Anthropic presenta Claude 4, el "mejor modelo del mundo". Apple se puede frotar las manos

Acaba de presentarse "el mejor modelo de codificación del mundo". Al menos eso dicen sus creadores de Anthropic, una de las empresas punteras en el terreno de la programación con IA y que fue fundada por exmiembros de OpenAI. Se trata de Claude Opus 4 y Claude Sonnet 4, dos modelos que pretenden alejarse de sus competidores a base de razonamiento y eficiencia.

Ambos pretenden ir más allá de completar código de programación, siendo un asistente inteligente que incluso razone y mantenga cierta memoria contextual. Una gran noticia para los programadores en general y para los que usen Apple en particular, puesto que ambas compañías están colaborando estrechamente en una herramienta para desarrolladores.

La fuerte promesa de los nuevos modelos de Claude

Esta misma semana, en la Google I/O 2025 conocimos multitud de novedades en IA generativa para el usuario, pero también novedades para desarrolladores como Jules. Se trata de un asistente de programación con capacidades para actuar en segundo plano y avisarnos de posibles errores, proporcionando código con el que solventarlo. También OpenAI mediante Codex ha presentado modelos similares.

En su primera conferencia para desarrolladores, Anthropic ha querido dar su propia respuesta aprovechando que sus modelos ya estaba siendo considerados una de los mejores en eso del vibe coding. Y de ese modo han presentado Claude Opus 4 y Claude Sonnet 4.

SWE-bench, que es una métrica de referencia centrada en tareas reales de desarrollo extraídas de bases de datos como Stack Overflow o GitHub, muestra que Claude Opus 4 se sitúa por encima de OpenAI Codex-1 y Gemini 2.5 Pro con porcentajes de alrededor de un 72,5%. Eso en procesamiento estándar, ya que en paralelo alcanza el 79,4%.

Se ha diseñado específicamente para poder ejecutar tareas complejas sin perder la coherencia y que aparezcan alucinaciones. Eso sí, en pruebas de rendimiento con razonamiento multimodal, combinando texto e imágenes, Claude Opus 4 no logra superar al o3 de OpenAI.

En Applesfera

6.500 millones de dólares y un fichaje estrella: OpenAI quiere su nuevo iPhone cueste lo que cueste

En lo referente a Claude Sonnet 4, Anthropic se encuentra con un modelo que alcanza un 72,7% en pruebas de SWE-bench, superando también al resto de competidores. Aunque su objetivo no es el de competir con Opus 4, sino ofrecer un rendimiento más centrado en la eficiencia.

En ambos casos se pretende combinar razonamiento y uso de herramientas para obtener mejores respuestas y facilitar la tarea de programación.

Buenas noticias para programadores de Apple

Pese a las grandes inversiones en IA anunciadas por Apple, la compañía va muy por detrás de competidores como OpenAI, Google o Meta en lo que al despliegue de modelos se refiere. La mejor prueba es Swift Assist, una herramienta que presentó el pasado año con el objetivo de integrar un asistente en Xcode para ayudar a los desarrolladores en sus tareas.

Sin embargo, tal como reveló Mark Gurman recientemente, hasta los ingenieros de la compañía criticaban la cantidad de errores y alucinaciones que arrojaba ese modelo en la práctica. Fue esa la razón por la que no se llegó a lanzar.

En Applesfera

ChatGPT se integra muy bien con Siri. Pero con este ajuste es aún mejor

Ahora, en cambio, se espera que puedan lanzarla definitivamente de la mano de Anthropic y, probablemente, con modelos de Claude 4 como base. Es algo por lo que los desarrolladores de aplicaciones para iOS, iPadOS y macOS se podrán beneficiar.

Esto permitiría no solo recibir una ayuda puntual, sino lograr generar todo un bloque de código de forma coherente. Modelos como Claude 4 Opus son capaces de explicar sus decisiones y validarlas para que sea coherente con las prácticas de Apple.

Salvo sorpresa, será en la próxima WWDC 2025 que arranca el 9 de junio cuando Apple anuncie estas novedades. Aparte, se esperan otras ventajas para los desarrolladores como la apertura de los modelos de Apple Intelligence para que puedan ser utilizados de forma más amplia por aplicaciones de terceros.

En Applesfera | Qué es el Apple ID: una sola cuenta y contraseña para controlar iCloud y la App Store de forma sencilla

En Applesfera | Apple macOS: todas las versiones hasta la fecha, cómo saber la que estás usando y cómo actualizar el sistema operativo