Anthropic lanza Claude Sonnet 4.5: mejoras y nuevas características para desarrolladores

Este mes, Anthropic presenta Claude Sonnet 4.5, una versión mejorada de su modelo de procesamiento de lenguaje natural, conocido por ser uno de los preferidos entre los desarrolladores. La compañía califica esta actualización como la “mejor modelo de codificación del mundo”, lo que resalta su compromiso con la innovación y la excelencia en el ámbito del desarrollo de software.

Claude Sonnet 4.5: Avances notables en desempeño

La nueva versión de Claude Sonnet promete un seguimiento más confiable de instrucciones y una mejor capacidad para refactorizar código existente. En la evaluación de SWE-Bench Verified, que mide cómo los modelos se desempeñan en tareas de solicitudes de extracción reales de GitHub, Sonnet 4.5 obtuvo una puntuación del 77.2%, y subió al 82% cuando se aplicó un cómputo paralelo a la prueba. Estos resultados demuestran un avance significativo en comparación con versiones anteriores.

En ciertos ámbitos, la compañía afirma que Sonnet 4.5 supera a Opus 4.1, su modelo insignia, especialmente en trabajos relacionados con la industria de servicios financieros. La evaluación OSWorld, que mide el desempeño de los modelos de AI en tareas computacionales reales, muestra que Sonnet 4.5 lidera la lista con un 61.4% de tasa de éxito, un notable aumento desde el 43.9% que obtuvo Sonnet 4, además de sobrepasar a Opus 4.1, que se mantenía alrededor del 44%.

Un cambio significativo es la capacidad de Sonnet 4.5 para ejecutar tareas complejas de manera autónoma durante 30 horas, a diferencia de las 7 horas que podía gestionar su predecesor, Opus 4. Con estas mejoras, Anthropic afirma que Sonnet 4.5 logra mantener el enfoque y rendimiento a lo largo del tiempo, aunque se requerirán pruebas adicionales para confirmar esta efectividad en situaciones del mundo real.

Comparativa con la competencia

En la mayoría de las pruebas de codificación, Sonnet 4.1 ha superado a competidores como GPT-5 de OpenAI y Gemini 2.5 Pro de Google. Sin embargo, en benchmarks de razonamiento visual, donde los modelos de Anthropic generalmente han tenido un rendimiento más moderado, la competencia parece estar a la delantera.

Otro aspecto relevante es que Anthropic ha mejorado el acceso del modelo a características adicionales, equiparando su rendimiento al de su agente de codificación, Claude Code. Estas nuevas funcionalidades incluyen acceso a máquinas virtuales, mejor gestión del contexto y soporte para múltiples agentes.

Innovadoras características de Claude Code

Con el lanzamiento de Sonnet 4.5, también se introducen actualizaciones en Claude Code, el agente de programación de Anthropic. Este ha demostrado ser una herramienta valiosa, generando más de $500 millones en ingresos anuales, con un crecimiento de uso superior al 10% en los últimos tres meses. Claude Code ahora contará con una extensión nativa para Visual Studio Code, permitiendo a los desarrolladores observar en tiempo real los cambios realizados por el agente.

Adicionalmente, se han realizado mejoras en la interfaz de línea de comandos, con mayor visibilidad del estado y un historial de comandos que se puede buscar, facilitando la reutilización de comandos pasados. También se han introducido puntos de control que simplifican la reversión del código en caso de que Claude Code no actúe como se esperaba, eliminando la necesidad de realizar copias de seguridad manuales.

Lanza el Claude Agent SDK

Para los desarrolladores interesados en crear agentes basados en la misma infraestructura que Claude Code, Anthropic ha presentado el Claude Agent SDK. Este nuevo conjunto de herramientas permitirá a los desarrolladores construir agentes personalizados, utilizando la misma infraestructura que alimenta a Claude Code. El SDK incluye funciones esenciales como gestión de memoria, gestión del contexto y administración de permisos.

Como complemento, los desarrolladores recibirán una herramienta de memoria en la API que ayudará a los agentes a mantener el contexto a lo largo de tareas prolongadas. También se añadirá una función de gestión de contexto automática que ajustará la ventana de contexto de Claude, eliminando datos obsoletos según sea necesario.

“Imagine with Claude”: generando software en tiempo real

Una de las características más intrigantes que se lanza junto con Sonnet 4.5 es “Imagine with Claude”, un experimento que ilustra cómo generar software y interfaces de usuario en tiempo real. Anthropic explica que “no se predefine ninguna funcionalidad; ningún código está preescrito. Lo que se ve es Claude creando en tiempo real, respondiendo y adaptándose a las solicitudes mientras interactúas”.

Este experimento, que estará disponible exclusivamente para suscriptores del plan Claude Max durante los próximos cinco días, muestra un potencial significativo en la creación de software a demanda, aunque aún se carece de claridad respecto a los procesos internos mientras Claude desarrolla estas aplicaciones.

A medida que el campo de la inteligencia artificial avanza, las discusiones en torno a herramientas que permiten la generación de software instantánea están ganando tracción. A pesar de que existen soluciones como Lovable que se acercan a esta idea, la propuesta de Anthropic de crear software deseable en el momento presenta un futuro prometedor para la industria.

Conclusión

Con el lanzamiento de Claude Sonnet 4.5, Anthropic continúa marcando la pauta en el desarrollo de modelos de inteligencia artificial aplicados a la codificación. Las mejoras en la capacidad para seguir instrucciones, la autonomía en tareas complejas y la introducción de nuevas funcionalidades refuerzan su posición en el mercado.

La estructura de precios se mantiene en $3/$15 por millón de tokens de entrada/salida, lo que representa la misma tarifa que Anthropic aplicaba para Sonnet 4.

Para aquellos interesados en conocer más sobre los avances en el ámbito de la inteligencia artificial y el desarrollo de software, se invita a seguir explorando el contenido en este blog.