Anthropic ha lanzado una actualización clave de su modelo de inteligencia artificial más potente, Claude Opus 4.8. Si bien la compañía lo describe como una mejora “modesta pero tangible”, esta nueva versión introduce funciones significativas para la planificación de tareas complejas y un control de esfuerzo ajustable, enfocándose en la fiabilidad y precisión de sus respuestas.
Uno de los avances más notables radica en cómo la IA maneja la incertidumbre. Claude Opus 4.8 ha sido diseñado para identificar activamente las limitaciones o posibles problemas en sus propios análisis, un aspecto que otros modelos suelen omitir. Pruebas internas de Anthropic revelan que esta versión es cuatro veces menos probable de pasar por alto errores en el código que genera, en comparación con su predecesor, Opus 4.7.
La empresa subraya su compromiso con la honestidad en sus modelos. En una publicación de blog, Anthropic explicó: “Entrenamos a todos nuestros modelos para que sean honestos, por ejemplo, para evitar hacer afirmaciones que no puedan respaldar”. Los primeros evaluadores confirman que Opus 4.8 es más propenso a señalar incertidumbres sobre su trabajo y menos a emitir declaraciones sin fundamento.
Este punto, aunque parezca menor, aborda una de las problemáticas más persistentes en la IA actual. Es común observar cómo modelos como ChatGPT, Gemini o el propio Claude llegan a conclusiones con escasa o nula evidencia. A menudo, sus respuestas pueden sonar categóricas, incluso cuando están inventando información, un fenómeno conocido como “alucinación”.
El equipo de alineamiento de Anthropic ha reportado que Claude Opus 4.8 alcanza niveles superiores en métricas de comportamiento prosocial, tales como el respeto por la autonomía del usuario. Además, el modelo exhibe tasas considerablemente más bajas de comportamientos desalineados, como el engaño o la cooperación en usos indebidos, frente a Opus 4.7.
Flujos de trabajo dinámicos y control de esfuerzo
Junto con el modelo, Anthropic presentó Dynamic Workflows, una función disponible en vista previa para investigación dentro de Claude Code. Esta herramienta innovadora permite planificar tareas complejas y ejecutar cientos de subagentes en paralelo dentro de una misma sesión. Estos subagentes verifican sus propios resultados antes de consolidar una respuesta final.
Un caso de uso concreto que destaca la compañía es la capacidad de Claude Code, con Opus 4.8, para gestionar migraciones a gran escala de bases de código. Puede manejar proyectos que involucran cientos de miles de líneas de código, abarcando desde el inicio hasta la integración final de manera eficiente.
Otra novedad significativa que llega a claude.ai y Cowork es el control de esfuerzo. Esta característica permite a los usuarios ajustar la profundidad con la que el modelo trabaja en cada respuesta. En configuraciones de esfuerzo elevadas, Claude razona con mayor profundidad, mientras que en configuraciones bajas, responde más rápidamente y consume menos cuota.
Opus 4.8 viene con el nivel “alto” de esfuerzo predeterminado, pero los usuarios pueden escalar hasta los niveles “extra” o “max”. Estas configuraciones superiores son ideales para tareas particularmente complejas o flujos de trabajo asíncronos de larga duración que requieren un análisis más exhaustivo.
Precios y futuro de Claude
Claude Opus 4.8 ya se encuentra disponible en todos los planes de pago y a través de la API de Anthropic, manteniendo la misma estructura de precios que su predecesor. El costo se mantiene en 5 dólares por millón de tokens de entrada y 25 dólares por millón de tokens de salida.
Además, el “modo rápido”, que permite al modelo operar a 2,5 veces su velocidad estándar, ahora es significativamente más accesible. Su costo se ha reducido a tres veces menos en comparación con las versiones anteriores, facilitando el acceso a una mayor velocidad de procesamiento.
Aprovechando este lanzamiento, Anthropic también confirmó que está desarrollando modelos que ofrecerán capacidades similares a las de Opus, pero a un coste más reducido. La empresa tiene previsto lanzar una nueva versión de Claude Mythos, prometiendo una inteligencia superior a la de Opus.
La llegada de Claude Mythos está planeada para un futuro, aunque su implementación requerirá primero la creación de salvaguardas aún más estrictas. Estas medidas son esenciales para prevenir el mal uso por parte de ciberdelincuentes y garantizar un despliegue seguro de esta avanzada tecnología.