| Tech

Anthropic lanza una versión de su aclamado modelo Mythos para desarrolladores

Esta versión de Mythos destaca en tareas largas y complejas, pero evita las preguntas sobre temas arriesgados como la ciberseguridad o la biología.

Anthropic lanza una versión de su aclamado modelo Mythos para desarrolladores [Foto: NurPhoto / Contributor/Getty Images]

El martes, Anthropic lanzó Claude Fable 5, una versión pública y con medidas de seguridad (o salvaguardas) de su aclamado modelo de IA “Mythos”.

La startup de IA afirmó que Claude Fable 5 es más capaz que cualquier otro modelo que haya lanzado al público, demostrando un rendimiento sobresaliente en ingeniería de software, trabajo basado en el conocimiento y tareas de visión, entre otras áreas.

El modelo supera a las versiones anteriores en la ejecución de tareas más largas y complejas. La empresa de análisis Hex señaló que Fable 5 fue el primer modelo en superar 90% en su prueba de referencia principal sobre tareas analíticas complejas y de larga duración, lo que representa un salto de 10 puntos respecto a los modelos Opus anteriores. Claude Fable 5 obtuvo una puntuación del 80.3% en SWE-Bench-Pro (que mide la capacidad de los modelos de IA para actuar como agentes en tareas de programación), frente al 58.6% de GPT-5.5 (de OpenAI) y el 54.2% de Gemini 3.1 Pro (de Google DeepMind). Los evaluadores destacaron que Fable demostró “un criterio sólido y atención a los matices”.

Anthropic lanzó el modelo original Mythos Preview en abril, pero solo para un grupo selecto de profesionales de ciberseguridad defensiva y supervisores de infraestructuras críticas. Mythos, según la empresa, había demostrado ser muy eficaz a la hora de detectar y explotar vulnerabilidades de seguridad en software comercial.

El nuevo modelo Fable 5 presenta algunas limitaciones, según Anthropic. Por ejemplo, no responde a preguntas sobre ciberseguridad o biología, sino que deriva dichas consultas al modelo Claude Opus 4.8, que tiene capacidades más reducidas. No obstante, Anthropic indica que esto ocurrió solo en aproximadamente el 5% de las sesiones.

Fable 5 fue sometido a intentos, tanto por parte de equipos internos como externos, de engañarlo para que respondiera preguntas sobre temas prohibidos. Ninguno de estos intentos tuvo éxito.

En cuanto a los investigadores de ciberseguridad que ya tienen acceso a Mythos Preview, ahora podrán acceder a un nuevo modelo denominado Claude Mythos 5. Más personas y organizaciones obtendrán acceso a través de “un programa de acceso de confianza más sistemático”, según Anthropic. Este lanzamiento público de un modelo Mythos se produce pocos días después de que Anthropic instara a los principales laboratorios de IA a implementar una pausa global coordinada en el desarrollo de esta tecnología, advirtiendo sobre el creciente riesgo de que los rápidos avances en las capacidades de la IA superen los mecanismos de control humano.

OpenAI, rival de Anthropic, coincide con esta postura. En una nueva publicación de blog del lunes, su CEO, Sam Altman (junto con Jakub Pachocki), escribió que el sector necesita una organización internacional capaz de “permitir que el mundo emprenda acciones coordinadas —incluida la ralentización del desarrollo de modelos de frontera cuando sea necesario— para que la resiliencia social, la seguridad y la alineación puedan avanzar al mismo ritmo”.

Los líderes de empresas de IA han abogado por una regulación gubernamental más estricta sobre el desarrollo de modelos de frontera; sin embargo, el grupo de presión del sector de la IA y la administración Trump se han esforzado por obstaculizar leyes vinculantes de seguridad de la IA que exigirían a los laboratorios algo más que un cumplimiento voluntario.

No obstante, la posible amenaza a la seguridad que suponía Mythos habría avivado las discrepancias entre funcionarios clave de la Casa Blanca respecto al alcance de la supervisión gubernamental. Asimismo, este hecho contribuyó a impulsar la reciente orden ejecutiva sobre IA, la cual exige a los laboratorios que presenten al gobierno los resultados de las pruebas realizadas durante el mes previo al lanzamiento de determinados modelos de frontera.

Claude Fable 5 está a disposición de los desarrolladores a través de la API de Anthropic.

Author

  • Mark Sullivan

    Mark Sullivan es redactor sénior de Fast Company y cubre temas de tecnología emergente, inteligencia artificial y políticas tecnológicas. Antes de incorporarse a Fast Company en enero de 2016, Sullivan escribió para VentureBeat, Light Reading, CNET, Wired y PCWorld. Síguelo en Twitter @thesullivan

    View all posts

Author

  • Mark Sullivan

    Mark Sullivan es redactor sénior de Fast Company y cubre temas de tecnología emergente, inteligencia artificial y políticas tecnológicas. Antes de incorporarse a Fast Company en enero de 2016, Sullivan escribió para VentureBeat, Light Reading, CNET, Wired y PCWorld. Síguelo en Twitter @thesullivan

    View all posts

Sobre el autor

Mark Sullivan es redactor sénior de Fast Company y cubre temas de tecnología emergente, inteligencia artificial y políticas tecnológicas. Antes de incorporarse a Fast Company en enero de 2016, Sullivan escribió para VentureBeat, Light Reading, CNET, Wired y PCWorld. Síguelo en Twitter @thesullivan