Estados Unidos ordenó a Anthropic detener Fable 5 y Mythos 5
TL; DR
El gobierno de EE. UU. emitió una directiva de control de exportaciones el 12 de junio ordenando a Enthropic suspender el acceso a Fable 5 y Mythos 5, citando preocupaciones de seguridad nacional por una supuesta fuga. Anthropologie cumplió, pero rechazó públicamente, calificando la acción desproporcionada y advirtiendo que si se implementaba en toda la industria cerraría todos los despliegues de modelos fronterizos. El retiro sin precedentes se produjo apenas tres días después del lanzamiento de Fable 5.
El gobierno de EE. UU. ha ordenado a Anthropic suspender el acceso a dos de sus modelos de IA más capaces, Fable 5 y Mythos 5, en lo que parece ser la primera vez que Washington obliga a desconectar un producto comercial de IA. La directiva, que Anthropic dice haber recibido el 12 de junio a las 5:21 p.m. ET, cita a las autoridades de seguridad nacional y exige que la compañía suspenda el acceso a todos los ciudadanos extranjeros, incluidos sus propios empleados.
Dado que Anthropic no puede distinguir de manera confiable a los ciudadanos extranjeros de los usuarios nacionales en tiempo real, el resultado práctico es un cierre forzoso de ambos modelos para todos los clientes en todo el mundo. El acceso a otros modelos de Anthropic no se ve afectado.
Tres días libres desde el lanzamiento
Anthropologie lanzó Fable 5 el 9 de junio como su primer modelo "clase Mythos" disponible para el público en general. Fable 5 es la versión pública, con clasificadores de seguridad que señalan solicitudes vulnerables de Cloud Opus 4.8, mientras que Mythos 5, el mismo modelo subyacente sin ciberseguridad, se limitó a defensores de ciberseguridad probados y operadores de infraestructura crítica.
Ambos modelos ya estaban en la mira de la administración Trump, que previamente había tomado medidas para bloquear el lanzamiento más amplio de Mythos de Anthropic. La compañía ofreció Fable 5 gratis a los clientes Pro, Max, Team y Enterprise hasta el 22 de junio.
Controversia sobre la fuga de la cárcel
Según Axios, el Departamento de Comercio actuó después de que una empresa anónima afirmara que había encontrado una manera de hacer jailbreak a Mythos. Anthropic dijo que encontró evidencia verbal de un jailbreak limitado y no universal que esencialmente implicaba pedirle al modelo que leyera una base de código específica y corrigiera errores de software.
Anthropic revisó la estrategia y dijo que las vulnerabilidades que enfrenta son menores y ya conocidas públicamente. Afirma que otros modelos, incluido el GPT-5.5 de OpenAI, pueden detectar los mismos errores sin derivación, aunque TNW no pudo verificar de forma independiente esta comparación específica.
La compañía hace una clara distinción entre jailbreaks estrechos, que pueden extraer cierta información bajo ciertas circunstancias, y jailbreaks universales, que anulan en gran medida las medidas de seguridad de un modelo. Anthropic dice que ningún evaluador ha encontrado todavía un jailbreak público para Fable 5, aunque el Instituto de Seguridad de IA del Reino Unido ha desarrollado un jailbreak parcial para la cuestión de la vulnerabilidad de un solo turno a las pocas horas de la prueba.
Miles de horas de trabajo en equipo rojo, luego esto
Antes del lanzamiento, Anthropic dijo que trabajó con el gobierno de EE. UU., AISI del Reino Unido y varias organizaciones privadas de terceros para proteger Fable durante miles de horas. Según se informa, una recompensa por errores externos no ha producido fugas públicas en más de 1.000 horas de pruebas.
La compañía adoptó una controvertida política de retención de datos obligatoria de 30 días para todo el tráfico de Fable y Mythos, anulando los acuerdos de retención cero existentes con los clientes. Anthropic dice que la retención es necesaria para detectar patrones de abuso que solo son visibles en múltiples solicitudes.
Fuego antropogénico
En una declaración pública inusualmente combativa, Anthropic dijo que no estaba de acuerdo con que un posible jailbreak reducido debería ser "una razón para retirar un modelo comercial implementado para cientos de millones de personas". Advirtió que la implementación del estándar en toda la industria "esencialmente detendría todas las implementaciones de nuevos modelos para todos los proveedores de modelos fronterizos".
La agencia pidió "un proceso legal que sea transparente, justo, claro y basado en hechos técnicos" para que cualquier poder gubernamental pueda bloquear instalaciones inseguras. Dijo que esta acción no pasó la prueba.
La tensión es un patrón.
La directiva se produce en un contexto de creciente fricción entre Antropología y Washington. El Pentágono incluyó a Anthropic en la lista negra como una amenaza a la cadena de suministro de seguridad nacional a principios de este año, incluso cuando la NSA continúa utilizando a Claud como ninguna alternativa.
Anthropic demandó al gobierno por esa designación. La misma administración que identificó a la empresa como un riesgo para la seguridad también instó a los bancos a adoptar su tecnología y autorizó a la NSA a seguir utilizando Mythos en redes clasificadas.
El conflicto pone de relieve la propia incertidumbre del gobierno sobre cómo gestionar una empresa cuyas capacidades de IA teme y en las que confía simultáneamente.
Qué significa esto para la industria
Siguiendo el precedente, un único jailbreak reportado puede dar lugar a retiradas similares independientemente de la gravedad de cualquier modelo de Frontier AI. Es probable que esa perspectiva provoque escalofríos en una industria que ha pasado el año pasado compitiendo para implementar modelos cada vez más capaces con un mayor escrutinio gubernamental.
Anthropic dice que cree que la directiva fue un malentendido y está trabajando para restablecer el acceso lo antes posible. Prometió compartir más detalles dentro de las 24 horas.





