Anthropic ha anunciado que su modelo Claude Fable 5 estará disponible nuevamente a nivel global a partir de este jueves. Esta decisión se tomó después de mantener conversaciones con el Gobierno de Estados Unidos y de implementar nuevas medidas para evitar que el modelo sea utilizado en ciberseguridad ofensiva.
La compañía detalló que el regreso del modelo se llevará a cabo con un nuevo conjunto de clasificadores que permitirán detectar y bloquear un mayor número de solicitudes asociadas a actividades potencialmente maliciosas.
Debido a estos cambios, algunas funciones habituales, como la programación y depuración de código, serán temporalmente dirigidas al modelo Claude Opus 4.8, mientras Anthropic trabaja en ajustar los nuevos filtros con el fin de reducir los falsos positivos y mejorar la diferenciación entre solicitudes legítimas e intentos de abuso.
Colaboración con el Gobierno de EE.UU.
Además, la empresa informó que ampliará su colaboración con el Gobierno estadounidense en áreas de evaluación y seguridad de modelos de inteligencia artificial. Este acuerdo incluye el acceso anticipado de las autoridades a futuros modelos y a sus mecanismos de protección, permitiendo realizar pruebas antes de su lanzamiento. También se contempla el intercambio de información sobre vulnerabilidades, técnicas para eludir restricciones, conocidas como «jailbreaks», y posibles usos indebidos.
Anthropic destinará recursos específicos para llevar a cabo investigaciones conjuntas sobre la seguridad en inteligencia artificial.
Un marco común frente a los «jailbreaks»
La compañía también mencionó que ha empezado a desarrollar un marco de consenso junto a Amazon, Microsoft, Google y otros miembros de la alianza Glasswing. Este marco busca establecer criterios comunes para evaluar la gravedad de los intentos de vulnerar las restricciones de los modelos de IA.
El objetivo es definir estándares compartidos sobre cómo deberían reaccionar las empresas desarrolladoras ante este tipo de incidentes.
Finalmente, Anthropic invitó a otros proveedores de modelos de inteligencia artificial y socios de la industria a unirse a esta iniciativa. En su comunicado, la empresa agradeció la paciencia de los usuarios durante la suspensión temporal de Claude Fable 5 y destacó el trabajo conjunto realizado con el Gobierno de Estados Unidos, empresas tecnológicas y la comunidad de investigación para reintroducir el modelo al público.
Con información de Montevideo Portal

