OpenAI lanza GPT-5.5-Cyber en medio del endurecimiento del control sobre Anthropic: Una nueva era de ciberseguridad en la IA

El 22 de junio, OpenAI presentó oficialmente la versión completa de su modelo especializado GPT-5.5-Cyber, diseñado para buscar, verificar y corregir vulnerabilidades. Este lanzamiento es una respuesta directa a las recientes restricciones impuestas a los modelos de Anthropic y marca una nueva etapa en la carrera por el dominio en el ámbito de la seguridad de la IA.
El modelo, que es un elemento clave del programa Daybreak, no estará disponible para el público en general. Su público objetivo son expertos verificados en ciberseguridad que necesitan herramientas avanzadas para realizar operaciones de defensa autorizadas. OpenAI eligió el camino de la alineación preventiva con las estructuras federales de EE. UU., a diferencia de Anthropic, cuyos modelos Fable 5 y Mythos 5 fueron desactivados tras recibir una directiva gubernamental en el marco del control de exportaciones.
Rendimiento técnico y análisis comparativo
Los resultados de los benchmarks muestran un progreso significativo. En la prueba CyberGym, que incluye 1507 tareas basadas en vulnerabilidades reales en 188 proyectos de código abierto, GPT-5.5-Cyber obtuvo un resultado del 85,6%, superando al GPT-5.5 estándar (81,8%) e incluso al modelo bloqueado Anthropic Mythos 5 (83,8%).
Se lograron resultados aún más impresionantes en otras pruebas. En ExploitGym, que evalúa la capacidad de convertir una vulnerabilidad en un exploit funcional, el modelo obtuvo un 39,5% frente al 25,95% de la versión normal. En SEC-bench Pro, que simula la búsqueda de vulnerabilidades a largo plazo, el resultado fue del 69,8% frente al 63,1%.
Sin embargo, como muestran los datos del UK AI Security Institute (AISI), en escenarios más complejos de simulación completa de ataques, el panorama no es tan claro. En la prueba The Last Ones, que simula un ataque corporativo de múltiples etapas, GPT-5.5-Cyber lo superó en 3 de 10 intentos, mientras que la versión actualizada de Mythos Preview lo logró en 6 de 10 intentos. Esto subraya que, a pesar de la especialización limitada, las capacidades generales de agente de los modelos de Anthropic siguen siendo superiores en algunos aspectos.
Estrategia de acceso y asociaciones
OpenAI ha definido claramente los límites de uso de GPT-5.5-Cyber. El modelo está destinado exclusivamente a usuarios verificados en escenarios autorizados. Para otros clientes, la empresa recomienda usar GPT-5.5 con las funciones Trusted Access for Cyber y Codex Security.
En el marco del programa Daybreak Cyber Partner Program, OpenAI ya ha atraído a gigantes como Akamai, Check Point, Cisco, CrowdStrike, IBM, Palo Alto Networks, Proofpoint, SentinelOne, Wiz y Zscaler. Además, se ha lanzado la iniciativa Patch the Planet para proyectos de código abierto, creada en colaboración con Trail of Bits, HackerOne y otros socios. Entre los primeros participantes se encuentran cURL, Go, Python, Sigstore y pyca/cryptography.
Mi análisis: El lanzamiento de GPT-5.5-Cyber no es solo un avance tecnológico, sino un movimiento estratégico en un contexto de creciente presión regulatoria. OpenAI demuestra que puede ofrecer potentes herramientas de ciberseguridad sin violar las restricciones de exportación, a diferencia de Anthropic. Sin embargo, la brecha de rendimiento en escenarios complejos de agente indica que la carrera por crear el "hacker de IA" perfecto está lejos de terminar. En los próximos meses, el factor clave no será solo la potencia bruta de los modelos, sino también la capacidad de las empresas para establecer canales seguros y legítimos para su uso.