OpenAI lanza GPT-5.5-Cyber: una nueva era de ciberseguridad en medio de las restricciones de Anthropic
El 22 de junio, OpenAI presentó oficialmente la versión completa de GPT-5.5-Cyber, un modelo especializado diseñado para buscar, verificar y corregir vulnerabilidades. Este movimiento se produjo en medio de severas restricciones impuestas a Anthropic, lo que creó una ventana de mercado única para OpenAI.
Contexto: cómo OpenAI aprovechó el momento
El 9 de junio, Anthropic lanzó dos versiones de los modelos de la familia Claude: Fable 5 y Mythos 5. Este último se posicionó como un modelo base "privado" con restricciones reducidas. Sin embargo, ya el 12 de junio, tras una directiva del gobierno de EE. UU. en el marco del control de exportaciones, Anthropic se vio obligada a desactivar estos modelos. Esto provocó una ola de descontento: el 23 de junio, la empresa Legion presentó una demanda contra el gobierno de EE. UU., alegando que la pérdida de acceso a los modelos de Anthropic interrumpió el funcionamiento de sus herramientas para la preparación de documentos legales.
A diferencia de Anthropic, OpenAI optó por un camino más cauteloso. La empresa coordinó previamente todas las verificaciones con las estructuras federales de EE. UU. y abrió GPT-5.5-Cyber exclusivamente para especialistas verificados en ciberseguridad. Este enfoque permitió evitar riesgos regulatorios y ocupar el nicho que quedó vacante.
Características técnicas: qué puede hacer el nuevo modelo
Según OpenAI, GPT-5.5-Cyber muestra resultados impresionantes en los benchmarks especializados. En la prueba CyberGym, el modelo obtuvo un 85,6% frente al 81,8% del GPT-5.5 estándar. Este benchmark, desarrollado por investigadores de UC Berkeley, incluye 1507 tareas basadas en vulnerabilidades reales en 188 proyectos de código abierto. En ExploitGym, el modelo alcanzó un 39,5% frente al 25,95% de la versión normal, y en SEC-bench Pro, un 69,8% frente al 63,1%.
Merece especial atención la comparación con la competencia. GPT-5.5-Cyber superó a Anthropic Mythos 5 en CyberGym: 85,6% frente a 83,8%. Sin embargo, en escenarios más complejos la situación es ambigua. El UK AI Security Institute (AISI) informó que, en una simulación de 32 pasos de un ataque corporativo llamado The Last Ones, GPT-5.5-Cyber completó con éxito el escenario en 2 de cada 10 intentos, mientras que Mythos Preview lo hizo en 3 de cada 10. Posteriormente, AISI actualizó los datos: la nueva versión de Mythos Preview superó la prueba en 6 de cada 10 intentos, mientras que GPT-5.5-Cyber solo en 3 de cada 10.
Estrategia de acceso y alianzas
OpenAI dejó claro que GPT-5.5-Cyber no está destinada al usuario masivo. El modelo solo está disponible para especialistas verificados que necesiten capacidades avanzadas para trabajos de protección autorizados. Para los clientes habituales, la empresa recomienda la GPT-5.5 estándar con Trusted Access for Cyber y Codex Security.
En el marco del programa Daybreak, OpenAI lanzó el Cyber Partner Program, que incluye a gigantes como Akamai, Check Point, Cisco, CrowdStrike, IBM, Palo Alto Networks, Proofpoint, SentinelOne, Wiz y Zscaler. Además, se inició la iniciativa Patch the Planet para proyectos de código abierto, creada en colaboración con Trail of Bits y con la participación de HackerOne. Entre los primeros participantes se encuentran cURL, Go, Python, Sigstore y pyca/cryptography.
Mi opinión experta: El lanzamiento de GPT-5.5-Cyber no es solo un avance tecnológico, sino un movimiento estratégico en un contexto de endurecimiento de la regulación de la IA. OpenAI demuestra cómo se puede equilibrar eficazmente entre la innovación y el cumplimiento normativo, mientras que los competidores enfrentan restricciones regulatorias. Sin embargo, la brecha en el rendimiento en escenarios de ataque complejos (The Last Ones) muestra que la carrera de capacidades cibernéticas está lejos de terminar. En los próximos meses veremos cómo esta dinámica afecta a todo el mercado de la ciberseguridad.