Crypto news

24.06.2026
09:06

OpenAI presenta GPT-5.5-Cyber en medio de la presión regulatoria sobre Anthropic

Chatbot ChatGPT de OpenAI

El 22 de junio, OpenAI lanzó oficialmente la versión completa de su modelo especializado GPT-5.5-Cyber, diseñado para buscar, verificar y corregir vulnerabilidades de software. Este lanzamiento ocurre en un momento muy revelador: justo después de que el gobierno de EE. UU. impusiera restricciones de exportación que obligaron a Anthropic a retirar sus modelos avanzados Claude Fable 5 y Mythos 5.

GPT-5.5-Cyber es un componente clave de la iniciativa Daybreak, un programa integral de ciberdefensa de OpenAI que también incluye la herramienta Codex Security y asociaciones con empresas líderes en seguridad. El modelo no está destinado al uso masivo; solo los especialistas en ciberseguridad verificados tendrán acceso para realizar operaciones de defensa autorizadas.

Ventana estratégica de oportunidades

La situación en el mercado de seguridad de IA cambió drásticamente después de que el 9 de junio Anthropic abriera el acceso a dos versiones de la familia Claude. Ya el 12 de junio, la empresa se vio obligada a desactivar estos modelos por orden del gobierno de EE. UU. en el marco del control de exportaciones. Esto tuvo graves consecuencias: el 23 de junio, el bufete de abogados Legion presentó una demanda contra el gobierno de EE. UU., alegando que la pérdida de acceso a los modelos de Anthropic interrumpió el funcionamiento de sus herramientas para la preparación de documentos legales.

OpenAI eligió un enfoque fundamentalmente diferente. La empresa coordinó previamente todas las verificaciones con las estructuras federales de EE. UU. y abrió GPT-5.5-Cyber solo para usuarios verificados. Esto les permitió evitar riesgos regulatorios y ocupar el nicho que quedó vacante.

Especificaciones técnicas y benchmarks

Según OpenAI, GPT-5.5-Cyber muestra resultados impresionantes en pruebas especializadas. En el benchmark CyberGym, el modelo obtuvo un 85,6% frente al 81,8% del GPT-5.5 estándar. Una brecha aún más significativa se observa en ExploitGym: 39,5% frente a 25,95%. En la prueba SEC-bench Pro, los resultados fueron del 69,8% frente al 63,1%.

Sin embargo, es importante entender el contexto de estas cifras. CyberGym se centra en la reproducción de vulnerabilidades conocidas en entornos controlados, lo que no abarca todo el espectro de ataques reales. Además, según el UK AI Security Institute, en escenarios complejos de múltiples pasos, como la simulación del ataque corporativo The Last Ones, GPT-5.5-Cyber superó la prueba en 2 de cada 10 intentos, mientras que la versión actualizada de Mythos Preview de Anthropic lo logró en 6 de cada 10 intentos.

Comparación con competidores

Una comparación directa con el modelo retirado Anthropic Mythos 5 muestra que GPT-5.5-Cyber lo superó en CyberGym: 85,6% frente a 83,8%. Sin embargo, en pruebas más complejas como The Last Ones, el panorama es mixto. Esto sugiere que, aunque el modelo especializado de OpenAI es fuerte en tareas estrechas de reproducción de vulnerabilidades, en escenarios complejos de ataques reales, Anthropic mantiene una ventaja.

Ecosistema y restricciones de acceso

OpenAI también lanzó el Daybreak Cyber Partner Program, que incluye a gigantes como Akamai, Check Point, Cisco, CrowdStrike, IBM, Palo Alto Networks y otros. Además, se anunció la iniciativa Patch the Planet para proyectos de código abierto, creada en colaboración con Trail of Bits y con la participación de HackerOne. Entre los primeros participantes se encuentran cURL, Go, Python y pyca/cryptography.

Mi análisis de la situación muestra que OpenAI eligió estratégicamente el momento adecuado para el lanzamiento, llenando el vacío dejado por la salida de Anthropic. Sin embargo, la carrera armamentista de IA en ciberseguridad apenas comienza. Mientras GPT-5.5-Cyber demuestra superioridad en benchmarks estrechos, los escenarios de ataque reales siguen siendo dominio de Anthropic. La pregunta es si OpenAI podrá alcanzar a su competidor en tareas complejas antes de que las restricciones regulatorias cambien las reglas del juego nuevamente.