GLM-5.2: ¿Un competidor real de Claude o solo ruido? Mi análisis del buque insignia chino

18.06.2026

07:20

En el mundo de la inteligencia artificial se gesta un curioso cambio. La empresa china Z.ai ha lanzado su nuevo modelo insignia GLM-5.2, y ya ha generado un acalorado debate a su alrededor. La comunidad lo ha apodado el «asesino» de Claude, insinuando una competencia directa con las soluciones punteras de Anthropic. Analicemos hasta qué punto este título es merecido y qué representa realmente esta red neuronal.

¿Qué es GLM-5.2 y cuál es su fortaleza?

GLM-5.2 no es solo una actualización más, sino una seria declaración de intenciones para liderar el segmento de modelos open-source para programación. Su principal ventaja es una ventana de contexto gigantesca de 1 millón de tokens que no se degrada durante el funcionamiento. Esto significa que el modelo es capaz de «ver» y procesar toda la base de código del proyecto en su totalidad, sin perder el hilo del razonamiento incluso durante sesiones de varias horas.

Las características clave que destaco son:

Contexto de 1M de tokens: Toda la base de código cabe en un solo ciclo de razonamiento, algo crítico para proyectos complejos.
Dos modos de razonamiento: High para un equilibrio entre velocidad y calidad, y Max, el «modo de máximo rendimiento», que consume más tokens pero ofrece mejores resultados.
Licencia MIT abierta: El modelo se puede ejecutar en equipos propios (self-hosting), lo que otorga control total sobre los datos y los costes.
Precio de API: El coste de las llamadas se ha mantenido al nivel de la versión anterior GLM-5.1, lo que lo hace accesible.

El modelo ya está disponible en HuggingFace y ModelScope, y también está integrado en frameworks populares como vLLM y SGLang.

Benchmarks: Los números hablan más que las palabras

Según las pruebas propias de Z.ai, GLM-5.2 muestra resultados impresionantes. En los benchmarks clave para programación, la diferencia con la versión anterior GLM-5.1 es enorme: 81,0 frente a 63,5 en Terminal-Bench 2.1 y 62,1 frente a 58,4 en SWE-bench Pro.

Sin embargo, si observamos las cifras absolutas, la situación se vuelve más matizada. En modo Max, el modelo se acerca mucho al buque insignia de Anthropic, Claude Opus 4.8. En Terminal-Bench 2.1, la diferencia es de solo 4 puntos (81,0 frente a 85,0), y en SWE-bench Pro, de 7 puntos (62,1 frente a 69,2). Además, GLM-5.2 supera con solvencia a Gemini 3.1 Pro y GPT-5.5 en muchas pruebas.

Especialmente interesante es el panorama en tareas de larga duración (long-horizon). En la prueba FrontierSWE, donde los modelos trabajan durante horas, GLM-5.2 se queda solo un 1% por detrás de Opus 4.8. Esto sugiere que la arquitectura del modelo realmente maneja bien el mantenimiento del contexto a lo largo del tiempo.

La cuestión del precio y las «trampas»

La suscripción GLM Coding Plan ofrece tres tarifas: Lite ($12.6/mes), Pro ($50.4/mes) y Max ($112/mes) con pago anual. Esto es significativamente más barato que las tarifas de Claude Pro o GPT Plus, especialmente considerando los límites.

Sin embargo, como muestra la práctica, el diablo está en los detalles. Los usuarios en la red discuten activamente dos problemas principales:

Infraestructura en la nube débil: Muchos se quejan de un servicio inestable, respuestas lentas y un coste elevado en horas punta. Dicen que es más fácil pagar por Claude o GPT.
Problemas de comportamiento: El modelo tiende a bloquearse e ignorar comandos. Hay quien opina que está «optimizado» exclusivamente para los benchmarks, pero en el desarrollo real no se comporta de manera tan eficaz.

Los críticos señalan que todo el potencial de GLM-5.2 solo se despliega en modo Max, que consume muchas más veces los tokens. En modo High, ya no es tan convincente.

Mi veredicto

Llamar a GLM-5.2 el «asesino» de Claude sería una exageración. Sí, es el modelo open-source más potente hasta la fecha, que se ha acercado mucho a las soluciones cerradas punteras. Ofrece una combinación única de contexto enorme, licencia abierta y resultados impresionantes en benchmarks.

Sin embargo, aún está lejos de una victoria completa sobre Claude. Los problemas de infraestructura, la inestabilidad y el alto consumo de tokens en modo Max son defectos graves. Por ahora, GLM-5.2 es más bien un «competidor económico y audaz», ideal para entusiastas y desarrolladores dispuestos a tolerar imperfecciones a cambio de un precio bajo y apertura. Para quienes necesitan estabilidad y previsibilidad, Claude y GPT siguen siendo la opción más fiable.

Crypto news