GLM-5.2: ¿Un competidor real de Claude o simplemente marketing ruidoso?
La empresa china Z.ai ha lanzado su nuevo modelo insignia GLM-5.2, y la comunidad ya lo ha apodado el "asesino" de Claude de Anthropic. He analizado detenidamente las especificaciones, los benchmarks y las reseñas para entender si este título es merecido.
¿Qué es GLM-5.2 y por qué es interesante?
GLM-5.2 es un modelo de código abierto con licencia MIT, lo que ya supone una ventaja significativa. Su característica clave es una ventana de contexto de 1 millón de tokens que no se degrada en sesiones extremadamente largas. Esto permite al modelo mantener el foco en grandes volúmenes de código o texto, algo crítico para proyectos complejos.
El modelo ofrece dos niveles de refuerzo de razonamiento: High para un equilibrio entre rendimiento y consumo de tokens, y Max para capacidades máximas. El precio de la API se ha mantenido al nivel de la versión anterior GLM-5.1, lo que resulta muy atractivo dado el aumento de rendimiento.
Cifras frente a declaraciones
Veamos los benchmarks clave. En Terminal-Bench 2.1, GLM-5.2 obtiene 81,0 puntos, acercándose mucho a Opus 4.8 con sus 85,0 y superando a Gemini 3.1 Pro (74,0). En SWE-bench Pro obtiene 62,1 frente a 69,2 de Opus 4.8. En FrontierSWE (proyectos técnicos largos), el rezago respecto al líder es de solo el 1%.
Sin embargo, en la prueba DeepSWE, GLM-5.2 muestra 46,2 frente a 58,0 de Opus 4.8 y 70,0 de GPT-5.5. En NL2Repo (generación de proyectos a partir de descripciones), el resultado es 48,9 frente a 69,7 de Claude. Esto indica que en algunos escenarios, el modelo aún está notablemente por detrás de las soluciones punteras.
Uso real: reseñas y críticas
Los usuarios valoran positivamente la lógica básica y la capacidad del modelo para trabajar de forma autónoma. Propone correcciones por sí mismo y puede realizar tareas complejas a través de agentes auxiliares. Sin embargo, también hay quejas importantes.
El principal problema es la infraestructura en la nube. Muchos se quejan del escaso soporte y de la costosa tarificación en momentos de carga máxima. El modo Max, donde el modelo se despliega por completo, consume muchas más fichas, lo que encarece su uso. Algunos desarrolladores señalan que el modelo tiende a "atascarse" en bucles infinitos e ignorar comandos.
Veredicto del analista
GLM-5.2 es, sin duda, un gran paso adelante. Es el mejor modelo de código abierto para programación hasta la fecha y, en varios escenarios, realmente pisa los talones a Opus 4.8. La licencia MIT abierta y la posibilidad de ejecutarlo en hardware propio son bazas poderosas.
Sin embargo, llamarlo "asesino" de Claude es prematuro. En la mayoría de las pruebas, la propia Z.ai sitúa su modelo por debajo de Opus 4.8. Además, los problemas de infraestructura y el alto coste de uso en modo Max lo hacen menos atractivo para el trabajo diario en comparación con las soluciones consolidadas de Anthropic u OpenAI. GLM-5.2 es un competidor formidable que reduce la brecha, pero aún no la supera.