GLM-5.2 de Z.ai: ¿Realmente este modelo chino se ha convertido en el «asesino» de Claude? Análisis de un experto
En el mundo de la inteligencia artificial se gesta una sensación. El nuevo modelo abierto GLM-5.2 de la empresa Z.ai, según muchos entusiastas, supone un serio desafío para los productos estrella de Anthropic: los modelos de la familia Claude. Algunos ya se han apresurado a llamarlo el «asesino chino» de Claude, y hay razones de peso para ello.
Analicemos qué es realmente GLM-5.2 y hasta qué punto son justas tales afirmaciones rimbombantes. No se trata simplemente de una actualización más. La principal novedad es una ventana de contexto ampliada a 1 millón de tokens, cinco veces más que su predecesor GLM-5.1. Esto permite al modelo mantener en su campo de visión bases de código enteras y mantener sesiones largas y complejas sin pérdida de calidad. Además, el modelo ofrece dos modos de «refuerzo de razonamiento»: High para equilibrar rendimiento y consumo de tokens, y Max para máxima precisión, pero con un mayor consumo de recursos.
La ventaja clave es la licencia abierta MIT, que elimina las restricciones regionales y permite ejecutar el modelo en hardware propio (self-hosting). Esto hace que GLM-5.2 sea increíblemente atractivo para desarrolladores y empresas preocupadas por la privacidad de los datos.
Benchmarks: Los números no mienten, pero hay matices
Según las pruebas internas de Z.ai, GLM-5.2 muestra resultados impresionantes, especialmente en tareas de programación. En la prueba Terminal-Bench 2.1 obtuvo 81,0 puntos, acercándose mucho al resultado de Claude Opus 4.8 (85,0) y superando significativamente a Gemini 3.1 Pro (74,0). En SWE-bench Pro, el resultado es de 62,1 frente a 58,4 de GLM-5.1, aunque todavía está lejos del 69,2 de Opus 4.8.
Sin embargo, si observamos otros benchmarks, el panorama se vuelve más complejo. En NL2Repo, que evalúa la generación de un proyecto completo a partir de una descripción textual, GLM-5.2 (48,9) está muy por detrás de Opus 4.8 (69,7). En DeepSWE, la brecha es aún mayor: 46,2 frente a 58,0. Es decir, en varios escenarios complejos, el modelo chino aún no alcanza al líder.
No obstante, en tareas de larga duración (long-horizon), como FrontierSWE, donde el modelo debe gestionar un proyecto durante decenas de horas, GLM-5.2 se queda solo un 1% por detrás de Opus 4.8, superando a GPT-5.5 y a la versión anterior Opus 4.7. Esto sugiere que la novedad maneja bien el mantenimiento del contexto y la coherencia en sesiones prolongadas.
Precio y experiencia real de los usuarios
El costo de la suscripción GLM Coding Plan comienza desde $12.6 al mes para el plan Lite (con pago anual), que es realmente varias veces más barato que las suscripciones a Claude o GPT. El plan Max costará $112 al mes. Sin embargo, como señalan los usuarios, «el diablo está en los detalles». El modo Max, en el que el modelo despliega todo su potencial, consume significativamente más tokens, lo que con un uso activo puede agotar rápidamente el límite.
Las opiniones de los usuarios están divididas. Por un lado, se elogia la lógica básica, que ha mejorado notablemente, y la capacidad de resolver tareas complejas de forma autónoma, ofreciendo correcciones. Por otro lado, se critica la infraestructura en la nube inestable, el alto costo del modo Max y la tendencia del modelo a «encasillarse» en ciclos interminables de razonamiento, ignorando las órdenes del usuario. Muchos señalan que GLM-5.2 está «optimizado» para los benchmarks, pero en el trabajo real con código se comporta como un modelo de «plan económico».
Mi veredicto: Llamar a GLM-5.2 el «asesino» de Claude es prematuro por ahora. Es, sin duda, el modelo abierto más potente hasta la fecha, que reduce la brecha con los líderes del mercado y ofrece ventajas únicas como la licencia abierta y una enorme ventana de contexto. Para los desarrolladores que valoran la privacidad y están dispuestos a tolerar algunos «problemas de crecimiento» de la infraestructura, es una herramienta excelente y rentable. Sin embargo, para una calidad y estabilidad sin concesiones, los buques insignia de Anthropic y OpenAI siguen siendo imbatibles. El mercado de la IA se vuelve cada vez más competitivo, y eso, sin duda, beneficia a todos.