Grok Build bajo fuego de críticas: los desarrolladores compararon la herramienta xAI con Claude Code y Codex
Elon Musk publicó recientemente en la red social X una solicitud de críticas sobre su nuevo producto Grok Build, respondiendo a una publicación entusiasta de uno de los usuarios. La reacción de la comunidad resultó ser todo menos optimista. Debajo de la publicación del multimillonario aparecieron decenas de comentarios, y una parte significativa de ellos señalaba los puntos débiles de la herramienta. Analicemos qué tiene de malo Grok Build y por qué, según los seguidores de Musk, competidores como Anthropic y OpenAI han avanzado mucho más.
¿Qué es Grok Build y cuál es su fortaleza?
Grok Build es una herramienta CLI agente de xAI para desarrollo, lanzada en beta temprana en mayo de 2026. Funciona directamente desde la terminal y solo está disponible para suscriptores de SuperGrok y X Premium Plus. El costo de acceso es de aproximadamente $300 al mes, lo que sitúa al producto en el mismo rango de precios que Claude Code y GitHub Copilot.
Para tareas complejas, los desarrolladores previeron un modo de planificación: el usuario puede aprobar un plan, comentar pasos individuales o reescribirlo completamente antes de comenzar la ejecución. Después de esto, cada cambio se muestra como un diff (visualización línea por línea de la diferencia entre dos versiones del archivo). El modelo base Grok 4.3 beta utiliza una arquitectura con 16 agentes y una ventana de contexto de 2 millones de tokens, y la herramienta puede ejecutar hasta ocho agentes en paralelo. Suena impresionante, pero en la práctica resultó ser diferente.
Comparación con competidores no favorece a xAI
El tema más frecuente en los comentarios fue la comparación con Claude Code y OpenAI Codex. Desafortunadamente, estas comparaciones casi siempre resultaron desfavorables para Grok. Un desarrollador describió un experimento directo: Grok trabajó en la implementación de un proyecto durante casi dos días, después de lo cual el mismo volumen de tareas se transfirió a Codex. Como resultado, el competidor avanzó el doble en seis horas.
Otro usuario afirmó que Grok entraba en bucles infinitos durante treinta minutos, mientras que Opus resolvió el mismo problema en el primer intento. Un tercer especialista señaló que la velocidad de inferencia en Grok CLI se siente demasiado lenta en comparación con Claude Code y Codex, lo que hace incómodo observar el trabajo del agente.
Además, hubo opiniones de que Grok es bueno para investigaciones profundas, pero claramente pierde frente a sus rivales en codificación autónoma compleja. Esta es una señal grave: si la herramienta no maneja tareas básicas de desarrollo, su valor para la comunidad profesional cae drásticamente.
Solicitudes de funcionalidad y aplicación de escritorio
Un grupo notable de comentarios se refería a las capacidades faltantes del sistema. Los usuarios solicitaron activamente la creación de una aplicación de escritorio oficial similar a Claude Cowork. Señalaron que la principal fortaleza de Claude radica en la integración en todos los aspectos de los flujos de trabajo, no solo en la escritura de código.
Adicionalmente, se escucharon solicitudes para las siguientes opciones:
- lanzamiento de una versión de código abierto del producto durante el período de prueba beta;
- implementación de funcionalidad completa de bucles (loop skill);
- creación del comando /goal para un trabajo autónomo estable del agente;
- integración de una capacidad incorporada para demostrar el software creado sin exportación.
Por separado, se planteó la cuestión de la retroalimentación. Un usuario admitió que no entiende a través de qué canales enviar comentarios después de un resultado fallido. Esto es bastante notable, considerando que xAI incorporó el comando /feedback directamente en el CLI. Parece que incluso los mecanismos básicos de interacción con los usuarios siguen siendo poco claros.
Precio y limitaciones: economía contra desarrolladores
El costo de la suscripción provocó una ola separada de críticas entre los especialistas. Los usuarios se quejaron de la estricta vinculación al costoso plan SuperGrok y sugirieron introducir un nivel más accesible. Además, lamentaron las estrictas limitaciones de tokens y el límite de 15 minutos de acceso a Grok Premium por día.
En la tabla a continuación, resumo las principales quejas:
| Problema | Esencia de la queja de los usuarios |
|---|---|
| Alta barrera de entrada | Vinculación obligatoria al costoso plan SuperGrok |
| Límites de uso | Restricciones de tokens y solo 15 minutos de Grok Premium al día |
| Geografía | Temores de que xAI repita la salida de Claude de Europa |
Ironía y escepticismo: cómo reaccionó la comunidad a la publicación de Musk
El propio formato de la publicación de Musk provocó reacciones sarcásticas. Varios usuarios notaron que la solicitud de comentarios críticos iba acompañada de la cita de un fanático entusiasta que literalmente declaró su amor por el producto. Un comentarista llamó a la republicación de su propia oda de alabanza un tipo especial de confianza en sí mismo.
Al mismo tiempo, parte de la audiencia se mantuvo leal a la empresa. Hubo agradecimientos por las rápidas iteraciones del equipo y declaraciones de que el producto está mejorando rápidamente. Algunos incluso predijeron que Grok pronto se convertiría en la mejor herramienta del mercado. Sin embargo, esas voces fueron una clara minoría.
Conclusiones del analista de Cryptalist
La recopilación de comentarios debajo de la publicación de Musk mostró una brecha evidente entre el mensaje de marketing y las evaluaciones de los desarrolladores en ejercicio. Grok Build se destaca por su gran contexto y arquitectura multiagente, pero en tareas reales, los usuarios registran un rezago en la calidad de la codificación autónoma, la velocidad y la estabilidad en comparación con los establecidos Claude Code y Codex.
Por lo tanto, las principales quejas se reducen a tres áreas:
- Calidad y confiabilidad: bucles, regresiones y pérdida frente a competidores en pruebas directas.
- Ecosistema: falta de una aplicación de escritorio, versión de código abierto y varias funciones de agente.
- Economía: precio alto y restricciones estrictas de tokens.
La etapa temprana de beta y el mecanismo de retroalimentación incorporado le dan a xAI un canal directo para refinar rápidamente el producto. Sin embargo, en mi opinión, para alcanzar a los líderes, la empresa necesitará no solo corregir errores, sino revisar radicalmente el enfoque de la codificación autónoma y la experiencia del usuario. Por ahora, Grok Build es una herramienta prometedora pero inmadura que pierde frente a soluciones más maduras en todas las métricas clave.