Mercado de IA: el dólar, no el token, es la verdadera medida del poder
El socio gerente de Dragonfly, Haseeb Qureshi, criticó duramente el enfoque actual para analizar el mercado de modelos de IA. Su tesis principal: la cuota de tokens consumidos es un indicador extremadamente poco fiable y engañoso. Los modelos deben compararse exclusivamente por los dólares gastados, no por el volumen de tokens generados. Considero que esta tesis es fundamental para comprender la dinámica real de la industria.
Cuatro trampas de la métrica de tokens
El primer problema: los subsidios. Los laboratorios chinos lanzan regularmente nuevos modelos con descuentos agresivos o incluso acceso gratuito. Esto atrae a usuarios que migran entre modelos gratuitos, inflando el consumo de tokens sin gastar dinero real. Los gráficos de "cuota de mercado" en este caso dibujan una imagen falsa.
El segundo problema: el diferente tamaño de los modelos. Un modelo pequeño como Qwen 3.5-27B cuesta aproximadamente cien veces menos por token que el emblemático Claude Opus. El aumento en el uso de Qwen puede parecer un salto brusco en la cuota de mercado, aunque económicamente es una gota en el océano. El análisis debe hacerse dentro de las categorías de peso.
El tercer problema: los sistemas multiagente. Se puede gastar la misma cantidad en un sistema complejo basado en DeepSeek o GLM 5.2 y en un modelo avanzado como Opus o GPT-5.5 Pro. Pero la configuración multiagente "quemará" muchos más tokens por el mismo dinero. Como señaló acertadamente Qureshi: si el 5% del uso de Opus se traslada a un sistema de este tipo con un consumo de tokens cuatro veces mayor, el gráfico mostrará una pérdida de cuota de Opus de aproximadamente el 18%, aunque el gasto real solo se desplace un 5%. Dichos gráficos exageran la importancia de los tokens baratos.
El cuarto problema: la muestra de OpenRouter. Las grandes empresas, una vez que se deciden por un laboratorio avanzado, prefieren trabajar directamente con Anthropic u OpenAI, evitando el recargo de OpenRouter. En los gráficos, esto parece una disminución de la cuota de EE. UU., aunque los tokens simplemente salen de la plataforma. Conclusión: OpenRouter es útil para evaluar la cuota dentro de los modelos abiertos, pero no sirve para comparar modelos abiertos y cerrados.
¿El futuro son los modelos baratos?
Una idea similar fue desarrollada por el fundador de SageRoad Research, Trevor Noren, vinculándola con la presión de precios sobre la industria. Citó una estimación de JPMorgan: muchos tokens en el futuro serán consumidos no por modelos avanzados, sino por modelos abiertos pequeños, que son suficientes para tareas específicas. Amazon ya ofrece alrededor de medio centenar de modelos abiertos a un precio que es una fracción del costo de los avanzados, y Nvidia, junto con Dell, Lenovo y HP, está creando computadoras para agentes de IA.
El ejemplo del costo es especialmente ilustrativo. Ejecutar el conjunto de tareas Artificial Analysis Intelligence Index en Claude Opus 4.8 cuesta $3,700 con un resultado de 56 puntos, mientras que DeepSeek V4 Pro obtiene 44 puntos por solo $186, aproximadamente 20 veces más barato. Conclusión: el nivel avanzado de inteligencia no es necesario para todo, y donde es necesario, GLM 5.2 de Z.ai parece comparable a los modelos principales de Anthropic y OpenAI.
Noren cree que la mercantilización de los modelos no solo vendrá de la competencia entre laboratorios avanzados, sino también de empresas que buscan controlar los costos a través de modelos especializados más baratos. Ambas posiciones coinciden en una cosa: el mercado de inteligencia artificial debe medirse en dinero, no en tokens, y bajo la presión de los precios, la ventaja se desplaza cada vez más hacia los modelos baratos.
Mi conclusión: el mercado de IA está entrando en una fase de madurez donde las métricas de "volumen bruto" están dando paso a la eficiencia económica. Los inversores y analistas que no se adapten a la evaluación en dólares corren el riesgo de perderse un cambio tectónico hacia una selección pragmática de modelos. Los laboratorios chinos ya han capturado la "frontera eficiente" en el segmento de modelos pequeños, y esto está cambiando las reglas del juego.