Crypto news

26.06.2026
17:00

Ilusión de los tokens: por qué el mercado de IA debe valorarse en dólares, no en unidades de consumo

Recientemente, en la industria de la inteligencia artificial se ha observado una tendencia peligrosa: analistas y periodistas se apoyan cada vez más en datos brutos sobre el consumo de tokens para evaluar la cuota de mercado de los modelos. Como analista profesional, considero que este enfoque es fundamentalmente incorrecto y engañoso. El socio director de Dragonfly, Haseeb Qureshi, argumentó recientemente de manera contundente por qué la cuota de tokens es una mala métrica y propuso medir el mercado en función de los costos reales en dinero. Analicemos su lógica.

Cuatro "trampas" de las estadísticas de tokens

El primer problema, y quizás el más obvio, son los subsidios. Los laboratorios chinos lanzan regularmente nuevos modelos con grandes descuentos o incluso acceso gratuito. Esto atrae a una gran cantidad de usuarios que saltan de un modelo gratuito a otro, inflando artificialmente el consumo de tokens, pero sin generar ni un centavo de ingresos reales. Los gráficos de uso en estos casos muestran un crecimiento bonito que no tiene nada que ver con la realidad económica.

El segundo problema está relacionado con el tamaño de los modelos. Los modelos pequeños, como Qwen 3.5-27B, cuestan aproximadamente cien veces menos por token que el modelo insignia Claude Opus. El crecimiento del uso de Qwen puede verse en el gráfico como un aumento repentino en la cuota de los modelos abiertos, aunque económicamente es una magnitud completamente insignificante. Analizar el mercado sin separar los modelos por categorías de peso es como comparar elefantes con hormigas.

El tercer problema son los sistemas multiagente. Se puede gastar la misma cantidad en una arquitectura multiagente compleja basada en DeepSeek o GLM 5.2 y en un solo modelo avanzado como Opus o GPT-5.5 Pro. Pero con un rendimiento comparable, la configuración multiagente consumirá muchos más tokens por el mismo dinero. Como señaló acertadamente Qureshi, si el 5% del uso de Opus se desplaza a un sistema de este tipo con un consumo de tokens cuatro veces mayor, el gráfico mostrará una caída de la cuota de Opus del 18%, aunque los gastos reales solo se hayan reducido en un 5%. Esto es una distorsión grave de la realidad.

El cuarto problema es la limitación de la propia plataforma OpenRouter. Si una empresa se ha decidido por un laboratorio avanzado, le resulta más rentable recurrir directamente a Anthropic u OpenAI, y no a través de OpenRouter con su recargo. En el gráfico, esto se verá como una disminución de la cuota de EE. UU., aunque los tokens simplemente se van fuera de la plataforma. OpenRouter es útil para evaluar la cuota dentro de los modelos abiertos, pero no es adecuado en absoluto para comparar modelos abiertos y cerrados.

¿El futuro pertenece a los modelos baratos?

El fundador de SageRoad Research, Trevor Noren, desarrolla una idea similar, vinculándola con la presión de precios sobre la industria. Cita una estimación de JPMorgan: muchos tokens en el futuro podrían ser consumidos no por modelos avanzados, sino por modelos abiertos pequeños, que son suficientes para tareas específicas. Amazon ya ofrece alrededor de medio centenar de modelos abiertos a un precio que es una fracción del costo de los avanzados. Nvidia, junto con Dell, Lenovo y HP, está creando computadoras para agentes de IA.

El ejemplo del costo es especialmente ilustrativo. Según datos de JPMorgan, ejecutar el conjunto de tareas Artificial Analysis Intelligence Index en Claude Opus 4.8 cuesta $3,700 con un resultado de 56 puntos, mientras que DeepSeek V4 Pro obtiene 44 puntos por solo $186, aproximadamente 20 veces más barato. La conclusión es obvia: el nivel avanzado de inteligencia no es necesario para todo, solo donde realmente se necesita. GLM 5.2 de Z.ai parece comparable a los modelos principales de Anthropic y OpenAI.

Noren cree que la mercantilización de los modelos no solo vendrá de la competencia entre laboratorios avanzados, sino también de empresas que buscan controlar los costos mediante modelos especializados más baratos.

Mi conclusión como analista: ambas posturas coinciden en un punto: el mercado de la inteligencia artificial debe medirse por el dinero, no por los tokens. Bajo la presión de los precios, la ventaja se está desplazando cada vez más hacia los modelos baratos. Este es un cambio fundamental que inversores y desarrolladores deberían tener en cuenta desde ya. Aquellos que sigan mirando los gráficos brutos de consumo de tokens corren el riesgo de perderse la imagen real de la redistribución del capital en la industria.