El mercado de la IA: por qué la métrica de "tokens" es engañosa y hay que contar en dólares
Últimamente, en la industria de la inteligencia artificial se ha vuelto una moda comparar modelos según el volumen de tokens consumidos. Sin embargo, como muestran los debates recientes entre analistas líderes, este enfoque es fundamentalmente erróneo. El socio director de la firma de capital de riesgo Dragonfly, Haseeb Qureshi, señala acertadamente que la cuota de tokens es un indicador extremadamente poco fiable para evaluar el mercado de modelos de IA. La imagen real de la fuerza y la demanda del mercado solo la proporcionan los dólares gastados, no el consumo bruto.
¿Por qué la métrica de tokens distorsiona tanto la realidad? Qureshi destaca varios problemas clave. El primero son los subsidios. Los laboratorios chinos lanzan regularmente nuevos modelos con descuentos agresivos o incluso acceso gratuito. Esto infla artificialmente los volúmenes de consumo de tokens, ya que los usuarios migran de un modelo gratuito a otro sin gastar ni un centavo. Los gráficos muestran un crecimiento explosivo, pero detrás de ello no hay una monetización real.
El tamaño importa: precio por token
El segundo problema radica en los diferentes tamaños de los modelos. Modelos pequeños, como Qwen 3.5-27B, pueden ser cien veces más baratos por token que soluciones insignia como Claude Opus. Un salto brusco en la cuota de consumo de Qwen en los gráficos de OpenRouter parece un triunfo de los modelos abiertos, pero en términos económicos es una cantidad insignificante. Un análisis correcto, según mi profunda convicción, solo es posible dentro de categorías de peso: los modelos deben compararse dentro de la misma clase por tamaño.
El tercer problema son los sistemas multiagente. Puedes gastar la misma cantidad en una configuración compleja basada en DeepSeek o GLM 5.2 y en una sola consulta a un modelo avanzado como Opus. Sin embargo, la arquitectura multiagente "quemará" muchas más veces la cantidad de tokens por el mismo dinero. Qureshi pone un ejemplo ilustrativo: si el 5% del uso de Opus migra a un sistema de este tipo con un gasto de tokens cuatro veces mayor, el gráfico mostrará una pérdida de cuota de Opus del 18%, aunque los gastos reales solo se hayan desplazado un 5%. Este es un ejemplo clásico de cómo la métrica de tokens exagera la importancia de los tokens baratos.
OpenRouter: un espejo distorsionado del mercado
El cuarto problema está relacionado con la elección de la propia plataforma OpenRouter. Las grandes empresas, una vez que se deciden por un laboratorio avanzado, prefieren trabajar directamente con Anthropic u OpenAI, evitando el recargo de OpenRouter. En el gráfico, esto parece una disminución de la cuota de EE. UU., aunque los tokens simplemente salen de la plataforma. La conclusión es obvia: OpenRouter es útil para evaluar la cuota dentro de los modelos abiertos, pero absolutamente inadecuado para comparar sistemas abiertos y cerrados.
Esta posición también la desarrolla el fundador de SageRoad Research, Trevor Noren, vinculándola con la presión de precios sobre la industria. Los datos de JPMorgan muestran que muchos tokens en el futuro serán consumidos no por modelos avanzados, sino por modelos abiertos pequeños, suficientes para tareas específicas. Amazon ya ofrece alrededor de medio centenar de modelos abiertos a un precio que es una fracción del costo de los avanzados.
Particularmente reveladoras son las cifras de JPMorgan: ejecutar el conjunto de tareas Artificial Analysis Intelligence Index en Claude Opus 4.8 cuesta $3,700 con un resultado de 56 puntos, mientras que DeepSeek V4 Pro obtiene 44 puntos por solo $186, aproximadamente 20 veces más barato. Según el banco, los propios modelos pequeños de Claude Haiku y GPT-5.4-mini aún no son competitivos en la "frontera eficiente", que actualmente dominan los desarrolladores chinos: DeepSeek, MiniMax, Xiaomi y Alibaba.
Mi análisis como experto: Estamos presenciando un cambio tectónico. La comoditización de los modelos es inevitable, y no solo vendrá de la competencia entre laboratorios avanzados, sino también de las corporaciones que buscan controlar los gastos mediante soluciones especializadas más baratas. Ambas posiciones coinciden en una cosa: el mercado de la IA debe medirse en dinero, no en tokens. Bajo la presión de los precios, la ventaja se desplaza cada vez más hacia los modelos baratos, y los inversores que siguen el sector cripto y de IA deberían reconsiderar sus KPI. Las métricas tradicionales de consumo de tokens están obsoletas: el futuro está en la eficiencia en dólares.