Dólares, no tokens: por qué la cuota de mercado de los modelos de IA es una ilusión peligrosa
El socio gerente de Dragonfly, Haseeb Qureshi, ha criticado duramente el enfoque actual para evaluar el mercado de modelos de IA. En su opinión, el análisis basado en el consumo de tokens —especialmente en la plataforma OpenRouter— conduce a conclusiones fundamentalmente erróneas. La verdadera métrica son los dólares gastados por los usuarios, no el volumen bruto de tokens.
Según Qureshi, el problema radica en varias distorsiones clave. La primera son los subsidios. Los laboratorios chinos lanzan regularmente modelos con descuentos agresivos o incluso acceso gratuito. Esto atrae a un flujo de usuarios que saltan de un modelo gratuito a otro, inflando las estadísticas de tokens, pero sin generar ingresos reales. El segundo factor es la enorme variación en el costo del token según el tamaño del modelo. Un modelo pequeño como Qwen 3.5-27B puede ser cien veces más barato por token que el modelo insignia Claude Opus. Un aumento repentino en la cuota de Qwen en el gráfico de OpenRouter parece impresionante, pero económicamente podría ser una gota en el océano. Qureshi enfatiza que un análisis correcto solo es posible dentro de las mismas categorías de peso.
Sistemas devoradores de tokens y la estadística "ciega" de OpenRouter
La tercera trampa son los sistemas multiagente. Se puede gastar la misma cantidad en una arquitectura compleja basada en DeepSeek o GLM 5.2 y en una sola consulta a un modelo de primer nivel como Opus. Con un rendimiento comparable, una configuración multiagente consumirá muchas más tokens por el mismo dinero. "Si el 5% del uso de Opus migra a un sistema así con un consumo de tokens cuatro veces mayor, el gráfico mostrará una pérdida del 18% de la cuota de Opus, aunque el gasto real solo se haya desplazado un 5%", explica Qureshi. Esto exagera dramáticamente la importancia de los tokens baratos.
El cuarto matiz es la propia elección de OpenRouter como fuente de datos. Si una empresa ya ha decidido su proveedor (Anthropic u OpenAI), le resulta más rentable trabajar directamente, evitando el recargo de la plataforma. En los gráficos de OpenRouter, esto parece una disminución de la cuota de los modelos estadounidenses, aunque el consumo real simplemente se traslada fuera de la plataforma. La conclusión de Qureshi es contundente: OpenRouter solo es útil para comparar dentro del segmento de modelos abiertos, pero es completamente inadecuado para comparar ecosistemas abiertos y cerrados.
Presión de precios: ¿el futuro pertenece a los modelos baratos?
Esta lógica es desarrollada por Trevor Noren, fundador de SageRoad Research. Él cita datos de JPMorgan: muchos tokens futuros no serán consumidos por modelos avanzados, sino por modelos abiertos pequeños, suficientes para tareas específicas. Amazon ya ofrece alrededor de medio millar de modelos abiertos a una fracción del costo de los modelos insignia, y Nvidia, junto con Dell, Lenovo y HP, está creando computadoras para agentes de IA. Mientras tanto, los propios mini-modelos de los gigantes estadounidenses (Claude Haiku, GPT-5.4-mini) aún no son competitivos en la "frontera eficiente", donde actualmente dominan los desarrolladores chinos: DeepSeek, MiniMax, Xiaomi y Alibaba.
El ejemplo del costo es particularmente ilustrativo. Ejecutar el conjunto de tareas del Artificial Analysis Intelligence Index en Claude Opus 4.8 cuesta $3,700 con un resultado de 56 puntos. DeepSeek V4 Pro obtiene 44 puntos por solo $186, aproximadamente 20 veces más barato. La conclusión es obvia: la inteligencia de vanguardia no es necesaria para todo, y donde es necesaria, GLM 5.2 de Z.ai ya es comparable con los modelos principales de Anthropic y OpenAI.
Opinión del experto: Los argumentos de Qureshi y Noren no son solo un debate académico. Para la industria de las criptomonedas, donde las métricas "on-chain" a menudo se perciben como una verdad absoluta, esto es un recordatorio importante: los datos brutos sin contexto de monetización pueden ser engañosos. El mercado de la IA se está moviendo hacia la mercantilización, y la verdadera batalla no será por los tokens, sino por los dólares de los presupuestos corporativos que buscan la máxima eficiencia. La victoria de los modelos chinos en el segmento de "relación calidad-precio" no es solo una tendencia, sino un cambio estructural a largo plazo.