El verdadero costo de los modelos de IA: por qué el dólar es más importante que los tokens
El análisis del mercado de modelos de IA basado en el consumo de tokens es un camino hacia conclusiones fundamentalmente erróneas. A esta conclusión llegan los principales expertos de la industria, señalando que la verdadera medida de la competitividad y la demanda deberían ser los costos en dólares de los usuarios, no los indicadores brutos de uso de tokens.
Problema n.º 1: Distorsión de datos por subsidios
Los laboratorios chinos utilizan activamente una estrategia de precios agresiva, lanzando nuevos modelos con grandes descuentos o incluso acceso gratuito. Esto crea una ilusión de alta demanda: los usuarios cambian entre modelos gratuitos, inflando las estadísticas de consumo de tokens, pero sin gastar dinero real. Comparar esta actividad con el uso pago de modelos insignia es, por supuesto, erróneo.
Problema n.º 2: El tamaño del modelo importa
Los modelos pequeños, como Qwen 3.5-27B, pueden ser cien veces más baratos por token que, por ejemplo, Claude Opus. Un aumento repentino en la participación de modelos baratos en los gráficos de OpenRouter parece un triunfo de la IA abierta, pero en términos monetarios puede ser una cantidad absolutamente insignificante. Es necesario analizar el mercado estrictamente dentro de categorías de peso, comparando modelos de tamaño comparable.
Problema n.º 3: Sistemas multiagente
Las arquitecturas modernas que utilizan cascadas de varios modelos (por ejemplo, basadas en DeepSeek) consumen muchos más tokens por el mismo dinero que un solo modelo potente. Si el 5 % del uso de Opus se traslada a dicho sistema con un consumo de tokens cuatro veces mayor, el gráfico mostrará una pérdida de participación de Opus del 18 %, mientras que los costos reales en dólares solo se reducirán en un 5 %. Los tokens exageran la importancia de las soluciones baratas.
Problema n.º 4: Limitaciones de la plataforma OpenRouter
Las grandes corporaciones, una vez que eligen un proveedor, prefieren trabajar directamente con Anthropic u OpenAI, evitando el recargo de OpenRouter. Esto significa que la disminución de la participación de los modelos estadounidenses en la plataforma no refleja una fuga real de clientes: los tokens simplemente desaparecen del alcance de OpenRouter. La plataforma es útil para evaluar tendencias dentro del segmento de modelos abiertos, pero es absolutamente inadecuada para comparar ecosistemas abiertos y cerrados.
¿El futuro pertenece a los modelos baratos?
JPMorgan ofrece un ejemplo claro: ejecutar un benchmark en Claude Opus 4.8 cuesta $3,700 (resultado 56 puntos), mientras que DeepSeek V4 Pro alcanza 44 puntos por solo $186, 20 veces más barato. Amazon ya ofrece media docena de modelos abiertos a un precio que es una fracción del costo de sus equivalentes propietarios, y Nvidia, junto con Dell, Lenovo y HP, está creando computadoras para agentes de IA. Los gastos corporativos siguen siendo el principal motor del retorno de la inversión en IA, pero las empresas minimizarán los costos.
Mi conclusión: La industria se dirige hacia la mercantilización. Las posiciones líderes en la "frontera eficiente" las ocupan actualmente los desarrolladores chinos: DeepSeek, MiniMax, Xiaomi y Alibaba. Medir el mercado en dólares, y no en tokens, desplazará inevitablemente el enfoque del análisis hacia modelos baratos y altamente especializados. Y esto no es una cuestión de futuro: ya está sucediendo ahora mismo.