Crypto news

21.06.2026
10:16

NVIDIA distribuye una potente IA de forma gratuita — y gana más que sus competidores con ello

El 4 de junio de 2026, NVIDIA lanzó Nemotron 3 Ultra, el modelo de IA abierta más grande de la línea Nemotron 3. La empresa publicó bajo una licencia libre los pesos del modelo, los datos de entrenamiento y las metodologías de entrenamiento. El modelo está diseñado para agentes autónomos de larga duración y razonamiento complejo.

A diferencia de los modelos insignia cerrados como ChatGPT o Claude, Nemotron 3 Ultra se puede descargar, ajustar con datos propios y ejecutar en tu propia infraestructura. La apuesta aquí no es por la máxima inteligencia, sino por la apertura, la eficiencia y el control sobre el modelo.

Qué hace especial la arquitectura del modelo

Nemotron 3 Ultra no es simplemente un "transformador agrandado". Su base es una arquitectura híbrida compuesta por tres enfoques diferentes: capas Mamba-2, capas de atención (Attention) y una mezcla latente de expertos (Latent MoE), un mecanismo que dirige cada solicitud solo a los "especialistas" necesarios dentro del modelo.

Las capas Mamba-2 procesan textos largos de forma rápida y económica: sus costos crecen linealmente con la longitud, no de forma exponencial como en el mecanismo de atención habitual. Las capas de atención, por su parte, retienen con precisión grandes volúmenes de texto en la memoria. Y Latent MoE comprime los datos antes de pasarlos a los expertos, lo que permite que cada uno trabaje de manera específica y precisa, sin requerir cálculos adicionales.

En total, el modelo tiene alrededor de 550 mil millones de parámetros, pero para procesar cada token solo se utilizan aproximadamente 55 mil millones. Gracias a esto, piensa como un sistema enorme, pero en términos de costos se comporta como uno mucho más compacto. Junto con una ventana de contexto de 1 millón de tokens y una velocidad de más de 300 tokens por segundo, esto proporciona una capacidad de procesamiento de cinco a seis veces mayor y un costo de tareas aproximadamente un 30% menor.

Estrategia de NVIDIA y apuesta por el ecosistema

El principal valor del lanzamiento, según analistas del sector, no reside en el modelo en sí, sino en el ecosistema que NVIDIA está construyendo alrededor de su hardware. La lógica es simple: quien ejecuta Nemotron casi con certeza lo hace en tarjetas gráficas NVIDIA, lo ajusta con sus herramientas de software y lo despliega en su propio software. La apertura aquí no es caridad, sino una forma de atraer a los desarrolladores de vuelta a la compra del hardware de la empresa.

NVIDIA puede permitirse esto porque sus capacidades financieras son incomparables con los costos del modelo en sí. Con una capitalización de mercado superior a los 5 billones de dólares, el entrenamiento de Nemotron 3 Ultra, que probablemente costó cientos de millones de dólares, es un gasto casi imperceptible para la compañía. Las ventas de tarjetas gráficas cubren con creces la investigación, por lo que NVIDIA puede distribuir el modelo de forma gratuita y aun así ganar más de lo que los competidores cerrados cobran por el acceso de pago.

El contexto político añade un peso adicional al lanzamiento. Un modelo estadounidense abierto se puede verificar, modificar y ejecutar en servidores propios, lo que lo hace atractivo para países que construyen una IA nacional independiente, desde Europa hasta el Sudeste Asiático. Nadie puede desactivar este modelo de forma remota, y esto es especialmente valioso tras las recientes restricciones en torno a los modelos cerrados.

En qué aspectos el modelo es inferior y qué pasará después

A pesar de todas sus ventajas, Nemotron 3 Ultra no es el modelo más inteligente del mercado. En el ranking independiente Artificial Analysis Intelligence Index obtuvo 48 puntos, el mejor resultado entre los modelos abiertos de EE. UU., pero a nivel mundial está por detrás de líderes como Kimi K2.6 (54 puntos) y DeepSeek. Según estimaciones de analistas, los modelos abiertos están de tres a siete meses por detrás de los cerrados.

Sin embargo, esta brecha, en mi opinión, es cada vez menos relevante si el modelo abierto es simplemente suficiente para las tareas reales. Un banco que implementa Nemotron 3 Ultra para procesar préstamos en sus propios servidores no necesita una inteligencia de nivel insignia; necesita un modelo que se pueda ajustar con datos confidenciales, mantener dentro de su perímetro de seguridad protegido y no compartir información sensible con terceros.

La apuesta de NVIDIA por la eficiencia, en lugar de por los récords en pruebas, podría resultar más visionaria. Con la adopción masiva de la IA, el costo de operación del modelo pasa a primer plano, y aquel que casi no se queda atrás en inteligencia, pero es cinco veces más barato, gana en la operación real. Los analistas esperan que el ecosistema abierto solo se fortalezca: NVIDIA tiene los recursos, la motivación y los canales de distribución para lanzar modelos abiertos cada vez más potentes más rápido que cualquier otra empresa.

Opinión de experto: En los próximos 12 a 18 meses, veremos cómo los modelos abiertos basados en la arquitectura Nemotron se convierten en el estándar para el sector empresarial, mientras que los sistemas cerrados seguirán siendo un producto de nicho para tareas donde la calidad de nivel superior al 1% es crítica. NVIDIA, al distribuir IA de forma gratuita, está esencialmente cortando el suministro de aire a los competidores que intentan monetizar el acceso a sus modelos. Este es un ejemplo clásico de la estrategia de "cuchilla y hojas de afeitar", pero a escala de toda la industria.