Nvidia eleva 50 veces la eficiencia de IA con Blackwell Ultra y reduce el costo por token

¿Quieres operar este fin de semana? Los índices sintéticos siguen activos → Explorar opciones.

Espacio patrocinado

Nvidia presentó nuevos datos de rendimiento de su arquitectura Blackwell Ultra y afirmó que sus sistemas GB300 NVL72 pueden alcanzar hasta 50 veces más capacidad de procesamiento por megavatio y reducir el costo por token en un factor de 35 frente a la generación Hopper.

El anuncio se produce en un momento en el que la inferencia de modelos avanzados se consolida como el principal motor de demanda computacional, impulsando una competencia centrada en eficiencia energética, reducción de costos y escalabilidad.

Blackwell y el nuevo estándar de rendimiento

Las mejoras de Blackwell Ultra se apoyan en una combinación de avances en hardware y software. Los Ultra Tensor Cores integrados ofrecen alrededor de 1,5 veces más potencia de cómputo que las GPU Blackwell estándar, mientras que el procesamiento de las capas de atención se duplicó gracias a una ejecución acelerada del algoritmo softmax, componente central de las arquitecturas transformer.

Estas optimizaciones buscan reducir cuellos de botella en modelos de razonamiento con ventanas de contexto extensas, cada vez más frecuentes en sistemas de IA generativa. En paralelo, la biblioteca TensorRT-LLM incrementó su rendimiento de forma sostenida, permitiendo que el throughput por GPU se duplique en determinados niveles de interactividad desde finales de 2025.

En conjunto, los avances multiplicaron por diez los tokens procesados por segundo por usuario y por cinco los tokens por segundo por megavatio. Esto explica el incremento total de 50 veces en la producción de infraestructura que Nvidia describe como una «fábrica de inteligencia artificial».

La economía del token como nueva métrica dominante

El enfoque de Blackwell Ultra refleja un cambio estructural en el sector, ya que la eficiencia por token se consolida como el principal indicador para evaluar la viabilidad económica de la inteligencia artificial.

Según el comunicado oficial, Chen Goldberg, vicepresidente senior de ingeniería en CoreWeave, señaló que el rendimiento en contextos largos y el consumo energético se han vuelto factores decisivos, especialmente porque la inferencia ocupa ahora el centro de la producción de modelos.

En consecuencia, las reducciones de costos podrían reconfigurar los modelos de negocio del sector. Proveedores de inferencia como Baseten, DeepInfra, Fireworks AI y Together AI ya reportaron mejoras relevantes con la plataforma Blackwell estándar.

Con Blackwell Ultra, ese margen se amplía aún más en cargas de baja latencia, reforzando la viabilidad de modelos comerciales basados en inferencia intensiva.

La nube acelera la adopción

El despliegue comercial avanza entre los grandes proveedores de infraestructura. CoreWeave fue el primero en implementar sistemas GB300 NVL72 en producción, integrándolos con su entorno basado en Kubernetes.

Posteriormente, Microsoft anunció el desarrollo de un superclúster GB300 NVL72 a gran escala, capaz de superar 1.1 millones de tokens por segundo en pruebas validadas externamente.

Por su parte, Oracle Cloud Infrastructure prevé expandir sus superclusters más allá de 100.000 GPU Blackwell para responder a la creciente demanda de inferencia. Al mismo tiempo, Nvidia anticipó nuevas mejoras con su próxima plataforma Rubin, que promete un salto adicional cercano a diez veces respecto a Blackwell.

En conjunto, estos movimientos refuerzan la transición hacia una fase industrial de la inteligencia artificial, donde la eficiencia energética, la reducción de costos y la escalabilidad de la inferencia se consolidan como los principales ejes de competencia tecnológica global.

Julio Molina
Julio Molina
Soy un joven de Venezuela, apasionado por la tecnología, la innovación y los sucesos económicos que moldean el mundo actual. Mi interés por las criptomonedas me llevó a profundizar en el ecosistema blockchain, con un enfoque especial en el sudeste asiático.

Deja un comentario

Columnistas destacados

Comunicados de Prensa

Asia