Publicado: mayo 9, 2026, 7:00 am
<![CDATA[
Las nuevas versiones de IA generativa son continuas, tanto que muchas veces los usuarios no saben cuál es la última innovación de ChatGPT, Claude o Gemini. En el caso de lo que hace China, ese conocimiento está aún más lejos. Cuando DeepSeek irrumpió en enero de 2025 con R1, el efecto fue inmediato y brutal. La empresa china hizo que Wall Street se preguntara si la carrera de la IA realmente necesitaba inversiones multimillonarias. Ese día, Nvidia cayó casi 17% y perdió cerca de 593,000 millones de dólares en valor de mercado.
El lanzamiento de DeepSeek V4-Pro no provocó un terremoto similar en los mercados, pero eso no significa que sea irrelevante, pues anunció un descuento de 75% para su modelo V4-Pro que extendió hasta el 31 de mayo de este año. Con ese ajuste, el costo por un millón de tokens de entrada baja de 1.74 dólares a 0.435 dólares, mientras que el millón de tokens de salida pasa de 3.48 dólares a 0.87 dólares. DeepSeek presentó V4 como una familia de modelos con dos versiones, V4-Pro, su opción más potente, y V4-Flash, una alternativa más ligera y económica. Según la documentación de la empresa, V4-Pro tiene 1.6 billones de parámetros totales y 49,000 millones activos, mientras que V4-Flash tiene 284,000 millones de parámetros totales y 13,000 millones activos. Ambos soportan una ventana de contexto de un millón de tokens. Una de las mediciones que más llaman la atención es el procesamiento de los tokens que empresas como Gemini, de Google Cloud han tenido. Sundar Pichai, CEO de Alphabet y Google, dijo que sus inversiones en IA ya forman parte de la rentabilidad de su empresa y de otras compañías, y como ejemplo señaló que Gemini ya procesa más de 16,000 millones de tokens por minuto mediante uso directo de API por clientes. “Nvidia y las otras empresas de semiconductores continúan siendo los principales beneficiados por la inversión en IA, pero actualmente el mercado está mirando también a las compañías que están realizando esta inversión para ver si pueden rentabilizarla, en caso de lograrlo harían sostenible la demanda por chips y por ende toda la cadena de suministro se beneficiaría”, señaló Rolando Rogers, portfolio manager de Fintual. DeepSeek, por su parte, insiste en que V4 está optimizado para capacidades “agénticas”, es decir, para sistemas que no solo responden preguntas, sino que ejecutan tareas.
Eso no significa que Nvidia quede fuera de la ecuación, al contrario, la demanda por capacidad de cómputo crece, pero ahora se cuestiona la eficiencia de los modelos, pues demuestra que no es necesario depender de GPU de última generación. Hace poco más de un año, Greg Estes, vicepresidente de marketing en Nvidia, señaló cuando fue el lanzamiento de R1, que una de las apuestas de la empresa con DeepSeek era mantener un modelo eficiente y rentable. En China, esa ambición tiene una dimensión política, ya que la IA es una pieza central de la autosuficiencia tecnológica del país, especialmente frente a las restricciones de Estados Unidos para el acceso a chips avanzados.
]]>
