Revista Gerente - Colombia
Registro  /  Login

Portal de Negocios en Colombia

NEGOCIOS

Los Gerentes de Impacto del 2024

TECNOLOGÍA

Quién es Liang Wenfeng, la mente detrás de DeepSeek, la IA china que surgió de la nada

El futuro puede surgir en cualquier parte. Incluso en Zhanjiang, una anodina ciudad enclavada en la costa de Cantón. Allí nació en 1985 Liang Wenfeng, un joven enjuto y gafoso, anodino solo en apariencia. Hete aquí que su extraordinaria creación, la inteligencia artificial DeepSeek … , sacude estos días el mundo a modo de renovado «momento Sputnik», revelando que la carrera tecnológica entre las dos grandes superpotencias, China y Estados Unidos, está en realidad mucho más disputada de lo previsto.
De Zhanjiang a Zhejiang. El talento matemático de Liang le abrió las puertas de esta prestigiosa universidad provincial, donde se graduó en Ingeniería Electrónica y Telecomunicaciones antes de completar una maestría en Ingeniería de la Información. Durante su etapa universitaria, ese talento matemático se refinó en interés por la automatización aplicada a las inversiones.

De Zhejiang a Huanfang, High-Flyer en inglés. Así llamó Liang a la empresa que en 2015 cofundó junto a dos compañeros de carrera, Xu Jin y Zheng Dawei. Su propósito consistía en aplicar el uso de algoritmos de aprendizaje automático al sector financiero. ¿El resultado? Una revolución: fondos gestionados por valor de 7.600 millones de euros y 160 empleados. Liang, no obstante, siempre se consideró más ingeniero que inversor.
De High-Flyer a DeepSeek. La firma siguió avanzando en sus investigaciones sobre inteligencia artificial (IA), hasta atesorar más de 10.000 unidades procesadoras de Nvidia, capaces de entrenar Grandes Modelos de Lenguaje (LLM, por sus siglas en inglés). En abril de 2023, el equipo directivo anunció sus planes de expandir sus actividades y dedicar recursos a «explorar la esencia de la Inteligencia Artificial General», definida por OpenAI como un sistema autónomo capaz de superar las capacidades cognitivas de los seres humanos en la mayoría de actividades con valor económico. Un mes después, High-Flyer creaba una nueva filial: DeepSeek.
Y de Deepseek, al mundo. El impacto llegó el pasado 20 de enero, con la presentación de su modelo R1. Este ha logrado igualar a las plataformas estadounidenses pese a contar con menos semiconductores y de inferior calidad, así como un coste oficial de 5,6 millones de dólares frente a las estimaciones generales vigentes, cifradas entre 100 y 1.000 millones de dólares. Su modesta y eficaz aparición, por más que persistan dudas respecto a la veracidad de sus recursos, ha provocado una corrección bursátil de magnitudes planetarias, en particular ante el estadounidense Proyecto Stargate y sus inversiones por valor de 500.000 millones de dólares pregonadas la semana pasada.
La fiabilidad de DeepSeek, sin embargo, ha quedado en entredicho al comprobar que su inteligencia artificial opera dentro de los límites impuestos por la censura china. El sistema se niega a proporcionar información sobre cuestiones sensibles para el régimen, como la matanza de Tiananmen. Ahora bien: en sus transparentes entrañas no cabe mentira alguna. La empresa presenta sus modelos con código abierto, lo que permite su adaptación en manos de otros desarrolladores, acelerando así la innovación a nivel global.

Tensión geopolítica

La clarividencia de Liang no ha pasado desapercibida para el Partido Comunista. El todavía treintañero era invitado ese mismo 20 de enero a exponer sus puntos de vista ante la atenta mirada del primer ministro, Li Qiang. La irrupción de DeepSeek no solo ha desplazado a la competencia en la escena global, también fronteras adentro. En particular a Baidu, un gigante tecnológico dueño del más popular motor de búsqueda, que con su Ernie parecía liderar la inteligencia artificial china como ya hace con los coches autónomos.
Su director ejecutivo, Robin Li, protagonizó el año pasado un evento semejante. Este aseguró entonces que las empresas chinas nunca serían capaces de replicar el éxito de OpenAI y su ChatGPT, y que por tanto deberían centrarse en explotar las posibilidades comerciales de los modelos ya existentes.
Liang, en cambio, posee un discurso más ambicioso. Durante una entrevista con la publicación china ‘Waves’ en 2023, una de sus escasas apariciones en medios de comunicación hasta la fecha, defendió que «la inteligencia artificial china no puede estar siempre por detrás. A menudo decimos que hay una distancia de uno o dos años entre China y Estados Unidos, pero la auténtica distancia es aquella que media entre originalidad e imitación».
Una competición que al otro lado del Pacífico también están decididos a ganar –la Unión Europea ni está ni se le espera–. La rivalidad entre ambas potencias se extiende a nuevos ámbitos, y el tecnológico representa desde hace años uno de los más explícitos. El éxito fulgurante de DeepSeek, de hecho, realza las dudas respecto a las restricciones a la exportación de semiconductores avanzados impuestas por la Casa Blanca. ¿Resultan útiles? ¿Fracasan? ¿Por puenteables o por generar el efecto opuesto, incentivando la innovación?

Sea como fuere, el propio Liang habría reconocido durante su conversación con el primer ministro que estas sanciones constituían un punto de congestión para la industria china, según recogía el ‘Wall Street Journal’. Una nota contextual, en cualquier caso, a su discurso optimista, sabedor de que no importa tanto dónde empieza la carrera como dónde acaba.

DeepSeek lanza su propio generador de imágenes por IA para tumbar ahora a Midjourney y las de Microsoft, Google o X

28/01/2025

Actualizado a las 11:21h.

DeepSeek, la empresa china responsable del ‘chatbot’ del mismo nombre que ha desbancado a ChatGPT en la App Store, ha lanzado Janus Pro, un nuevo modelo de generación de imágenes que mejora la comprensión multimodal y la estabilidad de la generación de imagen a texto para ofrecer resultados «altamente realistas» y con detalle pese a su baja resolución.
Janus Pro es el último integrante de la familia de modelos generativos Janus, una versión mejorada que, como explica la compañía en el repositorio de GitHub, «incorpora una estrategia de entrenamiento optimizada, datos de entrenamiento ampliados y escalabilidad a un tamaño de modelo mayor».

En su base se encuentra el modelo de lenguaje visual DeepSeek VL2, con 4.500 millones de parámetros activados. Según la compañía, «logra un rendimiento competitivo o de última generación con parámetros activados similares o menores en comparación con los modelos densos y basados en MoE de código abierto existentes».

Janus Pro se ofrece en dos tamaños, con mil millones de parámetros (1B) y 7.000 millones de parámetros (7B). Este último ofrece una mejor comprensión multimodal y mejora la estabilidad de la generación de texto a imagen.

INTERNACIONAL

VIDA GERENTE

Especiales Gerente