El mundo de la inteligencia artificial recibió una conmoción inesperada esta semana cuando se dio a conocer la historia de DeepSeek, una modesta compañía china que, contra todo pronóstico, logró presentar un modelo de lenguaje de vanguardia con recursos limitados. Esta hazaña no solo ha encendido el debate sobre el liderazgo tecnológico en Silicon Valley, sino que además ha convertido a Liang Wenfeng, el hombre detrás de la empresa, en un símbolo de orgullo nacional en China. Su logro, alcanzado en medio de restricciones impuestas por Estados Unidos a la exportación de procesadores de alta gama, pone de relieve la tenacidad de la industria tecnológica china y subraya la posibilidad de innovar aun cuando las circunstancias son adversas.
La publicación detallada de su modelo R1, con una explicación minuciosa de su proceso de entrenamiento, sorprendió a la comunidad científica y a las grandes corporaciones estadounidenses. Para muchos expertos, esta movida representa un momento decisivo: por primera vez se ha mostrado, paso a paso, cómo desarrollar un sistema tan avanzado sin recurrir a presupuestos casi ilimitados. Con este anuncio, DeepSeek se ha convertido en un rival a tomar muy en serio, y su fundador en un protagonista decisivo para entender la futura competencia global en el ámbito de la IA.
Un impulso inusual: el origen financiero y la obsesión por las GPU
Liang Wenfeng no se formó en el corazón de la industria de la inteligencia artificial, ni en un prestigioso laboratorio de Silicon Valley. De hecho, era ampliamente reconocido por liderar un exitoso fondo de cobertura llamado High-Flyer. Fue allí donde comenzó a aplicar algoritmos basados en IA para analizar patrones de mercado y detectar oportunidades de inversión. Con el paso del tiempo, sus tácticas de cuantificación y su creciente obsesión por las tarjetas gráficas Nvidia —fundamentales para entrenar modelos de IA— lo llevaron a crear un equipo con profundos conocimientos en el manejo de grandes clústeres de computación.
En 2021, antes de que surgieran las fuertes restricciones de exportación desde Estados Unidos, Liang empezó a comprar miles de GPUs Nvidia para su proyecto paralelo de inteligencia artificial, algo que más de uno describió como un mero capricho de multimillonario. Mientras en el mundo de la tecnología se daba por hecho que solo gigantes como ByteDance o Alibaba podrían desarrollar modelos equivalentes a los de OpenAI o Google, él construía un músculo informático inusual en una empresa de su tamaño. Con una visión aún difusa —pero enfocada en la ambición de crear “algo que lo cambiaría todo”— DeepSeek comenzó a gestarse como una apuesta arriesgada, pero prometedora.
El punto de inflexión llegó cuando, desde Washington, se restringió la exportación de los chips más potentes de Nvidia al mercado chino. En lugar de frustrar los planes de DeepSeek, estas medidas impulsaron la creatividad del equipo de Liang: se las ingeniaron para maximizar la capacidad de un hardware que no era de última generación, demostrando que el verdadero secreto no radica tanto en la potencia bruta, sino en la optimización y en la forma de entrenar modelos con menos recursos. Esa experiencia, sumada a la dedicación de un equipo formado por ingenieros locales de élite, les dio la confianza para lanzar el modelo R1 y detallar sus métodos de desarrollo.
El desafío a los gigantes de Silicon Valley y el orgullo nacional
La comunidad de investigadores de inteligencia artificial en Estados Unidos reaccionó con asombro y cierta preocupación ante el hecho de que una start-up relativamente desconocida de China lograra resultados comparables a los de organizaciones como OpenAI o Google DeepMind, pero con una fracción de su presupuesto. DeepSeek anunció que había invertido alrededor de 5,6 millones de dólares y utilizado poco más de 2.000 unidades de GPU Nvidia H800 para entrenar un modelo con la impresionante cifra de 671.000 millones de parámetros. Si se compara con los capitales de cientos o incluso miles de millones de dólares que manejan las firmas estadounidenses, la eficiencia alcanzada resulta todavía más destacable.
Mientras los foros de Silicon Valley discutían si las grandes tecnológicas —Meta, Anthropic o la misma OpenAI— podrían mantener su “ventaja competitiva” a largo plazo, en China la revelación del modelo R1 convirtió a Liang Wenfeng en un adalid de la independencia tecnológica. Al mismo tiempo, se erigió como un ejemplo claro de cómo la comunidad investigadora china puede encontrar caminos propios para avanzar en áreas de frontera. Prueba de ello fue su participación en un encuentro con Li Qiang, la segunda figura más influyente del gobierno, en el que se instó a los empresarios a concentrar esfuerzos en conseguir avances en tecnologías clave.
En buena parte, la cultura corporativa de DeepSeek recuerda al comienzo de DeepMind en Reino Unido: un fervor casi académico centrado en compartir descubrimientos y promover la investigación. La compañía no parece estar apurada por recaudar fondos externos ni por producir beneficios inmediatos a partir de sus logros. Más bien, muestra un afán casi purista por generar avances y difundirlos para que otros puedan construir sobre ellos. Según inversionistas y analistas en Beijing, esta conducta, tan poco usual en el ámbito empresarial, la vuelve particularmente competitiva: la reputación de liberar conocimiento promueve el intercambio de ideas y atrae a mentes brillantes.
La expansión de la infraestructura global y los nuevos retos de DeepSeek
Pese al revuelo que ha causado DeepSeek, no hay duda de que sus competidores estadounidenses siguen moviéndose a gran velocidad. Las mayores empresas de IA —desde OpenAI hasta Google— están levantando enormes centros de datos con hardware de última generación. El anuncio reciente de OpenAI y SoftBank, que planean invertir al menos 100.000 millones de dólares en infraestructura, o la megaexpansión de Elon Musk con xAI y su supercomputadora Colossus, reflejan que la batalla por la supremacía en la inteligencia artificial apenas comienza. En este entorno hipercompetitivo, la ventaja inicial de DeepSeek podría reducirse si no mantiene el ritmo de inversión en nuevas tecnologías o no logra renovar su infraestructura.
Por el momento, DeepSeek cuenta con uno de los clústeres de computación más grandes de China y una experiencia que le permite exprimir el rendimiento de chips que no son de última generación. Sin embargo, a medida que los gigantes internacionales avancen hacia la compra y el desarrollo de procesadores aún más potentes —como la próxima serie Blackwell de Nvidia—, el desafío para la pequeña firma china será equilibrar la carrera de potencia sin renunciar a sus métodos de optimización. Los ingenieros de DeepSeek no ignoran que los recursos de las grandes corporaciones estadounidenses podrían volver a imponer un nuevo estándar de rendimiento, dificultando que las compañías con menor acceso al capital puedan competir de igual a igual.
Un futuro incierto, pero prometedor
Los logros de DeepSeek revelan la importancia de la especialización y la audacia en la industria de la IA. También subrayan la existencia de un gran número de ingenieros y científicos en China capaces de aprovechar sistemas y algoritmos de forma muy eficiente, reduciendo costes y acortando el tiempo de entrenamiento de los modelos. Muchos analistas señalan que este talento en optimización y sistemas distribuidos es el verdadero “arma secreta” de DeepSeek, y podría servirle para afrontar cualquier turbulencia futura.
Sin embargo, el panorama no está libre de nubes grises. Fuentes cercanas a High-Flyer, el fondo de cobertura de Liang, señalan que los resultados han sido menos espectaculares en los últimos meses, quizá porque Liang se concentra cada vez más en DeepSeek. Si esta tendencia se prolonga, la disponibilidad de recursos que ha hecho posible la ambiciosa investigación de IA podría mermar. El equilibrio entre seguir financiando un proyecto de altos vuelos y mantener el rendimiento del fondo será un factor determinante a mediano plazo.
Aun así, el entusiasmo que se respira en las oficinas de DeepSeek, situadas en Hangzhou y Beijing, y su creciente prestigio como empleador que ofrece algunos de los salarios más competitivos del sector, apuntan a una voluntad firme de seguir mejorando. Liang, por su parte, refuerza la identidad de la compañía como un semillero puramente “local”: su equipo directivo se nutre principalmente de doctores graduados de las universidades más importantes de China, como Pekín, Tsinghua y Beihang. Este énfasis en el talento local ha calado hondo en la opinión pública y ha reforzado la idea de que la innovación china puede triunfar sin depender de la cantera de Silicon Valley.
El sorprendente ascenso de DeepSeek
La publicación del modelo R1 de DeepSeek representa una prueba tangible de que la innovación puede surgir en lugares y bajo condiciones que la mayoría juzgaría inadecuadas o insuficientes. Ha habido un importante debate internacional sobre la necesidad de gigantescos presupuestos y hardware puntero para avanzar en la inteligencia artificial, pero la experiencia de esta start-up china sugiere que la creatividad y la optimización pueden, al menos en parte, compensar la falta de recursos ilimitados. Además, la historia de Liang Wenfeng y su transición desde el mundo de las finanzas cuantitativas hasta la construcción de un titán tecnológico ilustra cómo la perseverancia y la visión pueden dar frutos en un escenario global cada vez más competitivo.
DeepSeek, con su enfoque en la investigación pura y su compromiso de compartir el conocimiento, ha dejado claro que el espacio de la IA no es exclusivo de las corporaciones estadounidenses con grandes bolsillos. Aunque enfrenta la presión de gigantes con recursos descomunales y la incertidumbre económica de su propio fondo de cobertura, la empresa se presenta como un caso de estudio fascinante. En la carrera global por desarrollar modelos cada vez más cercanos a la inteligencia humana, DeepSeek ha demostrado que China no solo está dispuesta a competir, sino que también sabe cómo golpear la mesa con fuerza cuando menos se espera.