El pasado 27 de enero, inversores de todo el mundo contemplaban atónitos la evolución del mercado. Las principales empresas tecnológicas sufrían un desplome repentino. El Nasdaq caía con fuerza desde su apertura, cerrando finalmente en -3,1%. Nvidia, una de las joyas del sector tecnológico, se desplomaba un 17% en su cotización, entrando en el récord Guinness como la empresa con la mayor pérdida de capitalización bursátil en un solo día: 593.000 millones de dólares.
No era la única que veía cómo caía el precio de su acción. Todo el ecosistema tecnológico detrás de la innovación en IA generativa se tambaleaba, con ramificaciones que alcanzaban incluso al sector eléctrico. Constellation Energy, uno de los principales proveedores de energía de los gigantes de internet, registraba un varapalo del 19% en su cotización.
La onda expansiva llegaba incluso a la española ACS, que, tras un repunte vertiginoso la semana anterior por su participación en la construcción de data centers vinculados al proyecto Stargate, a través de Turner Construction, veía ahora cómo sus acciones retrocedían a los niveles previos al anuncio.
Un nuevo competidor en el desarrollo de la IA generativa había emergido casi como por arte de magia en China, poniendo en jaque a Silicon Valley. Su nombre, DeepSeek. El revuelo no se debía tanto a lo que hacía —pues sus capacidades eran casi idénticas a las de otros chatbots ya existentes (Gemini, Claude, o ChatGPT)—, sino a cómo lo hacía, que era infinitamente más eficiente. Esto rompía la creencia de que solo invirtiendo una ingente cantidad de recursos era posible competir en este mercado.
Nadie vio venir a DeepSeek. Una empresa que había nacido en mayo de 2023, de la mano de Liang Wenfeng, fundador de un fondo cuantitativo de cobertura, que decidió hacer una spin-off de su laboratorio de innovación para desarrollar una IA general (IAG). Por tanto, estaba fuera del ecosistema de los gigantes tecnológicos chinos, como Baidu o Alibaba, del que podría esperarse alguna innovación disruptiva. Primera sorpresa: ¿cómo una empresa nacida en la periferia de los grandes hubs tecnológicos, y en tan poco tiempo, había sido capaz de obtener resultados similares a los de OpenAI?
Hasta aquí, todo apuntaba a una sana (*) competencia que, de forma inesperada, entraba a rivalizar con Anthropic y OpenAI. Pero dentro traía una segunda sorpresa: lo había conseguido con una inversión mínima. Para ponerlo en perspectiva: mientras entrenar los nuevos modelos de OpenAI o Anthropic superaban los 100 millones de dólares de inversión, el de DeepSeek había costado tan solo 5,6 millones de dólares (puede que algo más).
El 20 de enero, poco antes de que en la Casa Blanca anunciara una inversión a gran escala en centros de datos para afianzar el liderazgo de Estados Unidos en Inteligencia artificial, fuera de los focos mediáticos se presentaba DeepSeek R1. Una semana más tarde, el 26 de enero, Marc Andreessen, uno de los inversores más influyentes de Estados Unidos, y gran conocedor del mercado de IA, escribía en X un sucinto mensaje: “DeepSeek R1 es el momento Sputnik de la IA”. Ya solo quedaba esperar a que al día siguiente abrieran los mercados bursátiles.
Hasta ahora, desarrollar modelos de IA generativa avanzados ha sido un proceso intensivo en recursos computacionales (miles de GPU de alto rendimiento) consumiendo grandes cantidades de energía. Pocas empresas tienen el músculo financiero para hacerlo. Sin embargo, DeepSeek ha cambiado el paradigma económico dando paso a una futura democratización de la IA generativa. En otras palabras, su impacto no radica en empujar más allá los límites de la IA, sino en hacerla accesible para más empresas y, por cierto, de manera más sostenible.
La necesidad es la madre de la invención, y en China, el impulso por desarrollar una IA propia es abrumador. Pero si hay algo que motiva a un ingeniero, es resolver problemas bajo restricciones, y la empresa enfrentaba al menos dos muy importantes.
El primero era un desafío tecnológico: sin acceso a los chips de última generación de Nvidia, tuvo que transformar su limitación de hardware en un problema de software. Decidió sacrificar algo de precisión numérica (de 32 a 8 decimales) para ahorrar memoria (75%), procesó texto en bloques (varios tokens en paralelo) para acelerar el análisis y activó solo las partes del modelo necesarias en cada momento mediante sistemas expertos (MoE). Además, optó por eliminar el componente humano mediante técnicas de aprendizaje por refuerzo automatizadas y se apoyó en versiones más pequeñas del modelo mediante un proceso de “destilado”. En resumen, una batería de técnicas y estrategias de optimización ingeniosas que, aplicadas de forma sistemática, le permitieron entrenar modelos de IA con hardware estándar sin necesidad de recurrir a chips de última generación.
La segunda restricción era de talento: los expertos capaces de desarrollar estos modelos son escasos. No podían competir en salarios con los gigantes tecnológicos chinos. Había que buscar un enfoque diferente, y adoptar código abierto resultó ser una solución clave. Su transparencia no solo permitió apoyarse en una comunidad de desarrolladores, sino que también atrajo a estudiantes interesados en formar parte de un ecosistema dinámico y diverso. Además, la empresa fomentaba un ambiente de trabajo académico y orientado a la innovación para atraer a jóvenes investigadores. De hecho, como apuntaba con cierta nostalgia un directivo de Nvidia, no deja de ser paradójico que DeepSeek sea quien “mantenga viva la misión original de OpenAI de ser realmente abierta, estar a la vanguardia de la investigación y hacerlo en beneficio de todos”.
El desplome bursátil del 27 de enero no solo fue una señal para los inversores, sino también un aviso geoestratégico. Al día siguiente, Donald Trump reconocía que había sido “una llamada de atención para centrarse en competir para ganar». Además, destacó que «en lugar de gastar miles y miles de millones, gastando menos, con suerte, se podría alcanzar la misma solución».
Hace dos años, Arthur Mensch, cofundador de Mistral, declaraba en una entrevista en el Financial Times: “Nuestros competidores están desperdiciando muchos recursos en el entrenamiento de sus modelos. Estamos felices de ser el competidor más eficiente en inversión de capital”. Ahora, desde China, han apartado de un codazo a Mistral, redefiniendo completamente el concepto de eficiencia y cuestionando tanto el modelo económico como, por extensión, la estrategia de crecimiento de toda una industria.
Finalmente, el 29 de enero, las aguas volvían a su cauce. El mercado comenzaba a absorber el cambio y asimilar sus implicaciones. El dominio de las grandes tecnológicas ya no es incuestionable. Y, como diría Keynes… “Cuando los hechos cambian, cambio de opinión. ¿Qué hace usted, señor?»