El día después de Navidad, DeepSeek, una startup de origen chino cuyo nombre era desconocido para casi todo el mundo, lanzó su nuevo modelo de inteligencia artificial generativa DeepSeek-V3 capaz de operar como las plataformas más conocidas del mercado, ChatGPT o Gemini. El objetivo estaba claro: la potencia asiática quería demostrar que estaba a la altura de los avances tecnológicos. Es una batalla que, tarde o temprano, China iba a dar.
Ahora, la novedad frente a esto es otra. Los ingenieros de DeepSeek detallaron en un informe que para el entrenamiento de esta nueva IA se utilizaron alrededor de 6 millones de dólares, un décimo de lo que invirtió Meta en su última inteligencia artificial (el monto, desde entonces, ha sido disputado, al no incluir una inversión previa, hoy estimada en más de mil millones de dólares).
Hasta el debut de DeepSeek, la enorme inversión necesaria para entrenar un modelo de IA se posicionaban como la principal barrera que detenía la creación de nuevos sistemas lejos de las grandes empresas estadounidenses. ChatGPT-4, por ejemplo, costó más de 100 millones de dólares, según dijo Sam Altman, el CEO de OpenAI, en 2023. Pero aquella traba financiera parece haberse levantado. Y eso sacudió a la industria.
DeepSeek es una startup que fue fundada en 2023 por una firma de trading china llamada High Flyer. El emprendedor Liang Wenfeng es el líder de ambas compañías y, de acuerdo con The New York Times, su objetivo era desarrollar tecnologías que fueran competencia de la mano de talento joven graduado de las mejores universidades. “El avance no es casual. China tiene como objetivo ser líder mundial en IA para 2030-, aclara Santiago Vespoli, cofundador de Erebant, consultora especializada en inteligencia artificial-. Este salto era necesario para posicionarse entre los principales actores globales.”
Aunque la potencia asiática ya era reconocida y destacada en áreas como vehículos autónomos y reconocimiento facial, la innovación que trajo con el aterrizaje de DeepSeek fue lo que obligó a Estados Unidos, donde se concentran la mayoría de las grandes empresas tecnológicas como Google, Meta, OpenAI, Amazon y Microsoft, comenzar a tomarse en serio la rivalidad en este campo en particular.
“El modelo bajo costo de DeepSeek ejerce una presión significativa en las empresas de inteligencia artificial estadounidenses”, afirma Rong, una investigadora china especializada tecnología de la Universidad de Pekín.
El detrás de escena de DeepSeekLo que bajó el costo de desarrollo fue la cantidad de chips -los responsables de los análisis de datos en las IA- que usaron. En detalle, DeepSeek logró desarrollar un modelo con tan solo 2000 chips de Nvidia, mientras que otras empresas referentes usan alrededor de 16.000 procesadores. Pero, ¿cómo y por qué lograron reducir tanto el número necesario de chips? La respuesta a esta pregunta se delinea en varias partes pero al final del día se reduce en un concepto clave: la optimización.
Por un lado, tiene un origen más geopolítico. En octubre de 2022 el gobierno de Estados Unidos comenzó a establecer controles de exportación que limitaban el acceso de chinos a procesadores de alto rendimiento como serían los Nvidia H100, un referente de la industria de la inteligencia artificial (y la razón por la que desde 2023 Nvidia está entre las tres empresas más valiosas del planeta). En una entrevista con el medio 36Kr, Wenfeng aseguró que el mayor problema que enfrentaban no era obtener financiamiento, sino los chips más avanzados: la dificultad en el acceso a mejor hardware obligó a la compañía a ser igual de eficiente con menos recursos.
Por otro lado, gracias a las innovaciones técnicas que hicieron al ejecutar el modelo pudieron prescindir de tanto uso computacional, según confirmó Vespoli. Una de ellas es la incorporación del método conocido como “mezcla de expertos”, que optimiza el análisis de datos. Tradicionalmente, los sistemas de inteligencia artificial utilizan una única red neuronal que procesa toda la información y aprende todos los patrones con los que se entrena. Este enfoque suele ser costoso, ya que requiere intercambiar grandes cantidades de datos entre los chips o semiconductores, consumiendo más energía y recursos.
En cambio, según explica The New York Times, el método de “mezcla de expertos” divide el sistema en varias redes neuronales diferentes—llamadas “expertos”—, cada una especializada en áreas particulares de conocimiento. Debido a su especialización, estos expertos individuales necesitan menos capacidad computacional, intercambios entre ellos, energía y memoria, lo que permite aprovechar mejor el hardware disponible y acelerar el procesamiento.
Además, DeepSeek es una plataforma de código abierto. Diferente a OpenAI, que todavía mantiene en secreto lo que sucede puertas adentro de la empresa. Esto permite que cualquier persona, investigador o empresa descargue el código de los modelos, lo edite, investigue, adapte y ajuste, armando una colaboración continúa global para la mejora de la tecnología. Está lejos de ser la única: la plataforma de IA de Meta, por ejemplo, llamada Llama, también es de código abierto y está disponible para toda la comunidad.
“La innovación más importante de DeepSeek es su estrategia de código abierto, que tuvo un impacto significativo en la industria de la IA“, asegura Rong. ”Brinda oportunidades a muchas pequeñas empresas y desarrolladores para participar en este campo, lo que ha impulsado una mayor innovación", agregó.
Las turbulencias ante la llegada de DeepSeekEn enero, DeepSeek lanzó R1, su modelo de IA cuyo distintivo está en tener la capacidad de hacer análisis más profundos y responder pedidos más complejos. Rápidamente, la aplicación de esta tecnología se convirtió en la más descargada de la App Store de iOS en Estados Unidos y logró el reconocimiento de los expertos de todo el mundo.
El primer impacto lo sufrió Nvidia: hasta el debut de DeepSeek, se creía que para crear una inteligencia artificial era excluyente invertir millones de dólares, especialmente en semiconductores. A finales de enero, mientras DeepSeek ganaba usuarios, la empresa sufrió una caída de 600 mil millones de dólares en su cotización bursátil, la mayor pérdida en un solo día en toda la historia de la Bolsa de Estados Unidos.
“Los inversionistas temían una caída en la demanda de sus chips costosos frente a modelos más económicos y eficientes, como los de DeepSeek”, explicó Vespoli. A mediados de 2024, Nvidia se había transformado en la empresa con mayor valuación en el mercado gracias a sus procesadores para IA, que aventajaban por mucho lo que ofrecían otros competidores como AMD o Huawei. Hace dos años, la capitalización de la compañía era de alrededor de 400.000 millones de dólares. El año pasado, sin embargo, comenzó valuándose en 1 billón de dólares (es decir, un millón de millones) y terminó en junio en 3 billones de dólares, superando a Apple.
Luego de la baja, la empresa logró estabilizarse en un mes. La reacción del mercado fue abrupta y típica de la dinámica oferta-demanda. Pero una vez reconciliados los efectos de DeepSeek, fue evidente que esto no implicaba más que cambios positivos.
Por un lado, la demanda de los chips sigue escalando. De hecho, los nuevos modelos “low cost” amplían el mercado posible para Nvidia. “Está expandiendo y acelerando la adopción de la inteligencia artificial”, dijo el CEO y fundador de Nvidia, Jensen Huang. “DeepSeek está demostrándole a todo el mundo que hay oportunidades para que los modelos sean mucho más eficientes de lo que creíamos posible”, continuó. En esta línea, la empresa lanzó recientemente BlackWell, la nueva línea de chips considerada la más avanzada del mercado, manteniéndose así en la vanguardia del sector.
Por otro lado, la compañía está viendo un claro potencial de mercado en los agentes de IA y la robótica que están transformando rotundamente la manera en la que interactuamos con la tecnología. De hecho, la empresa presentó Jetson Thor, un procesador diseñado para robots humanoides. “Nvidia busca convertirse en un proveedor de tecnología para miles de fabricantes de robots, lo que le permitirá ampliar su presencia en mercados emergentes y reducir su dependencia de los servidores de IA”, expresa Vespoli.
Y para el beneficio de todos, la mayor competencia en inteligencia artificial puede suponer el fin de la hegemonía de Nvidia: los monopolios nunca son buenos. “Se incrementará la competencia y se fomentará la innovación. Con más actores compitiendo, se podrían ofrecer productos más diversos y, además, los precios podrían reducirse”, reflexiona Vespoli. “Este ambiente también abriría oportunidades para que nuevos actores, incluidos competidores de China y otras startups, ingresen al mercado, lo que podría equilibrar el panorama competitivo”.
Según Rong, muchos países están desarrollando sus propias tecnologías en IA. “La competencia no solo se produce dentro del mercado, sino que también implica cooperación y rivalidad entre países”, advierte la investigadora. En el caso de China, tener una IA de forma independiente es también importante para asegurar seguridad tecnológica y el desarrollo de capacidades innovadores que puedan mejorar el nivel de la industria general en el país.
A través de su innovación y el ecosistema que tiene, Nvidia sigue estando muy bien posicionada en el mercado, aunque atraviese turbulencias financieras. Marcio Aguiar, director de la división Enterprise de Nvidia para Latinoamérica, cree que desde la empresa están preparados para continuar en la vanguardia. “Queremos mostrar cómo nuestras plataformas permiten a los desarrolladores y líderes empresariales obtener nuevas habilidades y abordar problemas reales utilizando la IA de manera eficiente”, dice.
En el próximo GTC -evento en donde Nvidia presenta sus nuevos productos para el año- la industria seguirá viendo cómo esta empresa hace para mantenerse liderando el sector, ahora dentro de un nuevo contexto de competencia y oportunidades. Puede traer cambios positivos, como bien lo indican los especialistas, pero también puede haber otro giro inesperado en los avances tecnológicos, que dejen a Nvidia sin un norte claro. Lo interesante es ver cómo estos actores buscan la prosperidad en la incertidumbre.