Paco Bree: «DeepSeek en 5 minutos: lo que debes saber sobre la nueva IA disruptiva»

Artículo publicado en El Español (05/02/2025)

«La innovación disruptiva rara vez llega como un rayo caído del cielo. Suele ser predecible si entendemos sus patrones». Esta frase, inspirada en el reciente artículo de Harvard Business Review (HBR) titulado Why DeepSeek Shouldn’t Have Been a Surprise, escrito por Prithwiraj (Raj) Choudhury, Natarajan Balasubramanian y Mingtao Xu, resume la irrupción de DeepSeek en el mundo de la inteligencia artificial. Su llegada ha sacudido el mercado de los modelos generativos, sorprendiendo a muchos, pero respondiendo a una lógica bien conocida en el mundo de la innovación.

DeepSeek es una startup china que ha irrumpido con fuerza en el sector de la inteligencia artificial con modelos generativos que desafían a los gigantes estadounidenses. Su modelo, lanzado el 20 de enero de 2025, se presenta como una alternativa a las tecnologías de OpenAI, Meta y otros actores establecidos. Sin embargo, lo que realmente distingue a DeepSeek es su enfoque radicalmente eficiente en cuanto a costos y hardware.

Mientras que las grandes tecnológicas estadounidenses han apostado por infraestructuras computacionales masivas, con miles de chips de última generación de NVIDIA y presupuestos multimillonarios, DeepSeek ha optado por una estrategia más liviana. Utilizando una arquitectura optimizada basada en Multi-Head Latent Attention (MLA) y Mixture of Experts (MOE), sus modelos requieren menos recursos computacionales, pero logran resultados competitivos. Además, DeepSeek ha abrazado el código abierto, publicando sus modelos bajo licencias permisivas como MIT, fomentando una adopción masiva y acelerando su evolución en el ecosistema tecnológico global.

El resultado es claro: su modelo estrella, DeepSeek-R1, se entrena a un costo de apenas 5,6 millones de dólares, una fracción de los 40 a 200 millones que las empresas estadounidenses gastan en modelos similares. Sin embargo, a pesar de esta eficiencia en costos, DeepSeek todavía enfrenta retos en cuanto a la calidad de sus respuestas y su capacidad de razonamiento en comparación con GPT-4 de OpenAI, Claude de Anthropic y Gemini de Google.

Aunque su arquitectura permite procesar grandes volúmenes de datos con menos recursos, la falta de acceso a las más avanzadas GPUs y su dependencia de hardware menos potente podría afectar su rendimiento en tareas altamente complejas.

Desde su llegada, DeepSeek ha sido vinculada con la palabra «disrupción», un término clave en el mundo de los negocios y la tecnología. La teoría de la innovación disruptiva, acuñada por Clayton Christensen en los años 90, explica cómo nuevas tecnologías inicialmente más accesibles y de menor rendimiento logran, con el tiempo, desplazar a las soluciones dominantes.

Este patrón ya ha sido observado en otros sectores: las miniacerías en la industria del acero, la aparición de Netflix frente a Blockbuster, y la irrupción de los smartphones frente a los teléfonos móviles tradicionales.

El caso de DeepSeek sigue esta lógica. Al ofrecer una alternativa más asequible y eficiente, ha puesto en jaque a las compañías que hasta ahora lideraban la IA generativa. No es solo una cuestión de costo, sino de accesibilidad: modelos abiertos, entrenados con menor infraestructura, que pueden ser adaptados a casos de uso específicos en diversas industrias. Hoy, la disrupción en IA ya no es una cuestión teórica.

Modelos como DeepSeek-R1 y otros que están surgiendo en China están reconfigurando el mercado. En paralelo, se espera que pequeños modelos de lenguaje (Small Language Models o SLMs) también jueguen un papel clave en la próxima ola de innovación. La gran pregunta es: ¿Cómo deben responder las empresas y los líderes tecnológicos ante este cambio?

Para los líderes empresariales y los responsables de tecnología, DeepSeek representa una oportunidad y un desafío. No depender de un único proveedor de IA y combinar soluciones estadounidenses y chinas puede mitigar riesgos y optimizar costos. Invertir en capacidades internas permite aprovechar la flexibilidad de los modelos de código abierto como DeepSeek.

En términos de sostenibilidad y eficiencia, modelos como DeepSeek-R1 demuestran que es posible reducir costos sin comprometer la calidad, lo que obliga a las empresas a evaluar el impacto ambiental y económico de sus elecciones tecnológicas. Comprender los marcos normativos y los riesgos de trabajar con modelos de diferentes países es crucial, especialmente en cuestiones de privacidad y seguridad de los datos.

Finalmente, la inteligencia artificial no es solo una cuestión técnica, sino también una decisión estratégica y humanista que debe alinearse con valores organizacionales, fomentando la inclusión, la ética y el impacto positivo en la sociedad.

DeepSeek es solo el comienzo de una nueva fase en la inteligencia artificial. La historia de la innovación nos enseña que aquellos que ignoran las disrupciones suelen quedar obsoletos. En cambio, quienes las entienden y actúan con rapidez pueden posicionarse como líderes en la próxima generación tecnológica.

Deja una respuesta Cancelar la respuesta