DeepSeek: El "tapado" chino que reta a GPT-4 y quiere reventar los precios de la IA

DeepSeek: El "tapado" chino que reta a GPT-4 y quiere reventar los precios de la IA

Últimamente, en el mundo de la inteligencia artificial, parece que vivimos en una carrera de caballos con solo tres participantes claros. El debate casi siempre gira en torno a si el último modelo de GPT de OpenAI es mejor que Claude 3 Opus, o si Gemini de Google por fin ha conseguido alcanzarlos. Nos obsesionamos con los benchmarks, las ventanas de contexto y, por supuesto, con las suscripciones mensuales.

Pero mientras miramos fijamente a Silicon Valley, está ocurriendo algo fascinante en Oriente. No es una simple copia; es una alternativa real que está obligando a muchos early adopters y, sobre todo, a directores de tecnología, a girar la cabeza.

Hablo de DeepSeek, un conjunto de modelos de IA desarrollados por DeepSeek AI, una startup con sede en Beijing que, por cierto, tiene vínculos con la Universidad de Tsinghua (el "MIT de China"). Y la razón por la que deberías conocerlo no es solo por su origen, sino porque está atacando el único punto débil que los gigantes de la IA parecían tener bien atado: el precio.

 

¿Qué es exactamente DeepSeek y por qué tanto revuelo?

 

A primera vista, DeepSeek es "otro más" en la larga lista de LLMs (Large Language Models) que han surgido en los últimos dos años. Pero si cavas un poco, te das cuenta de que no.

Su modelo estrella más reciente, DeepSeek-V2, lanzado en 2024, no es un modelo para jugar a hacer poemas (que también puede), sino una bestia optimizada. Es un modelo MoE (Mixture of Experts), una arquitectura similar a la que usa Mistral en su aclamado Mixtral 8x7B. Sin entrar en una clase de ingeniería, esto significa que el modelo es mucho más eficiente: en lugar de activar toda su red neuronal masiva para responder "hola", activa solo las "partes" (expertos) necesarias.

¿El resultado? Un rendimiento que, según sus propios benchmarks (y los de terceros que empiezan a validarlos), se codea y, en algunas tareas, supera a GPT-4 Turbo y Claude 3 Sonnet.

Donde realmente brilla, y esto es clave, es en tareas de codificación y razonamiento matemático. Su modelo especializado, DeepSeek-Coder, se ha convertido en una especie de arma secreta para muchos desarrolladores, superando a menudo a GitHub Copilot (basado en OpenAI) en la generación de código complejo y la depuración.

Pero, seamos sinceros, modelos buenos empiezan a haber muchos. El verdadero "clic" mental ocurre cuando miras la siguiente línea de su página de producto.

 

El elefante en la habitación: El precio es ridículamente bajo

 

Aquí es donde la historia se pone interesante. Estamos acostumbrados a que la IA de alta calidad sea cara. Si has intentado montar un sistema de RAG (Retrieval-Augmented Generation) para tu empresa, o simplemente has querido procesar miles de documentos a través de la API de OpenAI, sabes que la factura de la API a final de mes puede dar un susto.

Mientras muchos siguen apostando por GPT-4 para sus operaciones, el coste es un freno real para la experimentación masiva.

DeepSeek ha decidido que no quiere jugar a ese juego. Sus precios de API no son un "descuento". Son una demolición.

Estamos hablando de cifras que, en algunos casos, son un 98% o 99% más baratas que las de GPT-4 Turbo. No es una errata. Mientras que procesar un millón de tokens (la "moneda" de la IA) en un modelo de OpenAI te puede costar varios dólares, DeepSeek ofrece cifras que rondan los céntimos. Se han visto ofertas de lanzamiento que suenan a ciencia ficción, como "un yuan (unos 13 céntimos de euro) por cada millón de tokens".

De repente, la barrera de entrada económica para la IA se desploma.

 

La IA "buena, bonita y barata"… ¿Dónde está la trampa?

 

Como buenos ingenieros y técnicos, sabemos que cuando algo es demasiado bueno para ser verdad, suele tener una contrapartida. Y DeepSeek no es la excepción. Tiene varias, y son importantes.

1. El factor geopolítico (El gran "PERO") No podemos ignorarlo: DeepSeek es una empresa china. Para una startup en Sevilla que quiere analizar sentimiento en redes sociales, esto puede ser irrelevante. Pero para una empresa mediana o grande que maneje datos de clientes (RGPD), información financiera, o secretos industriales, usar una API cuyo tráfico pasa por servidores en China (o simplemente está bajo jurisdicción china) es un "no" rotundo por motivos de cumplimiento y seguridad. La privacidad y la soberanía del dato son, ahora mismo, el mayor freno para su adopción en Occidente a nivel corporativo serio.

2. El ecosistema y la documentación OpenAI, Google y Meta (con Llama) no solo ofrecen un modelo; ofrecen un ecosistema. Tienen millones de usuarios, foros desbordados de preguntas y respuestas, tutoriales en YouTube, SDKs pulidos en todos los lenguajes y una integración nativa en plataformas como Azure o AWS.

DeepSeek, aunque tiene una documentación técnica sorprendentemente buena, sigue siendo el "nuevo". Encontrar ayuda en Stack Overflow es más difícil. Las integraciones son más manuales. Si te quedas atascado, estás más solo.

3. ¿Es realmente tan bueno como dicen? Aunque los benchmarks en codificación y matemáticas son estelares, algunos usuarios reportan que en tareas más "humanas" —como la escritura creativa, el matiz, la ironía o el razonamiento de "sentido común"— todavía puede sentirse un paso por detrás de la finura de un GPT-4o o un Claude 3 Opus. No es malo en absoluto, pero se nota su optimización hacia lo técnico.

 

El "laboratorio" perfecto: El ahorro para experimentar

 

Y entonces, ¿para qué sirve DeepSeek si tiene esos inconvenientes?

Sirve para lo más importante que necesita este sector ahora mismo: experimentar sin arruinarse.

Imagina que eres un departamento de IT (como nosotros en ForgeNEX) y quieres probar una idea. Por ejemplo, crear un chatbot interno que lea las 20.000 páginas de documentación técnica de todos vuestros proyectos para que los nuevos empleados puedan hacerle preguntas.

  • El plan con GPT-4: Haces una pequeña prueba de concepto (PoC), funciona, pero cuando calculas el coste de indexar (embeber) todos esos documentos y el coste de las consultas diarias de 50 empleados, el proyecto se va a miles de euros al mes. El director financiero te mira mal y la idea se queda en un cajón.
  • El plan con DeepSeek: Haces la PoC. Calculas el coste. Y te das cuenta de que el coste total de la API es tan bajo que es casi un error de redondeo en el presupuesto del departamento. Te da igual que 50 o 100 empleados lo usen. El coste es asumible.

DeepSeek se convierte así en el "laboratorio" perfecto. Es la herramienta ideal para prototipar, para probar, para fallar y para iterar. Te permite construir esa herramienta interna de análisis de logs, ese sistema de RAG para tus documentos legales, o ese script que te resume automáticamente los commits de GitHub, sin tener que pedir permiso a contabilidad cada vez que ejecutas el programa.

 

¿Un nuevo estándar o un gigante regional?

 

DeepSeek es la prueba de que la excelencia en IA no es un monopolio de Silicon Valley y, sobre todo, que el precio actual de la IA no está escrito en piedra.

Es posible que, por el factor geopolítico, DeepSeek nunca llegue a ser el motor de la IA en las empresas de Europa o Estados Unidos. Pero su mera existencia ya es una gran noticia para todos. Está presionando a OpenAI, Google y Anthropic, obligándoles a optimizar sus propios modelos y a bajar sus precios para no perder a la creciente masa de desarrolladores y startups que simplemente buscan la mejor relación potencia/precio.

Quizás no uses DeepSeek para tu producto final de cara al cliente, pero sin duda es la herramienta que quieres tener en tu caja de herramientas para trastear. Aquí en ForgeNEX, no le quitamos el ojo de encima. En la era de la IA, la capacidad de experimentar rápido y barato lo es todo.

Compartir: