DeepSeek Acusado de Usar Datos de Google Gemini para Entrenar su IA

Laboratorio Chino Bajo Sospecha por Entrenamiento con Modelo Rival

La semana pasada, el laboratorio chino DeepSeek lanzó una versión actualizada de su modelo de IA R1, destacando en pruebas de matemáticas y programación. Sin revelar la fuente de sus datos de entrenamiento, investigadores sospechan que utilizó información de Google Gemini.

Dispositivo con logo DeepSeek en entorno tecnológico
Interfaz de DeepSeek con iluminación azul característica

Evidencias de Uso Ilegítimo

Sam Paeach, desarrollador especializado en evaluar IA, publicó en X que el modelo R1-0528 de DeepSeek replica patrones lingüísticos de Gemini 2.5 Pro. Otro creador anónimo de la herramienta SpeechMap corroboró que los «rastros cognitivos» del modelo son idénticos a los de Gemini.

Antecedentes con OpenAI

En diciembre de 2024, el modelo V3 de DeepSeek se identificaba recurrentemente como ChatGPT. Según Bloomberg, Microsoft detectó filtración masiva de datos desde cuentas de OpenAI vinculadas a DeepSeek, usando «destilación» (técnica prohibida por OpenAI para competidores).

Logos de DeepSeek y OpenAI
Histórica rivalidad entre DeepSeek y OpenAI

Contaminación de Datos Global

El problema se agrava por la saturación de «contenido basura generado por IA» en la web, usado involuntariamente en entrenamiento. Nathan Lambert del instituto AI2 justifica las acciones de DeepSeek:

«Con escasez de GPUs y exceso de capital, usar datos de Gemini es computacionalmente eficiente»

Contramedidas de la Industria

  • OpenAI: Implementó verificación de identidad excluyendo a China
  • Google: Comenzó a resumir rastros de Gemini en AI Studio
  • Anthropic: Siguió el mismo camino para proteger ventajas competitivas
Robots representando modelos de IA en competencia
Representación artística de la batalla entre modelos de IA

Comparte este artículo

Otras notas de tu interés:

Tecnologia

Google AI y los Errores Ortográficos: El Talón de Aquiles de los Modelos de Lenguaje

Negocios

George Pino: Defensa y Fiscalía Enfrentan en Corte por Accidente Náutico Mortal

Economia

Snowflake y AWS sellan un acuerdo de $6 mil millones centrado en chips CPU para IA

Economia

Remote alcanza $300 millones en ingresos recurrentes y duplica su productividad con IA

Economia

ClickHouse Duplica Ingresos y Acelera Plan de Salida a Bolsa

Economia

Meta lanza suscripciones globales para Instagram, Facebook y WhatsApp, y prueba planes de IA y profesionales

Economia

Cognition recauda más de $1,000 millones y alcanza una valoración de $25,000 millones

Negocios

¡Últimos días para ahorrar hasta $410 en boletos para Disrupt 2026!

Bienestar y Salud Mental

SOND Lanza Dreambuds: Auriculares Inteligentes que Redefinen el Sueño con IA y Sensores Fisiológicos

Espectáculos y Entretenimiento

ElevenLabs presenta Music v2: IA que cambia de género musical en plena canción