DeepSeek lanza modelo R1 compacto que supera a gigantes como Google en pruebas matemáticas

Revolución en IA: El modelo distilado de DeepSeek desafía a los líderes tecnológicos

El laboratorio chino DeepSeek ha lanzado DeepSeek-R1-0528-Qwen3-8B, una versión compacta de su modelo de razonamiento R1 que supera a Google Gemini 2.5 Flash en AIME 2025, el conjunto de problemas matemáticos avanzados.

Representación de inteligencia artificial futurista

Rendimiento excepcional con eficiencia

  • Supera a Google: Mejor desempeño que Gemini 2.5 Flash en pruebas matemáticas AIME 2025
  • Iguala a Microsoft: Rendimiento cercano al modelo Phi 4 de Microsoft en evaluación HMMT
  • Base tecnológica: Desarrollado sobre Qwen3-8B de Alibaba (lanzado en mayo)

Ventajas computacionales clave

Estos modelos «distilados» requieren significativamente menos recursos:

  • Requisitos: Funciona con GPU de 40GB-80GB RAM (ej: Nvidia H100)
  • Comparación: El modelo R1 completo necesita doce GPU de 80GB
  • Entrenamiento: Fine-tuning con texto generado por el R1 completo

Acceso y licenciamiento abierto

Disponible bajo licencia MIT que permite uso comercial sin restricciones. Plataformas como LM Studio ya ofrecen el modelo mediante API.

«Para investigación académica en modelos de razonamiento y desarrollo industrial enfocado en modelos de pequeña escala» – DeepSeek en Hugging Face

Dispositivo con logo de DeepSeek

Potencial transformador

Este avance democratiza el acceso a IA avanzada, permitiendo implementaciones más económicas en entornos académicos y empresariales sin sacrificar capacidades de razonamiento matemático.

Comparte este artículo

Otras notas de tu interés:

Negocios

Cierre del restaurante Blue Collar en Miami: historia y despedida de un ícono de la comida casera

Sociedad y Cultura

arXiv endurece políticas: prohibición de un año por uso descuidado de IA en artículos científicos

Politica

Sean Cairncross y el liderazgo en el control de la IA avanzada: nuevas preocupaciones cibernéticas

Economia

Trump impulsa vínculo entre su ley SAVE y proyectos bipartidistas en EE. UU.

Economia

El auge de los centros de datos AI en South Florida: crecimiento y polémica vecinal

Negocios

Greg Brockman asume el control de la estrategia de producto en OpenAI

Economia

Cancelación de la gira de Sean Duffy: patrocinadores se niegan en EE. UU.

Politica Internacional

Estados Unidos ordena a viajeros en Air Force One desechar regalos y teléfonos tras viaje a China

Economia

Crecimiento de centros de datos para IA en South Florida: ¿Progreso tecnológico o peligro ambiental y comunitario?

Economia

Colapso de negociaciones en LIRR: Huelga amenaza el transporte en Nueva York