Gemma 3n: IA multimodal para dispositivos cotidianos

En el marco de Google I/O 2025, la compañía presentó Gemma 3n, un modelo de IA multimodal capaz de procesar audio, texto, imágenes y vídeo incluso en dispositivos con menos de 2GB de RAM.
Características clave:
- Arquitectura compartida: Basada en Gemini Nano
- Privacidad mejorada: Funciona sin necesidad de nube
- Disponibilidad: En fase de preview desde el 20 de mayo
Modelos especializados para salud y accesibilidad

MedGemma: IA para aplicaciones médicas
Dentro del programa Health AI Developer Foundations, Google lanzó MedGemma, su modelo abierto más avanzado para análisis de texto e imágenes médicas.
«Los desarrolladores pueden adaptar MedGemma para crear aplicaciones de salud innovadoras»
– Gus Martins, Product Manager de Gemma
SignGemma: Traducción de lengua de señas
Este modelo pionero convierte lengua de señas americana en texto en inglés, siendo el más capaz hasta la fecha según Google.
Adopción y controversias
A pesar de las críticas sobre sus términos de licencia no estándar, los modelos Gemma acumulan decenas de millones de descargas, demostrando su relevancia en la comunidad de desarrolladores.