Sostenibilidad y Medio Ambiente, Tecnologia

Portada » Artículos » Google Gemini 2.5 Flash: Retroceso en estándares de seguridad de IA según reporte interno

Google Gemini 2.5 Flash: Retroceso en estándares de seguridad de IA según reporte interno

mayo 2, 2025

Resultados preocupantes en pruebas automatizadas

El último modelo de inteligencia artificial de Google, Gemini 2.5 Flash, muestra un desempeño inferior en pruebas de seguridad comparado con su versión anterior, según revela un reporte técnico interno publicado esta semana.

Datos clave de las evaluaciones

Text-to-text safety: Retroceso de 4.1%
Image-to-text safety: Caída de 9.6%

Estas métricas miden la capacidad del modelo para cumplir con las políticas de contenido seguro de Google ante solicitudes de texto e imágenes respectivamente.

Implicaciones para la industria de IA

El hallazgo se produce mientras las principales compañías de IA buscan hacer sus modelos más permisivos. Meta y OpenAI han anunciado recientemente ajustes para que sus sistemas eviten tomar posturas editoriales en temas controvertidos.

«Existe tensión entre seguir instrucciones en temas sensibles y cumplir políticas de seguridad», admite el reporte técnico de Google

Preocupaciones sobre transparencia

Thomas Woodside, cofundador del Secure AI Project, señala: «Sin detalles específicos sobre las violaciones, es difícil evaluar independientemente los riesgos reales».

Contexto histórico

Google tardó semanas en publicar el reporte completo de Gemini 2.5 Pro
Versiones iniciales del documento omitieron detalles clave de seguridad

Tags Benchmarks, ética tecnológica, Google Gemini, IA, Modelos de Lenguaje, seguridad digital

Comparte este artículo

Otras notas de tu interés:

Economia

Waymo Alcanza 500,000 Viajes Semanales y Acelera su Expansión de Robotaxis en EE.UU.

marzo 29, 2026

Espectáculos y Entretenimiento

OpenAI cierra Sora: un golpe a la IA de video y un giro estratégico hacia el negocio empresarial

marzo 29, 2026

Politica Internacional

Corea del Norte prueba motor de misil con alcance hasta Estados Unidos

marzo 29, 2026

Tecnologia

Filtración de Herramientas de Hacking Coruna y DarkSword Amenaza a Millones de iPhones

marzo 28, 2026

Economia

Inteligencia Artificial Domina el Demo Day de Y Combinator W26 2024

marzo 28, 2026

Bienestar y Salud Mental

Estudio de Stanford revela los peligros ocultos de buscar consejos personales en chatbots de IA

marzo 28, 2026

Economia

Los Dos Últimos Cofundadores de xAI Abandonan la Empresa de IA de Elon Musk

marzo 28, 2026

Economia

Claude de Anthropic atrae a consumidores: Crecimiento récord en suscripciones pagadas

marzo 28, 2026

Economia

Physical Intelligence Negocia $1.000 Millones para Revolucionar la Robótica con IA

marzo 28, 2026

Negocios

Whoop: El Wearable que Evoluciona de Herramienta Deportiva a Guardián de la Salud

marzo 28, 2026