Google Gemini 2.5 Flash: Retroceso en estándares de seguridad de IA según reporte interno

Resultados preocupantes en pruebas automatizadas

El último modelo de inteligencia artificial de Google, Gemini 2.5 Flash, muestra un desempeño inferior en pruebas de seguridad comparado con su versión anterior, según revela un reporte técnico interno publicado esta semana.

Modelos Gemini de Google

Datos clave de las evaluaciones

  • Text-to-text safety: Retroceso de 4.1%
  • Image-to-text safety: Caída de 9.6%

Estas métricas miden la capacidad del modelo para cumplir con las políticas de contenido seguro de Google ante solicitudes de texto e imágenes respectivamente.

Implicaciones para la industria de IA

El hallazgo se produce mientras las principales compañías de IA buscan hacer sus modelos más permisivos. Meta y OpenAI han anunciado recientemente ajustes para que sus sistemas eviten tomar posturas editoriales en temas controvertidos.

«Existe tensión entre seguir instrucciones en temas sensibles y cumplir políticas de seguridad», admite el reporte técnico de Google

Flujo de trabajo de seguridad en Vertex AI

Preocupaciones sobre transparencia

Thomas Woodside, cofundador del Secure AI Project, señala: «Sin detalles específicos sobre las violaciones, es difícil evaluar independientemente los riesgos reales».

Contexto histórico

  • Google tardó semanas en publicar el reporte completo de Gemini 2.5 Pro
  • Versiones iniciales del documento omitieron detalles clave de seguridad

Comparte este artículo

Otras notas de tu interés:

Economia

Waymo Alcanza 500,000 Viajes Semanales y Acelera su Expansión de Robotaxis en EE.UU.

Espectáculos y Entretenimiento

OpenAI cierra Sora: un golpe a la IA de video y un giro estratégico hacia el negocio empresarial

Politica Internacional

Corea del Norte prueba motor de misil con alcance hasta Estados Unidos

Tecnologia

Filtración de Herramientas de Hacking Coruna y DarkSword Amenaza a Millones de iPhones

Economia

Inteligencia Artificial Domina el Demo Day de Y Combinator W26 2024

Bienestar y Salud Mental

Estudio de Stanford revela los peligros ocultos de buscar consejos personales en chatbots de IA

Economia

Los Dos Últimos Cofundadores de xAI Abandonan la Empresa de IA de Elon Musk

Economia

Claude de Anthropic atrae a consumidores: Crecimiento récord en suscripciones pagadas

Economia

Physical Intelligence Negocia $1.000 Millones para Revolucionar la Robótica con IA

Negocios

Whoop: El Wearable que Evoluciona de Herramienta Deportiva a Guardián de la Salud