Google Gemini 2.5 Flash: Retroceso en estándares de seguridad de IA según reporte interno

Resultados preocupantes en pruebas automatizadas

El último modelo de inteligencia artificial de Google, Gemini 2.5 Flash, muestra un desempeño inferior en pruebas de seguridad comparado con su versión anterior, según revela un reporte técnico interno publicado esta semana.

Modelos Gemini de Google

Datos clave de las evaluaciones

  • Text-to-text safety: Retroceso de 4.1%
  • Image-to-text safety: Caída de 9.6%

Estas métricas miden la capacidad del modelo para cumplir con las políticas de contenido seguro de Google ante solicitudes de texto e imágenes respectivamente.

Implicaciones para la industria de IA

El hallazgo se produce mientras las principales compañías de IA buscan hacer sus modelos más permisivos. Meta y OpenAI han anunciado recientemente ajustes para que sus sistemas eviten tomar posturas editoriales en temas controvertidos.

«Existe tensión entre seguir instrucciones en temas sensibles y cumplir políticas de seguridad», admite el reporte técnico de Google

Flujo de trabajo de seguridad en Vertex AI

Preocupaciones sobre transparencia

Thomas Woodside, cofundador del Secure AI Project, señala: «Sin detalles específicos sobre las violaciones, es difícil evaluar independientemente los riesgos reales».

Contexto histórico

  • Google tardó semanas en publicar el reporte completo de Gemini 2.5 Pro
  • Versiones iniciales del documento omitieron detalles clave de seguridad

Comparte este artículo

Otras notas de tu interés:

Sociedad y Cultura

Campbell Brown y Forum AI: La lucha por la verdad en la era de la inteligencia artificial

Economia

Clio Alcanza $500M en ARR: La IA Impulsa el Crecimiento del Sector Legal Tech

Economia

Exdirector de hacking de L3Harris pagará $10 millones por vender herramientas a un broker ruso

Economia

Amazon Lanza ‘Amazon Now’: Entregas en 30 Minutos en Estados Unidos

Tecnologia

Google lanza ‘Create My Widget’: personaliza tu Android con inteligencia artificial

Tecnologia

Google I/O: Nuevas funciones de IA Gemini transforman Android con widgets, navegación y asistencia inteligente

Negocios

Anthropic lanza nuevas herramientas de IA para el sector legal en medio de una intensa competencia

Negocios

Google lanza Rambler: la función de dictado con IA para Gboard que desafía a las startups

Tecnologia

Android Show de Google: Nuevas funciones, Googlebook y Gemini llegan con grandes actualizaciones

Economia

Google y SpaceX en conversaciones para lanzar centros de datos orbitales