Google Gemini 2.5 Flash: Retroceso en estándares de seguridad de IA según reporte interno

Resultados preocupantes en pruebas automatizadas

El último modelo de inteligencia artificial de Google, Gemini 2.5 Flash, muestra un desempeño inferior en pruebas de seguridad comparado con su versión anterior, según revela un reporte técnico interno publicado esta semana.

Modelos Gemini de Google

Datos clave de las evaluaciones

  • Text-to-text safety: Retroceso de 4.1%
  • Image-to-text safety: Caída de 9.6%

Estas métricas miden la capacidad del modelo para cumplir con las políticas de contenido seguro de Google ante solicitudes de texto e imágenes respectivamente.

Implicaciones para la industria de IA

El hallazgo se produce mientras las principales compañías de IA buscan hacer sus modelos más permisivos. Meta y OpenAI han anunciado recientemente ajustes para que sus sistemas eviten tomar posturas editoriales en temas controvertidos.

«Existe tensión entre seguir instrucciones en temas sensibles y cumplir políticas de seguridad», admite el reporte técnico de Google

Flujo de trabajo de seguridad en Vertex AI

Preocupaciones sobre transparencia

Thomas Woodside, cofundador del Secure AI Project, señala: «Sin detalles específicos sobre las violaciones, es difícil evaluar independientemente los riesgos reales».

Contexto histórico

  • Google tardó semanas en publicar el reporte completo de Gemini 2.5 Pro
  • Versiones iniciales del documento omitieron detalles clave de seguridad

Comparte este artículo

Otras notas de tu interés:

Noticia Local

Más de 1,000 tanques de gasolina corroídos amenazan el agua subterránea en Miami-Dade

Economia

Centros de datos orbitales: ejecutivos tecnológicos cuestionan la viabilidad de la visión de Musk

Politica Internacional

Administración Trump limita el lanzamiento del último modelo de OpenAI

Politica Internacional

Corea del Norte reafirma su poderío militar con nuevas pruebas de armas

Economia

Última oportunidad: Ahorra hasta $190 en el Founder Summit 2026 – Precio límite esta noche

Economia

Control gubernamental en el lanzamiento de modelos de IA en Estados Unidos: ¿hacia una regulación sin precedentes?

Negocios

OpenAI, SpaceX y Apple se suman a la tendencia de chips personalizados para reducir la dependencia de Nvidia

Politica Internacional

Gobierno de EE. UU. frena el lanzamiento de GPT-5.6 de OpenAI

Economia

OpenAI nombra a Prabhjeet Singh como primer director general en India

Politica Internacional

Carney Renovación de Casa Famosa en Canadá