OpenAI refuerza la transparencia en IA con evaluaciones de seguridad públicas

OpenAI publica métricas de seguridad de sus modelos de IA

En un esfuerzo por aumentar la transparencia, OpenAI lanzó este miércoles 14 de mayo de 2025 el Safety Evaluations Hub, una plataforma que muestra el desempeño de sus modelos en pruebas de contenido dañino, jailbreaks y alucinaciones.

Equipo analizando dispositivo de IA en entorno profesional

¿Qué incluye la nueva plataforma?

  • Resultados actualizados periódicamente
  • Métricas comparativas entre versiones de modelos
  • Evaluaciones de capacidad y seguridad escalables

La compañía reconoció críticas recientes sobre plazos acelerados en pruebas de seguridad y la falta de informes técnicos completos. En noviembre de 2023, el CEO Sam Altman enfrentó acusaciones de «ocultar detalles clave» durante revisiones de seguridad previas a su breve destitución.

Incidentes recientes y soluciones

Dispositivo móvil mostrando logo de OpenAI con temporizador

Tras el polémico lanzamiento de GPT-4o, que generó respuestas «excesivamente complacientes» ante ideas peligrosas, OpenAI implementará:

  • Fase alpha optativa para pruebas previas
  • Mecanismos de retroalimentación controlada
  • Actualizaciones graduales del hub con cada mejora del modelo

Compromiso de evolución

«Buscamos que la comunidad contribuya al desarrollo de estándares de evaluación más robustos»

Este movimiento coincide con esfuerzos regulatorios globales para establecer parámetros de seguridad en IA, usando diseño modular en la arquitectura de pruebas y tipografía digital especializada para presentar datos complejos de manera accesible.

Comparte este artículo

Otras notas de tu interés:

Economia

La Hipótesis Nula: Clave en el Análisis de Inversiones

Economia

Trump AI Flip Flop: Regalo a China o Propuesta Geopolítica?

Economia

Fisher Island: La batalla legal por el depósito de combustible que divide a la comunidad

Economia

FTC Aprueba la Adquisición de Mesh Optical Technologies por Elon Musk y SpaceX

Negocios

Vinton Cerf, el ‘padre de internet’, se retira de Google

Economia

Wayve ofrece liquidez a empleados con oferta de recompra de $85 millones a valoración de $8.5 mil millones

Economia

Trump levanta restricciones a los modelos de IA Mythos y Fable de Anthropic

Tecnologia

Busy Bar de Flipper Devices: El display de productividad personalizable que llega para transformar tu enfoque

Tecnologia

OpenClaw llega a iOS y Android: el agente de IA de código abierto ahora es una app móvil

Economia

EquiLibre Technologies: La IA de DeepMind que venció al póker ahora conquista Wall Street