OpenAI refuerza la transparencia en IA con evaluaciones de seguridad públicas

OpenAI publica métricas de seguridad de sus modelos de IA

En un esfuerzo por aumentar la transparencia, OpenAI lanzó este miércoles 14 de mayo de 2025 el Safety Evaluations Hub, una plataforma que muestra el desempeño de sus modelos en pruebas de contenido dañino, jailbreaks y alucinaciones.

Equipo analizando dispositivo de IA en entorno profesional

¿Qué incluye la nueva plataforma?

  • Resultados actualizados periódicamente
  • Métricas comparativas entre versiones de modelos
  • Evaluaciones de capacidad y seguridad escalables

La compañía reconoció críticas recientes sobre plazos acelerados en pruebas de seguridad y la falta de informes técnicos completos. En noviembre de 2023, el CEO Sam Altman enfrentó acusaciones de «ocultar detalles clave» durante revisiones de seguridad previas a su breve destitución.

Incidentes recientes y soluciones

Dispositivo móvil mostrando logo de OpenAI con temporizador

Tras el polémico lanzamiento de GPT-4o, que generó respuestas «excesivamente complacientes» ante ideas peligrosas, OpenAI implementará:

  • Fase alpha optativa para pruebas previas
  • Mecanismos de retroalimentación controlada
  • Actualizaciones graduales del hub con cada mejora del modelo

Compromiso de evolución

«Buscamos que la comunidad contribuya al desarrollo de estándares de evaluación más robustos»

Este movimiento coincide con esfuerzos regulatorios globales para establecer parámetros de seguridad en IA, usando diseño modular en la arquitectura de pruebas y tipografía digital especializada para presentar datos complejos de manera accesible.

Comparte este artículo

Otras notas de tu interés:

Economia

Ken Griffin Duplica su Apuesta por Miami: Expansión Masiva de Oficinas en la Torre de Brickell

Economia

Rascacielos en Miami: ¿Están hundiéndose? Expertos piden revisar regulaciones por asentamientos del suelo

Negocios

La reunión que precipitó la salida de Elon Musk de OpenAI: Greg Brockman revela los detalles

Economia

Despidos Masivos en Spirit Airlines: Apoyo y Recursos para Empleados en South Florida

Economia

La china DeepSeek busca recaudar fondos con una valoración que se dispara a 45.000 millones de dólares

Negocios

Administración Mamdani examina contratos de proveedores del NYPD e ICE en EE.UU.

Economia

SpaceX Invierte $55,000 Millones en la Fábrica de Chips Terafab en Texas

Economia

Apple paga $250 millones por demanda sobre funciones retrasadas de Siri

Economia

Match Group Frena Contrataciones para Pagar su Apuesta por la IA: ¿El Fin de las Citas Tradicionales?

Negocios

Genesis AI presenta su modelo GENE-26.5 con manos robóticas humanoides