OpenAI refuerza la transparencia en IA con evaluaciones de seguridad públicas

OpenAI publica métricas de seguridad de sus modelos de IA

En un esfuerzo por aumentar la transparencia, OpenAI lanzó este miércoles 14 de mayo de 2025 el Safety Evaluations Hub, una plataforma que muestra el desempeño de sus modelos en pruebas de contenido dañino, jailbreaks y alucinaciones.

Equipo analizando dispositivo de IA en entorno profesional

¿Qué incluye la nueva plataforma?

  • Resultados actualizados periódicamente
  • Métricas comparativas entre versiones de modelos
  • Evaluaciones de capacidad y seguridad escalables

La compañía reconoció críticas recientes sobre plazos acelerados en pruebas de seguridad y la falta de informes técnicos completos. En noviembre de 2023, el CEO Sam Altman enfrentó acusaciones de «ocultar detalles clave» durante revisiones de seguridad previas a su breve destitución.

Incidentes recientes y soluciones

Dispositivo móvil mostrando logo de OpenAI con temporizador

Tras el polémico lanzamiento de GPT-4o, que generó respuestas «excesivamente complacientes» ante ideas peligrosas, OpenAI implementará:

  • Fase alpha optativa para pruebas previas
  • Mecanismos de retroalimentación controlada
  • Actualizaciones graduales del hub con cada mejora del modelo

Compromiso de evolución

«Buscamos que la comunidad contribuya al desarrollo de estándares de evaluación más robustos»

Este movimiento coincide con esfuerzos regulatorios globales para establecer parámetros de seguridad en IA, usando diseño modular en la arquitectura de pruebas y tipografía digital especializada para presentar datos complejos de manera accesible.

Comparte este artículo

Otras notas de tu interés:

Shopping y Compras

Apple AirPods Max 2: Lanzamiento sorpresa con audio de alta fidelidad y nueva traducción en vivo

Negocios

Picsart lanza un mercado de agentes de IA para revolucionar la creación de contenido

Economia

Impacto del Mercado de Vehículos Eléctricos entre China, Canadá y Estados Unidos

Economia

Nvidia Lanza NemoClaw: La Plataforma de Seguridad Empresarial para Estrategias OpenClaw

Economia

Nvidia Proyecta Ventas por $1 Billón para sus Chips de IA Blackwell y Vera Rubin

Negocios

Memories AI y Nvidia Unen Fuerzas para Crear Memoria Visual en Wearables y Robots

Negocios

Nvidia Desvela DLSS 5: La Revolución de la IA en Gráficos y Más Allá

Politica

Demanda acusa a xAI de Elon Musk por generar imágenes de explotación infantil con IA

Economia

Fuse, la Startup de IA que Revoluciona la Originación de Préstamos, Cierra una Ronda de $25 Millones

Economia

Florida en Alerta: $7.7 Mil Millones Perdidos por Estafas en 2024