Sign In

OpenAI implementa salvaguardias contra riesgos biológicos en sus modelos de IA

Nuevo sistema de monitoreo para prevenir amenazas biológicas

OpenAI ha desplegado un «sistema de razonamiento centrado en seguridad» para sus modelos de IA o3 y o4-mini, diseñado específicamente para bloquear consultas relacionadas con la creación de amenazas químicas y biológicas. Este avance responde al aumento de capacidades que representan estos modelos respecto a sus predecesores.

Interfaz de OpenAI mostrando mensaje de seguridad

Detalles técnicos clave

  • Efectividad: En pruebas internas, los modelos rechazaron responder a 98.7% de solicitudes riesgosas
  • Entrenamiento: Equipos especializados (red teamers) dedicaron 1,000 horas identificando conversaciones peligrosas
  • Innovación: Monitor personalizado que aplica políticas de contenido en tiempo real

Arquitectura de seguridad

Diagrama de flujo de seguridad de OpenAI

El sistema integra:

  • Filtrado de contenido en múltiples capas
  • Monitoreo continuo de patrones de abuso
  • Integración con el Preparedness Framework para evaluación de riesgos

Retos pendientes

A pesar de los avances:

  • El sistema no previene intentos repetidos con nuevas consultas
  • Críticas de investigadores sobre priorización de seguridad vs velocidad de lanzamientos
  • Ausencia de reporte de seguridad para el reciente modelo GPT-4.1

Comparte este artículo

Otras notas de tu interés:

Economia

Microsoft excluye a ingenieros en China de trabajos para el Departamento de Defensa

Espectáculos y Entretenimiento

Renuncia CEO de Astronomer tras escándalo en concierto de Coldplay

Negocios

Windsurf Revela Detalles Tras Agónica Adquisición por Cognition

Negocios

Libros Imprescindibles sobre Ciberseguridad y Vigilancia Digital

Economia

Guía Definitiva para un Pitch Perfecto a Fondos de Inversión por Tiffany Luck de NEA

Negocios

Alerta Máxima: Así Exponen los Asistentes de IA tu Vida Privada al Acceder a Datos Personales

Negocios

Startup de Y Combinator abandona revolucionaria tecnología de agentes IA para Windows

Economia

Greptile Negocia Ronda Serie A de $30 Millones en Mercado de IA para Código

Economia

Lesiones en SpaceX Starbase Superan en 6x el Promedio de la Industria Aeroespacial

Sociedad y Cultura

Empresa de Vigilancia Explota Vulnerabilidad SS7 para Rastrear Ubicaciones