OpenAI Implementa Sistema de Enrutamiento de Seguridad y Controles Parentales en ChatGPT

OpenAI Refuerza la Seguridad en ChatGPT con Nuevas Herramientas

OpenAI comenzó a probar un nuevo sistema de enrutamiento de seguridad en ChatGPT durante el fin de semana y, este lunes, introdujo controles parentales en el chatbot, generando reacciones encontradas entre los usuarios.

Interfaz de ChatGPT mostrando opciones de seguridad

Motivación Trágica Detrás de las Medidas

Estas características de seguridad responden a numerosos incidentes en los que ciertos modelos de ChatGPT validaron pensamientos delirantes de los usuarios en lugar de redirigir conversaciones dañinas. OpenAI enfrenta una demanda por muerte injusta vinculada a un caso donde un adolescente murió por suicidio después de meses de interacciones con el chatbot.

¿Cómo Funciona el Sistema de Enrutamiento?

El sistema está diseñado para detectar conversaciones emocionalmente sensibles y cambiar automáticamente, en medio del chat, a GPT-5-thinking, considerado el modelo mejor equipado para trabajos de seguridad de alto riesgo. Estos modelos fueron entrenados con una nueva característica de seguridad llamada «completaciones seguras», que les permite responder preguntas sensibles de manera segura, en lugar de simplemente negarse a participar.

Contraste con Modelos Anteriores

Esto representa un cambio respecto a modelos anteriores, como GPT-4o, diseñados para ser complacientes y responder rápidamente, lo que ha generado críticas por su naturaleza excesivamente condescendiente. Cuando OpenAI implementó GPT-5 como predeterminado en agosto, muchos usuarios se opusieron y exigieron acceso a GPT-4o.

Reacciones Mixtas y Período de Iteración

Aunque expertos y usuarios han acogido con beneplácito las características de seguridad, otros han criticado lo que perciben como una implementación demasiado cautelosa, acusando a OpenAI de tratar a los adultos como niños y degradar la calidad del servicio. La empresa ha reconocido que perfeccionar el sistema tomará tiempo y se ha dado un período de 120 días para iteración y mejora.

«El enrutamiento ocurre por mensaje; el cambio del modelo predeterminado es temporal. ChatGPT te dirá qué modelo está activo cuando se le pregunte. Esto es parte de un esfuerzo más amplio para fortalecer las salvaguardias y aprender del uso real antes de un lanzamiento más amplio», explicó Nick Turley, vicepresidente y director de la aplicación ChatGPT.

Controles Parentales: Protección para los Más Jóvenes

La implementación de controles parentales en ChatGPT ha recibido niveles similares de elogio y crítica. Estos controles permiten a los padres personalizar la experiencia de sus adolescentes mediante:

  • Establecer horarios silenciosos
  • Desactivar el modo de voz y la memoria
  • Eliminar la generación de imágenes
  • Optar por no participar en el entrenamiento de modelos

Interfaz de aplicación móvil con opciones de creación de imágenes

Protecciones Adicionales y Detección de Riesgos

Las cuentas para adolescentes incluyen protecciones de contenido adicionales, como reducción de contenido gráfico e ideales extremos de belleza, y un sistema de detección que reconoce señales potenciales de autolesión. Si los sistemas detectan posible daño, un equipo especializado revisa la situación y, en casos de angustia aguda, se contacta a los padres por correo electrónico, mensaje de texto y alerta push, a menos que hayan optado por no recibirlas.

OpenAI admitió que el sistema no será perfecto y podría activar alarmas innecesarias, pero considera mejor actuar y alertar a los padres que permanecer en silencio. La empresa también está trabajando en formas de contactar a servicios de emergencia si detecta una amenaza inminente para la vida y no puede localizar a un padre.

Comparte este artículo

Otras notas de tu interés:

Politica Internacional

Trump envía al Senado la nominación de Joshua Rudd para el Comando Cibernético de la NSA

Bienestar y Salud Mental

Leona Health: La startup que revoluciona la comunicación médica en Latinoamérica con IA y $14M en financiación

Negocios

OpenAI Lanza GPT Image 1.5: Más Rápido y Preciso en la Competencia contra Google Gemini

Tecnologia

Meta actualiza sus gafas AI con nuevas funciones para escuchar conversaciones e integrar música

Negocios

DoorDash Lanza Zesty: La App Social con IA que Revoluciona el Descubrimiento de Restaurantes

Negocios

Google lanza CC: su nuevo asistente de productividad basado en email con IA Gemini

Negocios

Adobe Firefly revoluciona la edición de video con prompts e integración de modelos de IA de terceros

Economia

Databricks Recauda Más de $4 Mil Millones en Ronda Serie L y Alcanza Valuación de $134 Mil Millones

Negocios

Everbloom AI: La revolución sostenible que transforma residuos de plumas en fibra de lujo

Bienestar y Salud Mental

Miami-Dade a un voto de aprobar centro de salud mental que reduciría costos de cárcel