CEO de Anthropic Dario Amodei advierte: La humanidad desconoce cómo funcionan realmente los modelos de IA

El llamado urgente por transparencia en sistemas de inteligencia artificial

En un ensayo publicado este jueves 24 de abril de 2025, Dario Amodei, CEO de Anthropic, reveló una verdad incómoda: «No tenemos idea precisa de por qué los modelos de IA toman decisiones específicas».

Comparación de rendimiento de modelos IA

Tabla comparativa de modelos IA (Fuente: Anthropic)

La meta: Escáneres cerebrales para IA

Amodei propone desarrollar «resonancias magnéticas» para modelos de IA que permitan:

  • Detectar tendencias peligrosas (mentiras o búsqueda de poder)
  • Identificar vulnerabilidades estructurales
  • Explicar procesos de toma de decisiones

Circuitos neuronales: El avance clave

Diagrama entrenamiento IA

Proceso de entrenamiento con retroalimentación constitucional

Anthropic descubrió «circuitos» en sus modelos, como uno que relaciona ciudades con estados estadounidenses. «Estimamos que existen millones de estos circuitos», reveló Amodei.

El dilema de la IA superinteligente

«Sería inaceptable que la humanidad ignore cómo funcionan sistemas que dominarán economía y seguridad nacional»

El CEO advierte que alcanzar una IA a nivel humano (AGI) sin comprender sus mecanismos internos podría ser catastrófico.

Propuestas concretas

  • Regulaciones «light-touch» para fomentar investigación
  • Controles de exportación de chips a China
  • Colaboración con OpenAI y Google DeepMind

Identidad visual Anthropic

Enfoque en IA segura y explicable

Comparte este artículo

Otras notas de tu interés:

Politica

Brendan Carr fusiona física y política: Curvatura del tiempo e igualdad en las elecciones de EE.UU.

Negocios

Gamma AI lanza Gamma Imagine: una nueva herramienta de generación de imágenes para rivalizar con Canva y Adobe

Negocios

Niv-AI: Revolucionando la Eficiencia Energética en Centros de Datos con Inteligencia Artificial

Shopping y Compras

Apple AirPods Max 2: Lanzamiento sorpresa con audio de alta fidelidad y nueva traducción en vivo

Negocios

Picsart lanza un mercado de agentes de IA para revolucionar la creación de contenido

Economia

Impacto del Mercado de Vehículos Eléctricos entre China, Canadá y Estados Unidos

Economia

Nvidia Lanza NemoClaw: La Plataforma de Seguridad Empresarial para Estrategias OpenClaw

Economia

Nvidia Proyecta Ventas por $1 Billón para sus Chips de IA Blackwell y Vera Rubin

Negocios

Memories AI y Nvidia Unen Fuerzas para Crear Memoria Visual en Wearables y Robots

Negocios

Nvidia Desvela DLSS 5: La Revolución de la IA en Gráficos y Más Allá