Recursive Self-Improvement: La Nueva Frontera de la Inteligencia Artificial
El término «recursión» se ha convertido en la última palabra de moda en los círculos de inteligencia artificial. Dos startups han adoptado el nombre, y muchas más han comenzado a referenciar la mejora recursiva (RSI) en sus hojas de ruta. Al igual que la AGI antes, RSI se ha convertido en una palabra de tres letras para un despegue cataclísmico de la IA, incluso si aún existe desacuerdo sobre su significado exacto.
¿Qué es RSI?
En términos básicos, RSI se refiere a un sistema de IA que puede mejorarse continuamente. Una vez que los sistemas de IA pueden gestionar el ciclo de actualización mejor que los humanos, el proceso se convierte en un bucle cerrado, limitado solo por la potencia computacional disponible. Los humanos dejarían de ser necesarios o incluso útiles.
Startups y científicos líderes en la carrera
A principios de este mes, el conocido investigador Richard Socher lanzó Recursive Superintelligence con RSI como objetivo explícito.
«Nuestro objetivo principal es construir superinteligencia recursiva auto-mejorable a escala», afirmó Socher. «Esto significa que todo el proceso de ideación, implementación y validación de ideas de investigación sería automático».
Otro pionero es Alex Karpathy, figura legendaria de Tesla y OpenAI, quien utiliza enjambres de agentes para entrenar LLMs en tareas simples en su proyecto Auto-Research. Karpathy ha sido inusualmente abierto, tuiteando hitos y compartiendo los bloques de construcción en GitHub. Hasta ahora, el trabajo se ha limitado a mejoras menores en un modelo a escala GPT-2.
«No es investigación novedosa y revolucionaria (todavía)», comentó en marzo.
Con su nuevo rol en pre-entrenamiento en Anthropic, tendrá la oportunidad de aplicar la idea a mayor escala.
Sara Hooker, exalumna de Cohere y Google, fundó Adaption y lanzó AutoScientist para automatizar el entrenamiento de frontera. Al igual que Auto-Research, el sistema entrena agentes para realizar mejoras incrementales. Si estos investigadores logran impulsar la frontera, el sistema podría convertirse rápidamente en algo muy similar a RSI.
Por su parte, Doris Xin de Disarray generó un interés más específico cuando su agente de aprendizaje automático autónomo obtuvo 28 medallas en una reciente competencia de Kaggle, superando a muchos agentes entrenados por humanos. Para Xin, el principal desafío es la confiabilidad.
«Sostendría que, con cómputo infinito y horizonte temporal infinito, ya estamos allí», declaró Xin. «Esto no es un esfuerzo creativo, es mucha ingeniería básica».
La visión de los gigantes tecnológicos
El CEO de Google, Sundar Pichai, reconoció en una reciente entrevista que la industria aún está lejos de sistemas recursivos significativos.
«Es un continuo, y todos estamos progresando. Pero en la forma en que la gente describe RSI, representaría un siguiente nivel de aceleración y tendría muchas implicaciones, pero aún no estamos allí», afirmó Pichai.
Sin embargo, el continuo incluye una gran cantidad de sistemas de IA auto-mejorables. En enero, uno de los programadores principales de Claude Code en Anthropic estimó que «cerca del 100%» del código de su equipo fue escrito por la herramienta, una admisión franca de que Claude Code se estaba escribiendo a sí mismo.
En una encuesta reciente vinculada a la vista previa de Mythos, 5 de 18 ingenieros de Anthropic creyeron que, con mejoras de integración, esta versión de Mythos podría sustituir pronto a un ingeniero L4, un programador de nivel medio que puede asumir proyectos complejos sin supervisión. No obstante, se reportaron debilidades:
«Algunas de las principales debilidades reportadas de Claude en comparación con un L4 incluyen la autogestión de tareas semanales ambiguas, la comprensión de las prioridades organizacionales, el gusto, la verificación, el seguimiento de instrucciones y la epistémica».
Es decir, todo lo relacionado con la autodirección, pilar fundamental del RSI.
El camino hacia la auto-mejora total
Helen Toner, directora del Centro de Seguridad y Tecnología Emergente de Georgetown y exmiembro de la junta directiva de OpenAI, señaló que simplemente usar herramientas de IA para hacer investigación no es suficiente para calificar como RSI.
«Están usando IA para todo lo que pueden», indicó Toner. «Y eso es diferente de la definición clásica de RSI, que realmente implica que no se necesitan humanos».
Toner destacó un reciente post de Ayeja Cotra de METR, que distingue diferentes hitos en el camino hacia la toma de control de la investigación por IA. «Adecuación» ocurre cuando el sistema puede seguir investigando sin humanos, aunque el resultado sea menos valioso o eficiente. «Paridad» se alcanza cuando un sistema solo de IA es tan bueno como uno solo humano. «Supremacía» llega cuando un sistema solo de IA supera a un sistema colaborativo humano-IA. Cotra concluye que la IA está muy cerca del umbral de adecuación.
«No me sorprendería si me dijeran que este hito ya se ha superado, y espero que ocurra en los próximos años», escribió Cotra.
En cuanto a la paridad, una vez alcanzada, cree que «aceleraría masivamente el ritmo del progreso de la IA, llevando a la supremacía en la investigación en otro año».
Sin embargo, incluso si los investigadores pueden hacer mejoras incrementales como las de Karpathy, existen grandes desafíos para delegar todo el proceso de investigación. Toner lo compara con la historia de la computación:
«Pasamos de lenguajes de máquina a ensamblador y lenguajes compilados; te alejas cada vez más de las entrañas de la computadora, pero el humano todavía, en algún sentido intuitivo, dirige el espectáculo».
Superar ese paradigma requerirá desafíos significativos en ingeniería y alineación. La compensación básica entre el trabajo humano y la inteligencia de las máquinas será difícil de superar.

La imagen muestra una mano utilizando un stylus para interactuar con un panel digital que presenta circuitos electrónicos y la palabra «AI», representando el avance tecnológico en inteligencia artificial.
¿Qué sigue para RSI?
A pesar del enorme interés y las inversiones, no hay cómputo infinito disponible. El único punto en el que los investigadores coinciden es que, al igual que la AGI, el RSI total aún no ha llegado.