Un Descubrimiento Inesperado en la Frontera de la IA y las Matemáticas
Durante un fin de semana reciente, Neel Somani, ingeniero de software, ex investigador cuantitativo y fundador de una startup, estaba probando las habilidades matemáticas del nuevo modelo de OpenAI cuando hizo un descubrimiento inesperado. Tras pegar un problema complejo en ChatGPT y dejar que «pensara» durante 15 minutos, regresó para encontrar una solución completa. Somani evaluó la prueba y la formalizó con una herramienta llamada Harmonic, y todo resultó correcto.

«Estaba curioso por establecer una línea base para saber cuándo los modelos de lenguaje grandes (LLMs) son efectivamente capaces de resolver problemas matemáticos abiertos en comparación con dónde luchan», dijo Somani. La sorpresa fue que, utilizando el modelo más reciente, la frontera comenzó a avanzar.
La Cadena de Razonamiento de ChatGPT y su Enlace con Erdős
La cadena de pensamiento de ChatGPT es aún más impresionante, enumerando axiomas matemáticos como la fórmula de Legendre, el postulado de Bertrand y el teorema de la Estrella de David. Eventualmente, el modelo encontró una publicación de Math Overflow de 2013, donde el matemático de Harvard Noam Elkies había dado una solución elegante a un problema similar. Pero la prueba final de ChatGPT difirió del trabajo de Elkies en aspectos importantes y ofreció una solución más completa a una versión del problema planteado por el legendario matemático Paul Erdős.
La vasta colección de problemas sin resolver de Erdős, que supera el millar de conjeturas mantenidas en línea, se ha convertido en un campo de pruebas para la inteligencia artificial.
El Auge de las Soluciones Impulsadas por IA
Desde el lanzamiento de GPT 5.2, descrito por Somani como «anecdóticamente más hábil en razonamiento matemático que iteraciones anteriores», el volumen de problemas resueltos se ha vuelto difícil de ignorar. Desde Navidad, 15 problemas han sido movidos de «abiertos» a «resueltos» en el sitio web de Erdős, y 11 de las soluciones han acreditado específicamente a modelos de IA como parte del proceso.

La Perspectiva de los Expertos
El prestigioso matemático Terence Tao tiene una mirada más matizada en su página de GitHub, contando ocho problemas diferentes donde los modelos de IA hicieron progresos autónomos significativos en un problema de Erdős, con otros seis casos donde el progreso se logró al localizar e construir sobre investigaciones previas.
En Mastodon, Tao conjeturó que la naturaleza escalable de los sistemas de IA los hace «más adecuados para ser aplicados sistemáticamente a la ‘cola larga’ de problemas oscuros de Erdős, muchos de los cuales en realidad tienen soluciones sencillas».
La Formalización: Una Clave para el Futuro
Otro factor impulsor es un cambio reciente hacia la formalización, una tarea intensiva en mano de obra que hace que el razonamiento matemático sea más fácil de verificar y extender. La formalización no requiere el uso de IA o incluso computadoras, pero una nueva generación de herramientas automatizadas ha facilitado mucho el proceso.
El «asistente de pruebas» de código abierto Lean, desarrollado en Microsoft Research en 2013, se ha utilizado ampliamente en el campo como una forma de formalizar pruebas. Herramientas de IA como Aristotle de Harmonic prometen automatizar gran parte del trabajo de formalización.
La Adopción por Parte de la Comunidad Matemática
Para Tudor Achim, fundador de Harmonic, el salto repentino en problemas resueltos de Erdős es menos importante que el hecho de que los matemáticos más grandes del mundo están comenzando a tomar esas herramientas en serio. «Me importa más el hecho de que los profesores de matemáticas y ciencias de la computación están usando [herramientas de IA]», dijo Achim. «Estas personas tienen reputaciones que proteger, así que cuando dicen que usan Aristotle o ChatGPT, esa es evidencia real».
Este avance marca un hito significativo en la colaboración entre la inteligencia artificial y la investigación matemática de vanguardia, planteando nuevas preguntas sobre la capacidad de los modelos de lenguaje grandes para empujar las fronteras del conocimiento humano.