La inteligencia artificial está logrando avances sin precedentes en las matemáticas puras, lo que obliga a los investigadores a reevaluar el futuro de su campo. El proyecto First Proof, un punto de referencia para probar las capacidades matemáticas de los LLM, ha revelado que los modelos de IA ahora son capaces de generar pruebas válidas para teoremas del mundo real, una hazaña que antes se pensaba que tardaría años. La próxima segunda ronda de pruebas exigirá total transparencia por parte de las empresas de IA, ya que el campo se enfrenta a un cambio de paradigma.

El auge de la IA en la investigación matemática

Durante décadas, las matemáticas dependieron del ingenio humano para ampliar los límites del conocimiento. Pero en los últimos meses, los LLM han comenzado a generar pruebas verificables, desafiando la noción de que el razonamiento matemático complejo es exclusivamente humano. La primera ronda de First Proof demostró este progreso, con modelos de OpenAI y Google DeepMind que resolvieron con éxito múltiples problemas que dejaron perplejos a otros participantes.

Lauren Williams, una matemática de Harvard involucrada en First Proof, calificó el desempeño de los modelos como “bastante impresionante”. El proyecto surgió de las propias experiencias del equipo con la IA, que, si bien es prometedora, a menudo produce resultados defectuosos pero confiables. En teoría, los LLM pueden ayudar a los matemáticos demostrando pasos intermedios, pero en la práctica, con frecuencia generan pruebas inexactas disfrazadas de cálculos complejos.

Los primeros resultados de la prueba: una instantánea de las capacidades actuales

La prueba inicial involucró 10 lemas inéditos. El modelo de OpenAI demostró correctamente cinco, mientras que el agente Aletheia de Google DeepMind resolvió seis (aunque un resultado sigue siendo discutido). En particular, cada modelo destacó en los problemas con los que luchaba el otro, destacando la diversidad de sus puntos fuertes. Daniel Litt, matemático de la Universidad de Toronto, observó que las capacidades de la IA están “mejorando muy rápidamente”, y hasta ocho de los diez problemas se resuelven parcialmente con la IA.

Este progreso ha provocado un debate dentro del campo. Algunos, como Litt, imaginan un futuro en el que las herramientas de inteligencia artificial mejoren la productividad de los matemáticos humanos. Propone que incluso en un escenario hipotético en el que las IA generen todas las pruebas posibles, los matemáticos seguirían prosperando explorando y comprendiendo este vasto paisaje. Sin embargo, los sistemas de IA actuales no son fiables y con frecuencia cometen errores sutiles que son difíciles de detectar.

El desafío de la verificación y la confianza

La dificultad para verificar las pruebas generadas por IA es un obstáculo importante. Mohammed Abouzaid, un matemático de Stanford involucrado en la Primera Prueba, enfatiza que los errores a menudo quedan ocultos en cálculos complejos, lo que los hace casi indistinguibles de los errores humanos. Los modelos no son “honestos” y a menudo presentan afirmaciones exageradas u ocultan errores críticos.

Para solucionar este problema, el equipo de First Proof contratará revisores anónimos para la segunda ronda, financiados con subvenciones y donaciones de empresas de inteligencia artificial. Esto es en respuesta a una brecha evidente entre los esfuerzos públicos y privados de IA: estos últimos resolvieron más problemas en la primera ronda, probablemente debido a modelos mejorados o asistencia humana no revelada.

El futuro de las matemáticas: ¿adaptación u obsolescencia?

La situación actual exige adaptación. Las instituciones y la profesión deben prepararse para un futuro en el que los LLM inundarán el campo con pruebas potencialmente defectuosas. La falta de transparencia en los sistemas propietarios de IA genera preocupaciones sobre la democratización; Si sólo empresas selectas tuvieran acceso a modelos superiores, el campo podría volverse más exclusivo, no menos.

La segunda ronda de First Proof está diseñada para resolver estos problemas. Al exigir acceso directo a los modelos, el equipo pretende garantizar pruebas justas. Aún es incierto si OpenAI, Google y otras empresas de IA cumplirán.

En última instancia, comprender las verdaderas capacidades de la IA es fundamental para guiar a los futuros matemáticos. Como afirma Abouzaid: “Una de nuestras principales motivaciones es asegurarnos de que podemos decirles a los jóvenes cómo esperamos que sea el campo dentro de unos años”. La rápida evolución de la IA en matemáticas exige una evaluación cuidadosa, transparencia y adaptación proactiva para garantizar el progreso continuo del campo.