L’intelligenza artificiale sta facendo progressi senza precedenti nella matematica pura, costringendo i ricercatori a rivalutare il futuro del loro campo. Il progetto First Proof, un punto di riferimento per testare le capacità matematiche degli LLM, ha rivelato che i modelli di intelligenza artificiale sono ora in grado di generare prove valide per teoremi del mondo reale, un’impresa che in precedenza si pensava fosse lontana anni. L’imminente secondo ciclo di test richiederà piena trasparenza da parte delle società di intelligenza artificiale, poiché il settore si trova ad affrontare un cambiamento di paradigma.
L’ascesa dell’intelligenza artificiale nella ricerca matematica
Per decenni, la matematica si è affidata all’ingegno umano per ampliare i confini della conoscenza. Ma negli ultimi mesi, i LLM hanno iniziato a produrre prove verificabili, sfidando l’idea che il ragionamento matematico complesso sia unicamente umano. Il primo round di First Proof ha dimostrato questi progressi, con i modelli di OpenAI e Google DeepMind che hanno risolto con successo molteplici problemi che hanno sconcertato gli altri partecipanti.
Lauren Williams, una matematica di Harvard coinvolta in First Proof, ha notato le prestazioni dei modelli come “piuttosto impressionanti”. Il progetto è nato dalle esperienze del team con l’intelligenza artificiale, che, sebbene promettente, spesso produce risultati imperfetti ma sicuri. Gli LLM possono teoricamente assistere i matematici dimostrando passaggi intermedi, ma in pratica spesso generano dimostrazioni imprecise mascherate da calcoli complessi.
I primi risultati dimostrativi: un’istantanea delle attuali capacità
Il test iniziale ha coinvolto 10 lemmi inediti. Il modello di OpenAI ne ha dimostrati correttamente cinque, mentre l’agente Aletheia di Google DeepMind ne ha risolti sei (anche se un risultato rimane controverso). In particolare, ciascun modello eccelleva nei problemi con cui l’altro lottava, evidenziando la diversità dei loro punti di forza. Daniel Litt, matematico dell’Università di Toronto, ha osservato che le capacità dell’intelligenza artificiale stanno “migliorando molto rapidamente”, con ben otto dei dieci problemi parzialmente risolti dall’intelligenza artificiale.
Questo progresso ha acceso il dibattito nel settore. Alcuni, come Litt, immaginano un futuro in cui gli strumenti di intelligenza artificiale miglioreranno la produttività dei matematici umani. Propone che anche in uno scenario ipotetico in cui le IA generino tutte le possibili dimostrazioni, i matematici prospererebbero comunque esplorando e comprendendo questo vasto panorama. Tuttavia, gli attuali sistemi di intelligenza artificiale sono inaffidabili e spesso commettono errori sottili difficili da rilevare.
La sfida della verifica e della fiducia
La difficoltà nel verificare le prove generate dall’intelligenza artificiale è un ostacolo significativo. Mohammed Abouzaid, un matematico di Stanford coinvolto nella Prima Dimostrazione, sottolinea che gli errori sono spesso nascosti nei calcoli complessi, rendendoli quasi indistinguibili dagli errori umani. I modelli non sono “onesti”, spesso presentano affermazioni esagerate o nascondono errori critici.
Per risolvere questo problema, il team di First Proof assumerà revisori anonimi per il secondo turno, finanziati da sovvenzioni e donazioni da parte di aziende di intelligenza artificiale. Ciò è in risposta a un evidente divario tra gli sforzi dell’IA pubblica e quella proprietaria: quest’ultima ha risolto più problemi nella prima fase, probabilmente grazie a modelli migliorati o all’assistenza umana non divulgata.
Il futuro della matematica: adattamento o obsolescenza?
La situazione attuale richiede un adattamento. Le istituzioni e la professione devono prepararsi per un futuro in cui gli LLM inondano il campo con prove potenzialmente imperfette. La mancanza di trasparenza nei sistemi di IA proprietari solleva preoccupazioni sulla democratizzazione; se solo aziende selezionate avessero accesso a modelli superiori, il settore potrebbe diventare più esclusivo, e non meno.
Il secondo round di First Proof è progettato per risolvere questi problemi. Richiedendo l’accesso diretto ai modelli, il team mira a garantire test equi. Resta incerto se OpenAI, Google e altre società di intelligenza artificiale si adegueranno.
In definitiva, comprendere le reali capacità dell’intelligenza artificiale è fondamentale per guidare i futuri matematici. Come afferma Abouzaid, “Una delle nostre motivazioni principali è assicurarci di poter dire ai giovani come ci aspettiamo che sarà il settore tra pochi anni”. La rapida evoluzione dell’intelligenza artificiale in matematica richiede un’attenta valutazione, trasparenza e adattamento proattivo per garantire il continuo progresso del campo.
