Sztuczna inteligencja dokonuje bezprecedensowych postępów w czystej matematyce, zmuszając badaczy do ponownego przemyślenia przyszłości swojej dziedziny. Project First Proof, punkt odniesienia do testowania możliwości matematycznych dużych modeli językowych (LLM), pokazał, że modele sztucznej inteligencji są obecnie w stanie generować poprawne dowody twierdzeń w świecie rzeczywistym – osiągnięcie, o którym wcześniej sądzono, że zajmie wiele lat. Druga runda testów będzie wymagać od firm zajmujących się sztuczną inteligencją pełnej przejrzystości, ponieważ pole przechodzi zmiany sejsmiczne.
Rozwój sztucznej inteligencji w badaniach matematycznych
Przez dziesięciolecia matematyka polegała na ludzkiej pomysłowości, aby przesuwać granice wiedzy. Jednak w ostatnich miesiącach LLM zaczęły generować możliwe do przetestowania dowody, podważając pogląd, że złożone myślenie matematyczne jest wyłącznie cechą ludzką. Pierwsza runda First Proof pokazała ten postęp: modele z OpenAI i Google DeepMind pomyślnie rozwiązały kilka problemów, które przekraczały możliwości innych uczestników.
Lauren Williams, matematyczka z Harvardu, która brała udział w badaniu First Proof, stwierdziła, że wyniki modeli były „imponujące”. Projekt wyrósł z osobistych doświadczeń zespołu ze sztuczną inteligencją, która choć obiecująca, często daje błędne, ale pewne wyniki. Teoretycznie studia LLM mogą pomóc matematykom, udowadniając etapy pośrednie, ale w praktyce często generują niedokładne dowody udające złożone obliczenia.
Wyniki pierwszego dowodu: migawka bieżących możliwości
Pierwszy test obejmował 10 niepublikowanych lematów. Model OpenAI uzyskał pięć poprawnych wyników, a agent Aletheia z Google DeepMind miał sześć poprawnych wyników (jeden pozostaje kontrowersyjny). Co ważne, każdy model doskonale radził sobie z zadaniami, z którymi borykał się drugi, podkreślając różnorodność ich mocnych stron. Daniel Litt, matematyk z Uniwersytetu w Toronto, zauważył, że możliwości sztucznej inteligencji „szybko się poprawiają” i że sztuczna inteligencja częściowo rozwiązała nawet osiem z dziesięciu problemów.
Postęp ten wywołał dyskusję w społeczeństwie. Niektórzy, jak Litt, wyobrażają sobie przyszłość, w której narzędzia AI poprawią produktywność matematyków. Sugeruje, że nawet w hipotetycznym scenariuszu, w którym sztuczna inteligencja generuje wszelkie możliwe dowody, matematycy nadal dobrze by sobie poradzili, badając i rozumiejąc ten rozległy krajobraz. Jednak obecne systemy sztucznej inteligencji są zawodne i często popełniają subtelne błędy, które są trudne do wykrycia.
Wyzwanie weryfikacji i zaufania
Główną przeszkodą jest trudność w weryfikacji dowodów generowanych przez sztuczną inteligencję. Mohammed Abuzaid, matematyk ze Stanford, który przyczynił się do powstania First Proof, podkreśla, że w skomplikowanych obliczeniach błędy są często ukryte, przez co są prawie nie do odróżnienia od błędów ludzkich. Modelki nie są „uczciwe” i często wysuwają przesadne twierdzenia lub ukrywają krytyczne błędy.
Aby rozwiązać ten problem, zespół First Proof w drugiej turze zatrudnia anonimowych recenzentów, finansowanych z grantów i darowizn od firm zajmujących się sztuczną inteligencją. Wynika to z ogromnej przepaści pomiędzy publicznymi i zastrzeżonymi wysiłkami AI – ta ostatnia rozwiązała więcej problemów w pierwszej turze, prawdopodobnie dzięki ulepszonym modelom lub nieokreślonej pomocy człowieka.
Przyszłość matematyki: adaptacja czy starzenie się?
Obecna sytuacja wymaga adaptacji. Instytucje i społeczność muszą przygotować się na przyszłość, w której LLM zalewają pole potencjalnie błędnymi dowodami. Brak przejrzystości w zastrzeżonych systemach sztucznej inteligencji budzi obawy dotyczące demokratyzacji; gdyby tylko wybrane firmy miały dostęp do doskonałych modeli, obszar ten mógłby stać się bardziej ekskluzywny, a nie mniej.
Celem drugiej rundy pierwszego dowodu jest rozwiązanie tych problemów. Wymagając bezpośredniego dostępu do modeli, zespół stara się zapewnić uczciwe testy. Nie jest pewne, czy OpenAI, Google i inne firmy zajmujące się sztuczną inteligencją spełnią ten wymóg.
Ostatecznie zrozumienie prawdziwych możliwości sztucznej inteligencji ma kluczowe znaczenie dla określenia przyszłości matematyków. Jak stwierdza Abouzaid: „Jedną z naszych głównych motywacji jest upewnienie się, że możemy powiedzieć młodym ludziom, czego mogą się spodziewać w tej dziedzinie za kilka lat”. Szybki rozwój sztucznej inteligencji w matematyce wymaga uważnej oceny, przejrzystości i proaktywnego dostosowywania, aby zapewnić ciągły postęp w tej dziedzinie.




















