Kecerdasan buatan membuat terobosan yang belum pernah terjadi sebelumnya dalam bidang matematika murni, sehingga memaksa para peneliti untuk mengevaluasi kembali masa depan bidang mereka. Proyek First Proof, sebuah tolok ukur untuk menguji kemampuan matematika LLM, telah mengungkapkan bahwa model AI kini mampu menghasilkan bukti valid untuk teorema dunia nyata—suatu prestasi yang sebelumnya diperkirakan masih membutuhkan waktu bertahun-tahun lagi. Uji coba putaran kedua yang akan datang akan menuntut transparansi penuh dari perusahaan AI, karena bidang ini menghadapi perubahan paradigma.
Bangkitnya AI dalam Penelitian Matematika
Selama beberapa dekade, matematika mengandalkan kecerdikan manusia untuk mendorong batas-batas pengetahuan. Namun dalam beberapa bulan terakhir, LLM telah mulai menghasilkan bukti yang dapat diverifikasi, menantang gagasan bahwa penalaran matematika yang kompleks adalah hal yang unik bagi manusia. Putaran pertama First Proof menunjukkan kemajuan ini, dengan model dari OpenAI dan Google DeepMind berhasil memecahkan berbagai masalah yang membingungkan peserta lainnya.
Lauren Williams, ahli matematika Harvard yang terlibat dalam First Proof, menyatakan bahwa kinerja model tersebut “cukup mengesankan”. Proyek ini muncul dari pengalaman tim sendiri dengan AI, yang meskipun menjanjikan, sering kali memberikan hasil yang cacat namun meyakinkan. LLM secara teoritis dapat membantu ahli matematika dengan membuktikan langkah-langkah perantara, namun dalam praktiknya, mereka sering kali menghasilkan bukti yang tidak akurat yang disamarkan dalam perhitungan yang rumit.
Hasil Bukti Pertama: Potret Kemampuan Saat Ini
Tes awal melibatkan 10 lemma yang tidak dipublikasikan. Model OpenAI membuktikan lima dengan benar, sementara agen Aletheia dari Google DeepMind memecahkan enam (meskipun satu hasil masih diperdebatkan). Khususnya, masing-masing model unggul dalam permasalahan yang dihadapi oleh model lainnya, dan menyoroti keberagaman kekuatan masing-masing model. Daniel Litt, ahli matematika di Universitas Toronto, mengamati bahwa kemampuan AI “meningkat dengan sangat pesat”, dengan delapan dari sepuluh permasalahan diselesaikan sebagian oleh AI.
Kemajuan ini telah memicu perdebatan di lapangan. Beberapa orang, seperti Litt, membayangkan masa depan di mana alat AI dapat meningkatkan produktivitas manusia matematikawan. Dia mengusulkan bahwa bahkan dalam skenario hipotetis di mana AI menghasilkan semua bukti yang mungkin, ahli matematika akan tetap berkembang dengan mengeksplorasi dan memahami lanskap yang luas ini. Namun, sistem AI saat ini tidak dapat diandalkan dan sering kali membuat kesalahan halus yang sulit dideteksi.
Tantangan Verifikasi dan Kepercayaan
Kesulitan dalam memverifikasi bukti yang dihasilkan AI merupakan rintangan yang signifikan. Mohammed Abouzaid, ahli matematika Stanford yang terlibat dalam First Proof, menekankan bahwa kesalahan sering kali terkubur dalam perhitungan yang rumit, sehingga hampir tidak dapat dibedakan dari kesalahan manusia. Model yang digunakan tidak “jujur”, sering kali menyajikan klaim yang berlebihan atau menyembunyikan kesalahan kritis.
Untuk mengatasi hal ini, tim First Proof akan mempekerjakan pengulas anonim untuk putaran kedua, yang didanai oleh hibah dan sumbangan dari perusahaan AI. Hal ini merupakan respons terhadap kesenjangan yang mencolok antara upaya AI yang bersifat publik dan yang bersifat kepemilikan—yang terakhir ini memecahkan lebih banyak masalah pada tahap pertama, kemungkinan besar karena model yang lebih baik atau bantuan manusia yang dirahasiakan.
Masa Depan Matematika: Adaptasi atau Keusangan?
Situasi saat ini menuntut adaptasi. Institusi dan profesi harus mempersiapkan masa depan di mana LLM membanjiri lapangan dengan bukti-bukti yang berpotensi cacat. Kurangnya transparansi dalam sistem AI menimbulkan kekhawatiran mengenai demokratisasi; jika hanya perusahaan-perusahaan tertentu yang memiliki akses terhadap model-model unggul, bidang ini akan menjadi lebih eksklusif, bukan malah berkurang.
Pembuktian Pertama putaran kedua dirancang untuk mengatasi masalah ini. Dengan mewajibkan akses langsung ke model, tim bertujuan untuk memastikan pengujian yang adil. Apakah OpenAI, Google, dan perusahaan AI lainnya akan mematuhinya masih belum pasti.
Pada akhirnya, memahami kemampuan AI yang sebenarnya sangat penting untuk membimbing para ahli matematika masa depan. Seperti yang dikatakan Abouzaid, “Salah satu motivasi utama kami adalah memastikan bahwa kami dapat memberi tahu generasi muda seperti apa bidang yang kami harapkan dalam beberapa tahun ke depan.” Evolusi AI yang cepat dalam matematika memerlukan evaluasi yang cermat, transparansi, dan adaptasi proaktif untuk memastikan kemajuan berkelanjutan di bidang ini.




















