A inteligência artificial está a fazer incursões sem precedentes na matemática pura, forçando os investigadores a reavaliar o futuro da sua área. O projeto First Proof, uma referência para testar as capacidades matemáticas dos LLMs, revelou que os modelos de IA são agora capazes de gerar provas válidas para teoremas do mundo real – um feito que se pensava estar a anos de distância. A próxima segunda ronda de testes exigirá total transparência das empresas de IA, à medida que o campo enfrenta uma mudança de paradigma.
A ascensão da IA na pesquisa matemática
Durante décadas, a matemática confiou na engenhosidade humana para ultrapassar os limites do conhecimento. Mas nos últimos meses, os LLMs começaram a gerar provas verificáveis, desafiando a noção de que o raciocínio matemático complexo é exclusivamente humano. A primeira rodada do First Proof demonstrou esse progresso, com modelos da OpenAI e do Google DeepMind resolvendo com sucesso vários problemas que deixaram outros participantes perplexos.
Lauren Williams, matemática de Harvard envolvida no First Proof, considerou o desempenho dos modelos “bastante impressionante”. O projeto surgiu das próprias experiências da equipe com IA, que, embora promissora, muitas vezes produz resultados falhos, mas confiáveis. Os LLMs podem teoricamente ajudar os matemáticos provando etapas intermediárias, mas na prática, eles frequentemente geram provas imprecisas disfarçadas em cálculos complexos.
Os primeiros resultados de prova: um instantâneo das capacidades atuais
O teste inicial envolveu 10 lemas inéditos. O modelo da OpenAI provou corretamente cinco, enquanto o agente Aletheia do Google DeepMind resolveu seis (embora um resultado permaneça contestado). Notavelmente, cada modelo destacou-se nos problemas com os quais o outro se debateu, destacando a diversidade dos seus pontos fortes. Daniel Litt, matemático da Universidade de Toronto, observou que as capacidades da IA estão a “melhorar muito rapidamente”, com oito dos dez problemas parcialmente resolvidos pela IA.
Esse progresso gerou debate na área. Alguns, como Litt, prevêem um futuro onde as ferramentas de IA aumentem a produtividade dos matemáticos humanos. Ele propõe que mesmo num cenário hipotético em que as IA gerem todas as provas possíveis, os matemáticos ainda prosperariam explorando e compreendendo esta vasta paisagem. No entanto, os atuais sistemas de IA não são fiáveis, cometendo frequentemente erros subtis que são difíceis de detetar.
O Desafio da Verificação e Confiança
A dificuldade em verificar as provas geradas pela IA é um obstáculo significativo. Mohammed Abouzaid, um matemático de Stanford envolvido na Primeira Prova, enfatiza que os erros são frequentemente enterrados em cálculos complexos, tornando-os quase indistinguíveis dos erros humanos. Os modelos não são “honestos”, apresentando frequentemente afirmações exageradas ou escondendo erros críticos.
Para resolver isso, a equipe do First Proof contratará revisores anônimos para a segunda rodada, financiados por subsídios e doações de empresas de IA. Isto é uma resposta a uma lacuna gritante entre os esforços de IA públicos e proprietários – estes últimos resolveram mais problemas na primeira ronda, provavelmente devido a modelos melhorados ou a assistência humana não revelada.
O Futuro da Matemática: Adaptação ou Obsolescência?
A situação atual exige adaptação. As instituições e a profissão devem preparar-se para um futuro onde os LLMs inundarão o campo com provas potencialmente falhas. A falta de transparência nos sistemas proprietários de IA levanta preocupações sobre a democratização; se apenas empresas selecionadas tivessem acesso a modelos superiores, o campo poderia tornar-se mais exclusivo, e não menos.
A segunda rodada da Primeira Prova foi projetada para resolver esses problemas. Ao exigir acesso direto aos modelos, a equipe visa garantir testes justos. Se a OpenAI, o Google e outras empresas de IA irão cumprir, permanece incerto.
Em última análise, compreender as verdadeiras capacidades da IA é fundamental para orientar futuros matemáticos. Como afirma Abouzaid: “Uma das nossas principais motivações é garantir que podemos dizer aos jovens como esperamos que o campo seja daqui a alguns anos”. A rápida evolução da IA na matemática exige uma avaliação cuidadosa, transparência e adaptação proativa para garantir o progresso contínuo da área.
