Искусственный интеллект добивается беспрецедентных успехов в чистой математике, заставляя исследователей переосмыслить будущее своей области. Проект First Proof, эталон для тестирования математических возможностей больших языковых моделей (LLM), показал, что ИИ-модели теперь способны генерировать корректные доказательства реальных теорем — достижение, которое, как считалось ранее, будет возможно лишь через несколько лет. Второй раунд тестирования потребует полной прозрачности от компаний, разрабатывающих ИИ, поскольку область переживает кардинальный сдвиг.

Подъём ИИ в Математических Исследованиях

На протяжении десятилетий математика полагалась на человеческую изобретательность для расширения границ знаний. Но в последние месяцы LLM начали генерировать проверяемые доказательства, ставя под сомнение представление о том, что сложное математическое мышление является исключительно человеческим. Первый раунд First Proof продемонстрировал этот прогресс: модели от OpenAI и Google DeepMind успешно решили несколько задач, которые оказались не под силу другим участникам.

Лорен Уильямс, математик из Гарварда, участвовавшая в First Proof, отметила, что результаты моделей были «впечатляющими». Проект возник из личного опыта команды с ИИ, который, хотя и многообещающий, часто выдаёт ошибочные, но уверенные результаты. Теоретически LLM могут помочь математикам, доказывая промежуточные шаги, но на практике они часто генерируют неточные доказательства, замаскированные под сложные вычисления.

Результаты First Proof: Снимок Текущих Возможностей

Первый тест включал в себя 10 неопубликованных лемм. Модель OpenAI правильно доказала пять, а агент Aletheia от Google DeepMind решил шесть (один результат остаётся спорным). Важно отметить, что каждая модель преуспела в задачах, в которых другая испытывала трудности, что подчеркивает разнообразие их сильных сторон. Дэниел Литт, математик из Университета Торонто, заметил, что возможности ИИ «быстро улучшаются», и что ИИ частично решил до восьми из десяти задач.

Этот прогресс вызвал дебаты в сообществе. Некоторые, такие как Литт, предвидят будущее, в котором инструменты ИИ повысят производительность человеческих математиков. Он предполагает, что даже в гипотетическом сценарии, где ИИ генерирует все возможные доказательства, математики все равно будут преуспевать, исследуя и понимая этот обширный ландшафт. Однако текущие системы ИИ ненадежны и часто допускают тонкие ошибки, которые трудно обнаружить.

Вызов Верификации и Доверия

Сложность проверки доказательств, сгенерированных ИИ, является серьёзным препятствием. Мохаммед Абузаид, математик из Стэнфорда, участвовавший в First Proof, подчёркивает, что ошибки часто скрыты в сложных вычислениях, что делает их почти неотличимыми от человеческих ошибок. Модели не «честны» и часто делают преувеличенные заявления или скрывают критические ошибки.

Чтобы решить эту проблему, команда First Proof на втором раунде нанимает анонимных рецензентов, финансируемых грантами и пожертвованиями от компаний, разрабатывающих ИИ. Это связано с огромным разрывом между публичными и проприетарными усилиями в области ИИ — последние решили больше задач в первом раунде, вероятно, благодаря улучшенным моделям или неуказанной помощи человека.

Будущее Математики: Адаптация или Устаревание?

Текущая ситуация требует адаптации. Институты и сообщество должны подготовиться к будущему, в котором LLM будут наводнять область потенциально ошибочными доказательствами. Отсутствие прозрачности в проприетарных системах ИИ вызывает опасения по поводу демократизации; если только избранные компании будут иметь доступ к превосходным моделям, область может стать более эксклюзивной, а не менее.

Второй раунд First Proof призван решить эти проблемы. Требуя прямого доступа к моделям, команда стремится обеспечить справедливое тестирование. То, будут ли OpenAI, Google и другие компании, разрабатывающие ИИ, соблюдать это требование, остаётся неопределённым.

В конечном счёте, понимание истинных возможностей ИИ имеет решающее значение для определения будущего математиков. Как утверждает Абузаид: «Одна из наших главных мотиваций — убедиться, что мы можем сказать молодым людям, чего ожидать от этой области через несколько лет». Быстрое развитие ИИ в математике требует тщательной оценки, прозрачности и активной адаптации для обеспечения дальнейшего прогресса области.