Альфа-геометрия и олимпиадные задачи
17 января 2024 года в блоге Дипмайнд вышла заметка о выходе нового ИИ – Альфа-геометрии (AlphaGeometry).
Об этом же написано в статье для Нейче, вышедшей в тот же день.
Так что из себя представляет Альфа-геометрия?
Альфа-геометрия – это ИИ, который решает сложные геометрические задачи на уровне золотого призера математических олимпиад.
На конкурсе из 30 олимпиадных задач по геометрии Альфа-геометрия решила 25 за нормативное время. Для сравнения, предыдущий ИИ за это время решил только 10 олимпиадных задач, тогда как среднестатистический золотой медалист-олимпиадник решает 25-26 задач.
Предыдущая система для поиска решения использовала метод Ву (Wu’s method) – алгебраический подход к геометрическим задачам (о котором, возможно, потом расскажу). Альфа-геометрия использует иные принципы.
Альфа-геометрия ищет решения при помощи нейросетевой языковой модели, объединенной с алгоритмом дедуктивных выводов, к которым система приходит путем преобразования по определенным правилам цепочек символов. То есть это нейро-символическая система (neuro-symbolic system). Одна часть системы (нейронная) обеспечивает быстрые «интуитивные» идеи, а другая (символическая) – более взвешенные, рациональные.
Нейросетевая языковая модель хорошо находит общие закономерности и взаимосвязи в лингвистических данных, поэтому она быстро предсказывает потенциально полезные конструкции, но не может объяснить, почему и как она пришла к такому результату.
Система дедуктивных выводов основана на формальной логике и использует ясные правила для достижения результата: «если X, то Y», где X и Y геометрические утверждения, например, «A, B, C коллинеарные». Выводы дедуктивной системы объяснимы, но она негибкая, и сложные, непривычные задачи решает медленно.
Взаимная эксплуатация обоих модулей позволяет решить геометрическую задачу.
Геометрическая задача обычно записана в виде диаграммы и набора утверждений. Для решения задачи необходимо добавить правильные элементы на диаграмму: точки, прямые или окружности.
Для поиска правильных элементов символическая модель анализирует утверждения о диаграмме, при помощи дедуктивных правил преобразует утверждения в новые, и передает символьную запись промежуточного результата языковой модели. Языковая модель анализирует эту запись и предсказывает, какой новый элемент целесообразно добавить. Символическая модель использует эту рекомендацию для дальнейшего анализа и выводов. Процесс повторяется. Если процесс заходит в тупик, языковая модель предлагает другой элемент. Так продолжается до тех пор, пока не будет выведено правильное решение.
Для обучения модели разработчики сгенерировали датасет из 100 миллионов уникальных примеров. Это позволило обучить Альфа-геометрию без учителя. Подробности генерации датасета и примеры решения задач есть в статье.
Код Альфа-геометрии написан на Питоне и доступен на Гитхабе:
https://github.com/google-deepmind/alphageometry
Такой код – прекрасная возможность для всех интересующихся программированием систем автоматического решения математических задач разобраться в алгоритме, что-то скопировать и научиться новому.
Имхо. Раз есть Альфа-геометрия, видимо, когда-то будет и Бета с Омегой. Что и как они смогут решить, можно только нафантазировать, но все говорит о том, что у математиков появляются серьезные нечеловеческие конкуренты.