AI and IMO

Google DeepMind’dan sun’iy intellekt bu yilgi Xalqaro matematika olimpiadasida (IMO) kumush medalni qo‘lga kiritdi, bu har qanday sun’iy intellekt birinchi marta shohsupaga ko‘tarildi.
IMO yosh matematiklar uchun dunyodagi eng nufuzli tanlov hisoblanadi. Uning test savollariga to'g'ri javob berish uchun AI tizimlarida odatda etishmaydigan matematik qobiliyat talab etiladi.

Yanvar oyida Google DeepMind AlphaGeometry AI tizimini namoyish etdi, bu IMO geometriyasi bo'yicha ba'zi savollarga, shuningdek, odamlarga javob bera oladi. Biroq, bu jonli musobaqadan emas edi va u IMO medalini qo'lga kiritish uchun zarur bo'lgan raqamlar nazariyasi, algebra va kombinatorika kabi boshqa matematik fanlardan savollarga javob bera olmadi.
Google DeepMind endi kengroq diapazondagi matematik muammolarni hal qila oladigan AlphaProof deb nomlangan yangi sun’iy intellektni va geometriya bo‘yicha ko‘proq savollarni yechish mumkin bo‘lgan AlphaGeometryning takomillashtirilgan versiyasini chiqardi.
Jamoa bu yilgi IMO savollari bo‘yicha ikkala tizimni birgalikda sinovdan o‘tkazganida, oltita savoldan to‘rttasiga to‘g‘ri javob berib, ularga mumkin bo‘lgan 42 balldan 28 ball to‘pladi. Bu kumush medal va bu yilgi oltin medal ostonasidan atigi bir ochko qo'lga kiritish uchun yetarli bo'ldi.

Buyuk Britaniyaning Bat shahrida o‘tgan haftada o‘tkazilgan tanlovda 58 nafar ishtirokchi oltin, 123 nafari kumush medalni qo‘lga kiritdi.
IMO prezidenti Gregor Dolinar : "Biz hammamiz yaxshi bilamizki, AI oxir-oqibat ko'pgina matematik muammolarni hal qilishda odamlardan yaxshiroq bo'ladi, ammo sun'iy intellektning yaxshilanish tezligi hayratlanarli". "Bir necha kun oldin IMO 2024 oltin medalini atigi bir ochkoga boy berib qo'yish haqiqatan ham ta'sirli".
Matbuot anjumanida Kembrij universitetidan Timoti Gowers , AlphaProofning javoblarini belgilashda yordam bergan, sun'iy intellektning ishlashi hayratlanarli ekanligini va muammolarga odamlarga o'xshash tarzda javob berish uchun "sehrli kalitlar" topilganini aytdi. "Men bu sehrli kalitlar, ehtimol, u qila oladigan narsadan biroz yuqoriroq bo'ladi deb o'yladim, shuning uchun dastur haqiqatan ham bu kalitlarni topganida, bu juda ajablanib bo'ldi", dedi Gowers.
AlphaProof shaxmat va Go bo‘yicha eng yaxshi odamlarni mag‘lub eta oladigan Google DeepMind’ning avvalgi sun’iy intellektiga o‘xshash ishlaydi . Ushbu sun'iy intellektlarning barchasi mustahkamlovchi o'rganish deb ataladigan sinov va xato yondashuviga tayanadi, bu erda tizim ko'plab urinishlar orqali muammoni hal qilishning o'ziga xos usulini topadi. Biroq, bu usul AI tushunadigan va tekshirishi mumkin bo'lgan tilda yozilgan muammolarning katta to'plamini talab qiladi, IMOga o'xshash muammolarning aksariyati ingliz tilida yozilgan.
Bu muammoni hal qilish uchun DeepMinddagi Tomas Xubert va uning hamkasblari AI ularni qanday hal qilishni o'rganishi uchun ushbu muammolarni Lean deb nomlangan dasturlash tiliga tarjima qilish uchun Google-ning Gemini AI-dan, ChatGPT-ga o'xshash til modelidan foydalanganlar.
"Boshida u, ehtimol, eng oddiy muammolarni hal qila oladi va qiyinroq va qiyinroq muammolarga hujum qilish uchun oddiyroq muammolarni hal qilishdan o'rganadi", dedi Xubert matbuot anjumanida. Shuningdek, u o'z javoblarini Lean-da ishlab chiqaradi, shuning uchun ularni darhol to'g'ri deb tekshirish mumkin.

AlphaProofning ishlashi ta'sirli bo'lsa-da, u sekin ishlaydi, raqobatchilarga ruxsat berilgan uchta savol uchun 4,5 soat o'rniga ba'zi echimlarni topish uchun uch kungacha vaqt ketadi. Shuningdek, u raqamlarni sanash va tartibga solishni o'rganish bo'lgan kombinatorika bo'yicha ikkala savolga ham javob bera olmadi. "Biz hali ham bu nima uchun ekanligini tushunish ustida ishlayapmiz, bu bizni tizimni yaxshilashga olib keladi," deydi Google DeepMind'dagi Aleks Devis .
AlphaProof o'z javoblariga qanday etib borishi yoki u odamlar ishlatadigan matematik sezgilardan foydalanadimi yoki yo'qmi, aniq emas, dedi Gowers, ammo uning dalillarni Lean'dan ingliz tiliga tarjima qilish qobiliyati ularning to'g'riligini tekshirishni osonlashtiradi.
Natija ta’sirchan va muhim bosqichdir, deydi Avstraliyaning Sidney universitetidan Geordi Uilyamson . "Rasmiy dalillar bo'yicha mustahkamlashni o'rganishga ilgari ko'plab urinishlar bo'lgan va hech biri katta muvaffaqiyatga erishmagan."
AlphaProof kabi tizim ishlaydigan matematiklar uchun dalillarni ishlab chiqishda foydali bo'lishi mumkin bo'lsa-da, u hal qilinishi va ustida ishlanishi kerak bo'lgan muammolarni aniqlashda yordam bera olmaydi, bu tadqiqotchilarning ko'p vaqtini oladi, - deydi Yang-Xui Xe Londonda. Matematika fanlari instituti.
Xubertning aytishicha, uning jamoasi AlphaProof noto'g'ri javoblarni kamaytirish orqali Google'ning Gemini kabi katta til modellarini yaxshilashga yordam beradi deb umid qilmoqda.
XTX Markets savdo kompaniyasi IMOda oltin medalni qo'lga kiritishga qodir sun'iy intellekt uchun AI matematika olimpiadasi deb nomlangan 5 million dollar mukofot taklif qildi, ammo AlphaProof bunga loyiq emas, chunki u ommaga ochiq emas. "Biz DeepMindning yutuqlari ko'proq jamoalarni AIMO mukofotiga kirishga ilhomlantiradi deb umid qilamiz va, albatta, DeepMindning o'zlari ham ommaviy kirishni mamnuniyat bilan qabul qiladilar", deydi Aleks Gerko XTX Markets.

https://t.me/aopscommunity