Süni zəka dünyanın 30 ən yaxşı riyaziyyatçısını az qala geridə qoyub

Süni İntellekt

15.07.2025

Emil

May ayının ortalarında Kaliforniya ştatının Berkli şəhərində 30 tanınmış riyaziyyatçı OpenAI şirkətinə məxsus o4-mini adlı çat-botun riyazi qabiliyyətlərini sınamaq üçün bir araya gəlib. 2 gün ərzində onlar bu süni zəkanı professor səviyyəsində suallarla sınağa çəkiblər və müəyyən ediblər ki, bu süni zəka sistemi son dərəcə çətin riyazi məsələləri həll edə bilir və artıq dünyanın ən yaxşı magistratura tələbələrinin əksəriyyətini qabaqlayır. Böyük dil modelləri (BDM) cümlədə növbəti sözün nə olacağını proqnozlaşdırma qabiliyyətinə malikdirlər. Lakin bir çox digər BDM-lərlə müqayisədə, o4-mini və onun Gemini 2.5 Flash kimi analoqları daha güclü möhkəmləndirici öyrənmə ilə xüsusi məlumat bazaları üzərində təlimləndirilib. Bu yanaşma çat-botu ənənəvi BDM-lərlə müqayisədə daha mürəkkəb riyazi məsələlərə dərindən nüfuz edə biləcək səviyyəyə çatdırmağa imkan verir.

OpenAI şirkəti o4-mini modelinin inkişaf səviyyəsini ölçmək üçün müstəqil təşkilat olan Epoch AI-ya daha əvvəl heç vaxt dərc olunmamış 300 riyazi məsələdən ibarət bir tapşırıq toplusu hazırlamağı tapşırıb. Müasir böyük dil modelləri artıq mürəkkəb riyazi suallara doğru cavablar verə bilirlər, lakin Epoch AI tərəfindən seçilmiş bu suallar ən qabaqcıl modellər üçün belə çətin olub - onların heç biri 6-dan çox tapşırıq həll edə bilməyib, yəni 2%-lik nəticəni aşa bilməyiblər. Lakin o4-mini tamamilə fərqli, radikal nəticə göstərib. Epoch AI tərəfindən dəvət olunmuş Elliot Glazer-in rəhbərlik etdiyi tədqiqat 2024-cü ilin sentyabrında başlayıb. o4-mini üçün nəzərdə tutulmuş 300 riyazi tapşırıq bakalavriat, magistratura və tədqiqat səviyyəsi olmaqla 3 çətinlik dərəcəsinə bölünüb. 2025-ci ilin aprel ayına qədər Glazer müəyyən edib ki, o4-mini bu tapşırıqların təxminən 20%-ni həll edə bilir.

Dördüncü səviyyə isə hətta riyaziyyat professorları üçün belə çətin olan tapşırıqlardan ibarət olub. Tədqiqatda iştirak etmiş alimlər bu sualların model tərəfindən vaxtından əvvəl öyrənilməsinin və ya təsadüfi sızmanın qarşısını almaq məqsədilə məxfilik sazişi imzalamalı olublar. 17-18 may tarixlərində təcrübənin iştirakçıları Berklidə toplaşıb o4-mini-nin son sual blokuna necə cavab verəcəyini yoxladılar. 30 alim 6 nəfərlik qruplara bölünmüşdü. 2 gün ərzində onlar bir-birilə yarışaraq elə tapşırıqlar hazırlamağa çalışdılar ki, həm özləri onları həll edə bilsinlər, həm də çat-botu çaşdırsınlar. Sonda alimlər çat-botu çıxılmaz vəziyyətə salan 10 sual tapa bilsələr də, süni zəkanın 1 il ərzində nə qədər irəlilədiyi onları heyrətləndirdi. London Riyaziyyat Elmləri İnstitutunun alimi və layihənin iştirakçılarından biri olan Yang Hui He o4-mini-nin səviyyəsini ən azı çox savadlı bir magistrantla müqayisə edib.

O bildirib ki, çat-bot həll tapma sürəti baxımından peşəkar riyaziyyatçıdan əhəmiyyətli dərəcədə üstündür: orada ki, insan ekspertə həll üçün həftələr və ya aylar lazım olardı, model bu işi cəmi bir neçə dəqiqəyə yerinə yetirirdi. Süni zəkanın irəliləyişi texnologiyaya heyranlıqla yanaşı, narahatlıq da doğurur. Tədqiqat iştirakçıları o4-mini-nin nəticələrinə istifadəçilərin həddindən artıq güvənməsindən narahat olduqlarını ifadə ediblər. “İnduksiya ilə sübut var, əksini sübut etmə üsulu var, bir də qorxu ilə sübut üsulu var. Əgər kimsə bir şeyi kifayət qədər inamla deyirsə, insanlar sadəcə etiraz etməyə çəkinirlər. Məncə, o4-mini artıq qorxu ilə sübutu mənimsəyib - o hər şeyi böyük inamla deyir” - deyə Yang Hui He bildirib. Tədqiqatın sonunda iştirakçılar riyaziyyatın gələcəyi barədə düşünməyə başlayıblar. Müzakirələr “beşinci səviyyə” adlandırılan məsələlərə keçib - bu, hətta ən yaxşı riyaziyyatçıların belə həll edə bilmədikləri suallardır. Əgər süni zəka bu səviyyəyə çatsa, riyaziyyatçıların rolu kəskin şəkildə dəyişəcək. Bu baxımdan, riyaziyyatın gələcək nəsillər üçün qorunub saxlanmasının əsas açarı ali təhsildə yaradıcılığın inkişafı olacaq.

Paylaş

openai

artificial intelligence

openai o4 mini

suni zeka

suni intellekt

Bənzər xəbərlər