
Süni zəka dünyanın 30 ən yaxşı riyaziyyatçısını az qala geridə qoyub
Süni İntellekt
15.07.2025
Emil
May ayının ortalarında Kaliforniya ştatının Berkli şəhərində 30 tanınmış riyaziyyatçı OpenAI şirkətinə məxsus o4-mini adlı çat-botun riyazi qabiliyyətlərini sınamaq üçün bir araya gəlib. 2 gün ərzində onlar bu süni zəkanı professor səviyyəsində suallarla sınağa çəkiblər və müəyyən ediblər ki, bu süni zəka sistemi son dərəcə çətin riyazi məsələləri həll edə bilir və artıq dünyanın ən yaxşı magistratura tələbələrinin əksəriyyətini qabaqlayır. Böyük dil modelləri (BDM) cümlədə növbəti sözün nə olacağını proqnozlaşdırma qabiliyyətinə malikdirlər. Lakin bir çox digər BDM-lərlə müqayisədə, o4-mini və onun Gemini 2.5 Flash kimi analoqları daha güclü möhkəmləndirici öyrənmə ilə xüsusi məlumat bazaları üzərində təlimləndirilib. Bu yanaşma çat-botu ənənəvi BDM-lərlə müqayisədə daha mürəkkəb riyazi məsələlərə dərindən nüfuz edə biləcək səviyyəyə çatdırmağa imkan verir.

OpenAI şirkəti o4-mini modelinin inkişaf səviyyəsini ölçmək üçün müstəqil təşkilat olan Epoch AI-ya daha əvvəl heç vaxt dərc olunmamış 300 riyazi məsələdən ibarət bir tapşırıq toplusu hazırlamağı tapşırıb. Müasir böyük dil modelləri artıq mürəkkəb riyazi suallara doğru cavablar verə bilirlər, lakin Epoch AI tərəfindən seçilmiş bu suallar ən qabaqcıl modellər üçün belə çətin olub - onların heç biri 6-dan çox tapşırıq həll edə bilməyib, yəni 2%-lik nəticəni aşa bilməyiblər. Lakin o4-mini tamamilə fərqli, radikal nəticə göstərib. Epoch AI tərəfindən dəvət olunmuş Elliot Glazer-in rəhbərlik etdiyi tədqiqat 2024-cü ilin sentyabrında başlayıb. o4-mini üçün nəzərdə tutulmuş 300 riyazi tapşırıq bakalavriat, magistratura və tədqiqat səviyyəsi olmaqla 3 çətinlik dərəcəsinə bölünüb. 2025-ci ilin aprel ayına qədər Glazer müəyyən edib ki, o4-mini bu tapşırıqların təxminən 20%-ni həll edə bilir.

Dördüncü səviyyə isə hətta riyaziyyat professorları üçün belə çətin olan tapşırıqlardan ibarət olub. Tədqiqatda iştirak etmiş alimlər bu sualların model tərəfindən vaxtından əvvəl öyrənilməsinin və ya təsadüfi sızmanın qarşısını almaq məqsədilə məxfilik sazişi imzalamalı olublar. 17-18 may tarixlərində təcrübənin iştirakçıları Berklidə toplaşıb o4-mini-nin son sual blokuna necə cavab verəcəyini yoxladılar. 30 alim 6 nəfərlik qruplara bölünmüşdü. 2 gün ərzində onlar bir-birilə yarışaraq elə tapşırıqlar hazırlamağa çalışdılar ki, həm özləri onları həll edə bilsinlər, həm də çat-botu çaşdırsınlar. Sonda alimlər çat-botu çıxılmaz vəziyyətə salan 10 sual tapa bilsələr də, süni zəkanın 1 il ərzində nə qədər irəlilədiyi onları heyrətləndirdi. London Riyaziyyat Elmləri İnstitutunun alimi və layihənin iştirakçılarından biri olan Yang Hui He o4-mini-nin səviyyəsini ən azı çox savadlı bir magistrantla müqayisə edib.

O bildirib ki, çat-bot həll tapma sürəti baxımından peşəkar riyaziyyatçıdan əhəmiyyətli dərəcədə üstündür: orada ki, insan ekspertə həll üçün həftələr və ya aylar lazım olardı, model bu işi cəmi bir neçə dəqiqəyə yerinə yetirirdi. Süni zəkanın irəliləyişi texnologiyaya heyranlıqla yanaşı, narahatlıq da doğurur. Tədqiqat iştirakçıları o4-mini-nin nəticələrinə istifadəçilərin həddindən artıq güvənməsindən narahat olduqlarını ifadə ediblər. “İnduksiya ilə sübut var, əksini sübut etmə üsulu var, bir də qorxu ilə sübut üsulu var. Əgər kimsə bir şeyi kifayət qədər inamla deyirsə, insanlar sadəcə etiraz etməyə çəkinirlər. Məncə, o4-mini artıq qorxu ilə sübutu mənimsəyib - o hər şeyi böyük inamla deyir” - deyə Yang Hui He bildirib. Tədqiqatın sonunda iştirakçılar riyaziyyatın gələcəyi barədə düşünməyə başlayıblar. Müzakirələr “beşinci səviyyə” adlandırılan məsələlərə keçib - bu, hətta ən yaxşı riyaziyyatçıların belə həll edə bilmədikləri suallardır. Əgər süni zəka bu səviyyəyə çatsa, riyaziyyatçıların rolu kəskin şəkildə dəyişəcək. Bu baxımdan, riyaziyyatın gələcək nəsillər üçün qorunub saxlanmasının əsas açarı ali təhsildə yaradıcılığın inkişafı olacaq.
Paylaş
Bənzər xəbərlər

Süni İntellekt
Çin mənşəli yeni süni zəka modeli ChatGPT və Deepseek-i geridə qoyub
Çinin süni zəka startapı Moonshot AI bu həftə məşhur Kimi çat-botunu yaratdıqdan sonra açıq mənbəli böyük dil modeli olan Kimi K2-ni təqdim edib.

Süni İntellekt
Çinli hərbçilər hərbi robotların təhlükələri barədə xəbərdarlıq ediblər
Keçən əsrin fantast-yazıçılarının düşüncələri bu gün üçün olduqca aktual görünə bilər - xüsusilə də aparıcı dövlətlərin bədənə sahib süni zəka sistemlərinin yaradılması sahəsində yarışdıqları bir dövrdə. Çin Xalq Azadlıq Ordusunun rəsmi qəzetində (PLA Daily) dərc olunmuş analitik məqalənin müəllifləri, amerikalı yazıçı-fantast Isaac Asimov-un “Robototexnikanın 3 Qanunu”na istinad edərək, hərbi sahədə insanabənzər robotların kütləvi istehsalına başlamazdan əvvəl onların üzərində etik və hüquqi araşdırmalar aparmağa çağırırlar.

Süni İntellekt
Məşhur mütəxəssis: "Süni zəka hamını deyil, yalnız müəyyən insanları güclü edəcək"
Süni zəka sahəsində dünyanın aparıcı mütəxəssislərindən biri, Google Brain-in qurucusu və Coursera-nın həmtəsisçisi Andrew Ng, ümumi süni zəka (AGI) ilə bağlı narahatlıqların böyük dərəcədə şişirdildiyini bəyan edib.

Proqram Təminatı
Windows 11-ə ayarlar ilə kömək edəcək süni zəka agenti əlavə edilib
Microsoft süni zəka əsaslı funksiyaları Windows 11 əməliyyat sisteminə aktiv şəkildə inteqrasiya etməyə davam edir. Bu dəfə tərtibatçılar Settings tətbiqinə süni zəka agentini əlavə ediblər, bu da istifadəçilərə fərqli parametrləri daha asan tapmaq və onları proqram platformasının işini optimallaşdırmaq üçün tənzimləmək imkanı verəcək.

Süni İntellekt
OpenAI-nin açıq mənbəli süni zəka modeli yenidən təxirə salınıb
OpenAI bu yay artıq ikinci dəfədir ki, açıq mənbəli süni zəka modelinin təqdimatını təxirə salır. Bu barədə şirkətin baş direktoru Sam Altman məlumat verib. Əvvəlcə modelin bu həftə təqdim olunması planlaşdırılırdı, lakin indi təhlükəsizliklə bağlı əlavə testlər aparmaq üçün təqdimatın qeyri-müəyyən vaxta qədər təxirə salınmasına qərar verilib.
Ən çox oxunanlar

Samsung Galaxy Z Fold 7, Z Flip 7 və Z Flip 7 FE təqdim olunub - QİYMƏTİ
