OpenAI-nin o3 modeli gözlənildiyindən aşağı nəticə göstərdi

OpenAI dekabr ayında o3 modelini təqdim edərkən, şirkət bu modelin FrontierMath adlanan və mürəkkəb riyazi məsələlər toplusu üzrə sualların təxminən dörddə birini düzgün cavablandıra bildiyini iddia etmişdi.
Bu nəticə rəqabəti geridə qoymuşdu – çünki növbəti ən yaxşı model həmin məsələlərin cəmi 2%-ni düzgün cavablandıra bilmişdi.
Crossmedia.az xarici mediaya istinadən xəbər verir ki, əldə olunan bu rəqəm, çox güman ki, maksimum göstərici idi və bu, daha çox hesablama gücünə malik olan, lakin ötən həftə ictimaiyyətə təqdim edilən modeldən fərqli bir o3 versiyası ilə əldə olunmuşdu.
FrontierMath-ın arxasında duran tədqiqat institutu Epoch AI, cümə günü o3 modeli üzərində apardığı müstəqil sınaqların nəticələrini açıqladı. Epoch AI müəyyən etdi ki, o3 modeli təxminən 10% düzgün nəticə göstərib – bu isə OpenAI-nin iddia etdiyi ən yüksək göstəricidən xeyli aşağıdır.
Bu isə OpenAI-nin yalan danışdığını göstərmir, sadəcə, əvvəlki iddia ilə son nəticə arasında fərq olduğunu bildirir.
Zeynəb Yunuszadə
17:40 22.04.2025
Oxunuş sayı: 894