02.02.2026.
8:05
AI agenti pali na testu: Katastrofalni su u matematici, a evo i zašto
Istraživači su testirali najnaprednije AI modele i došli do poražavajućih rezultata.
Iako nas tehnološki giganti uveravaju da je budućnost u AI agentima koji će raditi umesto nas, novo istraživanje pokazuje da su ovi sistemi zapravo "operisani" od osnovne logike i matematike.
U svetu tehnologije trenutno ne postoji veći "hajp" od AI agenata. To nisu obični četbotovi sa kojima se dopisujete; to su sistemi koji bi trebalo da samostalno koriste vaš računar, plaćaju račune ili planiraju putovanja. Međutim, najnovija studija otkrila je njihovu "Ahilovu petu", a to je osnovna matematika.
Istraživači su testirali najnaprednije modele i došli do poražavajućih rezultata. Problem leži u tzv. akumulaciji grešaka. Pošto AI agenti funkcionišu tako što jedan veliki zadatak razbijaju na niz manjih koraka, svaka sitna greška u proračunu na početku dovodi do potpunog kolapsa cele operacije.
Kada bi agent dobio zadatak koji zahteva više od nekoliko logičkih koraka, šansa za uspeh bi drastično opadala. U prevodu, ako mu poverite da vam sračuna troškove i rezerviše hotel, lako se može desiti da ostanete i bez novca i bez smeštaja.
- Koristiće AI za pisanje zakona
- AI kreira malver brže nego ikad
- Znamo kada bi mogao da stigne, ali još ne znamo šta je
Još jedan problem koji je studija istakla jeste to što ovi sistemi često "zaborave" šta je bio prvobitni cilj. Dok pokušavaju da reše jedan pod-zadatak, agenti se neretko zaglave u besmislenim ponavljanjima (loop) ili počnu da generišu potpuno nebitne podatke, gubeći nit onoga što je korisnik zapravo tražio.
"Performanse su često bile katastrofalne čim bi se u jednačinu uvela malo kompleksnija logika," navodi se u izveštaju koji prenosi Futurism.
Ovo istraživanje je svojevrsni "hladan tuš" za kompanije kao što su Microsoft, Google i OpenAI. Dok se oni utrkuju ko će pre izbaciti pametnijeg asistenta, realnost je da ovi sistemi i dalje ne razumeju svet oko sebe na način na koji to radi ljudski mozak.
Za sada, savet je jasan: nemojte dozvoliti veštačkoj inteligenciji da vam vodi poslovne knjige ili rešava domaći iz matematike bez detaljne provere.
Komentari 0
Pogledaj komentare Pošalji komentar