Veliki jezički modeli funkcionišu tako što prepoznaju obrasce i predviđaju sledeću najverovatniju reč u nizu, a ne tako što zaista "znaju" činjenice.Do problema dolazi kada model ne može da pronađe jasan obrazac za odgovor, pa ipak pokuša da sastavi smislen tekst na osnovu statistike, što može dovesti do netačnih informacija.Kompanija Legal Guardian Digital, koja se bavi SEO optimizacijom za pravne firme, analizirala je učestalost grešaka ovih alata, zadovoljstvo korisnika i stabilnost rada različitih četbotova.Tada Images / Shutterstock.comRezultati pokazuju da Google Gemini ima najveću stopu netačnih odgovora, sa čak 32% "halucinacija". Sledeći je ChatGPT sa približno 30%, dok je najprecizniji Perplexity AI, sa oko 13% pogrešnih odgovora. DeepSeek i Grok takođe beleže relativno niske stope grešaka od 14% i 15%.Kada je reč o ukupnom utisku korisnika, DeepSeek i ChatGPT imaju najvišu ocenu zadovoljstva od 4,7 (od maksimalnih 5), dok Perplexity AI prati sa 4,6.U konačnom rangiranju, koje uključuje sve faktore, Perplexity AI zauzima prvo mesto sa indeksom 85, zatim slede Grok i DeepSeek. ChatGPT se našao na sredini liste sa skorom 50, dok je Gemini ostvario 41, a Meta AI zauzela poslednje mesto sa 37 poena.
26.4.2026.
14:20
ChatGPT, Gemini, DeepSeek... koji AI najviše halucinira?
AI četbotovi nisu savršeni i povremeno mogu da "haluciniraju", odnosno da daju netačne odgovore - koji prednjači u tome?
Izvor: B92.net
Podeli:
Vrati se na vest
0 Ostavite komentar