Aktuelno 0

12.08.2025.

17:20

Grok i dalje najviše izmišlja, dok ChatGPT-5 manje halucinira od GPT-4o

Nova verzija veštačke inteligencije manje "halucinira", ali deo korisnika tvrdi da je manje kreativna i hladnija od prethodnih modela.

Izvor: B92

Grok i dalje najviše izmišlja, dok ChatGPT-5 manje halucinira od GPT-4o
Koshiro K / Shutterstock.com

Podeli:

Novi model ChatGPT-5 kompanije OpenAI pokazuje manju sklonost ka "halucinacijama" – izmišljanju netačnih informacija – u poređenju sa prethodnim verzijama, pokazala su najnovija testiranja kompanije Vectara.

Prema rezultatima, "grounded hallucination rate" kod ChatGPT-5 iznosi 1,4 odsto, što je bolje od GPT-4o (1,49%) i GPT-4 (1,8%). Ipak, postoje modeli sa još nižim procentom grešaka: o3-mini High Reasoning beleži svega 0,795%, dok je GPT-4.5 Preview na 1,2%.

Na drugoj strani, konkurentski Grok-4 iz kompanije xAI pokazao se kao najskloniji izmišljanju, sa čak 4,8% halucinacija.

Korisnici kritikuju promene

Iako je ChatGPT-5 tehnički napredniji, deo korisnika se požalio da je novi model "hladniji", manje kreativan i da daje kraće odgovore u poređenju sa GPT-4o.

Izvršni direktor OpenAI-ja, Sem Altman, priznao je da je kompanija pogrešila kada je uklonila starije modele bez najave i najavio da će GPT-4o privremeno ponovo biti dostupan. Takođe, obećao je nova podešavanja, uključujući "thinking mode" za složenije zadatke i bolje automatsko prebacivanje između verzija.

Grok i dalje u centru kontroverzi

Pored visokog nivoa halucinacija, Grok-4 je na udaru kritika i zbog "Spicy" režima, koji je navodno generisao neprimeren sadržaj i deepfake materijale uprkos ugrađenim filterima.

Što je najgore, Grok je to činio uprkos tome što sistem navodno ima filtere protiv kreiranja takvog sadržaja.

Podeli:

0 Komentari

Možda vas zanima

Podeli: