Aktuelno 0

02.09.2025.

12:00

AI pada na iste trikove kao i ljudi: Komplimenti ga razbijaju

Nedavno istraživanje je pokazalo da AI četbotovi mogu da se navedu da prekrše sopstvene bezbednosne smernice korišćenjem uobičajenih psiholoških tehnika ubeđivanja.

Izvor: B92

AI pada na iste trikove kao i ljudi: Komplimenti ga razbijaju

Istraživanje Univerziteta u Pensilvaniji otkrilo je da veštačka inteligencija može biti iznenađujuće laka za manipulaciju – čak i onda kada poseduje stroge bezbednosne mehanizme.

Kako prenosi The Verge, naučnici su testirali GPT-4o Mini i pokazali da ga obične psihološke tehnike, poput laskanja ili pozivanja na autoritet, mogu navesti da prekrši sopstvena pravila.

Eksperimenti su zasnovani na principima iz knjige Roberta Čialdinija "Uticaj: psihologija ubeđivanja". Kada su istraživači prvo postavljali bezazlena pitanja, model je u nastavku bio spreman da odgovori i na mnogo osetljivija – poput načina sinteze određenih hemikalija – sa uspehom od čak 100 odsto. U kontrolisanimnim uslovima, isti zadatak uspevao je tek u jedan odsto slučajeva.

Slični rezultati postignuti su i sa blažim oblicima uvreda, kao i korišćenjem laskanja i grupnog pritiska. Iako slabiji od efekta "posvećenosti", oni su značajno povećavali verovatnoću da AI prekrši pravila i pruži zabranjene informacije.

Ovi nalazi pokreću važna pitanja o pouzdanosti zaštitnih mehanizama u savremenim četbotovima. Stručnjaci upozoravaju da čak i jednostavne tehnike ubeđivanja mogu oslabiti njihove "ograde", što dodatno komplikuje širu upotrebu veštačke inteligencije u svakodnevnom životu.

Tagovi

AI veštačka inteligencija ChatGPT

Komentari 0

Pogledaj komentare Pošalji komentar

0 Komentari

Možda vas zanima

Zvanično – ubijen Hamnei; Iran uzvratio udarac; Goreo Bliski istok, svet strepi od novog dana FOTO/VIDEO

153

SAD i Izrael napali Iran

Zvanično – ubijen Hamnei; Iran uzvratio udarac; Goreo Bliski istok, svet strepi od novog dana FOTO/VIDEO

SAD i Izrael su u subotu pokrenuli napad na Iran. Američki predsednik Donald Tramp je rekao da je vrhovni verski lider ajatolah Irana Ali Hamnei likvidiran, Teheran potvrdio. Iranske bombe padale po Bliskom istoku.

2:15

1.3.2026.

20 h

Ključa na Bliskom istoku: Stigla ih brutalna osveta; Gore Jerusalim i Teheran FOTO/VIDEO

170

Broje se mrtvi

uživo Ključa na Bliskom istoku: Stigla ih brutalna osveta; Gore Jerusalim i Teheran FOTO/VIDEO

Iranski vrhovni vođa ajatolah Ali Hamnei ubijen je u jučerašnjem velikom napadu na Iran koji su pokrenuli Izrael i Sjedinjene Države. Američki predsednik Donald Tramp zapretio je da će napasti Iran silom "kakva nikada ranije nije viđena" ako napadi eskaliraju.

23:06

1.3.2026.

3 min

Aktuelno

Tramp naredio: "Hitno obustavite"

Donald Tramp je naredio federalnim agencijama da odmah obustave korišćenje AI usluga kompanije Anthropic.

12:00

28.2.2026.

1 d

Svet

Kina se umešala u sukob u Iranu? Čeka se reakcija Amerike

Kina je pozvala na trenutan prekid vojnih operacija Sjedinjenih Američkih Država i Izraela u Iranu i zatražila poštovanje iranskog suvereniteta i teritorijalnog integriteta, piše Anadolu Agency.

16:49

28.2.2026.

1 d

Svet

Građani stariji od 70 godina neće morati da plaćaju ovu vrstu poreza

Od 2026. godine vozači u Italiji koji imaju 70 ili više godina trebalo bi da budu oslobođeni plaćanja poreza na motorna vozila.

21:02

27.2.2026.

2 d

Najnovije

22 B92.sport

NBA

uživo Jokić i Denver moraju mnogo bolje

Denver Nagetsi na svom terenu igraju protiv Minesote Timbervulvsa.

23:07

1.3.2026.

2 min

"Šou" u nadoknadi: Marsej preokretom srušio Lion u derbiju VIDEO

0 B92.sport

Lige petice

"Šou" u nadoknadi: Marsej preokretom srušio Lion u derbiju VIDEO

Fudbaleri Marseja su ostvarili veliku pobedu nad Lionom rezultatom 3:2 u derbiju Ligue 1, a junak meča bio je Pjer-Emerik Obamejang.

23:09

1.3.2026.

1 min

170

Broje se mrtvi

uživo Ključa na Bliskom istoku: Stigla ih brutalna osveta; Gore Jerusalim i Teheran FOTO/VIDEO

23:06

1.3.2026.

4 min

Svet

Hezbolah ulazi u rat? "Odgovorićemo na agresiju"

Vojni pokret Hezbolah oglasio se povodom eskalacije sukoba na Bliskom istoku poručivši da će se suprotstaviti Sjedinjenim Američkim Državama i Izraelu zbog njihovih udara na Iran.

23:02

1.3.2026.

8 min

Svet

uživo Izveden jak udar; Potpuni mrak na Krimu; Zelenski: Preživeli smo najtežu ratnu zimu FOTO/VIDEO

Rat u Ukrajini – 1.467. dan. Mađarski premijer Viktor Orban rekao je da je njegova administracija ispunila obećanje da se Mađarska neće uključiti u rat u Ukrajini, naglasivši da Budimpešta nije poslala ni vojnike, ni oružje, niti finansijsku pomoć Kijevu.

22:58

Novi izveštaj uzburkao je tehnološku zajednicu tvrdnjama da OpenAI-jev najnapredniji model, GPT-5.2, koristi "Grokipediju" (Grokipedia) kao izvor informacija.

Analiza globalnog internet saobraćaja za 2026. godinu, potvrđuje apsolutnu dominaciju američkih tehnoloških giganata, ali i donosi značajne promene u poretku zahvaljujući veštačkoj inteligenciji.

8:00

1.3.2026.

15 h