Šta su to 'halucinacije' i zašto su AI chatbotovi ponekad puni dezinformacija

Googleova nova opcija pretraživanja AI Overviews postala je metom brojnih kritika zbog toga što nudi činjenično netočne i zavaravajuće odgovore na upite.

Opcija pokrenuta prije dvije sedmice prikazuje na vrhu stranice sažetak odgovora na uobičajena pitanja u Googleovoj tražilici, a koje pribavlja iz različitih izvora širom weba. Trebala bi pritom pomoći pri pronalaženju odgovora na složenija pitanja.

Umjesto toga, predlaže da se sir ljepilom zalijepi na pizzu ako se odlijepi, sugerira konzumaciju kamenja radi poboljšavanja zdravlja i ponavlja više puta opovrgnute teorije zavjere, poput one da je bivši američki predsjednik Barack Obama musliman.

Nije jedina sklona takvom ponašanju. Istraživanje koje je proveo startup Vectara, prenosi Euronews, otkrilo je da roboti za brbljanje temeljeni na umjetnoj inteligenciji izmišljaju informacije između tri i 27 posto vremena.

Veliki jezični modeli (large language models, LLM), koji pokreću chatbotove kao što su OpenAI-jev ChatGPT i Googleov Gemini, uče predvidjeti odgovor na temelju obrazaca koje promatraju. Model izračunava najvjerovatnije sljedeće riječi za odgovor na vaše pitanje na temelju onoga što se nalazi u njihovoj bazi podataka.

Ali ponekad podaci o obuci modela mogu biti nepotpuni ili pristrani, što dovodi do netačnih odgovora, a to se kolokvijalno naziva halucinacijama. Prema Googleu, više je razloga zbog kojih se one događaju.

To bi mogli biti nedostatni podaci o obuci koje koristi model, netočne pretpostavke ili skrivene pristranosti u informacijama koje upotrebljava chatbot. Google je identificirao nekoliko vrsta halucinacija umjetne inteligencije, poput netočnih predviđanja događaja, lažno pozitivnih rezultata identificiranjem nepostojećih prijetnji i lažnih negativnih rezultata.

U Googleu priznaju da halucinacije mogu imati značajne posljedice. Naprimjer, zdravstvena umjetna inteligencija može pogrešno detektirati benignu promjenu na koži kao malignu, što kao posljedicu može imati nepotreban medicinski zahvat ili tretman.

Nisu, doduše, sve halucinacije loše. Recimo, mogu biti korisne u kreativnim situacijama, pri stvaranju teksta ili slike. Pitanje je kako ih navesti na razlikovanje kreativnog od činjeničnog.

Tačnost odgovora svodi se na kvalitet skupa podataka s kojima se radi. Što je manje tačnih podataka, to će halucinacije biti vjerovatnije.

Trenutno modeli umjetne inteligencije koriste puno podataka s weba i drugih javno dostupnih podataka. OpenAI također sklapa ugovore s masovnim medijskim organizacijama kao što su Axel Springer i News Corp te publikacijama kao što je Le Monde za licenciranje njihovog sadržaja da bi mogli trenirati svoje modele na pouzdanijim podacima.

Nije, dakle, problem u količini (iako i ona igra ulogu), već u kvaliteti izvornih podataka. Taj će problem očito biti rješavan u hodu.

Postoji nekoliko tehnika koje Google preporučuje za usporavanje ovog problema, poput regularizacije, koja kažnjava model zbog ekstremnih predviđanja. To je moguće postići ograničavanjem broja mogućih ishoda koje može predvidjeti.

Treneri također mogu dati povratne informacije svom modelu, govoreći im što im se svidjelo, a što nije svidjelo u odgovoru, kako bi chatbotu pomogli naučiti što traže korisnici.

Umjetna inteligencija također bi trebala biti obučena na osnovi relevantnih informacija za ono što će raditi, poput korištenja skupa podataka medicinskih slika za dijagnosticiranje bolesti.

Firme s LLM-ovima mogle bi zabilježiti najčešće upite i zatim okupiti tim s pojedincima s različitim vještinama da bi smislili kako poboljšati svoje odgovore. Velike tvrtke s velikom računarskom snagom također bi mogle isprobati stvaranje vlastitih evolucijskih algoritama za poboljšanje pouzdanosti svojih modela.

U ovom pristupu modeli umjetne inteligencije haluciniraju ili izmišljaju podatke o obuci za druge modele s istinitim informacijama, već identificirane matematičkim jednadžbama. Ako se hiljade modela takmiče jedni protiv drugih u pronalaženju istinitosti, proizvedeni modeli bit će manje skloni halucinacijama.

Manje firme mogu se okušati u ručnom finom podešavanju podataka koje njihovi modeli smatraju pouzdanima ili istinitima na temelju vlastitog skupa standarda. To je radno intenzivnije i skuplje. Korisnici također trebaju biti svjesni toga da do halucinacija može doći i razumjeti koja su ograničenja umjetne inteligencije.

Šta su to ‘halucinacije’ i zašto su AI chatbotovi ponekad puni dezinformacija

Tužiteljstvo traži pritvor za sve uhapšene zbog pada nadstrešnice u Novom Sadu, među njima i bivši ministar

Mercedes-Benz otkrio detalje o novom benzinskom motoru

Sam Mendes ima ambiciozan projekt, snima četiri filma o “Beatlesima”

Danas sunčano i hladno. Evo šta nas čeka narednih dana

Sutra izbori u Rumuniji. Rastu šanse kandidata koji obožava Trumpa

Šta je zapravo Sebija Izetbegović ostavila na KCUS-u? Na računu je 58 miliona KM, ali se moraju vraćati njeni dugovi

Dok se slavi bod protiv Nizozemske, pojavile se mračne vijesti o “Zmajevima”: O ovome niko ne priča

Igrač kakav se u BiH više neće roditi: Lagao da je siromašan i da ima petero djece, a onda je sve ‘podmuklo’ naplatio

Haos na vaganju u Areni: Spahović napao Barbira

Demirović se poslije reprezentativne pauze vratio u Stuttgart. Tamo ga je dočekalo pravo iznenađenje

Slične vijesti

I Kinezi imaju svoj OpenAI, evo šta su ponudili

Deutsche bank ulaže u umjetnu inteligenciju

Američka vlada traži od Googlea da se riješi svojih popularnih proizvoda

ChatGPT lansirao vlastitu tražilicu i započeo rat s Googleom

Chrome će imati ugrađeni ESET antivirusni mehanizam za otkrivanje zlonamjernog softvera

Googleova umjetna inteligencija sada će moći pamtiti stvari o korisnicima

Gladijator II izazvao niz reakcija na mrežama, kritikuju ga zbog korištenja umjetne inteligencije

Sve se češće koristi: Da li je ChatGPT možda bolji od pretraživanja na Googleu?