Halucinacije su fundamentalna mana u dizajnu AI chatbotova. Kada ChatGPT, Gemini, Copilot ili drugi AI modeli pružaju lažne informacije, bez obzira koliko uvjerljivo zvučale, to je halucinacija. AI može halucinirati manje odstupanje, naizgled bezazlenu grešku ili se upustiti u iznošenje klevetničkih i potpuno izmišljenih optužbi.
Bez obzira na ozbiljnost greške, one će se neizbježno pojaviti ako dovoljno dugo koristite ChatGPT ili njegove konkurente. Razumijevanje kako i zašto ovi sistemi mogu da pomiješaju vjerovatno sa istinitim je ključno za svakoga ko želi da komunicira sa vještačkom inteligencijom.
Pošto ovi sistemi generišu odgovore predviđajući koja bi sljedeća riječ trebalo da bude na osnovu obrazaca u podacima za obuku, umjesto da ih provjeravaju sa stvarnim činjenicama, oni mogu zvučati uvjerljivo stvarno, a da su potpuno izmišljeni. Caka je u tome da budete svjesni da se halucinacija može dogoditi u bilo kojem trenutku i da tražite tragove koji su skriveni pred vama.
Jedna od najiritantnijih stvari kod vještačkih halucinacija je to što one često uključuju naizgled specifične detalje. Izmišljeni odgovor može pominjati datume, imena i druge detalje koji mu daju izgled autentičnosti.
Pošto ChatGPT generiše tekst koji podsjeća na obrasce koje je naučio tokom obuke, može kreirati detalje koji odgovaraju strukturi validnog odgovora, a da nikada ne ukazuje na pravi izvor. Možete postaviti pitanje o osobi i vidjeti stvarne dijelove ličnih podataka o pojedincu pomiješane sa potpuno izmišljenom pričom.
Ova vrsta specifičnosti otežava uočavanje halucinacije, jer ljudi imaju tendenciju da vjeruju detaljnim izjavama. Međutim, ključno je provjeriti bilo koji od ovih detalja, što bi vam moglo stvoriti probleme ako se ispostavi da su netačni. Ako se datum, članak ili pomenuta osoba ne pojavljuju nigdje drugo, to je znak da možda doživljavate halucinaciju.
U vezi sa zamkom specifičnosti je pretjerano samouvjeren ton mnogih vještačkih halucinacija. ChatGPT i slični modeli su dizajnirani da predstave odgovore tečnim, autoritativnim tonom, i kako piše TechRadar, upravo to samopouzdanje može učiniti da dezinformacije djeluju vjerodostojno, čak i kada je osnovna tvrdnja neosnovana. Modeli vještačke inteligencije su optimizovani da predvide vjerovatne nizove riječi, tako da čak i kada treba da budu pažljivi u vezi sa onim što pišu, predstavit će informacije sa istom sigurnošću kao i tačne podatke.
Za razliku od ljudskog stručnjaka koji bi se mogao distancirati ili reći „Nisam siguran“, i dalje je neuobičajeno, iako češće, da model vještačke inteligencije kaže „Ne znam“. To je zato što sveobuhvatan odgovor nagrađuje privid potpunosti u odnosu na iskrenost u vezi sa neizvjesnošću.
U svakoj oblasti gdje sami stručnjaci izražavaju nesigurnost, trebalo bi očekivati pouzdan sistem koji će to odražavati. Na primjer, nauka i medicina često sadrže debate ili evoluirajuće teorije gdje su definitivni odgovori nedostižni. Ako ChatGPT odgovori kategoričnom izjavom o takvim temama, proglašavajući jedan uzrok ili univerzalno prihvaćenu činjenicu, to samopouzdanje bi zapravo moglo da signalizira halucinaciju, jer model popunjava prazninu u znanju izmišljenom pričom umjesto da ukazuje na područja spora.
Duhovi u citatima
Citati i reference su odličan način da se potvrdi vjerodostojnost onoga što ChatGPT navodi. Međutim, ponekad će pružiti ono što izgleda kao legitimne reference, osim što ti izvori zapravo ne postoje. Ova vrsta halucinacije je posebno problematična u akademskom ili profesionalnom kontekstu. Student može da napravi pregled literature na osnovu lažnih citata koji izgledaju savršeno formatirani, sa vjerodostojnim naslovima časopisa.
Kasnije se ispostavlja da je rad zasnovan na referencama koje se ne mogu pronaći u povjerljivim publikacijama. Uvijek provjerite da li se citirani rad, autor ili časopis mogu pronaći u renomiranim akademskim bazama podataka ili putem direktne online pretrage. Ako ime djeluje neobično specifično, ali ne vraća nikakve rezultate pretrage, veoma je vjerovatno da je u pitanju „fantomski citat“ koji je model kreirao da bi njegov odgovor zvučao autoritativno.
Kontradiktornosti unutar razgovora
Samouvjerene tvrdnje sa stvarnim referencama su odlične, ali ako ChatGPT proturječi samom sebi, nešto možda i dalje nije uredu. Zato su korisna dodatna pitanja. Pošto generativna vještačka inteligencija nema ugrađenu bazu podataka za konsultacije radi dosljednosti, može proturječiti samom sebi kada se dalje ispituje. Ovo je često očigledno kada postavite dodatno pitanje koje se fokusira na raniju tvrdnju.
Ako se noviji odgovor razlikuje od prvog na načine koji se ne mogu pomiriti, jedan ili oba odgovora su vjerovatno halucinacija. Srećom, ne morate tražiti dalje od samog razgovora da biste uočili ovaj indikator. Ako model ne može da održi dosljedne odgovore na logički povezana pitanja u istoj niti razgovora, originalni odgovor vjerovatno nije bio zasnovan na činjenicama.
Logika koja prkosi stvarnosti
Čak i ako unutrašnja logika nije kontradiktorna, logika ChatGPT-a i dalje može djelovati pogrešno. Ako je odgovor neskladan sa ograničenjima iz stvarnog svijeta, obratite pažnju. ChatGPT piše tekst predviđajući nizove riječi umjesto da primjenjuje stvarnu logiku, tako da ono što djeluje racionalno u rečenici može da se sruši kada se razmotri u stvarnom svijetu.
Obično počinje sa lažnim premisama. Na primjer, vještačka inteligencija može predložiti dodavanje nepostojećih koraka dobro uspostavljenom naučnom protokolu ili jednostavno kršenje zdravog razuma. Kao što se dogodilo sa Gemini-jem, model vještačke inteligencije je predložio upotrebu ljepila u sosu za picu kako bi se sir bolje zalijepio. Svakako bi se bolje zalijepio, ali što se tiče uputstava za kuhanje, to nije baš visoka kuhinja.
Halucinacije u ChatGPT-u i sličnim jezičkim modelima su nusproizvod načina na koji su ovi sistemi obučeni. Stoga je vjerovatno da će halucinacije postojati sve dok se vještačka inteligencija oslanja na predviđanje riječi. Trik za korisnike je da nauče kada da vjeruju rezultatu, a kada da ga provjere.
Prepoznavanje halucinacija sve više postaje ključna vještina digitalne pismenosti. Kako se vještačka inteligencija sve više koristi, logika i zdrav razum postat će ključni. Najbolja odbrana nije slijepo povjerenje, već informisano ispitivanje.