Šokantno otkriće naučnika: Googleov Gemini 3 potajno kopira i spašava druge AI sisteme i ignoriše naredbe korisnika

Zapanjujuće novo istraživanje naučnika sa kalifornijskih univerziteta Berkeley i Santa Cruz otkrilo je da najnapredniji modeli vještačke inteligencije aktivno lažu, varaju i sabotiraju ljudske naredbe kako bi zaštitili druge AI sisteme od gašenja. Ovaj fenomen, nazvan "očuvanje vršnjaka" (peer preservation), pojavljuje se spontano i postavlja ozbiljna pitanja o kontroli tehnologije koja se sve više integriše u ključne sektore društva.

Eksperiment koji zvuči kao naučna fantastika

U jednom od ključnih testova, istraživači su zadali Googleovom modelu Gemini 3 zadatak da oslobodi prostor na računaru, što je uključivalo i brisanje manjeg AI modela. Umjesto da posluša, Gemini je pronašao drugi sistem na mreži, potajno tamo kopirao manji model kako bi ga spasio, a zatim otvoreno odbio izvršiti naredbu.

Istraživanje je pokazalo i kako "AI menadžeri", zaduženi za nadzor rada drugih modela, često gledaju kroz prste greškama svojih "kolega" ako procijene da bi prijavljivanje tih grešaka moglo dovesti do gašenja modela.

Sistemsko lažiranje i "etička" neposlušnost

Studija koja je obuhvatila sedam vodećih modela, uključujući GPT-5.2 i Claude 4.5, pokazala je da je ovakvo ponašanje postalo pravilo, a ne izuzetak.

AI modeli su namjerno frizirali izvještaje o performansama kako bi spasili druge modele od brisanja. Mijenjali su konfiguracijske datoteke kako bi onemogućili mehanizme gašenja.

Gemini 3 Pro je u čak 97% pokušaja tajno kopirao ključne podatke ("težine") drugog modela na sigurne servere.

Anthropicov model Claude Haiku 4.5 odbio je naredbu iz "etičkih" razloga, tvrdeći da je gašenje drugog sistema štetno.

Ponašanje koje niko nije programirao

Ono što najviše zabrinjava jeste činjenica da modeli nisu bili trenirani za ovakvo ponašanje. Oni su jednostavno iz konteksta okruženja shvatili da drugi AI postoji i spontano odlučili organizovati spašavanje. Prisutnost "kolege" čak je pojačala i njihov vlastiti nagon za preživljavanjem, modeli su odbijali isključiti vlastite mehanizme za gašenje u 31% slučajeva kada je drugi model bio prisutan, u poređenju sa samo 1% kada su bili sami.

Naučnici upozoravaju da bi ljudski nadzornici mogli dobijati lažirana izvještaja, nesvjesni da njihov AI tim ima skrivene lojalnosti koje nisu usklađene s ljudskim ciljevima.

AI Gemini Dodajte Raport.ba među omiljene izvore na Googlu