Hugging Face je postao najveća platforma za velike jezične modele, no njegova popularnost privukla je i cyber kriminalce.
Na primarni online repozitorij za generativnu umjetnu inteligenciju Hugging Face ubačene su tisuće datoteka koje sadrže skrivene kodove. Oni mogu “otrovati” podatke i krasti informacije, uključujući i tokene koji se korsite za plaćanje onima koji upravljaju AI-jem i cloudom, kažu istraživači sigurnosti.
Istraživači iz startupova za sigurnost ProtectAI, Hiddenlayer i Wiz već mjesecima upozoravaju na učitavanje ovih “zlonamjernih modela” na stranice Hugging Facea, koja sada sadrži više od milion modela dostupnih za preuzimanje.
“Stari virusi Trojanci koji su pokušavali skrivećki ubacivati zlonamjerne kodove u vaše sustave prilagodili su se eri umjetne inteligencije,” kaže Ian Swanson, osnivač i izvršni direktor Protect AI-ja. Njegov startup ranije ove godine počeo je skenirati Hugging Face i pronašao više od 3.000 zlonamjernih datoteka.
Lažni profili
Neki od ovih zlonamjernih aktera čak i otvaraju lažne profile na Hugging Faceu, predstavljajući se kao Meta ili druge tehnološke kompanije i mame nepažljive korisnike da preuzimaju njihov sadržaj, kaže Swanson. Analiza Hugging Facea otkrila je veliki broj lažnih računa koji su se predstavljali kao Facebook, Visa, SpaceX ili Ericsson.
Jedan model, koji je lažno tvrdio da pripada startupu za testiranje genoma 23AndMe, preuzet je nekoliko tisuća puta prije nego je uhvaćen, kaže Swanson. Upozorio je kako taj model nakon preuzimanja može “krenuti u lov” na lozinke kojima se mogu ukrasti resursi s clouda. Hugging Face model je nakon upozorenja izbrisao, piše Forbes.
Sada je repozitorij u svoju platformu integrirao alat Protect AI-ja koji skenira datoteke u potrazi za zlonamjernim kodovima, pokazujući korisnicima rezultate pretrage prije nego oni išta preuzmu.
Iz kompanije za Forbes kažu kako su od početka 2022. godine počeli provjeravati profile velikih kompanija poput Nvidije i OpenAI-ja. U novembru 2021. su počeli skenirati datoteke koje se koriste za obučavanje velikih jezižnih modela. “Nadamo se da će naša suradnja s Protect AI-jem, ali i mnogim drugima, pomoći u izgradnji povjerenja kako bi dijeljenje i usvajanje strojnog učenja postalo lakše,” rekao je Julien Chaumond, izvršni tehnološki direktor Hugging Facea.
Ogroman rizik
Opasnost koju predstavljaju ovi modeli bila je tolika da je američka Agencija za kibernetičku sigurnost i sigurnost infrastrukture (NSA), zajedno s agencijama iz Velike Britanije i Kanade, u travnju izdala upozorenje o problemu. Agencije su upozorile tvrtke da pretraže modele i provjere sadržavaju li oni opasne kodove, kao i da ih aktiviraju samo podalje od ključnih sustava.
Hakeri koji su napali Hugging Face uglavnom ubacuju upute u kod kojeg developeri preuzimaju sa stranice, koristeći ga za preuzimanje kontrole nad modelom kada ga meta počne koristiti. “Ovo su klasični napadi, ali su skriveni unutar modela,” objašnjava Swanson. “Nitko ne može znati da model čini sve te zlokobne stvari i bilo bi iznimno teško pronaći krivca.”
Vrijednost Hugging Facea procijenjena je na 4,5 milijardi dolara u avgustu 2023. godine, kada je tvrtka prikupila 235 miliona dolara investicija. Ovaj osmogodišnji startup osnovali su Clement Delangue, Julien Chaumond i Thomas Wolf. U početku je bio chatbot aplikacija za mlade, a 2018. godine prerastao je u platformu za strojno učenje. Do danas su od investitora prikupili 400 miliona dolara, a neki ga nazivaju i Githubom za AI istraživače.
“Dugo vremena je umjetna inteligencija bila zanimljiva samo istraživačima i sigurnosne prakse bile su vrlo rudimentarne,” kaže Chaumond. “Kako naša popularnost raste, raste i broj potencijalno zlonamjernih aktera koji žele napasti AI zajednicu.”