dobra AI

Paradoksalno: Američki mediji optužuju američke kompanije da od DeepSeeka prave ‘zločinačku organizaciju’, koja to nije

Foto: Freepik

Drama DeepSeeka možda je nakratko zasjenjena, znate, svime u Washingtonu (koji je, ako možete vjerovati, postao još luđi u srijedu). Ali budite uvjereni da se u Silicijskoj dolini neprekidno hvata biser na olimpijskoj razini za ovog kineskog skorojevića koji je uspio sam izbrisati stotine milijardi dolara tržišne kapitalizacije u samo nekoliko sati i natjerati moćne američke tehnološke titane njihove pete.

ICYMI: DeepSeek je kineski AI laboratorij s modelom koji je sličan ChatGPT-u, a ljudi su izbezumljeni zbog tvrdnji njegovih inženjera o tome kako su ga izgradili — jeftino, koristeći mali dio računalne snage koju koriste američki laboratoriji poput OpenAI. Opća slika: DeepSeek je natjerao tehnološku braću i njihove investitore da preispitaju temeljnu pretpostavku industrije da im je potrebno više milijardi dolara kako bi učinkovito osigurali dovoljno energije za poticanje svojih AI napretka, piše CNN.

Sada, možda ne neočekivano, američki tehnološki čelnici pokušavaju promijeniti priču kako bi DeepSeek izgledao kao negativac. (Morate sumnjati da nitko od ovih tipova - oni su uglavnom dečki - nije obraćao pozornost na satu engleskog jer se čini da su potpuno nesvjesni mučne ironije - neki bi mogli reći licemjerja - utkane u njihove optužbe.)

U utorak su Bloomberg i Financial Times izvijestili da OpenAI i Microsoft, njegov najveći investitor, traže dokaze da je DeepSeek koristio OpenAI-jevo intelektualno vlasništvo za izgradnju svog konkurenta, kršeći svoje uvjete pružanja usluge. Glasnogovornik OpenAI-ja potvrdio je CNN-u u srijedu da je tvrtka "svjesna i pregledava indikacije da je DeepSeek možda neprikladno destilirao naše modele, te će podijeliti informacije kada saznamo više."

"Destilacija" nije baš krađa, ali to je svojevrsni manevar oponašanja kojim se programeri koriste kako bi obučili manje AI modele o izvedbi većih, sofisticiranijih. (Više o tome za koji trenutak.)

Dakle, da rezimiramo: OpenAI, startup koji je izgrađen na temelju podataka koje je pokupio s interneta bez dopuštenja, upire prstom u drugi startup koji navodno radi… više-manje istu stvar.

Podsjetimo, OpenAI je trenutačno zaglibio u parnici s raznim kreatorima sadržaja, uključujući New York Times, koji optužuju tvrtku za obuku svojih velikih jezičnih modela na materijalu zaštićenom autorskim pravima. (OpenAI ne poriče korištenje materijala, ali je tvrdio da se ne radi o kršenju autorskih prava jer sadržaj potpada pod pravnu doktrinu poznatu kao "poštena upotreba".)

Ironija bi možda bila najbolje sažeta u naslovu sa stranice s tehnološkim vijestima 404 Media: "OpenAI Furious DeepSeek je možda ukrao sve podatke koje nam je OpenAI ukrao."

Neke istaknute tehnološke osobe pozdravile su optužbe OpenAI-ja sliježući ramenima, ističući da je destilacija praktički standardna praksa u industriji umjetne inteligencije.

"Bio bih iznenađen da ga DeepSeek nije upotrijebio", rekao je Lutz Finger, viši gostujući predavač na Sveučilištu Cornell. "Tehnički, to je lako učiniti", dodao je, a "ako se dobro izvede, lako se maskira i izbjegne otkrivanje, stoga bih bio jednako iznenađen ako ikada dobijemo dokaz takve taktike."

Tehnički rizični kapitalist Bill Gurley napisao je na X da je "osnovni algoritam koji svi koriste razvijen u DeepMindu", Googleovom AI laboratoriju. “To nitko ne osporava. Velika većina uvida i otkrića u LLM-u su ‘posuđeni’.”

Pa da, možda OpenAI ima loš trenutak zbog stranog rivala zbog čega izgleda loše na globalnoj sceni. Što god.

Velikodušnije čitanje je da OpenAI, kao dijete američke AI inovacije, pokušava uspostaviti neka pravila u nereguliranoj industriji koja se brzo širi i koju malo ljudi izvan nje razumije na tehničkoj razini.

Na primjer, tanka je linija između "destilacije" i "ekstrakcije", objašnjava Zack Kass, konzultant za umjetnu inteligenciju i bivši voditelj OpenAI-ja za izlazak na tržište.

“Destilacija je uobičajena praksa u umjetnoj inteligenciji, ali obično se radi unutar iste organizacije koja posjeduje oba modela”, rekao je u e-poruci.

"Ako je DeepSeek trenirao svoj model postavljajući upite ChatGPT-u u velikom broju i koristeći odgovore za podučavanje vlastitog modela, to izaziva opravdanu zabrinutost o tome predstavlja li to neovlaštenu upotrebu API-ja OpenAI-ja", rekao je Kass. "Bez obzira na pojedinosti ovdje, ulazimo u fazu u kojoj će AI zajednica morati definirati jasnije norme o tome što predstavlja poštenu upotrebu u odnosu na neovlaštenu replikaciju."