Kineska kompanija za umjetnu inteligenciju DeepSeek odgodila je objavu svog novog AI modela nakon što ga nije uspjela obučiti koristeći Huaweijeve čipove, čime je naglasila ograničenja koja Kina ima u pronalasku adekvatnih zamjena za američku tehnologiju.
Prema riječima tri izvora upoznata s pitanjem, vlasti su potaknule DeepSeek da, nakon što je u januaru predstavio svoj model R1, usvoji Huaweijev Ascend procesor umjesto Nvidijinih sistema.
Međutim, kineski start-up je naišao na tehničke probleme tokom procesa obuke svog modela R2 koristeći te čipove, što ga je natjeralo da upotrijebi Nvidijine čipove za treniranje AI sistema, a Huaweijeve za proces zaključivanja. Obuka podrazumijeva učenje modela iz velikih skupova podataka, dok se zaključivanje odnosi na fazu korištenja obučenog modela za predviđanje ili generisanje odgovora, poput odgovora chatbota.
Problemi su bili glavni razlog zbog kojeg je majska objava modela odgođena, što je kompaniju koštalo prednosti u odnosu na konkurente, rekao je izvor upoznat sa situacijom.
Poteškoće na koje je DeepSeek naišao pokazuju da kineski čipovi još uvijek zaostaju za američkim u ključnim zadacima, naglašavajući izazove s kojima se Kina suočava u nastojanju da postane tehnološki samodostatna. Financial Times je ove sedmice izvijestio da je Peking zatražio od kineskih tehnoloških kompanija da opravdaju svoje narudžbe Nvidijinog H20, kako bi ih potaknuo na promovisanje Huaweijevih i Cambriconovih alternativa.
Insajderi iz industrije tvrde da su kineski čipovi nestabilni, imaju sporiju povezanost i lošiji softver u poređenju s Nvidijinim proizvodima.
Huawei je poslao tim inženjera u sjedište DeepSeeka kako bi pomogli kompaniji da iskoristi Ascend čip za razvoj modela R2, rekle su dvije osobe. Uprkos prisustvu stručnog tima, DeepSeek nije uspio provesti uspješnu obuku na Ascend čipu.
DeepSeek i dalje sarađuje s Huaweijem kako bi Ascend čipovi postali kompatibilni i za zaključivanje.