Kompanija xAI, koju vodi Elon Musk, predstavila je novu, revolucionarnu verziju svoje umjetne inteligencije – Grok 4! Tvrde da će Grok 4 u mnogim disciplinama, pa čak i u rješavanju kompleksnih zadataka, nadmašiti ljudske sposobnosti. Razvojni tim to s ponosom naziva prekretnicom u svijetu AI-ja.
Grok 4 s lakoćom prolazi akademske testove poput Scholastic Assessment Testa (SAT) i Graduate Record Examination (GRE) s najboljim ocjenama. Međutim, za prave "teškaše" xAI nudi i verziju "Grok 4 Heavy" – varijantu s znatno većom procesorskom snagom.
U ovoj "Heavy" verziji, više AI agenata istovremeno radi na istom zadatku. Oni upoređuju svoja rješenja i dogovaraju se o najboljem rezultatu. xAI tvrdi da Grok 4 Heavy tako uspješno rješava oko 44,4 posto pitanja iz izuzetno teškog testa zvanog "Humanity's Last Exam" – što je znatno više od konkurencije. Za usporedbu, sljedeći najbolji model, Gemini 2.5 Pro, postiže samo 21,6 posto, a OpenAI-jev o3 20,3 posto.
"Humanity’s Last Exam" (Posljednji ispit čovječanstva) je izuzetno zahtjevan test, osmišljen s ciljem da se istraže granice sposobnosti trenutnih AI sistema. Kreirali su ga Center for AI Safety (CAIS) i Scale AI, a obuhvaćta 3.000 pitanja iz preko 100 različitih stručnih područja, uključujući matematiku, prirodne nauke, humanistiku i informatiku. Pitanja su kreirali stručnjaci iz više od 500 institucija širom svijeta.
Šta ovaj test čini tako posebnim?
Najviši nivo težine: Pitanja zahtijevaju dubinsko stručno znanje i kompleksno logičko razmišljanje.
Multimodalni zadaci: Pored tekstualnih pitanja, postoje i zadaci s slikama, dijagramima i drugim formatima.
Stroga evaluacija: Većina pitanja ima jasne, provjerljive odgovore za objektivno mjerenje performansi.
Ova "heavy" verzija dostupna je u novoj pretplati za 300 dolara mjesečno i namijenjena je prvenstveno aplikacijama visoke kompleksnosti, poput istraživanja, simulacija ili prognoza.
U jednoj ekonomskoj simulaciji, Grok 4 je upravljao radom automata za prodaju. AI je koordinirao skladišta, narudžbe i cijene, a prema pružatelju usluga, ostvario je veći profit od ostalih modela. U istraživanju, filtrirao je najrelevantniju hipotezu iz miliona skupova podataka – znatno brže od konvencionalnih metoda.
Elon Musk vjeruje da će Grok 4 uskoro razviti nove tehnologije, a moguće su čak i otkrića u fizici. Ključno će biti hoće li se te ideje održati u stvarnosti – odnosno, hoće li biti korisne i provedive.