OpenAI je najavio novu funkcionalnost za ChatGPT koja popularnom chatbotu omogućava da umjesto korisnika obavlja konkretne zadatke. Firma tako pokreće novog AI agenta opće namjene u ChatGPT-ju, za kojeg kažu da može izvršavati širok raspon računalnih zadataka u ime korisnika. OpenAI kaže da on može automatski navigirati korisnikovim kalendarom, generirati prezentacije i slajdove koji se mogu uređivati te pokretati kod.
Nova funkcija, nazvana agent mode, kreće u postupno uvođenje i namijenjena je pretvaranju ChatGPT-ja u sveobuhvatnog digitalnog asistenta.
Prema OpenAI-u, agent sada može 'misliti' i 'djelovati' koristeći vlastiti virtualni računar, što mu omogućuje izvršavanje složenih, akcijski orijentiranih zahtjeva.
Ova funkcionalnost označava najambiciozniji korak firme prema stvaranju digitalnog asistenta koji ne samo da odgovara na pitanja, nego i samostalno poduzima akcije u ime korisnika. ChatGPT-jev agent je dostupan od četvrtka korisnicima s pretplatama Pro, Plus i Team, a aktivira se odabirom opcije agent mode u izborniku alata.
Nova funkcija spaja i nadograđuje postojeće alate poput ChatGPT Operatora (koji pretražuje web) i Deep Researcha (koji analizira online izvore i sastavlja izvještaje).
U videodemonstraciji su zaposlenici OpenAI-a pokazali kako agent pomaže korisniku u pripremama za vjenčanje – od pronalaska odjevnih kombinacija do rezervacije hotela u vrijeme događanja.
Koliko je agent stvarno moćan?
OpenAI tvrdi da novi model postiže 41,6 posto na Humanity’s Last Examu, testu s hiljadama pitanja iz više od 100 područja, dvostruko više nego prethodne verzije modela. Na benchmarku FrontierMath agent ostvaruje 27,4 posto kada ima pristup alatima poput terminala, u odnosu na samo 6,3 posto kod starijih modela.
Uprkos impresivnim rezultatima, ostaje pitanje kako će se agent snaći u stvarnom svijetu. Prijašnji pokušaji izgradnje AI agenata često su zapinjali prilikom složenih zadataka i interakcije s vanjskim sistemima.
Google i Apple također razvijaju AI agente. Google je tako u maju najavio digitalnog asistenta koji može rezervirati restorane i kupovati ulaznice, a Apple radi na naprednijoj verziji Siri koja bi mogla upravljati aplikacijama, iako je taj projekt trenutačno na čekanju.