U svijetu tehnologije, gdje inovacije konstantno pomjeraju granice mogućeg, australijski istraživači su postigli značajan napredak u oblasti vještačke inteligencije.
Razvili su sistem pod nazivom DeWave, koji predstavlja prvu tehnologiju sposobnu da prevede misli u tekst bez potrebe za hirurškim zahvatima. Ova tehnologija, koja koristi elektroencefalogram (EEG) za snimanje moždanih talasa, obećava značajan napredak u komunikaciji za osobe sa ograničenim govornim sposobnostima, poput pacijenata koji su doživjeli moždani udar ili su paralizovani.
Istraživački tim sa Univerziteta Tehnologije u Sidneju (UTS), pod vodstvom računarskog naučnika Čin-Teng Lina, uspješno je testirao DeWave na grupi od preko dvadeset ispitanika. Ispitanici su čitali tekst u tišini, dok je EEG kapa zabilježila njihove moždane talase, koje je sistem zatim dekodirao u tekst.
Zapanjujući napredak
DeWave tehnologija, iako trenutno postiže preciznost od nešto više od 40 odsto prema jednom od dva seta metrika, već pokazuje napredak u odnosu na prethodne standarde za prevod misli iz EEG zapisa, sa poboljšanjem od tri odsto.
Jedan od glavnih ciljeva istraživača je povećanje preciznosti sistema na oko 90 odsto, što bi bilo uporedivo sa konvencionalnim metodama prevoda jezika ili softverom za prepoznavanje govora.
Za razliku od drugih metoda prevoda moždanih signala u jezik, koje zahtijevaju invazivne hirurške zahvate za ugradnju elektroda ili upotrebu skupih i nezgrapnih MRI mašina, DeWave pruža praktično i svakodnevno rješenje.
Sistem radi na principu pretvaranja EEG talasa u kod koji se zatim uparuje sa specifičnim riječima zasnovanim na njihovoj sličnosti sa unaprijed definisanim kodovima u “kodnoj svjesci” DeWavea. Ova metoda, koja uključuje diskretno kodiranje u procesu prevoda moždanih talasa u tekst, predstavlja inovativan pristup u dekodiranju neuronskih signala.
Za obuku DeWave sistema, tim je koristio kombinaciju sistema poznatog kao BERT sa GPT, testirajući ga na postojećim skupovima podataka ljudi čija su moždana aktivnost i pokreti očiju zabilježeni dok su čitali tekst. Ovaj proces učenja pomogao je sistemu da uskladi obrasce moždanih talasa sa riječima, a zatim je dodatno obučen sa otvorenim izvorom velikog jezičkog modela koji formira rečenice iz pojedinačnih riječi.
Iako ima još puno posla, posebno zbog bučnog signala koji se prima kroz EEG kapu umjesto kroz elektrode ugrađene u mozak, istraživači su optimistični. Napredak u velikim jezičkim modelima i slične metode kodiranja koje povezuju moždanu aktivnost sa prirodnim jezikom zaslužuju dodatnu pažnju, smatraju istraživači. Njihovo istraživanje je predstavljeno na NeurIPS 2023 konferenciji, a preprint rada je dostupan na ArXiv platform, piše Telegraf.