Jön a szóalapú internet?
Az első pillantásra ötletesnek, de nem túl jelentősnek tűnő lépés mögött sokkal több van, mint gondolnánk: az új módszer lehetővé teszi, hogy a jövőben a hang- és videoanyagok legyenek az internetes információtárolás és -megosztás első számú eszközei.
A világháló ma jellemzően "nyomtatott" (azaz írott szöveges) formában tárolja az információkat. Ennek - az emberi kultúra nyomtatáshoz kötődő hagyományain túl - kizárólag gyakorlati okai vannak: mindeddig kizárólag a nyomtatott szövegben lehetett megfelelő hatékonysággal keresni. Márpedig az internetes világban az információgyűjtés legfontosabb csatornája a kulcsszavas keresés: a keresőprogramok "motorjai" a szövegben megbújó szavak alapján tallóznak a dokumentumokban (de ugyanígy működik a Google képkeresője vagy a YouTube videotára is: ezeket is az álló-, illetve mozgóképekhez biggyesztett kulcsszavak alapján találják meg a keresőprogramok).
Ugyanakkor az emberi kultúra digitális lenyomatainak egyre jelentősebb hányada nem nyomtatott formában keletkezik. Az előadásokról, vitákról, beszélgetésekről sokkal könynyebb hang- és képfelvételt készíteni, a zeneszámok, klipek, filmek, rádió- és tévéműsorok pedig már eleve ebben az utóbbi formában születnek (és ugyanígy rögzítik például a műtéteket, a bírósági tárgyalásokat, a parlamenti üléseket stb.). Keresgélni (az interneten keresztül) viszont csak akkor lehet bennük, ha valaki előzőleg elkészíti és digitalizálja a nyomtatott átiratot. Hiába van meg például a közszolgálati tévécsatornák legtöbb műsora a tévék online archívumában, ezeket csak a cím vagy a dátum alapján lehet visszakeresni, a tartalmi keresés nagyon nehézkesen működik.
A Digital Natives Kft. a Műegyetem kutatóival együttműködve most olyan beszédfelismerő szoftvert fejlesztett ki, amely közvetlenül a hang-, illetve a videoanyagokban (azaz a mellé írt kulcsszavak, az ún. tagek nélkül) is el tudja végezni a kulcsszavas keresést. A fejlesztők egy kulcsrakész alkalmazást mutattak be, amely a mai formájában bármilyen létező film- vagy hangarchívumhoz csatlakoztatható. Alapesetben a kulcsszavas keresés eredménye egy film- vagy hangfelvétel, amelynek lejátszása - ha a linkjére rákattintunk - onnan indul, ahol a keresőszó a szövegben először elhangzik.
Hasonló, a nagyközönség számára is elérhető megoldása pillanatnyilag csak a Google-nak van, ám az is meglehetősen szűk körben használható: az amerikai elnökválasztással foglalkozó videók anyagában lehet keresni, kizárólag angol nyelven. A magyar alkalmazás elvileg bármilyen állomány átnézésére képes, igaz, egyelőre csak magyarul tud. A beszédfelismerő "szókészlete" jelenleg mintegy 200 ezer magyar szóból és kifejezésből áll, ezeket a szoftver körülbelül 90 százalékos hatékonysággal használja.
A szolgáltatás a tervek szerint a későbbiekben más nyelveken, illetve kibővített (például összetett tartalomelemzési) feladatok megoldására is használható lesz. (H. M.)