Jön a szóalapú internet?

Olyan megoldást készített egy hazai fejlesztőcsapat, amelynek segítségével hatékonyan lehet keresni az interneten fellelhető audiotartalmak között.

Az első pillantásra ötletesnek, de nem túl jelentősnek tűnő lépés mögött sokkal több van, mint gondolnánk: az új módszer lehetővé teszi, hogy a jövőben a hang- és videoanyagok legyenek az internetes információtárolás és -megosztás első számú eszközei.

A világháló ma jellemzően "nyomtatott" (azaz írott szöveges) formában tárolja az információkat. Ennek - az emberi kultúra nyomtatáshoz kötődő hagyományain túl - kizárólag gyakorlati okai vannak: mindeddig kizárólag a nyomtatott szövegben lehetett megfelelő hatékonysággal keresni. Márpedig az internetes világban az információgyűjtés legfontosabb csatornája a kulcsszavas keresés: a keresőprogramok "motorjai" a szövegben megbújó szavak alapján tallóznak a dokumentumokban (de ugyanígy működik a Google képkeresője vagy a YouTube videotára is: ezeket is az álló-, illetve mozgóképekhez biggyesztett kulcsszavak alapján találják meg a keresőprogramok).

Ugyanakkor az emberi kultúra digitális lenyomatainak egyre jelentősebb hányada nem nyomtatott formában keletkezik. Az előadásokról, vitákról, beszélgetésekről sokkal könynyebb hang- és képfelvételt készíteni, a zeneszámok, klipek, filmek, rádió- és tévéműsorok pedig már eleve ebben az utóbbi formában születnek (és ugyanígy rögzítik például a műtéteket, a bírósági tárgyalásokat, a parlamenti üléseket stb.). Keresgélni (az interneten keresztül) viszont csak akkor lehet bennük, ha valaki előzőleg elkészíti és digitalizálja a nyomtatott átiratot. Hiába van meg például a közszolgálati tévécsatornák legtöbb műsora a tévék online archívumában, ezeket csak a cím vagy a dátum alapján lehet visszakeresni, a tartalmi keresés nagyon nehézkesen működik.

A Digital Natives Kft. a Műegyetem kutatóival együttműködve most olyan beszédfelismerő szoftvert fejlesztett ki, amely közvetlenül a hang-, illetve a videoanyagokban (azaz a mellé írt kulcsszavak, az ún. tagek nélkül) is el tudja végezni a kulcsszavas keresést. A fejlesztők egy kulcsrakész alkalmazást mutattak be, amely a mai formájában bármilyen létező film- vagy hangarchívumhoz csatlakoztatható. Alapesetben a kulcsszavas keresés eredménye egy film- vagy hangfelvétel, amelynek lejátszása - ha a linkjére rákattintunk - onnan indul, ahol a keresőszó a szövegben először elhangzik.

Hasonló, a nagyközönség számára is elérhető megoldása pillanatnyilag csak a Google-nak van, ám az is meglehetősen szűk körben használható: az amerikai elnökválasztással foglalkozó videók anyagában lehet keresni, kizárólag angol nyelven. A magyar alkalmazás elvileg bármilyen állomány átnézésére képes, igaz, egyelőre csak magyarul tud. A beszédfelismerő "szókészlete" jelenleg mintegy 200 ezer magyar szóból és kifejezésből áll, ezeket a szoftver körülbelül 90 százalékos hatékonysággal használja.

A szolgáltatás a tervek szerint a későbbiekben más nyelveken, illetve kibővített (például összetett tartalomelemzési) feladatok megoldására is használható lesz. (H. M.)

Top cikkek
Érdemes elolvasni
Vélemény
NOL Piactér

Tisztelt Olvasó!

A nol.hu a továbbiakban archívumként működik, a tartalma nem frissül, és az egyes írások nem kommentelhetőek.

Mediaworks Hungary Zrt.