Okostelefonok szópárbaja
1998-ban, azaz 13 évvel ezelőtt, a mobil-forradalom előjátéka idején a Samsung bemutatott egy apró, kinyitható készüléket, amelyben egyebek között a hangvezérlés is a beépített opciók között volt A mini-mobil mai szemmel nézve nem tudott túl sokat (az adott korban viszont kimondottan nagytudásúnak számított), ugyanakkor a legfontosabb funkcióit hanggal is lehetett vezérelni. Ehhez először meg kellett ismerkednie a felhasználó hangjával és kiejtésével: nem úgy általában a szöveget, hanem a bediktált neveket-számokat-utasításokat értette meg, azokat is főként akkor, ha a gazda hangján szólaltak meg.
Azóta közel másfél évtized telt el, és a hangvezérlésnek sem a valódi rendetetését, sem a problémamentes működésmódját nem sikerült megtalálni. Az átlagos felismerési arány (a jelenleg a felhasználói piacon lévő alkalmazásoknál) a 70 százalékot közelíti – ennyit az említett ős-Samsung is tudott. Az érintőképernyős készülékek pedig egy időre zárójelbe tették az egész irányzatot: az ikonok bökdösésénél látszólag nincs egyszerűbb parancsbeviteli mód.
Csakhogy a valóságban a hangvezérlés "univerzálisabb": egyrészt a látásukban vagy mozgásukban korlátozottak is használhatják, másrészt pedig – és a jövőben ez lehet a fő előnye – nem kell hozzá elővenni a készüléket, sőt fizikai kezelőfelületre sincs szükség (hogy ez utóbbi milyen sokat ér, azt mindenki könnyen el tudja képzelni, aki már ügyetlenkedett mondjuk egy karórába épített mobillal). Ha van használható hangvezérlés, akkor a telefon – egy apró kijelzővel – tényleg elfér az órában vagy a golyóstollban, a fogyasztása a jelenlegi szint töredékére csökkenhet, a töltést pedig megoldhatja egy napelem, vagy (mint az automata óráknál) a karunk mozgása.
A legújabb iPhone-ban már lesz (vagy inkább van) ilyen kiterjesztett hangvezérlési funkció: nem csak az alap-utasításkészletet tudja, hanem a telefonon tárolt zeneszámok között, sőt az interneten is keresgélhetünk a segítségével. Az Apple ugyanis a közelmúltban a fejlesztőgárdával együtt felvásárolt egy apró, de az adott területen abszolút élvonalbeli céget, a Sirit, és annak fejlesztéseit nem különálló alkalmazásként telepítette a gépre, hanem beépítette az operációs rendszerbe (ugyanúgy, ahogy korábban a multi-touch kezelést). A telefon nem csak utasításokat fogad el a beszélőtől, de - logikai értelemben – kérdésekre is válaszol: megadja a szóban kezdeményezett keresési vagy számítási művelet eredményét, azaz válaszolni is tud hangban, és megérti a beszéd bizonyos összefüggéseit. Igaz, erre egyelőre csak angolul, németül képes, de a nyelvtudás a jövőben gyorsan bővül majd.
Az okostelefon azért vált megfelelő platforrmá a hangvezérléshez, mert a készülékeken immár kényelmesen elférnek a hatalmas hangminta-adatbázisok, és a műveletvégzési sebességük is elegendő ahhoz, hogy a válasz valós idejűnek tűnjön. Ez természetesen nem csak az iPhone-ra igaz: a hírek szerint a következő Android-verzió is "teljes értékű" (multifunkciós, "betanítás" nélkül is működő és öntanító) beszédvezérléssel érkezik majd, és állítólag hasonló megoldáson dolgozik a Microsoft is – olyannyira, hogy a nyilvános adatok szerint az utóbbinak a legjobb, 80 százalék fölötti a felismerési aránya.