Okostelefonok szópárbaja

Új frontot talált magának az Apple és az Android: a legközelebbi csatát vélhetően a beszédvezérlésű alkalmazások területén vívják egymással. Az elvben akár a felhasználói szokások teljes átalakítására is képes újdonság képességei eddig kezdetlegesek voltak, mára azonban talán megértek rá a feltételek, hogy az írás mellett (vagy helyett) hang és a beszéd legyen az ember-gép kommunikáció fő csatornája.

1998-ban, azaz 13 évvel ezelőtt, a mobil-forradalom előjátéka idején a Samsung bemutatott egy apró, kinyitható készüléket, amelyben egyebek között a hangvezérlés is a beépített opciók között volt A mini-mobil mai szemmel nézve nem tudott túl sokat (az adott korban viszont kimondottan nagytudásúnak számított), ugyanakkor a legfontosabb funkcióit hanggal is lehetett vezérelni. Ehhez először meg kellett ismerkednie a felhasználó hangjával és kiejtésével: nem úgy általában a szöveget, hanem a bediktált neveket-számokat-utasításokat értette meg, azokat is főként akkor, ha a gazda hangján szólaltak meg.

Az iPhone 4S. Kívülről nem sokat változott
Staff members try iPhone 4S at an Apple store in Tokyo October 14, 2011. Apple Inc's latest iPhone went on sale in stores across the globe on Friday, with fans snapping up the final gadget unveiled during Steve Jobs' lifetime, many buying the phone as a tribute to the former Apple boss. Hundreds of fans queued around city blocks in Tokyo to be the first to get their hands on the iPhone 4S, which looks similar to the previous iPhone 4 but has a better camera, faster processor and well-received voice activated software. REUTERS/Kim Kyung-Hoon (JAPAN - Tags: BUSINESS SCIENCE TECHNOLOGY)

Azóta közel másfél évtized telt el, és a hangvezérlésnek sem a valódi rendetetését, sem a problémamentes működésmódját nem sikerült megtalálni. Az átlagos felismerési arány (a jelenleg a felhasználói piacon lévő alkalmazásoknál) a 70 százalékot közelíti – ennyit az említett ős-Samsung is tudott. Az érintőképernyős készülékek pedig egy időre zárójelbe tették az egész irányzatot: az ikonok bökdösésénél látszólag nincs egyszerűbb parancsbeviteli mód.

Csakhogy a valóságban a hangvezérlés "univerzálisabb": egyrészt a látásukban vagy mozgásukban korlátozottak is használhatják, másrészt pedig – és a jövőben ez lehet a fő előnye – nem kell hozzá elővenni a készüléket, sőt fizikai kezelőfelületre sincs szükség (hogy ez utóbbi milyen sokat ér, azt mindenki könnyen el tudja képzelni, aki már ügyetlenkedett mondjuk egy karórába épített mobillal). Ha van használható hangvezérlés, akkor a telefon – egy apró kijelzővel – tényleg elfér az órában vagy a golyóstollban, a fogyasztása a jelenlegi szint töredékére csökkenhet, a töltést pedig megoldhatja egy napelem, vagy (mint az automata óráknál) a karunk mozgása.

A legújabb iPhone-ban már lesz (vagy inkább van) ilyen kiterjesztett hangvezérlési funkció: nem csak az alap-utasításkészletet tudja, hanem a telefonon tárolt zeneszámok között, sőt az interneten is keresgélhetünk a segítségével. Az Apple ugyanis a közelmúltban a fejlesztőgárdával együtt felvásárolt egy apró, de az adott területen abszolút élvonalbeli céget, a Sirit, és annak fejlesztéseit nem különálló alkalmazásként telepítette a gépre, hanem beépítette az operációs rendszerbe (ugyanúgy, ahogy korábban a multi-touch kezelést). A telefon nem csak utasításokat fogad el a beszélőtől, de - logikai értelemben – kérdésekre is válaszol: megadja a szóban kezdeményezett keresési vagy számítási művelet eredményét, azaz válaszolni is tud hangban, és megérti a beszéd bizonyos összefüggéseit. Igaz, erre egyelőre csak angolul, németül képes, de a nyelvtudás a jövőben gyorsan bővül majd.

Az okostelefon azért vált megfelelő platforrmá a hangvezérléshez, mert a készülékeken immár kényelmesen elférnek a hatalmas hangminta-adatbázisok, és a műveletvégzési sebességük is elegendő ahhoz, hogy a válasz valós idejűnek tűnjön. Ez természetesen nem csak az iPhone-ra igaz: a hírek szerint a következő Android-verzió is "teljes értékű" (multifunkciós, "betanítás" nélkül is működő és öntanító) beszédvezérléssel érkezik majd, és állítólag hasonló megoldáson dolgozik a Microsoft is – olyannyira, hogy a nyilvános adatok szerint az utóbbinak a legjobb, 80 százalék fölötti a felismerési aránya.

Top cikkek
Érdemes elolvasni
Vélemény
NOL Piactér

Tisztelt Olvasó!

A nol.hu a továbbiakban archívumként működik, a tartalma nem frissül, és az egyes írások nem kommentelhetőek.

Mediaworks Hungary Zrt.