Egyre több hangvezérelt eszköz létezik, például az Apple HomePod, a Google Home és az Amazon Echo. Ennek oka az, hogy a hang interfészek javítják a felhasználói élményt, sőt, a comScore (marketing kutató cég) úgy véli, hogy a hang 2020-ig az összes keresés 50% -át végrehajtja.
Az öt legnagyobb technológiai vállalat, a Microsoft, a Google, az Amazon, az Apple és a Facebook fejlesztette ki (vagy jelenleg fejleszti) hangkompatibilis AI asszisztenseket.
Függetlenül attól, hogy a VUI-ról (Voice User Interface), a webes alkalmazásokról vagy az intelligens otthoni hangszórókról beszélünk, a hang-interakciók egyre gyakoribbá válnak a mai technológiában, különösen mivel sok ember fáradtságát éli úgy, hogy sok órát a képernyő előtt tartanak.
Tehát lássuk, hogyan lehet megtervezni a felhasználói felhasználói felületeket, és hogy mi legyen az anatómiai hangutasításoknak.
Ha online oldalakat olvas a háziasszonyokról, észreveszi, hogy egyesek szoros kapcsolatot alakítanak ki a hangszórójukkal oly módon, hogy inkább kedvtelésből tartott állatoknak, mint termékeknek tűnjenek.
Bizonyára nem felel meg az összes vásárlói elvárásnak a még folyamatban lévő programokkal, de kiindulási pontként követhet néhány irányelvet.
A grafikus felhasználói felület megmutatja a felhasználóknak mindent, amit megtehetnek. A hang interfésznek nincs módja megmutatni a felhasználó számára, hogy milyen lehetőségek állnak rendelkezésre, és az új felhasználók elvárásaikat az emberi beszélgetések tapasztalataira alapozzák.
Ezért azzal kezdhetnek, hogy valamit kérnek, amelynek nincs értelme a rendszernek, vagy ami nem lehetséges. Ennek megoldása a felhasználói interakció lehetőségeinek felkínálása.
Például a hang interfész mondhat valamit, például: "Segítek vásárolni" vagy "tudok információkat adni a termékekről".
Mindenesetre a felhasználók számára is biztosítani kell a funkciók egyszerű kivezetését, ideértve az „exit" lehetőséget is.
A grafikus felületeken a felhasználók láthatják, hogy melyik szakaszban vannak, míg a hang felhasználói felületeknél a felhasználóknak tudniuk kell, milyen funkciókat használnak.
A felhasználók gyorsan megzavarhatják a beszélgetés helyét, vagy tévedésből aktiválhatják a funkcionalitást, ezért további meghallgatás nélkül több részletre van szükségük.
Az interfésznek meg kell válaszolnia egy termékkel kapcsolatos kérdést egy olyan teljes mondattal, mint például: "Az X márka és az X modell autója 20 000 dollárba kerül, és 2 évre garantált."
Ez lehetővé teszi a felhasználók számára, hogy tudják, milyen funkciókat használnak, és miről beszélnek a beszélõ.
Amikor az emberek beszélnek, gyakran nem fejezik ki teljes szándékukat, mert szlengt, muffint, rövidített szavakat stb. Használnak.
Az emberek között megértjük egymást, de a hang interfészeknek szükségük van arra, hogy az ember kifejezetten kifejezze magát, hogy megértse szándékait.
Ezen felül, minél több információ áll a szándékukkal kapcsolatban a felhasználót egy mondatban, annál jobb.
A felhasználó kérdezheti: "Adjon nekem információkat a rendelkezésre álló autókról, kérjük, kérjük az X modell árát", és azonnal megkapja a kívánt információt, ahelyett, hogy először mondaná: „Információkat akarok a rendelkezésre álló autókról", majd kérdezi a modellt .
Lehet, hogy a felhasználók nem veszik észre ezt a működési módot, ezért a lehető legtöbb példát kell használnia az interakciókra.
Amikor a felhasználók vizuális tartalmat vagy listákat böngésznek, visszatérhetnek az információkhoz, amelyeket figyelmen kívül hagytak vagy elfelejtettek.
A verbális tartalom esetében ez nem a helyzet. Verbális tartalommal a mondatokat rövidnek kell tartani.
Ajánlott, hogy az interakciónak háromnél több különféle lehetősége legyen.
Használjon valamilyen egyszerű visszajelzést, hogy a felhasználó tudja, hogy a rendszer hallgat.
Használjon némi vizuális információt, hogy a felhasználók tudják, hogy a hang felhasználói felülete hallgat, és a felhasználó azonnal láthatja, hogy az általa beszélt felvétel történik (hasonlóan, amikor másokkal beszélgetünk, és a nem verbális kommunikáció révén láthatjuk, hogy hallgatnak) ).
A párbeszéd folyamatának megteremtése előtt a tervezőknek először meg kell érteniük a hangutasítás anatómiáját. A felhasználó hangutasítása három kulcsfontosságú tényezőből áll: szándék, deklaráció és szóköz. Elemezzük a következő kérést: "Játsszon pihentető zenét aludni".
A szándék a felhasználó hangutasításának szélesebb célját képviseli. A példakérelemben a szándék egyértelmű, a felhasználó zenét akar hallgatni.
Hogyan fogalmazza meg a felhasználó a parancsot, azaz az utasítást. Az alkalmazott példában tudjuk, hogy a felhasználó pihentető zenét akar játszani a "play" szónak köszönhetően, de ez nem az egyetlen módja annak mondaására. A felhasználó azt is mondhatja: "Zenét akarok hallgatni".
A beszélgetés-tervezőknek figyelembe kell venniük a kifejezés minden variációját.
Időnként a szándék önmagában nem elegendő, és több felhasználói információra van szükség a kérés teljesítéséhez.
Ezt "kontextusnak" nevezzük, és ezek, akárcsak a vizuális interfészek, opcionálisak vagy szükségesek lehetnek az alkalmazás kitöltéséhez.
Ebben az esetben a "pihentető" szó felhasználhatja a "zene lejátszása" kontextust arra, hogy megismerje, hogy pihentető zene lejátszását kéri.
A kiváló hang felhasználói felületek megtervezéséhez elegáns módon kell megtalálnia a releváns információkat a felhasználók számára anélkül, hogy túlterhelné őket.
A hangfelhasználói interakció bizonyos szempontból több kihívást jelenthet, mint a vizuális rendszer, azonban nem kétséges, hogy egy interakciós módot fognak egyre inkább használni.