वॉइस यूजर इंटरफेस कैसे डिजाइन करें

अधिक से अधिक ध्वनि-नियंत्रित उपकरण हैं, जैसे कि ऐप्पल होमपॉड, गूगल होम और अमेज़ॅन इको। ऐसा इसलिए है क्योंकि वॉइस इंटरफेस उपयोगकर्ता अनुभव को बेहतर बनाते हैं, वास्तव में, कॉमस्कोर (एक मार्केटिंग रिसर्च कंपनी) का मानना है कि 2020 तक आवाज़ सभी खोजों में से 50% को निष्पादित करेगी।

पांच सबसे बड़ी प्रौद्योगिकी कंपनियां, Microsoft, Google, Amazon, Apple और Facebook, ने (या वर्तमान में विकासशील) आवाज-सक्षम AI सहायकों का विकास किया है।

चाहे हम वेब एप्लिकेशन या स्मार्ट होम स्पीकर के लिए VUI (वॉयस यूजर इंटरफेसेस) के बारे में बात कर रहे हों, आज की तकनीक में वॉयस इंटरैक्शन तेजी से आम है, खासकर जब से कई लोग स्क्रीन के सामने कई घंटों तक थकान का अनुभव करते हैं।

तो, आइए देखते हैं कि वॉयस यूजर इंटरफेस कैसे डिजाइन किया जाए और एनाटॉमी वॉयस कमांड क्या होनी चाहिए।

कैसे आवाज इंटरफेस डिजाइन करने के लिए

यदि आप होम स्पीकर्स की ऑनलाइन समीक्षा पढ़ते हैं, तो आप देखेंगे कि कुछ लोग अपने स्पीकर के साथ इस तरह से घनिष्ठ संबंध बनाते हैं जो किसी उत्पाद की तुलना में पालतू जानवर की तरह दिखता है।

आप निश्चित रूप से अभी भी पूरी प्रगति पर हैं कार्यक्रमों के साथ सभी ग्राहक अपेक्षाओं को पूरा नहीं कर सकते हैं, लेकिन आप कुछ दिशानिर्देशों को प्रारंभिक बिंदु के रूप में पालन कर सकते हैं।

उपयोगकर्ताओं को वे क्या कर सकते हैं, इसकी जानकारी प्रदान करें

एक ग्राफिकल यूजर इंटरफेस उपयोगकर्ताओं को वे सब कुछ दिखाता है जो वे कर सकते हैं। एक वॉयस इंटरफ़ेस में उपयोगकर्ता को यह दिखाने का कोई तरीका नहीं है कि कौन से विकल्प संभव हैं, और नए उपयोगकर्ता मानवीय वार्तालापों के साथ अपने अनुभव पर अपनी उम्मीदों को आधार बनाते हैं।

इसलिए, वे किसी ऐसी चीज़ के लिए पूछकर शुरू कर सकते हैं जो सिस्टम के लिए कोई मतलब नहीं है या जो संभव नहीं है। इसका समाधान उपयोगकर्ता इंटरैक्शन विकल्पों की पेशकश करना है।

उदाहरण के लिए, वॉइस इंटरफ़ेस कुछ कह सकता है जैसे "मैं आपको खरीदने में मदद कर सकता हूं" या "मैं आपको उत्पादों के बारे में जानकारी दे सकता हूं"।

किसी भी स्थिति में, उपयोगकर्ताओं को एक सुविधा से बाहर का आसान तरीका प्रदान किया जाना चाहिए, जिसमें उनके विकल्पों में से एक के रूप में 'निकास' भी शामिल है।

पूरी जानकारी के साथ जवाब दें

ग्राफिकल इंटरफेस में उपयोगकर्ता देख सकते हैं कि वे किस सेक्शन में हैं, जबकि वॉयस यूजर इंटरफेस में उपयोगकर्ताओं को पता होना चाहिए कि वे किस कार्यक्षमता का उपयोग कर रहे हैं।

उपयोगकर्ता जल्दी से भ्रमित हो सकते हैं कि वे बातचीत में कहां हैं या गलती से कार्यक्षमता को सक्रिय कर सकते हैं, इसलिए, श्रवण से अधिक मार्गदर्शन के बिना, उन्हें अधिक विवरण की आवश्यकता होती है।

इंटरफ़ेस को एक पूरे वाक्यांश वाले उत्पाद के बारे में एक प्रश्न का उत्तर देना चाहिए जैसे "ब्रांड X और मॉडल X की कार की कीमत $ 20,000 है, और इसकी गारंटी 2 साल है।"

यह उपयोगकर्ताओं को यह जानने की अनुमति देता है कि वे किस कार्यक्षमता का उपयोग कर रहे हैं, और वक्ता किस बारे में बात कर रहा है।

जितना हो सके उतने उदाहरणों का उपयोग करें

जब लोग बोलते हैं, तो वे अक्सर अपने पूर्ण इरादों को व्यक्त नहीं करते हैं, कई बार क्योंकि वे कठबोली, मफिन, छोटे शब्दों आदि का उपयोग करते हैं।

मनुष्यों के बीच हम एक-दूसरे को समझते हैं, लेकिन आवाज के इंटरफेस को मानव को अपने इरादों को समझने के लिए खुद को सही ढंग से व्यक्त करने की आवश्यकता होती है।

इसके अलावा, उनके इरादों के बारे में अधिक जानकारी में एक वाक्य में एक उपयोगकर्ता शामिल है, बेहतर।

एक उपयोगकर्ता पूछ सकता है: "मुझे उपलब्ध कारों के बारे में जानकारी दें, एक्स मॉडल की कीमत कृपया" और तुरंत प्राप्त होने वाली जानकारी प्राप्त करें, बजाय पहले कहने के: "मैं उपलब्ध कारों के बारे में जानकारी चाहता हूं" और फिर मॉडल के लिए पूछ रहा हूं ।

उपयोगकर्ताओं को परिचालन के इस तरीके का एहसास नहीं हो सकता है, इसलिए आपको यथासंभव अधिक से अधिक उदाहरणों का उपयोग करना चाहिए।

विकल्पों की मात्रा को सीमित करें

जब उपयोगकर्ता दृश्य सामग्री या सूचियों को ब्राउज़ करते हैं, तो वे उस जानकारी पर वापस लौट सकते हैं जिसे उन्होंने अनदेखा किया था या भूल गए थे।

यह मौखिक सामग्री के साथ ऐसा नहीं है। मौखिक सामग्री के साथ, वाक्यों को छोटा रखा जाना चाहिए।

यह अनुशंसा की जाती है कि बातचीत के लिए तीन से अधिक विभिन्न विकल्पों का उपयोग किया जाए।

उस उपयोगकर्ता को सूचित करें जो आप सुन रहे हैं

सरल प्रतिक्रिया के कुछ रूप का उपयोग करें ताकि उपयोगकर्ता जानता है कि सिस्टम सुन रहा है।

आपको कुछ दृश्य जानकारी का उपयोग करना चाहिए ताकि उपयोगकर्ताओं को पता चले कि वॉइस उपयोगकर्ता इंटरफ़ेस सुन रहा है, उपयोगकर्ता तुरंत देख सकता है कि वह जो कह रहा है वह रिकॉर्ड किया जा रहा है (इसी तरह जब हम अन्य लोगों से बात करते हैं और अशाब्दिक संचार द्वारा आप देख सकते हैं कि वे सुन रहे हैं )।

आवाज आज्ञाओं का एनाटॉमी

संवाद का एक प्रवाह बनने से पहले, डिजाइनरों को पहले एक आवाज आदेश की शारीरिक रचना को समझना चाहिए। उपयोगकर्ता के वॉयस कमांड में तीन प्रमुख कारक होते हैं: इरादा, घोषणा और स्थान। आइए निम्नलिखित अनुरोध का विश्लेषण करें: "सोने के लिए आराम संगीत खेलें"।

इरादा

इरादा उपयोगकर्ता के वॉइस कमांड के व्यापक उद्देश्य का प्रतिनिधित्व करता है। उदाहरण अनुरोध में, इरादा स्पष्ट है, उपयोगकर्ता संगीत सुनना चाहता है।

बयान

उपयोगकर्ता कमांड को कैसे तैयार करता है, अर्थात, स्टेटमेंट। उपयोग किए गए उदाहरण में हम जानते हैं कि उपयोगकर्ता "प्ले" शब्द के लिए धन्यवाद संगीत खेलना चाहता है, लेकिन यह कहने का एकमात्र तरीका नहीं है। उपयोगकर्ता यह भी कह सकता है "मैं संगीत सुनना चाहता हूं"।

वार्तालाप डिजाइनरों को अभिव्यक्ति के सभी रूपों को ध्यान में रखना चाहिए।

प्रसंग

कभी-कभी, केवल एक इरादा पर्याप्त नहीं होता है और अनुरोध को पूरा करने के लिए अधिक उपयोगकर्ता जानकारी की आवश्यकता होती है।

इसे "संदर्भ" कहा जाता है, और ये, विज़ुअल इंटरफेस के रूप में, वैकल्पिक हो सकते हैं या किसी एप्लिकेशन को पूरा करने के लिए आवश्यक हो सकते हैं।

इस मामले में, "आराम" शब्द संदर्भ "प्ले म्यूजिक" का उपयोग कर सकता है यह जानने के लिए कि आप आराम से संगीत खेलने का अनुरोध कर रहे हैं।

उत्कृष्ट वॉयस यूजर इंटरफेस डिजाइन करने के लिए, आपको उपयोगकर्ताओं को बिना किसी सूचना के संबंधित जानकारी प्रदान करने का एक सुंदर तरीका खोजना होगा।

वॉइस उपयोगकर्ता इंटरैक्शन एक दृश्य प्रणाली की तुलना में कुछ पहलुओं में अधिक चुनौतियों का सामना कर सकता है, हालांकि, इसमें कोई संदेह नहीं है कि यह इंटरैक्शन का एक तरीका है जो तेजी से उपयोग किया जाएगा।