अधिक से अधिक ध्वनि-नियंत्रित उपकरण हैं, जैसे कि ऐप्पल होमपॉड, गूगल होम और अमेज़ॅन इको। ऐसा इसलिए है क्योंकि वॉइस इंटरफेस उपयोगकर्ता अनुभव को बेहतर बनाते हैं, वास्तव में, कॉमस्कोर (एक मार्केटिंग रिसर्च कंपनी) का मानना है कि 2020 तक आवाज़ सभी खोजों में से 50% को निष्पादित करेगी।
पांच सबसे बड़ी प्रौद्योगिकी कंपनियां, Microsoft, Google, Amazon, Apple और Facebook, ने (या वर्तमान में विकासशील) आवाज-सक्षम AI सहायकों का विकास किया है।
चाहे हम वेब एप्लिकेशन या स्मार्ट होम स्पीकर के लिए VUI (वॉयस यूजर इंटरफेसेस) के बारे में बात कर रहे हों, आज की तकनीक में वॉयस इंटरैक्शन तेजी से आम है, खासकर जब से कई लोग स्क्रीन के सामने कई घंटों तक थकान का अनुभव करते हैं।
तो, आइए देखते हैं कि वॉयस यूजर इंटरफेस कैसे डिजाइन किया जाए और एनाटॉमी वॉयस कमांड क्या होनी चाहिए।
यदि आप होम स्पीकर्स की ऑनलाइन समीक्षा पढ़ते हैं, तो आप देखेंगे कि कुछ लोग अपने स्पीकर के साथ इस तरह से घनिष्ठ संबंध बनाते हैं जो किसी उत्पाद की तुलना में पालतू जानवर की तरह दिखता है।
आप निश्चित रूप से अभी भी पूरी प्रगति पर हैं कार्यक्रमों के साथ सभी ग्राहक अपेक्षाओं को पूरा नहीं कर सकते हैं, लेकिन आप कुछ दिशानिर्देशों को प्रारंभिक बिंदु के रूप में पालन कर सकते हैं।
एक ग्राफिकल यूजर इंटरफेस उपयोगकर्ताओं को वे सब कुछ दिखाता है जो वे कर सकते हैं। एक वॉयस इंटरफ़ेस में उपयोगकर्ता को यह दिखाने का कोई तरीका नहीं है कि कौन से विकल्प संभव हैं, और नए उपयोगकर्ता मानवीय वार्तालापों के साथ अपने अनुभव पर अपनी उम्मीदों को आधार बनाते हैं।
इसलिए, वे किसी ऐसी चीज़ के लिए पूछकर शुरू कर सकते हैं जो सिस्टम के लिए कोई मतलब नहीं है या जो संभव नहीं है। इसका समाधान उपयोगकर्ता इंटरैक्शन विकल्पों की पेशकश करना है।
उदाहरण के लिए, वॉइस इंटरफ़ेस कुछ कह सकता है जैसे "मैं आपको खरीदने में मदद कर सकता हूं" या "मैं आपको उत्पादों के बारे में जानकारी दे सकता हूं"।
किसी भी स्थिति में, उपयोगकर्ताओं को एक सुविधा से बाहर का आसान तरीका प्रदान किया जाना चाहिए, जिसमें उनके विकल्पों में से एक के रूप में 'निकास' भी शामिल है।
ग्राफिकल इंटरफेस में उपयोगकर्ता देख सकते हैं कि वे किस सेक्शन में हैं, जबकि वॉयस यूजर इंटरफेस में उपयोगकर्ताओं को पता होना चाहिए कि वे किस कार्यक्षमता का उपयोग कर रहे हैं।
उपयोगकर्ता जल्दी से भ्रमित हो सकते हैं कि वे बातचीत में कहां हैं या गलती से कार्यक्षमता को सक्रिय कर सकते हैं, इसलिए, श्रवण से अधिक मार्गदर्शन के बिना, उन्हें अधिक विवरण की आवश्यकता होती है।
इंटरफ़ेस को एक पूरे वाक्यांश वाले उत्पाद के बारे में एक प्रश्न का उत्तर देना चाहिए जैसे "ब्रांड X और मॉडल X की कार की कीमत $ 20,000 है, और इसकी गारंटी 2 साल है।"
यह उपयोगकर्ताओं को यह जानने की अनुमति देता है कि वे किस कार्यक्षमता का उपयोग कर रहे हैं, और वक्ता किस बारे में बात कर रहा है।
जब लोग बोलते हैं, तो वे अक्सर अपने पूर्ण इरादों को व्यक्त नहीं करते हैं, कई बार क्योंकि वे कठबोली, मफिन, छोटे शब्दों आदि का उपयोग करते हैं।
मनुष्यों के बीच हम एक-दूसरे को समझते हैं, लेकिन आवाज के इंटरफेस को मानव को अपने इरादों को समझने के लिए खुद को सही ढंग से व्यक्त करने की आवश्यकता होती है।
इसके अलावा, उनके इरादों के बारे में अधिक जानकारी में एक वाक्य में एक उपयोगकर्ता शामिल है, बेहतर।
एक उपयोगकर्ता पूछ सकता है: "मुझे उपलब्ध कारों के बारे में जानकारी दें, एक्स मॉडल की कीमत कृपया" और तुरंत प्राप्त होने वाली जानकारी प्राप्त करें, बजाय पहले कहने के: "मैं उपलब्ध कारों के बारे में जानकारी चाहता हूं" और फिर मॉडल के लिए पूछ रहा हूं ।
उपयोगकर्ताओं को परिचालन के इस तरीके का एहसास नहीं हो सकता है, इसलिए आपको यथासंभव अधिक से अधिक उदाहरणों का उपयोग करना चाहिए।
जब उपयोगकर्ता दृश्य सामग्री या सूचियों को ब्राउज़ करते हैं, तो वे उस जानकारी पर वापस लौट सकते हैं जिसे उन्होंने अनदेखा किया था या भूल गए थे।
यह मौखिक सामग्री के साथ ऐसा नहीं है। मौखिक सामग्री के साथ, वाक्यों को छोटा रखा जाना चाहिए।
यह अनुशंसा की जाती है कि बातचीत के लिए तीन से अधिक विभिन्न विकल्पों का उपयोग किया जाए।
सरल प्रतिक्रिया के कुछ रूप का उपयोग करें ताकि उपयोगकर्ता जानता है कि सिस्टम सुन रहा है।
आपको कुछ दृश्य जानकारी का उपयोग करना चाहिए ताकि उपयोगकर्ताओं को पता चले कि वॉइस उपयोगकर्ता इंटरफ़ेस सुन रहा है, उपयोगकर्ता तुरंत देख सकता है कि वह जो कह रहा है वह रिकॉर्ड किया जा रहा है (इसी तरह जब हम अन्य लोगों से बात करते हैं और अशाब्दिक संचार द्वारा आप देख सकते हैं कि वे सुन रहे हैं )।
संवाद का एक प्रवाह बनने से पहले, डिजाइनरों को पहले एक आवाज आदेश की शारीरिक रचना को समझना चाहिए। उपयोगकर्ता के वॉयस कमांड में तीन प्रमुख कारक होते हैं: इरादा, घोषणा और स्थान। आइए निम्नलिखित अनुरोध का विश्लेषण करें: "सोने के लिए आराम संगीत खेलें"।
इरादा उपयोगकर्ता के वॉइस कमांड के व्यापक उद्देश्य का प्रतिनिधित्व करता है। उदाहरण अनुरोध में, इरादा स्पष्ट है, उपयोगकर्ता संगीत सुनना चाहता है।
उपयोगकर्ता कमांड को कैसे तैयार करता है, अर्थात, स्टेटमेंट। उपयोग किए गए उदाहरण में हम जानते हैं कि उपयोगकर्ता "प्ले" शब्द के लिए धन्यवाद संगीत खेलना चाहता है, लेकिन यह कहने का एकमात्र तरीका नहीं है। उपयोगकर्ता यह भी कह सकता है "मैं संगीत सुनना चाहता हूं"।
वार्तालाप डिजाइनरों को अभिव्यक्ति के सभी रूपों को ध्यान में रखना चाहिए।
कभी-कभी, केवल एक इरादा पर्याप्त नहीं होता है और अनुरोध को पूरा करने के लिए अधिक उपयोगकर्ता जानकारी की आवश्यकता होती है।
इसे "संदर्भ" कहा जाता है, और ये, विज़ुअल इंटरफेस के रूप में, वैकल्पिक हो सकते हैं या किसी एप्लिकेशन को पूरा करने के लिए आवश्यक हो सकते हैं।
इस मामले में, "आराम" शब्द संदर्भ "प्ले म्यूजिक" का उपयोग कर सकता है यह जानने के लिए कि आप आराम से संगीत खेलने का अनुरोध कर रहे हैं।
उत्कृष्ट वॉयस यूजर इंटरफेस डिजाइन करने के लिए, आपको उपयोगकर्ताओं को बिना किसी सूचना के संबंधित जानकारी प्रदान करने का एक सुंदर तरीका खोजना होगा।
वॉइस उपयोगकर्ता इंटरैक्शन एक दृश्य प्रणाली की तुलना में कुछ पहलुओं में अधिक चुनौतियों का सामना कर सकता है, हालांकि, इसमें कोई संदेह नहीं है कि यह इंटरैक्शन का एक तरीका है जो तेजी से उपयोग किया जाएगा।