Sesli kullanıcı arayüzleri nasıl tasarlanır?

Apple HomePod, Google Home ve Amazon Echo gibi daha fazla ses kontrollü cihaz var. Bunun nedeni, ses arayüzlerinin kullanıcı deneyimini geliştirmesidir, aslında comScore (bir pazarlama araştırma şirketi), sesin 2020'ye kadar tüm aramaların% 50'sini gerçekleştireceğine inanmaktadır.

En büyük beş teknoloji şirketi olan Microsoft, Google, Amazon, Apple ve Facebook ses özellikli AI yardımcılarını geliştirdi (veya şu anda geliştiriyor).

Web uygulamaları veya akıllı ev hoparlörleri için VUI'den (Sesli Kullanıcı Arabirimleri) bahsediyor olsak da, günümüzün teknolojisinde ses etkileşimleri giderek yaygınlaşmaktadır, özellikle de birçok insan ekranın önünde saatlerce süren yorgunluk yaşadığından.

Şimdi, sesli kullanıcı arayüzlerinin nasıl tasarlanacağını ve anatomi ses komutlarının nasıl olması gerektiğini görelim.

Ses arayüzleri nasıl tasarlanır?

Ev hoparlörlerinin çevrimiçi yorumlarını okursanız, bazı kişilerin hoparlörlerinden bir üründen daha fazla evcil hayvana benzeyen bir şekilde yakın bir bağlantı oluşturduğunu göreceksiniz.

Hala tam olarak ilerlemekte olan programlarla tüm müşteri beklentilerini karşılayamazsınız, ancak bazı yönergeleri başlangıç noktası olarak takip edebilirsiniz.

Kullanıcılara neler yapabilecekleri hakkında bilgi verin

Grafik kullanıcı arabirimi kullanıcılara yapabilecekleri her şeyi gösterir. Bir ses arabirimi, kullanıcıya hangi seçeneklerin mümkün olduğunu göstermenin bir yolu yoktur ve yeni kullanıcılar beklentilerini insan konuşmalarıyla ilgili deneyimlerine dayandırır.

Bu nedenle, sistem için hiçbir anlam ifade etmeyen veya mümkün olmayan bir şey isteyerek başlayabilirler. Bunun çözümü kullanıcı etkileşimi seçenekleri sunmaktır.

Örneğin, sesli arayüz "Satın almanıza yardımcı olabilirim" veya "size ürünler hakkında bilgi verebilirim" gibi bir şey söyleyebilir.

Her durumda, kullanıcılara seçeneklerinden biri olan 'çıkış' da dahil olmak üzere bir özellikten kolay bir çıkış yolu sağlanmalıdır.

Yanıtları eksiksiz bilgilerle birlikte gönderin

Grafik arayüzlerde kullanıcılar hangi bölümde olduklarını görebilirken, sesli kullanıcı arayüzlerinde kullanıcılar hangi işlevselliği kullandıklarını bilmelidir.

Kullanıcılar, konuşmada nerede oldukları konusunda hızlı bir şekilde kafanız karışabilir veya yanlışlıkla işlevselliği etkinleştirebilir, bu nedenle, işitselden daha fazla rehberlik olmadan daha fazla ayrıntıya ihtiyaç duyarlar.

Arayüz, "X markasının ve X modelinin otomobili 20.000 $ fiyatla satılıyor ve 2 yıl garantili" gibi bir ürünle ilgili tüm soruları yanıtlamalıdır.

Bu, kullanıcıların hangi işlevleri kullandıklarını ve konuşmacının ne hakkında konuştuklarını bilmelerini sağlar.

Mümkün olduğu kadar çok örnek kullanın

İnsanlar konuştuğunda, argo, kek, kelime kısaltması vb.Çünkü çoğu zaman tam niyetlerini ifade etmezler.

İnsanlar arasında birbirimizi anlıyoruz, ancak ses arayüzleri, niyetlerini anlamak için insanın kendini doğru bir şekilde ifade etmesine ihtiyaç duyuyor.

Buna ek olarak, niyetleri hakkında daha fazla bilgi bir cümledeki bir kullanıcıyı içerir, daha iyi.

Bir kullanıcı şu soruyu sorabilir: "Bana mevcut arabalar hakkında bilgi verin, X modelinin fiyatı lütfen" ve ilk önce "Mevcut arabalar hakkında bilgi istiyorum" ve sonra modeli sormak yerine hemen istediği bilgileri alın .

Kullanıcılar bu şekilde çalışmazlar, bu nedenle mümkün olduğunca çok etkileşim örneği kullanmalısınız.

Seçeneklerin miktarını sınırlayın

Kullanıcılar görsel içeriğe veya listelere göz attığında, gözden kaçırdıkları veya unuttukları bilgilere geri dönebilirler.

Sözlü içerik ile durum böyle değildir. Sözlü içerikle, cümleler kısa tutulmalıdır.

Bir etkileşim için üçten fazla farklı seçeneğin kullanılması önerilir.

Kullanıcıya dinlediğinizi bildirin

Kullanıcının sistemin dinlediğini bilmesi için bir tür basit geri bildirim kullanın.

Kullanıcıların sesli kullanıcı arayüzünün dinlediğini bilmesi için bazı görsel bilgileri kullanmalısınız, kullanıcı derhal söylediklerinin kaydedildiğini görebilir (diğer insanlarla konuştuğumuza benzer ve sözsüz iletişim yoluyla dinlediklerini görebilirsiniz) ).

Sesli komutların anatomisi

Bir diyalog akışı oluşturmadan önce, tasarımcılar önce bir ses komutunun anatomisini anlamalıdır. Bir kullanıcının sesli komutu üç anahtar faktörden oluşur: niyet, beyan ve boşluk. Şu isteği analiz edelim: "Uyku için rahatlatıcı müzik çalın".

niyet

Niyet, bir kullanıcının sesli komutunun daha geniş hedefini temsil eder. Örnek istekte, amaç açıktır, kullanıcı müzik dinlemek ister.

Beyan

Kullanıcının komutu nasıl formüle ettiği, yani ifade. Kullanılan örnekte, kullanıcının "oyun" kelimesi sayesinde rahatlatıcı müzik çalmak istediğini biliyoruz, ancak bunu söylemenin tek yolu bu değil. Kullanıcı ayrıca "Müzik dinlemek istiyorum" diyebilir.

Konuşma tasarımcıları, ifadenin tüm varyasyonlarını dikkate almalıdır.

bağlam

Bazen yalnızca bir niyet yeterli olmaz ve isteği yerine getirmek için daha fazla kullanıcı bilgisi gerekir.

Buna "bağlam" denir ve bunlar görsel arayüzlerde olduğu gibi bir uygulamayı tamamlamak için isteğe bağlı veya gerekli olabilir.

Bu durumda, "rahatlatıcı" kelimesi, rahatlatıcı müzik çalmayı talep ettiğinizi bilmek için "müzik çal" bağlamını kullanabilir.

Mükemmel sesli kullanıcı arayüzleri tasarlamak için, kullanıcılara bunaltıcı olmadan ilgili bilgileri sağlamanın zarif bir yolunu bulmalısınız.

Sesli kullanıcı etkileşimi, bazı açılardan görsel bir sistemden daha fazla zorluk yaratabilir, ancak bunun giderek daha fazla kullanılacak bir etkileşim modu olduğuna şüphe yoktur.