語音是人們?nèi)粘I钪凶畛S玫慕换シ绞剑脖恢饾u應(yīng)用車載產(chǎn)品中,本文將以駕車途中最常見的場景——導(dǎo)航場景,簡單聊聊語音交互。
一、當(dāng)前手機(jī)app語音導(dǎo)航功能如何?
以高德地圖為例,在開啟“駕車模式”和“首頁搖一搖喚醒語音”后,在首頁搖一搖即可語音輸入指令。
1. 語音搜索地名
第一步:語音輸入地名。測試中發(fā)現(xiàn),目前僅支持地名或行車途中常見的服務(wù)站點(diǎn)(加油站、洗手間、服務(wù)站等),暫不支持“附近的吃飯地點(diǎn)”智能地點(diǎn)推薦功能。
第二步:根據(jù)語音提示選擇目的地。測試中發(fā)現(xiàn):目前僅支持“第x個(gè)”的固定格式,暫不支持地名或下一頁等指令(圖中地點(diǎn)有多頁)。
第三步:開始導(dǎo)航。
有時(shí),搜索的地名只有一個(gè),便會確認(rèn)是否開始導(dǎo)航。測試中發(fā)現(xiàn),目前僅支持“是”指令,暫不支持“否”,且多次測試中“是”被高德地圖識別為“超市”。
也支持快捷的語音指令,導(dǎo)航到xxx,即直接開始導(dǎo)航。測試中發(fā)現(xiàn),當(dāng)出現(xiàn)多個(gè)類似地點(diǎn)時(shí),默認(rèn)導(dǎo)航至該地點(diǎn)名單的第一個(gè)地點(diǎn)。
2. 語音導(dǎo)航
語音播報(bào):途徑地點(diǎn)、全程路長、預(yù)計(jì)所需時(shí)長、實(shí)時(shí)路況、監(jiān)控提醒、服務(wù)站提醒。
測試中發(fā)現(xiàn):語音導(dǎo)航中并不支持語音交互,若是需要在路途中尋找洗手間或更改路線,只能手動操作。然而這無疑增加了行車中的風(fēng)險(xiǎn)。
二、設(shè)想中的車載語音交互導(dǎo)航是怎樣的?
設(shè)想應(yīng)當(dāng)基于需求,對于車載語音交互導(dǎo)航,用戶的需求如下:
- 基本需求:在搜索目的地時(shí)可使用語音輸入地名
- 期望需求:在導(dǎo)航途中可使用語音修改目的地或增加途經(jīng)地
- 興奮需求:在搜索目的地時(shí)可提供智能化的地點(diǎn)推薦
1. 基本需求
目前高德地圖和部分車載智能中控臺已經(jīng)能做的,核心的關(guān)鍵在于對語音的識別率,這將極大影響語音交互的效率。
語音的高識別率需要大量的語音訓(xùn)練,中國人口音五花八門,各家產(chǎn)品皆很難達(dá)到較高的識別率??拼笥嶏w有語音開發(fā)合作平臺,語音識別率達(dá)98%,與他們合作能極大的提高開發(fā)效益。
2. 期望需求
目前比較少見,常見的應(yīng)用場景是滴滴拼車,拼完座后,高德地圖會導(dǎo)航司機(jī)用最短的路程接完乘客并送達(dá)乘客到目的地,但高德地圖并沒有在C端產(chǎn)品上開放出該功能。
修改目的地和增加途經(jīng)地只需要重新規(guī)劃路線,該需求實(shí)現(xiàn)的核心在于對語音的高識別率、降噪和回音消除。行車途中若是對指識別錯(cuò)誤,可能會導(dǎo)致導(dǎo)航錯(cuò)誤,影響用戶駕車情緒,增大行車風(fēng)險(xiǎn)。且高速駕駛中噪音較大,可能還會遇到車窗打開、車內(nèi)喧嘩等場景,降噪和回音消除是導(dǎo)航中保證語音高識別率的基礎(chǔ)。
3. 興奮需求
其實(shí)是一個(gè)低頻需求,大部分的用戶在開車前便已有了目的地,未有目的地的時(shí)候,也會現(xiàn)在美團(tuán)或大眾點(diǎn)評等平臺上選好目的地,再上車。很少會出現(xiàn),坐上了車,才想著要去哪里的場景??赡艽嬖诘膱鼍笆牵脩粼谛熊囃局型蝗幌敫淖兡康牡?,或出來玩耍后未盡興想繼續(xù)玩,但不知道去哪里。
高德地圖上便有附近地點(diǎn)的搜索,美團(tuán)與大眾點(diǎn)評等O2O平臺上亦有附近商家推薦,與這兩者合作,便能解決該需求。
三、語音交互導(dǎo)航的流程
如何去達(dá)成良好的車載語音交互導(dǎo)航體驗(yàn),這里將以獨(dú)立車載智能中控臺的初次接入場景和導(dǎo)航場景為例進(jìn)行說明。
1.?初次接入流程
接通電源:大部分獨(dú)立車載智能中控臺都不具備儲電功能,需要在車上接電。然而車內(nèi)環(huán)境狹小,也較為復(fù)雜,不同車型內(nèi)飾也各有差異,需要在說明書上用通用的方式指引用戶給中控臺接通電源。
接通手機(jī)或汽車與中控臺:應(yīng)注意保持行車途中信號的穩(wěn)定性。
進(jìn)行新手引導(dǎo):
- 自我介紹:產(chǎn)品角色亮相,支持功能介紹
- 基本規(guī)則介紹:讓用戶了解語音交互的基本使用方式
- 引導(dǎo)用戶完成基本設(shè)置:家庭/公司地址設(shè)置、聲紋識別等常用功能或隱私設(shè)置
需要注意的是:新手引導(dǎo)是極易被用戶跳過或不用心聽的,應(yīng)該在新手引導(dǎo)后仍有觸達(dá)用戶的方式,讓他們了解語音交互的基本使用方式或完成基本設(shè)置。
2. 導(dǎo)航場景
喚醒:
- 語音喚醒:當(dāng)用戶需要使用中控臺是喚醒它,為了避免誤喚醒,通常會將喚醒詞設(shè)置為3~4個(gè)詞,如“小飛魚”,三字詞和四字詞在漢語中是相對較為低頻的,有助于提高喚醒的準(zhǔn)確率??梢允褂枚ㄏ蛘Z音,即只有固定位置的人說話才會被收錄,只開放給駕駛位和副駕駛位。
- 喚醒反饋:中控臺被喚醒后,進(jìn)行反饋。簡單的反饋可以是“叮”一聲,但這樣顯得太冷漠,最好是使用“我在”“你說”等人性化的回應(yīng)詞或語句。
設(shè)置目的地:
(1)語音輸入
這里以導(dǎo)航為例,用戶輸入的語音可能為“導(dǎo)航到會展中心”“會展中心”“去會展中心”“我想去會展中心”,需要對地名、“導(dǎo)航”、“去”的識別較為準(zhǔn)確。
與喚醒詞不同,目的地的語音通常為一句話,所包含的字詞會較為復(fù)雜。語句的識別可簡單劃分為5個(gè)步驟:
- 判斷語音結(jié)束點(diǎn):判斷從發(fā)聲到結(jié)束,截取聲音片段。
- 提取有效信息:將聲音片段識別成一個(gè)個(gè)發(fā)音。
- 識別:將發(fā)音與文字匹配,將發(fā)音識別成特定的文字。
- 自然語言理解:根據(jù)算法理解語意。
- 對話管理:根據(jù)語意進(jìn)行回復(fù),引導(dǎo)進(jìn)行下一輪的對話。
目前對話管理有兩種識別模型,一種是使用人工定義回復(fù)的內(nèi)容,另一種是通過機(jī)器學(xué)習(xí)的算法,提供自然語言的回復(fù)。
除開語句識別技術(shù)外,還要保障有清晰的聲音獲取。行車途中,難免會遇到較為嘈雜的環(huán)境,如車窗大開、高速駕駛、車內(nèi)喧嘩和空調(diào)聲大等,需要進(jìn)行降噪。目前比較常見的技術(shù)手段是使用雙麥克風(fēng)陣列降噪和回聲消除。
(2)識別反饋
對輸入的語音內(nèi)容給予反饋。
- 識別完成反饋:“為你找到深圳會展中心,位于福華三路與金田路交匯處,是否導(dǎo)航”。
- 識別錯(cuò)誤反饋:“抱歉,沒有聽清,請?jiān)僬f一遍”,需要注意的是,若是多次識別錯(cuò)誤,可能是用戶沒有正確遵循語音交互規(guī)則,此時(shí)可進(jìn)行基本規(guī)則介紹。
開始導(dǎo)航:
(1)確認(rèn)是否開始導(dǎo)航
若用戶回復(fù)“是”或“開始”,則上一步識別正確,開始導(dǎo)航。
若用戶回復(fù)“否”或“取消”,則說明上一步識別錯(cuò)誤,應(yīng)重新設(shè)置目的地,應(yīng)回復(fù)用戶“主人,你想去哪兒呢?”,并進(jìn)入設(shè)置目的地步驟的語音輸入環(huán)節(jié)。
若用戶回復(fù)其他“地名”,則說明上一步識別錯(cuò)誤,應(yīng)更改目的地,回復(fù)“為你找到深圳大劇院,位于深圳市羅湖區(qū),是否導(dǎo)航”。
若識別錯(cuò)誤,則回復(fù)“抱歉,沒有聽清,請問是否開始導(dǎo)航?”,重復(fù)識別錯(cuò)誤3次,應(yīng)當(dāng)退出導(dǎo)航功能,避免用戶不良情緒的積累。
(2)開始導(dǎo)航提示
提示用戶導(dǎo)航已經(jīng)開始,對行車?yán)锍?、預(yù)計(jì)時(shí)長、路途車況、途經(jīng)地點(diǎn)等內(nèi)容進(jìn)行播報(bào)。
如:“準(zhǔn)備出發(fā),路程約為14公里,目前道路通暢,預(yù)計(jì)需要28分鐘,途經(jīng)泥崗西路、紅荔路、金田路,祝你一路順風(fēng)?!?/p>
(3)導(dǎo)航中語音交互規(guī)則介紹
行車途中,常見的需求有規(guī)避擁堵、更改目的地、尋找加油站、尋找服務(wù)站、尋找洗手間、尋找充電站等。長期以來,各類手機(jī)導(dǎo)航app和車機(jī)中控臺在導(dǎo)航中都需要用手操作去更改路線,但這樣會帶來嚴(yán)重的行車風(fēng)險(xiǎn)。時(shí)速60km/h時(shí),操作手機(jī)3s,就相當(dāng)于盲開50m,發(fā)生事故的概率是平時(shí)的23倍。
用戶并不知道行車途中可以使用語音交互進(jìn)行指令,也不知道如何進(jìn)行語音交互,故在前3次中導(dǎo)航,可進(jìn)行導(dǎo)航中語音交互規(guī)則介紹。
這類語音交互是基于導(dǎo)航場景中的,故該部分的功能也應(yīng)該在導(dǎo)航中才可有效開啟。如“前方還有多遠(yuǎn)到達(dá)充電站”。
導(dǎo)航中:
(1)路況播報(bào)
常見的如前方擁堵、監(jiān)控提醒、服務(wù)站提醒等。
當(dāng)前方發(fā)生較大擁堵時(shí),用戶會有規(guī)避擁堵的需求,可詢問用戶“前方發(fā)生擁堵,預(yù)計(jì)通過時(shí)長為40分鐘,是否規(guī)避擁堵?”,若用戶在多次遇到擁堵時(shí)選擇規(guī)避,則可默認(rèn)幫用戶進(jìn)行規(guī)避擁堵,并提示“前方發(fā)生擁堵,預(yù)計(jì)通過時(shí)長為40分鐘,已為你規(guī)避擁堵,節(jié)省擁堵時(shí)間30分鐘?!?/p>
(2)輸入語音指令
常見的如尋找附近的洗手間、增加途經(jīng)地、更改目的地、規(guī)避擁堵等。需要注意的是,增加途經(jīng)地的指令,在導(dǎo)航到達(dá)途經(jīng)地后需繼續(xù)原目的地的導(dǎo)航。
如:用戶在長途行駛時(shí),常會前往服務(wù)站休息或加油,會使用語音“去最近的服務(wù)站”,導(dǎo)航到最近的服務(wù)站后,用戶下車休息一段時(shí)間返回車上,僅需一句“繼續(xù)剛才的導(dǎo)航”,即可繼續(xù)導(dǎo)航至原目的地。
有時(shí),用戶可能會聽不清路況播報(bào)的內(nèi)容,而輸入語音“重復(fù)剛來的內(nèi)容”、“我沒有聽清”。
這些語音指令都需要結(jié)合導(dǎo)航途中的不同場景來做具體的流程設(shè)計(jì)。
(3)識別反饋
需根據(jù)具體場景來提供識別反饋。
如:用戶沒有聽清路況播報(bào)時(shí),反饋“為你重新播放剛剛的內(nèi)容,前方發(fā)生擁堵,預(yù)計(jì)通過時(shí)長為40分鐘,是否規(guī)避擁堵?”
如:用戶在長途行駛中,添加途徑地服務(wù)站,導(dǎo)航至服務(wù)站后,在提示完“已到達(dá)服務(wù)站”后,可詢問用戶“是否繼續(xù)導(dǎo)航至深圳大劇院?”
導(dǎo)航結(jié)束:
(1)結(jié)束導(dǎo)航提示
提示用戶導(dǎo)航已結(jié)束。導(dǎo)航結(jié)束通常有兩種場景,一是已到達(dá)目的地,此時(shí)提示“已到達(dá)目的地,導(dǎo)航已結(jié)束”,二是用戶退出導(dǎo)航,此時(shí)提示“導(dǎo)航已結(jié)束”
(2)進(jìn)入休眠狀態(tài)
導(dǎo)航結(jié)束后,自動進(jìn)入休眠狀態(tài),等待下一次喚醒。
完~
本文由 @陳想吃 原創(chuàng)發(fā)布于人人都是產(chǎn)品經(jīng)理。未經(jīng)許可,禁止轉(zhuǎn)載。
題圖來自 Unsplash,基于CC0協(xié)議。
愛盈利-運(yùn)營小咖秀(www.jza6.com) 始終堅(jiān)持研究分享移動互聯(lián)網(wǎng)App運(yùn)營推廣經(jīng)驗(yàn)、策略、全案、渠道等純干貨知識內(nèi)容;是廣大App運(yùn)營從業(yè)者的知識啟蒙、成長指導(dǎo)、進(jìn)階學(xué)習(xí)的集聚平臺;
想了解更多移動互聯(lián)網(wǎng)干貨知識,請關(guān)注微信公眾號運(yùn)營小咖秀(ID: yunyingshow)