整個(gè)語(yǔ)音行業(yè)從2010年蘋(píng)果公司推出siri開(kāi)始,受到越來(lái)越多的關(guān)注。越來(lái)越多的業(yè)內人士認為,語(yǔ)音技術(shù)在兩三年內,會(huì )徹底改變當前的人機交互方式。北美最大的語(yǔ)音技術(shù)提供商nuance的高管最近就說(shuō):“語(yǔ)音和自然語(yǔ)義理解突然成為一門(mén)前沿科技,而我們正站在這個(gè)過(guò)渡點(diǎn)上。我認為語(yǔ)音識別將真正顛覆目前的計算機交互接口?!北疚膰@智能語(yǔ)音在智能交通、智能電網(wǎng)以及智能家居中的應用展開(kāi)探討。
智能語(yǔ)音技術(shù)改變傳統交互方式
智能語(yǔ)音交互首先改變的是移動(dòng)互聯(lián)網(wǎng)。以iphone中內置的siri為例,用戶(hù)以自然語(yǔ)言的方式對智能手機下達指令,而手機根據用戶(hù)語(yǔ)音和用戶(hù)當前的環(huán)境及上下文對用戶(hù)意圖進(jìn)行理解,并按照用戶(hù)意圖執行命令的過(guò)程。如用戶(hù)說(shuō)“查找附近的川菜館”,則手機會(huì )搜索用戶(hù)當前所在位置附近的川菜風(fēng)味餐廳,并將列表顯示出來(lái)供用戶(hù)選擇查看。
如今的語(yǔ)音搜索不同于傳統搜索模式,不是基于無(wú)關(guān)聯(lián)的幾個(gè)關(guān)鍵詞來(lái)反饋結果,而是能夠理解用戶(hù)指令,完成一項完整的任務(wù)。也就是說(shuō),語(yǔ)音搜索已經(jīng)不僅局限于將客戶(hù)需要的信息呈現出來(lái),還會(huì )將一些連鎖信息進(jìn)行反饋,自動(dòng)生成給客戶(hù)一套全面的服務(wù),基于這種高智能化的技術(shù)進(jìn)化,語(yǔ)音必將成為日后移動(dòng)互聯(lián)網(wǎng)的入口之一。
電視和機頂盒也是采用智能語(yǔ)音交互比較積極的行業(yè)。傳統的電視機和機頂盒的遙控操作都比較復雜,而采用智能語(yǔ)音交互技術(shù),只需對著(zhù)遙控器說(shuō)話(huà),就可以控制電視,輸入文字、打開(kāi)應用、播放視頻都可輕松實(shí)現。去年三星、lg和聯(lián)想等都發(fā)布了帶有專(zhuān)用語(yǔ)音輸入功能的遙控器,甚至有的還實(shí)現了類(lèi)似siri的語(yǔ)音助手的功能。
傳統行業(yè)利用智能語(yǔ)音交互技術(shù)進(jìn)行業(yè)務(wù)效率提升的意愿也比較強烈。比如傳統呼叫中心領(lǐng)域,需要投入大量資金、人力,甚至建設大面積的人工語(yǔ)音座席,每年投入上百億資金。國外早已普遍采用基于智能語(yǔ)音交互技術(shù)改造的呼叫中心,大量的用戶(hù)常見(jiàn)問(wèn)題、投訴和建議都可以被自動(dòng)識別和回復,節省了成本。而且這些呼叫中心每天收到大量的用戶(hù)語(yǔ)音數據,包含了龐大數量的用戶(hù)信息、偏好,都具有極大價(jià)值。但是如果不能利用智能語(yǔ)音技術(shù)進(jìn)行數據處理和挖掘,這些信息就如同儲量龐大的金礦,卻無(wú)法開(kāi)采。為了開(kāi)發(fā)這些數據,傳統呼叫中心都對投入智能語(yǔ)音交互技術(shù)抱有極大熱情。
另外,汽車(chē)、玩具、穿戴設備都對智能交互技術(shù)能提供的全新交互方式抱有很大的期待。語(yǔ)音技術(shù)作為一個(gè)已經(jīng)漸漸成熟的基礎技術(shù),隨著(zhù)使用面日漸擴大,必將越來(lái)越改變傳統的人機交互方式。