亞馬遜旗下的智能語(yǔ)音助手平臺(tái)Alexa及內(nèi)置了Alexa的智能音箱產(chǎn)品Echo,可謂過(guò)去一年里智能家居市場(chǎng)當(dāng)之無(wú)愧的明星。根據(jù)消費(fèi)者智能研究機(jī)構(gòu) CIRP(Consumer Intelligence Research Partners)發(fā)布的報(bào)告,截止 2016年11月21日,Echo系列在美國(guó)的銷(xiāo)量已經(jīng)達(dá)到510萬(wàn)臺(tái),實(shí)現(xiàn)了口碑、銷(xiāo)量雙豐收。在不久前舉辦的CES2017展會(huì)上,Alexa又狠狠賺足了眼球。亞馬遜本身雖未參展,但內(nèi)置了Alexa語(yǔ)音助手的智能產(chǎn)品幾乎無(wú)處不在,其中包括LG推出的智能冰箱和家庭機(jī)器人Hub Robot。
盡管已經(jīng)取得了諸多成就,亞馬遜并未在探索智能家居交互方式的道路上止步。上周四亞馬遜宣布, Alexa智能語(yǔ)音助手平臺(tái)已經(jīng)擁有超過(guò)10000項(xiàng)“技能”(Skill)。而在一年前,這項(xiàng)數(shù)字才不過(guò)區(qū)區(qū)100多,Alexa的強(qiáng)化升級(jí)速度可謂驚人。如今,除了查詢(xún)天氣、播放音樂(lè)、創(chuàng)建任務(wù)、設(shè)置鬧鐘、發(fā)送消息之類(lèi)的基本功能之外,Alexa還支持預(yù)訂外賣(mài)、Uber打車(chē)、控制家用電器等各種功能。
無(wú)獨(dú)有偶,亞馬遜宣布這一消息不久,谷歌便表示:從本周開(kāi)始,Google助手將支持運(yùn)行Android 7.0 Nougat和Android 6.0 Marshmallow的智能手機(jī)。作為亞馬遜最大的對(duì)手,谷歌在智能家居領(lǐng)域起步稍晚,2016年5月的I/O大會(huì)上與Echo對(duì)壘的Google Home才首度亮相。不過(guò)隨著Google Home學(xué)習(xí)Echo向第三方開(kāi)發(fā)者開(kāi)放后,谷歌加快了追趕的腳步。不久前有消息爆出,谷歌正在其智能手機(jī)Pixel中為智能語(yǔ)音程序“谷歌助手”Google Assistant添加新的功能,使得用戶(hù)可以通過(guò)Pixel用語(yǔ)音控制智能家居產(chǎn)品,就像使用谷歌智能音箱那樣。業(yè)界一直認(rèn)為,擁有強(qiáng)大安卓生態(tài)的谷歌接下來(lái)會(huì)將Google Assistant適配更多的安卓手機(jī),以快速攫取智能語(yǔ)音市場(chǎng)。僅僅一個(gè)多星期,這一猜想便得到了印證。
從谷歌和亞馬遜快速推進(jìn)的步伐來(lái)看,智能語(yǔ)音助手前景無(wú)限,一個(gè)屬于智能語(yǔ)音交互的時(shí)代正在迅速開(kāi)啟。然而,我們必須清醒地認(rèn)識(shí)到智能語(yǔ)音交互技術(shù)仍然處在非常初級(jí)的階段。
首先,語(yǔ)音識(shí)別的準(zhǔn)確率仍有待提升。去年,在錘子科技的M1手機(jī)發(fā)布會(huì)上,CEO羅永浩高調(diào)地演示了錘子手機(jī)內(nèi)置的科大訊飛語(yǔ)音輸入法,并聲稱(chēng)語(yǔ)音識(shí)別準(zhǔn)確略高達(dá)97%。不過(guò),根據(jù)筆者實(shí)測(cè)來(lái)看,識(shí)別準(zhǔn)確率遠(yuǎn)低于這一數(shù)值。這是因?yàn)檎Z(yǔ)音識(shí)別技術(shù)對(duì)于環(huán)境的要求十分苛刻;背景噪音、口音、語(yǔ)速、特定領(lǐng)域的專(zhuān)有名詞等因素都會(huì)對(duì)識(shí)別準(zhǔn)確率造成顯著的影響。因此,在當(dāng)前技術(shù)水平下,語(yǔ)音識(shí)別技術(shù)的使用范圍仍十分局限,使用體驗(yàn)也仍有改善空間。
其次,在正確識(shí)別用戶(hù)發(fā)音的前提下,機(jī)器是否真的能夠理解用戶(hù)想要表達(dá)的真實(shí)含義呢?眾所周知,人類(lèi)口語(yǔ)跟書(shū)面語(yǔ)言有著巨大差異,與計(jì)算機(jī)可讀的二進(jìn)制編碼或者字符序列更是天淵之別。把富有個(gè)性化的人類(lèi)口語(yǔ)轉(zhuǎn)化成機(jī)器語(yǔ)言是一件十分浩大的工程,我們目前取得的成果尚十分有限。相信大家都對(duì)幾年前風(fēng)行過(guò)一陣的手機(jī)語(yǔ)音助手還有印象,彼時(shí)不少人熱衷于“調(diào)戲”Siri等手機(jī)語(yǔ)音助手,但很快便感到興味索然。因?yàn)檫@些語(yǔ)音助手一問(wèn)十不知,實(shí)在太笨了。毫無(wú)疑問(wèn),幾年過(guò)去,Siri們已經(jīng)取得了巨大的進(jìn)步,但只要它們的出錯(cuò)率高于5%,對(duì)于用戶(hù)體驗(yàn)的傷害便是無(wú)法挽回的。
當(dāng)然,即便所有的技術(shù)現(xiàn)在已經(jīng)足夠成熟,用戶(hù)們也沒(méi)做好接受它們的心理準(zhǔn)備。沒(méi)有人愿意對(duì)著冰冷的機(jī)器說(shuō)話(huà),然后得到毫無(wú)感情的的回應(yīng)。用戶(hù)希望從語(yǔ)音助手那里得到的,不僅僅是迅速準(zhǔn)確的反饋,還有富有個(gè)性和感情聲音以及與人類(lèi)交流時(shí)的親切感。
此外,人在與系統(tǒng)做交互的時(shí)候,能記住的信息只有10秒左右。舉一個(gè)常見(jiàn)的場(chǎng)景,撥打銀行的客服電話(huà)時(shí),你必須集中精力聽(tīng)語(yǔ)音播報(bào),一旦被打斷就又得從頭聽(tīng)一遍。這些都是我們?cè)谡娇缇痴Z(yǔ)音交互時(shí)代的大門(mén)前必須面對(duì)和解決的問(wèn)題。
不過(guò),我們也不必為此感到灰心和喪氣,隨著技術(shù)的飛速發(fā)展,大多數(shù)問(wèn)題在不遠(yuǎn)的未來(lái)都將得到解決。屆時(shí),語(yǔ)音交互或許不是能夠應(yīng)對(duì)所有場(chǎng)景的唯一交互方式,但在腦波控制技術(shù)成熟之前,它必然是大多數(shù)場(chǎng)景下的最佳選擇。就目前而言,語(yǔ)音交互技術(shù)為我們提供了更多的選擇,而且在某些場(chǎng)景下,比如通過(guò)Echo智能音箱控制客廳的燈光,語(yǔ)音交互技術(shù)到來(lái)的用戶(hù)體驗(yàn)已經(jīng)大大優(yōu)于手機(jī)APP和面板開(kāi)關(guān)了。
我們有足夠的理由想象這樣一個(gè)場(chǎng)景:某個(gè)周日的早上,我們起床后,家里的智能音箱自動(dòng)給我們播報(bào)當(dāng)天的天氣狀況;冰箱里的牛奶只剩最后一盒時(shí),語(yǔ)音助手會(huì)主動(dòng)詢(xún)問(wèn)是否需要添購(gòu);得到肯定答復(fù)后,語(yǔ)音助手已經(jīng)安排快遞在約定好的時(shí)間送來(lái),而你所要做的就是慢慢享用……
(審核編輯: 智匯小蟹)
分享