全系標(biāo)配滿級(jí)防水,OPPO A5 系列新品正式發(fā)布

優(yōu)必選:以一個(gè)過(guò)來(lái)人的身份告訴創(chuàng)業(yè)者,如何通過(guò) Alexa 實(shí)現(xiàn)語(yǔ)音助手的海外本地化丨WARE 2017
若要將智能語(yǔ)音硬件產(chǎn)品出口到海外,可利用 Alexa 更好的實(shí)現(xiàn)產(chǎn)品落地。
在國(guó)內(nèi),做智能硬件的不少,其中有不少出口國(guó)外的產(chǎn)品。那么,搭載語(yǔ)音交互功能的產(chǎn)品在進(jìn)入海外市場(chǎng)時(shí),最主要的還是要考慮語(yǔ)音交互的本土化問(wèn)題。在深圳灣舉辦的「WARE 2017 語(yǔ)音智能平臺(tái)與應(yīng)用峰會(huì)」中,優(yōu)必選 Alpha 產(chǎn)品線的負(fù)責(zé)人梁嘉豪以一個(gè)創(chuàng)業(yè)公司的視角向大家分享了其智能語(yǔ)音助手海外本地化探索的過(guò)程。
梁嘉豪曾從無(wú)到有搭建了優(yōu)必選的產(chǎn)品團(tuán)隊(duì),現(xiàn)主要責(zé)優(yōu)必選人工語(yǔ)音助手相關(guān)產(chǎn)品:Alpha2,Lynx,Beta,Alpha1 等產(chǎn)品。在智能語(yǔ)音交互上有豐富的實(shí)戰(zhàn)經(jīng)驗(yàn),對(duì)國(guó)內(nèi)外智能語(yǔ)音行業(yè)有深刻的了解。
優(yōu)必選 Alpha 2 于 2016 年啟動(dòng)了英文版語(yǔ)音的研發(fā),但難以實(shí)現(xiàn)海外本地化英文語(yǔ)義的編寫(xiě),基于這樣的評(píng)估,Alpha 2 隨后接入 Api.ai(不需在每個(gè)場(chǎng)景中編寫(xiě)語(yǔ)義),World Frame Alpha 和 Alice(讓語(yǔ)音更聰明)。經(jīng)過(guò)一路以來(lái)的探索,Alpha 2 最終選擇了 Alexa,并于 2017 年的 CES 上發(fā)布搭載 Alexa 的 Lynx 機(jī)器人。

海外本地化面臨哪些問(wèn)題?
可以說(shuō),優(yōu)必選已經(jīng)把能走的路都走了一遍。梁嘉豪講述了他們這一路以來(lái)所遇到的問(wèn)題,可歸結(jié)為以下三大類:
1.語(yǔ)言本地化:翻譯是語(yǔ)音軟件海外本地化最簡(jiǎn)單的辦法,但事實(shí)上,人工智能類產(chǎn)品因擁有海量數(shù)據(jù),單靠翻譯是不足夠的。語(yǔ)言本地化包括喚醒、ASR/TTS、NLP/NLU 個(gè)三方面。其中,喚醒指的是需要對(duì)喚醒詞進(jìn)行外文轉(zhuǎn)化,NLP/NLU 則需要運(yùn)用海量的本地?cái)?shù)據(jù)進(jìn)行訓(xùn)練。
2.內(nèi)容本地化:包括考慮新聞、故事、時(shí)區(qū)、音樂(lè)、天氣、版權(quán)等的當(dāng)?shù)貙傩浴F渲?,版?quán)問(wèn)題最為棘手,如音樂(lè)無(wú)法得到當(dāng)?shù)貞?yīng)用的授權(quán),將無(wú)法給用戶帶來(lái)順暢的體驗(yàn)。
3.云服務(wù)本地化:即服務(wù)器部署地的問(wèn)題。若國(guó)內(nèi)產(chǎn)品在國(guó)外使用時(shí),依舊走國(guó)內(nèi)服務(wù)器通道,則難以為用戶提供良好的體驗(yàn)。
對(duì)于沒(méi)有當(dāng)?shù)鼗瘍?yōu)勢(shì)的創(chuàng)業(yè)公司來(lái)說(shuō),Alexa 是不錯(cuò)的選擇
梁嘉豪表示,對(duì)于一個(gè)沒(méi)有當(dāng)?shù)鼗瘍?yōu)勢(shì)的創(chuàng)業(yè)公司來(lái)說(shuō),接入 Alexa 是最佳的選擇,原因有以下幾點(diǎn):
1.Alexa 能夠提供極致的用戶體驗(yàn),它要求麥克風(fēng)在聽(tīng)到聲音、回應(yīng)用戶的整個(gè)過(guò)程需要保持在 1.5s 以內(nèi),避免因等待時(shí)間過(guò)長(zhǎng)導(dǎo)致用戶產(chǎn)生等待焦慮。將這個(gè)反應(yīng)時(shí)間從 4s 縮短到 1.5s,Alexa 團(tuán)隊(duì)先后花了 3 年時(shí)間。
2.Amazon 能夠提供科學(xué)、完整的接入指引,清楚地向廠商指示,機(jī)器在被喚醒、監(jiān)聽(tīng)、請(qǐng)求網(wǎng)絡(luò)等狀態(tài)下,需要應(yīng)用光效、聲音等向用戶表明機(jī)器自身所處的狀態(tài)。
3.便捷的技能開(kāi)發(fā)方式,因大部分中、小廠商么沒(méi)有足夠的 NLP/NLU 數(shù)據(jù),Alexa 能夠讓廠商免去對(duì) NLP/NLU 這部分的考慮。
4.體系的認(rèn)證體系,這一點(diǎn)確保任何接入 Alexa 的產(chǎn)品都能為用戶提供極致的用戶體驗(yàn)。

亞馬遜資質(zhì)驗(yàn)證,需要注意哪些?
梁嘉豪進(jìn)一步向大家講述了亞馬遜資質(zhì)驗(yàn)證體系的框架:
麥克風(fēng)陣列(喚醒、誤喚醒、識(shí)別):分別是安靜和噪音環(huán)境下的喚醒率和誤喚醒率檢測(cè)。
用戶體驗(yàn)(燈效、反饋、延時(shí)):包括反饋機(jī)制是否到位,讓用戶清楚機(jī)器所處的狀態(tài),機(jī)器向用戶反饋的時(shí)間不超過(guò) 1.5s。
大音頻文件播放體驗(yàn)(用戶等待時(shí)長(zhǎng)):Amazon 擁有海量的內(nèi)容,且不同內(nèi)容供應(yīng)商所提供的音頻文件格式各不相同,要求所提供的音頻文件能夠被播放,雖然對(duì)用戶等待時(shí)長(zhǎng)沒(méi)有固定數(shù)值,但要求在一個(gè)相對(duì)較短的時(shí)間范圍內(nèi)。

另外,梁嘉豪還說(shuō)道,目前廠商從向 Amazon 提交申請(qǐng)到最終讓產(chǎn)品接入 Alexa 的時(shí)長(zhǎng)大概為 2 個(gè)月。但需要注意的是,隨著越來(lái)越多廠商的申請(qǐng)接入,申請(qǐng)周期將會(huì)延長(zhǎng)。
問(wèn)答
Q:放在機(jī)器人上的人工智能跟放在音箱上的有一定區(qū)別,我們會(huì)期待除了聲音之外還會(huì)有更多的結(jié)合的交互。因?yàn)閮?yōu)必選做機(jī)器人,應(yīng)用了 Alexa 之后是否會(huì)有一些搭配?比如說(shuō)做一些多模塊的交互來(lái)與語(yǔ)音交互進(jìn)行結(jié)合,也就是在交互方面是怎么思考的?
A:優(yōu)必選其實(shí)是做人形機(jī)器人,與音箱最大的不同是,人形機(jī)器人有肢體,可以有豐富的能力。所以說(shuō),我們?cè)诮尤?Alexa 時(shí)結(jié)合了硬件的特點(diǎn),有更豐富的肢體語(yǔ)言,比如讓機(jī)器人可以跟著用戶一起做瑜伽。同時(shí)我們會(huì)在系統(tǒng)上加深運(yùn)用,比如開(kāi)放一些針對(duì)家庭監(jiān)控、視頻通話的功能,讓我們的產(chǎn)品跟 Alexa 區(qū)別出來(lái)。
Q:對(duì)兒童的聲音有沒(méi)有什么特別的識(shí)別方法?這個(gè)問(wèn)題擴(kuò)展出去是,在家庭場(chǎng)景下面,我們針對(duì)一個(gè)兒童能識(shí)別出他的聲音,然后給它對(duì)應(yīng)到是否兒童的內(nèi)容,就比如更加安全的環(huán)境。
A:因?yàn)槲覀儥C(jī)器人是相通的,針對(duì)不同的用戶調(diào)取不同的應(yīng)用,舉個(gè)簡(jiǎn)單的例子,我們可以調(diào)取整個(gè)攝像頭,然后通過(guò)后臺(tái)的算法去算出這個(gè)用戶大概是多少歲的,如果他是小于 16 歲,就把他識(shí)別是一個(gè)兒童,這樣我們就可以去調(diào)取針對(duì)兒童的語(yǔ)音識(shí)別算法,同時(shí)為他調(diào)取一些跟兒童相關(guān)的內(nèi)容,比如兒歌。這就要去跟別的硬件進(jìn)行深度的結(jié)合,如果僅僅通過(guò)語(yǔ)音的話其實(shí)不太夠。