全系標(biāo)配滿級(jí)防水,OPPO A5 系列新品正式發(fā)布

3 項(xiàng)新技術(shù)發(fā)布,5 大語音方案競(jìng)技,9 大咖共話語音 AI 的下一站 | WARE 2019
遺憾錯(cuò)過會(huì)議,還可以通過這篇文章補(bǔ)救一下~
上周,深圳灣年度 WARE 2019 新硬件峰會(huì)第 II 季在深圳如期舉行。
作為國(guó)內(nèi)最早一批關(guān)注語音智能、智能音箱的媒體,深圳灣從單品、平臺(tái)、生態(tài),關(guān)注著行業(yè)里的一舉一動(dòng),每一次的行業(yè)會(huì)議都聚焦當(dāng)下的熱門議題。
在 4 月的那場(chǎng)「WARE 2019」新硬件峰會(huì)上,我們聚焦「ON THE GO」的主題,探討了隨行 AI 場(chǎng)景的產(chǎn)品創(chuàng)新。
3 個(gè)月后,也就是這次峰會(huì),我們將關(guān)注點(diǎn)放到了與智能語音相關(guān)的 AI 前沿技術(shù)和應(yīng)用方案商,并賦予了「ALWARYS ON」的主題。ALWAYS ON 意在「無處不在和無時(shí)不在的語音助手」,探索這一愿景下,AI 技術(shù)有了哪些新的進(jìn)展,行業(yè)面臨了哪些新的挑戰(zhàn)和機(jī)遇,又有哪些有潛力的新應(yīng)用場(chǎng)景。
為了找到這些問題的答案,我們邀請(qǐng)了 9 位嘉賓,他們分別來自互聯(lián)網(wǎng)企業(yè)、AI 和 IoT 技術(shù)平臺(tái)商和方案商、元器件和芯片方案商、技術(shù)型創(chuàng)業(yè)公司,為我們做出一一的解答。

1.三大趨勢(shì)
2021 年每 4 個(gè)家庭消費(fèi)電子設(shè)備中有一個(gè)集成語音助手
所謂春江水暖鴨先知,在普通消費(fèi)者見到產(chǎn)品前,方案商、技術(shù)廠商就已經(jīng)嗅到了商機(jī)和方向。
關(guān)于整體行業(yè)市場(chǎng)預(yù)測(cè),LinkPlay 分享了一組數(shù)據(jù):
2018 年,家庭消費(fèi)電子(CE)設(shè)備市場(chǎng)總量達(dá)到了 20 億臺(tái),其中 12% 集成了語音助手(VA),相當(dāng)于 2.49 億臺(tái)設(shè)備具有語音交互的能力,這里不包括「work with」的設(shè)備。
在這些 VA 設(shè)備 ,遠(yuǎn)場(chǎng)設(shè)備占比 2%,大約為 4000 萬~5000 萬臺(tái)。預(yù)計(jì)到 2021 年,每 4 個(gè)家庭 CE 設(shè)備中有一個(gè)集成 VA。
家電、車載、酒店等細(xì)分場(chǎng)景,催生新的技術(shù)熱點(diǎn);遠(yuǎn)場(chǎng)全雙工、多模態(tài)交互,成為智能設(shè)備標(biāo)配
在產(chǎn)品落地的場(chǎng)景方面,思必馳認(rèn)為,智能音箱、手機(jī)之后,智能小家電、可穿戴設(shè)備等設(shè)備,將成為 AI 新一輪賦能目標(biāo)。在萬物皆可+AI 的趨勢(shì)下,催生新的技術(shù)熱點(diǎn),包括全雙工、分布式麥克風(fēng)陣列、多設(shè)備聯(lián)動(dòng)的喚醒機(jī)制等,都將成為智能設(shè)備的標(biāo)配。
而在移動(dòng)出行服務(wù)的領(lǐng)域,地平線認(rèn)為,車載智能的競(jìng)爭(zhēng)升級(jí),能夠提供極致交互體驗(yàn)將成為制勝關(guān)鍵,集成了手勢(shì)、指紋、體征、眼球、語音等感知方案的多模態(tài)交互,是下一代人機(jī)交互的趨勢(shì)。
在行業(yè)市場(chǎng),酒店成為 AI 廠商新一輪的角逐。犀動(dòng)智能科技指出,2018 年全球智能語音音箱市場(chǎng)(80M units)已經(jīng)超過平板,互聯(lián)網(wǎng)公司對(duì)于語音入口的爭(zhēng)奪戰(zhàn),提升了用戶認(rèn)知以及產(chǎn)業(yè)鏈支持。而隨著消費(fèi)者對(duì)于智能語音、智能客控的接受程度在成長(zhǎng),酒店內(nèi)的高頻人流,將成為下一代 NLP 訓(xùn)練與落地的垂直細(xì)分場(chǎng)景。
通話降噪成為 TWS 新一輪產(chǎn)品競(jìng)爭(zhēng)力的體現(xiàn)
隨著 AirPods 引爆真無線藍(lán)牙耳機(jī)(TWS)耳機(jī)市場(chǎng),市場(chǎng)對(duì)體驗(yàn)更好的 TWS 產(chǎn)品的需求量加大,低功耗、體積小、體驗(yàn)好,成為新一輪產(chǎn)品競(jìng)爭(zhēng)的重點(diǎn)。大象聲科認(rèn)為,通話降噪體驗(yàn)將成為 TWS 產(chǎn)品競(jìng)爭(zhēng)力的體現(xiàn)。
2.三大新發(fā)布
樓氏推出微型聲學(xué)電控閥門,降噪交談兩不誤
樓氏電子,70 多年來致力于研發(fā)應(yīng)用于助聽器和其他電子設(shè)備的微型聲學(xué)元器件,在近年來一直在推動(dòng)動(dòng)鐵、硅麥、智能麥克風(fēng)等產(chǎn)品在消費(fèi)硬件領(lǐng)域的應(yīng)用。
降噪隔音和聽取外界音,往往不可兼得。針對(duì)這點(diǎn),樓氏基于自身在微機(jī)電技術(shù)研發(fā)領(lǐng)域的積累,推出全球首個(gè)用于耳機(jī)的微型聲學(xué)電控閥門。
據(jù)樓氏電子席金苗介紹,采用樓氏微型聲學(xué)電控閥門的耳機(jī)具備環(huán)境感知能力,能夠自動(dòng)控制閥門的打開與閉合,具有功耗小、沒有延遲和失真等特點(diǎn),方便用戶在無需取下耳機(jī)的情況照常聽取外界音和交談。
席金苗透露,樓氏微型閥門在研發(fā)當(dāng)中,將會(huì)在某些客戶的新品中應(yīng)用和發(fā)布。

大象聲科亮相新技術(shù),AI 通話降噪+骨傳導(dǎo),現(xiàn)場(chǎng)演示耳機(jī)通話降噪新境界
深度學(xué)習(xí)大規(guī)模應(yīng)用在語音識(shí)別和語音合成當(dāng)中,但是在語音前端信號(hào)處理當(dāng)中,深度學(xué)習(xí)的應(yīng)用只是剛剛開始。
2017 年成立的大象聲科則是全球第一家大規(guī)模商用基于深度學(xué)習(xí)單通道語音增強(qiáng)方案的公司。在 2018 年年底,更是因?yàn)楦咄旪埲蚣夹g(shù)峰會(huì)上現(xiàn)場(chǎng)展示,獲得了業(yè)內(nèi)關(guān)注與認(rèn)可。目前,國(guó)內(nèi)多款智能手機(jī)都已采用大象聲科 Vocplus Telecom 降噪方案,成功實(shí)現(xiàn) AI 通話降噪功能,為成千上萬的用戶帶來了更清晰的語音通話體驗(yàn)。
蘋果 AirPods 引爆 TWS 耳機(jī)市場(chǎng),藍(lán)牙連接的穩(wěn)定性問題得到解決之后,通話降噪更是重中之重。大象聲科也將之納入今年的工作重點(diǎn)之一。
對(duì)此,大象聲科打造了 AI+bone sensor 通話降噪方案,將 AI 通話降噪和骨傳導(dǎo)傳感器高效融合,覆蓋低信噪比全場(chǎng)景,不論是在地鐵,商場(chǎng),KTV, 還是風(fēng)噪場(chǎng)景,都能大幅提升通話清晰度,并且僅需要一個(gè)麥克風(fēng),能夠提高工程效率,節(jié)省硬件成本。
會(huì)上,苗健彰對(duì)該方案進(jìn)行了首次公開演示。
犀動(dòng)智能科技推出「犀動(dòng)易聊」,現(xiàn)場(chǎng)演示非固定指令式的自然對(duì)話式體驗(yàn)
從 Google Assistant 退役創(chuàng)業(yè)的 Vic Shen,在本次大會(huì)正式亮相了他的創(chuàng)業(yè)項(xiàng)目犀動(dòng)智能科技。聚焦在酒店語音服務(wù)垂直場(chǎng)景,犀動(dòng)推出軟硬件的一體化解決方案小犀管家,實(shí)現(xiàn)了 24x7 全天候的智能語音交互,并率先支持同時(shí)多語義識(shí)別,同時(shí)支持多輪對(duì)話以及雙語并發(fā)。
Vic 表示,基于語音和影像的搜尋會(huì)占據(jù) 50% 搜尋的入口,基于此,犀動(dòng)智能科技利用類影像處理的機(jī)器學(xué)習(xí)來處理語義理解,創(chuàng)造自然對(duì)話,多意圖分析,為酒店客房提供「非固定指令式的自然對(duì)話式體驗(yàn)」。
通過現(xiàn)場(chǎng)的演示,我們可以看到,犀動(dòng)智能科技的對(duì)話系統(tǒng)「犀動(dòng)易聊」,可以將多層選擇過程簡(jiǎn)化為一個(gè)語音指令,通過卡片化的方式,呈現(xiàn)出房客多個(gè)需求并加以引導(dǎo),再通過引入新的商業(yè)模式「全天候采購(gòu)導(dǎo)引」來滿足用戶需求。
現(xiàn)階段,單體酒店導(dǎo)入 AI 技術(shù),進(jìn)行智慧化轉(zhuǎn)型的技術(shù)壁壘依舊很高,因此更需要可以幫助酒店進(jìn)行成本流程管理優(yōu)化的系統(tǒng),并將線上內(nèi)容和服務(wù)集成,產(chǎn)生新的服務(wù)收入。

3.語音方案競(jìng)技
LinkPlay 推出 Voice Assistant 2.0 方案,更聰明,無處不在,并具有繁榮的內(nèi)容和服務(wù)生態(tài)
作為智能語音的先行者,亞馬遜 Alexa 認(rèn)證合作伙伴,以及多家語音產(chǎn)品背后的技術(shù)力量,成立五年的 LinkPlay 已經(jīng)積累了 200 多種硬件設(shè)備的語音智能化經(jīng)驗(yàn)。
在會(huì)上,LinkPlay CEO 趙立峰講述了近年語音設(shè)備的技術(shù)和產(chǎn)品化的演進(jìn),他認(rèn)為,新一代語音助手(Voice Assistant 2.0)將更聰明,無處不在,并且具有繁榮的內(nèi)容和服務(wù)生態(tài)。
趙立峰總結(jié),不管是想做 Works With VA 還是 Built-in VA 產(chǎn)品的廠商,主要面臨以下幾個(gè)問題:一是產(chǎn)品定義;二是目前 VA 能力不足(在聽清、聽懂方面);三是割裂的 VA 生態(tài)系統(tǒng),形成數(shù)據(jù)、產(chǎn)品運(yùn)營(yíng)壁壘;四是安全和隱私。
對(duì)此,圍繞從硬件到提供「硬件+服務(wù)」的轉(zhuǎn)化,LinkPlay 提供 Voice Built-in Solution (VBS) 的方案以及 LinkPlay 云服務(wù),涵蓋完整的軟硬件系統(tǒng)、高可靠性/低延時(shí)的設(shè)備控制云、VBS API/SDK、控制 App(Android,iOS,未來加入 PC)、自動(dòng)化測(cè)試和量產(chǎn)程序等完整的服務(wù)鏈條。旨在簡(jiǎn)化產(chǎn)品開發(fā)難度,提供新產(chǎn)品參考設(shè)計(jì),協(xié)助客戶快速上市,確保后續(xù)產(chǎn)品更新維護(hù)。
三年前,在 WARE 2017 第 I 季的峰會(huì)上,亞馬遜 Alexa 首次在國(guó)內(nèi)的第三方媒體平臺(tái)做公開分享,隨著 Alexa Voice Assistant 設(shè)備打響的,還有國(guó)內(nèi)的「百箱大戰(zhàn)」,包括 BAT 在內(nèi)的國(guó)內(nèi)平臺(tái)廠商和 AI 廠商,也紛紛推出了自家的語音助手(VA)。而作為 VA 背后的廠商的 LinkPlay 經(jīng)歷了整個(gè)過程,感慨頗深。
當(dāng)深圳灣問及 LinkPlay 對(duì)國(guó)內(nèi) VA 市場(chǎng)的看法時(shí),趙立峰指出,國(guó)內(nèi)百度、阿里、騰訊等平臺(tái)大廠對(duì) VA 的普及功不可沒,但隨著各家在自有品牌語音硬件設(shè)備的耕耘的重心轉(zhuǎn)移,LinkPlay 也將合作方向轉(zhuǎn)向致力于推動(dòng)第三方設(shè)備語音智能化的平臺(tái)合作伙伴。

聲智科技推出 SoundAI Azero,能夠快速落地的一站式解決方案?
成立 3 年的聲智科技是一家融合聲學(xué)和人工智能技術(shù)的平臺(tái)服務(wù)商。目前,聲智科技已成為全球最大的智能音箱技術(shù)供應(yīng)商之一,曾服務(wù)于 BAT、小米、華為、360,是一家「躲在巨頭背后的服務(wù)提供商」,其技術(shù)實(shí)力已經(jīng)被各大廠的「頭牌」智能音箱所證明。
從智能音箱時(shí)代一路走來,聲智科技銷售總監(jiān)周治國(guó)揭示了行業(yè)狀況:中小企業(yè)面臨著進(jìn)場(chǎng)難的問題。與傳統(tǒng)硬件相比,智能語音產(chǎn)品技術(shù)鏈條?、聲學(xué)調(diào)試?yán)щy、內(nèi)容聚合難、平臺(tái)移植難、開發(fā)周期?。受限于團(tuán)隊(duì)的資金和技術(shù)能力,要把語音 AI 的用戶體驗(yàn)成熟度做到產(chǎn)品級(jí)并實(shí)現(xiàn)量產(chǎn),期間的挑戰(zhàn)并不小。
為此,聲智科技發(fā)布了全鏈條遠(yuǎn)場(chǎng)智能交互系統(tǒng)「SoundAI Azero」。該系統(tǒng)以遠(yuǎn)場(chǎng)語音交互和遠(yuǎn)場(chǎng)雙工通話為技術(shù)內(nèi)核,兼容主流芯片架構(gòu)、硬件設(shè)計(jì)和聲學(xué)結(jié)構(gòu),具有一站式 Turnkey 解決方案、全面的語音交互能力、高整合內(nèi)容資源、協(xié)議兼容性強(qiáng)、兩周實(shí)現(xiàn)快速開發(fā)等特點(diǎn),可廣泛應(yīng)用于多種場(chǎng)景的硬件設(shè)備。
AI+IoT+5G 背景下,行業(yè)需要能夠快速落地的一站式解決方案。通過 Azero 系統(tǒng),聲智科技希望將語音引申到各行各業(yè),用一套系統(tǒng)解決所有事情,降低中小客戶在這方面的投入,還希望在各個(gè)細(xì)節(jié)做精、做細(xì),幫助設(shè)備廠商又快又好地實(shí)現(xiàn)產(chǎn)品開發(fā)和量產(chǎn)。
思必馳小家電和小型設(shè)備智能化解決方案,具有「去中心化」和「小而快」的優(yōu)勢(shì)
隨著「萬物皆可上云,萬物皆可計(jì)算」的物聯(lián)網(wǎng)時(shí)代來臨,小到耳機(jī),大到空調(diào)、洗衣機(jī),幾乎所有設(shè)備都有 + AI 的需求,對(duì) AI 廠商來說,智能音箱之后,智能小家電是一個(gè)正在發(fā)展壯大的藍(lán)海市場(chǎng)。
區(qū)別于智能音箱、手機(jī),智能小家電具有主頻低的特點(diǎn),對(duì)語音交互功能的需求單一。針對(duì)智能白電、智能小家電和智能穿戴等設(shè)備,思必馳在今年推出了低功耗算法方案,幫助小設(shè)備快速賦能 AI。
結(jié)合產(chǎn)品應(yīng)用場(chǎng)景,根據(jù)硬件結(jié)構(gòu)評(píng)審和聲學(xué)評(píng)估結(jié)果,思必馳低功耗算法方案提供相應(yīng)的單項(xiàng)/組合項(xiàng)算法方案,主要可分為一級(jí)低功耗喚醒,二級(jí)喚醒驗(yàn)證,三級(jí)聲紋驗(yàn)證。
目前,針對(duì)近場(chǎng)交互設(shè)備、手機(jī)、耳機(jī)、兒童故事機(jī)等終端,思必馳均已有成型、能夠快速運(yùn)用的低功耗解決方案。
面對(duì) 5G、物聯(lián)網(wǎng)浪潮,思必馳始終夯實(shí) AI 能力,將自己定位為一家市場(chǎng)需求驅(qū)動(dòng)型技術(shù)公司,「技術(shù)廠商是規(guī)定不了客戶需求的,我們所有的發(fā)展和方案輸出都由客戶決定。」
△ 思必馳 CMO 龍夢(mèng)竹
地平線推出軟硬件一體化全棧解決方案,將自動(dòng)駕駛上的技術(shù)和經(jīng)驗(yàn),賦能到汽車座艙
提起地平線這家公司,大家對(duì)它的第一印象普遍聚焦在自動(dòng)駕駛業(yè)務(wù)上。事實(shí)上,地平線也同時(shí)在積極開拓 AIoT 業(yè)務(wù),將自動(dòng)駕駛上嘗試的技術(shù)和經(jīng)驗(yàn),落地到家居、消費(fèi)電子、人機(jī)交互的等應(yīng)用。
地平線多模交互產(chǎn)品總經(jīng)理張宏志表示,多模態(tài)交互是下一代人機(jī)交互的趨勢(shì),核心在于「主動(dòng)」。要做到這點(diǎn),機(jī)器首先需要具備感知能力,精準(zhǔn)識(shí)別人的需求,其次是針對(duì)場(chǎng)景、個(gè)性化提供服務(wù)的策略。
以智能座艙場(chǎng)景為例,地平線將芯片、語音、圖像技術(shù)融合在一起,提供軟硬件一體化全棧解決方案,從情緒、視線、表情、手勢(shì)等方面,對(duì)人機(jī)交互進(jìn)行判斷,交互對(duì)象從駕駛員向車內(nèi)所有人轉(zhuǎn)變,交互方式向主動(dòng)交互轉(zhuǎn)變,提供有針對(duì)性的交互邏輯。
張宏志認(rèn)為,自動(dòng)駕駛是人工智能時(shí)代的關(guān)鍵,自動(dòng)駕駛的實(shí)現(xiàn)是一個(gè)攀登珠穆朗瑪峰的過程,在真正實(shí)現(xiàn)的時(shí)候,也就是人工智能技術(shù)成熟、普及的時(shí)候。

犀動(dòng)酒店服務(wù)數(shù)字化系統(tǒng),小團(tuán)隊(duì)打造的酒店線上入口
近一兩年來,巨頭補(bǔ)貼,不僅使行業(yè)進(jìn)入洗牌階段,還一定程度上做好了市場(chǎng)鋪墊。精明的創(chuàng)業(yè)者往往能從中挖掘新的機(jī)會(huì)。
2018 年 10 月成立的犀動(dòng)智能科技(Aiello)就從酒店的垂直場(chǎng)景出發(fā),為酒店行業(yè)提供「軟件-硬件-系統(tǒng)」的一體化解決方案,以及 SaaS 平臺(tái)。
犀動(dòng)智能科技分享了一組關(guān)于酒店行業(yè)的數(shù)據(jù):在國(guó)內(nèi)和東南亞的一些酒店,語音控制已成為房屋更新方案的標(biāo)配,大多成本控制在 200 元、500 元/間。據(jù)統(tǒng)計(jì),國(guó)內(nèi)大約有 1500 萬個(gè)酒店/公寓房間(不包含 Airbnb 等民宿),在國(guó)內(nèi)智能酒店、服務(wù)型公寓是一個(gè)藍(lán)海市場(chǎng)。
相比家庭環(huán)境,酒店場(chǎng)景下的智能音箱,因客人流動(dòng)性大,且高頻次的特點(diǎn),收集到的樣本量往往更大。Aiello 的方案為酒店搭建數(shù)字化平臺(tái),幫助酒店提高服務(wù)效率,從線上切入滿足線下住戶需求,包括住中反饋、語音用戶畫像趨勢(shì)分析、零售、旅游推薦等。
目前,產(chǎn)業(yè)互聯(lián)網(wǎng)盛行,犀動(dòng)智能科技認(rèn)為,做 2B 業(yè)務(wù)要尊重傳統(tǒng)行業(yè),從傳統(tǒng)行業(yè)的需求出發(fā)提供可行性方案,打造差異化,這也是中小型創(chuàng)業(yè)公司的機(jī)會(huì)。
4.兩大開源平臺(tái)
Google TensorFlow Lite,助力實(shí)現(xiàn)低功耗、低成本的端上機(jī)器學(xué)習(xí)
在今年 Google I/O 大會(huì)上,Google Assistant 秀新肌肉:基于 Google 的神經(jīng)網(wǎng)絡(luò)和機(jī)器學(xué)習(xí)算法,Google Assistant 的 100GB 語音識(shí)別模型在運(yùn)行中所占據(jù)的字節(jié)不到 0.5 GB,運(yùn)行速度比前代的速度快了 10 倍,實(shí)現(xiàn)零延時(shí)、本地化。
Google TensorFlow 資深軟件工程師王鐵震認(rèn)為,這顯示了「The future of ML is tiny」的趨勢(shì),即深度學(xué)習(xí)的兩大趨勢(shì):更小的學(xué)習(xí)、更強(qiáng)的芯片。
王鐵震透露,目前 Google 正在探索如何將深度學(xué)習(xí)部署到 MCU 上,一旦得到廣泛應(yīng)用,也就意味著,智能硬件以后可以用更小的芯片實(shí)現(xiàn)本地化、更低的功耗,更低的低成本,真正讓語音「無處不在」。這一成果也將被廣泛應(yīng)用在智能門鎖、集聯(lián)喚醒、能量采集等場(chǎng)景,有非常大的想象空間。
△ Google TensorFlow 資深軟件工程師王鐵震
Ubuntu Core,為安全、設(shè)備升級(jí)管理、軟件服務(wù)收益保駕護(hù)航
Ubuntu 是開發(fā)者使用最廣泛的 Linux 平臺(tái),可以將 IoT 設(shè)備連接到服務(wù)器和云。經(jīng)過多年的發(fā)展,Ubuntu 已經(jīng)從一個(gè)的操作平臺(tái)演變成一套完整從云端到設(shè)備的生態(tài)鏈。在云端,為企業(yè)提供了 Ubuntu 服務(wù)器認(rèn)證,自動(dòng)化部署和 OpenStack 等解決方案。在設(shè)備端,提供專為 IoT 所設(shè)計(jì)的 Ubuntu Core。
Canonical 資深工程師和 IoT 架構(gòu)師彭日廷表示,IoT 在與 AI 的融合過程面臨著很多挑戰(zhàn),包括安全存在隱患、設(shè)備升級(jí)管理難、軟件服務(wù)的收益難等。在這些方面,Ubuntu 從 Brand Store,Snapcraft,Snap 板塊提供全方位的支持,方便企業(yè)管理和更新,確保設(shè)備的安全性。
最后,編輯在文末還準(zhǔn)備了本次大會(huì)的報(bào)道合集,以及往屆 WARE 峰會(huì)的精彩內(nèi)容,歡迎點(diǎn)閱。
微信號(hào):shenzhenware
圖文編輯:深圳灣編輯部
// WARE 2019 · ALWAYS ON //
// WARE 2017-2019 歷屆精彩回放 //
回顧寫的非常詳實(shí)和深度!