全系標配滿級防水,OPPO A5 系列新品正式發布

語音 AI 向車載場景拓張,3 年 4 大戰場全回顧,以及未來展望 | 特稿
車載語音歷經 3 年發展,普及率比智能音箱高出 45% 以上,玩家橫跨平臺商、AI 技術服務商、車載配件設備商、手機廠、車廠。這是一個持續升溫的大市場,預計到 2028 年,全球近 90% 的新車將標配語音助手。
2017 年 3 月 22 日,美國福特車主多了一個福利——通過亞馬遜 Alexa 語音平臺就可以向星巴克訂購咖啡。車主無需離開方向盤,就可以完成從語音指令選單、再到支付下單的一系列動作,然后就可以 Drive-In 取咖啡了。
福特 SYNC 平臺于 2007 年首次推出,支持通過藍牙連接移動設備和語音命令。2017 年,在亞馬遜的推動下,已經升級為 SYNC 3 的福特智駕系統,完成了與 Alexa 的語音集成,用戶可以在家中與 Echo 智能音箱對話,完成打開車窗、空調等指令。
而此次福特、亞馬遜和星巴克聯手推出的語音點咖啡的功能,透露著語音助手已經開始從家中逐漸走向車內。

△ 福特 SYNC 3 集成 Alexa
幾乎是在同一時間,在 2017 年 3 月 30 日這一天,大洋彼岸的大眾汽車集團(中國)與人工智能公司出門問問簽署了合作協議,確定將共同成立一家合資企業,由大眾汽車集團與出門問問共同持股,雙方各持 50% 的股份。同時,大眾汽車集團對出門問問戰略投資 1.8 億美元,雙方聯手展開人工智能技術的研發,并將其應用于汽車行業。
大眾汽車集團在汽車和移動出行領域的領導地位不必贅述,選擇出門問問更多的是看中了其軟硬結合的能力——出門問問在 AI 語音領域擁有多年的技術積累,在智能家居和可穿戴設備等消費級硬件領域,也有多年的應用探索。大眾汽車集團與出門問問的聯姻廣受行業和媒體關注,成為推動車載語音從 demo 走向「大眾」的重要力量。

△ 一汽-大眾新邁騰智能車機
如今,3 年過去了,車載語音領域發生了很多事,很多車企和語音公司也都陸續交出了答卷,我們對于行業的認知和趨勢的判斷,也在悄悄的發生變化。就讓我們一起梳理一下吧:
過去 3 年,車載語音 4 大戰場逐步升溫
縱觀整個車載語音行業的發展歷史,我們將目光聚焦在以下 4 大戰場:
一號戰場:語音 AI 巨頭車載場景賦能戰
2017 年,隨著亞馬遜和 Google 智能語音軍備賽的打響,兩家巨頭紛紛將戰場從語音 AI 應用已經相對成熟的智能家居領域引向車載場景。
第一階段,與傳統車企合作,將各家的語音助手引入到部分車型上,通過手機和第三方設備,在車內實現導航、聽歌、打電話等基本的語音交互。第二階段,與傳統車企合作,將語音助手植入到車機系統中,實現雙向且更多與車輛相關聯的控制。
Google 于 2017 年宣布將 Google Assistant 集成到了 Android Auto 平臺中。亞馬遜則于次年推出 Alexa Auto SDK 車載套件,幫助車廠完成更深度的語音助手的集成。

△ Google 在 CES 2020 上展示的內置了 Android Auto 的 Volvo XC40
二號戰場:車載配件市場升溫
車載配件市場的熱度也在這一輪語音 AI 巨頭的推動下,出現了大幅的提升。Garmin Speak、Roav Viva、Muse 等搭載了亞馬遜 Alexa 或 Google Assistant 語音套件的智能硬件,紛紛走進車內。

△ Garmin Speak
2018 年 10 月,亞馬遜推出了車載后裝產品車載連接器 Echo Auto。接入汽車電源口,通過藍牙連接已安裝 Alexa app 的手機后,便可用語音交互獲取 Alexa 的在線服務。

△ Echo Auto
國內市場,早在 2016 年,出門問問的第一代智能車載產品問問魔鏡 TicMirror 和問問魔眼 TicEye 發布,率先將語音交互引入到車載配件市場。

△ 問問魔鏡 Ticmirror (智能后視鏡)和問問魔眼 Ticeye(ADAS 系統)
一個月后,國內的百度推出旗下首款語音智能車載產品——小度語音車載支架,通過一個簡單的手機支架(+車充)+ 雙麥克風陣列,匹配手機 app,實現百度云端資源和服務能力的對接。

△ 集成了百度地圖和百度語音助手「小度」的小度車載支架
不難看出,這類小「配件」產品,以及相應的藍牙協議/平臺的發布,意味著用戶可以以最小的成本將語音助手服務移植到車載場景。
三號戰場:手機廠商開啟「駕駛模式」
與此同時,Google、小米等手機廠商也打造了場景化的「駕駛模式」,允許用戶在車里直接通過手機喚醒語音助手,打開「信息儀表盤」并調用相應的服務。
與手機語音助手的深度整合,也透露著手機廠商的語音助手「全場景、跨設備」的發展規劃。

△ Google I/O 2019 亮相的 Pixel 手機的「駕駛模式」
四號戰場:傳統車企打造自家語音助手
在 2017 和 2019 的 3 年間,福特、寶馬、現代、尼桑等一線車企開始加大投資,或將 Google、亞馬遜等語音 AI 能力整合到自己的系統中,或與 Nuance / Cerence 等嵌入式語音公司合作,為新車定制更智能、體驗更好的語音助手。
而在國內戰場,大眾汽車集團與出門問問、上汽與阿里、廣汽與騰訊、小鵬與思必馳、蔚來和吉利與科大訊飛,紛紛在攜手后交出了答卷。

△ 亞馬遜在 CES 2020 上宣布與蘭博基尼合作
車載語音是剛需,完善體驗是前提
毋庸置疑,與家居和隨身場景相比,車里的語音交互更具剛需。
你可以不必開口向智能音箱或 AirPods 發出指令,但你在開車的時候,用語音命令打開空調、調用導航、或回電話,安全價值業已成為新生代駕駛員的交互習慣。
兩個月前,來自 Voicebot 的一份消費者調研報告顯示,在美國,有近 1.3 億人使用車載語音助手,普及率比智能音箱高出 45% 以上。
使用車載語音助手的活躍度也在提升,月活躍度為 64.6%,車載語音助手的月度活躍用戶幾乎與智能音箱所有者的總數一樣多。

資源分享:關注深圳灣(微信號:shenzhenware)公眾號,在對話窗口輸入「auto 2020」或「車載語音報告」,下載完整報告。
我們預見車載語音將成為未來智慧出行和自動駕駛的重要組成部分,甚至在三年前,深圳灣就曾這樣預言過。而隨著消費者使用習慣的逐漸養成,語音助手的普及不僅僅是語音 AI 廠商在推動,越來越多的車企加入到這場變革中,并發揮著越來越重要的作用。
但語音助手的交互體驗上,還存在著或多或少的問題。比如,在車廂內風噪、胎噪、多人會話的場景,語音識別不準確;再比如,對行車中的特定語音控制命令和對話內容理解不到位;還有,不能與車內的儀表盤控制系統整合在一起,等等,都極大的影響了用戶的體驗。
亞馬遜 Alexa 最近的一份調查顯示,在各項車載語音能力中,車載語音識別滿意度最低。這也折射了車載語音場景的復雜度,相對家居場景,要復雜的多。

△ 亞馬遜 Alexa 車載語音滿意度調查(來源:Voicebot)
前三年的探索,讓我們看到了,不單是手機等智能設備在車載場景的交互方式受限,更重要的是,將通用語音助手移植到車載場景的做法,存在著很多的局限。要打造體驗更好的車載語音交互系統,必須要針對車內場景做深度的定制和優化。
車載語音,前裝是關鍵,但并不簡單
我們再回顧過去 3 年,在大眾汽車集團和出門問問聯姻后,看出門問問是如何解決如上的問題的。
當時很多媒體將這一聯姻當做一次融資事件解讀,其實,更重要的意義是,別家還在各車廠拜訪打關系的時候,出門問問已經穩穩的攥到了前裝市場的門票。
前裝的方式能夠解決后裝智能設備的諸多問題,包括針對車載環境的語音交互效率,以及車載設備的控制等等。
出門問問創始人李志飛曾經表示,出門問問 AI 研發團隊「70% 的精力花在前裝車載語音交互技術的打磨上」。一方面是因為大眾汽車集團的要求非常苛刻——問問的工程師描述為「近乎到變態」,另一方面,盡管需求不斷提升和變化,但問問的研發團隊都給予了「超乎預期的」滿足。現在看來,盡管一路坎坷,但「前裝」策略還是很快見到了成效。
2018 年,出門問問的車載核心 AI 語音交互技術已通過旗下合資子公司大眾問問落地于江淮大眾 SOL(思皓)E20X 的前裝中,大眾問問還與德賽西威聯合打造并發布了智能車機產品。

△ 德賽西威-問眾智能車機
據官方透露,截至目前,出門問問主導研發的車載語音交互系統已經落地在大眾汽車集團旗下新邁騰家族系列、帕薩特、奧迪等多個主流車型,2020 年預計將落地 100 萬輛全新汽車,若以此增速,到 2023 年將可落地近 1000 萬輛。

△ 出門問問車載語音交互系統落地車型
兩年多的時間里,出門問問研發了一整套離在線結合的嵌入式車載語音交互系統,實現了完整的語音交互,包括前端信號處理、固定喚醒詞、自定義喚醒詞、快詞指令(比如車載地圖控制和音樂控制命令)、語音識別、自然語言理解、對話管理、語音合成等。
如何理解離線混合呢?我們在行車的大多數狀況下,使用的是移動蜂窩網絡。盡管大部分的高端車已經實現了 100% 的網絡滲透率,但仍有很多諸如隧道等復雜的網絡環境讓我們處于離線狀態,這個時候只支持在線的系統就無法即時反饋語音交互需求。
而有了這套離線和在線的混合系統,駕駛者不僅能在離線情況下,使用車內語音交互來實現多種車控功能,同時也能夠快速觸達多項服務。
為應對車規級的嚴苛標準,出門問問將系統內存控制在 450M 以內,CPU 占用低,整體響應時間快,在識別效果、播報體驗、響應時間、資源消耗等目標中,都達到了非常好的數據指標。
值得一提的是,出門問問首次在前裝系統中實現了全場景打斷(all-scene barge-in)、自定義喚醒詞、無間斷連續查詢(one shot)、智能等候(always on)等眾多功能,語音交互能力獲得了極大的提升。
我們可以從這個視頻中更好的理解這些技術是如何應用在車載環境中的,簡單舉兩個例子。
你好,帕薩特。// 自定義喚醒詞,你也可以說,你好,大眾。
我想吃火鍋,吃點心,吃小籠包。// 間斷連續查詢,期間不需要重復喚醒。
其實,這些技術應用在家居和可穿戴場景并不陌生,出門問問也已經有了多年的沉淀,如今拓展到車載場景,雖說可以「輕車熟路」,但其實并不簡單。
出門問問的團隊告訴深圳灣,車載場景的復雜度不僅體現在網絡上,車廂內風噪、胎噪、多人會話的場景為語音識別制造了很多麻煩,這也是為什么此前基于后裝設備的車載語音滿意度低的主要原因。
另外,車載環境下,還存在諸如駕駛者不希望其他乘客喚醒語音助手的需求,這種需求在其他語音交互載體(如智能音箱)上不常出現,但卻要求車載語音交互系統具備定向收音的功能。
還有,車內的人機對話與家里的人機對話也有很多的不同,家里常用到的閑聊和知識問答等對話,在車中并不常見。出門問問針對車內的主要對話內容做了新的知識圖譜的梳理,做到對于特定語音控制命令可以理解到位。

在今年年初深圳灣對出門問問創始人李志飛的專訪中,曾經聊到這個話題:車載語音為什么不能像智能音箱一樣,既叫好、又叫座?李志飛的解答是:
語音交互雖然在其他類型的設備上存在了很長時間,但真正符合車載剛需場景標準的產品剛剛開始在市場上普及,消費者需要時間去體驗真正帶來用戶利益、解決車載痛點的產品。叫座只是時間問題。
對于這套預裝在大眾新車里的離在線語音交互系統,李志飛信心十足:
出門問問在車載嵌入式語音交互技術的積累非常多,原因是我們有一個非常挑剔的伙伴就是大眾汽車集團。我們做出了一整套離線系統,在全球都是領先的。本地的自然語言理解、本地搜索、本地喚醒,這在全球都是非常有競爭力的。
當被問及,大眾新車是否只是小規模應用?李志飛的回答是:
不。今年,預計將有 100 多萬輛車,會用到這套離在線的系統。
車載語音推動智慧出行的變革
在 2019 年的「超級碗」廣告中,梅賽德斯·奔馳將語音作為了廣告的主旋律,一句「Hey Mercedes」成為了焦點。
這是一個非常重要的信號。過去,梅賽德斯·奔馳等汽車制造商的新車廣告通常會在汽車的物理性能(如造型、動力、安全性、內飾、影音系統)上大做文章,而這一次,它向人們展示了基于 MBUX 系統的語音助手,為駕駛帶來的無以倫比的便利。

△ 梅賽德斯·奔馳的「超級碗」廣告(節選)
行業研究機構 Navigant Research 預測,到 2020 年代中期,將有 90% 以上的新車具有內置數據連接的能力——雖然目前主要是通過 LTE,但到 2022 年左右,將會普遍使用車載 5G。

而隨著 5G 等基礎網絡設備的日漸成熟,將有更多的車輛原廠內置語音助手。預計到 2028 年,全球近 90% 的新車將標配語音助手。
過去幾年,我們在家居和可穿戴領域,看到了很多類似的增長數據。而在車載領域,我們同樣有理由相信,就如同語音 AI 極大的推動了智能家居的普及一樣,車載語音將加速未來智慧出行的變革。
微信號:shenzhenware
主筆:陳壹零 / 深圳灣
編輯:四時 / 深圳灣
題圖來源:Just AI