從幕后走向臺前,這里是一些關于阿里 AI 音箱的靠譜猜想

比阿里早兩年入場的京東叮咚,在國產智能音箱之路上都收獲了什么 | WARE 2017 人物專訪
阿里發布音箱之前,先來看看京東旗下的叮咚。
阿里要推出智能音箱的消息,就像一枚重磅炸彈一樣扔在了媒體圈。而就在 7 月 5 日阿里發布會的前一天,7 月 4 日,京東的第 6 款智能音箱上線了。
作為阿里智能音箱的最強勁的對手,京東足足領先了阿里兩年。早在 2014 年底,京東與科大訊飛共同出資成立了北京靈隆科技有限公司。此后,靈隆科技陸續推出了一系列基于科大訊飛語音交互系統的智能音箱,并在上個月的 CES Asia 上發布了迷你款叮咚 Top 及叮咚 II 代智能音箱。

· 在 CES Asia 上亮相的叮咚 II 代智能音箱
兩年前,當劉強東拍板這個項目的時候,還有很多人認為他不過是聽了一些人的耳邊風,一時頭腦發熱,組個一個當時看來已經是豪華陣容的團隊,做了一款中國版的 Echo 秀一下實力。
兩年后,亞馬遜 Echo 風靡世界,中國眾多廠家紛紛涌入語音智能生態,或是做平臺,或是做設備,其中不乏阿里騰訊這樣的龍頭公司。就連百度和阿里,都競相著把發布會開到了同一天,迫不及待的搶占著風口和展現自己的能力。
國內智能音箱市場,是否也會因為這樣的風口而出現市場銷量的轉機?作為國內最早做智能音箱產品的公司之一,靈隆科技經歷了哪些曲折的發展歷程?又是怎樣看待百度和阿里的入局?帶著這些疑問,深圳灣(微信公眾號 ID:shenzhenware)采訪了靈隆科技 CEO 魏強博士。
從叮咚 A1 到叮咚 Top,國產智能音箱為何越賣越便宜?
叮咚音箱的語音交互系統由科大訊飛開發,渠道則由京東負責。從 2015 年 8 月的 A1 算起,也先后經歷了數次版本的迭代,相繼推出了 A 系列 、Q 系列音箱。不過這些產品的市場價格卻有逐漸降低的趨勢。
根據魏強的描述,最早的叮咚 A1 于 2015 年 8 月發布,這大概是國內最早發布的智能音箱之一。A1 旗艦版音箱采用了科大訊飛的 AIUI 語音交互系統,支持語音喚醒功能,能與百度音樂、喜馬拉雅等內容資源無縫連接,同時也支持第三方應用平臺的進駐。

之后的叮咚智能音箱的定價越來越親民, 2015 年 12 月推出了叮咚青春版, 199 的低價使它成為當時性價比最高的智能音箱產品。到了 2016 年 10 月,又推出了叮咚 A3 靈動版,其同樣搭載了 AIUI 交互界面,并且延續京東智能在家庭入口上的布局,較之 A1 的一個重大改善是 A3 自帶電池,使得應用場景可以拓展到室外,方便攜帶。
而已于 7 月 4 日開售的叮咚 TOP ,預約價定在了 299 元,這款產品的體積比以往的叮咚音箱小了很多,外形上頗有 Echo Dot 的即視感,性能上卻包容了叮咚智能音箱A1的所有功能,另外還增加了控制智能電視和將傳統音箱智能化等多種功能。

在兩年的時間里,叮咚智能音箱的產品系列,經歷了從單一到豐富,從生硬到柔和,從只能問天氣、放音樂到拓展到更多的叫洗衣、叫快遞服務的過程,這也是一條叮咚產品線向多元化迭代的一個過程。
除了叮咚,另一家主打語音產品的國產機器人公司 Rokid 也開始走低價策略,其新出的 Rokid·Pebble 機器人售價為 1399,價格約為早期的 Rokid·Alien 的十分之一。當深圳灣問道為何會出現這樣的定價策略時,魏強博士從如下三個角度給出了解釋:
- 數字內容市場的不成熟。目前國內的數字音樂市場還在不斷增長的過程中,在未來會逐步走向正軌;但較之歐美成熟的音樂載體硬件市場,目前的需求還不是很明顯。
- 低價產品可吸引小白用戶。對于搭載了人工智能概念的音箱產品,對于小白用戶來說,依然是一個陌生的概念。因此只有將產品的性價比提升到足夠的水平,才能吸引他們來體驗智能產品。
- 培育滲透率低的市場。低價策略能覆蓋到更廣的用戶群體,幫助他們去習慣與學習語音交互這樣一種新的人機交互方式,當用戶習慣了某種場景下的語音產品,就會持續對其他人產生影響力。

雖然叮咚音箱已經推廣了兩年,在國內智能音箱市場的知名度很高,但放眼到整個 3C 產業,智能音箱卻依然是一個非常小眾的產品品類。因此,投入低價產品,讓普通用戶也體驗到智能產品,培育用戶養成語音交互的習慣,同時根據用戶的反饋及時改善用戶體驗,是一件眼光長遠的事。
對標 Echo,絕不僅僅是一件與技術相關的事
叮咚智能音箱對標的是亞馬遜 Echo。靈隆科技成立之初,魏強帶領的團隊,很多人都認為,基于科大訊飛的技術和未來京東的賣場,很容易就能搞定并大賣的中國版 Echo,然而后來發現,并非那么容易。智能音箱,要做的工作還有很多。
魏強博士畢業于日本京都大學,研究方向是系統設計與人工智能,專業的學術背景也使得他能夠從一個更加專業的角度來審視智能音箱這個行業。
盡管對標 Echo,但是在諸如語音識別的準確率、喚醒速度、遠場識別、聲紋識別等語音技術上 ,魏強博士認為,目前 Echo 并不比叮咚更出色。但比技術更重要的是,亞馬遜在背后為其搭建的整個內容服務生態。
亞馬遜本身擁有海量的音樂數字內容,也擁有目前世界上最大的網上購物平臺,還有自建的物流系統,這些都為 Echo 提供了遠不止硬件本身的服務應用體系。

除此之外 ,Echo 搭載的智能語音助手 Alexa 是一個開放性的智能語音平臺,最新的數據顯示 ,Alexa 目前目前能提供超過 15000 種語音技能,遠遠超過任何其他競爭者。
「即便是 BAT,也很難在短時間內取得亞馬遜 Echo 的成績。背后的原因,除了中美用戶習慣層面的差異,更重要的是,中國互聯網公司沒有像亞馬遜那樣擁有完整的語音產業鏈條。」魏強博士如此評價中國音箱市場的現狀。
中國的互聯網公司盡管各有千秋,但從產業鏈上來看,相較亞馬遜、蘋果、谷歌這樣的世界級巨頭來說,在產業鏈的完整性方面還有一定差距。單看語音智能的產業鏈,目前國內那么多公司都在做語音產品,卻都存在或多或少的缺失:有的缺技術,有的缺內容,有的在生產制造環節薄弱。
未來,誰會主宰這一塊市場,魏強博士認為不一定非得是互聯網公司。中國的互聯網公司沒有硬件產品設計生產的底蘊,智能手機市場那么大 ,BAT 也沒有一家做。盡管目前來積極投入的是互聯網公司偏多,但最后的贏家說不定會是華為 、Oppo 這樣的硬件廠家。
國內廠家不應該急于做利益劃分,而應該走聯合的中國特色道路
京東+科大訊飛的聯合模式,很多人認為,這應該是目前國內最類似亞馬遜 Echo 的路線。
首先京東是國內電商體系最像亞馬遜的公司,從自建物流體系,到建立會員制度,甚至做電子書平臺,背后都有亞馬遜的影子。除了能提供給叮咚強大的渠道支持,還能幫助將其鏈接到智能家居、消費購物等場景。
京東在智能家居布局甚久,其面向智能家居的智能平臺「京東微聯」是一款完成了跨品牌、跨平臺智能設備控制、交互和數據匯集的移動應用,這為叮咚接入智能家居廠家鋪好了道路。而科大訊飛則是國內積淀最久,技術最強的語音技術廠家,這兩家公司合體做音箱,成功的概率理論上來說要比其他的公司大很多。
正如上文中提到的,目前國內尚沒有哪一家公司有實力覆蓋整個語音產業鏈。由于企業規模、產業覆蓋程度的差異,國內做語音的廠家更應該走聯合的道路,而不是急與做利益劃分。
在魏強博士看來,目前國內很多公司并沒有想清楚智能音箱火起來是靠的是哪股風,就一窩蜂全涌上來做產品,爭搶市場,這并不見得是好事。「我們不希望大家一窩蜂上,去做低水平的重復性投入,每家公司應該找恰當的點切入特定的應用場景可能會更合適,而不是毫無目的的涌入。」魏強博士如此說道。
目前叮咚在國內的市場已高達 70%,魏強博士認為這雖是好事,但也會有擔憂。目前國內的智能音箱依舊是個小眾市場,在它走向普通大眾真正成為日常消費產品之前,占比多少的意義并不大。正如智能手機,剛開始只有蘋果一家,當行業發展到穩定期,肯定會是多家林立的局面,大家共同分享市場,既互相競爭又互相學習,市場才是健康的。
當問到下一步的發展規劃,魏強博士說到:目前在世界范圍內,幾乎所有的大廠商都在做智能音箱,這是一個很明顯的信號,智能語音產品很可能會成為下一代交互入口。雖然目前手機帶給了人們很多方便,但諸如 App 太多的痛點依然存在。
目前大家都在幻想一個場景,未來的語音產品會無處不在,它可能是電視、洗衣機、電燈,它會嵌入整個智能家居,而不一定是一款音箱,人們通過簡單的幾句話,就能輕松完成各種服務。希望這個幻想,能早日成為現實。
在深圳灣即將于 7 月 15 日舉辦的 WARE 2017 語音智能平臺與應用峰會(第二季)上,魏強博士也將作為嘉賓參與音箱論壇環節,分享靈隆科技在智能音箱之路上的見解與感悟,歡迎有興趣的朋友報名參加。