從概念到量產只用了三個月?——一個互聯網特色的硬件創新故事

從 DuerOS 說起:語音智能技術的認知、落地和未來
百度的人工智能戰略,可能是互聯網巨頭中最接地氣兒的。
兩年前,我們跟一位人工智能從業者聊天的時候,他曾提到專業和非專業人群對「人工智能」這個詞的理解存在相當大的差異。老百姓眼里的人工智能,是電影里那種像人一樣有著自主意識隨時盤算著毀滅人類的「人造生命」,而在搞人工智能研究的人看來,機器視覺、語義理解、深度學習……這個命題下每一個細分領域都算的上是人工智能的范疇。
如今,當以語音為媒介的人工智能得到越來越多關注的時候,類似的差異還仍然存在。不過,這樣的差異已經不是老百姓和從業者之間概念理解錯位,而是人工智能從業者當中,在面對技術發展和技術應用博弈時截然不同的態度。
DuerOS 們的任務,是提供便捷應用技術的工具
按照媒體慣用的命名方式,2017 年應該算得上是「語音智能元年」,特別下半年以來,國內的互聯網巨頭紛紛加大了在語音智能領域的布局力度,DuerOS 作為百度押寶人工智能之后交出的第一份作業,算得上是諸多語音智能平臺中最搶眼的一個。
在今年的百度 AI 開發者大會上,百度就提出「DuerOS 要做人工智能時代的安卓」,一個能為產品廠商解決基本的人工智能技術問題、為產品提供軟件基礎的平臺,功能類似于中國版的亞馬遜 Alexa。

但許多人工智能產品行業的從業者,更傾向于把這些巨頭的人工智能平臺簡單理解成一種可以塞進各種產品中的通用型人工智能。而現在人工智能全行業的技術基礎都還難以支撐這種通用性,「一個『啥都能干』的人工智能系統放到具體的使用場景中,如果缺乏對場景的深度理解和針對性優化的話,到頭來可能『啥都干不好』,所以還是選個具體的細分領域做更靠譜。」類似的觀點,我們聽到不止一次。
但 DuerOS 從來不是這樣一個「通用型人工智能」,實際上,在向開發者做介紹時,DuerOS 更常用的描述是「一個至少能夠完成基本服務的系統」——定位和姿態比「人工智能中的 Android」還要低得多。
這樣的認識上的偏差不能簡單地歸為理解錯誤,背后反映的其實是兩種截然不同的思維導向。
對以產品為導向的技術型產品商來說,「我想讓我的產品達到 10 分的體驗,但現在技術只能支持到 6 分,所以我覺得這個現在還做不了,我得另選個至少能達到 9 分的領域。」
而 DuerOS 等技術提供方以技術應用為導向看待這個問題時,就變成「我想支持廠商做出 10 分體驗的產品,但現在整體行業的技術水平或許才發展到 6 分,那我先把最成熟的 6 分做到大家都能用,看看能解決哪些問題,同時通過產品化獲取的經驗,繼續進一步的技術優化,力求達到 10 分。
而事實是,這「6 分」的技術確實已經能解決不少問題了。它或許不能像鋼鐵俠里的 JARVIS 那樣給你打點好生活的方方面面順便還能在你把妹撩漢的時候給你恰到好處的助攻,但要幫你擺脫只有 6 個按鍵卻還要完成 N 種反人類操作的機頂盒遙控器是綽綽有余了。

產品「賦能」并不是非要把電冰箱變成 JARVIS
「賦能」是跟著語音智能被提起的另一個概念——指的是把語音智能作為一種「能力」賦予到各種各樣的硬件產品上。但這種賦能并不是在各種傳統硬件里都塞進一個智能語音助手,而是指任何在應用新技術之后能帶來的體驗上的提升。
賦能傳統硬件,跟依托人工智能技術打造「人工智能產品」是有很大區別的。以家庭機器人為代表的人工智能產品,實際上是人工智能技術發展催生的新品類,所以人工智能技術層次是支撐整個產品體驗的核心。而我們說語音智能賦能傳統硬件時,更多是運用人工智能技術,在產品基本功能之上做進一步的體驗提升。
而 DuerOS 在其中扮演的,就是這樣一個讓硬件產品開發者能夠便捷地運用語音智能提升產品體驗的工具,其最大的價值,可能并不在于把人工智能的邊界往前推進了多少,而在于把現有資源整合了多少,把可用門檻降低了多少。
DuerOS 與國安廣視合作的 G1 機頂盒就是這樣一個例子。
這款人工智能機頂盒具備自然語言交流、語音搜索、語音控制、語音點播,圖像識別、問詢服務等多項功能,但最基本的任務還是解決傳統電視「好多臺、好多鈕、好繁瑣、難互動」的操作弊端,讓用戶動動嘴就可以對電視進行各種操作,在電視這樣一個非常傳統的領域中,這一升級帶來的便捷是實實在在可以感知、切中痛點的。這款智能機頂盒已經在長沙落地,很快便有超過 10 萬用戶體驗到了 DuerOS 帶來的智能化服務。

在具體產品和場景落地的過程中,取勝的關鍵在于發現傳統硬件產品在使用時還沒有被滿足的需求點,這需要對產品和應用場景的充分理解。在傳統硬件行業,產品廠商才是硬件方面的專家,要與產品本身的功能、調性、場景特征達到恰到好處的結合,就需要充分了解產品廠商對產品的定義,調查和理解產品廠商的需要內容源是什么,想表達的內容在設備上有沒有,分別該如何處理和調整。這種與產品團隊的深度對接,也是 DuerOS 現在正在花大力氣做的事。
同時,DuerOS 敢自比 Android,很大程度上還在于留給廠商和開發者的定制化空間。一個很現實的問題是,在某些領域廠商和開發者并不想在自己的設備上用他人服務,這種時候,DuerOS 就需要開放更多后臺技術支持他們開發自己的服務,降低技術門檻的同時,留足自主發揮的余地,讓廠商和開發者在得到足夠的對話式 AI 能力的同時,又得以保留產品空間和特色。
賦能產品和教育用戶,是同一過程的兩個方面
我們注意到,除了國安廣視的機頂盒之外,DuerOS 在家庭場景下已經落地的產品還包括智能電視、無屏電視等,這類傳統型家庭娛樂終端產品在交互上的可提升空間,也是現在大量智能語音技術商首先盯上的突破口。
手動操作不便的行車場景也一直都是語音智能廠商感興趣的領域,此前也有廠商推出帶語音交互的智能后視鏡、智能導航儀等,而百度要做的則是依托于大數據,用人工智能賦能汽車這個品類。DuerOS 扮演的則是這個體系中的交互窗口,通過足夠流暢的自然語音交互,單輪和多輪對話等功能,讓汽車場景中的人機交互更加自然便捷。

家居、車載、移動等傳統硬件密集的場景,將成為首先打開用戶認知的窗口。除了著力構建產業端生態之外,增強用戶對語音交互的認識并感受它的便捷,加速市場教育,也是包括 DuerOS 在內的整個語音智能行業努力想達成的目標。
百度不止一次表示,現階段商業化不是 DuerOS 的目標,認為只要人機交互有一次躍升的改變,實現商業化完全不成問題。語音會讓越來越多用戶實現全天候的設備連接,無論是廣告還是內容,都可能在語音設備上有更多的空間。到了這一階段,無論是 DuerOS 還是開發者,都會有很大的盈利空間。
但在現在這個階段,DuerOS 同時完成推動行業生態構建和教育消費市場兩方面任務的方式,就是打通一條快速賦能、快速產品化的通道,讓人工智能技術能夠快速通過各種產品與服務和用戶、消費者連接起來。
作為最大的中文搜索引擎,百度很清楚自己的優勢在哪里,在人工智能變革的時代,像所有互聯網巨頭一樣,百度期望的也是在最基礎的生態上做出自己的優勢。