語音智能 OS:國內 40 多家語音開發平臺,做中國版 Alexa 的滋味是怎樣的? | 語音智能特稿

語音開放平臺之戰打響,思必馳用對話定制 DUI 平臺「賦能」萬物 AI丨WARE 2017
思必馳作為「賦能」者,將與行業合作伙伴、開發者共同推進生態繁榮。
隨著越來越多硬件產品植入智能語音后,語音交互逐漸成為人工智能熱潮下的重要話題。如何將智能語音「賦能」到各類硬件產品中,是語音技術商與智能硬件廠商都普遍關注的重要議題。
于 2007 年成立的思必馳始終致力于語音技術與產品的結合。今年 8 月底,由思必馳團隊上百人經半年時間封閉研發的 DUI 開放平臺即將上線。
在 7 月 15 日由深圳灣(公眾號 ID:shenzhenware)主辦第二屆「WARE 2017 語音智能平臺與應用峰會」上,思必馳副總裁趙恒藝作為大會演講嘉賓向各位講述了思必馳打造語音開放平臺的歷程及愿景。
行業內已有 40 個語音開放平臺,開發者又有哪些需求
在歐美,Echo 能夠成為現象級產品,很大程度得益于其背后的 Alexa 技術。而在國內,雖這塊市場處于起步階段,但已經有了不少追隨者。據了解,行業內已有 40 多個人機對話平臺。在啟動 DUI 開放平臺項目之前,趙恒藝就已經率領團隊對國際上以及行業內的相關領域進行全方位的調研,包括各個語音對話平臺的優點和不足之處,以及相關開發者對平臺的訴求。
根據是否有底層識別技術、文本處理、語義理解能力,以及能否連接豐富的后端服務和技能這幾個維度,國內語音對話平臺主要分為四大類:

經過對大量行業開發者進行調查,思必馳了解到,有 67% 的開發者對這類語音開發平臺持觀望態度,部分(30%)不太了解技術的人認為平臺不需要具備算法降噪、回聲消除等功能。有 97% 的開發者希望語音開發平臺能有自主定制權,差異化。
趙恒藝表示,基于人機對話交互模式的智能音箱成為了行業的熱點,已有大量的語音平臺技術廠商與其合作伙伴都做了類似的產品布局。而事實上,雖然行業內已經有了真正落地和廣為人知的產品,甚至是標桿性產品,但從整體上看,智能語音產品仍舊擁有非常大的上升和發展空間。
趙恒藝補充道,即便這些產品還沒達到進入千家萬戶的程度,整個行業包括語音平臺商、與平臺進行合作的客戶、相應的開發者都在積極推進語音開放平臺這件事情。
基于行業經驗積累和需求探索,打造 DUI 開放平臺
作為一家在語音技術領域耕耘了近 10 年的企業,思必馳基于自身在語音識別、合成技術方面的積累,與合作伙伴共同研發了眾多相關產品。鑒于這些豐富的經驗,思必馳通過語音對話平臺,將語音識別、語義理解、回聲消噪、語音合成等一系列技術進行了良好的融合。
另外,基于自身構建的框架基礎,思必馳還結合了不同客戶、開發者的需求,力求做出擁有競爭優勢、滿足不同需求且能夠定制化的 DUI 開放平臺。
思必馳打造的 DUI 開放平臺提供了一整套完整的自主對話交互內核,開發者只需要做引擎和語義等相關的開發。

思必馳打造的 DUI 開放平臺提供了一整套完整的自主對話交互內核,包括語音識別、語義理解、智能對話、語音合成、后端資源接入、云端技能及本地技能等等,帶來一體化方案的無縫對接。

在支持 GUI 與 VUI 良好融合的同時,DUI 平臺還支持高度的定制化,包括對話邏輯、技能服務等,開發者可針對特定場景進行特殊定制。 另外,DUI 還能實現本地和云端雙重技能的定制,讓設備在沒有聯網的情況下能執行用戶使用頻率相對較高的任務,如車載場景下的導航等。

DUI 可視化的編輯界面,提供了文字、列表、圖文卡片、音樂播放、內嵌網頁等可視化組件,使得非專業的開發者能快速上手。為了便于開發者的運營,DUI 還提供一套可呈現實時運維數據的系統,實時了解用戶活躍度、使用時長等平臺相關維度信息。

思必馳作為「賦能」者,將與行業合作伙伴、開發者共同推進生態繁榮
除了自身在語音技術和經驗方面的積累,思必馳能打造出 DUI 這一整套語音開放平臺,也很大程度上是思必馳長期與客戶共同合作、討論、啟發的結果。
在語音開放平臺打造的這件事上,思必馳更多的是擔當一個賦能的角色。而要推動語音產品、交互的智能化,還需要各層面的客戶、開發者的加入和共同努力。
趙恒藝表示,思必馳已將 DUI 開放平臺作為公司的重要戰略任務之一,與眾多的合作伙伴、開發者共同打磨、完善產品。為此,思必馳還專門設立了 2 億元的基金,用于扶持平臺上優秀的開發者、優秀應用案例和創業項目。

屆時,DUI 開放平臺(域名 dui.ai)將于 8 月底正式上線。9 月份,思必馳將聯手深圳灣再次舉辦一場線下開發者活動。