DSP Concepts 用「樂高積木」式的音頻模塊,提升語音助手的識別能力

通過音頻軟件實現「聲音的自動對焦」,AudioTelligence 獲得 850 萬美元融資
又一家專注于語音識別技術的初創公司,助力語音助手在噪音中的人聲識別
音頻技術初創公司 AudioTelligence 在由 Octopus Ventures 牽頭的 A 輪融資中籌集了 850 萬美元。其語音識別軟件旨在提升語音助手在噪音中的人聲識別和理解。
AudioTelligence 表示,其的軟件可以實現「聲音的自動對焦」,當多種聲音(包括人聲)混合在一起時,該軟件可以挑選出與語音助手對話的人聲,同時過濾掉無關的音頻信號,從而大大提高語音助手在嘈雜環境中識別和理解人聲的能力,理解度可以從 22% 提高到 94%。
相比傳統依賴于麥克風校準的語音助手技術,AudioTelligence 基于軟件的噪聲過濾方法有諸多優勢,開發人員不需要獲得新的硬件支持,就能完成性能的改進和提升。
這項融資也透露著市場對于音頻軟件的濃厚興趣。此前,加州音頻軟件初創公司DSP Concepts 融資了 1,450 萬美元。其嵌入式音頻軟件平臺 Audio Weaver 提供類似樂高模塊一樣的音頻處理軟件模塊,通過圖像化編程的方式,幫助語音助手將人聲與其他噪音分離。Audio Weaver 已經有超過 4000 萬個設備使用,其主要客戶為車企、芯片制造商、以及智能設備制造商,如特斯拉、保時捷、GoPro 和 Braun Audio 等。
在快速增長的車內語音助手市場,AudioTelligence 可以解決語音助手因車內廣播而造成的意外喚醒。
AudioTelligence 首席執行官肯·羅伯茨(Ken Roberts)在一份聲明中說:
在相對安靜的音頻場景,語音指令可以運行良好,一旦有多個人交談或有背景音樂,語音識別的性能就會迅速下降。市場對我們的技術需求數量巨大,而且每天都在增長。
AudioTelligence 于 2017 年從劍橋大學的 CEDAR Audio 中分離出來,早先曾獲得劍橋創新資本(Cambridge Innovation Capital)的 310 萬美元種子輪融資。CEDAR Audio 和 Cambridge Innovation Capital 均參與了本輪融資。
采編:森林木 / 深圳灣