全系標配滿級防水,OPPO A5 系列新品正式發布

超越 AirPods Pro 和 FreeBuds 3 的 AI 骨傳導通話降噪來了,橫比結果超出預期
首款應用大象聲科 Vocplus AI 骨傳通話降噪技術的漫步者 DreamPods 在通話性能的橫比中,完勝其他 TWS 耳機。它是如何突破傳統和實現超越的?
最近上市的漫步者的 DreamPods TWS 打出了一項與眾不同的賣點功能——AI 骨傳導通話降噪,這引發了我們的興趣。
通話是 TWS 耳機最重要的功能之一。但當你身處在人聲嘈雜的咖啡廳、噪音分貝很高的地鐵和公交車站、或是快速行進風中,因為你佩戴的 TWS 耳機通話降噪做的不好,對方常常聽不清楚你講什么,這個體驗是非常糟糕的。
深圳灣曾經在一年前做過一期通話降噪的主流應用案例,其中,蘋果 AirPods 的雙麥克風加骨振動傳感器的「語音加速」方案,以及頭戴式 Bose 700 的 8 麥克風「雙向降噪」技術,令人印象深刻。

△ AirPods
AirPods 的后來者們多基于單雙麥克風與算法結合的方式,雖然多少實現了通話中的降噪,但實際上很難形成性能突破,在較為安靜的辦公環境表現尚佳,但在地鐵、馬路、機場、咖啡廳等日常嘈雜的環境中,接聽方的通話體驗常常不盡人意。
漫步者的 DreamPods 這款 TWS 耳機外形與 AirPods 的一代差不多,半開放式的掛耳設計,耳機柄也保留了 AirPods 的長度。整體上貌不驚人,連接、佩戴、續航、音質等也基本符合人們對于一款 AirPods 替代品的期待。但它主打的高清通話體驗,卻令我們發出了「WOW」的感嘆!

△ DreamPods
當我佩戴 DreamPods 站在公交車站時,我打電話給我的同事:
通話清晰嗎?回答:清晰。
公交車進站了,你聽得到嗎?回答:聽不到,也聽不出你在車站。
我身旁走過了一對母子,熊孩子在鬧著吃冰淇淋,你聽到了嗎?回答:聽不到。
我這會兒已經走進 KFC 了,我旁邊一桌的人正在聊端午節的旅游經歷,時不時的還發出笑聲,你聽得到嗎?回答:聽不到,完全感受不到你旁邊有人說話。
我已經走到室外了,這時候我迎著風,風很大哦,呼呼的,你聽得到風聲嗎?回答:有一些,能感覺到和剛剛你通話的環境不同,但聽你講話是清晰的。
這就是一款 699 元的「類 AirPods」的 TWS 耳機的表現,通話質量遠遠超出了以往我使用的其他國產耳機。而它也是首款應用大象聲科 Vocplus AI 骨傳通話降噪技術的 TWS 耳機。
骨傳導通話降噪,蘋果怎么做?
骨傳導通話降噪技術是蘋果早在 2013 年就為 AirPods 準備的專利技術,專利號 US9363596B2,直到 2016 年 AirPods 才上市。
專利中描述了用振動傳感器結合麥克風做上行降噪的方案,其中,振動傳感器主要搜集顱骨因振動而產生的聲音信號(顱骨傳音),而麥克風則主要負責采集空氣中的聲音。
采集來的聲音信號經由蘋果的算法處理,比如,在通話場景中,對背景噪聲進行削弱,對佩戴者的語音進行增強,從而輸出更清晰的通話聲音,讓接聽電話的對方,有更好的通話體驗。

△ AirPods 骨傳導方案 | 圖源:意法半導體
這一技術直接為 AirPods 帶來了遠超于其他跟隨者的出色的通話降噪效果。
同時,因為專利保護,為蘋果提供微型骨振動傳感器的意法半導體,在直到 2019 年的三年時間里,沒有向其他企業開放這一傳感器技術。
骨傳導通話降噪,華為怎么做?
華為曾經試圖避開蘋果專利,很早就開始研發「骨聲紋識別」技術——Bone Voice ID,并將其應用在 2018 年 12 月發布的 FreeBuds 2 Pro 的「聲紋支付」上。
簡單來說,華為將這一新穎的用戶身份識別檢測方案,用于識別耳機佩戴者說話時的骨聲紋信息,再將 ID 信息傳遞給手機,通過 AI 自動解鎖手機。與此同時,啟動手機上的語音助手,再接入相關的語音服務,比如打開微信支付或支付寶支付,最終實現通過耳機進行「骨聲紋支付」的功能。

△ 華為 FreeBuds 2 Pro 骨聲紋 ID 官宣
這個華為在宣傳中標榜的「黑科技」或許因為太早不夠成熟,或許因為太過于復雜,實際我們在體驗中,因為系統等各種限制,未能實現如海報所示的效果。華為官方商城的用戶留言也顯示,這個功能或者沒有上線或者體驗非常糟糕。
后來,華為「再接再厲」,在其去年發布的 FreeBuds 3 上再次采用了骨傳導的技術——主要用于通話降噪。
華為的方案與蘋果有什么不同?
但華為的骨傳導通話降噪技術又與蘋果有所不同。

據《雪球》引用寶藏左博士的信息,華為 FreeBuds 2 Pro 和 FreeBuds 3 采用的是同一顆骨振動傳感器,來自丹麥的 Sonion 公司的 VPU(Voice Process Unit)傳感器,型號為 VPU14AA01。
華為所采用的 VPU14AA01 和蘋果所采用的 ST LIS25BA 最大的不同是:
VPU14AA01 是單軸振動傳感器,輸出的是模擬信號,而 LIS25BA 是三軸振動傳感器,輸出的是數字信號。
作者在文章中猜測華為選擇 Sonion VPU 的原因在于功耗低(單軸振動),可以支持 Freebuds 3 能夠有與 AirPods 相當的續航時間。
但實際上,更大的不同在于前端信號處理。

△ 華為在 IFA 2019 上演示骨傳導通話降噪 | 圖源:深圳灣
當我們問起,蘋果和華為的方案有何不同?大象聲科的技術專家告訴深圳灣:
AirPods 和 FreeBuds 3 都是利用傳感器信號作為人聲檢測的標志,主要用來檢測聲帶振動。其中,AirPods 獲得的信號是數字信號,而 FreeBuds 3 獲得是模擬信號。
更進一步而言,無論是 AirPods 還是 FreeBuds 3,都依賴于傳統的雙麥克風進行波束形成(beamforming),麥克風數量和陣列設計都會影響信號采集的精度。
其他廠商怎么做?
為了避開蘋果的專利壁壘,一些廠商開始使用額外增加一顆麥克風,在波束形成的基礎上,通過增加對耳機內側聲音的收集,來彌補外部麥克風被噪音占用后、聲音信號不足的情況。
通過增加傳感器數量來豐富聲音采集的信息量雖然有效,但是片面的,更重要的是需要對數字信號進行分析、調整、并向接聽電話的一方輸出更清晰的聲音。
專家如上的意見也啟發了我們,信號處理是一門學問,就像我們寫文章,單純搜集資料是其一,消化、整理、輸出,則更考驗功力。
而再看這么多年 AirPods 在通話降噪上的體驗一直領先,很大程度上在于蘋果在軟件、硬件的集成優勢。
如今,有機會打破蘋果一家獨大的局面了。
大象聲科 AI 骨傳導通話降噪方案,如何突破傳統?
漫步者 DreamPods 是首款應用大象聲科 Vocplus AI 骨傳導通話降噪技術方案的 TWS 耳機。
大象聲科 Vocplus AI 骨傳降噪技術是基于深度神經網絡(DNN)的語音提取技術,能夠高效融合麥克風信號和骨振動信號,利用 DNN 強大的建模能力,實時分離人聲和噪聲,同時有效隔絕周圍人的聲音。

通過與大象聲科技術團隊的交談,我們了解到了用于 DreamPods 的 AI 骨傳通話降噪技術,在以下幾個層面實現了對傳統通話降噪技術的突破。
1、對于復雜噪音信號的建模能力
傳統信號處理本質上基于線性濾波的思想,對語音和噪聲信號建模。但傳統信號處理模型假設過于簡單,無法針對咖啡館等環境所產生復雜噪音信號,進行有效的刻畫。
而大象聲科采用的是深度學習技術,能夠對更為復雜的信號進行有效刻畫。
2、更強的 AI 自適應能力
同時,傳統信號處理采用的是人工設計的算法對模型參數進行估計,很難自動適應各種場景,導致后期調參工作量十分巨大。
在同一顆支持通話降噪的芯片上設計的產品,因為團隊在算法調教上的思路不同,或是打磨的時間長短不一,導致在不同的產品上、不同的環境中,通話效果差別很大。
大象聲科的 AI 語音降噪技術,是一種基于數據驅動的方法,模型參數通過使用海量的訓練樣本自動估計,使算法有更強的適應能力。

3、對佩戴者語音通話的人聲識別能力
用戶使用 TWS 耳機的場景復雜多變,對降噪算法的挑戰更大。
尤其是在某些極端的場景中(如嘈雜的地鐵車站、擁擠的地鐵車廂),耳機麥克風收到的語音信號幾乎完全被噪音遮蓋,佩戴者在通話時的人聲很難被準確識別,同時,車廂里其他干擾的人聲也不能被有效隔離。
這時候,一顆骨傳導傳感器(即 AirPods 中使用的語音加速傳感器)就可以準確接收佩戴者說話時的骨振動信號,不受外部噪音的干擾。
大象聲科是國內首家與意法半導體合作推出骨傳導通話降噪的算法廠商,軟硬結合,獨立性更強。

4、通過算法彌補骨傳導傳感器或麥克風信號采集的不足
單純使用骨傳導傳感器,在不加任何算法的情況下幾乎可以完全隔絕外部噪音。但其最大的問題是,骨傳導傳感器采集的信號頻率寬度有限,在實際耳機產品上,上限頻率只能到達 800Hz 左右,無法滿足通話需求。
換句話說,普通麥克風頻寬夠,但有噪聲,而骨傳導傳感器無噪聲,但頻寬有限。
大象聲科骨傳導通話方案同時使用骨傳導傳感器和單顆麥克風,利用 AI 技術將二者采集的信號進行有機的融合。利用骨傳導信號提供的重要聲學特征(如 VAD 和基音信息)對麥克風信號進行降噪和融合,達到比直接對麥克風信號進行降噪更好的效果。
并且,整個這一過程由 AI 自動完成,不需要進行人工提取特征參數。

5、單顆麥克風+骨傳導組合
如前文所述,AirPods 采用骨傳導傳感器 + 2 顆麥克風的方案,利用骨傳導信號幫助估計波束成形的參數,提升降噪效果。顯然,受限于麥克風的數量,波束成形的降噪能力依然有限。
而大象聲科的 AI 骨傳導通話降噪方案,本質上依然是基于深度學習的單麥降噪技術,只是借助了骨傳導信號所提供的信號,并將骨振動傳感器信號和用于通話麥克風信號一起送入 DNN,經 DNN 模塊預測,實時分離人聲和背景噪聲,提取清晰人聲,從而大幅度提升通話的清晰度。

以上幾方面的技術疊加,最終實現了 DreamPods 這款耳機在超低信噪比場景的高清通話,以及對于周圍人聲干擾的完全隔離——也就是前文描述的,通話對方感覺不到你身處噪音環境,感覺不到你旁邊有人說話。
值得一提的是,在實現單麥 AI 骨傳導通話降噪技術的落地之前,大象聲科是全球范圍內最早在手機端實現單麥 AI 通話降噪的公司,目前國產很多安卓手機包括小米、OPPO、vivo 等都搭載了他們的技術。
大象聲科也同時提供單麥/雙麥 AI 單雙麥通話降噪方案,在去年深圳灣的新硬件峰會上,大象聲科創始人苗健彰(Eric Miao)曾經為我們做過詳細的介紹。

△ 大象聲科創始人苗健彰(Eric Miao) | 圖源:深圳灣
橫比分析:DreamPods,AirPods Pro,FreeBuds 3 通話降噪性能實測
在大象聲科技術團隊的指導下,我們對 DreamPods、AirPods Pro 和 FreeBuds 3 這三款 TWS 的通話降噪效果,進行了一次專業的降噪性能測試。
測試選擇的環境是十字路口噪聲場景下,對比方法是三組兩兩對比測試。
我們將左右兩耳分別佩戴 AirPods Pro 和 DreamPods,兩個耳機分別連上手機藍牙打電話,并開啟華為手機自帶的電話錄音功能,錄下通話音頻。

△ AirPods Pro vs DreamPods 對比音頻 | 圖源:大象聲科
在該場景下,二者語音都非常清晰,聲音連續。從降噪方面,DreamPods 對于穩態和非穩態噪聲都抑制的非常好。
細微之處,AirPods Pro 在 5.5s 的頻譜圖上,表現出明顯的非穩態噪音——實際體驗則是非常清晰的鳴笛聲,而這種聲音往往會對目標人聲造成一定的干擾。
而在同一時間段,DreamPods 幾乎看不到噪音譜——正如我們開篇體驗的那樣,幾乎完全聽不到公交車的鳴笛聲。
我們再看一下 FreeBuds 3 和 DreamPods 的對比表現。

△ FreeBuds 3 vs DreamPods 對比音頻 | 圖源:大象聲科
兩副耳機的語音通話都比較清晰,DreamPods 對于穩態噪聲方面略優于 FreeBuds 3,而在非穩態噪聲方面,DreamPods 明顯優于 FreeBuds 3。
從頻譜圖上可以看出,FreeBuds 3 有不少穩態噪聲的殘留。而 DreamPods 完全沒有。瞬態噪聲方面,DreamPods 也能做到幾乎完全的壓制,明顯優于 FreeBuds 3。
我們前文提到,AirPods Pro 和 FreeBuds 3 均采集了骨傳導信號,但因為傳感器的不同,前者采集的是數字信號,而后者為模擬信號。二者通話降噪對比有何差異呢?

△ AirPods Pro vs FreeBuds 3 對比音頻 | 圖源:大象聲科
對比頻譜圖并沒有特別大的差異。Airpods Pro 相比 FreeBuds 3 在高頻上語音保留更多,聽起來更亮一些,更加清晰、飽滿。
而降噪方面,FreeBuds 3 對于穩態噪聲消除優于 Airpods Pro,而對于剎車聲這樣的非穩態噪聲,二者幾乎都沒有做相應的抑制,因此聽上去非常的刺耳。
灣里小結
這兩年,隨著 TWS 藍牙芯片技術的日漸成熟,藍牙連接穩定性、低功耗和長續航,越來越多的 TWS 產品涌入市場。
在市場完成初步的教育后,接下來各大耳機廠商比拼的就是降噪性能和差異化,而卓越的通話降噪體驗首當其沖。
漫步者 DreamPods 只是一個縮影,只是大象聲科 AI 骨傳導降噪技術在 TWS 上的一次落地嘗試。但是,隨著技術的逐步成熟,我們可以看到 AI 語音技術在終端產品上的應用,已然成為趨勢。
未來,將會有更多的 TWS 耳機,將「AI 語音降噪」作為產品標配,而大象聲科的實力,不容忽視。
微信號:shenzhenware
主筆:陳壹零 / 深圳灣
編輯:森林木 / 深圳灣