麥可興陣列麥克風硅麥原理
學術上有個概念是“傳聲器陣列”,主要由一定數目的聲學傳感器組成,用來對聲場的空間特性進行采樣并處理的系統。而這篇文章講到的麥克風陣列是其中一個狹義概念,特指應用于語音處理的按一定規則排列的多個麥克風系統,也可以簡單理解為2個以上麥克風組成的錄音系統。
二、麥克風陣列需求
消費級麥克風陣列的興起得益于語音交互的市場火熱,主要解決遠距離語音識別的問題,以保證真實場景下的語音識別率。這涉及了語音交互用戶場景的變化,當用戶從手機切換到類似Echo智能音箱或者機器人的時候,實際上麥克風面臨的環境就完全變了,這就如同兩個人竊竊私語和大聲嘶喊的區別。
前幾年,語音交互應用最為普遍的就是以Siri為代表的智能手機,這個場景一般都是采用單麥克風系統。單麥克風系統可以在低噪聲、無混響、距離聲源很近的情況下獲得符合語音識別需求的聲音信號。但是,若聲源距離麥克風距離較遠,并且真實環境存在大量的噪聲、多徑反射和混響,導致拾取信號的質量下降,這會嚴重影響語音識別率。而且,單麥克風接收的信號,是由多個聲源和環境噪聲疊加的,很難實現各個聲源的分離。這樣就無法實現聲源定位和分離,這很重要,因為還有一類聲音的疊加并非噪聲,但是在語音識別中也要抑制,就是人聲的干擾,語音識別顯然不能同時識別兩個以上的聲音。
顯然,當語音交互的場景過渡到以Echo、機器人或者汽車為主要場景的時候,單麥克風的局限就凸顯出來。為了解決單麥克風的這些局限性,利用麥克風陣列進行語音處理的方法應時而生。麥克風陣列由一組按一定幾何結構(常用線形、環形)擺放的麥克風組成,對采集的不同空間方向的聲音信號進行空時處理,實現噪聲抑制、混響去除、人聲干擾抑制、聲源測向、聲源跟蹤、陣列增益等功能,進而提高語音信號處理質量,以提高真實環境下的語音識別率。
三、麥克風關鍵技術
消費級的麥克風陣列主要面臨環境噪聲、房間混響、人聲疊加、模型噪聲、陣列結構等問題,若使用到語音識別場景,還要考慮針對語音識別的優化和匹配等問題。為了解決上述問題,特別是在消費領域的垂直場景應用環境中,關鍵技術就顯得尤為重要。
噪聲抑制:語音識別倒不需要完全去除噪聲,相對來說通話系統中需要的技術則是噪聲去除。這里說的噪聲一般指環境噪聲,比如空調噪聲,這類噪聲通常不具有空間指向性,能量也不是特別大,不會掩蓋正常的語音,只是影響了語音的清晰度和可懂度。這種方法不適合強噪聲環境下的處理,但是應付日常場景的語音交互足夠了。
混響消除:混響在語音識別中是個蠻討厭的因素,混響去除的效果很大程度影響了語音識別的效果。我們知道,當聲源停止發聲后,聲波在房間內要經過多次反射和吸收,似乎若干個聲波混合持續一段時間,這種現象叫做混響?;祉憰乐赜绊懻Z音信號處理,比如互相關函數或者波束主瓣,降低測向精度。
回聲抵消:嚴格來說,這里不應該叫回聲,應該叫“自噪聲”?;芈暿腔祉懙难由旄拍?,這兩者的區別就是回聲的時延更長。一般來說,超過100毫秒時延的混響,人類能夠明顯區分出,似乎一個聲音同時出現了兩次,我們就叫做回聲,比如天壇著名的回聲壁。實際上,這里所指的是語音交互設備自己發出的聲音,比如Echo音箱,當播放歌曲的時候若叫Alexa,這時候麥克風陣列實際上采集了正在播放的音樂和用戶所叫的Alexa聲音,顯然語音識別無法識別這兩類聲音?;芈暤窒褪且サ羝渲械囊魳沸畔⒍槐A粲脩舻娜寺?,之所以叫回聲抵消,只是延續大家的習慣而已,其實是不恰當的。
聲源測向:這里沒有用聲源定位,測向和定位是不太一樣的,而消費級麥克風陣列做到測向就可以了,沒必要在這方面投入太多成本。聲源測向的主要作用就是偵測到與之對話人類的聲音以便后續的波束形成。聲源測向可以基于能量方法,也可以基于譜估計,陣列也常用TDOA技術。聲源測向一般在語音喚醒階段實現,VAD技術其實就可以包含到這個范疇,也是未來功耗降低的關鍵研究內容。
波束形成:波束形成是通用的信號處理方法,這里是指將一定幾何結構排列的麥克風陣列的各麥克風輸出信號經過處理(例如加權、時延、求和等)形成空間指向性的方法。波束形成主要是抑制主瓣以外的聲音干擾,這里也包括人聲,比如幾個人圍繞Echo談話的時候,Echo只會識別其中一個人的聲音。
陣列增益:這個比較容易理解,主要是解決拾音距離的問題,若信號較小,語音識別同樣不能保證,通過陣列處理可以適當加大語音信號的能量。
模型匹配:這個主要是和語音識別以及語義理解進行匹配,語音交互是一個完整的信號鏈,從麥克風陣列開始的語音流不可能割裂的存在,必然需要模型匹配在一起。實際上,效果較好的語音交互專用麥克風陣列,通常是兩套算法,一套內嵌于硬件實時處理,另外一套服務于云端匹配語音處理。
四、青興適合運用陣列硅麥的型號推薦---高靈敏度、高信噪比硅麥
QX-4737數字硅麥 -26DBFS SNR59 PDM輸出
QX-3526數字硅麥 -26DBFS SNR65 PDM輸出
QX-4030數字硅麥 -26DBFS SNR64 PDM輸出
同類文章排行
- 電容式微麥克風結構原理
- 新品硅咪上市強烈推薦
- 硅麥相比與駐極體咪頭有啥優勢?雙麥降噪原理
- 麥可興陣列麥克風硅麥原理
- 青興咪頭降噪數字硅麥品牌logo圖標更新公告
- 麥克風咪頭工廠青興4015咪頭高靈敏度參數是什么
- 9750單指向降噪陣列咪頭功能闡述
- 4015咪頭|4011咪頭電容麥闡述與價格
- 高靈敏度LED燈管用咪頭工作原理剖析
- MINI型咪頭嵌入PCB內設計
最新資訊文章
- 青興咪頭工廠生產的駐極體咪頭結構是怎樣的?
- 咪頭4013mic工作原理
- 指向性麥克風mic是如何實現降噪的?
- 咪頭內置在小蜜蜂擴音器中有嘯叫的解決辦法
- 咪頭6027駐極體咪頭背級板如何選用
- 咪頭麥克風基本知識
- 深圳青興咪頭廠家介紹三種定向型mic的區別
- 4015駐極體電容咪頭與3729硅麥的區別在哪里
- 6027單指咪頭帶心型定向指向圖新功能簡介
- win10如何設置4015咪頭麥克風
- 商用顯示器陣列硅麥3526降噪數字麥克風介紹
- 電容式咪頭mic與CMOS硅咪頭原理
- 深圳咪頭廠家全新9745抗干擾咪頭闡述
- 深圳咪頭生產廠家2020新款青興全指向3012咪頭功能
- 駐極體電容焊線咪頭3015|3012機器人專業咪頭介紹
- MEMS mic 青興數字PDM接口硅麥功能簡介
- 6050單指向咪頭防嘯叫抗干擾雙指向咪頭功能介紹
- 為什么麥克風會產生反饋嘯叫?
- 電容式咪頭好還是動圈式咪頭好?
- 怎樣防止會議無線話筒嘯叫等問答