麥克風陣列構(gòu)型
以六麥陣列為例,具備以下功能特性:波束形成(波束形狀是陣列對不同頻率及方向的信號的響應,它與陣列麥克風數(shù)目、幾何形狀、源信號位置以及頻率有關。)、回聲消支持信噪比-30dB左右、平穩(wěn)噪聲濾波、方向性非平穩(wěn)噪聲抑制、語音增強和去混響、聲源定位精度±10°等功能。
六麥陣列包括六麥硬件陣列模塊方案和軟核方案,硬件模塊方案包括一塊XFM10621硬件模塊,通過連接麥克風、參考信號、供電和I2C即可實現(xiàn)陣列遠場拾音和降噪后音頻輸出,同時支持連續(xù)喚醒并輸出喚醒信號。
六麥模板硬件示意圖
軟核方案包括:錄音模塊、陣列算法、和ADC、FPGA驅(qū)動三個部分。
其中軟件模塊通過ALSA接口錄制96K、32bit雙聲道音頻數(shù)據(jù)。陣列算法可以提供語音喚醒、聲源定位、回聲消除和語音降噪功能。算法接收96K、32bit雙聲道音頻數(shù)據(jù),語音喚醒之后通知上層應用,并給出聲源角度。輸出回聲消除和降噪之后的16k、16bit語音數(shù)據(jù)。算法加密芯片進行加密,通過i2c接口和加密芯片進行通信驗證。六麥陣列軟核的運算性能要求 600MIPS,支持硬浮點運算。
陣列模塊和軟核方案都具備去混響和回聲消除功能。
去混響
混響是指聲波在室內(nèi)傳播時,要被墻壁、天花板、地板等障礙物反射,當聲源停止發(fā)聲后,聲波在室內(nèi)要經(jīng)過多次反射和吸收,最后才消失。這種現(xiàn)象稱為混響。因此,當聲源和麥克風之間的距離越遠,反射聲占的比例就越高,混響就嚴重。
經(jīng)典的去混響方法包括形成拾音波束來減少反射聲和基于反卷積的去混響方法。
回聲是指遠端說話人的聲音通過揚聲器播放出來包括其反射聲,又被近端的麥克風收集再傳送回遠端。聲學回聲主要出現(xiàn)的場合包括:模擬電話免提模式、手機免提模式、車載藍牙電話等場景。
用于打斷的回聲消除技術難點:喇叭播放的音樂一般為立體聲,甚至是環(huán)繞立體聲,因此需要真正的多通道回聲消除技術。設備的喇叭和麥克風一般距離很近,使用者距離較遠;麥克風信號的信噪比很低(一般在-10dB~-30dB)。
經(jīng)典的回聲消除方法包括非線性回聲消除處理,通過非線性的回聲抑制技術,顯著改善了非線性情況下的效果。
麥克風陣列結(jié)構(gòu)設計參考
Mic 孔的孔深孔徑比越小越好,即開孔越大越好,深度越小越好,盡量向1:1靠近?咨钆c孔徑比值越大,麥克頻響的震點越像低頻靠近,要求震點在12KHz以上。最少也要在8KHz以上。喇叭腔體不能漏氣。這是因為,喇叭正反兩面的聲波相位相差180度,當音腔有漏氣時,聲波會發(fā)生抵消,尤其是低頻頻段。
麥克和喇叭的失真都要小。麥克失真小于4%,喇叭失真小于10%,由于喇叭低頻失真嚴重些,會超過10%,可以考慮增加濾波器濾掉低頻成分。
喇叭腔體四周與其他機構(gòu)件保留1mm的距離,防止腔殼與機構(gòu)接觸產(chǎn)生異音。
喇叭鼓膜上方與機構(gòu)件保留1.5mm的距離,以防鼓膜振動碰到機構(gòu)件產(chǎn)生異音。
喇叭與機構(gòu)件有接觸的地方,要增加泡面,以起到緩沖、減振的效果,防止喇叭振動時與機構(gòu)件碰撞產(chǎn)生異音。
麥克風陣列聲學結(jié)構(gòu)確認流程
1.遠程會議或現(xiàn)場結(jié)構(gòu)設計評估
確認麥克陣列構(gòu)型,確認聲腔及安裝結(jié)構(gòu)設計,確認進聲孔深度、直徑大小等;
2.聲學實驗室錄音效果評估-第一階段
計算裸麥和帶聲腔結(jié)構(gòu)的麥克風之間的錄音之間諧波程度,根據(jù)分析結(jié)果確定是否通過。
3.聲學實驗室錄音效果評估-第二階段
分別利用裸麥和帶聲腔結(jié)構(gòu)的麥克風信號做基于相位的聲源定位,如果兩者定位誤差小于5°,則認為通過該項測試。
4.聲學實驗室錄音效果評估-第三階段
分別利用裸麥和帶聲腔結(jié)構(gòu)的麥克風錄音數(shù)據(jù)進行識別,效果差距在2%以內(nèi),則認為遠場識別方面無問題。
不同陣列的適用范圍
六麥環(huán)形陣列:六麥環(huán)形陣列適用于應用場景較為復雜(例如商場、辦公室),對角度定位要求比較高,回聲消除和識別率要求較高的機器人和家居產(chǎn)品解決方案。
四麥線性陣列:四麥線性陣列適用于車載,空調(diào),電視,應用型機器人等智能裝備,支持0~180°角度定位,回聲消除和連續(xù)喚醒等功能。
兩麥線性陣列:兩麥線性陣列對芯片性能要求較低,適用于低成本的智能裝備解決方案,支持回聲消除和噪聲抑制等功能。
QA問答
1.原始音頻質(zhì)量問題一般包括哪些?
可能導致的原因比較多,例如電源供電不足導致的底噪過大,孔徑過深導致的音質(zhì)下降,遮擋物導致的拾音問題,房間混響過大,增益問題造成的截幅,參考信號接入問題等等,具體問題需要具體分析。
2.麥克風陣列軟核和模塊的區(qū)別一般包括哪些?
麥克風陣列軟核需要自行完成麥克風及相關硬件模塊布板,軟核算法庫集成和調(diào)試優(yōu)化。麥克風陣列模塊是封裝好的硬件模塊,直接輸出麥克風陣列降噪后的音頻。軟核的更新一般由APP或系統(tǒng)固件完成,麥克風陣列模塊的更新由固件更新完成。
3.我的產(chǎn)品應該選擇什么構(gòu)型的麥克風陣列?
對多功能型機器人一般推薦采用六麥環(huán)形陣列,因為對語音識別率要求高,六麥環(huán)形陣列的波束和拾音范圍更加適宜。對功能型機器人和一些家具產(chǎn)品推薦采用四麥或者兩麥線性麥克風,因為命令詞識別對降噪音頻的質(zhì)量要求相對較低。
4.回聲消除的效果不佳可能是什么原因?
首先要檢查參考信號是否由功放后喇叭前接入,其次要檢查左右聲道和低音喇叭的接入順序是否正確,最后要檢查喇叭是否存在失真等問題。