国产成本人片无码免费网站,亚洲av永久无码精品表情包,久久www

上篇(webRTC中語(yǔ)音降噪模塊ANS細(xì)節(jié)詳解(一))講了維納濾波的基本原理。本篇先給出webRTC中ANS的基本處理過(guò)程，然后講其中兩步（即時(shí)域轉(zhuǎn)頻域和頻域轉(zhuǎn)時(shí)域）中的一些處理細(xì)節(jié)。

ANS的基本處理過(guò)程如下圖1：

???????????????????????????????????????? 圖1

從圖1可以看出，處理過(guò)程主要分6步，具體如下：

1）? 把輸入的帶噪信號(hào)從時(shí)域轉(zhuǎn)到頻域，主要包括分幀、加窗和短時(shí)傅里葉變換(STFT)等

2）? 做初始噪聲估計(jì)，基于估計(jì)出的噪聲算先驗(yàn)信噪比和后驗(yàn)信噪比

3）? 計(jì)算分類特征，這些特征包括似然比檢驗(yàn)(LRT)、頻譜平坦度和頻譜差異。根據(jù)這些特征確定語(yǔ)音/噪聲概率，從而判定當(dāng)前信號(hào)是語(yǔ)音還是噪聲。

4）? 根據(jù)算出來(lái)的語(yǔ)音/噪聲概率去更新噪聲估計(jì)

5）? 基于維納濾波去噪

6）? 把去噪后的信號(hào)從頻域轉(zhuǎn)換回時(shí)域，主要包括短時(shí)傅里葉逆變換(ISTFT)、加窗和重疊相加等。

我用于理解和調(diào)試的版本是以前的C版本，里面又分為浮點(diǎn)和定點(diǎn)兩種實(shí)現(xiàn)方式。對(duì)于算法理解來(lái)說(shuō)，最好看浮點(diǎn)實(shí)現(xiàn)的版本，因?yàn)樗芎退惴ㄔ碇械臄?shù)學(xué)表達(dá)式很好的聯(lián)系起來(lái)。定點(diǎn)實(shí)現(xiàn)中有很多諸如定標(biāo)等工程實(shí)現(xiàn)上的技巧，跟數(shù)學(xué)表達(dá)式很難直接聯(lián)系。部署時(shí)如有l(wèi)oad等制約因素，最好用定點(diǎn)的實(shí)現(xiàn)，因?yàn)橥ǔ６c(diǎn)實(shí)現(xiàn)的load比浮點(diǎn)實(shí)現(xiàn)的小不少。ANS支持8k/16k/32k HZ等三種采樣率。對(duì)于語(yǔ)音來(lái)說(shuō)，最常用的是16k HZ的，本文以及后續(xù)的均設(shè)定采用率為16k HZ。語(yǔ)音信號(hào)處理時(shí)以幀為單位，ANS中一幀為10 ms，可以算出一幀是160個(gè)采樣點(diǎn)。語(yǔ)音信號(hào)處理又通常在頻域下進(jìn)行的，因此先要把時(shí)域信號(hào)變成頻域信號(hào)，處理后再把頻域信號(hào)變回時(shí)域信號(hào)。時(shí)域信號(hào)變頻域信號(hào)在ANS降噪處理過(guò)程的開始部分，頻域信號(hào)變時(shí)域信號(hào)在ANS降噪處理過(guò)程的結(jié)束部分，但它們是相對(duì)稱的，且它們與降噪處理算法無(wú)關(guān)，因此把它們放在一起講。下面講講時(shí)頻互轉(zhuǎn)中的一些細(xì)節(jié)。

先看從時(shí)域信號(hào)變成頻域信號(hào)。主要步驟是分幀、加窗和做短時(shí)傅里葉變換（STFT）。分幀上面說(shuō)過(guò)，10 ms一幀，每幀160個(gè)采樣點(diǎn)。加窗的目的是避免頻譜泄漏。有多種窗函數(shù)，常見(jiàn)的有矩形窗、三角窗、漢寧（hanning）窗和海明（hamming）窗等。語(yǔ)音處理中常用的是漢寧窗和海明窗。ANS中用的是漢寧窗和矩形窗混在一起的混合窗。做STFT要求點(diǎn)數(shù)是2的N次方，現(xiàn)在每幀160個(gè)點(diǎn)，大于160的最近的2的N次方是256，所以STFT一次處理256個(gè)點(diǎn)（這也是代碼中256（#define ANAL_BLOCKL_MAX ?256）的由來(lái)）?，F(xiàn)在每幀160個(gè)點(diǎn)，需要補(bǔ)成256個(gè)點(diǎn)。一種做法是在160個(gè)點(diǎn)后面補(bǔ)零補(bǔ)成256個(gè)點(diǎn)。ANS用了一種更好的方法。用上一幀的尾部的96個(gè)點(diǎn)來(lái)補(bǔ)從而形成256個(gè)點(diǎn)。這樣從時(shí)域信號(hào)變成頻域信號(hào)的處理流程如下圖2：

???????????????????????????????????????????????????? 圖2

因?yàn)閷?duì)256點(diǎn)做STFT，所以加窗的點(diǎn)數(shù)也是256。ANS用的是窗是漢寧和矩形混合窗。漢寧窗函數(shù)是w(n) = 0.5 * (1 + cos(2*pi*n / (N-1)))，范圍是（0,1），波形如下圖3。

??????????????????????????????????? 圖3

這個(gè)混合窗是把192（96*2）點(diǎn)的漢寧窗在頂點(diǎn)處插入64點(diǎn)的幅值為1的矩形窗，從而形成256（256 = 192 + 64）點(diǎn)的混合窗，波形如下圖4。

??????????????????????????????????????? 圖4

至于為什么要這么做，后面講頻域轉(zhuǎn)換到時(shí)域時(shí)再說(shuō)。256個(gè)點(diǎn)的值與相應(yīng)的窗函數(shù)相乘，得到要送進(jìn)STFT處理的值。STFT處理后得到256個(gè)頻點(diǎn)的值，這些值除了第0點(diǎn)和第N/2點(diǎn)（N=256，即第128點(diǎn)）點(diǎn)是實(shí)數(shù)外，其余點(diǎn)都是復(fù)數(shù)，且關(guān)于第N/2點(diǎn)共軛對(duì)稱。因?yàn)楣曹棇?duì)稱，一個(gè)點(diǎn)知道了，它的對(duì)稱點(diǎn)就可以求出來(lái)。所以STFT處理后有（N/2 + 1）個(gè)點(diǎn)的值。這里N=256，STFT的輸出是129個(gè)點(diǎn)的值。這也是代碼中129（#define HALF_ANAL_BLOCKL ?129）的由來(lái)。得到129個(gè)頻點(diǎn)的值后還要算每個(gè)頻點(diǎn)的幅度譜和能量等，用于后面降噪算法，具體處理如下面代碼，已給出詳細(xì)的注釋，就不細(xì)說(shuō)了。

在頻域做完降噪處理后需要把信號(hào)從頻域變回時(shí)域，即信號(hào)的重建或者合成，主要步驟是做短時(shí)傅里葉反變換（ISTFT）、加窗和重疊相加(overlap add, OLA)等，處理流程如下圖5。

??????????????????????????????????? 圖5

先做ISTFT（短時(shí)傅里葉反變換），得到256點(diǎn)的實(shí)數(shù)值。這256點(diǎn)包括上一幀的尾部的96點(diǎn)，即有重疊。該怎么拼接保證聲音連貫?zāi)?？上面講從時(shí)域到頻域變換時(shí)用的窗是漢寧矩形混合窗，漢寧窗前半部分（頭部96點(diǎn)）類似于做正弦操作，后半部分（尾部96點(diǎn)）類似于做余弦操作。重疊部分是在上一幀的尾部，加窗做的是類余弦操作，在當(dāng)前幀是頭部，加窗做的是類正弦操作。信號(hào)重建疊加時(shí)一般要求能量或者幅值不變，能量是幅值的平方。那些重疊的點(diǎn)（假設(shè)幅值為m）在上一幀中加窗時(shí)做了類余弦操作，加窗后幅值變成了m*cosθ，在當(dāng)前幀中加窗時(shí)做了類正弦操作，加窗后幅值變成了m*sinθ，能量和為m²*cos²θ + m²*sin²θ, 正好等于m²(原信號(hào)的能量)，這說(shuō)明只要把重疊部分相加就可以保證語(yǔ)音信號(hào)的連貫了。這就解釋了代碼中把ISTFT后的值再做一次加窗操作并把重疊部分相加的原因。具體代碼見(jiàn)下圖6。

?????????????????????????????????????????????????? 圖6

至于矩形窗部分，幅值為1，即加窗后信號(hào)幅值不變，因而不需要做處理，直接填上就可以了。需要注意的是圖6中還有一個(gè)能量縮放因子factor。它在前200幀默認(rèn)為1，后續(xù)幀按如下邏輯關(guān)系得到。

圖7給出了做完ISTFT后數(shù)據(jù)拼接的示意圖。做完ISTFT后有256點(diǎn)數(shù)據(jù)，當(dāng)前幀的頭部96點(diǎn)數(shù)據(jù)與上一幀的尾部96點(diǎn)數(shù)據(jù)相加，中間64點(diǎn)數(shù)據(jù)不變，當(dāng)前幀尾部96點(diǎn)數(shù)據(jù)與下一幀的頭部96點(diǎn)數(shù)據(jù)相加，這樣就能很好的拼接處連貫的語(yǔ)音數(shù)據(jù)了。

????????????????????????????????????????????????? 圖7

下篇將講噪聲的初始估計(jì)以及基于估計(jì)出來(lái)的噪聲算先驗(yàn)信噪比和后驗(yàn)信噪比。

本文摘自：https://www.cnblogs.com/

webRTC中語(yǔ)音降噪模塊ANS細(xì)節(jié)詳解(二)2021-10-22 10:01:33

webRTC中語(yǔ)音降噪模塊ANS細(xì)節(jié)詳解(二)
2021-10-22 10:01:33