3D語(yǔ)音處理技術(shù)成就類Siri應(yīng)用

2013-08-21 12:17 來(lái)源:電子信息網(wǎng) 作者:蒲公英

由于近來(lái)平板電腦、計(jì)算機(jī)、智能電視機(jī)和其它消費(fèi)電子設(shè)備用的語(yǔ)音控制接口的興起,語(yǔ)音質(zhì)量成為了一個(gè)熱門話題。如果沒(méi)有可以理解的語(yǔ)音,自動(dòng)語(yǔ)音識(shí)別功能就不能正確工作,無(wú)法用作可靠的輸入設(shè)備。這個(gè)問(wèn)題還與噪聲環(huán)境糾纏在一起,而噪聲環(huán)境可能嚴(yán)重地降低語(yǔ)音的質(zhì)量,甚至?xí)拐Z(yǔ)音控制功能完全不可工作。

傳統(tǒng)噪聲抵消技術(shù)需要折衷考慮噪聲抑制程度和語(yǔ)音質(zhì)量:噪聲抑制水平越高,語(yǔ)音失真的可能性也越大。為了盡量減少這種折衷,工程師開(kāi)發(fā)出了噪聲抑制算法來(lái)減少噪聲電平,這種技術(shù)在固定噪聲場(chǎng)合具有很好的效果,但在街道噪聲和類似其它非固定噪聲的場(chǎng)合,性能并不理想。

隨著智能手機(jī)上引入第二個(gè)麥克風(fēng),噪聲抵消技術(shù)向前邁進(jìn)了一大步。手機(jī)上的兩個(gè)麥克風(fēng)工作在與人類聽(tīng)覺(jué)系統(tǒng)相似的方式。然而,這個(gè)功能并不能提供足夠的噪聲抵消水平來(lái)消除語(yǔ)音呼叫或語(yǔ)音控制場(chǎng)合的所有背景噪聲,例如在開(kāi)車或乘坐公共交通工具、甚至在音樂(lè)聲很大的家里時(shí)。

增加用于高級(jí)噪聲抵消的傳感器

除了標(biāo)準(zhǔn)的兩個(gè)音頻麥克風(fēng)外,高級(jí)噪聲抵消技術(shù)使用了一個(gè)新增的傳感器,然后應(yīng)用3D-Vocal算法執(zhí)行多個(gè)語(yǔ)音處理任務(wù),包括回波和背景噪聲抵消、響度均衡和一般語(yǔ)音增強(qiáng)。消除背景噪聲可以顯著提高智能手機(jī)、平板電腦和其它移動(dòng)設(shè)備中的自動(dòng)語(yǔ)音識(shí)別(ASR)和語(yǔ)音呼叫應(yīng)用的準(zhǔn)確率。

下圖1.0顯示了一個(gè)高級(jí)噪聲抵消技術(shù)如何影響有噪聲語(yǔ)音的例子。上面的波形代表有噪聲的語(yǔ)音,是語(yǔ)音和環(huán)境噪聲疊加的產(chǎn)物(S+N),而下面的波形是經(jīng)過(guò)3D語(yǔ)音處理后得到的干凈語(yǔ)音信號(hào)。

1

圖1.0:對(duì)語(yǔ)音和環(huán)境噪聲應(yīng)用典型的3D語(yǔ)音處理技術(shù)后的結(jié)果。

圖2.0顯示的是聲譜圖,上面的圖形代表有噪聲語(yǔ)音(S+N)的聲譜圖,下面的聲譜圖顯示的是經(jīng)過(guò)3D語(yǔ)音處理后的語(yǔ)音信號(hào)。

2

圖2.0:對(duì)語(yǔ)音和環(huán)境噪聲進(jìn)行3D處理后的聲譜圖。

利用傳感器和兩個(gè)麥克風(fēng)提供的擴(kuò)展數(shù)據(jù)集,3D-Vocal算法可以提取出用于表征語(yǔ)音源的特征信號(hào),并區(qū)分屬于感興趣語(yǔ)音的聲音分量與環(huán)境噪聲。圖3.0中的框圖顯示了高級(jí)噪聲抵消技術(shù)中的音頻處理路徑。

3

圖3.0:3D語(yǔ)音處理框圖。

3D語(yǔ)音處理框圖中的各個(gè)模塊說(shuō)明如下:

3D-Vocal(頻譜-時(shí)間分析):接收來(lái)自麥克風(fēng)陣列和VSensor的所有信號(hào),并對(duì)組合信息執(zhí)行專門的頻譜-時(shí)間處理。3D-Vocal數(shù)據(jù)中的一些相關(guān)圖案與環(huán)境噪聲有關(guān),其它圖案則被識(shí)別為用戶語(yǔ)音。3D-Vocal頻譜-時(shí)間處理功能將用戶語(yǔ)音從預(yù)測(cè)的環(huán)境噪聲中分離出來(lái),并為語(yǔ)音/噪聲特征提取模塊提供一些參考信息。

特征提?。喊伻肫渌K的語(yǔ)音/噪聲數(shù)據(jù)。提取出的特征包含了有關(guān)用戶語(yǔ)音和環(huán)境噪聲的頻譜-時(shí)間、實(shí)時(shí)信息。這些信息可以用來(lái)從用戶語(yǔ)音中濾除環(huán)境噪聲,實(shí)現(xiàn)回波抵消性能增強(qiáng)等功能。

環(huán)境噪聲抵消:抵消各種固定和非固定、相關(guān)和非相關(guān)的環(huán)境噪聲。環(huán)境噪聲抵消算法使用特征提取信息和3D-Vocal模塊的輸出信息。

均衡:均衡接收信號(hào)的頻譜分布,使其匹配ASR處理或語(yǔ)音呼叫的要求。


1 2 3 4 > 
3D語(yǔ)音處理

相關(guān)閱讀

暫無(wú)數(shù)據(jù)

一周熱門