一種基于LSTM-RNN的喉振傳聲器語(yǔ)音盲增強(qiáng)算法

鄭昌艷; 張雄偉; 曹鐵勇; 楊吉斌; 孫蒙; 邢益搏 陸軍工程大學(xué); 南京210007

關(guān)鍵詞:喉振傳聲器 語(yǔ)音盲增強(qiáng) 遞歸神經(jīng)網(wǎng)絡(luò) 長(zhǎng)短時(shí)記憶 非負(fù)矩陣分解 

摘要:喉振傳聲器以其優(yōu)良的抗噪聲特性已在多種強(qiáng)噪聲場(chǎng)景中得到應(yīng)用,但其產(chǎn)生的語(yǔ)音尚存在著中頻成份厚重、高頻成份缺失等問(wèn)題,嚴(yán)重影響了語(yǔ)音的清晰度和可懂度。為改善喉振傳聲器的語(yǔ)音質(zhì)量,本文提出了一種基于長(zhǎng)短時(shí)記憶遞歸神經(jīng)網(wǎng)絡(luò)(Long short term memory recurrent neuralnetworks,LSTM-RNN)的喉振傳聲器語(yǔ)音盲增強(qiáng)算法。與基于低維的譜包絡(luò)特征估計(jì)算法不同,該算法首先利用LSTM-RNN對(duì)喉振傳聲器語(yǔ)音與空氣傳導(dǎo)語(yǔ)音的高維對(duì)數(shù)幅度譜之間的轉(zhuǎn)換關(guān)系進(jìn)行建模,能有效捕捉上下文信息實(shí)現(xiàn)語(yǔ)音幅度譜的重構(gòu),然后采用非負(fù)矩陣分解(Non-negative matrixfactorization,NMF)對(duì)估計(jì)出的語(yǔ)音幅度譜進(jìn)行處理,有效抑制了過(guò)平滑問(wèn)題,進(jìn)一步提高了語(yǔ)音質(zhì)量。仿真實(shí)驗(yàn)得到的LLR,LSD,PESQ性能指標(biāo)表明,該算法可有效改善喉振傳聲器的語(yǔ)音質(zhì)量。

數(shù)據(jù)采集與處理雜志要求:

{1}基金項(xiàng)目:如果論文是項(xiàng)目成果,請(qǐng)按“項(xiàng)目名稱(chēng)(項(xiàng)目號(hào))”的形式寫(xiě)出。項(xiàng)目名稱(chēng)與項(xiàng)目號(hào)兩者都要有。

{2}稿件應(yīng)具有科學(xué)性、創(chuàng)新性和實(shí)用性,論點(diǎn)明確、論據(jù)可靠、數(shù)據(jù)準(zhǔn)確、邏輯嚴(yán)謹(jǐn)、文字通順。

{3}文中圖表或插圖請(qǐng)附清晰的原圖文件(tif. 或eps.格式,不低于600 像素)。

{4}注釋是對(duì)論文中某一特定內(nèi)容的解釋或補(bǔ)充說(shuō)明,用帶圈數(shù)字注于當(dāng)頁(yè)頁(yè)腳。

{5}稿件文字、標(biāo)點(diǎn)、年代、數(shù)字等書(shū)寫(xiě)方式均以國(guó)家有關(guān)規(guī)定為準(zhǔn)。

注:因版權(quán)方要求,不能公開(kāi)全文,如需全文,請(qǐng)咨詢雜志社

數(shù)據(jù)采集與處理

北大期刊
1-3個(gè)月下單

關(guān)注 17人評(píng)論|0人關(guān)注
相關(guān)期刊
  • 戶外探險(xiǎn)
    省級(jí)期刊 1個(gè)月內(nèi)下單
    戶外雜志社
  • 歌劇
    省級(jí)期刊 1個(gè)月內(nèi)下單
    上海歌劇院
  • 家居主張
    省級(jí)期刊 1個(gè)月內(nèi)下單
    上海世紀(jì)出版股份有限公司;上海辭書(shū)出版社
  • 幸福生活指南
    省級(jí)期刊 1個(gè)月內(nèi)下單
    福建省廣播影視集團(tuán)
服務(wù)與支付
国产精品视频线观看26uuu,免费av网站在线观看,免费一级a四片久久精品网,国产成人无码精品久久久露脸
亚洲美女牲淫视频片 | 亚洲欧美中文字幕在线一区一 | 亚洲精品国产制服丝袜美腿 | 亚洲国产欧美另类专区 | 婷婷丁香爱丁香 | 久久亚洲日韩理论AⅤ片 |