實(shí)驗(yàn)語音學(xué)(漢文部分)

發(fā)布時間:2023-05-23 16:28:31 | 來源:中國藏學(xué)研究中心 | 作者: | 責(zé)任編輯:

三、實(shí)驗(yàn)語音學(xué)

近些年來,實(shí)驗(yàn)語音學(xué)研究已從過去的音素、音節(jié)分析擴(kuò)展到句子和語音篇章的分析。除音色之外,超音段特征包括音高、音強(qiáng)和音長成為實(shí)驗(yàn)語音學(xué)的重要研究對象。語音規(guī)則的合成和識別、人工智能等,都是實(shí)驗(yàn)語音學(xué)關(guān)注的重點(diǎn)。

基于神經(jīng)網(wǎng)絡(luò)理論的研究越來越被學(xué)界關(guān)注,神經(jīng)網(wǎng)絡(luò)技術(shù)被應(yīng)用于語音合成與識別,相關(guān)研究有:黃曉輝、李京《基于循環(huán)神經(jīng)網(wǎng)絡(luò)的藏語語音識別聲學(xué)模型》(《中文信息學(xué)報(bào)》第5期)一文,將循環(huán)神經(jīng)網(wǎng)絡(luò)和連接時序分類算法應(yīng)用于藏語語音識別聲學(xué)建模,實(shí)現(xiàn)端到端的訓(xùn)練;實(shí)驗(yàn)結(jié)果顯示,與傳統(tǒng)基于隱馬爾可夫模型的聲學(xué)建模方法相比,循環(huán)神經(jīng)網(wǎng)絡(luò)模型在藏語拉薩話音素識別上性能優(yōu)越。

相關(guān)研究還有:梁寧娜、鄧彥松《基于DTW的藏語語音識別系統(tǒng)設(shè)計(jì)》(《電子技術(shù)與軟件工程》10期)一文指出,語音識別技術(shù)是讓計(jì)算機(jī)識別人類的語音,并將人類的語音轉(zhuǎn)換為與之對應(yīng)的命令或操作。基于藏語的語音系統(tǒng)的識別研究現(xiàn)在還不成熟,文章將語音識別技術(shù)和藏語的聲學(xué)特征結(jié)合起來,用DTW算法實(shí)現(xiàn)對藏語語音進(jìn)行了識別設(shè)計(jì)。趙悅、李要嬙等《臨近最優(yōu)主動學(xué)習(xí)的藏語語音識別方法研究》(《計(jì)算機(jī)工程與應(yīng)用》第22期)一文,基于主動學(xué)習(xí)的藏語拉薩話語音語料標(biāo)注及選擇,該研究提出了一種臨近最優(yōu)的批量樣本選擇目標(biāo)函數(shù),并驗(yàn)證了其具有submodular函數(shù)性質(zhì)。通過實(shí)驗(yàn)驗(yàn)證,該方法能夠使用較少的訓(xùn)練數(shù)據(jù)保證語音識別模型的精度,從而減少了人工標(biāo)注語料的工作量。

語音特征參數(shù)是語音信號分析的重要依據(jù),藏語語音特征參數(shù)的精確度直接影響藏語語音合成、語音識別及語音壓縮、降噪等處理的效果。涉及藏語的相關(guān)研究有:卓嘎、姜軍、董志誠《藏語語音時域參數(shù)提取關(guān)鍵技術(shù)研究》(《電腦知識與技術(shù)》第8期)一文,介紹了藏語時域語音信號處理過程中的語音特征參數(shù)及其提取關(guān)鍵技術(shù)和算法,分析了語音的時域特征參數(shù)在藏語語音分析中的實(shí)際應(yīng)用。都格草、才讓卓瑪、南措吉《基于譜減法的藏語語音減噪研究》(《廣西科學(xué)院學(xué)報(bào)》第1期)一文指出,譜減法是語音減噪中最常用的方法,文章通過統(tǒng)計(jì)分析譜減法的增益補(bǔ)償因子和過減因子參數(shù),研究基于譜減法的藏語語音減噪處理,并取得較為理想的實(shí)驗(yàn)結(jié)果。

版權(quán)所有 中國藏學(xué)研究中心。 保留所有權(quán)利。 京ICP備06045333號-1

京公網(wǎng)安備 11010502035580號