三、實驗語音學
近些年來,實驗語音學研究已從過去的音素、音節(jié)分析擴展到句子和語音篇章的分析。除音色之外,超音段特征包括音高、音強和音長成為實驗語音學的重要研究對象。語音規(guī)則的合成和識別、人工智能等,都是實驗語音學關(guān)注的重點。
基于神經(jīng)網(wǎng)絡(luò)理論的研究越來越被學界關(guān)注,神經(jīng)網(wǎng)絡(luò)技術(shù)被應(yīng)用于語音合成與識別,相關(guān)研究有:黃曉輝、李京《基于循環(huán)神經(jīng)網(wǎng)絡(luò)的藏語語音識別聲學模型》(《中文信息學報》第5期)一文,將循環(huán)神經(jīng)網(wǎng)絡(luò)和連接時序分類算法應(yīng)用于藏語語音識別聲學建模,實現(xiàn)端到端的訓練;實驗結(jié)果顯示,與傳統(tǒng)基于隱馬爾可夫模型的聲學建模方法相比,循環(huán)神經(jīng)網(wǎng)絡(luò)模型在藏語拉薩話音素識別上性能優(yōu)越。
相關(guān)研究還有:梁寧娜、鄧彥松《基于DTW的藏語語音識別系統(tǒng)設(shè)計》(《電子技術(shù)與軟件工程》10期)一文指出,語音識別技術(shù)是讓計算機識別人類的語音,并將人類的語音轉(zhuǎn)換為與之對應(yīng)的命令或操作?;诓卣Z的語音系統(tǒng)的識別研究現(xiàn)在還不成熟,文章將語音識別技術(shù)和藏語的聲學特征結(jié)合起來,用DTW算法實現(xiàn)對藏語語音進行了識別設(shè)計。趙悅、李要嬙等《臨近最優(yōu)主動學習的藏語語音識別方法研究》(《計算機工程與應(yīng)用》第22期)一文,基于主動學習的藏語拉薩話語音語料標注及選擇,該研究提出了一種臨近最優(yōu)的批量樣本選擇目標函數(shù),并驗證了其具有submodular函數(shù)性質(zhì)。通過實驗驗證,該方法能夠使用較少的訓練數(shù)據(jù)保證語音識別模型的精度,從而減少了人工標注語料的工作量。
語音特征參數(shù)是語音信號分析的重要依據(jù),藏語語音特征參數(shù)的精確度直接影響藏語語音合成、語音識別及語音壓縮、降噪等處理的效果。涉及藏語的相關(guān)研究有:卓嘎、姜軍、董志誠《藏語語音時域參數(shù)提取關(guān)鍵技術(shù)研究》(《電腦知識與技術(shù)》第8期)一文,介紹了藏語時域語音信號處理過程中的語音特征參數(shù)及其提取關(guān)鍵技術(shù)和算法,分析了語音的時域特征參數(shù)在藏語語音分析中的實際應(yīng)用。都格草、才讓卓瑪、南措吉《基于譜減法的藏語語音減噪研究》(《廣西科學院學報》第1期)一文指出,譜減法是語音減噪中最常用的方法,文章通過統(tǒng)計分析譜減法的增益補償因子和過減因子參數(shù),研究基于譜減法的藏語語音減噪處理,并取得較為理想的實驗結(jié)果。
版權(quán)所有 中國藏學研究中心。 保留所有權(quán)利。 京ICP備06045333號-1
京公網(wǎng)安備 11010502035580號