三、實(shí)驗(yàn)語(yǔ)音學(xué)
實(shí)驗(yàn)語(yǔ)音學(xué)的成果為自然語(yǔ)言的處理提供了強(qiáng)有力的支持。相關(guān)的成果有:夏吾措的《基于PAS6600的藏語(yǔ)送氣/不送氣輔音氣流信號(hào)研究》(《西北民族大學(xué)學(xué)報(bào)》自然科學(xué)版第3期)一文,以藏文字母中七組送氣與不送氣輔音為研究對(duì)象,利用語(yǔ)音空氣動(dòng)力學(xué)PAS6600提取各個(gè)輔音的氣流信號(hào)參數(shù),從呼氣時(shí)長(zhǎng)、平均呼氣速度、呼出氣流量等三項(xiàng)參數(shù),分析相同輔音的各項(xiàng)參數(shù)在不同性別間存在的差異,即男性的呼出氣流量比女性的呼出氣流量要大,這主要跟其生理特征有直接的關(guān)系。王慶楠、郭武、解傳棟的《基于端到端技術(shù)的藏語(yǔ)語(yǔ)音識(shí)別》(《模式識(shí)別與人工智能》第4期)一文,提出將已有的語(yǔ)言學(xué)知識(shí)結(jié)合至端到端的聲學(xué)建模中,采用綁定的三音子作為建模單元,解決建模單元的稀疏性問(wèn)題,大幅提高聲學(xué)建模的區(qū)分度和魯棒性。在藏語(yǔ)測(cè)試集上,通過(guò)實(shí)驗(yàn)證明文中方法提高基于鏈接時(shí)序分類技術(shù)的聲學(xué)模型的識(shí)別率,并驗(yàn)證語(yǔ)言學(xué)知識(shí)和基于端到端聲學(xué)建模技術(shù)結(jié)合的有效性。代龍翔、李冠宇、馬寧的《基于譜減法語(yǔ)音增強(qiáng)效果研究》(《西北民族大學(xué)學(xué)報(bào)》自然科學(xué)版第2期)一文,介紹了語(yǔ)音增強(qiáng)的發(fā)展歷程以及面向藏語(yǔ)語(yǔ)音的研究現(xiàn)狀。文章選擇經(jīng)典的譜減法作為語(yǔ)音增強(qiáng)方法,并介紹了譜減法原理,同時(shí)設(shè)計(jì)實(shí)驗(yàn)方案,實(shí)驗(yàn)語(yǔ)料使用純凈語(yǔ)音和噪音混合成的帶噪語(yǔ)音,按照不同信噪比進(jìn)行語(yǔ)音測(cè)試,得出結(jié)論:使用譜減法能夠明顯提升語(yǔ)音質(zhì)量,提升效果隨著噪音語(yǔ)音相關(guān)度的多少而變化。曲珍、扎西加、春燕的《最大熵軟決策樹(shù)HMM最大似然藏語(yǔ)音合成》(《計(jì)算機(jī)工程與設(shè)計(jì)》第4期)一文,針對(duì)傳統(tǒng)的硬決策樹(shù)藏語(yǔ)音合成系統(tǒng)存在泛化性能不強(qiáng)的問(wèn)題,設(shè)計(jì)改進(jìn)一種二進(jìn)制軟決策樹(shù)算法,實(shí)現(xiàn)基于語(yǔ)境因子的藏語(yǔ)音合成模型參數(shù)估計(jì)。內(nèi)部節(jié)點(diǎn)根據(jù)子代節(jié)點(diǎn)隸屬度進(jìn)行選取,每個(gè)節(jié)點(diǎn)可視為基于語(yǔ)境依賴隸屬度的模糊集合,將每個(gè)語(yǔ)境分配給幾個(gè)重疊的葉節(jié)點(diǎn),提高模型概括和函數(shù)逼近性能;采用最大熵平滑分布進(jìn)行局部一階矩和全局二階矩特征捕捉,實(shí)現(xiàn)隱式馬爾可夫(HMM)輸出概率分布的軟決策參數(shù)最大似然估計(jì)。仿真驗(yàn)證結(jié)果表明,所提算法在滿足應(yīng)用實(shí)時(shí)性要求的前提下,可有效提高藏語(yǔ)音合成效果。才讓卓瑪、才智杰的《基于語(yǔ)料庫(kù)的藏語(yǔ)語(yǔ)音合成單元選擇算法》(《中文信息學(xué)報(bào)》第5期)一文,針對(duì)藏語(yǔ)言文字的特點(diǎn),提出以基本構(gòu)件、組合構(gòu)件、字、詞及句單元相融合的混合單元語(yǔ)音合成策略,并提出了藏語(yǔ)語(yǔ)音合成混合單元選擇算法。主觀評(píng)價(jià)與客觀評(píng)測(cè)數(shù)據(jù)表明該策略與算法有效和合理,各類合成單元在開(kāi)放語(yǔ)料上的覆蓋率與語(yǔ)音合成效果均達(dá)到預(yù)期的目標(biāo)。
版權(quán)所有 中國(guó)藏學(xué)研究中心。 保留所有權(quán)利。 京ICP備06045333號(hào)-1
京公網(wǎng)安備 11010502035580號(hào)