用于最佳文本选择的改进贪婪算法被引量：1

Modified Greedy Algorithm for Optimal Text Selection

下载PDF

导出

摘要对于开放域的文语转换系统来说，最佳训练文本集的选择是至关重要的，尤其在希望文语转换系统能实现对不同说话人语音的自适应建模时．以音长模型为例，在线性模型的假设下，通过对设计矩阵结构的扩展，提出了基于多模型合并的贪婪选择算法．实验表明，由于充分利用了不同子类模型选择文本间的巨大冗余度，从而显著减少了所需训练语句的数量．同时，通过改进拟阵覆盖问题中代价函数的形式，将算法进一步推广至使训练文本中音素总数最少，从而可以更准确地实现选择文本最小化的目标． Optimal text selection is vital for open domain text to speech synthesis, especially when we desire the synthesizer to realize speaker adaptive modeling. The duration model was taken as a test case. Under the linear model assumption, by modifying the structure of design matrix, a multi model based greedy algorithm was proposed. Taking advantage of the big redundancy between texts for different sound categories, it can reduce the number of selected sentences drastically compared to the original single model based version. With a further modification of the cost function in matroid cover problem, the algorithm can be generalized from the minimization of sentence number to the minimization of total phoneme number, so as to implement a more accurate optimal text selection.

作者顾文涛

机构地区上海交通大学电子工程系

出处《上海交通大学学报》 EI CAS CSCD 北大核心 1999年第1期96-100,共5页 Journal of Shanghai Jiaotong University

基金美国贝尔实验室中国上海分部资助

关键词文本选择贪婪算法音长模型文语转换系统 text to speech synthesis text selection greedy algorithm matroid cover duration model

分类号 TN912.33 [电子电信—通信与信息系统] TP391.42 [自动化与计算机技术—计算机应用技术]

引文网络
相关文献

同被引文献8

1吴义坚,王仁华.基于HMM的可训练中文语音合成[J].中文信息学报,2006,20(4):75-81. 被引量：17
2蔡莲红,崔丹丹,蔡锐.汉语普通话语音合成语料库TH-CoSS的建设和分析[J].中文信息学报,2007,21(2):94-99. 被引量：12
3Tokuda K,Zen H,Black A W.An HMM-based speech synthesis system applied to english[C]//Proceedings of 2002 IEEE Workshop on Speech Synthesis,11-13 Sept 2002.
4Wang R H,Ma Zhong-ke,Li Wei,et al.A corpus-based Chinese speech synthesis with contextual-dependent unit selection[C]//The Sixth International Conference on Spoken Language Processing, Beijing, 2000: 391-394.
5那斯尔江,吾守尔·斯拉木.维吾尔语大词汇量连续语音识别研究-语音语料库的建立[C]//全国第11届少数民族语言文字学术会议,云南:西双版纳,2007,2:379-385.
6Buchsbaum A L,van Santen J P H.Selecting training text via greedy rank covering[C]//Proceedings 7th ACM-SIAM Symposium on Discrete Algorithms,Atlanta,USA, 1996.
7Corrmen T H.算法导论[M].2版.北京:高等教育出版社,2002.
8李少芳.连续背包问题贪婪算法最优解的实现[J].福建电脑,2003,19(11):12-13. 被引量：7

引证文献1

1姑丽加玛丽.麦麦提艾力,艾斯卡尔.肉孜,艾斯卡尔.艾木都拉.三音素模型的维吾尔语最佳文本选取算法[J].计算机工程与应用,2009,45(18):242-244. 被引量：5

二级引证文献5

1姑丽加玛丽.麦麦提艾力,艾斯卡尔.肉孜,艾斯卡尔.艾木都拉.维吾尔语多音词消歧混合方法[J].计算机工程与应用,2011,47(35):158-160.
2姑丽加玛丽·麦麦提艾力,艾斯卡尔·肉孜,艾斯卡尔·艾木都拉.多基元及韵律参数匹配的维吾尔语语音合成方法[J].计算机工程与应用,2012,48(2):116-118. 被引量：3
3张小燕,宿建军,薛化建,王磊.维吾尔语语音识别语料库中的OOV研究[J].计算机工程与设计,2012,33(2):772-776. 被引量：4
4卡斯木江.卡迪尔,古丽娜尔.艾力,艾斯卡尔.艾木都拉.基于最小合成单元的维吾尔音库设计[J].通信技术,2012,45(4):83-85. 被引量：1
5卡斯木江.卡迪尔,古丽娜尔.艾力,艾斯卡尔.艾木都拉.TTS语音单元的无损压缩与按需解压缩技术[J].信息技术,2012,36(10):11-14.

1大风.轻松学习Word2000(三)[J].中老年保健,2003(3):37-37.
2朱梅影.如何立足文本选择教学内容[J].学生之友（小学版）,2012(22):95-95.
3曹敦,陈子琦.一种新的无线传感器网络节点定位算法[J].计算机工程与应用,2012,48(8):116-118. 被引量：6
4徐烨.Word中的文本选择[J].视窗世界,2004(9):13-13.
5西贝.Word文档选择小窍门[J].少年电脑世界（低年级）,2002(6):23-23.
6严淑萍.小技巧两则[J].农村财务会计,2009(11):41-41.
7刘白,周永权.一种基于人工鱼群的混合聚类算法[J].计算机工程与应用,2008,44(18):136-138. 被引量：5
8克克PDF阅读器[J].电脑知识与技术（经验技巧）,2013(2):17-17.
9机器猫.轻松打造三维立体效果图[J].电脑迷,2006,0(5):61-61.
10屈玉贵,ustc.edu.cn,石勇军,ustc.edu.cn.多视角面向对象分析的一致性问题[J].计算机工程与应用,2000,36(11):75-77.

上海交通大学学报

1999年第1期

浏览历史

内容加载中请稍等...

用于最佳文本选择的改进贪婪算法被引量：1

同被引文献8

引证文献1

二级引证文献5

相关作者

相关机构

相关主题

浏览历史

用于最佳文本选择的改进贪婪算法 被引量：1

同被引文献8

引证文献1

二级引证文献5

相关作者

相关机构

相关主题

浏览历史

用于最佳文本选择的改进贪婪算法被引量：1