汉语连续语音数据库的语料设计被引量：17

The text design for continuous speech database of standard Chinese

导出

摘要质量优良的语音识别系统或语音合成系统需要高质量的、在语音学和语言学知识指导下设计的科学合理简洁有效的连续语音数据库的支持．在目前阶段，汉语语音数据库应限制在朗读言语（readspeech）的音段方面。为了描写语流中的音变现象，考虑如下语音单元：（1）不计声调的音节（401个）。（2）音节间的双音子415个。（3）音节间的三音子3035个，这是根据37个基本音子，利用音节间共振峰过渡的研究结果，按规则规纳的结果．（4）所有音节间过渡段的韵母一声母结构，采用和同三音子相同的归并方法，共781个．为了增加不同的韵律结构，并考虑语音识别系统的后处理，语料还包括汉语的17类基本句型．选用1993、1994两年的“人民日报”、“百家报刊精选”及若干电视剧本、词典词库作为语料库的原始语料，从中选出2185个句子和388个短语作为朗读语料，它们覆盖了99．8％个无调音节，100％的双音子，99．6％的三音子，以及17类句型。 Well developed continuous speech recognition systems need a higher quality, scientific designed, succinct and valid continuous speech database. At the first stage the database should be mainlylimited in read speech. To describe very complex variances in continuous speech, we propose the following speech units: (1) 401 syllables witout tone. (2) 415 inter-syllabic diphones. (3) 3035 inter-syllabictriphones. (4) 781 inter-syllabicfinal-initial structures. We also give 17 sentence patterns to include theprosodic phenomena. Using automatic method 2185 sentences and 388 phrases are collected by abovephonetic rules from a big corpus-recent years 'Peple's Daily' and so on, as the read text of continuousspeech recognition database in Standard Chinese. This set of sentences covers 99.8% syllables withouttone, 100% inter-syllabic diphoes, 99.6% inter-syllabic triphones and 100% sentence patterns.

作者祖漪清

机构地区中国社会科学院语言研究所

出处《声学学报》 EI CSCD 北大核心 1999年第3期236-247,共12页 Acta Acustica

基金国家863高科技计划资助!863-306-03-09-1

关键词汉语语音数据库语料设计

分类号 TN912.3 [电子电信—通信与信息系统]

引文网络
相关文献

参考文献25

1罗振声,郑碧霞.汉语句型自动分析和分布统计算法与策略的研究[J].中文信息学报,1994,8(2):1-19. 被引量：21
2孙甲松王作英等.连续语音训练词表的构造.第二届中国计算机智能接口与智能应用学术会议论文集[M].,1995.116-121.
3曲菲黄泰翼等.汉语综合语音库语料设计.第四届全国人机语音通讯学术会议论文集[M].,1996.337-341.
4G方特张家lu等（译）.言语科学与言语技术[M].商务印书馆,1994..
5曹剑芬.两音节音联字表[J].语言文字应用,1997,1:60-68.
6陈肖霞.汉语普通话两音节CVCV间C2为三个发音部位的逆向协同发音声学研究[J].中国语文,1997,4:54-63.
7颜景助.前音节为元音尾和后音节为零声母的普通话双音节的音节间共振峰过渡研究.语音研究报告[M].,1994-1995.41-53.
8孙国华.普通话两音节中V1－Z间的共振蜂过渡.第三届语音学研讨会论文集[M].,1996.108-110.
9许毅.普通话音联的声学语音学特性[J].中国语文,1986,5.
10郭锦浮.汉语句子长度、语速与结构停顿.计算机时代的汉语和汉字研究学术研讨会论文摘要[M].,1995.17.

二级参考文献6

1赵淑英，80年代与90年代中国现代汉语语法研究，1992年
2团体著者，世界汉语教学，1989年
3吴竞存，现代汉语句法分析，1988年
4朱德熙，语法讲义，1984年
5吕淑湘，中国语文，1984年
6邢福义，论现代汉语句型系统，1983年

共引文献22

1祖漪清.实现语音数据库科学性的重要环节——篇章断句与连续语音的韵律结构[J].语言文字应用,1998(1):95-99. 被引量：6
2郭艳华,周昌乐.一种汉语语句依存关系网协动生成方法研究[J].杭州电子工业学院学报,2000,20(4):24-32. 被引量：11
3詹卫东.80年代以来汉语信息处理研究述评──作为现代汉语语法研究的应用背景之一[J].当代语言学,2000,2(2):63-73. 被引量：13
4谌志群.汉语句子谓词的自动识别方法研究[J].计算机工程与应用,2007,43(17):176-178. 被引量：1
5刘伟权,钟义信.基于SRNN神经网络的汉语文本词类标注方法[J].计算机研究与发展,1997,34(6):421-426. 被引量：4
6李芳兰.汉语停延研究综述[J].宜春学院学报,2009,31(1):100-103. 被引量：1
7郭海旭,吕国英,李茹.面向数据分析的中文问句句法研究[J].计算机工程与科学,2009,31(10):101-104.
8魏志成.汉语句型系统的解构与重构[J].厦门理工学院学报,2010,18(1):91-96.
9詹卫东,常宝宝,俞士汶.汉语短语结构定界歧义类型分析及分布统计[J].中文信息学报,1999,13(3):9-17. 被引量：24
10王厚峰.句类中E块的作用及其判定策略[J].计算机科学,2000,27(5):64-67. 被引量：2

同被引文献85

1李永宏,孔江平,于洪志.藏语文-音自动规则转换及其实现[J].清华大学学报（自然科学版）,2008,48(S1):621-626. 被引量：20
2刘鹏,王作英.多模式汉语连续语音识别中视觉特征的提取和应用[J].中文信息学报,2004,18(4):79-84. 被引量：6
3祖漪清.实现语音数据库科学性的重要环节——篇章断句与连续语音的韵律结构[J].语言文字应用,1998(1):95-99. 被引量：6
4曹剑芬.普通话双音子和三音子结构系统代表语料集[J].语言文字应用,1997(1):62-70. 被引量：7
5曹剑芬.普通话语音的环境音变与双音子和三音子结构[J].语言文字应用,1996(2):58-63. 被引量：11
6刘连元.现代汉语语料库研制[J].语言文字应用,1996(3):3-9. 被引量：28
7石锋.天津方言双字组声调分析[J].语言研究,1986,6(1):77-90. 被引量：126
8洪晓鹏,姚鸿勋,徐铭辉.基于句子级的唇读语料库及其切分算法[J].计算机工程与应用,2005,41(3):174-177. 被引量：8
9王仁华,倪晋富.从音联出发设计语音库语料[J].计算机应用与软件,1994,11(1):30-35. 被引量：1
10左国玉,刘文举,阮晓钢.一种使用声调映射码本的汉语声音转换方法[J].数据采集与处理,2005,20(2):144-149. 被引量：4

引证文献17

1李荪,曹峰,刘姿杉.面向算法模型的语音数据集质量评估方法研究[J].计算机科学,2022,49(S02):519-524. 被引量：5
2林茂灿.普通话语句中间断和语句韵律短语[J].当代语言学,2000,2(4):210-217. 被引量：34
3阮玲英,陈立万.大词汇量连续语音识别探讨[J].电脑与信息技术,2007,15(4):54-56.
4杨阳蕊,李永宏,于洪志.藏语安多方言的音联结构及统计分析[J].西北民族大学学报（自然科学版）,2008,29(2):11-16. 被引量：2
5王宏,李鑫,高阳.基于大学生的汉语说话人识别语音库设计[J].昌吉学院学报,2008(6):107-111. 被引量：5
6赵晖,林成龙,唐朝京.基于视频三音子的双模态语料自动选取算法[J].计算机工程,2009,35(17):1-3. 被引量：2
7赵晖,林成龙,唐朝京.基于视频三音子的汉语双模态语料库的建立[J].中文信息学报,2009,23(5):98-103. 被引量：7
8李永宏,于洪志,孔江平.藏语连续语音语料库设计与实现[J].计算机工程与应用,2010,46(13):233-235. 被引量：9
9刘聪,胡郁,戴礼荣,王仁华.一种针对区分性训练的受限线性搜索优化方法[J].模式识别与人工智能,2010,23(4):450-455. 被引量：4
10沈亚敏,赵晖,张权,唐朝京.面向语音转换的汉语语料自动选取算法[J].计算机工程,2011,37(5):256-257.

二级引证文献76

1陈家隽.左缘与右缘语用标记“不是”的功能区分——以韵律实验分析为视角[J].语言学研究,2019(2):51-66. 被引量：1
2赵丹群,王心玥,郭磬馨.开放科学时代学术评价研究的新机遇与新挑战——从系列开放获取宣言/倡议或行动计划谈起[J].情报学进展,2024(1):247-277. 被引量：1
3杨国文.汉语小句的尾调及末尾音节的声调变化[J].当代语言学,2021(1):87-96.
4王茂林.解说式广播话语之间断分析[J].暨南大学华文学院学报,2004(3):64-71.
5林茂灿.普通话语句的韵律结构和基频(F_0)高低线构建[J].当代语言学,2002,4(4):254-265. 被引量：36
6王茂林.汉语自然话语韵律组块的优选论分析[J].暨南学报（哲学社会科学版）,2005,27(4):85-87. 被引量：5
7郑康.英汉语散文单句的信息节奏对比分析[J].苏州大学学报（哲学社会科学版）,2005,21(6):79-82. 被引量：1
8刘长军.英语音变模式对比性研究[J].华南理工大学学报（社会科学版）,2006,8(3):64-69. 被引量：4
9穆凤英.试析语调短语能力[J].徐州师范大学学报（哲学社会科学版）,2007,33(6):126-129. 被引量：6
10刘春梅.英汉复合词重音模式差异初探[J].徐州教育学院学报,2007,22(4):125-127. 被引量：3

1霍云.漫谈各种复用技术[J].中国有线电视,2004(16):6-10.
2潘玲,白振兴.一种易于实现的Turbo码乘积码译码算法[J].陕西师范大学学报（自然科学版）,2005,33(S1):199-201.
3赵庆卫,王作英,陆大紟.基于音节间相关识别单元的汉语连续语音识别算法[J].清华大学学报（自然科学版）,1999,39(9):65-68. 被引量：2
4沈伟.浅谈汉语方言语音数据库的语料设计[J].计算机光盘软件与应用,2014,17(8):254-255.
5赵力,邹采荣,吴镇扬.基于连续分布型HMM的汉语连续语音的声调识别方法[J].信号处理,2000,16(1):20-23. 被引量：6
6赵鹤鸣,周旭东.基于知识的汉语连续语音识别研究[J].计算机研究与发展,1993,30(6):44-48. 被引量：2
7吴霁,侯伯亨.一种新的汉语连续语音音节分割方法[J].西部电子,1993,4(4):8-17.
8胡玉贵,殷奎喜,赵华.基于2.4GHz模块的AODV路由协议的实现[J].金陵科技学院学报,2009,25(1):5-9. 被引量：1
9邹良营.探讨非二进制LDPC码编码调制在光纤通信中的应用[J].科学与财富,2014(4):311-311.
10一言.DENON AVR-4520 CI多声道影音接收机[J].现代音响技术,2013(6):18-21.

声学学报

1999年第3期

浏览历史

内容加载中请稍等...

汉语连续语音数据库的语料设计被引量：17

参考文献25

二级参考文献6

共引文献22

同被引文献85

引证文献17

二级引证文献76

相关作者

相关机构

相关主题

浏览历史

汉语连续语音数据库的语料设计 被引量：17

参考文献25

二级参考文献6

共引文献22

同被引文献85

引证文献17

二级引证文献76

相关作者

相关机构

相关主题

浏览历史

汉语连续语音数据库的语料设计被引量：17