期刊文献+

汉语连续语音数据库的语料设计 被引量:17

The text design for continuous speech database of standard Chinese
原文传递
导出
摘要 质量优良的语音识别系统或语音合成系统需要高质量的、在语音学和语言学知识指导下设计的科学合理简洁有效的连续语音数据库的支持.在目前阶段,汉语语音数据库应限制在朗读言语(readspeech)的音段方面。为了描写语流中的音变现象,考虑如下语音单元:(1)不计声调的音节(401个)。(2)音节间的双音子415个。(3)音节间的三音子3035个,这是根据37个基本音子,利用音节间共振峰过渡的研究结果,按规则规纳的结果.(4)所有音节间过渡段的韵母一声母结构,采用和同三音子相同的归并方法,共781个.为了增加不同的韵律结构,并考虑语音识别系统的后处理,语料还包括汉语的17类基本句型.选用1993、1994两年的“人民日报”、“百家报刊精选”及若干电视剧本、词典词库作为语料库的原始语料,从中选出2185个句子和388个短语作为朗读语料,它们覆盖了99.8%个无调音节,100%的双音子,99.6%的三音子,以及17类句型。 Well developed continuous speech recognition systems need a higher quality, scientific designed, succinct and valid continuous speech database. At the first stage the database should be mainlylimited in read speech. To describe very complex variances in continuous speech, we propose the following speech units: (1) 401 syllables witout tone. (2) 415 inter-syllabic diphones. (3) 3035 inter-syllabictriphones. (4) 781 inter-syllabicfinal-initial structures. We also give 17 sentence patterns to include theprosodic phenomena. Using automatic method 2185 sentences and 388 phrases are collected by abovephonetic rules from a big corpus-recent years 'Peple's Daily' and so on, as the read text of continuousspeech recognition database in Standard Chinese. This set of sentences covers 99.8% syllables withouttone, 100% inter-syllabic diphoes, 99.6% inter-syllabic triphones and 100% sentence patterns.
作者 祖漪清
出处 《声学学报》 EI CSCD 北大核心 1999年第3期236-247,共12页 Acta Acustica
基金 国家863高科技计划资助!863-306-03-09-1
  • 相关文献

参考文献25

  • 1罗振声,郑碧霞.汉语句型自动分析和分布统计算法与策略的研究[J].中文信息学报,1994,8(2):1-19. 被引量:21
  • 2孙甲松 王作英 等.连续语音训练词表的构造.第二届中国计算机智能接口与智能应用学术会议论文集[M].,1995.116-121.
  • 3曲菲 黄泰翼 等.汉语综合语音库语料设计.第四届全国人机语音通讯学术会议论文集[M].,1996.337-341.
  • 4G方特 张家lu等(译).言语科学与言语技术[M].商务印书馆,1994..
  • 5曹剑芬.两音节音联字表[J].语言文字应用,1997,1:60-68.
  • 6陈肖霞.汉语普通话两音节CVCV间C2为三个发音部位的逆向协同发音声学研究[J].中国语文,1997,4:54-63.
  • 7颜景助.前音节为元音尾和后音节为零声母的普通话双音节的音节间共振峰过渡研究.语音研究报告[M].,1994-1995.41-53.
  • 8孙国华.普通话两音节中V1-Z间的共振蜂过渡.第三届语音学研讨会论文集[M].,1996.108-110.
  • 9许毅.普通话音联的声学语音学特性[J].中国语文,1986,5.
  • 10郭锦浮.汉语句子长度、语速与结构停顿.计算机时代的汉语和汉字研究学术研讨会论文摘要[M].,1995.17.

二级参考文献6

  • 1赵淑英,80年代与90年代中国现代汉语语法研究,1992年
  • 2团体著者,世界汉语教学,1989年
  • 3吴竞存,现代汉语句法分析,1988年
  • 4朱德熙,语法讲义,1984年
  • 5吕淑湘,中国语文,1984年
  • 6邢福义,论现代汉语句型系统,1983年

共引文献22

同被引文献85

引证文献17

二级引证文献76

相关作者

内容加载中请稍等...

相关机构

内容加载中请稍等...

相关主题

内容加载中请稍等...

浏览历史

内容加载中请稍等...
;
使用帮助 返回顶部