-
题名基于双语语料的单个源语词汇和目标语多词单元的对齐
被引量:6
- 1
-
-
作者
陈博兴
杜利民
-
机构
中国科学院声学研究所语音交互技术研究中心
-
出处
《中文信息学报》
CSCD
北大核心
2003年第1期13-19,共7页
-
基金
国家 973重点基础研究发展资助项目 (G19980 30 5 0 5 )
-
文摘
多词单元包括固定搭配、多词习语和多词术语等。本文提供了一个基于双语口语语料库的自动对齐单个源语词汇和目标语多词单元的算法 ,算法一方面通过计算对应于同一个源语词汇 ,多个目标语词汇之间的互信息和t值的归一化差值的大小来衡量目标语多个词语之间的关联程度以提取多词单元 ,另一方面通过计算互信息和t值的平均值作为多词单元和单个源语词汇之间互为相互翻译的衡量程度 ,用局部最优、首尾禁用词过滤以及长词优先等策略很好地解决了这个问题。另外 ,对短语翻译词典的分级 ,有效地减少了高级别词典中非正确翻译项的数目 ,使得翻译词典具有更好的实用性。
-
关键词
双语语料
源语词汇
目标语
人工智能
机器翻译
双语对齐
多词单元
翻译词典
-
Keywords
artificial intelligence
machine translation bilingual alignment
multiword unit
translation dictionary
even association score
normalize association score difference
-
分类号
H08
[语言文字—语言学]
-
-
题名语块的特点与外语教学
被引量:1
- 2
-
-
作者
计道宏
-
机构
郧阳师范高等专科学校外语系
-
出处
《郧阳师范高等专科学校学报》
2013年第4期125-127,共3页
-
文摘
语块是外语学习的基本单位,是真实外语交际中高频率出现的大于单个单词的多词单位。越来越多的学者认为,语块将取代孤立的词汇或复杂的语法成为外语学习的中心,因为语块教学对外语学习者的外语流利程度和地道程度作用很大,是融词汇教学、语法教学、语用教学、语义教学和语篇教学为一体的整体性教学。
-
关键词
语块
预制语块
外语教学
多词单位
-
Keywords
language chunk
prefabricated chunk
foreign language teaching
multiword unit
-
分类号
G642.0
[文化科学—高等教育学]
-
-
题名中国英语新闻报刊中的词簇
被引量:36
- 3
-
-
作者
李文中
-
机构
河南师范大学
-
出处
《中国外语》
2007年第3期38-43,共6页
-
基金
2004年河南省哲学社科资助项目
-
文摘
为先导研究之目的,建立一个“中国英语新闻语料库”(CENAC),并提取各种长度的词簇,通过与对应的“英国英语新闻语料库”(BENAC)对比分析,调查中国语境中词簇的分布特征及语用功能。研究发现CENAC中使用更多的长词簇,这些词簇结构固定,意义具体,具有很强的表达能力。同时,这些词簇在语言和社会文化方面本土化特征明显,但不易为国际读者所理解。对外语学习者而言,充分掌握现成的模块化表达,有助于提高学习者的交际信心和流利程度。
-
关键词
多词单位
词簇
CENAC
中国英语
-
Keywords
multiword units
word clusters
CENAC
China English
-
分类号
G212
[文化科学—新闻学]
H315
[语言文字—英语]
-