期刊文献+
共找到1篇文章
< 1 >
每页显示 20 50 100
基于串频统计的汉语和孟加拉语专有名词识别 被引量:2
1
作者 柯修 王惠临 于薇 《现代图书情报技术》 CSSCI 北大核心 2011年第12期31-38,共8页
基于Nagao串频统计算法实现汉语和孟加拉语专有名词的识别。提取未经过词性标注的中文和孟加拉语语料中的的n元串,使用改进的SSR算法过滤多余子串,利用字串的相邻字信息计算所有n元串成为专有名词的概率,并据此筛选专有名词。最后,实现... 基于Nagao串频统计算法实现汉语和孟加拉语专有名词的识别。提取未经过词性标注的中文和孟加拉语语料中的的n元串,使用改进的SSR算法过滤多余子串,利用字串的相邻字信息计算所有n元串成为专有名词的概率,并据此筛选专有名词。最后,实现基于串频统计的跨语言专有名词识别系统。实验表明,系统能够从输入的生语料中有效地识别出人名、地名、团体机构名等。 展开更多
关键词 专有名词识别 串频统计 nagao算法 ssr算法
原文传递
上一页 1 下一页 到第
使用帮助 返回顶部