-
题名一种改进的统计与后串最大匹配的中文分词算法研究
被引量:7
- 1
-
-
作者
吴涛
张毛迪
陈传波
-
机构
华中科技大学软件学院
-
出处
《计算机工程与科学》
CSCD
2008年第8期79-82,共4页
-
基金
国家863计划资助项目(2006AA04Z131)
-
文摘
在比较各种传统分词方法优缺点的基础上,本文提出了一种新的分词算法。它采用改进的双向Markov链统计方法对词库进行更新,再利用基于词典的有穷自动机后串最大匹配算法以及博弈树搜索算法进行分词。实验结果表明,该分词算法在分词准确性、效率以及生词辨识上取得了良好的效果。
-
关键词
正向最大前串匹配
逆向最大前串匹配
统计法
有穷自动机
-
Keywords
forward maximum match
reverse maximum match
statistical method
definite finite automation
-
分类号
TP391
[自动化与计算机技术—计算机应用技术]
-
-
题名中文分词算法解析
被引量:15
- 2
-
-
作者
张磊
张代远
-
机构
南京邮电大学计算机学院
-
出处
《电脑知识与技术》
2009年第1期192-193,共2页
-
文摘
中文分词是计算机中文信息处理中的难题,而中文分词算法是其中的核心,但由于中英文环境中语素的不同特点,使得中文必须要解决分词的问题。这篇文章较为深刻的阐述了中分分词的算法,基于对分词算法的理解和对匹配法分词的分析,对最大匹配分词方法进行了较深入的研究探讨,提出了什么算法是解决分词效率的最佳方法以及各种方法的比较优劣等问题,及可能产生的歧义.对不同的算法给予了充分的解释,通过对各种算法的比较,总结出了比较常用和效率较高的算法。
-
关键词
中文分词
最大匹配算法
最大概率算法
算法
系统
-
Keywords
chinese lexical analysis
forward maximum matching method
maxamum probability method
algorithm
system
-
分类号
TP391
[自动化与计算机技术—计算机应用技术]
-
-
题名基于DRIS系统中的中文自动分词模块设计与实现
被引量:1
- 3
-
-
作者
张昭楠
马亚蕾
-
机构
陕西职业技术学院
-
出处
《电子设计工程》
2016年第14期158-160,共3页
-
文摘
随着信息检索技术越来越受到人们的重视,其中的中文自动分词技术就显得越来越重要。计算机通过对文本中的词语进行识别与处理,直接将结果传送给搜索引擎进行检索。文中在域内资源整合系统(DRIS)的基础上,设计并开发了一个全新的中文自动分词模块。通过算法的比对,选择了正向匹配算法作为该模块的基本算法,对其文件结构,中文词典初始化及识别处理过程做出详细介绍。经后期使用后可比较出该模块在检索效率与服务质量上都有了很大程度上的提高,达到了设计要求。
-
关键词
DRIS系统
中文自动分词
搜索引擎
正向最大匹配法
-
Keywords
DRIS
Chinese words auto-segmentation
search engine
forward maximum match method
-
分类号
TN99
[电子电信—信号与信息处理]
-
-
题名对电子邮件预处理技术的研究
被引量:1
- 4
-
-
作者
冯超
孙素宾
-
机构
中北大学电子与计算机科学技术学院
山西省机电职业技术学院
-
出处
《机械管理开发》
2010年第2期32-33,共2页
-
文摘
电子邮件的预处理,在邮件智能分类系统中是必不可少的重要环节,预处理的效果直接影响到邮件分类器的构建和邮件分类的效果。对电子邮件的预处理主要指汉语自动分词技术。
-
关键词
正向最大匹配法
0M方法
词频统计法
-
Keywords
forward maximum matching method
OM method
Frequency Statistics Act
-
分类号
TP393
[自动化与计算机技术—计算机应用技术]
-
-
题名基于标签技术和熵权法的缺陷推荐研究
被引量:2
- 5
-
-
作者
齐敬先
刘翌
蒋宇
闫训超
杨剑
-
机构
南瑞集团(国网电力科学研究院)有限公司
国网江苏省电力有限公司
-
出处
《计算机系统应用》
2018年第8期187-192,共6页
-
基金
江苏省公司科技项目(J2017007)~~
-
文摘
针对电力系统,设备(资产)运维管理系统(PMS)与调度管理系统(OMS)之间的设备缺陷互联需要PMS运维人员进行主观判断及手动选择操作,导致人员工作量大幅增加且数据交互的不合理程度和不完备程度也逐渐增大,本文提出了基于标签技术和熵权法的缺陷推荐方法.该方法首先以基于正向最大匹配算法、编辑距离和规则库的标签技术对缺陷数据进行标签化标识,然后采用熵权法对其标签进行评价,进而实现向调控员进行智能化推荐缺陷的目的.实验结果表明,通过该缺陷推荐方法的实施,显著减少了运维人员的缺陷选择工作量,并提升了缺陷信息推荐的准确性.
-
关键词
熵权法
标签
正向最大匹配法
编辑距离
缺陷
推荐
-
Keywords
entropy weight method
tag
forward maximum matching
edit distance
defect
recommend
-
分类号
TM73
[电气工程—电力系统及自动化]
TP391.3
[自动化与计算机技术—计算机应用技术]
-