期刊文献+
共找到5篇文章
< 1 >
每页显示 20 50 100
一种改进的统计与后串最大匹配的中文分词算法研究 被引量:7
1
作者 吴涛 张毛迪 陈传波 《计算机工程与科学》 CSCD 2008年第8期79-82,共4页
在比较各种传统分词方法优缺点的基础上,本文提出了一种新的分词算法。它采用改进的双向Markov链统计方法对词库进行更新,再利用基于词典的有穷自动机后串最大匹配算法以及博弈树搜索算法进行分词。实验结果表明,该分词算法在分词准确... 在比较各种传统分词方法优缺点的基础上,本文提出了一种新的分词算法。它采用改进的双向Markov链统计方法对词库进行更新,再利用基于词典的有穷自动机后串最大匹配算法以及博弈树搜索算法进行分词。实验结果表明,该分词算法在分词准确性、效率以及生词辨识上取得了良好的效果。 展开更多
关键词 正向最大前串匹配 逆向最大前串匹配 统计法 有穷自动机
在线阅读 下载PDF
中文分词算法解析 被引量:15
2
作者 张磊 张代远 《电脑知识与技术》 2009年第1期192-193,共2页
中文分词是计算机中文信息处理中的难题,而中文分词算法是其中的核心,但由于中英文环境中语素的不同特点,使得中文必须要解决分词的问题。这篇文章较为深刻的阐述了中分分词的算法,基于对分词算法的理解和对匹配法分词的分析,对最... 中文分词是计算机中文信息处理中的难题,而中文分词算法是其中的核心,但由于中英文环境中语素的不同特点,使得中文必须要解决分词的问题。这篇文章较为深刻的阐述了中分分词的算法,基于对分词算法的理解和对匹配法分词的分析,对最大匹配分词方法进行了较深入的研究探讨,提出了什么算法是解决分词效率的最佳方法以及各种方法的比较优劣等问题,及可能产生的歧义.对不同的算法给予了充分的解释,通过对各种算法的比较,总结出了比较常用和效率较高的算法。 展开更多
关键词 中文分词 最大匹配算法 最大概率算法 算法 系统
在线阅读 下载PDF
基于DRIS系统中的中文自动分词模块设计与实现 被引量:1
3
作者 张昭楠 马亚蕾 《电子设计工程》 2016年第14期158-160,共3页
随着信息检索技术越来越受到人们的重视,其中的中文自动分词技术就显得越来越重要。计算机通过对文本中的词语进行识别与处理,直接将结果传送给搜索引擎进行检索。文中在域内资源整合系统(DRIS)的基础上,设计并开发了一个全新的中文自... 随着信息检索技术越来越受到人们的重视,其中的中文自动分词技术就显得越来越重要。计算机通过对文本中的词语进行识别与处理,直接将结果传送给搜索引擎进行检索。文中在域内资源整合系统(DRIS)的基础上,设计并开发了一个全新的中文自动分词模块。通过算法的比对,选择了正向匹配算法作为该模块的基本算法,对其文件结构,中文词典初始化及识别处理过程做出详细介绍。经后期使用后可比较出该模块在检索效率与服务质量上都有了很大程度上的提高,达到了设计要求。 展开更多
关键词 DRIS系统 中文自动分词 搜索引擎 正向最大匹配法
在线阅读 下载PDF
对电子邮件预处理技术的研究 被引量:1
4
作者 冯超 孙素宾 《机械管理开发》 2010年第2期32-33,共2页
电子邮件的预处理,在邮件智能分类系统中是必不可少的重要环节,预处理的效果直接影响到邮件分类器的构建和邮件分类的效果。对电子邮件的预处理主要指汉语自动分词技术。
关键词 正向最大匹配法 0M方法 词频统计法
在线阅读 下载PDF
基于标签技术和熵权法的缺陷推荐研究 被引量:2
5
作者 齐敬先 刘翌 +2 位作者 蒋宇 闫训超 杨剑 《计算机系统应用》 2018年第8期187-192,共6页
针对电力系统,设备(资产)运维管理系统(PMS)与调度管理系统(OMS)之间的设备缺陷互联需要PMS运维人员进行主观判断及手动选择操作,导致人员工作量大幅增加且数据交互的不合理程度和不完备程度也逐渐增大,本文提出了基于标签技术和熵权法... 针对电力系统,设备(资产)运维管理系统(PMS)与调度管理系统(OMS)之间的设备缺陷互联需要PMS运维人员进行主观判断及手动选择操作,导致人员工作量大幅增加且数据交互的不合理程度和不完备程度也逐渐增大,本文提出了基于标签技术和熵权法的缺陷推荐方法.该方法首先以基于正向最大匹配算法、编辑距离和规则库的标签技术对缺陷数据进行标签化标识,然后采用熵权法对其标签进行评价,进而实现向调控员进行智能化推荐缺陷的目的.实验结果表明,通过该缺陷推荐方法的实施,显著减少了运维人员的缺陷选择工作量,并提升了缺陷信息推荐的准确性. 展开更多
关键词 熵权法 标签 正向最大匹配法 编辑距离 缺陷 推荐
在线阅读 下载PDF
上一页 1 下一页 到第
使用帮助 返回顶部