期刊文献+
共找到31篇文章
< 1 2 >
每页显示 20 50 100
基于深度学习的智能变电站继电保护定值校核方法
1
作者 曹海欧 陈鹏 《沈阳工业大学学报》 北大核心 2025年第6期704-710,共7页
【目的】在变电站继电保护装置定值校核过程中,传统方法主要依赖人工校核或简单程序校核。人工校核的准确性存在较大差异,且校核效率较低;简单程序校核在效率方面有所提升,但在准确性上仍有改进空间。针对上述不足,本研究提出一种基于... 【目的】在变电站继电保护装置定值校核过程中,传统方法主要依赖人工校核或简单程序校核。人工校核的准确性存在较大差异,且校核效率较低;简单程序校核在效率方面有所提升,但在准确性上仍有改进空间。针对上述不足,本研究提出一种基于深度学习的智能变电站继电保护装置定值校核方法。【方法】首先采用改进卷积循环神经网络(convolutional recurrent neural network,CRNN)对继电保护定值进行识别并利用卷积神经网络(CNN)将文本图像转换为特征序列,其次通过循环神经网络(recurrent neural network,RNN)对特征序列进行识别,最后使用基于词典的连接时序分类(connectionist temporal classification,CTC)损失函数实现转录,从而获得定值文本信息。在此基础上,引入转换门控单元对RNN模块进行改进,形成双向转换门控长短时记忆(bidirectional convert gate long short-term memory,Bi-CGLSTM)网络模型,以实现数据权值的自适应调节。随后,结合中文分词技术开展定值校核并构建完整的定值名称词典,采用Levenshtein距离算法计算待校核文本与标准文本的相似度,并结合改进的正向最大匹配算法完成定值文本匹配,从而实现对继电保护装置定值的逐一校核。【结果】为验证本文方法可行性和有效性,选取某供电公司240份包含10种常用设备型号的定值单作为实验样本进行验证。深度学习模型的训练参数设置为迭代次数100、学习率0.001,权重和偏置参数优化器为Adam。实验结果表明,改进CRNN模型的识别准确率高于97%,本文方法的校核准确率达97.07%,平均校核时间较短,整体性能显著优于对比方法。【结论】改进的深度神经网络能够有效提升大规模数据条件下继电保护装置定值文本的识别精度。基于Levenshtein距离算法与改进正向最大匹配算法的联合应用,不仅保证了校核准确率,还显著提升了校核效率。该方法为智能变电站的智慧运维提供了有力的技术支撑。 展开更多
关键词 智能变电站 继电保护装置 定值校核 卷积循环神经网络 词典 改进正向最大匹配算法 注意力机制
在线阅读 下载PDF
基于决策粗糙集的多源异构电网数据整合方法 被引量:8
2
作者 郭良 郑晓斌 +2 位作者 段春明 王卓 鲁兵 《兵工自动化》 北大核心 2025年第1期48-52,共5页
为解决多源异构电网数据整合耗时较长的问题,提出应用决策粗糙集的数据整合模型。通过纵向融合、横向融合2个环节,完成多源异构电网数据的融合处理,再应用并行化正向最大匹配去冗算法,删除融合数据中存在的重复冗余信息;依托决策粗糙集... 为解决多源异构电网数据整合耗时较长的问题,提出应用决策粗糙集的数据整合模型。通过纵向融合、横向融合2个环节,完成多源异构电网数据的融合处理,再应用并行化正向最大匹配去冗算法,删除融合数据中存在的重复冗余信息;依托决策粗糙集对电网数据进行属性约简,去除具有干扰作用的噪声条件属性,再从约简决策表内提取模糊分类规则,实现电网数据的分类整合管理;创建基于数据关联度的整合数据修复方案,完成数据整合模型的设计。实验结果表明:应用所提模型对43700条多源异构电网数据进行整合处理,所需的数据整合时间为5.9 s,符合实时性要求。 展开更多
关键词 决策粗糙集 异构数据 电网 数据整合 正向最大匹配原则 关联度
在线阅读 下载PDF
面向智能变电站保护的FMM测试及改进SVM校验诊断技术 被引量:3
3
作者 吕鹏飞 裘愉涛 +1 位作者 金盛 王志华 《中国电力》 北大核心 2025年第6期76-82,共7页
为解决智能变电站大量二次设备测试复杂、工期长以及缺乏测试结果诊断的难题,引入正向最大匹配(forward maximum matching,FMM)算法实现保护自动测试,并基于蛙跳算法(frog leaping algorithm,FLA)改进支持向量机(support vector machine... 为解决智能变电站大量二次设备测试复杂、工期长以及缺乏测试结果诊断的难题,引入正向最大匹配(forward maximum matching,FMM)算法实现保护自动测试,并基于蛙跳算法(frog leaping algorithm,FLA)改进支持向量机(support vector machines,SVM)模型完成测试结果的校验诊断。面向智能站保护配置信息关系,提出了保护自动测试与诊断系统架构。通过分析不同保护原理应用电压/电流定值关系建立保护测试需求,构建测试模板集合,利用哈希和编辑距离算法进行相似度比较,基于FMM算法实现了待测装置自动测试。算例分析与工程实例验证了所提技术的有效性。 展开更多
关键词 智能变电站 保护自动测试技术 正向最大匹配算法
在线阅读 下载PDF
一种改进的中文分词正向最大匹配算法 被引量:42
4
作者 王瑞雷 栾静 +1 位作者 潘晓花 卢修配 《计算机应用与软件》 CSCD 2011年第3期195-197,共3页
正向最大匹配分词FMM(Forward Maximum Matching)算法存在设定的最大词长初始值固定不变的问题,带来长词丢失或匹配次数较多的弊端。针对此问题提出了根据中文分词词典中的词条长度动态确定截取待处理文本长度的思想,改进了FMM算法。与... 正向最大匹配分词FMM(Forward Maximum Matching)算法存在设定的最大词长初始值固定不变的问题,带来长词丢失或匹配次数较多的弊端。针对此问题提出了根据中文分词词典中的词条长度动态确定截取待处理文本长度的思想,改进了FMM算法。与此相配合,设计了一种词典结构,使之能够有效地支持改进的算法。改进的算法与一般正向最大匹配算法相比大大减少了匹配次数,分析表明中文分词的速度和效率有了很大提高。 展开更多
关键词 中文分词 分词词典 正向最大匹配算法
在线阅读 下载PDF
基于Lucene的中文字典分词模块的设计与实现 被引量:27
5
作者 向晖 郭一平 王亮 《现代图书情报技术》 CSSCI 北大核心 2006年第8期46-50,共5页
在分析Lucene语言分析器结构的基础上,采用基于中文字典的正向最大匹配分词算法,设计实现能够在基于Lucene的搜索引擎中处理中文信息的中文分词模块。
关键词 搜索引擎 LUCENE 中文分词 正向最大匹配算法
在线阅读 下载PDF
一种改进的统计与后串最大匹配的中文分词算法研究 被引量:7
6
作者 吴涛 张毛迪 陈传波 《计算机工程与科学》 CSCD 2008年第8期79-82,共4页
在比较各种传统分词方法优缺点的基础上,本文提出了一种新的分词算法。它采用改进的双向Markov链统计方法对词库进行更新,再利用基于词典的有穷自动机后串最大匹配算法以及博弈树搜索算法进行分词。实验结果表明,该分词算法在分词准确... 在比较各种传统分词方法优缺点的基础上,本文提出了一种新的分词算法。它采用改进的双向Markov链统计方法对词库进行更新,再利用基于词典的有穷自动机后串最大匹配算法以及博弈树搜索算法进行分词。实验结果表明,该分词算法在分词准确性、效率以及生词辨识上取得了良好的效果。 展开更多
关键词 正向最大前串匹配 逆向最大前串匹配 统计法 有穷自动机
在线阅读 下载PDF
基于正向最大匹配算法的电力两票安全识别 被引量:10
7
作者 徐楠楠 王东风 韩璞 《计算机仿真》 CSCD 北大核心 2014年第1期145-148,355,共5页
为了让计算机具有处理甚至理解自然语言的能力,人们发明了很多自然语言语义分析理论。但是应用在电力系统工作票和操作票的领域中还很少。在中文分词的理论基础上利用正向最大匹配算法,针对电厂两票安全措施的语句进行自动识别,并分析... 为了让计算机具有处理甚至理解自然语言的能力,人们发明了很多自然语言语义分析理论。但是应用在电力系统工作票和操作票的领域中还很少。在中文分词的理论基础上利用正向最大匹配算法,针对电厂两票安全措施的语句进行自动识别,并分析了两票安全措施语句的语意。结果表明基于两票填写内容=动作词+设备名称词+状态词这种表示结构下,计算机能够很好的识别和理解电厂两票安全措施。这样计算机系统就能够对电力两票知识进一步的计算和推理,从而为深度人工智能开票提供了广泛的应用前景。 展开更多
关键词 自然语言理解 中文分词 正向最大匹配 电力两票系统
在线阅读 下载PDF
基于CRFs边缘概率的中文分词 被引量:19
8
作者 罗彦彦 黄德根 《中文信息学报》 CSCD 北大核心 2009年第5期3-8,共6页
将分词问题转化为序列标注问题,使用CRFs标注器进行序列标注是近年来广泛采用的分词方法。针对这一方法中CRFs的标记错误问题,该文提出基于CRFs边缘概率的分词方法。该方法从标注结果中发掘边缘概率高的候选词,重组边缘概率低的候选词,... 将分词问题转化为序列标注问题,使用CRFs标注器进行序列标注是近年来广泛采用的分词方法。针对这一方法中CRFs的标记错误问题,该文提出基于CRFs边缘概率的分词方法。该方法从标注结果中发掘边缘概率高的候选词,重组边缘概率低的候选词,提出FMM的奖励机制修正重组后的子串。在第四届SIGHAN Bakeoff中文简体语料SXU和NCC上进行闭式测试,分别在F-1值上达到了96.41%和94.30%的精度。 展开更多
关键词 计算机应用 中文信息处理 中文分词 条件随机场(CRFs) 边缘概率 最大向前匹配(FMM) 全局特征
在线阅读 下载PDF
基于改进Trie树结构的正向最大匹配算法 被引量:11
9
作者 熊志斌 朱剑锋 《计算机应用与软件》 CSCD 北大核心 2014年第5期276-278,共3页
提出一种改进的Trie树结构,树节点记录了字符串与构词的位置信息,子节点采用哈希查找机制,在此基础上优化了中文分词的正向最大匹配算法。分词过程中利用自动机机制判断是否构成最长词,解决了正向最大匹配算法需要根据词长调整字符串的... 提出一种改进的Trie树结构,树节点记录了字符串与构词的位置信息,子节点采用哈希查找机制,在此基础上优化了中文分词的正向最大匹配算法。分词过程中利用自动机机制判断是否构成最长词,解决了正向最大匹配算法需要根据词长调整字符串的问题。算法时间复杂度为1.33,对比试验结果表明有较快的分词速度。基于改进Trie树结构的正向最大匹配算法提高了中文分词速度,尤其适用于词典结构需要实时更新的场合。 展开更多
关键词 中文信息处理 分词 正向最大匹配算法
在线阅读 下载PDF
关于搜索引擎的中文分词与页面排序的研究 被引量:4
10
作者 王锡钢 王正 陈虎 《计算机应用与软件》 CSCD 北大核心 2013年第9期211-214,共4页
从搜索流程的分词和页面排序出发,由于中文分词比较复杂,鉴于正向最大分词算法和逆向最大分词算法的优缺点,提出基于正向最大和逆向最大匹配的双向匹配算法,该算法在一定程度提高了分词的准确性。页面排序也是影响用户搜索效率的一个重... 从搜索流程的分词和页面排序出发,由于中文分词比较复杂,鉴于正向最大分词算法和逆向最大分词算法的优缺点,提出基于正向最大和逆向最大匹配的双向匹配算法,该算法在一定程度提高了分词的准确性。页面排序也是影响用户搜索效率的一个重要因素,而网页相关度和网页的链接都是直接影响网页权值的重要因素,因而提出一种基于网页相关性的PageRank算法。新的页面排序算法既防治了页面漂移的可能性,也防治了全部依赖网页相关性的排序结果。 展开更多
关键词 正向最大匹配逆向最大匹配PageRank VSM
在线阅读 下载PDF
中文分词中的正向增字最大匹配算法研究 被引量:7
11
作者 戴上静 石春 吴刚 《微型机与应用》 2014年第17期15-18,共4页
针对正向最大匹配算法的长词丢失、匹配次数较多、歧义字段处理的准确率较低等问题,基于Trie树词典提出了3种正向增字最大匹配算法,分别使用逐词扫描、尾部折半扫描和尾部减一扫描这3种扫描方式采集歧义字段,并建立了一套歧义处理方法... 针对正向最大匹配算法的长词丢失、匹配次数较多、歧义字段处理的准确率较低等问题,基于Trie树词典提出了3种正向增字最大匹配算法,分别使用逐词扫描、尾部折半扫描和尾部减一扫描这3种扫描方式采集歧义字段,并建立了一套歧义处理方法。实验结果表明,该3种算法在分词速度和准确率上均有显著提高,错误率降低到了原算法的三分之一以下。当文本规模大于200 MB时,3种正向增字最大匹配算法的分词速度均比原最大匹配算法提高30%以上。 展开更多
关键词 中文分词 TRIE树 逐词扫描 正向增字匹配
在线阅读 下载PDF
基于双字哈希结构的最大匹配算法机制改进 被引量:6
12
作者 刘勇 魏光泽 《电子设计工程》 2017年第16期11-15,共5页
中文分词是计算机进行文本分析的关键技术。基于提高分词效率以满足日益增长的文本分析需求,通过分析常用的基于词典的机械分词算法与词典机制的优缺点,在对最大匹配算法进行改进的同时,采用双字哈希词典设计了适合此算法的双字哈希余... 中文分词是计算机进行文本分析的关键技术。基于提高分词效率以满足日益增长的文本分析需求,通过分析常用的基于词典的机械分词算法与词典机制的优缺点,在对最大匹配算法进行改进的同时,采用双字哈希词典设计了适合此算法的双字哈希余字分组的词典结构,提出了基于双字哈希结构的最大匹配改进算法。该算法在保证原最大匹配算法分词精度的前提下,大大提高了分词速度。经实验证明,改进后的算法性能明显提升。 展开更多
关键词 中文分词 最大正向匹配算法 词典 哈希结构 哈希函数
在线阅读 下载PDF
中文分词算法解析 被引量:15
13
作者 张磊 张代远 《电脑知识与技术》 2009年第1期192-193,共2页
中文分词是计算机中文信息处理中的难题,而中文分词算法是其中的核心,但由于中英文环境中语素的不同特点,使得中文必须要解决分词的问题。这篇文章较为深刻的阐述了中分分词的算法,基于对分词算法的理解和对匹配法分词的分析,对最... 中文分词是计算机中文信息处理中的难题,而中文分词算法是其中的核心,但由于中英文环境中语素的不同特点,使得中文必须要解决分词的问题。这篇文章较为深刻的阐述了中分分词的算法,基于对分词算法的理解和对匹配法分词的分析,对最大匹配分词方法进行了较深入的研究探讨,提出了什么算法是解决分词效率的最佳方法以及各种方法的比较优劣等问题,及可能产生的歧义.对不同的算法给予了充分的解释,通过对各种算法的比较,总结出了比较常用和效率较高的算法。 展开更多
关键词 中文分词 最大匹配算法 最大概率算法 算法 系统
在线阅读 下载PDF
基于字符串匹配的中文分词算法的研究 被引量:19
14
作者 常建秋 沈炜 《工业控制计算机》 2016年第2期115-116,119,共3页
伴随着信息技术的日新月异,互联网上的信息呈现出爆炸式的增长,为了满足人们快速而准确地获取信息,Lucene检索技术便应运而生。由于Lucene自带的分析器对中文分词效果不明显,切分出很多无用词,而且切分出的词失去原有意义。针对此问题,... 伴随着信息技术的日新月异,互联网上的信息呈现出爆炸式的增长,为了满足人们快速而准确地获取信息,Lucene检索技术便应运而生。由于Lucene自带的分析器对中文分词效果不明显,切分出很多无用词,而且切分出的词失去原有意义。针对此问题,在基于字符串的正向最大匹配分词方法的基础上,提出改进的方法,从而提高分词的准确性。最后,通过实验验证改进后的方法对分词的效果。 展开更多
关键词 LUCENE 中文分词 正向最大匹配算法
在线阅读 下载PDF
一种海图英语地名机器翻译方法 被引量:2
15
作者 乔晶 李鹤元 《海洋测绘》 CSCD 北大核心 2022年第5期73-77,82,共6页
针对目前海图英语地名机器翻译研究薄弱、传统人工翻译效率低等问题,提出了一种语料库和规则驱动相结合的海图英语地名机器翻译方法:首先分析海图英语地名组成特点及翻译难点,在此基础上设计英汉海图地名双语语料库及通名表,实现对现有... 针对目前海图英语地名机器翻译研究薄弱、传统人工翻译效率低等问题,提出了一种语料库和规则驱动相结合的海图英语地名机器翻译方法:首先分析海图英语地名组成特点及翻译难点,在此基础上设计英汉海图地名双语语料库及通名表,实现对现有海图地名资料的继承和地名通名的自动识别与翻译;而后结合英语地名译音表及译写细则开展音节切分,进而采用正向最大匹配算法完成待译字符串与英汉音译表的匹配,实现英语地名专名音译;最后组合输出地名通名及专名译写结果。经过对海图英语地名翻译实验,验证了该机器翻译方法的有效性,为大规模海图英语地名翻译奠定基础。 展开更多
关键词 海图英语地名 语料库 翻译规则库 音节切分 最大正向匹配算法
在线阅读 下载PDF
基于DRIS系统中的中文自动分词模块设计与实现 被引量:1
16
作者 张昭楠 马亚蕾 《电子设计工程》 2016年第14期158-160,共3页
随着信息检索技术越来越受到人们的重视,其中的中文自动分词技术就显得越来越重要。计算机通过对文本中的词语进行识别与处理,直接将结果传送给搜索引擎进行检索。文中在域内资源整合系统(DRIS)的基础上,设计并开发了一个全新的中文自... 随着信息检索技术越来越受到人们的重视,其中的中文自动分词技术就显得越来越重要。计算机通过对文本中的词语进行识别与处理,直接将结果传送给搜索引擎进行检索。文中在域内资源整合系统(DRIS)的基础上,设计并开发了一个全新的中文自动分词模块。通过算法的比对,选择了正向匹配算法作为该模块的基本算法,对其文件结构,中文词典初始化及识别处理过程做出详细介绍。经后期使用后可比较出该模块在检索效率与服务质量上都有了很大程度上的提高,达到了设计要求。 展开更多
关键词 DRIS系统 中文自动分词 搜索引擎 正向最大匹配法
在线阅读 下载PDF
基于规则和词共现的中文电子病历否定检出
17
作者 张远鹏 王理 董建成 《计算机应用与软件》 CSCD 2015年第3期50-52,共3页
对于中文电子病历文本中的否定术语的检出,目前有很多方法,基于规则的否定检出是比较常用的一种算法。但是该方法无法解决由于标点录入错误造成假阳性的问题。因此,在基于规则算法的基础上,提出一种基于词共现的否定检出算法,通过收集20... 对于中文电子病历文本中的否定术语的检出,目前有很多方法,基于规则的否定检出是比较常用的一种算法。但是该方法无法解决由于标点录入错误造成假阳性的问题。因此,在基于规则算法的基础上,提出一种基于词共现的否定检出算法,通过收集200份中文电子病历约150 865个汉字字符进行实验,新方法的阴性预测值比基于规则的算法提高了7.85%。所以,基于规则和词共现的否定检出算法能够很好地降低由于标点录入错误而出现假阳性术语的概率。 展开更多
关键词 词共现 正向最大匹配 互信息 否定检出
在线阅读 下载PDF
一种阿拉伯语地名的机器翻译方法 被引量:3
18
作者 任洪凯 王继周 +2 位作者 毛曦 马维军 殷红梅 《测绘科学》 CSCD 北大核心 2020年第8期157-163,共7页
针对目前我国阿拉伯语地名的机器翻译研究空白,该文通过分析阿拉伯语地名的词法结构以及语音特点,提出了一种关于阿拉伯语地名的机器翻译方法:首先基于点互信息计算公式训练大量地名语料提取常用词;接着通过有向无环图数据结构提取地名... 针对目前我国阿拉伯语地名的机器翻译研究空白,该文通过分析阿拉伯语地名的词法结构以及语音特点,提出了一种关于阿拉伯语地名的机器翻译方法:首先基于点互信息计算公式训练大量地名语料提取常用词;接着通过有向无环图数据结构提取地名模板;然后基于模板匹配解析待译地名词法结构,利用基于音节划分的音译模型音译词法结构中的专名;最后组合输出翻译结果。经过对阿语地名翻译实验,验证了本专用阿拉伯语地名机器翻译方法的有效性,对我国全球地理信息资源建设具有重要的现实意义。 展开更多
关键词 地名 机器翻译 点互信息 有向无环图 词法结构解析 音节划分 正向最大匹配算法
原文传递
基于分词匹配的主观题自动评阅技术研究 被引量:4
19
作者 冯光 乔丹丹 常静怡 《计算机与现代化》 2013年第3期212-214,219,共4页
目前,计算机自动阅卷系统中,针对简答题、论述题等主观题的自动评阅技术发展尚不成熟。为了解决主观题自动评阅系统中存在的准确度问题,本文采用基于最大正向匹配的中文分词提取技术和关键词匹配技术实现一种性能稳定且准确率较高的主... 目前,计算机自动阅卷系统中,针对简答题、论述题等主观题的自动评阅技术发展尚不成熟。为了解决主观题自动评阅系统中存在的准确度问题,本文采用基于最大正向匹配的中文分词提取技术和关键词匹配技术实现一种性能稳定且准确率较高的主观题自动评阅系统。实验测试表明,本文的主观试题自动评分方法基本可以满足系统设计的需求,是有效可行的方法。 展开更多
关键词 中文分词 最大正向匹配 主观题 关键字匹配
在线阅读 下载PDF
一种键树结构的中文分词方法
20
作者 熊志斌 《电脑编程技巧与维护》 2012年第20期97-99,共3页
正向最大匹配算法是中文自动分词一种常用算法。它为词典设计了键树结构,克服了设定初始词长的限制,并用Java实现了算法。
关键词 中文分词 正向最大匹配算法 键树
在线阅读 下载PDF
上一页 1 2 下一页 到第
使用帮助 返回顶部