期刊文献+
共找到73篇文章
< 1 2 4 >
每页显示 20 50 100
基于位置信息的序列模式挖掘算法 被引量:12
1
作者 张利军 李战怀 王淼 《计算机应用研究》 CSCD 北大核心 2009年第2期529-531,共3页
PrefixSpan算法在产生频繁序列模式时会产生大量的投影数据库,其中很多投影数据库是相同的。提出了基于位置信息的序列模式挖掘算法——PVS,该方法通过记录每个已产生投影数据库的位置信息,避免了重复产生相同的投影数据库,从而提高了... PrefixSpan算法在产生频繁序列模式时会产生大量的投影数据库,其中很多投影数据库是相同的。提出了基于位置信息的序列模式挖掘算法——PVS,该方法通过记录每个已产生投影数据库的位置信息,避免了重复产生相同的投影数据库,从而提高了算法的运行效率。通过实验证明,该算法在处理相似度很高的序列数据时比PrefixSpan算法有效。 展开更多
关键词 前缀 序列模式 投影数据库 位置信息
在线阅读 下载PDF
基于后缀数组检测函数克隆 被引量:3
2
作者 侯敏 张丽萍 +1 位作者 史庆庆 刘东升 《计算机应用研究》 CSCD 北大核心 2014年第4期1082-1085,共4页
为了提高检测效率,提出了一种新的函数克隆检测方法。该方法对传统后缀数组进行了改进,优化了基于后缀数组的算法。利用该算法可高效查找重复函数子串,进而检测出Type-1和Type-2类型的函数克隆。同时开发出相应的函数克隆检测工具FCD以... 为了提高检测效率,提出了一种新的函数克隆检测方法。该方法对传统后缀数组进行了改进,优化了基于后缀数组的算法。利用该算法可高效查找重复函数子串,进而检测出Type-1和Type-2类型的函数克隆。同时开发出相应的函数克隆检测工具FCD以实现该方法,并检测了24款C语言的开源软件。实验结果的分析验证了FCD能高效检测软件中的函数克隆。 展开更多
关键词 函数克隆 克隆检测 token串 后缀数组 公共函数前缀
在线阅读 下载PDF
一种迭代式的概念属性名称自动获取方法 被引量:4
3
作者 汪平仄 曹存根 王石 《中文信息学报》 CSCD 北大核心 2014年第4期58-67,共10页
属性是一种用于描述概念和鉴别概念的特殊知识。属性名称是表示属性的专有名词。该文提出了一种基于前后缀迭代的方法,从Web网页中获取概念的属性名称。该方法的每一次迭代分为两个阶段:(1)从现有种子属性集中选择合适的前后缀,构造词汇... 属性是一种用于描述概念和鉴别概念的特殊知识。属性名称是表示属性的专有名词。该文提出了一种基于前后缀迭代的方法,从Web网页中获取概念的属性名称。该方法的每一次迭代分为两个阶段:(1)从现有种子属性集中选择合适的前后缀,构造词汇-句法模式,从Web网页中提取候选属性;(2)采用基于相似性的验证模型对候选属性进行验证,以扩充现有属性集合。该文提出了一组验证模型对候选属性进行验证,比较各个模型的优缺点,并在地域类和商业主体类概念上分别得到了平均92.9%和90.7%的准确率,以及对原有种子属性集合近100倍的扩充率。 展开更多
关键词 概念 属性 属性前缀 属性后缀 属性元 知识获取
在线阅读 下载PDF
一种适合于GPU计算的并行后缀数组构造算法 被引量:3
4
作者 孙伟东 马宗民 《小型微型计算机系统》 CSCD 北大核心 2011年第5期830-836,共7页
后缀数组广泛应用于序列分析、字符串匹配和文本压缩,近年来,有关后缀数组构造和应用算法的不断探索构成了计算机科学中一个非常活跃的研究领域.在对现有串行算法进行了分析和对比之后,提出了一种新的、简洁的适合于GPU计算的并行后缀... 后缀数组广泛应用于序列分析、字符串匹配和文本压缩,近年来,有关后缀数组构造和应用算法的不断探索构成了计算机科学中一个非常活跃的研究领域.在对现有串行算法进行了分析和对比之后,提出了一种新的、简洁的适合于GPU计算的并行后缀数组倍增构造算法,以排序方法替代传统的分组策略,不但能独立完成后缀数组的并行构造,还可与现存的串行倍增算法结合使用,以达到最高的执行效率.实验结果表明该算法在解决实际应用问题时,具有易于实现、执行速度快和可扩展性强等优点,尤其在处理小字符集的数据时效率更高. 展开更多
关键词 后缀数组构造 倍增法 GPGPU CUDA
在线阅读 下载PDF
基于局部变化性的改进编辑距离算法 被引量:3
5
作者 王卫红 李君 《计算机工程》 CAS CSCD 北大核心 2015年第7期294-298,304,共6页
针对经典编辑距离算法在求解字符串相似度时计算效率过低的问题,提出一种改进的编辑距离算法。先求得2个字符串的最长公共前缀和最长公共后缀,再根据经典编辑距离算法得到2个字符串剩余部分之间的编辑距离,由反证法证明该编辑距离即为2... 针对经典编辑距离算法在求解字符串相似度时计算效率过低的问题,提出一种改进的编辑距离算法。先求得2个字符串的最长公共前缀和最长公共后缀,再根据经典编辑距离算法得到2个字符串剩余部分之间的编辑距离,由反证法证明该编辑距离即为2个原始字符串的编辑距离。在此基础上,分析改进算法的优势并将其应用于网页篡改检测中。实验结果表明,与经典算法相比,改进算法在求解同一网址的网页相似度时具有更高的计算效率。 展开更多
关键词 编辑距离 相似度 公共前缀 公共后缀 局部变化性 篡改检测
在线阅读 下载PDF
利用扩展标记集的词结构分析 被引量:2
6
作者 孙静 方艳 +1 位作者 丁彬 周国栋 《中文信息学报》 CSCD 北大核心 2014年第5期39-45,82,共8页
该文给出了一种与传统分词不同的词法分析选择,提出了一种利用扩展标记集来实现词内部结构分析的方法。首先阐述了词的内部结构特点,把结构中的前后缀视为特殊的词,进而通过识别出每一个词的前后缀来识别词的内部结构。方法是把词内部... 该文给出了一种与传统分词不同的词法分析选择,提出了一种利用扩展标记集来实现词内部结构分析的方法。首先阐述了词的内部结构特点,把结构中的前后缀视为特殊的词,进而通过识别出每一个词的前后缀来识别词的内部结构。方法是把词内部结构识别问题转换成序列标注问题,通过扩展标记集,采用CRF模型来实现词的内部结构分析。最终实验表明,无论是在总体性能上,还是在各层结构的识别上都取得了较高的准确度。 展开更多
关键词 扩展标记集 词结构分析 前后缀 序列标注问题
在线阅读 下载PDF
三字词中的类词缀 被引量:24
7
作者 曾立英 《语言文字应用》 CSSCI 北大核心 2008年第2期32-40,共9页
本文基于《现代汉语语法信息词典》8万词词库中的三字词,着力讨论三字词中的类词缀。首先通过类词缀在三字词与二字词中的功能对比来说明类词缀在构成三字词时规则性比较强,其次从词库中统计出现代汉语的类前缀和类后缀,最后探讨了类词... 本文基于《现代汉语语法信息词典》8万词词库中的三字词,着力讨论三字词中的类词缀。首先通过类词缀在三字词与二字词中的功能对比来说明类词缀在构成三字词时规则性比较强,其次从词库中统计出现代汉语的类前缀和类后缀,最后探讨了类词缀的领域特征以及类词缀在未登录词中的识别问题。 展开更多
关键词 三字词 类前缀 类后缀 领域特征
原文传递
神经网络复合推理技术的研究 被引量:1
8
作者 覃征 汪应洛 康继昌 《西安交通大学学报》 EI CAS CSCD 北大核心 1997年第8期8-13,19,共7页
提出了神经网络复合推理的思想,阐述了神经网络数值推理与传统符号逻辑推理的差异,提出了神经网络前置处理器和神经网络后置处理器的设计方法,建立了复合推理的系统结构,结合大型工程课题进行了验证.实践检验证明,该方法对解决非... 提出了神经网络复合推理的思想,阐述了神经网络数值推理与传统符号逻辑推理的差异,提出了神经网络前置处理器和神经网络后置处理器的设计方法,建立了复合推理的系统结构,结合大型工程课题进行了验证.实践检验证明,该方法对解决非结构化、半结构化。 展开更多
关键词 神经网络 复合推理 IDSS 决策支持系统
在线阅读 下载PDF
基于树型结构和加权熵的中文高频词提取算法 被引量:1
9
作者 王龙 刘衍珩 +1 位作者 李晓光 官健 《吉林大学学报(工学版)》 EI CAS CSCD 北大核心 2011年第1期188-192,共5页
提出了一种基于树型结构和加权熵的中文高频词提取算法。简单介绍了中文的树型结构和加权信息熵,详细叙述了算法的原理和设计步骤,并给出了具体的算法描述。实验结果表明,该算法是可行和有效的。
关键词 计算机应用 中文高频词 提取算法 加权熵 前缀树 后缀树
在线阅读 下载PDF
词缀·大纲·教材·教法 被引量:5
10
作者 辜向东 《重庆大学学报(社会科学版)》 2001年第3期79-80,共2页
本文阐述了词缀的重要性 ,分析了《大学英语教学大纲》(修订本 )和《大学英语》精读 (修订本 ) 1 4册中对常用前缀、后缀的处理所存在的不足之处 ,提出了在教学中如何创造性地使用大纲、教材的意见和建议。
关键词 前缀 后缀 教学大纲 教材 创造性 大学英语 英语教学 词缀
在线阅读 下载PDF
浅谈英语构词法 被引量:16
11
作者 卢春媚 《广州大学学报(社会科学版)》 2002年第3期29-32,共4页
词汇是英语学习者的主要障碍之一。英语构词法可以帮助我们正确辨认单词的词形、词性和理解词意 ,并迅速扩大词汇量 ,是学习英语的有效途径。而在所有构词法中 ,缀合法是构词能力最强的一种 ,它所构成的单词数量最大 ,是英语扩充词汇的... 词汇是英语学习者的主要障碍之一。英语构词法可以帮助我们正确辨认单词的词形、词性和理解词意 ,并迅速扩大词汇量 ,是学习英语的有效途径。而在所有构词法中 ,缀合法是构词能力最强的一种 ,它所构成的单词数量最大 ,是英语扩充词汇的最主要方法 ,被誉为“学习英语的最短最佳的途径”。 展开更多
关键词 英语构词法 缀合构词法 前缀 词根 后缀
在线阅读 下载PDF
基于后缀WM匹配算法的改进算法 被引量:5
12
作者 蒋晓鸽 武小年 张昭 《计算机与数字工程》 2013年第4期608-610,共3页
针对基于后缀WM匹配算法中的字符重复匹配问题,给出了相应的改进算法。该算法针对扫描阶段确定的与模式串前缀、后缀和前m个字符的后缀都相同的文本串字符块,在匹配阶段跳过文本串字符块中已经确定的字符块,避免了对已经确定的字符块的... 针对基于后缀WM匹配算法中的字符重复匹配问题,给出了相应的改进算法。该算法针对扫描阶段确定的与模式串前缀、后缀和前m个字符的后缀都相同的文本串字符块,在匹配阶段跳过文本串字符块中已经确定的字符块,避免了对已经确定的字符块的重复匹配,减少匹配开销。实验结果表明,相对于原始算法,改进算法降低了系统匹配的运行时间,提高了系统运行的效率。 展开更多
关键词 多模式匹配 WM算法 前缀 后缀
在线阅读 下载PDF
基于邻接字符对的三元后缀树全文索引模型 被引量:1
13
作者 姚全珠 赵凯 郭梁涛 《计算机工程》 CAS CSCD 2012年第18期42-44,49,共4页
传统后缀树全文索引模型的索引建立复杂、难以维护,且空间消耗大。为此,提出一种改进的后缀树全文索引模型。将一棵完整后缀树划分为若干个三元后缀树,从而简化后缀树的组织结构,便于其建立和维护索引。将邻接字符对的公共前缀作为后缀... 传统后缀树全文索引模型的索引建立复杂、难以维护,且空间消耗大。为此,提出一种改进的后缀树全文索引模型。将一棵完整后缀树划分为若干个三元后缀树,从而简化后缀树的组织结构,便于其建立和维护索引。将邻接字符对的公共前缀作为后缀树的根结点,以降低模型的空间消耗,提高查询效率。实验结果表明,与传统模型相比,该模型具有较高的时空效率。 展开更多
关键词 后缀树 全文索引 邻接字符对 三元后缀树 公共前缀 时空效率
在线阅读 下载PDF
《现代汉语词典》(第6版)词缀考察 被引量:5
14
作者 张美霞 《汉语学习》 CSSCI 北大核心 2013年第3期45-53,共9页
《现代汉语词典》(第6版)共收录词缀29个。本文从词缀的词条分立、读音标注、词性标注、搭配功能、意义阐释五个方面,考察了《现代汉语词典》词缀的收录情况,指出了需要进一步完善之处,并以此为基础探讨了汉语词缀在语音、语法、语义、... 《现代汉语词典》(第6版)共收录词缀29个。本文从词缀的词条分立、读音标注、词性标注、搭配功能、意义阐释五个方面,考察了《现代汉语词典》词缀的收录情况,指出了需要进一步完善之处,并以此为基础探讨了汉语词缀在语音、语法、语义、语用以及能产性方面的特色,最后提出在《现代汉语词典》附录中建立汉语词缀一览表的建议。 展开更多
关键词 《现代汉语词典》 释义 词缀 前缀 后缀
原文传递
基于后缀结构进行数据块优化的重复数据删除系统 被引量:1
15
作者 黄晨晖 林泳琴 《计算机系统应用》 2010年第11期75-78,70,共5页
为进一步提高重复数据删除系统的性能,提出基于数据分块的后缀数组SA和最长公共前缀LCP进行数据块优化的重复数据删除系统。系统首先将输入的数据流进行第一次分块,识别出相同的分块并给分块编号,创建分块编号序列的SA和LCP表,识别出最... 为进一步提高重复数据删除系统的性能,提出基于数据分块的后缀数组SA和最长公共前缀LCP进行数据块优化的重复数据删除系统。系统首先将输入的数据流进行第一次分块,识别出相同的分块并给分块编号,创建分块编号序列的SA和LCP表,识别出最大重复队列和非重复数据块,进一步得出优化的超级块大小,然后以超级块为单元进行第二次数据分块并保存数据压缩结果。实验表明,相比于固定分块,该系统能实现给定输入流较好的压缩性和数据重构性。 展开更多
关键词 重复数据删除 后缀数组 最长公共前缀 块优化
在线阅读 下载PDF
用构词法扩大学生词汇量的实践 被引量:1
16
作者 张海琳 《南阳师范学院学报》 CAS 2008年第4期91-92,共2页
对于刚入校的学生来讲,记忆单词是件费时、费力又收效甚微的事情。笔者在此介绍一种利用词根扩大词汇量的方法,以供同学们参考。
关键词 词根 前缀 后缀
在线阅读 下载PDF
日语接尾辞的分类与意义分析 被引量:1
17
作者 聂中华 《湖南大学学报(社会科学版)》 2002年第1期58-60,共3页
接尾辞是构成日语词汇的要素之一 ,以前接词的性质为标准 ,接尾辞可以分为前接动词型、前接名词型、前接形容词型和特殊型。接尾辞不仅可以改变派生词的词性 。
关键词 日语 接尾辞 前接词
在线阅读 下载PDF
词缀“云”考议 被引量:1
18
作者 刘传鸿 《语言研究》 CSSCI 北大核心 2013年第1期41-48,共8页
有学者指出"云"可作副词、连词后缀,并举有诸多用例,我们研究发现,这些"云"实与其后的动词、形容词组合,是后人对《诗经》同类结构的模仿及推广,根据其无实义,且组合能力强等特点,"云"当定性为动词、形... 有学者指出"云"可作副词、连词后缀,并举有诸多用例,我们研究发现,这些"云"实与其后的动词、形容词组合,是后人对《诗经》同类结构的模仿及推广,根据其无实义,且组合能力强等特点,"云"当定性为动词、形容词前缀。 展开更多
关键词 副词连词后缀 动词 形容词前缀
原文传递
基于批处理补丁的流媒体后缀动态缓存算法
19
作者 蔡青松 李子木 +1 位作者 覃少华 胡建平 《计算机科学》 CSCD 北大核心 2004年第11期31-37,共7页
在IP网络上高效传输流式存储型A/V数据是实现诸如VoD等应用的基础。当前一些典型的传输方案考虑了服务器调度策略以降低骨干网带宽消耗和服务器负载,但并未考虑媒体后缀的缓存策略。本文在带前缀的OBP算法基础上提出了流媒体对象后缀的... 在IP网络上高效传输流式存储型A/V数据是实现诸如VoD等应用的基础。当前一些典型的传输方案考虑了服务器调度策略以降低骨干网带宽消耗和服务器负载,但并未考虑媒体后缀的缓存策略。本文在带前缀的OBP算法基础上提出了流媒体对象后缀的增量式缓存及快速释放算法ICBR,并推导出了采用IC算法所需的骨干网带宽的理论结果。通过针对上述两种算法的仿真实验,本文的结果表明:即使在有限的缓存容量的前提下,采用IC算法和ICBR算法对媒体对象的后缀进行动态缓存可以显著降低骨干网链路上传输的补丁数据量,其骨干网带宽消耗显著优于OBP,从而在保证客户端较小的播放启动延迟的情况下有效降低了流媒体传输中骨干网带宽的消耗和服务器的负载。 展开更多
关键词 缓存 补丁 算法 流媒体 批处理 骨干网 服务器 带宽 IC 传输流
在线阅读 下载PDF
怎样记俄文单词 被引量:1
20
作者 臧海滨 《齐齐哈尔大学学报(哲学社会科学版)》 2008年第6期126-128,共3页
本文主要通过对构词法中前缀、后缀和复合关系的分析来记单词;结合课文、句子记单词;按反义、同义和同音关系记单词;围绕一个中心记单词等四种途径,对记单词进行了归结,供大家参考。
关键词 构词法 前缀 后缀 复合关系 反义、同义和同音关系
在线阅读 下载PDF
上一页 1 2 4 下一页 到第
使用帮助 返回顶部