期刊文献+
共找到33篇文章
< 1 2 >
每页显示 20 50 100
基于规则和Rocchio分类器的学前综合教育资源分类 被引量:1
1
作者 施聪莺 徐朝军 杨晓江 《现代图书情报技术》 CSSCI 北大核心 2009年第7期75-79,共5页
以学前综合教育资源分类为例,联合使用规则和Rocchio两种分类方法,利用建立的新闻规则库识别新闻资源并标注,然后采用Rocchio分类器对剩余资源进行分类。实验结果表明:基于规则和Rocchio分类器的综合分类策略能大大提高综合性资源的分... 以学前综合教育资源分类为例,联合使用规则和Rocchio两种分类方法,利用建立的新闻规则库识别新闻资源并标注,然后采用Rocchio分类器对剩余资源进行分类。实验结果表明:基于规则和Rocchio分类器的综合分类策略能大大提高综合性资源的分类效果。 展开更多
关键词 规则分类 rocchio分类器 综合资源分类
原文传递
ROCCHIO算法实现数据库模糊查询 被引量:1
2
作者 杨军 夏清国 《微电子学与计算机》 CSCD 北大核心 2006年第1期160-161,165,共3页
SQL语言对数据库的精确查询表现出较佳的性能,但模糊查询却不太令人满意。我们将ROCCHIO反馈算法引入数据库的查询,通过用户的少量反馈同时实现了精确查询和模糊查询。另外,每一次反馈除向用户显示最相关的记录之外,还提供相关度最不确... SQL语言对数据库的精确查询表现出较佳的性能,但模糊查询却不太令人满意。我们将ROCCHIO反馈算法引入数据库的查询,通过用户的少量反馈同时实现了精确查询和模糊查询。另外,每一次反馈除向用户显示最相关的记录之外,还提供相关度最不确定的记录以加快查询的速率,确保了系统查询的良好性能和用户的满意度。 展开更多
关键词 rocchio算法 模糊查询 相关度 用户反馈
在线阅读 下载PDF
基于改进Rocchio算法的短文本自动分类研究 被引量:3
3
作者 郑秋生 翟琳琳 《中原工学院学报》 CAS 2013年第1期70-73,共4页
为了利用已有的分类方法对短文本信息进行分类,选取大量长文本作为训练集,以此形成"词典",并利用改进的简单向量距离算法实现分类.理论和实验结果表明,该方法非常适用于短文本信息的分类.
关键词 短文本信息 rocchio算法 长文本训练集
在线阅读 下载PDF
基于Rocchio和KNN提出的新的文本分类技术 被引量:3
4
作者 邱定 张激 +2 位作者 王金华 王盼盼 游飞 《自动化与仪器仪表》 2017年第8期107-110,共4页
针对Rocchio算法分类效果不理想,限定于对可划分空间地分类,和KNN对K值的选取过于依赖这些缺陷,提出了一个通过为整个分类空间建立不止一个代表的方法,并且根据数据集的具体数据分布,为整个分类空间建立不同个数的分类代表。有效解决了R... 针对Rocchio算法分类效果不理想,限定于对可划分空间地分类,和KNN对K值的选取过于依赖这些缺陷,提出了一个通过为整个分类空间建立不止一个代表的方法,并且根据数据集的具体数据分布,为整个分类空间建立不同个数的分类代表。有效解决了Rocchio线性地划分实例空间的造成数据划分不合理的问题,由构造的代表和每个类泛化的实例创建的分类模型有效提高了分类效率,而且解决了分类准确度依赖人工给定K值的问题,提高了分类的准确度。通过在20-newsgroup和Reuters-21578两个数据集上的实验,实验结果显示新的算法远优于Rocchio和KNN分类算法,与选择的基准比较算法SVM相比效果略优。 展开更多
关键词 KNN rocchio SVM 文本分类 区域划分
原文传递
一种基于改进Rocchio的网络信息过滤反馈算法研究 被引量:1
5
作者 张立伟 刘培玉 朱振方 《山东科学》 CAS 2009年第1期31-34,共4页
随着互联网上信息的迅速增长,网络安全日益引起人们的关注。提供一定手段管理网络用户,尤其是青少年用户具有十分重要的意义。本文利用向量空间模型,Rocchio方法生成类别过滤模板,采用余弦算法比较待过滤文档和类别模板的相似度,并提出... 随着互联网上信息的迅速增长,网络安全日益引起人们的关注。提供一定手段管理网络用户,尤其是青少年用户具有十分重要的意义。本文利用向量空间模型,Rocchio方法生成类别过滤模板,采用余弦算法比较待过滤文档和类别模板的相似度,并提出一种利用反馈动态修改模板的反馈机制。实验表明本文提出的反馈方法是切实可行的。 展开更多
关键词 向量空间 rocchio分类算法 类别模板 反馈
在线阅读 下载PDF
基于改进Rocchio的网络信息过滤算法 被引量:1
6
作者 谭文娣 《信息与电脑》 2023年第10期79-81,共3页
由于网络上信息内容庞杂,传统基于内容的过滤方法难以建立准确的类别模板,导致信息过滤效果较差,提出基于改进Rocchio的网络信息过滤算法。文章首先利用数据包捕获技术与协议解析技术获取网络文本信息,其次基于改进Rocchio生成类别过滤... 由于网络上信息内容庞杂,传统基于内容的过滤方法难以建立准确的类别模板,导致信息过滤效果较差,提出基于改进Rocchio的网络信息过滤算法。文章首先利用数据包捕获技术与协议解析技术获取网络文本信息,其次基于改进Rocchio生成类别过滤模板,最后对比待过滤信息与类别模板的相似度,实现网络信息过滤。实验结果显示,设计的网络信息过滤算法的查全率为95.7%、查准率为96.8%,具有较好的过滤效果。 展开更多
关键词 改进rocchio 网络信息 信息过滤 过滤算法
在线阅读 下载PDF
一种基于聚类的PU主动文本分类方法 被引量:24
7
作者 刘露 彭涛 +1 位作者 左万利 戴耀康 《软件学报》 EI CSCD 北大核心 2013年第11期2571-2583,共13页
文本分类是信息检索的关键问题之一.提取更多的可信反例和构造准确高效的分类器是PU(positive and unlabeled)文本分类的两个重要问题.然而,在现有的可信反例提取方法中,很多方法提取的可信反例数量较少,构建的分类器质量有待提高.分别... 文本分类是信息检索的关键问题之一.提取更多的可信反例和构造准确高效的分类器是PU(positive and unlabeled)文本分类的两个重要问题.然而,在现有的可信反例提取方法中,很多方法提取的可信反例数量较少,构建的分类器质量有待提高.分别针对这两个重要步骤提供了一种基于聚类的半监督主动分类方法.与传统的反例提取方法不同,利用聚类技术和正例文档应与反例文档共享尽可能少的特征项这一特点,从未标识数据集中尽可能多地移除正例,从而可以获得更多的可信反例.结合SVM主动学习和改进的Rocchio构建分类器,并采用改进的TFIDF(term frequency inverse document frequency)进行特征提取,可以显著提高分类的准确度.分别在3个不同的数据集中测试了分类结果(RCV1,Reuters-21578,20 Newsgoups).实验结果表明,基于聚类寻找可信反例可以在保持较低错误率的情况下获取更多的可信反例,而且主动学习方法的引入也显著提升了分类精度. 展开更多
关键词 PU(FIositive and unlabeled)文本分类 聚类 TFIPNDF(term FREQUENCY inverse positive negative document frequency) 主动学习 可信反例 改进的rocchio
在线阅读 下载PDF
一种基于局部分析面向事件的查询扩展方法 被引量:10
8
作者 仲兆满 朱平 +2 位作者 李存华 管燕 刘宗田 《情报学报》 CSSCI 北大核心 2012年第2期151-159,共9页
针对用户获取事件类信息的需求,提出了一种基于局部分析面向事件LA-EO(localanalysis-eventoriented)的查询扩展方法,该方法将查询项区分为事件项和限定项两类分别处理。文章重点讨论了面向事件的查询项分析、事件项的扩展以及查询... 针对用户获取事件类信息的需求,提出了一种基于局部分析面向事件LA-EO(localanalysis-eventoriented)的查询扩展方法,该方法将查询项区分为事件项和限定项两类分别处理。文章重点讨论了面向事件的查询项分析、事件项的扩展以及查询项与文本相似度的计算等问题。围绕突发事件领域,使用搜索引擎和定点采集相结合的方法收集了4011篇文本,设置了10个查询项对本文提出的方法进行了实验比较。结果表明:LA—EO与Rocchio机制(记作LA—Rocchio)和局部上下文分析(记作LA—LCA)扩展方法相比,对事件类信息的检索,LA—EO具有更优的检索性能。 展开更多
关键词 信息检索 查询扩展 局部分析 面向事件 rocchio 局部上下文分析
在线阅读 下载PDF
最大散度差分类器及其在文本分类中的应用 被引量:8
9
作者 宋枫溪 刘树海 +1 位作者 杨静宇 夏赛飞 《计算机工程》 EI CAS CSCD 北大核心 2005年第5期8-10,50,共4页
提出的最大散度差分类器是在修正Fisher线性鉴别准则的基础上建立起来的,它与Rocchio和SVM分类器有着十分密切的联系。在国际标准语料库20Newsgroups上进行的仿真实验结果表明,最大散度差分类器具有良好的文本分类性能,其正确识别率明... 提出的最大散度差分类器是在修正Fisher线性鉴别准则的基础上建立起来的,它与Rocchio和SVM分类器有着十分密切的联系。在国际标准语料库20Newsgroups上进行的仿真实验结果表明,最大散度差分类器具有良好的文本分类性能,其正确识别率明显高于NaiveBayes和Rocchio,与SVM相当。 展开更多
关键词 最大散度差分类器 NAIVE Baycs分类器 rocchio分类器 SVM分类器 文本分类
在线阅读 下载PDF
基于聚类分析策略的用户偏好挖掘 被引量:8
10
作者 刘远超 王晓龙 +1 位作者 刘秉权 钟彬彬 《计算机应用研究》 CSCD 北大核心 2005年第12期21-23,共3页
利用训练文档集准确高效地挖掘隐藏的用户文本偏好和概念向量是文本信息过滤和多文档自动文摘等自然语言处理应用的关键技术之一。针对训练文本集中往往存在多个主题类别的问题,提出一种基于聚类分析策略的文本偏好挖掘方法。其基本思... 利用训练文档集准确高效地挖掘隐藏的用户文本偏好和概念向量是文本信息过滤和多文档自动文摘等自然语言处理应用的关键技术之一。针对训练文本集中往往存在多个主题类别的问题,提出一种基于聚类分析策略的文本偏好挖掘方法。其基本思路是对训练文档集进行聚类处理,然后对同主题文档进行共性分析,并经过特征权值调整和特征约简,获得表示用户不同主题偏好的概念向量。实验结果表明该方法具有对用户的文本偏好刻画更加精确,对相关阈值变化不敏感等优点,可以与Rocchio等算法结合来进行用户兴趣建模。 展开更多
关键词 偏好挖掘:文档聚类 概念向量 rocchio算法
在线阅读 下载PDF
一个基于反馈的信息过滤系统的设计与实现 被引量:9
11
作者 毛颖 王继成 +1 位作者 周源远 张福炎 《情报学报》 CSSCI 北大核心 2003年第5期539-544,共6页
随着互联网上信息的迅速增长,信息过滤技术得到越来越广泛的应用.本文论述了一个基于反馈的内容信息过滤系统的设计和实现.它采用向量空间模型,使用类重心分类算法来形成用户兴趣文件,采用余弦算法比较待过滤文档和用户兴趣文件的相似度... 随着互联网上信息的迅速增长,信息过滤技术得到越来越广泛的应用.本文论述了一个基于反馈的内容信息过滤系统的设计和实现.它采用向量空间模型,使用类重心分类算法来形成用户兴趣文件,采用余弦算法比较待过滤文档和用户兴趣文件的相似度,并使用Rocchio反馈模型来重建用户兴趣文件.实验表明,本文提出的策略和方法是切实可行的. 展开更多
关键词 信息过滤系统 网络信息管理 “用户兴趣文件” 类重心分类算法 余弦算法 rocchio 反馈模型 向量模型
在线阅读 下载PDF
结合相关类别信息的大规模文本层次分类研究 被引量:2
12
作者 何世柱 王明文 +1 位作者 周军军 石松 《山东大学学报(理学版)》 CAS CSCD 北大核心 2011年第5期58-62,共5页
深层分类模型是一种解决大规模文本层次分类问题的有效范式。本文基于该范式提出一种改进型模型,首先将一种新方法用于单独评价搜索阶段的效果;然后利用类别和文档信息共同选择候选类别;最后基于类中心训练Rocchio分类器,同时利用相关... 深层分类模型是一种解决大规模文本层次分类问题的有效范式。本文基于该范式提出一种改进型模型,首先将一种新方法用于单独评价搜索阶段的效果;然后利用类别和文档信息共同选择候选类别;最后基于类中心训练Rocchio分类器,同时利用相关类别的分类结果确定最终类别。在ODP数据集上的实验表明,相对于最新型的深层分类方法,该模型具有一定优势。 展开更多
关键词 深层分类 大规模层次 分层分类 rocchio
原文传递
基于词条权值的相关反馈算法在Web信息检索中的应用 被引量:4
13
作者 刘绍翰 武港山 张福炎 《情报学报》 CSSCI 北大核心 2002年第6期668-673,共6页
相关反馈技术是近年来信息检索技术研究的热点。本文首先介绍了传统信息检索技术的原理和存在的问题 ;接着概述了相关反馈技术的原理与过程 ;随后介绍词条及其权值算法并应用到相关反馈技术中去 ,提高信息检索的效果 ;
关键词 WEB信息检索 记号条 权值算法 相关反馈 rocchio 向量空间模型 搜索引擎
在线阅读 下载PDF
用户相关反馈下的空间关键字语义查询方法 被引量:2
14
作者 孟祥福 赵路路 +1 位作者 张霄雁 李盼 《小型微型计算机系统》 CSCD 北大核心 2019年第12期2650-2656,共7页
现有的空间关键字查询方法通常根据查询关键字在空间对象文本信息中的出现频率进行文本相关度评估,没有考虑用户对不同查询关键字的偏好程度,并且也没有考虑语义相关性.为解决上述问题,本文提出一种基于用户相关反馈的空间关键字个性化... 现有的空间关键字查询方法通常根据查询关键字在空间对象文本信息中的出现频率进行文本相关度评估,没有考虑用户对不同查询关键字的偏好程度,并且也没有考虑语义相关性.为解决上述问题,本文提出一种基于用户相关反馈的空间关键字个性化语义查询方法.该方法分为离线处理和在线处理两个阶段,在离线处理阶段,采用Gibbs算法估计空间对象文本信息的主题概率分布,进而利用LDA模型对空间数据集进行语义扩展.在线查询处理阶段,对于用户的初始查询条件,首先利用IR-tree混合索引结构从扩展后的空间数据库中获得候选查询结果;然后,用户根据个人偏好在候选集中明确标注出相关的查询结果(即相关反馈),根据用户的反馈信息,采用Rocchio算法对用户初始查询条件进行更新,使得新的查询条件更贴近用户实际需求和偏好;利用更新后的查询条件再进行检索,从而得到新的候选集,重复执行反馈过程,直到查询结果令用户满意为止.实验结果表明,本文提出的基于用户相关反馈的空间关键字语义查询方法可以有效捕获用户隐式偏好并体现语义相关性,在一定程度上提高了空间关键字查询结果的个性化程度和准确率. 展开更多
关键词 空间数据库 rocchio算法 IR-tree混合索引结构 用户反馈 top-k排序
在线阅读 下载PDF
一种混合特征阈值抽取的互联网旅游资源检索算法 被引量:2
15
作者 卢娜 高启明 《科技通报》 北大核心 2017年第8期162-165,共4页
针对传统的检索算法在互联网旅游资源检索中精确度不高的问题,本文提出了一种混合特征阈值抽取的互联网旅游资源检索算法。首先使用LLSF、kNN、Im-Rocchio算法计算个人特征矩阵,利用混合特征阈值抽取匹配策略提高检索的准确性,并在Rocc... 针对传统的检索算法在互联网旅游资源检索中精确度不高的问题,本文提出了一种混合特征阈值抽取的互联网旅游资源检索算法。首先使用LLSF、kNN、Im-Rocchio算法计算个人特征矩阵,利用混合特征阈值抽取匹配策略提高检索的准确性,并在Rocchio算法的基础上进行算法优化,实现混合特征阈值抽取的类别匹配,最后采用PageRank搜索排序算法对匹配的结果进行排序,输出检索结果。实例仿真结果表明,通过本文提出的改进策略,大大提高了旅游资源检索的精确度。 展开更多
关键词 Im-rocchio算法 混合特征 阈值抽取 互联网资源 旅游信息 检索算法
在线阅读 下载PDF
基于多代表点的文本分类研究 被引量:1
16
作者 陈可华 《郑州大学学报(工学版)》 CAS 北大核心 2010年第6期116-118,125,共4页
文本自动分类是一种有效的组织信息和管理信息的工具,传统分类方法一般在分类效果和运行效率上两者不可兼得,通过综合Rocchio和KNN2种分类方法的优点,设计出一种基于多代表点的文本分类方法,该方法通过对各类挖掘出多个有效的代表点(真... 文本自动分类是一种有效的组织信息和管理信息的工具,传统分类方法一般在分类效果和运行效率上两者不可兼得,通过综合Rocchio和KNN2种分类方法的优点,设计出一种基于多代表点的文本分类方法,该方法通过对各类挖掘出多个有效的代表点(真实或虚拟的),再使用基于这些代表点的Rocchio和KNN方法进行分类.实验表明,该方法以较少的训练时间达到令人满意的分类效果,并且能很好地解决不平衡类问题,实验结果显示,该方法能达到与SVM相当的分类效果. 展开更多
关键词 文本分类 多代表点 rocchio KNN
在线阅读 下载PDF
面向个性化需求的用户建模技术研究 被引量:4
17
作者 许琦 《科学技术与工程》 2010年第11期2655-2660,共6页
从用户需求多样性和随机性出发探讨了用户建模技术。对模型表示和模型更新两项关键技术进行了研究。基于向量空间模型表示用户模型,采用重心向量分类算法建立用户模型。分析用户浏览行为隐性地获取反馈信息,计算文档反馈度,提出了一种基... 从用户需求多样性和随机性出发探讨了用户建模技术。对模型表示和模型更新两项关键技术进行了研究。基于向量空间模型表示用户模型,采用重心向量分类算法建立用户模型。分析用户浏览行为隐性地获取反馈信息,计算文档反馈度,提出了一种基于Rocchio算法的周期性自适应学习机制更新用户模型。以用户满意度为评价指标,通过实验,验证了对用户需求变化的动态追踪能力。 展开更多
关键词 用户建模 个性化 向量空间模型 rocchio算法
在线阅读 下载PDF
基于向量空间模型的个性化信息过滤系统研究与开发 被引量:3
18
作者 许琦 《计算机与数字工程》 2014年第10期1940-1944,1990,共6页
论文提出了一种基于向量空间模型的用户个性化需求建模方法。对关键词权重算法作出改进,将网页分为四类逻辑段,通过计算关键词在各类逻辑段中的权重而加权得到综合权重。采用基于内容的构建原则和反馈原则,将用户模型构建分为训练阶段... 论文提出了一种基于向量空间模型的用户个性化需求建模方法。对关键词权重算法作出改进,将网页分为四类逻辑段,通过计算关键词在各类逻辑段中的权重而加权得到综合权重。采用基于内容的构建原则和反馈原则,将用户模型构建分为训练阶段和自适应学习阶段。在训练阶段由用户给出的样本文档与关键词采用类重心分类算法训练得到初始用户模型;在自适应学习阶段,提出了基于Rocchio算法的周期性自适应学习机制,根据用户对过滤结果的评价,调整用户模型,以提高对用户个性化需求的动态追踪能力。开发了个性化信息过滤原型系统。以中国服装网为实验数据源,对比百度搜索引擎,测试系统的信息过滤性能。实验结果表明,系统索引更新及时,响应速度快,返回的信息更精确,更合理,更加符合用户的实际需求。 展开更多
关键词 信息过滤 个性化需求 用户模型 向量空间模型 rocchio 算法
在线阅读 下载PDF
文本分类技术在网络基础教学资源中的应用 被引量:1
19
作者 陆红蕾 《漯河职业技术学院学报》 2012年第2期50-52,共3页
文本分类是实现网络资源快速分类的一项关键技术。通过对文本分类、网络教学资源、基础教学网络环境进行分析,针对网络教学资源的特点,提出了一个Rocchio算法的网页自动分类模型,并在基础教学网络环境下进行了仿真实验。实验结果表明,... 文本分类是实现网络资源快速分类的一项关键技术。通过对文本分类、网络教学资源、基础教学网络环境进行分析,针对网络教学资源的特点,提出了一个Rocchio算法的网页自动分类模型,并在基础教学网络环境下进行了仿真实验。实验结果表明,该模型能获得较好的分类效果,适合于基础教学资源的分类。 展开更多
关键词 文本分类 网络教学资源 rocchio算法
在线阅读 下载PDF
文本自动分类新探究 被引量:1
20
作者 陈可华 《赤峰学院学报(自然科学版)》 2011年第4期34-36,共3页
文本自动分类是一种有效的组织信息和管理信息的工具.传统分类方法一般在分类效果和运行效率两者上不可兼得.通过综合Rocchio和KNN两种分类方法的优点,设计了一种基于多代表点的文本分类方法,该方法通过对各类挖掘出多个有效的代表点(... 文本自动分类是一种有效的组织信息和管理信息的工具.传统分类方法一般在分类效果和运行效率两者上不可兼得.通过综合Rocchio和KNN两种分类方法的优点,设计了一种基于多代表点的文本分类方法,该方法通过对各类挖掘出多个有效的代表点(真实或虚拟的),再使用基于这些代表点的Rocchio和KNN方法进行分类.实验表明,该方法以较少的训练时间达到令人满意的分类效果,并且能很好解决不平衡类问题,实验结果显示该方法能达到与SVM相当的分类效果. 展开更多
关键词 文本分类 多代表点 rocchio KNN
在线阅读 下载PDF
上一页 1 2 下一页 到第
使用帮助 返回顶部