期刊导航
期刊开放获取
vip
退出
期刊文献
+
任意字段
题名或关键词
题名
关键词
文摘
作者
第一作者
机构
刊名
分类号
参考文献
作者简介
基金资助
栏目信息
任意字段
题名或关键词
题名
关键词
文摘
作者
第一作者
机构
刊名
分类号
参考文献
作者简介
基金资助
栏目信息
检索
高级检索
期刊导航
共找到
4
篇文章
<
1
>
每页显示
20
50
100
已选择
0
条
导出题录
引用分析
参考文献
引证文献
统计分析
检索结果
已选文献
显示方式:
文摘
详细
列表
相关度排序
被引量排序
时效性排序
基于BM25F模型的Web文本挖掘个性化推荐研究
被引量:
5
1
作者
邵康
张建伟
《情报理论与实践》
CSSCI
北大核心
2013年第11期118-122,共5页
文章提出的基于Web文本挖掘的个性化推荐模型是从Web交易事务中挖掘出与当前用户会话相似度最高的会话集,该模型将BM25F运用到了文本挖掘中。BM25F模型最初用在搜索引擎中,在个性化推荐中用来计算文本文档的相似性是可行的,并且通过实...
文章提出的基于Web文本挖掘的个性化推荐模型是从Web交易事务中挖掘出与当前用户会话相似度最高的会话集,该模型将BM25F运用到了文本挖掘中。BM25F模型最初用在搜索引擎中,在个性化推荐中用来计算文本文档的相似性是可行的,并且通过实验分析,其推荐结果更加优于传统的TF*IDF模型,因为BM25F计算的权重精确度大幅提高,进而提高了推荐的精确度。此外该模型能有效地跟踪用户的当前偏好,对用户随时改变兴趣偏好能及时作出响应。
展开更多
关键词
个性化推荐
bm25f
模型
文本挖掘
文本处理
原文传递
一种从医学文本中实现自动关键词抽取和筛选的技术方法
被引量:
3
2
作者
殷蜀梅
张智雄
吴振新
《现代图书情报技术》
CSSCI
北大核心
2008年第8期31-36,共6页
鉴于重要关键词对于文本有着重要的强文本表示功能,关键词抽取和筛选在信息检索、信息抽取和知识挖掘等领域中有着重要的作用。在调研当前关键词抽取的方法后,结合医学领域已有的叙词表和工具以及BM25F加权词频公式提出基于医学文本的...
鉴于重要关键词对于文本有着重要的强文本表示功能,关键词抽取和筛选在信息检索、信息抽取和知识挖掘等领域中有着重要的作用。在调研当前关键词抽取的方法后,结合医学领域已有的叙词表和工具以及BM25F加权词频公式提出基于医学文本的重要关键词抽取和筛选的技术方法。该方法主要解决两个关键问题:关键词的识别和抽取、关键词重要性的衡量和筛选。以2001-2007年骨关节炎领域的文献集合为数据来源,对该技术方法进行实践尝试,并验证其实际有效性,为知识挖掘中的重要关键词抽取提供一个行之有效的途径。
展开更多
关键词
关键词抽取
关键词筛选
bm25f
MMTx文本挖掘
医学数据挖掘
在线阅读
下载PDF
职称材料
医学文献集合的主题抽取和主题聚类实践
被引量:
4
3
作者
殷蜀梅
张智雄
《数字图书馆论坛》
2008年第9期32-36,共5页
文献中的重要关键词能够反映其核心主题,因此对文献主题的发现和抽取问题就转化为对文献中的重要关键词集合的抽取.文章在调研了国外在主题抽取和聚类方面采用的技术方法的基础上,提出了在医学学科领域从文本信息资源中抽取主题并进行...
文献中的重要关键词能够反映其核心主题,因此对文献主题的发现和抽取问题就转化为对文献中的重要关键词集合的抽取.文章在调研了国外在主题抽取和聚类方面采用的技术方法的基础上,提出了在医学学科领域从文本信息资源中抽取主题并进行主题领域判断的技术方案,并详细阐述了其中的主题聚类的技术环节.为了验证该技术方案的有效性,文章以骨关节炎领域为例,对文中提出的技术方案进行实践验证.验证的结果表明文章提出的技术方案有着实际的有效性.该文为2008年第9期本期话题'知识抽取'的文章之一.
展开更多
关键词
知识抽取
主题抽取
bm25f
MMTx
文本挖掘
医学数据挖掘
数字图书馆
在线阅读
下载PDF
职称材料
分布式全文检索技术的研究及应用
被引量:
3
4
作者
葛云生
孔杰
《计算机工程与设计》
北大核心
2018年第9期2997-3001,共5页
为有效解决分布式对海量数据的资源管理、共享资源并发访问控制以及如何对海量数据进行快速且准确的检索,提出一种基于zookeeper的分布式服务协调模型为分布式提供资源的管理和并发访问的控制,在lucene搜索引擎的基础上,采用组件技术并...
为有效解决分布式对海量数据的资源管理、共享资源并发访问控制以及如何对海量数据进行快速且准确的检索,提出一种基于zookeeper的分布式服务协调模型为分布式提供资源的管理和并发访问的控制,在lucene搜索引擎的基础上,采用组件技术并在BM25F算法的基础上添加时间因子分别对文档进行解析,创建索引和检索结果排序算法进行优化的方案。系统应用结果表明,该方案有效解决了分布式的资源管理和控制问题,提高了检索的效率和准确度。
展开更多
关键词
zookeeper框架
分布式
lucene搜索引擎
文档解析
bm25f
算法
在线阅读
下载PDF
职称材料
题名
基于BM25F模型的Web文本挖掘个性化推荐研究
被引量:
5
1
作者
邵康
张建伟
机构
安徽理工大学经济与管理学院
出处
《情报理论与实践》
CSSCI
北大核心
2013年第11期118-122,共5页
基金
淮南市科技计划项目"基于比较购物模型的电子商务系统研究"的成果
项目编号:2011A07919
文摘
文章提出的基于Web文本挖掘的个性化推荐模型是从Web交易事务中挖掘出与当前用户会话相似度最高的会话集,该模型将BM25F运用到了文本挖掘中。BM25F模型最初用在搜索引擎中,在个性化推荐中用来计算文本文档的相似性是可行的,并且通过实验分析,其推荐结果更加优于传统的TF*IDF模型,因为BM25F计算的权重精确度大幅提高,进而提高了推荐的精确度。此外该模型能有效地跟踪用户的当前偏好,对用户随时改变兴趣偏好能及时作出响应。
关键词
个性化推荐
bm25f
模型
文本挖掘
文本处理
Keywords
personalized recommendation
bm25f
model
text mining
text processing
分类号
TP391.1 [自动化与计算机技术—计算机应用技术]
原文传递
题名
一种从医学文本中实现自动关键词抽取和筛选的技术方法
被引量:
3
2
作者
殷蜀梅
张智雄
吴振新
机构
北京大学医学图书馆
中科院图书馆
出处
《现代图书情报技术》
CSSCI
北大核心
2008年第8期31-36,共6页
基金
国家社会科学基金项目"从数字信息资源中实现知识抽取的理论和方法研究"(项目编号:05BTQ006)的研究成果之一
文摘
鉴于重要关键词对于文本有着重要的强文本表示功能,关键词抽取和筛选在信息检索、信息抽取和知识挖掘等领域中有着重要的作用。在调研当前关键词抽取的方法后,结合医学领域已有的叙词表和工具以及BM25F加权词频公式提出基于医学文本的重要关键词抽取和筛选的技术方法。该方法主要解决两个关键问题:关键词的识别和抽取、关键词重要性的衡量和筛选。以2001-2007年骨关节炎领域的文献集合为数据来源,对该技术方法进行实践尝试,并验证其实际有效性,为知识挖掘中的重要关键词抽取提供一个行之有效的途径。
关键词
关键词抽取
关键词筛选
bm25f
MMTx文本挖掘
医学数据挖掘
Keywords
Keyword extraction Keyword filtration
bm25f
MMTx Text mining Medical data mining
分类号
TP391.1 [自动化与计算机技术—计算机应用技术]
在线阅读
下载PDF
职称材料
题名
医学文献集合的主题抽取和主题聚类实践
被引量:
4
3
作者
殷蜀梅
张智雄
机构
北京大学医学图书馆
中科院图书馆
出处
《数字图书馆论坛》
2008年第9期32-36,共5页
基金
本文受国家社会科学基金项目'从数字信息资源中买现知识抽取的理论和方法研究'(05BTQ006)和国家'十一五'科技支撑计划课置'网络科技信息监测与评价'(2006BAH03B05)的资金资助
文摘
文献中的重要关键词能够反映其核心主题,因此对文献主题的发现和抽取问题就转化为对文献中的重要关键词集合的抽取.文章在调研了国外在主题抽取和聚类方面采用的技术方法的基础上,提出了在医学学科领域从文本信息资源中抽取主题并进行主题领域判断的技术方案,并详细阐述了其中的主题聚类的技术环节.为了验证该技术方案的有效性,文章以骨关节炎领域为例,对文中提出的技术方案进行实践验证.验证的结果表明文章提出的技术方案有着实际的有效性.该文为2008年第9期本期话题'知识抽取'的文章之一.
关键词
知识抽取
主题抽取
bm25f
MMTx
文本挖掘
医学数据挖掘
数字图书馆
Keywords
Knowledge extraction
Topic extraction
bm25f
MMTx
Text mining
Medical data mining
Digital library
分类号
G2 [文化科学]
在线阅读
下载PDF
职称材料
题名
分布式全文检索技术的研究及应用
被引量:
3
4
作者
葛云生
孔杰
机构
桂林理工大学信息科学与工程学院
出处
《计算机工程与设计》
北大核心
2018年第9期2997-3001,共5页
基金
"嵌入式技术与智能信息处理"广西高校重点实验室基金项目
国家自然科学基金项目(61262076)
文摘
为有效解决分布式对海量数据的资源管理、共享资源并发访问控制以及如何对海量数据进行快速且准确的检索,提出一种基于zookeeper的分布式服务协调模型为分布式提供资源的管理和并发访问的控制,在lucene搜索引擎的基础上,采用组件技术并在BM25F算法的基础上添加时间因子分别对文档进行解析,创建索引和检索结果排序算法进行优化的方案。系统应用结果表明,该方案有效解决了分布式的资源管理和控制问题,提高了检索的效率和准确度。
关键词
zookeeper框架
分布式
lucene搜索引擎
文档解析
bm25f
算法
Keywords
zookeeper framework
distributed
lucene search engine
document analysis
bm25f
algorithm
分类号
TP311.52 [自动化与计算机技术—计算机软件与理论]
在线阅读
下载PDF
职称材料
题名
作者
出处
发文年
被引量
操作
1
基于BM25F模型的Web文本挖掘个性化推荐研究
邵康
张建伟
《情报理论与实践》
CSSCI
北大核心
2013
5
原文传递
2
一种从医学文本中实现自动关键词抽取和筛选的技术方法
殷蜀梅
张智雄
吴振新
《现代图书情报技术》
CSSCI
北大核心
2008
3
在线阅读
下载PDF
职称材料
3
医学文献集合的主题抽取和主题聚类实践
殷蜀梅
张智雄
《数字图书馆论坛》
2008
4
在线阅读
下载PDF
职称材料
4
分布式全文检索技术的研究及应用
葛云生
孔杰
《计算机工程与设计》
北大核心
2018
3
在线阅读
下载PDF
职称材料
已选择
0
条
导出题录
引用分析
参考文献
引证文献
统计分析
检索结果
已选文献
上一页
1
下一页
到第
页
确定
用户登录
登录
IP登录
使用帮助
返回顶部