期刊文献+
共找到4篇文章
< 1 >
每页显示 20 50 100
基于BM25F模型的Web文本挖掘个性化推荐研究 被引量:5
1
作者 邵康 张建伟 《情报理论与实践》 CSSCI 北大核心 2013年第11期118-122,共5页
文章提出的基于Web文本挖掘的个性化推荐模型是从Web交易事务中挖掘出与当前用户会话相似度最高的会话集,该模型将BM25F运用到了文本挖掘中。BM25F模型最初用在搜索引擎中,在个性化推荐中用来计算文本文档的相似性是可行的,并且通过实... 文章提出的基于Web文本挖掘的个性化推荐模型是从Web交易事务中挖掘出与当前用户会话相似度最高的会话集,该模型将BM25F运用到了文本挖掘中。BM25F模型最初用在搜索引擎中,在个性化推荐中用来计算文本文档的相似性是可行的,并且通过实验分析,其推荐结果更加优于传统的TF*IDF模型,因为BM25F计算的权重精确度大幅提高,进而提高了推荐的精确度。此外该模型能有效地跟踪用户的当前偏好,对用户随时改变兴趣偏好能及时作出响应。 展开更多
关键词 个性化推荐 bm25f模型 文本挖掘 文本处理
原文传递
一种从医学文本中实现自动关键词抽取和筛选的技术方法 被引量:3
2
作者 殷蜀梅 张智雄 吴振新 《现代图书情报技术》 CSSCI 北大核心 2008年第8期31-36,共6页
鉴于重要关键词对于文本有着重要的强文本表示功能,关键词抽取和筛选在信息检索、信息抽取和知识挖掘等领域中有着重要的作用。在调研当前关键词抽取的方法后,结合医学领域已有的叙词表和工具以及BM25F加权词频公式提出基于医学文本的... 鉴于重要关键词对于文本有着重要的强文本表示功能,关键词抽取和筛选在信息检索、信息抽取和知识挖掘等领域中有着重要的作用。在调研当前关键词抽取的方法后,结合医学领域已有的叙词表和工具以及BM25F加权词频公式提出基于医学文本的重要关键词抽取和筛选的技术方法。该方法主要解决两个关键问题:关键词的识别和抽取、关键词重要性的衡量和筛选。以2001-2007年骨关节炎领域的文献集合为数据来源,对该技术方法进行实践尝试,并验证其实际有效性,为知识挖掘中的重要关键词抽取提供一个行之有效的途径。 展开更多
关键词 关键词抽取 关键词筛选 bm25f MMTx文本挖掘 医学数据挖掘
在线阅读 下载PDF
医学文献集合的主题抽取和主题聚类实践 被引量:4
3
作者 殷蜀梅 张智雄 《数字图书馆论坛》 2008年第9期32-36,共5页
文献中的重要关键词能够反映其核心主题,因此对文献主题的发现和抽取问题就转化为对文献中的重要关键词集合的抽取.文章在调研了国外在主题抽取和聚类方面采用的技术方法的基础上,提出了在医学学科领域从文本信息资源中抽取主题并进行... 文献中的重要关键词能够反映其核心主题,因此对文献主题的发现和抽取问题就转化为对文献中的重要关键词集合的抽取.文章在调研了国外在主题抽取和聚类方面采用的技术方法的基础上,提出了在医学学科领域从文本信息资源中抽取主题并进行主题领域判断的技术方案,并详细阐述了其中的主题聚类的技术环节.为了验证该技术方案的有效性,文章以骨关节炎领域为例,对文中提出的技术方案进行实践验证.验证的结果表明文章提出的技术方案有着实际的有效性.该文为2008年第9期本期话题'知识抽取'的文章之一. 展开更多
关键词 知识抽取 主题抽取 bm25f MMTx 文本挖掘 医学数据挖掘 数字图书馆
在线阅读 下载PDF
分布式全文检索技术的研究及应用 被引量:3
4
作者 葛云生 孔杰 《计算机工程与设计》 北大核心 2018年第9期2997-3001,共5页
为有效解决分布式对海量数据的资源管理、共享资源并发访问控制以及如何对海量数据进行快速且准确的检索,提出一种基于zookeeper的分布式服务协调模型为分布式提供资源的管理和并发访问的控制,在lucene搜索引擎的基础上,采用组件技术并... 为有效解决分布式对海量数据的资源管理、共享资源并发访问控制以及如何对海量数据进行快速且准确的检索,提出一种基于zookeeper的分布式服务协调模型为分布式提供资源的管理和并发访问的控制,在lucene搜索引擎的基础上,采用组件技术并在BM25F算法的基础上添加时间因子分别对文档进行解析,创建索引和检索结果排序算法进行优化的方案。系统应用结果表明,该方案有效解决了分布式的资源管理和控制问题,提高了检索的效率和准确度。 展开更多
关键词 zookeeper框架 分布式 lucene搜索引擎 文档解析 bm25f算法
在线阅读 下载PDF
上一页 1 下一页 到第
使用帮助 返回顶部