期刊文献+
共找到8篇文章
< 1 >
每页显示 20 50 100
面向临床研究的中文概念标准化方法研究
1
作者 吴宁 李子轩 +2 位作者 蔡文红 王怀玉 袁驰 《医学信息学杂志》 2025年第9期60-67,共8页
目的/意义探索医学术语标准化方法,提高医疗服务质量和效率。方法/过程提出基于观测指标标识符逻辑命名与编码系统的中文医学术语标准化方法,包括基于中文大语言模型的关键要素提取与基于BM25算法的术语映射两个步骤。结果/结论该方法... 目的/意义探索医学术语标准化方法,提高医疗服务质量和效率。方法/过程提出基于观测指标标识符逻辑命名与编码系统的中文医学术语标准化方法,包括基于中文大语言模型的关键要素提取与基于BM25算法的术语映射两个步骤。结果/结论该方法在国家卫生行业标准已标注数据集上映射匹配率达到73.04%,验证了其在医学术语标准化中的可行性,可为提升医疗数据互认与服务效率提供支持。 展开更多
关键词 临床医学 术语标准化 关键要素提取 bm25算法
暂未订购
一种基于领域的历史网页检索算法
2
作者 张燕 黄连恩 林武 《计算机应用研究》 CSCD 北大核心 2010年第1期56-59,63,共5页
在历史网页检索系统中,存在着按时间顺序来对检索结果进行排序的特殊需求,在客观上要求系统能够比较准确地判断文档与查询词是否相关。针对这一特殊需求,引入领域的概念,将领域用于用户检索的表示,在领域的基础上设计了一种带衰减因子的... 在历史网页检索系统中,存在着按时间顺序来对检索结果进行排序的特殊需求,在客观上要求系统能够比较准确地判断文档与查询词是否相关。针对这一特殊需求,引入领域的概念,将领域用于用户检索的表示,在领域的基础上设计了一种带衰减因子的BM25检索相关性计算算法。实验结果显示该检索算法是有效的,引入领域后检索结果的F值平均提高了56.68%。 展开更多
关键词 历史网页 领域 检索算法 bm25 衰减因子
在线阅读 下载PDF
基于内容相似度的相关性评分算法对比分析研究 被引量:3
3
作者 鲍治国 王海安 +1 位作者 胡士伟 马西锋 《电子测试》 2022年第19期52-55,共4页
目前实现智能化推荐功能,通常有两种方式,一种是基于用户的协同过滤推荐系统,另一种是基于内容相似度的推荐系统。采用协同过滤的推荐系统时,通常需要较为庞大的用户群体,本文主要选择基于内容相似度的推荐系统进行论述。在使用该系统时... 目前实现智能化推荐功能,通常有两种方式,一种是基于用户的协同过滤推荐系统,另一种是基于内容相似度的推荐系统。采用协同过滤的推荐系统时,通常需要较为庞大的用户群体,本文主要选择基于内容相似度的推荐系统进行论述。在使用该系统时,往往需要对文档与对应的标题或语素进行相关性评分,通过评分对每位用户提供个性化的推荐,进而达到为每位用户提供更好地体验。这就会用到TF-IDF算法和BM25算法对文档进行相关性评分,本文对这两种方法的算法原理、优缺点以及改进方案展开论述,着重强调TF-IDF与BM25算法之间的区别与联系。 展开更多
关键词 文本相似度 bm25算法 TF-IDF算法 语义化分析
在线阅读 下载PDF
一种广告投放定位算法的研究
4
作者 蔡志荣 《科技通报》 北大核心 2017年第7期94-98,共5页
网络广告作为新兴的广告产业正在进行快速发展的发展,内容定向广告是近几年研究的主要方向,首先分析了网页广告的特征,针对内容定向的投放算法进行了研究,通过基于VSM的TF-IDF方法发现了网页广告文本之间的不足,引入正则表达式进行网页... 网络广告作为新兴的广告产业正在进行快速发展的发展,内容定向广告是近几年研究的主要方向,首先分析了网页广告的特征,针对内容定向的投放算法进行了研究,通过基于VSM的TF-IDF方法发现了网页广告文本之间的不足,引入正则表达式进行网页广告和文本的匹配,通过采用树形结构进行索引和过滤提高网页和文本的匹配率,最后通过改进的BM25算法提高了网页广告文本中的检索率。通过一定数量的网页内容和广告文本实验,表明本文的算法具有很好的有效性,提高了网页内容和广告文本的匹配率。 展开更多
关键词 网页广告 投放 正则表达式 bm25算法
在线阅读 下载PDF
基于主题相似度改进的PageRank算法研究 被引量:1
5
作者 刘齐 黄树成 《计算机与数字工程》 2022年第1期45-48,60,共5页
用户通过检索平台能获得大量信息,但搜索结果往往会出现主题漂移、偏重旧网页的现象,不能满足用户实际需求。为改善这种现象,提出了一种改进的PageRank算法。该算法采用BM25相似度算法对主题相似度进行计算,根据相似度评分来赋予不同的... 用户通过检索平台能获得大量信息,但搜索结果往往会出现主题漂移、偏重旧网页的现象,不能满足用户实际需求。为改善这种现象,提出了一种改进的PageRank算法。该算法采用BM25相似度算法对主题相似度进行计算,根据相似度评分来赋予不同的影响权重,可以提相似度高的网页的排名;利用网页在搜索引擎周期内被搜索到的次数来表示网页存在的时间长短,补偿新网页的权重。将它们引入PageRank算法中,使得页面PR值计算更加合理。实验表明,改进后的PageRank算法在搜索应用中能有效减少主题漂移现象,搜索结果也更全面、更准确。 展开更多
关键词 PAGERANK算法 主题漂移 bm25算法 时间反馈因子
在线阅读 下载PDF
基于BM25模型与借阅预测模型的书目检索排序算法研究 被引量:6
6
作者 姚舜 《图书馆杂志》 CSSCI 北大核心 2016年第10期63-68,共6页
针对传统书目检索系统的相关度排序存在的读者体验差的问题,提出基于BM25模型与借阅预测模型的排序算法。该算法综合了BM25模型的相关度算法和借阅预测模型的推荐度算法,使排序结果受到相关度、入藏时间、借阅情况、在馆情况和馆藏地点... 针对传统书目检索系统的相关度排序存在的读者体验差的问题,提出基于BM25模型与借阅预测模型的排序算法。该算法综合了BM25模型的相关度算法和借阅预测模型的推荐度算法,使排序结果受到相关度、入藏时间、借阅情况、在馆情况和馆藏地点权重等因素的影响。测试结果表明,综合排序算法使结果排序更加科学和合理,能够提高读者满意度和图书的借阅率。 展开更多
关键词 bm25 借阅预测 书目检索 排序算法 Xunsearch
原文传递
基于BM25算法的问题报告质量检测方法 被引量:10
7
作者 陈乐乐 黄松 +2 位作者 孙金磊 惠战伟 吴开舜 《清华大学学报(自然科学版)》 EI CAS CSCD 北大核心 2020年第10期829-836,共8页
问题报告作为记录和跟踪缺陷的载体,为解决软件质量问题提供依据。目前软件测试常以多人、并行的方式进行,海量问题报告的去假与去重等整合过程正面临严峻的挑战。因此,该文提出一种基于BM25算法的问题报告自动化检测方法,在对问题报告... 问题报告作为记录和跟踪缺陷的载体,为解决软件质量问题提供依据。目前软件测试常以多人、并行的方式进行,海量问题报告的去假与去重等整合过程正面临严峻的挑战。因此,该文提出一种基于BM25算法的问题报告自动化检测方法,在对问题报告进行预处理后,依据测试需求和测试报告样本建立匹配库,利用BM25算法计算两者的相似度得分,并以此为依据检测问题报告的正确性。在软件测试大赛的数据上进行实验,结果表明该文提出的方法能够正确评判大部分问题报告,有效提高了去假与去重效率。 展开更多
关键词 软件测试 bm25算法 问题报告 自然语言处理
原文传递
上一页 1 下一页 到第
使用帮助 返回顶部