期刊文献+
共找到50篇文章
< 1 2 3 >
每页显示 20 50 100
融合BM25与稠密向量的运维知识库混合检索研究
1
作者 李丹 杨宏明 赵显涛 《现代工程科技》 2025年第17期9-12,共4页
针对省级移动公司数据中心在同步推进“云转数改”与智能化迭代过程中,因多技术栈并行导致数据多源化、孤岛化,进而造成运维数据统一管理与高效检索极为困难的问题,通过设计融合BM25与稠密向量的私有运维知识库混合检索体系,对多源运维... 针对省级移动公司数据中心在同步推进“云转数改”与智能化迭代过程中,因多技术栈并行导致数据多源化、孤岛化,进而造成运维数据统一管理与高效检索极为困难的问题,通过设计融合BM25与稠密向量的私有运维知识库混合检索体系,对多源运维数据进行预处理,以生成高质量、结构化的输入数据。结合数据分块、分词、向量化处理以及构建双通道检索索引,并运用Deep Seek对检索结果进行优化,显著提升了运维数据检索的质量和效率。该体系已在省级移动公司的数据中心运维工作中得到应用并取得实效。 展开更多
关键词 Deep Seek RAG bm25 运维知识库 检索增强
在线阅读 下载PDF
基于BM25的勘察设计企业科研项目重复性检测方法研究 被引量:2
2
作者 王扬 曹德威 +2 位作者 王剑刚 钱锋 钱常运 《科技管理研究》 CSSCI 2024年第4期167-174,共8页
中国勘察设计企业的科研重复投入情况日益凸显,这是对资金、人力、信誉乃至科研精神的损耗,不利于尖端技术的孵化,因此通过智能化手段自动识别科研课题重复性,最大化复用科研成果势在必行。结合BM25算法的基础理论,融合勘察设计企业的... 中国勘察设计企业的科研重复投入情况日益凸显,这是对资金、人力、信誉乃至科研精神的损耗,不利于尖端技术的孵化,因此通过智能化手段自动识别科研课题重复性,最大化复用科研成果势在必行。结合BM25算法的基础理论,融合勘察设计企业的数据属性,引入领域、专业、负责人等特征值,提出一种聚焦企业内部的科研项目重复性检测方法。该方法涉及4个步骤,包括文本预处理、建立匹配库,根据词频-逆文档频率(TF-IDF)算法、BM25算法分别计算输入课题与匹配库中课题的相似度,最后分析计算结果。相较于TF-IDF算法,BM25算法通过词语饱和度和字段长度规约实现权重控制,针对新能源、工程数字化和信息化领域的研究课题中的计算结果有较高的区分度,有利于挖掘不同领域下高相似性的文本,最大程度避免潜在重复课题的遗漏;同时该算法的计算时间小于0.1 s,可满足商用,在科研课题立项重复性校验、成果重合度判定中发挥支撑作用,计算结果经技术研发人员复验,准确性满足业务管理需要,在勘察设计行业具有推广价值。 展开更多
关键词 科研课题 项目重复性校验 勘察设计企业 bm25 词频-逆文档频率(TF-IDF) 文本相似度
在线阅读 下载PDF
应用BM25行CRRT治疗MODS的方法及护理 被引量:5
3
作者 王淑玲 刘峰 商和丽 《齐鲁护理杂志》 2007年第1期7-8,共2页
目的:探讨BM25系统连续肾替代治疗(CRRT)治疗多脏器功能障碍综合征(MODS)的方法及护理要点。方法:63例MODS患者应用BM25系统,采用前置换、后置换方式行CRRT治疗。结果:63例MODS患者都能持续、稳定的调节水、电解质及酸碱平衡,而清除血... 目的:探讨BM25系统连续肾替代治疗(CRRT)治疗多脏器功能障碍综合征(MODS)的方法及护理要点。方法:63例MODS患者应用BM25系统,采用前置换、后置换方式行CRRT治疗。结果:63例MODS患者都能持续、稳定的调节水、电解质及酸碱平衡,而清除血液中的内毒素。结论:CRRT因其平稳有效地维持机体内环境稳定,能明显延长危重患者的生存时间,有利于脏器功能的恢复。 展开更多
关键词 bm25系统 CRRT MODS 方法 护理
暂未订购
基于BM25F模型的Web文本挖掘个性化推荐研究 被引量:5
4
作者 邵康 张建伟 《情报理论与实践》 CSSCI 北大核心 2013年第11期118-122,共5页
文章提出的基于Web文本挖掘的个性化推荐模型是从Web交易事务中挖掘出与当前用户会话相似度最高的会话集,该模型将BM25F运用到了文本挖掘中。BM25F模型最初用在搜索引擎中,在个性化推荐中用来计算文本文档的相似性是可行的,并且通过实... 文章提出的基于Web文本挖掘的个性化推荐模型是从Web交易事务中挖掘出与当前用户会话相似度最高的会话集,该模型将BM25F运用到了文本挖掘中。BM25F模型最初用在搜索引擎中,在个性化推荐中用来计算文本文档的相似性是可行的,并且通过实验分析,其推荐结果更加优于传统的TF*IDF模型,因为BM25F计算的权重精确度大幅提高,进而提高了推荐的精确度。此外该模型能有效地跟踪用户的当前偏好,对用户随时改变兴趣偏好能及时作出响应。 展开更多
关键词 个性化推荐 bm25F模型 文本挖掘 文本处理
原文传递
群智感知中基于BM25的多行为地点机会式数据收集协议 被引量:1
5
作者 陈翔 吴敏 +2 位作者 徐佳 戴华 于京杰 《电子测量与仪器学报》 CSCD 北大核心 2016年第1期75-83,共9页
针对已有群智感知服务中的数据收集协议仅考虑单行为地点属性的问题,提出基于BM25的用户多行为地点度量模型,将用户的社会属性度量扩展至多行为地点空间。进一步提出了多行为地点机会式数据收集协议MBPOP,首先初始化多个单行为地点用户... 针对已有群智感知服务中的数据收集协议仅考虑单行为地点属性的问题,提出基于BM25的用户多行为地点度量模型,将用户的社会属性度量扩展至多行为地点空间。进一步提出了多行为地点机会式数据收集协议MBPOP,首先初始化多个单行为地点用户,然后按照单行为地点属性值进行多线路递增转发,寻找单行为地点意图接受者;最后在符合多行为地点属性的用户群中组播数据,从而精准地到达具有多行为地点特征的意图接受群体。与同类协议的比较结果表明,MBPOP具有低代价、高传输率特性。 展开更多
关键词 群智感知 数据收集协议 bm25 多行为属性
在线阅读 下载PDF
基于Lucene的BM25模型的评分机制的研究 被引量:15
6
作者 范晨熙 黄理灿 李雪利 《工业控制计算机》 2013年第3期78-79,共2页
Okapi BM25是一种相关性排序函数,适用于搜索引擎根据与给定搜索查询的相关性对匹配文档进行排序。通过BM25模型与开源搜索框架Lucene的有机结合,实现了BM25模型在Lucene中的检索评分。经实验表明,BM25模型在Lucene中有较好的表现,为进... Okapi BM25是一种相关性排序函数,适用于搜索引擎根据与给定搜索查询的相关性对匹配文档进行排序。通过BM25模型与开源搜索框架Lucene的有机结合,实现了BM25模型在Lucene中的检索评分。经实验表明,BM25模型在Lucene中有较好的表现,为进一步根据实际需求利用BM25模型和Lucene进行全文检索做出了有益的探索。 展开更多
关键词 bm25 LUCENE 全文检索 评分机制 搜索引擎
在线阅读 下载PDF
应用BM25系统行CRRT时管路预冲技巧 被引量:1
7
作者 曲希莲 王希华 +2 位作者 王新娟 高玉玲 黄卫娜 《中国血液净化》 2005年第5期279-280,共2页
关键词 bm25系统 管路预冲 血滤器 静脉管路 连续肾替代治疗
暂未订购
BM25血液净化系统临床应用常见报警原因及处理 被引量:1
8
作者 钟宇芳 王饶萍 +2 位作者 冯婉娜 陈桂芳 许元文 《透析与人工器官》 2002年第3期32-34,共3页
目的 :回顾分析在重症急性肾功能衰竭 (ARF)患者中 ,应用 BM2 5血液净化系统进行连续性肾脏替代疗法 (CRRT)常见的机器报警原因及处理方法。方法 :2 0 0 0年 6月至 11月 ,用BM2 5 CRRT治疗重症 ARF患者 12例 ,回顾性分析 BM2 5血液净化... 目的 :回顾分析在重症急性肾功能衰竭 (ARF)患者中 ,应用 BM2 5血液净化系统进行连续性肾脏替代疗法 (CRRT)常见的机器报警原因及处理方法。方法 :2 0 0 0年 6月至 11月 ,用BM2 5 CRRT治疗重症 ARF患者 12例 ,回顾性分析 BM2 5血液净化系统的特点 ,使用方法及报警原因。结果 :12例患者在使用 BM2 5血液透析机进行 CRRT治疗时出现的故障 ,经过原因分析 ,及时消除报警故障 ,排除故障因素 ,使治疗能顺利进行 ,并且延长透析器及管道的寿命 ,避免增加患者痛苦及经济的负担。结论 :及时、正确处理 BM2 5血液净化系统的报警故障 ,可保证 CRRT顺利进行 。 展开更多
关键词 bm25血液净化系统 临床应用 报警原因 处理 急性肾功能衰竭
暂未订购
BM25血液净化系统临床应用常见报警原因及处理 被引量:1
9
作者 钟宇芳 王饶萍 +2 位作者 冯婉娜 陈桂芳 许元文 《透析与人工器官》 2001年第4期17-17,共1页
关键词 bm25血液净化系统 临床应用 常见报警原因 处理 连续性肾脏替代疗法
暂未订购
基于BM25-IWF特征提取的改进Simhash算法 被引量:1
10
作者 黄迎春 王港 《移动信息》 2021年第5期7-10,共4页
传统的Simhash 网页去重是基于词频文档逆频率(TF-IDF)提取特征词的算法,存在会将部分停用词权重放大、文章长度影响特征词的权重以及同类语料库中特征词的权重被稀释的问题。基于此,文章提出了一种基于惩罚因子词语逆频率(BM25-IWF)的S... 传统的Simhash 网页去重是基于词频文档逆频率(TF-IDF)提取特征词的算法,存在会将部分停用词权重放大、文章长度影响特征词的权重以及同类语料库中特征词的权重被稀释的问题。基于此,文章提出了一种基于惩罚因子词语逆频率(BM25-IWF)的Simhash算法,计算权重时,加入惩罚因子限制词频数值过大,减小文档长度对权重的影响,然后使用词语逆频率来解决同类语料库中特征词的权重被稀释的问题。从哈工大语料库中随机挑选1000篇文档,改进的Simhash算法进行相似度判断的平均精确率达94.82%,平均召回率达90.69%。相较于传统的Simhash算法,改进算法的精确率和召回率更高,更能实现网页的精准去重。 展开更多
关键词 网页去重 Simhash算法 bm25-IWF 特征提取
在线阅读 下载PDF
基于BM25聚类与巴氏系数相似度改进的推荐算法 被引量:7
11
作者 程苗 陈海龙 +1 位作者 孙海娇 闫五岳 《黑龙江大学自然科学学报》 CAS 2020年第5期610-616,共7页
推荐算法的目的是给用户推荐潜在的感兴趣的物品和信息,在传统的算法设计中,由于数据稀疏和冷启动等因素往往给推荐带来较大误差,依靠传统的用户项目数据评分来计算相似度已经难以达到让人满意的推荐效果。本文引入BM25算法对计算用户... 推荐算法的目的是给用户推荐潜在的感兴趣的物品和信息,在传统的算法设计中,由于数据稀疏和冷启动等因素往往给推荐带来较大误差,依靠传统的用户项目数据评分来计算相似度已经难以达到让人满意的推荐效果。本文引入BM25算法对计算用户和词素之间的相关性得分具有较准确效果。在用户项目评分矩阵和项目关键词矩阵的基础上,形成用户关键词矩阵,挖掘出用户对关键词的喜爱,继而完成用户兴趣聚类。引入巴氏系数,可以解决用户在没有共同评分项目情况下用户相似度计算问题。利用巴氏系数改进相似度,在类簇中找到与用户最相似的邻居集,产生有效推荐。对MovieLens数据集进行实验的结果表明,无论在准确率或召回率等实验测评中,该算法相比于传统的基于用户和基于物品等协同算法的实验结果都显著提高。 展开更多
关键词 聚类 bm25 巴氏系数 兴趣矩阵
在线阅读 下载PDF
百特持续床旁血滤机BM25的校正与检查方法 被引量:1
12
作者 李建锋 王伟芳 《医疗卫生装备》 CAS 2005年第1期54-55,57,共3页
关键词 百特持续床旁血滤机 bm25 校正 检查方法
在线阅读 下载PDF
一种新的融合BM25与文本特征的新闻摘要算法 被引量:11
13
作者 李楠 陶宏才 《成都信息工程大学学报》 2018年第2期113-118,共6页
提出一种融合BM25与文本特征的新闻摘要算法。首先使用BM25算法计算TextRank算法中的句子相似度,其次选择词频和句子位置作为文本特征,最后将文本特征的评分与TextRank的评分相加作为文本中句子的评分,对所有的句子按照评分降序排列,选... 提出一种融合BM25与文本特征的新闻摘要算法。首先使用BM25算法计算TextRank算法中的句子相似度,其次选择词频和句子位置作为文本特征,最后将文本特征的评分与TextRank的评分相加作为文本中句子的评分,对所有的句子按照评分降序排列,选择评分最高的几个句子作为摘要。使用ROUGE工具在NLPCC2015数据集上进行测试,结果表明该方法有较好的效果。 展开更多
关键词 bm25 TextRank 词频 图排序 ROUGE
在线阅读 下载PDF
基于BM25-RoBERTa的法律案例检索研究 被引量:1
14
作者 王贺 迟呈英 战学刚 《电脑编程技巧与维护》 2023年第3期74-75,130,共3页
法律案例检索是根据用户给定的查询范围在相应的候选案例中进行检索与查询出具有相似描述的法律案例。由于法律文本区别于普通短文本,采用传统的检索模型无法检索到更精准的法律案例。针对上述问题,提出了基于BM25和RoBERTa的法律案例... 法律案例检索是根据用户给定的查询范围在相应的候选案例中进行检索与查询出具有相似描述的法律案例。由于法律文本区别于普通短文本,采用传统的检索模型无法检索到更精准的法律案例。针对上述问题,提出了基于BM25和RoBERTa的法律案例检索模型BM25-RoBERTa,该模型将传统的检索模型与神经检索相结合以获得更好的排序结果。实验结果表明,文中提出的模型在处理法律案例检索任务时表现良好。 展开更多
关键词 法律案例检索 bm25算法 RoBERTa模型 文本相似性
在线阅读 下载PDF
基于BM25模型与借阅预测模型的书目检索排序算法研究 被引量:6
15
作者 姚舜 《图书馆杂志》 CSSCI 北大核心 2016年第10期63-68,共6页
针对传统书目检索系统的相关度排序存在的读者体验差的问题,提出基于BM25模型与借阅预测模型的排序算法。该算法综合了BM25模型的相关度算法和借阅预测模型的推荐度算法,使排序结果受到相关度、入藏时间、借阅情况、在馆情况和馆藏地点... 针对传统书目检索系统的相关度排序存在的读者体验差的问题,提出基于BM25模型与借阅预测模型的排序算法。该算法综合了BM25模型的相关度算法和借阅预测模型的推荐度算法,使排序结果受到相关度、入藏时间、借阅情况、在馆情况和馆藏地点权重等因素的影响。测试结果表明,综合排序算法使结果排序更加科学和合理,能够提高读者满意度和图书的借阅率。 展开更多
关键词 bm25 借阅预测 书目检索 排序算法 Xunsearch
原文传递
基于领域数据增强的大模型RAG招生问答系统设计与实现 被引量:1
16
作者 赵耕 涂一雄 +2 位作者 杨嘉驰 郑帅 张晴 《软件》 2025年第1期175-177,共3页
传统招生查询方式问答数据少,构建智能系统难。本文首先用大模型处理招生信息,生成问答集,增强数据后,训练BERT分类问题;其次,用BM25在同类数据中检索;最后,由ChatGLM3生成答案,构建RAG招生问答系统。
关键词 数据集 数据增强 BERT bm25 招生问答 RAG 问答系统
在线阅读 下载PDF
面向临床研究的中文概念标准化方法研究
17
作者 吴宁 李子轩 +2 位作者 蔡文红 王怀玉 袁驰 《医学信息学杂志》 2025年第9期60-67,共8页
目的/意义探索医学术语标准化方法,提高医疗服务质量和效率。方法/过程提出基于观测指标标识符逻辑命名与编码系统的中文医学术语标准化方法,包括基于中文大语言模型的关键要素提取与基于BM25算法的术语映射两个步骤。结果/结论该方法... 目的/意义探索医学术语标准化方法,提高医疗服务质量和效率。方法/过程提出基于观测指标标识符逻辑命名与编码系统的中文医学术语标准化方法,包括基于中文大语言模型的关键要素提取与基于BM25算法的术语映射两个步骤。结果/结论该方法在国家卫生行业标准已标注数据集上映射匹配率达到73.04%,验证了其在医学术语标准化中的可行性,可为提升医疗数据互认与服务效率提供支持。 展开更多
关键词 临床医学 术语标准化 关键要素提取 bm25算法
暂未订购
一种基于openEuler国产操作系统的应用助手工具设计与实现
18
作者 王天与 宋丽华 +1 位作者 谭玉青 路植 《计算机科学与应用》 2025年第4期177-185,共9页
国产操作系统openEuler系统中基本管理单位是rpm包,虽然rpm包为用户提供了丰富的命令和配置文件资源,但每个包中包含的命令和配置文件数量众多,且功能和用法各异,这给用户学习和使用openEuler带来了一定的困难。基于以上问题本文设计并... 国产操作系统openEuler系统中基本管理单位是rpm包,虽然rpm包为用户提供了丰富的命令和配置文件资源,但每个包中包含的命令和配置文件数量众多,且功能和用法各异,这给用户学习和使用openEuler带来了一定的困难。基于以上问题本文设计并实现了一款基于openEuler的应用助手,该应用助手构建了知识库,并实现基于TF-IDF和BM25算法的搜索功能,设计了友好的命令行界面。用户输入关键字后,助手能够智能返回相关命令和进一步的帮助信息,从而显著提升用户体验和操作效率,为openEuler社区的发展做出贡献。In the domestic operating system openEuler, the basic management unit is the rpm package. Although rpm packages provide users with a wealth of commands and configuration file resources, the numerous commands and configuration files contained within each package, along with their varied functionalities and usages, present a certain challenge for users in learning and using openEuler. Based on this issue, this paper designs and implements an application assistant based on openEuler. The application assistant constructs a knowledge base and implements a search functionality based on the TF-IDF and BM25 algorithms, along with a user-friendly command-line interface. When users input keywords, the assistant can intelligently return relevant commands and further assistance information, significantly enhancing user experience and operational efficiency, thereby contributing to the development of the openEuler community. 展开更多
关键词 openEuler TF-IDF bm25 操作系统 国产操作系统 应用助手
在线阅读 下载PDF
基于BM25算法的问题报告质量检测方法 被引量:10
19
作者 陈乐乐 黄松 +2 位作者 孙金磊 惠战伟 吴开舜 《清华大学学报(自然科学版)》 EI CAS CSCD 北大核心 2020年第10期829-836,共8页
问题报告作为记录和跟踪缺陷的载体,为解决软件质量问题提供依据。目前软件测试常以多人、并行的方式进行,海量问题报告的去假与去重等整合过程正面临严峻的挑战。因此,该文提出一种基于BM25算法的问题报告自动化检测方法,在对问题报告... 问题报告作为记录和跟踪缺陷的载体,为解决软件质量问题提供依据。目前软件测试常以多人、并行的方式进行,海量问题报告的去假与去重等整合过程正面临严峻的挑战。因此,该文提出一种基于BM25算法的问题报告自动化检测方法,在对问题报告进行预处理后,依据测试需求和测试报告样本建立匹配库,利用BM25算法计算两者的相似度得分,并以此为依据检测问题报告的正确性。在软件测试大赛的数据上进行实验,结果表明该文提出的方法能够正确评判大部分问题报告,有效提高了去假与去重效率。 展开更多
关键词 软件测试 bm25算法 问题报告 自然语言处理
原文传递
网络舆情敏感信息二级特征匹配跟踪仿真
20
作者 黄博宇 徐政超 《计算机仿真》 2025年第4期391-395,共5页
传统网络舆情敏感信息跟踪方法只关注单个信息片段的匹配,对信息的理解不够全面和深入,难以对复杂语义和结构关系进行捕捉,导致信息跟踪准确度差。为此,引入二级特征匹配技术,引入BM25模型,融合多角度特征对文本进行二级特征匹配,实现... 传统网络舆情敏感信息跟踪方法只关注单个信息片段的匹配,对信息的理解不够全面和深入,难以对复杂语义和结构关系进行捕捉,导致信息跟踪准确度差。为此,引入二级特征匹配技术,引入BM25模型,融合多角度特征对文本进行二级特征匹配,实现信息的深度特征提取和精准匹配,从而提高了信息跟踪的准确性。首先,融合语义情感对网络舆情敏感信息进行特征选择,利用容差改进距离对网络舆情敏感信息进行一级特征匹配法,快速筛选出与敏感信息紧密相关的文本;其次,引入BM25模型,融合多角度特征对文本进行二级特征匹配,采用BERT词嵌入技术对舆情敏感信息二级特征匹配,捕捉敏感信息其中的复杂结构和语义关系,提高匹配精度;最后,将匹配结果作为输入节点,通过计算敏感信息节点的变体接近中心性及其时域变化率,实现对网络舆情敏感信息的实时跟踪。实验结果表明,所提方法显著提升了网络舆情敏感信息跟踪的准确性和效率。 展开更多
关键词 特征选择 文本匹配 超网络模型 敏感信息跟踪
在线阅读 下载PDF
上一页 1 2 3 下一页 到第
使用帮助 返回顶部