期刊文献+
共找到47篇文章
< 1 2 3 >
每页显示 20 50 100
融合BM25与稠密向量的运维知识库混合检索研究
1
作者 李丹 杨宏明 赵显涛 《现代工程科技》 2025年第17期9-12,共4页
针对省级移动公司数据中心在同步推进“云转数改”与智能化迭代过程中,因多技术栈并行导致数据多源化、孤岛化,进而造成运维数据统一管理与高效检索极为困难的问题,通过设计融合BM25与稠密向量的私有运维知识库混合检索体系,对多源运维... 针对省级移动公司数据中心在同步推进“云转数改”与智能化迭代过程中,因多技术栈并行导致数据多源化、孤岛化,进而造成运维数据统一管理与高效检索极为困难的问题,通过设计融合BM25与稠密向量的私有运维知识库混合检索体系,对多源运维数据进行预处理,以生成高质量、结构化的输入数据。结合数据分块、分词、向量化处理以及构建双通道检索索引,并运用Deep Seek对检索结果进行优化,显著提升了运维数据检索的质量和效率。该体系已在省级移动公司的数据中心运维工作中得到应用并取得实效。 展开更多
关键词 Deep Seek RAG bm25 运维知识库 检索增强
在线阅读 下载PDF
应用BM25行CRRT治疗MODS的方法及护理 被引量:5
2
作者 王淑玲 刘峰 商和丽 《齐鲁护理杂志》 2007年第1期7-8,共2页
目的:探讨BM25系统连续肾替代治疗(CRRT)治疗多脏器功能障碍综合征(MODS)的方法及护理要点。方法:63例MODS患者应用BM25系统,采用前置换、后置换方式行CRRT治疗。结果:63例MODS患者都能持续、稳定的调节水、电解质及酸碱平衡,而清除血... 目的:探讨BM25系统连续肾替代治疗(CRRT)治疗多脏器功能障碍综合征(MODS)的方法及护理要点。方法:63例MODS患者应用BM25系统,采用前置换、后置换方式行CRRT治疗。结果:63例MODS患者都能持续、稳定的调节水、电解质及酸碱平衡,而清除血液中的内毒素。结论:CRRT因其平稳有效地维持机体内环境稳定,能明显延长危重患者的生存时间,有利于脏器功能的恢复。 展开更多
关键词 bm25系统 CRRT MODS 方法 护理
暂未订购
基于BM25F模型的Web文本挖掘个性化推荐研究 被引量:5
3
作者 邵康 张建伟 《情报理论与实践》 CSSCI 北大核心 2013年第11期118-122,共5页
文章提出的基于Web文本挖掘的个性化推荐模型是从Web交易事务中挖掘出与当前用户会话相似度最高的会话集,该模型将BM25F运用到了文本挖掘中。BM25F模型最初用在搜索引擎中,在个性化推荐中用来计算文本文档的相似性是可行的,并且通过实... 文章提出的基于Web文本挖掘的个性化推荐模型是从Web交易事务中挖掘出与当前用户会话相似度最高的会话集,该模型将BM25F运用到了文本挖掘中。BM25F模型最初用在搜索引擎中,在个性化推荐中用来计算文本文档的相似性是可行的,并且通过实验分析,其推荐结果更加优于传统的TF*IDF模型,因为BM25F计算的权重精确度大幅提高,进而提高了推荐的精确度。此外该模型能有效地跟踪用户的当前偏好,对用户随时改变兴趣偏好能及时作出响应。 展开更多
关键词 个性化推荐 bm25F模型 文本挖掘 文本处理
原文传递
群智感知中基于BM25的多行为地点机会式数据收集协议 被引量:1
4
作者 陈翔 吴敏 +2 位作者 徐佳 戴华 于京杰 《电子测量与仪器学报》 CSCD 北大核心 2016年第1期75-83,共9页
针对已有群智感知服务中的数据收集协议仅考虑单行为地点属性的问题,提出基于BM25的用户多行为地点度量模型,将用户的社会属性度量扩展至多行为地点空间。进一步提出了多行为地点机会式数据收集协议MBPOP,首先初始化多个单行为地点用户... 针对已有群智感知服务中的数据收集协议仅考虑单行为地点属性的问题,提出基于BM25的用户多行为地点度量模型,将用户的社会属性度量扩展至多行为地点空间。进一步提出了多行为地点机会式数据收集协议MBPOP,首先初始化多个单行为地点用户,然后按照单行为地点属性值进行多线路递增转发,寻找单行为地点意图接受者;最后在符合多行为地点属性的用户群中组播数据,从而精准地到达具有多行为地点特征的意图接受群体。与同类协议的比较结果表明,MBPOP具有低代价、高传输率特性。 展开更多
关键词 群智感知 数据收集协议 bm25 多行为属性
在线阅读 下载PDF
应用BM25系统行CRRT时管路预冲技巧 被引量:1
5
作者 曲希莲 王希华 +2 位作者 王新娟 高玉玲 黄卫娜 《中国血液净化》 2005年第5期279-280,共2页
关键词 bm25系统 管路预冲 血滤器 静脉管路 连续肾替代治疗
暂未订购
基于Lucene的BM25模型的评分机制的研究 被引量:15
6
作者 范晨熙 黄理灿 李雪利 《工业控制计算机》 2013年第3期78-79,共2页
Okapi BM25是一种相关性排序函数,适用于搜索引擎根据与给定搜索查询的相关性对匹配文档进行排序。通过BM25模型与开源搜索框架Lucene的有机结合,实现了BM25模型在Lucene中的检索评分。经实验表明,BM25模型在Lucene中有较好的表现,为进... Okapi BM25是一种相关性排序函数,适用于搜索引擎根据与给定搜索查询的相关性对匹配文档进行排序。通过BM25模型与开源搜索框架Lucene的有机结合,实现了BM25模型在Lucene中的检索评分。经实验表明,BM25模型在Lucene中有较好的表现,为进一步根据实际需求利用BM25模型和Lucene进行全文检索做出了有益的探索。 展开更多
关键词 bm25 LUCENE 全文检索 评分机制 搜索引擎
在线阅读 下载PDF
BM25血液净化系统临床应用常见报警原因及处理 被引量:1
7
作者 钟宇芳 王饶萍 +2 位作者 冯婉娜 陈桂芳 许元文 《透析与人工器官》 2002年第3期32-34,共3页
目的 :回顾分析在重症急性肾功能衰竭 (ARF)患者中 ,应用 BM2 5血液净化系统进行连续性肾脏替代疗法 (CRRT)常见的机器报警原因及处理方法。方法 :2 0 0 0年 6月至 11月 ,用BM2 5 CRRT治疗重症 ARF患者 12例 ,回顾性分析 BM2 5血液净化... 目的 :回顾分析在重症急性肾功能衰竭 (ARF)患者中 ,应用 BM2 5血液净化系统进行连续性肾脏替代疗法 (CRRT)常见的机器报警原因及处理方法。方法 :2 0 0 0年 6月至 11月 ,用BM2 5 CRRT治疗重症 ARF患者 12例 ,回顾性分析 BM2 5血液净化系统的特点 ,使用方法及报警原因。结果 :12例患者在使用 BM2 5血液透析机进行 CRRT治疗时出现的故障 ,经过原因分析 ,及时消除报警故障 ,排除故障因素 ,使治疗能顺利进行 ,并且延长透析器及管道的寿命 ,避免增加患者痛苦及经济的负担。结论 :及时、正确处理 BM2 5血液净化系统的报警故障 ,可保证 CRRT顺利进行 。 展开更多
关键词 bm25血液净化系统 临床应用 报警原因 处理 急性肾功能衰竭
暂未订购
BM25血液净化系统临床应用常见报警原因及处理 被引量:1
8
作者 钟宇芳 王饶萍 +2 位作者 冯婉娜 陈桂芳 许元文 《透析与人工器官》 2001年第4期17-17,共1页
关键词 bm25血液净化系统 临床应用 常见报警原因 处理 连续性肾脏替代疗法
暂未订购
基于BM25-IWF特征提取的改进Simhash算法 被引量:1
9
作者 黄迎春 王港 《移动信息》 2021年第5期7-10,共4页
传统的Simhash 网页去重是基于词频文档逆频率(TF-IDF)提取特征词的算法,存在会将部分停用词权重放大、文章长度影响特征词的权重以及同类语料库中特征词的权重被稀释的问题。基于此,文章提出了一种基于惩罚因子词语逆频率(BM25-IWF)的S... 传统的Simhash 网页去重是基于词频文档逆频率(TF-IDF)提取特征词的算法,存在会将部分停用词权重放大、文章长度影响特征词的权重以及同类语料库中特征词的权重被稀释的问题。基于此,文章提出了一种基于惩罚因子词语逆频率(BM25-IWF)的Simhash算法,计算权重时,加入惩罚因子限制词频数值过大,减小文档长度对权重的影响,然后使用词语逆频率来解决同类语料库中特征词的权重被稀释的问题。从哈工大语料库中随机挑选1000篇文档,改进的Simhash算法进行相似度判断的平均精确率达94.82%,平均召回率达90.69%。相较于传统的Simhash算法,改进算法的精确率和召回率更高,更能实现网页的精准去重。 展开更多
关键词 网页去重 Simhash算法 bm25-IWF 特征提取
在线阅读 下载PDF
基于BM25聚类与巴氏系数相似度改进的推荐算法 被引量:7
10
作者 程苗 陈海龙 +1 位作者 孙海娇 闫五岳 《黑龙江大学自然科学学报》 CAS 2020年第5期610-616,共7页
推荐算法的目的是给用户推荐潜在的感兴趣的物品和信息,在传统的算法设计中,由于数据稀疏和冷启动等因素往往给推荐带来较大误差,依靠传统的用户项目数据评分来计算相似度已经难以达到让人满意的推荐效果。本文引入BM25算法对计算用户... 推荐算法的目的是给用户推荐潜在的感兴趣的物品和信息,在传统的算法设计中,由于数据稀疏和冷启动等因素往往给推荐带来较大误差,依靠传统的用户项目数据评分来计算相似度已经难以达到让人满意的推荐效果。本文引入BM25算法对计算用户和词素之间的相关性得分具有较准确效果。在用户项目评分矩阵和项目关键词矩阵的基础上,形成用户关键词矩阵,挖掘出用户对关键词的喜爱,继而完成用户兴趣聚类。引入巴氏系数,可以解决用户在没有共同评分项目情况下用户相似度计算问题。利用巴氏系数改进相似度,在类簇中找到与用户最相似的邻居集,产生有效推荐。对MovieLens数据集进行实验的结果表明,无论在准确率或召回率等实验测评中,该算法相比于传统的基于用户和基于物品等协同算法的实验结果都显著提高。 展开更多
关键词 聚类 bm25 巴氏系数 兴趣矩阵
在线阅读 下载PDF
百特持续床旁血滤机BM25的校正与检查方法 被引量:1
11
作者 李建锋 王伟芳 《医疗卫生装备》 CAS 2005年第1期54-55,57,共3页
关键词 百特持续床旁血滤机 bm25 校正 检查方法
在线阅读 下载PDF
一种新的融合BM25与文本特征的新闻摘要算法 被引量:11
12
作者 李楠 陶宏才 《成都信息工程大学学报》 2018年第2期113-118,共6页
提出一种融合BM25与文本特征的新闻摘要算法。首先使用BM25算法计算TextRank算法中的句子相似度,其次选择词频和句子位置作为文本特征,最后将文本特征的评分与TextRank的评分相加作为文本中句子的评分,对所有的句子按照评分降序排列,选... 提出一种融合BM25与文本特征的新闻摘要算法。首先使用BM25算法计算TextRank算法中的句子相似度,其次选择词频和句子位置作为文本特征,最后将文本特征的评分与TextRank的评分相加作为文本中句子的评分,对所有的句子按照评分降序排列,选择评分最高的几个句子作为摘要。使用ROUGE工具在NLPCC2015数据集上进行测试,结果表明该方法有较好的效果。 展开更多
关键词 bm25 TextRank 词频 图排序 ROUGE
在线阅读 下载PDF
基于BM25-RoBERTa的法律案例检索研究 被引量:1
13
作者 王贺 迟呈英 战学刚 《电脑编程技巧与维护》 2023年第3期74-75,130,共3页
法律案例检索是根据用户给定的查询范围在相应的候选案例中进行检索与查询出具有相似描述的法律案例。由于法律文本区别于普通短文本,采用传统的检索模型无法检索到更精准的法律案例。针对上述问题,提出了基于BM25和RoBERTa的法律案例... 法律案例检索是根据用户给定的查询范围在相应的候选案例中进行检索与查询出具有相似描述的法律案例。由于法律文本区别于普通短文本,采用传统的检索模型无法检索到更精准的法律案例。针对上述问题,提出了基于BM25和RoBERTa的法律案例检索模型BM25-RoBERTa,该模型将传统的检索模型与神经检索相结合以获得更好的排序结果。实验结果表明,文中提出的模型在处理法律案例检索任务时表现良好。 展开更多
关键词 法律案例检索 bm25算法 RoBERTa模型 文本相似性
在线阅读 下载PDF
基于BM25的勘察设计企业科研项目重复性检测方法研究 被引量:2
14
作者 王扬 曹德威 +2 位作者 王剑刚 钱锋 钱常运 《科技管理研究》 CSSCI 2024年第4期167-174,共8页
中国勘察设计企业的科研重复投入情况日益凸显,这是对资金、人力、信誉乃至科研精神的损耗,不利于尖端技术的孵化,因此通过智能化手段自动识别科研课题重复性,最大化复用科研成果势在必行。结合BM25算法的基础理论,融合勘察设计企业的... 中国勘察设计企业的科研重复投入情况日益凸显,这是对资金、人力、信誉乃至科研精神的损耗,不利于尖端技术的孵化,因此通过智能化手段自动识别科研课题重复性,最大化复用科研成果势在必行。结合BM25算法的基础理论,融合勘察设计企业的数据属性,引入领域、专业、负责人等特征值,提出一种聚焦企业内部的科研项目重复性检测方法。该方法涉及4个步骤,包括文本预处理、建立匹配库,根据词频-逆文档频率(TF-IDF)算法、BM25算法分别计算输入课题与匹配库中课题的相似度,最后分析计算结果。相较于TF-IDF算法,BM25算法通过词语饱和度和字段长度规约实现权重控制,针对新能源、工程数字化和信息化领域的研究课题中的计算结果有较高的区分度,有利于挖掘不同领域下高相似性的文本,最大程度避免潜在重复课题的遗漏;同时该算法的计算时间小于0.1 s,可满足商用,在科研课题立项重复性校验、成果重合度判定中发挥支撑作用,计算结果经技术研发人员复验,准确性满足业务管理需要,在勘察设计行业具有推广价值。 展开更多
关键词 科研课题 项目重复性校验 勘察设计企业 bm25 词频-逆文档频率(TF-IDF) 文本相似度
在线阅读 下载PDF
基于领域数据增强的大模型RAG招生问答系统设计与实现 被引量:1
15
作者 赵耕 涂一雄 +2 位作者 杨嘉驰 郑帅 张晴 《软件》 2025年第1期175-177,共3页
传统招生查询方式问答数据少,构建智能系统难。本文首先用大模型处理招生信息,生成问答集,增强数据后,训练BERT分类问题;其次,用BM25在同类数据中检索;最后,由ChatGLM3生成答案,构建RAG招生问答系统。
关键词 数据集 数据增强 BERT bm25 招生问答 RAG 问答系统
在线阅读 下载PDF
一种基于openEuler国产操作系统的应用助手工具设计与实现
16
作者 王天与 宋丽华 +1 位作者 谭玉青 路植 《计算机科学与应用》 2025年第4期177-185,共9页
国产操作系统openEuler系统中基本管理单位是rpm包,虽然rpm包为用户提供了丰富的命令和配置文件资源,但每个包中包含的命令和配置文件数量众多,且功能和用法各异,这给用户学习和使用openEuler带来了一定的困难。基于以上问题本文设计并... 国产操作系统openEuler系统中基本管理单位是rpm包,虽然rpm包为用户提供了丰富的命令和配置文件资源,但每个包中包含的命令和配置文件数量众多,且功能和用法各异,这给用户学习和使用openEuler带来了一定的困难。基于以上问题本文设计并实现了一款基于openEuler的应用助手,该应用助手构建了知识库,并实现基于TF-IDF和BM25算法的搜索功能,设计了友好的命令行界面。用户输入关键字后,助手能够智能返回相关命令和进一步的帮助信息,从而显著提升用户体验和操作效率,为openEuler社区的发展做出贡献。In the domestic operating system openEuler, the basic management unit is the rpm package. Although rpm packages provide users with a wealth of commands and configuration file resources, the numerous commands and configuration files contained within each package, along with their varied functionalities and usages, present a certain challenge for users in learning and using openEuler. Based on this issue, this paper designs and implements an application assistant based on openEuler. The application assistant constructs a knowledge base and implements a search functionality based on the TF-IDF and BM25 algorithms, along with a user-friendly command-line interface. When users input keywords, the assistant can intelligently return relevant commands and further assistance information, significantly enhancing user experience and operational efficiency, thereby contributing to the development of the openEuler community. 展开更多
关键词 openEuler TF-IDF bm25 操作系统 国产操作系统 应用助手
在线阅读 下载PDF
面向临床研究的中文概念标准化方法研究
17
作者 吴宁 李子轩 +2 位作者 蔡文红 王怀玉 袁驰 《医学信息学杂志》 2025年第9期60-67,共8页
目的/意义探索医学术语标准化方法,提高医疗服务质量和效率。方法/过程提出基于观测指标标识符逻辑命名与编码系统的中文医学术语标准化方法,包括基于中文大语言模型的关键要素提取与基于BM25算法的术语映射两个步骤。结果/结论该方法... 目的/意义探索医学术语标准化方法,提高医疗服务质量和效率。方法/过程提出基于观测指标标识符逻辑命名与编码系统的中文医学术语标准化方法,包括基于中文大语言模型的关键要素提取与基于BM25算法的术语映射两个步骤。结果/结论该方法在国家卫生行业标准已标注数据集上映射匹配率达到73.04%,验证了其在医学术语标准化中的可行性,可为提升医疗数据互认与服务效率提供支持。 展开更多
关键词 临床医学 术语标准化 关键要素提取 bm25算法
暂未订购
一种从医学文本中实现自动关键词抽取和筛选的技术方法 被引量:3
18
作者 殷蜀梅 张智雄 吴振新 《现代图书情报技术》 CSSCI 北大核心 2008年第8期31-36,共6页
鉴于重要关键词对于文本有着重要的强文本表示功能,关键词抽取和筛选在信息检索、信息抽取和知识挖掘等领域中有着重要的作用。在调研当前关键词抽取的方法后,结合医学领域已有的叙词表和工具以及BM25F加权词频公式提出基于医学文本的... 鉴于重要关键词对于文本有着重要的强文本表示功能,关键词抽取和筛选在信息检索、信息抽取和知识挖掘等领域中有着重要的作用。在调研当前关键词抽取的方法后,结合医学领域已有的叙词表和工具以及BM25F加权词频公式提出基于医学文本的重要关键词抽取和筛选的技术方法。该方法主要解决两个关键问题:关键词的识别和抽取、关键词重要性的衡量和筛选。以2001-2007年骨关节炎领域的文献集合为数据来源,对该技术方法进行实践尝试,并验证其实际有效性,为知识挖掘中的重要关键词抽取提供一个行之有效的途径。 展开更多
关键词 关键词抽取 关键词筛选 bm25F MMTx文本挖掘 医学数据挖掘
在线阅读 下载PDF
信息检索中的带权邻近度度量研究 被引量:1
19
作者 薛源海 俞晓明 +2 位作者 刘悦 关峰 程学旗 《计算机研究与发展》 EI CSCD 北大核心 2014年第10期2216-2224,共9页
信息检索需要解决的主要问题是为信息索取者提供相关、准确甚至完整的信息.大量的传统检索模型基于词袋假设进行建模,不考虑查询词之间的相互联系.词项邻近度信息在现有的研究中常被用于提升经典信息检索模型的检索效果,但大部分工作没... 信息检索需要解决的主要问题是为信息索取者提供相关、准确甚至完整的信息.大量的传统检索模型基于词袋假设进行建模,不考虑查询词之间的相互联系.词项邻近度信息在现有的研究中常被用于提升经典信息检索模型的检索效果,但大部分工作没有考虑查询中各个词重要性的差异.在现代信息检索的查询请求中,查询词之间不仅不完全相互独立,而且分别具有不同的重要程度.因此,在计算邻近度信息时对查询词的重要性进行区分,将有助于提高检索效果.带权邻近度BM25模型(WP-BM25)使用待检索数据集的背景信息对查询词的重要性进行区分,并将带权邻近度度量方法整合到BM25模型中.在TREC评测的3个标准数据集FR88-89,WT2G和WT10G上的一系列对比实验表明,该模型具有较好的鲁棒性,且能够使检索效果得到显著提升. 展开更多
关键词 带权邻近度 度量方法 bm25 查询词重要性 信息检索
在线阅读 下载PDF
学术期刊论文审稿人的自动选择研究 被引量:1
20
作者 陆伟 王伟 刘丹 《情报学报》 CSSCI 北大核心 2010年第6期1138-1142,共5页
对于学术期刊论文审稿,通常采用人工阅读待审论文的方式确定审稿人。这种方式不仅耗时,而且带有一定的主观性。如何辅助期刊编辑快速准确地为论文选择审稿人,对于缩短审稿周期、提高论文质量,都具有重要的意义。本文借鉴现代信息检索的... 对于学术期刊论文审稿,通常采用人工阅读待审论文的方式确定审稿人。这种方式不仅耗时,而且带有一定的主观性。如何辅助期刊编辑快速准确地为论文选择审稿人,对于缩短审稿周期、提高论文质量,都具有重要的意义。本文借鉴现代信息检索的思想,分别运用概率模型中的BM25模型和统计语言模型中的Jelinek Mercer平滑模型对论文审稿人的自动选择问题进行了研究。实验结果表明,使用Jelinek Mercer平滑模型自动选择的审稿人能够较好的覆盖论文主题,具有较高的准确性。 展开更多
关键词 论文审稿人 自动选择 bm25 Jelinek Mercer平滑
在线阅读 下载PDF
上一页 1 2 3 下一页 到第
使用帮助 返回顶部