期刊导航
期刊开放获取
vip
退出
期刊文献
+
任意字段
题名或关键词
题名
关键词
文摘
作者
第一作者
机构
刊名
分类号
参考文献
作者简介
基金资助
栏目信息
任意字段
题名或关键词
题名
关键词
文摘
作者
第一作者
机构
刊名
分类号
参考文献
作者简介
基金资助
栏目信息
检索
高级检索
期刊导航
共找到
264
篇文章
<
1
2
…
14
>
每页显示
20
50
100
已选择
0
条
导出题录
引用分析
参考文献
引证文献
统计分析
检索结果
已选文献
显示方式:
文摘
详细
列表
相关度排序
被引量排序
时效性排序
基于改进预训练模型的裁判文书摘要生成研究
1
作者
尹金鑫
尹军祖
《智能计算机与应用》
2025年第6期50-57,共8页
裁判文书是人民法院公开审判活动、裁判理由、裁判依据和裁判结果的重要载体。然而,文书篇幅较长,影响了快速、有效的阅读体验。为解决这一问题,本文提出了一种基于预训练模型的裁判文书抽取式摘要生成方法。该方法改进了Oracle抽取方法...
裁判文书是人民法院公开审判活动、裁判理由、裁判依据和裁判结果的重要载体。然而,文书篇幅较长,影响了快速、有效的阅读体验。为解决这一问题,本文提出了一种基于预训练模型的裁判文书抽取式摘要生成方法。该方法改进了Oracle抽取方法,基于BERT和束搜索提取关键句子索引,并优化了检索生成模型的评分机制,结合Transformers和注意力机制,增强了模型的上下文理解能力和句子选择准确性。实验结果表明,该方法在ROUGE-1、ROUGE-2和ROUGE-L的Recall上分别提升了16.53%、5.46%和16.61%,优于现有的一些主流方法。
展开更多
关键词
裁判文书摘要
BERT
束搜索
TRANSFORMERS
注意力机制
在线阅读
下载PDF
职称材料
基于大模型的外文文献智能检索
被引量:
2
2
作者
张保军
《软件》
2025年第2期171-177,共7页
传统科技文献检索通常要求用户输入带有逻辑运算符的复杂检索条件,系统转换成ElasticsearchDSL检索式,根据检索式检索并展示结果。外文科技文献的检索情况更为复杂,现代专业领域的外文词汇不断涌现,这些专业词汇往往拼写复杂,且缺乏成...
传统科技文献检索通常要求用户输入带有逻辑运算符的复杂检索条件,系统转换成ElasticsearchDSL检索式,根据检索式检索并展示结果。外文科技文献的检索情况更为复杂,现代专业领域的外文词汇不断涌现,这些专业词汇往往拼写复杂,且缺乏成熟的中文翻译。尤其是小语种文献,阅读理解和检索难度更高。为此,本文运用人工智能大模型技术,实现智能化、多语种的文献检索,旨在帮助专业人员快速、有效地检索外文文献,省去输入复杂检索式的步骤。研究数据源自国外出版商的开放获取(OA)文献,并可扩展到专利、非OA文献及中文文献领域。整个系统基于大规模微服务的容器化云原生架构和分布式云数据库集群,最终以SaaS形式部署在私有云平台上,为用户提供便捷的访问体验。
展开更多
关键词
科技文献检索
大模型
人工智能
智能文献检索
云原生
云计算
在线阅读
下载PDF
职称材料
电力物资文档混合检索方法研究
3
作者
葛星
柏能
《福建电脑》
2025年第9期37-42,共6页
针对电力行业数字化转型中非结构化与半结构化物资文档检索效率低、精度不足的问题,本文提出一种基于动态权重融合的混合检索方法。通过结合关键词检索、结构化字段检索与语义向量检索的优势,构建电力物资领域预训练语言模型,并开发实...
针对电力行业数字化转型中非结构化与半结构化物资文档检索效率低、精度不足的问题,本文提出一种基于动态权重融合的混合检索方法。通过结合关键词检索、结构化字段检索与语义向量检索的优势,构建电力物资领域预训练语言模型,并开发实体识别与文本分类算法以提升查询意图理解与文档特征提取能力。基于某省电力物资文档的测试表明,该方法较传统检索方式显著提高了精确率,有效满足实际业务需求,具有较高的应用推广价值。
展开更多
关键词
电力物资
混合检索
预训练模型
语义检索
文档分类
在线阅读
下载PDF
职称材料
基于语义排序功能实现对比文件快速筛选
4
作者
陈立兵
《科技创新与生产力》
2024年第6期19-22,共4页
为提高专利的审查质量和效率,本文提出了在智能检索系统下灵活运用语义排序功能以实现对比文件的快速筛选。通过结合一个实际案例的检索分析,阐述了如何在检索结果中运用语义排序功能。采用申请号或原权利要求作为一次语义排序基准,并...
为提高专利的审查质量和效率,本文提出了在智能检索系统下灵活运用语义排序功能以实现对比文件的快速筛选。通过结合一个实际案例的检索分析,阐述了如何在检索结果中运用语义排序功能。采用申请号或原权利要求作为一次语义排序基准,并以发明构思作为二次语义排序基准,可以将目标文献的排序提前,有效提高筛选效率。
展开更多
关键词
语义排序
对比文件
专利检索
发明构思
在线阅读
下载PDF
职称材料
稀疏向量匹配技术在智能信息快速搜索中的运用评价
5
作者
胡若云
刘鹏
+2 位作者
张燕
金家红
赵天成
《粘接》
CAS
2024年第5期177-180,共4页
针对传统的电网领域搜索系统通常依赖关键词,存在查准率和召回率低的问题,无法为用户提供高效智能的信息检索体验。提出了一种基于稀疏向量匹配和机器阅读理解的电力文件智能搜索问答算法。通过对于电力文档中的文字内容进行向量化编码...
针对传统的电网领域搜索系统通常依赖关键词,存在查准率和召回率低的问题,无法为用户提供高效智能的信息检索体验。提出了一种基于稀疏向量匹配和机器阅读理解的电力文件智能搜索问答算法。通过对于电力文档中的文字内容进行向量化编码,建立语义索引,针对用户搜索的问题进行编码和机器阅读理解,实现自然语言问答式的智能搜索。结合稀疏向量匹配的快速检索召回能力和机器阅读理解的精准回答特性,同时提高了搜索系统的查准率和召回率,有效提高了用户的搜索体验和信息获取效率。实验结果表明该方法准确率和召回率均有较大提升。
展开更多
关键词
文档搜索
语义搜索
稀疏向量
机器阅读理解
智能问答
在线阅读
下载PDF
职称材料
高校智慧材料收集系统设计与研究
6
作者
刘海标
叶成权
+1 位作者
李万益
张渝荣
《信息与电脑》
2024年第22期28-30,共3页
文章对高校智慧材料收集系统进行了需求分析,并基于Spring Boot框架进行了功能设计和架构设计,对其中的关键功能全文检索、文档相似度、提取文档主题进行了研究,并提出了相应的实现方案。
关键词
智慧材料收集管理系统
需求分析
全文检索
文档相似度
主题提取
在线阅读
下载PDF
职称材料
基于Softmax回归分类模型的网页搜索排序算法
被引量:
2
7
作者
党米花
《吉林大学学报(信息科学版)》
CAS
2024年第5期985-990,共6页
针对网页搜索结果存在返回的网页与搜索的关键词领域不相关的领域漂移现象,导致用户无法搜索到需求信息的问题,提出基于Softmax回归分类模型的网页搜索排序算法。选择网页搜索文本特征,得到相应的特征项,利用向量表示模型,将选择的网页...
针对网页搜索结果存在返回的网页与搜索的关键词领域不相关的领域漂移现象,导致用户无法搜索到需求信息的问题,提出基于Softmax回归分类模型的网页搜索排序算法。选择网页搜索文本特征,得到相应的特征项,利用向量表示模型,将选择的网页搜索文本特征项转换为格式化数据,对网页搜索文本数据进行均衡处理,获取网页搜索文本数据集。采用Softmax回归分类模型,分类处理网页搜索文本数据集,预测网页搜索文本类别,通过Okapi BM25算法,对网页搜索文本进行排序操作,实现网页搜索排序。实验结果表明,所提算法具有较好的网页搜索排序,提升了网页搜索排序精度,避免网页搜索排序过程中的领域漂移现象。
展开更多
关键词
Softmax回归分类模型
网页搜索排序
文本预处理
TF-IDF算法
Okapi
BM25算法
在线阅读
下载PDF
职称材料
基于RDF句子的语义网文档搜索
被引量:
4
8
作者
吴鸿汉
瞿裕忠
李慧颖
《计算机研究与发展》
EI
CSCD
北大核心
2010年第2期255-263,共9页
语义网文档搜索是发现语义网数据的重要手段.针对传统信息检索方法的不足,提出基于RDF句子的文档词向量构建方法.首先,文档被看作RDF句子的集合,从而在文档分析和索引时能够保留基于RDF句子的结构信息.其次,引入资源的权威描述的定义,...
语义网文档搜索是发现语义网数据的重要手段.针对传统信息检索方法的不足,提出基于RDF句子的文档词向量构建方法.首先,文档被看作RDF句子的集合,从而在文档分析和索引时能够保留基于RDF句子的结构信息.其次,引入资源的权威描述的定义,能够跨越文档边界搜索到语义网中互连的数据.此外,扩展了传统的倒排索引结构,使得系统能够提取出更加便于阅读和理解的片段.在大规模真实数据集上的实验表明,该方法可以显著地提高文档检索的效率,在可用性上具有明显的提升.
展开更多
关键词
语义网
搜索引擎
语义网文档搜索
RDF句子
片段提取
在线阅读
下载PDF
职称材料
科技查新流程对查新质量的影响
被引量:
9
9
作者
郝慧
胡娟
《现代情报》
CSSCI
北大核心
2015年第5期149-152,共4页
本文首先对清华大学查新站与北京工业大学查新室的查新流程进行了对比,前者具有检索策略制定客观、科学,文献分析深入,报告格式有条理的优势,最终的查新质量有保证,而后者具有报告周期可控以及二次审核查新报告的特点,对查新效率和查新...
本文首先对清华大学查新站与北京工业大学查新室的查新流程进行了对比,前者具有检索策略制定客观、科学,文献分析深入,报告格式有条理的优势,最终的查新质量有保证,而后者具有报告周期可控以及二次审核查新报告的特点,对查新效率和查新质量的提高很有帮助。论文另外对查新流程中检索词的选择及检索策略的制定中经常遇到的查全率和检索结果为零的情况进行了举例分析,认为检索式的制定要根据不同检索词及其逻辑关系进行适当调整和取舍,防止得出片面的查新结论,造成新颖性误判。
展开更多
关键词
科技查新
查新流程
文献检索
检索词
检索式
在线阅读
下载PDF
职称材料
新时期学生信息获取和综合能力培养的研究与思考
被引量:
11
10
作者
苏丽
张萍
《现代情报》
北大核心
2005年第12期189-191,194,共4页
本文简述了信息教育的涵义、发展、存在的问题,阐述了学生信息获取和综合利用能力培养的意义和必要性,提出了学生信息获取和综合利用能力培养的有效模式和途径。
关键词
信息教育
文献检索课程改革
在线阅读
下载PDF
职称材料
基于用户个性化需求的一站式信息搜索推送方法研究
被引量:
6
11
作者
姜轶岚
夏寒
金晓卿
《中国卫生资源》
北大核心
2022年第1期139-143,共5页
基于用户个性化需求的一站式信息搜索推送方法是在考虑信息使用者个体差异与信息需求差异的基础上,通过系统推荐和推送,主动向用户提供其需要的文献信息资源。同时,通过系统主动学习获取用户的兴趣变化挖掘用户潜在需求,随用户兴趣变化...
基于用户个性化需求的一站式信息搜索推送方法是在考虑信息使用者个体差异与信息需求差异的基础上,通过系统推荐和推送,主动向用户提供其需要的文献信息资源。同时,通过系统主动学习获取用户的兴趣变化挖掘用户潜在需求,随用户兴趣变化更新推送内容,使得信息服务更具有动态性和及时性,提升搜索推送的质量和效率。重点阐述基于个性化需求的一站式搜索推送对于信息资源获取、个体化信息推送的实现方法以及具体实施步骤。
展开更多
关键词
搜索引擎
信息推送
个性化需求
一站式
文献检索
暂未订购
影响查新咨询工作质量的相关因素及对策
被引量:
5
12
作者
刘莉
逄大欣
《情报科学》
CSSCI
1999年第5期512-514,共3页
本文从4个方面讨论了影响查新咨询工作质量的相关因素,如用户提问的模糊性、查新人员的主观因素以及文献支持系统的选择等,并对提高查新咨询工作质量提出几点建议。
关键词
查新咨询
文献检索
信息服务
在线阅读
下载PDF
职称材料
浅谈标准文献检索
被引量:
5
13
作者
夏巨岚
翟煜男
《图书馆建设》
北大核心
2002年第3期99-100,共2页
本文介绍了标准的概念、种类以及如何利用标准文献为用户服务。
关键词
标准文献
文献检索
用户需求
用户分析
检索途径
在线阅读
下载PDF
职称材料
一种快速的XML语义检索算法
被引量:
6
14
作者
李新叶
苑津莎
《电子学报》
EI
CAS
CSCD
北大核心
2007年第11期2220-2225,共6页
传统基于关键词的搜索引擎不能充分利用XML文档的结构信息,搜索结果往往不精确;而基于结构信息和关键词的XML搜索技术又不适用于普通用户.基于关键词的XML语义检索克服了以上缺点,但需要提高检索效率.本文深入分析了XML文档结构潜藏的语...
传统基于关键词的搜索引擎不能充分利用XML文档的结构信息,搜索结果往往不精确;而基于结构信息和关键词的XML搜索技术又不适用于普通用户.基于关键词的XML语义检索克服了以上缺点,但需要提高检索效率.本文深入分析了XML文档结构潜藏的语义,提出了新的索引结构及两结点语义相关的判断函数,在此基础上提出了一种快速的XML语义检索算法,该算法大大减少了结点对语义相关的判断次数.对实际数据集的测试实验结果显示出新算法的有效性.
展开更多
关键词
XML文档
语义检索
索引结构
信息检索
在线阅读
下载PDF
职称材料
一种基于kmeans聚类算法和LDA主题模型的文本检索方法及有效性验证
被引量:
43
15
作者
刘江华
《情报科学》
CSSCI
北大核心
2017年第2期16-21,26,共7页
【目的/意义】非常态分布状态下,LDA主题模型的检索效果较差;在数据量较小的情况下LDA主题模型计算出来的正确率较低。【方法/过程】本文提出一种基于Kmeans聚类算法的LDA主题模型检索方法,本检索方法以Kmeans算法为基础,对文本主题进...
【目的/意义】非常态分布状态下,LDA主题模型的检索效果较差;在数据量较小的情况下LDA主题模型计算出来的正确率较低。【方法/过程】本文提出一种基于Kmeans聚类算法的LDA主题模型检索方法,本检索方法以Kmeans算法为基础,对文本主题进行聚类和语义相关度分析,避免了传统LDA主题模型存在的诸多缺陷。【结果/结论】实验结果显示,不论是一般还是多义主题关键词的检索,本文的LDA主题模型在耗时和准确率上均比本文列出的其他三种主题模型具有明显的优势,进一步验证了本文提出方法的有效性。
展开更多
关键词
LDA(潜在狄利克雷分布)
主题模型
聚类分析
文本检索
原文传递
现代文检课教材的结构及有关问题
被引量:
3
16
作者
丛立
古今
陈茜
《图书馆学研究》
2007年第4期73-75,共3页
文章提出文检课教材的1:1:8结构体系,依此比例安排并序列基础理论、手工检索、计算机检索的内容。以理论为基础,应用为主体,以Internet网络检索为龙头,辅以光盘检索、联机检索、手工检索,构筑全方位、多层面体系结构,并从开放性、综合...
文章提出文检课教材的1:1:8结构体系,依此比例安排并序列基础理论、手工检索、计算机检索的内容。以理论为基础,应用为主体,以Internet网络检索为龙头,辅以光盘检索、联机检索、手工检索,构筑全方位、多层面体系结构,并从开放性、综合性、系统性等若干方面就其总体规划加以探讨。
展开更多
关键词
文检课教材
文检课改革
信息检索
在线阅读
下载PDF
职称材料
中文Web文档聚类算法研究
被引量:
3
17
作者
林庆
袁晓峰
吴旻
《计算机工程与设计》
CSCD
北大核心
2009年第20期4759-4761,共3页
在STC算法的基础上,提出一种中文Web文档聚类算法STC-I,用以对检索结果进行在线高效地聚类。STC-I中,将文档集通过去同义词、近义词、相同句子的方法对文档进行降维处理,并通过计算查询关键字与文本的相似度,对参加聚类的文本打分的方...
在STC算法的基础上,提出一种中文Web文档聚类算法STC-I,用以对检索结果进行在线高效地聚类。STC-I中,将文档集通过去同义词、近义词、相同句子的方法对文档进行降维处理,并通过计算查询关键字与文本的相似度,对参加聚类的文本打分的方法来降低STC的时间复杂度并提高STC聚类准确率。通过对STC-I与STC、AHC、K-Means算法从聚类的准确性和时间复杂度上进行比较,结果表明,STC-I算法在聚类的准确性和时间复杂度方面都较STC、AHC和K-Means算法好。
展开更多
关键词
后缀树
文本聚类
搜索引擎
STC-I
STC
在线阅读
下载PDF
职称材料
浅谈文献检索课网络化教学的设计与实现
被引量:
8
18
作者
周密
但旺
《图书馆学研究》
2002年第9期65-67,共3页
网络环境下,文献检索课的教学内容和教学方式都面临着变革和挑战。本文分析了文献检索课的现状,指出了文献检索课开展网络教学的意义,重点介绍了如何编制和实现网络化教学软件,从而构建一种新型的文献教学模式。
关键词
文献检索
网络教学
用户教育
在线阅读
下载PDF
职称材料
专利文献的特点及其利用
被引量:
48
19
作者
王朝晖
《现代情报》
北大核心
2008年第9期151-152,156,共3页
专利文献是重要的技术信息,世界上每年发明创造成果的90%-95%能在专利文献中查到,而且许多发明创造成果仅仅出现于专利文献中。专利以公开换取保护,因特网上有着丰富的免费专利文献,对广大用户有非常重要的价值和意义。然而,大...
专利文献是重要的技术信息,世界上每年发明创造成果的90%-95%能在专利文献中查到,而且许多发明创造成果仅仅出现于专利文献中。专利以公开换取保护,因特网上有着丰富的免费专利文献,对广大用户有非常重要的价值和意义。然而,大多数信息用户对它的认识和利用还不够充分。本文详细地介绍了专利文献的特点、用途、检索方法及获取途径。
展开更多
关键词
专利文献
检索方法
获取途径
在线阅读
下载PDF
职称材料
一种基于文档相似度的检索结果重排序方法
被引量:
9
20
作者
周博
岑荣伟
+3 位作者
刘奕群
张敏
金奕江
马少平
《中文信息学报》
CSCD
北大核心
2010年第3期19-23,36,共6页
对相关反馈问题的研究已有近30年的历史,相关反馈也被证明可以大程度稳定地提升检索系统的性能。当前网络环境下相关反馈的应用以及用户提供反馈信息的方式已经发生了明显的变化,因此相关反馈研究又一次引起了研究界的注意。该文提出了...
对相关反馈问题的研究已有近30年的历史,相关反馈也被证明可以大程度稳定地提升检索系统的性能。当前网络环境下相关反馈的应用以及用户提供反馈信息的方式已经发生了明显的变化,因此相关反馈研究又一次引起了研究界的注意。该文提出了一种基于文档相似度的搜索结果重排序方法,该方法同时利用了反馈信息中的相关文档与不相关文档。在大规模网络信息检索标准实验数据上的实验结果表明:该方法不仅可以稳定地提高系统的检索性能,并且相较于经典的查询扩展方法有着明显的优势。
展开更多
关键词
计算机应用
中文信息处理
相关反馈
文档重排序
信息检索
在线阅读
下载PDF
职称材料
题名
基于改进预训练模型的裁判文书摘要生成研究
1
作者
尹金鑫
尹军祖
机构
中国人民公安大学信息网络安全学院
出处
《智能计算机与应用》
2025年第6期50-57,共8页
文摘
裁判文书是人民法院公开审判活动、裁判理由、裁判依据和裁判结果的重要载体。然而,文书篇幅较长,影响了快速、有效的阅读体验。为解决这一问题,本文提出了一种基于预训练模型的裁判文书抽取式摘要生成方法。该方法改进了Oracle抽取方法,基于BERT和束搜索提取关键句子索引,并优化了检索生成模型的评分机制,结合Transformers和注意力机制,增强了模型的上下文理解能力和句子选择准确性。实验结果表明,该方法在ROUGE-1、ROUGE-2和ROUGE-L的Recall上分别提升了16.53%、5.46%和16.61%,优于现有的一些主流方法。
关键词
裁判文书摘要
BERT
束搜索
TRANSFORMERS
注意力机制
Keywords
judicial
document
summarization
BERT
beam
search
Transformers
attention mechanism
分类号
D926.13 [政治法律—法学]
在线阅读
下载PDF
职称材料
题名
基于大模型的外文文献智能检索
被引量:
2
2
作者
张保军
机构
中国电子信息产业集团
出处
《软件》
2025年第2期171-177,共7页
文摘
传统科技文献检索通常要求用户输入带有逻辑运算符的复杂检索条件,系统转换成ElasticsearchDSL检索式,根据检索式检索并展示结果。外文科技文献的检索情况更为复杂,现代专业领域的外文词汇不断涌现,这些专业词汇往往拼写复杂,且缺乏成熟的中文翻译。尤其是小语种文献,阅读理解和检索难度更高。为此,本文运用人工智能大模型技术,实现智能化、多语种的文献检索,旨在帮助专业人员快速、有效地检索外文文献,省去输入复杂检索式的步骤。研究数据源自国外出版商的开放获取(OA)文献,并可扩展到专利、非OA文献及中文文献领域。整个系统基于大规模微服务的容器化云原生架构和分布式云数据库集群,最终以SaaS形式部署在私有云平台上,为用户提供便捷的访问体验。
关键词
科技文献检索
大模型
人工智能
智能文献检索
云原生
云计算
Keywords
scientific and technical literature
search
big model
AI
intelligent
document
retrieval
cloud native
cloud computing
分类号
TP391.3 [自动化与计算机技术—计算机应用技术]
在线阅读
下载PDF
职称材料
题名
电力物资文档混合检索方法研究
3
作者
葛星
柏能
机构
国网江苏省电力有限公司物资分公司合同结算部
出处
《福建电脑》
2025年第9期37-42,共6页
文摘
针对电力行业数字化转型中非结构化与半结构化物资文档检索效率低、精度不足的问题,本文提出一种基于动态权重融合的混合检索方法。通过结合关键词检索、结构化字段检索与语义向量检索的优势,构建电力物资领域预训练语言模型,并开发实体识别与文本分类算法以提升查询意图理解与文档特征提取能力。基于某省电力物资文档的测试表明,该方法较传统检索方式显著提高了精确率,有效满足实际业务需求,具有较高的应用推广价值。
关键词
电力物资
混合检索
预训练模型
语义检索
文档分类
Keywords
Electricity Materials
Mixed
search
Pre Trained Model
Semantic Retrieval
document
Classification
分类号
T39 [一般工业技术]
在线阅读
下载PDF
职称材料
题名
基于语义排序功能实现对比文件快速筛选
4
作者
陈立兵
机构
国家知识产权局专利局专利审查协作广东中心
出处
《科技创新与生产力》
2024年第6期19-22,共4页
文摘
为提高专利的审查质量和效率,本文提出了在智能检索系统下灵活运用语义排序功能以实现对比文件的快速筛选。通过结合一个实际案例的检索分析,阐述了如何在检索结果中运用语义排序功能。采用申请号或原权利要求作为一次语义排序基准,并以发明构思作为二次语义排序基准,可以将目标文献的排序提前,有效提高筛选效率。
关键词
语义排序
对比文件
专利检索
发明构思
Keywords
semantic ranking
comparative
document
s
patent
search
invention concept
分类号
G306 [文化科学]
在线阅读
下载PDF
职称材料
题名
稀疏向量匹配技术在智能信息快速搜索中的运用评价
5
作者
胡若云
刘鹏
张燕
金家红
赵天成
机构
国网浙江电力有限公司
杭州联汇科技股份有限公司
浙江大学滨江研究院
出处
《粘接》
CAS
2024年第5期177-180,共4页
文摘
针对传统的电网领域搜索系统通常依赖关键词,存在查准率和召回率低的问题,无法为用户提供高效智能的信息检索体验。提出了一种基于稀疏向量匹配和机器阅读理解的电力文件智能搜索问答算法。通过对于电力文档中的文字内容进行向量化编码,建立语义索引,针对用户搜索的问题进行编码和机器阅读理解,实现自然语言问答式的智能搜索。结合稀疏向量匹配的快速检索召回能力和机器阅读理解的精准回答特性,同时提高了搜索系统的查准率和召回率,有效提高了用户的搜索体验和信息获取效率。实验结果表明该方法准确率和召回率均有较大提升。
关键词
文档搜索
语义搜索
稀疏向量
机器阅读理解
智能问答
Keywords
document search
semantic
search
sparse embedding
machine reading comprehension
intelligent question answering
分类号
TM711 [电气工程—电力系统及自动化]
TP311 [自动化与计算机技术—计算机软件与理论]
在线阅读
下载PDF
职称材料
题名
高校智慧材料收集系统设计与研究
6
作者
刘海标
叶成权
李万益
张渝荣
机构
广东第二师范学院
广州花都实验中学
出处
《信息与电脑》
2024年第22期28-30,共3页
文摘
文章对高校智慧材料收集系统进行了需求分析,并基于Spring Boot框架进行了功能设计和架构设计,对其中的关键功能全文检索、文档相似度、提取文档主题进行了研究,并提出了相应的实现方案。
关键词
智慧材料收集管理系统
需求分析
全文检索
文档相似度
主题提取
Keywords
intelligent material collection system
requirement analysis
full-text
search
document
similarity
topic extraction
分类号
TP315 [自动化与计算机技术—计算机软件与理论]
在线阅读
下载PDF
职称材料
题名
基于Softmax回归分类模型的网页搜索排序算法
被引量:
2
7
作者
党米花
机构
西安交通工程学院人文与管理学院
出处
《吉林大学学报(信息科学版)》
CAS
2024年第5期985-990,共6页
基金
西安交通工程学院校级中青年基金资助项目(2023KY-17)。
文摘
针对网页搜索结果存在返回的网页与搜索的关键词领域不相关的领域漂移现象,导致用户无法搜索到需求信息的问题,提出基于Softmax回归分类模型的网页搜索排序算法。选择网页搜索文本特征,得到相应的特征项,利用向量表示模型,将选择的网页搜索文本特征项转换为格式化数据,对网页搜索文本数据进行均衡处理,获取网页搜索文本数据集。采用Softmax回归分类模型,分类处理网页搜索文本数据集,预测网页搜索文本类别,通过Okapi BM25算法,对网页搜索文本进行排序操作,实现网页搜索排序。实验结果表明,所提算法具有较好的网页搜索排序,提升了网页搜索排序精度,避免网页搜索排序过程中的领域漂移现象。
关键词
Softmax回归分类模型
网页搜索排序
文本预处理
TF-IDF算法
Okapi
BM25算法
Keywords
softmax regression classification model
sort web
search
text preprocessing
term-frequency-inverse
document
frequency(TF-IDF)algorithm
OkapiBM25 algorithm
分类号
TP391 [自动化与计算机技术—计算机应用技术]
在线阅读
下载PDF
职称材料
题名
基于RDF句子的语义网文档搜索
被引量:
4
8
作者
吴鸿汉
瞿裕忠
李慧颖
机构
东南大学计算机科学与工程学院
出处
《计算机研究与发展》
EI
CSCD
北大核心
2010年第2期255-263,共9页
基金
国家自然科学基金项目(60773106)
江苏省自然科学基金项目(BK2008290)~~
文摘
语义网文档搜索是发现语义网数据的重要手段.针对传统信息检索方法的不足,提出基于RDF句子的文档词向量构建方法.首先,文档被看作RDF句子的集合,从而在文档分析和索引时能够保留基于RDF句子的结构信息.其次,引入资源的权威描述的定义,能够跨越文档边界搜索到语义网中互连的数据.此外,扩展了传统的倒排索引结构,使得系统能够提取出更加便于阅读和理解的片段.在大规模真实数据集上的实验表明,该方法可以显著地提高文档检索的效率,在可用性上具有明显的提升.
关键词
语义网
搜索引擎
语义网文档搜索
RDF句子
片段提取
Keywords
semantic Web
search
engine
RDF
document search
RDF sentence
snippet generation
分类号
TP393.09 [自动化与计算机技术—计算机应用技术]
在线阅读
下载PDF
职称材料
题名
科技查新流程对查新质量的影响
被引量:
9
9
作者
郝慧
胡娟
机构
北京工业大学图书馆
出处
《现代情报》
CSSCI
北大核心
2015年第5期149-152,共4页
文摘
本文首先对清华大学查新站与北京工业大学查新室的查新流程进行了对比,前者具有检索策略制定客观、科学,文献分析深入,报告格式有条理的优势,最终的查新质量有保证,而后者具有报告周期可控以及二次审核查新报告的特点,对查新效率和查新质量的提高很有帮助。论文另外对查新流程中检索词的选择及检索策略的制定中经常遇到的查全率和检索结果为零的情况进行了举例分析,认为检索式的制定要根据不同检索词及其逻辑关系进行适当调整和取舍,防止得出片面的查新结论,造成新颖性误判。
关键词
科技查新
查新流程
文献检索
检索词
检索式
Keywords
sci - tech novelty retrieval
steps of novelty
search
document
retrieval
search
term
retrieval strategy
分类号
G252.7 [文化科学—图书馆学]
在线阅读
下载PDF
职称材料
题名
新时期学生信息获取和综合能力培养的研究与思考
被引量:
11
10
作者
苏丽
张萍
机构
北华大学
长春工程学院
出处
《现代情报》
北大核心
2005年第12期189-191,194,共4页
文摘
本文简述了信息教育的涵义、发展、存在的问题,阐述了学生信息获取和综合利用能力培养的意义和必要性,提出了学生信息获取和综合利用能力培养的有效模式和途径。
关键词
信息教育
文献检索课程改革
Keywords
information education
document
s
search
es curriculum reform
分类号
G40-63 [文化科学—教育学原理]
在线阅读
下载PDF
职称材料
题名
基于用户个性化需求的一站式信息搜索推送方法研究
被引量:
6
11
作者
姜轶岚
夏寒
金晓卿
机构
上海市疾病预防控制中心
出处
《中国卫生资源》
北大核心
2022年第1期139-143,共5页
基金
上海市公共卫生体系建设三年行动计划(2020—2022年)重点学科建设项目“大数据与人工智能应用”(GWⅤ-10.1-XK05)
上海市公共卫生体系建设三年行动计划(2020—2022年)学科带头人项目“大数据与人工智能应用”(GWⅤ-10.2-XD06)
上海市公共卫生体系建设三年行动计划(2020—2022年)学科带头人项目“流行病学”(GWⅤ-10.2-XD20)。
文摘
基于用户个性化需求的一站式信息搜索推送方法是在考虑信息使用者个体差异与信息需求差异的基础上,通过系统推荐和推送,主动向用户提供其需要的文献信息资源。同时,通过系统主动学习获取用户的兴趣变化挖掘用户潜在需求,随用户兴趣变化更新推送内容,使得信息服务更具有动态性和及时性,提升搜索推送的质量和效率。重点阐述基于个性化需求的一站式搜索推送对于信息资源获取、个体化信息推送的实现方法以及具体实施步骤。
关键词
搜索引擎
信息推送
个性化需求
一站式
文献检索
Keywords
search
engine
information push
personalized need
one-stop
document search
分类号
R19 [医药卫生—卫生事业管理]
暂未订购
题名
影响查新咨询工作质量的相关因素及对策
被引量:
5
12
作者
刘莉
逄大欣
机构
白求恩医科大学图书馆
出处
《情报科学》
CSSCI
1999年第5期512-514,共3页
文摘
本文从4个方面讨论了影响查新咨询工作质量的相关因素,如用户提问的模糊性、查新人员的主观因素以及文献支持系统的选择等,并对提高查新咨询工作质量提出几点建议。
关键词
查新咨询
文献检索
信息服务
Keywords
search
and consultation
document search
Information service
分类号
G252.6 [文化科学—图书馆学]
G252.7 [文化科学—图书馆学]
在线阅读
下载PDF
职称材料
题名
浅谈标准文献检索
被引量:
5
13
作者
夏巨岚
翟煜男
机构
黑龙江省图书馆
黑龙江中医药大学图书馆
出处
《图书馆建设》
北大核心
2002年第3期99-100,共2页
文摘
本文介绍了标准的概念、种类以及如何利用标准文献为用户服务。
关键词
标准文献
文献检索
用户需求
用户分析
检索途径
Keywords
Standard
document
Literature
search
分类号
G255.54 [文化科学—图书馆学]
在线阅读
下载PDF
职称材料
题名
一种快速的XML语义检索算法
被引量:
6
14
作者
李新叶
苑津莎
机构
华北电力大学电子与通信工程系
出处
《电子学报》
EI
CAS
CSCD
北大核心
2007年第11期2220-2225,共6页
文摘
传统基于关键词的搜索引擎不能充分利用XML文档的结构信息,搜索结果往往不精确;而基于结构信息和关键词的XML搜索技术又不适用于普通用户.基于关键词的XML语义检索克服了以上缺点,但需要提高检索效率.本文深入分析了XML文档结构潜藏的语义,提出了新的索引结构及两结点语义相关的判断函数,在此基础上提出了一种快速的XML语义检索算法,该算法大大减少了结点对语义相关的判断次数.对实际数据集的测试实验结果显示出新算法的有效性.
关键词
XML文档
语义检索
索引结构
信息检索
Keywords
XML
document
semantic
search
index structure
information retrieval
分类号
TP391 [自动化与计算机技术—计算机应用技术]
在线阅读
下载PDF
职称材料
题名
一种基于kmeans聚类算法和LDA主题模型的文本检索方法及有效性验证
被引量:
43
15
作者
刘江华
机构
赣南师范学院图书馆
出处
《情报科学》
CSSCI
北大核心
2017年第2期16-21,26,共7页
文摘
【目的/意义】非常态分布状态下,LDA主题模型的检索效果较差;在数据量较小的情况下LDA主题模型计算出来的正确率较低。【方法/过程】本文提出一种基于Kmeans聚类算法的LDA主题模型检索方法,本检索方法以Kmeans算法为基础,对文本主题进行聚类和语义相关度分析,避免了传统LDA主题模型存在的诸多缺陷。【结果/结论】实验结果显示,不论是一般还是多义主题关键词的检索,本文的LDA主题模型在耗时和准确率上均比本文列出的其他三种主题模型具有明显的优势,进一步验证了本文提出方法的有效性。
关键词
LDA(潜在狄利克雷分布)
主题模型
聚类分析
文本检索
Keywords
LDA(Latent Dirichlet Allocation)
topic model
cluster analysis
document
s
search
分类号
G254.9 [文化科学—图书馆学]
原文传递
题名
现代文检课教材的结构及有关问题
被引量:
3
16
作者
丛立
古今
陈茜
机构
吉林大学图书馆
出处
《图书馆学研究》
2007年第4期73-75,共3页
文摘
文章提出文检课教材的1:1:8结构体系,依此比例安排并序列基础理论、手工检索、计算机检索的内容。以理论为基础,应用为主体,以Internet网络检索为龙头,辅以光盘检索、联机检索、手工检索,构筑全方位、多层面体系结构,并从开放性、综合性、系统性等若干方面就其总体规划加以探讨。
关键词
文检课教材
文检课改革
信息检索
Keywords
document
-
search
Lesson
document
-
search
Lesson reform information
search
分类号
G252.7-4 [文化科学—图书馆学]
在线阅读
下载PDF
职称材料
题名
中文Web文档聚类算法研究
被引量:
3
17
作者
林庆
袁晓峰
吴旻
机构
南京理工大学计算机科学与技术学院
江苏大学计算机科学与通信工程学院
出处
《计算机工程与设计》
CSCD
北大核心
2009年第20期4759-4761,共3页
文摘
在STC算法的基础上,提出一种中文Web文档聚类算法STC-I,用以对检索结果进行在线高效地聚类。STC-I中,将文档集通过去同义词、近义词、相同句子的方法对文档进行降维处理,并通过计算查询关键字与文本的相似度,对参加聚类的文本打分的方法来降低STC的时间复杂度并提高STC聚类准确率。通过对STC-I与STC、AHC、K-Means算法从聚类的准确性和时间复杂度上进行比较,结果表明,STC-I算法在聚类的准确性和时间复杂度方面都较STC、AHC和K-Means算法好。
关键词
后缀树
文本聚类
搜索引擎
STC-I
STC
Keywords
suffix-tree
document
clustering
search
engine
STC-I
STC
分类号
TP391.1 [自动化与计算机技术—计算机应用技术]
在线阅读
下载PDF
职称材料
题名
浅谈文献检索课网络化教学的设计与实现
被引量:
8
18
作者
周密
但旺
机构
宁波大学图书馆
出处
《图书馆学研究》
2002年第9期65-67,共3页
文摘
网络环境下,文献检索课的教学内容和教学方式都面临着变革和挑战。本文分析了文献检索课的现状,指出了文献检索课开展网络教学的意义,重点介绍了如何编制和实现网络化教学软件,从而构建一种新型的文献教学模式。
关键词
文献检索
网络教学
用户教育
Keywords
document search
network teaching user educating
分类号
G252.2 [文化科学—图书馆学]
在线阅读
下载PDF
职称材料
题名
专利文献的特点及其利用
被引量:
48
19
作者
王朝晖
机构
华中师范大学图书馆
出处
《现代情报》
北大核心
2008年第9期151-152,156,共3页
文摘
专利文献是重要的技术信息,世界上每年发明创造成果的90%-95%能在专利文献中查到,而且许多发明创造成果仅仅出现于专利文献中。专利以公开换取保护,因特网上有着丰富的免费专利文献,对广大用户有非常重要的价值和意义。然而,大多数信息用户对它的认识和利用还不够充分。本文详细地介绍了专利文献的特点、用途、检索方法及获取途径。
关键词
专利文献
检索方法
获取途径
Keywords
patent
document
ation
search
ing method
obtain approach
分类号
G306 [文化科学]
在线阅读
下载PDF
职称材料
题名
一种基于文档相似度的检索结果重排序方法
被引量:
9
20
作者
周博
岑荣伟
刘奕群
张敏
金奕江
马少平
机构
智能技术与系统国家重点实验室清华大学计算机科学与技术系
出处
《中文信息学报》
CSCD
北大核心
2010年第3期19-23,36,共6页
基金
国家自然科学基金资助项目(60736044
60903107)
+2 种基金
高等学校博士学科点专项科研基金资助项目(20090002120005)
973国家重点基础研究资助项目(2004CB318108)
863计划高科技资助项目(2006AA01Z141)
文摘
对相关反馈问题的研究已有近30年的历史,相关反馈也被证明可以大程度稳定地提升检索系统的性能。当前网络环境下相关反馈的应用以及用户提供反馈信息的方式已经发生了明显的变化,因此相关反馈研究又一次引起了研究界的注意。该文提出了一种基于文档相似度的搜索结果重排序方法,该方法同时利用了反馈信息中的相关文档与不相关文档。在大规模网络信息检索标准实验数据上的实验结果表明:该方法不仅可以稳定地提高系统的检索性能,并且相较于经典的查询扩展方法有着明显的优势。
关键词
计算机应用
中文信息处理
相关反馈
文档重排序
信息检索
Keywords
computer application
Chinese information processing
relevance feedback
document
re-ranking
search
engine
分类号
TP391 [自动化与计算机技术—计算机应用技术]
在线阅读
下载PDF
职称材料
题名
作者
出处
发文年
被引量
操作
1
基于改进预训练模型的裁判文书摘要生成研究
尹金鑫
尹军祖
《智能计算机与应用》
2025
0
在线阅读
下载PDF
职称材料
2
基于大模型的外文文献智能检索
张保军
《软件》
2025
2
在线阅读
下载PDF
职称材料
3
电力物资文档混合检索方法研究
葛星
柏能
《福建电脑》
2025
0
在线阅读
下载PDF
职称材料
4
基于语义排序功能实现对比文件快速筛选
陈立兵
《科技创新与生产力》
2024
0
在线阅读
下载PDF
职称材料
5
稀疏向量匹配技术在智能信息快速搜索中的运用评价
胡若云
刘鹏
张燕
金家红
赵天成
《粘接》
CAS
2024
0
在线阅读
下载PDF
职称材料
6
高校智慧材料收集系统设计与研究
刘海标
叶成权
李万益
张渝荣
《信息与电脑》
2024
0
在线阅读
下载PDF
职称材料
7
基于Softmax回归分类模型的网页搜索排序算法
党米花
《吉林大学学报(信息科学版)》
CAS
2024
2
在线阅读
下载PDF
职称材料
8
基于RDF句子的语义网文档搜索
吴鸿汉
瞿裕忠
李慧颖
《计算机研究与发展》
EI
CSCD
北大核心
2010
4
在线阅读
下载PDF
职称材料
9
科技查新流程对查新质量的影响
郝慧
胡娟
《现代情报》
CSSCI
北大核心
2015
9
在线阅读
下载PDF
职称材料
10
新时期学生信息获取和综合能力培养的研究与思考
苏丽
张萍
《现代情报》
北大核心
2005
11
在线阅读
下载PDF
职称材料
11
基于用户个性化需求的一站式信息搜索推送方法研究
姜轶岚
夏寒
金晓卿
《中国卫生资源》
北大核心
2022
6
暂未订购
12
影响查新咨询工作质量的相关因素及对策
刘莉
逄大欣
《情报科学》
CSSCI
1999
5
在线阅读
下载PDF
职称材料
13
浅谈标准文献检索
夏巨岚
翟煜男
《图书馆建设》
北大核心
2002
5
在线阅读
下载PDF
职称材料
14
一种快速的XML语义检索算法
李新叶
苑津莎
《电子学报》
EI
CAS
CSCD
北大核心
2007
6
在线阅读
下载PDF
职称材料
15
一种基于kmeans聚类算法和LDA主题模型的文本检索方法及有效性验证
刘江华
《情报科学》
CSSCI
北大核心
2017
43
原文传递
16
现代文检课教材的结构及有关问题
丛立
古今
陈茜
《图书馆学研究》
2007
3
在线阅读
下载PDF
职称材料
17
中文Web文档聚类算法研究
林庆
袁晓峰
吴旻
《计算机工程与设计》
CSCD
北大核心
2009
3
在线阅读
下载PDF
职称材料
18
浅谈文献检索课网络化教学的设计与实现
周密
但旺
《图书馆学研究》
2002
8
在线阅读
下载PDF
职称材料
19
专利文献的特点及其利用
王朝晖
《现代情报》
北大核心
2008
48
在线阅读
下载PDF
职称材料
20
一种基于文档相似度的检索结果重排序方法
周博
岑荣伟
刘奕群
张敏
金奕江
马少平
《中文信息学报》
CSCD
北大核心
2010
9
在线阅读
下载PDF
职称材料
已选择
0
条
导出题录
引用分析
参考文献
引证文献
统计分析
检索结果
已选文献
上一页
1
2
…
14
下一页
到第
页
确定
用户登录
登录
IP登录
使用帮助
返回顶部