期刊文献+
共找到22篇文章
< 1 2 >
每页显示 20 50 100
基于摘要辅助认知增强的多模态科学数据检索方法
1
作者 杨斌 吕梁 +1 位作者 吕晓雯 乔振 《数据与计算发展前沿(中英文)》 2026年第1期207-218,共12页
【目的】由于当前科技项目数据资源存在术语专业性高、知识关联复杂、检索效率低等问题,传统检索模式难以满足多模态科学数据关联检索的需求,导致已有科技项目数据资源难以实现知识共享及融合应用。【方法】针对上述问题,为推进科技资... 【目的】由于当前科技项目数据资源存在术语专业性高、知识关联复杂、检索效率低等问题,传统检索模式难以满足多模态科学数据关联检索的需求,导致已有科技项目数据资源难以实现知识共享及融合应用。【方法】针对上述问题,为推进科技资源开放共享,提出一种基于摘要辅助认知增强的多模态科学数据检索方法。首先,构建基于大模型的多模态科学数据语义表示模型,将专业领域知识与结构引导机制相结合,生成包含关键知识的结构化摘要;随后,基于结构化摘要提供的关键字、描述信息等知识,构建定向思维链多路引导的多模态科学数据检索模型,通过认知提示知识增强结合多步动态推理,实现科学数据的多维关联分析,提升科学数据领域数据资源检索性能。【结果】最后,依托某省科学数据管理系统开展实验,结果表明,该方法对比当前已有Modular RAG框架,在测试集上的准确率和Rouge-n指标分别提升4.65%和3.18%。【结论】实验结果验证了所提方法在多模态、知识关联复杂的科学数据检索的适用性。 展开更多
关键词 多模态科学数据检索 多视角语义关联 结构化摘要 认知增强 思维链多路引导
在线阅读 下载PDF
基于Ontology的科学数据共享检索体系解析 被引量:10
2
作者 李丽亚 宋扬 +1 位作者 薛中玉 李春梅 《情报理论与实践》 CSSCI 北大核心 2009年第5期81-85,共5页
本文介绍了数据共享检索系统所采用的开发平台和工具,构建了基于Ontology的数据共享检索体系,指出了该体系的主要模块以及关键技术。目前,已经初步建立了基于仪表领域本体的智能检索系统,并实现了简单的语义查询功能。
关键词 科学数据 本体 智能检索 知识管理
原文传递
英美政府数据门户网站科学数据组织与查询研究 被引量:8
3
作者 司莉 李鑫 《图书馆论坛》 CSSCI 北大核心 2014年第10期110-114,共5页
政府数据门户网站的科学数据组织与查询功能是数据高效管理和利用的基础。通过考察英美政府数据门户网站的数据资源组织的具体方法和相应的数据浏览、检索功能,分析了它们在数据组织与浏览、检索方面的特点。
关键词 科学数据组织 数据检索 数据门户
在线阅读 下载PDF
本体构建理论在林业科学数据共享中的应用研究 被引量:3
4
作者 张乃静 鞠洪波 纪平 《西北林学院学报》 CSCD 北大核心 2013年第6期151-156,共6页
随着林业科学数据共享工程的不断深入,科学家们在实际应用中积累了大量的科学数据,而这些数据并没有被充分利用。如何有效的从海量林业科学数据中快速地查询出所需要的数据,是一个亟待解决的问题。针对林业科学数据检索遇到的问题,本文... 随着林业科学数据共享工程的不断深入,科学家们在实际应用中积累了大量的科学数据,而这些数据并没有被充分利用。如何有效的从海量林业科学数据中快速地查询出所需要的数据,是一个亟待解决的问题。针对林业科学数据检索遇到的问题,本文从本体的构建理论出发,构建林业科学数据本体,对林业科学数据进行语义形式化描述,成为人和机器都可以理解的表达形式。并对基于该本体的林业科学数据检索进行了案列分析,为本体的构建为语义层次上的林业科学数据共享提供前提条件。 展开更多
关键词 语义检索 本体 林业科学数据 森林资源
在线阅读 下载PDF
我国科学数据组织与管理研究探析 被引量:4
5
作者 赵捧未 丁献峰 +2 位作者 闫淼 段娜 王艺帆 《中国科技资源导刊》 2021年第2期44-49,58,共7页
从科学数据管理政策体系建设和科学数据管理平台建设两个方面系统阐述近年来我国科学数据组织与管理过程中取得的主要成效,并对我国科学数据的平台建设、存储技术、检索技术及检索服务四个方面进行初步分析。在此基础上,从科学数据语义... 从科学数据管理政策体系建设和科学数据管理平台建设两个方面系统阐述近年来我国科学数据组织与管理过程中取得的主要成效,并对我国科学数据的平台建设、存储技术、检索技术及检索服务四个方面进行初步分析。在此基础上,从科学数据语义化组织与管理、跨平台检索技术、检索算法优化、一站式检索服务和可视化检索服务五个方面,对我国科学数据组织管理与检索领域研究提出建议。 展开更多
关键词 科学数据 科学数据管理 科学数据管理平台 科学数据检索 科学数据组织
在线阅读 下载PDF
国家农业科学数据中心站内搜索引擎技术研究 被引量:2
6
作者 王剑 周国民 +1 位作者 丘耘 王健 《中国农学通报》 CSCD 北大核心 2011年第30期270-274,共5页
为了解决原有检索技术已经不能满足国家农业科学数据中心检索需求的问题,研究了Lucene这种开源全文检索工具包的原理及使用方法,探讨了利用Lucene工具包在国家农业科学数据中心站内构建海量数据搜索引擎的方法,并在农业科学数据中心网... 为了解决原有检索技术已经不能满足国家农业科学数据中心检索需求的问题,研究了Lucene这种开源全文检索工具包的原理及使用方法,探讨了利用Lucene工具包在国家农业科学数据中心站内构建海量数据搜索引擎的方法,并在农业科学数据中心网站中选取3个有代表性的大、中、小型数据库,依照上述方法建立了基于Lucene工具包的搜索引擎,以此为基础进行不同大小数据库搜索效率对比实验,最后,将实验结果与传统的数据检索方法在相应数据库搜索时所得到的结果相比较。实验结果表明,基于Lucene的搜索引擎在检索效率上明显占优,实际应用效果也是令人满意的。 展开更多
关键词 LUCENE 搜索引擎 全文检索 国家农业科学数据中心
在线阅读 下载PDF
大数据时代下科技查新推动科研创新研究 被引量:21
7
作者 何明举 《现代情报》 CSSCI 北大核心 2016年第8期109-112,共4页
大数据的出现既为科学研究奠定了雄厚的信息资源保障,同时又为科研数据查找、分析和利用带来了巨大挑战,文章通过分析科技查新与科研创新的关系,查找目前科技查新所存在的问题,重点提出通过整合查新机构资源打造科研大数据、加强科技查... 大数据的出现既为科学研究奠定了雄厚的信息资源保障,同时又为科研数据查找、分析和利用带来了巨大挑战,文章通过分析科技查新与科研创新的关系,查找目前科技查新所存在的问题,重点提出通过整合查新机构资源打造科研大数据、加强科技查新人才队伍的建设、规范科技查新管理和健全质量控制体系等一系列措施推动科技查新工作的科学发展,进一步推动科研创新。 展开更多
关键词 大数据 科技查新 科研创新
在线阅读 下载PDF
面向医药卫生知识服务系统的学术知识图谱构建与应用研究 被引量:1
8
作者 刘燕 张潇潇 侯丽 《医学信息学杂志》 CAS 2024年第4期1-7,30,共8页
目的/意义探析知识服务系统中学术知识图谱的构建框架和方法,为开展基于科技大数据的新型知识服务提供参考。方法/过程提出面向知识服务系统的学术知识图谱构建框架及方案,以医药卫生知识服务系统为例,详细阐述构建步骤及构建过程中的... 目的/意义探析知识服务系统中学术知识图谱的构建框架和方法,为开展基于科技大数据的新型知识服务提供参考。方法/过程提出面向知识服务系统的学术知识图谱构建框架及方案,以医药卫生知识服务系统为例,详细阐述构建步骤及构建过程中的关键技术。结果/结论基于多类型科技数据资源构建的学术知识图谱有助于更好地开展学术实体的关联挖掘与知识推理,提高科技数据组织管理效率,提供更高效的知识服务。 展开更多
关键词 学术知识图谱 知识服务系统 科技数据资源 智能检索
暂未订购
基于大数据挖掘与决策分析体系下高校图书馆个性化服务的思考 被引量:2
9
作者 罗寰 《信息与电脑》 2018年第16期117-118,135,共3页
大数据时代下,数据信息的重要性不断提升,已成为国家发展的关键因素。基于大数据挖掘与决策分析体系,对高校图书馆个性化服务展开了全面思考。具体地,简单了解高校图书馆大数据挖掘与决策体系分析架构流程和建设基础,以外购电子资源使... 大数据时代下,数据信息的重要性不断提升,已成为国家发展的关键因素。基于大数据挖掘与决策分析体系,对高校图书馆个性化服务展开了全面思考。具体地,简单了解高校图书馆大数据挖掘与决策体系分析架构流程和建设基础,以外购电子资源使用率、外部声誉舆论监控、科研信息检索、大数据+微服务四个实际案例为例,进行了详细分析。 展开更多
关键词 外购电子资源使用率 外部声誉舆论监控 科研信息检索 大数据
在线阅读 下载PDF
基于深度学习的科学数据集检索方法研究 被引量:22
10
作者 罗鹏程 王继民 +3 位作者 王世奇 郭鑫 高正 赵常煜 《情报理论与实践》 CSSCI 北大核心 2022年第7期49-56,共8页
[目的/意义]为了支撑数据驱动研究范式,促进科学数据的共享与利用,提高数据仓储和发现平台中数据集检索功能的效果。[方法/过程]将科学数据集检索过程分为候选数据集检索和候选数据集重排序两个主要阶段:在第一阶段,将BM25模型与基于Sim... [目的/意义]为了支撑数据驱动研究范式,促进科学数据的共享与利用,提高数据仓储和发现平台中数据集检索功能的效果。[方法/过程]将科学数据集检索过程分为候选数据集检索和候选数据集重排序两个主要阶段:在第一阶段,将BM25模型与基于SimCSE的稠密检索模型结合,获取潜在的相关数据集;在第二阶段,基于BERT排序模型对候选数据集的相关性进行评分,据此优化检索结果排序。[结果/结论]从国内外13个人文社科相关的科学数据仓储平台采集约10万数据集的元数据进行检索实验和效果评价,结果表明:提出的检索模型效果最优,其NDCG@10的得分分别高于基准的向量空间和BM25模型23.6和11.7个百分点;对各模型检索结果分析发现,该模型相比基准模型具有更强的语义检索能力;此外,还对模型权重设置进行分析,可为实践应用中的参数设置提供参考。[局限]仅在英文人文社科数据集上进行模型效果验证。 展开更多
关键词 信息检索 数据集搜索 科学数据 神经网络 学习排序 BERT SimCSE
原文传递
科技资料检索系统的设计及实现
11
作者 张二峰 王晓鹏 《开封大学学报》 2000年第1期25-28,共4页
利用FoxproforWindow开发了科技资料检索系统。该系统采用数据库技术 ,完成对过刊资料的输入、检索及维护等工作 。
关键词 数据库 科技资料检索系统 输入 设计 过刊资料
在线阅读 下载PDF
开放科学数据集的统一发现平台研究进展 被引量:10
12
作者 罗鹏程 王继民 聂磊 《情报学报》 CSSCI CSCD 北大核心 2022年第6期637-650,共14页
在开放科学环境下,科学数据的复用受到重视。为了方便研究人员查找科学数据,面向科学数据集的统一发现平台陆续推出,相关数据集检索方法受到研究者的广泛关注。本文对国内外开放科学数据集的统一发现平台相关的研究与应用实践进行广泛调... 在开放科学环境下,科学数据的复用受到重视。为了方便研究人员查找科学数据,面向科学数据集的统一发现平台陆续推出,相关数据集检索方法受到研究者的广泛关注。本文对国内外开放科学数据集的统一发现平台相关的研究与应用实践进行广泛调研,从数据集采集、组织、检索、综合排序四个方面,全面梳理、总结国内外研究进展,并分析未来发展方向。具体地,对数据集采集方法、多源元数据融合方法、元数据质量分析、元数据信息丰富方法、检索匹配中查询扩展和排序方法,以及相关性判据与综合排序方法进行详细介绍和深入分析,以期为进一步的研究和应用实践提供参考。 展开更多
关键词 科学数据 研究数据 数据集发现 数据集搜索 数据集检索
在线阅读 下载PDF
大数据时代医学生科研能力的培养
13
作者 范冀 任丽 《中医眼耳鼻喉杂志》 2024年第4期240-241,共2页
随着科技高速发展,文献信息资源爆炸性增长和多样化,文献资源不再局限于纸质形式,还包括电子书籍、在线数据库、开放获取期刊等,通过对大数据检索工具、检索途径等方面进行叙述,利用文献检索海量大数据来挖掘和使用文献中的最新信息和案... 随着科技高速发展,文献信息资源爆炸性增长和多样化,文献资源不再局限于纸质形式,还包括电子书籍、在线数据库、开放获取期刊等,通过对大数据检索工具、检索途径等方面进行叙述,利用文献检索海量大数据来挖掘和使用文献中的最新信息和案例,为学术研究和知识发现提供强大的支持,让学生了解学习相关政策、法律法规,具备数据高效查询、理解分析和应用能力,激发学生创新思维和解决问题能力,探索新的研究领域,从而提升医学生的科研能力。 展开更多
关键词 大数据 文献检索 数据库 科研能力
在线阅读 下载PDF
基于LSI的日地空间领域科学数据语义检索模型 被引量:5
14
作者 刘春蔚 邹自明 佟继周 《中国科学院大学学报(中英文)》 CSCD 北大核心 2016年第5期711-719,共9页
日地空间系统科学的数据具有体量大、种类多、结构复杂的特征,不同概念、不同事件之间的相互关联为该领域内的科学数据检索提出了很高的要求.然而目前该领域内依然以基于传统的关键词检索技术为主,严重影响检索结果的质量.提出一种数据... 日地空间系统科学的数据具有体量大、种类多、结构复杂的特征,不同概念、不同事件之间的相互关联为该领域内的科学数据检索提出了很高的要求.然而目前该领域内依然以基于传统的关键词检索技术为主,严重影响检索结果的质量.提出一种数据语义检索模型,它是在对日地空间学科元信息提取的基础上,使用文本处理的方法将提取信息转换为词项-文档矩阵,进一步使用潜在语义索引技术对其进行分析,计算出检索条目与不同数据集的语义相关度,从而根据语义相关度向用户推荐科学数据.实验对比表明,该模型的召回率明显优于传统方法,且具有很高的准确率.该模型同时支持对科学数据进行语义标注和关键词提取,亦可用于其他领域科学数据检索. 展开更多
关键词 日地空间 科学数据 语义检索 浅层语义索引 元数据
在线阅读 下载PDF
分布式检索在异构科技信息资源中的应用及优化 被引量:5
15
作者 李城 童彬 +4 位作者 刘应波 邬平 王锋 文若瑾 陈亚杰 《计算机应用与软件》 2017年第10期78-84,156,共8页
为解决使用传统集中式检索处理海量异构科技信息资源时存在单点故障、性能低、不易扩展等问题,提出一种在异构科技资源下应用的分布式高性能检索系统(DHRS),并对其核心技术进行重点研究和分析。针对检索结果资源访问开销大的问题,给出... 为解决使用传统集中式检索处理海量异构科技信息资源时存在单点故障、性能低、不易扩展等问题,提出一种在异构科技资源下应用的分布式高性能检索系统(DHRS),并对其核心技术进行重点研究和分析。针对检索结果资源访问开销大的问题,给出基于访问代价的评估算法。并结合实际应用场景对算法进行优化,优化后请求数减少了80%,实验环境下的性能平均提高了68%。同时通过真实数据集的测试,验证了DHRS检索海量科技资源的可行性,能够适用于对检索和扩展性能要求较高的场景。 展开更多
关键词 科技资源 分布式检索 海量数据 ElasticSearch 异构资源
在线阅读 下载PDF
面向创新的科技情报智能化服务系统构建——以陕西省科技情报一体化服务平台为例 被引量:7
16
作者 辛一 李鹏 +2 位作者 杨阳 殷春连 矫锐 《计算机技术与发展》 2022年第9期180-187,共8页
创新驱动战略的实施以及网络信息技术的迭代演化催生科技情报工作持续向数据化、流程化、系统化、智能化方向发展,构建以大数据、云计算以及移动互联网等信息技术为支撑的科技情报服务系统成为创新科技情报服务模式、提升科技情报服务... 创新驱动战略的实施以及网络信息技术的迭代演化催生科技情报工作持续向数据化、流程化、系统化、智能化方向发展,构建以大数据、云计算以及移动互联网等信息技术为支撑的科技情报服务系统成为创新科技情报服务模式、提升科技情报服务效能的重要方式。该文以陕西省科技情报一体化平台为例,从框架设计整合、业务流程再造、系统功能优化以及关键技术支撑四个维度出发,构建了一个以专业数据资源为基础,以数据检索分析挖掘技术为手段,以业务流程为依托,以面向创新的科技情报产品为输出的智能化平台。着重叙述了基于互联网的服务流程设计、异构数据的统一表示、海量数据检索技术、新一代情报分发技术以及情报挖掘技术在平台的应用。提出科技情报服务未来将不断地向着规范化、网络化、智能化的发展,从海量数据中更为全面、精准、快速的聚合资源,对数据进行高效、精准、深入的分析解读仍是科技情报服务系统优化改进的方向。建议平台在特色数据资源的集成、对不同情报分析工具的集成和综合运用、不同层次科技情报服务产品开发、移动端优化等方面继续提升改造,以期为其他科技情报智能化系统的研发应用提供借鉴。 展开更多
关键词 科技情报 智能化 一体化 服务平台 服务系统 大数据 数据检索 数据挖掘
在线阅读 下载PDF
论图书资料工作对高校科研活动的支持 被引量:1
17
作者 宋立新 《内蒙古财经学院学报(综合版)》 2003年第3期93-94,共2页
知识经济时代,高校科研对国家有着特别重要的意义,而高校教师是国家科研的主力军。高校图书资料工作应对高校科研活动提供有力的支持:提供一流的图书资料条件;提供优良的文献检索及其他相关服务;提供一流的专业队伍;提高信息资料的实效... 知识经济时代,高校科研对国家有着特别重要的意义,而高校教师是国家科研的主力军。高校图书资料工作应对高校科研活动提供有力的支持:提供一流的图书资料条件;提供优良的文献检索及其他相关服务;提供一流的专业队伍;提高信息资料的实效和系统性。 展开更多
关键词 图书资料工作 高校科研活动 知识经济 资料检索 时效性 系统性
在线阅读 下载PDF
基于粒子群算法的科技创新数据检索系统设计 被引量:2
18
作者 马芳平 李林 +2 位作者 郭金婷 柳玉兰 徐镭梦 《电子设计工程》 2023年第15期66-69,74,共5页
当前使用的深度学习驱动、基于哈希算法的数据检索方式,容易受到原始数据集冗余信息和噪声影响,存在检索查准率和查全率不高的问题,因此提出了基于粒子群算法的科技创新数据检索系统设计。使用检索引擎构建索引库群,设计检索数据存储模... 当前使用的深度学习驱动、基于哈希算法的数据检索方式,容易受到原始数据集冗余信息和噪声影响,存在检索查准率和查全率不高的问题,因此提出了基于粒子群算法的科技创新数据检索系统设计。使用检索引擎构建索引库群,设计检索数据存储模块、关联导航模块、数据分词流程。利用粒子群算法求解分词最短路径,根据数据分词处理结果,获取查询关键词对应的查询分词向量,完成数据检索,以此作为分词结果,避免系统检索受到原始数据集冗余信息和噪声影响。由实验结果可知,该系统查准率最高为96%,查全率最高为97%,具有高效检索效果。 展开更多
关键词 粒子群算法 科技创新数据 检索 查准率 查全率
在线阅读 下载PDF
A Systematic Approach for Hydrological Model Couplings
19
作者 Daniel Salas Xu Liang Yao Liang 《International Journal of Communications, Network and System Sciences》 2012年第6期343-352,共10页
It is of great importance to develop a systematic framework to integrate and coordinate software components to effectively and efficiently accomplish complex hydrological modeling tasks. In this paper, we examine the ... It is of great importance to develop a systematic framework to integrate and coordinate software components to effectively and efficiently accomplish complex hydrological modeling tasks. In this paper, we examine the state-of-art information technologies including service-oriented architecture, and propose a systematic approach based on service-oriented architecture and scientific workflow to investigate the general model coupling problems. A prototype system, MoteWS, based on web services for publishing field measurement data from wireless sensor networks is developed to preliminarily explore and test our proposed architecture. Results and lessons learned are discussed and future recommendations in this direction are provided. 展开更多
关键词 SERVICE-ORIENTED Architecture scientific WORKFLOW Web SERVICES Wireless Sensor Network data retrieval
在线阅读 下载PDF
基于迁移学习的化学键能数据自动抽取 被引量:1
20
作者 庞娜 袁钺 薛秋红 《现代情报》 CSSCI 2023年第1期19-28,共10页
[目的/意义]在计算化学中,化学键能是重要的化学领域科学数据,目前化学键能数据抽取工作主要是由领域专家手动抽取,效率低下,大多数化学键能科学数据被湮没于海量文献中,无益于深入的、创新的科学数据分析。[方法/过程]为了解决该问题,... [目的/意义]在计算化学中,化学键能是重要的化学领域科学数据,目前化学键能数据抽取工作主要是由领域专家手动抽取,效率低下,大多数化学键能科学数据被湮没于海量文献中,无益于深入的、创新的科学数据分析。[方法/过程]为了解决该问题,本研究以ChemBE化学键能语料为实验对象,设计在较少专家支持的情况下,使用迁移学习的方法在化学论文中自动抽取与化学键能相关的科学数据。本文提出了一种端到端的BERT-CRF模型,通过构建领域高频子词的方法来解决大量未登录词的问题,并在后续深度学习模型的训练中,将构建好的领域高频子词作为领域特征输入到深度学习模型中,实现了对论文中的化学键能科学数据自动、高效地抽取。[结果/结论]实验表明,端到端的BERT-CRF模型与需要专家构建规则的基线模型相比,取得了理想的实验结果,F1值达到了88.56%。本文通过构建领域高频子词来解决大量未登录词的问题,降低了对领域专家的要求,可以较为容易地、低成本地迁移到其他领域。本文的研究结果是情报分析技术在化学领域的实践,为化学键能的智能知识检索提供了重要支撑。 展开更多
关键词 迁移学习 化学键能 深度学习 自动抽取 智能知识检索 领域高频子词 联合抽取模型 科学数据 文本挖掘
在线阅读 下载PDF
上一页 1 2 下一页 到第
使用帮助 返回顶部