期刊文献+
共找到374篇文章
< 1 2 19 >
每页显示 20 50 100
Metadata Extended Model Based On Geological Domain Ontology
1
作者 Ying HUANG Mingqiang GUO +1 位作者 Xiangang LUO Zhong XIE 《Journal of Geographic Information System》 2009年第1期12-16,共5页
The current metadata modeling techniques can not meet the needs of knowledge conception expression, knowledge organization, and metadata semantic consistency in geological domain. This paper introduces ontology and in... The current metadata modeling techniques can not meet the needs of knowledge conception expression, knowledge organization, and metadata semantic consistency in geological domain. This paper introduces ontology and integrates this theory to geological domain metadata modeling. It adopts the first order logic equivalent algorithm and defines the metadata extended model as a quaternion group which is consists of geological term set, geological term definition set, attribute definition set and instance set. It also provides the formal description of each set. Finally the five steps for building geological domain metadata extended model are given. The result presents that this model not only provides the content standards for geological domain knowledge representation and knowledge organization, but also provides the basis for geological domain multi-source data and historical data integration and application in semantic consistency. 展开更多
关键词 ONTOLOGY GEOLOGICAL DOMAIN ONTOLOGY metadata metadata EXTENDED model
在线阅读 下载PDF
基于数字对象架构的能源数据互联关键技术
2
作者 沈亮 余晗 +4 位作者 郭经 李井泉 张肖杰 刘冉 姜海鸥 《福建师范大学学报(自然科学版)》 北大核心 2026年第2期54-64,共11页
数字对象架构(digital object architecture,DOA)通过将能源数据封装为数字对象实现对数据的标准化抽象和描述,为能源数据跨领域互联共享提供新的解决思路。基于DOA的能源数据互联框架和关键技术,提出了能源数据互联框架和面向互联的能... 数字对象架构(digital object architecture,DOA)通过将能源数据封装为数字对象实现对数据的标准化抽象和描述,为能源数据跨领域互联共享提供新的解决思路。基于DOA的能源数据互联框架和关键技术,提出了能源数据互联框架和面向互联的能源数据模型,有助于跨领域能源数据综合分析利用。探索了面向能源数据互联的能源元数据模型,形成了能源元数据自动化提取技术。经实验证明,与基础模型和主流通用模型对比,微调大模型在能源元数据提取任务上的性能明显提升,为能源数据的跨领域共享与利用提供了基础,有助于推动能源领域的数字化转型的深入发展。 展开更多
关键词 能源数据互联 数字对象架构 元数据自动提取 能源元数据模型 数据跨域共享
在线阅读 下载PDF
基于多模态大模型的特藏资源智能著录新模式研究
3
作者 施泽昊 张雨卉 王萍 《信息与管理研究》 2026年第1期52-63,共12页
本文旨在应对数字时代图书馆特藏资源普遍存在的“隐藏馆藏”困境,即大量珍贵文献因未被充分著录而无法为学界所用。传统人工著录效率低下,而光学字符识别(OCR)技术在处理版式复杂、字体多样的历史文献时存在根本性局限。为突破此瓶颈,... 本文旨在应对数字时代图书馆特藏资源普遍存在的“隐藏馆藏”困境,即大量珍贵文献因未被充分著录而无法为学界所用。传统人工著录效率低下,而光学字符识别(OCR)技术在处理版式复杂、字体多样的历史文献时存在根本性局限。为突破此瓶颈,本研究构建并验证了一种基于多模态大模型(MLLM)的智能著录新模式,其核心是一个集成了视觉语言模型(VLM)、大语言模型(LLM)与人机协同的“VLM+LLM+HITL”工作流。以版式极为复杂的戏单为实证案例,本研究从效率、准确率、成本效益与用户体验四个维度进行了全面的量化评估。实验结果表明,该模式可将单份文献的平均处理时间从1小时缩短至20分钟,效率提升66.7%;在AI初始准确率达75%的基础上,通过人机协同可实现近乎100%的最终准确率。成本效益分析显示,该模式的效益成本比高达2.78。此外,面向专业编目员的用户体验评估获得了82.5分的系统可用性量表(SUS)高分。本研究的核心贡献在于:技术上,验证了VLM在复杂文档智能处理上的优越性;方法上,提出了一个包含错误类型分析、成本效益与用户体验的多维评估框架;实践上,为解决“隐藏馆藏”问题、活化海量特藏资源提供了一套经过验证、具备经济可行性与良好用户接纳度的可扩展解决方案,为国家文化遗产数字化战略的深度实施提供了关键的技术与方法论支撑。 展开更多
关键词 数字人文 智能著录 特藏资源活化 多模态大模型 人机协同 元数据加工 成本效益分析 隐藏馆藏
在线阅读 下载PDF
多模态模型协作下GLAM馆藏图像元数据的自动生成研究
4
作者 严承希 孙志晗 +2 位作者 李佳怡 华建光 杨建梁 《情报理论与实践》 北大核心 2026年第3期189-198,共10页
[目的/意义]考虑GLAM机构面临馆藏图像元数据缺乏数据标注且人工标注困难的问题,结合当前预训练小模型与大语言模型在馆藏图像元数据自动标注方面研究的不足,提出一种基于模型协作的GLAM馆藏图像元数据自动生成方法MCM。[方法/过程]从... [目的/意义]考虑GLAM机构面临馆藏图像元数据缺乏数据标注且人工标注困难的问题,结合当前预训练小模型与大语言模型在馆藏图像元数据自动标注方面研究的不足,提出一种基于模型协作的GLAM馆藏图像元数据自动生成方法MCM。[方法/过程]从馆藏的多模态特性出发,MCM综合考虑MPSM、MLLM两类模型的互补性优势,通过“领域探测”与“可靠校对”两个阶段的有效整合,实现馆藏图像元数据的高效自动生成。以GLAM绘画资源的“图像朝代分类”与“图像文本描述”为任务进行多组实验评估与案例分析,从而检验MCM方法的有效性与算法优势,并阐释了其方法与应用方面的价值。[结果/结论]提出的MCM与其他基线模型(包括多模态大语言模型、多模态预训练小模型及已有的先进模型协作方法)相比,具有更加优异的综合性能。此外,补充实验还围绕测试数据集大小、上下文示例个数等进行了参数稳健性评估,有效地验证了MCM方法的健壮性优势。MCM模型的提出将有利于进一步推进多模态模型协作技术在GLAM馆藏图像元数据生成领域的方法拓展与应用实践。 展开更多
关键词 多模态大语言模型 多模态预训练小模型 模型协作 GLAM馆藏图像 元数据自动生成
原文传递
角色建模工具RModeler的设计与实现
5
作者 文斌 毛晓光 《计算机应用研究》 CSCD 北大核心 2008年第4期1257-1260,共4页
提倡在对象技术中基于角色识别对象及其协调关系,然后展开到类模型、接口模型、实体模型,同时对角色模型的形式化定义和表示方法进行了系统地研究,并在此基础上设计和实现了基于RML的可视化角色建模工具RModeler。RModeler目前完成了代... 提倡在对象技术中基于角色识别对象及其协调关系,然后展开到类模型、接口模型、实体模型,同时对角色模型的形式化定义和表示方法进行了系统地研究,并在此基础上设计和实现了基于RML的可视化角色建模工具RModeler。RModeler目前完成了代码实现和测试工作,并在实际开发中使用,运行良好。RModeler支持业务过程中采用RML语言的建模,具备将RML模型转换为UML模型的功能,采用业界标准数据描述格式XMI来传递和共享建模信息。 展开更多
关键词 角色 角色模型 角色建模语言 软件工具 扩展元数据交换
在线阅读 下载PDF
Requirement-driven remote sensing metadata planning and online acquisition method for large-scale heterogeneous data 被引量:1
6
作者 Shuang Wang Guoqing Li +1 位作者 Wenyang Yu Yue Ma 《Geo-Spatial Information Science》 SCIE EI CSCD 2022年第2期169-181,共13页
Remote sensing data acquisition is one of the most essential processes in the field of Earth observation.However,traditional methods to acquire data do not satisfy the requirements of current applications because larg... Remote sensing data acquisition is one of the most essential processes in the field of Earth observation.However,traditional methods to acquire data do not satisfy the requirements of current applications because large-scale data processing is required.To address this issue,this paper proposes a data acquisition framework that carries out remote sensing metadata planning and then realizes the online acquisition of large amounts of data.Firstly,this paper establishes a unified metadata cataloging model and realizes the catalog of metadata in a local database.Secondly,a coverage calculation model is presented,which can show users the data coverage information in a selected geographical region under the data requirements of a specific application.Finally,according to the data retrieval results and the coverage calcula-tion,a machine-to-machine interface is provided to acquire target remote sensing data.Experiments were conducted to verify the availability and practicality of the proposed frame-work,and the results show the strengths and powerful capabilities of our framework by overcoming deficiencies in traditional methods.It also achieved the online automatic acquisi-tion of large-scale heterogeneous remote sensing data,which can provide guidance for remote sensing data acquisition strategies. 展开更多
关键词 Online data acquisition remote sensing metadata planning metadata cataloging model coverage calculation machine-to-machine interface
原文传递
面向智能化元数据生产的智慧编目框架研究
7
作者 张雨卉 刘炜 +2 位作者 张磊 周纲 施泽昊 《信息与管理研究》 2026年第1期38-51,共14页
传统人工编目模式在信息资源规模与类型的爆炸式增长下面临可持续性瓶颈,成为图书馆知识服务的关键制约。生成式人工智能虽为自动化元数据生产提供了技术契机,但现有探索普遍存在流程嵌入不足、质量控制困难、跨类型文献适应性弱等问题... 传统人工编目模式在信息资源规模与类型的爆炸式增长下面临可持续性瓶颈,成为图书馆知识服务的关键制约。生成式人工智能虽为自动化元数据生产提供了技术契机,但现有探索普遍存在流程嵌入不足、质量控制困难、跨类型文献适应性弱等问题。为系统性解决上述挑战,本文构建了一个面向多类型文献的整体性智慧编目框架,将当前零散的AI编目探索纳入一个可扩展、可实施的体系之中,为图书馆系统性引入大模型提供了结构化的方法基础。本框架不仅在技术上提出了适应各种不同类型文献的方案,也针对传统编目规则在人工智能背景下的适配性难题,提出了MAC与OAC双路径机制,解决了AI技术与编目规范之间的结构性冲突。最终,本文通过特藏文献戏单与普通文献图书两个层次的案例,证实了该框架的有效性与可扩展性,为实现AI驱动的高质量元数据生产提供了理论依据与实践范式。 展开更多
关键词 智慧编目 元数据生产 生成式人工智能 大语言模型 人机协同 MAC/OAC机制 流程嵌入
在线阅读 下载PDF
An Ontological Approach to Intelligence Gathering Using Semantic Metadata 被引量:1
8
作者 Tameem Chowdhury StilianosVidalis Christopher Tubb 《通讯和计算机(中英文版)》 2013年第9期1166-1174,共9页
关键词 语义元数据 情报收集 本体论 知识发现 信息收集 智能理论 基础 设计
在线阅读 下载PDF
Research on the Adaptive Object-Model Architecture Style
9
作者 姚海琼 倪桂强 《Journal of Electronic Science and Technology of China》 2004年第4期16-20,共5页
The rapidly changing requirements and business rules stimulate software developers to make their applications more dynamic, configurable, and adaptable. An effective way to meet such requirements is to apply an adapti... The rapidly changing requirements and business rules stimulate software developers to make their applications more dynamic, configurable, and adaptable. An effective way to meet such requirements is to apply an adaptive object-model (AOM). The AOM architecture style is composed of metamodel, model engine and tools. Firstly, two small patterns for building up metamodel are analyzed in detail. Then model engine for interpreting metamodel and tools for end-uses to define and configure object models are discussed. Finally, a novel platform—applicationware—is proposed. 展开更多
关键词 adaptive object-model metadata METAmodel PATTERNS applicationware
在线阅读 下载PDF
Design and Implementation of Two-Level Metadata Server in Small-Scale Cluster File System
10
作者 LIU Yuling YU Hongfen SONG Weiwei 《Wuhan University Journal of Natural Sciences》 CAS 2006年第6期1939-1942,共4页
The reliability and high performance of metadata service is crucial to the store architecture. A novel design of a two-level metadata server file system (TTMFS) is presented, which behaves high reliability and perfo... The reliability and high performance of metadata service is crucial to the store architecture. A novel design of a two-level metadata server file system (TTMFS) is presented, which behaves high reliability and performance. The merits both centralized management and distributed management are considered simultaneously in our design. In this file system, the advanced-metadata server is responsible for manage directory metadata and the whole namespace. The double-metadata server is responsible for maintaining file metadata. And this paper uses the Markov return model to analyze the reliability of the two-level metadata server. The experiment data indicates that the design can provide high throughput. 展开更多
关键词 reliability two-level metadata server Markov return model failover
在线阅读 下载PDF
AI模型元数据规范发展现状与构建研究 被引量:1
11
作者 姜恩波 秦瑜 《农业图书情报学报》 2025年第10期4-21,共18页
[目的/意义]本研究旨在回应当前人工智能模型不透明性、难以解释、可追溯性差等问题,提出建立统一的AI模型元数据规范,以提升模型的可发现性、透明度、互操作性和可重用性,进而推动可信任AI的发展。[方法/过程]文章以元数据质量评估理... [目的/意义]本研究旨在回应当前人工智能模型不透明性、难以解释、可追溯性差等问题,提出建立统一的AI模型元数据规范,以提升模型的可发现性、透明度、互操作性和可重用性,进而推动可信任AI的发展。[方法/过程]文章以元数据质量评估理论和生命周期理论为基础,采用文献调研法、比较分析、问卷调查等方法,系统梳理和分析国内外已有的AI模型元数据实践,深入调查用户对元数据的认知与需求,并提出面向全生命周期的元数据构建方案。[结果/结论]用户认为AI模型元数据规范重要但对现有规范并不了解。现有AI模型元数据规范在元素命名、组织架构、内容细粒度解释等方面存在明显短板,影响模型信息的共享与复用。为此,文章提出了一个元数据框架,涵盖模型、数据、算法、技术特征、性能评估、风险与伦理、法律信息、相关资源等核心实体,并描述其间语义关系。研究认为,建立统一的AI模型元数据框架不仅有助于模型的信息化管理和平台互联互通,也将成为连接技术、伦理与治理的重要基础设施。未来,随着规范体系的不断完善与行业采纳,AI模型将更具可控性与可信赖性,推动技术生态的规范发展与跨界融合。 展开更多
关键词 AI模型 模型透明度 元数据规范 人工智能
在线阅读 下载PDF
A Novel Cross-Media Layered Semantic Mining Model 被引量:1
12
作者 ZENG Cheng CAO Jiaheng +2 位作者 PENG Zhiyong WANG Ke WANG Hui 《Wuhan University Journal of Natural Sciences》 CAS 2008年第1期21-26,共6页
This paper presents a cross-media semantic mining model (CSMM) based on object semantic. This model obtains object-level semantic information in terms of maximum probability principle. Then semantic templates are tr... This paper presents a cross-media semantic mining model (CSMM) based on object semantic. This model obtains object-level semantic information in terms of maximum probability principle. Then semantic templates are trained and constructed with STTS (Semantic Template Training System), which are taken as the bridge to realize the transition from various low-level media feature to object semantic. Furthermore, we put forward a kind of double layers metadata structure to efficaciously store and manage mined low-level feature and high-level semantic. This model has broad application in lots of domains such as intelligent retrieval engine, medical diagnoses, multimedia design and so on. 展开更多
关键词 cross-media semantic mining model object semantic semantic template semantic template training system metadata
在线阅读 下载PDF
ScaleFS:面向大语言模型的高性能可扩展元数据设计 被引量:2
13
作者 尚碧筠 韩银俊 +3 位作者 肖蓉 陈正华 屠要峰 董振江 《计算机研究与发展》 北大核心 2025年第3期589-604,共16页
近年来,以Chat GPT为代表的大语言模型(large language model,LLM)技术发展迅速.随着模型参数规模的持续增长,构建和应用大模型对数据存储规模和存储访问效率提出了更高要求,这对传统存储系统带来了严峻挑战.首先分析了大模型在数据准... 近年来,以Chat GPT为代表的大语言模型(large language model,LLM)技术发展迅速.随着模型参数规模的持续增长,构建和应用大模型对数据存储规模和存储访问效率提出了更高要求,这对传统存储系统带来了严峻挑战.首先分析了大模型在数据准备、模型训练和推理阶段的存储访问特征,深入探讨了传统存储系统在大模型场景下面临的主要问题和瓶颈.针对这些挑战,提出并实现了一种高性能、可扩展的分布式元数据设计Scale FS.通过目录树元数据与属性元数据解耦的架构设计,并结合深度与广度均衡的目录树分层分区策略设计,Scale FS实现了高效的路径解析、负载均衡和系统扩展能力,能够高效管理千亿级文件.此外,Scale FS设计了细粒度元数据结构,优化了元数据访问模式,并构建了面向文件语义优化的元数据键值存储底座,显著提升了元数据访问效率并减少了磁盘I/O操作.实验结果表明,Scale FS的每秒操作次数(operations per second,OPS)是HDFS的1.04~7.12倍,而延迟仅为HDFS的12.67%~99.55%.在千亿级文件规模下,Scale FS的大部分操作性能优于HDFS在十亿级文件规模下的表现,展现出更高的扩展性和访问效率,能够更好地满足大模型场景对千亿级文件存储及高效访问的需求. 展开更多
关键词 大语言模型 大模型训练 存储系统 元数据管理 可扩展性
在线阅读 下载PDF
面向铁路基础设施全生命周期数据传递的通用数据模型研究 被引量:3
14
作者 刘北胜 江若飞 +1 位作者 吕向茹 李慧 《铁道标准设计》 北大核心 2025年第5期28-34,共7页
不同BIM应用程序的数据标准和数据格式不统一将大幅降低各参与方的协作效率,并且增加信息不一致的风险。针对上述问题,从数据交换模式、数据格式和数据管理平台等方面对铁路基础设施全生命周期数据传递和应用需求进行分析。借助IFC及rai... 不同BIM应用程序的数据标准和数据格式不统一将大幅降低各参与方的协作效率,并且增加信息不一致的风险。针对上述问题,从数据交换模式、数据格式和数据管理平台等方面对铁路基础设施全生命周期数据传递和应用需求进行分析。借助IFC及railML的数据交换模式,提出一种铁路基础设施全生命周期数据传递通用数据模型,对数据模型架构进行研究,明确铁路基础设施数据分类、数据结构和关联关系,规范铁路基础设施元数据描述方法,提出由元数据信息自动生成XML Schema的转换机制,制定数据模型内容扩展和校验原则,并通过语义识别的方式对元数据唯一性进行判别。依托京张高铁项目开展铁路基础设施全生命周期通用数据模型的应用验证,搭建铁路基础设施元数据管理系统,梳理铁路基础设施元数据4 000余条,生成数据传递XML Schema 63个,形成一套铁路基础设施数据传递通用模板。同时基于Schema构建铁路基础设施数据协同共享平台,实现结构化数据生成及传递。通过设计、施工阶段数字化移交,实现京张高铁基础设施全生命周期数据无损传递,推动京张高铁基础设施建维一体化管理。 展开更多
关键词 铁路基础设施 全生命周期 数据传递 通用数据模型 元数据 数据交换模式
在线阅读 下载PDF
基于自适应解析模型的分布式遥感数据归档方法研究
15
作者 汪家瑞 赵汝哲 +3 位作者 张学亮 孟祥利 李峰 郭东宁 《无线电工程》 2025年第5期1124-1132,共9页
研究并实现了一种基于自适应元数据解析模型的分布式多源异构遥感卫星数据归档入库方法。随着遥感技术的不断进步,遥感数据量急剧增加,传统的归档技术面临并行处理能力和多源异构适应性的挑战。为了解决这些问题,提出了一种新的归档技术... 研究并实现了一种基于自适应元数据解析模型的分布式多源异构遥感卫星数据归档入库方法。随着遥感技术的不断进步,遥感数据量急剧增加,传统的归档技术面临并行处理能力和多源异构适应性的挑战。为了解决这些问题,提出了一种新的归档技术,能够高效、灵活地归档处理陆地观测、海洋观测、气象观测等多源异构遥感数据。设计了一种多源异构遥感数据自适应元数据解析模型,显著降低了多源异构遥感数据组织适配的难度和软件开发维护的工作量;设计了一种分布式归档技术架构,提高了系统的稳定性和可扩展性。通过技术试验,验证了所提方法的有效性和优越性,能够达到分布式多节点、多线程遥感数据快速归档入库效果。为遥感数据的编目归档管理提供了新的技术手段,对促进遥感技术的发展和应用具有重要意义。 展开更多
关键词 遥感数据 元数据 解析模型 分布式归档入库
在线阅读 下载PDF
大气环境监测数据湖元数据模型研究
16
作者 刘坤峄 王志宝 +1 位作者 赵满 罗源 《计算机与数字工程》 2025年第8期2265-2271,共7页
为了解决现有元数据管理模型缺乏对大气环境监测数据特征的全面分析,并不能较好地对大气环境监测数据进行管理的问题。论文针对大气环境监测数据规模大、组织结构松散等特点,提出了一种专用于大气环境监测数据潮的元数据模型(AEMDLM)。... 为了解决现有元数据管理模型缺乏对大气环境监测数据特征的全面分析,并不能较好地对大气环境监测数据进行管理的问题。论文针对大气环境监测数据规模大、组织结构松散等特点,提出了一种专用于大气环境监测数据潮的元数据模型(AEMDLM)。该模型将大气环境监测元数据分成时间、空间和业务三类,分别与大气环境监测数据资源目录相连接,进行数据匹配和语义推理,通过开发大气环境监测数据湖元数据管理系统(AEMDLMS)证明模型可以有效地提高大气环境监测数据湖的组织管理能力,便于数据的检索和分析。最后对大气环境监测数据检索进一步研究进行展望。 展开更多
关键词 大气环境监测 数据湖 元数据 元数据模型
在线阅读 下载PDF
面向煤矿AI应用的多源异构数据分层分类仓储技术 被引量:1
17
作者 张智星 付翔 +4 位作者 张小强 秦一凡 黄金宇 杨宇琪 贾一帆 《工矿自动化》 北大核心 2025年第9期18-24,共7页
在煤矿智能化转型进程中,多源异构数据呈爆发式增长,但煤炭企业对这些数据的应用仍停留在可视化的初级阶段,且面临三大瓶颈:数据结构多样难以统一存储,阻碍AI应用的数据关联分析;数据质量参差不齐,导致AI模型无法直接有效分析;数据体量... 在煤矿智能化转型进程中,多源异构数据呈爆发式增长,但煤炭企业对这些数据的应用仍停留在可视化的初级阶段,且面临三大瓶颈:数据结构多样难以统一存储,阻碍AI应用的数据关联分析;数据质量参差不齐,导致AI模型无法直接有效分析;数据体量庞大,造成数据查询与分析效率低,严重制约智能应用落地。针对上述问题,提出了一种面向煤矿AI应用的多源异构数据分层分类仓储技术,该技术框架主要由Flink数据流处理服务、数据分层存储、数据分类存储、AI模型应用服务、主数据及元数据管理构成。Flink数据流处理服务是数据的核心处理单元,主要实现井下各子系统(综采、掘进、主运输、综合保障等)实时数据的脏数据清理、异常值填充、数据格式统一等处理,为后续面向煤矿AI应用的特征值快速计算及模型的有效应用提供标准数据条件。数据分层存储完成海量多源异构数据的分级编码与结构化整合后,存储到数据分类存储体系中。通过主数据及元数据管理,确保关键数据的一致性与完整性,并实现数据语义的清晰明确表达,为AI模型应用提供清晰明确的数据信息保障。测试结果表明:该技术可以实现海量多源异构数据的合理分层分类存储、不同类型数据与对应存储介质的精准匹配。煤矿现场应用结果表明:应用该技术后,工业数据平均查询延迟降低到1.1 s,数据质量合格率提高到93%,占用内存大的非结构化数据由高成本的高频存储转为低成本分布式存储。 展开更多
关键词 煤矿AI应用 多源异构数据 煤矿工业数据 数据分类存储 数据分层存储 Flink数据流处理 AI模型应用 主数据及元数据管理
在线阅读 下载PDF
农业生产大数据治理:关键技术、应用分析与发展方向 被引量:3
18
作者 郭威 吴华瑞 +1 位作者 朱华吉 王菲菲 《智慧农业(中英文)》 2025年第3期17-34,共18页
[目的/意义]本文针对农业生产数据存在获取标准不一、数据采集不全、治理机制不明的问题,对现有的农业生产大数据治理模式进行了探索,通过大数据治理关键技术、适配工具的集成与场景化创新应用,阐明面向农业生产大数据治理的数据要素价... [目的/意义]本文针对农业生产数据存在获取标准不一、数据采集不全、治理机制不明的问题,对现有的农业生产大数据治理模式进行了探索,通过大数据治理关键技术、适配工具的集成与场景化创新应用,阐明面向农业生产大数据治理的数据要素价值发挥的技术路径,为实现数据驱动农业高质量生产提供参考。[进展]从农业生产大数据治理的视角,探索了数据获取与处理、数据存储与交换、数据管理、数据分析、大模型和数据安全保障6大环节17类大数据治理技术及工具,深度研究了大数据治理技术在农业生产中的应用方式,以上技术通过数据匹配、算力匹配、网络适配、模型匹配、场景匹配、业务组配等工具和中间件在场景中得到较好应用。剖析了农业生产产前、产中、产后全链条数据治理,以及面向不同类型农业园区、科研院所和高校、生产主体与农户服务案例。介绍了在国家级产业园区、省级农业科技园区和部分单品主体的治理经验,并调研了国内外农业生产大数据治理技术、做法和工具。[结论/展望]对农业生产大数据治理未来发展方向提出了见解,包括推动农业生产大数据治理标准的制定与落地,构建农业生产大数据治理通用资源池,扩展农业生产大数据治理多元化应用场景,适应大模型及海量数据驱动下的农业生产大数据治理新范式和强化农业生产大数据安全与隐私保护。 展开更多
关键词 农业大数据 大数据治理 大数据获取与处理 元数据 数据安全保障 农业大模型
在线阅读 下载PDF
基于元数据和语义建模的地质调查业务管理统一数据模型研究
19
作者 文敏 月一 +6 位作者 刘荣梅 任伟 张怀东 王想红 施艳 赵明明 余海龙 《时空信息学报》 2025年第3期231-244,共14页
地质项目、野外安全、地质资料、经费预算等地质调查业务管理信息系统的常态化运行,产生了海量数据,来源于不同系统的数据在结构、语义等方面存在巨大差异,导致数据冗余、口径不一等诸多现象。构建统一数据模型、建立统一数据视图,是实... 地质项目、野外安全、地质资料、经费预算等地质调查业务管理信息系统的常态化运行,产生了海量数据,来源于不同系统的数据在结构、语义等方面存在巨大差异,导致数据冗余、口径不一等诸多现象。构建统一数据模型、建立统一数据视图,是实现多源异构数据有效集成辅助决策的基本问题。本文基于元数据解析和语义建模研究,提出元数据解析—语义分析—分层构建—评价演进的建模方法,建立基于统一主数据与资源标识的映射关联规则;并利用统一建模语言,构建地质调查业务管理统一数据模型,在地质调查业务管理数据中心建设中得以验证应用。研究表明,本文方法不但有效解决了多源异构地质调查业务管理数据模型融合问题,实现了跨系统、跨部门多源数据的统一描述和一体化组织,还可为包含时空数据在内的多源异构数据的模型差异问题的解决提供技术方案。 展开更多
关键词 地质调查 数据集成 统一数据模型 元数据解析 语义建模
在线阅读 下载PDF
一种索引结构优化的检索增强生成技术在保险领域的交互应用研究 被引量:1
20
作者 成翌宁 张正 +1 位作者 杨立 马肖肖 《河北省科学院学报》 2025年第1期13-20,共8页
人工智能生成式大模型的提出对保险领域的智能交互场景产生了重大影响,在赋能行业应用软件“垂域精准计算”的技术要求的同时,为辅助代理端、业务端、用户端提供积极作用。然而大型语言模型在通用任务的生成表现中虽已经取得显著的成功... 人工智能生成式大模型的提出对保险领域的智能交互场景产生了重大影响,在赋能行业应用软件“垂域精准计算”的技术要求的同时,为辅助代理端、业务端、用户端提供积极作用。然而大型语言模型在通用任务的生成表现中虽已经取得显著的成功,对于“垂域精准计算”面向的特定领域知识密集型任务的应用仍面临着重大限制,在处理问答即时响应时,常会产生“幻觉”现象,从而无法控制输出结果质量。仅依靠在场景应用中引入检索增强生成技术仍会存在等长切分导致上下文语义衔接被截断、相似性搜索内容过于发散检索精度缺失等痛点问题。本文提出了一种“检索增强优化索引结构的技术解决方法”,该方法在传统检索增强索引过程中增加了文档切分策略、针对块的关键词提取、语义对齐与分类、元数据补全四个技术模块,采用基于语义逻辑关系的切分方式,并基于改进的信息加权计算统计算法(term frequency-inverse document frequency,TF-IDF)实现切分段落的关键信息提取,结合引入保险行业领域词根表及业务标签库对关键词进行语义对齐、类别划分,最后完成元数据关键信息补全。在保险领域的交互应用验证结果表明,该方法有效缓解了定长切分导致语义缺失的问题,提升了知识索引结果的准确性。 展开更多
关键词 精准计算 人工智能大语言模型 检索增强生成技术 知识切片 元数据补全
在线阅读 下载PDF
上一页 1 2 19 下一页 到第
使用帮助 返回顶部