期刊文献+
共找到4,067篇文章
< 1 2 204 >
每页显示 20 50 100
Dynamic Metadata Prefetching and Data Placement Algorithms for High-Performance Wide-Area Applications
1
作者 Bing Wei Yubin Li +2 位作者 Yi Wu Ming Zhong Ning Luo 《Computers, Materials & Continua》 2025年第9期4773-4804,共32页
Metadata prefetching and data placement play a critical role in enhancing access performance for file systems operating over wide-area networks.However,developing effective strategies for metadata prefetching in envir... Metadata prefetching and data placement play a critical role in enhancing access performance for file systems operating over wide-area networks.However,developing effective strategies for metadata prefetching in environments with concurrent workloads and for data placement across distributed networks remains a significant challenge.This study introduces novel and efficient methodologies for metadata prefetching and data placement,leveraging fine-grained control of prefetching strategies and variable-sized data fragment writing to optimize the I/O bandwidth of distributed file systems.The proposed metadata prefetching technique employs dynamic workload analysis to identify dominant workload patterns and adaptively refines prefetching policies,thereby boosting metadata access efficiency under concurrent scenarios.Meanwhile,the data placement strategy improves write performance by storing data fragments locally within the nearest data center and transmitting only the fragment location metadata to the remote data center hosting the original file.Experimental evaluations using real-world system traces demonstrate that the proposed approaches reduce metadata access times by up to 33.5%and application data access times by 17.19%compared to state-of-the-art techniques. 展开更多
关键词 metadata prefetching data placement wide-area network file system(WANFS) concurrent workload optimization
在线阅读 下载PDF
Machine Learning Security Defense Algorithms Based on Metadata Correlation Features
2
作者 Ruchun Jia Jianwei Zhang Yi Lin 《Computers, Materials & Continua》 SCIE EI 2024年第2期2391-2418,共28页
With the popularization of the Internet and the development of technology,cyber threats are increasing day by day.Threats such as malware,hacking,and data breaches have had a serious impact on cybersecurity.The networ... With the popularization of the Internet and the development of technology,cyber threats are increasing day by day.Threats such as malware,hacking,and data breaches have had a serious impact on cybersecurity.The network security environment in the era of big data presents the characteristics of large amounts of data,high diversity,and high real-time requirements.Traditional security defense methods and tools have been unable to cope with the complex and changing network security threats.This paper proposes a machine-learning security defense algorithm based on metadata association features.Emphasize control over unauthorized users through privacy,integrity,and availability.The user model is established and the mapping between the user model and the metadata of the data source is generated.By analyzing the user model and its corresponding mapping relationship,the query of the user model can be decomposed into the query of various heterogeneous data sources,and the integration of heterogeneous data sources based on the metadata association characteristics can be realized.Define and classify customer information,automatically identify and perceive sensitive data,build a behavior audit and analysis platform,analyze user behavior trajectories,and complete the construction of a machine learning customer information security defense system.The experimental results show that when the data volume is 5×103 bit,the data storage integrity of the proposed method is 92%.The data accuracy is 98%,and the success rate of data intrusion is only 2.6%.It can be concluded that the data storage method in this paper is safe,the data accuracy is always at a high level,and the data disaster recovery performance is good.This method can effectively resist data intrusion and has high air traffic control security.It can not only detect all viruses in user data storage,but also realize integrated virus processing,and further optimize the security defense effect of user big data. 展开更多
关键词 Data-oriented architecture metadata correlation features machine learning security defense data source integration
在线阅读 下载PDF
Research and application of key technologies for data delivery in railway engineering design based on metadata
3
作者 Xiangru Lyu Xunxiao Yin +1 位作者 Kun Wang Yongwen Wei 《High-Speed Railway》 2024年第1期51-56,共6页
In view of the problems of inconsistent data semantics,inconsistent data formats,and difficult data quality assurance between the railway engineering design phase and the construction and operation phase,as well as th... In view of the problems of inconsistent data semantics,inconsistent data formats,and difficult data quality assurance between the railway engineering design phase and the construction and operation phase,as well as the difficulty in fully realizing the value of design results,this paper proposes a design and implementation scheme for a railway engineering collaborative design platform.The railway engineering collaborative design platform mainly includes functional modules such as metadata management,design collaboration,design delivery management,model component library,model rendering services,and Building Information Modeling(BIM)application services.Based on this,research is conducted on multi-disciplinary parameterized collaborative design technology for railway engineering,infrastructure data management and delivery technology,and design multi-source data fusion and application technology.The railway engineering collaborative design platform is compared with other railway design software to further validate its advantages and advanced features.The platform has been widely applied in multiple railway construction projects,greatly improving the design and project management efficiency. 展开更多
关键词 Railway engineering metadata Data delivery Collaborative designplatform Design results BIM services
在线阅读 下载PDF
淋巴瘤临床研究数据标准的建设与应用
4
作者 米岚 谢彦 +3 位作者 侯艳 王维玉 朱军 宋玉琴 《中国新药杂志》 北大核心 2025年第9期953-960,共8页
目的:恶性肿瘤对人民生命健康构成严重威胁,抗肿瘤新药的研发势头迅猛。为确保临床试验数据质量及其有利于跨适应证审评和多研究合并分析,制定统一的数据标准至关重要。本研究立足于我国临床研究的现实问题,以淋巴瘤为疾病模型,提出统... 目的:恶性肿瘤对人民生命健康构成严重威胁,抗肿瘤新药的研发势头迅猛。为确保临床试验数据质量及其有利于跨适应证审评和多研究合并分析,制定统一的数据标准至关重要。本研究立足于我国临床研究的现实问题,以淋巴瘤为疾病模型,提出统一的临床研究标准数据模型,以确保在数据采集、分析和共享等环节具备统一的理念。方法:本研究深入比较了5项国际广泛使用的医学数据模型,系统梳理了各模型的优势和局限,总结了在数据模型标准应用过程中所面临的问题与机遇,并探索制定了目前我国淋巴瘤专病领域的数据标准。结果:本研究成功建立了淋巴瘤通用数据和治疗领域的14个数据集区域以及规范化描述结果,定义了每个元数据的6个属性描述,初步制定了淋巴瘤临床研究标准数据集。结论:制定专病领域的临床数据标准有助于确保数据质量基准,便于进行数据分析和汇总以及多研究数据间的比较,从而满足临床、科研和运营管理等领域对数据分析的需求,助力我国抗肿瘤新药临床研究生态建设发展。 展开更多
关键词 淋巴瘤 临床研究 数据标准化 元数据
原文传递
中国学术期刊论文元数据的开放和再利用
5
作者 朱江 罗煜 周海晨 《四川图书馆学报》 2025年第1期16-25,共10页
随着中国学术期刊繁荣发展以及开放获取出版的推广,中国学术期刊论文元数据已成为重要的资源、资产甚至资本。文章阐述了元数据的概念及相关理论,分析了中国学术期刊论文元数据和全文的开放现状,结合初步完成的开放中国学术期刊论文数... 随着中国学术期刊繁荣发展以及开放获取出版的推广,中国学术期刊论文元数据已成为重要的资源、资产甚至资本。文章阐述了元数据的概念及相关理论,分析了中国学术期刊论文元数据和全文的开放现状,结合初步完成的开放中国学术期刊论文数据库项目,讨论了中文期刊论文元数据的开放、期刊官网全文的链接方法以及开放中国学术期刊论文元数据的再利用方向。 展开更多
关键词 学术期刊 期刊论文数据库 开放获取出版 元数据开放 元数据再利用
在线阅读 下载PDF
翻译史研究:从副文本到元数据
6
作者 耿强 陈秋蒙 邱思怡 《浙江大学学报(人文社会科学版)》 北大核心 2025年第7期68-80,共13页
元数据为大数据时代的翻译史研究提供了一种范式和方法,可以弥补传统的基于少量数据细读的质性研究的不足。通过采集一千多部1978—1989年来自不同丛书的外国文学翻译作品的内副文本数据,使用R语言等大数据分析工具远距离考察翻译史长... 元数据为大数据时代的翻译史研究提供了一种范式和方法,可以弥补传统的基于少量数据细读的质性研究的不足。通过采集一千多部1978—1989年来自不同丛书的外国文学翻译作品的内副文本数据,使用R语言等大数据分析工具远距离考察翻译史长时段的发展趋势,可以发现:在这一时期,外国文学译介的重点在英、美、法三国的作品,对俄苏文学的关注仍然较多,外国文学译介呈现出大众化的趋势,翻译的形式多样,最活跃的译者占译者群体的比例较低。整体来看,外国文学翻译数量在1987年之后开始下滑。元数据方法可以在翻译产品、参与者、过程和语境研究四个方面发挥不同程度的作用,有助于拓展数字时代翻译副文本研究,提高中国翻译史宏观探索的科学性。 展开更多
关键词 元数据 翻译史 副文本 远读 R语言
原文传递
基于元数据技术的国民经济核算分类编码方法研究
7
作者 贾小爱 孟国峰 郭川 《统计与决策》 北大核心 2025年第5期55-61,共7页
分类编码是国民经济核算的基础,而元数据技术则是推动国民经济核算分类编码方法创新的重要工具。文章通过系统梳理国民经济核算分类编码发展历程发现,现有国民经济核算分类编码存在系统性不足、覆盖面有限、实用性较弱等问题。因此,采... 分类编码是国民经济核算的基础,而元数据技术则是推动国民经济核算分类编码方法创新的重要工具。文章通过系统梳理国民经济核算分类编码发展历程发现,现有国民经济核算分类编码存在系统性不足、覆盖面有限、实用性较弱等问题。因此,采用面状与线状相结合的多维列举层级分面组配法优化分类结构,同时引入数字与字母混合型的编码方法,构建国民经济核算分类编码标准;在此基础上,依据元数据理论,构建了包含3个类别共28个元素的国民经济核算分类编码元数据标准,以实现分类编码的标准化信息描述与管理。 展开更多
关键词 国民经济核算 分类编码 元数据 分面组配法
在线阅读 下载PDF
基于BIBFRAME的图书馆书目关联数据管理
8
作者 阎雅娜 李艳茹 麻潇雅 《新世纪图书馆》 2025年第1期89-96,F0003,共9页
为了充分参与关联开放数据环境,美国国会图书馆研制并于2012发布了BIBFRAME模型,在以关联数据技术为基础的更广泛的网络背景下,提供一个从MARC格式过渡的路径。BIBFRAME模型自从发布以来,在图书馆社区得到积极的响应和广泛的实践,到目... 为了充分参与关联开放数据环境,美国国会图书馆研制并于2012发布了BIBFRAME模型,在以关联数据技术为基础的更广泛的网络背景下,提供一个从MARC格式过渡的路径。BIBFRAME模型自从发布以来,在图书馆社区得到积极的响应和广泛的实践,到目前为止已进入到RDF数据生产、与MARC数据转换、BIBFRAME编辑工具开发、图书馆系统开发支持的应用阶段。论文基于BIBFRAME模型的应用实践,分析图书馆如何管理书目关联数据,如何重构工作流程,如何交换重用编目数据,如何实现基于实体的资源发现,以便为我国图书馆书目向关联数据转变提供参考借鉴。 展开更多
关键词 BIBFRAME 文献编目 关联数据 元数据管理
在线阅读 下载PDF
用户需求导向的电影资源元数据元素集构建研究
9
作者 王超 魏蕊 《图书馆研究与工作》 2025年第9期48-54,60,共8页
文章综合运用网络调查法、比较分析法、访谈法和问卷调查法,对四类电影资源平台元数据方案和两项相关标准开展深入调研与对比分析,结合影响用户电影选择行为的关键因素,最终构建面向用户需求的电影资源元数据元素集,并提出元素集开放共... 文章综合运用网络调查法、比较分析法、访谈法和问卷调查法,对四类电影资源平台元数据方案和两项相关标准开展深入调研与对比分析,结合影响用户电影选择行为的关键因素,最终构建面向用户需求的电影资源元数据元素集,并提出元素集开放共享与利用的建议,旨在提升电影资源组织的效率,改善用户检索与利用体验。 展开更多
关键词 电影资源 元数据 元素集 用户需求
在线阅读 下载PDF
语义特征挖掘下图书馆文献资源自动检索方法
10
作者 李强 姜衍 《电子设计工程》 2025年第15期44-47,共4页
为精准高效检索用户需求适配的文献资源,研究语义特征挖掘下图书馆文献资源自动检索方法。构建图书馆元数据特征结构空间,挖掘出图书馆文献资源信息的语义特征与检索特征。依据文献资源检索特征运算出不同语义特征向量的距离,并由此得... 为精准高效检索用户需求适配的文献资源,研究语义特征挖掘下图书馆文献资源自动检索方法。构建图书馆元数据特征结构空间,挖掘出图书馆文献资源信息的语义特征与检索特征。依据文献资源检索特征运算出不同语义特征向量的距离,并由此得出各语义特征的相似性,筛选出检索信息内的显性关键词,实现图书馆文献资源的自动检索。结果显示,所提方法的检索适配度超95%,检索准确度高,与关键词适配度高;且检索效率佳,能完成目标数量检索。 展开更多
关键词 语义特征挖掘 图书馆 文献资源 自动检索 元数据 关键词
在线阅读 下载PDF
SCHOLIX学术关联信息交换框架研究
11
作者 常康 姜恩波 《西藏科技》 2025年第5期72-80,共9页
目的 文章旨在介绍由研究数据联盟(RDA)和世界数据系统(WDS)共同提出的基于文献与数据集关联信息的交换框架—SCHOLIX,展现在开放数据和开放科学发展的背景之下,文献与数据关联整合存在现有交换框架的碎片化、互操作障碍等痛点等具体问... 目的 文章旨在介绍由研究数据联盟(RDA)和世界数据系统(WDS)共同提出的基于文献与数据集关联信息的交换框架—SCHOLIX,展现在开放数据和开放科学发展的背景之下,文献与数据关联整合存在现有交换框架的碎片化、互操作障碍等痛点等具体问题,出版机构、数据中心和信息服务机构在推动文献与数据如何进行最佳关联整合的实践。方法 文章采用文献分析法,通过19篇文献分析了SCHOLIX的提出背景、框架体系结构、信息包元数据规范以及典型服务应用案例等。结果 SCHOLIX是一个简洁的互联网应用互操作模型。SCHOLIX可以推动各类机构对文献和数据集之间的关联信息管理和利用走向标准化,能够推动信息组织与信息服务的发展,也能够弥补当前学术交流模型中的缺口。另外,SCHOLIX在互联网信息资源建设、信息服务以及研究数据重用统计和评价上能够起到推动作用。结论 资源体系、标识体系和交换体系是SCHOLIX的核心内容。国内目前虽然还不具备大规模开展文献与数据关联信息整合与服务的资源环境,但是SCHOLIX的思路却是未来发展的方向。在“前SCHOLIX”时代,建立起技术体系是我们应该采取的措施。 展开更多
关键词 SCHOLIX 学术关联 交换框架 元数据规范 ISLI
在线阅读 下载PDF
图书馆家谱知识整合服务的思考——以国家图书馆中华寻根网为例
12
作者 魏达贤 《图书情报研究》 2025年第1期34-39,71,共7页
[目的/意义]以中华寻根网为例,分析家谱知识整合的方法、平台架构及服务方式,为图书馆家谱数据库建设提供实践参考。[方法/过程]在调研分析家谱数据库的建设现状、相关研究的基础上,首先分析中华寻根网内各类资源的整合入库方法、流程... [目的/意义]以中华寻根网为例,分析家谱知识整合的方法、平台架构及服务方式,为图书馆家谱数据库建设提供实践参考。[方法/过程]在调研分析家谱数据库的建设现状、相关研究的基础上,首先分析中华寻根网内各类资源的整合入库方法、流程及知识关联关系的建立,其次介绍了中华寻根网的平台架构,最后提出面向读者的家谱知识化服务方式。[结果/结论]中华寻根网整合了多种文献类型、多种格式、多种渠道来源的家谱相关资源,对图书馆开展家谱整合服务具有一定的借鉴意义。 展开更多
关键词 家谱数字化 知识整合 知识服务 图书馆 元数据
在线阅读 下载PDF
基于元数据的BIM实体结构分解与自动编码研究
13
作者 陈萍 《铁路技术创新》 2025年第2期50-54,共5页
针对铁路项目在设计、施工阶段模型信息交付数据语义不一致、数据格式不统一、模型传递信息利用率低等问题,通过分析工程各阶段BIM模型的编码体系,提出一种基于铁路元数据的实体结构分解及编码方案。基于Revit研发BIM模型构件自动编码... 针对铁路项目在设计、施工阶段模型信息交付数据语义不一致、数据格式不统一、模型传递信息利用率低等问题,通过分析工程各阶段BIM模型的编码体系,提出一种基于铁路元数据的实体结构分解及编码方案。基于Revit研发BIM模型构件自动编码和赋码的工具,为铁路不同专业提供统一构件自动编码入口,实现元数据编码准确赋值、不遗漏。利用现有标准和规范体系,使BIM模型与各方面数据统一元素含义和关联关系,不仅拓展了铁路元数据的应用价值,同时为深化BIM技术应用,加强BIM与业务融合提供了重要支撑。 展开更多
关键词 BIM 元数据 数据交付 数据共享 IFD标准 结构分解 编码
在线阅读 下载PDF
基于Neo4j的气象数据治理知识图谱构建与应用
14
作者 王琪 王艺 《微型电脑应用》 2025年第2期78-83,共6页
随着气象数据种类的不断丰富、数据量级大规模增长,导致气象数据治理面临环节多、流程乱、治理思路难梳理等问题。为了解决气象数据治理中“数据—信息—知识”转化的难题,提升对气象数据环境的治理能力,提出一种基于图数据库Neo4j的气... 随着气象数据种类的不断丰富、数据量级大规模增长,导致气象数据治理面临环节多、流程乱、治理思路难梳理等问题。为了解决气象数据治理中“数据—信息—知识”转化的难题,提升对气象数据环境的治理能力,提出一种基于图数据库Neo4j的气象数据治理知识图谱的构建方法。针对气象数据治理各环节业务元数据的实际情况,采用自底向上的方式构建知识概念层次模型,通过基础数据处理、标准知识表示等步骤,完成包含3705个实体、8220条关系的气象数据治理知识图谱的构建,并在天津市气象局的气象数据治理业务中进行应用。实践证明,所构建的知识图谱能够极大提升气象数据传输流程的查询分析效率,借助知识图谱的关联关系,可以快速找出流程中的冗余环节、发现业务故障影响关联,为气象数据治理提供了有效的辅助决策。 展开更多
关键词 气象数据治理 气象元数据 知识图谱 辅助决策
在线阅读 下载PDF
基于TILT、DBNet与CRNN的图书封面文字识别算法
15
作者 秦燕 《图书情报导刊》 2025年第5期27-34,共8页
从图书封面自动识别文字是获取元数据的关键,但书籍摆放角度、复杂设计及光照条件显著影响识别精度。为此,提出多阶段协同的级联框架,融合DBNet检测网络、改进的TILT姿态矫正算法与CRNN序列模型,构建“检测—矫正—再检测”闭环流程。... 从图书封面自动识别文字是获取元数据的关键,但书籍摆放角度、复杂设计及光照条件显著影响识别精度。为此,提出多阶段协同的级联框架,融合DBNet检测网络、改进的TILT姿态矫正算法与CRNN序列模型,构建“检测—矫正—再检测”闭环流程。首先通过DBNet初步定位文字区域,随后采用局部低秩优化的TILT算法对所有文字区域进行一次性几何校正,再通过DBNet二次检测精确定位文字位置,最终结合CRNN实现多语言混合文本的高效识别。双重检测机制抑制误差传播,局部低秩优化避免全局矫正对背景的敏感性,在常规与倾斜场景下均提升识别鲁棒性。实验表明,较传统OCR及主流深度学习模型,该方法在复杂图书封面场景中准确性与适应性更优,为图书馆数字化管理的文字信息提取提供有效技术路径。 展开更多
关键词 深度学习 光学字符识别 神经网络 图书馆自动化 图书元数据管理
在线阅读 下载PDF
科学技术组织机构分类及机构编码标准化研究
16
作者 许红霞 邱盼盼 王宇鹏 《中国标准化》 2025年第18期59-64,共6页
科学技术组织作为科技活动、科技资源、科技成果的主要承载体,是国家创新能力和竞争力提升的关键。为了推动科技组织数据的标准化和规范化,基于线分类法提出了科技组织分类体系,覆盖科协系统的组织机构,以及国内外其他组织机构的类别划... 科学技术组织作为科技活动、科技资源、科技成果的主要承载体,是国家创新能力和竞争力提升的关键。为了推动科技组织数据的标准化和规范化,基于线分类法提出了科技组织分类体系,覆盖科协系统的组织机构,以及国内外其他组织机构的类别划分,并且制定了科技组织机构代码的编码规则,从基本信息、管理信息和业务信息3个维度分析了科技组织的属性特征,为科技组织信息的标准化建立了一套从分类、编码到元数据定义的完整数字化框架。 展开更多
关键词 组织机构分类 科学技术组织 机构编码规则 组织元数据标准
在线阅读 下载PDF
ScaleFS:面向大语言模型的高性能可扩展元数据设计 被引量:1
17
作者 尚碧筠 韩银俊 +3 位作者 肖蓉 陈正华 屠要峰 董振江 《计算机研究与发展》 北大核心 2025年第3期589-604,共16页
近年来,以Chat GPT为代表的大语言模型(large language model,LLM)技术发展迅速.随着模型参数规模的持续增长,构建和应用大模型对数据存储规模和存储访问效率提出了更高要求,这对传统存储系统带来了严峻挑战.首先分析了大模型在数据准... 近年来,以Chat GPT为代表的大语言模型(large language model,LLM)技术发展迅速.随着模型参数规模的持续增长,构建和应用大模型对数据存储规模和存储访问效率提出了更高要求,这对传统存储系统带来了严峻挑战.首先分析了大模型在数据准备、模型训练和推理阶段的存储访问特征,深入探讨了传统存储系统在大模型场景下面临的主要问题和瓶颈.针对这些挑战,提出并实现了一种高性能、可扩展的分布式元数据设计Scale FS.通过目录树元数据与属性元数据解耦的架构设计,并结合深度与广度均衡的目录树分层分区策略设计,Scale FS实现了高效的路径解析、负载均衡和系统扩展能力,能够高效管理千亿级文件.此外,Scale FS设计了细粒度元数据结构,优化了元数据访问模式,并构建了面向文件语义优化的元数据键值存储底座,显著提升了元数据访问效率并减少了磁盘I/O操作.实验结果表明,Scale FS的每秒操作次数(operations per second,OPS)是HDFS的1.04~7.12倍,而延迟仅为HDFS的12.67%~99.55%.在千亿级文件规模下,Scale FS的大部分操作性能优于HDFS在十亿级文件规模下的表现,展现出更高的扩展性和访问效率,能够更好地满足大模型场景对千亿级文件存储及高效访问的需求. 展开更多
关键词 大语言模型 大模型训练 存储系统 元数据管理 可扩展性
在线阅读 下载PDF
船用欠稳定网络环境下“请求-响应”数据集成模式研究 被引量:2
18
作者 刘子杨 孙玲 +2 位作者 孙锋 申帅 董冠华 《中国舰船研究》 北大核心 2025年第2期131-139,共9页
[目的]在船用欠稳定网络环境下,为提高数据传输效率和减少通信费用,提出一种基于“请求-响应”模式的分布式信息集成模式。[方法]结合信息元的有效组织和管理,通过详细定义信息元的组织方法,实现元数据的高效获取和平台元数据库的创建... [目的]在船用欠稳定网络环境下,为提高数据传输效率和减少通信费用,提出一种基于“请求-响应”模式的分布式信息集成模式。[方法]结合信息元的有效组织和管理,通过详细定义信息元的组织方法,实现元数据的高效获取和平台元数据库的创建。此外,研究还涉及信息标识解析、元数据映射配置及SQL语句的动态解析编译器设计,有效处理语义异构问题,并实现不同软件系统间数据的集成。[结果]实验结果显示,与传统模式相比,基于“请求-响应”模式的数据集成方法显著降低了24 h通信量。在单项数据集成实验中,24 h通信量从原有模式的3456000 byte显著降低至3696 byte(每小时请求)和154 byte(每天请求)。对于10项数据集成,24 h通信量从原有模式的11232000 byte降低至17952和748 byte。此外,还有效降低了数据传输频次,同时保持数据信息利用的有效性,显著提高数据处理的效率和准确性。[结论]证明了基于“请求-响应”模式的分布式信息集成方法在船用欠稳定网络环境下的高效性和实用性。 展开更多
关键词 数据通信系统 分布式信息集成 元数据映射 信息标识解析 配置化思想
在线阅读 下载PDF
AI生成元数据赋能图书馆资源建设的实践与启示——基于国内外案例调查 被引量:1
19
作者 张谙宁 叶兰 +2 位作者 周文琦 张倩 张欢庆 《大学图书馆学报》 北大核心 2025年第4期90-104,共15页
分析国内外图书馆在资源建设中应用AI生成元数据的实践经验,为国内图书馆提升AI应用能力和资源建设水平提供参考。通过调研国内外20个实践案例,围绕实施主体、资源对象、应用技术、应用场景和赋能成效总结实践现状和经验。研究从两个方... 分析国内外图书馆在资源建设中应用AI生成元数据的实践经验,为国内图书馆提升AI应用能力和资源建设水平提供参考。通过调研国内外20个实践案例,围绕实施主体、资源对象、应用技术、应用场景和赋能成效总结实践现状和经验。研究从两个方面提出实践建议与启示:一是制定AI生成元数据的技术应用方案,包括基于大语言模型的提示词工程、基于机器学习的领域数据训练和基于知识图谱的检索增强生成;二从战略规划、质量监控和人才能力等方面保障AI生成元数据赋能成效。 展开更多
关键词 人工智能 元数据 资源建设 图书馆
在线阅读 下载PDF
面向煤矿AI应用的多源异构数据分层分类仓储技术 被引量:1
20
作者 张智星 付翔 +4 位作者 张小强 秦一凡 黄金宇 杨宇琪 贾一帆 《工矿自动化》 北大核心 2025年第9期18-24,共7页
在煤矿智能化转型进程中,多源异构数据呈爆发式增长,但煤炭企业对这些数据的应用仍停留在可视化的初级阶段,且面临三大瓶颈:数据结构多样难以统一存储,阻碍AI应用的数据关联分析;数据质量参差不齐,导致AI模型无法直接有效分析;数据体量... 在煤矿智能化转型进程中,多源异构数据呈爆发式增长,但煤炭企业对这些数据的应用仍停留在可视化的初级阶段,且面临三大瓶颈:数据结构多样难以统一存储,阻碍AI应用的数据关联分析;数据质量参差不齐,导致AI模型无法直接有效分析;数据体量庞大,造成数据查询与分析效率低,严重制约智能应用落地。针对上述问题,提出了一种面向煤矿AI应用的多源异构数据分层分类仓储技术,该技术框架主要由Flink数据流处理服务、数据分层存储、数据分类存储、AI模型应用服务、主数据及元数据管理构成。Flink数据流处理服务是数据的核心处理单元,主要实现井下各子系统(综采、掘进、主运输、综合保障等)实时数据的脏数据清理、异常值填充、数据格式统一等处理,为后续面向煤矿AI应用的特征值快速计算及模型的有效应用提供标准数据条件。数据分层存储完成海量多源异构数据的分级编码与结构化整合后,存储到数据分类存储体系中。通过主数据及元数据管理,确保关键数据的一致性与完整性,并实现数据语义的清晰明确表达,为AI模型应用提供清晰明确的数据信息保障。测试结果表明:该技术可以实现海量多源异构数据的合理分层分类存储、不同类型数据与对应存储介质的精准匹配。煤矿现场应用结果表明:应用该技术后,工业数据平均查询延迟降低到1.1 s,数据质量合格率提高到93%,占用内存大的非结构化数据由高成本的高频存储转为低成本分布式存储。 展开更多
关键词 煤矿AI应用 多源异构数据 煤矿工业数据 数据分类存储 数据分层存储 Flink数据流处理 AI模型应用 主数据及元数据管理
在线阅读 下载PDF
上一页 1 2 204 下一页 到第
使用帮助 返回顶部