期刊文献+
共找到890篇文章
< 1 2 45 >
每页显示 20 50 100
A Stable and Consistent Document Model Suitable for Asynchronous Cooperative Edition
1
作者 Maurice Tchoupé Tchendji Rodrigue D. Djeumen Marcellin T. Atemkeng 《Journal of Computer and Communications》 2017年第8期69-82,共14页
Complex structured documents can be intentionally represented as a tree structure decorated with attributes. Ignoring attributes (these are related to semantic aspects that can be treated separately from purely struct... Complex structured documents can be intentionally represented as a tree structure decorated with attributes. Ignoring attributes (these are related to semantic aspects that can be treated separately from purely structural aspects which interest us here), in the context of a cooperative edition, legal structures are characterized by a document model (an abstract grammar) and each intentional representation can be manipulated independently and eventually asynchronously by several co-authors through various editing tools that operate on its “partial replicas”. For unsynchronized edition of a partial replica, considered co-author must have a syntactic document local model that constraints him to ensure minimum consistency of local representation that handles with respect to the global model. This consistency is synonymous with the existence of one or more (global) intentional representations towards the global model, assuming the current local representation as her/their partial replica. The purpose of this paper is to present the grammatical structures which are grammars that permit not only to specify a (global) model for documents published in a cooperative manner, but also to derive automatically via a so call projection operation, consistent (local) models for each co-authors involved in the cooperative edition. We also show some properties that meet these grammatical structures. 展开更多
关键词 STRUCTURED documentS documentS models GRAMMARS Cooperative EDITION STRUCTURED EDITION Projections VIEWS Partial Replicas
在线阅读 下载PDF
Stochastic Model for Multiple Classes and Subclasses Simple Documents Processing 被引量:1
2
作者 Pierre Moukeli Mbindzoukou Arsène Roland Moukoukou Marius Massala 《Intelligent Information Management》 2021年第2期124-140,共17页
The issue of document management has been raised for a long time, especially with the appearance of office automation in the 1980s, which led to dematerialization and Electronic Document Management (EDM). In the same ... The issue of document management has been raised for a long time, especially with the appearance of office automation in the 1980s, which led to dematerialization and Electronic Document Management (EDM). In the same period, workflow management has experienced significant development, but has become more focused on the industry. However, it seems to us that document workflows have not had the same interest for the scientific community. But nowadays, the emergence and supremacy of the Internet in electronic exchanges are leading to a massive dematerialization of documents;which requires a conceptual reconsideration of the organizational framework for the processing of said documents in both public and private administrations. This problem seems open to us and deserves the interest of the scientific community. Indeed, EDM has mainly focused on the storage (referencing) and circulation of documents (traceability). It paid little attention to the overall behavior of the system in processing documents. The purpose of our researches is to model document processing systems. In the previous works, we proposed a general model and its specialization in the case of small documents (any document processed by a single person at a time during its processing life cycle), which represent 70% of documents processed by administrations, according to our study. In this contribution, we extend the model for processing small documents to the case where they are managed in a system comprising document classes organized in subclasses;which is the case for most administrations. We have thus observed that this model is a Markovian <i>M<sup>L×K</sup>/M<sup>L×K</sup>/</i>1 queues network. We have analyzed the constraints of this model and deduced certain characteristics and metrics. <span style="white-space:normal;"><i></i></span><i>In fine<span style="white-space:normal;"></span></i>, the ultimate objective of our work is to design a document workflow management system, integrating a component of global behavior prediction. 展开更多
关键词 document Processing WORKFLOW Hierarchic Chart Counting Processes Stochastic models Waiting Lines Markov Processes Priority Queues Multiple Class and Subclass Queues
在线阅读 下载PDF
基于大语言模型的北洋政府文书资源命名实体识别研究 被引量:1
3
作者 邓君 张子姝 +2 位作者 潘禹兵 叶东宇 常严予 《现代情报》 北大核心 2026年第3期44-55,共12页
[目的/意义]针对北洋政府文书资源因语言复杂性、多样性及标注数据缺乏导致的命名实体识别难题,本文提出一种适应低资源场景基于大语言模型的命名实体识别框架,为近代历史文献的结构化挖掘与知识重组提供方法支撑。[方法/过程]该框架融... [目的/意义]针对北洋政府文书资源因语言复杂性、多样性及标注数据缺乏导致的命名实体识别难题,本文提出一种适应低资源场景基于大语言模型的命名实体识别框架,为近代历史文献的结构化挖掘与知识重组提供方法支撑。[方法/过程]该框架融合检索增强生成与高效参数微调,利用Faiss向量检索构建上下文样例动态选取机制,通过LoRA策略对大语言模型进行领域知识注入。最后,在自建语料库上,系统评估深度学习基准模型与不同采样策略下的大语言模型性能。[结果/结论]结果表明,结合相似度样例选择与LoRA微调的Qwen3-4B模型效果最优,总体F1值达0.857,实现对北洋政府文书的精准实体识别,验证了大模型在低资源历史文书处理中的实用性与可扩展性。 展开更多
关键词 北洋政府文书资源 大语言模型 命名实体识别 低资源场景 检索增强生成 LoRA微调
在线阅读 下载PDF
Storyline Extraction of Document-Level Events Using Large Language Models
4
作者 Ziyang Hu Yaxiong Li 《Journal of Computer and Communications》 2024年第11期162-172,共11页
This article proposes a document-level prompt learning approach using LLMs to extract the timeline-based storyline. Through verification tests on datasets such as ESCv1.2 and Timeline17, the results show that the prom... This article proposes a document-level prompt learning approach using LLMs to extract the timeline-based storyline. Through verification tests on datasets such as ESCv1.2 and Timeline17, the results show that the prompt + one-shot learning proposed in this article works well. Meanwhile, our research findings indicate that although timeline-based storyline extraction has shown promising prospects in the practical applications of LLMs, it is still a complex natural language processing task that requires further research. 展开更多
关键词 document-Level Storyline Extraction TIMELINE Large Language models Topological Structure of Storyline Prompt Learning
在线阅读 下载PDF
大语言模型的长文档处理能力实证研究
5
作者 王树义 刘峻臣 +2 位作者 李俊洁 肖骁 翟羽佳 《图书馆论坛》 北大核心 2026年第3期112-123,共12页
大语言模型(LLMs)的长文档处理能力是其在知识密集型领域应用的关键,然而对其性能与核心瓶颈的系统性实证评估尚显不足。为此,文章构建一个多层次、跨类型的评测框架,对五款主流模型在通俗读物与学术文献两类语料上的表现进行评估;通过... 大语言模型(LLMs)的长文档处理能力是其在知识密集型领域应用的关键,然而对其性能与核心瓶颈的系统性实证评估尚显不足。为此,文章构建一个多层次、跨类型的评测框架,对五款主流模型在通俗读物与学术文献两类语料上的表现进行评估;通过段落级、章节级和全文级三个递进式难度任务,从内容提取精确性、信息覆盖完整性、引用来源存在性、引用来源正确性及引文定位精度五个维度进行测试。研究发现,当前LLMs在长文档处理中存在显著的能力不对称性:多数模型虽能精准提取局部信息,但在须整合全文信息的任务中综合性能急剧下降,其中Gemini2.5 Pro与Claude 3.7 Sonnet表现出更优的综合性能与鲁棒性;文本的规范化结构有助于提升模型局部信息处理的稳定性,但会显著影响模型引文溯源能力,且对改善其全局整合能力的作用有限。 展开更多
关键词 大语言模型 长文档处理 信息提取 实证研究
在线阅读 下载PDF
大语言模型驱动的北洋政府文书资源知识图谱构建研究
6
作者 邓君 张子姝 +2 位作者 潘禹兵 叶东宇 常严予 《现代情报》 北大核心 2026年第4期57-67,共11页
[目的/意义]针对北洋政府文书资源智慧化开发利用需求,本文探索大语言模型驱动的知识图谱构建方法,将碎片化史料转化为可计算、可关联的深层语义网络,赋能史学智能分析,并推动北洋时期历史知识的公共传播与文化遗产的活化利用。[方法/过... [目的/意义]针对北洋政府文书资源智慧化开发利用需求,本文探索大语言模型驱动的知识图谱构建方法,将碎片化史料转化为可计算、可关联的深层语义网络,赋能史学智能分析,并推动北洋时期历史知识的公共传播与文化遗产的活化利用。[方法/过程]本研究提出大语言模型驱动的北洋政府文书资源知识图谱构建框架,依托KGGen知识图谱生成模型,贯通知识表示建模、实体关系抽取及图谱生成全流程。[结果/结论]该框架可有效揭示北洋政府文书资源内在知识结构,构建高质量体系化知识表达,为低资源近现代历史文献的图谱构建提供可复用、可迁移的方法论参考。 展开更多
关键词 大语言模型 北洋政府文书资源 知识图谱 KGGen模型 知识抽取
在线阅读 下载PDF
高校科研型实验室实验记录管理系统的设计、实现与应用
7
作者 范安然 艾立丽 +2 位作者 刘红梅 周艳华 张鹏 《贵州医科大学学报》 2026年第2期305-312,共8页
研究生作为高等院校科研的中坚力量,其科研数据管理规范性与科学性直接关系到科研成果的质量和学术诚信。为应对传统纸质记录存在易丢失、追溯难、共享不便等痛点,本研究立足研究生培养的科研数据管理环节,深入探讨电子实验记录系统(e-L... 研究生作为高等院校科研的中坚力量,其科研数据管理规范性与科学性直接关系到科研成果的质量和学术诚信。为应对传统纸质记录存在易丢失、追溯难、共享不便等痛点,本研究立足研究生培养的科研数据管理环节,深入探讨电子实验记录系统(e-LDMS)的理论优势,并结合实际需求,基于计算机局域网(LAN)的浏览器/服务器模式(B/S)搭建一套e-LDMS,进一步探究其对研究生科研过程的意义和实践价值。e-LDMS不仅通过LAN物理隔离和B/S模式保障了数据安全和便捷操作,而且能实现从科研数据产生到成果输出全过程的数字化管理模式,e-LDMS还能为研究生学术诚信提升和科研管理数字化改革提供一定的实践参考。 展开更多
关键词 电子实验记录管理系统 研究生 科研诚信 数字化管理模式
在线阅读 下载PDF
结合关键字提取和图对比学习的文档版面分析 被引量:1
8
作者 马晓松 刘杰 +1 位作者 李晓辉 郭颖 《小型微型计算机系统》 北大核心 2026年第1期150-156,共7页
文档版面分析是信息检索和文档理解领域的重要任务和必要前提.传统的文档版面分析方法往往忽略了文本内容与结构之间的深度关联.本文提出了基于图神经网络结合大语言模型和图对比学习的方法,以提高文档版面分析的精确度.首先,通过大语... 文档版面分析是信息检索和文档理解领域的重要任务和必要前提.传统的文档版面分析方法往往忽略了文本内容与结构之间的深度关联.本文提出了基于图神经网络结合大语言模型和图对比学习的方法,以提高文档版面分析的精确度.首先,通过大语言模型自动提取关键字并融合到图节点中,增强了图神经网络对文档内容与结构的理解.其次,采用图对比学习,通过视图间对比损失优化节点表示,使模型更有效地区分文档布局模式.实验结果表明,在DocLayNet数据集上的测试中,该方法显著提升了文档版面分析的准确率,优于现有的基准方法.本文的方法为文档理解与信息提取领域提供了一种新的技术路径,有望在更多实际应用中得到广泛应用. 展开更多
关键词 图神经网络 大模型 多模态 图对比学习 文档版面分析
在线阅读 下载PDF
面向大语言模型摘要生成的意图增强框架
9
作者 薛惠文 李宝安 +1 位作者 马登豪 吕学强 《计算机工程与应用》 北大核心 2026年第6期171-183,共13页
任务旨在从冗长文本中提炼出核心内容,以便简明传达关键信息。尽管大语言模型的迅速发展使摘要技术取得显著进步,但当前大语言模型并没有对文本的整体意图进行建模,导致难以精准捕捉文本意图并维持事实一致性,使得生成的摘要在细节覆盖... 任务旨在从冗长文本中提炼出核心内容,以便简明传达关键信息。尽管大语言模型的迅速发展使摘要技术取得显著进步,但当前大语言模型并没有对文本的整体意图进行建模,导致难以精准捕捉文本意图并维持事实一致性,使得生成的摘要在细节覆盖和上下文保持方面有所不足。为解决这一限制,提出一种意图感知的上下文摘要生成框架,该框架包括意图感知模块和信息熵扩展模块。其中,意图感知模块用于捕捉文本中的作者意图,确保提取的句子能够准确反映文档的核心思想。信息熵扩展模块则用于优化信息覆盖范围,最大程度地涵盖文本中的相关上下文信息。提取的文本意图信息块与大语言模型生成的原始摘要结合,生成更高质量的摘要。实验结果表明,该框架在Multi-News和Multi-XScience两个公开数据集上的表现优于所选的基线模型,能够有效提升大语言模型生成摘要的整体质量。 展开更多
关键词 文档摘要 大语言模型 信息熵 文本意图
在线阅读 下载PDF
Meta-RAG:基于元数据驱动的电力领域检索增强生成框架 被引量:1
10
作者 王合庆 魏杰 +2 位作者 景红雨 宋晖 徐波 《计算机工程》 北大核心 2026年第2期383-392,共10页
大语言模型(LLM)在对话、推理和知识保留能力方面展现了显著优势,但在处理电力领域知识密集型任务时仍面临事实准确性不足、知识更新难以及高质量领域数据集匮乏的问题。针对这些挑战,引入一种改进的检索增强生成(RAG)策略,该策略融合... 大语言模型(LLM)在对话、推理和知识保留能力方面展现了显著优势,但在处理电力领域知识密集型任务时仍面临事实准确性不足、知识更新难以及高质量领域数据集匮乏的问题。针对这些挑战,引入一种改进的检索增强生成(RAG)策略,该策略融合了混合检索策略和经过微调的生成模型,提供了更高效的知识捕获和更新能力。基于对现有方法的深入分析,针对电力领域的知识问答(QA)任务,提出了元数据驱动的RAG框架Meta-RAG,该框架包含数据准备、模型微调和检索推理3个阶段。数据准备阶段包括文档转换、元信息抽取与增强及文档解析模块,在此阶段,借助元信息的提取与增强确保了电力规范文档的高效索引和结构化处理,并且构建了电力领域的EleQA(Electricity Question Answering)数据集,这是一个包含19 560个问答对的电力规范问答数据集。在模型微调阶段,通过多问题生成、思维链提示生成和监督指令微调数据集构建模块,优化了模型在特定电力问答任务上的推理能力。在检索推理阶段则采用混合编码和重排序策略,结合检索和生成模块,进一步提高了答案的准确性和合理性。通过一系列实验,Meta-RAG的有效性得到验证。与Self-RAG、Corrective-RAG、Adaptive-RAG、RA-ISF等基线模型相比,Meta-RAG具有更高的回答准确率和检索命中率,其中,基于Qwen1.5-14B-Chat模型的Meta-RAG达到了整体准确率0.804 3,高于其他方法。消融实验和文档召回实验结果表明文档检索对框架性能影响最大,失去检索能力整体准确率下降了0.292 8。 展开更多
关键词 EleQA数据集 元信息抽取 知识问答 电力领域 检索增强生成 模型微调 文档转换
在线阅读 下载PDF
面向文档的检索增强生成技术综述
11
作者 黄天金 朱兴动 +2 位作者 刘凯 汪时交 赵鹏 《小型微型计算机系统》 北大核心 2026年第2期282-297,共16页
大语言模型(LLMs)的迅速发展正在全球范围内引发深刻的技术变革.检索增强生成(RAG)作为一种通过融合外部知识以提升模型输出准确性、时效性与可靠性的技术范式,已成为增强LLM应用效能的关键手段.从“文档”的视角,提出“文档全谱系”概... 大语言模型(LLMs)的迅速发展正在全球范围内引发深刻的技术变革.检索增强生成(RAG)作为一种通过融合外部知识以提升模型输出准确性、时效性与可靠性的技术范式,已成为增强LLM应用效能的关键手段.从“文档”的视角,提出“文档全谱系”概念,构建一个包含文档处理、嵌入与索引、检索、生成四大组件的RAG基础框架,并进行形式化描述.围绕“文档特性-优化策略”映射关系,系统梳理各项技术的最新进展,涵盖复杂文档处理、领域适应性嵌入、高级检索策略、可信生成等关键环节.最后,分析当前挑战,并展望未来发展方向.为相关领域的研究者和实践者提供一个以解决真实世界文档问题为导向的系统性参考. 展开更多
关键词 检索增强生成 大语言模型 文档理解 知识检索 模型上下文协议(MCP)
在线阅读 下载PDF
基于大模型文档知识抽取的领域知识图谱增量构建
12
作者 陈俊臻 王淑营 罗浩然 《计算机工程与应用》 北大核心 2026年第5期191-203,共13页
针对工业领域知识图谱构建中面临的标注样本稀缺、文档多源异构、语义结构复杂等挑战,提出一种基于大型预训练语言模型的领域知识图谱增量构建方法LLM-KG。该方法利用GPT-4模型自动生成高质量的标注样本,降低人工标注成本的同时提升训... 针对工业领域知识图谱构建中面临的标注样本稀缺、文档多源异构、语义结构复杂等挑战,提出一种基于大型预训练语言模型的领域知识图谱增量构建方法LLM-KG。该方法利用GPT-4模型自动生成高质量的标注样本,降低人工标注成本的同时提升训练数据的覆盖性与准确性;借助LoRA(low-rank adaptation)技术对轻量级语言模型进行领域微调,实现对领域文档中实体与关系的高精度抽取。为提升新增实体和关系的对齐质量,LLM-KG引入语义块划分机制,并结合向量数据库进行Top-k实体召回,最终由大语言模型对召回结果进行语义一致性判断与筛选,从而实现更加准确的实体融合与关系补全。在公开数据集DDI及风电装备数据集上进行了实验验证,结果表明,LLM-KG在准确率、召回率和F1值上均优于对比方法,展现出良好的领域适应性与增量构建能力。 展开更多
关键词 知识图谱(KG) 大模型微调 文档信息抽取 增量构建
在线阅读 下载PDF
融合大语言模型和提示工程的医用电气设备标准文件抽取方法研究
13
作者 朱婉婷 张培茗 +2 位作者 夏文科 李天纯 王丽 《中国食品药品监管》 2026年第2期34-43,共10页
目的:传统的实体关系抽取技术在没有数据集的情况下依赖大量的人工标注,费时费力且难以满足高效处理数据的要求。针对该情况,本文提出运用大语言模型(LLMs)和提示工程技术对医用电气(ME)设备标准文件进行实体和关系的抽取。方法:设计流... 目的:传统的实体关系抽取技术在没有数据集的情况下依赖大量的人工标注,费时费力且难以满足高效处理数据的要求。针对该情况,本文提出运用大语言模型(LLMs)和提示工程技术对医用电气(ME)设备标准文件进行实体和关系的抽取。方法:设计流水线式和端到端式2种提示词模板,同时从修改示例数量的角度测试提示词模板对大模型的抽取效果。结果:端到端式提示词模板的F1分数比流水线式更高,且合适数量的示例可以提高LLMs的抽取准确率。结论:本文提出的ME设备标准文件提示词模板有一定的有效性,可用于完成ME设备标准文件抽取三元组的构建。 展开更多
关键词 大语言模型 标准文件监管 提示工程 知识抽取 医用电气设备
在线阅读 下载PDF
基于实体信息增强思维链的政策长文本摘要方法
14
作者 赵景欣 王志强 +2 位作者 武永亮 董佳 唐松 《计算机技术与发展》 2026年第4期121-129,共9页
随着数字化治理的深入,政策公文的高效解读成为政务处理与社会治理的关键需求,文本摘要技术成为了快速提取核心内容的重要方法。然而政策公文篇幅冗长、要素复杂,针对传统人工摘要效率低下,通用大模型处理长文本政策时存在实体遗漏、逻... 随着数字化治理的深入,政策公文的高效解读成为政务处理与社会治理的关键需求,文本摘要技术成为了快速提取核心内容的重要方法。然而政策公文篇幅冗长、要素复杂,针对传统人工摘要效率低下,通用大模型处理长文本政策时存在实体遗漏、逻辑断层等问题,该文提出一种基于实体信息增强思维链的政策公文长文本摘要生成框架。框架包含三大核心模块:首先通过实体抽取模块提取关键要素,引导大模型关注核心内容;然后通过关系建模模块构建语义关联,梳理公文内在逻辑;最后,通过提示生成模块生成最终的公文摘要,实现政策文本的关键信息精准提取和摘要生成。实验结果显示,该框架在Rouge-1、Rouge-2、Rouge-L和BERTScore指标上的F1值分别达到了62.48%、33.02%、34.54%和75.34%,显著优于其他对比模型,相较于基础Qwen2.5-7B模型分别提升了4.38百分点、7.1百分点、10.9百分点、5.37百分点。生成摘要示例表明,该框架所生成摘要在准确性、细节完整度和语言流畅性上均表征良好。 展开更多
关键词 政策公文 文本摘要 大语言模型 思维链 实体抽取 关系建模
在线阅读 下载PDF
AI技术赋能公文处理:智能模型的构建与效能优化
15
作者 夏玮 《信息与电脑》 2026年第4期103-105,共3页
在数字化转型加速的背景下,公文处理作为政务办公与行业管理的核心环节,其效率与质量影响工作协同成效。以人工智能(Artificial Intelligence,AI)技术在公文处理场景的深度应用为研究对象,聚焦智能模型构建逻辑与效能优化路径,结合A区... 在数字化转型加速的背景下,公文处理作为政务办公与行业管理的核心环节,其效率与质量影响工作协同成效。以人工智能(Artificial Intelligence,AI)技术在公文处理场景的深度应用为研究对象,聚焦智能模型构建逻辑与效能优化路径,结合A区公文写作助手、B区公文智能体案例,分析大模型私有化部署等关键技术落地方法。研究表明,基于国产大模型构建的公文处理智能系统,通过语义理解等核心功能,可压缩60%以上的公文起草时间、提升专业规范度。文章提出的“技术底座-知识支撑-场景适配”构建框架与“数据迭代—功能升级—协同优化”效能提升路径,为公文处理智能化转型提供可复制推广的实践范式,具有重要的理论参考与应用价值。 展开更多
关键词 AI技术 公文处理 智能模型 效能优化
在线阅读 下载PDF
基于大语言模型的电力文档智能问答系统构建与应用
16
作者 李润东 《水电与新能源》 2026年第1期62-66,74,共6页
通过融合语义向量检索、多路层次化搜索与检索增强生成技术,构建基于大语言模型的电力文档智能问答系统。系统采用“预处理-向量化-检索-生成”四阶段架构,结合查询改写、二阶段重排及自我反省机制,显著提升问答准确性与专业性。应用表... 通过融合语义向量检索、多路层次化搜索与检索增强生成技术,构建基于大语言模型的电力文档智能问答系统。系统采用“预处理-向量化-检索-生成”四阶段架构,结合查询改写、二阶段重排及自我反省机制,显著提升问答准确性与专业性。应用表明,该系统对电力设备手册、操作规程等文档的检索效率较传统关键词搜索提升82%,回答准确率达92%,为电力企业知识管理智能化提供了可供推广的技术方案。 展开更多
关键词 电力文档 大语言模型 智能问答 检索增强生成
在线阅读 下载PDF
U-RADAR:基于不确定性感知的自适应文档解析框架
17
作者 贾宇 黄飞龙 +2 位作者 丁嘉伟 沈宜 石恒 《通信技术》 2026年第2期196-205,共10页
提出了一种基于不确定性感知的自适应文档解析框架(U-RADAR),即一种面向大规模文档解析的混合框架,旨在平衡处理效率与结构化抽取能力。不同于冗长的串行工具链或全页端到端模型,U-RADAR采用不确定性驱动的动态路由机制:以并行化、置信... 提出了一种基于不确定性感知的自适应文档解析框架(U-RADAR),即一种面向大规模文档解析的混合框架,旨在平衡处理效率与结构化抽取能力。不同于冗长的串行工具链或全页端到端模型,U-RADAR采用不确定性驱动的动态路由机制:以并行化、置信度感知的块级抽取构建结构化底座,仅对高不确定性区域(如跨页表格合并、阅读顺序纠偏),选择性调用大语言模型(LLM)进行二次推理与全局整合。配合自动回退机制与上下文裁剪,该框架将计算资源聚焦于歧义难例,显著降低了推理开销。实验表明,U-RADAR有效缓解了误差级联与串行瓶颈,在准确性、鲁棒性及长文档跨页结构还原性能上优于现有方案。验证了“抽取—增强—整合”范式的有效性,为可控、低成本的文档解析提供了通用落地路径。 展开更多
关键词 文档解析 多模态模型 动态路由 不确定性估计 结构化抽取 全局一致性
在线阅读 下载PDF
面向工艺规范的文档树结构检索增强生成方法
18
作者 姜禹辰 王裴岩 +1 位作者 余卓 李中武 《计算机集成制造系统》 北大核心 2026年第1期131-144,共14页
现有基于大语言模型的检索增强生成忽视了工艺规范这类技术文档所呈现的复杂段落结构与隐含知识关联,致使效果不佳难以满足应用需求。针对该问题设计了面向工艺规范的文档树结构检索方法(DTSR),利用段落间章节关系将工艺规范文档转化为... 现有基于大语言模型的检索增强生成忽视了工艺规范这类技术文档所呈现的复杂段落结构与隐含知识关联,致使效果不佳难以满足应用需求。针对该问题设计了面向工艺规范的文档树结构检索方法(DTSR),利用段落间章节关系将工艺规范文档转化为树形结构对象,设计了树形结构对象遍历算法在检索增强过程中动态获取相关段落,使得大语言模型获得更多对于问题回答有益的相关知识。在3345条工艺规范问答数据集上进行实验,结果表明,与朴素检索增强生成相比,DTSR在概念准确性上平均提升13.01%,在ROUGE-L和BLEU-4指标上分别提升4.78%和2.91%。为提高大语言模型在工艺规范等工程技术性文档中的应用效果提供了新的思路。 展开更多
关键词 检索增强生成 大语言模型 工艺规范 文档树结构
在线阅读 下载PDF
基于多线程UI-Model的远程实时交互教学系统 被引量:2
19
作者 冯柏力 霍剑青 +1 位作者 杨旭 王晓蒲 《中国科学技术大学学报》 CAS CSCD 北大核心 2010年第3期254-258,共5页
针对远程实时交互系统中亟待解决的交互功能扩充与复用及通用文档共享的问题,提出了多线程UI-Model体系结构,利用用户界面委托层,对传统的UI-Model体系结构进行了改进,实现了远程实时交互教学系统中交互功能的扩充与交互模块的复用;应... 针对远程实时交互系统中亟待解决的交互功能扩充与复用及通用文档共享的问题,提出了多线程UI-Model体系结构,利用用户界面委托层,对传统的UI-Model体系结构进行了改进,实现了远程实时交互教学系统中交互功能的扩充与交互模块的复用;应用基于WebBrowser控件实现了通用文档共享模块,并结合GDI+的应用实现了在文档共享中同步绘图交互的功能.利用多线程UI-Model体系结构设计和实现了一种易扩展、可复用的具有文字、视频、电子白板、文档共享等多种实时交互功能的远程实时交互教学系统. 展开更多
关键词 多线程UI-model 文档共享 实时交互
在线阅读 下载PDF
大模型驱动的多模态文档知识融合框架研究
20
作者 晏晓峰 郎宇洁 +1 位作者 尹蓝冰 黄崇福 《现代信息科技》 2026年第6期46-54,63,共10页
传统的文本情报分析范式在深度解析复杂多模态文档时存在根本局限,导致其蕴含的核心情报价值无法被有效挖掘。本研究旨在利用大模型的突破性能力,构建一套知识融合框架,以实现对多模态知识的结构化解析与跨模态融合。文章设计了一个覆... 传统的文本情报分析范式在深度解析复杂多模态文档时存在根本局限,导致其蕴含的核心情报价值无法被有效挖掘。本研究旨在利用大模型的突破性能力,构建一套知识融合框架,以实现对多模态知识的结构化解析与跨模态融合。文章设计了一个覆盖“获取-解析-集成-融合”四阶段的闭环智能框架,该框架以大模型为认知中枢,实现了文档的智能获取、深度解析、高质量集成与最终的跨模态知识融合。研究构建的知识融合框架,实现了从多模态文档到结构化知识的系统性转化,其关键效能相较传统范式有显著提升。本研究框架高度依赖大模型的底层能力,计算资源消耗较大,未来需探索模型轻量化与推理优化的技术路径。 展开更多
关键词 多模态文档 知识融合 大语言模型 情报分析 方法体系
在线阅读 下载PDF
上一页 1 2 45 下一页 到第
使用帮助 返回顶部