期刊文献+
共找到165篇文章
< 1 2 9 >
每页显示 20 50 100
融合全局指针网络与对比学习的嵌套命名实体识别
1
作者 刘继 谢京城 《计算机应用研究》 北大核心 2026年第1期129-135,共7页
为解决现有嵌套命名实体识别方法中存在的实体表示不充分、边界模糊和语义相似实体难以区分的问题,提出了一种基于全局指针网络与对比学习融合的中文嵌套命名实体识别方法。采用全局指针机制,通过构建实体头尾指针矩阵,将实体识别转换... 为解决现有嵌套命名实体识别方法中存在的实体表示不充分、边界模糊和语义相似实体难以区分的问题,提出了一种基于全局指针网络与对比学习融合的中文嵌套命名实体识别方法。采用全局指针机制,通过构建实体头尾指针矩阵,将实体识别转换为指针预测问题,引入对比学习框架增强实体表示的语义判别能力,采用基于移动平均的梯度归一化策略,平衡多任务学习中各子任务的优化难度。在CLUENER2020和CMeEE数据集上的实验表明,该方法与基线global pointer模型相比,F 1值分别提升2.30和2.55个百分点,验证了其在中文嵌套命名实体识别任务中的有效性。 展开更多
关键词 命名实体识别 嵌套实体 全局指针网络 对比学习 梯度归一化
在线阅读 下载PDF
基于RoBERTa和指针网络的中文实体与关系联合抽取方法
2
作者 陈燕 韦紫君 +3 位作者 廖宇翔 谭志湘 胡小春 宋玲 《郑州大学学报(工学版)》 北大核心 2026年第2期41-50,共10页
为了有效解决非结构化文本中实体与关系联合抽取时的三元组重叠问题,提出了一种基于RoBERTa和指针网络的中文实体与关系联合抽取方法。首先,针对实体重叠问题,基于指针网络设计了实体识别模块,将实体识别任务构建为token-pair识别问题,... 为了有效解决非结构化文本中实体与关系联合抽取时的三元组重叠问题,提出了一种基于RoBERTa和指针网络的中文实体与关系联合抽取方法。首先,针对实体重叠问题,基于指针网络设计了实体识别模块,将实体识别任务构建为token-pair识别问题,通过识别实体的开始和结束位置来提取所有可能的实体;其次,针对三元组重叠问题,设计基于多头注意力机制和Ptr-Net的关系抽取模块,将三元组(s,r,o)抽取任务构建为五元组(s_(h),s_(t),r,o_(h),o_(t))识别任务;最后,在中文信息抽取数据集DuIE上进行大量实验。实验结果表明:所提模型综合性能优于所有基线模型,其精确率、召回率和F 1值分别为81.04%、85.82%和83.36%。 展开更多
关键词 实体与关系联合抽取 RoBERTa 指针网络 自然语言处理 深度学习
在线阅读 下载PDF
融合内容引导与多尺度注意力的摘要生成模型
3
作者 岳帅 王业 《计算机系统应用》 2026年第1期276-287,共12页
长文本中的信息压缩和语义连贯性一直是摘要生成模型的难点.为此本文提出了一种融合内容引导与多尺度注意力的摘要生成模型.该模型通过双分支结构实现对多粒度语义的联合建模,并利用内容引导机制聚焦于摘要相关的关键信息区域.模型在传... 长文本中的信息压缩和语义连贯性一直是摘要生成模型的难点.为此本文提出了一种融合内容引导与多尺度注意力的摘要生成模型.该模型通过双分支结构实现对多粒度语义的联合建模,并利用内容引导机制聚焦于摘要相关的关键信息区域.模型在传统BERT-Transformer架构基础上引入双分支结构增强语义表达能力,并通过MSAA-SAM融合机制设计,进一步实现跨分支信息对齐与表达统一.同时,本文对指针生成网络进行了改进,结合全局句向量引导机制提升生成控制能力,从而增强对长文本中关键信息的提取与冗余内容的抑制.在NLPCC 2017数据集和LCSTS数据集上的实验结果表明,该模型在生成式摘要任务上均优于主流基线模型,验证了其在语义建模、生成质量与控制能力方面的综合优势. 展开更多
关键词 深度学习 文本摘要 多尺度注意力 内容引导机制 指针生成网络 语义建模
在线阅读 下载PDF
基于改进指针网络的莲蓬采摘路径规划研究
4
作者 郑伟 范万鹏 马婕 《农机化研究》 北大核心 2026年第5期128-134,241,共8页
针对人工采摘莲蓬存在劳动效率低、成本高的问题,提出了一种高效指针网络模型,可快速精准计算最优莲蓬采摘路径,提升智能化装备的采摘效率。首先,采用自注意力机制模块代替传统指针网络中编码器和解码器使用的长短期记忆网络,实现节点... 针对人工采摘莲蓬存在劳动效率低、成本高的问题,提出了一种高效指针网络模型,可快速精准计算最优莲蓬采摘路径,提升智能化装备的采摘效率。首先,采用自注意力机制模块代替传统指针网络中编码器和解码器使用的长短期记忆网络,实现节点并行运算,提升模型运算速度;其次,采用基于Rollout基线的深度强化学习方法对指针网络模型参数进行训练,提升模型泛化性。验证实验结果表明:在区域[0,1]×[0,1]内改进算法在目标点数为20、40、80时,求解时间分别为0.007、0.011、0.020 s,最短路径长度分别为4.07、5.70、8.53;在80个目标点的情况下,改进指针网络模型较遗传算法、蚁群算法和传统指针网络方法的求解时间分别减少了277.894、58.133、4.530 s,路径长度分别缩短了22.07、4.11、0.39;将所提算法部署在NVIDIA Jetson Nano中,当目标点数为20、40、80时,改进模型的求解时间分别为0.110、0.112、0.304 s。此方法可为莲蓬智能采摘装备的研究提供理论依据,并为其他果实采摘路径规划提供借鉴。 展开更多
关键词 莲蓬采摘 改进指针网络 自注意力机制 深度强化学习 路径规划
在线阅读 下载PDF
基于深度学习的编译型语言代码转换技术研究
5
作者 张明明 张富林 +2 位作者 刘建戈 张鹏宇 洪涛 《计算机技术与发展》 2026年第1期24-30,共7页
随着软件系统跨平台和语言多样化的需求日益增长,自动源代码转换技术成为现代软件工程中的关键研究方向。传统基于规则和统计方法的代码转换手段受限于语法覆盖范围小、语义一致性弱等问题,难以满足大规模、高精度的代码迁移需求。该文... 随着软件系统跨平台和语言多样化的需求日益增长,自动源代码转换技术成为现代软件工程中的关键研究方向。传统基于规则和统计方法的代码转换手段受限于语法覆盖范围小、语义一致性弱等问题,难以满足大规模、高精度的代码迁移需求。该文聚焦于编译型语言之间的代码转换任务,提出一种基于深度学习的Java到C++自动代码转换方法。该方法融合了Transformer编码-解码结构、语法树建模、层次注意力机制和指针生成机制,能够同时捕捉源代码的词法和结构特征,并有效处理未登录标识符的翻译问题。在构建的Java-C++平行数据集上开展了系统实验,结果表明该模型在BLEU得分提升了6.4百分点,CodeBLEU提升了4.7百分点,精确匹配率提高了5.7百分点,功能正确率提高了7.8百分点,在多个评价指标上均显著优于现有主流方法。通过消融实验和案例分析进一步验证了模型结构各部分对性能提升的重要贡献。 展开更多
关键词 代码转换 编译型语言 TRANSFORMER 语法树 指针生成网络
在线阅读 下载PDF
融入实体翻译的汉越神经机器翻译模型 被引量:2
6
作者 高盛祥 侯哲 +1 位作者 余正涛 赖华 《计算机应用》 北大核心 2025年第1期69-74,共6页
在汉越低资源翻译任务中,句子中的实体词准确翻译是一大难点。针对实体词在训练语料中出现的频率较低,模型无法构建双语实体词之间的映射关系等问题,构建一种融入实体翻译的汉越神经机器翻译模型。首先,通过汉越实体双语词典预先获取源... 在汉越低资源翻译任务中,句子中的实体词准确翻译是一大难点。针对实体词在训练语料中出现的频率较低,模型无法构建双语实体词之间的映射关系等问题,构建一种融入实体翻译的汉越神经机器翻译模型。首先,通过汉越实体双语词典预先获取源句中实体词的翻译结果;其次,将结果拼接在源句末端作为模型的输入,同时在编码端引入“约束提示信息”增强表征;最后,在解码端融入指针网络机制,以确保模型能复制输出源端句的词汇。实验结果表明,该模型相较于跨语言模型XLM-R(Cross-lingual Language Model-RoBERTa)的双语评估替补(BLEU)值在汉越方向提升了1.37,越汉方向提升了0.21,时间性能上相较于Transformer该模型在汉越方向和越汉方向分别缩短3.19%和3.50%,可有效地提升句子中实体词翻译的综合性能。 展开更多
关键词 汉越神经机器翻译 实体翻译 双语词典 指针网络 低资源
在线阅读 下载PDF
基于大语言模型和提示学习的旅游文本实体关系联合抽取方法 被引量:2
7
作者 徐春 苏明钰 +2 位作者 马欢 吉双焱 王萌萌 《数据分析与知识发现》 北大核心 2025年第7期130-140,共11页
【目的】针对旅游领域知识分散、标注数据有限导致的微调效率低、抽取性能不佳等问题,进行小样本场景下实体关系抽取方法的研究。【方法】基于大模型GLM进行旅游领域的提示学习后,对输入文本进行编码表示,结合全局指针网络完成潜在关系... 【目的】针对旅游领域知识分散、标注数据有限导致的微调效率低、抽取性能不佳等问题,进行小样本场景下实体关系抽取方法的研究。【方法】基于大模型GLM进行旅游领域的提示学习后,对输入文本进行编码表示,结合全局指针网络完成潜在关系预测和特定关系下的实体识别,抽取关系三元组。【结果】在自建旅游数据集和百度DuIE数据集上进行实验,本文模型的F1值分别为90.51%和89.45%,较传统关系抽取模型分别提升2.37和0.16个百分点。【局限】提示学习仅应用于旅游领域和特定编码器,在应用场景方面还有拓展空间。【结论】本文方法能够更好地对旅游文本进行实体关系联合抽取,提示学习和大语言模型编码器可以缓解小样本场景下模型训练效果不佳的问题,有效提高实体关系抽取的准确率。 展开更多
关键词 实体关系抽取 大语言模型 提示学习 全局指针网络
原文传递
基于对抗训练和全局指针网络的医疗文本 实体关系联合抽取模型 被引量:2
8
作者 段宇锋 柏萍 《情报科学》 北大核心 2025年第3期47-57,共11页
【目的/意义】在比较分析现有关系抽取方法的基础上,构建适用于医疗文本的关系抽取模型。【方法/过程】构建AGP模型实现关系抽取。该模型将医疗文本的嵌入表示输入Transformer编码器进一步提取文本特征,利用全局指针网络解码。为了提高... 【目的/意义】在比较分析现有关系抽取方法的基础上,构建适用于医疗文本的关系抽取模型。【方法/过程】构建AGP模型实现关系抽取。该模型将医疗文本的嵌入表示输入Transformer编码器进一步提取文本特征,利用全局指针网络解码。为了提高鲁棒性,模型引入了对抗训练。【结果/结论】AGP模型在CMeIE-V1、CMeIE-V2和DiaKG数据集上F1值分别达到0.6190、0.5321和0.5684。实验结果证明AGP模型在医疗文本关系抽取任务上的性能优于基准模型。【创新/局限】本文提出的模型未整合大语言模型。 展开更多
关键词 对抗训练 全局指针网络 关系抽取 预训练模型 医疗文本
原文传递
基于层叠式指针网络的供需事件抽取模型
9
作者 白宇 宁培强 +1 位作者 张桂平 王凌云 《中文信息学报》 北大核心 2025年第10期109-121,共13页
供需事件抽取任务旨在从非结构化文本中识别与供需活动相关的事件信息并以结构化的形式呈现出来。该文将供需事件抽取任务划分为触发词抽取、元素抽取两个子任务并对其分别建模,提出了一种层叠式指针网络管道模型。利用触发词文字信息... 供需事件抽取任务旨在从非结构化文本中识别与供需活动相关的事件信息并以结构化的形式呈现出来。该文将供需事件抽取任务划分为触发词抽取、元素抽取两个子任务并对其分别建模,提出了一种层叠式指针网络管道模型。利用触发词文字信息、触发词位置信息、触发词标记信息建立两个子任务之间的有效特征连接,并通过堆叠多层指针网络、级联解码解决了供需事件抽取中普遍存在的元素跨度较长、多事件共现、元素重叠嵌套等问题。在供需事件数据集上的实验结果显示,该文提出的模型在触发词抽取任务和元素抽取任务上的F 1值分别达到95.32%和83.53%,总体F 1值达到86.91%。 展开更多
关键词 事件抽取 供需事件 指针网络 管道模型 特征连接
在线阅读 下载PDF
基于深度学习的指针式仪表自动读数与读数校正方法
10
作者 朱均超 张明惠 +2 位作者 韩芳芳 王玉军 宋思源 《仪表技术与传感器》 北大核心 2025年第7期50-56,共7页
为了实现不同量程指针式仪表的自动精准读数,文中提出了一种基于深度学习的指针式仪表自动读数与读数校正的方法。针对不同量程指针式仪表的自动读数,首先,采用YOLOv5模型和U-Net模型进行仪表的检测及指针与刻度线信息的分割;随后利用PP... 为了实现不同量程指针式仪表的自动精准读数,文中提出了一种基于深度学习的指针式仪表自动读数与读数校正的方法。针对不同量程指针式仪表的自动读数,首先,采用YOLOv5模型和U-Net模型进行仪表的检测及指针与刻度线信息的分割;随后利用PP-OCRv3模型读取量程信息,实现对不同量程的仪表信息提取;最后将读取的量程信息代入夹角占比公式计算出仪表读数。针对倾斜仪表读数不准确的问题,构建BP神经网络拟合出检测读数与实际读数的非线性映射关系,实现对不同倾斜角度的指针式仪表检测读数的校正。实验表明:该方法能够得出不同量程的精准读数,平均绝对百分比误差MAPE为2.6845%。 展开更多
关键词 指针式仪表 深度学习 BP神经网络 读数校正 自动读数 OCR模型
在线阅读 下载PDF
融合知识和语义信息的双编码器自动摘要模型 被引量:1
11
作者 贾莉 马廷淮 +1 位作者 桑晨扬 潘倩 《计算机工程与应用》 北大核心 2025年第7期213-221,共9页
为了解决自动文本摘要任务存在的文本语义信息不能充分编码、生成的摘要语义冗余、原始语义信息丢失等语义问题,提出了一种融合知识和文本语义信息的双编码器自动摘要模型(dual-encoder automatic summarization model incorporating kn... 为了解决自动文本摘要任务存在的文本语义信息不能充分编码、生成的摘要语义冗余、原始语义信息丢失等语义问题,提出了一种融合知识和文本语义信息的双编码器自动摘要模型(dual-encoder automatic summarization model incorporating knowledge and semantic information,KSDASum)。该方法采用双编码器对原文语义信息进行充分编码,文本编码器获取全文的语义信息,图结构编码器维护全文上下文结构信息。解码器部分采用基于Transformer结构和指针网络,更好地捕捉文本和结构信息进行交互,并利用指针网络的优势提高生成摘要的准确性。同时,训练过程中采用强化学习中自我批判的策略梯度优化模型能力。该方法在CNN/Daily Mail和XSum公开数据集上与GSUM生成式摘要方法相比,在评价指标上均获得最优的结果,证明了所提模型能够有效地利用知识和语义信息,提升了生成文本摘要的能力。 展开更多
关键词 知识图谱编码器 图注意力机制 指针网络 增强训练 自动摘要
在线阅读 下载PDF
基于改进指针网络的无人机数据采集路径规划 被引量:1
12
作者 陈修恒 左燕 彭冬亮 《无线电工程》 2025年第9期1869-1876,共8页
由于无人机的电池续航能力有限,单次飞行任务难以完成所有传感器点的数据采集,需要在充电桩之间多次往返进行能量补充。为了解决无人机能量约束下可充电无人机数据采集中的路径规划问题,提出一种基于深度强化学习的新算法。该方法采用... 由于无人机的电池续航能力有限,单次飞行任务难以完成所有传感器点的数据采集,需要在充电桩之间多次往返进行能量补充。为了解决无人机能量约束下可充电无人机数据采集中的路径规划问题,提出一种基于深度强化学习的新算法。该方法采用指针网络(Pointer Networks,PN)解决组合优化的方式建立序列决策模型,通过Actor-Critic强化学习算法框架对模型参数进行训练,并对无人机决策进行短期预测的方法,改进指针网络的决策输出。仿真结果显示,算法收敛速率提升了10%以上,最优结果提升了7%~17%。所提算法不仅提升了无人机任务执行的效率,还提高了无人机数据采集的收益。 展开更多
关键词 无人机数据采集任务规划 组合优化问题 指针网络 Actor-Critic 深度强化学习
在线阅读 下载PDF
融合PERT与高效全局指针网络的电力变压器缺陷文本实体识别方法
13
作者 林蔚青 郑垂锭 +4 位作者 陈静 江灏 肖洒 王铭海 缪希仁 《电网技术》 北大核心 2025年第11期4876-4887,共12页
电力变压器缺陷文本蕴含大量与设备可靠性密切相关的信息,可为变压器的智能化运维及寿命周期管理提供重要支撑。依托基于Transformer的双向编码器表示(bidirectional encoder representation from transformers,BERT)模型,文章提出一种... 电力变压器缺陷文本蕴含大量与设备可靠性密切相关的信息,可为变压器的智能化运维及寿命周期管理提供重要支撑。依托基于Transformer的双向编码器表示(bidirectional encoder representation from transformers,BERT)模型,文章提出一种融合乱序语言模型预训练BERT(pre-training BERT with permuted language model,PERT)与高效全局指针(efficient global pointer,EGP)网络的电力变压器缺陷文本实体识别方法。首先,在大规模中文语料库上利用乱序语言模型进行预训练以形成PERT模型。其次,PERT作为语义编码层,以深入挖掘实体内部的语义依赖关系,并捕捉复杂文本中的语言特征;EGP作为信息解码层,专注于精确定位关键信息并提取实体在缺陷文本中的分布特征,进而准确识别缺陷实体。最后,运用PERT-EGP模型识别缺陷文本中包含的缺陷设备、缺陷部件、缺陷部位、缺陷现象和缺陷程度5类实体。算例结果表明,相较于现有方法,该方法不仅在成分复杂的复合实体和长文本上效果提升显著,而且大幅缩短模型训练时间,具有更好的文本识别性能。 展开更多
关键词 缺陷文本 变压器 实体识别 乱序语言模型 高效全局指针网络
原文传递
基于提示学习和全局指针网络的中文古籍实体关系联合抽取方法 被引量:4
14
作者 李斌 林民 +3 位作者 斯日古楞 高颖杰 王玉荣 张树钧 《计算机应用》 北大核心 2025年第1期75-81,共7页
基于“预训练+微调”范式的实体关系联合抽取方法依赖大规模标注数据,在数据标注难度大、成本高的中文古籍小样本场景下微调效率低,抽取性能不佳;中文古籍中普遍存在实体嵌套和关系重叠的问题,限制了实体关系联合抽取的效果;管道式抽取... 基于“预训练+微调”范式的实体关系联合抽取方法依赖大规模标注数据,在数据标注难度大、成本高的中文古籍小样本场景下微调效率低,抽取性能不佳;中文古籍中普遍存在实体嵌套和关系重叠的问题,限制了实体关系联合抽取的效果;管道式抽取方法存在错误传播问题,影响抽取效果。针对以上问题,提出一种基于提示学习和全局指针网络的中文古籍实体关系联合抽取方法。首先,利用区间抽取式阅读理解的提示学习方法对预训练语言模型(PLM)注入领域知识以统一预训练和微调的优化目标,并对输入句子进行编码表示;其次,使用全局指针网络分别对主、客实体边界和不同关系下的主、客实体边界进行预测和联合解码,对齐成实体关系三元组,并构建了PTBG(Prompt Tuned BERT with Global pointer)模型,解决实体嵌套和关系重叠问题,同时避免了管道式解码的错误传播问题;最后,在上述工作基础上分析了不同提示模板对抽取性能的影响。在《史记》数据集上进行实验的结果表明,相较于注入领域知识前后的OneRel模型,PTBG模型所取得的F1值分别提升了1.64和1.97个百分点。可见,PTBG模型能更好地对中文古籍实体关系进行联合抽取,为低资源的小样本深度学习场景提供了新的研究思路与方法。 展开更多
关键词 实体关系联合抽取 全局指针网络 提示学习 预训练语言模型 中文古籍
在线阅读 下载PDF
基于全局指针限定窗口的中文医学实体识别
15
作者 仇家康 张卫山 +2 位作者 陈涛 张宝宇 朱宜昌 《计算机工程与设计》 北大核心 2025年第9期2586-2591,共6页
针对中文医学文本复杂嵌套实体难以处理的问题,提出一种基于全局指针限定窗口的中文医学实体识别模型。该模型通过医疗领域自适应预训练和新词挖掘,学习并适应医疗领域的特定数据分布。使用全局指针网络解码,并引入实体限定窗口,有效减... 针对中文医学文本复杂嵌套实体难以处理的问题,提出一种基于全局指针限定窗口的中文医学实体识别模型。该模型通过医疗领域自适应预训练和新词挖掘,学习并适应医疗领域的特定数据分布。使用全局指针网络解码,并引入实体限定窗口,有效减少长冗余负样本对模型训练的干扰。为降低模型对样本顺序的敏感性,采用最优自蒸馏策略,使模型学习到更高质量的知识和特征表示。实验结果表明,该模型在4个公开数据集上的性能均显著高于基线模型。 展开更多
关键词 实体识别 中文医学 模型蒸馏 文本挖掘 全局指针 神经网络 深度学习
在线阅读 下载PDF
基于提示学习的ERNIE-BiLSTM-PN通用信息抽取方法研究 被引量:1
16
作者 刘万里 雍新有 +3 位作者 曹开臣 陈俞舟 刘禄波 蔡世民 《电子科技大学学报》 北大核心 2025年第3期411-423,共13页
随着大数据时代的到来,信息抽取已成为自然语言处理领域的重要研究方向。信息抽取涉及多项任务,包括命名实体识别、关系抽取和事件抽取等,每项任务通常需要依靠专用模型来应对其特定的挑战。该文提出一种基于提示学习的ERNIE-BiLSTM-PN... 随着大数据时代的到来,信息抽取已成为自然语言处理领域的重要研究方向。信息抽取涉及多项任务,包括命名实体识别、关系抽取和事件抽取等,每项任务通常需要依靠专用模型来应对其特定的挑战。该文提出一种基于提示学习的ERNIE-BiLSTM-PN通用信息抽取方法(EBP-UIE),结合预训练语言模型(ERNIE)、双向长短期记忆网络(BiLSTM)和指针网络(PN),旨在通过一个统一的框架解决信息抽取任务的复杂性,并实现跨任务知识的共享。ERNIE优化了对文本的深层理解和上下文分析,BiLSTM的应用加强了对序列特征的捕捉及长距离依赖关系的解析,PN则提高了对文本中信息元素起止位置的精确标定,提示学习机制灵活实现多个信息抽取任务的统一建模。实验结果显示:在命名实体识别任务,EBP-UIE在MSRA和PeopleDaily数据集上的F1分数比UIE模型分别高出7.12%和0.53%;在关系抽取任务,EBP-UIE在DuIE数据集上的F1分数超过UIE模型6.84%;对于事件抽取任务,EBP-UIE在DuEE数据集上的触发词和论元抽取F1分数分别比UIE模型高出4.49%和0.95%。 展开更多
关键词 通用信息抽取 深度学习 指针网络 提示学习
在线阅读 下载PDF
基于指针网络架构的多星协同成像任务规划方法
17
作者 朱运豆 孙海权 胡笑旋 《系统工程与电子技术》 北大核心 2025年第7期2246-2255,共10页
随着卫星资源数量增加,用户成像需求也在急剧扩大,亟需加强多星协同成像任务规划研究,提升卫星服务能力。本文基于深度强化学习对多星协同成像任务规划问题开展研究。首先,在满足任务需求、卫星能力、时空约束基础上,建立多星协同成像... 随着卫星资源数量增加,用户成像需求也在急剧扩大,亟需加强多星协同成像任务规划研究,提升卫星服务能力。本文基于深度强化学习对多星协同成像任务规划问题开展研究。首先,在满足任务需求、卫星能力、时空约束基础上,建立多星协同成像任务规划数学模型。然后,设计一种基于指针网络的卫星任务规划算法,利用指针网络机制对输入序列进行优化选择,并通过Mask向量表征各类约束。最后,仿真结果表明算法获得的平均任务收益比传统启发式算法和指针网络模型至少提高1.71%,对于不同任务规模实例训练完成的算法,其平均任务收益差最大不超过0.28%,证明了算法的有效性和适用性。 展开更多
关键词 多星协同成像 任务规划 深度强化学习 指针网络
在线阅读 下载PDF
基于深度强化学习的多无人机协同配送路径组合优化研究 被引量:3
18
作者 孔繁辉 姜斌 《科技管理研究》 2025年第7期194-206,共13页
无人机配送是合理优化“最后一公里”物流配送问题的重要探索。通过聚焦无人机物流配送路径优化这个前沿问题,引入深度强化学习智能算法,对如何实现多架无人机协同配送模式下路径组合进行优化决策。与传统的精确算法和启发式算法不同,... 无人机配送是合理优化“最后一公里”物流配送问题的重要探索。通过聚焦无人机物流配送路径优化这个前沿问题,引入深度强化学习智能算法,对如何实现多架无人机协同配送模式下路径组合进行优化决策。与传统的精确算法和启发式算法不同,深度强化学习算法在充分考虑无人机物流配送特征,尤其在分析非线性能源消费对配送潜能作用机理基础上,构建多约束下混合整数规划模型,通过指针网络(Ptr-Net)模型训练多层自更新的生成前馈网络,从而优化多架无人机服务序列组合决策顺序。研究结果表明,深度强化学习方法具有比传统算法更高的优化效率,此外,模型解码端的注意力机制强化了输入与输出元素间的权重联系,提高了训练数据的特征收敛速度。该问题的解决可拓展物流配送模式与路径优化理论,进一步推动无人机在物流配送领域的应用范围。 展开更多
关键词 多无人机路径优化 协同配送 深度强化学习 指针网络模型 注意力机制
在线阅读 下载PDF
基于交叉多头注意力的查询式文本摘要生成
19
作者 何东欢 李旸 王素格 《中文信息学报》 北大核心 2025年第7期138-147,共10页
生成是一项根据给定文档和查询,生成与查询相关摘要的任务。该文将查询式摘要生成任务转换为阅读理解任务,将文档与查询进行交互,建立了基于交叉多头注意力的Transformer架构的多源指针生成式摘要新模型。该模型通过BERT预训练模型,建... 生成是一项根据给定文档和查询,生成与查询相关摘要的任务。该文将查询式摘要生成任务转换为阅读理解任务,将文档与查询进行交互,建立了基于交叉多头注意力的Transformer架构的多源指针生成式摘要新模型。该模型通过BERT预训练模型,建立文档、查询和摘要的嵌入表示,再在Transformer架构中,通过交叉的多头注意力机制,建立查询与文档的交互深层语义表示。在此基础上,使用多源指针生成网络,使生成的摘要与文档和查询内容具有语义一致性和表达连贯性。最后,在查询式文本摘要生成数据集Debatepedia和Querysum-data上,与已有方法进行对比实验,实验结果验证了该文摘要生成模型CMAT-PG的有效性。 展开更多
关键词 查询式文本摘要生成 机器阅读理解 交叉多头注意力机制 多源指针生成网络
在线阅读 下载PDF
基于RBIEGP的中文医疗实体识别
20
作者 周文卓 廖光忠 《计算机技术与发展》 2025年第6期124-130,共7页
中文医疗文本的实体识别是自然语言处理领域的重点研究方向,文本的内在复杂性,包括术语的歧义性、实体的层级性以及对上下文信息的高度依赖,均有可能对实体识别任务的结果产生显著影响。为此,提出一种基于RBIEGP模型的中文实体识别方法... 中文医疗文本的实体识别是自然语言处理领域的重点研究方向,文本的内在复杂性,包括术语的歧义性、实体的层级性以及对上下文信息的高度依赖,均有可能对实体识别任务的结果产生显著影响。为此,提出一种基于RBIEGP模型的中文实体识别方法。该方法首先利用RoBERTa-wwm-ext预训练模型对输入的中文医疗文本进行编码处理,以生成包含丰富语义信息的词向量序列;然后,将这些词向量序列送入BiGRU网络和集成了注意力机制的迭代扩张卷积神经网络,以捕获输入文本的上下文信息以及扩展感受野;最后,将这些融合了语法语义特征、上下文信息以及扩展感受野的特征一起输入到全局指针网络(Efficient Global Pointer,EGP),以进行实体类别的判定,并输出具有高准确度的实体类别序列。实验结果表明,RBIEGP模型在CMeEE/Yidu-S4k数据集上的F 1分数分别达到了70.47%和83.02%,相较于一些现有的主流模型,分别提升了2.72百分点和1.99百分点。 展开更多
关键词 实体识别 预训练 全局指针网络 注意力机制 感受野
在线阅读 下载PDF
上一页 1 2 9 下一页 到第
使用帮助 返回顶部