期刊文献+
共找到158篇文章
< 1 2 8 >
每页显示 20 50 100
基于大语言模型和提示学习的旅游文本实体关系联合抽取方法 被引量:1
1
作者 徐春 苏明钰 +2 位作者 马欢 吉双焱 王萌萌 《数据分析与知识发现》 北大核心 2025年第7期130-140,共11页
【目的】针对旅游领域知识分散、标注数据有限导致的微调效率低、抽取性能不佳等问题,进行小样本场景下实体关系抽取方法的研究。【方法】基于大模型GLM进行旅游领域的提示学习后,对输入文本进行编码表示,结合全局指针网络完成潜在关系... 【目的】针对旅游领域知识分散、标注数据有限导致的微调效率低、抽取性能不佳等问题,进行小样本场景下实体关系抽取方法的研究。【方法】基于大模型GLM进行旅游领域的提示学习后,对输入文本进行编码表示,结合全局指针网络完成潜在关系预测和特定关系下的实体识别,抽取关系三元组。【结果】在自建旅游数据集和百度DuIE数据集上进行实验,本文模型的F1值分别为90.51%和89.45%,较传统关系抽取模型分别提升2.37和0.16个百分点。【局限】提示学习仅应用于旅游领域和特定编码器,在应用场景方面还有拓展空间。【结论】本文方法能够更好地对旅游文本进行实体关系联合抽取,提示学习和大语言模型编码器可以缓解小样本场景下模型训练效果不佳的问题,有效提高实体关系抽取的准确率。 展开更多
关键词 实体关系抽取 大语言模型 提示学习 全局指针网络
原文传递
基于层叠式指针网络的供需事件抽取模型
2
作者 白宇 宁培强 +1 位作者 张桂平 王凌云 《中文信息学报》 北大核心 2025年第10期109-121,共13页
供需事件抽取任务旨在从非结构化文本中识别与供需活动相关的事件信息并以结构化的形式呈现出来。该文将供需事件抽取任务划分为触发词抽取、元素抽取两个子任务并对其分别建模,提出了一种层叠式指针网络管道模型。利用触发词文字信息... 供需事件抽取任务旨在从非结构化文本中识别与供需活动相关的事件信息并以结构化的形式呈现出来。该文将供需事件抽取任务划分为触发词抽取、元素抽取两个子任务并对其分别建模,提出了一种层叠式指针网络管道模型。利用触发词文字信息、触发词位置信息、触发词标记信息建立两个子任务之间的有效特征连接,并通过堆叠多层指针网络、级联解码解决了供需事件抽取中普遍存在的元素跨度较长、多事件共现、元素重叠嵌套等问题。在供需事件数据集上的实验结果显示,该文提出的模型在触发词抽取任务和元素抽取任务上的F 1值分别达到95.32%和83.53%,总体F 1值达到86.91%。 展开更多
关键词 事件抽取 供需事件 指针网络 管道模型 特征连接
在线阅读 下载PDF
融入实体翻译的汉越神经机器翻译模型
3
作者 高盛祥 侯哲 +1 位作者 余正涛 赖华 《计算机应用》 北大核心 2025年第1期69-74,共6页
在汉越低资源翻译任务中,句子中的实体词准确翻译是一大难点。针对实体词在训练语料中出现的频率较低,模型无法构建双语实体词之间的映射关系等问题,构建一种融入实体翻译的汉越神经机器翻译模型。首先,通过汉越实体双语词典预先获取源... 在汉越低资源翻译任务中,句子中的实体词准确翻译是一大难点。针对实体词在训练语料中出现的频率较低,模型无法构建双语实体词之间的映射关系等问题,构建一种融入实体翻译的汉越神经机器翻译模型。首先,通过汉越实体双语词典预先获取源句中实体词的翻译结果;其次,将结果拼接在源句末端作为模型的输入,同时在编码端引入“约束提示信息”增强表征;最后,在解码端融入指针网络机制,以确保模型能复制输出源端句的词汇。实验结果表明,该模型相较于跨语言模型XLM-R(Cross-lingual Language Model-RoBERTa)的双语评估替补(BLEU)值在汉越方向提升了1.37,越汉方向提升了0.21,时间性能上相较于Transformer该模型在汉越方向和越汉方向分别缩短3.19%和3.50%,可有效地提升句子中实体词翻译的综合性能。 展开更多
关键词 汉越神经机器翻译 实体翻译 双语词典 指针网络 低资源
在线阅读 下载PDF
基于对抗训练和全局指针网络的医疗文本 实体关系联合抽取模型
4
作者 段宇锋 柏萍 《情报科学》 北大核心 2025年第3期47-57,共11页
【目的/意义】在比较分析现有关系抽取方法的基础上,构建适用于医疗文本的关系抽取模型。【方法/过程】构建AGP模型实现关系抽取。该模型将医疗文本的嵌入表示输入Transformer编码器进一步提取文本特征,利用全局指针网络解码。为了提高... 【目的/意义】在比较分析现有关系抽取方法的基础上,构建适用于医疗文本的关系抽取模型。【方法/过程】构建AGP模型实现关系抽取。该模型将医疗文本的嵌入表示输入Transformer编码器进一步提取文本特征,利用全局指针网络解码。为了提高鲁棒性,模型引入了对抗训练。【结果/结论】AGP模型在CMeIE-V1、CMeIE-V2和DiaKG数据集上F1值分别达到0.6190、0.5321和0.5684。实验结果证明AGP模型在医疗文本关系抽取任务上的性能优于基准模型。【创新/局限】本文提出的模型未整合大语言模型。 展开更多
关键词 对抗训练 全局指针网络 关系抽取 预训练模型 医疗文本
原文传递
基于深度学习的指针式仪表自动读数与读数校正方法
5
作者 朱均超 张明惠 +2 位作者 韩芳芳 王玉军 宋思源 《仪表技术与传感器》 北大核心 2025年第7期50-56,共7页
为了实现不同量程指针式仪表的自动精准读数,文中提出了一种基于深度学习的指针式仪表自动读数与读数校正的方法。针对不同量程指针式仪表的自动读数,首先,采用YOLOv5模型和U-Net模型进行仪表的检测及指针与刻度线信息的分割;随后利用PP... 为了实现不同量程指针式仪表的自动精准读数,文中提出了一种基于深度学习的指针式仪表自动读数与读数校正的方法。针对不同量程指针式仪表的自动读数,首先,采用YOLOv5模型和U-Net模型进行仪表的检测及指针与刻度线信息的分割;随后利用PP-OCRv3模型读取量程信息,实现对不同量程的仪表信息提取;最后将读取的量程信息代入夹角占比公式计算出仪表读数。针对倾斜仪表读数不准确的问题,构建BP神经网络拟合出检测读数与实际读数的非线性映射关系,实现对不同倾斜角度的指针式仪表检测读数的校正。实验表明:该方法能够得出不同量程的精准读数,平均绝对百分比误差MAPE为2.6845%。 展开更多
关键词 指针式仪表 深度学习 BP神经网络 读数校正 自动读数 OCR模型
在线阅读 下载PDF
融合知识和语义信息的双编码器自动摘要模型 被引量:1
6
作者 贾莉 马廷淮 +1 位作者 桑晨扬 潘倩 《计算机工程与应用》 北大核心 2025年第7期213-221,共9页
为了解决自动文本摘要任务存在的文本语义信息不能充分编码、生成的摘要语义冗余、原始语义信息丢失等语义问题,提出了一种融合知识和文本语义信息的双编码器自动摘要模型(dual-encoder automatic summarization model incorporating kn... 为了解决自动文本摘要任务存在的文本语义信息不能充分编码、生成的摘要语义冗余、原始语义信息丢失等语义问题,提出了一种融合知识和文本语义信息的双编码器自动摘要模型(dual-encoder automatic summarization model incorporating knowledge and semantic information,KSDASum)。该方法采用双编码器对原文语义信息进行充分编码,文本编码器获取全文的语义信息,图结构编码器维护全文上下文结构信息。解码器部分采用基于Transformer结构和指针网络,更好地捕捉文本和结构信息进行交互,并利用指针网络的优势提高生成摘要的准确性。同时,训练过程中采用强化学习中自我批判的策略梯度优化模型能力。该方法在CNN/Daily Mail和XSum公开数据集上与GSUM生成式摘要方法相比,在评价指标上均获得最优的结果,证明了所提模型能够有效地利用知识和语义信息,提升了生成文本摘要的能力。 展开更多
关键词 知识图谱编码器 图注意力机制 指针网络 增强训练 自动摘要
在线阅读 下载PDF
融合PERT与高效全局指针网络的电力变压器缺陷文本实体识别方法
7
作者 林蔚青 郑垂锭 +4 位作者 陈静 江灏 肖洒 王铭海 缪希仁 《电网技术》 北大核心 2025年第11期4876-4887,共12页
电力变压器缺陷文本蕴含大量与设备可靠性密切相关的信息,可为变压器的智能化运维及寿命周期管理提供重要支撑。依托基于Transformer的双向编码器表示(bidirectional encoder representation from transformers,BERT)模型,文章提出一种... 电力变压器缺陷文本蕴含大量与设备可靠性密切相关的信息,可为变压器的智能化运维及寿命周期管理提供重要支撑。依托基于Transformer的双向编码器表示(bidirectional encoder representation from transformers,BERT)模型,文章提出一种融合乱序语言模型预训练BERT(pre-training BERT with permuted language model,PERT)与高效全局指针(efficient global pointer,EGP)网络的电力变压器缺陷文本实体识别方法。首先,在大规模中文语料库上利用乱序语言模型进行预训练以形成PERT模型。其次,PERT作为语义编码层,以深入挖掘实体内部的语义依赖关系,并捕捉复杂文本中的语言特征;EGP作为信息解码层,专注于精确定位关键信息并提取实体在缺陷文本中的分布特征,进而准确识别缺陷实体。最后,运用PERT-EGP模型识别缺陷文本中包含的缺陷设备、缺陷部件、缺陷部位、缺陷现象和缺陷程度5类实体。算例结果表明,相较于现有方法,该方法不仅在成分复杂的复合实体和长文本上效果提升显著,而且大幅缩短模型训练时间,具有更好的文本识别性能。 展开更多
关键词 缺陷文本 变压器 实体识别 乱序语言模型 高效全局指针网络
原文传递
基于提示学习和全局指针网络的中文古籍实体关系联合抽取方法 被引量:3
8
作者 李斌 林民 +3 位作者 斯日古楞 高颖杰 王玉荣 张树钧 《计算机应用》 北大核心 2025年第1期75-81,共7页
基于“预训练+微调”范式的实体关系联合抽取方法依赖大规模标注数据,在数据标注难度大、成本高的中文古籍小样本场景下微调效率低,抽取性能不佳;中文古籍中普遍存在实体嵌套和关系重叠的问题,限制了实体关系联合抽取的效果;管道式抽取... 基于“预训练+微调”范式的实体关系联合抽取方法依赖大规模标注数据,在数据标注难度大、成本高的中文古籍小样本场景下微调效率低,抽取性能不佳;中文古籍中普遍存在实体嵌套和关系重叠的问题,限制了实体关系联合抽取的效果;管道式抽取方法存在错误传播问题,影响抽取效果。针对以上问题,提出一种基于提示学习和全局指针网络的中文古籍实体关系联合抽取方法。首先,利用区间抽取式阅读理解的提示学习方法对预训练语言模型(PLM)注入领域知识以统一预训练和微调的优化目标,并对输入句子进行编码表示;其次,使用全局指针网络分别对主、客实体边界和不同关系下的主、客实体边界进行预测和联合解码,对齐成实体关系三元组,并构建了PTBG(Prompt Tuned BERT with Global pointer)模型,解决实体嵌套和关系重叠问题,同时避免了管道式解码的错误传播问题;最后,在上述工作基础上分析了不同提示模板对抽取性能的影响。在《史记》数据集上进行实验的结果表明,相较于注入领域知识前后的OneRel模型,PTBG模型所取得的F1值分别提升了1.64和1.97个百分点。可见,PTBG模型能更好地对中文古籍实体关系进行联合抽取,为低资源的小样本深度学习场景提供了新的研究思路与方法。 展开更多
关键词 实体关系联合抽取 全局指针网络 提示学习 预训练语言模型 中文古籍
在线阅读 下载PDF
基于全局指针限定窗口的中文医学实体识别
9
作者 仇家康 张卫山 +2 位作者 陈涛 张宝宇 朱宜昌 《计算机工程与设计》 北大核心 2025年第9期2586-2591,共6页
针对中文医学文本复杂嵌套实体难以处理的问题,提出一种基于全局指针限定窗口的中文医学实体识别模型。该模型通过医疗领域自适应预训练和新词挖掘,学习并适应医疗领域的特定数据分布。使用全局指针网络解码,并引入实体限定窗口,有效减... 针对中文医学文本复杂嵌套实体难以处理的问题,提出一种基于全局指针限定窗口的中文医学实体识别模型。该模型通过医疗领域自适应预训练和新词挖掘,学习并适应医疗领域的特定数据分布。使用全局指针网络解码,并引入实体限定窗口,有效减少长冗余负样本对模型训练的干扰。为降低模型对样本顺序的敏感性,采用最优自蒸馏策略,使模型学习到更高质量的知识和特征表示。实验结果表明,该模型在4个公开数据集上的性能均显著高于基线模型。 展开更多
关键词 实体识别 中文医学 模型蒸馏 文本挖掘 全局指针 神经网络 深度学习
在线阅读 下载PDF
基于提示学习的ERNIE-BiLSTM-PN通用信息抽取方法研究 被引量:1
10
作者 刘万里 雍新有 +3 位作者 曹开臣 陈俞舟 刘禄波 蔡世民 《电子科技大学学报》 北大核心 2025年第3期411-423,共13页
随着大数据时代的到来,信息抽取已成为自然语言处理领域的重要研究方向。信息抽取涉及多项任务,包括命名实体识别、关系抽取和事件抽取等,每项任务通常需要依靠专用模型来应对其特定的挑战。该文提出一种基于提示学习的ERNIE-BiLSTM-PN... 随着大数据时代的到来,信息抽取已成为自然语言处理领域的重要研究方向。信息抽取涉及多项任务,包括命名实体识别、关系抽取和事件抽取等,每项任务通常需要依靠专用模型来应对其特定的挑战。该文提出一种基于提示学习的ERNIE-BiLSTM-PN通用信息抽取方法(EBP-UIE),结合预训练语言模型(ERNIE)、双向长短期记忆网络(BiLSTM)和指针网络(PN),旨在通过一个统一的框架解决信息抽取任务的复杂性,并实现跨任务知识的共享。ERNIE优化了对文本的深层理解和上下文分析,BiLSTM的应用加强了对序列特征的捕捉及长距离依赖关系的解析,PN则提高了对文本中信息元素起止位置的精确标定,提示学习机制灵活实现多个信息抽取任务的统一建模。实验结果显示:在命名实体识别任务,EBP-UIE在MSRA和PeopleDaily数据集上的F1分数比UIE模型分别高出7.12%和0.53%;在关系抽取任务,EBP-UIE在DuIE数据集上的F1分数超过UIE模型6.84%;对于事件抽取任务,EBP-UIE在DuEE数据集上的触发词和论元抽取F1分数分别比UIE模型高出4.49%和0.95%。 展开更多
关键词 通用信息抽取 深度学习 指针网络 提示学习
在线阅读 下载PDF
基于指针网络架构的多星协同成像任务规划方法
11
作者 朱运豆 孙海权 胡笑旋 《系统工程与电子技术》 北大核心 2025年第7期2246-2255,共10页
随着卫星资源数量增加,用户成像需求也在急剧扩大,亟需加强多星协同成像任务规划研究,提升卫星服务能力。本文基于深度强化学习对多星协同成像任务规划问题开展研究。首先,在满足任务需求、卫星能力、时空约束基础上,建立多星协同成像... 随着卫星资源数量增加,用户成像需求也在急剧扩大,亟需加强多星协同成像任务规划研究,提升卫星服务能力。本文基于深度强化学习对多星协同成像任务规划问题开展研究。首先,在满足任务需求、卫星能力、时空约束基础上,建立多星协同成像任务规划数学模型。然后,设计一种基于指针网络的卫星任务规划算法,利用指针网络机制对输入序列进行优化选择,并通过Mask向量表征各类约束。最后,仿真结果表明算法获得的平均任务收益比传统启发式算法和指针网络模型至少提高1.71%,对于不同任务规模实例训练完成的算法,其平均任务收益差最大不超过0.28%,证明了算法的有效性和适用性。 展开更多
关键词 多星协同成像 任务规划 深度强化学习 指针网络
在线阅读 下载PDF
基于改进指针网络的无人机数据采集路径规划
12
作者 陈修恒 左燕 彭冬亮 《无线电工程》 2025年第9期1869-1876,共8页
由于无人机的电池续航能力有限,单次飞行任务难以完成所有传感器点的数据采集,需要在充电桩之间多次往返进行能量补充。为了解决无人机能量约束下可充电无人机数据采集中的路径规划问题,提出一种基于深度强化学习的新算法。该方法采用... 由于无人机的电池续航能力有限,单次飞行任务难以完成所有传感器点的数据采集,需要在充电桩之间多次往返进行能量补充。为了解决无人机能量约束下可充电无人机数据采集中的路径规划问题,提出一种基于深度强化学习的新算法。该方法采用指针网络(Pointer Networks,PN)解决组合优化的方式建立序列决策模型,通过Actor-Critic强化学习算法框架对模型参数进行训练,并对无人机决策进行短期预测的方法,改进指针网络的决策输出。仿真结果显示,算法收敛速率提升了10%以上,最优结果提升了7%~17%。所提算法不仅提升了无人机任务执行的效率,还提高了无人机数据采集的收益。 展开更多
关键词 无人机数据采集任务规划 组合优化问题 指针网络 Actor-Critic 深度强化学习
在线阅读 下载PDF
基于交叉多头注意力的查询式文本摘要生成
13
作者 何东欢 李旸 王素格 《中文信息学报》 北大核心 2025年第7期138-147,共10页
生成是一项根据给定文档和查询,生成与查询相关摘要的任务。该文将查询式摘要生成任务转换为阅读理解任务,将文档与查询进行交互,建立了基于交叉多头注意力的Transformer架构的多源指针生成式摘要新模型。该模型通过BERT预训练模型,建... 生成是一项根据给定文档和查询,生成与查询相关摘要的任务。该文将查询式摘要生成任务转换为阅读理解任务,将文档与查询进行交互,建立了基于交叉多头注意力的Transformer架构的多源指针生成式摘要新模型。该模型通过BERT预训练模型,建立文档、查询和摘要的嵌入表示,再在Transformer架构中,通过交叉的多头注意力机制,建立查询与文档的交互深层语义表示。在此基础上,使用多源指针生成网络,使生成的摘要与文档和查询内容具有语义一致性和表达连贯性。最后,在查询式文本摘要生成数据集Debatepedia和Querysum-data上,与已有方法进行对比实验,实验结果验证了该文摘要生成模型CMAT-PG的有效性。 展开更多
关键词 查询式文本摘要生成 机器阅读理解 交叉多头注意力机制 多源指针生成网络
在线阅读 下载PDF
基于RBIEGP的中文医疗实体识别
14
作者 周文卓 廖光忠 《计算机技术与发展》 2025年第6期124-130,共7页
中文医疗文本的实体识别是自然语言处理领域的重点研究方向,文本的内在复杂性,包括术语的歧义性、实体的层级性以及对上下文信息的高度依赖,均有可能对实体识别任务的结果产生显著影响。为此,提出一种基于RBIEGP模型的中文实体识别方法... 中文医疗文本的实体识别是自然语言处理领域的重点研究方向,文本的内在复杂性,包括术语的歧义性、实体的层级性以及对上下文信息的高度依赖,均有可能对实体识别任务的结果产生显著影响。为此,提出一种基于RBIEGP模型的中文实体识别方法。该方法首先利用RoBERTa-wwm-ext预训练模型对输入的中文医疗文本进行编码处理,以生成包含丰富语义信息的词向量序列;然后,将这些词向量序列送入BiGRU网络和集成了注意力机制的迭代扩张卷积神经网络,以捕获输入文本的上下文信息以及扩展感受野;最后,将这些融合了语法语义特征、上下文信息以及扩展感受野的特征一起输入到全局指针网络(Efficient Global Pointer,EGP),以进行实体类别的判定,并输出具有高准确度的实体类别序列。实验结果表明,RBIEGP模型在CMeEE/Yidu-S4k数据集上的F 1分数分别达到了70.47%和83.02%,相较于一些现有的主流模型,分别提升了2.72百分点和1.99百分点。 展开更多
关键词 实体识别 预训练 全局指针网络 注意力机制 感受野
在线阅读 下载PDF
基于文本语义的注意力指针网络文本摘要生成模型
15
作者 谢文博 张晓滨 《计算机与数字工程》 2025年第1期189-195,共7页
论文旨在针对文本摘要生成任务中存在的语义信息编码不充分、生成摘要结果不通顺问题,提出一种基于文本语义的注意力指针网络文本摘要模型。该模型采用改进的序列到序列(Seq2Seq)架构,利用双编码器+双注意力机制对源文档编码以获取文本... 论文旨在针对文本摘要生成任务中存在的语义信息编码不充分、生成摘要结果不通顺问题,提出一种基于文本语义的注意力指针网络文本摘要模型。该模型采用改进的序列到序列(Seq2Seq)架构,利用双编码器+双注意力机制对源文档编码以获取文本的不同特征向量:应用Child-Sum Tree-LSTMs+SelfAttention获取文本的语义特征向量,BiLSTM+SoftAttention获取文本的位置时序特征向量,之后构建门控机制与指针网络融合取舍不同编码器获取到的特征向量,利用覆盖机制解决生成重复问题,最后使用集束搜索选取最终生成词,从而产生更为准确和连贯的摘要。最终实验表明:在中文短文本摘要数据集LCSTS与英文数据集CNN/Daily Mail上,论文模型与对照实验组对比,在ROUGE评分标准下取得了更高的分数,表明该模型能有效地提升文本摘要生成效果。 展开更多
关键词 文本摘要生成 Child-Sum Tree-LSTMs Seq2Seq 指针网络 注意力机制
在线阅读 下载PDF
基于深度强化学习的多无人机协同配送路径组合优化研究 被引量:1
16
作者 孔繁辉 姜斌 《科技管理研究》 2025年第7期194-206,共13页
无人机配送是合理优化“最后一公里”物流配送问题的重要探索。通过聚焦无人机物流配送路径优化这个前沿问题,引入深度强化学习智能算法,对如何实现多架无人机协同配送模式下路径组合进行优化决策。与传统的精确算法和启发式算法不同,... 无人机配送是合理优化“最后一公里”物流配送问题的重要探索。通过聚焦无人机物流配送路径优化这个前沿问题,引入深度强化学习智能算法,对如何实现多架无人机协同配送模式下路径组合进行优化决策。与传统的精确算法和启发式算法不同,深度强化学习算法在充分考虑无人机物流配送特征,尤其在分析非线性能源消费对配送潜能作用机理基础上,构建多约束下混合整数规划模型,通过指针网络(Ptr-Net)模型训练多层自更新的生成前馈网络,从而优化多架无人机服务序列组合决策顺序。研究结果表明,深度强化学习方法具有比传统算法更高的优化效率,此外,模型解码端的注意力机制强化了输入与输出元素间的权重联系,提高了训练数据的特征收敛速度。该问题的解决可拓展物流配送模式与路径优化理论,进一步推动无人机在物流配送领域的应用范围。 展开更多
关键词 多无人机路径优化 协同配送 深度强化学习 指针网络模型 注意力机制
在线阅读 下载PDF
基于MacBERT与全局指针网络的中文电子病历命名实体识别
17
作者 吴天宇 郭冬冬 +2 位作者 李文桥 李子康 苗琳 《科学技术与工程》 北大核心 2025年第11期4656-4665,共10页
针对现有序列标注方法不能有效解决中文电子病历嵌套实体识别问题,提出一种基于MacBERT与全局指针网络的中文电子病历命名实体识别模型。首先通过MacBERT-large预训练模型将文本转换为结合语境信息的动态向量,然后使用FGM (fast gradien... 针对现有序列标注方法不能有效解决中文电子病历嵌套实体识别问题,提出一种基于MacBERT与全局指针网络的中文电子病历命名实体识别模型。首先通过MacBERT-large预训练模型将文本转换为结合语境信息的动态向量,然后使用FGM (fast gradient method)方法生成对抗样本添加至原有向量并一同输入BiLSTM (bi-directional long short-term memory)网络获取上下文特征,并通过引入注意力机制增强长距离语义特征获取,最后利用全局指针网络模型同时考虑头部和尾部的特征信息进行解码以获得更好的医学嵌套实体预测效果。实验结果表明,本文模型相较于识别效果较好的主流模型全局指针网络模型在CCKS2019以及两个版本的CMeEE中文电子病历数据集上F1分别提高了1.8%、1.37%、1.72%,证明了模型的有效性。 展开更多
关键词 命名实体识别 中文电子病历 全局指针网络 注意力机制
在线阅读 下载PDF
面向高频动态到达的天文卫星机遇目标任务规划方法
18
作者 王旭航 吴海燕 《空间科学学报》 北大核心 2025年第5期1376-1386,共11页
以巡天设备每天将探测到数以万计的变源天体以及对变源天体的观测需求增长为背景,形成了由高频动态到达的机遇目标(ToO)及其后随观测任务组成的长序列任务规划问题.该问题具有观测事件随机性、数据获取高时效性、可选择性多和约束复杂... 以巡天设备每天将探测到数以万计的变源天体以及对变源天体的观测需求增长为背景,形成了由高频动态到达的机遇目标(ToO)及其后随观测任务组成的长序列任务规划问题.该问题具有观测事件随机性、数据获取高时效性、可选择性多和约束复杂的特点,常被视为NP(非确定性多项式)难题,因此获取监督学习的标签数据不易.而针对采用无监督学习的深度强化学习(DRL)方法求解长序列任务规划问题时,卫星作为智能体难以快速收敛至全局最优策略.为此本文借鉴局部注意力(LA)机制的思想对指针网络(PN)进行改进,提出局部注意力指针网络(LA-PN)算法.该算法通过引入时间窗口的方式,使模型专注于对当前决策有重要影响的序列部分,减少了无效探索.通过仿真结果对比分析,验证算法的收益性、实时性和泛化性. 展开更多
关键词 机遇目标 后随观测 任务规划 深度强化学习 局部注意力指针网络
在线阅读 下载PDF
基于Mem2Seq网络和多级记忆网络的翻译对话系统设计
19
作者 陆春兰 《自动化与仪器仪表》 2025年第2期228-232,共5页
英语翻译近年来随着全球化的发展,起着越来越重要的沟通桥梁作用。但是现有的翻译对话系统数据库常常出现解码错误,导致翻译的不准确性。因此,研究提出结合端到端可微分网络和多级记忆网络模型来优化翻译对话系统。结果显示,研究所提模... 英语翻译近年来随着全球化的发展,起着越来越重要的沟通桥梁作用。但是现有的翻译对话系统数据库常常出现解码错误,导致翻译的不准确性。因此,研究提出结合端到端可微分网络和多级记忆网络模型来优化翻译对话系统。结果显示,研究所提模型在实际英语翻译时,准确度在K值为1、3时最为稳定。研究设计的模型可以最大程度上避免输入指令梯度消失,进而处理更复杂的指令与长文本。英语翻译的对话系统的智能化将会得到进一步提升,其也将实现自主注意力的表达能力,丰富单词表征,理解语句的更深层次含义。这为机翻行业提供了极具价值的实验科研方向,能够在一定程度上助推翻译行业经济发展,增加使用者的生活便捷度与满足感。 展开更多
关键词 英语翻译 Mem2Seq 多级记忆网络 指针网络
原文传递
基于增量预训练与对抗学习的古籍命名实体识别
20
作者 任乐 张仰森 +2 位作者 李剑龙 孙圆明 刘帅康 《计算机工程与设计》 北大核心 2025年第4期1190-1197,共8页
针对用于古籍命名实体识别古籍语料少、古文信息熵高的问题,构建基于二十四史的古籍文本语料库,并提出一种基于增量预训练和对抗学习的古籍命名实体识别模型(ANER-IPAL)。基于自建的古籍文本数据集,使用NEZHA-TCN模型进行预训练,在嵌入... 针对用于古籍命名实体识别古籍语料少、古文信息熵高的问题,构建基于二十四史的古籍文本语料库,并提出一种基于增量预训练和对抗学习的古籍命名实体识别模型(ANER-IPAL)。基于自建的古籍文本数据集,使用NEZHA-TCN模型进行预训练,在嵌入层融合对抗学习增强模型泛化能力,在解码层引入全局指针网络,将实体识别任务建模为子串提取任务,结合规则进行结果的矫正输出。实验结果表明,所提模型在“古籍命名实体识别2023”数据集(GuNER2023)上的F1值达到了95.34%,相较于基线模型NEZHA-GP提高了4.19%。 展开更多
关键词 二十四史 古籍命名实体识别 增量预训练 时序卷积神经网络 对抗学习 全局指针 子串提取
在线阅读 下载PDF
上一页 1 2 8 下一页 到第
使用帮助 返回顶部