期刊文献+
共找到171篇文章
< 1 2 9 >
每页显示 20 50 100
A two-stage scheduling algorithm based on pointer network with attention mechanism for micro-nano Earth observation satellite constellation
1
作者 Hai LI Yuanhao LIU +5 位作者 Boyu DENG Yongjun LI Xin LI Yu LI Taijiang ZHANG Shanghong ZHAO 《Chinese Journal of Aeronautics》 2025年第8期433-448,共16页
Micro-nano Earth Observation Satellite(MEOS)constellation has the advantages of low construction cost,short revisit cycle,and high functional density,which is considered a promising solution for serving rapidly growin... Micro-nano Earth Observation Satellite(MEOS)constellation has the advantages of low construction cost,short revisit cycle,and high functional density,which is considered a promising solution for serving rapidly growing observation demands.The observation Scheduling Problem in the MEOS constellation(MEOSSP)is a challenging issue due to the large number of satellites and tasks,as well as complex observation constraints.To address the large-scale and complicated MEOSSP,we develop a Two-Stage Scheduling Algorithm based on the Pointer Network with Attention mechanism(TSSA-PNA).In TSSA-PNA,the MEOS observation scheduling is decomposed into a task allocation stage and a single-MEOS scheduling stage.In the task allocation stage,an adaptive task allocation algorithm with four problem-specific allocation operators is proposed to reallocate the unscheduled tasks to new MEOSs.Regarding the single-MEOS scheduling stage,we design a pointer network based on the encoder-decoder architecture to learn the optimal singleMEOS scheduling solution and introduce the attention mechanism into the encoder to improve the learning efficiency.The Pointer Network with Attention mechanism(PNA)can generate the single-MEOS scheduling solution quickly in an end-to-end manner.These two decomposed stages are performed iteratively to search for the solution with high profit.A greedy local search algorithm is developed to improve the profits further.The performance of the PNA and TSSA-PNA on singleMEOS and multi-MEOS scheduling problems are evaluated in the experiments.The experimental results demonstrate that PNA can obtain the approximate solution for the single-MEOS scheduling problem in a short time.Besides,the TSSA-PNA can achieve higher observation profits than the existing scheduling algorithms within the acceptable computational time for the large-scale MEOS scheduling problem. 展开更多
关键词 Micro-nano earth observation satellite Observation scheduling Large-scale scheduling Two-stage optimization pointer network Attention mechanism
原文传递
Enhancing the generalization capability of 2D array pointer networks through multiple teacher-forcing knowledge distillation
2
作者 Qidong Liu Xin Shen +3 位作者 Chaoyue Liu Dong Chen Xin Zhou Mingliang Xu 《Journal of Automation and Intelligence》 2025年第1期29-38,共10页
The Heterogeneous Capacitated Vehicle Routing Problem(HCVRP),which involves efficiently routing vehicles with diverse capacities to fulfill various customer demands at minimal cost,poses an NP-hard challenge in combin... The Heterogeneous Capacitated Vehicle Routing Problem(HCVRP),which involves efficiently routing vehicles with diverse capacities to fulfill various customer demands at minimal cost,poses an NP-hard challenge in combinatorial optimization.Recently,reinforcement learning approaches such as 2D Array Pointer Networks(2D-Ptr)have demonstrated remarkable speed in decision-making by modeling multiple agents’concurrent choices as a sequence of consecutive actions.However,these learning-based models often struggle with generalization,meaning they cannot seamlessly adapt to new scenarios with varying numbers of vehicles or customers without retraining.Inspired by the potential of multi-teacher knowledge distillation to harness diverse knowledge from multiple sources and craft a comprehensive student model,we propose to enhance the generalization capability of 2D-Ptr through Multiple Teacher-forcing Knowledge Distillation(MTKD).We initially train 12 unique 2D-Ptr models under various settings to serve as teacher models.Subsequently,we randomly sample a teacher model and a batch of problem instances,focusing on those where the chosen teacher performed best.This teacher model then solves these instances,generating high-reward action sequences to guide knowledge transfer to the student model.We conduct rigorous evaluations across four distinct datasets,each comprising four HCVRP instances of varying scales.Our empirical findings underscore the proposed method superiority over existing learning-based methods in terms of both computational efficiency and solution quality. 展开更多
关键词 Vehicle routing problem Multi-teacher knowledge distillation Teacher-forcing pointer network
在线阅读 下载PDF
Graph Pointer Network Based Hierarchical Curriculum Reinforcement Learning Method Solving Shuttle Tankers Scheduling Problem
3
作者 Xiaoyong Gao Yixu Yang +4 位作者 Diao Peng Shanghe Li Chaodong Tan Feifei Li Tao Chen 《Complex System Modeling and Simulation》 2024年第4期339-352,共14页
Shuttle tankers scheduling is an important task in offshore oil and gas transportation process,which involves operating time window fulfillment,optimal transportation planning,and proper inventory management.However,c... Shuttle tankers scheduling is an important task in offshore oil and gas transportation process,which involves operating time window fulfillment,optimal transportation planning,and proper inventory management.However,conventional approaches like Mixed lnteger Linear Programming(MlLP)or meta heuristic algorithms often fail in long running time.In this paper,a Graph Pointer Network(GPN)based Hierarchical Curriculum Reinforcement Learning(HCRl)method is proposed to solve Shuttle Tankers Scheduling Problem(STSP)The model is trained to divide STSP into voyage and operation stages and generate routing and inventory management decisions sequentially.An asynchronous training strategy is developed to address the coupling between stages.Comparison experiments demonstrate that the proposed HCRL method achieves 12%shortel tour lengths on average compared to heuristic algorithms.Additional experiments validate its generalizability to unseen instances and scalability to larger instances. 展开更多
关键词 graph pointer network hierarchical reinforcement learning curriculum learning shuttle tanker scheduling problem
原文传递
融合全局指针网络与对比学习的嵌套命名实体识别
4
作者 刘继 谢京城 《计算机应用研究》 北大核心 2026年第1期129-135,共7页
为解决现有嵌套命名实体识别方法中存在的实体表示不充分、边界模糊和语义相似实体难以区分的问题,提出了一种基于全局指针网络与对比学习融合的中文嵌套命名实体识别方法。采用全局指针机制,通过构建实体头尾指针矩阵,将实体识别转换... 为解决现有嵌套命名实体识别方法中存在的实体表示不充分、边界模糊和语义相似实体难以区分的问题,提出了一种基于全局指针网络与对比学习融合的中文嵌套命名实体识别方法。采用全局指针机制,通过构建实体头尾指针矩阵,将实体识别转换为指针预测问题,引入对比学习框架增强实体表示的语义判别能力,采用基于移动平均的梯度归一化策略,平衡多任务学习中各子任务的优化难度。在CLUENER2020和CMeEE数据集上的实验表明,该方法与基线global pointer模型相比,F 1值分别提升2.30和2.55个百分点,验证了其在中文嵌套命名实体识别任务中的有效性。 展开更多
关键词 命名实体识别 嵌套实体 全局指针网络 对比学习 梯度归一化
在线阅读 下载PDF
基于RoBERTa和指针网络的中文实体与关系联合抽取方法
5
作者 陈燕 韦紫君 +3 位作者 廖宇翔 谭志湘 胡小春 宋玲 《郑州大学学报(工学版)》 北大核心 2026年第2期41-50,共10页
为了有效解决非结构化文本中实体与关系联合抽取时的三元组重叠问题,提出了一种基于RoBERTa和指针网络的中文实体与关系联合抽取方法。首先,针对实体重叠问题,基于指针网络设计了实体识别模块,将实体识别任务构建为token-pair识别问题,... 为了有效解决非结构化文本中实体与关系联合抽取时的三元组重叠问题,提出了一种基于RoBERTa和指针网络的中文实体与关系联合抽取方法。首先,针对实体重叠问题,基于指针网络设计了实体识别模块,将实体识别任务构建为token-pair识别问题,通过识别实体的开始和结束位置来提取所有可能的实体;其次,针对三元组重叠问题,设计基于多头注意力机制和Ptr-Net的关系抽取模块,将三元组(s,r,o)抽取任务构建为五元组(s_(h),s_(t),r,o_(h),o_(t))识别任务;最后,在中文信息抽取数据集DuIE上进行大量实验。实验结果表明:所提模型综合性能优于所有基线模型,其精确率、召回率和F 1值分别为81.04%、85.82%和83.36%。 展开更多
关键词 实体与关系联合抽取 RoBERTa 指针网络 自然语言处理 深度学习
在线阅读 下载PDF
融合内容引导与多尺度注意力的摘要生成模型
6
作者 岳帅 王业 《计算机系统应用》 2026年第1期276-287,共12页
长文本中的信息压缩和语义连贯性一直是摘要生成模型的难点.为此本文提出了一种融合内容引导与多尺度注意力的摘要生成模型.该模型通过双分支结构实现对多粒度语义的联合建模,并利用内容引导机制聚焦于摘要相关的关键信息区域.模型在传... 长文本中的信息压缩和语义连贯性一直是摘要生成模型的难点.为此本文提出了一种融合内容引导与多尺度注意力的摘要生成模型.该模型通过双分支结构实现对多粒度语义的联合建模,并利用内容引导机制聚焦于摘要相关的关键信息区域.模型在传统BERT-Transformer架构基础上引入双分支结构增强语义表达能力,并通过MSAA-SAM融合机制设计,进一步实现跨分支信息对齐与表达统一.同时,本文对指针生成网络进行了改进,结合全局句向量引导机制提升生成控制能力,从而增强对长文本中关键信息的提取与冗余内容的抑制.在NLPCC 2017数据集和LCSTS数据集上的实验结果表明,该模型在生成式摘要任务上均优于主流基线模型,验证了其在语义建模、生成质量与控制能力方面的综合优势. 展开更多
关键词 深度学习 文本摘要 多尺度注意力 内容引导机制 指针生成网络 语义建模
在线阅读 下载PDF
基于改进指针网络的莲蓬采摘路径规划研究
7
作者 郑伟 范万鹏 马婕 《农机化研究》 北大核心 2026年第5期128-134,241,共8页
针对人工采摘莲蓬存在劳动效率低、成本高的问题,提出了一种高效指针网络模型,可快速精准计算最优莲蓬采摘路径,提升智能化装备的采摘效率。首先,采用自注意力机制模块代替传统指针网络中编码器和解码器使用的长短期记忆网络,实现节点... 针对人工采摘莲蓬存在劳动效率低、成本高的问题,提出了一种高效指针网络模型,可快速精准计算最优莲蓬采摘路径,提升智能化装备的采摘效率。首先,采用自注意力机制模块代替传统指针网络中编码器和解码器使用的长短期记忆网络,实现节点并行运算,提升模型运算速度;其次,采用基于Rollout基线的深度强化学习方法对指针网络模型参数进行训练,提升模型泛化性。验证实验结果表明:在区域[0,1]×[0,1]内改进算法在目标点数为20、40、80时,求解时间分别为0.007、0.011、0.020 s,最短路径长度分别为4.07、5.70、8.53;在80个目标点的情况下,改进指针网络模型较遗传算法、蚁群算法和传统指针网络方法的求解时间分别减少了277.894、58.133、4.530 s,路径长度分别缩短了22.07、4.11、0.39;将所提算法部署在NVIDIA Jetson Nano中,当目标点数为20、40、80时,改进模型的求解时间分别为0.110、0.112、0.304 s。此方法可为莲蓬智能采摘装备的研究提供理论依据,并为其他果实采摘路径规划提供借鉴。 展开更多
关键词 莲蓬采摘 改进指针网络 自注意力机制 深度强化学习 路径规划
在线阅读 下载PDF
基于深度学习的编译型语言代码转换技术研究
8
作者 张明明 张富林 +2 位作者 刘建戈 张鹏宇 洪涛 《计算机技术与发展》 2026年第1期24-30,共7页
随着软件系统跨平台和语言多样化的需求日益增长,自动源代码转换技术成为现代软件工程中的关键研究方向。传统基于规则和统计方法的代码转换手段受限于语法覆盖范围小、语义一致性弱等问题,难以满足大规模、高精度的代码迁移需求。该文... 随着软件系统跨平台和语言多样化的需求日益增长,自动源代码转换技术成为现代软件工程中的关键研究方向。传统基于规则和统计方法的代码转换手段受限于语法覆盖范围小、语义一致性弱等问题,难以满足大规模、高精度的代码迁移需求。该文聚焦于编译型语言之间的代码转换任务,提出一种基于深度学习的Java到C++自动代码转换方法。该方法融合了Transformer编码-解码结构、语法树建模、层次注意力机制和指针生成机制,能够同时捕捉源代码的词法和结构特征,并有效处理未登录标识符的翻译问题。在构建的Java-C++平行数据集上开展了系统实验,结果表明该模型在BLEU得分提升了6.4百分点,CodeBLEU提升了4.7百分点,精确匹配率提高了5.7百分点,功能正确率提高了7.8百分点,在多个评价指标上均显著优于现有主流方法。通过消融实验和案例分析进一步验证了模型结构各部分对性能提升的重要贡献。 展开更多
关键词 代码转换 编译型语言 TRANSFORMER 语法树 指针生成网络
在线阅读 下载PDF
基于Masked-Pointer的多轮对话重写模型 被引量:1
9
作者 杨双涛 符博 +1 位作者 于晨晨 胡长建 《北京大学学报(自然科学版)》 EI CAS CSCD 北大核心 2021年第1期31-37,共7页
针对多轮会话中的Non-Sentential Utterances(NSUs)问题,结合当前在自然语言处理领域广泛使用的预训练语言模型,将Masked Language Model用于多轮会话NSUs的重写任务,提出Masked Rewriter Model。与基于Seq2Seq的重写模型相比,重写效果... 针对多轮会话中的Non-Sentential Utterances(NSUs)问题,结合当前在自然语言处理领域广泛使用的预训练语言模型,将Masked Language Model用于多轮会话NSUs的重写任务,提出Masked Rewriter Model。与基于Seq2Seq的重写模型相比,重写效果提升明显。根据NSUs重写任务特点,将Masked Language Model与Pointer Network相结合,提出基于Masked-Pointer Rewriter Model的多轮会话重写模型,利用指针网络,提升重写模型对上文信息的关注程度,在BERT Masked Rewriter模型的基础上进一步提升重写效果。 展开更多
关键词 人机交互 预训练语言模型 指针网络 会话重写
在线阅读 下载PDF
融入实体翻译的汉越神经机器翻译模型 被引量:2
10
作者 高盛祥 侯哲 +1 位作者 余正涛 赖华 《计算机应用》 北大核心 2025年第1期69-74,共6页
在汉越低资源翻译任务中,句子中的实体词准确翻译是一大难点。针对实体词在训练语料中出现的频率较低,模型无法构建双语实体词之间的映射关系等问题,构建一种融入实体翻译的汉越神经机器翻译模型。首先,通过汉越实体双语词典预先获取源... 在汉越低资源翻译任务中,句子中的实体词准确翻译是一大难点。针对实体词在训练语料中出现的频率较低,模型无法构建双语实体词之间的映射关系等问题,构建一种融入实体翻译的汉越神经机器翻译模型。首先,通过汉越实体双语词典预先获取源句中实体词的翻译结果;其次,将结果拼接在源句末端作为模型的输入,同时在编码端引入“约束提示信息”增强表征;最后,在解码端融入指针网络机制,以确保模型能复制输出源端句的词汇。实验结果表明,该模型相较于跨语言模型XLM-R(Cross-lingual Language Model-RoBERTa)的双语评估替补(BLEU)值在汉越方向提升了1.37,越汉方向提升了0.21,时间性能上相较于Transformer该模型在汉越方向和越汉方向分别缩短3.19%和3.50%,可有效地提升句子中实体词翻译的综合性能。 展开更多
关键词 汉越神经机器翻译 实体翻译 双语词典 指针网络 低资源
在线阅读 下载PDF
基于大语言模型和提示学习的旅游文本实体关系联合抽取方法 被引量:2
11
作者 徐春 苏明钰 +2 位作者 马欢 吉双焱 王萌萌 《数据分析与知识发现》 北大核心 2025年第7期130-140,共11页
【目的】针对旅游领域知识分散、标注数据有限导致的微调效率低、抽取性能不佳等问题,进行小样本场景下实体关系抽取方法的研究。【方法】基于大模型GLM进行旅游领域的提示学习后,对输入文本进行编码表示,结合全局指针网络完成潜在关系... 【目的】针对旅游领域知识分散、标注数据有限导致的微调效率低、抽取性能不佳等问题,进行小样本场景下实体关系抽取方法的研究。【方法】基于大模型GLM进行旅游领域的提示学习后,对输入文本进行编码表示,结合全局指针网络完成潜在关系预测和特定关系下的实体识别,抽取关系三元组。【结果】在自建旅游数据集和百度DuIE数据集上进行实验,本文模型的F1值分别为90.51%和89.45%,较传统关系抽取模型分别提升2.37和0.16个百分点。【局限】提示学习仅应用于旅游领域和特定编码器,在应用场景方面还有拓展空间。【结论】本文方法能够更好地对旅游文本进行实体关系联合抽取,提示学习和大语言模型编码器可以缓解小样本场景下模型训练效果不佳的问题,有效提高实体关系抽取的准确率。 展开更多
关键词 实体关系抽取 大语言模型 提示学习 全局指针网络
原文传递
基于对抗训练和全局指针网络的医疗文本 实体关系联合抽取模型 被引量:2
12
作者 段宇锋 柏萍 《情报科学》 北大核心 2025年第3期47-57,共11页
【目的/意义】在比较分析现有关系抽取方法的基础上,构建适用于医疗文本的关系抽取模型。【方法/过程】构建AGP模型实现关系抽取。该模型将医疗文本的嵌入表示输入Transformer编码器进一步提取文本特征,利用全局指针网络解码。为了提高... 【目的/意义】在比较分析现有关系抽取方法的基础上,构建适用于医疗文本的关系抽取模型。【方法/过程】构建AGP模型实现关系抽取。该模型将医疗文本的嵌入表示输入Transformer编码器进一步提取文本特征,利用全局指针网络解码。为了提高鲁棒性,模型引入了对抗训练。【结果/结论】AGP模型在CMeIE-V1、CMeIE-V2和DiaKG数据集上F1值分别达到0.6190、0.5321和0.5684。实验结果证明AGP模型在医疗文本关系抽取任务上的性能优于基准模型。【创新/局限】本文提出的模型未整合大语言模型。 展开更多
关键词 对抗训练 全局指针网络 关系抽取 预训练模型 医疗文本
原文传递
基于层叠式指针网络的供需事件抽取模型
13
作者 白宇 宁培强 +1 位作者 张桂平 王凌云 《中文信息学报》 北大核心 2025年第10期109-121,共13页
供需事件抽取任务旨在从非结构化文本中识别与供需活动相关的事件信息并以结构化的形式呈现出来。该文将供需事件抽取任务划分为触发词抽取、元素抽取两个子任务并对其分别建模,提出了一种层叠式指针网络管道模型。利用触发词文字信息... 供需事件抽取任务旨在从非结构化文本中识别与供需活动相关的事件信息并以结构化的形式呈现出来。该文将供需事件抽取任务划分为触发词抽取、元素抽取两个子任务并对其分别建模,提出了一种层叠式指针网络管道模型。利用触发词文字信息、触发词位置信息、触发词标记信息建立两个子任务之间的有效特征连接,并通过堆叠多层指针网络、级联解码解决了供需事件抽取中普遍存在的元素跨度较长、多事件共现、元素重叠嵌套等问题。在供需事件数据集上的实验结果显示,该文提出的模型在触发词抽取任务和元素抽取任务上的F 1值分别达到95.32%和83.53%,总体F 1值达到86.91%。 展开更多
关键词 事件抽取 供需事件 指针网络 管道模型 特征连接
在线阅读 下载PDF
A Cooperative Location Management Scheme for Mobile Ad Hoc Networks 被引量:1
14
作者 Demin LI Jiacun WANG +2 位作者 Liping ZHANG Hao LI Jie ZHOU 《International Journal of Communications, Network and System Sciences》 2009年第8期732-741,共10页
A mobile ad hoc network (MANET) is a kind of wireless ad hoc network. It is a self-configuring network of mobile routers connected by wireless links. Since MANETs do not have a fixed infrastructure, it is a chal-lenge... A mobile ad hoc network (MANET) is a kind of wireless ad hoc network. It is a self-configuring network of mobile routers connected by wireless links. Since MANETs do not have a fixed infrastructure, it is a chal-lenge to design a location management scheme that is both scalable and cost-efficient. In this paper, we propose a cooperative location management scheme, called CooLMS, for MANETs. CooLMS combines the strength of grid based location management and pointer forwarding strategy to achieve high scalability and low signaling cost. An indepth formal analysis of the location management cost of CooLMS is presented. In particular, the total location management cost of mobile nodes moving at variable velocity is estimated using the Gauss_Markov mobility model for the correlation of mobility velocities. Simulation results show CooLMS performs better than other schemes under certain circumstances. 展开更多
关键词 Ad HOC network Grid HOME Region LOCATION Management FORWARDING pointer COST Estimation
在线阅读 下载PDF
基于深度学习的指针式仪表自动读数与读数校正方法
15
作者 朱均超 张明惠 +2 位作者 韩芳芳 王玉军 宋思源 《仪表技术与传感器》 北大核心 2025年第7期50-56,共7页
为了实现不同量程指针式仪表的自动精准读数,文中提出了一种基于深度学习的指针式仪表自动读数与读数校正的方法。针对不同量程指针式仪表的自动读数,首先,采用YOLOv5模型和U-Net模型进行仪表的检测及指针与刻度线信息的分割;随后利用PP... 为了实现不同量程指针式仪表的自动精准读数,文中提出了一种基于深度学习的指针式仪表自动读数与读数校正的方法。针对不同量程指针式仪表的自动读数,首先,采用YOLOv5模型和U-Net模型进行仪表的检测及指针与刻度线信息的分割;随后利用PP-OCRv3模型读取量程信息,实现对不同量程的仪表信息提取;最后将读取的量程信息代入夹角占比公式计算出仪表读数。针对倾斜仪表读数不准确的问题,构建BP神经网络拟合出检测读数与实际读数的非线性映射关系,实现对不同倾斜角度的指针式仪表检测读数的校正。实验表明:该方法能够得出不同量程的精准读数,平均绝对百分比误差MAPE为2.6845%。 展开更多
关键词 指针式仪表 深度学习 BP神经网络 读数校正 自动读数 OCR模型
在线阅读 下载PDF
融合知识和语义信息的双编码器自动摘要模型 被引量:1
16
作者 贾莉 马廷淮 +1 位作者 桑晨扬 潘倩 《计算机工程与应用》 北大核心 2025年第7期213-221,共9页
为了解决自动文本摘要任务存在的文本语义信息不能充分编码、生成的摘要语义冗余、原始语义信息丢失等语义问题,提出了一种融合知识和文本语义信息的双编码器自动摘要模型(dual-encoder automatic summarization model incorporating kn... 为了解决自动文本摘要任务存在的文本语义信息不能充分编码、生成的摘要语义冗余、原始语义信息丢失等语义问题,提出了一种融合知识和文本语义信息的双编码器自动摘要模型(dual-encoder automatic summarization model incorporating knowledge and semantic information,KSDASum)。该方法采用双编码器对原文语义信息进行充分编码,文本编码器获取全文的语义信息,图结构编码器维护全文上下文结构信息。解码器部分采用基于Transformer结构和指针网络,更好地捕捉文本和结构信息进行交互,并利用指针网络的优势提高生成摘要的准确性。同时,训练过程中采用强化学习中自我批判的策略梯度优化模型能力。该方法在CNN/Daily Mail和XSum公开数据集上与GSUM生成式摘要方法相比,在评价指标上均获得最优的结果,证明了所提模型能够有效地利用知识和语义信息,提升了生成文本摘要的能力。 展开更多
关键词 知识图谱编码器 图注意力机制 指针网络 增强训练 自动摘要
在线阅读 下载PDF
基于改进指针网络的无人机数据采集路径规划 被引量:1
17
作者 陈修恒 左燕 彭冬亮 《无线电工程》 2025年第9期1869-1876,共8页
由于无人机的电池续航能力有限,单次飞行任务难以完成所有传感器点的数据采集,需要在充电桩之间多次往返进行能量补充。为了解决无人机能量约束下可充电无人机数据采集中的路径规划问题,提出一种基于深度强化学习的新算法。该方法采用... 由于无人机的电池续航能力有限,单次飞行任务难以完成所有传感器点的数据采集,需要在充电桩之间多次往返进行能量补充。为了解决无人机能量约束下可充电无人机数据采集中的路径规划问题,提出一种基于深度强化学习的新算法。该方法采用指针网络(Pointer Networks,PN)解决组合优化的方式建立序列决策模型,通过Actor-Critic强化学习算法框架对模型参数进行训练,并对无人机决策进行短期预测的方法,改进指针网络的决策输出。仿真结果显示,算法收敛速率提升了10%以上,最优结果提升了7%~17%。所提算法不仅提升了无人机任务执行的效率,还提高了无人机数据采集的收益。 展开更多
关键词 无人机数据采集任务规划 组合优化问题 指针网络 Actor-Critic 深度强化学习
在线阅读 下载PDF
融合PERT与高效全局指针网络的电力变压器缺陷文本实体识别方法
18
作者 林蔚青 郑垂锭 +4 位作者 陈静 江灏 肖洒 王铭海 缪希仁 《电网技术》 北大核心 2025年第11期4876-4887,共12页
电力变压器缺陷文本蕴含大量与设备可靠性密切相关的信息,可为变压器的智能化运维及寿命周期管理提供重要支撑。依托基于Transformer的双向编码器表示(bidirectional encoder representation from transformers,BERT)模型,文章提出一种... 电力变压器缺陷文本蕴含大量与设备可靠性密切相关的信息,可为变压器的智能化运维及寿命周期管理提供重要支撑。依托基于Transformer的双向编码器表示(bidirectional encoder representation from transformers,BERT)模型,文章提出一种融合乱序语言模型预训练BERT(pre-training BERT with permuted language model,PERT)与高效全局指针(efficient global pointer,EGP)网络的电力变压器缺陷文本实体识别方法。首先,在大规模中文语料库上利用乱序语言模型进行预训练以形成PERT模型。其次,PERT作为语义编码层,以深入挖掘实体内部的语义依赖关系,并捕捉复杂文本中的语言特征;EGP作为信息解码层,专注于精确定位关键信息并提取实体在缺陷文本中的分布特征,进而准确识别缺陷实体。最后,运用PERT-EGP模型识别缺陷文本中包含的缺陷设备、缺陷部件、缺陷部位、缺陷现象和缺陷程度5类实体。算例结果表明,相较于现有方法,该方法不仅在成分复杂的复合实体和长文本上效果提升显著,而且大幅缩短模型训练时间,具有更好的文本识别性能。 展开更多
关键词 缺陷文本 变压器 实体识别 乱序语言模型 高效全局指针网络
原文传递
基于提示学习和全局指针网络的中文古籍实体关系联合抽取方法 被引量:4
19
作者 李斌 林民 +3 位作者 斯日古楞 高颖杰 王玉荣 张树钧 《计算机应用》 北大核心 2025年第1期75-81,共7页
基于“预训练+微调”范式的实体关系联合抽取方法依赖大规模标注数据,在数据标注难度大、成本高的中文古籍小样本场景下微调效率低,抽取性能不佳;中文古籍中普遍存在实体嵌套和关系重叠的问题,限制了实体关系联合抽取的效果;管道式抽取... 基于“预训练+微调”范式的实体关系联合抽取方法依赖大规模标注数据,在数据标注难度大、成本高的中文古籍小样本场景下微调效率低,抽取性能不佳;中文古籍中普遍存在实体嵌套和关系重叠的问题,限制了实体关系联合抽取的效果;管道式抽取方法存在错误传播问题,影响抽取效果。针对以上问题,提出一种基于提示学习和全局指针网络的中文古籍实体关系联合抽取方法。首先,利用区间抽取式阅读理解的提示学习方法对预训练语言模型(PLM)注入领域知识以统一预训练和微调的优化目标,并对输入句子进行编码表示;其次,使用全局指针网络分别对主、客实体边界和不同关系下的主、客实体边界进行预测和联合解码,对齐成实体关系三元组,并构建了PTBG(Prompt Tuned BERT with Global pointer)模型,解决实体嵌套和关系重叠问题,同时避免了管道式解码的错误传播问题;最后,在上述工作基础上分析了不同提示模板对抽取性能的影响。在《史记》数据集上进行实验的结果表明,相较于注入领域知识前后的OneRel模型,PTBG模型所取得的F1值分别提升了1.64和1.97个百分点。可见,PTBG模型能更好地对中文古籍实体关系进行联合抽取,为低资源的小样本深度学习场景提供了新的研究思路与方法。 展开更多
关键词 实体关系联合抽取 全局指针网络 提示学习 预训练语言模型 中文古籍
在线阅读 下载PDF
基于全局指针限定窗口的中文医学实体识别
20
作者 仇家康 张卫山 +2 位作者 陈涛 张宝宇 朱宜昌 《计算机工程与设计》 北大核心 2025年第9期2586-2591,共6页
针对中文医学文本复杂嵌套实体难以处理的问题,提出一种基于全局指针限定窗口的中文医学实体识别模型。该模型通过医疗领域自适应预训练和新词挖掘,学习并适应医疗领域的特定数据分布。使用全局指针网络解码,并引入实体限定窗口,有效减... 针对中文医学文本复杂嵌套实体难以处理的问题,提出一种基于全局指针限定窗口的中文医学实体识别模型。该模型通过医疗领域自适应预训练和新词挖掘,学习并适应医疗领域的特定数据分布。使用全局指针网络解码,并引入实体限定窗口,有效减少长冗余负样本对模型训练的干扰。为降低模型对样本顺序的敏感性,采用最优自蒸馏策略,使模型学习到更高质量的知识和特征表示。实验结果表明,该模型在4个公开数据集上的性能均显著高于基线模型。 展开更多
关键词 实体识别 中文医学 模型蒸馏 文本挖掘 全局指针 神经网络 深度学习
在线阅读 下载PDF
上一页 1 2 9 下一页 到第
使用帮助 返回顶部