期刊文献+
共找到13篇文章
< 1 >
每页显示 20 50 100
融合多阶段特征的中文命名实体识别模型
1
作者 杨先凤 范玥 +1 位作者 李自强 汤依磊 《计算机工程与设计》 北大核心 2025年第1期37-43,共7页
针对中文命名实体识别中未充分利用完整的文本表示和语句特征的问题,提出一种融合多阶段特征的中文命名实体识别模型(LM-CNER)。采用全局注意力机制文本融合字符级嵌入与其预训练词向量,同时获取字符级特征和单词级特征。采用翻转长短... 针对中文命名实体识别中未充分利用完整的文本表示和语句特征的问题,提出一种融合多阶段特征的中文命名实体识别模型(LM-CNER)。采用全局注意力机制文本融合字符级嵌入与其预训练词向量,同时获取字符级特征和单词级特征。采用翻转长短时记忆网络(Re-LSTM)进行上下文特征提取,采用多头自注意力机制进行句法分析,并将二者进行拼接。使用条件随机场作为解码器,得到命名实体识别结果。在微博和简历两个数据集上的实验结果表明,该模型能够获取更加准确的文本表示和语句特征,提升模型的实体识别效果。 展开更多
关键词 命名实体识别 翻转长短时记忆网络 注意力机制 编码器 预训练词向量 多阶段特征 条件随机场
在线阅读 下载PDF
基于VMD再分解和CNN-LSTM算法的大坝渗流预测方法
2
作者 刘阳 聂倩文 +2 位作者 赵琛 苏凡 刘希北 《河南科学》 2025年第9期1289-1297,共9页
渗流事故的发生将带来溃坝的风险,准确预测大坝渗流是大坝安全稳定运行的重要保障。为此,综合运用信号分解技术和深度学习理论,提出了一种性能优良的基于VMD再分解和CNN-LSTM算法的大坝渗流预测方法。首先,利用变分模态分解(VMD)算法对... 渗流事故的发生将带来溃坝的风险,准确预测大坝渗流是大坝安全稳定运行的重要保障。为此,综合运用信号分解技术和深度学习理论,提出了一种性能优良的基于VMD再分解和CNN-LSTM算法的大坝渗流预测方法。首先,利用变分模态分解(VMD)算法对原始渗流监测序列进行多尺度分解,以解决原始序列的强波动性;其次,对VMD分解残差进行再分解,以挖掘残差中的有效渗流信息;然后,利用CNN和LSTM的网络结构特性,构建CNN-LSTM预测算法,其中CNN用以提取多尺度渗流分量中的关键信息,LSTM旨在赋予模型时序分析能力;最后即可完成大坝渗流预测模型的构建。案例分析表明:所提方法能够有效解决原始渗流序列强波动性对预测精度的不良影响;同时所提方法也解决了单一时间序列样本匮乏的问题,增强了建模数据丰富度,大大降低了传统多尺度预测建模的复杂度,避免了多个子序列预测结果叠加给预测精度带来的不利影响;与几个传统方法相比,所提方法对大坝渗流的预测精度最优。本研究可为大坝安全监控提供一种新的思路。 展开更多
关键词 大坝渗流 预测 VMD再分解 CNN-LSTM 深度学习
在线阅读 下载PDF
基于深度学习模型集成的日最高和最低气温订正预报研究
3
作者 卢姝 郭可萌 +3 位作者 周悦 傅承浩 许霖 顾雪 《热带气象学报》 CSCD 北大核心 2024年第6期1018-1029,共12页
采用2018—2023年中国气象局陆面数据同化系统的气温资料以及欧洲中期天气预报中心的高分辨率模式预报产品(ECMWF-IFS),分别建立基于时空堆叠的残差网络(Res-STS)以及基于自注意力(Self-Attention)机制的长短期记忆网络(Attention-LSTM)... 采用2018—2023年中国气象局陆面数据同化系统的气温资料以及欧洲中期天气预报中心的高分辨率模式预报产品(ECMWF-IFS),分别建立基于时空堆叠的残差网络(Res-STS)以及基于自注意力(Self-Attention)机制的长短期记忆网络(Attention-LSTM),并将两个模型进行集成,构建集成神经网络模型(Ensemble),得到涵盖湖南地区的0.05°×0.05°气温网格日最高、最低气温预报产品。结果表明:深度学习模型均有效改善了ECMWF-IFS预报效果,0—24 h预报时效日最高气温的平均绝误差(MAE)相比ECMWF-IFS和中央气象台指导报(SCMOC)分别降低了25.76%~40.40%和15.03%~31.79%,日最低气温的MAE分别降低了10.53%~31.58%和5.31%~19.47%,其中Ensemble模型在绝大多数月份的预报效果均是最优。同时,Ensemble模型有效弥补了ECMWF-IFS对地形复杂区域预报效果弱的缺陷,日最高气温预报准确率(F2)达85%的面积占比为17.31%,而其余模型低于6%;日最低气温F2达90%的面积占比为68.63%,高出单一模型21.08%~63.09%。由此可见,多模型集成能够显著提高气温预报的准确性和可靠性。 展开更多
关键词 Res-STS Attention-LSTM 多模型集成 ECMWF-IFS 气温预报
在线阅读 下载PDF
基于Res-Bi-LSTM的人脸表情识别 被引量:5
4
作者 梁华刚 王亚茹 张志伟 《计算机工程与应用》 CSCD 北大核心 2020年第13期204-209,共6页
人脸表情识别在人机交互、临床医学、安全驾驶等方面有着广泛的应用前景。针对传统LSTM网络只能根据单向传播信息学习表情时序特征的局限,提出在双向传播的Bi-LSTM网络基础上,采用恒等映射残差理论有效防止易受网络深度引起的梯度消失... 人脸表情识别在人机交互、临床医学、安全驾驶等方面有着广泛的应用前景。针对传统LSTM网络只能根据单向传播信息学习表情时序特征的局限,提出在双向传播的Bi-LSTM网络基础上,采用恒等映射残差理论有效防止易受网络深度引起的梯度消失问题。又因为提取空间特征的Inception-V3网络存在参数过多,容易过拟合等问题,提出添加两个Reduction模块减少参数,进而得到泛化性更好的Inception-w模型。最后对设计的模型在CK+和Oulu-CASIA两个数据集上进行实验,并与现有方法进行对比。实验可得最高识别率为99.6%,表明该方法在一定范围内具有较好的识别准确率。 展开更多
关键词 表情识别 Inception-w模型 Res-Bi-LSTM 时空特征
在线阅读 下载PDF
基于Res-LSTM的燃料电池系统故障检测
5
作者 全睿 乐有生 +2 位作者 李涛 常雨芳 谭保华 《昆明理工大学学报(自然科学版)》 北大核心 2022年第6期68-77,共10页
质子交换膜燃料电池系统由多个子系统组成,其运行机理复杂,在运行中易发生多种故障,对其进行故障检测有利于控制策略调整,提高系统的可靠性.本文运用残差-长短期记忆网络(Residual Network with Long Short-Term Memory, Res-LSTM)对质... 质子交换膜燃料电池系统由多个子系统组成,其运行机理复杂,在运行中易发生多种故障,对其进行故障检测有利于控制策略调整,提高系统的可靠性.本文运用残差-长短期记忆网络(Residual Network with Long Short-Term Memory, Res-LSTM)对质子交换膜燃料电池系统的输入输出关系进行建模,运用基于模型的方法对燃料电池系统进行故障检测.实验结果表明,残差-长短期记忆网络能准确预测正常状态的燃料电池输出电压,通过电压残差阈值比较,可以进行故障检测.与长短期记忆网络相比,残差-长短期记忆网络的预测结果更精确,训练速度更快,电压残差阈值更小,从而可以获得更准确的故障检测结果. 展开更多
关键词 质子交换膜燃料电池 故障检测 残差-长短期记忆网络 模型
原文传递
基于再编码的无监督时间序列异常检测模型 被引量:9
6
作者 尹春勇 周立文 《计算机应用》 CSCD 北大核心 2023年第3期804-811,共8页
针对时间序列的数据不平衡和高度复杂的时间相关性导致的异常检测准确率低的问题,以生成对抗网络(GAN)作为基础提出一种基于再编码的无监督时间序列异常检测模型RTGAN。首先,使用具有周期一致性的多个生成器保证生成样本的多样性,从而... 针对时间序列的数据不平衡和高度复杂的时间相关性导致的异常检测准确率低的问题,以生成对抗网络(GAN)作为基础提出一种基于再编码的无监督时间序列异常检测模型RTGAN。首先,使用具有周期一致性的多个生成器保证生成样本的多样性,从而学习不同的异常模式;其次,使用堆叠式LSTM-dropout RNN捕获时间相关性;然后,使用二次编码在潜在空间中比较生成样本和真实样本之间的差异,并将此差异作为再编码误差当作异常分数的一部分,从而提高异常检测的准确率;最后,使用新的异常分数对单变量和多变量时间序列数据集进行异常检测。将所提模型与七种基线异常检测模型在单变量和多变量时间序列上进行了比较。实验结果表明,所提模型在所有数据集上均获得了最高的平均F1值(0.815),并且总体性能分别比原始自编码器(AE)模型Dense-AE和最新的基准模型USAD高出36.29%和8.52%。通过不同的信噪比(SNR)检测模型的健壮性,结果表明所提模型一直优于LSTM-VAE、USAD和OmniAnomaly,尤其在SNR为30%情况下,RTGAN的F1值分别比USAD和OmniAnomaly高出13.53%和10.97%。可见所提模型能有效提高异常检测的准确率和鲁棒性。 展开更多
关键词 生成对抗网络 异常检测 时间序列 堆叠式长短期记忆网络 自编码器 再编码
在线阅读 下载PDF
融合多尺度注意力和双向LSTM的行人重识别 被引量:5
7
作者 闫昊雷 李小春 +3 位作者 张仁飞 张磊 邱浪波 王哲 《空军工程大学学报》 CSCD 北大核心 2022年第5期71-76,共6页
将深度学习应用于行人重识别领域,嵌入多尺度注意力融合模块至神经网络中进行多尺度特征提取和表示,可有效提升注意力机制对深度学习网络的识别性能。提出了一种基于SEblock的多尺度通道注意力融合模块,并结合Res Net50卷积神经网络提... 将深度学习应用于行人重识别领域,嵌入多尺度注意力融合模块至神经网络中进行多尺度特征提取和表示,可有效提升注意力机制对深度学习网络的识别性能。提出了一种基于SEblock的多尺度通道注意力融合模块,并结合Res Net50卷积神经网络提取特征;然后通过双向LSTM网络进一步提取特征序列上下文信息,在提高模型对图像重要特征的提取能力的同时,降低对图像冗余特征的关注度;最后使用级联难采样三元组损失函数和交叉熵损失函数共同训练网络模型,使样本能够在高维特征空间中实现聚类,进一步提升模型识别准确性。所提出算法在Market1501数据集和CUHK03数据集分别进行实验,并在同等条件下和其他注意力模块算法进行比较。为进一步验证各模块作用,对算法进行消融实验,以验证各模块的有效性,实验结果表明,所提出方法可有效应用于行人重识别。 展开更多
关键词 注意力机制 卷积神经网络 行人重识别 深度学习 LSTM
在线阅读 下载PDF
密集帧率采样的视频标题生成 被引量:2
8
作者 汤鹏杰 谭云兰 +1 位作者 李金忠 谭彬 《计算机科学与探索》 CSCD 北大核心 2018年第6期981-993,共13页
使用固定时间间隔取帧的方式用于视频标题生成,易导致多种静态或动态信息丢失,使得生成的句子质量难以提高。针对这一问题,提出了一种使用密集帧率采样的标题生成方法(dense frame rate sampling based captioning model,DFS-CM),将视... 使用固定时间间隔取帧的方式用于视频标题生成,易导致多种静态或动态信息丢失,使得生成的句子质量难以提高。针对这一问题,提出了一种使用密集帧率采样的标题生成方法(dense frame rate sampling based captioning model,DFS-CM),将视频分为多个长度统一的片段,提取片段中所有视频帧的深度CNN(convolutional neural network)特征,然后使用均值或最大值方法,降低了特征数量,增强了特征的稀疏程度;同时,还改善了模型的训练策略,增强了模型的稳定性和泛化能力。最后在S2VT框架的基础上,使用Goog Le Net和Res Net-152两种CNN模型,对所提方法进行了验证。在Youtube2Text数据集上的实验结果表明,无论是采用均值特征还是最大值特征,其模型性能与基准模型相比均得到了改善,尤其是使用Res Net-152和最大值方式,其B@4和CIDEr分别达到了47.1%和34.1%。 展开更多
关键词 视频 标题生成 GoogLeNet ResNet 长短时记忆(LSTM) 密集帧率采样
在线阅读 下载PDF
基于重加权策略平衡损失与LSTM的窃电行为检测研究 被引量:12
9
作者 吕笃良 刘梦爽 +3 位作者 桓露 孙羽森 刘通宇 袁培森 《智慧电力》 北大核心 2022年第4期15-20,58,共7页
窃电行为是导致电能损失与电力企业经济效益降低的重要原因。针对窃电问题,提出了一种基于有效数量加权策略的损失函数,改善数据集分布不均衡导致训练模型泛化性能下降的问题;基于该策略,设计了基于长短期神经网络的时间序列分类模型,... 窃电行为是导致电能损失与电力企业经济效益降低的重要原因。针对窃电问题,提出了一种基于有效数量加权策略的损失函数,改善数据集分布不均衡导致训练模型泛化性能下降的问题;基于该策略,设计了基于长短期神经网络的时间序列分类模型,用于用户日用电量的窃电行为检测任务;采用用户日用电量真实数据进行实验测试,结果表明基于有效数量的加权策略可一定程度解决数据集不平衡导致的模型泛化性下降问题。与现有方法相比,所提方法在精确度上有所提高,对窃电行为检测具有有效性与可行性。 展开更多
关键词 窃电检测 重加权策略 类别平衡损失 LSTM 时间序列分类
在线阅读 下载PDF
基于Res-LSTM网络的多元化电池剩余容量实时预测 被引量:5
10
作者 陈果 黄祺尧 张志宏 《智慧电力》 北大核心 2022年第7期29-36,共8页
针对储能系统电池容量实时预测中存在的电池新旧程度不一,放电倍率、采样间隔多样等多元化问题,提出了一种全新的基于安时残差连接的长短时记忆网络。通过进行多通道传感信号的特征变换,使其更适用于多元化电池放电的实时剩余容量预测... 针对储能系统电池容量实时预测中存在的电池新旧程度不一,放电倍率、采样间隔多样等多元化问题,提出了一种全新的基于安时残差连接的长短时记忆网络。通过进行多通道传感信号的特征变换,使其更适用于多元化电池放电的实时剩余容量预测。所提方法相比于常见基线方法误差降低了11.8%,并且在多倍率测试下方差较小,具有更高的鲁棒性。 展开更多
关键词 储能系统 电池剩余容量预测 安时积分估计法 信号特征处理 Res-LSTM神经网络 多倍率放电
在线阅读 下载PDF
基于融合Dropout与注意力机制的LSTM-GRU车辆轨迹预测 被引量:20
11
作者 吴晓建 危一华 +2 位作者 王爱春 雷耀 张瑞雪 《湖南大学学报(自然科学版)》 EI CAS CSCD 北大核心 2023年第4期65-75,共11页
在智能驾驶环境的车辆轨迹预测环节,为更好地获取环境车辆的轨迹时序特征,在长短期记忆神经网络(LSTM)基础上,嵌入Dropout层以增强网络泛化性,引入注意力机制予以预测效果影响较大的时序数据更大权重从而提高预测结果的可靠性,且将改进... 在智能驾驶环境的车辆轨迹预测环节,为更好地获取环境车辆的轨迹时序特征,在长短期记忆神经网络(LSTM)基础上,嵌入Dropout层以增强网络泛化性,引入注意力机制予以预测效果影响较大的时序数据更大权重从而提高预测结果的可靠性,且将改进的LSTM模型与门控循环单元GRU模型结合,构建LSTM-GRU预测模型以进一步提升环境车辆轨迹预测的准确性.在此基础上,使用NGSIM公开数据集对模型进行训练、验证和测试.研究结果表明,融合了Dropout和注意力机制的LSTM-GRU神经网络轨迹预测模型相较标准的LSTM长短期记忆网络以及GRU门控循环单元,在预测较长时序的车辆轨迹上具有优势,提高了轨迹预测的准确性,降低了实际轨迹和预测轨迹之间的均方根误差和平均绝对误差. 展开更多
关键词 智能汽车 轨迹预测 长短期记忆神经网络 门控循环单元 注意力机制
在线阅读 下载PDF
基于多粒度和语义信息的中文关系抽取 被引量:1
12
作者 陈钰 张安勤 许春辉 《计算机系统应用》 2021年第3期190-195,共6页
中文关系抽取采用基于字符或基于词的神经网络,现有的方法大多存在分词错误和歧义现象,会不可避免的引入大量冗余和噪音,从而影响关系抽取的结果.为了解决这一问题,本文提出了一种基于多粒度并结合语义信息的中文关系抽取模型.在该模型... 中文关系抽取采用基于字符或基于词的神经网络,现有的方法大多存在分词错误和歧义现象,会不可避免的引入大量冗余和噪音,从而影响关系抽取的结果.为了解决这一问题,本文提出了一种基于多粒度并结合语义信息的中文关系抽取模型.在该模型中,我们将词级别的信息合并进入字符级别的信息中,从而避免句子分割时产生错误;借助外部的语义信息对多义词进行建模,来减轻多义词所产生的歧义现象;并且采用字符级别和句子级别的双重注意力机制.实验表明,本文提出的模型能够有效提高中文关系抽取的准确率和召回率,与其他基线模型相比,具有更好的优越性和可解释性. 展开更多
关键词 信息处理 关系抽取 注意力机制 词向量表示 双向长短期记忆网络
在线阅读 下载PDF
一种LSTM模型预测BC值的空间碎片无控再入预报方法 被引量:2
13
作者 蒯家伟 赵柯昕 +1 位作者 孙立刚 廖名传 《宇航学报》 EI CAS CSCD 北大核心 2022年第12期1731-1738,共8页
提出一种利用长短周期记忆(LSTM)神经网络模型动态预测无控再入过程中弹道系数(BC)值实现空间碎片高精度再入时刻预报。通过利用空间碎片两行根数(TLE)、简化通用摄动模型(SGP4)与公开的物体陨落时间作为实测数据样本,利用迭代修正BC值... 提出一种利用长短周期记忆(LSTM)神经网络模型动态预测无控再入过程中弹道系数(BC)值实现空间碎片高精度再入时刻预报。通过利用空间碎片两行根数(TLE)、简化通用摄动模型(SGP4)与公开的物体陨落时间作为实测数据样本,利用迭代修正BC值方法构建预测模型的训练集,由此构造用于预测BC值的LSTM模型预测BC,再采用高精度轨道外推动力学模型配合预测BC值预报再入时刻,结果表明基于LSTM模型预测BC的空间碎片再入时刻预报方法是可行的,在95%的置信度内,90天以上的再入时刻预报精度小于10%,30天预报精度小于8%。 展开更多
关键词 空间碎片 弹道系数(BC) 长短期记忆(LSTM)神经网络 两行根数(TLE) 再入预报
在线阅读 下载PDF
上一页 1 下一页 到第
使用帮助 返回顶部