期刊文献+
共找到45篇文章
< 1 2 3 >
每页显示 20 50 100
通用人工智能中的Long-Context技术分析
1
作者 赵立东 郭敬明 蒋燕 《集成电路应用》 2024年第6期410-412,共3页
阐述通用人工智能中的Long-Context技术原理,提出该技术的解决方案,包括位置编码外推、注意力机制计算优化、模型结构优化和检索增强生成。分析硬件系统的瓶颈,探讨Long-Context在通用人工智能时代的发展趋势。
关键词 long-context 位置编码 注意力机制 检索增强生成
在线阅读 下载PDF
一种双分支特征交互融合的高效红外图像彩色化方法
2
作者 陈宇 詹伟达 +2 位作者 蒋一纯 朱德鹏 韩登 《西安交通大学学报》 北大核心 2025年第8期211-222,共12页
针对现有的红外图像彩色化方法在全局特征捕获和计算复杂度方面存在显著局限性的问题,提出了一种双分支特征交互融合的高效红外图像彩色化方法。设计双分支编码器,通过局部特征提取分支获取局部空间上下文信息,确保细粒度特征的捕获,并... 针对现有的红外图像彩色化方法在全局特征捕获和计算复杂度方面存在显著局限性的问题,提出了一种双分支特征交互融合的高效红外图像彩色化方法。设计双分支编码器,通过局部特征提取分支获取局部空间上下文信息,确保细粒度特征的捕获,并通过全局特征提取分支获取全局特征,满足对长程依赖的需求。设计交互融合模块,对两个分支提取到的特征进行有效整合,显著增强了模型的整体性能。在解码器部分提出上下文聚合模块,进一步优化多尺度语义特征的聚合能力,改善了彩色化结果的边缘清晰度和细节表现力。在KAIST和FLIR数据集上进行广泛实验验证,结果表明:与现有方法相比,所提方法在两个数据集上均具有更高的彩色化质量,峰值信噪比分别达到28.645、30.459 dB,结构相似度达到0.507、0.725,均优于对比方法,且有效性和先进性也得到了验证。研究结果可为提升红外图像的可读性与可解释性以及提高夜视与恶劣环境下的观测能力提供参考。 展开更多
关键词 红外图像彩色化 细粒度特征 长程依赖 交互融合 上下文聚合
在线阅读 下载PDF
一种空间语义联合感知的红外无人机目标跟踪方法
3
作者 于国栋 蒋一纯 +5 位作者 刘云清 王义君 詹伟达 王春阳 冯江海 韩悦毅 《电子与信息学报》 北大核心 2025年第11期4242-4253,共12页
现有红外无人机目标跟踪方法在多尺度特征融合过程中存在空间和语义信息丢失问题,导致跟踪器无法精准定位无人机目标位置,降低了跟踪任务的成功率。针对上述问题,该文提出一种空间语义联合感知的红外无人机目标跟踪方法。首先,提出了空... 现有红外无人机目标跟踪方法在多尺度特征融合过程中存在空间和语义信息丢失问题,导致跟踪器无法精准定位无人机目标位置,降低了跟踪任务的成功率。针对上述问题,该文提出一种空间语义联合感知的红外无人机目标跟踪方法。首先,提出了空间语义联合注意模块,通过空间多尺度注意模块提取多尺度长程依赖特征,增强空间上下文信息的关注,并通过全局-局部通道语义注意模块交互全局和局部通道特征,确保重要语义信息的捕获。其次,设计了双分支全局特征交互模块对模板和搜索分支特征进行有效整合,显著提高了网络的整体性能。在红外无人机数据集Anti-UAV上进行了广泛实验验证,结果表明:与现有方法相比,该方法具有更好的跟踪性能,平均状态精度达到0.769,成功率达到0.743,精确度达到0.935,均优于对比方法,并且有效性、泛化性和先进性也得到了验证。 展开更多
关键词 目标跟踪 语义信息 空间上下文信息 长程依赖 特征交互
在线阅读 下载PDF
大语言模型长文本推断优化技术综述
4
作者 陶伟 王健宗 +1 位作者 张旭龙 瞿晓阳 《大数据》 2025年第6期72-94,共23页
随着大语言模型技术的快速发展,其处理长文本输入的需求日益增加,但长文本推断面临内存消耗大和时延高的问题。为提高大语言模型在长文本推断中的效率,对现有优化技术进行了全面回顾和分析。首先,揭示了影响效率的三大关键因素:一是庞... 随着大语言模型技术的快速发展,其处理长文本输入的需求日益增加,但长文本推断面临内存消耗大和时延高的问题。为提高大语言模型在长文本推断中的效率,对现有优化技术进行了全面回顾和分析。首先,揭示了影响效率的三大关键因素:一是庞大的模型体量,二是具有二次计算复杂度的注意力机制操作,三是自回归式的解码策略。这些因素共同制约了模型的整体性能表现。随后,提出了一种分类方法,将优化技术分为模型优化、计算优化和系统优化,并详细介绍了量化、稀疏注意力、算子融合等关键技术。研究结果表明,这些优化技术能有效提升长文本推断的性能。最后,展望了未来研究方向,强调了进一步优化大语言模型长文本推断的重要性,以满足不断增长的长文本推断需求。 展开更多
关键词 大语言模型 长文本推断 模型优化 计算优化 系统优化
在线阅读 下载PDF
面向深思考的高效混合注意力机制
5
作者 肖朝军 方晔玮 韩旭 《计算》 2025年第8期42-47,共6页
近年来,大语言模型通过强化学习训练获得了强大的深度推理能力,能够生成长思维链来解决复杂问题。然而,传统自注意力机制的平方复杂度在处理包含大量推理词元的长序列时产生巨大计算和存储开销,严重制约了深思考模型的训练和推理效率。... 近年来,大语言模型通过强化学习训练获得了强大的深度推理能力,能够生成长思维链来解决复杂问题。然而,传统自注意力机制的平方复杂度在处理包含大量推理词元的长序列时产生巨大计算和存储开销,严重制约了深思考模型的训练和推理效率。现有研究主要关注对深思考模型进行后处理优化,从而提升深思考模型的推理效率,忽略了训练阶段的效率问题。本研究发现,深思考场景下推理过程呈现局部性特征,使得混合注意力机制具有独特优势,将稠密注意力模型通过少量后训练转换为混合注意力模型,并基于此进行深思考训练。实验结果表明,在AIME、MATH-500和LiveCodebench等典型深思考评测集上,1:1混合注意力模型达到了与稠密注意力模型相当甚至更优的性能,同时在64k词元的上下文窗口下节省22%的训练时间开销和46.9%的键值缓存存储开销。 展开更多
关键词 混合注意力 大语言模型 高效思考 滑动窗口注意力 稀疏注意力 推理模型 思维链 长序列处理
在线阅读 下载PDF
深度思考模型带来的人工智能基础设施挑战与机遇
6
作者 章明星 《计算》 2025年第8期34-41,共8页
近年来,随着“缩放法则”带来的性能增益趋于减缓,研究者提出深度思考模型(reasoning model)新范式,通过延长上下文和链式思考路径提升智能表现。然而,这一升级也对人工智能(artificial intelligence,AI)基础设施提出了前所未有的挑战:... 近年来,随着“缩放法则”带来的性能增益趋于减缓,研究者提出深度思考模型(reasoning model)新范式,通过延长上下文和链式思考路径提升智能表现。然而,这一升级也对人工智能(artificial intelligence,AI)基础设施提出了前所未有的挑战:训练阶段需要支持更长序列、更多阶段的分布式并行与强化学习后训练流程;推理阶段则因超长输入输出和键值(keyvalue,KV)缓存激增导致算力、显存和带宽压力倍增。为此,业界在训练中综合应用张量并行、流水线并行、专家并行与序列并行,并通过DualPipe等改进掩盖通信延迟;在推理中提出“以存换算”架构,如Mooncake架构的预填充阶段/解码计算密集阶段/解码注意力阶段(简称prefill/model/attention)异构分离,以及KTransformers的计算强度导向卸载策略,实现存储与计算资源的异构协同。最后,面向未来,通过稀疏注意力机制(如MoBA、NSA)以降低长序列的O(n^(2))复杂度,为深度思考模型的下一步基础设施适配提供了新的思路。本研究梳理了代表性案例与技术路径,为行业在算法与系统协同优化上提供参考。 展开更多
关键词 深度思考模型 链式思考 人工智能基础设施 长上下文 并行训练 键值缓存 异构协同 稀疏注意力
在线阅读 下载PDF
基于预测网络的视频异常行为检测方法
7
作者 庄旭 张红民 郑敬添 《计算机仿真》 2025年第5期475-481,共7页
提出了一种优化预测网络的视频异常行为检测方法,现有的大部分视频异常行为检测方法主要基于最小化重建误差准则,缺乏对异常行为运动长期性的考虑。因此,提出了一种基于运动上下文感知的预测网络来进行视频异常行为检测。上述方法引入... 提出了一种优化预测网络的视频异常行为检测方法,现有的大部分视频异常行为检测方法主要基于最小化重建误差准则,缺乏对异常行为运动长期性的考虑。因此,提出了一种基于运动上下文感知的预测网络来进行视频异常行为检测。上述方法引入具有记忆对齐学习的长期运动上下文记忆,能够将视频帧的信息存储到存储器中,建立起当前输入帧与前后帧的映射关系以方便后续的预测,通过预测未来帧与原始帧之间的差异来检测视频目标异常行为。同时,采用具有重叠注意力的全局匹配光流估计方法来获取未来帧和原始帧的光流图,并在预测中引入运动约束让未来帧和原始帧之间的光流保持一致。此外,采用生成性对抗网络进行训练模型,让上述方法能更好地预测未来帧,提高视频异常行为检测的准确性。Avenue和ShanghaiTech两个数据集上的实验结果表明,所提方法相比于其它的视频人体异常行为检测方法有更好地表现,在Avenue和ShanghaiTech数据集中分别达到了90.7%和85.4%。 展开更多
关键词 视频异常行为检测 运动上下文感知 长期运动上下文记忆 光流估计 生成性对抗网络
在线阅读 下载PDF
多元化文化背景下饲料外贸人才培养的长效机制研究
8
作者 叶莹 《中国饲料》 北大核心 2025年第18期121-124,共4页
为探讨多元化文化背景下饲料外贸人才培养的长效机制,文章对饲料外贸人才培养的需求和重要性进行深入分析,并根据人才培养现状提出了切实可行的策略,旨在提高人才培养的针对性和有效性,实现饲料外贸人才的持续培养、发展和利用,确保人... 为探讨多元化文化背景下饲料外贸人才培养的长效机制,文章对饲料外贸人才培养的需求和重要性进行深入分析,并根据人才培养现状提出了切实可行的策略,旨在提高人才培养的针对性和有效性,实现饲料外贸人才的持续培养、发展和利用,确保人才培养始终与饲料外贸活动相适应,从而以高素质的?饲料外贸人才助推饲料企业的海外发展。 展开更多
关键词 多元化文化背景 饲料外贸 人才培养 长效机制
在线阅读 下载PDF
中国乡村地区引入长期护理保险制度的社会过程——以X市的实践为例
9
作者 刘芳 《中国农业大学学报(社会科学版)》 CSSCI 北大核心 2024年第6期50-74,共25页
本文研究主旨是乡村地区引入长期护理保险制度的社会过程与运行机制。当前,我国长期护理保险制度正处于分级式政策试验阶段,各个制度主体在其中表达自身的利益诉求和制度观念,影响并塑造着微观制度形态。本文以中国东南地区X市乡村地区... 本文研究主旨是乡村地区引入长期护理保险制度的社会过程与运行机制。当前,我国长期护理保险制度正处于分级式政策试验阶段,各个制度主体在其中表达自身的利益诉求和制度观念,影响并塑造着微观制度形态。本文以中国东南地区X市乡村地区长期护理保险实践为例,考察了地方政府、乡村社会和乡村居民在长期护理保险试点过程中的互动过程,阐述了以社会再分配利益和乡村社会基础为核心的制度微观运行机制,认为当前我国长期护理保险实践中存在地方政府与乡村社会之间具有互相独立又彼此融合的“双重主体性”特征。本文认为,当前在我国乡村地区推进长期护理保险制度建设具有必要性和紧迫性,需要寻找长期护理保险制度设计与乡村居民利益表达之间的平衡点,加强公共资源向经济—社会双薄弱地区的再分配,并系统性完善我国乡村地区养老照护服务体系建设。 展开更多
关键词 长期护理保险 社会基础 社会再分配利益 社会过程
在线阅读 下载PDF
母国制度情境下逆向知识转移的长期创新效应
10
作者 欧阳慧敏 《科学学研究》 CSSCI CSCD 北大核心 2024年第9期2000-2009,共10页
创新是跨国公司的重要发展战略,中国跨国公司能否有效利用逆向知识转移提升长期创新绩效备受关注。基于知识基础理论和制度理论,构建“逆向知识转移-组织双元学习-长期创新绩效”的理论框架,运用190份中国跨国公司调查数据和结构方程模... 创新是跨国公司的重要发展战略,中国跨国公司能否有效利用逆向知识转移提升长期创新绩效备受关注。基于知识基础理论和制度理论,构建“逆向知识转移-组织双元学习-长期创新绩效”的理论框架,运用190份中国跨国公司调查数据和结构方程模型进行检验。研究发现,逆向知识转移可以直接促进长期创新绩效的实现,也可以通过双元联合的中介作用提升长期创新绩效。并且,母国制度情境在其中发挥了重要作用。当母公司所处地区制度环境更好时,逆向知识转移对双元联合积极作用更大,也进一步促进了长期创新绩效的提升。研究结论对跨国公司创新研究形成补充并拓展了制度理论在其中的应用,为中国跨国公司长期创新发展和培养竞争优势提供了理论依据。 展开更多
关键词 逆向知识转移 组织双元学习 长期创新绩效 母国制度情境
原文传递
基于上下文方面记忆网络的方面级情感分析
11
作者 王亚新 王亮 王军 《计算机工程与设计》 北大核心 2024年第2期443-451,共9页
基于深度记忆网络在方面级情感分析中的优势及针对相关工作中忽略上下文词与方面之间位置信息的不足,提出一种基于上下文方面记忆网络的方面级情感分析方法。不同记忆网络层关注上下文记忆不同部分,获取丰富方面感知上下文信息。为充分... 基于深度记忆网络在方面级情感分析中的优势及针对相关工作中忽略上下文词与方面之间位置信息的不足,提出一种基于上下文方面记忆网络的方面级情感分析方法。不同记忆网络层关注上下文记忆不同部分,获取丰富方面感知上下文信息。为充分利用方面间信息,设计方面记忆网络更新模块,为所需方面生成邻近方面的语义和关系信息,在多计算层中的多头注意力机制输入采用两种策略计算上下文和方面词的相关性。在3个基准数据集上的实验结果表明,所提模型在性能评价指标的准确率和Macro-F1-score上与相关工作比较有一定提升。 展开更多
关键词 细粒度 方面级情感分析 深度记忆网络 双向长短期记忆网络 多注意力机制 上下文 方面记忆网络
在线阅读 下载PDF
基于双路信息时空图卷积网络的交通预测模型 被引量:3
12
作者 康雁 谢思宇 +4 位作者 王飞 寇勇奇 徐玉龙 吴志伟 李浩 《计算机科学》 CSCD 北大核心 2021年第S02期46-51,62,共7页
随着深度学习的发展,神经网络在各个领域都有着大量的应用,智慧交通系统也不例外。交通流预测是智慧交通系统的基石,是整个交通预测的核心所在。近年来,图卷积神经网络的利用有效地提高了交通预测的性能,如何进一步提高对图的时空特征... 随着深度学习的发展,神经网络在各个领域都有着大量的应用,智慧交通系统也不例外。交通流预测是智慧交通系统的基石,是整个交通预测的核心所在。近年来,图卷积神经网络的利用有效地提高了交通预测的性能,如何进一步提高对图的时空特征进行捕获的能力,将会成为热点。为了提升交通预测的精度,提出了一种基于双路信息时空图卷积网络的交通预测模型。首先,针对图卷积网络的交通预测模型在长距离依赖上建模有所不足,并且没有完全挖掘时空图信息之间的隐藏关系以及在时空图结构上还有信息缺失,提出了一种三重池化注意力机制来建模全局上下文信息。通过对图卷积层和时间卷积层各增加并行的三重池化注意力路径,构造了一个双路信息时空卷积层,提升了卷积层的泛化能力及模型捕获长距离依赖的能力,同时让时空卷积层能够很好地捕获时空图结构上的空间和时间特征,从而有效地提升了交通预测性能。在两个公共交通数据集(METR-LA和PEMS-BAY)上的实验结果表明,该模型具有较好的性能。 展开更多
关键词 交通预测 图卷积神经网络 全局上下文建模 长距离依赖
在线阅读 下载PDF
东方美学情境下的长镜头理论 被引量:3
13
作者 杨一 《绵阳师范学院学报》 2008年第9期104-107,共4页
长镜头理论兴起于西方,传入东方之后产生了巨大的影响。在当代中国,不管是电影艺术的创作还是电视纪录片的拍摄,关于长镜头理论和长镜头中所体现出来的纪实美学的探寻浪潮至今方兴未艾。本文就东西方长镜头的差异简要分析了在东方美学... 长镜头理论兴起于西方,传入东方之后产生了巨大的影响。在当代中国,不管是电影艺术的创作还是电视纪录片的拍摄,关于长镜头理论和长镜头中所体现出来的纪实美学的探寻浪潮至今方兴未艾。本文就东西方长镜头的差异简要分析了在东方美学情景观照之下的东方式长镜头的内涵和外延。 展开更多
关键词 长镜头 意境 儒道文化 诗画体现
在线阅读 下载PDF
从语境层面破解英语长句的翻译 被引量:3
14
作者 杨文 《海外英语》 2012年第8X期170-171,共2页
英语长句的翻译历来都是英语翻译中的难点。而语境的基本理论在翻译学的地位是举足轻重的。在理解英语、汉语的语言特征的基础上,从语词的场合、逻辑、语序以及时代背景等语境层面把握长句的翻译十分必要。
关键词 翻译 长句 语境
在线阅读 下载PDF
中国武术思想史研究若干议题管窥 被引量:1
15
作者 陈星潭 韩红雨 马振水 《成都体育学院学报》 CSSCI 北大核心 2018年第1期21-25,46,共6页
对武术思想史的关注,是推进武术理论的必然要求,成为当前学术研究热点。本文通过文献资料等方法,分析了武术思想史的若干议题,提出史料是武术思想史研究的基础,甄别与互证程度高低决定了思想根基深浅;语境是历史上的特定时代,是武术思... 对武术思想史的关注,是推进武术理论的必然要求,成为当前学术研究热点。本文通过文献资料等方法,分析了武术思想史的若干议题,提出史料是武术思想史研究的基础,甄别与互证程度高低决定了思想根基深浅;语境是历史上的特定时代,是武术思想发生、发展和成熟的历史现场;主体是基于占历史多数的大众习武群体,主体叙事遵循的是唯物史观,符合史学转型潮流;本体是区别于其它文化思想的抓手,是武术思想的最终建构;长时段彰显着武术思想的连续性,提醒我们摆脱"后见之明",树立"去熟悉化"意识,从"无知之幕"探究思想之流。 展开更多
关键词 中国武术 武术思想史 文化 历史语境 主体与本体 长时段
在线阅读 下载PDF
LED大屏幕设计中的几个难点和解决方法 被引量:1
16
作者 丁卫红 赵建洋 王永强 《淮阴工业专科学校学报》 2000年第1期83-85,共3页
本文主要介绍 LED大屏幕设计中信号远距离传送、图文混排、汉字平滑缩放和汉字点阵提取等关键技术。实践证明 ,实用。
关键词 信号远距离传送 图文混排 汉字点阵 LED大屏幕 设计 显示屏
在线阅读 下载PDF
坚持我国宗教中国化方向的几点思考 被引量:1
17
作者 金泽 《浙江工商大学学报》 CSSCI 北大核心 2023年第4期5-11,共7页
宗教学理论研究要为推动我国宗教坚持中国化方向助力,就要在调研问题和理论探索上多下功夫。通过理论层面对三组辩证“关系”进行探索,得出以下结论:一是宗教存在的长期性和宗教在特定时间、空间中嬗变的关系,决定了坚持宗教中国化方向... 宗教学理论研究要为推动我国宗教坚持中国化方向助力,就要在调研问题和理论探索上多下功夫。通过理论层面对三组辩证“关系”进行探索,得出以下结论:一是宗教存在的长期性和宗教在特定时间、空间中嬗变的关系,决定了坚持宗教中国化方向要着眼于当下和未来;二是宗教存在的群众性和信众的归属与身份的非等同关系,决定了坚持宗教中国化方向不能忽视“结构”及其多样性;三是传承宗教传统与调适变革的内在动力的关系,决定了坚持宗教中国化方向重在“自觉”。希冀上述思考能为推动宗教中国化、促进宗教学理论界的“三大体系”建设提供助力。 展开更多
关键词 宗教 中国化方向 长期性 群众性 辩证性
在线阅读 下载PDF
基于编解码网络UNet3+的遥感影像建筑变化检测 被引量:15
18
作者 梁燕 易春霞 王光宇 《计算机学报》 EI CAS CSCD 北大核心 2023年第8期1720-1733,共14页
遥感影像建筑变化检测需解决两个重要问题:一是双时相影像本身存在的时间依赖性问题;其二是由于建筑物密集分布,阴影效应及各对象之间的相似性导致的特征鉴别问题.该文分析现有处理方案,提出了基于UNet3+网络的边缘引导变换检测网络(Edg... 遥感影像建筑变化检测需解决两个重要问题:一是双时相影像本身存在的时间依赖性问题;其二是由于建筑物密集分布,阴影效应及各对象之间的相似性导致的特征鉴别问题.该文分析现有处理方案,提出了基于UNet3+网络的边缘引导变换检测网络(Edge-Guided Change Detection Base on UNet3+,EGCD-UNet3+).UNet3+利用全尺度的跳跃连接把来自不同尺度特征图中的深层语义与浅层语义直接结合,从多尺度聚合的特征图中学习层次表示,但是在特征提取时忽略了对象尺度规模,导致感受野与尺度不匹配.因此EGCD-UNet3+首先设计了一种具有自适应感受野的选择性核Block(Selective Kernel Block,SKB)代替UNet3+原始的Block,使影像对在提取深、浅层特征时具有自适应感受野属性.EGCD-UNet3+由编码与解码两部分构成,在编码端利用长短期记忆网络(Long Short-Term Memory,LSTM)捕捉长期依赖关系,建模像素之间的关系上下文,设计差分增强模块(Difference Enhance Module,DEM),分析影像对之间的时间相关性,解决双时相本身存在的时间依赖性问题.在解码端,EGCD-UNet3+提出边缘引导上下文模块(Edge-Guided Context Module,EGCM)进一步改善建筑检测边界的性能,在更细粒度水平上有效提取多尺度空间边缘信息.最后,EGCD-UNet3+利用同时具备像素分割误差和边缘分割误差的复合损失函数,使网络能够充分学习有效的特征进行准确的标签预测.所提模型在LEVIR-CD与WHU-CD数据集上验证,精准率(P)分别达到90.75%、91.75%,召回率(R)可分别增长到96.68%、92.42%,F1-score(F1)分别增加到93.15%、92.08%,总体分割精确度(OA)分别达到99.12%、98.96%,且交并比(IoU)分别增加到83.96%、74.91%. 展开更多
关键词 变化检测 差分增强 长短期记忆 选择性核 边缘引导上下文
在线阅读 下载PDF
融合时间上下文与长短期偏好的序列推荐模型 被引量:1
19
作者 胡胜利 林凯 《湖北民族大学学报(自然科学版)》 CAS 2022年第3期328-335,共8页
在以往基于自注意力机制的序列推荐模型中,由于忽略上下文信息和长期行为信息,常导致模型无法捕捉到多层次的序列特征.因此提出一种融合时间上下文与长短期偏好的序列推荐模型.首先利用感知时间间隔的自注意力机制来建模用户和项目短期... 在以往基于自注意力机制的序列推荐模型中,由于忽略上下文信息和长期行为信息,常导致模型无法捕捉到多层次的序列特征.因此提出一种融合时间上下文与长短期偏好的序列推荐模型.首先利用感知时间间隔的自注意力机制来建模用户和项目短期行为交互的关系模式,然后补充用户长期偏好来增强用户特征表示,并利用门控机制将长短期偏好表示进行融合生成用户最终兴趣表示.最后对用户交互项目间的共现模式进行建模,并结合用户最终兴趣表示进行项目推荐.在3个公开数据集上进行实验的结果验证了该模型的有效性. 展开更多
关键词 序列推荐 时间信息 项目共现 上下文信息 长短期偏好
在线阅读 下载PDF
基于BiLSTM-CNN串行混合模型的文本情感分析 被引量:34
20
作者 赵宏 王乐 王伟杰 《计算机应用》 CSCD 北大核心 2020年第1期16-22,共7页
针对现有文本情感分析方法准确率不高、实时性不强以及特征提取不充分的问题,构建了双向长短时记忆神经网络和卷积神经网络(BiLSTM-CNN)的串行混合模型。首先,利用双向循环长短时记忆(BiLSTM)神经网络提取文本的上下文信息;然后,对已提... 针对现有文本情感分析方法准确率不高、实时性不强以及特征提取不充分的问题,构建了双向长短时记忆神经网络和卷积神经网络(BiLSTM-CNN)的串行混合模型。首先,利用双向循环长短时记忆(BiLSTM)神经网络提取文本的上下文信息;然后,对已提取的上下文特征利用卷积神经网络(CNN)进行局部语义特征提取;最后,使用Softmax得出文本的情感倾向。通过与CNN、长短时记忆神经网络(LSTM)、BiLSTM等单一模型对比,所提出的文本情感分析模型在综合评价指标F1上分别提高了2.02个百分点、1.18个百分点和0.85个百分点;与长短时记忆神经网络和卷积神经网络(LSTM-CNN)、BiLSTM-CNN并行特征融合等混合模型对比,所提出的文本情感分析模型在综合评价指标F1上分别提高了1.86个百分点和0.76个百分点。实验结果表明,基于BiLSTM-CNN的串行混合模型在实际应用中具有较大的价值。 展开更多
关键词 文本情感分析 上下文信息 语义特征 长短时记忆神经网络 卷积神经网络
在线阅读 下载PDF
上一页 1 2 3 下一页 到第
使用帮助 返回顶部