期刊文献+
共找到373篇文章
< 1 2 19 >
每页显示 20 50 100
Exploiting multi-context analysis in semantic image classification
1
作者 田永鸿 黄铁军 高文 《Journal of Zhejiang University-Science A(Applied Physics & Engineering)》 SCIE EI CAS CSCD 2005年第11期1268-1283,共16页
As the popularity of digital images is rapidly increasing on the Internet, research on technologies for semantic image classification has become an important research topic. However, the well-known content-based image... As the popularity of digital images is rapidly increasing on the Internet, research on technologies for semantic image classification has become an important research topic. However, the well-known content-based image classification methods do not overcome the so-called semantic gap problem in which low-level visual features cannot represent the high-level semantic content of images. Image classification using visual and textual information often performs poorly since the extracted textual features are often too limited to accurately represent the images. In this paper, we propose a semantic image classification ap- proach using multi-context analysis. For a given image, we model the relevant textual information as its multi-modal context, and regard the related images connected by hyperlinks as its link context. Two kinds of context analysis models, i.e., cross-modal correlation analysis and link-based correlation model, are used to capture the correlation among different modals of features and the topical dependency among images induced by the link structure. We propose a new collective classification model called relational support vector classifier (RSVC) based on the well-known Support Vector Machines (SVMs) and the link-based cor- relation model. Experiments showed that the proposed approach significantly improved classification accuracy over that of SVM classifiers using visual and/or textual features. 展开更多
关键词 Image classification multi-context analysis Cross-modal correlation analysis Link-based correlation model Linkage semantic kernels Relational support vector classifier
在线阅读 下载PDF
基于尺度交互蒸馏网络的薄壳山核桃品种识别方法 被引量:2
2
作者 赵宁 陈智坤 +3 位作者 杨朋飞 王瑞多 张计育 李永荣 《农业工程学报》 北大核心 2025年第5期209-216,共8页
薄壳山核桃是一种重要的经济坚果,由于品种繁多,对其进行快速科学的鉴定是进行种质资源保护与品种选育的重要基础。为了实现薄壳山核桃品种的快速鉴定,该研究针对品种鉴定提出了基于尺度交互蒸馏网络的薄壳山核桃品种识别方法,通过学习... 薄壳山核桃是一种重要的经济坚果,由于品种繁多,对其进行快速科学的鉴定是进行种质资源保护与品种选育的重要基础。为了实现薄壳山核桃品种的快速鉴定,该研究针对品种鉴定提出了基于尺度交互蒸馏网络的薄壳山核桃品种识别方法,通过学习薄壳山核桃的可判别性特征实现品种鉴定。研究选择波尼等12种薄壳山核桃,建立了9048张实拍图像的品种识别数据集;针对薄壳山核桃图片取样中距离变化导致的目标尺度多样性问题,设计了一种全局-局部特征协同学习方案,用于提取尺度不变特征;与此同时,该研究结合尺度知识蒸馏方案,通过训练提取的不同尺度数据进行预测保证模型训练的有效性。结果表明,通过训练该方法对上述12个品种的薄壳山核桃品种识别准确率均达到了96.98%,显著提高了薄壳山核桃的品种鉴定准确率。该研究开发的薄壳山核桃品种自动识别模型对于未来果实鉴定及产品分选提供了技术手段。 展开更多
关键词 薄壳山核桃 品种鉴定 尺度交互蒸馏 多尺度上下文注意融合 知识蒸馏
在线阅读 下载PDF
面向复杂背景下烟雾火焰检测的改进YOLOv8s算法 被引量:2
3
作者 马耀名 张鹏飞 谭福生 《计算机工程与应用》 北大核心 2025年第3期121-130,共10页
针对复杂背景下烟雾火焰目标与背景混淆,导致烟雾火焰检测精度低等问题,提出一种面向复杂背景下烟雾火焰检测的YOLOv8s改进模型。特征通道之间具有高度相似性,为了有效利用跨不同通道间的冗余,提高模型对烟雾火焰目标和背景的区分,设计... 针对复杂背景下烟雾火焰目标与背景混淆,导致烟雾火焰检测精度低等问题,提出一种面向复杂背景下烟雾火焰检测的YOLOv8s改进模型。特征通道之间具有高度相似性,为了有效利用跨不同通道间的冗余,提高模型对烟雾火焰目标和背景的区分,设计了C2fFR(C2f with partial rep conv)轻量级特征提取模块。设计了MCFM(multi-scale context fusion module)多尺度上下文融合模块,来捕捉并利用上下文信息,增强特征的表示。使用Inner-SIoU损失函数,解决边界框不匹配的问题,提高模型对高IoU样本的回归能力。实验结果表明,改进后的YOLOv8s烟雾火焰检测模型相比于基线模型YOLOv8s,mAP@50提升了4.6个百分点,mAP@50:95提升了2.3个百分点,模型参数量降低了18.9%,计算量降低了8.1%,FPS为93帧/s,与其他主流检测算法相比也具有较好的检测性能。 展开更多
关键词 YOLOv8s C2fFR 多尺度上下文融合 Inner-SIoU
在线阅读 下载PDF
融合全局选择与局部区分的车辆重识别网络
4
作者 徐胜军 张梦倩 +2 位作者 詹博涵 刘光辉 孟月波 《系统仿真学报》 北大核心 2025年第1期220-233,共14页
针对跨镜头多视角差异导致车辆重识别面临的不同视角、复杂背景和光照强度等干扰问题,提出了一种融合全局选择与局部区分的车辆重识别网络。基于Resnet50骨干网络,设计了融合全局特征与局部特征的三分支互补网络,利用全局分支学习车辆... 针对跨镜头多视角差异导致车辆重识别面临的不同视角、复杂背景和光照强度等干扰问题,提出了一种融合全局选择与局部区分的车辆重识别网络。基于Resnet50骨干网络,设计了融合全局特征与局部特征的三分支互补网络,利用全局分支学习车辆的整体外观信息,局部分支捕获车辆的差异性细节信息。基于注意力机制提出了上下文特征选择模块(context feature selection module,CFSM),有效分离了车辆信息与复杂背景信息,并提出了一种细节特征增强模块(detail feature enhancement module,DFEM),利用部件之间的相对位置信息强化多粒度特征细节信息的学习。提出了一种权值自适应平衡策略,联合多损失函数进行训练。实验结果表明,所提网络在VeRi-776数据集上的mAP、CMC@1和CMC@5分别达到73.2%、93.4%和97.3%;在VehicleID数据集的大规模测试子集上,CMC@1和CMC@5分别达到75.0%和92.7%。与对比网络相比,所提网络具有较高的识别率和鲁棒性。 展开更多
关键词 车辆重识别 多分支结构 全局上下文特征 局部区分特征 权值自适应策略
原文传递
浅析文创T恤的社会生命史
5
作者 宋德风 邵丹丹 《染整技术》 2025年第7期112-114,共3页
文化创意产品本质上是承载文化的物品,经由人为的文化注入,转化为具有特殊价值的商品。物品在此过程中承担着展示、宣传文化的功能。以文创T恤为研究对象,结合阿尔君·阿帕杜莱的物的社会生命理论,探讨文创T恤在商品化—去商品化—... 文化创意产品本质上是承载文化的物品,经由人为的文化注入,转化为具有特殊价值的商品。物品在此过程中承担着展示、宣传文化的功能。以文创T恤为研究对象,结合阿尔君·阿帕杜莱的物的社会生命理论,探讨文创T恤在商品化—去商品化—再商品化这一动态流动过程中的社会生命历程。从理论层面阐释文创产品与物的社会生命之间的关联,剖析文创T恤从设计与生产到流通与消费,再到再生与争议等各个阶段所呈现出的社会生命特征,揭示其在不同社会情境下的多元意义与价值。旨在为文化创意产业的发展提供新的视角和思路,使文创T恤在各个阶段都能获得全新的生命。 展开更多
关键词 文创T恤 物的社会生命 文创产品 多语境
在线阅读 下载PDF
基于YOLOv5s的舰船小目标检测方法研究
6
作者 师红宇 蔡自桂 +1 位作者 杜文 张哲于 《舰船电子工程》 2025年第2期34-38,73,共6页
海面舰船目标检测容易受陆地、海浪等背景的干扰。针对舰船小目标检测精度低和鲁棒性差的问题,提出一种改进的舰船目标检测模型CWMA-YOLOv5s。首先,设计具有多分支跨层连接的C2f模块丰富多目标舰船梯度流信息。然后,设计并实现了残差多... 海面舰船目标检测容易受陆地、海浪等背景的干扰。针对舰船小目标检测精度低和鲁棒性差的问题,提出一种改进的舰船目标检测模型CWMA-YOLOv5s。首先,设计具有多分支跨层连接的C2f模块丰富多目标舰船梯度流信息。然后,设计并实现了残差多头自注意力融合模块优化特征融合效果。其次,改进Predection网络,设计SCP结构,提高了舰船目标的显著度。最后,引入改进的WIOU损失函数解决CIOU损失函数带来的梯度爆炸和模型提前退化问题。实验结果表明,与YOLOv5s模型相比,该模型在MASATI-v2数据集上,精度提高了13.1%,召回率提高了12.8%,mAP@50提高了6.8%。与其他同类型检测算法相比,该算法拥有更好的学习能力,整体检测精度达到了82.3%,具有较强的鲁棒性。 展开更多
关键词 舰船检测 多头自注意力机制 空间上下文金字塔 WIOU损失函数
在线阅读 下载PDF
多情景模拟下福州市土地利用变化对生态系统服务价值的影响 被引量:2
7
作者 刘凡可 肖桂荣 《国土与自然资源研究》 2025年第3期26-30,共5页
本文以福州市为研究区,基于四期土地利用数据和生态系统服务价值评估模型,设定耕地保护、城市发展、生态保护和自然发展4种情景,运用MCCA模型模拟出2035年不同情景下土地利用变化对福州市生态系统服务价值的影响。结果表明,建设用地显... 本文以福州市为研究区,基于四期土地利用数据和生态系统服务价值评估模型,设定耕地保护、城市发展、生态保护和自然发展4种情景,运用MCCA模型模拟出2035年不同情景下土地利用变化对福州市生态系统服务价值的影响。结果表明,建设用地显著增加会导致耕地、林地和草地总量降低,造成ESV降低。生态保护情景放缓了建设用地扩展速率,林地资源的恢复使其ESV出现了上涨,是最符合福州市未来国土空间规划的土地利用优化最优情景。林地和水域是影响生态质量最显著的两种地类,未来规划过程中应加大对林地和水域的保护与治理。研究结果可为福州市土地利用格局完善和生态环境质量提高提供参考依据。 展开更多
关键词 土地利用模拟 MCCA模型 多情景 生态系统服务价值 福州市
在线阅读 下载PDF
A Visual Analysis Approach for Community Detection of Multi-Context Mobile Social Networks 被引量:3
8
作者 马昱欣 徐佳逸 +5 位作者 彭帝超 张婷 金呈哲 屈华民 陈为 彭群生 《Journal of Computer Science & Technology》 SCIE EI CSCD 2013年第5期797-809,共13页
The problem of detecting community structures of a social network has been extensively studied over recent years, but most existing methods solely rely on the network structure and neglect the context information of t... The problem of detecting community structures of a social network has been extensively studied over recent years, but most existing methods solely rely on the network structure and neglect the context information of the social relations. The main reason is that a context-rich network offers too much flexibility and complexity for automatic or manual modulation of the multifaceted context in the analysis process. We address the challenging problem of incorporating context information into the community analysis with a novel visual analysis mechanism. Our approach consists of two stages: interactive discovery of salient context, and iterative context-guided community detection. Central to the analysis process is a context relevance model (CRM) that visually characterizes the influence of a given set of contexts on the variation of the detected communities, and discloses the community structure in specific context configurations. The extracted relevance is used to drive an iterative visual reasoning process, in which the community structures are progressively discovered. We introduce a suite of visual representations to encode the community structures, the context as well as the CRM. In particular, we propose an enhanced parallel coordinates representation to depict the context and community structures, which allows for interactive data exploration and community investigation. Case studies on several datasets demonstrate the efficiency and accuracy of our approach. 展开更多
关键词 visual analysis community detection multi-context
原文传递
基于多尺度高斯上下文特征激励的舰船目标检测方法
9
作者 张嘉丹 朱坤 +3 位作者 张振超 龚志辉 郭海涛 戴晨光 《地球信息科学学报》 北大核心 2025年第10期2498-2509,共12页
【目的】针对高分辨率遥感影像幅宽大、背景复杂,舰船目标细节特征丰富以及易受相似目标干扰等特点,本文提出一种基于多尺度高斯上下文特征激励的舰船目标检测方法。【方法】首先,设计了联合空间和通道注意力机制的高斯上下文转换模块(S... 【目的】针对高分辨率遥感影像幅宽大、背景复杂,舰船目标细节特征丰富以及易受相似目标干扰等特点,本文提出一种基于多尺度高斯上下文特征激励的舰船目标检测方法。【方法】首先,设计了联合空间和通道注意力机制的高斯上下文转换模块(Spatial and Channel-Gaussian Context Transformer,SC-GCT),实现了前景目标的可辨识性表达,有效缓解了背景噪声以及相似性目标干扰等问题。其次,引入了多尺度特征自适应加权融合方法(Multi-scale Feature Adaptive Fusion,MFAF),构建信息表达更充分的特征图,实现了目标语义与空间位置的精确表征。【结果】本文在HRSC2016数据集上进行了对比实验,结果表明,本文算法的检测精度mAP值达到了96.8%,相较于基线模型YOLOv8提升了1.3%,且检测精度和效率均优于现有主流舰船目标检测算法;在基础网络中添加SC-GCT以及MFAF模块后,mAP值分别提升了0.7%和1.1%,验证了本文算法中各模块的有效性。为进一步验证本文算法的实际应用价值,选取横须贺港、旅顺港、梅波特港等不同真实港口场景下的遥感影像测试,结果表明算法在复杂真实环境中仍能保持稳定性能。【结论】本文算法有效提升了舰船目标检测精度,在复杂背景舰船检测任务中具有良好的实用性与泛化性。 展开更多
关键词 遥感影像 舰船目标检测 注意力机制 高斯上下文 多尺度特征 YOLOv8 HRSC2016
原文传递
以AI塑形智慧图书馆:基于智能体的下一代图书馆服务平台 被引量:3
10
作者 刘炜 张磊 +1 位作者 嵇婷 陈晓扬 《农业图书情报学报》 2025年第5期15-26,共12页
[目的/意义]云计算时代提出的图书馆服务平台(LSP)未能实现其成为图书馆统一解决方案的承诺,在智慧图书馆时代又面临新的发展瓶颈。其相对刚性的架构、孤岛化的数据模型和有限的智能水平,难以满足现代用户对新型资源生态的获取,及主动... [目的/意义]云计算时代提出的图书馆服务平台(LSP)未能实现其成为图书馆统一解决方案的承诺,在智慧图书馆时代又面临新的发展瓶颈。其相对刚性的架构、孤岛化的数据模型和有限的智能水平,难以满足现代用户对新型资源生态的获取,及主动式服务的迫切需求。本文旨在提出一种基于大语言模型(LLM)智能体(Agent)的下一代LSP架构A-LSP,以解决现有LSP的局限性,并推动图书馆服务平台向人工智能时代转型。[方法/过程]该架构引入了一个新的3层概念模型,包括实现标准化工具集成的MCP市场、负责编排调度的智能体中间件,以及支持功能扩展的智能体应用生态层。同时,文章面向未来图书馆提出了“五大中心”的建设需求框架,即智慧资源中心、智慧服务中心、智慧学习中心、智慧学术交流中心与智慧文化传承中心,以构建图书馆技术与业务融合的蓝图。[结果/结论]研究提出的A-LSP架构通过基于模型上下文协议(MCP)的API封装,确保了对现有系统的后向兼容性,能够在不替换原有系统的基础上实施新的平台战略。这一基于智能体的图书馆服务平台可以看成是现有LSP的重要升级,将驱动其从以资源管理为中心转向以智能体服务为中心,成为人工智能时代的图书馆服务平台。 展开更多
关键词 智能体 智慧图书馆 图书馆服务平台 大语言模型 多智能体系统 模型上下文协议
在线阅读 下载PDF
基于多尺度上下文提取的小样本野生动物检测
11
作者 刘珂 林珊玲 +4 位作者 师欣雨 林坚普 吕珊红 林志贤 郭太良 《液晶与显示》 北大核心 2025年第3期516-526,共11页
针对野生动物数据集样本量小、目标尺度多变所导致的野生动物检测困难以及检测精度低等问题,提出一种基于多尺度上下文提取的小样本野生动物检测(MS-FSWD)算法。首先,通过多尺度上下文提取模块增强模型对不同尺度的野生动物的感知能力,... 针对野生动物数据集样本量小、目标尺度多变所导致的野生动物检测困难以及检测精度低等问题,提出一种基于多尺度上下文提取的小样本野生动物检测(MS-FSWD)算法。首先,通过多尺度上下文提取模块增强模型对不同尺度的野生动物的感知能力,提高检测性能;其次,引入Res2Net作为原型校准模块的强分类网络对分类器输出的分类分数进行校正;然后,在RPN中加入置换注意力机制,增强目标区域的特征图,弱化背景信息;最后,将平衡L1损失作为定位损失函数,提升目标定位性能。实验结果表明,相比DeFRCN算法,MS-FSWD在小样本野生动物数据集FSWA上,1-shot和3-shot检测任务中新类AP50分别提升了9.9%和6.6%;在公共数据集PASCAL VOC上,MS-FSWD最高提升了12.6%。与VFA算法相比,在PASCAL VOC数据集Novel Set 3的10-shot任务中,新类AP50提升了3.3%。 展开更多
关键词 小样本目标检测 野生动物检测 迁移学习 多尺度上下文提取 注意力机制
在线阅读 下载PDF
改进TransCenter的组合距离多目标跟踪方法
12
作者 赵海涛 岳希 +1 位作者 唐聃 蔡博 《计算机工程与应用》 北大核心 2025年第9期177-185,共9页
在智能驾驶和视频监控领域中,多目标跟踪被广泛应用,但在目标发生遮挡和非线性运动时,此时产生的噪声会造成检测和跟踪精度的降低,同时众多关联匹配算法也没有考虑到IoU和外观失衡的情况。针对以上问题,提出一种基于TransCenter改进的... 在智能驾驶和视频监控领域中,多目标跟踪被广泛应用,但在目标发生遮挡和非线性运动时,此时产生的噪声会造成检测和跟踪精度的降低,同时众多关联匹配算法也没有考虑到IoU和外观失衡的情况。针对以上问题,提出一种基于TransCenter改进的多目标跟踪网络。引用小波变换处理检测特征,设计了上下文协同选择器,通过动态选择跟踪特征和检测特征来缓解噪声产生的负面影响;融合卡尔曼滤波预测值和跟踪位移,以提高非线性运动中的预测位移准确度;根据IoU距离和外观距离的差值优化组合距离的权重,解决了高速运动和外观剧烈变化时组合距离失效的情况。在BDD100k、DanceTrack数据集上进行了实验,结果表明,与ByteTrack算法相比,改进网络的mMOTA和HOTA值分别提升了4.3和5.9个百分点,与TransCenter相比,HOTA提升了7.4个百分点,且有着更好的灵活性和跟踪精度。 展开更多
关键词 多目标跟踪 卡尔曼滤波 上下文协同 组合距离
在线阅读 下载PDF
基于MYOLOv8的目标检测方法 被引量:2
13
作者 张正勃 曹爱岷 王兴盛 《计算机测量与控制》 2025年第1期93-98,113,共7页
针对当前的目标检测方法难以表征多尺度上下文特征的问题,提出了MYOLOv8算法;为了提高YOLOv8模型对于小、中、大型目标的检测能力,提出了一种分层多尺度提取模块对空间特征进行分层特征聚合来捕获多尺度空间上下文信息;为了进一步提高... 针对当前的目标检测方法难以表征多尺度上下文特征的问题,提出了MYOLOv8算法;为了提高YOLOv8模型对于小、中、大型目标的检测能力,提出了一种分层多尺度提取模块对空间特征进行分层特征聚合来捕获多尺度空间上下文信息;为了进一步提高模型对于空间语义的提取能力,提出了一种自适应的通道注意力机制,该机制通过自适应地学习相邻通道之间的相互依赖关系来促进模型关注有用特征,抑制无用特征;为了提高模型对于边界困难样本的定位能力,提出了一种Slide Loss来处理目标检测中的样本不平衡问题,该方法采用对困难样本进行强加权的方式来促使模型着重优化难分样本;在MS COCO数据集上的实验结果表明,所提出的算法相比于YOLOv8-n和YOLOv8-s,mAP分别提升了3.4%和1.4%,同时具有相似的参数量和计算开销,以及更快的推理速度。 展开更多
关键词 目标检测 多尺度上下文 分层特征聚合 注意力机制 样本不平衡
在线阅读 下载PDF
基于高效特征提取和大感受野的无人机航拍图像目标检测
14
作者 沈朕宇 朱凤华 +2 位作者 王知学 沈震 熊刚 《智能系统学报》 北大核心 2025年第4期813-821,共9页
针对无人机航拍图像中存在小目标、目标遮挡、背景复杂的问题,提出一种基于高效特征提取和大感受野的目标检测网络(efficient feature and large receptive field network,EFLF-Net)。通过优化检测层架构降低小目标漏检率;在主干网络融... 针对无人机航拍图像中存在小目标、目标遮挡、背景复杂的问题,提出一种基于高效特征提取和大感受野的目标检测网络(efficient feature and large receptive field network,EFLF-Net)。通过优化检测层架构降低小目标漏检率;在主干网络融合新的构建模块以提升特征提取效率;引入内容感知特征重组模块和大型选择性核网络,增强颈部网络对遮挡目标的上下文感知能力;采用Wise-IoU损失函数优化边界框回归稳定性。在VisDrone2019数据集上的实验结果表明,EFLF-Net较基准模型在平均精度上提高了5.2%。与已有代表性的目标检测算法相比,该方法对存在小目标、目标相互遮挡和复杂背景的无人机航拍图像有更好的检测效果。 展开更多
关键词 无人机航拍图像 小目标检测 特征提取 多尺度变化 YOLOv8 上下文信息 感受野 损失函数
在线阅读 下载PDF
基于SecureViT的恶意代码检测模型
15
作者 张傲 刘微 +2 位作者 刘阳 李波 刘芳菲 《电子测量技术》 北大核心 2025年第16期113-121,共9页
随着恶意代码的多样性和隐蔽性不断增加,传统的恶意代码检测方法在面对未知恶意代码时往往面临高成本和不稳定性的挑战。本研究旨在提出一种轻量化且高效的恶意代码检测模型,以适应资源受限环境中的应用需求。本文提出了一种基于Secure... 随着恶意代码的多样性和隐蔽性不断增加,传统的恶意代码检测方法在面对未知恶意代码时往往面临高成本和不稳定性的挑战。本研究旨在提出一种轻量化且高效的恶意代码检测模型,以适应资源受限环境中的应用需求。本文提出了一种基于SecureViT的轻量化恶意代码检测模型。该模型通过引入ACF模块与MSDC模块实现高效特征提取与精准分类。ACF模块增强了模型对全局上下文信息的建模能力,MSDC模块则通过多尺度特征提取与动态显著性调整进一步提升特征表达的丰富性。实验结果表明,SecureViT模型在Malimg、Virus-MNIST和BIG2015数据集上的分类精度分别为97.46%、91.17%和95.49%,且计算开销仅为1.71 GMAC,显著提高了检测性能并有效降低了计算成本。该模型在恶意代码检测中展现了优异的检测精度与低计算复杂度,具备在资源受限环境中的实际应用潜力。 展开更多
关键词 恶意代码检测 上下文融合 多尺度卷积 轻量化深度学习模型
原文传递
“三链驱动”的新商科专业管理学课程“三阶六环”教学改革 被引量:1
16
作者 武新星 范颖 《对外经贸》 2025年第5期152-155,共4页
管理学是一门研究各类组织管理活动的普遍规律、基本原理和一般方法的新商科专业学生专业基础课程。立足于新时代管理学教育,根据“以学生为中心,以现实问题为导向,以管理情境为依托”的“十四五”期间新商科专业人才培养方案新要求,以... 管理学是一门研究各类组织管理活动的普遍规律、基本原理和一般方法的新商科专业学生专业基础课程。立足于新时代管理学教育,根据“以学生为中心,以现实问题为导向,以管理情境为依托”的“十四五”期间新商科专业人才培养方案新要求,以及课程存在的教学痛点,以管理育人为目标,聚焦课前“知识情境规划”、课中“四大教学情境创设”和课后“多维多元评价”的“三阶六环”教学效果提升,通过混合式教学模式的应用、过程性评价与终结性评价的结合以及教学内容和方法的创新保障“三阶六环”教学改革方案的实施,取得了良好效果。 展开更多
关键词 新商科专业 管理学课程 知识情境规划 教学情境创设 多维多元评价 教学改革与创新
在线阅读 下载PDF
基于多尺度上下文注意力U-SegNet的遥感目标检测
17
作者 陈瑞霞 张善文 吴青娥 《电讯技术》 北大核心 2025年第8期1187-1195,共9页
针对遥感目标图像多样、目标较小且与周围环境对比度差,导致现有目标检测方法复杂度高、检测效果差、泛化能力弱,以及经典U-Net和U-SegNet忽略了不同目标尺度特征感受野差异等问题,提出了一种基于多尺度上下文注意力U-SegNet(Multi-scal... 针对遥感目标图像多样、目标较小且与周围环境对比度差,导致现有目标检测方法复杂度高、检测效果差、泛化能力弱,以及经典U-Net和U-SegNet忽略了不同目标尺度特征感受野差异等问题,提出了一种基于多尺度上下文注意力U-SegNet(Multi-scale Context Attention U-SegNet,MSCAUSNet)的遥感目标检测新模型。该模型由U-SegNet、多尺度特征融合(Multi-scale Feature Fusion,MSFF)和多尺度上下文注意力(Multi-scale Context Attention,MSCA)模块组成,采用MSCA代替U-SegNet中的跳跃连接以融合目标低层特征与高层特征,并通过MSFF和MSCA模块充分捕获多尺度上下文特征,从而显著提升遥感多尺度目标检测性能。在遥感目标图像数据集上的实验结果表明,该模型能够有效检测不同尺度遥感目标,较经典U-Net和U-SegNet的检测精度分别提高了7.94%和5.09%。该模型为遥感目标检测和识别系统提供了技术支持。 展开更多
关键词 遥感多尺度目标检测 多尺度上下文注意力U-SegNet 多尺度上下文注意力 多尺度特征融合
在线阅读 下载PDF
基于通道注意力和特征融合的伪造语音检测研究
18
作者 汤龙 雷震春 《计算机技术与发展》 2025年第10期131-138,共8页
随着深度学习技术的迅猛发展,语音伪造技术对自动说话人验证系统的安全性构成严峻挑战,语音伪造检测系统依旧面临准确率不足、场景单一等问题。该文提出了一种结合通道注意力和特征融合的伪造语音检测方法,以解决语音伪造检测系统面临... 随着深度学习技术的迅猛发展,语音伪造技术对自动说话人验证系统的安全性构成严峻挑战,语音伪造检测系统依旧面临准确率不足、场景单一等问题。该文提出了一种结合通道注意力和特征融合的伪造语音检测方法,以解决语音伪造检测系统面临的一系列问题。为了聚集丰富的上下文信息和融合尺度不一致的特征,该文提出了双分支通道注意力模块,利用深度卷积沿通道维度聚合多尺度上下文信息,同时在两个分支上捕捉全局和局部特征信息;然后提出了注意力特征融合模块,将LFCC特征经过真实语音GMM和欺骗语音GMM得到对数高斯概率特征,随后基于注意力进行特征融合以学习具有通道上下文信息和全局局部特征信息的交互特征,解决了特征融合机制场景单一的问题。与基线系统相比,文中最佳系统AFF-ResNet在ASVSpoof2021LA数据集上的EER和min t-DCF分别降低37.5%和15.3%。实验结果表明,该方法显著提升了语音欺骗检测的准确率。 展开更多
关键词 伪造语音检测 对数高斯概率特征 通道注意力 深度卷积 多尺度上下文信息 特征融合
在线阅读 下载PDF
基于CNN和Transformer结合的野生菌分类
19
作者 李向阳 龙朝勋 +1 位作者 李海燕 余鹏飞 《计算机仿真》 2025年第6期578-583,588,共7页
针对野生菌分类困难的问题,提出了一种基于卷积神经网络和Transformer结合的算法。选取ResNeXt50作为基础网络,首先,引入Transformer中的多头自注意力来增强感受野;其次,改进多头自注意力,使其能够充分利用相邻键之间的上下文信息,提取... 针对野生菌分类困难的问题,提出了一种基于卷积神经网络和Transformer结合的算法。选取ResNeXt50作为基础网络,首先,引入Transformer中的多头自注意力来增强感受野;其次,改进多头自注意力,使其能够充分利用相邻键之间的上下文信息,提取到更有效的特征;最后,参照Transformer的结构引入高斯误差线性单元(GELU)和层归一化(LN)替代残差块中的ReLU激活函数和BN层,并减少它们的数量。在自建野生菌数据集上进行实验,对比其它七种算法,所改进的模型达到了最高的分类准确率97.63%,在野生菌识别上具有较好的识别效果。 展开更多
关键词 野生菌分类 卷积神经网络 多头自注意力 上下文信息
在线阅读 下载PDF
结合局部感知与多层次注意力的多模态方面级情感分析
20
作者 曾碧卿 姚勇涛 +3 位作者 谢梁琦 陈鹏飞 邓会敏 王瑞棠 《计算机工程》 北大核心 2025年第9期80-90,共11页
多模态方面级情感分析(MABSA)旨在从图文对中分析方面词的情感极性。现有方法致力于抽取图像和文本的情感特征。然而,图像和文本的各个特征不一定对最终的情感分析是有效的,图像和文本通常在方面词情感相关的区域外含有大量的冗余信息... 多模态方面级情感分析(MABSA)旨在从图文对中分析方面词的情感极性。现有方法致力于抽取图像和文本的情感特征。然而,图像和文本的各个特征不一定对最终的情感分析是有效的,图像和文本通常在方面词情感相关的区域外含有大量的冗余信息与噪声信息,并且图像和文本的不同区域可能对应不同方面词,导致在构建图像和文本特征抽取的初步阶段引入噪声。此外,图像和文本的方面词相关的情感极性可能是对立的,即两者存在交互信息。为了解决上述问题,提出结合局部感知与多层次注意力的MABSA模型。首先,设计局部感知模块,筛选与方面词语义相关的文本内容及图像区域;然后,引入多层次注意力模块,使用瓶颈注意力机制进行模态交互信息的提取,提高了情感信息的聚合准确率。实验结果表明,该模型能够在Twitter2015、Twitter2017、Multi-ZOL数据集上达到SOTA(State-of-the-Art)性能,显著优于同类模型。 展开更多
关键词 多模态方面级情感分析 局部感知 多层次注意力 局部上下文 瓶颈注意力
在线阅读 下载PDF
上一页 1 2 19 下一页 到第
使用帮助 返回顶部