期刊文献+
共找到388篇文章
< 1 2 20 >
每页显示 20 50 100
Exploiting multi-context analysis in semantic image classification
1
作者 田永鸿 黄铁军 高文 《Journal of Zhejiang University-Science A(Applied Physics & Engineering)》 SCIE EI CAS CSCD 2005年第11期1268-1283,共16页
As the popularity of digital images is rapidly increasing on the Internet, research on technologies for semantic image classification has become an important research topic. However, the well-known content-based image... As the popularity of digital images is rapidly increasing on the Internet, research on technologies for semantic image classification has become an important research topic. However, the well-known content-based image classification methods do not overcome the so-called semantic gap problem in which low-level visual features cannot represent the high-level semantic content of images. Image classification using visual and textual information often performs poorly since the extracted textual features are often too limited to accurately represent the images. In this paper, we propose a semantic image classification ap- proach using multi-context analysis. For a given image, we model the relevant textual information as its multi-modal context, and regard the related images connected by hyperlinks as its link context. Two kinds of context analysis models, i.e., cross-modal correlation analysis and link-based correlation model, are used to capture the correlation among different modals of features and the topical dependency among images induced by the link structure. We propose a new collective classification model called relational support vector classifier (RSVC) based on the well-known Support Vector Machines (SVMs) and the link-based cor- relation model. Experiments showed that the proposed approach significantly improved classification accuracy over that of SVM classifiers using visual and/or textual features. 展开更多
关键词 Image classification multi-context analysis Cross-modal correlation analysis Link-based correlation model Linkage semantic kernels Relational support vector classifier
在线阅读 下载PDF
基于特征融合及多尺度上下文提取的实时语义分割
2
作者 刘伯红 刘磊 《重庆邮电大学学报(自然科学版)》 北大核心 2026年第1期167-176,共10页
针对实时语义分割算法常用的双分支结构存在空间分支和上下文分支特征融合不充分、多尺度上下文信息提取不全面等问题,提出基于特征融合及多尺度上下文提取的实时语义分割网络。设计空间-多尺度双向注意力融合模块,使用空间注意力机制... 针对实时语义分割算法常用的双分支结构存在空间分支和上下文分支特征融合不充分、多尺度上下文信息提取不全面等问题,提出基于特征融合及多尺度上下文提取的实时语义分割网络。设计空间-多尺度双向注意力融合模块,使用空间注意力机制和多尺度特征融合模块实现双分支交互融合,促进空间特征以及语义特征在双分支上的流动;在上下文分支末端设计了串联聚合金字塔池化模块,更精确地捕捉细节信息;聚合空间分支不同阶段特征,增强模型对图像特征的全面理解能力,促进深层特征与浅层特征的深度融合;使用多尺度注意力特征融合模块引导空间分支和上下文分支融合。实验结果表明,构建的网络在Cityscapes数据集上平均交并比(mean intersection over union,MIoU)达到78.0%,推理速度为104.5 Frame/s;在CamVid数据集上,MIoU达到75.9%,推理速度为224.6 Frame/s。 展开更多
关键词 实时语义分割 特征融合 注意力机制 多尺度上下文提取
在线阅读 下载PDF
从感知到意向:多场景智能产品的用户体验研究综述
3
作者 武月琴 苏洋 《包装工程》 北大核心 2026年第2期485-496,共12页
目的系统梳理近十年来多场景智能产品用户体验领域的研究进展,探讨其在跨场景设计与优化中的理论与实践价值。方法基于文献计量学方法,结合中国知网等相关学术期刊文献,筛选2015年至2025年的相关研究并运用CiteSpace与VOSviewer进行关... 目的系统梳理近十年来多场景智能产品用户体验领域的研究进展,探讨其在跨场景设计与优化中的理论与实践价值。方法基于文献计量学方法,结合中国知网等相关学术期刊文献,筛选2015年至2025年的相关研究并运用CiteSpace与VOSviewer进行关键词共现、时间线演化及主题聚类分析,从应用场景、交互设计与用户体验三个维度解析研究热点、发展趋势与关键问题。结果多场景智能产品的用户体验呈现显著的情境依赖性与领域差异性,主要问题集中在功能适配、界面优化、个性化服务、情感体验四个方面。同时,揭示用户体验设计正从单一功能优化向多场景适应与情感共鸣方向发展。结论提出“感知-行为-认知-意向”四层多场景用户体验框架,不仅为解决多场景体验差异问题提供系统化方法论,而且为智能产品设计优化与多场景用户体验提升提供理论依据与实践参考。 展开更多
关键词 多场景 智能产品设计 用户体验 情景理论
在线阅读 下载PDF
A Visual Analysis Approach for Community Detection of Multi-Context Mobile Social Networks 被引量:3
4
作者 马昱欣 徐佳逸 +5 位作者 彭帝超 张婷 金呈哲 屈华民 陈为 彭群生 《Journal of Computer Science & Technology》 SCIE EI CSCD 2013年第5期797-809,共13页
The problem of detecting community structures of a social network has been extensively studied over recent years, but most existing methods solely rely on the network structure and neglect the context information of t... The problem of detecting community structures of a social network has been extensively studied over recent years, but most existing methods solely rely on the network structure and neglect the context information of the social relations. The main reason is that a context-rich network offers too much flexibility and complexity for automatic or manual modulation of the multifaceted context in the analysis process. We address the challenging problem of incorporating context information into the community analysis with a novel visual analysis mechanism. Our approach consists of two stages: interactive discovery of salient context, and iterative context-guided community detection. Central to the analysis process is a context relevance model (CRM) that visually characterizes the influence of a given set of contexts on the variation of the detected communities, and discloses the community structure in specific context configurations. The extracted relevance is used to drive an iterative visual reasoning process, in which the community structures are progressively discovered. We introduce a suite of visual representations to encode the community structures, the context as well as the CRM. In particular, we propose an enhanced parallel coordinates representation to depict the context and community structures, which allows for interactive data exploration and community investigation. Case studies on several datasets demonstrate the efficiency and accuracy of our approach. 展开更多
关键词 visual analysis community detection multi-context
原文传递
基于级联注意力的结肠息肉图像分割算法研究
5
作者 周孟然 陆鹏 《重庆工商大学学报(自然科学版)》 2026年第1期1-10,共10页
目的针对现有Transformer模型在息肉图像分割中存在注意力分散以及作为编码器提取的多级特征在融合时易产生信息丢失导致的分割精度不高的问题,提出一种新的分割模型PVT-CAMNet。方法在该模型中,使用金字塔式Transformer(Pyramid Vision... 目的针对现有Transformer模型在息肉图像分割中存在注意力分散以及作为编码器提取的多级特征在融合时易产生信息丢失导致的分割精度不高的问题,提出一种新的分割模型PVT-CAMNet。方法在该模型中,使用金字塔式Transformer(Pyramid Vision Transformer,PVT)作为编码器,接着设计了多尺度特征注意力提取模块(Multi-scale Feature Attention Extraction,MFAE)和层间注意力聚合模块(Inter-layer Attention Aggregation,IA)。其中,PVT通过其自注意力机制保证了模型的泛化能力,MFAE使用不同大小的滤波器多尺度提取特征,旨在缓解注意力分散问题;IA交互融合不同层级特征,有效解决多级特征融合产生的信息丢失问题;最后引入全局上下文模块(Global Context,GC)使模型更好地理解特征图之间的像素依赖关系。结果在Kvasir、CVC-ClinicDB、CVC-ColonDB和ETIS数据集上进行了评估,相较于最优基线模型,mDice、mIoU分别提高了1.76%、0.81%、1.51%、1.74%、3.15%、2.65%和1.73%、3.84%。结论PVT-CAMNet的学习性能和泛化性能均优于其他先进方法,在息肉图像分割上具有一定的应用价值。 展开更多
关键词 息肉图像分割 多尺度注意力提取 层间注意力聚合 全局上下文
在线阅读 下载PDF
高速公路雾天能见度检测的跨尺度特征上下文融合网络
6
作者 唐继辉 孙玉宝 +1 位作者 张振东 黄亮 《计算机应用与软件》 北大核心 2026年第1期158-164,201,共8页
高速公路行驶中浓雾以及团雾天气严重影响交通安全。为了降低交通事故发生概率,提出高速公路雾天能见度检测的跨尺度特征上下文融合网络,从单幅监控图像实现能见度的自动分类与预警。该网络通过两个并行支路分别提取高速公路雾天图像的... 高速公路行驶中浓雾以及团雾天气严重影响交通安全。为了降低交通事故发生概率,提出高速公路雾天能见度检测的跨尺度特征上下文融合网络,从单幅监控图像实现能见度的自动分类与预警。该网络通过两个并行支路分别提取高速公路雾天图像的道路整体结构特征与多尺度细节特征,并设计跨尺度特征上下文融合模块,计算尺度间的关联性,将多尺度细节特征与道路整体特征进行自适应融合,提升网络的判别能力。同时构建真实场景雾天图像数据集,图像均来自中国多条高速公路的监控视频。实验结果表明该算法达到最高检测准确性,可为高速公路管理部门的智能化管理提供技术支撑。 展开更多
关键词 能见度检测 多尺度细节特征 跨尺度特征上下文融合
在线阅读 下载PDF
基于尺度交互蒸馏网络的薄壳山核桃品种识别方法 被引量:2
7
作者 赵宁 陈智坤 +3 位作者 杨朋飞 王瑞多 张计育 李永荣 《农业工程学报》 北大核心 2025年第5期209-216,共8页
薄壳山核桃是一种重要的经济坚果,由于品种繁多,对其进行快速科学的鉴定是进行种质资源保护与品种选育的重要基础。为了实现薄壳山核桃品种的快速鉴定,该研究针对品种鉴定提出了基于尺度交互蒸馏网络的薄壳山核桃品种识别方法,通过学习... 薄壳山核桃是一种重要的经济坚果,由于品种繁多,对其进行快速科学的鉴定是进行种质资源保护与品种选育的重要基础。为了实现薄壳山核桃品种的快速鉴定,该研究针对品种鉴定提出了基于尺度交互蒸馏网络的薄壳山核桃品种识别方法,通过学习薄壳山核桃的可判别性特征实现品种鉴定。研究选择波尼等12种薄壳山核桃,建立了9048张实拍图像的品种识别数据集;针对薄壳山核桃图片取样中距离变化导致的目标尺度多样性问题,设计了一种全局-局部特征协同学习方案,用于提取尺度不变特征;与此同时,该研究结合尺度知识蒸馏方案,通过训练提取的不同尺度数据进行预测保证模型训练的有效性。结果表明,通过训练该方法对上述12个品种的薄壳山核桃品种识别准确率均达到了96.98%,显著提高了薄壳山核桃的品种鉴定准确率。该研究开发的薄壳山核桃品种自动识别模型对于未来果实鉴定及产品分选提供了技术手段。 展开更多
关键词 薄壳山核桃 品种鉴定 尺度交互蒸馏 多尺度上下文注意融合 知识蒸馏
在线阅读 下载PDF
面向复杂背景下烟雾火焰检测的改进YOLOv8s算法 被引量:8
8
作者 马耀名 张鹏飞 谭福生 《计算机工程与应用》 北大核心 2025年第3期121-130,共10页
针对复杂背景下烟雾火焰目标与背景混淆,导致烟雾火焰检测精度低等问题,提出一种面向复杂背景下烟雾火焰检测的YOLOv8s改进模型。特征通道之间具有高度相似性,为了有效利用跨不同通道间的冗余,提高模型对烟雾火焰目标和背景的区分,设计... 针对复杂背景下烟雾火焰目标与背景混淆,导致烟雾火焰检测精度低等问题,提出一种面向复杂背景下烟雾火焰检测的YOLOv8s改进模型。特征通道之间具有高度相似性,为了有效利用跨不同通道间的冗余,提高模型对烟雾火焰目标和背景的区分,设计了C2fFR(C2f with partial rep conv)轻量级特征提取模块。设计了MCFM(multi-scale context fusion module)多尺度上下文融合模块,来捕捉并利用上下文信息,增强特征的表示。使用Inner-SIoU损失函数,解决边界框不匹配的问题,提高模型对高IoU样本的回归能力。实验结果表明,改进后的YOLOv8s烟雾火焰检测模型相比于基线模型YOLOv8s,mAP@50提升了4.6个百分点,mAP@50:95提升了2.3个百分点,模型参数量降低了18.9%,计算量降低了8.1%,FPS为93帧/s,与其他主流检测算法相比也具有较好的检测性能。 展开更多
关键词 YOLOv8s C2fFR 多尺度上下文融合 Inner-SIoU
在线阅读 下载PDF
融合全局选择与局部区分的车辆重识别网络
9
作者 徐胜军 张梦倩 +2 位作者 詹博涵 刘光辉 孟月波 《系统仿真学报》 北大核心 2025年第1期220-233,共14页
针对跨镜头多视角差异导致车辆重识别面临的不同视角、复杂背景和光照强度等干扰问题,提出了一种融合全局选择与局部区分的车辆重识别网络。基于Resnet50骨干网络,设计了融合全局特征与局部特征的三分支互补网络,利用全局分支学习车辆... 针对跨镜头多视角差异导致车辆重识别面临的不同视角、复杂背景和光照强度等干扰问题,提出了一种融合全局选择与局部区分的车辆重识别网络。基于Resnet50骨干网络,设计了融合全局特征与局部特征的三分支互补网络,利用全局分支学习车辆的整体外观信息,局部分支捕获车辆的差异性细节信息。基于注意力机制提出了上下文特征选择模块(context feature selection module,CFSM),有效分离了车辆信息与复杂背景信息,并提出了一种细节特征增强模块(detail feature enhancement module,DFEM),利用部件之间的相对位置信息强化多粒度特征细节信息的学习。提出了一种权值自适应平衡策略,联合多损失函数进行训练。实验结果表明,所提网络在VeRi-776数据集上的mAP、CMC@1和CMC@5分别达到73.2%、93.4%和97.3%;在VehicleID数据集的大规模测试子集上,CMC@1和CMC@5分别达到75.0%和92.7%。与对比网络相比,所提网络具有较高的识别率和鲁棒性。 展开更多
关键词 车辆重识别 多分支结构 全局上下文特征 局部区分特征 权值自适应策略
原文传递
浅析文创T恤的社会生命史
10
作者 宋德风 邵丹丹 《染整技术》 2025年第7期112-114,共3页
文化创意产品本质上是承载文化的物品,经由人为的文化注入,转化为具有特殊价值的商品。物品在此过程中承担着展示、宣传文化的功能。以文创T恤为研究对象,结合阿尔君·阿帕杜莱的物的社会生命理论,探讨文创T恤在商品化—去商品化—... 文化创意产品本质上是承载文化的物品,经由人为的文化注入,转化为具有特殊价值的商品。物品在此过程中承担着展示、宣传文化的功能。以文创T恤为研究对象,结合阿尔君·阿帕杜莱的物的社会生命理论,探讨文创T恤在商品化—去商品化—再商品化这一动态流动过程中的社会生命历程。从理论层面阐释文创产品与物的社会生命之间的关联,剖析文创T恤从设计与生产到流通与消费,再到再生与争议等各个阶段所呈现出的社会生命特征,揭示其在不同社会情境下的多元意义与价值。旨在为文化创意产业的发展提供新的视角和思路,使文创T恤在各个阶段都能获得全新的生命。 展开更多
关键词 文创T恤 物的社会生命 文创产品 多语境
在线阅读 下载PDF
基于YOLOv5s的舰船小目标检测方法研究
11
作者 师红宇 蔡自桂 +1 位作者 杜文 张哲于 《舰船电子工程》 2025年第2期34-38,73,共6页
海面舰船目标检测容易受陆地、海浪等背景的干扰。针对舰船小目标检测精度低和鲁棒性差的问题,提出一种改进的舰船目标检测模型CWMA-YOLOv5s。首先,设计具有多分支跨层连接的C2f模块丰富多目标舰船梯度流信息。然后,设计并实现了残差多... 海面舰船目标检测容易受陆地、海浪等背景的干扰。针对舰船小目标检测精度低和鲁棒性差的问题,提出一种改进的舰船目标检测模型CWMA-YOLOv5s。首先,设计具有多分支跨层连接的C2f模块丰富多目标舰船梯度流信息。然后,设计并实现了残差多头自注意力融合模块优化特征融合效果。其次,改进Predection网络,设计SCP结构,提高了舰船目标的显著度。最后,引入改进的WIOU损失函数解决CIOU损失函数带来的梯度爆炸和模型提前退化问题。实验结果表明,与YOLOv5s模型相比,该模型在MASATI-v2数据集上,精度提高了13.1%,召回率提高了12.8%,mAP@50提高了6.8%。与其他同类型检测算法相比,该算法拥有更好的学习能力,整体检测精度达到了82.3%,具有较强的鲁棒性。 展开更多
关键词 舰船检测 多头自注意力机制 空间上下文金字塔 WIOU损失函数
在线阅读 下载PDF
多情景模拟下福州市土地利用变化对生态系统服务价值的影响 被引量:2
12
作者 刘凡可 肖桂荣 《国土与自然资源研究》 2025年第3期26-30,共5页
本文以福州市为研究区,基于四期土地利用数据和生态系统服务价值评估模型,设定耕地保护、城市发展、生态保护和自然发展4种情景,运用MCCA模型模拟出2035年不同情景下土地利用变化对福州市生态系统服务价值的影响。结果表明,建设用地显... 本文以福州市为研究区,基于四期土地利用数据和生态系统服务价值评估模型,设定耕地保护、城市发展、生态保护和自然发展4种情景,运用MCCA模型模拟出2035年不同情景下土地利用变化对福州市生态系统服务价值的影响。结果表明,建设用地显著增加会导致耕地、林地和草地总量降低,造成ESV降低。生态保护情景放缓了建设用地扩展速率,林地资源的恢复使其ESV出现了上涨,是最符合福州市未来国土空间规划的土地利用优化最优情景。林地和水域是影响生态质量最显著的两种地类,未来规划过程中应加大对林地和水域的保护与治理。研究结果可为福州市土地利用格局完善和生态环境质量提高提供参考依据。 展开更多
关键词 土地利用模拟 MCCA模型 多情景 生态系统服务价值 福州市
在线阅读 下载PDF
改进YOLO11的多尺度上下文增强注意力车辆检测模型
13
作者 刘炜 皮建勇 +1 位作者 胡倩 胡伟超 《电子测量技术》 北大核心 2025年第21期177-188,共12页
为了提高高性能多尺度目标检测,特别是小目标检测的精度,以减少交通事故的发生概率。本研究提出了一种改进YOLO11模型的多尺度上下文增强注意力机制的汽车检测方法。首先,在主干网络中设计并引入了RPCSPELAN5结构替换C3k2模块,提升特征... 为了提高高性能多尺度目标检测,特别是小目标检测的精度,以减少交通事故的发生概率。本研究提出了一种改进YOLO11模型的多尺度上下文增强注意力机制的汽车检测方法。首先,在主干网络中设计并引入了RPCSPELAN5结构替换C3k2模块,提升特征提取能力和信息聚合。其次,在颈部网络中创建并新增DSM模块,该模块通过动态上采样器和无参数注意力机制,增强小目标的特征融合。最后,进一步改进颈部网络,采用了基于Haar小波的下采样模块,提升语义分割表现和上下文连续性。在VOC2012和COCO数据集上的实验表明,所提出的算法在多个评估指标上均取得了显著的提升。VOC2012数据集上的P、R、mAP50和mAP50-95分别提高了0.2%、5.3%、3.4%和4.2%,而COCO数据集上的提升幅度分别为7.7%、6.0%、8.7%和6.5%。本研究提出的算法在多尺度目标检测,特别是小目标检测精度上表现出优越性,有效提高了车辆检测精度,有助于降低交通事故发生的概率。 展开更多
关键词 目标检测 YOLO11 多尺度 上下文增强 注意力机制
原文传递
结合局部感知与多层次注意力的多模态方面级情感分析 被引量:2
14
作者 曾碧卿 姚勇涛 +3 位作者 谢梁琦 陈鹏飞 邓会敏 王瑞棠 《计算机工程》 北大核心 2025年第9期80-90,共11页
多模态方面级情感分析(MABSA)旨在从图文对中分析方面词的情感极性。现有方法致力于抽取图像和文本的情感特征。然而,图像和文本的各个特征不一定对最终的情感分析是有效的,图像和文本通常在方面词情感相关的区域外含有大量的冗余信息... 多模态方面级情感分析(MABSA)旨在从图文对中分析方面词的情感极性。现有方法致力于抽取图像和文本的情感特征。然而,图像和文本的各个特征不一定对最终的情感分析是有效的,图像和文本通常在方面词情感相关的区域外含有大量的冗余信息与噪声信息,并且图像和文本的不同区域可能对应不同方面词,导致在构建图像和文本特征抽取的初步阶段引入噪声。此外,图像和文本的方面词相关的情感极性可能是对立的,即两者存在交互信息。为了解决上述问题,提出结合局部感知与多层次注意力的MABSA模型。首先,设计局部感知模块,筛选与方面词语义相关的文本内容及图像区域;然后,引入多层次注意力模块,使用瓶颈注意力机制进行模态交互信息的提取,提高了情感信息的聚合准确率。实验结果表明,该模型能够在Twitter2015、Twitter2017、Multi-ZOL数据集上达到SOTA(State-of-the-Art)性能,显著优于同类模型。 展开更多
关键词 多模态方面级情感分析 局部感知 多层次注意力 局部上下文 瓶颈注意力
在线阅读 下载PDF
基于ASC-Net的医学图像分割算法
15
作者 施连焘 李正国 +2 位作者 李建阳 王玉峰 王洪宇 《计算机应用与软件》 北大核心 2025年第12期315-322,332,共9页
结肠内窥镜检查是检测直肠息肉、直肠癌的金标准。其中息肉是导致结直肠癌的主要诱因,但是在结直肠内窥下精准地诊断息肉极度依赖有专业水准的医生。为此提出一种基于实时结肠内窥镜检查的自适应语义校正网络(ASC-Net)。其中,ASC-Net使... 结肠内窥镜检查是检测直肠息肉、直肠癌的金标准。其中息肉是导致结直肠癌的主要诱因,但是在结直肠内窥下精准地诊断息肉极度依赖有专业水准的医生。为此提出一种基于实时结肠内窥镜检查的自适应语义校正网络(ASC-Net)。其中,ASC-Net使用非全局自校正(Non-global Self-calibration,NSC)模块,通过上下文校准操作发展长距离空间依赖性,以提取最具区分性的特征。此外,模型当中还设计一个上下文引导语义校正(Context-guided Semantic Calibration,CSC)模块,通过收集多范围上下文信息动态捕获多尺度息肉。开发一个多尺度特征融合(Multiscale Feature Fusion,MFF)模块,以学习更多具有代表性的特征并进行融合,以细化分割结果。所提出的ASC-Net在Kvasir-SEG数据集上的Dice系数和AUC指标达到了84.58%和98.80%,相比U-Net、TransFuse和HarDNet算法,Dice系数精度分别提高了9.76百分点、4.41百分点和1.74百分点。 展开更多
关键词 结直肠息肉 自适应语义校正网络 语义分割 多尺度上下文信息 注意力机制
在线阅读 下载PDF
基于多尺度高斯上下文特征激励的舰船目标检测方法
16
作者 张嘉丹 朱坤 +3 位作者 张振超 龚志辉 郭海涛 戴晨光 《地球信息科学学报》 北大核心 2025年第10期2498-2509,共12页
【目的】针对高分辨率遥感影像幅宽大、背景复杂,舰船目标细节特征丰富以及易受相似目标干扰等特点,本文提出一种基于多尺度高斯上下文特征激励的舰船目标检测方法。【方法】首先,设计了联合空间和通道注意力机制的高斯上下文转换模块(S... 【目的】针对高分辨率遥感影像幅宽大、背景复杂,舰船目标细节特征丰富以及易受相似目标干扰等特点,本文提出一种基于多尺度高斯上下文特征激励的舰船目标检测方法。【方法】首先,设计了联合空间和通道注意力机制的高斯上下文转换模块(Spatial and Channel-Gaussian Context Transformer,SC-GCT),实现了前景目标的可辨识性表达,有效缓解了背景噪声以及相似性目标干扰等问题。其次,引入了多尺度特征自适应加权融合方法(Multi-scale Feature Adaptive Fusion,MFAF),构建信息表达更充分的特征图,实现了目标语义与空间位置的精确表征。【结果】本文在HRSC2016数据集上进行了对比实验,结果表明,本文算法的检测精度mAP值达到了96.8%,相较于基线模型YOLOv8提升了1.3%,且检测精度和效率均优于现有主流舰船目标检测算法;在基础网络中添加SC-GCT以及MFAF模块后,mAP值分别提升了0.7%和1.1%,验证了本文算法中各模块的有效性。为进一步验证本文算法的实际应用价值,选取横须贺港、旅顺港、梅波特港等不同真实港口场景下的遥感影像测试,结果表明算法在复杂真实环境中仍能保持稳定性能。【结论】本文算法有效提升了舰船目标检测精度,在复杂背景舰船检测任务中具有良好的实用性与泛化性。 展开更多
关键词 遥感影像 舰船目标检测 注意力机制 高斯上下文 多尺度特征 YOLOv8 HRSC2016
原文传递
以AI塑形智慧图书馆:基于智能体的下一代图书馆服务平台 被引量:9
17
作者 刘炜 张磊 +1 位作者 嵇婷 陈晓扬 《农业图书情报学报》 2025年第5期15-26,共12页
[目的/意义]云计算时代提出的图书馆服务平台(LSP)未能实现其成为图书馆统一解决方案的承诺,在智慧图书馆时代又面临新的发展瓶颈。其相对刚性的架构、孤岛化的数据模型和有限的智能水平,难以满足现代用户对新型资源生态的获取,及主动... [目的/意义]云计算时代提出的图书馆服务平台(LSP)未能实现其成为图书馆统一解决方案的承诺,在智慧图书馆时代又面临新的发展瓶颈。其相对刚性的架构、孤岛化的数据模型和有限的智能水平,难以满足现代用户对新型资源生态的获取,及主动式服务的迫切需求。本文旨在提出一种基于大语言模型(LLM)智能体(Agent)的下一代LSP架构A-LSP,以解决现有LSP的局限性,并推动图书馆服务平台向人工智能时代转型。[方法/过程]该架构引入了一个新的3层概念模型,包括实现标准化工具集成的MCP市场、负责编排调度的智能体中间件,以及支持功能扩展的智能体应用生态层。同时,文章面向未来图书馆提出了“五大中心”的建设需求框架,即智慧资源中心、智慧服务中心、智慧学习中心、智慧学术交流中心与智慧文化传承中心,以构建图书馆技术与业务融合的蓝图。[结果/结论]研究提出的A-LSP架构通过基于模型上下文协议(MCP)的API封装,确保了对现有系统的后向兼容性,能够在不替换原有系统的基础上实施新的平台战略。这一基于智能体的图书馆服务平台可以看成是现有LSP的重要升级,将驱动其从以资源管理为中心转向以智能体服务为中心,成为人工智能时代的图书馆服务平台。 展开更多
关键词 智能体 智慧图书馆 图书馆服务平台 大语言模型 多智能体系统 模型上下文协议
在线阅读 下载PDF
基于通道注意力和特征融合的伪造语音检测研究 被引量:1
18
作者 汤龙 雷震春 《计算机技术与发展》 2025年第10期131-138,共8页
随着深度学习技术的迅猛发展,语音伪造技术对自动说话人验证系统的安全性构成严峻挑战,语音伪造检测系统依旧面临准确率不足、场景单一等问题。该文提出了一种结合通道注意力和特征融合的伪造语音检测方法,以解决语音伪造检测系统面临... 随着深度学习技术的迅猛发展,语音伪造技术对自动说话人验证系统的安全性构成严峻挑战,语音伪造检测系统依旧面临准确率不足、场景单一等问题。该文提出了一种结合通道注意力和特征融合的伪造语音检测方法,以解决语音伪造检测系统面临的一系列问题。为了聚集丰富的上下文信息和融合尺度不一致的特征,该文提出了双分支通道注意力模块,利用深度卷积沿通道维度聚合多尺度上下文信息,同时在两个分支上捕捉全局和局部特征信息;然后提出了注意力特征融合模块,将LFCC特征经过真实语音GMM和欺骗语音GMM得到对数高斯概率特征,随后基于注意力进行特征融合以学习具有通道上下文信息和全局局部特征信息的交互特征,解决了特征融合机制场景单一的问题。与基线系统相比,文中最佳系统AFF-ResNet在ASVSpoof2021LA数据集上的EER和min t-DCF分别降低37.5%和15.3%。实验结果表明,该方法显著提升了语音欺骗检测的准确率。 展开更多
关键词 伪造语音检测 对数高斯概率特征 通道注意力 深度卷积 多尺度上下文信息 特征融合
在线阅读 下载PDF
基于多尺度上下文提取的小样本野生动物检测
19
作者 刘珂 林珊玲 +4 位作者 师欣雨 林坚普 吕珊红 林志贤 郭太良 《液晶与显示》 北大核心 2025年第3期516-526,共11页
针对野生动物数据集样本量小、目标尺度多变所导致的野生动物检测困难以及检测精度低等问题,提出一种基于多尺度上下文提取的小样本野生动物检测(MS-FSWD)算法。首先,通过多尺度上下文提取模块增强模型对不同尺度的野生动物的感知能力,... 针对野生动物数据集样本量小、目标尺度多变所导致的野生动物检测困难以及检测精度低等问题,提出一种基于多尺度上下文提取的小样本野生动物检测(MS-FSWD)算法。首先,通过多尺度上下文提取模块增强模型对不同尺度的野生动物的感知能力,提高检测性能;其次,引入Res2Net作为原型校准模块的强分类网络对分类器输出的分类分数进行校正;然后,在RPN中加入置换注意力机制,增强目标区域的特征图,弱化背景信息;最后,将平衡L1损失作为定位损失函数,提升目标定位性能。实验结果表明,相比DeFRCN算法,MS-FSWD在小样本野生动物数据集FSWA上,1-shot和3-shot检测任务中新类AP50分别提升了9.9%和6.6%;在公共数据集PASCAL VOC上,MS-FSWD最高提升了12.6%。与VFA算法相比,在PASCAL VOC数据集Novel Set 3的10-shot任务中,新类AP50提升了3.3%。 展开更多
关键词 小样本目标检测 野生动物检测 迁移学习 多尺度上下文提取 注意力机制
在线阅读 下载PDF
改进TransCenter的组合距离多目标跟踪方法
20
作者 赵海涛 岳希 +1 位作者 唐聃 蔡博 《计算机工程与应用》 北大核心 2025年第9期177-185,共9页
在智能驾驶和视频监控领域中,多目标跟踪被广泛应用,但在目标发生遮挡和非线性运动时,此时产生的噪声会造成检测和跟踪精度的降低,同时众多关联匹配算法也没有考虑到IoU和外观失衡的情况。针对以上问题,提出一种基于TransCenter改进的... 在智能驾驶和视频监控领域中,多目标跟踪被广泛应用,但在目标发生遮挡和非线性运动时,此时产生的噪声会造成检测和跟踪精度的降低,同时众多关联匹配算法也没有考虑到IoU和外观失衡的情况。针对以上问题,提出一种基于TransCenter改进的多目标跟踪网络。引用小波变换处理检测特征,设计了上下文协同选择器,通过动态选择跟踪特征和检测特征来缓解噪声产生的负面影响;融合卡尔曼滤波预测值和跟踪位移,以提高非线性运动中的预测位移准确度;根据IoU距离和外观距离的差值优化组合距离的权重,解决了高速运动和外观剧烈变化时组合距离失效的情况。在BDD100k、DanceTrack数据集上进行了实验,结果表明,与ByteTrack算法相比,改进网络的mMOTA和HOTA值分别提升了4.3和5.9个百分点,与TransCenter相比,HOTA提升了7.4个百分点,且有着更好的灵活性和跟踪精度。 展开更多
关键词 多目标跟踪 卡尔曼滤波 上下文协同 组合距离
在线阅读 下载PDF
上一页 1 2 20 下一页 到第
使用帮助 返回顶部