期刊文献+
共找到389篇文章
< 1 2 20 >
每页显示 20 50 100
Exploiting multi-context analysis in semantic image classification
1
作者 田永鸿 黄铁军 高文 《Journal of Zhejiang University-Science A(Applied Physics & Engineering)》 SCIE EI CAS CSCD 2005年第11期1268-1283,共16页
As the popularity of digital images is rapidly increasing on the Internet, research on technologies for semantic image classification has become an important research topic. However, the well-known content-based image... As the popularity of digital images is rapidly increasing on the Internet, research on technologies for semantic image classification has become an important research topic. However, the well-known content-based image classification methods do not overcome the so-called semantic gap problem in which low-level visual features cannot represent the high-level semantic content of images. Image classification using visual and textual information often performs poorly since the extracted textual features are often too limited to accurately represent the images. In this paper, we propose a semantic image classification ap- proach using multi-context analysis. For a given image, we model the relevant textual information as its multi-modal context, and regard the related images connected by hyperlinks as its link context. Two kinds of context analysis models, i.e., cross-modal correlation analysis and link-based correlation model, are used to capture the correlation among different modals of features and the topical dependency among images induced by the link structure. We propose a new collective classification model called relational support vector classifier (RSVC) based on the well-known Support Vector Machines (SVMs) and the link-based cor- relation model. Experiments showed that the proposed approach significantly improved classification accuracy over that of SVM classifiers using visual and/or textual features. 展开更多
关键词 Image classification multi-context analysis Cross-modal correlation analysis Link-based correlation model Linkage semantic kernels Relational support vector classifier
在线阅读 下载PDF
基于特征融合及多尺度上下文提取的实时语义分割
2
作者 刘伯红 刘磊 《重庆邮电大学学报(自然科学版)》 北大核心 2026年第1期167-176,共10页
针对实时语义分割算法常用的双分支结构存在空间分支和上下文分支特征融合不充分、多尺度上下文信息提取不全面等问题,提出基于特征融合及多尺度上下文提取的实时语义分割网络。设计空间-多尺度双向注意力融合模块,使用空间注意力机制... 针对实时语义分割算法常用的双分支结构存在空间分支和上下文分支特征融合不充分、多尺度上下文信息提取不全面等问题,提出基于特征融合及多尺度上下文提取的实时语义分割网络。设计空间-多尺度双向注意力融合模块,使用空间注意力机制和多尺度特征融合模块实现双分支交互融合,促进空间特征以及语义特征在双分支上的流动;在上下文分支末端设计了串联聚合金字塔池化模块,更精确地捕捉细节信息;聚合空间分支不同阶段特征,增强模型对图像特征的全面理解能力,促进深层特征与浅层特征的深度融合;使用多尺度注意力特征融合模块引导空间分支和上下文分支融合。实验结果表明,构建的网络在Cityscapes数据集上平均交并比(mean intersection over union,MIoU)达到78.0%,推理速度为104.5 Frame/s;在CamVid数据集上,MIoU达到75.9%,推理速度为224.6 Frame/s。 展开更多
关键词 实时语义分割 特征融合 注意力机制 多尺度上下文提取
在线阅读 下载PDF
从感知到意向:多场景智能产品的用户体验研究综述
3
作者 武月琴 苏洋 《包装工程》 北大核心 2026年第2期485-496,共12页
目的系统梳理近十年来多场景智能产品用户体验领域的研究进展,探讨其在跨场景设计与优化中的理论与实践价值。方法基于文献计量学方法,结合中国知网等相关学术期刊文献,筛选2015年至2025年的相关研究并运用CiteSpace与VOSviewer进行关... 目的系统梳理近十年来多场景智能产品用户体验领域的研究进展,探讨其在跨场景设计与优化中的理论与实践价值。方法基于文献计量学方法,结合中国知网等相关学术期刊文献,筛选2015年至2025年的相关研究并运用CiteSpace与VOSviewer进行关键词共现、时间线演化及主题聚类分析,从应用场景、交互设计与用户体验三个维度解析研究热点、发展趋势与关键问题。结果多场景智能产品的用户体验呈现显著的情境依赖性与领域差异性,主要问题集中在功能适配、界面优化、个性化服务、情感体验四个方面。同时,揭示用户体验设计正从单一功能优化向多场景适应与情感共鸣方向发展。结论提出“感知-行为-认知-意向”四层多场景用户体验框架,不仅为解决多场景体验差异问题提供系统化方法论,而且为智能产品设计优化与多场景用户体验提升提供理论依据与实践参考。 展开更多
关键词 多场景 智能产品设计 用户体验 情景理论
在线阅读 下载PDF
A Visual Analysis Approach for Community Detection of Multi-Context Mobile Social Networks 被引量:3
4
作者 马昱欣 徐佳逸 +5 位作者 彭帝超 张婷 金呈哲 屈华民 陈为 彭群生 《Journal of Computer Science & Technology》 SCIE EI CSCD 2013年第5期797-809,共13页
The problem of detecting community structures of a social network has been extensively studied over recent years, but most existing methods solely rely on the network structure and neglect the context information of t... The problem of detecting community structures of a social network has been extensively studied over recent years, but most existing methods solely rely on the network structure and neglect the context information of the social relations. The main reason is that a context-rich network offers too much flexibility and complexity for automatic or manual modulation of the multifaceted context in the analysis process. We address the challenging problem of incorporating context information into the community analysis with a novel visual analysis mechanism. Our approach consists of two stages: interactive discovery of salient context, and iterative context-guided community detection. Central to the analysis process is a context relevance model (CRM) that visually characterizes the influence of a given set of contexts on the variation of the detected communities, and discloses the community structure in specific context configurations. The extracted relevance is used to drive an iterative visual reasoning process, in which the community structures are progressively discovered. We introduce a suite of visual representations to encode the community structures, the context as well as the CRM. In particular, we propose an enhanced parallel coordinates representation to depict the context and community structures, which allows for interactive data exploration and community investigation. Case studies on several datasets demonstrate the efficiency and accuracy of our approach. 展开更多
关键词 visual analysis community detection multi-context
原文传递
基于级联注意力的结肠息肉图像分割算法研究
5
作者 周孟然 陆鹏 《重庆工商大学学报(自然科学版)》 2026年第1期1-10,共10页
目的针对现有Transformer模型在息肉图像分割中存在注意力分散以及作为编码器提取的多级特征在融合时易产生信息丢失导致的分割精度不高的问题,提出一种新的分割模型PVT-CAMNet。方法在该模型中,使用金字塔式Transformer(Pyramid Vision... 目的针对现有Transformer模型在息肉图像分割中存在注意力分散以及作为编码器提取的多级特征在融合时易产生信息丢失导致的分割精度不高的问题,提出一种新的分割模型PVT-CAMNet。方法在该模型中,使用金字塔式Transformer(Pyramid Vision Transformer,PVT)作为编码器,接着设计了多尺度特征注意力提取模块(Multi-scale Feature Attention Extraction,MFAE)和层间注意力聚合模块(Inter-layer Attention Aggregation,IA)。其中,PVT通过其自注意力机制保证了模型的泛化能力,MFAE使用不同大小的滤波器多尺度提取特征,旨在缓解注意力分散问题;IA交互融合不同层级特征,有效解决多级特征融合产生的信息丢失问题;最后引入全局上下文模块(Global Context,GC)使模型更好地理解特征图之间的像素依赖关系。结果在Kvasir、CVC-ClinicDB、CVC-ColonDB和ETIS数据集上进行了评估,相较于最优基线模型,mDice、mIoU分别提高了1.76%、0.81%、1.51%、1.74%、3.15%、2.65%和1.73%、3.84%。结论PVT-CAMNet的学习性能和泛化性能均优于其他先进方法,在息肉图像分割上具有一定的应用价值。 展开更多
关键词 息肉图像分割 多尺度注意力提取 层间注意力聚合 全局上下文
在线阅读 下载PDF
高速公路雾天能见度检测的跨尺度特征上下文融合网络
6
作者 唐继辉 孙玉宝 +1 位作者 张振东 黄亮 《计算机应用与软件》 北大核心 2026年第1期158-164,201,共8页
高速公路行驶中浓雾以及团雾天气严重影响交通安全。为了降低交通事故发生概率,提出高速公路雾天能见度检测的跨尺度特征上下文融合网络,从单幅监控图像实现能见度的自动分类与预警。该网络通过两个并行支路分别提取高速公路雾天图像的... 高速公路行驶中浓雾以及团雾天气严重影响交通安全。为了降低交通事故发生概率,提出高速公路雾天能见度检测的跨尺度特征上下文融合网络,从单幅监控图像实现能见度的自动分类与预警。该网络通过两个并行支路分别提取高速公路雾天图像的道路整体结构特征与多尺度细节特征,并设计跨尺度特征上下文融合模块,计算尺度间的关联性,将多尺度细节特征与道路整体特征进行自适应融合,提升网络的判别能力。同时构建真实场景雾天图像数据集,图像均来自中国多条高速公路的监控视频。实验结果表明该算法达到最高检测准确性,可为高速公路管理部门的智能化管理提供技术支撑。 展开更多
关键词 能见度检测 多尺度细节特征 跨尺度特征上下文融合
在线阅读 下载PDF
多要素交互下城市公园生物多样性感知偏好研究
7
作者 胡馨蕾 杨高原 陈崇贤 《园林》 2026年第1期21-29,共9页
城市公园规划设计需兼顾协同生物多样性保护与公众需求,理解公众对公园生物多样性的感知偏好是实现这一协同的关键。在现实公园场景中,人们对生物多样性的感知偏好通常受多种景观要素的共同影响。以杭州为例,采用定量联合分析实验与定... 城市公园规划设计需兼顾协同生物多样性保护与公众需求,理解公众对公园生物多样性的感知偏好是实现这一协同的关键。在现实公园场景中,人们对生物多样性的感知偏好通常受多种景观要素的共同影响。以杭州为例,采用定量联合分析实验与定性随行访谈相结合的混合研究方法,探讨在多种公园要素交互作用下,公众对城市公园生物多样性的感知偏好。结果显示:公众普遍偏好更高生物多样性水平的公园环境,该偏好与其所感知到的生物多样性效益密切相关,包括心理恢复、环境质量改善及审美价值提升。在多要素权衡中,公众同时重视生物多样性与人工设施,对公园自然性与便利性有双重诉求。人群中存在不同的偏好阵营,包括自然导向型和休闲导向型人群。前者重视生态体验,倾向于将人工设施和高强度植被维护视为对自然环境的干扰;后者则更关注公园设施带来的舒适与便利性,并倾向为了获得更好的游憩体验而接受一定程度的生物多样性降低。研究结果可为兼顾生物多样性保护与公众需求的城市公园规划设计提供实证支持。 展开更多
关键词 生物多样性 城市公园 感知偏好 多要素交互 混合方法
在线阅读 下载PDF
基于边缘感知增强和多尺度特征融合的轻量化水下鱼类检测
8
作者 何冰晴 臧兆祥 《渔业现代化》 北大核心 2026年第1期131-143,共13页
针对水下图像中由于水体浑浊、光照不均而导致的鱼类目标边缘模糊、漏检率高以及现有模型计算复杂度大、部署困难的问题,本研究提出了一种基于改进YOLOv11n的水下鱼类检测算法CRL-YOLO11。首先,设计了边缘感知与上下文引导注意力模块,... 针对水下图像中由于水体浑浊、光照不均而导致的鱼类目标边缘模糊、漏检率高以及现有模型计算复杂度大、部署困难的问题,本研究提出了一种基于改进YOLOv11n的水下鱼类检测算法CRL-YOLO11。首先,设计了边缘感知与上下文引导注意力模块,以增强模型对弱特征目标的感知能力,从而提升小目标鱼类的检测效果;其次,构建了轻量化高效聚合模块,利用重参数化多分支结构实现跨尺度特征融合,降低信息传递损失;此外,针对计算成本较高的问题,引入了选择性通道下采样和轻量化非对称检测头。在自建数据集上试验结果显示:与基准模型YOLOv11n相比,CRL-YOLO11模型的mAP50提高了2.1%,召回率提升了2.9%;同时权重和参数量分别减至原模型的86%和82%;此外,在Kaggle-fish数据集中,mAP50提高了0.7%,召回率提升了2.4%,在URPC2019数据集上,mAP50提升了1.1%。研究表明,该模型具备良好的检测精度、泛化能力与部署效率,适用于智慧渔业与养殖场景下的实时水下目标检测任务。 展开更多
关键词 水下目标检测 YOLOv11 边缘感知 上下文引导 多尺度特征 轻量化网络 鱼类检测
在线阅读 下载PDF
基于尺度交互蒸馏网络的薄壳山核桃品种识别方法 被引量:2
9
作者 赵宁 陈智坤 +3 位作者 杨朋飞 王瑞多 张计育 李永荣 《农业工程学报》 北大核心 2025年第5期209-216,共8页
薄壳山核桃是一种重要的经济坚果,由于品种繁多,对其进行快速科学的鉴定是进行种质资源保护与品种选育的重要基础。为了实现薄壳山核桃品种的快速鉴定,该研究针对品种鉴定提出了基于尺度交互蒸馏网络的薄壳山核桃品种识别方法,通过学习... 薄壳山核桃是一种重要的经济坚果,由于品种繁多,对其进行快速科学的鉴定是进行种质资源保护与品种选育的重要基础。为了实现薄壳山核桃品种的快速鉴定,该研究针对品种鉴定提出了基于尺度交互蒸馏网络的薄壳山核桃品种识别方法,通过学习薄壳山核桃的可判别性特征实现品种鉴定。研究选择波尼等12种薄壳山核桃,建立了9048张实拍图像的品种识别数据集;针对薄壳山核桃图片取样中距离变化导致的目标尺度多样性问题,设计了一种全局-局部特征协同学习方案,用于提取尺度不变特征;与此同时,该研究结合尺度知识蒸馏方案,通过训练提取的不同尺度数据进行预测保证模型训练的有效性。结果表明,通过训练该方法对上述12个品种的薄壳山核桃品种识别准确率均达到了96.98%,显著提高了薄壳山核桃的品种鉴定准确率。该研究开发的薄壳山核桃品种自动识别模型对于未来果实鉴定及产品分选提供了技术手段。 展开更多
关键词 薄壳山核桃 品种鉴定 尺度交互蒸馏 多尺度上下文注意融合 知识蒸馏
在线阅读 下载PDF
面向复杂背景下烟雾火焰检测的改进YOLOv8s算法 被引量:8
10
作者 马耀名 张鹏飞 谭福生 《计算机工程与应用》 北大核心 2025年第3期121-130,共10页
针对复杂背景下烟雾火焰目标与背景混淆,导致烟雾火焰检测精度低等问题,提出一种面向复杂背景下烟雾火焰检测的YOLOv8s改进模型。特征通道之间具有高度相似性,为了有效利用跨不同通道间的冗余,提高模型对烟雾火焰目标和背景的区分,设计... 针对复杂背景下烟雾火焰目标与背景混淆,导致烟雾火焰检测精度低等问题,提出一种面向复杂背景下烟雾火焰检测的YOLOv8s改进模型。特征通道之间具有高度相似性,为了有效利用跨不同通道间的冗余,提高模型对烟雾火焰目标和背景的区分,设计了C2fFR(C2f with partial rep conv)轻量级特征提取模块。设计了MCFM(multi-scale context fusion module)多尺度上下文融合模块,来捕捉并利用上下文信息,增强特征的表示。使用Inner-SIoU损失函数,解决边界框不匹配的问题,提高模型对高IoU样本的回归能力。实验结果表明,改进后的YOLOv8s烟雾火焰检测模型相比于基线模型YOLOv8s,mAP@50提升了4.6个百分点,mAP@50:95提升了2.3个百分点,模型参数量降低了18.9%,计算量降低了8.1%,FPS为93帧/s,与其他主流检测算法相比也具有较好的检测性能。 展开更多
关键词 YOLOv8s C2fFR 多尺度上下文融合 Inner-SIoU
在线阅读 下载PDF
融合全局选择与局部区分的车辆重识别网络
11
作者 徐胜军 张梦倩 +2 位作者 詹博涵 刘光辉 孟月波 《系统仿真学报》 北大核心 2025年第1期220-233,共14页
针对跨镜头多视角差异导致车辆重识别面临的不同视角、复杂背景和光照强度等干扰问题,提出了一种融合全局选择与局部区分的车辆重识别网络。基于Resnet50骨干网络,设计了融合全局特征与局部特征的三分支互补网络,利用全局分支学习车辆... 针对跨镜头多视角差异导致车辆重识别面临的不同视角、复杂背景和光照强度等干扰问题,提出了一种融合全局选择与局部区分的车辆重识别网络。基于Resnet50骨干网络,设计了融合全局特征与局部特征的三分支互补网络,利用全局分支学习车辆的整体外观信息,局部分支捕获车辆的差异性细节信息。基于注意力机制提出了上下文特征选择模块(context feature selection module,CFSM),有效分离了车辆信息与复杂背景信息,并提出了一种细节特征增强模块(detail feature enhancement module,DFEM),利用部件之间的相对位置信息强化多粒度特征细节信息的学习。提出了一种权值自适应平衡策略,联合多损失函数进行训练。实验结果表明,所提网络在VeRi-776数据集上的mAP、CMC@1和CMC@5分别达到73.2%、93.4%和97.3%;在VehicleID数据集的大规模测试子集上,CMC@1和CMC@5分别达到75.0%和92.7%。与对比网络相比,所提网络具有较高的识别率和鲁棒性。 展开更多
关键词 车辆重识别 多分支结构 全局上下文特征 局部区分特征 权值自适应策略
原文传递
浅析文创T恤的社会生命史
12
作者 宋德风 邵丹丹 《染整技术》 2025年第7期112-114,共3页
文化创意产品本质上是承载文化的物品,经由人为的文化注入,转化为具有特殊价值的商品。物品在此过程中承担着展示、宣传文化的功能。以文创T恤为研究对象,结合阿尔君·阿帕杜莱的物的社会生命理论,探讨文创T恤在商品化—去商品化—... 文化创意产品本质上是承载文化的物品,经由人为的文化注入,转化为具有特殊价值的商品。物品在此过程中承担着展示、宣传文化的功能。以文创T恤为研究对象,结合阿尔君·阿帕杜莱的物的社会生命理论,探讨文创T恤在商品化—去商品化—再商品化这一动态流动过程中的社会生命历程。从理论层面阐释文创产品与物的社会生命之间的关联,剖析文创T恤从设计与生产到流通与消费,再到再生与争议等各个阶段所呈现出的社会生命特征,揭示其在不同社会情境下的多元意义与价值。旨在为文化创意产业的发展提供新的视角和思路,使文创T恤在各个阶段都能获得全新的生命。 展开更多
关键词 文创T恤 物的社会生命 文创产品 多语境
在线阅读 下载PDF
多情景模拟下福州市土地利用变化对生态系统服务价值的影响 被引量:3
13
作者 刘凡可 肖桂荣 《国土与自然资源研究》 2025年第3期26-30,共5页
本文以福州市为研究区,基于四期土地利用数据和生态系统服务价值评估模型,设定耕地保护、城市发展、生态保护和自然发展4种情景,运用MCCA模型模拟出2035年不同情景下土地利用变化对福州市生态系统服务价值的影响。结果表明,建设用地显... 本文以福州市为研究区,基于四期土地利用数据和生态系统服务价值评估模型,设定耕地保护、城市发展、生态保护和自然发展4种情景,运用MCCA模型模拟出2035年不同情景下土地利用变化对福州市生态系统服务价值的影响。结果表明,建设用地显著增加会导致耕地、林地和草地总量降低,造成ESV降低。生态保护情景放缓了建设用地扩展速率,林地资源的恢复使其ESV出现了上涨,是最符合福州市未来国土空间规划的土地利用优化最优情景。林地和水域是影响生态质量最显著的两种地类,未来规划过程中应加大对林地和水域的保护与治理。研究结果可为福州市土地利用格局完善和生态环境质量提高提供参考依据。 展开更多
关键词 土地利用模拟 MCCA模型 多情景 生态系统服务价值 福州市
在线阅读 下载PDF
基于YOLOv5s的舰船小目标检测方法研究
14
作者 师红宇 蔡自桂 +1 位作者 杜文 张哲于 《舰船电子工程》 2025年第2期34-38,73,共6页
海面舰船目标检测容易受陆地、海浪等背景的干扰。针对舰船小目标检测精度低和鲁棒性差的问题,提出一种改进的舰船目标检测模型CWMA-YOLOv5s。首先,设计具有多分支跨层连接的C2f模块丰富多目标舰船梯度流信息。然后,设计并实现了残差多... 海面舰船目标检测容易受陆地、海浪等背景的干扰。针对舰船小目标检测精度低和鲁棒性差的问题,提出一种改进的舰船目标检测模型CWMA-YOLOv5s。首先,设计具有多分支跨层连接的C2f模块丰富多目标舰船梯度流信息。然后,设计并实现了残差多头自注意力融合模块优化特征融合效果。其次,改进Predection网络,设计SCP结构,提高了舰船目标的显著度。最后,引入改进的WIOU损失函数解决CIOU损失函数带来的梯度爆炸和模型提前退化问题。实验结果表明,与YOLOv5s模型相比,该模型在MASATI-v2数据集上,精度提高了13.1%,召回率提高了12.8%,mAP@50提高了6.8%。与其他同类型检测算法相比,该算法拥有更好的学习能力,整体检测精度达到了82.3%,具有较强的鲁棒性。 展开更多
关键词 舰船检测 多头自注意力机制 空间上下文金字塔 WIOU损失函数
在线阅读 下载PDF
改进YOLO11的多尺度上下文增强注意力车辆检测模型
15
作者 刘炜 皮建勇 +1 位作者 胡倩 胡伟超 《电子测量技术》 北大核心 2025年第21期177-188,共12页
为了提高高性能多尺度目标检测,特别是小目标检测的精度,以减少交通事故的发生概率。本研究提出了一种改进YOLO11模型的多尺度上下文增强注意力机制的汽车检测方法。首先,在主干网络中设计并引入了RPCSPELAN5结构替换C3k2模块,提升特征... 为了提高高性能多尺度目标检测,特别是小目标检测的精度,以减少交通事故的发生概率。本研究提出了一种改进YOLO11模型的多尺度上下文增强注意力机制的汽车检测方法。首先,在主干网络中设计并引入了RPCSPELAN5结构替换C3k2模块,提升特征提取能力和信息聚合。其次,在颈部网络中创建并新增DSM模块,该模块通过动态上采样器和无参数注意力机制,增强小目标的特征融合。最后,进一步改进颈部网络,采用了基于Haar小波的下采样模块,提升语义分割表现和上下文连续性。在VOC2012和COCO数据集上的实验表明,所提出的算法在多个评估指标上均取得了显著的提升。VOC2012数据集上的P、R、mAP50和mAP50-95分别提高了0.2%、5.3%、3.4%和4.2%,而COCO数据集上的提升幅度分别为7.7%、6.0%、8.7%和6.5%。本研究提出的算法在多尺度目标检测,特别是小目标检测精度上表现出优越性,有效提高了车辆检测精度,有助于降低交通事故发生的概率。 展开更多
关键词 目标检测 YOLO11 多尺度 上下文增强 注意力机制
原文传递
结合局部感知与多层次注意力的多模态方面级情感分析 被引量:2
16
作者 曾碧卿 姚勇涛 +3 位作者 谢梁琦 陈鹏飞 邓会敏 王瑞棠 《计算机工程》 北大核心 2025年第9期80-90,共11页
多模态方面级情感分析(MABSA)旨在从图文对中分析方面词的情感极性。现有方法致力于抽取图像和文本的情感特征。然而,图像和文本的各个特征不一定对最终的情感分析是有效的,图像和文本通常在方面词情感相关的区域外含有大量的冗余信息... 多模态方面级情感分析(MABSA)旨在从图文对中分析方面词的情感极性。现有方法致力于抽取图像和文本的情感特征。然而,图像和文本的各个特征不一定对最终的情感分析是有效的,图像和文本通常在方面词情感相关的区域外含有大量的冗余信息与噪声信息,并且图像和文本的不同区域可能对应不同方面词,导致在构建图像和文本特征抽取的初步阶段引入噪声。此外,图像和文本的方面词相关的情感极性可能是对立的,即两者存在交互信息。为了解决上述问题,提出结合局部感知与多层次注意力的MABSA模型。首先,设计局部感知模块,筛选与方面词语义相关的文本内容及图像区域;然后,引入多层次注意力模块,使用瓶颈注意力机制进行模态交互信息的提取,提高了情感信息的聚合准确率。实验结果表明,该模型能够在Twitter2015、Twitter2017、Multi-ZOL数据集上达到SOTA(State-of-the-Art)性能,显著优于同类模型。 展开更多
关键词 多模态方面级情感分析 局部感知 多层次注意力 局部上下文 瓶颈注意力
在线阅读 下载PDF
基于ASC-Net的医学图像分割算法
17
作者 施连焘 李正国 +2 位作者 李建阳 王玉峰 王洪宇 《计算机应用与软件》 北大核心 2025年第12期315-322,332,共9页
结肠内窥镜检查是检测直肠息肉、直肠癌的金标准。其中息肉是导致结直肠癌的主要诱因,但是在结直肠内窥下精准地诊断息肉极度依赖有专业水准的医生。为此提出一种基于实时结肠内窥镜检查的自适应语义校正网络(ASC-Net)。其中,ASC-Net使... 结肠内窥镜检查是检测直肠息肉、直肠癌的金标准。其中息肉是导致结直肠癌的主要诱因,但是在结直肠内窥下精准地诊断息肉极度依赖有专业水准的医生。为此提出一种基于实时结肠内窥镜检查的自适应语义校正网络(ASC-Net)。其中,ASC-Net使用非全局自校正(Non-global Self-calibration,NSC)模块,通过上下文校准操作发展长距离空间依赖性,以提取最具区分性的特征。此外,模型当中还设计一个上下文引导语义校正(Context-guided Semantic Calibration,CSC)模块,通过收集多范围上下文信息动态捕获多尺度息肉。开发一个多尺度特征融合(Multiscale Feature Fusion,MFF)模块,以学习更多具有代表性的特征并进行融合,以细化分割结果。所提出的ASC-Net在Kvasir-SEG数据集上的Dice系数和AUC指标达到了84.58%和98.80%,相比U-Net、TransFuse和HarDNet算法,Dice系数精度分别提高了9.76百分点、4.41百分点和1.74百分点。 展开更多
关键词 结直肠息肉 自适应语义校正网络 语义分割 多尺度上下文信息 注意力机制
在线阅读 下载PDF
基于多尺度高斯上下文特征激励的舰船目标检测方法
18
作者 张嘉丹 朱坤 +3 位作者 张振超 龚志辉 郭海涛 戴晨光 《地球信息科学学报》 北大核心 2025年第10期2498-2509,共12页
【目的】针对高分辨率遥感影像幅宽大、背景复杂,舰船目标细节特征丰富以及易受相似目标干扰等特点,本文提出一种基于多尺度高斯上下文特征激励的舰船目标检测方法。【方法】首先,设计了联合空间和通道注意力机制的高斯上下文转换模块(S... 【目的】针对高分辨率遥感影像幅宽大、背景复杂,舰船目标细节特征丰富以及易受相似目标干扰等特点,本文提出一种基于多尺度高斯上下文特征激励的舰船目标检测方法。【方法】首先,设计了联合空间和通道注意力机制的高斯上下文转换模块(Spatial and Channel-Gaussian Context Transformer,SC-GCT),实现了前景目标的可辨识性表达,有效缓解了背景噪声以及相似性目标干扰等问题。其次,引入了多尺度特征自适应加权融合方法(Multi-scale Feature Adaptive Fusion,MFAF),构建信息表达更充分的特征图,实现了目标语义与空间位置的精确表征。【结果】本文在HRSC2016数据集上进行了对比实验,结果表明,本文算法的检测精度mAP值达到了96.8%,相较于基线模型YOLOv8提升了1.3%,且检测精度和效率均优于现有主流舰船目标检测算法;在基础网络中添加SC-GCT以及MFAF模块后,mAP值分别提升了0.7%和1.1%,验证了本文算法中各模块的有效性。为进一步验证本文算法的实际应用价值,选取横须贺港、旅顺港、梅波特港等不同真实港口场景下的遥感影像测试,结果表明算法在复杂真实环境中仍能保持稳定性能。【结论】本文算法有效提升了舰船目标检测精度,在复杂背景舰船检测任务中具有良好的实用性与泛化性。 展开更多
关键词 遥感影像 舰船目标检测 注意力机制 高斯上下文 多尺度特征 YOLOv8 HRSC2016
原文传递
以AI塑形智慧图书馆:基于智能体的下一代图书馆服务平台 被引量:9
19
作者 刘炜 张磊 +1 位作者 嵇婷 陈晓扬 《农业图书情报学报》 2025年第5期15-26,共12页
[目的/意义]云计算时代提出的图书馆服务平台(LSP)未能实现其成为图书馆统一解决方案的承诺,在智慧图书馆时代又面临新的发展瓶颈。其相对刚性的架构、孤岛化的数据模型和有限的智能水平,难以满足现代用户对新型资源生态的获取,及主动... [目的/意义]云计算时代提出的图书馆服务平台(LSP)未能实现其成为图书馆统一解决方案的承诺,在智慧图书馆时代又面临新的发展瓶颈。其相对刚性的架构、孤岛化的数据模型和有限的智能水平,难以满足现代用户对新型资源生态的获取,及主动式服务的迫切需求。本文旨在提出一种基于大语言模型(LLM)智能体(Agent)的下一代LSP架构A-LSP,以解决现有LSP的局限性,并推动图书馆服务平台向人工智能时代转型。[方法/过程]该架构引入了一个新的3层概念模型,包括实现标准化工具集成的MCP市场、负责编排调度的智能体中间件,以及支持功能扩展的智能体应用生态层。同时,文章面向未来图书馆提出了“五大中心”的建设需求框架,即智慧资源中心、智慧服务中心、智慧学习中心、智慧学术交流中心与智慧文化传承中心,以构建图书馆技术与业务融合的蓝图。[结果/结论]研究提出的A-LSP架构通过基于模型上下文协议(MCP)的API封装,确保了对现有系统的后向兼容性,能够在不替换原有系统的基础上实施新的平台战略。这一基于智能体的图书馆服务平台可以看成是现有LSP的重要升级,将驱动其从以资源管理为中心转向以智能体服务为中心,成为人工智能时代的图书馆服务平台。 展开更多
关键词 智能体 智慧图书馆 图书馆服务平台 大语言模型 多智能体系统 模型上下文协议
在线阅读 下载PDF
基于通道注意力和特征融合的伪造语音检测研究 被引量:1
20
作者 汤龙 雷震春 《计算机技术与发展》 2025年第10期131-138,共8页
随着深度学习技术的迅猛发展,语音伪造技术对自动说话人验证系统的安全性构成严峻挑战,语音伪造检测系统依旧面临准确率不足、场景单一等问题。该文提出了一种结合通道注意力和特征融合的伪造语音检测方法,以解决语音伪造检测系统面临... 随着深度学习技术的迅猛发展,语音伪造技术对自动说话人验证系统的安全性构成严峻挑战,语音伪造检测系统依旧面临准确率不足、场景单一等问题。该文提出了一种结合通道注意力和特征融合的伪造语音检测方法,以解决语音伪造检测系统面临的一系列问题。为了聚集丰富的上下文信息和融合尺度不一致的特征,该文提出了双分支通道注意力模块,利用深度卷积沿通道维度聚合多尺度上下文信息,同时在两个分支上捕捉全局和局部特征信息;然后提出了注意力特征融合模块,将LFCC特征经过真实语音GMM和欺骗语音GMM得到对数高斯概率特征,随后基于注意力进行特征融合以学习具有通道上下文信息和全局局部特征信息的交互特征,解决了特征融合机制场景单一的问题。与基线系统相比,文中最佳系统AFF-ResNet在ASVSpoof2021LA数据集上的EER和min t-DCF分别降低37.5%和15.3%。实验结果表明,该方法显著提升了语音欺骗检测的准确率。 展开更多
关键词 伪造语音检测 对数高斯概率特征 通道注意力 深度卷积 多尺度上下文信息 特征融合
在线阅读 下载PDF
上一页 1 2 20 下一页 到第
使用帮助 返回顶部