期刊文献+
共找到591篇文章
< 1 2 30 >
每页显示 20 50 100
A multivariate grey incidence model for different scale data based on spatial pyramid pooling 被引量:7
1
作者 ZHANG Ke CUI Le YIN Yao 《Journal of Systems Engineering and Electronics》 SCIE EI CSCD 2020年第4期770-779,共10页
In order to solve the problem that existing multivariate grey incidence models cannot be applied to time series on different scales, a new model is proposed based on spatial pyramid pooling.Firstly, local features of ... In order to solve the problem that existing multivariate grey incidence models cannot be applied to time series on different scales, a new model is proposed based on spatial pyramid pooling.Firstly, local features of multivariate time series on different scales are pooled and aggregated by spatial pyramid pooling to construct n levels feature pooling matrices on the same scale. Secondly,Deng's multivariate grey incidence model is introduced to measure the degree of incidence between feature pooling matrices at each level. Thirdly, grey incidence degrees at each level are integrated into a global incidence degree. Finally, the performance of the proposed model is verified on two data sets compared with a variety of algorithms. The results illustrate that the proposed model is more effective and efficient than other similarity measure algorithms. 展开更多
关键词 grey system spatial pyramid pooling grey incidence multivariate time series
在线阅读 下载PDF
Automatic Segmentation Method for Cone-Beam Computed Tomography Image of the Bone Graft Region within Maxillary Sinus Based on the Atrous Spatial Pyramid Convolution Network 被引量:1
2
作者 XU Jiangchang HE Shamin +2 位作者 YU Dedong WU Yiqun CHEN Xiaojun 《Journal of Shanghai Jiaotong university(Science)》 EI 2021年第3期298-305,共8页
Sinus floor elevation with a lateral window approach requires bone graft(BG)to ensure sufficient bone mass,and it is necessary to measure and analyse the BG region for follow-up of postoperative patients.However,the B... Sinus floor elevation with a lateral window approach requires bone graft(BG)to ensure sufficient bone mass,and it is necessary to measure and analyse the BG region for follow-up of postoperative patients.However,the BG region from cone-beam computed tomography(CBCT)images is connected to the margin of the maxillary sinus,and its boundary is blurred.Common segmentation methods are usually performed manually by experienced doctors,and are complicated by challenges such as low efficiency and low precision.In this study,an auto-segmentation approach was applied to the BG region within the maxillary sinus based on an atrous spatial pyramid convolution(ASPC)network.The ASPC module was adopted using residual connections to compose multiple atrous convolutions,which could extract more features on multiple scales.Subsequently,a segmentation network of the BG region with multiple ASPC modules was established,which effectively improved the segmentation performance.Although the training data were insufficient,our networks still achieved good auto-segmentation results,with a dice coefficient(Dice)of 87.13%,an Intersection over Union(Iou)of 78.01%,and a sensitivity of 95.02%.Compared with other methods,our method achieved a better segmentation effect,and effectively reduced the misjudgement of segmentation.Our method can thus be used to implement automatic segmentation of the BG region and improve doctors’work efficiency,which is of great importance for developing preliminary studies on the measurement of postoperative BG within the maxillary sinus. 展开更多
关键词 atrous spatial pyramid convolution(ASPC) bone graft(BG)region medical image segmentation residual connection
原文传递
Local-Tetra-Patterns for Face Recognition Encoded on Spatial Pyramid Matching
3
作者 Khuram Nawaz Khayam Zahid Mehmood +4 位作者 Hassan Nazeer Chaudhry Muhammad Usman Ashraf Usman Tariq Mohammed Nawaf Altouri Khalid Alsubhi 《Computers, Materials & Continua》 SCIE EI 2022年第3期5039-5058,共20页
Face recognition is a big challenge in the research field with a lot of problems like misalignment,illumination changes,pose variations,occlusion,and expressions.Providing a single solution to solve all these problems... Face recognition is a big challenge in the research field with a lot of problems like misalignment,illumination changes,pose variations,occlusion,and expressions.Providing a single solution to solve all these problems at a time is a challenging task.We have put some effort to provide a solution to solving all these issues by introducing a face recognition model based on local tetra patterns and spatial pyramid matching.The technique is based on a procedure where the input image is passed through an algorithm that extracts local features by using spatial pyramid matching andmax-pooling.Finally,the input image is recognized using a robust kernel representation method using extracted features.The qualitative and quantitative analysis of the proposed method is carried on benchmark image datasets.Experimental results showed that the proposed method performs better in terms of standard performance evaluation parameters as compared to state-of-the-art methods on AR,ORL,LFW,and FERET face recognition datasets. 展开更多
关键词 Face recognition local tetra patterns spatial pyramid matching robust kernel representation max-pooling
在线阅读 下载PDF
HSPOG:An Optimized Target Recognition Method Based on Histogram of Spatial Pyramid Oriented Gradients 被引量:4
4
作者 Shaojun Guo Feng Liu +3 位作者 Xiaohu Yuan Chunrong Zou Li Chen Tongsheng Shen 《Tsinghua Science and Technology》 SCIE EI CAS CSCD 2021年第4期475-483,共9页
The Histograms of Oriented Gradients(HOG)can produce good results in an image target recognition mission,but it requires the same size of the target images for classification of inputs.In response to this shortcoming,... The Histograms of Oriented Gradients(HOG)can produce good results in an image target recognition mission,but it requires the same size of the target images for classification of inputs.In response to this shortcoming,this paper performs spatial pyramid segmentation on target images of any size,gets the pixel size of each image block dynamically,and further calculates and normalizes the gradient of the oriented feature of each block region in each image layer.The new feature is called the Histogram of Spatial Pyramid Oriented Gradients(HSPOG).This approach can obtain stable vectors for images of any size,and increase the target detection rate in the image recognition process significantly.Finally,the article verifies the algorithm using VOC2012 image data and compares the effect of HOG. 展开更多
关键词 Histograms of Oriented Gradients(HOG) Histogram of spatial pyramid Oriented Gradients(HSPOG) object recognition spatial pyramid segmentation
原文传递
EYE-YOLO: a multi-spatial pyramid pooling and Focal-EIOU loss inspired tiny YOLOv7 for fundus eye disease detection
5
作者 Akhil Kumar R.Dhanalakshmi 《International Journal of Intelligent Computing and Cybernetics》 2024年第3期503-522,共20页
Purpose:The purpose of this work is to present an approach for autonomous detection of eye disease in fundus images.Furthermore,this work presents an improved variant of the Tiny YOLOv7 model developed specifically fo... Purpose:The purpose of this work is to present an approach for autonomous detection of eye disease in fundus images.Furthermore,this work presents an improved variant of the Tiny YOLOv7 model developed specifically for eye disease detection.The model proposed in this work is a highly useful tool for the development of applications for autonomous detection of eye diseases in fundus images that can help and assist ophthalmologists.Design/methodology/approach:The approach adopted to carry out this work is twofold.Firstly,a richly annotated dataset consisting of eye disease classes,namely,cataract,glaucoma,retinal disease and normal eye,was created.Secondly,an improved variant of the Tiny YOLOv7 model was developed and proposed as EYE-YOLO.The proposed EYE-YOLO model has been developed by integrating multi-spatial pyramid pooling in the feature extraction network and Focal-EIOU loss in the detection network of the Tiny YOLOv7 model.Moreover,at run time,the mosaic augmentation strategy has been utilized with the proposed model to achieve benchmark results.Further,evaluations have been carried out for performance metrics,namely,precision,recall,F1 Score,average precision(AP)and mean average precision(mAP).Findings:The proposed EYE-YOLO achieved 28%higher precision,18%higher recall,24%higher F1 Score and 30.81%higher mAP than the Tiny YOLOv7 model.Moreover,in terms of AP for each class of the employed dataset,it achieved 9.74%higher AP for cataract,27.73%higher AP for glaucoma,72.50%higher AP for retina disease and 13.26%higher AP for normal eye.In comparison to the state-of-the-art Tiny YOLOv5,Tiny YOLOv6 and Tiny YOLOv8 models,the proposed EYE-YOLO achieved 6:23.32%higher mAP.Originality/value:This work addresses the problem of eye disease recognition as a bounding box regression and detection problem.Whereas,the work in the related research is largely based on eye disease classification.The other highlight of this work is to propose a richly annotated dataset for different eye diseases useful for training deep learning-based object detectors.The major highlight of this work lies in the proposal of an improved variant of the Tiny YOLOv7 model focusing on eye disease detection.The proposed modifications in the Tiny YOLOv7 aided the proposed model in achieving better results as compared to the state-of-the-art Tiny YOLOv8 and YOLOv8 Nano. 展开更多
关键词 Tiny YOLOv7 spatial pyramid pooling Focal-EIOU loss Eye disease detection
在线阅读 下载PDF
Feature pyramid attention network for audio-visual scene classification 被引量:1
6
作者 Liguang Zhou Yuhongze Zhou +3 位作者 Xiaonan Qi Junjie Hu Tin Lun Lam Yangsheng Xu 《CAAI Transactions on Intelligence Technology》 2025年第2期359-374,共16页
Audio-visual scene classification(AVSC)poses a formidable challenge owing to the intricate spatial-temporal relationships exhibited by audio-visual signals,coupled with the complex spatial patterns of objects and text... Audio-visual scene classification(AVSC)poses a formidable challenge owing to the intricate spatial-temporal relationships exhibited by audio-visual signals,coupled with the complex spatial patterns of objects and textures found in visual images.The focus of recent studies has predominantly revolved around extracting features from diverse neural network structures,inadvertently neglecting the acquisition of semantically meaningful regions and crucial components within audio-visual data.The authors present a feature pyramid attention network(FPANet)for audio-visual scene understanding,which extracts semantically significant characteristics from audio-visual data.The authors’approach builds multi-scale hierarchical features of sound spectrograms and visual images using a feature pyramid representation and localises the semantically relevant regions with a feature pyramid attention module(FPAM).A dimension alignment(DA)strategy is employed to align feature maps from multiple layers,a pyramid spatial attention(PSA)to spatially locate essential regions,and a pyramid channel attention(PCA)to pinpoint significant temporal frames.Experiments on visual scene classification(VSC),audio scene classification(ASC),and AVSC tasks demonstrate that FPANet achieves performance on par with state-of-the-art(SOTA)approaches,with a 95.9 F1-score on the ADVANCE dataset and a relative improvement of 28.8%.Visualisation results show that FPANet can prioritise semantically meaningful areas in audio-visual signals. 展开更多
关键词 dimension alignment feature pyramid attention network pyramid channel attention pyramid spatial attention semantic relevant regions
在线阅读 下载PDF
基于空间通道自适应特征的肝脏病理图像分割网络
7
作者 王建宇 王朝立 +1 位作者 孙占全 刘晓虹 《电子科技》 2026年第1期9-17,共9页
针对肝脏病理图像中病变区域与周围组织相似度高、对比度低以及边界模糊等问题,文中提出了一个基于空间通道自适应特征的肝脏病理分割网络。通过混合校准注意力使网络能够自适应地选择经空间和通道校准过的特征信息,有利于编码器捕获与... 针对肝脏病理图像中病变区域与周围组织相似度高、对比度低以及边界模糊等问题,文中提出了一个基于空间通道自适应特征的肝脏病理分割网络。通过混合校准注意力使网络能够自适应地选择经空间和通道校准过的特征信息,有利于编码器捕获与肝脏病灶相关的重要特征,并在编码器最深层引入空洞空间金字塔池化模块来弥补高级特征所缺失的多尺度信息,提高模型的分割精度。在私有肝脏数据集、公开肝脏数据集以及其他两种公开病理数据集对所提网络进行对比实验和消融实验。实验结果表明,相较于其他方法,所提网络的分割结果较佳,且有效解决了肝细胞癌分割问题。 展开更多
关键词 肝细胞癌 病理图像 编解码架构 混合校准注意力模块 空间注意力 通道注意力 空洞空间金字塔池化模块 多尺度信息
在线阅读 下载PDF
基于改进YOLOv11的CNN-Transformer混合水域垃圾检测算法
8
作者 赵建永 李瑞东 +1 位作者 姚浩 魏秀蓉 《无线互联科技》 2026年第4期21-25,50,共6页
河流水面漂浮物检测受限于复杂环境条件(如光照变化、波纹干扰)和检测目标尺度较小的特点,传统方法难以实现高精度检测。文章提出一种面向复杂水域场景的单阶段检测模型YOLOv11n-SPT,在YOLOv11n基础上引入新型Spatial Pyramid Transform... 河流水面漂浮物检测受限于复杂环境条件(如光照变化、波纹干扰)和检测目标尺度较小的特点,传统方法难以实现高精度检测。文章提出一种面向复杂水域场景的单阶段检测模型YOLOv11n-SPT,在YOLOv11n基础上引入新型Spatial Pyramid Transformer(SPT)模块与通道注意力机制。SPT模块采用多分支空间金字塔结构,实现高分辨率细节保留与超大感受野全局建模的协同。在FloW-Img数据集上,YOLOv11n-SPT的mAP@0.5达到81.2%,较基线YOLOv11n提升2.9个百分点;消融实验表明,单独引入SPT模块使mAP@0.5提升2.0%,召回率提升2.1%,进一步叠加通道注意力后精确率提升至85.4%。YOLOv11n-SPT在微小目标与强干扰场景下表现出更强的鲁棒性与定位精度,为无人清漂船、无人机巡河等实际水域环境治理任务提供了高效可靠的感知方案。 展开更多
关键词 水面漂浮物检测 spatial pyramid Transformer YOLOv11
在线阅读 下载PDF
基于多层次特征融合和注意力机制的无人机图像小目标检测算法 被引量:1
9
作者 张信佳 王芳 《计算机工程》 北大核心 2026年第2期148-157,共10页
无人机(UAV)航拍图像中的目标通常具有尺度密集、易被遮挡且多为小目标等特点,这导致检测过程中容易出现漏检和误检。为应对上述挑战,基于YOLOv5s提出了针对小目标检测的SNA-YOLOv5s算法。首先,引入空间深度转换卷积(SPD-Conv)模块替换... 无人机(UAV)航拍图像中的目标通常具有尺度密集、易被遮挡且多为小目标等特点,这导致检测过程中容易出现漏检和误检。为应对上述挑战,基于YOLOv5s提出了针对小目标检测的SNA-YOLOv5s算法。首先,引入空间深度转换卷积(SPD-Conv)模块替换原模型的跨步卷积层,避免细节信息丢失,增强小目标特征提取能力;其次,设计新型平均快速空间金字塔池化(AGSPPF)模块,引入平均池化操作缓解池化层在提取特征信息的同时会导致部分信息丢失的问题,提升模型的特征提取能力;再次,新增针对小目标的大尺度检测分支,捕捉浅层特征中丰富的细节信息,提升模型对小目标的检测能力;最后,将归一化注意力机制(NAM)嵌入骨干网络,对特征信息进行加权处理,抑制无效的特征信息。在VisDrone2019数据集和NWPU VHR-10数据集上的训练测试结果表明,该算法的均值平均精度(mAP)分别达到了42.3%和96.5%,与基线模型YOLOv5s相比分别提高了8.4和2.6百分点。通过与其他基于深度学习的主流模型对比实验,进一步验证了该模型的鲁棒性和精确性。 展开更多
关键词 YOLOv5s模型 小目标检测 空间深度转换卷积 空间金字塔池化 归一化注意力机制
在线阅读 下载PDF
基于关键点特征提取与融合的人体姿态检测模型
10
作者 刘启恒 胡永祥 +1 位作者 潘长宁 韩龙志 《现代电子技术》 北大核心 2026年第7期31-39,共9页
针对不同场景下人体关键点特征提取能力和融合能力不足的问题,文中提出一种改进的YOLOv11n-Pose模型。该模型使用PKI Block替换原有的Bottleneck结构,以增强关键点特征的提取能力。同时,设计多膨胀率的空间金字塔卷积模块,以提高特征提... 针对不同场景下人体关键点特征提取能力和融合能力不足的问题,文中提出一种改进的YOLOv11n-Pose模型。该模型使用PKI Block替换原有的Bottleneck结构,以增强关键点特征的提取能力。同时,设计多膨胀率的空间金字塔卷积模块,以提高特征提取时的灵活性和表达能力。最后,引入CAF Block网络,进一步提升多尺度特征的融合效果。实验结果表明,所提算法在COCO2017数据集上的精确率、召回率、mAP@0.5、mAP@0.5:0.9相较于原模型分别提高了3.1%、2.9%、3.5%和1.2%。在实际推理中关键点位置估计误差和漏检情况显著减少,具有较好的应用价值。 展开更多
关键词 姿态检测 注意力机制 特征提取 特征融合 空间金字塔卷积 CAF Block网络
在线阅读 下载PDF
基于Oracle 10g Spatial的栅格数据存储、管理及关键技术 被引量:13
11
作者 黄登山 陈大克 +1 位作者 葛峰 李全杰 《桂林工学院学报》 北大核心 2005年第3期317-321,共5页
在Oracle 10g Spatial可以存储管理矢量数据的基础上,研究栅格图像的存储与管理,分析了栅格数据、元数据、波段、图层、坐标系、物理存储结构等几个相关概念,探讨了存储管理中分块、索引、影像金字塔、地理参照等关键技术,最后用实验证... 在Oracle 10g Spatial可以存储管理矢量数据的基础上,研究栅格图像的存储与管理,分析了栅格数据、元数据、波段、图层、坐标系、物理存储结构等几个相关概念,探讨了存储管理中分块、索引、影像金字塔、地理参照等关键技术,最后用实验证明,采用Oracle 10gSpatial选件可以进行栅格图像的有效存储与管理.并设计了空间数据表结构,将空间对象的栅格数据、矢量数据及属性数据存储到同一数据库,实现了空间数据的一体化管理. 展开更多
关键词 栅格数据 ORACLE spatial 数据库 影像金字塔
在线阅读 下载PDF
基于Oracle 9i Spatial的海量空间影像数据管理 被引量:11
12
作者 邓雪清 张永生 +1 位作者 李波 巩丹超 《测绘学院学报》 北大核心 2003年第2期110-112,116,共4页
利用Oracle 9iSpatial组件提供的模型和功能 ,研究了海量空间影像数据的管理技术。实验表明 ,采用规则分块技术和构建影像金字塔可以实现对超大空间影像的有效管理 ,并为高性能并行数据服务提供了实现基础。
关键词 海量空间影像 几何图形 空间查询 金字塔结构 多分辨率层次模型
在线阅读 下载PDF
改进YOLOv5的道路小目标检测算法
13
作者 王海涛 裴树军 +1 位作者 裴洪扬 许靖 《哈尔滨理工大学学报》 北大核心 2026年第1期35-46,共12页
针对目前自动驾驶领域目标检测算法在对道路小目标检测时经常出现漏检、误检的问题,提出基于YOLOv5s的目标检测算法SCE-YOLOv5。首先,借鉴SPPCSPC的思想,对主干网络中的SPPF层进行了重新设计,确保在提高模型精度和感受野的同时获得速度... 针对目前自动驾驶领域目标检测算法在对道路小目标检测时经常出现漏检、误检的问题,提出基于YOLOv5s的目标检测算法SCE-YOLOv5。首先,借鉴SPPCSPC的思想,对主干网络中的SPPF层进行了重新设计,确保在提高模型精度和感受野的同时获得速度的提升。其次,Neck部分的上采样算子被替换为CARAFE,能够在较大的感受野内聚合上下文信息,避免上采样过程中部分特征信息缺失。最后,在每一层检测头前都引入EMA注意力机制,对全局信息进行编码,提取更多的特征信息。实验结果表明:在KITTI数据集和Kaggle数据集上,改进后的算法与原算法相比,m AP值有所提高,并且检测速度也分别达到了90帧/秒和61帧/秒,具备较高的实时性,可以满足自动驾驶道路目标检测的需求。 展开更多
关键词 道路目标检测 注意力机制 YOLOv5 空间金字塔池化 特征上采样
在线阅读 下载PDF
基于多尺度金字塔池化的自适应无参考图像质量评价
14
作者 吴雪松 陈媛媛 周涛 《计算机工程》 北大核心 2026年第3期107-118,共12页
在图像质量评价(IQA)领域,无参考质量评价方法在处理真实场景下的失真图像时展现了巨大的应用价值和未来发展潜力,然而真实环境中的失真图像具有高度的多样性和复杂性,增加了相关评价算法设计的难度。近年来,深度学习技术在图像分类、... 在图像质量评价(IQA)领域,无参考质量评价方法在处理真实场景下的失真图像时展现了巨大的应用价值和未来发展潜力,然而真实环境中的失真图像具有高度的多样性和复杂性,增加了相关评价算法设计的难度。近年来,深度学习技术在图像分类、目标检测以及图像分割等细分领域均取得了令人瞩目的成果。这些进展推动科研人员将深度神经网络(DNN)技术引入IQA中。DNN凭借其出色的特征提取和学习能力,为真实环境中的失真IQA带来了创新性的解决方案和显著的进步。但是,现有方法在处理真实场景图像质量描述时仍存在一定的局限性,特别是在应对图像内容多样性方面。此外,许多基于DNN的IQA方法需要对输入图像进行缩放或裁剪以固定分辨率,这往往会破坏图像的原始结构和内容,从而影响质量评估的准确性和泛化能力。为了解决这些问题,提出一种基于多尺度金字塔池化的自适应无参考图像质量评价方法(MSPP-IQA)。MSPP-IQA允许直接使用原始尺寸的图像进行质量评估,无需任何图像预处理,通过引入图像内容理解模块和注意力模块,模仿人类视觉系统(HVS)的工作原理,同时感知全局高级特征和局部低级特征。实验结果表明,相较于当前主流方法,MSPP-IQA在真实失真和合成失真数据集上均表现出良好的性能。这一实验结果充分证明了MSPP-IQA在应对真实失真IQA挑战方面的有效性和优越性。 展开更多
关键词 无参考图像质量评价 真实失真 多尺度特征融合 空间金字塔池化 注意力机制
在线阅读 下载PDF
基于多尺度特征融合的矿用钢索损伤检测网络
15
作者 徐永恒 裴晓芳 《计算机工程与设计》 北大核心 2026年第2期576-583,共8页
矿用钢索的安全性直接影响作业人员生命保障与设备运行,其损伤检测面临尺度多变、形态不规则的挑战。针对此问题,提出一种轻量级的可形变与多尺度融合网络。设计一种DRConv卷积模块,提升网络在复杂环境下的精度。基于MSDA注意力机制,提... 矿用钢索的安全性直接影响作业人员生命保障与设备运行,其损伤检测面临尺度多变、形态不规则的挑战。针对此问题,提出一种轻量级的可形变与多尺度融合网络。设计一种DRConv卷积模块,提升网络在复杂环境下的精度。基于MSDA注意力机制,提出空洞空间金字塔SPDA改进原有的SPPF模块,提升上采样效果。基于DCN和D-LKA的思想设计SLNK模块,并结合RT-DETR解码器中的CCFM网络,形成一种全新的融合多尺度和可形变卷积的颈部网络RTSLNK,轻量化模型的同时提高精度。实验结果表明,相较于原模型YOLOv8n,平均精度提高5.2%,参数量降低10.5%,在矿用钢索损伤检测任务中表现出色。 展开更多
关键词 矿用钢丝绳索 表面损伤检测 可形变卷积 空洞空间金字塔 可变形大核注意力 跨尺度特征融合 轻量化网络
在线阅读 下载PDF
轻量化几何流形深度网络的自闭症诊断方法
16
作者 吴金颖 马慧彬 《现代信息科技》 2026年第3期70-75,共6页
自闭症谱系障碍(Autism Spectrum Disorder,ASD)是一类常见的中枢神经发育障碍,其临床诊断存在主观性强、准确性不足的问题。为提升功能性磁共振成像(functional Magnetic Resonance Imaging,fMRI)在计算机辅助诊断中的性能,文章构建了... 自闭症谱系障碍(Autism Spectrum Disorder,ASD)是一类常见的中枢神经发育障碍,其临床诊断存在主观性强、准确性不足的问题。为提升功能性磁共振成像(functional Magnetic Resonance Imaging,fMRI)在计算机辅助诊断中的性能,文章构建了一种轻量化几何流形深度网络(Lightweight Geometric Manifold Deep Network,LGMD-Net)。该网络采用多通道二维残差结构结合医学几何先验获取三维信息,通过轻量化残差块实现高效特征提取;在特征降维阶段,引入空间金字塔池化捕获多尺度空间特征,并结合流形混合(Manifold Mixup)技术实现特征增强与正则化。实验在ABIDE数据集上开展,结果表明,该方法在分类准确率、F1值及AUC等指标上均优于卷积神经网络、Transformer及图神经网络模型,同时在参数规模、推理时间与显存占用方面具备显著优势。研究结果验证了LGMD-Net在提升诊断准确性及工程化应用中的可行性。 展开更多
关键词 自闭症谱系障碍 功能磁共振成像 轻量化网络 空间金字塔池化 流形混合
在线阅读 下载PDF
基于语义分割网络的智能驾驶车道检测算法研究
17
作者 杜家宇 王书强 《智能计算机与应用》 2026年第2期197-200,F0003,共5页
本文针对当前很多语义分割网络在车道检测任务中因受外界环境因素干扰造成检测精度低的问题,提出了一种基于ESPNet网络优化改进方法。在特征提取网络末端以高效通道注意力和位置注意力模块为基础构建融合注意力机制,在加强了局部跨通道... 本文针对当前很多语义分割网络在车道检测任务中因受外界环境因素干扰造成检测精度低的问题,提出了一种基于ESPNet网络优化改进方法。在特征提取网络末端以高效通道注意力和位置注意力模块为基础构建融合注意力机制,在加强了局部跨通道信息交互的同时增强了空间上下文信息聚合能力。改进后的模型在BDD100k数据集上进行验证,实验结果表明,改进后语义分割模型检测精度在车道线以及可行驶区域的检测任务中均有提升。 展开更多
关键词 智能驾驶 语义分割 高效空间金字塔 融合注意力机制
在线阅读 下载PDF
基于Oracle 10g Spatial的空间栅格数据的存储与管理 被引量:1
18
作者 李光师 徐全生 史新慧 《地理空间信息》 2007年第2期30-33,共4页
深入地研究和分析了Oracle 10g Spatial中新增的栅格数据的存储和管理机制,包括其采用的数据模型、元数据管理机制、栅格金字塔策略及物理存储结构等。在实验中给出了一个比较典型的对栅格数据进行存储和管理的操作示例。同时,指出了Ora... 深入地研究和分析了Oracle 10g Spatial中新增的栅格数据的存储和管理机制,包括其采用的数据模型、元数据管理机制、栅格金字塔策略及物理存储结构等。在实验中给出了一个比较典型的对栅格数据进行存储和管理的操作示例。同时,指出了Oracle提供的栅格数据上载工具存在的局限性,并针对该局限性提出了一种简单有效的解决方案。 展开更多
关键词 栅格数据 ORACLE spatial GEORASTER 栅格金字塔
在线阅读 下载PDF
SCVi-Net:一种基于混合模型的视网膜血管分割方法
19
作者 茅纪慧 姜尚格日乐 江旻珊 《光学仪器》 2026年第1期30-42,共13页
现有视网膜血管分割方法通常受限于局部感受野,难以有效捕获全局信息。此外,血管结构在不同尺度下的形态差异较大,使得多尺度特征融合变得困难。为了解决上述问题,提出了一种高效的视网膜血管分割模型SCVi-Net。该模型在U-Net的基础上... 现有视网膜血管分割方法通常受限于局部感受野,难以有效捕获全局信息。此外,血管结构在不同尺度下的形态差异较大,使得多尺度特征融合变得困难。为了解决上述问题,提出了一种高效的视网膜血管分割模型SCVi-Net。该模型在U-Net的基础上改进了跳跃连接,引入一个新的空间通道联合注意力模块,通过自适应调整空间和通道权重,增强了特征提取能力。通过在编码器最深层加入视觉Transformer模块,SCVi-Net的全局信息捕获能力得到了提升。空洞空间金字塔池化模块能有效提取多尺度特征,可增强网络的鲁棒性。侧边多尺度融合模块通过融合多个侧边输出,优化了训练过程,从而提升了血管区域的分割精度。为评估模型的优越性,在DRIVE、CHASEDB1和STARE数据集上进行了对比实验,结果表明,SCVi-Net在复杂视网膜血管图像中具有较好的分割精度和鲁棒性。 展开更多
关键词 视网膜血管分割 U-Net 联合注意力机制 Transformer 空洞卷积 SCVi-Net 医学图像处理
在线阅读 下载PDF
基于改进U-KAN的田间秸秆覆盖率检测技术
20
作者 马钦 陈子霖 +6 位作者 王昊天 刘哲 张凯 史晓晨 李海龙 张婧芳 吴才聪 《农业机械学报》 北大核心 2026年第4期309-316,共8页
准确高效地检测秸秆覆盖率关乎土壤保护和农业可持续发展,然而现有的秸秆覆盖率检测模型易受光照或阴影等自然环境的影响,当秸秆与土地相似度较高时模型精度会大幅下降。针对车载相机拍摄的秸秆图像中秸秆形态各异、光照引起土地泛白、... 准确高效地检测秸秆覆盖率关乎土壤保护和农业可持续发展,然而现有的秸秆覆盖率检测模型易受光照或阴影等自然环境的影响,当秸秆与土地相似度较高时模型精度会大幅下降。针对车载相机拍摄的秸秆图像中秸秆形态各异、光照引起土地泛白、土地颗粒感强或阴影遮挡的问题,本文提出了一种在自然环境下检测不同尺度秸秆的语义分割方法(Unified attention mixed pooling pyramidU-KAN)。本文用深度膨胀可分离卷积替代传统空洞空间金字塔池化的空洞卷积以获取更多秸秆细节信息,并在自适应平均池化的基础上,增加条带池化分支以更好捕获间隔较大秸秆的特征,从而构建混合池化膨胀空间金字塔模块,将该模块应用于主干网络的最高语义层以获取零散分布秸秆的多尺度信息。同时在解码阶段引入统一注意力融合模块以有效恢复秸秆分割边缘的细节信息。试验结果表明,UMU-KAN在本文构建的秸秆数据集上平均交并比为85.36%,平均像素精度为91.71%,优于经典算法Unet、Swin-Unet和DeepLabv3+,其平均交并比相比DeepLabv3+高1.25个百分点,该模型对自然环境下形态各异的秸秆具有更强的分割性能和良好的鲁棒性,此外本文也进一步证明了柯尔莫戈洛夫-阿诺尔德网络(Kolmogorov-Arnold network,KAN)在农业视觉领域的发展潜力。 展开更多
关键词 秸秆覆盖率 语义分割 空洞空间金字塔
在线阅读 下载PDF
上一页 1 2 30 下一页 到第
使用帮助 返回顶部