期刊文献+
共找到906篇文章
< 1 2 46 >
每页显示 20 50 100
Multi-focus image fusion based on block matching in 3D transform domain 被引量:5
1
作者 YANG Dongsheng HU Shaohai +2 位作者 LIU Shuaiqi MA Xiaole SUN Yuchao 《Journal of Systems Engineering and Electronics》 SCIE EI CSCD 2018年第2期415-428,共14页
Fusion methods based on multi-scale transforms have become the mainstream of the pixel-level image fusion. However,most of these methods cannot fully exploit spatial domain information of source images, which lead to ... Fusion methods based on multi-scale transforms have become the mainstream of the pixel-level image fusion. However,most of these methods cannot fully exploit spatial domain information of source images, which lead to the degradation of image.This paper presents a fusion framework based on block-matching and 3D(BM3D) multi-scale transform. The algorithm first divides the image into different blocks and groups these 2D image blocks into 3D arrays by their similarity. Then it uses a 3D transform which consists of a 2D multi-scale and a 1D transform to transfer the arrays into transform coefficients, and then the obtained low-and high-coefficients are fused by different fusion rules. The final fused image is obtained from a series of fused 3D image block groups after the inverse transform by using an aggregation process. In the experimental part, we comparatively analyze some existing algorithms and the using of different transforms, e.g. non-subsampled Contourlet transform(NSCT), non-subsampled Shearlet transform(NSST), in the 3D transform step. Experimental results show that the proposed fusion framework can not only improve subjective visual effect, but also obtain better objective evaluation criteria than state-of-the-art methods. 展开更多
关键词 image fusion block matching 3d transform block-matching and 3d(BM3d) non-subsampled Shearlet transform(NSST)
在线阅读 下载PDF
基于3D-CNN和融合Transformer的步态识别算法 被引量:1
2
作者 李金成 代雪晶 闫睿骜 《科学技术与工程》 北大核心 2025年第17期7276-7284,共9页
当前,步态识别的主流方法常依赖堆叠卷积层来逐步扩大感受野,以融合局部特征,这种方法大多采用浅层网络,在提取步态图像的全局特征时存在一定的局限性,并缺乏对时序周期特征信息的关注。因此提出一种融合Transformer和3D卷积的深层神经... 当前,步态识别的主流方法常依赖堆叠卷积层来逐步扩大感受野,以融合局部特征,这种方法大多采用浅层网络,在提取步态图像的全局特征时存在一定的局限性,并缺乏对时序周期特征信息的关注。因此提出一种融合Transformer和3D卷积的深层神经网络算法(3D convolutional gait recognition network based on adaptFormer and spect-conv,3D-ASgaitNet)。首先,初始残差卷积层将二进制轮廓数据转换为浮点编码特征图,以提供密集的低级结构特征;在此基础上,光谱层通过频域和时域的联合处理增强特征提取能力,并使用伪3D残差卷积模块进一步提取高级时空特征;最后融合AdaptFormer模块,通过轻量级的下采样-上采样网络结构,以适应不同的数据分布和任务需求,提供灵活的特征变换能力。3D-ASgaitNet分别在4个公开的室内数据集(CASIA-B、OU-MVLP)、室外数据集(GREW、Gait3D)上进行,分别取得99.84%、87.83%、45.32%、72.12%的识别准确率。实验结果表明,所提出方法在CASIA-B、Gait3D数据集中的识别准确率接近SOTA性能。 展开更多
关键词 步态识别 融合transformer 3d残差卷积 二进制轮廓数据
在线阅读 下载PDF
基于Transformer模型的3D NAND闪存剩余寿命预测方法
3
作者 石颖 杨少华 +2 位作者 周斌 吴福根 胡湘洪 《微电子学》 北大核心 2025年第2期327-334,共8页
为了预测3D NAND闪存的剩余使用寿命以及提高数据存储的可靠性,设计了3D NAND闪存的高温和温度循环实验,分析了各项操作时间和原始错误比特数的变化趋势。同时建立了一种改进的Transformer模型,以预处理后的寿命特征数据为输入,对3D NAN... 为了预测3D NAND闪存的剩余使用寿命以及提高数据存储的可靠性,设计了3D NAND闪存的高温和温度循环实验,分析了各项操作时间和原始错误比特数的变化趋势。同时建立了一种改进的Transformer模型,以预处理后的寿命特征数据为输入,对3D NAND闪存的剩余使用寿命进行预测。与LSTM、GRU相比,所建立模型在高温擦写实验数据集中的均方根误差分别下降了20.5%、21.0%;在温度循环擦写实验数据集中则分别下降2.5%和7.8%。实验结果表明,该模型可以准确预测3D NAND闪存的剩余寿命,优化闪存寿命管理策略。 展开更多
关键词 3d NAND闪存 剩余使用寿命 transformer模型 寿命预测
原文传递
VoxTNT:基于多尺度Transformer的点云3D目标检测方法
4
作者 郑强文 吴升 魏婧卉 《地球信息科学学报》 北大核心 2025年第6期1361-1380,共20页
【背景】传统方法因静态感受野设计较难适配城市自动驾驶场景中汽车、行人及骑行者等目标的显著尺度差异,且跨尺度特征融合易引发层级干扰。【方法】针对自动驾驶场景中多类别、多尺寸目标的3D检测中跨尺度表征一致性的关键挑战,本研究... 【背景】传统方法因静态感受野设计较难适配城市自动驾驶场景中汽车、行人及骑行者等目标的显著尺度差异,且跨尺度特征融合易引发层级干扰。【方法】针对自动驾驶场景中多类别、多尺寸目标的3D检测中跨尺度表征一致性的关键挑战,本研究提出基于均衡化感受野的3D目标检测方法VoxTNT,通过局部-全局协同注意力机制提升检测性能。在局部层面,设计了PointSetFormer模块,引入诱导集注意力模块(Induced Set Attention Block,ISAB),通过约简的交叉注意力聚合高密度点云的细粒度几何特征,突破传统体素均值池化的信息损失瓶颈;在全局层面,设计了VoxelFormerFFN模块,将非空体素抽象为超点集并实施跨体素ISAB交互,建立长程上下文依赖关系,并将全局特征学习计算负载从O(N^(2))压缩至O(M^(2))(M<<N,M为非空体素数量),规避了复杂的Transformer直接使用在原始点云造成的高计算复杂度。该双域耦合架构实现了局部细粒度感知与全局语义关联的动态平衡,有效缓解固定感受野和多尺度融合导致的特征建模偏差。【结果】实验表明,该方法在KITTI数据集单阶段检测下,中等难度级别的行人检测精度AP(Average Precision)值达到59.56%,较SECOND基线提高约12.4%,两阶段检测下以66.54%的综合指标mAP(mean Average Precision)领先次优方法BSAODet的66.10%。同时,在WOD数据集中验证了方法的有效性,综合指标mAP达到66.09%分别超越SECOND和PointPillars基线7.7%和8.5%。消融实验进一步表明,均衡化局部和全局感受野的3D特征学习机制能显著提升小目标检测精度(如在KITTI数据集中全组件消融的情况下,中等难度级别的行人和骑行者检测精度分别下降10.8%和10.0%),同时保持大目标检测的稳定性。【结论】本研究为解决自动驾驶多尺度目标检测难题提供了新思路,未来将优化模型结构以进一步提升效能。 展开更多
关键词 智能交通工程 自动驾驶 点云 三维目标检测 体素 transformER
原文传递
基于Contextual Transformer的自动驾驶单目3D目标检测
5
作者 厍向阳 颜唯佳 董立红 《计算机工程与应用》 CSCD 北大核心 2024年第19期178-189,共12页
针对当前单目3D目标检测中存在的漏检和多尺度目标检测效果不佳的问题,提出了一种基于Contextual Transformer的自动驾驶单目3D目标检测算法(CM-RTM3D)。在ResNet-50网络中引入Contextual Transformer(CoT),构建ResNet-Transformer架构... 针对当前单目3D目标检测中存在的漏检和多尺度目标检测效果不佳的问题,提出了一种基于Contextual Transformer的自动驾驶单目3D目标检测算法(CM-RTM3D)。在ResNet-50网络中引入Contextual Transformer(CoT),构建ResNet-Transformer架构以提取特征。设计多尺度空间感知模块(MSP),通过尺度空间响应操作改善浅层特征的丢失情况,嵌入沿水平和竖直两个空间方向的坐标注意力机制(CA),使用softmax函数生成各尺度的重要性软权重。在偏移损失中采用Huber损失函数代替L1损失函数。实验结果表明:在KITTI自动驾驶数据集上,相较于RTM3D算法,该算法在简单、中等、困难三个难度级别下,AP3D分别提升了4.84、3.82、5.36个百分点,APBEV分别提升了4.75、6.26、3.56个百分点。 展开更多
关键词 自动驾驶 单目3d目标检测 Contextual transformer 多尺度感知 坐标注意力机制
在线阅读 下载PDF
基于局部特征编解码的自动驾驶3D目标检测
6
作者 邵凯 吴广 +2 位作者 梁燕 奚兴发 高琳珈 《系统工程与电子技术》 北大核心 2025年第10期3168-3178,共11页
针对自动驾驶三维目标检测中多层次特征提取和多尺度特征上下文依赖性问题,采用点-体素的检测框架,提出一种综合多项技术的基于局部特征编解码区域卷积神经网络(local feature encode-decode region-based convolutional neural network... 针对自动驾驶三维目标检测中多层次特征提取和多尺度特征上下文依赖性问题,采用点-体素的检测框架,提出一种综合多项技术的基于局部特征编解码区域卷积神经网络(local feature encode-decode region-based convolutional neural network,LFED-RCNN)。首先,在三维特征提取阶段提出结合卷积网络和Transformer编解码结构的卷积编解码主干,其中额外下采样卷积网络提取多层次三维特征,局部编解码网络建模特征间关联并融合深浅层特征,提升模型在复杂背景下对前景目标的特征获取能力。其次,设计位置编码模块对鸟瞰图视角下的二维特征进行位置编码,建立长期依赖关系,提升检测精度。所提方案LFED-RCNN在KITTI和ONCE数据集上进行验证,在KITTI数据集的困难等级下,对车、行人、骑行者三类检测对象分别可达到82.95%、57.48%、72.14%的平均准确率(mean average precision,mAP)。实验结果证明,所提方法在困难模式上表现出优异性能。 展开更多
关键词 三维目标检测 点云 transformER 编码器 解码器 接受域
在线阅读 下载PDF
PillarTNet:基于Transformer的三维目标检测模型
7
作者 韩建栋 苏佳 《小型微型计算机系统》 北大核心 2025年第9期2168-2175,共8页
针对三维点云目标检测中传统的卷积神经网络在特征提取阶段因下采样导致分辨率降低,影响小目标的识别准确性问题,本文提出一种基于Transformer的三维目标检测模型:PillarTNet.该模型首先使用双重注意力融合模块强化特征编码,然后通过区... 针对三维点云目标检测中传统的卷积神经网络在特征提取阶段因下采样导致分辨率降低,影响小目标的识别准确性问题,本文提出一种基于Transformer的三维目标检测模型:PillarTNet.该模型首先使用双重注意力融合模块强化特征编码,然后通过区域扩张注意力模块提取特征,保持整个过程伪图像分辨率不变,更有利于小目标的检测,同时引入区域移位机制促进不同区域的信息交流.但是注意力操作会存在大量空体素,可能增加大目标的漏检与误检风险,为此,对检测头采用空体素关注模块以缓解这一问题.在KITTI数据集上的实验结果显示:PillarTNet在确保Car和Cyclist检测精度的同时,Pedestrian的检测在3个难度等级的AP 3D分别达到了62.48%、53.21%和49.57%,且本模型在推理速度和内存需求方面均表现出色,充分验证了PillarTNet的优越性和适应性. 展开更多
关键词 三维目标检测 点云 transformER 双重注意力融合 空体素关注
在线阅读 下载PDF
基于时空注意力的3D人体姿态估计网络设计
8
作者 易见兵 张裕贤 +3 位作者 曹锋 李俊 彭鑫 陈鑫 《广西师范大学学报(自然科学版)》 北大核心 2025年第5期130-144,共15页
在3D人体姿态估计中,遮挡会导致人体关节点提取不准确,针对该问题,本文提出一种结合时空注意力和通道注意力的3D人体姿态估计算法。首先,提出一种特征筛选模块,该模块通过引入位置嵌入模块,以进一步捕获人体关节点的特征信息;其次,提出... 在3D人体姿态估计中,遮挡会导致人体关节点提取不准确,针对该问题,本文提出一种结合时空注意力和通道注意力的3D人体姿态估计算法。首先,提出一种特征筛选模块,该模块通过引入位置嵌入模块,以进一步捕获人体关节点的特征信息;其次,提出一种移动视觉Transformer时间注意力模块,该模块通过引入SiLU激活函数,以获取更多姿态特征细节;最后,提出一种通道注意力模块,该模块通过引入并行分支处理架构及增加归一化层,以调整输出通道的特征权重,达到算法对人体姿态特征的关注和弱化其背景特征的目的。在Human3.6M数据集上进行实验,相较于基准模型Strided Transformer,将级联金字塔网络提取的2D关节点作为输入时,每关节位置误差的平均值和进行普罗克鲁斯对齐后的每关节位置误差的平均值分别下降2.5%和2.3%;将Human3.6M数据集标注的2D关节点作为输入时,每关节位置误差的平均值下降6.7%。实验结果表明,本文提出的算法准确性较高。 展开更多
关键词 3d人体姿态估计 遮挡 时空注意力 通道注意力 transformER
在线阅读 下载PDF
Efficient single-pixel imaging encrypted transmission based on 3D Arnold transformation
9
作者 梁振宇 王朝瑾 +4 位作者 王阳阳 高皓琪 朱东涛 许颢砾 杨星 《Chinese Physics B》 SCIE EI CAS CSCD 2024年第3期378-386,共9页
Single-pixel imaging(SPI)can transform 2D or 3D image data into 1D light signals,which offers promising prospects for image compression and transmission.However,during data communication these light signals in public ... Single-pixel imaging(SPI)can transform 2D or 3D image data into 1D light signals,which offers promising prospects for image compression and transmission.However,during data communication these light signals in public channels will easily draw the attention of eavesdroppers.Here,we introduce an efficient encryption method for SPI data transmission that uses the 3D Arnold transformation to directly disrupt 1D single-pixel light signals and utilizes the elliptic curve encryption algorithm for key transmission.This encryption scheme immediately employs Hadamard patterns to illuminate the scene and then utilizes the 3D Arnold transformation to permutate the 1D light signal of single-pixel detection.Then the transformation parameters serve as the secret key,while the security of key exchange is guaranteed by an elliptic curve-based key exchange mechanism.Compared with existing encryption schemes,both computer simulations and optical experiments have been conducted to demonstrate that the proposed technique not only enhances the security of encryption but also eliminates the need for complicated pattern scrambling rules.Additionally,this approach solves the problem of secure key transmission,thus ensuring the security of information and the quality of the decrypted images. 展开更多
关键词 single-pixel imaging 3d Arnold transformation elliptic curve encryption image encryption
原文传递
CT图像肾肿瘤分割的三维轴向Transformer模型
10
作者 张金龙 吴敏 孙玉宝 《计算机工程与科学》 北大核心 2025年第4期677-685,共9页
自动分割CT图像序列中肾脏及其肿瘤区域能够为放化疗计划提供定量参考依据。当前基于Transformer的肾肿瘤分割模型得到了广泛关注,特别是与U-Net模型及其变体结合使用。现有的基于Transformer的分割网络通常在单个切片局部窗口内进行特... 自动分割CT图像序列中肾脏及其肿瘤区域能够为放化疗计划提供定量参考依据。当前基于Transformer的肾肿瘤分割模型得到了广泛关注,特别是与U-Net模型及其变体结合使用。现有的基于Transformer的分割网络通常在单个切片局部窗口内进行特征学习,对切片内空间信息以及切片间轴向信息表示存在不足。针对这一问题,提出了三维轴向Transformer模块,将3个维度的复杂耦合关联分解为交替的2个轴向注意力,融合了切片内部以及切片之间的轴向体关联信息。以三维轴向Transformer模块为基础,融合多尺度特征与残差学习方式,构建了二阶段的肾脏肿瘤分割编解码网络ATrans UNet,在KiTS19数据集上,肾脏和肾脏肿瘤分割结果的Dice相似性分别是96.43%和81.04%,平均Dice得分对比2D-Unet提升了8.40%,对比3D-Unet提升了4.84%。 展开更多
关键词 CT图像序列 肾肿瘤三维分割 三维轴向transformer 二阶段编解码网络
在线阅读 下载PDF
基于3D TransUnet模型的断层识别方法
11
作者 赵昭阳 赵建国 +3 位作者 欧阳芳 马铭 闫博鸿 张宇 《石油科学通报》 2025年第5期878-891,共14页
断层作为油气运移、聚集的重要通道和场所,其识别任务是地震资料解释工作的重要环节。然而断层的类型多样、分布广泛、特征复杂,为断层识别任务带来了不小的困难,本文提出了使用3D TransUnet模型进行断层识别的方法,该模型基于3D CNN和T... 断层作为油气运移、聚集的重要通道和场所,其识别任务是地震资料解释工作的重要环节。然而断层的类型多样、分布广泛、特征复杂,为断层识别任务带来了不小的困难,本文提出了使用3D TransUnet模型进行断层识别的方法,该模型基于3D CNN和Transformer模块构建而成,采用3D Unet模型端对端的结构设计,通过学习合成地震数据三维断层之间的空间关系,从而预测实际地震数据的断层信息,在荷兰北海F3区块和塔里木盆地哈拉哈塘地区的地震工区都成功应用,并取得良好的效果。研究结果表明,3D TransUnet模型具有CNN局部精度高和Transformer全局注意力的特点,能够根据断层全局信息对复杂区域的断层进行推理预测。将实验结果与3D Unet模型和其他传统方法断层识别的结果进行对比,通过计算验证集断层识别的召回率(Recall)和精确率(Precision),得到的3D TransUnet模型断层识别的召回率为0.87,精确率为0.83,远高于其他断层识别方法。在三维实际地震工区的应用中,3D TransUnet模型能够在不同实际地震工区都准确地识别出断层信息,对于特征较弱的断层,由于该模型加入了Transformer模块,具备全局注意力机制,因此可以通过整个工区断层的分布趋势来推断出该区域是否存在断层。通过将训练完成的断层识别模型同时运用到不同实际地震工区(F3区块和哈拉哈塘地区),从而证明了该方法的通用性,即训练好的断层识别模型可以在不同地区的地震数据中使用。研究发现该方法能够有效地识别出地层中的微裂缝信息,在微裂缝作为储集层的油气田,由于微裂缝主要沿着大断层发育,井位都部署在大断层的附近,而在这类油气田的中后期采油阶段,井位的部署则主要根据微裂缝的发育程度决定,因此该断层识别方法对微裂缝作为储集层的油气田的井位部署具有指导意义。 展开更多
关键词 深度学习 合成模型 3d TransUnet transformER 断层识别
原文传递
基于3D高斯溅射的人物化身重建算法
12
作者 李斌 张文慧 +1 位作者 项颖 郝禄国 《电子测量技术》 北大核心 2025年第10期177-185,共9页
针对基于神经辐射场的隐式建模技术在个性化三维人物化身的创建中存在训练效率低和人物姿势泛化能力不足的问题。本文提出了一种结合3D高斯溅射技术和人体参数化模型的显示表示方法,并引入基于注意力机制的Point Transformer架构,该架... 针对基于神经辐射场的隐式建模技术在个性化三维人物化身的创建中存在训练效率低和人物姿势泛化能力不足的问题。本文提出了一种结合3D高斯溅射技术和人体参数化模型的显示表示方法,并引入基于注意力机制的Point Transformer架构,该架构能够深入学习并提取每一帧中的人物姿势信息,并将其有效融合到高斯属性参数中,从而增强模型的渲染能力。在People-Snapshot数据集上的实验中,本文方法与当前先进方法进行了对比。定量结果显示,本文方法在PSNR指标上平均达到29.53,相较于基线方法提升了13.7%,表现出显著优势。定性评估表明,即使在人物大幅度运动的情况下,本文算法仍能有效保证渲染结果的完整性和细节表现。 展开更多
关键词 3d高斯溅射 参数化人体模型 三维人物重建 transformER
原文传递
基于Transformer构架的海气耦合智能模型对ENSO的预测及订正
13
作者 马天翼 智海 +1 位作者 张荣华 周路 《海洋学报》 北大核心 2025年第6期33-46,共14页
厄尔尼诺-南方涛动(El Niño-Southern Oscillation,ENSO)作为气候系统中最强的年际变率信号,可对全球的天气和气候产生重要的影响。在全球变暖下,ENSO的演变愈发呈现出复杂、多样的特征,其模拟与预测已成为气候领域极具挑战性的课... 厄尔尼诺-南方涛动(El Niño-Southern Oscillation,ENSO)作为气候系统中最强的年际变率信号,可对全球的天气和气候产生重要的影响。在全球变暖下,ENSO的演变愈发呈现出复杂、多样的特征,其模拟与预测已成为气候领域极具挑战性的课题。本研究引入基于Transformer架构开发的热带海气系统多变量智能预测模型——3D-Geoformer,开展ENSO预测的误差分析及订正研究。3DGeoformer模型不同于多数智能模型的仅对ENSO相关的单变量场或时间序列进行预测,实现了对热带太平洋海气系统多变量三维场的准确表征和预测,保证了ENSO预测所需物理过程的完整性。同时,本文针对3D-Geoformer模型在ENSO中存在的春季预测技巧低、赤道西太平洋海表温度(SST)预测能力较弱和极端ENSO事件预测强度偏低等问题,提出了基于经验正交分解(EOF)的季节预测误差订正技术,并应用于对3D-Geoformer预测结果的订正检验。在订正关系构建阶段,通过对1983-2009年的多变量预测场和预测误差场进行EOF分析,构建二者主成分序列间的线性关系,并用于后续误差订正。在测试阶段,利用预测场的EOF主成分系数以及与误差场主成分的线性关系,便可算出对应的预测误差场主成分,进而得到预测误差场和校正的预测场。结果显示,使用3D-Geoformer模型对赤道西太平洋海表温度预测时,预测误差在0.15℃以下;赤道中东太平洋SST预测误差缩减46.7%。通过比较EOF订正前后的3D-Geoformer模型对赤道太平洋SST预测结果的异常相关系数(ACC)的差值,结果发现,ACC的差值均有正值区,表明经过EOF订正后的模型预测准确度提高,且优化了3D-Geoformer模型在训练过程中使用第6次耦合模式比较计划(CMIP6)的气候模式数据引起的“冷舌偏差”问题。模型对提前12个月对2015-2016年El Ni?o的预测订正结果显示,赤道西太平洋地区SST误差控制在0.5℃以内,赤道东太平洋SST预测误差减小约75%,误差范围缩至±0.5℃以内。本研究揭示了基于EOF分解的季节预测误差订正方法在改善模式预测中的应用价值,为进一步提高智能模型预测ENSO的精度提供了新方法,也为地球科学领域相关的模拟预测、误差分析研究提供了新思路。 展开更多
关键词 ENSO预测 EOF统计订正 transformER 3d-Geoformer
在线阅读 下载PDF
三维卷积与Transformer支持下联合空谱特征的高光谱影像分类 被引量:1
14
作者 何光 吴田军 《计算机工程与应用》 北大核心 2025年第2期259-272,共14页
由于CNN对局部特征提取能力强,目前仍是高光谱影像处理和分析中的主流深度模型,但是CNN感受野有限,无法建立长距离依赖关系,学习全局语义信息受限。Transformer的自注意力机制可以对输入序列中的每个位置进行注意力计算,从而能有效获取... 由于CNN对局部特征提取能力强,目前仍是高光谱影像处理和分析中的主流深度模型,但是CNN感受野有限,无法建立长距离依赖关系,学习全局语义信息受限。Transformer的自注意力机制可以对输入序列中的每个位置进行注意力计算,从而能有效获取全局上下文信息。如何实现CNN和Transformer的技术耦合并充分利用空间信息和光谱信息进行高光谱遥感影像分类是一个重要的待研问题。鉴于此,提出一种新的基于三维卷积和Transformer的高光谱遥感影像分类方法,尝试联合空谱特征实现解译能力的提升。使用主成分分析方法对高光谱遥感影像沿垂直方向降维;用非负矩阵分解算法对降维后遥感影像沿水平方向进行空间特征提取,将两种工具处理后遥感影像进行拼接,以充分保留信息;再用三维卷积核对拼接后遥感影像进行空间特征和光谱特征的综合提取;用Transformer的注意力机制对提取空间信息和光谱信息的遥感影像序列建立长距离依赖关系并使用多层感知机完成分类任务。实验表明,所提方法在WHU-Hi龙口、汉川、洪湖以及雄安新区马蹄湾村数据集上均表现出比对比方法更优异的分类性能,表明该方法具有一定的泛化性和稳健性。 展开更多
关键词 非负矩阵分解 特征融合 三维卷积 空谱联合 transformER 高光谱遥感影像分类
在线阅读 下载PDF
基于Transformer与图卷积网络的三维人体姿态估计
15
作者 王宇晶 包明明 刘星 《传感技术学报》 北大核心 2025年第9期1624-1630,共7页
提出了一种Transformer与图网络相结合的网络模型,用于对视觉传感器采集到的视频图像进行三维人体姿态估计。Transformer能够有效地从二维关键关节点中提取时空维度高相关性特征,而图网络则能够感知细节相关性特征,通过融合这两种网络结... 提出了一种Transformer与图网络相结合的网络模型,用于对视觉传感器采集到的视频图像进行三维人体姿态估计。Transformer能够有效地从二维关键关节点中提取时空维度高相关性特征,而图网络则能够感知细节相关性特征,通过融合这两种网络结构,提高了三维姿态估计的精度。在公开数据集Human3.6M上进行了仿真实验,验证了Transformer与图卷积融合算法的性能。实验结果显示,最终估计得到的三维人体关节点的平均关节点位置偏差(Mean Per Joint Position Error,MPJPE)为38.4 mm,相较于现有方法有一定提升,表明该方法具有较强的应用价值,可应用于许多下游相关工作中。 展开更多
关键词 三维人体姿态估计 transformER 图卷积 时空相关性
在线阅读 下载PDF
3D-CNN与Transformer混合结构的高光谱图像空谱联合分类 被引量:1
16
作者 景海钊 陶丽杰 张号逵 《光学精密工程》 CSCD 北大核心 2024年第23期3504-3512,共9页
针对高光谱图像(Hyperspectral Images,HSI)地面覆盖类的像素级分类问题,提出一种3D-ConvFormer的混合结构模型,该模型通过在浅层使用三维卷积(3D-CNN)操作提取高光谱图像的局部空间光谱特征,在深层利用自注意力(Slef-attention)机制在... 针对高光谱图像(Hyperspectral Images,HSI)地面覆盖类的像素级分类问题,提出一种3D-ConvFormer的混合结构模型,该模型通过在浅层使用三维卷积(3D-CNN)操作提取高光谱图像的局部空间光谱特征,在深层利用自注意力(Slef-attention)机制在卷积窗口内提取空间光谱特征,实现了卷积网络的平移不变性与self-attention对特征的灵活提取能力的有效融合。在Indian Pines,PaviaU和WHU Hi Longkou 3组公开的高光谱图像数据集上进行实验,采用总体分类精度(OA)、平均分类精度(AA)和Kappa系数3个指标,对地物类别的像素级分类结果进行量化评估。实验结果表明,模型在Indian Pines数据集上OA为98.41%,AA为97.56%,Kappa为98.16%;在PaviaU数据集上OA为99.39%,AA为99.30%,Kappa为99.18%;在WHU-Hi-Longkou数据集上OA为98.53%,AA为98.97%,Kappa为98.06%。模型在3组高光谱图像分类任务中展示出的性能均优于对比的模型方法,取得了良好的分类性能,有效提升高光谱图像的分类精度。 展开更多
关键词 计算机视觉 高光谱图像 卷积神经网络 视频转换 自注意力机制
在线阅读 下载PDF
基于3DCNN融合TFT的储粮结露风险预测研究
17
作者 李欣泽 乔星瀚 +4 位作者 王文越 乌云山丹 吴文福 郭鸿鹏 卢延辉 《农业机械学报》 北大核心 2025年第7期549-557,共9页
针对当前储粮结露风险预测主要依赖简单粮温监测和经验判断、缺乏准确预测工具的问题,本文提出了一种结合三维卷积神经网络(3DCNN)和时间融合变换器(TFT)的储粮结露风险预测方法。该方法通过3DCNN提取粮堆内部温度场的空间特征,结合TFT... 针对当前储粮结露风险预测主要依赖简单粮温监测和经验判断、缺乏准确预测工具的问题,本文提出了一种结合三维卷积神经网络(3DCNN)和时间融合变换器(TFT)的储粮结露风险预测方法。该方法通过3DCNN提取粮堆内部温度场的空间特征,结合TFT处理时间序列数据,基于历史气象数据和未来气象预报数据,实现了粮堆温度场的高精度预测,并利用预测结果与未来7 d气象预报数据进行结露风险预判。研究采用新疆塔城地区8个粮仓的实测数据进行了模型训练和验证,获得了精确的粮温预测模型。在测试集上进行了模型性能对比实验,结果显示,3 DCNN-TFT模型在粮堆温度场预测中的平均绝对误差(MAE)为0.16℃,均方根误差(RMSE)为0.18℃,显著优于其他预测模型。最后通过实仓实验验证了模型泛化能力,实验结果显示,3DCNN-TFT模型具有较高的预测精度,平均MAE为0.16℃,RMSE为0.19℃。同时,模型成功预测了结露风险并提前发出预警。本文方法显著提高了粮堆温度场预测精度,准确预测了结露风险,为储粮粮情监管与预测系统开发提供了有力支持。 展开更多
关键词 储粮 结露风险 温度场预测 3d卷积神经网络 时间融合变换器
在线阅读 下载PDF
融合点云Transformer与PointRCNN的三维目标检测
18
作者 曹捷 彭忆强 +4 位作者 樊利康 何刘 沈安林 刘旭磊 王龙飞 《应用激光》 北大核心 2025年第7期155-165,共11页
针对基于点的激光雷达三维目标检测算法存在检测性能不足的问题,提出了一种融合点云Transformer与PointRCNN的三维目标检测算法。首先,在PointRCNN的点云编码器中额外引入了稳定的局部平均特征,并进行多特征融合去增强网络算法的鲁棒性... 针对基于点的激光雷达三维目标检测算法存在检测性能不足的问题,提出了一种融合点云Transformer与PointRCNN的三维目标检测算法。首先,在PointRCNN的点云编码器中额外引入了稳定的局部平均特征,并进行多特征融合去增强网络算法的鲁棒性。其次,在细化候选框网络中引入一个专注于处理点的Transformer模块去构建感兴趣区域(RoIs)中大范围的点云关系,从而增强算法对场景空间结构的理解能力。在KITTI数据集中的实验表明,与基准算法相比,改进算法对汽车、行人和骑行者的mAP分别提高了3.07%、3.27%和4.37%。与主流的检测算法相比,改进算法也表现出优越的检测性能。最后,将改进算法部署在实车平台上进行在线检测,验证其工业价值。 展开更多
关键词 激光雷达 三维目标检测 transformER PointRCNN
原文传递
浅析裸眼3D技术在户外广告中的运用 被引量:1
19
作者 龙雨薇 《丝网印刷》 2025年第4期45-48,共4页
户外广告正处于数字化转型关键期,裸眼3D技术凭借其独特的视觉体验为户外广告注入了新的活力。裸眼3D远景大屏广告吸引观看并传播,助力城市形象塑造;裸眼3D近景小屏广告可优化观感体验,贴合场景并增强参与感。户外广告发展也面临环境限... 户外广告正处于数字化转型关键期,裸眼3D技术凭借其独特的视觉体验为户外广告注入了新的活力。裸眼3D远景大屏广告吸引观看并传播,助力城市形象塑造;裸眼3D近景小屏广告可优化观感体验,贴合场景并增强参与感。户外广告发展也面临环境限制、视角局限、高成本和内容同质化等问题,可以通过技术创新、规划观看距离和鼓励创新合作来促进其可持续发展。 展开更多
关键词 裸眼3d技术 户外广告 数字化转型 创新
在线阅读 下载PDF
基于局部特征增强的单目3D人体姿态估计算法
20
作者 闫鑫 王创业 高浩 《微电子学与计算机》 2025年第4期106-113,共8页
在计算机视觉和机器学习领域的快速发展中,3D人体姿态估计已成为一项备受关注的研究方向。早期的3D人体姿态估计方法多集中在图像领域,然而这类方法需要更多的计算资源且结果并不理想。为了克服这些问题,2D-to-3D方法应运而生。目前效... 在计算机视觉和机器学习领域的快速发展中,3D人体姿态估计已成为一项备受关注的研究方向。早期的3D人体姿态估计方法多集中在图像领域,然而这类方法需要更多的计算资源且结果并不理想。为了克服这些问题,2D-to-3D方法应运而生。目前效果最佳的2D-to-3D方法多基于Transformer,然而这类方法着重于对人体骨架的全局提取,忽略了骨架的局部差异性,导致对局部信息学习不够充分。本文提出一种基于Transformer框架的三维人体姿态估计算法,该算法在全局算法的基础上添加一个局部分支网络。在局部分支中,首先通过非均匀图卷积网络提取二维人体骨架中的空间语义特征,使网络更好地学习人体的拓扑结构关系。其次,通过分层局部时间网络从人体关节、部位及姿势这3个不同层级学习帧与帧之间的细微差异。在全局算法中,输入数据经过空间和时间Transformer分别提取所有关键点和所有帧的分布关系。该网络在低层部分由局部算法与全局算法并联提取骨架特征,高层部分则由全局算法级联组成。本文在Human3.6M和MPI-INF-3DHP两个公共数据集上使用MPJPE(Mean Per Joint Position Error)评价指标对该方法进行评估,分别取得20.8 mm及22.3 mm的结果。结果表明,本文算法已达到相对较高的性能水准。 展开更多
关键词 3d人体姿态估计 局部信息 transformER
在线阅读 下载PDF
上一页 1 2 46 下一页 到第
使用帮助 返回顶部