期刊文献+
共找到912篇文章
< 1 2 46 >
每页显示 20 50 100
Multi-focus image fusion based on block matching in 3D transform domain 被引量:6
1
作者 YANG Dongsheng HU Shaohai +2 位作者 LIU Shuaiqi MA Xiaole SUN Yuchao 《Journal of Systems Engineering and Electronics》 SCIE EI CSCD 2018年第2期415-428,共14页
Fusion methods based on multi-scale transforms have become the mainstream of the pixel-level image fusion. However,most of these methods cannot fully exploit spatial domain information of source images, which lead to ... Fusion methods based on multi-scale transforms have become the mainstream of the pixel-level image fusion. However,most of these methods cannot fully exploit spatial domain information of source images, which lead to the degradation of image.This paper presents a fusion framework based on block-matching and 3D(BM3D) multi-scale transform. The algorithm first divides the image into different blocks and groups these 2D image blocks into 3D arrays by their similarity. Then it uses a 3D transform which consists of a 2D multi-scale and a 1D transform to transfer the arrays into transform coefficients, and then the obtained low-and high-coefficients are fused by different fusion rules. The final fused image is obtained from a series of fused 3D image block groups after the inverse transform by using an aggregation process. In the experimental part, we comparatively analyze some existing algorithms and the using of different transforms, e.g. non-subsampled Contourlet transform(NSCT), non-subsampled Shearlet transform(NSST), in the 3D transform step. Experimental results show that the proposed fusion framework can not only improve subjective visual effect, but also obtain better objective evaluation criteria than state-of-the-art methods. 展开更多
关键词 image fusion block matching 3d transform block-matching and 3d(BM3d) non-subsampled Shearlet transform(NSST)
在线阅读 下载PDF
基于3D-CNN和融合Transformer的步态识别算法 被引量:1
2
作者 李金成 代雪晶 闫睿骜 《科学技术与工程》 北大核心 2025年第17期7276-7284,共9页
当前,步态识别的主流方法常依赖堆叠卷积层来逐步扩大感受野,以融合局部特征,这种方法大多采用浅层网络,在提取步态图像的全局特征时存在一定的局限性,并缺乏对时序周期特征信息的关注。因此提出一种融合Transformer和3D卷积的深层神经... 当前,步态识别的主流方法常依赖堆叠卷积层来逐步扩大感受野,以融合局部特征,这种方法大多采用浅层网络,在提取步态图像的全局特征时存在一定的局限性,并缺乏对时序周期特征信息的关注。因此提出一种融合Transformer和3D卷积的深层神经网络算法(3D convolutional gait recognition network based on adaptFormer and spect-conv,3D-ASgaitNet)。首先,初始残差卷积层将二进制轮廓数据转换为浮点编码特征图,以提供密集的低级结构特征;在此基础上,光谱层通过频域和时域的联合处理增强特征提取能力,并使用伪3D残差卷积模块进一步提取高级时空特征;最后融合AdaptFormer模块,通过轻量级的下采样-上采样网络结构,以适应不同的数据分布和任务需求,提供灵活的特征变换能力。3D-ASgaitNet分别在4个公开的室内数据集(CASIA-B、OU-MVLP)、室外数据集(GREW、Gait3D)上进行,分别取得99.84%、87.83%、45.32%、72.12%的识别准确率。实验结果表明,所提出方法在CASIA-B、Gait3D数据集中的识别准确率接近SOTA性能。 展开更多
关键词 步态识别 融合transformer 3d残差卷积 二进制轮廓数据
在线阅读 下载PDF
基于Transformer模型的3D NAND闪存剩余寿命预测方法
3
作者 石颖 杨少华 +2 位作者 周斌 吴福根 胡湘洪 《微电子学》 北大核心 2025年第2期327-334,共8页
为了预测3D NAND闪存的剩余使用寿命以及提高数据存储的可靠性,设计了3D NAND闪存的高温和温度循环实验,分析了各项操作时间和原始错误比特数的变化趋势。同时建立了一种改进的Transformer模型,以预处理后的寿命特征数据为输入,对3D NAN... 为了预测3D NAND闪存的剩余使用寿命以及提高数据存储的可靠性,设计了3D NAND闪存的高温和温度循环实验,分析了各项操作时间和原始错误比特数的变化趋势。同时建立了一种改进的Transformer模型,以预处理后的寿命特征数据为输入,对3D NAND闪存的剩余使用寿命进行预测。与LSTM、GRU相比,所建立模型在高温擦写实验数据集中的均方根误差分别下降了20.5%、21.0%;在温度循环擦写实验数据集中则分别下降2.5%和7.8%。实验结果表明,该模型可以准确预测3D NAND闪存的剩余寿命,优化闪存寿命管理策略。 展开更多
关键词 3d NAND闪存 剩余使用寿命 transformer模型 寿命预测
原文传递
VoxTNT:基于多尺度Transformer的点云3D目标检测方法
4
作者 郑强文 吴升 魏婧卉 《地球信息科学学报》 北大核心 2025年第6期1361-1380,共20页
【背景】传统方法因静态感受野设计较难适配城市自动驾驶场景中汽车、行人及骑行者等目标的显著尺度差异,且跨尺度特征融合易引发层级干扰。【方法】针对自动驾驶场景中多类别、多尺寸目标的3D检测中跨尺度表征一致性的关键挑战,本研究... 【背景】传统方法因静态感受野设计较难适配城市自动驾驶场景中汽车、行人及骑行者等目标的显著尺度差异,且跨尺度特征融合易引发层级干扰。【方法】针对自动驾驶场景中多类别、多尺寸目标的3D检测中跨尺度表征一致性的关键挑战,本研究提出基于均衡化感受野的3D目标检测方法VoxTNT,通过局部-全局协同注意力机制提升检测性能。在局部层面,设计了PointSetFormer模块,引入诱导集注意力模块(Induced Set Attention Block,ISAB),通过约简的交叉注意力聚合高密度点云的细粒度几何特征,突破传统体素均值池化的信息损失瓶颈;在全局层面,设计了VoxelFormerFFN模块,将非空体素抽象为超点集并实施跨体素ISAB交互,建立长程上下文依赖关系,并将全局特征学习计算负载从O(N^(2))压缩至O(M^(2))(M<<N,M为非空体素数量),规避了复杂的Transformer直接使用在原始点云造成的高计算复杂度。该双域耦合架构实现了局部细粒度感知与全局语义关联的动态平衡,有效缓解固定感受野和多尺度融合导致的特征建模偏差。【结果】实验表明,该方法在KITTI数据集单阶段检测下,中等难度级别的行人检测精度AP(Average Precision)值达到59.56%,较SECOND基线提高约12.4%,两阶段检测下以66.54%的综合指标mAP(mean Average Precision)领先次优方法BSAODet的66.10%。同时,在WOD数据集中验证了方法的有效性,综合指标mAP达到66.09%分别超越SECOND和PointPillars基线7.7%和8.5%。消融实验进一步表明,均衡化局部和全局感受野的3D特征学习机制能显著提升小目标检测精度(如在KITTI数据集中全组件消融的情况下,中等难度级别的行人和骑行者检测精度分别下降10.8%和10.0%),同时保持大目标检测的稳定性。【结论】本研究为解决自动驾驶多尺度目标检测难题提供了新思路,未来将优化模型结构以进一步提升效能。 展开更多
关键词 智能交通工程 自动驾驶 点云 三维目标检测 体素 transformER
原文传递
融合Vision Transformer与3D CNN的深度伪造视频篡改检测
5
作者 孙立信 吴永飞 +2 位作者 李心宇 任杰煌 刘西林 《计算机应用与软件》 北大核心 2025年第11期121-127,共7页
Deepfake技术的出现,使人们可以轻松地对人脸视频进行篡改,对社会造成巨大的危害。现有的篡改检测方法主要侧重于视频帧间的局部人脸区域空间特征变化检测,并没有考虑连续全局区域的时域特征,且不能检测视频帧中的细微空域特征变化。针... Deepfake技术的出现,使人们可以轻松地对人脸视频进行篡改,对社会造成巨大的危害。现有的篡改检测方法主要侧重于视频帧间的局部人脸区域空间特征变化检测,并没有考虑连续全局区域的时域特征,且不能检测视频帧中的细微空域特征变化。针对此问题,提出融合Vision Transformer和3D CNN的视频篡改检测方法ViT-3DCNN。该方法无需对人脸进行裁剪,直接学习视频帧间的连续时域特征以及每一帧的空间特征。实验结果表明,不依赖于人脸剪裁的情况下,ViT-3DCNN模型分别在DFDC数据集及Celeb-DF数据集上取得了93.3%与90.65%的分类准确性,充分验证了该模型在检测精度和泛化性等方面相较于现有检测方法具有明显的优势。 展开更多
关键词 伪造视频篡改检测 时空特征 Vision transformer 3d卷积
在线阅读 下载PDF
Estimating primaries by sparse inversion of the 3D Curvelet transform and the L1-norm constraint 被引量:7
6
作者 冯飞 王德利 +1 位作者 朱恒 程浩 《Applied Geophysics》 SCIE CSCD 2013年第2期201-209,237,共10页
In this paper, we built upon the estimating primaries by sparse inversion (EPSI) method. We use the 3D curvelet transform and modify the EPSI method to the sparse inversion of the biconvex optimization and Ll-norm r... In this paper, we built upon the estimating primaries by sparse inversion (EPSI) method. We use the 3D curvelet transform and modify the EPSI method to the sparse inversion of the biconvex optimization and Ll-norm regularization, and use alternating optimization to directly estimate the primary reflection coefficients and source wavelet. The 3D curvelet transform is used as a sparseness constraint when inverting the primary reflection coefficients, which results in avoiding the prediction subtraction process in the surface-related multiples elimination (SRME) method. The proposed method not only reduces the damage to the effective waves but also improves the elimination of multiples. It is also a wave equation- based method for elimination of surface multiple reflections, which effectively removes surface multiples under complex submarine conditions. 展开更多
关键词 Sparse inversion primary reflection coefficients 3d Curvelet transformation L1regularization convex optimization
在线阅读 下载PDF
Applications of Lodrigues Matrix in 3D Coordinate Transformation 被引量:3
7
作者 YAO Jili XU Yufei XIAO Wei 《Geo-Spatial Information Science》 2007年第3期173-176,共4页
Three transformation models (Bursa-Wolf, Molodensky, and WTUSM) are generally used between two data systems transformation. The linear models are used when the rotation angles are small; however, when the rotation a... Three transformation models (Bursa-Wolf, Molodensky, and WTUSM) are generally used between two data systems transformation. The linear models are used when the rotation angles are small; however, when the rotation angles get bigger, model errors will be produced. In this paper, we present a method with three main terms:① the traditional rotation angles θ,φ,ψ are substituted with a,b,c which are three respective values in the anti-symmetrical or Lodrigues matrix; ② directly and accurately calculating the formula of seven parameters in any value of rotation angles; and ③ a corresponding adjustment model is established. This method does not use the triangle function. Instead it uses addition, subtraction, multiplication and division, and the complexity of the equation is reduced, making the calculation easy and quick. 展开更多
关键词 3d transformation linear model transformation equation Lodrigues matrix
在线阅读 下载PDF
融合3D注意力和Transformer的图像去雨网络 被引量:5
8
作者 王美华 柯凡晖 +2 位作者 梁云 范衠 廖磊 《中国图象图形学报》 CSCD 北大核心 2022年第5期1509-1521,共13页
目的因为有雨图像中雨线存在方向、密度和大小等各方面的差异,单幅图像去雨依旧是一个充满挑战的研究问题。现有算法在某些复杂图像上仍存在过度去雨或去雨不足等问题,部分复杂图像的边缘高频信息在去雨过程中被抹除,或图像中残留雨成... 目的因为有雨图像中雨线存在方向、密度和大小等各方面的差异,单幅图像去雨依旧是一个充满挑战的研究问题。现有算法在某些复杂图像上仍存在过度去雨或去雨不足等问题,部分复杂图像的边缘高频信息在去雨过程中被抹除,或图像中残留雨成分。针对上述问题,本文提出三维注意力和Transformer去雨网络(three-dimension attention and Transformer deraining network,TDATDN)。方法将三维注意力机制与残差密集块结构相结合,以解决残差密集块通道高维度特征融合问题;使用Transformer计算特征全局关联性;针对去雨过程中图像高频信息被破坏和结构信息被抹除的问题,将多尺度结构相似性损失与常用图像去雨损失函数结合参与去雨网络训练。结果本文将提出的TDATDN网络在Rain12000雨线数据集上进行实验。其中,峰值信噪比(peak signal to noise ratio,PSNR)达到33.01 d B,结构相似性(structural similarity,SSIM)达到0.9278。实验结果表明,本文算法对比以往基于深度学习的神经网络去雨算法,显著改善了单幅图像去雨效果。结论本文提出的TDATDN图像去雨网络结合了3D注意力机制、Transformer和编码器—解码器架构的优点,可较好地完成单幅图像去雨工作。 展开更多
关键词 单幅图像去雨 卷积神经网络(CNN) transformER 3d注意力 U-Net
原文传递
基于轻量3D CNNs和Transformer的手语识别 被引量:4
9
作者 路飞 韩祥祖 +1 位作者 程显鹏 田国会 《华中科技大学学报(自然科学版)》 EI CAS CSCD 北大核心 2023年第5期13-18,共6页
针对传统基于3D CNNs(三维卷积神经网络)的手语识别方法模型计算复杂度和内存占用较高,及基于RNNs(循环神经网络)的连续手语识别方法的长距离建模能力不足的问题,提出一种基于轻量3D CNNs和Transformer的手语识别方法.首先使用轻量3D C... 针对传统基于3D CNNs(三维卷积神经网络)的手语识别方法模型计算复杂度和内存占用较高,及基于RNNs(循环神经网络)的连续手语识别方法的长距离建模能力不足的问题,提出一种基于轻量3D CNNs和Transformer的手语识别方法.首先使用轻量3D CNNs进行孤立词手语识别的时空建模,然后提出RKD(随机知识蒸馏),从多个教师模型中提取知识以提高轻量三维卷积的特征提取能力;针对连续手语,在特征提取后使用完全基于自注意力的Transformer进行全局建模.实验结果表明:所提方法在CSL-500和CSL-continuous数据集上可以获得95.10%的识别率和1.9的WER(词错误率),证明了所提方法的有效性. 展开更多
关键词 手语识别 轻量三维卷积神经网络 知识蒸馏 transformer网络 特征提取
原文传递
多尺度Transformer激光雷达点云3D物体检测 被引量:3
10
作者 孙刘杰 赵进 +1 位作者 王文举 张煜森 《计算机工程与应用》 CSCD 北大核心 2022年第8期136-146,共11页
激光雷达点云3D物体检测,对于小物体如行人、自行车的检测精度较低,容易漏检误检,提出一种多尺度Transformer激光雷达点云3D物体检测方法 MSPT-RCNN(multi-scale point transformer-RCNN),提高点云3D物体检测精度。该方法包含两个阶段,... 激光雷达点云3D物体检测,对于小物体如行人、自行车的检测精度较低,容易漏检误检,提出一种多尺度Transformer激光雷达点云3D物体检测方法 MSPT-RCNN(multi-scale point transformer-RCNN),提高点云3D物体检测精度。该方法包含两个阶段,即第一阶段(RPN)和第二阶段(RCNN)。RPN阶段通过多尺度Transformer网络提取点云特征,该网络包含多尺度邻域嵌入模块和跳跃连接偏移注意力模块,获取多尺度邻域几何信息和不同层次全局语义信息,生成高质量初始3D包围盒;在RCNN阶段,引入包围盒内的点云多尺度邻域几何信息,优化了包围盒位置、尺寸、朝向和置信度等信息。实验结果表明,该方法(MSPT-RCNN)具有较高检测精度,特别是对于远处和较小物体,提升更高。MSPT-RCNN通过有效学习点云数据中的多尺度几何信息,提取不同层次有效的语义信息,能够有效提升3D物体检测精度。 展开更多
关键词 transformER 多尺度 偏移注意力 点云 3d物体检测
在线阅读 下载PDF
基于Contextual Transformer的自动驾驶单目3D目标检测
11
作者 厍向阳 颜唯佳 董立红 《计算机工程与应用》 CSCD 北大核心 2024年第19期178-189,共12页
针对当前单目3D目标检测中存在的漏检和多尺度目标检测效果不佳的问题,提出了一种基于Contextual Transformer的自动驾驶单目3D目标检测算法(CM-RTM3D)。在ResNet-50网络中引入Contextual Transformer(CoT),构建ResNet-Transformer架构... 针对当前单目3D目标检测中存在的漏检和多尺度目标检测效果不佳的问题,提出了一种基于Contextual Transformer的自动驾驶单目3D目标检测算法(CM-RTM3D)。在ResNet-50网络中引入Contextual Transformer(CoT),构建ResNet-Transformer架构以提取特征。设计多尺度空间感知模块(MSP),通过尺度空间响应操作改善浅层特征的丢失情况,嵌入沿水平和竖直两个空间方向的坐标注意力机制(CA),使用softmax函数生成各尺度的重要性软权重。在偏移损失中采用Huber损失函数代替L1损失函数。实验结果表明:在KITTI自动驾驶数据集上,相较于RTM3D算法,该算法在简单、中等、困难三个难度级别下,AP3D分别提升了4.84、3.82、5.36个百分点,APBEV分别提升了4.75、6.26、3.56个百分点。 展开更多
关键词 自动驾驶 单目3d目标检测 Contextual transformer 多尺度感知 坐标注意力机制
在线阅读 下载PDF
基于Transformer的融合信息增强3D目标检测算法 被引量:16
12
作者 金宇锋 陶重犇 《仪器仪表学报》 EI CAS CSCD 北大核心 2023年第12期297-306,共10页
针对当前3D目标检测算法将不同模态数据融合时会产生错位现象,从而破坏数据之间的关联性并造成数据损失的问题,提出了一种基于Transformer的融合信息增强3D目标检测算法。首先设计了Transformer双域融合特征区域建议模块,利用变形注意... 针对当前3D目标检测算法将不同模态数据融合时会产生错位现象,从而破坏数据之间的关联性并造成数据损失的问题,提出了一种基于Transformer的融合信息增强3D目标检测算法。首先设计了Transformer双域融合特征区域建议模块,利用变形注意力机制,将提取到的雷达点云特征和图像特征进行双域特征融合,用于生成3D预选框;其次,通过设计的深度补全机制的特征信息增强模块,补全密集的深度和特征语义信息来完成框的细化;最后,设计了多模态特征交叉注意力模块,采用动态交叉注意力机制来获得不同模态间的相关性,从而将特征信息有效对齐融合。在Kitti、Nuscences和Waymo数据集上的实验结果证明了该算法的有效性和通用性。大量的消融实验证明了该算法各个模块的有效性。在实车平台上的实验结果表明,该算法在复杂的实际环境中具有优秀的鲁棒性。 展开更多
关键词 3d目标检测 transformER 深度补全 多模态融合 自动驾驶
原文传递
A complete solution of an improved universal 3D coordinate similarity transformation model 被引量:3
13
作者 Leyang Wang Jianqiang Sun Qiwen Wu 《Geodesy and Geodynamics》 CSCD 2021年第2期125-132,共8页
When linearizing three-dimensional(3 D)coordinate similarity transformation model with large rotations,we usually encounter the ill-posed normal matrix which may aggravate the instability of solutions.To alleviate the... When linearizing three-dimensional(3 D)coordinate similarity transformation model with large rotations,we usually encounter the ill-posed normal matrix which may aggravate the instability of solutions.To alleviate the problem,a series of conversions are contributed to the 3 D coordinate similarity transformation model in this paper.We deduced a complete solution for the 3 D coordinate similarity transformation at any rotation with the nonlinear adjustment methodology,which involves the errors of the common and the non-common points.Furthermore,as the large condition number of the normal matrix resulted in an intractable form,we introduced the bary-centralization technique and a surrogate process for deterministic element of the normal matrix,and proved its benefit for alleviating the condition number.The experimental results show that our approach can obtain the smaller condition number to stabilize the convergence of the interested parameters.Especially,our approach can be implemented for considering the errors of the common and the non-common points,thus the accuracy of the transformed coordinates improves. 展开更多
关键词 3d coordinate transformation Nonlinear adjustment Complete solution Condition number Bary-centralization
原文传递
基于局部特征编解码的自动驾驶3D目标检测
14
作者 邵凯 吴广 +2 位作者 梁燕 奚兴发 高琳珈 《系统工程与电子技术》 北大核心 2025年第10期3168-3178,共11页
针对自动驾驶三维目标检测中多层次特征提取和多尺度特征上下文依赖性问题,采用点-体素的检测框架,提出一种综合多项技术的基于局部特征编解码区域卷积神经网络(local feature encode-decode region-based convolutional neural network... 针对自动驾驶三维目标检测中多层次特征提取和多尺度特征上下文依赖性问题,采用点-体素的检测框架,提出一种综合多项技术的基于局部特征编解码区域卷积神经网络(local feature encode-decode region-based convolutional neural network,LFED-RCNN)。首先,在三维特征提取阶段提出结合卷积网络和Transformer编解码结构的卷积编解码主干,其中额外下采样卷积网络提取多层次三维特征,局部编解码网络建模特征间关联并融合深浅层特征,提升模型在复杂背景下对前景目标的特征获取能力。其次,设计位置编码模块对鸟瞰图视角下的二维特征进行位置编码,建立长期依赖关系,提升检测精度。所提方案LFED-RCNN在KITTI和ONCE数据集上进行验证,在KITTI数据集的困难等级下,对车、行人、骑行者三类检测对象分别可达到82.95%、57.48%、72.14%的平均准确率(mean average precision,mAP)。实验结果证明,所提方法在困难模式上表现出优异性能。 展开更多
关键词 三维目标检测 点云 transformER 编码器 解码器 接受域
在线阅读 下载PDF
PillarTNet:基于Transformer的三维目标检测模型
15
作者 韩建栋 苏佳 《小型微型计算机系统》 北大核心 2025年第9期2168-2175,共8页
针对三维点云目标检测中传统的卷积神经网络在特征提取阶段因下采样导致分辨率降低,影响小目标的识别准确性问题,本文提出一种基于Transformer的三维目标检测模型:PillarTNet.该模型首先使用双重注意力融合模块强化特征编码,然后通过区... 针对三维点云目标检测中传统的卷积神经网络在特征提取阶段因下采样导致分辨率降低,影响小目标的识别准确性问题,本文提出一种基于Transformer的三维目标检测模型:PillarTNet.该模型首先使用双重注意力融合模块强化特征编码,然后通过区域扩张注意力模块提取特征,保持整个过程伪图像分辨率不变,更有利于小目标的检测,同时引入区域移位机制促进不同区域的信息交流.但是注意力操作会存在大量空体素,可能增加大目标的漏检与误检风险,为此,对检测头采用空体素关注模块以缓解这一问题.在KITTI数据集上的实验结果显示:PillarTNet在确保Car和Cyclist检测精度的同时,Pedestrian的检测在3个难度等级的AP 3D分别达到了62.48%、53.21%和49.57%,且本模型在推理速度和内存需求方面均表现出色,充分验证了PillarTNet的优越性和适应性. 展开更多
关键词 三维目标检测 点云 transformER 双重注意力融合 空体素关注
在线阅读 下载PDF
2D/3D Isometric Transformation Using Spring-Mass System
16
作者 Fan Jin 1 Matthew M.F. Yuen 2 Qifu Wang 1 Zhou Ji 1 1The CAD Center of The Huazhong Unviersity of Science and Technology, Wuhan, China 430074 2Department of Mechanical Engineering, The Hong Kong University of Science and Technolog 《Computer Aided Drafting,Design and Manufacturing》 1997年第2期26-36,共0页
This paper presents a general method for 2D/3D transformation, which can be efficiently used in three dimensional computer aided garment design. The method utilizes a uniform triangular spring_mass based deformable mo... This paper presents a general method for 2D/3D transformation, which can be efficiently used in three dimensional computer aided garment design. The method utilizes a uniform triangular spring_mass based deformable model. 2D to 3D transformation and 3D to 2D transformation both can be implemented on the same model. A general and efficient collision detection method is also briefly discussed in this paper. 展开更多
关键词 D/3d transformation deformable model spring_mass system collision detection computer aided garment design
全文增补中
Multiple description scalable video coding based on 3D lifted wavelet transform 被引量:3
17
作者 KIM Yong-deak 《Journal of Zhejiang University-Science A(Applied Physics & Engineering)》 SCIE EI CAS CSCD 2006年第5期857-863,共7页
In this work, a new method to deal with the unconnected pixels in motion compensated temporal filtering (MCTF) is presented, which is designed to improve the performance of 3D lifted wavelet coding. Furthermore, multi... In this work, a new method to deal with the unconnected pixels in motion compensated temporal filtering (MCTF) is presented, which is designed to improve the performance of 3D lifted wavelet coding. Furthermore, multiple description scalable coding (MDSC) is investigated, and novel MDSC schemes based on 3D wavelet coding are proposed, using the lifting imple- mentation of temporal filtering. The proposed MDSC schemes can avoid the mismatch problem in multiple description video coding, and have high scalability and robustness of video transmission. Experimental results showed that the proposed schemes are feasible and adequately effective. 展开更多
关键词 Multiple DESCRIPTION SCALABLE coding (MDSC) MOTION compensated temporal filtering (MCTF) Block-split bidi-rectional MOTION estimation 3d lifted WAVELET transform
在线阅读 下载PDF
基于时空注意力的3D人体姿态估计网络设计
18
作者 易见兵 张裕贤 +3 位作者 曹锋 李俊 彭鑫 陈鑫 《广西师范大学学报(自然科学版)》 北大核心 2025年第5期130-144,共15页
在3D人体姿态估计中,遮挡会导致人体关节点提取不准确,针对该问题,本文提出一种结合时空注意力和通道注意力的3D人体姿态估计算法。首先,提出一种特征筛选模块,该模块通过引入位置嵌入模块,以进一步捕获人体关节点的特征信息;其次,提出... 在3D人体姿态估计中,遮挡会导致人体关节点提取不准确,针对该问题,本文提出一种结合时空注意力和通道注意力的3D人体姿态估计算法。首先,提出一种特征筛选模块,该模块通过引入位置嵌入模块,以进一步捕获人体关节点的特征信息;其次,提出一种移动视觉Transformer时间注意力模块,该模块通过引入SiLU激活函数,以获取更多姿态特征细节;最后,提出一种通道注意力模块,该模块通过引入并行分支处理架构及增加归一化层,以调整输出通道的特征权重,达到算法对人体姿态特征的关注和弱化其背景特征的目的。在Human3.6M数据集上进行实验,相较于基准模型Strided Transformer,将级联金字塔网络提取的2D关节点作为输入时,每关节位置误差的平均值和进行普罗克鲁斯对齐后的每关节位置误差的平均值分别下降2.5%和2.3%;将Human3.6M数据集标注的2D关节点作为输入时,每关节位置误差的平均值下降6.7%。实验结果表明,本文提出的算法准确性较高。 展开更多
关键词 3d人体姿态估计 遮挡 时空注意力 通道注意力 transformER
在线阅读 下载PDF
Efficient single-pixel imaging encrypted transmission based on 3D Arnold transformation
19
作者 梁振宇 王朝瑾 +4 位作者 王阳阳 高皓琪 朱东涛 许颢砾 杨星 《Chinese Physics B》 SCIE EI CAS CSCD 2024年第3期378-386,共9页
Single-pixel imaging(SPI)can transform 2D or 3D image data into 1D light signals,which offers promising prospects for image compression and transmission.However,during data communication these light signals in public ... Single-pixel imaging(SPI)can transform 2D or 3D image data into 1D light signals,which offers promising prospects for image compression and transmission.However,during data communication these light signals in public channels will easily draw the attention of eavesdroppers.Here,we introduce an efficient encryption method for SPI data transmission that uses the 3D Arnold transformation to directly disrupt 1D single-pixel light signals and utilizes the elliptic curve encryption algorithm for key transmission.This encryption scheme immediately employs Hadamard patterns to illuminate the scene and then utilizes the 3D Arnold transformation to permutate the 1D light signal of single-pixel detection.Then the transformation parameters serve as the secret key,while the security of key exchange is guaranteed by an elliptic curve-based key exchange mechanism.Compared with existing encryption schemes,both computer simulations and optical experiments have been conducted to demonstrate that the proposed technique not only enhances the security of encryption but also eliminates the need for complicated pattern scrambling rules.Additionally,this approach solves the problem of secure key transmission,thus ensuring the security of information and the quality of the decrypted images. 展开更多
关键词 single-pixel imaging 3d Arnold transformation elliptic curve encryption image encryption
原文传递
CT图像肾肿瘤分割的三维轴向Transformer模型
20
作者 张金龙 吴敏 孙玉宝 《计算机工程与科学》 北大核心 2025年第4期677-685,共9页
自动分割CT图像序列中肾脏及其肿瘤区域能够为放化疗计划提供定量参考依据。当前基于Transformer的肾肿瘤分割模型得到了广泛关注,特别是与U-Net模型及其变体结合使用。现有的基于Transformer的分割网络通常在单个切片局部窗口内进行特... 自动分割CT图像序列中肾脏及其肿瘤区域能够为放化疗计划提供定量参考依据。当前基于Transformer的肾肿瘤分割模型得到了广泛关注,特别是与U-Net模型及其变体结合使用。现有的基于Transformer的分割网络通常在单个切片局部窗口内进行特征学习,对切片内空间信息以及切片间轴向信息表示存在不足。针对这一问题,提出了三维轴向Transformer模块,将3个维度的复杂耦合关联分解为交替的2个轴向注意力,融合了切片内部以及切片之间的轴向体关联信息。以三维轴向Transformer模块为基础,融合多尺度特征与残差学习方式,构建了二阶段的肾脏肿瘤分割编解码网络ATrans UNet,在KiTS19数据集上,肾脏和肾脏肿瘤分割结果的Dice相似性分别是96.43%和81.04%,平均Dice得分对比2D-Unet提升了8.40%,对比3D-Unet提升了4.84%。 展开更多
关键词 CT图像序列 肾肿瘤三维分割 三维轴向transformer 二阶段编解码网络
在线阅读 下载PDF
上一页 1 2 46 下一页 到第
使用帮助 返回顶部