期刊文献+
共找到9,163篇文章
< 1 2 250 >
每页显示 20 50 100
基于改进RT-DETR的有遮挡交通标志检测算法
1
作者 于天河 杨壮壮 +2 位作者 胡金帅 常梦瑶 王文龙 《工程科学学报》 北大核心 2026年第2期393-408,共16页
针对交通标志检测中目标尺寸小、检测精度低等问题,尤其是在远距离拍摄、遮挡严重的情况下,传统检测算法往往难以准确识别交通标志.本文提出了一种基于改进RT-DETR的交通标志检测算法.首先,考虑到当前交通标志被遮挡情况下数据集的匮乏... 针对交通标志检测中目标尺寸小、检测精度低等问题,尤其是在远距离拍摄、遮挡严重的情况下,传统检测算法往往难以准确识别交通标志.本文提出了一种基于改进RT-DETR的交通标志检测算法.首先,考虑到当前交通标志被遮挡情况下数据集的匮乏,自建一个遮挡条件下的交通标志数据集.然后,在反向残差移动块中引入膨胀重参数块,构建了一个轻量级的复合膨胀残差块来替换原始主干提取网络中的BasicBlock,增强了模型的特征提取能力.最后,对RT-DETR模型的损失函数进行了优化,提出了DS-IoU联合损失函数加快收模型敛速度.实验结果表明,改进后的算法在自制数据集上的m AP为94.2%,相比于原始算法增加量为4.7%,在公开数据集TT100K和CCTSDB2021的m AP分别为92.8%和91.7%,相比于原始算法增加量分别为3.1%和2.4%,Params和GFLOPs相比于原始的算法分别降低了26.0%和12.5%.本文提出的改进方法极大地减少了计算量和参数数量,有效提升了遮挡情况下的交通标志的检测精度. 展开更多
关键词 交通标志检测 rt-detr 遮挡数据集 轻量化 联合损失函数
在线阅读 下载PDF
Anti-Interference High-Speed Modulation Decoder for Quantum Key Distribution
2
作者 Hua-Xing Xu Shao-Hua Wang +1 位作者 Chang-Lei Wang Ping Zhang 《Chinese Physics Letters》 2025年第1期34-39,共6页
Quantum key distribution is increasingly transitioning toward network applications,necessitating advancements in system performance,including photonic integration for compact designs,enhanced stability against environ... Quantum key distribution is increasingly transitioning toward network applications,necessitating advancements in system performance,including photonic integration for compact designs,enhanced stability against environmental disturbances,higher key rates,and improved efficiency.In this letter,we propose an orthogonal polarization exchange reflector Michelson interferometer model to address quantum channel disturbances caused by environmental factors.Based on this model,we designed a Sagnac reflector-Michelson interferometer decoder and verified its performance through an interference system.The interference fringe visibility exceeded 98%across all four coding phases at 625 MHz.These results indicate that the decoder effectively mitigates environmental interference while supporting high-speed modulation frequencies.In addition,the proposed anti-interference decoder,which does not rely on magneto-optical devices,is well-suited for photonic integration,aligning with the development trajectory for next-generation quantum communication devices. 展开更多
关键词 decoder INTERFEROMETER POLARIZATION
原文传递
Design of improved error-rate sliding window decoder for SC-LDPC codes: reliable termination and channel value reuse
3
作者 JIA Xishan LI Jining +3 位作者 YAO Yuan WANG Yifan LIU Bo XU Degang 《Optoelectronics Letters》 2025年第4期212-217,共6页
In this paper,an improved error-rate sliding window decoder is proposed for spatially coupled low-density parity-check(SC-LDPC)codes.For the conventional sliding window decoder,the message retention mechanism causes u... In this paper,an improved error-rate sliding window decoder is proposed for spatially coupled low-density parity-check(SC-LDPC)codes.For the conventional sliding window decoder,the message retention mechanism causes unreliable messages along the edges of belief propagation(BP)decoding in the current window to be kept for subsequent window decoding.To improve the reliability of the retained messages during the window transition,a reliable termination method is embedded,where the retained messages undergo more reliable parity checks.Additionally,decoding failure is unavoidable and even causes error propagation when the number of errors exceeds the error-correcting capability of the window.To mitigate this problem,a channel value reuse mechanism is designed,where the received channel values are utilized to reinitialize the window.Furthermore,considering the complexity and performance of decoding,a feasible sliding optimized window decoding(SOWD)scheme is introduced.Finally,simulation results confirm the superior performance of the proposed SOWD scheme in both the waterfall and error floor regions.This work has great potential in the applications of wireless optical communication and fiber optic communication. 展开更多
关键词 reliable termination message retention mechanism reliable termination method sliding window decoderthe error rate sliding window decoder belief propagation bp decoding retained messages
原文传递
基于自注意力机制说话人编码器与SA-Decoder的语音克隆方法
4
作者 焦乐岩 朱欣娟 《计算机与现代化》 2025年第7期69-76,共8页
FreeVC模型在语音克隆技术领域表现出色。但是由于语音序列中包含复杂的语音特征变化和信息,例如音色、风格等,FreeVC模型中的Speaker Encoder模块只使用单一的LSTM网络难以准确地提取和表示说话人信息,这会导致模型处理语音序列的性能... FreeVC模型在语音克隆技术领域表现出色。但是由于语音序列中包含复杂的语音特征变化和信息,例如音色、风格等,FreeVC模型中的Speaker Encoder模块只使用单一的LSTM网络难以准确地提取和表示说话人信息,这会导致模型处理语音序列的性能下降,影响声音转换质量和准确性。并且FreeVC模型使用传统的解码器,其中上采样(反卷积)操作细节丢失,导致重建还原的音频咬字细节会模糊不清,从而产生音频伪影。针对这些问题,本文提出一种基于自注意力机制的说话人编码器与SA-Decoder的语音克隆方法FreeVC-SA。该方法将说话人的梅尔谱作为输入,在LSTM网络上加入自注意力机制有助于模型更好地捕捉长距离依赖关系,更为准确地提取说话人的音色、风格等特征。使用SA-Decoder可以很好地解决局部感受野限制问题,使得重建生成的语音克隆效果更加真实、清晰。实验结果表明,与所有基线模型相比,FreeVC-SA语音克隆的自然度相似性和情感相似性均有明显提升,字错误率和字符错误率均有明显下降。 展开更多
关键词 语音克隆 说话人编码器 SA-decoder 自注意力机制 FreeVC-SA
在线阅读 下载PDF
Global receptive field transformer decoder method on quantum surface code data and syndrome error correction
5
作者 Ao-Qing Li Ce-Wen Tian +2 位作者 Xiao-Xuan Xu Hong-Yang Ma Jun-Qing Liang 《Chinese Physics B》 2025年第3期267-276,共10页
Quantum computing has the potential to solve complex problems that are inefficiently handled by classical computation.However,the high sensitivity of qubits to environmental interference and the high error rates in cu... Quantum computing has the potential to solve complex problems that are inefficiently handled by classical computation.However,the high sensitivity of qubits to environmental interference and the high error rates in current quantum devices exceed the error correction thresholds required for effective algorithm execution.Therefore,quantum error correction technology is crucial to achieving reliable quantum computing.In this work,we study a topological surface code with a two-dimensional lattice structure that protects quantum information by introducing redundancy across multiple qubits and using syndrome qubits to detect and correct errors.However,errors can occur not only in data qubits but also in syndrome qubits,and different types of errors may generate the same syndromes,complicating the decoding task and creating a need for more efficient decoding methods.To address this challenge,we used a transformer decoder based on an attention mechanism.By mapping the surface code lattice,the decoder performs a self-attention process on all input syndromes,thereby obtaining a global receptive field.The performance of the decoder was evaluated under a phenomenological error model.Numerical results demonstrate that the decoder achieved a decoding accuracy of 93.8%.Additionally,we obtained decoding thresholds of 5%and 6.05%at maximum code distances of 7 and 9,respectively.These results indicate that the decoder used demonstrates a certain capability in correcting noise errors in surface codes. 展开更多
关键词 quantum error correction surface code transformer decoder
原文传递
Pyramid–MixNet: Integrate Attention into Encoder-Decoder Transformer Framework for Automatic Railway Surface Damage Segmentation
6
作者 Hui Luo Wenqing Li Wei Zeng 《Computers, Materials & Continua》 2025年第7期1567-1580,共14页
Rail surface damage is a critical component of high-speed railway infrastructure,directly affecting train operational stability and safety.Existing methods face limitations in accuracy and speed for small-sample,multi... Rail surface damage is a critical component of high-speed railway infrastructure,directly affecting train operational stability and safety.Existing methods face limitations in accuracy and speed for small-sample,multi-category,and multi-scale target segmentation tasks.To address these challenges,this paper proposes Pyramid-MixNet,an intelligent segmentation model for high-speed rail surface damage,leveraging dataset construction and expansion alongside a feature pyramid-based encoder-decoder network with multi-attention mechanisms.The encoding net-work integrates Spatial Reduction Masked Multi-Head Attention(SRMMHA)to enhance global feature extraction while reducing trainable parameters.The decoding network incorporates Mix-Attention(MA),enabling multi-scale structural understanding and cross-scale token group correlation learning.Experimental results demonstrate that the proposed method achieves 62.17%average segmentation accuracy,80.28%Damage Dice Coefficient,and 56.83 FPS,meeting real-time detection requirements.The model’s high accuracy and scene adaptability significantly improve the detection of small-scale and complex multi-scale rail damage,offering practical value for real-time monitoring in high-speed railway maintenance systems. 展开更多
关键词 Pyramid vision transformer encoder–decoder architecture railway damage segmentation masked multi-head attention mix-attention
在线阅读 下载PDF
Low power Viterbi decoder design for low altitude adhoc networks
7
作者 FEI Yingying XIAO Chunlu +3 位作者 JING Wenhao MA Tianming WANG Jiahan JIN Jie 《High Technology Letters》 2025年第2期154-163,共10页
With the rapid development of low altitude economic industry,low altitude adhoc network technology has been getting more and more intensive attention.In the adhoc network protocol designed in this paper,the convolutio... With the rapid development of low altitude economic industry,low altitude adhoc network technology has been getting more and more intensive attention.In the adhoc network protocol designed in this paper,the convolutional code used is(3,1,7),and the design of a low power Viterbi decoder adapted to multi-rate variations is proposed.In the traditional Viterbi decoding method,the high complexity of path metric(PM)accumulation and Euclidean distance computation leads to the problems of low efficiency and large storage resources in the decoder.In this paper,an improved add compare select(ACS)algorithm,a generalized formula for branch metric(BM)based on Manhattan distance,and a method to reduce the accumulated PM for different Viterbi decoders are put forward.A simulation environment based on Vivado and Matlab to verify the accuracy and effectiveness of the proposed Viterbi decoder is also established.The experimental results show that the total power consumption is reduced by 15.58%while the decoding accuracy of the Viterbi decoder is guaranteed,which meets the design requirements of a low power Viterbi decoder. 展开更多
关键词 low altitude adhoc network Manhattan distance network protocol Viterbi decoder field programmable gate array(FPGA)
在线阅读 下载PDF
Area optimization of parallel Chien search architecture for Reed-Solomon(255,239) decoder 被引量:1
8
作者 胡庆生 王志功 +1 位作者 张军 肖洁 《Journal of Southeast University(English Edition)》 EI CAS 2006年第1期5-10,共6页
A global optimization algorithm (GOA) for parallel Chien search circuit in Reed-Solomon (RS) (255,239) decoder is presented. By finding out the common modulo 2 additions within groups of Galois field (GF) mult... A global optimization algorithm (GOA) for parallel Chien search circuit in Reed-Solomon (RS) (255,239) decoder is presented. By finding out the common modulo 2 additions within groups of Galois field (GF) multipliers and pre-computing the common items, the GOA can reduce the number of XOR gates efficiently and thus reduce the circuit area. Different from other local optimization algorithms, the GOA is a global one. When there are more than one maximum matches at a time, the best match choice in the GOA has the least impact on the final result by only choosing the pair with the smallest relational value instead of choosing a pair randomly. The results show that the area of parallel Chien search circuits can be reduced by 51% compared to the direct implementation when the group-based GOA is used for GF multipliers and by 26% if applying the GOA to GF multipliers separately. This optimization scheme can be widely used in general parallel architecture in which many GF multipliers are involved. 展开更多
关键词 RS decoder Chien search circuit area optimization Galois field multiplier
在线阅读 下载PDF
A Total Dose Radiation Hardened PDSOI CMOS 3-Line to 8-Line Decoder
9
作者 刘梦新 韩郑生 +3 位作者 李多力 刘刚 赵超荣 赵发展 《Journal of Semiconductors》 EI CAS CSCD 北大核心 2008年第6期1036-1039,共4页
The first domestic total dose hardened 2μm partially depleted silicon-on-insulator (PDSOI) CMOS 3-line to 8- line decoder fabricated in SIMOX is demonstrated. The radiation performance is characterized by transisto... The first domestic total dose hardened 2μm partially depleted silicon-on-insulator (PDSOI) CMOS 3-line to 8- line decoder fabricated in SIMOX is demonstrated. The radiation performance is characterized by transistor threshold voltage shifts,circuit static leakage currents,and I-V curves as a function of total dose up to 3× 10^5rad(Si). The worst case threshold voltage shifts of the front channels are less than 20mV for nMOS transistors at 3 × 10^5rad(Si) and follow-up irradiation and less than 70mV for the pMOS transistors. Furthermore, no significant radiation induced leakage currents and functional degeneration are observed. 展开更多
关键词 PDSOI decoder total dose RADIATION
在线阅读 下载PDF
基于时空特征融合的Encoder-Decoder多步4D短期航迹预测 被引量:2
10
作者 石庆研 张泽中 韩萍 《信号处理》 CSCD 北大核心 2023年第11期2037-2048,共12页
航迹预测在确保空中交通安全、高效运行中扮演着至关重要的角色。所预测的航迹信息是航迹优化、冲突告警等决策工具的输入,而预测准确性取决于模型对航迹序列特征的提取能力。航迹序列数据是具有丰富时空特征的多维时间序列,其中每个变... 航迹预测在确保空中交通安全、高效运行中扮演着至关重要的角色。所预测的航迹信息是航迹优化、冲突告警等决策工具的输入,而预测准确性取决于模型对航迹序列特征的提取能力。航迹序列数据是具有丰富时空特征的多维时间序列,其中每个变量都呈现出长短期的时间变化模式,并且这些变量之间还存在着相互依赖的空间信息。为了充分提取这种时空特征,本文提出了基于融合时空特征的编码器-解码器(Spatio-Temporal EncoderDecoder,STED)航迹预测模型。在Encoder中使用门控循环单元(Gated Recurrent Unit,GRU)、卷积神经网络(Convolutional Neural Network,CNN)和注意力机制(Attention,AT)构成的双通道网络来分别提取航迹时空特征,Decoder对时空特征进行拼接融合,并利用GRU对融合特征进行学习和递归输出,实现对未来多步航迹信息的预测。利用真实的航迹数据对算法性能进行验证,实验结果表明,所提STED网络模型能够在未来10 min预测范围内进行高精度的短期航迹预测,相比于LSTM、CNN-LSTM和AT-LSTM等数据驱动航迹预测模型具有更高的精度。此外,STED网络模型预测一个航迹点平均耗时为0.002 s,具有良好的实时性。 展开更多
关键词 4D航迹预测 时空特征 Encoder-decoder 门控循环单元
在线阅读 下载PDF
基于轻量级改进RT-DETR边缘部署算法的绝缘子缺陷检测 被引量:9
11
作者 姜香菊 王瑞彤 马彦鸿 《电工技术学报》 北大核心 2025年第3期842-854,共13页
随着新型电力系统的不断发展建设,输电线路绝缘子状态智能化巡检成为必然趋势。为方便“云-边-端协同架构”进行边缘部署,该文提出一种轻量级RT-DETR目标检测算法。首先,采用RT-DETR作为基线算法降低优化难度,提高鲁棒性;其次,选择轻量... 随着新型电力系统的不断发展建设,输电线路绝缘子状态智能化巡检成为必然趋势。为方便“云-边-端协同架构”进行边缘部署,该文提出一种轻量级RT-DETR目标检测算法。首先,采用RT-DETR作为基线算法降低优化难度,提高鲁棒性;其次,选择轻量级EMO作为算法特征提取主干,充分学习绝缘子目标的长距离特征交互及缺陷小目标的局部特征交互,并提出基于轻量级注意力的尺度内特征交互模块和轻量级跨尺度特征融合模块设计轻量级高效混合编码器;再次,在轻量级高效混合编码器中引入定位信息补充分支、使用DIoU损失函数结合迁移学习训练技巧,缓解轻量化造成的算法精度下降问题;最后,构建多天气条件绝缘子数据集进行训练验证。实验结果表明,相较于基线算法,所提算法检测精度达到97.2%,只损失0.7个百分点,而参数量和计算量分别下降67.8%和71.2%,检测速度提升2.5倍,满足多天气条件下的输电线路绝缘子状态巡检准确率及边缘部署轻量化要求。 展开更多
关键词 绝缘子缺陷检测 rt-detr算法 轻量化 边缘部署 目标检测算法
在线阅读 下载PDF
基于encoder-decoder框架的城镇污水厂出水水质预测 被引量:4
12
作者 史红伟 陈祺 +1 位作者 王云龙 李鹏程 《中国农村水利水电》 北大核心 2023年第11期93-99,共7页
由于污水厂的出水水质指标繁多、污水处理过程中反应复杂、时序非线性程度高,基于机理模型的预测方法无法取得理想效果。针对此问题,提出基于深度学习的污水厂出水水质预测方法,并以吉林省某污水厂监测水质为来源数据,利用多种结合encod... 由于污水厂的出水水质指标繁多、污水处理过程中反应复杂、时序非线性程度高,基于机理模型的预测方法无法取得理想效果。针对此问题,提出基于深度学习的污水厂出水水质预测方法,并以吉林省某污水厂监测水质为来源数据,利用多种结合encoder-decoder结构的神经网络预测水质。结果显示,所提结构对LSTM和GRU网络预测能力都有一定提升,对长期预测能力提升更加显著,ED-GRU模型效果最佳,短期预测中的4个出水水质指标均方根误差(RMSE)为0.7551、0.2197、0.0734、0.3146,拟合优度(R2)为0.9013、0.9332、0.9167、0.9532,可以预测出水质局部变化,而长期预测中的4个指标RMSE为1.7204、1.7689、0.4478、0.8316,R2为0.4849、0.5507、0.4502、0.7595,可以预测出水质变化趋势,与顺序结构相比,短期预测RMSE降低10%以上,R2增加2%以上,长期预测RMSE降低25%以上,R2增加15%以上。研究结果表明,基于encoder-decoder结构的神经网络可以对污水厂出水水质进行准确预测,为污水处理工艺改进提供技术支撑。 展开更多
关键词 污水厂出水 encoder-decoder 多指标水质预测 GRU模型
在线阅读 下载PDF
基于改进RT-DETR的饼干包装外观缺陷快速检测 被引量:3
13
作者 古莹奎 叶彪彪 +1 位作者 郭明健 连增卫 《食品与机械》 北大核心 2025年第2期234-241,共8页
[目的]针对现有食品包装缺陷实时检测模型参数量庞大和计算复杂、在终端设备上部署困难等问题,提出一种基于改进RT-DETR的轻量化模型SGHS-DETR。[方法]采用超轻量化网络StarNet作为特征提取主干以降低模型参数,引入基于梯度路径规划的... [目的]针对现有食品包装缺陷实时检测模型参数量庞大和计算复杂、在终端设备上部署困难等问题,提出一种基于改进RT-DETR的轻量化模型SGHS-DETR。[方法]采用超轻量化网络StarNet作为特征提取主干以降低模型参数,引入基于梯度路径规划的高效聚合模块GELAN进行特征融合并保留语义和细节特征;采用基于小波分解的HWD轻量级下采样模块减少特征信息损失,并替换损失函数为ShapeIoU进一步提升模型的检测精度。[结果]SGHS-DETR模型在饼干包装数据集上的平均检测精度达到92.6%,较基准模型参数量和计算复杂度分别降低了65.5%和72.1%,同时检测速度提升了74.4%。[结论]SGHS-DETR模型能够快速有效地检测出饼干包装外观缺陷。 展开更多
关键词 食品包装 缺陷检测 轻量化 rt-detr StarNet
在线阅读 下载PDF
改进RT-DETR的煤矿刮板输送机链条故障智能识别方法 被引量:1
14
作者 毛清华 郭文瑾 +2 位作者 苏毅楠 司马俊雷 薛旭升 《煤炭科学技术》 北大核心 2025年第9期469-479,共11页
针对目前煤矿刮板输送机链条多故障识别中的主要问题,提出一种基于改进RT-DETR(Real-Time DEtection TRansformer)的煤矿刮板输送机链条故障智能识别方法。该方法在数据集构建时,运用基于HSV三通道的图像预处理方法对煤矿刮板输送机链... 针对目前煤矿刮板输送机链条多故障识别中的主要问题,提出一种基于改进RT-DETR(Real-Time DEtection TRansformer)的煤矿刮板输送机链条故障智能识别方法。该方法在数据集构建时,运用基于HSV三通道的图像预处理方法对煤矿刮板输送机链条图像进行数据降噪与增强处理,提升图像质量。在改进的RT-DETR算法中,通过采用MobileNetV4作为主干特征网络,提升主干网络特征提取效率;通过将混合编码器中的普通卷积替换为效果更佳的Ghost卷积,降低算法参数量,提升识别速度;通过运用CSPStage特征融合模块和Inner-GIoU损失函数,增强特征利用和融合的能力,提高识别准确率。为了验证算法改进模块的效果,通过消融实验结果表明:改进RT-DETR算法与原RT-DETR算法相比,识别准确度提升1.6%,每秒处理的帧数提升15.5 frames/s,模型大小降低36%,参数量减少35.9%。运用改进RT-DETR算法与YOLOv8m-ghost、YOLOv8m-RT-DETR和YOLOv10s算法进行多故障识别对比实验,对比实验结果表明:改进RT-DETR识别算法在各指标上均效果最优,能够实现刮板输送机链条断链故障和磨损故障的高效准确识别,识别准确率达到97.6%,每秒处理的FPS值达到67.2 frames/s,能够在空载和未满载状态下,满足煤矿刮板输送机链条故障在线高效准确识别的需求。 展开更多
关键词 煤矿刮板输送机 链条故障 rt-detr 智能识别 MobileNetV4 HSV三通道
在线阅读 下载PDF
基于改进RT-DETR的葡萄叶片病害检测 被引量:1
15
作者 王海瑞 胡灿 +1 位作者 朱贵富 蒋晨 《湖南农业大学学报(自然科学版)》 北大核心 2025年第4期117-124,共8页
针对葡萄叶片相似表现症状的病害识别率较低及细小病害检测困难的问题,提出一种基于改进RT-DETR网络的葡萄叶片病害检测方法。首先,采用坐标注意力(CA)机制对可变形卷积网络v2(DCNv2)模块进行改进,构建DCNv2_CA模块以增强目标特征的提... 针对葡萄叶片相似表现症状的病害识别率较低及细小病害检测困难的问题,提出一种基于改进RT-DETR网络的葡萄叶片病害检测方法。首先,采用坐标注意力(CA)机制对可变形卷积网络v2(DCNv2)模块进行改进,构建DCNv2_CA模块以增强目标特征的提取能力,并在模型的主干特征提取部分加入DCNv2_CA模块来提高模型对病害深层关键特征的提取能力;其次,在模型的特征交互模块中引入高低频特征交互(HiLo)注意力机制,使模型能同时关注特征的高低频信息,提高模型对葡萄细小病害的检测能力;最后,用聚合–分发机制重构模型的跨层融合网络,使其能更充分地融合各个层级之间的信息,进一步提升模型对相似表型症状病害的识别性能。结果表明:改进RT-DETR模型的病害检测准确率、召回率和平均精度均值分别达到了90.8%、89.5%和93.4%,相较于初始模型分别提升了5.4、3.9和5.6个百分点,且相对于其他模型也具有明显的优势。综上可见,改进后的RT-DETR模型能够准确地实现葡萄叶片病害检测。 展开更多
关键词 葡萄叶片 目标检测 病害检测 rt-detr 注意力机制 可变形卷积网络 高低频特征交互 聚合–分发机制
在线阅读 下载PDF
基于DCNv2和Transformer Decoder的隧道衬砌裂缝高效检测模型研究 被引量:3
16
作者 孙己龙 刘勇 +4 位作者 周黎伟 路鑫 侯小龙 王亚琼 王志丰 《图学学报》 CSCD 北大核心 2024年第5期1050-1061,共12页
为解决因衬砌裂缝性状随机、分布密集、标注框分辨率低所导致的现有模型识别精度低、检测速度慢及参数量庞大等问题,以第2版可变形卷积网络(DCNv2)和端到端变换器解码器(Transformer Decoder)为基础对YOLOv8网络框架进行改进,提出了面... 为解决因衬砌裂缝性状随机、分布密集、标注框分辨率低所导致的现有模型识别精度低、检测速度慢及参数量庞大等问题,以第2版可变形卷积网络(DCNv2)和端到端变换器解码器(Transformer Decoder)为基础对YOLOv8网络框架进行改进,提出了面向衬砌裂缝的检测模型DTD-YOLOv8。首先,通过引入DCNv2对YOLOv8主干卷积网络C2f进行融合以实现模型对裂缝形变特征的准确快速感知,同时采用Transformer Decoder对YOLOv8检测头进行替换以实现端到端框架内完整目标检测流程,从而消除因Anchor-free处理模式所带来的计算消耗。采用自建裂缝数据集对SSD,Faster-RCNN,RT-DETR,YOLOv3,YOLOv5,YOLOv8和DTD-YOLOv8的7种检测模型进行对比验证。结果表明:改进模型F1分数和mAP@50值分别为87.05%和89.58%;其中F1分数相较其他6种模型分别提高了14.16%,7.68%,1.55%,41.36%,8.20%和7.40%;mAP@50分别提高了28.84%,15.47%,1.33%,47.65%,10.14%和10.84%。改进模型参数量仅为RT-DETR的三分之一,检测单张图片的速度为16.01 ms,FPS为65.46帧每秒,对比其他模型检测速度得到提升。该模型在面向运营隧道裂缝检测任务需求时能够表现出高效的性能。 展开更多
关键词 隧道工程 目标检测 第2版可变形卷积网络 Transformer decoder 衬砌裂缝
在线阅读 下载PDF
基于织物疵点检测的改进RT-DETR模型
17
作者 李敏 李珠婷 +2 位作者 朱萍 崔树芹 颜小运 《毛纺科技》 北大核心 2025年第11期130-138,共9页
为提升织物疵点检测的效率与准确性,提出一种基于改进RT-DETR模型的方法。首先,针对RT-DETR模型全局和局部特征捕捉能力不足的问题,在骨干网络引入RADBlock模块,提高模型识别不同尺度织物疵点的精度;其次,考虑到在网络较深的部分容易对... 为提升织物疵点检测的效率与准确性,提出一种基于改进RT-DETR模型的方法。首先,针对RT-DETR模型全局和局部特征捕捉能力不足的问题,在骨干网络引入RADBlock模块,提高模型识别不同尺度织物疵点的精度;其次,考虑到在网络较深的部分容易对织物疵点特征造成遗失的问题,设计结合扩张卷积的跨尺度特征注意力融合模块CAFBlock,有效保留织物疵点细节;最后使用SIoU代替GIoU函数帮助模型提高检测精度。在天池平台织物疵点数据集测试结果显示,与原RT-DETR模型相比较,改进后RT-DETR模型的精确率、召回率和mAP@0.5分别提高了4.6%,5.1%和7.1%,同时参数量、计算量分别减少了约16%和8%。 展开更多
关键词 织物疵点检测 rt-detr模型 RADBlock CAFBlock SIoU
在线阅读 下载PDF
基于改进RT-DETR的草莓病害检测方法
18
作者 王海瑞 胡灿 +1 位作者 朱贵富 蒋晨 《湖南大学学报(自然科学版)》 北大核心 2025年第12期176-188,共13页
我国作为世界上最大的草莓生产国,准确检测草莓病害是保障草莓品质和产量的有效手段.针对草莓病害在复杂背景下检测精度不高及细微病害检测困难的问题,提出了一种改进RT-DETR(real-time detection transformer)网络的草莓病害检测方法 ... 我国作为世界上最大的草莓生产国,准确检测草莓病害是保障草莓品质和产量的有效手段.针对草莓病害在复杂背景下检测精度不高及细微病害检测困难的问题,提出了一种改进RT-DETR(real-time detection transformer)网络的草莓病害检测方法 .首先,使用AdditiveBlock-CGLU模块对主干特征提取网络进行重构,以增强模型在复杂背景干扰下对深层关键特征的表征能力.其次,提出多尺度跨层特征融合金字塔网络(multi-scale cross-layer block feature fusion pyramid network,MS-CBFPN)优化模型的特征融合部分,使其能更有效整合不同层级信息并充分捕捉图像上下文信息,从而提高模型对细微病害特征的检测能力.最后,在特征交互模块(attention-based intra-scale feature interaction,AIFI)中引入渐进式重参数化批量归一化(progressive re-parameterized batch normalization,PRepBN)结构,通过动态调整学习率及重参数化方法,使模型更好地适应不同训练阶段的变化,进一步增强模型对草莓病害的检测性能.实验结果表明,改进模型在检测草莓病害的准确率、召回率、mAP@0.5、mAP@0.5:0.95和F1得分五项指标上分别提升了3.4、7.6、3.3、8.0和5.6个百分点,且相对于其他模型也具有优势,表明改进的RT-DETR模型是一种在复杂场景下有效的草莓病害检测模型. 展开更多
关键词 目标检测 病害检测 rt-detr CAS-VIT EMCAD PRepBN
在线阅读 下载PDF
基于改进RT-DETR的织物疵点检测方法
19
作者 李敏 周双 +2 位作者 朱萍 崔树芹 颜小运 《电子测量技术》 北大核心 2025年第14期176-184,共9页
针对织物疵点种类有限、尺度变化大以及模型检测精度低等问题,提出了一种基于RT-DETR的织物疵点检测方法DHR-DETR。首先,创新性地设计了多路径坐标注意力机制模块(MPCA),并将其与可变形卷积模块(DCNv2)深度融合,构建动态可变形卷积模块... 针对织物疵点种类有限、尺度变化大以及模型检测精度低等问题,提出了一种基于RT-DETR的织物疵点检测方法DHR-DETR。首先,创新性地设计了多路径坐标注意力机制模块(MPCA),并将其与可变形卷积模块(DCNv2)深度融合,构建动态可变形卷积模块,以应对复杂多样的疵点形状。其次,采用高水平筛选特征金字塔(HS-FPN)替换跨尺度特征融合模块(CCFM),实现多层次特征的高效融合并有效降低了模型复杂度。最后,构建了兼具轻量化和特征增强能力的RetBlockC3模块,并集成至HS-FPN网络,进一步强化模型对局部信息的捕捉能力,同时显著提升模型的轻量化性能。试验结果表明,DHR-DETR方法在公开和自制织物数据集上的mAP@0.5分别达到了50.9%和97.5%,相较原模型提高了2.9%和0.6%,参数量仅为17.9 M,计算量降低了37%,显著提升了模型的检测性能和部署效率,具备在实际工业检测任务中的应用潜力。 展开更多
关键词 rt-detr 疵点检测 动态可变形卷积 高水平筛选特征金字塔 轻量化
原文传递
基于巡检机器人和改进RT-DETR的奶牛挑食行为识别方法
20
作者 田富洋 张立印 +3 位作者 张帅扬 宋占华 于镇伟 张姬 《农业机械学报》 北大核心 2025年第6期258-267,共10页
针对目前复杂环境下奶牛在采食过程中挑食行为与采食行为差异不大、识别精度较低、人工识别劳动强度大等问题,本文提出了一种基于巡检机器人和改进RT-DETR模型的奶牛挑食行为识别方法。根据奶牛采食特性设计巡检机器人采集奶牛采食过程... 针对目前复杂环境下奶牛在采食过程中挑食行为与采食行为差异不大、识别精度较低、人工识别劳动强度大等问题,本文提出了一种基于巡检机器人和改进RT-DETR模型的奶牛挑食行为识别方法。根据奶牛采食特性设计巡检机器人采集奶牛采食过程数据,分中午、下午和晚上3个时间段分别在3个牛棚进行采集,最终构建包含3个时间段共计10280幅奶牛采食数据集。对RT-DETR模型进行改进,在RT-DETR模型浅层中引入DAttention(DAT)模块和Bi-Level Routing Attention(BRA)模块融合的DBRA结构,建立了新的图像特征提取结构,提升输入图像局部和全局特征深度融合能力;在RT-DETR模型编码器中融合Efficient Multi-Scale Attention(EMA)模块,增强了提取高层次语义信息能力,更好地联系上下文信息。试验结果表明,改进后模型在奶牛采食视频数据集平均精度均值(mAP@0.5)为99.1%,模型内存占用量为39.6 MB,浮点计算量为4.67×10^(10),相较于原模型平均精度均值提高7.4个百分点,模型内存占用量降低0.9 MB,浮点计算量减少2%。与Sparse R-CNN、YOLO v7-L、YOLO v8n、DINO、Swin Transformer和DETR模型相比,平均精度均值(mAP@50)分别提高8.5、9.8、7.8、6.6、11.4、9.5个百分点。研究结果可以为实现畜牧养殖智能化提供技术支持。 展开更多
关键词 奶牛挑食行为 巡检机器人 改进rt-detr 行为识别 注意力机制
在线阅读 下载PDF
上一页 1 2 250 下一页 到第
使用帮助 返回顶部