期刊文献+
共找到21,041篇文章
< 1 2 250 >
每页显示 20 50 100
复杂环境下智能终端支持的无线图像传输系统研究
1
作者 刘建苹 《中国宽带》 2026年第1期123-125,共3页
为解决复杂环境下传统通信网络超负荷、短距离对讲设备无法传输图像的问题,本文研究设计复杂环境下智能终端支持的无线图像传输系统。该系统以Android智能终端为信息采集处理端,通过App采集图像、视频与文字,采用JPEG与H.264编码技术压... 为解决复杂环境下传统通信网络超负荷、短距离对讲设备无法传输图像的问题,本文研究设计复杂环境下智能终端支持的无线图像传输系统。该系统以Android智能终端为信息采集处理端,通过App采集图像、视频与文字,采用JPEG与H.264编码技术压缩多媒体数据;设计嵌入式Wi-Fi接口模块并移植u C/OS-ii系统,完成与超短波电台的对接及数据收发;依托超短波电台抗干扰、远距离传输特性传输数据,PC端上位机软件最终完成数据接收、校验、解码与实时显示。系统有效提升无线图像传输的便携性与实用性,满足复杂环境下安全指挥等场景的通信需求。 展开更多
关键词 无线图像传输 Android智能终端 超短波电台 嵌入式Wi-Fi模块 H.264编码
在线阅读 下载PDF
5G网络环境下数字视频传输稳定性增强技术关键点研究
2
作者 张李高 《中国宽带》 2026年第1期33-35,共3页
在5G网络环境下,数字视频传输的稳定性与可靠性是研究的重点。5G网络具有高速率、低延迟特性,其中数字视频传输技术在远程制作、实时性监控以及虚拟现实等不同的领域中应用广泛,但是在应用中还是存在丢包以及延迟等诸多问题,这些问题严... 在5G网络环境下,数字视频传输的稳定性与可靠性是研究的重点。5G网络具有高速率、低延迟特性,其中数字视频传输技术在远程制作、实时性监控以及虚拟现实等不同的领域中应用广泛,但是在应用中还是存在丢包以及延迟等诸多问题,这些问题严重影响了视频传输的稳定性。5G网络环境下数字视频传输稳定性增强技术必须要优化射频前端架构结构,实现多频协同以及波束赋形,则可以提高可靠性。而基于多路径TCP以及自适应FEC冗余编码等技术手段进行处理,通过网络切片以及边缘计算架构等多种方式进行协同应用,可以有效满足不同业务应用需求。 展开更多
关键词 5G视频传输 稳定性增强 大规模MIMO 自适应FEC 网络切片 边缘计算
在线阅读 下载PDF
视联网:从能力实践到发展前瞻
3
作者 万奇 白一凡 张慧勇 《通信世界》 2026年第1期38-41,共4页
目前视联网已成为数字经济重要基础设施,而视联网生态圈的日益拓展,使网络承载能力面临多元挑战。本文以中国移动“三层接入、两网协同、技术融合”的业务承载体系为研究对象,对专线、有线、无线三类场景差异化承载实施方案进行要点总结... 目前视联网已成为数字经济重要基础设施,而视联网生态圈的日益拓展,使网络承载能力面临多元挑战。本文以中国移动“三层接入、两网协同、技术融合”的业务承载体系为研究对象,对专线、有线、无线三类场景差异化承载实施方案进行要点总结,并对未来视联网关键技术应用进行思考与展望。 展开更多
关键词 视联网 5G专网 差异化承载 SRv6 技术展望
在线阅读 下载PDF
EGOP: A Server-Side Enhanced Architecture to Eliminate End-to-End Latency Caused by GOP Length in Live Streaming
4
作者 Kunpeng Zhou Tao Wu Jia Zhang 《Computers, Materials & Continua》 2026年第1期935-961,共27页
Over the past few years,video live streaming has gained immense popularity as a leading internet application.In current solutions offered by cloud service providers,the Group of Pictures(GOP)length of the video source... Over the past few years,video live streaming has gained immense popularity as a leading internet application.In current solutions offered by cloud service providers,the Group of Pictures(GOP)length of the video source often significantly impacts end-to-end(E2E)latency.However,designing an optimized GOP structure to reduce this effect remains a significant challenge.This paper presents two key contributions.First,it explores how the GOP length at the video source influences E2E latency in mainstream cloud streaming services.Experimental results reveal that the mean E2E latency increases linearly with longer GOP lengths.Second,this paper proposes EGOP(an Enhanced GOP structure)that can be implemented in streaming media servers.Experiments demonstrate that EGOP maintains a consistent E2E latency,unaffected by the GOP length of the video source.Specifically,even with a GOP length of 10 s,the E2E latency remains at 1.35 s,achieving a reduction of 6.98 s compared to Volcano-Engine(the live streaming service provider for TikTok).This makes EGOP a promising solution for low-latency live streaming. 展开更多
关键词 GOP EGOP low-latency live streaming TikTok
在线阅读 下载PDF
面向高分辨率图像传输的CNN网络编码方案研究 被引量:1
5
作者 刘娜 杨颜博 +2 位作者 张嘉伟 李宝山 马建峰 《西安电子科技大学学报》 北大核心 2025年第2期225-238,共14页
网络编码技术可以有效提升网络的吞吐率,然而,传统网络编码的编解码复杂度高且难以自适应环境噪声等动态因素的影响而容易导致解码失真,近年来有研究者引入神经网络以优化网络编码过程,但在高分辨率图像传输任务中,现有的神经网络编码... 网络编码技术可以有效提升网络的吞吐率,然而,传统网络编码的编解码复杂度高且难以自适应环境噪声等动态因素的影响而容易导致解码失真,近年来有研究者引入神经网络以优化网络编码过程,但在高分辨率图像传输任务中,现有的神经网络编码方案对高维度空间信息的捕捉能力不足,带来较大的通信及计算开销。为此,文中提出采用二维卷积神经网络(CNN)对各网络节点的编解码器进行参数化设计的联合源的深度学习网络编码方案,通过CNN捕捉深层空间结构信息并降低网络节点的计算复杂度。在信源节点,通过卷积层运算实现对传输数据的降维处理,提升数据的传输速率;在中间节点,接收来自两个信源的数据并通过CNN编码压缩至单个信道传输;在信宿节点,对接收到的数据利用CNN进行升维解码而恢复出原始图像。实验表明,在不同信道带宽占用比和信道噪声水平下,该方案在峰值信噪比和结构相似度上展现出优良的解码性能。 展开更多
关键词 网络编码 深度学习 卷积神经网络 高分辨率图像 图像通信
在线阅读 下载PDF
适应遥感船舶图像的轻量化旋转小目标检测网络 被引量:3
6
作者 孙伟 沈欣怡 +1 位作者 张小瑞 管菲 《电子测量与仪器学报》 北大核心 2025年第4期122-131,共10页
遥感图像船舶目标小、背景复杂、姿态变化大,传统船舶检测算法为提升精度,往往忽视了模型规模和实时性,难以应用到资源受限的设备上。针对上述问题,提出一种适应遥感船舶图像的轻量化旋转小目标检测网络(RFDNet)。考虑到遥感船舶图像拍... 遥感图像船舶目标小、背景复杂、姿态变化大,传统船舶检测算法为提升精度,往往忽视了模型规模和实时性,难以应用到资源受限的设备上。针对上述问题,提出一种适应遥感船舶图像的轻量化旋转小目标检测网络(RFDNet)。考虑到遥感船舶图像拍摄距离远而导致图片中目标较小且图像中包含丰富的背景信息,设计注意力卷积融合双分支网络(ACFNet),通过对局部特征信息与全局空间感知信息的充分提取,提高船舶小目标检测精度;为避免船舶目标姿态各异而导致检测时的精度下降,利用旋转目标方向信息引入旋转边界框损失函数,获得更准确的边界框回归损失,提升任意方向旋转船舶目标的检测性能;针对为提高模型精度而带来的参数量增加问题,在特征融合部分引入轻量级卷积,将卷积、深度可分离卷积以及通道混洗相结合,减少模型的参数量。通过对比实验和消融实验证明,RFDNet在HRSC2016数据集和DOTA数据集上的平均精度均值(mAP)分别达到了97.63%和81.63%,模型参数降到了2.99×10^(6),在有效提升检测精度的同时实现了模型的轻量化设计,为遥感船舶目标检测算法在资源受限设备上的应用提供了新思路。 展开更多
关键词 遥感图像 旋转目标检测 深度学习 特征融合 损失函数
原文传递
光伏发电机组异动信息主动增量式更新算法 被引量:1
7
作者 王晖 赵咨钧 +1 位作者 管保晋 曲诺亚 《电子设计工程》 2025年第1期132-136,共5页
针对进行光伏发电机组密集型异动信息更新操作时,出现更新时延长、更新结果不完整的问题,提出了光伏发电机组异动信息主动增量式更新算法。通过特征提取、小波变换和模极大值计算来获取有效的增量式特征;构建增量特征成词袋模型并进行标... 针对进行光伏发电机组密集型异动信息更新操作时,出现更新时延长、更新结果不完整的问题,提出了光伏发电机组异动信息主动增量式更新算法。通过特征提取、小波变换和模极大值计算来获取有效的增量式特征;构建增量特征成词袋模型并进行标注;结合蚁群算法搜索异动信息,计算最小平均带宽和最佳更新路径,通过动态更新相容类和决策类异动信息完善数据;采用2阶段集合式更新方案进行信息增量收集和校验增量分发,以获取主动增量式更新异动信息。由实验结果可知,该算法更新时延在全部校验节点下未超过40 s,且能够保证更新结果具有完整性。 展开更多
关键词 光伏发电机组 异动信息 主动增量式 更新
在线阅读 下载PDF
面向超高清视频的算力网络架构及关键技术 被引量:1
8
作者 周旭 吴红 +1 位作者 张伟 宋俊平 《科技导报》 北大核心 2025年第9期38-47,共10页
超高清视频是中国视听产业重要发展方向之一,国家相关部门也出台了一系列政策,鼓励和支持超高清视频产业的发展。超高清视频的采集、传输、制作、播出过程,尤其是融合了ChatGPT、Sora等先进人工智能内容生成技术后,呈现出典型的大带宽... 超高清视频是中国视听产业重要发展方向之一,国家相关部门也出台了一系列政策,鼓励和支持超高清视频产业的发展。超高清视频的采集、传输、制作、播出过程,尤其是融合了ChatGPT、Sora等先进人工智能内容生成技术后,呈现出典型的大带宽、高算力、低时延特征,令算力和网络基础设施面临严峻考验。基于超高清视频典型需求和计算、网络技术最新发展趋势,提出了面向超高清视频的算力网络架构,综合运用异构算力资源组网与安全传输技术、超高清视频业务需求建模与资源编排技术、“数算模”联合调度与路由规划技术、超高清视频高速传输技术等算力网络关键技术,实现全国范围内异构算力的汇聚、组网,满足超高清视频采、编、播等各环节业务处理对多样化算力和网络传输的需求。 展开更多
关键词 超高清视频 算力网络 异构算力组网 算网资源编排 路由规划 高速传输技术
原文传递
基于改进ResNet的机场鸟类识别方法 被引量:1
9
作者 孔建国 赵志伟 +1 位作者 张向伟 梁海军 《电子设计工程》 2025年第5期172-177,共6页
针对机场鸟类识别过程中存在识别难度较大、准确率较低等问题,该文提出了一种改进ResNet的SA-ResNet(SPDConv and Attention-ResNet)模型。模型采用空间到深度卷积(SPDConv)替换ResNet18中的跨步卷积层,避免信息的过度丢失,增强模型特... 针对机场鸟类识别过程中存在识别难度较大、准确率较低等问题,该文提出了一种改进ResNet的SA-ResNet(SPDConv and Attention-ResNet)模型。模型采用空间到深度卷积(SPDConv)替换ResNet18中的跨步卷积层,避免信息的过度丢失,增强模型特征提取能力;使用高效通道注意力(ECA)改进卷积块注意力模块(CBAM),并提出高效卷积块注意力模块(ECBAM)进一步提高模型识别准确率。通过自建的ADB-20机场鸟类数据集验证表明,SA-ResNet模型的准确率达到了95.9%,能够很好地识别机场鸟类,为机场开展鸟击防范工作奠定基础。 展开更多
关键词 鸟类识别 残差网络 注意力机制 深度学习
在线阅读 下载PDF
基于HQAM和资源映射的UEP方案
10
作者 赵海军 陈华月 崔梦天 《高技术通讯》 北大核心 2025年第4期350-359,共10页
本文针对宽带无线通信中视频流的差错保护进行了研究。首先,建立了应用于本文方案的H.264/AVC应用层和IEEE 802.16m物理层跨层系统模型;然后,通过对多天线不等差错保护(unequal error protection,UEP)和单天线分层正交调幅不等差错保护... 本文针对宽带无线通信中视频流的差错保护进行了研究。首先,建立了应用于本文方案的H.264/AVC应用层和IEEE 802.16m物理层跨层系统模型;然后,通过对多天线不等差错保护(unequal error protection,UEP)和单天线分层正交调幅不等差错保护的深入分析,提出了一种在物理层实现对具有不同优先级数据的不同保护级别的资源映射方法,从而实现将多天线的不等差错保护和分层正交调幅(hierarchical quadrature amplitude modulation,HQAM)单天线的不等差错保护相结合的新的HQAM-多输入多输出(multiple-input multiple-output,MIMO)不等差错保护方案。仿真实验结果表明,本文提出的基于HQAM和资源映射的MIMO不等差错保护方案,无论在获得的数据包差错性能和非应答(negative-acknowledgement,NACK)比性能方面,还是在获得的视频峰值信噪比(peak signal-to-noise ratio,PSNR)性能方面都优于传统的多天线的不等差错保护方案和单天线的HQAM不等差错保护方案。 展开更多
关键词 视频流 差错保护 分层正交调幅 资源映射 差错率 峰值信噪比
在线阅读 下载PDF
基于FPGA的4K视频板间传输显示系统
11
作者 严飞 蒋晔 +2 位作者 张丽娟 王鹏 刘银萍 《液晶与显示》 北大核心 2025年第8期1145-1153,共9页
随着4K超高清视频技术在医疗、安防等领域的广泛应用,现场可编程门阵列(FPGA)常被协同用于处理大型的超高清视频图像任务。针对使用高速收发器8b/10b编码方式的数据带宽利用率低的问题,提出一种基于FPGA的4K视频板间传输显示系统。该系... 随着4K超高清视频技术在医疗、安防等领域的广泛应用,现场可编程门阵列(FPGA)常被协同用于处理大型的超高清视频图像任务。针对使用高速收发器8b/10b编码方式的数据带宽利用率低的问题,提出一种基于FPGA的4K视频板间传输显示系统。该系统设计以FPGA为核心,结合STM32微控制器与GSV2011编解码芯片实现对数据传输方式的控制,并对GTX的硬件接口进行了优化。多通道GTX收发器使用64b/66b编码方式,根据4K视频流时序设计编码发送、解码接收逻辑实现传输功能。此外,设计多通道数据同步、DDR多帧缓存等逻辑,有效解决因信道偏斜导致的多通道数据传输偏差与读写时钟速率不匹配导致的显示帧撕裂问题。实验结果表明,该系统能够高效稳定地实现4K@60 Hz视频的板间传输实时显示,硬件资源消耗较低,且相较8b/10b编码的有效带宽减少3.12 Gb/s,为多个FPGA协同处理超高清视频场景提供灵活高效、成本更低的传输方案,具有良好的工程应用价值。 展开更多
关键词 FPGA 4K视频 GTX收发器 64b/66b编码
在线阅读 下载PDF
融合多源信息及图像特征泛化的空气质量检测
12
作者 王晓婷 崔雅博 刘丽娜 《电子测量技术》 北大核心 2025年第13期166-173,共8页
针对空气PM_(2.5)浓度检测过度依赖专业设备的问题,提出了一种融合多源信息及图像特征泛化的空气质量检测算法。首先采用EfficientNet-B0作为主干网络对输入的大气可见光图像进行特征编码,将温度、湿度、风速、气压和光照强度等多源气... 针对空气PM_(2.5)浓度检测过度依赖专业设备的问题,提出了一种融合多源信息及图像特征泛化的空气质量检测算法。首先采用EfficientNet-B0作为主干网络对输入的大气可见光图像进行特征编码,将温度、湿度、风速、气压和光照强度等多源气象信息映射为与大气图像对应的特征向量,并与大气图像特征进行拼接融合;然后利用全连接层将全局特征输出为标量,并利用损失函数检测出空气的PM_(2.5)浓度;最后在网络模型训练阶段,通过对大气图像不同尺度的特征进行随机泛化增强来丰富样本分布空间,使网络能够在有限的数据样本中学习到更多特征,从而有效改善了检测网络的性能。实验结果表明:设计的检测方法与几种主流的方法相比具有更高的检测精度和稳定性,在测试集上得到的RMSE和R-squared分别为21.55μg/m^(3)和0.923,通过对8个场景检测,得到结果的平均误差仅为5.2%,最大误差也仅为7.6%,能够适应各类极端大气污染环境的空气质量检测任务。 展开更多
关键词 空气质量 PM_(2.5)检测 卷积神经网络 多源信息 特征泛化增强 特征融合
原文传递
融合自适应阈值与α-ML核函数的双稀疏空域错误隐藏
13
作者 刘浩 丘茂基 +2 位作者 周镭 陈根龙 燕帅 《哈尔滨工业大学学报》 北大核心 2025年第10期154-164,共11页
在实时视频流的解码端,恢复压缩视频时经常出现块丢失现象。空域错误隐藏利用在当前帧中块与块之间的相关性进行受损图像的恢复,无需其他帧的信息。在众多空域错误隐藏算法中,稀疏表达机制进一步利用了图像的稀疏性,与逐点插值机制相比... 在实时视频流的解码端,恢复压缩视频时经常出现块丢失现象。空域错误隐藏利用在当前帧中块与块之间的相关性进行受损图像的恢复,无需其他帧的信息。在众多空域错误隐藏算法中,稀疏表达机制进一步利用了图像的稀疏性,与逐点插值机制相比恢复质量更好。当前的稀疏表达算法仍面临候选子区域选取不准、相关模型参数较敏感的难题。为此,对基于稀疏表达的对偶空间正则框架进行研究,重点对其中的局部区域匹配和局部线性相关建模两个阶段进行优化,提出一种融合自适应阈值与α-ML核函数的双稀疏空域错误隐藏算法。在局部区域匹配阶段,所提算法设计了一种基于自适应阈值的局部区域匹配方法,能够灵活地适应特征各异的丢失子区域,为字典构建和局部线性相关建模提供更准确的观测空间和潜在空间。在局部线性相关建模阶段,所提算法使用了一种基于α-ML核函数的核岭回归方法作为局部线性相关模型,与现有的高斯核函数相比,α-ML核函数参数敏感性更低、灵活性更好。实验结果表明,在典型的块丢失模式下,所提算法在恢复质量上高于其他现有的空域错误隐藏算法。 展开更多
关键词 错误隐藏 自适应阈值 核函数 区域匹配 相关模型
在线阅读 下载PDF
结合预训练模型的双向门控图卷积对抗词义消歧
14
作者 张春祥 孙颖 +1 位作者 高可心 高雪瑶 《电子与信息学报》 北大核心 2025年第11期4549-4559,共11页
词义消歧(WSD)是提升计算机自然语言理解能力的关键技术,广泛应用于机器翻译、信息检索等领域。为解决现有模型在泛化与鲁棒性方面的不足,该文提出了一种基于预训练模型的双向门控循环单元(Bi-GRU)、交叉注意力(CA)和图卷积网络(GCN)融... 词义消歧(WSD)是提升计算机自然语言理解能力的关键技术,广泛应用于机器翻译、信息检索等领域。为解决现有模型在泛化与鲁棒性方面的不足,该文提出了一种基于预训练模型的双向门控循环单元(Bi-GRU)、交叉注意力(CA)和图卷积网络(GCN)融合的词义消歧模型,引入对抗训练(AT)来优化该模型。将歧义词左右词汇的词形、词性和语义类作为消歧特征,输入LERT获取动态词向量,利用交叉注意力融合Bi-GRU神经网络提取token序列的全局语义信息和CLS序列的局部语义信息,为消歧特征图生成更加完整的句子结点表示。将消歧特征图输入图卷积来更新结点之间的特征信息,然后利用插值预测层和语义分类层来确定歧义词的真实语义类别。计算输入动态词向量的梯度,生成细微的连续扰动,并将扰动加入到原始词向量矩阵中,生成对抗样本。利用对抗样本,融合网络的损失与对抗训练中的损失来优化消歧模型。实验结果表明,该方法不仅能够增强消歧模型处理复杂词汇歧义问题的能力,还能有效提高其鲁棒性和泛化能力,从而表现出更好的消歧性能。 展开更多
关键词 词义消歧 图卷积网络 对抗训练 消歧特征 消歧特征图
在线阅读 下载PDF
基于中心锚困难三元组损失和多视图特征融合的三维模型分类
15
作者 高雪瑶 张澐凯 张春祥 《电子与信息学报》 北大核心 2025年第6期1937-1949,共13页
多视图可以全面表征3维模型的视觉特性以及潜在的空间结构信息,但现有方法容易忽视不同视图间的差异性和互补性。针对上述问题,该文提出一种基于中心锚困难3元组损失和多视图特征融合的3维模型分类方法。首先,以3维模型的多视图集为输入... 多视图可以全面表征3维模型的视觉特性以及潜在的空间结构信息,但现有方法容易忽视不同视图间的差异性和互补性。针对上述问题,该文提出一种基于中心锚困难3元组损失和多视图特征融合的3维模型分类方法。首先,以3维模型的多视图集为输入,利用深度残差收缩网络(DRSN)提取视图特征并融合2维形状分布特征D1,D2和D3得到视图融合特征;其次,根据3维模型视图融合特征,通过香农熵来衡量视图分类的不确定性,并将3维模型的多视图按视图显著性由高到低排序;然后,搭建基于注意力-长短期记忆网络(Att-LSTM)的3元组多视图特征融合网络,利用LSTM学习多视图之间的上下文信息,并融入多头注意力机制充分捕捉多视图间的相关信息;最后,引入度量学习并提出了一种新颖的中心锚困难3元组损失(CAH Triplet Loss),并联合交叉熵损失(CE Loss)来优化多视图特征融合网络,减小同类样本、增大异类样本在特征空间上的距离,加强网络对3维模型区分性特征的学习。实验表明:该方法在3维模型数据集ModelNet10上的分类准确率达到93.83%,分类性能突出。 展开更多
关键词 3维模型分类 多视图特征融合 注意力机制 3元组损失
在线阅读 下载PDF
基于皮尔逊相关系数与核密度估计的低秩稀疏分形图像压缩算法 被引量:1
16
作者 张琴 谢莹 曹一青 《贵州大学学报(自然科学版)》 2025年第3期35-43,共9页
分形图像压缩算法具有较高压缩比,但存在压缩时间长和重构图像质量不高的问题。为解决以上问题,提出一种基于皮尔逊相关系数与核密度估计的低秩稀疏分形图像压缩算法。该算法提取R块(值域块)和D块(定义域块)的皮尔逊相关系数作为特征量... 分形图像压缩算法具有较高压缩比,但存在压缩时间长和重构图像质量不高的问题。为解决以上问题,提出一种基于皮尔逊相关系数与核密度估计的低秩稀疏分形图像压缩算法。该算法提取R块(值域块)和D块(定义域块)的皮尔逊相关系数作为特征量,并对提取的皮尔逊相关系数特征量进行最优带宽核密度估计,再利用分形图像编码的低秩稀疏分解实现R块和D块的匹配。将本文算法分别与基本分形编码(basic fractal image coding,BFIC)、稀疏分形图像压缩算法(sparse fractal image coding,SFIC)、双层非负矩阵分解算法(double-layer non-negative matrix factorization,DLNMF)和正交稀疏分形编码算法(orthogonal sparse fractal coding,OSFC)进行比较,实验结果表明,图像的重构质量和编码速度都得到了提高,减少了图像的存储空间和传输带宽,重构后能够保持图像细节,在医疗图像、媒体数据传输、遥感监测等工程领域有较好的应用前景。 展开更多
关键词 图像压缩 分形编码 皮尔逊相关系数 核密度估计
在线阅读 下载PDF
基于尺度不变特征变换的医学图像高精度配准研究
17
作者 宁梓淯 李萌 +1 位作者 李燕 任重贵 《电子设计工程》 2025年第13期189-192,共4页
为有效指导基于医学图像的医疗引导诊断,研究基于尺度不变特征变换的医学图像高精度配准方法。先利用Harris算法提取医学图像的角点特征,再通过SIFT算法对其进行特征描述,获取不同尺度下的新特征点;接着依据欧氏距离进行图像特征点的初... 为有效指导基于医学图像的医疗引导诊断,研究基于尺度不变特征变换的医学图像高精度配准方法。先利用Harris算法提取医学图像的角点特征,再通过SIFT算法对其进行特征描述,获取不同尺度下的新特征点;接着依据欧氏距离进行图像特征点的初步配准,然后基于两个特征点间的互相关系数剔除误配准点;最后采用RANSAC算法再次剔除误配准点,以提升匹配精度。实验结果显示,该方法可有效实现医学图像配准,保留边缘和细节信息,均方误差最小为0.75,峰值信噪比(PSNR)最大为48.52 dB;配准后的归一化互信息达到1.622 87,互相关系数为0.999 46,较其他对比方法表现更优;同时剔除误配准点降低了特征空间中误配准点对的数量,实现高精度配准,具有实际应用价值。 展开更多
关键词 尺度不变特征变换 医学图像 高精度配准 互相关 误配准点 特征描述
在线阅读 下载PDF
改进YOLOv8的密集人群口罩检测算法
18
作者 伍锡如 梁诗意 《电子测量技术》 北大核心 2025年第1期55-63,共9页
针对公共场合密集人群场景下由于人群遮挡导致的信息缺失及检测目标较小、分辨率低导致人脸佩戴口罩检测算法检测困难的问题,提出了一种改进YOLOv8的密集人群口罩检测算法。采用GD机制代替YOLOv8中FPN结构解决跨层信息传输中信息丢失的... 针对公共场合密集人群场景下由于人群遮挡导致的信息缺失及检测目标较小、分辨率低导致人脸佩戴口罩检测算法检测困难的问题,提出了一种改进YOLOv8的密集人群口罩检测算法。采用GD机制代替YOLOv8中FPN结构解决跨层信息传输中信息丢失的问题,GD使用一个统一的模块收集和融合所有层级的信息,实现网络跨层信息的无损传输,增强了网络特征提取能力。在GD机制中插入ODconv模块对GD传输的信息沿4个维度进行学习,提高模型低分辨目标和小目标的检测精度。此外,引入了一种轻量化检测头SCSBD,对占比过高的YOLOv8检测头进行轻量化处理,平衡模型大小。实验结果表明,改进后的网络在精确率、召回率和平均精度上分别提升了13.6%、1.5%和6.9%,对人脸口罩的检测精度达到了81.1%,模型权重文件仅为25 MB,模型大小介于YOLOv8s和Gold-YOLO-S之间,达到了大小和精度的平衡。 展开更多
关键词 密集人群 口罩检测 YOLOv8 GD机制 ODConv SCSBD 特征提取 轻量化
原文传递
改进YOLOv11的无人机航拍图像检测算法
19
作者 李珺 丁彬彬 +1 位作者 史维娟 杨琳 《电子测量技术》 北大核心 2025年第18期111-121,共11页
针对无人机航拍图像检测任务中,存在目标尺寸微小且背景环境复杂,往往会导致漏检和误检的问题,本文提出了一种基于YOLOv11的航拍图像小目标检测算法WT-YOLO。首先,考虑到无人机航拍图像普遍为小目标的问题,调整了YOLOv11颈部网络的结构... 针对无人机航拍图像检测任务中,存在目标尺寸微小且背景环境复杂,往往会导致漏检和误检的问题,本文提出了一种基于YOLOv11的航拍图像小目标检测算法WT-YOLO。首先,考虑到无人机航拍图像普遍为小目标的问题,调整了YOLOv11颈部网络的结构,改变了输出特征图的尺寸,提高了算法对小目标的检测能力。其次,结合WTConv,重新设计了Bottleneck和C3k2模块的结构,命名为C3k2-WT,来实现特征的高效提取。再次,引入Focal-Modulation来替换SPPF,通过在不同的空间尺度上聚焦和调制特征,使得模型在处理复杂场景时更具鲁棒性;最后,设计了共享卷积检测头,通过卷积共享机制,减少了模型的参数量,同时增强了特征图之间的全局信息融合能力。改进后的算法在VisDrone2019数据集上的实验表明,相较于基础YOLOv11s模型,准确率(P)、召回率(R)和检测精度(mAP50)分别提升了5.6%,5.9%和7.5%,并且参数量下降了约1/4,对比其他算法表现出了良好的性能。 展开更多
关键词 航拍图像 目标检测 YOLOv11 无人机 小目标
原文传递
基于改进Vision Transformer的水稻叶片病害图像识别
20
作者 朱周华 周怡纳 +1 位作者 侯智杰 田成源 《电子测量技术》 北大核心 2025年第10期153-160,共8页
水稻叶片病害智能识别在现代农业生产中具有重要意义。针对传统Vision Transformer网络缺乏归纳偏置,难以有效捕捉图像局部细节特征的问题,提出了一种改进的Vision Transformer模型。该模型通过引入内在归纳偏置,增强了对多尺度上下文... 水稻叶片病害智能识别在现代农业生产中具有重要意义。针对传统Vision Transformer网络缺乏归纳偏置,难以有效捕捉图像局部细节特征的问题,提出了一种改进的Vision Transformer模型。该模型通过引入内在归纳偏置,增强了对多尺度上下文以及局部与全局依赖关系的建模能力,同时降低了对大规模数据集的需求。此外,Vision Transformer中的多层感知器模块被Kolmogorov-Arnold网络结构取代,从而提升了模型对复杂特征的提取能力和可解释性。实验结果表明,所提模型在水稻叶片病害识别任务中取得了优异的性能,识别准确率达到了98.62%,较原始ViT模型提升了6.2%,显著提高了对水稻叶片病害的识别性能。 展开更多
关键词 水稻叶片病害 图像识别 Vision Transformer网络 归纳偏置 局部特征
原文传递
上一页 1 2 250 下一页 到第
使用帮助 返回顶部