基于显著性特征与交叉注意力的无参考图像质量评价算法

No-reference image quality assessment algorithm based on saliency features and cross-attention mechanism

下载PDF

导出

摘要实际业务场景中的图像数据通常呈现内容丰富和失真表现复杂的特点,对客观图像质量评价(IQA)算法的泛化是一个巨大挑战。针对这一问题,提出一种无参考IQA(NR-IQA)算法。该算法主要由特征提取网络(FEN)、特征融合网络(FFN)和自适应预测网络(APN)这3个子网络组成。首先,将样本的全局视图、局部patch和显著性视图一并输入FEN,并通过Swim Transformer提取全局失真、局部失真和显著性特征;其次,采用级联的Transformer编码器融合全局失真特征和局部失真特征,并挖掘二者的潜在关联模式;受人类视觉关注机制的启发,在FFN中使用显著性特征激发注意力模块,使该模块对视觉显著性区域施加额外关注,从而提升算法的语义解析能力;最后,通过动态构建的多层感知机(MLP)回归网络计算出预测分数。在主流的合成失真和真实失真数据集上的实验结果表明,所提算法与DSMix(Distortion-induced Sensitivity map-guided Mixed augmentation)算法相比,所提算法在TID2013数据集上的斯皮尔曼秩序相关系数(SRCC)提升了4.3%,在KonIQ数据集上的皮尔森线性相关系数(PLCC)提升了1.4%,并展现出了出色的泛化能力和可解释性,能够有效应对业务场景中失真表现复杂的情况,且可以根据样本个体特征做出适应性预测。 Image data in actual business scenarios usually presents the characteristics of rich content and complex distortion performance,which is a great challenge to the generalization of objective Image Quality Assessment(IQA)algorithms.In order to solve this problem,a No-Reference IQA(NR-IQA)algorithm was proposed,which is mainly composed of three sub-networks:Feature Extraction Network(FEN),Feature Fusion Network(FFN),and Adaptive Prediction Network(APN).Firstly,the global view,local patch,and saliency view of the sample were input into the FEN together,and the global distortion,local distortion,and saliency features were extracted by Swim Transformer.Then,the cascaded Transformer encoder was used to fuse the global distortion features and local distortion features,and the potential correlation patterns of the two were explored.Inspired by the human visual attention mechanism,the saliency features were used in the FFN to activate the attention module,so that the module was able to pay additional attention to the visual salient region,so as to improve the semantic parsing ability of the algorithm.Finally,the prediction score was calculated by the dynamically constructed MultiLayer Perceptron(MLP)regression network.Experimental results on main stream synthetic and real-world distortion datasets show that compared with the DSMix(Distortion-induced Sensitivity map-guided Mixed augmentation)algorithm,the proposed algorithm improves the Spearman Rank-order Correlation Coefficient(SRCC)by 4.3%on TID2013 dataset,and the Pearson Linear Correlation Coefficient(PLCC)by 1.4%on KonIQ dataset.The proposed algorithm also demonstrates excellent generalization ability and interpretability,which can deal with the complex distortion performance in business scenarios effectively,and can make adaptive prediction according to the individual characteristics of the sample.

作者邓旸赵涛孙凯童同高钦泉 DENG Yang;ZHAO Tao;SUN Kai;TONG Tong;GAO Qinquan(School of Physics and Information Engineering,Fuzhou University,Fuzhou Fujian 350108,China;Fuzhou Branch,China Telecom Corporation Limited,Fuzhou Fujian 350005,China;Beijing Radio and Television Station,Beijing 100022,China;Fujian Imperial Vision Technology Group Company Limited,Fuzhou Fujian 350002,China)

机构地区福州大学物理与信息工程学院中国电信股份有限公司福州分公司北京广播电视台福建帝视科技集团有限公司

出处《计算机应用》北大核心 2025年第12期3995-4003,共9页 journal of Computer Applications

基金福建省人工智能科技经济融合服务平台项目([2022]15)。

关键词图像质量评价人类视觉系统视觉关注显著目标检测注意力机制 Image Quality Assessment(IQA) Human Visual System(HVS) visual attention Salient Object Detection(SOD) attention mechanism

分类号 TP391.4 [自动化与计算机技术—计算机应用技术]

引文网络
相关文献

参考文献1

1王文冠,沈建冰,贾云得.视觉注意力检测综述[J].软件学报,2019,30(2):416-439. 被引量：67

共引文献66

1刘祥学.杨廷和与嘉靖初年的政治革新[J].西南师范大学学报（人文社会科学版）,2000,26(2):122-128. 被引量：1
2刘孝保,陆宏彪,阴艳超,陈志成.基于多元神经网络融合的分布式资源空间文本分类研究[J].计算机集成制造系统,2020,26(1):161-170. 被引量：9
3杨国萍,刘本永.基于目标轮廓增强的GrabCut图像分割方法[J].软件,2020,41(2):28-32. 被引量：6
4张盼盼,李其申,杨词慧.基于轻量级分组注意力模块的图像分类算法[J].计算机应用,2020,40(3):645-650. 被引量：8
5亢伉.利用对抗生成网络的视觉显著性预测研究[J].电子设计工程,2020,28(8):180-183. 被引量：2
6张泽平,杨浪,谢志行.基于Xception的实时情绪识别在课堂质量分析上的研究[J].自动化技术与应用,2020,39(6):48-53. 被引量：3
7陈少玉,曾惠蘋.基于核心素养培养的地理景观图开发与应用——以深圳红树林与大鹏半岛研学为例[J].中学地理教学参考,2020(11):37-39. 被引量：1
8余石龙,鲍劲松,李婕,张启华.基于误差注意力的晶圆制造数据异常检测[J].中国机械工程,2020,31(14):1686-1692. 被引量：2
9李中益,杨观赐,李杨,何玲.基于图像语义的服务机器人视觉隐私行为识别与保护系统[J].计算机辅助设计与图形学学报,2020,32(10):1679-1687. 被引量：11
10王毅,吕健,尤乾,赵泽宇,颜宝明,朱姝蔓.基于菲茨定律的虚拟现实任意形状选择模型[J].计算机应用,2020,40(11):3320-3326. 被引量：3

1张臻(文/图).不到200元的耳边愉悦飞傲FD11耳机[J].微型计算机,2023(14):70-71.
2葛晓宁,许新桥,张怀清,张京,杨杰,崔泽宇,傅汝饶,梁金洁,邹添华,王林龙,刘洋.林木基因型-环境互作算法研究进展与思考[J].林业科学,2025,61(3):1-15. 被引量：3
3李聚贤,赵凯,乔雪,孙中琪,姜慧杰.基于CT栖息地影像组学鉴别乏脂肪肾血管平滑肌脂肪瘤与小肾癌的应用研究[J].临床放射学杂志,2025,44(11):2148-2154.
4张凯,于瓅.基于MPC-YOLOv8算法的遥感影像目标检测[J].哈尔滨商业大学学报(自然科学版),2025,41(6):651-660.
5万术娟,陈波,姚金霞,随顺涛,蒋辉霞,张浩田,万先起,谭杰,高新,蒋金巧,张军.机器视觉在中药材机械化生产中的研究进展[J].四川农业科技,2025(11):169-171.
6潘熙.基于组合神经网络的新能源场站集中式功率预测研究[J].电子设计工程,2025,33(23):77-81.
7蔺月妮,汪西莉.结合CNN和多尺度视觉状态空间的遥感图像语义分割网络[J].计算机科学与探索,2025,19(12):3290-3302.
8邱倩倩,杨茜,戴志强.改进背景先验算法的显著性地物检测研究[J].现代测绘,2025,48(3):1-4.
9李信东.广播电视台中波音频信号失真比对分析[J].西部广播电视,2025,46(8):158-161. 被引量：2
10郝飞,焦云东,孙佳浩,徐鸿蒙,孟超.正交远心机器视觉测量方法及其系统与应用[J].仪器仪表学报,2025,46(9):125-133.

计算机应用

2025年第12期

浏览历史

内容加载中请稍等...

基于显著性特征与交叉注意力的无参考图像质量评价算法

参考文献1

共引文献66

相关作者

相关机构

相关主题

浏览历史