期刊文献⁺

任意字段

题名或关键词

题名

关键词

文摘

作者

第一作者

机构

刊名

分类号

参考文献

作者简介

基金资助

栏目信息

融合声纹特征的图像识别自监督算法设计研究

Research on the Design of Self-monitoring Algorithm for Image Recognition Based on Voiceprint Features

下载PDF

导出

摘要传统单模态人脸图像识别在复杂环境下容易受光照变化、目标遮挡等因素影响,识别精度和健壮性有待提高。声纹作为人类独有生物特征,与人脸图像特征形成了有效互补。提出一种融合声纹特征的人脸图像识别自监督算法,构建双分支特征提取网络,设计跨模态注意力融合机制,建立对比学习框架实现无监督多模态特征学习。实验结果表明,相比单模态方法,该算法识别准确率从85.2%提高至93.7%,在10%标注数据条件下仍拥有82.3%的识别准确率,验证了跨模态自监督学习的有效性。 Traditional single-mode face image recognition is easily affected by factors such as illumination change and target occlusion in complex environment,and its recognition accuracy and robustness need to be improved.Voiceprint,as a unique biological feature of human beings,effectively complements the features of human face images.This paper proposes a self-monitoring algorithm for face image recognition based on voiceprint features,constructs a double-branch feature extraction network,designs a cross-modal attention fusion mechanism,and establishes a comparative learning framework to realize unsupervised multi-modal feature learning.The experimental results show that the recognition accuracy of the algorithm is improved from 85.2%to 93.7%compared with the single-mode method,and it still reaches 82.3%under the condition of 10%labeled data,which verifies the effectiveness of cross-mode self-supervised learning.

作者王梦仙卢静涛陈志泉谢文娜 WANG Mengxian;LU Jingtao;CHEN Zhiquan;XIE Wenna(Xiamen Nanyang Vocational College,Xiamen 361000,China;University of the East,Manila 1008,Philippines)

机构地区厦门南洋职业学院菲律宾东方大学

出处《电声技术》 2025年第10期46-48,共3页 Audio Engineering

基金福建省教育厅中青年教师教育科研项目(科技类)课题(JAT242033)。

关键词人脸图像识别声纹特征自监督学习跨模态融合注意力机制 face image recognition voiceprint self-supervised learning cross-modal fusion attention mechanism

分类号 TN912.34 [电子电信—通信与信息系统]

引文网络
相关文献

参考文献10

1王晨海,彭婵娟.基于机器视觉的局部遮挡人脸图像识别仿真[J].计算机仿真,2023,40(11):170-174. 被引量：5
2张宇翔,李茁,陆镜泽,尚增强,陈树丽,王文超,张鹏远.基于声纹特征的伪造语音检测[J].声学学报,2025,50(1):201-210. 被引量：2
3赵琰,赵凌君,张思乾,计科峰,匡纲要.自监督解耦动态分类器的小样本类增量SAR图像目标识别[J].电子与信息学报,2024,46(10):3936-3948. 被引量：3
4孙红,杨晨,莫光萍,朱江明.基于双分支特征提取的轻量级图像分割算法[J].包装工程,2023,44(11):299-308. 被引量：6
5席青云,邱长江,陶佰睿,关新宇,苗凤娟.基于共振峰和梅尔倒谱的声纹特征提取SOC设计[J].传感技术学报,2023,36(5):782-787. 被引量：4
6张文兴,杨振凯,刘文婧,王建国.改进ResNet双目视觉算法在人脸活体检测中的应用研究[J].机械设计与制造,2023(9):64-67. 被引量：1
7刘娟,左志群,陈玉琦,肖笛,庞宝川,曹得华.用于组织病理图像分类的端到端注意力池化方法[J].武汉大学学报（信息科学版）,2024,49(7):1070-1078. 被引量：1
8王婷,季繁繁,崔绍君,袁晓彤.融合对比学习的对抗式无监督领域自适应图像分类方法[J].计算机辅助设计与图形学学报,2025,37(5):844-855. 被引量：1
9王苑铮,孙文祥,范意兴,廖华明,郭嘉丰.基于对比学习的跨模态实体链接模型[J].计算机研究与发展,2025,62(3):662-671. 被引量：3
10张宏图,化春键,蒋毅,俞建峰,陈莹.融合改进图卷积的跨模态检索[J].计算机工程与应用,2024,60(11):95-104. 被引量：1

二级参考文献49

1傅兴玉,尤红建,付琨.基于邻域均方连续差分的SAR图像边缘提取算法[J].电子与信息学报,2012,34(5):1030-1037. 被引量：6
2张路,廖明生,董杰,许强,龚健雅.基于时间序列InSAR分析的西部山区滑坡灾害隐患早期识别——以四川丹巴为例[J].武汉大学学报（信息科学版）,2018,43(12):2039-2049. 被引量：155
3张成晖,叶朝辉,张立伟,吴楠.SoC FPGA在声波测井数据采集系统中的应用[J].传感器与微系统,2017,36(3):150-152. 被引量：5
4丁柏圆,文贡坚,余连生,马聪慧.属性散射中心匹配及其在SAR目标识别中的应用[J].雷达学报（中英文）,2017,6(2):157-166. 被引量：96
5李婉玲,张秋菊.基于HMM/SVM的抗噪语音特征提取及优化[J].传感器与微系统,2019,38(4):55-58. 被引量：10
6蓝雯飞,汪敦志,张盛兰.一种新的降维算法PCA_LLE在图像识别中的应用[J].中南民族大学学报（自然科学版）,2020,39(1):85-90. 被引量：7
7杨蕴,李玉,赵泉华.基于多标记像素匹配的高分辨率遥感图像道路提取[J].交通运输系统工程与信息,2020,20(1):68-74. 被引量：12
8刘宇琦,赵宏伟,王玉.一种基于QPSO优化的流形学习的视频人脸识别算法[J].自动化学报,2020,46(2):256-263. 被引量：18
9张雪菲,程乐超,白升利,张繁,孙农亮,王章野.基于变分自编码器的人脸图像修复[J].计算机辅助设计与图形学学报,2020,32(3):401-409. 被引量：21
10张欣彧,尤鸣宇,朱江,韩煊.基于联合损失函数的小规模数据人脸识别[J].北京理工大学学报,2020,40(2):163-168. 被引量：12

共引文献17

1谢曼娜.智能声纹识别技术在智慧监狱管理中的应用[J].电声技术,2023,47(6):65-67. 被引量：1
2仇亚骏,杨艺西,苏童,刘翰文,何宇泽,周倩.基于图像识别的会场画面效果智能判别技术及应用[J].电视技术,2024,48(5):23-25.
3卢伟,孙刘杰,吕龙龙.基于深度学习的通用性图像复原方法研究[J].包装工程,2024,45(15):269-281. 被引量：1
4闫景富,王鹏飞.多尺度特征融合下三维视觉图像场景分割算法[J].现代电子技术,2024,47(21):46-50. 被引量：1
5王敏,许永琪,曹小萌,曹冉,欧翔.基于DSCI-YOLOv8的纺织品材质分类方法[J].电子测量技术,2024,47(18):130-137.
6井煜.基于深度学习的局部遮挡人脸图像识别方法研究[J].互联网周刊,2024(21):56-58. 被引量：2
7杨军.基于人工智能的通信服务网络独立语义特征抽取算法[J].自动化与仪器仪表,2024(10):52-55. 被引量：1
8李新伟,陈益,何若男,刘舒彬,曹辉.基于改进EWT的病理嗓音检测[J].电子设计工程,2025,33(2):172-175.
9汤文昊.基于视觉图神经网络的人脸识别方法研究[J].科技资讯,2024,22(24):44-46. 被引量：1
10郑爱玲,许艳艳.基于深度学习的车载视频图像动态识别算法与应用研究[J].信息技术与信息化,2025(3):51-54.

1昂旺措姆.中小学语文课外阅读与课堂教学的衔接路径探析[J].读报参考,2023(26):96-96.
2姜慧,张莹.机器视觉与涡流检测融合的表面缺陷多模态识别研究[J].工程技术与管理(香港),2026(2):171-173.
3李虹江,于昕左,马佳,董秀军.多源遥感数据融合的高陡边坡危岩体信息提取[J].地质科技通报,2025,44(6):306-316.
4赵熙萌,刘一迪,谭宏伟.妇科肿瘤围手术期管理的革命:从ERAS到预康复的系统性优化[J].临床医学进展,2025,15(12):1287-1298.
5鲁筱,叶剑平.养老金融与养老REITs发展:机遇、困境与协同路径[J].当代经济管理,2026,48(2):83-88.
6黄锦丰,王诗慧.小学生家庭科学实验课程研发与实践[J].中国教育技术装备,2026(1):72-76.
7张倩榕.钢琴演奏艺术美学的价值呈现及实现路径[J].黔南民族师范学院学报,2025,45(5):123-128.

电声技术

2025年第10期

相关作者

内容加载中请稍等...

相关机构

内容加载中请稍等...

相关主题

内容加载中请稍等...

浏览历史

内容加载中请稍等...

;

使用帮助返回顶部