期刊文献+
共找到42篇文章
< 1 2 3 >
每页显示 20 50 100
Detection of Abnormal Cardiac Rhythms Using Feature Fusion Technique with Heart Sound Spectrograms
1
作者 Saif Ur Rehman Khan Zia Khan 《Journal of Bionic Engineering》 2025年第4期2030-2049,共20页
A heart attack disrupts the normal flow of blood to the heart muscle,potentially causing severe damage or death if not treated promptly.It can lead to long-term health complications,reduce quality of life,and signific... A heart attack disrupts the normal flow of blood to the heart muscle,potentially causing severe damage or death if not treated promptly.It can lead to long-term health complications,reduce quality of life,and significantly impact daily activities and overall well-being.Despite the growing popularity of deep learning,several drawbacks persist,such as complexity and the limitation of single-model learning.In this paper,we introduce a residual learning-based feature fusion technique to achieve high accuracy in differentiating abnormal cardiac rhythms heart sound.Combining MobileNet with DenseNet201 for feature fusion leverages MobileNet lightweight,efficient architecture with DenseNet201,dense connections,resulting in enhanced feature extraction and improved model performance with reduced computational cost.To further enhance the fusion,we employed residual learning to optimize the hierarchical features of heart abnormal sounds during training.The experimental results demonstrate that the proposed fusion method achieved an accuracy of 95.67%on the benchmark PhysioNet-2016 Spectrogram dataset.To further validate the performance,we applied it to the BreakHis dataset with a magnification level of 100X.The results indicate that the model maintains robust performance on the second dataset,achieving an accuracy of 96.55%.it highlights its consistent performance,making it a suitable for various applications. 展开更多
关键词 Cardiac rhythms Feature fusion Residual learning BreakHis spectrogram sound
在线阅读 下载PDF
基于改进EfficientNetV2的铝液泄漏声音识别与预警机制
2
作者 梁艳辉 温承杰 +2 位作者 闫军威 周璇 张洪涛 《华南理工大学学报(自然科学版)》 北大核心 2026年第2期38-51,共14页
铝液泄漏是导致铝加工深井铸造爆炸事故的直接原因。为解决实际工程中铝液泄漏判断方法滞后性强、准确率低和监测范围受限等问题,该文提出了基于改进EfficientNetV2的铝液泄漏声音识别方法。该方法通过声音特征判断铝液泄漏,以扩大监测... 铝液泄漏是导致铝加工深井铸造爆炸事故的直接原因。为解决实际工程中铝液泄漏判断方法滞后性强、准确率低和监测范围受限等问题,该文提出了基于改进EfficientNetV2的铝液泄漏声音识别方法。该方法通过声音特征判断铝液泄漏,以扩大监测范围;同时通过优化堆叠因子、引入高效通道注意力机制改进EfficientNetV2结构,以进一步提升识别速率与准确率。首先,利用拾音器采集不同场景下的声音数据,构建包含7类声音场景的声音数据库;然后,从声音信号中提取对数梅尔语谱图作为特征集,输入到改进的EfficientNetV2模型进行训练与验证,最终得到铝液泄漏声音识别模型。实验结果表明:改进的EfficientNetV2识别准确率达95.48%;与原始EfficientNetV2、ResNet、 RegNet及DenseNet相比,改进模型的浮点运算次数分别为上述模型的12.34%、8.64%、11.14%和10.80%,参数量分别为上述模型的11.37%、9.55%、15.95%和17.24%,CPU环境下每秒处理图像帧数分别为上述模型的6.53倍、6.14倍、4.41倍和8.00倍,说明改进的EfficientNetV2具有快速准确的识别性能。此外,基于该文提出的铝液泄漏声音识别方法,构建了铝液泄漏风险预警机制,并将该机制应用于铸造单元的实时风险监测。实践结果验证了所提识别方法与预警机制的有效性,可为铝加工深井铸造爆炸事故的预防提供技术参考。 展开更多
关键词 铝加工深井铸造 铝液泄漏 声音识别 风险预警 改进的EfficientNetV2 对数梅尔语谱图
在线阅读 下载PDF
Design of Security System by Means of Sound Print
3
作者 Ismail Abdul-Jabbar Hasan 《World Journal of Engineering and Technology》 2018年第4期903-913,共11页
Sound Recognition becomes an important tool for intrusion detection or for the monitoring of public premises exposed to personal hostility. It could further identify different sounds. The main idea of the sound recogn... Sound Recognition becomes an important tool for intrusion detection or for the monitoring of public premises exposed to personal hostility. It could further identify different sounds. The main idea of the sound recognition process in a security system is to store samples of different sound signals in the memory of the computer as references,?and?to be analyzed with respect to their frequencies components. In this paper, the sound signal of an unknown source would be analyzed and compared with all the available reference samples,?and?then recognition is made according to the closest sample. The developed security system consists of two main parts: the spectrum analyzer that converts the sound signal to spectrograms. It is designed based on the real-time analyzes, and the recognizer which compares the spectrograms and gives the decision of the recognition by using a special criterion. Experimental results prove that the accuracy of the proposed system can be 98.33% for the selected sample of signals. 展开更多
关键词 Security System sound Signal SPECTRUM ANALYZER spectrogram
暂未订购
基于梅尔频谱图和残差神经网络的中国传统乐器声音分类方法研究
4
作者 陈彬 牛磊 《安徽水利水电职业技术学院学报》 2025年第5期38-44,共7页
文章提出一种结合梅尔频谱图与残差神经网络(ResNet)的方法用于中国传统乐器声音的分类。通过将乐器声音片段转换为梅尔频谱图,再利用ResNet对频谱图进行特征提取和分类训练,取得了良好的识别精度。利用频谱图在音频信号处理中的时频局... 文章提出一种结合梅尔频谱图与残差神经网络(ResNet)的方法用于中国传统乐器声音的分类。通过将乐器声音片段转换为梅尔频谱图,再利用ResNet对频谱图进行特征提取和分类训练,取得了良好的识别精度。利用频谱图在音频信号处理中的时频局部化特性以及ResNet在图像识别中的层次特征学习能力,提升了乐器声音分类的准确性和效率。该方法在验证集上的分类准确率达到了87%,具有良好的泛化能力。 展开更多
关键词 梅尔频谱图 残差神经网络 中国传统乐器 声音分类
在线阅读 下载PDF
基于声音信号的转辙机故障诊断研究 被引量:1
5
作者 梁续继 戴胜华 《铁道标准设计》 北大核心 2025年第2期183-190,共8页
铁路信号系统中转辙机的故障率较高,需要采用智能化解决方案对故障进行诊断。传统的解决方案基于电信号,未能充分利用机械电子设备的物理特征。针对这一问题,基于转辙机动作时的声音进行故障诊断。首先,根据转辙机的动作特性提出6种会... 铁路信号系统中转辙机的故障率较高,需要采用智能化解决方案对故障进行诊断。传统的解决方案基于电信号,未能充分利用机械电子设备的物理特征。针对这一问题,基于转辙机动作时的声音进行故障诊断。首先,根据转辙机的动作特性提出6种会影响声音信号的常见机械故障。然后,根据声音诊断在特征提取方面的不同路线,采用3种技术方案。端到端方案通过wav2vec2.0语音识别框架直接进行训练和识别;特征矩阵方案提取声音信号的梅尔倒谱系数(MFCC),通过主成分分析(PCA)得到固定尺寸的特征矩阵,由多分类支持向量机(SVM)进行故障分类;声音图像化方案生成声音信号的语谱图,同时建立卷积神经网络VGG16的轻量化改进模型,将语谱图输入至该模型中进行训练和识别。实验结果表明,3种技术方案均能有效地对包括正常工作和6种故障类型的7种工作状态实现诊断,准确率分别为99.8%、94.2%和96.6%。验证了基于声音进行转辙机故障诊断的3种技术方案的可行性,并体现了语音领域技术在转辙机故障诊断中的应用价值。 展开更多
关键词 转辙机 故障诊断 声音信号 特征提取 wav2vec2.0 MFCC 语谱图
在线阅读 下载PDF
基于改进MobileNetV3的笼养蛋鸡声音分类识别方法 被引量:3
6
作者 衡一帆 盛哲雅 +3 位作者 严煜 谷月 周昊博 王树才 《农业机械学报》 北大核心 2025年第4期427-435,共9页
为实现笼养蛋鸡声音的准确分类,实现蛋鸡健康、情绪、生产状态等信息的智能化、非接触式检测,提出了一种基于改进MobileNetV3的笼养蛋鸡声音分类识别方法。以欣华二号蛋鸡为研究对象,采集蛋鸡在笼养条件下发出的热应激声、惊吓声、产蛋... 为实现笼养蛋鸡声音的准确分类,实现蛋鸡健康、情绪、生产状态等信息的智能化、非接触式检测,提出了一种基于改进MobileNetV3的笼养蛋鸡声音分类识别方法。以欣华二号蛋鸡为研究对象,采集蛋鸡在笼养条件下发出的热应激声、惊吓声、产蛋声以及鸣唱声,经过声音预处理将一维声音信号转化为三维梅尔频谱图,建立了包括8541幅梅尔频谱图的蛋鸡声音数据集。通过在MobileNetV3中引入高效通道注意力(Efficient channel attention,ECA)模块,提高了笼养蛋鸡声音分类准确率。试验结果表明,MobileNetV3-ECA模型准确率、召回率、精确率以及F1分数分别达到95.25%、95.16%、95.02%、95.08%,相比原始模型分别提高1.99、2.08、2.00、2.04个百分点。通过与分别引入坐标注意力(Coordinate attention,CA)、卷积块注意力模块(Convolutional block attention module,CBAM)的模型对比,引入ECA模块后模型准确率分别提高2.11、2.03个百分点,其他指标同样有更明显的提高。与ShuffleNetV2、DesNet121和EfficientNetV2模型相比,MobileNetV3-ECA准确率分别提高1.99、2.03、2.50个百分点。本文提出的基于MobileNetV3-ECA的蛋鸡声音分类识别方法,能够有效且准确地实现对包括热应激声在内的不同种类蛋鸡声音分类识别,为蛋鸡规模化养殖中的自动化、智能化声音检测提供了算法支持,为禽舍巡检机器人功能优化提供了参考,同时为规模化笼养蛋鸡热应激预警开辟了思路。 展开更多
关键词 笼养蛋鸡 声音分类 MobileNetV3 高效通道注意力 梅尔频谱图 卷积神经网络
在线阅读 下载PDF
基于多特征融合与迁移学习的电子琴声音信号自动化识别系统
7
作者 刘志方 张丽珍 《电子设计工程》 2025年第23期177-181,共5页
为全面描述电子琴声音信号的特性,增强系统的鲁棒性和泛化能力,设计基于多特征融合与迁移学习的电子琴声音信号自动化识别系统。设计声音信号采集与处理模块,实时采集声音信号,并经由频谱分析,得到声音信号的短时傅里叶变换、常数Q变换... 为全面描述电子琴声音信号的特性,增强系统的鲁棒性和泛化能力,设计基于多特征融合与迁移学习的电子琴声音信号自动化识别系统。设计声音信号采集与处理模块,实时采集声音信号,并经由频谱分析,得到声音信号的短时傅里叶变换、常数Q变换和对数梅尔频谱图;在上位机中采用TL-VGG16迁移学习的特征提取网络,分别在频谱图中提取声音信号的振幅、音高与音色特征,增强系统的鲁棒性和泛化能力;对特征进行多特征融合,经由全连接层输出声音信号自动化识别结果。实验证明,该系统的识别准确率在0.75以上且相对稳定,且该系统可有效将采集的声音信号转换成频谱图,并提取声音信号特征,完成多特征融合,进而精准自动化识别声音信号。 展开更多
关键词 多特征融合 迁移学习 声音信号 自动化识别 频谱图
在线阅读 下载PDF
基于生成对抗学习的变压器声纹异常检测研究
8
作者 卞楠 《自动化应用》 2025年第19期119-121,126,共4页
针对变压器异常声纹样本数量少,有监督声纹异常诊断方法应用受限的问题,提出一种基于自编码生成对抗的无监督变压器声纹异常检测模型。首先,为获取原始变压器音频样本的时间-频率特征,将原始变压器音频转换为梅尔语谱图。随后,构建生成... 针对变压器异常声纹样本数量少,有监督声纹异常诊断方法应用受限的问题,提出一种基于自编码生成对抗的无监督变压器声纹异常检测模型。首先,为获取原始变压器音频样本的时间-频率特征,将原始变压器音频转换为梅尔语谱图。随后,构建生成对抗网络(GAN)框架下的声纹异常检测模型,该模型通过生成器学习正常状态语谱图的特征分布,并利用判别器区分生成样本与真实样本。在训练过程中,模型通过优化生成器和判别器的对抗损失,学习正常样本的特征表示,并计算输入样本在潜在空间中的异常得分。在检测阶段,根据输入样本的异常得分是否超过预设阈值实现变压器异常声纹检测。所研究的方法在变压器声纹数据集上实现了94.08%的检测精度和100%的检测召回率,证明了该方法的有效性。 展开更多
关键词 电力变压器 声纹检测 异常诊断 时间-频率特征 梅尔语谱图
在线阅读 下载PDF
10种鸣禽控制鸣啭神经核团大小与鸣唱复杂性的相关性 被引量:8
9
作者 曾少举 卢凯 +3 位作者 华方圆 赵文龙 张信文 左明雪 《动物学报》 SCIE CAS CSCD 北大核心 2005年第1期68-75,共8页
为进一步揭示鸣禽鸣唱行为的神经生物学机制 ,本实验先对 8个科 10种鸣禽的鸣唱行为进行了观察和录音 ,并借助声谱软件分析了每种鸣禽的鸣唱复杂性。鸣唱语句复杂性的评价指标包括 :短语总数、每个短语中所含的平均音节数及音节种类数... 为进一步揭示鸣禽鸣唱行为的神经生物学机制 ,本实验先对 8个科 10种鸣禽的鸣唱行为进行了观察和录音 ,并借助声谱软件分析了每种鸣禽的鸣唱复杂性。鸣唱语句复杂性的评价指标包括 :短语总数、每个短语中所含的平均音节数及音节种类数、所有短语的总音节数及音节种类数、最长短语的音节数及音节种类数。然后 ,测定了前脑三个鸣啭学习控制核团和一个与发声无关的视觉参考核团体积 ,分析了鸣唱语句复杂性和这些核团大小间的相关关系。结果表明 :1)HVC和HVC/Rt与 7种鸣唱语句复杂性指标无关 ;RA和RA/Rt与总音节种类数相关 ;AreaX与总音节数及音节种类数相关 ;2 )HVC/RA和HVC/X比值与多个鸣唱语句复杂性指标相关。结果提示 展开更多
关键词 RA 行为 神经核团 前脑 相关性 观察 比值 鸣禽 节数 种类
在线阅读 下载PDF
白腰文鸟发声行为的神经发育 被引量:13
10
作者 左明雪 曾少举 +1 位作者 彭卫民 张信文 《动物学报》 SCIE CAS CSCD 北大核心 2002年第1期50-57,共8页
本文研究了 5~ 15 0日龄雄性白腰文鸟 (Lonchurastriataswinhoei)不同年龄段的声谱变化以及这种变化的神经调制机制。结果如下 :(1)HVC、RA和AreaX三个发声核团的神经联系基本接近成年鸟的水平后 ,幼鸟才开始学习鸣叫 (约 45日龄 ) ;(2... 本文研究了 5~ 15 0日龄雄性白腰文鸟 (Lonchurastriataswinhoei)不同年龄段的声谱变化以及这种变化的神经调制机制。结果如下 :(1)HVC、RA和AreaX三个发声核团的神经联系基本接近成年鸟的水平后 ,幼鸟才开始学习鸣叫 (约 45日龄 ) ;(2 )HVC、RA和AreaX达到成年核团体积时 (约 80日龄 ) ,幼鸟才具有成年雄鸟的鸣叫模式 ;(3)发声控制核团的发育与核团间的神经支配有关 ,而基本不受鸣唱行为的影响 ,HVC、RA和AreaX的最快增长时间段各不相同 ,三个核团随年龄增长而呈现体积增长的显著变化 (one wayANOVA ,P <0 0 5 ) ,但各核团在任意两个时间段的体积差异并不都显著。结果提示 :发声行为产生的时间和发展与发声控制核团的发育、核团间的神经联系有关 ,最终的体积发育程度受内在遗传力的作用 。 展开更多
关键词 白腰文鸟 发声控制核团 神经联系 声谱 发声行为 神经发育 鸣禽
在线阅读 下载PDF
白腰文鸟发声行为的性别差异及其机制 被引量:7
11
作者 曾少举 左明雪 张信文 《Zoological Research》 CAS CSCD 北大核心 2001年第1期51-57,共7页
通过声谱分析 ,研究了 5~ 12 0日龄雌、雄白腰文鸟 (Lonchurastriataswinhoei)的声谱变化 ,及该时段 3个主要发声控制核团 (HVC、RA、AreaX)体积、睾丸 (睾酮 )的相应改变。结果如下 :① 45日龄以前 ,雌雄鸟只能发出简单鸣叫 (call) ,... 通过声谱分析 ,研究了 5~ 12 0日龄雌、雄白腰文鸟 (Lonchurastriataswinhoei)的声谱变化 ,及该时段 3个主要发声控制核团 (HVC、RA、AreaX)体积、睾丸 (睾酮 )的相应改变。结果如下 :① 45日龄以前 ,雌雄鸟只能发出简单鸣叫 (call) ,鸣叫声间无性别差异。 45日龄后 ,雄鸟开始学习鸣唱 (song) ,至 12 0日龄基本学会成年鸟的鸣唱语句。雌鸟基本不会鸣唱。②雄性HVC ,RA ,AreaX体积均比雌性大 2~ 6倍。 3个核团的大小发育不完全一致 ,各核团的快速生长期与鸣唱学习的主要时段 (6 0~ 12 0日龄 )不同步 ,说明核团的个体发育可能不完全受发声行为的影响。③睾丸的充分发育 (12 0日龄后 ) 展开更多
关键词 鸣禽 发声控制核团 性二型 声谱 睾酮 白腰文鸟 发声行为 性别差异
在线阅读 下载PDF
基于声谱图纹理特征的蛋鸡发声分类识别 被引量:15
12
作者 杜晓冬 滕光辉 +2 位作者 TOMAS Norton 王朝元 刘慕霖 《农业机械学报》 EI CAS CSCD 北大核心 2019年第9期215-220,共6页
为有效地辨别蛋鸡不同类型声音,了解蛋鸡的健康状况以及个体需求,提高生产效率的同时改善蛋鸡福利化养殖,提出一种基于声谱图纹理特征的蛋鸡发声分类识别方法。以海兰褐蛋鸡的声音为研究对象,将图像处理和声音处理技术相结合,由一维声... 为有效地辨别蛋鸡不同类型声音,了解蛋鸡的健康状况以及个体需求,提高生产效率的同时改善蛋鸡福利化养殖,提出一种基于声谱图纹理特征的蛋鸡发声分类识别方法。以海兰褐蛋鸡的声音为研究对象,将图像处理和声音处理技术相结合,由一维声音信号转换为二维图像信号,二维声谱图中的纹理特征呈现了蛋鸡声音的更多细节信息。最后,利用2DGabor滤波器提取蛋鸡发声声谱图中的声纹信息,并采用人工神经网络模型进行训练和分类识别。试验结果表明,本文方法平均灵敏度和平均精确度不低于92.0%,风机噪声识别灵敏度达99.3%,鸣叫声识别灵敏度最低,为76.0%。 展开更多
关键词 蛋鸡 声音识别 声谱图 GABOR滤波器
在线阅读 下载PDF
基于声谱图和SVM的煤矿瓦斯和煤尘爆炸识别方法 被引量:9
13
作者 孙继平 余星辰 王云泉 《煤炭科学技术》 CAS CSCD 北大核心 2023年第2期366-376,共11页
为提高煤矿瓦斯和煤尘爆炸感知准确率,提出了基于声谱图和SVM的煤矿瓦斯和煤尘爆炸感知方法:在煤矿井下重点监测区域安装矿用拾音器;实时监测煤矿井下设备工作声音及环境音;将采集到的声音提取由MFCC构成的声谱图,通过计算声谱图的灰度... 为提高煤矿瓦斯和煤尘爆炸感知准确率,提出了基于声谱图和SVM的煤矿瓦斯和煤尘爆炸感知方法:在煤矿井下重点监测区域安装矿用拾音器;实时监测煤矿井下设备工作声音及环境音;将采集到的声音提取由MFCC构成的声谱图,通过计算声谱图的灰度共生矩阵得到0°、45°、90°、135°的能量、熵、对比度、相关性,分别求其均值和标准差作为声谱图图像纹理特征,构成该声音的特征量,输入到SVM中建立煤矿瓦斯和煤尘爆炸声音识别模型;对待测声音同样提取其MFCC声谱图图像纹理特征,输入到训练好的识别模型中进行声音识别分类;并进行了试验验证。首先,提取了采掘工作面设备运行、瓦斯和煤尘爆炸等不同声音的MFCC特征值,分析了不同声音的MFCC特征值分布情况;提取不同声音的MFCC声谱图,分析了不同声音的声谱图的特征参数:能量、熵、对比度、相关性的均值和标准差,可见通过提取MFCC声谱图的灰度共生矩阵特征参数构成的特征量可有效表征声音信号;其次,将待测声音输入建立的识别模型中,完成识别分类。结果表明:所提方法的识别率达到95%,整体识别性能高于其他算法;最后,通过贝叶斯参数优化试验结果可知,优化后的SVM识别模型的召回率、识别率分别提高10%、3%,优于优化前的识别模型,能够满足煤矿瓦斯和煤尘爆炸感知和报警需求。 展开更多
关键词 瓦斯和煤尘爆炸 声谱图 灰度共生矩阵 声音识别 图像识别 支持向量机
在线阅读 下载PDF
10种鸣禽鸣唱复杂性与发声核团体积的聚类分析 被引量:1
14
作者 曾少举 卢凯 +3 位作者 华方圆 赵文龙 张信文 左明雪 《Zoological Research》 CAS CSCD 北大核心 2004年第6期522-526,共5页
选用捕自野外和人工繁殖的 10种雄性成鸟 (一年龄以上 )作为实验材料。当鸟适应环境后录音 ,用VS 99语音工作站软件进行声谱分析。鸣唱的复杂性采用语句短语总数、短语的音节数之和、短语的音节种类数之和、每个短语中所含的平均音节数... 选用捕自野外和人工繁殖的 10种雄性成鸟 (一年龄以上 )作为实验材料。当鸟适应环境后录音 ,用VS 99语音工作站软件进行声谱分析。鸣唱的复杂性采用语句短语总数、短语的音节数之和、短语的音节种类数之和、每个短语中所含的平均音节数、每个短语中所含的平均音节种类数、每种鸣禽最长短语的音节数和最长短语的音节种类数 7项指标表示。然后测定前脑的上纹状体腹侧尾端 (HVC)、古纹状体粗核 (RA)以及嗅叶的X核 (AreaX) 3个主要鸣唱控制核团的体积。最后分别对 10种鸣禽 3个发声控制核团体积和鸣唱复杂性的 7项指标进行聚类分析。 10种鸣禽的 7项指标值相差较大 ,即使同一科也如此。蒙古百灵的 3种核团体积比值均最大 ,其次是金丝雀和黄喉鹉。 10种鸣禽鸣唱语句复杂性的 7个指标和 3种核团体积聚类分析树形图显示的结果各不相同 ;仅RA和AreaX核团体积的树形图显示蒙古百灵远离其他 9种鸣禽 ,与现代分类学和DNA分析得到的进化树一致。 展开更多
关键词 纹状体 RA 团体 前脑 野外 比值 年龄 鸣禽 节数 聚类分析
在线阅读 下载PDF
基于肺音谱图Hough变换的喘鸣音识别方法 被引量:2
15
作者 张柯欣 龙哲 +1 位作者 王雪峰 赵宏 《东北大学学报(自然科学版)》 EI CAS CSCD 北大核心 2017年第11期1534-1537,共4页
提出了一种基于Hough变换从肺音的STFT光谱图中检测喘鸣音的方法.这一方法先对采集的数字肺音数据的STFT谱图进行ROI区域的截取,再利用Canny算子进行图像边缘检测,最后基于Hough变换数据的分析来自动识别喘鸣音.临床分析的数据包括临床... 提出了一种基于Hough变换从肺音的STFT光谱图中检测喘鸣音的方法.这一方法先对采集的数字肺音数据的STFT谱图进行ROI区域的截取,再利用Canny算子进行图像边缘检测,最后基于Hough变换数据的分析来自动识别喘鸣音.临床分析的数据包括临床采集的肺音和国际上共享的肺音文件.Hough变换检测方法在60例喘鸣音的检测中达到了87%的准确率,70例正常呼吸音的识别率达到74%. 展开更多
关键词 喘鸣音 HOUGH变换 STFT变换 光谱图 肺音识别
暂未订购
基于卷积神经网络的局部放电声音识别研究 被引量:13
16
作者 汪志成 王泽旺 +2 位作者 朱梦帆 纪荣焕 张斌 《电子测量技术》 北大核心 2023年第20期148-155,共8页
针对变压器与中压开关柜传统绝缘状态检测方法依赖人工的问题,本文基于可听声声音识别方法,通过将电力设备放电故障声音与正常工况声音、环境噪声进行混叠制作样本集,以模拟真实电力设备运行环境;对故障声音进行预处理后,使用声谱图提... 针对变压器与中压开关柜传统绝缘状态检测方法依赖人工的问题,本文基于可听声声音识别方法,通过将电力设备放电故障声音与正常工况声音、环境噪声进行混叠制作样本集,以模拟真实电力设备运行环境;对故障声音进行预处理后,使用声谱图提取声音的短时频率、能量分布等特征,构建声谱图数据集,结合改进的卷积神经网络实现对放电故障的检测;通过加入注意力机制,调节指数衰减学习率、数据集样本数量、音频采样率等方式进一步提升网络的精度,最终设计的网络模型识别准确率最高可达99.2%,相比其他检测方法优势明显,可实现对放电故障的在线检测。 展开更多
关键词 电力设备 局部放电 声谱图 声音识别 卷积神经网络
原文传递
基于改进残差网络的低空无人机声音识别方法 被引量:3
17
作者 薛珊 卫立炜 +2 位作者 顾宸瑜 孟宪宇 贾冰 《长春理工大学学报(自然科学版)》 2022年第4期100-107,共8页
“黑飞”无人机的泛滥给人们的生活带来了极大威胁。抵制“黑飞”无人机的首要任务是识别它。针对低空无人机识别问题,设计了一种基于改进残差网络的无人机声音识别方法。首先,采集低空无人机声音数据并进行预处理,建立数据集;其次,研... “黑飞”无人机的泛滥给人们的生活带来了极大威胁。抵制“黑飞”无人机的首要任务是识别它。针对低空无人机识别问题,设计了一种基于改进残差网络的无人机声音识别方法。首先,采集低空无人机声音数据并进行预处理,建立数据集;其次,研究并比较了梅尔频率倒谱系数(MFCC)、对数梅尔谱图(Log-Mel)及其一阶差分等音频特征;然后,设计了基于残差块改进的神经网络(IRBNet);最后,运用设计的IRBNet以及CNN-1、CNN-2、ResNet和IRBNet-1等基准网络对无人机进行识别实验。实验结果表明,IRBNet的识别准确率为97.45%,与其他基准网络相比,准确率更高;设计的IRBNet具有识别无人机的可行性和有效性。 展开更多
关键词 无人机 声音识别 特征提取 对数梅尔谱图 卷积神经网络
在线阅读 下载PDF
基于数学形态学的病理性附加肺音时频谱图分析 被引量:1
18
作者 张柯欣 王雪峰 +3 位作者 魏巍 龙哲 王春武 赵宏 《中华中医药学刊》 CAS 北大核心 2016年第7期1550-1552,I0001,共4页
对病理性附加肺音进行即时识别和分析,是监控呼吸系统病情和不断改进治疗方法的十分必要的手段。提出了典型病理性附加肺音进行STFT和小波变换后的特征频谱图像模型,并根据这一模型设计出病理性附加肺音识别方法。这一方法与国际上各种... 对病理性附加肺音进行即时识别和分析,是监控呼吸系统病情和不断改进治疗方法的十分必要的手段。提出了典型病理性附加肺音进行STFT和小波变换后的特征频谱图像模型,并根据这一模型设计出病理性附加肺音识别方法。这一方法与国际上各种基于学习或统计的病理性附加肺音识别方法比较,具有直观的优势和鲁棒的特点。 展开更多
关键词 肺音 水泡音 喘鸣音 数学形态学 小波 时频谱图
原文传递
基于域泛化的无监督机器设备异常声检测 被引量:6
19
作者 章林柯 许艳武 余永升 《海军工程大学学报》 CAS 北大核心 2023年第6期52-56,70,共6页
在基于声信号的机器设备异常检测中,机器运行时发出的声音可能会因机器运转状态的改变而发生变化,环境噪声也会改变场景中的声学特征,而传统的机器异常声音检测系统会因为声学特征的改变导致正常的声音被错误地标记为异常。针对这一问题... 在基于声信号的机器设备异常检测中,机器运行时发出的声音可能会因机器运转状态的改变而发生变化,环境噪声也会改变场景中的声学特征,而传统的机器异常声音检测系统会因为声学特征的改变导致正常的声音被错误地标记为异常。针对这一问题,提出了基于域泛化技术的无监督机器异常声音检测方法。首先,将声信号的对数梅尔谱图输入深度学习神经网络模型,结合域混合方法和坐标注意力机制模块,提高系统域泛化能力和异常识别性能;然后,在DCASE开源数据集上进行实验,与两种基线评估系统的AUC和pAUC得分进行对比。结果表明,所提出的方法在域泛化条件下的异常检测性能得到明显提升。 展开更多
关键词 无监督深度学习 异常声音检测 域泛化 对数梅尔谱图
在线阅读 下载PDF
心音频谱图在二尖瓣反流患者左心室功能监测中的作用
20
作者 张文俐 屈雪蒸 +1 位作者 宋蓓 张瑞岩 《心脑血管病防治》 2024年第1期9-12,20,共5页
目的探求使用可穿戴设备获取心音频谱图,观察不同程度二尖瓣反流(MR)患者心音频谱特征在左心室功能监测中的作用。方法入选2020年6月至2021年5月因心血管疾病入住上海交通大学医学院附属瑞金医院的102例MR患者,根据心脏超声MR反流束面积... 目的探求使用可穿戴设备获取心音频谱图,观察不同程度二尖瓣反流(MR)患者心音频谱特征在左心室功能监测中的作用。方法入选2020年6月至2021年5月因心血管疾病入住上海交通大学医学院附属瑞金医院的102例MR患者,根据心脏超声MR反流束面积/左心房面积比值超过20%将其分为轻度MR组72例和中度及以上MR组30例。基于心音频谱图对心音持续时间、最大声强、最大心音振幅进行分析,并与心脏超声测定的左心室射血分数(LVEF)进行相关性分析。结果心音频谱图第一心音持续时间与收缩期持续时间比值(S11-S12/S11-S21)与LVEF呈线性负相关(r=-0.535,P<0.01),S11-S12/S11-S21用于判定LVEF降低(LVEF<50%)曲线下面积为0.840(95%CI=0.756~0.924,P<0.01),截断值是55.50%,敏感度78.6%,特异度83.3%。结论心音频谱图提示,MR患者心脏收缩期第一心音持续时间占比与LVEF呈负相关性,在二尖瓣病患的心功能居家监测中存在潜在的应用价值。 展开更多
关键词 二尖瓣反流 心音频谱图 收缩期持续时间 左心室射血分数
暂未订购
上一页 1 2 3 下一页 到第
使用帮助 返回顶部