期刊文献+
共找到745篇文章
< 1 2 38 >
每页显示 20 50 100
Detection of Abnormal Cardiac Rhythms Using Feature Fusion Technique with Heart Sound Spectrograms
1
作者 Saif Ur Rehman Khan Zia Khan 《Journal of Bionic Engineering》 2025年第4期2030-2049,共20页
A heart attack disrupts the normal flow of blood to the heart muscle,potentially causing severe damage or death if not treated promptly.It can lead to long-term health complications,reduce quality of life,and signific... A heart attack disrupts the normal flow of blood to the heart muscle,potentially causing severe damage or death if not treated promptly.It can lead to long-term health complications,reduce quality of life,and significantly impact daily activities and overall well-being.Despite the growing popularity of deep learning,several drawbacks persist,such as complexity and the limitation of single-model learning.In this paper,we introduce a residual learning-based feature fusion technique to achieve high accuracy in differentiating abnormal cardiac rhythms heart sound.Combining MobileNet with DenseNet201 for feature fusion leverages MobileNet lightweight,efficient architecture with DenseNet201,dense connections,resulting in enhanced feature extraction and improved model performance with reduced computational cost.To further enhance the fusion,we employed residual learning to optimize the hierarchical features of heart abnormal sounds during training.The experimental results demonstrate that the proposed fusion method achieved an accuracy of 95.67%on the benchmark PhysioNet-2016 Spectrogram dataset.To further validate the performance,we applied it to the BreakHis dataset with a magnification level of 100X.The results indicate that the model maintains robust performance on the second dataset,achieving an accuracy of 96.55%.it highlights its consistent performance,making it a suitable for various applications. 展开更多
关键词 Cardiac rhythms Feature fusion Residual learning BreakHis spectrogram sound
在线阅读 下载PDF
基于改进EfficientNetV2的铝液泄漏声音识别与预警机制
2
作者 梁艳辉 温承杰 +2 位作者 闫军威 周璇 张洪涛 《华南理工大学学报(自然科学版)》 北大核心 2026年第2期38-51,共14页
铝液泄漏是导致铝加工深井铸造爆炸事故的直接原因。为解决实际工程中铝液泄漏判断方法滞后性强、准确率低和监测范围受限等问题,该文提出了基于改进EfficientNetV2的铝液泄漏声音识别方法。该方法通过声音特征判断铝液泄漏,以扩大监测... 铝液泄漏是导致铝加工深井铸造爆炸事故的直接原因。为解决实际工程中铝液泄漏判断方法滞后性强、准确率低和监测范围受限等问题,该文提出了基于改进EfficientNetV2的铝液泄漏声音识别方法。该方法通过声音特征判断铝液泄漏,以扩大监测范围;同时通过优化堆叠因子、引入高效通道注意力机制改进EfficientNetV2结构,以进一步提升识别速率与准确率。首先,利用拾音器采集不同场景下的声音数据,构建包含7类声音场景的声音数据库;然后,从声音信号中提取对数梅尔语谱图作为特征集,输入到改进的EfficientNetV2模型进行训练与验证,最终得到铝液泄漏声音识别模型。实验结果表明:改进的EfficientNetV2识别准确率达95.48%;与原始EfficientNetV2、ResNet、 RegNet及DenseNet相比,改进模型的浮点运算次数分别为上述模型的12.34%、8.64%、11.14%和10.80%,参数量分别为上述模型的11.37%、9.55%、15.95%和17.24%,CPU环境下每秒处理图像帧数分别为上述模型的6.53倍、6.14倍、4.41倍和8.00倍,说明改进的EfficientNetV2具有快速准确的识别性能。此外,基于该文提出的铝液泄漏声音识别方法,构建了铝液泄漏风险预警机制,并将该机制应用于铸造单元的实时风险监测。实践结果验证了所提识别方法与预警机制的有效性,可为铝加工深井铸造爆炸事故的预防提供技术参考。 展开更多
关键词 铝加工深井铸造 铝液泄漏 声音识别 风险预警 改进的EfficientNetV2 对数梅尔语谱图
在线阅读 下载PDF
抽水蓄能电动机励磁绕组匝间短路的环流特性分析
3
作者 李泽同 李永刚 +1 位作者 马明晗 齐鹏 《内蒙古大学学报(自然科学版)》 2026年第1期23-33,共11页
围绕抽水蓄能电动机励磁绕组早期匝间短路难以识别的难题,提出一种以定子并联支路环流特性为基础的方法。首先,从电磁场理论出发,在电动机运行条件下,建立并推导出励磁绕组匝间短路与定子同相支路环流谐波之间的定量关系式。然后,利用... 围绕抽水蓄能电动机励磁绕组早期匝间短路难以识别的难题,提出一种以定子并联支路环流特性为基础的方法。首先,从电磁场理论出发,在电动机运行条件下,建立并推导出励磁绕组匝间短路与定子同相支路环流谐波之间的定量关系式。然后,利用有限元软件建立抽水蓄能电动机的二维仿真模型,模拟正常、轻微及严重短路3种工况,并对气隙磁密和支路环流进行频谱分析。研究发现,匝间短路故障会在定子支路环流中激发出特定的分数次谐波,且这些特征谐波的幅值与故障严重程度呈显著正相关,同时故障磁极处的气隙磁密会相应减小。该方法通过监测环流中的特征谐波,可实现对电动机励磁绕组早期匝间短路的灵敏度、无扰性进行在线检测,为保障机组安全稳定运行提供了有效的技术手段。 展开更多
关键词 抽水蓄能电动机 励磁绕组 匝间短路 环流时频谱图
原文传递
基于DenseNet和迁移学习的声纹识别方法
4
作者 陈润强 王卫辰 +1 位作者 徐亚博 李烈 《现代电子技术》 北大核心 2026年第2期171-177,共7页
传统的声纹识别方法受环境噪声和个体变化等因素的影响,准确率难以进一步提升。为此,提出一种基于DenseNet和迁移学习的语谱图声纹识别方法,以进一步提高声纹识别系统的性能。使用DenseNet的声纹识别模型对源域语音进行训练;采用迁移学... 传统的声纹识别方法受环境噪声和个体变化等因素的影响,准确率难以进一步提升。为此,提出一种基于DenseNet和迁移学习的语谱图声纹识别方法,以进一步提高声纹识别系统的性能。使用DenseNet的声纹识别模型对源域语音进行训练;采用迁移学习将源域训练的DenseNet模型迁移到目标域训练数据;在目标域测试数据上验证迁移后模型的性能,并对比分析迁移前后DenseNet模型和ResNet模型的声纹识别性能。实验结果表明,与原始ResNet模型、DenseNet模型和经迁移学习的ResNet模型相比,经迁移学习的DenseNet模型的识别准确率分别提高了3.89%、6.67%和3.34%,且具有较快的收敛速度。 展开更多
关键词 声纹识别 DenseNet 迁移学习 语谱图 ResNet 语音信号处理
在线阅读 下载PDF
An Improved Forest Fire Detection Model Using Audio Classification and Machine Learning
5
作者 Kemahyanto Exaudi Deris Stiawan +4 位作者 Bhakti Yudho Suprapto Hanif Fakhrurroja MohdYazid Idris Tami AAlghamdi Rahmat Budiarto 《Computers, Materials & Continua》 2026年第1期2062-2085,共24页
Sudden wildfires cause significant global ecological damage.While satellite imagery has advanced early fire detection and mitigation,image-based systems face limitations including high false alarm rates,visual obstruc... Sudden wildfires cause significant global ecological damage.While satellite imagery has advanced early fire detection and mitigation,image-based systems face limitations including high false alarm rates,visual obstructions,and substantial computational demands,especially in complex forest terrains.To address these challenges,this study proposes a novel forest fire detection model utilizing audio classification and machine learning.We developed an audio-based pipeline using real-world environmental sound recordings.Sounds were converted into Mel-spectrograms and classified via a Convolutional Neural Network(CNN),enabling the capture of distinctive fire acoustic signatures(e.g.,crackling,roaring)that are minimally impacted by visual or weather conditions.Internet of Things(IoT)sound sensors were crucial for generating complex environmental parameters to optimize feature extraction.The CNN model achieved high performance in stratified 5-fold cross-validation(92.4%±1.6 accuracy,91.2%±1.8 F1-score)and on test data(94.93%accuracy,93.04%F1-score),with 98.44%precision and 88.32%recall,demonstrating reliability across environmental conditions.These results indicate that the audio-based approach not only improves detection reliability but also markedly reduces computational overhead compared to traditional image-based methods.The findings suggest that acoustic sensing integrated with machine learning offers a powerful,low-cost,and efficient solution for real-time forest fire monitoring in complex,dynamic environments. 展开更多
关键词 Audio classification convolutional neural network(CNN) environmental science forest fire detection machine learning spectrogram analysis IOT
在线阅读 下载PDF
基于LTE多普勒谱图的手势识别方法
6
作者 乔媛 苗苗 +2 位作者 贺伟杰 李金保 邬晶淼 《内蒙古大学学报(自然科学版)》 2026年第1期34-47,共14页
针对LTE信号在手势识别中因随机相位偏移导致手势特征提取困难的问题,提出一种基于多普勒谱图的手势识别方法。首先,计算不同天线间信道频率响应(CFR)的商,用来消除因载波频率偏移(CFO)和采样频率偏移(SFO)引起的随机相位偏移,并滤除高... 针对LTE信号在手势识别中因随机相位偏移导致手势特征提取困难的问题,提出一种基于多普勒谱图的手势识别方法。首先,计算不同天线间信道频率响应(CFR)的商,用来消除因载波频率偏移(CFO)和采样频率偏移(SFO)引起的随机相位偏移,并滤除高频噪声;提取信号的切线相位变化,计算由手势运动引起的信号传播路径变化。然后,采用连续小波变换(CWT)计算多普勒谱图,并通过一阶时间微分消除静态干扰。最后,利用卷积神经网络对不同手势的多普勒谱图进行分类,从而实现手势识别。实验结果表明,该方法能够有效抑制CFO和SFO引起的随机相位偏移,精准提取多普勒特征。在1.5 m距离的径向方向下,4个目标在两个场景下的平均识别准确率达到94%,展现出卓越的手势识别能力。 展开更多
关键词 LTE信号 多普勒谱图 卷积神经网络 手势识别
原文传递
Research on data diagnosis method of acoustic array sensor device based on spectrogram 被引量:4
7
作者 Xing Lei Hang Ji +3 位作者 Qiang Xu Ting Ye Shengfu Zhang Chengjun Huang 《Global Energy Interconnection》 EI CAS CSCD 2022年第4期418-433,共16页
Acoustic array sensor device for partial discharge detection is widely used in power equipment inspection with the advantages of non-contact and precise positioning compared with partial discharge detection methods su... Acoustic array sensor device for partial discharge detection is widely used in power equipment inspection with the advantages of non-contact and precise positioning compared with partial discharge detection methods such as ultrasonic method and pulse current method.However,due to the sensitivity of the acoustic array sensor and the influence of the equipment operation site interference,the acoustic array sensor device for partial discharge type diagnosis by phase resolved partial discharge(PRPD)map might occasionally presents incorrect results,thus affecting the power equipment operation and maintenance strategy.The acoustic array sensor detection device for power equipment developed in this paper applies the array design model of equal-area multi-arm spiral with machine learning fast fourier transform clean(FFT-CLEAN)sound source localization identification algorithm to avoid the interference factors in the noise acquisition system using a single microphone and conventional beam forming algorithm,improves the spatial resolution of the acoustic array sensor device,and proposes an acoustic array sensor device based on the acoustic spectrogram.The analysis and diagnosis method of discharge type of acoustic array sensor device can effectively reduce the system misjudgment caused by factors such as the resolution of the acoustic imaging device and the time domain pulse of the digital signal,and reduce the false alarm rate of the acoustic array sensor device.The proposed method is tested by selecting power cables as the object,and its effectiveness is proved by laboratory verification and field verification. 展开更多
关键词 Acoustic array sensor device Acoustic spectrogram Partial discharge Power equipment False alarm rate
在线阅读 下载PDF
User Recognition System Based on Spectrogram Image Conversion Using EMG Signals 被引量:2
8
作者 Jae Myung Kim Gyu Ho Choi +1 位作者 Min-Gu Kim Sung Bum Pan 《Computers, Materials & Continua》 SCIE EI 2022年第7期1213-1227,共15页
Recently,user recognitionmethods to authenticate personal identity has attracted significant attention especially with increased availability of various internet of things(IoT)services through fifth-generation technol... Recently,user recognitionmethods to authenticate personal identity has attracted significant attention especially with increased availability of various internet of things(IoT)services through fifth-generation technology(5G)based mobile devices.The EMG signals generated inside the body with unique individual characteristics are being studied as a part of nextgeneration user recognition methods.However,there is a limitation when applying EMG signals to user recognition systems as the same operation needs to be repeated while maintaining a constant strength of muscle over time.Hence,it is necessary to conduct research on multidimensional feature transformation that includes changes in frequency features over time.In this paper,we propose a user recognition system that applies EMG signals to the short-time fourier transform(STFT),and converts the signals into EMG spectrogram images while adjusting the time-frequency resolution to extract multidimensional features.The proposed system is composed of a data pre-processing and normalization process,spectrogram image conversion process,and final classification process.The experimental results revealed that the proposed EMG spectrogram image-based user recognition system has a 95.4%accuracy performance,which is 13%higher than the EMGsignal-based system.Such a user recognition accuracy improvement was achieved by using multidimensional features,in the time-frequency domain. 展开更多
关键词 EMG user recognition spectrogram CNN
在线阅读 下载PDF
Continuous frequency and phase spectrograms: a study of their 2D and 3D capabilities and application to musical signal analysis 被引量:1
9
作者 Laurent NAVARRO Guy COURBEBAISSE Jean-Charles PINOLI 《Journal of Zhejiang University-Science A(Applied Physics & Engineering)》 SCIE EI CAS CSCD 2008年第2期199-206,共8页
A new lighting and enlargement on phase spectrogram (PS) and frequency spectrogram (FS) is presented in this paper. These representations result from the coupling of power spectrogram and short time Fourier transf... A new lighting and enlargement on phase spectrogram (PS) and frequency spectrogram (FS) is presented in this paper. These representations result from the coupling of power spectrogram and short time Fourier transform (STFT). The main contribution is the construction of the 3D phase spectrogram (3DPS) and the 3D frequency spectrogram (3DFS). These new tools allow such specific test signals as small slope linear chirp, phase jump case of musical signal analysis is reported. The main objective is to and small frequency jump to be analyzed. An application detect small frequency and phase variations in order to characterize each type of sound attack without losing the amplitude information given by power spectrogram 展开更多
关键词 Frequency spectrogram (FS) Phase spectrogram (PS) Time-frequency representations Musical signals
在线阅读 下载PDF
Health Monitoring of Milling Tool Inserts Using CNN Architectures Trained by Vibration Spectrograms 被引量:2
10
作者 Sonali S.Patil Sujit S.Pardeshi Abhishek D.Patange 《Computer Modeling in Engineering & Sciences》 SCIE EI 2023年第7期177-199,共23页
In-process damage to a cutting tool degrades the surface􀀀nish of the job shaped by machining and causes a signi􀀀cant􀀀nancial loss.This stimulates the need for Tool Condition Monitoring(TCM)t... In-process damage to a cutting tool degrades the surface􀀀nish of the job shaped by machining and causes a signi􀀀cant􀀀nancial loss.This stimulates the need for Tool Condition Monitoring(TCM)to assist detection of failure before it extends to the worse phase.Machine Learning(ML)based TCM has been extensively explored in the last decade.However,most of the research is now directed toward Deep Learning(DL).The“Deep”formulation,hierarchical compositionality,distributed representation and end-to-end learning of Neural Nets need to be explored to create a generalized TCM framework to perform eciently in a high-noise environment of cross-domain machining.With this motivation,the design of dierent CNN(Convolutional Neural Network)architectures such as AlexNet,ResNet-50,LeNet-5,and VGG-16 is presented in this paper.Real-time spindle vibrations corresponding to healthy and various faulty con􀀀gurations of milling cutter were acquired.This data was transformed into the time-frequency domain and further processed by proposed architectures in graphical form,i.e.,spectrogram.The model is trained,tested,and validated considering dierent datasets and showcased promising results. 展开更多
关键词 Milling tool inserts health monitoring vibration spectrograms deep learning convolutional neural network
在线阅读 下载PDF
基于改进EfficientNet的煤矸音频分类方法 被引量:1
11
作者 宋庆军 焦守悦 +2 位作者 姜海燕 宋庆辉 郝文超 《工矿自动化》 北大核心 2025年第1期138-144,共7页
针对煤矸音频特征提取过程中设备运行噪声干扰严重及单一提取方法易导致信息丢失的问题,提出了一种基于改进EfficientNet的煤矸音频分类方法。采用基于Mel频谱和Gammatone倒谱系数的特征提取方法,有效捕捉矸石声音中的低频信息和细节特... 针对煤矸音频特征提取过程中设备运行噪声干扰严重及单一提取方法易导致信息丢失的问题,提出了一种基于改进EfficientNet的煤矸音频分类方法。采用基于Mel频谱和Gammatone倒谱系数的特征提取方法,有效捕捉矸石声音中的低频信息和细节特征。选择EfficientNet-B0作为骨干网络,并对其进行以下改进:将原有的多尺度通道注意力模块换成卷积块注意力模块,得到卷积注意力特征融合(CAFF)模块,通过网络自学习为不同空间位置的特征分配不同的权重信息,生成新的有效特征;在原有的MBConv模块中并行嵌入频域通道注意力(FCA)模块,加强特征图的表达能力,从而提高整个网络的性能。实验结果表明:引入CAFF模块后,模型准确率提升了0.61%,F1得分提升了0.52%,且模型收敛更快,说明CAFF模块有效提升了模型对频谱特征的捕捉能力;引入FCA模块后,准确率提升了0.45%,F1得分提升了0.62%,说明模块的叠加可以进一步提高模型的泛化能力和处理复杂特征的能力;改进EfficientNe模型的准确率为91.90%,标准差为0.108,显著优于同类对比音频分类模型。 展开更多
关键词 综放开采 煤矸识别 音频特征提取 EfficientNet Mel频谱特征 Gammatone倒谱系数 注意力机制
在线阅读 下载PDF
基于声纹脊线化和元学习的变压器故障诊断方法
12
作者 曲朝阳 刘谊豪 +2 位作者 曲楠 姜涛 徐晓宇 《电力系统保护与控制》 北大核心 2025年第13期163-174,共12页
针对变压器声纹检测中信号易受干扰且足量样本获取困难的问题,提出一种融合声纹脊线化与元学习的变压器声纹诊断方法。首先,基于脊线化特征处理,对优化后的变压器声纹时频谱图进行物理特征筛选与形态特征压缩。然后,搭建选择性编码器(se... 针对变压器声纹检测中信号易受干扰且足量样本获取困难的问题,提出一种融合声纹脊线化与元学习的变压器声纹诊断方法。首先,基于脊线化特征处理,对优化后的变压器声纹时频谱图进行物理特征筛选与形态特征压缩。然后,搭建选择性编码器(selective encoder, SE)加深时频与形态表征的关联度,提升模型收敛速度。最后,构造元学习网络评估变压器状态,并引入基于OD-Reptile的一阶梯度更新策略,通过内外循环优化机制增强参数泛化性,从而实现少样本、信息干扰条件下的高精度声纹诊断。相较于R-WDCNN、LSTM、CNN等传统深度学习信号诊断方法,该方法在低样本、高噪声环境下(SNR为-12 dB),收敛轮数减少10轮以上。同时,准确率分别提高6.35%,12.1%和16.93%。实验结果显示,所提方法在准确性、抗噪性、鲁棒性以及泛化性方面均有显著提升。 展开更多
关键词 声纹 小样本 脊线化 时频谱图 选择性编码 元学习 故障诊断
在线阅读 下载PDF
基于声谱图和卷积神经网络的磁暴图像识别
13
作者 李鸿宇 孙君嵩 +2 位作者 王丽 杨杰 赵雨馨 《空间科学学报》 北大核心 2025年第4期943-949,共7页
磁暴是一种重要的地磁场扰动类型,影响着通信、电力和航空航天等领域,因此对磁暴识别技术进行研究与创新有助于磁暴信息的应用.基于2010-2023年12个定点地磁观测水平分量分钟值数据,采用声谱图成像技术,运用VGG19卷积神经网络模型开展... 磁暴是一种重要的地磁场扰动类型,影响着通信、电力和航空航天等领域,因此对磁暴识别技术进行研究与创新有助于磁暴信息的应用.基于2010-2023年12个定点地磁观测水平分量分钟值数据,采用声谱图成像技术,运用VGG19卷积神经网络模型开展磁暴日和磁静日人工智能图像分类研究.实验结果显示,模型的准确率为97.41%,精确率为98.00%,召回率为96.80%,模型的预测能力较好,这表明声谱图成像技术在图像识别分类问题中具有较高的实用性,且VGG19卷积神经网络模型用于磁暴日和磁静日地磁分类的可行性较高,研究结果为磁暴预警与监测提供了新的思路. 展开更多
关键词 地磁 磁暴 声谱图 卷积神经网络 图像分类
在线阅读 下载PDF
基于WGAN-div和CNN的毫米波雷达人体动作识别方法
14
作者 李秋生 钟滢洁 《贵州师范大学学报(自然科学版)》 北大核心 2025年第5期23-33,共11页
针对基于毫米波雷达的人体动作识别数据集规模小导致的模型过拟合问题,提出一种基于Wasserstein散度生成对抗网络(WGAN-div)与卷积神经网络(CNN)的联合识别方法。首先,通过搭建毫米波雷达平台采集人体动作的雷达回波数据,经预处理生成... 针对基于毫米波雷达的人体动作识别数据集规模小导致的模型过拟合问题,提出一种基于Wasserstein散度生成对抗网络(WGAN-div)与卷积神经网络(CNN)的联合识别方法。首先,通过搭建毫米波雷达平台采集人体动作的雷达回波数据,经预处理生成微多普勒时频谱图;其次,利用WGAN-div模型学习时频谱图特征分布,生成高质量扩充数据以缓解数据不足;最后,构建浅层CNN模型实现动作分类。实验结果表明,所提方法在6类人体动作识别任务中准确率达98.17%,较深度卷积生成对抗网络(DCGAN)和带梯度惩罚的Wasserstein生成对抗网络(WGAN-gp)分别提升1.67%和0.87%。该方法通过取消Lipschitz约束优化生成质量,有效解决了小样本场景下的识别性能下降问题,为雷达数据增强与动作识别提供了一种新思路。 展开更多
关键词 毫米波雷达 人体动作识别 Wasserstein散度生成对抗网络 卷积神经网络 小样本学习 微多普勒时频谱 雷达数据增强
在线阅读 下载PDF
指纹图谱技术研究现状及其在固废领域的应用 被引量:2
15
作者 郑志敏 杨金忠 +4 位作者 迭庆杞 王菲 黄瑞潇 杨玉飞 黄启飞 《中国环境科学》 北大核心 2025年第8期4410-4422,共13页
为了解指纹图谱技术研究现状并明确其在固废领域的应用现状与前景,依托Web of Science(WOS)核心数据库对2010~2024年相关文献进行检索和分析.发文量分析得知指纹图谱技术依然保持着较高的研究热度,学科聚类分析得知其应用广泛并且近几... 为了解指纹图谱技术研究现状并明确其在固废领域的应用现状与前景,依托Web of Science(WOS)核心数据库对2010~2024年相关文献进行检索和分析.发文量分析得知指纹图谱技术依然保持着较高的研究热度,学科聚类分析得知其应用广泛并且近几年在环境领域研究热度也较高;关键词聚类发现研究热点集中在4个方面:Recognition(识别)、ChemoInformatics(化学信息学)、Deep Learning(深度学习)以及Model(模型).对固废领域文献进行关键词共现,得知其关于使用指纹图谱技术进行固废管理的研究较少,主要集中在后处理阶段.进行文献调研,对指纹图谱的数据获取技术、特征提取技术、特征呈现形式进行总结,提出固废领域应用新兴技术的可能性以及未来发展展望. 展开更多
关键词 指纹 图谱 固体废物 雷达图 配分曲线 CITESPACE
在线阅读 下载PDF
基于梅尔频谱图和残差神经网络的中国传统乐器声音分类方法研究
16
作者 陈彬 牛磊 《安徽水利水电职业技术学院学报》 2025年第5期38-44,共7页
文章提出一种结合梅尔频谱图与残差神经网络(ResNet)的方法用于中国传统乐器声音的分类。通过将乐器声音片段转换为梅尔频谱图,再利用ResNet对频谱图进行特征提取和分类训练,取得了良好的识别精度。利用频谱图在音频信号处理中的时频局... 文章提出一种结合梅尔频谱图与残差神经网络(ResNet)的方法用于中国传统乐器声音的分类。通过将乐器声音片段转换为梅尔频谱图,再利用ResNet对频谱图进行特征提取和分类训练,取得了良好的识别精度。利用频谱图在音频信号处理中的时频局部化特性以及ResNet在图像识别中的层次特征学习能力,提升了乐器声音分类的准确性和效率。该方法在验证集上的分类准确率达到了87%,具有良好的泛化能力。 展开更多
关键词 梅尔频谱图 残差神经网络 中国传统乐器 声音分类
在线阅读 下载PDF
基于VGGish-BiGRU的戏曲流派分类模型
17
作者 龚谊承 王晓雨 《电子设计工程》 2025年第17期7-11,17,共6页
音乐类型分类(MGC)任务有助于提升音乐产业的效益和用户体验,为了弘扬戏曲文化,戏曲流派的识别与分类是一项具有挑战性的任务。传统的音频分类算法依赖于手动提取特征,导致特征表达能力较弱,从而产生一定误差。该文将迁移学习与深度学... 音乐类型分类(MGC)任务有助于提升音乐产业的效益和用户体验,为了弘扬戏曲文化,戏曲流派的识别与分类是一项具有挑战性的任务。传统的音频分类算法依赖于手动提取特征,导致特征表达能力较弱,从而产生一定误差。该文将迁移学习与深度学习相结合,利用预训练VGGish模型提取戏曲特征结合BiGRU模型对所建立的戏曲数据集进行自动分类。实验结果表明,该方法在自建的包含8个剧种共1500首音乐的戏曲数据集上获得0.78的分类精度。为了验证模型的泛化能力,将所搭建的方法用于公共数据集GTZAN上,同样展现出较好的分类效果。与现有的基准模型相比,该方法在性能上提升3.5%~15%。 展开更多
关键词 戏曲分类 深度学习 频谱分析 VGGish网络 双向门控循环单元 迁移学习
在线阅读 下载PDF
基于层级化分数阶语谱图的帕金森病构音障碍分类 被引量:1
18
作者 薛在发 卢辉斌 +1 位作者 林丽琴 张涛 《中国生物医学工程学报》 北大核心 2025年第1期21-33,共13页
构音障碍是帕金森病的早期症状之一。现有的基于深度学习的帕金森病构音障碍分类大多根据语谱图和卷积神经网络分析,但两者分别存在角度单一和感受野受限等不足,导致信息提取不充分。本研究提出了一种基于层级化分数阶语谱图的帕金森病... 构音障碍是帕金森病的早期症状之一。现有的基于深度学习的帕金森病构音障碍分类大多根据语谱图和卷积神经网络分析,但两者分别存在角度单一和感受野受限等不足,导致信息提取不充分。本研究提出了一种基于层级化分数阶语谱图的帕金森病分类方法。首先,通过增加角度旋转因子,将构音信号转化为分数阶语谱图以增强从不同角度提取能量信息的能力;其次,将Swin Transformer网络在ImageNet上预训练的参数进行迁移和微调以解决数据量小的弊端;最后,结合层级化结构和基于偏移窗口的自注意力机制扩大感受野和实现多尺度信息融合,从而有效提升帕金森病分类精度。在Database-1(240个样本,由伊斯坦布尔大学医学院神经内科采集)和Database-2(1404个样本,由唐山工人医院和开滦精神卫生中心合作采集)上的验证结果表明,该方法具有良好的稳定性,且在两个数据集上的准确率分别达到了97.80%和98.75%,性能均优于所对比的先进方法。本研究所提出方法为帕金森病构音障碍分析提供了新的视角。 展开更多
关键词 帕金森病 构音障碍 分数阶语谱图 参数迁移 层级化结构
暂未订购
基于超声信号的金属化膜电容器老化状态评估方法 被引量:1
19
作者 许馨愉 汲胜昌 +2 位作者 郑琳子 闫昕旖 祝令瑜 《电工技术学报》 北大核心 2025年第5期1652-1661,共10页
金属化膜电容器(MFC)是模块化多电平变流器(MMC)中较为薄弱的部件之一,准确地评估其健康状态对柔性直流输电系统的安全稳定运行意义重大。该文对MFC超声信号的局部放电相位分布(PRPD)谱图进行分析,提出一种基于健康指数公式的老化状态... 金属化膜电容器(MFC)是模块化多电平变流器(MMC)中较为薄弱的部件之一,准确地评估其健康状态对柔性直流输电系统的安全稳定运行意义重大。该文对MFC超声信号的局部放电相位分布(PRPD)谱图进行分析,提出一种基于健康指数公式的老化状态评估方法。首先,通过搭建超声监测试验平台采集声信号,分析MFC在老化过程中的失效机理;其次,基于自愈放电和局部放电比例的显著变化,探讨老化对PRPD谱图中放电信号分布的影响;最后在此基础上,构建基于健康指数公式的线性回归模型进行老化状态评估,并通过试验验证所提方法与模型的可行性和有效性。结果表明,与现有方法相比,该方法只需采集超声信号的PRPD谱图信息即可评估MFC当前的老化程度,解决了传统方法会对系统回路造成影响、抗干扰能力弱且监测精度较低的问题,为MMC的状态监测和寿命评估提供了新的手段,并为MFC非电量状态监测方法的研究奠定了基础。 展开更多
关键词 金属化膜电容器 超声法 局部放电相位分布(PRPD)谱图 老化状态评估
在线阅读 下载PDF
基于改进MobileNetV3的笼养蛋鸡声音分类识别方法 被引量:3
20
作者 衡一帆 盛哲雅 +3 位作者 严煜 谷月 周昊博 王树才 《农业机械学报》 北大核心 2025年第4期427-435,共9页
为实现笼养蛋鸡声音的准确分类,实现蛋鸡健康、情绪、生产状态等信息的智能化、非接触式检测,提出了一种基于改进MobileNetV3的笼养蛋鸡声音分类识别方法。以欣华二号蛋鸡为研究对象,采集蛋鸡在笼养条件下发出的热应激声、惊吓声、产蛋... 为实现笼养蛋鸡声音的准确分类,实现蛋鸡健康、情绪、生产状态等信息的智能化、非接触式检测,提出了一种基于改进MobileNetV3的笼养蛋鸡声音分类识别方法。以欣华二号蛋鸡为研究对象,采集蛋鸡在笼养条件下发出的热应激声、惊吓声、产蛋声以及鸣唱声,经过声音预处理将一维声音信号转化为三维梅尔频谱图,建立了包括8541幅梅尔频谱图的蛋鸡声音数据集。通过在MobileNetV3中引入高效通道注意力(Efficient channel attention,ECA)模块,提高了笼养蛋鸡声音分类准确率。试验结果表明,MobileNetV3-ECA模型准确率、召回率、精确率以及F1分数分别达到95.25%、95.16%、95.02%、95.08%,相比原始模型分别提高1.99、2.08、2.00、2.04个百分点。通过与分别引入坐标注意力(Coordinate attention,CA)、卷积块注意力模块(Convolutional block attention module,CBAM)的模型对比,引入ECA模块后模型准确率分别提高2.11、2.03个百分点,其他指标同样有更明显的提高。与ShuffleNetV2、DesNet121和EfficientNetV2模型相比,MobileNetV3-ECA准确率分别提高1.99、2.03、2.50个百分点。本文提出的基于MobileNetV3-ECA的蛋鸡声音分类识别方法,能够有效且准确地实现对包括热应激声在内的不同种类蛋鸡声音分类识别,为蛋鸡规模化养殖中的自动化、智能化声音检测提供了算法支持,为禽舍巡检机器人功能优化提供了参考,同时为规模化笼养蛋鸡热应激预警开辟了思路。 展开更多
关键词 笼养蛋鸡 声音分类 MobileNetV3 高效通道注意力 梅尔频谱图 卷积神经网络
在线阅读 下载PDF
上一页 1 2 38 下一页 到第
使用帮助 返回顶部