期刊文献+
共找到1,623篇文章
< 1 2 82 >
每页显示 20 50 100
孤独症访谈场景下融入角色信息的说话人日志方法
1
作者 王康月 程铭 +2 位作者 谢奕香 邹小兵 李明 《计算机科学》 北大核心 2025年第2期231-241,共11页
说话人日志技术在智能语音转写领域扮演着关键的角色,其核心任务是按照说话人的身份对多人音频进行分割和聚类,以便更好地对音频内容及转写文本进行整理。在医疗访谈领域,说话人日志技术是自动化评估的前置条件。医疗交互对话领域天然... 说话人日志技术在智能语音转写领域扮演着关键的角色,其核心任务是按照说话人的身份对多人音频进行分割和聚类,以便更好地对音频内容及转写文本进行整理。在医疗访谈领域,说话人日志技术是自动化评估的前置条件。医疗交互对话领域天然存在角色信息,以孤独症辅助诊断为例,典型的情境包括医生、家长和接受诊断的孩子这3种明确定义的角色。但在实际对话中,角色和说话人之间的对应关系可能并非一一对应。例如,在孤独症诊断过程中,每次会话仅涉及一个孩子,而医生或家长的数量却是不确定的。文中认为语音片段中隐含的角色信息与声纹信息可以进行有效的互补,进而降低错误率,故提出一种将角色信息引入序列到序列目标说话人语音活动检测(Seq2Seq-TSVAD)中的方法。在CPEP-3数据集上,说话人日志的错误率(DER)为20.61%,相比Seq2Seq-TSVAD方法降低了9.8%,相比模块化说话人日志方法降低了19.3%,表明孤独症访谈场景下角色信息在提升说话人日志性能方面具有明显的作用。 展开更多
关键词 说话人日志 角色分类 特定说话人语音活动检测 声纹特征提取 孤独症谱系障碍
在线阅读 下载PDF
基于改进LightGBM的鸭蛋裂纹检测方法
2
作者 黄松杰 魏云龙 +2 位作者 张龙基 俞英健 石伟杰 《声学技术》 北大核心 2025年第6期1006-1015,共10页
鸭蛋蛋壳裂纹敲击声检测是禽蛋加工业的重要环节。文章针对鸭蛋蛋壳厚度不一致导致的敲击声检测准确率低且检测速度慢等问题,提出了一种对敲击响应声信号进行多特征提取和利用改进灰狼优化(improved grey wolf optimization, IGWO)算法... 鸭蛋蛋壳裂纹敲击声检测是禽蛋加工业的重要环节。文章针对鸭蛋蛋壳厚度不一致导致的敲击声检测准确率低且检测速度慢等问题,提出了一种对敲击响应声信号进行多特征提取和利用改进灰狼优化(improved grey wolf optimization, IGWO)算法优化轻量级梯度提升机(light gradient boosting machine, LightGBM)分类模型的鸭蛋裂纹检测方法。该方法利用主成分分析对鸭蛋裂纹信号的时频域特征进行筛选,提取8维特征向量,通过IGWO算法对LightGBM分类模型进行参数优化,并测试其分类性能。实验结果表明,在采集的鸭蛋裂纹数据集上,采用筛选后的特征输入与全特征输入相比,检测速度是后者的2倍,IGWO-LightGBM对鸭蛋裂纹的识别准确率达到96.64%,相比于支持向量机,准确率提高了15.02个百分点。该方法在识别准确率和识别速度方面均有显著提升,适用于工业流水线检测。 展开更多
关键词 裂纹检测 声学信号 主成分分析 灰狼算法 LightGBM算法
在线阅读 下载PDF
基于改进ViT的语音情感识别
3
作者 汪珙 詹泳 《计算机与数字工程》 2025年第10期2837-2841,共5页
语音情感识别是提高人机交互体验的关键之一。当前的语音情感识别方法识别率仍然偏低,需进一步提升。为了满足语音情感识别的需求,论文在原有ViT模型的基础上,使用梅尔声谱图作为输入,采用重叠的横向滑动分块机制进行输入适配,并引入了... 语音情感识别是提高人机交互体验的关键之一。当前的语音情感识别方法识别率仍然偏低,需进一步提升。为了满足语音情感识别的需求,论文在原有ViT模型的基础上,使用梅尔声谱图作为输入,采用重叠的横向滑动分块机制进行输入适配,并引入了卷积混合注意力机制在获取全局信息的同时避免损失局部重要特征。在RAVDESS数据集上进行了实验,使用改进ViT模型的识别率为86.11%,高于其他模型,相对于原ViT模型提升了2.78%。实验结果表明,改进ViT模型对语音情感识别具有更好的识别效果。 展开更多
关键词 语音情感识别 语音分类 注意力机制 VIT 卷积
在线阅读 下载PDF
嵌入式翻译器语音识别系统误差自动检测方法
4
作者 贾梦琦 《自动化技术与应用》 2025年第4期103-106,129,共5页
嵌入式翻译器语音识别系统识别过程中受到多种因素影响,产生不同的误差结果,影响后续的语音控制,提出嵌入式翻译器语音识别系统的误差自动检测方法。通过分帧加窗理论,预处理嵌入式翻译器语音信息;依据语音信息选择语言与声学模型,设定... 嵌入式翻译器语音识别系统识别过程中受到多种因素影响,产生不同的误差结果,影响后续的语音控制,提出嵌入式翻译器语音识别系统的误差自动检测方法。通过分帧加窗理论,预处理嵌入式翻译器语音信息;依据语音信息选择语言与声学模型,设定语音信息特征提取流程,预测误差信息的特征指数,提取语音信息特征;采用注意力机制,建立共享参数函数,在划定区域内自动检测识别系统误差,实现误差自动检测。实验结果表明,以“five”语句为翻译识别对象,分别在噪声因素为50 dB和150 dB条件下检测误差,所提方法能够准确地对误差信号进行识别。 展开更多
关键词 误差检测 嵌入式翻译器 语音识别系统 分帧加窗 注意力机制
在线阅读 下载PDF
智能语音助手用户的持续使用行为影响因素研究——基于“认知-情感-意动”的理论视角 被引量:1
5
作者 杨秀丽 《信息与电脑》 2025年第14期160-162,共3页
探究智能语音助手用户持续使用行为的影响因素及其作用机理,以期揭示智能语音助手用户持续使用行为背后的深层次原因,对于智能语音助手企业在当前激烈竞争中保持优势具有重要意义。在“认知-情感-意动”理论框架基础上,构建智能语音助... 探究智能语音助手用户持续使用行为的影响因素及其作用机理,以期揭示智能语音助手用户持续使用行为背后的深层次原因,对于智能语音助手企业在当前激烈竞争中保持优势具有重要意义。在“认知-情感-意动”理论框架基础上,构建智能语音助手用户持续使用意向影响机理模型,通过问卷调查收集400份有效样本数据,采用结构方程模型进行假设检验与实证分析。研究结果表明,实用价值、享乐价值和社会存在正向影响技术信任,感知隐私风险负向影响技术信任,而象征价值对技术信任没有显著影响,技术信任正向影响持续使用意图。 展开更多
关键词 智能语音助手 使用行为影响因素 “认知-情感-意动”理论 技术信任
在线阅读 下载PDF
基于减小高频混响和RF-DRSN-EMA的声音事件分类方法
6
作者 曹毅 王彦雯 +2 位作者 李杰 郑植 孙浩 《华南理工大学学报(自然科学版)》 北大核心 2025年第7期70-79,共10页
针对现有声音事件分类方法分类准确率不高、泛化能力不强的问题,该文提出了一种基于减小高频混响和多尺度注意力的频域残差收缩网络(RF-DRSN-EMA)的声音事件分类方法。首先,根据减小声音混响的原理,提出了一种减小高频混响的方法,该方... 针对现有声音事件分类方法分类准确率不高、泛化能力不强的问题,该文提出了一种基于减小高频混响和多尺度注意力的频域残差收缩网络(RF-DRSN-EMA)的声音事件分类方法。首先,根据减小声音混响的原理,提出了一种减小高频混响的方法,该方法仅减小分离出音频中的高频段混响而保留其余频段的关键频率信息,以便在提升语音清晰度的同时尽可能地减小语音失真的影响。然后,以深度残差收缩网络为基础网络,结合改进的频域自校正算法和多尺度注意力模块,提出了多尺度注意力的频域残差收缩网络RF-DRSN-EMA;该网络采用RF自校正模块(其内部的长短距离残差结构能缓解特征坍塌),以实现频域信息的高效采集,并在单元的输出采用多尺度注意力模块,进一步关注单元在输出层的有效信息,以强化模型的表征能力。最后,基于数据集ESC-10、UrbanSound8K和DCASE2020 Task 1A开展了声音事件分类实验。结果表明:该文提出的减小高频混响的语音增强方法能有针对性地减小高频段混响等背景噪音的影响和消除冗余特征,音质损伤较小,从而具有更好的分类性能;RF-DRSN-EMA实现了网络中频域的典型特征去噪以及信息的高效采集,在3个数据集上的最佳分类准确率分别达到98.00%、93.42%、72.80%,从而验证了该方法的有效性和泛化性。 展开更多
关键词 声音事件分类 减小高频混响 频域残差收缩网络 多尺度注意力 语音增强
在线阅读 下载PDF
基于音节类型识别的自动语音分割算法
7
作者 孙林嘉 秦磊 +1 位作者 康美金 王莹琳 《计算机应用》 北大核心 2025年第6期2034-2042,共9页
基于边界检测的方法侧重利用时域和频域的突变来将语音数据切分成音节单元,较少关注语言知识在分割中发挥的作用。同时,此类方法通常需要设置各项参数以获得满意的分割结果,致使这些方法在大数据量和跨语言的环境下存在稳定性差、调整... 基于边界检测的方法侧重利用时域和频域的突变来将语音数据切分成音节单元,较少关注语言知识在分割中发挥的作用。同时,此类方法通常需要设置各项参数以获得满意的分割结果,致使这些方法在大数据量和跨语言的环境下存在稳定性差、调整参数难和泛化能力弱的缺点。针对上述问题,提出一种基于音节类型识别的自动语音分割算法。该算法的特点在于所要识别的对象是语音数据中的音节类型,而非具体的音节内容。首先,利用语言学研究成果和音节构成规律获得不同语言在自然发音下较通用的音节类型;其次,采用经典的高斯混合模型(GMM)和隐马尔可夫模型(HMM)为每种音节类型构建声学模型;另外,为了更好地描述音节属性,提出一种基于多频带分析和显著信息融合的特征提取通道;最后,在所识别音节类型序列的基础上,使用维特比算法确定对应音节起止点的语音帧。在实验阶段利用3种常见语言的语音数据训练得到音节类型的声学模型,再在6种语言和方言上进行识别实验。实验结果表明,所提算法的平均识别准确率至少达到了91.93%;与使用梅尔频率倒谱系数(MFCC)相比,使用所提特征获得的平均识别准确率至少提升了27.16个百分点;当容差阈值为20 ms时,在6种语言和方言上依然可以取得90.70%以上的平均分割准确率;相较于近年来有代表性的4种算法,所提算法的平均分割准确率至少提升了5.73个百分点。以上说明所提算法具有较强的泛化能力、较好的稳定性和较高的分割准确率。 展开更多
关键词 语音分割 音节类型 声学模型 多频带分析 特征融合
在线阅读 下载PDF
用于金属管材超声波焊接X射线检测的图像运动去模糊研究
8
作者 林珍珠 林伟 《核电子学与探测技术》 北大核心 2025年第12期1873-1877,共5页
针对金属管材焊接质量X射线检测中出现的不同程度的X光图像运动模糊问题,提出一种多参数融合引导的深度学习去模糊方法。该方法首先通过物理参数编码器对X光图像的成像参数进行特征提取;然后在端到端网络的各级特征图中,以特征级线性调... 针对金属管材焊接质量X射线检测中出现的不同程度的X光图像运动模糊问题,提出一种多参数融合引导的深度学习去模糊方法。该方法首先通过物理参数编码器对X光图像的成像参数进行特征提取;然后在端到端网络的各级特征图中,以特征级线性调制(Feature-wise Linear Modulation,FiLM)方式融合多成像参数,并在瓶颈层增加自注意力机制以抑制振铃伪影。实验结果表明:相比传统去模糊方法及纯数据驱动网络,本方法在峰值信噪比(Peak Signal-to-Noise Ratio,PSNR)上提升4~5 dB,在结构相似性指数(Structural Similarity Index,SSIM)上提升0.1~0.12,在X光图像运动模糊去除效果上表现更优。 展开更多
关键词 X射线检测 X光图像 运动去模糊 端到端深度学习
在线阅读 下载PDF
实用语音情感的特征分析与识别的研究 被引量:35
9
作者 黄程韦 赵艳 +2 位作者 金赟 于寅骅 赵力 《电子与信息学报》 EI CSCD 北大核心 2011年第1期112-116,共5页
该文针对语音情感识别在实际中的应用,研究了烦躁等实用语音情感的分析与识别。通过计算机游戏诱发的方式采集了高自然度的语音情感数据,提取了74种情感特征,分析了韵律特征、音质特征与情感维度之间的关系,对烦躁等实用语音情感的声学... 该文针对语音情感识别在实际中的应用,研究了烦躁等实用语音情感的分析与识别。通过计算机游戏诱发的方式采集了高自然度的语音情感数据,提取了74种情感特征,分析了韵律特征、音质特征与情感维度之间的关系,对烦躁等实用语音情感的声学特征进行了评价与选择,提出了针对实际应用环境的可拒判的实用语音情感识别方法。实验结果表明,文中采用的语音情感特征,能较好识别烦躁等实用语音情感,平均识别率达到75%以上。可拒判的实用语音情感识别方法,对模糊的和未知的情感类别的分类进行了合理的决策,在语音情感的实际应用中具有重要的意义。 展开更多
关键词 语音识别 实用语音情感 韵律特征 音质特征 拒判方法
在线阅读 下载PDF
基于Speech SDK的语音控制应用程序的设计与实现 被引量:40
10
作者 李禹材 左友东 +1 位作者 郑秀清 王玲 《计算机应用》 CSCD 北大核心 2004年第6期114-116,共3页
分析了微软SpeechSDK5.1里语音应用程序接口(SAPI)的结构和工作原理,提出了语音控制应用程序的设计方法,并以"Z+Z智能教学平台的语音识别接口"的设计为例,展示了这类系统的主框架和关键技术。
关键词 语音识别 COM SAPI 语音控制
在线阅读 下载PDF
高压水射流反射声信号特征值提取方法的研究 被引量:13
11
作者 杨洪涛 王从东 +2 位作者 张东速 李梦 孙玉玲 《中国机械工程》 EI CAS CSCD 北大核心 2010年第20期2434-2437,2467,共5页
为了实现高压水射流靶物反射声特征值的有效提取,应用小波降噪方法和模极大值法分别获取对应靶物材质与几何形状参数声信号特征值。介绍了其基本原理,编制了相应的特征值提取程序。利用前混合磨料射流设备、传声器和高速数据采集设备等... 为了实现高压水射流靶物反射声特征值的有效提取,应用小波降噪方法和模极大值法分别获取对应靶物材质与几何形状参数声信号特征值。介绍了其基本原理,编制了相应的特征值提取程序。利用前混合磨料射流设备、传声器和高速数据采集设备等建立了反射声信号采集的试验装置,进行了对应模拟防步兵地雷、泥地和石块水射流探测试验并采集了数据,应用上述程序对数据进行处理,优化选用小波参数。试验结果显示:应用小波降噪的方法可以有效地将靶物反射声信号与水射流声信号、环境声信号分离,获得对应不同材料靶物的声信号特征值;利用模极大值法可以有效地获得对应不同几何形状参数靶物边界的声信号突变点特征值。这些特征值可以用于后续的靶物材质与几何形状参数的识别。 展开更多
关键词 高压水射流 反射声信号 靶物材质 几何形状参数 小波降噪 模极大值法
在线阅读 下载PDF
面向语音情感识别的语谱图特征提取算法 被引量:18
12
作者 陶华伟 査诚 +3 位作者 梁瑞宇 张昕然 赵力 王青云 《东南大学学报(自然科学版)》 EI CAS CSCD 北大核心 2015年第5期817-821,共5页
为研究信号相关性在语音情感识别中的作用,提出了一种面向语音情感识别的语谱图特征提取算法.首先,对语谱图进行处理,得到归一化后的语谱图灰度图像;然后,计算不同尺度、不同方向的Gabor图谱,并采用局部二值模式提取Gabor图谱的纹理特征... 为研究信号相关性在语音情感识别中的作用,提出了一种面向语音情感识别的语谱图特征提取算法.首先,对语谱图进行处理,得到归一化后的语谱图灰度图像;然后,计算不同尺度、不同方向的Gabor图谱,并采用局部二值模式提取Gabor图谱的纹理特征;最后,将不同尺度、不同方向Gabor图谱提取到的局部二值模式特征进行级联,作为一种新的语音情感特征进行情感识别.柏林库(EMO-DB)及FAU Ai Bo库上的实验结果表明:与已有的韵律、频域、音质特征相比,所提特征的识别率提升3%以上;与声学特征融合后,所提特征的识别率较早期声学特征至少提高5%.因此,利用这种新的语音情感特征可以有效识别不同种类的情感语音. 展开更多
关键词 情感识别 语谱图 图像纹理特征 局部二值模式
在线阅读 下载PDF
基于RNN-RBM语言模型的语音识别研究 被引量:29
13
作者 黎亚雄 张坚强 +1 位作者 潘登 胡惮 《计算机研究与发展》 EI CSCD 北大核心 2014年第9期1936-1944,共9页
近年来深度学习兴起,其在语言模型领域有着不错的成效,如受限玻尔兹曼机(restricted Boltzmann machine,RBM)语言模型等.不同于N-gram语言模型,这些根植于神经网络的语言模型可以将词序列映射到连续空间来评估下一词出现的概率,以解决... 近年来深度学习兴起,其在语言模型领域有着不错的成效,如受限玻尔兹曼机(restricted Boltzmann machine,RBM)语言模型等.不同于N-gram语言模型,这些根植于神经网络的语言模型可以将词序列映射到连续空间来评估下一词出现的概率,以解决数据稀疏的问题.此外,也有学者使用递归神经网络来建构语言模型,期望由递归的方式充分利用所有上文信息来预测下一词,进而有效处理长距离语言约束.根据递归受限玻尔兹曼机神经网络(recurrent neural network-restricted Boltzmann machine,RNN-RBM)的基础来捕捉长距离信息;另外,也探讨了根据语言中语句的特性来动态地调整语言模型.实验结果显示,使用RNN-RBM语言模型对于大词汇连续语音识别的效能有相当程度的提升. 展开更多
关键词 语音识别 语言模型 神经网络 递归神经网络-受限玻尔兹曼机 关联信息
在线阅读 下载PDF
基于声音多特征贝叶斯网络融合的话者识别研究 被引量:14
14
作者 朱坚民 张雷 +1 位作者 翟东婷 雷静桃 《仪器仪表学报》 EI CAS CSCD 北大核心 2013年第9期2058-2067,共10页
针对基于语音单一特征提取方法所存在的话者识别准确率较低的问题,提出将话者语音中反映人耳听觉感知特性的MFCC特征和接近心理声学临界频带的1/3倍频程(1/3 octave)特征作为话者声音的特征参数,设计话者识别的贝叶斯网络,融合2种声音... 针对基于语音单一特征提取方法所存在的话者识别准确率较低的问题,提出将话者语音中反映人耳听觉感知特性的MFCC特征和接近心理声学临界频带的1/3倍频程(1/3 octave)特征作为话者声音的特征参数,设计话者识别的贝叶斯网络,融合2种声音特征参数,通过贝叶斯网络推理实现话者识别。贝叶斯网络通过学习过程确定已注册话者各声音特征的条件概率。进行话者识别时,贝叶斯网络利用贝叶斯定理及条件独立性假设融合待识别话者声音的MFCC特征和1/3倍频程特征,计算每个已注册话者对输入语音特征矢量的后验概率,根据后验概率的大小实现待识别话者的推断。话者识别实验结果表明:提出的基于声音多特征贝叶斯网络融合的话者识别方法可行有效,识别正确率达到100%。 展开更多
关键词 MFCC特征 1 3倍频程特征 贝叶斯网络 后验概率 话者识别 融合
在线阅读 下载PDF
语音信号中的情感特征分析和识别的研究 被引量:50
15
作者 赵力 将春辉 +1 位作者 邹采荣 吴镇扬 《电子学报》 EI CAS CSCD 北大核心 2004年第4期606-609,共4页
提出了一种利用全局和时序结构的组合特征以及MMD进行情感特征识别的方法.对于从10名话者中 搜集的带有欢快,愤怒,惊奇和悲伤4种情感的1000句语句,利用提出的新的识别方法获得了94%的平均情感识别 率.
关键词 语音信号 情感特征分析 MMD 情感识别
在线阅读 下载PDF
一种基于受限玻尔兹曼机的说话人特征提取算法 被引量:19
16
作者 酆勇 熊庆宇 +1 位作者 石为人 曹俊华 《仪器仪表学报》 EI CAS CSCD 北大核心 2016年第2期256-262,共7页
基于总体空间差异模型的身份认证矢量(即i-vector)已经在说话人识别任务中得到了广泛应用。本文提出了一种基于受限玻尔兹曼机(RBM)的说话人特征向量提取方法来替代总体差异建模的特征提取方法。该方法通过训练得到RBM的模型参数,之后... 基于总体空间差异模型的身份认证矢量(即i-vector)已经在说话人识别任务中得到了广泛应用。本文提出了一种基于受限玻尔兹曼机(RBM)的说话人特征向量提取方法来替代总体差异建模的特征提取方法。该方法通过训练得到RBM的模型参数,之后利用隐层输出来表征输入语音超向量的说话人信息。文中比较了不同结构和模块(包括构建RBM的2种单元分布、线性判别分析等)对说话人确认性能的影响。所提方法作为一种新的i-vector特征表示方法,在NIST SRE 2008上取得了和ivector说话人基线系统相当的性能。通过与i-vector基线系统进行融合,系统性能进一步提升。在NIST SRE 2008女性电话语音测试集和男性电话语音测试集上的等错误率分别降至6.83%和4.73%。 展开更多
关键词 说话人确认 身份认证矢量 深度学习 受限玻尔兹曼机 线性判别分析
在线阅读 下载PDF
普通话语音情感识别的特征选择技术 被引量:14
17
作者 谢波 陈岭 +1 位作者 陈根才 陈纯 《浙江大学学报(工学版)》 EI CAS CSCD 北大核心 2007年第11期1816-1822,共7页
针对情感声学特征在语音情感识别中的重要性问题,运用优先选择、序列前向、序列后向和逐步判别分析进行了特征选择.对说话人和文本均无关、说话人相关2组普通话情感语音进行特征选择,然后利用线性判别分析和支持向量机进行实际识别效果... 针对情感声学特征在语音情感识别中的重要性问题,运用优先选择、序列前向、序列后向和逐步判别分析进行了特征选择.对说话人和文本均无关、说话人相关2组普通话情感语音进行特征选择,然后利用线性判别分析和支持向量机进行实际识别效果的分析比较.特征选择结果表明,基频、对数能量、语速和第一共振峰均值对普通话情感语音具有较强的判别能力,但情感声学特征的判别力随着说话人的不同而有所差异.特征选择方法比较实验表明,逐步判别分析比其他3种方法具有更高的平均准确率,当特征个数为9~12时分类器的平均准确率最高.效用分析表明,特征选择在小样本时更加有效. 展开更多
关键词 情感计算 语音情感识别 情感声学特征 特征选择 普通话
在线阅读 下载PDF
低资源条件下基于i-vector特征的LSTM递归神经网络语音识别系统 被引量:23
18
作者 黄光许 田垚 +2 位作者 康健 刘加 夏善红 《计算机应用研究》 CSCD 北大核心 2017年第2期392-396,共5页
在低资源条件下,由于带标注训练数据较少,搭建的语音识别系统性能往往不甚理想。针对此问题,首先在声学模型上研究了长短时记忆(LSTM)递归神经网络,通过对长序列进行建模来充分挖掘上下文信息,并且引入线性投影层减小模型参数;然后研究... 在低资源条件下,由于带标注训练数据较少,搭建的语音识别系统性能往往不甚理想。针对此问题,首先在声学模型上研究了长短时记忆(LSTM)递归神经网络,通过对长序列进行建模来充分挖掘上下文信息,并且引入线性投影层减小模型参数;然后研究了在特征空间中对说话人进行建模的技术,提取出能有效反映说话人和信道信息的身份认证矢量(i-vector);最后将上述研究结合构建了基于i-vector特征的LSTM递归神经网络系统。在Open KWS 2013标准数据集上进行实验,结果表明该技术相比于深度神经网络基线系统有相对10%的字节错误率降低。 展开更多
关键词 语音识别 长短时记忆神经网络 身份认证矢量
在线阅读 下载PDF
基于Teager能量算子和深度置信网络的滚动轴承故障诊断 被引量:13
19
作者 陶洁 刘义伦 +2 位作者 付卓 杨大炼 汤芳 《中南大学学报(自然科学版)》 EI CAS CSCD 北大核心 2017年第1期61-68,共8页
针对传统的分类器对滚动轴承早期微弱故障进行诊断时泛化能力不强的问题,提出基于Teager能量算子(TEO)和深度置信网络(DBN)的滚动轴承故障诊断方法。先用TEO提取滚动轴承振动信号中的瞬时能量,构造相应的特征向量;采用层次优化算法调整... 针对传统的分类器对滚动轴承早期微弱故障进行诊断时泛化能力不强的问题,提出基于Teager能量算子(TEO)和深度置信网络(DBN)的滚动轴承故障诊断方法。先用TEO提取滚动轴承振动信号中的瞬时能量,构造相应的特征向量;采用层次优化算法调整DBN结构参数,生成合适的分类器。应用美国西储大学轴承实验振动信号,对不同类型、不同损伤程度的滚动轴承进行故障诊断,对比分析DBN、支持向量机(SVM)和邻近算法(KNN)的分类准确性。研究结果表明:DBN能更准确、稳定地识别滚动轴承各种故障,具有较强的泛化能力。 展开更多
关键词 深度置信网络 TEAGER能量算子 滚动轴承 故障诊断
在线阅读 下载PDF
基于麦克风阵列声音信号定位方法的研究 被引量:21
20
作者 吴晓 靳世久 +1 位作者 李一博 张鹏 《传感技术学报》 CAS CSCD 北大核心 2010年第5期682-686,共5页
提出了一种在嘈杂环境下利用麦克风阵列对声音信号定位的方法。该方法对每个麦克风采集的声音信号进行经验模态分解,然后根据各个IMF信号的归一化能量挑选出主要的IMF分量进行信号重构,从而实现对信号进行降噪处理。将降噪后的信号使用... 提出了一种在嘈杂环境下利用麦克风阵列对声音信号定位的方法。该方法对每个麦克风采集的声音信号进行经验模态分解,然后根据各个IMF信号的归一化能量挑选出主要的IMF分量进行信号重构,从而实现对信号进行降噪处理。将降噪后的信号使用互功率谱相位法进行相关运算,计算出不同麦克风声音信号出现的时间差异。根据信号时延和麦克风之间的几何位置关系计算出声音信号的位置。为了验证本文所提出的定位算法,进行了语音信号定位实验,通过实验实测的数据分析对比分析,验证了本文提出的方法比传统的定位算法要优越。 展开更多
关键词 声源定位 EMD分解 室内环境 信号到达时间 互功率谱相位
在线阅读 下载PDF
上一页 1 2 82 下一页 到第
使用帮助 返回顶部