期刊文献+
共找到221篇文章
< 1 2 12 >
每页显示 20 50 100
低资源环境下的语音唤醒研究综述
1
作者 王月昊 周若华 《计算机工程》 北大核心 2025年第2期35-53,共19页
语音唤醒作为实现人机交互的关键技术,一直是语音领域的研究热点。随着深度学习技术的发展,其研究方法的重心已从传统的大词汇连续语音识别(LVCSR)技术逐渐转向基于神经网络的技术,然而如何在小型设备上实现高效唤醒并利用有限的样本数... 语音唤醒作为实现人机交互的关键技术,一直是语音领域的研究热点。随着深度学习技术的发展,其研究方法的重心已从传统的大词汇连续语音识别(LVCSR)技术逐渐转向基于神经网络的技术,然而如何在小型设备上实现高效唤醒并利用有限的样本数据进行模型训练仍是低资源语音唤醒系统设计面临的挑战。首先,定义了语音唤醒中的低资源概念,区分了语音唤醒和语音识别以及相关术语,介绍了经典的语音唤醒模型及其适配场景,阐述了低资源语音唤醒的国内外研究现状。其次,从语音唤醒系统的结构组成的角度分别说明了声学特征提取与声学模型的主流技术和优化策略。然后,对语音唤醒模型的轻量化方法展开分析并对其优缺点进行比较,总结了数据低资源语音唤醒中常见的小样本学习、零样本学习、迁移学习等解决方法,并介绍了常见语音唤醒数据集和评价指标。最后,探讨并展望了低资源语音唤醒技术未来的研究方向。 展开更多
关键词 语音唤醒 低资源 模型量化 小样本学习 人机交互
在线阅读 下载PDF
基于Gabor、Fisher脸多特征提取及集成SVM的人脸表情识别 被引量:15
2
作者 黄永明 章国宝 +1 位作者 董飞 达飞鹏 《计算机应用研究》 CSCD 北大核心 2011年第4期1536-1539,1543,共5页
针对静态的灰度图像表情库,提出了基于多种脸部表情特征多级分类的表情识别算法。首先在选取的人脸特征点上作局部的Gabor小波变换。为了提高特征提取速度,利用改进的弹性图匹配算法来提取图像中的人脸有效区域,在提取的人脸区域中提取... 针对静态的灰度图像表情库,提出了基于多种脸部表情特征多级分类的表情识别算法。首先在选取的人脸特征点上作局部的Gabor小波变换。为了提高特征提取速度,利用改进的弹性图匹配算法来提取图像中的人脸有效区域,在提取的人脸区域中提取几何特征,并通过Fisher脸法提取统计特征,利用几何特征与建立的相应一级集成SVM来进行初次分类。最后利用Fisher特征与建立的相应二级集成SVM进行最终分类。通过在JAFFE与Cohn-Kanade表情库中实验,证明该方法与单个特征相比较,具有更高的表情识别率以及更强的鲁棒性。 展开更多
关键词 表情识别 改进的弹性模板 GABOR小波变换 FISHER脸 集成支持向量机 分类器级联
在线阅读 下载PDF
消除信号趋势项时小波基优选方法研究 被引量:20
3
作者 吴志成 王重阳 任爱君 《北京理工大学学报》 EI CAS CSCD 北大核心 2013年第8期811-814,共4页
在消除信号趋势项时引入小波基函数对信号进行分解和重构.小波基函数的选择会影响消除信号趋势项后的结果.提出了消趋误差指数的概念及其计算公式,并使用该公式计算了34种常用小波基的消趋误差指数,优选出sym10等6种消趋误差指数较小的... 在消除信号趋势项时引入小波基函数对信号进行分解和重构.小波基函数的选择会影响消除信号趋势项后的结果.提出了消趋误差指数的概念及其计算公式,并使用该公式计算了34种常用小波基的消趋误差指数,优选出sym10等6种消趋误差指数较小的小波基.使用sym10小波基及另外两种非优选小波基对实测的汽车车身振动加速度信号进行消除趋势项处理.结果表明,使用sym10小波基提取的信号趋势项比其它非优选小波基更为准确,验证了提出的消趋误差指数计算公式的有效性. 展开更多
关键词 小波分析法 信号趋势项 小波基
在线阅读 下载PDF
基于参数优化的最小二乘支持向量机HEV阀控铅酸蓄电池SOC预测 被引量:11
4
作者 王琪 孙玉坤 黄永红 《中南大学学报(自然科学版)》 EI CAS CSCD 北大核心 2015年第1期113-119,共7页
针对电池容量预测问题,引入最小二乘支持向量机(LS-SVM)方法用于判断混合动力汽车(HEV)阀控铅酸蓄电池(VRLA)的荷电状态(SOC)。考虑到最小二乘支持向量机的参数选择会对预测结果产生较大的影响,提出一种基于参数优化的最小二乘支持向量... 针对电池容量预测问题,引入最小二乘支持向量机(LS-SVM)方法用于判断混合动力汽车(HEV)阀控铅酸蓄电池(VRLA)的荷电状态(SOC)。考虑到最小二乘支持向量机的参数选择会对预测结果产生较大的影响,提出一种基于参数优化的最小二乘支持向量机预测方法。首先,在非线性回归预测模型的训练过程中,采用模拟退火算法来确定LS-SVM的初始值参数,从而更好地反映预测模型的复杂度,以此提高状态预测的精度。其次,由于预测模型在应对不良数据时可能出现误差增大的问题,分别采用贝叶斯证据框架(BEF)优化算法和留一交叉验证(LOOCV)优化算法来增强预测模型的抗差能力。研究结果表明:留一交叉验证优化算法具有较高的预测精度,实用性强,有效性高。 展开更多
关键词 蓄电池 荷电状态 最小二乘支持向量机 参数优化 预测
在线阅读 下载PDF
类别不平衡学习识别UWB定位非视距信号 被引量:7
5
作者 缪志敏 赵陆文 +1 位作者 田世伟 姜劲松 《信号处理》 CSCD 北大核心 2016年第1期8-13,共6页
非视距(Non Line of Sight,NLOS)传播是影响超宽带(Ultra-wide Bandwidth,UWB)定位精度的一个重要因素。针对UWB定位中视距(Line of Sight,LOS)信号数量大于NLOS信号数量所呈现的类别不平衡特点,提出了一种基于类别不平衡学习的NLOS信... 非视距(Non Line of Sight,NLOS)传播是影响超宽带(Ultra-wide Bandwidth,UWB)定位精度的一个重要因素。针对UWB定位中视距(Line of Sight,LOS)信号数量大于NLOS信号数量所呈现的类别不平衡特点,提出了一种基于类别不平衡学习的NLOS信号识别方法。该方法通过给NLOS信号和LOS信号赋予不同的误分代价来训练一个带野值的支持向量数据描述(Support Vector Data Description,SVDD)学习器,实现对数量少但重要的NLOS信号的识别。仿真结果表明,当LOS信号数量远大于NLOS信号数量时,该方法对NLOS信号的识别性能优于支持向量机(Support Vector Machine,SVM)。 展开更多
关键词 超宽带定位 非视距 支持向量数据描述 类别不平衡学习
在线阅读 下载PDF
基于SVM的多分类器融合算法在说话人识别中的应用 被引量:5
6
作者 王波 徐毅琼 李弼程 《计算机工程与设计》 CSCD 北大核心 2007年第12期2909-2910,2913,共3页
多分类器协同合作克服了单个分类器识别效果不理想,适用范围较窄或对使用环境要求较高的不足,并为研制更高性能的分类器,提供了解决问题的另一个途径。提出了一种基于SVM的多分类器说话人识别系统,该系统的识别框架基于多分类器的协同... 多分类器协同合作克服了单个分类器识别效果不理想,适用范围较窄或对使用环境要求较高的不足,并为研制更高性能的分类器,提供了解决问题的另一个途径。提出了一种基于SVM的多分类器说话人识别系统,该系统的识别框架基于多分类器的协同工作。该多分类器系统采用了ANN(artificial neural networks)、GMM(gaussian mixed model)分类器和子带结构分类器,参数选取包括MFCC(mel frequency cepstrum coefficient)、LPCC(linear prediction cepstrum coefficient)。多分类器融合采用SVM方法。本系统在超短波信道(15 db)的实际应用中达到94%的识别率。 展开更多
关键词 说话人识别 多分类器协同 子带结构分类器 分层识别 人工神经网络 混合高斯模型 支持向量机
在线阅读 下载PDF
MFSC系数特征局部有限权重共享CNN语音识别 被引量:9
7
作者 黄玉蕾 罗晓霞 刘笃仁 《控制工程》 CSCD 北大核心 2017年第7期1507-1513,共7页
针对传统语音识别应用中识别效果不理想的问题,提出一种基于美尔谱系数(MFSC)特征的有限局部权重共享卷积神经网络(CNN)语音识别。首先,借鉴图像处理中对输入图像信息的处理方式,构建语音信号的二维阵列特征映射输入形式,每个映射表示... 针对传统语音识别应用中识别效果不理想的问题,提出一种基于美尔谱系数(MFSC)特征的有限局部权重共享卷积神经网络(CNN)语音识别。首先,借鉴图像处理中对输入图像信息的处理方式,构建语音信号的二维阵列特征映射输入形式,每个映射表示为含静态数据、一阶导数、二阶导数的MFSC系数特征,便于应用图像处理方式进行识别;其次,引入图像处理的卷积神经网络,并且针对语音信号特征的局部特性,构建有限局部权重共享卷积神经网络学习算法,提高语音信号辨识度并降低算法复杂度;最后,通过实验对所提算法进行验证,并且给出算法参数变化影响实验,为具体应用提供依据。 展开更多
关键词 卷积神经网络 局部权重共享 语音识别 特征映射 美尔谱系数
原文传递
基于改进粒子群算法的独立分量分析 被引量:4
8
作者 谭萍 李伟娟 李明 《兰州大学学报(自然科学版)》 CAS CSCD 北大核心 2010年第4期124-128,共5页
提出一种有效的基于改进的粒子群算法的盲源分离算法.首先引入进化速度和聚集强度来更新粒子群算法中的动态惯性权重w,然后定义基于改进PSO的独立分量分析算法的适应性函数,最后给出算法的具体步骤.实验结果表明,改进的ICA算法可以快速... 提出一种有效的基于改进的粒子群算法的盲源分离算法.首先引入进化速度和聚集强度来更新粒子群算法中的动态惯性权重w,然后定义基于改进PSO的独立分量分析算法的适应性函数,最后给出算法的具体步骤.实验结果表明,改进的ICA算法可以快速有效地得到BSS的最优解. 展开更多
关键词 盲源分离 粒子群算法 独立分量分析 语音信号
在线阅读 下载PDF
基于两种GMM-UBM多维概率输出的SVM语音情感识别 被引量:2
9
作者 黄永明 章国宝 +1 位作者 董飞 达飞鹏 《计算机应用研究》 CSCD 北大核心 2011年第1期98-101,共4页
针对GMM应用于情感识别时区分能力较弱的缺点,提出了一种将GMM与SVM有效结合的算法:基于GMM-UBM多维概率输出的SVM语音情感识别方法。该方法将GMM-UBM模型对一条语音的情感特征参数的两种多维概率输出(与特征向量同维、与GMM阶数同维)作... 针对GMM应用于情感识别时区分能力较弱的缺点,提出了一种将GMM与SVM有效结合的算法:基于GMM-UBM多维概率输出的SVM语音情感识别方法。该方法将GMM-UBM模型对一条语音的情感特征参数的两种多维概率输出(与特征向量同维、与GMM阶数同维)作为SVM分类器的特征参数,既利用了GMM表征数据本身统计特性的能力,又保留了SVM判决能力强的特点。在柏林情感语音库与汉语情感语料库上进行的实验结果表明,该方法在语音情感识别上的平均识别率较标准GMM方法提高1.7%~3.7%。 展开更多
关键词 语音情感识别 特征向量同维GMM—UBM多维概率输出 GMM阶数同维GMM—UBM多维概率输出 支持向量机(SVM)
在线阅读 下载PDF
基于DSP的声控系统的设计与实现 被引量:3
10
作者 马洪连 朱杰 +1 位作者 杨凤岐 孟新雨 《测控技术》 CSCD 2005年第12期30-32,共3页
介绍了一个包括说话人识别和说话内容识别的声控系统的设计与实现。该系统以TMS320VC5509 DSP 为平台,以倒谱系数为特征参数,以欧氏距离法和矢量量化法为识别算法,实时实现了系统的识别功能。
关键词 数字信号处理器 倒谱系数 说话人识别 语音识别 矢量量化
在线阅读 下载PDF
基于语音信号的情感处理研究进展 被引量:11
11
作者 韩纪庆 邵艳秋 《电声技术》 2006年第5期58-62,67,共6页
介绍了基于语音信号的情感处理技术的研究进展,综述了该领域的研究方法、相关技术及应用领域,讨论了其未来的发展方向。
关键词 语音信号 情感 语音识别 语音合成
在线阅读 下载PDF
基于正四棱锥形六元声阵列被动定位的研究 被引量:3
12
作者 刘泳锐 刘文怡 甄成方 《传感技术学报》 CAS CSCD 北大核心 2014年第2期252-256,共5页
声音无线传感器网络节点利用到达时间差(TDOA)原理进行声音目标定位,提出了一种正四棱锥形六元声音阵列定位模型。推导出了目标空间定位计算公式,应用广义互相关算法对时延进行估计。同时对模型误差进行了分析。最后通过仿真实验,可以... 声音无线传感器网络节点利用到达时间差(TDOA)原理进行声音目标定位,提出了一种正四棱锥形六元声音阵列定位模型。推导出了目标空间定位计算公式,应用广义互相关算法对时延进行估计。同时对模型误差进行了分析。最后通过仿真实验,可以对目标进行有效定位,定位误差小。 展开更多
关键词 无线传感器网络节点 被动声定位 六元正四棱锥 误差分析
在线阅读 下载PDF
高斯序列核支持向量机用于说话人识别 被引量:5
13
作者 李杰 刘贺平 《计算机工程与应用》 CSCD 北大核心 2010年第18期183-185,共3页
说话人识别问题具有重要的理论价值和深远的实用意义,在研究支持向量机核方法理论的基础上,将其与传统高斯混合模型(GMM)相结合构建成基于高斯序列核的支持向量机(SVM)。SVM的灵活性和强大分类能力主要在于可以根据要处理的问题来相应... 说话人识别问题具有重要的理论价值和深远的实用意义,在研究支持向量机核方法理论的基础上,将其与传统高斯混合模型(GMM)相结合构建成基于高斯序列核的支持向量机(SVM)。SVM的灵活性和强大分类能力主要在于可以根据要处理的问题来相应的选取核函数。在识别的过程中引入特征空间归正技术NAP(Nuisance Attribute Projection)对同一说话人在不同信道和环境所带来的特征差异进行弥补。用美国国家标准与技术研究所(NIST)2004年评测数据集进行实验,结果表明该方法可以大幅度提高识别率。 展开更多
关键词 支持向量机 高斯线性核 高斯非线性核 NAP技术 说话人识别
在线阅读 下载PDF
混合策略改进的粒子群算法 被引量:8
14
作者 朱茂桃 刘欢 +1 位作者 吴佘胤 商高高 《重庆理工大学学报(自然科学)》 CAS 北大核心 2024年第1期110-121,共12页
针对粒子群算法易陷入局部最优、收敛精度低、收敛速度慢等缺陷,提出了基于混合策略的改进粒子群算法。使用融合Circle映射与精英反向学习的策略初始化种群,提升初始种群的质量,同时加快收敛速度;在粒子速度更新方式中引入蜘蛛移动策略... 针对粒子群算法易陷入局部最优、收敛精度低、收敛速度慢等缺陷,提出了基于混合策略的改进粒子群算法。使用融合Circle映射与精英反向学习的策略初始化种群,提升初始种群的质量,同时加快收敛速度;在粒子速度更新方式中引入蜘蛛移动策略平衡算法的全局搜索与局部搜索;提出了基于自适应t分布的变异策略,增强算法全局搜索和跳出局部最优能力;对15个单峰和多峰函数进行仿真实验,与其他3种算法进行了对比分析,结果表明:所提出的改进算法具有很强的寻优能力与稳定性。 展开更多
关键词 粒子群优化算法 蜘蛛优化 自适应t分布
在线阅读 下载PDF
一种提高稳态误差及收敛速度的回声消除算法 被引量:2
15
作者 江冰 叶玲 +1 位作者 朱成健 曾为 《声学技术》 CSCD 2009年第3期295-299,共5页
以研究回声消除为背景,在分析比较了三种LMS自适应滤波器算法的基础上,提出了改进的LMS自适应滤波器算法。并利用Matlab进行仿真分析,通过绘制误差曲线、学习曲线,证明了改进后的算法在稳态误差以及收敛速度方面都优于之前的算法。该算... 以研究回声消除为背景,在分析比较了三种LMS自适应滤波器算法的基础上,提出了改进的LMS自适应滤波器算法。并利用Matlab进行仿真分析,通过绘制误差曲线、学习曲线,证明了改进后的算法在稳态误差以及收敛速度方面都优于之前的算法。该算法能较好地应用到IP电话中的回声消除的自适应滤波问题。 展开更多
关键词 自适应滤波器 归一化LMS算法 延迟LMS算法 回声消除
在线阅读 下载PDF
基于段级特征的对话环境下说话人分段算法 被引量:1
16
作者 王波 徐毅琼 李弼程 《计算机工程与设计》 CSCD 北大核心 2007年第10期2401-2402,2416,共3页
提出了一种使用段级语音特征对测试进行说话人分段从而实现对话环境下说话人分段算法,算法实现中基于车比雪夫和不等式提出了基于协方差模型的段级特征的距离测度描述。该识别方法根据实验选择了合适的段级特征语音段长度,实验结果表明... 提出了一种使用段级语音特征对测试进行说话人分段从而实现对话环境下说话人分段算法,算法实现中基于车比雪夫和不等式提出了基于协方差模型的段级特征的距离测度描述。该识别方法根据实验选择了合适的段级特征语音段长度,实验结果表明基于段级特征的说话人识别方法在有效地在对话环境下将多人的语音进行分段,从而提高了说话人识别系统的精度和识别速度。 展开更多
关键词 段级特征 车比雪夫和不等式 说话人识别 语音分段 高斯混合模型 数字信号处理芯片
在线阅读 下载PDF
基于自适应插值法的单幅图像边缘保持仿真 被引量:3
17
作者 刘磊 牟飞燕 《计算机仿真》 北大核心 2023年第1期267-271,共5页
针对单幅图像边缘信息不易保持的问题,从自适应阈值及插值处理两个角度出发,提出基于自适应插值法的单幅图像边缘保持方法。采用小波图像去噪方法预处理图像,降低图像噪声,并改进硬软阈值函数,精准估算小波变换时的小波系数,提高图像去... 针对单幅图像边缘信息不易保持的问题,从自适应阈值及插值处理两个角度出发,提出基于自适应插值法的单幅图像边缘保持方法。采用小波图像去噪方法预处理图像,降低图像噪声,并改进硬软阈值函数,精准估算小波变换时的小波系数,提高图像去噪效果;通过直方图平衡算法增强去噪后图像的低频子带,提高图像间的对比度;利用Canny自适应阈值边缘检测方法,将增强后图像直方图的子图像分割为边缘区间和平坦区间,采用众数法和邻近法判定插值点所在区间后,分别利用非线性或双线性插值处理区间,完成单幅图像边缘保持。仿真结果证明,所提方法的单幅图像边缘保持效果最佳,图像质感好。 展开更多
关键词 自适应插值法 单幅图像 边缘保持 阈值 低频子带
在线阅读 下载PDF
基于稀疏性的欠定语音盲分离方法研究 被引量:1
18
作者 王国鹏 刘郁林 罗颖光 《计算机应用》 CSCD 北大核心 2009年第4期1056-1058,共3页
针对源信号增多导致语音信号稀疏性变差的问题,提出一种新的基于稀疏性的混合矩阵估计方法,利用主分量分析(PCA)检测只有一个源信号存在的时频点并用于估计混合矩阵,从而提高了估计性能,特别适用于欠定语音盲分离。同时指出了影响基于... 针对源信号增多导致语音信号稀疏性变差的问题,提出一种新的基于稀疏性的混合矩阵估计方法,利用主分量分析(PCA)检测只有一个源信号存在的时频点并用于估计混合矩阵,从而提高了估计性能,特别适用于欠定语音盲分离。同时指出了影响基于稀疏性语音盲分离方法性能的因素。仿真结果验证了上述结论。 展开更多
关键词 稀疏性 混合矩阵估计 语音盲分离
在线阅读 下载PDF
平顶山煤矿煤的物质组成特征研究 被引量:2
19
作者 冯松宝 赵梓臣 +3 位作者 付铜洋 余磊 车青松 刘茂钱 《河北省科学院学报》 CAS 2015年第2期75-80,共6页
采用刻槽法在平顶山煤矿采取煤样,对所取煤样利用全自动煤岩系统进行煤显微组分含量测定以及采用手持XRF元素分析仪进行煤中元素含量测试。综合两项实验数据进行数理统计分析,测定结果表明平顶山煤矿煤中镜质组含量约72.97%、半镜质组... 采用刻槽法在平顶山煤矿采取煤样,对所取煤样利用全自动煤岩系统进行煤显微组分含量测定以及采用手持XRF元素分析仪进行煤中元素含量测试。综合两项实验数据进行数理统计分析,测定结果表明平顶山煤矿煤中镜质组含量约72.97%、半镜质组含量约4.58%、壳质组含量约3.56%、惰质组含量约13.62%。可推断平顶山煤的物质组成特征有利于生成气态烃。煤中所含元素中Fe、S两种元素较为突出,Fe元素平均含量约为1977ppm,S元素平均含量约为4828ppm,两者在煤中可能以具体的矿物形式存在(如黄铁矿等),有助于提高煤生烃过程的转化率。 展开更多
关键词 煤物质组成特征 显微组分 元素组成 矿物组成
在线阅读 下载PDF
基于嵌入式语音通信系统的研究 被引量:2
20
作者 杨华 陈明义 +1 位作者 胡晖 杨伟平 《衡阳师范学院学报》 2005年第6期28-31,共4页
研究利用嵌入式系统实现语音实时通信,设计了由嵌入式微处理器S3C44B0X和专用语音处理芯片 UDA1341TS组成的语音通信系统、文中提出了软硬件设计方案,并就数字音频文件的生成、传输及显示进行了探讨。本系统能实现语音播放、语音录制及... 研究利用嵌入式系统实现语音实时通信,设计了由嵌入式微处理器S3C44B0X和专用语音处理芯片 UDA1341TS组成的语音通信系统、文中提出了软硬件设计方案,并就数字音频文件的生成、传输及显示进行了探讨。本系统能实现语音播放、语音录制及实时网络通信,经实际测试,效果良好,界面显示简洁美观,既有较好的质量,又节省了成本、空间,是通信系统中实用可行的参考方案。 展开更多
关键词 嵌入式系统 语音通信 语音录放 TCP/IP DMA传输
在线阅读 下载PDF
上一页 1 2 12 下一页 到第
使用帮助 返回顶部