期刊文献+
共找到63篇文章
< 1 2 4 >
每页显示 20 50 100
Variable Rate Characteristic Waveform Interpolation Speech Coder Based on Phonetic Classification
1
作者 王晶 匡镜明 赵胜辉 《Journal of Beijing Institute of Technology》 EI CAS 2007年第2期187-192,共6页
A variable-bit-rate characteristic waveform interpolation (VBR-CWI) speech codec with about 1.8 kbit/s average bit rate which integrates phonetic classification into characteristic waveform (CW) decomposition is p... A variable-bit-rate characteristic waveform interpolation (VBR-CWI) speech codec with about 1.8 kbit/s average bit rate which integrates phonetic classification into characteristic waveform (CW) decomposition is proposed. Each input frame is classified into one of 4 phonetic classes. Non-speech frames are represented with Bark-band noise model. The extracted CWs become rapidly evolving waveforms (REWs) or slowly evolving waveforms (SEWs) in the cases of unvoiced or stationary voiced frames respectively, while mixed voiced frames use the same CW decomposition as that in the conventional CWI. Experimental results show that the proposed codec can eliminate most buzzy and noisy artifacts existing in the fixed-bit-rate characteristic waveform interpolation (FBR-CWI) speech codec, the average bit rate can be much lower, and its reconstructed speech quality is much better than FS 1 016 CELP at 4.8 kbit/s and similar to G. 723.1 ACELP at 5.3 kbit/s. 展开更多
关键词 variable bit rate speech coding characteristic waveform interpolation phonetic classification
在线阅读 下载PDF
基于时频特征融合的伪造语音检测算法
2
作者 袁程胜 张雪原 +2 位作者 周志立 李欣亭 付章杰 《数据采集与处理》 北大核心 2025年第6期1538-1555,共18页
针对伪造语音检测精度不高和泛化性弱的难题,提出一种基于时频特征融合的伪造语音检测算法。首先,为了挖掘语音片段能量分布不均、基频波动异常,以及提取语义连贯性的细微差别,提出一种多分支特征融合网络,分别从音高、音强以及能量分... 针对伪造语音检测精度不高和泛化性弱的难题,提出一种基于时频特征融合的伪造语音检测算法。首先,为了挖掘语音片段能量分布不均、基频波动异常,以及提取语义连贯性的细微差别,提出一种多分支特征融合网络,分别从音高、音强以及能量分布来挖掘真假语音的差异痕迹,以更好地表征真假语音的频率变化、振幅变化和峰值差异,提高伪造语音检测的准确率。其次,经典的坐标注意力机制未能对语音时频域的细粒度差异进行有效挖掘,为此提出一种时频坐标注意力机制,分别从时域和频域两个方向对能量分布和基频波动异常进行联合编码,以更好地表征频谱图中的共性高频能量异常,提升模型的泛化性。最后,设计了一种自适应联合损失优化函数,通过平衡不同分支网络的权重,进一步提升模型对伪造语音中高频能量异常及语义不连贯性的学习能力。在ASVspoof 2019逻辑访问数据集上进行了性能评估,实验结果表明,与现有的工作相比,所提方法在等错误率(Equal error rate,EER)和最小归一化串联检测代价函数(Minimum normalized tandem detection cost function,min t‑DCF)两个指标上均取得较好性能,分别降低了0.34%和0.014。此外,在应对极难检测的未知攻击A17时,同样展现出较高的泛化性,其中EER和min t‑DCF分别下降了3.9522%和0.1364。当应对未知类型的欺骗攻击时,同样表现出较好的泛化性。 展开更多
关键词 伪造语音检测 特征融合 时频特征融合 频谱图 语音波形
在线阅读 下载PDF
智能上假肢特定人语音识别系统实现 被引量:9
3
作者 樊炳辉 卢凤 +1 位作者 王鑫 刘圭圭 《计算机工程与设计》 北大核心 2017年第6期1630-1634,共5页
智能上假肢特定人语音识别系统采用特定人语音识别技术对智能上假肢进行实时准确控制。实现对语音波形的实时显示;运用均匀子带方差和双门限方法,实现噪音环境下特定人语音的实时端点检测;引入I-Mel滤波器和Mid-Mel滤波器对传统Mel滤波... 智能上假肢特定人语音识别系统采用特定人语音识别技术对智能上假肢进行实时准确控制。实现对语音波形的实时显示;运用均匀子带方差和双门限方法,实现噪音环境下特定人语音的实时端点检测;引入I-Mel滤波器和Mid-Mel滤波器对传统Mel滤波器进行改进,有效提高信息完整度;采用全局最小值DTW算法对参考模板和待识别指令进行匹配识别。测试结果表明,该系统对短词的平均识别率为97.875%,短句的平均识别率为97%,实现了对控制指令实时、准确的识别,满足系统应用需要。 展开更多
关键词 语音识别 波形显示 频带方差 梅尔频率倒谱系数 动态时间规整
在线阅读 下载PDF
基于奇异值分解的低速率波形内插语音编码算法 被引量:13
4
作者 王贵平 鲍长春 张鹏 《电子学报》 EI CAS CSCD 北大核心 2006年第1期135-140,共6页
波形内插(WI)语音编码模型作为当今最具潜力的低速率语音编码方案之一,因其良好的性能,越来越受到人们的重视.本文基于一种奇异值分解(SVD)的特征波形分解方法,利用语音信号的感知特性,将二维特征波形的幅度谱分成基本矩阵、过渡矩阵和... 波形内插(WI)语音编码模型作为当今最具潜力的低速率语音编码方案之一,因其良好的性能,越来越受到人们的重视.本文基于一种奇异值分解(SVD)的特征波形分解方法,利用语音信号的感知特性,将二维特征波形的幅度谱分成基本矩阵、过渡矩阵和补充矩阵,并采用了不同的量化方法,有效地降低了运算复杂度;另外,本文根据语音信号时变特性,将三个矩阵分为三种组合模式表示特征波形幅度谱,并引入周期因子和能量熵来衡量矩阵周期程度,解决了奇异值分解后参数难于量化的问题,提高了编码效率.主观A/B测试表明,本文提出的2.4kbps SVD-WI编码器的重建语音质量略好于2·4kbps MELP编码器. 展开更多
关键词 语音编码 波形内插 特征波形 奇异值分解 周期因子
在线阅读 下载PDF
基于非负矩阵分解的2kb/s波形内插语音编码算法 被引量:6
5
作者 张鹏 鲍长春 郭莉莉 《电子学报》 EI CAS CSCD 北大核心 2008年第4期632-638,共7页
在波形内插(Waveform Interpolation,WI)语音编码器中,如何低延时、高精度并且低复杂度的分解和量化特征波形(Characteristic Waveform,CW)一直是该编码模型的研究热点和难点.本文提出用非负矩阵分解(Non-negative MatrixFactorization,... 在波形内插(Waveform Interpolation,WI)语音编码器中,如何低延时、高精度并且低复杂度的分解和量化特征波形(Characteristic Waveform,CW)一直是该编码模型的研究热点和难点.本文提出用非负矩阵分解(Non-negative MatrixFactorization,NMF)方法来分解语音特征波形.该分解方法仅需要当前帧的语音信号,不会给编码器带来额外的延时;为了提高分解精度,本文在CW分解之前先对CW按照其子帧的最大基音周期进行分类,然后按不同类别进行分解.另外,本文结合耳蜗模型提出了NMF的基矢量分带初始化算法,将CW的分解精度提高到与二阶奇异值分解相当的水平;为了降低WI编码器的计算复杂度,本文去除了传统WI编码器中的特征波形对齐模块,同时将NMF的分解阶数设定为16以折中CW分解的计算复杂度和分解精度.最后,本文基于矩阵量化技术,对非负矩阵分解后的编码矩阵采用分裂式矩阵量化方案来量化.主观A/B测试表明,本文提出的2kb/s NMF-WI编码器的合成语音质量接近于2.4kb/s SVD-WI编码器.MOS分测试表明,本文提出的2kb/s NMF-WI编码器的合成语音质量稍差于2.4kb/s MELP编码器. 展开更多
关键词 语音编码 波形内插 特征波形 非负矩阵分解
在线阅读 下载PDF
语音压缩编码技术研究进展 被引量:8
6
作者 时磊 尚秋峰 李健宇 《声学技术》 CSCD 北大核心 2008年第4期553-556,共4页
为了满足数字通信及其它商业应用的需求,语音压缩编码技术得到了迅速发展。介绍了目前语音压缩编码技术的研究进展,主要包括连续可变斜率增量调制(CVSD)、小波分析、多脉冲激励线性预测编码、散布脉冲码激励线性预测(DP-CELP)、多重脉... 为了满足数字通信及其它商业应用的需求,语音压缩编码技术得到了迅速发展。介绍了目前语音压缩编码技术的研究进展,主要包括连续可变斜率增量调制(CVSD)、小波分析、多脉冲激励线性预测编码、散布脉冲码激励线性预测(DP-CELP)、多重脉冲散布非均匀代数码本激励线性预测(MPD-USACELP)、波形内插(WI)、线谱对(频率)(LSP)的量化。对以上算法进行了分析比较,总结了它们的特点和适用范围,并介绍了其中一些算法在DSP上的实时实现。 展开更多
关键词 语音压缩编码 线性预测(LP) 波形内插 DSP
在线阅读 下载PDF
波形内插语音编码技术回顾与展望 被引量:2
7
作者 李靓 鲍长春 王贵平 《通信学报》 EI CSCD 北大核心 2005年第1期95-103,共9页
介绍了原型波形内插和特征波形内插算法的基本原理及其实现方法,详细描述了原型波形内插和特征形内插语音编码技术的研究进展情况,并提出了今后的研究方向。
关键词 语音编码 波形内插 原型波形 特征波形
在线阅读 下载PDF
波形内插语音编码中特征波形表达和对齐快速算法 被引量:3
8
作者 齐峰岩 鲍长春 《北京工业大学学报》 EI CAS CSCD 北大核心 2006年第6期514-519,共6页
针对波形内插编码模型中特征波形的表达和对齐算法计算复杂度较高的问题,应用快速傅里叶变换、3 次B样条插值和周期延拓等技术对特征波形表示和对齐2个模块作了相应的改进.改进后的算法是相对独立的,2个模块的复杂度从43.252×10... 针对波形内插编码模型中特征波形的表达和对齐算法计算复杂度较高的问题,应用快速傅里叶变换、3 次B样条插值和周期延拓等技术对特征波形表示和对齐2个模块作了相应的改进.改进后的算法是相对独立的,2个模块的复杂度从43.252×106次/s操作降到9.178×106次/s操作.实验结果表明,改进后算法复杂度大幅下降,大大减少了编码器的计算负载,并保持了原有编码器的合成语音质量. 展开更多
关键词 语音编码 波形内插 傅里叶变换 样条插值
在线阅读 下载PDF
网络型有声计算机辅助教学系统 被引量:2
9
作者 谢咏圭 姚力 张普含 《北京师范大学学报(自然科学版)》 CAS CSCD 1993年第2期199-203,共5页
论述了一种网络型有声计算机辅助教学系统的设计思想,它符合国内外CAI的发展趋势和我国国情,有实用价值.这种系统基于Novell网络,采用了先进的Netware 3.11网络操作系统,其发声部分采用ADM波形编码技术,设计的语音接口卡达到了成本低、... 论述了一种网络型有声计算机辅助教学系统的设计思想,它符合国内外CAI的发展趋势和我国国情,有实用价值.这种系统基于Novell网络,采用了先进的Netware 3.11网络操作系统,其发声部分采用ADM波形编码技术,设计的语音接口卡达到了成本低、音质好的目标.所研制的有声CAI网络已实际调试成功,并已应用于英语有声计算机辅助教学系统. 展开更多
关键词 计算机 教学 局域网络 CAI
在线阅读 下载PDF
基于小波变换的2.4kbit/s波形内插语音编码算法 被引量:3
10
作者 王晶 匡镜明 谢湘 《通信学报》 EI CSCD 北大核心 2007年第5期43-48,共6页
基于双正交小波滤波器组对波形内插编码中提取的特征波进行多级分解与重构,提出了一种基于小波变换(WT)的2.4kbit/s特征波形内插(CWI)语音编码算法。编码端去除了特征波对齐运算,并对幅度谱进行多级分解,相位谱不传输,鉴于小波变换对信... 基于双正交小波滤波器组对波形内插编码中提取的特征波进行多级分解与重构,提出了一种基于小波变换(WT)的2.4kbit/s特征波形内插(CWI)语音编码算法。编码端去除了特征波对齐运算,并对幅度谱进行多级分解,相位谱不传输,鉴于小波变换对信号的压缩特性,仅传输对人耳感知起主要贡献的最后一级特征波幅度谱;解码端对各尺度空间采用单独重建的方法,相位信息在重构的末级与幅度谱结合,并由浊音度标志选择固定或随机相位。此外,根据语音信号的时变特性,由基于子帧的浊音度标志选择需要传输的幅度谱及量化模式。主观R-A/B测试表明,这种基于小波变换的2.4kbit/s编码算法的合成语音质量明显优于标准的2.4kbit/s的MELP编码器及FS1016的4.8kbit/sCELP编码器,亦优于3.8kbit/s的传统CWI编码框架下的合成语音效果。 展开更多
关键词 语音编码 小波变换 波形内插 特征波形分解
在线阅读 下载PDF
波形编辑语音合成技术及在汉语TTS中的应用 被引量:7
11
作者 蔡莲红 《小型微型计算机系统》 CSCD 北大核心 1994年第10期11-16,共6页
本文介绍了近几年迅速发展的基于波形编辑的语音合成技术。文中简介了它的研究内容、基本算法,还介绍了用波形编辑方法实现的汉语文一语转换系统。
关键词 语音合成 波形编辑 汉语TTS
在线阅读 下载PDF
语音特征波形的分解与量化 被引量:1
12
作者 王贵平 鲍长春 李靓 《电声技术》 2005年第1期50-54,58,共6页
波形内插语音编码模型作为当今最具潜力的低速率语音编码方案之一,因其良好的性能,越来越受到人们的重视。基于波形内插(WI)语音编码算法,全面总结和分析了现存的特征波形分解和量化的方法,这将为该领域的研究人员提供重要的参考。
关键词 语音编码 语音分解 波形内插
在线阅读 下载PDF
语音合成系统中波形拼接过渡算法的研究 被引量:1
13
作者 张鹏 王丽红 毛琳 《黑龙江大学自然科学学报》 CAS 北大核心 2011年第6期867-870,共4页
在现代的汉语语音合成的波形拼接合成方法中,没有考虑前后音节的声学影响,导致在音节连接处出现协同发音的低质合成,这大大降低了合成语音的自然度。为解决这一问题,提出了一个根据汉语语音韵律特征的研究,通过修改音节的韵律特征参数,... 在现代的汉语语音合成的波形拼接合成方法中,没有考虑前后音节的声学影响,导致在音节连接处出现协同发音的低质合成,这大大降低了合成语音的自然度。为解决这一问题,提出了一个根据汉语语音韵律特征的研究,通过修改音节的韵律特征参数,实现音节之间韵律特征参数波形拼接平滑过渡的算法。实验表明本方法的有效性,其语音合成的自然度更高,对语料库的要求更低。 展开更多
关键词 协同发音 语音合成 波形拼接 音素 韵律过渡
在线阅读 下载PDF
语音信号的频域非线性波形编码 被引量:1
14
作者 戴宪华 黄继武 《通信学报》 EI CSCD 北大核心 1998年第2期90-96,共7页
本文主要研究语音信号的分段离散Fourier变换(DFT)波形编码。提出新的信号分析工具——非线性DFT,它不仅表征了时间序列的局部线性信息,而且也包含有时间序列的全局大范围的二阶(平方)非线性特征,因此它具有比线性... 本文主要研究语音信号的分段离散Fourier变换(DFT)波形编码。提出新的信号分析工具——非线性DFT,它不仅表征了时间序列的局部线性信息,而且也包含有时间序列的全局大范围的二阶(平方)非线性特征,因此它具有比线性DFT更强的信号分析能力。利用该DFT对一长分段(如,512或者1024个样点)语音信号进行波形编码,在获得较高的压缩比(压缩比为8或16)的情况下,能很好地保持原语音信号波形的细节特征。 展开更多
关键词 非线性DFT 语音信号 波形编码
在线阅读 下载PDF
汉语语音拼接技术的研究 被引量:1
15
作者 郭兰英 李林 任委军 《计算机应用与软件》 CSCD 北大核心 2005年第11期49-50,84,共3页
汉语语音拼接模块是TTS系统中最基本、最重要的模块。它的功能是根据文本分析、韵律生成的结果从语音数据库中提取语音基元,并将这些语音基元按照某种算法拼接在一起,从而实时地生成适当的语音输出文件。本文主要剖析了采用波形拼接的... 汉语语音拼接模块是TTS系统中最基本、最重要的模块。它的功能是根据文本分析、韵律生成的结果从语音数据库中提取语音基元,并将这些语音基元按照某种算法拼接在一起,从而实时地生成适当的语音输出文件。本文主要剖析了采用波形拼接的方法实现汉语语音拼接的技术,阐述了主要模块的开发过程。 展开更多
关键词 汉语语音拼接模块 TTS系统 语音数据库 波形拼接 文件存储格式
在线阅读 下载PDF
基于FPGA的语音信号波形VGA显示方法 被引量:4
16
作者 陶中幸 《液晶与显示》 CAS CSCD 北大核心 2016年第2期185-192,共8页
在基于FPGA的语谱分析研究与设计中,需要将语音时域波形和语谱分析结果同时显示在VGA屏幕上,而采用一般方法只能在有限的VGA显示区域内显示局部波形,无法将完整的一段语音信号波形显示出来。针对这一问题,提出了一种适合FPGA实现的语音... 在基于FPGA的语谱分析研究与设计中,需要将语音时域波形和语谱分析结果同时显示在VGA屏幕上,而采用一般方法只能在有限的VGA显示区域内显示局部波形,无法将完整的一段语音信号波形显示出来。针对这一问题,提出了一种适合FPGA实现的语音信号波形VGA显示方法。该方法通过分析语音信号的波形特点,以及显示中存在的波形放大、波形缩小两个问题,提出线性插值和保留极值的解决方法,并详细探讨了这两种方法的FPGA硬件实现结构。实验结果表明,该方法能够有效地对语音信号进行正确显示。 展开更多
关键词 现场可编程门阵列 语音信号 波形缩放 波形显示方法 视频图形阵列
在线阅读 下载PDF
波形内插语音编码器中快渐变波形幅度的量化 被引量:1
17
作者 李靓 鲍长春 《信号处理》 CSCD 2004年第6期545-547,544,共4页
在低速率参数语音编码算法中,如何用有限的比特数有效地量化幅度谱是一个关键问题。本文对波形内插语音编码模型中快渐变波形幅度的量化问题进行了深入研究和分析,提出了一种基于矢量变维和DCT的REW幅度感觉加权量化方案,该方法降低了... 在低速率参数语音编码算法中,如何用有限的比特数有效地量化幅度谱是一个关键问题。本文对波形内插语音编码模型中快渐变波形幅度的量化问题进行了深入研究和分析,提出了一种基于矢量变维和DCT的REW幅度感觉加权量化方案,该方法降低了编码比特数,减少了存储和计算复杂度,增强了编码语音的感性质量。主观听力测试结果表明该量化方案在每帧4比特时的WI语音编解码质量要优于用基于DCT的REW幅度矩阵量化方案在每帧10比特时的重建语音质量。 展开更多
关键词 幅度 语音编码器 量化 内插 语音编解码 语音编码算法 DCT 计算复杂度 渐变 比特
在线阅读 下载PDF
基于Haar小波提升的2.4 kbit/s CWI语音编码算法 被引量:1
18
作者 王晶 赵胜辉 匡镜明 《北京理工大学学报》 EI CAS CSCD 北大核心 2008年第7期609-613,共5页
提出一种基于Haar小波提升的2.4 kbit/s特征波形内插(CWI)语音编码算法.将特征波离散时间傅里叶级数(DTFS)得到的幅度谱转化为离散余弦变换(DCT)系数,用Haar小波提升实现特征波的多级分解与重建.利用相位谱间距的均值和基音周期增益联... 提出一种基于Haar小波提升的2.4 kbit/s特征波形内插(CWI)语音编码算法.将特征波离散时间傅里叶级数(DTFS)得到的幅度谱转化为离散余弦变换(DCT)系数,用Haar小波提升实现特征波的多级分解与重建.利用相位谱间距的均值和基音周期增益联合判断浊音度标志,用于进行相位选择和离散余弦变换系数的选择性量化.主观A-B听音实验表明,该语音编码算法音质优于传统的3.8 kbit/s CWI编码器,在较低码率上获得较为满意的合成音质,且Haar小波提升特征波形分解与重建方法解决了传统小波变换CWI算法延时较大的问题. 展开更多
关键词 语音编码 特征波形内插(CWI) 小波提升 离散余弦变换(DCT) 浊音度
在线阅读 下载PDF
基于生成对抗网络联合训练的语音分离方法 被引量:3
19
作者 王涛 全海燕 《信号处理》 CSCD 北大核心 2020年第6期1013-1019,共7页
基于深度神经网络的语音分离方法大都在频域上进行训练,并且在训练过程中往往只关注目标语音特征,不考虑干扰语音特征。为此,提出了一种基于生成对抗网络联合训练的语音分离方法。该方法以时域波形作为网络输入,保留了信号时延导致的相... 基于深度神经网络的语音分离方法大都在频域上进行训练,并且在训练过程中往往只关注目标语音特征,不考虑干扰语音特征。为此,提出了一种基于生成对抗网络联合训练的语音分离方法。该方法以时域波形作为网络输入,保留了信号时延导致的相位信息。同时,利用对抗机制,使生成模型和判别模型分别训练目标语音和干扰语音的特征,提高了语音分离的有效性。实验中,采用Aishell数据集进行对比测试。结果表明,本文所提方法在三种信噪比条件下都有良好的分离效果,能更好地恢复出目标语音中的高频频段信息。 展开更多
关键词 语音分离 时域波形 生成对抗网络 联合训练
在线阅读 下载PDF
MPLPC激励脉冲提取算法研究 被引量:1
20
作者 马震 蒋保臣 陶立慧 《计算机应用与软件》 CSCD 北大核心 2007年第11期183-185,共3页
原始的多脉冲激励线性预测编码(MPLPC)方案中,由于没有考虑余量信号波形中的多脉冲信息和声门脉冲的非平稳性,导致计算量较大而且编码速率较高。为了解决这些问题,提出了波形辅助的激励脉冲搜索和变个数MPLPC方法。首先,给出用于辅助搜... 原始的多脉冲激励线性预测编码(MPLPC)方案中,由于没有考虑余量信号波形中的多脉冲信息和声门脉冲的非平稳性,导致计算量较大而且编码速率较高。为了解决这些问题,提出了波形辅助的激励脉冲搜索和变个数MPLPC方法。首先,给出用于辅助搜索的中心削波的削波门限,以减少搜索范围;然后,利用语音激励的非平稳性,提出了每帧脉冲个数的确定方法,用Matlab对本方法进行了仿真,获得良好的合成语音质量,而且可以减少1kb/s的编码速率。 展开更多
关键词 可变个数 波形辅助 语音编码 多脉冲激励
在线阅读 下载PDF
上一页 1 2 4 下一页 到第
使用帮助 返回顶部