期刊文献+
共找到296篇文章
< 1 2 15 >
每页显示 20 50 100
A New Adaptive Formant Vocoder
1
作者 Hu Yi and He DehuanBeijing Institute of Remote Sensing Equipment, P. O. Box 3925, Beijing 100854, China 《Journal of Systems Engineering and Electronics》 SCIE EI CSCD 1991年第1期89-96,共8页
A new type of vocoder system based upon formant analysis is presented in this paper. The LMS adaptive algorithm is used for tracking formants of speech signals. The results of computer simulation show that the new voc... A new type of vocoder system based upon formant analysis is presented in this paper. The LMS adaptive algorithm is used for tracking formants of speech signals. The results of computer simulation show that the new vocoder has better synthesized speech quality. 展开更多
关键词 Adaptive formant vocoder formant analysis LMS adaptive algorithm.
在线阅读 下载PDF
Using Formants to Compare Short and Long Vowels in Modern Standard Arabic 被引量:1
2
作者 Veton Kepuska Mohamed Alshaari 《Journal of Computer and Communications》 2020年第5期96-106,共11页
This study was concerned with the short vowels in modern standard Arabic words with Consonant Vowel-Consonant Vowel-Consonant Vowel (CVCVCV) structure, and the long vowels in words with Consonant Vowel Vowel-Consonant... This study was concerned with the short vowels in modern standard Arabic words with Consonant Vowel-Consonant Vowel-Consonant Vowel (CVCVCV) structure, and the long vowels in words with Consonant Vowel Vowel-Consonant (CVVC). Even though there has been a dispute on the precise number of Arabic vowels that exist between language studies, this study used the opinion that the Arabic language has three vowels;the elongation of each vowel gave the other three because this is the opinion of classical Arabic linguists which is the source of the Modern Standard Arabic (MSA). Studies said that the first and second formant values (F1, F2) can represent the vowels. In this study, the formants were measured using LPC (Linear Predictive Coding), verifying the measurement to see if the measured follows the pattern of formants measurements of the other studies, and the formants were used to investigate the relationship between short and long vowels. Furthermore, the study figured out if the dialect of speakers can affect the values of formants, even if the spoken language is MSA, some statistical measurements were calculated to evaluate the relationship. 展开更多
关键词 Arabic VOWELS formant MSA CVCVCV Words Corpus VOWEL Triangle DIALECT
在线阅读 下载PDF
A new formant feature and its application in Mandarin vowel pronunciation quality assessment
3
作者 卢小春 潘复平 +1 位作者 尹俊勋 胡维平 《Journal of Central South University》 SCIE EI CAS 2013年第12期3573-3581,共9页
In order to improve the Mandarin vowel pronunciation quality assessment, a nox/el formant feature was proposed and applied to formant classification for Chinese Mandarin vowel pronunciation quality evaluation. Formant... In order to improve the Mandarin vowel pronunciation quality assessment, a nox/el formant feature was proposed and applied to formant classification for Chinese Mandarin vowel pronunciation quality evaluation. Formant candidates of each frame were plotted on the time-frequency plane to form a bitmap, and its Gabor feature was extracted to represent the formant trajectory. The feature was then classified by using GMM model and the classification posterior probability was mapped to pronunciation quality grade. The experiments of comparing the Gabor transformation based formant trajectory feature with several other kinds of traditionally used features show that with this method, a human-machine scoring correlation coefficient (CC) of 0.842 can be achieved, which is better than the result of 0.832 by traditional speech recognition techniques. At the same time, considering that the long-term information of formant classification and the short-term information of speech recognition technique are complementary to each other, it is investigated to combine their results with linear or nonlinear methods to further improve the evaluation performance. As a result, experiments on PSK show that the best CC of 0.913, which is very close to the correlation of inter-human rating of 0.94, is gotten by using neural network. 展开更多
关键词 computer assisted language learning speech recognition Gaussian mixture model formant Gabor feature NEURALNETWORK
在线阅读 下载PDF
Using Formants to Extract Short Vowels from Arabic Words with (Consonant Vowel)<sup>3</sup>Structure
4
作者 Mohamed Alshaari Veton Kepuska 《Journal of Computer and Communications》 2021年第5期1-9,共9页
Arabic texts suffer from missing short vowels. Arabic Speech Recognition is not as good as English speech recognition due to the short vowels not being recognized. And the Arabic language is unlike the English languag... Arabic texts suffer from missing short vowels. Arabic Speech Recognition is not as good as English speech recognition due to the short vowels not being recognized. And the Arabic language is unlike the English language in characteristics such as the number of vowels. English has more than 24 vowels that are close to each other in pronunciation. The Arabic language only has three short vowels that are far from each other in utter and measurement, by elongating those short vowels, long vowels arose. Researchers said that the vowels could be recognized using formants. The formants’ measurements of Arabic vowels are far from each other too, so it is possible to recognize them so that Arabic Speech recognition can give more accurate results. The paper applies this idea to the corpus Phonemes of Arabic. It uses the Euclidian distance method to measure the distances between formant values to recognize Arabic from words with a CV3 structure, the Linear Predictive Coding method and MATLAB to develop the programs that will extract the formants and calculate the means of the short vowels by using the corpus to identify the short vowels within words in the corpus. The results showed that if highly qualified readers were chosen to read the Arabic text, then higher rates of recognition of the short vowels involved in words will be achieved. This paper revealed that some of the characteristics of a language can be utilized for vowel recognition or to enhance the existing methods for speech recognition. 展开更多
关键词 Arabic Short Vowels Corpus CV3 Words formant
在线阅读 下载PDF
RHYTHM FORMANTS OF STORY READING IN STANDARD MANDARIN 被引量:1
5
作者 GIBBON Dafydd 《中国语音学报》 2020年第2期1-16,共16页
Rhythm Formant Theory(RFT),a modulation-theoretic approach to the physical modelling of speech rhythm,is described and applied in an exploratory analysis of the rhetorical rhythms of read-aloud Mandarin Chinese transl... Rhythm Formant Theory(RFT),a modulation-theoretic approach to the physical modelling of speech rhythm,is described and applied in an exploratory analysis of the rhetorical rhythms of read-aloud Mandarin Chinese translations of the IPA benchmark text The North Wind and the Sun.Rhythm Formant Analysis(RFA),a methodology for empirically investigating Rhythm Formant Theory without prior annotation of the speech signal,is presented in some detail,with the aim of studying rhythm variation in larger units throughout longer texts,rather than restricting analysis to words,phrases and sentences.A test case of read-aloud narratives was investigated,with the null hypothesis that male and female readers do not differ in rhetorical reading strategies.RFA was used to generate vectors of low frequency(LF)variation in spectrograms,for analysis with hierarchical clustering methods.The clustering indicates that the null hypothesis was falsified and rhetorical differences between female and male speakers were tentatively confirmed.Ongoing work includes the analysis of linguistic factors underlying LF variation.In the conclusion,RFT is placed into a more general framework of a Speech Modulation Frequency Scale of modulation types. 展开更多
关键词 Rhythm formant Theory Speech rhythm Rhythm formant Rhythm spectrogram Modulation-theory
原文传递
16年跨度对普通话青年女声声学特征的影响
6
作者 肖雨萍 曹洪林 《应用声学》 北大核心 2025年第4期815-823,共9页
为研究长时间跨度对说话人声学特征的影响,该文构建了两个不同时间跨度的数据组,实验组跨度16年(2005年首次录音时19~20岁,2021年再次录音时35~36岁),对照组跨度3个月(19~20岁),两组均包括10位北京籍女性被试的普通话朗读语音。提取的... 为研究长时间跨度对说话人声学特征的影响,该文构建了两个不同时间跨度的数据组,实验组跨度16年(2005年首次录音时19~20岁,2021年再次录音时35~36岁),对照组跨度3个月(19~20岁),两组均包括10位北京籍女性被试的普通话朗读语音。提取的声学参数包括7个单元音(/a/、/■/、/u/、/i/、/y/、/■/、/■/)的前四条共振峰、篇章语料的长时基频(LTF0)和(前四条)长时共振峰(LTF)分布。相关样本非参数检验结果显示,16年后实验组的LTF0均值显著降低(对照组3个月前后LTF0均值无显著变化),多数单元音共振峰未见显著差异,绝大多数LTF参数未见显著变化;判别分析结果显示,在相同条件下,只有当预测变量包括LTF0时,3个月对照组的判别率才会明显高于16年实验组的判别率。由此可知,对于青年期(19~40岁)内的女性说话人而言,16年时间跨度对其声学参数的影响规律表现为LTF0均值显著降低,多数共振峰参数仍保持相对稳定。该结论对于司法语音同一性鉴定具有重要应用价值。 展开更多
关键词 非同时期语音 语音同一性鉴定 长时基频 共振峰 长时共振峰 声学特征
在线阅读 下载PDF
基于常数Q变换的构音障碍语音自动检测和评估
7
作者 孙国伦 王丽 《网络新媒体技术》 2025年第1期16-25,40,共11页
针对构音障碍语音的自动检测与严重程度评估问题,提出一种融合构音障碍语音病理特性的自动检测和评估方法。通过结合常数Q变换的频谱以及源-滤波器假设,将频谱分解,并使用常数Q变换频谱及其分量来捕捉构音障碍患者发音过程中的共振峰歪... 针对构音障碍语音的自动检测与严重程度评估问题,提出一种融合构音障碍语音病理特性的自动检测和评估方法。通过结合常数Q变换的频谱以及源-滤波器假设,将频谱分解,并使用常数Q变换频谱及其分量来捕捉构音障碍患者发音过程中的共振峰歪曲等发音特点。同时,采用密集连接网络对含有病理特性的声学特征建模实现构音障碍检测与严重程度评估。实验结果表明,该方法在英语、意大利语和中文等语种的语音自动检测任务上分别取得2%以上的准确率绝对值提升;在英语和中文语料的构音障碍严重程度评估任务上分别取得2%和10%以上的准确率绝对值提升。这表明该方法能够在不同语种和不同任务上一致提升构音障碍语音建模性能。 展开更多
关键词 构音障碍语音 语音共振峰 常数Q 变换 密集连接网络 源-滤波器
在线阅读 下载PDF
基于MLP的伪装语音说话人性别鉴定
8
作者 张晓 管林玉 《计算机科学》 CSCD 北大核心 2024年第S02期395-398,共4页
文中提出了一种基于神经网络的伪装语音说话人识别模型,用以实现从共振峰的中心频率、带宽、音强等参数识别伪装语音说话人的性别。该模型以多层感知机(Multi-Layer Perceptron,MLP)为框架,经全连接的非线性堆叠计算获取识别结果,并在... 文中提出了一种基于神经网络的伪装语音说话人识别模型,用以实现从共振峰的中心频率、带宽、音强等参数识别伪装语音说话人的性别。该模型以多层感知机(Multi-Layer Perceptron,MLP)为框架,经全连接的非线性堆叠计算获取识别结果,并在模型的训练阶段采用L-BFGS进行优化参数的求解。实验中采用SoundTouch对男性和女性的自然语音进行伪装,探讨了网络结构与激活函数对该模型的影响,以及该识别模型对不同电子伪装手段的适应能力。实验结果表明,基于MLP的识别模型能高效区分采用不同电子伪装手段伪装后的语音对应的说话人的性别。 展开更多
关键词 多层感知机 电子伪装语音 性别鉴定 共振峰 说话人
在线阅读 下载PDF
基于超声成像的藏语安多方言元音研究 被引量:1
9
作者 龙代吉草 更太加 +1 位作者 石海强 魏建国 《信息化研究》 2024年第4期42-47,共6页
本文借助超声仪采集了藏语安多方言元音的生理语音数据,系统分析了安多方言元音的动态舌位和稳定段的静态舌位,以及声学共振峰数据。实验结果显示,在舌位运动过程中确实存在一个稳定阶段,此阶段各帧数据间的差异都较小,将该阶段的舌位... 本文借助超声仪采集了藏语安多方言元音的生理语音数据,系统分析了安多方言元音的动态舌位和稳定段的静态舌位,以及声学共振峰数据。实验结果显示,在舌位运动过程中确实存在一个稳定阶段,此阶段各帧数据间的差异都较小,将该阶段的舌位特征与古藏语相比,发现安多方言元音系统已经产生了一定的变化,即元音舌位由低到高依次为/a/、/i,u,o/、/e/,舌位由前到后分别为/e/、/i,u,a/、/o/,其中元音/i/和/u/央化并产生了新的音位变体。最后我们从空间域角度对安多方言元音的舌体音姿进行了总体描述。明确了元音在生理特征与声学特征上具有统一性,这对藏语不同方言之间的发音差异和共性研究均有一定的理论意义和参考价值。 展开更多
关键词 藏语安多方言 元音 超声图像 声学共振峰
在线阅读 下载PDF
新闻播音中韵律边界的声学特性及交际实现
10
作者 刘文 陈彦婷 《语言文字应用》 CSSCI 北大核心 2024年第1期128-141,共14页
韵律边界是口语交际互动的重要线索,其感知高度依赖于声学线索。本文以《新闻联播》的播读语料为研究对象,采用声学手段对韵律边界音节进行系统研究。结果显示:韵律边界音节的时长均大于非边界音节,而音高和音强则小于非边界音节。此外... 韵律边界是口语交际互动的重要线索,其感知高度依赖于声学线索。本文以《新闻联播》的播读语料为研究对象,采用声学手段对韵律边界音节进行系统研究。结果显示:韵律边界音节的时长均大于非边界音节,而音高和音强则小于非边界音节。此外,韵律边界位置上的阳平和上声存在挤喉音。调音方面,男性和女性的共鸣效果好,高频能量均有所增强,且男性存在演讲者共振峰。本文探究了新闻播音的韵律特性,研究成果可为指导播音教学实践提供一定参考。 展开更多
关键词 新闻播音 韵律边界 语速 嗓音质量 演讲者共振峰
原文传递
基于功率谱和共振峰的母羊发声信号识别 被引量:18
11
作者 宣传忠 武佩 +3 位作者 马彦华 张丽娜 韩丁 刘艳秋 《农业工程学报》 EI CAS CSCD 北大核心 2015年第24期219-224,共6页
内蒙古及周边西部地区正在发展规模化种草设施圈养,这种养殖模式要求较高的福利化饲养水平。母羊在不同的应激行为下会发出不同的声信号,可以通过识别母羊发声信号去评价其健康状况和福利化养殖水平。该研究以成年小尾寒羊为例,通过无... 内蒙古及周边西部地区正在发展规模化种草设施圈养,这种养殖模式要求较高的福利化饲养水平。母羊在不同的应激行为下会发出不同的声信号,可以通过识别母羊发声信号去评价其健康状况和福利化养殖水平。该研究以成年小尾寒羊为例,通过无线语音数据采集卡,平均采集80只母羊在寻羔、饥饿和惊吓3种应激行为下的发声,用Audacity软件共分割成1 200句叫声信号,并用带通滤波和小波消噪进行预处理。每种应激行为下再随机选取200句发声信号,共计600句进行AR(auto-regressive)功率谱估计和共振峰分析,提取第1、2和3共振峰频率和6个代表性的功率谱估计频域参数:功率谱密度的平均值、几何平均值、中值、切尾平均值、平均绝对偏差值和四位分极差,同时也提取叫声信号的最大值、持续时间和间隔时间时域参数,这些特征参数用于训练BP(back propagation)神经网络母羊发声信号识别模型,剩余的600句发声信号用于测试模型的识别效果。结果表明:母羊在不同应激行为下的发声信号具有明显差异的特征参数,采用共振峰参数训练的BP网络,其对母羊发声信号的正确识别率为85.3%,高于利用AR功率谱估计参数的81.0%,当2种参数进行组合训练BP网络后,其正确识别率可达93.8%,表明这种方法的识别效果更好,由于在同一种应激行为下,不同年龄和体质量的母羊发声信号具有一定的差异性,使得系统的误识别率达到6.2%。 展开更多
关键词 动物 功率谱 声音信号 母羊 共振峰 特征提取
在线阅读 下载PDF
腭裂语音元音共振峰特点的分析 被引量:21
12
作者 杨学财 李宁毅 +2 位作者 卜令学 蔡圳 童庆春 《华西口腔医学杂志》 CAS CSCD 北大核心 2003年第6期451-453,462,共4页
目的 了解腭裂术后患者语音矫治后元音发音的改变 ,明确语音矫治对腭裂患者语音改善的重要性。方法 应用VS_99语音工作站对 10例健康儿童、未进行语音训练的 33例腭裂术后患者及 16例语音矫治后患者的 4个单元音 [a]、[e]、[i]、[u]... 目的 了解腭裂术后患者语音矫治后元音发音的改变 ,明确语音矫治对腭裂患者语音改善的重要性。方法 应用VS_99语音工作站对 10例健康儿童、未进行语音训练的 33例腭裂术后患者及 16例语音矫治后患者的 4个单元音 [a]、[e]、[i]、[u]发音进行语音分析。结果 ①元音 [a]前 3个共振峰频率 (F1 ,F2 ,F3)平均值 ,3组间无显著件差异 (P >0 .0 5 )。②元音 [e]的F1 ,F2 ,F3平均值 ,语音矫治前组与对照组 ,矫治前组与矫治后组比较 ,均有显著性差异 (P <0 .0 5 ) ;而矫治后组与对照组间无显著性差异 (P >0 .0 5 )。③元音 [i]的F1 ,F2 ,F3平均值 ,矫治前组与矫治后组比较有显著性差异 (P <0 .0 5 ) ,矫治后组与对照组比较F2 、F3有显著性差异 (P <0 0 5 )。④元音 [u]的F1 ,F2 ,F3平均值 ,矫治前组与矫治后组比较有显著性差异 (P <0 .0 5 ) ,其他各组间无显著性差异 (P >0 .0 5 )。结论 腭裂修复术可使患者达到解剖结构上的正常或接近正常 ,但未达到完善的腭咽闭合 ,因而需要语音矫治与训练 ;语音矫治后患者语音有明显改善 ;通过语音频谱的分析 ,可为语音矫治提供依据。 展开更多
关键词 腭裂 语音元音共振峰特点 分析 语音矫治 语音频谱
暂未订购
腭裂畸形程度对腭裂语音影响的研究 被引量:26
13
作者 李蓓 石冰 +3 位作者 郑谦 蒙田 尹恒 鲁勇 《华西口腔医学杂志》 CAS CSCD 北大核心 2007年第1期55-57,共3页
目的研究腭裂畸形程度与腭裂语音之间的关联性。方法选择102例行腭帆提肌重建术的非综合征型腭裂患者为研究对象,其中完全性腭裂56例(CCP组),不完全性腭裂46例(ICCP组)。在语音频谱仪上测定患者在手术前及术后发[i]音时共振峰F1、F2、F... 目的研究腭裂畸形程度与腭裂语音之间的关联性。方法选择102例行腭帆提肌重建术的非综合征型腭裂患者为研究对象,其中完全性腭裂56例(CCP组),不完全性腭裂46例(ICCP组)。在语音频谱仪上测定患者在手术前及术后发[i]音时共振峰F1、F2、F3的数值,并与30例正常对照组(C组)的测定结果进行比较。患者的术后复诊时间为3~6个月。结果①C组、ICCP组术前和CCP组术前的F1值无统计学差异(P>0.05),F2、F3值有统计学差异(P<0.05),C组高于ICCP组,ICCP组高于CCP组;②C组、ICCP组术后和CCP组术后的F1值无统计学差异(P>0.05),F2、F3值有统计学差异(P<0.05),C组高于ICCP组,ICCP组高于CCP组;③ICCP组和CCP组进行组内自身比较,术前、术后的F1值无统计学差异,术后F2、F3值均高于术前(P<0.05)。结论腭裂畸形程度对腭裂患者的语音有影响,畸形越严重,患者舌位后缩越明显,术后软腭上抬动度越差,语音状况越不理想。 展开更多
关键词 腭裂 畸形程度 共振峰 语音
暂未订购
蛋鸡发声音频数据库的构建与应用 被引量:20
14
作者 余礼根 滕光辉 +2 位作者 李保明 劳凤丹 邢永正 《农业工程学报》 EI CAS CSCD 北大核心 2012年第24期150-156,共7页
蛋鸡发声含有丰富的机体信息,充分挖掘其声学特性,并利用其无接触、无应激的优点,为建立基于发声信息的蛋鸡养殖远程监测平台提供基础依据。该研究借助音频数字化处理技术和数据库管理平台,以海兰褐蛋鸡为例,搭建系统分别采集其在小规... 蛋鸡发声含有丰富的机体信息,充分挖掘其声学特性,并利用其无接触、无应激的优点,为建立基于发声信息的蛋鸡养殖远程监测平台提供基础依据。该研究借助音频数字化处理技术和数据库管理平台,以海兰褐蛋鸡为例,搭建系统分别采集其在小规模(5只)饲养条件下的叫声信息及其体态行为。运用音频处理软件Adobe Auditionv1.0和音频分析软件Praat5.3提取蛋鸡发声特征参数,包括持续时间、基音频率、频谱质心、共振峰及其衍生的统计值,以此构建出蛋鸡发声音频数据库,在此基础上分别选取蛋鸡产蛋行为发声、鸣唱声和鸣叫声等典型发声行为对比分析。结果表明,蛋鸡产蛋行为发声与鸣唱声均为多次重复的、有节奏的、短促的音节所构成(称其为句子),前者先抑后扬、后者先扬后抑,句子的音节个数分别是7.8±2.0、15.2±7.7,但其时频域特征间存在着显著差异(P<0.05),与鸣叫声相比,其发声特征参数如频谱质心、共振峰等有着显著差异。研究表明,掌握蛋鸡发声的含义,有助于了解其行为特性、机体状态以及种群间的信息传递,并为蛋鸡行为特征识别与数字化监测平台的构建提供数据支持。 展开更多
关键词 音频记录 动物 行为研究 蛋鸡 基音频率 频谱质心 共振峰
在线阅读 下载PDF
语音情感特征的提取与分析 被引量:11
15
作者 王薇 杨丽萍 +1 位作者 魏丽 刘艳 《实验室研究与探索》 CAS 北大核心 2013年第7期91-94,191,共5页
语音情感识别与分析是目前人工智能、情感计算的主要研究方向之一,其研究成果能直接影响人与计算机的交互方式。语音情感识别的基础是语音情感特征值的确定、提取及分析,这将直接决定语音情感识别的准确程度。情感语音数据库的创建及选... 语音情感识别与分析是目前人工智能、情感计算的主要研究方向之一,其研究成果能直接影响人与计算机的交互方式。语音情感识别的基础是语音情感特征值的确定、提取及分析,这将直接决定语音情感识别的准确程度。情感语音数据库的创建及选择成为语音情感特征值提取与分析的前提。本文实验所采用的情感语音库为北京航空航天大学电子信息工程学院毛峡教授课程组建立的,对于不同情感的同一样本语句进行能量分析、基频分析及共振峰分析,以确定不同特征值对于喜悦、愤怒、悲伤、平静等情感的区别度。这为进一步研究人类情感语音特征值的确定与提取、分析提供了一定的参考。 展开更多
关键词 语音情感 情感特征 能量 基频 共振峰
在线阅读 下载PDF
阻塞性睡眠呼吸暂停低通气综合征和单纯鼾症者鼾声的基频及共振峰分析 被引量:14
16
作者 彭好 许辉杰 +3 位作者 黄魏宁 杨弋 贺宇霞 李传颖 《听力学及言语疾病杂志》 CAS CSCD 北大核心 2013年第1期27-31,共5页
目的研究阻塞性睡眠呼吸暂停低通气综合征(obstructive sleep apnea-hypopnea syndrome,OS-AHS)和单纯鼾症(simple snoring,SS)者鼾声的基频和共振峰特点,探讨其可能的临床应用价值。方法对50例OSAHS患者(OSAHS组,轻度16例,中度15例,重... 目的研究阻塞性睡眠呼吸暂停低通气综合征(obstructive sleep apnea-hypopnea syndrome,OS-AHS)和单纯鼾症(simple snoring,SS)者鼾声的基频和共振峰特点,探讨其可能的临床应用价值。方法对50例OSAHS患者(OSAHS组,轻度16例,中度15例,重度19例)和20例SS者(单纯鼾症组)行同步多导睡眠监测和鼾声监测,截取每例患者不同睡眠时段的10次鼾声,使用Prrat语音分析软件对鼾声的基频和共振峰进行分析。结果 SS组有明显的基频,在100Hz段以下分布聚集,而OSAHS组鼾声基频无规律;SS组鼾声的第一共振峰值(F1)明显小于OSAHS组;OSAHS组中,重度组F1最高,轻度组最低,且各组间两两比较差异均有统计学意义。结论 OSAHS患者与SS者的鼾声基频和共振峰频率特别是F1有明显差别,F1值的大小与OSAHS的严重程度有一定关系,鼾声的基频及共振峰值有助于OSAHS与SS的区分以及OSAHS严重程度的大致判断;根据SS者鼾声的基频可能有助于鼾声来源的鉴别。 展开更多
关键词 阻塞性睡眠呼吸暂停低通气综合征 单纯鼾症 鼾声 基频 共振峰
暂未订购
一种新的语音信号共振峰提取的算法 被引量:6
17
作者 何峰 陈晓清 +1 位作者 李国锁 林嘉宇 《信号处理》 CSCD 北大核心 2007年第4期618-621,共4页
本文提出了一种新的语音信号共振峰的提取方法。在LPC幅度谱上搜寻最大的极大值点所对应的频率,并将它作为构成声道参数的某一谐振腔所对应的共轭复根的角度,再通过LPC系数的相—频特性的一次导数和三次导数相结合的方法求出这对共轭复... 本文提出了一种新的语音信号共振峰的提取方法。在LPC幅度谱上搜寻最大的极大值点所对应的频率,并将它作为构成声道参数的某一谐振腔所对应的共轭复根的角度,再通过LPC系数的相—频特性的一次导数和三次导数相结合的方法求出这对共轭复根的幅度,从而确定了该谐振腔,也就得到了该谐振腔的共振峰。然后,用LPC的多项式对该谐振腔所对应的多项式做多项式除法,得到新的LPC系数,接着重复前面的步骤,可以较好地求出在LPC谱中对应幅度最大的两个共振峰。 展开更多
关键词 LPC 共振峰 相—特性 谐振腔
在线阅读 下载PDF
频谱分析技术在腭裂语音研究中的应用 被引量:22
18
作者 封兴华 魏建华 +3 位作者 张立军 马威 何亚会 石冰 《中国口腔颌面外科杂志》 CAS 2003年第2期70-73,共4页
目的用语音共振峰的原理建立腭裂语音研究的客观方法。方法对正常儿童、腭裂术前儿童、腭裂术后儿童分别进行单元音[a]、[o]、[e]、[ī]、[u]、[ü]的录音及语音频谱分析,计算各组儿童的第一、二、三共振峰数值,对腭裂术后儿童的腭... 目的用语音共振峰的原理建立腭裂语音研究的客观方法。方法对正常儿童、腭裂术前儿童、腭裂术后儿童分别进行单元音[a]、[o]、[e]、[ī]、[u]、[ü]的录音及语音频谱分析,计算各组儿童的第一、二、三共振峰数值,对腭裂术后儿童的腭咽闭合不全率及语音清晰度进行测量,并评价其与共振峰的对应关系。结果正常儿童的第一、二、三共振峰数值是比较恒定的,腭裂术前儿童的共振峰数值明显下降,腭裂术后儿童的共振峰数值随腭咽闭合程度和语音清晰度的改善而显著提高。腭咽闭合完全者发[i]时,F3值明显大于腭咽闭合不全者。结论语音共振峰可以客观地反映腭咽闭合状况,单元音[i]可以作为此种检测的标准音素。 展开更多
关键词 腭裂 元音 共振峰 腭咽闭合不全 语音
暂未订购
舌癌患者术后元音共振峰频谱分析 被引量:13
19
作者 姚卫萍 施星辉 +1 位作者 吴凤鸣 吴煜农 《口腔医学》 CAS 2007年第5期272-274,共3页
目的分析舌癌患者术后元音共振峰的变化,了解患者的语音功能状况。方法20名舌体切除范围不超过半舌的舌癌患者为研究对象,对其手术前、后的6个汉语单元音共振峰(F1、F2、F3)进行分析比较。结果手术后患者元音/e/F1、/i/F1、/u/F1、/o/F2... 目的分析舌癌患者术后元音共振峰的变化,了解患者的语音功能状况。方法20名舌体切除范围不超过半舌的舌癌患者为研究对象,对其手术前、后的6个汉语单元音共振峰(F1、F2、F3)进行分析比较。结果手术后患者元音/e/F1、/i/F1、/u/F1、/o/F2、/u/F2上升,/櫣/F2、/i/F3、/櫣/F3下降。结论舌癌术后,患者的语音功能发生明显变化,使用VS-99语音工作站可对患者手术前后语音功能变化特征进行定量分析,为临床语音功能训练提供参考。 展开更多
关键词 舌癌 元音 共振峰 频谱分析
暂未订购
藏语孤立词语音识别技术研究 被引量:6
20
作者 赵尔平 王聪华 +1 位作者 党红恩 雒伟群 《西北师范大学学报(自然科学版)》 CAS 北大核心 2015年第5期50-54,共5页
针对藏语读音首先看后加字,然后根据元音的位置关系决定读音,而且元音比辅音携带更多听觉感知信息的特点,提出了一种改进的HTK系统藏语孤立词语音识别技术.在识别特征参数中,增加更能表征元音特征的共振峰参数提高语音识别的正确性,通... 针对藏语读音首先看后加字,然后根据元音的位置关系决定读音,而且元音比辅音携带更多听觉感知信息的特点,提出了一种改进的HTK系统藏语孤立词语音识别技术.在识别特征参数中,增加更能表征元音特征的共振峰参数提高语音识别的正确性,通过循环迭代方法提高语音训练速度,利用藏文字母拉丁转写方法解决藏文和语音识别系统编码不一致的问题.在二次开发的HTK平台进行实验,正确率达到92.83%,实验结果表明元音特征在藏语音识别中起到重要作用. 展开更多
关键词 藏语孤立词 共振峰 M el倒谱特征 循环迭代 隐马尔可夫模型 语音识别
在线阅读 下载PDF
上一页 1 2 15 下一页 到第
使用帮助 返回顶部