期刊文献+
共找到35篇文章
< 1 2 >
每页显示 20 50 100
从《广东新语》看清初借词的若干问题
1
作者 王祖霞 《上饶师范学院学报》 2024年第1期74-81,共8页
词汇是语言中最为敏感的要素,词语的借用是语言接触最为常见的现象.《广东新语》详细记载了广州及周边地区的经济、文化、民俗等内容,其间使用了不少反映异域概念的借词.这些借词的内容与外交、外贸有关,其产生方式有纯音译式、合璧式... 词汇是语言中最为敏感的要素,词语的借用是语言接触最为常见的现象.《广东新语》详细记载了广州及周边地区的经济、文化、民俗等内容,其间使用了不少反映异域概念的借词.这些借词的内容与外交、外贸有关,其产生方式有纯音译式、合璧式、标记式、非标记式等.同实异形现象在借词中较为普遍,这与字形、译介方式的选择等有关.读懂借词,不仅可以为汉语词汇研究提供一手资料,还有助于古籍整理. 展开更多
关键词 《广东新语》 语言接触 借词 译介类型
在线阅读 下载PDF
用于提升聋哑人语音表现力的语音合成技术 被引量:3
2
作者 马皓天 洪峰 +3 位作者 毛海全 郑立通 牟宏宇 许伟杰 《声学技术》 CSCD 北大核心 2024年第6期843-853,共11页
目前,聋哑人主要通过手语的方式与健听人进行沟通,但这对未接受专业手语学习的健听人来说是一种挑战。因此,将手语转换为文本,再将文本转换成带有聋哑人音色的、健听人能理解的语音非常具有研究意义。为研究聋哑人语音合成的可行性,文... 目前,聋哑人主要通过手语的方式与健听人进行沟通,但这对未接受专业手语学习的健听人来说是一种挑战。因此,将手语转换为文本,再将文本转换成带有聋哑人音色的、健听人能理解的语音非常具有研究意义。为研究聋哑人语音合成的可行性,文章首先分析了聋哑人的语音特征,并根据分析的结论,提出了能合成高自然度、高清晰度且带有聋哑人自身声音特色的模型算法以及相应的评估体系。文章根据不同残疾程度的聋哑人语音特征,提出了面向轻度残疾聋哑人的语音转换和合成方法以及面向重度残疾聋哑人的语音克隆方法。根据分析结果,轻度残疾聋哑人语音与健听人语音具有一定的共性,因此使用AdaIN-VC语音转换模型转换出带有聋哑人音色、高可懂度的语音,并将转换好的语音结合Tacotron2语音合成模型进行文本到语音的映射。考虑到重度残疾聋哑人语音的不稳定性,文章基于Zero-shot的SV2TTS语音克隆框架,使用了ECAPA-TDNN作为重度残疾聋哑人音色表征的说话人编码器,以获取准确的聋哑人表征。此外,文章还引入基于基频情感分类的风格迁移模块,对合成语音进行风格上的迁移。实验结果表明,在保证一定相似度的情况下,实验中两位轻残聋哑人的自然度主观意见评分别从原来的2.53和3.06提高至2.88和3.21,并且语音识别的错词率从100%分别降低至80.77%和76.91%。同样,文中提出的主观错词率也有明显的下降。而在语音克隆的实验中,模型合成的重残聋哑人语音与其自身音色的相似度主观相似度意见评分达到3,且聋哑人语音的自然度主观意见评分和情感表达能力均得到了提高。 展开更多
关键词 语音合成 语音转换 语音克隆 风格迁移
在线阅读 下载PDF
基于迁移学习和基频特征融合的文本相关说话人识别框架 被引量:1
3
作者 马皓天 洪峰 +5 位作者 毛海全 徐楚林 胡梦璐 牟宏宇 陈友元 许伟杰 《声学技术》 CSCD 北大核心 2024年第5期677-685,共9页
目前,面向我国金融支付的说话人识别技术在社会层面上没有大范围的推广,其原因在于数据集的缺乏以及识别技术未能满足安全性要求。针对上述问题,文章录制了用于中文数字串文本相关说话人识别的SHALCAS-WXSD22B数据集,用于金融支付场景... 目前,面向我国金融支付的说话人识别技术在社会层面上没有大范围的推广,其原因在于数据集的缺乏以及识别技术未能满足安全性要求。针对上述问题,文章录制了用于中文数字串文本相关说话人识别的SHALCAS-WXSD22B数据集,用于金融支付场景中的数字串声纹识别研究,并提出一种基于迁移学习和基频特征融合的文本相关说话人识别框架,提高了文本相关说话人识别技术的可靠性。在数字串SHALCAS-WXSD22B-d006和SHALCAS-WXSD22B-d007语料实验中,所提框架实现的最佳等错误率分别为0.88%和1.05%,与ECAPA-TDNN基线模型相比等错误率相对降低了17和20个百分点,且达到了支付场景下的声纹识别安全性指标。实验结果表明,文中所提框架不仅具有更好的识别准确率和安全性能,而且同样能提高框架中包括ResNet34在内的其他log-Mel识别模型的性能。 展开更多
关键词 文本相关说话人识别 迁移学习 基频特征 嵌入级融合 决策级融合
在线阅读 下载PDF
新疆南疆地区学前教师国家通用语言韵母产出特征及教学建议 被引量:1
4
作者 贾媛 潘琳娇 《喀什大学学报》 2024年第2期56-63,共8页
党的二十大报告指出“加大国家通用语言文字推广力度”。对此聚焦新疆南疆地区学前教师国家通用语言发音问题,以实验语音学为手段,综合运用描写分析、数据统计、比较分析等方法,对少数民族教师的国家通用语言元音的产出特征进行分析。... 党的二十大报告指出“加大国家通用语言文字推广力度”。对此聚焦新疆南疆地区学前教师国家通用语言发音问题,以实验语音学为手段,综合运用描写分析、数据统计、比较分析等方法,对少数民族教师的国家通用语言元音的产出特征进行分析。在研究过程中,将少数民族学前教师与“国家通用语言发音人”(以下简称“发音人”)的发音,分别进行系统的对比和分析,总结出学前教师习得撮口呼韵母ü、üe、üan、ün、iong的语音特点和规律。研究结果显示,与“发音人”的发音产出相比,学前教师在撮口呼韵母üe的共振峰频率上有一定差异(p<0.05);在撮口呼韵母ü、üe、üan、ün、iong的产出时长上存在显著差异(p<0.01)。在产出偏误上,存在过度泛化和错读两类偏误现象,具体有ü发音过长、ü错读成u等偏误。基于以上研究,提出相应的培训教学建议。 展开更多
关键词 撮口呼 韵母 语音偏误 学前教师 建议
在线阅读 下载PDF
基于双耳语音分离和丢失数据技术的鲁棒语音识别算法 被引量:11
5
作者 周琳 赵一良 +1 位作者 朱竑谕 汤一彬 《声学技术》 CSCD 北大核心 2019年第5期545-553,共9页
鲁棒语音识别技术在人机交互、智能家居、语音翻译系统等方面有重要应用。为了提高在噪声和语音干扰等复杂声学环境下的语音识别性能,基于人耳听觉系统的掩蔽效应和鸡尾酒效应,利用不同声源的空间方位,提出了基于双耳声源分离和丢失数... 鲁棒语音识别技术在人机交互、智能家居、语音翻译系统等方面有重要应用。为了提高在噪声和语音干扰等复杂声学环境下的语音识别性能,基于人耳听觉系统的掩蔽效应和鸡尾酒效应,利用不同声源的空间方位,提出了基于双耳声源分离和丢失数据技术的鲁棒语音识别算法。该算法首先根据目标语音的空间方位信息,在双耳声信号的等效矩形带宽(EquivalentRectangularBandwidth,ERB)子带内进行混合语音信号的分离,从而得到目标语音的数据流。针对分离后目标语音在频域存在频谱数据丢失的问题,利用丢失数据技术修正基于隐马尔科夫模型的概率计算,再进行语音识别。仿真实验表明,由于双耳声源分离方法得到的目标语音数据去除了噪声和干扰的影响,所提出的算法显著提高了复杂声学环境下的语音识别性能。 展开更多
关键词 空间听觉 双耳声源分离 丢失数据技术 误识率
在线阅读 下载PDF
结合注意力机制和因果卷积网络的维吾尔语方言识别 被引量:4
6
作者 孙杰 王宏 吾守尔·斯拉木 《声学技术》 CSCD 北大核心 2020年第6期697-703,共7页
针对传统x-vector模型生成方言语音段级表示时,未考虑不同帧级特征对方言辨识作用不一致的问题,以及维吾尔语的黏着性特点,提出结合注意力机制和因果卷积网络的维吾尔语方言识别方法。首先使用多层因果卷网络实现方言语音序列建模,然后... 针对传统x-vector模型生成方言语音段级表示时,未考虑不同帧级特征对方言辨识作用不一致的问题,以及维吾尔语的黏着性特点,提出结合注意力机制和因果卷积网络的维吾尔语方言识别方法。首先使用多层因果卷网络实现方言语音序列建模,然后采用空洞卷积核增大感受野扩展采样范围,最后使用注意力池化获取方言语音段级特征。维吾尔语方言识别实验结果表明,所提方法较标准x-vector模型方言识别的识别准确率提升了23.19个百分点。 展开更多
关键词 注意力机制 因果卷积网络 空洞卷积 维吾尔语方言 识别
在线阅读 下载PDF
基于注意力机制的LSTM语音情感主要特征选择 被引量:10
7
作者 胡婷婷 冯亚琴 +1 位作者 沈凌洁 王蔚 《声学技术》 CSCD 北大核心 2019年第4期414-421,共8页
传统的语音情感识别方式采用的语音特征具有数据量大且无关特征多的特点,因此选择出与情感相关的语音特征具有重要意义。通过提出将注意力机制结合长短时记忆网络(LongShortTermMemory,LSTM),根据注意力权重进行特征选择,在两个数据集... 传统的语音情感识别方式采用的语音特征具有数据量大且无关特征多的特点,因此选择出与情感相关的语音特征具有重要意义。通过提出将注意力机制结合长短时记忆网络(LongShortTermMemory,LSTM),根据注意力权重进行特征选择,在两个数据集上进行了实验。结果发现:(1)基于注意力机制的LSTM相比于单独的LSTM模型,识别率提高了5.4%,可见此算法有效提高了模型的识别效果;(2)注意力机制是一种有效的特征选择方法。采用注意力机制选择出了具有实际物理意义的声学特征子集,此特征集相比于原有公用特征集在降低了维数的情况下,提高了识别准确率;(3)根据选择结果对声学特征进行分析,发现有声片段长度特征、无声片段长度特征、梅尔倒谱系数(Mel-FrequencyCepstralCoefficient,MFCC)、F0基频等特征与情感识别具有较大相关性。 展开更多
关键词 特征选择 语音情感识别 深度学习 注意力机制
在线阅读 下载PDF
“有一说一”的认识立场表达研究
8
作者 何茹 《南华大学学报(社会科学版)》 2024年第6期102-108,共7页
“有一说一”标记主观认识立场,活跃在网络媒体和日常交际中。“有一说一”具有较高的语义确信度和灵活的话语位置,凸显言者认识、标示言者评价以及提示焦点信息是“有一说一”立场表达功能的具体体现。“有一说一”以客观形式包装言者... “有一说一”标记主观认识立场,活跃在网络媒体和日常交际中。“有一说一”具有较高的语义确信度和灵活的话语位置,凸显言者认识、标示言者评价以及提示焦点信息是“有一说一”立场表达功能的具体体现。“有一说一”以客观形式包装言者的主观立场,减少与听者的对立情绪,作为新的语言模因,受到合作原则的驱动,适应了网络交际的需要,也顺应了语言的发展。 展开更多
关键词 “有一说一” 语义确信度 立场表达 语用策略
在线阅读 下载PDF
从群母论浊声和摩擦——实验音韵学在汉语音韵学中的实验 被引量:44
9
作者 朱晓农 《语言研究》 CSSCI 北大核心 2003年第2期5-18,共14页
上古群母字部份在中古以前擦化,部份在中古以后清化,这是音韵学常识。但为什么这么变,却是以前没有问过的问题。本文以实验语音学、类型学为工具来解答这个问题。并连带着处理浊声清化、浊擦音、日母元音值等问题。本文提倡的汉语实验... 上古群母字部份在中古以前擦化,部份在中古以后清化,这是音韵学常识。但为什么这么变,却是以前没有问过的问题。本文以实验语音学、类型学为工具来解答这个问题。并连带着处理浊声清化、浊擦音、日母元音值等问题。本文提倡的汉语实验音韵学以普遍音变现象为考察对象,从物理、生理、心理学中的普遍原理来探索发生在汉语中的普遍音变的条件。而什么是普遍音变则是从共时类型学和反复发生的历史音变来确定的。 展开更多
关键词 实验音韵学 普遍音变 音变顺序 群母 日母 浊声 摩擦
在线阅读 下载PDF
基于深度学习的自然与表演语音情感识别 被引量:16
10
作者 王蔚 胡婷婷 冯亚琴 《南京大学学报(自然科学版)》 CAS CSCD 北大核心 2019年第4期660-666,共7页
语音是情感表达的重要途径,自然状态和表演状态下的语音所蕴含的情感信息并不完全相同.为了探索自然状态和表演状态下语音情感识别的差异,采用深度学习算法分析了IEMOCAP公用数据集,对自然状态和表演状态下的中性、愤怒、开心和悲伤等... 语音是情感表达的重要途径,自然状态和表演状态下的语音所蕴含的情感信息并不完全相同.为了探索自然状态和表演状态下语音情感识别的差异,采用深度学习算法分析了IEMOCAP公用数据集,对自然状态和表演状态下的中性、愤怒、开心和悲伤等四类情绪语音数据进行实验:首先提取语音数据的声学特征(对比了emobase2010特征集和eGeMAPs特征集),然后利用卷积神经网络(Convolutional Neural Networks,CNN)对自然与表演状态下的语音情感进行识别,比较了两种状态下的情感识别率,再利用混淆矩阵分析两种状态下不同情绪之间的误分率和相似性.实验结果显示,自然状态下的情感识别率明显高于表演状态下,还发现愤怒和悲伤在两种状态下的误分率有明显区别.该现象对理解情绪的表达机制有启发意义。 展开更多
关键词 情感类别 语音情感识别 深度学习 伪装语音
在线阅读 下载PDF
基于重要性评分的多级随机森林网络语音情感识别 被引量:3
11
作者 叶吉祥 涂晴宇 陈沅涛 《长沙理工大学学报(自然科学版)》 CAS 2019年第3期77-83,共7页
在源数据不充分或不平衡的情况下,深度学习方法在小样本集上难以取得令人满意的语音情感识别效果。因此,本研究构造了一种三层随机森林情感识别网络,在每一层都单独剥离易于区分的情感类别,并通过重要性评分方法,为每一层网络都构造一... 在源数据不充分或不平衡的情况下,深度学习方法在小样本集上难以取得令人满意的语音情感识别效果。因此,本研究构造了一种三层随机森林情感识别网络,在每一层都单独剥离易于区分的情感类别,并通过重要性评分方法,为每一层网络都构造一个识别特定类别的特征集,该特征集的每一个特征都依据贡献度大小得到赋权,以确保对分类贡献越多的特征因子对结果影响越大。本研究构建的多级情感识别网络,在小样本集语音情感识别的整体识别率上,较单层随机森林网络和支持向量机分别提高了5%和7%,较流行的深度学习方法卷积神经网络提高了12%。实验结果和理论分析表明:基于重要性评分的多级随机森林网络相较于其他方法,在源数据样本量较少和部分不平衡的情况下,有更高的识别准确率,具有语音情感识别方向的实际应用意义。 展开更多
关键词 随机森林 多级网络 重要性评分 特征赋权 情感差异 交叉验证
在线阅读 下载PDF
各频段的时域周期波动信息在中文元音和音调认知中的作用 被引量:2
12
作者 罗鑫 傅前杰 王仁华 《声学技术》 EI CSCD 北大核心 2005年第4期254-258,共5页
各种时域包络信息中,周期波动信息能显著增强频谱信息严重受损时的中文音调和句子识别;分析各频段的时域周期波动信息对中文语音识别的作用具有重要的理论和实际意义。为了在不同频段中保留时域周期波动信息,4频段电子耳蜗声学模拟实验... 各种时域包络信息中,周期波动信息能显著增强频谱信息严重受损时的中文音调和句子识别;分析各频段的时域周期波动信息对中文语音识别的作用具有重要的理论和实际意义。为了在不同频段中保留时域周期波动信息,4频段电子耳蜗声学模拟实验使用不同的低通滤波截止频率来提取各频段的时域包络。6种低通滤波截止频率组合包括:4频段都使用50Hz(all-50),4频段都使用500Hz(all-500),4频段中某一频段使用500Hz而其余三频段使用50Hz(ch1-500等)。辨识结果显示:ch4-500组合产生最高的,与all-500组合相似、比all-50组合显著增强的音调识别;而元音识别则不随低通滤波截止频率组合发生显著变化。这表明传递最高频段的时域周期波动信息对增强电子耳蜗使用者的中文音调识别最重要。 展开更多
关键词 周期波动 语音识别 电子耳蜗
在线阅读 下载PDF
联合使用助听器和增强电子耳蜗的使用者的中文语音识别 被引量:4
13
作者 罗鑫 傅前杰 王仁华 《北京生物医学工程》 2005年第4期250-253,267,共5页
目的 使用电子耳蜗与助听器联合的声学模拟考察在语音成形噪声中的中文语音识别。方法 使用1增1减的信噪比自适应变化过程,测试了6个具有正常听力、使用中文语言的被试者在语音成形噪声中的中文句子识别门限(speechrecognitionthresho... 目的 使用电子耳蜗与助听器联合的声学模拟考察在语音成形噪声中的中文语音识别。方法 使用1增1减的信噪比自适应变化过程,测试了6个具有正常听力、使用中文语言的被试者在语音成形噪声中的中文句子识别门限(speechrecognitionthresholds,SRT)。结果 中文语音识别门限SRT随模拟系统中助听器的低通滤波截止频率变化的曲线呈现与低通滤波的幅频响应相似的形状。结论 只要助听器恢复的残存低频声学听力覆盖了说话人的基频范围,这些低频信息就能显著地帮助电子耳蜗使用者在语音成形噪声中识别中文语音,无论电子耳蜗的整体输入频率范围与助听器恢复的频率范围是否交叠。 展开更多
关键词 电子耳蜗 助听器 语音识别 中文
在线阅读 下载PDF
基于DSP实现硬件压缩算法的语音信号记录仪
14
作者 张小蓟 郭国强 刘晓东 《电声技术》 2006年第7期63-65,共3页
利用DSP硬件完成语音压缩算法是语音信号记录与处理的一个强有力手段。结合高性能单片机MSP430大容量闪存即可组成一个便携式大容量语音信号记录仪。记录仪在430单片机的控制下,利用TRUESPEECH语音压缩算法可在一片256MFLASH上完成大于... 利用DSP硬件完成语音压缩算法是语音信号记录与处理的一个强有力手段。结合高性能单片机MSP430大容量闪存即可组成一个便携式大容量语音信号记录仪。记录仪在430单片机的控制下,利用TRUESPEECH语音压缩算法可在一片256MFLASH上完成大于14h的长时间语音信号的记录,且有良好的回放效果。设备具有时钟控制、信息添加与删除、振铃应答、自动增益控制等功能。 展开更多
关键词 数字信号处理 语音压缩算法 MSP430单片机
在线阅读 下载PDF
语音频率均衡在耳鸣康复仪中的应用
15
作者 郭国强 杨益新 李博 《电声技术》 2007年第6期31-33,共3页
以人耳等响曲线为依据,结合电声转换的原理,设计了一种语音频率均衡电路。该均衡器由多级数字电位器组成,对输出信号的幅度进行自适应调整,从而实现了各频率点声音响度的精确可控输出。临床试验表明,耳鸣康复仪中嵌入频率均衡器扩展了... 以人耳等响曲线为依据,结合电声转换的原理,设计了一种语音频率均衡电路。该均衡器由多级数字电位器组成,对输出信号的幅度进行自适应调整,从而实现了各频率点声音响度的精确可控输出。临床试验表明,耳鸣康复仪中嵌入频率均衡器扩展了它的使用范围,改善了耳鸣治疗的效果。 展开更多
关键词 语音频率均衡 耳鸣康复 幅度衰减
在线阅读 下载PDF
明代史料笔记的借词研究
16
作者 王祖霞 《淮海工学院学报(人文社会科学版)》 2018年第11期49-53,共5页
明代史料笔记数量多,词语丰富,是近代汉语研究的重要语料。借词是近代汉语词汇研究的重要组成部分,梳理明代史料笔记中的借词资料,分析其语义范畴与译介方式,探求其来源及形成途径,勾勒出明代史料笔记中借词的基本面貌,可以为明代借词... 明代史料笔记数量多,词语丰富,是近代汉语研究的重要语料。借词是近代汉语词汇研究的重要组成部分,梳理明代史料笔记中的借词资料,分析其语义范畴与译介方式,探求其来源及形成途径,勾勒出明代史料笔记中借词的基本面貌,可以为明代借词研究及近代汉语研究提供一定资料,为相关词典的编写提供一些补充,同时也还可以为当时的历史文化等研究提供一定的参考。 展开更多
关键词 明代 史料笔记 借词
在线阅读 下载PDF
不同水平的普通话学习者单字调声调感知研究 被引量:7
17
作者 帕丽扎提·克依木 古力努尔·艾尔肯 +1 位作者 米吉提·阿不里米提 艾斯卡尔·艾木都拉 《声学技术》 CSCD 北大核心 2020年第1期61-68,共8页
首先采用实验语音学的理论和方法进行比较分析,进一步了解普通话学习者声调学习的情况,通过定量研究的方法,对两种不同水平(高级水平和初级水平)学习者的声调感知进行声学分析并对学习普通话过程中的语调掌握状况展开探讨。考察了20名... 首先采用实验语音学的理论和方法进行比较分析,进一步了解普通话学习者声调学习的情况,通过定量研究的方法,对两种不同水平(高级水平和初级水平)学习者的声调感知进行声学分析并对学习普通话过程中的语调掌握状况展开探讨。考察了20名不同水平学习者对普通话声调学习的感知情况。按学习者对汉语9个单元音的4个声调感知和12个复合元音的4个声调的单字调辨认,以及阳平-上声的区分实验数据,统计学习者的辨认准确率、各调类的偏误率和反应时间,最后利用SPSS数据分析软件从统计的角度进行了辨认准确率和反应时间的相关性分析,分别对声调感知的准确率和反应时间的显著性差异进行检验。 展开更多
关键词 普通话习得者 声调感知 单字调 偏误分析
在线阅读 下载PDF
利用波束形成和神经网络进行语音增强 被引量:2
18
作者 龚杰 冯海泓 +2 位作者 陈友元 方义 牟宏宇 《声学技术》 CSCD 北大核心 2020年第3期323-328,共6页
语音增强在语音信号处理的前端非常重要,直接影响后端语音识别等效果。目前用神经网络进行单通道语音分离对于解决鸡尾酒会问题取得了很大的进步,但是用于复杂混合语音时分离效果仍不令人满意。针对单通道情形下的不足,使用多通道结构形... 语音增强在语音信号处理的前端非常重要,直接影响后端语音识别等效果。目前用神经网络进行单通道语音分离对于解决鸡尾酒会问题取得了很大的进步,但是用于复杂混合语音时分离效果仍不令人满意。针对单通道情形下的不足,使用多通道结构形成4个方向的超指向波束,结合神经网络算法实现对于指定方向的目标语音增强。仿真和实验结果表明,该算法相较于超指向波束形成算法和谱减法在多种评价指标上均有了明显的提升。 展开更多
关键词 语音增强 超指向波束形成 神经网络
在线阅读 下载PDF
注意力机制对生成对抗网络语音增强迁移学习模型的影响 被引量:2
19
作者 曹中辉 黄志华 +1 位作者 葛文萍 黄浩 《声学技术》 CSCD 北大核心 2021年第1期77-81,共5页
基于深度学习的语音增强模型对训练集外语言语音和噪声进行降噪时,性能明显下降。为了解决这一问题,提出一种引入注意力机制的生成对抗网络(Generative Adversarial Network,GAN)语音增强迁移学习模型。在生成对抗语音增强模型的判别模... 基于深度学习的语音增强模型对训练集外语言语音和噪声进行降噪时,性能明显下降。为了解决这一问题,提出一种引入注意力机制的生成对抗网络(Generative Adversarial Network,GAN)语音增强迁移学习模型。在生成对抗语音增强模型的判别模型中引入注意力机制,以高资源场景下的大量语音数据训练得到的语音增强模型为基础增强模型,结合低资源场景下的少量语音训练数据,对基础增强模型进行权重迁移,提升低资源场景下语音增强模型的增强效果。实验结果表明,采用注意力机制的生成对抗语音增强迁移学习模型,对低资源场景下的带噪语音和集外噪声可以进行有效的降噪。 展开更多
关键词 生成对抗网络(GAN) 语音增强 迁移学习 跨语言语音增强 注意力机制
在线阅读 下载PDF
非汉语母语者的普通话元音和辅音感知研究 被引量:3
20
作者 古扎丽努尔·德力木拉提 古力努尔·艾尔肯 +1 位作者 米吉提·阿不里米提 艾斯卡尔·艾木都拉 《声学技术》 CSCD 北大核心 2020年第2期214-219,共6页
语音感知研究是语音学主要研究内容之一。为了解学习者对普通话元音和辅音的感知情况,并为汉语教学提供借鉴,拓宽言语学习模型的应用领域,减少教学的盲目性,根据第二语言习得理论模式,采用实验语音学和统计学的方法,设计辨认实验和区分... 语音感知研究是语音学主要研究内容之一。为了解学习者对普通话元音和辅音的感知情况,并为汉语教学提供借鉴,拓宽言语学习模型的应用领域,减少教学的盲目性,根据第二语言习得理论模式,采用实验语音学和统计学的方法,设计辨认实验和区分实验,分别对普通话水平处于高级和初级水平的20名维吾尔族大学生元音、塞音、擦音和塞擦音的感知情况进行研究。辨认实验考察学习者对元音和辅音的感知反应时间和感知准确率。在区分实验中,计算元音对的频谱距离,辅音对的频谱距离,以及它们的时长差异,对学习者的区分能力进行分析。实验结果显示高级水平学习者的感知元音和辅音的能力明显高于初级水平学习者。学习者对发音部位靠后的元音反应时间快且感知准确率高,对于发音部位靠前的元音反应时间较慢且感知准确率低,对塞擦音的辨认准确率高,对擦音的辨认准确度最低。元音对的频谱距离和辅音对的时长差异会影响到学习者的区分能力,但辅音对的频谱距离和区分情况不存在密切联系。 展开更多
关键词 辨认实验 区分实验 语音感知 频谱距离 时长差异
在线阅读 下载PDF
上一页 1 2 下一页 到第
使用帮助 返回顶部