期刊导航
期刊开放获取
vip
退出
期刊文献
+
任意字段
题名或关键词
题名
关键词
文摘
作者
第一作者
机构
刊名
分类号
参考文献
作者简介
基金资助
栏目信息
任意字段
题名或关键词
题名
关键词
文摘
作者
第一作者
机构
刊名
分类号
参考文献
作者简介
基金资助
栏目信息
检索
高级检索
期刊导航
共找到
7
篇文章
<
1
>
每页显示
20
50
100
已选择
0
条
导出题录
引用分析
参考文献
引证文献
统计分析
检索结果
已选文献
显示方式:
文摘
详细
列表
相关度排序
被引量排序
时效性排序
WFST解码器词图生成算法中的非活跃节点检测与内存优化
1
作者
丁佳伟
刘加
+3 位作者
张卫强
冯运波
刘利军
于乐
《中国科学院大学学报(中英文)》
CSCD
北大核心
2019年第1期109-114,共6页
解码器引擎是语音识别系统的核心模块,而基于加权有限状态机(WFST)的解码器则是解码器的一种典型形式。分析静态WFST解码器在实际应用中的资源占用问题,提出一种在解码和词图生成过程中通过检测非活跃节点动态回收系统资源的策略。最后,...
解码器引擎是语音识别系统的核心模块,而基于加权有限状态机(WFST)的解码器则是解码器的一种典型形式。分析静态WFST解码器在实际应用中的资源占用问题,提出一种在解码和词图生成过程中通过检测非活跃节点动态回收系统资源的策略。最后,在OpenKWS 15数据集上进行实验,证明该策略使解码器的内存消耗比不回收系统资源的解码器降低75%左右。
展开更多
关键词
语音识别解码器
加权有限状态机
工程应用
内存回收
在线阅读
下载PDF
职称材料
基于WFST的俄语字音转换算法研究
被引量:
3
2
作者
冯伟
易绵竹
马延周
《中文信息学报》
CSCD
北大核心
2018年第2期87-93,101,共8页
在俄语语音信息处理的资源建设中,字音转换技术起到了至关重要的作用。该文尝试对基于SAMPA的俄语音素集进行改进设计,使标音结果能够反映俄语单词的重音位置及元音弱化现象。依据改进的新音素集构建了包含20 000词的俄语发音词典。在...
在俄语语音信息处理的资源建设中,字音转换技术起到了至关重要的作用。该文尝试对基于SAMPA的俄语音素集进行改进设计,使标音结果能够反映俄语单词的重音位置及元音弱化现象。依据改进的新音素集构建了包含20 000词的俄语发音词典。在此基础上,实现了一种数据驱动的俄语字音转换算法,将加权有限状态转化器(WFST)应用于算法的对齐、建模和解码过程中。首先利用期望最大化算法以"多对多"的方式对俄语字音进行对齐,然后将对齐结果通过联合N-gram模型训练,并转化为WFST发音模型,最后通过WFST解码算法对任意单词的发音进行预测。交叉验证实验结果表明,平均词形正确率为62.9%,平均音素正确率为92.2%。
展开更多
关键词
字音转换
俄语
发音词典
加权有限状态转化器
在线阅读
下载PDF
职称材料
词类扩充方法在语音识别中的应用
被引量:
3
3
作者
杨林国
《电子技术应用》
北大核心
2014年第6期123-125,129,共4页
针对当前基于N-gram的语言模型在特定领域的数据稀缺(如歌手名、音乐名等),提出了基于特定领域的词类扩充方法,从而有效解决特定领域词表即时扩充的问题。
关键词
自动语音识别
听写
语言模型
N-GRAM
wfst
CMN
在线阅读
下载PDF
职称材料
基于加权有限状态机的动态匹配词图生成算法
被引量:
4
4
作者
郭宇弘
黎塔
+2 位作者
肖业鸣
潘接林
颜永红
《电子与信息学报》
EI
CSCD
北大核心
2014年第1期140-146,共7页
由于现有的加权有限状态机(WFST)解码网络没有精确词尾标记,导致当前已有的词图生成算法不含精确的词尾时间点,或者仅是状态、音素级别的词图,无法应用到关键词检索中。该文提出在WFST静态解码器下的语音识别词图生成算法。首先从理论...
由于现有的加权有限状态机(WFST)解码网络没有精确词尾标记,导致当前已有的词图生成算法不含精确的词尾时间点,或者仅是状态、音素级别的词图,无法应用到关键词检索中。该文提出在WFST静态解码器下的语音识别词图生成算法。首先从理论上分析了WFST解码音素图和词图的可转换关系,然后提出了字典的动态音素匹配方法解决了WFST网络中词尾时间点对齐的问题,最后通过令牌传递的遍历方法生成了词图。同时,考虑到计算量优化,在令牌传递过程中引入了剪枝算法,使音素图转词图的耗时不到解码耗时的3%。得到的词图,不仅可以用于语言模型重打分,由于含有精确的词尾时间点,还可以直接应用到关键词检索系统中。实验结果表明,该文的词图生成算法具有较高的计算效率;和已有动态解码器的词图相比,词图中包含更多解码信息,在大词汇连续语音识别的重打分结果和关键词检索中都能取得更好的性能。
展开更多
关键词
自动语音识别
加权有限状态机
词图生成
关键词检索
在线阅读
下载PDF
职称材料
基于多模型融合的人名翻译系统
被引量:
2
5
作者
庞薇
徐波
《中文信息学报》
CSCD
北大核心
2009年第1期44-49,共6页
该文提出了一种基于加权有限状态转化器(WFST)的多模型融合人名翻译框架。该框架以两个基于字符的转换模型和两个基于发音的转换模型为核心,通过加权有限状态转换器将多模型进行融合实现对人名的翻译。与单个模型相比,该文提出的方法的...
该文提出了一种基于加权有限状态转化器(WFST)的多模型融合人名翻译框架。该框架以两个基于字符的转换模型和两个基于发音的转换模型为核心,通过加权有限状态转换器将多模型进行融合实现对人名的翻译。与单个模型相比,该文提出的方法的优势在于通过从各种信息源得到的数据价值的最大化。实验结果表明,基于多模型融合方法的人名翻译的错误率比单一模型的人名翻译的错误率降低了7.14%。
展开更多
关键词
计算机应用
中文信息处理
多模型融合
音译
命名实体
加权有限状态转换器
在线阅读
下载PDF
职称材料
低空间复杂度的加权有限状态转换器合成算法
6
作者
李伟
吴及
吕萍
《计算机应用研究》
CSCD
北大核心
2011年第8期2931-2934,共4页
利用加权有限状态转换器相关的合成操作,可以将语音识别需要的模型进行组合,便于识别中各种知识的综合利用,从而提升识别性能。传统合成算法在计算的同时存储了无效状态与状态转移。在进行词典与语言模型等合成操作时,算法需要1 GB甚至...
利用加权有限状态转换器相关的合成操作,可以将语音识别需要的模型进行组合,便于识别中各种知识的综合利用,从而提升识别性能。传统合成算法在计算的同时存储了无效状态与状态转移。在进行词典与语言模型等合成操作时,算法需要1 GB甚至更多内存保存无效信息,这直接导致了算法的高空间复杂度。为解决这一问题,提出同步裁剪合成算法(synchronized pruning composition algorithm,SPCA)。新算法对传统合成算法进行了改进,在合成的同时对无效信息进行及时的分析和去除。实验表明,与经典的合成算法相比,SPCA平均节约内存14.99%,所用最大内存节约25.72%,有效降低了合成的空间复杂度。
展开更多
关键词
加权有限状态转换器
合成
有向图
空间复杂度
语音识别
在线阅读
下载PDF
职称材料
基于双向长短时记忆联结时序分类和加权有限状态转换器的端到端中文语音识别系统
被引量:
17
7
作者
姚煜
RYAD Chellali
《计算机应用》
CSCD
北大核心
2018年第9期2495-2499,共5页
针对隐马尔可夫模型(HMM)在语音识别中存在的不合理条件假设,进一步研究循环神经网络的序列建模能力,提出了基于双向长短时记忆神经网络的声学模型构建方法,并将联结时序分类(CTC)训练准则成功地应用于该声学模型训练中,搭建出不依赖于...
针对隐马尔可夫模型(HMM)在语音识别中存在的不合理条件假设,进一步研究循环神经网络的序列建模能力,提出了基于双向长短时记忆神经网络的声学模型构建方法,并将联结时序分类(CTC)训练准则成功地应用于该声学模型训练中,搭建出不依赖于隐马尔可夫模型的端到端中文语音识别系统;同时设计了基于加权有限状态转换器(WFST)的语音解码方法,有效解决了发音词典和语言模型难以融入解码过程的问题。与传统GMM-HMM系统和混合DNN-HMM系统对比,实验结果显示该端到端系统不仅明显降低了识别错误率,而且大幅提高了语音解码速度,表明了该声学模型可以有效地增强模型区分度和优化系统结构。
展开更多
关键词
语音识别
长短时记忆神经网络
联结时序分类
加权有限状态转换器
端到端系统
在线阅读
下载PDF
职称材料
题名
WFST解码器词图生成算法中的非活跃节点检测与内存优化
1
作者
丁佳伟
刘加
张卫强
冯运波
刘利军
于乐
机构
清华大学电子工程系
中国移动通信信息安全管理与运行中心
出处
《中国科学院大学学报(中英文)》
CSCD
北大核心
2019年第1期109-114,共6页
基金
国家自然科学基金(U1836219)资助
文摘
解码器引擎是语音识别系统的核心模块,而基于加权有限状态机(WFST)的解码器则是解码器的一种典型形式。分析静态WFST解码器在实际应用中的资源占用问题,提出一种在解码和词图生成过程中通过检测非活跃节点动态回收系统资源的策略。最后,在OpenKWS 15数据集上进行实验,证明该策略使解码器的内存消耗比不回收系统资源的解码器降低75%左右。
关键词
语音识别解码器
加权有限状态机
工程应用
内存回收
Keywords
speech recognition decoder
wfst
engineering application
memory recycling
分类号
TN912 [电子电信—通信与信息系统]
在线阅读
下载PDF
职称材料
题名
基于WFST的俄语字音转换算法研究
被引量:
3
2
作者
冯伟
易绵竹
马延周
机构
战略支援部队信息工程大学洛阳校区
出处
《中文信息学报》
CSCD
北大核心
2018年第2期87-93,101,共8页
基金
洛阳市社会科学规划项目(2016B285)
文摘
在俄语语音信息处理的资源建设中,字音转换技术起到了至关重要的作用。该文尝试对基于SAMPA的俄语音素集进行改进设计,使标音结果能够反映俄语单词的重音位置及元音弱化现象。依据改进的新音素集构建了包含20 000词的俄语发音词典。在此基础上,实现了一种数据驱动的俄语字音转换算法,将加权有限状态转化器(WFST)应用于算法的对齐、建模和解码过程中。首先利用期望最大化算法以"多对多"的方式对俄语字音进行对齐,然后将对齐结果通过联合N-gram模型训练,并转化为WFST发音模型,最后通过WFST解码算法对任意单词的发音进行预测。交叉验证实验结果表明,平均词形正确率为62.9%,平均音素正确率为92.2%。
关键词
字音转换
俄语
发音词典
加权有限状态转化器
Keywords
G2P
Russian
pronunciation dictionary
wfst
分类号
TP391 [自动化与计算机技术—计算机应用技术]
在线阅读
下载PDF
职称材料
题名
词类扩充方法在语音识别中的应用
被引量:
3
3
作者
杨林国
机构
安徽职业技术学院
出处
《电子技术应用》
北大核心
2014年第6期123-125,129,共4页
文摘
针对当前基于N-gram的语言模型在特定领域的数据稀缺(如歌手名、音乐名等),提出了基于特定领域的词类扩充方法,从而有效解决特定领域词表即时扩充的问题。
关键词
自动语音识别
听写
语言模型
N-GRAM
wfst
CMN
Keywords
ASR
dictation
LM
N-Gram
wfst
CMN
分类号
TP3 [自动化与计算机技术—计算机科学与技术]
在线阅读
下载PDF
职称材料
题名
基于加权有限状态机的动态匹配词图生成算法
被引量:
4
4
作者
郭宇弘
黎塔
肖业鸣
潘接林
颜永红
机构
中国科学院语言声学与内容理解重点实验室
出处
《电子与信息学报》
EI
CSCD
北大核心
2014年第1期140-146,共7页
基金
国家自然科学基金(10925419
90920302
+8 种基金
61072124
11074275
11161140319
91120001
61271426)
中国科学院战略性先导科技专项(XDA06030100
XDA06030500)
国家863计划项目(2012AA012503)
中科院重点部署项目(KGZD-EW-103-2)资助课题
文摘
由于现有的加权有限状态机(WFST)解码网络没有精确词尾标记,导致当前已有的词图生成算法不含精确的词尾时间点,或者仅是状态、音素级别的词图,无法应用到关键词检索中。该文提出在WFST静态解码器下的语音识别词图生成算法。首先从理论上分析了WFST解码音素图和词图的可转换关系,然后提出了字典的动态音素匹配方法解决了WFST网络中词尾时间点对齐的问题,最后通过令牌传递的遍历方法生成了词图。同时,考虑到计算量优化,在令牌传递过程中引入了剪枝算法,使音素图转词图的耗时不到解码耗时的3%。得到的词图,不仅可以用于语言模型重打分,由于含有精确的词尾时间点,还可以直接应用到关键词检索系统中。实验结果表明,该文的词图生成算法具有较高的计算效率;和已有动态解码器的词图相比,词图中包含更多解码信息,在大词汇连续语音识别的重打分结果和关键词检索中都能取得更好的性能。
关键词
自动语音识别
加权有限状态机
词图生成
关键词检索
Keywords
Automatic speech recognition
Weighted Finite State Transducer (
wfst
)
Lattice generation
Keyword spotting
分类号
TP391.42 [自动化与计算机技术—计算机应用技术]
在线阅读
下载PDF
职称材料
题名
基于多模型融合的人名翻译系统
被引量:
2
5
作者
庞薇
徐波
机构
中国科学院自动化研究所数字内容技术研究中心
中国科学院自动化研究所模式识别国家重点实验室
出处
《中文信息学报》
CSCD
北大核心
2009年第1期44-49,共6页
基金
国家863计划资助项目(2006AA01Z194)
文摘
该文提出了一种基于加权有限状态转化器(WFST)的多模型融合人名翻译框架。该框架以两个基于字符的转换模型和两个基于发音的转换模型为核心,通过加权有限状态转换器将多模型进行融合实现对人名的翻译。与单个模型相比,该文提出的方法的优势在于通过从各种信息源得到的数据价值的最大化。实验结果表明,基于多模型融合方法的人名翻译的错误率比单一模型的人名翻译的错误率降低了7.14%。
关键词
计算机应用
中文信息处理
多模型融合
音译
命名实体
加权有限状态转换器
Keywords
computer application
Chinese information processing
multiple model combination
transliteration
named entity
wfst
分类号
TP391 [自动化与计算机技术—计算机应用技术]
在线阅读
下载PDF
职称材料
题名
低空间复杂度的加权有限状态转换器合成算法
6
作者
李伟
吴及
吕萍
机构
清华大学电子工程系
出处
《计算机应用研究》
CSCD
北大核心
2011年第8期2931-2934,共4页
文摘
利用加权有限状态转换器相关的合成操作,可以将语音识别需要的模型进行组合,便于识别中各种知识的综合利用,从而提升识别性能。传统合成算法在计算的同时存储了无效状态与状态转移。在进行词典与语言模型等合成操作时,算法需要1 GB甚至更多内存保存无效信息,这直接导致了算法的高空间复杂度。为解决这一问题,提出同步裁剪合成算法(synchronized pruning composition algorithm,SPCA)。新算法对传统合成算法进行了改进,在合成的同时对无效信息进行及时的分析和去除。实验表明,与经典的合成算法相比,SPCA平均节约内存14.99%,所用最大内存节约25.72%,有效降低了合成的空间复杂度。
关键词
加权有限状态转换器
合成
有向图
空间复杂度
语音识别
Keywords
wfst
(weighted finite-state transducer)
composition
digraph
space-complexity
speech recognition
分类号
TP301.1 [自动化与计算机技术—计算机系统结构]
TP301.6 [自动化与计算机技术—计算机系统结构]
在线阅读
下载PDF
职称材料
题名
基于双向长短时记忆联结时序分类和加权有限状态转换器的端到端中文语音识别系统
被引量:
17
7
作者
姚煜
RYAD Chellali
机构
南京工业大学电气工程与控制科学学院
出处
《计算机应用》
CSCD
北大核心
2018年第9期2495-2499,共5页
文摘
针对隐马尔可夫模型(HMM)在语音识别中存在的不合理条件假设,进一步研究循环神经网络的序列建模能力,提出了基于双向长短时记忆神经网络的声学模型构建方法,并将联结时序分类(CTC)训练准则成功地应用于该声学模型训练中,搭建出不依赖于隐马尔可夫模型的端到端中文语音识别系统;同时设计了基于加权有限状态转换器(WFST)的语音解码方法,有效解决了发音词典和语言模型难以融入解码过程的问题。与传统GMM-HMM系统和混合DNN-HMM系统对比,实验结果显示该端到端系统不仅明显降低了识别错误率,而且大幅提高了语音解码速度,表明了该声学模型可以有效地增强模型区分度和优化系统结构。
关键词
语音识别
长短时记忆神经网络
联结时序分类
加权有限状态转换器
端到端系统
Keywords
speech recognition
Long Short-Term Memory(LSTM)neural network
Connectionist Temporal Classification(CTC)
Weight Finite-State Transducer(
wfst
)
end-to-end system
分类号
TN912.34 [电子电信—通信与信息系统]
在线阅读
下载PDF
职称材料
题名
作者
出处
发文年
被引量
操作
1
WFST解码器词图生成算法中的非活跃节点检测与内存优化
丁佳伟
刘加
张卫强
冯运波
刘利军
于乐
《中国科学院大学学报(中英文)》
CSCD
北大核心
2019
0
在线阅读
下载PDF
职称材料
2
基于WFST的俄语字音转换算法研究
冯伟
易绵竹
马延周
《中文信息学报》
CSCD
北大核心
2018
3
在线阅读
下载PDF
职称材料
3
词类扩充方法在语音识别中的应用
杨林国
《电子技术应用》
北大核心
2014
3
在线阅读
下载PDF
职称材料
4
基于加权有限状态机的动态匹配词图生成算法
郭宇弘
黎塔
肖业鸣
潘接林
颜永红
《电子与信息学报》
EI
CSCD
北大核心
2014
4
在线阅读
下载PDF
职称材料
5
基于多模型融合的人名翻译系统
庞薇
徐波
《中文信息学报》
CSCD
北大核心
2009
2
在线阅读
下载PDF
职称材料
6
低空间复杂度的加权有限状态转换器合成算法
李伟
吴及
吕萍
《计算机应用研究》
CSCD
北大核心
2011
0
在线阅读
下载PDF
职称材料
7
基于双向长短时记忆联结时序分类和加权有限状态转换器的端到端中文语音识别系统
姚煜
RYAD Chellali
《计算机应用》
CSCD
北大核心
2018
17
在线阅读
下载PDF
职称材料
已选择
0
条
导出题录
引用分析
参考文献
引证文献
统计分析
检索结果
已选文献
上一页
1
下一页
到第
页
确定
用户登录
登录
IP登录
使用帮助
返回顶部