期刊文献+
共找到5篇文章
< 1 >
每页显示 20 50 100
基于子字单元的维吾尔语语音识别研究 被引量:5
1
作者 薛化建 董兴华 +2 位作者 周喜 吐尔洪.吾司曼 李晓 《计算机工程》 CAS CSCD 北大核心 2011年第20期208-210,共3页
为提高维吾尔语语音识别的识别率,在分析维吾尔语特点的基础上,设计一种基于子字单元的维吾尔语语音识别总体结构,指出维吾尔语单词的发音模型,给出构建子字发音字典的方法,及其以子字单元为基础构建语言模型与声学模型的方法。在一个... 为提高维吾尔语语音识别的识别率,在分析维吾尔语特点的基础上,设计一种基于子字单元的维吾尔语语音识别总体结构,指出维吾尔语单词的发音模型,给出构建子字发音字典的方法,及其以子字单元为基础构建语言模型与声学模型的方法。在一个语音库上进行实验,采用一种非监督的词切分方法对维吾尔语单词进行词切分,生成子字。实验结果表明,基于子字单元的维吾尔语语音识别可以获得更好的识别结果。 展开更多
关键词 维吾尔语 词切分 子字单元 隐马尔科夫模型 连续语音识别
在线阅读 下载PDF
基于子词的句子级别神经机器翻译的译文质量估计方法 被引量:14
2
作者 李培芸 翟煜锦 +4 位作者 项青宇 李茂西 裘白莲 罗文兵 王明文 《厦门大学学报(自然科学版)》 CAS CSCD 北大核心 2020年第2期159-166,共8页
目前性能最优的译文质量估计系统使用神经机器翻译中的编码器-解码器模型作为特征提取器.该方法由于限制词表大小易导致数据稀疏问题,从而使得较多的未登陆词不能被正确评价.为了缓解上述问题,在详细分析不同子词切分方法的特点后,提出... 目前性能最优的译文质量估计系统使用神经机器翻译中的编码器-解码器模型作为特征提取器.该方法由于限制词表大小易导致数据稀疏问题,从而使得较多的未登陆词不能被正确评价.为了缓解上述问题,在详细分析不同子词切分方法的特点后,提出了基于字节对编码(BPE)子词切分和基于一元文法语言模型子词切分的神经译文质量估计方法,并将两者的译文质量估计的得分与基于词语切分的神经译文质量估计得分融合后进行译文质量估计.在WMT18句子级别译文质量估计子任务数据集上的实验结果表明:融合BPE子词切分、一元文法语言模型子词切分和词语切分的神经译文质量估计方法的性能在多个评测子任务上超过了WMT18给出的最好参与系统,深入的实验分析进一步揭示了融合不同粒度的句子切分方法提高了译文质量估计的健壮性. 展开更多
关键词 质量估计 神经机器翻译 子词 编码器-解码器模型 循环神经网络 联合神经网络
在线阅读 下载PDF
高性能子字并行运算单元的设计与实现 被引量:3
3
作者 董冕 吴丹 +3 位作者 饶金理 黄威 戴葵 邹雪城 《计算机工程》 CAS CSCD 2012年第16期249-252,共4页
通过硬件共享的方式实现一套高性能子字并行运算单元,运算单元采用流水线设计,可以一个周期进行1个64-bit、2个32-bit、4个16-bit或8个8-bit定点运算,1个双精度或2个单精度浮点运算。运算单元采用Verilog HDL设计,在0.18μm标准CMOS工... 通过硬件共享的方式实现一套高性能子字并行运算单元,运算单元采用流水线设计,可以一个周期进行1个64-bit、2个32-bit、4个16-bit或8个8-bit定点运算,1个双精度或2个单精度浮点运算。运算单元采用Verilog HDL设计,在0.18μm标准CMOS工艺库下实现,并针对实际多媒体应用程序基于ESCA系统进行性能评测。实验结果表明,该运算单元可以在硬件开销和性能上获得较好的平衡。 展开更多
关键词 多媒体技术 子字并行 硬件共享 运算单元 ESCA系统 协处理器
在线阅读 下载PDF
基于预训练与音素字节对编码的越南语识别 被引量:4
4
作者 沈之杰 郭武 《数据采集与处理》 CSCD 北大核心 2023年第1期101-110,共10页
基于无监督预训练技术的wav2vec 2.0在许多低资源语种上获得了良好的性能,成为研究的热点。本文在预训练模型的基础上进行越南语连续语音识别。将语音学信息引入到基于链接时序分类代价函数(Connectionist temporal classification,CTC... 基于无监督预训练技术的wav2vec 2.0在许多低资源语种上获得了良好的性能,成为研究的热点。本文在预训练模型的基础上进行越南语连续语音识别。将语音学信息引入到基于链接时序分类代价函数(Connectionist temporal classification,CTC)的声学建模中,选取音素与含位置信息的音素作为基础单元。为了平衡建模单元数目以及模型的精细程度,采用字节对编码(Byte-pair encoding,BPE)算法生成音素子词,将上下文信息结合到声学建模过程。实验在美国NIST的BABEL任务低资源的越南语开发集上进行,所提算法相对wav2vec 2.0基线系统有明显改进,识别词错误率由37.3%降低到29.4%。 展开更多
关键词 低资源语音识别 建模单元 字节对编码 音素子词 预训练 越南语识别
在线阅读 下载PDF
支持媒体处理的子字绝对值单元设计与实现
5
作者 开耀文 高德远 张萌 《微处理机》 2012年第4期18-22,共5页
子字并行结构的计算单元是提高多媒体应用程序性能的有效方式。研究和实现了支持子字并行的32位绝对值单元,并优化了该单元的关键路径。从时序,面积等方面对三种设计方案进行了分析比较。结果表明经过优化的子字并行绝对值单元在保证面... 子字并行结构的计算单元是提高多媒体应用程序性能的有效方式。研究和实现了支持子字并行的32位绝对值单元,并优化了该单元的关键路径。从时序,面积等方面对三种设计方案进行了分析比较。结果表明经过优化的子字并行绝对值单元在保证面积大小的同时,减小了整个单元的延时。 展开更多
关键词 子字并行 加法器 绝对值单元 进位截断 和加一
在线阅读 下载PDF
上一页 1 下一页 到第
使用帮助 返回顶部