期刊文献+
共找到36篇文章
< 1 2 >
每页显示 20 50 100
High Performance Motion Estimation Operator Using Multimedia Oriented Subword Parallelism
1
作者 Shafqat Khan Emmanuel Casseau 《通讯和计算机(中英文版)》 2012年第1期1-14,共14页
关键词 多媒体应用 并行处理 计算单位 运动估计 性能 资源利用率 经营单位 SWP
在线阅读 下载PDF
基于子词的双层CRFs中文分词 被引量:23
2
作者 黄德根 焦世斗 周惠巍 《计算机研究与发展》 EI CSCD 北大核心 2010年第5期962-968,共7页
提出了基于子词的双层CRFs(conditional random fields)中文分词方法,旨在解决中文分词中切分歧义与未登录词的问题.该方法是建立在基于子词的序列标注模型上.方法第1层利用基于字CRFs模型来识别待测语料中的子词,这样做是为了减少子词... 提出了基于子词的双层CRFs(conditional random fields)中文分词方法,旨在解决中文分词中切分歧义与未登录词的问题.该方法是建立在基于子词的序列标注模型上.方法第1层利用基于字CRFs模型来识别待测语料中的子词,这样做是为了减少子词的跨越标记错误和增加子词识别的精确率;第2层利用CRFs模型学习基于子词的序列标注,对第1层的输出进行测试,进而得到分词结果.在2006年SIGHAN Bakeoff的中文简体语料上进行了测试,包括UPUC和MSRA语料,分别在F值上达到了93.3%和96.1%的精度.实验表明,基于子词的双层CRFs模型能够更加有效地利用子词来提高中文分词的精度. 展开更多
关键词 中文分词 条件随机场 双层条件随机场 子词 子词过滤
在线阅读 下载PDF
基于词根的中国手语识别方法 被引量:5
3
作者 王春立 高文 +1 位作者 马继勇 高秀娟 《计算机研究与发展》 EI CSCD 北大核心 2003年第2期150-156,共7页
迄今为止 ,手语识别面临的最大问题是如何解决词汇集易扩充的连续识别 提出一种大词汇量连续中国手语识别方法 ,将词根作为识别基元 ,由于基元的数目是有限的 ,因此基于HMM的手语信号的训练和识别变得比较容易处理 ,可以实现更大词汇... 迄今为止 ,手语识别面临的最大问题是如何解决词汇集易扩充的连续识别 提出一种大词汇量连续中国手语识别方法 ,将词根作为识别基元 ,由于基元的数目是有限的 ,因此基于HMM的手语信号的训练和识别变得比较容易处理 ,可以实现更大词汇量的识别 除此之外 ,所提方法还有利于实现手势语和手指语的混合识别 从中国手语中共整理出2 4 0 0多个词根 ,为每个词根建一个并行的HMM模型 ,对各数据流的HMM模型进行聚类 ,确定出手语识别的基元 根据这些基元对手势词编码 ,并建立了树状搜索网格 ,使用状态结点上高斯密度函数聚类、语言模型和N Best方法提高系统的速度和精度 对 5 119个手语词做了实验 ,连续语句的识别率可在 90 展开更多
关键词 词根 中国手语识别方法 HMM模型 图像处理 快速匹配算法 计算机 手语自动翻译系统
在线阅读 下载PDF
基于子字单元的维吾尔语语音识别研究 被引量:5
4
作者 薛化建 董兴华 +2 位作者 周喜 吐尔洪.吾司曼 李晓 《计算机工程》 CAS CSCD 北大核心 2011年第20期208-210,共3页
为提高维吾尔语语音识别的识别率,在分析维吾尔语特点的基础上,设计一种基于子字单元的维吾尔语语音识别总体结构,指出维吾尔语单词的发音模型,给出构建子字发音字典的方法,及其以子字单元为基础构建语言模型与声学模型的方法。在一个... 为提高维吾尔语语音识别的识别率,在分析维吾尔语特点的基础上,设计一种基于子字单元的维吾尔语语音识别总体结构,指出维吾尔语单词的发音模型,给出构建子字发音字典的方法,及其以子字单元为基础构建语言模型与声学模型的方法。在一个语音库上进行实验,采用一种非监督的词切分方法对维吾尔语单词进行词切分,生成子字。实验结果表明,基于子字单元的维吾尔语语音识别可以获得更好的识别结果。 展开更多
关键词 维吾尔语 词切分 子字单元 隐马尔科夫模型 连续语音识别
在线阅读 下载PDF
一种高性能子字并行乘法器的设计与实现 被引量:3
5
作者 黄立波 岳虹 +1 位作者 陆洪毅 戴葵 《计算机工程与应用》 CSCD 北大核心 2007年第20期104-106,131,共4页
提出了一种支持子字并行的乘法器体系结构,并完成了其VLSI设计与实现。该乘法器在16bit阵列子字并行结构的基础上,扩展了有符号与无符号之间的混合操作,采用多周期合并技术,实现了32bit宽度的子字并行,并支持子字模式的乘累加,同时采用... 提出了一种支持子字并行的乘法器体系结构,并完成了其VLSI设计与实现。该乘法器在16bit阵列子字并行结构的基础上,扩展了有符号与无符号之间的混合操作,采用多周期合并技术,实现了32bit宽度的子字并行,并支持子字模式的乘累加,同时采用流水线设计技术,能够在单周期内完成4个8×8、2个16×16或1个32×16的有符号/无符号乘法操作。0.18μm的标准单元库的实现表明该乘法器既能减小面积又能提高主频,是硬件消耗和运算性能的较好折衷,非常适用于多媒体微处理器的设计。 展开更多
关键词 子字并行 乘法器 多媒体
在线阅读 下载PDF
子字并行加法器的研究与实现 被引量:2
6
作者 马胜 黄立波 +2 位作者 王志英 刘聪 戴葵 《计算机工程与应用》 CSCD 北大核心 2009年第36期54-59,共6页
子字并行加法器能够有效提高多媒体应用程序的处理性能。基于门延迟模型对加法器原理及性能进行了分析,设计了进位截断和进位消除两种子字并行控制机制。在这两种机制的指导下,实现了多种子字并行加法器,并对它们的性能进行了比较和分... 子字并行加法器能够有效提高多媒体应用程序的处理性能。基于门延迟模型对加法器原理及性能进行了分析,设计了进位截断和进位消除两种子字并行控制机制。在这两种机制的指导下,实现了多种子字并行加法器,并对它们的性能进行了比较和分析。结果表明进位消除机制相对于进位截断机制需要较短的延时,较少的逻辑门数以及较低的功耗。在各种子字并行加法器中,Kogge-Stone加法器具有最少的延迟时间,RCA加法器具有最少的逻辑门数和最低的功耗。研究结果可以用于指导子字并行加法器的设计与选择。 展开更多
关键词 子字并行 加法器 进位截断 进位消除
在线阅读 下载PDF
基于自注意力机制神经机器翻译的软件缺陷自动修复方法 被引量:6
7
作者 曹鹤玲 刘昱 韩栋 《电子学报》 EI CAS CSCD 北大核心 2024年第3期945-956,共12页
循环神经网络对于代码序列数据有着良好的处理能力,软件缺陷修复的补丁生成模型大多采用循环神经网络实现.然而,基于循环神经网络的补丁生成模型在处理代码序列中长距离依赖问题时仍然具有局限性,其修复成功率和修复效率较低.针对此问题... 循环神经网络对于代码序列数据有着良好的处理能力,软件缺陷修复的补丁生成模型大多采用循环神经网络实现.然而,基于循环神经网络的补丁生成模型在处理代码序列中长距离依赖问题时仍然具有局限性,其修复成功率和修复效率较低.针对此问题,提出一种基于自注意力神经机器翻译的软件缺陷自动修复方法(Self-attention Neural machine translation based automatic software Repair,SNRepair).首先,为有效缓解源码中的未登录词问题,对数据集引入子词切分技术进行预处理;其次,为解决源代码中棘手的长距离依赖问题并更充分地利用局部信息,构建融合局部建模的Transformer程序补丁生成模型;然后,采用缺陷自动定位技术定位缺陷语句位置,利用参数优化后的Transformer补丁生成模型生成候选补丁;最后,运行测试用例验证候选补丁.在具有395个真实Java软件缺陷的Defects4J缺陷库上实验评估,结果表明SNRepair方法与对比方法比较,修复成功率和修复效率更高. 展开更多
关键词 软件缺陷自动修复 神经机器翻译 自注意力机制 子词切分 局部建模
在线阅读 下载PDF
基于音节拼接的关键词识别系统 被引量:1
8
作者 石峰 秦敏 李治柱 《计算机工程》 CAS CSCD 北大核心 2004年第9期157-158,共2页
针对不确定的汉语语音关键词识别系统,为每个关键词分别建立模型是非常烦琐的,采用音节作为次词具有很好的灵活性。通过同传统的关键词识别系统作比较后发现用音节作为次词的系统具有相当高的识别率,其运算效率也非常高。
关键词 隐含马尔可夫模型 关键词识别 次词 音节拼接 汉语语音关键词识别系统
在线阅读 下载PDF
连续汉语音流中声韵母切分研究 被引量:1
9
作者 刘映杰 马义德 +2 位作者 刘悦 袁敏 段磊 《甘肃科学学报》 2005年第3期90-93,共4页
根据汉语语音的特点,提出了一种连续汉语语音中声韵母自动切分的新算法.根据音素单元结构确定HMM模型中的状态数,利用HMM模型进行音素切分,再对切分结果进行合并,得到最终的声韵母子词单元.通过实验验证了子词单元产生的稳定性和准确性... 根据汉语语音的特点,提出了一种连续汉语语音中声韵母自动切分的新算法.根据音素单元结构确定HMM模型中的状态数,利用HMM模型进行音素切分,再对切分结果进行合并,得到最终的声韵母子词单元.通过实验验证了子词单元产生的稳定性和准确性,实验结果表明,算法在这两方面均达到了较好的性能,且与话者无关. 展开更多
关键词 语音识别 子词 切分 HMM模型
在线阅读 下载PDF
补子字自由的无限字 被引量:1
10
作者 黄允宝 《杭州师范学院学报(自然科学版)》 CAS 2007年第1期1-5,共5页
研究满足下列条件的无限字w:如果x是w的子字,并且|x|至少取k(k是某个固定正整数),那么x的补字不是w的子字.给出了k≤4时所有这种无限字.
关键词 子字 补字 补子字 女补子字自由字
在线阅读 下载PDF
一种确定多媒体应用程序内层循环的子字并行编译方法
11
作者 吴丹 王志英 +1 位作者 王绍刚 王淼 《电子学报》 EI CAS CSCD 北大核心 2006年第B12期2575-2578,共4页
多媒体程序是数据密集型应用,其核心代码部分占用了大部分的执行时间,因此,对多媒体应用程序的研究大多针对其核心代码部分.本文围绕多媒体应用程序的核心内层循环,分析其子字并行特点,提出了一种新颖的按位数据流分析方法,能够确定程... 多媒体程序是数据密集型应用,其核心代码部分占用了大部分的执行时间,因此,对多媒体应用程序的研究大多针对其核心代码部分.本文围绕多媒体应用程序的核心内层循环,分析其子字并行特点,提出了一种新颖的按位数据流分析方法,能够确定程序的内层循环,为进一步深入研究奠定基础. 展开更多
关键词 多媒体 子字并行 内层循环 数据流
在线阅读 下载PDF
基于循环展开的子字并行指令自动生成
12
作者 王淼 王志英 +1 位作者 沈立 戴葵 《华中科技大学学报(自然科学版)》 EI CAS CSCD 北大核心 2008年第2期46-49,共4页
针对向量编译的不足,提出一种基于循环展开的子字并行指令自动生成的方法.该方法利用传统的循环变换技术对多媒体应用中可以进行子字并行的循环进行优化,生成子字并行代码.首先识别出可并行的循环,然后通过循环展开、寄存器重命名、指... 针对向量编译的不足,提出一种基于循环展开的子字并行指令自动生成的方法.该方法利用传统的循环变换技术对多媒体应用中可以进行子字并行的循环进行优化,生成子字并行代码.首先识别出可并行的循环,然后通过循环展开、寄存器重命名、指令合并等技术来提升循环体基本块中的子字并行性.在TTA(trans-port triggered architecture)体系结构的编译框架下用该方法实现了子字并行指令的自动生成.实验表明该方法得到了较好的加速比. 展开更多
关键词 向量编译 子字并行 并行指令 循环展开 代码自动生成
在线阅读 下载PDF
子词驻留特征在电话语音确认中的应用
13
作者 孙成立 刘刚 郭军 《计算机工程》 CAS CSCD 北大核心 2009年第1期27-29,共3页
语速和插入删除错误是导致自动电话转接系统发生错误的重要原因。该文给出一种基于子词似然比(LLR)和子词驻留特征融合的语音确认方法减少上述错误。提出基于最小分类错误准则方法求取子词特征融合参数。电话转接系统实验结果表明,采用... 语速和插入删除错误是导致自动电话转接系统发生错误的重要原因。该文给出一种基于子词似然比(LLR)和子词驻留特征融合的语音确认方法减少上述错误。提出基于最小分类错误准则方法求取子词特征融合参数。电话转接系统实验结果表明,采用子词驻留特征能有效提高语音确认效果,与LLR方法相比,名称关键词的等错误率下降3.35%,数字串关键词的等错误率下降4.05%。 展开更多
关键词 语音确认 似然比 子词驻留概率 最小分类错误
在线阅读 下载PDF
一种基于代价子图的子字并行指令选择算法
14
作者 王淼 王志英 《计算机工程与科学》 CSCD 2008年第9期141-144,150,共5页
子字并行能够充分利用多媒体算法的数据精度小、内部循环处理形式规则的特点,是加速多媒体处理的有效方式。然而,如何充分挖掘多媒体应用中的子字并行仍然是一个难题。本文说明传统的并行技术可以有效地开发循环中的子字并行性,同时提... 子字并行能够充分利用多媒体算法的数据精度小、内部循环处理形式规则的特点,是加速多媒体处理的有效方式。然而,如何充分挖掘多媒体应用中的子字并行仍然是一个难题。本文说明传统的并行技术可以有效地开发循环中的子字并行性,同时提出一种基于代价子图的子字并行指令自动识别的方法。与其他方法相比,该方法利用代价模型对子字并行指令选择进行定量评估。本文在TTA体系结构框架下实现了这一方法。实验结果表明,该方法可以充分地提取循环中的子字并行性。 展开更多
关键词 子字并行 指令选择 代价子图
在线阅读 下载PDF
基于子词的句子级别神经机器翻译的译文质量估计方法 被引量:14
15
作者 李培芸 翟煜锦 +4 位作者 项青宇 李茂西 裘白莲 罗文兵 王明文 《厦门大学学报(自然科学版)》 CAS CSCD 北大核心 2020年第2期159-166,共8页
目前性能最优的译文质量估计系统使用神经机器翻译中的编码器-解码器模型作为特征提取器.该方法由于限制词表大小易导致数据稀疏问题,从而使得较多的未登陆词不能被正确评价.为了缓解上述问题,在详细分析不同子词切分方法的特点后,提出... 目前性能最优的译文质量估计系统使用神经机器翻译中的编码器-解码器模型作为特征提取器.该方法由于限制词表大小易导致数据稀疏问题,从而使得较多的未登陆词不能被正确评价.为了缓解上述问题,在详细分析不同子词切分方法的特点后,提出了基于字节对编码(BPE)子词切分和基于一元文法语言模型子词切分的神经译文质量估计方法,并将两者的译文质量估计的得分与基于词语切分的神经译文质量估计得分融合后进行译文质量估计.在WMT18句子级别译文质量估计子任务数据集上的实验结果表明:融合BPE子词切分、一元文法语言模型子词切分和词语切分的神经译文质量估计方法的性能在多个评测子任务上超过了WMT18给出的最好参与系统,深入的实验分析进一步揭示了融合不同粒度的句子切分方法提高了译文质量估计的健壮性. 展开更多
关键词 质量估计 神经机器翻译 子词 编码器-解码器模型 循环神经网络 联合神经网络
在线阅读 下载PDF
面向国防科技领域的技术和术语识别方法研究 被引量:13
16
作者 冯鸾鸾 李军辉 +1 位作者 李培峰 朱巧明 《计算机科学》 CSCD 北大核心 2019年第12期231-236,共6页
随着自然语言处理技术的发展,人们越来越重视构建面向国防科技领域的知识图谱。而面向国防科技领域的技术和术语识别是构建该领域技术知识图谱的基础。文中基于该领域的语料库,在技术和术语识别的任务上,探索了子词单元在传统序列标注Bi... 随着自然语言处理技术的发展,人们越来越重视构建面向国防科技领域的知识图谱。而面向国防科技领域的技术和术语识别是构建该领域技术知识图谱的基础。文中基于该领域的语料库,在技术和术语识别的任务上,探索了子词单元在传统序列标注Bi-LSTM+CRF模型上的应用。此外,针对任务的特点,提出了适用于技术和术语识别的语言学特征。基于该领域的语料库,实验结果表明技术和术语识别的F1值达到了71.80%,较基准系统提升了3.04%,能够较好地识别出面向国防科技领域的技术和术语。同时,所提方法也优于基于BERT模型的技术术语识别方法。 展开更多
关键词 面向国防科技领域 技术和术语 子词 Bi-LSTM+CRF模型 语言学特征
在线阅读 下载PDF
高性能子字并行运算单元的设计与实现 被引量:3
17
作者 董冕 吴丹 +3 位作者 饶金理 黄威 戴葵 邹雪城 《计算机工程》 CAS CSCD 2012年第16期249-252,共4页
通过硬件共享的方式实现一套高性能子字并行运算单元,运算单元采用流水线设计,可以一个周期进行1个64-bit、2个32-bit、4个16-bit或8个8-bit定点运算,1个双精度或2个单精度浮点运算。运算单元采用Verilog HDL设计,在0.18μm标准CMOS工... 通过硬件共享的方式实现一套高性能子字并行运算单元,运算单元采用流水线设计,可以一个周期进行1个64-bit、2个32-bit、4个16-bit或8个8-bit定点运算,1个双精度或2个单精度浮点运算。运算单元采用Verilog HDL设计,在0.18μm标准CMOS工艺库下实现,并针对实际多媒体应用程序基于ESCA系统进行性能评测。实验结果表明,该运算单元可以在硬件开销和性能上获得较好的平衡。 展开更多
关键词 多媒体技术 子字并行 硬件共享 运算单元 ESCA系统 协处理器
在线阅读 下载PDF
关于弱自避免字的注记
18
作者 黄允宝 《杭州师范学院学报(自然科学版)》 2007年第6期401-405,共5页
文章将给出两个元素字母表上的极大弱自避免字的完整刻画,同时给出三个元素字母表Σ3上,满足条件:x1[1]=2,2-1x1∈Σ2ω的无限弱自避免字x1=20012010150130111017012301150…,其中(20)-1x1中0的位置由序列fn决定:f2n+1=52n-2(n≥0),f2n=... 文章将给出两个元素字母表上的极大弱自避免字的完整刻画,同时给出三个元素字母表Σ3上,满足条件:x1[1]=2,2-1x1∈Σ2ω的无限弱自避免字x1=20012010150130111017012301150…,其中(20)-1x1中0的位置由序列fn决定:f2n+1=52n-2(n≥0),f2n=82n-1-2(n≥1). 展开更多
关键词 子字 自避免字 弱自避免字 极大弱自避免字
在线阅读 下载PDF
基于多粒度的蒙汉神经机器翻译研究 被引量:3
19
作者 高芬 苏依拉 +3 位作者 牛向华 赵旭 范婷婷 仁庆道尔吉 《计算机应用与软件》 北大核心 2020年第4期145-149,170,共6页
在蒙汉神经机器翻译中,输入序列的基本粒度对翻译效果有一定的影响。为了选择合适的翻译粒度,分别对蒙古语和汉语进行词-词、词-子词、子词-词、子词-子词粒度的切分,并对比不同粒度在长短时记忆网络和Transformer翻译模型中的翻译表现... 在蒙汉神经机器翻译中,输入序列的基本粒度对翻译效果有一定的影响。为了选择合适的翻译粒度,分别对蒙古语和汉语进行词-词、词-子词、子词-词、子词-子词粒度的切分,并对比不同粒度在长短时记忆网络和Transformer翻译模型中的翻译表现。实验结果表明,在两种翻译模型中,对两种语料同时进行子词粒度切分效果最好。 展开更多
关键词 蒙汉神经机器翻译 翻译粒度 长短时记忆 Transformer 子词粒度
在线阅读 下载PDF
基于子词链的中文新闻广播故事自动分割 被引量:2
20
作者 杨玉莲 谢磊 《计算机应用研究》 CSCD 北大核心 2009年第2期583-586,594,共5页
提出了一种基于子词链的中文新闻广播故事自动分割方法。利用中文同音异形字众多、词典开放、分词多样和组词灵活等特点,在新闻广播的语音识别抄本上采用中文子词单元(汉字和音节)创建子词链,进行中文新闻广播故事的自动分割,有效地解... 提出了一种基于子词链的中文新闻广播故事自动分割方法。利用中文同音异形字众多、词典开放、分词多样和组词灵活等特点,在新闻广播的语音识别抄本上采用中文子词单元(汉字和音节)创建子词链,进行中文新闻广播故事的自动分割,有效地解决了在传统词链方法中由于语音识别错误(特别是词典未收录词汇)导致的相关联词之间无法匹配的问题。同时,利用各级词汇表示单元之间的互补性,如词的表义确定性和子词对语音识别错误的鲁棒性,对各级词汇进行融合,利用不同级别词汇表示单元的优势进一步提高中文新闻广播故事分割的性能。在TDT2中文标准新闻广播语料库上进行的实验表明,基于一元汉字子词链分割方法的F-mea-sure比传统词链方法提高了6.06%。基于一元和二元汉字子词链边界强度的融合可以使F-mea-sure进一步提高2.55%。基于投票法的融合可以使F-measure比传统词链方法提高9.04%。 展开更多
关键词 子词 词链 主题分割 故事分割 信息检索 语音文件检索
在线阅读 下载PDF
上一页 1 2 下一页 到第
使用帮助 返回顶部