期刊文献+
共找到40篇文章
< 1 2 >
每页显示 20 50 100
基于SSE2的YUV与RGB色彩空间转换 被引量:17
1
作者 刘云粼 王树东 《中国图象图形学报》 CSCD 北大核心 2010年第1期45-49,共5页
视频处理中需要完成从YUV色彩空间到RGB色彩空间的转换。通过分析YUV格式与RGB格式间的转换算法,提出使用整形计算替代浮点运算,利用整除256对应右移八位操作,提高运算速度。结合使用Intel单指令多数据扩展指令集SSE2技术进行算法优化后... 视频处理中需要完成从YUV色彩空间到RGB色彩空间的转换。通过分析YUV格式与RGB格式间的转换算法,提出使用整形计算替代浮点运算,利用整除256对应右移八位操作,提高运算速度。结合使用Intel单指令多数据扩展指令集SSE2技术进行算法优化后,显著提高格式转换运算的效率。实验结果表明,采用此技术可以提高25倍以上的运算速度,在视频处理中具有很好的应用性。 展开更多
关键词 色彩空间转换YUV RGB sse2
在线阅读 下载PDF
基于SSE2的Smith-Waterman算法 被引量:2
2
作者 戴正华 张庆丹 +2 位作者 徐琳 谭光明 冯圣中 《计算机工程与应用》 CSCD 北大核心 2006年第11期85-87,共3页
Smith-Waterman动态规划算法是生物信息学使用最广泛的序列匹配算法,由于存在严重的数据依赖关系,该算法的细粒度数据并行性开发受到了很大限制。文章从简化数据依赖关系出发,采用前驱计算思想,提出了基于X86处理器多媒体指令集SSE2的Sm... Smith-Waterman动态规划算法是生物信息学使用最广泛的序列匹配算法,由于存在严重的数据依赖关系,该算法的细粒度数据并行性开发受到了很大限制。文章从简化数据依赖关系出发,采用前驱计算思想,提出了基于X86处理器多媒体指令集SSE2的Smith-Waterman细粒度并行算法SWSSE2,在相似性显著的情况下比普通的SW算法性能提高5倍,且与测试集无关。一般相似性不显著的情形下,同目前最好的动态规划细粒度并行算法SWMMX相比可以获得1.5倍的加速比。 展开更多
关键词 Smith-Waterman 算法 细粒度并行算法 SIMD sse2
在线阅读 下载PDF
H.264编码器的SSE2指令级优化 被引量:2
3
作者 王琰 向校萱 祁燕 《计算机工程与应用》 CSCD 2012年第10期217-221,共5页
H.264视频编码标准采用了很多新技术,具有更优越的编码效率,同时也增加了计算复杂度,无法满足实时应用。由于单指令多数据扩展指令集2(SSE2)的并行运算能力可以提高计算机对多媒体数据的实时处理。文中主要采用了SSE2对H.264中的一些耗... H.264视频编码标准采用了很多新技术,具有更优越的编码效率,同时也增加了计算复杂度,无法满足实时应用。由于单指令多数据扩展指令集2(SSE2)的并行运算能力可以提高计算机对多媒体数据的实时处理。文中主要采用了SSE2对H.264中的一些耗时较多的关键模块,例如整数像素运动估计中计算SAD、整数DCT变换、量化、Hadamard变换以及亚像素运动估计中计算SATD进行了指令级优化。实验结果表明,经过优化后,在保持视频图像质量的前提下,相应模块运行速度得到了提高,使H.264编码器整体的编码速度较好地满足实时要求。 展开更多
关键词 H.264编码 绝对误差和 整数DCT变换 变换绝对差值总和 单指令多数据扩展指令集2(sse2)
在线阅读 下载PDF
一种利用SSE2多重纹理混合的大范围虚拟地形可视化技术 被引量:1
4
作者 魏勇 丁雨淋 +2 位作者 龚桂荣 杜莹 周艳 《武汉大学学报(信息科学版)》 EI CSCD 北大核心 2015年第4期510-515,共6页
大规模三维地形的真实感可视化对于表现战场自然环境具有重要意义,OpenGL、D3D等主流三维图形引擎需要将多层纹理数据发送到GPU端进行多重纹理融合操作。对于瘦客户机,在显卡位宽和显存有限的资源下,大量的多重纹理融合操作常会导致GPU... 大规模三维地形的真实感可视化对于表现战场自然环境具有重要意义,OpenGL、D3D等主流三维图形引擎需要将多层纹理数据发送到GPU端进行多重纹理融合操作。对于瘦客户机,在显卡位宽和显存有限的资源下,大量的多重纹理融合操作常会导致GPU和带宽负载过大,出现绘制画面不流畅、渲染效率低等问题。为此,提出了一种基于SSE2的多重纹理混合技术,通过在CPU端进行混合纹理混合操作,降低GPU负载,减少数据传送时间。实验证明,该方法在保证CPU计算效率的前提下,有效地降低了大范围虚拟战场环境可视化过程中GPU和带宽负载,显著提升了瘦客户机中大范围虚拟战场数据的渲染效率。 展开更多
关键词 多重纹理混合 sse2 三维地形可视化 大范围虚拟地形环境
原文传递
基于SSE2的AVS-M视频编码器优化 被引量:1
5
作者 钱金法 赵力 《电视技术》 北大核心 2007年第12期28-30,共3页
从SIMD技术出发,介绍了利用SSE2指令集优化AVS-M视频编码器的具体方法,主要集中在运动搜索与补偿,亚像素插值及整数DCT变换和反变换等模块的优化,并通过实验证明了优化的有效性。
关键词 单指令多数据技术 sse2技术 AVS—M标准 优化
在线阅读 下载PDF
利用SSE2指令构造随机数生成器 被引量:2
6
作者 曾光 韩文报 《信息工程大学学报》 2008年第3期268-271,共4页
异或移位随机数生成器是Marsaglia于2002年提出的周期为2k-1且适合32位CPU快速实现的随机数生成器,其中k为32,64,96,128等。近几年,通用CPU技术有了较大进展,例如单指令多数据技术和多级流水线等。文章利用第2代单指令多数据流扩展指令... 异或移位随机数生成器是Marsaglia于2002年提出的周期为2k-1且适合32位CPU快速实现的随机数生成器,其中k为32,64,96,128等。近几年,通用CPU技术有了较大进展,例如单指令多数据技术和多级流水线等。文章利用第2代单指令多数据流扩展指令设计了一类基于128比特面向软件实现的随机数生成器。这类新的生成器与异或移位随机数生成器类似,但是它可以充分利用CPU的新特性。其反馈逻辑更适合流水线处理,速度较不使用SSE2指令约有2倍的提高,同时其输出序列的随机性与异或移位随机数生成器类似。 展开更多
关键词 SIMD技术 sse2指令集 异或移位随机数生成器 软件快速实现
在线阅读 下载PDF
SSE2指令在代码优化中的关键作用研究 被引量:2
7
作者 范建军 《华中师范大学学报(自然科学版)》 CAS CSCD 北大核心 2004年第4期423-426,共4页
代码优化是提高应用程序性能的重要手段,单指令多数据流作为一项动态改善应用程序性能的技术已被工业界广泛接受.通过对Intel的第二代单指令多数据流扩展指令系统SSE2在程序优化中的重要方法和关键实现的研究,给出实践中有关代码优化的... 代码优化是提高应用程序性能的重要手段,单指令多数据流作为一项动态改善应用程序性能的技术已被工业界广泛接受.通过对Intel的第二代单指令多数据流扩展指令系统SSE2在程序优化中的重要方法和关键实现的研究,给出实践中有关代码优化的解决方法. 展开更多
关键词 代码优化 sse2 SIMD技术
在线阅读 下载PDF
美国威利“SSE2L”高频电刀故障检修一例 被引量:2
8
作者 魏科绪 《医疗卫生装备》 CAS 2004年第1期78-78,共1页
关键词 美国 威利“sse2L”高频电刀 故障 检修 调节旋钮
暂未订购
视频编码中环路滤波的SSE2优化方法研究 被引量:1
9
作者 董志平 陈水仙 艾浩军 《计算机工程与应用》 CSCD 北大核心 2006年第8期34-36,140,共4页
视频编码中的环路滤波是计算密集运算,利用SSE2指令系统的特性,提出了数据重排和位掩蔽两种优化策略。实验结果表明,可使平均性能提高77%以上。
关键词 环路滤波 视频编码 sse2
在线阅读 下载PDF
基于SSE2的模板匹配并行算法改进 被引量:1
10
作者 龚浩 戚其丰 《控制工程》 CSCD 2005年第S1期120-122,共3页
Intel处理器的SSE2(Streaming SIMD Extensions 2,数据流单指令多数据扩展)技术,支持指令级SIMD操作,提供了单处理器上并行处理的解决方法。将模板匹配算法用SSE2 技术并行化,在Linux平台下用GCC编译实现。试验结果表明:SSE2技术大大加... Intel处理器的SSE2(Streaming SIMD Extensions 2,数据流单指令多数据扩展)技术,支持指令级SIMD操作,提供了单处理器上并行处理的解决方法。将模板匹配算法用SSE2 技术并行化,在Linux平台下用GCC编译实现。试验结果表明:SSE2技术大大加快了模板匹配的速度,能够在保证原有精度和稳定性基础上,解决了模板匹配方法计算量大、耗时多, 成本高的问题,有效地满足了在电子产品与制造等众多领域对计算机视觉技术的实时要求。 展开更多
关键词 GCC 内嵌汇编 sse2 模板匹配
在线阅读 下载PDF
基于MMX/SSE/SSE2的H.264解码器关键算法优化 被引量:1
11
作者 张琦 万枫丹 +1 位作者 段柯 吴镇扬 《信息与电子工程》 2006年第1期14-17,共4页
H.264采用整数离散余弦变换(DISCRETECOSINETRANSFORM,DCT)、多种量化方法选择和更精确的帧内预测等先进技术,提高了解码图像质量,但增加了算法的计算复杂度。利用MMX/SSE/SSE2指令集对H.264解码器的关键算法进行优化,在不影响图像质量... H.264采用整数离散余弦变换(DISCRETECOSINETRANSFORM,DCT)、多种量化方法选择和更精确的帧内预测等先进技术,提高了解码图像质量,但增加了算法的计算复杂度。利用MMX/SSE/SSE2指令集对H.264解码器的关键算法进行优化,在不影响图像质量的情况下,实验证明可以显著提高算法的执行效率。 展开更多
关键词 信息处理技术 解码算法 优化 MMX/SSE/sse2
在线阅读 下载PDF
基于SSE2指令集的RC6-64/r/b在IA-32平台上的快速实现
12
作者 陈佳康 李晖 +1 位作者 王珺 邓冠阳 《计算机应用与软件》 CSCD 北大核心 2012年第10期85-88,108,共5页
目前64位与32位计算机广泛共存,RC6-64/r/b的常规实现方法在64位计算机上可以达到很高的性能,但在32位计算机上性能较低,这限制了RC6-64/r/b算法的广泛应用。利用SSE2指令集对RC6-64/r/b算法中的64位运算进行简化,并实现SIMD并行,使得RC... 目前64位与32位计算机广泛共存,RC6-64/r/b的常规实现方法在64位计算机上可以达到很高的性能,但在32位计算机上性能较低,这限制了RC6-64/r/b算法的广泛应用。利用SSE2指令集对RC6-64/r/b算法中的64位运算进行简化,并实现SIMD并行,使得RC6-64/r/b在IA-32平台上的运行速度成倍提升,该方法也可用于其他含有64位运算的密码算法的快速实现上。 展开更多
关键词 sse2 SIMD IA-32 RC6 对称密码算法
在线阅读 下载PDF
AVS视频编码中分像素插值的SSE2优化方法
13
作者 曹明 江城 +1 位作者 张重阳 郑世宝 《电视技术》 北大核心 2010年第11期30-32,共3页
视频编码中分像素插值是运动补偿中比较复杂的算法,耗时较长。利用SSE2指令系统并行处理的特性,针对AVS视频编码的分像素插值部分提出一种优化算法。实验结果表明,该算法可使该模块的平均执行时间缩短为原来的1/3。
关键词 分像素插值 运动补偿 AVS标准 视频编码 sse2
在线阅读 下载PDF
基于SSE2的MPEG-4视频快速解码研究
14
作者 李青山 朱利 何杭军 《微电子学与计算机》 CSCD 北大核心 2005年第4期92-95,99,共5页
离散余弦逆变换是MPEG-4视频纹理解码中运算时间开销最大的部分。本文在快速离散余弦逆变换算法的基础上,引入针对多媒体数据流的SSE2并行计算技术。在保证图像质量的前提下大幅度提高了软件的解码速度。实验结果表明,该方法能有效地降... 离散余弦逆变换是MPEG-4视频纹理解码中运算时间开销最大的部分。本文在快速离散余弦逆变换算法的基础上,引入针对多媒体数据流的SSE2并行计算技术。在保证图像质量的前提下大幅度提高了软件的解码速度。实验结果表明,该方法能有效地降低MPEG-4视频解码的时间开销,适合于NC环境下的视频分发应用。 展开更多
关键词 MPEG-4 快速解码 sse2 IDCT 纹理解码
在线阅读 下载PDF
基于SSE2对H.265/HEVC中分像素插值的优化
15
作者 陈丽丽 沈燕飞 +1 位作者 邓米克 蔡志峰 《计算机工程与应用》 CSCD 2014年第19期136-142,共7页
分像素插值算法是视频编码算法中的一项关键技术,对视频编码性能有非常重要的影响。在最新的视频编码标准H.265/HEVC中,提出了使用DCT插值滤波器(DCTIF)分别进行半像素和1/4像素插值,但是计算复杂度较大,尤其对于高分辨率和超高分辨... 分像素插值算法是视频编码算法中的一项关键技术,对视频编码性能有非常重要的影响。在最新的视频编码标准H.265/HEVC中,提出了使用DCT插值滤波器(DCTIF)分别进行半像素和1/4像素插值,但是计算复杂度较大,尤其对于高分辨率和超高分辨率的视频编码应用。对滤波器系数的理论推导过程进行了详细介绍,并利用SSE2指令集进行了优化设计和实现,实验结果表明该方法比参考代码中的方法提高了217%~259%的性能。 展开更多
关键词 分像素插值 视频编码 H.265/HEVC标准 sse2指令集
在线阅读 下载PDF
SSE2与AES-NI在密码算法中的应用
16
作者 苗旭东 郑秀林 李艳俊 《北京电子科技学院学报》 2016年第2期12-16,共5页
密码算法的实现效率是衡量一个密码算法好坏的重要指标。传统密码算法是基于比特(A5算法)、字节(AES算法)、32位字(IDEA)设计的,软件实现速度相对较慢,而在最近的CAESAR竞赛中,基于快速指令集设计的一些算法,例如MORUS、AEGIS,它们的软... 密码算法的实现效率是衡量一个密码算法好坏的重要指标。传统密码算法是基于比特(A5算法)、字节(AES算法)、32位字(IDEA)设计的,软件实现速度相对较慢,而在最近的CAESAR竞赛中,基于快速指令集设计的一些算法,例如MORUS、AEGIS,它们的软件实现速度是非常快的。本文选择了两种非常有代表性的指令集SSE2与AES-NI进行研究,研究这两种指令集在密码算法中的使用方法,以及这些指令集应用到密码算法中会提升效率,通过对这两种指令集的研究,指出了使用指令集在密码算法中的优势。 展开更多
关键词 sse2 AES-NI 指令集
在线阅读 下载PDF
美国Valleylab公司SSE2L手术电刀故障1例
17
作者 张臣舜 《云南大学学报(自然科学版)》 CAS CSCD 2000年第S2期169-169,共1页
对造成SSE2L高频手术刀出现电切状态输出功率低,电凝状态无输出的故障作了较全面的分析,并给出排除的方法.
关键词 sse2L高频手术刀 故障 检修
原文传递
一种基于SIMD技术的快速并行代数重建算法 被引量:8
18
作者 刘远 张定华 +2 位作者 赵歆波 毛海鹏 刘晓鹏 《中国图象图形学报》 CSCD 北大核心 2007年第1期73-77,共5页
代数重建算法是解决非完全投影数据重建的有效方法,尤其在对于超出探测器尺寸范围的大型零件的无损检测中已成为最有力的关键技术,但以往算法计算量较大、耗时较长。为了快速地进行代数重建,提出了一种基于Intel处理器单指令多数据(sing... 代数重建算法是解决非完全投影数据重建的有效方法,尤其在对于超出探测器尺寸范围的大型零件的无损检测中已成为最有力的关键技术,但以往算法计算量较大、耗时较长。为了快速地进行代数重建,提出了一种基于Intel处理器单指令多数据(single instruction multiple data,SIMD)技术[2]的快速并行算法,并在充分分析代数重建公式特点的基础上,设计了一套便于并行化运算的数据结构及计算流程,其在运算中可一次性加载多个打包数据,利用MMX(multimedia extension)、SSE(streaming SIMD extension)和SSE2指令完成SIMD方式计算。通过仿真实验证明,该算法在达到同样精度的前提下,不仅提高了重建速度(加速比4倍),解决了传统代数重建算法运算速度慢的瓶颈问题,并且能够较好地重建部分数据缺失的投影图像,该算法对于航空航天大型零部件的无损检测具有重要的理论意义及工程应用价值。 展开更多
关键词 CT 代数重建 单指令多数据并行运算 SSE和sse2指令
在线阅读 下载PDF
一种基于奔腾SIMD指令的快速背景提取方法 被引量:2
19
作者 周西汉 刘勃 +1 位作者 周荷琴 袁非牛 《计算机工程与应用》 CSCD 北大核心 2004年第27期81-83,共3页
论文提出一种基于Intel奔腾SIMD指令的快速背景提取方法。在一种改进的混合高斯背景模型中,Jeffrey值的计算和背景模型的更新等存在着很高的内在SIMD并行性,通过将数据按照SSE数据类型组织,实现了混合高斯背景模型的SIMD算法。实验结果... 论文提出一种基于Intel奔腾SIMD指令的快速背景提取方法。在一种改进的混合高斯背景模型中,Jeffrey值的计算和背景模型的更新等存在着很高的内在SIMD并行性,通过将数据按照SSE数据类型组织,实现了混合高斯背景模型的SIMD算法。实验结果表明:嵌入奔腾SIMD指令的方法比传统计算提高75%左右的性能,加速了背景提取的速度,达到了实时处理的要求,具有较大的实际应用价值。 展开更多
关键词 背景提取 混合高斯模型 SIMD MMX/SSE/sse2
在线阅读 下载PDF
基于单指令多数据流技术的视频信息处理优化 被引量:5
20
作者 张颖 王兴国 刘济林 《电视技术》 北大核心 2003年第11期40-43,共4页
针对SIMD技术的特点,阐述SIMD技术在视频处理实时软件实现中的具体应用,并以视频解码器显示模块的SIMD优化为例,分析、比较了SIMD技术优化前后的算法效率和图像质量,并探讨了在特定环境下SIMD编程的特点及优化方法。
关键词 SIMD技术 MMX/SSE/sse2技术 并行处理 视频信息处理 多媒体通信
在线阅读 下载PDF
上一页 1 2 下一页 到第
使用帮助 返回顶部