期刊文献+
共找到53篇文章
< 1 2 3 >
每页显示 20 50 100
基于NVIDIA Kepler的PIC方法并行 被引量:1
1
作者 文敏华 林新华 Simon Chong Wee See 《计算机工程与科学》 CSCD 北大核心 2013年第11期100-104,共5页
PIC方法是计算等离子体物理中广泛使用的一种计算方法。通常情况下需要使用大量的计算粒子以达到高的计算精度,这导致非常庞大的计算量。因而PIC方法的加速研究对于减少其时间成本非常有意义。设计了一个基于NVIDIA Kepler GPU的PIC算法... PIC方法是计算等离子体物理中广泛使用的一种计算方法。通常情况下需要使用大量的计算粒子以达到高的计算精度,这导致非常庞大的计算量。因而PIC方法的加速研究对于减少其时间成本非常有意义。设计了一个基于NVIDIA Kepler GPU的PIC算法,并使用CUDA在GPU上实现了该算法。在PIC方法中最耗时间的两个函数collision和mover被移植到GPU上。在实验中使用了NVIDIA新发布的Kepler K20GPU进行这两个函数的性能测试,相比于Intel Sandy Bridge E5-2650,最高获得了30倍的加速。 展开更多
关键词 PIC方法 CUDA NVIDIA KEPLER
在线阅读 下载PDF
科技改变未来——NVIDIA访谈实录 被引量:3
2
作者 朱晓琳 何犹卿 李浩南 《建筑技艺》 2017年第9期64-67,共4页
AT:NVIDIA如何看待将先进的科技,如虚拟现实(VR)、增强现实(AR)、人工智能技术应用在传统行业中? 何犹卿:NVIDIA的主要业务是中央处理器(简称CPU)和图形处理器(GPU),它们是计算机运行最基础的计算平台——从对图形的处理到... AT:NVIDIA如何看待将先进的科技,如虚拟现实(VR)、增强现实(AR)、人工智能技术应用在传统行业中? 何犹卿:NVIDIA的主要业务是中央处理器(简称CPU)和图形处理器(GPU),它们是计算机运行最基础的计算平台——从对图形的处理到高性能的计算,从人工智能算法到其他科学的计算,都属于二者的工作范畴。这一底层技术的服务客户涉及各行各业,人们利用这一平台处理和解决特定的应用。例如在工业设计中,产品的参数(尺寸、大小、材质、颜色等)需要通过图形处理来表达,并实现人机交互;在传媒娱乐行业(动漫、电视、电影、游戏等)中,通过输入指令得到画面,实现即时、高度的人机交互应用,给人一种独特的体验。 展开更多
关键词 NVIDIA 人工智能技术 图形处理器 计算平台 实录 技改 交互应用 娱乐行业
在线阅读 下载PDF
点燃SLI的二级火箭! NVIDIA工程师谈Quad SLI
3
作者 邓培智 《微型计算机》 北大核心 2006年第10期162-166,共5页
NVIDIA推销SLI的概念可谓是相当成功,在过去的两年时间里.“SLI”几乎成了显卡新技术的代名词。通过让两块显卡并联工作,可以实现比单卡多80%的性能提升:但是追求性能的玩家们没有满足.SLI也没有就此止步——在以往双卡互连的基... NVIDIA推销SLI的概念可谓是相当成功,在过去的两年时间里.“SLI”几乎成了显卡新技术的代名词。通过让两块显卡并联工作,可以实现比单卡多80%的性能提升:但是追求性能的玩家们没有满足.SLI也没有就此止步——在以往双卡互连的基础上.现在又进一步实现了Quad SLI(四卡互连)。那么Quad SLI如何实现.性能如何、又有谁会去消费这样的”梦幻产品”?让我们请NVIDIA亚太区技术市场经理邓培智先生来为我们揭开所有的疑团…… 展开更多
关键词 NVIDIA QUAD SLI 工程师 火箭 二级 点燃 技术市场 并联工作 亚太区 显卡
在线阅读 下载PDF
NVIDIA发布第八代GPU架构Turing
4
《设计》 2018年第18期154-155,共2页
在温哥华举办的SIGGRAPH专业图形学会议上,黄仁勋发布了NVIDIA第八代GPU架构Turing,会上同期发布了NVIDIA Quadro RTX 8000、Quadro RTX 6000和Quadro RTX5000,并向与会的专业人士详细介绍了Quadro RTX Server——一个面向价值2500亿美... 在温哥华举办的SIGGRAPH专业图形学会议上,黄仁勋发布了NVIDIA第八代GPU架构Turing,会上同期发布了NVIDIA Quadro RTX 8000、Quadro RTX 6000和Quadro RTX5000,并向与会的专业人士详细介绍了Quadro RTX Server——一个面向价值2500亿美元的视效行业的参考架构。"这从根本上改变了计算机图形的实现方式,这是现实主义的一次跨越式变革,"黄仁勋对台下1,200多位图形领域的专业人士说道。 展开更多
关键词 NVIDIA GPU 架构 QUADRO SIGGRAPH 计算机图形 SERVER 专业人士
在线阅读 下载PDF
NVIDIA的目标:成为全球最好的视觉计算厂商
5
作者 黄仁勋 《现代计算机(中旬刊)》 2010年第8期54-54,共1页
NVIDIA,听起来像是India(印度)、Malaysia(马来西亚)或是Indonesia(印度尼西亚)等,像一个地方,一个地名,所以,我们什么都可以做:可以做显卡,也可以做超级计算机,也可以做移动计算机……NVIDIA这个名字很奇怪的,刚开始大家都不会... NVIDIA,听起来像是India(印度)、Malaysia(马来西亚)或是Indonesia(印度尼西亚)等,像一个地方,一个地名,所以,我们什么都可以做:可以做显卡,也可以做超级计算机,也可以做移动计算机……NVIDIA这个名字很奇怪的,刚开始大家都不会讲,可是会讲的时候大家都会了,就好像我变成你的朋友了,只有朋友知道怎么称呼我。 展开更多
关键词 NVIDIA 视觉计算 印度尼西亚 厂商 超级计算机 移动计算机 马来西亚 显卡
在线阅读 下载PDF
NVIDIA重磅炸弹Tegra 4安卓掌机曝光
6
《计算机与网络》 2013年第10期14-14,共1页
Tegra4发布会上,NVIDIA重点都放在了突然从天而降的一款掌机产品上,开发代号为“ProjectSHIELD”(神盾工程)。这才是第一款基于Tegra4的产品。
关键词 NVIDIA 重磅炸弹 掌机 曝光 产品
在线阅读 下载PDF
NVIDIA助力蔚来构建移动计算平台 被引量:1
7
作者 《设计》 2022年第6期160-160,共1页
当今越来越多的行业朝着智能化方向转移,拥有百年历史的汽车行业也不例外。汽车制造商、供应商、初创公司等正接受着这股浪潮的洗礼,向自动驾驶时代前进。蔚来是一家全球化的智能电动汽车公司,于2014年11月25日正式成立。蔚来致力于通... 当今越来越多的行业朝着智能化方向转移,拥有百年历史的汽车行业也不例外。汽车制造商、供应商、初创公司等正接受着这股浪潮的洗礼,向自动驾驶时代前进。蔚来是一家全球化的智能电动汽车公司,于2014年11月25日正式成立。蔚来致力于通过提供高性能的智能电动汽车与极致用户体验,为用户创造愉悦的生活方式。蔚来采用了NVIDIA DRIVE Orin系统级芯片构建自主研发的新一代自动驾驶平台,其在智能电动汽车领域始终保持领先的自动驾驶研发水平,满足软件定义车辆的AI基础架构和车内计算需求。 展开更多
关键词 初创公司 研发水平 自动驾驶 软件定义 用户体验 系统级芯片 基础架构 智能化方向
在线阅读 下载PDF
基于参数化生成的四经绞罗工艺复原
8
作者 于晓洋 丁肇辰 +3 位作者 刘凯旋 毕枫 岳冉 吕婉琪 《毛纺科技》 北大核心 2025年第5期30-38,共9页
为了在数字时代下更广泛地保护、传承与传播四经绞罗织造工艺,提出了一种运用参数化工具实现高精度织物外观复原的方法。首先基于四经绞罗工艺相关知识点对该结构进行切分与列举;其次在Substance Designer中生成模块化的单元结构;再次... 为了在数字时代下更广泛地保护、传承与传播四经绞罗织造工艺,提出了一种运用参数化工具实现高精度织物外观复原的方法。首先基于四经绞罗工艺相关知识点对该结构进行切分与列举;其次在Substance Designer中生成模块化的单元结构;再次通过分布贴图限定图形的生成范围,将图形转化为多通道贴图从而应用于服饰的数字化复原;最后采用层次分析法与模糊评价法对四经绞罗数字复原视觉效果进行评价。结果表明,运用参数化技术生成的纹理具有可持续性,对纺织品进行高精度的高效复原具有可行性,为服饰的数字化提供一种复原新思路。 展开更多
关键词 参数化 服饰数字化 四经绞罗 Substance Designer 数字化复原
在线阅读 下载PDF
算力——舱驾AI进化的核心燃料
9
作者 Wu.Yu 郑宇超 《汽车制造业》 2025年第5期21-24,共4页
本文提出算力是车载端侧舱驾AI进化的核心燃料这一核心观点,其需求随高级辅助驾驶等级提升呈指数级增长。生成式AI的发展也推动着智舱向多模态乃至全模态体验跃迁。NVIDIA通过芯片架构的代际创新、成熟的软件生态、安全与算力的协同设... 本文提出算力是车载端侧舱驾AI进化的核心燃料这一核心观点,其需求随高级辅助驾驶等级提升呈指数级增长。生成式AI的发展也推动着智舱向多模态乃至全模态体验跃迁。NVIDIA通过芯片架构的代际创新、成熟的软件生态、安全与算力的协同设计及高带宽支撑,重构了车载计算底层逻辑;同时,其构建的车企合作矩阵、传感器与算法生态及云端训练体系形成开放技术联盟和算力闭环,在功能安全与智驾产品安全标准上树立行业标杆,持续推动舱驾AI持续进化。 展开更多
关键词 舱驾AI 大算力 智能汽车
在线阅读 下载PDF
Learned distributed image compression with decoder side information
10
作者 Yankai Yin Zhe Sun +2 位作者 Peiying Ruan Ruidong Li Feng Duan 《Digital Communications and Networks》 2025年第2期349-358,共10页
With the rapid development of digital communication and the widespread use of the Internet of Things,multi-view image compression has attracted increasing attention as a fundamental technology for image data communica... With the rapid development of digital communication and the widespread use of the Internet of Things,multi-view image compression has attracted increasing attention as a fundamental technology for image data communication.Multi-view image compression aims to improve compression efficiency by leveraging correlations between images.However,the requirement of synchronization and inter-image communication at the encoder side poses significant challenges,especially for constrained devices.In this study,we introduce a novel distributed image compression model based on the attention mechanism to address the challenges associated with the availability of side information only during decoding.Our model integrates an encoder network,a quantization module,and a decoder network,to ensure both high compression performance and high-quality image reconstruction.The encoder uses a deep Convolutional Neural Network(CNN)to extract high-level features from the input image,which then pass through the quantization module for further compression before undergoing lossless entropy coding.The decoder of our model consists of three main components that allow us to fully exploit the information within and between images on the decoder side.Specifically,we first introduce a channel-spatial attention module to capture and refine information within individual image feature maps.Second,we employ a semi-coupled convolution module to extract both shared and specific information in images.Finally,a cross-attention module is employed to fuse mutual information extracted from side information.The effectiveness of our model is validated on various datasets,including KITTI Stereo and Cityscapes.The results highlight the superior compression capabilities of our method,surpassing state-of-the-art techniques. 展开更多
关键词 Digital communication Image compression Side information Channel-spatial attention module Cross-attention module
在线阅读 下载PDF
Association of age at diagnosis of diabetes with subsequent risk of age-related ocular diseases and vision acuity 被引量:2
11
作者 Si-Ting Ye Xian-Wen Shang +8 位作者 Yu Huang Susan Zhu Zhuo-Ting Zhu Xue-Li Zhang Wei Wang Shu-Lin Tang Zong-Yuan Ge Xiao-Hong Yang Ming-Guang He 《World Journal of Diabetes》 SCIE 2024年第4期697-711,共15页
BACKGROUND The importance of age on the development of ocular conditions has been reported by numerous studies.Diabetes may have different associations with different stages of ocular conditions,and the duration of di... BACKGROUND The importance of age on the development of ocular conditions has been reported by numerous studies.Diabetes may have different associations with different stages of ocular conditions,and the duration of diabetes may affect the development of diabetic eye disease.While there is a dose-response relationship between the age at diagnosis of diabetes and the risk of cardiovascular disease and mortality,whether the age at diagnosis of diabetes is associated with incident ocular conditions remains to be explored.It is unclear which types of diabetes are more predictive of ocular conditions.AIM To examine associations between the age of diabetes diagnosis and the incidence of cataract,glaucoma,age-related macular degeneration(AMD),and vision acuity.METHODS Our analysis was using the UK Biobank.The cohort included 8709 diabetic participants and 17418 controls for ocular condition analysis,and 6689 diabetic participants and 13378 controls for vision analysis.Ocular diseases were identified using inpatient records until January 2021.Vision acuity was assessed using a chart.RESULTS During a median follow-up of 11.0 years,3874,665,and 616 new cases of cataract,glaucoma,and AMD,respectively,were identified.A stronger association between diabetes and incident ocular conditions was observed where diabetes was diagnosed at a younger age.Individuals with type 2 diabetes(T2D)diagnosed at<45 years[HR(95%CI):2.71(1.49-4.93)],45-49 years[2.57(1.17-5.65)],50-54 years[1.85(1.13-3.04)],or 50-59 years of age[1.53(1.00-2.34)]had a higher risk of AMD independent of glycated haemoglobin.T2D diagnosed<45 years[HR(95%CI):2.18(1.71-2.79)],45-49 years[1.54(1.19-2.01)],50-54 years[1.60(1.31-1.96)],or 55-59 years of age[1.21(1.02-1.43)]was associated with an increased cataract risk.T2D diagnosed<45 years of age only was associated with an increased risk of glaucoma[HR(95%CI):1.76(1.00-3.12)].HRs(95%CIs)for AMD,cataract,and glaucoma associated with type 1 diabetes(T1D)were 4.12(1.99-8.53),2.95(2.17-4.02),and 2.40(1.09-5.31),respectively.In multivariable-adjusted analysis,individuals with T2D diagnosed<45 years of age[β95%CI:0.025(0.009,0.040)]had a larger increase in LogMAR.Theβ(95%CI)for LogMAR associated with T1D was 0.044(0.014,0.073).CONCLUSION The younger age at the diagnosis of diabetes is associated with a larger relative risk of incident ocular diseases and greater vision loss. 展开更多
关键词 DIABETES Age at diagnosis CATARACT GLAUCOMA Age-related macular disease Vision acuity
暂未订购
GPU并行计算加速的实时可视外壳三维重建及其虚实交互 被引量:13
12
作者 邵绪强 聂霄 王保义 《计算机辅助设计与图形学学报》 EI CSCD 北大核心 2017年第1期52-61,共10页
针对现有的基于图像的三维重建方法难以实现真实物体的快速三维重建,无法满足虚实交互等应用需求的问题,提出一种基于GPU并行计算的实时三维重建及其虚实交互方法.首先把物体所在空间剖分成具有数据独立性的体素集合,结合可视外壳重建... 针对现有的基于图像的三维重建方法难以实现真实物体的快速三维重建,无法满足虚实交互等应用需求的问题,提出一种基于GPU并行计算的实时三维重建及其虚实交互方法.首先把物体所在空间剖分成具有数据独立性的体素集合,结合可视外壳重建算法和精确行进立方体算法并行遍历每个体素得到体素状态序列;然后并行压缩体素状态序列得到非空体素集合,对非空体素进行并行三角形网格化,并利用图形硬件的多重纹理映射和可编程功能进行基于像素的纹理映射;最后假定虚拟物体的粒子为运动受限的拉格朗日流体粒子,重建物体网格顶点为流体边界,通过流体动力学方程的并行光滑粒子动力学方法求解来计算虚实交互.实验结果表明,该方法在GPU上进行完全并行求解,在32×32×32的空间剖分精度下,实现了实时三维重建和20帧/s左右的虚实交互计算,适用于计算机图形学和虚拟现实等领域中的虚实交互应用. 展开更多
关键词 可视外壳 三维重建 GPU并行计算 虚实交互 实时模拟
在线阅读 下载PDF
半透明物体漫散射效果的实时绘制与材质编辑 被引量:3
13
作者 王锐 Ewen Cheslack-Postava +4 位作者 Rui Wang David Luebke 华炜 彭群生 鲍虎军 《计算机辅助设计与图形学学报》 EI CSCD 北大核心 2008年第8期993-1000,共8页
半透明物体透明效果的真实感绘制是近年来研究的热点,提出一种针对半透明物体漫散射效果的实时真实感绘制与材质动态编辑方法——基于双向表面散射反射率函数(BSSRDF)的Dipole近似.通过主元分析将Dipole近似中的漫散射材质函数分解为与... 半透明物体透明效果的真实感绘制是近年来研究的热点,提出一种针对半透明物体漫散射效果的实时真实感绘制与材质动态编辑方法——基于双向表面散射反射率函数(BSSRDF)的Dipole近似.通过主元分析将Dipole近似中的漫散射材质函数分解为与形状相关函数和与半透明材质相关函数的乘积形式;利用该分解表示,在预辐射传输的实时真实感绘制框架下,通过对散射传输的预计算来实现在多种光源环境下对半透明物体材质的实时编辑.此外,还提出一种对预计算辐射传输数据在空域上进行二次小波压缩的方法,利用表面点在空间分布位置的相关性,在保证绘制质量的前提下,大大压缩了数据,提升了绘制效率.实验结果表明,文中方法可以生成具有高度真实感的半透明效果并保证实时的绘制速度. 展开更多
关键词 半透明材质编辑 双向表面散射反射率函数 主元分析 Dipole近似
在线阅读 下载PDF
保持区域平滑的3维动画形状高效编辑 被引量:2
14
作者 冼楚华 杨煜 +1 位作者 黄俊贤 李桂清 《中国图象图形学报》 CSCD 北大核心 2020年第5期1019-1031,共13页
目的 基于控制单元的形状编辑效果受各个控制单元对应权重的影响,而计算闭合形式的控制点权重方法难以有效地处理控制骨骼权重.针对3维空间的控制骨骼提出了一种虚拟控制单元插入算法和骨骼关节点标架变换方法,以保持骨骼控制区域的形状... 目的 基于控制单元的形状编辑效果受各个控制单元对应权重的影响,而计算闭合形式的控制点权重方法难以有效地处理控制骨骼权重.针对3维空间的控制骨骼提出了一种虚拟控制单元插入算法和骨骼关节点标架变换方法,以保持骨骼控制区域的形状,从而得到过渡平滑、形状保持的良好编辑效果.方法 选择C2连续的线性权值计算方法,在用户输入相应的控制单元后,根据控制单元的支持度插入满足条件的虚拟控制点,实现了对动画形状平滑高效的编辑.首先采用离散化的方式,近似求解输入形状构成的封闭域中任意两点之间的内部距离,然后进行Voronoi区域分解,初步获得每个控制单元的控制区域.如果控制点的支持度约束不符合要求,则通过插入虚拟控制点的方式进行调整,并根据邻接关系计算实控制点对虚拟控制点的权重实现实控制点对虚拟控制点的控制.由于算法计算权值和编辑更新顶点可以并行,因此引入图形处理器(graphics processing unit,GPU)实行并行化处理.结果 实验对比了算法在编辑细节以及对不同网格模型的适应性和编辑效率方面的表现,结果表明本文算法在局部细节处不发生过度形变且保持平滑,对非三角网格和多个封闭区域叠加的网格模型依然适用,且本文算法不需要迭代,又有GPU并行计算,编辑时间显著下降.结论 本文算法易于实现,编辑效果过渡平滑,保留细节特征;GPU并行计算极大提高效率,达到实时交互效果. 展开更多
关键词 线性混合 平滑处理 区域分解 并行计算 网格变形
原文传递
异构集群上的宏基因组聚类优化
15
作者 韦建文 许志耿 +2 位作者 王丙强 Simon SEE 林新华 《计算机科学》 CSCD 北大核心 2017年第3期20-22,47,共4页
宏基因组基因聚类是筛选致病基因的新型方法,其依赖于海量的测序数据、有效的聚类算法以及高效的计算机来实现。相关系数矩阵的计算是进行聚类前必须完成的操作,占总计算量的比重较大。以某基因库为例,包含1300个样本、每样本百万基因... 宏基因组基因聚类是筛选致病基因的新型方法,其依赖于海量的测序数据、有效的聚类算法以及高效的计算机来实现。相关系数矩阵的计算是进行聚类前必须完成的操作,占总计算量的比重较大。以某基因库为例,包含1300个样本、每样本百万基因的数据,单线程运行需要27年。充分发挥多核CPU的潜力,利用GPU加速卡强大的计算能力,将程序扩展到多节点集群上运行,是重要而迫切的工作。在仔细分析算法的基础上,首先针对单CPU节点和单GPU卡做了高效实现,获得了接近理想的加速比;然后利用缓存优化进一步提升性能;最后使用负载均衡方法在MPI线程间分发计算任务,实现了良好的扩展。相比未优化的单线程程序,16节点CPU获得了238.8倍的加速,6块GPU卡获得了263.8倍的加速。 展开更多
关键词 基因聚类 异构计算 缓存优化 负载均衡
在线阅读 下载PDF
动态网格的DSMC方法在GPU上的并行
16
作者 文敏华 林新华 Simon Chong Wee See 《计算机科学与探索》 CSCD 2013年第5期472-479,共8页
直接模拟蒙特卡罗方法(direct simulation Monte Carlo,DSMC)是稀薄气体动力学领域的重要工具。然而,DSMC方法有两个比较主要的缺点:一是复杂的网格处理;另一个是庞大的计算量。使用动态网格的DSMC方法可以根据流场信息,动态生成自适应... 直接模拟蒙特卡罗方法(direct simulation Monte Carlo,DSMC)是稀薄气体动力学领域的重要工具。然而,DSMC方法有两个比较主要的缺点:一是复杂的网格处理;另一个是庞大的计算量。使用动态网格的DSMC方法可以根据流场信息,动态生成自适应的碰撞网格,能有效解决前一个缺点;针对后一个缺点,使用统一计算架构(compute unified device architecture,CUDA)编写并行程序,将基于动态网格的DSMC方法移植到图形处理器(graphic processing unit,GPU)上以减少计算时间。在并行实现中,GPU负责绝大部分的计算,而CPU只负责初始化、结果输出等少量工作。使用一个二维超音速横掠平板问题作为算例,验证了并行程序的正确性。对于不同规模的算例,在NVIDIA Fermi C2050之上均获得了10倍以上的加速比;对于相同算例,NVIDIA最新发布的Kepler K20上的速度约为FermiC2050上的1.3~1.6倍。 展开更多
关键词 统一计算架构(CUDA) 图形处理器(GPU) 直接模拟蒙特卡罗方法(DSMC) 动态网格DSMC 并行模拟
在线阅读 下载PDF
浅谈“注入AI、物理准确”的元宇宙数字世界创建底层技术 被引量:2
17
作者 何展 刘春晖 《人工智能》 2022年第5期71-77,共7页
如何创建“元宇宙”概念下的数字世界,如何实现具有真正落地意义的数字世界,需要计算机图形学(CG)、计算机视觉(CV)、物理引擎模拟、扩展现实(XR、AR、VR、MR等),以及扩展到云边端算力等技术的融合、成熟和落地。本文从NVIDIA Omnivers... 如何创建“元宇宙”概念下的数字世界,如何实现具有真正落地意义的数字世界,需要计算机图形学(CG)、计算机视觉(CV)、物理引擎模拟、扩展现实(XR、AR、VR、MR等),以及扩展到云边端算力等技术的融合、成熟和落地。本文从NVIDIA Omniverse技术平台入手,浅谈这些技术的集合是如何实现数字人/数字形象、面向人工智能(AI)的工业数字孪生,以及如何让每个人都成为数字世界创建者的。 展开更多
关键词 工业数字孪生 数字人数字形象 NVIDIA Omniverse
在线阅读 下载PDF
智能工业革命
18
作者 黄仁勋 《智能制造》 2017年第1期70-74,共5页
GPU驱动的深度学习是一种新的计算模型,其引发了现代人工智能大爆炸。NVIDIA联合创始人兼CEO黄仁勋先生在本文中讨论了人工智能不久的将来、人工智能对产业的影响,以及企业如何抓住人工智能的商业机会。
关键词 人工智能 工业革命 NVIDIA 大规模并行处理 GPU 计算模型 商业机会 性能计算
在线阅读 下载PDF
庄海鸥:费米给我们带来了什么?
19
作者 庄海欧 《微型计算机》 2010年第10期4-4,共1页
十几年前,PC中负责显示功能的只有颗显示控制器,把字符与简单的图形输出到屏幕上。1999年NVIDIA(英伟达)发明全世界首颗GPU,GeForce256的问世才真正开始了视觉处理的时代。GPU让PC从原本简单及粗造的二维画面走进了今天所看到的精... 十几年前,PC中负责显示功能的只有颗显示控制器,把字符与简单的图形输出到屏幕上。1999年NVIDIA(英伟达)发明全世界首颗GPU,GeForce256的问世才真正开始了视觉处理的时代。GPU让PC从原本简单及粗造的二维画面走进了今天所看到的精致3D世界。 展开更多
关键词 GEFORCE256 费米 海鸥 NVIDIA 显示控制器 显示功能 图形输出 视觉处理
在线阅读 下载PDF
天体物理成团研究中的非规则访存优化 被引量:1
20
作者 郝赫 司雨蒙 +2 位作者 韦建文 文敏华 林新华 《计算机科学与探索》 CSCD 北大核心 2017年第1期80-90,共11页
HGGF(halo-based galaxy group finder)算法实现了基于暗物质晕的星系找群,在研究宇宙大尺度结构及宇宙的演化等领域中占有至关重要的地位。但由于数据规模的增长,急需对HGGF算法进行优化,以缩短运行时间。经分析,算法的热点部分耗时受... HGGF(halo-based galaxy group finder)算法实现了基于暗物质晕的星系找群,在研究宇宙大尺度结构及宇宙的演化等领域中占有至关重要的地位。但由于数据规模的增长,急需对HGGF算法进行优化,以缩短运行时间。经分析,算法的热点部分耗时受到非规则访存的严重影响,因此针对算法的结构和非规则访存模型,提出了数据预排序方法,并分析了该方法如何影响访存过程。在此基础上,利用数据对齐、循环分解进一步优化访存效率,利用负载均衡和互斥变量私有化的方法提高了Open MP的并行效率,最终将HGGF应用使用12线程加速11.6倍,同时取得了更好的可扩展性。主要有三点贡献:(1)分析了HGGF算法的非规则访存问题;(2)提出并分析了数据预排序方法;(3)使用数据对齐、循环分解、负载均衡、互斥变量私有化方法提高了HGGF应用的并行性能。 展开更多
关键词 天体物理成团 非规则访存优化 数据预排序 并行计算
在线阅读 下载PDF
上一页 1 2 3 下一页 到第
使用帮助 返回顶部