检索结果-维普期刊中文期刊服务平台

期刊文献⁺

任意字段

题名或关键词

题名

关键词

文摘

作者

第一作者

机构

刊名

分类号

参考文献

作者简介

基金资助

栏目信息

共找到9篇文章

< 1 >

每页显示 20 50 100

已选择0条

导出题录引用分析

统计分析

显示方式：

文摘详细列表

相关度排序被引量排序时效性排序

LAPACK线性方程求解函数在龙芯3A上的并行化被引量：1: 1; 作者刘斌斌顾乃杰 +1 位作者任开新张杰《小型微型计算机系统》 CSCD 北大核心 2014年第5期1085-1089,共5页; 针对龙芯3A体系结构,该文通过变量代换或消除、简化依赖关系、增加热点数据副本、并行流水等方法对BLAS函数和LAPACK函数做并行化,基于原LAPACK库的结构层次实现了线性方程求解函数的并行化版本,用户只需设定核数重新编译出LAPACK的多... 展开更多; 关键词 lapack BLAS 龙芯3A 多核; 在线阅读下载PDF 职称材料

基于龙芯3A的LAPACK函数优化: 2; 作者张斌顾乃杰 +1 位作者何颂颂刘斌斌《计算机系统应用》 2012年第11期63-67,共5页; 针对龙芯3A体系结构,通过底层BLAS库的优化、LAPACK分块算法中分块大小的改善以及LAPACK函数的单独优化这三种途径来提升LAPACK函数的性能.用LAPACK自带的性能测试程序进行测试,实验结果表明,有240个LAPACK函数的性能提升达到30%以上,... 展开更多; 关键词 lapack BLAS 龙芯3A 优化双单精度; 在线阅读下载PDF 职称材料

LAPACK的自动并行化工具研究被引量：3: 3; 作者谢幸李玉成《数值计算与计算机应用》 CSCD 北大核心 2001年第2期130-133,共4页; LAPACK (Linear Algebra PACKage) is a subroutine library for solving the most common problems in numerical linear algebra, designed to run efficiently on shared-memory vector and parallel processors. Only the general s... 展开更多; 关键词 lapack 自动并行化并行化工具源代码分析相关性分析数据私有化基本技术; 原文传递

LAPACK中的分块算法及其效果被引量：5: 4; 作者李玉成《数值计算与计算机应用》 CSCD 北大核心 2001年第3期172-180,共9页; This paper shows two approaches to improve the performance of numeral al- gebra software by describing block algorithms in LAPACK. The block algorithms can make up higher level and more effcient BLAS programs. This pa... 展开更多; 关键词 lapack 分块算法线性代数软件包数值线性代数问题; 原文传递

基于Linux的Fortran与C/C++混合编程被引量：3: 5; 作者李霞亓雪冬《现代计算机（中旬刊）》 2012年第2期57-60,共4页; Fortran、C/C++是用户数量最多,使用最为广泛的编程语言,存在大量优秀的软件包及源代码,通过混合编程可以合并不同语言的优势,充分利用目前存在的这些软件资源。分析在Linux系统中Fortran与C/C++混合编程基本原理和内部调用约定,并通过... 展开更多; 关键词混合编程 FORTRAN F2C G77 lapack; 在线阅读下载PDF 职称材料

ABEEMσπ模型中计算分子电荷分布加速方法的比较: 6; 作者杨忠志马丽《商丘师范学院学报》 CAS 2014年第6期1-6,共6页; 基于ABEEMσπ模型计算分子的电荷分布时,求解线性方程组是最为耗时的环节.本文针对不同硬件环境下,系数矩阵是稠密、对称非正定矩阵的线性方程组的求解方法进行了比较.详细介绍了串行求解库LAPACK以及基于GPU的CULA库的使用,并给出了基... 展开更多; 关键词 ABEEMΣΠ模型 MPI GPU lapack CULA 对称非正定矩阵; 在线阅读下载PDF 职称材料

PLASMA自适应调优与性能优化的设计与实现: 7; 作者吕渐春张云泉 +1 位作者王婷肖玄基《计算机科学》 CSCD 北大核心 2012年第4期282-286,共5页; PLASMA是一个高效的线性代数软件包,其数据分布结合分堆、细粒度并行以及乱序执行机制等大大提高了程序的性能。但PLASMA仍然存在一些问题,比如分块大小对程序性能的影响非常大,以及产生了大量的数据拷贝等。通过对比传统的LAPACK和PLA... 展开更多; 关键词 lapack PLASMA 自适应调优优化; 在线阅读下载PDF 职称材料

用矩阵法拟合新磁性材料的耦合参数J及朗道因子g: 8; 作者冯晓霞《山西师范大学学报（自然科学版）》 2009年第2期58-61,共4页; 对于已制备的新磁性材料,考虑到其分子中不同位置磁性原子间的自旋相互作用能量及塞曼能,用矩阵法通过LAPACK软件包实现精确对角化求解其哈密顿量得出了配分函数,并应用Monte Carlo方法采用随机行走计算出磁化率,χ通过与实验中测定的... 展开更多; 关键词新磁性材料磁化机制矩阵法 lapack MonteCarlo方法; 在线阅读下载PDF 职称材料

xMath2.0:a high‑performance extended math library for SW26010‑Pro many‑core processor: 9; 作者 Fangfang Liu Wenjing Ma +11 位作者 Yuwen Zhao Daokun Chen Yi Hu Qinglin Lu WanWang Yin Xinhui Yuan Lijuan Jiang Hao Yan Min Li Hongsen Wang Xinyu Wang Chao Yang 《CCF Transactions on High Performance Computing》 2023年第1期56-71,共16页; High performance extended math library is used by many scientific engineering and artificial intelligence applications,which usually involves many common mathematical computations and the most time-consuming functions... 展开更多; 关键词 Extended Math Library SW26010-Pro Sunway TaihuLight Pro BLAS lapack FFT SPARSE Many-Core Processors; 在线阅读下载PDF 职称材料

	题名	作者	出处	发文年	被引量	操作
1	LAPACK线性方程求解函数在龙芯3A上的并行化	刘斌斌顾乃杰任开新张杰	《小型微型计算机系统》 CSCD 北大核心	2014	1	在线阅读下载PDF 职称材料
2	基于龙芯3A的LAPACK函数优化	张斌顾乃杰何颂颂刘斌斌	《计算机系统应用》	2012	0	在线阅读下载PDF 职称材料
3	LAPACK的自动并行化工具研究	谢幸李玉成	《数值计算与计算机应用》 CSCD 北大核心	2001	3	原文传递
4	LAPACK中的分块算法及其效果	李玉成	《数值计算与计算机应用》 CSCD 北大核心	2001	5	原文传递
5	基于Linux的Fortran与C/C++混合编程	李霞亓雪冬	《现代计算机（中旬刊）》	2012	3	在线阅读下载PDF 职称材料
6	ABEEMσπ模型中计算分子电荷分布加速方法的比较	杨忠志马丽	《商丘师范学院学报》 CAS	2014	0	在线阅读下载PDF 职称材料
7	PLASMA自适应调优与性能优化的设计与实现	吕渐春张云泉王婷肖玄基	《计算机科学》 CSCD 北大核心	2012	0	在线阅读下载PDF 职称材料
8	用矩阵法拟合新磁性材料的耦合参数J及朗道因子g	冯晓霞	《山西师范大学学报（自然科学版）》	2009	0	在线阅读下载PDF 职称材料
9	xMath2.0:a high‑performance extended math library for SW26010‑Pro many‑core processor	Fangfang Liu Wenjing Ma Yuwen Zhao Daokun Chen Yi Hu Qinglin Lu WanWang Yin Xinhui Yuan Lijuan Jiang Hao Yan Min Li Hongsen Wang Xinyu Wang Chao Yang	《CCF Transactions on High Performance Computing》	2023		在线阅读下载PDF 职称材料

已选择0条

导出题录引用分析

统计分析

使用帮助返回顶部