产业集群信息网

产业集群决策

1 生物技术资源文献
2 电子信息资源文献
3 环境科学文献资源
4 海洋科学技术文献
5 新材料数据库文献
6 光机电技术资源文献

LU分解和Laplace算法在GPU上的实现

陈颖[1] 林锦贤[1,2] 吕暾[2,3]

关键词：图形处理器 LU分解 Laplace算法统一计算设备架构共享存储器

主要内容：随着图形处理器（GPU）性能的大幅度提升以及可编程性的发展，已经有许多算法成功地移植到GPU上。LU分解和Laplace算法是科学计算的核心，但计算量往往很大，由此提出了一种在GPU上加速计算的方法。使用Nvidia公司的统一计算设备架构（CUDA）编程模型实现这两个算法，通过对CPU与GPU进行任务划分，同时利用GPU上的共享存储器提高数据访问速度，对GPU程序进行分支消除，并且对矩阵分段计算以达到加速计算的目的。实验结果表明，随着矩阵规模的增大，基于GPU的算法相对于基于CPU的算法具有良好的加速效果。

《计算机应用》 2011,31(3).-851-855

全文下载请进入http://hightech.stlib.cn/tpi_1/sysasp/include/index.asp