| LU分解和Laplace算法在GPU上的实现 |
| 陈颖[1] 林锦贤[1,2] 吕暾[2,3] |
| 关键词:图形处理器 LU分解 Laplace算法 统一计算设备架构 共享存储器 |
| 主要内容:随着图形处理器(GPU)性能的大幅度提升以及可编程性的发展,已经有许多算法成功地移植到GPU上。LU分解和Laplace算法是科学计算的核心,但计算量往往很大,由此提出了一种在GPU上加速计算的方法。使用Nvidia公司的统一计算设备架构(CUDA)编程模型实现这两个算法,通过对CPU与GPU进行任务划分,同时利用GPU上的共享存储器提高数据访问速度,对GPU程序进行分支消除,并且对矩阵分段计算以达到加速计算的目的。实验结果表明,随着矩阵规模的增大,基于GPU的算法相对于基于CPU的算法具有良好的加速效果。 |
| 《计算机应用》 2011,31(3).-851-855 |
| 全文下载请进入http://hightech.stlib.cn/tpi_1/sysasp/include/index.asp |