Posts Tagged ‘CUDA’

在网上有很多讲如何实现Tiled Matrix Multiplication的文章,不过大部分只对方阵且尺寸等于Tile尺寸整倍数的矩阵有效。我在这里贴出实现任意尺寸矩阵乘法的代码。

Read the rest of this entry »

World Line
Time Machine
Friendly Links
Online Tools