CUDAとOpenCLによるGPUを用いた行列-行列積(GEMM)の実装テスト備忘録。OpenMPを用いたCPUのマルチスレッド型の並列実装とも比較する 目次実装コードGPUアーキテクチャの勉強評価に用いる行列-行列積(GEMM)簡易速度評価 実装コード 実装したコード、環境構築用ス …
続きを読む
タグ:OpenMP
【OpenMP】マルチスレッド並列化による処理の高速化効果検証
コンピュータ・システムの勉強の一環としてC++を用いた行列-行列積演算の高速化を行ったうちの「スレッド並列化編」としてここで簡単にまとめておきます。勉強したことをまとめがてらアウトプットしているので、間違い等ございましたらご指摘いただけると助かります。 目次 …
続きを読む
