GPUだとなんで行列の積と和が高速にこなせるのかピンと来てないです。後で調べてみます。ありがとうございます。

Reply to this note

Please Login to reply.

Discussion

条件付きジャンプやメモリアクセス先の変更が少なくて、纏まった量の決まった演算が多いから、と聞いています

信号処理の分野で昔からdspっていう概念がありますよね。連続したメモリ領域で分岐予測が必要ない演算を高速に行うものだと思います。それのより汎用的なシステムなんでしょうかね。最近だとコンパイラの最適化も人が追いかけるの難しいレベルでしょうし、色んな要素技術が集まって高速に動かしてるんでしょうね。調べて見たいと思います。CUDAの本とか、GPUのレジスタとか命令セットは斜め読みだと難しくてよく分かんないんですよね…。意外と複雑なのかも…。

CPUから見るとGPUは汎用性を捨ててある(グラフィック形の)演算に特化してる方です。

CPUはだいたいコアが10個くらいで、いろんな順番で全然違う処理が出来るようにクロックを上げまくって頑張る方針ですが、GPUはコア10000個くらい用意して、メモリアクセスを速くして、入出力が大量な決まった演算が得意、っていう方針の違いがあると思います。

* グラフィック系