今日学んだこと: MKL_DIRECT_CALL

さて、"いいね"がつかないこの「今日学んだこと」コーナー。

今回はIntelが提供するMath Kernel Libraryで小さな行列計算を高速化する最適化がなされたという話。

小さな問題サイズにおけるインテル® MKL パフォーマンスの向上: MKL_DIRECT_CALL の使用
http://www.isus.jp/article/library-special/improve-mkl-performance-for-small-problems/

MKLのxGEMMは大きな行列積を速くするようにチューニングされていて、小さい行列は手でやっても変わらないんじゃないかって思ってたんだけど、ベンチマークを見るとそうでもないみたい。

手で書いた行列積はやっぱり全然遅いのね。

”インテル® MKL 11.2 のほうが 11.1.1 よりもパフォーマンスが優れていることが分かります。”
なるほど、なるほど。確かに11.1.1より結構速くなってる。φ(．． )

"また、MKL_DIRECT_CALL によってもたらされる利点も明らかです。"
そ、そうだろうか (￣□￣；) ちょっとだけ速くなってるけど...

まあとにかく、11.1を使っている人は11.2以上にupgradeしたほうがいいよって話。

ifortさんのブログ

在米10+年のifortです。ハイパフォーマンスコンピューティングとか計算機科学とかFortranとか、そういった類のことをアメリカから発信していこうかと思っています。

今日学んだこと: MKL_DIRECT_CALL