大体、基本ツールのチューニングって粒度が小さすぎて、効果無さ過ぎ。SIMD用に立て積み、横積み、アンロール、L1L2キャッシュ制御と技を繰り出すが、手間がかかる割には効果が薄い。コントローラ側で色々やり始めたら、キャッシュ制御なんて単なるオーバーヘッドになりかねない。球面線形補間みたいな重い関数を使った演算子は、やりがいがあるんだけど、元が重すぎて誰も使ってない。色々やってるうちに、最後には、コンパイラの出したアセンブラコードを読み出す始末。結論は、コンパイラの気持ちになってコードを書くと言うことだった。ボスは、9月、9月って焦ってるし、これで良いのか。