PS:GCC用みたい。CPUに対して余計な事するかもしれない。
プリフェッチは「次にアクセスするメモリ」を予告しておく行為。
//プリフェッチ // fcPreFetchUp (i+1 < pCol を守る)
// 上向きカウント専用
inline void fcPreFetchUp(const size_t& i) noexcept {
#if defined(PREFETCH_OPT)
if (i + 1 < pCol) {
//if (i + 1 < pCol) って遅い?いいえ、ほぼ無視できるオーバーヘッドです。現代CPUと最適化コンパイラ(特に -O2 以上)では、if (i + 1 < N)は分岐予測が効いてほぼノーコスト。
__builtin_prefetch(&mVector[i + 1], 0, 1);
}
#endif
}
// 下向きカウント専用(最後から2つ前まで)
inline void fcPreFetchDown(const size_t& i) noexcept {
#if defined(PREFETCH_OPT)
if (i >= 1) {
__builtin_prefetch(&mVector[i - 1], 0, 1);
}
#endif
}
//とある関数内
for (size_t i = 0; i < piSize; ++i) {
fcPreFetchUp(i);
mVector[i]=i;
}
引用ChatGPT