覚書 なぜ const size_t& より size_t のほうが速いのか
適用後、若干早くなった。1分近くの短縮ができたら良いんだが。
d_fcCopySE_BlockSTD_pVector:548μs
d_fcCopySE_BlockSIMD_pVector:335μs
d_fcCopySE_BaseSTD_pVector:265μs
d_fcCopySE_BaseSIMD_pVector:450μs
Arr N*N:N=20000
mtd:stdコピー : 1: 190ms, 2: 191ms, ...... 9: 188ms, 10: 189ms, 平均 189 ms
mtd:SIMDコピー : 1: 254ms, 2: 253ms, ...... 9: 253ms, 10: 256ms, 平均 254 ms
mtd:ブロッキング stdコピー : 1: 265ms, 2: 263ms, ...... 9: 262ms, 10: 260ms, 平均 261 ms
mtd:ブロッキングSIMDコピー : 1: 260ms, 2: 256ms, ...... 9: 256ms, 10: 254ms, 平均 256 ms
mtd:マルチスレ_STDコピー : 1: 103ms, 2: 101ms, ...... 9: 101ms, 10: 101ms, 平均 100 ms
mtd:forコピー : 1: 324ms, 2: 328ms, ...... 9: 321ms, 10: 323ms, 平均 323 ms
new:stdコピー : 1: 264ms, 2: 267ms, ...... 9: 266ms, 10: 267ms, 平均 267 ms
new:forコピー : 1: 319ms, 2: 310ms, ...... 9: 308ms, 10: 310ms, 平均 313 ms
vec:stdコピー : 1: 261ms, 2: 259ms, ...... 9: 258ms, 10: 258ms, 平均 258 ms
vec:forコピー : 1: 315ms, 2: 316ms, ...... 9: 314ms, 10: 316ms, 平均 314 ms
mtd:STDスワップ : 1: 373ms, 2: 353ms, ...... 9: 350ms, 10: 346ms, 平均 352 ms
mtd:SIMDスワップ : 1: 295ms, 2: 299ms, ...... 9: 293ms, 10: 295ms, 平均 295 ms
mtd:ブロッキングSTDスワップ : 1: 352ms, 2: 350ms, ...... 9: 345ms, 10: 347ms, 平均 348 ms
mtd:ブロッキングSIMDスワップ : 1: 295ms, 2: 295ms, ...... 9: 293ms, 10: 293ms, 平均 293 ms
mtd:forスワップ : 1: 409ms, 2: 407ms, ...... 9: 404ms, 10: 410ms, 平均 407 ms
new:stdスワップ : 1: 0ms, 2: 0ms, ...... 9: 0ms, 10: 0ms, 平均 0 ms
new:forスワップ : 1: 393ms, 2: 378ms, ...... 9: 371ms, 10: 374ms, 平均 375 ms
vec:stdスワップ : 1: 0ms, 2: 0ms, ...... 9: 0ms, 10: 0ms, 平均 0 ms
vec:forスワップ : 1: 315ms, 2: 311ms, ...... 9: 307ms, 10: 304ms, 平均 307 ms
Arr N*N:N=1000
mtd:M2M2掛算 : 1: 886ms, 2: 863ms, ...... 9: 870ms, 10: 871ms, 平均 867 ms
new:M2M2掛算 : 1: 442ms, 2: 443ms, ...... 9: 431ms, 10: 432ms, 平均 434 ms
vec:M2M2掛算 : 1: 438ms, 2: 443ms, ...... 9: 430ms, 10: 430ms, 平均 434 ms
Arr N*N:N=20000
mtd:ランダムアクセス : 1: 10ms, 2: 8ms, ...... 9: 7ms, 10: 7ms, 平均 7 ms
new:ランダムアクセス : 1: 9ms, 2: 8ms, ...... 9: 7ms, 10: 7ms, 平均 7 ms
vec:ランダムアクセス : 1: 10ms, 2: 9ms, ...... 9: 8ms, 10: 9ms, 平均 7 ms
Arr N*N:N=10000
mtd:行アクセス : 1: 168ms, 2: 167ms, ...... 9: 165ms, 10: 169ms, 平均 166 ms
mtd:列アクセス : 1: 509ms, 2: 503ms, ...... 9: 505ms, 10: 503ms, 平均 504 ms
new:行アクセス : 1: 166ms, 2: 167ms, ...... 9: 166ms, 10: 167ms, 平均 166 ms
new:列アクセス : 1: 388ms, 2: 389ms, ...... 9: 388ms, 10: 388ms, 平均 386 ms
vec:行アクセス : 1: 166ms, 2: 183ms, ...... 9: 165ms, 10: 169ms, 平均 168 ms
vec:列アクセス : 1: 414ms, 2: 410ms, ...... 9: 389ms, 10: 393ms, 平均 397 ms
Arr N*N:N=20000
mtd:memset 0 : 1: 186ms, 2: 170ms, ...... 9: 167ms, 10: 168ms, 平均 170 ms
mtd:for 0 Set : 1: 213ms, 2: 213ms, ...... 9: 209ms, 10: 211ms, 平均 209 ms
new:for 0 Set : 1: 200ms, 2: 201ms, ...... 9: 199ms, 10: 200ms, 平均 200 ms
vec:std::fill 0 Set : 1: 187ms, 2: 169ms, ...... 9: 169ms, 10: 170ms, 平均 170 ms
vec:for 0 Set : 1: 204ms, 2: 200ms, ...... 9: 199ms, 10: 199ms, 平均 200 ms
mtd:Practice : 1:1787ms, 2:1765ms, ...... 9:1764ms, 10:1763ms, 平均 1762 ms
new:Practice : 1:1949ms, 2:1927ms, ...... 9:1930ms, 10:1929ms, 平均 1933 ms
vec:Practice : 1:1939ms, 2:1908ms, ...... 9:1911ms, 10:1909ms, 平均 1915 ms
=====================================================
=========== 全体集計 10回の平均時間 ===========
=====================================================
mtd:stdコピー 平均 189 ms
mtd:SIMDコピー 平均 254 ms
mtd:ブロッキング stdコピー 平均 261 ms
mtd:ブロッキングSIMDコピー 平均 256 ms
mtd:マルチスレ_STDコピー 平均 100 ms
mtd:forコピー 平均 323 ms
new:stdコピー 平均 267 ms
new:forコピー 平均 313 ms
vec:stdコピー 平均 258 ms
vec:forコピー 平均 314 ms
mtd:STDスワップ 平均 352 ms
mtd:SIMDスワップ 平均 295 ms
mtd:ブロッキングSTDスワップ 平均 348 ms
mtd:ブロッキングSIMDスワップ 平均 293 ms
mtd:forスワップ 平均 407 ms
new:stdスワップ 平均 0 ms
new:forスワップ 平均 375 ms
vec:stdスワップ 平均 0 ms
vec:forスワップ 平均 307 ms
mtd:M2M2掛算 平均 867 ms
new:M2M2掛算 平均 434 ms
vec:M2M2掛算 平均 434 ms
mtd:ランダムアクセス 平均 7 ms
new:ランダムアクセス 平均 7 ms
vec:ランダムアクセス 平均 7 ms
mtd:行アクセス 平均 166 ms
mtd:列アクセス 平均 504 ms
new:行アクセス 平均 166 ms
new:列アクセス 平均 386 ms
vec:行アクセス 平均 168 ms
vec:列アクセス 平均 397 ms
mtd:memset 0 平均 170 ms
mtd:for 0 Set 平均 209 ms
new:for 0 Set 平均 200 ms
vec:std::fill 0 Set 平均 170 ms
vec:for 0 Set 平均 200 ms
mtd:Practice 平均 1762 ms
new:Practice 平均 1933 ms
vec:Practice 平均 1915 ms
Hello World!