覚書 なぜ const size_t& より size_t のほうが速いのか

適用後、若干早くなった。1分近くの短縮ができたら良いんだが。



d_fcCopySE_BlockSTD_pVector:548μs
d_fcCopySE_BlockSIMD_pVector:335μs
d_fcCopySE_BaseSTD_pVector:265μs
d_fcCopySE_BaseSIMD_pVector:450μs
Arr N*N:N=20000
mtd:stdコピー                :   1: 190ms,   2: 191ms, ......  9: 188ms,  10: 189ms,  平均   189 ms
mtd:SIMDコピー               :   1: 254ms,   2: 253ms, ......  9: 253ms,  10: 256ms,  平均   254 ms
mtd:ブロッキング stdコピー   :   1: 265ms,   2: 263ms, ......  9: 262ms,  10: 260ms,  平均   261 ms
mtd:ブロッキングSIMDコピー   :   1: 260ms,   2: 256ms, ......  9: 256ms,  10: 254ms,  平均   256 ms
mtd:マルチスレ_STDコピー     :   1: 103ms,   2: 101ms, ......  9: 101ms,  10: 101ms,  平均   100 ms
mtd:forコピー                :   1: 324ms,   2: 328ms, ......  9: 321ms,  10: 323ms,  平均   323 ms
new:stdコピー                :   1: 264ms,   2: 267ms, ......  9: 266ms,  10: 267ms,  平均   267 ms
new:forコピー                :   1: 319ms,   2: 310ms, ......  9: 308ms,  10: 310ms,  平均   313 ms
vec:stdコピー                :   1: 261ms,   2: 259ms, ......  9: 258ms,  10: 258ms,  平均   258 ms
vec:forコピー                :   1: 315ms,   2: 316ms, ......  9: 314ms,  10: 316ms,  平均   314 ms
mtd:STDスワップ              :   1: 373ms,   2: 353ms, ......  9: 350ms,  10: 346ms,  平均   352 ms
mtd:SIMDスワップ             :   1: 295ms,   2: 299ms, ......  9: 293ms,  10: 295ms,  平均   295 ms
mtd:ブロッキングSTDスワップ  :   1: 352ms,   2: 350ms, ......  9: 345ms,  10: 347ms,  平均   348 ms
mtd:ブロッキングSIMDスワップ :   1: 295ms,   2: 295ms, ......  9: 293ms,  10: 293ms,  平均   293 ms
mtd:forスワップ              :   1: 409ms,   2: 407ms, ......  9: 404ms,  10: 410ms,  平均   407 ms
new:stdスワップ              :   1:   0ms,   2:   0ms, ......  9:   0ms,  10:   0ms,  平均     0 ms
new:forスワップ              :   1: 393ms,   2: 378ms, ......  9: 371ms,  10: 374ms,  平均   375 ms
vec:stdスワップ              :   1:   0ms,   2:   0ms, ......  9:   0ms,  10:   0ms,  平均     0 ms
vec:forスワップ              :   1: 315ms,   2: 311ms, ......  9: 307ms,  10: 304ms,  平均   307 ms
Arr N*N:N=1000
mtd:M2M2掛算                 :   1: 886ms,   2: 863ms, ......  9: 870ms,  10: 871ms,  平均   867 ms
new:M2M2掛算                 :   1: 442ms,   2: 443ms, ......  9: 431ms,  10: 432ms,  平均   434 ms
vec:M2M2掛算                 :   1: 438ms,   2: 443ms, ......  9: 430ms,  10: 430ms,  平均   434 ms
Arr N*N:N=20000
mtd:ランダムアクセス                :   1:  10ms,   2:   8ms, ......  9:   7ms,  10:   7ms,  平均     7 ms
new:ランダムアクセス                :   1:   9ms,   2:   8ms, ......  9:   7ms,  10:   7ms,  平均     7 ms
vec:ランダムアクセス                :   1:  10ms,   2:   9ms, ......  9:   8ms,  10:   9ms,  平均     7 ms
Arr N*N:N=10000
mtd:行アクセス                   :   1: 168ms,   2: 167ms, ......  9: 165ms,  10: 169ms,  平均   166 ms
mtd:列アクセス                   :   1: 509ms,   2: 503ms, ......  9: 505ms,  10: 503ms,  平均   504 ms
new:行アクセス                   :   1: 166ms,   2: 167ms, ......  9: 166ms,  10: 167ms,  平均   166 ms
new:列アクセス                   :   1: 388ms,   2: 389ms, ......  9: 388ms,  10: 388ms,  平均   386 ms
vec:行アクセス                   :   1: 166ms,   2: 183ms, ......  9: 165ms,  10: 169ms,  平均   168 ms
vec:列アクセス                   :   1: 414ms,   2: 410ms, ......  9: 389ms,  10: 393ms,  平均   397 ms
Arr N*N:N=20000
mtd:memset 0                 :   1: 186ms,   2: 170ms, ......  9: 167ms,  10: 168ms,  平均   170 ms
mtd:for 0 Set                :   1: 213ms,   2: 213ms, ......  9: 209ms,  10: 211ms,  平均   209 ms
new:for 0 Set                :   1: 200ms,   2: 201ms, ......  9: 199ms,  10: 200ms,  平均   200 ms
vec:std::fill 0 Set          :   1: 187ms,   2: 169ms, ......  9: 169ms,  10: 170ms,  平均   170 ms
vec:for 0 Set                :   1: 204ms,   2: 200ms, ......  9: 199ms,  10: 199ms,  平均   200 ms
mtd:Practice                 :   1:1787ms,   2:1765ms, ......  9:1764ms,  10:1763ms,  平均  1762 ms
new:Practice                 :   1:1949ms,   2:1927ms, ......  9:1930ms,  10:1929ms,  平均  1933 ms
vec:Practice                 :   1:1939ms,   2:1908ms, ......  9:1911ms,  10:1909ms,  平均  1915 ms


=====================================================
=========== 全体集計    10回の平均時間  ===========
=====================================================

mtd:stdコピー                 平均 189   ms
mtd:SIMDコピー                平均 254   ms
mtd:ブロッキング stdコピー    平均 261   ms
mtd:ブロッキングSIMDコピー    平均 256   ms
mtd:マルチスレ_STDコピー      平均 100   ms
mtd:forコピー                 平均 323   ms
new:stdコピー                 平均 267   ms
new:forコピー                 平均 313   ms
vec:stdコピー                 平均 258   ms
vec:forコピー                 平均 314   ms
mtd:STDスワップ               平均 352   ms
mtd:SIMDスワップ              平均 295   ms
mtd:ブロッキングSTDスワップ   平均 348   ms
mtd:ブロッキングSIMDスワップ  平均 293   ms
mtd:forスワップ               平均 407   ms
new:stdスワップ               平均 0     ms
new:forスワップ               平均 375   ms
vec:stdスワップ               平均 0     ms
vec:forスワップ               平均 307   ms
mtd:M2M2掛算                  平均 867   ms
new:M2M2掛算                  平均 434   ms
vec:M2M2掛算                  平均 434   ms
mtd:ランダムアクセス                 平均 7     ms
new:ランダムアクセス                 平均 7     ms
vec:ランダムアクセス                 平均 7     ms
mtd:行アクセス                    平均 166   ms
mtd:列アクセス                    平均 504   ms
new:行アクセス                    平均 166   ms
new:列アクセス                    平均 386   ms
vec:行アクセス                    平均 168   ms
vec:列アクセス                    平均 397   ms
mtd:memset 0                  平均 170   ms
mtd:for 0 Set                 平均 209   ms
new:for 0 Set                 平均 200   ms
vec:std::fill 0 Set           平均 170   ms
vec:for 0 Set                 平均 200   ms
mtd:Practice                  平均 1762  ms
new:Practice                  平均 1933  ms
vec:Practice                  平均 1915  ms
Hello World!