覚書



プロセッサ    AMD Ryzen 5 3500U with Radeon Vega Mobile Gfx     2.10 GHz
実装 RAM    8.00 GB (5.88 GB 使用可能)

fcCopySE_BlockSTDcopy_pVector :     2 ms
fcCopySE_BlockSIMD_pVector    :     3 ms
fcCopySE_BaseSTDcopy_pVector  :     4 ms
fcCopySE_BaseSIMD_pVector     :     4 ms
Type10
d_fcCopySE_BlockSIMD_pVector:3273μs
d_fcCopySE_BlockSIMD_pVector:3273μs
d_fcCopySE_BaseSTD_pVector:4724μs
d_fcCopySE_BaseSIMD_pVector:4924μs
Arr N*N:N=10000
mtd:stdコピー                :   1: 135ms,   2: 103ms, ......  9: 102ms,  10: 103ms,  平均   112 ms
mtd:SIMDコピー               :   1: 180ms,   2: 175ms, ......  9: 193ms,  10: 208ms,  平均   190 ms
mtd:ブロッキング stdコピー   :   1: 188ms,   2: 217ms, ......  9: 218ms,  10: 233ms,  平均   230 ms
mtd:ブロッキングSIMDコピー   :   1: 233ms,   2: 233ms, ......  9: 227ms,  10: 235ms,  平均   229 ms
mtd:マルチスレ_STDコピー     :   1:  81ms,   2:  76ms, ......  9:  91ms,  10:  82ms,  平均    82 ms
mtd:forコピー                :   1: 414ms,   2: 376ms, ......  9: 433ms,  10: 395ms,  平均   404 ms
new:stdコピー                :   1: 235ms,   2: 226ms, ......  9: 210ms,  10: 199ms,  平均   216 ms
new:forコピー                :   1: 224ms,   2: 220ms, ......  9: 236ms,  10: 223ms,  平均   221 ms
vec:stdコピー                :   1: 230ms,   2: 222ms, ......  9: 202ms,  10: 213ms,  平均   217 ms
vec:forコピー                :   1: 235ms,   2: 231ms, ......  9: 218ms,  10: 233ms,  平均   229 ms
mtd:STDスワップ              :   1: 311ms,   2: 295ms, ......  9: 329ms,  10: 331ms,  平均   316 ms
mtd:SIMDスワップ             :   1: 291ms,   2: 289ms, ......  9: 268ms,  10: 282ms,  平均   279 ms
mtd:ブロッキングSTDスワップ  :   1: 312ms,   2: 313ms, ......  9: 302ms,  10: 343ms,  平均   317 ms
mtd:ブロッキングSIMDスワップ :   1: 278ms,   2: 294ms, ......  9: 265ms,  10: 329ms,  平均   272 ms
mtd:forスワップ              :   1: 613ms,   2: 565ms, ......  9: 714ms,  10: 622ms,  平均   653 ms
new:stdスワップ              :   1:   0ms,   2:   0ms, ......  9:   0ms,  10:   0ms,  平均     0 ms
new:forスワップ              :   1: 333ms,   2: 303ms, ......  9: 292ms,  10: 289ms,  平均   309 ms
vec:stdスワップ              :   1:   0ms,   2:   0ms, ......  9:   0ms,  10:   0ms,  平均     0 ms
vec:forスワップ              :   1: 220ms,   2: 228ms, ......  9: 250ms,  10: 224ms,  平均   231 ms
Arr N*N:N=100
mtd:M2M2掛算                 :   1:   4ms,   2:   6ms, ......  9:   4ms,  10:   5ms,  平均     4 ms
new:M2M2掛算                 :   1:   2ms,   2:   4ms, ......  9:   2ms,  10:   3ms,  平均     1 ms
vec:M2M2掛算                 :   1:   1ms,   2:   1ms, ......  9:   1ms,  10:   1ms,  平均     1 ms
Arr N*N:N=10000
mtd:ランダムアクセス                :   1:   2ms,   2:   4ms, ......  9:   3ms,  10:   2ms,  平均     2 ms
new:ランダムアクセス                :   1:   7ms,   2:   3ms, ......  9:   3ms,  10:   3ms,  平均     4 ms
vec:ランダムアクセス                :   1:   5ms,   2:   5ms, ......  9:   2ms,  10:   3ms,  平均     3 ms
Arr N*N:N=10000
mtd:行アクセス                   :   1: 180ms,   2: 190ms, ......  9: 191ms,  10: 178ms,  平均   176 ms
mtd:列アクセス                   :   1:1660ms,   2:1594ms, ......  9:1709ms,  10:1786ms,  平均  1697 ms
new:行アクセス                   :   1: 172ms,   2: 190ms, ......  9: 191ms,  10: 252ms,  平均   191 ms
new:列アクセス                   :   1:1854ms,   2:1851ms, ......  9:1629ms,  10:2108ms,  平均  1862 ms
vec:行アクセス                   :   1: 135ms,   2: 140ms, ......  9: 174ms,  10: 186ms,  平均   164 ms
vec:列アクセス                   :   1:1779ms,   2:2149ms, ......  9:1851ms,  10:1882ms,  平均  1917 ms
mtd:memset 0                 :   1:  40ms,   2:  37ms, ......  9:  42ms,  10:  38ms,  平均    38 ms
mtd:for 0 Set                :   1: 505ms,   2: 386ms, ......  9: 372ms,  10: 409ms,  平均   428 ms
new:for 0 Set                :   1: 172ms,   2: 181ms, ......  9: 166ms,  10: 181ms,  平均   176 ms
vec:std::fill 0 Set          :   1: 183ms,   2: 154ms, ......  9: 163ms,  10: 168ms,  平均   166 ms
vec:for 0 Set                :   1: 181ms,   2: 185ms, ......  9: 188ms,  10: 177ms,  平均   181 ms

=====================================================
=========== 全体集計    10回の平均時間  ===========
=====================================================

mtd:stdコピー                 平均 112   ms
mtd:SIMDコピー                平均 190   ms
mtd:ブロッキング stdコピー    平均 230   ms
mtd:ブロッキングSIMDコピー    平均 229   ms
mtd:マルチスレ_STDコピー      平均 82    ms
mtd:forコピー                 平均 404   ms
new:stdコピー                 平均 216   ms
new:forコピー                 平均 221   ms
vec:stdコピー                 平均 217   ms
vec:forコピー                 平均 229   ms
mtd:STDスワップ               平均 316   ms
mtd:SIMDスワップ              平均 279   ms
mtd:ブロッキングSTDスワップ   平均 317   ms
mtd:ブロッキングSIMDスワップ  平均 272   ms
mtd:forスワップ               平均 653   ms
new:stdスワップ               平均 0     ms
new:forスワップ               平均 309   ms
vec:stdスワップ               平均 0     ms
vec:forスワップ               平均 231   ms
mtd:M2M2掛算                  平均 4     ms
new:M2M2掛算                  平均 1     ms
vec:M2M2掛算                  平均 1     ms
mtd:ランダムアクセス                 平均 2     ms
new:ランダムアクセス                 平均 4     ms
vec:ランダムアクセス                 平均 3     ms
mtd:行アクセス                    平均 176   ms
mtd:列アクセス                    平均 1697  ms
new:行アクセス                    平均 191   ms
new:列アクセス                    平均 1862  ms
vec:行アクセス                    平均 164   ms
vec:列アクセス                    平均 1917  ms
mtd:memset 0                  平均 38    ms
mtd:for 0 Set                 平均 428   ms
new:for 0 Set                 平均 176   ms
vec:std::fill 0 Set           平均 166   ms
vec:for 0 Set                 平均 181   ms
Hello World!