人工知能時代の確率・統計の学び方(2) | 感じる科学、味わう数学

感じる科学、味わう数学

科学は、自然そのものというより、モデルです。数学は、関係性を捉える枠組みです。
だから、正しいか否かより、大事なのは視点です。


 

 確率と統計は似ています。けれども、確率と統計はむしろ真逆だとも言えます。確率の問題では通常「サイコロ=1/6、じゃんけん=1/3、コイン=1/2」から話が始まります。つまり中学・高校の確率では「大元が与えられて、そこから具体例を計算する」わけです。それに対して「周辺情報から大元を探る」のが統計です。その意味で真逆なのです。

 「周辺情報から大元を探る」のは、高校数学でいうと「条件付き確率」に当たります。その考え方はネット社会で多く使われています。例えば、ユーザーの利用履歴に応じて表示する広告を変える仕組みなど。限られた情報(=与えられた条件)から、ある事柄がどの程度成り立つのかを見込む(=確率を計算する)わけです。

 

 もう一つ、高校の確率の中で人工知能を理解するために必要なのは「期待値」です。さて、数学の授業で期待値を扱うときも「サイコロなら1/6、ジャンケンなら1/3、コイン投げなら1/2」が大前提になっています。大元が変わることはありません。けれども、将来必要になるのは「大元の確率を変えることで、期待値を最大化・最適化する」ことです。

 そして人工知能がやっているのは、実はそれなのです。ビッグデータを元にして、判定が最適化されるように情報に重み付けしているのです。情報の重み付けとは、一律に受け取るのではなく、強弱をつけて受け取ること。生物の脳も人工知能も同じです。忘れることやぼんやり見ることは大事な機能です。そうやって情報に重み付けをすることから意味が出てくるからです。

 

 高校数学の教科書で「条件付き確率」も「期待値」も扱いが小さいのですが、それこそが将来役立ちます。