みなさま、こんばんわ🌜

大阪は台風一過で、やっと穏やかな天候が戻ってきました😃

 
1 Python 3年生 機械学習 5日目

本日は『Python 3年生 機械学習のしくみ』という本の5日目の学習日でした。

 

本日は「4章 機械学習のいろいろなアルゴリズム」の「分類:ランダムフォレスト」から学習をスタートさせました。

2 分類:ランダムフォレスト

「ランダムフォレスト」は、決定木をたくさん作って、多数決で予測をする、精度の高いアルゴリズムです。

 

決定木の予測精度をもっと上げるために考えられました。

 

決定木のデータをそのまま使って、ランダムフォレストを試してみました。

 

正解率が100%で、精度の高い分類ができているのがわかります。

3 分類:k-NN(k近傍法)

「k-NN(k近傍法)」は、近くにあるデータは仲間という考え方で、調べたい値の近くにあるデータを調べて、何の仲間かを予測するアルゴリズムです。

 

k-NN(k近傍法)を試してみました👆👆👆

 

こちらも正解率が100%になっていて、精度の高い分類法だとわかりますね😃

4 クラスタリング:k-means(k平均法)

「k-means(k平均法)」も「k-NN(k近傍法)」と同じく、近くあるデータは仲間という考え方を使ったアルゴリズムです。

 

「k-NN(k近傍法)」との最大の違いは、「k-means(k平均法)」が 教師なし学習 という点です。

 

答えはわからないけど、答えを見つける方法は知っているから、グループ分けをすることができるそうです。

 

k-NN(k近傍法)のデータを利用して、k-means(k平均法)を試してみました。

 

答えのデータを渡さないので、コードが k-NN(k近傍法)よりもさらに簡素になっています。

 

警告が出ていますが、ChatGPT で調べても今は意味がわからないので、先に進みます😅

5 画像から数字を予測する

今度は画像から数字を予測するプログラムを作ります。

 

『Python1年生 第2版 体験してわかる!会話でまなべる!プログラミングのしくみ』で作ったのと同じようなプログラムですね😊️

 

0~9の数字の特徴を、コンピュータが理解しやすいようにスライスしたのがこちらの図です👆👆👆

 

コンピュータは全体像から雰囲気を把握するのではなく、細切れにして理解するみたいですね😃

 

データを生成したり、計算をしたりした後、「4」の数字の画像を渡すと、コンピュータはちゃんと「4」だと予測できました。

 

「Python 1年生」の学習から1ヵ月と10日経ちました。

 

先月に「Python 1年生」を勉強した時よりも、少しだけ人工知能について理解が深まったような気がしています🙂

 

今日はここまで❗

 

最後までお読みいただき、ありがとうございました😄

また来てね~😄👋