みなさま、こんばんわ🌜

今日の大阪は日差しの強い真夏日でした😅

 
1 Python 2年生 データ分析 1日目

本日から『Python 2年生 データ分析』の学習に入りました❗

 

今日から新しい本に入りました😉

2 データ分析とは
 

新しい本のサブタイトルは「データ分析」です。

 

本の始めの方に、「データ分析」の説明がありました。

データ分析とは

データ分析は、客観的な事実をもとにしたよりよい解決方法です。

データを見ると、「現在こういう状態だとわかり、ここが問題だと考えられます。だから、ここを改善してみましょう」と論的な解決方法を考えることができます。

データ分析とは、「データを集めて、問題の解決方法を考える技術」なのです。

参考 森巧尚(2020)『Python2年生 データ分析のしくみ 体験してわかる!会話でまなべる!』pp.15, 翔泳社

データ分析は、感や経験に頼らない、より科学的な問題解決法と言えそうです😉

3 Jupyter Notebook

このシリーズのこれまでの本では、Python をインストールするときにおまけについてきた IDLE(アイドル)というエディタを使用していましたが、「データ分析」では Jupyter Notebook という、ブラウザ上で動作するプログラムの対話型実行環境を使用することになりました。

 

以前、別の本(『スッキリわかる Python入門』)でインストールしていた Anaconda3 上のソフトです。

 

Anaconda3 をインストールしたのは今月の始めのことですが、既にアップデートがあったようで、色々アップデートしていると、使えるようになるまでに時間がかかりました😅

 

情報技術はすごいスピードでどんどん進んでいるようです。

 

4 データの前処理
 

本では「データの前処理」の重要性について説明が書いてありました。

 

前処理とは、「データをきちんと揃えて使える状態にしておくこと」のことのようです。

 

前処理では以下の手順で、データを用意していきます。

  1. 表データの読み込み
  2. データをざっくり眺めて把握
  3. 必要なデータの追加や不必要なデータの削除
  4. 欠損データなどのデータミスをチェックする

 

データを分析する前に、こういった準備が大切なんですね😃

5 データの抽出・追加・削除

早速、Jupyter Notebook を使って、データをデータフレームに入力して表示したり、データを追加したり、削除したりしてみました。

 

IDLE はいちいちファイルを保存しなければ動かせませんが、Jupyter Notebook ならファイルを保存しなくてもすぐにプログラムを動かせるので、試行錯誤しながらプログラミングを行うにはもってこいだと思いました😉

6 ChatGPTに質問

本の通りに入力してもエラーが出たり、うまくいってもコードの意味がわからないこともあります💦

 

そういう時、私はすぐに ChatGPT に質問しています😉

 

Python などのプログラミングは ChatGPT の得意分野みたいで、すぐに的確かつ丁寧な答えが返ってきます。

 

GPT-3.5なので、料金は無料です👌

 

わからないことがあれば、どんどん ChatGPT に質問してみましょう😉⭐

 

今日はここまで❗

 

最後までお読みいただき、ありがとうございました😄

また来てね~😄👋