「最初はエクセルだけでど

 また新しいお話です。」

エクセルの関数には

・Sinやπなど数学の関数

・複利計算など財務関数

など専門の知識が必要な関数があります。

中でも最近注目されているのが

データサイエンス

大量のデータを分析することです。

分析とは

・わかりやすいグラフを作成する

・統計学の値(分析の機能や関数)を求める。

つまりは、データの

傾向や特徴を探し出して

わかりやすい数値やグラフにすることです。

エクセルは

・複雑な表を作成する(ワープロ)

・便利なファイルを作成する。

・お仕事を自動化する(VBA)

などに加えて

・データを集計、分析する

機能もあります。

総合アプリです。

※次に紹介するMicrosoft365アプリの

 PowerBIに相当します。

 

分析するためのデータの準備

エクセルに限らずデータの在り方で

分析できる、出来ない

決まってしまいます。

正しいシートの構成

・データは一行目に項目

・二行目以降に縦方向にデータを入力

ダメなパターン(バッドノウハウ)

・一セルに1データの原則

・セルの結合

※データのシート以外、表だけの場合も同じです。

・列にはデータのタイプ(数値、文字、日付)を設定

・横方向にデータが伸びる(エクセル絵巻物語

・印刷用のシートにデータを入力(エクセル方眼紙

・シート名に日付(年月)を入れていく

 シートが増えていくパターン

・ファイルを分ける(ファイル名に年月など)

この様な誤ったファイルや使い方も見つけたら

きちんと指摘して作り直しましょう。

データサイエンス(分析)には不向きです。

 

さて

正しいデータのシートにデータが準備できたら

分析してみましょう。

・ピボットテーブルの作成

・ピボットグラフの作成

※フィルターの機能でグラフとテーブル(表)が

 連動することを確認します。

・グラフに近似曲線を追加する。

※作成した禁止直線の式を表示させましょう。

 データの傾向が数値で理解できます。

・平均値と標準偏差を計算する。

・散布図 と 正規分布曲線

・二つのデータを比較する相関係数、t検定

データサイエンス(分析)の基本をマスターしましょう。

平均値はわかるけど

標準偏差?学生時代習ったはずです。

平均値 =AVERAGE(数値のデータ範囲)

標準偏差=STDEV.P(数値のデータ範囲)

※データのばらつきの指標です。

相関係数=CORREL(数値A、数値B)

相関係数と近似曲線

アドインから分析ツールを使う

殆どの分析の指標を計算してくれます。

※統計の知識が必要です。

 現代では統計学も必須です。

 一度勉強してみましょう。

 

職場に適当なデータがあれば試してみましょう。

ネット上にあるデータで分析しても良いです。

コロナ患者数と人口密度

など思いつく事例を探してみてください。

演習問題がありましたので

チャレンジしてみてください。

タイタニック号の生存予測

「それと、次回の勉強で使いますので

 自分の自己紹介をワードで

 作っておいてください」

ちょっと意味ありげな一言で終了します。