ぱそひろ日記ー今日はこんな感じ(パソコンHIROBAより)

ぱそひろ日記ー今日はこんな感じ(パソコンHIROBAより)

パソコンHIROBAでの出来事や講習会でのお話しです!

つい最近新しいパソコンで授業を始めることになったのですが…

それがIBMのLenovoで14インチノートパソコン

 

色々分からないことがあり講師のくせに軽く苦戦状態…ガーンガーンガーン

  • その1:電源は右側面だが、ディスプレイを空けると電源を押さなくてもWindowsが起動する
  • その2:ファンクションキーが使えない?
     ⇒[Fn]キーと[ESC]を押したら[ESC]にランプがついてファンクションロックがかかり使えた

 

何事も経験です!とりあえずは何とかなって良かったぁ…照れ

 

「出題範囲」の赤い字は、今回の【第4回】で

取り上げている内容になります。

 

出題範囲

1.平均 6.外れ値の検出 11.集計
2.中央値 7.度数分布表 12.散布図
3.最頻値 8.標準化 13.相関分析
4.レンジ 9.移動平均 14.回帰分析
5.標準偏差 10.季節調整 15.最適値

 

いつもながら長くなっていますので、

必要のないところは

適当に読み飛ばしてくださいね!

 

では始めていきます。

 

1.度数分布表とは

 

一覧にした全てのデータを

それぞれの範囲(階級)にグループ分けをして、

そのグループの中にいくつ(何人、何個など)

当てはまるデータがあるかといった

出現回数をまとめた表です。

 

 例:20人の受験者を、年代別に

   何人受験したかを調べたい。

   という場合、20~29歳、30~39歳、…

   といったように範囲(階級)を作り、

   その範囲の中に何人の受験者(度数)が

   いるかを求める。

 

   また、範囲に限らず20歳が何人、

   21歳が何人という個々のデータ(今回は歳)の

   出現頻度を調べるという事もあります。

 

まずは、度数分布表を作成するために

どういう操作が必要なのか確認した上で、

実際にExcelでの操作を見ていきます。

 

<上記の具体例を元にした表>

 

上記の表を度数分布表にすると・・・

 

階級→度数(まずはこの2つの項目を作ります)

 

         

20代は9人、30代は3人、40代は3人、

50代は2人、60代は1人

このように年代別の内訳を表にまとめます。

 

階級:対象となる個々の値や

    区切った範囲のこと

    今回対象は、年齢に範囲を持たせています!

 

度数:各階級に出現する数

    (出現頻度)

 

では、実際に一覧表から、度数分布表を

作成する手順を見ていきます。

 

2.データ一覧から度数分布表にする作業手順

 

  2-1 階級と度数

 

①表を作成!

②[並べ替え]→[塗りつぶしの色]

③色ごとに数える

④表にまとめる

 

実際に一覧表から「度数分布表」にする

作業手順を図解したものが以下です!

 

①階級を決めて表にまとめておきましょう!

 

②一覧表の出現回数を調べたい列(年齢)の

 いずれかにアクティブセルを置き

 [データ]タブ-[昇順]をクリック

          

             

20~29を範囲選択し[塗りつぶしの色]で任意の色をクリック

                

以降年代ごとに同じ色を設定!

 

③色ごとに個数を数えて、①で作成した表に記入

 

 

<参考1>

実務などで扱う大量のデータは

[条件付き書式]

を使うのが良いでしょう!

 

<参考2>

頻度を算出する関数に「MODE.SNGL」が

ありますが、違いを確認しておきます。

 

試験範囲にも出てくる

MODE.SNGL関数(最頻値を求める)は、

一覧の中から一番多く出現する

数字そのものを1つ表示することになります。

 

この表に対してMODE.SNGL関数を

使った場合は 23 の数字が答えとして

あがってきますので、

23歳の人が受験者の中で

一番多かったことになります。

 

それに対し「度数分布表は」

一覧の値そのもの、

もしくは範囲となる階級に分けて、

その階級に属する数字が何回出現するかの

出現頻度を表で表すものです。

 

  2-2 相対度数

 

全てのデータ(度数の合計)を1としたときに

それぞれのデータが何パーセント占めているかを

示す個々のデータの割合が相対度数です。

 

階級→度数→相対度数

 

 

度数の 18 と相対度数の 1 は

 それぞれの列を合計したものですが、

 あった方が内容を理解しやすいため

 ここでは載せました。

 

具体的に計算をしてみると

 

20~29歳の相対度数は

9÷18=0.50

 

30~39歳の相対度数は

3÷18=0.17

 

というように、相対度数は

 

個々の度数÷度数の合計

 

で求める事ができます。

 

<Excelでの操作手順>

 

A列、B列には元の一覧表を

作成しています。

 

 

①度数の合計を求める

 

 

②F4番地をアクティブセルにして

 「=E4/E9」の式を立てますが、以降はコピーを

 とるためB9をクリックした後[F4]キーを押して

 絶対指定に!

 

 

③F4をアクティブセルにしてオートフィルコピー

 

 

④F9をアクティブセルにして合計を求める

 

 

 

<重要な特徴>

相対度数を全て足すと必ず 1 になります!

 

 

  2-3 累積度数

 

「累積」ですから、

度数を最初の階級から順番に足していき

積み上げられた値です。

 

階級→度数→相対度数→累積度数

 

 

具体的に計算をしてみると

 

20~29歳の累積度数は

最初の度数そのものの値 9

 

30~39歳の累積度数は

9+3=12

 

40~49歳の累積度数は

12+3=15

 

となりますね。

 

最初の値だけ、

度数そのままの数値を!とりますが、

それ以降は、それまでの合計に

対象となる度数を足していけば良いのです。

 

<Excelで操作手順>

 

①I4番地をアクティブセルにして

「=E4」を入力

 

 

②I5をアクティブセルにして

 「=I4+E5」を入力

 

 

③I4をアクティブセルにしてオートフィルコピー

 

 

<重要な特徴>

赤枠で囲んでいる箇所ですが、

累積度数の最終値は度数の合計と一致

するということです!

 

  2-4 累積相対度数

 

ここは「累積度数」と同じ考えで、

相対度数を最初の階級から順番に足していき

積み上げられた値になります。

 

階級→度数→相対度数→累積度数→累積相対度数

 

 

具体的に計算をしてみると

 

20~29歳の累積相対度数は

最初の相対度数そのものの値 0.50

 

30~39歳の累積相対度数は

0.50+0.17=0.67

 

40~49歳の累積度数は

0.67+0.17=0.83

 

となります。

 

<Excelで操作手順>

 

①J4番地をアクティブセルにして

「=F4」を入力

 

②J5をアクティブセルにして

 「=J4+F5」を入力

 ※この時小数点以下の桁数が

  多く表示されますので、ここでは

  小数点以下の桁数を2桁に設定

  し直しています。

 

 

③J5をアクティブセルにしてオートフィルコピー

 

<重要な特徴>

累積相対度数の最終値は相対度数の合計と一致

するということです!

 

 

3.グラフで表現

  

最頻値をグラフで表す方法は

大きく2つあります。

 

①棒グラフからヒストグラムへ

②ヒストグラム

 

3-1 棒グラフからヒストグラムへ

 

度数分布表を元にヒストグラムを作成する場合は

棒グラフを作成します。

 

まずは元の表と完成例を確認します!

 

元の表

完成例

 

<作成手順>

 

①データ範囲を選択
 A3:B23を選択します。
 ※項目名に当たるA3:B3は範囲に入れても
     入れなくてもOK!です。

 

 

②[挿入]タブ-[縦棒/横棒グラフの挿入]

 

 

<ここまでの完成例>

 

このままでは、棒グラフそのものであって、

ヒストグラムとしては使えませんので、

ここから編集をしてヒストグラムに

変えていきます。

 

③グラフ内の系列(いずれかの棒)を選択して右クリック

 -[データ系列の書式設定]


「系列のオプション」が選択されている状態で
・「要素の間隔」を0~2の間で数字を入力
(入力する数字は好みでOK!)

 


この設定で各棒の幅が広がります。

 

<注意>
実務などの場合は、

見やすさで作成して良いと思いますが、

基本的にはヒストグラムの棒の間隔は

開けません!


ここでは、見やすさを優先して、

「要素の間隔」を 2 で設定していますが、

0 に設定しておけば試験では

間違いありません。

 

3-2 ヒストグラム

 

度数分布表にまとめられていない場合は、

表の一覧を元にヒストグラムを作成します。

 

まずは元の表と完成例を確認します!

 

元の表

完成例

 

<作成手順>

 

①データ範囲を選択
 B4:B23を選択します。
 ・ヒストグラムの範囲選択は

  対象となる一列のみ(B列)選択です。
 ・項目名に当たるB3番地の(年齢)は

  範囲に入れても入れなくても OK!です。

 

 

②[挿入]タブ-[統計グラフの挿入]-[ヒストグラム]
 

 

<ここまでの完成例>

 

 

既定のグラフでは軸の間隔が自動的に

調整されていますので、修正します。

 

③グラフ内の項目軸を選択して右クリック-
  [軸の書式設定]


「軸のオプション」が選択されている状態で
・[軸のオプション]をクリック
・[ビンの幅]をクリックし「10」を入力
・[ビンのアンダーフロー]をクリックし
 「20」を入力(確認のため)

 

 

これで完成です!

 

 

<ヒストグラムは自由度が少ない!>

 

 

完成したグラフを見ていきます。

 

[軸のオプション]で設定項目となった

ビンとは1本の棒を表しています。


つまりビンの幅=棒の幅、ということで

ビンの幅は10の幅であり

20~29(年齢)を表します。


ですが、グラフをよく見ると

21~始まっているはずです。

ヒストグラムでは、

データの一覧に存在する最小値から始まることに

なりますので、最小の年齢が21歳から

ということになります。


ビンのアンダーフローを20にしても21のままです。

 

3.棒グラフ?ヒストグラム?

 

どちらのグラフで作成するかは、

元データがカギを握っていることを

再確認しておきましょう!

 

•データの一覧から作成したいならヒストグラム
但し細かい設定ができない!

 

•度数分布表があるなら棒グラフ
自分の思うような柔軟なグラフが作れる!

 

<重要>

棒グラフとヒストグラムは

グラフの性質が異なりますので、

まったく同じ元の表から作成すると

違うものとなってしまいます。

 

4.まとめ

 

①「度数分布表」は「階級」「度数」「相対度数」

  「累積度数」「累積相対度数」から作られます。

 

 ・相対度数は合計すると 1 になる

 

 ・累積度数は度数の合計と最終値が一致する

 

 ・累積相対度数は

  相対度数の合計と最終値が一致する


②「度数分布表」の「階級」を求める際は

  [並び替え]-[塗りつぶしの色]を使いましょう。

 

「度数分布表」からは「棒グラフ」

  「データの一覧表」からは「ヒストグラム」

 

 

以上で第4回を終了します。

 

いつも見づらい画像がありすみません。

 

なんだか今回はいつもより更に

長くなってしまいました(*_*;

 

最後までご覧いただき

ありがとうございました音譜

 

「出題範囲」の赤い字は、今回の【第3回】で

取り上げている内容になります。

 

出題範囲

1.平均 6.外れ値の検出 11.集計
2.中央値 7.度数分布表 12.散布図
3.最頻値 8.標準化 13.相関分析
4.レンジ 9.移動平均 14.回帰分析
5.標準偏差 10.季節調整 15.最適値

 

今回は比較的コンパクトになる予定でしたが、

実務に即した操作も入れてしまい

またまた長くなってしまいましたので、

必要のないところは

適当に読み飛ばしてくださいね!

 

では始めていきます。

 

1.外れ値とは

 

ここは第2回の標準偏差でも触れていますが

極端に小さい値や大きい値(=規格外)

のことです。

 

データの傾向を把握する上では

この「外れ値」があることで、

平均はあまりあてにならないデータに

なることがあります。

 

(「外れ値」が必要のないデータ!」

という事ではありません!!)

 

「平均は外れ値の影響を受けやすい」でしたね!

 

・・・とここまでは前回でも述べた通りです。

 

2.外れ値はどんな時に出現するか

 

  1.データの入力ミス

  2.測定ミス

  3.重大な異常

 

1番と2番は人的なミスとなりますので、

担当する人が十分注意を払うしかないのですが、

問題は3番ですね。

 

ここで改めて抑えておきたいのは、

全てのデータが意味を持っている!

ということです。

勿論、外れ値も例外ではありません

(若干言ってることが、しつこい気もしますが・・・)

 

また外れ値自体は一律に決まりがあるわけではなく、

専門的な知識のある方が判断することになります。

 

3.具体例

 

ミカン10個の中からMサイズのミカンを

取り出す作業をします。
Mサイズになるミカンの重さを85g~105gとしたとき、

外れ値となるミカンは何個あるか。

 85、 100、 80、 85、90、 87、 91、95、110、 84

 

<ヒント>

①データ量が少ない場合は、

 並べ替えをすれば見つけやすい

②データ量が多い場合は、

 条件付き書式を使うとよい。

 

では、実際にExcelの画面で確認してみましょう!

 

 

10個のデータを表にまとめました。

今回は2つの方法

 1.並べ替え

 2.条件付き書式

を確認していきます。

 

データはA1番地から「番号」のデータを

入力しているとします。

 

<操作-並べ替え

①重さの列のどこかでクリック

 (B列に作ったならデータのあるB列のどこか)

 

②[データ]-[昇順]

         

後は必要に応じて手動で[塗りつぶしの色]を

設定しておくと解答するときに見間違いが

なくなりますね。

 

 

塗りつぶしされている以外の箇所を数えます。

 

では改めて、次の方法を確認しましょう!

 

<操作-条件付き書式

①B2:B11までを範囲選択

 

②[ホーム]タブ-[条件付き書式]

 -[セルの強調表示ルール]

 -[指定の範囲内]

   

 範囲の最小値、ここでは85

      最大値、ここでは105

を入力して[OK]をクリックです。

 

条件に該当する値に書式が設定されますので、

それ以外のセルの個数を数えれば良いですね。

 

 

答えは3です。

 

では試験とは少し離れて

実務で使う時のお話です。

 

4.大量のデータ(テーブル)

 

実務では大量のデータを扱うことになります。

その場合、目視で数を数えるという事は

効率的ではないし、ミスの原因にもなります。

 

ここはExcelに任せてしまいましょう!

 

[テーブル]機能を使います。

 

<テーブルの操作>
[挿入]タブ-[テーブル]

 

・範囲が正しく選択されていること

・「先頭行をテーブルの見出しとして使用する」

 にチェックがついていること

 

を確認し[OK]

 

 

こんな感じの表が出来上がります。

 

これでも使えますが、

実務で使う事を想定すると

見栄え(=見やすく)はとても大事です。

 

作業効率アップ、ミスの軽減

に繋がります。

 

5-1.テーブル-デザイン変更

 

最初に作成されるテーブルはテーブル書式が

設定されていますので、

条件付き書式とかぶさってしまい

データが見づらくなってしまいます。

 

テーブル書式を解除しましょう。

 

<操作>

アクティブセルを表の中に置いて

[テーブルデザイン]▼をクリックし、

「淡色」グループの「なし」を選択します。

 

 

かなり見やすくなりましたね。

 

5-2.テーブル-色フィルタ

 

フィルタ機能を使って、

塗りつぶしされていないデータだけを

表示します。

 

<操作>

アクティブセルを表の中に置いて

「重さ(g)」▼をクリックし、

「色フィルタ」にマウスを合わせ

[塗りつぶしなし]をクリック

 

 

このくらいのデータ量であれば、

目視でも十分ですが

今回取り上げているのは

「大量のデータ」です。

 

数えることもExcelに任せましょう!

 

5-3.テーブル-集計行

 

<操作1>

アクティブセルを表の中に置いて

「テーブルスタイルオプション」グループの

[□集計行]をクリックしてチェックを付ける

 

集計行が追加されましたが、

集計の既定は「合計」です。

ここでは数を数えたいので変更します。

 

<操作2>

「B12」(集計値に当たる274のセル)をクリック後、

▼をクリックして「数値の個数」をクリック

 

どんなにデータ数が多くても一瞬で、

個数を求めてくれますので、

ぜひ使ってみてください。

 

これで、実務に即した「大量データ」は

終了です。

 

以降はまた試験対策に戻ります。

 

6.外れ値の検出-散布図

 

散布図は

「相関関係」「データの散らばり具合」

表現するグラフですが、

このグラフは「外れ値」も見つけやすくします。

 

まずは散布図の特徴、

作成する上での注意点を

見ていきましょう。

 

•散布図は縦軸(Y軸)、横軸(X軸)ともに

変数使うことができます。

 例:体重と身長、気温と売上など

 

•勿論、一方だけでも使えます。
 例:番号(定数)とテストの合計点、

   月と気温など

 

•必ず2列を対象に範囲選択します。

 

•グラフを作成する際の、

表の1行目に当たる項目行は、

範囲に入れても入れなくても

支障はありません。

 

•表データが長い範囲選択は

[Ctrl]+[Shift]+[↓]が効率的です。

 

7-1.散布図の作成

 

先ほどのミカンのデータを元に

散布図を作ってみましょう!

 

1.表全体に当たる「番号~84」まで範囲選択

2.[挿入]タブ-「グラフ」グループ[散布図]

 

 

7-2.散布図の作成

 

上記スライドの散布図で良い場合もあるでしょうが、

さらにデータを見やすくするために、

数値軸のメモリを調整する

という場合もあります。


それによりデータがより強調され、

外れ値の範囲も確認しやすくなります。

 

<操作>

「数値軸で右クリック」-[軸の書式設定]
 ※最小値:75 最大値:115 の場合

 

 

 

上と下の直線の間から外にあるデータは

外れ値の領域というのが見た目で確認できます。

 

8.近似曲線

 

・近似曲線とは

散布図だけだと点の流れが分かりづらい場合に

滑らかに表すための曲線で、

流れを曲線で表すことで、

傾向をつかみやすくします。

 

また予測を立てることもできる曲線です。


もっと深く入るとさらに詳細な分析結果を

得ることができるわけですが、

今回は近似曲線というものの

試験に必要な操作法と役割を

確認していきます。

 

・試験では散布図を作成して

「外れ値」を探し出し、プラスして

「近似曲線を追加する」という指示が

出ている場合がありますので、

近似曲線も作れるようにしておきましょう!

(操作はとっても簡単です。)

 

・試験で使う近似曲線の種類は

「線形近似」を選んでおけば問題ありません。

 

<操作方法>

いずれかの散布図の点上で

右クリック-[近似曲線の追加]

 

 

近似曲線が追加されると

画面右側に「近似曲線の書式設定」

作業ウィンドウが表示されますので、

「線形近似」が選ばれていることを

確認しましょう。

 

この近似曲線から明らかに離れている点

が外れ値となる可能性が高いわけですね。

 

9.折れ線グラフを使う

 

「外れ値」の検出は「折れ線グラフ」を使っても

表すことができます。


先ほどから使っているデータを元に

折れ線グラフを作ってみましょう!


※作り方は散布図の時と

   ほぼ変わりませんので

  操作は割愛します。

 

 

初めから「マーカー付き折れ線」を

作成した場合は次の操作は

必要ありません。

 

凡例は線自体が一本なので

無くても支障なしです。

 

<操作>

・[グラフのデザイン]タブ-[グラフの種類の変更]-

  [折れ線]-[マーカー付き折れ線]

 

・[グラフのデザイン]タブ-[グラフの要素の変更]-

  [凡例]-[下]

 

 

10.最大値と最小値を表現

 

先ほどの散布図では上限と下限を表す

最大値と最小値の線を図形で描きましたが、

折れ線グラフの場合は、表にデータを入力して、

直線を表現できます。

 

 

<操作>

①表に「最小値」と「最大値」のデータを追加入力

②グラフの範囲を広げる

 ※グラフが選択されている状態で

  表の右下にが表示されるので、

  ドラッグして範囲を広げる!

ここではグラフが見やすいように

直線の見た目を変更しています。

試験では必要ありませんので、

参考までに操作の確認をしておきます。

 

<操作-線の幅(太さ)

①直線上で右クリック-[データ系列の書式設定]

②[塗りつぶしと線]アイコン選択-「線」タブ

  「幅:0.75」

 

<操作-マーカー

①直線上で右クリック-[データ系列の書式設定]

②[塗りつぶしと線]アイコン選択-「マーカー」タブ

  「マーカーのオプション」をクリック

③「なし」

 

11.まとめ

 

•平均は「外れ値」の影響を受ける

 

•「外れ値」は必要のないデータ!ということではない

 

•外れ値の検出法

 •並べ替え

 •条件付き書式

 •散布図(+近似曲線)

 •折れ線グラフ

 

•上記の操作がスムーズにできるようにする

 

以上で第3回を終了します。

 

いつも見づらい画像がありすみません。

 

そしてやはり今回も

長くなってしまいました(*_*;

 

最後までご覧いただき

ありがとうございました音譜

 

「出題範囲」の赤い字は、今回の【第2回】で

取り上げている内容になります。

 

出題範囲

1.平均 6.外れ値の検出 11.集計
2.中央値 7.度数分布表 12.散布図
3.最頻値 8.標準化 13.相関分析
4.レンジ 9.移動平均 14.回帰分析
5.標準偏差 10.季節調整 15.最適値

 

結構長いので、適当に読み飛ばして

必要な個所を見てください!

 

では始めていきます。

 

1.標準偏差とは

一言でいうと「分散をルートで表したもの」

   標準偏差=分散の式

式にすると上記のようになりますが、逆に

   分散=標準偏差の式

と表すこともできますね。

 

ではそもそも、分散って何でしょうか・・・

 

2.分散と偏差を知る-偏差編

 

標準偏差を知るには分散を、

分散を知るには偏差を知っておきたいところ。

 

・・・という事で偏差から確認をしていきます。

 

偏差:1つの値と平均との差

式 :1つの値-平均

 

  偏差とはあるデータと平均との差

  という事になります。

 

<例>

A君の点数が60点、平均が70点だとすると、

偏差は -10 ということですね。

 

偏差は全体的に見た統計ではなく、

個人としてどうなのか、

もしくは1つのものとしてどうなのかを

平均との差を求めることで数値化します。

 

3.分散と偏差を知る-分散編

 

分散は複数のデータが平均よりどのくらい離れているか

知るために数値化する事で、

それにより平均では読み取れないデータの

ばらつきを知る指標となります。

 

ただレンジほど単純ではありませんね。

 

レンジもデータのばらつきを知る指標ですが、

違いは、標準偏差は平均をベースに考えられている

ということでしょうか。

 

データを比較する場合、平均というものが

一般的によく使われますが、

平均だけを見てその傾向を判断して良いのか・・・

を知るために分散や標準偏差を

求めることになります。

 

平均だけ分かっておけば良いでしょう!

という場合も実際はありますからね。

 

では、こんな例の場合はどうでしょうか。

 

<例>

転職を考える男性の画像皆さんは就活をしているとします転職を考える女性の画像

 

A社とB社の平均月収を比較したと

想定してください。

A社は25万、B社は平均27万、とします。

仕事内容はほぼ変わりません。

 

決心した男性の画像悩んでいる女性の画像

 

そうなんです。

平均は極端な値に引っ張られてしまう!

という特徴があるのです。

 

この極端な値を「外れ値」と言いますが、

平均は外れ値の影響を受けやすいのです。

 

A社は一般社員から幹部社員まで

お給料の差があまりないのに対し、

B社は極端に一般社員のお給料が安く、

幹部社員がたくさんもらっているかもしれません。

 

そんな状態だとしても平均に差は

あまり見られなくなります。

 

ではそれぞれの社員の月収内訳を

以下とした場合の平均を比較してみましょう!

 

見るからに、B社に差がみられるのが分かります。

 

今回のケースでは平均収入だけで判断せず、

その他の要素もしっかり含めて

どちらの会社が良いのか判断しなければなりません。

 

4.分散

そこで使われるのが分散です。

 

分散は複数データに

ばらつきが大きいのか小さいのか」を

数値で表してくれるものです。

 

今回の例でいえば、社員一人一人のお給料に

差が大きいのか小さいのか・・・という事です。

 

数値が小さければ、ばらつきが少ない!

ことになりますので、

平均を見て判断しても良い会社のようです。

 

5.分散を求める式

分散はそれぞれのデータの偏差を2乗したものを

全て足して人数で割ります。

 

各社員の月収をA~E、

平均を 平均の記号

社員の総数を n とした場合

 

分散の式

という式に各データを当てはめることで

分散を求める事ができます。

 

6.標準偏差

分散が分かったところでやっと標準偏差です。

 

前述した通り分散と標準偏差は

=でつなぐことができるので、分散が分かれば

標準偏差はすぐ理解できます。

 

こんな式でしたね。

 

じゃあ分散で良いのでは・・・

 

そうですね。

なぜわざわざ標準偏差に

しなければいけないのでしょうか。

 

そもそも偏差を足していっても良いのでは・・・

 

という疑問もあるかもしれません。

 

もしそれぞれの偏差を足して人数で割る!

という式になった場合、

答えは0 になってしまいます。

 

では実際に確認してみましょう!

 

偏差から標準偏差を求めたら・・・

 

先ほどの例で挙げた

A社データをそのまま代入してみましょう!

 

社員の月収の表

このように結果は 0 になってしまいます。

 

B社でも同じ結果なので試してみてください!

 

偏差ではマイナスやプラスの値を

同時に扱うので、結果、答えは0

になってしまうことが分かりました。

 

これを解消したのが、2乗した分散です!

2乗するという事はマイナスがなくなる

という事です!

 

分散の式プラス代入

 

分散では2乗した値が使われますので、

単位が偏差や平均と異なります

そこで分散にルートを使って、単位を同じにします。

 

この単位を同じにしたものが標準偏差です。

 

先ほど算出した値は分散   17.6

標準偏差に直すと      

ルートを外して計算し直すと 4.195…

 

7.Excelを使えば計算が楽!

考え方が理解できたら、結果を求めるには

Excel関数を使うのが楽です。

 

  STDEV.P ⇒ 標準偏差

    (エスティーデブピー) 

  VAR.P ⇒ 分散

   (バーピー) 

 

ちなみにSTDEV.PとVAR.P・・・

どちらとも P が後ろについていますが、

STDEV.S、VAR.Sという

S がついているものもあります。

 

Pは母集団(すべてのデータ)、

Sは標本(データの一部⇒サンプル)

 

を対象に計算することを意味しますが、

ここでは詳しい内容を省いて、

Pを使って求めます。

 

ビジネス統計スペシャリストでは

Pを使う事が多いです。

 

計算に使う元データが

母集団なのかサンプルなのかが

はっきりしている場合は使い分けてください。

 

では先ほどから扱っている

表データを使って標準偏差と分散を

求めていきましょう!

 

今回は縦計として算出します。

 

 

セルに入力する式を赤枠で示しています。

標準偏差と分散の式

 

A社の標準偏差 =STDEV.P(B2:B6)

A社の分散    =VAR.P(B2:B6)

 

B社の標準偏差 =STDEV.P(C2:C6)

B社の分散    =VAR.P(C2:C6)

 

答えは以下の通りです。

標準偏差と分散の答え

 

上の表のようにそれぞれのセルに

式を入力すると、

下の表のような答えになるはずです。

 

また4つのセルは小数点以下2桁で四捨五入し、

小数点以下1桁まで表示しています。

 

8.考察の結果

A社は標準偏差4.2、B社は20.9となっており、

A社の方がばらつきが少ないのに対し、

B社は相当ばらつきが大きいことが分かります。

 

という事は、A社の方が5人の月給の差は

B社に比べて少ない!という事になります。

 

B社は相当個人の月収に差があるので

要注意! ですね。

 

9.SQRT関数

ちなみにSTDEV.Pを使って

標準偏差を求めるのであれば、

分散は算出する必要はありません。

 

 =STDEV.P(範囲) とすれば良いわけです。

 

・・・が分散の値が算出されていれば、

そこからルートに直して標準偏差を求める

こともできるわけです。

 

 =SQRT(範囲)

  ※範囲は分散が入力されているセルをクリック

 

このようにSTDEV.Pを使わずに

標準偏差を求める事もできます!

 

では、SQRTを使って求めた式を確認します。

結果

SQRT関数は値をルート(平方根)に直す関数

ですから、これも覚えておくと使える場面がありますね。

 

10.基本統計量について

今回の例のようにA社の標準偏差だけを求める

とうことであればExcel関数を使えば良いのですが、

 

例えばその他の

 平均・中央値・最頻値・レンジ(範囲)・標準偏差

といったデータを分析する上で良く用いられる

基本データを一気に知りたい場合

Excelのアドインである

[データ分析][基本統計量]を使うのが便利です。

 

この「基本統計量」の機能は

アドインになっていますので、

自分で追加しないと画面には出てきません。

 

そこで確認したいのが、 

使える状態になっているかどうかです。

 

[データ]タブをクリック

リボンの一番右端の[分析]グループに

[データ分析]があるかです。

 

見えていればそのまま使えますが、

見えていない場合の操作確認をしておきます!

 ※公式テキストにも書かれています!

 

①[ファイル]-[オプション]-[アドイン]をクリック

 

②画面下にある管理:にExcelアドインを

 表示した状態で[設定]をクリック

 

③「分析ツール」にチェック

 「ソルバーアドイン」も

 ここでチェックを 付けると後の操作が

 スムーズになります。

 

11.まとめ

 

•偏差、分散、標準偏差の関係と特徴を抑える

 

•平均は外れ値(極端に小さい値や大きい値)の

影響を受けるので、平均と標準偏差を求める事で、

データの本質に近づく

 

•分散は標準偏差の2乗であり、

標準偏差は分散をルートに直した式

 

•Excel関数で標準偏差はSTDEV.P、

分散はVAR.P

 

•複数の項目を一気に分析したい場合は

「基本統計量」を使うと便利

 

 

以上で第2回を終了します。

 

私はブログ原稿をパワポで作っており、

そこで作成した画像を貼り付けた部分が

あるので、かなり荒い画像で

見づらくなっている箇所がありすみません。

 

そして前回にもまして

長くなってしまいました(*_*;

 

最後までご覧いただき

ありがとうございました音譜

 

ここでは

ビジネス統計スペシャリスト-Excel分析ベーシック」

の資格取得を目指す方に、抑えておきたい箇所に

重点を置いて解説しています。

 

比較的理解しやすい

「平均・中央値・最頻値」

に関しては触れていませんので、

公式テキストなどを参考に学習を進めていただいた上で、

プラスの参考資料として活用していただくことを

目的としています。

 

「出題範囲」の赤い字は、今回の【第1回】で

取り上げている内容になります。

 

出題範囲

1.平均 6.外れ値の検出 11.集計
2.中央値 7.度数分布表 12.散布図
3.最頻値 8.標準化 13.相関分析
4.レンジ 9.移動平均 14.回帰分析
5.標準偏差 10.季節調整 15.最適値

 

結構長いので、適当に読み飛ばして

必要な個所を見てください!

 

では始めていきます。

 

1.レンジって何・・・

英語で表すと「Range」

これを日本語で訳すと「範囲=(幅)

という意味になります。

 

統計学でも同じような意味に使われますが、

ではどんな役割があるのか・・・

 

分散、標準偏差といった言葉を聞いたことはあるでしょうか。

どちらも「データの散らばり具合(ばらつきの度合い)」

知りたいときに使われる手法ですが、

レンジもこの2つと同じ役割であると思ってください。

 

では、具体例を用いて

もう少し分かりやすくしていきたいと思います。

 

<例>

Aクラス15人とBクラス13人の男子生徒の身長で、

身長の差が少ないのはどちらのクラスかを調べたい。

なおそれぞれのクラスの身長の最大値と最小値は

以下の通りである。

 

  Aクラス Bクラス
最大値 177 173
最小値 163 165

 

まず考え方から見ていきましょう!

 

レンジの画像表現

※画像関係はパワポで作った資料を使っているので、

       字がぼやけて見づらいかもしれません。スミマセン・・・

 

上記の画像を見るとオレンジのラインの中に

それぞれのクラス全員が収まっていることが分かります。

・・・ということは

Bクラスの方が幅が小さいので、ばらつきも少ない!

という結果になります。

 

茶色の箇所には計算式を入れて、

数字で比較をしているのですが、

Aクラスは14、Bクラスは8の幅になりますから、

数字で結果を表すと、

漠然とBクラスの方がばらつきが少ないと言う事ではなく、

どのくらい1とBにばらつきの差があるかを

はっきりとした数字で算出することができます。

 

では 「求め方」 の確認をしておきます。

 

  レンジ=最大値-最小値

 

少しここで「人に伝える」という場合の方法について

お話をしておきます。

 

結果を人に伝える方法として大きく2つが考えられます。

 一つ目は視覚的に伝える

 二つ目は数字で伝える

 

一つ目の視覚的に伝えるということの良さは

何といっても目で見て傾向をつかみやすくなる!

ことです。一目瞭然!という感じですね。

材料としては、グラフや図などが多いでしょうか。

 

このブログでもレンジをオレンジのバーで示して、

結果を視覚的に表しています。

 

そして二つ目の数字で伝える!というのは

その差をより明確にかつ具体的にできる!

という点です。計算あるのみですね。

 

それぞれの特徴を踏まえて、シーンに応じて

使い分けてくださいね。

 

また、これはレンジだけに言えることではなく、

「人に伝える」というシーンにおいて!

どの場合でもこの考えです。

自分で何か資料を作るときに思い出してください。

 

・・・とここまではそんなに悩まなくても

理解できると思いますが・・・

 

では、レンジと最大値が分かっていて

「最小値を求めたい」

というパターンだったらどうでしょうか。

 

逆にレンジと最小値が分かっていて

「最大値を求めたい」

ということもあります。

 

少し時間をかければわかるでしょうが、

「試験」においては、時間をかけたくない問題

一つです。

 

式として覚えるか、図形で覚えるかのどちらかが良いでしょう。

 

※またまたパワポ画像です(*_*;

 

式は覚えるように、図は思い浮かべられるように

なれば良いと思います。

 

図の方は少し分かりづらいかもしれませんので、

補足しておきます。

 

例えば最大値を求めたい!という場合、

円の中の求めたい最大値を無いものとします。

残った2つ、ここではレンジと最小値ですね。

この2つの関係性を円の図形で思い出してください。

レンジ+最小値

というのが頭に浮かんでくればOK!です。

 

 

今回は平均を取り上げていないのですが、

平均でも同じような考え方ができ、また出題される

可能性もありますので式と図を入れておきますね。

 

 

 

以上を踏まえて、レンジに関する問題を

Excelで解いてみましょう!

 

男子生徒の身長で考えてみますが、

今回はAクラス5人、Bクラス7人とします。

以下の表データを参考にレンジを求めたい!

 

そのためには最大値、最小値ともに先に

求めておきます。

 最大値⇒MAX関数

 最小値⇒MIN関数

 レンジ⇒最大値-最小値

 

最初に最大値と最小値を求めますが

MAX関数とMIN関数は

Excelの[ホーム]タブ-[編集]グループにある

Σの▼ボタンを使いましょう!

 

①答えが欲しいセルをアクティブセルにして、

  Σの▼をクリックし最大値をクリック

 

②対象となる数値をドラッグで範囲選択

 

③[Enter]で確定

 

④同様にして「最小値」も求めます。

 

⑤最後にアクティブセルをレンジの答えを求めたいセルに置き

  上記で出た答えを使ってレンジを求めます。

 

 「最大値が入力されているセル」-「最小値が入力されているセル」

 

以下が計算した答えです!

 

 

では最小値を求める場合はどうでしょう!

最大値とレンジは分かっていて、最小値を求めるという場合です。

黒の塗りつぶしが最小値になります。

 

最小値=最大値-レンジ

でしたね。

 

以下が計算した答えです。

 

最後は最大値を求めたい!です

最大値=最小値+レンジ

でしたね。

 

以下が計算した答えです。

 

試験では文章問題でも操作問題でも色々な方向から

出題されますので、ぜひ参考にしてください。

 

では今回のまとめです!

 

試験では「レンジを求める」だけではなく
  最大値を求めなさい
  最小値を求めなさい
といった設問がある!

 

同様に平均でもこのような出題はされる可能性がある!

 

意味や役割を理解して解かないと、
試験は合格できても実務では苦しむことになる!

 

以上、レンジにしては長くなってしまいましたが、

今回はこれで終了です!

 

ありがとうございました音譜

 

昨日「ビジネス統計スペシャリスト-Excel分析ベーシック」

受験してきまして合格しましたので、

私が受験してみて、感じたことを書いていきます。

これから勉強を始める方やこれから受験される方の

参考になれば嬉しく思います。

 

この資格は

「Excelスキル」+「統計知識」を証明できる資格

になりますので、MOSなどを既に取得している方や

Excelは使えてさらに上位資格を目指したい!

と思っている方にはとてもお勧めしたい資格の一つです。

 

今回のブログでは私が実際に受験した上で感じたことや注意点、

試験概要や自分が使った教材についてお話をしていきます。

 

 

   <目 次>

 

1.感じたこと、注意点

 ①Excelを操作させる問題が多い

 ②時間が足りない

 ③時間配分に気を付けて

 ④Excelの操作画面は自動表示

 ⑤出題順はランダム

 ⑥制限時間に余裕はない

 ⑦問題は最後まで見れるように

 

2.試験概要

 

3.教材について

 

 

1.感じたこと、注意点

①Excelを操作させる問題が思ったより多い

 出題のされ方としては

  ・文章問題による選択

   (4つの選択肢が多いがたまに5つの選択肢も)

  ・Excel操作による選択

   (Excelで操作した結果を選択肢から選ぶ問題と

    操作で出た答えを直接数字で記入する問題がある)

 

Excelを操作させる問題が多い!

ということはExcelに精通していないと

解くのが難しいし時間もかかります。

 

この問題ではどの機能を使う!

ということを早めに判断できるようにしましょう。

 

早めに判断した上で、

スムーズなExcel操作ができること!

が必要です。

 

知っておくべき機能としては

MOS-Excelスペシャリストレベルは必須です。

 

文章による選択問題と比較すると

7割くらいはExcelを使わせる問題

のような気がしました。

 

そして些細なことですが、

小数点以下何桁まで表示させるのか・・・ 

ここは絶対に間違えないでください。

 

答えが出ているのにちょっとしたミスで

×になってしまうのは絶対に避けなければいけません。

試験では1点でも合格点に満たなければ落ちてしまいます。

 

凡ミスは絶対にしない!ようにしてください。

 

②時間が足りない

思ったより全然時間が足りません。

 

私自身はMOS-ExcelのExpertまで持っているので

(自慢ではなく判断基準としてです)

操作には問題ないと思いますし、インストラクターという職種柄

Excel機能も把握しているのですが、

それでも時間が足りないと感じました。

(統計学の知識と国語力に問題があったかもです)

 

ですから、時間配分を十分考えて問題を解いてください。

 

③時間配分に気を付けて

上記でお話しした通り、時間はあっという間に過ぎてしまいます。

 

画面左下にタイマーが表示され残り時間を示しますから、

頻繁でなくていいので、ある程度のところで

残り時間と自分が今何問目を解いているかを確認してください。

 

そういう意味では文章による選択問題は

操作問題に比べて時間はかからないので、

そこで迷わずに解いていきたいところですが、

結構選択肢に困るような問題が出てきます。

選択問題を侮ってはダメです。

 

ここで時間をとらないためにも

統計で使われる用語、役割について

しっかり理解し、把握しておくことが重要です。

 

Excelの操作問題で大事なのは

この問題ではどの機能を使って求めるのか!

ということです。

またその機能は絶対これでなければ解けない!

というものもありますし、別の方法でも解ける!

という場合も多々あります。

 

普段からこのパターンだったら、この機能を使う!

という自分なりの決め事があると良いでしょう。

ただ、それが上手くはまらなかったときは、

別の方法で操作することも必要になりますので、

操作結果は同じだけれど操作方法は違うという

柔軟性を持っておくとさらに楽になると思いました。

 

やはり引き出しは多い方が有利です。

 

④Excelの操作画面は自動表示

自分で学習している時は

「Excelを起動して⇒対象ファイルを開いて」

という形で進めていきますが、

 

本試験はExcel画面が問題と同時に自動表示

 

されますので、その点では時間のロスが少なくなると思います。

 

⑤出題順はランダム

学習中の方は

テキストや模擬試験をやられているかと思いますが、

テキストや模擬試験は出題範囲の順番で解くことになります。

 

ですが、

本試験はどのカテゴリが最初に出題されるか分かりません

 

まあ、当然ではありますが、

テキストや模擬試験に慣れていると

思いのほかペースが狂ってしまいます。

 

私の場合は難しい問題が最初に来てしまい少し焦りました。

 

⑥制限時間に余裕はない

時間配分にも関連してきますが、

時間は足りない!と思ってください。

 

そのために必要なのは

問題を読み解く力、統計の知識力、Excel操作力

この3点に限ります。

 

やはりどんな試験でも共通して言えるのは、

国語力は大事!ということですね。

 

⑦問題文は最後まで見れるように

試験を受けるときの鉄板でもありますが、

全部の問題に目を通す!というのはとても重要です。

 

解ける問題がどこで出題されるかわからないので、

解ける問題に手を付けられないで終わる事は

避けなければなりません。

 

・・・かといって時間がかかりそうだということでバンバン問題を

飛ばしていっては必ず時間が足りなくなります。

 

基本的には1問目から順番に解いて、

2,3問程度なら飛ばして後で見直すのが良いでしょう。

 

画面右上に「後で見直す」・・・(確かこんな名前だったと思います)

というチェックボックスがありますので、そこにチェックを入れて

最後の余った時間で確認してください。

 

くれぐれも飛ばし過ぎないように注意してください!

 

 

2.試験概要

試験形式 CBT方式
文章問題:4つの選択肢から1つを選択
       (たまに5つの選択肢もあり)
操作問題:4つの選択肢から1つを選択と
       Excelの操作で得た数字の答えを記入
試験時間 60分
出題数 約37問
合格基準 700点以上(1000点満点)
受験料 一般価格:6,600円 割引価格:4,400円
※割引対象者
 ①MOS、IC3、VBAエキスパート、
   コンタクトセンター検定試験、
   ビジネス統計スペシャリスト
      以上の資格を1つでも取得している場合
  ②学生の場合

 

 

3.教材について

私もそうでしたが、受験される方は

オデッセイコミュニケーションズから出版されている

 ・Excelで学ぶビジネスデータ分析の基礎

  (税込1,650円)

 ・ビジネス統計スペシャリスト Excel分析ベーシック模擬テスト

  (税込1,650円)

この2冊を使うパターンがほとんどだと思います。

 

模擬テストの方は紙ベースではなくWeb上で問題を解く方式です。

 

テキストを2,3回理解しながら読んで、

模擬試験を全問正解するまで確認をする!

 

これでほぼ合格はできるでしょう。

 

・・・が中途半端な知識ではそれでも時間が足りない!

といったことが出てきます。

 

焦りは本来の力を失わせます!

そして不要な緊張を呼んでしまいます。

 

今後私のブログでは出題範囲の中からこれは理解が難しい!

と思われる統計学を取り上げつつ、

Excelの操作方法も併せて解説していきたいと思っていますので、

興味のある方はまた覗いてみてください。

 

明日中には【第1回】を投稿できるようにしたいと思っています。

 

最後まで閲覧いただきありがとうございました!!

 

またまた久々の投稿となっておりますが、

ここ何年か別分野での仕事の機会を頂きまして、

知識の無さからとてもバタバタしておりました。

 

その分野というのは「統計学」なのですが、

統計学を用いたデータ分析の考え方、手法などを

行っておりました。

この「統計学を用いた」というところが何とも別分野に

なるわけですが・・・

 

自分の知識の無さを痛感しまして、

 ・知識を深めたい(立場的に必須)

 ・「統計学」は結構面白い

 ・Excelでできることをもっと知りたい

という考えに至りました。

 

YouTubeで「統計学」を色々調べていると、

「オデッセイコミュニケーションズ」で

「ビジネス統計スペシャリスト」という資格試験を

実施しているのが分かりまして、これは・・・

という事で、今に至っております。

 

私は知識を得るために資格を利用する!という習性がありまして、

もともとルーズな人間!という事なのでしょうが、

追い込んで自分にプレッシャーをかけないと、

どうも甘えが出てしまうようです。

 

明後日、試験になりますが、もし合格したら、

自分の中で消化した「合格のために必要な知識」

ブログに書き込んで行こうと思っていますので、

これから資格取得を目指す方の参考になればと思っています。

 



私、ずっとこの動画のアップを

忘れていました。

 

去年の10月、『清塚信也』の
コンサートに行ったのです。

動画撮影が、中途半端になっていて

とっても残念なのですが…

私この時、何をやっていたのかな。

もっとしっかり撮ればよかったと

後悔です。

 
埼玉県の鴻巣市で
行われたんですけど、
とにかくその技術の凄さに
感動していました。
 
そして曲と曲の間に入るお話!
これもまた面白かったし、
驚いたのが、
ピアノの弾き始めに『溜め』
というのが全くなく、
すぐに弾き始めるんですよ。
 
弾き始めこそあっさりで
ビックリなのですが、
やっぱり流石!でした。
 
清塚さん本人からも、
聴きに行ったみなさんに、
動画アップokのお許しが
出ていました。
 
 
 
 

本当にとっても忙しい日々でした・・・4月の初めまでは・・・・

 

コロナ感染症が広がりを見せた4月初め!

ついに学校は休講になり、

最初のうちは、「こんなに家にいたのは出産以来かな・・・」

なんて、呑気に考えていたけれど、それでもやっぱり、

結構パソコンに向かっていました。

それと同じくらいやっていたのが

 AmazonプライムVideo!

見ていましたね。

 

まず、最初にはまったのが「のだめカンタービレ」

何回見たのかなぁ・・・ってくらい最初から最後まで

通して見てまして、やっぱり音楽っていいよねぇ・・・と浸っていました。

それに、オーケストラがこんなに魅力的だとも恥ずかしながら、今までは思っていなくて…

色々な発見があって、本当に面白かったです。

 

次にはまりまくったのが、「京極 真」。

今でもはまり中!です。

コナンは見ていたのだけれど、京極さんはあまり意識していなかったのですよ。ストーリー全体がコナンは面白くて見ていたのだけれど、『紺青の拳』を見てからというもの、かなりヤバイです!

人柄が好きすぎて、とにかく京極さんが出ている

回を探しまくって、全て見てしまいました。

どうやったら、ああいう人格が作られるのか。

 

こんなことをしていたので、自粛もさほど苦ではなく…

とは言ってもビデオばかり見ていたわけではないのですよ。

 

やっぱり、これだけ時間があると色々やれますね!

(ブログもたくさん書けば良かったです…後悔) 


そして1ヵ月くらいたった、今日、

それこそ何か月ぶり?何年ぶりかで楽譜の打ち込みを練習がてら、やってみました。

こういう操作もやっていないと本当に忘れてしまいますね。

 

ブログの書き方も忘れてしまっていて怖いです!

 

打ち込み練習の題材はカノンのJAZZバージョンなのですが、

せっかく作ったので、どこかで鳴らしてみたい!と思い、

実はブログを開けてみたのですが、

音楽の入れ方が分からなかったので、HP上で鳴らしてみることにします。

https://pasohiro.jp

うまくいくかな・・・にやり良かったら、覗いて見て下さいね。

 

Windows10 上のAccess2013の環境で!

●テーブルを作成し、主キーを設定しようと思ったら、グレーアウトで主キーボタン使えず…

但し、右クリックからの主キー設定はできました。

●そして、テーブル保存をするも、ナビゲーションにテーブル名が表示されないはてなマークはてなマークはてなマーク

一度Accessを閉じて、開き直すと、表示されるのですが、保存のたびに開き直すのは面倒!

最終的に、Officeを修復する事で両方とも解決しました!