統計学ノート補講・棒グラフとヒストグラム | 診療情報管理士通信教育第85期生@福岡のブログ

診療情報管理士通信教育第85期生@福岡のブログ

2014年7月入講生です。HIM通教生の皆さん、一緒に頑張りましょう!→2017年第10回認定試験合格。DPCコース第9期・腫瘍学分類コース第6期認定。
各記事は受講当時のものです。現在は他の資格にもチャレンジ中(詳細はプロフィールにて)

 ヒストグラムは、棒グラフの隙間がないもの……ではありません!
 一見、形はそっくりに見えるんですが。


 実を言うと、ヒストグラムって、必ずしもこんな棒が並んだ形にする必要はないのです。


 こういう曲線のものも、実はヒストグラムと呼びます。

 最初のグラフは、階級値の取り方で、たまたま区切られて、棒みたいな形になっているだけです。
 ヒストグラムで大事なのは、棒の高さではなく、面積(ブルーで塗ってるとこ)の方です。

 では、棒グラフとヒストグラムの違いって、一体何なの??

 数字が連続しているか、いないかです。

 例えば、身長の分布。
 身長の数値というのは、途切れない連続した数値ですね。
 その数値を、適当に区切って階級にすれば、ヒストグラムは棒グラフっぽい形になります。
 区切り方はあくまでも自分の都合です。
 データ取り扱いの都合上、勝手に階級値に区切っているけれど、本来は区切りのない数値なので、棒の間は空けないのが当然なわけです。
 なお、こういうのを「連続型の確率変量」と呼びます。

 ヒストグラムにできないのは、例えばサイコロの出目をグラフ化した場合。

 まぁこの場合は、普通に1/6の確率で均等に出るはずなので、あんまりグラフ化する意味はないですが(苦笑)
 これの棒の間をくっつけちゃいけないってことは、分かりますよね?
 出目の「1」「2」「3」……は、それぞれ独立したものです。
 こういうのを「離散型の確率変量」と言いますが、棒グラフの間をくっつけたらおかしいというのは、感覚的に分かると思います。

 というわけで、棒グラフとヒストグラムは似て非なるもの、なのでした。