ヒストグラムは、棒グラフの隙間がないもの……ではありません!
一見、形はそっくりに見えるんですが。
実を言うと、ヒストグラムって、必ずしもこんな棒が並んだ形にする必要はないのです。
こういう曲線のものも、実はヒストグラムと呼びます。
最初のグラフは、階級値の取り方で、たまたま区切られて、棒みたいな形になっているだけです。
ヒストグラムで大事なのは、棒の高さではなく、面積(ブルーで塗ってるとこ)の方です。
では、棒グラフとヒストグラムの違いって、一体何なの??
数字が連続しているか、いないかです。
例えば、身長の分布。
身長の数値というのは、途切れない連続した数値ですね。
その数値を、適当に区切って階級にすれば、ヒストグラムは棒グラフっぽい形になります。
区切り方はあくまでも自分の都合です。
データ取り扱いの都合上、勝手に階級値に区切っているけれど、本来は区切りのない数値なので、棒の間は空けないのが当然なわけです。
なお、こういうのを「連続型の確率変量」と呼びます。
ヒストグラムにできないのは、例えばサイコロの出目をグラフ化した場合。
まぁこの場合は、普通に1/6の確率で均等に出るはずなので、あんまりグラフ化する意味はないですが(苦笑)
これの棒の間をくっつけちゃいけないってことは、分かりますよね?
出目の「1」「2」「3」……は、それぞれ独立したものです。
こういうのを「離散型の確率変量」と言いますが、棒グラフの間をくっつけたらおかしいというのは、感覚的に分かると思います。
というわけで、棒グラフとヒストグラムは似て非なるもの、なのでした。