棒グラフとヒストグラムの違いがわからないというコメントを受けることが多いので、どう説明したものかと思っていたのですが、次のような図を書いたら、理解してくれる人が多いような気がしたのでご紹介。
まずデータは、こちら。「何じゃそのデータは!?」というツッコミは無しで。説明のためにテキトーに作ったデータですから。
収入 | 度数 |
0-20万 | 100人 |
21-50万 | 100人 |
51-100万 | 100人 |
101-200万 | 100人 |
201-400万 | 100人 |
401-1000万 | 100人 |
まず、棒グラフを描いてみます。
見てのとおり、棒と棒のあいだが空いています。データは変ですが、グラフを読み取ることは可能です。
さて、これをヒストグラムにしてみます。
ヒストグラムには各階級の間に隙間はない。(『数学嫌いのための社会統計学』p.40)
とのことなので、棒と棒のあいだをひっつけてみましょうか。
はい、オカシイですね。
何がおかしいかというと、ヒストグラムは棒グラフと違って、それぞれの柱の「面積」が量を表すようになっています。
ヒストグラムは「面積」で度数を比較するものなので、「柱の太さ×高さ」が度数に対応していなければならない。例えば、幅が20万円の柱は、幅が100万円の柱の5分の1しか太さがないので、同じ度数でも柱の高さは5倍なければならない。(『調査データ分析の基礎』p.71)
というわけで、仮に「0−20万(幅20)で100人」の高さを1にするなら、「21−50(幅30)で100人」の高さは20/30=2/3にしなければなりません。さっきの表に、幅を加えて、ヒストグラムの高さを示す列も足すと、こうなります。
収入 | 度数 | ヒストグラムの高さ |
0-20万(幅20) | 100人 | 1 |
21-50万(幅30) | 100人 | 2/3 |
51-100万(幅50) | 100人 | 2/5 |
101-200万(幅100) | 100人 | 1/5 |
201-400万(幅200) | 100人 | 1/10 |
401-1000万(幅600) | 100人 | 1/30 |
グラフはこんな感じ。今度はおかしくないと思いますが、どうでしょうか。
と、一応書いてみましたが、文字と図だけで説明するのは難しいですね・・・。
こんな説明でも「わかった!」という人がいたら、嬉しいです。
ちなみに、参考文献は次の2冊です。どちらもわかりやすくオススメです。