日々の記録簿

日々のできごとの記録

日記

棒グラフとヒストグラムの違い

投稿日:

棒グラフとヒストグラムの違いがわからないというコメントを受けることが多いので、どう説明したものかと思っていたのですが、次のような図を書いたら、理解してくれる人が多いような気がしたのでご紹介。

まずデータは、こちら。「何じゃそのデータは!?」というツッコミは無しで。説明のためにテキトーに作ったデータですから。

収入 度数
0-20万 100人
21-50万 100人
51-100万 100人
101-200万 100人
201-400万 100人
401-1000万 100人

まず、棒グラフを描いてみます。

graph2

見てのとおり、棒と棒のあいだが空いています。データは変ですが、グラフを読み取ることは可能です。

さて、これをヒストグラムにしてみます。

ヒストグラムには各階級の間に隙間はない。(『数学嫌いのための社会統計学』p.40)

とのことなので、棒と棒のあいだをひっつけてみましょうか。

graph3

はい、オカシイですね。

何がおかしいかというと、ヒストグラムは棒グラフと違って、それぞれの柱の「面積」が量を表すようになっています。

ヒストグラムは「面積」で度数を比較するものなので、「柱の太さ×高さ」が度数に対応していなければならない。例えば、幅が20万円の柱は、幅が100万円の柱の5分の1しか太さがないので、同じ度数でも柱の高さは5倍なければならない。(『調査データ分析の基礎』p.71)

というわけで、仮に「0−20万(幅20)で100人」の高さを1にするなら、「21−50(幅30)で100人」の高さは20/30=2/3にしなければなりません。さっきの表に、幅を加えて、ヒストグラムの高さを示す列も足すと、こうなります。

収入 度数 ヒストグラムの高さ
0-20万(幅20) 100人 1
21-50万(幅30) 100人 2/3
51-100万(幅50) 100人 2/5
101-200万(幅100) 100人 1/5
201-400万(幅200) 100人 1/10
401-1000万(幅600) 100人 1/30

グラフはこんな感じ。今度はおかしくないと思いますが、どうでしょうか。

graph1

と、一応書いてみましたが、文字と図だけで説明するのは難しいですね・・・。

こんな説明でも「わかった!」という人がいたら、嬉しいです。

ちなみに、参考文献は次の2冊です。どちらもわかりやすくオススメです。

スポンサーリンク

スポンサーリンク

-日記

執筆者:


comment

メールアドレスが公開されることはありません。 が付いている欄は必須項目です

関連記事

“rstanarm”や”brms”のインストールが、”PKI”がインストールできないために失敗する

タイトルどおり。rstanarmやbrmsをインストールしようと思ったのだが、PKIがインストールできなくて失敗した。 環境はArch Linuxで、Rのバージョンは3.4。 すこし調べてみたところ、 …

surveyでR2値を計算する方法

Rのsurvey packageには通常の回帰分析におけるR2値を計算する関数が存在しないようである。なので計算方法。参考にしたのはこちらのサイト。コードを見るとわかるが、途中でヌルモデルを計算してる …

Rで日本の校区地図を描く

Rで日本の校区地図を描く方法です。 データの準備 国土数値情報 ダウンロードサービスより、校区地図のもとになるデータ(shapeファイル)をダウンロードする。 データは、リンク先ページの、JPGIS2 …

さくらVPSのVNCコンソールの挙動が変(Vimiumが原因)

タイトルで言いたいことは終わっているのですが、chromeプラグインのVimiumを有効化していると、さくらVPSのVNCコンソール(html5)がうまく動きません。vimiumを無効化すると、普通に …

vimtexでuplatexがコンパイルできない(vimtex_compiler_latexmkの設定)

以前からLaTeXの執筆にはvimtexを使っていたのですが、2017年4月頃にアップデートしたらコンパイルできなくなったので原因を探ったときのメモ。 なお、「latexmkでコンパイルはできる」こと …