日々の記録簿

日々のできごとの記録

日記

SPSSの「ケースの重み付け」とは何なのか

投稿日:

前回の続き。だいたい納得したのだが、SPSSの「ケースの重み付け」が一体何をしているのかもう少し調べてみたくなった。「ケースの重み付け」を設定したとき、分散や標準偏差はどうやって計算されているのだろう?

weighted.var <- function(x, w, na.rm = FALSE) {
  if (na.rm) {
    w <- w[!is.na(x)]
    x <- x[!is.na(x)]
  }
  sum(w * (x - weighted.mean(x, w))^2) / (sum(w) - 1)
}
weighted.se <- function(x, w, na.rm = FALSE) {
  if (na.rm) {
    w <- w[!is.na(x)]
    x <- x[!is.na(x)]
  }
  v <- sum(w * (x - weighted.mean(x, w))^2) / (sum(w) - 1)
  sqrt(v) / sqrt(sum(w))
}

d <- data.frame(
  ans = c(1, 2, 2, 3, 3, 4, 4, 1, 2, 3),
  gender = c(rep(1, 7), rep(2, 3)),
  w = c(rep(5 / 7, 7), rep(5 / 3, 3))
)

weighted.mean(d$ans, d$w) # 平均
sqrt(weighted.var(d$ans, d$w)) # 標準偏差
weighted.se(d$ans, d$w) # 標準誤差

というわけでRのコード。例題は前回と同じくこちらのサイトのものを流用。これならウェイトが整数でないにもかかわらず、それっぽい(誤った)数値が算出される。na.rmのオプションも付けたので、欠測があっても大丈夫。もっとも使うことはないだろうが。

スポンサーリンク

スポンサーリンク

-日記

執筆者:


comment

メールアドレスが公開されることはありません。 が付いている欄は必須項目です

関連記事

Thinkpad X1 Carbon 2016 (4th gen)に、Arch Linuxをインストールする方法(その3)

Thinkpad X1 Carbon 2016 (4th gen)でLinuxが起動しないという問題の現状です。 最新のkernel 4.6rc3を試したところ、OneLink+ ドックを繋いだままで …

Lenovoのドッキングステーションは何台のディスプレイに出力できるのか?

Lenovoのドッキングステーションを使って、マルチディスプレイ環境を構築するときに気になるのが、同時に何台のディスプレイに出力できるのかという点。2020年現在の情報は、こちらのLenovoのサイト …

Nvim-Rの導入方法(その2)

vimからRを使う場合、Nvim-Rが便利です。 以前にも紹介しましたが、設定をいくつか間違えていたので修正版です。 インストール まず、neovimをインストールする。このとき、deopleteを使 …

FactoMineRからベンゼクリの修正割合(Benzecri’s modified rates)を計算する

最近、多重対応分析(Multiple Correspondence Analysis)を勉強していた。RではFactoMineRのMCA関数がいい感じである。 ただ、ベンゼクリの修正割合を計算できると …

全国学力・学習状況調査の何が問題なのか(その1)

いい加減、この問題にケリをつけたほうがいいと思うので、論点を整理しておきます。 そもそも全国学力・学習状況調査は何のためにやるのか? 議論を整理するために、もっとも重要な論点は、これである。いったい全 …