日々の記録簿

日々のできごとの記録

SPSSの「ケースの重み付け」とは何なのか

投稿日：2022-11-02

前回の続き。だいたい納得したのだが、SPSSの「ケースの重み付け」が一体何をしているのかもう少し調べてみたくなった。「ケースの重み付け」を設定したとき、分散や標準偏差はどうやって計算されているのだろう？

weighted.var <- function(x, w, na.rm = FALSE) {
  if (na.rm) {
    w <- w[!is.na(x)]
    x <- x[!is.na(x)]
  }
  sum(w * (x - weighted.mean(x, w))^2) / (sum(w) - 1)
}
weighted.se <- function(x, w, na.rm = FALSE) {
  if (na.rm) {
    w <- w[!is.na(x)]
    x <- x[!is.na(x)]
  }
  v <- sum(w * (x - weighted.mean(x, w))^2) / (sum(w) - 1)
  sqrt(v) / sqrt(sum(w))
}

d <- data.frame(
  ans = c(1, 2, 2, 3, 3, 4, 4, 1, 2, 3),
  gender = c(rep(1, 7), rep(2, 3)),
  w = c(rep(5 / 7, 7), rep(5 / 3, 3))
)

weighted.mean(d$ans, d$w) # 平均
sqrt(weighted.var(d$ans, d$w)) # 標準偏差
weighted.se(d$ans, d$w) # 標準誤差

というわけでRのコード。例題は前回と同じくこちらのサイトのものを流用。これならウェイトが整数でないにもかかわらず、それっぽい（誤った）数値が算出される。na.rmのオプションも付けたので、欠測があっても大丈夫。もっとも使うことはないだろうが。

執筆者：さくら

comment コメントをキャンセル

関連記事

: systemdを245にアップデートすると、netctlが動かない？

焦ったけど、バグレポートが出ていた上に、末尾に修正方法が書いてあった。 sudo netctl reenable <your-profile-name> を実行すればok。ログを見ると、s …

: kernel 4.2でPT3を使う

kernel 4.2にアップグレードした際に、pt3のlinuxドライバのビルドに失敗しました。とりあえずkernelをダウングレードして凌いでいたのですが、対処方が記載されたサイトがあったので、情 …

: VLC3.0.4-3でTSファイルが再生できない【解決】

タイトルの通りですが、いつの間にかVLC（3.0.4-3）でTSファイルが再生できなくなっていました。OSはArch Linuxです。依存関係でダウングレードもできない模様。ググってみると、【Mpe …

: 棒グラフとヒストグラムの違い

棒グラフとヒストグラムの違いがわからないというコメントを受けることが多いので、どう説明したものかと思っていたのですが、次のような図を書いたら、理解してくれる人が多いような気がしたのでご紹介。まずデー …

: Rを勉強するためにいろいろ寄り道をしていた

Rをもっと勉強したいなと思って、『R言語徹底解説』を買ってみました。・・・が、ちんぷんかんぷん。クラスとか、オブジェクト指向とか、遅延評価とか、さっぱりわかりません。これはいかんと思い、ここ2ヶ月ほ …

PREV: survey package（R）の使い方
NEXT: 大規模調査の分析でSPSSの「ケースの重み付け」を使う場合の留意点

: 2023/08/19

X1 carbon gen 10でxf86-video-intelをインストールするといろいろおかしくなる

: 2023/03/07

surveyで相関係数を計算する

: 2023/03/06

surveyでR2値を計算する方法

: 2022/11/04

大規模調査の分析でSPSSの「ケースの重み付け」を使う場合の留意点

: 2022/11/02

SPSSの「ケースの重み付け」とは何なのか

最近の投稿

カテゴリー