日々の記録簿

日々のできごとの記録

PISA

SPSSとSASでsample weightsの扱いが違う

投稿日:

PISA Data Analysis Manual を読んでいたら興味深い記述がありました。

However, even with an equi-probabilistic sample, statistical software packages might return different results for weighted and unweighted data. Unlike SPSS ® , SAS ® proposes four options for dividing the weighted sum of square, i.e. (i) the number of valid observations; (ii) the number of valid observations minus 1; (iii) the sum of the weights for the valid observations; and (iv) the sum of the weights for the valid observations minus 1. By default, SAS ® divides the weighted sum of square by (n –1) while SPSS ® divides it by the sum of the weight minus 1.

OECD, 2009, PISA Data Analysis Manual SPSS 2nd edition, p.50

要はSPSSとSASで、weightsを設定した場合の標準偏差のデフォルトが違うということです。計算方法も4パターンある模様。Table 3.1と3.2に例があるので、Rで検算してみると確かに違う・・・。けっこう違う値を返すので怖いですね。勉強になりました。ソースコードはgithubに載せておきます。

スポンサーリンク

スポンサーリンク

-PISA

執筆者:


comment

メールアドレスが公開されることはありません。 が付いている欄は必須項目です

関連記事

PISA2015の分析方法とintsvyの使い方

Rのintsvy packageを使ってPISA2015を分析する方法です。 データの準備 まず、OECDのホームページからPISA2015のデータをダウンロードする。PISA2015からSPSSのデ …

PISAの分析方法(お知らせ)

PISAデータの分析方法に関する資料を、githubにまとめることにしました。ぼちぼち追記していきますので、興味のある方はどうぞ。

RによるPISA Data Analysis Manualの再現(第10章: 学校の変数を扱う)

第7章(標準誤差の推定)、第8章(PVs)、第9章(習熟度)に引き続き、PISA Data Analysis Manual SPSS 2nd Editionの分析を、Rで再現してみます。 今回は、学校 …

RによるPISA Data Analysis Manualの再現(第8章: PVsを使う)

前回に引き続き、PISA Data Analysis Manual SPSS 2nd Editionの分析を、Rで再現してみます。 今回は、PVs(Plausible Values: 推算値法)に関わ …

RによるPISA Data Analysis Manualの再現(第9章: Proficiency Levels/習熟度の計算)

第7章(標準誤差の推定)、第8章(PVs)に引き続き、PISA Data Analysis Manual SPSS 2nd Editionの分析を、Rで再現してみます。 今回は、習熟度(Profici …