日々の記録簿

日々のできごとの記録

PISA

SPSSとSASでsample weightsの扱いが違う

投稿日:

PISA Data Analysis Manual を読んでいたら興味深い記述がありました。

However, even with an equi-probabilistic sample, statistical software packages might return different results for weighted and unweighted data. Unlike SPSS ® , SAS ® proposes four options for dividing the weighted sum of square, i.e. (i) the number of valid observations; (ii) the number of valid observations minus 1; (iii) the sum of the weights for the valid observations; and (iv) the sum of the weights for the valid observations minus 1. By default, SAS ® divides the weighted sum of square by (n –1) while SPSS ® divides it by the sum of the weight minus 1.

OECD, 2009, PISA Data Analysis Manual SPSS 2nd edition, p.50

要はSPSSとSASで、weightsを設定した場合の標準偏差のデフォルトが違うということです。計算方法も4パターンある模様。Table 3.1と3.2に例があるので、Rで検算してみると確かに違う・・・。けっこう違う値を返すので怖いですね。勉強になりました。ソースコードはgithubに載せておきます。

スポンサーリンク

スポンサーリンク

-PISA

執筆者:


comment

メールアドレスが公開されることはありません。 が付いている欄は必須項目です

関連記事

RによるPISAの分析(データの準備その2)

RによるPISAの分析(データの準備)で公開したpythonコードですが、その後、PISA2000のspsファイルに対応していなかったとか、すべての国のデータをまとめて変換したほうが便利だとか、ファイ …

RによるPISA Data Analysis Manualの再現(第9章: Proficiency Levels/習熟度の計算)

第7章(標準誤差の推定)、第8章(PVs)に引き続き、PISA Data Analysis Manual SPSS 2nd Editionの分析を、Rで再現してみます。 今回は、習熟度(Profici …

PISA2015の分析方法とintsvyの使い方

Rのintsvy packageを使ってPISA2015を分析する方法です。 データの準備 まず、OECDのホームページからPISA2015のデータをダウンロードする。PISA2015からSPSSのデ …

RによるPISAの分析(データの準備)

PISAをRで分析する際に、最初の壁になるのが、データファイルが大きすぎるという点でしょう。 すでに述べたように、PISAのデータは、(1)データが固定長のtxtファイルになっている、(2)参加国すべ …

RによるPISAの分析(PISAデータをCSVに変換する)

PISAデータをcsvに変換する作業が面倒になってきたので、以前紹介していたpythonスクリプトを書き直し、全自動で行えるようにしました。 ここからpisacsv.zipをダウンロードし、展開してく …