日々の記録簿

日々のできごとの記録

PISA

SPSSとSASでsample weightsの扱いが違う

投稿日:

PISA Data Analysis Manual を読んでいたら興味深い記述がありました。

However, even with an equi-probabilistic sample, statistical software packages might return different results for weighted and unweighted data. Unlike SPSS ® , SAS ® proposes four options for dividing the weighted sum of square, i.e. (i) the number of valid observations; (ii) the number of valid observations minus 1; (iii) the sum of the weights for the valid observations; and (iv) the sum of the weights for the valid observations minus 1. By default, SAS ® divides the weighted sum of square by (n –1) while SPSS ® divides it by the sum of the weight minus 1.

OECD, 2009, PISA Data Analysis Manual SPSS 2nd edition, p.50

要はSPSSとSASで、weightsを設定した場合の標準偏差のデフォルトが違うということです。計算方法も4パターンある模様。Table 3.1と3.2に例があるので、Rで検算してみると確かに違う・・・。けっこう違う値を返すので怖いですね。勉強になりました。ソースコードはgithubに載せておきます。

スポンサーリンク

スポンサーリンク

-PISA

執筆者:


comment

メールアドレスが公開されることはありません。 が付いている欄は必須項目です

関連記事

RによるPISAの分析(データの準備)

PISAをRで分析する際に、最初の壁になるのが、データファイルが大きすぎるという点でしょう。 すでに述べたように、PISAのデータは、(1)データが固定長のtxtファイルになっている、(2)参加国すべ …

RによるPISA Data Analysis Manualの再現(第9章: Proficiency Levels/習熟度の計算)

第7章(標準誤差の推定)、第8章(PVs)に引き続き、PISA Data Analysis Manual SPSS 2nd Editionの分析を、Rで再現してみます。 今回は、習熟度(Profici …

RによるPISA Data Analysis Manualの再現(第10章: 学校の変数を扱う)

第7章(標準誤差の推定)、第8章(PVs)、第9章(習熟度)に引き続き、PISA Data Analysis Manual SPSS 2nd Editionの分析を、Rで再現してみます。 今回は、学校 …

RによるPISAの分析(データの準備その2)

RによるPISAの分析(データの準備)で公開したpythonコードですが、その後、PISA2000のspsファイルに対応していなかったとか、すべての国のデータをまとめて変換したほうが便利だとか、ファイ …

RによるPISAの分析(データの準備:続報)

三重大の奥村晴彦氏のホームページにて、RでPISAデータを読み込む方法(PISAデータを読む)が公開されていました。 こちらは、Rubyで読み込んでいるようです(ちなみに私はRubyはサッパリです・・ …