タイトルのとおりですが、TIMSS2011を利用して、国・私立中学校と公立中学校の成績差を見てみます。
とりあえず、平均点の差を検討する
TIMSS2011の学校質問紙や生徒質問紙では、生徒が通っているのが私立学校かどうかといった情報は得られない。
しかし、日本の中学校データには、IDSTRATEという層化変数(5-8は公立/9が国立or私立)がある。
今回は、この変数を利用して、国・私立中学校と公立中学校の成績差を検討する。
Rのコードは以下の通り。
# library library(car) library(foreign) library(intsvy) # data jp11stu <- read.spss("bsgjpnm5.sav", use.value.labels=F, to.data.frame=T, use.missing=T) timss.table("IDSTRATE", data=jp11stu) timss.mean.pv("BSMMAT", by="IDSTRATE", data=jp11stu) jp11stu$public <- recode(jp11stu$IDSTRATE, "5:8=1; 9=0") # 公立=1, 国・私立=1のダミー変数 timss.reg.pv(pvlabel="BSMMAT", x="public", data=jp11stu) # ダミー変数による回帰
最後の回帰分析では、publicの係数が-78.54(14.91)になる。
これは、公立中学校の方が、国・私立中学校に比べて78.54点、数学の成績が低いことを意味している。
母親学歴との関連はどうなっているのか?
国・私立中学校のほうが公立中学校より成績が高いからと言って、国・私立中学校のほうが公立中学校より優れているとは限らない。
一般に、社会的・経済的に恵まれた人々の子弟のほうが成績が高い。
国・私立中学校の成績が高いのは、国・私立中学校の成績が優れているからではなく、単にこうした人々が多く在学しているからかもしれない。
この問題をきちんと検証するのは難しいので、ここでは、母親学歴と成績の関連を散布図で示すにとどめておく。
# 母学歴が「高卒orわからない」の人を0に、「短大・大卒・それ以上」の人を1にしたダミー変数。 jp11stu$m_edu <- recode(jp11stu$BSBG06A, "1:3=0; 4:7=1; 8=0") jp11sch <- aggregate(cbind(BSMMAT01, public, m_edu) ~ IDSCHOOL, data=jp11stu, mean) plot(jp11sch$m_edu, jp11sch$BSMMAT01, xlim=c(0,1), ylim=c(400,700), xlab="母短大・大卒割合", ylab="数学得点PV1", main="母短大・大卒×数学得点PV1", col=ifelse(jp11sch$public==1, "red", "blue")) # 公立中を青、国・私立中を赤色でプロット。
図は、以下のようになる。
この図を見ると、国・私立中学校は成績も高い(図の上方に青い点が多い)が、母親学歴が高い人々もまた多い(右側に青い点が多い)ということがわかる。
ちなみに、なぜこんな分析をしたかというと、aggregate関数の使い方を知りたかったからである。