2012年9月21日金曜日

【統計】IPW推定量を導出してみる その1

前回の続きで、今回はRubin(1985)の提案している「傾向スコアによる重み付け推定法」を導出しようと思います.


  • $z$:割付け変数
  • $x$:共変量
  • $y$:従属変数


IPW推定量は、傾向スコアの逆数の重み付け平均でHorvitz-Thompson型推定量と呼ばれています.この推定量は通常の単純平均とは異なり、共変量を調整した平均です.この推定量のいいところは、平均処遇効果と周辺平均を計算することができることです.

マッチングや重回帰分析による共変量調整は、平均処遇効果を計算することはできますが、割り付け変数ごとに周辺平均を計算することはできません.しかし、この推定量を用いれば、周辺平均を計算することができます.

Horvitz-Thompson型推定量
「強く無視できる割当条件」\[ (y_{0}, y_{1}) \perp z | \mathbf{x} \]が成立するとき、
\[ E\left[\frac{y_{1}z}{e(\mathbf{x})}\right] = E\left[y_{1}\right] .\]


証明
まず傾向スコアの定義から
\[ e_{i} \equiv Pr(z_{i} = 1|\mathbf{x_{i}})  = E(z_{i}|\mathbf{x_{i}}) \]
と書くことができます.以下では対象者番号のiを省略しています.

\begin{equation*}
\begin{split}

E \left[ \frac{y_{1}z}{e} \right]
&= E_{ \mathbf{x}} \left[ E\left( \frac{y_{1}z}{e}| \mathbf{x} \right) \right] \\
&= E_{ \mathbf{x}} \left[ E\left(y_{1}|\mathbf{x}\right) E\left( \frac{z}{e}|\mathbf{x}\right) \right] \\
&= E_{ \mathbf{x}} \left[ \frac{1}{e} E\left( y_{1}|\mathbf{x} \right) E\left( z | \mathbf{x} \right) \right] = E\left( y_{1} \right)
\end{split}

\end{equation*}


1行目から2行目へは割付が強い意味で無視できるという条件を用いています($\mathbf{x}$が与えられた下では、$y$と$z$は条件付き独立)Q.E.D.

上の方法と同様にして、$E[y_{0}]$を求めることができます.


\begin{equation*}
\begin{split}

E \left[ \frac{y_{0}(1-z)}{1-e} \right]
&= E_{ \mathbf{x}} \left[ E\left( \frac{y_{0}z}{1-e}| \mathbf{x} \right) \right] \\
&= E_{ \mathbf{x}} \left[ E\left(y_{0}|\mathbf{x}\right) E\left( \frac{1-z}{1-e}|\mathbf{x}\right) \right] \\
&= E_{ \mathbf{x}} \left[ \frac{1}{1-e} E\left( y_{0}|\mathbf{x} \right) E\left( 1-z | \mathbf{x} \right) \right] = E\left( y_{0} \right)
\end{split}

\end{equation*}



つまり、真の傾向スコアがわかっていて、強く無視できる割当ての条件が成立するならば、対照群・処置群それぞれの周辺期待値を求めるには、傾向スコアによって重み付けされた期待値を求めればよい、ということになります.

参考文献

0 件のコメント:

コメントを投稿