2012年12月30日日曜日

【統計】【R】IPW推定量を導出してみる その3

前回の記事(その1その2)で紹介したIPW推定量のRコードを紹介します.

次のような2つのステップを踏んで、IPW推定量を計算します.
傾向スコアを推定
傾向スコアの推定には、ロジスティクス回帰分析を用います.割り当て変数を従属変数、共変量を説明変数にして分析を行います.
IPW推定量を計算
前回の記事より、IPW推定量を計算します.

サンプルデータはRのlalondeというデータを用います.
このデータは、職業支援プログラムの賃金(78年の賃金:re78)への効果をはかるもので、訓練を受けるグループ(処置群:treat=1)と受けないグループ(対照群:treat=0)間の賃金差を調べています.


応援よろしくです.

2012年12月26日水曜日

【統計】IPW推定量を導出してみる その2

前回の記事の続きです.Horvitz-Thompson型推定量の推定値を求めます.


Horvitz-Thompson型推定量
「強く無視できる割当条件」\[ (y_{0}, y_{1}) \perp z | \mathbf{x} \]が成立するとき、
\[ E\left[\frac{y_{1}z}{e(\mathbf{x})}\right] = E\left[y_{1}\right] .\]

期待値の推定量は平均値をとることが一般的なので、


\begin{equation*}
\begin{split}

E \left[ \frac{y_{1}z}{e} \right]
&= \frac{1}{n} \sum_{i=1}^{N} \frac{z_{i}y_{i1}}{e_{i}} \\
&= \frac{\sum_{i=1}^{N} \frac{z_{i}y_{i1}}{e_{i}}}{\sum_{i=1}^{N} \frac{z_{i}}{e_{i}}}
\end{split}

\end{equation*}

1行目から2行目へは、次のような関係を用いています.


\begin{equation*}
\begin{split}

E \left[ \frac{z}{e} \right]
&= E_{\mathbf{x}} \left[ E \left[ \frac{z}{e} | \mathbf{x} \right] \right] \\
&= E_{\mathbf{x}} \left[ \frac{1}{e}E \left[ z | \mathbf{x} \right] \right] = 1.

\end{split}
\end{equation*}

ところで、
\[ E \left[ \frac{z}{e} \right] \approx \frac{1}{n} \sum_{i=1}^{N} \frac{z_{i}}{e_{i}}\]
であるので、
\[ \frac{1}{n} \sum_{i=1}^{N} \frac{z_{i}}{e_{i}} \approx 1 \leftrightarrow
\sum_{i=1}^{N} \frac{z_{i}}{e_{i}} \approx n. \]

次回は、この推定量のRコードを考えてみます.

参考文献

応援よろしくです.