前回の記事(その1、その2)で紹介したIPW推定量のRコードを紹介します.
次のような2つのステップを踏んで、IPW推定量を計算します.
傾向スコアを推定
傾向スコアの推定には、ロジスティクス回帰分析を用います.割り当て変数を従属変数、共変量を説明変数にして分析を行います.
IPW推定量を計算
前回の記事より、IPW推定量を計算します.
サンプルデータはRのlalondeというデータを用います.
このデータは、職業支援プログラムの賃金(78年の賃金:re78)への効果をはかるもので、訓練を受けるグループ(処置群:treat=1)と受けないグループ(対照群:treat=0)間の賃金差を調べています.
応援よろしくです.
2012年12月30日日曜日
2012年12月26日水曜日
【統計】IPW推定量を導出してみる その2
前回の記事の続きです.Horvitz-Thompson型推定量の推定値を求めます.
Horvitz-Thompson型推定量
「強く無視できる割当条件」\[ (y_{0}, y_{1}) \perp z | \mathbf{x} \]が成立するとき、
\[ E\left[\frac{y_{1}z}{e(\mathbf{x})}\right] = E\left[y_{1}\right] .\]
期待値の推定量は平均値をとることが一般的なので、
\begin{equation*}
\begin{split}
E \left[ \frac{y_{1}z}{e} \right]
&= \frac{1}{n} \sum_{i=1}^{N} \frac{z_{i}y_{i1}}{e_{i}} \\
&= \frac{\sum_{i=1}^{N} \frac{z_{i}y_{i1}}{e_{i}}}{\sum_{i=1}^{N} \frac{z_{i}}{e_{i}}}
\end{split}
\end{equation*}
1行目から2行目へは、次のような関係を用いています.
\begin{equation*}
\begin{split}
E \left[ \frac{z}{e} \right]
&= E_{\mathbf{x}} \left[ E \left[ \frac{z}{e} | \mathbf{x} \right] \right] \\
&= E_{\mathbf{x}} \left[ \frac{1}{e}E \left[ z | \mathbf{x} \right] \right] = 1.
\end{split}
\end{equation*}
ところで、
\[ E \left[ \frac{z}{e} \right] \approx \frac{1}{n} \sum_{i=1}^{N} \frac{z_{i}}{e_{i}}\]
であるので、
\[ \frac{1}{n} \sum_{i=1}^{N} \frac{z_{i}}{e_{i}} \approx 1 \leftrightarrow
\sum_{i=1}^{N} \frac{z_{i}}{e_{i}} \approx n. \]
次回は、この推定量のRコードを考えてみます.
参考文献
応援よろしくです.
Horvitz-Thompson型推定量
「強く無視できる割当条件」\[ (y_{0}, y_{1}) \perp z | \mathbf{x} \]が成立するとき、
\[ E\left[\frac{y_{1}z}{e(\mathbf{x})}\right] = E\left[y_{1}\right] .\]
期待値の推定量は平均値をとることが一般的なので、
\begin{equation*}
\begin{split}
E \left[ \frac{y_{1}z}{e} \right]
&= \frac{1}{n} \sum_{i=1}^{N} \frac{z_{i}y_{i1}}{e_{i}} \\
&= \frac{\sum_{i=1}^{N} \frac{z_{i}y_{i1}}{e_{i}}}{\sum_{i=1}^{N} \frac{z_{i}}{e_{i}}}
\end{split}
\end{equation*}
1行目から2行目へは、次のような関係を用いています.
\begin{equation*}
\begin{split}
E \left[ \frac{z}{e} \right]
&= E_{\mathbf{x}} \left[ E \left[ \frac{z}{e} | \mathbf{x} \right] \right] \\
&= E_{\mathbf{x}} \left[ \frac{1}{e}E \left[ z | \mathbf{x} \right] \right] = 1.
\end{split}
\end{equation*}
ところで、
\[ E \left[ \frac{z}{e} \right] \approx \frac{1}{n} \sum_{i=1}^{N} \frac{z_{i}}{e_{i}}\]
であるので、
\[ \frac{1}{n} \sum_{i=1}^{N} \frac{z_{i}}{e_{i}} \approx 1 \leftrightarrow
\sum_{i=1}^{N} \frac{z_{i}}{e_{i}} \approx n. \]
次回は、この推定量のRコードを考えてみます.
参考文献
応援よろしくです.
登録:
投稿 (Atom)