BOOK JOURNAL: 【統計】傾向スコア

傾向スコアが因果推論でよく使われているということで勉強中…

ということで、「傾向スコアを用いた共変量調整による因果効果の推定と臨床医学・薬学・公衆衛生分野での応用について」の前半部分をまとめました．

共変量の影響を除去しなければならない！

たとえば、ある薬を飲むこと（従属変数）で病気が早く治る（独立変数）か知りたいとき、投薬の有無を操作することができないために、薬を飲んだ人と飲まなかった人に分けて治癒日数の平均の差を調べることになります．しかし、この方法では治癒日数に影響を与えそうな病気の症状や年齢などの共変量の影響が除去されないために、ある薬の病気を早く治す因果効果を知ることができなくなってしまう！
じゃどうすればいいのか？？ということで、共変量の調整方法として以下の３つが考えられてきました．

既存の共変量調整

既存の共変量調整法は３つあります．

均衡化

恒常化・限定

統計的調整

マッチング
層別解析
共分散分析

最後の３．共分散分析は、共変量が独立変数と従属変数に影響を与えてしまうなら、それをモデルに含めて考えればいいという方法になります．

具体例
Cox回帰、パス解析、グラフィカルモデリング、構造方程式モデリング…
問題点
しかし、この方法でもやはり問題点があります。
線形や二次関数など、従属変数と共変量の関係をモデル化しないといけないということです．もし真のモデルが二次関数のときに線形を仮定してしまうと誤った結論が得られてしまいます．また、回帰係数自体が、因果効果と等しくはならないということです．

傾向スコアの利用

そこで、こうした問題点を克服するために、”セミパラメトリックな”共変量調整法として傾向スコアを用いた解析法が注目されています．
定義
今、薬を飲んだ人をz＝１、薬を飲まなかった人をz＝０のようにzを割付変数とします．また共変量ベクトルをxとすると、傾向スコアは群１（薬を飲んだ人）へ割付けられる確率として定義されます．添字のiは第i被験者を表しています．

\[ e_{i} = Pr(z_{i} = 1|\mathbf{x_{i}}) \]

使用のための条件
ただし、この傾向スコアを使うためには条件が必要です．それが、割当てが「強い意味で無視可能」であるという条件です．この条件は次の３つに分けられます．

観測された共変量によって割付が説明できるということ

観測されていない共変量が割付に影響を与えないということ

従属変数の値によって、割付が決定されないということ

傾向スコアの具体的な解析方法
以上のような条件が成立するときに、傾向スコアを用いた解析を行うことができます．
その解析方法は二段階に分かれています．

傾向スコアの推定

傾向スコアを用いた調整

マッチング
層別
共分散分析
重み付き平均

次回は、重み付け平均を考えてみます．

BOOK JOURNAL

2012年9月19日水曜日

【統計】傾向スコア

0 件のコメント:

コメントを投稿