傾向スコアが因果推論でよく使われているということで勉強中…
ということで、「傾向スコアを用いた共変量調整による因果効果の推定と臨床医学・薬学・公衆衛生分野での応用について」の前半部分をまとめました.
共変量の影響を除去しなければならない!
たとえば、ある薬を飲むこと(従属変数)で病気が早く治る(独立変数)か知りたいとき、投薬の有無を操作することができないために、薬を飲んだ人と飲まなかった人に分けて治癒日数の平均の差を調べることになります.しかし、この方法では治癒日数に影響を与えそうな病気の症状や年齢などの共変量の影響が除去されないために、ある薬の病気を早く治す因果効果を知ることができなくなってしまう!
じゃどうすればいいのか??ということで、共変量の調整方法として以下の3つが考えられてきました.
既存の共変量調整
既存の共変量調整法は3つあります.
- 均衡化 共変量が同じになるペアを作ること
- 恒常化・限定 共変量がある値で一緒の被験者のみに限定して分析を行うこと
- 統計的調整
- マッチング
- 層別解析
- 共分散分析
例えば、病気の症状を重いと軽いに分けること
具体例
Cox回帰、パス解析、グラフィカルモデリング、構造方程式モデリング…
問題点
しかし、この方法でもやはり問題点があります。
線形や二次関数など、従属変数と共変量の関係をモデル化しないといけないということです.もし真のモデルが二次関数のときに線形を仮定してしまうと誤った結論が得られてしまいます.また、回帰係数自体が、因果効果と等しくはならないということです.
Cox回帰、パス解析、グラフィカルモデリング、構造方程式モデリング…
問題点
しかし、この方法でもやはり問題点があります。
線形や二次関数など、従属変数と共変量の関係をモデル化しないといけないということです.もし真のモデルが二次関数のときに線形を仮定してしまうと誤った結論が得られてしまいます.また、回帰係数自体が、因果効果と等しくはならないということです.
そこで、こうした問題点を克服するために、”セミパラメトリックな”共変量調整法として傾向スコアを用いた解析法が注目されています.
定義
今、薬を飲んだ人をz=1、薬を飲まなかった人をz=0のようにzを割付変数とします.また共変量ベクトルをxとすると、傾向スコアは群1(薬を飲んだ人)へ割付けられる確率として定義されます.添字のiは第i被験者を表しています.
ただし、この傾向スコアを使うためには条件が必要です.それが、割当てが「強い意味で無視可能」であるという条件です.この条件は次の3つに分けられます.
以上のような条件が成立するときに、傾向スコアを用いた解析を行うことができます.
その解析方法は二段階に分かれています.
定義
今、薬を飲んだ人をz=1、薬を飲まなかった人をz=0のようにzを割付変数とします.また共変量ベクトルをxとすると、傾向スコアは群1(薬を飲んだ人)へ割付けられる確率として定義されます.添字のiは第i被験者を表しています.
-
\[
e_{i} = Pr(z_{i} = 1|\mathbf{x_{i}})
\]
ただし、この傾向スコアを使うためには条件が必要です.それが、割当てが「強い意味で無視可能」であるという条件です.この条件は次の3つに分けられます.
- 観測された共変量によって割付が説明できるということ 割付は共変量のみから影響を受けるということ
- 観測されていない共変量が割付に影響を与えないということ 観測したもの以外に共変量が存在しないということです.
- 従属変数の値によって、割付が決定されないということ 共変量を与えた下では、病気の治癒日数である従属変数が投薬をするかしないかの割当てには影響を与えないということです.つまり、以下のような条件付き独立が成立していることが必要です.
たとえば、薬を飲むかどうかに割付けられるかは、共変量である病気の症状によって説明できるということです.
傾向スコアを用いた解析では、アンケート調査で共変量をもれなく聞いている必要があります.
以上のような条件が成立するときに、傾向スコアを用いた解析を行うことができます.
その解析方法は二段階に分かれています.
- 傾向スコアの推定 ロジスティック回帰かノンパラメトリック回帰で推定されます.
- 傾向スコアを用いた調整
- マッチング
- 層別
- 共分散分析
- 重み付き平均
0 件のコメント:
コメントを投稿