まずは蝋の翼から。

学んだことを書きながら確認・整理するためのメモブログ。こういうことなのかな?といったことをふわっと書いたりしていますが、理解が浅いゆえに的はずれなことも多々あると思うのでツッコミ歓迎

媒介分析で因果効果の内訳を考える

因果媒介分析とは

概要

因果効果の内訳を考えるための手法として、因果媒介分析(Causal Mediation Analysis)というものがある。
これによって、A→Yという因果関係(Whether:AはYに効果があるのか?)だけでなく、AによってM1, M2, ...という事象が起きた結果Yに影響した、という内訳(Why/How:Aをしたら何故/どうやってYに効果があるか?)について考えることができる。

より具体的に書くと「ジムに入会する(A)ことで体脂肪率(Y)が変化したが、それは運動量が変化した(M1)からなのか、健康意識が変化した(M2)からなのか、食事習慣が変化したから(M3)なのか」「Aの効果の内、M1,M2,M3がそれぞれどれくらいの内訳で効果があったか’」という疑問に答えることができる。

これは、体脂肪率 = α 運動量 + β 健康意識スコア + γ 食習慣 のように、体脂肪と運動量の直接的な関係性を見るのではなく、ジムに入会することで生じた運動量の変化という、運動量に関して因果の内訳にのみ着目した効果を観測することができる(健康意識などに関しても同様)。

f:id:chito_ng:20190812143708p:plain

Uberでは、施策による仮説や効果の検証などに使われている模様。

Mediation Modeling at Uber: Understanding Why Product Changes Work (and Don’t Work)

因果媒介分析の手法

因果媒介分析にはいくつか手法があるが、基本的に以下の図で考える。

f:id:chito_ng:20190812151625p:plain

ジム入会における、体脂肪率への影響の内訳を考える。

図にある「運動量変化」をDirect Effect(間接効果)、「運動量変化以外の効果(健康意識の変化や、食習慣の変化などまとまたもの)」をDirect Effect(直接効果)と呼ぶ。つまり、ジム入会における体脂肪率への全影響量をTotal Effectとすると、 Total Effect = Direct Effect + Indirect Effect となる。

なお、以下では数式のAを「ジム入会」、Yを「体脂肪率」、Mを「運動量」とする。また、簡略化のため交絡Cは図、式からいったん省略する。

Difference Method

シンプルな手法。

まず、以下からTotal Effectを推定する。 f:id:chito_ng:20190812152541p:plain

Y = \alpha_0 A

このときの\alpha_0がジム入会(A)に対する全効果、つまりTotal Effectとなる。

次に以下を考える。 f:id:chito_ng:20190812151625p:plain

 Y = \alpha_1 A + \beta_1 M

このときの\beta_1は「運動量(M)」の効果となりIndirect Effectとなる。
\alpha_1は、「運動量(M)」を追加したときのジム入会(A)の、媒介変数を経由しない効果。つまり、\alpha_1はDirect Effectになる。

 Total Effect = Direct Effect + Indirect Effectより、 \alpha_0 =  \alpha_1 + \beta_1となる。
このことから、Indirect Effect  \beta_1 = \alpha_0 - \alpha_1で計算することができる。

ただし、このやり方は「ジム入会(A)」と「運動量(M)」の間に交互作用がある場合(例えば、ジム入会の有無で、体脂肪に対する運動量あたりの効果が変わるとき)は下図の式が交互作用部分を表す項を追加した Y = \alpha_1 A + \beta_1 M + \gamma_1 AMとなるので解析的にDirect Effect, Indirect Effectを求めることができなくなる。

また、下図のように「ジム入会(A)」と「体脂肪率(Y)」への交絡CはRCT(ランダム化比較実験)などによってコントロールすることができるので問題はない。一方で、「体脂肪率(Y)」と「運動量(M)」に交絡(U)がある場合は係数が正しく推定ができない。しかし、RCTなどを使おうが媒介変数Mはランダムに割り付けることはできないので一般的には交絡が生じていると考えられるし、仮にランダムに割り付けがされていても選択バイアスが生じるためどちらにせよ推定量にバイアスがかかることになる。

f:id:chito_ng:20190812160731p:plain

つまり、Difference Methodを用いた因果媒介分析は、「AとMの交互作用がない」「YとMに交絡がない」「Mの選択バイアスが微小」、更に言えば説明をはしょったが「A,MとYに線形関係がある」「Yがカテゴリカル変数ではない」という強い仮定を置いている

Baron-Kenny Method

以下の式で表す媒介分析の手法。  Y = \alpha_0 A + \beta_0 M
 M = \alpha_1 A

これらから、
 Direct Effect =  \alpha_0
 Indirect Effect =  \alpha_0 \alpha_1

で求めることができる。ただし、この手法もDifference Methodと同様の問題が生じる。

Counterfactual-based Mediation

先程までと違い、反事実(Counterfactual)モデルを考えることでDirect/Indirect Effectを考える。

CDE(Controll Direct Effect)

YをY_{AM}で表す。例えば、Y_{1m}は、A=1(入会),M=mのときのYを示す。
このとき、 CDE(m) = Y_{1m} - Y_{0m}という概念を考える。

これは、運動量Mをある値に固定した上で入会した場合(A=1)と、入会してない場合(A=0)を比較している。つまり、運動量M以外の要素での差(=Direct Effect)はどうなるのか?ということがわかる。

当たり前だが交互作用がある場合はmによってCDE(m)の値は変わる。この性質からCDEは運動量をmに固定するような介入をするとAのM以外の効果はどうなるか という用途で使うことができる。

なお、Indirect Effectは見ることができない(用途的にはどうでもいいが)。

仮定

仮定としては以下の2つが必要で、RCTなどで対応可能。 -1. 共変量Cを与えると、未測定のA, Mへの交絡がない -2. 共変量Cを与えると、、未測定のA, Yにの交絡がない

Natural Direct Effect / Natural Indirect Effect

MをM_aで表す。例えば、M_1は、A=1(入会)のときのMを示す。
そのため、YはY_{AM_a}で表す。例えば、Y_{1M_0}は、A=0(非入会)のときのMを与えたときの、A=1(入会)のときのYを示す。
なお、交互作用がない場合はM_0M_1は一致する。

このとき、Direct Effect(Natural Direct Effect)とIndirect Effect(Natural Indirect Effect)はそれぞれ以下の式で示すことができる。

NDE = Y_{1M_0} -  Y_{0M_0}
NIE = Y_{1M_1} -  Y_{1M_0}

NDEは媒介変数MをM_0に固定した上でのAの変化による効果差(入会/非入会の差)を表している。
何故M_0に固定するかというと、Direct EffectはA=1での効果を知りたいのでA=0からA=1に変えたときのMを介さないAの効果を知りたい。そのため、Aを動かした中でのMの変化を除外した、Direct部分のNaturalな変化のみを捉えるために、M_0に固定した上でのAの変化を見ている。

NIEは媒介変数A=1に固定した上でのMの変化による効果差(入会/非入会の差)を表している。
何故Aを1に固定するかというと、Inirect EffectはDirect Effect以外、つまり媒介部分Mだけの効果差を知りたいのでM_0からM_1に変えたときのAが1のときの効果を知りたい。そのため、Direct Effectを固定するためにAを1に固定した上でのMのNaturalな変化のみを見ている。

なお、このときも Total Effect = NDE(Direct Effect) + NIE(Indirect Effect)で表せれるので、冒頭にあるような「入会の効果の内訳のうち運動量はどれくらいか?」という問に答えることができる。

このときのDirect Effect, Indirect Effectは 交互作用の有無や線形性、Yが非カテゴリカル変数の仮定は置かなくても良い
しかし、 Y_{1M_0},  Y_{0M_0}, Y_{1M_1}, Y_{1M_0} を推定するためにはIdentifiability Assumption(識別可能性の仮定)を必要とする。

Identifiability Assumption

NDE, NIEのためのは以下の4つの条件が必要となる。

  1. 共変量Cを与えると、未測定のA, Mへの交絡がない
  2. 共変量Cを与えると、未測定のA, Yへの交絡がない
  3. 共変量CとAを与えると、未測定のM, Yへの交絡Uがない
  4. Aの影響を受ける、未測定のY, Mへの交絡Lがない

1,2はRCTなどで対応可能。仮定3,4は前述のDifference Method, Baron-Kenny Methodと同様にRCTなどを使おうが媒介変数Mはランダムに割り付けることはできないので一般的には交絡が生じていると考えられるし、仮にランダムに割り付けがされていても選択バイアスが生じるためどちらにせよ推定量にバイアスがかかることになる。

そのため感度分析を用いてどの程度仮定違反でバイアスが出ているか確認する必要性がある。

未測定のM, Yへの交絡Uがある例 f:id:chito_ng:20190812175144p:plain

Aの影響を受ける、未測定のY, Mへの交絡Lがある例 f:id:chito_ng:20190812175237p:plain

NDE, NIE, CDEの解析

上記を満たしていて、以下の線形モデルが成立する場合。

 E(Y | A = a, M = m, C = c) = \alpha_0 + \alpha_1 a + \alpha_2 m + \alpha_3 am + \alpha_4 c
 E(M | A = a, C = c) = \beta_0 + \beta_1 a + \beta_2 c

NDE, NIE, CDEは以下で解析的に求まる。

 NDE = \alpha_1 + \alpha_3 (\beta_0 + \beta_2 E(C)
 NIE = (\alpha_2 + \alpha_3 ) \beta_1
 \alpha_1 + \alpha_3 m

これはBaron-Kenny Methodと見比べるとBaron-Kenny Methodの拡張となっていることがわかる。

なお、Rでは以下のパッケージに実装されている)。
Causal Mediation Analysis Using R

mediation: R Package for Causal Mediation Analysis

参考

今回以下の記事を参考にしました。というか、krskさんの記事(上2つ)を自分なりに解釈し直したり他の見て自己補完した感じです。

因果効果のメカニズムを検討する:媒介分析(Causal Mediation Analysis)入門①~既存の手法の問題点~ - Unboundedly

因果効果のメカニズムを検討する:媒介分析(Causal Mediation Analysis)入門②~反事実モデルに基づく媒介効果の定義~ - Unboundedly

直接効果・間接効果の推定および未測定の交絡に対する感度解析

Causal Mediation Analysis(因果媒介分析)④:媒介因子が2つある場合|ドクターキッド(Dr.KID)

Causal Mediation | Columbia University Mailman School of Public Health

Unpacking the Black Box of Causality: Learning about Causal Mechanisms from Experimental and Observational Studies

A General Approach to Causal Mediation Analysis

Causal Inference Book