因果媒介分析とは

概要

因果効果の内訳を考えるための手法として、因果媒介分析(Causal Mediation Analysis)というものがある。
これによって、A→Yという因果関係(Whether:AはYに効果があるのか？)だけでなく、AによってM1, M2, ...という事象が起きた結果Yに影響した、という内訳（Why/How:Aをしたら何故/どうやってYに効果があるか？）について考えることができる。

例

より具体的に書くと「ジムに入会する(A)ことで体脂肪率(Y)が変化したが、それは運動量が変化した(M1)からなのか、健康意識が変化した(M2)からなのか、食事習慣が変化したから(M3)なのか」「Aの効果の内、M1,M2,M3がそれぞれどれくらいの内訳で効果があったか’」という疑問に答えることができる。

これは、体脂肪率 = α 運動量 + β 健康意識スコア + γ 食習慣のように、体脂肪と運動量の直接的な関係性を見るのではなく、ジムに入会することで生じた運動量の変化という、運動量に関して因果の内訳にのみ着目した効果を観測することができる(健康意識などに関しても同様)。

f:id:chito_ng:20190812143708p:plain

Uberでは、施策による仮説や効果の検証などに使われている模様。

Mediation Modeling at Uber: Understanding Why Product Changes Work (and Don’t Work)

因果媒介分析の手法

因果媒介分析にはいくつか手法があるが、基本的に以下の図で考える。

f:id:chito_ng:20190812151625p:plain

ジム入会における、体脂肪率への影響の内訳を考える。

図にある「運動量変化」をDirect Effect(間接効果)、「運動量変化以外の効果(健康意識の変化や、食習慣の変化などまとまたもの)」をDirect Effect(直接効果)と呼ぶ。つまり、ジム入会における体脂肪率への全影響量をTotal Effectとすると、 Total Effect = Direct Effect + Indirect Effect となる。

なお、以下では数式のAを「ジム入会」、Yを「体脂肪率」、Mを「運動量」とする。また、簡略化のため交絡Cは図、式からいったん省略する。

Difference Method

シンプルな手法。

まず、以下からTotal Effectを推定する。 f:id:chito_ng:20190812152541p:plain

$Y = \alpha_0 A$

このときの $\alpha_0$ がジム入会(A)に対する全効果、つまりTotal Effectとなる。

次に以下を考える。 f:id:chito_ng:20190812151625p:plain

$Y = \alpha_1 A + \beta_1 M$

このときの $\beta_1$ は「運動量(M)」の効果となりIndirect Effectとなる。
$\alpha_1$ は、「運動量(M)」を追加したときのジム入会(A)の、媒介変数を経由しない効果。つまり、 $\alpha_1$ はDirect Effectになる。

$Total Effect = Direct Effect + Indirect Effect$ より、 $\alpha_0 = \alpha_1 + \beta_1$ となる。
このことから、Indirect Effect $\beta_1 = \alpha_0 - \alpha_1$ で計算することができる。

ただし、このやり方は「ジム入会(A)」と「運動量(M)」の間に交互作用がある場合（例えば、ジム入会の有無で、体脂肪に対する運動量あたりの効果が変わるとき）は下図の式が交互作用部分を表す項を追加した $Y = \alpha_1 A + \beta_1 M + \gamma_1 AM$ となるので解析的にDirect Effect, Indirect Effectを求めることができなくなる。

また、下図のように「ジム入会(A)」と「体脂肪率(Y)」への交絡CはRCT(ランダム化比較実験)などによってコントロールすることができるので問題はない。一方で、「体脂肪率(Y)」と「運動量(M)」に交絡(U)がある場合は係数が正しく推定ができない。しかし、RCTなどを使おうが媒介変数Mはランダムに割り付けることはできないので一般的には交絡が生じていると考えられるし、仮にランダムに割り付けがされていても選択バイアスが生じるためどちらにせよ推定量にバイアスがかかることになる。

f:id:chito_ng:20190812160731p:plain

つまり、Difference Methodを用いた因果媒介分析は、「AとMの交互作用がない」「YとMに交絡がない」「Mの選択バイアスが微小」、更に言えば説明をはしょったが「A,MとYに線形関係がある」「Yがカテゴリカル変数ではない」という強い仮定を置いている。

Baron-Kenny Method

以下の式で表す媒介分析の手法。 $Y = \alpha_0 A + \beta_0 M$
$M = \alpha_1 A$

これらから、
$Direct Effect = \alpha_0$
$Indirect Effect = \alpha_0 \alpha_1$

で求めることができる。ただし、この手法もDifference Methodと同様の問題が生じる。

Counterfactual-based Mediation

先程までと違い、反事実(Counterfactual)モデルを考えることでDirect/Indirect Effectを考える。

CDE(Controll Direct Effect)

Yを $Y_{AM}$ で表す。例えば、 $Y_{1m}$ は、A=1(入会),M=mのときのYを示す。
このとき、 $CDE(m) = Y_{1m} - Y_{0m}$ という概念を考える。

これは、運動量Mをある値に固定した上で入会した場合(A=1)と、入会してない場合(A=0)を比較している。つまり、運動量M以外の要素での差(=Direct Effect)はどうなるのか？ということがわかる。

当たり前だが交互作用がある場合はmによってCDE(m)の値は変わる。この性質からCDEは運動量をmに固定するような介入をするとAのM以外の効果はどうなるか という用途で使うことができる。

なお、Indirect Effectは見ることができない(用途的にはどうでもいいが)。

仮定

仮定としては以下の2つが必要で、RCTなどで対応可能。 -1. 共変量Cを与えると、未測定のA, Mへの交絡がない -2. 共変量Cを与えると、、未測定のA, Yにの交絡がない

Natural Direct Effect / Natural Indirect Effect

Mを $M_a$ で表す。例えば、 $M_1$ は、A=1(入会)のときのMを示す。
そのため、Yは $Y_{AM_a}$ で表す。例えば、 $Y_{1M_0}$ は、A=0(非入会)のときのMを与えたときの、A=1(入会)のときのYを示す。
なお、交互作用がない場合は $M_0$ と $M_1$ は一致する。

このとき、Direct Effect(Natural Direct Effect)とIndirect Effect(Natural Indirect Effect)はそれぞれ以下の式で示すことができる。

$NDE = Y_{1M_0} - Y_{0M_0}$
$NIE = Y_{1M_1} - Y_{1M_0}$

NDEは媒介変数Mを $M_0$ に固定した上でのAの変化による効果差（入会/非入会の差）を表している。
何故 $M_0$ に固定するかというと、Direct EffectはA=1での効果を知りたいのでA=0からA=1に変えたときのMを介さないAの効果を知りたい。そのため、Aを動かした中でのMの変化を除外した、Direct部分のNaturalな変化のみを捉えるために、 $M_0$ に固定した上でのAの変化を見ている。

NIEは媒介変数A=1に固定した上でのMの変化による効果差（入会/非入会の差）を表している。
何故Aを1に固定するかというと、Inirect EffectはDirect Effect以外、つまり媒介部分Mだけの効果差を知りたいので $M_0$ から $M_1$ に変えたときのAが1のときの効果を知りたい。そのため、Direct Effectを固定するためにAを1に固定した上でのMのNaturalな変化のみを見ている。

なお、このときも Total Effect = NDE(Direct Effect) + NIE(Indirect Effect)で表せれるので、冒頭にあるような「入会の効果の内訳のうち運動量はどれくらいか？」という問に答えることができる。

このときのDirect Effect, Indirect Effectは 交互作用の有無や線形性、Yが非カテゴリカル変数の仮定は置かなくても良い。
しかし、 $Y_{1M_0}, Y_{0M_0}, Y_{1M_1}, Y_{1M_0}$ を推定するためにはIdentifiability Assumption(識別可能性の仮定）を必要とする。

Identifiability Assumption

NDE, NIEのためのは以下の4つの条件が必要となる。

共変量Cを与えると、未測定のA, Mへの交絡がない
共変量Cを与えると、未測定のA, Yへの交絡がない
共変量CとAを与えると、未測定のM, Yへの交絡Uがない
Aの影響を受ける、未測定のY, Mへの交絡Lがない

1,2はRCTなどで対応可能。仮定3,4は前述のDifference Method, Baron-Kenny Methodと同様にRCTなどを使おうが媒介変数Mはランダムに割り付けることはできないので一般的には交絡が生じていると考えられるし、仮にランダムに割り付けがされていても選択バイアスが生じるためどちらにせよ推定量にバイアスがかかることになる。

そのため感度分析を用いてどの程度仮定違反でバイアスが出ているか確認する必要性がある。

未測定のM, Yへの交絡Uがある例 f:id:chito_ng:20190812175144p:plain