前回投稿で、総合効果(total effect)は以下のように要素分解できることを紹介しました。

$$ 総合効果(TE) = 総合直接効果(TDE) + 純粋な間接効果(PIE) $$

$$ 総合効果(TE) = 自然な直接効果(NDE/PDE) + 自然な間接効果(NIE/TIE) $$

この直接効果(direct effect)と間接効果(indirect effect)の推定問題に対する古典モデルは、ニューラルネットワークで誤差逆伝播法が提唱されたのと同じ1986年のBaron and Kemyによる以下のモデルです。以降、処置変数は$A$で表記します。

$$ E[M | A=a]=\beta_0+\beta_1\alpha $$

$$ E[Y | A=a, M=m]=\theta_0+\theta_1a+\theta_2m $$

解析の非専門家に多い勘違いはモデルは正解を導く公式というものでしょう。この場合について厳密に言うと、ある条件を満たす場合、上記モデルで推定された係数$\theta_1$、$\theta_2$、$\beta_1$を使うと、以下関係式が成立するということです。

$$ 自然な直接効果(NDE/PDE) = \theta_1(a-a\ast) $$

$$ 自然な間接効果(NIE/TIE) = \beta_1\theta_2(a-a\ast) $$

$a\ast$は最初の図の右上状態時の処置変数の値$t_0$のことです。ここでの問題はどのような条件を満たした時に上の関係式が成立するかです。そこで本稿ではNGケースを紹介します。具体的には以下DAGにおいて媒介因子$M$と成果変数$Y$の交絡因子$C1$が未測定の場合です。

この何が問題でしょうか。ポイントは媒介因子$M$が合流点ということです。因子$C_1$を説明変数に取り込めていない状況で因子$M$を固定(説明変数としてモデル化)しているので、因子$A$と因子$C_1$は条件付き依存の状態になってしまいます。依存下における処置変数の変化に対する成果変数の変量などに興味はなく、他の因子の影響から切り離された状態(独立した状態)でのそれに興味がある訳ですから、未観測の因子$C_1$の存在は$\theta_1$を直接効果の解釈として使えなくしてしまうのです。詳細は以下Paperなどをご参照下さい。

メルマガ登録のご案内

CI.ではデータ&ディシジョン科学の観点からの情報発信を行っています。
よろしければ、メルマガ登録をお願い致します。

コメントは利用できません。