これまで直接効果と間接効果を推定する媒介分析(Mediation analysis)のための4条件を紹介してきましたが、モデリングのためのデータ収集に関連し一点補足します。具体的にはデータをランダム化比較試験で収集した場合との関連です。

  1. 処置変数$A$と媒介因子$M$の間に未観測の交絡因子が存在しない($C1$を観測する)
  2. 処置変数$A$と成果変数$Y$の間に未観測の交絡因子が存在しない($C2$を観測する)
  3. 媒介因子$M$と成果変数$Y$の間に未観測の交絡因子が存在しない($C3$を観測する)
  4. 媒介因子$M$と成果変数$Y$の交絡因子に処置変数が影響しない($A$から$C3$の矢印が存在しない)

ランダム化と媒介分析

私たちが観察でなくデータをランダム化比較試験で収集する場合、上記1/2番は満たされます。処置$A$に直接矢印が向いている$C1$と$C2$に該当する条件です。ここでの留意点は$C3$についてはランダム化されたデータにおいても調整が必要ということです。なぜなら$C3$で調整しないと、$M$が合流点となり合流点層別バイアス(collider stratification bias)を発生させるためです。

当該バイアスについては前々回の投稿もご参照下さい。データ収集設計からが分析ですので、データがあるから何かできないか考える「後付け分析」は組織としても個人としても早めに突破したい所ですよね。本稿は以上です。

メルマガ登録のご案内

CI.ではデータ&ディシジョン科学の観点からの情報発信を行っています。
よろしければ、メルマガ登録をお願い致します。

コメントは利用できません。