
直接効果と間接効果を推定するための4条件を前回投稿などで紹介しました。今回はこれらの条件を満たすDAGと満たさないDAGを確認した後、具体的な解析事例を紹介します。
- 処置変数$A$と媒介因子$M$の間に未観測の交絡因子が存在しない($C1$を観測する)
- 処置変数$A$と成果変数$Y$の間に未観測の交絡因子が存在しない($C2$を観測する)
- 媒介因子$M$と成果変数$Y$の間に未観測の交絡因子が存在しない($C3$を観測する)
- 媒介因子$M$と成果変数$Y$の交絡因子に処置変数が影響しない($A$から$C3$の矢印が存在しない)
条件を満たすDAG、満たさないDAG
上のDAGは因子$C1$が処置変数$A$と成果変数$Y$および$A$と媒介因子$M$の交絡因子に、そして$C3$が$M$と$Y$の交絡因子になっていて、かついずれも因子$A$に対し矢印が向いています。未観測の交絡因子が無いかの判断はドメイン固有の知識により必要ですが、このDAGの形式には問題ありません。
上のDAGは処置変数$A$が$M$と$Y$の交絡因子$C3$に影響を与えており形式NGです。これまで確認してきたことは、交絡因子は因子$A$と$M$と$Y$の因果連鎖トライアングルのどの辺に対する(また複数に対する)交絡因子となってもよいが、処置変数$A$が媒介因子$M$と成果変数$Y$の交絡因子の原因になってはいけなかったからです。
解析設計事例:家庭環境が子供の認知能力にもたらす影響
家庭環境を職場環境、子供を部下、認知能力をパフォーマンスと読み変えれば、典型的なHR系アナリティクスのテーマになりそうです。これはMarjoribanks(1974)の教育モデルに基づくDAGで、先の形式チェックをしたものと同一の構造です。この場合、因子$A$が因子$C2$の原因になり影響を与えるとは考えにくく受け入れやすいDAGになっています。ここに登場する因子を見ることで、皆さんの手元課題の因子についても想像力を掻き立てられませんか?
本稿参照論文には上記の他に、母親の喫煙有無(暴露変数)がSIDS(乳幼児突然死症候群)に与える解析事例紹介もありましたが、私には共変量の一つである飲酒有無と暴露変数の矢印の向きに対する判断ができませんでした。媒介分析(Mediation analysis)ができる解析ライブラリの紹介などはまた別途ご紹介できればと思います。本稿は以上です。