Blog

心理学系研究で目にするα係数。例えば、組織へのエンゲージメントのメカニズム解明のための実証分析を考えます。まず概念モデルを構築し、次に登場する因子の測定法を検討。アプリダウンロードや退職のように行動で明確に定義可能な因子を除けば、自己申告ベースの調査に頼らないといけない因子は多く、このような因子測定に対する信頼性をどのように評価するかが課題となります。ここで登場するのがCronbachのα係数(信頼係数)です。

前回記事でも紹介したZOOM疲れに関する論文では、例えば、ZOOM疲れを以下の5つの要素から定義し、要素ごとにα係数が計算され報告されています。一つの概念について聞き方を変えて測定しているだけですから、設問間のスコアが相応の強さの関連性でないと信頼性が怪しいのは感覚的には自明でしょう。数学と物理の点数を理系力と見做すのにあまり異論を感じないその感覚をきちんと定量化しましょうと言えば、よりわかりやすいでしょうか。

さて信頼係数$\rho$の定義についてです。ある調査で測定された観測値を$X$、真値を$T$、測定誤差を$E$とします。誤差$E$が様々な要因でランダムに生じるものとすると、これら3つの確率変数の分散はその独立性から以下を満たします。

$Var(X)=Var(T)+Var(E)$

すると、信頼係数$\rho$は以下のように定義することができます。しかし当然ながら、真値$T$はわからないので、信頼係数をどのように計算するかが課題になるのです。

$\rho=Var(T)/Var(X)=1-Var(E)/Var(X)$

信頼係数を求めるための基本アプローチとして、以下の3つが挙げられます。

  • 平行テスト法
    • 平均と分散が同じテストを用意し測定を二度行う
    • 設問群が一つの概念の測定に相応しければ、二つのテストのスコア合計は高い相関関係を示す
    • 実際、平均と分散が同一の場合、信頼係数は二つのスコアの相関係数に一致する
    • しかし、平均と分散が同じテストを作成すること自体が実現困難である
  • 再テスト法
    • 同じテストを同一対象に対して時間間隔を空けて二度行う
    • 同一テストなのでスコアの平均と分散は一致している
    • しかし、学習効果や順序効果によるバイアスのため上記一致条件は普通崩れる
  • 折半法
    • 上記踏まえテストは一つだけ用意する
    • ある概念測定のための設問群が(例えば)全てで10問とする
    • 上記設問を(例えば)5問ずつに分け、各々の合計スコアの相関係数から信頼係数$\rho_{sh}$を求める
    • 本稿では$\rho_{sh}$の定義式は省略(詳しくは心理学と心理測定における信頼性についてをご参照)

さてCronbachのα係数は具体的には以下で定義されますが($X$は設問群の合計得点、$X_i$は設問$i$の得点)、この式自体ではなく、これにより満たされるいくつかの性質を理解することが本係数の理解には役立つでしょう。

$ \alpha = \frac{n}{(n-1)}(1 – \frac{\sum_{i=1}^{n}Var(X_i)}{Var(X)})  $

上記にて定義されたCronbachのα係数は以下を満します。折半法の欠点(折半の方法に信頼係数が依存する)を見事に解消している点が広く活用されている背景と言えそうですね。

  • 全ての折半のパターンについての信頼係数$\rho_{sh}$を求めた場合、その算術平均と$\alpha$は一致する
  • $\alpha$は信頼係数の下界の一つ:つまり$\alpha$は$\rho$の楽観的な推定にはなっていない

逆に、実務上留意すべき点は以下になると思います。実務においては、データ収集を計画する非データ専門職の方のために(研究のような精緻な観点ではなく)簡便性と実行性を確保した実践的ガイドラインを用意してあげた方が良いと思います。

  • 設問数が増えると$\alpha$は上昇:未調整の$R^2$値と同様の注意が必要と言えそうですね
  • $\alpha$係数の高さは一次元性を保証しない:変数クラスタリングで綺麗に分割できる可能性

最後に付言すると、行動ログやセンサデータであってもそのまま実証分析の因子になる訳ではありません。簡単に例示すれば、コミュニケーションログから人間関係を表現するスコアを開発するとか、身体の動きから気分感情を推定するといった事です。当然、この種の技術課題には機械学習は有用なオプションとなるでしょう。本稿は以上とさせて頂きます。

コメントは利用できません。