はじめに
第2次世界大戦後、米国の心理学者ゴードン・オルポートとレオ・ポストマンは、「デマの流通量は、その問題が当事者にとってどれほど重要か、そしてその問題に関するエビデンスがどれだけ曖昧であるかの積に比例する」と指摘しました。この内容は組織内の誤情報流通の抑制に対し、質の高いエビデンスの提供が重要であることを示唆しています。
分析マネジメント論の前編では、このエビデンスの質の観点から、組織内の誤情報抑制とAnalytical ROIの向上について記しましたが、後編にあたる本稿ではさらに一歩踏み込み、分析結果が組織にとって価値あるものと認識されるために必要な要素について探求します。
分析の価値とは
2023年7月、三重県で4歳の女児が親から暴行され死亡するという痛ましい事件が報道されました。実はこの事件の起きる一年以上前から、担当部署では女児の一時保護が検討されていましたが、AIによる予測結果(過去類似ケースに基づく一時保護率を39%と提示)を受けた担当者は、一時保護の判断を見送っていたのです。
AI導入に期待されることは、AIの出力結果を受け取った人がそれを受け取らなかった場合に比べ、その判断精度を向上させることでしょう。しかしこの事例が示すように、情報を受け取ったが故に精度を低下させることがあり得るのです。データの専門家、特に方法論的専門家は、分析結果を導く科学的厳密性や先進性に傾ける情熱と同程度の注意を、分析結果の受け手の認知過程にも向けるべきだと考えています。
本稿はこのような認識から、分析価値は「情報の受け手の認知領域を含む『分析の後工程の変化』で決まる」との立場から展開します。
情報の受け手の認知過程
以下の図2は、「医師の診断結果を聞かされた患者」と、上述の「三重県のAI出力結果を受けとった担当者」の認知過程を例示したもので、その過程を理解・認識・価値・判断に分解しています(本分解は『患者の意思決定にどう関わるか?―ロジックの統合と実践のための技法』(医学書院)のP.141からP.143の内容を元に筆者がアレンジしています)。
過程❶:理解
最初のステップは情報の「理解」です。今回のAI出力「一時保護率(39%)」への理解はシンプルで、5回の判断機会があれば平均して2回は一時保護と判断されるものと、誰もが理解できるでしょう。
過程❷:認識
今回の「認識」は「リスク認識」の問題と言えます。5回中2回は一時保護になることが「高リスク」なのか「低リスク」なのかを判別するということです。ここで分析者が注意したい点は、この認識は情報の受け手のメンタルモデルを介して行われるという点です。つまり情報の受け手にとって、情報が作られた過程は「重要かもしれないが重大な関心事ではない」ということです。
意思決定支援の失敗の一つに、分析者が「情報の受け手が数値を『理解』できていない」と誤解し、「数値の算出過程を説明し直す」というものがあります。そうではなく分析者は、情報の受け手の「認識の仕方」に注目する必要があります。
今回、読者の中にも「39%」とい値から「低リスク」と認識された方がいるかもしれません。ただ、これはあまり好ましい認識方法とは言えません。数値単体に意味はなく、それと将来リスクとの関連性の強度や全体数値との比較が重要だからです。
たとえば、過去の一時保護率と将来リスクの関連性がとても強く、かつ全体の一時保護率が10%程度だと聞かされたら、この「39%」という数値は「高リスク」と認識されるでしょう。数値の理解が同一でも、認識の仕方まで同一とは限らないのです(情報提示の方法で認識が楽観的または悲観的にブレることを「フレーミング効果」と呼びます)。
過程❸:価値
認識の次は「価値」づけです。「高リスクほど一時保護すべき」という価値観が否定されることはないでしょうが、リスクがそこまで高くないのなら、「できるだけ子供を家族から分離すべきではない」という価値観もあるはずです。子供の利益を第一とするといっても、目先の害の解消策(親子の分離)が新たな害を生み出しかねません。
意思決定者にとって何が重大な関心事かを明確にすることは、意思決定者本人にとっても意思決定者を支援する人やシステムにとっても不可欠な工程となります。
過程❹:判断
目先の害とその解消に伴い予想される害、また時には限られた資源制約を考慮し、実行可能なオプション(一時保護とするか否かのgo/no-go)から一つを選択します。特に今回のように意思決定者(判断を下す専門家)と、害の解消される人物が異なる場合、専門家本人の価値観や考え方ではなく、専門家集団の集合知としての判断が下さるべきでしょう。
分析価値の源泉
今回事例の痛ましい顛末は、複雑な判断を現場の専門家に委ねることの限界を強く示唆しています。また、どれだけ優れた分析工程から得られた結果であっても、それ単体で意思決定状況が容易にならないこともわかります。
すなわち一つのエビデンスはそれ単体で価値があるのではなく、関連するエビデンスが集合知として統合され、そこから一つの判断指針「〜の状況では〜すべき」(推奨)が示されて初めて、分析の後工程への良い影響(分析価値)が生み出されるのです。
図3:分析価値の源泉
データの科学とディシジョンの科学を紡ぐ
分析を価値あるものにするには、意思決定者が直面する課題に対し、何をすべきかの「推奨」まで作成されているのが理想です(図3)。この実現のためには「エビデンスを推奨へと変換するシステム」が必要となりますが、幸いにも私たちはこれをゼロから構築する必要はありません。既に科学の営みの中で開発されたシステムを利用可能だからです。それがGRADEと呼ばれるシステムです。
図4:エビデンスから推奨への変換(GRADEシステムの超概要)
GRADEとは
GRADEは、エビデンスを推奨に変換するためのシステムであり、臨床医が特定の患者の状態に対し「何をすべきか」を決定するための体系的なアプローチを提供します。このシステムは、医学情報を科学的に吟味し共有することを目的とした国際的なNPOであるコクランが作成したシステマティックレビュー報告「コクランレビュー」や各国の診療ガイドラインの作成に広く活用されています。GRADEは、エビデンスに基づく医療の現在の到達点の一つと言えるものです。
GRADEの特徴は、「エビデンスの確実性の評価」と「推奨の強さの評価」を明確に分離している点にあります。分析工程のマネジメントはエビデンスの確実性を高めますが、これだけでは不十分です。本工程から得られたエビデンスに基づく推奨が、分析の後工程(意思決定工程)に良い変化をもたらすための重要なツールとなるのです。
- エビデンスの確実性(CoE:Certainty of Evidence)
- 何をもってエビデンスの確実性をUp/Downさせるかを規定
- Down要因:
- バイアスリスク
- 非一貫性
- 非直接性
- 不精確さ
- 出版バイアス
- Up要因:
- 大きな効果
- 用量反応
- 交絡因子の解釈
- 推奨づくり
- 個々のCoEからエビデンス総体の確実性を評価し「推奨の強さ」と「方向性」を決定
- 強い推奨:
- 〜を推奨する
- 〜すべきである
- 弱い推奨:
- 〜を提案する
- 〜するとよいだろう
- 弱い推奨反対:
- 〜をしないことを提案する
- 〜しない方がよいだろう
- 強い推奨反対:
- 〜をしないことを推奨する
- 〜すべきでない
図5:GRADEシステムの流れ
出所:http://aihara.la.coocan.jp/?p=857
図5左上にあるPICOとは、リサーチクエスチョン(RQ)を構造化するための枠組みで、研究の全体像や分析設計に用いられます。また複数の研究知見を統合する際にも、どのようなRQを対象に「エビデンスを統合するか?」を定義するのに活用されます。PICOの頭文字は、以下の通りで、因果推論の基本構造を提供します。
- Population:研究対象の集合(例:〜を患っている65歳以上の患者)
- Intervention:研究対象にどのような介入を実施するか(例:新薬)
- Comparison:介入と比較する対照(例:プラセボ)
- Outcome:介入と対照の効果の差を測定するための指標(例:1年以内の死亡割合)
分類の重要性
臨床領域には、世界保健機関が発行する国際疾病分類(ICD)やアメリカ精神医学会が発行する精神疾患の診断・統計マニュアル(DSM)が存在します。ICDはあらゆる病気や健康状態を分類するための国際的な標準コード体系、DSMは精神疾患をカテゴリごとに分類し、それぞれの疾患に対する具体的な診断基準を記載したものです。
これらの分類体系は、臨床診断、研究、教育、そして政策立案において共通の基盤を提供し、医療従事者にとって不可欠なツールとなっています。例えば、PICOで研究課題を設計する際、ICDやDSMの分類に基づいて研究対象となる集団を明確に設定できます。また介入やアウトカムも標準化された定義に基づいて実施・測定できるため、異なる研究結果の比較やエビデンスの定量的統合(メタアナリシス)が可能になります。
- DPC(Diagnosis Procedure Combination)とは何で、この種の分類の重要性は何か?
- DPCコード「診断群分類番号: 010010xx03x00x」はどのような内容か?
- DPCを模して、企業部門の機能ごとに課題コードを採番するアイディアはないか?
分析マネジメントのコア業務
米国の医療政策研究者のシェケル博士らが、AHRQ(アメリカ医療研究品質局)作成の17件の診療ガイドラインをレビューした結果、作成後3.6年(95%CI:2.6〜4.6年)経過したガイドラインの90%以上はもはやその妥当性はなく、診療ガイドラインの半分は5.8年(95%CI:5.0~6.6年)で時代遅れとなっていることが判明しました。
臨床研究では「本来普遍的だが極めて複雑な対象」(人体)に対し、世界中の研究者が解明に取り組む結果として、多くの知見の書き換えが起きていると考えられます。ビジネス分析の文脈では、扱う対象(顧客や市場や技術動向)が流動的で極めて複雑なこと、さらに限られた分析的資源(専属の分析者を置ける組織は少数)の下で質の低いエビデンスが作られていることを考えると、臨床研究の世界と同等かそれ以上の速度で、現在の“常識“が書き換えられても不思議ではありません。
このように考えると、標準解決手段は絶えず変化することを前提に、課題分類ごとに投下されている分析関連費用とそれに対する成果(例:何件、新しい標準解決手段を生み出せたかなど)の追跡が、データ利活用を進める組織には不可欠なマネジメント事項になることが理解できるのです。
データ分析に向けた分類成熟度チェックリスト
☑️ 分析課題を体系化した「分類コード」の開発の必要性を認識できているか?
☑️ 分析課題を体系化した「分類コード」の開発を進めているか?
☑️ 分析課題を体系化した「分類コード」の定期的な見直しを行なっているか?
☑️ 分類コードごとに、分析対象・単位(人・物・イベントなど)を定められているか?
☑️ 分類コードごとに、標準解決手段や対照手段(プラセボ相当)を定められているか?
☑️ 標準解決手段を越える新手段(新技術)の開発を進めているか?
☑️ 課題解決状態を測定するための指標を開発(または定義)できているか?
☑️ 新手段導入時のトライアル手順(効果検証含む)は整備されているか?
まとめ
本稿では、分析の価値は情報を受け取る意思決定者の認知過程に依存しており、高品質なエビデンスを生み出すだけでは十分でないことを指摘しました。重要なのは、エビデンスをどのように活用し推奨へと変換するかです。特に複雑な判断を行う際に、AIやデータ分析の結果の価値は、それ自体ではなく関連するエビデンスが統合され、適切な判断指針として提示されることで初めて発揮されることを強調しました。
分析マネジメントには、科学的厳密性が求められる分析工程と、実践的な意思決定支援である分析の後工程、両方を最適化することが求められています。
- 分析価値は情報の受け手の認知過程に依存して決まる。
- 高品質なエビデンスの生成は分析価値創出の十分条件ではない。
- エビデンスを推奨に変換するアプローチの一つにGRADEシステムがある。
- データ分析やAIシステムの出力結果は、それ単体では価値を発揮しにくい。
- 複数のエビデンスが統合されることで、集団知としての判断指針が生まれる。
- 分析マネジメントの対象は、科学的厳密性と意思決定支援の両方に跨る。
- ビジネス成果管理の第一歩は体系化された課題分類コードの開発である。
Comment