
思考と推論
前回記事の通り、思考にはさまざまなタイプがあり、推論(reasoning)はその中の一つに位置付けられます。例えば「類似と思考(改訂版、ちくま学芸文庫)」では、思考を以下のように類型化しています。
- 推論(reasoning)と呼ばれるタイプの思考
- 80点が合格ラインの時、82点を取得した。自分は合格だと思う。
- 問題解決(problem-solving)と呼ばれるタイプの思考
- 連絡したい相手に連絡が取れない。さてどうしようかと思う。
- 意思決定(decision-making)と呼ばれるタイプの思考
- ランチに何を食べようかと考える。
また「ABC of 臨床推論:診断エラーを回避する(羊土社)」では、推論を以下の7つに類型化しています。本稿では情報分析の世界で活用されてきた分析手法である競合仮説分析(ACH: Analysis of Cometing Hypotheses)を紹介し、これが各種推論とどう関連しているかを指摘します。その上で本分析ステップ毎の認知科学的意義を述べ、最後にデータサイエンスの応用可能性について考察します。
- 演繹的推論(deductive reasoning)
- 仮説演繹法(hypothetico-deductive reasoning)
- 帰納的推論(inductive reasoning)
- 仮説的推論(abductive reasoning)
- 規則に基づく推論/分類による推論/決定論的推論
- 確率的推論(probabilistic reasoning)
- 因果推論(causal reasoning)
競合仮説分析とは
競合仮説分析は、複数の仮説同士を競わせ、どの仮説が観察結果(インフォメーションや証拠などと呼ばれる)と照らし、最も妥当であるかを導くための情報分析手法の一つです。本分析の実施においては、各過程の認知科学的意義を理解しておくことが重要ですが(ただ手順に従えば良いものではない)、ここではまず手順についてのみ概説します。
北岡元著「ビジネス・インテリジェンス:未来を予想するシナリオ分析の技法」を元にステップを少しだけ整理すると、本分析の流れは以下のようになります。
- マトリクスの作成
- 仮説を生成し行方向ヘッダー部に並べる
- 既にある証拠を列方向インデックス部に並べる
- マトリクスの拡充
- 仮説に関連しそうな証拠を追加(縦方向への拡張)
- 仮説とインフォメーションの突合評価
- 仮説に整合する証拠にはC(Consistent)、
- 仮説に整合しない証拠にはN(Not Consistent)、
- どちらとも言えない証拠には?と記入する。
- マトリクスの見直し
- 新しい仮説の生成を試みる(横方向への拡張)
- 全てに整合する意味のない証拠を削除(行方向の合理化)
- 仮説の削除
- 各種の証拠と不整合の多い仮説を削除(横方向の合理化)
- 仮説の選択
- 最終候補仮説を選択する
- 最終仮説のチェック
- 最終仮説を聞いて心地よいかを確認
競合仮説分析と各種推論
まず、競合仮説分析のステップ5における仮説の削除は、推論類型2の帰納的推論(inductive reasoning)に相当します。ここに特段の説明は不要でしょう。留意点については次節で述べたいと思います。
次に、競合仮説分析のステップ4における仮説の生成(横方向への拡張)は、推論類型4の仮説的推論(abductive reasoning)に相当します。アブダクションとして知られ「証拠に広く整合する新しい仮説を生成する推論」となります。証拠は既に観察された<結果>で、そこから仮説(結果を生じさせている<原因>や<メカニズム>や<相手の意図>)を生成しようとする、つまり、原因から結果ではなく、結果から原因を推論するので、帰納的推論と同様、その推論の結果には常に不確かさが伴います。従って仮説生成後に、当該仮説に矛盾する証拠がないかを改めて批判的に収集することが重要となります。
競合仮説分析の認知科学的意義
インテリジェンスの生産の失敗によって悲惨な事態が引き起こる世界ですから、情報分析官は思い込みや感情や認知バイアスに流されないよう要求されます。従って、彼ら・彼女らが用いる分析メソッドにもそれら要求へのサポートが期待されます。競合仮説分析では、ステップ毎に以下のような点に留意することで感情やバイアスへの対処が可能となります。
- マトリクスの作成
- 可能な限り仮説を出し尽くすことが重要
- これはアンカリング(係留と調整ヒューリスティック)への対処となります。
- 視野の狭窄は、例えば「決定力!正しく選択するための4つのステップ(早川書房)」では、4つの意思決定の罠の一つに挙げられ、これを回避することにもなります。
- マトリクスの拡充
- 後述の悪魔の代弁者として証拠の探索と追加が重要。
- 分析者に都合良い証拠(好みの仮説を支持する証拠)に偏り意識的に追加する事は禁忌。
- これを無意識的に行ってしまうことを確証バイアスと言います。
- 意識的に行うとインテリジェンスの政治化を招きます。
- 分析者は自らに対し悪魔の代弁者にならなくてはいけません。
- 仮説とインフォメーションの突合評価
- 知識や経験不足の分析者だけに突合評価をさせないよう注意する。
- 上記はマネジメントの役割で下記のシステムエラーを予防する。
- 参考:突合評価時の判断エラーの4類型
- 無過失:誰がやっても起きるエラー
- システム:不適切な人員配置等により引き起こされるエラー
- 知識:知識不足で証拠の存在に気付けない(知覚エラー)
- 解釈:経験不足で証拠の解釈に失敗する(思考エラー)
- 初心者と熟練者の突合判断の評価として後述します。
- 参考:分析者個人の判断は知覚→思考→判断/行動と流れる。
- マトリクスの見直し
- 仮説の生成では「証拠を解釈し統合する力」や「同じ証拠を違う視座から見る知覚力」が問われます。これはエンジニアリング能力とは別の能力です。
- 仮説の生成には知識の量が重要です。「知覚力を磨く:絵画を観察するように世界を見る技法(ダイヤモンド社)」など参照下さい。
- 仮説の削除
- 整合していない証拠の数が単に多いものから削除するといった機械処理は避けましょう。
- 一つ一つの証拠の重さを鑑み判断できる人(分析者)を育成・配置しましょう。
- 仮説の選択
- 整合している証拠の数が多いものを単に選ぶといった機械処理は避けましょう。
- 最終仮説のチェック
- 悪魔の代弁者となり、最終仮説にとって不都合な証拠がないか確認しましょう。
- 分析結果が心地良いと感じるを感じましょう。
- もし違和感があれば(時間が許せば)結論を先延ばしにしましょう。
競合仮説分析と悪魔の代弁者
悪魔の代弁者(Devil’s Advocate)は聞いたことがあると思います(参照;ピクサーの「プラッシング」、伝説の経営者スローンに学ぶ「健全な批判」の効果)。批判にされされていないアイディアの有用性には誰もが疑問を抱くはずです。悪魔の代弁者は、上述の通り競合仮説分析のステップ2とステップ7に含めるよう留意します。ただ単に当該分析の手順を踏んでも、この分析の価値が担保されないというのはここにあります。係留と調整ヒューリスティックや確証バイアスを回避するため、有力と思われる仮説と整合しない証拠を意図的に探索しなければ、競合仮説分析はバイアスに塗れその価値を失うからです。
競合仮説分析とトリップ・ワイヤ
トリップ・ワイヤは情報分析手法であるウォー・ゲームやシナリオ分析で紹介される概念です。例えば、競合やマーケット環境の変化を検知すべく仕掛けれたシグナル条件のことで、競合同志が提携するとしたら<どちらかの企業が新しい拠点を物色するだろう>と考え、その動きを監視することをトリップ・ワイヤを仕掛けると言います。
競合仮説分析を行う際、私たちは証拠を適宜追加していく必要がありました。解析事象に対し十分な知識があれば、各仮説を支持(または不支持)することになるであろうトリップ・ワイヤを仕掛け監視することで、仮説の選定に役立てれることができます。ここまで鑑みればデータ収集の意義が理解できると思います。ただ蓄積されたデータがビッグだと言って、その観察データを有り難がって解析するだけがデータサイエンティストではないはずです。
身近な例では、お医者さんが私たち患者に「もし〜という症状が出たら、また来てくださいね」と言うことがあるかと思いますが、あればお医者さんにとっての<トリップ・ワイヤ>で、もし患者が指示通りに来院したら、当初の診断戦略を再考しなければいけないと認識しているのです。同様にして、情報分析官が「〜が観察された(またはされていない)」という証拠を用意できれば、競合仮説分析のマトリクスを効果的に拡充することが可能になるのです。
データサイエンスの活用可能性に関する考察
❶統計モデルの成立または破綻を証拠として取り込む
コロナの実行再生産数の推定において、前週最低気温との温度差などの気候因子が主要な説明変数であることを示した多次元時系列回帰(VAR)の実証分析があります。本稿では、一度確立された数理モデルが破綻しないこと(または破綻するようになること)が、競合仮説分析の一つの証拠になることを指摘したいと思います。本稿では当該モデルが妥当であることを前提として議論を進めます。
例えば、冬から春に向かう中でのコロナ陽性判定社数が低下している局面を考えます。この低下原因を主に温度差とするか、各種の施策効果とするか、陰謀とするかの3つの仮説を競争させるとします。
ここで仮に陰謀だと主張する人がいたとします。競合仮説分析の視点からこの仮説を支持するには、「そのような操作が成されたとすれば、温度差などの気候条件のみで学習されたVARモデルは破綻する」という証拠が得られるはずです。簡単に言えば、これまで現象を説明できていたモデルが使えなくなるということです。このような証拠の提示なく、0.1%か90%かわからない「可能性」を武器に仮説を主張されても議論にならないのです。
単にインフォメーション(Ct値を変えたなど)に反応するのではなく、インテリジェンス(知性)の土俵で議論する際には、このような数理モデルの事前構築やその破綻の監視といったことが証拠になる訳ですから、企業経営においてもこの種のインテリジェンスベースの状況判断ができるようになることは、今後益々重要となるでしょう。
❷トリップ・ワイヤとしての変化点検出
時系列解析の活用にはVAR活用に示された予測(forecast)の他に、異常検知(anomaly detection)や変化点検出(change-point detection)といったタスクが存在します。監視指標の推移に変化があるとか、複数時系列の関係性が過去系列と比して稀な状態にあるといった事を定量的に警告してくれる解析技術です。想定外を常に想定することは難しいですが、もしデータを系統的かつ継続的に(つまり時系列で)観測することができれば、状況の変化について警告を出す解析技術は、比較的手に届きやすくなっています。このような状況変化の有無を証拠として採用するリテラシーを身に付けることで、機械学習やデータサイエンスを通し競合仮説分析を高度化できるのです。
❸人材育成教材としての競合仮説分析
最後に、競争仮説分析自体を使った人材育成と、カッパ係数(Cohen’s kappa coefficient)を利用した初心者と熟練者の判断の一致度の測定について紹介します。
先述の北岡元著「ビジネス・インテリジェンス:未来を予想するシナリオ分析の技法」の最終章に、競合仮説分析のケーススタディがあります。当然、このような演習においても、熟練者が最終的に選択する仮説と初心者が選択する仮説には乖離が生じると考えられます。
人材育成という大きな問題を小さな問題に落とし込むなら、それは一つ一つの小さな判断(仮説の選択)が一致するということですから、競合仮説分析のケーススタディにおける仮説選択の一致度の測定は、ナレッジトランスファーの達成度合いの定量的把握という意味で有用です。また一致度をケーススタディの難易度や種類ごとに計測することも組織の技術伝承状況の把握に役立つでしょう。
❹判断の機械学習化へ
最後に、競合仮説分析のケーススタディの先にある可能性を指摘します。もしケーススタディを自社独自に開発し蓄積できたと仮定します。すると、多くのデータサイエンティストにとって、その判断の機械学習化の検討はかなり進めやすくなっていると言えます。なぜなら、同一の仮説群に対し同様の状況判断が繰り返されるなら、それは教師データになり得ますし、提示される証拠は特徴量エンジニアリングの設計書のようなものだからです。しかし、これは条件を満たせばの話ですから、機械学習化(AI化)を目的に競合仮説分析を行う必要はありません。
関連ライブラリ
- ruptures:変化点検出のためのpythonオープンソースライブラリ