
本題の前に前回投稿への解答を掲載します。相関係数、相関関係、因果関係についての概念確認にお役立て下さい。今回はこの基本概念の理解を前提にデータサイエンス部門の仕事について整理したいと思います。
DS部門が扱う4つのBQと3つのCapability
今回内容は私が企業に属しているときのDS部門マネジメントの際に、人材獲得や育成予算配分を考えるときのフレームを言語化したものです。皆様のDS部門マネジメントの一助となれば嬉しいです。さてそれでは本題ですが、私たちデータサイエンス部門が扱うビジネスクエスチョンは以下の4つです。
- ビジネスクエスチョン❶:そもそも現状ってどうなってるの?(現状把握)
- ビジネスクエスチョン❷:これって上手くいってるの?(効果測定)
- ビジネスクエスチョン❸:なんでこれは上手くいってる(いない)の?(因果解明)
- ビジネスクエスチョン❹:君ならどうする?(予測など人間思考の要素タスクのモデル化)
そしてこれらに対応するために必要なケイパビリティは以下の3つとなります。
- ケイパビリティ❶:ビジネス・インテリジェンス(BI)の機能提供を支える能力(BQ1)
- ケイパビリティ❷:因果推論(効果測定)と因果解明を支える能力(BQ2/3)
- ケイパビリティ❸:機械学習や数理最適化などを遂行するための能力(BQ4)
必要な人材
BQ1の対応にはBI基幹機能の提供能力が必要です。具体的には、KPI定義や創造、データ蓄積、加工、配布の能力です。特に配布にはコミュニケーション力等のソフトスキルが要求されます。ここにIT部門メインでBQ1をやる難しさがあります(IT部門にソフトスキルが無いと言っているのではなく、意思決定に関する情報配布に要するソフトスキルは別競技という意味です)。他部門(EnablerのIT部門と社内顧客の事業部門)との協力体制構築の難しさを知る人がBQ1対応に必要です。BI部門での職務経験は良いシグナルです。
BQ2とBQ3の対応には計量経済学的な実証分析を手掛けてきた人材が必要です。重回帰分析、BLUE、残差診断、DAG、交絡因子、媒介因子、パネル分析、固有効果、固定効果などの概念が細胞に染み付いていることに加え、RCTやA/Bテストが盛んな企業での実務経験が良いシグナルです。ただし実験が盛んな企業に「だけ」いた人の場合、あなたの組織で失敗という貴重な経験を積むことになるかもしれません。BQ2は単なる技術課題ではなく適応課題でもあるからです。
BQ4の予測や診断や推奨や生成などの人間思考の要素タスクのモデル化ですが、ここには機械学習関連能力が役立ちます。通常、BQ4が得意な人とBQ2/3ができる人は違いますし、BQ1が得意な人もまた違います。BQ1ができる人とBQ2/3ができる人も違います。なのでこれら能力を組織に組み込むには、それぞれの領域でのチームリーダークラスを段階的に揃えていくしかありません。順番はBQ1、次にBQ2、BQ2途中からBQ4です。BQ3は科学的思考を土台とした知的好奇心がドライバーになるので、BQ1/2/4の人材のシナジーと競争が進む中で新たに採用しても良いですし育成しても良いと思います。
組織マネジメント
さてデータサイエンス部門の成果が歪な場合、それはいずれかの能力に尖った人物の影響力が強すぎるからかもしれません。人は自分の専門能力を過大評価しその他を過小評価します。これは書いている私自身もそうです。どんなに謙虚になろうとしてもバイアスは消せません。
最後に付け加えるならそれは社内キャリアパスの設計です(特にキャリアの頂上)。BQ2/3は科学研究と同根であること、BQ4を支える機械学習は今後も広く科学技術分野から注目されるであろうことから、現状ライフサイエンス系企業以外ではあまり使われていないようですが、私はCSO(Chief Scientific Officer)がしっくりくる設計だと思います。今回は以上です。