
動画概要 
データサイエンスプロジェクトには大きく4つのプロジェクト類型(リサーチクエスチョンの型)があります。その中の一つが異常検知や退職予測モデルに代表される予測(診断)モデルの開発・評価です。
モデルの評価指標を知っているというだけでは、もちろん実務プロジェクトを計画・運営することはできません。それではどのような視点が必要になるのでしょうか。
本動画では、正解ラベルと呼ばれるデータ種別やモデルの用途にはそれぞれ複数のパターンがあることを指摘し、そのパターン別経路ごとにPoC死に至る背景を解説しています。
参照
・STARD2015に学ぶ 「診断精度の分析」の書き方
https://www.slideshare.net/yoshitaket/stard2015
・診断精度研究のバイアスリスク評価ツールQUADAS-2
https://minds.jcqhc.or.jp/docs/minds/guideline/pdf/Utilization_QUADAS-2.pdf
・不完全な参照基準と診断精度
https://kenkobunka.com/kenbun/kb53/terasawa53.pdf
・医学文献 ユーザーズガイド根拠に基づく診療のマニュアル(第2版)
https://square.umin.ac.jp/massie-tmd/hokuryotemp3.pdf
・診断精度研究の系統的レビューとメタアナリシス
https://iss.ndl.go.jp/books/R000000004-I027320258-00
・Comparative accuracy: assessing new tests against existing diagnostic pathways
https://www.researchgate.net/publication/7104852_Comparative_accuracy_Assessing_new_tests_against_existing_diagnostic_pathways
・Diagnostic test evaluation methodology: A systematic review of methods employed to evaluate diagnostic tests in the absence of gold standard – An update
https://www.ncbi.nlm.nih.gov/pmc/articles/PMC6788703/