後半のテーマ「データドリフト」について資料化を進める。モデル性能に影響を与える訓練時と推論時のデータ特性の予期せぬ変化がデータドリフトだ。どれだけモデルの評価を過去データで積み重ねても、MLモデルの性能監視が要求されるのはこの為だ。より一般的に言えば、制御できない環境からサンプリングされたデータを用い、帰納的にモデルパラメータを推定している以上、どれだけ大規模データで学習しようと環境が変化したら使えなくなるのは当然のように感じられるだろう。しかしこの変化を察知し堅牢なモデルへと修正する方法論となるとそれは難しい技術課題となる。データドリフトの厄介な点は、❶概念理解までの簡単さに比してその解決が難しいこと、❷IT全般に通じるが保守運用に相当する性能監視は予算・要員・時間の確保への理解を得にくいこともありそうだ。組織的対応ができる企業は少ないだろう。

コメントは利用できません。