ブログ

(最終更新日:2019年11月6日)

はじめに

【第10話】技術の深さと高さ:深さに支えられた高さのみがアイデアを生むで非エンジニアの方も技術系論文や技術誌でインプットしましょうと提案したので、今回はその読み方の例として、日経ロボティクス (2019年10月号)の巻頭記事(Sexy Technology )にある『古野電気による強化学習活用事例』を取り上げたいと思います。技術を深める技術解析は、またどこかで準備できれば紹介したいと思います。

事例概要

  • タイトル:古野電気が船舶向け自動運転を強化学習で実現
  • サブタイトル:ガウス過程でダイナミクス自動獲得、実機学習可能に
  • 掲載雑誌:日経ロボティクス(2019年10月)
  • Point1:強化学習を用いたプレジャーボート向け自動運転技術の開発
  • Point2:海上目標位置への自動移動と指定位置に留まる定点制御の開発
  • Point3:制御器の学習は実機側で実現

タイトルからわかるように、入口(活用技術)は強化学習と制御、出口(活用領域)が自動運転の事例です。入口側でいくと深層学習との組み合わせがホットですが、採用技術はガウス過程となっていて、その点が実機学習可能という出口の特徴につながっています。タイトルからこの程度の技術的つながりがわかるように技術解像度を高めておくと良いです。それでは本事例について少し深掘りして見ていきましょう。

新規性

  • 船の進む向きを決めるステアリング操作機能の自動運転は2014年以前に製品化済み
  • 今回技術はステアリングだけではなくエンジンスロットル操作まで含めた自動運転技術
  • 機械学習アルゴリズムの一つであるガウス過程と制御工学で実績のあるModl Predictive Controlを組み合わせた独自技術SPMPCの提案

【参考】モデル予測制御:https://jp.mathworks.com/videos/introduction-to-model-predictive-control-mpc-part-1-1494946684184.html

ステアリング操作のみであればガウス過程も強化学習も必要なかったが、制御対象のパラメータにエンジンスロットルが加わったことで(制御対象の自由度がましたため)、従来技術を超えた技術開発の必要性が生じたでろう点にまず注目したいです。制御パラメータの数やその内容によって採用技術は変わる訳ですから、他社事例をいくら表面的に収集しても、そこから普遍的な何かであったり、技術的アイディアが得られることは無いでしょう。

ここでは自由度の『内容』についても触れておきます。具体的には、プレジャーボートの場合、船の真横に力を作用させる選択肢がないという点です。もし、そのような力を直接制御させることができれば、定点制御はより簡単にできる訳ですから、制御ロジックを強化学習に委ねることは無かったと推察されます。また裏を返せば、高度な技術に飛び付く前に、もっと直接的な解決策を採用できないかと問うことが重要だと気付けます。船の真横に力を作用させる構造を持たせるとなぜ駄目なのか。これは業界の人には自明でしょうが、業界外の人間がこういう素朴な疑問を持つことは大切ではないでしょうか。

最後に、新規性に関連し指摘したいのは、この技術開発のスタートは確実にマーケットニーズにあったと思われるです。プレジャーボートの用途である『釣り』を想定した場合、魚群探知機の反応する場所に自動で移動したい、到着したらそこに留まりたいというニーズはとても理解しやすいです。マーケットニーズ起点の開発は組織の理解を得やすいですし、技術者も難課題への挑戦意欲が湧きやすいでしょう

有用性

  • 目標位置への自動移動の実現
  • 指定位置での定点制御の実現
  • ユーザー保有の船に合わせた制御器の学習を実機で実現
  • メーカーの船や機種は不問

定点制御と強化学習

定点制御は船の操縦に熟練した人でなければ難しいようです。私も友人が定点制御を頑張っている様子を見たことがありますが、やはり面倒そうでした(彼は楽しんでいましたが)。一般論として、熟練者(人間)は高度な判断や行動はできますが(素晴らしいことですが)、その背景のロジックを(他者にも自分にも)うまく説明できないことが多いです。こういうケース、つまり、行動できるけど説明できないというケースの行動ロジックの獲得が、強化学習には期待されています。また本ケースでは制御対象のパラメータが2と比較的少なかったです。これも取り組みのステップとしては重要だと思います。何が制御パラメータかさへ記述できないような問題から取り組むのはとても悪手ですから避けましょう。

説明可能性へのユーザーの関心

また本事例は、制御を機械が上手くやってくれればよく、最終ユーザーは細かい制御ロジックには興味がないという点も有用性を支える重要な点だと思います。技術詳細は省きますが、深層学習ではなくガウス過程にした方が良いかもしれないと考えた理由や、どこまでの処理をガウス過程にやらせ、どこからを従来制御手法のMPCに委ねるかといった判断について、ユーザーは理解する必要もありませんし興味もないでしょう。おそらくユーザーにとっては安全・安心な制御であるとメーカーが保証し、万一の時にはきちんと責任を取ってくれることだけが重要だと思います。このように技術適用の最終利用ユーザーにとってロジックはどうでも良いという状況はAI技術導入の一つのポイントとなるでしょう。

信頼性

  • SPMPCはMPCでの将来予測にガウス過程を用いたものである
  • SPMPCはケンブリッジ大学で先行開発されたPILCOの軽量版である
  • 実機を使った市場投入前の検証ノウハウ

まず前提として、フィードバック制御手法であるMPCは、その汎用性、制約遵守性、最適性などの認められた実績豊富な信頼性の高い技術アプローチだということです。そして、SPMPCはその予測器(ここでは水流に対する時系列位置情報の推移のダイナミクスの予測)にガウス過程を採用している訳ですから、比較的保守的な設計になっていると感じられます。

引用元雑誌では(論文ではないので)掲載されてませんが、従来MPCの範疇だけに留めた場合との制御性能の比較実験をすれば、新手法の性能評価はしやすかったと想像します。また、SPMPC(ダイナミクスはガウス過程で方策はMPC)は先行研究のPILCO(ダイナミクス予測も方策もガウス過程)の軽量版であることから、こちらの性能比較実験も比較的行いやすかったと推察されます。このように従来の代表的手法や先行研究との比較ポイントが十分に絞られた研究の信頼性は高く保ちやすいことが想像できます。あなた(ビジネスサイド)の技術バックグラウンドの弱さが、現場に無理に新しい知識や理論を鍋の具材のようにただ投入するだけのプロジェクトを強いていないでしょうか。新規技術の開発やその検証は、地道な先行研究調査と伝統的手法との比較から意味をもつことに留意ください。

最後に、信頼性に関連し指摘したいのは、市場投入前の安全性検証のノウハウについてです。先の段落の『信頼性』はあくまで論文における信頼性であり、市場が要求する安心・安全ではありません。最終的なユーザーが要求する意味での『信頼性』をどのように確保するか。このようなノウハウが古野電気には既存製品の上市経験からあったと予想されます。AI系プロジェクトのPoC死がまだ多いのは技術的評価とマーケット評価の質の違いを軽んじる風潮にあると思っています。今回技術検証ではそのような甘さは無かったのだと思います。

まとめ

さて、いかがだったでしょうか。今回事例研究では技術的深さよりも高さにフォーカスし考察を行いました。強化学習の流れ、モデルベース学習とモデルフリー学習の違いや種類、ガウス過程の特徴、MPCについての詳細は触れていません。それでもある程度の技術背景考察はできるのだと感じてもらえたのではないでしょうか。

技術部門は要素技術の理論・実装の両面からその能力を高めることが要求されていますが、同時に、経営チームは技術アイディアで事業をリードする技術リーダーシップを高めることが期待されています。技術を深掘りするためではなく、技術活用視座を高めるために技術系雑誌や論文を読む。そこに組織や技術者の成長ストーリーを読み解く。そんなコーヒータイムを取り入れてもいいのではないでしょうか。経営層の技術リーダーシップが低ければ、AI人材の採用も育成も退職防止できまないのですから。

技術リーダーシップに興味のある方へ

以下の参考図書に技術リダーシップ(MOIモデル)についての記述があります。上記雑誌をMOI視点からまとめていくというのも技術リーダーシップ養成に役立つと考えます。興味あれば社内教育に反映させてはいかがでしょうか。

AI系人材育成に興味のある方へ

弊社コンタクトフォームからお問い合わせ下さい。

サービス提供までの基本的な流れは、以下をご確認下さい。

コメントは利用できません。