自動制御工学の分野で、確率的な振る舞いをするものを自動制御する「確率制御」の研究をしています。「確率的動特性をもつ離散時間系」を数学的対象として、その系に目的の動作をさせることを可能にする数式を導きました。また,そのような数理モデルをベースにしながら,確率統計のデータも活用し、未知の部分をデータから分布で補完して、制御の可変部分に反映する方法も提案しています。この研究の過程で、これまでの確率制御に関する理論の統一をはかることに成功しています。
この理論と技術を用いた自動車の遠隔型自動運転などについて、メーカーと産業応用に向けた共同研究を進めています。自動制御に関する既存の理論や技術の限界を、確率統計情報の活用により突破し、技術的課題を解決することを目指しています。
人間よりも大きなものを制御するというところに魅力を感じ、自動制御に関心をもちました。
当初は、自動制御を実現する制御理論の中でも従来からあるロバスト制御について研究していました。これは、制御対象のモデルに未知パラメータがある場合に,その範囲を指定して制御の性能を保障するというものです。しかし、範囲に対して最悪の性能を保障するため、範囲を広くしていくと正しい可能性が高そうなパラメータに対して性能が落ちてしまうという問題があります。そこで、範囲全体に分布をとることで可能性の高いところの性能を高めることができる「確率制御」に着目し、現在は研究を行っています。その過程で、これまでのさまざまな確率制御理論を統一する数式を発見することができました。
機械学習はデータをもとに学習をしていく手法ですが、これに確率制御もとりいれて融合することで将来的にさまざまな課題解決に貢献したいと考えています。
機械学習の中でも強化学習では、一定期間の観測をもとに方策を更新して学習するため、制御対象に関する何らかの特性の変化が例えば50msec程度のタイムスケールで起きたときに,その変化にすぐには適応できないという課題があります。これでは、自動運転を例にとると路面の状態が逐一変わるような状況にはそのまま用いることができません。制御工学と機械学習の双方の強みを活かし,従来の手法単独では解決できない課題に挑戦を続けたいです。
この研究が従来の制御工学と異なるのは、データから逐次学習するという点です。そのため、データを扱う専門家の方々とさらに連携していきたいと考えています。確率変数をもち分布で補完する制御の枠組みでは、得られる観測データによって逐次で分布が変わっていきます。そのような分布をデータからどのように構築するかなどについて、専門家からみた視点を得ながら研究を進めたいと考えています。
実装についても、異なる分野の方々との連携が必要です。自動運転のほかにも、また製品ではなくアルゴリズムでも、確率的な振る舞いをしているものは沢山あります。制御の性能を上げたい方がいれば、数式をつくる部分で貢献をし、新しいアイディアが生まれることを期待しています。