展示中
SEED
78

確率制御の統一理論で、数理モデルとデータを使って自動制御の課題を解決したい!

RESEARCHER
本研究で扱っている制御対象の数理モデル「確率的動特性をもつ離散時間系」。モデル自身に確率変数が入っていることが特徴である。このランダムで変動する部分が、どのようなものでも扱える。

Lorem ipsum dolor sit amet, consectetur adipiscing elit. Suspendisse varius enim in eros elementum tristique. Duis cursus, mi quis viverra ornare, eros dolor interdum nulla, ut commodo diam libero vitae erat. Aenean faucibus nibh et justo cursus id rutrum lorem imperdiet. Nunc ut sem vitae risus tristique posuere.

確率制御の分野では、範囲を指定して制御の性能を保証するロバスト制御と、範囲全体に分布をとる確率制御がある。自動制御では、システムが複雑化すると未知パラメータが各所に生じるようになってその範囲を広くとらざるを得ない。ロバスト制御で最悪性能を保証しようとすると、最尤値に対する性能を諦めることになり、最も可能性が高いところの性能が落ちてしまう。分布がわかっている場合には確率制御を考えることでこの問題を回避できる。

Lorem ipsum dolor sit amet, consectetur adipiscing elit. Suspendisse varius enim in eros elementum tristique. Duis cursus, mi quis viverra ornare, eros dolor interdum nulla, ut commodo diam libero vitae erat. Aenean faucibus nibh et justo cursus id rutrum lorem imperdiet. Nunc ut sem vitae risus tristique posuere.

一般に制御工学においてはまず安定性と呼ばれる性質を保証することが基本となる。この安定性を前述の確率系に対して必要十分の意味で特徴づけるリアプノフ不等式の導出に成功した。これにより遠隔型自動運転などで経路追従特性に理論保証を与えることが可能になっている。

Lorem ipsum dolor sit amet, consectetur adipiscing elit. Suspendisse varius enim in eros elementum tristique. Duis cursus, mi quis viverra ornare, eros dolor interdum nulla, ut commodo diam libero vitae erat. Aenean faucibus nibh et justo cursus id rutrum lorem imperdiet. Nunc ut sem vitae risus tristique posuere.

確率制御理論の変遷。本研究の過程で、従来から扱われている白色雑音や有限モードマルコフ連鎖に依存する確率系だけでなく、出力分布が任意の隠れマルコフモデルやマルチンゲールなどに依存するような新たなクラスの確率系も統一的に議論の対象とすることが可能になった。

Lorem ipsum dolor sit amet, consectetur adipiscing elit. Suspendisse varius enim in eros elementum tristique. Duis cursus, mi quis viverra ornare, eros dolor interdum nulla, ut commodo diam libero vitae erat. Aenean faucibus nibh et justo cursus id rutrum lorem imperdiet. Nunc ut sem vitae risus tristique posuere.

各モードでの出力が離散・連続を問わず任意に設定できる出力分布に従う隠れマルコフモデル。内部でモードが確率的に切り替わりながら出力分布が決まっていく。

Lorem ipsum dolor sit amet, consectetur adipiscing elit. Suspendisse varius enim in eros elementum tristique. Duis cursus, mi quis viverra ornare, eros dolor interdum nulla, ut commodo diam libero vitae erat. Aenean faucibus nibh et justo cursus id rutrum lorem imperdiet. Nunc ut sem vitae risus tristique posuere.

マルチンゲールでは、前の時刻での実現値が次の時刻での分布における平均値になる。このような規則に従うパラメータの逐次推定と相性がよいことが期待される。マルチンゲールはウィーナー過程を包含しており,経済学や物理学などでランダム性のモデルとして用いられる。

Lorem ipsum dolor sit amet, consectetur adipiscing elit. Suspendisse varius enim in eros elementum tristique. Duis cursus, mi quis viverra ornare, eros dolor interdum nulla, ut commodo diam libero vitae erat. Aenean faucibus nibh et justo cursus id rutrum lorem imperdiet. Nunc ut sem vitae risus tristique posuere.

自動車の自動運転について、メーカーと産業応用に向けた共同研究を進めている。実験では、GPSによる位置情報を利用して、サーバ上でハンドルやアクセルへの指令値を計算して戻し、決められた経路に自動車が沿って運行するように制御する。 このような制御をモデルフリーの機械学習のみで行おうとすると、想定外のことが起きたときの要因の特定が難しい。確率制御理論を用いることで性能を理論保証できる他、制御器も実装が容易なものになる。

Lorem ipsum dolor sit amet, consectetur adipiscing elit. Suspendisse varius enim in eros elementum tristique. Duis cursus, mi quis viverra ornare, eros dolor interdum nulla, ut commodo diam libero vitae erat. Aenean faucibus nibh et justo cursus id rutrum lorem imperdiet. Nunc ut sem vitae risus tristique posuere.

自動制御とは、目的に適合するように、対象に所要の操作を加えることを自動的に行わせることである。様々な対象の自動制御化が望まれているが課題は山積している。開発した理論や技術によって技術的課題の解決に貢献していきたい。

Lorem ipsum dolor sit amet, consectetur adipiscing elit. Suspendisse varius enim in eros elementum tristique. Duis cursus, mi quis viverra ornare, eros dolor interdum nulla, ut commodo diam libero vitae erat. Aenean faucibus nibh et justo cursus id rutrum lorem imperdiet. Nunc ut sem vitae risus tristique posuere.

遠隔で自動車を制御する時には遅延が起こる。また、データを送る際にもパケットごとに遅延が起きるため、時間によってデータのばらつきも変わってしまう。こうしたことを考慮しないモデルを用いると、大雑把な自動制御しかできないことが課題であった。 本研究では、事前に通信遅延を測って分布を作成し、その分布の情報も使って制御器と呼ばれるアルゴリズムを作り、それにより自動車を制御している。 現在、リアルタイムで取得したデータを逐次反映するところまで、制御アルゴリズムの高度化を目指している。

Lorem ipsum dolor sit amet, consectetur adipiscing elit. Suspendisse varius enim in eros elementum tristique. Duis cursus, mi quis viverra ornare, eros dolor interdum nulla, ut commodo diam libero vitae erat. Aenean faucibus nibh et justo cursus id rutrum lorem imperdiet. Nunc ut sem vitae risus tristique posuere.

アルゴリズムは遠隔地にあるPCで動かし、インターネット経由で車にハンドルやアクセルの指令値を送る。通信遅延が最大でどれくらい生じるかは事前にはわからないため、例えば無限に大きくなりうると考えて従来の「ロバスト制御」で対応しようとすると、そもそも制御器が存在しなくなってしまい自動制御できなくなる。「確率制御」では、大きな値は小さな確率でしか出ないという分布を考え、計測したデータをもとに構成し、そのような問題を回避している。

Lorem ipsum dolor sit amet, consectetur adipiscing elit. Suspendisse varius enim in eros elementum tristique. Duis cursus, mi quis viverra ornare, eros dolor interdum nulla, ut commodo diam libero vitae erat. Aenean faucibus nibh et justo cursus id rutrum lorem imperdiet. Nunc ut sem vitae risus tristique posuere.

No items found.
どんなタネ?

自動制御工学の分野で、確率的な振る舞いをするものを自動制御する「確率制御」の研究をしています。「確率的動特性をもつ離散時間系」を数学的対象として、その系に目的の動作をさせることを可能にする数式を導きました。また,そのような数理モデルをベースにしながら,確率統計のデータも活用し、未知の部分をデータから分布で補完して、制御の可変部分に反映する方法も提案しています。この研究の過程で、これまでの確率制御に関する理論の統一をはかることに成功しています。

この理論と技術を用いた自動車の遠隔型自動運転などについて、メーカーと産業応用に向けた共同研究を進めています。自動制御に関する既存の理論や技術の限界を、確率統計情報の活用により突破し、技術的課題を解決することを目指しています。

なぜ研究を始めた?

人間よりも大きなものを制御するというところに魅力を感じ、自動制御に関心をもちました。

当初は、自動制御を実現する制御理論の中でも従来からあるロバスト制御について研究していました。これは、制御対象のモデルに未知パラメータがある場合に,その範囲を指定して制御の性能を保障するというものです。しかし、範囲に対して最悪の性能を保障するため、範囲を広くしていくと正しい可能性が高そうなパラメータに対して性能が落ちてしまうという問題があります。そこで、範囲全体に分布をとることで可能性の高いところの性能を高めることができる「確率制御」に着目し、現在は研究を行っています。その過程で、これまでのさまざまな確率制御理論を統一する数式を発見することができました。

なにを変える?

機械学習はデータをもとに学習をしていく手法ですが、これに確率制御もとりいれて融合することで将来的にさまざまな課題解決に貢献したいと考えています。

機械学習の中でも強化学習では、一定期間の観測をもとに方策を更新して学習するため、制御対象に関する何らかの特性の変化が例えば50msec程度のタイムスケールで起きたときに,その変化にすぐには適応できないという課題があります。これでは、自動運転を例にとると路面の状態が逐一変わるような状況にはそのまま用いることができません。制御工学と機械学習の双方の強みを活かし,従来の手法単独では解決できない課題に挑戦を続けたいです。

なにが必要?

この研究が従来の制御工学と異なるのは、データから逐次学習するという点です。そのため、データを扱う専門家の方々とさらに連携していきたいと考えています。確率変数をもち分布で補完する制御の枠組みでは、得られる観測データによって逐次で分布が変わっていきます。そのような分布をデータからどのように構築するかなどについて、専門家からみた視点を得ながら研究を進めたいと考えています。

実装についても、異なる分野の方々との連携が必要です。自動運転のほかにも、また製品ではなくアルゴリズムでも、確率的な振る舞いをしているものは沢山あります。制御の性能を上げたい方がいれば、数式をつくる部分で貢献をし、新しいアイディアが生まれることを期待しています。

VIDEO MATERIAL
導いた確率制御理論を応用した遠隔型自動運転の実験風景(三菱電機株式会社との共同研究)。通信時に生じる通信遅延の確率分布を考慮して遠隔地からアルゴリズムで自動運転している。
研究についてのコメントを残しましょう!
コメントを書く
OTHER SEEDS

その他のタネ