(19)【発行国】日本国特許庁(JP)
(12)【公報種別】公開特許公報(A)
(11)【公開番号】P2024157832
(43)【公開日】2024-11-08
(54)【発明の名称】制御装置の設計方法および移動体の製造方法
(51)【国際特許分類】
G05D 1/43 20240101AFI20241031BHJP
G05B 11/36 20060101ALI20241031BHJP
【FI】
G05D1/02 H
G05B11/36 G
【審査請求】未請求
【請求項の数】7
【出願形態】OL
(21)【出願番号】P 2023072434
(22)【出願日】2023-04-26
(71)【出願人】
【識別番号】000006208
【氏名又は名称】三菱重工業株式会社
(74)【代理人】
【識別番号】100149548
【弁理士】
【氏名又は名称】松沼 泰史
(74)【代理人】
【識別番号】100162868
【弁理士】
【氏名又は名称】伊藤 英輔
(74)【代理人】
【識別番号】100161702
【弁理士】
【氏名又は名称】橋本 宏之
(74)【代理人】
【識別番号】100189348
【弁理士】
【氏名又は名称】古都 智
(74)【代理人】
【識別番号】100196689
【弁理士】
【氏名又は名称】鎌田 康一郎
(72)【発明者】
【氏名】菊池 惟子
(72)【発明者】
【氏名】村田 直史
(72)【発明者】
【氏名】安達 丈泰
【テーマコード(参考)】
5H004
5H301
【Fターム(参考)】
5H004GA14
5H004GA30
5H004GB11
5H004HA07
5H004HA08
5H004HB07
5H004HB08
5H004JB22
5H004JB24
5H004KB02
5H004KB04
5H004KB06
5H004KC32
5H004KC33
5H301AA01
5H301AA06
5H301AA10
5H301BB14
5H301BB20
5H301CC03
5H301CC04
5H301CC06
5H301CC07
5H301CC10
5H301DD01
5H301DD07
5H301DD15
5H301GG07
5H301GG19
5H301KK08
5H301LL03
5H301LL06
(57)【要約】
【課題】1機のリーダである移動体と、リーダに追従する1機以上のフォロワである移動体からなる移動体群において、フォロワが他の移動体のすべての状態量を観測できない場合であっても、フォロワをリーダに追従させることができる制御装置の設計方法を提供する。
【解決手段】制御装置の設計方法は、オブザーバおよびフィードバック制御器を備える制御装置の設計方法であって、前記オブザーバの極の実部がすべて虚軸から負側に所定値だけ離れるように制約する線形行列不等式、および、前記オブザーバのH
∞ノルムを最小化するように制約する線形行列不等式の両方を満たすオブザーバゲインを設計するステップと、前記フォロワそれぞれの設計した前記オブザーバを含む閉ループ系全体の安定を保証しつつ、追従制御性能を向上させるためのフィードバックゲインを線形行列不等式を用いて設計するステップとを有する。
【選択図】
図5
【特許請求の範囲】
【請求項1】
リーダである1機の移動体と、前記リーダに追従する1機以上のフォロワである移動体からなる移動体群における前記フォロワの制御装置の設計方法であって、
前記フォロワの前記制御装置は、
前記リーダおよび他のフォロワのうち少なくとも1機である隣接エージェントと自機との相対位置と、オブザーバゲインとに基づいて、前記隣接エージェントとの状態量相対値を推定するオブザーバと、
前記状態量相対値の推定値と、フィードバックゲインとに基づいて、自機が前記リーダに追従するための制御入力を出力するフィードバック制御器と、
を備え、
前記制御装置の設計方法は、前記オブザーバの極の実部がすべて虚軸から負側に所定値だけ離れるように制約する線形行列不等式、および、前記オブザーバのH∞ノルムを最小化するように制約する線形行列不等式の両方を満たすオブザーバゲインを設計するステップと、前記フォロワそれぞれの設計した前記オブザーバおよび前記フィードバック制御器を含む閉ループ系全体の安定を保証しつつ、前記リーダへの追従制御性能を向上させるためのフィードバックゲインを線形行列不等式を用いて設計するステップとを有する、
制御装置の設計方法。
【請求項2】
前記オブザーバゲインを設計するステップは、指定された範囲内でオブザーバの収束速度を決める前記所定値を変化させながら前記オブザーバゲインの設計を繰り返し実行し、前記収束速度が予め設定された速度以下となるように、前記所定値を決定する、
請求項1に記載の制御装置の設計方法。
【請求項3】
前記閉ループ系の極の実部がすべて負である間、フィードバックゲインの大きさの上限値を漸増させながら、前記閉ループ系を安定させるように制約する線形行列不等式、および前記フィードバックゲインの大きさが前記上限値以下となるように制約する線形行列不等式の両方を満たすフィードバックゲインを設計するステップをさらに有する、
請求項1に記載の制御装置の設計方法。
【請求項4】
前記隣接エージェントとの相対位置に基づいて、自機の目標位置に対する定常偏差を低減する補正値を出力する積分器を追加するステップをさらに有する、
請求項3に記載の制御装置の設計方法。
【請求項5】
前記オブザーバゲインを設計するステップは、指定された複数の速力に対応する複数のオブザーバゲインを設計する、
請求項1に記載の制御装置の設計方法。
【請求項6】
前記フィードバックゲインを設計するステップは、指定された複数の速力に対応する複数のフィードバックゲインを設計する、
請求項3に記載の制御装置の設計方法。
【請求項7】
リーダである1機の移動体と、前記リーダに追従する1機以上のフォロワである移動体からなる移動体群における、前記フォロワである移動体の製造方法であって、
請求項1から6のいずれか一項に記載の制御装置の設計方法で設計されたゲインに基づいて、前記制御装置を製造する工程を有する、
移動体の製造方法。
【発明の詳細な説明】
【技術分野】
【0001】
本開示は、制御装置の設計方法および移動体の製造方法に関する。
【背景技術】
【0002】
特許文献1には、複数の移動体(エージェント)が互いの位置を認識しながら、各移動体が自律分散的に監視領域内のリスクが高い地点それぞれに向かって移動する分散制御システムが記載されている。
【0003】
なお、特許文献1に記載の技術では、各エージェントが収束する合意値は時不変である。また、特許文献1に記載の技術では、移動体の運動特性が考慮されていない。したがって、特許文献1に記載の技術では、1機のリーダである移動体に他のフォロワである移動体が追従するマルチエージェントシステムにおいて、動的に状態が変化するリーダに追従するように各フォロワを制御することは困難である。
【0004】
図17は、従来のフォロワの機能構成を示すブロック図である。
非特許文献1には、線形のマルチエージェントシステムにおけるリーダ・フォロワ制御手法が提案されている。
図17に示すように、各フォロワは通信可能なリーダまたはフォロワ(あるフォロワiに情報を伝達する1機以上のエージェント。以下、「隣接エージェント」とも記載する。)の全状態量x
j(たとえば、位置、速度、姿勢角、姿勢角速度など)を知ることができる場合、自機の状態量x
iと隣接エージェントの状態量x
jとの相対値をフィードバックすることで、自機をリーダに追従させるリーダ・フォロワ制御を行う。ここで、制御対象であるフォロワの機体のダイナミクスは式(1)、機体への制御入力u
iは式(2)で表される。
【0005】
【0006】
【0007】
また、非特許文献1には、システムの安定性が高くなるようにフィードバックゲインKを決定するための手法が記載されている。
【先行技術文献】
【特許文献】
【0008】
【非特許文献】
【0009】
【非特許文献1】Weijun Cao, et. al., "Leader-follower consensus of linear multi-agent systems with unknown external disturbances", System & Control Letters, Vol. 82, pp. 64-70, 2015
【発明の概要】
【発明が解決しようとする課題】
【0010】
たとえば水中で運用するUUVのように、通信が制限される(通信量が制限される、通信遅延や通信途絶などが発生する)場合がある。このように、通信が制限される条件下では、隣接エージェントから通信で取得する情報を最小限にする、無線通信を用いずにセンサ(カメラやレーザスキャナなど)により隣接エージェントの状態量を取得するなどの対策を行う必要がある。
【0011】
しかしながら、従来の技術では、各フォロワは隣接エージェントのすべての状態量xjを取得可能であることが前提となっている。そうすると、従来の技術では、通信が制限される条件下では隣接エージェントのすべての状態量xjを取得することができず、リーダ・フォロワ制御を行うことが困難となる。
【0012】
本開示の目的は、1機のリーダである移動体と、リーダに追従する1機以上のフォロワである移動体からなる移動体群において、フォロワが他の移動体のすべての状態量を観測できない場合であっても、フォロワをリーダに追従させることができる制御装置の設計方法および移動体の製造方法を提供することにある。
【課題を解決するための手段】
【0013】
本開示の一態様によれば、制御装置の設計方法は、リーダである1機の移動体と、前記リーダに追従する1機以上のフォロワである移動体からなる移動体群における前記フォロワの制御装置の設計方法であって、前記フォロワの前記制御装置は、前記リーダおよび他のフォロワのうち少なくとも1機である隣接エージェントと自機との相対位置と、オブザーバゲインとに基づいて、前記隣接エージェントとの状態量相対値を推定するオブザーバと、前記状態量相対値の推定値と、フィードバックゲインとに基づいて、自機が前記リーダに追従するための制御入力を出力するフィードバック制御器と、を備え、前記制御装置の設計方法は、前記オブザーバの極の実部がすべて虚軸から負側に所定値だけ離れるように制約する線形行列不等式、および、前記オブザーバのH∞ノルムを最小化するように制約する線形行列不等式の両方を満たすオブザーバゲインを設計するステップと、前記フォロワそれぞれの設計した前記オブザーバおよび前記フィードバック制御器を含む閉ループ系全体の安定を保証しつつ、前記リーダへの追従制御性能を向上させるためのフィードバックゲインを線形行列不等式を用いて設計するステップとを有する。
【0014】
本開示の一態様によれば、移動体の製造方法は、リーダである1機の移動体と、前記リーダに追従する1機以上のフォロワである移動体からなる移動体群における、前記フォロワである移動体の製造方法であって、上述の制御装置の設計方法で設計されたゲインに基づいて、前記制御装置を製造する工程を有する。
【発明の効果】
【0015】
上記態様によれば、1機のリーダである移動体と、リーダに追従する1機以上のフォロワである移動体からなる移動体群において、フォロワが他の移動体のすべての状態量を観測できない場合であっても、フォロワをリーダに追従させることができる。
【図面の簡単な説明】
【0016】
【
図1】第1の実施形態に係る移動体群の概略を示す図である。
【
図2】第1の実施形態に係るフォロワの機能構成を示すブロック図である。
【
図3】第1の実施形態に係るネットワーク構造の例を示す第1の図である。
【
図4】第1の実施形態に係るネットワーク構造の例を示す第2の図である。
【
図5】第1の実施形態に係る制御装置の設計方法の流れを示すフローチャートである。
【
図6】第1の実施形態に係るシミュレーション結果を示す図である。
【
図7】第2の実施形態に係るフォロワの機能構成を示すブロック図である。
【
図8】第2の実施形態に係る制御装置の設計方法の流れを示すフローチャートである。
【
図9】第3の実施形態に係る制御装置の設計方法の流れを示すフローチャートである。
【
図10】第3の実施形態に係るフィードバックゲインの設計例を示す図である。
【
図11】第4の実施形態に係るネットワーク構造の例を示す第1の図である。
【
図12】第4の実施形態に係るネットワーク構造の例を示す第2の図である。
【
図13】第4の実施形態に係るシミュレーションを説明するための図である。
【
図14】第4の実施形態に係るシミュレーション結果を示す図である。
【
図15】第4の実施形態の変形例に係る制御装置の設計方法の流れを示すフローチャートである。
【
図16】少なくとも1つの実施形態に係る移動体の制御装置のハードウェア構成を示す概略ブロック図である。
【
図17】従来のフォロワの機能構成を示すブロック図である。
【発明を実施するための形態】
【0017】
<第1の実施形態>
以下、第1の実施形態について
図1~
図6を参照しながら説明する。
【0018】
(移動体群の全体構成)
図1は、第1の実施形態に係る移動体群の概略を示す図である。
移動体群1は、連携して動作する複数の移動体からなる。移動体は、たとえばUUV(Unmanned Undersea Vehicle)、UGV(Unmanned Ground Vehicle)、UAV(Unmanned Aerial Vehicle)などの自律動作可能な無人機である。
図1に示すように、本実施形態に係る移動体群1は、1機のリーダである移動体L(以下、「リーダL」とも記載する。)と、指定されたフォーメーションを保ってリーダLに追従する1機以上のフォロワである移動体F(以下、「フォロワF」とも記載する。)とを有する。また、以降の説明において、リーダLおよびフォロワFを「エージェント」とも記載する。
【0019】
図1には、1機のリーダLに対し、9機のフォロワF1~F9が所定のフォーメーションを保って追従する例が示されている。
図1の例では、リーダLを中心とする同心円L1,L2上に、それぞれ5機のフォロワF1~F5と、4機のフォロワF6~F9が配置されるフォーメーションが指定されている。
【0020】
各フォロワFは、直接的に、または他のフォロワFを介して間接的にリーダLと連結するネットワーク構造を有する。ネットワーク構造は、無線通信またはセンサでの観測による、エージェント間の情報伝達の連結関係を表したものである。
【0021】
図1の例では、フォロワF1~F5は直接的にリーダLと連結する。すなわち、フォロワF1~F5は、リーダLからリーダ・フォロワ制御に要する情報を取得する。また、フォロワF6~F9は、それぞれ他のフォロワF1~F4と連結し、これら他のフォロワF1~F4を介して間接的にリーダLと連結する。すなわち、フォロワF6~F9は、それぞれフォロワF1~F4からリーダ・フォロワ制御に要する情報を取得する。したがって、フォロワF6~F9は、フォロワF1~F4を介して間接的にリーダLに追従する。
【0022】
以降の説明において、各フォロワFの直接的な連結相手を「隣接エージェント」とも記載する。
【0023】
リーダLは、たとえば外部からの操作指示や、予め与えられたシナリオなどにしたがい、動的に状態(位置、姿勢、速度など)を変化させる。一方で、各フォロワFは、操作指示やシナリオなどは与えられず、隣接エージェントから取得した情報に基づき、自動的にリーダLに追従する。
【0024】
(フォロワの機能構成)
図2は、第1の実施形態に係るフォロワの機能構成を示すブロック図である。
図2に示すように、フォロワFは、機体10と、制御装置20とを備える。また、
図2に示すように、フォロワFのリーダ・フォロワ制御は、機体10および制御装置20の各部からなる閉ループ系CLでモデル化される。
【0025】
機体10は、制御装置20の制御対象であり、フォロワF
i(i番目の機体)が備える推進系(または駆動系)、操舵系などを含む。
図2は、機体10を上式(1)のダイナミクスを有する線形システムで表したものである。
【0026】
機体10は、制御入力uiを入力とし、状態量xiを出力とする。制御入力uiは、推進系や操舵系などの複数の操作量からなる。たとえば移動体(リーダLおよびフォロワF)がUUVである場合、制御入力uiはスラスタ回転数や舵角などである。状態量xiは機体10の位置(三次元座標)、姿勢、速度など複数の状態量からなる。
【0027】
また、本実施形態に係る機体10は、状態量xiに含まれる複数の状態量のうち、機体10の位置yiのみを制御装置20に出力する。
【0028】
制御装置20は、取得部201と、オブザーバ202と、フィードバック制御器203とを備える。
【0029】
取得部201は、自機と隣接エージェントとの相対位置y
Fiを取得する。
図1の例において、自機がフォロワF4である場合、取得部201は隣接エージェントであるリーダLとの相対位置y
F4を取得する。また、自機がフォロワF9である場合、取得部201は隣接エージェントであるフォロワF4との相対位置y
F9を取得する。
【0030】
取得部201は、たとえば、無線通信により隣接エージェントから位置yjを取得し、自機の位置yiと差である相対位置yFiを取得する。また、取得部201は、自機の位置yiと、センサで計測した隣接エージェントの位置や距離などに基づいて、隣接エージェントとの相対位置yFiを取得してもよい。
【0031】
オブザーバ202は、いわゆる未知入力オブザーバ(UIO;Unknown Input Observer)である。オブザーバ202は、隣接エージェントとの相対位置yFiと、オブザーバゲインH,F,Pとに基づいて、隣接エージェントとのすべての状態量の相対値xFiを推定する。状態量相対値の推定値は^xFi(「^x」はxにハット記号(^)を付したもの)と記載する。
【0032】
フィードバック制御器203は、隣接エージェントとの状態量相対値の推定値^xFiと、フィードバックゲインKとに基づいて、機体10(自機)がリーダLに追従するための制御入力uiを機体10に出力する。本実施形態において、制御入力uiは上式(2)に代えて式(3)で表される。
【0033】
【0034】
図17に示すように、従来のリーダ・フォロワ制御では、一般的に、制御入力u
iはすべての状態量の相対値(x
i-x
j)をフィードバックすることで、リーダに追従することが可能となる。
【0035】
これに対し、本実施形態では、フォロワFの制御装置20は、通信が制限される条件下で運用されることを考慮して、隣接エージェントから取得する状態量の位置yFiのみに限定し、相対位置yFi以外の他の状態量相対値をオブザーバ202により推定する構成としている。これにより、フォロワFの制御装置20は、他のエージェントの全状態量を観測できない場合であっても、リーダ・フォロワ制御に必要なすべての状態量相対値を推定して取得することができる。
【0036】
また、フォロワFの制御装置20は、隣接エージェントから取得する情報を位置情報のみに限定することで、隣接エージェントとの通信量を低減することができる。さらに、通信相手である隣接エージェントは1機のみであるため、各フォロワが近傍の複数のエージェントと通信を行う従来技術と比較して、エージェント全体における通信量および通信回数を低減することができる。
【0037】
また、フォロワFの制御装置20は、無線通信に代えて、測距センサなどの計測値に基づき隣接エージェントとの相対位置yFiを取得してもよい。このようにすることで、通信遅延や通信途絶が生じやすい環境下(たとえば水中など)であっても、隣接エージェントとの相対位置yFiをより確実に取得し、リーダLに追従可能なレジリエントなリーダ・フォロワ制御を行うことができる。
【0038】
(設計条件について)
一般的なオブザーバを適用した場合、オブザーバは自機の制御入力uiと隣接エージェントの制御入力ujとの相対値(入力相対値)uFi=ui-ujを必要とする。
【0039】
これに対し、本実施形態では、通信が制限されるケースを考慮して、隣接エージェントから得られる情報を相対位置yFiのみとしている。つまり、本実施形態では、オブザーバに必要な隣接エージェントとの入力相対値uFiを取得することができない。このため、本実施形態では、入力相対値を未知入力として扱い、未知入力の影響を排除して全状態量の推定が可能なオブザーバ202を設計する。
【0040】
オブザーバ202による状態量相対値の推定値は式(4)、真値は式(5)で表される。
【0041】
【0042】
なお、A,B,Cは
図2に示す機体10のダイナミクスから決まる値、H,F,Pはオブザーバゲインである。
【0043】
【0044】
オブザーバ推定誤差eiは式(6)で、オブザーバ推定誤差のダイナミクスは式(7)で表される。
【0045】
【0046】
【0047】
このとき、以下の式(8)-(10)が成り立つならば、式(11)が成り立つ。
【0048】
【0049】
【0050】
【0051】
【0052】
また、Hが安定であれば、推定誤差eiはゼロに漸近し、式(12)が成立する。
【0053】
【0054】
ただし、式(10)が成立するためのFが存在するためには、rank(CB)=rank(B)が成立する必要がある。たとえば、移動体の状態量の数が制御入力の数よりも少ない場合、式(10)が成立するためのランクの条件を満たすことができない。そうすると、一般的には未知入力オブザーバを構築することができない。
【0055】
このため、本実施形態に係るオブザーバ202を設計する際には、未知入力がオブザーバ推定誤差eiに与える影響をH∞ノルムで表し、H∞ノルムを最小化するRxUIO(Relaxed UIO)を適用する。RxUIOは、行列のランクが一致しない場合であっても、未知入力オブザーバを設計可能とする技術である。本実施形態では、たとえば『Daoliang Tan, et. al., "A Relaxed Solution to Unknown Input Observers for State and Fault Estimation", IFAC-PapersOnLine, Volume 48, Issue 21, pages 1048-1053, 2015』に記載のRxUIOの技術をオブザーバ設計の一部に利用する。
【0056】
RxUIOを適用したとき、式(10)は成立しないが、式(8),(9)は成立するようにオブザーバゲインH,F,Pを設計することは可能である。そうすると、オブザーバ推定誤差eiのダイナミクスを示す式(7)において、2,3項目をゼロにすることができ、以下の式(13)のように表すことができる。
【0057】
【0058】
ここで、N台分のフォロワFの状態量をx、オブザーバ推定誤差をeとしたとき、リーダLの状態量xL、リーダLに対する入力uLを用いてシステム全体(全エージェント)の閉ループ系CLは式(14)で表される。
【0059】
【0060】
ここで、MはN+1番目のエージェントをリーダLとした場合のグラフラプラシアンの、リーダLに係る行列(N+1列目、N+1行目)を削除したものであり、式(15)で表される。
【0061】
【0062】
また、式(14)のA,B,Cは
図2に示す機体10のダイナミクスから決まる値、H,F,Pはオブザーバゲイン、Kはフィードバックゲイン、Iは単位行列である。
【0063】
式(14)において、システムの安定性を示すシステム行列A’の式(16)に着目すると、RxUIOの未知入力の影響を完全に排除することができないため、オブザーバとフィードバック制御系の分離定理が成り立っていない。すなわち、オブザーバとフィードバック制御とが依存関係にあるため、それぞれを独立に設計すると、システムは不安定となる。
【0064】
【0065】
分離定理を成立させ、システムの安定性を保証するためには、上式(16)のうち、
【0066】
【0067】
を十分小さくする必要がある。これらを十分小さくするための条件は、以下の3点である。
【0068】
(a)ネットワーク構造を示すMを小さくする
(b)フィードバックゲインKを小さくする
(c)未知入力のH∞ノルムに関わる(FC-I)Bを小さくする
【0069】
条件(a)について、「各フォロワFは直接的にまたは間接的にリーダLと連結するネットワーク構造を有する」という前提条件を満たしつつMを小さくするためには、相対位置を取得する相手である隣接エージェントの数を少数とすることが望ましい。
【0070】
図3は、第1の実施形態に係るネットワーク構造の例を示す第1の図である。
図3は、
図1に例示した移動体群1のネットワーク構造を表したものである。
図1および
図3の例では、Mが最小となるように、各フォロワFが情報を取得する相手である隣接エージェントを1機のみとしている。つまり、フォロワF1、F2,F3,F4,F5はリーダLのみを隣接エージェントとし、フォロワF6,F7,F8,F9はそれぞれフォロワF1,F2,F3,F4のみを隣接エージェントとする。
【0071】
図4は、第1の実施形態に係るネットワーク構造の例を示す第2の図である。
図4は、1機のリーダLに4機のフォロワF1~F4が追従する移動体群1のネットワーク構造を例示したものである。
図4に示すように、リーダLおよび各フォロワFを直列に連結したネットワーク構造としてもよい。
【0072】
条件(b)について、フィードバックゲインKを小さくすることでシステムの安定性を保証できる。一方で、リーダLへの追従性能を向上させるためには、フィードバックゲインKを十分に大きくする必要がある。したがって、システムを安定させるためにフィードバックゲインKを小さくしすぎると、フィードバックが効かずリーダLへの追従性能が劣化する。
【0073】
条件(c)について、未知入力の影響を表すH∞のノルムを最小化するとき、RxUIOの極の実部が虚軸に近くなり、オブザーバ推定値の収束が遅くなる。一方で、リーダLへの追従性能を向上させるためには、オブザーバ推定値の収束を早めるために、RxUIOの極の実部を虚軸から負側に離す必要がある。したがって、システムを安定させるために(FC-I)Bを小さくし過ぎると、オブザーバから誤った推定値が出力される可能性があり、リーダLへの追従性能が劣化する。
【0074】
つまり、システムの安定性を保証するための条件(b),(c)は、リーダLへの追従性能を向上させるための条件と相反するものとなる。このため、本実施形態では、システムの安定性の保証と、リーダLへの追従性能(リーダ・フォロワ制御性能)の向上とを両立するために、条件(b),(c)を変更し、以下の条件(a),(b’),(c’)を満たすように、オブザーバ202およびフィードバック制御器203を設計する。
【0075】
(a)ネットワーク構造を示すMを小さくする
(b’)フィードバックゲインKをシステム全体の安定性が保証される範囲内で最大値とする
(c’)RxUIOの極となるゲインHの固有値の実部が虚軸から所定値α以上、負側に離れるように極配置したうえで、未知入力の影響を表すH∞ノルムが最小となるRxUIOを設計する
【0076】
(制御装置の設計方法)
図5は、第1の実施形態に係る制御装置の設計方法の流れを示すフローチャートである。
以下、
図5を参照しながら、制御装置20のオブザーバ202およびフィードバック制御器203を設計する方法について詳細に説明する。
【0077】
まず、移動体群1のネットワーク構造を規定する(ステップS01)。具体的には、条件(a)を満たすように、すべてのフォロワFが直接的または間接的にリーダLと仮想的に連結するとともに、各フォロワの直接の連結相手(隣接エージェント)が少数となるネットワーク構造を規定する。本実施形態では、たとえば隣接エージェントの数を1機とする。
【0078】
次に、条件(c’)を満たすように、オブザーバ202のオブザーバゲインH,F,Pを線形行列不等式(LMI;Linear Matrix Inequality)を用いて設計する(ステップS02)。
【0079】
条件(c’)において、オブザーバ推定値の収束速度を決めるαは、制御装置20の設計者により任意に設定される設計パラメータである。また、LMI条件は以下の式(18)、(19)で表される。式(18)は未知入力のH∞ノルムを最小化するための制約であるり、RxUIOを手法を利用したものである。RxUIOでは、上記したようにH∞ノルムの最小化するときにRxUIOの極の実部が虚軸に近くなり、オブザーバ推定値の収束速度が低下するという課題がある。したがって、本実施形態では、式(19)の線形行列不等式をさらに追加して、オブザーバゲインの設計を行う。式(19)は、RxUIOの極の実部を虚軸より負側にαだけ離すための制約である。
【0080】
【0081】
【0082】
ステップS02では、式(18),(19)のLMI条件を満たしつつ、未知入力を表すξを最小化するように変数P,Y,Vを設計する。式(18)を満たせば、H∞ノルムはξ未満となる。ただし、Y=PF,V=PP1である。変数P,Y,Vが決まることにより、オブザーバ202のオブザーバゲインH,F,Pも決まる。
【0083】
次に、フィードバック制御器203のフィードバックゲインKを設計する。
【0084】
まず、フィードバックゲインKの大きさ||K||=γの上限値(初期値)を設定する(ステップS03)。この初期値は、制御装置20の設計者により任意に設定される設計パラメータである。
【0085】
次に、||K||<γを満たしつつ、全状態量が観測可能であると仮定した場合のLMI条件に基づいて、フィードバックゲインKを設計する(ステップS04)。このとき、LMI条件は以下の式(20),(21)で表される。
【0086】
【0087】
【0088】
ステップS04では、式(20),(21)のLMI条件を満たす変数X,Yを設計する。ここで、KX=Yであり、変数X,Yが決まるとフィードバックゲインKも決まる(K=YX
-1)。ステップS02において、未知入力の影響を最小とするRxUIO(オブザーバ202)が設計できているため、
図2に示すようにフィードバック制御器203には隣接エージェントの全状態量の推定値が入力されるようになる。式(20)は、オブザーバ推定値が真値と一致している場合にシステム安定性を保証するための制約である。式(21)はフィードバックゲインKの大きさをγ以下に抑えるための制約である。
【0089】
次に、設計したフィードバックゲインKを用いてシステム全体(全フォロワF)の閉ループ系CLの極を算出する(ステップS05)。閉ループ系CLの極は、上式(16)で表されるシステム行列A’の固有値である。
【0090】
次に、極の実部がすべて負であるか判定する(ステップS06)。
【0091】
極の実部がすべて負である場合(ステップS06;YES)、システムは安定である。この場合、フィードバックゲインKの大きさの上限値γを所定量dγだけ大きくして(ステップS07)、再度フィードバックゲインの設計を行うステップS04に戻る。この所定量dγは、制御装置20の設計者により任意に設定される設計パラメータである。
【0092】
一方、極の実部の少なくとも1つが負ではない場合(ステップS06;NO)、システムは不安定である。この場合、前回の上限値γ=γ-dγで設計したフィードバックゲインKの値を採用する(ステップS08)。
【0093】
このように、極の実部がすべて負である間、フィードバックゲインKの大きさの上限値γを漸増させながらフィードバックゲインKを設計する(ステップS04~S07)ことにより、フィードバックゲインKをシステム全体の安定性が保証される範囲内で最大値とすることができる。つまり、上記した条件(b’)を満たすことができる。
【0094】
なお、本実施形態では、ステップS02において、オブザーバ推定値の収束速度を決めるαは、設計者が設定した固定を使用する例について説明したが、これに限られることはない。αの値が虚軸に近いほど収束速度は遅くなる一方で、ξの値は小さくなり、未知入力の影響が小さくなる。したがって、他の実施形態では、たとえば設計者が指定した範囲内でαの値を変化させつつステップS02を繰り返し、ξの値が設計者が予め設定した基準値以下となり、且つ、オブザーバ推定値の収束速度が設計者が予め設定した速度以下となるαを求めてもよい。このようにすることで、オブザーバ202の収束速度と推定精度の両方のバランスがとれた適切なオブザーバゲインH,F,Pを設計することが可能となる。
【0095】
また、本実施形態では、各フォロワFの隣接エージェントを1機のみとするネットワーク構造を例として説明したが、これに限られることはない。他の実施形態では、各フォロワFの隣接エージェントを2機以上とするネットワーク構造としてもよい。たとえば、フォロワF1の隣接エージェントがリーダLおよびフォロワF2の2機である場合、制御装置20の取得部201は、隣接エージェントであるリーダLおよびフォロワF2それぞれとの相対位置(y
Fi1=y
i-y
j1,y
Fi2=y
i-y
j2)を取得する。また、オブザーバ202は隣接エージェントであるリーダLおよびフォロワF2それぞれとの状態量相対値(x
Fi1,x
Fi2)を推定する。この場合、
図5のステップS01において、各フォロワFが複数機の隣接エージェント持つネットワーク構造を規定して、制御装置20を設計する。
【0096】
上記した設計方法により設計したゲインに基づいて、制御装置20および制御装置20を備える移動体(フォロワF)を製造する。
【0097】
(シミュレーション結果)
図6は、第1の実施形態に係るシミュレーション結果を示す図である。
図6は、本実施形態の設計方法により設計(製造)された移動体でリーダ・フォロワ制御のシミュレーションを行った結果をグラフで表したものである。このシミュレーションでは、1機のリーダLおよび9機のフォロワFからなる移動体群1が、
図1に示すフォーメーションで移動を行った。フォロワF1~F5の5機はリーダLを中心とする半径50mの同心円L1上に等間隔に配置され、フォロワF6~F9の4機はリーダLを中心とする半径100mの同心円L2上に等間隔に配置された。
図6は、このシミュレーションにおける各フォロワF1~F9の目標軌道との偏差の時刻歴、およびリーダLの速力の時刻歴をそれぞれ表したものである。
図6に示すように、リーダLの軌道変化で一時的に目標軌道との偏差は生じたものの、次第に目標軌道との偏差が0に収束していくことが確認できた。
【0098】
(作用、効果)
以上のように、本実施形態に係るフォロワFの制御装置20は、自機Fiと隣接エージェントとの相対位置yFiと、オブザーバゲインH,F,Pとに基づいて、隣接エージェントとの状態量相対値xFiを推定するオブザーバ202と、状態量相対値の推定値^xFiと、フィードバックゲインKとに基づいて、自機FiがリーダLに追従するための制御入力uiを出力するフィードバック制御器203と、を備える。また、制御装置20の設計方法は、オブザーバ202の極の実部がすべて虚軸から負側に所定値αだけ離れるように制約する線形行列不等式、および、オブザーバ202のH∞ノルムを最小化するように制約する線形行列不等式の両方を満たすオブザーバゲインH,F,Pを設計するステップと、フォロワFそれぞれの設計したオブザーバ202およびフィードバック制御器203を含む閉ループ系CL全体の安定を保証しつつ、リーダLへの追従制御性能を向上させるためのフィードバックゲインKを線形行列不等式を用いて設計するステップとを有する。
【0099】
このようにすることで、たとえば通信に制限があるなどの理由で、隣接エージェントのすべての状態量を観測できない場合であっても、隣接エージェントとの相対位置yFiから、すべての状態量相対値xFiを推定可能なオブザーバ202を設計することができる。また、所定値αおよびH∞ノルムに関する制約を満たすオブザーバゲインH,F,Pを設計することで、隣接エージェントとの制御入力の相対値が未知であっても、オブザーバ202への未知入力の影響を十分に小さくしてすべての状態量相対値xFiを推定可能とするとともに、オブザーバ202の推定値の収束速度の低下を抑制することができる。また、上記のように線形行列不等式を用いたフィードバックゲインKの設計を行うことにより、システム全体(全エージェント)の安定性の保証と、各フォロワFのリーダLへの追従性能を向上とを両立することができる。
【0100】
また、制御装置20の設計方法は、閉ループ系CLの極の実部がすべて負である間、フィードバックゲインKの大きさの上限値γを漸増させながら、閉ループ系CLを安定させるように制約する線形行列不等式、およびフィードバックゲインKの大きさが上限値γ以下となるように制約する線形行列不等式の両方を満たすフィードバックゲインKを設計するステップをさらに有する。
【0101】
このようにすることで、システム全体(全エージェント)の安定性が保証される範囲内でフィードバックゲインKを大きくすることができる。これにより、システム全体の安定性の保証と、各フォロワFのリーダLへの追従性能を向上とをより確実に両立することができる。
【0102】
また、オブザーバゲインH,F,Pを設計するステップにおいて、指定された範囲内でオブザーバの収束速度を決める所定値αを変化させながらオブザーバゲインH,F,Pの設計を繰り返し実行し、収束速度が予め設定された速度以下となるように、所定値αを決定してもよい。
【0103】
このようにすることで、オブザーバ202の収束速度と推定精度の両方のバランスがとれた適切なオブザーバゲインH,F,Pを設計することが可能となる。
【0104】
また、移動体の製造方法は、自機と隣接エージェントとの相対位置yFiと、オブザーバゲインH,F,Pとに基づいて、隣接エージェントとの状態量相対値xFiを推定するオブザーバ202を設計するステップと、状態量相対値の推定値^xFiと、フィードバックゲインKとに基づいて、自機がリーダLに追従するための制御入力uiを出力するフィードバック制御器203を設計するステップと、を有する。オブザーバ202を設計するステップは、オブザーバ202の極の実部がすべて虚軸から負側に所定値αだけ離れるように制約する線形行列不等式、および、オブザーバ202のH∞ノルムを最小化するように制約する線形行列不等式の両方を満たすオブザーバゲインH,F,Pを設計する。
【0105】
このようにすることで、たとえば通信に制限があるなどの理由で、隣接エージェントのすべての状態量を観測できない場合であっても、隣接エージェントとの相対位置yFiから、すべての状態量相対値xFiを推定可能な移動体(フォロワF)を製造することができる。また、所定値αおよびH∞ノルムに関する制約を満たすオブザーバゲインH,F,Pを設計することで、隣接エージェントとの制御入力の相対値が未知であっても、オブザーバ202への未知入力の影響を十分に小さくしてすべての状態量相対値xFiを推定可能とするとともに、オブザーバ202の推定値の収束速度の低下を抑制することができる。したがって、状態量相対値をより精度よく推定可能な移動体を製造することができる。
【0106】
<第2の実施形態>
次に、第2の実施形態について
図7~
図8を参照しながら説明する。上述の実施形態と共通の構成要素には同一の符号を付して詳細説明を省略する。
【0107】
(フォロワの機能構成)
図7は、第2の実施形態に係るフォロワの機能構成を示すブロック図である。
図7に示すように、本実施形態に係るフォロワFの制御装置20は、積分器204と、加算器205とをさらに備える。
【0108】
積分器204は、相対位置yFi(位置の偏差)を蓄積して、フィードバック制御器203が出力する制御入力uiの補正値を出力する。
【0109】
加算器205は、フィードバック制御器203が出力する制御入力ui1,ui2,…のうち、少なくとも1つの制御入力ui1に、積分器204が出力する補正値を加算する。したがって、制御対象である機体10には、加算器205により補正値が加算された後の制御入力ui1’(補正後制御入力)が入力される。
【0110】
(制御装置の設計方法)
図8は、第2の実施形態に係る制御装置の設計方法の流れを示すフローチャートである。
以下、
図8を参照しながら、本実施形態に係る制御装置20を設計する方法について説明する。なお、ステップS01~S08については、第1の実施形態(
図5)と同じ処理であるため、説明を省略する。本実施形態において、制御装置20の設計方法は、制御装置20に積分器204および加算器205を追加する工程(ステップS10)をさらに実施する。
【0111】
説明を簡単にするため、たとえば移動体はUUVであり、制御入力ui1,ui2はそれぞれスラスタの回転数指令値、舵指令値であるとする。舵指令値にui2より制御される目標姿勢はステップ状に変化することから、定常偏差を持たずに追従可能である。一方、回転数指令値ui1で制御される目標位置は、追従相手であるリーダLの位置がランプ状に時々刻々と変化することから、定常偏差が生じる。
【0112】
したがって、ステップS10において、目標位置(相対位置yFi)に対する定常偏差を低減する補正値を出力する積分器204を追加する設計を行う。さらに、積分器204が出力した補正値を、目標位置に対する制御入力である回転数指令値ui1に加算する加算器205を追加する設計を行う。
【0113】
なお、
図6の例のように、定常偏差がない制御入力である舵指令値u
i2については、補正値を加算しない構成としてもよい。また、他の実施形態では、すべての制御入力u
i1,u
i2,…に補正値を加算する構成としてもよい。
【0114】
(作用、効果)
以上のように、本実施形態に係る制御装置20の設計方法は、定常偏差を低減する補正値を出力する積分器204を追加するステップをさらに有する。
【0115】
このようにすることで、リーダLの移動に伴い時々刻々と変化する目標位置に対しても、定常偏差を低減して精度よく追従することが可能な制御装置20を設計することができる。
【0116】
<第3の実施形態>
次に、第3の実施形態について
図9~
図10を参照しながら説明する。上述の実施形態と共通の構成要素には同一の符号を付して詳細説明を省略する。
【0117】
本実施形態では、オブザーバゲインH,F,Pの設計工程(
図5のステップS02)、およびフィードバックゲインKの設計工程(
図5のステップS03~S08)において、速力ごとのオブザーバゲインH,F,PおよびフィードバックゲインKを算出する。
【0118】
(制御装置の設計方法)
図9は、第3の実施形態に係る制御装置の設計方法の流れを示すフローチャートである。
図9のステップS21は、上述の実施形態のステップS01(
図5)と同じであるため、説明を省略する。
【0119】
移動体(フォロワF)は、速力に応じて運動特性が変化する。すなわち、機体10の線形システム(
図2)で表されるA,Bの行列が速力に応じて変化する。このため、本実施形態では、速力毎のオブザーバゲインH,F,Pを設計する工程(ステップS22)と、速力毎のフィードバックゲインKを設計する工程(ステップS23)とをそれぞれ実施する。
【0120】
ステップS22において、設計者により指定された複数の速力それぞれについて、
図5のステップS02と同じ処理を実施する。例えば、2ノット、2.5ノット、3ノット、3,5ノット、…の速力を指定されたとする。まず、速力2ノットに対応するA,Bを使用して、上式(18),(19)の両方を満たす、速力2ノットに対応するオブザーバゲインH,F,Pを設計する。次に、速力2.5ノットに対応するA,Bを使用して、上式(18),(19)の両方を満たす、速力2.5ノットに対応するオブザーバゲインH,F,Pを設計する。同様に、速力3ノット、3.5ノット、…に対応するオブザーバゲインH,F,Pをそれぞれ設計する。
【0121】
また、ステップS23において、ステップS22で指定された複数の速力それぞれについて、
図5のステップS03~S08と同じ処理を実施する。上記した例では、まず、速力2ノットに対応するA,Bを使用して、閉ループ系CLの極の実部がすべて負となる範囲内で最大となる、速力2ノットに対応するフィードバックゲインKを設計する。次に、速力2.5ノットに対応するA,Bを使用して、閉ループ系CLの極の実部がすべて負となる範囲内で最大となる、速力2.5ノットに対応するフィードバックゲインKを設計する。同様に、速力3ノット、3.5ノット、…に対応するフォードバックゲインKをそれぞれ設計する。
【0122】
図10は、第3の実施形態に係るフィードバックゲインの設計例を示す図である。
図10には、ステップS23において、速力2~6ノット(0.5ノット刻み)で各エージェントのフィードバックゲインKを設計した例が示されている。図示は略すが、オブザーバゲインH,F,Pそれぞれについても同様に設計済みである。
【0123】
各エージェントの制御装置20は、速力毎に設計されたフィードバックゲインKのテーブルを予め記憶領域に格納しておく。また、制御装置20のフィードバック制御器203は、フィードバックゲインKのテーブルと、自機速力とに基づいて、
図10に例示する線形補完したフィードバックゲインKを使用して、制御入力u
iを求める。これにより、制御装置20は、自機速力の運動特性に応じて適切に機体10を制御することができるので、リーダLへの追従性能をさらに向上させることができる。
【0124】
同様に、各エージェントの制御装置20は、速力毎に設計されたオブザーバゲインH,F,Pそれぞれのテーブルを予め記憶領域に格納しておく。また、制御装置20のオブザーバ202は、オブザーバゲインH,F,Pのテーブルと、自機速力とに基づいて線形補完したオブザーバゲインH,F,Pそれぞれを使用して、状態量相対値xFiを推定する。これにより、制御装置20は、自機速力に応じた運動特性の変化を加味して、状態量相対値xFiの推定精度を向上させることができる。
【0125】
(作用、効果)
以上のように、本実施形態では、オブザーバゲインH,F,Pを設計する工程において、指定された複数の速力に対応する複数のオブザーバゲインH,F,Pを設計する。
【0126】
このようにすることで、速力に応じて運動特性が変化する機体10について、自機の速度に応じた精度のよい状態量相対値の推定可能なオブザーバ202を設計することができる。
【0127】
また、フィードバックゲインKを設計する工程において、指定された複数の速力に対応する複数のフィードバックゲインKを設計する。
【0128】
このようにすることで、速力に応じて運動特性が変化する機体10について、自機の速度に応じて適切に機体10の制御を行うことができる制御装置20(フィードバック制御器203)を設計することができる。
【0129】
<第4の実施形態>
次に、第4の実施形態について
図11~
図14を参照しながら説明する。上述の実施形態と共通の構成要素には同一の符号を付して詳細説明を省略する。
【0130】
たとえば1機のフォロワが故障などにより移動体群を離脱した場合、離脱したフォロワから情報を得ていたフォロワは、他のエージェント(リーダまたはフォロワ)に連結しなおして、以降は新たなエージェントから情報を取得することとなる。つまり、移動体群の運用中、フォロワの離脱によりネットワーク構造が変化する場合がある。
【0131】
しかしながら、従来の技術では、移動体群の運用中にネットワーク構造が変化しないことを前提として、制御装置の設計を行っていた。このため、従来の技術で設計された制御装置では、移動体群からフォロワが離脱した場合に、リーダ・フォロワ制御が正常に行われなくなる可能性がある。
【0132】
本実施形態では、このような移動体群1からフォロワが離脱するケースを考慮して、ネットワーク構造が変化した後も安定してリーダ・フォロワ制御を可能とする制御装置20を設計する。なお、本実施形態では、各フォロワFの隣接エージェントを1機のみに限定し、複数のフォロワFのうち1機が離脱するケースについて考える。
【0133】
(制御装置の設計方法)
本実施形態では、上述の複数の実施形態のうち、第1の実施形態の設計方法(
図5)にネットワーク構造変化を考慮したフィードバックゲインKを設計する方法を適用する例について説明する。
【0134】
まず、
図5のステップS01において、各フォロワFが相対位置を取得する相手である隣接エージェントは1機のみに限定したネットワーク構造を規定する。また、ステップS02~S08について、以下に説明するフィードバックゲインKの設計工程(ステップS04)以外は、第1の実施形態と同じである。
【0135】
ネットワーク構造が変化するケースを考慮したフィードバックゲインKの設計工程(ステップS04)について説明する。
【0136】
ネットワーク変化前のネットワーク構造をMα、変化後(1機のフォロワF離脱後)のネットワーク構造をMβとおく。ネットワーク構造Mαに対するLMIを解いた結果得られる変数をXα,Yαとする。つまり、上式(20)は、以下の式(22)となる。
【0137】
【0138】
ネットワーク構造Mαに対して設計されたフィードバックゲインKをネットワーク構造Mβに適用したとき、以下の式(23)が成立すれば、ネットワーク構造変化後のシステムも安定であるといえる。
【0139】
【0140】
上述の実施形態で説明したように、式(20)は予め規定したネットワーク構造においてシステムが安定であるために必要な条件である。したがって、式(20)を書き換えた式(22)が満たされる場合、以下の式(24)が成立すれば、式(23)が成立する。
【0141】
【0142】
よって、任意のMβに対して式(22)、且つ、以下の式(25)の2つのLMIを解いて求めたXα,Yαから設計したフィードバックゲインK=YαXα
-1を用いれば、変化前後のどちらのネットワーク構造Mα,Mβに対しても安定性を保証できる。
【0143】
【0144】
なお、1機のフォロワFの離脱に限定した場合、後述のようにMα-Mβは必ず半正定値行列となることが解析的に示される。したがって、1機のフォロワFが離脱した後の如何なるネットワーク構造Mβに対しても、以下の式(26)を満たせば、システムの安定性を保証することができる。
【0145】
【0146】
したがって、本実施形態では、
図5のステップS04において、上述の実施形態で説明した式(21)と、本実施形態で説明した式(22),(26)との3つのLMI条件を満たすフィードバックゲインKを設計する。
【0147】
また、(M
α-M
β)は必ず半正定値行列となることについて、
図11~
図12を参照しながら説明する。
【0148】
(A)連結の末端のフォロワが離脱するケース
移動体群1の末端のフォロワFが離脱した場合には、新しくネットワークをつなぎ直す必要がない。離脱フォロワをi、離脱フォロワへ情報を送っていたフォロワをjとすると、Mα-Mβは、j→iのみ通信している場合(Mα)のグラフラプラシアンと同様となる。そうすると、Mα-Mβの固有値は0または1(0以上)であることが自明であり、Mα-Mβは必ず半正定値行列となる(Mα-Mβ≧0)ことが保証される。
【0149】
図11は、第4の実施形態に係るネットワーク構造の例を示す第1の図である。
図11には、1機のリーダLおよび4機のフォロワF1~F4からなる移動体群1の例が示されている。
図11の(a)は変化前のネットワーク構造M
α、(b)は変化後のネットワーク構造M
β、(c)はM
α-M
βを示す。
【0150】
具体的に、
図11を参照しながら、末端のフォロワF4が離脱した例について説明する。
図11の(b)に示す変化後のネットワーク構造M
βは、フォロワF1~F3の行は変化なしであり、離脱フォロワF4の行はすべて0になる。また、
図11の(c)に示すように、M
α-M
βは離脱フォロワF4の行(4行目)のみが残り、他の行はすべて0になる。つまり、M
α-M
βは、フォロワF2→フォロワF4のみ通信している場合(M
α)のグラフラプラシアンに一致する。よって、連結の末端のフォロワが離脱するケースにおいて、M
α-M
βの固有値は0,1のみであり、M
α-M
β≧0となることが証明された。
【0151】
(B)連結の途中のフォロワが離脱するケース
次に、連結の途中のフォロワが離脱した場合、この離脱フォロワから情報を取得していたフォロワは、他のエージェントに連結し直す必要がある。離脱フォロワをi、離脱フォロワから情報を取得していたフォロワをj、jが新たに情報を取得する(連結し直す)エージェントをrとする。このとき、Mα-Mβは離脱フォロワに対応するi行目が残り、j行目のi列目が-1、r列目が1(なお、rがリーダLの場合は反映されない)となり、他の全要素は0となる。そうすると、Mα-Mβの固有値は0または1(0以上)であることが自明であり、Mα-Mβは必ず半正定値行列となる(Mα-Mβ≧0)ことが保証される。
【0152】
図12は、第4の実施形態に係るネットワーク構造の例を示す第2の図である。
図12には、1機のリーダLおよび4機のフォロワF1~F4からなる移動体群1の例が示されている。
図12の(a)は変化前のネットワーク構造M
α、(b)は変化後のネットワーク構造M
β、(c)はM
α-M
βを示す。
【0153】
具体的に、
図12を参照しながら、連結の途中のフォロワF2が離脱した例について説明する。フォロワF2が離脱すると、フォロワF2に連結していたフォロワF4は、他のフォロワFに連結し直さなくてはならない。たとえば、
図12の(b)に示すように、フォロワF4がフォロワF1に連結し直したとする。なお、フォロワF4が他のエージェント(リーダLまたはフォロワF3)に連結し直した場合も同様である。
【0154】
図12の(b)に示す変化後のネットワーク構造M
βにおいて、離脱フォロワF2の行はすべて0になる。また、離脱フォロワF2から情報を取得していたフォロワF4の行は新たなネットワーク構造となる。つまり、当初の連結相手である離脱フォロワF2の列が0となり、新たな連結相手であるフォロワF1の列が-1となる。また、
図12の(c)に示すように、M
α-M
βは、M
αの離脱フォロワF2の行(2行目)が残り、ネットワーク構造が変化するフォロワF4の行(4行目)の1列目が1、2列目が-1となり、他の全要素は0となる。よって、連結の途中のフォロワが離脱するケースにおいても、M
α-M
βの固有値は0,1のみであり、M
α-M
β≧0となることが証明された。
【0155】
(シミュレーション結果)
図13は、第4の実施形態に係るシミュレーションを説明するための図である。
図13は、本実施形態の設計方法により設計(製造)された移動体によるリーダ・フォロワ制御のシミュレーション内容を表している。このシミュレーションでは、1機のリーダLおよび9機のフォロワFからなる移動体群1が、
図13の(a)に示すフォーメーションで移動を行った。フォロワF1~F5の5機はリーダLを中心とする半径50mの同心円L1上に等間隔に配置され、フォロワF6~F9の4機はリーダLを中心とする半径100mの同心円L2上に等間隔に配置された。
【0156】
また、このシミュレーションにおいて、ある時刻t1にフォロワF4が故障し、故障発生から5秒後に
図13の(b)に示すようにネットワーク構造を変化させた。具体的には、フォロワF4から情報を取得していたフォロワF9は、フォロワF5に連結し直し、以降はフォロワF5から相対位置を取得した。
【0157】
図14は、第4の実施形態に係るシミュレーション結果を示す図である。
図14は、
図13のシミュレーションにおける、各フォロワF1~F9の目標軌道との偏差の時刻歴、およびリーダLの速力の時刻歴をそれぞれ表したものである。
図14に示すように、時刻t1においてフォロワF4が故障により移動体群1から離脱した。これ以降のフォロワF4の目標軌道との偏差の時刻歴は表示しない。また、フォロワF4から情報を取得していたフォロワF9は、時刻t1から5秒間、故障したフォロワF4に追従したため、一時的に目標軌道との偏差が大きくなっている。しかしながら、フォロワF9が連結相手をフォロワF5に変更したことにより、フォロワF9の目標軌道との偏差が徐々に小さくなり、最終的に0に収束していくことが確認できた。
【0158】
(変形例)
なお、第4の実施形態では、第1の実施形態のフォロワFの制御装置20(
図2)について、フィードバックゲインK設計時のLMI条件をさらに追加する手法について説明したが、これに限られることはない。たとえば、他の実施形態では、従来のフォロワ制御装置(
図17)について、第4の実施形態のフィードバックゲインKを設計する手法を適用してもよい。
【0159】
図15は、第4の実施形態の変形例に係る制御装置の設計方法の流れを示すフローチャートである。
従来の制御装置(
図17)において、第4の実施形態に係るフィードバックゲインKの設計手法を適用する場合、まず、第4の実施形態と同様に、ネットワーク構造を規定する(ステップS31)。すなわち、各フォロワFが相対位置を取得する相手である隣接エージェントは1機のみに限定したネットワーク構造を規定する。
【0160】
次に、フィードバックゲインKを設計する(ステップS32)。本変形例では、ステップS31で規定したネットワーク構造をMαとし、上式(22),(26)の2つのLMI条件を満たすフィードバックゲインKを設計する。
【0161】
従来技術における制御装置は、隣接エージェントの全ての状態量を観測可能であることを前提としている。したがって、自機の状態量および隣接エージェントの状態量との相対値と、ステップS31で設計したフィードバックゲインKとに基づいて制御入力uiを算出することにより、従来のフォロワについても、1機のフォロワの離脱によるネットワーク構造の変化にロバストなリーダ・フォロワ制御を実現することが可能となる。
【0162】
(作用、効果)
以上のように、本実施形態に係る制御装置20の設計方法は、リーダLおよびフォロワFの情報伝達の連結関係を表すネットワーク構造であって、フォロワFがリーダLまたはフォロワFのうち1機である隣接エージェントの状態量を取得するようにネットワーク構造を規定するステップと、規定されたネットワーク構造に基づく線形行列不等式であって、フィードバック制御器203を含む閉ループ系CLを安定させるように制約する第1の線形行列不等式(式(22))と、第1の線形行列不等式から得られる変数に基づく第2の線形行列不等式(式(26))との両方を満たすフィードバックゲインKを設計するステップと、を有する。
【0163】
このようにすることで、移動体群1から1機のフォロワFが離脱してネットワーク構造が変化した場合であっても、リーダ・フォロワ制御を安定して継続することが可能な制御装置20を設計することができる。これにより、移動体群1のうちいずれか1機のフォロワFが故障した場合であっても、運用を継続することが可能なロバストな移動体群1を構成することができる。
【0164】
また、制御装置20がオブザーバ202を備える構成である場合、フィードバックゲインKを設計するステップは、閉ループ系CLの極の実部がすべて負である間、上限値γを漸増させながら、第1の線形行列不等式(式(22))、第2の線形行列不等式(式(26))、およびフィードバックゲインKの大きさが上限値γ以下となるように制約する第3の線形行列不等式(式(21))のすべてを満たすフィードバックゲインを設計する。
【0165】
このようにすることで、オブザーバ202を備える制御装置20(
図2)について、システム全体(全エージェント)の安定性が保証される範囲内でフィードバックゲインKを大きくするとともに、ネットワーク構造が変化した場合であってもリーダ・フォロワ制御を安定して継続することが可能な制御装置20を設計することができる。
【0166】
<その他の実施形態>
以上、図面を参照して一実施形態について詳しく説明してきたが、具体的な構成は上述のものに限られることはなく、様々な設計変更等をすることが可能である。すなわち、他の実施形態においては、上述の処理の順序が適宜変更されてもよい。また、一部の処理が並列に実行されてもよい。
【0167】
<制御装置のハードウェア構成>
図16は、少なくとも1つの実施形態に係る移動体の制御装置のハードウェア構成を示す概略ブロック図である。
【0168】
コンピュータ900は、プロセッサ901、主記憶装置902、補助記憶装置903、および、インタフェース904を備える。
【0169】
上述の制御装置20は、コンピュータ900に実装される。そして、上述した各処理部の動作は、プログラムの形式で補助記憶装置903に記憶されている。プロセッサ901は、プログラムを補助記憶装置903から読み出して主記憶装置902に展開し、当該プログラムに従って上記処理を実行する。また、プロセッサ901は、プログラムに従って、上述した各記憶部に対応する記憶領域を主記憶装置902に確保する。
【0170】
プログラムは、コンピュータ900に発揮させる機能の一部を実現するためのものであってもよい。例えば、プログラムは、補助記憶装置903に既に記憶されている他のプログラムとの組み合わせ、または他の装置に実装された他のプログラムとの組み合わせによって機能を発揮させるものであってもよい。なお、他の実施形態においては、コンピュータ900は、上記構成に加えて、または上記構成に代えてPLD(Programmable Logic Device)などのカスタムLSI(Large Scale Integrated Circuit)を備えてもよい。PLDの例としては、PAL(Programmable Array Logic)、GAL(Generic Array Logic)、CPLD(Complex Programmable Logic Device)、FPGA(Field Programmable Gate Array)等が挙げられる。この場合、プロセッサ901によって実現される機能の一部または全部が当該集積回路によって実現されてよい。
【0171】
補助記憶装置903の例としては、HDD(Hard Disk Drive)、SSD(Solid State Drive)、磁気ディスク、光磁気ディスク、CD-ROM(Compact Disc Read Only Memory)、DVD-ROM(Digital Versatile Disc Read Only Memory)、半導体メモリ等が挙げられる。補助記憶装置903は、コンピュータ900のバスに直接接続された内部メディアであってもよいし、インタフェース904または通信回線を介してコンピュータ900に接続される外部記憶装置910であってもよい。また、このプログラムが通信回線によってコンピュータ900に配信される場合、配信を受けたコンピュータ900が当該プログラムを主記憶装置902に展開し、上記処理を実行してもよい。少なくとも1つの実施形態において、補助記憶装置903は、一時的でない有形の記憶媒体である。
【0172】
また、プログラムは、前述した機能の一部を実現するためのものであってもよい。さらに、プログラムは、前述した機能を補助記憶装置903に既に記憶されている他のプログラムとの組み合わせで実現するもの、いわゆる差分ファイル(差分プログラム)であってもよい。
【0173】
<付記>
上述の実施形態に記載の制御装置の設計方法および移動体の製造方法は、例えば以下のように把握される。
【0174】
(1)第1の態様によれば、制御装置の設計方法は、リーダLである1機の移動体と、リーダLに追従する1機以上のフォロワFである移動体からなる移動体群1におけるフォロワFの制御装置20の設計方法であって、フォロワFの制御装置20は、リーダLおよび他のフォロワFのうち少なくとも1機である隣接エージェントと自機との相対位置yFiと、オブザーバゲインH,F,Pとに基づいて、隣接エージェントとの状態量相対値xFiを推定するオブザーバ202と、状態量相対値の推定値^xFiと、フィードバックゲインKとに基づいて、自機がリーダLに追従するための制御入力uiを出力するフィードバック制御器203と、を備え、制御装置20の設計方法は、オブザーバ202の極の実部がすべて虚軸から負側に所定値αだけ離れるように制約する線形行列不等式、および、オブザーバ202のH∞ノルムを最小化するように制約する線形行列不等式の両方を満たすオブザーバゲインH,F,Pを設計するステップと、フォロワFそれぞれの設計したオブザーバ202およびフィードバック制御器203を含む閉ループ系CL全体の安定を保証しつつ、リーダLへの追従制御性能を向上させるためのフィードバックゲインKを線形行列不等式を用いて設計するステップとを有する。
【0175】
このようにすることで、たとえば通信に制限があるなどの理由で、隣接エージェントのすべての状態量を観測できない場合であっても、隣接エージェントとの相対位置yFiから、すべての状態量相対値xFiを推定可能なオブザーバ202を設計することができる。また、所定値αおよびH∞ノルムに関する制約を満たすオブザーバゲインH,F,Pを設計することで、隣接エージェントとの制御入力の相対値が未知であっても、オブザーバ202への未知入力の影響を十分に小さくしてすべての状態量相対値xFiを推定可能とするとともに、オブザーバ202の推定値の収束速度の低下を抑制することができる。また、上記のように線形行列不等式を用いたフィードバックゲインKの設計を行うことにより、システム全体(全エージェント)の安定性の保証と、各フォロワFのリーダLへの追従性能を向上とを両立することができる。
【0176】
(2)第2の態様によれば、第1の態様に係る制御装置20の設計方法において、オブザーバゲインH,F,Pを設計するステップは、指定された範囲内でオブザーバ202の収束速度を決める所定値αを変化させながらオブザーバゲインH,F,Pの設計を繰り返し実行し、収束速度が予め設定された速度以下となるように、所定値αを決定する。
【0177】
このようにすることで、オブザーバ202の収束速度と推定精度の両方のバランスがとれた適切なオブザーバゲインH,F,Pを設計することが可能となる。
【0178】
(3)第3の態様によれば、第1または第2の態様に係る制御装置20の設計方法は、閉ループ系CLの極の実部がすべて負である間、フィードバックゲインKの大きさの上限値γを漸増させながら、閉ループ系CLを安定させるように制約する線形行列不等式、およびフィードバックゲインKの大きさが上限値γ以下となるように制約する線形行列不等式の両方を満たすフィードバックゲインKを設計するステップをさらに有する。
【0179】
このようにすることで、システム全体(全エージェント)の安定性が保証される範囲内でフィードバックゲインKを大きくすることができる。これにより、システム全体の安定性の保証と、各フォロワFのリーダLへの追従性能を向上とをより確実に両立することができる。
【0180】
(4)第4の態様によれば、第1から第3のいずれか一の態様に係る制御装置20の設計方法は、隣接エージェントとの相対位置yFiに基づいて、自機の目標位置に対する定常偏差を低減する補正値を出力する積分器204を追加するステップをさらに有する。
【0181】
このようにすることで、リーダLの移動に伴い時々刻々と変化する目標位置に対しても、定常偏差を低減して精度よく追従することが可能な制御装置20を設計することができる。
【0182】
(5)第5の態様によれば、第1から第4のいずれか一の態様に係る制御装置20の設計方法において、オブザーバゲインH,F,Pを設計するステップは、指定された複数の速力に対応する複数のオブザーバゲインH,F,Pを設計する。
【0183】
このようにすることで、速力に応じて運動特性が変化する機体10について、自機の速度に応じた精度のよい状態量相対値の推定可能なオブザーバ202を設計することができる。
【0184】
(6)第6の態様によれば、第3の態様に係る制御装置20の設計方法において、フィードバックゲインKを設計するステップは、指定された複数の速力に対応する複数のフィードバックゲインKを設計する。
【0185】
このようにすることで、速力に応じて運動特性が変化する機体10について、自機の速度に応じて適切に機体10の制御を行うことができる制御装置20(フィードバック制御器203)を設計することができる。
【0186】
(7)第7の態様によれば、移動体の製造方法は、リーダLである1機の移動体と、リーダLに追従する1機以上のフォロワFである移動体からなる移動体群1における、フォロワFである移動体の製造方法であって、第1から第6のいずれか一の態様に係る制御装置20の設計方法で設計されたゲインに基づいて、制御装置20を製造する工程を有する。
【符号の説明】
【0187】
1 移動体群
10 機体(制御対象)
20 制御装置
201 取得部
202 オブザーバ
203 フィードバック制御器
204 積分器
205 加算器
CL 閉ループ系
L リーダ
F フォロワ
H,F,P オブザーバゲイン
K フィードバックゲイン