特開2024-992 | 知財ポータル「IP Force」

知財求人 - 知財ポータルサイト「IP Force」

▶ 国立大学法人広島大学の特許一覧

特開2024-992制御装置、制御方法及びプログラム

書誌要約請求の範囲詳細な説明課題実施例実施するための形態図面の説明

目に優しい文字サイズ小中大 PDF Top

< >

1
2
3
4
5
6
7
8
9
10
11
12
13
14
15
16
17
18

(19)【発行国】日本国特許庁(JP)

(12)【公報種別】公開特許公報(A)

(11)【公開番号】P2024000992

(43)【公開日】2024-01-09

(54)【発明の名称】制御装置、制御方法及びプログラム

(51)【国際特許分類】

G05B 13/02 20060101AFI20231226BHJP

【ＦＩ】

G05B13/02 A

【審査請求】未請求

【請求項の数】8

【出願形態】ＯＬ

(21)【出願番号】P 2023100585

(22)【出願日】2023-06-20

(31)【優先権主張番号】P 2022099457

(32)【優先日】2022-06-21

(33)【優先権主張国・地域又は機関】JP

【新規性喪失の例外の表示】特許法第３０条第２項適用申請有り刊行物１令和５年２月１日ウェブサイト掲載電気学会研究会研究資料ｈｔｔｐｓ：／／ｗｏｒｋｓｈｏｐ．ｉｅｅ．ｏｒ．ｊｐ／ｓｂｔｋ／ｃｇｉ－ｂｉｎ／ｓｂｔｋ－ｓｈｏｗｐｒｏｇｒａｍ．ｃｇｉ？ｗｏｒｋｓｈｏｐｉｄ＝ＳＢＷ００００８３Ａ３刊行物２令和５年２月５日愛媛大学教育学部大講義室及びＷＥＢ開催電気学会研究会Ｃ部門制御研究会

(71)【出願人】

【識別番号】504136568

【氏名又は名称】国立大学法人広島大学

(74)【代理人】

【識別番号】100196380

【弁理士】

【氏名又は名称】森匡輝

(72)【発明者】

【氏名】脇谷伸

(72)【発明者】

【氏名】山本透

(72)【発明者】

【氏名】槇野泰大

【テーマコード（参考）】

5H004

【Ｆターム（参考）】

5H004GA15

5H004GA30

5H004GB12

5H004HB01

5H004KC01

5H004KC31

5H004LA12

5H004MA12

5H004MA13

5H004MA15

(57)【要約】

【課題】極値の探索に要する時間を短縮することができる制御装置、制御方法及びプログラムを提供する。
【解決手段】制御装置１は、制御対象であるシステム２１の出力ｙに基づいて、システム２１の評価指標νの極値を演算して、システム２１の入力変数θを調整する制御部１２と、出力ｙ、システム２１の状態を表す状態変数ｘ及び評価指標νに影響を与える環境変数ｚのうち少なくとも環境変数ｚを含む情報ベクトルφと、評価指標νの勾配情報ξと、入力変数θとを含む複数のデータセットΦを格納するデータベース１４と、勾配情報ξに基づいてシステム２１の特性が変動したか否かを判定する特性変動判定部１３と、入力変数θの演算条件を修正する更新パラメータを演算する更新パラメータ演算部１５と、を備える。システム２１の特性が変動した場合、制御部１２は、データベース１４に基づいて演算された更新パラメータに基づいて入力変数θを調整する。
【選択図】図１

【特許請求の範囲】

【請求項1】

制御対象であるシステムの出力に基づいて、前記システムの特性を表す評価指標の極値を演算して、前記システムの入力変数を調整する制御部と、
前記出力、前記システムの状態を表す状態変数及び前記評価指標に影響を与える環境変数のうち少なくとも前記環境変数を含む情報ベクトルと、前記評価指標の勾配情報と、前記入力変数とを含む複数のデータセットを格納するデータベースと、
前記勾配情報に基づいて、前記システムの特性が変動したか否かを判定する特性変動判定部と、
前記入力変数の演算条件を修正する更新パラメータを演算する更新パラメータ演算部と、を備え、
前記特性変動判定部において前記システムの特性が変動したと判定された場合、
前記更新パラメータ演算部は、前記データベースに基づいて前記更新パラメータを演算し、
前記制御部は、前記更新パラメータに基づいて前記入力変数を調整する、
ことを特徴とする制御装置。

【請求項2】

前記制御部は、
前記更新パラメータに基づいて、前時刻ステップの前記入力変数を更新し、更新された前記前時刻ステップの前記入力変数に基づいて現在時刻ステップの前記入力変数を演算する、
ことを特徴とする請求項１に記載の制御装置。

【請求項3】

前記更新パラメータ演算部は、
前記データベースに格納されている前記データセットの前記情報ベクトルと、現在時刻ステップの前記情報ベクトルとの距離に基づいて近傍データセットを選択し、前記近傍データセットに基づいて前記更新パラメータを演算する、
ことを特徴とする請求項１又は２に記載の制御装置。

【請求項4】

前記更新パラメータ演算部は、
前記データベースに記憶されている前記データセットを、前記勾配情報が小さい順にソートして、
前記近傍データセットを選択する、
ことを特徴とする請求項３に記載の制御装置。

【請求項5】

前記制御部は、
前記勾配情報が所定の閾値以上であった場合、現在時刻ステップの前記データセットを前記データベースに格納する、
ことを特徴とする請求項１に記載の制御装置。

【請求項6】

前記制御部は、前記入力変数に入力される摂動信号の振幅を調整する振幅調整手段を備え、
前記振幅調整手段は、前記勾配情報の大きさと正の相関を有するように、前記摂動信号の振幅の大きさを調整する、
ことを特徴とする請求項１に記載の制御装置。

【請求項7】

制御対象であるシステムの出力に基づいて、前記システムの特性を表す評価指標の極値を演算して、前記システムの入力変数を調整する制御方法において、
前記評価指標の勾配情報に基づいて、前記システムの特性が変動したか否かを判定し、
前記システムの特性が変動したと判定された場合、前記出力、前記システムの状態を表す状態変数及び前記評価指標に影響を与える環境変数のうち少なくとも前記環境変数を含む情報ベクトルと、前記勾配情報と、前記入力変数とを含む複数のデータセットを格納するデータベースに基づいて、前記入力変数の演算条件を修正する更新パラメータを演算し、演算された前記更新パラメータに基づいて前記入力変数を演算する、
ことを特徴とする制御方法。

【請求項8】

コンピュータを、
制御対象であるシステムの出力、前記システムの状態を表す状態変数及び前記システムの特性を表す評価指標に影響を与える環境変数のうち少なくとも前記環境変数を含む情報ベクトルと、前記評価指標の勾配情報と、前記システムの入力変数とを含む複数のデータセットを格納するデータベース、
前記出力に基づいて前記評価指標の極値を演算して、前記入力変数を調整する制御部、
前記制御部で演算された前記評価指標の勾配情報に基づいて、前記システムの特性が変動したか否かを判定する特性変動判定部、
前記特性変動判定部において前記システムの特性が変動したと判定された場合、前記データベースに基づいて、前記制御部における前記入力変数の演算条件を修正する更新パラメータを演算する更新パラメータ演算部、
として動作させるプログラム。

【発明の詳細な説明】

【技術分野】

【0001】

本発明は、データベースを用いた極値探索制御法による制御装置、制御方法及びプログラムに関する。

【背景技術】

【0002】

近年、極値制御を用いた制御装置、制御方法が種々開発されている。極値制御は、制御対象のモデルを用いることなく、制御対象とするシステムの評価関数の値を最大又は最小に維持することにより制御を行うため、システムが未知のパラメータを含む場合であっても制御を行うことが可能である。

【0003】

また、制御対象となるシステムの多くは非線形性や時変性を有しており、最適点が時間や動作条件によって変動する可能性がある。このようなシステムに対して評価関数を最大化するような目標値を探索する手法として、摂動法による極値探索制御法がある。摂動法では、評価関数の導関数を直接的に用いる必要がなく、システムへの入力信号に摂動信号を加えることで極値探索を行う。したがって、導関数を求めることが困難な非線形システムに対しても適用できる。例えば、特許文献１では、極値制御を用いた最大電力追従制御装置が提案されている。

【先行技術文献】

【特許文献】

【0004】

【特許文献1】特開２０１５－１０２８７６号公報

【発明の概要】

【発明が解決しようとする課題】

【0005】

極値制御では、一般的に勾配法によって逐次的に評価関数の極値探索が行われており、極値探索の精度、効率等が制御性能に大きな影響を与える。特許文献１では、評価関数の傾きに基づいて摂動信号を切り替えることにより、極値探索の精度を高めることとしている。

【0006】

しかしながら、勾配法による逐次的な極値探索では、極値の探索に時間がかかり、探索中の非最適運転による損失が大きくなってしまう。

【0007】

本発明は、上述の事情に鑑みてなされたものであり、極値の探索に要する時間を短縮することができる制御装置、制御方法及びプログラムを提供することを目的とする。

【課題を解決するための手段】

【0008】

上記目的を達成するために、この発明の第１の観点に係る制御装置は、
制御対象であるシステムの出力に基づいて、前記システムの特性を表す評価指標の極値を演算して、前記システムの入力変数を調整する制御部と、
前記出力、前記システムの状態を表す状態変数及び前記評価指標に影響を与える環境変数のうち少なくとも前記環境変数を含む情報ベクトルと、前記評価指標の勾配情報と、前記入力変数とを含む複数のデータセットを格納するデータベースと、
前記勾配情報に基づいて、前記システムの特性が変動したか否かを判定する特性変動判定部と、
前記入力変数の演算条件を修正する更新パラメータを演算する更新パラメータ演算部と、を備え、
前記特性変動判定部において前記システムの特性が変動したと判定された場合、
前記更新パラメータ演算部は、前記データベースに基づいて前記更新パラメータを演算し、
前記制御部は、前記更新パラメータに基づいて前記入力変数を調整する。

【0009】

また、前記制御部は、
前記更新パラメータに基づいて、前時刻ステップの前記入力変数を更新し、更新された前記前時刻ステップの前記入力変数に基づいて現在時刻ステップの前記入力変数を演算する、
こととしてもよい。

【0010】

また、前記更新パラメータ演算部は、
前記データベースに格納されている前記データセットの前記情報ベクトルと、現在時刻ステップの前記情報ベクトルとの距離に基づいて近傍データセットを選択し、前記近傍データセットに基づいて前記更新パラメータを演算する、
こととしてもよい。

【0011】

また、前記更新パラメータ演算部は、
前記データベースに記憶されている前記データセットを、前記勾配情報が小さい順にソートして、
前記近傍データセットを選択する、
こととしてもよい。

【0012】

また、前記制御部は、
前記勾配情報が所定の閾値以上であった場合、現在時刻ステップの前記データセットを前記データベースに格納する、
こととしてもよい。

【0013】

また、前記制御部は、前記入力変数に入力される摂動信号の振幅を調整する振幅調整手段を備え、
前記振幅調整手段は、前記勾配情報の大きさと正の相関を有するように、前記摂動信号の振幅の大きさを調整する、
こととしてもよい。

【0014】

この発明の第２の観点に係る制御方法では、
制御対象であるシステムの出力に基づいて、前記システムの特性を表す評価指標の極値を演算して、前記システムの入力変数を調整する制御方法において、
前記評価指標の勾配情報に基づいて、前記システムの特性が変動したか否かを判定し、
前記システムの特性が変動したと判定された場合、前記出力、前記システムの状態を表す状態変数及び前記評価指標に影響を与える環境変数のうち少なくとも前記環境変数を含む情報ベクトルと、前記勾配情報と、前記入力変数とを含む複数のデータセットを格納するデータベースに基づいて、前記入力変数の演算条件を修正する更新パラメータを演算し、演算された前記更新パラメータに基づいて前記入力変数を演算する。

【0015】

この発明の第３の観点に係るプログラムは、
コンピュータを、
制御対象であるシステムの出力、前記システムの状態を表す状態変数及び前記システムの特性を表す評価指標に影響を与える環境変数のうち少なくとも前記環境変数を含む情報ベクトルと、前記評価指標の勾配情報と、前記システムの入力変数とを含む複数のデータセットを格納するデータベース、
前記出力に基づいて前記評価指標の極値を演算して、前記入力変数を調整する制御部、
前記制御部で演算された前記評価指標の勾配情報に基づいて、前記システムの特性が変動したか否かを判定する特性変動判定部、
前記特性変動判定部において前記システムの特性が変動したと判定された場合、前記データベースに基づいて、前記制御部における前記入力変数の演算条件を修正する更新パラメータを演算する更新パラメータ演算部、
として動作させる。

【発明の効果】

【0016】

本発明の制御装置、制御方法及びプログラムによれば、システムの特性が変動した場合に、データベースに格納されたデータセットに基づいて極値探索を行うので、極値の探索に要する時間を短縮することが可能である。

【図面の簡単な説明】

【0017】

【図1】本発明の実施の形態１に係る制御装置のブロック線図である。

【図2】実施の形態１に係る制御装置のハードウエア構成を示すブロック図である。

【図3】実施の形態１に係る制御処理の流れを示すフローチャートである。

【図4】実施の形態１に係る勾配情報演算の流れを示すフローチャートである。

【図5】ノッチフィルタによる信号処理の例を示すグラフであり、（Ａ）は勾配情報のグラフ、（Ｂ）は周波数成分を除去した勾配情報のグラフ、（Ｃ）は勾配の大きさと閾値との関係を示すグラフである。

【図6】実施の形態１に係る更新パラメータの演算の流れを示すフローチャートである。

【図7】（Ａ）は実施の形態１に係る制御処理の数値例における摩擦力とスリップ率との関係を表すグラフであり、（Ｂ）は環境変数ごとの摩擦力とスリップ率との関係を表すグラフである。

【図8】数値例１におけるシステム及び制御装置の構成を示すブロック線図である。

【図9】数値例１における従来の極値探索制御の場合のシミュレーション結果を表すグラフである。

【図10】数値例１における実施の形態１に係る極値探索制御の場合のシミュレーション結果を表すグラフである。

【図11】数値例２におけるシステム及び制御装置の構成を示すブロック線図である。

【図12】数値例２における従来の極値探索制御の場合のシミュレーション結果を表すグラフである。

【図13】数値例２における実施の形態１に係る極値探索制御の場合のシミュレーション結果を表すグラフである。

【図14】実施の形態２に係る制御装置のブロック線図である。

【図15】数値例３における従来の極値探索制御の場合のシステム及び制御装置の構成を示すブロック線図である。

【図16】数値例３における実施の形態２に係る極値探索制御の場合のシステム及び制御装置の構成を示すブロック線図である。

【図17】数値例３における従来の極値探索制御の場合のシミュレーション結果を表すグラフである。

【図18】数値例３における実施の形態２に係る極値探索制御の場合のシミュレーション結果を表すグラフである。

【発明を実施するための形態】

【0018】

以下、図を参照しつつ、本発明の実施の形態に係る制御装置及び制御方法について説明する。

【0019】

（実施の形態１）
本実施の形態に係る制御装置１は、制御対象を含む開ループ系又は閉ループ系のシステム２１について所定の評価指標を最大化することによって制御を行う極値探索制御システムである。

【0020】

システム２１は、以下の式のように表される。

【数1】

ただし、ｘは状態変数、ｕは操作量、ｚは環境変数、νは評価指標、Ｊは評価関数である。また、ｆ，ｇ，Ｊは連続な関数とする。

【0021】

また、システム２１は、以下の仮定１～３を満たすこととする。
（仮定１）

【数2】

【0022】

（仮定２）
入力変数θについて、システム２１の平衡状態ｘ＝ｌ（θ）は局所的に指数的安定である。

【0023】

（仮定３）
以下の式を満たすθ^＊が存在する。

【数3】

【0024】

上記の条件の下、システム２１の具体的な構成は特に限定されず、システム２１は、システムの状態変数ｘ、制御特性の評価を行うための出力ｙ等を計測可能なものであればよい。また、システム２１の制御特性は、環境変数ｚによって変動し、これにより出力ｙが変動する。制御特性に影響を与える環境変数ｚは、観測可能な変数であり、例えばシステム２１に含まれるプラントで生産される製品の材料、プラント操業に係る気温、湿度等である。

【0025】

制御装置１は、図１のブロック線図に示すように、評価部１１、制御部１２、特性変動判定部１３、データベース１４、更新パラメータ演算部１５を備える。

【0026】

評価部１１は、システム２１の出力ｙ及び予め設定された評価関数Ｊに基づいて制御特性の評価指標νを演算し、出力する。図１に示すように、評価関数Ｊは環境変数ｚを含み、環境変数ｚによって変動する。

【0027】

制御部１２は、極値探索制御法を用いてシステム２１を制御するコントローラである。具体的には、評価部１１で演算される評価指標νに基づいて、評価指標νを極値に維持させるためにシステム２１に入力される入力変数θを調整する。入力変数θは、評価関数Ｊに基づく評価指標νを極値に維持させるための信号であり、例えば、システム２１に入力される目標値ｒ、操作量ｕ等である。制御部１２は、図１に示すように、ハイパスフィルタ１２１、摂動信号発生器１２２、乗算器１２３、ローパスフィルタ１２４、増幅器１２５、積分器１２６、加算器１２７を備える。

【0028】

これらの制御部１２の各要素の基本的な構成は、公知の摂動法による極値探索制御機構に基づいており、システム２１の特性変動があった場合の極値探索方法が従来の極値探索制御と異なる。制御部１２の各要素の具体的な動作については、後述する。

【0029】

特性変動判定部１３は、制御部１２において演算される勾配情報ξに基づいて、システム２１の特性が変動したか否かを判定する。特性が変動したか否かは、例えば予め定められた所定の閾値に基づいて判定される。閾値は、特性変動によって極値探索に要する時間を考慮して適宜選択すればよい。特性変動判定部１３は、システム２１の特性が変動したと判定した場合、更新パラメータ演算部１５へ更新指令を出力する。

【0030】

データベース１４は、システム２１の評価指標νの勾配情報ξ、入力変数θ及び情報ベクトルφを含む複数のデータセットΦを格納する。情報ベクトルφは、システム２１の出力ｙ、状態変数ｘ及び環境変数ｚのうち少なくとも環境変数ｚを含む一群のデータである。情報ベクトルφに含まれるパラメータとしては、データベース１４に格納されたデータセットΦ中の情報ベクトルφと、現在時刻ステップの情報ベクトルφとの距離を演算するために適切なパラメータを適宜選択することとすればよい。

【0031】

更新パラメータ演算部１５は、特性変動判定部１３から更新指令を受信した場合、データベース１４に含まれるデータセットΦと、現在のシステム２１の状態を表すクエリ（要求点）としての情報ベクトルφとに基づいて、現在のシステム２１の状態に近い状態を表すデータセットΦ_ｉを近傍データセットΦ_ｉとして選択する。更新パラメータ演算部１５は、選択された近傍データセットΦ_ｉに基づいて、更新パラメータθ＾^ｏｌｄを演算し、制御部１２へ出力する。

【0032】

更新パラメータθ＾^ｏｌｄは、勾配法によって演算される入力変数θを修正するためのパラメータである。本実施の形態では、データベース１４に格納されているデータセットΦに基づいて演算される更新パラメータθ＾^ｏｌｄを用いて入力変数θを演算する。したがって、システム２１の特性が変動した場合に、データベース１４内のデータセットΦに基づいて極値探索の初期値を再設定することができる。これにより、極値探索に要する時間を短くすることができる。

【0033】

制御部１２は、更新パラメータ演算部１５から更新パラメータθ＾^ｏｌｄを受信した場合、受信した更新パラメータθ＾^ｏｌｄ、演算した勾配情報ξ及び摂動信号発生器１２２で発生される摂動信号に基づいて、入力変数θを演算する。そして、制御部１２は、演算された入力変数θをシステム２１に入力して制御を行う。

【0034】

制御装置１は、例えば、図２に示すハードウエア構成を有する。具体的には、制御装置１は、装置全体の動作を司るＣＰＵ（Central Processing Unit）５１と、ＣＰＵ５１の作業領域等として動作する主記憶部５２と、ＣＰＵ５１の動作プログラム、データベース１４等を記憶する外部記憶部５３と、システムの状態変数ｘ、出力ｙ等の情報を出力する表示部５４と、各種設定値等に係るユーザからの入力を受け付ける入力部５５と、これらを接続するバス５６から構成される。

【0035】

主記憶部５２は、ＲＡＭ（Random Access Memory）等から構成されている。主記憶部５２には、外部記憶部５３に記憶されておりＣＰＵ５１を制御部１２、特性変動判定部１３、更新パラメータ演算部１５等として動作させるための動作プログラム及びデータ等がロードされる。また、主記憶部５２は、ＣＰＵ５１の作業領域（データの一時記憶領域）としても用いられる。

【0036】

外部記憶部５３は、フラッシュメモリ、ハードディスク等の不揮発性メモリから構成される。外部記憶部５３には、ＣＰＵ５１に実行させるための動作プログラム及びデータが予め記憶されている。また、外部記憶部５３は、データベース１４を記憶する。

【0037】

表示部５４は、ユーザにシステムの状態変数ｘ、出力ｙ、環境変数ｚ等の情報を提示する液晶パネル、有機ＥＬ（Electro-Luminescence）等の表示用デバイスである。

【0038】

入力部５５は、ユーザが制御部１２の設定値等を入力する、マウス、キーボード、タッチパネル等の入力デバイスである。

【0039】

続いて、制御装置１を用いた制御方法について、図３のフローチャートを参照しつつ、具体的に説明する。

【0040】

準備として、初期データベースを作成する。初期データベースとしてのデータベース１４に格納するデータセットΦの形式は、以下の式（１）に示すように、情報ベクトルφ、勾配情報ξ、入力変数θ＾を含む。

【数4】

ここで、θ＾は、図１に示すように、制御部１２で演算される入力変数θの更新値である。

【0041】

また、情報ベクトルφは、以下の式（２）に示すように、出力ｙ、状態変数ｘ、環境変数ｚを含む。より詳細には、状態変数ｘはｐ次元のベクトル（状態変数ベクトル）であり、環境変数ｚはｑ次元のベクトル（環境変数ベクトル）である。

【数5】

ここで、ｎ_ｙ、ｎ_ｘｉ、ｎ_ｚｉは各信号の次数を表す。

【0042】

上記のように表される様々な時刻ｔにおけるデータセットΦが、データベース１４に格納される。データベース１４に格納されたデータセットΦには、Φ_１，Φ_２，・・・，Φ_Ｎ（Ｎはデータセット数）としてインデックスが付与されており、以下インデックスが付与されたデータセットΦを以下の式（３）のように表す。

【数6】

【0043】

初期データベースとしてデータベース１４に格納されるデータセットΦは、過去の操業データ、コンピュータシミュレーションのデータ等に基づいて作成される。初期データベースに格納すべきデータは、評価指標νの極値付近を探索しているときのデータのみであるので、予め設定された所定の閾値ｔｈ_１よりも勾配情報ξが小さい場合のデータをデータベース１４に格納することとする。なお閾値ｔｈ_１の大きさ（ｔｈ_１∈Ｒ）は適宜調整すればよい。

【0044】

初期データベースの作成が完了した後、システム２１の操業とともに、制御装置１による制御が開始される。制御が開始されると、制御装置１は、システム２１の出力ｙを取得する（ステップＳ１１）。

【0045】

評価部１１は、取得した出力ｙ及び予め設定されている評価関数Ｊに基づいて、評価指標νを演算する（ステップＳ１２）。評価関数Ｊは、出力ｙの関数であり、入力変数θ、環境変数ｚ等によって変動する。

【0046】

制御部１２は、ステップＳ１２で演算された評価指標νに基づいて、勾配情報ξを演算する（ステップＳ１３）。図４は、ステップＳ１３の勾配情報ξの演算の詳細な流れを示すフローチャートである。図１及び図４に示すように、制御部１２は、取得した評価指標νをハイパスフィルタ１２１に入力して、低周波成分（直流成分）を除去する（ステップＳ３１）。ハイパスフィルタ１２１の特性は、以下に示す通りである。

【数7】

ここで、ω_ｈはカットオフ周波数である。

【0047】

ハイパスフィルタ１２１で低周波成分を除去された信号ν－ηは、乗算器１２３へ入力される。

【0048】

また、摂動信号発生器１２２は、摂動信号を発生させ、乗算器１２３へ入力する。摂動信号は、評価指標νを極値に保つための信号として摂動法を用いた極値探索制御で用いられるものであり、特に限定されない。本実施の形態では、図１に示すように、乗算器１２３へ入力する摂動信号としてβｓｉｎωｔを用いる。周波数ωは、システム２１の特性を考慮して十分遅いもの、振幅βは、システム２１の特性を考慮して十分小さいものを適宜選択すればよい。

【0049】

乗算器１２３は、ステップＳ３１で生成された信号ν－ηと、摂動信号βｓｉｎωｔとを乗算し、ξ’を生成する（ステップＳ３２）。制御部１２は、ステップＳ３２で演算したξ’をローパスフィルタ１２４に入力して高周波成分を除去し、勾配情報ξを演算する（ステップＳ３３）。これにより、制御部１２は、直接的に評価関数Ｊの導関数を用いることなく勾配情報ξを取得することができる。ローパスフィルタ１２４の特性は、以下に示す通りである。

【数8】

ここで、ω_ｌはカットオフ周波数である。

【0050】

図３に戻り、制御部１２は、ステップＳ１３で演算した勾配情報ξを特性変動判定部１３及び増幅器１２５へ入力する。特性変動判定部１３は、勾配情報ξに基づいて、システム２１に特性変動が生じているか否か判定する。具体的には、特性変動判定部１３は、下記の特性を有するノッチフィルタを用いて、勾配情報ξから摂動信号の周波数成分（摂動信号周波数ω_ｎ）を除去してξ~を演算する（ステップＳ１４）。

【数9】

ただし、ｄ，ζはノッチフィルタの設計パラメータである。

【0051】

特性変動判定部１３は、演算されたξ~を時間微分して、勾配の変化の大きさを表すγを演算する（ステップＳ１５）。これにより、図５（Ａ）、（Ｂ）の例に示すように、勾配情報ξから周波数成分を除いたγを演算することができる。特性変動判定部１３は、演算されたγと予め設定された閾値ε_１とを用いて、システム２１の特性が変動しているか否かを判定する（ステップＳ１６）。

【0052】

図５（Ｃ）の例に示すように、勾配の変化を表すγ^２が閾値ε_１よりも大きく、システム２１の特性が変化していると判定される場合（ステップＳ１６のＹＥＳ）、更新パラメータ演算部１５は、更新パラメータθ＾^ｏｌｄの演算を行う（ステップＳ１７）。図６は、ステップＳ１７の更新パラメータθ＾^ｏｌｄの演算の詳細な流れを示すフローチャートである。

【0053】

図６に示すように、更新パラメータ演算部１５は、データベース１４に格納されたデータセットΦをソートする（ステップＳ４１）。具体的には、更新パラメータ演算部１５は、勾配情報ξ_ｉの小さなものからデータセットΦを昇順にソート、すなわちデータセットΦ_ｉのインデックスを変更する。

【0054】

更新パラメータ演算部１５は、クエリ（要求点）を取得する（ステップＳ４２）。以下の式（４）で表されるクエリは、過去及び現在の時刻ステップで取得され、制御装置１を構成する主記憶部５２等に記憶されているシステム２１の出力ｙ、状態変数ｘ、環境変数ｚ等に基づいて生成される。

【数10】

【0055】

更新パラメータ演算部１５は、ステップＳ４２で取得したクエリｑ（ｔ）と、データベース１４内の第ｉ番目のデータセットΦ_ｉに含まれる情報ベクトルφ_ｉとの距離ｄ_ｉ（ｑ（ｔ），φ_ｉ）を演算する（ステップＳ４３）。距離ｄ_ｉ（ｑ（ｔ），φ_ｉ）は、例えば、以下の式（５）に示す重み付きＬ１ノルムとする。

【数11】

ここで、φ_ｌは情報ベクトルφのｌ番目の要素、ｍａｘ（φ_ｉｌ（ｍ））はデータベース１４内に格納されている全ての情報ベクトルφのｌ番目の要素の中で最大の要素を示す。また、ｍｉｎ（φ_ｉｌ（ｍ））はデータベース１４内に格納されている全ての情報ベクトルφのｌ番目の要素の中で最小の要素を示す。

【0056】

更新パラメータ演算部１５は、ステップＳ４３で演算した距離ｄ_ｉ（ｑ（ｔ），φ_ｉ）の中で小さいものから上位ｎ個のデータセットΦ_ｉを近傍データセットΦ_ｉとして選択する（ステップＳ４４）。近傍データセットΦ_ｉであるか否かは、例えば、予め設定された閾値ε_ｄを用いて、インデックスｉ＝１から順に演算された距離ｄ_ｉ（ｑ（ｔ），φ_ｉ）がｄ_ｉ（ｑ（ｔ），φ_ｉ）＜ε_ｄを充足するか否かによって判定し、近傍データセットΦ_ｉの数がｎ個に達するまで距離計算が行われる。データベース１４内のデータセットΦ_ｉは、ステップＳ４１で勾配情報ξ_ｉの小さい順にソートされているので、極値に近いと考えられるΦ_ｉから順に近傍データセットΦ_ｉを選択することができる。

【0057】

近傍データセット数ｎは、予めユーザが決定することとしてもよいし、自動的に決定されることとしてもよい。自動的に近傍データセット数ｎを決定する場合、更新パラメータ演算部１５は、例えば、勾配の変動の大きさを表す変数γの大きさに基づいて決定することとすればよい。

【0058】

ステップＳ４４によって選択された近傍データセットΦ_ｉが存在しない場合（ステップＳ４５のＮＯ）、更新パラメータ演算部１５は、更新パラメータθ＾^ｏｌｄの演算を終了する。

【0059】

ステップＳ４４によって選択された近傍データセットΦ_ｉが存在する場合（ステップＳ４５のＹＥＳ）、距離ｄ_ｉ（ｑ（ｔ），φ_ｉ）に基づいて、以下の式（６）を満たすように、近傍データセットΦ_ｉごとの重みを演算する（ステップＳ４６）。

【数12】

【0060】

近傍データセットΦ_ｉに対応する重みｗ_ｉは、例えば、以下の式（７）によって演算される。

【数13】

【0061】

更新パラメータ演算部１５は、近傍データセットΦ_ｉに含まれる入力変数θ_ｉと、ステップＳ４６で演算された重みｗ_ｉとに基づいて、以下の式（８）から、入力変数θを決定するための更新パラメータθ＾^ｏｌｄを演算する（ステップＳ４７）。

【数14】

【0062】

更新パラメータ演算部１５は、ステップＳ４７で演算された更新パラメータθ＾^ｏｌｄを制御部１２へ送信し、制御部１２は主記憶部５２等に記憶されている前時刻ステップの入力変数θ（ｔ－１）を更新パラメータθ＾^ｏｌｄに更新する（ステップＳ４８）。これにより、入力変数θの演算条件が修正される。

【0063】

図３に戻り、制御部１２は、入力変数の更新値θ＾を演算する（ステップＳ１８）。具体的には、制御部１２の積分器１２６は、以下の式（９）で表される数値積分を行う。

【数15】

ここで、ｋはゲイン、ｈはｋ及びξの関数である。

【0064】

上述したように、環境変数ｚの変化等によってシステム２１の特性が所定の閾値より大きく変動した場合、更新パラメータ演算部１５で演算された更新パラメータθ＾^ｏｌｄによって前時刻ステップの入力変数θ＾（ｔ－１）が更新されている。これにより、データベース１４に格納されたデータセットΦに基づいて、現在時刻ステップ以降の極値探索における初期値を、より最適値に近い値とすることが可能となる。すなわち、過去の最適化結果を利用して、特性変動後の極値探索を行うことができる。したがって、極値の探索に要する時間を短縮し、探索中の非最適運転による損失を抑制することが可能となる。

【0065】

ステップＳ１６に戻り、γ^２が閾値ε_１以下であり、システム２１の特性変化が生じていないと判定される場合（ステップＳ１６のＮＯ）、式（９）に示すように、前時刻ステップの入力変数θ（ｔ－１）、ステップＳ１３で演算された勾配情報ξに基づいて、増幅器１２５及び積分器１２６によって、現在時刻ステップの入力変数の更新値θ＾が演算される（ステップＳ１９）。

【0066】

また、勾配情報ξが予め定められた閾値ε_２より小さい（ξ^２＜ε_２）場合（ステップＳ２０のＹＥＳ）、制御部１２は、その時点のデータセットΦを作成してデータベース１４に格納する（ステップＳ２１）。これにより、極値に近い状態のデータセットΦをデータベース１４に追加して、環境変数ｚの変動等による特性変化に対応可能な範囲を拡大させ、極値探索時の時間短縮効果を高めることができる。

【0067】

また、勾配情報ξが予め定められた閾値ε_２以上（ξ^２≧ε_２）の場合（ステップＳ２０のＮＯ）、制御部１２は、データセットΦを追加せず次のステップに進む。

【0068】

制御部１２は、ステップＳ１８又はステップＳ１９で演算された入力変数の更新値θ＾を加算器１２７に入力する。

【0069】

また、摂動信号発生器１２２は、摂動信号を発生させ、加算器１２７へ入力する。本実施の形態では、図１に示すように、加算器１２７へ入力する摂動信号としてαｓｉｎωｔを用いる。振幅αは乗算器１２３に入力される摂動信号の振幅βと同様にシステム２１の特性を考慮して適宜選択すればよい。

【0070】

加算器１２７は、入力変数の更新値θ＾と、摂動信号αｓｉｎωｔとを加算して入力変数θを演算する（ステップＳ２２）。制御部１２は、演算した入力変数θをシステム２１へ入力することにより（ステップＳ２３）、極値制御を行う。

【0071】

以下、制御動作が終了するまで、制御装置１は、ステップＳ１１～Ｓ２３の処理を繰り返して、システム２１の制御を行う。

【0072】

以上説明したように、本実施の形態に係る制御装置１は、摂動法を用いて極値探索制御を行う制御部１２と、システム２１の状態変数ｘ、環境変数ｚ、入力変数θ等を含むデータセットΦが格納されたデータベース１４とを備える。そして、システムの特性が変動している場合、データベース１４を用いて入力変数θを調整することにより、極値探索に係る初期値を、極値に近い値に再設定する。したがって、極値探索に要する時間を短縮することができるので、探索中の非最適運転による損失を低減することができる。

【0073】

また、近傍データセットΦ_ｉの探索において、更新パラメータ演算部１５は、データベース１４に格納されているデータセットΦを、評価指標νの勾配の大きさを表す勾配情報ξ_ｉが小さい順にソートする。そして、更新パラメータ演算部１５は、ソートされたデータセットΦ_ｉの情報ベクトルφ_ｉとクエリｑ（ｔ）との距離を順次演算して、近傍データセットΦ_ｉを選択することとしている。したがって、より極値に近い条件のデータセットΦを近傍データセットΦ_ｉとして選択できるので、極値探索にかかる時間短縮の効果をより高めることができる。

【0074】

本実施の形態に係る制御装置１では、制御対象としてのシステム２１に入力される目標値ｒ、操作量ｕ等を入力変数θとして想定したが、これに限られない。例えば、入力変数θは、システム２１に内包されるＰＩＤコントローラ等の制御パラメータであることとしてもよい。

【0075】

（数値例１）
以下、本実施の形態に係る極値探索制御の数値例について、自動車のアンチロックブレーキシステムにおける極値探索制御を例として説明する。具体的には、タイヤと路面との間の摩擦力μを最大化することにより、ブレーキ作動時の制動距離を短くすることを目標とする。図７（Ａ）は、以下の式に示す自動車のスリップ率λと摩擦力μとの関係を示すグラフである。

【数16】

ただし、ｗｓはタイヤの回転速度、ｖｓは車速である。

【0076】

図７（Ａ）に示すように、例えば、ブレーキによる制動力を制御することにより、スリップ率λを調整し、摩擦力μを最大値に維持することができる。しかしながら、路面の状況、タイヤの状況等の環境変数ｚによって、摩擦力μとスリップ率λとの関係は変化するので、最大摩擦力となるスリップ率（最適点）λ^＊を把握することは困難である。

【0077】

本例では、図７（Ｂ）に示す環境変数ｚ＝１及びｚ＝２の場合の摩擦力μとスリップ率λとの関係を表すデータセットΦが予めデータベース１４に格納されていることとし、環境変数ｚ＝３とした場合の制動距離について、本実施の形態に係る制御装置１の場合と、データベース１４を用いない従来の極値探索制御に係る制御装置の場合とをコンピュータシミュレーションによって比較した。

【0078】

図８は、本数値例に係るシステム２１及び制御装置１の構成を示すブロック線図である。図８に示すように、本例では、タイヤの回転速度ｗｓ、車速ｖｓから演算されるスリップ率λを出力ｙとする。そして、制御部１２は、摩擦力μの極値を探索して、入力変数θであるスリップ率λを演算し、システム２１に入力する。また、本例に係る情報ベクトルφは、環境変数ｚのみを含む。

【0079】

図９は、従来の極値探索制御によるシミュレーション結果を示すグラフである。また、図１０は、本実施の形態に係る制御装置１によるシミュレーション結果を示すグラフである。図９及び図１０に示すように、本実施の形態に係るデータベース１４を用いた極値探索制御により、未知の環境を表す環境変数ｚ＝３の場合において、制動距離を短くすることができている。これは、本実施の形態に係る制御装置１を用いることによって、データベース１４に格納されているデータセットΦに基づいて、未知の環境による極値探索の初期値を、より極値に近い位置に設定することができているためである。

【0080】

（数値例２）
本実施の形態に係る極値探索制御の別の数値例について説明する。図１１に示すように、本例では、以下の式に示すコントローラ及び制御対象を含むシステム２１を、極値探索制御によって制御する。

【数17】

【0081】

システム２１は、以下の式の通りである。評価関数Ｊは環境変数ｚを含む。環境変数ｚは、６００ｓごとにｚ＝２，４，６，３と切り替わる。また、ｚには、平均０、分散０．０１のガウス性白色雑音が重畳される。

【数18】

【0082】

図１２は、従来の極値探索制御によるシミュレーション結果を示すグラフである。また、図１３は、本実施の形態に係る制御装置１によるシミュレーション結果を示すグラフである。図１２及び図１３に示すように、本実施の形態に係るデータベース１４を用いた極値探索制御により、環境変数ｚ＝３となった場合において、効率よく極値探索を行えていることがわかる。これは、過去に探索された極値付近のデータセットΦを活用することにより、環境変数ｚが変動した場合の極値探索における初期値が、極値に近い値に設定できているためである。

【0083】

以上、数値例を用いて説明したように、データベース１４を用いて極値探索制御を行うことにより、システムの特性が変動した場合の極値探索に要する時間を短縮し、制御性能を向上させることができる。

【0084】

（実施の形態２）
上記実施の形態１に係る制御装置１では、摂動信号を用いて極値探索制御を行うこととしている。この場合、入力変数θに入力される摂動信号の影響によって、評価指標νの最適値付近において、出力ｙに振動が生じる場合がある。この摂動信号による振動の発生を抑制するため、制御装置１に摂動信号の振幅調整手段を付加することもできる。本実施の形態では、摂動信号の振幅調整を行う制御装置２について説明する。

【0085】

本実施の形態に係る制御装置２は、摂動信号の振幅を調整する振幅調整手段１６を備える点が実施の形態１に係る制御装置１と異なり、その他の構成等については実施の形態１と同様であるので、同じ符号を付して説明を省略する。

【0086】

具体的には、制御装置２は、図１４に示すように、ローパスフィルタ１２４の出力信号に基づいて、摂動信号発生器１２２で生成された摂動信号の振幅を調整する振幅調整手段１６を備える。具体的には、振幅調整手段１６は、ローパスフィルタ１２４の出力信号である勾配情報ξの大きさが大きい場合には摂動信号の振幅を大きくし、勾配情報ξが小さい場合には摂動信号の振幅を小さくする。すなわち、振幅調整手段１６は、勾配情報ξの大きさと正の相関を有するように、摂動信号の振幅の大きさを調整する。これにより、極値探索の最適値付近において、摂動信号の振幅が小さくなるので、定常的な振動の発生を抑制することができる。

【0087】

振幅調整手段１６による摂動信号の振幅の算出条件は特に限定されず、上述のように極値探索に係る変動の大きさを示す勾配情報ξの大きさと正の相関を有するように増減するものであればよい。本実施の形態に係る振幅調整手段１６は、勾配情報ξを用いて以下の式で表される振幅α（ξ）を演算する。

【数19】

ただし、ｋ_ａは正の定数である。

【0088】

これにより、勾配情報ξの大きさに伴って、摂動信号の振幅の大きさを増減することができるので、速やかに極値探索を行うことができるとともに、最適値付近における振動を抑制することができる。

【0089】

（数値例３）
以下、実施の形態２に係る振幅調整手段１６の効果を確認するための比較シミュレーションの例について説明する。本例では、図１５のブロック線図に示す従来の極値探索制御を行う極値探索制御システムＥＳと、図１６のブロック線図に示す実施の形態２に係る振幅調整手段１６を備えるデータベース駆動極値探索制御システムＤＤＥＳとを同様の条件で動作させて比較シミュレーションを行った。また、図１６に係るデータベース駆動極値探索制御システムＤＤＥＳでは、図１５に係る極値探索制御システムＥＳによる探索結果をデータベース１４に格納して用いることとしている。

【0090】

コントローラと制御対象とを含むシステム２１の閉ループ系の伝達関数は以下のように表される。

【数20】

【0091】

制御対象Ｇ（ｓ）は、以下のように設定した。

【数21】

また、コントローラＣ（ｓ）は、以下のように設定した。

【数22】

【0092】

以下に示すように評価関数Ｊは３つの環境変数ｚ_１～ｚ_３を含む。

【数23】

【0093】

また、環境変数ｚ_１～ｚ_３は以下のように６００ｓごとに切り替わることとした。

【表1】

【0094】

図１７に示す極値探索制御システムＥＳの制御結果と比較して、図１８に示すデータベース駆動極値探索制御システムＤＤＥＳの制御結果では、速やかに極値探索が行われ、高い制御性能が得られていることがわかる。また、図１８の出力ｙのグラフ中に拡大して示すように、最適値付近において、摂動信号による振動の振幅が減衰しており、より安定的な制御を行えていることがわかる。

【0095】

上記実施の形態に係る制御方法は、通常のコンピュータシステムを用いて実現可能である。例えば、上記実施の形態に係る極値探索制御を実行するためのコンピュータプログラムを、インターネット等のネットワークを介して配布し、当該コンピュータプログラムをコンピュータにインストールすることにより、コンピュータ装置を上記の極値探索制御を実行する制御装置として機能させることができる。

【産業上の利用可能性】

【0096】

本発明は、勾配法を用いて極値探索制御を行う制御装置に好適である。特に、環境変数の変動によって特性が変動するシステムの制御に好適である。

【符号の説明】

【0097】

１，２制御装置、１１評価部、１２制御部、１２１ハイパスフィルタ、１２２摂動信号発生器、１２３乗算器、１２４ローパスフィルタ、１２５増幅器、１２６積分器、１２７加算器、１３特性変動判定部、１４データベース、１５更新パラメータ演算部、１６振幅調整手段、２１システム、５１ＣＰＵ、５２主記憶部、５３外部記憶部、５４表示部、５５入力部、５６バス

【図1】