特開2020-71766(P2020-71766A)IP Force 特許公報掲載プロジェクト 2022.1.31 β版

知財求人 - 知財ポータルサイト「IP Force」

▶ コベルコ建機株式会社の特許一覧 ▶ 国立大学法人広島大学の特許一覧

<>
  • 特開2020071766-感性フィードバック制御装置 図000031
  • 特開2020071766-感性フィードバック制御装置 図000032
  • 特開2020071766-感性フィードバック制御装置 図000033
  • 特開2020071766-感性フィードバック制御装置 図000034
  • 特開2020071766-感性フィードバック制御装置 図000035
  • 特開2020071766-感性フィードバック制御装置 図000036
  • 特開2020071766-感性フィードバック制御装置 図000037
  • 特開2020071766-感性フィードバック制御装置 図000038
  • 特開2020071766-感性フィードバック制御装置 図000039
  • 特開2020071766-感性フィードバック制御装置 図000040
  • 特開2020071766-感性フィードバック制御装置 図000041
< >
(19)【発行国】日本国特許庁(JP)
(12)【公報種別】公開特許公報(A)
(11)【公開番号】特開2020-71766(P2020-71766A)
(43)【公開日】2020年5月7日
(54)【発明の名称】感性フィードバック制御装置
(51)【国際特許分類】
   G05B 11/36 20060101AFI20200410BHJP
【FI】
   G05B11/36 Z
【審査請求】未請求
【請求項の数】4
【出願形態】OL
【全頁数】19
(21)【出願番号】特願2018-206633(P2018-206633)
(22)【出願日】2018年11月1日
【国等の委託研究の成果に係る記載事項】(出願人による申告)平成30年度、国立研究開発法人科学技術振興機構 研究成果展開事業 センター・オブ・イノベーションプログラム『精神的価値が成長する感性イノベーション拠点』委託研究開発、産業技術力強化法第17条の適用を受ける特許出願
(71)【出願人】
【識別番号】000246273
【氏名又は名称】コベルコ建機株式会社
(71)【出願人】
【識別番号】504136568
【氏名又は名称】国立大学法人広島大学
(74)【代理人】
【識別番号】110001427
【氏名又は名称】特許業務法人前田特許事務所
(72)【発明者】
【氏名】山本 透
(72)【発明者】
【氏名】木下 拓矢
【テーマコード(参考)】
5H004
【Fターム(参考)】
5H004GA26
5H004GB12
5H004KB01
5H004KC48
5H004KD63
(57)【要約】
【課題】操作者の感性をフィードバック制御できる制御装置を提供する。
【解決手段】感性メータ20は、対象機器10の出力u(t)に対応する操作者の生体情報x(t)を検出し、当該生体情報x(t)に基づき、操作者の快適度y(t)を決定する。第1制御部30は、快適度y(t)に関する第1目標値r(t)と、快適度y(t)との差分e(t)に基づき、出力u(t)に関する第2目標値w(t)を決定する。第2制御部40は、第2目標値w(t)と出力u(t)との差分ε(t)に基づき、対象機器10に対する制御入力vc (t)を決定する。δ設定部50は、操作者による対象機器10に対する操作入力vh (t)、及び、制御入力vc (t)のそれぞれについて、操作者の操作レベルに応じた重み付けを行う。重み付けされた操作入力vh (t)及び制御入力vc (t)が合算されて対象機器10に入力される。
【選択図】図1
【特許請求の範囲】
【請求項1】
操作者によって操作される対象機器と、
前記対象機器の出力u(t)に対応する前記操作者の生体情報x(t)を検出し、当該生体情報x(t)に基づき、前記操作者の快適度y(t)を決定する感性メータと、
前記快適度y(t)に関する第1目標値r(t)と、前記快適度y(t)との差分に基づき、前記出力u(t)に関する第2目標値w(t)を決定する第1制御部と、
前記第2目標値w(t)と前記出力u(t)との差分に基づき、前記対象機器に対する制御入力vc (t)を決定する第2制御部と、
前記操作者による前記対象機器に対する操作入力vh (t)、及び、前記制御入力vc (t)のそれぞれについて、前記操作者の操作レベルに応じた重み付けを行う重み付け設定部と
を備え、
前記重み付け設定部によりそれぞれ重み付けされた前記操作入力vh (t)及び前記制御入力vc (t)が合算されて前記対象機器に入力される、
感性フィードバック制御装置。
【請求項2】
請求項1に記載の感性フィードバック制御装置において、
前記感性メータは、快・不快、活性・非活性、期待感の3つの情報を前記生体情報x(t)として検出し、当該3つの情報の相関性から得られる感性値を前記快適度y(t)として決定する、
感性フィードバック制御装置。
【請求項3】
請求項1又は2に記載の感性フィードバック制御装置において、
前記第1目標値r(t)、前記第2目標値w(t)及び前記快適度y(t)が逐次蓄積されるデータベースをさらに備え、
前記第1制御部は、前記データベースに蓄積されているデータを用いて、制御パラメータの調整を行いながら、前記第2目標値w(t)を決定する、
感性フィードバック制御装置。
【請求項4】
請求項1〜3のいずれか1項に記載の感性フィードバック制御装置において、
前記対象機器は、建設機械である、
感性フィードバック制御装置。
【発明の詳細な説明】
【技術分野】
【0001】
本発明は、感性フィードバック制御装置に関するものである。
【背景技術】
【0002】
内閣府の調査によれば、我が国は、国内総生産(GDP)が高いにも関わらず、幸福度が低いとされている。すなわち、GDPに関する「物の豊かさ」と、幸福度に関する「心の豊かさ」との間には大きなギャップが存在している。
【0003】
このようなギャップを埋めるための方策の1つとして、既に高度化されている「物」(福祉支援機器など)が、人の感性を考慮した動作を行うことによって、心の豊かさを向上させることが考えられている(例えば特許文献1)。また、「感性」の可視化技術についても、社会実装を想定した研究が行われている(例えば特許文献2)。
【先行技術文献】
【特許文献】
【0004】
【特許文献1】特開2018−36773号公報
【特許文献2】特開2017−74356号公報
【発明の概要】
【発明が解決しようとする課題】
【0005】
しかしながら、感性に関するほとんどの研究は、製品のデザイン評価・設計などの静的な分野であり、特に操作者によって操作される自動車や建設機械等の機器を対象として操作者の感性を動的に制御する研究はほとんど行われていない。
【0006】
そこで、本発明は、操作者によって操作される機器において操作者の感性をフィードバック制御できる感性フィードバック制御装置を提供することを目的とする。
【課題を解決するための手段】
【0007】
前記の目的を達成するために、本願発明者らは、人の感性は、時変系や非線形系であると考えられるため、そのモデル化は困難であることに着目し、以下のような発明を想到した。すなわち、操作者によって操作される対象機器の出力(例えば油圧ショベルの応答速度)に対応する人の感性を計測し、制御対象値として「快適度」を設定し、「快適度」が目標値を満足するように対象機器の制御を行うという発明である。ここで、「快適度」は、操作者が、脳内の対象機器の目標出力(例えば油圧ショベルの目標応答速度)と同様な出力が得られるように現実の対象機器の操作ができたときに、最も高い値を持つ。
【0008】
以上のように、本発明は、(i) 操作者のモデルを必要とせず、(ii)感性情報がフィードバックされることから、本発明を「感性フィードバック制御」と称するものとする。また、本発明の基本構成は、対象機器に関する制御系である内側ループに、感性フィードバック制御系である外側ループを付加したカスケード制御系である。
【0009】
具体的には、本発明に係る感性フィードバック制御装置は、操作者によって操作される対象機器と、対象機器の出力u(t)に対応する操作者の生体情報x(t)を検出し、当該生体情報x(t)に基づき、操作者の快適度y(t)を決定する感性メータと、快適度y(t)に関する第1目標値r(t)と、快適度y(t)との差分に基づき、出力u(t)に関する第2目標値w(t)を決定する第1制御部と、第2目標値w(t)と出力u(t)との差分に基づき、対象機器に対する制御入力vc (t)を決定する第2制御部と、操作者による対象機器に対する操作入力vh (t)、及び、制御入力vc (t)のそれぞれについて、操作者の操作レベルに応じた重み付けを行う重み付け設定部とを備え、重み付け設定部によりそれぞれ重み付けされた操作入力vh (t)及び制御入力vc (t)が合算されて対象機器に入力される。
【0010】
本発明に係る感性フィードバック制御装置によると、感性メータが、対象機器の出力u(t)に対応する操作者の生体情報x(t)を検出し、当該生体情報x(t)に基づき、操作者の快適度y(t)を決定する。また、第1制御部は、快適度y(t)に関する第1目標値r(t)と、快適度y(t)との差分に基づき、出力u(t)に関する第2目標値w(t)を決定する。また、第2制御部は、第2目標値w(t)と出力u(t)との差分に基づき、対象機器に対する制御入力vc (t)を決定する。このため、感性メータ、第1制御部及び第2制御部を用いて、対象機器において操作者の感性(具体的には快適度)をフィードバックした制御を行うことができる。
【0011】
また、本発明に係る感性フィードバック制御装置によると、重み付け設定部は、操作者による対象機器に対する操作入力vh (t)、及び、制御入力vc (t)のそれぞれについて、操作者の操作レベルに応じた重み付けを行い、重み付けされた操作入力vh (t)及び制御入力vc (t)が合算されて対象機器に入力される。このため、重み付け設定部を用いて、感性フィードバックの程度を操作者の操作レベルに応じて設定することができる。これにより、例えば、未熟な操作者に対しては感性フィードバックの程度を高くして、対象機器における当該操作者の操作入力の反映度を低くしたり、逆に、熟練操作者に対しては感性フィードバックの程度を低くして、対象機器における当該操作者の操作入力の反映度を高くしたりすることができる。
【0012】
また、本発明に係る感性フィードバック制御装置において、感性メータは、快・不快、活性・非活性、期待感の3つの情報を生体情報x(t)として検出し、当該3つの情報の相関性から得られる感性値を快適度y(t)として決定してもよい。
【0013】
このようにすると、感性である「快適度」を定量的に評価できるので、感性フィードバック制御の精度を向上させることができる。
【0014】
また、本発明に係る感性フィードバック制御装置において、第1目標値r(t)、第2目標値w(t)及び快適度y(t)が逐次蓄積されるデータベースをさらに備え、第1制御部は、データベースに蓄積されているデータを用いて、制御パラメータの調整を行いながら、第2目標値w(t)を決定してもよい。
【0015】
このようにすると、非線形系である操作者の感性をモデル化することなく、データベース駆動型制御を用いて、感性フィードバック制御を行うことができる。
【0016】
また、本発明に係る感性フィードバック制御装置において、対象機器は、建設機械であってもよい。
【0017】
このようにすると、操作者が、脳内の建設機械の目標出力(例えば油圧ショベルの目標応答速度)と同様な出力が得られるように現実の建設機械を操作することが可能になる。
【発明の効果】
【0018】
本発明によると、操作者によって操作される機器において操作者の感性をフィードバック制御できる感性フィードバック制御装置を提供することができる。
【図面の簡単な説明】
【0019】
図1】実施形態に係る感性フィードバック制御装置の構成図である。
図2】実施形態に係る感性フィードバック制御装置において用いられる感性多軸モデルの模式図である。
図3】実施形態に係る感性フィードバック制御装置において用いられるデータベース駆動型制御を説明する図である。
図4】実施形態に係る感性フィードバック制御装置によって得られる効果を示す図である。
図5図1に示す感性フィードバック制御装置においてδ値が1である場合の構成を簡単化して示す図である。
図6】実施形態に係る感性フィードバック制御装置において用いられるFRITのブロック線図である。
図7】実施形態に係る感性フィードバック制御装置における快適度と出力誤差との関係を示す図である。
図8】実施形態に係る感性フィードバック制御装置における快適度、出力及び入力の時間変化をシミュレーションした結果を示す図である。
図9】実施形態に係る感性フィードバック制御装置における制御パラメータの時間変化をシミュレーションした結果を示す図である。
図10】比較例に係る感性フィードバック制御装置の構成図である。
図11】比較例に係る感性フィードバック制御装置における快適度、出力及び入力の時間変化をシミュレーションした結果を示す図である。
【発明を実施するための形態】
【0020】
以下、図面を参照しながら、本発明の実施形態に係る感性フィードバック制御装置について説明する。尚、本発明の範囲は、以下の実施の形態に限定されず、本発明の技術的思想の範囲内で任意に変更可能である。
【0021】
図1は、一実施形態に係る感性フィードバック制御装置の構成図である。図1に示すように、感性フィードバック制御装置100は、対象機器10と、感性メータ20と、第1制御部30と、第2制御部40と、重み付け(δ)設定部50とを備えている。対象機器10は、操作者によって操作される機器、例えば、自動車や建設機械等である。感性メータ20は、対象機器10の出力u(t)に対応する操作者の生体情報x(t)を検出し、当該生体情報x(t)に基づき、操作者の快適度y(t)を決定する。対象機器10の出力u(t)とは、例えば、油圧ショベルの応答速度である。第1制御部30は、快適度y(t)に関する第1目標値(目標快適度)r(t)と、快適度y(t)との差分e(t)に基づき、出力u(t)に関する第2目標値(目標出力)w(t)を決定する。第2制御部40は、目標出力w(t)と出力u(t)との差分ε(t)に基づき、対象機器10に対する制御入力vc (t)を決定する。δ設定部50は、操作者による対象機器10に対する操作入力vh (t)、及び、制御入力vc (t)のそれぞれについて、操作者の操作レベルに応じた重み付けを行う。
【0022】
(感性メータ)
本実施形態では、対象機器の出力u(t)に対応する操作者の生体情報x(t)に基づく快適度y(t)が制御パラメータに用いられる。感性メータ20は、操作者の生体情報x(t)を検出する手段として、例えば、CCDカメラによる顔表情の検出、心拍センサによる心拍の検出、CCDカメラによる呼吸(回数や深さ)の検出、皮膚インピーダンスセンサによる皮膚抵抗の検出、筋電センサによる上肢筋電、下肢筋電の検出、マイクによる音声情報の検出等から適宜選択される一つ或いは二つ以上の手段を用いてもよい。
【0023】
ところで、人は何かを見たり、聞いたり、或いは何かに触れたり、触れられたりしたときに、わくわくしたり、うきうきしたり、はらはらしたり、どきどきしたりといった感情或いは情動を抱くことがある。そのような感情或いは情動は人の複雑で高次の脳活動によってもたらされると考えられ、感情或いは情動の形成には、運動神経及び感覚神経を含む体性神経系、交感神経及び副交感神経を含む自律神経系、さらには記憶や経験などが深く関与していると考えられる。そこで、感性を、外受容感覚情報(体性神経系)と内受容感覚情報(自律神経系)を統合し、過去の経験、記憶と照らし合わせて生じる情動反応を、より上位のレベルで俯瞰する高次脳機能と定義する。換言すると、感性は、予測(イメージ)と結果(感覚情報)とのギャップを経験・知識と比較することによって“はっ”と気付く高次脳機能であると言える。
【0024】
このような高次脳機能である感性は、種々の観点から総合的に捉える必要がある。例えば、人が快い、快適、或いは心地よいと感じているか、反対に人が気持ち悪い、不快、或いは心地よくないと感じているかといった「快/不快」の観点から感性を捉えることができる。また、例えば、人が覚醒、興奮、或いは活性状態にあるか、反対に人がぼんやり、沈静、或いは非活性状態にあるかといった「活性/非活性」の観点から感性を捉えることができる。また、例えば、人が何かを期待或いは予期してわくわくしているか、反対にわくわく感が阻害されているかといった「期待感」の観点から感性を捉えることができる。
【0025】
快/不快及び活性/非活性を2軸に表したラッセル(Russell)の円環モデルが知られており、この円環モデルで感情を表すことができる。しかし、感性は予測(イメージ)と結果(感覚情報)とのギャップを経験・知識と比較する高次脳機能であるので、快/不快及び活性/非活性の2軸からなる既存の円環モデルでは十分に表し得ない。そこで、本実施形態では、例えば、ラッセルの円環モデルに時間軸(例えば期待感)を第3軸として加えた感性多軸モデルとして、感性をとらえる。
【0026】
図2は、本実施形態において一例として採用する感性多軸モデルの模式図である。図2に示すように、感性多軸モデルは、「快/不快」を第1軸、「活性/非活性」を第2軸、「時間(期待感)」を第3軸として表すことができる。感性を多軸モデル化することのメリットは、各軸に評価値を算出し、それらを総合することで、漠然と広い概念の感性を定量的に評価する、つまり、可視化することができる点にある。具体的には、感性多軸モデルの各軸の脳生理情報から、各軸の脳生理指標値(EEG,EEG活性,EEG期待感)を求め、被験者の主観的な統計データから得られた、感性多軸モデルの各軸の重み付け係数(a,b,c)を示す主観心理軸を用いて、次のような計算式で、感性値を評価できることが実証されている。
【0027】
感性値=[主観心理軸]*[脳生理指標]=a*EEG+b*EEG活性+c*EEG期待感
感性メータ20は、例えば、このような計算式に従って得られた感性値を、快適度y(t)として用いてもよい。
【0028】
(第1制御部)
第1制御部30の入出力関係については、例えば、KP 、KI 、KD をそれぞれPIDパラメータとして、下記の式(1)に示すPID制御がなされる。
【0029】
【数1】
【0030】
本実施形態では、快適度y(t)を向上させることが目的となるが、フィードバック制御において個々に適した目標出力w(t)を設定することは困難である。そこで、図1に示すようなカスケード制御系を採用することにより、目標快適度r(t)を与えることによって、個々に適した目標出力w(t)を自動生成する。このとき、人の感性は時変系、非線形系であると考えられるため、第1制御部30は、図1に示すように、データベース60を利用したフィードバック制御(データベース駆動型制御:例えば「脇谷伸 他、FRIT法を用いた非線形PID制御系の設計、計測と制御、Vol.52、No.10、pp.885-891 (2013)」参照)を行う。データベース60には、第1制御部30のPIDパラメータの調整に必要なデータ、例えば、目標快適度r(t)、快適度y(t)及び目標出力w(t)等が逐次蓄積される。
【0031】
図3は、第1制御部30のデータベース駆動型制御を説明する図である。第1制御部30のデータベース駆動型制御については、後記の実施例で詳述するが、例えば、勾配法を用いた学習機能を利用してもよいし、さらには、FRIT(Fictitious Reference Iterative Tuning)法を組み合わせてオフライン学習を行ってもよい。
【0032】
(第2制御部)
第2制御部40の入出力関係については、例えば、KP ’、KI ’、KD ’をそれぞれPIDパラメータとして、下記の式(2)に示すPID制御がなされる。
【0033】
【数2】
【0034】
第2制御部40のPIDパラメータには、対象機器10に応じた既存のパラメータを用いることが可能である。既存のパラメータは、固定した定数であってもよいし、或いは、可変パラメータであってもよい。
【0035】
(δ設定部)
δ設定部50は、基本的には、スキルの高い操作者には相対的に低い重み(δ値)を設定し、スキルの低い操作者には相対的に高いδ値を設定する。例えば、操作者のスキルレベルを5段階で予め評価しておき、δ設定部50は、各スキルレベルに応じたδ値を定数として保持しておき、操作者のスキルレベルが入力されると、δ値を一意に決定してもよい。或いは、δ設定部50は、操作者にテスト操作を行わせた結果に基づき、当該操作者の操作レベルを評価し、その評価結果に応じたδ値を設定してもよい。
【0036】
(効果)
以上に説明したように、本実施形態の感性フィードバック制御装置100によると、感性メータ20が、対象機器10の出力u(t)に対応する操作者の生体情報x(t)を検出し、当該生体情報x(t)に基づき、操作者の快適度y(t)を決定する。また、第1制御部30は、快適度y(t)に関する第1目標値(目標快適度)r(t)と、快適度y(t)との差分に基づき、出力u(t)に関する第2目標値(目標出力)w(t)を決定する。また、第2制御部40は、目標出力w(t)と出力u(t)との差分に基づき、対象機器10に対する制御入力vc (t)を決定する。このように、感性メータ20、第1制御部30及び第2制御部40を用いて、対象機器10において操作者の感性(具体的には快適度y(t))をフィードバックした制御を行うことができる。
【0037】
図4は、本実施形態の感性フィードバック制御装置100によって得られる効果を示す図である。図4に示すように、対象機器10、例えば油圧ショベルにおいて操作者の感性をフィードバックした制御を行うことができるので、元来操作者のスキルレベルと無関係に画一的に設計されている対象機器10に、多種多様なスキルレベルを持つ操作者に応じて出力応答させることが可能となる。従って、多種多様なスキルレベルを持つ操作者の快適度を向上させることができる。
【0038】
また、本実施形態の感性フィードバック制御装置100によると、δ設定部50は、操作者による対象機器10に対する操作入力vh (t)、及び、制御入力vc (t)のそれぞれについて、操作者の操作レベルに応じた重み付けを行い、重み付けされた操作入力vh (t)及び制御入力vc (t)が合算されて対象機器10に入力される。このため、δ設定部50を用いて、感性フィードバックの程度を操作者の操作レベルに応じて設定することができる。これにより、例えば、未熟な操作者に対しては感性フィードバックの程度を高くして、対象機器10における当該操作者の操作入力の反映度を低くしたり、逆に、熟練操作者に対しては感性フィードバックの程度を低くして、対象機器10における当該操作者の操作入力の反映度を高くしたりすることができる。
【0039】
また、本実施形態の感性フィードバック制御装置100において、感性メータ20は、快・不快、活性・非活性、期待感の3つの情報を生体情報x(t)として検出し、当該3つの情報の相関性から得られる感性値を快適度y(t)として決定してもよい。このようにすると、感性である「快適度」を定量的に評価できるので、感性フィードバック制御の精度を向上させることができる。
【0040】
また、本実施形態の感性フィードバック制御装置100において、目標快適度r(t)、目標出力w(t)及び快適度y(t)が逐次蓄積されるデータベース60をさらに備え、第1制御部30は、データベース60に蓄積されているデータを用いて、制御パラメータの調整を行いながら、目標出力w(t)を決定してもよい。このようにすると、非線形系である操作者の感性をモデル化することなく、データベース駆動型制御を用いて、感性フィードバック制御を行うことができる。
【0041】
また、本実施形態の感性フィードバック制御装置100において、対象機器10が建設機械であると、操作者が、脳内の建設機械の目標出力(例えば油圧ショベルの目標応答速度)と同様な出力が得られるように現実の建設機械を操作することが可能になる。
【0042】
また、本実施形態の感性フィードバック制御装置100において、第1制御部30のデータベース駆動型制御が学習機能を利用するものであると、操作者による対象機器10の操作時間が長くなるに従って、対象機器10は、当該操作者にとってより適した出力応答を行うように徐々に変化する。これにより、操作者の快適度をより一層向上させることができる。
【0043】
(実施例)
以下、感性フィードバック制御装置100においてδ値を「1」に設定し、対象機器10に制御入力vc (t)のみが入力される場合を例として、主として第1制御部30のデータベース駆動型制御について説明する。
【0044】
図5は、図1に示す感性フィードバック制御装置100においてδ値が1である場合の構成を簡単化して示す図である。尚、図5において、図1と同じ構成要素には同じ符号を付し、δ設定部50等の図示を省略している。
【0045】
本実施例では、対象機器10は油圧ショベル、対象機器10の出力u(t)は油圧ショベルのバケットの応答速度、対象機器10に対する制御入力vc (t)はトルクである。
【0046】
また、本実施例では、制御対象である操作者の快適度y(t)を非線形系と捉え、データベース駆動型制御を適用して第1制御部30を構成する。尚、内側ループの第2制御部40は、KP ’=1.5、KI ’=0.1、KD ’=0.1として、式(2)に示すPID制御を行うものとし、本実施例では調整対象とはしない。
【0047】
具体的には、制御対象である快適度y(t)として,下記の式(3)で表される離散時間非線形システムを想定する。
【0048】
【数3】
【0049】
式(3)において、y(t)はシステム出力、f()は非線形関数、φ(t−1)は、システムの時刻tより前の状態を表しており、情報ベクトルと呼ぶ。また、情報ベクトルφ(t−1)は、下記の式(4)で定義される。
【0050】
【数4】
【0051】
ここで,w(t)(対象機器10の目標出力w(t))は、快適度y(t)の制御におけるシステム入力であり、ny 、nw はそれぞれシステム出力及びシステム入力の次数である。データベース駆動型制御では、各操業データが式(4)の形式でデータベース60(図3参照)に蓄積される。また、現在のシステムの状態を表す情報ベクトルφ(t)を要求点(クエリ)と呼ぶ。
【0052】
また、第1制御部30の制御則として、下記の式(5)で表される速度型I−PD制御則を用いる。
【0053】
【数5】
【0054】
但し、式(5)において、e(t)は制御誤差信号であり、r(t)を目標快適度とすると、下記の式(6)で定義することができる。
【0055】
【数6】
【0056】
また、式(5)において、KP (t)、KI (t)、KD (t)はそれぞれ、各ステップ(時刻t)における比例ゲイン、積分ゲイン、微分ゲインを表している。さらに、Δ(:=1−z-1)は差分演算子を、z-1は遅延演算子を示している。
【0057】
本実施例では、FRIT法を用いて、1回の動作実験によって得られた入出力データw0 (t)、y0 (t)、及び、これらの実験データから生成される擬似参照入力r(t)によって、第1制御部30の制御パラメータを直接的に算出する。図6は、本実施例で用いるFRITのブロック線図を示す。図6において、Systemは、第2制御部40と対象機器10と感性メータ20とからなるシステムであり、C(z-1)は制御器(第1制御部30)であり、下記の式(7)で表すことができる。
【0058】
【数7】
【0059】
式(7)において、nは制御則の次数を示し、PID制御則の場合はn=2となる。また、図6に示すように、C(z-1)の入出力関係を下記の式(8)で表すことができる。
【0060】
【数8】
【0061】
式(8)より、擬似参照入力rは、下記の式(9)のように算出される。
【0062】
【数9】
【0063】
尚、FRIT法では、図6に示すように、予め所望の特性を有する参照モデルGm(z-1)を設計しておき、擬似参照入力rに対する参照モデルGm(z-1)の出力をm (t)とし、m (t)とy0 (t)との誤差が小さくなるように、制御パラメータを算出する。参照モデルGm(z-1)は、下記の式(10)、式(11)の特性多項式で表すことができる。
【0064】
【数10】
【0065】
【数11】
【0066】
式(11)において、α、σはそれぞれ制御系の立ち上がり特性、減衰特性に関係するパラメータを示しており、任意に設定可能である。また、Ts はサンプリング時間である。具体的には、σは制御系の出力がステップ状の目標値の約60%に達するまでの時間を示している。また、αは0以上2.0以下の範囲で設定されることが望ましく、α=0ではBinomialモデルの応答を示し、α=1ではButterworthモデルの応答を示す。
【0067】
以下、データベース駆動型PIDコントローラの設計手順について説明する。
【0068】
<初期データベースの作成>
データベース駆動型制御では、過去の蓄積データが存在しない場合、原理的に局所コントローラの設計を行うことができない。従って、本実施例では、ある平衡点周りで得られた入出力データから、Zieglar & Nichols(ZN)法(「J.G.Zieglar 他、Optimum settings for automatic controllers、Trans.ASME、Vol.64、No.8、pp.759-768 (1942)」参照)や、Chien,Hrones & Reswick(CHR)法(「K.L. Chien 他、On the Automatic Control of Generalized Passive Systems、Trans.ASME、Vol.74、pp.175-185 (1972)」参照)などを用いてPIDゲインを算出し、これらのPIDゲインと前述の入出力データとからなる情報ベクトル(下記の式(12)で表される)によって初期データベースを作成する。
【0069】
【数12】
【0070】
式(12)において、j=1、2、・・・、N(0)であり、i=1、2、・・・Mであり、φ(j)、K(j)はそれぞれ下記の式(13)、式(14)で与えられる。
【0071】
【数13】
【0072】
【数14】
【0073】
また、N(0)は初期データ数(初期データベースにおける情報ベクトルの数)を表し、Mは要素数を表す。初期データベースにおけるPIDゲインは固定であるので、K(1)=K(2)=・・・=K(N(0))である。
【0074】
<距離の算出、近傍の選択>
要求点φ(t)と、データベースに蓄えられている情報ベクトルφ(j)との距離を、下記の式(15)で表される重みつきL1 ノルムにより求める。
【0075】
【数15】
【0076】
ここで、N(t)は時刻tにおいてデータベースに蓄えられているデータ数(情報ベクトル)を表している。また、φl (j)は第j番目の情報ベクトルの第l番目の要素を表している。同じく、φl (t)は時刻tにおける要求点の第l番目の要素を表している。さらに、maxφl (m)は、データベースに存在する全ての情報ベクトル(φ(j):j=1、2、・・・、N(t))の第l番目の要素の中で最も大きな要素を示しており、minφl (m)は、同第l番目の要素のなかで最も小さな要素を示している。
【0077】
本実施例では、式(15)により求められた、距離dが小さい方からk個の情報ベクトルを選択し、当該選択されたデータ集合を近傍として定義する。
【0078】
<局所コントローラの構成>
次に、前述のように選択された近傍に対して、下記の式(16)で示される、重みつき局所線形平均法(Linearly Weighted Average:LWA)により局所コントローラを構成する。
【0079】
【数16】
【0080】
ここで、wi は選択された第i番目の情報ベクトルに含まれるK(i)に対する重みであり、下記の式(17)で与えられる。
【0081】
【数17】
【0082】
以上の手順により各時刻tにおけるPIDゲインを算出することができる。さらに、データベース駆動型PID制御系が各平衡点において適切にPIDゲインを調整できようにするためには、データベースの学習(制御パラメータの更新)を行う必要がある。そこで、本実施例では、FRITを適用し、データベースの構築に用いた初期データから、学習によってデータベース内の各データセットにおけるPIDゲインをオフラインで更新する。
【0083】
<FRITを用いたデータベース駆動型PID制御のオフライン学習>
以下、FRITを用いたデータベース駆動型PID制御のオフライン学習について,具体的に説明する。まず、閉ループデータでの要求点φ0 (t)におけるPIDゲインを算出するために、式(15)によって、要求点とデータベース内の情報ベクトルとの間の距離を計算し、k個の近傍データを選択する。続いて、式(16)によってPIDゲインを算出し、算出したPIDゲインを用い、下記の式(18)、式(19)で表される最急降下法によってPIDゲインKold (t)の学習を行い、新たにKnew を導出する。
【0084】
【数18】
【0085】
【数19】
【0086】
式(18)、式(19)において、ηは学習係数、J(t+1)は、下記の式(20)、式(21)で定義される評価規範を表している。
【0087】
【数20】
【0088】
【数21】
【0089】
但し、m (t)は、下記の式(22)のように設計される。
【0090】
【数22】
【0091】
式(22)において、Gm (1)=1+p1 +p2 である(式(10)参照)。
【0092】
また、式(18)の右辺第2項のそれぞれの偏微分は、式(23)のように展開される。
【0093】
【数23】
【0094】
式(23)において、Γ(t)は、下記の式(24)のように表される。
【0095】
【数24】
【0096】
式(23)に擬似参照入力r(t)が含まれていることから、式(18)は、FRITによるオフライン学習となっている。式(18)により得られたKnew (t)を用いて、データベース上の各近傍データの更新を行う。この手順を、式(20)で表される評価規範が十分小さくなるまで繰り返すことによって、最適なデータベースを取得することができる。システムに対してデータ駆動型制御を適用する際は、各ステップ(時刻)ごとに、前述の「初期データベースの作成」、「距離の算出、近傍の選択」、「局所コントローラの構成」の手順に従って局所コントローラを構成することにより、非線形システムに対して、より有効な制御性能を得ることが可能となる。
【0097】
<数値例>
以下、本実施例による感性フィードバック制御の数値例について説明する。
【0098】
ここで、図5に示す対象機器(操作者が操作する機器)10は、油圧ショベルであるとし、下記の式(25)の一次遅れ系で表す。
【0099】
【数25】
【0100】
一方、快適度y(t)は、ウェーバー・フェヒナーの法則(「I.P.Herman、Physics of the Human Body:Biological and Medical Physics、Biomedical Engineering、Springer-Verlag GmbH & CO.KG (2007)」参照)を用いて、快適度y(t)の最大値が1となるように、下記の式(26)、式(27)で表す。
【0101】
【数26】
【0102】
【数27】
【0103】
式(26)、式(27)において、wh (t)は、操作者が脳内で持つ油圧ショベルの目標速度であるが、これは制御系にとって未知である。また、eh (t)は、操作者の脳内で感じる油圧ショベルの速度誤差である。
【0104】
式(26)から、操作者の脳内での速度誤差eh (t)が完全にゼロであれば、快適度y(t)は最大の1となる。尚、E(t)は、快適度y(t)に関する変数であり、操作者によって異なる値を持つ。図7は、操作者の脳内での速度誤差eh (t)と、快適度y(t)との関係を示す。図7に示すように、速度誤差eh (t)が大きくなればなるほど、快適度y(t)が低下している。また、E(t)が大きくなればなるほど、快適度y(t)の低下率が大きくなる。
【0105】
尚、以下に説明する数値例における各設定パラメータは、r=0.8、wh =40、σ=10、α=0、η=[80、60、80]とした。
【0106】
また、内側ループの第2制御器40には、既存の制御パラメータを用い、外側ループの第1制御部30の制御パラメータの調整には、非線形システムに対して有効なデータベース駆動型制御(「脇谷伸 他、FRIT法を用いた非線形PID制御系の設計、計測と制御、Vol.52、No.10、pp.885-891 (2013)」参照)を用いた。
【0107】
また、初期データ{u0 、y0 }を取得するための外側ループ(第1制御部30)のPIDゲインは、KP =3.5、KI =0.5、KD =3.5とし、内側ループ(第2制御器40)のPIDゲインは、KP ’=1.5、KI ’=0.1、KD ’=0.1とした。
【0108】
以上の設定においてデータベース駆動型制御により第1制御部30の制御パラメータの調整を行いながら感性フィードバック制御を行った結果(各ステップ(時刻)における快適度y(t)、速度u(t)、トルクv(t))を図8に、また、各ステップ(時刻)における調整された制御パラメータ(PIDゲイン)を図9にそれぞれ示す。
【0109】
図8に示すように、PIDゲインを固定した初期データy0 は、式(26)で表される快適度y(t)が非線形系であるため、目標快適度r(=0.8)に追従していない。一方、データベース駆動型制御によりPIDゲインの調整を行った場合(本実施例)の快適度yは、目標快適度rに追従している。すなわち、本実施例によって感性フィードバック制御が実現されている。これは、図9に示すように、PIDゲインが適応的に調整されているためであると考えられる。
【0110】
また、操作者の脳内の目標速度wh (=40)は制御系にとっては未知であるが、本実施例によって得られた目標速度wは、最終的には40になっている。このことから、データベースを解析すれば、操作者の脳内の目標速度を推定することが可能となることが示唆される。
【0111】
また、図8に示すように、負荷が大きいときには、それに伴って大きいトルクv(対象機器10に対する入力)が自動算出されていることが分かる。
【0112】
(比較例)
以下、感性フィードバック制御を外側ループのみにより実現した場合、つまり、対象機器に関する内側の制御ループが無い場合を比較例として、本発明の感性フィードバック制御におけるカスケード制御系(外側ループ+内側ループ)の有効性について説明する。
【0113】
図10は、比較例に係る感性フィードバック制御装置の構成図である。図10に示すように、比較例に係る感性フィードバック制御装置200は、対象機器10と、感性メータ20と、制御部30Aとを備えている。対象機器10は、前述の実施例と同様に、操作者によって操作される油圧ショベルである。感性メータ20は、図1に示す本実施形態の感性フィードバック制御装置200の感性メータ20と同様に、対象機器10の出力u(t)に対応する操作者の生体情報x(t)を検出し、当該生体情報x(t)に基づき、操作者の快適度y(t)を決定する。制御部30Aは、快適度y(t)に関する目標値(目標快適度)r(t)と、快適度y(t)との差分e(t)に基づき、対象機器10に対する制御入力v(t)を決定する。
【0114】
制御部30Aの入出力関係については、例えば、KP ’’、KI ’’、KD ’’をそれぞれPIDパラメータとして、下記の式(28)に示すPID制御がなされる。
【0115】
【数28】
【0116】
また、制御部30Aは、図10に示すように、データベース60Aを利用したデータベース駆動型制御を行う。データベース60Aには、制御部30AのPIDパラメータの調整に必要なデータ、例えば、目標快適度r(t)、快適度y(t)及び制御入力v(t)等が逐次蓄積される。
【0117】
尚、本比較例でも、対象機器10の出力u(t)は油圧ショベルのバケットの応答速度、対象機器10に対する制御入力vc (t)はトルクである。
【0118】
データベース駆動型制御により制御部30Aの制御パラメータの調整を行いながら感性フィードバック制御を行った結果(各ステップ(時刻)における快適度y(t)、速度u(t)、トルクv(t))を図11に示す。尚、初期データ{u0 、y0 }を取得するための制御部30AのPIDゲインは、前述の実施例と同様に、KP =3.5、KI =0.5、KD =3.5とし、その他のパラメータも、前述の実施例と同様に、r=0.8、wh =40、σ=10、α=0、η=[80、60、80]とした。
【0119】
図11に示すように、比較例においては、データベース駆動型制御によりPIDゲインの調整を行っても、快適度yは目標快適度rに追従していない。すなわち、比較例に係る感性フィードバック制御は、十分な制御性能を実現できていない。
【0120】
この結果から、本発明の感性フィードバック制御においてはカスケード制御系により内側ループ(第2制御部40)の即応性を向上させていることによって、制御系の設計が容易になり、感性フィードバック制御の精度が向上したものと推認される。
【0121】
以上、本発明についての実施形態(実施例を含む)を説明したが、本発明は前述の実施形態のみに限定されず、発明の範囲内で種々の変更が可能である。すなわち、前述の実施形態の説明は、本質的に例示に過ぎず、本発明、その適用物或いはその用途を制限することを意図するものではない。
【0122】
例えば、本実施形態においては、油圧ショベル(建設機械)を例として、感性フィードバック制御装置を説明したが、操作者により操作される他の機器についても同様に適用可能である。
【符号の説明】
【0123】
10 対象機器
20 感性メータ
30 第1制御部
40 第2制御部
50 重み付け(δ)設定部
60 データベース
100 感性フィードバック制御装置
図1
図2
図3
図4
図5
図6
図7
図8
図9
図10
図11