IP Force 特許公報掲載プロジェクト 2022.1.31 β版

知財求人 - 知財ポータルサイト「IP Force」

▶ 株式会社豊田中央研究所の特許一覧 ▶ 株式会社豊田自動織機の特許一覧

特開2022-144626学習モデル生成装置、状態量推定装置、学習モデル生成方法、およびコンピュータプログラム
<>
  • 特開-学習モデル生成装置、状態量推定装置、学習モデル生成方法、およびコンピュータプログラム 図1
  • 特開-学習モデル生成装置、状態量推定装置、学習モデル生成方法、およびコンピュータプログラム 図2
  • 特開-学習モデル生成装置、状態量推定装置、学習モデル生成方法、およびコンピュータプログラム 図3
  • 特開-学習モデル生成装置、状態量推定装置、学習モデル生成方法、およびコンピュータプログラム 図4
  • 特開-学習モデル生成装置、状態量推定装置、学習モデル生成方法、およびコンピュータプログラム 図5
  • 特開-学習モデル生成装置、状態量推定装置、学習モデル生成方法、およびコンピュータプログラム 図6
  • 特開-学習モデル生成装置、状態量推定装置、学習モデル生成方法、およびコンピュータプログラム 図7
  • 特開-学習モデル生成装置、状態量推定装置、学習モデル生成方法、およびコンピュータプログラム 図8
  • 特開-学習モデル生成装置、状態量推定装置、学習モデル生成方法、およびコンピュータプログラム 図9
  • 特開-学習モデル生成装置、状態量推定装置、学習モデル生成方法、およびコンピュータプログラム 図10
< >
(19)【発行国】日本国特許庁(JP)
(12)【公報種別】公開特許公報(A)
(11)【公開番号】P2022144626
(43)【公開日】2022-10-03
(54)【発明の名称】学習モデル生成装置、状態量推定装置、学習モデル生成方法、およびコンピュータプログラム
(51)【国際特許分類】
   G06N 20/00 20190101AFI20220926BHJP
【FI】
G06N20/00 130
【審査請求】未請求
【請求項の数】8
【出願形態】OL
(21)【出願番号】P 2021045710
(22)【出願日】2021-03-19
(71)【出願人】
【識別番号】000003609
【氏名又は名称】株式会社豊田中央研究所
(71)【出願人】
【識別番号】000003218
【氏名又は名称】株式会社豊田自動織機
(74)【代理人】
【識別番号】100160691
【弁理士】
【氏名又は名称】田邊 淳也
(74)【代理人】
【識別番号】100157277
【弁理士】
【氏名又は名称】板倉 幸恵
(74)【代理人】
【識別番号】100182718
【弁理士】
【氏名又は名称】木崎 誠司
(72)【発明者】
【氏名】田中 紗也香
(72)【発明者】
【氏名】池戸 隆人
(72)【発明者】
【氏名】稲垣 英人
(72)【発明者】
【氏名】近藤 和也
(57)【要約】
【課題】誤差を含む入力が与えられた場合であっても、状態量の推定精度を維持することが可能な学習モデルを提供する。
【解決手段】学習モデル生成装置は、1以上のパラメータを含む入力値と、入力値に対応した出力値と、を含む第1データセットを取得するデータ取得部と、取得された入力値に含まれる1以上のパラメータのうち、少なくとも1つのパラメータに対して誤差を付与した誤差付入力値を生成し、誤差付入力値と、誤差を付与される前の入力値に対応した出力値と、を含む第2データセットを生成するデータ生成部と、第1データセットと第2データセットとを教師データとした機械学習によって学習モデルを生成するモデル生成部と、を備える。
【選択図】図1
【特許請求の範囲】
【請求項1】
学習モデル生成装置であって、
1以上のパラメータを含む入力値と、前記入力値に対応した出力値と、を含む第1データセットを取得するデータ取得部と、
取得された前記入力値に含まれる1以上の前記パラメータのうち、少なくとも1つの前記パラメータに対して誤差を付与した誤差付入力値を生成し、前記誤差付入力値と、誤差を付与される前の前記入力値に対応した出力値と、を含む第2データセットを生成するデータ生成部と、
前記第1データセットと前記第2データセットとを教師データとした機械学習によって学習モデルを生成するモデル生成部と、
を備える、学習モデル生成装置。
【請求項2】
請求項1に記載の学習モデル生成装置であって、
前記データ生成部は、前記パラメータを取得するためのセンサの諸元値に応じて、前記センサから出力されたセンサ値の誤差の範囲で、前記パラメータに付与する誤差の大きさを設定する、学習モデル生成装置。
【請求項3】
請求項2に記載の学習モデル生成装置であって、
前記データ生成部は、前記パラメータに付与する誤差として、前記センサ値の最大誤差または最小誤差を設定する、学習モデル生成装置。
【請求項4】
請求項1から請求項3までのいずれか一項に記載の学習モデル生成装置であって、
前記モデル生成部は、前記学習モデルとして、内燃機関を有するシステムの状態量を推定するモデルを生成し、
前記データ取得部は、前記パラメータとして、前記システムの物理量を取得するセンサのセンサ値を含む、学習モデル生成装置。
【請求項5】
請求項4に記載の学習モデル生成装置であって、
前記モデル生成部は、前記学習モデルとして、排出ガスの浄化用触媒を有する前記システムにおける前記浄化用触媒の状態量を推定するモデルを生成し、
前記データ取得部は、前記入力値の前記パラメータとして、
前記内燃機関から前記浄化用触媒へと流入する前記排出ガスの流量と、
前記浄化用触媒の入口における前記排出ガスの温度と、
前記浄化用触媒の出口における前記排出ガスの温度と、
前記浄化用触媒の入口におけるNOx濃度と、
の少なくとも1つを含む、学習モデル生成装置。
【請求項6】
請求項5に記載の学習モデル生成装置を有する状態量推定装置であって、
前記モデル生成部により生成された前記学習モデルと、物理モデルと、を含む触媒状態推定モデルを記憶する記憶部と、
前記データ取得部により取得された前記第1データセットに含まれる前記入力値と、前記データ生成部により生成された第2データセットに含まれる前記誤差付入力値とのそれぞれを入力として、前記記憶部の前記触媒状態推定モデルに適用することで、前記浄化用触媒の状態量を推定する推定値算出部と、
を備える、状態量推定装置。
【請求項7】
学習モデル生成方法であって、
1以上のパラメータを含む入力値と、前記入力値に対応した出力値と、を含む第1データセットを取得するデータ取得工程と、
取得された前記入力値に含まれる1以上の前記パラメータのうち、少なくとも1つの前記パラメータに対して誤差を付与した誤差付入力値を生成し、前記誤差付入力値と、誤差を付与される前の前記入力値に対応した出力値と、を含む第2データセットを生成するデータ生成工程と、
前記第1データセットと前記第2データセットとを教師データとした機械学習によって学習モデルを生成するモデル生成工程と、
を備える、学習モデル生成方法。
【請求項8】
コンピュータに学習モデルを生成させるコンピュータプログラムであって、
1以上のパラメータを含む入力値と、前記入力値に対応した出力値と、を含む第1データセットを取得するデータ取得機能と、
取得された前記入力値に含まれる1以上の前記パラメータのうち、少なくとも1つの前記パラメータに対して誤差を付与した誤差付入力値を生成し、前記誤差付入力値と、誤差を付与される前の前記入力値に対応した出力値と、を含む第2データセットを生成するデータ生成機能と、
前記第1データセットと前記第2データセットとを教師データとした機械学習によって学習モデルを生成するモデル生成機能と、
を実現させる、コンピュータプログラム。
【発明の詳細な説明】
【技術分野】
【0001】
本発明は、学習モデル生成装置、状態量推定装置、学習モデル生成方法、およびコンピュータプログラムに関する。
【背景技術】
【0002】
機械学習により生成された学習モデルを用いて、種々の状態量を推定する装置が知られている(例えば、特許文献1,2参照)。特許文献1に記載された技術では、雰囲気温度推定装置内の雰囲気温度を推定するための学習モデルが生成され、この学習モデルを用いて雰囲気温度が推定される。特許文献1に記載の装置では、入力変数取得部が取得した種々の入力変数をニューラルネットワークに入力する。ニューラルネットワーク計算部は、計算を繰り返すことにより、ニューラルネットワークの重みを決定することで学習モデルを生成する。
【0003】
特許文献2には、NOx還元処理を行う内燃機関の排気浄化装置が記載されている。この排気浄化装置では、内燃機関の運転状態を示す機関運転パラメータを入力とし、NOx触媒に関わる制御パラメータを出力とする学習モデルを用いて、NOx触媒に吸蔵されたNOx量が推定されている。
【先行技術文献】
【特許文献】
【0004】
【特許文献1】特開2019-60642号公報
【特許文献2】特開2009-180086号公報
【発明の概要】
【発明が解決しようとする課題】
【0005】
しかしながら、特許文献1及び特許文献2に記載された技術では、学習モデルを用いた状態量の推定精度が低下する可能性があった。具体的には、特許文献1において、センサにより取得された実環境の温度などを入力変数とした場合、センサの個体差などによる誤差が入力値に含まれることにより、学習モデルによる推定精度が低下する場合がある。同様に、特許文献2において、機関運転パラメータを車上のセンサなどから取得する場合、ノイズやセンサ特性に基づいた誤差が入力値に含まれることにより、学習モデルによる推定精度が低下する場合がある。
【0006】
本発明は、上述した課題を解決するためになされたものであり、誤差を含む入力が与えられた場合であっても、状態量の推定精度を維持することが可能な学習モデルを提供することを目的とする。
【課題を解決するための手段】
【0007】
本発明は、上述の課題の少なくとも1つを解決するためになされたものであり、以下の形態として実現できる。
【0008】
(1)本発明の一形態によれば、学習モデル生成装置が提供される。この学習モデル生成装置は、1以上のパラメータを含む入力値と、前記入力値に対応した出力値と、を含む第1データセットを取得するデータ取得部と、取得された前記入力値に含まれる1以上の前記パラメータのうち、少なくとも1つの前記パラメータに対して誤差を付与した誤差付入力値を生成し、前記誤差付入力値と、誤差を付与される前の前記入力値に対応した出力値と、を含む第2データセットを生成するデータ生成部と、前記第1データセットと前記第2データセットとを教師データとした機械学習によって学習モデルを生成するモデル生成部と、を備える。
【0009】
学習モデルは、学習時に使用した入力値のデータ密度が低い外挿領域を近似できない性質を有する。そのため、入力値に誤差が含まれる場合には入力値が外挿領域となり、外挿領域での推定精度が低下してしまう。すなわち、入力値に誤差が含まれる場合には、学習モデルにより算出された状態量の推定値の推定精度が低下する。本構成によれば、従来、学習モデルを生成する際の教師データとして用いられていた入力値と出力値とのセット(第1データセット)に加えてさらに、誤差付入力値と出力値とのセット(第2データセット)を教師データとして、機械学習を行うことで学習モデルを生成する。このため、誤差を含む入力値が外挿領域ではなく内挿領域となる。これにより、本構成の学習モデル生成装置では、誤差を含む入力が与えられた場合であっても、状態量の推定精度を維持することが可能な学習モデルを提供できる。この結果、センサ値等のパラメータに誤差を含む入力値に対してロバスト性を高め、学習モデルを用いて算出される状態量の推定精度の低下を抑制できる。
【0010】
(2)上記態様の学習モデル生成装置において、前記データ生成部は、前記パラメータを取得するためのセンサの諸元値に応じて、前記センサから出力されたセンサ値の誤差の範囲で、前記パラメータに付与する誤差の大きさを設定してもよい。
この構成によれば、第2データセットの誤差付入力値が含む誤差が、正解値のセンサ値において想定される誤差の範囲に設定される。これにより、本構成によれば、学習モデルを用いて算出される状態量の推定精度をより高い状態に維持できる。
【0011】
(3)上記態様の学習モデル生成装置において、前記データ生成部は、前記パラメータに付与する誤差として、前記センサ値の最大誤差または最小誤差を設定してもよい。
この構成によれば、最大誤差または最小誤差が入力値に付与されることにより、モデル生成部は、正解値のセンサ値が取り得る最大の誤差を含む教師データにより学習モデルを生成できる。これにより、状態量の推定値の内挿領域が大きくなり、実際のセンサ値が取り得る誤差の範囲において、状態量の推定精度を高い状態に維持できる。
【0012】
(4)上記態様の学習モデル生成装置において、前記モデル生成部は、前記学習モデルとして、内燃機関を有するシステムの状態量を推定するモデルを生成し、前記データ取得部は、前記パラメータとして、前記システムの物理量を取得するセンサのセンサ値を含んでもよい。
この構成によれば、学習モデル生成装置により生成された学習モデルを用いて、内燃機関を有するシステムの状態量を推定できる。内燃機関を有するシステムは一般に、状態量を推定するために多種多様なパラメータを含む入力値が必要となる。学習モデルを用いることにより、このような内燃機関を有するシステムの状態量を、簡単かつ高精度に推定できる。
【0013】
(5)上記態様の学習モデル生成装置において、前記モデル生成部は、前記学習モデルとして、排出ガスの浄化用触媒を有する前記システムにおける前記浄化用触媒の状態量を推定するモデルを生成し、前記データ取得部は、前記パラメータとして、前記内燃機関から前記浄化用触媒へと流入する前記排出ガスの流量と、前記浄化用触媒の入口における前記排出ガスの温度と、前記浄化用触媒の出口における前記排出ガスの温度と、前記浄化用触媒の入口におけるNOx濃度と、の少なくとも1つを含んでもよい。
この構成によれば、排出ガスの流量と、排出ガスの入口温度および出口温度と、排出ガス中のNOx濃度と、を入力変数として、浄化用触媒の状態量を推定する学習モデルを生成できる。
【0014】
(6)本発明の他の一形態によれば、上記態様の学習モデル生成装置を有する状態量推定装置が提供される。この状態量推定装置によれば、前期モデル生成部により生成された前記学習モデルと、物理モデルと、を含む触媒状態推定モデルを記憶する記憶部と、前記データ取得部により取得された前記第1データセットに含まれる前記入力値と、前記データ生成部により生成された第2データセットに含まれる前記誤差付入力値とのそれぞれを入力として、前記記憶部の前記触媒状態推定モデルに適用することで、前記浄化用触媒の状態量を推定する推定値算出部と、を備える。
この構成によれば、状態量推定装置は、機械学習により生成された学習モデルと、物理モデルとを組み合わせて構成された触媒状態推定モデルを用いて、浄化用触媒の状態量を推定する。このため、学習モデル、または物理モデルの一方のみを用いる場合と比較して、浄化用触媒の状態量の推定精度を向上できる。
【0015】
なお、本発明は、種々の態様で実現することが可能であり、例えば、学習モデル生成装置、学習装置、状態量推定装置、およびこれらの装置を備えるシステム、学習モデル生成システム、これら装置や方法を実行するためのコンピュータプログラム、このコンピュータプログラムを配布するためのサーバ装置、コンピュータプログラムを記憶した一時的でない記憶媒体等の形態で実現することができる。
【図面の簡単な説明】
【0016】
図1】本発明の実施形態としての状態量推定装置の説明図である。
図2】データが取得されてから学習モデルが生成されるまでの説明図である。
図3】データが取得されてから学習モデルが生成されるまでの説明図である。
図4】推定値算出部による推定値算出の説明図である。
図5】第2データセットにより拡大する内挿領域の説明図である。
図6】状態量推定方法のフローチャートである。
図7】本実施形態の学習モデルの推定精度についての説明図である。
図8】比較例の学習モデルの推定精度についての説明図である。
図9】本実施形態と比較例とにおいて推定された状態量の比較についての説明図である。
図10】変形例の学習モデル生成方法のフローチャートである。
【発明を実施するための形態】
【0017】
<実施形態>
図1は、本発明の実施形態としての状態量推定装置100の説明図である。図1には、内燃機関210を備える内燃機関システム200と、状態量推定装置100との概略ブロック図が示されている。本実施形態の状態量推定装置100は、入力値と出力値とを含む第1データセットDS1と、誤差が付与された誤差付入力値と出力値との第2データセットDS2とを教師データとした機械学習により学習モデルを生成する。生成された学習モデルは、第1データセットDS1に加えて、誤差付入力値を含む第2データセットDS2を教師データとしているため、学習モデルを用いた状態量の推定精度が高く維持される。
【0018】
図1に示されるように、内燃機関システム200は、内燃機関210から排出される排出ガス中のNOx(窒素酸化物)を浄化するNSR触媒(吸蔵還元触媒:NOx Storage Reduction catalyst)220と、排出ガスが通る排気管230と、内燃機関210から排出される排出ガスの流量を取得する流量取得部231と、排出ガス中のNOx濃度を取得するNOx濃度取得部232と、NSR触媒220に流入する前の排出ガスの入口ガス温度を取得する前端温度取得部233と、NSR触媒220から流出した排出ガスの出口ガス温度を取得する後端温度取得部234と、を備えている。
【0019】
内燃機関210は、例えば、ディーゼルエンジンや、リーンバーン運転方式のガソリンエンジンである。図1に示されるように、排気管230は、内燃機関210からの排出ガスが流通する主流路を形成する。本実施形態の流量取得部231は、排気管230に設けられたピトー管式流量計によって測定された測定信号を取得することにより、排出ガスの流量を取得する。NOx濃度取得部232は、NSR触媒220へ流入する排気中のNOx濃度を測定するセンサである。前端温度取得部233および後端温度取得部234は、温度センサである。
【0020】
図1に示される本実施形態の状態量推定装置100は、排出ガスの各種パラメータ(例えば、ガス流量、NOx濃度、入口ガス温度、および出口ガス温度、1時刻前のNOx吸蔵量)を入力値とし、NSR触媒220における実際のNOx吸蔵率を出力値とした場合に、入力値から出力値を推定する学習モデルを生成する。このとき、状態量推定装置100は「学習モデル生成装置」として機能する。学習モデルの生成後、状態量推定装置100は、生成した学習モデルを用いて、NSR触媒220のNOx吸蔵率(浄化用触媒の状態量)を推定し、状態量の推定精度が要求性能を満たしているか否かを判定する。
【0021】
状態量推定装置100は、CPU(Central Process Unit)10と、状態量の推定に用いられる学習モデルおよび物理モデルを記憶する記憶部20と、各種画像を表示する表示部30と、を備えている。図1に示されるように、記憶部20は、学習モデルを記憶する学習モデルデータベース(学習モデルDB)21と、物理モデルを予め記憶している物理モデルデータベース(物理モデルDB)22と、を備えている。物理モデルの詳細については後述する。
【0022】
CPU10は、ROM(Reae Only Memory)に格納されているコンピュータプログラムをRAM(Ramdam Access Memory)に展開して実行することにより、各種機能を実行する。本実施形態のCPU10は、内燃機関システム200から取得された複数のセンサ値を取得するデータ取得部11と、データ取得部11から送信される第1データセットDS1から第2データセットDT2を生成するデータ生成部12と、第1データセットDS1と第2データセットDS2とを教師データとした機械学習によって学習モデルを生成するモデル生成部13と、生成した学習モデルを取得するモデル取得部14と、記憶部20に記憶された学習モデルおよび物理モデルを用いて状態量の推定値を算出する推定値算出部15と、算出された推定値の精度が要求性能を満たしているか否かを判定する判定部16として機能する。
【0023】
図2および図3は、データが取得されてから学習モデルが生成されるまでの説明図である。図2には、モデル生成部13が生成するモデルの詳細と、データ取得部11とデータ生成部12とモデル生成部13との間でやり取りされるデータセットとを示す概略ブロック図が示されている。図2に示されるように、データ取得部11は、1以上のパラメータを含む入力値と、この入力値に対応した出力値とを含む第1データセットDS1を取得する。本実施形態では、入力値として、各取得部231~234により取得された4つのセンサ値および1時刻前のNOx吸蔵量で構成される5つのパラメータ(流量、入口ガス温度、出口ガス温度、NOx濃度、および1時刻前のNOx吸蔵量)を採用する。また、出力値として、NSR触媒220における正解値のNOx吸蔵量を採用する。データ取得部11は、取得した第1データセットDS1をモデル生成部13へと送信する。
【0024】
本実施形態のデータ生成部12は、データ取得部11により取得された入力値に含まれる4つのセンサ値のうち、1以上のパラメータに対して誤差を付与した誤差付入力値を生成する。以降、データ生成部12は入力値に含まれるパラメータの1つである「入口ガス温度」に対して誤差を付与する場合を例示して説明する。具体的には、データ生成部12は、入口ガス温度に付与する誤差として、前端温度取得部233の最大誤差(例えば+x2)と、最小誤差(例えば-x2)と、のそれぞれを設定した2つの誤差付入力値を生成する。なお、本実施形態のデータ生成部12は、入口ガス温度に付与する誤差として、前端温度取得部233の諸元値に応じた大きさの誤差を付与する。換言すれば、上述した±x2は、前端温度取得部233の諸元値において規定されたセンサ値の誤差範囲である。
【0025】
データ生成部12は、上述のようにして生成した誤差付入力値を用いて、第2データセットDS2を生成する。具体的には、データ生成部12は、誤差付入力値と、誤差が付与される前の入力値に対応した出力値と、を含む第2データセットDS2を生成する。データ生成部12は、生成した第2データセットDS2をモデル生成部13へと送信する。
【0026】
また、データ生成部12は、生成された学習モデルの推定精度を確認するために用いられるテストデータを生成する。具体的には、データ生成部12は、第1データセットDS1と、最大誤差である誤差付入力値を含む第2データセットDS2と、最小誤差である誤差付入力値を含む第2データセットDS2とのそれぞれのデータに含まれる入力値を、テストデータして生成する。データ生成部12は、テストデータを推定値算出部15へと送信する。
【0027】
モデル生成部13は、データ取得部11から送信された第1データセットDS1と、データ生成部12から送信された第2データセットDS2とを教師データとした機械学習によって、学習モデルを生成する。本実施形態のモデル生成部13は、ニューラルネットワーク(NN:Neural Network)を用いた機械学習により、第1NNモデルMD1と、第2NNモデルMD2と、第3NNモデルMD3と、を生成する。モデル生成部13は、生成した学習モデル(第1~第3NNモデルMD1~MD3)を、記憶部20の学習モデルDB21に記憶させる。
【0028】
第1NNモデルMD1は、NSR触媒220における「NOx浄化率」を推定するためのモデルである。第1NNモデルMD1と、第2NNモデルMD2と、第3NNモデルMD3と、後述する物理モデルとのそれぞれの入力変数には、第1データセットDS1の入力値または第2データセットDS2の誤差付入力値に含まれる5つのパラメータのうちの少なくとも1つを採用できる。第1NNモデルMD1の出力変数は、入力変数が表す諸条件下における、NSR触媒220のNOx吸蔵率の推定値である。なお、データ取得部11が取得するパラメータのうちの「1時刻前のNOx吸蔵量」は、1時刻前において第1NNモデルMD1により推定されたNOx浄化率を用いて算出される値である。
【0029】
第2NNモデルMD2は、NSR触媒220における「気相反応で浄化されるNOx量」を推定するためのモデルである。第2NNモデルMD2の出力変数は、入力変数が表わす諸条件下において、NSR触媒220の気相反応で浄化されるNOxの量の推定値である。
【0030】
第3NNモデルMD3は、NSR触媒220における「NOx還元量」を推定するためのモデルである。第3NNモデルMD3の入力変数には、第1データセットDS1の入力値または第2データセットDS2の誤差付入力値に含まれる5つのパラメータのうちの少なくとも1つと、後述する物理モデルにより推定される還元反応に寄与しない添加剤の量とを採用できる。第3NNモデルMD3の出力変数は、入力変数が表す諸条件下における、還元反応またはリッチスパイク制御で還元されるNOx還元量の推定値である。なお、リッチスパイク制御とは、内燃機関210内の空燃比を短時間リッチ状態とすることで、CO、H2、およびHC等のその他の未燃ガス(以降「CO,H2,HC等」とも呼ぶ)を内燃機関210から排出させる制御である。
【0031】
記憶部20の物理モデルDB22に記憶されている物理モデルは、リッチスパイク制御において、「還元反応に寄与しない添加剤量(CO,H2,HC等の量)」を推定するためのモデルである。内燃機関210からの排出ガスの温度やNSR触媒220の温度によっては、NSR触媒220に吸蔵されているNOxと添加剤との還元反応が十分に進行しない場合がある。物理モデルでは、このような還元反応に寄与しない添加剤の量を推定する。物理モデルの一例としては、還元反応に寄与しないCOの量を推定するアレニウスの式を採用できる。
【0032】
学習モデルDB21に記憶された学習モデル(第1~第3NNモデルMD1~MD3)と、物理モデルDB22に記憶された物理モデルとは「触媒状態推定モデル」として機能する。本実施形態の触媒状態推定モデルは、第1NNモデルMD1により推定されたNOx浄化率と、第2NNモデルMD2により推定された気相反応で浄化されるNOx量と、第3NNモデルMD3により推定されたNOx還元量と、物理モデルにより推定された還元反応に寄与しない添加剤量とを用いて、NSR触媒220の状態量(例えば、NOx吸蔵量)を推定するためのモデルである。
【0033】
図3には、学習モデル生成のフローのイメージ図が示されている。図3に示されるように、モデル生成部13は、5つのパラメータを含む入力値(誤差付入力値を含む)と出力値とを含む第1データセットDS1および第2データセットDS2から構成される教師データを用いて機械学習を行う。
【0034】
モデル取得部14は、記憶部20から取得した触媒状態推定モデルを推定値算出部15に送信する。推定値算出部15は、触媒状態推定モデルに対して、第1データセットDS1に含まれる入力値と、第2データセットDS2に含まれる入力値(誤差付入力値を含む)とのそれぞれをテストデータとして入力することにより、NSR触媒220の状態量(例えば、NOx吸蔵量)の推定値を算出する。具体的には、推定値算出部15は、テストデータから第1NNモデルMD1により推定されたNOx浄化率と、テストデータから第2NNモデルMD2により推定された気相反応で浄化されるNOx量と、テストデータから第3NNモデルMD3により推定されたNOx還元量と、テストデータから物理モデルにより推定された還元反応に寄与しない添加剤量と、をそれぞれ触媒状態推定モデルに入力することによって、出力変数としてのNOx吸蔵量を算出する。
【0035】
図4は、推定値算出部15による推定値算出の説明図である。図4に示されるように、推定値算出部15は、学習モデルを用いて、第1データセットDS1に含まれる入力値と、入口ガス温度が最大誤差である第2データセットDS2の誤差付入力値と、入口ガス温度が最小誤差である第2データセットDS2の誤差付入力値と、のそれぞれに対応するNOx吸蔵率を算出する。推定値算出部15は、算出されたそれぞれのNOx吸蔵率に対応する、状態量の推定値としてのNOx吸蔵量を算出する。なお、図4に示される2つの第2データセットDS2の入口ガス温度のグラフには、比較のための第1データセットDS1に含まれる誤差を含まない入口ガス温度が破線で示されている。同じように、2つの第2データセットDS2を用いて算出された状態量としてのNOx吸蔵量のグラフには、誤差付入力値を含まない第1データセットDS1を用いて算出されたNOx吸蔵量のグラフが破線で示されている。
【0036】
図5は、第2データセットDS2により拡大する内挿領域RG1の説明図である。図5には、推定値算出部15が算出したNOx吸蔵量を表すプロットと、当該プロットから算出された近似曲線y1,y2,y3とが示されている。近似曲線y1は、第1データセットDS1の入力値から算出されたNOx吸蔵量(小さい黒丸のプロット)に近似する曲線である。近似曲線y2は、最大誤差である第2データセットDS2の誤差付入力値から算出されたNOx吸蔵量(大きい白丸のプロット)に近似する曲線である。近似曲線y3は、最小誤差である第2データセットDS2の誤差付入力値から算出されたNOx吸蔵量(大きい丸のハッチングが施されたプロット)に近似する曲線である。図5に示されるように、最大誤差と最小誤差とのそれぞれに対応する誤差付入力値がテストデータとして用いられることにより、近似曲線y2と近似曲線y3との間に囲まれる内挿領域RG1が形成される。
【0037】
判定部16は、推定値算出部15により算出された状態量の推定値が、要求仕様としての許容誤差範囲内に含まれているか否かを判定する。判定部16は、状態量の推定値が要求仕様を満たすと判定した場合には、要求仕様を満たす学習モデルとして学習モデルDB21に記憶する。状態量の推定値が要求仕様を満たさないと判定された場合には、モデル生成部13は、学習アルゴリズムと、中間層のノード数を含むハイパーパラメータとを決定し直して、新たな学習モデルを生成する。
【0038】
図6は、状態量推定方法のフローチャートである。図6に示される状態量推定フローでは、初めに、データ生成部12が教師データを生成する(ステップS1)。教師データは、データ取得部11により取得された第1データセットDS1と、データ生成部12により生成された第2データセットDS2とを含む。データ生成部12は、第1データセットDS1と第2データセットDS2とのそれぞれをテストデータとして生成する(ステップS2)。
【0039】
モデル生成部13は、学習アルゴリズムとハイパーパラメータとを決定する(ステップS3)。モデル生成部13は、決定した学習アルゴリズムおよびハイパーパラメータと、教師データとを用いて学習モデルを生成する(ステップS4)。判定部16は、推定値算出部15が学習モデルおよび物理モデルと、テストデータとを用いて算出した状態量の推定精度を確認する(ステップS5)。判定部16は、推定値算出部15により全てのテストデータに対応する推定値が算出されたか否かを判定する(ステップS6)。全てのテストデータに対応する推定値が算出されていない場合には(ステップS6:NO)、ステップS5の処理が行われる。
【0040】
ステップS6の処理において、判定部16は、全てのテストデータに対応する推定値が算出されたと判定した場合には(ステップS6:YES)、算出された推定精度が要求仕様を満たすか否かを判定する(ステップS7)。算出された推定精度が要求仕様を満たさないと判定された場合には(ステップS7:NO)、ステップS3以降の処理が行われる。算出された推定精度が要求仕様を満たすと判定された場合には(ステップS7:YES)、要求仕様を満たす学習モデルが学習モデルDB21に保存されて、状態量推定フローが終了する。
【0041】
図7は、本実施形態の学習モデルの推定精度についての説明図である。図7には、本実施形態の学習モデルにより算出されたNOx吸蔵量の推定値の時間変化が示されている。図7には、正解値として出力値が細い実線で表され、+x2の誤差が付与されたテストデータを用いて算出された推定値が太い破線で示され、+x1(<x2)の誤差が付与されたテストデータを用いて算出された推定値が太い二点鎖線で示され、誤差が付与されていないテストデータを用いて算出された推定値が細い一点鎖線で示され、-x1の誤差が付与されたテストデータを用いて算出された推定値が細い破線で示され、-x2の誤差が付与されたテストデータを用いて算出された推定値が太い実線で示されている。なお、「x1」および「x2」は、任意の正の数である。
【0042】
図8は、比較例の学習モデルの推定精度についての説明図である。図8には、比較例の学習モデルにより算出されたNOx吸蔵量の推定値の時間変化が示されている。比較例の学習モデルは、本実施形態の入力値に誤差を含まない第1データセットDS1のみが教師データとして機械学習されたモデルである。図8に示されるグラフのスケールは、図7のスケールと同じである。図8に示される各種推定値の線種は、図7に示される線種に対応している。
【0043】
図9は、本実施形態と比較例とにおいて推定された状態量の比較についての説明図である。図9には、図7および図8から導かれた、テストデータに付与された誤差に対して、推定された状態量であるNOx吸蔵量と正解値との差の最大値の割合である最大絶対誤差が示されている。本実施形態の推定値は、折れ線L1(実線)により示され、比較例の推定値は、折れ線L2(破線)により示されている。最大絶対誤差は、推定値と正解値との差の絶対値を正解値で除した値のうちの最大値である。すなわち、本実施形態では、入力値に誤差が含まれる場合であっても、状態量の推定精度の低下を抑制できる。
【0044】
以上説明したように、本実施形態の状態量推定装置100では、データ取得部11が5つのパラメータ(流量、入口ガス温度、出口ガス温度、NOx濃度、および1時刻前のNOx吸蔵量)と、出力値としてのNSR触媒220における正解値のNOx吸蔵量とを含む第1データセットDS1を取得する。データ生成部12は、データ取得部11により取得された入力値に含まれる4つのセンサ値のうち、入口ガス温度に対して誤差を付与した誤差付入力値を生成する。データ生成部12は、第2データセットDS2として、誤差付入力値と、誤差を付与される前の入力値に対応した第1データセットDS1に含まれる出力値とを含むデータセットを生成する。モデル生成部13は、第1データセットDS1と第2データセットDS2とを教師データとした機械学習によって学習モデルを生成する。学習モデルは、学習時に使用した入力値のデータ密度が低い外挿領域を近似できない性質を有する。そのため、入力値に誤差が含まれる場合には入力値が外挿領域となり、図8,9に示されるように、外挿領域での推定精度が低下してしまう。すなわち、入力値に誤差が含まれる場合には、学習モデルにより算出された状態量の推定値の推定精度が低下する。本実施形態の状態量推定装置100によれば、従来、学習モデルを生成する際の教師データとして用いられていた入力値と出力値とのセット(第1データセットDS1)に加えてさらに、誤差付入力値と出力値とのセット(第2データセットDS2)を教師データとして、機械学習を行うことで学習モデルを生成する。このため、誤差を含む入力値が外挿領域ではなく内挿領域RG1となる。これにより、本実施形態の状態量推定装置100では、誤差を含む入力が与えられた場合であっても、状態量の推定精度を維持することが可能な学習モデルを提供できる。この結果、図7,9に示されるように、センサ値等の誤差を含む入力値に対してロバスト性を高め、算出される状態量の推定精度の低下を抑制できる。
【0045】
また、本実施形態のデータ生成部12は、入口ガス温度に付与する誤差として前端温度取得部233により取得される誤差の範囲で設定する。すなわち、第2データセットDS2の誤差付入力値が含む誤差が、正解値の前端温度取得部233の入口ガス温度において想定される誤差の範囲に設定される。これにより、本実施形態では、学習モデルにより算出される状態量の推定精度をより高い状態に維持できる。
【0046】
また、本実施形態のデータ生成部12は、入口ガス温度に付与する誤差として、前端温度取得部233の最大誤差(例えば+x2)と最小誤差(例えば-x2)とのそれぞれを設定した誤差付入力値を生成する。最大誤差または最小誤差が入力値に付与されることにより、モデル生成部13は、実際の前端温度取得部233が取り得る最大の誤差を含む教師データにより学習モデルを生成できる。これにより、状態量の推定値の内挿領域RG1が大きくなり、実際の前端温度取得部233が取り得る誤差の範囲において、状態量の推定精度を高い状態に維持できる。
【0047】
また、本実施形態のデータ取得部11は、各取得部231~234により取得された4つのセンサ値、又はセンサ値から導出した値および1時刻前のNOx吸蔵量で構成される5つのパラメータを取得する。モデル生成部13は、NSR触媒220における状態量としてNOx吸蔵率を推定する学習モデルを生成する。本実施形態によれば、状態量推定装置100により生成された学習モデルを用いて、内燃機関210を有する内燃機関システム200の状態量を推定できる。内燃機関210を有する内燃機関システム200は一般に、状態量を推定するために多種多様なパラメータを含む入力値が必要となる。学習モデルを用いることにより、このような内燃機関210を有する内燃機関システム200の状態量を、簡単かつ高精度に推定できる。
【0048】
また、本実施形態のモデル生成部13は、内燃機関システム200におけるNSR触媒220の状態量を推定する学習モデルを生成する。データ取得部11は、取得するパラメータとして、排出ガスの流量と、NSR触媒220に流入する排出ガスの入口ガス温度と、NSR触媒220から排出される排出ガスの出口ガス温度と、排出ガス中のNOx濃度とを含んでいる。本実施形態の状態量推定装置100は、排出ガスの流量と、排出ガスの入口温度および出口温度と、排出ガス中のNOx濃度と、を入力変数として、NSR触媒220の状態量を推定する学習モデルを生成できる。
【0049】
また、本実施形態の状態量推定装置100は、学習モデルを記憶する学習モデルDB21と、物理モデルを記憶する物理モデルDB22とを備える記憶部20を備えている。推定値算出部15は、データ取得部11により取得された第1データセットDS1の入力値と、データ生成部12により生成された第2データセットDS2の誤差付入力値とのそれぞれをテストデータとして、NSR触媒220のNOx吸蔵量を推定する。本実施形態の状態量推定装置100は、機械学習により生成された学習モデルと、物理モデルとを組み合わせて構成された触媒状態推定モデルを用いて、NSR触媒220のNOx吸蔵量を算出する。このため、学習モデル、または物理モデルの一方のみを用いる場合と比較して、NSR触媒220のNOx吸蔵量の推定精度を向上できる。
【0050】
<上記実施形態の変形例>
本発明は上記の実施形態に限られるものではなく、その要旨を逸脱しない範囲において種々の態様において実施することが可能であり、例えば次のような変形も可能である。上記実施形態において、ハードウェアによって実現されるとした構成の一部をソフトウェアに置き換えるようにしてもよく、逆に、ソフトウェアによって実現されるとした構成の一部をハードウェアに置き換えるようにしてもよい。本発明は上記の実施形態に限られるものではなく、その要旨を逸脱しない範囲において種々の態様において実施することが可能である。
【0051】
上記実施形態では、学習モデルを生成する学習モデル生成装置の一例としての状態量推定装置100について説明したが、状態量推定装置100が備える構成および実行する制御については変形可能である。学習モデル生成装置は、第1データセットDS1を用いて誤差付入力値を含む第2データセットDS2を生成するデータ生成部12と、第1データセットDS1と第2データセットDS2とを教師データとして機械学習により学習モデルを生成するモデル生成部13と、を備える範囲で変形可能である。例えば、状態量推定装置100は、表示部30および記憶部20を備えておらず、モデル取得部14と推定値算出部15と判定部16として機能しなくてもよい。すなわち、学習モデルを生成して状態量の推定精度を判定しない学習モデル生成装置であってもよい。状態量推定装置100が推定する状態量は、内燃機関システム200の排出ガスからNSR触媒220が吸蔵するNOx吸蔵量に限られず、データ取得部11により取得された1以上のパラメータを含む入力値と出力値とのデータセットに応じて変形可能である。
【0052】
上記実施形態のデータ生成部12は、前端温度取得部233のパラメータに対してのみ誤差を付与したが、誤差を付与するパラメータの数は2つ以上であってもよいし、前端温度取得部233以外のパラメータであってもよい。データ生成部12は、誤差付入力値として付与する誤差として、最大誤差と最小誤差とのそれぞれを含む2つの第2データセットDS2を生成したが、パラメータに付与される誤差は変形可能である。パラメータに付与される誤差は、センサの諸元値に応じてセンサ値の誤差の範囲が好ましい。本明細書における「センサ値」とは、センサにより直接取得された値に加え、当該値を用いて導出した間接的な値も含んでいる。そのため、「センサ値の誤差」とは、センサにより直接取得される値に対する誤差に起因して、センサ値を用いて導出される間接的な値に発生する誤差も含んでいる。生成される第2データセットDS2は、最大誤差と最小誤差とのそれぞれに対応するデータセットに加えて、最大誤差とゼロとの中間値の誤差に対応するデータセットを含んでいてもよく、変形可能である。
【0053】
上記実施形態のモデル生成部13は、図2に示されるように、ニューラルネットワークを用いた機械学習モデル(第1NNモデルMD1,第2NNモデルMD2,および第3NNモデルMD3)と、物理モデルとの両方を用いて、状態量としてのNOx吸蔵量を算出したが、物理モデルを用いないで状態量を算出してもよい。また、生成される学習モデルに含まれるニューラルネットワークを用いたモデルは、2つ以下であってもよいし、4つ以上であってもよい。モデル生成部13は、ニューラルネットワーク以外のモデルを用いた機械学習を行ってもよい。モデル生成部13は、NSR触媒220のNOx吸蔵量を算出するために、各取得部231~234により取得された4つのセンサ値および1時刻前のNOx吸蔵量で構成される5つのパラメータ(流量、入口ガス温度、出口ガス温度、NOx濃度、および1時刻前のNOx吸蔵量)を用いたが、5つのパラメータの全てを用いなくてもよい。データ取得部11が5つのパラメータとは異なるパラメータを取得し、モデル生成部13は、取得された当該異なるパラメータを用いて学習モデルを生成してもよい。
【0054】
図10は、変形例の学習モデル生成方法のフローチャートである。図10に示される学習モデル生成フローでは、初めに、データ取得部11が第1データセットDS1を取得する(ステップS11)。データ生成部12は、第1データセットDS1を用いて第2データセットDS2を生成する(ステップS12)。モデル生成部13は、第1データセットDS1と第2データセットDS2とを教師データとした機械学習によって学習モデルを生成する(ステップS3)。
【0055】
以上、実施形態、変形例に基づき本態様について説明してきたが、上記した態様の実施の形態は、本態様の理解を容易にするためのものであり、本態様を限定するものではない。本態様は、その趣旨並びに特許請求の範囲を逸脱することなく、変更、改良され得ると共に、本態様にはその等価物が含まれる。また、その技術的特徴が本明細書中に必須なものとして説明されていなければ、適宜、削除することができる。
【符号の説明】
【0056】
10…CPU
11…データ取得部
12…データ生成部
13…モデル生成部
14…モデル取得部
15…推定値算出部
16…判定部
20…記憶部
21…学習モデルDB
22…物理モデルDB
30…表示部
100…状態量推定装置(学習モデル生成装置)
200…内燃機関システム
210…内燃機関
220…NSR触媒
230…排気管
231…流量取得部
232…NOx濃度取得部
233…前端温度取得部
234…後端温度取得部
DS1…第1データセット
DS2…第2データセット
MD1…第1NNモデル
MD2…第2NNモデル
MD3…第3NNモデル
RG1…内挿領域
x1,x2…誤差
図1
図2
図3
図4
図5
図6
図7
図8
図9
図10