(19)【発行国】日本国特許庁(JP)
(12)【公報種別】公開特許公報(A)
(11)【公開番号】P2023178055
(43)【公開日】2023-12-14
(54)【発明の名称】制御装置
(51)【国際特許分類】
G06N 20/00 20190101AFI20231207BHJP
G06N 3/08 20230101ALI20231207BHJP
【FI】
G06N20/00
G06N3/08
【審査請求】未請求
【請求項の数】1
【出願形態】OL
(21)【出願番号】P 2022091102
(22)【出願日】2022-06-03
(71)【出願人】
【識別番号】000003207
【氏名又は名称】トヨタ自動車株式会社
(74)【代理人】
【識別番号】110002147
【氏名又は名称】弁理士法人酒井国際特許事務所
(72)【発明者】
【氏名】高橋 祐希
(72)【発明者】
【氏名】井手 宏二
(72)【発明者】
【氏名】大八木 大史
(72)【発明者】
【氏名】金子 智洋
(72)【発明者】
【氏名】篠田 祥尚
(72)【発明者】
【氏名】中山 茂樹
(72)【発明者】
【氏名】伊藤 真輝
(57)【要約】
【課題】汎用性が低下する出力となることを抑制することができる制御装置を提供する。
【解決手段】制御装置1は、フラグ付けしていないデータ群から生成した第1の学習済モデルおよびフラグ付けしたデータ群から生成した第2の学習済モデルの各々に対して、同一の入力パラメータを入力し、第1の学習済モデルおよび第2の学習済モデルの各々が出力する出力パラメータに基づいて、第2の学習済モデルの再学習を行う。
【選択図】
図1
【特許請求の範囲】
【請求項1】
プロセッサを備え、
前記プロセッサは、
フラグ付けしていないデータ群から生成した第1の学習済モデルおよびフラグ付けしたデータ群から生成した第2の学習済モデルの各々に対して、同一の入力パラメータを入力し、
前記第1の学習済モデルおよび前記第2の学習済モデルの各々が出力する出力パラメータに基づいて、前記第2の学習済モデルの再学習を行う、
制御装置。
【発明の詳細な説明】
【技術分野】
【0001】
本開示は、制御装置に関する。
【背景技術】
【0002】
特許文献1は、自律的に再学習を行った学習済モデルに対して、メーカ等によって一律に作成された標準的な学習済モデルに更新する場合、再学習によって車両固有の特性が反映された学習済の結果が書き換えられることを防止する技術が開示されている。この技術によれば、更新後の学習済モデルの出力部と、学習部による学習により車両固有の特性が反映された差分モデルの出力値と、を用いることにより、それまでの差分モデルの学習により得られたニューラルネットワークの重みやバイアスを内燃機関の制御に反映させる。
【先行技術文献】
【特許文献】
【0003】
【発明の概要】
【発明が解決しようとする課題】
【0004】
ところで、特許文献1のような自律的に再学習等を行う学習済モデルでは、再学習を行うための入力パラメータを取得する地域等の内容によっては、出力値が偏ってしまい、汎用性が低下する場合があり、改善の余地があった。
【0005】
本開示は、上記に鑑みてなされたものであって、入力パラメータの内容に関わらず、汎用性が低下する出力となることを抑制することができる制御装置を提供することを目的とする。
【課題を解決するための手段】
【0006】
上述した課題を解決し、目的を達成するために、本開示に係る制御装置は、プロセッサを備え、前記プロセッサは、フラグ付けしていないデータ群から生成した第1の学習済モデルおよびフラグ付けしたデータ群から生成した第2の学習済モデルの各々に対して、同一の入力パラメータを入力し、前記第1の学習済モデルおよび前記第2の学習済モデルの各々が出力する出力パラメータに基づいて、第2の学習済モデルの再学習を行う。
【発明の効果】
【0007】
本開示によれば、入力パラメータの内容に関わらず、汎用性が低下する出力となることを抑制することができるという効果を奏する。
【図面の簡単な説明】
【0008】
【
図1】
図1は、一実施の形態に係る制御装置の機能構成を示すブロック図である。
【
図2】
図2は、一実施の形態に係る制御装置が実行する処理の概要を示すフローチャートである。
【
図3】
図3は、一実施の形態に係る制御装置が実行する処理の概要を模式的に説明する図である。
【発明を実施するための形態】
【0009】
以下、本開示の実施の形態に係る制御装置について、図面を参照しながら説明する。なお、以下の実施の形態により本開示が限定されるものではない。また、以下において、同一の部分には同一の符号を付して説明する。
【0010】
〔制御装置の機能構成〕
図1は、一実施の形態に係る制御装置の機能構成を示すブロック図である。
図1に示す制御装置1は、ネットワークを介して外部から取得した複数の学習済モデルの各々に対して、同一の入力パラメータを入力し、かつ、複数の学習済モデルの各々から出力される出力パラメータの乖離に基づいて、再学習を実行する。
図1に示すように、制御装置1は、送受信部11と、入力部12と、表示部13と、記録部14と、制御部15と、を備える。
【0011】
送受信部11は、制御部15の制御のもと、図示しないネットワークを介して外部装置へ各種情報を送信するとともに、外部装置から学習データまたは学習済モデルを受信する。送受信部11は、各種情報を送受信可能な通信モジュール等を用いて構成される。
【0012】
入力部12は、キーボード、マウス、スイッチおよびタッチパネル等を用いて構成され、ユーザの各種操作の入力を受け付け、受け付けた操作に応じた情報を制御部15へ出力する。
【0013】
表示部13は、制御部15の制御のもと、制御装置1に関する各種情報を表示する。表示部13は、液晶ディスプレイまたは有機ELディスプレイ(Organic Electroluminescent Display)等の表示ディスプレイを用いて構成される。
【0014】
記録部14は、DRAM(Dynamic Random Access Memory)、ROM(Read Only Memory)、Flashメモリ、HDD(Hard Disk Drive)、SSD(Solid State Drive)等を用いて構成され、制御装置1に関する各種情報を記録する。また、記録部14は、制御装置1が実行する各種のプログラムを記録するプログラム記録部141と、第1の学習済モデルを記録する第1の学習済モデル記録部142と、第2の学習済モデルを記録する第2の学習済モデル記録部143と、を有する。
【0015】
第1の学習済モデルおよび第2の学習済モデルは、複数の入力パラメータで構成される入力データを入力し、複数の出力パラメータで構成される出力データを出力する。具体的には、第1の学習済モデルは、アノテーション(Annotation)等のフラグ付け(正解ラベル)していないデータ群を教師データとして学習して生成した学習済モデルである。また、第2の学習済モデルは、フラグ付けしたデータ群を教師データとして学習して生成した学習済モデルである。
【0016】
第1の学習済モデルおよび第2の学習済モデルは、機械学習の一例としてニューラルネットワークを用いた深層学習の学習済モデルを一例に説明するが、それ以外の方法に基づく機械学習を適用してもよい。例えば、第1の学習済モデルおよび第2の学習済モデルは、サポートベクターマシン、決定木、単純ベイズ、k近傍法等、他の教師あり学習を用いたものであってもよい。さらに、学習済モデルは、教師あり学習に代えて半教師あり学習または教師なし学習によって生成された学習済モデルであってもよい。なお、入力パラメータは、予め記録部14に記録させてもよいし、送受信部11を介して外部機器、例えば車両および携帯電話等から取得したものを用いてもよい。
【0017】
また、入力パラメータとは、車両を制御するパラメータである。例えば、入力パラメータは、車両の速度、ハンドルの操舵角、アクセルの踏み込み量、スロットの開度、車両の位置情報、エンジンの回転数、燃焼噴射量、燃焼噴射時期、燃料の残量、走行距離およびモータの回転数等である。もちろん、一実施の形態では、入力パラメータに、例えば、種別、地域、身長、体重およびバイタル情報等をさらに含まれてもよい。また、出力パラメータは、車両を自動運転するための制御パラメータである。例えば、出力パラメータは、アクセル開度、エンジンの回転数、モータの回転数、速度およびハンドルの操舵角等である。
【0018】
制御部15は、メモリと、CPU(Central Processing Unit)、FPGA(Field-Programmable Gate Array)またはASIC(Application Specific Integrated Circuit)等のハードウェアを有するプロセッサを用いて構成される。制御部15は、制御装置1を構成する各部を制御する。また、制御部15は、プログラム記録部141に記録されたプログラムをメモリの作業領域に読み出して実行し、プロセッサによるプログラムの実行を通じて各構成部等を制御することによって、ハードウェアとソフトウェアとが協働し、所定の目的に合致した機能モジュールを実現する。具体的には、制御部15は、機能モジュールとして、入力制御部151と、算出部152と、判定部153と、再学習制御部154と、を有する。
【0019】
入力制御部151は、第1の学習済モデルおよび第2の学習済モデルの各々に対して、同一の入力パラメータ(入力値)を入力する。
【0020】
算出部152と、第1の学習済モデルの出力パラメータと、第2の学習済モデルが出力した出力パラメータ(出力値)と、の差分を算出する。
【0021】
判定部153は、第1の学習済モデルおよび第2の学習済モデルの各々が出力した出力パラメータの差分が所定値以上であるか否かを判定する。ここで、所定値とは、入力パラメータに従って想定される値である。なお、所定値は、入力部12を介してユーザによって適宜設定されてもよい。
【0022】
再学習制御部154は、第1の学習済モデルおよび第2の学習済モデルの各々が出力する出力パラメータに基づいて、第2の学習済モデルの再学習を行う。例えば、再学習制御部154は、出力パラメータが第1の学習済モデルによって出力される出力パラメータとの差分が所定値となるような教師データを入力パラメータとして第2の学習済モデルに入力することによって第2の学習済モデルを再学習させる。
【0023】
〔制御装置の処理〕
次に、制御装置1が実行する処理について説明する。
図2は、制御装置1が実行する処理の概要を示すフローチャートである。
図3は、制御装置1が実行する処理の概要を模式的に説明する図である。
【0024】
図2に示すように、まず、判定部153は、第1の学習済モデルおよび第2の学習済モデルが作成済みであるか否かを判定する(ステップS101)。具体的には、判定部153は、送受信部11が外部機器またはサーバと通信を行うことによって第1の学習済モデル記録部142および第2の学習済モデル記録部143に、外部機器およびサーバ等で生成された第1の学習済モデルおよび第2の学習済モデルが記録されているか否かを判定する。判定部153によって第1の学習済モデルおよび第2の学習済モデルが作成済みであると判定された場合(ステップS101:Yes)、制御装置1は、後述するステップS102へ移行する。これに対して、判定部153によって第1の学習済モデルおよび第2の学習済モデルが作成済みでないと判定された場合(ステップS101:No)、制御装置1は、本処理を終了する。
【0025】
続いて、入力制御部151は、第1の学習済モデルおよび第2の学習済モデルの各々に対して、同一の入力パラメータを入力する(ステップS102)。
図3に示すように、入力制御部151は、第1の学習済モデルM1および第2の学習済モデルM2の各々に対して、同一の入力パラメータP1を入力する。
【0026】
その後、算出部152は、第1の学習済モデルの出力パラメータと、第2の学習済モデルが出力した出力パラメータと、の差分を算出する(ステップS103)。
図3に示すように、算出部152は、第1の学習済モデルM1の出力パラメータP11(出力値)と、第2の学習済モデルM2が出力した出力パラメータP12(出力値)と、の差分D1を算出する。
【0027】
続いて、判定部153は、第1の学習済モデルおよび第2の学習済モデルの各々が出力した出力パラメータの差分が所定値以上であるか否かを判定する(ステップS104)。判定部153によって第1の学習済モデルおよび第2の学習済モデルの各々が出力した出力パラメータの差分が所定値以上であると判定された場合(ステップS104:Yes)、制御装置1は、後述するステップS105へ移行する。これに対して、判定部153によって第1の学習済モデルおよび第2の学習済モデルの各々が出力した出力パラメータの差分が所定値以上でないと判定された場合(ステップS104:No)、制御装置1は、本処理を終了する。
【0028】
ステップS105において、再学習制御部154は、第2の学習済モデルを再学習させる。具体的には、再学習制御部154は、第2の学習済モデルに対して、記録部14に記録された各データにアノテーション等のフラグ(正解ラベル)を付した教師データを用いて再学習させる。例えば、再学習制御部154は、出力パラメータが第1の学習済モデルによって出力される出力パラメータとの差分が所定値となるような教師データを入力パラメータとして第2の学習済モデルに入力することによって第2の学習済モデルを再学習させる。これにより、第2の学習済モデルが出力する出力パラメータの汎用性が低下することを抑制することができる。ステップS105の後、制御装置1は、本処理を終了する。
【0029】
以上説明した一実施の形態によれば、再学習制御部154が第1の学習済モデルおよび第2の学習済モデルの各々が出力する出力パラメータに基づいて、第2の学習済モデルの再学習を行う。これにより、入力パラメータの内容に関わらず、汎用性が低下することを抑制することができる。
【0030】
また、一実施の形態によれば、判定部153によって第1の学習済モデルおよび第2の学習済モデルの各々が出力した出力パラメータの差分が所定値以上であると判定された場合、再学習制御部154が第2の学習済モデルの再学習を行う。これにより、入力パラメータの内容に関わらず、汎用性が低下する出力となることを抑制することができる。
【0031】
また、一実施の形態では、上述してきた「部」を、「回路」などに読み替えることができる。例えば、装置制御部は、装置制御回路に読み替えることができる。
【0032】
また、一実施の形態に係る制御装置1に実行させるプログラムは、インストール可能な形式または実行可能な形式のファイルデータでCD-ROM、フレキシブルディスク(FD)、CD-R、DVD(Digital Versatile Disk)、USB媒体、フラッシュメモリ等のコンピュータで読み取り可能な記憶媒体に記憶されて提供される。
【0033】
また、一実施の形態に係る制御装置1に実行させるプログラムは、インターネット等のネットワークに接続されたコンピュータ上に格納し、ネットワーク経由でダウンロードさせることにより提供するように構成してもよい。
【0034】
なお、本明細書におけるフローチャートの説明では、「まず」、「その後」、「続いて」等の表現を用いてステップ間の処理の前後関係を明示していたが、本実施の形態を実施するために必要な処理の順序は、それらの表現によって一意的に定められるわけではない。即ち、本明細書で記載したフローチャートにおける処理の順序は、矛盾のない範囲で変更することができる。
【0035】
さらなる効果や変形例は、当業者によって容易に導き出すことができる。本発明のより広範な態様は、以上のように表しかつ記述した特定の詳細および代表的な実施の形態に限定されるものではない。従って、添付のクレームおよびその均等物によって定義される総括的な発明の概念の精神または範囲から逸脱することなく、様々な変更が可能である。
【0036】
以上、本願の実施の形態のいくつかを図面に基づいて詳細に説明したが、これらは例示であり、本発明の開示の欄に記載の態様を始めとして、当業者の知識に基づいて種々の変形、改良を施した他の形態で本発明を実施することが可能である。
【符号の説明】
【0037】
1 制御装置
11 送受信部
12 入力部
13 表示部
14 記録部
15 制御部
141 プログラム記録部
142 第1の学習済モデル記録部
143 第2の学習済モデル記録部
151 入力制御部
152 算出部
153 判定部
154 再学習制御部