(19)【発行国】日本国特許庁(JP)
(12)【公報種別】特許公報(B1)
(11)【特許番号】6869589
(24)【登録日】2021年4月16日
(45)【発行日】2021年5月12日
(54)【発明の名称】情報処理装置、方法及びプログラム
(51)【国際特許分類】
G06N 20/00 20190101AFI20210426BHJP
G06N 3/04 20060101ALI20210426BHJP
【FI】
G06N20/00 130
G06N3/04 154
【請求項の数】8
【全頁数】16
(21)【出願番号】特願2021-510471(P2021-510471)
(86)(22)【出願日】2020年9月30日
(86)【国際出願番号】JP2020037104
【審査請求日】2021年2月25日
(31)【優先権主張番号】特願2019-233427(P2019-233427)
(32)【優先日】2019年12月24日
(33)【優先権主張国】JP
【早期審査対象出願】
(73)【特許権者】
【識別番号】517045705
【氏名又は名称】株式会社エイシング
(74)【代理人】
【識別番号】100098899
【弁理士】
【氏名又は名称】飯塚 信市
(74)【代理人】
【識別番号】100163865
【弁理士】
【氏名又は名称】飯塚 健
(72)【発明者】
【氏名】出澤 純一
(72)【発明者】
【氏名】菅原 志門
【審査官】
多賀 実
(56)【参考文献】
【文献】
特開平5−290013(JP,A)
【文献】
特開平2−100757(JP,A)
【文献】
特開平4−213752(JP,A)
【文献】
特開平7−121206(JP,A)
(58)【調査した分野】(Int.Cl.,DB名)
G06N 3/00−99/00
(57)【特許請求の範囲】
【請求項1】
参照入力データを取得する、参照入力データ取得部と、
訓練用入力データと前記訓練用入力データに対応する訓練用正解データに基づいて生成された第1の近似関数へと、前記参照入力データを入力して第1の出力データを生成する、第1出力データ生成部と、
前記訓練用入力データと、前記訓練用入力データを前記第1の近似関数へと入力して生成された出力データと前記訓練用正解データの差分データと、に基づいて機械学習を行うことにより生成された第2の学習済モデルへと、前記参照入力データを入力して第2の出力データを生成する、第2出力データ生成部と、
前記第1の出力データと前記第2の出力データとに基づいて最終出力データを生成する、最終出力データ生成部と、
参照正解データを取得する、参照正解データ取得部と、
前記第1の出力データと前記参照正解データとの差分データと、前記参照入力データに基づいて機械学習を行い前記第2の学習済モデルを更新する、更新部と、
前記第2の出力データに基づいて所定の条件判定を行い、所定の条件を満たす場合には、ユーザへと提示される所定の情報を生成する、ユーザ提供情報生成部と、を備えた情報処理装置。
【請求項2】
前記第1の近似関数は、前記訓練用入力データと前記訓練用正解データに基づいて機械学習を行うことにより生成された第1の学習済モデルである、請求項1に記載の情報処理装置。
【請求項3】
前記第1の近似関数は、前記訓練用入力データと前記訓練用正解データとの関係を定式化した関数である、請求項1に記載の情報処理装置。
【請求項4】
前記情報処理装置は、さらに、
前記第2の出力データを所定の値域へと制限する出力制限部を備える、請求項1に記載の情報処理装置。
【請求項5】
前記情報は、前記参照入力データ及び前記参照正解データが取得された装置のメンテナンス時期に関する情報である、請求項1に記載の情報処理装置。
【請求項6】
参照入力データを取得する、参照入力データ取得部と、
訓練用入力データと前記訓練用入力データに対応する訓練用正解データに基づいて生成された第1の近似関数へと、前記参照入力データを入力して第1の出力データを生成する、第1出力データ生成部と、
前記訓練用入力データと、前記訓練用入力データを前記第1の近似関数へと入力して生成された出力データと前記訓練用正解データの差分データと、に基づいて機械学習を行うことにより生成された第2の学習済モデルへと、前記参照入力データを入力して第2の出力データを生成する、第2出力データ生成部と、
前記第1の出力データと前記第2の出力データとに基づいて最終出力データを生成する、最終出力データ生成部と、
参照正解データを取得する、参照正解データ取得部と、
前記第1の出力データと前記参照正解データとの差分データと、前記参照入力データに基づいて機械学習を行い前記第2の学習済モデルを更新する、更新部と、
前記第2の出力データに基づいて所定の条件判定を行い、所定の条件を満たす場合には、ユーザへと提示される所定の情報を生成する、ユーザ提供情報生成部と、を備えた情報処理システム。
【請求項7】
参照入力データを取得する、参照入力データ取得ステップと、
訓練用入力データと前記訓練用入力データに対応する訓練用正解データに基づいて生成された第1の近似関数へと、前記参照入力データを入力して第1の出力データを生成する、第1出力データ生成ステップと、
前記訓練用入力データと、前記訓練用入力データを前記第1の近似関数へと入力して生成された出力データと前記訓練用正解データの差分データと、に基づいて機械学習を行うことにより生成された第2の学習済モデルへと、前記参照入力データを入力して第2の出力データを生成する、第2出力データ生成ステップと、
前記第1の出力データと前記第2の出力データとに基づいて最終出力データを生成する、最終出力データ生成ステップと、
参照正解データを取得する、参照正解データ取得ステップと、
前記第1の出力データと前記参照正解データとの差分データと、前記参照入力データに基づいて機械学習を行い前記第2の学習済モデルを更新する、更新ステップと、
前記第2の出力データに基づいて所定の条件判定を行い、所定の条件を満たす場合には、ユーザへと提示される所定の情報を生成する、ユーザ提供情報生成ステップと、を備えた情報処理方法。
【請求項8】
コンピュータを、
参照入力データを取得する、参照入力データ取得部と、
訓練用入力データと前記訓練用入力データに対応する訓練用正解データに基づいて生成された第1の近似関数へと、前記参照入力データを入力して第1の出力データを生成する、第1出力データ生成部と、
前記訓練用入力データと、前記訓練用入力データを前記第1の近似関数へと入力して生成された出力データと前記訓練用正解データの差分データと、に基づいて機械学習を行うことにより生成された第2の学習済モデルへと、前記参照入力データを入力して第2の出力データを生成する、第2出力データ生成部と、
前記第1の出力データと前記第2の出力データとに基づいて最終出力データを生成する、最終出力データ生成部と、
参照正解データを取得する、参照正解データ取得部と、
前記第1の出力データと前記参照正解データとの差分データと、前記参照入力データに基づいて機械学習を行い前記第2の学習済モデルを更新する、更新部と、
前記第2の出力データに基づいて所定の条件判定を行い、所定の条件を満たす場合には、ユーザへと提示される所定の情報を生成する、ユーザ提供情報生成部と、を備えた情報処理装置として機能させるためのプログラム。
【発明の詳細な説明】
【技術分野】
【0001】
この発明は、機械学習技術、特に学習モデルを備えた装置等に関する。
【背景技術】
【0002】
近年、工場内の装置等、様々な装置の制御に機械学習技術が利用されている。
【0003】
この種の装置に対して機械学習技術を適用するための最も一般的な設計手法は、予め対象となる装置の特性を取得し、当該特性に基づいて予め機械学習(オフライン学習)を行って学習済モデルを生成した後、当該学習済モデルを装置へと搭載する手法である。このような手法によれば、事前に用意した豊富なデータに基づく学習を行うことができるので、一定の出力精度を担保することができる。
【0004】
しかしながら、上述の所謂オフライン学習を伴う構成では、装置が経年劣化等により特性変化した場合には、事前学習時の装置特性との間でずれが生じ、出力精度が低下するおそれがある。
【0005】
これに対して、学習モデルを装置へと搭載し、当該装置を動作させつつ得られたデータに基づいて逐次的に機械学習を行って学習モデルを更新する設計(オンライン学習)も考え得る。このような手法によれば、装置が経年劣化等により特性変化した場合であっても学習により適応的に対応することができる。
【0006】
しかしながら、上述の所謂オンライン学習は、オフライン学習に比べて出力精度が悪い場合が多く、また、学習初期等においては出力精度を担保できないおそれもある。また、外れ値のような不適切なデータを学習してしまった場合には暴走のおそれもある。
【0007】
オフライン学習を行った学習済モデルを装置へと搭載し、その後に当該学習済モデルをオンライン学習によりさらに更新することも考えられる。
【0008】
しかしながら、このオンライン学習とオフライン学習とを単に使用する手法では、オンラインによる追加学習がオフライン学習により獲得されたモデルへと影響を及ぼし推定精度の低下を招く可能性がある。例えば、使用する学習モデルによっては、それまでに獲得したモデルが急激に失われてしまう、所謂、破壊的忘却(例えば、非特許文献1)等のおそれがある。以上より、信頼性の観点から、実用上、やはり本手法も採用し難い。
【先行技術文献】
【非特許文献】
【0009】
【非特許文献1】Robert M. French著、"Catastrophic Forgetting in Connectionist Networks: Causes, Consequences, Solutions"、[online]、平成11年5月、Quantitative Psycology and Cognitive Science, Department of Psycology, University of Liege,4000 Liege,Belgium,[令和1年12月12日]、インターネット<URL:https://www.researchgate.net/publication/12977135_Catastrophic_forgetting_in_connectionist_networks>
【発明の概要】
【発明が解決しようとする課題】
【0010】
すなわち、一定の出力精度を担保しつつもモデルの特性変化にも適応可能な機械学習技術はこれまでに提唱されていなかった。
【0011】
本発明は、上述の技術的背景の下になされたものであり、その目的とするところは、一定の出力精度を担保しつつもモデルの特性変化にも適応可能な機械学習技術を提供することにある。
【0012】
本発明のさらに他の目的並びに作用効果については、明細書の以下の記述を参照することにより、当業者であれば容易に理解されるであろう。
【課題を解決するための手段】
【0013】
上述の技術的課題は、以下の構成を有する装置、システム、方法、プログラム等により解決することができる。
【0014】
すなわち、本発明に係る機械学習装置は、参照入力データを取得する、参照入力データ取得部と、訓練用入力データと前記訓練用入力データに対応する訓練用正解データに基づいて生成された第1の近似関数へと、前記参照入力データを入力して第1の出力データを生成する、第1出力データ生成部と、前記訓練用入力データと、前記訓練用入力データを前記第1の近似関数へと入力して生成された出力データと前記訓練用正解データの差分データと、に基づいて機械学習を行うことにより生成された第2の学習済モデルへと、前記参照入力データを入力して第2の出力データを生成する、第2出力データ生成部と、前記第1の出力データと前記第2の出力データとに基づいて最終出力データを生成する、最終出力データ生成部と、参照正解データを取得する、参照正解データ取得部と、前記第1の出力データと前記参照正解データとの差分データと、前記参照入力データに基づいて機械学習を行い前記第2の学習済モデルを更新する、更新部と、を備えている。
【0015】
このような構成によれば、第1の出力データを生成する第1の近似関数については事前に獲得された近似関数を用いると共に、第1の出力データと正解データとの差分に相当する第2の出力データを生成する第2の学習済モデルについては適宜機械学習により更新を行うので、事前に獲得された近似関数により一定の出力精度を担保しつつ、対象モデルの特性変化についてオンライン学習により適応的に機械学習を行うことができる。すなわち、出力精度について一定の担保をしつつも対象モデルの特性変化等に対して適応可能な機械学習技術を提供することができる。
【0016】
前記第1の近似関数は、前記訓練用入力データと前記訓練用正解データに基づいて機械学習を行うことにより生成された第1の学習済モデルであってもよい。
【0017】
前記第1の近似関数は、前記訓練用入力データと前記訓練用正解データとの関係を定式化した関数であってもよい。
【0018】
前記情報処理装置は、さらに、前記第2の出力データを所定の値域へと制限する出力制限部を備えてもよい。
【0019】
前記情報処理装置は、さらに、前記第2の出力データに基づいて所定の条件判定を行い、所定の条件を満たす場合には、ユーザへと提示される所定の情報を生成する、ユーザ提供情報生成部を備える、ものであってもよい。
【0020】
前記情報は、前記参照入力データ及び前記参照正解データが取得された装置のメンテナンス時期に関する情報であってもよい。
【0021】
本発明は、システムとしても観念することができる。すなわち、本発明に係る情報処理システムは、参照入力データを取得する、参照入力データ取得部と、訓練用入力データと前記訓練用入力データに対応する訓練用正解データに基づいて生成された第1の近似関数へと、前記参照入力データを入力して第1の出力データを生成する、第1出力データ生成部と、前記訓練用入力データと、前記訓練用入力データを前記第1の近似関数へと入力して生成された出力データと前記訓練用正解データの差分データと、に基づいて機械学習を行うことにより生成された第2の学習済モデルへと、前記参照入力データを入力して第2の出力データを生成する、第2出力データ生成部と、前記第1の出力データと前記第2の出力データとに基づいて最終出力データを生成する、最終出力データ生成部と、参照正解データを取得する、参照正解データ取得部と、前記第1の出力データと前記参照正解データとの差分データと、前記参照入力データに基づいて機械学習を行い前記第2の学習済モデルを更新する、更新部と、を備えている。
【0022】
本発明は、方法としても観念することができる。すなわち、本発明に係る情報処理方法は、参照入力データを取得する、参照入力データ取得ステップと、訓練用入力データと前記訓練用入力データに対応する訓練用正解データに基づいて生成された第1の近似関数へと、前記参照入力データを入力して第1の出力データを生成する、第1出力データ生成ステップと、前記訓練用入力データと、前記訓練用入力データを前記第1の近似関数へと入力して生成された出力データと前記訓練用正解データの差分データと、に基づいて機械学習を行うことにより生成された第2の学習済モデルへと、前記参照入力データを入力して第2の出力データを生成する、第2出力データ生成ステップと、前記第1の出力データと前記第2の出力データとに基づいて最終出力データを生成する、最終出力データ生成ステップと、参照正解データを取得する、参照正解データ取得ステップと、前記第1の出力データと前記参照正解データとの差分データと、前記参照入力データに基づいて機械学習を行い前記第2の学習済モデルを更新する、更新ステップと、を備えている。
【0023】
本発明は、コンピュータプログラムとしても観念することができる。すなわち、本発明に係るプログラムは、コンピュータを、参照入力データを取得する、参照入力データ取得部と、訓練用入力データと前記訓練用入力データに対応する訓練用正解データに基づいて生成された第1の近似関数へと、前記参照入力データを入力して第1の出力データを生成する、第1出力データ生成部と、前記訓練用入力データと、前記訓練用入力データを前記第1の近似関数へと入力して生成された出力データと前記訓練用正解データの差分データと、に基づいて機械学習を行うことにより生成された第2の学習済モデルへと、前記参照入力データを入力して第2の出力データを生成する、第2出力データ生成部と、前記第1の出力データと前記第2の出力データとに基づいて最終出力データを生成する、最終出力データ生成部と、参照正解データを取得する、参照正解データ取得部と、前記第1の出力データと前記参照正解データとの差分データと、前記参照入力データに基づいて機械学習を行い前記第2の学習済モデルを更新する、更新部と、を備えた情報処理装置として機能させるためのプログラムである。
【0024】
また、本発明は、別の側面から装置として観念することができる。すなわち、本発明に係る情報処理装置は、訓練用入力データと訓練用正解データに基づいて機械学習を行うことにより第1の学習済モデルを生成する、第1の学習処理部と、前記訓練用入力データと、前記訓練用入力データを前記第1の学習済モデルへと入力して生成された出力データと前記訓練用正解データの差分データと、に基づいて機械学習を行うことにより第2の学習済モデルを生成する、第2の学習処理部と、を備えている。
【0025】
本発明は、別の側面から方法として観念することができる。すなわち、本発明に係る情報処理方法は、訓練用入力データと訓練用正解データに基づいて機械学習を行うことにより第1の学習済モデルを生成する、第1の学習処理ステップと、前記訓練用入力データと、前記訓練用入力データを前記第1の学習済モデルへと入力して生成された出力データと前記訓練用正解データの差分データと、に基づいて機械学習を行うことにより第2の学習済モデルを生成する、第2の学習処理ステップと、を備えている。
【0026】
本発明は、別の側面からプログラムとして観念することができる。すなわち、本発明に係る情報処理プログラムは、コンピュータを、訓練用入力データと訓練用正解データに基づいて機械学習を行うことにより第1の学習済モデルを生成する、第1の学習処理部と、前記訓練用入力データと、前記訓練用入力データを前記第1の学習済モデルへと入力して生成された出力データと前記訓練用正解データの差分データと、に基づいて機械学習を行うことにより第2の学習済モデルを生成する、第2の学習処理部と、を備える情報処理装置として機能させるためのプログラムである。
【0027】
本発明は、別の側面から方法として観念することができる。すなわち、本発明に係る方法は、訓練用入力データと訓練用正解データに基づいて機械学習を行うことにより第1の学習済モデルを生成する、第1の学習処理ステップと、前記訓練用入力データと、前記訓練用入力データを前記第1の学習済モデルへと入力して生成された出力データと前記訓練用正解データの差分データと、に基づいて機械学習を行うことにより第2の学習済モデルを生成する、第2の学習処理ステップと、前記第1の学習済モデル及び前記第2の学習済モデルを、所定の装置に対して、前記第2の学習済モデルについては前記装置から取得されるデータに基づいて更新可能な態様で搭載する、学習済モデル搭載ステップと、を備えている。
【発明の効果】
【0028】
本発明によれば、一定の出力精度を担保しつつもモデルの特性変化にも適応可能な機械学習技術を提供することができる。
【図面の簡単な説明】
【0029】
【
図1】
図1は、情報処理装置のハードウェア構成図である。
【
図2】
図2は、制動距離推定装置のハードウェア構成図である。
【
図3】
図3は、第1の実施形態に係るゼネラルフローチャートである。
【
図4】
図4は、事前学習処理の詳細フローチャートである。
【
図6】
図6は、実稼働処理の詳細フローチャートである。
【
図7】
図7は、推定出力の統合処理に関する概念図である。
【
図9】
図9は、真値と推定出力との関係性ついて示す説明図である。
【発明を実施するための形態】
【0030】
以下、本発明の実施の一形態を、添付の図面を参照しつつ、詳細に説明する。
【0031】
(1.第1の実施形態)
(1.1 ハードウェア構成)
図1及び
図2を参照しつつ、本実施形態に係るハードウェアについて説明する。
【0032】
図1は、機械学習処理を行って学習済モデルを生成することが可能な情報処理装置10のハードウェア構成図である。同図から明らかな通り、制御部11、記憶部12、表示部13、操作信号入力部14、通信部15及びI/O部16を備え、それらはバスを介して接続されている。
【0033】
制御部11は、CPU及びGPU等の制御装置であり、後述する様々な動作を実現するプログラムの実行処理を行う。例えば、情報処理装置10の全体制御や学習処理又は推定処理等を行う。記憶部12は、ROM、RAM等の揮発性又は不揮発性の記憶装置であり、訓練用入力データや正解データ等を含む学習対象となる訓練データ、機械学習プログラム、推定処理プログラム等を格納している。表示部13は、ディスプレイ等と接続されて表示制御を行い、ディスプレイ等を介してユーザにGUIを提供する。操作信号入力部14は、キーボード、タッチパネル、ボタン等の入力部を介して入力された信号を処理するものである。通信部15は、インターネットやLAN等を通じて外部機器と通信を行う通信チップ等である。I/O部16は、外部装置との情報の入出力処理を行う装置である。
【0034】
また、
図2は、オフラインで学習された学習済モデルが搭載される装置、本実施形態では、例として車両等に搭載され車両の制動距離の推定を行う制動距離推定装置20のハードウェア構成図である。なお、本実施形態においては、制動距離推定装置20を採用したが、搭載対象装置はこのような装置に限定されない。従って、例えば、工作機械やロボット等のあらゆる装置に適用可能である。
【0035】
同図から明らかな通り、制御部21、記憶部22、表示部23、操作信号入力部24、通信部25及びI/O部26を備え、それらはバスを介して接続されている。
【0036】
制御部21は、CPU及びGPU等の制御装置であり、後述する様々な動作を実現するプログラムの実行処理を行う。例えば、情報処理装置20の全体制御や学習処理又は推定処理等を行う。記憶部22は、ROM、RAM等の揮発性又は不揮発性の記憶装置であり、学習済モデル、訓練用入力データや正解データ等を含む学習対象となる訓練データ、機械学習プログラム、推定処理プログラム等を格納している。表示部23は、ディスプレイ等と接続されて表示制御を行い、ディスプレイ等を介してユーザにGUIを提供する。I/O部24は、外部装置との情報の入出力処理を行う装置である。操作信号入力部25は、キーボード、タッチパネル、ボタン等の入力部を介して入力された信号を処理するものである。通信部26は、車両の他の構成と通信を行う通信ユニット等である。センサ情報取得部28は、車両の各種センサ情報、例えば、タイヤの回転数等のセンサ情報を取得する。
【0037】
なお、ハードウェア構成は本実施形態に係る構成に限定されるものではなく、構成や機能を分散又は統合してもよい。また、例えば、複数台の情報処理装置1により分散的に処理を行っても良いし、大容量記憶装置をさらに外部に設けて情報処理装置1と接続する等してもよい。さらに、IC、特に、ASICやFPGA等を用いて回路的に実装してもよい。
【0038】
(1.2 動作)
次に、
図3〜
図9を参照しつつ、情報処理装置10及び制動距離推定装置20の動作について説明する。
【0039】
図3は、本実施形態に係る処理の流れについて示すゼネラルフローチャートである。同図から明らかな通り、処理が開始すると、情報処理装置10上において制動距離推定装置20へと搭載する学習モデルに関して予め機械学習を行う処理、すなわち事前学習処理が行われる(S1)。
【0040】
この事前学習処理の後、事前学習処理において得られたオフライン学習用の学習済モデルとオンライン学習用の学習済モデルを対象装置、すなわち、本実施形態においては制動距離推定装置20へと実装する処理が行われる(S3)。
【0041】
この実装の後、制動距離推定装置20を動作させつつ、同装置から得られる現実のデータに基づいてオンライン学習を行う実稼働処理が行われる(S5)。その後、所定の終了条件を満たした場合、処理は終了する。なお、本実施形態において、オンライン学習とは、装置へと搭載した学習モデルのパラメータ等を装置において得られたデータに基づいて機械学習を行って装置上で更新することを意味する。なお、このとき、更新周期は、様々な構成とすることができ、例えば、装置の制御周期と対応した逐次的な学習であってもよいし、所定量学習対象データが蓄積してから行うバッチ学習又はミニバッチ学習等であってもよい。
【0042】
(1.2.1 事前学習処理の詳細)
図4及び
図5を参照しつつ、事前の機械学習処理の詳細について説明する。
図4は、事前学習処理の詳細フローチャートであり、
図5は、事前学習処理の概念図である。
【0043】
図4から明らかな通り、事前学習処理が開始すると、学習モデルやそのパラメータ、訓練用入力データと訓練用正解データとから成る訓練データ群等の各種データを読み出す処理が行われる(S11)。なお、訓練データは、例えば、搭載が予定される装置から予め実際に得られたデータ等である。本実施形態においては、訓練用入力データはブレーキのかけ初めのタイヤの回転数であり、訓練用正解データは制動距離、すなわち、タイヤが実際に停止するまでのタイヤの回転回数である。
【0044】
その後、読み出した訓練用データ群に基づいてオフライン学習用モデルについて教師あり学習が行われる(S13)。本実施形態においては、オフライン学習用モデルとして、ニューラルネットワークが採用される。
【0045】
この学習処理を概念的に表したものが
図5最上段である。すなわち、訓練用入力データ31と訓練用正解データ32とから成る訓練用データのデータ群が、オフライン学習用モデルへと入力されて学習処理が行われる。これにより、訓練用データ群に基づくオフライン学習による学習済モデルが生成される。この学習済モデルは、ブレーキのかけ始めのタイヤの回転数を入力として推定制動距離(タイヤ停止までの回転回数)を出力する。
【0046】
なお、オフライン学習用モデルについては、本実施形態の学習モデルに限定されない。従って、アルゴリズムとして、例えば、ランダムフォレストや学習木(例として、特開2016−173686を参照)等又はそれらの組み合わせのアルゴリズムを採用してもよい。
【0047】
この学習済モデルを生成した後、差分データの生成処理が行われる(S14)。より詳細には、生成された学習済モデルに対して訓練用データを入力したその出力(推定結果)と、訓練用正解データとの差分を算出する処理が行われる。
【0048】
この差分データの生成処理を概念的に表したものが
図5中段である。すなわち、訓練用入力データ31をオフライン学習により生成された学習済モデルへと入力した出力データ33と、訓練用正解データ32との差分を演算し、差分データ34を生成する処理が行われる。
【0049】
この差分データの生成処理の後、オンライン学習用モデルについて学習処理が行われる(S15)。すなわち、オンライン学習用モデルを、訓練用入力データと差分データを用いて学習する処理がなされる。
【0050】
このオンライン学習用モデルの学習処理を概念的に表したものが
図5下段である。すなわち、訓練用入力データ31と差分データ34とを用いてオンライン学習用モデルについて機械学習を行い、オンライン学習用の学習済モデルを生成する。この学習済モデルは、ブレーキをかけ始めた際のタイヤの回転数を入力として推定差分データを出力する。
【0051】
なお、オンライン学習用モデルは、本実施形態においては、学習木(例として、特開2016−173686を参照)が利用される。学習木を用いた学習処理においては、入力されるデータが、分岐条件に応じて階層的に分割された各状態空間に対応付けられ蓄積されていく。推定出力は、学習後に各状態空間に内包される各データに対応する出力値又は出力ベクトルの相加平均をとることにより算出される。このような構成により、学習木は、オンライン学習に好適である。
【0052】
また、オンライン学習用モデルについては、本実施形態の学習モデルに限定されない。従って、例えば、PA(Passive Aggressive)アルゴリズムやニューラルネットワーク等の他のアルゴリズムを採用してもよい。
【0053】
オンライン学習用モデルについての学習処理が終了した後、オフライン学習を行った学習済モデル、オンライン学習を行った学習済モデルのいずれも含む各種データを記憶部12へと記憶する処理を行い(S17)、事前学習処理は終了する。
【0054】
(1.2.2 実稼働処理の詳細)
次に、
図6〜
図8を参照しつつ、車両の制動距離推定装置20の実稼働処理(S5)の詳細について説明する。
【0055】
図6は、実稼働処理の詳細フローチャートである。同図から明らかな通り、処理が開始すると、事前学習によって獲得された学習済モデル等の読み出し処理が行われる(S51)。
【0056】
その後、制動距離推定装置20は、制動距離の推定指令があるまで待機状態となる(S52NO)。この状態において、制動距離の推定指令を受信すると(S52YES)、センサ情報取得部28からセンサ情報を読み出して各学習済モデルへの入力データとする処理が行われる(S53)。
【0057】
推定指令は、例えば、車両に対してブレーキをかけ始めたことを表す他の系統から発せられた信号である。また、本実施形態においては、センサは車両のタイヤの回転数を検出する回転数検出センサである。なお、本実施形態においてはセンサ入力として回転数を採用しているものの他のデータであってもよい。従って、例えば、路面環境に相当するデータ等を採用してもよい。
【0058】
次に、センサを介して取得されたタイヤの回転数を入力として、オフライン学習用の学習済モデルに基づいて出力データ、すなわち、推定制動距離(停止までの回転回数)を出力する処理が行われる(S54)。同様に、センサを介して取得されたタイヤの回転数を入力として、オンライン学習用の学習済モデルに基づいて、推定制動距離と正解値との推定差分データを生成する処理が行われる(S55)。
【0059】
推定制動距離と推定差分データを生成した後、これらの推定出力を統合する処理を行って、最終的な推定制動距離を算出する(S56)。
【0060】
図7は、上述の推定出力の統合処理に関する概念図である。同図から明らかな通り、オフライン学習用の学習済モデルとオンライン学習用の学習済モデルにはそれぞれ同一の入力データ41、すなわち、所定時点のタイヤの回転数が提供される。この入力データを受けて、各学習済モデルはそれぞれ、推定制動距離データ42と推定差分データ43を出力する。その後、推定制動距離データ42と推定差分データ43とは足しあわされて統合されて、最終的な推定制動距離が算出される。
【0061】
このような構成により、ブレーキや車体の特性の変化等も考慮しつつ、ブレーキをかけた瞬間に車両の停止までの制動距離を推定することが出来る。これにより、例えば、推定制動距離を用いた車体制御等が可能となる。
【0062】
図6に戻り、統合推定データを生成した後、制動距離推定装置20は、実際の制動距離を読み出し(S57)、当該実制動距離データに基づいて差分データを生成する処理を行う(S58)。すなわち、オフライン学習用の学習済モデルから生成された推定制動距離と実制動距離データとの差分データを生成する処理を行う。
【0063】
この差分データと入力データに基づいて、オンライン学習用の学習済モデルについて機械学習を行いオンライン学習用の学習済モデルを更新する(S59)。その後、再び推定指令の待機状態となり一連の処理(S52〜S59)が繰り返される。
【0064】
図8は、上述のオンライン学習に関する概念図である。同図から明らかな通り、センサから取得された入力データ41は、オフライン学習用の学習済モデルへと入力され、学習済モデルから推定制動距離に相当する所定の出力データ42が生成される。この出力データ42と、センサから取得された実制動距離データ51との差分から、差分データ52が生成される。この差分データ52と入力データ41とに基づいて、機械学習により、オンライン学習用の学習済モデルを更新する処理が行われる。
【0065】
このような構成によれば、事前に獲得された近似関数により一定の出力精度を担保しつつ、対象の特性変化についてオンライン学習により適応的に機械学習を行うことができる。すなわち、出力精度について一定の担保をしつつも対象の特性変化等に対して適応可能な機械学習技術を提供することができる。
【0066】
(1.2.3 その他)
図9は、真値と推定出力との関係性の一例について示す説明図である。横軸は時間、縦軸は出力値(推定値)を示す。同図から明らかな通り、実線で示される真値(正解値)に最も近似している曲線は、オフライン学習用の学習済モデルの出力とオンライン学習用の学習済モデルの出力とを足し合わせて統合した出力を表す破線である。
【0067】
また、統合出力(破線)は、オフライン学習用の学習済モデルの出力(二点鎖線)とオンライン学習用の学習済モデルの出力(一点鎖線)から構成されるものの、同図から明らかな通り、オフライン学習用の学習済モデルの出力が支配的であって、オンライン学習用の学習済モデルの出力の割合は小さいことが分かる。
【0068】
すなわち、オフライン学習用の学習済モデルを用いて大まかな推定を行いつつも、オンライン学習用の学習済モデルを用いて差分部分について調整を行っている。これにより、一般にオフライン学習程の精度は期待できないことが多いオンライン学習用の学習済モデルの影響を抑えつつも適応的な学習を行うことができる。すなわち、出力精度について一定の担保をしつつも対象の特性変化等に対して適応可能な機械学習技術を提供することができることが把握される。
【0069】
(2.変形例)
上述の実施形態においては、オフライン学習用の学習済モデルの出力とオンライン学習用の学習済モデルの出力とを足し合わせる構成としたが、本発明はこのような構成に限定されない。従って、例えば、オンライン学習用の学習済モデルの出力に一定の制限を設けてもよい。例えば、オンライン学習用の学習済モデルの出力に上限と下限を設けてもよい。
【0070】
上述の実施形態においては、学習済モデルを搭載する装置として、制動距離推定装置を採用したが、本発明はこのような構成に限定されない。従って、例えば、工場内の工作機械やロボットなどあらゆる種類の装置へと搭載することができる。また、学習対象とするデータもあらゆるデータを採用することができる。
【0071】
上述の実施形態においては、オフライン学習用モデルとオンライン学習用モデルの両方について予め事前学習を行う構成を採用した。しかしながら、本発明はこのような構成に限定されない。従って、例えば、オンライン学習用モデルについては事前学習を行わずに装置搭載後に学習を進める構成としてもよい。
【0072】
上述の実施形態においては、オフライン学習により近似関数(学習済モデル)を生成しているものの、本発明はそのような構成に限定されない。従って、例えば、機械学習を行わずに、定式化された近似関数を利用してもよい。
【0073】
上述の実施形態においては、オフライン学習用モデル又はオンライン学習用モデルのそれぞれについて、ニューラルネットワーク等の単一のモデルを用いて生成するものとして記載したが、本発明はこのような構成に限定されない。従って、例えば、同一の又は異なる複数の学習モデルを組み合わせて利用してそれぞれのモデルとして構成してもよい。すなわち、例えば、ニューラルネットワークとランダムフォレストの両方を組み合わせて利用してオフライン学習用モデルとして構成してもよい。
【0074】
上述の実施形態においては、オンライン学習用の学習済モデルとオフライン学習用の学習済モデルに基づいて出力推定を行う例について説明したが、これらの学習済モデルの利用はそのような例に留まらない。従って、例えば、オンライン学習用の学習済モデルの出力に基づいて所定の条件判定を行い、ユーザに対して、装置に生じた変化に関する通知やそれに伴う情報提供等を行っても良い。例えば、条件を満たした場合に、装置の制御を停止したり、ユーザに対して注意喚起を行う情報を提供する等してもよい。例えば、所定のエラーメッセージを通知したり、装置のメンテナンス時期を通知してもよい。
【0075】
条件判定は、例えば、オンライン学習用の学習済モデルの出力が所定の閾値を超えるか否かとすることができる。また、所定の閾値を超える割合や頻度を条件とすることもできる。
【産業上の利用可能性】
【0076】
本発明は、機械学習技術を利用する種々の産業等にて利用可能である。
【符号の説明】
【0077】
10 情報処理装置
11 制御部
12 記憶部
13 表示部
14 操作信号入力部
15 通信部
16 I/O部
20 制動距離推定装置
21 制御部
22 記憶部
23 表示部
24 I/O部
25 操作信号入力部
26 通信部
28 センサ情報取得部
【要約】
【課題】一定の出力精度を担保しつつモデルの特性変化にも適応可能な機械学習技術を提供すること。
【解決手段】参照入力データ取得部と、訓練用入力データと訓練用正解データに基づいて生成された第1の近似関数へと参照入力データを入力して第1の出力データを生成する第1出力データ生成部と、訓練用入力データと訓練用入力データを第1の近似関数へと入力して生成された出力データと訓練用正解データの差分データとに基づいて機械学習を行うことにより生成された第2の学習済モデルへと参照入力データを入力して第2の出力データを生成する第2出力データ生成部と、第1の出力データと第2の出力データに基づいて最終出力データを生成する最終出力データ生成部と、参照正解データ取得部と、第1の出力データと参照正解データとの差分データと参照入力データに基づいて機械学習を行い第2の学習済モデルを更新する更新部を備えた情報処理装置が提供される。
【選択図】
図5