IP Force 特許公報掲載プロジェクト 2022.1.31 β版

知財求人 - 知財ポータルサイト「IP Force」

▶ いすゞ自動車株式会社の特許一覧

特許7487759モデル作成装置、データ生成装置、モデル作成方法及びデータ生成方法
<>
  • 特許-モデル作成装置、データ生成装置、モデル作成方法及びデータ生成方法 図1
  • 特許-モデル作成装置、データ生成装置、モデル作成方法及びデータ生成方法 図2
  • 特許-モデル作成装置、データ生成装置、モデル作成方法及びデータ生成方法 図3
  • 特許-モデル作成装置、データ生成装置、モデル作成方法及びデータ生成方法 図4
  • 特許-モデル作成装置、データ生成装置、モデル作成方法及びデータ生成方法 図5A
  • 特許-モデル作成装置、データ生成装置、モデル作成方法及びデータ生成方法 図5B
  • 特許-モデル作成装置、データ生成装置、モデル作成方法及びデータ生成方法 図6
  • 特許-モデル作成装置、データ生成装置、モデル作成方法及びデータ生成方法 図7
  • 特許-モデル作成装置、データ生成装置、モデル作成方法及びデータ生成方法 図8
  • 特許-モデル作成装置、データ生成装置、モデル作成方法及びデータ生成方法 図9
< >
(19)【発行国】日本国特許庁(JP)
(12)【公報種別】特許公報(B2)
(11)【特許番号】
(24)【登録日】2024-05-13
(45)【発行日】2024-05-21
(54)【発明の名称】モデル作成装置、データ生成装置、モデル作成方法及びデータ生成方法
(51)【国際特許分類】
   G06N 20/00 20190101AFI20240514BHJP
   G08G 1/00 20060101ALI20240514BHJP
   G16Y 10/40 20200101ALI20240514BHJP
   G16Y 20/20 20200101ALI20240514BHJP
   G16Y 40/60 20200101ALI20240514BHJP
【FI】
G06N20/00 130
G08G1/00 D
G16Y10/40
G16Y20/20
G16Y40/60
【請求項の数】 4
(21)【出願番号】P 2022154997
(22)【出願日】2022-09-28
(65)【公開番号】P2024048863
(43)【公開日】2024-04-09
【審査請求日】2022-11-17
(73)【特許権者】
【識別番号】000000170
【氏名又は名称】いすゞ自動車株式会社
(74)【代理人】
【識別番号】110002952
【氏名又は名称】弁理士法人鷲田国際特許事務所
(72)【発明者】
【氏名】下沢 智啓
(72)【発明者】
【氏名】水師 由佳
【審査官】坂庭 剛史
(56)【参考文献】
【文献】特開2021-051638(JP,A)
【文献】国際公開第2019/163141(WO,A1)
【文献】特開2012-168037(JP,A)
【文献】米国特許出願公開第2022/0080980(US,A1)
(58)【調査した分野】(Int.Cl.,DB名)
G06N 20/00
G08G 1/00
G16Y 10/40
G16Y 20/20
G16Y 40/60
(57)【特許請求の範囲】
【請求項1】
車両が高速道路区間を走行中に測定された前記車両の走行中の時系列データから前記時系列データに関する発生頻度分布を示す頻度データを取得する頻度データ取得部と、
前記車両の高速道路区間走行中の学習用時系列データと、それに対応する学習用頻度データと、を教師データとして差分に基づく重み付け処理を用いて機械学習することにより得られた機械学習モデルに、前記頻度データを入力することにより、前記頻度データに対応する時系列データである生成時系列データを生成するデータ生成部と、
前記機械学習モデルから出力される前記生成時系列データに関する発生頻度分布を示す頻度データを生成頻度データとして得る頻度データ生成部と、
前記機械学習モデルに入力した前記頻度データと前記生成頻度データとの差分を算出する差分算出部と、
前記機械学習モデルから出力される前記生成時系列データの中から、前記差分算出部により算出された差分が小さくなるような生成時系列データを選択して出力することで、前記生成時系列データを補正する補正部と、
を備え、
前記補正部は、前記生成時系列データから互いに異なる時間の複数の生成時系列データを切り出し、かつ、切り出した複数の生成時系列データの中から、前記差分算出部の差分値が最も小さい頻度データに対応する生成時系列データを選択して出力する、
データ生成装置。
【請求項2】
前記補正部は、前記生成時系列データから所定の時間間隔t1で所定長さT0の生成時系列データを複数切り出し、かつ、切り出した複数の時間長T0の生成時系列データの中から、前記差分算出部の差分値が最も小さい頻度データに対応する時間長T0の生成時系列データを選択して出力する、
請求項に記載のデータ生成装置。
【請求項3】
前記補正部は、
前記生成時系列データから所定の時間間隔t1で所定長さT0の生成時系列データを複数切り出し、かつ、切り出した複数の時間長T0の生成時系列データの中から、前記差分算出部の差分値が最も小さい頻度データに対応する時間長T0の生成時系列データを選択し、
選択した時間長T0の周辺領域の生成時系列データに対して、前記時間間隔t1よりも短い時間間隔t2で所定長さT0の生成時系列データを複数切り出し、かつ、切り出した複数の時間長T0の生成時系列データの中から、前記差分算出部の差分値が最も小さい頻度データに対応する時間長T0の生成時系列データを選択して出力する、
請求項に記載のデータ生成装置。
【請求項4】
コンピューターが実行するデータ生成方法であって、
車両が高速道路区間を走行中に測定された前記車両の走行中の時系列データから前記時系列データに関する発生頻度分布を示す頻度データを取得するステップと、
前記車両の走行中の学習用時系列データと、それに対応する学習用頻度データと、を教師データとして差分に基づく重み付け処理を用いて機械学習することにより得られた機械学習モデルに、前記頻度データを入力することにより、前記頻度データに対応する時系列データである生成時系列データを生成するステップと、
前記機械学習モデルから出力される前記生成時系列データに関する発生頻度分布を示す頻度データを生成頻度データとして得るステップと、
前記機械学習モデルに入力した前記頻度データと前記生成頻度データとの差分を算出するステップと、
前記機械学習モデルから出力される前記生成時系列データの中から、前記差が小さくなるような生成時系列データを選択して出力することで、前記生成時系列データを補正するステップと、
を含み、
前記生成時系列データを補正するステップでは、前記生成時系列データから互いに異なる時間の複数の生成時系列データを切り出し、かつ、切り出した複数の生成時系列データの中から、前記差分値が最も小さい頻度データに対応する生成時系列データを選択して出力する、
データ生成方法。
【発明の詳細な説明】
【技術分野】
【0001】
本開示は、車両に関連するデータを生成するためのモデル作成装置、データ生成装置、モデル作成方法及びデータ生成方法に関する。
【背景技術】
【0002】
車両の速度及び加速度等のデータを取得し、取得したデータに基づいて車両を管理するシステムが知られている(例えば、特許文献1を参照)。
【0003】
車両の状態を把握するためには、時間経過に伴って変化する多数のデータから構成される時系列データをシステムが解析することが望ましい。しかしながら、時系列データはデータサイズが大きいので、車両が時系列データを送信し続けると通信時の負荷が大きい。そこで、車両が送信するデータ量を抑制しつつ、車両の状態を把握しやすくする方法が求められている。
【0004】
本出願の出願人は、特許文献2において、頻度情報から時系列データを生成する技術を提案している。一例として、特許文献2には、車速の時系列データと、それに対応する車速頻度及び加減速頻度を学習データとして用いて機械学習を行うことで、それら頻度データの入力に応じて生成した車速時系列データを出力する機械学習モデルの作成方法が記載されている。
【先行技術文献】
【特許文献】
【0005】
【文献】特開2012-248087号公報
【文献】特開2021-51637号公報
【発明の概要】
【発明が解決しようとする課題】
【0006】
ところで、特許文献2に記載された技術においては、頻度データの入力に応じて機械学習モデルから生成時系列データを出力するようになっているので、生成時系列データに関する頻度データは入力した頻度データと完全に一致することが望ましい。
【0007】
入力した頻度データと生成時系列データに関する頻度データに差が生じていた場合の改善策として、機械学習モデルを多層化などの構造変更することで、機械学習モデルをより複雑な表現を可能にする構造とする方法が挙げられる。
【0008】
しかし、この方法では、多層化につれて計算量が増大し学習時間が長くなる上に、高価で高性能のコンピューターが必要となる場合もある。さらに、所望の精度を得ることが可能なモデル構造の見当をつけるためには試行回数が必要なため、手間もかかる欠点がある。
【0009】
本発明は、以上の点を考慮してなされたものであり、機械学習モデルを用いて頻度情報から時系列データを生成する場合に、機械学習モデルの構造を変更しなくとも、生成時系列データの再現度を向上させることができる、モデル作成装置、データ生成装置、モデル作成方法及びデータ生成方法を提供する。
【課題を解決するための手段】
【0010】
本発明のモデル作成装置の一つの態様は、
車両が高速道路区間を走行中に測定された前記車両の走行中の時系列データを学習用時系列データとして取得する時系列データ取得部と、
前記学習用時系列データに関する発生頻度分布を示す学習用頻度データを取得する学習用頻度データ取得部と、
前記学習用時系列データと、それに対応する前記学習用頻度データと、を教師データとして差分に基づく重み付け処理を用いて機械学習することにより、頻度データが入力されたことに応じて生成時系列データを出力する機械学習モデルを作成するモデル作成部と、
を備える。
【0011】
本発明のデータ生成装置の一つの態様は、
車両が高速道路区間を走行中に測定された前記車両の走行中の時系列データから前記時系列データに関する発生頻度分布を示す頻度データを取得する頻度データ取得部と、
前記車両の高速道路区間走行中の学習用時系列データと、それに対応する学習用頻度データと、を教師データとして差分に基づく重み付け処理を用いて機械学習することにより得られた機械学習モデルに、前記頻度データを入力することにより、前記頻度データに対応する時系列データである生成時系列データを生成するデータ生成部と、
前記機械学習モデルから出力される前記生成時系列データに関する発生頻度分布を示す頻度データを生成頻度データとして得る頻度データ生成部と、
前記機械学習モデルに入力した前記頻度データと前記生成頻度データとの差分を算出する差分算出部と、
前記機械学習モデルから出力される前記生成時系列データの中から、前記差分算出部により算出された差分が小さくなるような生成時系列データを選択して出力することで、前記生成時系列データを補正する補正部と、
を備え、
前記補正部は、前記生成時系列データから互いに異なる時間の複数の生成時系列データを切り出し、かつ、切り出した複数の生成時系列データの中から、前記差分算出部の差分値が最も小さい頻度データに対応する生成時系列データを選択して出力する。
【0012】
本発明のモデル作成方法の一つの態様は、
コンピューターが実行するモデル作成方法であって、
車両が高速道路区間を走行中に測定された前記車両の走行中の時系列データを学習用時系列データとして取得するステップと、
前記学習用時系列データに関する発生頻度分布を示す学習用頻度データを取得するステップと、
前記学習用時系列データと、それに対応する前記学習用頻度データと、を教師データとして差分に基づく重み付け処理を用いて機械学習することにより、頻度データが入力されたことに応じて生成時系列データを出力する機械学習モデルを作成するステップと、
を含む。
【0013】
本発明のデータ生成方法の一つの態様は、
コンピューターが実行するデータ生成方法であって、
車両が高速道路区間を走行中に測定された前記車両の走行中の時系列データから前記時系列データに関する発生頻度分布を示す頻度データを取得するステップと、
前記車両の走行中の学習用時系列データと、それに対応する学習用頻度データと、を教師データとして差分に基づく重み付け処理を用いて機械学習することにより得られた機械学習モデルに、前記頻度データを入力することにより、前記頻度データに対応する時系列データである生成時系列データを生成するステップと、
前記機械学習モデルから出力される前記生成時系列データに関する発生頻度分布を示す頻度データを生成頻度データとして得るステップと、
前記機械学習モデルに入力した前記頻度データと前記生成頻度データとの差分を算出するステップと、
前記機械学習モデルから出力される前記生成時系列データの中から、前記差分算出部により算出された差分が小さくなるような生成時系列データを選択して出力することで、前記生成時系列データを補正するステップと、
を含み、
前記生成時系列データを補正するステップでは、前記生成時系列データから互いに異なる時間の複数の生成時系列データを切り出し、かつ、切り出した複数の生成時系列データの中から、前記差分算出部の差分値が最も小さい頻度データに対応する生成時系列データを選択して出力する。
【発明の効果】
【0014】
本発明によれば、機械学習モデルを用いて頻度情報から時系列データを生成する場合に、機械学習モデルの構造を変更しなくとも、生成時系列データの再現度を向上させることができるようになる。特に、長い生成時系列データの中から、最も入力側の頻度データと一致する生成時系列データを選択できるため、確実な精度向上が可能である。また、機械学習モデルに対する変更は、出力する生成時系列データの時間軸の長さのみでよいので、機械学習モデルの構造自体を大きく変更する必要がない。
【図面の簡単な説明】
【0015】
図1】データ生成システムの概要を説明するための図
図2】データ生成システムの概要を説明するための図
図3図3Aは時系列データを示す図、図3Bは車速の頻度データを示す図、図3Cは加速度の頻度データを示す図
図4】データ生成装置の構成を示すブロック図
図5A】条件付きVAEにより構成される機械学習モデルを、モデル作成部が作成する処理の概要を示す図
図5B】データ生成部が機械学習モデルを用いて時系列データを生成する過程を示す図
図6】データ生成装置における処理の流れを示すフローチャート
図7】実施の形態による補正を実現するための、データ生成装置の構成を示すブロック図
図8】高速道路区間の車速時系列データ例を示す図
図9】実施の形態で用いられる生成時系列データの切り出し及び選択の説明に供する図であり、図9Aは時間間隔t1での切り出し及び選択の説明に供する図、図9Bは時間間隔t2での切り出し及び選択の説明に供する図
【発明を実施するための形態】
【0016】
以下、本開示の実施の形態を、図面を参照して説明する。
【0017】
<1>データ生成システムSの概要
図1及び図2は、データ生成システムSの概要を説明するための図である。データ生成システムSは、車両Tにおいて測定された各種のパラメータの頻度データに基づいて、当該パラメータの時系列データを生成するためのシステムである。データ生成システムSは、データ収集装置1及びデータ生成装置2を備えている。データ生成装置2は、機械学習モデルを用いて、頻度データに基づいて時系列データを生成する装置である。データ生成装置2は、機械学習モデルを作成するモデル作成装置としても機能する。当該機械学習モデルは、例えば条件付VAE(Variational Auto Encoder)又は条件付GAN(Generative Adversarial Networks)を含んで構成されている。
【0018】
図3は、時系列データ及び頻度データの概要を示す図である。図3Aに示すように、時系列データは、時間によって変化するパラメータの値を示すデータであり、例えば1秒ごとの車両Tの速度の値から構成されている。図3Bに示すように、頻度データは、所定の期間内における、パラメータの値(速度)の発生頻度の分布を示すデータである。頻度データは、図3Cに示したように、パラメータを一階微分した値(加速度)の発生頻度の分布を示すデータであってもよい。
【0019】
パラメータが車両Tの速度である場合、頻度データは、例えば単位時間(例えば1時間)内に時速1kmの状態が発生した時間、時速2kmの状態が発生した時間等のように、時速Nkm(Nは0以上の整数)の状態が発生した時間又は割合を示すデータである(図3B参照)。パラメータが車両Tの速度である場合、頻度データは、単位時間内に所定の加速度が発生した時間又は割合を示すデータであってもよい(図3C参照)。なお、車両Tが加速している間は加速度が正の値となり、減速している間は加速度が負の値となる。
【0020】
車両Tにおいて測定されるパラメータは、データ生成システムSは、車両Tにおいて測定されたパラメータの時系列データ及び頻度データを教師データとして機械学習(例えば深層学習)した機械学習モデルを作成し、作成した機械学習モデルを用いて、車両Tから得られた頻度データに基づいて時系列データを生成することを可能にする。
【0021】
これにより、データ量の少ない頻度データに基づいて、データ量の大きい時系列データを生成できるようになる。
【0022】
車両Tの管理者は、データ生成システムSにおいて生成される時系列データを分析することで、車両Tの燃費、劣化度、運転の質等の各種の情報を得ることが可能になる。
【0023】
以下、図1及び図2を参照しながら、データ生成システムSの概要を説明する。データ収集装置1は、ネットワークNを介して多数の車両Tにおいて測定されたパラメータのデータを取得する装置であり、例えばコンピューターである。
【0024】
図1に示したように、データ生成装置2は、データ収集装置1を介して車両Tから取得した時系列データ及び当該時系列データに対応する頻度データを教師データとして機械学習した機械学習モデルを作成するコンピューターである。また、図2に示したように、データ生成装置2は、作成した機械学習モデルを用いて、車両Tから得られた頻度データに基づいて時系列データを生成する。
【0025】
図1は、データ生成装置2が機械学習をして機械学習モデルを作成する際のデータ生成システムSの動作を示す図である。データ収集装置1は、予め登録された車両Tから所定のパラメータ(例えば速度)の測定データを取得する(図1における(1))。データ収集装置1は、取得した測定データの時系列データをデータ生成装置2に送信する(図1における(2))。
【0026】
データ生成装置2は、データ収集装置1から受信した時系列データに基づいて頻度データを生成し、時系列データ及び頻度データを教師データとして、頻度データが入力されると時系列データを出力する機械学習モデルを作成する(図1における(3))。データ生成装置2が頻度データを生成する代わりに、データ収集装置1が時系列データから頻度データを生成し、データ収集装置1が時系列データ及び頻度データをデータ生成装置2に送信してもよい。
【0027】
続いて、図2を参照して、データ生成装置2が機械学習モデルを作成した後の動作を説明する。車両Tは、測定したパラメータの頻度データをデータ収集装置1に送信する(図2における(4))。データ収集装置1は車両Tから受信した頻度データをデータ生成装置2に送信する(図2における(5))。データ生成装置2は、受信した頻度データを機械学習モデルに入力し、機械学習モデルから出力される時系列データを取得することにより時系列データを生成する(図2における(6))。データ生成装置2は生成した時系列データをデータ収集装置1に送信する(図2における(7))。
【0028】
以上の流れにより、データ生成装置2を利用する車両Tの管理者等のユーザが、頻度データに基づいて、所望のパラメータの時系列データを取得することができる。データ生成装置2は、生成した時系列データをデータ収集装置1以外の任意のコンピューターに送信したり、ディスプレイに表示したり、印刷したりしてもよい。
【0029】
<2>データ生成装置2の構成及び動作
図4は、データ生成装置2の構成を示す図である。データ生成装置2は、通信部21と、記憶部22と、制御部23と、を有する。制御部23は、時系列データ取得部231と、学習用頻度データ取得部232と、生成用頻度データ取得部233と、データ出力部234と、モデル作成部235と、データ生成部236とを有する。
【0030】
データ生成装置2が生成用頻度データ取得部233、データ出力部234及びデータ生成部236を有しない場合、データ生成装置2は、機械学習モデルMを作成するモデル作成装置として機能する。
【0031】
通信部21は、データ収集装置1又はその他の外部装置との間でデータを送受信するための通信インターフェースである。通信部21は、受信したデータを制御部23に送るとともに、制御部23から入力したデータを外部装置に送る。
【0032】
記憶部22は、ROM(Read Only Memory)、RAM(Random Access Memory)及びハードディスク等の記憶媒体を含む。記憶部22は、制御部23が実行するプログラムを記憶する。また、記憶部22は、データ収集装置1から受信した時系列データ及び頻度データを一時的に記憶する。
【0033】
制御部23は、例えばCPU(Central Processing Unit)である。制御部23は、記憶部22に記憶されたプログラムを実行することにより、時系列データ取得部231、学習用頻度データ取得部232、生成用頻度データ取得部233、データ出力部234、モデル作成部235及びデータ生成部236として機能する。
【0034】
時系列データ取得部231は、車両Tが走行中に測定されたパラメータの時系列データを学習用時系列データとして取得する。時系列データ取得部231は、例えば、車両Tが走行中に測定された車両の速度の時系列データを学習用時系列データとして取得し、これをモデル作成部235に送る。
【0035】
学習用頻度データ取得部232は、時系列データ取得部231が取得した学習用時系列データに対応する学習用頻度データを取得する。学習用頻度データ取得部232は、例えば、通信部21を介して学習用頻度データを取得するが、学習用頻度データ取得部232は、学習用時系列データに基づいて学習用頻度データを作成することにより、学習用時系列データから学習用頻度データを取得してもよい。
【0036】
学習用頻度データ取得部232は、学習用頻度データとして、例えば学習用時系列データに関するパラメータの発生頻度分布を示すデータ(図3B参照)を取得する。また、学習用頻度データ取得部232は、学習用頻度データとして、学習用時系列データの一階微分値の発生頻度分布を示すデータ(図3C参照)を取得してもよい。
【0037】
学習用時系列データが速度の時系列データである場合、学習用頻度データ取得部232は、学習用時系列データにおける速度の発生頻度分布を示す学習用速度頻度データ、及び/又は、学習用時系列データにおける加速度の発生頻度分布を示す学習用加速度頻度データを取得する。学習用頻度データ取得部232は、取得した学習用頻度データをモデル作成部235に送る。
【0038】
生成用頻度データ取得部233は、機械学習モデルMを用いて時系列データを生成するために用いられる生成用頻度データを取得する。本明細書において、機械学習モデルMを用いて生成される時系列データを生成時系列データという。生成用頻度データ取得部233は、生成用頻度データとして、生成用速度頻度データ及び/又は生成用加速度頻度データを取得する。生成用頻度データ取得部233は、取得した生成用頻度データをデータ生成部236に送る。
【0039】
データ出力部234は、データ生成部236が生成用頻度データに基づいて機械学習モデルMから生成した生成時系列データを出力する。データ出力部234は、データ生成部236から出力された生成時系列データを、通信部21などの外部の装置に送信する。
【0040】
モデル作成部235は、機械学習モデルMを作成し、作成した機械学習モデルMの重みを記憶部22に記憶させる。モデル作成部235は、モデル作成部235が有するメモリ(不図示)に重みを記憶させてもよい。
【0041】
モデル作成部235は、学習用時系列データと、それに関する学習用頻度データと、を教師データとして重み付け処理を用いて機械学習することにより、頻度データが入力されたことに応じて頻度データに対応する時系列データである生成時系列データを出力する機械学習モデルMを作成する。
【0042】
学習用時系列データが、車両Tの速度の時系列データであり、学習用頻度データが、車両Tの速度の頻度データ及び/又は加速度の頻度データであり、生成時系列データが速度の時系列データである場合、機械学習モデルMは、速度頻度データ及び/又は加速度頻度データが入力されたことに応じて車両Tの速度の時系列データである生成時系列データを出力する。
【0043】
データ生成部236は、生成用頻度データ取得部233から入力された生成用頻度データを機械学習モデルMに入力することにより生成時系列データを生成する。生成用頻度データ取得部233から入力された生成用頻度データが、車両Tの速度の頻度データ及び/又は加速度の頻度データである場合、データ生成部236は、車両Tの速度の頻度データ及び/又は車両Tの加速度の頻度データを入力することにより機械学習モデルMから出力される速度の時系列データを生成時系列データとして生成する。データ生成部236により生成された生成時系列データは、データ出力部234を介して外部に出力される。
【0044】
<3>機械学習モデルMの作成方法
図5Aは、機械学習モデルMの一例として、条件付きVAEにより構成される機械学習モデルMをモデル作成部235が作成する処理の概要を示す図である。図5Bは、データ生成部236が機械学習モデルMを用いて時系列データを生成する過程を示す図である。
【0045】
図5に示すように、機械学習モデルMは、一例としてのディープニューラルネットワーク(DNN)により構成されている。DNNは、入力層から出力層までの間に複数の層を有しており、それぞれの層に含まれる複数のノードそれぞれに可変の重みが設けられている。機械学習モデルMが学習する前の重みは初期値となっている。
【0046】
図5Aに示すように、モデル作成部235は、入力された学習用時系列データ及び学習用頻度データのペアが入力される機械学習モデルM-1と、潜在変数ベクトルz及び学習用頻度データが入力される機械学習モデルM-2とで構成され、機械学習モデルM-2から出力される生成時系列データと、入力した学習用時系列データとを比較する。
【0047】
モデル作成部235は、機械学習モデルM-1及び機械学習モデルM-2に学習用頻度データを入力した際に機械学習モデルM-2から出力される生成時系列データと、学習用時系列データとの差分に基づいて、機械学習モデルM-1及び機械学習モデルM-2の重みを更新する。
【0048】
モデル作成部235は、例えば生成時系列データと学習用時系列データとの差が閾値以上である場合に、前記差を逆伝搬させ、逆伝搬させた経路上のノードの重みを更新する。モデル作成部235は、生成時系列データと学習用時系列データとの差が閾値未満になるまで、学習用頻度データを機械学習モデルM-1及び機械学習モデルM-2に入力したことにより生成される生成時系列データと学習用時系列データとの比較と重みの更新とを繰り返す。モデル作成部235は、多数の学習用頻度データ及び学習用時系列データのペアを用いて上記の処理を実行することにより、図5Bに示す機械学習モデルM-3(機械学習モデルM-2と実質的に同一のモデル)を作成する。
【0049】
モデル作成部235が機械学習モデルM-1及び機械学習モデルM-2を更新して機械学習モデルM-3として完成した後には、図5Bに示すように、データ生成部236が、車両Tから取得された頻度データ(生成用頻度データ)を機械学習モデルM-3に入力することにより、機械学習モデルM-3が、入力された頻度データに対応する生成時系列データを出力する。
【0050】
<4>データ生成装置2における処理の流れ
図6は、データ生成装置2における処理の流れを示すフローチャートである。図6に示すフローチャートは、データ生成装置2が機械学習モデルMの作成を開始する指示を受けた時点から開始される。
【0051】
モデル作成部235は、機械学習モデルMを作成する指示を受けると、時系列データ取得部231から学習用時系列データを取得する(ステップS11)。また、モデル作成部235は、学習用頻度データ取得部232から学習用頻度データを取得する(ステップS12)。ステップS11とステップS12を実行する順序は任意であり、モデル作成部235は、学習用時系列データと学習用頻度データとを同時に取得してもよい。モデル作成部235は、学習用時系列データと学習用頻度データのセットを教師データとして機械学習することにより機械学習モデルMを更新する(ステップS13)。具体的には、モデル作成部235は、記憶部22に記憶された機械学習モデルMの重みを更新する。
【0052】
モデル作成部235は、更新された機械学習モデルMの性能を評価し、評価した結果が基準レベル以上であるか否かを判定する(ステップS14)。モデル作成部235は、例えば、頻度データを機械学習モデルMに入力した際に機械学習モデルMから出力される生成時系列データと、学習用時系列データとの差分が閾値未満である場合に、評価した結果が基準レベル以上であると判定する。
【0053】
モデル作成部235は、評価した結果が基準レベルに達していないと判定した場合(ステップS14においてNO)、ステップS11に戻り、さらなる学習用時系列データ及び学習用頻度データを用いて機械学習を繰り返す。モデル作成部235は、評価した結果が基準レベルに達していると判定した場合(ステップS14においてYES)、機械学習モデルMの更新を終了する(ステップS15)。
【0054】
その後、データ生成部236は、時系列データを生成するための生成用頻度データを取得すると(ステップS16)、生成用頻度データを機械学習モデルMに入力する(ステップS17)。データ生成部236は、機械学習モデルMから出力された生成時系列データを出力する(ステップS18)。
【0055】
<5>生成時系列データの補正
図4との対応部分に同一符号を付して示す図7は、さらに改良を加えたデータ生成装置300の構成を示すブロック図である。データ生成装置300は、モデル作成部235が頻度データ生成部301、差分算出部302及び補正部303を有することを除いて、図4のデータ生成装置2と同様の構成となっている。
【0056】
なお、頻度データ生成部301、差分算出部302及び補正部303は、更新を終え完成した機械学習モデルMから出力される生成時系列データを補正するためのものであり、図7の例では、これらをモデル作成部235内に設けているが、これらはモデル作成部235とデータ生成部236との間や、データ生成部236内に設けてもよい。
【0057】
頻度データ生成部301は、機械学習モデルMから出力される生成時系列データに関する発生頻度分布を示す頻度データを生成頻度データとして得る。
【0058】
差分算出部302は、生成用頻度データ取得部233により得られた生成用頻度データと、頻度データ生成部301により得られた生成頻度データとの差分を算出する。
【0059】
補正部303は、機械学習モデルMからの生成時系列データの中から、差分算出部302により算出された差分が小さくなるような生成時系列データを選択することで、生成時系列データを補正する。
【0060】
補正部303により選択された生成時系列データは、データ生成部236に出力される。つまり、生成用頻度データ取得部233で得られた生成用頻度データがデータ生成部236を経由してモデル作成部235に入力され、生成用頻度データに基づく生成時系列データが機械学習モデルMから出力されると、この生成用頻度データとの差分が小さい生成時系列データが補正部303によって選択されてデータ生成部236に出力される。
【0061】
これにより、機械学習モデルMを用いて生成用頻度データから生成時系列データを得る場合に、機械学習モデルMの構造を変更しなくとも、生成時系列データの精度を向上させることができるようになる。
【0062】
次に、図8を用いて、データ生成装置300の特徴的な動作について説明する。ここでは、扱うデータが車速データである場合を例にとって説明する。
【0063】
図8は、機械学習モデルMから出力された生成時系列データ(高速道路区間車速時系列データ)の例を示す。図8からも分かるように、高速道路区間車速時系列データは、全ての時間領域において、ほぼ80±20[km/h]の範囲内で変動し、大きな差は無い。なお、ここでの高速道路区間車速時系列データとは、パーキングエリア内や料金所区間を除いたものである。
【0064】
本実施の形態は、このような大きな差がない高速道路区間車速時系列データの中から、生成用頻度データとの差分が小さい領域の生成車速時系列データを選択するといった補正を行うものである。所望の長さT0の生成車速時系列データ(この所望の長さT0の生成車速時系列データとは、最終的に出力させたい時系列データの長さのことをいう)よりも長く車速時系列データの生成を行い、そこから所定の時間間隔tで所望の長さT0の複数の生成車速時系列データを切り取る。
【0065】
そして、複数の生成車速時系列データを頻度データへと変換して生成用頻度データと比較し、最もよく一致する頻度データに対応する生成車速時系列データを選択して出力する。
【0066】
ここで切り取る時間間隔tを大きくすると、候補となるデータ数を抑えることができるため、計算量を抑えることができる。しかし、切り取る時間間隔tを大きくすると、頻度データが入力側とより一致する箇所を見落とすおそれがある。逆に時間間隔tを小さくすると、候補となるデータ数を増やすことができるが、それに伴い計算量が増大してしまう。
【0067】
これを考慮して、本実施の形態では、最初に切り取る時間間隔tを大きめに設定し、頻度データが一致する区間を大まかに把握した後、その区間周辺に限定して、切り取る時間間隔tを小さくして再探索を行う。
【0068】
図9は、本実施の形態における生成車速時系列データの切り出し及び選択の説明に供する図である。
【0069】
補正部303は、入力された生成車速時系列データ(高速道路区間車速時系列データ)を、図9Aに示したように、所望の時間長T0を単位として複数個切り出す。この切り出しは、時間間隔t1を隔てながら行われる。
【0070】
補正部303は、切り出した複数の時間長T0の生成車速時系列データの中から、差分算出部302の差分値が最も小さい頻度データに対応する時間長T0の生成車速時系列データを選択して出力する。
【0071】
なお上述したように、図9Aのように時間間隔t1で抽出した複数の時間長T0の中から1つを選択してデータ生成部236に出力してもよいが、図9Bに示したように、さらに時間間隔t1よりも短い間隔で再探索を行って最終的な時間長T0の生成車速時系列データを選択してデータ生成部236に出力してもよい。
【0072】
具体的に説明する。補正部303は、図9Aで選択した時間長T0の生成車速時系列データに、当該生成車速時系列データの前後の所定時間分を加えた生成車速時系列データを再探索領域とする。補正部303は、この再探索領域の生成車速時系列データを、所望の時間長T0を単位として複数個切り出す。この切り出しは、時間間隔t1よりも短い時間間隔t2を隔てながら行われる。
【0073】
補正部303は、切り出した複数の時間長T0の生成車速時系列データの中から、差分算出部302の差分値が最も小さい頻度データに対応する時間長T0の生成車速時系列データを選択して出力する。
【0074】
<6>まとめ
以上説明したように、本実施の形態のモデル作成装置(制御部23)は、車両Tが走行中に測定された車両Tの高速道路区間を走行中の時系列データを学習用時系列データとして取得する学習用時系列データ取得部231と、学習用時系列データに関する発生頻度分布を示す学習用頻度データを取得する学習用頻度データ取得部232と、学習用時系列データと、それに対応する学習用頻度データと、を教師データとして差分に基づく重み付け処理を用いて機械学習することにより、頻度データが入力されたことに応じて生成時系列データを出力する機械学習モデルMを作成するモデル作成部235と、を有する。
【0075】
本実施の形態のデータ生成装置(制御部23)は、車両Tが高速道路区間を走行中に測定された車両Tの走行中の時系列データから時系列データに関する発生頻度分布を示す頻度データを取得する頻度データ取得部233と、車両Tの高速道路区間走行中の学習用時系列データと、それに対応する学習用頻度データと、を教師データとして差分に基づく重み付け処理を用いて機械学習することにより得られた機械学習モデルMに、前記頻度データを入力することにより、前記頻度データに対応する時系列データである生成時系列データを生成するデータ生成部236と、機械学習モデルMから出力される生成時系列データに関する発生頻度分布を示す頻度データを生成頻度データとして得る頻度データ生成部301と、前記頻度データと生成頻度データとの差分を算出する差分算出部302と、機械学習モデルMから出力される生成時系列データの中から、差分算出部302により算出された差分が小さくなるような生成時系列データを選択して出力することで、生成時系列データを補正する補正部303と、を備え、補正部303は、生成時系列データから互いに異なる時間の複数の生成時系列データを切り出し、かつ、切り出した複数の生成時系列データの中から、差分算出部302の差分値が最も小さい頻度データに対応する生成時系列データを選択して出力する。
【0076】
このようにすることで、機械学習モデルを用いて頻度情報から時系列データを生成する場合に、機械学習モデルの構造を変更しなくとも、生成時系列データの精度を向上させることができるようになる。特に、長い生成時系列データの中から、最も入力側の頻度データと一致する生成時系列データを選択できるため、確実な精度向上が可能である。また、本実施の形態における機械学習モデルに対する変更は、出力する生成時系列データの時間軸の長さのみでよいので、機械学習モデルMの構造自体を大きく変更する必要がない。
【0077】
以上、本発明を実施の形態を用いて説明したが、本発明の技術的範囲は上記実施の形態に記載の範囲には限定されず、その要旨の範囲内で種々の変形及び変更が可能である。例えば、装置の全部又は一部は、任意の単位で機能的又は物理的に分散・統合して構成することができる。また、複数の実施の形態の任意の組み合わせによって生じる新たな実施の形態も、本発明の実施の形態に含まれる。組み合わせによって生じる新たな実施の形態の効果は、もとの実施の形態の効果を併せ持つ。
【0078】
上述の実施の形態では、主に時系列データが車両Tの速度である場合について述べたが、上述したように時系列データは、これに限らず、例えば、車両Tの加速度、車両Tで使用される冷却水の温度、車両Tで使用される油の温度、車両Tのアクセル開度、車両Tの振動量など、車両Tの走行によりであり時間的に変化する種々のパラメータについての時系列データであり得る。
【0079】
また、上述の実施の形態では、データ生成装置2がデータ収集装置1から時系列データ及び頻度データを取得する場合を例示したが、データ生成装置2がデータ収集装置1の機能を有しており、データ生成装置2が複数の車両Tから測定データを受信してもよい。
【0080】
また、以上の説明においては、データ生成装置2として機能するコンピューターが、モデル作成装置の機能を有するとともに、生成用頻度データが入力されたことに応じて機械学習モデルMから出力された生成時系列データを出力する機能も有する場合を例示したが、データ生成装置2の構成はこれに限らない。データ生成装置2は、モデル作成装置として機能する第1コンピューターと、第1コンピューターに生成用頻度データを入力し、第1コンピューターから生成時系列データを取得する第2コンピューターとによって構成されていてもよい。
【0081】
図8に示したような高速道路区間の時系列データの抽出は、学習用時系列データ取得部231で行ってもよく、モデル作成部235で行ってもよく、通信部21で行ってもよく、或いは、データ生成装置300の外部で行ってもよい。高速道路区間の時系列データの抽出は、例えば車両の位置情報に基づいて行ってもよく、車速に基づいて行ってもよい。
【産業上の利用可能性】
【0082】
本発明は、車両走行中の車両に関する時系列データを、学習により少ないデータから再現する技術として広く用いることができる。
【符号の説明】
【0083】
1 データ収集装置
2、300 データ生成装置
21 通信部
22 記憶部
23 制御部
231 時系列データ取得部
232 学習用頻度データ取得部
233 生成用頻度データ取得部
234 データ出力部
235 モデル作成部
236 データ生成部
301 頻度データ生成部
302 差分算出部
303 補正部
M 機械学習モデル
S データ生成システム
T 車両
図1
図2
図3
図4
図5A
図5B
図6
図7
図8
図9