(19)【発行国】日本国特許庁(JP)
(12)【公報種別】特許公報(B2)
(11)【特許番号】
(24)【登録日】2023-11-30
(45)【発行日】2023-12-08
(54)【発明の名称】情報処理装置、プログラム及び情報処理方法
(51)【国際特許分類】
G06N 3/08 20230101AFI20231201BHJP
G06N 20/00 20190101ALI20231201BHJP
【FI】
G06N3/08
G06N20/00
(21)【出願番号】P 2023526466
(86)(22)【出願日】2021-06-29
(86)【国際出願番号】 JP2021024512
(87)【国際公開番号】W WO2023275976
(87)【国際公開日】2023-01-05
【審査請求日】2023-04-28
【早期審査対象出願】
(73)【特許権者】
【識別番号】000006013
【氏名又は名称】三菱電機株式会社
(74)【代理人】
【識別番号】100116964
【氏名又は名称】山形 洋一
(74)【代理人】
【識別番号】100120477
【氏名又は名称】佐藤 賢改
(74)【代理人】
【識別番号】100135921
【氏名又は名称】篠原 昌彦
(74)【代理人】
【識別番号】100203677
【氏名又は名称】山口 力
(72)【発明者】
【氏名】劉 継康
【審査官】北川 純次
(56)【参考文献】
【文献】特開2019-040475(JP,A)
【文献】特開2020-194414(JP,A)
【文献】特開2018-073349(JP,A)
【文献】国際公開第2020/065970(WO,A1)
【文献】大林 準,ロジスティック回帰分析と傾向スコア(propensity score)解析,天理医学紀要 [online],2016年,19巻 2号,pp. 71-79,[検索日 2023.06.13], インターネット:<URL: https://www.jstage.jst.go.jp/article/tenrikiyo/19/2/19_19-008/_pdf/-char/ja>
(58)【調査した分野】(Int.Cl.,DB名)
G06N 3/02-3/10
G06N 20/00
(57)【特許請求の範囲】
【請求項1】
複数のセンサからセンサデータを収集するデータ収集部と、
前記センサデータに基づいて予測を行うための学習モデルを学習するために既に用いられた学習データである学習済データ及び前記センサデータに対応する未学習データを含む判定バッチデータを生成する判定データ生成部と、
前記学習済データ及び前記未学習データに対して、前記予測の結果に影響を及ぼす共変量を用いて傾向スコアを算出することで、前記学習済データ及び前記未学習データを複数の層に割り振る層別を行い、前記層別の結果から、前記複数の層の中で重要度が高いと判断される層である重要層の出現頻度と、前記未学習データ及び前記学習済データの中で重要度が高いと判断されるデータである重要データの出現頻度とを用いて、前記学習モデルを再学習するか否かを判断する再学習判定部と、を備えること
を特徴とする情報処理装置。
【請求項2】
前記再学習判定部は、前記重要層の出現頻度が予め定められた閾値以上である場合、又は、前記重要データの出現頻度が予め定められた閾値以上である場合に、前記学習モデルを再学習すると判断すること
を特徴とする請求項1に記載の情報処理装置。
【請求項3】
前記再学習判定部は、前記複数の層の内、平均予測精度が予め定められた閾値以下の層、又は、前記未学習データの予測精度と、前記学習済データの予測精度との差が予め定められた閾値以上の層を前記重要層と判断すること
を特徴とする請求項1又は2に記載の情報処理装置。
【請求項4】
前記再学習判定部は、前記重要層に含まれている前記未学習データ及び前記学習済データを前記重要データと判断すること、
を特徴とする請求項1から3の何れか一項に記載の情報処理装置。
【請求項5】
前記再学習判定部は、前記複数の層の内、前記重要層以外の層に含まれている前記未学習データ及び前記学習済データについて、前記学習モデルである第1の学習モデルとは異なる第2の学習モデルを用いて、前記重要データか否かを判断すること
を特徴とする請求項1から4の何れか一項に記載の情報処理装置。
【請求項6】
前記再学習判定部が前記学習モデルを再学習すると判断した場合に、前記学習モデルを再学習する再学習部をさらに備えること
を特徴とする請求項1から5の何れか一項に記載の情報処理装置。
【請求項7】
コンピュータを、
複数のセンサからセンサデータを収集するデータ収集部、
前記センサデータに基づいて予測を行うための学習モデルを学習するために既に用いられた学習データである学習済データ及び前記センサデータに対応する未学習データを含む判定バッチデータを生成する判定データ生成部、及び、
前記学習済データ及び前記未学習データに対して、前記予測の結果に影響を及ぼす共変量を用いて傾向スコアを算出することで、前記学習済データ及び前記未学習データを複数の層に割り振る層別を行い、前記層別の結果から、前記複数の層の中で重要度が高いと判断される層である重要層の出現頻度と、前記未学習データ及び前記学習済データの中で重要度が高いと判断されるデータである重要データの出現頻度とを用いて、前記学習モデルを再学習するか否かを判断する再学習判定部、として機能させること
を特徴とするプログラム。
【請求項8】
データ収集部が、複数のセンサからセンサデータを収集し、
判定データ生成部が、前記センサデータに基づいて予測を行うための学習モデルを学習するために既に用いられた学習データである学習済データ及び前記センサデータに対応する未学習データを含む判定バッチデータを生成し、
再学習判定部が、前記学習済データ及び前記未学習データに対して、前記予測の結果に影響を及ぼす共変量を用いて傾向スコアを算出することで、前記学習済データ及び前記未学習データを複数の層に割り振る層別を行い、
前記再学習判定部が、前記層別の結果から、前記複数の層の中で重要度が高いと判断される層である重要層の出現頻度と、前記未学習データ及び前記学習済データの中で重要度が高いと判断されるデータである重要データの出現頻度とを用いて、前記学習モデルを再学習するか否かを判断すること
を特徴とする情報処理方法。
【発明の詳細な説明】
【技術分野】
【0001】
本開示は、情報処理装置、プログラム及び情報処理方法に関する。
【背景技術】
【0002】
近年、機械学習における学習モデルを使用して、様々な予測が行われている。
例えば、電車又はバス等の公共交通機関の需要予測のため、統計的手法による交通需要予測技術が考案されており、駅の交通混雑緩和、及び、電車又はバス等の車両運行能力の調整に適用されている。
【0003】
従来の技術として、動的に更新される適切な人流予測モデルに基づいて将来の人流データを予測できるようにする交通需要予測装置が開示されている(例えば、特許文献1参照)。ここでの人流データは、単位時間にある施設を通過する人数のことである。
【先行技術文献】
【特許文献】
【0004】
【発明の概要】
【発明が解決しようとする課題】
【0005】
従来の交通需要予測装置では、重回帰モデルによる人流予測モデルといった学習モデルを用いて、新たな人流データを予測し、その平均予測精度を用いて、学習モデルのパラメータを再学習するか否かが判断されていた。
【0006】
そのため、重要なデータであっても、極端な天気又は運行事故に代表される出現頻度の低い場面であるレアシーン等のデータを考慮することができない。このため、学習モデルの再学習を判断する条件となるデータは、レアシーン等の重要なデータが少なくなり、偏りが大きいデータとなる。従って、従来の技術では、正しい条件で学習モデルの再学習条件を判断できないという問題があった。
【0007】
そこで、本開示の一又は複数の態様は、重要データが偏り過ぎることを防止して、より正しい条件で学習モデルを再学習するか否かを判断できるようにすることを目的とする。
【課題を解決するための手段】
【0008】
本開示の一態様に係る情報処理装置は、複数のセンサからセンサデータを収集するデータ収集部と、前記センサデータに基づいて予測を行うための学習モデルを学習するために既に用いられた学習データである学習済データ及び前記センサデータに対応する未学習データを含む判定バッチデータを生成する判定データ生成部と、前記学習済データ及び前記未学習データに対して、前記予測の結果に影響を及ぼす共変量を用いて傾向スコアを算出することで、前記学習済データ及び前記未学習データを複数の層に割り振る層別を行い、前記層別の結果から、前記複数の層の中で重要度が高いと判断される層である重要層の出現頻度と、前記未学習データ及び前記学習済データの中で重要度が高いと判断されるデータである重要データの出現頻度とを用いて、前記学習モデルを再学習するか否かを判断する再学習判定部と、を備えることを特徴とする。
【0009】
本開示の一態様に係るプログラムは、コンピュータを、複数のセンサからセンサデータを収集するデータ収集部、前記センサデータに基づいて予測を行うための学習モデルを学習するために既に用いられた学習データである学習済データ及び前記センサデータに対応する未学習データを含む判定バッチデータを生成する判定データ生成部、及び、前記学習済データ及び前記未学習データに対して、前記予測の結果に影響を及ぼす共変量を用いて傾向スコアを算出することで、前記学習済データ及び前記未学習データを複数の層に割り振る層別を行い、前記層別の結果から、前記複数の層の中で重要度が高いと判断される層である重要層の出現頻度と、前記未学習データ及び前記学習済データの中で重要度が高いと判断されるデータである重要データの出現頻度とを用いて、前記学習モデルを再学習するか否かを判断する再学習判定部、として機能させることを特徴とする。
【0010】
本開示の一態様に係る情報処理方法は、データ収集部が、複数のセンサからセンサデータを収集し、判定データ生成部が、前記センサデータに基づいて予測を行うための学習モデルを学習するために既に用いられた学習データである学習済データ及び前記センサデータに対応する未学習データを含む判定バッチデータを生成し、再学習判定部が、前記学習済データ及び前記未学習データに対して、前記予測の結果に影響を及ぼす共変量を用いて傾向スコアを算出することで、前記学習済データ及び前記未学習データを複数の層に割り振る層別を行い、前記再学習判定部が、前記層別の結果から、前記複数の層の中で重要度が高いと判断される層である重要層の出現頻度と、前記未学習データ及び前記学習済データの中で重要度が高いと判断されるデータである重要データの出現頻度とを用いて、前記学習モデルを再学習するか否かを判断することを特徴とする。
【発明の効果】
【0011】
本開示の一又は複数の態様によれば、重要データが偏り過ぎることを防止して、より正しい条件で学習モデルを再学習するか否かを判断することができる。
【図面の簡単な説明】
【0012】
【
図1】情報処理システムの構成を概略的に示すブロック図である。
【
図3】(A)~(C)は、再学習判定部での処理を説明するための概略図である。
【
図4】重要層の出現頻度を説明するための概略図である。
【
図5】重要データの出現頻度を説明するための概略図である。
【
図6】情報処理装置のハードウェア構成例を示すブロック図である。
【
図7】情報処理装置において予測モデルを再学習する際の処理を示すフローチャートである。
【発明を実施するための形態】
【0013】
図1は、情報処理システム100の構成を概略的に示すブロック図である。
ここでは、情報処理システム100は、電車又はバス等の公共交通機関の需要予測を行う交通需要予測システムであるものとして説明を行う。
【0014】
情報処理システム100は、センサ101と、入力部102と、表示部103と、情報処理装置110とを備える。
【0015】
センサ101は、交通需要に関連する外界情報を示すセンサデータを生成して、そのセンサデータを情報処理装置110に送信する。センサ101の数については、特に限定しないが、ここでは、複数のセンサ101が設けられているものとする。
【0016】
入力部102は、情報処理装置110に対する様々な指示の入力を受け付ける。入力された指示は、情報処理装置110に送られる。
例えば、入力部102は、需要予測を行う日付の入力を受け付ける。
ここで、入力部102は、具体的には、キーボード又はマウス等の入力装置で構成される。
【0017】
表示部103は、情報処理装置110での処理結果を出力する。
例えば、表示部103は、情報処理装置110で行われた、将来の交通需要の予測結果を表示する。
ここで、表示部103は、具体的には、液晶ディスプレイ等の表示装置で構成される。
【0018】
情報処理装置110は、センサ101から得られるセンサデータで示される外界情報を、入力部102からの指示に従って処理して、その処理結果を表示部103に表示させる。
例えば、情報処理装置110は、センサデータで示される外界情報から、予め学習された学習モデルである予測モデルを用いて、入力部102に入力された日付における交通需要を予測して、その予測結果を表示部103に表示させる。本実施の形態では、情報処理装置110は、交通需要予測装置として機能する。なお、予測モデルを第1の学習モデルともいう。
【0019】
ここで、予測モデルは、事前に学習済の重みが設定されている場合と、事前に学習済の重みが設定されていない場合とで異なる方法で学習される。
【0020】
事前に学習済みの重みが設定されていない場合、予測モデルを初期設定された重みで初期化する。初期設定された重みは、例えば、全ベクトルを0と設定したときの重み行列を指す。そして、予め取得されたセンサデータから変換されたモデル入力データを学習データとして用いて、予測モデルの学習が行われる。このようにして学習された重みについては、情報処理装置110に記憶される。
【0021】
事前に学習済みの重みが設定されている場合、直近に記憶された重みで予測モデルを初期化する。そして、予め取得されたセンサデータから変換されたモデル入力データを学習データとして用いて、予測モデルの学習が行われる。このようにして学習された重みについては、情報処理装置110に記憶される。
【0022】
情報処理装置110は、通信部111と、データ収集部112と、入出力インタフェース部(以下、入出力I/F部という)113と、制御部120と、記憶部150とを備える。
【0023】
通信部111は、センサ101からのセンサデータを受信する。受信されたセンサデータは、データ収集部112に与えられる。
【0024】
データ収集部112は、複数のセンサ101からセンサデータを収集する。
例えば、データ収集部112は、通信部111からセンサデータを受け取り、そのセンサデータを、予測モデルの入力フォーマットに合わせたモデル入力データに変換して、そのモデル入力データを制御部120に与える。
【0025】
入出力I/F部113は、入力部102又は表示部103を接続する。
例えば、入出力I/F部113は、入力部102から、需要予測を行う日付を示す日付データを受けて、その日付データを制御部120に与える。
また、入出力I/F部113は、予測データ記憶部154から出力された予測結果データを、表示部103で利用できる信号データに変換し、その信号データを表示部103に出力する。
【0026】
制御部120は、情報処理装置110での処理を制御する。
制御部120は、データ生成部130と、予測処理部140とを備える。
【0027】
データ生成部130は、予測モデルの再学習を判定するための判定バッチデータを生成する。また、データ生成部130は、判定バッチデータを用いて、予測モデルを再学習するか否かを判定する。そして、データ生成部130は、再学習すると判定した場合に、予測モデルを再学習するための再学習バッチデータを生成する。
データ生成部130は、判定データ生成部131と、再学習判定部132と、再学習データ生成部133とを備える。
【0028】
判定データ生成部131は、予測モデルを学習するために既に用いられた学習データである学習済データ及びセンサデータに対応する未学習データを含む判定バッチデータを生成する。ここでは、未学習データは、センサデータから変換されたモデル入力データである。
具体的には、判定データ生成部131は、データ収集部112から与えられた、予測モデルの学習に使われていないセンサデータから変換されたモデル入力データである未学習データと、記憶部150に記憶されている、学習済のモデル入力データである学習済みデータと、記憶部150に記憶されている、過去の最適な予測モデルの重みとで予測モデルを再学習するか否かを判定するための判定バッチデータを生成する。判定バッチデータは、記憶部150に記憶される。
ここで、学習済データの数は一定で、例えば、過去の予め定められた期間(例えば、数週間)の重要データとする。重要データは、重要度の高いデータである。
【0029】
再学習判定部132は、記憶部150に記憶されている判定バッチデータを読み込み、過去の最適なモデルのパラメータを用いて、未学習データ及び学習済データのそれぞれで予測精度の評価を実施する。
例えば、再学習判定部132は、モデル入力データに含まれている共変量データで、未学習データ及び学習済データのそれぞれを層別して、各層の重要度及び各層に振り分けられた未学習データ及び学習済データの重要度の両方を用いて、再学習するか否かを判定する。
【0030】
ここでは、再学習判定部132学習済データ及びセンサデータに対応する未学習データに対して、予測の結果に影響を及ぼす共変量を用いて傾向スコアを算出することで、学習済データ及び未学習データを複数の層に割り振る層別を行う。そして、再学習判定部132は、その層別の結果から、その複数の層の中で重要度が高いと判断される層である重要層の出現頻度と、未学習データ及び学習済データの中で重要度が高いと判断されるデータである重要データの出現頻度とを用いて、予測モデルを再学習するか否かを判断する。
【0031】
以下、再学習判定部132の具体的な処理例を説明する。
まず、再学習判定部132による層別を説明する。
ここでは、再学習判定部132は、多項式ロジットモデル又は線形重回帰モデルを用いて、誘導施策の傾向性を分析する因果推論技術で傾向スコアを計算し、共変量データの次元削減を行って層別を行う。
【0032】
具体的には、交通事故又は極端な天気等の外界要因による駅又は車両の混雑度変化があるときに、駅内の係員が車内放送又は手動ガイダンス等の施策によって人流を誘導する。再学習判定部132は、これらの誘導施策の履歴を収集し、天気、運行情報又はイベント情報等の共変量データを共変量で分析して、誘導施策の確率を勾配ブースティング決定木又は多項式ロジットモデルにより算出する。共変量で算出された誘導施策の確率を、誘導施策の傾向スコアとして定義する。傾向スコアの値は0と1との間の実数である。なお、共変量は、因果関係の分析において、評価対象の要因以外に観測され、その因果関係に影響を及ぼす要因である。ここでは、共変量は、交通需要又は電車の混雑度等に影響する変量である。
【0033】
そして、再学習判定部132は、誘導施策の傾向スコアを用いて、各層の閾値を設定し、未学習データ及び学習済データの層別を行う。例えば、傾向スコアが0以上、かつ、0.03未満のデータは、施策確率小の層に振り分けられる。傾向スコアが0.3以上、かつ、0.6未満のデータは、施策確率中の層に振り分けられる。傾向スコアが0.6以上、かつ、1以下のデータは、施策確率大の層に振り分けられる。
なお、この層別は、一例であり、例えば、層別の閾値及び層の数については、学習用の実際の実データの共変量のバランスによって調整することができる。
【0034】
次に、再学習判定部132は、各層に振り分けられた未学習データ及び学習済データの平均予測精度を計算し、さらに、各層に振り分けられた未学習データ及び学習済データの予測精度の差を計算する。
【0035】
そして、再学習判定部132は、計算された平均予測精度が予め定められた閾値以下である層、又は、計算された予測精度の差が予め定められた閾値以上である層がある場合には、そのような層に重要ラベルを付すとともに、そのような層に含まれている全てのデータに重要ラベルを付加する。ここで、重要ラベルが付された層が重要層である。また、重要ラベルが付されたデータが重要データである。
【0036】
また、再学習判定部132は、計算された平均予測精度が予め定められた閾値よりも大きい層、及び、計算された予測精度の差が予め定められた閾値よりも小さい層に含まれているデータが重要データであるか否かを判断する。この判断については、機械学習における深層学習モデルを用いて行われればよい。この深層学習モデルは、予測モデルとは異なる学習モデルである。深層学習モデルを第2の学習モデルともいう。この深層学習モデルのパラメータは、事前に学習データを用意して学習済みのものが用いられる。ここで重要データの判断のための深層学習モデルの一例としては、
図2に示されているLSTM(Long-Short Term Memory)モデルを用いることができる。このモデルの入力は、時系列データとなる交通需要予測時系列変化量であり、このモデルの出力は、重要度one-hotベクトルになっている。
【0037】
そして、再学習判定部132は、重要層の出現頻度が予め定められた閾値以上である場合、又は、重要データの出現頻度が予め定められた閾値以上である場合に、予測モデルを再学習すると判断する。
【0038】
図3~
図5は、再学習判定部132での処理を説明するための概略図である。
再学習判定部132は、記憶部150に記憶されている判定バッチデータを読み込み、過去の最適なモデルのパラメータを用いて、未学習データD1及び学習済データD2のそれぞれで、傾向スコアを計算し、共変量データの次元削減を行って層別を行う。
【0039】
これにより
図3(A)に示されているように、学習済データ及び未学習データが第1層L1、第2層L2、・・・に振り分けられる。
【0040】
次に、再学習判定部132は、
図3(B)に示されているように、各層L1、L2、・・・に振り分けられた未学習データ及び学習済データの平均予測精度を計算し、さらに、各層に振り分けられた未学習データ及び学習済データの予測精度の差を計算する。
【0041】
そして、再学習判定部132は、計算された平均予測精度及び計算された予測精度の差を用いて、各々の層について重要ラベル又は非重要ラベルを付加する。
図3(C)では、第1層L1に重要ラベルが付されており、第2層L2に非重要ラベルが付されている。
【0042】
再学習判定部132は、重要ラベルが付された層に含まれている全てのデータにも、重要ラベルを付加する。そして、再学習判定部132は、非重要ラベルが付された層に含まれている各々のデータが重要データであるか否かを判断し、重要データと判断されたデータには重要ラベルを付し、重要データとは判断されなかったデータには非重要ラベルを付す。非重要ラベルが付された層を非重要層ともいい、非重要ラベルが付されたデータを非重要データともいう。
【0043】
そして、再学習判定部132は、重要ラベルが付された層である重要層の出現頻度が予め定められた閾値以上である場合、又は、重要データの出現頻度が予め定められた閾値以上である場合に、予測モデルを再学習すると判断する。
例えば、
図4に示されているように、重要層の出現頻度が1/3となっていた場合において、重要層の出現頻度に対する閾値が0.5であるときには、重要層の出現頻度は、閾値以上となってはいない。
一方、
図5に示されているように重要データの出現頻度が5/8となっていた場合において、重要データの出現頻度に対する閾値が0.5であるときには、重要データの出現頻度が閾値以上となっている。
【0044】
このような場合には、再学習判定部132は、予測モデルが適切に学習されておらず、予測モデルの重みを再学習する必要があると判断する。ここでは、重要層の出現頻度が閾値以上である場合に、重要データがある層に偏り過ぎることを判断でき、この偏りを防ぐために予測モデルの重みが再学習される。
図4及び
図5の例では、重要層の出現頻度からみると予測モデルの重みの再学習は必要ないが、重要データの分布において偏りが発生しているため、重要データの出現頻度が高まっている。このため、
図5に示されている例だと、予測モデルの重みの再学習が必要だと判断される。
【0045】
再学習データ生成部133は、再学習判定部132が再学習する必要があると判定した場合に、学習データ及び未学習データを、各層のデータと同じ比例で再度サンプリングすることで、再学習バッチデータを生成して、その再学習バッチデータを記憶部150に記憶させる。
【0046】
予測処理部140は、学習モデルである予測モデルを用いて、センサデータに基づいて予測を行う。また、予測処理部140は、再学習判定部132が予測モデルを再学習すると判断した場合に、その予測モデルを再学習する。
予測処理部140は、モデル重み更新部141と、モデル重み検証部142と、データ予測部143とを備える。
【0047】
モデル重み更新部141は、学習データ記憶部152に記憶されている再学習バッチデータを読み込み、その再学習バッチデータを用いて、予測モデルの再学習を行う再学習部である。
例えば、モデル重み更新部141は、モデル重み記憶部153に記憶されている予測モデルの重みを、再学習バッチデータを用いて更新する。
【0048】
モデル重み検証部142は、モデル重み更新部141により更新された重みが最適であるか否かを判断する。例えば、モデル重み検証部142は、更新された重みの予測誤差を少なくするため、過去の最適な重みの予測誤差よりも、更新された重みの予測誤差が少ない場合に、更新された重みが最適であると判断する。
そして、モデル重み検証部142は、更新された重みが最適であると判断された場合には、その更新された重みを、更新された重みが最適ではないと判断された場合には、過去の最適な重みをデータ予測部143に与える。
【0049】
データ予測部143は、モデル重み検証部142から与えられた重みを使用して、データ収集部112で収集されたセンサデータに基づいて、入力部102に入力された日付における交通需要を予測する予測部である。そして、データ予測部143は、その予測結果を示す予測結果データを記憶部150に記憶させる。
【0050】
記憶部150は、情報処理装置110での処理に必要なプログラム及びデータを記憶する。
記憶部150は、判定データ記憶部151と、学習データ記憶部152と、モデル重み記憶部153と、予測データ記憶部154とを備える。
【0051】
判定データ記憶部151は、判定データ生成部131で生成された判定バッチデータを記憶する。
学習データ記憶部152は、再学習データ生成部133で生成された再学習バッチデータを記憶する。また、学習データ記憶部152には、予測モデルの学習に既に使用された学習データも学習済データとして記憶されているものとする。このため、再学習バッチデータも、予測モデルの再学習に使用された後は、学習済データとなる。
【0052】
モデル重み記憶部153は、予測モデルの重みを記憶する。
予測データ記憶部154は、データ予測部143で予測された予測結果である需要予測を示す需要予測データを記憶する。
【0053】
以上に記載された情報処理装置110は、
図6に示されているような、揮発性又は不揮発性のメモリ10と、CPU(Central Processing Unit)等のプロセッサ11と、HDD(Hard Disk Drive)又はSSD(Sorid State Drive)等の補助記憶装置12と、NIC(Network Interfece Card)等の通信I/F13と、USB(Universal Serial Bus)等の接続I/F14とを備えるコンピュータ15により実現することができる。
【0054】
例えば、データ収集部112及び制御部120は、メモリ10に格納されているプログラムを実行するプロセッサ11により実現することができる。
記憶部150は、メモリ10又は補助記憶装置12により実現することができる。
通信部111は、通信I/F13により実現することができる。
入出力I/F部113は、接続I/F14により実現することができる。
【0055】
なお、以上に記載したプログラムは、ネットワークを通じて提供されてもよく、また、記録媒体に記録されて提供されてもよい。即ち、このようなプログラムは、例えば、プログラムプロダクトとして提供されてもよい。
【0056】
次に、情報処理装置110の動作について説明する。
図7は、情報処理装置110において予測モデルを再学習する際の処理を示すフローチャートである。
まず、再学習判定部132は、判定データ記憶部151から判定バッチデータを読み込む(S10)。なお、判定バッチデータは、例えば、予め定められた期間(例えば、数時間)に一回更新され、判定バッチデータが更新されると、再学習判定部132は、予測モデルを再学習するか否かを判断するものとする。
【0057】
次に、再学習判定部132は、多項式ロジットモデル又は線形重回帰モデルによる施策傾向性を分析する統計的因果推論技術を用いて、ステップS10で読み込まれた判定バッチデータに含まれている未学習データ及び学習済データに含まれている共変量データの次元数を1次元落として、層別を行う(S11)。また、再学習判定部132は、層別された各層の平均予測精度、及び、未学習データと、学習済みデータとの予測精度の差分を計算する。
【0058】
次に、再学習判定部132は、ステップS11で計算された平均予測精度が予め定められた閾値以上である層、又は、ステップS11で計算された予測精度の差が予め定められた閾値以上である層が存在するか否かを判断する(S12)。そのような層が存在する場合(S12でYes)には、処理はステップS13に進み、そのような層が存在しない場合(S12でNo)には、処理はステップS14に進む。
【0059】
ステップS13では、ステップS11で計算された平均予測精度が予め定められた閾値以上である層、及び、ステップS11で計算された予測精度の差が予め定められた閾値以上である層に重要ラベルを付加するとともに、そのような層に含まれている全てのデータに重要ラベルを付加する。
【0060】
ステップS14では、ステップS11で計算された平均予測精度が予め定められた閾値未満である層、及び、ステップS11で計算された予測精度の差が予め定められた閾値未満である層に非重要ラベルを付加する。
【0061】
次に、再学習判定部132は、教師ありLSTMモデルを用いて、非重要層に含まれているデータが重要データになるか否かを判断する(S15)。
そして、再学習判定部132は、ステップS15で、重要データと判断されたデータに重要ラベルを付加する。重要ラベルが付加されたデータを、重要データともいう。
【0062】
そして、再学習判定部132は、重要層の出現頻度が予め定められた閾値(例えば、0.5)以上である第1の条件、及び、重要データの出現頻度が予め定められた閾値(例えば、0.5)以上である第2の条件の少なくとも何れか一方の条件が満たされるか否かを判断する(S17)。第1の条件及び第2の条件の少なくとも何れか一方が満たされる場合(S17でYes)には、処理はステップS18に進み、第1の条件が満たされず、かつ、第2の条件も満たされない場合(S17でNo)には、処理は終了する。
【0063】
ステップS18では、再学習判定部132は、予測モデルを再学習すると判断し、再学習データ生成部133は、再学習バッチデータを生成し、その再学習バッチデータに基づいて、モデル重み更新部141が予測モデルの再学習を実行する。
【0064】
以上に記載された実施の形態によれば、予測モデルの再学習を行うか否かを判定する場合に、重要データの出現頻度だけでなく、重要層の出現頻度も参考にされるため、重要データが一つの層に偏りすぎることを防ぐことができる。このため、より正しい条件で予測モデルを再学習するか否かを判定することができる。
【0065】
また、以上に記載された実施の形態によれば、重要データを用いて重点的に再学習が行われるため、予測モデルの学習の収束度と、レアシーンデータ又は混雑度が高い重要データの予測精度を向上させることができる。
【0066】
さらに、再学習バッチデータにおける非重要データのデータ量を減少されることができるため、再学習で用いるデータ量を抑えることができる。
【符号の説明】
【0067】
100 情報処理システム、 101 センサ、 102 入力部、 103 表示部、 110 情報処理装置、 111 通信部、 112 データ収集部、 113 入出力I/F部、 120 制御部、 130 データ生成部、 131 判定データ生成部、 132 再学習判定部、 133 再学習データ生成部、 140 予測処理部、 141 モデル重み更新部、 142 モデル重み検証部、 143 データ予測部、 150 記憶部、 151 判定データ記憶部、 152 学習データ記憶部、 153 モデル重み記憶部、 154 予測データ記憶部。