特許7395066 | 知財ポータル「IP Force」

知財求人 - 知財ポータルサイト「IP Force」

▶ 三菱電機株式会社の特許一覧

特許7395066情報処理装置、プログラム及び情報処理方法

書誌要約請求の範囲詳細な説明課題実施例実施するための形態図面の説明

目に優しい文字サイズ小中大 PDF Top

< >

1
2
3
4
5
6
7

(19)【発行国】日本国特許庁(JP)

(12)【公報種別】特許公報(B2)

(11)【特許番号】

(24)【登録日】2023-11-30

(45)【発行日】2023-12-08

(54)【発明の名称】情報処理装置、プログラム及び情報処理方法

(51)【国際特許分類】

G06N 3/08 20230101AFI20231201BHJP

G06N 20/00 20190101ALI20231201BHJP

【ＦＩ】

G06N3/08

G06N20/00

【請求項の数】 8

(21)【出願番号】P 2023526466

(86)(22)【出願日】2021-06-29

(86)【国際出願番号】 JP2021024512

(87)【国際公開番号】W WO2023275976

(87)【国際公開日】2023-01-05

【審査請求日】2023-04-28

【早期審査対象出願】

(73)【特許権者】

【識別番号】000006013

【氏名又は名称】三菱電機株式会社

(74)【代理人】

【識別番号】100116964

【弁理士】

【氏名又は名称】山形洋一

(74)【代理人】

【識別番号】100120477

【弁理士】

【氏名又は名称】佐藤賢改

(74)【代理人】

【識別番号】100135921

【弁理士】

【氏名又は名称】篠原昌彦

(74)【代理人】

【識別番号】100203677

【弁理士】

【氏名又は名称】山口力

(72)【発明者】

【氏名】劉継康

【審査官】北川純次

(56)【参考文献】

【文献】特開２０１９－０４０４７５（ＪＰ，Ａ）

【文献】特開２０２０－１９４４１４（ＪＰ，Ａ）

【文献】特開２０１８－０７３３４９（ＪＰ，Ａ）

【文献】国際公開第２０２０／０６５９７０（ＷＯ，Ａ１）

【文献】大林準，ロジスティック回帰分析と傾向スコア（propensity score）解析，天理医学紀要 [online]，2016年，19巻 2号，pp. 71-79，[検索日 2023.06.13], インターネット：<URL: https://www.jstage.jst.go.jp/article/tenrikiyo/19/2/19_19-008/_pdf/-char/ja>

(58)【調査した分野】(Int.Cl.，ＤＢ名)

Ｇ０６Ｎ３／０２－３／１０

Ｇ０６Ｎ２０／００

(57)【特許請求の範囲】

【請求項1】

複数のセンサからセンサデータを収集するデータ収集部と、
前記センサデータに基づいて予測を行うための学習モデルを学習するために既に用いられた学習データである学習済データ及び前記センサデータに対応する未学習データを含む判定バッチデータを生成する判定データ生成部と、
前記学習済データ及び前記未学習データに対して、前記予測の結果に影響を及ぼす共変量を用いて傾向スコアを算出することで、前記学習済データ及び前記未学習データを複数の層に割り振る層別を行い、前記層別の結果から、前記複数の層の中で重要度が高いと判断される層である重要層の出現頻度と、前記未学習データ及び前記学習済データの中で重要度が高いと判断されるデータである重要データの出現頻度とを用いて、前記学習モデルを再学習するか否かを判断する再学習判定部と、を備えること
を特徴とする情報処理装置。

【請求項2】

前記再学習判定部は、前記重要層の出現頻度が予め定められた閾値以上である場合、又は、前記重要データの出現頻度が予め定められた閾値以上である場合に、前記学習モデルを再学習すると判断すること
を特徴とする請求項１に記載の情報処理装置。

【請求項3】

前記再学習判定部は、前記複数の層の内、平均予測精度が予め定められた閾値以下の層、又は、前記未学習データの予測精度と、前記学習済データの予測精度との差が予め定められた閾値以上の層を前記重要層と判断すること
を特徴とする請求項１又は２に記載の情報処理装置。

【請求項4】

前記再学習判定部は、前記重要層に含まれている前記未学習データ及び前記学習済データを前記重要データと判断すること、
を特徴とする請求項１から３の何れか一項に記載の情報処理装置。

【請求項5】

前記再学習判定部は、前記複数の層の内、前記重要層以外の層に含まれている前記未学習データ及び前記学習済データについて、前記学習モデルである第１の学習モデルとは異なる第２の学習モデルを用いて、前記重要データか否かを判断すること
を特徴とする請求項１から４の何れか一項に記載の情報処理装置。

【請求項6】

前記再学習判定部が前記学習モデルを再学習すると判断した場合に、前記学習モデルを再学習する再学習部をさらに備えること
を特徴とする請求項１から５の何れか一項に記載の情報処理装置。

【請求項7】

コンピュータを、
複数のセンサからセンサデータを収集するデータ収集部、
前記センサデータに基づいて予測を行うための学習モデルを学習するために既に用いられた学習データである学習済データ及び前記センサデータに対応する未学習データを含む判定バッチデータを生成する判定データ生成部、及び、
前記学習済データ及び前記未学習データに対して、前記予測の結果に影響を及ぼす共変量を用いて傾向スコアを算出することで、前記学習済データ及び前記未学習データを複数の層に割り振る層別を行い、前記層別の結果から、前記複数の層の中で重要度が高いと判断される層である重要層の出現頻度と、前記未学習データ及び前記学習済データの中で重要度が高いと判断されるデータである重要データの出現頻度とを用いて、前記学習モデルを再学習するか否かを判断する再学習判定部、として機能させること
を特徴とするプログラム。

【請求項8】

データ収集部が、複数のセンサからセンサデータを収集し、
判定データ生成部が、前記センサデータに基づいて予測を行うための学習モデルを学習するために既に用いられた学習データである学習済データ及び前記センサデータに対応する未学習データを含む判定バッチデータを生成し、
再学習判定部が、前記学習済データ及び前記未学習データに対して、前記予測の結果に影響を及ぼす共変量を用いて傾向スコアを算出することで、前記学習済データ及び前記未学習データを複数の層に割り振る層別を行い、
前記再学習判定部が、前記層別の結果から、前記複数の層の中で重要度が高いと判断される層である重要層の出現頻度と、前記未学習データ及び前記学習済データの中で重要度が高いと判断されるデータである重要データの出現頻度とを用いて、前記学習モデルを再学習するか否かを判断すること
を特徴とする情報処理方法。

【発明の詳細な説明】

【技術分野】

【0001】

本開示は、情報処理装置、プログラム及び情報処理方法に関する。

【背景技術】

【0002】

近年、機械学習における学習モデルを使用して、様々な予測が行われている。
例えば、電車又はバス等の公共交通機関の需要予測のため、統計的手法による交通需要予測技術が考案されており、駅の交通混雑緩和、及び、電車又はバス等の車両運行能力の調整に適用されている。

【0003】

従来の技術として、動的に更新される適切な人流予測モデルに基づいて将来の人流データを予測できるようにする交通需要予測装置が開示されている（例えば、特許文献１参照）。ここでの人流データは、単位時間にある施設を通過する人数のことである。

【先行技術文献】

【特許文献】

【0004】

【文献】特開２０１９－０４０４７５号公報

【発明の概要】

【発明が解決しようとする課題】

【0005】

従来の交通需要予測装置では、重回帰モデルによる人流予測モデルといった学習モデルを用いて、新たな人流データを予測し、その平均予測精度を用いて、学習モデルのパラメータを再学習するか否かが判断されていた。

【0006】

そのため、重要なデータであっても、極端な天気又は運行事故に代表される出現頻度の低い場面であるレアシーン等のデータを考慮することができない。このため、学習モデルの再学習を判断する条件となるデータは、レアシーン等の重要なデータが少なくなり、偏りが大きいデータとなる。従って、従来の技術では、正しい条件で学習モデルの再学習条件を判断できないという問題があった。

【0007】

そこで、本開示の一又は複数の態様は、重要データが偏り過ぎることを防止して、より正しい条件で学習モデルを再学習するか否かを判断できるようにすることを目的とする。

【課題を解決するための手段】

【0008】

本開示の一態様に係る情報処理装置は、複数のセンサからセンサデータを収集するデータ収集部と、前記センサデータに基づいて予測を行うための学習モデルを学習するために既に用いられた学習データである学習済データ及び前記センサデータに対応する未学習データを含む判定バッチデータを生成する判定データ生成部と、前記学習済データ及び前記未学習データに対して、前記予測の結果に影響を及ぼす共変量を用いて傾向スコアを算出することで、前記学習済データ及び前記未学習データを複数の層に割り振る層別を行い、前記層別の結果から、前記複数の層の中で重要度が高いと判断される層である重要層の出現頻度と、前記未学習データ及び前記学習済データの中で重要度が高いと判断されるデータである重要データの出現頻度とを用いて、前記学習モデルを再学習するか否かを判断する再学習判定部と、を備えることを特徴とする。

【0009】

本開示の一態様に係るプログラムは、コンピュータを、複数のセンサからセンサデータを収集するデータ収集部、前記センサデータに基づいて予測を行うための学習モデルを学習するために既に用いられた学習データである学習済データ及び前記センサデータに対応する未学習データを含む判定バッチデータを生成する判定データ生成部、及び、前記学習済データ及び前記未学習データに対して、前記予測の結果に影響を及ぼす共変量を用いて傾向スコアを算出することで、前記学習済データ及び前記未学習データを複数の層に割り振る層別を行い、前記層別の結果から、前記複数の層の中で重要度が高いと判断される層である重要層の出現頻度と、前記未学習データ及び前記学習済データの中で重要度が高いと判断されるデータである重要データの出現頻度とを用いて、前記学習モデルを再学習するか否かを判断する再学習判定部、として機能させることを特徴とする。

【0010】

本開示の一態様に係る情報処理方法は、データ収集部が、複数のセンサからセンサデータを収集し、判定データ生成部が、前記センサデータに基づいて予測を行うための学習モデルを学習するために既に用いられた学習データである学習済データ及び前記センサデータに対応する未学習データを含む判定バッチデータを生成し、再学習判定部が、前記学習済データ及び前記未学習データに対して、前記予測の結果に影響を及ぼす共変量を用いて傾向スコアを算出することで、前記学習済データ及び前記未学習データを複数の層に割り振る層別を行い、前記再学習判定部が、前記層別の結果から、前記複数の層の中で重要度が高いと判断される層である重要層の出現頻度と、前記未学習データ及び前記学習済データの中で重要度が高いと判断されるデータである重要データの出現頻度とを用いて、前記学習モデルを再学習するか否かを判断することを特徴とする。

【発明の効果】

【0011】

本開示の一又は複数の態様によれば、重要データが偏り過ぎることを防止して、より正しい条件で学習モデルを再学習するか否かを判断することができる。

【図面の簡単な説明】

【0012】

【図1】情報処理システムの構成を概略的に示すブロック図である。

【図2】ＬＳＴＭモデルの一例を示す概略図である。

【図3】（Ａ）～（Ｃ）は、再学習判定部での処理を説明するための概略図である。

【図4】重要層の出現頻度を説明するための概略図である。

【図5】重要データの出現頻度を説明するための概略図である。

【図6】情報処理装置のハードウェア構成例を示すブロック図である。

【図7】情報処理装置において予測モデルを再学習する際の処理を示すフローチャートである。

【発明を実施するための形態】

【0013】

図１は、情報処理システム１００の構成を概略的に示すブロック図である。
ここでは、情報処理システム１００は、電車又はバス等の公共交通機関の需要予測を行う交通需要予測システムであるものとして説明を行う。

【0014】

情報処理システム１００は、センサ１０１と、入力部１０２と、表示部１０３と、情報処理装置１１０とを備える。

【0015】

センサ１０１は、交通需要に関連する外界情報を示すセンサデータを生成して、そのセンサデータを情報処理装置１１０に送信する。センサ１０１の数については、特に限定しないが、ここでは、複数のセンサ１０１が設けられているものとする。

【0016】

入力部１０２は、情報処理装置１１０に対する様々な指示の入力を受け付ける。入力された指示は、情報処理装置１１０に送られる。
例えば、入力部１０２は、需要予測を行う日付の入力を受け付ける。
ここで、入力部１０２は、具体的には、キーボード又はマウス等の入力装置で構成される。

【0017】

表示部１０３は、情報処理装置１１０での処理結果を出力する。
例えば、表示部１０３は、情報処理装置１１０で行われた、将来の交通需要の予測結果を表示する。
ここで、表示部１０３は、具体的には、液晶ディスプレイ等の表示装置で構成される。

【0018】

情報処理装置１１０は、センサ１０１から得られるセンサデータで示される外界情報を、入力部１０２からの指示に従って処理して、その処理結果を表示部１０３に表示させる。
例えば、情報処理装置１１０は、センサデータで示される外界情報から、予め学習された学習モデルである予測モデルを用いて、入力部１０２に入力された日付における交通需要を予測して、その予測結果を表示部１０３に表示させる。本実施の形態では、情報処理装置１１０は、交通需要予測装置として機能する。なお、予測モデルを第１の学習モデルともいう。

【0019】

ここで、予測モデルは、事前に学習済の重みが設定されている場合と、事前に学習済の重みが設定されていない場合とで異なる方法で学習される。

【0020】

事前に学習済みの重みが設定されていない場合、予測モデルを初期設定された重みで初期化する。初期設定された重みは、例えば、全ベクトルを０と設定したときの重み行列を指す。そして、予め取得されたセンサデータから変換されたモデル入力データを学習データとして用いて、予測モデルの学習が行われる。このようにして学習された重みについては、情報処理装置１１０に記憶される。

【0021】

事前に学習済みの重みが設定されている場合、直近に記憶された重みで予測モデルを初期化する。そして、予め取得されたセンサデータから変換されたモデル入力データを学習データとして用いて、予測モデルの学習が行われる。このようにして学習された重みについては、情報処理装置１１０に記憶される。

【0022】

情報処理装置１１０は、通信部１１１と、データ収集部１１２と、入出力インタフェース部（以下、入出力Ｉ／Ｆ部という）１１３と、制御部１２０と、記憶部１５０とを備える。

【0023】

通信部１１１は、センサ１０１からのセンサデータを受信する。受信されたセンサデータは、データ収集部１１２に与えられる。

【0024】

データ収集部１１２は、複数のセンサ１０１からセンサデータを収集する。
例えば、データ収集部１１２は、通信部１１１からセンサデータを受け取り、そのセンサデータを、予測モデルの入力フォーマットに合わせたモデル入力データに変換して、そのモデル入力データを制御部１２０に与える。

【0025】

入出力Ｉ／Ｆ部１１３は、入力部１０２又は表示部１０３を接続する。
例えば、入出力Ｉ／Ｆ部１１３は、入力部１０２から、需要予測を行う日付を示す日付データを受けて、その日付データを制御部１２０に与える。
また、入出力Ｉ／Ｆ部１１３は、予測データ記憶部１５４から出力された予測結果データを、表示部１０３で利用できる信号データに変換し、その信号データを表示部１０３に出力する。

【0026】

制御部１２０は、情報処理装置１１０での処理を制御する。
制御部１２０は、データ生成部１３０と、予測処理部１４０とを備える。

【0027】

データ生成部１３０は、予測モデルの再学習を判定するための判定バッチデータを生成する。また、データ生成部１３０は、判定バッチデータを用いて、予測モデルを再学習するか否かを判定する。そして、データ生成部１３０は、再学習すると判定した場合に、予測モデルを再学習するための再学習バッチデータを生成する。
データ生成部１３０は、判定データ生成部１３１と、再学習判定部１３２と、再学習データ生成部１３３とを備える。

【0028】

判定データ生成部１３１は、予測モデルを学習するために既に用いられた学習データである学習済データ及びセンサデータに対応する未学習データを含む判定バッチデータを生成する。ここでは、未学習データは、センサデータから変換されたモデル入力データである。
具体的には、判定データ生成部１３１は、データ収集部１１２から与えられた、予測モデルの学習に使われていないセンサデータから変換されたモデル入力データである未学習データと、記憶部１５０に記憶されている、学習済のモデル入力データである学習済みデータと、記憶部１５０に記憶されている、過去の最適な予測モデルの重みとで予測モデルを再学習するか否かを判定するための判定バッチデータを生成する。判定バッチデータは、記憶部１５０に記憶される。
ここで、学習済データの数は一定で、例えば、過去の予め定められた期間（例えば、数週間）の重要データとする。重要データは、重要度の高いデータである。

【0029】

再学習判定部１３２は、記憶部１５０に記憶されている判定バッチデータを読み込み、過去の最適なモデルのパラメータを用いて、未学習データ及び学習済データのそれぞれで予測精度の評価を実施する。
例えば、再学習判定部１３２は、モデル入力データに含まれている共変量データで、未学習データ及び学習済データのそれぞれを層別して、各層の重要度及び各層に振り分けられた未学習データ及び学習済データの重要度の両方を用いて、再学習するか否かを判定する。

【0030】

ここでは、再学習判定部１３２学習済データ及びセンサデータに対応する未学習データに対して、予測の結果に影響を及ぼす共変量を用いて傾向スコアを算出することで、学習済データ及び未学習データを複数の層に割り振る層別を行う。そして、再学習判定部１３２は、その層別の結果から、その複数の層の中で重要度が高いと判断される層である重要層の出現頻度と、未学習データ及び学習済データの中で重要度が高いと判断されるデータである重要データの出現頻度とを用いて、予測モデルを再学習するか否かを判断する。

【0031】

以下、再学習判定部１３２の具体的な処理例を説明する。
まず、再学習判定部１３２による層別を説明する。
ここでは、再学習判定部１３２は、多項式ロジットモデル又は線形重回帰モデルを用いて、誘導施策の傾向性を分析する因果推論技術で傾向スコアを計算し、共変量データの次元削減を行って層別を行う。

【0032】

具体的には、交通事故又は極端な天気等の外界要因による駅又は車両の混雑度変化があるときに、駅内の係員が車内放送又は手動ガイダンス等の施策によって人流を誘導する。再学習判定部１３２は、これらの誘導施策の履歴を収集し、天気、運行情報又はイベント情報等の共変量データを共変量で分析して、誘導施策の確率を勾配ブースティング決定木又は多項式ロジットモデルにより算出する。共変量で算出された誘導施策の確率を、誘導施策の傾向スコアとして定義する。傾向スコアの値は０と１との間の実数である。なお、共変量は、因果関係の分析において、評価対象の要因以外に観測され、その因果関係に影響を及ぼす要因である。ここでは、共変量は、交通需要又は電車の混雑度等に影響する変量である。

【0033】

そして、再学習判定部１３２は、誘導施策の傾向スコアを用いて、各層の閾値を設定し、未学習データ及び学習済データの層別を行う。例えば、傾向スコアが０以上、かつ、０．０３未満のデータは、施策確率小の層に振り分けられる。傾向スコアが０．３以上、かつ、０．６未満のデータは、施策確率中の層に振り分けられる。傾向スコアが０．６以上、かつ、１以下のデータは、施策確率大の層に振り分けられる。
なお、この層別は、一例であり、例えば、層別の閾値及び層の数については、学習用の実際の実データの共変量のバランスによって調整することができる。

【0034】

次に、再学習判定部１３２は、各層に振り分けられた未学習データ及び学習済データの平均予測精度を計算し、さらに、各層に振り分けられた未学習データ及び学習済データの予測精度の差を計算する。

【0035】

そして、再学習判定部１３２は、計算された平均予測精度が予め定められた閾値以下である層、又は、計算された予測精度の差が予め定められた閾値以上である層がある場合には、そのような層に重要ラベルを付すとともに、そのような層に含まれている全てのデータに重要ラベルを付加する。ここで、重要ラベルが付された層が重要層である。また、重要ラベルが付されたデータが重要データである。

【0036】

また、再学習判定部１３２は、計算された平均予測精度が予め定められた閾値よりも大きい層、及び、計算された予測精度の差が予め定められた閾値よりも小さい層に含まれているデータが重要データであるか否かを判断する。この判断については、機械学習における深層学習モデルを用いて行われればよい。この深層学習モデルは、予測モデルとは異なる学習モデルである。深層学習モデルを第２の学習モデルともいう。この深層学習モデルのパラメータは、事前に学習データを用意して学習済みのものが用いられる。ここで重要データの判断のための深層学習モデルの一例としては、図２に示されているＬＳＴＭ（Ｌｏｎｇ－ＳｈｏｒｔＴｅｒｍＭｅｍｏｒｙ）モデルを用いることができる。このモデルの入力は、時系列データとなる交通需要予測時系列変化量であり、このモデルの出力は、重要度ｏｎｅ－ｈｏｔベクトルになっている。

【0037】

そして、再学習判定部１３２は、重要層の出現頻度が予め定められた閾値以上である場合、又は、重要データの出現頻度が予め定められた閾値以上である場合に、予測モデルを再学習すると判断する。

【0038】

図３～図５は、再学習判定部１３２での処理を説明するための概略図である。
再学習判定部１３２は、記憶部１５０に記憶されている判定バッチデータを読み込み、過去の最適なモデルのパラメータを用いて、未学習データＤ１及び学習済データＤ２のそれぞれで、傾向スコアを計算し、共変量データの次元削減を行って層別を行う。

【0039】

これにより図３（Ａ）に示されているように、学習済データ及び未学習データが第１層Ｌ１、第２層Ｌ２、・・・に振り分けられる。

【0040】

次に、再学習判定部１３２は、図３（Ｂ）に示されているように、各層Ｌ１、Ｌ２、・・・に振り分けられた未学習データ及び学習済データの平均予測精度を計算し、さらに、各層に振り分けられた未学習データ及び学習済データの予測精度の差を計算する。

【0041】

そして、再学習判定部１３２は、計算された平均予測精度及び計算された予測精度の差を用いて、各々の層について重要ラベル又は非重要ラベルを付加する。図３（Ｃ）では、第１層Ｌ１に重要ラベルが付されており、第２層Ｌ２に非重要ラベルが付されている。

【0042】

再学習判定部１３２は、重要ラベルが付された層に含まれている全てのデータにも、重要ラベルを付加する。そして、再学習判定部１３２は、非重要ラベルが付された層に含まれている各々のデータが重要データであるか否かを判断し、重要データと判断されたデータには重要ラベルを付し、重要データとは判断されなかったデータには非重要ラベルを付す。非重要ラベルが付された層を非重要層ともいい、非重要ラベルが付されたデータを非重要データともいう。

【0043】

そして、再学習判定部１３２は、重要ラベルが付された層である重要層の出現頻度が予め定められた閾値以上である場合、又は、重要データの出現頻度が予め定められた閾値以上である場合に、予測モデルを再学習すると判断する。
例えば、図４に示されているように、重要層の出現頻度が１／３となっていた場合において、重要層の出現頻度に対する閾値が０．５であるときには、重要層の出現頻度は、閾値以上となってはいない。
一方、図５に示されているように重要データの出現頻度が５／８となっていた場合において、重要データの出現頻度に対する閾値が０．５であるときには、重要データの出現頻度が閾値以上となっている。

【0044】

このような場合には、再学習判定部１３２は、予測モデルが適切に学習されておらず、予測モデルの重みを再学習する必要があると判断する。ここでは、重要層の出現頻度が閾値以上である場合に、重要データがある層に偏り過ぎることを判断でき、この偏りを防ぐために予測モデルの重みが再学習される。
図４及び図５の例では、重要層の出現頻度からみると予測モデルの重みの再学習は必要ないが、重要データの分布において偏りが発生しているため、重要データの出現頻度が高まっている。このため、図５に示されている例だと、予測モデルの重みの再学習が必要だと判断される。

【0045】

再学習データ生成部１３３は、再学習判定部１３２が再学習する必要があると判定した場合に、学習データ及び未学習データを、各層のデータと同じ比例で再度サンプリングすることで、再学習バッチデータを生成して、その再学習バッチデータを記憶部１５０に記憶させる。

【0046】

予測処理部１４０は、学習モデルである予測モデルを用いて、センサデータに基づいて予測を行う。また、予測処理部１４０は、再学習判定部１３２が予測モデルを再学習すると判断した場合に、その予測モデルを再学習する。
予測処理部１４０は、モデル重み更新部１４１と、モデル重み検証部１４２と、データ予測部１４３とを備える。

【0047】

モデル重み更新部１４１は、学習データ記憶部１５２に記憶されている再学習バッチデータを読み込み、その再学習バッチデータを用いて、予測モデルの再学習を行う再学習部である。
例えば、モデル重み更新部１４１は、モデル重み記憶部１５３に記憶されている予測モデルの重みを、再学習バッチデータを用いて更新する。

【0048】

モデル重み検証部１４２は、モデル重み更新部１４１により更新された重みが最適であるか否かを判断する。例えば、モデル重み検証部１４２は、更新された重みの予測誤差を少なくするため、過去の最適な重みの予測誤差よりも、更新された重みの予測誤差が少ない場合に、更新された重みが最適であると判断する。
そして、モデル重み検証部１４２は、更新された重みが最適であると判断された場合には、その更新された重みを、更新された重みが最適ではないと判断された場合には、過去の最適な重みをデータ予測部１４３に与える。

【0049】

データ予測部１４３は、モデル重み検証部１４２から与えられた重みを使用して、データ収集部１１２で収集されたセンサデータに基づいて、入力部１０２に入力された日付における交通需要を予測する予測部である。そして、データ予測部１４３は、その予測結果を示す予測結果データを記憶部１５０に記憶させる。

【0050】

記憶部１５０は、情報処理装置１１０での処理に必要なプログラム及びデータを記憶する。
記憶部１５０は、判定データ記憶部１５１と、学習データ記憶部１５２と、モデル重み記憶部１５３と、予測データ記憶部１５４とを備える。

【0051】

判定データ記憶部１５１は、判定データ生成部１３１で生成された判定バッチデータを記憶する。
学習データ記憶部１５２は、再学習データ生成部１３３で生成された再学習バッチデータを記憶する。また、学習データ記憶部１５２には、予測モデルの学習に既に使用された学習データも学習済データとして記憶されているものとする。このため、再学習バッチデータも、予測モデルの再学習に使用された後は、学習済データとなる。

【0052】

モデル重み記憶部１５３は、予測モデルの重みを記憶する。
予測データ記憶部１５４は、データ予測部１４３で予測された予測結果である需要予測を示す需要予測データを記憶する。

【0053】

以上に記載された情報処理装置１１０は、図６に示されているような、揮発性又は不揮発性のメモリ１０と、ＣＰＵ（ＣｅｎｔｒａｌＰｒｏｃｅｓｓｉｎｇＵｎｉｔ）等のプロセッサ１１と、ＨＤＤ（ＨａｒｄＤｉｓｋＤｒｉｖｅ）又はＳＳＤ（ＳｏｒｉｄＳｔａｔｅＤｒｉｖｅ）等の補助記憶装置１２と、ＮＩＣ（ＮｅｔｗｏｒｋＩｎｔｅｒｆｅｃｅＣａｒｄ）等の通信Ｉ／Ｆ１３と、ＵＳＢ（ＵｎｉｖｅｒｓａｌＳｅｒｉａｌＢｕｓ）等の接続Ｉ／Ｆ１４とを備えるコンピュータ１５により実現することができる。

【0054】

例えば、データ収集部１１２及び制御部１２０は、メモリ１０に格納されているプログラムを実行するプロセッサ１１により実現することができる。
記憶部１５０は、メモリ１０又は補助記憶装置１２により実現することができる。
通信部１１１は、通信Ｉ／Ｆ１３により実現することができる。
入出力Ｉ／Ｆ部１１３は、接続Ｉ／Ｆ１４により実現することができる。

【0055】

なお、以上に記載したプログラムは、ネットワークを通じて提供されてもよく、また、記録媒体に記録されて提供されてもよい。即ち、このようなプログラムは、例えば、プログラムプロダクトとして提供されてもよい。

【0056】

次に、情報処理装置１１０の動作について説明する。
図７は、情報処理装置１１０において予測モデルを再学習する際の処理を示すフローチャートである。
まず、再学習判定部１３２は、判定データ記憶部１５１から判定バッチデータを読み込む（Ｓ１０）。なお、判定バッチデータは、例えば、予め定められた期間（例えば、数時間）に一回更新され、判定バッチデータが更新されると、再学習判定部１３２は、予測モデルを再学習するか否かを判断するものとする。

【0057】

次に、再学習判定部１３２は、多項式ロジットモデル又は線形重回帰モデルによる施策傾向性を分析する統計的因果推論技術を用いて、ステップＳ１０で読み込まれた判定バッチデータに含まれている未学習データ及び学習済データに含まれている共変量データの次元数を１次元落として、層別を行う（Ｓ１１）。また、再学習判定部１３２は、層別された各層の平均予測精度、及び、未学習データと、学習済みデータとの予測精度の差分を計算する。

【0058】

次に、再学習判定部１３２は、ステップＳ１１で計算された平均予測精度が予め定められた閾値以上である層、又は、ステップＳ１１で計算された予測精度の差が予め定められた閾値以上である層が存在するか否かを判断する（Ｓ１２）。そのような層が存在する場合（Ｓ１２でＹｅｓ）には、処理はステップＳ１３に進み、そのような層が存在しない場合（Ｓ１２でＮｏ）には、処理はステップＳ１４に進む。

【0059】

ステップＳ１３では、ステップＳ１１で計算された平均予測精度が予め定められた閾値以上である層、及び、ステップＳ１１で計算された予測精度の差が予め定められた閾値以上である層に重要ラベルを付加するとともに、そのような層に含まれている全てのデータに重要ラベルを付加する。

【0060】

ステップＳ１４では、ステップＳ１１で計算された平均予測精度が予め定められた閾値未満である層、及び、ステップＳ１１で計算された予測精度の差が予め定められた閾値未満である層に非重要ラベルを付加する。

【0061】

次に、再学習判定部１３２は、教師ありＬＳＴＭモデルを用いて、非重要層に含まれているデータが重要データになるか否かを判断する（Ｓ１５）。
そして、再学習判定部１３２は、ステップＳ１５で、重要データと判断されたデータに重要ラベルを付加する。重要ラベルが付加されたデータを、重要データともいう。

【0062】

そして、再学習判定部１３２は、重要層の出現頻度が予め定められた閾値（例えば、０．５）以上である第１の条件、及び、重要データの出現頻度が予め定められた閾値（例えば、０．５）以上である第２の条件の少なくとも何れか一方の条件が満たされるか否かを判断する（Ｓ１７）。第１の条件及び第２の条件の少なくとも何れか一方が満たされる場合（Ｓ１７でＹｅｓ）には、処理はステップＳ１８に進み、第１の条件が満たされず、かつ、第２の条件も満たされない場合（Ｓ１７でＮｏ）には、処理は終了する。

【0063】

ステップＳ１８では、再学習判定部１３２は、予測モデルを再学習すると判断し、再学習データ生成部１３３は、再学習バッチデータを生成し、その再学習バッチデータに基づいて、モデル重み更新部１４１が予測モデルの再学習を実行する。

【0064】

以上に記載された実施の形態によれば、予測モデルの再学習を行うか否かを判定する場合に、重要データの出現頻度だけでなく、重要層の出現頻度も参考にされるため、重要データが一つの層に偏りすぎることを防ぐことができる。このため、より正しい条件で予測モデルを再学習するか否かを判定することができる。

【0065】

また、以上に記載された実施の形態によれば、重要データを用いて重点的に再学習が行われるため、予測モデルの学習の収束度と、レアシーンデータ又は混雑度が高い重要データの予測精度を向上させることができる。

【0066】

さらに、再学習バッチデータにおける非重要データのデータ量を減少されることができるため、再学習で用いるデータ量を抑えることができる。

【符号の説明】

【0067】

１００情報処理システム、１０１センサ、１０２入力部、１０３表示部、１１０情報処理装置、１１１通信部、１１２データ収集部、１１３入出力Ｉ／Ｆ部、１２０制御部、１３０データ生成部、１３１判定データ生成部、１３２再学習判定部、１３３再学習データ生成部、１４０予測処理部、１４１モデル重み更新部、１４２モデル重み検証部、１４３データ予測部、１５０記憶部、１５１判定データ記憶部、１５２学習データ記憶部、１５３モデル重み記憶部、１５４予測データ記憶部。

【図1】

【図2】

【図3】

【図4】

【図5】

【図6】

【図7】

知財求人

知財求人お知らせサービス

知財のニュースを調べる
- 知財ニュース
- 知財周辺ニュース
企業の特許を調べる
知財のセミナーを調べる
知財,特許事務所への求職・転職
特許事務所をさがす
弁理士試験を受ける
- 年の弁理士試験情報
- 弁理士試験の合格率など統計
知財の法律をしらべる
期限日をしらべる
- 今日に対して意見書・補正書の期限
- 今日に対して審査請求期限日
知財の判決をしらべる
コンテンツ・リンク
運営会社
プレスの皆様へ
- お問い合わせ
ユーザーの皆様
- お問い合わせ・フィードバック
広告掲載を希望の皆様へ
- 広告掲載について
- 求人広告の掲載について

IP Force 特許公報掲載プロジェクト 2022.1.31 β版