IP Force 特許公報掲載プロジェクト 2022.1.31 β版

知財求人 - 知財ポータルサイト「IP Force」

▶ 三菱電機株式会社の特許一覧

特許7752595運行予測装置、運行管理装置、運行管理システム、学習装置、運行予測方法、学習方法、運行予測プログラム、および学習プログラム
<>
  • 特許-運行予測装置、運行管理装置、運行管理システム、学習装置、運行予測方法、学習方法、運行予測プログラム、および学習プログラム 図1
  • 特許-運行予測装置、運行管理装置、運行管理システム、学習装置、運行予測方法、学習方法、運行予測プログラム、および学習プログラム 図2
  • 特許-運行予測装置、運行管理装置、運行管理システム、学習装置、運行予測方法、学習方法、運行予測プログラム、および学習プログラム 図3
  • 特許-運行予測装置、運行管理装置、運行管理システム、学習装置、運行予測方法、学習方法、運行予測プログラム、および学習プログラム 図4
  • 特許-運行予測装置、運行管理装置、運行管理システム、学習装置、運行予測方法、学習方法、運行予測プログラム、および学習プログラム 図5
  • 特許-運行予測装置、運行管理装置、運行管理システム、学習装置、運行予測方法、学習方法、運行予測プログラム、および学習プログラム 図6
  • 特許-運行予測装置、運行管理装置、運行管理システム、学習装置、運行予測方法、学習方法、運行予測プログラム、および学習プログラム 図7
  • 特許-運行予測装置、運行管理装置、運行管理システム、学習装置、運行予測方法、学習方法、運行予測プログラム、および学習プログラム 図8
  • 特許-運行予測装置、運行管理装置、運行管理システム、学習装置、運行予測方法、学習方法、運行予測プログラム、および学習プログラム 図9
  • 特許-運行予測装置、運行管理装置、運行管理システム、学習装置、運行予測方法、学習方法、運行予測プログラム、および学習プログラム 図10
  • 特許-運行予測装置、運行管理装置、運行管理システム、学習装置、運行予測方法、学習方法、運行予測プログラム、および学習プログラム 図11
  • 特許-運行予測装置、運行管理装置、運行管理システム、学習装置、運行予測方法、学習方法、運行予測プログラム、および学習プログラム 図12
  • 特許-運行予測装置、運行管理装置、運行管理システム、学習装置、運行予測方法、学習方法、運行予測プログラム、および学習プログラム 図13
  • 特許-運行予測装置、運行管理装置、運行管理システム、学習装置、運行予測方法、学習方法、運行予測プログラム、および学習プログラム 図14
  • 特許-運行予測装置、運行管理装置、運行管理システム、学習装置、運行予測方法、学習方法、運行予測プログラム、および学習プログラム 図15
  • 特許-運行予測装置、運行管理装置、運行管理システム、学習装置、運行予測方法、学習方法、運行予測プログラム、および学習プログラム 図16
  • 特許-運行予測装置、運行管理装置、運行管理システム、学習装置、運行予測方法、学習方法、運行予測プログラム、および学習プログラム 図17
  • 特許-運行予測装置、運行管理装置、運行管理システム、学習装置、運行予測方法、学習方法、運行予測プログラム、および学習プログラム 図18
  • 特許-運行予測装置、運行管理装置、運行管理システム、学習装置、運行予測方法、学習方法、運行予測プログラム、および学習プログラム 図19
  • 特許-運行予測装置、運行管理装置、運行管理システム、学習装置、運行予測方法、学習方法、運行予測プログラム、および学習プログラム 図20
  • 特許-運行予測装置、運行管理装置、運行管理システム、学習装置、運行予測方法、学習方法、運行予測プログラム、および学習プログラム 図21
< >
(19)【発行国】日本国特許庁(JP)
(12)【公報種別】特許公報(B2)
(11)【特許番号】
(24)【登録日】2025-10-02
(45)【発行日】2025-10-10
(54)【発明の名称】運行予測装置、運行管理装置、運行管理システム、学習装置、運行予測方法、学習方法、運行予測プログラム、および学習プログラム
(51)【国際特許分類】
   B61L 27/60 20220101AFI20251003BHJP
   B61L 25/02 20060101ALI20251003BHJP
   B61L 27/12 20220101ALI20251003BHJP
【FI】
B61L27/60
B61L25/02 Z
B61L27/12
【請求項の数】 18
(21)【出願番号】P 2022190610
(22)【出願日】2022-11-29
(65)【公開番号】P2024078202
(43)【公開日】2024-06-10
【審査請求日】2024-11-13
(73)【特許権者】
【識別番号】000006013
【氏名又は名称】三菱電機株式会社
(74)【代理人】
【識別番号】100118762
【弁理士】
【氏名又は名称】高村 順
(72)【発明者】
【氏名】島吉 翔太
(72)【発明者】
【氏名】上田 健詞
(72)【発明者】
【氏名】立石 大輔
(72)【発明者】
【氏名】東耕 吉孝
(72)【発明者】
【氏名】菅原 浩介
(72)【発明者】
【氏名】橋本 遼太
【審査官】加藤 昌人
(56)【参考文献】
【文献】特開2020-064570(JP,A)
【文献】特表2019-503540(JP,A)
【文献】特開2010-193545(JP,A)
【文献】米国特許出願公開第2019/0084600(US,A1)
【文献】特開2020-137227(JP,A)
【文献】特開2010-221839(JP,A)
【文献】特開2008-222004(JP,A)
【文献】特許第7179232(JP,B2)
(58)【調査した分野】(Int.Cl.,DB名)
B61L 1/00-99/00
G06Q 10/00-99/00
G06F 18/00-18/40
G06N 3/00-99/00
(57)【特許請求の範囲】
【請求項1】
列車の運行状況を示す運行データと前記列車を利用する利用者の人流の状況を示す人流データとを含む予測対象データを、前記列車から取得するデータ取得部と、
前記運行データおよび前記人流データを含む学習用データが過去データと前記過去データよりも後に取得された直近データとに分けられ、前記過去データのうち前記直近データに類似する類似データと前記直近データとを学習させた予測モデルを用いて、前記予測対象データから、将来における前記運行状況および前記人流の状況の少なくとも一方を予測する予測部と、
を備え、
前記類似データは、前記過去データおよび前記直近データを学習させた類似判定モデルを用いて、前記過去データのうち、前記直近データに類似すると判定されたデータである、
ことを特徴とする運行予測装置。
【請求項2】
前記類似判定モデルは、前記過去データの一部である第1の部分と前記直近データとを学習することによって生成され、
前記過去データのうち前記第1の部分を除いた部分である第2の部分が前記類似判定モデルへ入力されることによって、前記過去データの前記第2の部分についての前記直近データとの類似度を求め、
前記類似データは、前記過去データの前記第2の部分のうち前記直近データに類似すると前記類似度に基づいて判定されたデータである、
ことを特徴とする請求項1に記載の運行予測装置。
【請求項3】
前記類似判定モデルは、前記過去データの一部である第1の部分と前記直近データの一部である第1の部分とを学習することによって生成され、
前記過去データのうち前記第1の部分を除いた部分である第2の部分と前記直近データのうち前記第1の部分を除いた部分である第2の部分とが前記類似判定モデルへ入力されることによって、前記過去データの前記第2の部分および前記直近データの前記第2の部分の各々についての前記直近データの前記第1の部分との類似度を求め、
前記類似データは、前記過去データの前記第2の部分について求めた前記類似度を閾値と比較することによって、前記過去データの前記第2の部分のうち前記直近データに類似すると判定されたデータである、
ことを特徴とする請求項1に記載の運行予測装置。
【請求項4】
前記閾値は、前記直近データの前記第2の部分について求めた前記類似度の分布を基に設定される、
ことを特徴とする請求項3に記載の運行予測装置。
【請求項5】
前記直近データを、取得された日時ごとのデータについて求めた前記類似度に基づいて分類し、分類されたデータについての頻度の分布を第1の分布とし、前記類似データと判定された前記過去データを、取得された日時ごとのデータの前記類似度に基づいて分類し、分類されたデータについての頻度の分布を第2の分布として、前記類似データと判定された前記過去データの一部を前記類似データから削除することによって、前記第2の分布を前記第1の分布に近づける調整を行う、
ことを特徴とする請求項2から4のいずれか1つに記載の運行予測装置。
【請求項6】
前記学習用データには、前記学習用データが取得された日時のデータが紐付けられており、日時の範囲が指定されることによって前記直近データの範囲が設定され、前記学習用データが取得された日時により前記過去データと前記直近データとを分別する、
ことを特徴とする請求項1から4のいずれか1つに記載の運行予測装置。
【請求項7】
前記列車から出力されるデータである機器データから前記予測対象データを抽出するデータ抽出部と、
前記列車が第1の駅を出発したときから、次の停車駅である第2の駅に前記列車が到着して当該第2の駅を前記列車が出発するまでの期間、または、前記列車が第1の駅に到着したときから、当該第1の駅を前記列車が出発して次の停車駅である第2の駅に前記列車が到着するまでの期間を単位として、前記予測対象データを単位ごとのデータへ変換することにより、駅間単位の前記予測対象データである特徴量を抽出する特徴量抽出部と、
を備え、
前記類似判定モデルへ入力される前記過去データと前記類似判定モデルへ入力される前記直近データとの各々において、前記過去データと前記直近データとを分けた結果を表す目的変数が前記特徴量に紐付けられる、
ことを特徴とする請求項1から4のいずれか1つに記載の運行予測装置。
【請求項8】
駅間単位の前記特徴量である第1の特徴量を、設定された期間を単位とする第2の特徴量へ変換する特徴量変換部、
を備え、
前記類似判定モデルは、前記第2の特徴量である前記過去データと前記第2の特徴量である前記直近データとを学習することによって生成され、
前記類似データは、前記第2の特徴量である前記過去データから判定される、
ことを特徴とする請求項7に記載の運行予測装置。
【請求項9】
請求項1に記載の運行予測装置と、
前記運行予測装置によって出力される予測結果に応じた対策を策定する対策処理部と、
を備え、
前記運行予測装置は、将来における前記運行状況および前記人流の状況の少なくとも一方の前記予測結果を前記対策処理部へ出力する、
ことを特徴とする運行管理装置。
【請求項10】
前記列車から出力されるデータである機器データを受信する通信部と、
受信された前記機器データを収集し、収集された前記機器データを前記運行予測装置へ出力するデータ収集装置と、
を備え、
前記運行予測装置は、前記予測対象データを前記機器データから抽出するデータ抽出部、
を備えることを特徴とする請求項9に記載の運行管理装置。
【請求項11】
請求項9に記載の運行管理装置と、
前記列車の運行ダイヤを作成するダイヤ作成装置と、
を備え、
前記運行管理装置は、将来における前記運行状況および前記人流の状況の少なくとも一方の前記予測結果に応じた前記対策の情報を前記ダイヤ作成装置へ出力し、
前記ダイヤ作成装置は、前記対策の情報に基づいて前記運行ダイヤを作成する、
ことを特徴とする運行管理システム。
【請求項12】
請求項9に記載の運行管理装置と、
前記列車から出力されるデータである機器データを収集し、収集された前記機器データを前記運行管理装置へ出力するデータ収集装置と、
を備えることを特徴とする運行管理システム。
【請求項13】
請求項1に記載の運行予測装置と、
前記列車から出力されるデータである機器データを収集し、収集された前記機器データを前記運行予測装置へ出力するデータ収集装置と、
前記運行予測装置によって出力される予測結果に応じた対策を策定する運行管理装置と、
を備え、
前記運行予測装置は、将来における前記運行状況および前記人流の状況の少なくとも一方の前記予測結果を前記運行管理装置へ出力する、
ことを特徴とする運行管理システム。
【請求項14】
列車の運行状況を示す運行データと前記列車を利用する利用者の人流の状況を示す人流データとを含む学習用データが、過去データと、前記過去データよりも後に取得された直近データとに分けられ、前記過去データのうち前記直近データに類似する類似データを判定する類似判定モデルを、前記過去データと前記直近データとを学習することによって生成する類似判定モデル生成部と、
前記類似判定モデルに基づいて前記過去データから前記類似データを判定する類似データ判定部と、
将来における前記運行状況および前記人流の状況の少なくとも一方を予測する予測モデルを、前記直近データと前記類似データとを学習することによって生成する予測モデル生成部と、
を備えることを特徴とする学習装置。
【請求項15】
列車の運行状況を示す運行データと前記列車を利用する利用者の人流の状況を示す人流データとを含む予測対象データを、前記列車から取得するステップと、
前記運行データおよび前記人流データを含む学習用データを、過去データと前記過去データよりも後に取得された直近データとに分け、前記過去データのうち前記直近データに類似する類似データと前記直近データとを学習させた予測モデルを用いて、前記予測対象データから、将来における前記運行状況および前記人流の状況の少なくとも一方を予測するステップと、
を含み、
前記類似データは、前記過去データおよび前記直近データを学習させた類似判定モデルを用いて、前記過去データのうち、前記直近データに類似すると判定されたデータである、
ことを特徴とする運行予測方法。
【請求項16】
列車の運行状況を示す運行データと前記列車を利用する利用者の人流の状況を示す人流データとを含む学習用データを、過去データと、前記過去データよりも後に取得された直近データとに分けるステップと、
前記過去データのうち前記直近データに類似する類似データを判定する類似判定モデルを、前記過去データと前記直近データとを学習することによって生成するステップと、
前記類似判定モデルに基づいて前記過去データから前記類似データを判定するステップと、
将来における前記運行状況および前記人流の状況の少なくとも一方を予測する予測モデルを、前記直近データと前記類似データとを学習することによって生成するステップと、
を含むことを特徴とする学習方法。
【請求項17】
列車の運行状況を示す運行データと前記列車を利用する利用者の人流の状況を示す人流データとを含む予測対象データを、前記列車から取得するステップと、
前記運行データおよび前記人流データを含む学習用データを、過去データと前記過去データよりも後に取得された直近データとに分け、前記過去データのうち前記直近データに類似する類似データと前記直近データとを学習させた予測モデルを用いて、前記予測対象データから、将来における前記運行状況および前記人流の状況の少なくとも一方を予測するステップと、
をコンピュータに実行させる運行予測プログラムであって、
前記類似データは、前記過去データおよび前記直近データを学習させた類似判定モデルを用いて、前記過去データのうち、前記直近データに類似すると判定されたデータである、
ことを特徴とする運行予測プログラム。
【請求項18】
列車の運行状況を示す運行データと前記列車を利用する利用者の人流の状況を示す人流データとを含む学習用データを、過去データと、前記過去データよりも後に取得された直近データとに分けるステップと、
前記過去データのうち前記直近データに類似する類似データを判定する類似判定モデルを、前記過去データと前記直近データとを学習することによって生成するステップと、
前記類似判定モデルに基づいて前記過去データから前記類似データを判定するステップと、
将来における前記運行状況および前記人流の状況の少なくとも一方を予測する予測モデルを、前記直近データと前記類似データとを学習することによって生成するステップと、
をコンピュータに実行させることを特徴とする学習プログラム。
【発明の詳細な説明】
【技術分野】
【0001】
本開示は、列車の運行状況を予測する運行予測装置、運行管理装置、運行管理システム、学習装置、運行予測方法、学習方法、運行予測プログラム、および学習プログラムに関するものである。
【背景技術】
【0002】
鉄道の分野では、将来における列車の運行状況を予測し、列車を利用する利用者の混雑緩和が可能となるように、または、列車の効率的な運行が可能となるように、予測された運行状況に基づいて列車の運行を調整することがある。
【0003】
特許文献1には、列車の運行予測を行うシステムに関し、運行している列車について今後到着する駅での発着時刻を予測し、列車の遅延時間と当該遅延時間で遅延する確率との分布である運行予測分布を作成することが開示されている。特許文献1に開示されるシステムは、現在運行している列車と運行条件が類似しているときの運行実績データを過去の運行実績データから抽出し、抽出された運行実績データに基づいて運行予測分布を作成する。特許文献1に開示されるシステムは、運行条件である複数の条件について類似しているか否かを個別に判定することによって、現在の運行条件と過去の運行条件とが類似しているか否かを判定する。
【先行技術文献】
【特許文献】
【0004】
【文献】特開2021-98425号公報
【発明の概要】
【発明が解決しようとする課題】
【0005】
列車の運行状況の高精度な予測を可能とするためには、運行状況に影響を及ぼし得る多くの条件を運行条件とすることが望まれる。特許文献1に開示されるシステムは、運行条件である複数の条件について類似しているか否かを個別に判定することから、条件の数が多くなるほど、現在の運行条件と過去の運行条件とが類似しているか否かの判定が困難となる。また、運行状況への影響の度合いは条件ごとに異なることから、類似しているか否かの判定に条件ごとの影響の度合いを反映させることは、条件の数が多くなるほど困難となる。このため、特許文献1に開示される技術によると、現在運行している列車と運行条件が類似しているときの運行実績データを抽出することが困難であることから、将来における列車の運行状況を高精度に予測することが困難であるという問題があった。
【0006】
本開示は、上記に鑑みてなされたものであって、将来における列車の運行状況を高精度に予測可能とする運行予測装置を得ることを目的とする。
【課題を解決するための手段】
【0007】
上述した課題を解決し、目的を達成するために、本開示にかかる運行予測装置は、列車の運行状況を示す運行データと列車を利用する利用者の人流の状況を示す人流データとを含む予測対象データを、列車から取得するデータ取得部と、運行データおよび人流データを含む学習用データが過去データと過去データよりも後に取得された直近データとに分けられ、過去データのうち直近データに類似する類似データと直近データとを学習させた予測モデルを用いて、予測対象データから、将来における運行状況および人流の状況の少なくとも一方を予測する予測部と、を備える。類似データは、過去データおよび直近データを学習させた類似判定モデルを用いて、過去データのうち、直近データに類似すると判定されたデータである。
【発明の効果】
【0008】
本開示にかかる運行予測装置は、将来における列車の運行状況を高精度に予測することができる、という効果を奏する。
【図面の簡単な説明】
【0009】
図1】実施の形態1にかかる運行管理システムの構成例を示す図
図2】実施の形態1にかかる運行予測装置が保持する特徴量データベースにおけるテーブルの例を示す第1の図
図3】実施の形態1における過去データと直近データと類似データとの関係を示す概念図
図4】実施の形態1にかかる運行予測装置における類似判定モデルの生成と類似データの判定との詳細について説明するための第1の図
図5】実施の形態1にかかる運行予測装置における類似判定モデルの生成と類似データの判定との詳細について説明するための第2の図
図6図5に示す例において類似データの判定に使用される閾値について説明するための図
図7】実施の形態1にかかる運行予測装置における類似判定モデルの生成と類似データの判定との詳細について説明するための第3の図
図8】実施の形態1にかかる運行予測装置が保持する特徴量データベースにおけるテーブルの例を示す第2の図
図9】実施の形態1にかかる運行予測装置による、学習時における動作の手順の例を示すフローチャート
図10図9に示すステップS4における類似データの判定についての詳細な手順の例を示すフローチャート
図11】実施の形態1にかかる運行予測装置による、予測時における動作の手順の例を示すフローチャート
図12】実施の形態1の第1の変形例にかかる運行管理システムの構成例を示す図
図13】実施の形態1の第2の変形例にかかる運行管理システムの構成例を示す図
図14】実施の形態2にかかる運行管理システムの構成例を示す図
図15】実施の形態2にかかる運行予測装置の特徴量変換部における第1の特徴量から第2の特徴量への変換について説明するための図
図16】実施の形態2にかかる運行予測装置において類似データの判定に使用される第2の特徴量の第1の例について説明するための図
図17】実施の形態2にかかる運行予測装置において類似データの判定に使用される第2の特徴量の第2の例について説明するための第1の図
図18】実施の形態2にかかる運行予測装置において類似データの判定に使用される第2の特徴量の第2の例について説明するための第2の図
図19】実施の形態2にかかる運行予測装置により類似データを判定するときにおける動作の手順の例を示すフローチャート
図20図19に示すステップS32における特徴量の変換についての詳細な手順の例を示すフローチャート
図21】実施の形態1または2にかかる運行管理システムを構成する運行予測装置のハードウェア構成例を示す図
【発明を実施するための形態】
【0010】
以下に、実施の形態にかかる運行予測装置、運行管理装置、運行管理システム、学習装置、運行予測方法、学習方法、運行予測プログラム、および学習プログラムを図面に基づいて詳細に説明する。
【0011】
実施の形態1.
図1は、実施の形態1にかかる運行管理システム100の構成例を示す図である。運行管理システム100は、鉄道における列車10の運行を管理するシステムである。運行管理システム100は、複数の列車10と、各列車10の運行を管理する運行管理装置30と、各列車10の運行ダイヤを作成するダイヤ作成装置40とを備える。
【0012】
各列車10は、1つまたは複数の車両からなる。各列車10は、運行管理装置30との通信を行う通信部11と機器データを取得する車載機器とを備える。車載機器の図示は省略する。機器データは、列車10の状況を示すデータである。機器データは、例えば、列車10の加速度または速度、利用者が使用する乗降口であるドアの開閉に関するドア開閉情報、列車10の走行位置情報、各車両の乗車率、各車両の乗降人数、駅間の走行時間、各駅における停車時間などが該当する。なお、機器データはこれらに限定されないものとする。通信部11は、車載機器により取得された機器データを運行管理装置30へ送信する。
【0013】
運行管理装置30は、列車10の運行状況を予測する運行予測装置20と、通信部31と、データ収集装置32と、対策処理部33と、運行ダイヤデータベース34を保持する記憶部34aとを備える。
【0014】
通信部31は、運行管理装置30の外部の装置との通信を行う。通信部31は、各列車10の通信部11との間の通信と、ダイヤ作成装置40との間の通信とを行う。通信部31と通信部11とは、無線通信により互いに通信する。無線通信の通信方式は特に限定されないものとする。
【0015】
通信部31は、各列車10の通信部11から出力される機器データを受信し、機器データをデータ収集装置32へ出力する。データ収集装置32は、通信部31により受信された機器データを収集し、収集された機器データを運行予測装置20へ出力する。データ収集装置32は、一定の周期で機器データを取得することによって、機器データを収集する。データ収集装置32により機器データを取得する周期は、例えば、数十ミリ秒から1秒の間で任意に設定することができる。
【0016】
運行予測装置20は、データ抽出部21と、特徴量抽出部22と、特徴量データベース23を保持する記憶部23aと、学習装置24と、推論装置25と、モデル記憶部26とを備える。
【0017】
データ抽出部21は、データ収集装置32により収集された機器データから運行データと人流データとを抽出する。運行データおよび人流データは、後述する特徴量を抽出するために必要なデータである。運行データは、列車10の運行状況を示すデータである。人流データは、列車10を利用する利用者の人流の状況を示すデータである。運行データは、例えば、列車10が駅を出発する時刻である出発時刻、駅間の走行時間、各駅における停車時間などが該当する。人流データは、各車両の乗車率、各車両の乗降人数などが該当する。データ抽出部21は、機器データが走行中のデータと駅での停車中のデータとのいずれであるかを、機器データに含まれる列車10の加速度、速度、ドア開閉情報、走行位置情報などを用いることで判断することができる。なお、運行データと人流データとは、実施の形態1において例示されるデータに限定されないものとする。データ抽出部21は、抽出された運行データと抽出された人流データとを特徴量抽出部22へ出力する。
【0018】
特徴量抽出部22は、データ抽出部21により抽出された運行データおよび人流データである時系列データから、駅間単位のデータである特徴量を抽出する。特徴量抽出部22は、列車10が第1の駅を出発したときから、次の停車駅である第2の駅に列車10が到着して当該第2の駅を列車10が出発するまでの期間、または、列車10が第1の駅に到着したときから、当該第1の駅を列車10が出発して次の停車駅である第2の駅に列車10が到着するまでの期間を単位として、時系列データを単位ごとのデータへ変換することにより、特徴量を抽出する。このように、特徴量抽出部22は、時系列データから特徴量を生成する。機械学習において、特徴量は説明変数とも称される。
【0019】
特徴量抽出部22は、運行ダイヤデータベース34に格納されている運行ダイヤの情報と時系列データとに基づいて特徴量を生成しても良い。運行ダイヤの情報と時系列データとに基づいて生成される特徴量の例は、列車10の遅延時間である。運行ダイヤに示される出発時刻と運行データに示される出発時刻との差分が遅延時間に相当する。
【0020】
特徴量抽出部22により抽出された特徴量は、特徴量データベース23に格納される。特徴量データベース23におけるテーブルの各行には、日付データが紐付けられる。日付データは、運行データまたは人流データが取得された日時のデータである。運行データまたは人流データが取得された日時とは、運行データまたは人流データの元となる機器データが各列車10において取得された日時とする。
【0021】
運行予測装置20による処理は、学習フェーズと推論フェーズとに分けられる。なお、運行予測装置20についての上記内容は、学習フェーズと推論フェーズとを区別せずに説明したものとする。運行予測装置20は、学習フェーズにおいて、将来における運行状況および人流の状況の少なくとも一方についての予測モデルを生成する。運行予測装置20は、推論フェーズにおいて、予測モデルを用いて、将来における運行状況および人流の状況の少なくとも一方を予測する。
【0022】
学習フェーズにおいて、データ抽出部21は、運行データと人流データとを含む学習用データを、データ収集装置32により収集された機器データから抽出する。特徴量抽出部22は、時系列データである学習用データから、駅間単位の学習用データである特徴量を抽出する。特徴量抽出部22により抽出された特徴量は、特徴量データベース23に格納される。特徴量データベース23において、学習用データには、学習用データが取得された日時を示す日時データが紐付けられる。
【0023】
学習装置24は、学習フェーズにおける学習を行う。学習装置24は、データ分別部241と、類似判定モデル生成部242と、類似データ判定部243と、データ取得部244と、予測モデル生成部245とを備える。データ分別部241は、特徴量データベース23から学習用データを読み出し、学習用データを、過去データと、過去データよりも後に取得された直近データとに分別する。データ分別部241は、分別の結果を出力する。例えば、データ分別部241は、分別の結果として、直近データであるか否かを示すラベルを出力する。特徴量データベース23におけるテーブルの各行には、データ分別部241により出力されるラベルが紐付けられる。
【0024】
類似判定モデル生成部242は、過去データと直近データとを特徴量データベース23から読み出すことによって、過去データと直近データとを取得する。類似判定モデル生成部242は、過去データと直近データとを学習することによって類似判定モデルを生成する。類似判定モデルは、過去データのうち直近データに類似する類似データを判定するモデルである。このように、類似判定モデル生成部242は、学習用データが過去データと直近データとに分けられ、過去データのうち直近データに類似する類似データを判定する類似判定モデルを、過去データと直近データとを学習することによって生成する。類似判定モデル生成部242は、教師あり学習のアルゴリズムに従い、直近データであるか否かを示すラベルと特徴量との関係を学習することで、類似判定モデルを構築する。
【0025】
類似データ判定部243は、特徴量データベース23から過去データを読み出すことによって、過去データを取得する。類似データ判定部243は、類似判定モデル生成部242によって生成された類似判定モデルを取得する。類似データ判定部243は、類似判定モデルに基づいて過去データから類似データを判定する。類似データ判定部243は、判定の結果を出力する。例えば、類似データ判定部243は、判定の結果として、類似データであるか否かを示すラベルを出力する。類似データは、過去データおよび直近データを学習させた類似判定モデルを用いて、過去データのうち、直近データに類似すると判定されたデータである。
【0026】
予測モデル生成部245における学習には、直近データと類似データとからなる学習用データが使用される。すなわち、予測モデル生成部245は、類似データに該当しない過去データが除外された学習用データを使用する学習によって、予測モデルを生成する。データ取得部244は、直近データと類似データとからなる学習用データを取得する。直近データと類似データとからなる学習用データは、データ取得部244から予測モデル生成部245へ入力される。以下、直近データと類似データとからなる学習用データを、学習用入力データと称する。
【0027】
特徴量データベース23におけるテーブルの各行には、学習用入力データであるか否かを示すラベルが紐付けられる。類似データ判定部243により出力されるラベルは、過去データについて学習用入力データであるか否かを示すラベルともいえる。特徴量データベース23におけるテーブルのうち過去データの各行には、学習用入力データであるか否かを示すラベルとして、類似データであるか否かを示すラベルが紐付けられる。なお、特徴量データベース23におけるテーブルのうち直近データの各行において、学習用入力データであるか否かを示すラベルには、学習用入力データであることを示す値がセットされる。
【0028】
データ取得部244は、学習用入力データであるか否かを示すラベルを参照することにより、直近データと類似データとを特徴量データベース23から読み出す。データ取得部244は、直近データと類似データとを特徴量データベース23から読み出すことによって、学習用入力データを取得する。データ取得部244は、取得された学習用入力データを予測モデル生成部245へ出力する。
【0029】
予測モデル生成部245は、学習用入力データを学習することによって、すなわち、直近データと類似データとを学習することによって、予測モデルを生成する。予測モデルは、将来における列車10の運行状況、および、列車10を利用する利用者の将来における人流の状況の少なくとも一方を予測するモデルである。実施の形態1において、将来とは、例えば、列車10を運行している状況において数駅先を走行する時点、あるいは、列車10を運行している状況の数分先または数時間先である。将来とは、翌日または数日先でも良い。予測モデル生成部245が予測する運行状況とは、遅延時間または停車時間、あるいは、駅間を走行したときの消費電力量などである。予測モデル生成部245が予測する人流の状況とは、乗車率または乗降人数などである。予測モデル生成部245は、生成された予測モデルを出力する。モデル記憶部26は、予測モデル生成部245から出力された予測モデルを保持する。
【0030】
推論フェーズにおいて、データ抽出部21は、運行データと人流データとを含む予測対象データを、データ収集装置32により収集された機器データから抽出する。特徴量抽出部22は、時系列データである予測対象データから、駅間単位の予測対象データである特徴量を抽出する。特徴量抽出部22により抽出された特徴量は、特徴量データベース23に格納される。
【0031】
推論装置25は、推論フェーズにおいて、将来における運行状況および人流の状況の少なくとも一方を予測する。推論装置25は、データ取得部251と、予測部である推論部252とを備える。データ取得部251は、予測対象データを特徴量データベース23から読み出すことによって、推論用データである予測対象データを取得する。このようにして、データ取得部251は、各列車10から、通信部31、データ収集装置32、データ抽出部21、特徴量抽出部22、および特徴量データベース23を介して、運行データと人流データとを含む予測対象データを取得する。データ取得部251は、予測対象データを推論部252へ出力する。
【0032】
推論部252は、モデル記憶部26から予測モデルを読み出す。推論部252は、予測対象データと予測モデルとに基づいて、将来における列車10の運行状況、および、列車10を利用する利用者の将来における人流の状況の少なくとも一方を推論する。推論部252は、データ取得部251により取得された予測対象データが予測モデルへ入力されることによって、将来における運行状況および将来における人流の状況の少なくとも一方についての予測結果を出力する。このようにして、予測モデル生成部245は、運行データおよび人流データを含む学習用データが過去データと直近データとに分けられ、過去データのうち直近データに類似する類似データと直近データとを学習させた予測モデルを用いて、予測対象データから、将来における運行状況および人流の状況の少なくとも一方を予測する。推論部252は、将来における運行状況および人流の状況の少なくとも一方の予測結果を対策処理部33へ出力する。
【0033】
対策処理部33は、推論部252によって出力される予測結果に応じた対策を策定する。例えば、対策処理部33は、列車10の遅延を示す予測結果が推論部252により出力された場合に、遅延を緩和させ得る対策、または、遅延を防ぎ得る対策を策定する。対策処理部33は、各列車10の発着時刻の変更、または、運行する列車10の本数の調整などといった対策を策定する。対策処理部33は、駅での乗り換えに使用される列車10の遅延が予測された場合において、乗り換え先の列車10の発車時刻を調整することとしても良い。
【0034】
対策処理部33は、策定された対策を実行するための指示を通信部31へ出力する。通信部31は、策定された対策を実行するための指示を各列車10へ送信する。各列車10は、対策処理部33により出力された当該指示に従って運行を調整する。または、通信部31は、策定された対策を実行するための指示をダイヤ作成装置40へ送信する。
【0035】
ダイヤ作成装置40の運行ダイヤ作成部41は、各列車10の運行ダイヤを作成する。運行ダイヤの情報は、運行ダイヤデータベース34に格納される。また、運行ダイヤ作成部41は、対策処理部33により出力された指示に従って運行ダイヤを調整する。運行ダイヤ作成部41は、予測を行った当日の運行ダイヤを指示に従って調整するほか、予測を行った日よりも後の日の運行ダイヤを指示に従って作成することとしても良い。
【0036】
運行管理装置30は、複数の列車10およびダイヤ作成装置40の各々と通信可能な装置である。運行管理装置30は、クラウド環境に構築されるサーバであるサーバ装置でも良い。クラウド環境は、クラウドサービスプラットフォームにおいて提供されるコンピュータ資源を含む。サーバ装置は、クラウド環境に構築されるため、クラウドサーバとも呼ばれる。
【0037】
運行管理装置30は、予測される運行状況、または予測される人流の状況を利用者へ向けて公表するために、推論装置25により出力される予測結果を出力することとしても良い。運行管理システム100は、予測される運行状況についての情報、または予測される人流の状況についての情報を、駅の案内板、ウェブサイト、またはアプリケーションにより提示するために、推論装置25による予測結果を利用しても良い。
【0038】
次に、特徴量データベース23に格納されるデータについて説明する。図2は、実施の形態1にかかる運行予測装置20が保持する特徴量データベース23におけるテーブルの例を示す第1の図である。
【0039】
図2に示す例において、「出発時刻」、「遅延時刻」、「乗降人数」、および「将来の遅延時間」の各列は、運行データの項目または人流データの項目を表す。特徴量は、複数の項目の各々についてのデータのまとまりであって、テーブルの各行に示される。図2において、「出発時刻」は、時、分、および秒により表される。「遅延時間」の単位、「将来の遅延時間」の単位は、それぞれ秒とする。「乗降人数」は、人数を表す数値により表される。「将来の遅延時間」は、ある駅から見て例えばn駅先(nは正の整数)で発生する遅延時間である。図2に示す例では、次の停車駅での遅延時間を将来の遅延時間とする。学習用データにおいて、特徴量には、将来の運行状況についての項目および将来の人流の状況についての項目の少なくとも1つが紐付けられる。図2に示す例では、将来の運行状況についての項目である「将来の遅延時間」が特徴量に紐付けられている。将来の運行状況についての項目は、遅延時間に限られず、駅における停車時間などであっても良い。将来の人流の状況についての項目は、乗車率または乗降人数などである。
【0040】
図2に示す例において、「年」、「月」、および「日」の3つの列は、日付データを表す。テーブルの各行には、運行データまたは人流データが取得された日時を表す日付データが紐付けられる。なお、日付データにおける「日」は、0時を区切りとする期間ではなく、始発の列車10の運転開始時から最終の列車10の運転終了時までを単位とする期間とする。
【0041】
「直近データ」の列は、直近データであるか否かを示すラベルを表す。図2に示す例において、ラベル「0」は直近データではないことを表し、ラベル「1」は直近データであることを表す。図2に示す例では、2022年6月3日以前に取得された運行データおよび人流データが過去データに分別され、2022年6月4日以降に取得された運行データおよび人流データが直近データに分別されている。「学習用入力データ」の列は、学習用入力データであるか否かを示すラベルを表す。図2に示すテーブルは、学習用入力データであるか否かを示すラベルの値が格納される前の状態とする。
【0042】
特徴量は、類似判定モデル生成部242による学習における説明変数である。直近データであるか否かを示すラベルは、類似判定モデル生成部242による学習における目的変数である。すなわち、特徴量データベース23におけるテーブルの各行には、説明変数と目的変数とが互いに対応付けられている。
【0043】
特徴量に含められるデータは、図2に例示する項目のデータに限られない。特徴量には、列車10の運行状況についてのさまざまな項目のデータと、人流の状況についてのさまざまな項目のデータとを含めることが可能である。例えば、列車10の運行状況についての項目は、駅間の走行時間、または、各駅における停車時間などであっても良い。人流の状況についての項目は、列車10の走行中における乗車率、駅での乗降中における乗車率変動、または、駅での乗降人数などであっても良い。人流の状況についての項目には、列車10における利用者の状況を示す項目のみならず、列車10が発着するホーム、駅の構内、または改札口における混雑の状況を示す項目が含まれても良い。ホームの混雑の状況を示す項目と、構内の混雑の状況を示す項目と、改札口の混雑の状況を示す項目とのうち2つ以上が組み合わせられて、混雑の状況を示す項目として使用されても良い。
【0044】
各車両で乗車率が取得されている場合、特徴量には各車両の乗車率を含めることができる。車両の重量を計測することにより走行中の乗車率が取得される場合、計測した値にブレが発生する場合があるため、特徴量には、走行中における乗車率の平均値が使用されても良い。列車10の全体における乗車率が取得されている場合、特徴量には、列車10の全体における乗車率を含めることとしても良い。
【0045】
乗車率変動は、利用者の乗り降りに伴う乗車率の変化度合いを表す指標である。乗車率変動を特徴量に含めることは、乗り降りの激しさに起因する遅延時間の予測、または、乗車率の予測に有用である。乗車率変動は、乗降中における乗車率の平均、乗降中における乗車率の分散、または、乗降中における乗車率の標準偏差により表される。各車両で乗車率が取得されている場合、特徴量には各車両の乗車率変動を含めることができる。なお、列車10のうち乗り降りが最も激しい車両における乗り降りの状態が、列車10の乗り降りに要する時間に最も影響を及ぼすことから、乗車率の標準偏差が最も大きい車両の乗車率変動を特徴量に含めることとしても良い。
【0046】
乗降人数は、ある駅において乗客が列車10から降車した人数と当該駅において列車10に乗車した人数との合計値である。各車両で乗降人数が取得されている場合、特徴量には各車両の乗降人数を含めることができる。なお、駅への到着によりドアが開いたときの乗車率とドアが開いている間における乗車率の最小値とに基づいて降車人数を求め、求めた降車人数を特徴量に含めることとしても良い。また、駅からの出発のためにドアを閉じたときの乗車率とドアが開いている間における乗車率の最小値とに基づいて乗車人数を求め、求めた乗車人数を特徴量に含めることとしても良い。
【0047】
特徴量には、駅ID(IDentifier)、天候、車両の種別、列車10の種別、列車10の行先、運転方向、列車10の走行速度、列車10が駅間を走行したときの消費電力量または回生電力量、列車10に搭載されているモータなどの機器の種別、列車10と当該列車10の前を走行する先行列車との距離、列車10と先行列車との時間間隔などが含められても良い。車両の種別とは、例えば、トイレの有無、女性専用車両か否かといった種別である。列車10の種別とは、各駅停車または急行といった種別である。また、ある駅についての特徴量に、当該駅の1つ前に停車した駅についての運行データまたは人流データ、あるいは、当該駅の2つ以上前に停車した駅についての運行データまたは人流データが含められても良い。また、ある駅についての特徴量に、当該駅についての運行データまたは人流データと当該駅の1つ前に停車した駅についての運行データまたは人流データとの差分、または、当該駅についての運行データまたは人流データと当該駅の2つ以上前に停車した駅についての運行データまたは人流データとの差分が含められても良い。さらに、ある列車10についての特徴量に、先行列車についての運行データまたは人流データが含められても良い。
【0048】
図3は、実施の形態1における過去データと直近データと類似データとの関係を示す概念図である。運行予測装置20は、予測モデルへ予測対象データを入力することにより、将来における列車10の運行状況、および、列車10を利用する利用者の将来における人流の状況の少なくとも一方を予測する。予測対象データは、学習装置24による学習が行われた時よりも後に取得された運行データおよび人流データである。
【0049】
直近データは、学習装置24による学習が行われる日から遡った一定の期間において取得された運行データおよび人流データである。過去データは、直近データである運行データおよび人流データの取得が開始された日よりも前に取得された運行データおよび人流データである。図3には、横軸を日として、時系列における過去データと直近データと予測対象データとの並びを表している。運行予測装置20は、過去データと直近データとを含む学習用データを取得する。
【0050】
類似判定モデル生成部242は、過去データと直近データとを学習することによって類似判定モデルを生成する。類似データ判定部243は、類似判定モデルに基づいて、過去データから類似データを判定する。運行予測装置20は、過去データから類似データを抽出することにより、直近データと類似データとを含む学習用入力データを取得する。予測モデル生成部245は、学習用入力データを学習することによって、予測モデルを生成する。図3に示す白抜き矢印は、類似データ判定部243での判定によって過去データから類似データが抽出されることを表す。
【0051】
特徴量データベース23において、学習用データには、学習用データが取得された日時を示す日付データが紐付けられている。データ分別部241は、特徴量データベース23におけるテーブルの各行に紐付けられている日付データを基に、特徴量データベース23内の学習用データを過去データと直近データとに分別する。データ分別部241には、直近データの範囲とする期間があらかじめ設定される。データ分別部241は、当該期間に包含される日付データが紐付けられている学習用データを直近データに分別する。例えば、データ分別部241には、直近データの範囲とする期間を示す情報が、運行管理装置30を使用するユーザによって入力されることによって、直近データの範囲とする期間が設定される。直近データの範囲とする期間は、例えば、学習の当日から数週間前までの期間、または、学習の当日から数カ月前までの期間などと設定される。
【0052】
直近データの範囲とする期間には、任意の期間を設定することができる。例えば、利用者の人流に影響を及ぼし得るイベントが開催されている場合、または、利用者の人流に影響を及ぼし得るイベントが予定されている場合、開催または予定されているイベントと同様のイベントが開催された期間を、直近データの範囲とする期間に設定しても良い。また、感染症の流行といった、人流に影響が及ぶような事態が発生している場合、発生している事態と同様の事態が発生した期間を、直近データの範囲とする期間に設定しても良い。これにより、運行予測装置20は、予測時と人流の状況が近いときに取得された過去データを類似データに含めることができるため、将来における列車10の運行状況または将来における人流の状況を高精度に予測することができる。
【0053】
また、利用者の人流に影響を及ぼし得るイベントが無く、人流に影響が及ぶような事態も無い場合、人流に影響を及ぼし得るイベントが開催された期間と人流に影響が及ぶような事態が発生した期間とを除いた期間を、直近データの範囲とする期間に設定しても良い。この場合も、運行予測装置20は、予測時と人流の状況が近いときに取得された過去データを類似データに含めることができるため、将来における列車10の運行状況または将来における人流の状況を高精度に予測することができる。
【0054】
次に、運行予測装置20における類似判定モデルの生成と類似データの判定との詳細について説明する。図4は、実施の形態1にかかる運行予測装置20における類似判定モデルの生成と類似データの判定との詳細について説明するための第1の図である。
【0055】
実施の形態1において、類似判定モデル生成部242および類似データ判定部243は、過去データからの類似データの判定にadversarial validationの手法を使用する。類似判定モデル生成部242は、交差検証(cross validation)といった手法により過去データをトレーニングデータとテストデータとに分割し、教師あり学習を行う。ここでは、k分割交差検証(k-fold cross validation)を例として説明する。
【0056】
図4に示す例では、特徴量データベース23内の過去データをk個の部分に分割し、k個の部分のうちの1つをテストデータに設定し、過去データのうち残りの(k-1)個の部分をラベル「0」のトレーニングデータに設定する。また、直近データをラベル「1」のトレーニングデータに設定する。これらのラベルは、類似判定モデル生成部242での学習における目的変数であって、直近データであるか否かを示すラベルである。以下の説明において、分割データとは、過去データをk個の部分に分割した各々を指すものとする。
【0057】
類似判定モデル生成部242は、トレーニングデータの学習によって類似判定モデルを生成する。類似データ判定部243は、テストデータを類似判定モデルへ入力することによって、テストデータについての直近データとの類似度を算出する。類似度は、テーブルの行ごとに算出される。類似データ判定部243は、テストデータのうち、算出された類似度があらかじめ設定された閾値以上であったデータを類似データと判定する。類似判定モデル生成部242と類似データ判定部243とは、過去データのうちテストデータとする部分を順次変更しながら類似判定モデルの生成と類似度の算出とをk回繰り返す。
【0058】
このように、図4に示す例において、類似判定モデル生成部242は、過去データの一部である第1の部分と直近データとを学習することによって類似判定モデルを生成する。類似データ判定部243は、過去データのうち第1の部分を除いた部分である第2の部分が類似判定モデルへ入力されることによって、過去データの第2の部分についての直近データとの類似度を求め、過去データの第2の部分が類似データに該当するか否かを類似度に基づいて判定する。第1の部分とは、過去データのうちラベル「0」のトレーニングデータとされた部分を指す。第2の部分は、過去データのうちテストデータとされた部分を指す。図4に示す例において、類似データは、過去データの第2の部分のうち直近データに類似すると類似度に基づいて判定されたデータである。
【0059】
これにより、類似判定モデル生成部242および類似データ判定部243は、過去データから類似データを判定することができる。なお、類似データ判定部243は、算出された類似度が高い方から、あらかじめ設定された数のデータを選出することにより、類似データを判定することとしても良い。データの数とは、特徴量データベース23のテーブルにおける行を単位とするデータの数、すなわち、駅間単位のデータの数とする。
【0060】
図5は、実施の形態1にかかる運行予測装置20における類似判定モデルの生成と類似データの判定との詳細について説明するための第2の図である。図5に示す例は、図4に示す例の応用例である。図5に示す例は、過去データのみならず直近データもk個の部分データに分割し、直近データの部分データもテストデータに含める例である。
【0061】
図5に示す例では、図4に示す例と同様に、過去データをk個の部分に分割し、k個の部分のうちの1つをテストデータに設定し、過去データのうち残りの(k-1)個の部分をラベル「0」のトレーニングデータに設定する。また、直近データをk個の部分に分割し、k個の部分のうちの1つをテストデータに設定し、直近データのうち残りの(k-1)個の部分をラベル「1」のトレーニングデータに設定する。
【0062】
類似判定モデル生成部242は、トレーニングデータの学習によって類似判定モデルを生成する。類似データ判定部243は、テストデータを類似判定モデルへ入力することによって、テストデータについての直近データとの類似度を算出する。類似データ判定部243は、テストデータに含まれる過去データの分割データのうち、算出された類似度が閾値以上であったデータを類似データと判定する。類似判定モデル生成部242と類似データ判定部243とは、過去データのうちテストデータとする部分と直近データのうちテストデータとする部分との各々を順次変更しながら類似判定モデルと類似度の算出とをk回繰り返す。
【0063】
このように、図5に示す例において、類似判定モデル生成部242は、過去データの一部である第1の部分と直近データの一部である第1の部分とを学習することによって類似判定モデルを生成する。過去データの第1の部分とは、過去データのうちラベル「0」のトレーニングデータとされた部分を指す。直近データの第1の部分とは、直近データのうちラベル「1」のトレーニングデータとされた部分を指す。
【0064】
また、図5に示す例において、類似データ判定部243は、過去データのうち第1の部分を除いた部分である第2の部分と直近データのうち第1の部分を除いた部分である第2の部分とが類似判定モデルへ入力されることによって、過去データの第2の部分および直近データの第2の部分の各々についての直近データの第1の部分との類似度を求め、過去データの第2の部分について求めた類似度を閾値と比較することによって過去データの第2の部分について類似データに該当するか否かを判定する。過去データの第2の部分とは、過去データのうちテストデータとされた部分を指す。直近データの第2の部分とは、直近データのうちテストデータとされた部分を指す。図5に示す例において、類似データは、過去データの第2の部分について求めた類似度を閾値と比較することによって、過去データの第2の部分のうち直近データに類似すると判定されたデータである。
【0065】
図5に示す例においても、類似判定モデル生成部242および類似データ判定部243は、過去データから類似データを判定することができる。また、図5に示す例では、類似判定モデル生成部242および類似データ判定部243は、直近データのうちテストデータとされた部分について算出される類似度の分布を基に、類似データを判定するための閾値を設定することができる。
【0066】
図6は、図5に示す例において類似データの判定に使用される閾値について説明するための図である。図6には、過去データのうちテストデータとされた部分について類似度の分布と直近データのうちテストデータとされた部分についての類似度の分布とをプロットにより表したグラフの例を示す。類似データ判定部243は、図6に示すように、直近データであるテストデータについて算出された類似度よりも低い類似度を閾値に設定する。このように、図5に示す例において、閾値は、直近データの第2の部分について求めた類似度の分布を基に設定される。
【0067】
類似判定モデル生成部242は、過去データのうちテストデータとする部分と直近データのうちテストデータとする部分との各々を順次変更しながら類似判定モデルを生成することにより、k個の類似判定モデルを生成する。類似データ判定部243は、k個の類似判定モデルの各々について、直近データであるテストデータについて算出された類似度の分布を基に、閾値を設定する。
【0068】
過去データを複数の部分データに分割する場合に、過去データのうちテストデータとする分割データごとに、特徴量に違いが表れることがあり得る。図5に示す例では、直近データであるテストデータについて算出された類似度の分布を基に閾値が設定されることで、類似データ判定部243は、過去データであるテストデータにおける特徴量の傾向に応じた閾値を基に類似データを判定することができる。このため、類似データ判定部243は、過去データのうち直近データに類似するデータを類似データとして適切に抽出することができる。運行予測装置20は、類似データを適切に抽出できることによって、予測精度の向上が可能となる。
【0069】
図7は、実施の形態1にかかる運行予測装置20における類似判定モデルの生成と類似データの判定との詳細について説明するための第3の図である。図7に示す例は、図4に示す例と図5に示す例との応用例である。図7に示す例において、類似データ判定部243は、算出された類似度が閾値以上である過去データの一部を削除する調整を行う。
【0070】
図7の右部には、特徴量データベース23に格納されている直近データ、すなわち、直近データであるか否かを示すラベルが「1」である学習用データのヒストグラムを示す。特徴量データベース23における直近データの行ごとのデータ、すなわち、直近データのうち取得された日時ごとのデータについて類似度を求め、求めた類似度の値ごとの頻度を棒グラフにより表したものが、図7の右部に示すヒストグラムである。すなわち、直近データを、取得された日時ごとのデータについて求めた類似度に基づいて分類し、分類されたデータについての頻度の分布を表したものが、図7の右部に示すヒストグラムである。以下、図7の右部に示すヒストグラムにより表される頻度の分布を、第1の分布と称する。
【0071】
図7の左上部には、特徴量データベース23に格納されている過去データ、すなわち、直近データであるか否かを示すラベルが「0」である学習用データのヒストグラムを示す。特徴量データベース23における過去データの行ごとのデータ、すなわち、過去データのうち取得された日時ごとのデータについて類似度を求め、求めた類似度の値ごとの頻度を棒グラフにより表したものが、図7の左上部に示すヒストグラムである。また、当該ヒストグラムでは、類似度が閾値以上であるデータの頻度を表す棒グラフを実線により表し、類似度が閾値以下であるデータの頻度を表す棒グラフを破線により表す。以下、図7の左上部に示すヒストグラムのうち実線の棒グラフにより表される頻度の分布を、第2の分布と称する。すなわち、類似度が閾値以上であることにより類似データと判定された過去データを、取得された日時ごとのデータの類似度に基づいて分類し、分類されたデータについての頻度の分布が、第2の分布である。
【0072】
図7に示す例では、類似データ判定部243は、類似度を閾値と比較することにより類似データと判定された過去データの一部を類似データから削除することによって、第2の分布を第1の分布に近づける調整を行う。図7の左下部には、類似度が閾値以上であるデータの一部、すなわち、類似データと判定された過去データの一部を、類似データから削除した後におけるヒストグラムを表す。図7の左下部に示すヒストグラムにおいて、棒グラフの破線部分は、過去データのうち、第2の分布を第1の分布に近づける調整により削除された部分を表す。棒グラフの実線部分は、過去データのうち、当該調整により残された部分を表す。図7の左下部に示すヒストグラムのうち実線により表される部分は、図7の左上部に示されるヒストグラムと同じである。
【0073】
図7に示す例では、類似データ判定部243は、過去データに含まれるデータを類似度に基づいて分類した場合におけるデータの頻度の分布が、直近データを類似度に基づいて分類した場合におけるデータの頻度の分布に一致するように、過去データに含まれるデータの数を調整する。
【0074】
過去データにおいて類似度ごとに分類されたデータの頻度が、直近データにおける類似度ごとに分類されたデータの頻度を超える場合、過去データの当該データの多くを学習用入力データに残したとしても、予測モデルの精度向上にはつながらないといえる。図7に示す例では、類似データ判定部243は、第2の分布を第1の分布に近づける調整により、過去データのうち予測モデルの精度向上に有用なデータのみを、学習用入力データに含めることができる。
【0075】
次に、予測モデル生成部245での学習に使用される学習用入力データについて説明する。図8は、実施の形態1にかかる運行予測装置20が保持する特徴量データベース23におけるテーブルの例を示す第2の図である。図8に示すテーブルは、図2に示すテーブルに、学習用入力データであるか否かを示すラベルが追加されたものである。
【0076】
図8に示す「学習用入力データ」の列において、ラベル「0」は学習用入力データではないことを表し、ラベル「1」は学習用入力データであることを表す。図8に示す例では、2022年6月4日以降に取得された学習用データである直近データが、学習用入力データに含められている。また、2022年6月3日以前に取得された学習用データのうち、2022年6月2日の7時10分00秒のデータと同日の7時14分00秒のデータとが、類似データとして学習用入力データに含められている。
【0077】
図8に示す例において、特徴量のうち「将来の遅延時間」は、予測モデル生成部245による学習における目的変数とする。また、「将来の遅延時間」以外の特徴量は、予測モデル生成部245による学習における説明変数とする。予測モデル生成部245は、教師データである目的変数と説明変数との関係を、教師あり学習のアルゴリズムに従って学習することで、将来の運行状況を表す遅延時間の予測モデルを構築する。
【0078】
予測モデル生成部245は、類似データに該当しない過去データが除外された学習用入力データが入力されることによって、不要なデータについての学習を省略することができる。これにより、予測モデル生成部245は、学習時間を短縮させることができる。また、予測モデル生成部245は、直近の運行状況と直近の人流の状況とに合った高精度な予測を可能とする予測モデルを生成することができる。運行予測装置20は、将来の運行状況の高精度な予測、または将来の人流の状況の高精度な予測が可能となる。運行管理装置30は、利用者の混雑緩和が可能となるように、または、列車10の効率的な運行が可能となるように列車10の運行を調整することができる。
【0079】
予測モデル生成部245は、類似判定モデル生成部242による学習における説明変数とされた特徴量の項目のうち、運行状況の予測に有用な項目のみ、または人流の状況の予測に有用な項目のみを、予測モデル生成部245による学習における説明変数とすることとしても良い。すなわち、類似判定モデル生成部242による学習における説明変数とされた特徴量の項目の一部は、予測モデル生成部245による学習における説明変数から除外されても良い。運行予測装置20は、運行状況の予測に有用な項目のみ、または人流の状況の予測に有用な項目のみを特徴量として残すことによって、予測モデル生成部245における学習時間の短縮と、運行状況の高精度な予測または人流の状況の高精度な予測とが可能となる。
【0080】
なお、実施の形態1において、類似判定モデル生成部242は、直近データと過去データとの学習に、教師あり学習ではなく教師なし学習の手法を使用しても良い。類似データ判定部243は、過去データのクラスタリングを行い、過去データのうち直近データと同じクラスタに属するデータを類似データと判定しても良い。類似判定モデル生成部242は、特徴量データベース23における特徴量の次元数を、主成分分析といった手法により削減し、次元数を削減してから、教師あり学習またはクラスタリングを行うこととしても良い。
【0081】
予測モデルの精度は、人流の特徴の変化などにより、時間の経過とともに徐々に低下する場合がある。また、利用者の人流に影響を及ぼし得るイベント、または、人流に影響が及ぶような事態の発生といったイレギュラーな事象が起きていない通常時の後に、イベントの開催または感染症の流行等といったイレギュラーな事象が起こることにより人流に変化が生じることとなった場合も、予測モデルの精度は低下することとなる。または、イレギュラーな事象が起きた後に、イレギュラーな事象が無くなり通常時に戻った場合も、予測モデルの精度は低下することとなる。
【0082】
運行予測装置20は、予測モデルの精度を監視し、精度が低下したと判断した場合に、直近データの更新と更新された直近データに基づいた類似データの判定とによって学習用入力データを更新し、更新された学習用入力データに基づく再学習を予測モデル生成部245により行うこととしても良い。これにより、運行予測装置20は、運行状況または人流の状況の予測に使用される予測モデルの精度を維持可能とし、運行状況または人流の状況の高精度な予測を継続することができる。
【0083】
運行予測装置20は、例えば、直近データと予測対象データとで類似か否かを判定し、予測対象データのうち類似と判定されたデータの数がある基準よりも少ない場合に、予測モデルの精度が低下したと判断する。運行予測装置20は、予測モデルの精度を一定の期間ごとに確認し、精度低下の判断があらかじめ設定された数だけ連続した場合に、学習用入力データの更新と再学習とを行うこととしても良い。
【0084】
運行予測装置20は、運行状況または人流の状況について、予測モデルの使用による予測結果と実績との差分である誤差を求め、誤差が基準を超えた場合に、学習用入力データの更新と再学習とを行うこととしても良い。運行予測装置20は、誤差の値を蓄積して蓄積された値の平均を求め、平均が基準を超えた場合に、学習用入力データの更新と再学習とを行うこととしても良い。さらに、運行予測装置20は、イベントといったイレギュラーな事象が起きることがあらかじめ判明している場合に、事前に、学習用入力データの更新と再学習とを行うこととしても良い。
【0085】
運行予測装置20は、直近データの更新と、類似データの判定と、予測モデル生成部245による再学習とを定期的に実施することとしても良い。運行予測装置20は、学習に関わる処理を、列車10が運行されていない時間帯において実施しても良い。
【0086】
次に、実施の形態1にかかる運行予測装置20による動作の手順について説明する。以下、運行予測装置20による動作の手順の例を、予測モデルを生成する学習時と、予測モデルを使用して運行状況を予測する予測時とに分けて説明する。図9は、実施の形態1にかかる運行予測装置20による、学習時における動作の手順の例を示すフローチャートである。図9に示す手順は、学習フェーズにおける動作の手順の例である。
【0087】
ステップS1において、運行予測装置20は、データ抽出部21により、機器データから学習用データを抽出する。データ抽出部21は、データ収集装置32により各列車10から収集された機器データから学習用データを抽出する。データ抽出部21は、抽出された学習用データを特徴量抽出部22へ出力する。
【0088】
ステップS2において、運行予測装置20は、特徴量抽出部22により、ステップS1において抽出された学習用データから特徴量を抽出する。特徴量抽出部22は、データ抽出部21から入力される時系列の学習用データを駅間単位の学習用データへ変換することにより、特徴量を抽出する。
【0089】
ステップS3において、運行予測装置20は、ステップS2により抽出された特徴量を特徴量抽出部22が特徴量データベース23へ書き込むことにより、特徴量を特徴量データベース23に格納する。特徴量データベース23には、特徴量と、特徴量に紐付けられた日付データとが格納される。
【0090】
ステップS4において、運行予測装置20は、類似判定モデル生成部242により類似判定モデルを生成し、類似データ判定部243により類似判定モデルに基づいて過去データから類似データを判定する。
【0091】
ステップS5において、運行予測装置20は、学習用入力データに該当するか否かを示す値を特徴量抽出部22が特徴量データベース23へ書き込むことにより、学習用入力データに該当するか否かを示す値を特徴量に紐付ける。類似データ判定部243は、直近データと類似データとについては、特徴量データベース23の「学習用入力データ」の列に、学習用入力データであることを示す値である「1」を書き込む。類似データ判定部243は、過去データのうち類似データ以外のデータについては、特徴量データベース23の「学習用入力データ」の列に、学習用入力データではないことを示す値である「0」を書き込む。
【0092】
ステップS6において、運行予測装置20は、データ取得部244により学習用入力データを特徴量データベース23から読み出すことにより、特徴量データベース23から学習用入力データを抽出する。データ取得部244は、学習用入力データであるか否かを示すラベルが「1」である学習用データ、すなわち、直近データと類似データとを特徴量データベース23から読み出すことにより、学習用入力データを抽出する。データ取得部244は、抽出された学習用入力データを予測モデル生成部245へ出力する。
【0093】
ステップS7において、運行予測装置20の予測モデル生成部245は、ステップS6において抽出された学習用入力データを学習することによって、予測モデルを生成する。モデル記憶部26は、予測モデル生成部245により生成された予測モデルを保持する。以上により、運行予測装置20は、図9に示す手順による動作を終了する。
【0094】
図10は、図9に示すステップS4における類似データの判定についての詳細な手順の例を示すフローチャートである。ここでは、図4に示す例により類似判定モデルの生成と類似データの判定とを行う場合の手順について説明する。
【0095】
ステップS11において、データ分別部241は、図9に示すステップS3において特徴量データベース23に格納された特徴量である学習用データを、過去データと直近データとに分別する。データ分別部241は、特徴量データベース23内の学習用データのうち、直近データの範囲を示す期間に日付データが包含される学習用データを直近データと判定する。データ分別部241は、特徴量データベース23内の学習用データのうち、直近データと判定された学習用データ以外を、過去データと判定する。
【0096】
データ分別部241は、直近データに該当するか否かを示す値を特徴量データベース23へ書き込むことにより、直近データに該当するか否かを示す値を学習用データに紐付ける。データ分別部241は、直近データに分別された学習用データについては、特徴量データベース23の「直近データ」の列に、直近データであることを示す値である「1」を書き込む。データ分別部241は、過去データに分別された学習用データについては、特徴量データベース23の「直近データ」の列に、直近データではないことを示す値である「0」を書き込む。
【0097】
ステップS12において、類似判定モデル生成部242は、「直近データ」の列の値が「0」である過去データを特徴量データベース23から読み出し、過去データをk個の分割データに分割する。また、類似判定モデル生成部242は、「直近データ」の列の値が「1」である直近データを特徴量データベース23から読み出す。
【0098】
ステップS13において、類似判定モデル生成部242は、1つの分割データをテストデータとして、過去データのうちテストデータを除いた部分と直近データとを学習することによって類似判定モデルを生成する。類似判定モデル生成部242は、k個の分割データのうちの1つをテストデータに設定し、過去データのうち残りの(k-1)個の分割データをラベル「0」のトレーニングデータに設定する。また、類似判定モデル生成部242は、特徴量データベース23から読み出された直近データをラベル「1」のトレーニングデータに設定する。類似判定モデル生成部242は、トレーニングデータの学習によって類似判定モデルを生成する。
【0099】
ステップS14において、類似データ判定部243は、テストデータを類似判定モデルへ入力することによって、テストデータについての直近データとの類似度を求める。類似判定モデル生成部242および類似データ判定部243は、ステップS13およびステップS14を、全ての分割データをテストデータとする場合について実行する。すなわち、類似判定モデル生成部242および類似データ判定部243は、過去データのうちテストデータとする部分を順次変更しながら類似判定モデルの生成と類似度の算出とをk回繰り返す。
【0100】
ステップS15において、類似データ判定部243は、過去データのうち類似度が閾値以上である過去データを類似データと判定する。運行予測装置20は、ステップS15を終えると、図9に示すステップS5へ手順を進める。
【0101】
図11は、実施の形態1にかかる運行予測装置20による、予測時における動作の手順の例を示すフローチャートである。図11に示す手順は、推論フェーズにおける動作の手順の例である。
【0102】
ステップS21において、運行予測装置20は、データ抽出部21により、機器データから予測対象データを抽出する。データ抽出部21は、抽出された予測対象データを特徴量抽出部22へ出力する。
【0103】
ステップS22において、運行予測装置20は、特徴量抽出部22により、ステップS21において抽出された予測対象データから特徴量を抽出する。特徴量抽出部22は、データ抽出部21から入力される時系列の予測対象データを駅間単位の予測対象データへ変換することにより、特徴量を抽出する。
【0104】
ステップS23において、運行予測装置20は、ステップS22により抽出された特徴量を特徴量抽出部22が特徴量データベース23へ書き込むことにより、特徴量を特徴量データベース23に格納する。
【0105】
推論装置25のデータ取得部251は、運行状況および人流の状況の少なくとも一方の予測に使用する予測対象データを特徴量データベース23から読み出すことによって、推論用データである予測対象データを取得する。データ取得部251は、予測対象データを推論部252へ出力する。推論部252は、モデル記憶部26から予測モデルを読み出す。ステップS24において、運行予測装置20は、推論部252において特徴量を予測モデルへ入力することによって、将来における運行状況または将来における人流の状況の予測結果を推論部252により求める。推論部252が出力する予測結果は、特徴量データベース23に格納される。以上により、運行予測装置20は、図11に示す手順による動作を終了する。
【0106】
図1には、運行管理装置30に運行予測装置20とデータ収集装置32とが備えられる例を示したが、運行管理システム100の構成は図1に示す構成に限定されないものとする。以下、運行管理システム100の変形例について説明する。
【0107】
図12は、実施の形態1の第1の変形例にかかる運行管理システム100Aの構成例を示す図である。運行管理システム100Aは、複数の列車10と、各列車10の運行を管理する運行管理装置30Aと、ダイヤ作成装置40と、サーバ装置50とを備える。運行管理装置30は、列車10の運行状況を予測する運行予測装置20Aを備える。運行予測装置20Aの構成は、図1に示す運行予測装置20の構成と同様である。運行管理装置30Aは、データ収集装置32を備えていない点が、図1に示す運行管理装置30とは異なる。
【0108】
サーバ装置50は、クラウド環境に構築されるサーバである。サーバ装置50は、データ収集装置51と、サーバ装置50の外部の装置との通信を行う通信部52とを備える。データ収集装置51は、図1に示すデータ収集装置32と同様に、機器データを収集する。データ収集装置51は、収集された機器データを運行予測装置20Aへ出力する。通信部52は、各列車10の通信部11との間の通信と、運行管理装置30Aとの間の通信とを行う。
【0109】
図1に示す運行管理システム100の運行管理装置30は、各列車10から機器データを直接取得していたが、図12に示す運行管理システム100Aの運行管理装置30Aは、サーバ装置50に備えられたデータ収集装置51を介して機器データを取得する。
【0110】
図13は、実施の形態1の第2の変形例にかかる運行管理システム100Bの構成例を示す図である。運行管理システム100Bは、複数の列車10と、運行管理装置30Bと、ダイヤ作成装置40と、サーバ装置50Bとを備える。
【0111】
サーバ装置50Bは、クラウド環境に構築されるサーバである。サーバ装置50Bは、図12に示すサーバ装置50と同様に、データ収集装置51および通信部52を備える。通信部52は、各列車10の通信部11との間の通信と、運行管理装置30Bとの間の通信とを行う。サーバ装置50Bは、さらに、列車10の運行状況を予測する運行予測装置20Bを備える。運行予測装置20Bは、図1に示す運行予測装置20と同様の構成を備える。また、運行予測装置20Bは、運行ダイヤデータベース34を保持する記憶部34aを備える。
【0112】
運行管理装置30Bは、図1に示す運行管理装置30と同様に、通信部31および対策処理部33を備える。運行管理装置30Bは、運行予測装置20とデータ収集装置32と記憶部34aとが備えられていない点が、図1に示す運行管理装置30とは異なる。
【0113】
図1に示す運行管理システム100の運行予測装置20は、運行管理装置30の内部に備えられていたが、図13に示す運行管理システム100Bの運行予測装置20Bは、データ収集装置51とともにサーバ装置50Bに備えられている。
【0114】
推論装置25の推論部252は、予測結果を通信部52へ出力する。通信部52は、運行管理装置30Bの通信部31へ予測結果を送信する。通信部31は、受信された予測結果を対策処理部33へ出力する。対策処理部33は、策定された対策を実行するための指示を通信部31へ出力する。
【0115】
なお、図1に示す運行管理システム100において、学習装置24は、運行予測装置20に内蔵される装置である。学習装置24は、運行予測装置20の外部の装置であっても良く、運行管理装置30の外部の装置であっても良い。運行管理装置30の外部の装置である学習装置24は、運行管理システム100を構成する装置である。学習装置24は、ネットワークを介して運行予測装置20に接続可能な装置でも良い。学習装置24は、クラウドサーバ上に存在する装置でも良い。図12に示す運行管理システム100Aにおいても、学習装置24は、運行予測装置20Aの外部の装置、または、運行管理装置30Aの外部の装置であっても良い。図13に示す運行管理システム100Bにおいても、学習装置24は、運行予測装置20Bの外部の装置、または、サーバ装置50Bの外部の装置であっても良い。
【0116】
実施の形態1によると、運行予測装置20,20A,20Bは、過去データと直近データとを学習することによって類似判定モデルを生成し、類似判定モデルに基づいて過去データから類似データを判定する。運行予測装置20,20A,20Bは、過去データおよび直近データの学習により生成された類似判定モデルを使用することにより、運行状況に影響を及ぼし得るより多くの項目が特徴量に含まれる場合でも、過去データから類似データを抽出することができる。また、運行予測装置20,20A,20Bは、類似か否かの判定における影響の度合いが互いに異なる多くの項目が特徴量に含まれる場合でも、類似しているか否かの判定に項目ごとの影響の度合いを反映させることができる。さらに、運行予測装置20,20A,20Bは、過去データのうち運行状況または人流の状況が類似しているデータから列車10の運行状況を予測することによって、運行状況の高精度な予測が可能となる。以上により、運行予測装置20,20A,20B、運行管理装置30,30A,30B、および運行管理システム100,100A,100Bは、将来における列車10の運行状況を高精度に予測することができる、という効果を奏する。
【0117】
実施の形態2.
実施の形態1では、運行予測装置20,20A,20Bは、駅間単位の学習用データである特徴量に基づいて類似データを判定することとした。実施の形態2では、任意の期間を単位とする特徴量に基づいて類似データを判定する例について説明する。
【0118】
図14は、実施の形態2にかかる運行管理システム100Cの構成例を示す図である。実施の形態2では、上記の実施の形態1と同一の構成要素には同一の符号を付し、実施の形態1とは異なる構成について主に説明する。運行管理システム100Cは、鉄道における列車10の運行を管理するシステムである。運行管理システム100Cは、複数の列車10と、各列車10の運行を管理する運行管理装置30Cと、各列車10の運行ダイヤを作成するダイヤ作成装置40とを備える。
【0119】
運行管理装置30Cは、運行予測装置20とは異なる構成の運行予測装置20Cを備える点が、図1に示す運行管理装置30とは異なる。運行予測装置20Cは、学習装置24とは異なる構成の学習装置24Cを備える点が、図1に示す運行予測装置20とは異なる。また、運行予測装置20Cは、特徴量データベース23を保持する記憶部23aの代わりに、第1の特徴量データベース27を保持する記憶部27aを有する。第1の特徴量データベース27は、運行状況の予測において使用される特徴量である第1の特徴量が格納される運行予測用の特徴量データベースである。第1の特徴量データベース27は、特徴量データベース23と同様のデータベースである。
【0120】
学習装置24Cは、データ分別部241と、類似判定モデル生成部242Cと、類似データ判定部243Cと、データ取得部244と、予測モデル生成部245と、特徴量変換部246と、第2の特徴量データベース247を保持する記憶部247aとを備える。
【0121】
特徴量変換部246は、駅間単位の学習用データである第1の特徴量を第1の特徴量データベース27から読み出すことによって、第1の特徴量を取得する。特徴量変換部246は、取得された第1の特徴量を、設定された期間を単位とする第2の特徴量へ変換する。実施の形態2では、第2の特徴量は、日単位の特徴量とする。第2の特徴量は、日単位の特徴量に限られず、週単位または月単位の特徴量でも良い。第2の特徴量の単位とする期間には、任意の期間を設定することができる。
【0122】
第2の特徴量は、第2の特徴量データベース247に格納される。第2の特徴量データベース247は、類似データの判定において使用される特徴量である第2の特徴量が格納される類似判定用の特徴量データベースである。第2の特徴量データベース247におけるテーブルの各行には、日付データと、直近データであるか否かを示すラベルとが紐付けられる。第2の特徴量データベース247は、日単位のデータである第2の特徴量が格納される点を除いて、図1に示す特徴量データベース23と同様である。
【0123】
類似判定モデル生成部242Cは、第2の特徴量である過去データと、第2の特徴量である直近データとを第2の特徴量データベース247から読み出すことによって、第2の特徴量である過去データと第2の特徴量である直近データとを取得する。類似判定モデル生成部242Cは、第2の特徴量である過去データと第2の特徴量である直近データとを学習することによって類似判定モデルを生成する。
【0124】
類似データ判定部243Cは、第2の特徴量である過去データを第2の特徴量データベース247から読み出すことによって、第2の特徴量である過去データを取得する。類似データ判定部243Cは、類似判定モデルに基づいて、第2の特徴量である過去データから類似データを判定する。類似データ判定部243Cは、判定の結果を出力する。例えば、類似データ判定部243Cは、判定の結果として、類似データであるか否かを示すラベルを出力する。類似データ判定部243Cによる判定の結果は、第1の特徴量データベース27において学習用入力データであるか否かを示すラベルに反映される。
【0125】
図15は、実施の形態2にかかる運行予測装置20Cの特徴量変換部246における第1の特徴量から第2の特徴量への変換について説明するための図である。図15の左部には、第1の特徴量データベース27におけるテーブルのうち日付データの部分の例を示す。図15の右部には、第2の特徴量データベース247におけるテーブルのうち日付データの部分の例を示す。図15に示す白抜き矢印は、第1の特徴量が第2の特徴量へ変換されることを表す。
【0126】
第1の特徴量データベース27におけるテーブルは、図2および図8に示す場合と同様である。第1の特徴量データベース27におけるテーブルにおいて、第1の特徴量は、テーブルの各行に示される。第1の特徴量データベース27において同一の日付データが紐付けられている第1の特徴量が、第2の特徴量データベース247では1日ごとの学習用データである第2の特徴量にまとめられる。第2の特徴量データベース247におけるテーブルにおいて、第2の特徴量は、テーブルの各行に示される。なお、第2の特徴量の単位とする「日」は、0時を区切りとする期間ではなく、始発の列車10の運転開始時から最終の列車10の運転終了時までを単位とする期間とする。
【0127】
実施の形態2では、運行予測装置20Cは、駅間単位に相当する期間よりも長い期間を単位とする第2の特徴量に基づいて、過去データから類似データを判定する。イベントの開催または感染症の流行等といった事象は、日単位で、または1日よりも長い期間を単位として、列車10の運行または利用者の人流に影響を及ぼすことが考えられる。運行予測装置20Cは、このような影響を加味して、過去データからの類似データを判定が可能となる。
【0128】
次に、第2の特徴量の例について説明する。ここでは、第2の特徴量の例である2つの具体例について説明する。図16は、実施の形態2にかかる運行予測装置20Cにおいて類似データの判定に使用される第2の特徴量の第1の例について説明するための図である。第1の例は、駅間単位の学習用データを駅ごとおよび時間帯ごとのデータ群に変換し、データ群ごとにおけるデータの頻度を日単位の学習用データとする例である。
【0129】
図16に示す第1の例では、乗車率変動を値の大きさにより「小」、「中」、「大」の3つに分類し、駅ごとおよび時間帯ごとに「小」、「中」、「大」の各々に分類されたデータの頻度を第2の特徴量とする。図16に示す第1の例では、駅ごとおよび時間帯ごとに「小」、「中」、「大」の各々にデータが分類される。図16には、駅ごとおよび時間帯ごとにおけるデータの頻度を棒グラフにより表したヒストグラムを示す。図16には、「A駅」における8時台の乗車率変動について求めた頻度の分布と、「A駅」における9時台の乗車率変動について求めた頻度の分布との例を示す。特徴量変換部246は、各日の学習用データについて、このようなデータの分類と頻度の算出とを行うことによって、第1の特徴量を第2の特徴量へ変換する。なお、データの頻度とは、第1の特徴量データベース27の行ごとのデータの数とする。
【0130】
第1の例では、第2の特徴量は、駅ごと、および、時間帯ごとの利用者数を考慮した特徴量とされる。これにより、類似データ判定部243Cは、時差出勤を実践する利用者数などを加味して類似データを判定することができる。
【0131】
図17は、実施の形態2にかかる運行予測装置20Cにおいて類似データの判定に使用される第2の特徴量の第2の例について説明するための第1の図である。第2の例は、第1の特徴量における複数の項目の各値の特徴を基に、駅間単位の学習用データを複数のクラスタに分け、クラスタごとのデータの頻度を日単位の学習用データとする例である。
【0132】
図17に示す第2の例では、乗車率変動、および、遅延時間などといった2以上の項目の各々について、値の大きさにより「小」、「中」、「大」などと分類する。そして、項目ごとの値の特徴を表す当該分類を基に、乗車率変動「大」かつ遅延時間「大」のデータをクラスタ番号「1」のクラスタ、乗車率変動「中」かつ遅延時間「小」のデータをクラスタ番号「2」のクラスタ、などというように、駅間単位の学習用データを複数のクラスタに分ける。さらに、クラスタごとのデータの頻度を第2の特徴量とする。図17に示す第2の例では、学習用データをクラスタ番号「1」から「6」までの6個のクラスタに分けることとする。図17には、クラスタごとのデータの頻度を棒グラフにより表したヒストグラムを示す。
【0133】
図18は、実施の形態2にかかる運行予測装置20Cにおいて類似データの判定に使用される第2の特徴量の第2の例について説明するための第2の図である。図18には、第2の特徴量データベース247におけるテーブルの例を示す。第2の特徴量データベース247におけるテーブルにおいて、第2の特徴量であるクラスタごとの頻度は、テーブルの各行に示される。第2の特徴量データベース247には、1日ごとの学習用データである第2の特徴量がテーブルの各行にまとめられる。
【0134】
特徴量変換部246は、各日の学習用データについて、このようなクラスタリングと頻度の算出とを行うことによって、第1の特徴量を第2の特徴量へ変換する。なお、特徴量変換部246は、第1の特徴量の次元数を、主成分分析といった手法により削減し、次元数を削減してから、クラスタリングを行うこととしても良い。また、特徴量変換部246は、図16に示す第1の例と図17に示す第2の例とを組み合わせて、第1の特徴量を第2の特徴量へ変換しても良い。特徴量変換部246は、時間帯または駅ごとに学習用データをクラスタリングしても良い。特徴量変換部246は、学習用データの項目のうち任意の項目について値を分類し、クラスタリングを行うことができる。
【0135】
次に、実施の形態2にかかる運行予測装置20Cによる動作について説明する。ここでは、予測モデルを生成する学習時における動作のうち類似データの判定における動作について説明する。図19は、実施の形態2にかかる運行予測装置20Cにより類似データを判定するときにおける動作の手順の例を示すフローチャートである。
【0136】
ステップS31において、データ分別部241は、第1の特徴量データベース27に格納された第1の特徴量である学習用データを、過去データと直近データとに分別する。データ分別部241は、直近データに該当するか否かを示す値を第1の特徴量データベース27へ書き込むことにより、直近データに該当するか否かを示す値を学習用データに紐付ける。
【0137】
特徴量変換部246は、駅間単位の学習用データを第1の特徴量データベース27から読み出すことによって、駅間単位の学習用データを取得する。ステップS32において、特徴量変換部246は、駅間単位の特徴量を日単位の特徴量に変換し、日単位の特徴量である第2の特徴量を第2の特徴量データベース247に格納する。
【0138】
ステップS33において、類似判定モデル生成部242Cは、「直近データ」の列の値が「0」である過去データを第2の特徴量データベース247から読み出し、過去データをk個の分割データに分割する。また、類似判定モデル生成部242Cは、「直近データ」の列の値が「1」である直近データを第2の特徴量データベース247から読み出す。
【0139】
ステップS34において、類似判定モデル生成部242Cは、1つの分割データをテストデータとして、過去データのうちテストデータを除いた部分と直近データとを学習することによって類似判定モデルを生成する。類似判定モデル生成部242Cは、図10に示すステップS13の場合と同様に、類似判定モデルを生成する。
【0140】
ステップS35において、類似データ判定部243Cは、テストデータを類似判定モデルへ入力することによって、テストデータについての直近データとの類似度を求める。類似データ判定部243Cは、図10に示すステップS14の場合と同様に、類似度を求める。
【0141】
類似判定モデル生成部242Cおよび類似データ判定部243Cは、ステップS34およびステップS35を、全ての分割データをテストデータとする場合について実行する。すなわち、類似判定モデル生成部242Cおよび類似データ判定部243Cは、過去データのうちテストデータとする部分を順次変更しながら類似判定モデルの生成と類似度の算出とをk回繰り返す。
【0142】
ステップS36において、類似データ判定部243Cは、類似度が閾値以上である過去データを類似データと判定する。運行予測装置20Cは、ステップS36を終えると、図9に示すステップS5以降と同様の手順を進める。
【0143】
図20は、図19に示すステップS32における特徴量の変換についての詳細な手順の例を示すフローチャートである。ここでは、特徴量変換部246により、第1の特徴量を、図17に示す第2の例にかかる第2の特徴量へ変換する場合の動作について説明する。
【0144】
ステップS41において、特徴量変換部246は、駅間単位の特徴量をクラスタリングする。特徴量変換部246は、学習用データにおける2以上の項目の各々の値の特徴を基に、学習用データを複数のクラスタに分ける。ステップS42において、特徴量変換部246は、1つの日の学習用データにおける各クラスタの頻度を求める。
【0145】
ステップS43において、特徴量変換部246は、クラスタ別の頻度を表すヒストグラムを求めることによって、当該1つの日についての日単位の特徴量を生成する。ステップS44において、特徴量変換部246は、生成された日単位の特徴量を第2の特徴量データベース247に格納する。特徴量変換部246は、ステップS42からステップS44までを、過去データに紐付けられている全ての日について実行する。
【0146】
ステップS45において、特徴量変換部246は、直近データに該当するか否かを示す値を、第2の特徴量データベース247に格納された日単位の特徴量に紐付ける。運行予測装置20Cは、ステップS45を終えると、図19に示すステップS33へ手順を進める。
【0147】
実施の形態2によると、運行予測装置20Cは、過去データと直近データとを学習することによって類似判定モデルを生成し、類似判定モデルに基づいて過去データから類似データを判定する。運行予測装置20Cは、運行状況に影響を及ぼし得るより多くの項目が特徴量に含まれる場合でも、過去データから類似データを抽出することができる。また、運行予測装置20Cは、列車10の運行または利用者の人流へ影響が及ぶ期間に応じて、第2の特徴量の単位とする期間を任意に設定することができ、列車10の運行または利用者の人流への影響を加味して類似データを判定することができる。このため、運行予測装置20Cは、類似データの高精度な判定が可能となる。以上により、運行予測装置20C、運行管理装置30C、および運行管理システム100Cは、将来における列車10の運行状況を高精度に予測することができる、という効果を奏する。
【0148】
次に、実施の形態1または2にかかる運行予測装置20,20A,20B,20Cのハードウェア構成について説明する。図21は、実施の形態1または2にかかる運行管理システム100,100A,100B,100Cを構成する運行予測装置20,20A,20B,20Cのハードウェア構成例を示す図である。運行予測装置20,20A,20B,20Cは、処理回路80と入力部81と出力部84とを備えるコンピュータシステムにより実現される。処理回路80は、プロセッサ82およびメモリ83を備える。処理回路80は、プロセッサ82がソフトウェアを実行する回路である。
【0149】
運行予測装置20,20A,20B,20Cのデータ抽出部21、特徴量抽出部22、学習装置24,24C、および推論装置25の各部は、ソフトウェア、ファームウェア、またはソフトウェアとファームウェアとの組み合わせにより実現される。ソフトウェアまたはファームウェアはプログラムとして記述され、メモリ83に格納される。処理回路80では、メモリ83に記憶されたプログラムをプロセッサ82が読み出して実行することにより、運行予測装置20,20A,20B,20Cの各部の機能を実現する。すなわち、処理回路80は、運行予測装置20,20A,20B,20Cの処理が結果的に実行されることになるプログラムを格納するためのメモリ83を備える。メモリ83に記憶されたプログラムは、運行管理システム100,100A,100B,100Cの手順および方法をコンピュータに実行させる運行管理プログラムである。
【0150】
プロセッサ82は、CPU(Central Processing Unit)、処理装置、演算装置、マイクロプロセッサ、マイクロコンピュータ、プロセッサ、またはDSP(Digital Signal Processor)である。メモリ83は、例えば、RAM(Random Access Memory)、ROM(Read Only Memory)、フラッシュメモリ、EPROM(Erasable Programmable Read Only Memory)、EEPROM(登録商標)(Electrically Erasable Programmable Read Only Memory)といった、不揮発性または揮発性の半導体メモリである。入力部81は、運行予測装置20,20A,20B,20Cへ情報を入力するための装置である。出力部84は、運行予測装置20,20A,20B,20Cの外部へ情報を出力する。
【0151】
図1に示す運行管理装置30のうちのデータ収集装置32および対策処理部33と、図12に示す運行管理装置30Aのうちの対策処理部33と、図13に示す運行管理装置30Bの対策処理部33とは、図21に示す処理回路80と同様の構成により実現される。運行管理装置30,30A,30B,30Cのハードウェア構成には、通信を行う通信装置が含められる。
【0152】
学習装置24は、メモリ83に記憶された学習プログラムをプロセッサ82が読み出して実行することにより実現されても良い。学習プログラムは、コンピュータで実行可能なプログラムであって、学習装置24の動作を実行するためのプログラムである。学習プログラムは、学習装置24の手順および方法をコンピュータに実行させるものであるともいえる。
【0153】
図12に示すサーバ装置50と、図13に示すサーバ装置50Bのうちのデータ収集装置51とは、図21に示す処理回路80と同様の構成により実現される。サーバ装置50,50Bのハードウェア構成には、通信を行う通信装置が含められる。実施の形態1または2にかかる運行管理システム100,100A,100B,100Cのダイヤ作成装置40は、図21に示すハードウェア構成と同様のハードウェア構成により実現される。
【0154】
以上の各実施の形態に示した構成は、本開示の内容の一例を示すものである。各実施の形態の構成は、別の公知の技術と組み合わせることが可能である。各実施の形態の構成同士が適宜組み合わせられても良い。本開示の要旨を逸脱しない範囲で、各実施の形態の構成の一部を省略または変更することが可能である。
【0155】
以下、本開示の諸態様を付記としてまとめて記載する。
【0156】
(付記1)
列車の運行状況を示す運行データと前記列車を利用する利用者の人流の状況を示す人流データとを含む予測対象データを、前記列車から取得するデータ取得部と、
前記運行データおよび前記人流データを含む学習用データが過去データと前記過去データよりも後に取得された直近データとに分けられ、前記過去データのうち前記直近データに類似する類似データと前記直近データとを学習させた予測モデルを用いて、前記予測対象データから、将来における前記運行状況および前記人流の状況の少なくとも一方を予測する予測部と、
を備え、
前記類似データは、前記過去データおよび前記直近データを学習させた類似判定モデルを用いて、前記過去データのうち、前記直近データに類似すると判定されたデータである、
ことを特徴とする運行予測装置。
(付記2)
前記類似判定モデルは、前記過去データの一部である第1の部分と前記直近データとを学習することによって生成され、
前記過去データのうち前記第1の部分を除いた部分である第2の部分が前記類似判定モデルへ入力されることによって、前記過去データの前記第2の部分についての前記直近データとの類似度を求め、
前記類似データは、前記過去データの前記第2の部分のうち前記直近データに類似すると前記類似度に基づいて判定されたデータである、
ことを特徴とする付記1に記載の運行予測装置。
(付記3)
前記類似判定モデルは、前記過去データの一部である第1の部分と前記直近データの一部である第1の部分とを学習することによって生成され、
前記過去データのうち前記第1の部分を除いた部分である第2の部分と前記直近データのうち前記第1の部分を除いた部分である第2の部分とが前記類似判定モデルへ入力されることによって、前記過去データの前記第2の部分および前記直近データの前記第2の部分の各々についての前記直近データの前記第1の部分との類似度を求め、
前記類似データは、前記過去データの前記第2の部分について求めた前記類似度を閾値と比較することによって、前記過去データの前記第2の部分のうち前記直近データに類似すると判定されたデータである、
ことを特徴とする付記1に記載の運行予測装置。
(付記4)
前記閾値は、前記直近データの前記第2の部分について求めた前記類似度の分布を基に設定される、
ことを特徴とする付記3に記載の運行予測装置。
(付記5)
前記直近データを、取得された日時ごとのデータについて求めた前記類似度に基づいて分類し、分類されたデータについての頻度の分布を第1の分布とし、前記類似データと判定された前記過去データを、取得された日時ごとのデータの前記類似度に基づいて分類し、分類されたデータについての頻度の分布を第2の分布として、前記類似データと判定された前記過去データの一部を前記類似データから削除することによって、前記第2の分布を前記第1の分布に近づける調整を行う、
ことを特徴とする付記2から4のいずれか1つに記載の運行予測装置。
(付記6)
前記学習用データには、前記学習用データが取得された日時のデータが紐付けられており、日時の範囲が指定されることによって前記直近データの範囲が設定され、前記学習用データが取得された日時により前記過去データと前記直近データとを分別する、
ことを特徴とする付記1から5のいずれか1つに記載の運行予測装置。
(付記7)
前記列車から出力されるデータである機器データから前記予測対象データを抽出するデータ抽出部と、
前記列車が第1の駅を出発したときから、次の停車駅である第2の駅に前記列車が到着して当該第2の駅を前記列車が出発するまでの期間、または、前記列車が第1の駅に到着したときから、当該第1の駅を前記列車が出発して次の停車駅である第2の駅に前記列車が到着するまでの期間を単位として、前記予測対象データを単位ごとのデータへ変換することにより、駅間単位の前記予測対象データである特徴量を抽出する特徴量抽出部と、
を備え、
前記類似判定モデルへ入力される前記過去データと前記類似判定モデルへ入力される前記直近データとの各々において、前記過去データと前記直近データとを分けた結果を表す目的変数が前記特徴量に紐付けられる、
ことを特徴とする付記1から6のいずれか1つに記載の運行予測装置。
(付記8)
駅間単位の前記特徴量である第1の特徴量を、設定された期間を単位とする第2の特徴量へ変換する特徴量変換部、
を備え、
前記類似判定モデルは、前記第2の特徴量である前記過去データと前記第2の特徴量である前記直近データとを学習することによって生成され、
前記類似データは、前記第2の特徴量である前記過去データから判定される、
ことを特徴とする付記7に記載の運行予測装置。
(付記9)
付記1に記載の運行予測装置と、
前記運行予測装置によって出力される予測結果に応じた対策を策定する対策処理部と、
を備え、
前記運行予測装置は、将来における前記運行状況および前記人流の状況の少なくとも一方の前記予測結果を前記対策処理部へ出力する、
ことを特徴とする運行管理装置。
(付記10)
前記列車から出力されるデータである機器データを受信する通信部と、
受信された前記機器データを収集し、収集された前記機器データを前記運行予測装置へ出力するデータ収集装置と、
を備え、
前記運行予測装置は、前記予測対象データを前記機器データから抽出するデータ抽出部、
を備えることを特徴とする付記9に記載の運行管理装置。
(付記11)
付記9に記載の運行管理装置と、
前記列車の運行ダイヤを作成するダイヤ作成装置と、
を備え、
前記運行管理装置は、将来における前記運行状況および前記人流の状況の少なくとも一方の前記予測結果に応じた前記対策の情報を前記ダイヤ作成装置へ出力し、
前記ダイヤ作成装置は、前記対策の情報に基づいて前記運行ダイヤを作成する、
ことを特徴とする運行管理システム。
(付記12)
付記9に記載の運行管理装置と、
前記列車から出力されるデータである機器データを収集し、収集された前記機器データを前記運行管理装置へ出力するデータ収集装置と、
を備えることを特徴とする運行管理システム。
(付記13)
付記1に記載の運行予測装置と、
前記列車から出力されるデータである機器データを収集し、収集された前記機器データを前記運行予測装置へ出力するデータ収集装置と、
前記運行予測装置によって出力される予測結果に応じた対策を策定する運行管理装置と、
を備え、
前記運行予測装置は、将来における前記運行状況および前記人流の状況の少なくとも一方の前記予測結果を前記運行管理装置へ出力する、
ことを特徴とする運行管理システム。
(付記14)
列車の運行状況を示す運行データと前記列車を利用する利用者の人流の状況を示す人流データとを含む学習用データが、過去データと、前記過去データよりも後に取得された直近データとに分けられ、前記過去データのうち前記直近データに類似する類似データを判定する類似判定モデルを、前記過去データと前記直近データとを学習することによって生成する類似判定モデル生成部と、
前記類似判定モデルに基づいて前記過去データから前記類似データを判定する類似データ判定部と、
将来における前記運行状況および前記人流の状況の少なくとも一方を予測する予測モデルを、前記直近データと前記類似データとを学習することによって生成する予測モデル生成部と、
を備えることを特徴とする学習装置。
(付記15)
列車の運行状況を示す運行データと前記列車を利用する利用者の人流の状況を示す人流データとを含む予測対象データを、前記列車から取得するステップと、
前記運行データおよび前記人流データを含む学習用データを、過去データと前記過去データよりも後に取得された直近データとに分け、前記過去データのうち前記直近データに類似する類似データと前記直近データとを学習させた予測モデルを用いて、前記予測対象データから、将来における前記運行状況および前記人流の状況の少なくとも一方を予測するステップと、
を含み、
前記類似データは、前記過去データおよび前記直近データを学習させた類似判定モデルを用いて、前記過去データのうち、前記直近データに類似すると判定されたデータである、
ことを特徴とする運行予測方法。
(付記16)
列車の運行状況を示す運行データと前記列車を利用する利用者の人流の状況を示す人流データとを含む学習用データを、過去データと、前記過去データよりも後に取得された直近データとに分けるステップと、
前記過去データのうち前記直近データに類似する類似データを判定する類似判定モデルを、前記過去データと前記直近データとを学習することによって生成するステップと、
前記類似判定モデルに基づいて前記過去データから前記類似データを判定するステップと、
将来における前記運行状況および前記人流の状況の少なくとも一方を予測する予測モデルを、前記直近データと前記類似データとを学習することによって生成するステップと、
を含むことを特徴とする学習方法。
(付記17)
列車の運行状況を示す運行データと前記列車を利用する利用者の人流の状況を示す人流データとを含む予測対象データを、前記列車から取得するステップと、
前記運行データおよび前記人流データを含む学習用データを、過去データと前記過去データよりも後に取得された直近データとに分け、前記過去データのうち前記直近データに類似する類似データと前記直近データとを学習させた予測モデルを用いて、前記予測対象データから、将来における前記運行状況および前記人流の状況の少なくとも一方を予測するステップと、
をコンピュータに実行させる運行予測プログラムであって、
前記類似データは、前記過去データおよび前記直近データを学習させた類似判定モデルを用いて、前記過去データのうち、前記直近データに類似すると判定されたデータである、
ことを特徴とする運行予測プログラム。
(付記18)
列車の運行状況を示す運行データと前記列車を利用する利用者の人流の状況を示す人流データとを含む学習用データを、過去データと、前記過去データよりも後に取得された直近データとに分けるステップと、
前記過去データのうち前記直近データに類似する類似データを判定する類似判定モデルを、前記過去データと前記直近データとを学習することによって生成するステップと、
前記類似判定モデルに基づいて前記過去データから前記類似データを判定するステップと、
将来における前記運行状況および前記人流の状況の少なくとも一方を予測する予測モデルを、前記直近データと前記類似データとを学習することによって生成するステップと、
をコンピュータに実行させることを特徴とする学習プログラム。
【符号の説明】
【0157】
10 列車、11,31,52 通信部、20,20A,20B,20C 運行予測装置、21 データ抽出部、22 特徴量抽出部、23 特徴量データベース、23a,27a,34a,247a 記憶部、24,24C 学習装置、25 推論装置、26 モデル記憶部、27 第1の特徴量データベース、30,30A,30B,30C 運行管理装置、32,51 データ収集装置、33 対策処理部、34 運行ダイヤデータベース、40 ダイヤ作成装置、41 運行ダイヤ作成部、50,50B サーバ装置、80 処理回路、81 入力部、82 プロセッサ、83 メモリ、84 出力部、100,100A,100B,100C 運行管理システム、241 データ分別部、242,242C 類似判定モデル生成部、243,243C 類似データ判定部、244,251 データ取得部、245 予測モデル生成部、246 特徴量変換部、247 第2の特徴量データベース、252 推論部。
図1
図2
図3
図4
図5
図6
図7
図8
図9
図10
図11
図12
図13
図14
図15
図16
図17
図18
図19
図20
図21