(19)【発行国】日本国特許庁(JP)
(12)【公報種別】特許公報(B2)
(11)【特許番号】6903536
(24)【登録日】2021年6月25日
(45)【発行日】2021年7月14日
(54)【発明の名称】運行情報処理装置およびその処理方法
(51)【国際特許分類】
B61L 25/02 20060101AFI20210701BHJP
G06F 16/00 20190101ALI20210701BHJP
B61L 27/00 20060101ALI20210701BHJP
【FI】
B61L25/02 A
G06F16/00
B61L27/00 G
【請求項の数】7
【全頁数】16
(21)【出願番号】特願2017-185605(P2017-185605)
(22)【出願日】2017年9月27日
(65)【公開番号】特開2019-59348(P2019-59348A)
(43)【公開日】2019年4月18日
【審査請求日】2020年2月6日
(73)【特許権者】
【識別番号】000005108
【氏名又は名称】株式会社日立製作所
(74)【代理人】
【識別番号】110001689
【氏名又は名称】青稜特許業務法人
(72)【発明者】
【氏名】米原 三揮
(72)【発明者】
【氏名】川崎 健治
(72)【発明者】
【氏名】長谷川 敬祐
【審査官】
今井 貞雄
(56)【参考文献】
【文献】
特開平11−282913(JP,A)
【文献】
登録実用新案第3089328(JP,U)
【文献】
特開2005−145163(JP,A)
【文献】
特開2002−087268(JP,A)
(58)【調査した分野】(Int.Cl.,DB名)
B61L 25/00−25/08
(57)【特許請求の範囲】
【請求項1】
コンピュータを用いて、列車の運行情報を作成する運行情報処理装置であって、
列車の運行に関する指令指示ごとに該指令指示のテキストを格納する指令指示データベースと、
前記指令指示データベースから選択される少なくとも一部の運行情報を格納する入力済み運行情報データベースと、
前記運行情報の特徴を表す、予め決められた抽出モデルと、前記指令指示と前記入力済み運行情報との差分を表す差分モデルを管理するモデル管理部と、
前記指令指示データベースから、前記入力済み運行情報データベースに該当する運行情報が無い指令指示における該テキストから必要な項目を抽出して、運行情報を作成する運行情報予測部と、を有し、
前記運行情報予測部は、
前記抽出モデルと、抽出された前記項目の対象のテキストをもとに運行情報の候補を抽出し、各候補の組合せについて確からしさを計算し、前記各候補の確からしさのばらつきをもとに予測確信度を算出する第1の算出手段と、
第1の算出手段によって求められた前記予測確信度が所定の条件の場合、前記抽出対象テキストと、前記入力済み運行情報データベースに格納された運行情報に対応するテキストとの鉄道の路線構造にもとづく差分特徴ベクトルを算出し、該差分特徴ベクトルを基に類似度を算出する第2の算出手段と、
前記第2の算出手段によって算出された類似度の高い指令指示と、それに対応する運行情報と、前記指令指示データベースにある前記指令指示と、前記差分モデルを用いて、運行情報を作成する第3の算出手段と、
を有することを特徴とする運行情報処理装置。
【請求項2】
前記第2の算出手段は、前記予測確信度と閾値とを比較し、該比較の結果、前記予測確信度が該閾値以下の場合に、前記差分特徴ベクトルを基に類似度を算出し、
前記第3の算出手段は、前記類似度算出手段によって算出された類似度の高い類似運行情報と、該高い類似運行情報に対応する類似テキストとを選択し、前記類似テキストと前記抽出対象テキストとの差分を計算し、前記テキストの差分と前記差分モデルから、前記類似運行情報と前記抽出対象テキストに対応する運行情報との編集特徴ベクトルを算出し、該編集特徴ベクトルの要素について前記類似運行情報を適用して前記運行情報を作成することを特徴とする請求項1の運行情報処理装置。
【請求項3】
前記差分特徴ベクトルは、2つのテキストとその入力時刻に対し、路線上の駅の関係や、運用プロセスの時間的な変化に基づき予め定義された、差分関数と、差分関数ごとに定義された差分コストに基づき、
前記テキストのうち入力が早いテキスト1に対し、前記差分関数の一部を作用させたときに、もう一方のテキスト2との差が最小となるような差分関数の組合せであることを特徴とする請求項1の運行情報処理装置。
【請求項4】
前記編集特徴ベクトルは、2つの運行情報に対し、あらかじめ定義された各項目に対する編集関数に基づき、1つ目の運行情報から2つ目の運行情報へ編集する際の、前記編集関数の組合せであることを特徴とする請求項2の運行情報処理装置。
【請求項5】
前記差分モデルは、差分特徴関数と、編集特徴との関連の重みを要素とする行列であることを特徴とする請求項1の運行情報処理装置。
【請求項6】
列車の運行に関する指令指示ごとに該指令指示のテキストを格納する指令指示データベースと、前記指令指示データベースから選択される少なくとも一部の運行情報を格納する入力済み運行情報データベースと、を有し、
コンピュータのプログラム実行により、運行情報予測部が、前記指令指示データベースから、前記入力済み運行情報データベースに該当する運行情報が無い指令指示における該テキストから必要な項目を抽出して、運行情報を作成する運行情報処理方法であって、
前記コンピュータのプログラム実行により、モデル管理部が、前記運行情報の特徴を表す、予め決められた抽出モデルと、前記指令指示と前記入力済み運行情報との差分を表す差分モデルを管理するステップと、
前記運行情報予測部が、
前記抽出モデルと、抽出された前記項目の対象のテキストをもとに運行情報の候補を抽出し、各候補の組合せについて確からしさを計算し、前記各候補の確からしさのばらつきをもとに予測確信度を算出する第1の算出ステップと、
第1の算出ステップによって求められた前記予測確信度が所定の条件の場合、前記抽出対象テキストと、前記入力済み運行情報データベースに格納された運行情報に対応するテキストとの鉄道の路線構造にもとづく差分特徴ベクトルを算出し、該差分特徴ベクトルを基に類似度を算出する第2の算出ステップと、
前記第2の算出ステップによって算出された類似度の高い指令指示と、それに対応する運行情報と、前記指令指示データベースにある前記指令指示と、前記差分モデルを用いて、運行情報を作成する第3の算出ステップと、
を有することを特徴とする運行情報処理方法。
【請求項7】
前記第2の算出ステップは、前記予測確信度と閾値とを比較し、該比較の結果、前記予測確信度が該閾値以下の場合に、前記差分特徴ベクトルを基に類似度を算出し、
前記第3の算出ステップは、前記類似度算出手段によって算出された類似度の高い類似運行情報と、該高い類似運行情報に対応する類似テキストとを選択し、前記類似テキストと前記抽出対象テキストとの差分を計算し、前記テキストの差分と前記差分モデルから、前記類似運行情報と前記抽出対象テキストに対応する運行情報との編集特徴ベクトルを算出し、該編集特徴ベクトルの要素について前記類似運行情報を適用して前記運行情報を作成する
ことを特徴とする請求項6の運行情報処理方法。
【発明の詳細な説明】
【技術分野】
【0001】
本発明は、運行情報処理装置およびその処理方法に係り、特に列車の運行情報の作成処理に関するものである。
【背景技術】
【0002】
鉄道事業において、天候不良や車両故障等が発生すると、予め設定されたダイヤ通りに列車の運行ができず、一部の区間や期間において運行の見合わせや遅延が生じることがある。
【0003】
列車の運行状況を利用者(乗客等)に知らせるために、例えば、特許文献1に記載のように、鉄道の駅に設置された表示装置に、鉄道の異常区間や運行の状況等の情報を表示する案内システムが知られている。最近では、運行情報が配信システムを介してネット上に配信され、利用者はスマートフォン等の携帯端末を用いて最新の状況を知ることができる。
【0004】
ダイヤが乱れた場合、事業者は早急に運行計画を変更して列車の運行条件を切り替える必要がある。例えば、特許文献2には、列車ダイヤの計画変更に際して、計画変更の可否の入力に応答して、列車の運行予測の制約条件である列車の走行条件及び駅の設備条件を切り替えて、データベースの列車ダイヤ情報、列車の在線状況及び軌道回路情報を用いて列車の運行を予測する運転整理支援システムが開示されている。
【0005】
一方、列車の運行情報を利用者に知らせる案内システムにおいては、例えば特許文献1に記載のように、操作者が操作端末を用いて、列車情報や状況メッセージ等の情報を入力している。運行情報は時々刻々と変わるので、操作者はその度に運行情報を早急に入力する必要がある。運行情報の変更が頻繁になると、入力作業も増大して煩雑になる。
【先行技術文献】
【特許文献】
【0006】
【特許文献1】特開2017−124662公報
【特許文献2】特開2009−96221公報
【発明の概要】
【発明が解決しようとする課題】
【0007】
最近の鉄道網は広域化、複雑化しており、仮にある路線の1ヵ所で異常が発生してもその影響は広域化する。そのため運行が影響する路線や駅を想定して、複数の運行情報を同時に入力することが求められ、操作者の負担はさらに増す。
【0008】
本発明者らは、案内システム或いは配信システムにて利用者に提供される運行情報の作成処理において、操作者による運行情報の入力作業を出来るだけ減らす方法について検討した。その1つとして、管理者が発する運行状況、運行の変更等を含む全ての指令や情報を、文書のテキスト情報としてデータベースに記録しておき、その蓄積されたテキスト情報を基に、数理的処理を行って運行情報の候補を抽出するモデルを提唱する。
【0009】
因みに、特許文献1に記載の運転整理支援システムは、列車の走行条件や駅の設備条件を制約式として表現した数理モデルを用いて運行予測しているが、これは駅員が使用するダイヤを提示するものであり、一般の利用者へ提供することを想定していない。
【0010】
そこで、本発明の目的は、数理モデルを用いて、利用者に提供する運行情報を高精度に予測可能にし、かつ運行情報を求めるに際して操作者の入力作業の負担を軽減することができる運行情報処理装置および方法を提供することにある。
【課題を解決するための手段】
【0011】
本発明に係る運行情報処理装置は、好ましくは、コンピュータを用いて、列車の運行情報を作成する運行情報処理装置であって、
列車の運行に関する指令指示ごとに該指令指示のテキストを格納する指令指示データベースと、
前記指令指示データベースから選択される少なくとも一部の運行情報を格納する入力済み運行情報データベースと、
前記運行情報の特徴を表す、予め決められた抽出モデルと、前記指令指示と前記入力済み運行情報との差分を表す差分モデルを管理するモデル管理部と、
前記指令指示データベースから、前記入力済み運行情報データベースに該当する運行情報が無い指令指示における該テキストから必要な項目を抽出して、運行情報を作成する運行情報予測部と、を有し、
前記運行情報予測部は、
前記抽出モデルと、抽出された前記項目の対象のテキストをもとに運行情報の候補を抽出し、各候補の組合せについて確からしさを計算し、前記各候補の確からしさのばらつきをもとに予測確信度を算出する第1の算出手段と、
第1の算出手段によって求められた前記予測確信度が所定の条件の場合、前記抽出対象テキストと、前記入力済み運行情報データベースに格納された運行情報に対応するテキストとの鉄道の路線構造にもとづく差分特徴ベクトルを算出し、該差分特徴ベクトルを基に類似度を算出する第2の算出手段と、
前記第2の算出手段によって算出された類似度の高い指令指示と、それに対応する運行情報と、前記指令指示データベースにある前記指令指示と、前記差分モデルを用いて、運行情報を作成する第3の算出手段と、を有することを特徴とする運行情報処理装置、として構成される。
【0012】
さらに、本発明は上記運行情報処理装置による運行情報処理方法としても把握される。
【発明の効果】
【0013】
本発明によれば、数理モデルを用いて、利用者に提供する運行情報を高精度に予測可能にし、かつ運行情報を求めるに際して操作者の入力作業の負担を軽減することができる。
【図面の簡単な説明】
【0014】
【
図2】運行情報処理装置のハードウェア構成を示す図である。
【
図3】指令指示テーブル111の構成を示す図である。
【
図4】入力済み運行情報テーブル112の構成を示す図である。
【
図5】運行情報予測部120の処理フローを示す図である。
【
図6】差分特徴ベクトル及び類似度を算出する処理ステップ(1205)の詳細な処理フローを示す図である。
【
図7】差分関数テーブル132の構成を示す図である。
【
図8】差分特徴ベクトル180の構成を示す図である。
【
図10】差分特徴ベクトルと類似度を算出する処理ステップ(1211)の詳細な処理フローを示す図である。
【
図11】編集関数テーブル133の構成を示す図である。
【
図12】編集特徴ベクトル200の構成を示す図である。
【
図16】差分モデル学習部144の処理フローを示す図である。
【
図17】学習用指令指示テーブル141の構成を示す図である。
【
図18】学習用運行情報テーブル142の構成を示す図である。
【発明を実施するための形態】
【0015】
以下、図面を参照して、本発明に係る運行情報処理装置の好ましい実施形態について説明する。
【0016】
図1は、運行情報処理装置100のブロック図を示す。
運行情報処理装置100は、ネットワークを介して運行情報配信システム170に接続されて、運行情報処理配信システムを形成する。運行情報配信システム170にはネットワークを介して、駅に設置される大型表示パネルが接続され、更にはスマートフォンのような携帯端末が接続可能とされる。
【0017】
運行情報処理装置100は、予測データ管理部110と、運行情報予測部120と、モデル管理部130と、教師データ管理部140と、抽出モデル学習部143と、差分モデル学習部144と、表示入力部150と、運行情報テーブル160とを有する。各部の機能やテーブル構成については後で詳述する。
【0018】
本実施形態において、運行情報処理装置100は、例えば
図20に示すような、鉄道の路線構造を対象にした運行情報を処理する。処理の結果、「X駅とY駅間が運転見合わせ」とか、「車両交渉のためW駅からV駅間で遅延が発生」を表現するテキストや画像を、運行情報配信システム170は配信することができる。
【0019】
図2に、運行情報処理装置100のハードウェア構成を示す。
運行情報処理装置100は、例えばサーバ等のコンピュータによって構成される。サーバは、プログラムの実行によりデータ処理を行う処理部(CPU)201と、プログラムやデータを記憶するメモリ202と、各種データやデータベースを記憶する外部記憶装置のような記憶部203と、データや指示を入力する入力部204と、種々の情報を表示する表示部205と、ネットワークを通して外部と通信する通信部206と、を有する。入力部204は、操作者(入力者)がテキストや指示を入力できる例えばキーボードやマウス、及び音声入力手段を含む。表示部205は例えば液晶表示器である。入力部204と表示部205は、
図1の表示入力部150を実現する。
図1の各機能部は、処理部201がプログラムを実行することで実現される。
図1の各テーブルは記憶部203に格納される。
【0020】
次に、
図1における各機能部及び各テーブルについて説明する。
〈運行情報予測部120〉
運行情報予測部120は、運行情報処理装置100の中核を成す部位であり、予測データ管理部110が管理する入力済みの運行情報及び逐次与えられる指令指示と、モデル管理部130が管理する運行情報抽出モデル(以下単に抽出モデルという)131及び運行情報差分モデル(以下単に差分モデルという)134を用いて運行情報を作成する。運行情報の作成に際しては、表示入力部150との間で関係する情報の入出力を行う。なお、運行情報予測部120による運行情報の処理については、
図5のフローチャートを参照して後述する。
作成された運行情報は運行情報テーブル160(
図14参照)へ送られてそこに記憶される。運行情報テーブル160に登録された情報は、運行情報配信システム170を介して、大型表示パネルや携帯端末等へ提供される。
【0021】
ここで、運行情報テーブル160は、
図14に示すように、運行情報ID1601と、指令指示ID(1602)と、路線(1603)と、開始駅(1604)と、終了駅(1605)と、原因(1606)と、状況(1607)、の各項目から構成される。
【0022】
〈表示入力部150〉
表示入力部150は、駅の担当管理者が操作する入出力機能であり、運行情報予測部120が処理した情報を画面情報として表示する表示インターフェースとしての類似選択UI(152)と、入力インターフェースとしての入力UI(151)を備えている。入力UI(151)はまた、予測データ管理部110で使用される運行情報や指令指示を含む情報、及び教師データ管理部140で使用される運行情報や指令指示を含む情報を入力する。指令指示は音声による指示の場合があり、そのときは音声がテキストに変換される。
【0023】
〈予測データ管理部110〉
予測データ管理部110は、運行情報予測部120で使用される入力済み運行情報及び指令指示をそれぞれテーブル111,112に格納して管理する。これらの情報や指示は、入力UI(151)から入力される。指令指示とは、運行情報に対する作成や変更等の指示である。
【0024】
指令指示テーブル111は、
図3に示すように、指令指示を識別する指令指示ID(1111)と、指示内容を表すテキスト(1112)、指示が与えられた時刻を示す日時(1113)の各項目から構成される。テキスト(1112)は、例えば駅の指令管理者が発した音声としての指令をマイクなどの音声取得手段によって収集し、音声認識技術を用いてテキスト化したものである。指令指示がキーボード等の入力手段によって文字入力される場合には入力されたテキストデータそのものがテキストとなる。
【0025】
入力済み運行情報テーブル112は、
図4に示すように、入力済み運行情報ID(112)と、指令指示ID(113)と、路線(1123)と、開始駅(1124)と、終了駅(1125)と、原因(1126)と、状況(1127)、の各項目から構成される。
入力済み運行情報テーブル112は、指令指示テーブル111に格納されたテキストから必要な項目を抽出したものが登録される。
【0026】
〈モデル管理部130〉
モデル管理部130は、運行情報予測部120が運行情報を予測するときに用いられる予測モデルを管理する。すなわち、モデル管理部130は、教師データ管理部140で管理される学習用の運行情報及び指令指示を基に、モデル学習部143、144で作成される予測モデルを管理する。本実施形態において予測モデルとして、抽出モデル131と差分モデル134が用意され、それらは差分関数テーブル132と編集関数テーブル133に格納して管理される。
【0027】
ここで、抽出モデル131は、
図19に示すように、要素ID1311と、値1312の各項目から構成される。w1からwMのM個の特徴ベクトルと、各特徴ベクトルに対する重み1312で表される。
【0028】
運行情報差分モデル134は、
図13に示すように、要素ID134と、差分関数1342と、編集関数1343と、重み1344の各項目から構成される。差分モデルの各レコードは、差分関数と、編集関数との関連度を示す。例えば、要素ID=W11のレコードは、差分関数=F1、編集関数=E1の関連度が0.7であることを示す。すなわち、指令指示のテキストにおいて、“replace(八重, 多町)”の差分が発生した場合に、0.7の強さで、運行情報において、”replace(開始駅,八重,多町)”という操作が想起されることを示す。
【0029】
差分関数を格納する差分関数テーブル132は、
図7に示すように、差分関数ID(1321)と、差分関数(1322)と、差分コスト(1323)、の各項目から構成される。差分関数(1322)は、指令指示のテキストに対する操作を表す。例えば、差分関数ID=F1のレコードの差分関数 “replace(八重, 多町)”は、指令指示のテキストに含まれる”八重”というキーワードを”多町”に置換する操作を意味する。また、差分コスト(1323)にはその操作を行うコストをあらかじめ定義する。例えば、差分関数 “replace(八重, 多町)”は、八重と多町の駅が路線構造上近く、類似する指令指示間で良く発生する操作であるとみなし、コストを低く設定する。反対に、差分関数ID=F2の差分関数“replace(八重, 鶴屋)”は、駅が離れているため、類似する指令指示では発生しにくい操作であるとみなし、コストを高く設定する。差分コストは、上記路線構造の他にも、運用プロセス上の傾向をもとに設定しても良い。例えば差分関数ID=F4の差分関数“emerge(復旧)”は、類似する指令指示を比較して、”復旧”というキーワードが出現したことを表す。これは、例えば車両故障から復旧した場合に指令指示のテキストに現れることがある。この時の差分コストは、類似する指令指示の時間差と、過去の車両故障発生から復旧まで時間との乖離を差分コストとしても良く、
図7で、“abs(t2−t1−復旧時間平均)/復旧時間標準偏差”とあるように、類似する指令指示の日時t1,t2の差と、過去の事例からあらかじめ算出した復旧時間の平均と偏差とを用いて乖離度を算出し、差分コストとしてもよい。このほかにも、例えば復旧時間の確率密度関数をあらかじめ算出しておき、t2−t1の確率密度を差分コストとしても良い。
【0030】
編集関数を格納する編集関数テーブル133は、
図11に示すように、差分関数ID1331と、差分関数1332、の各項目から構成される。差分関数は、運行情報を変化させるときの操作をあらかじめ定義する。例えば、差分関数ID=E1の差分関数”replace(開始駅,八重, 多町)”は、運行情報の開始駅を、八重から多町に置換することを表す。また、差分関数ID=E5の差分関数”delete(運行情報)”は、当該運行情報に係る異常が収束し、平常運転に戻った際に、運行情報を削除する操作を表す。
【0031】
編集特徴ベクトル200は、
図12に示すように、要素ID2001と、値2002、の項目から構成される。編集特徴ベクトルの要素数は、編集関数テーブル133の要素数と一致し、各レコードは、編集関数テーブルのレコードと1対1で対応する。値201は、0以上の値が格納され、運行情報に対し対応する編集関数を作用させる確率を表す。例えば、
図12では、要素ID=E1の値が0.7となっており、運行情報を作成するステップ(1211)において閾値を0.5以上に設定した場合には、対応する編集関数”replace(開始駅,八重,多町)”を作用させることを示す。
【0032】
〈教師データ管理部140〉
教師データ管理部140は、予測モデルを作成するための原情報となる教師データを管理するため、主にデータベース機能を有する。教師データとして、学習用指令指示テーブル141と、学習用運行情報テーブル142を保持する。
【0033】
学習用指令指示テーブル141は、
図17に示すように、学習用指令指示ID(1411)と、テキスト(1412)と、日時(1413)の各項目から構成される。学習用指令指示テーブル141は、指令指示テーブル111の内容と同じであるが、前者は過去に受けた指令指示の情報を学習用として用いている。
【0034】
学習用運行情報テーブル142は、
図18に示すように、学習用運行情報ID(1421)と、学習用指令指示ID(1422)と、路線(1423)と、開始駅(1424)と、終了駅(1425)と、原因(1426)と、状況(1427)の各項目から構成される。学習用運行情報テーブル142は、入力済み運行情報テーブル112の内容と同じであるが、前者は過去に対応した運行情報を学習用として用いている。
【0035】
〈差分モデル学習部144〉
差分モデル学習部144は、学習用運行情報テーブル141及び学習用指令指示テーブル142の情報を用いて、差分モデル134(
図13参照)を作成する処理を行う。この処理の詳細については、
図16を参照して後述する。
【0036】
〈抽出モデル学習部143〉
抽出モデル学習部143は、学習用運行情報テーブル141及び学習用指令指示テーブル142を参照して、何れ路線の、何れ駅で、どのような故障があるかについてそれらの特徴を抽出して、重みを付与した1又は複数の特徴ベクトルとして表した抽出モデル131を作成する処理を行う。
【0037】
次に、
図5を参照して、運行情報予測部120の処理動作について説明する。
運行情報予測部120は、指令指示テーブル111に新たな指令指示Xが追加されると、その入力された指令指示Xの各項目の組合せについて特徴ベクトルを作成して、その特徴ベクトルと抽出モデル131(
図19参照)の値1312の内積を計算する(1201)。そして、各候補について確からしさを算出し、抽出予測確信度を算出する(1202)。ここで確信度とは、1つの問いに対して複数の正解の候補がある場合、その中からどれだけの確信をもって正解を選んでいるかを示す指標である。確信度は、例えば、最も確からしさの高い公報と、2番目に確からしさの高い候補との、確からしさの差として計算できる。
【0038】
そして、算出された抽出予測確信度と閾値とを比較して(1203)、抽出予測確信度が閾値以下でない(閾値超)場合には(1203:N)、予測スコアの最も高い候補を運行情報として運行情報テーブル160に追加する(1204)。一方、抽出予測確信度が閾値以下の場合には(1203:Y)、入力済み運行情報テーブル112の入力済み運行情報に対応する、指令指示テーブル111における指令指示ID(1111)のテキスト1112のそれぞれについて、指令指示Xのテキストとの差分特徴ベクトル180を算出し、類似度190を計算する(1205)。類似度190については
図9を参照して後述する。
【0039】
そして、計算した類似度180と閾値とを比較して(1206)、類似度180が閾値以上の指令指示がなかった場合は(1206:N)、操作者(入力者)に運行情報の各項目を入力させる。そして、入力された各項目を、運行情報テーブル160と、入力済み運行情報テーブル112と、学習用運行情報テーブル142に書き込む(1207)。一方、類似度180が閾値以上の指令指示があった場合(1206:Y)、類似度180が閾値以上の指令指示の類似度のばらつきから、類似予測確信度を算出する(1208)。そして、算出された類似予測確信度と閾値との比較から、類似予測確信度が閾値以上でない場合(1209:N)、類似選択UI(152)及び入力UI(151)を介して、入力者に類似度が高い指令指示および運行情報の候補を提示して、類似する指令指示を選択させる(1210)。一方、類似予測確信度が閾値以上の場合は(1209:Y)、類似度のもっとも高い指令指示と、それに対応する運行情報と、指令指示Xと、差分モデルを用いて、運行情報を作成する(1211)。作成された運行情報は、運行情報テーブル160に格納される。
【0040】
図6は、上記の運行情報の予測処理における、差分特徴ベクトル及び類似度を算出する処理ステップ(1205)の詳細を示す処理フローの例である。
運行情報予測部120は、指令指示テーブル111にある指令指示Xのテキストを構文解析して、構文木を算出する(12051)。そして、入力済み運行情報テーブル112を参照して、各レコードを取り出し(12052)、各レコードに対応する指令指示(入力済み指令指示)を、指令指示テーブル111から取り出して(12053)、入力済み指令指示のテキストを構文解析して構文木を算出する(12054)。そして、指令指示Xの構文と、入力済み指令指示の構文木とを比較して、差分特徴ベクトル180を算出する(12055)。その後、差分特徴ベクトルと差分関数テーブル132の差分コストを基に類似度190を算出する(12056)。類似度190は、例えば差分特徴ベクトルと、前記差分コストを要素に持つ差分コストベクトルとの内積の逆数で求められる。
【0041】
図8は、上記の運行情報の予測処理における、差分特徴ベクトルと類似度とを算出する処理ステップ(1205)によって算出される差分特徴ベクトル180の一例である。
差分特徴ベクトル180は、要素ID181と、値182の項目から構成される。差分特徴ベクトルの要素数は、差分関数テーブル132の要素数と一致し、各レコードは、差分関数テーブル132のレコードと1対1で対応する。値182には「1」又は「0」が格納される。ここで、前記類似指令指示のテキストを前記指令指示Xのテキストに近づける際に、各差分関数を作用させる場合は「1」、作用させない場合は「0」で表す。例えば、
図8では、要素ID=F1のレコードは、値が「1」のため、差分関数テーブル132における、差分関数ID=F1の差分関数”replace(八重, 多町)”を作用させることを表し、要素ID=D2のレコードは、値が「0」のため、差分関数ID=F2の差分関数” replace(八重, 鶴屋)”を作用させないことを表す。
【0042】
図9は、上記の運行情報の予測処理における、差分特徴ベクトルと類似度とを算出する処理ステップ(1205)によって算出される類似度190の一例である。類似度190は、入力済み運行情報ID191と、類似度192の項目から構成される。
【0043】
図10は、上記の運行情報の予測処理における、差分特徴ベクトルと類似度とを算出する処理ステップ(1211)の詳細を示す処理フローの例である。
この処理1211は、類似度の最も高い指令指示と、それに対応する類似運行情報と、指令指示Xと、差分モデルとを用いて運行情報を作成する処理である。運行情報予測部120は、上記のように算出された差分特徴ベクトル180と、差分モデル134の行列積を行い、編集特徴ベクトル200を算出する(12111)。そして、算出された編集特徴ベクトル200の各要素について、特徴量が閾値以上の要素に対応する編集関数のうち、適用可能なものを類似運行情報に適用し、運行情報を作成する(12112)。作成された運行情報は、運行情報テーブル160に格納される。
【0044】
図15は、運行情報処理装置100の表示入力部150における画面表示の例を示す。この画面表示は、表示入力部150の類似選択UI(152)を介して表示される。運行情報予測部120が、操作者に類似度が高い指令指示および運行情報の候補を提示し、類似する指令指示を選択させるために表示する画面である。画面表示において、上部画面1521には、類似度が閾値以上の運行情報と、その類似度が路線図上に表示される。路線図の強調表示された区間が選択対象となる。下部画面1522には、指令指示された運行情報の時間ごとに、テキストや関係する駅、原因、状況、類似度等が表形式で表示される。操作者が、選択キー1523を操作すると、その対応する運行情報が選択されて、入力UI151を介して、運行情報予測部120へ送られる。
【0045】
図16は、差分モデル学習部143の処理フローを示す。
この処理は、教師データ管理部140が、学習用指令指示テーブル141と、学習用運行情報テーブル142を用いて、差分モデルを算出し、運行情報差分モデルテーブル134に格納するまでの一連の動作である。
【0046】
差分モデル学習部143は、予測モデルの重み行列Wを適当な値で初期化し、学習回数tを「1」で初期化する(14401)。そして、学習用指令指示テーブル141からランダムに2つレコード(X1,X2)を取り出して(14402)、X1とX2のテキストの類似度を計算する(14403)。そして、類似度と閾値との比較関係において、類似度が閾値以上でないの場合は(14404:N)、ステップ14402に戻る。一方、類似度が閾値以上の場合(14404:Y)は、学習用運行情報テーブル142からX1とX2に対応する学習用運行情報(Y1, Y2)をそれぞれ取り出して(14405)、X1とX2の差分特徴ベクトルDXと、Y1とY2の編集特徴ベクトルEYをそれぞれ計算する(14406)。そして、DX,EY,Wをもとに損失を計算し、Wを更新する(14407)。そして、tにt+1を代入し、t≧Tでない場合には14402に戻り、t≧Tの場合は(14409)、Wを運行情報差分モデルテーブル134に格納する(14410)。
【0047】
以上説明したように、本実施形態によれば、数理モデルを用いて、利用者に提供する運行情報を高精度に予測することが可能となる。
類似するデータが複数入力された場合、最初のデータについて予測確信度が低いと、操作者による手入力の作業が必要となる。この情報を用いてモデルを再学習することでモデルの精度は向上するが、その改善は漸近的であるため、続く類似データに対しても同様に予測確信度が低く、操作者は連続して手入力が必要となり、作業負担増となる。これは、教師データが真の分布に対して偏りがある場合に発生する。本実施形態によれば、教師データに偏りがある場合にも、操作者の負担を軽減することができる。
【0048】
なお、本発明は上記実施形態に限定されずに、種々変形、応用して実施し得る。また、上記実施形態で用いられた用語は一例であってその趣旨を逸脱しない範囲で変形、或いは別の用語ものものでも実施し得る。
例えば、上記実施形態では種々のテーブルを用いているが、これらをテーブルと呼ばないで、データベース(DB)或いは単にその情報自体で呼んでもよい。
【符号の説明】
【0049】
100:運行情報処理装置 110:予測データ管理部
120:運行情報予測部 130:モデル管理部
140:教師データ管理部 143:抽出モデル学習部
144:差分モデル学習部 150:表示入力部
111:指令指示テーブル 112:入力済み運行情報テーブル
131:抽出モデル 132:差分関数テーブル
133:編集関数テーブル 134:差分モデル
141:学習用指令指示テーブル 142:学習用運行情報テーブル
160:運行情報テーブル 180:差分特徴ベクトル
200:編集特徴ベクトル