(19)【発行国】日本国特許庁(JP)
(12)【公報種別】公開特許公報(A)
(11)【公開番号】P2023086112
(43)【公開日】2023-06-21
(54)【発明の名称】情報処理装置
(51)【国際特許分類】
G08G 1/00 20060101AFI20230614BHJP
G16Y 10/40 20200101ALI20230614BHJP
G16Y 20/20 20200101ALI20230614BHJP
G16Y 40/20 20200101ALI20230614BHJP
【FI】
G08G1/00 A
G16Y10/40
G16Y20/20
G16Y40/20
【審査請求】未請求
【請求項の数】7
【出願形態】OL
(21)【出願番号】P 2022193146
(22)【出願日】2022-12-01
(31)【優先権主張番号】P 2021200194
(32)【優先日】2021-12-09
(33)【優先権主張国・地域又は機関】JP
(71)【出願人】
【識別番号】510080727
【氏名又は名称】株式会社グリッド
(71)【出願人】
【識別番号】507194017
【氏名又は名称】株式会社高速道路総合技術研究所
(71)【出願人】
【識別番号】505398941
【氏名又は名称】東日本高速道路株式会社
(71)【出願人】
【識別番号】505398952
【氏名又は名称】中日本高速道路株式会社
(71)【出願人】
【識別番号】505398963
【氏名又は名称】西日本高速道路株式会社
(74)【代理人】
【識別番号】100190621
【弁理士】
【氏名又は名称】崎間 伸洋
(74)【代理人】
【識別番号】100212510
【弁理士】
【氏名又は名称】笠原 翔
(72)【発明者】
【氏名】若槻 祐貴
(72)【発明者】
【氏名】建部 順平
(72)【発明者】
【氏名】▲刑▼ 健
【テーマコード(参考)】
5H181
【Fターム(参考)】
5H181AA01
5H181BB04
5H181BB12
5H181BB13
5H181BB20
5H181CC04
5H181CC11
5H181CC27
5H181DD01
5H181DD03
5H181EE02
5H181EE07
5H181EE12
5H181FF10
5H181FF13
5H181FF22
5H181FF27
5H181FF33
5H181LL01
5H181LL02
5H181LL04
5H181LL11
5H181MC27
(57)【要約】
【課題】道路で発生する交通事故の予測精度を向上させること。
【解決手段】説明変数の候補を選定し、交通事故の予測に実際に用いる説明変数の少なくとも一つを、選定した候補のうちから選定する。この選定のために、道路管理会社DKから提供される、トラフィックカウンターデータTC等の交通情報を用いた統計的検定処理S1を実行する。それにより、他の候補、或いは選定済みの説明変数との関連性を確認し、その確認結果を検討し、候補のうちから説明変数を選定する。選定した説明変数の有効性の確認のために、更に精度検証処理S2が実行される。これにより、有効性が確認できた場合に、候補のうちから選定した説明変数を用いて交通事故を予測する交通事故予測モデルの構築MKが行われる。
【選択図】
図1
【特許請求の範囲】
【請求項1】
対象道路における対象区間での交通事故の予測に用いられる、事故発生間隔を含む複数の説明変数の内容を表す説明変数情報群を取得する情報取得手段と、
前記情報取得手段により取得された前記説明変数情報群を用いて、前記対象区間での前記交通事故の予測を行う事故予測手段と、
を備える情報処理装置。
【請求項2】
前記事故予測手段は、前記対象区間での車両の交通状態を第1の状態、及び前記第1の状態より交通量が多い第2の状態のうちの何れかに分類し、前記交通状態が前記第2の状態と分類した場合に、前記事故発生間隔を用いた前記交通事故の予測を行う、
請求項1に記載の情報処理装置。
【請求項3】
前記事故予測手段は、前記対象区間に複数の車線が存在し、且つ前記複数の説明変数が車線毎に与えられている場合、前記車線毎に、前記交通状態を前記第1の状態、及び前記第2の状態のうちの何れかに分類し、前記交通事故の予測を行う、
請求項2に記載の情報処理装置。
【請求項4】
前記情報取得手段は、前記事故発生間隔の他に、時間帯を含む前記複数の説明変数の内容を表す前記説明変数情報群を取得する、
請求項1~3の何れか1項に記載の情報処理装置。
【請求項5】
前記事故予測手段は、対数尤度の算出により、前記交通事故の予測を行う、
請求項1~4の何れか1項に記載の情報処理装置。
【請求項6】
情報処理装置に、
対象道路における対象区間での交通事故の予測に用いられる、事故発生間隔を含む複数の説明変数の内容を表す説明変数情報群を取得させ、
取得された前記説明変数情報群を用いて、前記対象区間での前記交通事故の予測を行わせる、
処理を実行させるプログラム。
【請求項7】
道路で発生する交通事故の予測に用いる説明変数の候補を一つ以上、選定し、
選定した前記候補毎に、統計的検定法を用いて、交通事故発生との関係性を評価し、
前記候補別に評価した前記関係性に基づいて、前記交通事故の予測に用いる前記説明変数を一つ以上の前記候補のうちから選定する、
説明変数選定方法。
【発明の詳細な説明】
【技術分野】
【0001】
本発明は、情報処理装置に関する。
【背景技術】
【0002】
従来より、予測モデルを用いて交通事故の起こりやすさを予測する技術が提案されている(例えば、特許文献1)。また、近年では、上述の予測モデルとして、交通情報(速度、交通量、時間占有率等)を入力情報として、予測時点直後の特定道路区間における事故の起こりやすさを予測するCNN(Convolutional Neural Network)モデルを用いる技術も提案されている(例えば、非特許文献1参照)。
【先行技術文献】
【特許文献】
【0003】
【非特許文献】
【0004】
【非特許文献1】Tsubota, T., Yoshii, Y., Xing, J., “Prediction of Traffic Accident Likelihood on Intercity Expressway by Convolutional Neural Network” Intelligence, Informatics and Infrastructure, 2020, vol. 1-1, pp. 11-17.
【発明の概要】
【発明が解決しようとする課題】
【0005】
しかしながら、交通情報を表す説明変数のみを使用したCNNモデルでは、予測モデルとしての精度が十分ではなく、交通事故予測モデルの精度向上に効果的な説明変数の選定には改善の余地があった。
【0006】
本発明は、このような状況に鑑みてなされたものであり、道路で発生する交通事故の予測精度を向上させることを目的とする。
【課題を解決するための手段】
【0007】
本開示の一態様の情報処理装置は、対象道路における対象区間での交通事故の予測に用いられる、事故発生間隔を含む複数の説明変数の内容を表す説明変数情報群を取得する情報取得手段と、前記情報取得手段により取得された前記説明変数情報群を用いて、前記対象区間での前記交通事故の予測を行う事故予測手段と、を備える。
【0008】
本開示の一態様の説明変数選定方法は、道路で発生する交通事故の予測に用いる説明変数の候補を一つ以上、選定し、選定した前記候補毎に、統計的検定法を用いて、交通事故発生との関係性を評価し、前記候補別に評価した前記関係性に基づいて、前記交通事故の予測に用いる前記説明変数を前記一つ以上の前記候補のうちから選定する。
【発明の効果】
【0009】
本発明によれば、道路で発生する交通事故の予測精度を向上させることができる。
【図面の簡単な説明】
【0010】
【
図1】本発明が適用された交通事故予測モデルを構築する方法の一例を説明する図である。
【
図2】説明変数の選定のために想定した調査対象の例を説明する図である。
【
図3】平均交通量と空間平均速度の関係例を示す散布図である。
【
図4】統計的検定処理の例を示すフローチャートである。
【
図5】各候補に対してカイ二乗検定を行った結果の例を説明する図である。
【
図6】構築した提案モデルの例を示す概念図である。
【
図8】提案モデルで交通事故の予測を行った場合に、各区間で算出されたF1スコア、適合率、再現率の各値の例を示す図である。
【
図9】提案モデルとベースモデルの各F1スコアの例を区間別に示す図である。
【
図10】提案モデルで交通事故の予測を行った場合に、1日を複数の期間に分け、算出されたF1スコア、適合率、再現率の各値の例を期間別に示す図である(区間1)。
【
図11】提案モデルで交通事故の予測を行った場合に、1日を複数の期間に分け、算出されたF1スコア、適合率、再現率の各値の例を期間別に示す図である(区間2)。
【
図12】提案モデルで交通事故の予測を行った場合に、1日を複数の期間に分け、算出されたF1スコア、適合率、再現率の各値の例を期間別に示す図である(区間3)。
【
図13】提案モデルで交通事故の予測を行った場合に、1日を複数の期間に分け、算出されたF1スコア、適合率、再現率の各値の例を期間別に示す図である(区間4)。
【
図14】説明変数の組み合わせによる予測精度の差を確認した結果の例を説明する図である。
【
図15】本発明の情報処理装置の一実施形態に係るAPサーバが設置された環境の一例を説明する図である。
【
図16】本発明の情報処理装置の一実施形態に係るAPサーバのハードウェア構成の一例を示すブロック図である。
【
図17】本発明の情報処理装置の一実施形態に係るAPサーバ上に実現される機能的構成の一例を示す機能ブロック図である。
【
図18】NICEモデルによる交通事故の予測を行う仕組みの例を説明する図である。
【発明を実施するための形態】
【0011】
以下、本発明を実施するための形態について、図を参照しながら説明する。なお、以下に説明する実施形態は、あくまでも一例であって、本発明の技術的範囲はこれに限られるものではない。本発明の技術的範囲には、様々な変形例も含まれる。
【0012】
図1は、本発明が適用された交通事故予測モデルを構築する方法の一例を説明する図である。
この交通事故予測モデルは、車両D、例えば自動二輪車を含む各種自動車等が通行する道路で発生する交通事故を予測するためのモデルである。本実施形態では、CNNを用いて構築することが想定されている。
【0013】
交通事故の予測は、対象道路DRの対象区間を想定して行われる。そのために、対象道路DRの対象区間で収集された情報が用いられる。この情報の収集を想定しているために、交通事故の予測を行う対象区間としては、車両感知器SKが設置された場所を2つ以上、含む区間が選択される。
【0014】
図1で想定される対象道路DRの対象区間は、片側3車線LNの道路である。車両感知器SKは、車線LN毎に設置されている。その車両感知器SKは、例えば超音波送受器を用いたものであり、超音波を路面に向けて間欠的に発射するようになっている。そのため、車両感知器SKは、反射波が入射するタイミングの違いにより、車両Dの有無だけでなく、車両Dの車高、長さも特定可能なものとなっている。車両Dの種類(車種)等は、車高、長さにより判断可能である。
【0015】
各車両感知器SKは、例えば道路交通の安全と円滑のための交通管理用に設置されたものである。各車両感知器SKにより得られた情報は、交通事故の防止、渋滞の解消等の役割を有する道路管理会社DKにも提供される。道路管理会社DKは、各車両感知器SKにより得られた情報を処理して、トラフィックカウンターデータTCを含む各種データを生成する。
【0016】
トラフィックカウンターデータTCには、交通量、車両Dの速度の他に、時間占有率(OCC)等が含まれる。時間占有率は、全体の時間のうちに車両Dが感知された時間が占める比率を表す情報である。トラフィックカウンターデータTCは、以降「トラカンデータTC」と略記する。
道路管理会社DKには、その役割から、交通事故に関する情報、気象(天候)情報等が提供される。交通事故に関する情報は、警察、監視カメラ等から収集される。
【0017】
本実施形態では、道路管理会社DKにより提供可能なデータを説明変数として用いることを想定している。このことから、本実施形態では、道路管理会社DKにより提供可能なデータを想定して、説明変数(独立変数)の候補を選定し、選定した候補のうちから、交通事故予測モデルに実際に用いる説明変数を選定する。
図1には、説明変数の候補として、天候、曜日、休日、速度、交通量、時間帯、事故発生間隔、時間占有率等が選定されたことを示している。
【0018】
選定した候補のうちからの説明変数の選定には、統計的検定法が用いられる。ここでの統計的検定処理S1は、統計的検定法により、交通事故発生との関係性を候補別に確認するために行われる処理である。本実施形態では、統計的検定法として、カイ二乗検定を採用している。なお、統計的検定法としては、カイ二乗検定に限定されない。
【0019】
説明変数の選定に統計的検定法を用いるのは、以下の理由からである。
交通事故の多くは、運転者の不注意、或いは速度超過等が原因である。しかし、各運転者や各車両Dのリアルタイムの情報を得るのは非常に困難である。このことから、交通事故の予測精度の向上のためには、交通事故前の特性を間接的に表現するデータを交通事故の予測に用いることが考えられる。
【0020】
交通事故は、それぞれ固有の状況下で発生すると考えられる。その状況の特徴を推定するためには、大量の事故データが必要となる。しかし、交通事故の発生頻度は比較的に低く、大量の事故データが得られる可能性は非常に低いのが実情である。
【0021】
交通事故が発生した状況は、複数の説明変数を用いて分類することが可能である。しかし、説明変数の数が増えるほど、複数の説明変数で分類される状況下で発生した交通事故の数は少なくなって、必要な事故データが得られる可能性は更に低くなる。その一方では、学習が複雑になって、適切な交通事故予測モデルの構築がより困難になる。
【0022】
このようなことから、事故予測精度を向上させるためには、より多くの説明変数を用いるのではなく、事故直前の特性を限られた説明変数で表現する必要がある。そこで、本実施形態では、カイ二乗検定を用いて、説明変数を選定することにより、説明変数の数を抑えつつ、交通事故の予測精度を向上させるアプローチを採用している。
【0023】
説明変数として、速度、交通量、及び時間占有率を用いた従来の交通事故予測モデル(例えば、非特許文献1参照)では、事故リスクを予測できる可能性が示唆されている。このことから、本実施形態では、この交通事故予測モデルをベースモデルとし、他の有効な説明変数の選定にカイ二乗検定を用いている。ここでは、理解を容易とするために、説明変数の候補としては、天候、曜日、休日、時間帯、及び事故発生間隔の五つのみを想定することとする。
【0024】
これら候補のうちの事故発生間隔は、「交通事故が発生しやすい状況では、交通事故がより頻繁に発生する可能性がある」という仮説に基づき、生存時間分析の考え方を取り入れて選定したものである。生存時間分析とは、ある事象が発生するまでの時間を調べることである。例えば、生存時間tまでの生存確率を示す生存関数を考えると、tが大きくなるにつれて生存関数は減衰し、ゼロに近づいていく。本実施形態では、交通事故という事象が発生するまでの生存時間分析を行った。
【0025】
この生存時間分析では、先ず、ある交通事故が発生してから次の交通事故が発生するまでの時間を集計した。次に、交通事故が発生してからの経過時間の範囲を30分とし、0~30分、30~60分、...のように、各時間範囲で発生した交通事故の数を集計した。それにより、事故発生間隔は、以下のように算出している。なお、事故発生間隔の算出方法は、特に限定されるものではない。
【0026】
rC = NaccC/Nacc (1)
ここで、Cはカテゴリ数(30分間を単位に、交通事故からの経過時間を表現した数)、NaccCはカテゴリ数Cで発生した交通事故数、Naccは全交通事故数である。
【0027】
図2は、説明変数の選定のために想定した調査対象の例を説明する図である。
有効な説明変数とは、交通事故発生との関連性の高いものである。本実施形態では、
図2に示すように、説明変数として有効な候補を確認するための調査対象として、東名高速道路を選択し、東名高速道路の御殿場IC(InterChange)から東京ICまでの上り区間を調査対象区間として選択している。この調査対象区間は、区間1~4に分け、区間1~4のそれぞれで候補の有効性を確認している。区間1~4は全て3車線LNである。以降、区間1~4を纏めて「総調査対象区間」とも表記し、区別する。
車両感知器SKは、区間1には12台、区間2には8台、区間3、4にはそれぞれ12台が設置されている。各車両感知器SKにより、例えばトラカンデータTCは5分間隔で得られる。
【0028】
交通事故の要因は、交通状態によって大きく異なる。
交通量が比較的に多く、周囲の車両Dに拘束される度合いが比較的に高い重交通状態(第1の状態)では、交通事故の原因は、主に不注意によるものである。車間距離が比較的に短くなって、周囲の確認が困難になることも交通事故の原因の一つであると考えられる。特に大型車が多い場合、周囲の確認だけでなく、交通標識等の確認もより困難となる。このようなこともあり、交通事故としては、他の車両Dと接触して起こる接触事故が大部分となる。実際、交通事故の大部分は、重交通状態時に発生することが知られている。
【0029】
これに対し、重交通状態より拘束される度合いが低い軽交通状態(第2の状態)では、交通事故の原因は、主に速度超過等であると思われる。交通事故としては、単独事故(自損事故)が多い。このように、交通状態により、交通事故の原因、その種類が異なることから、本実施形態では、重交通状態に着目し、候補の確認を行っている。それにより、
図2には、区間、区間の長さとともに、交通量の多い状況での事故データ数、事故なしデータ数の各例を示している。データ数は、30分を調査対象期間とした調査対象期間数、つまりカテゴリ数で表している。
【0030】
図3は、平均交通量と空間平均速度の関係例を示す散布図である。この散布図は、調査対象である東名高速道路中のある区間でのものである。
交通量に応じた交通状態の分類法としては、交通容量の55%の交通量を境界に、交通状態を重交通状態、軽交通状態に分類するものがある(例えばGeistefeldt, J., “Assessment of Basic Freeway Segments in the German Highway Capacity Manual HBS 2015 and Beyond”, Transportation Research Procedia, 2016, vol.15, p.421.)。本実施形態では、この分類法を採用している。
【0031】
この分類法について、空間平均速度SVと、平均交通量SQを用いて具体的に説明する。空間平均速度SV、平均交通量SQは、それぞれ次のように表される。
【0032】
【0033】
ここでiは時空間における空間分割単位の番号、jは時空間における時間分割単位の番号、qijは番号i、jで指定される分割単位での交通量、Liは車両感知器SKの間隔(距離)、vijは番号i、jで指定される時空分割単位での車両Dの速度、kijは番号i、jで指定される時空分割単位での密度(=qij/vij)である。
【0034】
このようにして求められる空間平均速度SVとしては、想定する交通容量に達する限界速度を考慮して60(km/h)に設定した。今回の調査対象区間である3車線LN区間の平均の交通容量は約5135(veh/h)である。このことから、境界における平均交通量SQは、SQ=5135×0.55=2825(veh/h)となる。それにより、平均交通量SQが2825(veh/h)未満の場合は軽交通状態、平均交通量SQが2825(veh/h)以上の場合は重交通状態とそれぞれ分類するようにしている。
【0035】
平均交通量SQが2825(veh/h)未満の場合であっても、速度v
ijが特に低ければ、速度v
ijを上げられない理由が存在すると考えられる。本実施形態では、その理由が、交通渋滞の発生にあるとして、重交通状態に分類するようにしている。それにより、
図3に示すように、散布図で軽交通状態と分類されるのは、左上の矩形部分内の範囲となる。統計的検定処理S1は、重交通状態、軽交通状態に分類せず全てのデータを用いて行っている。
なお、交通状態の判定は、別の指標を用いて行うようにしても良い。例えば時間占有率を用いて、交通状態の判定を行うようにしても良い。
【0036】
複数の車線LNが存在する場合、車線LN毎に車両感知器SKが設置されるのが普通である。このこともあり、上記のような交通状態の判定を複数の車線LNが存在する対象区間で行う場合、交通状態の判定は、最も交通量の多い車線LNに着目して行っても良いが、平均を求めて、求めた平均により行うようにしても良い。このこともあり、交通状態の判定方法は、特に限定されない。しかし、対象区間の交通状態の詳細を把握できるようになることから、車線LN毎の交通状態を判定することは、予測精度をより向上させるうえで有効である。
【0037】
本実施形態では、3車線LNの平均に着目して交通状態の判定を行うようにしている。これは、或る時点で各車線LNの交通状態に違いがあったとしても、その違いがなくなる方向に各車線LNの交通状態が変化すると考えられるからである。一方、最も交通量の多い車線LNに着目する場合であっても、同様に、全体としては交通状態が同じようなものになると考えられる。このようなことから、何れの交通状態に着目するとしても、3車線LNの交通状態を適切に判定できると考えられる。
【0038】
図4は、統計的検定処理の例を示すフローチャートである。本実施形態では、
図2にフローチャート例を示す統計的検定処理S1により、調査対象説明変数の各候補のうち、実際に用いる説明変数を選定する。
【0039】
図4にフローチャート例を示す統計的検定処理S1は、プログラムにより情報処理装置に実行させる場合を想定したものである。このことから、処理を実行する主体としては、情報処理装置を想定する。なお、人の制御、或いは操作により、
図4に示すような手順に沿って処理を行わせても良い。それにより、
図4に例を示すフローチャート中の一部の処理を情報処理装置に行わせるようにしても良い。
【0040】
統計的検定処理S1の実行の前に用意されたテストデータのサンプル数は膨大である。カイ二乗検定では、サンプル数が大きすぎると、統計的に有意な結果が出やすくなる傾向がある。このことから、統計的検定処理S1では、テストデータ中から使用するものを抽出し、カイ二乗検定の結果を確認することを複数回、繰り返し行うようになっている。
【0041】
統計的検定処理S1では、先ず、情報処理装置は、カイ二乗検定を行った回数を計数するための変数Kに0を代入する(ステップS11)。次に情報処理装置は、変数Kの値をインクリメントする(ステップS12)。その後、情報処理装置は、テストデータ中から今回のカイ二乗検定に用いるものを抽出するサンプリングを行い(ステップS13)、更に抽出したテストデータを用いて、クロス集計表を作成する(ステップS14)。
【0042】
クロス集計表は、交通事故発生との関連を確認するために用いられる表であり、テストデータから得られた観測値が纏められている。交通事故発生との関連を確認するための各期待値は、クロス集計表の観測値を用いて求められる。情報処理装置は、クロス集計表の作成後に、各期待値をまとめた期待度数表を作成する(ステップS15)。
【0043】
カイ二乗検定で正しい結果を得るためには、求めた期待値がある値以上であることが求められる(例えばコクランの規則)。このことから、期待度数表の作成後、情報処理装置は、算出した期待値の最小値が閾値Thを超えているか否か判定する(ステップS16)。期待値のうちに閾値Th以下のものが一つ以上、存在した場合(ステップS16のNo)、上記ステップS13に戻り、テストデータのサンプリングが行われる。一方、全ての期待値が閾値Thを超えていた場合(ステップS16のYes)、情報処理装置は、クロス集計表、及び期待度数表から、カイ二乗値を算出する(ステップS17)。その後、情報処理装置は、カイ二乗値に基づくp値を算出する(ステップS18)。
【0044】
p値の算出後、情報処理装置は、変数Kの値が予め定めた繰り返し回数T以上か否か判定する(ステップS19)。変数Kの値が繰り返し回数T以上であった場合(ステップS19のYes)、情報処理装置は、p値の平均値を算出する(ステップS20)。その後、統計的検定処理S1が終了する。一方、変数Kの値が繰り返し回数T未満であった場合(ステップS19のNo)、上記ステップS12に戻る。それにより、繰り返し回数T分のカイ二乗値が算出される。
【0045】
p値は、カイ二乗値を変換して得られる値(確率)である。一般的には、p値が有意水準未満となった場合、帰無仮説を棄却するようになっている。本実施形態でも、p値の平均値が有意水準未満となった候補を、帰無仮説が棄却されたものとしている。つまり、交通事故発生との関連性が存在するとしている。なお、有意水準は0.05である。
【0046】
図5は、各候補に対してカイ二乗検定を行った結果の例を説明する図である。
図5(a)~
図5(e)に、天候、曜日、休日、時間帯、事故発生間隔の各候補の結果を個別に示している。全ての候補で結果を区間1~4に分けて示している。
【0047】
図5に示すカイ二乗検定の結果は、5つの候補のうち、時間帯、事故発生間隔は交通事故発生との関連性があることを表している。このことから、本実施形態では、ベースモデルに対し、時間帯、事故発生間隔を説明変数として選定している。
【0048】
時間帯、事故発生間隔の追加により、交通事故の予測精度が実際に向上するとは限らない。つまり、予測精度が実際には向上しないか、或いは低下する可能性がある。このことから、予測精度がベースモデルより向上するか否かを確認するために、精度検証処理S2が行われる。
【0049】
本実施形態では、精度検証処理S2は、ベースモデルに時間帯、事故発生間隔の2つを説明変数として追加するモデルを新たに構築し、ベースモデルの予測精度と対比することで行っている。新たに構築したモデルは以降「提案モデル」と表記する。
【0050】
図6は、構築した提案モデルの例を示す概念図である。
上記のように、ベースモデルは、CNNモデルをベースにし、説明変数の数は、速度、交通量、時間占有率の3つである。CNNモデルには、入力層、中間層(隠れ層)、出力層(完全連結層)の3つに大別される層が存在する。
【0051】
提案モデルでは、ベースモデルから、入力層に時間帯を1チャンネルとして追加することにより、データを時空間で分散させ、時間帯別の交通特徴の違いを情報として与えるようにしている。入力層で表す矩形は、データが時空間で分散されていることを示している。つまり、例えば縦軸、及び横軸のうちの一方は時間、他方は空間をそれぞれ表している。時間での分散は、例えば5分間隔である。
【0052】
事故発生間隔は、
図6に示すように、出力層に1ユニット61を追加し、時空間特徴量から抽出された値として入力させている。これは、事故発生間隔は、入力層に入力されるデータ(説明変数の内容を表す情報)とは異なる、特定の時間間隔で事故が発生するリスクを表す値であるためである(式(1)参照)。出力層に追加した1ユニット61に、事故発生間隔に応じた値を入力することにより、他の4つの説明変数の内容と組み合わせた交通事故の予測を行うことができる。この1ユニット61を出力層に追加することにより、提案モデルは、重交通状態時における交通事故の予測に対応させたものとなっている。入力層に入力される他の説明変数を表す値は何れも、重交通状態時のものである。
【0053】
図2に示す区間1~4を対象区間とする場合、車両Dが時速50kmで走行すると仮定すると、30分が経過するまでの間に、何れの区間でも始点から終点まで車両Dが通過し終わることになる。このことから、
図6に例を示す提案モデルでの交通事故の予測は、現在から1時間前までのデータを用いて、現在から30分後までを範囲として行うようにしている。
評価指標としては、一般的に分類モデルの評価指標として用いられている混同行列とF1スコアを用いた。
【0054】
図7は、混合行列の例を説明する図である。
混同行列は、
図7に示すように、モデルの予測結果を実際の分類クラス毎に集計したものである。混合行列では、トゥルー(T)、フォルス(F)は、予測の真偽を示す。トゥルー(T)は予測が真、つまり予測が正しいことを示し、フォルス(F)は予測が偽、つまり予測が誤っていることを示す。また、ポジティブ(P)、ネガティブ(N)は、予測結果の内容を真偽で示す。ポジティブ(P)は、真と予測、つまり交通事故が発生と予測したことを示し、ネガティブ(N)は、偽と予測、つまり交通事故が発生しないと予測したことを示す。それにより、例えばトゥルー・ポジティブ(TP)は、真のものを真と予測、つまり実際に発生した交通事故を発生すると予測したことを表している。
【0055】
F1スコアは、統計解析で精度を測る指標の一つであり、適合率、再現率を用いて算出される。混同行列からは、以下のように算出できる。
F1スコア=(2×適合率×再現率)/(適合率+再現率) (4)
ここで、適合率は、適合率=TP/(TP+FP)により計算され、再現率は、再現率=TP/(TP+FN)により計算される。
【0056】
F1スコアは、0~1の範囲内の値である。1に近いほど、予測精度が高いことを示している。
なお、精度を測る指標はF1スコアに限定されない。別の指標であっても良く、評価方法は採用する指標に合わせて決定すれば良いものである。
【0057】
図8は、提案モデルで交通事故の予測を行った場合に、各区間で算出されたF1スコア、適合率、再現率の各値の例を示す図である。
図8では、比較のために、ベースモデルでの各値の例も併せて示している。
【0058】
提案モデルとベースモデルの予測精度を比較した場合、
図8に示すように、区間2を除いて、提案モデルのほうがF1スコア、及び適合率は高く、再現率は低くなっている。それにより、提案モデルはベースモデルよりも誤認識が少ない、つまり予測精度が高いことが分かる。
【0059】
図9は、提案モデルとベースモデルの各F1スコアの例を区間別に示す図である。
図9では、
図8から抽出した各F1スコアの他に、F1スコアの平均値、及び改善率を併せて示している。改善率(%)は、F1スコアの平均値を用いて算出される値であり、ここでは改善率=(提案モデルのF1スコアの平均値-ベースモデルのF1スコアの平均値)×100/ベースモデルのF1スコアの平均値、により求めている。
【0060】
図9に示すように、提案モデルをベースモデルと比較した場合の改善率は19.1(%)である。このことからも、提案モデルは、ベースモデルよりも予測精度が改善され、より高精度に交通事故を予測できることが分かる。
【0061】
このことは、ベースモデルに説明変数として追加した時間帯、事故発生間隔が予測精度の改善に寄与していることを意味している。このような時間帯、事故発生間隔が説明変数として有効なことは、
図5に示すように、カイ二乗検定の結果が示唆している。それにより、説明変数の選定にカイ二乗検定に代表される統計的検定が有効であることが分かる。選定した説明変数の候補が実際に有効か否かを事前に、且つ高精度に予測できることから、より高精度の交通事故予測モデルの構築をより短時間に、且つより容易に行ううえで、統計的検定を用いることが有効である。
【0062】
図10~
図13は、提案モデルで交通事故の予測を行った場合に、1日を複数の期間に分け、算出されたF1スコア、適合率、再現率の各値の例を期間別に示す図である。
図10~
図13では、区間別に分けつつ、
図8と同じく、比較のために、ベースモデルでの各値の例も併せて示している。各値が全て0となっている期間は、交通事故が発生していない、または発生した交通事故を予測できていない期間である。ここで、
図10~
図13を参照しつつ、区間別に予測結果について説明する。
【0063】
1日は、
図10~
図13に示すように、0:00~5:59、6:00~11:59、12:00~17:59、18:00~23:59の4期間に分けている。しかし、事故発生期間は、上記のように、30分間隔毎に算出している。このことから、各期間は、実際には、事故発生期間を算出する時間間隔で更に分けられている。
【0064】
図10は、区間1でのF1スコア、適合率、再現率の各値の例を示している。
区間1では、
図10に示すように、6:00~11:59の期間、提案モデルはベースモデルよりもF1スコアが高くなっている。区間1は、東京へ向かう車両Dによる朝のラッシュアワーが発生し、渋滞する。この渋滞時に事故が多いという特徴がある。時間帯、事故発生間隔を追加したことにより、6:00~11:59の期間では、この特徴を事故の予測に反映できたものと考えられる。
【0065】
図11は、区間2でのF1スコア、適合率、再現率の各値の例を示している。
区間2では、
図11に示すように、F1スコアは、提案モデルがベースモデルよりも概して低いか、或いは同じ値となっている。このような結果になった理由としては、区間2では、両モデルに含まれる速度、交通量、時間占有率の事故への寄与度が時間帯、事故発生間隔よりも高いためと考えられる。
【0066】
図12は、区間3でのF1スコア、適合率、再現率の各値の例を示している。
区間3では、
図12に示すように、F1スコア、適合率は、12:00~17:59、18:00~23:59の2期間で提案モデルがベースモデルより高くなっている。この区間3には、繁忙期、或いは休日等に、夕方から夜にかけて、首都圏に戻ってくる車両Dが多く、渋滞を発生するという特徴がある。2区間で予測精度がベースモデルより向上しているのは、時間帯、事故発生間隔を説明変数として追加したことにより、その特徴を予測に反映できたためと考えられる。
【0067】
図13は、区間4でのF1スコア、適合率、再現率の各値の例を示している。
区間4では、
図13に示すように、F1スコア、適合率は、6:00~11:59、12:00~17:59の2期間で提案モデルがベースモデルより高くなっている。この区間4には、6:00~11:59の期間は渋滞となることが少なく、事故も少ないという特徴がある。一方、12:00~17:59の期間は、区間3で発生した渋滞の影響が及ぶこともあり、繁忙期、土日祝日には渋滞が発生しやすいという特徴がある。そのような特徴がそれぞれ存在する2期間では、時間帯、事故発生間隔を説明変数として追加したことにより、その特徴を予測に反映できているものと考えられる。6:00~11:59の期間については、渋滞となることが少ないという特徴から、説明変数として加えた時間帯が予測精度の向上に大きく寄与していると考えられる。
【0068】
図1に示す精度検証処理S2では、区間別の予測精度の確認だけでなく、期間別の予測精度の確認を行っている。このような確認の結果、新たに説明変数として選定した時間帯、事故発生間隔は、特に重交通状態時における予測精度を向上させるうえで有効なことが確認できた。それにより、任意の対象道路DRの任意の対象区間で発生する交通事故を予測する交通事故予測モデルの構築MKを行っている。
【0069】
図14は、説明変数の組み合わせによる予測精度の差を確認した結果の例を説明する図である。
ここで対象としたのは、8つの説明変数である。それにより、総組み合わせ数は254である。本実施形態では、254通りの説明変数の組み合わせの全てでCNNベースのモデルを構築し、予測精度の確認を通して、更に時間帯、事故発生間隔の有効性を検証している。
図14は、各CNNベースモデルで得られたF1スコアの例を示したものである。なお、8つの説明変数とは、例えば天候、曜日、休日、速度、交通量、時間帯、事故発生間隔、時間占有率である。
【0070】
図14において、BMはF1スコアが最も高かったモデル(ベストモデル)、PMは提案モデル、PAはベースモデルをそれぞれ表している。
ベストモデルBMでの説明変数の組み合わせは、速度、交通量、曜日、休日、時間帯、事故発生間隔である。説明変数の組み合わせに時間帯、事故発生間隔が含まれていることから、時間帯、事故発生間隔は説明変数として有効であることが確認できる。また、説明変数の選定に統計的検定法が有効であることも確認できる。
【0071】
以降は、
図15~
図18を参照し、本発明の一実施形態に係る情報処理装置について詳細に説明する。この情報処理装置は、上記提案モデルを実装させたものである。
図15は、本発明の情報処理装置の一実施形態に係るAP(APplication)サーバが設置された環境の一例を説明する図である。
【0072】
図15に示す例では、APサーバ1は、上記提案モデルが実装された情報処理装置であり、道路管理会社DKに設置されている。APサーバ1は、LAN(Local Area Network)等のネットワーク5に接続されている。そのネットワークNには他に、DB(Data Base)サーバ2、情報収集装置3、及び端末4等が接続されている。
【0073】
なお、
図15に例を示す環境は、あくまでも一例であり、その環境は特に限定されない。APサーバ1、DBサーバ2等は、クラウドサービスを利用して設置するようにしても良い。このこともあり、APサーバ1、DBサーバ2等を含む何れのノードの設置場所は特に限定されない。何れのノードも任意の場所に設置させることが可能である。
【0074】
情報収集機器群JGは、車両感知器SK等を含む情報収集用の各種道路設備群である。情報収集機器群JGを構成する各情報収集機器により得られた情報は、例えば別のネットワーク、或いは専用回線を介して、道路管理会社DKに提供される。道路管理会社DKに設置された情報収集装置3は、各情報収集機器により直接、或いは間接的に送信された情報への対応用である。情報収集装置3は、各情報収集機器から受信した情報をそのまま、或いは処理して、DBサーバ2に保存させる。それにより、DBサーバ2には、トラカンデータTCを含む各種交通情報が保存される。
【0075】
警察署KSは、交通事故に対応し処理する。警察署KSは、交通事故が発生した場合、そのことを電話、或いは所定の信号の送信等により、道路管理会社DKに連絡する。交通事故の処理が終了した場合にも、同様にして、道路管理会社DKに連絡する。この結果、DBサーバ2には、発生した交通事故についての事故情報も保存される。事故情報の保存は、例えば情報収集装置3か、或いは端末4への操作者の操作により行われる。
【0076】
情報収集機器群JGを用いた情報収集、及び交通事故についての事故情報の収集の何れにも、周知の方法を用いることができる。このこともあり、それらの収集方法は、収集した情報の保存の仕方を含め、特に限定されるものではない。つまり、周知の方法を用いることができるだけでなく、様々な変形を行っても良いものである。
【0077】
端末4は、APサーバ1の利用にも用いることができる。それにより、端末4を使用する操作者は、対象道路DR、対象区間、時間帯等で予測対象条件を指定しての交通事故の予測をAPサーバ1に行わせることができる。
【0078】
なお、APサーバ1は、道路管理会社DKにより設置されるものでなくとも良い。つまり、別の組織が設置するものであっても良い。設置場所については、組織が管理する場所でなくとも良い。例えばクラウドサービスを利用し、APサーバ1等を設置するようにしても良い。APサーバ1、DBサーバ2等を同じ場所に設置しなくとも良い。このようなことからも、
図15に示す環境例は一例であり、様々な変形が可能である。
【0079】
図16は、本発明の情報処理装置の一実施形態に係るAPサーバのハードウェア構成の一例を示すブロック図である。次に
図16を参照し、APサーバ1のハードウェア構成例について具体的に説明する。なお、この構成例も一例であり、APサーバ1のハードウェア構成はこれに限定されない。
【0080】
APサーバ1は、
図16に示すように、CPU(Central Processing Unit)11、ROM(Read Only Memory)12、RAM(Random Access Memory)13、バス14、入出力インターフェース15、出力部16、入力部17、記憶部18、通信部19、及びドライブ20を備えている。
【0081】
CPU11は、例えばROM12に記録されているプログラム、及び記憶部18からRAM13にロードされたプログラムを実行し、各種の処理を実現させる。記憶部18からRAM13にロードされるプログラムには、例えばOS(Operating System)、及びそのOS上で動作する各種アプリケーション・プログラムが含まれる。各種アプリケーション・プログラムには、本サービスの提供用に開発されたものが1つ以上、含まれる。
【0082】
RAM13には、CPU11が各種の処理を実行する上において必要なデータ等も適宜記憶される。そのデータには、CPU11が実行する各種プログラムも含まれる。各種プログラムは、RAM13に読み出されてCPU11に実行される。
【0083】
CPU11、ROM12及びRAM13は、バス14を介して相互に接続されている。このバス14にはまた、入出力インターフェース15も接続されている。入出力インターフェース15には、出力部16、入力部17、記憶部18、通信部19、及びドライブ21が接続されている。
【0084】
出力部16は、例えば液晶等のディスプレイである。出力部16は、CPU11の制御により、各種画像、或いは各種画面を表示する。出力部16は、APサーバ1に搭載されたものであっても良いが、必要に応じて接続されるものであっても良い。それにより、出力部16は、必須の構成要素ではない。
【0085】
入力部17は、例えばキーボード等の各種ハードウェア釦等を含む構成のものである。その構成には、マウス等のポインティングデバイスが1つ以上、含まれていても良い。操作者(主にシステム管理者)は、入力部17を介して各種情報を入力することができる。この入力部17も、APサーバ1に搭載されたものであっても良いが、必要に応じて接続されるものであっても良い。それにより、入力部17も、必須の構成要素ではない。
【0086】
記憶部18は、例えばハードディスク装置、或いはSSD(Solid State Drive)等の補助記憶装置である。データ量の大きいデータは、この記憶部18に記憶される。
通信部19は、ネットワークNを介した他の情報処理装置との間の通信を可能にする。
図15に示すDBサーバ2、情報収集装置3、及び端末4は何れも、他の情報処理装置である。
【0087】
ドライブ20は、磁気ディスク、光ディスク、光磁気ディスク、或いは半導体メモリカード等のリムーバブルメディア25が着脱可能な装置である。ドライブ20は、例えば装着されたリムーバブルメディア25からの情報の読み取り、及びリムーバブルメディア25への情報の書き込みが可能である。それにより、リムーバブルメディア25に記録されたプログラムは、ドライブ20を介して、記憶部18に記憶させることができる。また、ドライブ20に装着されたリムーバブルメディア25は、記憶部18に記憶されている各種データのコピー先、或いは移動先として用いることができる。
【0088】
本サービス用に開発されたアプリケーション・プログラムは、リムーバブルメディア25に記録させて配布しても良い。インターネット等のネットワークを介して配布可能にしても良い。このことから、アプリケーション・プログラムを記録した記録媒体としては、ネットワークに直接的、或いは間接的に接続された情報処理装置に搭載、若しくは装着されたものか、或いは外部のアクセス可能な装置に搭載、若しくは装着されたものであっても良い。
【0089】
APサーバ1が備えるハードウェア資源は、アプリケーション・プログラムを含む各種プログラムによって制御される。その結果、APサーバ1上には、交通事故予測モデルとして上記提案モデルが実現され、端末4を使用する操作者の指示、或いは予め定められた設定に従って、対象道路DRの対象区間で発生する交通事故の予測を行うことが可能となっている。
【0090】
図17は、本発明の情報処理装置の一実施形態に係るAPサーバ上に実現される機能的構成の一例を示す機能ブロック図である。次に
図17を参照しつつ、APサーバ1上に実現される機能的構成の例について詳細に説明する。
【0091】
APサーバ1のCPU11上には、機能的構成として、
図17に示すように、要求処理部111、データ取得制御部112、説明変数生成部113、事故予測部114、学習処理部115、及び画面生成部116が実現される。そのCPU11は、通信部19により、DBサーバ2、情報収集装置3、及び端末4との間でネットワーク5を介したデータの送受信を行うことができる。
【0092】
これらの機能的な構成要素111~116は、本サービスの提供用に開発されたアプリケーション・プログラムを含む各種プログラムをCPU11が実行することにより実現される。その結果として、記憶部18には、トラカンデータ格納部181、説明変数格納部182、及び予測結果格納部183が情報格納用に確保される。
【0093】
APサーバ1には、交通事故の予測を含む各種機能が搭載されている。それにより、APサーバ1は、端末4等から送信される各種要求に対応する。要求処理部111は、通信部19によって受信された要求を処理し、その要求に応じた機能を提供するための制御を行う。交通事故の予測に関わる各種要求の主なものとしては、交通事故の予測を指示するための予測要求、予測結果の出力を指示するための出力要求、提案モデル等の学習を指示する学習処理要求、等がある。
【0094】
データ取得制御部112は、交通事故の予測に必要なデータを取得するための制御を行い、その制御で取得されたデータを記憶部18に確保されたトラカンデータ格納部181に格納する。トラカンデータTCは、データ取得制御部112によって取得される主なデータである。データ取得制御部112により取得されてトラカンデータ格納部181に格納されるデータとしては他に、事故情報等も含まれる。ここでは以降、便宜的に、事故情報は情報収集装置3から取得されるものと想定する。また、トラカンデータTCを含む交通事故の予測用のデータは以降、「交通データ」と総称する。
【0095】
普通、説明変数の内容は、交通事故予測モデルの入力用としては不適切である。このことから、説明変数生成部113は、例えばトラカンデータ格納部181に格納されている交通データを参照して、説明変数毎に、その内容を入力用にエンコードしたデータを生成し、生成したデータを説明変数格納部182に格納する。この説明変数生成部113は、本実施形態における情報取得手段に相当する。生成されたデータが、本実施形態における説明変数情報群に相当する。
【0096】
事故発生間隔は、例えば上記式(1)により算出される。それにより、説明変数生成部113は、交通データを参照して、式(1)により事故発生間隔を算出し、算出した事故発生間隔から、出力層の1ユニット61に実際に入力すべき値を算出、或いは特定する。時間帯は、1日は24時間であることから、例えば1時間のカテゴリで分け、0~23の範囲内の整数で表す。そのような必要な操作が、説明変数毎に行われる。この操作は、基本的に数値化のためのものである。ラベルエンコーディング、及びターゲットエンコーディング等の各種エンコーディングは、何れも数値化手法の一つであり、且つ、操作のために採用可能な一手法である。入力用の説明変数については、以降、便宜的に「説明変数入力データ」と表記して区別する。
【0097】
説明変数入力データは、対象道路DR毎、対象区間毎に生成される。それにより、
図2に示すように、総対象区間を区間1~4に分けての交通事故の予測が可能となっている。言い換えれば、そのような説明変数データの用意により、用意された説明変数データで指定される対象道路DRの対象区間での交通事故の予測を可能にさせている。
【0098】
事故予測部114は、説明変数格納部182に格納された説明変数入力データを用いて、対象道路DRの対象区間で発生する交通事故を予測し、その予測結果を記憶部18に確保された予測結果格納部183に格納する。
【0099】
事故予測部114には、交通事故を予測する内容が異なる第1予測部114a、及び第2予測部114bが存在する。それにより、端末4の操作者は、例えば予測内容を選択することが可能となっている。例えば端末4から送信される予測要求内に、予測内容を示す予測種別情報を含めることにより、予測内容を操作者に選択させることができる。事故予測部114、この事故予測部114を構成する第1予測部114a、第2予測部114bは全て、本実施形態における事故予測手段に相当する。
【0100】
第1予測部114aは、上記提案モデルによる交通事故の予測を実現させる。その予測は、
図7に示すように、交通事故が発生するか否かである。
これに対し、第2予測部114bは、NICE(Non-linear Independent Component Estimation)モデルにより、交通事故を予測する。
【0101】
NICEモデルは、高次元の複雑な密度関数をモデリングするディープラーニングフレームワークであり、データの非線形で決定論的な変形が学習される。ここでの変形とは、変形されたデータが分解された分布に準拠するように、潜在変数空間に写像するものである。訓練の基準は、対数尤度である。それにより、交通事故の予測は対数尤度で行われる。なお、潜在変数空間を表す潜在変数は、統計学において、直接は観察されないが、観測された他の変数から推定される変数のことである。
【0102】
図18は、NICEモデルによる交通事故の予測を行う仕組みの例を説明する図である。
図18に示すように、NICEモデルの構築でも、提案モデルと同様に、過去に観測されたトラカンデータTC等から得られる説明変数入力データを用いた学習が行われる。この学習により構築されたNICEモデルに対し、予測用のトラカンデータTC等から得られる説明変数入力データを入力することにより、潜在変数空間での写像が求められる形で対数尤度が算出され、出力される。交通事故の予測を対数尤度で行うことから、交通事故あり、交通事故なしのそれぞれのケース別に、対数尤度を算出させることができる。
【0103】
交通事故の発生頻度は比較的に低い。このため、交通事故ありの説明変数入力データを学習用に十分な量、用意するのは非常に困難なのが実情である。しかし、交通事故の予測にNICEモデルを採用した場合、つまり対数尤度により交通事故の予測を行う場合、交通事故なしの説明変数入力データのみを学習に用いることもできる。これは、NICEモデルでは、学習データと予測対象データとの間の対数尤度で交通事故の予測が行えるからである。ここでの学習データ、及び予測対象データが何れも、説明変数入力データである。
尤度は、特定の条件下における特定のデータの発生確率を指す。そのため、算出した対数尤度から、予測対象データの発生確率を算出することができる。それにより、例えば、対数尤度の小さい交通状態が観測された場合、その交通状態の発生確率が低いことを意味するため、操作者等は、予測対象データの異常度が高いことを確認することができる。
NICEモデルによる交通事故の予測を行う場合、上記のような利点がある。
【0104】
第2予測部114bは、上記のようなNICEモデルが実装されている。それにより、第1予測部114aとは異なるアルゴリズムで異なる種類の交通事故の予測を行う。第2予測部114bによる予測結果、及び第1予測部114aによる予測結果はともに、予測結果格納部183に格納される。
【0105】
学習処理部115は、事故予測部114を構成する第1予測部114a、及び第2予測部114bに対する学習処理を行う。この学習処理では、例えば説明変数格納部182に格納されている説明変数入力データを用いた学習が行われる。この学習を通して、上記提案モデル、及び上記NICEモデルの構築もそれぞれ行うことができる。
【0106】
画面生成部116は、主に端末4に送信される画面(例えばWebページ)の生成を行う。生成される画面は、例えば要求処理部111に指示される。その指示により生成される画面には、第1予測部114a、或いは第2予測部114bによる交通事故の予測結果が配置されたものも含まれる。それにより、端末4を使用する操作者は、随時、第1予測部114a、或いは第2予測部114bによる交通事故の予測結果を確認することができる。また、予測結果を表すダウンロードも画面生成部116により可能となっている。
【0107】
なお、
図17には示していないが、事故予測部114には、軽交通状態時の交通事故を予測するための予測部が2つ含まれる。一つは、第1予測部114aと同じく、交通事故が発生するか否かを予測するものである。もう一つは、第2予測部114bと同じく、交通事故あり、交通事故なしのそれぞれのケース別に、対数尤度を算出するものである。説明変数としては、例えばともに、速度、交通量、時間占有率、及び時間帯が用いられている。このようなものを事故予測部114に含めることにより、交通状態が重交通状態か否かにより、実際に用いられる予測部を切り換えての交通事故の予測が行われる。交通事故の予測は、交通事故が発生する確率を算出することで行っても良い。
【0108】
また、本実施形態では、対象道路DRを高速道路としているが、対象道路DRは高速道路以外の道路であっても良い。つまり一般道であっても良い。一般道であっても、その一般道で得られた説明変数入力データ(説明変数情報群)を用いた学習により、より高い精度での交通事故を予測できると期待される。
また、説明変数入力データは、説明変数生成部113が生成することにより取得されるが、説明変数入力データ自体を外部から直接、取得するようにしても良い。それにより、説明変数入力データを生成する装置自体は、特に限定されない。
【0109】
現在から30分後までに発生する交通事故の予測のために、現在から60分前までの説明変数入力データを用いているが、このような説明変数入力データを用いるのも一例である。例えば同じ天候、同じ時期、同じ曜日、同じ時間帯で得られた過去の説明変数入力データを用いて、交通事故の予測を行うようにしても良い。交通事故の予測のために、現在から60分前までの説明変数入力データを用いているのは、日、時間帯により特有の交通状態となっていることも多いからである。つまり、交通事故を予測する日時の交通状態に近い説明変数入力データが得られる可能性が比較的に高いと期待できるからである。時間帯による交通状態の変化の傾向が予め確認できているような場合、直前に得られた交通データを操作し、操作した交通データから得られる説明変数入力データを交通事故の予測に用いるようにしても良い。このようなことから、交通事故の予測に用いる交通データ、説明変数入力データは特に限定されるものではない。
【0110】
本実施形態では、CPU11上に事故予測部114、及び学習処理部115を実現させているが、それらのうちの一つ以上をGPU(Graphics Processing Unit)上に実現させても良い。GPUの数は、2以上であっても良い。このことからも、APサーバ1のハードウェア構成は
図16に示す例に限定されない。搭載するCPU11、及びGPUの各数も限定されない。
【0111】
本実施形態では、交通量に応じた交通状態の分類により、交通状態を重交通状態、及び軽交通状態のうちの何れかに分類しているが、このような分類は一例である。特に重交通状態は、2以上に更に分類するようにしても良い。具体的には、例えば重交通状態は、混雑状態、及び渋滞状態の2つに更に分類しても良い。
高速道路では、混雑状態、及び渋滞状態の分類は、例えば車両Dの速度に着目して行っても良い。具体的には時速が40km以下の重交通状態時を渋滞状態、渋滞状態以外の重交通状態時を混雑状態とそれぞれ分類しても良い。重交通状態は、3以上に分類するようにしても良い。重交通状態となる期間が
図10等に示すように分けられたとしても、その期間内は、重交通状態の細分化に合わせ、細分化された状態別に分ける必要がある。
【0112】
このように、重交通状態を2以上に細分化する場合、事故発生間隔は、細分化した状態毎に算出するのが望ましい。これは、細分化した分類毎に、事故発生間隔に異なる傾向がある可能性が考えられるからである。それにより、重交通状態を細分化し、細分化した分類毎に、その分類で算出された事故発生間隔を用いた交通事故の予測を行うようにする場合、その予測精度が更に向上すると期待できる。
【符号の説明】
【0113】
1 APサーバ、2 DBサーバ、3 情報収集装置、4 端末、11 CPU、18 記憶部、19 通信部、111 要求処理部、112 データ取得制御部、113 説明変数生成部、114 事故予測部、114a 第1予測部、114b 第2予測部、115 学習処理部、116 画面生成部、181 トラカンデータ格納部、182 説明変数格納部、183 予測結果格納部。