特開2023-86112 | 知財ポータル「IP Force」

知財求人 - 知財ポータルサイト「IP Force」

▶ 株式会社グリッドの特許一覧 ▶ 株式会社高速道路総合技術研究所の特許一覧 ▶ 東日本高速道路株式会社の特許一覧 ▶ 中日本高速道路株式会社の特許一覧 ▶ 西日本高速道路株式会社の特許一覧

特開2023-86112情報処理装置

書誌要約請求の範囲詳細な説明課題実施例実施するための形態図面の説明

目に優しい文字サイズ小中大 PDF Top

< >

1
2
3
4
5
6
7
8
9
10
11
12
13
14
15
16
17
18

(19)【発行国】日本国特許庁(JP)

(12)【公報種別】公開特許公報(A)

(11)【公開番号】P2023086112

(43)【公開日】2023-06-21

(54)【発明の名称】情報処理装置

(51)【国際特許分類】

G08G 1/00 20060101AFI20230614BHJP

G16Y 10/40 20200101ALI20230614BHJP

G16Y 20/20 20200101ALI20230614BHJP

G16Y 40/20 20200101ALI20230614BHJP

【ＦＩ】

G08G1/00 A

G16Y10/40

G16Y20/20

G16Y40/20

【審査請求】未請求

【請求項の数】7

【出願形態】ＯＬ

(21)【出願番号】P 2022193146

(22)【出願日】2022-12-01

(31)【優先権主張番号】P 2021200194

(32)【優先日】2021-12-09

(33)【優先権主張国・地域又は機関】JP

(71)【出願人】

【識別番号】510080727

【氏名又は名称】株式会社グリッド

(71)【出願人】

【識別番号】507194017

【氏名又は名称】株式会社高速道路総合技術研究所

(71)【出願人】

【識別番号】505398941

【氏名又は名称】東日本高速道路株式会社

(71)【出願人】

【識別番号】505398952

【氏名又は名称】中日本高速道路株式会社

(71)【出願人】

【識別番号】505398963

【氏名又は名称】西日本高速道路株式会社

(74)【代理人】

【識別番号】100190621

【弁理士】

【氏名又は名称】崎間伸洋

(74)【代理人】

【識別番号】100212510

【弁理士】

【氏名又は名称】笠原翔

(72)【発明者】

【氏名】若槻祐貴

(72)【発明者】

【氏名】建部順平

(72)【発明者】

【氏名】▲刑▼ 健

【テーマコード（参考）】

5H181

【Ｆターム（参考）】

5H181AA01

5H181BB04

5H181BB12

5H181BB13

5H181BB20

5H181CC04

5H181CC11

5H181CC27

5H181DD01

5H181DD03

5H181EE02

5H181EE07

5H181EE12

5H181FF10

5H181FF13

5H181FF22

5H181FF27

5H181FF33

5H181LL01

5H181LL02

5H181LL04

5H181LL11

5H181MC27

(57)【要約】

【課題】道路で発生する交通事故の予測精度を向上させること。
【解決手段】説明変数の候補を選定し、交通事故の予測に実際に用いる説明変数の少なくとも一つを、選定した候補のうちから選定する。この選定のために、道路管理会社ＤＫから提供される、トラフィックカウンターデータＴＣ等の交通情報を用いた統計的検定処理Ｓ１を実行する。それにより、他の候補、或いは選定済みの説明変数との関連性を確認し、その確認結果を検討し、候補のうちから説明変数を選定する。選定した説明変数の有効性の確認のために、更に精度検証処理Ｓ２が実行される。これにより、有効性が確認できた場合に、候補のうちから選定した説明変数を用いて交通事故を予測する交通事故予測モデルの構築ＭＫが行われる。
【選択図】図１

【特許請求の範囲】

【請求項1】

対象道路における対象区間での交通事故の予測に用いられる、事故発生間隔を含む複数の説明変数の内容を表す説明変数情報群を取得する情報取得手段と、
前記情報取得手段により取得された前記説明変数情報群を用いて、前記対象区間での前記交通事故の予測を行う事故予測手段と、
を備える情報処理装置。

【請求項2】

前記事故予測手段は、前記対象区間での車両の交通状態を第１の状態、及び前記第１の状態より交通量が多い第２の状態のうちの何れかに分類し、前記交通状態が前記第２の状態と分類した場合に、前記事故発生間隔を用いた前記交通事故の予測を行う、
請求項１に記載の情報処理装置。

【請求項3】

前記事故予測手段は、前記対象区間に複数の車線が存在し、且つ前記複数の説明変数が車線毎に与えられている場合、前記車線毎に、前記交通状態を前記第１の状態、及び前記第２の状態のうちの何れかに分類し、前記交通事故の予測を行う、
請求項２に記載の情報処理装置。

【請求項4】

前記情報取得手段は、前記事故発生間隔の他に、時間帯を含む前記複数の説明変数の内容を表す前記説明変数情報群を取得する、
請求項１～３の何れか１項に記載の情報処理装置。

【請求項5】

前記事故予測手段は、対数尤度の算出により、前記交通事故の予測を行う、
請求項１～４の何れか１項に記載の情報処理装置。

【請求項6】

情報処理装置に、
対象道路における対象区間での交通事故の予測に用いられる、事故発生間隔を含む複数の説明変数の内容を表す説明変数情報群を取得させ、
取得された前記説明変数情報群を用いて、前記対象区間での前記交通事故の予測を行わせる、
処理を実行させるプログラム。

【請求項7】

道路で発生する交通事故の予測に用いる説明変数の候補を一つ以上、選定し、
選定した前記候補毎に、統計的検定法を用いて、交通事故発生との関係性を評価し、
前記候補別に評価した前記関係性に基づいて、前記交通事故の予測に用いる前記説明変数を一つ以上の前記候補のうちから選定する、
説明変数選定方法。

【発明の詳細な説明】

【技術分野】

【0001】

本発明は、情報処理装置に関する。

【背景技術】

【0002】

従来より、予測モデルを用いて交通事故の起こりやすさを予測する技術が提案されている（例えば、特許文献１）。また、近年では、上述の予測モデルとして、交通情報（速度、交通量、時間占有率等）を入力情報として、予測時点直後の特定道路区間における事故の起こりやすさを予測するＣＮＮ（Convolutional Neural Network）モデルを用いる技術も提案されている（例えば、非特許文献１参照）。

【先行技術文献】

【特許文献】

【0003】

【特許文献1】特開２０１４－３５６３９号公報

【非特許文献】

【0004】

【非特許文献1】Tsubota, T., Yoshii, Y., Xing, J., “Prediction of Traffic Accident Likelihood on Intercity Expressway by Convolutional Neural Network” Intelligence, Informatics and Infrastructure, 2020, vol. 1-1, pp. 11-17.

【発明の概要】

【発明が解決しようとする課題】

【0005】

しかしながら、交通情報を表す説明変数のみを使用したＣＮＮモデルでは、予測モデルとしての精度が十分ではなく、交通事故予測モデルの精度向上に効果的な説明変数の選定には改善の余地があった。

【0006】

本発明は、このような状況に鑑みてなされたものであり、道路で発生する交通事故の予測精度を向上させることを目的とする。

【課題を解決するための手段】

【0007】

本開示の一態様の情報処理装置は、対象道路における対象区間での交通事故の予測に用いられる、事故発生間隔を含む複数の説明変数の内容を表す説明変数情報群を取得する情報取得手段と、前記情報取得手段により取得された前記説明変数情報群を用いて、前記対象区間での前記交通事故の予測を行う事故予測手段と、を備える。

【0008】

本開示の一態様の説明変数選定方法は、道路で発生する交通事故の予測に用いる説明変数の候補を一つ以上、選定し、選定した前記候補毎に、統計的検定法を用いて、交通事故発生との関係性を評価し、前記候補別に評価した前記関係性に基づいて、前記交通事故の予測に用いる前記説明変数を前記一つ以上の前記候補のうちから選定する。

【発明の効果】

【0009】

本発明によれば、道路で発生する交通事故の予測精度を向上させることができる。

【図面の簡単な説明】

【0010】

【図1】本発明が適用された交通事故予測モデルを構築する方法の一例を説明する図である。

【図2】説明変数の選定のために想定した調査対象の例を説明する図である。

【図3】平均交通量と空間平均速度の関係例を示す散布図である。

【図4】統計的検定処理の例を示すフローチャートである。

【図5】各候補に対してカイ二乗検定を行った結果の例を説明する図である。

【図6】構築した提案モデルの例を示す概念図である。

【図7】混合行列の例を説明する図である。

【図8】提案モデルで交通事故の予測を行った場合に、各区間で算出されたＦ１スコア、適合率、再現率の各値の例を示す図である。

【図9】提案モデルとベースモデルの各Ｆ１スコアの例を区間別に示す図である。

【図10】提案モデルで交通事故の予測を行った場合に、１日を複数の期間に分け、算出されたＦ１スコア、適合率、再現率の各値の例を期間別に示す図である（区間１）。

【図11】提案モデルで交通事故の予測を行った場合に、１日を複数の期間に分け、算出されたＦ１スコア、適合率、再現率の各値の例を期間別に示す図である（区間２）。

【図12】提案モデルで交通事故の予測を行った場合に、１日を複数の期間に分け、算出されたＦ１スコア、適合率、再現率の各値の例を期間別に示す図である（区間３）。

【図13】提案モデルで交通事故の予測を行った場合に、１日を複数の期間に分け、算出されたＦ１スコア、適合率、再現率の各値の例を期間別に示す図である（区間４）。

【図14】説明変数の組み合わせによる予測精度の差を確認した結果の例を説明する図である。

【図15】本発明の情報処理装置の一実施形態に係るＡＰサーバが設置された環境の一例を説明する図である。

【図16】本発明の情報処理装置の一実施形態に係るＡＰサーバのハードウェア構成の一例を示すブロック図である。

【図17】本発明の情報処理装置の一実施形態に係るＡＰサーバ上に実現される機能的構成の一例を示す機能ブロック図である。

【図18】ＮＩＣＥモデルによる交通事故の予測を行う仕組みの例を説明する図である。

【発明を実施するための形態】

【0011】

以下、本発明を実施するための形態について、図を参照しながら説明する。なお、以下に説明する実施形態は、あくまでも一例であって、本発明の技術的範囲はこれに限られるものではない。本発明の技術的範囲には、様々な変形例も含まれる。

【0012】

図１は、本発明が適用された交通事故予測モデルを構築する方法の一例を説明する図である。
この交通事故予測モデルは、車両Ｄ、例えば自動二輪車を含む各種自動車等が通行する道路で発生する交通事故を予測するためのモデルである。本実施形態では、ＣＮＮを用いて構築することが想定されている。

【0013】

交通事故の予測は、対象道路ＤＲの対象区間を想定して行われる。そのために、対象道路ＤＲの対象区間で収集された情報が用いられる。この情報の収集を想定しているために、交通事故の予測を行う対象区間としては、車両感知器ＳＫが設置された場所を２つ以上、含む区間が選択される。

【0014】

図１で想定される対象道路ＤＲの対象区間は、片側３車線ＬＮの道路である。車両感知器ＳＫは、車線ＬＮ毎に設置されている。その車両感知器ＳＫは、例えば超音波送受器を用いたものであり、超音波を路面に向けて間欠的に発射するようになっている。そのため、車両感知器ＳＫは、反射波が入射するタイミングの違いにより、車両Ｄの有無だけでなく、車両Ｄの車高、長さも特定可能なものとなっている。車両Ｄの種類（車種）等は、車高、長さにより判断可能である。

【0015】

各車両感知器ＳＫは、例えば道路交通の安全と円滑のための交通管理用に設置されたものである。各車両感知器ＳＫにより得られた情報は、交通事故の防止、渋滞の解消等の役割を有する道路管理会社ＤＫにも提供される。道路管理会社ＤＫは、各車両感知器ＳＫにより得られた情報を処理して、トラフィックカウンターデータＴＣを含む各種データを生成する。

【0016】

トラフィックカウンターデータＴＣには、交通量、車両Ｄの速度の他に、時間占有率（ＯＣＣ）等が含まれる。時間占有率は、全体の時間のうちに車両Ｄが感知された時間が占める比率を表す情報である。トラフィックカウンターデータＴＣは、以降「トラカンデータＴＣ」と略記する。
道路管理会社ＤＫには、その役割から、交通事故に関する情報、気象（天候）情報等が提供される。交通事故に関する情報は、警察、監視カメラ等から収集される。

【0017】

本実施形態では、道路管理会社ＤＫにより提供可能なデータを説明変数として用いることを想定している。このことから、本実施形態では、道路管理会社ＤＫにより提供可能なデータを想定して、説明変数（独立変数）の候補を選定し、選定した候補のうちから、交通事故予測モデルに実際に用いる説明変数を選定する。図１には、説明変数の候補として、天候、曜日、休日、速度、交通量、時間帯、事故発生間隔、時間占有率等が選定されたことを示している。

【0018】

選定した候補のうちからの説明変数の選定には、統計的検定法が用いられる。ここでの統計的検定処理Ｓ１は、統計的検定法により、交通事故発生との関係性を候補別に確認するために行われる処理である。本実施形態では、統計的検定法として、カイ二乗検定を採用している。なお、統計的検定法としては、カイ二乗検定に限定されない。

【0019】

説明変数の選定に統計的検定法を用いるのは、以下の理由からである。
交通事故の多くは、運転者の不注意、或いは速度超過等が原因である。しかし、各運転者や各車両Ｄのリアルタイムの情報を得るのは非常に困難である。このことから、交通事故の予測精度の向上のためには、交通事故前の特性を間接的に表現するデータを交通事故の予測に用いることが考えられる。

【0020】

交通事故は、それぞれ固有の状況下で発生すると考えられる。その状況の特徴を推定するためには、大量の事故データが必要となる。しかし、交通事故の発生頻度は比較的に低く、大量の事故データが得られる可能性は非常に低いのが実情である。

【0021】

交通事故が発生した状況は、複数の説明変数を用いて分類することが可能である。しかし、説明変数の数が増えるほど、複数の説明変数で分類される状況下で発生した交通事故の数は少なくなって、必要な事故データが得られる可能性は更に低くなる。その一方では、学習が複雑になって、適切な交通事故予測モデルの構築がより困難になる。

【0022】

このようなことから、事故予測精度を向上させるためには、より多くの説明変数を用いるのではなく、事故直前の特性を限られた説明変数で表現する必要がある。そこで、本実施形態では、カイ二乗検定を用いて、説明変数を選定することにより、説明変数の数を抑えつつ、交通事故の予測精度を向上させるアプローチを採用している。

【0023】

説明変数として、速度、交通量、及び時間占有率を用いた従来の交通事故予測モデル（例えば、非特許文献１参照）では、事故リスクを予測できる可能性が示唆されている。このことから、本実施形態では、この交通事故予測モデルをベースモデルとし、他の有効な説明変数の選定にカイ二乗検定を用いている。ここでは、理解を容易とするために、説明変数の候補としては、天候、曜日、休日、時間帯、及び事故発生間隔の五つのみを想定することとする。

【0024】

これら候補のうちの事故発生間隔は、「交通事故が発生しやすい状況では、交通事故がより頻繁に発生する可能性がある」という仮説に基づき、生存時間分析の考え方を取り入れて選定したものである。生存時間分析とは、ある事象が発生するまでの時間を調べることである。例えば、生存時間ｔまでの生存確率を示す生存関数を考えると、ｔが大きくなるにつれて生存関数は減衰し、ゼロに近づいていく。本実施形態では、交通事故という事象が発生するまでの生存時間分析を行った。

【0025】

この生存時間分析では、先ず、ある交通事故が発生してから次の交通事故が発生するまでの時間を集計した。次に、交通事故が発生してからの経過時間の範囲を３０分とし、０～３０分、３０～６０分、．．．のように、各時間範囲で発生した交通事故の数を集計した。それにより、事故発生間隔は、以下のように算出している。なお、事故発生間隔の算出方法は、特に限定されるものではない。

【0026】

ｒ_Ｃ＝Ｎａｃｃ^Ｃ／Ｎａｃｃ（１）
ここで、Ｃはカテゴリ数（３０分間を単位に、交通事故からの経過時間を表現した数）、Ｎａｃｃ^Ｃはカテゴリ数Ｃで発生した交通事故数、Ｎａｃｃは全交通事故数である。

【0027】

図２は、説明変数の選定のために想定した調査対象の例を説明する図である。
有効な説明変数とは、交通事故発生との関連性の高いものである。本実施形態では、図２に示すように、説明変数として有効な候補を確認するための調査対象として、東名高速道路を選択し、東名高速道路の御殿場ＩＣ（InterChange）から東京ＩＣまでの上り区間を調査対象区間として選択している。この調査対象区間は、区間１～４に分け、区間１～４のそれぞれで候補の有効性を確認している。区間１～４は全て３車線ＬＮである。以降、区間１～４を纏めて「総調査対象区間」とも表記し、区別する。
車両感知器ＳＫは、区間１には１２台、区間２には８台、区間３、４にはそれぞれ１２台が設置されている。各車両感知器ＳＫにより、例えばトラカンデータＴＣは５分間隔で得られる。

【0028】

交通事故の要因は、交通状態によって大きく異なる。
交通量が比較的に多く、周囲の車両Ｄに拘束される度合いが比較的に高い重交通状態（第１の状態）では、交通事故の原因は、主に不注意によるものである。車間距離が比較的に短くなって、周囲の確認が困難になることも交通事故の原因の一つであると考えられる。特に大型車が多い場合、周囲の確認だけでなく、交通標識等の確認もより困難となる。このようなこともあり、交通事故としては、他の車両Ｄと接触して起こる接触事故が大部分となる。実際、交通事故の大部分は、重交通状態時に発生することが知られている。

【0029】

これに対し、重交通状態より拘束される度合いが低い軽交通状態（第２の状態）では、交通事故の原因は、主に速度超過等であると思われる。交通事故としては、単独事故（自損事故）が多い。このように、交通状態により、交通事故の原因、その種類が異なることから、本実施形態では、重交通状態に着目し、候補の確認を行っている。それにより、図２には、区間、区間の長さとともに、交通量の多い状況での事故データ数、事故なしデータ数の各例を示している。データ数は、３０分を調査対象期間とした調査対象期間数、つまりカテゴリ数で表している。

【0030】

図３は、平均交通量と空間平均速度の関係例を示す散布図である。この散布図は、調査対象である東名高速道路中のある区間でのものである。
交通量に応じた交通状態の分類法としては、交通容量の５５％の交通量を境界に、交通状態を重交通状態、軽交通状態に分類するものがある（例えばGeistefeldt, J., “Assessment of Basic Freeway Segments in the German Highway Capacity Manual HBS 2015 and Beyond”, Transportation Research Procedia, 2016, vol.15, p.421.）。本実施形態では、この分類法を採用している。

【0031】

この分類法について、空間平均速度ＳＶと、平均交通量ＳＱを用いて具体的に説明する。空間平均速度ＳＶ、平均交通量ＳＱは、それぞれ次のように表される。

【0032】

【数1】

【0033】

ここでｉは時空間における空間分割単位の番号、ｊは時空間における時間分割単位の番号、ｑ_ｉｊは番号ｉ、ｊで指定される分割単位での交通量、Ｌ_ｉは車両感知器ＳＫの間隔（距離）、ｖ_ｉｊは番号ｉ、ｊで指定される時空分割単位での車両Ｄの速度、ｋ_ｉｊは番号ｉ、ｊで指定される時空分割単位での密度（＝ｑ_ｉｊ／ｖ_ｉｊ）である。

【0034】

このようにして求められる空間平均速度ＳＶとしては、想定する交通容量に達する限界速度を考慮して６０（ｋｍ／ｈ）に設定した。今回の調査対象区間である３車線ＬＮ区間の平均の交通容量は約５１３５（ｖｅｈ／ｈ）である。このことから、境界における平均交通量ＳＱは、ＳＱ＝５１３５×０．５５＝２８２５（ｖｅｈ／ｈ）となる。それにより、平均交通量ＳＱが２８２５（ｖｅｈ／ｈ）未満の場合は軽交通状態、平均交通量ＳＱが２８２５（ｖｅｈ／ｈ）以上の場合は重交通状態とそれぞれ分類するようにしている。

【0035】

平均交通量ＳＱが２８２５（ｖｅｈ／ｈ）未満の場合であっても、速度ｖ_ｉｊが特に低ければ、速度ｖ_ｉｊを上げられない理由が存在すると考えられる。本実施形態では、その理由が、交通渋滞の発生にあるとして、重交通状態に分類するようにしている。それにより、図３に示すように、散布図で軽交通状態と分類されるのは、左上の矩形部分内の範囲となる。統計的検定処理Ｓ１は、重交通状態、軽交通状態に分類せず全てのデータを用いて行っている。
なお、交通状態の判定は、別の指標を用いて行うようにしても良い。例えば時間占有率を用いて、交通状態の判定を行うようにしても良い。

【0036】

複数の車線ＬＮが存在する場合、車線ＬＮ毎に車両感知器ＳＫが設置されるのが普通である。このこともあり、上記のような交通状態の判定を複数の車線ＬＮが存在する対象区間で行う場合、交通状態の判定は、最も交通量の多い車線ＬＮに着目して行っても良いが、平均を求めて、求めた平均により行うようにしても良い。このこともあり、交通状態の判定方法は、特に限定されない。しかし、対象区間の交通状態の詳細を把握できるようになることから、車線ＬＮ毎の交通状態を判定することは、予測精度をより向上させるうえで有効である。

【0037】

本実施形態では、３車線ＬＮの平均に着目して交通状態の判定を行うようにしている。これは、或る時点で各車線ＬＮの交通状態に違いがあったとしても、その違いがなくなる方向に各車線ＬＮの交通状態が変化すると考えられるからである。一方、最も交通量の多い車線ＬＮに着目する場合であっても、同様に、全体としては交通状態が同じようなものになると考えられる。このようなことから、何れの交通状態に着目するとしても、３車線ＬＮの交通状態を適切に判定できると考えられる。

【0038】

図４は、統計的検定処理の例を示すフローチャートである。本実施形態では、図２にフローチャート例を示す統計的検定処理Ｓ１により、調査対象説明変数の各候補のうち、実際に用いる説明変数を選定する。

【0039】

図４にフローチャート例を示す統計的検定処理Ｓ１は、プログラムにより情報処理装置に実行させる場合を想定したものである。このことから、処理を実行する主体としては、情報処理装置を想定する。なお、人の制御、或いは操作により、図４に示すような手順に沿って処理を行わせても良い。それにより、図４に例を示すフローチャート中の一部の処理を情報処理装置に行わせるようにしても良い。

【0040】

統計的検定処理Ｓ１の実行の前に用意されたテストデータのサンプル数は膨大である。カイ二乗検定では、サンプル数が大きすぎると、統計的に有意な結果が出やすくなる傾向がある。このことから、統計的検定処理Ｓ１では、テストデータ中から使用するものを抽出し、カイ二乗検定の結果を確認することを複数回、繰り返し行うようになっている。

【0041】

統計的検定処理Ｓ１では、先ず、情報処理装置は、カイ二乗検定を行った回数を計数するための変数Ｋに０を代入する（ステップＳ１１）。次に情報処理装置は、変数Ｋの値をインクリメントする（ステップＳ１２）。その後、情報処理装置は、テストデータ中から今回のカイ二乗検定に用いるものを抽出するサンプリングを行い（ステップＳ１３）、更に抽出したテストデータを用いて、クロス集計表を作成する（ステップＳ１４）。

【0042】

クロス集計表は、交通事故発生との関連を確認するために用いられる表であり、テストデータから得られた観測値が纏められている。交通事故発生との関連を確認するための各期待値は、クロス集計表の観測値を用いて求められる。情報処理装置は、クロス集計表の作成後に、各期待値をまとめた期待度数表を作成する（ステップＳ１５）。

【0043】

カイ二乗検定で正しい結果を得るためには、求めた期待値がある値以上であることが求められる（例えばコクランの規則）。このことから、期待度数表の作成後、情報処理装置は、算出した期待値の最小値が閾値Ｔｈを超えているか否か判定する（ステップＳ１６）。期待値のうちに閾値Ｔｈ以下のものが一つ以上、存在した場合（ステップＳ１６のＮｏ）、上記ステップＳ１３に戻り、テストデータのサンプリングが行われる。一方、全ての期待値が閾値Ｔｈを超えていた場合（ステップＳ１６のＹｅｓ）、情報処理装置は、クロス集計表、及び期待度数表から、カイ二乗値を算出する（ステップＳ１７）。その後、情報処理装置は、カイ二乗値に基づくｐ値を算出する（ステップＳ１８）。

【0044】

ｐ値の算出後、情報処理装置は、変数Ｋの値が予め定めた繰り返し回数Ｔ以上か否か判定する（ステップＳ１９）。変数Ｋの値が繰り返し回数Ｔ以上であった場合（ステップＳ１９のＹｅｓ）、情報処理装置は、ｐ値の平均値を算出する（ステップＳ２０）。その後、統計的検定処理Ｓ１が終了する。一方、変数Ｋの値が繰り返し回数Ｔ未満であった場合（ステップＳ１９のＮｏ）、上記ステップＳ１２に戻る。それにより、繰り返し回数Ｔ分のカイ二乗値が算出される。

【0045】

ｐ値は、カイ二乗値を変換して得られる値（確率）である。一般的には、ｐ値が有意水準未満となった場合、帰無仮説を棄却するようになっている。本実施形態でも、ｐ値の平均値が有意水準未満となった候補を、帰無仮説が棄却されたものとしている。つまり、交通事故発生との関連性が存在するとしている。なお、有意水準は０．０５である。

【0046】

図５は、各候補に対してカイ二乗検定を行った結果の例を説明する図である。図５（ａ）～図５（ｅ）に、天候、曜日、休日、時間帯、事故発生間隔の各候補の結果を個別に示している。全ての候補で結果を区間１～４に分けて示している。

【0047】

図５に示すカイ二乗検定の結果は、５つの候補のうち、時間帯、事故発生間隔は交通事故発生との関連性があることを表している。このことから、本実施形態では、ベースモデルに対し、時間帯、事故発生間隔を説明変数として選定している。

【0048】

時間帯、事故発生間隔の追加により、交通事故の予測精度が実際に向上するとは限らない。つまり、予測精度が実際には向上しないか、或いは低下する可能性がある。このことから、予測精度がベースモデルより向上するか否かを確認するために、精度検証処理Ｓ２が行われる。

【0049】

本実施形態では、精度検証処理Ｓ２は、ベースモデルに時間帯、事故発生間隔の２つを説明変数として追加するモデルを新たに構築し、ベースモデルの予測精度と対比することで行っている。新たに構築したモデルは以降「提案モデル」と表記する。

【0050】

図６は、構築した提案モデルの例を示す概念図である。
上記のように、ベースモデルは、ＣＮＮモデルをベースにし、説明変数の数は、速度、交通量、時間占有率の３つである。ＣＮＮモデルには、入力層、中間層（隠れ層）、出力層（完全連結層）の３つに大別される層が存在する。

【0051】

提案モデルでは、ベースモデルから、入力層に時間帯を１チャンネルとして追加することにより、データを時空間で分散させ、時間帯別の交通特徴の違いを情報として与えるようにしている。入力層で表す矩形は、データが時空間で分散されていることを示している。つまり、例えば縦軸、及び横軸のうちの一方は時間、他方は空間をそれぞれ表している。時間での分散は、例えば５分間隔である。

【0052】

事故発生間隔は、図６に示すように、出力層に１ユニット６１を追加し、時空間特徴量から抽出された値として入力させている。これは、事故発生間隔は、入力層に入力されるデータ（説明変数の内容を表す情報）とは異なる、特定の時間間隔で事故が発生するリスクを表す値であるためである（式（１）参照）。出力層に追加した１ユニット６１に、事故発生間隔に応じた値を入力することにより、他の４つの説明変数の内容と組み合わせた交通事故の予測を行うことができる。この１ユニット６１を出力層に追加することにより、提案モデルは、重交通状態時における交通事故の予測に対応させたものとなっている。入力層に入力される他の説明変数を表す値は何れも、重交通状態時のものである。

【0053】

図２に示す区間１～４を対象区間とする場合、車両Ｄが時速５０ｋｍで走行すると仮定すると、３０分が経過するまでの間に、何れの区間でも始点から終点まで車両Ｄが通過し終わることになる。このことから、図６に例を示す提案モデルでの交通事故の予測は、現在から１時間前までのデータを用いて、現在から３０分後までを範囲として行うようにしている。
評価指標としては、一般的に分類モデルの評価指標として用いられている混同行列とＦ１スコアを用いた。

【0054】

図７は、混合行列の例を説明する図である。
混同行列は、図７に示すように、モデルの予測結果を実際の分類クラス毎に集計したものである。混合行列では、トゥルー（Ｔ）、フォルス（Ｆ）は、予測の真偽を示す。トゥルー（Ｔ）は予測が真、つまり予測が正しいことを示し、フォルス（Ｆ）は予測が偽、つまり予測が誤っていることを示す。また、ポジティブ（Ｐ）、ネガティブ（Ｎ）は、予測結果の内容を真偽で示す。ポジティブ（Ｐ）は、真と予測、つまり交通事故が発生と予測したことを示し、ネガティブ（Ｎ）は、偽と予測、つまり交通事故が発生しないと予測したことを示す。それにより、例えばトゥルー・ポジティブ（ＴＰ）は、真のものを真と予測、つまり実際に発生した交通事故を発生すると予測したことを表している。

【0055】

Ｆ１スコアは、統計解析で精度を測る指標の一つであり、適合率、再現率を用いて算出される。混同行列からは、以下のように算出できる。
Ｆ１スコア＝（２×適合率×再現率）／（適合率＋再現率）（４）
ここで、適合率は、適合率＝ＴＰ／（ＴＰ＋ＦＰ）により計算され、再現率は、再現率＝ＴＰ／（ＴＰ＋ＦＮ）により計算される。

【0056】

Ｆ１スコアは、０～１の範囲内の値である。１に近いほど、予測精度が高いことを示している。
なお、精度を測る指標はＦ１スコアに限定されない。別の指標であっても良く、評価方法は採用する指標に合わせて決定すれば良いものである。

【0057】

図８は、提案モデルで交通事故の予測を行った場合に、各区間で算出されたＦ１スコア、適合率、再現率の各値の例を示す図である。図８では、比較のために、ベースモデルでの各値の例も併せて示している。

【0058】

提案モデルとベースモデルの予測精度を比較した場合、図８に示すように、区間２を除いて、提案モデルのほうがＦ１スコア、及び適合率は高く、再現率は低くなっている。それにより、提案モデルはベースモデルよりも誤認識が少ない、つまり予測精度が高いことが分かる。

【0059】

図９は、提案モデルとベースモデルの各Ｆ１スコアの例を区間別に示す図である。図９では、図８から抽出した各Ｆ１スコアの他に、Ｆ１スコアの平均値、及び改善率を併せて示している。改善率（％）は、Ｆ１スコアの平均値を用いて算出される値であり、ここでは改善率＝（提案モデルのＦ１スコアの平均値－ベースモデルのＦ１スコアの平均値）×１００／ベースモデルのＦ１スコアの平均値、により求めている。

【0060】

図９に示すように、提案モデルをベースモデルと比較した場合の改善率は１９．１（％）である。このことからも、提案モデルは、ベースモデルよりも予測精度が改善され、より高精度に交通事故を予測できることが分かる。

【0061】

このことは、ベースモデルに説明変数として追加した時間帯、事故発生間隔が予測精度の改善に寄与していることを意味している。このような時間帯、事故発生間隔が説明変数として有効なことは、図５に示すように、カイ二乗検定の結果が示唆している。それにより、説明変数の選定にカイ二乗検定に代表される統計的検定が有効であることが分かる。選定した説明変数の候補が実際に有効か否かを事前に、且つ高精度に予測できることから、より高精度の交通事故予測モデルの構築をより短時間に、且つより容易に行ううえで、統計的検定を用いることが有効である。

【0062】

図１０～図１３は、提案モデルで交通事故の予測を行った場合に、１日を複数の期間に分け、算出されたＦ１スコア、適合率、再現率の各値の例を期間別に示す図である。図１０～図１３では、区間別に分けつつ、図８と同じく、比較のために、ベースモデルでの各値の例も併せて示している。各値が全て０となっている期間は、交通事故が発生していない、または発生した交通事故を予測できていない期間である。ここで、図１０～図１３を参照しつつ、区間別に予測結果について説明する。

【0063】

１日は、図１０～図１３に示すように、０：００～５：５９、６：００～１１：５９、１２：００～１７：５９、１８：００～２３：５９の４期間に分けている。しかし、事故発生期間は、上記のように、３０分間隔毎に算出している。このことから、各期間は、実際には、事故発生期間を算出する時間間隔で更に分けられている。

【0064】

図１０は、区間１でのＦ１スコア、適合率、再現率の各値の例を示している。
区間１では、図１０に示すように、６：００～１１：５９の期間、提案モデルはベースモデルよりもＦ１スコアが高くなっている。区間１は、東京へ向かう車両Ｄによる朝のラッシュアワーが発生し、渋滞する。この渋滞時に事故が多いという特徴がある。時間帯、事故発生間隔を追加したことにより、６：００～１１：５９の期間では、この特徴を事故の予測に反映できたものと考えられる。

【0065】

図１１は、区間２でのＦ１スコア、適合率、再現率の各値の例を示している。
区間２では、図１１に示すように、Ｆ１スコアは、提案モデルがベースモデルよりも概して低いか、或いは同じ値となっている。このような結果になった理由としては、区間２では、両モデルに含まれる速度、交通量、時間占有率の事故への寄与度が時間帯、事故発生間隔よりも高いためと考えられる。

【0066】

図１２は、区間３でのＦ１スコア、適合率、再現率の各値の例を示している。
区間３では、図１２に示すように、Ｆ１スコア、適合率は、１２：００～１７：５９、１８：００～２３：５９の２期間で提案モデルがベースモデルより高くなっている。この区間３には、繁忙期、或いは休日等に、夕方から夜にかけて、首都圏に戻ってくる車両Ｄが多く、渋滞を発生するという特徴がある。２区間で予測精度がベースモデルより向上しているのは、時間帯、事故発生間隔を説明変数として追加したことにより、その特徴を予測に反映できたためと考えられる。

【0067】

図１３は、区間４でのＦ１スコア、適合率、再現率の各値の例を示している。
区間４では、図１３に示すように、Ｆ１スコア、適合率は、６：００～１１：５９、１２：００～１７：５９の２期間で提案モデルがベースモデルより高くなっている。この区間４には、６：００～１１：５９の期間は渋滞となることが少なく、事故も少ないという特徴がある。一方、１２：００～１７：５９の期間は、区間３で発生した渋滞の影響が及ぶこともあり、繁忙期、土日祝日には渋滞が発生しやすいという特徴がある。そのような特徴がそれぞれ存在する２期間では、時間帯、事故発生間隔を説明変数として追加したことにより、その特徴を予測に反映できているものと考えられる。６：００～１１：５９の期間については、渋滞となることが少ないという特徴から、説明変数として加えた時間帯が予測精度の向上に大きく寄与していると考えられる。

【0068】

図１に示す精度検証処理Ｓ２では、区間別の予測精度の確認だけでなく、期間別の予測精度の確認を行っている。このような確認の結果、新たに説明変数として選定した時間帯、事故発生間隔は、特に重交通状態時における予測精度を向上させるうえで有効なことが確認できた。それにより、任意の対象道路ＤＲの任意の対象区間で発生する交通事故を予測する交通事故予測モデルの構築ＭＫを行っている。

【0069】

図１４は、説明変数の組み合わせによる予測精度の差を確認した結果の例を説明する図である。
ここで対象としたのは、８つの説明変数である。それにより、総組み合わせ数は２５４である。本実施形態では、２５４通りの説明変数の組み合わせの全てでＣＮＮベースのモデルを構築し、予測精度の確認を通して、更に時間帯、事故発生間隔の有効性を検証している。図１４は、各ＣＮＮベースモデルで得られたＦ１スコアの例を示したものである。なお、８つの説明変数とは、例えば天候、曜日、休日、速度、交通量、時間帯、事故発生間隔、時間占有率である。

【0070】

図１４において、ＢＭはＦ１スコアが最も高かったモデル（ベストモデル）、ＰＭは提案モデル、ＰＡはベースモデルをそれぞれ表している。
ベストモデルＢＭでの説明変数の組み合わせは、速度、交通量、曜日、休日、時間帯、事故発生間隔である。説明変数の組み合わせに時間帯、事故発生間隔が含まれていることから、時間帯、事故発生間隔は説明変数として有効であることが確認できる。また、説明変数の選定に統計的検定法が有効であることも確認できる。

【0071】

以降は、図１５～図１８を参照し、本発明の一実施形態に係る情報処理装置について詳細に説明する。この情報処理装置は、上記提案モデルを実装させたものである。
図１５は、本発明の情報処理装置の一実施形態に係るＡＰ（APplication）サーバが設置された環境の一例を説明する図である。

【0072】

図１５に示す例では、ＡＰサーバ１は、上記提案モデルが実装された情報処理装置であり、道路管理会社ＤＫに設置されている。ＡＰサーバ１は、ＬＡＮ（Local Area Network）等のネットワーク５に接続されている。そのネットワークＮには他に、ＤＢ（Data Base）サーバ２、情報収集装置３、及び端末４等が接続されている。

【0073】

なお、図１５に例を示す環境は、あくまでも一例であり、その環境は特に限定されない。ＡＰサーバ１、ＤＢサーバ２等は、クラウドサービスを利用して設置するようにしても良い。このこともあり、ＡＰサーバ１、ＤＢサーバ２等を含む何れのノードの設置場所は特に限定されない。何れのノードも任意の場所に設置させることが可能である。

【0074】

情報収集機器群ＪＧは、車両感知器ＳＫ等を含む情報収集用の各種道路設備群である。情報収集機器群ＪＧを構成する各情報収集機器により得られた情報は、例えば別のネットワーク、或いは専用回線を介して、道路管理会社ＤＫに提供される。道路管理会社ＤＫに設置された情報収集装置３は、各情報収集機器により直接、或いは間接的に送信された情報への対応用である。情報収集装置３は、各情報収集機器から受信した情報をそのまま、或いは処理して、ＤＢサーバ２に保存させる。それにより、ＤＢサーバ２には、トラカンデータＴＣを含む各種交通情報が保存される。

【0075】

警察署ＫＳは、交通事故に対応し処理する。警察署ＫＳは、交通事故が発生した場合、そのことを電話、或いは所定の信号の送信等により、道路管理会社ＤＫに連絡する。交通事故の処理が終了した場合にも、同様にして、道路管理会社ＤＫに連絡する。この結果、ＤＢサーバ２には、発生した交通事故についての事故情報も保存される。事故情報の保存は、例えば情報収集装置３か、或いは端末４への操作者の操作により行われる。

【0076】

情報収集機器群ＪＧを用いた情報収集、及び交通事故についての事故情報の収集の何れにも、周知の方法を用いることができる。このこともあり、それらの収集方法は、収集した情報の保存の仕方を含め、特に限定されるものではない。つまり、周知の方法を用いることができるだけでなく、様々な変形を行っても良いものである。

【0077】

端末４は、ＡＰサーバ１の利用にも用いることができる。それにより、端末４を使用する操作者は、対象道路ＤＲ、対象区間、時間帯等で予測対象条件を指定しての交通事故の予測をＡＰサーバ１に行わせることができる。

【0078】

なお、ＡＰサーバ１は、道路管理会社ＤＫにより設置されるものでなくとも良い。つまり、別の組織が設置するものであっても良い。設置場所については、組織が管理する場所でなくとも良い。例えばクラウドサービスを利用し、ＡＰサーバ１等を設置するようにしても良い。ＡＰサーバ１、ＤＢサーバ２等を同じ場所に設置しなくとも良い。このようなことからも、図１５に示す環境例は一例であり、様々な変形が可能である。

【0079】

図１６は、本発明の情報処理装置の一実施形態に係るＡＰサーバのハードウェア構成の一例を示すブロック図である。次に図１６を参照し、ＡＰサーバ１のハードウェア構成例について具体的に説明する。なお、この構成例も一例であり、ＡＰサーバ１のハードウェア構成はこれに限定されない。

【0080】

ＡＰサーバ１は、図１６に示すように、ＣＰＵ（Central Processing Unit）１１、ＲＯＭ（Read Only Memory）１２、ＲＡＭ（Random Access Memory）１３、バス１４、入出力インターフェース１５、出力部１６、入力部１７、記憶部１８、通信部１９、及びドライブ２０を備えている。

【0081】

ＣＰＵ１１は、例えばＲＯＭ１２に記録されているプログラム、及び記憶部１８からＲＡＭ１３にロードされたプログラムを実行し、各種の処理を実現させる。記憶部１８からＲＡＭ１３にロードされるプログラムには、例えばＯＳ（Operating System）、及びそのＯＳ上で動作する各種アプリケーション・プログラムが含まれる。各種アプリケーション・プログラムには、本サービスの提供用に開発されたものが１つ以上、含まれる。

【0082】

ＲＡＭ１３には、ＣＰＵ１１が各種の処理を実行する上において必要なデータ等も適宜記憶される。そのデータには、ＣＰＵ１１が実行する各種プログラムも含まれる。各種プログラムは、ＲＡＭ１３に読み出されてＣＰＵ１１に実行される。

【0083】

ＣＰＵ１１、ＲＯＭ１２及びＲＡＭ１３は、バス１４を介して相互に接続されている。このバス１４にはまた、入出力インターフェース１５も接続されている。入出力インターフェース１５には、出力部１６、入力部１７、記憶部１８、通信部１９、及びドライブ２１が接続されている。

【0084】

出力部１６は、例えば液晶等のディスプレイである。出力部１６は、ＣＰＵ１１の制御により、各種画像、或いは各種画面を表示する。出力部１６は、ＡＰサーバ１に搭載されたものであっても良いが、必要に応じて接続されるものであっても良い。それにより、出力部１６は、必須の構成要素ではない。

【0085】

入力部１７は、例えばキーボード等の各種ハードウェア釦等を含む構成のものである。その構成には、マウス等のポインティングデバイスが１つ以上、含まれていても良い。操作者（主にシステム管理者）は、入力部１７を介して各種情報を入力することができる。この入力部１７も、ＡＰサーバ１に搭載されたものであっても良いが、必要に応じて接続されるものであっても良い。それにより、入力部１７も、必須の構成要素ではない。

【0086】

記憶部１８は、例えばハードディスク装置、或いはＳＳＤ（Solid State Drive）等の補助記憶装置である。データ量の大きいデータは、この記憶部１８に記憶される。
通信部１９は、ネットワークＮを介した他の情報処理装置との間の通信を可能にする。図１５に示すＤＢサーバ２、情報収集装置３、及び端末４は何れも、他の情報処理装置である。

【0087】

ドライブ２０は、磁気ディスク、光ディスク、光磁気ディスク、或いは半導体メモリカード等のリムーバブルメディア２５が着脱可能な装置である。ドライブ２０は、例えば装着されたリムーバブルメディア２５からの情報の読み取り、及びリムーバブルメディア２５への情報の書き込みが可能である。それにより、リムーバブルメディア２５に記録されたプログラムは、ドライブ２０を介して、記憶部１８に記憶させることができる。また、ドライブ２０に装着されたリムーバブルメディア２５は、記憶部１８に記憶されている各種データのコピー先、或いは移動先として用いることができる。

【0088】

本サービス用に開発されたアプリケーション・プログラムは、リムーバブルメディア２５に記録させて配布しても良い。インターネット等のネットワークを介して配布可能にしても良い。このことから、アプリケーション・プログラムを記録した記録媒体としては、ネットワークに直接的、或いは間接的に接続された情報処理装置に搭載、若しくは装着されたものか、或いは外部のアクセス可能な装置に搭載、若しくは装着されたものであっても良い。

【0089】

ＡＰサーバ１が備えるハードウェア資源は、アプリケーション・プログラムを含む各種プログラムによって制御される。その結果、ＡＰサーバ１上には、交通事故予測モデルとして上記提案モデルが実現され、端末４を使用する操作者の指示、或いは予め定められた設定に従って、対象道路ＤＲの対象区間で発生する交通事故の予測を行うことが可能となっている。

【0090】

図１７は、本発明の情報処理装置の一実施形態に係るＡＰサーバ上に実現される機能的構成の一例を示す機能ブロック図である。次に図１７を参照しつつ、ＡＰサーバ１上に実現される機能的構成の例について詳細に説明する。

【0091】

ＡＰサーバ１のＣＰＵ１１上には、機能的構成として、図１７に示すように、要求処理部１１１、データ取得制御部１１２、説明変数生成部１１３、事故予測部１１４、学習処理部１１５、及び画面生成部１１６が実現される。そのＣＰＵ１１は、通信部１９により、ＤＢサーバ２、情報収集装置３、及び端末４との間でネットワーク５を介したデータの送受信を行うことができる。

【0092】

これらの機能的な構成要素１１１～１１６は、本サービスの提供用に開発されたアプリケーション・プログラムを含む各種プログラムをＣＰＵ１１が実行することにより実現される。その結果として、記憶部１８には、トラカンデータ格納部１８１、説明変数格納部１８２、及び予測結果格納部１８３が情報格納用に確保される。

【0093】

ＡＰサーバ１には、交通事故の予測を含む各種機能が搭載されている。それにより、ＡＰサーバ１は、端末４等から送信される各種要求に対応する。要求処理部１１１は、通信部１９によって受信された要求を処理し、その要求に応じた機能を提供するための制御を行う。交通事故の予測に関わる各種要求の主なものとしては、交通事故の予測を指示するための予測要求、予測結果の出力を指示するための出力要求、提案モデル等の学習を指示する学習処理要求、等がある。

【0094】

データ取得制御部１１２は、交通事故の予測に必要なデータを取得するための制御を行い、その制御で取得されたデータを記憶部１８に確保されたトラカンデータ格納部１８１に格納する。トラカンデータＴＣは、データ取得制御部１１２によって取得される主なデータである。データ取得制御部１１２により取得されてトラカンデータ格納部１８１に格納されるデータとしては他に、事故情報等も含まれる。ここでは以降、便宜的に、事故情報は情報収集装置３から取得されるものと想定する。また、トラカンデータＴＣを含む交通事故の予測用のデータは以降、「交通データ」と総称する。

【0095】

普通、説明変数の内容は、交通事故予測モデルの入力用としては不適切である。このことから、説明変数生成部１１３は、例えばトラカンデータ格納部１８１に格納されている交通データを参照して、説明変数毎に、その内容を入力用にエンコードしたデータを生成し、生成したデータを説明変数格納部１８２に格納する。この説明変数生成部１１３は、本実施形態における情報取得手段に相当する。生成されたデータが、本実施形態における説明変数情報群に相当する。

【0096】

事故発生間隔は、例えば上記式（１）により算出される。それにより、説明変数生成部１１３は、交通データを参照して、式（１）により事故発生間隔を算出し、算出した事故発生間隔から、出力層の１ユニット６１に実際に入力すべき値を算出、或いは特定する。時間帯は、１日は２４時間であることから、例えば１時間のカテゴリで分け、０～２３の範囲内の整数で表す。そのような必要な操作が、説明変数毎に行われる。この操作は、基本的に数値化のためのものである。ラベルエンコーディング、及びターゲットエンコーディング等の各種エンコーディングは、何れも数値化手法の一つであり、且つ、操作のために採用可能な一手法である。入力用の説明変数については、以降、便宜的に「説明変数入力データ」と表記して区別する。

【0097】

説明変数入力データは、対象道路ＤＲ毎、対象区間毎に生成される。それにより、図２に示すように、総対象区間を区間１～４に分けての交通事故の予測が可能となっている。言い換えれば、そのような説明変数データの用意により、用意された説明変数データで指定される対象道路ＤＲの対象区間での交通事故の予測を可能にさせている。

【0098】

事故予測部１１４は、説明変数格納部１８２に格納された説明変数入力データを用いて、対象道路ＤＲの対象区間で発生する交通事故を予測し、その予測結果を記憶部１８に確保された予測結果格納部１８３に格納する。

【0099】

事故予測部１１４には、交通事故を予測する内容が異なる第１予測部１１４ａ、及び第２予測部１１４ｂが存在する。それにより、端末４の操作者は、例えば予測内容を選択することが可能となっている。例えば端末４から送信される予測要求内に、予測内容を示す予測種別情報を含めることにより、予測内容を操作者に選択させることができる。事故予測部１１４、この事故予測部１１４を構成する第１予測部１１４ａ、第２予測部１１４ｂは全て、本実施形態における事故予測手段に相当する。

【0100】

第１予測部１１４ａは、上記提案モデルによる交通事故の予測を実現させる。その予測は、図７に示すように、交通事故が発生するか否かである。
これに対し、第２予測部１１４ｂは、ＮＩＣＥ（Non-linear Independent Component Estimation）モデルにより、交通事故を予測する。

【0101】

ＮＩＣＥモデルは、高次元の複雑な密度関数をモデリングするディープラーニングフレームワークであり、データの非線形で決定論的な変形が学習される。ここでの変形とは、変形されたデータが分解された分布に準拠するように、潜在変数空間に写像するものである。訓練の基準は、対数尤度である。それにより、交通事故の予測は対数尤度で行われる。なお、潜在変数空間を表す潜在変数は、統計学において、直接は観察されないが、観測された他の変数から推定される変数のことである。

【0102】

図１８は、ＮＩＣＥモデルによる交通事故の予測を行う仕組みの例を説明する図である。
図１８に示すように、ＮＩＣＥモデルの構築でも、提案モデルと同様に、過去に観測されたトラカンデータＴＣ等から得られる説明変数入力データを用いた学習が行われる。この学習により構築されたＮＩＣＥモデルに対し、予測用のトラカンデータＴＣ等から得られる説明変数入力データを入力することにより、潜在変数空間での写像が求められる形で対数尤度が算出され、出力される。交通事故の予測を対数尤度で行うことから、交通事故あり、交通事故なしのそれぞれのケース別に、対数尤度を算出させることができる。

【0103】

交通事故の発生頻度は比較的に低い。このため、交通事故ありの説明変数入力データを学習用に十分な量、用意するのは非常に困難なのが実情である。しかし、交通事故の予測にＮＩＣＥモデルを採用した場合、つまり対数尤度により交通事故の予測を行う場合、交通事故なしの説明変数入力データのみを学習に用いることもできる。これは、ＮＩＣＥモデルでは、学習データと予測対象データとの間の対数尤度で交通事故の予測が行えるからである。ここでの学習データ、及び予測対象データが何れも、説明変数入力データである。
尤度は、特定の条件下における特定のデータの発生確率を指す。そのため、算出した対数尤度から、予測対象データの発生確率を算出することができる。それにより、例えば、対数尤度の小さい交通状態が観測された場合、その交通状態の発生確率が低いことを意味するため、操作者等は、予測対象データの異常度が高いことを確認することができる。
ＮＩＣＥモデルによる交通事故の予測を行う場合、上記のような利点がある。

【0104】

第２予測部１１４ｂは、上記のようなＮＩＣＥモデルが実装されている。それにより、第１予測部１１４ａとは異なるアルゴリズムで異なる種類の交通事故の予測を行う。第２予測部１１４ｂによる予測結果、及び第１予測部１１４ａによる予測結果はともに、予測結果格納部１８３に格納される。

【0105】

学習処理部１１５は、事故予測部１１４を構成する第１予測部１１４ａ、及び第２予測部１１４ｂに対する学習処理を行う。この学習処理では、例えば説明変数格納部１８２に格納されている説明変数入力データを用いた学習が行われる。この学習を通して、上記提案モデル、及び上記ＮＩＣＥモデルの構築もそれぞれ行うことができる。

【0106】

画面生成部１１６は、主に端末４に送信される画面（例えばＷｅｂページ）の生成を行う。生成される画面は、例えば要求処理部１１１に指示される。その指示により生成される画面には、第１予測部１１４ａ、或いは第２予測部１１４ｂによる交通事故の予測結果が配置されたものも含まれる。それにより、端末４を使用する操作者は、随時、第１予測部１１４ａ、或いは第２予測部１１４ｂによる交通事故の予測結果を確認することができる。また、予測結果を表すダウンロードも画面生成部１１６により可能となっている。

【0107】

なお、図１７には示していないが、事故予測部１１４には、軽交通状態時の交通事故を予測するための予測部が２つ含まれる。一つは、第１予測部１１４ａと同じく、交通事故が発生するか否かを予測するものである。もう一つは、第２予測部１１４ｂと同じく、交通事故あり、交通事故なしのそれぞれのケース別に、対数尤度を算出するものである。説明変数としては、例えばともに、速度、交通量、時間占有率、及び時間帯が用いられている。このようなものを事故予測部１１４に含めることにより、交通状態が重交通状態か否かにより、実際に用いられる予測部を切り換えての交通事故の予測が行われる。交通事故の予測は、交通事故が発生する確率を算出することで行っても良い。

【0108】

また、本実施形態では、対象道路ＤＲを高速道路としているが、対象道路ＤＲは高速道路以外の道路であっても良い。つまり一般道であっても良い。一般道であっても、その一般道で得られた説明変数入力データ（説明変数情報群）を用いた学習により、より高い精度での交通事故を予測できると期待される。
また、説明変数入力データは、説明変数生成部１１３が生成することにより取得されるが、説明変数入力データ自体を外部から直接、取得するようにしても良い。それにより、説明変数入力データを生成する装置自体は、特に限定されない。

【0109】

現在から３０分後までに発生する交通事故の予測のために、現在から６０分前までの説明変数入力データを用いているが、このような説明変数入力データを用いるのも一例である。例えば同じ天候、同じ時期、同じ曜日、同じ時間帯で得られた過去の説明変数入力データを用いて、交通事故の予測を行うようにしても良い。交通事故の予測のために、現在から６０分前までの説明変数入力データを用いているのは、日、時間帯により特有の交通状態となっていることも多いからである。つまり、交通事故を予測する日時の交通状態に近い説明変数入力データが得られる可能性が比較的に高いと期待できるからである。時間帯による交通状態の変化の傾向が予め確認できているような場合、直前に得られた交通データを操作し、操作した交通データから得られる説明変数入力データを交通事故の予測に用いるようにしても良い。このようなことから、交通事故の予測に用いる交通データ、説明変数入力データは特に限定されるものではない。

【0110】

本実施形態では、ＣＰＵ１１上に事故予測部１１４、及び学習処理部１１５を実現させているが、それらのうちの一つ以上をＧＰＵ（Graphics Processing Unit）上に実現させても良い。ＧＰＵの数は、２以上であっても良い。このことからも、ＡＰサーバ１のハードウェア構成は図１６に示す例に限定されない。搭載するＣＰＵ１１、及びＧＰＵの各数も限定されない。

【0111】

本実施形態では、交通量に応じた交通状態の分類により、交通状態を重交通状態、及び軽交通状態のうちの何れかに分類しているが、このような分類は一例である。特に重交通状態は、２以上に更に分類するようにしても良い。具体的には、例えば重交通状態は、混雑状態、及び渋滞状態の２つに更に分類しても良い。
高速道路では、混雑状態、及び渋滞状態の分類は、例えば車両Ｄの速度に着目して行っても良い。具体的には時速が４０ｋｍ以下の重交通状態時を渋滞状態、渋滞状態以外の重交通状態時を混雑状態とそれぞれ分類しても良い。重交通状態は、３以上に分類するようにしても良い。重交通状態となる期間が図１０等に示すように分けられたとしても、その期間内は、重交通状態の細分化に合わせ、細分化された状態別に分ける必要がある。

【0112】

このように、重交通状態を２以上に細分化する場合、事故発生間隔は、細分化した状態毎に算出するのが望ましい。これは、細分化した分類毎に、事故発生間隔に異なる傾向がある可能性が考えられるからである。それにより、重交通状態を細分化し、細分化した分類毎に、その分類で算出された事故発生間隔を用いた交通事故の予測を行うようにする場合、その予測精度が更に向上すると期待できる。

【符号の説明】

【0113】

１ＡＰサーバ、２ＤＢサーバ、３情報収集装置、４端末、１１ＣＰＵ、１８記憶部、１９通信部、１１１要求処理部、１１２データ取得制御部、１１３説明変数生成部、１１４事故予測部、１１４ａ第１予測部、１１４ｂ第２予測部、１１５学習処理部、１１６画面生成部、１８１トラカンデータ格納部、１８２説明変数格納部、１８３予測結果格納部。

【図1】