(19)【発行国】日本国特許庁(JP)
(12)【公報種別】特許公報(B1)
(11)【特許番号】
(24)【登録日】2025-07-18
(45)【発行日】2025-07-29
(54)【発明の名称】都市高速道路における交通事故の発生確率の予測方法、デバイス及び製品
(51)【国際特許分類】
G08G 1/00 20060101AFI20250722BHJP
G06N 20/00 20190101ALI20250722BHJP
【FI】
G08G1/00 C
G06N20/00 130
(21)【出願番号】P 2024128076
(22)【出願日】2024-08-02
【審査請求日】2024-08-02
(31)【優先権主張番号】202410675497.0
(32)【優先日】2024-05-28
(33)【優先権主張国・地域又は機関】CN
【早期審査対象出願】
(73)【特許権者】
【識別番号】522046210
【氏名又は名称】台州学院
(74)【代理人】
【識別番号】110002262
【氏名又は名称】TRY国際弁理士法人
(74)【代理人】
【識別番号】110000844
【氏名又は名称】弁理士法人クレイア特許事務所
(72)【発明者】
【氏名】何海傑
(72)【発明者】
【氏名】姚奕憧
(72)【発明者】
【氏名】曹紀興
(72)【発明者】
【氏名】田茂霖
(72)【発明者】
【氏名】于子瑩
(72)【発明者】
【氏名】曹建斌
【審査官】尾崎 和寛
(56)【参考文献】
【文献】特開2023-086112(JP,A)
【文献】特開2021-182189(JP,A)
【文献】特開2022-074223(JP,A)
(58)【調査した分野】(Int.Cl.,DB名)
G08G 1/00-99/00
G01C21/00-21/36
G01C23/00-25/00
G06N20/00
(57)【特許請求の範囲】
【請求項1】
「都市高速道路」とは、高架橋上のみを対象とする道路を指すものであり、
都市高速道路における交通事故の発生確率を予測する方法であって、
(A)所定の収集頻度に従って都市高速道路の複数車線それぞれからの交通流情報を取得し、複数車線分の交通流情報をまとめた集合を情報流の集合として取得する工程と、
(B)前記情報流の集合に含まれる各車線ごとの交通流情報について、
測定器によって収集されたデータの有効性をテストし、有効性を有する交
通流情報を取得する工程と、有効と判断された交通流情報において離散的に欠損
しているデータがある場合に、ランダムウォーク法を用いて推定補完し、推定し
た交通流情報を取得する工程と、
かかる有効性のある交通流情報および推定補完により得られた交通流情報を第1特性データとして決定する工程と、
(C)所定の設定時間帯内における、対象道路が所在する都市における全ての運行中タクシーのGPS軌跡データ、および同時間帯内に発生した交通事故の事故記録を収集して、GPS軌跡集合と事故記録集合を取得する工程と、
ここで、「設定時間帯」とは、事故記録集合中に記載された事故発生時刻を含む前後所定時間幅をもつ時間帯をいい、当該事故発生に関わる交通流を抽出するために設定された時間範囲を指し、
(D) 前記事故記録集合およびGPS軌跡集合に基づき、下記の処理を行って第2特性データを決定する工程であって、
高架下都市道路を走行するタクシーのGPS軌跡データを削除することにより、(高架橋上)の都市高速道路上を走行したタクシーのGPS軌跡データを抽出する工程と、
その抽出データのうち、前記各事故記録に対応する設定時間帯において高架橋上の都市高速道路を走行する全ての運行中タクシーのGPS軌跡データを第2特性データとして取得する工程と、
(E)前記第2特性データに基づいて、下記の手順で第3特性データ及び第4特性データを計算する工程であって、
(E1)前記(D)工程にて高架下データが削除された後の第2特性データを参照し、都市高速道路を構成する各高架橋の各道路区間について、前記道路区間を走行する各運行中タクシーの平均速度を算出し、これらのタクシー単位の平均速度を前記第3特性データとする工程と、
(E2)前記(E1)の高架橋上の道路区間のみから取得されたタクシー単位平均速度をさらに集約して各道路区間全体の平均速度を算出し、これを第4特性データとする工程と、
(F)前記第3特性データと第4特性データを、D-S証拠理論に基づくデータ融合手法を用いて統合し、前記道路区間における融合平均速度を取得する工程と、
(G)前記融合平均速度、前記第1特性データ、前記第2特性データ、前記第3特性データ及び前記第4特性データをリアルタイムの都市高速道路交通事故リスク予測モデルに入力して、交通事故の発生確率を取得する工程と、
(H)前記交通事故の発生確率と前記第1~第4特性データとを、クラス不均衡データのサンプリング手法であるBalanced Baggingを用いて処理し、訓練セットを取得する工程と、
(I)前記訓練セットを用いて、GBDTアルゴリズムにより構築された都市高速道路交通事故リスク予測モデルを訓練した後、XGBoostアルゴリズムを用いて該モデルを最適化し、最適化されたモデルを取得し、当該最適化されたモデルを使用して都市高速道路における交通事故の発生確率を予測する工程と、
を含むことを特徴とする都市高速道路における交通事故の発生確率の予測方法。
【請求項2】
請求項1に記載の予測方法において、
前記(B)の有効性テストとは、取得された交通流情報に対して、センサの異常値や収集タイミングの不整合、および一定閾値以上の連続欠損が含まれるか否かを判定する処理であり、当該テストで異常がないと判定された交通流情報を「有効性のある交通流情報」として取得し、もし部分的に欠損が存在する場合はランダムウォーク法を用いて推定補完することを特徴とする都市高速道路における交通事故の発生確率の予測方法。
【請求項3】
請求項1に記載の予測方法において、
前記(D)の工程において「高架下都市道路を走行する運行中タクシーのGPS軌跡データを削除する」理由は、都市高速道路の高架部と平面道路を区別し、高架橋上の交通流状況を正確に抽出するためであることを特徴とする都市高速道路における交通事故の発生確率の予測方法。
【請求項4】
請求項1に記載の予測方法において、
前記(E1)の「各運行中タクシーの平均速度」とは、特定の高架橋の特定道路区間を走行するタクシーについて、該道路区間の長さと当該タクシーの連続GPSデータから算出される区間平均速度を指すことを特徴とする都市高速道路における交通事故の発生確率の予測方法。
【請求項5】
請求項1に記載の予測方法において、
前記(E2)の「各道路区間の平均速度」とは、前記(E1)にて算出された複数のタクシー単位の平均速度を集約した道路区間全体の平均速度であることを特徴とする都市高速道路における交通事故の発生確率の予測方法。
【請求項6】
請求項1に記載の予測方法において、
前記(F)のD-S証拠理論とは、Dempster-Shafer理論に基づく不確実性を考慮した確率的推論手法であり、複数の異なるデータソース(第3特性データおよび第4特性データなど)から得られる証拠を統合することによって、融合平均速度を算出するデータ融合方式であることを特徴とする都市高速道路における交通事故の発生確率の予測方法。
【請求項7】
請求項1に記載の予測方法において、
前記(H)のBalanced Baggingとは、少数クラスの事故データと多数クラス非事故データとの不均衡を低減するために、両クラスのサンプルをバランスよく抽出する手法であり、複数のサブセットを作成・再サンプリングした後、それらサブセットで訓練した複数の分類器の結果を組み合わせることで最終的な訓練セットを生成する方式であることを特徴とする都市高速道路における交通事故の発生確率の予測方法。
【請求項8】
メモリ、プロセッサ及びメモリに格納されプロセッサ上で実行可能なコンピュータプログラムを含むコンピュータデバイスであって、前記プロセッサが前記コンピュータプログラムを実行して、請求項1~7のいずれか1項に記載の都市高速道路における交通事故の発生確率の予測方法を実現することを特徴とするコンピュータデバイス。
【発明の詳細な説明】
【技術分野】
【0001】
本発明は、安全運転の技術分野に関し、特に都市高速道路における交通事故の発生確率の予測方法、デバイス及び製品に関する。
【背景技術】
【0002】
都市高速道路における交通事故の発生確率の既存の予測方法の多くは、交通事故の巨視的な予測研究であり、断面のマイクロ波検出器によるデータと過去のデータに基づいて、交通事故リスク予測モデルを構築し、交通事故の危険箇所を特定し、道路交通の安全性を向上させるために、交通流の特性、車両の特性、ドライバーの特性、道路環境などと交通事故の発生確率との関係を説明する。本質的に、従来の交通事故予測は、交通事故の発生または不発生を予測することではなく、特定の道路における長期の平均事故頻度を推定することである。その欠点は、多様な空間範囲の交通流状態が事故のリスクに与える影響を完全に反映できないこと、同時に、事故の可能性をリアルタイムで予測し、事故の発生を事前に警告することができないことである。
【発明の概要】
【発明が解決しようとする課題】
【0003】
本発明の目的は、都市高速道路における交通事故の発生確率の予測方法、デバイス及び製品を提供することであり、多様な空間範囲の交通流状態が事故のリスクに与える影響を完全に反映し、事故の可能性をリアルタイムで予測し、事故の発生を事前に警告できる。
【課題を解決するための手段】
【0004】
上記の目的を達成するために、本発明は以下の解決策を提供する。
都市高速道路における交通事故の発生確率の予測方法であって、
所定の収集頻度に従って対象道路の各車線の交通流情報を収集して、情報流の集合を取得することと、
前記情報流の集合内の各交通流情報に対して有効性テストと欠損データ推定を行って第1特性データを取得し、前記第1特性データには、情報流の集合内の有効性のある交通流情報と、情報流の集合内の有効性のある交通流情報を推定して得られた交通流情報が含まれることと、
設定時間帯内の対象都市内の全ての運行中タクシーのGPS軌跡データと設定時間帯内の対象都市のすべての交通事故の事故記録を収集して、GPS軌跡集合と事故記録集合を取得し、前記対象都市は、対象道路が存在する都市であることと、
事故記録集合及びGPS軌跡集合に基づいて第2特性データを決定し、前記第2特性データは、GPS軌跡集合における各対象時間帯内の都市高速道路を走行する全ての運行中タクシーのGPS軌跡データであり、各対象時間帯は、事故記録集合中の各事故記録に対応する時間帯であることと、
第2特性データに基づいて、第3特性データ及び第4特性データを計算し、前記第3特性データには、第2特性データ内の各高架橋の各道路区間における各運行中タクシーの平均速度が含まれ、前記第4特性データには、各高架橋の各道路区間の平均速度が含まれることと、
第3特性データと第4特性データに基づき、D-S証拠理論を使用して融合平均速度を取得することと、
融合平均速度、第1特性データ、第2特性データ、第3特性データ及び第4特性データをリアルタイムの都市高速道路交通事故リスク予測モデルに入力して、交通事故確の発生確率を取得することと、
Balanced Baggingを使用して交通事故の発生確率、第1特性データ、第2特性データ、第3特性データ及び第4特性データを処理して訓練セットを取得することと、
訓練セットを使用して都市高速道路の交通事故リスク予測モデルを訓練及び最適化し、最適化されたモデルを取得し、最適化されたモデルを使用して、都市高速道路交通事故の発生確率を予測することを含む。
【0005】
また、前記情報流の集合内の各交通流情報に対して有効性テストと欠損データ推定を行って第1特性データを取得することは、具体的に、
前記情報流の集合内の各交通流情報に対して有効性テストして有効性を有する交通流情報を取得することと、
有効性を有する交通流情報に対して欠損データ推定を実行して、推定して得られた交通流情報を取得することと、
前記有効性を有する交通流情報及び推定して得られた交通流情報を第1特性データとして決定することが含まれる。
【0006】
また、事故記録集合及びGPS軌跡集合に基づいて第2特性データを決定することは、具体的に、
GPS軌跡集合における高架下都市道路を走行する運行中タクシーのGPS軌跡データを削除して対象軌道集合を取得することと、
対象軌道集合における各対象時間帯における全ての運行中タクシーのGPS軌道データを第2特性データとして決定することが含まれる。
【0007】
また、第2特性データに基づいて、第3特性データ及び第4特性データを計算することは、具体的に、
第2特性データと各高架橋の各道路区間の長さに基づいて、第2特性データの各高架橋の各道路区間における各運行中タクシーの平均速度を計算し、
第2特性データの各高架橋の各道路区間における各運行中タクシーの平均速度に基づいて各高架橋の各道路区間における平均速度を計算することが含まれる。
【0008】
また、訓練セットを使用して都市高速道路の交通事故リスク予測モデルを訓練及び最適化し、最適化されたモデルを取得することは、具体的に、
訓練セットを使用してGBDTアルゴリズムを用いて構築された都市高速道路の交通事故リスク予測モデルに対して訓練し、訓練された都市高速道路の交通事故リスク予測モデルを取得することと、
XGBoostアルゴリズムを使用して訓練された都市高速道路交通事故リスク予測モデルを最適化し,最適化されたモデルを取得することが含まれる。
【0009】
また、有効性を有する交通流情報に対して欠損データ推定を実行して、推定して得られた交通流情報を取得することは、具体的に、
ランダムウォーク法を使用して有効性を有する交通流情報に対して欠損データ推定を実行し、推定して得られた交通流情報を取得することが含まれる。
【0010】
コンピュータデバイスであって、メモリ、プロセッサ及びメモリに格納されプロセッサ上で実行可能なコンピュータプログラムを含み、前記プロセッサは前記コンピュータプログラムを実行して、前記都市高速道路における交通事故の発生確率を予測する方法を実現する。
【0011】
コンピュータプログラム製品であって、コンピュータプログラムを含み、当該コンピュータプログラムがプロセッサによって実行される場合、前記都市高速道路における交通事故の発生確率の上記予測方法を実現する。
【発明の効果】
【0012】
本発明によって提供される特定の実施例によれば、本発明は以下の技術的効果を開示する。
本発明は、前記情報流の集合内の各交通流情報に対して有効性テストと欠損データ推定を行って第1特性データを取得し、事故記録集合及びGPS軌跡集合に基づいて第2特性データを決定し、第2特性データに基づいて、第3特性データ及び第4特性データを計算し、第3特性データと第4特性データに基づき、D-S証拠理論を使用して融合平均速度を取得し、融合平均速度、第1特性データ、第2特性データ、第3特性データ及び第4特性データをリアルタイムの都市高速道路交通事故リスク予測モデルに入力して、交通事故確の発生確率を取得し、Balanced Baggingを使用して交通事故の発生確率、第1特性データ、第2特性データ、第3特性データ及び第4特性データを処理して訓練セットを取得し、訓練セットを使用して都市高速道路の交通事故リスク予測モデルを訓練及び最適化し、最適化されたモデルを取得し、最適化されたモデルを使用して、都市高速道路交通事故の発生確率を予測し、本発明は第3特性データ及び第4特性データを融合し、融合したデータ、交通流情報とGPS軌跡情報に基づいてモデルを訓練及び最適化することで、多様な空間範囲における交通流の状態が事故のリスクに及ぼす影響を完全に反映でき、最適化されたモデルに基づいて事故が発生する可能性をリアルタイムに予測し、事故を事前に警告できる。
【0013】
本発明の実施例または従来技術の技術的解決策をより明確に説明するために、実施例で使用する必要がある図面を以下に簡単に紹介するが、明らかに、以下の説明における図面は本発明の一部の実施例にすぎず、当業者であれば、創造的な努力をすることなくこれらの図面に基づいて他の図面を得ることができる。
【図面の簡単な説明】
【0014】
【
図1】本発明の実施例によって提供される都市高速道路における交通事故の発生確率の予測方法の原理図である。
【
図2】本発明の実施例によって提供されるデータの有効性を検査する方法のフローチャートである。
【
図3】本発明の実施例によって提供されるタクシーGPSデータ削除方法のフローチャートである。
【
図4】本発明の実施例によって提供される無事故グループ選択方法のフローチャートである。
【
図5】Balanced Baggingアルゴリズムの原理図である。
【
図6】本発明の実施例によって提供されるDS証拠理論の原理図である。
【
図8】本発明の実施例によって提供される都市高速道路における交通事故の発生確率を予測する方法のフローチャートである。
【発明を実施するための形態】
【0015】
本発明の実施例における技術的解決策は、本発明の実施例における図面を参照して以下に明確且つ完全に説明されるが、明らかに、説明した実施例は本発明の実施例の一部にすぎず、すべての実施例ではない。本発明の実施例に基づいて、創造的な努力なしに当業者によって得られる他のすべての実施例は、本発明の保護の範囲内に含まれる。
本発明の上記の目的、特徴及び利点をより明白且つ理解しやすくするために、以下、図面及び特定の実施例を参照して本発明をさらに詳細に説明する。
【0016】
本発明は、リアルタイム交通事故予測に関する綿密な研究の不足を補うための、都市高速道路における交通事故の発生確率の予測方法を提供する。
図8に示すように、都市高速道路における交通事故の発生確率の予測方法には次のステップが含まれる。
ステップ101:所定の収集頻度に従って対象道路の各車線の交通流情報を収集して、情報流の集合を取得する。
【0017】
ステップ102:前記情報流の集合内の各交通流情報に対して有効性テストと欠損データ推定を行って第1特性データを取得する。前記第1特性データには、情報流の集合内の有効性のある交通流情報と、情報流の集合内の有効性のある交通流情報を推定して得られた交通流情報(有効性のある交通流情報に対して推定して得られた欠損された交通流データ)が含まれる。
【0018】
ステップ103:設定時間帯内の対象都市内の全ての運行中タクシーのGPS軌跡データ及び設定時間帯内の対象都市のすべての交通事故の事故記録を収集して、GPS軌跡集合と事故記録集合を取得する。前記対象都市は、対象道路が存在する都市である。GPS軌跡データには、タクシーのナンバープレート番号、日付、時刻、乗客の状態、経度及び緯度、速度及び方向が含まれまるが、これらに限定されない。
【0019】
ステップ104:事故記録集合及びGPS軌跡集合に基づいて第2特性データを決定する。前記第2特性データは、GPS軌跡集合における各対象時間帯内の都市高速道路を走行する全ての運行中タクシーのGPS軌跡データであり、各対象時間帯は、事故記録集合中の各事故記録に対応する時間帯である。
【0020】
ステップ105:第2特性データに基づいて、第3特性データ及び第4特性データを計算し、前記第3特性データには、第2特性データ内の各高架橋の各道路区間における各運行中タクシーの平均速度が含まれ、前記第4特性データには、各高架橋の各道路区間の平均速度が含まれる。
【0021】
ステップ106:第3特性データと第4特性データに基づき、D-S証拠理論を使用して融合平均速度を取得する。
【0022】
ステップ107:融合平均速度、第1特性データ、第2特性データ、第3特性データ及び第4特性データをリアルタイムの都市高速道路交通事故リスク予測モデルに入力して、交通事故確の発生確率を取得する。
【0023】
ステップ108:Balanced Baggingを使用して交通事故の発生確率、第1特性データ、第2特性データ、第3特性データ及び第4特性データを処理して訓練セットを取得する。
【0024】
ステップ109:訓練セットを使用して都市高速道路の交通事故リスク予測モデルを訓練及び最適化し、最適化されたモデルを取得し、最適化されたモデルを使用して、都市高速道路交通事故の発生確率を予測する。
【0025】
実際の適用では、所定の収集頻度に従って対象道路の各車線の交通流情報を収集して、情報流の集合を取得することは、具体的に、
サイドマウント型断面マイクロ波測定器を利用して、対象道路の各車線路面の交通流情報を30秒ごとに収集し、一つの車線は複数のサイドマウント型断面マイクロ波測定器に対応する。一つの車線路面の交通流情報には、前記車線の全てのサイドマウント型断面マイクロ波測定器のデバイス番号、車線番号、収集日、流量(30秒以内に前記車線を通過する全ての車両の速度)、速度(30秒以内に前記車線で各マイクロ波車両測定器を通過する全ての車両の速度の平均値)、収集時間と時間占有率(30秒以内に、車両が前記車線における全てのマイクロ波車両測定器断面を通過した累積時間の30秒に対する比率)が含まれる。
【0026】
実際の適用では、その断面マイクロ波測定器によって収集された生データには部分的なエラーや欠損したセグメントが含まれている可能性があるため、リアルタイム交通流特徴を抽出する前に、その有効性をテストする必要がある。前記情報流の集合内の各交通流情報に対して有効性テストと欠損データ推定を行って第1特性データを取得することは、具体的に、
前記情報流の集合内の各交通流情報に対して有効性テストして有効性を有する交通流情報を取得することが含まれる。
図2に示すデータ有効性テストのステップに従って、データの有効性テストを実行し、テスト後の有効な交通流データを保存した。
【0027】
有効性テストに合格したデータについては、収集されたデータ自体が欠損している場合は、データの完全性を確保するために欠損している交通流データを推定する必要がある。
【0028】
実際の適用では、抽出された事故の時間と空間範囲に対応する交通流データの多くが離散的に欠損しているため、ランダムウォーク法を使用して有効性のある交通流情報に対して欠損データを推定し、推定して得られた交通流情報を取得する。ランダムウォークの式は、次のとおりである。
【0029】
【0030】
式では、X’t+1は、時刻t+1でのパラメータ推定値(本発明では、具体的に交通流、速度、または時間占有率を指す)であり、Xtは時刻tのパラメータ観測値、即ち、収集された値である。
【0031】
実際の適用では、設定時間帯内の対象都市の全ての交通事故の事故記録を収集し、GPS軌跡集合と事故記録集合を取得することは、具体的に、
対象都市の公安部門が対象都市における過去1年間のすべての事故記録を取得することである。各事故記録には、日付、時間、発生場所、ドライバー情報、事故情報及び事故の簡単な説明が含まれる。
【0032】
実際の適用では、事故記録集合及びGPS軌跡集合に基づいて第2特性データを決定することは、具体的に、
GPS軌跡集合における高架下都市道路を走行する運行中タクシーのGPS軌跡データを削除して対象軌道集合を取得することが含まれる。タクシーのGPSデータについては、都市高速道路は高架橋で存在するのが多いため、タクシーGPSの空間集約を行う場合には、現実的で効果な運行中タクシーが反映した実際の交通流情報を抽出するために、高架下の都市部道路を走行する車両を除外する必要があり、
図3に従って運行中タクシーのGPSデータを削除して、各事故に対応する時間帯に都市高速道路を走行している運行中タクシーを決定する。
【0033】
対象軌跡集合の各対象時間帯における全ての運行中タクシーのGPS軌道データを第2特性データとして決定する。各事故に対応する時間範囲内で都市高速道路を走行する運行中タクシーに対するGPS軌跡データが第2特性データである。
【0034】
実際の適用では、タクシーのGPS軌跡データはタクシー走行のGPS位置と車両の瞬間速度しか取得できないため、第2特性データに基づいて交通流速度の特徴のみが抽出され、第2特性データに基づいて、第3特性データ及び第4特性データを計算することは、具体的に、
第2特性データ及び各高架橋の各道路区間の長さに基づいて、第2特性データの各高架橋の各道路区間における各運行中タクシーの平均速度を計算することが含まれる。計算式は次のとおりである。
【0035】
【0036】
ここで、nは、特定高架橋の道路区間kにおける運行中タクシーpのGPS軌跡データの総数であり、Vqは運行中タクシーpの第q番目のGPS軌跡データの速度値を表し、Lは特定高架橋の道路区間kの長さであり、第3特性データとして、Vpは特定高架橋の道路区間kにおける運行中タクシーpの平均速度を示す。
【0037】
第2特性データの各高架橋の各道路区間における各運行中タクシーの平均速度に基づいて、各高架橋の各道路区間における平均速度を計算し、計算式は次のとおりである。
【0038】
【0039】
ここで、Mは特定高架橋の道路区間kの車両台数であり、第4特性データとして、Vkは特定高架橋の道路区間kの平均速度である。
【0040】
実際の適用では、第3特性データと第4特性データに基づき、D-S証拠理論を使用して融合平均速度を取得することは、具体的に、
D-S証拠理論は、異種センサーデータに対して効果的な融合モデルを構築でき、その原理は
図6に示すとおりである。
図6の(a)の部分はD-Sデータ融合方法を表し、即ち、すべてのデータは、D-Sデータ理論融合方式によって統一及び融合され、最後に融合完了しデータが出力される。
図6の(b)の部分は、別のD-Sデータ融合方法を示している。2組のデータをそれぞれ融合し、融合後のデータと別の組のデータを融合し、すべてのデータが融合を完了するまで融合し、最終的に融合が完了したデータを出力し、その2つの方法の効果は等価である。
【0041】
その具体的なステップ次のとおりである。
ステップ1:第3特性データと第4特性データに基づいて、次のDS証拠理論の知識識別フレームワークを構築する。
【0042】
【0043】
Vmircrove(t)とVGPS(t)がそれぞれ第4特性データ及び第3特性データから由来し、Vmircrove(t)は、t時間帯の断面マイクロ波測定器に基づく特定道路区間の平均速度、即ち高架橋の道路区間における運行中タクシーの平均速度を表し、VGPS(t)はt時間帯のタクシーGPS軌跡データに基づく特定道路区間の平均速度、即ち高架橋上の道路区間の平均速度を表し、両者が相互に排他的であると考えることができるため、F(t)のすべての要素で構成される冪集合は次のようになる。
【0044】
【0045】
ここで、X1(t)=Vmircroveは、決定が第4特性データの高架橋の特定道路区間の平均速度であることを表し、X2(t)=VGPSは、決定が第3特性データの高架橋の特定道路区間における運行中タクシーの平均速度であることを表し、X3(t)=Vmircrove(t)∩VGPS(t)は不確実な決定であり、X1(t)とX2(t)のどちらの決定か判別できないことを表す。
【0046】
ステップ2:二種類のデータソースの下で、異なる決定に対する基本的な信頼分配を次のように決定する。
基本的な信頼関数の分配は、特定の決定に対する支持の程度の定量的な基準であり、各決定の証拠でもある。
【0047】
【数6】
数6を基本信頼分配値と呼び、次の条件を満たす。
【0048】
【0049】
ここで、iは第i番目のデータソースによって提供される証拠を表し、jは第j番目の決定であり、mi(Xj(t))は第i番目のデータソースによって提供される証拠がXj(t)を裏付ける度合いを表し、決定Xj(t)の基本分配値と呼ばれ、Pj(Xj(t))は第i番目のデータソースにおけるXj(t)の基本確率分配関数であり、mi(φ)は決定φの基本分配値を表し、Xj(t)はステップ1における三種類の決定である。
【0050】
Pi(Xj(t))がVi(t)~N(ui(t),σ2
i(t)を満たすと仮定すると、ここで、ui(t)とσ2
i(t)はそれぞれ、第i類のデータソースの履歴データにおける、t時間帯における道路区間の平均速度の平均と分散を表す。Vi(t)は、t時間帯の第i類のデータソースの履歴データにおける道路区間の平均速度を表し、Pi(X1(t))は第i番目のデータソースにおけるX1(t)の基本確率分配関数を表し、Pi(X2(t))は第i番目のデータソースにおけるX1(t)の基本確率分配関数を表し、Pi(X3(t))は第i番目のデータソースにおけるX1(t)の基本確率分配関数を表す。
【0051】
Pi(Xj(t))の具体的な計算方法は以下の通りである。
【0052】
【0053】
ステップ3:第3特性データと第4特性データの二種類のデータソースのDemspster証拠に基づいて次のように二種類のデータソースを合成する。
【0054】
【0055】
ここで、Kは二種類のデータソースによって提供される証拠間の矛盾を表し、m1(B)は、第3特性データの基本確率分配関数を表し、m2(C)は第4特性データにおける基本確率分配関数を表し、1/Kが0に近づくほど、異なるデータソースから提供される証拠の矛盾が大きくなり、Aは上記の不確実な決定を表し、Bは上記の決定が第3特性データにおける特定道路区間の平均速度であることを示し、Cは上記の決定が第4特性データにおける特定道路区間の平均速度であることを示している。
【0056】
ステップ4:速度のウエート(weight)計算式に従って、二種類のデータソースのウエートを次のように決定する。
【0057】
第3特性データのt時間帯の平均速度に基づくウエートの計算式は次のとおりである。
【0058】
【0059】
第4特性データのt時間帯の平均速度に基づくウエート計算式は次のとおりである。
【0060】
【0061】
最後に、上記の式を代入すると、次のような二種類のデータソースを融合した後のt時間帯の平均速度が取得できる。
【0062】
【0063】
ここで、m(X1(t))は第4特性データソースの基本分配値を表し、m(X2(t))第3特性データソースの基本分配値を表し、ωmircrove第3特性データのウエートであり、ωGPSは第4特性データのウエート1-α(t)である。
【0064】
事故発生前の交通流の状況は事故リスクの大きさと密接な関係があるため、事故前状況と呼ばれる。そして、特定の条件下で事故が発生していない交通状況を正常な交通流状態と定義する。事故発生時と正常な交通流状態での交通流状態の変化を研究の上判断するために、事故グループのデータと比較するための対照グループ(即ち、正常な交通状態のデータ)を設定する必要がある。
図4で示す非事故群選択ステップに従って、対照グループのデータを明確にする。交通事故の発生は確率の低い出来事であるため、対照グループの実験データは事故グループの実験データよりも大幅に多くなり、したがって、リアルタイムの都市高速道路交通事故リスク予測モデルの作成は、不均衡なデータの分類問題になり、即ち、多数クラスのサンプル数が少数クラスのサンプル数よりもはるかに多い。これまで、交通事故予測モデルの作成では、不均衡なデータ分類の問題に対しては「ケース-コントロール」法が主に使用され、即ち、交通事故が発生した状態のデータをケースとして選択し、それに対応する非事故状態のデータをコントロールとして使用した。その後の多くの研究では、経験的手法に基づいて、ケースグループと対照グループのデータの比率を1:4としているが、経験的手法に基づいて1:4の比率を選択すると、大量の対照グループデータがモデルに含まれないことになり、モデルの予測性能が損なわれる可能性がある。そこで、本発明では、不平衡サンプルセットの処理方法として、Balanced Bagging統合サンプリング方法を採用した。Balanced Baggingを使用して交通事故の発生確率、第1特性データ、第2特性データ、第3特性データ及び第4特性データを処理して訓練セットを取得し、Balanced Baggingアルゴリズムの原理は
図5に示すとおりであり、対照グループデータと実験グループデータで構成されるセットを対照グループデータと実験グループデータの両方を含むサブセットに直接分割し、異なるサブセットで対照グループデータと実験グループデータのリサンプリングを行い、交通事故確率予測モデルを分類して複数の分類器を生成し、次に全ての分類器の結果を重み付けして組み合わせることで、最終的な訓練セットを得ることができる。
【0065】
実際の適用では、訓練セットを使用して都市高速道路の交通事故リスク予測モデルを訓練及び最適化し、最適化されたモデルを取得することは、具体的に次のことが含まれる。
訓練セットを使用してGBDTアルゴリズムを用いて構築された都市高速道路の交通事故リスク予測モデルに対して訓練し、訓練された都市高速道路の交通事故リスク予測モデルを取得する。
XGBoostアルゴリズムを使用して訓練された都市高速道路交通事故リスク予測モデルを最適化し,最適化されたモデルを取得する。
【0066】
実際の適用では、訓練セットを使用してGBDTアルゴリズムを用いて構築された都市高速道路の交通事故リスク予測モデルに対して訓練し、訓練された都市高速道路の交通事故リスク予測モデルを取得するステップは、具体的に、次のとおりである。
【0067】
ステップ1:初期の事故リスク予測目的関数y0’の構築:
【0068】
【0069】
yiは、訓練セットのi番目のサンプルグループに対応する交通事故の発生確率を表し、一つのサンプルグループには、対応する交通事故の発生確率、第1特性データ、第2特性データ、第3特性データ及び第4特性データが含まれ、cは、i番目のデータグループに対応する第1特性データ、第2特性データ、第3特性データ及び第4特性データを事故リスク予測モデルに入力して得られる予測値を示し、hitはt回目の反復の決定木モデルを表し、Nはサンプルのグループの総数を表す。
【0070】
損失関数は次のように定義できる。
【0071】
【0072】
ここで、nは訓練セットに含まれる全てのサンプルの総数を表し、y’tはt回目の反復の事故リスク予測目的関数を表す。
【0073】
事故リスク予測モデルは次のように定義できる。
【0074】
【0075】
ここで、hitはt回目の反復後の決定木モデルである。
【0076】
ステップ2:モデルを訓練して、t=1からT回までの反復を次のように行う。
1)t回目の反復回数における各実験グループと対照グループの事故リスク分類(i=1~N)の残差値ritを計算し、y’t-1はt-1回目の反復の事故リスク予測目的関数を表す。
【0077】
【0078】
2)訓練セットを使用して決定木モデルhitを構築する:
【0079】
【0080】
3)損失関数を最小化してウエートβ
tを計算し、目的関数y
t’を更新する。
【0081】
4)反復回数tを更新し、次の反復に進み、1)に戻り、t=Tになるまで反復して停止すると、訓練済みの都市高速道路交通事故リスク予測モデルを取得する。
【0082】
ステップ3:訓練済みの都市高速道路の交通事故リスク予測モデルを出力する。
【0083】
本発明により確立された都市高速道路における交通事故リスク予測モデルは良好な応用見通しを有する。本発明は、交通流パラメータに基づいて事故リスクの早期警告を可能にし、交通管理者は、適切な安全対策を講じるために、関連する交通情報を適時に発信することができる。
【0084】
本発明は、フルサンプル検出カテゴリに入る交通流データを測定するための断面マイクロ波測定器を実現したが、収集できるのは断面の交通流状況のみであり、道路区間全体の交通流情報を取得できるわけではない。タクシーのGPS軌跡データは、道路区間全体の交通情報を継続的に追跡することで、この欠点を効果的に克服できる。
図1に示すように、本発明は、DS証拠の理論的方法を使用して2種類のデータソースを統合し、交通事故リスクを予測するためのデータベースを提供することを提案する。Balanced Baggingリサンプリング手法は、事故サンプルデータと非事故サンプルデータのバランスをとるために使用され、リアルタイムの事故予測に関連する不均衡分類問題をより適切に解決した。最後に、都市高速道路におけるリアルタイム事故リスク予測の「ブラックボックスモデル」を、特徴量重要度分析と部分依存図に基づいて解釈し、関連する分析を行った。
【0085】
本発明によれば、交通管理部門は、交通事故のリスクを早期に警告し、タイムリーに交通警察管理を計画し、都市道路網の交通安全レベルをより効果的に向上させることができる。
【0086】
本発明は、都市道路における交通事故発生率を効果的に予測でき、交通関連管理部門が交通事故のリスクを的確に早期警告し、適時に交通管理スケジュールを作成し、交通事故を回避することができ、都市道路システムの交通安全レベルを効果的に向上させることができる。
【0087】
モデルの作成に関して、本発明は、統合された機械学習アルゴリズムであるXGBoostアルゴリズムによって駆動され、XGBoostアルゴリズムによって作成されたモデルは、都市高速道路におけるリアルタイムの交通流特性と事故リスクとの間の非線形関係をよりよく適合させることができ、より優れた解釈性を備えている。
【0088】
一つの実施例では、さらに、コンピュータデバイスを提供し、メモリ、プロセッサ及びメモリに格納されプロセッサ上で実行可能なコンピュータプログラムを含み、当該プロセッサはコンピュータプログラムを実行する場合、上記各方法の実施例に記載の都市高速道路における交通事故の発生確率を予測する方法を実現し、当該コンピュータデバイスはデータベースであってもよく、その内部構造図は
図7に示すとおりである。当該コンピュータデバイスは、プロセッサ、メモリ、入力/出力インターフェース(Input/Output、I/Oと略称)、及び通信インターフェースを含む。ここで、プロセッサ、メモリ、入力/出力インターフェースはシステムバスを介して接続され、通信インターフェースは入力/出力インターフェースを介してシステムバスに接続される。ここで、当該コンピュータデバイスのプロセッサは、コンピューティング及び制御機能を提供するために使用される。当該コンピュータデバイスのメモリには、不揮発性記憶媒体と内部メモリが含まれる。当該不揮発性記憶媒体には、オペレーティングシステム、コンピュータプログラム、データベースが格納されている。当該内部メモリは、不揮発性記憶媒体内のオペレーティングシステム及びコンピュータプログラムを実行するための環境を提供する。当該コンピュータデバイスのデータベースは、保留中のトランザクションを保存するために使用される。当該コンピュータデバイスの入力/出力インターフェースは、プロセッサと外部デバイスの間で情報を交換するために使用される。当該コンピュータデバイスの通信インターフェースは、ネットワーク接続を介して外部端末と通信するために使用される。当該コンピュータプログラムは、プロセッサによって実行される場合、一種類のデータ処理方法を実現する。
【0089】
一実施例では、コンピュータプログラムを含み、当該コンピュータプログラムがプロセッサによって実行される場合、上記の方法の実施例で説明した都市高速道路における交通事故の発生確率の上記予測方法を実現するコンピュータプログラム製品を提供した。
【0090】
説明する必要があるのは、本出願に関わる対象情報(対象デバイス情報、対象個人情報等を含むがこれらに限定されない)やデータ(解析に使用されるデータ、保存データ、表示データ等を含むがこれらに限定されない)は、全てがブジェクトによって承認された、またはすべての関係者によって完全に承認された情報及びデータであり、また、関連データの収集、使用、処理は、関連する法律、規制、基準に準拠する必要がある。
【0091】
上記の実施例の技術的特徴は、任意の方法で組み合わせることができ、説明を簡潔にするために、上記の実施例における各技術的特徴のすべての可能な組み合わせが説明されているわけではないが、これらの技術的特徴の組み合わせに矛盾がない限り、本明細書の範囲内にあるとみなすべきである。
【0092】
本明細書では、特定の例を使用して、本発明の原理と実装方法を説明し、上記の実施例の説明は、本発明の方法及びその中心となる概念を理解するためにのみ使用されると同時に、当業者にとっては、本発明の考え方に基づいて、特定の実装及び適用範囲に変更が生じるであろう。要約すると、本明細の内容は本発明を限定するものとして解釈されるべきではない。
【要約】 (修正有)
【課題】本発明は都市高速道路における交通事故の発生確率の予測方法、デバイス及び製品を開示し、安全運転の技術分野に関する。
【解決手段】予測方法には、第1特性データ、第2特性データ、第3特性データと第4特性データに基づき、融合平均速度を取得し、融合平均速度と四つの特性データを予測モデルに入力して、交通事故の発生確率を取得し、交通事故の発生確率と四つの特性データを処理して訓練セットを取得し、訓練セットを使用して都市高速道路の交通事故リスク予測モデルを訓練及び最適化し、最適化されたモデルを取得し、最適化されたモデルを使用して、都市高速道路交通事故の発生確率を予測することが含まれる。本発明は、異なる空間範囲における交通流状態が事故のリスクに及ぼす影響を完全に反映でき、事故の可能性をリアルタイムに予測し、事故を事前に警告できる。
【選択図】
図8