IP Force 特許公報掲載プロジェクト 2022.1.31 β版

知財求人 - 知財ポータルサイト「IP Force」

▶ 住友電気工業株式会社の特許一覧

特開2024-2642訓練装置、推定装置、及び学習済みモデル
<>
  • 特開-訓練装置、推定装置、及び学習済みモデル 図1
  • 特開-訓練装置、推定装置、及び学習済みモデル 図2
  • 特開-訓練装置、推定装置、及び学習済みモデル 図3
  • 特開-訓練装置、推定装置、及び学習済みモデル 図4
  • 特開-訓練装置、推定装置、及び学習済みモデル 図5
  • 特開-訓練装置、推定装置、及び学習済みモデル 図6A
  • 特開-訓練装置、推定装置、及び学習済みモデル 図6B
  • 特開-訓練装置、推定装置、及び学習済みモデル 図7
  • 特開-訓練装置、推定装置、及び学習済みモデル 図8
  • 特開-訓練装置、推定装置、及び学習済みモデル 図9
< >
(19)【発行国】日本国特許庁(JP)
(12)【公報種別】公開特許公報(A)
(11)【公開番号】P2024002642
(43)【公開日】2024-01-11
(54)【発明の名称】訓練装置、推定装置、及び学習済みモデル
(51)【国際特許分類】
   G06N 20/00 20190101AFI20231228BHJP
   G06N 3/08 20230101ALI20231228BHJP
【FI】
G06N20/00 130
G06N3/08
【審査請求】未請求
【請求項の数】9
【出願形態】OL
(21)【出願番号】P 2022101969
(22)【出願日】2022-06-24
(71)【出願人】
【識別番号】000002130
【氏名又は名称】住友電気工業株式会社
(74)【代理人】
【識別番号】110000280
【氏名又は名称】弁理士法人サンクレスト国際特許事務所
(72)【発明者】
【氏名】島村 拓志
(72)【発明者】
【氏名】岡山 藤治
(57)【要約】
【課題】 オフセット追従における変動パラメータを推定可能とする。
【解決手段】 本開示の一態様に係る装置は、未学習のモデルを記憶するメモリと、前記未学習のモデルの訓練を実行するプロセッサと、を備える訓練装置であって、前記未学習のモデルは、交通信号制御機を遠隔制御するための信号制御指令に含まれるデータを入力ノードとし、前記交通信号制御機が実行するオフセット追従における変動パラメータを出力ノードとするモデルであり、前記プロセッサは、前記信号制御指令に含まれるデータと、前記交通信号制御機が実行した制御内容を表す信号制御実行情報に含まれるデータとのセットを教師データとして、前記訓練を実行する。
【選択図】 図7
【特許請求の範囲】
【請求項1】
未学習モデルを記憶するメモリと、
前記未学習モデルの訓練を実行するプロセッサと、を備える訓練装置であって、
前記未学習モデルは、
交通信号制御機を遠隔制御するための信号制御指令に含まれるデータを入力ノードとし、前記交通信号制御機が実行するオフセット追従における変動パラメータを出力ノードとするモデルであり、
前記プロセッサは、
前記信号制御指令に含まれるデータと、前記交通信号制御機が実行した制御内容を表す信号制御実行情報に含まれるデータとのセットを教師データとして、前記訓練を実行する、訓練装置。
【請求項2】
前記入力ノードには、
サイクル長、スプリット、オフセット変更有無、追従方向指定、追従幅指定、オフセット追従監視、オフセット基準時刻、及びオフセット値のうちの少なくとも1つが含まれる、請求項1に記載の訓練装置。
【請求項3】
前記出力ノードには、
サイクル長、及び可変階梯の継続時間、又は当該可変階梯を含む複数の階梯の継続時間が含まれる請求項1又は請求項2に記載の訓練装置。
【請求項4】
前記プロセッサは、
前記交通信号制御機が遠隔動作中であることを条件として、前記訓練を実行する、請求項1又は請求項2に記載の訓練装置。
【請求項5】
前記プロセッサは、
前記交通信号制御機がオフセット同期中であることを条件として、前記訓練を実行する、請求項1又は請求項2に記載の訓練装置。
【請求項6】
前記プロセッサは、
前記交通信号制御機の動作が異常なしであることを条件として、前記訓練を実行する、請求項1又は請求項2に記載の訓練装置。
【請求項7】
交通信号制御機を遠隔制御するための信号制御指令に含まれるデータに基づいて、前記交通信号制御機が実行するオフセット追従における変動パラメータを出力するよう、演算処理装置を機能させるための学習済みモデルであって、
複数の入力ノードを含む入力層と、
複数の中間ノードを含む隠れ層と、
複数の出力ノードを含む出力層と、を有するニューラルネットワークから構成され、
前記ニューラルネットワークに含まれる各ノード間の重みとバイアスの値は、
前記信号制御指令に含まれる前記データを入力データと、前記交通信号制御機が実行した制御内容を表す信号制御実行情報に含まれるデータとのセットを教師データとして訓練された値である、学習済みモデル。
【請求項8】
学習済みモデルを記憶するメモリと、
交通信号制御機が実行するオフセット追従における変動パラメータを推定するプロセッサと、を備える推定装置であって、
前記学習済みモデルは、
請求項1に記載の訓練装置により訓練されたモデルであり、
前記プロセッサは、
前記交通信号制御機を遠隔制御するための信号制御指令に含まれるデータを前記学習済みモデルに入力して得られる出力データを前記変動パラメータとする、推定装置。
【請求項9】
データ変換ツールを記憶するメモリと、
交通信号制御機が実行するオフセット追従における変動パラメータを推定するプロセッサと、を備える推定装置であって、
前記データ変換ツールは、
学習済みモデルと同等又は近似するデータ変換を実行可能な変換ツールであり、
前記学習済みモデルは、
請求項1に記載の訓練装置により訓練されたモデルであり、
前記プロセッサは、
前記交通信号制御機を遠隔制御するための信号制御指令に含まれるデータを前記データ変換ツールに入力して得られる出力データを前記変動パラメータとする、推定装置。
【発明の詳細な説明】
【技術分野】
【0001】
本開示は、訓練装置、推定装置、及び学習済みモデルに関する。
【背景技術】
【0002】
特許文献1には、車両に信号情報を提供する路側中継装置が記載されている。
特許文献1の路側中継装置は、交通信号制御機を遠隔制御するために中央装置が送信する信号制御指令と、交通信号制御機が中央装置に送信する動作状態情報とに基づいて、車両向けの信号情報を生成する。また、路側中継装置は、車両との無線通信が可能な通信装置に、生成した車両向けの信号情報を送信する。
【先行技術文献】
【特許文献】
【0003】
【特許文献1】WO2021/152947
【発明の概要】
【発明が解決しようとする課題】
【0004】
信号制御指令によりオフセット変更が指示されると、交通信号制御機はオフセット追従を行う。この場合、交通信号制御機は、信号制御指令で指定される追従方向に、当該指令で指定される追従幅の範囲内でサイクル長などを段階的に変更させる。
しかし、オフセット追従において変動させるサイクル長などの変動パラメータの算出方法は、警察仕様等で規定されておらずメーカ固有の考え方に依拠する。従って、車両に信号情報を提供する場合に、オフセット追従中の正確な信号情報の把握が困難となる。
【0005】
本開示は、かかる従来の問題点に鑑み、オフセット追従における変動パラメータを推定可能とすることを目的とする。
【課題を解決するための手段】
【0006】
本開示の一態様に係る装置は、未学習モデルを記憶するメモリと、前記未学習モデルの訓練を実行するプロセッサと、を備える訓練装置であって、前記未学習モデルは、交通信号制御機を遠隔制御するための信号制御指令に含まれるデータを入力ノードとし、前記交通信号制御機が実行するオフセット追従における変動パラメータを出力ノードとするモデルであり、前記プロセッサは、前記信号制御指令に含まれるデータと、前記交通信号制御機が実行した制御内容を表す信号制御実行情報に含まれるデータとのセットを教師データとして、前記訓練を実行する。
【0007】
本開示の一態様に係るモデルは、交通信号制御機を遠隔制御するための信号制御指令に含まれるデータに基づいて、前記交通信号制御機が実行するオフセット追従における変動パラメータを出力するよう、演算処理装置を機能させるための学習済みモデルであって、複数の入力ノードを含む入力層と、複数の中間ノードを含む隠れ層と、複数の出力ノードを含む出力層と、を有するニューラルネットワークから構成され、前記ニューラルネットワークに含まれる各ノード間の重みとバイアスの値は、前記信号制御指令に含まれる前記データを入力データと、前記交通信号制御機が実行した制御内容を表す信号制御実行情報に含まれるデータとのセットを教師データとして訓練された値である。
【発明の効果】
【0008】
本開示によれば、オフセット追従における変動パラメータを推定することができる。
【図面の簡単な説明】
【0009】
図1図1は、情報提供システムの一例を示すブロック図である。
図2図2は、信号制御指令のフォーマットの一例を示す図である。
図3図3は、信号制御実行情報のフォーマットの一例を示す図である。
図4図4は、信号動作状態情報のフォーマットの一例を示す図である。
図5図5は、接続アダプタが生成する時限表の一例を示す図である。
図6A図6Aは、信号情報のデータ構造を示す図である。
図6B図6Bは、信号情報のヘッダ部及びデータ部に格納されるデータ値とデータの内容を示す説明図である。
図7図7は、モデルの構成例を示すブロック図である。
図8図8は、未学習モデルの訓練装置の構成例を示すブロック図である。
図9図9は、変動パラメータの推定装置の構成例を示すブロック図である。
【発明を実施するための形態】
【0010】
<本開示の実施形態の概要>
以下、本開示の実施形態の概要を列記して説明する。
(1) 本実施形態に係る訓練装置は、未学習モデルを記憶するメモリと、前記未学習モデルの訓練を実行するプロセッサと、を備える訓練装置であって、前記未学習モデルは、交通信号制御機を遠隔制御するための信号制御指令に含まれるデータを入力ノードとし、前記交通信号制御機が実行するオフセット追従における変動パラメータを出力ノードとするモデルであり、前記プロセッサは、前記信号制御指令に含まれるデータと、前記交通信号制御機が実行した制御内容を表す信号制御実行情報に含まれるデータとのセットを教師データとして、前記訓練を実行する。
【0011】
本実施形態の訓練装置によれば、上記の訓練により、信号制御指令に含まれるデータから変動パラメータを出力する学習済みモデルが生成される。
このため、学習済みモデルに信号制御指令に含まれるデータを入力することにより、オフセット追従における変動パラメータが出力される。従って、算出方法がメーカによって相違し得るオフセット追従における変動パラメータを推定することができる。
【0012】
(2) 本実施形態の訓練装置において、前記入力ノードには、例えば、サイクル長、スプリット、オフセット変更有無、追従方向指定、追従幅指定、オフセット追従監視、オフセット基準時刻、及びオフセット値のうちの少なくとも1つが含まれていてもよい。
その理由は、上記の少なくとも1つの情報は、交通信号制御機がどのようなアルゴリズムを採用するとしても、交通信号制御機がオフセット追従を行う場合に必要となるからである。
【0013】
(3) 本実施形態の訓練装置において、前記出力ノードには、例えば、サイクル長、及び可変階梯の継続時間、又は当該可変階梯を含む複数の階梯の継続時間が含まれていてもよい。
その理由は、オフセット追従において交通信号制御機が段階的に変動させるパラメータ(変動パラメータ)には、通常、サイクル長と可変階梯の秒数が含まれるからである。
【0014】
(4) 本実施形態の訓練装置において、前記プロセッサは、前記交通信号制御機が遠隔動作中であることを条件として、前記訓練を実行してもよい。
このようにすれば、遠隔制御中ではない交通信号制御機の信号制御実行情報に基づくモデルの訓練を防止でき、正常な教師データに基づく訓練を実行できる。
【0015】
(5) 本実施形態の訓練装置において、前記プロセッサは、前記交通信号制御機がオフセット同期中であることを条件として、前記訓練を実行してもよい。
このようにすれば、オフセット追従中ではない交通信号制御機の信号制御実行情報に基づくモデルの訓練を防止でき、正常な教師データに基づく訓練を実行できる。
【0016】
(6) 本実施形態の訓練装置において、前記プロセッサは、前記交通信号制御機の動作が異常なしであることを条件として、前記訓練を実行してもよい。
このようにすれば、故障と推定される交通信号制御機の信号制御実行情報に基づくモデルの訓練を防止でき、正常な教師データに基づく訓練を実行できる。
【0017】
(7) 本実施形態に係るモデルは、交通信号制御機を遠隔制御するための信号制御指令に含まれるデータに基づいて、前記交通信号制御機が実行するオフセット追従における変動パラメータを出力するよう、演算処理装置を機能させるための学習済みモデルであって、複数の入力ノードを含む入力層と、複数の中間ノードを含む隠れ層と、複数の出力ノードを含む出力層と、を有するニューラルネットワークから構成され、前記ニューラルネットワークに含まれる各ノード間の重みとバイアスの値は、前記信号制御指令に含まれる前記データを入力データと、前記交通信号制御機が実行した制御内容を表す信号制御実行情報に含まれるデータとのセットを教師データとして訓練された値である。
【0018】
本実施形態のモデルは、上記の訓練により、信号制御指令に含まれるデータから変動パラメータを出力するように重みとバイアスの値が調整された学習済みモデルである。
このため、学習済みモデルに信号制御指令に含まれるデータを入力することにより、オフセット追従における変動パラメータが出力される。従って、算出方法がメーカによって相違し得るオフセット追従における変動パラメータを推定することができる。
【0019】
(8) 本実施形態の一態様に係る推定装置は、学習済みモデルを記憶するメモリと、交通信号制御機が実行するオフセット追従における変動パラメータを推定するプロセッサと、を備える推定装置であって、前記学習済みモデルは、上述の訓練装置により訓練されたモデルであり、前記プロセッサは、前記交通信号制御機を遠隔制御するための信号制御指令に含まれるデータを前記学習済みモデルに入力して得られる出力データを前記変動パラメータとする。
【0020】
本実施形態の推定装置によれば、プロセッサが、交通信号制御機を遠隔制御するための信号制御指令に含まれるデータを学習済みモデルに入力して得られる出力データを変動パラメータとするので、算出方法がメーカによって相違し得るオフセット追従における変動パラメータを、信号制御指令から容易に推定することができる。
【0021】
(9) 本実施形態の別態様に係る推定装置は、データ変換ツールを記憶するメモリと、交通信号制御機が実行するオフセット追従における変動パラメータを推定するプロセッサと、を備える推定装置であって、前記データ変換ツールは、学習済みモデルと同等又は近似するデータ変換を実行可能な変換ツールであり、前記学習済みモデルは、上述の訓練装置により訓練されたモデルであり、前記プロセッサは、前記交通信号制御機を遠隔制御するための信号制御指令に含まれるデータを前記データ変換ツールに入力して得られる出力データを前記変動パラメータとする。
【0022】
本実施形態の推定装置によれば、プロセッサが、交通信号制御機を遠隔制御するための信号制御指令に含まれるデータをデータ変換ツールに入力して得られる出力データを変動パラメータとするので、算出方法がメーカによって相違し得るオフセット追従における変動パラメータを、信号制御指令から容易に推定することができる。
【0023】
本開示は、上記のような特徴的な構成を備えるシステム及び装置として実現できるだけでなく、かかる特徴的な構成をコンピュータに実行させるためのプログラムとして実現することができる。また、本開示は、システム及び装置の一部又は全部を実現する半導体集積回路として実現することができる。
【0024】
<本開示の実施形態の詳細>
以下、図面を参照して、本開示の実施形態の詳細を説明する。なお、以下に記載する実施形態の少なくとも一部を任意に組み合わせてもよい。
【0025】
〔情報提供システムの構成例〕
図1は、情報提供システム100の一例を示すブロック図である。
図1に示すように、本実施形態の情報提供システム100は、道路を通行中の車両6に信号灯器5の灯色状態を表す信号情報を提供するシステムであり、中央装置1、交通信号制御機2、接続アダプタ3、及び通信装置4を備える。
【0026】
中央装置1は、交通管制を担う事業者が保有するサーバである。中央装置1は、車両感知器及びプローブ車両(いずれも図示せず。)などから収集した交通情報に基づいて、複数の交差点を対象とする交通感応制御(集中制御)を行う。
交通感応制御には、系統区間に属する信号機群の動作を制御する「系統制御」、及び系統制御を道路網に拡張した「広域制御(面制御)」が含まれる。
【0027】
従って、中央装置1は、図1に示す交通信号制御機2を含む、管轄エリア内の複数の交通信号制御機との通信が可能である。中央装置1は、交通信号制御機2を遠隔制御するための方式として「テーブル制御方式」を採用する。
テーブル制御方式は、中央装置1が、サイクル、スプリット及びオフセットなどの信号制御パラメータを含む「信号制御指令」(図2参照)を交通信号制御機2に送信する方式である。この方式では、交通信号制御機2が、受信した信号制御指令に基づいて、信号灯器5の階梯ごとの継続時間を表す「時限表」(図5参照)を決定する。
【0028】
従って、中央装置1は、交通感応制御を実行すると、交差点ごとに信号制御指令を生成し、この信号制御指令を、信号灯器5の動作を制御する交通信号制御機2に送信する。
交通信号制御機2は、信号制御指令に基づいて自機が決定した時限表に従って、信号灯器5の灯色状態(青信号、赤信号、黄信号及び右折矢印など)を切り替える。時限表は、1サイクルごとに当該1サイクル分だけ生成される。
【0029】
テーブル制御方式では、交通信号制御機2は、前回サイクルに実施した制御内容を表す「信号制御実行情報」(図3参照)を、今回サイクルの開始時に中央装置1に送信する。
信号制御実行情報に格納される情報には、前回サイクルのサイクル開始時刻(最初の階梯の開始時刻)、実行された各階梯の秒数、実行されたオフセットの内容、実行された端末感応制御の種別を表す感応実行種別、及び、車両感知器の感知情報(交通量及び占有時間)などが含まれる。
【0030】
交通信号制御機2は、今回サイクルの動作状態を示す「信号動作状態情報」(図4参照)を中央装置1に送信することもできる。
信号動作状態情報には、例えば、実行中の現示状態と階梯番号を含む実行階梯情報、及び、自機の動作異常(タイマ異常やCPU異常など)を通知するための動作状況などが含まれる。実行階梯情報は、階梯が進行するタイミングで必ず中央装置1に送信される。
【0031】
接続アダプタ3は、次の機能1から機能3を有する。この点は、特許文献1の路側中継装置と同様である。なお、接続アダプタ3の内部構成については後述する。
機能1:中央装置1と交通信号制御機2との通信を中継かつ傍受する機能
機能2:中央装置1から受信した信号制御指令と、交通信号制御機2から受信した信号動作状態情報とから、車両向けの「信号情報」(図6参照)を生成する機能
機能3:信号情報の提供を無線で行う通信装置4との通信機能
【0032】
通信装置4は、信号情報を車両6に無線で提供するための通信装置であり、例えば、ITS(Intelligent Transport Systems)無線機、或いはセルラー通信の基地局である。
通信装置4がITS無線機である場合、信号情報は、ITS対応の車両6に無線送信される。通信装置4が基地局である場合、信号情報は、基地局からコアネットワークのクラウドサーバに転送される。クラウドサーバは、上記と同じ基地局又は別の基地局に信号情報を転送し、当該基地局が車両6に搭載された移動端末に信号情報を無線送信する。
【0033】
〔信号制御指令、信号制御実行情報、及び信号動作状態情報〕
図2は、信号制御指令のフォーマットの一例を示す図である。
図3は、信号制御実行情報のフォーマットの一例を示す図である。
図4は、信号動作状態情報のフォーマットの一例を示す図である。
これらのフォーマットは、社団法人新交通管理システム協会(UTMS協会)が発行する「U形交通信号制御機 U形通信アプリケーション規格」に規定されている。従って、各フォーマットに含まれるデータ内容は、当該規格書に定義されている。
【0034】
〔時限表〕
図5は、接続アダプタ3が作成する時限表の一例を示す図である。
図5の例では、1サイクルが次の8つの階梯(ステップ)から構成されている。
流入路R1は、第1方向(例えば東西方向)に延びる、歩行者灯器が設置された流入路である。流入路R2は、第1方向と交差する第2方向(例えば南北方向)に延びる、歩行者灯器が設置されていない流入路である。
【0035】
1PG:流入路R1の車両灯器と歩行者灯器の双方が青
1PF:流入路R1の車両灯器が青でかつ歩行者灯器が青点滅
1PR:流入路R1の車両灯器が青でかつ歩行者灯器が赤
1Y :流入路R1の車両灯器が黄でかつ歩行者灯器が赤
1AR:流入路R1及び流入路2の双方が赤(全赤)
2G :流入路R2の車両灯器が青
2Y :流入路R2の車両灯器が黄
2R :流入路R2の車両灯器が赤
【0036】
図5の例では、8つの階梯のうち、1PGと2Gは、オフセット追従や端末感応制御などの実行により変動し得る可変階梯である。このため、1PGと2Gの継続時間は、他の階梯と異なり固定長ではなく、範囲を持つ時間として定義される。
図5の例では、1PGの継続時間の範囲は30~50秒であり、2Gの継続時間の範囲は20~40秒である。交通信号制御機2は、オフセット追従や端末感応制御を実行中の場合には、制御結果に応じて1PG及び2Gの継続時間を決定する。
【0037】
〔車両向けの信号情報〕
図6は、車両向けの信号情報のフォーマットの一例を示す図である。
具体的には、図6Aは、信号情報のデータ構造を示す図である。図6Bは、信号情報のヘッダ部及びデータ部に格納されるデータ値とデータの内容を示す説明図である。図6Bの信号情報は、図5の時限表における流入路R1の信号情報である。
【0038】
図6Aに示すように、車両向けの信号情報は、ヘッダ部、データ部、及びフッタ部を含むデータ構造を有する。
ヘッダ部には、信号情報であることを示す識別子、信号情報のサイズ、及び提供対象の灯色数(図例では3つ)が含まれる。フッタ部にはCRC(Cyclic Redundancy Check)値などが格納される。データ部には、ヘッダ部で定義された灯色数分の灯色(1)~(3)の表示予定時間(図例では秒数)が格納される。
【0039】
図6Bにおいて、灯色(1)~(3)のデータ値(コード)と実際の信号灯色の対応関係は、次の通りである。
コードが「01」の信号灯色(1)=青信号
コードが「02」の信号灯色(2)=黄信号
コードが「03」の信号灯色(3)=赤信号
【0040】
図6Bに示すように、流入路R1において、灯色(1)(=青信号)の表示予定秒数の最短時間は40秒であり、最長時間は70秒である。
灯色(1)の最小保証時間には、実行中の階梯(1PG)以降の階梯において、車両灯器として同じ表示を行う場合の最短時間の合計値が格納される。図6Bの例では、1PFと1PRの最短時間の合計値として10秒が格納されている。
【0041】
流入路R1において、灯色(2)(=黄信号)の表示予定秒数の最短時間及び最長時間は、いずれも5秒である。
流入路R1において、灯色(3)(=赤信号)の表示予定秒数の最短時間及び最長時間は、いずれも55秒である。このように、最短時間と最長時間が一致する灯色の表示予定秒数は確定している。なお、表示予定時間は、100m秒又は10m秒単位などで表現してもよく、フォーマット自体も図6に示す形式に限定されない。
【0042】
〔接続アダプタの内部構成〕
図1に戻り、路側中継装置の一種である接続アダプタ3は、第1通信部31、第2通信部32、第3通信部33、制御部34、記憶部35、及び同期処理部36を備える。
第1通信部31は、中央装置1が採用する通信規格(例えばUD型伝送方式)に則った通信回線41を接続可能な通信ボードである。中央装置1と第1通信部31との通信経路には、ルータなどの他の中継装置が介在してもよい。
【0043】
第2通信部32は、交通信号制御機2が採用する通信規格(例えばU型伝送方式)に則った通信回線42を接続可能な通信ボードである。交通信号制御機2と第2通信部32との通信経路には、ルータなどの他の中継装置が介在してもよい。
第3通信部33は、通信装置4が採用する通信規格(例えばイーサネット:「イーサネット」は登録商標)に則った通信回線43が接続される通信ボードである。通信装置4と第3通信部33との通信経路には、ルータなどの他の中継装置が介在してもよい。
【0044】
制御部34は、1又は複数のCPU(Central Processing Unit)、及び1又は複数のRAM(Random Access Memory)を含む演算処理装置である。制御部34には、FPGA(Field-Programmable Gate Array)などの集積回路が含まれていてもよい。
制御部34は、記憶部35に格納されたコンピュータプログラム37をメインメモリ(RAM)に読み出し、当該プログラム37に従って所定の情報処理を行う。所定の情報処理には、通信フレームの中継処理、及び信号情報の生成処理などが含まれる。
【0045】
記憶部35は、HDD(Hard Disk Drive)及びSDD(Solid State Drive)などの不揮発性メモリを含む補助記憶装置よりなる。
記憶部35には、フラッシュROM(Read Only Memory)、USB(Universal Serial Bus)メモリ、又はSDカードなどが含まれていてもよい。
【0046】
同期処理部36は、所定の同期方式により、交通信号制御機2などの他の通信ノードと時刻同期を図るための処理部である。制御部34は、同期処理部36が生成するローカル時刻に従って、信号情報に含める各灯器の点灯又は消灯タイミングなどを決定する。
同期処理部36の同期方式は、例えば、GNSS(Global Navigation Satellite System)受信機の出力に基づく同期方式、NTP(Network Time Protocol)及びPTP(Precision Time Protocol)などの通信フレームを用いた同期方式などを採用し得る。
【0047】
制御部34は、信号制御指令及び信号動作状態情報に基づいて、交通信号制御機2と同様の制御動作をエミュレートすることができる。
例えば、制御部34は、信号制御指令に含まれる信号制御パラメータ(サイクル、スプリット及びオフセットなど)に基づいて、時限表(図5参照)を作成可能である。制御部34は、信号制御指令で指定される端末感応制御の種別に基づいて、交通信号制御機2と同種の端末感応制御を実行することもできる。
【0048】
制御部34は、作成した時限表に基づいて、車両向けの信号情報(図6参照)を生成する。制御部34による「信号情報の生成処理」の詳細は後述する。
制御部34は、車両向けの信号情報を生成すると、生成した信号情報を含む通信フレームを生成し、生成した通信フレームを第3通信部33に出力する。第3通信部33は、入力された信号情報を含む通信フレームを通信装置4に送信する。
【0049】
〔信号情報の生成処理〕
制御部34が実行する信号情報の生成処理には、次の処理1から処理4が含まれる。
制御部34は、以下の処理1から処理4を十分に短い所定の演算周期(例えば100m秒)で実行し、信号情報をほぼリアルタイムに更新する。
制御部34は、信号情報を第3通信部33に出力する場合、出力時点において最新(直近)の信号情報を出力する。
【0050】
処理1:時限表の作成
制御部34は、信号制御指令(図2参照)及び信号動作状態情報(図4参照)から、次回サイクルに適用する時限表を作成する。
時限表には、1サイクルに含まれる複数の階梯、各階梯の継続時間(例えば秒数)、及びサイクル開始時刻Tsなどが含まれる(図5参照)。
【0051】
具体的には、制御部34は、信号制御指令に含まれる階梯番号、スプリット1~6の基準値、+変動値、-変動値、サイクル長、及び、各階梯と各現示との関係を表す定数などに基づいて、時限表に含める複数の階梯と、各階梯の継続時間を求める。
【0052】
処理2:可変階梯の継続時間の算出
制御部34は、信号制御指令に含まれる感応許可から、交通信号制御機2が端末感応制御(車両感知器による感知情報に基づいて可変階梯を変化させる制御)を実施中か否かを判定する。
制御部34は、端末感応制御を実行中である場合は、信号制御指令に含まれる感応許可により指定される種別の端末感応制御(例えば、ジレンマ感応、バス感応又はギャップ感応など)を実行し、可変階梯の継続時間に反映させる。
【0053】
処理3:階梯の継続時間の補正
制御部34は、自身が算出した階梯の継続時間(第1時間)と、信号動作状態情報から算出した階梯の実行時間(第2時間)とに所定値以上の微差が生じた場合は、階梯変化時に送信される実行階梯情報の受信タイミングに基づいて、第1時間を補正する。具体的には、時限表に含まれる各階梯の継続時間を第2時間に合わせる。
【0054】
処理4:信号情報の作成
制御部34は、算出した階梯ごとの継続時間に基づいて、所定のフォーマットの信号情報(例えば図6参照)を作成する。信号情報には、各流入路における灯色、及び現時点以後の灯色ごとの表示予定時間(現時点からの残秒数)などが含まれる。
【0055】
〔オフセット追従時の課題と解決方法〕
オフセット追従とは、信号制御指令で指定されるオフセット値に即応せず、当該オフセット値に段階的に近づくようにサイクル長を延長又は短縮する制御のことである。
オフセット追従に関しては、交通流に与える影響を考慮して、例えばサイクル長の12.5%又は25%の追従幅を最大とする、及び追従開始から4サイクル以内に追従を完了するなどが規格で規定される。もっとも、交通信号制御機2は、信号制御指令で指示された追従幅と追従方向に従うことを条件として独自にオフセット追従を行う。
【0056】
すなわち、オフセット追従時に変動させるパラメータ(例えばサイクル長及び可変階梯の秒数など。:以下、「変動パラメータ」という。)の算出方法は、規格の範囲外であるため交通信号制御機2のメーカ固有のアルゴリズムに依拠する。
このため、接続アダプタ3の制御部34は、交通信号制御機2がオフセット追従を実行中である場合は、当該制御機2が独自のアルゴリズムで決定する変動パラメータを算出できないため、時限表をサイクル開始前に再現できない。従って、接続アダプタ3の制御部34が正確な信号情報を提供できなくなるという問題がある。
【0057】
本実施形態では、上記の課題を解消するため、信号制御指令を入力データとし、変動パラメータを出力データとし、信号制御指令と交通信号制御機2の制御実績である信号制御実行情報とのデータセットを教師データとして、未学習のモデルMUを訓練することにより、信号制御指令から変動パラメータを出力可能な学習済みのモデルMLを生成する。
具体的には、記憶部35のコンピュータプログラム37には、上記の訓練を制御部34に実行させる学習プログラム37Aが含まれる。
【0058】
すなわち、制御部34の機械学習は、モデルMUの訓練により変動パラメータを演算可能なモデルMLを生成する処理である。
以下、未学習のモデルMUを「未学習モデルMU」又は「モデルMU」と記載することがあり、学習済みのモデルMLを「学習済みモデルML」又は「モデルML」と記載することがある。また、未学習モデルMUと学習済みモデルMLの総称については「モデルMU,ML」と略記する。
【0059】
モデルMU,MLは、例えば、入力層と出力層の間に少なくとも1つの隠れ層(中間層)が介在するニューラルネットワークとして定義される。
モデルMU,MLの入力データは、信号制御指令に含まれる情報である。未学習モデルMUの教師データ(データセット)は、信号制御指令に含まれるデータと、交通信号制御機2の制御内容を表す信号制御実行情報に含まれるデータである。信号動作状態情報に含まれる情報は、訓練の要否判定のための条件データとして利用される。なお、信号制御実行情報に含まれる一部の情報(例えば「異常情報」)も、訓練の要否判定のための条件データとして利用される。
【0060】
〔モデルの構成例と訓練〕
図7は、モデルMU,MLの構成例を示すブロック図である。
図7に示すように、モデルMU,ULは、複数の入力ノードを含む入力層LIと、複数の中間ノードを含む隠れ層LHと、複数の出力ノードを含む出力層LOと、を有するニューラルネットワークである。ノード間の結合は、全結合又は一部結合のいずれでもよい。また、図例では隠れ層LHが1層であるが、2層以上でもよい。
【0061】
入力層LIの入力ノードには、信号制御指令に属する情報のうち、サイクル長、スプリット、オフセット変更有無、追従方向指定、追従幅指定、オフセット追従監視、オフセット基準時刻、及びオフセット値が含まれる。
その理由は、これらの情報は、交通信号制御機2がどのようなアルゴリズムを採用するとしても、交通信号制御機2がオフセット追従を行う場合に必要となるからである。従って、上記のすべての情報を入力ノードとすることが好ましいが、上記の情報のうちの少なくとも1つを採用することにしてもよい。
【0062】
出力層LOの出力ノードには、オフセット追従における変動パラメータの一例として、サイクル長Ci(i=1,2……)、1PGの継続時間Gi1(i=1,2……)、及び、2Gの継続時間Gi2(i=1,2……)が含まれる。
離散変数iは、オフセット追従の開始直後のサイクルを初回(i=1)とした場合のサイクルのカウント数である。例えば、オフセット追従を完了すべきサイクル数が4回以内に指定される場合は、離散変数iの最大値Nを4に設定すればよい。
【0063】
図7の教師データTDは、出力層LOの出力ノードの正解となるデータであり、サイクル長TCi(i=1,2……)、1PGの継続時間TGi1(i=1,2……)、及び、2Gの継続時間TGi2(i=1,2……)が含まれる。
サイクル長TCiの値は、信号制御実行情報(図3参照)の予定サイクル長から取得される。継続時間TGi1,TGi2の値は、信号制御実行情報の実行階梯n(n=1,2……24)の秒時から取得される。
【0064】
接続アダプタ3の制御部34は、教師データTDを用いて、ノード間の重みとバイアスが最適化されるようにモデルMUの訓練を行う。
かかる訓練により、未学習のモデルMUに含まれるノード間の重みとバイアスが適切な出力データ(変動パラメータ)が得られるように収束し、学習済みのモデルMLが生成されることになる。
【0065】
学習済みのモデルMLの生成が完了すると、制御部34は、信号制御指令から抽出したサイクル長、スプリット、追従方向指定、及び追従幅指定などのデータをモデルMLの入力層LIに入力し、サイクル長Ci、1PGの継続時間Gi1、及び2Gの継続時間Gi2をモデルMLに出力させる。
制御部34は、モデルMLが出力するサイクル長Ci、1PGの継続時間Gi1、及び2Gの継続時間Gi2を、次回サイクルの時限表(図5参照)の算出に利用する。
【0066】
〔訓練の実行条件〕
図7に示すように、接続アダプタ3の制御部34は、交通信号制御機2が遠隔制御中か否か(ステップST11)、及びオフセット同期中か否か(ステップST12)を判定する。これらの判定に必要な情報は、信号動作状態情報の「動作状況2」に含まれる。
そして、制御部34は、上記の各判定結果が肯定的である場合に限り、入力層LIへのデータ入力を有効(イネーブル)とする。
【0067】
これにより、遠隔制御中ではない交通信号制御機2、及びオフセット追従中ではない交通信号制御機2の信号制御実行情報に基づくモデルMUの訓練が未然に防止される。従って、正常な教師データに基づく訓練を実行できるようになる。
【0068】
また、接続アダプタ3の制御部34は、交通信号制御機2が異常なしか否かを判定する(ステップST13)。この判定に必要な情報は、信号制御実行情報の「異常情報」(タイマ異常又は時計異常などの識別情報)に含まれる。
そして、制御部34は、上記の判定結果が肯定的である場合に限り、入力層LIへのデータ入力を有効(イネーブル)とする。
【0069】
これにより、故障と推定される交通信号制御機2の信号制御実行情報に基づくモデルMUの訓練が未然に防止される。従って、正常な教師データに基づく訓練を実行できるようになる。
【0070】
〔未学習モデルの訓練装置〕
図8は、未学習モデルMUの訓練装置34Tの構成例を示すブロック図である。
具体的には、図8は、接続アダプタ3の制御部34の訓練機能に関するブロック図である。従って、訓練装置34Tは、物理的には制御部34と同じ演算処理装置であり、メモリ34Mとプロセッサ34Pとを備える。
【0071】
メモリ34Mは、少なくとも1つのRAMを含み、プロセッサ34Pは、少なくとも1つのCPU又はFPGAなどの集積回路を含む。メモリ34Mには、図7に示す未学習モデルMUが記録される。
プロセッサ34Pは、信号制御指令に含まれるデータと信号制御実行情報に含まれるデータを教師データとして未学習モデルMUを訓練する。訓練には次の処理T1から処理T6が含まれる。
【0072】
処理T1:データリセット
プロセッサ34Pは、モデルMUに含まれる各ノード間の重みとバイアスの値を初期値にリセットする。
【0073】
処理T2:訓練データの入出力
プロセッサ34Pは、信号制御指令から抽出した入力データ(サイクル長、スプリット、オフセット変更有無、追従方向指定、及び追従幅指定など)を、訓練データとしてモデルMUの入力層LIに入力し、モデルMUに出力データ(Ci,Gi1,Gi2)を算出させる。
【0074】
処理T3: 損失計算
プロセッサ34Pは、出力データ(Ci,Gi1,Gi2)と信号制御実行情報から抽出した教師データ(TCi,TGi1,TGi2)を比較して、両者の損失(例えば平均二乗誤差)を計算する。
【0075】
処理T4:重みとバイアスの探索
プロセッサ34Pは、勾配降下法などにより、損失が最小となるノード間の重みとバイアスの値が得られるまで処理T2と処理T3を繰り返す。
【0076】
処理T5:学習済みモデルMLの生成
プロセッサ34Pは、損失が最小となるノード間の重みとバイアスの値をメモリ34Mに記録し、当該重みとバイアスの値を有するモデルMUを学習済みモデルMLとする。
【0077】
処理T6:訓練の実行条件の判定
処理T2において、プロセッサ34Pは、信号制御実行情報と信号動作状態情報のうちの少なくとも1つに含まれる条件データ(例えば遠隔動作中か)に従って、訓練の実行条件を充足するか否かを判定する。プロセッサ34Pは、実行条件を充足する場合に限り、入力層LIへのデータ入力を許容する。
【0078】
〔変動パラメータの推定装置〕
図9は、変動パラメータの推定装置34Eの構成例を示すブロック図である。
具体的には、図9は、接続アダプタ3の制御部34のパラメータ推定機能に関するブロック図である。従って、推定装置34Eは、物理的には制御部34と同じ演算処理装置であり、メモリ34Mとプロセッサ34Pとを備える。
【0079】
メモリ34Mは、少なくとも1つのRAMを含み、プロセッサ34Pは、少なくとも1つのCPU又はFPGAなどの集積回路を含む。メモリ34Mには、図7に示す学習済みモデルMLが記録される。
プロセッサ34Pは、学習済みモデルMLを用いて、信号制御指令から取得した入力データXjから変動パラメータYkを演算する。具体的には、入力データXjをモデルMLの入力層LIに入力し、モデルMLが出力するデータを変動パラメータYkとする。
【0080】
図9に示すように、メモリ34Mは、入力データXjを変動パラメータYkに変換するデータ変換ツールDTを記憶することもできる。
データ変換ツールDTは、学習済みモデルMLと同等又は近似するデータ変換を実行するように作成された変換ツールであり、例えば、行列式又は参照テーブルなどの形式を有する。この場合、プロセッサ34Pは、入力データXjをデータ変換ツールDTに入力し、ツールDTの出力結果を変動パラメータYkとする。
【0081】
なお、「同等又は近似するデータ変換」とは、学習済みモデルMLの場合と厳密に一致する解を出力することを要求する趣旨ではなく、例えば、学習済みモデルMLの出力値に対して所定値(100m秒)以内の誤差で変動パラメータYkを出力できるデータ変換のことをいう。
【0082】
〔その他の変形例〕
上述の実施形態(変形例を含む。)は、すべての点で例示であって制限的なものではない。本開示の権利範囲は請求の範囲によって示され、請求の範囲と均等の意味及び範囲内での全ての変更が含まれることが意図される。
【0083】
上述の実施形態において、オフセット追従時の変動パラメータとして、可変階梯G1i,G2iの代わりに、例えば流入路R1の青時間と流入路R2の青時間など、可変階梯を含む複数の階梯の継続時間を採用してもよい。
また、変動パラメータの単位は、例えばサイクル長に対する比率(%)など、秒数以外の単位であってもよい。
【0084】
上述の実施形態において、モデルMUの訓練装置34T(図8)は、接続アダプタ3の演算処理装置(制御部34)ではなく、接続アダプタ3以外の中継装置又はサーバなどの情報処理装置(以下、「外部装置」という。)に搭載された演算処理装置でもよい。
この場合、外部装置の訓練装置34Tが生成した学習済みモデルMLを接続アダプタ3のメモリ34Mに格納すれば、接続アダプタ3の制御部34を変動パラメータの推定装置34Eとして運用可能となる。
【0085】
同様に、上述の実施形態において、変動パラメータの推定装置34E(図9)は、接続アダプタ3の演算処理装置(制御部34)ではなく、外部装置に搭載された演算処理装置であってもよい。
この場合、外部装置の推定装置34Eが演算した変動パラメータを接続アダプタ3に送信するようにすれば、接続アダプタ3は、受信した変動パラメータを時限表の作成に利用可能となる。
【符号の説明】
【0086】
1 中央装置
2 交通信号制御機
3 接続アダプタ(路側中継装置)
4 通信装置
6 車両
31 第1通信部
32 第2通信部
33 第3通信部
34 制御部(演算処理装置)
34T 訓練装置(演算処理装置)
34E 推定装置(演算処理装置)
34M メモリ
34P プロセッサ
35 記憶部
36 同期処理部
37 コンピュータプログラム
37A 学習プログラム
41 通信回線
42 通信回線
43 通信回線
100 情報提供システム
MU 未学習のモデル(未学習モデル)
ML 学習済みのモデル(学習済みモデル)
DT データ変換ツール
図1
図2
図3
図4
図5
図6A
図6B
図7
図8
図9