(19)【発行国】日本国特許庁(JP)
(12)【公報種別】公開特許公報(A)
(11)【公開番号】P2024147209
(43)【公開日】2024-10-16
(54)【発明の名称】データベース構築方法
(51)【国際特許分類】
G06F 16/215 20190101AFI20241008BHJP
G08G 1/16 20060101ALI20241008BHJP
G06F 16/23 20190101ALI20241008BHJP
【FI】
G06F16/215
G08G1/16 A
G06F16/23
【審査請求】未請求
【請求項の数】10
【出願形態】OL
(21)【出願番号】P 2023060078
(22)【出願日】2023-04-03
(71)【出願人】
【識別番号】516227490
【氏名又は名称】株式会社テクノアクセルネットワークス
(74)【代理人】
【識別番号】100159499
【弁理士】
【氏名又は名称】池田 義典
(74)【代理人】
【識別番号】100120329
【弁理士】
【氏名又は名称】天野 一規
(74)【代理人】
【識別番号】100159581
【弁理士】
【氏名又は名称】藤本 勝誠
(74)【代理人】
【識別番号】100106264
【弁理士】
【氏名又は名称】石田 耕治
(74)【代理人】
【識別番号】100139354
【弁理士】
【氏名又は名称】松浦 昌子
(74)【代理人】
【識別番号】100208708
【弁理士】
【氏名又は名称】河村 健志
(74)【代理人】
【識別番号】100215371
【弁理士】
【氏名又は名称】古茂田 道夫
(74)【代理人】
【識別番号】100187997
【弁理士】
【氏名又は名称】田中 厳輝
(72)【発明者】
【氏名】宮田 博司
(72)【発明者】
【氏名】有本 和民
【テーマコード(参考)】
5B175
5H181
【Fターム(参考)】
5B175CA07
5B175DA10
5B175HB03
5H181AA01
5H181BB04
5H181LL01
5H181LL02
5H181LL04
(57)【要約】 (修正有)
【課題】関連性のある複数のデータを逐次的に、かつ、コンパクトに蓄積するデータベース構築方法を提供する。
【解決手段】方法は、第1登録データ群と、第1登録データに基づいて生成される第2登録データ群と、第2登録データに、その生成に寄与した第1登録データを紐付ける枝と、登録データの確信度とが格納されているデータベースを構築するデータベース構築方法であって、データ追加工程S1は、新たな第1登録データ、新たな第2登録データおよび新たな枝を、データベースにすでに登録されている第1登録データ、第2登録データおよび枝とに対応付ける対応付けステップS11と、対応付けステップで対応付けられた既存の第1登録データおよび第2登録データの確信度を、対応する新たな第1登録データおよび第2登録データの確信度を用いて更新する確信度更新ステップS12と、を含む。
【選択図】
図6
【特許請求の範囲】
【請求項1】
複数の第1登録データが属する第1登録データ群と、
上記複数の第1登録データに基づいて生成される複数の第2登録データが属する第2登録データ群と、
上記第2登録データに、その生成に寄与した第1登録データを紐付ける枝と、
上記第1登録データおよび上記第2登録データの確信度と
が格納されているデータベースを構築するデータベース構築方法であって、
1または複数の新たな第1登録データおよび1または複数の新たな第2登録データと、上記新たな第2登録データの生成に寄与した第1登録データを紐付ける新たな枝とを、上記データベースに追加するデータ追加工程を備え、
上記データ追加工程が、
上記新たな第1登録データ、上記新たな第2登録データおよび上記新たな枝を、上記データベースにすでに登録されている既存の第1登録データ、既存の第2登録データおよび既存の枝と対応付ける対応付けステップと、
上記対応付けステップで対応付けられた上記既存の第1登録データおよび上記既存の第2登録データの確信度を、対応する上記新たな第1登録データおよび上記新たな第2登録データの確信度を用いて更新する確信度更新ステップと
を有するデータベース構築方法。
【請求項2】
上記確信度更新ステップで、更新される確信度が、既存の確信度および新たな確信度の平均値、最大値および最小値のうちのいずれかである請求項1に記載のデータベース構築方法。
【請求項3】
上記データ追加工程が、
上記確信度更新ステップ後に、上記対応付けステップで対応付けられた上記既存の枝の起点となる第1登録データの確信度および上記既存の枝の終点となる第2登録データの確信度を含む評価関数に基づいて、上記既存の枝を削除する枝苅ステップ
を有する請求項1に記載のデータベース構築方法。
【請求項4】
上記評価関数が、上記起点となる第1登録データの確信度および上記終点となる第2登録データの確信度の積、相加平均値、相乗平均値、最大値または最小値を含む請求項3に記載のデータベース構築方法。
【請求項5】
上記枝苅ステップにおいて、上記評価関数が上記起点となる第1登録データの確信度および上記終点となる第2登録データの確信度に対して単調増加する関数であり、上記評価関数の値が所定値以下または所定値未満となる場合に枝が削除される請求項3に記載のデータベース構築方法。
【請求項6】
上記枝苅ステップにおいて、上記評価関数が上記起点となる第1登録データの確信度および上記終点となる第2登録データの確信度に対して単調減少する関数であり、上記評価関数の値が所定値以上または所定値超となる場合に枝が削除される請求項3に記載のデータベース構築方法。
【請求項7】
上記枝苅ステップにおいて、上記評価関数が上記起点となる第1登録データの確信度および上記終点となる第2登録データの確信度に対して単調増加する関数であり、上記評価関数の値が所定値以上または所定値超となる場合に枝が削除される請求項3に記載のデータベース構築方法。
【請求項8】
上記枝苅ステップにおいて、上記評価関数が上記起点となる第1登録データの確信度および上記終点となる第2登録データの確信度に対して単調減少する関数であり、上記評価関数の値が所定値以下または所定値未満となる場合に枝が削除される請求項3に記載のデータベース構築方法。
【請求項9】
上記データ追加工程が、
上記枝苅ステップ後に、第1登録データのうちこれを起点とする枝が存在しない第1登録データ、および第2登録データのうちこれを終点とする枝が存在しない第2登録データを削除するデータ削除ステップ
を有する請求項3に記載のデータベース構築方法。
【請求項10】
上記枝が、初期値を登録時とする更新時刻データを有しており、
上記確信度更新ステップにおいて、上記対応付けステップで対応付けられた上記既存の枝の上記更新時刻データを、上記確信度を更新した時刻に更新し、
上記枝苅ステップにおいて、所定時間以上更新時刻データの更新がない枝も削除する請求項3または請求項9に記載のデータベース構築方法。
【発明の詳細な説明】
【技術分野】
【0001】
本発明は、データベース構築方法に関する。
【背景技術】
【0002】
近年、車両の安全運転や自動運転支援が実用化されつつあり、また自動運転の開発も進んでいる。自動運転では、車両の前方をカメラで撮影し、撮影された画像をもとに歩行者、駐車車両等の障害物を認識し、未来位置を予測し、これらの障害物を回避する制御がなされる。
【0003】
上記障害物が歩行者であれば、時々刻々移動する可能性が高く、上記障害物が駐車車両であれば、時刻が経過してもその場に留まっている可能性が高いことになる。このように認識された障害物により、未来位置の予測にも影響が生じ得る。また、障害物ではないもの(例えば路面の凹凸や汚れなど)を障害物と認識してしまうと、車両は不要な回避行動をとるように制御されてしまう。
【0004】
さらに、例えば歩行者は、通常は直線的に移動するが、例えば駐車車両があればそれを避けるような回避行動をとる。このように障害物が移動するものである場合、その移動は、他の障害物により影響を受けることになる。
【0005】
障害物と互いの動きに誤認識があると、その未来位置の予測に大きな影響を生じる場合が少なくない。このような誤認識を抑制することができる自動運転システムが提案されている(特開2022-130209号公報参照)。この自動運転システムでは、過去に認識された障害物に関する特徴量の分布を表す特徴量分布と、評価対象として認識された障害物の特徴量とを比較し、障害物の誤認識を判定する判定部を備えている。上記特徴量分布は、障害物が滞留した時間の分布を表す滞留時間分布、障害物が移動した速度の分布を表す移動速度分布、障害物が移動した距離の分布を表す移動距離分布等である。このような特徴量を使用すると、例えば障害物が歩行者であると判断されているのに、歩行者では想定できないような高速移動をしているような場合には、誤認識であると判断できる。
【0006】
上記自動運転システムでは、上記判定部が誤認識であると判断した場合は、詳細データとして収集し、オペレータに対して、誤認識と判定されたときの画像データを提示し、オペレータから異常の有無および要因を含む判定結果の入力を受け付けるように構成されている。
【先行技術文献】
【特許文献】
【0007】
【発明の概要】
【発明が解決しようとする課題】
【0008】
上記自動運転システムでは、収集された詳細データはデータベースに蓄積され、例えば障害物の認識モデルの再学習に使用される。この詳細データは、障害物が相互に関連性を有する木構造を示し、その構造が常に変化し得る。このとき、複数のどんなデータがどういう関係性で関連するのかを、事前に確定することは難しく、また、実際の状況においていつでもすべての組み合わせがあらわるとは限らない。このため、生じ得る様々な関係性を表すためには、複数のデータをすべて記録しておく必要性があり、複数のデータを1つのデータに縮退して蓄積することが容易ではない。このため、詳細データは個別に格納され、データベースのデータ量が膨大になる傾向にある。
【0009】
膨大なデータ量を削減するため、類似するデータや頻度の高いデータを抽出してまとめ上げる方法を採用し得るが、その場合でも抽出前にいったんデータを膨大に蓄積する必要があり、詳細データが収集される都度に行うことはできない。
【0010】
本開示は、以上のような事情に基づいてなされたものであり、関連性のある複数のデータを逐次的に、かつコンパクトにデータベースに蓄積できるデータベース構築方法を提供することを目的とする。
【課題を解決するための手段】
【0011】
本開示の一態様に係るデータベース構築方法は、複数の第1登録データが属する第1登録データ群と、上記複数の第1登録データに基づいて生成される複数の第2登録データが属する第2登録データ群と、上記第2登録データに、その生成に寄与した第1登録データを紐付ける枝と、上記第1登録データおよび上記第2登録データの確信度とが格納されているデータベースを構築するデータベース構築方法であって、1または複数の新たな第1登録データおよび1または複数の新たな第2登録データと、上記新たな第2登録データの生成に寄与した第1登録データを紐付ける新たな枝とを、上記データベースに追加するデータ追加工程を備え、上記データ追加工程が、上記新たな第1登録データ、上記新たな第2登録データおよび上記新たな枝を、上記データベースにすでに登録されている既存の第1登録データ、既存の第2登録データおよび既存の枝と対応付ける対応付けステップと、上記対応付けステップで対応付けられた上記既存の第1登録データおよび上記既存の第2登録データの確信度を、対応する上記新たな第1登録データおよび上記新たな第2登録データの確信度を用いて更新する確信度更新ステップとを有する。
【発明の効果】
【0012】
本開示のデータベース構築方法は、関連性のある複数のデータを逐次的に、かつコンパクトにデータベースに蓄積できる。
【図面の簡単な説明】
【0013】
【
図1】
図1は、本開示の一実施形態に係るデータベース構築方法により構築されるデータベースが含まれる通信システムの構成図である。
【
図2】
図2は、
図1の通信システムのデータベースの構成図である。
【
図3】
図3は、第2登録データ生成部の動作の説明図である。
【
図4】
図4は、登録データと枝との関係を示す模式的関係図である。
【
図5】
図5は、
図4のデータを追加する前のデータベースの格納データを示す模式図である。
【
図6】
図6は、本開示の一実施形態に係るデータベース構築方法の処理手順を示すフロー図である。
【
図7】
図7は、対応付けステップで対応付けられた
図4に示す新たなデータおよび新たな枝を示す模式図である。
【
図8】
図8は、対応付けステップで対応付けられた
図5に示す既存のデータおよび既存の枝を示す模式図である。
【
図9】
図9は、確信度更新ステップで対応付けられていない
図4に示す新たなデータをデータベースに追加した状態を示す模式図である。
【発明を実施するための形態】
【0014】
[本開示の実施形態の説明]
最初に本開示の実施態様を列記して説明する。
【0015】
本開示の一態様に係るデータベース構築方法は、複数の第1登録データが属する第1登録データ群と、上記複数の第1登録データに基づいて生成される複数の第2登録データが属する第2登録データ群と、上記第2登録データに、その生成に寄与した第1登録データを紐付ける枝と、上記第1登録データおよび上記第2登録データの確信度とが格納されているデータベースを構築するデータベース構築方法であって、1または複数の新たな第1登録データおよび1または複数の新たな第2登録データと、上記新たな第2登録データの生成に寄与した第1登録データを紐付ける新たな枝とを、上記データベースに追加するデータ追加工程を備え、上記データ追加工程が、上記新たな第1登録データ、上記新たな第2登録データおよび上記新たな枝を、上記データベースにすでに登録されている既存の第1登録データ、既存の第2登録データおよび既存の枝と対応付ける対応付けステップと、上記対応付けステップで対応付けられた上記既存の第1登録データおよび上記既存の第2登録データの確信度を、対応する上記新たな第1登録データおよび上記新たな第2登録データの確信度を用いて更新する確信度更新ステップとを有する。
【0016】
当該データベース構築方法では、新たに発生した登録データのうち、既存の登録データと対応するものは共通化するので、データベースのデータ量が膨大となることを抑止できる。また、当該データベース構築方法では、対応付けられた既存の登録データの確信度を新たな登録データの確信度を用いて更新する。この確信度は、登録データの信頼度を意味し、確信度を更新することで、登録データ自体の信頼度や時間軸に対する重要度を判断できるから、当該データベース構築方法によれば、いったんデータを膨大に蓄積することなく、逐次的にデータを更新することができる。
【0017】
上記確信度更新ステップで、更新される確信度が、既存の確信度および新たな確信度の平均値、最大値および最小値のうちのいずれかであるとよい。平均値は比較的簡単な演算でもっともらしい確信度を与える。最大値は確信度が高いつまり信頼度の高いデータベースの構築に適している。逆に、最小値は特異性の高いデータベースの構築に適している。
【0018】
上記データ追加工程が、上記確信度更新ステップ後に、上記対応付けステップで対応付けられた上記既存の枝の起点となる第1登録データの確信度および上記既存の枝の終点となる第2登録データの確信度を含む評価関数に基づいて、上記既存の枝を削除する枝苅ステップを有するとよい。確信度の更新後に、例えば確信度が低い登録データは信頼性が低いと解釈可能である。当該データベース構築方法では、第1登録データに基づいて第2登録データが生成されるが、関連付けられる第1登録データおよび第2登録データの確信度がともに低いような場合、その関連づけは信頼性が低く、例えば構築されたデータベースを活用する際に外乱となるおそれがある。このような登録データの関連性については、両者を紐付ける枝を刈り取ることで削除できる。つまり、確信度を含む評価関数に基づいて枝を削除することで、構築されるデータベースの信頼度を高めることができる。
【0019】
上記評価関数が、上記起点となる第1登録データの確信度および上記終点となる第2登録データの確信度の積、相加平均値、相乗平均値、最大値または最小値を含むとよい。上記評価関数として確信度の積、相加平均値、相乗平均値、最大値または最小値を含めることで、比較的簡単な評価関数で構築されるデータベースの信頼度を高めることができる。
【0020】
上記枝苅ステップにおいて、上記評価関数が上記起点となる第1登録データの確信度および上記終点となる第2登録データの確信度に対して単調増加する関数であり、上記評価関数の値が所定値以下または所定値未満となる場合に枝が削除されるとよい。このように評価関数が第1登録データの確信度および第2登録データの確信度に対して単調増加する関数である場合、評価関数の値を所定値以下または所定値未満となる場合に枝を削除することで、構築されるデータベースの信頼度を高めることができる。
【0021】
上記枝苅ステップにおいて、上記評価関数が上記起点となる第1登録データの確信度および上記終点となる第2登録データの確信度に対して単調減少する関数であり、上記評価関数の値が所定値以上または所定値超となる場合に枝が削除されるとよい。このように評価関数が第1登録データの確信度および第2登録データの確信度に対して単調減少する関数である場合、評価関数の値を所定値以上または所定値超となる場合に枝を削除することで、構築されるデータベースの信頼度を高めることができる。
【0022】
上記枝苅ステップにおいて、上記評価関数が上記起点となる第1登録データの確信度および上記終点となる第2登録データの確信度に対して単調増加する関数であり、上記評価関数の値が所定値以上または所定値超となる場合に枝が削除されるとよい。この場合、むしろ確信度が低い登録データを紐付ける枝が残り、確信度の高い登録データを紐付ける枝が刈り取られることとなる。確信度が低い登録データは希にしか生じないと解釈することも可能である。この解釈に基づけば、確信度が低い登録データを紐付ける枝を積極的に残すことで、主に特異ケースを抽出したデータベースを構築することができる。
【0023】
上記枝苅ステップにおいて、上記評価関数が上記起点となる第1登録データの確信度および上記終点となる第2登録データの確信度に対して単調減少する関数であり、上記評価関数の値が所定値以下または所定値未満となる場合に枝が削除されるとよい。このように上記評価関数が上記起点となる第1登録データの確信度および上記終点となる第2登録データの確信度に対して単調減少する関数である場合、上記評価関数の値が所定値以下または所定値未満となる場合に枝を削除することで、主に特異ケースを抽出したデータベースを構築することができる。
【0024】
上記データ追加工程が、上記枝苅ステップ後に、第1登録データのうちこれを起点とする枝が存在しない第1登録データ、および第2登録データのうちこれを終点とする枝が存在しない第2登録データを削除するデータ削除ステップを有するとよい。枝苅の結果、起点とする枝が存在しない第1登録データおよび終点とする枝が存在しない第2登録データは、データベースの構成に寄与せず不要であるので、これを削除することでデータベースをさらにコンパクト化することができる。
【0025】
上記枝が、初期値を登録時とする更新時刻データを有しており、上記確信度更新ステップにおいて、上記対応付けステップで対応付けられた上記既存の枝の上記更新時刻データを、上記確信度を更新した時刻に更新し、上記枝苅ステップにおいて、所定時間以上更新時刻データの更新がない枝も削除するとよい。所定時間以上更新時刻データの更新がない枝は、古いデータで現在では発生頻度が低下したデータであるとみなせる。このようなデータを削除することで、データベースの信頼度を維持しつつ、コンパクト化が図れる。
【0026】
ここで「確信度」とは、抽出あるいは推定されたデータの信頼性を意味し、-1から1の範囲の小数で表すことができる。確信度が-1である場合、データが確実に誤っていることを意味し、1である場合はデータが確実に正しいことを意味し、0である場合はデータが正しいか誤っているかが不明であることを意味する。本明細書では、正しいデータを推論することが目的であるため、確信度の範囲は0以上1以下となる。
【0027】
[本開示の実施形態の詳細]
以下、本開示の実施形態に係るデータベース管理システムについて、適宜図面を参照しつつ説明する。
【0028】
本開示の一実施形態に係るデータベース管理システムは、第1登録データに基づいて第2登録データが生成されるような段階的に処理がなされる処理系、例えば安全運転支援システムや自動運転に必要な情報を収集するために用いることができる。以下、安全運転支援システムや自動運転に必要な情報を収集する場合を例にとり説明するが、当該データベース管理システムが用いられる範囲がこれに限定されることを意味するものではない。
【0029】
安全運転支援システムや自動運転に必要な情報は、例えば自動車の周辺状況や運転状況、ドライバの状況などが該当し、当該データベース管理システムでは、これらの状況を処理して、その過程を残す。得られたデータベースは、例えば事故分析、快適度分析、データを抽出するAIのモデルの修正などに用いることができる。また、それぞれの状況に合わせてパーソナライズ、ローカライズが行われ、例えば運転状況のシーンを類別化し、パターン化することもできる。当該データベース管理システムは、このような目的に合うデータベースを構築することができる。
【0030】
〔通信システム〕
図1に示す通信システム100は、当該データベース管理システムが搭載されている通信システムの構成例である。通信システム100は、複数のモバイル基地局110と複数の移動体120とを含むネットワーク130を有する通信システムである。当該通信システム100は、1の主データベース141と、この主データベース141と直接に若しくは1または複数の中間データベース142を介して間接に接続される複数の末端データベース143とを有する階層化データベース140を備える。
【0031】
<ネットワーク>
ネットワーク130に含まれる複数のモバイル基地局110および複数の移動体120は、互いに共通のワイヤレスインタフェースで接続されている。
【0032】
上記ワイヤレスインタフェースとしては、5G、ローカル5G、4G、DSRC(Dedicated Short Range Communications)、LPWA(Low Power Wide Area)、WiFi、IEEE802.11系列、ITS(Intelligent Transport System)通信のインタフェース等を用いることができる。
【0033】
モバイル基地局110および複数の移動体120は、任意の2者間で直接通信を行うことができるように構成されていることが好ましい。さらに、例えば移動体120から他の移動体120を経由してモバイル基地局110に至るような、1または複数の移動体120を中継器とした通信を行うこともできるとよい。なお、
図1では図面が煩雑となることを避けるため、上記2者間の通信のうち一部を代表して図示しており、その全てが図示されているわけではない。
【0034】
<モバイル基地局>
モバイル基地局110は、通信システム100のワイヤレス通信が行える地理的範囲を統括し、制御する基地局である。具体的には、モバイル基地局110は、例えば複数の移動体120のデータ管理処理と配信制御処理とを行う。
【0035】
モバイル基地局110は、主基地局111と、ローカル基地局112とを含み、他のネットワークのモバイル基地局との間、あるいはクラウドデータセンターとの間の通信を行え、通信の基幹網を構成する。
【0036】
(主基地局)
主基地局111は、上記地理的範囲全体を統括および制御する。主基地局111は、通信機能、主データベース141およびプロセッサを有する。
【0037】
(ローカル基地局)
ローカル基地局112は、主基地局111の下層に属し、主基地局111が統括する地理的範囲を細分化して統括する。このため、通常、複数のローカル基地局112が設けられる。逆に、上記地理的範囲を細分化する必要がない場合は、ローカル基地局112は省略可能であり、モバイル基地局110は主基地局111のみで構成され、上記地理的範囲全体を直接統括する。
【0038】
ローカル基地局112は、通信機能、中間データベース142およびプロセッサを有する。ローカル基地局112は、例えばローカル5G基地局とすることができる。
【0039】
<移動体>
複数の移動体120は、当該通信システム100のネットワーク130が管理するデータ共有エリア(ワイヤレス通信が行える地理的範囲)を移動する機器である。複数の移動体120は、通信機能、末端データベース143およびプロセッサを有する。
図1に示す通信システム100において、移動体120は、車両である。
【0040】
複数の移動体120の末端データベース143は、相互に参照可能に構成されている。また、移動体120は、後述するデータベース管理装置1を有している(
図2参照)。
【0041】
〔データベース管理装置〕
図2に示すデータベース管理装置1は、データベース10と、センサ20と、第1登録データ生成部30と、第2登録データ生成部40と、第3登録データ生成部50とを備える。なお、データベース管理装置1のデータベース10が、末端データベース143を構成している。
【0042】
<データベース>
データベース10は、複数の第1登録データが属する第1登録データ群11、複数の第2登録データが属する第2登録データ群12、複数の第3登録データが属する第3登録データ群13、詳細センサデータ14および枝データ15が格納されている。
【0043】
第1登録データ群11、第2登録データ群12および第3登録データ群13は、個々の上記第1登録データ、上記第2登録データおよび上記第3登録データにそれぞれ対応するデータの信頼性を表す第1確信度11a、第2確信度12aおよび第3確信度13aを含む。
【0044】
詳細センサデータ14は、センサ20で検知した情報である。詳細センサデータ14は、データ量が多い重たいデータとなりがちであるので、例えば一定時間保持後に古いデータから順に消去される等の処理が行われる。
【0045】
詳細センサデータ14は、主に自己のセンサ20により検知されたデータである。一方、第1登録データ群11、第2登録データ群12および第3登録データ群13は、比較的データ量が少ない軽いデータであり、上記ワイヤレスインタフェースを介して他の移動体120の情報をも容易に格納することができるので、移動体120が必要とするネットワーク130中の情報が適宜集められている。
【0046】
<センサ>
センサ20が検知する情報としては、天候、気温といった任意の自然現象や、交通渋滞等の人工物で生ずる現象、心拍数、呼吸数、血圧等の人間のバイタル情報、車両への人物の接近、道路上への落下物の情報、時刻、移動速度、位置などのセンサで検知できる任意のものを挙げることができる。中でも、移動体120が車両である場合、センサ20が、道路の状況を捉えるカメラであるとよい。道路の画像は、多くの情報を一度に取得できる反面、処理が複雑となる。データベース管理装置1は、このような複雑な処理も高い精度で行うことができるので、例えば自動運転等に応用し易い。
【0047】
各移動体120は、センサ20により収集した情報を上記プロセッサにより処理し、末端データベース143に格納する。
【0048】
<データ生成部>
データベース管理装置1は、第1登録データ生成部30、第2登録データ生成部40および第3登録データ生成部50を備えることで、センサ20により検知されるセンサ情報を起点として、上記第1登録データ、上記第2登録データ、上記第3登録データ、第1確信度11a、第2確信度12aおよび第3確信度13aを生成することができる。
【0049】
(第1登録データ生成部)
第1登録データ生成部30は、センサ20により検知されたセンサ情報に基づいて上記第1登録データを生成する。また、第1確信度11aは、第1登録データ生成部30により生成される。
【0050】
第1登録データ生成部30は、既知のセンサ情報と、そのセンサ情報に対応する第1登録データとを教師データとして機械学習された第1予測モデル31を用いて、上記センサ情報から上記第1登録データを生成することが好ましい。
【0051】
この場合、第1確信度11aは、第1予測モデル31に含まれるパラメータから決定することができる。このように第1予測モデル31にいわゆるAIを用いると、その予測モデルに含まれるパラメータから容易に第1確信度11aを算出することができる。
【0052】
(第2登録データ生成部)
第2登録データ生成部40は、上記第1登録データに基づいて上記第2登録データを生成する。また、第2確信度12aは、第2登録データ生成部40により生成される。
【0053】
第2登録データ生成部40は、既知のセンサ情報および既知の第1登録データと、そのセンサ情報および第1登録データに対応する第2登録データとを教師データとして機械学習された第2予測モデル41を用いて、上記センサ情報および上記第1登録データから上記第2登録データを生成することが好ましい。
【0054】
この場合、第2確信度12aは、第2予測モデル41に含まれるパラメータから決定されるとよい。このように第2予測モデル41にAIを用いると、その予測モデルに含まれるパラメータから容易に第2確信度12aを算出することができる。
【0055】
(第3登録データ生成部)
第3登録データ生成部50は、上記第2登録データに基づいて上記第3登録データを生成する。また、第3確信度13aは、第3登録データ生成部50により生成される。
【0056】
第3登録データ生成部50は、既知のセンサ情報および既知の第2登録データと、そのセンサ情報および第2登録データに対応する第3登録データとを教師データとして機械学習された第3予測モデル51を用いて、上記センサ情報および上記第2登録データから上記第3登録データを生成することが好ましい。なお、第3登録データ生成部50において、上記第2登録データに替えてまたは加えて、第1登録データを用いてもよい。
【0057】
この場合、第3確信度13aは、第3予測モデル51に含まれるパラメータから決定されるとよい。このように第3予測モデル51にAIを用いると、その予測モデルに含まれるパラメータから容易に第3確信度13aを算出することができる。
【0058】
<具体事例>
具体事例として、移動体120が車両、センサ20が道路の状況を捉えるカメラであり、自動運転である車両が道路上の障害物を見極め、回避行動の必要性を判断する場合を例に挙げて、さらにデータベース管理装置1の動作を詳細に説明するが、データベース管理装置1の適用範囲が本事例に限定されることを意味するものではない。
【0059】
図2には、道路状況の一例として、移動体120の前方に、三角コーンX1、自転車X2および歩行者X3が存在している場合を示している。
【0060】
(第1登録データ生成部)
このような系において、第1登録データ生成部30の役割は、物理情報の特徴抽出であり、この事例では、センサ20が検知したセンサ情報から認知した障害物が三角コーン、自転車、歩行者等のどれに属する物体であるのかを分類するステップとなる。
【0061】
このとき第1登録データ生成部30が生成する第1確信度11aは、分類結果の信頼度を意味する。この確信度は、0以上1以下の小数値で表され、1に近いほど信頼度が高いことを意味する。
【0062】
第1確信度11aの意味は、次の通りである。三角コーンX1は、第1登録データ生成部30によって、三角コーンに分類されることになる。典型的な三角コーンの特徴を備えていた場合は、その第1確信度11aは1に近いものとなるが、例えば三角コーンX1が灰色等の目立たない色彩であった場合は、三角コーンではない可能性が示唆され、第1確信度11aは低いこと(例えば0.5等)になる。あるいは、三角コーンX1が空中に浮遊していた場合、判断が誤っている可能性も十分に想定され、第1確信度11aの数値はさらに低いこと(例えば0.1等)になる。このように障害物が三角コーンに分類されたからといって、その信頼度はまちまちであるから、これを示す量が第1確信度11aということになる。
【0063】
(第2登録データ生成部)
第2登録データ生成部40の役割は、第1登録データ生成部30が抽出した物理情報をもとにした意味情報の抽出であり、この事例では、障害物の未来位置の予測となる。
【0064】
例えば自転車X2に着目する。センサ20が検知したセンサ情報に基づく三角コーンX1、自転車X2及び歩行者X3の位置関係が
図3のようであったとする。さらに、センサ情報から自転車X2の速度も取得可能であり、自転車X2の未来位置を予測することができる。
【0065】
自転車X2の前方には三角コーンX1が存在する。三角コーンX1は、原則として移動しないから、自転車X2の方が三角コーンX1を避ける行動をとることが容易に予測され、さらに道路の中央側(
図3の上側)には、自転車X2より高速で移動する移動体120が後方(
図3の右側)から迫っているから、道路の端側(
図3の下側)に回避する可能性が高く、例えば
図3に示すように、移動する可能性を決定することができる。
【0066】
ここで、第1確信度11aと同様に、自転車X2の移動の方向と確率の算出自体の確信度が定義でき、これを第2確信度12aとすることができる。この場合、移動方向が3通り(
図3のY1~Y3)存在するので、第2確信度12aは、その移動方向ごとに3つの数値が存在し得る。
【0067】
(第3登録データ生成部)
第3登録データ生成部50の役割は、第2登録データ生成部40が抽出した意味情報をもとにした価値情報の抽出であり、この事例では、障害物に対する危険性の予測あるいは危険回避行動の予測となる。
【0068】
第3登録データ生成部50では、入力として上記第2登録データに加えて、センサ情報から得られる移動体120の位置や速度が挙げられる。必要に応じて上記第1登録データを参照してもよい。
【0069】
第3確信度13aについても、第3登録データの算出自体の確信度が定義できる。例えば自転車X2がY1に移動する場合、移動体120の前方に飛び出すこととなるため、危険性が高いと判断される。一方、自転車X2がY3に移動する場合は、危険性は低い。これらは比較的高い確信度で予見可能であると思われる。ところが、自転車X2がY2に移動する場合、自転車X2の運転者は三角コーンX1に気付いていない可能性が否定できず危険性は断定的には予見できず、比較的低い確信度となると考えられる。
【0070】
上述した点を除き、第3登録データ生成部50は、第2登録データ生成部40と同様に構成することができる。
【0071】
(枝データ)
上述のように自転車X2の前方には三角コーンX1が存在する。三角コーンX1は、原則として移動しないから、自転車X2の方が三角コーンX1を避ける行動をとることが予想される。つまり、自転車X2の未来位置の予測には、三角コーンX1が寄与することとなる。この場合、第2登録データであるY1~Y3に、その生成に寄与した第1登録データであるX1を紐付ける。この紐付け情報は、枝情報として枝データ15に格納される。
【0072】
上述の具体例で示した登録データと枝との関係を模式的に示すと
図4のように表せる。
図4では、第1登録データをX1~X3、第2登録データをY1~Y3、第3登録データをZ1~Z3で表し、それぞれの確信度をf
*、登録データを紐付ける枝をE
**で示している。ここで、*は、登録データの符号を示す。
【0073】
〔データベース構築方法〕
上述の
図4に示す具体例を
図5に示すデータベース10に登録し、データベース10を構築する方法、すなわち本開示の一実施形態に係るデータベース構築方法について説明する。当該データベース構築方法は、複数の第1登録データX1~X3が属する第1登録データ群11と、複数の第1登録データX1~X3に基づいて生成される複数の第2登録データY1~Y3が属する第2登録データ群12と、第2登録データY1~Y3に、その生成に寄与した第1登録データX1~X3を紐付ける枝E
XiYjと、複数の第2登録データY1~Y3に基づいて生成される複数の第3登録データZ1~Z3が属する第3登録データ群13と、第3登録データZ1~Z3に、その生成に寄与した第2登録データY1~Y3を紐付ける枝E
YjZkと、第1登録データX1~X3、第2登録データY1~Y3および第3登録データZ1~Z3の確信度f
*(*:X1~X3、Y1~Y3、Z1~Z3)とが格納されているデータベース10を構築するデータベース構築方法である。
【0074】
当該データベース構築方法は、
図6に示すように、複数の新たな第1登録データX1~X3、複数の新たな第2登録データY1~Y3および複数の新たな第3登録データZ1~Z3と、新たな第2登録データY1~Y3の生成に寄与した第1登録データX1~X3を紐付ける新たな枝E
XiYjと、新たな第3登録データZ1~Z3の生成に寄与した第2登録データY1~Y3を紐付ける新たな枝E
YjZkとを、データベース10に追加するデータ追加工程S1を備える。
【0075】
データ追加工程S1は、対応付けステップS11と、確信度更新ステップS12と、枝苅ステップS13と、データ削除ステップS14とを有する。
【0076】
<対応付けステップ>
対応付けステップS11では、新たな第1登録データX1~X3、新たな第2登録データY1~Y3、新たな第3登録データZ1~Z3および新たな枝E**(*:X1~X3、Y1~Y3、Z1~Z3)を、データベース10にすでに登録されている既存の第1登録データXi、既存の第2登録データYj、既存の第3登録データZkおよび既存の枝E**(*:Xi、Yj、Zk)と対応付ける。
【0077】
具体的には、対応する登録データ(第1登録データXi、第2登録データYj、第3登録データZkおよび枝E
**をマッピングするとよい。
図7および
図8に対応付けステップS11後の対応関係を示す。
図7および
図8において、対応付けられた登録データおよび枝を実線で示し、対応付けられなかった登録データおよび枝を破線で示している。
【0078】
例えば歩行者X3について、同一の歩行者を対応付ける(異なる歩行者は対応付けない)方法と、カテゴリーが歩行者であれば異なる歩行者であっても対応付ける方法とが想定される。いずれの方法を採用するかは、データベース10の目的に応じて変わり得る。例えばデータベース10が時間的に連続するある一場面の解析を目的とするものであれば、前者の方法が採用され得る。一方、データベース10が歩行者X3と自転車X2あるいは移動体120との関係を一般化することを目的とするものであれば、後者の方法が採用され得る。
【0079】
ここで、例えば第1登録データX1~X3は、単に障害物の種類のみを表すデータであってもよいが、その位置や移動速度を含むデータセットであってもよい。このデータセットの内容は、第2登録データY1~Y3を生成する際の必要性に応じて適宜決定される。例えば第1登録データX1~X3に、障害物の種類に加えてその位置も含める場合、その位置を精密に定義すると、位置情報の相違により、新たな第1登録データX1~X3が既存の第1登録データXiと対応付けられない可能性が高くなる。このため、例えばカメラにより取得された画像を所定の区画(例えば
図3であれば5×5の区画)に分割し、第1登録データXiの属する区画により対応付けるとよい。
【0080】
<確信度更新ステップ>
確信度更新ステップS12では、対応付けステップS11で対応付けられた既存の第1登録データXi、既存の第2登録データYjおよび既存の第3登録データZkの確信度F*(*:Xi、Yj、Zk)を、対応する新たな第1登録データX1~X3、新たな第2登録データY1~Y3および新たな第3登録データZ1~Z3の確信度f*を用いて更新する。
【0081】
更新される確信度は、
図8において実線で示されている確信度(第1確信度11a、第2確信度12aおよび第3確信度13a)である。このうち、第2登録データY3のように対応付けられている枝E
**がつながっていないデータに係る確信度F
Y3は更新対象から外してもよい。このようなデータは、新たな登録データとは生成に寄与したデータが全く異なるためである。
【0082】
確信度更新ステップS12で、更新される確信度F*としては、既存の確信度F*および新たな確信度f*の平均値、最大値、最小値、最頻値、中央値、積分フィルタ値、カルマンフィルタ値などが選択可能である。中でも平均値、最大値および最小値のうちのいずれかであることが好ましい。平均値は比較的簡単な演算でもっともらしい確信度を与える。最大値は確信度が高いつまり信頼度の高いデータベース10の構築に適している。逆に、最小値は特異性の高いデータベース10の構築に適している。なお、更新される確信度F*として、平均値、最頻値または中央値を採用する場合には、確信度F*以外に総和と度数とを保持しておくとよい。
【0083】
なお、新たな登録データXi、Yj、Zkや新たな枝E
**において、既存の登録データXi、Yj、Zkや枝E
**と対応付けられないものが存在し得る。例えば
図7の例では、第1登録データX3、第3登録データZ3、枝E
X1Y3、枝E
X2Y2、枝E
X2Y3、枝E
X3Y3、枝E
Y3Z3が、これに相当する。このような新たな登録データXi、Yj、Zkや新たな枝E
**は、そのままデータベース10に追加され、新たな登録データXi、Yj、Zkには、対応する新たな確信度f
*が付与される(
図9参照)。
【0084】
<枝刈ステップ>
枝刈ステップS13では、確信度更新ステップS12後に、対応付けステップS11で対応付けられた既存の枝EXiYjの起点となる第1登録データXiの確信度fXiおよび既存の枝EXiYjの終点となる第2登録データYjの確信度fYjを含む評価関数または対応付けステップS11で対応付けられた既存の枝EYjZkの起点となる第2登録データYjの確信度fYjおよび既存の枝EYjZkの終点となる第3登録データZkの確信度fZkを含む評価関数に基づいて、既存の枝EXiYjまたは枝EYjZkを削除する。
【0085】
確信度F*の更新後に、例えば確信度F*が低い登録データは信頼性が低いと解釈可能である。当該データベース構築方法では、第1登録データXiに基づいて第2登録データYjが生成されるが、関連付けられる第1登録データXiおよび第2登録データYjの確信度F*がともに低いような場合、その関連づけは信頼性が低く、例えば構築されたデータベース10を活用する際に外乱となるおそれがある。このような登録データの関連性については、両者を紐付ける枝を刈り取ることで削除できる。つまり、確信度を含む評価関数に基づいて枝を削除することで、構築されるデータベース10の信頼度を高めることができる。
【0086】
上記評価関数は、個々の枝E
**単位で定義されていてもよいし、例えば
図7のX1→Y1→Z1のパスを構成する2つの枝E
X1Y1と枝E
Y1Z1とを含めて定義されてもよい。パス単位で定義する場合、
図7のX2→Y2→Z2のように一部のパス(Y2→Z2)しか既存のデータベース10と合致しないということが生じ得る。この場合は、Y2→Z2は評価の対象とはならず、このパスに対しては、枝刈ステップS13は実行されない。
【0087】
ここでは、上記評価関数が個々の枝E**単位で定義されている場合を例にとり説明を続ける。なお、個々の枝E**として、枝EXiYjと枝EYjZkとが存在するが、枝EXiYjで代表させても一般性は失わない、そこで、さらに既存の枝EXiYjの起点となる第1登録データXiの確信度FXiおよび既存の枝EXiYjの終点となる第2登録データYjの確信度FYjを含む評価関数に基づいて、既存の枝EXiYjを削除する場合を用いて説明する。
【0088】
上記評価関数としては、確信度FXiおよび確信度FYjの和、積、最大値、最小値、相加平均値、相乗平均値などが採用可能である。なかでも上記評価関数が、上記起点となる第1登録データXiの確信度FXiおよび上記終点となる第2登録データYjの確信度FYjの積、相加平均値、相乗平均値、最大値または最小値を含むことが好ましい。上記評価関数として確信度の積、相加平均値、相乗平均値、最大値または最小値を含めることで、比較的簡単な評価関数で構築されるデータベース10の信頼度を高めることができる。
【0089】
上記評価関数が上記起点となる第1登録データXiの確信度FXiおよび上記終点となる第2登録データYjの確信度FYjに対して単調増加する関数であり、上記評価関数の値が所定値以下または所定値未満となる場合に枝EXiYjが削除されるとよい。このように評価関数が第1登録データXiの確信度FXiおよび第2登録データYjの確信度FYjに対して単調増加する関数である場合、上記評価関数の値が小さいことは、第1登録データXiと第2登録データYjとが同時に生じることに対する確信度が低いことを意味する。つまり、この枝EXiYjは信頼性が低いと解釈可能である。従って、上記評価関数の値を所定値以下または所定値未満となる場合に枝を削除することで、構築されるデータベース10の信頼度を高めることができる。
【0090】
上記評価関数が上記起点となる第1登録データXiの確信度FXiおよび上記終点となる第2登録データYjの確信度FYjに対して単調減少する関数であり、上記評価関数の値が所定値以上または所定値超となる場合に枝EXiYjが削除されるとよい。このように評価関数が第1登録データXiの確信度FXiおよび第2登録データYjの確信度FYjに対して単調減少する関数である場合、上記評価関数の値が大きいことは、第1登録データXiと第2登録データYjとが同時に生じることに対する確信度が低いことを意味する。従って、上記評価関数の値を所定値以上または所定値超となる場合に枝を削除することで、構築されるデータベース10の信頼度を高めることができる。
【0091】
逆に、上記評価関数が上記起点となる第1登録データXiの確信度FXiおよび上記終点となる第2登録データYjの確信度FYjに対して単調増加する関数であり、上記評価関数の値が所定値以上または所定値超となる場合に枝EXiYjが削除されるように構成することもできる。この場合、むしろ確信度が低い登録データを紐付ける枝EXiYjが残り、確信度の高い登録データを紐付ける枝EXiYjが刈り取られることとなる。確信度が低い登録データは希にしか生じないと解釈することも可能である。この解釈に基づけば、確信度が低い登録データを紐付ける枝EXiYjを積極的に残すことで、主に特異ケースを抽出したデータベース10を構築することができる。
【0092】
上記評価関数が上記起点となる第1登録データXiの確信度FXiおよび上記終点となる第2登録データYjの確信度FYjに対して単調減少する関数であり、上記評価関数の値が所定値以下または所定値未満となる場合に枝EXiYjが削除されるようにしてもよい。このように上記評価関数が上記起点となる第1登録データXiの確信度FXiおよび上記終点となる第2登録データYjの確信度に対して単調減少する関数である場合には、上記評価関数の値が所定値以下または所定値未満となる場合に枝EXiYjを削除することで、主に特異ケースを抽出したデータベース10を構築することができる。
【0093】
上記評価関数を構築するにあたって、第1登録データXiおよび第2登録データYjが同時に生じる確信度をP(Xi、Yj)とし、第1登録データXiが生じないことを「!Xi」と表すことにする。つまり、P(!Xi、Yj)は第1登録データXiが生じず、かつ第2登録データYjが生じる確信度を意味する。このとき、P(Xi、Yj)+P(!Xi、Yj)+P(Xi、!Yj)+P(!Xi、!Yj)=1を満たすようにP(Xi、Yj)を定め、上記評価関数としてP(Xi、Yj)を用いることが好ましい。このような評価関数を用いることで、構築されるデータベース10の信頼度をさらに高めることができる。
【0094】
枝EXiYjを削除対象とするか否かの上記所定値は、構築されるデータベース10の信頼度、要請されるコンパクト化などに応じ、適宜決定されるが、例えば上記評価関数として上述のP(Xi、Yj)を用いる場合であれば、上記所定値は0.4とすることが好ましく、0.3とすることがより好ましい。P(Xi、Yj)が上記所定値以下または未満である場合に削除対象とすることで効果的にコンパクト化できる。
【0095】
枝EXiYjが、初期値を登録時とする更新時刻データを有しており、確信度更新ステップS12において、対応付けステップS11で対応付けられた既存の枝EXiYjの上記更新時刻データを、上記確信度を更新した時刻に更新し、枝苅ステップS13において、所定時間以上更新時刻データの更新がない枝EXiYjも削除してもよい。所定時間以上更新時刻データの更新がない枝EXiYjは、古いデータで現在では発生頻度が低下したデータであるとみなせる。このようなデータを削除することで、データベース10の信頼度を維持しつつ、コンパクト化が図れる。
【0096】
<データ削除ステップ>
データ削除ステップS14は、枝苅ステップS13後に、第1登録データXiのうちこれを起点とする枝EXiYjが存在しない第1登録データXi、および第2登録データYjのうちこれを終点とする枝EXiYjが存在しない第2登録データYjを削除する。
【0097】
例えば
図9のデータベース10において、枝苅ステップS13で枝E
X1Y1および枝E
X2Y1が削除され、存在しない場合、第2登録データY1を終点とする枝E
XiYjが存在しなくなるため、この第2登録データY1は削除される。
【0098】
そして、第2登録データY1が削除されると、枝EY2Z3が不要となり削除し得る。さらに、この枝EY2Z3の削除により、第3登録データY1を終点とする枝EXiYjが存在しなくなるため、第3登録データZ1を終点とする枝EYiZjが存在しなくなるため、この第3登録データZ1も削除し得る。このように連鎖的に不要な枝E**や登録データXi、Yj、Zkを削除してもよい。
【0099】
また、例えば枝苅ステップS13で枝EY2Z2が削除された場合であれば、第2登録データY2を起点とする枝EYiZjが存在しなくなるため、第2登録データY2が削除される。
【0100】
一方、枝EX1Y1が削除されても、この枝EX1Y1の起点である第1登録データX1は削除されない。第1登録データX1には、削除されていない枝EX1Y2や枝EX1Y3が存在しているためである。
【0101】
このように枝苅の結果、起点とする枝EXiYjが存在しない第1登録データXiおよび終点とする枝EXiYjが存在しない第2登録データYjは、データベース10の構成に寄与せず不要であるので、これを削除することでデータベース10をさらにコンパクト化することができる。
【0102】
<利点>
当該データベース構築方法では、新たに発生した登録データXi、Yj、Zkのうち、既存の登録データXi、Yj、Zkと対応するものは共通化するので、データベース10のデータ量が膨大となることを抑止できる。また、当該データベース構築方法では、対応付けられた既存の登録データXi、Yj、Zkの確信度F*を新たな登録データXi、Yj、Zkの確信度f*を用いて更新する。この確信度F*は、登録データXi、Yj、Zkの信頼度を意味し、確信度F*を更新することで、登録データXi、Yj、Zk自体の信頼度や時間軸に対する重要度を判断できるから、当該データベース構築方法によれば、いったんデータを膨大に蓄積することなく、逐次的にデータを更新することができる。
【0103】
[その他の実施形態]
上記実施形態は、本発明の構成を限定するものではない。従って、上記実施形態は、本明細書の記載および技術常識に基づいて上記実施形態各部の構成要素の省略、置換または追加が可能であり、それらは全て本発明の範囲に属するものと解釈されるべきである。
【0104】
上記実施形態では、第1登録データ群から第3登録データ群までの3つの登録データ群を備える場合を説明したが、第4登録データ群あるいはそれ以上のデータ群を備え、第4確信度あるいはそれ以上の確信度を含むデータベースも本発明の対象とするところである。逆に、第3登録データ群を備えない2段構成のデータベースも本発明の対象とするところである。
【0105】
また、第1登録データから第3登録データの全てが確信度を含む必要はなく、例えば第2登録データと第3登録データとが確信度を含むデータベースも本発明の対象とするところである。
【0106】
上記実施形態では、第3登録データが第2登録データに基づいて生成される場合を説明したが、第3登録データが第1登録データに基づいて生成される場合や、第3登録データが第1登録データおよび第2登録データに基づいて生成される場合も本発明の対象とするところである。
【0107】
上記実施形態では、データ追加工程が枝苅ステップと、削除ステップとを有する場合を説明したが、データ追加工程が削除ステップを有さない構成や、データ追加工程が枝苅ステップと、削除ステップとをともに有さない場合も本発明の意図するところである。
【産業上の利用可能性】
【0108】
以上説明したように、本開示のデータベース構築方法は、関連性のある複数のデータを逐次的に、かつコンパクトにデータベースに蓄積できる。
【符号の説明】
【0109】
1 データベース管理装置
10 データベース
11 第1登録データ群
11a 第1確信度
12 第2登録データ群
12a 第2確信度
13 第3登録データ群
13a 第3確信度
14 詳細センサデータ
15 枝データ
20 センサ
30 第1登録データ生成部
31 第1予測モデル
40 第2登録データ生成部
41 第2予測モデル
50 第3登録データ生成部
51 第3予測モデル
100 通信システム
110 モバイル基地局
111 主基地局
112 ローカル基地局
120 移動体
130 ネットワーク
140 階層化データベース
141 主データベース
142 中間データベース
143 末端データベース
X1 三角コーン
X2 自転車
X3 歩行者