(19)【発行国】日本国特許庁(JP)
(12)【公報種別】公開特許公報(A)
(11)【公開番号】P2024061803
(43)【公開日】2024-05-08
(54)【発明の名称】判定装置
(51)【国際特許分類】
G08G 1/00 20060101AFI20240426BHJP
G07C 5/00 20060101ALI20240426BHJP
G06T 7/00 20170101ALI20240426BHJP
【FI】
G08G1/00 D
G07C5/00 Z
G06T7/00 650Z
【審査請求】有
【請求項の数】1
【出願形態】OL
(21)【出願番号】P 2024036556
(22)【出願日】2024-03-11
(62)【分割の表示】P 2020054202の分割
【原出願日】2020-03-25
(71)【出願人】
【識別番号】000005016
【氏名又は名称】パイオニア株式会社
(74)【代理人】
【識別番号】100134832
【弁理士】
【氏名又は名称】瀧野 文雄
(74)【代理人】
【識別番号】100165308
【弁理士】
【氏名又は名称】津田 俊明
(74)【代理人】
【識別番号】100115048
【弁理士】
【氏名又は名称】福田 康弘
(72)【発明者】
【氏名】伊藤 友二
(72)【発明者】
【氏名】井上 俊明
(72)【発明者】
【氏名】柴田 晃司
(57)【要約】
【課題】心理的負担がかかったことにより生じる事故やヒヤリハットといった安全上の問題が発生した疑いを判定する。
【解決手段】判定装置1は、視覚顕著性演算部3が、移動体から外部を撮像した画像に基づいて、その画像内における視覚顕著性の高低を推測して得られた視覚顕著性マップを取得し、視線座標設定部4が、理想視線の座標を設定する。そして、ベクトル誤差演算部5が、視覚顕著性マップと理想視線とに基づいて画像における視覚的注意集中度Psを算出する。判定部6が、視覚的注意集中度Psの時間的な変化量に基づいて、ヒヤリハット等の移動体の走行中に安全上の問題が発生した疑いがあると判定する。
【選択図】
図1
【特許請求の範囲】
【請求項1】
移動体から外部を撮像した画像に基づいて、その画像内における視覚顕著性の高低を推測して得られた視覚顕著性分布情報を取得する取得部と、
予め定めた規則に従って前記画像における基準視線位置を設定する視線位置設定部と、
前記視覚顕著性分布情報と前記視線位置とに基づいて前記画像における視覚的注意の集中度を算出する視覚的注意集中度算出部と、
前記視覚的注意の集中度の時間的な変化量に基づいて、前記移動体の走行中に安全上の問題が発生した疑いがあると判定する判定部と、
を備えることを特徴とする判定装置。
【発明の詳細な説明】
【技術分野】
【0001】
本発明は、移動体から外部を撮像した画像に基づいて所定の判定処理を行う判定装置に関する。
【背景技術】
【0002】
例えばドライブレコーダにおいては、車両の加速度に基づいて事故又はヒヤリハット等の発生を検出して、その発生前後の画像を記録している。
【0003】
特許文献1には、事故やヒヤリハットといったイベントを高精度に検出し、イベントの発生の原因を特定することができることができるドライブレコーダ装置の発明が記載されている。特許文献1に記載の発明では、加速度の変化量が加速側で発生した場合、制御部21は、アクセル開度の変化量が運転者の判断によって操作したと判断される一定値以下であるか否かを判別し、アクセル開度の変化量が一定値以下である場合、外部エネルギーによるイベントであると判断する。一方、アクセル開度の変化量が一定値を越える場合、制御部21は、運転手の判断によるイベントであると判断する。この場合、制御部21は、ヒヤリハットの事例として、イベント情報、各種センサで収集したデータ、および映像情報を記録部26に記録する。
【先行技術文献】
【特許文献】
【0004】
【発明の概要】
【発明が解決しようとする課題】
【0005】
加速度のみで事故やヒヤリハットと判定すると、急制動を伴わない例えば突然の車両の横からの侵入によるヒヤリハットや、漫然状態におけるヒヤリハットを検知することはできない。
【0006】
特許文献1に記載された発明では、アクセルの開度も判断の基準となっているため、急制動を伴わない例えば突然の車両の横からの侵入によるヒヤリハットや、漫然状態におけるヒヤリハットを検知することはできない。
【0007】
本発明が解決しようとする課題としては、心理的負担がかかったことにより生じる事故やヒヤリハットといった安全上の問題が発生した疑いを判定することが一例として挙げられる。
【課題を解決するための手段】
【0008】
上記課題を解決するために、請求項1に記載の発明は、移動体から外部を撮像した画像に基づいて、その画像内における視覚顕著性の高低を推測して得られた視覚顕著性分布情報を取得する取得部と、予め定めた規則に従って前記画像における基準視線位置を設定する視線位置設定部と、前記視覚顕著性分布情報と前記視線位置とに基づいて前記画像における視覚的注意の集中度を算出する視覚的注意集中度算出部と、前記視覚的注意の集中度の時間的な変化量に基づいて、前記移動体の走行中に安全上の問題が発生した疑いがあると判定する判定部と、を備えることを特徴としている。
【0009】
請求項5に記載の発明は、移動体から外部を撮像した画像に基づいて所定の判定処理を行う判定装置で実行される判定方法であって、前記画像に基づいて、その画像内における視覚顕著性の高低を推測して得られた視覚顕著性分布情報を取得する取得工程と、予め定めた規則に従って前記画像における基準視線位置を設定する視線位置設定工程と、前記視覚顕著性分布情報と前記視線位置とに基づいて前記画像における視覚的注意の集中度を算出する視覚的注意集中度算出工程と、前記視覚的注意の集中度の時間的な変化量に基づいて、前記移動体の走行中に安全上の問題が発生した疑いがあると判定する判定工程と、を含むことを特徴としている。
【0010】
請求項6に記載の発明は、請求項5に記載の判定方法をコンピュータにより実行させることを特徴としている。
【0011】
請求項7に記載の発明は、請求項6に記載の判定プログラムを格納したことを特徴としている。
【図面の簡単な説明】
【0012】
【
図1】本発明の第1の実施例にかかる判定装置を有するシステムの概略構成図である。
【
図2】
図1に示された判定装置の機能構成図である。
【
図3】
図1に示された視覚顕著性演算部の構成を例示するブロック図である。
【
図4】(a)は判定装置へ入力する画像を例示する図であり、(b)は(a)に対し推定される、視覚顕著性マップを例示する図である。
【
図5】
図1に示された視覚顕著性演算部の処理方法を例示するフローチャートである。
【
図6】非線形写像部の構成を詳しく例示する図である。
【
図8】(a)および(b)はそれぞれ、フィルタで行われる畳み込み処理の例を示す図である。
【
図9】(a)は、第1のプーリング部の処理を説明するための図であり、(b)は、第2のプーリング部の処理を説明するための図であり、(c)は、アンプーリング部の処理を説明するための図である。
【
図11】
図1に示された画像入力部に入力された画像と、その画像から取得された視覚顕著性マップの例である。
【
図12】視覚的注意集中度の時間的変化の例を示したグラフである。
【
図13】
図1に示された判定装置の動作のフローチャートである。
【発明を実施するための形態】
【0013】
以下、本発明の一実施形態にかかる判定装置を説明する。本発明の一実施形態にかかる判定装置は、取得部が、移動体から外部を撮像した画像に基づいて、その画像内における視覚顕著性の高低を推測して得られた視覚顕著性分布情報を取得し、視線位置設定部が、予め定めた規則に従って画像における基準視線位置を設定する。そして、視覚的注意集中度算出部が、視覚顕著性分布情報と視線位置とに基づいて画像における視覚的注意の集中度を算出する。そして、判定部が、視覚的注意の集中度の時間的な変化量に基づいて、移動体の走行中に安全上の問題が発生した疑いがあると判定する。このようにすることにより、視覚顕著性分布情報を用いるため、画像内に含まれる標識や歩行者といった物体に視線が無意識に集中しやすいという文脈的な注意状態の時間的な変化量に基づいて安全上の問題が発生した疑いがあると判定することができる。したがって、画像のみで心理的負担がかかったことにより生じる事故やヒヤリハットといった安全上の問題が発生した疑いを判定することができる。
【0014】
また、視覚的注意集中度算出部は、視覚顕著性分布情報を構成する各画素の値と、各画素の位置と基準視線位置の座標位置とのベクトル誤差と、に基づいて視覚的注意の集中度を算出してもよい。このようにすることにより、視覚顕著性が高い位置と基準視線位置との差に応じた値が視覚的注意の集中度として算出される。したがって、例えば、視覚顕著性が高い位置と基準視線位置との距離に応じて視覚的注意の集中度の値が変化するようにできる。
【0015】
また、判定部の判定結果に関する情報を出力する出力部を備えてもよい。このようにすることにより、判定結果や判定結果に基づく情報等を外部に表示等して伝達することができる。
【0016】
また、画像は、移動体が備えるセンサにより移動体の急制動加速度が検出されたことにより得られたものであってもよい。このようにすることにより、例えばドライブレコーダ等において、急制動の検出に基づいて抽出された画像について、さらにヒヤリハット等の判定をすることができるため、人手による手間を省くことができる。
【0017】
また、取得部は、画像を写像処理可能な中間データに変換する入力部と、中間データを写像データに変換する非線形写像部と、写像データに基づき顕著性分布を示す顕著性推定情報を生成する出力部と、を備え、非線形写像部は、中間データに対し特徴の抽出を行う特徴抽出部と、特徴抽出部で生成されたデータのアップサンプルを行うアップサンプル部と、を備えてもよい。このようにすることにより、小さな計算コストで、視覚顕著性を推定することができる。また、このようにして推定した視覚顕著性は、文脈的な注意状態を反映したものとなる。
【0018】
また、本発明の一実施形態にかかる情報処理方法は、取得工程で、移動体から外部を撮像した画像に基づいて、その画像内における視覚顕著性の高低を推測して得られた視覚顕著性分布情報を取得し、視線位置設定工程で、予め定めた規則に従って画像における基準視線位置を設定する。そして、視覚的注意集中度算出工程で、視覚顕著性分布情報と視線位置とに基づいて画像における視覚的注意の集中度を算出する。そして、判定工程で、視覚的注意の集中度の時間的な変化量に基づいて、移動体の走行中に安全上の問題が発生した疑いがあると判定する。このようにすることにより、視覚顕著性分布情報を用いるため、画像内に含まれる標識や歩行者といった物体に視線が無意識に集中しやすいという文脈的な注意状態の時間的な変化量に基づいて安全上の問題が発生した疑いがあると判定することができる。したがって、画像のみで心理的負担がかかったことにより生じる事故やヒヤリハットといった安全上の問題が発生した疑いを判定することができる。
【0019】
また、上述した情報処理方法を、コンピュータにより実行させている。このようにすることにより、コンピュータを用いて安全上の問題が発生した疑いがあると判定することができる。したがって、画像のみで精度良く事故やヒヤリハットといった安全上の問題が発生した疑いを判定することができる。
【0020】
また、上述した情報処理プログラムをコンピュータ読み取り可能な記憶媒体に格納してもよい。このようにすることにより、当該プログラムを機器に組み込む以外に単体でも流通させることができ、バージョンアップ等も容易に行える。
【実施例0021】
本発明の一実施例にかかる判定装置を
図1~
図14を参照して説明する。本実施例にかかる判定装置は、例えば自動車等の移動体に設置されるに限らず、事業所等に設置されるサーバ装置等で構成してもよい(
図1を参照)。即ち、リアルタイムに解析する必要はなく、走行後等に解析を行ってもよい。
【0022】
図1は、判定装置をサーバ装置で構成した例である。
図1では、車両Vに搭載されているドライブレコーダ10において、加速度センサ等の車両挙動検出部11によって急制動や急加速、その他の衝撃等により大きな加速度が検出された場合に、その前後の所定期間の画像(動画像)をインターネット等のネットワークNを介して判定装置1に送信している。なお、
図2に示した車両挙動検出部11は、加速度センサに限らず、車両Vに搭載されているABS(Anti-lock Braking System)や横滑り防止装置等であってもよい。これらの装置(センサ)が作動したことをトリガとして前後の所定期間の画像を送信あるいは保存すればよい。このような急制動等が検出された画像を後述する処理の対象とすることで、ある程度絞られた画像に対して処理を実行することができ、処理を行う時間(処理量)を削減することができる。なお、
図1のような通信で送信する形態に限らず、サーバ装置1に接続されたハードディスクドライブやメモリカード等の記録媒体から読み出した画像であってもよい。また、判定装置はサーバ装置に限らず、判定手段等が組み込まれた車載機器や、自宅や事業所のPC端末であってもよいし、これらの機器とサーバとで処理を分散するように構成されていてもよい。
【0023】
図2に示したように、判定装置1は、画像入力部2と、視覚顕著性演算部3と、視線座標設定部4と、ベクトル誤差演算部5と、判定部6と、を備えている。
【0024】
画像入力部2は、例えば上述したドライブレコーダ等のカメラなどで撮像された画像(例えば動画像)が入力され、その画像を画像データとして出力する。なお、入力された動画像は、例えばフレーム毎等の時系列に分解された画像データとして出力する。画像入力部2に入力される画像として静止画を入力してもよいが、時系列に沿った複数の静止画からなる画像群として入力するのが好ましい。
【0025】
画像入力部2に入力される画像は、例えば車両の進行方向が撮像された画像が挙げられる。つまり、移動体から外部を連続的に撮像した画像とする。この画像はいわゆるパノラマ画像や複数カメラを用いて取得した画像等の水平方向に180°や360°等進行方向以外が含まれる画像であってもよい。また、画像入力部2には入力されるのは、カメラで撮像された画像に限らず、上述したようにハードディスクドライブやメモリカード等の記録媒体から読み出した画像であってもよい。
【0026】
視覚顕著性演算部3は、画像入力部2から画像データが入力され、後述する視覚顕著性推定情報として視覚顕著性マップを出力する。即ち、視覚顕著性演算部3は、移動体から外部を撮像した画像に基づいて視覚顕著性の高低を推測して得られた視覚顕著性マップ(視覚顕著性分布情報)を取得する取得部として機能する。
【0027】
図3は、視覚顕著性演算部3の構成を例示するブロック図である。本実施例に係る視覚顕著性演算部3は、入力部310、非線形写像部320、出力部330および記憶部390を備える。入力部310は、画像を写像処理可能な中間データに変換する。非線形写像部320は、中間データを写像データに変換する。出力部330は、写像データに基づき顕著性分布を示す顕著性推定情報を生成する。そして、非線形写像部320は、中間データに対し特徴の抽出を行う特徴抽出部321と、特徴抽出部321で生成されたデータのアップサンプルを行うアップサンプル部322とを備える。記憶部390は、画像入力部2から入力された画像データや後述するフィルタの係数等が保持されている。以下に詳しく説明する。
【0028】
図4(a)は、視覚顕著性演算部3へ入力する画像を例示する図であり、
図4(b)は、
図4(a)に対し推定される、視覚顕著性分布を示す画像を例示する図である。本実施例に係る視覚顕著性演算部3は、画像における各部分の視覚顕著性を推定する装置である。視覚顕著性とは例えば、目立ちやすさや視線の集まりやすさを意味する。具体的には視覚顕著性は、確率等で示される。ここで、確率の大小は、たとえばその画像を見た人の視線がその位置に向く確率の大小に対応する。
【0029】
図4(a)と
図4(b)とは、互いに位置が対応している。そして、
図4(a)において、視覚顕著性が高い位置ほど、
図4(b)において輝度が高く表示されている。
図4(b)のような視覚顕著性分布を示す画像は、出力部330が出力する視覚顕著性マップの一例である。本図の例において、視覚顕著性は、256階調の輝度値で可視化されている。出力部330が出力する視覚顕著性マップの例については詳しく後述する。
【0030】
図5は、本実施例に係る視覚顕著性演算部3の動作を例示するフローチャートである。
図5に示したフローチャートは、コンピュータによって実行される判定方法の一部であって、入力ステップS110、非線形写像ステップS120、および出力ステップS130を含む。入力ステップS110では、画像が写像処理可能な中間データに変換される。非線形写像ステップS120では、中間データが写像データに変換される。出力ステップS130では、写像データに基づき顕著性分布を示す視覚顕著性推定情報(視覚顕著性分布情報)が生成される。ここで、非線形写像ステップS120は、中間データに対し特徴の抽出を行う特徴抽出ステップS121と、特徴抽出ステップS121で生成されたデータのアップサンプルを行うアップサンプルステップS122とを含む。
【0031】
図3に戻り、視覚顕著性演算部3の各構成要素について説明する。入力ステップS110において入力部310は、画像を取得し、中間データに変換する。入力部310は、画像データを画像入力部2から取得する。そして入力部310は、取得した画像を中間データに変換する。中間データは非線形写像部320が受け付け可能なデータであれば特に限定されないが、たとえば高次元テンソルである。また、中間データはたとえば、取得した画像に対し輝度を正規化したデータ、または、取得した画像の各画素を、輝度の傾きに変換したデータである。入力ステップS110において入力部310は、さらに画像のノイズ除去や解像度変換等を行っても良い。
【0032】
非線形写像ステップS120において、非線形写像部320は入力部310から中間データを取得する。そして、非線形写像部320において中間データが写像データに変換される。ここで、写像データは例えば高次元テンソルである。非線形写像部320で中間データに施される写像処理は、たとえばパラメータ等により制御可能な写像処理であり、関数、汎関数、またはニューラルネットワークによる処理であることが好ましい。
【0033】
図6は、非線形写像部320の構成を詳しく例示する図であり、
図7は、中間層323の構成を例示する図である。上記した通り、非線形写像部320は、特徴抽出部321およびアップサンプル部322を備える。特徴抽出部321において特徴抽出ステップS121が行われ、アップサンプル部322においてアップサンプルステップS122が行われる。また、本図の例において、特徴抽出部321およびアップサンプル部322の少なくとも一方は、複数の中間層323を含むニューラルネットワークを含んで構成される。ニューラルネットワークにおいては、複数の中間層323が結合されている。
【0034】
特にニューラルネットワークは畳み込みニューラルネットワークであることが好ましい。具体的には、複数の中間層323のそれぞれは、一または二以上の畳み込み層324を含む。そして、畳み込み層324では、入力されたデータに対し複数のフィルタ325による畳み込みが行われ、複数のフィルタ325の出力に対し活性化処理が施される。
【0035】
図6の例において、特徴抽出部321は、複数の中間層323を含むニューラルネットワークを含んで構成され、複数の中間層323の間に第1のプーリング部326を備える。また、アップサンプル部322は、複数の中間層323を含むニューラルネットワークを含んで構成され、複数の中間層323の間にアンプーリング部328を備える。さらに、特徴抽出部321とアップサンプル部322とは、オーバーラッププーリングを行う第2のプーリング部327を介して互いに接続されている。
【0036】
なお、本図の例において各中間層323は、二以上の畳み込み層324からなる。ただし、少なくとも一部の中間層323は、一の畳み込み層324のみからなってもよい。互いに隣り合う中間層323は、第1のプーリング部326、第2のプーリング部327およびアンプーリング部328のいずれかで区切られる。ここで、中間層323に二以上の畳み込み層324が含まれる場合、それらの畳み込み層324におけるフィルタ325の数は互いに等しいことが好ましい。
【0037】
本図では、「A×B」と記された中間層323は、B個の畳み込み層324からなり、各畳み込み層324は、各チャネルに対しA個の畳み込みフィルタを含むことを意味している。このような中間層323を以下では「A×B中間層」とも呼ぶ。たとえば、64×2中間層323は、2個の畳み込み層324からなり、各畳み込み層324は、各チャネルに対し64個の畳み込みフィルタを含むことを意味している。
【0038】
本図の例において、特徴抽出部321は、64×2中間層323、128×2中間層323、256×3中間層323、および、512×3中間層323をこの順に含む。また、アップサンプル部322は、512×3中間層323、256×3中間層323、128×2中間層323、および64×2中間層323をこの順に含む。また、第2のプーリング部327は、2つの512×3中間層323を互いに接続している。なお、非線形写像部320を構成する中間層323の数は特に限定されず、たとえば画像データの画素数に応じて定めることができる。
【0039】
なお、本図は非線形写像部320の構成の一例であり、非線形写像部320は他の構成を有していても良い。たとえば、64×2中間層323の代わりに64×1中間層323が含まれても良い。中間層323に含まれる畳み込み層324の数が削減されることで、計算コストがより低減される可能性がある。また、たとえば、64×2中間層323の代わりに32×2中間層323が含まれても良い。中間層323のチャネル数が削減されることで、計算コストがより低減される可能性がある。さらに、中間層323における畳み込み層324の数とチャネル数との両方を削減しても良い。
【0040】
ここで、特徴抽出部321に含まれる複数の中間層323においては、第1のプーリング部326を経る毎にフィルタ325の数が増加することが好ましい。具体的には、第1の中間層323aと第2の中間層323bとが、第1のプーリング部326を介して互いに連続しており、第1の中間層323aの後段に第2の中間層323bが位置する。そして、第1の中間層323aは、各チャネルに対するフィルタ325の数がN1である畳み込み層324で構成されており、第2の中間層323bは、各チャネルに対するフィルタ325の数がN2である畳み込み層324で構成されている。このとき、N2>N1が成り立つことが好ましい。また、N2=N1×2が成り立つことがより好ましい。
【0041】
また、アップサンプル部322に含まれる複数の中間層323においては、アンプーリング部328を経る毎にフィルタ325の数が減少することが好ましい。具体的には、第3の中間層323cと第4の中間層323dとが、アンプーリング部328を介して互いに連続しており、第3の中間層323cの後段に第4の中間層323dが位置する。そして、第3の中間層323cは、各チャネルに対するフィルタ325の数がN3である畳み込み層324で構成されており、第4の中間層323dは、各チャネルに対するフィルタ325の数がN4である畳み込み層324で構成されている。このとき、N4<N3が成り立つことが好ましい。また、N3=N4×2が成り立つことがより好ましい。
【0042】
特徴抽出部321では、入力部310から取得した中間データから勾配や形状など、複数の抽象度を持つ画像特徴を中間層323のチャネルとして抽出する。
図7は、64×2中間層323の構成を例示している。本図を参照して、中間層323における処理を説明する。本図の例において、中間層323は第1の畳み込み層324aと第2の畳み込み層324bとで構成されており、各畳み込み層324は64個のフィルタ325を備える。第1の畳み込み層324aでは、中間層323に入力されたデータの各チャネルに対して、フィルタ325を用いた畳み込み処理が施される。たとえば入力部310へ入力された画像がRGB画像である場合、3つのチャネルh
0
i(i=1..3)のそれぞれに対して処理が施される。また、本図の例において、フィルタ325は64種の3×3フィルタであり、すなわち合計64×3種のフィルタである。畳み込み処理の結果、各チャネルiに対して、64個の結果h
0
i,j(i=1..3,j=1..64)が得られる。
【0043】
次に、複数のフィルタ325の出力に対し、活性化部329において活性化処理が行われる。具体的には、全チャネルの対応する結果jについて、対応する要素毎の総和に活性化処理が施される。この活性化処理により、64チャネルの結果h1
i(i=1..64)、すなわち、第1の畳み込み層324aの出力が、画像特徴として得られる。活性化処理は特に限定されないが、双曲関数、シグモイド関数、および正規化線形関数の少なくともいずれかを用いる処理が好ましい。
【0044】
さらに、第1の畳み込み層324aの出力データを第2の畳み込み層324bの入力データとし、第2の畳み込み層324bにて第1の畳み込み層324aと同様の処理を行って、64チャネルの結果h2
i(i=1..64)、すなわち第2の畳み込み層324bの出力が、画像特徴として得られる。第2の畳み込み層324bの出力がこの64×2中間層323の出力データとなる。
【0045】
ここで、フィルタ325の構造は特に限定されないが、3×3の二次元フィルタであることが好ましい。また、各フィルタ325の係数は独立に設定可能である。本実施例において、各フィルタ325の係数は記憶部390に保持されており、非線形写像部320がそれを読み出して処理に用いることができる。ここで、複数のフィルタ325の係数は機械学習を用いて生成、修正された補正情報に基づいて定められてもよい。たとえば、補正情報は、複数のフィルタ325の係数を、複数の補正パラメータとして含む。非線形写像部320は、この補正情報をさらに用いて中間データを写像データに変換することができる。記憶部390は視覚顕著性演算部3に備えられていてもよいし、視覚顕著性演算部3の外部に設けられていてもよい。また、非線形写像部320は補正情報を、通信ネットワークを介して外部から取得しても良い。
【0046】
図8(a)および
図8(b)はそれぞれ、フィルタ325で行われる畳み込み処理の例を示す図である。
図8(a)および
図8(b)では、いずれも3×3畳み込みの例が示されている。
図8(a)の例は、最近接要素を用いた畳み込み処理である。
図8(b)の例は、距離が二以上の近接要素を用いた畳み込み処理である。なお、距離が三以上の近接要素を用いた畳み込み処理も可能である。フィルタ325は、距離が二以上の近接要素を用いた畳み込み処理を行うことが好ましい。より広範囲の特徴を抽出することができ、視覚顕著性の推定精度をさらに高めることができるからである。
【0047】
以上、64×2中間層323の動作について説明した。他の中間層323(128×2中間層323、256×3中間層323、および、512×3中間層323等)の動作についても、畳み込み層324の数およびチャネルの数を除いて、64×2中間層323の動作と同じである。また、特徴抽出部321における中間層323の動作も、アップサンプル部322における中間層323の動作も上記と同様である。
【0048】
図9(a)は、第1のプーリング部326の処理を説明するための図であり、
図9(b)は、第2のプーリング部327の処理を説明するための図であり、
図9(c)は、アンプーリング部328の処理を説明するための図である。
【0049】
特徴抽出部321において、中間層323から出力されたデータは、第1のプーリング部326においてチャネル毎にプーリング処理が施された後、次の中間層323に入力される。第1のプーリング部326ではたとえば、非オーバーラップのプーリング処理が行われる。
図9(a)では、各チャネルに含まれる要素群に対し、2×2の4つの要素30を1つの要素30に対応づける処理を示している。第1のプーリング部326ではこのような対応づけが全ての要素30に対し行われる。ここで、2×2の4つの要素30は互いに重ならないよう選択される。本例では、各チャネルの要素数が4分の1に縮小される。なお、第1のプーリング部326において要素数が縮小される限り、対応づける前後の要素30の数は特に限定されない。
【0050】
特徴抽出部321から出力されたデータは、第2のプーリング部327を介してアップサンプル部322に入力される。第2のプーリング部327では、特徴抽出部321からの出力データに対し、オーバーラッププーリングが施される。
図9(b)では、一部の要素30をオーバーラップさせながら、2×2の4つの要素30を1つの要素30に対応づける処理を示している。すなわち、繰り返される対応づけにおいて、ある対応づけにおける2×2の4つの要素30のうち一部が、次の対応づけにおける2×2の4つの要素30にも含まれる。本図のような第2のプーリング部327では要素数は縮小されない。なお、第2のプーリング部327において対応づける前後の要素30の数は特に限定されない。
【0051】
第1のプーリング部326および第2のプーリング部327で行われる各処理の方法は特に限定されないが、たとえば、4つの要素30の最大値を1つの要素30とする対応づけ(max pooling)や4つの要素30の平均値を1つの要素30とする対応づけ(average
pooling)が挙げられる。
【0052】
第2のプーリング部327から出力されたデータは、アップサンプル部322における中間層323に入力される。そして、アップサンプル部322の中間層323からの出力データはアンプーリング部328においてチャネル毎にアンプーリング処理が施された後、次の中間層323に入力される。
図9(c)では、1つの要素30を複数の要素30に拡大する処理を示している。拡大の方法は特に限定されないが、1つの要素30を2×2の4つの要素30へ複製する方法が例として挙げられる。
【0053】
アップサンプル部322の最後の中間層323の出力データは写像データとして非線形写像部320から出力され、出力部330に入力される。出力ステップS130において出力部330は、非線形写像部320から取得したデータに対し、たとえば正規化や解像度変換等を行うことで視覚顕著性マップを生成し、出力する。視覚顕著性マップはたとえば、
図4(b)に例示したような視覚顕著性を輝度値で可視化した画像(画像データ)である。また、視覚顕著性マップはたとえば、ヒートマップのように視覚顕著性に応じて色分けされた画像であっても良いし、視覚顕著性が予め定められた基準より高い視覚顕著領域を、その他の位置とは識別可能にマーキングした画像であっても良い。さらに、視覚顕著性推定情報は画像等として示されたマップ情報に限定されず、視覚顕著領域を示す情報を列挙したテーブル等であっても良い。
【0054】
視線座標設定部4は、後述する理想視線を視覚顕著性マップ上に設定する。理想視線とは、障害物や自分以外の交通参加者がいないという理想的な交通環境下で自動車の運転者が進行方向に沿って向ける視線をいう。画像データや視覚顕著性マップ上では(x,y)座標として取り扱う。なお、本実施例では理想視線は固定値とするが、移動体の停止距離に影響する速度や道路の摩擦係数の関数として扱ってもよいし、設定された経路情報を利用して決定されてもよい。また、理想視点を算出する方法として現走行路に対応する消失点を利用してもよい。その際に、自車両速度を検知して、理想視点を消失点と自車位置との間の2秒後や3秒後に設定してもよい。即ち、視線座標設定部4は、予め定めた規則に従って画像における理想視線(基準視線位置)を設定する視線位置設定部として機能する。
【0055】
ベクトル誤差演算部5は、視覚顕著性演算部3が出力した視覚顕著性マップ及び当該視覚顕著性マップや画像に対して視線座標設定部4が設定した理想視線に基づいてベクトル誤差を算出し、そのベクトル誤差に基づいて視覚的注意の集中度を示す後述する視覚的注意集中度Psを演算する。即ち、ベクトル誤差演算部5は、視覚顕著性分布情報と視線位置とに基づいて画像における視覚的注意の集中度を算出する視覚的注意集中度算出部として機能する。
【0056】
ここで、本実施例におけるベクトル誤差について
図10を参照して説明する。
図10は、視覚顕著性マップの例を示したものである。この視覚顕著性マップはH画素×V画素の256階調の輝度値で示されており、
図4と同様に視覚顕著性が高い画素ほど輝度が高く表示されている。
図10において、理想視線の座標(x,y)=(x
im,y
im)としたとき、視覚顕著性マップ内の任意の座標(k,m)の画素とのベクトル誤差を算出する。視覚顕著性マップにおいて輝度が高い座標と理想視線の座標とが離れている場合は、注視すべき位置と実際に注視し易い位置とが離れることを意味し、視覚的注意が散漫になり易い画像といえる。一方、輝度が高い座標と理想視線の座標とが近い場合は、注視すべき位置と実際に注視し易い位置とが近いことを意味し、注視すべき位置に視覚的注意が集中し易い画像といえる。
【0057】
次に、ベクトル誤差演算部5における視覚的注意集中度Psの算出方法について説明する。本実施例では、視覚的注意集中度Psは次の(1)式により算出される。
【数1】
【0058】
(1)式において、Vvcはピクセル深度(輝度値)、fwは重みづけ関数、derrはベクトル誤差を示している。この重みづけ関数は、例えばVvcの値を示す画素から理想視線の座標までの距離に基づいて重み設定される関数である。αは輝点1点の視覚顕著性マップ(リファレンスヒートマップ)における、輝点の座標と理想視線の座標が一致したときの視覚的注意集中度Psが1となるような係数である。
【0059】
即ち、ベクトル誤差演算部5(視覚的注意集中度算出部)は、視覚顕著性マップ(視覚顕著性分布情報)を構成する各画素の値と、各画素の位置と理想視線(基準視線位置)の座標位置とのベクトル誤差と、に基づいて視覚的注意の集中度を算出している。
【0060】
このようにして得られた視覚的注意集中度Psは、視覚顕著性マップ上に設定した理想視線の座標からの全画素の座標のベクトル誤差と輝度値の関係を重みづけした上で合計したものの逆数である。この視覚的注意集中度Psは、理想視線の座標から視覚顕著性マップの輝度が高い分布が離れていると低い値が算出される。即ち、視覚的注意集中度Psは、理想視線に対する集中度ともいえる。
【0061】
図11に画像入力部2に入力された画像と、その画像から取得された視覚顕著性マップの例を示す。
図11(a)は入力画像、(b)は視覚顕著性マップである。このような、
図11において、理想視線の座標を例えば前方を走行するトラック等の道路上に設定すると、その場合における視覚的注意集中度Psが算出される。
【0062】
判定部6は、ベクトル誤差演算部5で算出された視覚的注意集中度Psの時間的変化に基づいて画像入力部2から入力された画像が事故又はヒヤリハット等の移動体の走行中に安全上の問題が発生した疑いがあるか判定する。判定後は、その判定結果等を外部へ出力する。
【0063】
図12に視覚的注意集中度Psの時間的変化の例を示す。
図12は、12秒間の動画像における視覚的注意集中度Psの変化を示している。
図12において、約6.5秒~約7秒の間で視覚的注意集中度Psが急激に変化している。これは、例えば自車両の前方に他車両が割り込んだ場合等であり、このような変化を検出することでヒヤリハットとなる事象を検出することができる。
【0064】
図12に示したように、視覚的注意集中度Psの短時間当たりの変化率や変化値などの変化量を予め定めた閾値等と比較することによりヒヤリハット等の疑いがある画像を抽出することができる。
【0065】
次に、上述した構成の判定装置1における動作(判定方法)について、
図13のフローチャートを参照して説明する。また、このフローチャートを判定装置1として機能するコンピュータで実行されるプログラムとして構成することで判定プログラムとすることができる。また、この判定プログラムは、判定装置1が有するメモリ等に記憶するに限らず、メモリカードや光ディスク等の記憶媒体に格納してもよい。
【0066】
まず、画像入力部2が、入力された画像を画像データとして視覚顕著性演算部3に出力する(ステップS11)。本ステップでは、画像入力部2に入力された画像データを画像フレーム等の時系列に分解して視覚顕著性演算部3へ入力している。また、本ステップでノイズ除去や幾何学変換などの画像処理を施してもよい。
【0067】
次に、視覚顕著性演算部3が、視覚顕著性マップを取得する(ステップS12)。視覚顕著性マップは、視覚顕著性演算部3において、上述した方法により
図4(b)に示したような視覚顕著性マップを時系列に出力する。
【0068】
一方、ステップS12と並行して、視線座標設定部4が、理想視線の座標を設定する(ステップS13)。この座標は、上述したように本実施例では前方注視等の固定位置とする。
【0069】
次に、ベクトル誤差演算部5が、視覚顕著性マップ及び理想視線から視覚的注意集中度Psを算出する(ステップS14)。即ち、上述したように、理想視線の座標と、視覚顕著性マップの座標とのベクトル誤差を算出し、そのベクトル誤差と、各画素の値と、に基づいて(1)式により視覚的注意集中度Psを算出する。
【0070】
次に、判定部6が、ベクトル誤差演算部5で算出された視覚的注意集中度Psの時間的変化に基づいて画像入力部2から入力された画像が移動体の走行中に安全上の問題が発生した疑いがあるか判定する(ステップS15)。
【0071】
次に、判定部6が、ステップS16の判定結果を出力する(ステップS16)。本ステップでは、単に判定結果を出力するに限らず、その結果を表示装置等に表示させたり、画像入力部2から入力された画像に判定結果に応じたラベルを付加する等の処理を行ってもよい。あるいは、画像入力部2から入力された画像のうち安全上の問題が発生した疑いがあると判定された画像のみを特定の記憶装置(特定の記憶領域)に保存するといった処理を行ってもよい。即ち、判定部6は、判定結果に関する情報を出力する出力部として機能する。
【0072】
以上の説明から明らかなように、ステップS12が取得工程、ステップS13視線位置設定工程、ステップS14が視覚的注意集中度算出工程、ステップS15が判定工程、としてそれぞれ機能する。
【0073】
ここで、上述した判定装置1における判定結果を表示する画像の例について
図14を参照して説明する。
図14に示した画像は判定部6により生成され、所定の表示装置に表示される。
図14に示した画像50は、走行画像表示領域51と、視覚的注意集中度表示領域52と、を備えている。
【0074】
走行画像表示領域51は、ドライブレコーダ等により撮像された車両の走行画像が表示される。走行画像表示領域51には、消失点VPと、視覚顕著性マップVMと、視線推定位置GEと、検知物体枠OFと、水平線及び奥行距離推定線HDと、白線推定WLと、ヒヤリハット判定枠HFと、が表示可能となっている。
【0075】
消失点VPは、後述する白線推定WL等から推定してもよいし、オプティカルフロー等を用いて推定してもよい。視覚顕著性マップVMは、走行画像表示領域51に表示されている画像についての視覚顕著性マップ(ヒートマップ)を当該画像に重ねて表示させている。なお、
図14では、ヒートマップ上の輝度の高い部分のみが視認できるが実際は輝度の低い部分も含め走行画像に重ねられている。つまり、走行画像において視線が向かい易い部分を表示している。
【0076】
視線推定位置GEは、本実施例では、ヒートマップ上で輝度が最も高い位置を視線位置と推定している。検知物体枠OFは、走行画像において周知のアルゴリズムによる物体検知の結果検知された物体を囲む枠として表示される。なお、本実施例における物体検知では、検出する物体の種類(車両、人間等)を指定し、指定された種類に属する物体のみが検知される。物体検知処理は、判定部6で行ってもよいし、
図1には図示されていない他のブロックで行ってもよい。
【0077】
水平線及び奥行距離推定線HDは、走行画像における水平線と奥行距離を示している。白線推定WLは、走行画像内の白線等の区画線を認識して示している。ヒヤリハット判定枠HFは、走行画像表示領域51の四辺に沿うような枠状に形成され、判定部6によりヒヤリハット等の安全上の問題が発生した疑いがあると判定された場合に表示される。または、ヒヤリハット判定枠HFは常時青色等の枠として表示され、安全上の問題が発生した疑いがあると判定された場合は赤色等で表示される等表示色を変更したり、点滅させるなどとしてもよい。
【0078】
視覚的注意集中度表示領域52は、走行画像表示領域51の右側に設けられている。視覚的注意集中度表示領域52は、ベクトル誤差演算部5で演算された視覚的注意集中度Psをバーグラフ状に表示する。
図14では、符号52aが視覚的注意集中度Psを示すバーである。視覚的注意集中度Psが大きな値を示しているときはバー52aが高くなり、視覚的注意集中度Psが小さな値を示しているときはバー52aが低くなる。つまり、バー52aが高い位置では、集中度が高い(集中)傾向であり、バー52aが低い位置では、集中度が低い(分散)傾向であるといえる。
【0079】
視覚的注意集中度表示領域52のバー52aの高さは、視覚顕著性マップがフレーム単位で取得されることから、画像の再生時間の推移とともに変化する。そのため、例えばバー52aの高さが急激に高くなるようなシーンは、視覚的注意の集中度が分散から集中へ急速に変化したことを示し、このバー52aによっても、判定部6による安全上の問題が発生した疑いがあることを視覚的に表示することができる。
【0080】
本実施例によれば、判定装置1は、視覚顕著性演算部3が、移動体から外部を撮像した画像に基づいて、その画像内における視覚顕著性の高低を推測して得られた視覚顕著性マップを取得し、視線座標設定部4が、理想視線の座標を設定する。そして、ベクトル誤差演算部5が、視覚顕著性マップと理想視線とに基づいて画像における視覚的注意集中度Psを算出する。判定部6が、視覚的注意集中度Psの時間的な変化量に基づいて、ヒヤリハット等の移動体の走行中に安全上の問題が発生した疑いがあると判定する。このようにすることにより、視覚顕著性マップを用いるため、画像内に含まれる標識や歩行者といった物体に視線が無意識に集中しやすいという文脈的な注意状態の時間的な変化量に基づいてヒヤリハット等の安全上の問題が発生した疑いがあると判定することができる。したがって、画像のみで心理的負担がかかったことにより生じる事故やヒヤリハットといった安全上の問題が発生した疑いを判定することができる。
【0081】
また、ベクトル誤差演算部5は、視覚顕著性マップを構成する各画素の値と、各画素の位置と理想視線の座標位置とのベクトル誤差と、に基づいて視覚的注意集中度Psを算出している。このようにすることにより、視覚顕著性が高い位置と理想視線との差に応じた値が視覚的注意集中度Psとして算出される。したがって、例えば、視覚顕著性が高い位置と理想視線との距離に応じて視覚的注意集中度Psの値が変化するようにすることができる。
【0082】
また、判定部6は、判定結果に関する情報を出力している。このようにすることにより、判定結果や判定結果に基づく情報等を外部に表示等して伝達することができる。
【0083】
また、画像入力部2に入力される画像は、移動体が備えるセンサにより急制動が検出されたこと、例えば移動体の加速度が基準値以上であることにより得られたものであってもよい。このようにすることにより、例えばドライブレコーダ等において、加速度に基づいて抽出された画像について、さらにヒヤリハット等の判定をすることができるため、従来人手により急制動が事故やヒヤリハットに係るものか、事故やヒヤリハット以外の要因(例えば、移動体が段差を超えたことによるもの、荒い運転によるもの)であるかを判別していた手間をより省くことができる。また、急制動の場合に加えて、急な運転操作(別言すれば危険挙動)の場合を含めてもよい。例えば、横方向の加速度から何かをよける操作や、白線からのはみ出し走行に気づいて戻す操作等に関連するヒヤリハットが発生した可能性があるとして画像を抽出してもよい。また、急加速をさらに含んでもよい。例えば、高速道路における漫然運転により速度の低下に気づいて急加速をした可能性があるとして、画像を抽出してもよい。
【0084】
また、視覚顕著性演算部3は、画像を写像処理可能な中間データに変換する入力部310と、中間データを写像データに変換する非線形写像部320と、写像データに基づき顕著性分布を示す顕著性推定情報を生成する出力部330と、を備え、非線形写像部320は、中間データに対し特徴の抽出を行う特徴抽出部321と、特徴抽出部321で生成されたデータのアップサンプルを行うアップサンプル部322と、を備えている。このようにすることにより、小さな計算コストで、視覚顕著性を推定することができる。また、このようにして推定した視覚顕著性は、文脈的な注意状態を反映したものとなる。
【0085】
また、本発明は上記実施例に限定されるものではない。即ち、当業者は、従来公知の知見に従い、本発明の骨子を逸脱しない範囲で種々変形して実施することができる。かかる変形によってもなお本発明の判定装置を具備する限り、勿論、本発明の範疇に含まれるものである。