IP Force 特許公報掲載プロジェクト 2022.1.31 β版

知財求人 - 知財ポータルサイト「IP Force」

▶ ノダー インコーポレイテッドの特許一覧

特許7525936確信度推定値を有する深度マップを提供するための方法およびシステム
(19)【発行国】日本国特許庁(JP)
(12)【公報種別】特許公報(B2)
(11)【特許番号】
(24)【登録日】2024-07-23
(45)【発行日】2024-07-31
(54)【発明の名称】確信度推定値を有する深度マップを提供するための方法およびシステム
(51)【国際特許分類】
   B60R 1/20 20220101AFI20240724BHJP
   G06T 7/00 20170101ALI20240724BHJP
   G06T 7/593 20170101ALI20240724BHJP
   G08G 1/16 20060101ALI20240724BHJP
【FI】
B60R1/20 100
G06T7/00 650Z
G06T7/593
G08G1/16 C
【請求項の数】 20
(21)【出願番号】P 2022561423
(86)(22)【出願日】2021-12-22
(65)【公表番号】
(43)【公表日】2023-05-25
(86)【国際出願番号】 US2021064856
(87)【国際公開番号】W WO2022150196
(87)【国際公開日】2022-07-14
【審査請求日】2022-11-25
(31)【優先権主張番号】63/229,102
(32)【優先日】2021-08-04
(33)【優先権主張国・地域又は機関】US
(31)【優先権主張番号】PCT/US2021/012294
(32)【優先日】2021-01-06
(33)【優先権主張国・地域又は機関】US
【早期審査対象出願】
(73)【特許権者】
【識別番号】522292297
【氏名又は名称】ノダー インコーポレイテッド
【氏名又は名称原語表記】NODAR INC.
(74)【代理人】
【識別番号】100116322
【弁理士】
【氏名又は名称】桑垣 衛
(72)【発明者】
【氏名】ジャン、リーフ オールデン
(72)【発明者】
【氏名】ブルス、カルステン ルイス
【審査官】久保田 信也
(56)【参考文献】
【文献】特開2003-269917(JP,A)
【文献】特開2015-158749(JP,A)
【文献】再公表特許第2017/057058(JP,A1)
【文献】芦ヶ原 隆之 Takayuki Yoshigahara,最終回 コンピュータビジョンは人のビジョンにどこまで近づいたか ~難点とそれを回避する実践的アプローチについて~ How Does Computer-Vision Imitate Human-Vision with the Latest Techniques? -Practical Approaches to Avoid Difficulties- (The Last Chapter),映像情報メディア学会誌 第60巻 第12号 THE JOURNAL OF THE INSTITUTE OF IMAGE INFORMATION AND TELEVISION ENGINEERS,日本,(社)映像情報メディア学会 THE INSTITUTE OF IMAGE INFORMATION AND TELEVISION ENGINEERS,第60巻
(58)【調査した分野】(Int.Cl.,DB名)
B60R 1/20
G06T 7/00
G06T 7/593
G08G 1/16
(57)【特許請求の範囲】
【請求項1】
車両移動を制御するための自動車両支援システムであって、前記システムは、
コンピュータプロセッサと、前記コンピュータプロセッサに対して結合されたメモリとから成る、車両制御システムと、
第1のセンサシステムであって、
カメラセンサのペアによってキャプチャされた、シーンの第1の画像データを受信することと、
前記第1の画像データからの第1の視差値と、
前記第1の画像データからの第1の確信度値と、
前記第1の視差値からの第2の確信度値と
を算出することと、
前記第1の確信度値に基づく第1の確信度マップと、
前記第2の確信度値に基づく第2の確信度マップと、
前記第1の確信度マップおよび前記第2の確信度マップに基づく第1センサ確信度マップと
を生み出すことと、
前記第1の視差値を含む、第1の視差マップと、
前記第1センサ確信度マップと
を出力することと
を行うように構成された、第1のセンサシステムと
を備え、
前記車両制御システムは、
前記第1のセンサシステムから、前記第1の視差マップと、前記第1センサ確信度マップとを受信することと、
前記第1の視差マップと、前記第1センサ確信度マップとに基づいて、前記車両を制御するために、前記車両の電子制御ユニット(ECU)に対して、第1の制御信号をリアルタイムまたはほぼリアルタイムで出力することと、
前記車両の表示デバイスに対して、前記第1の視差マップと、前記第1センサ確信度マップとに基づいた、ビデオストリームを出力することと
を行うように構成される、
自動車両支援システム。
【請求項2】
前記ビデオストリームにおいて、前記第1センサ確信度マップは、前記第1の視差マップの一部になるように、エンコードされる、請求項1に記載の車両支援システム。
【請求項3】
前記第1の画像データは、複数のピクセルから成り、
前記第1の視差マップは、前記ピクセルの各々についての視差値から成り、
前記第1センサ確信度マップは、前記ピクセルの各々についての確信度値から成る、
請求項1に記載の車両支援システム。
【請求項4】
前記シーンの少なくとも一部分の第2の画像データを受信し、前記第2の画像データに基づいて、第2センサ確信度マップを出力するように構成された、第2のセンサシステム
をさらに備え、
前記車両制御システムは、
前記第2のセンサシステムから、前記第2センサ確信度マップを受信することと、
前記ビデオストリームを、スーパフレームのシーケンスとして出力することであって、各スーパフレームは、前記第1の視差マップと、前記第1センサ確信度マップと、前記第2センサ確信度マップとに基づいた情報を含む、出力することと
を行うように構成される、
請求項1に記載の車両支援システム。
【請求項5】
前記車両制御システムは、前記第1の視差マップと、前記第1センサ確信度マップとに基づいて、前記車両の複数のECUに対して、複数の制御信号を出力するように構成される、請求項1に記載の車両支援システム。
【請求項6】
前記ビデオストリームは、
前記第1の視差マップと、前記第1センサ確信度マップとを含む、少なくとも1つのスーパフレームと、
前記第1の視差マップと、前記第2センサ確信度マップとを含む、少なくとも1つのスーパフレームと
を含む、請求項4に記載の車両支援システム。
【請求項7】
前記ビデオストリームは、前記第1センサ確信度マップの一部分と、前記第2センサ確信度マップの一部分とを含む、少なくとも1つのスーパフレームを含む、請求項4に記載の車両支援システム。
【請求項8】
前記第1の画像データは、ステレオビジョンデータを含み、
前記第2の画像データは、ライダデータを含む、
請求項4に記載の車両支援システム。
【請求項9】
前記第1のセンサシステムは、
前記第1の画像データに基づいて、複数のカメラベースの確信度マップを生み出すことと、
前記複数のカメラベースの確信度マップからのデータを集約することと、
前記複数のカメラベースの確信度マップから集約された前記データに基づいて、前記第1センサ確信度マップを出力することと
を行うように構成された、確信度プロセッサを含む、請求項1に記載の車両支援システム。
【請求項10】
前記ビデオストリームの複数のスーパフレームはそれぞれ、
前記シーンの2次元(2D)画像に対応する、第1の領域と、
前記シーンの深度マップに対応する、第2の領域と、
前記シーンの確実性マップに対応する、第3の領域と
を含む、
請求項1に記載の車両支援システム。
【請求項11】
前記シーンの前記2D画像のピクセル、前記シーンの前記深度マップのピクセル、および前記シーンの前記確実性マップのピクセルは、時間的および空間的にマッチさせられる、請求項10に記載の車両支援システム。
【請求項12】
前記ビデオストリームは、2次元(2D)カラー画像を含み、各2Dカラー画像は、複数のピクセルを含み、各ピクセルのアルファチャンネル透明度は、前記ピクセルについての確信度値に比例する、請求項1に記載の車両支援システム。
【請求項13】
前記2Dカラー画像のカラーは、深度範囲を示す、請求項12に記載の車両支援システム。
【請求項14】
コンピュータプロセッサによって遂行されたときに、前記コンピュータプロセッサに、車両移動を制御するための自動車両支援システムの方法を実行させるコードを記憶した、非一時的コンピュータ可読記憶媒体であって、前記方法は、
前記コンピュータプロセッサが、カメラセンサのペアによってキャプチャされた、シーンの第1の画像データを受信する工程と、
前記コンピュータプロセッサが、
前記第1の画像データからの第1の視差値と、
前記第1の画像データからの第1の確信度値と、
前記第1の視差値からの第2の確信度値と
を算出する工程と、
前記コンピュータプロセッサが、
前記第1の視差値から成る、第1の視差マップと、
前記第1の確信度値に基づく第1の確信度マップと、
前記第2の確信度値に基づく第2の確信度マップと、
前記第1の確信度マップおよび前記第2の確信度マップに基づく第1センサ確信度マップと
を生み出す工程と、
前記コンピュータプロセッサが、前記第1の視差マップと、前記第1センサ確信度マップとに基づいて、前記車両を制御するために、前記車両の電子制御ユニット(ECU)に対して、第1の制御信号をリアルタイムまたはほぼリアルタイムで出力する工程と、
前記コンピュータプロセッサが、前記車両の表示デバイスに対して、前記第1の視差マップと、前記第1センサ確信度マップとに基づいた、ビデオストリームを出力する工程と
を含む、非一時的コンピュータ可読記憶媒体。
【請求項15】
前記第1の画像データは、複数のピクセルを含み、
前記第1の視差マップは、前記ピクセルの各々についての視差値を含み、
前記第1センサ確信度マップは、前記ピクセルの各々についての確信度値を含む、
請求項14に記載のコンピュータ可読記憶媒体。
【請求項16】
前記方法は、
前記コンピュータプロセッサが、前記シーンの少なくとも一部分の第2の画像データに対応する第2センサ確信度マップを獲得する工程と、
前記コンピュータプロセッサが、前記ビデオストリームを、スーパフレームのシーケンスとして出力する工程であって、各スーパフレームは、前記第1の視差マップと、前記第1センサ確信度マップと、前記第2センサ確信度マップとに基づいた情報を含む、工程と
をさらに含む、請求項14に記載のコンピュータ可読記憶媒体。
【請求項17】
前記方法は、
前記コンピュータプロセッサが、前記第1の視差マップと、前記第1センサ確信度マップとに基づいて、前記車両の複数のECUに対して、複数の制御信号を出力する工程
をさらに含む、請求項14に記載のコンピュータ可読記憶媒体。
【請求項18】
前記ビデオストリームを出力する前記工程は、
前記コンピュータプロセッサが、前記第1の視差マップと、前記第1センサ確信度マップとを含むように、少なくとも1つのスーパフレームを準備する工程と、
前記コンピュータプロセッサが、前記第1の視差マップと、前記第2センサ確信度マップとを含むように、少なくとも1つのスーパフレームを準備する工程と
を含む、請求項16に記載のコンピュータ可読記憶媒体。
【請求項19】
前記ビデオストリームを出力する前記工程は、前記コンピュータプロセッサが、
前記シーンの2次元(2D)画像に対応する、第1の領域と、
前記シーンの深度マップに対応する、第2の領域と、
前記シーンの確実性マップに対応する、第3の領域と
を含むように、前記ビデオストリームの複数のスーパフレームのそれぞれを準備する工程を含む、
請求項14に記載のコンピュータ可読記憶媒体。
【請求項20】
前記方法は、
前記コンピュータプロセッサが、前記第1の画像データに基づいて、複数のカメラベースの確信度マップを生み出す工程と
前記コンピュータプロセッサが、前記複数のカメラベースの確信度マップからのデータを集約する工程と
前記コンピュータプロセッサが、前記複数のカメラベースの確信度マップから集約された前記データに基づいて、前記第1センサ確信度マップを出力する工程と
をさらに含む、請求項19に記載のコンピュータ可読記憶媒体。
【発明の詳細な説明】
【技術分野】
【0001】
本発明の技術は、ステレオビジョンシステムに関する。詳細には、本発明の技術は、シーンの画像をキャプチャし、2次元(「2D」)画像データ、シーン内の対象物までの距離に関係する深度推定値データ、および深度推定値データの確実性のレベルに関係する確信度データを出力する、ステレオビジョンシステム(例えば、ステレオカメラシステム)に関する。
【背景技術】
【0002】
ステレオビジョンシステムは、典型的には、左カメラによってキャプチャされた画像と、右カメラによってキャプチャされた画像における、マッチしたピクセル間の視差またはパララックスを測定することによって、距離を推定するために、2つのカメラ(例えば、左カメラおよび右カメラ)を使用する。例えば、特許文献1は、カメラのうちの1つ(しばしば、左カメラ)によってキャプチャされた、平行化画像に対応する、ピクセルシフトデータを包含する、2Dマトリックスである、視差マップを出力する、ステレオビジョンシステムおよび方法を開示している。ピクセルの深度は、ピクセルの視差に反比例するので、カメラからピクセルで画像化された対象物までの距離に対応する、画像の各ピクセルについての深度の推定値は、視差マップから容易に計算され得る。そのため、「深度マップ」および「視差マップ」という用語は、それらが、画像のシーンについて、ほぼ同一の情報を提供するので、本願明細書においては、交換可能に使用されることがある。
【0003】
存在しているステレオビジョンシステムの問題は、深度推定値が、典型的には、推定値が、ピクセルごとに、またはフレームごとにでさえ、どの程度信頼できるか(または信頼できないか)の指標なしに提供されることである。従来の運転者支援システムにおいては、車両を停止させる、または操縦するための自動化された決定は、多数のセンサ(例えば、レーダ、ライダ、カメラなど)からの情報に基づいて、いずれのセンサからの情報についても信頼性の知識なしに、行われることがある。これは、運転者支援システムが、不必要な手順(例えば、きわめて低速での走行、過度に頻繁なブレーキなど)を実行することによって、センサからの相反する情報の不確実性を過大補償する結果となり得、乗客の快適性を低下させることがあり、または運転者支援システムが、恣意的に別のセンサよりも1つのセンサを選ぶことによって、相反する情報の不確実性を過小補償する結果となり得、乗客リスクを低下させることがある。認識されるように、運転者支援システムによって行われる決定は、乗客の安全に大きく影響することがあり、時には、重大な生命に関わる決定となることがある。例えば、車両が、幹線道路での運転に典型的な巡航スピードで走行しているとき、対象物までの距離の正確な知識は、巡航スピードを維持、またはほぼ維持しながら、対象物に衝突することを避けるために、運転者支援システムがどのように車両を制御するかに必須であり得る。
【先行技術文献】
【特許文献】
【0004】
【文献】米国特許第8208716号明細書
【発明の概要】
【課題を解決するための手段】
【0005】
自律車両および高度運転者支援システムは、車両の周囲についての情報を獲得して、車両の制御システムが、車両をどのように操縦するか、車両のスピードをどのように調整するか(例えば、どのように加速または減速するか)、安全対策を配備するか(例えば、警告点滅灯をオンにするか)どうかなどについての決定を行うことを可能にするために、様々なタイプのセンサ(例えば、ライダ、レーダ、カメラ、超音波、ステレオカメラなど)からの情報を使用し得る。認識されるように、車両の制御システムは、数十の電子制御モジュールまたはユニット(「ECU」)を、いくつかのケースにおいては、100を超えるECUを含むことがあり、各ECUは、車両動作の一側面を制御する(例えば、スピード制御ECU、ブレーキ制御ECU、変速機制御ECU、エンジン制御ECU、バッテリ管理ECUなど)。
【0006】
本発明者らは、異なるタイプのセンサからのデータを最も良く融合させる、または組み合わせるためには、センサの各々からの測定値の確信度または確実性のレベルを知ることが重要であることを認知し、認識した。本技術のいくつかの態様においては、画像のペア内に出現する特徴までの距離を示す、高解像度深度情報は、画像のペアのステレオマッチングを通して決定され得る。ステレオマッチングは、視差特徴、先行画像、コスト曲線、および局所的特性のうちのいずれか1つまたは任意の組み合わせに基づいて、距離確実性情報を提供するために実行され得る。距離確実性情報は、深度情報の信頼性が格付けられることを可能にすることによって、センサ融合における問題を最小化または排除するために使用され得、したがって、深度情報を使用して行われた決定の安全性の程度を増加させ得る。
【0007】
本技術の態様によれば、監視ありまたは監視なしの車両移動のための自動車両支援システムが提供される。システムは、コンピュータプロセッサと、コンピュータプロセッサに対して結合されたメモリとから成る、車両制御システムと、シーンの第1の画像データを受信し、第1の画像データに基づいて、第1の視差マップと、第1の確信度マップとを出力するように構成された、第1のセンサシステムとから成り得る。車両制御システムは、第1のセンサシステムから、第1の視差マップと、第1の確信度マップとを受信し、第1の視差マップと、第1の確信度マップとから成る、ビデオストリームを出力するように構成され得る。
【0008】
この態様のいくつかの実施形態においては、ビデオストリームにおいて、第1の確信度マップは、第1の視差マップの一部になるようにエンコードされ得る。いくつかの実施形態においては、視差マップは、ピクセルの各々についての視差データから成り得、確信度マップは、ピクセルの各々についての確信度データから成り得る。いくつかの実施形態においては、第1の画像データは、左右の2次元(2D)の第1の画像についてのデータから成り得、第1のセンサシステムは、第1の画像データから、左右(2D)の平行化された第1の画像と、第1のコストボリュームマップとを生成するように構成され得、第1のセンサシステムは、2Dの平行化された第1の画像と、第1の視差マップと、第1のコストボリュームマップとから、第1の確信度マップを生成するように構成され得る。いくつかの実施形態においては、第1のセンサシステムは、セミグローバルマッチング(SGM)アルゴリズムから決定される一意性の値、および第1の画像データに対するソーベル演算から決定される画像テクスチャメトリックの一方または両方に基づいて、第1の確信度マップを生成するように構成され得る。
【0009】
この態様のいくつかの実施形態においては、車両支援システムは、シーンの少なくとも一部分の第2の画像データを受信し、第2の画像データに基づいて、第2の確信度マップを出力するように構成された、第2のセンサシステムからさらに成り得る。車両制御システムは、第2のセンサシステムから、第2の確信度マップを受信することと、ビデオストリームを、スーパフレームのシーケンスとして出力することであって、各スーパフレームは、第1の視差マップと、第1の確信度マップと、第2の確信度マップとに基づいた情報から成る、出力することとを行うように構成され得る。いくつかの実施形態においては、車両制御システムは、ビデオストリームの情報に基づいて、車両の電子制御ユニット(ECU)に対して、制御信号を出力するように構成され得る。いくつかの実施形態においては、第1のセンサシステムは、第1の視差マップと、第1の確信度マップとを生成するために、第1の画像データを処理するように構成された、第1のセンサモジュールであり得、第2のセンサシステムは、第2の確信度マップを生成するために、第2の画像データを処理するように構成された、第2のセンサモジュールであり得、第1のセンサモジュールおよび第2のセンサモジュールは、メモリ内に記憶され得、コンピュータプロセッサは、第1のセンサモジュールおよび第2のセンサモジュールを遂行するように構成され得る。いくつかの実施形態においては、ビデオストリームは、第1の視差マップと、第1の確信度マップとから成る、少なくとも1つのスーパフレームと、第1の視差マップと、第2の確信度マップとから成る、少なくとも1つのスーパフレームとから成り得る。いくつかの実施形態においては、ビデオストリームは、第1の確信度マップの一部分と、第2の確信度マップの一部分とから成る、少なくとも1つのスーパフレームから成り得る。いくつかの実施形態においては、第1の画像データは、ステレオビジョンデータから成り得、第2の画像データは、ライダデータから成り得る。
【0010】
この態様のいくつかの実施形態においては、車両支援システムは、シーンの少なくとも一部分の第3の画像データを受信し、第3の画像データに基づいて、第3の確信度マップを出力するように構成された、第3のセンサシステムからさらに成り得る。第3の画像データは、レーダデータ、または音響データから成る。
【0011】
この態様のいくつかの実施形態においては、ビデオストリームの各スーパフレームは、シーンの2次元(2D)画像と、シーンの深度マップと、シーンの確実性マップとから成り得る。いくつかの実施形態においては、シーンの確実性マップは、第1の確信度マップ、もしくは第2の確信度マップ、または第1の確信度マップと第2の確信度マップとの組み合わせから成り得る。いくつかの実施形態においては、シーンの深度マップは、シーンの2D画像に対応する画像データを用いて変調された、第1の視差マップから成り得、シーンの確実性マップは、シーンの2D画像に対応する画像データを用いて変調された、第1の確信度マップ、もしくは第2の確信度マップ、または第1の確信度マップと第2の確信度マップとの組み合わせから成り得る。いくつかの実施形態においては、シーンの2D画像のピクセル、シーンの深度マップのピクセル、およびシーンの確実性マップのピクセルは、時間的および空間的にマッチさせられ得る。いくつかの実施形態においては、車両制御システムは、ビデオストリームのデータサイズを下げるために、第1の視差マップからの視差情報、ならびに第1の確信度マップおよび第2の確信度マップからの確信度情報をエンコードするように構成され得る。
【0012】
この態様のいくつかの実施形態においては、車両支援システムは、車両上に搭載されるように構成された、カメラのペアからさらに成り得る。カメラは、第1のセンサシステムに対して、第1の画像データを提供するように構成され得る。
【0013】
この態様のいくつかの実施形態においては、ビデオストリームは、2次元(2D)カラー画像から成り得、各2Dカラー画像は、複数のピクセルから成り、各ピクセルのアルファチャンネル透明度は、ピクセルについての確信度値に比例する。いくつかの実施形態においては、2Dカラー画像のカラーは、深度範囲を示し得る。
【0014】
本技術の別の態様によれば、コンピュータプロセッサによって遂行されたときに、コンピュータプロセッサに、監視ありまたは監視なしの車両移動のための自動車両支援システムの方法を実行させるコードが記憶された、非一時的コンピュータ可読記憶媒体が提供される。方法は、コンピュータプロセッサが、第1の視差マップと、第1の確信度マップとを獲得する工程であって、第1の視差マップおよび第1の確信度マップは、シーンの第1の画像データに対応する、工程と、コンピュータプロセッサが、第1の視差マップと、第1の確信度マップとから成る、ビデオストリームを出力する工程とから成り得る。
【0015】
この態様のいくつかの実施形態においては、ビデオストリームを出力する工程は、コンピュータプロセッサが、第1の視差マップの一部となるように、第1の確信度マップをエンコードする工程から成り得る。いくつかの実施形態においては、第1の画像データは、複数のピクセルから成り得、視差マップは、ピクセルの各々についての視差データから成り得、確信度マップは、ピクセルの各々についての確信度データから成り得る。いくつかの実施形態においては、方法は、コンピュータプロセッサが、シーンの少なくとも一部分の第2の画像データに対応する第2の確信度マップを獲得する工程と、コンピュータプロセッサが、ビデオストリームを、スーパフレームのシーケンスとして出力する工程であって、各スーパフレームは、第1の視差マップと、第1の確信度マップと、第2の確信度マップとに基づいた情報から成る、工程とからさらに成り得る。いくつかの実施形態においては、方法は、コンピュータプロセッサが、ビデオストリームの情報に基づいて、車両の電子制御ユニット(ECU)に対して、制御信号を出力する工程からさらに成り得る。いくつかの実施形態においては、方法は、コンピュータプロセッサが、第1の視差マップと、第1の確信度マップとを獲得するために、第1の画像データを処理する工程と、コンピュータプロセッサが、第2の確信度マップを獲得するために、第2の画像データを処理する工程とからさらに成り得る。
【0016】
この態様のいくつかの実施形態においては、ビデオストリームを出力する工程は、コンピュータプロセッサが、第1の視差マップと、第1の確信度マップとから成るように、少なくとも1つのスーパフレームを準備する工程と、コンピュータプロセッサが、第1の視差マップと、第2の確信度マップとから成るように、少なくとも1つのスーパフレームを準備する工程とから成り得る。いくつかの実施形態においては、ビデオストリームを出力する工程は、コンピュータプロセッサが、第1の確信度マップの一部分と、第2の確信度マップの一部分とから成る、少なくとも1つのスーパフレームを準備する工程からさらに成り得る。いくつかの実施形態においては、第1の画像データは、ステレオビジョンデータから成り得、第2の画像データは、ライダデータ、またはレーダデータ、または音響データから成り得る。
【0017】
この態様のいくつかの実施形態においては、ビデオストリームを出力する工程は、コンピュータプロセッサが、シーンの2次元(2D)画像と、シーンの深度マップと、シーンの確実性マップとから成るように、ビデオストリームの各スーパフレームを準備する工程から成り得る。いくつかの実施形態においては、コンピュータプロセッサによって、各スーパフレームを準備する工程は、シーンの2D画像のピクセルと、シーンの深度マップのピクセルと、シーンの確実性マップのピクセルとを、時間的および空間的にマッチさせる工程から成り得る。いくつかの実施形態においては、ビデオストリームを出力する工程は、コンピュータプロセッサが、ビデオストリームのデータサイズを下げるために、第1の視差マップからの視差情報、ならびに第1の確信度マップおよび第2の確信度マップからの確信度情報をエンコードする工程から成り得る。いくつかの実施形態においては、ビデオストリームを出力する工程は、各2Dカラー画像が、複数のピクセルから成り、各ピクセルのアルファチャンネル透明度が、ピクセルについての確信度値に比例し、2Dカラー画像のカラーが、深度範囲を示すように、2次元(2D)カラー画像を準備する工程から成り得る。
【0018】
本技術の別の態様によれば、ステレオビジョンシステムが提供される。システムは、画像のペアのシーケンスをキャプチャするように構成された、ステレオカメラシステムであって、画像の各ペアは、同時にキャプチャされた、第1の画像と、第2の画像とから成る、ステレオカメラシステムと、コンピュータプロセッサであって、ステレオカメラシステムから、画像データのストリームを受信することであって、画像データは、画像のペアのシーケンスに対応する、受信することを行うようにプログラムされた、コンピュータプロセッサとから成り得る。コンピュータプロセッサは、画像のペアの各々について、マッチさせられたピクセルの2次元(2D)ピクセルマップを生成するために、第1の画像と、第2の画像とを平行化することと、ピクセルマップの各ピクセルについて、深度値を決定することと、ピクセルマップの各ピクセルについて、深度値についての確信度値を決定することとを行うようにもプログラムされ得る。コンピュータプロセッサは、確信度値のうちの少なくとも1つが画像異常を示すとき、制御信号を発行することを行うようにもプログラムされ得る。
【0019】
この態様のいくつかの実施形態においては、画像異常は、事前決定された閾値を下回る確信度値を有する、確信度マップの一部分の1つまたは複数のピクセルに対応し得る。いくつかの実施形態においては、画像異常は、シーケンスの画像の2つ以上の連続するペアについて、事前決定された閾値を下回る確信度値を有する、確信度マップの一部分の1つまたは複数のピクセルに対応し得る。いくつかの実施形態においては、画像異常は、確信度マップの隣接する領域の複数のピクセルから成り得る。いくつかの実施形態においては、制御信号は、事前記録されたメッセージであり得る、可聴音を引き起こすように構成され得る。いくつかの実施形態においては、制御信号は、車両のエンジン制御モジュールに対して発行され得る。いくつかの実施形態においては、ピクセルマップの各ピクセルについて、確信度値は、ピクセルにおけるエッジの有無、ピクセルの照度レベル、ならびにピクセルマップがそれから生成された第1の画像および第2の画像のテクスチャ値に基づいて決定され得る。
【0020】
この態様のいくつかの実施形態においては、コンピュータプロセッサは、画像のペアのシーケンスに対応する、スーパフレームのシーケンスを出力するようにプログラムされ得、スーパフレームの各々は、2D画像と、2D画像に対応する確信度マップとから成る。いくつかの実施形態においては、2D画像は、第1の画像、または第2の画像であり得る。いくつかの実施形態においては、コンピュータプロセッサは、スーパフレームのシーケンスを、2D画像と、確信度マップに対応する可視的な確信度インジケータとを示すことをディスプレイに行わせる、表示信号として出力するようにプログラムされ得る。表示信号は、確信度インジケータを、2D画像の各ピクセルの透明度として、ピクセルごとに表示させ得る。いくつかの実施形態においては、スーパフレームの各々は、2D画像と、確信度マップと、2D画像に対応する視差マップとから成り得る。
【0021】
本技術の別の態様によれば、コンピュータプロセッサによって遂行されたとき、コンピュータプロセッサに、ステレオビジョンシステムの方法を実行させるコードが記憶された、非一時的コンピュータ可読記憶媒体が提供される。方法は、コンピュータプロセッサが、ステレオカメラシステムから、画像データのストリームを受信する工程であって、画像データは、画像のペアのシーケンスに対応し、画像の各ペアは、同時にキャプチャされた、第1の画像と、第2の画像とから成る、工程と、画像のペアの各々について、コンピュータプロセッサが、マッチさせられたピクセルの2次元(2D)ピクセルマップを生成するために、第1の画像と、第2の画像とを平行化する工程と、ピクセルマップの各ピクセルについて、深度値を決定する工程と、ピクセルマップの各ピクセルについて、深度値についての確信度値を決定する工程と、確信度マップのうちの少なくとも1つが画像異常を示すとき、コンピュータプロセッサが、制御信号を発行する工程とから成り得る。
【0022】
この態様のいくつかの実施形態においては、画像異常は、事前決定された閾値を下回る確信度値を有する、確信度マップの一部分の1つまたは複数のピクセルに対応し得る。いくつかの実施形態においては、画像異常は、シーケンスの画像の2つ以上の連続するペアについて、事前決定された閾値を下回る確信度値を有する、確信度マップの一部分の1つまたは複数のピクセルに対応し得る。いくつかの実施形態においては、画像異常は、確信度マップの隣接する領域の複数のピクセルから成り得る。
【0023】
この態様のいくつかの実施形態においては、制御信号は、可聴音を引き起こすように構成され得る。例えば、可聴音は、事前記録されたメッセージであり得る。いくつかの実施形態においては、制御信号は、車両のエンジン制御モジュールに対して発行され得る。いくつかの実施形態においては、ピクセルマップの各ピクセルについて、確信度値は、ピクセルにおけるエッジの有無、ピクセルの照度レベル、ならびにピクセルマップがそれから生成された第1の画像および第2の画像のテクスチャ値に基づいて決定され得る。
【0024】
この態様のいくつかの実施形態においては、方法は、コンピュータプロセッサが、画像のペアのシーケンスに対応する、スーパフレームのシーケンスを出力する工程であって、スーパフレームの各々は、2D画像と、2D画像に対応する視差マップと、2D画像に対応する確信度マップとから成る、工程からさらに成り得る。いくつかの実施形態においては、2D画像は、第1の画像、または第2の画像であり得る。いくつかの実施形態においては、スーパフレームのシーケンスを出力する工程は、2D画像と、確信度マップに対応する可視的な確信度インジケータとを示すことをディスプレイに行わせる、表示信号を出力する工程から成り得る。いくつかの実施形態においては、表示信号は、確信度インジケータを、2D画像の各ピクセルの透明度として、ピクセルごとに表示させ得る。いくつかの実施形態においては、スーパフレームの各々は、2D画像と、確信度マップと、2D画像に対応する視差マップとから成り得る。
【0025】
上述の特徴は、本願明細書で議論される実施形態のいずれにおいても、別個に、または任意の組み合わせで一緒に、使用され得る。
本願明細書において開示される本技術の様々な態様および実施形態が、添付の図を参照して、以下で説明される。図は、必ずしも実寸に比例しているとは限らないことが認識されるべきである。多数の図に出現する項目が、同じ参照番号によって示されることがある。明瞭にする目的で、あらゆる構成要素が、あらゆる図において、ラベル付けされるとは限らないことがある。添付の図のうちの少なくとも1つは、以下に示されるように、少なくとも部分的にカラーで作成される。
【図面の簡単な説明】
【0026】
図1】本技術のいくつかの実施形態による、ステレオビジョンシステムのブロック図。
図2】本技術のいくつかの実施形態による、車両上に配置されたセンサおよび電子制御ユニットの配置を示す図。
図3】本技術のいくつかの実施形態による、制御システムに対して結合されたステレオビジョンシステムのブロック図。
図4A】本技術のいくつかの実施形態による、コストボリュームがどのように決定され得るかを理解するための図。
図4B】本技術のいくつかの実施形態による、コスト曲線の例を示す図。
図5】本技術のいくつかの実施形態による、確信度処理手順によって実行されるプロセスを示す図。
図6】本技術のいくつかの実施形態による、ビデオストリームおよびビデオストリームのスーパフレームの例を示す図(図6の一部はカラー化されている)。
図7A】本技術のいくつかの実施形態による、ビデオストリーム内に含まれ得る、異なるタイプのスーパフレームの例を示す図。
図7B】本技術のいくつかの実施形態による、ビデオストリーム内に含まれ得る、異なるタイプのスーパフレームの例を示す図。
図7C】本技術のいくつかの実施形態による、ビデオストリーム内に含まれ得る、異なるタイプのスーパフレームの例を示す図。
図7D】本技術のいくつかの実施形態による、ビデオストリーム内に含まれ得る、異なるタイプのスーパフレームの例を示す図。
図7E】本技術のいくつかの実施形態による、ビデオストリーム内に含まれ得る、異なるタイプのスーパフレームの例を示す図。
図7F】本技術のいくつかの実施形態による、ビデオストリーム内に含まれ得る、異なるタイプのスーパフレームの例を示す図。
図8A】本技術のいくつかの実施形態による、センサによってキャプチャされたシーンを照明することを備える、ビーム領域を概略的に描いた図。
図8B】本技術のいくつかの実施形態による、シーンのキャプチャされた画像内の対象物についての断面積と範囲との間の関係を描いたグラフ。
図9A】本技術のいくつかの実施形態による、視差マップおよび確信度マップの例を示す図(図9Aの一部はカラー化されている)。
図9B】本技術のいくつかの実施形態による、視差マップおよび確信度マップの例を示す図。
【発明を実施するための形態】
【0027】
車両が動いている最中に、車両の周囲についての情報を獲得して、車両の電子制御システムが、車両をどのように動作させるかについての決定を行うことを可能にするために、および/または車両を操作している運転者を支援するのに有用な情報を運転者に対して提供するために、異なるタイプのセンサシステム(例えば、ライダシステム、レーダシステム、モノビジョンカメラシステム、ステレオビジョンカメラシステム、温度測定システム(例えば、熱電対)、音響システム(例えば、超音波トランスデューサシステム、可聴音マイクロフォンシステムなど))からのセンサ情報が、車両によって使用され得る。例えば、センサ情報は、車両のスピードを調整する(例えば、加速または減速する)、安全手段を配備する(例えば、警告点滅灯、フロントガラスワイパをオンにするなど)、車両の経路内の対象物から離れるように操縦するなどするために、制御システムによって使用され得る。別の例においては、センサ情報は、車両の経路内の特定の対象物を運転者に警告するために、制御システムによって使用され得る。本技術のいくつかの実施形態においては、制御システムは、車両の動作の様々な側面を制御するように構成された、ECUから成る、集中型コンピュータシステムであり得る。ECUの各々は、1つまたは複数のセンサからデータを受信し、車両の一部を動作させるために使用される、1つまたは複数の制御信号を出力するために、データを処理するように構成された、ソフトウェアおよび/またはハードウェアから成り得る。上で述べられたように、移動している車両においては、動作中の100を超えるECUがあることがある。いくつかのECUは、他のECUから独立して動作し得、いくつかのECUは、1つまたは複数の他のECUと相互依存して動作し得る。本技術の他のいくつかの実施形態においては、車両の電子制御システムは、非集中化され得る。例えば、バッテリ管理ECUは、例えば、スピード制御ECUから独立した、別個のシステムとして動作し得る。各ECUは、1つタイプのセンサ、または複数タイプのセンサから、センサ情報を受信し得る。例えば、車室温度ECUは、車両の車室の異なる領域に位置付けられた、1つまたは複数の温度計から、センサ情報を受信し得、ヒータおよび/またはエアコンを制御して、車室の温度を車両の乗員によって設定された温度に維持するために、センサ情報を使用し得る。別の例においては、操縦ECUは、ステレオ画像化のためのカメラの1つまたは複数のセット、1つまたは複数のレーダシステム、1つまたは複数のライダシステム、1つまたは複数のタイヤ圧計、1つまたは複数のマイクロフォン、2D画像化のための1つまたは複数のカメラ、および1つまたは複数のナビゲーションシステム(例えば、GPSシステム)の様々な組み合わせからセンサ情報を受信し得、目的地まで車両を安全に操縦するのに、最も良い一連の行動を決定するために、センサ情報を使用し得る。
【0028】
本発明者らは、異なるタイプのセンサからのデータの使用を最適化するためには、センサの各々からの測定値の確信度または確実性のレベルを知ることが重要であることを認知し、認識した。本技術のいくつかの実施形態によれば、確信度情報は、対象物までの距離を決定するためのデータのために、どのセンサまたはセンサのどの組み合わせが使用されるべきかを決定するために使用され得る。従来のセンサは、典型的には、測定値についての確信度レベルを示す、誤差推定値(例えば、誤差バー)を報告することなく、測定値または推定された測定値を報告し、それが、正確な融合を困難にしていた。しかしながら、上で述べられたように、自動車用途で特に重要な機能的に安全なシステムは、人命の安全に影響し得る決定を行うために、センサ測定値に依存する。したがって、車両の電子制御システムに対して、正確なセンサデータを提供することに、高められた関心があり、それは、制御システムに対して、センサデータについての確信度のレベルを提供することを伴い得る。確信度データを装備することで、制御システムは、センサデータが、車両を制御するために使用されるほど十分に信用できるか、それともセンサデータが、十分に信頼できず、使用されるべきではないかに関する決定をより良く行うことができることがある。認識されるように、センサ融合は、異なるタイプのセンサからのデータを組み合わせるために、中央制御システムによって実行され得るが、本技術のいくつかの実施形態においては、センサ融合は、車両のECUの1つもしくは複数によって、またはECUおよび/もしくは中央制御システムと連携して動作する、補助システムによって、実行され得る。
【0029】
本発明者らは、より多くの証拠または情報が利用可能になると、仮説または推定値についての確率を更新するために、ベイズ推論において、推定値の確信度レベルが使用され得ることを認知し、認識した。車両上に配備された同じタイプおよび/または異なるタイプの様々なセンサからのセンサデータが、車両上に配備された特定のセンサからのセンサデータを裏付けるために、使用され得る。本発明者らは、車両の運転者支援システムが、信頼できるデータに基づいて決定を行うことを可能にすることによって、深度推定値についての確信度範囲を報告するセンサが、より安全な車両をもたらし得ることを認知し、認識した。それは、人間の運転者によって制御されないことがある、自律車両にとってとりわけ重要である。例えば、車両が、幹線道路の運転に典型的な巡航スピードで走行しており、センサ(例えば、カメラ)が、(例えば、センサ上のデブリのせいで)センサが車両に近い範囲内にある対象物を間違って検出するように、部分的に妨害された場合、センサによってキャプチャされた画像の分析に織り込まれる様々な因子に基づいて、本技術のいくつかの実施形態によるステレオビジョンシステムは、その対象物に対応するそのセンサデータに対して、相対的に低いレベルの確実性を示す確信度を決定および出力し得、したがって、そのセンサデータは、無視され得る。これは、車両が、その経路上において巡航スピードを継続するように制御されること、または潜在的に偽の(すなわち、存在しない)対象物に衝突することを避けるために、緊急ブレーキをかける、例えば、車両のブレーキを突然適用するような、車両の追突される可能性を増加させ得る制御が行われる代わりに、観察時間を増加させるために、スピードを緩やかに下げるように制御されることを可能にし得る。いくつかの実施形態においては、センサデータと関連付けられた確信度は、センサデータが使用され得るか、それとも相対的に高い確信度を有する、別のセンサからのセンサデータが代わりに使用されるべきかを決定するために使用され得る。例えば、センサデータからの深度情報は、車両の経路内の対象物を示しているが、深度情報が、低い確信度値と関連付けられている場合、対象物らしきものが、より多くの時間にわたって観察されることを可能にするために、および/または対象物らしきものが、他のセンサシステムによってクロスチェックされることを可能にするために、車両は、その走行スピードを下げるように制御され得る。以下で議論されるように、本技術の様々な実施形態によれば、ステレオビジョン技術によって獲得されたデータを裏付けるまたは補足するために、異なるタイプのセンサシステム(例えば、レーダ、ライダ、音響などに基づくシステム)が使用され得る。
【0030】
本発明者らは、特定のセンサが部分的または全体的に誤動作している(例えば、デブリによって部分的または全体的に覆われている)かどうかを、運転者支援システムが決定することを可能にすることによって、各センサからの深度推定値の確信度レベルまたは確実性の程度が、乗客の安全を増加させるために、有利に使用され得ることを認知し、認識した。いくつかの実施形態においては、確信度レベルから導出された情報は、センサにおける異常を運転者に対して警告するために使用され得る。いくつかの実施形態においては、ステレオビジョンシステム、またはステレオビジョンシステムと連携して動作するデバイスは、複数の画像にわたって、低い確信度(例えば、閾値確信度レベルを下回る値)の発生を追跡し得、センサが異常に機能していることがあるかどうかを決定するために、例えば、低い確信度の頻度を使用し得る。
【0031】
本技術のいくつかの実施形態によれば、ステレオビジョンシステムは、画像についての全般的な確信度を決定および出力するように構成され得る。「確信度」、「確信度範囲」、および「確信度レベル」という用語は、本願明細書においては、交換可能に使用されることがある。画像は、移動する車両(例えば、車、トラック、飛行機など)上のセンサによってキャプチャされたシーンのものであり得、または固定された構造物(例えば、街灯、管制塔、住居、オフィスビルなど)上に搭載されたセンサによってキャプチャされたシーンのものであり得る。ステレオビジョンシステムは、車両上に配備されたスタンドアロンシステムであり得、または車両の制御システム内に組み込まれ得る。いくつかの実施形態においては、ステレオビジョンシステムは、画像の複数の領域の各領域についての確信度を決定および出力し得る。例えば、画像は、(例えば、左上、右上、左下、右下)象限に分割され得、ステレオビジョンシステムは、各象限についての確信度を決定および出力し得る。いくつかの実施形態においては、ステレオビジョンシステムは、画像の各ピクセルについての確信度を決定および出力し得る。
【0032】
本技術のいくつかの実施形態によれば、ステレオビジョンシステムは、シーンのキャプチャされた画像に対応する、深度マップを出力するように構成され得る。画像は、キャプチャされたデジタル画像であり得、またはアナログ画像からデジタル化され得る。深度マップは、深度値、またはステレオビジョンシステムのセンサからシーン内の対象物までの距離のマップであり得る。深度マップは、深度マップの各ピクセル(および画像の各ピクセル)が、関連付けられた深度値を有し得るように、画像のピクセルに対応する、ピクセルから成り得る。ステレオビジョンシステムは、深度マップとともに、確信度データを出力するようにも構成され得る。いくつかの実施形態においては、確信度データは、深度マップの確実性または確信度を示す、確信度マップであり得る。いくつかの実施形態においては、確信度マップは、確信度マップの各ピクセル(および画像の各ピクセル)が、関連付けられた確信度を有し得るように、深度マップ(および画像)のピクセルに対応する、ピクセルから成り得る。いくつかの実施形態においては、確信度マップは、誤差バーとして、標準偏差値として、バケット(例えば、高確信度、中確信度、低確信度)で、または各推定された確信度の品質レベルを示すことが可能な他の任意のメトリックで、確信度の推定値を表し得る。
【0033】
上で述べられたように、ピクセルの深度は、ピクセルの視差に反比例するので、画像の各ピクセルについての深度の推定値は、視差マップから計算され得る。そのため、「深度マップ」および「視差マップ」という用語は、それらが、画像内のキャプチャされたシーンについて、ほぼ同一の情報を提供し、当技術分野で知られた単純な代数変換によって関係付けられるので、本願明細書においては、交換可能に使用されることがある。
【0034】
本技術のいくつかの実施形態によれば、自律車両、および/または高度運転者支援システム(ADAS)は、事故を避けるために、および/または信頼できないデータがあるときに、運転者に対して警告するために、深度マップ、および深度マップと関連付けられた確信度値を有利に使用し得る。いくつかの実施形態においては、確信度値は、深度マップの各ピクセルに対して提供され得るので、低い確信度値を有するいくつかのピクセルがあるときに、シーンのキャプチャされたビデオシーケンスのフレーム全体を破棄する必要がないことがある。代わりに、低い確信度値を有するピクセルは、破棄され得、十分に高い確信度値を有する残りのピクセルが、深度算出のために使用され得る。この選択性は、運転中に視野内のシーンを処理するとき、車両のAピラー、車両のフロントガラスワイパなどの妨害対象物を、運転手は自然に見えないことにし得るという、人間の視覚に非常に似ている。すなわち、運転者は、視野内のシーンを評価しながら、妨害対象物を自動的に無視する。いくつかの実施形態においては、フレームのいくつかが無視された場合であっても、ビデオシーケンスのフレームは使用され得るので、確信度マップは、センサ利用可能性を増加させ得、それは、車両のセンサが、より大きい範囲の環境状況において、より高いデューティーサイクルで、動作することを可能にする。例えば、センサのレンズの一部に汚れがあるときであっても、またはフロントガラスワイパがセンサの視野を部分的に妨害することがあるときも、またはセンサによってキャプチャされた画像の一区画が露出過多であるときも、またはセンサによってキャプチャされた画像の一区画が低い光レベルを有するときも、または画像の他のいくつかのピクセルが無視されるべきデータを有することがある場合であっても、センサによってキャプチャされた画像のいくつかのピクセルが有用なデータを有し得る、いずれの状況があるときも、センサは動作し得る。ピクセルごとの確信度値から成る、確信度マップを提供することによって、車両の電子制御システムは、有効で、相対的に高い確信度値を有する、深度マップのエリアに注意を払うことを可能にされ得る。
【0035】
本技術のいくつかの実施形態によれば、自律車両は、信頼性および安全を増加させるために、カメラ、ライダ、レーダ、および/または超音波センサなどの、異なるセンサからの情報を融合し得る。そのようなセンサは、対象物までの距離に関する情報を報告または提供し得るが、異なるセンサについて異なる距離が報告されたとき、どのセンサを信用すべきかが、不明確なことがある。いくつかの実施形態においては、センサ融合アルゴリズムは、異なるセンサからのデータを組み合わせ得、1つまたは別のセンサからの融合されていない情報が、個別に使用されるときに可能であるよりも、小さい不確実性を有する、融合された情報を出力し得る。本発明者らは、アルゴリズムに対して、異なるセンサの各々についての確実性パラメータ(例えば、分散)を提供することによって、センサ融合アルゴリズムが、融合された情報の確実性を増加させるように、強化され得ることを認知し、認識した。いくつかの実施形態においては、確信度マップは、ピクセルごとに、異なるセンサについて、決定され得るので、センサ融合は、異なるが重なり合う視野を有する2つ以上のセンサについて、可能にされ得る。いくつかの実施形態においては、対象物を包含する重なり合う視野があるとき、対象物についてのレーダ距離推定値は、対象物についてのステレオビジョン距離推定値と比較され得る。例えば、晴天の日中に走行する車の上のセンサは、車上のカメラによってキャプチャされた画像に基づいた、ステレオビジョン距離決定について、非常に高い確信度値を有し得、したがって、とりわけ、車上の他のセンサが、高い確信度値を返すことを期待され得ない、300メートル以上の範囲または距離にある対象物について、ステレオビジョン距離決定は、車の電子制御システムによって、信用され得る。(例えば、濃霧、土砂降りの雨など)天候が、悪くなった場合、視程は、より低くなり得、結果として、光減衰が、ステレオビジョン距離推定値を悪化させ、関連付けられた確信度値を低くさせ得る。車の制御システムは、そのときは、カメラからのデータの代わりに、レーダデータから距離推定値を獲得するように、切り替え得る。同様に、車が、夜間、または霧もしくは他の降水のない、低い周囲光レベルにおいて走行している場合、典型的なライダシステムは、それ独自の能動的な照明源を有するので、車の制御システムは、レーダデータまたはカメラからのデータからの代わりに、ライダデータから距離推定値を獲得するように、切り替え得る。いくつかの実施形態においては、車の制御システムが、ステレオビジョン距離推定値、ライダ距離推定値、レーダ距離推定値、または音響距離推定値の間の切り替えをいつ行うべきかを決定する代わりに、切り替えは、車の主要なセンサシステムであり得る、車のステレオビジョンシステムによって、実行され得る。認識されるように、上述の例は、車についての距離推定値に関係するが、本技術は、車に限定されず、他の車両(例えば、トラックおよび他の道路車両、列車および他の鉄道車両、船および他の海上車両、ならびに飛行機および他の航空車両など)に適用可能であり得る。
【0036】
図1は、本技術のいくつかの実施形態による、ステレオマッチング確信度または確実性についての値を提供するように構成された、ステレオビジョンシステム1のブロック図を示している。ステレオビジョンシステム1は、複数のセンサシステムに対して結合され、センサシステムの各々から、測定値またはセンサデータを受信するように構成された、コンピュータプロセッサ10から成り得る。いくつかの実施形態においては、プロセッサ10に対して結合されたセンサシステムは、カメラ、ライダセンサ、レーダセンサ、および/または超音波センサであり得る、センサ100から成る、画像化システムから成り得る。いくつかの実施形態においては、ステレオビジョンシステム1は、自律的に動く(すなわち、人間の制御なし)、および/または半自律的に動く(すなわち、人間の制御もしくは限定された人間の制御あり)ことが可能な車両の上に、搭載され得る。例えば、車両は、自動車、トラック、ロボット、海上船舶、および飛行車両などであり得る。
【0037】
本技術のいくつかの実施形態によれば、センサ100は、同時に、すなわち、時間の同じまたはほぼ同じ瞬間に、車両の環境の画像をキャプチャするように構成された、2つのステレオカメラ100から成り得る。表記を簡略化するために、カメラ100は、それらが、互いに対して垂直(例えば、上下)に、または互いに対して斜めに、または(例えば、一方のカメラは車両の前部分にあり、他方のカメラは車両の後部分にあるなど)異なる範囲ビン内にオフセットされて位置決めされることがあっても、本願明細書においては、「左」カメラおよび「右」カメラと呼ばれ得る。カメラ100は、例えば、カラーCMOS(相補型金属酸化膜半導体)カメラ、グレースケールCMOSカメラ、CCD(電荷結合素子)カメラ、SWIR(短波長赤外線)カメラ、LWIR(長波長赤外線)カメラ、または焦点面アレイセンサであり得る。
【0038】
本技術のいくつかの実施形態によれば、センサS1、S2、S3、S4、S5、S6、S7、S8、S9は、図2に概略的に描かれているように、車両20上の複数の異なる場所に位置付けられ得る。いくつかの実施形態においては、センサS1、S2、・・・、S9のうちのいくつかは、車両20の車室の内部に位置付けられ得、したがって、埃および雨から保護され得る。いくつかの実施形態においては、センサS1、S2、・・・、S9のいくつかは、車両20の車室の外部に位置付けられ得、したがって、ベースライン(すなわち、2つのセンサ間の距離)が、車室の幅よりも大きくなることを可能にし得、これは、車室の幅に制限されたベースラインと比較して、相対的により遠い距離にある対象物が、検出されることを可能にし得る。いくつかの実施形態においては、センサS1、S2、・・・、S9は、センサS1、S2、・・・、S9からデータを受信し、および/またはセンサS1、S2、・・・、S9に電力を供給するように構成された、1つまたは複数のECU22、24に対して、無線または有線で、結合され得る。いくつかの実施形態においては、ECU22、24のうちの少なくともいくつかは、コンピュータプロセッサ10の一部であり得る。いくつかの他の実施形態においては、ECU22、24のうちの少なくともいくつかは、コンピュータプロセッサ10の外部に位置付けられ得、コンピュータプロセッサ10に対して、無線または有線で、信号を送信するように構成され得る。いくつかの実施形態においては、ヘッドライト内のカメラのペア(例えば、S1とS9)、またはサイドビューミラー内のカメラのペア(例えば、S2とS8)、またはフロントガラス内のカメラのペア(例えば、S3とS7、もしくは代替として、S3とS5)、またはルーフ上のカメラのペア(例えば、S4とS6)など、2つのカメラだけが、必要とされる。
【0039】
本技術のいくつかの実施形態によれば、ステレオビジョンシステム1は、図3において概略的に示されるように、車両のメインシステムコントローラ30に対して、結合され得る。いくつかの実施形態においては、メインシステムコントローラ30は、車両動作のすべての自動化された側面を制御するように構成され得る、車両の制御システムであり得る。いくつかの実施形態においては、ステレオビジョンシステム1は、メインシステムコントローラ30によって指令されるように構成され得、指令および制御ライン32を介して、メインシステムコントローラ30に対する信号、およびメインシステムコントローラ30からの信号を通信し得る。認識されるように、指令および制御ライン32は、有線通信メカニズム(例えば、データバス、通信ライン)であり得、または当技術分野において知られた通信技法を使用する、無線通信メカニズムであり得る。いくつかの実施形態においては、メインシステムコントローラ30は、高レベル機能(例えば、自動緊急ブレーキ、ルート選択など)を編成し、高レベル機能を実施するために、様々なサブシステムまたはECU(例えば、ステレオビジョンシステム1)と通信するように構成された、コンピュータから成り得る。いくつかの実施形態においては、指令および制御ライン32を介した通信のために、共通通信プロトコルが、使用され得る(例えば、イーサネット(登録商標)、CAN(コントローラエリアネットワーク)、I2C(集積回路間)、LIN(ローカル相互接続ネットワーク)など)。ステレオビジョンシステム1は、図3において、メインシステムコントローラ30から分離して示されているが、ステレオビジョンシステム1は、いくつかの実施形態においては、メインシステムコントローラ30の一部であり得、いくつかの実施形態においては、メインシステムコントローラ30の筐体内に、物理的に位置付けられ得る。
【0040】
図1に戻ると、カメラ100は、本技術のいくつかの実施形態によれば、画像取得モジュール102に対して、無線でまたは有線接続で、結合され得る。いくつかの実施形態においては、カメラ100によってキャプチャされたシーンの画像データは、知られた通信インターフェース(例えば、USB(ユニバーサルシリアルバス)コネクタ、イーサネット(登録商標)コネクタ、MIPI(モバイル業界プロセッサインターフェース)CSI(カメラシリアルインターフェース)コネクタ、GMSL(ギガビットマルチメディアシリアルリンク)コネクタ、およびフラットパネルディスプレイリンク(FPDリンク)コネクタなど)を介して、画像取得モジュール102に対して、転送され得る。いくつかの実施形態においては、カメラ100は、画像取得モジュール102に対して画像データを、リアルタイムまたはほぼリアルタイムで、直接的に、またはカメラ100に組み込まれ得る、バッファメモリデバイス(例えば、RAM)を介して、送信するように構成され得る。いくつかの実施形態においては、カメラ100は、画像取得モジュール102、およびコンピュータプロセッサ10の他の一部によってアクセス可能な、データ記憶メモリデバイス140と関連付けられ得、カメラ100は、データ記憶デバイス140に対して、画像データを送信するように構成され得る。いくつかの実施形態においては、カメラ100は、シーンのビデオデータのストリームをキャプチャするように構成された、ビデオカメラであり得る。ビデオデータのストリームは、左ストリームと、右ストリームとから成り得、各ストリームは、フレームのシーケンスから成る。したがって、本願明細書において使用される場合の「画像データ」という用語は、いくつかの実施形態においては、ビデオデータのフレームに言及していることがある。
【0041】
本技術のいくつかの実施形態によれば、画像取得モジュール102は、原デジタル画像データまたは「原画像データ」を生成するために、カメラ100からの画像データをデジタル化するように構成され得る。いくつかの実施形態においては、画像取得モジュール102は、画像前処理モジュール104に対して、原画像データを提供し得る。いくつかの実施形態においては、画像取得モジュール102は、将来の処理のために原画像データを記憶し得る、メモリ140に対して、原画像データを提供し得る。
【0042】
本技術のいくつかの実施形態によれば、画像前処理モジュール104は、補正された左画像および右画像を生成するために、原画像データを補正するように構成され得る。例えば、画像前処理モジュール104は、デモザイク、自動焦点、自動露出、および自動ホワイトバランス補正、口径食、ノイズリダクション、不良ピクセルフィルタリング、HDR(ハイダイナミックレンジ)ルックアップテーブルカラー処理、および画像圧縮のうちのいずれか1つまたは任意の組み合わせを実行し得る。補正された左画像および右画像は、画像平行化モジュール106に対して、転送され得る。
【0043】
本技術のいくつかの実施形態によれば、画像平行化モジュール106は、補正された左画像および右画像のピクセルの対応する行が、同じエピポーラ平面上にあるように、それらを歪ませることによって、補正された左画像および右画像を平行化するように構成され得る。歪ませた後、画像平行化モジュール106は、カラー画像またはグレースケール画像であり得る、左右の平行化2D画像114を出力し得る。認識されるように、画像平行化は、補正された左画像および右画像における共通の対象物のマッチングを簡略化するために使用される、知られた技法である。画像平行化モジュール106は、ステレオマッチングモジュール108、確信度処理モジュール110、およびエンコーダモジュール112に対して、左右の平行化2D画像114を提供し得る。
【0044】
本技術のいくつかの実施形態によれば、ステレオマッチングモジュール108は、平行化2D画像114における各マッチングピクセルペア間の視差を計算するように構成され得る。ステレオマッチングモジュール108によって実行される処理は、いくつかの実施形態においては、4つの手順、すなわち、コスト計算手順、コスト集約手順、視差計算手順、および視差精緻化手順から成り得、それらの各々は、以下で議論される。
【0045】
本技術のいくつかの実施形態によれば、コスト計算手順は、可能な視差値のセットのうちの各視差値における、各ピクセルについてのマッチングコストを計算することによって、「視差空間画像」と呼ばれることもある、3次元(3D)コストボリュームマップ118を構築することから成り得る。以下で議論されるように、コストボリューム(またはより正しくは、マッチングコストボリューム)は、W×H×Dの積として決定され得、WおよびHは、各画像の幅寸法および高さ寸法であり、Dは、視差仮説または可能な視差の数である。特定のピクセルと特定の視差値とについてのマッチングコストは、その特定のピクセルが、その特定の視差値を有する可能性がどれだけ低いかを表す。典型的には、以下で議論されるように、与えられたピクセルについて、最も低いマッチングコストを有する視差値が、視差マップにおいて使用されるために、選定される。与えられたピクセルについての視差値を選択するためのこのアプローチは、いわゆる勝者総取り(WTA)アプローチであり、勝者は、最も低いマッチングコストを有する視差値、すなわち、すべての視差仮説の中で最良のものである。マッチングコストは、例えば、絶対差技法、相互情報量(MI)技法(例えば、階層的MI(HMI)技法)、正規化相互相関(NCC)技法、ハミング距離技法など、知られた技法を使用して、計算され得る。いくつかの実施形態においては、NCC技法は、H.ヒルシュミュラ(H.Hirschmuller)らによる、「ステレオマッチングのためのコスト関数の評価(Evaluation of Cost Functions for Stereo Matching)」(2007 IEEE Conference on Computer Vision and Pattern Recognition)において説明されているように、考察中のピクセルの周りの2つのサブウィンドウ(左右の平行化2D画像114の各々において1つのサブウィンドウ)についてのコストをマッチさせるために、使用され得る。いくつかの実施形態においては、ハミング距離技法は、S.サリカ(S.Sarika)らによる、「変動する放射測定条件下におけるセンサスフィルタリングベースのステレオマッチング(Census Filtering Based Stereomatching Under Varying Radiometric Conditions)」(2015 Procedia Computer Science)において説明されているように、考察中のピクセルを取り囲む近隣ピクセルが、これらのピクセルの強度値が、考察中のピクセルのそれよりも大きいか、それとも小さいかに応じて、ビットストリングにマッピングされる、センサス変換において、使用され得る。
【0046】
図4Aは、本技術のいくつかの実施形態による、コストボリュームマップ118がどのように決定され得るかを理解するための図を示している。コストボリューム分析において、コストボリュームマップ118は、平行化2D画像114の左平行化画像(または右平行化画像)内のあらゆるピクセルについてのコスト曲線(例えば、コスト曲線400)を収集することによって、構築され得る。コストボリュームマップ118は、H×W×Dの要素を有し、Hは、画像の高さであり(例えば、Hは、行方向におけるピクセルの数であり得、またはより低い精度のマッチングが許される場合、行方向におけるピクセルグループの数であり得)、Wは、画像の幅であり(例えば、Wは、列方向におけるピクセル数であり得、またはより低い精度のマッチングが許される場合、列方向におけるピクセルグループの数であり得)、Dは、探索される視差の数である。したがって、簡略化して述べると、コストボリュームマップ118は、各ピクセル座標(行および列)についてのコスト曲線を備えると考えられ得る。いくつかの実施形態においては、コストボリュームマップ118は、当技術分野で知られている技法を使用して、より信頼性の高いマッチングコストを獲得するために、(例えば、フィルタリングによって)精緻化され得る。例えば、C.レーマン(C.Rhemann)らによる、「ビジュアルコレスポンデンスおよびその先のための高速コストボリュームフィルタリング(Fast cost-volume filtering for visual correspondence and beyond)」(2011 Conference on Computer Vision and Pattern Recognition)において説明されている技法がある。
【0047】
図4Bは、本技術のいくつかの実施形態による、コストマッチング手順を説明するために使用され得る、コスト曲線400の例を示している。認識されるように、コストマッチングは、典型的には、左平行化画像において(H0,W0)の(行,列)座標を有するピクセルPと、右平行化画像において(H0,W0+D0)の座標を有するピクセルとの間で、実行され得る。マッチングコストと視差との間の関係を示す、コスト曲線400は、考察中の特定のピクセルを表し得る。(言及される「マッチングコスト」という用語は、本願明細書においては、「マッチコスト」または「コスト」と呼ばれることもある)。図4Bに示されるように、コスト曲線400は、視差がdのとき、cd1の最も低いグローバル最小コストを有し、視差がdのとき、cd2の2番目に低いグローバル最小コストを有し、視差がd2mのとき、cd2mの2番目に低いローカル最小コストを有する。認識されるように、「グローバル」という用語は、コスト曲線400におけるすべての点にわたって評価された値に対して使用され得、「ローカル」という用語は、コスト曲線400の一部分にわたって評価された値に対して使用され得る。
【0048】
本技術のいくつかの実施形態によれば、マッチングコストについての値は、左右の平行化2D画像114における考察中のピクセルの周りの、列方向において5ピクセルにまたがり、行方向において5ピクセルにまたがる、サブウィンドウ(「5×5」サブウィンドウ)について、NCC技法(上を参照)を使用して、決定され得る。
【0049】
本技術のいくつかの実施形態によれば、コスト集約手順は、コスト計算手順の結果を利用して、各ピクセルのサポート領域にわたって、マッチングコストを集約することから成り得る。「ローカル」ステレオマッチング技法については、サポート領域は、関心ピクセルの周りの近隣ピクセルのグループにおけるコストの加重和であると理解され得る。「セミグローバル」および「グローバル」ステレオマッチング技法については、サポート領域は、画像内の全ピクセルについてのコストの関数であると理解され得る。
【0050】
本技術のいくつかの実施形態によれば、視差計算手順は、コスト集約手順の結果を使用し、ローカルまたはグローバル最適化方法を使用して、各ピクセルについての視差を計算することと、精緻化されていない視差マップを生成することとから成り得る。計算スピード対正確さが、ローカル最適化手法とグローバル最適化手法との間の選定を決定し得る。例えば、ローカル方法は、正確さよりもスピードが望まれる場合に使用され得、一方、グローバル方法は、スピードよりも正確さが望まれる場合に使用され得る。いくつかの実施形態においては、ブロックマッチングなどの、ローカル最適化方法が使用され得る。いくつかの実施形態においては、セミグローバルマッチング(SGM)などの、グローバル最適化方法が使用され得る。
【0051】
本技術のいくつかの実施形態によれば、視差精緻化手順は、左右の平行化2D画像114についての2D視差マップ116を生成するために、精緻化されていない視差マップをフィルタリングすることから成り得る。視差精緻化手順は、視差値を補正するための任意選択の手順である。従来の精緻化ステップは、左右チェックと、穴埋めと、平滑化フィルタと、異常値検出および除去とを含む。
【0052】
本技術のいくつかの実施形態によれば、ステレオマッチングモジュール108は、上で説明されたものとは異なる、ステレオマッチング技法を採用し得る。例えば、ステレオマッチングモジュールは、モド サアド ハミド(Mohd Saad Hamid)らによる、「深層学習に基づいたステレオマッチングアルゴリズム:調査(Stereo matching algorithm based on deep learning: A survey)」(2020 Journal of King Saud University - Computer and Information Sciences)において説明されている1つもしくは複数の技法、および/またはH.ヒルシュミュラ(H.Hirschmuller)による、「セミグローバルマッチングおよび相互情報量によるステレオ処理(Stereo Processing by Semi-Global Matching and Mutual Information)」(2008 IEEE Transactions on Pattern Analysis and Machine Intelligence)において説明されている1つもしくは複数の技法を使用し得る。
【0053】
本技術のいくつかの実施形態によれば、ステレオマッチングモジュール108は、図1に示されるように、ステレオビジョンシステム1のプロセッサ10のエンコーダモジュール112、および確信度処理モジュール110に対して、2D視差マップ116を出力する。いくつかの実施形態においては、ステレオマッチングモジュール108は、確信度処理モジュール110に対して、視差マップ116を導出することとの関連において上で議論された、3Dコストボリュームマップ118も出力する。
【0054】
本技術のいくつかの実施形態によれば、確信度処理モジュール110は、画像平行化モジュール106から、左右の2D平行化画像114を、ステレオマッチングモジュール108から、コストボリュームマップ118を、およびステレオマッチングモジュール108から、2D視差マップ116を、入力として受信し、これらの入力から、平行化画像114の各ピクセルについて推定される視差の正確さを決定するように構成される。
【0055】
確信度処理モジュール110は、本技術のいくつかの実施形態によれば、ビデオストリームの各フレームについての確信度値を計算するように構成され得る。いくつかの実施形態においては、確信度処理モジュール110は、ビデオストリームの各フレームの各ピクセルについての確信度値を計算し得る。したがって、本願明細書における「画像」という用語は、ビデオストリームのフレームを包含し得ることが理解されるべきである。
【0056】
図1に戻ると、確信度処理モジュール110は、本技術のいくつかの実施形態によれば、エンコーダモジュール112に対して、確信度情報を出力し得る。確信度情報は、いくつかの実施形態においては、ビデオストリームの各フレームについての確信度マップ120であり得る。確信度マップ120は、ステレオマッチングモジュール108によって、エンコーダモジュール112に対して出力された、視差マップ116と同じ次元(dimensions)を有し得る。いくつかの実施形態においては、確信度マップ120は、視差マップ116内の対応するピクセルについての深度推定値の確信度レベルを表す値を示す、フレームの各ピクセルについての確信度情報を含み得る。いくつかの実施形態においては、特定のピクセルの確信度レベルを表す値は、そのピクセルについて決定された視差または深度の2乗平均平方根誤差であり得、またはそのピクセルについて決定された視差または深度の95%信頼区間であり得、または変動性の任意の尺度(例えば、標準偏差、平均の標準誤差、信頼区間、データ範囲、パーセンタイルなど)であり得る。M.ポッジ(M.Poggi)らによる、「深層学習時代におけるステレオマッチングの確信度について:量的評価(On the confidence of stereo matching in a deep-learning era: a quantitative evaluation)」(2021 IEEE Transactions on Pattern Analysis & Machine Intelligence)、およびX.フー(X.Hu)らによる、「ステレオビジョンのための確信度尺度の量的評価(A Quantitative Evaluation of Confidence Measures for Stereo Vision)」(2012 IEEE Transactions on Pattern Analysis and Machine Intelligence)において説明されているものなど、他の確信度メトリックが使用され得る。
【0057】
図5は、本技術のいくつかの実施形態による、確信度処理モジュール110によって実行される処理を示す図である。いくつかの実施形態においては、ブロック500において、第1の確信度尺度プロセスは、ステレオマッチングモジュール108から受信されたコストボリューム118に基づいて、第1の確信度マップ508を計算する。いくつかの実施形態においては、各ピクセルについてのコスト曲線(例えば、コスト曲線400)の勝者マージンが計算され、第1の確信度マップ508上における、そのピクセルの確信度値として使用され得る。勝者マージン(WMN)は、コスト曲線全体にわたって正規化された、2番目に低いローカル最小コストcd2mと最も低いグローバル最小コストcd1との間の差、または
【0058】
【数1】
【0059】
として定義され得、pは、考察中のピクセルの座標であり、cは、マッチコストであり、Dは、探索される視差のセットである。いくつかの実施形態においては、第1の確信度マップ308は、M.ポッジ(M.Poggi)らによる、「深層学習時代におけるステレオマッチングの確信度について:量的評価(On the confidence of stereo matching in a deep-learning era: a quantitative evaluation)」(2021 IEEE Transactions on Pattern Analysis & Machine Intelligence)において要約されているものなど、他の尺度からも導出され得る。
【0060】
本技術のいくつかの実施形態によれば、ブロック502において、確信度処理モジュール110の第2の確信度尺度プロセスは、画像平行化モジュール106から受信された平行化2D画像114に基づいて、第2の確信度マップ510を計算する。いくつかの実施形態においては、テクスチャが、例えば、平行化2D画像114内における変化を決定するために、画像データの導関数(例えば、x導関数)を算出することによって、平行化2D画像114上において測定され、テクスチャ値は、第2の確信度マップ510を導出するために使用され得る。いくつかの実施形態においては、画像テクスチャは、xソーベル演算子を使用して、測定され得る。認識されるように、テクスチャのない特徴、または画像内の複数の他の特徴と同じである特徴をマッチさせる際の困難さのせいで、少ないテクスチャ、または繰り返し構造から成るテクスチャを有する画像上において、3D再構築処理を実行することは困難であることが、ステレオビジョン技術において知られている。この困難さを考慮して、第2の確信度マップ310は、xソーベル演算子:
【0061】
【数2】
【0062】
を用いて畳み込まれた、グレースケール画像から導出され得る。画像内のエッジを強調することが知られている、そのようなソーベル畳み込みまたはフィルタリングは、平行化2D画像114内にエッジがあるとき、高い値を産出し得、したがって、ステレオマッチングを行うのがより容易であり得る、より鮮明な、より良く定義された特徴という結果になり得る。いくつかの実施形態においては、ソーベル畳み込みに加えて、またはソーベル畳み込みの代わりに、第2の確信度マップ510は、ピクセルの強度に基づいて、各ピクセルを評価し、最小閾値を下回る、または最大閾値を上回る強度を有するピクセルにペナルティを与えることによって、導出され得る。例えば、最小閾値を下回る信号強度レベルを有する、各低強度または過小照明ピクセルに対して、ゼロまたは低い確信度値が決定され得、同様に、最大値を上回る信号強度レベルを有する、各過大照明または飽和ピクセルに対して、ゼロまたは低い確信度値が決定され得る。
【0063】
本技術のいくつかの実施形態によれば、ブロック504において、確信度処理モジュール110の第3の確信度尺度プロセスは、ステレオマッチングモジュール108から受信された視差マップ116に基づいて、第3の確信度マップ512を計算する。いくつかの実施形態においては、第3の確信度マップ312についての確信度値は、平行化2D画像114の各ピクセルについて決定された視差の分散から計算され得る。いくつかの実施形態においては、分散は、近隣ピクセル(例えば、考察中のピクセルを取り囲むピクセル)について決定された視差に関する統計的分散であり得る。例えば、相対的により高い分散を有するピクセルは、ピクセルが、よりノイズの多い(例えば、より散在性の)データを有する、視差マップ116の領域の一部であることを示し得、したがって、相対的により低い確信度値を割り当てられ得る。認識されるように、ノイズの多さは、ぼやけを示し得、画像をキャプチャするために使用されたセンサ(例えば、カメラ100)、またはセンサの領域が、汚れている、または部分的に見えなくされている可能性があることを示し得る。視差マップ116における分散を検出するために、知られた技法(例えば、ラプラスフィルタおよび/またはソーベルフィルタに基づいた技法)が使用され得る。いくつかの実施形態においては、閾値分散を下回る分散は、考察中のピクセルが、ぼやけている、またはぼやけた領域内にあることを示し得、したがって、第3の確信度マップ512において、低い確信度値を割り当てられ得る。
【0064】
認識されるように、第1の確信度マップ508、第2の確信度マップ510、および第3の確信度マップ512は、本技術のいくつかの実施形態によれば、画像の各ピクセル、またはビデオストリームの各フレームの各ピクセルについての確信度値から成ると説明されたが、いくつかの他の実施形態においては、第1の確信度マップ508、第2の確信度マップ510、および第3の確信度マップ512のうちの1つまたは複数は、画像またはフレームの2つ以上のピクセルを代表する、確信度値から成り得る。例えば、ビデオストリームの各フレームは、n個のグループにカテゴライズされたピクセルから成り得、確信度処理モジュール110は、ビデオストリームの各フレームについて、n個の確信度値(すなわち、n個のグループの各々についての確信度値)を計算するように構成され得る。
【0065】
本技術のいくつかの実施形態によれば、ブロック506において、確信度処理モジュール110の集約器プロセスは、第1の確信度マップ508、第2の確信度マップ510、および第3の確信度マップ512を使用し、確信度マップ120を生成するために、第1の確信度マップ508、第2の確信度マップ510、および第3の確信度マップ512における推定された確信度値を組み合わせる。したがって、確信度マップ120は、複数の確信度の尺度に基づいた、確実性の最も良い推定値である、強化された確信度値から成り得る。いくつかの実施形態においては、集約器プロセスは、各ピクセルについて、確信度の和を計算することから成り得、和を、確信度マップ120におけるピクセルについての強化された確信度値として使用し得る。いくつかの実施形態においては、集約器プロセスは、第1の確信度マップ508、第2の確信度マップ510、および第3の確信度マップ512における確信度を重み付けし、その後、各ピクセルについて、確信度の加重和を計算することを備え得、加重和を、確信度マップ120におけるピクセルについての強化された確信度値として使用し得る。いくつかの実施形態においては、集約器プロセスは、各ピクセルについて、第1の確信度マップ508、第2の確信度マップ510、および第3の確信度マップ512におけるピクセルについての確信度を、確信度マップ120におけるピクセルについての強化された確信度値として使用される、単一の値を出力し得る、ルックアップテーブルに対する、3つの入力値として使用することを備え得る。
【0066】
図1に戻ると、確信度処理モジュール110は、本技術のいくつかの実施形態によれば、コンピュータプロセッサ10のエンコーダモジュール112に対して、確信度マップ120を出力し得る。エンコーダモジュール112は、平行化2D画像114、視差マップ116、および確信度マップ120を受信し、受信された情報をエンコードし、エンコードされた情報から成る、ビデオストリーム122を出力するように構成され得る。いくつかの実施形態においては、ビデオストリーム122は、車両のメインシステムコントローラ30に対して、提供され得る。
【0067】
本技術のいくつかの実施形態によれば、ビデオストリーム122は、各24ビットカラー値が、カメラ100によってキャプチャされたシーンまでの範囲または距離であるようにエンコードされ得る、24ビットカラー深度ビデオから成り得る。いくつかの実施形態においては、0から近似的に16800メートルまでの距離が、24ビットを用いて表され得、各カラーは、16800メートル範囲の異なる1ミリメートル部分を表す。いくつかの実施形態においては、ビデオストリーム122は、ピクセルから成る2Dフレームから成り得、各フレームのピクセルは、平行化2D画像114のピクセルに対応する。ビデオストリーム122の各フレームの各ピクセルは、強化された確信度値とともに、エンコードされ得る。例えば、各強化された確信度値は、0から255までの8ビット符号なし値であり得、相対的により高い値は、より高いレベルの確信度を示し得る。いくつかの実施形態においては、確信度マップ120の強化された確信度値について、8ビット表現を使用することは、確信度マップ120が、グレースケール画像として表示されることを可能にし得る。いくつかの実施形態においては、ビデオストリーム122は、深度または距離を表す、24ビットカラービデオストリームから成り得、確信度を表す、8ビットモノクロビデオストリームからも成り得る。深度データが確信度データから分離され得るように、ビデオストリーム122を出力することは、いくつかの実施形態においては、例えば、対象物を検出する際、および車両の対象物までの距離を決定する際に、強化された信頼性を提供するために、異なるタイプのセンサ(例えば、ライダ、レーダ、超音波、カメラなど)からのデータが組み合わされ得る、センサ融合を容易にし得る。例えば、シーン内の対象物が、典型的なカメラによってキャプチャされた画像において、明確に見えないことがある、霧がかかった環境においては、画像のピクセルについての確信度値は、一般に、画像全体にわたって低くなり得る。そのようなケースにおいては、車両の制御システム(例えば、メインシステムコントローラ30)は、画像が、使用されるのに十分なほど信頼できないと決定し得る。
【0068】
本技術のいくつかの実施形態によれば、ステレオビジョンシステム1のコンピュータプロセッサ10は、ライダ確信度処理モジュール124から成り得、センサ100は、レーザ光を用いてシーンを照明し、シーンから受光された反射光から、ライダ画像データ(例えば、ビデオストリーム)と、ライダ確信度データとを生成し、エンコーダモジュール112に対して、ライダ確信度マップ126を出力するように構成された、ライダセンサから成り得る。任意選択で、ライダ画像データは、ライダ確信度マップ126と一緒に出力され得る。いくつかの実施形態においては、コンピュータプロセッサ10は、レーダ確信度処理モジュール128から成り得、センサ100は、知られた波長(例えば、76.5GHz)の波を用いてシーンを照明し、知られた波長を有し、シーンから反射された反射波から、レーダ画像データ(例えば、ビデオストリーム)と、レーダ確信度データとを生成し、エンコーダモジュール112に対して、レーダ確信度マップ130を出力するように構成された、レーダセンサから成り得る。任意選択で、レーダ画像データは、レーダ確信度マップ130と一緒に出力され得る。いくつかの実施形態においては、コンピュータプロセッサ10は、音響確信度処理モジュール132から成り得、センサ100は、知られた波長(例えば、20kHz)の音響波(例えば、超音波)を用いてシーンを照射し、知られた波長を有し、シーンから反射された反射波から、音響画像データ(例えば、ビデオストリーム)と、音響確信度データとを生成し、エンコーダモジュール112に対して、音響確信度マップ134を出力するように構成された、トランスデューサから成り得る。任意選択で、音響画像データは、音響確信度マップ134と一緒に出力され得る。ライダ画像データ、レーダ画像データ、および音響画像データについての確信度値を決定するための技法が、以下で議論される。
【0069】
本技術のいくつかの実施形態によれば、ライダ確信度処理モジュール124は、ステレオマッチングモジュール108から、視差マップ116およびコストボリュームマップ118を、確信度処理モジュール110から、確信度マップ120を受信するように構成され得る。図1には示されていないが、ライダ確信度処理モジュール124は、いくつかの実施形態においては、画像平行化モジュール106から、左右の平行化2D画像114の一方または両方を受信するようにも構成され得る。ライダ確信度処理モジュール124は、比較を実行するために、およびライダ確信度データが、確信度マップ120の対応する領域よりも高い確信度値である値を有する領域を識別するために、確信度マップ120と、他の受信された情報(すなわち、視差マップ116、および/またはコストボリュームマップ118、および/または平行化2D画像114の一方もしくは両方)のうちのいくつかまたはすべてとを使用し得る。いくつかの実施形態においては、ライダ確信度処理モジュール124は、エンコーダモジュール112に対して、比較情報を、ライダ確信度マップ126と一緒に提供し得る。同様に、いくつかの実施形態においては、視差マップ116、コストボリュームマップ118、および確信度マップ120が、エンコーダモジュール112に対して、比較情報を、レーダ確信度マップ130と一緒に提供するように構成され得る、レーダ確信度処理モジュール128に対して提供され得る。同様に、いくつかの実施形態においては、視差マップ116、コストボリュームマップ118、および確信度マップ120が、エンコーダモジュール112に対して、比較情報を、音響確信度マップ134と一緒に提供するように構成され得る、音響確信度処理モジュール132に対して提供され得る。
【0070】
本技術のいくつかの実施形態によれば、エンコーダモジュール112は、カメラ100によって獲得されたセンサデータだけに基づいた深度情報を含むように、ビデオストリーム122をエンコードするか、それとも別のセンサシステム(例えば、ライダセンサ、レーダセンサ、音響センサ、カメラの別のペアなど)だけに基づいた深度情報を含むように、ビデオストリーム122をエンコードするか、それとも車両上の複数の異なるセンサシステムから導出されたセンサデータを組み合わせるために、センサ融合を実行するかを決定するために、確信度マップ120と、ライダ確信度マップ126、レーダ確信度マップ130、および音響確信度マップ134のうちの1つまたは複数とを使用し得る。いくつかの実施形態においては、エンコーダモジュール112は、ビデオストリーム122における画像データ、深度データ、および/または確信度データが、異なるセンサシステムから決定された、最も高い確信度値に対応するように、ビデオストリーム122をエンコードするように構成され得る。いくつかの実施形態においては、ビューストリーム122のフレームは、平行化2D画像114に基づいた、1つまたは複数のフレームと、ライダ画像データに基づいた、1つまたは複数のフレームによって後続される、確信度マップ120と、音響画像データおよび音響確信度マップ134に基づいた、1つまたは複数のフレームによって後続される、ライダ確信度マップ126とから成り得る。いくつかの実施形態においては、ビデオストリーム122の1つまたは複数のフレームは、各々、異なるセンサシステムから導出されたデータの組み合わせから成り得る。例えば、ビデオストリーム122のフレームの各々は、4つの象限(例えば、左上、右上、左下、右下)から成り得、各象限は、最も高い全般的な確信度(例えば、象限のピクセルにわたる最も高い平均確信度レベル)を有するセンサデータから成る。したがって、カメラ100の一方または両方の上のデブリが、確信度マップ120の左上象限に、車両の他のセンサシステムの全般的な確信度と比較して最も低い全般的な確信度を有させるが、確信度マップ120の他の3つの象限は、最も高い全般的な確信度値を有する場合、ビデオストリーム122の対応するフレームの左上象限は、最も高い全般的な確信度を有する、センサシステムからのデータを用いて、置き換えられ得る。認識されるように、ビデオストリーム122のフレームを、フレームごとに、または象限ごとに、最適化する代わりに、フレームは、異なるセンサシステムのセンサによってキャプチャされたシーンの高信頼性の推定値を提供する他のやり方で最適化され得る。いくつかの実施形態においては、車両が、夜間に、または暗い環境において動作させられているとき、エンコーダモジュール112は、カメラベースデータの代わりに、例えば、ライダベースデータを用いて、ビデオストリーム122をエンコードし得る。
【0071】
図6は、本技術のいくつかの実施形態による、ビデオストリーム122の例を描いている。ビデオストリーム122は、シーケンスフレームから成り得、そのうちの3つだけが、すなわち、フレームN 600、フレームN+1 602、およびフレームN+2 604だけが示されている。いくつかの実施形態においては、各フレームは、(カラーまたはグレースケールでの)左(または右)平行化2D画像114と、(カラーまたはグレースケールでの)視差マップ116と、(カラーまたはグレースケールでの)確信度マップ120とから成る、スーパフレーム606であり得る。いくつかの実施形態においては、スーパフレーム606は、以下のうちの、すなわち、速度大きさマップ、(x軸に沿った動きを描く)水平速度マップ、(y軸に沿った動きを描く)垂直速度マップ、および(z軸に沿った動きを描く)視線速度マップのうちのいずれか1つまたは任意の組み合わせなどの、1つまたは複数の速度マップも包含し得る。速度マップは、2つ以上のフレームにわたって、密なオプティカルフローを有する、マッチさせられた点(またはピクセル)を追跡し、その後、マッチさせられた点の視差マップ値の差を決定することによって、計算され得る。この方式においては、スーパフレーム606は、ビデオフレームの他の任意のストリームと同じように送信され得、したがって、エンコーディング、デコーディング、送信などのための存在しているビデオ技術を有利に使用し得る。認識されるように、視差マップ116は、代わりに、深度マップであり得、なぜなら、両方のタイプのマップは、センサ(例えば、カメラ100)から、センサによってキャプチャされたシーンまでの距離に関係し、両方のタイプのマップは、典型的には、互いに反比例するからである。いくつかの実施形態においては、各スーパフレームの平行化2D画像114の各ピクセルの「アルファチャンネル」または透明度が、情報を記憶するために、使用され得る。例えば、ピクセルについての深度推定値の確信度または確実性についての値は、ピクセルのアルファチャンネル内に記憶され得る。
【0072】
図7A乃至図7Fは、本技術のいくつかの実施形態による、ビデオストリーム122内に含まれ得る、6タイプのスーパフレームを示している。認識されるように、異なるタイプのスーパフレームは、異なるタイプの情報から成り、したがって、異なるサイズを有し得る。図7Aは、垂直に連結された、2D RGB(赤緑青)カラー画像700(例えば、左(または右)平行化2D画像114)と、深度マップまたは視差マップ700(例えば、視差マップ116)と、確信度マップ704(例えば、確信度マップ120)とから成る、スーパフレーム750を示している。いくつかの実施形態においては、スーパフレーム750の各ピクセルは、ピクセルの視差または範囲を記述するために、3バイトを使用し得、3バイトが、ピクセルの確信度レベルを記述するために使用され得る。いくつかの実施形態においては、スーパフレーム750の各ピクセルは、9バイトを用いて指定され得る。図7Bは、2Dカラー画像706と、視差マップおよび確信度マップの連結とから成る、スーパフレーム752を示している。いくつかの実施形態においては、スーパフレーム752の各ピクセルは、視差マップのために2バイト、確信度マップのために1バイトを使用し得、連結すると合計で3バイトである。いくつかの実施形態においては、スーパフレーム752の各ピクセルは、6バイトを用いて指定され得る。図7Cは、赤色画像710のためのチャンネル、緑色画像712のためのチャンネル、および青色画像714のためのチャンネルを含む、チャンネルから形成される、2Dカラー画像から成る、スーパフレーム754を示している。スーパフレーム754は、上位バイト716および下位バイト718を含む、16ビット視差マップと、確信度マップとからも成る。いくつかの実施形態においては、スーパフレーム754の各ピクセルは、6バイトを用いて指定され得る。図7Dは、赤色画像722、緑色画像724、および青色画像726から形成されたカラー画像と、視差マップ728と、確信度マップ730とから成る、スーパフレーム756を示している。いくつかの実施形態においては、視差マップ728の各ピクセルは、5バイトを用いて指定され得る。図7Eは、2Dグレースケール画像732と、視差マップ734と、確信度マップ736とから成る、スーパフレーム758を示している。いくつかの実施形態においては、スーパフレーム758の各ピクセルは、3バイトを用いて指定され得る。図7Fは、2Dカラー画像738と、視差マップ740と、確信度マップ742とから成る、スーパフレーム760を示している。カラー画像738の各ピクセルは、1バイトを用いて指定され得る。例えば、カラー画像738は、ベイヤフィルタパターンまたはルックアップテーブルによって、カラーパレット内に指定され得、これは、スーパフレーム760が、RGBカラー画像におけるのと同じくらいコンパクトであることを可能にし得る。いくつかの実施形態においては、スーパフレーム760の各ピクセルは、3バイトを用いて指定され得る。
【0073】
上で述べられたように、エンコーダモジュール112に対して、カメラ100からのセンサデータに基づいた、ステレオビジョン確信度マップ120を提供することに加えて、ライダ確信度マップ126、レーダ確信度マップ130、および音響確信度マップ134が、エンコーダモジュール112に対して、提供され得る。ライダセンサ、レーダセンサ、および音響センサは、上で説明されたように、カメラ100と同じまたは同様の視野を有し得、または重なり合う視野を有し得る。いくつかの実施形態においては、ライダ確信度マップ126、レーダ確信度マップ130、および音響確信度マップ134のうちの1つまたは複数は、ビデオストリーム122に対して、付加され得る。例えば、ライダ確信度マップ126(または別の確信度マップ)は、図7A乃至図7Fのスーパフレーム750、752、754、756、758、760のいずれかの確信度マップ内に、別個のビットとしてエンコードされ得、または単純に、例えば、垂直連結によって、スーパフレームに対して付加され得る。
【0074】
本技術のいくつかの実施形態によれば、ライダセンサが、画像の各ピクセルについてのライダ戻り信号を提供するように構成される場合、ライダ確信度マップ(例えば、ライダ確信度マップ126)は、2D画像(例えば、左(または右)平行化2D画像114)の各ピクセルについての確信度値から成り得る。いくつかの実施形態においては、ライダセンサは、例えば、1つ置きのピクセルもしくは2つ置きのピクセルについての、またはピクセルの事前決定されたグループについての、ライダ戻り信号を提供するように構成され得、これは、相対的により疎らであるが、それでも依然として有用なライダ確信度マップという結果になり得る。各ピクセルが、その座標(i,j)によって識別され得る場合、ピクセル(i,j)の確信度値は、mijと表記され得る。いくつかの実施形態においては、ライダ確信度マップは、
R≧Rminの場合、mij=a-2(P+P-1/2
R<Rminの場合、mij=0
に従った、2D画像114と視差マップ116との関数であり得、Rは、視差マップ116によって測定されるような、ピクセル(i,j)における対象物までの距離または範囲であり、Pは、2D画像114によって測定されるような、ピクセル(i,j)の(太陽光または他の光源からの)背景光パワーであり、aは、正規化定数であり、Pは、フィッティング定数であり、Rminは、ライダセンサの最小距離である。いくつかの実施形態においては、Pの値は、例えば、カメラ100についてのセンサゲインおよび露出値によって除算された、ピクセル(i,j)における2D画像114のグレースケール値であり得る。上で示されたように、ライダ確信度マップを生成する際に使用される、2D画像および視差マップは、カメラ100によってキャプチャされた2D画像114、およびステレオビジョン処理に基づいて決定された視差マップ116であり得る。いくつかの実施形態においては、ピクセル(i,j)における対象物が、ライダセンサの最小範囲よりも近いとき、ピクセル(i,j)についての確信度値は、ゼロに設定され得る。確信度値mijについての上記の式は、距離または範囲の2乗、すなわち、Rに反比例し、また背景光パワー、すなわち、Pの平方根にも反比例するように、すなわち、
SNRlidar∝R-2-1/2
となるように、ライダ信号対雑音比(SNR)の推定から、導出される。すなわち、対象物が、ライダセンサから遠く離れるほど、戻り信号は低下し、それ故、ライダ推定の正確さは、戻り信号に対応する受光された光子の数に比例して、低下する。加えて、任意の背景光(例えば、太陽、月、人工)は、ライダセンサによって「ショットノイズ」を感知させることがあり、ノイズエネルギーは、背景光パワーの平方根に等しい。したがって、ライダ確信度マップ126は、2つの物理量、すなわち、ピクセルにおける対象物までの距離と、ピクセルにおける背景光のレベルとに基づき得る。
【0075】
レーダセンサおよび音響センサも、ライダセンサと同じく、R-2-1/2に比例する、SNRを有し得る。この特性は、本技術のいくつかの実施形態による、ライダ確信度マップを計算するための、上で説明されたのと同様の方式で、レーダ確信度マップ(例えば、レーダ確信度マップ130)、および/または音響確信度マップ(例えば、音響確信度マップ134)を計算するために、採用され得る。
【0076】
本技術のいくつかの実施形態によれば、車両上の異なるセンサシステムは、異なる距離範囲にある対象物を感知するように、配置され得る。例えば、図8Aは、レーダセンサシステムまたは音響センサシステムによって照射されるビーム領域800を概略的に描いている。ビーム領域800は、多数の距離または範囲R、R、R、Rにおいて、多数の対象物A、B、C、Dを有する、シーンを包含し得る。対象物から反射される戻り信号の強さは、ステレオビジョンシステム1によって測定され得る、対象物の断面積に比例する(例えば、範囲は、視差マップ116に基づき、ターゲットの面積は、左(または右)平行化2D画像114によって与えられる)。いくつかの実施形態においては、センサシステムによって検出された戻り信号は、信号強さに基づいて、異なるビン内にカテゴライズされ得る。図8Bは、対象物A、B、C、Dの各々について、断面積と範囲との間の関係を描いたグラフである。破線は、レーダセンサシステム(またはライダセンサシステム)のノイズフロア802を表す。ノイズフロア802は、レーダおよびライダ技術についての知られた量であり、距離の2乗の関数として劣化することが知られている、センサ感度に対応し得る。上で述べられたように、ライダSNRは、距離または範囲の2乗に反比例する値として、推定され得る。いくつかの実施形態においては、ピクセルについてのライダ(またはレーダ)確信度は、ピクセルについてのSNRに比例する値として、決定され得る。例えば、複数のピクセルにまたがり得る対象物の断面積の、ノイズフロア802の範囲スケール値に対する比は、SNRに比例する値であり、対象物が出現するピクセルについての確信度値として、使用され得る。
【0077】
本技術の例となる実施形態によれば、ステレオビジョンシステム1がインストールされた車両は、乗用車であり得る。センサ100は、車のフロントガラスの左上部分および右上部分(例えば、図2におけるセンサS3、S7の位置)上に搭載された、2つのカメラであり得、上で議論されたスーパフレーム750などのスーパフレームから成り得る、ビデオストリーム122になるように処理および変換される、画像をキャプチャするように構成され得る。スーパフレーム750のRGB画像700は、画像前処理モジュール104の一部であり得る、またはステレオマッチングが実行される前に、画像が平行化を施される前(または後)に、キャプチャされた画像の画像データを処理する、コンピュータプロセッサ10の別個のモジュールであり得る、対象物検出モジュール(例えば、単眼対象物検出器)によって、解析され得る。例えば、対象物検出モジュールは、キャプチャされた画像のシーンにおいて、様々な形状のバウンディングボックスを決定するために、トレーニングされた畳み込みニューラルネットワークを使用するように構成され得る。形状は、ニューラルネットワークが、車によってしばしば遭遇される典型的な対象物(例えば、他の車両、歩行者、自転車に乗った人、交通標識、交通信号など)として認知するようにトレーニングされた、対象物のカテゴリに対応し得る。スーパフレーム750の視差マップ702は、検出された対象物までの平均距離を決定するために、バウンディングボックスにわたって平均化され得る。さらに、地面または路面が、S.カケガワ(S.Kakegawa)らによる、「ステレオカメラのための垂直ローカル視差ヒストグラムに基づいた路面セグメンテーション(Road Surface Segmentation based on Vertically Local Disparity Histogram for Stereo Camera)」(Int’l J. ITS Res. vol.16,pp.90-97,2018)において説明されている、垂直視差ヒストグラムを使用した技法、ならびにH.バジノ(H.Badino)らによる、「確率的占有グリッドおよび動的プログラミングを使用したフリースペース計算(Free Space Computation Using Stochastic Occupancy Grids and Dynamic Programming)」(Workshop on Dynamical Vision, ICCV,2007)において説明されている、確率的占有グリッドおよび動的プログラミングを使用した技法など、知られた技法を使用して、視差マップ702から計算され得る。路面から、未分類のロードハザード(例えば、オートバイのヘルメット、レンガ、緩んだ積荷からの木製パレット、マフラ、タイヤから分離したトレッドなど)が、見つけられ、マークされ得る。典型的な路面上の小さい未分類の対象物は、しばしば、よく定義されたエッジおよび輪郭特徴を有し、それが、確信度マップ704における、高い確信度値をもたらし得、したがって、誤検出および不必要な自動緊急ブレーキが発生することを防止し得る。この例となる実施形態においては、カメラ100の一方または両方のキャプチャされた画像の左下の一部を塞ぐ、デブリ(例えば、泥)が、フロントガラス上にある場合、確信度処理モジュール110は、ステレオマッチングモジュール108が、ステレオマッチングモジュール108によって出力される、コストボリュームマップ118の左下の一部において、高いコストを繰り返し報告することを検出し得、したがって、確信度マップ120の対応領域について、低い確信度値を提供し得る。車のメインシステムコントローラ30は、低い確信度値が、許容可能な確信度閾値内にあるかどうかを決定するように構成され得、閾値内にない場合、左下領域からのデータを無効化するように、コンピュータプロセッサ10を制御し得る。すなわち、いくつかの実施形態においては、左下領域についての確信度値が、信頼性閾値よりも低く、したがって、左下領域についての計算された深度値は、無効であり得るので、コンピュータプロセッサ10は、誤読を避け、結果として、車の誤った制御を避ける(例えば、シーン内に実際にはない対象物を避けるために、回避行動を実行するように、車が制御されるのを防止する)ために、左下領域に関連する、カメラ100からのデータを使用して、キャプチャされた画像のシーン内の対象物を検出しないように制御され得る。代わりに、上で議論されたように、データについての確信度値が、確信度閾値を満たしている場合、車上の他のセンサからのデータが使用され得る。
【0078】
図3に戻ると、メインシステムコントローラ30は、本技術のいくつかの実施形態によれば、車両の動作の様々な側面を制御するように構成された、複数のECU34-1、34-2、34-3、34-4、・・・、34-nに対して、制御信号を発行するように構成され得る。例えば、ビデオストリーム122は、車両のディスプレイ(示されず)に対して提供され得、また赤い尾灯が車両の経路の前方にあり、それが交通渋滞または他の潜在的危険を示していることがあると、高い確実性(例えば、90%よりも高い確実性)で決定するために、ビデオストリーム122からの視差情報および確信度情報を使用し得る、メインシステムコントローラ30に対しても提供され得る。メインシステムコントローラ30は、その後、車両を減速させ、停止させるように、車両のパワートレインを制御し得る、ECU34-1に対して、制御信号を発行し得る。いくつかの実施形態においては、コンピュータプロセッサ10および/またはメインシステムコントローラ30による処理は、シーンの画像データが、カメラ100によってキャプチャされ、画像取得モジュール102に対して転送されたときに対して、リアルタイムまたはほぼリアルタイム(例えば、2秒未満または1秒未満)で、ディスプレイが、ビデオストリーム122に対応するビデオを示し得るだけ、十分に高速であり得る。いくつかの実施形態においては、ECU34-1は、シーンの画像データが、カメラ100によってキャプチャされ、画像取得モジュール102に対して転送されたときに対して、リアルタイムまたはほぼリアルタイムで、制御信号を受信し得る。上で述べられたように、メインシステムコントローラ30と、ECU34-1、34-2、34-3、34-4、・・・、34-nとの間の通信は、技法を介し得る。例えば、指令および制御ライン32は、車両に内蔵されたネットワークまたはバスであり得、メインシステムコントローラ30と、ECU34-1、34-2、34-3、34-4、・・・、34-nとの間で信号を送るために、知られたプロトコル(例えば、イーサネット(登録商標)、CAN、I2C、LINなど)を使用し得る。
【0079】
図9Aおよび図9Bは、2つの5メガピクセルカメラによってキャプチャされ、上で説明された本技術の様々な実施形態に従って処理された、シーンの画像からの結果である、データの例を示している。2つのカメラは、それらが1.2mのベースラインによって分離されるように、標準的な乗用車のルーフに搭載された。図9Aは、シーンの距離および明度の両方が、同時に見られ得るように、グレースケールカメラ画像(示されず)とブレンドされた、カラー視差マップを示している。視差マップは、赤色が相対的に近い対象物を示し、青色が相対的により遠く離れた対象物を示す、jetカラーマップを用いてエンコードされた、0から1023までの値を有する。視差マップの透明度は、グレースケールカメラ画像によって変調される。図9Bは、シーンの対応する確信度マップを示している。確信度マップは、H.ヒルシュミュラ(H.Hirschmuller)による、「セミグローバルマッチングおよび相互情報量によるステレオ処理(Stereo Processing by Semi-Global Matching and Mutual Information)」(2008 IEEE Transactions on Pattern Analysis and Machine Intelligence)において説明されているような、セミグローバルマッチングアルゴリズムからの、各ピクセルについての最小集約コスト値を示している。
【0080】
本技術のいくつかの実施形態によれば、図1図3、および図5における処理モジュールおよび構成要素は、ハードウェア(例えば、上で説明された手順および方法を実行するようにプログラムされた、1つもしくは複数のコンピュータプロセッサ)で、および/またはソフトウェア(例えば、コンピュータ遂行可能コード)で、実施され得る。いくつかの実施形態においては、ソフトウェアの少なくともいくつかは、コンピュータプロセッサ内に事前プログラムされ得る。いくつかの実施形態においては、ソフトウェアの少なくともいくつかは、非一時的コンピュータ可読記憶媒体上に、または複数の非一時的コンピュータ可読記憶媒体上に記憶され得、それらは、コンピュータプロセッサによってアクセスされ、遂行され得る。いくつかの実施形態においては、プロセスモジュールは、ソフトウェアモジュール、もしくはハードウェアモジュール、またはハードウェアとソフトウェアとを組み合わせたモジュールであり得る。
【0081】
本願明細書において説明された技術による、車両支援システムは、異なる構成で具現化され得る。例となる構成は、以下のような構成(1)乃至(21)の組み合わせを含む。
(1)監視ありまたは監視なしの車両移動のための自動車両支援システムであって、システムは、コンピュータプロセッサと、コンピュータプロセッサに対して結合されたメモリとから成る、車両制御システムと、シーンの第1の画像データを受信し、第1の画像データに基づいて、第1の視差マップおよび第1の確信度マップを出力するように構成された、第1のセンサシステムとを備え、車両制御システムは、第1のセンサシステムから、第1の視差マップと、第1の確信度マップとを受信し、第1の視差マップと、第1の確信度マップとから成る、ビデオストリームを出力するように構成される、自動車両支援システム。
【0082】
(2)ビデオストリームにおいて、第1の確信度マップは、第1の視差マップの一部になるように、エンコードされる、構成(1)のシステム。
(3)第1の画像データは、複数のピクセルから成り、視差マップは、ピクセルの各々についての視差データから成り、確信度マップは、ピクセルの各々についての確信度データから成る、構成(1)または構成(2)のシステム。
【0083】
(4)第1の画像データは、左右の2次元(2D)の第1の画像についてのデータから成り、第1のセンサシステムは、第1の画像データから、左右(2D)の平行化された第1の画像と、第1のコストボリュームマップとを生成するように構成され、第1のセンサシステムは、2Dの平行化された第1の画像と、第1の視差マップと、第1のコストボリュームマップとから、第1の確信度マップを生成するように構成される、構成(1)乃至(3)のうちのいずれか1つのシステム。
【0084】
(5)第1のセンサシステムは、セミグローバルマッチング(SGM)アルゴリズムから決定される一意性の値、および第1の画像データに対するソーベル演算から決定される画像テクスチャ値の一方または両方に基づいて、第1の確信度マップを生成するように構成される、構成(1)乃至(4)のうちのいずれか1つのシステム。
【0085】
(6)シーンの少なくとも一部分の第2の画像データを受信し、第2の画像データに基づいて、第2の確信度マップを出力するように構成された、第2のセンサシステムをさらに備え、車両制御システムは、第2のセンサシステムから、第2の確信度マップを受信することと、ビデオストリームを、スーパフレームのシーケンスとして出力することであって、各スーパフレームは、第1の視差マップと、第1の確信度マップと、第2の確信度マップとに基づいた情報から成る、出力することとを行うように構成される、構成(1)乃至(5)のうちのいずれか1つのシステム。
【0086】
(7)車両制御システムは、ビデオストリームの情報に基づいて、車両の電子制御ユニット(ECU)に対して、制御信号を出力するように構成される、構成(1)乃至(6)のうちのいずれか1つのシステム。
【0087】
(8)第1のセンサシステムは、第1の視差マップと、第1の確信度マップとを生成するために、第1の画像データを処理するように構成された、第1のセンサモジュールであり、第2のセンサシステムは、第2の確信度マップを生成するために、第2の画像データを処理するように構成された、第2のセンサモジュールであり、第1のセンサモジュールおよび第2のセンサモジュールは、メモリ内に記憶され、コンピュータプロセッサは、第1のセンサモジュールおよび第2のセンサモジュールを遂行するように構成される、構成(1)乃至(7)のうちのいずれか1つのシステム。
【0088】
(9)ビデオストリームは、第1の視差マップと、第1の確信度マップとから成る、少なくとも1つのスーパフレームと、第1の視差マップと、第2の確信度マップとから成る、少なくとも1つのスーパフレームとから成る、構成(1)乃至(8)のうちのいずれか1つのシステム。
【0089】
(10)ビデオストリームは、第1の確信度マップの一部分と、第2の確信度マップの一部分とから成る、少なくとも1つのスーパフレームから成る、構成(1)乃至(9)のうちのいずれか1つのシステム。
【0090】
(11)第1の画像データは、ステレオビジョンデータから成り、第2の画像データは、ライダデータから成る、構成(1)乃至(10)のうちのいずれか1つのシステム。
(12)シーンの少なくとも一部分の第3の画像データを受信し、第3の画像データに基づいて、第3の確信度マップを出力するように構成された、第3のセンサシステムをさらに備える、構成(1)乃至(11)のうちのいずれか1つのシステム。
【0091】
(13)第3の画像データは、レーダデータ、または音響データから成る、構成(1)乃至(12)のうちのいずれか1つのシステム。
(14)ビデオストリームの各スーパフレームは、シーンの2次元(2D)画像と、シーンの深度マップと、シーンの確実性マップとから成る、構成(1)乃至(13)のうちのいずれか1つのシステム。
【0092】
(15)シーンの確実性マップは、第1の確信度マップ、もしくは第2の確信度マップ、または第1の確信度マップと第2の確信度マップとの組み合わせから成る、構成(1)乃至(14)のうちのいずれか1つのシステム。
【0093】
(16)シーンの深度マップは、シーンの2D画像に対応する画像データを用いて変調された、第1の視差マップから成り、シーンの確実性マップは、シーンの2D画像に対応する画像データを用いて変調された、第1の確信度マップ、もしくは第2の確信度マップ、または第1の確信度マップと第2の確信度マップとの組み合わせから成る、構成(1)乃至(15)のうちのいずれか1つのシステム。
【0094】
(17)シーンの2D画像のピクセル、シーンの深度マップのピクセル、およびシーンの確実性マップのピクセルは、時間的および空間的にマッチさせられる、構成(1)乃至(16)のうちのいずれか1つのシステム。
【0095】
(18)車両制御システムは、ビデオストリームのデータサイズを下げるために、第1の視差マップからの視差情報、ならびに第1の確信度マップおよび第2の確信度マップからの確信度情報をエンコードするように構成される、構成(1)乃至(17)のうちのいずれか1つのシステム。
【0096】
(19)車両上に搭載されるように構成された、カメラのペアをさらに備え、カメラは、第1のセンサシステムに対して、第1の画像データを提供するように構成される、構成(1)乃至(18)のうちのいずれか1つのシステム。
【0097】
(20)ビデオストリームは、2次元(2D)カラー画像から成り、各2Dカラー画像は、複数のピクセルから成り、各ピクセルのアルファチャンネル透明度は、ピクセルについての確信度値に比例する、構成(1)乃至(19)のうちのいずれか1つのシステム。
【0098】
(21)2Dカラー画像のカラーは、深度範囲を示す、構成(1)乃至(20)のうちのいずれか1つのシステム。
非一時的コンピュータ可読記憶媒体は、コンピュータプロセッサによって遂行されたときに、コンピュータプロセッサに、本願明細書において説明される技術による、監視ありまたは監視なしの車両移動のための自動車両支援システムの方法を実行させるコードを記憶するように構成され得る。そのようなコンピュータ可読記憶媒体の例は、以下のような構成(22)乃至(34)の組み合わせを含む。
【0099】
(22)コンピュータプロセッサによって遂行されたときに、コンピュータプロセッサに、監視ありまたは監視なしの車両移動のための自動車両支援システムの方法を実行させるコードを記憶した、非一時的コンピュータ可読記憶媒体であって、方法は、コンピュータプロセッサが、第1の視差マップと、第1の確信度マップとを獲得する工程であって、第1の視差マップおよび第1の確信度マップは、シーンの第1の画像データに対応する、工程と、コンピュータプロセッサが、第1の視差マップと、第1の確信度マップとから成る、ビデオストリームを出力する工程とから成る、非一時的コンピュータ可読記憶媒体。
【0100】
(23)ビデオストリームを出力する工程は、コンピュータプロセッサが、第1の視差マップの一部となるように、第1の確信度マップをエンコードする工程から成る、構成(22)のコンピュータ可読記憶媒体。
【0101】
(24)第1の画像データは、複数のピクセルから成り、視差マップは、ピクセルの各々についての視差データから成り、確信度マップは、ピクセルの各々についての確信度データから成る、構成(22)または構成(23)のコンピュータ可読記憶媒体。
【0102】
(25)方法は、コンピュータプロセッサが、シーンの少なくとも一部分の第2の画像データに対応する第2の確信度マップを獲得する工程と、コンピュータプロセッサが、ビデオストリームを、スーパフレームのシーケンスとして出力する工程であって、各スーパフレームは、第1の視差マップと、第1の確信度マップと、第2の確信度マップとに基づいた情報から成る、工程とからさらに成る、構成(22)乃至(24)のうちのいずれか1つのコンピュータ可読記憶媒体。
【0103】
(26)方法は、コンピュータプロセッサが、ビデオストリームの情報に基づいて、車両の電子制御ユニット(ECU)に対して、制御信号を出力する工程からさらに成る、構成(22)乃至(25)のうちのいずれか1つのコンピュータ可読記憶媒体。
【0104】
(27)方法は、コンピュータプロセッサが、第1の視差マップと、第1の確信度マップとを獲得するために、第1の画像データを処理する工程と、コンピュータプロセッサが、第2の確信度マップを獲得するために、第2の画像データを処理する工程とからさらに成る、構成(22)乃至(26)のうちのいずれか1つのコンピュータ可読記憶媒体。
【0105】
(28)ビデオストリームを出力する工程は、コンピュータプロセッサが、第1の視差マップと、第1の確信度マップとから成るように、少なくとも1つのスーパフレームを準備する工程と、コンピュータプロセッサが、第1の視差マップと、第2の確信度マップとから成るように、少なくとも1つのスーパフレームを準備する工程とから成る、構成(22)乃至(27)のうちのいずれか1つのコンピュータ可読記憶媒体。
【0106】
(29)ビデオストリームを出力する工程は、コンピュータプロセッサが、第1の確信度マップの一部分と、第2の確信度マップの一部分とから成る、少なくとも1つのスーパフレームを準備する工程から成る、構成(22)乃至(28)のうちのいずれか1つのコンピュータ可読記録媒体。
【0107】
(30)第1の画像データは、ステレオビジョンデータから成り、第2の画像データは、ライダデータ、またはレーダデータ、または音響データから成る、構成(22)乃至(29)のうちのいずれか1つのコンピュータ可読記憶媒体。
【0108】
(31)ビデオストリームを出力する工程は、コンピュータプロセッサが、シーンの2次元(2D)画像と、シーンの深度マップと、シーンの確実性マップとから成るように、ビデオストリームの各スーパフレームを準備する工程から成る、構成(22)乃至(30)のうちのいずれか1つのコンピュータ可読記憶媒体。
【0109】
(32)コンピュータプロセッサによって、各スーパフレームを準備する工程は、シーンの2D画像のピクセルと、シーンの深度マップのピクセルと、シーンの確実性マップのピクセルとを、時間的および空間的にマッチさせる工程から成る、構成(22)乃至(31)のうちのいずれか1つのコンピュータ可読記憶媒体。
【0110】
(33)ビデオストリームを出力する工程は、コンピュータプロセッサが、ビデオストリームのデータサイズを下げるために、第1の視差マップからの視差情報、ならびに第1の確信度マップおよび第2の確信度マップからの確信度情報をエンコードする工程から成る、構成(22)乃至(32)のうちのいずれか1つのコンピュータ可読記憶媒体。
【0111】
(34)ビデオストリームを出力する工程は、各2Dカラー画像が、複数のピクセルから成り、各ピクセルのアルファチャンネル透明度が、ピクセルについての確信度値に比例し、2Dカラー画像のカラーが、深度範囲を示すように、2次元(2D)カラー画像を準備する工程から成る、構成(22)乃至(33)のうちのいずれか1つのコンピュータ可読記憶媒体。
【0112】
本願明細書において説明される技術による、ステレオビジョンシステムは、異なる構成で具現化され得る。例となる構成は、以下のような構成(35)乃至(46)の組み合わせを含む。
【0113】
(35)画像のペアのシーケンスをキャプチャするように構成された、ステレオカメラシステムであって、画像の各ペアは、同時にキャプチャされた、第1の画像と、第2の画像とから成る、ステレオカメラシステムと、コンピュータプロセッサであって、ステレオカメラシステムから、画像データのストリームを受信することであって、画像データは、画像のペアのシーケンスに対応する、受信することと、画像のペアの各々について、マッチさせられたピクセルの2次元(2D)ピクセルマップを生成するために、第1の画像と、第2の画像とを平行化することと、ピクセルマップの各ピクセルについて、深度値を決定することと、ピクセルマップの各ピクセルについて、深度値についての確信度値を決定することと、確信度値のうちの少なくとも1つが、画像異常を示すとき、制御信号を発行することとを行うようにプログラムされた、コンピュータプロセッサとを備える、ステレオビジョンシステム。
【0114】
(36)画像異常は、事前決定された閾値を下回る確信度値を有する、確信度マップの一部分の1つまたは複数のピクセルに対応する、構成(35)のシステム。
(37)画像異常は、シーケンスの画像の2つ以上の連続するペアについて、事前決定された閾値を下回る確信度値を有する、確信度マップの一部分の1つまたは複数のピクセルに対応する、構成(35)または構成(36)のシステム。
【0115】
(38)画像異常は、確信度マップの隣接する領域の複数のピクセルから成る、構成(35)乃至(37)のうちのいずれか1つのシステム。
(39)制御信号は、可聴音を引き起こすように構成される、構成(35)乃至(38)のうちのいずれか1つのシステム。
【0116】
(40)可聴音は、事前記録されたメッセージである、構成(35)乃至(39)のうちのいずれか1つのシステム。
(41)制御信号は、車両のエンジン制御モジュールに対して発行される、構成(35)乃至(40)のうちのいずれか1つのシステム。
【0117】
(42)ピクセルマップの各ピクセルについて、確信度値は、ピクセルにおけるエッジの有無、ピクセルの照度レベル、ならびにピクセルマップがそれから生成された第1の画像および第2の画像のテクスチャ値に基づいて決定される、構成(35)乃至(41)のうちのいずれか1つのシステム。
【0118】
(43)コンピュータプロセッサは、画像のペアのシーケンスに対応する、スーパフレームのシーケンスを出力するようにプログラムされ、スーパフレームの各々は、2D画像と、2D画像に対応する確信度マップとから成る、構成(35)乃至(42)のうちのいずれか1つのシステム。
【0119】
(44)2D画像は、第1の画像、または第2の画像である、構成(35)乃至(43)のうちのいずれか1つのシステム。
(45)コンピュータプロセッサは、スーパフレームのシーケンスを、2D画像と、確信度マップに対応する可視的な確信度インジケータとを示すことをディスプレイに行わせる、表示信号として出力するようにプログラムされる、構成(35)乃至(44)のうちのいずれか1つのシステム。
【0120】
(46)表示信号は、確信度インジケータを、2D画像の各ピクセルの透明度として、ピクセルごとに、表示させる、構成(35)乃至(45)のうちのいずれか1つのシステム。
【0121】
非一時的コンピュータ可読記憶媒体は、コンピュータプロセッサによって遂行されたときに、コンピュータプロセッサに、本願明細書において説明される技術による、車両支援システムの方法を実行させるコードを記憶するように構成され得る。そのようなコンピュータ可読記憶媒体の例は、以下のような構成(47)乃至(59)の組み合わせを含む。
【0122】
(47)コンピュータプロセッサによって遂行されたときに、コンピュータプロセッサに、ステレオビジョンシステムの方法を実行させるコードを記憶した、非一時的コンピュータ可読記憶媒体であって、方法は、コンピュータプロセッサが、ステレオカメラシステムから、画像データのストリームを受信する工程であって、画像データは、画像のペアのシーケンスに対応し、画像の各ペアは、同時にキャプチャされた、第1の画像と、第2の画像とから成る、工程と、画像のペアの各々について、コンピュータプロセッサが、マッチさせられたピクセルの2次元(2D)ピクセルマップを生成するために、第1の画像と、第2の画像とを平行化する工程と、ピクセルマップの各ピクセルについて、深度値を決定する工程と、ピクセルマップの各ピクセルについて、深度値についての確信度値を決定する工程と、確信度マップのうちの少なくとも1つが、画像異常を示すとき、コンピュータプロセッサが、制御信号を発行する工程とから成る、非一時的コンピュータ可読記憶媒体。
【0123】
(48)画像異常は、事前決定された閾値を下回る確信度値を有する、確信度マップの一部分の1つまたは複数のピクセルに対応する、構成(47)のコンピュータ可読記憶媒体。
【0124】
(49)画像異常は、シーケンスの画像の2つ以上の連続するペアについて、事前決定された閾値を下回る確信度値を有する、確信度マップの一部分の1つまたは複数のピクセルに対応する、構成(47)または構成(48)のコンピュータ可読記憶媒体。
【0125】
(50)画像異常は、確信度マップの隣接する領域の複数のピクセルから成る、構成(47)乃至(49)のうちのいずれか1つのコンピュータ可読記憶媒体。
(51)制御信号は、可聴音を引き起こすように構成される、構成(47)乃至(50)のうちのいずれか1つのコンピュータ可読記憶媒体。
【0126】
(52)可聴音は、事前記録されたメッセージである、構成(47)乃至(51)のうちのいずれか1つのコンピュータ可読記憶媒体。
(53)制御信号は、車両のエンジン制御モジュールに対して発行される、構成(47)乃至(52)のうちのいずれか1つのコンピュータ可読記憶媒体。
【0127】
(54)ピクセルマップの各ピクセルについて、確信度値は、ピクセルにおけるエッジの有無、ピクセルの照度レベル、ならびにピクセルマップがそれから生成された第1の画像および第2の画像のテクスチャ値に基づいて決定される、構成(47)乃至(53)のうちのいずれか1つのコンピュータ可読記憶媒体。
【0128】
(55)方法は、コンピュータプロセッサが、画像のペアのシーケンスに対応する、スーパフレームのシーケンスを出力する工程であって、スーパフレームの各々は、2D画像と、2D画像に対応する視差マップと、2D画像に対応する確信度マップとから成る、工程からさらに成る、構成(47)乃至(54)のうちのいずれか1つのコンピュータ可読記憶媒体。
【0129】
(56)2D画像は、第1の画像、または第2の画像である、構成(47)乃至(55)のうちのいずれか1つのコンピュータ可読記憶媒体。
(57)スーパフレームのシーケンスを出力する工程は、2D画像と、確信度マップに対応する可視的な確信度インジケータとを示すことをディスプレイに行わせる、表示信号を出力する工程から成る、構成(47)乃至(56)のうちのいずれか1つのコンピュータ可読記憶媒体。
【0130】
(58)表示信号は、確信度インジケータを、2D画像の各ピクセルの透明度として、ピクセルごとに、表示させる、構成(47)乃至(57)のうちのいずれか1つのコンピュータ可読記憶媒体。
【0131】
(59)スーパフレームの各々は、2D画像と、確信度マップと、2D画像に対応する視差マップとから成る、構成(47)乃至(58)のうちのいずれか1つのコンピュータ可読記憶媒体。
【0132】
結び
様々な改変、変更、および改良が、上で議論された構造、構成、および方法に対して行われることができ、本願明細書において開示された本発明の主旨および範囲内にあることが意図されていることが理解されるべきである。さらに、本発明の利点が示されたが、本発明のあらゆる実施形態が、あらゆる説明された利点を含むわけではないことが認識されるべきである。いくつかの実施形態は、本願明細書において有利であるとして説明されたいずれかの特徴を実施しないことがある。したがって、上述の説明および添付の図面は、例としてのものにすぎない。
【0133】
本技術のいくつかの態様は、1つまたは複数の方法として具現化され得、本技術の方法の一部として実行される行為は、任意の適切なやり方で、順序付けられ得ることが理解されるべきである。したがって、様々な実施形態において、順次的な行為として示され、および/または説明されるにもかかわらず、いくつかの行為を同時に実行することを含み得る、示されたのと、および/または説明されたのと異なる順序で行為が実行される実施形態が構築され得る。
【0134】
本発明の様々な態様は、単独で、組み合わせて、または上で説明された実施形態において具体的には議論されなかった様々な配置で使用され得、したがって、それの適用の際、上述の説明において規定された、または図面において例示された、構成要素の詳細および配置に限定されない。例えば、1つの実施形態において説明された態様は、他の実施形態において説明された態様と、任意の方式で、組み合わされ得る。
【0135】
要素を修飾するための、説明および特許請求の範囲における、「第1の」、「第2の」、「第3の」などの序数用語の使用は、それ自体では、1つの要素が別の要素よりも上位である、いかなる優先順位、優先権、もしくは順序も、または方法の行為が実行される時間的順序を含意せず、ある名前を有する1つの要素または行為を、(序数用語を使用しなければ)同じ名前を有する別の要素または行為から区別して、要素または行為を区別するためのラベルとして使用されるにすぎない。
【0136】
本願明細書において定義され、使用されるような、すべての定義は、辞書の定義、本願明細書に援用される文書における定義、および/または定義された用語の通常の意味よりも優先されると理解されるべきである。
【0137】
本願明細書および特許請求の範囲において使用される場合、不定冠詞「a」および「an」は、明確に反対のことを示していない限り、「少なくとも1つ」を意味すると理解されるべきである。
【0138】
本願明細書および特許請求の範囲において使用される場合、1つまたは複数の要素のリストへの言及における、「少なくとも1つ」という語句は、要素のリスト内の要素のうちのいずれか1つまたは複数から選択された、少なくとも1つの要素を意味するが、必ずしも、要素のリスト内に具体的に列挙された、ありとあらゆる要素の少なくとも1つを含むとは限らず、要素のリスト内の要素の任意の組み合わせを除外しないと理解されるべきである。この定義は、「少なくとも1つ」という語句が言及する、要素のリスト内において具体的に識別された要素以外の要素が、具体的に識別されたそれらの要素に関係があるか、それとも関係がないかにかかわらず、任意選択で存在し得ることも許容する。
【0139】
本願明細書および特許請求の範囲において使用される場合、2つの値(例えば、距離、幅など)への言及における、「等しい」または「同じ」という語句は、2つの値が、製造公差内で同じであることを意味する。したがって、等しい、または同じである、2つの値は、2つの値が、±5%だけ互いに異なることを意味し得る。
【0140】
本願明細書および特許請求の範囲で使用される場合の「および/または」という語句は、そのように等位接続された要素の「どちらかまたは両方」、すなわち、いくつかのケースにおいては連言的に存在し、他のケースにおいては選言的に存在する要素を意味すると理解されるべきである。「および/または」を用いて列挙された多数の要素は、同じやり方で、すなわち、そのように等位接続された要素のうちの「1つまたは複数」と解釈されるべきである。「および/または」節によって具体的に識別された要素以外の他の要素が、具体的に識別されたそれらの要素に関係があるか、それとも関係がないかにかかわらず、任意選択で存在し得る。したがって、非限定的な例として、「Aおよび/またはB」に対する言及は、「備える」などのオープンエンド語と併せて使用されるとき、1つの実施形態においては、Aだけに(任意選択でB以外の要素を含む)、別の実施形態においては、Bだけに(任意選択でA以外の要素を含む)、また別の実施形態においては、AとBの両方に(任意選択で他の要素を含む)言及するなどすることができる。
【0141】
本願明細書および特許請求の範囲において使用される場合、「または」は、上で定義された「および/または」と同じ意味を有すると理解されるべきである。例えば、リスト内の項目を分離するとき、「または」または「および/または」は、包含的であると、すなわち、数々の要素または要素のリストのうちの、2つ以上も含む、少なくとも1つ、および任意選択で、追加の列挙されていない項目を含むと解釈されるものとする。「ただ1つの」、もしくは「正確に1つの」など、明確に反対のことを示す用語だけが、または特許請求の範囲において使用されたときの「から成る」が、数々の要素または要素のリストのうちの正確に1つを含むことに言及している。一般に、本願明細書において使用される場合の「または」という用語は、「どちらか」、「1つの」、「ただ1つの」、または「正確に1つの」などの、排他性の用語によって先行されるときだけ、排他的選択肢(すなわち、「一方または他方であって、両方ではない」)を示すと解釈されるものとする。特許請求の範囲において使用されるときの「から原則的に成る」は、特許法の分野で使用されるような、それの通常の意味を有するものとする。
【0142】
また、本願明細書において使用される言葉遣いおよび専門用語は、説明の目的のためのものであり、限定的なものと見なされるべきではない。本願明細書における、「含む」、「備える」、「から成る」、「有する」、「包含する」、および「伴う」などの用語、およびそれらの変形の使用は、その後に列挙される項目、およびそれらの均等物、ならびに追加の項目を包含することを意味する。
【0143】
本願明細書において使用される場合の「近似的に」および「約」という用語は、いくつかの実施形態においては、目標値の±20%以内、いくつかの実施形態においては、目標値の±10%以内、いくつかの実施形態においては、目標値の±5%以内、およびいくつかの実施形態においては、目標値の±2%以内を意味すると解釈され得る。「近似的に」および「約」という用語は、目標値に等しくてよい。
【0144】
本願明細書において使用される場合の「実質的に」という用語は、いくつかの実施形態においては、目標値の95%以内、いくつかの実施形態においては、目標値の98%以内、いくつかの実施形態においては、目標値の99%以内、およびいくつかの実施形態においては、目標値の99.5%以内を意味すると解釈され得る。いくつかの実施形態においては、「実質的に」という用語は、目標値の100%に等しくてよい。
図1
図2
図3
図4A
図4B
図5
図6
図7A
図7B
図7C
図7D
図7E
図7F
図8A
図8B
図9A
図9B