IP Force 特許公報掲載プロジェクト 2022.1.31 β版

知財求人 - 知財ポータルサイト「IP Force」

▶ ビーエヌエスエフ レイルウェイ カンパニーの特許一覧

特許7405338遷移画像を使用してオブジェクトを再構成するためのシステム及び方法
<>
  • 特許-遷移画像を使用してオブジェクトを再構成するためのシステム及び方法 図1
  • 特許-遷移画像を使用してオブジェクトを再構成するためのシステム及び方法 図2
  • 特許-遷移画像を使用してオブジェクトを再構成するためのシステム及び方法 図3
  • 特許-遷移画像を使用してオブジェクトを再構成するためのシステム及び方法 図4
  • 特許-遷移画像を使用してオブジェクトを再構成するためのシステム及び方法 図5
  • 特許-遷移画像を使用してオブジェクトを再構成するためのシステム及び方法 図6
  • 特許-遷移画像を使用してオブジェクトを再構成するためのシステム及び方法 図7
< >
(19)【発行国】日本国特許庁(JP)
(12)【公報種別】特許公報(B2)
(11)【特許番号】
(24)【登録日】2023-12-18
(45)【発行日】2023-12-26
(54)【発明の名称】遷移画像を使用してオブジェクトを再構成するためのシステム及び方法
(51)【国際特許分類】
   G06T 3/00 20060101AFI20231219BHJP
   G06T 1/00 20060101ALI20231219BHJP
   G06T 7/00 20170101ALI20231219BHJP
【FI】
G06T3/00 780
G06T1/00 330A
G06T7/00 650A
【請求項の数】 17
(21)【出願番号】P 2022581595
(86)(22)【出願日】2021-05-12
(65)【公表番号】
(43)【公表日】2023-10-18
(86)【国際出願番号】 US2021031892
(87)【国際公開番号】W WO2022005622
(87)【国際公開日】2022-01-06
【審査請求日】2023-02-28
(31)【優先権主張番号】16/917,590
(32)【優先日】2020-06-30
(33)【優先権主張国・地域又は機関】US
【早期審査対象出願】
(73)【特許権者】
【識別番号】505220284
【氏名又は名称】ビーエヌエスエフ レイルウェイ カンパニー
【住所又は居所原語表記】2500 Lou Menk Drive, Fort Worth, Texas 76131 U.S.A.
(74)【代理人】
【識別番号】100120662
【弁理士】
【氏名又は名称】川上 桂子
(74)【代理人】
【識別番号】100216770
【弁理士】
【氏名又は名称】三品 明生
(74)【代理人】
【識別番号】100217364
【弁理士】
【氏名又は名称】田端 豊
(74)【代理人】
【識別番号】100180529
【弁理士】
【氏名又は名称】梶谷 美道
(72)【発明者】
【氏名】コーラー、 レイチェル
【審査官】岡本 俊威
(56)【参考文献】
【文献】特開2005-038035(JP,A)
(58)【調査した分野】(Int.Cl.,DB名)
G06T 1/00
G06T 3/00
G06T 7/00
(57)【特許請求の範囲】
【請求項1】
装置であって、
1つ以上のプロセッサと、
前記1つ以上のプロセッサに結合された1つ以上のコンピュータ可読非一時的記憶媒体であって、前記1つ以上のプロセッサによって実行されると、前記装置に処理を実行させる命令を含む1つ以上のコンピュータ可読非一時的記憶媒体と、
を含み、
前記処理は、
輸送インフラ構成要素の第1画像、及び前記輸送インフラ構成要素の第2画像を受信する処理であって、前記第1画像は、オブジェクトの第1領域を含み、前記第2画像は、前記オブジェクトの第2領域を含む処理と、
遷移画像を識別する処理であって、前記遷移画像は、前記オブジェクトの第1領域、及び前記オブジェクトの第2領域を含む処理と、
前記遷移画像内の前記オブジェクトの第1領域、及び前記第1画像内の前記オブジェクトの第1領域が第1等価領域であると決定する処理と、
前記第1画像及び前記遷移画像を使用して前記オブジェクトの再構成を生成する処理と、
を含み、
前記オブジェクトの再構成は、前記オブジェクトの第1領域及び前記オブジェクトの第2領域を含み、
前記オブジェクトの再構成は、前記第1等価領域の重複を除外し、
前記第1画像内の前記オブジェクトの第1部分を識別する処理と、
前記第1画像内の前記オブジェクトの第1部分の周辺に第1バウンディングボックスを構成する処理であって、前記第1バウンディングボックスは前記オブジェクトの第1領域を含む処理と、
前記遷移画像内の前記オブジェクトの第2部分を識別する処理と、
前記遷移画像内の前記オブジェクトの第2部分の周辺に第2バウンディングボックスを構成する処理であって、前記第2バウンディングボックスは、前記遷移画像内の前記オブジェクトの第1領域及び前記オブジェクトの第2領域を含む処理と、
を含む、
装置。
【請求項2】
前記第1画像は、前記オブジェクトの第3領域、前記オブジェクトの第4領域、及び前記オブジェクトの第5領域をさらに含み、
前記遷移画像は、前記オブジェクトの第3領域及び前記オブジェクトの第4領域を含む
請求項1に記載の装置。
【請求項3】
前記処理は、
前記遷移画像内の前記オブジェクトの第3領域及び前記第1画像内の前記オブジェクトの第3領域が第3等価領域であると決定する処理と、
前記遷移画像内の前記オブジェクトの第4領域及び前記第1画像内の前記オブジェクトの第4領域が第4等価領域であると決定する処理と、
を含み、
前記オブジェクトの再構成は、前記第3及び第4等価領域を除外する、請求項2に記載の装置。
【請求項4】
前記処理は、前記オブジェクトの再構成を生成するために、前記オブジェクトの第1領域、前記オブジェクトの第2領域、前記オブジェクトの第3領域、前記オブジェクトの第4領域、及び前記オブジェクトの第5領域を連結する処理をさらに含み、前記オブジェクトの再構成は、前記オブジェクト全体を示す、請求項2に記載の装置。
【請求項5】
前記処理は、前記遷移画像内の前記オブジェクトの第1領域及び前記第1画像内の前記オブジェクトの第1領域が前記第1等価領域であることを決定するために、IoU(Intersection over Union)を使用する処理をさらに含む、請求項1に記載の装置。
【請求項6】
前記遷移画像は、前記第1画像の半分及び前記第2画像の半分を含む、請求項1に記載の装置。
【請求項7】
方法であって、
オブジェクト再構成モジュールによって、輸送インフラ構成要素の第1画像と、輸送インフラ構成要素の第2画像を受信する処理であって、前記第1画像は、オブジェクトの第1領域を含み、前記第2画像は、前記オブジェクトの第2領域を含むステップと、
前記オブジェクト再構成モジュールによって、遷移画像を識別するステップであって、前記遷移画像は、前記オブジェクトの第1領域及び前記オブジェクトの第2領域を含むステップと、
前記オブジェクト再構成モジュールによって、前記遷移画像内の前記オブジェクトの第1領域及び前記第1画像内の前記オブジェクトの第1領域が第1等価領域であると決定するステップと、
前記オブジェクト再構成モジュールによって、前記第1画像及び前記遷移画像を使用して前記オブジェクトの再構成を生成するステップと、
を含み、
前記オブジェクトの再構成は、前記オブジェクトの第1領域及び前記オブジェクトの第2領域を含み、
前記オブジェクトの再構成は、前記第1等価領域の重複を除外し、
前記オブジェクト再構成モジュールによって、前記第1画像内の前記オブジェクトの第1部分を識別するステップと、
前記オブジェクト再構成モジュールによって、前記第1画像内の前記オブジェクトの第1部分の周辺に第1バウンディングボックスを構成するステップであって、前記第1バウンディングボックスは、前記オブジェクトの第1領域を含むステップと、
前記オブジェクト再構成モジュールによって、前記遷移画像内の前記オブジェクトの第2部分を識別するステップと、
前記オブジェクト再構成モジュールによって、前記遷移画像内の前記オブジェクトの第2部分の周辺に第2バウンディングボックスを構成するステップであって、前記第2バウンディングボックスは、前記遷移画像内の前記オブジェクトの第1領域及び前記オブジェクトの第2の領域を含むステップと、
を含む、
方法。
【請求項8】
前記第1画像は、
前記オブジェクトの第3領域、前記オブジェクトの第4領域、及び前記オブジェクトの第5領域をさらに含み、
前記遷移画像は、
前記オブジェクトの第3領域、及び前記オブジェクトの第4領域を含む、
請求項7に記載の方法。
【請求項9】
前記オブジェクト再構成モジュールによって、前記遷移画像内の前記オブジェクトの第3領域、及び前記第1画像内の前記オブジェクトの第3領域が第3等価領域であると決定するステップと、
前記オブジェクト再構成モジュールによって、前記遷移画像内の前記オブジェクトの第4領域、及び前記第1画像内の前記オブジェクトの第4領域が第4等価領域であると決定するステップと、
をさらに含み、
前記オブジェクトの再構成は、前記第3及び第4等価領域を除外する、
請求項8に記載の方法。
【請求項10】
前記方法は、
前記オブジェクト再構成モジュールによって、前記オブジェクトの再構成を生成するために、前記オブジェクトの第1領域、前記オブジェクトの第2領域、前記オブジェクトの第3領域、前記オブジェクトの第4領域、及び前記オブジェクトの第5領域を連結するステップをさらに含み、
前記オブジェクトの再構成は、前記オブジェクト全体を示す、
請求項8に記載の方法。
【請求項11】
前記遷移画像内の前記オブジェクトの第1領域及び前記第1画像内の前記オブジェクトの第1領域が前記第1等価領域であることを決定するために、IoU(Intersection over Union)を使用するステップをさらに含む、請求項7に記載の方法。
【請求項12】
前記遷移画像は、前記第1画像の半分及び前記第2画像の半分を含む、請求項7に記載の方法。
【請求項13】
プロセッサによって実行されると、前記プロセッサに処理を実行させる命令を具現化する1つ以上のコンピュータ可読非一時的記憶媒体であって、
前記処理は、
オブジェクト再構成モジュールによって、輸送インフラ構成要素の第1画像、及び前記輸送インフラ構成要素の第2画像を受信する処理であって、前記第1画像は、オブジェクトの第1領域を含み、前記第2画像は、前記オブジェクトの第2領域を含む処理と、
前記オブジェクト再構成モジュールによって、遷移画像を識別する処理であって、前記遷移画像は、前記オブジェクトの第1領域、及び前記オブジェクトの第2領域を含む処理と、
前記オブジェクト再構成モジュールによって、前記遷移画像内の前記オブジェクトの第
1領域、及び前記第1画像内の前記オブジェクトの第1領域が第1等価領域であると決定する処理と、
前記オブジェクト再構成モジュールによって、前記第1画像及び前記遷移画像を使用して前記オブジェクトの再構成を生成する処理と、
を含み、
前記オブジェクトの再構成は、前記オブジェクトの第1領域及び前記オブジェクトの第2領域を含み、
前記オブジェクトの再構成は、前記第1等価領域の重複を除外し、
前記オブジェクト再構成モジュールによって、前記第1画像内の前記オブジェクトの第1部分を識別する処理と、
前記オブジェクト再構成モジュールによって、前記第1画像内の前記オブジェクトの第1部分の周辺に第1バウンディングボックスを構成する処理であって、前記第1バウンディングボックスは、前記オブジェクトの第1領域を含む処理と、
前記オブジェクト再構成モジュールによって、前記遷移画像内の前記オブジェクトの第2部分を識別する処理と、
前記オブジェクト再構成モジュールによって、前記遷移画像内の前記オブジェクトの第2部分の周辺に第2バウンディングボックスを構成する処理であって、第2バウンディングボックスは、前記遷移画像内の前記オブジェクトの前記第1領域及び前記オブジェクトの前記第2領域を含む処理と、
を含む、
コンピュータ可読非一時的記憶媒体。
【請求項14】
前記第1画像は、前記オブジェクトの第3領域、前記オブジェクトの第4領域、及び前記オブジェクトの第5領域をさらに含み、
前記遷移画像は、前記オブジェクトの第3領域及び前記オブジェクトの第4領域を含む、
請求項13に記載のコンピュータ可読非一時的記憶媒体。
【請求項15】
前記処理は、
前記オブジェクト再構成モジュールによって、前記遷移画像内の前記オブジェクトの第3領域、及び前記第1画像内の前記オブジェクトの第3領域が第3等価領域であると決定する処理と、
前記オブジェクト再構成モジュールによって、前記遷移画像内の前記オブジェクトの第4領域、及び前記第1画像内の前記オブジェクトの第4領域が第4等価領域であると決定する処理と、
をさらに含み、
前記オブジェクトの再構成は、前記第3及び第4等価領域を除外する、
請求項14に記載のコンピュータ可読非一時的記憶媒体。
【請求項16】
前記処理は、
前記オブジェクト再構成モジュールによって、前記オブジェクトの再構成を生成するために、前記オブジェクトの第1領域、前記オブジェクトの第2領域、前記オブジェクトの第3領域、前記オブジェクトの第4領域、及び前記オブジェクトの第5領域を連結する処理をさらに含み、
前記オブジェクトの再構成は、オブジェクト全体を示す、
請求項14に記載のコンピュータ可読非一時的記憶媒体。
【請求項17】
前記処理は、
前記遷移画像内の前記オブジェクトの第1領域及び前記第1画像内の前記オブジェクトの第1領域が前記第1等価領域であることを決定するために、IoU(Intersec
tion over Union)を使用する処理をさらに含む、請求項13に記載のコンピュータ可読非一時的記憶媒体。
【発明の詳細な説明】
【技術分野】
【0001】
本開示は、一般にオブジェクト再構成(reconstructing object)に関し、特に遷移画像(transitional image)を使用してオブジェクトを再構成するシステム及び方法に関する。
【背景技術】
【0002】
オブジェクト検出モデル(Object detection model)は、大量の画像データを処理すると共に各画像を独立的に類推する。深層学習モデル(deep learning model)の速度と精度の間には、本質的なトレードオフ(tradeoff)が存在する。このトレードオフは、サイズが劇的に変化するオブジェクト及び/又は全体のピクセルデータの比率が非常に小さいオブジェクトの一部を検出するようにモデルを訓練するときに増幅される。オブジェクト検出モデルは、複数の画像内のオブジェクトを正確に識別するように訓練することができるが、特定のシステムでは、オブジェクトの非常に小さな部分を正確に検出することにともなう遅延ペナルティ(latency penalty)を許容することができない。
【発明の概要】
【課題を解決するための手段】
【0003】
一実施形態によれば、方法は、オブジェクト再構成モジュール(object reconstruction module)によって、第1画像及び第2画像を受信するステップを含む。第1画像は、オブジェクトの第1領域を含み、第2画像は、オブジェクトの第2領域を含む。この方法はまた、オブジェクト再構成モジュールによって、遷移画像を識別するステップを含む。遷移画像は、オブジェクトの第1領域及びオブジェクトの第2領域を含む。方法はまた、オブジェクト再構成モジュールによって、遷移画像内のオブジェクトの第1領域及び第1画像内のオブジェクトの第1領域が第1等価領域(first equivalent region)であると決定するステップと、オブジェクト再構成モジュールによって、第1画像及び遷移画像を使用してオブジェクトの再構成(reconstruction)を生成するステップとを含む。オブジェクトの再構成は、オブジェクトの第1領域及びオブジェクトの第2領域を含み、第1等価領域を除外する。
【0004】
特定の実施形態では、第1画像は、オブジェクトの第3領域、オブジェクトの第4領域、及びオブジェクトの第5領域をさらに含み、遷移画像は、オブジェクトの第3領域、及びオブジェクトの第4領域を含む。いくつかの実施形態では、方法は、オブジェクト再構成モジュールによって、遷移画像内のオブジェクトの第3領域、及び第1画像内のオブジェクトの第3領域を決定するステップを含む。画像は、第3等価領域であり、オブジェクト再構成モジュールによって、遷移画像内のオブジェクトの第4領域、及び第1画像内のオブジェクトの第4領域が第4等価領域であると決定する。特定の実施形態では、オブジェクトの再構成は、第3及び第4領域を除外する。いくつかの実施形態では、方法は、オブジェクト再構成モジュールによって、オブジェクトの再構成を生成するために、オブジェクトの第1領域、オブジェクトの第2領域、オブジェクトの第3領域、オブジェクトの第4領域、及びオブジェクトの第5領域を連結するステップを含み、ここでオブジェクトの再構成は、オブジェクト全体を示す。
【0005】
特定の実施形態では、方法は、オブジェクト再構成モジュールによって、第1画像内のオブジェクトの第1部分(first portion)を識別するステップと、オブジェクト再構成モジュールによって、第1画像内のオブジェクトの第1部分の周辺に第1バウンディングボックス(first bounding box)を構成するステップとを含む。第1バウンディングボックスは、オブジェクトの第1領域を含み得る。いくつかの実施形態では、方法は、オブジェクト再構成モジュールによって、遷移画像内のオブジェクトの第2部分を識別するステップと、オブジェクト再構成モジュールによって、遷移画像内のオブジェクトの第2部分の周辺に第2バウンディングボックスを構成するステップとを含む。第2バウンディングボックスは、オブジェクトの第1領域及びオブジェクトの第2領域を含み得る。特定の実施形態では、方法は、遷移画像内のオブジェクトの第1領域及び第1画像内のオブジェクトの第1領域が等価領域であることを決定するために、IoU(Intersection over Union)を使用する処理を含む。いくつかの実施形態では、遷移画像は、第1画像の半分及び第2画像の半分を含む。
【0006】
他の実施形態によれば、装置は、1つ以上のプロセッサと、1つ以上のプロセッサに結合された1つ以上のコンピュータ可読非一時的記憶媒体(computer-readable non-transitory storage media)とを含む。1つ以上のコンピュータ可読非一時的記憶媒体は、1つ以上のプロセッサによって実行されると、第1画像及び第2画像の受信を含む処理を装置に実行させる命令を含む。第1画像は、オブジェクトの第1領域を含み、第2画像は、オブジェクトの第2領域を含む。処理は、遷移画像を識別する処理も含む。遷移画像は、オブジェクトの第1領域及びオブジェクトの第2領域を含む。処理はまた、遷移画像内のオブジェクトの第1領域及び第1画像内のオブジェクトの第1領域が第1等価領域であると決定する処理と、第1画像及び遷移画像を使用してオブジェクトの再構成を生成する処理とを含む。オブジェクトの再構成は、オブジェクトの第1領域及びオブジェクトの第2領域を含み、第1等価領域を除外する。
【0007】
また他の実施形態によれば、1つ以上のコンピュータ可読記憶媒体は、プロセッサによって実行されると、オブジェクト再構成モジュールによって、第1画像及び第2画像を受信する処理を含む処理をプロセッサに実行させる命令を具現化する。第1画像は、オブジェクトの第1領域を含み、第2画像は、オブジェクトの第2領域を含む。処理はまた、オブジェクト再構成モジュールによって、遷移画像を識別する処理を含む。遷移画像は、オブジェクトの第1領域及びオブジェクトの第2領域を含む。処理はまた、オブジェクト再構成モジュールによって、遷移画像内のオブジェクトの第1領域、及び第1画像内のオブジェクトの第1領域が第1等価領域であると決定する処理と、オブジェクト再構成モジュールによって、第1画像及び遷移画像を使用してオブジェクトの再構成を生成する処理とを含む。オブジェクトの再構成は、オブジェクトの第1領域及びオブジェクトの第2領域を含み、第1等価領域を除外する。
【0008】
本開示の特定の実施形態の技術的利点は、以下のうちの1つ以上を含み得る。本開示は、遷移画像を使用してオブジェクトを再構成するシステム及び方法について説明する。特定の実施形態では、オブジェクトを再構成するために使用されるバウンディングボックス縮小アルゴリズムは、単一画像及び単一類推結果内に含まれたバウンディングボックスを縮小するために、画像別に動作する標準の非最大抑制アルゴリズム(non-maximum suppression algorithms)と組み合わせて使用され得る。特定の実施形態では、遷移画像は、2つの画像を所定のパーセンテージで重ね合わせることによって生成される。本開示の特定の実施形態では、50%の所定のパーセンテージで使用されるが、本開示は、任意の適切な所定のパーセンテージ(例えば、25パーセント、75パーセントなど)を企図する。特定の実施形態では、本明細書に開示されたシステム及び方法は、2つ以上のボックス間のIoUスコア、検出ラベルの同等性、及び/又は信頼スコアの閾値などの縮小基準を使用し得る。
【0009】
本開示の特定の実施形態では、本明細書に開示されたシステム及び方法は、同じ画像内のいくつかのオブジェクトクラスにわたって使用され得る。例えば、いくつかの実施形態では、同じクラスに属するバウンディングボックスを論理的に縮小することができ、その結果、いくつかの完全に構成されたオブジェクトが生成されてもよい。特定の実施形態では、等価を算出するために、標準の非最大抑制アルゴリズムが使用される方法と同様に、IoUを使用して、バウンディングボックス及び/又は他の関心領域の等価領域を算出してもよい。本開示で説明するシステム及び方法は、鉄道、道路、及び水路を含む様々な運送インフラに一般化し得る。
【0010】
他の技術的利点は、以下の図面、説明、及び特許請求の範囲から当業者には容易に明らかになるであろう。さらに、特定の利点が上に列挙されているが、様々な実施形態は、列挙された利点の全部又は一部を含むか、全く含まなくてもよい。
【0011】
本開示内容の理解を助けるために、添付の図面と併せて以下の説明を参照する。
【図面の簡単な説明】
【0012】
図1】遷移画像を使用してオブジェクトを再構成するための例示的なシステムを示す図である。
図2図1のシステムによって使用され得る例示的な画像を示す図である。
図3図1のシステムによって使用され得る例示的な遷移画像を示す図である。
図4図1のシステムによって決定され得る例示的な等価領域を示す図である。
図5図1のシステムによって生成され得るオブジェクト再構成の例を示す図である。
図6】遷移画像を使用してオブジェクトを再構成する例示的な方法を示す図である。
図7】本明細書に記載のシステム及び方法によって使用され得る例示的なコンピュータシステムを示す図である。
【発明を実施するための形態】
【0013】
図1図7は、遷移画像を使用してオブジェクトを再構成するための例示的なシステム及び方法を示している。図1は、遷移画像を使用してオブジェクトを再構成するための例示的なシステムを示し、図2は、図1のシステムによって使用され得る例示的な画像を示している。図3は、図1のシステムによって使用され得る例示的な遷移画像を示し、図4は、図1のシステムによって決定され得る例示的な等価領域を示している。図5は、図1のシステムによって生成され得るオブジェクト再構成の例を示している。図6は、遷移画像を使用してオブジェクトを再構成する例示的な方法を示している。図7は、本明細書に記載のシステム及び方法によって使用され得る例示的なコンピュータシステムを示している。
【0014】
図1は、遷移画像を使用してオブジェクトを再構成するための例示的なシステム100を示す。システム100又はその一部は、組織(entity)に関連することができ、遷移画像を使用してオブジェクトを再構成する、企業、会社(例えば、鉄道会社、運送会社など)又は政府機関(例えば、運輸局、公安局など)のような任意の組織を含み得る。システム100の要素は、ハードウェア、ファームウェア、及びソフトウェアの任意の適切な組み合わせを使用して実現され得る。例えば、システム100の要素は、図7のコンピュータシステムの1つ以上の構成要素を使用して実現されてもよい。システム100は、ネットワーク110、鉄道環境(railway environment)120、鉄道線路130、鉄道車両140、画像キャプチャモジュール150、オブジェクト160、オブジェクト再構成モジュール170、画像172、遷移画像174、バウンディングボックス176、等価領域、及びオブジェクト再構成180を含む。
【0015】
ネットワーク110は、システム100の構成要素間の伝達を容易にする任意のタイプのネットワークであり得る。ネットワーク110の1つ以上の部分は、アドホックネットワーク、イントラネット、エクストラネット、仮想私設網(VPN)、ローカルエリアネットワーク(LAN)、無線LAN(WLAN)、広域ネットワーク(WAN)、無線WAN(WWAN)、大都市圏ネットワーク(MAN)、インターネットの一部、公衆交換電話網(PSTN)の一部、携帯電話網、3Gネットワーク、4Gネットワーク、5Gネットワーク、LTE(Long Term Evolution)セルラ通信網、これらの2つ以上の組み合わせ、又はその他の適切なタイプのネットワークを含み得る。ネットワーク110の1つ以上の部分は、1つ以上のアクセス(例えば、モバイルアクセス)、コア及び/又はエッジネットワークを含み得る。ネットワーク110は、私設網(private network)、公衆網(public network)、インターネットを介した接続、モバイルネットワーク、WI-FIネットワーク、ブルートゥース(登録商標)ネットワークなどの任意の通信網であり得る。システム100の1つ以上の構成要素は、ネットワーク110を介して伝達し得る。例えば、オブジェクト再構成モジュール170は、画像キャプチャモジュール150から情報を受信することを含め、ネットワーク110を介して伝達し得る。
【0016】
システム100の鉄道環境120は、1つ以上の鉄道線路130を含む領域である。鉄道環境120は、区画(division)及び/又は細区画(subdivision)に関連し得る。区画は、監督者の監督下にある鉄道の部分である。細区画は、区画のさらに小さな部分である。細区画は、作業員区域(crew district)及び/又は支線(branch line)であり得る。図1に示す実施形態では、鉄道環境120は、鉄道線路130、鉄道車両140、画像キャプチャモジュール150、及びオブジェクト160を含む。
【0017】
システム100の鉄道線路130は、鉄道車両140の車輪が転がるための表面を提供することによって、鉄道車両140が動くことを可能にする構造である。特定の実施形態では、鉄道線路130は、レール、締結装置、枕木、バラストなどを含む。システム100の鉄道車両140は、鉄道線路130に沿って移動できる車両である。鉄道車両140は、ジオメトリ車両、機関車、客車、貨車、有蓋車、長物車、タンク車などであってもよい。特定の実施形態では、鉄道車両140は、1つ以上の画像キャプチャモジュール150に関連付けられてもよい。
【0018】
システム100の画像キャプチャモジュール150は、オブジェクト160の画像172をキャプチャする構成要素である。システム100のオブジェクト160は、道路、鉄道、航空路、水路、運河、パイプライン、及びターミナル構成要素などの輸送インフラ構成要素である。オブジェクト160は、鉄道線路130、破片(debris)(例えば、瓦礫(rubble)、残骸(wreckage)、廃虚(ruins)、落葉(litter)、ゴミ(trash)、小枝(brush)など)、歩行者(例えば、侵入者(trespasser))、動物(animal)、植生(vegetation)、バラストなどの鉄道環境120内の構成要素を含み得る。オブジェクト160は、ジョイント(joint)、スイッチ(switch)、フロッグ(frog)、レールヘッド(rail head)、アンカー(anchor)、ファスナ(fastener)、ゲージプレート(gage plate)、バラスト(ballast)、枕木(例えば、コンクリート製の枕木及び木製の枕木)などの鉄道線路130の構成要素を含み得る。システム100の画像172は、1つ以上のオブジェクト160の物理的形態を示す。画像172は、デジタル画像、写真などを含み得る。画像172は、画像172a、画像172bなどを含み、画像172nまで続き、ここで、172nは、任意の適切な数を表す。
【0019】
画像キャプチャモジュール150は、1つ以上のカメラ、レンズ、センサ、光学装置、照明要素などを含み得る。例えば、画像キャプチャモジュール150は、オブジェクト160の画像172を自動でキャプチャする1つ以上のカメラ(例えば、高解像度カメラ、ラインスキャンカメラ、ステレオカメラなど)を含んでもよい。特定の実施形態では、画像キャプチャモジュール150は、鉄道車両140に取り付けられる。画像キャプチャモジュール150は、鉄道環境120の鮮明な視野を提供する任意の適所で鉄道車両140に取り付けられ得る。例えば、画像キャプチャモジュール150は、鉄道線路130の下向きのビューを提供するために、鉄道車両140の前方端部(例えば、フロントバンパ)に取り付けられてもよい。別の例として、画像キャプチャモジュール150は、鉄道線路130の前方ビューを提供するために、鉄道車両140の前方端部(例えば、フロントガラス)に取り付けられてもよい。また別の例として、画像キャプチャモジュール150は、鉄道線路130の後方ビューを提供するために、鉄道車両140の後方端部(例えば、後部フロントガラス)に取り付けられてもよい。
【0020】
画像キャプチャモジュール150は、鉄道車両140が鉄道線路130に沿って移動する間に、静止画像又は動画172を自動でキャプチャし得る。画像キャプチャモジュール150は、任意の適切な数の静止画像又は動画172を自動でキャプチャし得る。例えば、画像キャプチャモジュール150は、カメラ(例えば、ラインスキャンカメラ)をトリガーするために、エンコーダ(例えば、位置エンコーダ)を使用して、距離の関数として画像172を自動でキャプチャしてもよい。別の例として、画像キャプチャモジュール150は、毎秒、毎分、毎時間など、所定の数の静止画像172を自動でキャプチャしてもよい。いくつかの実施形態では、画像キャプチャモジュール150は、オブジェクト160に対して画像172を検査し得る。例えば、画像キャプチャモジュール150は、1つ以上のモデルを使用して、画像172内のオブジェクト160を検出してもよい。モデルは、1つ以上のオブジェクト検出モデル、機械学習モデル、マシンビジョンモデル、深層学習モデルなどを含み得る。画像キャプチャモジュール150は、1つ以上のオブジェクト160の1つ以上の画像172をオブジェクト再構成モジュール170に伝達し得る。
【0021】
システム100のオブジェクト再構成モジュール170は、1つ以上の画像172及び/又は1つ以上の遷移画像174からオブジェクト160を再生成する構成要素である。特定の実施形態では、オブジェクト再構成モジュール170は、システム100の1つ以上の構成要素から画像172を受信する。例えば、オブジェクト再構成モジュール170は、画像キャプチャモジュール150から画像172a及び画像172bを受信してもよい。複数の画像172は、単一オブジェクト160の1つ以上の部分を含み得る。例えば、画像172aは、オブジェクト160の第1部分を含んでもよく、画像172bは、オブジェクト160の第2部分を含んでもよい。
【0022】
各オブジェクト160は、領域として表し得る。例えば、オブジェクト160(例えば、レールの継目板)は、画像172aがオブジェクト160の4つの連続した領域を含み、画像172bがオブジェクト160の残りの第5領域を含むように、5つの領域を有してもよい。別の例として、オブジェクト160は、画像172aがオブジェクト160の3つの連続的な領域を含み、画像172bがオブジェクト160の残りの第4領域及び第5領域を含むように5つの領域を有してもよい。
【0023】
特定の実施形態では、オブジェクト再構成モジュール170は、1つ以上の画像172及び/又は遷移画像174に対する類推を実行する。オブジェクト再構成モジュール170は、画像172及び/又は遷移画像174内のオブジェクト160を検出するために、オブジェクト検出アルゴリズムを実行することによって類推を実行し得る。類推の実行に応答して、オブジェクト再構成モジュール170は、1つ以上のオブジェクト160(又はその一部)の周辺に1つ以上のバウンディングボックス176を生成し得る。バウンディングボックス176は、オブジェクト160を識別する輪郭線である。特定の実施形態では、各バウンディングボックス176は、長方形の4つの角を識別するx及びy座標であり、オブジェクト160の周辺の長方形のボックスである。バウンディングボックス176は、バウンディングボックス176a、バウンディングボックス176b、バウンディングボックス176cなどを含み、バウンディングボックス176nまで続き、ここで、174nは、任意の適切な数を表す。
【0024】
特定の実施形態では、画像キャプチャモジュール150は、画像172内のオブジェクト160(又はその一部)の周辺にバウンディングボックス176を構成する。例えば、オブジェクト再構成モジュール170は、画像172a内のオブジェクト160の第1部分を識別し、画像172a内のオブジェクト160の第1部分の周辺にバウンディングボックス176aを構成してもよい。別の例として、オブジェクト再構成モジュール170は、画像172b内のオブジェクト160の第2部分を識別し、画像172b内のオブジェクト160の第2部分の周辺にバウンディングボックス176bを構成してもよい。また別の例として、オブジェクト再構成モジュール170は、遷移画像174a内のオブジェクト160の第3部分を識別し、遷移画像176a内のオブジェクト160の第3部分の周辺にバウンディングボックス176cを構成してもよい。
【0025】
いくつかの実施形態では、オブジェクト160の領域は、バウンディングボックス176によって画定される。例えば、5つの領域を有するオブジェクトの場合、画像172a内のバウンディングボックス176aによって囲まれたオブジェクト160の第1部分は、オブジェクト160の第1領域、第2領域、第3領域、及び第4領域を画定してもよく、画像172b内のバウンディングボックス176bによって囲まれたオブジェクト160の第2部分は、オブジェクト160の第5領域を画定してもよく、そして、遷移画像174a内のバウンディングボックス176cによって囲まれたオブジェクト160の第3部分は、オブジェクト160の第2領域、第3領域、第4領域、及び第5領域を画定してもよい。
【0026】
特定の実施形態では、オブジェクト再構成モジュール170は、画像172から遷移画像174を生成する。遷移画像174は、1つ以上の他の画像172と同じピクセルを共有する画像である。例えば、画像172a及び遷移画像174aは、同じピクセルの所定の比率(例えば、25,50、又は75%)を共有してもよい。遷移画像174は、遷移画像174a、遷移画像174b、及び遷移画像174nまで含み、ここで、176nは、任意の適切な数を表す。
【0027】
いくつかの実施形態では、オブジェクト再構成モジュール170は、2つ以上の画像172を重ね合わせることによって遷移画像174を生成する。例えば、オブジェクト再構成モジュール170は、遷移画像174aが画像172aと画像172bの重なった部分を含むように、画像172aの一部(例えば、50%)と画像172bの一部(例えば、50%)を重ねて遷移画像174aを生成してもよい。いくつかの実施形態では、画像キャプチャモジュール150は、遷移画像174をキャプチャする。例えば、画像キャプチャモジュール150は、所定の量の重なり(例えば、25,50又は75パーセントの重なり)を含む後続の画像172をキャプチャするように構成してもよい。
【0028】
特定の実施形態では、各遷移画像174は、オブジェクト160の1つ以上の領域を含む。例えば、5つの領域を有するオブジェクトの場合、画像172aは、第1領域、第2領域、第3領域、及び第4領域を含んでもよく、画像172bは、第5領域を含んでもよく、遷移画像174aは、画像172aの第2、第3、及び第4領域と画像172bの第5領域を含んでもよい。
【0029】
特定の実施形態では、オブジェクト再構成モジュール170は、1つ以上の等価領域178を決定する。等価領域178は、同じピクセルを共有する画像172及び遷移画像174内の領域である。等価領域178は、等価領域178a、等価領域178bなどを等価領域178nまで含み、ここで、178nは、任意の適切な数を表す。オブジェクト再構成モジュール170は、1つ以上の画像172と1つ以上の遷移画像174との間の等価領域178を決定し得る。例えば、オブジェクト再構成モジュール170は、画像172a及び遷移画像174aの両方がオブジェクト160の第2、第3、及び第4領域を含むと決定してもよい。特定の実施形態では、オブジェクト再構成モジュール170は、オブジェクト再構成180から等価領域178を除外する。いくつかの実施形態では、オブジェクト再構成モジュール170は、遷移画像174内のオブジェクト160の第1領域と画像172a内のオブジェクト160の第1領域とが等価領域178であることを決定するために、IoU、検出ラベルの同等性、及び/又は信頼度スコアの閾値を使用する。
【0030】
特定の実施形態では、オブジェクト再構成モジュール170は、オブジェクト再構成180を生成する。各オブジェクト再構成180は、オブジェクト160の全体の表現である。例えば、オブジェクト再構成180は、画像172aの第1、第2、第3、及び第4領域、及び画像172bの第5領域を含んでもよい。オブジェクト再構成180は、オブジェクト再構成180a、オブジェクト再構成180bなどを含み、オブジェクト再構成180nまで続き、ここで、180nは、任意の適切な数を表す。特定の実施形態では、オブジェクト再構成モジュール170は、1つ以上の画像172及び1つ以上の遷移画像174を使用してオブジェクト再構成180を生成する。例えば、オブジェクト再構成モジュール170は、画像172aからの第1、第2、第3、及び第4領域と遷移画像174aからの第5領域とを連結することによって、オブジェクト再構成180aを生成してもよい。特定の実施形態では、オブジェクト再構成モジュール170は、オブジェクト再構成180を生成するときに、オブジェクト160の領域の重複を避けるために、等価領域178を除外する。例えば、画像172a及び遷移画像174aの両方が、オブジェクト160の第2領域、第3領域、及び第4領域を含む場合、オブジェクト再構成モジュール170は、オブジェクト再構成180aにおいてこれらの領域が重複するのを避けるために、遷移画像174aの第2領域、第3領域、及び第4領域を除外してもよい。
【0031】
作動中に、システム100の画像キャプチャモジュール150は、鉄道車両140に取り付けられる。
【0032】
画像キャプチャモジュールは、鉄道車両140が鉄道環境120の鉄道線路130に沿って移動する間に、オブジェクト160の画像172a及び画像172bをキャプチャする。システム100のオブジェクト再構成モジュール170は、ネットワーク110を介して、画像キャプチャモジュール150からオブジェクト160(例えば、レールの継目板(rail joint bar))の画像172a及び画像172bを受信する。オブジェクト再構成モジュール170は、画像172a内のオブジェクト160の第1部分を検出するために、1つ以上のオブジェクト検出モデルを使用する。オブジェクト再構成モジュール170は、画像172a内のオブジェクト160の第1部分の周辺にバウンディングボックス176aを構成する。オブジェクト160は、5つの領域として表され、バウンディングボックス176aによって囲まれた画像172aの第1部分は、オブジェクト160の第1領域、第2領域、第3領域、及び第4領域を含む。画像172bは、オブジェクト160の第2部分及び第5領域を含む。しかし、オブジェクト再構成モジュール170は、画像172bの全体サイズに対する第2部分のサイズのために、オブジェクト160の第2部分を検出しないことがある。
【0033】
オブジェクト再構成モジュール170は、遷移画像174aが画像172aの半分と画像172bの半分とを含むように、画像172aと画像172bとを重ね合わせることによって、遷移画像174aを生成する。オブジェクト再構成モジュール170は、遷移画像174a内のオブジェクト160の第3部分を検出し、オブジェクト160の第3部分の周辺にバウンディングボックス176cを構成する。バウンディングボックス176cは、オブジェクト160の第2領域、第3領域、第4領域、及び第5領域を含む。オブジェクト再構成モジュール170は、画像172a及び遷移画像174aの第2領域、第3領域、及び第4領域が等価領域178であると決定する。オブジェクト再構成モジュール170は、オブジェクト160の領域の重複を避けるために、オブジェクト再構成180において等価領域178(例えば、遷移画像174aの第3領域、第4領域、及び第5領域)を除外する。オブジェクト再構成モジュール170は、画像172aの第1領域、第2領域、第3領域、及び第4領域と遷移画像174aの第5領域とを連結することによって、オブジェクト160のオブジェクト再構成180を生成する。このように、システム100は、オブジェクト160の小さい部分が画像172bで検出されない場合でも、オブジェクト160全体を正確に再生成するのに使用され得る。
【0034】
図1は、ネットワーク110、鉄道環境120、鉄道線路130、鉄道車両140、画像キャプチャモジュール150、オブジェクト160、オブジェクト再構成モジュール170、画像172、バウンディングボックス176、遷移画像174、等価領域178、及びオブジェクト再構成180の特定の配置を示す。本明細書は、ネットワーク110、鉄道環境120、鉄道線路130、鉄道車両140、画像キャプチャモジュール150、オブジェクト160、オブジェクト再構成モジュール170、画像172、バウンディングボックス176、遷移画像174、等価領域178、及びオブジェクト再構成180の任意の適切な配置を企図する。
【0035】
例えば、画像キャプチャモジュール150、及びオブジェクト再構成モジュール170は、単一モジュールに結合され得る。
【0036】
図1は、ネットワーク110、鉄道環境120、鉄道線路130、鉄道車両140、画像キャプチャモジュール150、オブジェクト160、オブジェクト再構成モジュール170、画像172、バウンディングボックス176、遷移画像174、等価領域178、及びオブジェクト再構成180の特定の数を示す。本明細書は、ネットワーク110、鉄道環境120、鉄道線路130、鉄道車両140、画像キャプチャモジュール150、オブジェクト160、オブジェクト再構成モジュール170、画像172、遷移画像174、バウンディングボックス176、等価領域178、及びオブジェクト再構成180の任意の適切な数を企図する。例えば、システム100は、複数の鉄道環境120、複数の画像キャプチャモジュール150及び/又は複数のオブジェクト再構成モジュール170を含んでもよい。
【0037】
図2は、図1のシステムによって使用され得る例示的な画像172を示す。図2に示した実施形態では、画像172は、画像172a及び画像172bを含む。画像172aは、オブジェクト(例えば、図1のオブジェクト160)の一部を含み、画像172bは、同一のオブジェクトの残りの部分を含む。画像172a内のオブジェクトの部分は、バウンディングボックス176aによって囲まれ、画像172b内のオブジェクトの部分は、バウンディングボックス176bによって囲まれている。
【0038】
画像172内のオブジェクト全体を理解するのに役立つように、オブジェクトを5つの領域に分割する。画像172a内のオブジェクトの部分は、領域1、領域2、領域3、及び領域4を含み、画像172b内のオブジェクトの部分は、領域5を含む。オブジェクトが2つの独立的な画像172として表される場合、オブジェクト全体の再構成は、画像172aからのバウンディングボックス176a(領域1から4を含む)と、それに続く画像172bからのバウンディングボックス176b(領域5を含む)である。バウンディングボックス176aとバウンディングボックス176bとの連結は、領域1から5までの完全なセットを生成する。
【0039】
図2に示すように、画像172bは、オブジェクトの相対的に小さい部分であるオブジェクトの5分の1を含む。図1のオブジェクト再構成モジュールは、画像172b内のオブジェクトの相対的に小さい部分を正確に検出するように訓練され得るが、このプロセスは、オブジェクト検出速度を著しく低下させる可能性がある。特定の実施形態では、オブジェクト再構成モジュールは、画像172b内の領域5を検出することの遅延ペナルティを吸収できない場合がある。しかし、オブジェク再構成モジュールは、オブジェクト全体をキャプチャする必要がある。この問題を解決するために、オブジェクト再構成モジュールは、以下の図3で説明するように遷移画像を利用して、完全な遅延ペナルティを招かずに、オブジェクト全体を正確に検出することができる。
【0040】
図3は、図1のシステムによって使用され得る遷移画像174aを示す。画像172a及び画像172bは、各々2つの部分、即ち第1部分及び第2部分に分割される。画像172aの第2部分は、バウンディングボックス176aの領域2、領域3、及び領域4を含み、画像172bの第1部分は、バウンディングボックス176bの領域5を含む。特定の実施形態では、オブジェクト再構成モジュールは、画像172aの第2部分を画像172bの第1部分と重ね合わせることによって、遷移画像174aが画像172aの第2部分及び画像172bの第1部分を含むように生成し得る。いくつかの実施形態では、遷移画像174aは、画像キャプチャモジュールによって生成される。
【0041】
図3の画像172a、画像172b及び遷移画像174aの各々に対して独立的な類推が実行される。類推の実行に応答して、バウンディングボックス176aは、画像172a上に構成され、バウンディングボックス176bは、画像172b上に構成され、バウンディングボックス176cは、遷移画像174a上に構成される。画像172aは、領域1,2,3及び4を含み、画像172bは、領域5を含み、遷移画像174aは、領域2、3、4、及び5を含む。
【0042】
遷移画像174aが存在するため、速度のために精度を犠牲にするオブジェクト再構成モジュールは、画像172a及び画像172b内のオブジェクト全体を正確に検出することができる。オブジェクト再構成モジュールが画像172b内のオブジェクトの領域5を検出できない場合でも、画像172bに元々含まれていたピクセルは、遷移画像174aにも含まれる。従って、画像172a及び遷移画像174a内のオブジェクトの検出は、完全な検出である。追加の画像(例えば、遷移画像174a)に対する類推は、遅延ペナルティを招くが、特定の実施形態では、この遅延ペナルティは、画像172b内のオブジェクトの領域5を正確に検出することによって生じる遅延ペナルティよりも少なくなり得る。以下の図4及び図5は、領域1から5までの重複を避けるために画像に適用される追加の処理を示している。
【0043】
図4は、図1のシステムによって決定され得る例示的な等価領域178aを示す。画像172aは、バウンディングボックス176a(オブジェクトの領域1、領域2、領域3、及び領域4を囲む)、及び画像172bは、バウンディングボックス176b(オブジェクトの領域5を囲む)を含む。特定の実施形態では、それぞれの領域は、自身のバウンディングボックス176によって囲まれ得る。例えば、画像172aの領域1は、第1バウンディングボックス176によって囲まれることができ、画像172aの領域2は、第2バウンディングボックス176によって囲まれることができ、以下同様である。特定の実施形態では、バウンディングボックスは、互いの中に入れ子にすることができる。例えば、重なる2つの他のオブジェクトが検出された場合、領域1は、さらに大きいバウンディングボックス176内に入れ子にできる第1バウンディングボックス176によって囲まれてもよい。
【0044】
図4に示すように、画像172aのバウンディングボックス176aと遷移画像174aのバウンディングボックス176cは、同等でない。バウンディングボックス176a及びバウンディングボックス176cは、互いに異なる座標空間を占有し、オブジェクトの互いに異なる領域を含む。しかし、画像172aの第2部分に含まれたピクセルは、遷移画像174aの第1部分に含まれたピクセルと同じピクセルである。画像172aのバウンディングボックス176aと遷移画像174aのバウンディングボックス176cの単純な連結は、領域12342345を生成するが、これは、オブジェクト全体の領域2、3、及び4の不正確な重複である。
【0045】
オブジェクトの領域を重複せずにオブジェクト全体を正確に再構成するために、画像172a及び/又は遷移画像174aは、重なるピクセルを考慮して縮小される。特定の実施形態では、図1のオブジェクト再構成モジュールは、画像172a及び遷移画像174a内の等価領域178aを決定する。等価領域178aは、同じピクセルを共有する2つ以上の画像内の領域である。オブジェクト再構成モジュール170は、等価領域178aを決定するために、IoU、検出ラベルの同等性、及び/又は信頼度スコアの閾値を使用し得る。例えば、オブジェクト再構成モジュール170は、画像172aの領域2、領域3、及び領域4を囲むバウンディングボックス176と遷移画像174aの領域2、領域3、及び領域4が等価領域178aであることを決定するために、IoUを使用してもよい。特定の実施形態では、オブジェクト再構成モジュールは、画像172a及び遷移画像174aにおける検出のIoUを算出し、IoUが所定の閾値より大きいか否かを決定する。IoUが所定の閾値よりも大きい場合、オブジェクト再構成モジュール170は、画像172aと遷移画像174aとの間の重なりが等価領域178aを画定すると決定する。以下の図5で説明するように、等価領域178aは、最終的なオブジェクト再構成から除外し得る。
【0046】
図5は、図1のシステムによって生成され得る例示的なオブジェクト再構成180aを示す。上の図4に表示すように、画像172a及び遷移画像174aの領域2、3、4は、等価領域178aである。等価領域178aは、このような領域の重複を避けるために、オブジェクト再構成180aから除外される(即ち、領域2、3、及び4は、オブジェクト再構成180aに一度だけ含まれる)。図1のオブジェクト再構成モジュールは、領域1、2、3、4、及び5を連結することによって、オブジェクト再構成180aを生成する。領域1から5の連結は、オブジェクト再構成180aがオブジェクト(例えば、全体で図1のオブジェクト160)を示すように12345として表し得る。オブジェクト再構成モジュールによって画像172b内のオブジェクトの領域5が検出された場合、等価領域178bの重複を避けるために、同じプロセスが適用され得る。
【0047】
図6は、遷移画像(例えば、図1の遷移画像174a)を使用してオブジェクトを再構成するための例示的な方法600を示す。方法600は、ステップ610で開始する。ステップ620で、オブジェクト再構成モジュール(例えば、図1のオブジェクト再構成モジュール170)は、ネットワーク(例えば、図1のネットワーク110)を介して、オブジェクト(例えば、図1のオブジェクト160)の2つ以上の画像を受信する。例えば、オブジェクト再構成モジュールは、画像キャプチャモジュール(例えば、図1の画像キャプチャモジュール150)からオブジェクトの第1画像(例えば、図1の画像172a)及び第2画像(例えば、図1の画像172b)を受信してもよい。画像キャプチャモジュールは、鉄道車両(例えば、図1の鉄道車両140)に取り付けられ得る。特定の実施形態では、画像キャプチャモジュールは、鉄道車両が鉄道環境(例えば、図1の鉄道環境120)の鉄道線路(例えば、鉄道線路130)に沿って移動する間に、オブジェクトの画像をキャプチャする。次に、方法600は、ステップ620からステップ630に移動する。
【0048】
方法600のステップ630で、オブジェクト再構成モジュールは、オブジェクト再構成のために遷移画像(例えば、図3の遷移画像174a)を使用するか否かを決定する。例えば、オブジェクト再構成モジュールは、オブジェクト再構成モジュールがオブジェクト検出精度よりオブジェクト検出速度を優先する場合(例えば、受信した画像内のオブジェクトの相対的に小さい部分を検出)、遷移画像を利用するように決定してもよい。オブジェクト再構成モジュールがオブジェクト再構成のために遷移画像を利用しないと決定した場合、オブジェクト再構成モジュールは、ステップ630からステップ670に進み、オブジェクト再構成モジュールは、受信した画像からオブジェクトの再構成を生成する。例えば、オブジェクト再構成モジュールによって受信された第1画像は、オブジェクトの第1領域、第2領域、及び第3領域を含んでもよく、オブジェクト再構成モジュールによって受信され第2画像は、オブジェクトの第4領域及び第5領域を含んでもよい。
【0049】
オブジェクト再構成モジュールは、第1画像内のオブジェクトの第1領域、第2領域、及び第3領域を検出し得る。オブジェクト再構成モジュールは、第2画像内のオブジェクトの第4領域及び第5領域を検出し得る。オブジェクト再構成モジュールは、オブジェクト再構成がオブジェクト全体を示すように、第1画像で検出された第1領域、第2領域、及び第3領域を、第2画像で検出された第4領域及び第5領域と連結することによって、オブジェクトの再構成を生成し得る。次に、方法600は、ステップ670からステップ680に移動し、ここで方法600は終了する。
【0050】
ステップ630において、オブジェクト再構成モジュールが、オブジェクト再構成のために遷移画像を利用すると決定した場合、オブジェクト再構成モジュールは、遷移画像が各画像の重なった部分を含むように、第1画像及び第2画像を重ねて遷移画像を作成し得る。例えば、オブジェクト再構成モジュールによって受信された第1画像は、オブジェクトの第1領域、第2領域、第3領域、及び第4領域を含んでもよく、オブジェクト再構成モジュールによって受信され第2画像は、オブジェクトの第5領域を含んでもよい。オブジェクト再構成モジュールは、オブジェクトの第2領域、第3領域、第4領域、及び第5領域を含むように、第1画像と第2画像とを重ねて遷移画像を生成し得る。特定の実施形態では、オブジェクト再構成モジュールは、画像キャプチャモジュールから遷移画像を受信する。次に、方法600は、ステップ630からステップ640に移動する。
【0051】
方法600のステップ640で、オブジェクト再構成モジュールは、各画像に対して類推を実行する。例えば、オブジェクト再構成モジュールは、第1画像、第2画像、及び遷移画像内のオブジェクトを検出するためにオブジェクト検出アルゴリズムを実行することによって、第1画像、第2画像、及び遷移画像に対する類推を実行してもよい。類推を実行してオブジェクトを検出することに応答して、オブジェクト再構成モジュールは、検出されたオブジェクト(又はその一部)の周辺に1つ以上のバウンディングボックスを生成し得る。各バウンディングボックスは、オブジェクトの1つ以上の領域を含み得る。次に、方法600は、ステップ640からステップ650に移動する。
【0052】
方法600のステップ650で、オブジェクト再構成モジュールは、受信した画像内の等価領域(例えば、図4の等価領域178a)を決定する。等価領域は、同じピクセルを共有する領域である。特定の実施形態では、オブジェクト再構成モジュールは、2つ以上のボックスのIoUを算出する前に、重複領域を超えて延在し得るバウンディングボックスを正規化するために、第1画像、第2画像、及び遷移画像のバウンディングボックス及び重複領域の交差を実行する。いくつかの実施形態では、オブジェクト再構成モジュールは、IoU、検出ラベル等価性、及び/又は信頼度スコアの閾値を使用して、重複領域を決定する。例えば、オブジェクト再構成モジュールは、第2領域、第3領域、及び第4領域が第1画像及び遷移画像で重複することを決定するために、IoU、検出レーベル等価性、及び/又は信頼スコアの閾値を使用してもよい。別の例として、オブジェクト再構成モジュールは、第5領域が第2画像及び遷移画像で重複することを決定するために、IoU、検出ラベルの同等性、及び/又は信頼度スコアの閾値を使用してもよい。次に、方法600は、ステップ650からステップ660に移動する。
【0053】
方法600のステップ660で、オブジェクト再構成モジュールは、オブジェクトの再構成から等価領域を除外する。例えば、オブジェクト再構成モジュールが、第1画像及び遷移画像からの第2領域、第3領域、及び第4領域が等価領域であると決定した場合、オブジェクト再構成モジュールは、オブジェクト再構成が第2領域、第3領域、及び第4領域の1つの複製だけを含むようにオブジェクト再構成で等価領域を除外してもよい。別の例として、オブジェクト再構成モジュールが、第2画像からの第5領域及び遷移画像が等価領域であると決定した場合、オブジェクト再構成モジュールは、オブジェクト再構成が第5領域の1つの複製だけを含むようにオブジェクト再構成において等価領域を除外してもよい。次に、方法600は、ステップ660からステップ670に移動する。
【0054】
方法600のステップ670で、オブジェクト再構成モジュールは、1つ以上の受信した画像及び1つ以上の遷移画像からオブジェクトの再構成(例えば、図5のオブジェクト再構成180a)を生成する。例えば、オブジェクト再構成モジュールによって受信された第1画像は、オブジェクトの第1領域、第2領域、第3領域、及び第4領域を含んでもよく、方法600のステップ630で生成された遷移画像は、オブジェクトの第2領域、第3領域、第4領域、及び第5領域を含んでもよい。オブジェクト再構成モジュールは、オブジェクトの再構成がオブジェクト全体を示すように、第1画像からの第1領域、第2領域、第3領域、及び第4領域を遷移画像の第5領域と連結することによって、オブジェクトの再構成を生成し得る。次に、方法600は、ステップ670からステップ680に移動し、ここで方法600は終了する。このように、方法600は、受信した画像内のオブジェクトの特定の領域が検出されない場合でも、オブジェクトを全体的に再構成するために使用され得る。
【0055】
図4に示される方法600に対して、修正、追加、又は省略を行うことができる。方法600は、より多い、より少ない、又は他のステップを含み得る。例えば、方法600は、第2遷移画像を利用することを含み得る。ステップは、並行して、又は任意の適切な順序で実行され得る。方法600のステップを完了する特定の構成要素として論じられているが、任意の適切な構成要素は、方法600の任意のステップを実行し得る。例えば、方法600の1つ以上のステップは、画像キャプチャモジュールによって実行されてもよい。
【0056】
図7は、本明細書に記載のシステム及び方法によって使用され得る例示的なコンピュータシステムを示す。例えば、図1のシステム100の1つ以上の構成要素(例えば、画像キャプチャモジュール150及び/又はオブジェクト再構成モジュール170)は、1つ以上のインターフェース710、処理回路720、メモリ730、及び/又は他の適切な要素を含んでもよい。インターフェース710は、入力を受信し、出力を送信し、入力及び/又は出力を処理して、及び/又は他の適切な動作を実行する。インターフェース710は、ハードウェア及び/又はソフトウェアを含み得る。
【0057】
処理回路720は、構成要素の処理を実行又は管理する。処理回路720は、ハードウェア及び/又はソフトウェアを含み得る。処理回路の例は、1つ以上のコンピュータ、1つ以上のマイクロプロセッサ、1つ以上のアプリケーションなどを含む。特定の実施形態では、処理回路720は、入力から出力を生成するなどのアクション(例えば、処理)を実行するめのロジック(例えば、命令)を実行する。処理回路720によって実行されるロジックは、1つ以上の有形の非一時的なコンピュータ可読媒体(例えば、メモリ730)に符号化され得る。例えば、ロジックは、コンピュータプログラム、ソフトウェア、コンピュータ実行可能命令、及び/又はコンピュータによって実行可能である命令を含んでもよい。特定の実施形態では、実施形態の処理は、コンピュータプログラムを格納、実現及び/又は符号化、及び/又は格納及び/又は符号化されたコンピュータプログラムを有する1つ以上のコンピュータ可読媒体によって実行されてもよい。
【0058】
メモリ730(又はメモリユニット)は、情報を格納する。メモリ730は、1つ以上の非一時的、有形、コンピュータ可読、及び/又はコンピュータ実行可能記憶媒体を含み得る。メモリ730の例は、コンピュータメモリ(例えば、RAM又はROM)、大容量記憶媒体(例えば、ハードディスク)、リムーバブル記憶媒体(例えば、コンパクトディスク(CD)又はデジタルビデオディスク(DVD))、データベース及び/又はネットワークストレージ(例えば、サーバ)及び/又はその他コンピュータ可読媒体を含む。
【0059】
本明細書では、コンピュータ可読非一時的記憶媒体又は媒体は、1つ以上の半導体ベース又は他の集積回路(IC)(例えば、フィールドプログラマブルゲートアレイ(FPGA)又は特定用途向け集積回路(ASIC))、ハードディスクドライブ(HDD)、ハイブリッドハードドライブ(HHD)、光ディスク、光ディスクドライブ(ODD)、光磁気ディスク、光磁気ドライブ、フロッピーディスク、フロッピーディスクドライブ(FDD)、磁気テープ、ソリッドステートドライブ(SSD)、RAMドライブ、SD(SECURE DIGITAL)カード又はドライブ、その他の適切なコンピュータ可読の非一時的記憶媒体、又は必要に応じてこれらの2以上の適切な組み合わせを含み得る。コンピュータ可読非一時的記憶媒体は、必要に応じて、揮発性、不揮発性、又は揮発性と不揮発性の組み合わせであり得る。
【0060】
本明細書において、「又は」は、明示的に別段の指示がない限り、又は文脈によって別段の指示がない限り、包括的であって排他的ではない。従って、本明細書において、「A又はB」は、明示的に別段の指示がない限り、又は文脈によって別段の指示がない限り、「A、B、又はその両方」を意味する。また、「及び」は、明示的に別段の指示がない限り、又は文脈によって別段の指示がない限り、共同及び複数を意味する。従って、本明細書で「A及びB」は、明示的に別段の指示がない限り、又は文脈によって別段の指示がない限り、「A及びB、共同、又は個別」を意味する。本開示の範囲は、当業者が理解することのできる本明細書に記載又は図示された例示的な実施形態に対する全ての変更、置換、変形、変更及び修正を含む。本開示の範囲は、本明細書に記載又は図示された例示的な実施形態に限定されない。さらに、本開示は、特定の構成要素、要素、特徴、機能、処理、又はステップを含むものとして本明細書のそれぞれの実施形態を説明及び例示しているが、これらの実施形態のいずれも、当業者が理解し得る本明細書のどこかに記載又は図示された構成要素、要素、特徴、機能、処理、又はステップのうちの任意の組み合わせ又は順列を含み得る。さらに、特定の機能を実行するように適切に構成して配置され、作動又は作動可能な装置、又はシステム、又はその構成要素に対する添付された特許請求の範囲の言及は、その装置、システム、又は構成要素が適切に構成して配置され、作動又は作動可能、又は特定の機能が活性化又は解除されたかにかかわらず、その装置のシステム又は構成要素を含む。さらに、本開示は、特定の利点を提供するものとして特定の実施形態を説明又は図示しているが、特定の実施形態は、これらの利点のいずれも提供しないか、一部を提供、又は全てを提供し得る。
図1
図2
図3
図4
図5
図6
図7