(19)【発行国】日本国特許庁(JP)
(12)【公報種別】公表特許公報(A)
(11)【公表番号】
(43)【公表日】2024-03-27
(54)【発明の名称】画像及びビデオから反射特徴(reflective features)を除去するためのリアルタイム機械学習ベースのプライバシーフィルタ
(51)【国際特許分類】
H04N 21/854 20110101AFI20240319BHJP
H04N 7/15 20060101ALI20240319BHJP
【FI】
H04N21/854
H04N7/15
【審査請求】未請求
【予備審査請求】未請求
(21)【出願番号】P 2023558342
(86)(22)【出願日】2022-03-03
(85)【翻訳文提出日】2023-10-23
(86)【国際出願番号】 US2022018799
(87)【国際公開番号】W WO2022211967
(87)【国際公開日】2022-10-06
(32)【優先日】2021-03-31
(33)【優先権主張国・地域又は機関】US
(81)【指定国・地域】
(71)【出願人】
【識別番号】591016172
【氏名又は名称】アドバンスト・マイクロ・ディバイシズ・インコーポレイテッド
【氏名又は名称原語表記】ADVANCED MICRO DEVICES INCORPORATED
(71)【出願人】
【識別番号】508301087
【氏名又は名称】エーティーアイ・テクノロジーズ・ユーエルシー
【氏名又は名称原語表記】ATI TECHNOLOGIES ULC
【住所又は居所原語表記】One Commerce Valley Drive East, Markham, Ontario, L3T 7X6 Canada
(74)【代理人】
【識別番号】100108833
【氏名又は名称】早川 裕司
(74)【代理人】
【識別番号】100111615
【氏名又は名称】佐野 良太
(74)【代理人】
【識別番号】100162156
【氏名又は名称】村雨 圭介
(72)【発明者】
【氏名】ヴィッキー ユウミン ウー
(72)【発明者】
【氏名】ウィルソン ハン ユウ
(72)【発明者】
【氏名】ハッキ カン カライマー
【テーマコード(参考)】
5C164
【Fターム(参考)】
5C164FA10
5C164VA35P
(57)【要約】
画像から反射を除去するための方法が開示される。本方法は、画像の1つ以上のセグメントを識別することであって、1つ以上のセグメントが反射を含むことと、1つ以上のセグメントの1つ以上の特徴を識別することと、セグメントから1つ以上の特徴を除去して、1つ以上のサニタイズされたセグメントを生成することと、1つ以上のサニタイズされたセグメントを画像と組み合わせて、サニタイズされた画像を生成することと、を含む。
【選択図】
図5
【特許請求の範囲】
【請求項1】
画像から反射を除去するための方法であって、
反射オブジェクトであるとみなされるオブジェクトを第1の画像が含むという第1の識別を行うことと、
前記第1の識別に応じて、前記第1の画像から1つ以上の反射を除去して、修正された第1の画像を生成することと、
反射オブジェクトであるとみなされるオブジェクトを第2の画像が含まないという第2の識別を行うことと、
前記第2の画像に対して、前記第2の画像から1つ以上の反射を除去するための処理を行わないことと、を含む、
方法。
【請求項2】
前記第1の画像は静止画像を含む、
請求項1の方法。
【請求項3】
前記第1の画像はビデオ会議のフレームを含む、
請求項1の方法。
【請求項4】
ビデオ会議システムのカメラからビデオを取得することと、
前記ビデオを解析して、修正されたビデオを生成することと、
前記ビデオ会議システムの受信機に前記ビデオを送信することと、を更に含み、
前記解析することは、前記第1の識別を行うことと、前記除去することと、前記第2の識別を行うことと、前記処理を行わないことと、を含み、
前記修正されたビデオは、1つ以上の反射が除去された前記第1の画像と、前記第2の画像と、を含む、
請求項3の方法。
【請求項5】
前記修正された第1の画像と、前記第2の画像と、をディスプレイに送信することを更に含む、
請求項1の方法。
【請求項6】
前記反射オブジェクトであるとみなされるオブジェクトを第1の画像が含むという第1の識別を行うことは、画像を、反射オブジェクトであるとみなされるオブジェクトを含むものとして、又は、反射オブジェクトであるとみなされるオブジェクトを含まないものとして識別するように構成された分類器を用いて、前記第1の画像を処理することを含む、
請求項5の方法。
【請求項7】
前記分類器は、ニューラルネットワーク分類器を含む、
請求項6の方法。
【請求項8】
前記反射オブジェクトであるとみなされるオブジェクトを第1の画像が含むという第1の識別を行うことは、前記第1の画像の関心領域内で前記オブジェクトを検索することを含む、
請求項1の方法。
【請求項9】
前記反射オブジェクトであるとみなされるオブジェクトを第2の画像が含まないという第2の識別を行うことは、前記第2の画像の関心領域内に前記オブジェクトが含まれていないと判定することを含む、
請求項1の方法。
【請求項10】
画像から反射を除去するためのシステムであって、
入力ソースと、
解析システムと、を備え、
前記解析システムは、
前記入力ソースから第1の画像及び第2の画像を取得することと、
反射オブジェクトであるとみなされるオブジェクトを前記第1の画像が含むという第1の識別を行うことと、
前記第1の識別に応じて、前記第1の画像から1つ以上の反射を除去することと、
反射オブジェクトであるとみなされるオブジェクトを前記第2の画像が含まないという第2の識別を行うことと、
前記第2の画像に対して、前記第2の画像から1つ以上の反射を除去するための処理を行わないことと、
を行うように構成されている、
システム。
【請求項11】
前記第1の画像は静止画像を含む、
請求項10のシステム。
【請求項12】
前記第1の画像はビデオ会議のフレームを含む、
請求項10のシステム。
【請求項13】
前記入力ソースは、ビデオ会議システムのカメラを含み、
前記解析システムは、
ビデオ会議システムのカメラからビデオを取得することと、
前記ビデオを解析して、修正されたビデオを生成することと、
前記ビデオ会議システムの受信機に前記ビデオを送信することと、
を行うように構成されており、
前記解析することは、前記第1の識別を行うことと、前記除去することと、前記第2の識別を行うことと、前記処理を行わないことと、を含み、
前記修正されたビデオは、1つ以上の反射が除去された前記第1の画像と、前記第2の画像と、を含む、
請求項12のシステム。
【請求項14】
前記解析システムは、前記修正された第1の画像と、前記第2の画像と、を表示のために出力するように構成されている、
請求項10のシステム。
【請求項15】
前記反射オブジェクトであるとみなされるオブジェクトを第1の画像が含むという第1の識別を行うことは、画像を、反射オブジェクトであるとみなされるオブジェクトを含むものとして、又は、反射オブジェクトであるとみなされるオブジェクトを含まないものとして識別するように構成された分類器を用いて、前記第1の画像を処理することを含む、
請求項14のシステム。
【請求項16】
前記分類器は、ニューラルネットワーク分類器を含む、
請求項15のシステム。
【請求項17】
前記反射オブジェクトであるとみなされるオブジェクトを第1の画像が含むという第1の識別を行うことは、前記第1の画像の関心領域内で前記オブジェクトを検索することを含む、
請求項10のシステム。
【請求項18】
前記反射オブジェクトであるとみなされるオブジェクトを第2の画像が含まないという第2の識別を行うことは、前記第2の画像の関心領域内に前記オブジェクトが含まれていないと判定することを含む、
請求項10のシステム。
【請求項19】
命令を記憶するコンピュータ可読記憶媒体であって、
前記命令は、プロセッサによって実行されると、
反射オブジェクトであるとみなされるオブジェクトを第1の画像が含むという第1の識別を行うことと、
前記第1の識別に応じて、前記第1の画像から1つ以上の反射を除去することと、
反射オブジェクトであるとみなされるオブジェクトを第2の画像が含まないという第2の識別を行うことと、
前記第2の画像に対して、前記第2の画像から1つ以上の反射を除去するための処理を行わないことと、
を含む動作を前記プロセッサに実行させる、
コンピュータ可読記憶媒体。
【請求項20】
前記第1の画像は静止画像を含む、
請求項19のコンピュータ可読記憶媒体。
【発明の詳細な説明】
【技術分野】
【0001】
(関連出願の相互参照)
本願は、2021年3月31日に出願された米国特許出願第17/219,766号の利益を主張し、その内容は、本明細書に完全に記載されているように参照により組み込まれる。
【背景技術】
【0002】
ビデオ及び画像は、データを操作するための多種多様な技術を処理することを含む。このような技術に対する改良が絶えず行われている。
【0003】
添付の図面と共に例として与えられる以下の説明から、より詳細な理解を得ることができる。
【図面の簡単な説明】
【0004】
【
図1】本開示の1つ以上の特徴を実装することができる例示的なコンピューティングデバイスのブロック図である。
【
図2】一例による、ビデオを解析し、反射からの画像を除去するために1つ以上のニューラルネットワークを訓練(トレーニング)するためのシステムを示す図である。
【
図3】一例による、反射画像を除去するためにビデオを解析及び修正するためのシステムを示す図である。
【
図4】一例による、解析システムによって実行される解析技術を示すブロック図である。
【
図5】一例による、ビデオ又は画像から反射を除去するための方法のフロー図である。
【発明を実施するための形態】
【0005】
ビデオデータは、眼鏡又はミラー等の反射面に反射されたプライベート画像を不注意に含むことがある。機械学習を利用してそのようなプライベート画像をビデオから除去するための技術が本明細書で提供される。例では、本技術は、自動プライベート画像除去技術を含み、それによって、
図1のコンピューティングデバイス100等のデバイスがビデオデータを解析してプライベート画像を除去する。画像除去技術は、1つ以上の訓練(トレーニング)されたニューラルネットワークを利用して、解析のための様々なタスクを実行する。例では、本技術は、自動プライベート画像除去技術のために1つ以上のニューラルネットワークを訓練するための訓練技術を含む。様々な例では、自動画像除去技術は、訓練技術のうち1つ以上と同じコンピューティングデバイス100又は異なるコンピューティングデバイス100によって実行される。
【0006】
図1は、本開示の1つ以上の特徴を実装することができる例示的なコンピューティングデバイス100のブロック図である。様々な例では、コンピューティングデバイス100は、例えば、コンピュータ、ゲームデバイス、ハンドヘルドデバイス、セットトップボックス、テレビ、携帯電話、タブレットコンピュータ、又は、他のコンピューティングデバイスのうち何れかであるが、これらに限定されない。デバイス100は、1つ以上のプロセッサ102、メモリ104、記憶装置106、1つ以上の入力デバイス108、及び、1つ以上の出力デバイス110を含む。また、デバイス100は、1つ以上の入力ドライバ112及び1つ以上の出力ドライバ114を含む。何れの入力ドライバ112も、ハードウェア、ハードウェアとソフトウェアとの組み合わせ、又は、ソフトウェアとして具体化され、入力デバイス108を制御する(例えば、動作を制御し、入力ドライバ112からの入力を受信し、入力ドライバ112にデータを提供する)役割を果たす。同様に、何れの出力ドライバ114も、ハードウェア、ハードウェアとソフトウェアとの組み合わせ、又は、ソフトウェアとして具体化され、出力デバイス110を制御する(例えば、動作を制御し、出力ドライバ114からの入力を受信し、出力ドライバ114にデータを提供する)役割を果たす。デバイス100は、
図1に示されていない追加の構成要素を含むことができることを理解されたい。
【0007】
様々な代替例では、1つ以上のプロセッサ102は、中央処理ユニット(CPU)、グラフィックス処理ユニット(GPU)、同じダイ上に位置するCPU及びGPU、又は、1つ以上のプロセッサコアを含み、各プロセッサコアは、CPU又はGPUとすることができる。様々な代替例では、メモリ104は、1つ以上のプロセッサ102と同じダイ上に位置するか、又は、1つ以上のプロセッサ102とは別に位置する。メモリ104は、揮発性又は不揮発性メモリ(例えば、ランダムアクセスメモリ(RAM)、ダイナミックRAM、キャッシュ)を含む。
【0008】
記憶装置106は、固定又はリムーバブル記憶装置(例えば、限定するものではないが、ハードディスクドライブ、ソリッドステートドライブ、光ディスク、フラッシュドライブ)を含む。入力デバイス108は、キーボード、キーパッド、タッチスクリーン、タッチパッド、検出器、マイクロフォン、加速度計、ジャイロスコープ、生体認証スキャナ、又は、ネットワーク接続(例えば、無線IEEE802シグナルの送信及び/又は受信のための無線ローカルエリアネットワークカード)を含むが、これらに限定されない。出力デバイス110は、ディスプレイ、スピーカ、プリンタ、触覚フィードバックデバイス、1つ以上の光、アンテナ、又は、ネットワーク接続(例えば、無線IEEE802シグナルの送信及び/又は受信のための無線ローカルエリアネットワークカード)を含むが、これらに限定されない。
【0009】
入力ドライバ112及び出力ドライバ114は、それぞれ、入力デバイス108及び出力デバイス110とインターフェースし、それらをドライブする1つ以上のハードウェア、ソフトウェア及び/又はファームウェア構成要素を含む。入力ドライバ112は、1つ以上のプロセッサ102及び入力デバイス108と通信し、1つ以上のプロセッサ102が入力デバイス108から入力を受信することを可能にする。出力ドライバ114は、1つ以上のプロセッサ102及び出力デバイス110と通信し、1つ以上のプロセッサ102が出力デバイス110に出力を送信することを可能にする。
【0010】
いくつかの実施形態では、出力ドライバ114は、加速処理デバイス(accelerated processing device、APD)116を含む。いくつかの実施形態では、APD116は、汎用コンピューティングのために使用され、ディスプレイ(表示デバイス118等)に出力を提供しない。他の実施形態では、APD116は、グラフィカル出力をディスプレイ118に提供し、いくつかの代替形態では、汎用コンピューティングも実行する。いくつかの例では、表示デバイス118は、物理ディスプレイデバイス又はリモートディスプレイプロトコルを使用して出力を示す模擬デバイスである。APD116は、1つ以上のプロセッサ102から計算コマンド及び/又はグラフィックスレンダリングコマンドを受け入れて、それらの計算コマンド及び/又はグラフィックスレンダリングコマンドを処理し、いくつかの例では、表示のためにピクセル出力を表示デバイス118に提供する。APD116は、単一命令複数データ(single-instruction-multiple-data、SIMD)パラダイムに従って計算を行う1つ以上の並列処理ユニットを含む。いくつかの実施形態では、APD116は、専用グラフィックス処理ハードウェア(例えば、グラフィックス処理パイプラインを実装する)を含み、他の実施形態では、APD116は、専用グラフィックス処理ハードウェアを含まない。
【0011】
図2は、一例による、ビデオを解析し、反射からの画像を除去するために1つ以上のニューラルネットワークを訓練するためのシステム200を示す図である。システム200は、訓練データ204を受け入れ、1つ以上の訓練されたニューラルネットワーク206を生成するネットワークトレーナ202を含む。
【0012】
様々な例では、システム200は、
図1のコンピューティングデバイス100のインスタンスであるか又はその一部である。様々な例では、ネットワークトレーナ202は、プロセッサ(プロセッサ102等)上で実行されるソフトウェアを含む。様々な例では、ソフトウェアは、記憶装置106に存在し、メモリ104にロードされる。様々な例では、ネットワークトレーナ202は、ネットワークトレーナ202の動作を実行するために配線接続されたハードウェア(例えば、回路)を含む。様々な例では、ネットワークトレーナ202は、本明細書に記載される動作を実行するハードウェア及びソフトウェアの組み合わせを含む。生成済みの訓練されたニューラルネットワーク206、及び、それらのニューラルネットワーク206を訓練するために使用される訓練データ204は、以下で更に詳細に説明される。
【0013】
図3は、一例による、反射画像を除去するためにビデオを解析及び修正するためのシステム300を示す図である。システム300は、解析システム302及び訓練されたネットワーク306を含む。解析システム302は、訓練されたネットワーク306を利用して、入力ビデオ304から反射を識別して除去し、出力ビデオ308を生成する。様々な例では、入力ビデオ304は、入力ソースを介して解析システム302に提供される。様々な例では、入力ソースは、ソフトウェア、ハードウェア、又は、それらの組み合わせを含む。様々な例では、入力ソースは、個別のメモリであるか、又は、メインメモリ等の別のより一般的なメモリの一部である。様々な例では、入力ソースは、メモリ、バッファ又はハードウェアデバイスから入力ビデオ304をフェッチするように構成された1つ以上の入力/出力要素(ソフトウェア、ハードウェア又はそれらの組み合わせ)を含む。いくつかの例では、入力ソースは、ビデオのフレームを提供するビデオカメラである。
【0014】
いくつかの例では、システム300は、
図1のコンピューティングデバイス100のインスタンスであるか又はその一部である。いくつかの例では、システム300であるか又はその一部であるコンピューティングデバイス100は、
図2のシステム200であるか又はその一部であるコンピューティングデバイスと同じコンピューティングデバイス100である。様々な例では、解析システム302は、プロセッサ(プロセッサ102等)上で実行されるソフトウェアを含む。様々な例では、ソフトウェアは、記憶装置106に存在し、メモリ104にロードされる。様々な例では、解析システム302は、解析システム302の動作を実行するために配線接続されたハードウェア(例えば、回路)を含む。様々な例では、解析システム302は、本明細書に記載される動作を実行するハードウェア及びソフトウェアの組み合わせを含む。いくつかの例では、
図3の訓練されたネットワーク306のうち1つ以上は、
図2のニューラルネットワーク206のうち1つ以上と同じである。言い換えれば、
図2のシステム200は、ビデオを解析及び編集するために解析システム302によって使用される訓練されたニューラルネットワークを生成する。
【0015】
図4は、一例による、解析システム302によって実行される解析技術400を示すブロック図である。技術400は、インスタンスセグメンテーション動作402、特徴抽出動作404、反射除去動作406、及び、復元動作408を含む。解析システム302は、この技術の動作を入力ビデオ304の1つ以上のフレームに適用する。
【0016】
インスタンスセグメンテーション動作402は、入力フレームのうち反射を含む部分を識別する。一例では、インスタンスセグメンテーション動作402の少なくとも一部は、ニューラルネットワークとして実装される。ニューラルネットワークは、画像内の反射を認識するように構成されている。このニューラルネットワークは、画像を分類することができる任意のニューラルネットワークアーキテクチャとして実装可能である。1つの例示的なニューラルネットワークアーキテクチャは、畳み込みニューラルネットワークベースの画像分類器である。他の例では、画像内の反射を認識するために、任意の他のタイプのニューラルネットワークが使用される。いくつかの例では、ニューラルネットワーク以外のエンティティが、画像内の反射を認識するために使用される。いくつかの例では、動作402において利用されるニューラルネットワークは、
図2のシステム200によって生成され、訓練されたニューラルネットワーク206のうち何れかである。一例では、
図2のシステム200は、反射を含むか含まないかの何れかの画像を含むラベル付けされた入力を受け入れる。反射を含む画像に対して、画像は、画像が反射を含むというインジケーションでラベル付けされる。反射を含まない画像の場合、画像は、画像が反射を含まないというインジケーションでラベル付けされる。ニューラルネットワークは、入力画像を、反射を含むか含まないかの何れかに分類することを学習する。
【0017】
いくつかの実施形態では、インスタンスセグメンテーション動作402は、画像分類処理を、システム400に入力された画像の一部に制限する。より具体的には、いくつかの実施形態では、インスタンスセグメンテーション動作402は、解析されている画像の範囲全体の一部である関心領域のインジケーションを取得する。一例では、関心領域は、画像の中央部分である。いくつかの実施形態又は動作モードでは、関心領域は、ユーザによって示される。そのような実施形態では、インスタンスセグメンテーション動作402は、そのようなインジケーションを、ユーザから、又は、ユーザがそのような情報を入力したことに応じて記憶されたデータから受信する。いくつかの例では、ユーザ情報は、技術400を実行するビデオ会議ソフトウェア又は他のビデオソフトウェアに入力される。多くの場合、機密情報を示す反射は、中央部分又は他の部分等のビデオの或る特定の領域に制限される。
【0018】
いくつかの実施形態では、インスタンスセグメンテーション402は、2つの部分の画像認識を含む。第1の部分では、インスタンスセグメンテーション402は、画像を、特定のタイプの反射オブジェクトを有するか又は有さないかの何れかとして分類し、その例には眼鏡又はミラーが含まれる。いくつかの例では、この部分は、そのようなオブジェクトを含む又は含まない画像を用いて訓練され、そのようにラベル付けされたニューラルネットワーク分類器として実装される。インスタンスセグメンテーション402が、そのようなオブジェクトのうち何れかが関心領域に含まれると判定した場合、インスタンスセグメンテーション402は、第2の部分に進む。インスタンスセグメンテーション402が、そのようなオブジェクトが関心領域内に含まれないと判定した場合、インスタンスセグメンテーション402は、第2の部分に進まず、入力画像を更に処理しない(すなわち、動作404、406又は408に進まない)。第2の部分において、インスタンスセグメンテーション402は、画像を、反射を含むか含まないかの何れかとして分類する。再び、いくつかの例では、この部分は、反射を含む又は含まない画像を用いて訓練され、そのようにラベル付けされたニューラルネットワーク分類器として実装される。画像が反射を含まない場合、技術400は、画像を更に処理しない(動作404、406又は408を実行しない)。
【0019】
特徴抽出動作404は、画像内の反射を含む部分を抽出する。一例では、特徴抽出動作404は、画像に対してクロップ動作を実行して、画像内の反射を含む部分を区別する。別の例では、特徴抽出動作402は、反射の境界のインジケーションを生成し、この境界は、その後、反射及び画像を処理するために使用される。いくつかの例では、画像内の反射を含む部分は、動作402に関して言及した関心領域である。
【0020】
反射除去動作406は、動作404の画像の抽出された部分から反射画像を除去する。一例において、反射除去動作406は、逆畳み込みベースのニューラルネットワークのようなアーキテクチャとして実装される。いくつかの例では、このニューラルネットワークは、訓練されたニューラルネットワーク206のうち何れかであり、ネットワークトレーナ202によって生成される。一例では、残差ニューラルネットワークは、学習された画像特徴を識別しようと試み、学習された特徴は、反射面における反射である。言い換えれば、残差ニューラルネットワークは、反射面における反射画像である画像の部分を認識するように訓練される。(様々な例において、この訓練は、
図2のネットワークトレーナ200によって行われる)。次に、反射除去動作406は、抽出された部分から認識された特徴を引いて、反射画像を含まない反射面の画像を得る。反射除去動作406の出力は、反射が除去された画像部分である。
【0021】
復元動作408は、反射が除去されたフレームを生成するために、反射が除去された画像部分を、特徴抽出動作404が画像部分を抽出した元の画像と再結合する。一例では、復元動作408は、抽出された部分に対応する元の画像のピクセルを、反射特徴を除去するために動作406によって処理されたピクセルで置き換えることを含む。一例では、画像は鏡を含み、反射除去動作406は、鏡内の反射画像を除去して、反射が除去された画像部分を生成する。復元動作408は、鏡に対応する元のフレームのピクセルを、除去動作406によって処理されたピクセルで置き換えて、反射のない鏡を有する新しいフレームを生成する。
【0022】
図5は、一例による、ビデオ又は画像から反射を除去するための方法500のフロー図である。
図1~
図4のシステムに関して説明したが、当業者であれば、任意の技術的に実現可能な順序で方法500のステップを行うように構成された任意のシステムが本開示の範囲内に含まれることを認識するであろう。
【0023】
ステップ502において、解析システム302は、入力画像502を解析して、入力画像502内に1つ以上の反射があるかどうかを判定する。いくつかの例では、ステップ502は、
図4のステップ402として実行される。より具体的には、解析システム302は、反射を有する画像を認識するように訓練された畳み込みニューラルネットワーク等の訓練されたニューラルネットワークに対して画像を適用する。この適用の結果は、画像が反射を含むかどうかのインジケーションである。
【0024】
ステップ504において、画像が反射を含むと解析システム302が判定した場合、方法500はステップ508に進み、画像が反射を含まないと解析システム302が判定した場合、方法500はステップ506に進み、解析システム302は、未処理の画像を出力する。
【0025】
ステップ508において、解析システム302は、1つ以上の検出された反射を除去する。様々な例では、解析システム302は、
図4のステップ404~408としてステップ508を実行する。具体的には、解析システム302は、画像から反射を含むと識別された部分を抽出する特徴抽出404を実行し、それらの部分から反射特徴を除去する反射除去406を実行し、画像の対応するピクセルを修正された画像部分のピクセルで置き換える復元408を実行する。
【0026】
ステップ510において、解析システム302は、処理された画像を出力する。様々な例では、出力は、更なるビデオ処理のために、又は、エンコーダ等の画像の消費者に提供される。ステップ506はステップ510と同様である。
【0027】
ステップ512において、解析システム302は、解析すべき画像が更にあるかどうかを判定する。いくつかの例では、ビデオの場合、解析システム302は、フレームごとにビデオを処理し、フレームの各々から反射を除去する。したがって、この状況では、解析システム302がビデオの全てのフレームを処理していない場合、解析すべきより多くの画像が存在する。他の例では、解析システム302は、処理すべき画像の指定されたセットを有し、全てのそのような画像が処理されるまでそれらの画像を処理し続ける。処理すべき更なる画像が存在する場合、方法500はステップ502に進み、処理すべき更なる画像が存在しない場合、方法500はステップ514に進み、方法は終了する。
【0028】
様々な実施形態において、処理されたビデオ出力は、任意の技術的に実行可能な方法で使用される。一例では、再生システムは、ユーザによる視聴のためにビデオを処理及び表示する。他の例では、記憶システムが、後で取り出すためにビデオを記憶する。更に他の例では、ネットワークデバイスは、別のコンピュータシステムによる使用のためにネットワークを介してビデオを送信する。
【0029】
本明細書の開示に基づいて、多くの変形が可能であることを理解されたい。例えば、いくつかの実施形態では、解析システム302は、ビデオ会議システムであるか、又は、ビデオ会議システムの一部である。ビデオ会議システムは、本明細書の他の箇所で説明されるように、カメラからビデオを受信し、ビデオを解析して、反射画像を検出し、除去する。更に、いくつかの動作は、ニューラルネットワークによって、又は、ニューラルネットワークの助けを借りて実行されるものとして説明されているが、いくつかの実施形態では、ニューラルネットワークは、1つ以上のそのような動作のために使用されない。特徴及び要素が特定の組み合わせで上述されているが、各特徴又は要素は、他の特徴及び要素を用いずに単独で、又は、他の特徴及び要素を用いて若しくは用いずに様々な組み合わせで使用することができる。
【0030】
提供される方法は、汎用コンピュータ、プロセッサ又はプロセッサコアにおいて実装することができる。好適なプロセッサとしては、例として、汎用プロセッサ、専用プロセッサ、従来型プロセッサ、デジタルシグナルプロセッサ(digital signal processor、DSP)、複数のマイクロプロセッサ、DSPコアと関連する1つ以上のマイクロプロセッサ、コントローラ、マイクロコントローラ、特定用途向け集積回路(Application Specific Integrated Circuit、ASIC)、フィールドプログラマブルゲートアレイ(Field Programmable Gate Array、FPGA)回路、任意の他のタイプの集積回路(integrated circuit、IC)、及び/又は、状態マシンが挙げられる。そのようなプロセッサは、処理されたハードウェア記述言語(hardware description language、HDL)命令及びネットリストを含む他の中間データ(コンピュータ可読媒体に記憶させることが可能な命令)の結果を使用して製造プロセスを構成することによって製造することができる。そのような処理の結果はマスクワークとすることができ、このマスクワークをその後の半導体製造プロセスにおいて使用して、本開示の特徴を実装するプロセッサを製造する。
【0031】
本明細書に提供される方法又はフロー図は、汎用コンピュータ又はプロセッサによる実行のために非一時的なコンピュータ可読記憶媒体に組み込まれるコンピュータプログラム、ソフトウェア又はファームウェアにおいて実装することができる。非一時的なコンピュータ可読記憶媒体の例としては、読み取り専用メモリ(read only memory、ROM)、ランダムアクセスメモリ(RAM)、レジスタ、キャッシュメモリ、半導体メモリデバイス、内蔵ハードディスク及びリムーバブルディスク等の磁気媒体、磁気光学媒体、並びに、CD-ROMディスク及びデジタル多用途ディスク(digital versatile disk、DVD)等の光学媒体が挙げられる。
【国際調査報告】