(19)【発行国】日本国特許庁(JP)
(12)【公報種別】特許公報(B2)
(11)【特許番号】
(24)【登録日】2023-09-27
(45)【発行日】2023-10-05
(54)【発明の名称】ジョイントローリングシャッター補正及び画像ぼけ除去
(51)【国際特許分類】
G06T 1/40 20060101AFI20230928BHJP
G06T 5/00 20060101ALI20230928BHJP
【FI】
G06T1/40
G06T5/00 710
G06T5/00 725
(21)【出願番号】P 2022516141
(86)(22)【出願日】2020-11-06
(86)【国際出願番号】 US2020059398
(87)【国際公開番号】W WO2021101732
(87)【国際公開日】2021-05-27
【審査請求日】2022-03-11
(32)【優先日】2019-11-22
(33)【優先権主張国・地域又は機関】US
(32)【優先日】2020-11-05
(33)【優先権主張国・地域又は機関】US
(73)【特許権者】
【識別番号】504080663
【氏名又は名称】エヌイーシー ラボラトリーズ アメリカ インク
【氏名又は名称原語表記】NEC Laboratories America, Inc.
(74)【代理人】
【識別番号】100123788
【氏名又は名称】宮崎 昭夫
(74)【代理人】
【識別番号】100127454
【氏名又は名称】緒方 雅昭
(72)【発明者】
【氏名】トラン、 クオック-フイ
(72)【発明者】
【氏名】ズオン、 ビンビン
(72)【発明者】
【氏名】ジ、 パン
(72)【発明者】
【氏名】チャンドラカー、 マンモハン
【審査官】▲高▼橋 真之
(56)【参考文献】
【文献】特開2019-114262(JP,A)
【文献】米国特許出願公開第2014/0267801(US,A1)
【文献】米国特許出願公開第2016/0292882(US,A1)
(58)【調査した分野】(Int.Cl.,DB名)
G06T 1/40-5/00
(57)【特許請求の範囲】
【請求項1】
ローリングシャッター(RS)歪み及びぼけアーティファクトを単一入力RS及び
ぼけ画像において共に除去するためにプロセッサで実行されるコンピュータ実装方法であって、
カメラから複数のRSぼけ画像を生成すること(801)と、
単一ビュージョイントRS補正及びぼけ除去の畳み込みニューラルネットワーク(CNN)を訓練する訓練データを生成するために、構造及び動き認識RS歪み及びぼけレンダリングモジュールを用いることでGS鮮明画像、対応GS鮮明奥行きマップ、合成RSカメラの動きのセットからRSぼけ画像を合成すること(803)と、
前記単一ビュージョイントRS補正及びぼけ除去のCNNを用いることで、前記単一入力RS及びぼけ画像からRS修正及びぼけ除去画像を予測すること(805)と、
を含む方法。
【請求項2】
単一ビュージョイントRS補正及びぼけ除去が、単一の順方向パスで実行される、請求項1に記載の方法。
【請求項3】
訓練フェーズにおいて、前記単一ビュージョイントRS補正及びぼけ除去の畳み込みニューラルネットワーク(CNN)を訓練するための合成RSぼけ画像を生成するために、前記GS鮮明画像、前記対応GS鮮明奥行きマップ、前記合成RSカメラの動きのセットのための前記構造及び動き認識RS歪み及びぼけレンダリングモジュールを用いることをさらに含む、請求項1に記載の方法。
【請求項4】
テストフェーズにおいて、単一の順方向パスで対応RS補正及びぼけ除去画像を提供するために、前記単一ビュージョイントRS補正及びぼけ除去のCNNに前記単一
入力RS及び
ぼけ画像を生成する、請求項1に記載の方法。
【請求項5】
生成器ネットワークが、対応GS鮮明画像を予測する、請求項3に記載の方法。
【請求項6】
識別器ネットワークが、予測されたGS鮮明画像またはグラウンドトゥルースGS鮮明画像のいずれかを取得し、その画像を「真」または「偽」のいずれかに分類する、請求項
5に記載の方法。
【請求項7】
前記生成器ネットワーク及び前記識別器ネットワークが、敵対的損失を介して共に訓練される、請求項6に記載の方法。
【請求項8】
視覚ジオメトリ群(VGG)ネットワークの様々な層のアクティベーション間の差を最小化する、知覚的損失が追加される、請求項7に記載の方法。
【請求項9】
前記生成器ネットワークは、エンコーダ及びデコーダを含み、前記エンコーダが前記単一入力RS及びぼけ画像からコンパクトなボトルネックの形式で単一ビューRS補正とぼけ除去との共有特徴を抽出し、前記デコーダが前記コンパクトなボトルネックをオリジナルの入力画像サイズにアップサンプリングする、請求項7に記載の方法。
【請求項10】
単一入力ローリングシャッター(RS)及びぼけ画像におけるRS歪及びぼけアーティファクトを共に除去するための、コンピュータで読み取り可能なプログラムを有する非一時的にコンピュータで読み取り可能な記憶媒体であって、
前記コンピュータで読み取り可能なプログラムがコンピュータで実行されると、
カメラから複数のRSぼけ画像を生成すること(801)と、
単一ビュージョイントRS補正及びぼけ除去の畳み込みニューラルネットワーク(CNN)を訓練する訓練データを生成するために、構造及び動き認識RS歪み及びぼけレンダリングモジュールを用いることでGS鮮明画像、対応GS鮮明奥行きマップ、合成RSカメラの動きのセットからRSぼけ画像を合成すること(803)と、
前記単一ビュージョイントRS補正及びぼけ除去のCNNを用いることで、前記単一入力RS及びぼけ画像からRS修正及びぼけ除去画像を予測すること(805)と、
を前記コンピュータに実行させるための、非一時的にコンピュータで読み取り可能な記憶媒体。
【請求項11】
単一ビュージョイントRS補正及びぼけ除去が、単一の順方向パスで実行される、請求項10に記載の非一時的にコンピュータで読み取り可能な記憶媒体。
【請求項12】
訓練フェーズにおいて、前記単一ビュージョイントRS補正及びぼけ除去の畳み込みニューラルネットワーク(CNN)を訓練するための合成RSぼけ画像を生成するために、前記GS鮮明画像、前記対応GS鮮明奥行きマップ、前記合成RSカメラの動きのセットのための前記構造及び動き認識RS歪み及びぼけレンダリングモジュールを用いることをさらに含む、請求項10に記載の非一時的にコンピュータで読み取り可能な記憶媒体。
【請求項13】
テストフェーズにおいて、単一の順方向パスで対応RS補正及びぼけ除去画像を提供するために、前記単一ビュージョイントRS補正及びぼけ除去のCNNに前記単一
入力RS及び
ぼけ画像を生成する、請求項10に記載の非一時的にコンピュータで読み取り可能な記憶媒体。
【請求項14】
生成器ネットワークが、対応GS鮮明画像を予測する、請求項12に記載の非一時的にコンピュータで読み取り可能な記憶媒体。
【請求項15】
識別器ネットワークが、予測されたGS鮮明画像またはグラウンドトゥルースGS鮮明画像のいずれかを取得し、その画像を「真」または「偽」のいずれかに分類する、請求項
14に記載の非一時的にコンピュータで読み取り可能な記憶媒体。
【請求項16】
前記生成器ネットワーク及び前記識別器ネットワークが、敵対的損失を介して共に訓練される、請求項15に記載の非一時的にコンピュータで読み取り可能な記憶媒体。
【請求項17】
視覚ジオメトリ群(VGG)ネットワークの様々な層のアクティベーション間の差を最小化する、知覚的損失が追加される、請求項16に記載の非一時的にコンピュータで読み取り可能な記憶媒体。
【請求項18】
前記生成器ネットワークは、エンコーダ及びデコーダを含み、前記エンコーダが前記単一入力RS及びぼけ画像からコンパクトなボトルネックの形式で単一ビューRS補正とぼけ除去との共有特徴を抽出し、前記デコーダが前記コンパクトなボトルネックをオリジナルの入力画像サイズにアップサンプリングする、請求項16に記載の非一時的にコンピュータで読み取り可能な記憶媒体。
【請求項19】
単一入力ローリングシャッター(RS)及びぼけ画像におけるRS歪及びぼけアーティファクトを共に除去するためのシステムであって、
メモリと、
カメラから複数のRSぼけ画像を生成し(801)、
単一ビュージョイントRS補正及びぼけ除去の畳み込みニューラルネットワーク(CNN)を訓練する訓練データを生成するために、構造及び動き認識RS歪み及びぼけレンダリングモジュールを用いることでGS鮮明画像、対応GS鮮明奥行きマップ、合成RSカメラの動きのセットからRSぼけ画像を合成し(803)、
前記単一ビュージョイントRS補正及びぼけ除去のCNNを用いることで、前記単一入力RS及びぼけ画像からRS修正及びぼけ除去画像を予測する(805)ように構成された、前記メモリと通信する1つまたは複数のプロセッサと、
を有するシステム。
【請求項20】
生成器ネットワークが、対応GS鮮明画像を予測し、
識別器ネットワークが、予測されたGS鮮明画像またはグラウンドトゥルースGS鮮明画像のいずれかを取得し、その画像を「真」または「偽」のいずれかに分類し、
前記生成器ネットワーク及び前記識別器ネットワークが、敵対的損失を介して共に訓練され
視覚ジオメトリ群(VGG)ネットワークの様々な層のアクティベーション間の差を最小化する、知覚的損失が追加された、請求項19に記載のシステム。
【発明の詳細な説明】
【技術分野】
【0001】
この出願は、2019年11月22日に出願された米国仮特許出願第62/939,016号及び2020年11月5日に出願された米国特許出願第17/090,508号を基礎とする優先権を主張し、その開示の全てをここに取り込む。
【0002】
本発明は、合成ローリングシャッター(RS:rolling shutter)ぼけ画像を生成するための構造及び動き認識(structure-and-motion-aware)RS歪み及びぼけレンダリングモジュールに関し、何より単一入力RS及びぼけ画像からRS歪み及びぼけアーティファクトを同時に除去するためのエンドツーエンド学習アプローチに関する。
【背景技術】
【0003】
コスト上の利点を有する相補型金属酸化物半導体(CMOS:Complementary Metal Oxide Semiconductor)センサは、例えばウェブカメラ、携帯電話機、タブレット等の大多数の消費者向けカメラで採用されている。しかしながら、CMOSセンサによる1つの欠点はローリングシャッター(RS)機構によって動作することである。代替手段のグローバルシャッター(GS)のように同時ではなく、RSはセンサアレイの各行を(連続する複数の行間で一定の時間遅延を伴って)順次露光する。RSカメラの場合、露光期間中にカメラが動くと、撮影画像にRS歪みが生じる可能性がある。これは、特に屋内シーンのような暗い場所では、通常、ぼけアーティファクトと組み合わされる。
【発明の概要】
【0004】
単一入力ローリングシャッター(RS)及びぼけ画像におけるRS歪及びぼけアーティファクトを共に除去するためのコンピュータ実装方法が提示される。本方法は、GS鮮明画像、対応GS鮮明奥行きマップ、合成RSカメラの動きのセットから合成RSぼけ画像を生成するための構造及び動き認識RS歪み及びぼけレンダリングモジュール、並びに単一入力RS及びぼけ画像からRS修正及びぼけ除去画像を予測するための単一ビュージョイントRS補正及びぼけ除去のネットワークを含む。
【0005】
単一入力ローリングシャッター(RS)及びぼけ画像におけるRS歪及びぼけアーティファクトを共に除去するための、コンピュータで読み取り可能なプログラムを有する非一時的にコンピュータで読み取り可能な記憶媒体が提示される。コンピュータで読み取り可能なプログラムがコンピュータで実行されると、GS鮮明画像、対応GS鮮明奥行きマップ、合成RSカメラの動きのセットから合成RSぼけ画像を生成するための構造及び動き認識RS歪み及びぼけレンダリングモジュール、並びに単一入力RS及びぼけ画像からRS修正及びぼけ除去画像を予測するための単一ビュージョイントRS補正及びぼけ除去のネットワークをコンピュータに実行させる。
【0006】
単一入力ローリングシャッター(RS)及びぼけ画像におけるRS歪及びぼけアーティファクトを共に除去するためのシステムが提示される。本システムは、メモリと、構造及び動き認識RS歪み及びぼけレンダリングモジュールによって、GS鮮明画像、対応GS鮮明奥行きマップ、合成RSカメラの動きのセットから合成RSぼけ画像を生成し、単一ビュージョイントRS補正及びぼけ除去のネットワークを用いて単一入力RS及びぼけ画像からRS修正及びぼけ除去画像を予測するように構成された、上記メモリと通信する1つまたは複数のプロセッサと、を有する。
【0007】
これら及び他の特徴並びに利点は、以下の典型的な実施形態の詳細な説明を添付の図面と併せて読むことで明らかになるであろう。
【0008】
本開示では、後述するように、以下の図面を参照しながら好ましい実施形態について詳細に説明する。
【図面の簡単な説明】
【0009】
【
図1】
図1は、本発明の一実施形態による、構造及び動き認識ローリングシャッター(RS)歪み及びぼけレンダリングモジュール、並びに単一ビュージョイントRS補正及びぼけ除去のネットワークのブロック/フロー図である。
【0010】
【
図2】
図2は、本発明の一実施形態による、単一ビュージョイントRS補正及びぼけ除去のネットワークの例示的なアーキテクチャのブロック/フロー図である。
【0011】
【
図3】
図3は、本発明の一実施形態による、
図2のジェネレータネットワークのための例示的なアーキテクチャのブロック/フロー図である。
【0012】
【
図4】
図4は、本発明の一実施形態による、RSぼけビデオのための同時ローカライゼーション及びマッピング(SEAM)に対するRS補正及びぼけ除去の方法の適用例のブロック/フロー図である。
【0013】
【
図5】
図5は、本発明の一実施形態による、RSぼけ画像のためのSFM(Structure from Motion)に対するRS補正及びぼけ除去の方法の適用例のブロック/フロー図である。
【0014】
【
図6】
図6は、本発明の一実施形態による、構造及び動き認識ローリングシャッター(RS)歪み及びぼけレンダリングモジュール及び単一ビュージョイントRS補正及びぼけ除去のネットワークの実際の適用例のブロック/フロー図である。
【0015】
【
図7】
図7は、本発明の一実施形態による、RS補正及びぼけ除去のための例示的な処理システムのブロック/フロー図である。
【0016】
【
図8】
図8は、本発明の一実施形態による、RS補正及びぼけ除去のための例示的な方法のブロック/フロー図である。
【発明を実施するための形態】
【0017】
本発明は、単一入力RS及びぼけ画像におけるローリングシャッター(RS)歪み及びぼけアーティファクトを共に除去するためのエンドツーエンド学習アプローチを導入する。さらに、本発明は、本方法を訓練するために使用できる、本物そっくりなRS及びぼけ画像を合成するための手順を導入する。最後に、例示的な実施形態は、RSぼけ画像のためのSFM(Structure from Motion)、並びにRSぼけビデオのためのSLAM(Simultaneous Localization and Mapping)の目標に向けた本発明の適用例を示す。
【0018】
本発明は、単一入力RS及びぼけ画像からRS歪み及びぼけアーティファクトを同時に除去するためのエンドツーエンド学習アプローチを導入する。さらに、本発明は、畳み込みニューラルネットワーク(CNN:convolutional neural network)を訓練するための多数のRS及びぼけ画像を生成する新しいRS及びぼけ画像合成手順を導入する。
【0019】
例示的な実施形態は、単一ビュージョイントRS補正及びぼけ除去を単一の順方向パスで実行するために学習する、CNNアーキテクチャを導入する。単一ビューRS補正とぼけ除去のタスクは密接に繋がっているため、例示的なCNNは共有される特徴を抽出し、それらに同時に取り組むことが有利である。CNNを訓練するための多様で本物そっくりなRS画像及びぼけ画像の大規模なデータセットを得るために、例示的な実施形態は、レンダリング中のカメラの動きと奥行きマップの両方を利用する、構造及び動き認識RS歪み及びぼけ合成パイプラインを導入する。さらに、例示的な実施形態は、RSぼけ画像/ビデオのためのSFM/SLAMに対するアプローチ案を適用する。
【0020】
図1は、本発明の一実施形態による、構造及び動き認識ローリングシャッター(RS)歪み及びぼけレンダリングモジュール、並びに単一ビュージョイントRS補正及びぼけ除去のネットワークのブロック/フロー図である。
【0021】
図1は、構造及び動き認識RS歪み及びぼけレンダリングモジュール、並びに単一ビュージョイントRS補正及びぼけ除去のネットワークを示している。訓練フェーズ150において、合成RSぼけ画像120を生成するために、一組のグローバルシャッター(GS)鮮明画像112、対応GS鮮明奥行きマップ104及び合成RSカメラの動き102が、構造及び動き認識RS歪み及びぼけレンダリングモジュール110によって用いられる。具体的には、例示的な実施形態は、奥行き及びフレームにおけるカメラの動きを用いて2Dモーションフローを計算し、それを用いて局所領域における画素を平均化(ぼけを生成)して移動(RS歪みを生成)する。次に、単一ビュージョイントRS補正及びぼけ除去のネットワーク130をエンドツーエンドで訓練するために、合成されたRSぼけ画像120及びオリジナルのGS鮮明画像112が入力データ及びグラウンドトゥルース教師として用いられる。テスト時間160において、単一の本物そっくりなRSぼけ画像140がネットワーク130に入力され、単一の順方向パスにおいて対応RS修正及びぼけ除去画像145を生成する。
【0022】
図2は、本発明の一実施形態による、単一ビュージョイントRS補正及びぼけ除去のネットワークの例示的なアーキテクチャのブロック/フロー図である。
【0023】
訓練フェーズ150において、入力RSぼけ画像202が与えられると、生成器ネットワーク204は、対応GS鮮明画像206を予測する。識別器ネットワーク212は、予測GS鮮明画像206またはグラウンドトゥルースGS鮮明画像208のいずれかを取り込み、それが「偽」(予測画像206)または「真」(グラウンドトゥルース画像208)であるか否かを分類することを目的とする。これら2つのサブネットワークは、敵対的損失(adversarial loss)214を介して共に訓練される。さらに、例示的な実施形態は、予測画像206及びグラウンドトゥルース画像208に適用される(例えば、ImageNetで事前訓練された)視覚ジオメトリグループ(VGG:visual geometry group)ネットワークの様々な層(conv1_1、conv2_1、conv3_1、conv4_1、conv5_1)のアクティベーション間の差を最小化する知覚的(perceptual loss)損失210を追加する。テスト時間160では、生成器ネットワーク204のみが必要とされ、識別器ネットワーク212は廃棄される。生成器ネットワーク204のアーキテクチャの一例は
図3で示され、pix2pixHDのマルチスケール識別器ネットワークが識別器ネットワーク212として使用できる。
【0024】
図3は、本発明の一実施形態による、
図2の生成器ネットワークのための例示的なアーキテクチャのブロック/フロー図である。
【0025】
生成器ネットワーク204は、入力RSぼけ画像202からコンパクトなボトルネックの形式で、単一ビューRS補正とぼけ除去との共有特徴を抽出するエンコーダ325と、コンパクトなボトルネックをオリジナルの入力画像サイズにアップサンプリングし、出力予測GS鮮明画像206を生成するデコーダ335とを有する。例示的な実施形態は、エンコーダ325とデコーダ335との間の情報共有を可能にするために、エンコーダ325とデコーダ335とのレイヤ間にスキップ接続302を追加する。全ての畳み込み層305は、1×1ウィンドウサイズを用いる最終段の畳み込み層320を除いて、3×3のウィンドウサイズを用いる。ボックスの下の数字はチャンネル数を表している。ダウンサンプリングは、ストライド2の2×2最大値プーリングによって行われる。アップ畳み込み層には、特徴チャネルの数を半分にするアップサンプリング及び2×2畳み込みを含む。エンコーダ325及びデコーダ335は、畳み込み層305、プーリング層310及びアップ畳み込み層315を含む。
【0026】
図4は、本発明の一実施形態による、RSぼけビデオのための同時ローカライゼーション及びマッピング(SLAM)に対するRS補正及びぼけ除去の方法の適用例のブロック/フロー図である。
【0027】
RSぼけビデオのためのSLAMに対するRS補正及びぼけ除去の方法の適用例を
図4に示す。入力RSぼけビデオ410は、RS歪み及びぼけアーティファクトを有する連続画像フレームのセットである。RS歪み及びぼけアーティファクトを除去し、対応RS修正及びぼけ除去のフレーム430を得るために、各フレームは、提案するRS補正及びぼけ除去法420(例えば、RS補正及びぼけ除去)にそれぞれ渡される。RS修正フレーム及びぼけ除去フレーム430は、ビデオで観察されるカメラの軌跡及びシーン構造450を推定するために、SLAMモジュール440に送られる。
【0028】
図5は、本発明の一実施形態による、RSぼけ画像のためのSFM(Structure from Motion)に対するRS補正及びぼけ除去の方法の適用例のブロック/フロー図である。
【0029】
RSぼけ画像のためのSFMに対するRS補正及びぼけ除去の方法の適用例を
図5に示す。例えば、Google Image Searchから得られるRSぼけ画像510の順序不同のセットは、RSぼけ画像を備えるSFM用の入力として使用できる。RS歪み及びぼけアーティファクトを除去し、対応RS修正及びぼけ除去画像530を得るために、各画像は、提案するRS補正及びぼけ除去法520(例えば、RS補正及びぼけ除去)に個別に渡される。RS修正画像及びぼけ除去画像530は、画像内で観察されるカメラ姿勢及びシーン構造550を推定するためにSFMモジュール540に送られる。
【0030】
図6は、本発明の一実施形態による、構造及び動き認識ローリングシャッター(RS)歪み及びぼけレンダリングモジュール、並びに単一ビュージョイントRS補正及びぼけ除去のネットワークの実際の適用例のブロック/フロー図である。
【0031】
1つの実際の適用例において、ユーザ602は、画像606をキャプチャするためにカメラ等のキャプチャ装置604を用いる。画像606は、ぼけ及びRS歪みを含むことができる。本発明のCNNアーキテクチャ608は、キャプチャされた画像606からぼけ及びRS効果を推定し、除去するために使用できる。CNNアーキテクチャ608は、RS歪みのない鮮明な画像610をユーザ602に出力することを可能にする。本発明の例示的な実施形態は、単一入力RS及びぼけ画像におけるRS歪み及びぼけアーティファクトを共に除去するためのエンドツーエンド学習手法を導入する。さらに、本発明は、この方法を訓練するために使用できる、本物そっくりなRS及びぼけ画像を合成するための手順を導入する。最後に、例示的な実施形態は、RSぼけ画像のためのSFM、並びにRSぼけビデオのためのSLAMの目標に向けた本発明の適用例を示す。CNNアーキテクチャ608は、単一の順方向パスで単一ビュージョイントRS補正及びぼけ除去を実行することを学習する。単一ビューRS補正及びぼけ除去のタスクは密接に繋がっているため、CNN608は共有された特徴を抽出し、それらに同時に取り組むことが有利である。
【0032】
図7は、本発明の一実施形態による、RS補正及びぼけ除去のための例示的な処理システムのブロック/フロー図である。
【0033】
処理システムは、システムバス702を介して他の構成要素と動作可能に接続された、少なくとも1つのプロセッサまたはプロセッサ装置(CPU)704を含む。システムバス702には、キャッシュ706、リードオンリメモリ708、ランダムアクセスメモリ710、入力/出力(I/O)アダプタ720、ネットワークアダプタ730、ユーザインターフェースアダプタ740及びディスプレイアダプタ750が動作可能に接続されている。バス702には、1つまたは複数のカメラ760を接続できる。カメラ760は、訓練モジュール150及びテストモジュール160を用いることで、RS補正及びぼけ除去のために、構造及び動き認識ローリングシャッター(RS)歪み及びぼけレンダリングモジュール、並びに単一ビュージョイントRS補正及びぼけ除去のネットワーク770を用いることができる。
【0034】
記憶装置722は、I/Oアダプタ720によってシステムバス702に動作可能に接続されている。記憶装置722は、ディスク記憶装置(例えば、磁気または光ディスク記憶装置)、固体磁気装置等のうちのいずれであってもよい。
【0035】
トランシーバ732は、ネットワークアダプタ730によってシステムバス702に動作可能に接続されている。
【0036】
複数のユーザ入力装置742は、ユーザインタフェースアダプタ740によってシステムバス702に動作可能に接続されている。ユーザ入力装置742は、キーボード、マウス、キーパッド、画像キャプチャ装置、モーションセンシングデバイス、マイクロフォン、あるいはこれらの装置のうちの少なくとも2つのデバイスの機能を組み込んだデバイス等のいずれであってもよい。もちろん、本発明の原理の趣旨を維持する限りにおいて、他のタイプの入力装置を使用することも可能である。複数のユーザ入力装置742は、同じタイプのユーザ入力装置であってもよく、異なるタイプのユーザ入力装置であってもよい。ユーザ入力装置742は、処理システムに情報を入力し、処理システムから情報を出力するために使用される。
【0037】
ディスプレイ装置752は、ディスプレイアダプタ750によってシステムバス702に動作可能に接続されている。
【0038】
もちろん、処理システムは、当業者であれば容易に思いつくような他の要素(不図示)を含んでいてもよく、特定の要素を省略してもよい。例えば、当業者であれば容易に理解できるが、処理システムには、その詳細な実装に応じて他の様々な入力装置及び/または出力装置を含むことができる。例えば、無線及び/または有線による種々の入力装置及び/または出力装置を使用できる。さらに、当業者であれば容易に理解できるが、様々な構成において追加のプロセッサ、コントローラ、メモリ等を用いることも可能である。処理システムの上記及び他の変形例は、本明細書で提供される本原理の教示によって当業者であれば容易に考えられるであろう。
【0039】
図8は、本発明の一実施形態による、RS補正及びぼけ除去のための例示的な方法のブロック/フロー図である。
【0040】
ブロック801において、カメラから複数のRSぼけ画像を生成する。
【0041】
ブロック803において、単一ビュージョイントRS補正及びぼけ除去の畳み込みニューラルネットワーク(CNN)を訓練する訓練データを生成するために、構造及び動き認識RS歪み及びぼけレンダリングモジュールを用いることで、GS鮮明画像、対応GS鮮明奥行きマップ、合成RSカメラの動きのセットからRSぼけ画像を合成する。
【0042】
ブロック805において、単一ビュージョイントRS補正及びぼけ除去のCNNを用いることで、単一入力RS及びぼけ画像からRS修正及びぼけ除去画像を予測する。
【0043】
本明細書で用いる「データ」、「コンテンツ」、「情報」及び同様の用語は、様々な例示的な実施形態によって取得され、送信され、受信され、表示され、及び/または格納されることが可能なデータを示すために、交換可能に使用できる。したがって、これらの用語の使用は、開示の主旨及び範囲を制限するものと解釈されるべきではない。さらに、本明細書に別の計算デバイスからデータを受信するための計算デバイスが記載されている場合、データは、別の計算デバイスから直接受信してもよく、1つ以上の中間計算デバイス、例えば1つ以上のサーバ、リレー、ルータ、ネットワークアクセスポイント、基地局等を介して間接的に受信してもよい。同様に、本明細書にデータを別の計算デバイスに送信するための計算デバイスが記載されている場合、データは、別の計算データに直接送信してもよく、例えば、1つ以上のサーバ、リレー、ルータ、ネットワークアクセスポイント、基地局及び/または同様のもの等の1つ以上の中間計算デバイスを介して間接的に送信してもよい。
【0044】
ユーザとのインタラクションを提供するための、本明細書に記載されている実施形態は、ユーザに情報を表示するためのディスプレイデバイス、例えば、CRT(cathode ray tube)またはLCD(liquid crystal display)モニタ、キーボード、ユーザがコンピュータに入力できるポインティングデバイス、例えばマウスまたはトラックボールを有するコンピュータで実施できる。他の種類の装置もユーザとのインタラクションを提供するために使用することができる。例えば、ユーザに提供されるフィードバックは、任意の形態の感覚フィードバック、例えば視覚フィードバック、聴覚フィードバックまたは触覚フィードバックとすることが可能であり、ユーザからの入力は、音響入力、音声入力または触覚入力を含む任意の形態で受信できる。
【0045】
当業者であれば理解するように、本発明の態様は、システム、方法またはコンピュータプログラム製品として実施してもよい。したがって、本発明の態様は、全体としてハードウェアの実施形態であってもよく、全体としてソフトウェアの実施形態(ファームウェア、常駐ソフトウェア、マイクロコード等を含む)であってもよく、本明細書において、一般に「回路」、「モジュール」、「計算機」、「装置」または「システム」と呼ぶことができる、ソフトウェアとハードウェアの態様を組み合わせた実施の形態を採用してもよい。さらに、本発明の態様は、コンピュータで読み取り可能なプログラムコードを有する、1つまたは複数のコンピュータで読み取り可能な媒体で具現化された、コンピュータプログラム製品の形態を採用してもよい。
【0046】
1つまたは複数のコンピュータで読み取り可能な媒体の任意の組合せを用いてもよい。コンピュータで読み取り可能な媒体は、コンピュータで読み取り可能な信号媒体またはコンピュータで読み取り可能な記録媒体であってもよい。コンピュータで読み取り可能な記録媒体は、例えば、電子、磁気、光学、電磁気、赤外線または半導体システム、装置またはデバイス、あるいは前述の任意の適切な組合せとすることができるが、これらに限定されない。コンピュータで読み取り可能な記録媒体のより具体的な例(以下に限定されない)は、1つ以上のワイヤ、携帯用コンピュータディスケット、ハードディスク、ランダムアクセスメモリ(RAM)、リードオンリーメモリ(ROM)、消去可能プログラマブルリードオンリーメモリ(EPROMまたはフラッシュメモリ)、光ファイバ、携帯用コンパクトディスクリードオンリーメモリ(CD-ROM)、光データ記憶装置、磁気データ記憶装置または前述した任意の適切な組み合わせを含む。本文書のコンテキストにおいて、コンピュータで読み取り可能な記録媒体は、命令実行システム、装置またはデバイスによって、またはそれに関連して使用するためのプログラムを含む、またはそれを記憶できる、任意の有形媒体であってもよい。
【0047】
コンピュータで読み取り可能な信号媒体には、例えば、ベースバンドで、または搬送波の一部として、コンピュータで読み取り可能なプログラムコードが具現化された伝搬データ信号を含むことができる。そのような伝播信号は、電磁、光学またはそれらの任意の適切な組み合わせを含むが、それらに限定されない、任意の様々な形態がある。コンピュータ読み取り可能な信号媒体は、コンピュータ読み取り可能な記録媒体ではなく、命令実行システム、装置または装置によって、またはそれに関連して使用するためにプログラムを通信、伝播、または移送できる、任意のコンピュータ読み取り可能な媒体であってもよい。
【0048】
コンピュータで読み取り可能な媒体で具現化されたプログラムコードは、無線、有線、光ファイバケーブル、RF等、あるいは前述した任意の適切な組合せを含むが、これらに限定されない、任意の適切な媒体を用いて送信される。
【0049】
本発明の態様に関する処理を実行するためのコンピュータプログラムコードは、Java、Smalltalk、C++等のオブジェクト指向プログラミング言語及び「C」プログラミング言語または類似のプログラミング言語等の従来の手続き型プログラミング言語を含む、1つ以上のプログラミング言語の任意の組み合わせで書くことができる。プログラムコードは、全体的にユーザのコンピュータで実行されてもよく、スタンドアロンソフトウェアパッケージとして部分的にユーザのコンピュータで実行されてもよく、部分的にユーザのコンピュータで実行され、かつ部分的にリモートコンピュータで実行されてもよく、全体的にリモートコンピュータまたはサーバで実行されてもよい。後者のシナリオにおいて、リモートコンピュータは、ローカルエリアネットワーク(LAN)または広域ネットワーク(WAN)を含む任意のタイプのネットワークを介してユーザのコンピュータと接続されてもよく、(例えば、インターネットサービスプロバイダを利用したインターネットを介して)外部コンピュータと接続されてもよい。
【0050】
本発明の態様について、本発明の一実施形態による、方法、装置(システム)、並びにコンピュータプログラム製品のフローチャート及び/またはブロック図を参照して以下で説明する。フローチャート及び/またはブロック図の各ブロック、並びにフローチャート及び/またはブロック図のブロックにおける組合せは、コンピュータプログラム命令によって実施できることを理解されたい。これらのコンピュータプログラム命令は、コンピュータまたは他のプログラマブルデータ処理装置のプロセッサを通して実行される命令が、フローチャート及び/またはブロック図の1つまたは複数のブロックまたはモジュールに指定される機能/動作を実施するための手段を作り出すようなマシンを生成するために、汎用コンピュータ、専用コンピュータまたは他のプログラマブルデータ処理装置のプロセッサに提供される。
【0051】
これらのコンピュータプログラム命令は、コンピュータで読み取り可能な媒体に格納された命令が、フローチャート及び/またはブロック図の1つまたは複数のブロックまたはモジュールに指定された機能/動作を実装する命令を含む製品を生成するように、コンピュータ、他のプログラマブルデータ処理装置または他のデバイスに、特定の方法で機能するように指示できるコンピュータで読み取り可能な媒体に格納できる。
【0052】
コンピュータプログラム命令は、またコンピュータ、他のプログラマブルデータ処理装置または他のデバイスにロードされて、一連の動作ステップがコンピュータ、他のプログラマブル装置または他のデバイスで実行され、コンピュータまたは他のプログラマブル装置で実行される命令が、フローチャート及び/またはブロック図のブロックまたはモジュールに指定された機能/動作を実装するためのプロセスを提供するように、コンピュータ実装プロセスを生成できる。
【0053】
本明細書で使用する「プロセッサ」という用語は、例えばCPU(central processing unit)及び/または他の処理回路を含むもの等、任意の処理装置を含むことを意図しており、「プロセッサ」という用語は1つ以上の処理装置を指すことが可能であり、処理装置に関連する様々な要素は、他の処理装置によって共有されることも理解されたい。
【0054】
本明細書で使用する「メモリ」という用語は、例えば、RAM、ROM、固定メモリデバイス(例えば、ハードドライブ)、リムーバブルメモリデバイス(例えば、ディスケット)、フラッシュメモリ等、プロセッサまたはCPUに関連するメモリを含むことを意図している。このようなメモリは、コンピュータで読み取り可能な記録媒体と考えることができる。
【0055】
さらに、本明細書で使用する「入力/出力装置」または「I/O装置」という用語は、例えば、処理ユニットにデータを入力するための1つまたは複数の入力装置(例えば、キーボード、マウス、スキャナ等)及び/または処理ユニットに関連する、結果を提示するための1つまたは複数の出力装置(例えば、スピーカ、ディスプレイ、プリンタなど)を含むことを意図している。
【0056】
上記は、あらゆる観点において説明的(illustrative)かつ典型的(exemplary)であって限定的でないものと理解されるべきであり、本明細書で開示する本発明の範囲は、詳細な説明から決定されるべきではなく、特許法で認められた最大限の広さに基づいて解釈される特許請求の範囲から決定されるべきである。本明細書中に図示及び記載されている実施形態は、本発明の原理を説明するものにすぎず、本発明の範囲及び主旨から逸脱することなく当業者は様々な変更を実施することができることを理解されたい。当業者は、本発明の範囲及び精神から逸脱することなく、様々な他の特徴の組み合わせを実施できる。以上、本発明の態様について、特許法で要求される細部及び詳細な事項と共に説明したが、特許証で保護されることを要求する特許請求の範囲は、添付の特許請求の範囲に示されている。