(19)【発行国】日本国特許庁(JP)
(12)【公報種別】特許公報(B2)
(11)【特許番号】
(24)【登録日】2024-06-03
(45)【発行日】2024-06-11
(54)【発明の名称】マルチビュースタイル変換のシステムおよび方法
(51)【国際特許分類】
H04N 13/122 20180101AFI20240604BHJP
H04N 13/111 20180101ALI20240604BHJP
G06T 15/20 20110101ALI20240604BHJP
【FI】
H04N13/122
H04N13/111
G06T15/20 500
(21)【出願番号】P 2022552455
(86)(22)【出願日】2021-01-28
(86)【国際出願番号】 US2021015570
(87)【国際公開番号】W WO2021178079
(87)【国際公開日】2021-09-10
【審査請求日】2022-11-21
(32)【優先日】2020-03-01
(33)【優先権主張国・地域又は機関】US
(73)【特許権者】
【識別番号】514274546
【氏名又は名称】レイア、インコーポレイテッド
【氏名又は名称原語表記】LEIA INC.
(74)【代理人】
【識別番号】100092783
【氏名又は名称】小林 浩
(74)【代理人】
【識別番号】100120134
【氏名又は名称】大森 規雄
(74)【代理人】
【識別番号】100093676
【氏名又は名称】小林 純子
(74)【代理人】
【識別番号】100126354
【氏名又は名称】藤田 尚
(72)【発明者】
【氏名】ダルクィスト,ニコラス
(72)【発明者】
【氏名】グナシーラン,サラバナ
(72)【発明者】
【氏名】コーリ,プネート
(72)【発明者】
【氏名】リー,エドワード
【審査官】秦野 孝一郎
(56)【参考文献】
【文献】特開2012-060345(JP,A)
【文献】特開2013-225740(JP,A)
【文献】国際公開第2020/004013(WO,A1)
【文献】米国特許出願公開第2013/0136337(US,A1)
【文献】米国特許出願公開第2018/0082407(US,A1)
【文献】国際公開第2019/139858(WO,A1)
【文献】米国特許出願公開第2019/0026956(US,A1)
【文献】特表2013-524625(JP,A)
(58)【調査した分野】(Int.Cl.,DB名)
H04N 13/00-13/3982
G06T 15/20
(57)【特許請求の範囲】
【請求項1】
処理回路と、
命令を含むメモリとを備えるマルチビュースタイル変換システムであって、前記命令が前記処理回路によって実行されると、前記処理回路に、
シーンの第1視点(fisrt perspective)を表す第1画像、前記第1画像に対応する第1視差マップ、および前記シーンの第2視点(second perspective)を表す第2画像を受信させ、
前記第1画像に適用されたスタイル変換モデルを表す第1スタイル化画像を生成させ、
前記第1スタイル化画像および前記第1視差マップに基づいて、前記第1スタイル化画像の前記第2視点への第1シフトを含むスタイル化シフト画像を生成させ、
前記スタイル化シフト画像のガイドフィルタおよび前記第2画像に基づいて第2スタイル化画像を生成させ、前記ガイドフィルタが、前記第2画像に基づいて前記第2スタイル化画像におけるエッジ特性を処理する、マルチビュースタイル変換システム。
【請求項2】
マルチビューディスプレイをさらに備え、
前記命令が、前記処理回路にさらに、
前記第1視差マップに基づいて前記第1スタイル化画像を生成させ、
前記第2画像に対応する第2視差マップに基づいて前記第2スタイル化画像を生成させ、前記第1スタイル化画像および前記第2スタイル化画像が、マルチビューディスプレイによって同時にレンダリングされるように構成され、
前記命令が、前記処理回路にさらに、
前記第1スタイル化画像および前記第2スタイル化画像を前記マルチビューディスプレイに表示させる、請求項1に記載のマルチビュースタイル変換システム。
【請求項3】
前記命令が、前記処理回路にさらに、
前記第1スタイル化画像および前記第2スタイル化画像に基づいて複数のスタイル化視点ビューを合成させ、
前記複数のスタイル化視点ビューを前記マルチビューディスプレイに表示させる、請求項2に記載のマルチビュースタイル変換システム。
【請求項4】
前記命令が、前記処理回路にさらに、前記第2スタイル化画像への第2ガイドフィルタの適用に基づいて第2フィルタ後画像として前記第2スタイル化画像を生成させ、前記第2フィルタ後画像の生成が、前記第2画像にさらに基づく、請求項1に記載のマルチビュースタイル変換システム。
【請求項5】
前記命令が、前記処理回路にさらに、前記第1スタイル化画像への第1ガイドフィルタの適用に基づいて第1フィルタ後画像として前記第1スタイル化画像を生成させ、前記第1フィルタ後画像の生成が、前記第1画像にさらに基づく、請求項4に記載のマルチビュースタイル変換システム。
【請求項6】
前記第1ガイドフィルタが、第1ガイド鮮明化フィルタを含み、前記第1ガイド鮮明化フィルタが、前記第1画像内の第1複数のエッジに基づいて前記第1スタイル化画像を鮮明化し、
前記第2ガイドフィルタが、第2ガイド鮮明化フィルタを含み、前記第2ガイド鮮明化フィルタが、前記第2画像内の第2複数のエッジに基づいて前記第2スタイル化画像を鮮明化する、請求項5に記載のマルチビュースタイル変換システム。
【請求項7】
前記命令が、前記処理回路にさらに、前記第1画像および前記スタイル変換モデルに基づいて前記第1スタイル化画像を生成させる、請求項1に記載のマルチビュースタイル変換システム。
【請求項8】
前記スタイル変換モデルが、複数のターゲットスタイル画像に関する機械学習を介して訓練されたスタイル変換ニューラルネットワークを含む、請求項7に記載のマルチビュースタイル変換システム。
【請求項9】
前記命令が、前記処理回路にさらに、
ターゲットスタイル画像を受信させ、
前記ターゲットスタイル画像へのニューラルスタイル変換(NST)アルゴリズムの適用に基づいてターゲットスタイルを識別させ、
前記ターゲットスタイルに基づいて前記スタイル変換モデルを生成させる、請求項7に記載のマルチビュースタイル変換システム。
【請求項10】
前記第1視差マップが、前記第1画像および前記第2画像に基づいて生成され、前記第2画像の第2複数の画像点に対する前記第1画像の第1複数の画像点の水平座標の差を表し、
第2視差マップが、前記第1画像および前記第2画像に基づいて生成され、前記第1画像の前記第1複数の画像点に対する前記第2画像の前記第2複数の画像点の水平座標の差を表す、請求項1に記載のマルチビュースタイル変換システム。
【請求項11】
前記命令が、前記処理回路にさらに、
前記第1スタイル化画像および前記第1視差マップに基づいて、第1外挿画像であって、前記第1画像に関連付けられた前記シーンの前記第1視点に基づいて第3視点に外挿された第1合成視点を表す第1外挿画像を生成させ、
前記第2スタイル化画像および前記第2視差マップに基づいて、第2外挿画像であって、前記第2画像に関連付けられた前記シーンの前記第2視点に基づいて第4視点に外挿された第2合成視点を表す第2外挿画像を生成させ、
前記第1外挿画像および前記第2外挿画像を前記マルチビューディスプレイに表示させる、請求項2に記載のマルチビュースタイル変換システム。
【請求項12】
前記命令が、前記処理回路にさらに、
前記第1スタイル化画像を第1の所望の出力視点から再投影することに基づいて第1スタイル化視点画像を生成させ、
前記第2スタイル化画像を第2の所望の出力視点から再投影することに基づいて第2スタイル化視点画像を生成させ、
前記第1スタイル化視点画像および前記第2スタイル化視点画像を前記マルチビューディスプレイに表示させる、請求項2に記載のマルチビュースタイル変換システム。
【請求項13】
前記第1の所望の出力視点が、デバイスマルチビューディスプレイに関連付けられた第1デバイス視点に基づき、
前記第2の所望の出力視点が、前記デバイスマルチビューディスプレイに関連付けられた第2デバイス視点に基づく、請求項12に記載のマルチビュースタイル変換システム。
【請求項14】
前記命令が、前記処理回路にさらに、
第3の所望の出力視点から第3スタイル化画像を再投影することに基づいて第3スタイル化視点画像を生成させ、
第4の所望の出力視点から第4スタイル化画像を再投影することに基づいて第4スタイル化視点画像を生成させ、
前記第3スタイル化視点画像および前記第4スタイル化視点画像を前記マルチビューディスプレイに表示させる、請求項12に記載のマルチビュースタイル変換システム。
【請求項15】
シーンの第1視点を表す第1画像、前記第1画像に対応する第1視差マップ、および前記シーンの第2視点を表す第2画像を受信するステップと、
前記第1画像に適用されたスタイル変換モデルを表す第1スタイル化画像を生成するステップと、
前記第1スタイル化画像および前記第1視差マップに基づいて、前記第1スタイル化画像の前記第2視点への第1シフトを含むスタイル化シフト画像を生成するステップと、
前記スタイル化シフト画像のガイドフィルタおよび前記第2画像に基づいて第2スタイル化画像を生成するステップであって、前記ガイドフィルタが、前記第2画像に基づいて前記第2スタイル化画像におけるエッジ特性を処理するステップとを含む、マルチビュースタイル変換方法。
【請求項16】
前記第1視差マップに基づいて第1スタイル化画像を生成するステップと、
前記第2画像に対応する第2視差マップに基づいて第2スタイル化画像を生成するステップとを含み、前記第1スタイル化画像および前記第2スタイル化画像が、マルチビューディスプレイによってレンダリングされるように構成される、請求項15に記載のマルチビュースタイル変換方法。
【請求項17】
前記第1スタイル化画像および前記第2スタイル化画像に基づいて複数のスタイル化視点ビューを合成するステップをさらに含む、請求項16に記載のマルチビュースタイル変換方法。
【請求項18】
前記第2スタイル化画像への第2ガイドフィルタの適用に基づいて第2フィルタ後画像として前記第2スタイル化画像を生成するステップをさらに含み、前記第2フィルタ後画像の前記生成が、前記第2画像にさらに基づくステップをさらに含む、請求項16に記載のマルチビュースタイル変換方法。
【請求項19】
前記第1スタイル化画像への第1ガイドフィルタの適用に基づいて第1フィルタ後画像として前記第1のスタイル化画像を生成するステップをさらに含み、前記第1フィルタ後画像の生成が、前記第1画像にさらに基づく、請求項18に記載のマルチビュースタイル変換方法。
【請求項20】
前記第1ガイドフィルタが第1ガイド鮮明化フィルタを含み、前記第1ガイド鮮明化フィルタが、前記第1画像内の第1複数のエッジに基づいて前記第1スタイル化画像を鮮明化し、
前記第2ガイドフィルタが第2ガイド鮮明化フィルタを含み、前記第2ガイド鮮明化フィルタが、前記第2画像内の第2複数のエッジに基づいて前記第2スタイル化画像を鮮明化する、請求項19に記載のマルチビュースタイル変換方法。
【請求項21】
前記第1画像および前記スタイル変換モデルに基づいて前記第1スタイル化画像を生成するステップをさらに含む、請求項15に記載のマルチビュースタイル変換方法。
【請求項22】
前記スタイル変換モデルが、複数のターゲットスタイル画像に関する機械学習を介して訓練されたスタイル変換ニューラルネットワークを含む、請求項21に記載のマルチビュースタイル変換方法。
【請求項23】
ターゲットスタイル画像を受信するステップと、
前記ターゲットスタイル画像へのニューラルスタイル変換(NST)アルゴリズムの適用に基づいてターゲットスタイルを識別するステップと、
前記ターゲットスタイルに基づいて前記スタイル変換モデルを生成するステップとをさらに含む、請求項21に記載のマルチビュースタイル変換方法。
【請求項24】
前記第1視差マップが、前記第1画像および前記第2画像に基づいて生成され、前記第2画像の第2複数の画像点に対する前記第1画像の第1複数の画像点の水平座標の差を表し、
第2視差マップが、前記第1画像および前記第2画像に基づいて生成され、前記第1画像内の前記第1複数の画像点に対する前記第2画像内の前記第2複数の画像点の水平座標の差を表す、請求項15に記載のマルチビュースタイル変換方法。
【請求項25】
前記第1スタイル化画像および前記第1視差マップに基づいて、第1外挿画像であって、前記第1画像に関連付けられた前記シーンの前記第1視点に基づいて第3視点に外挿された第1合成視点を表す第1外挿画像を生成するステップと、
前記第2スタイル化画像および前記第2視差マップに基づいて、第2外挿画像であって、前記第2画像に関連付けられた前記シーンの前記第2視点に基づいて第4視点に外挿された第2合成視点を表す第2外挿画像を生成するステップとをさらに含む、請求項16に記載のマルチビュースタイル変換方法。
【請求項26】
前記第1スタイル化画像を第1の所望の出力視点から再投影することに基づいて第1スタイル化視点画像を生成するステップと、
前記第2スタイル化画像を第2の所望の出力視点から再投影することに基づいて第2スタイル化視点画像を生成するステップとをさらに含む、請求項16に記載のマルチビュースタイル変換方法。
【請求項27】
前記第1の所望の出力視点が、デバイスマルチビューディスプレイに関連付けられた第1デバイス視点に基づき、
前記第2の所望の出力視点が、前記デバイスマルチビューディスプレイに関連付けられた第2デバイス視点に基づく、請求項26に記載のマルチビュースタイル変換方法。
【請求項28】
第3の所望の出力視点から
第3スタイル化画像を再投影することに基づいて第3スタイル化視点画像を生成するステップと、
第4の所望の出力視点から
第4スタイル化画像を再投影することに基づいて第4スタイル化
視点画像を生成するステップとをさらに含む、請求項26に記載のマルチビュースタイル変換方法。
【発明の詳細な説明】
【技術分野】
【0001】
関連出願の相互参照
本出願は、2020年3月1日に出願された米国仮特許出願第62/983,739号の優先権を主張し、その全体が参照により本明細書に組み込まれる。
【背景技術】
【0002】
電子ディスプレイは、多種多様なデバイスおよび製品のユーザに情報を伝達するためのほぼユビキタスな媒体である。最も一般的に使用されている電子ディスプレイには、陰極線管(CRT)、プラズマディスプレイパネル(PDP)、液晶ディスプレイ(LCD)、エレクトロルミネセントディスプレイ(EL)、有機発光ダイオード(OLED)、アクティブマトリクスOLED(AMOLED)ディスプレイ、および電気泳動ディスプレイ(EP)、ならびに電気機械的または電気流体的光変調を使用する様々なディスプレイ(例えば、デジタルマイクロミラーデバイス、エレクトロウェッティングディスプレイなど)が含まれる。一般に、電子ディスプレイは、アクティブディスプレイ(すなわち、光を発するディスプレイ)またはパッシブディスプレイ(すなわち、別の光源によって提供される光を変調するディスプレイ)のいずれかに分類され得る。アクティブディスプレイの最も明白な例は、CRT、PDP、およびOLED/AMOLEDである。
【0003】
電子ディスプレイに表示されるコンテンツおよび関連情報は、一般に、グラフィックスプロセッシングユニット(GPU)を使用してレンダリングされ、ディスプレイドライバに渡される。場合によっては、元のコンテンツ、特に画像または写真は、レンダリング前に操作または修正されてもよい。操作または修正は、例えば、情報の表示に関連付けられたGPUまたは別のプロセッサを使用して提供され得る。
【発明の概要】
【0004】
本明細書に記載の原理による例および実施形態の様々な特徴は、添付の図面と併せて以下の詳細な説明を参照することによってより容易に理解することができ、同様の参照番号は同様の構造要素を示す。
本開示は、以下の[1]から[28]を含む。
[1]処理回路と、
命令を含むメモリとを備えるマルチビュースタイル変換システムであって、上記命令が上記処理回路によって実行されると、上記処理回路に、
シーンの第1視点(fisrt perspective)を表す第1画像、上記第1画像に対応する第1視差マップ、および上記シーンの第2視点(second perspective)を表す第2画像を受信させ、
上記第1画像に適用されたスタイル変換モデルを表す第1スタイル化画像を生成させ、
上記第1スタイル化画像および上記第1視差マップに基づいて、上記第1スタイル化画像の上記第2視点への第1シフトを含むスタイル化シフト画像を生成させ、
上記スタイル化シフト画像のガイドフィルタおよび上記第2画像に基づいて第2スタイル化画像を生成させ、上記ガイドフィルタが、上記第2画像に基づいて上記第2スタイル化画像におけるエッジ特性を処理する、マルチビュースタイル変換システム。
[2]マルチビューディスプレイをさらに備え、
上記命令が、上記処理回路にさらに、
上記第1視差マップに基づいて上記第1スタイル化画像を生成させ、
上記第2画像に対応する第2視差マップに基づいて上記第2スタイル化画像を生成させ、上記第1スタイル化画像および上記第2スタイル化画像が、マルチビューディスプレイによって同時にレンダリングされるように構成され、
上記命令が、上記処理回路にさらに、
上記第1スタイル化画像および上記第2スタイル化画像を上記マルチビューディスプレイに表示させる、上記[1]に記載のマルチビュースタイル変換システム。
[3]上記命令が、上記処理回路にさらに、
上記第1スタイル化画像および上記第2スタイル化画像に基づいて複数のスタイル化視点ビューを合成させ、
上記複数のスタイル化視点ビューを上記マルチビューディスプレイに表示させる、上記[2]に記載のマルチビュースタイル変換システム。
[4]上記命令が、上記処理回路にさらに、上記第2スタイル化画像への第2ガイドフィルタの適用に基づいて第2フィルタ後画像として上記第2スタイル化画像を生成させ、上記第2フィルタ後画像の生成が、上記第2画像にさらに基づく、上記[1]に記載のマルチビュースタイル変換システム。
[5]上記命令が、上記処理回路にさらに、上記第1スタイル化画像への第1ガイドフィルタの適用に基づいて第1フィルタ後画像として上記第1スタイル化画像を生成させ、上記第1フィルタ後画像の生成が、上記第1画像にさらに基づく、上記[4]に記載のマルチビュースタイル変換システム。
[6]上記第1ガイドフィルタが、第1ガイド鮮明化フィルタを含み、上記第1ガイド鮮明化フィルタが、上記第1画像内の第1複数のエッジに基づいて上記第1スタイル化画像を鮮明化し、
上記第2ガイドフィルタが、第2ガイド鮮明化フィルタを含み、上記第2ガイド鮮明化フィルタが、上記第2画像内の第2複数のエッジに基づいて上記第2スタイル化画像を鮮明化する、上記[5]に記載のマルチビュースタイル変換システム。
[7]上記命令が、上記処理回路にさらに、上記第1画像および上記スタイル変換モデルに基づいて上記第1スタイル化画像を生成させる、上記[1]に記載のマルチビュースタイル変換システム。
[8]上記スタイル変換モデルが、複数のターゲットスタイル画像に関する機械学習を介して訓練されたスタイル変換ニューラルネットワークを含む、上記[7]に記載のマルチビュースタイル変換システム。
[9]上記命令が、上記処理回路にさらに、
ターゲットスタイル画像を受信させ、
上記ターゲットスタイル画像へのニューラルスタイル変換(NST)アルゴリズムの適用に基づいてターゲットスタイルを識別させ、
上記ターゲットスタイルに基づいて上記スタイル変換モデルを生成させる、上記[7]に記載のマルチビュースタイル変換システム。
[10]上記第1視差マップが、上記第1画像および上記第2画像に基づいて生成され、上記第2画像の第2複数の画像点に対する上記第1画像の第1複数の画像点の水平座標の差を表し、
第2視差マップが、上記第1画像および上記第2画像に基づいて生成され、上記第1画像の上記第1複数の画像点に対する上記第2画像の上記第2複数の画像点の水平座標の差を表す、上記[1]に記載のマルチビュースタイル変換システム。
[11]上記命令が、上記処理回路にさらに、
上記第1スタイル化画像および上記第1視差マップに基づいて、第1外挿画像であって、上記第1画像に関連付けられた上記シーンの上記第1視点に基づいて第3視点に外挿された第1合成視点を表す第1外挿画像を生成させ、
上記第2スタイル化画像および上記第2視差マップに基づいて、第2外挿画像であって、上記第2画像に関連付けられた上記シーンの上記第2視点に基づいて第4視点に外挿された第2合成視点を表す第2外挿画像を生成させ、
上記第1外挿画像および上記第2外挿画像を上記マルチビューディスプレイに表示させる、上記[2]に記載のマルチビュースタイル変換システム。
[12]上記命令が、上記処理回路にさらに、
上記第1スタイル化画像を第1の所望の出力視点から再投影することに基づいて第1スタイル化視点画像を生成させ、
上記第2スタイル化画像を第2の所望の出力視点から再投影することに基づいて第2スタイル化視点画像を生成させ、
上記第1スタイル化視点画像および上記第2スタイル化視点画像を上記マルチビューディスプレイに表示させる、上記[2]に記載のマルチビュースタイル変換システム。
[13]上記第1の所望の出力視点が、デバイスマルチビューディスプレイに関連付けられた第1デバイス視点に基づき、
上記第2の所望の出力視点が、上記デバイスマルチビューディスプレイに関連付けられた第2デバイス視点に基づく、上記[12]に記載のマルチビュースタイル変換システム。
[14]上記命令が、上記処理回路にさらに、
第3の所望の出力視点から第3スタイル化画像を再投影することに基づいて第3スタイル化視点画像を生成させ、
第4の所望の出力視点から第4スタイル化画像を再投影することに基づいて第4スタイル化視点画像を生成させ、
上記第3スタイル化視点画像および上記第4スタイル化視点画像を上記マルチビューディスプレイに表示させる、上記[12]に記載のマルチビュースタイル変換システム。
[15]シーンの第1視点を表す第1画像、上記第1画像に対応する第1視差マップ、および上記シーンの第2視点を表す第2画像を受信するステップと、
上記第1画像に適用されたスタイル変換モデルを表す第1スタイル化画像を生成するステップと、
上記第1スタイル化画像および上記第1視差マップに基づいて、上記第1スタイル化画像の上記第2視点への第1シフトを含むスタイル化シフト画像を生成するステップと、
上記スタイル化シフト画像のガイドフィルタおよび上記第2画像に基づいて第2スタイル化画像を生成するステップであって、上記ガイドフィルタが、上記第2画像に基づいて上記第2スタイル化画像におけるエッジ特性を処理するステップとを含む、マルチビュースタイル変換方法。
[16]上記第1視差マップに基づいて第1スタイル化画像を生成するステップと、
上記第2画像に対応する第2視差マップに基づいて第2スタイル化画像を生成するステップとを含み、上記第1スタイル化画像および上記第2スタイル化画像が、マルチビューディスプレイによってレンダリングされるように構成される、上記[15]に記載のマルチビュースタイル変換方法。
[17]上記第1スタイル化画像および上記第2スタイル化画像に基づいて複数のスタイル化視点ビューを合成するステップをさらに含む、上記[16]に記載のマルチビュースタイル変換方法。
[18]上記第2スタイル化画像への第2ガイドフィルタの適用に基づいて第2フィルタ後画像として上記第2スタイル化画像を生成するステップをさらに含み、上記第2フィルタ後画像の上記生成が、上記第2画像にさらに基づくステップをさらに含む、上記[16]に記載のマルチビュースタイル変換方法。
[19]上記第1スタイル化画像への第1ガイドフィルタの適用に基づいて第1フィルタ後画像として上記第1のスタイル化画像を生成するステップをさらに含み、上記第1フィルタ後画像の生成が、上記第1画像にさらに基づく、上記[18]に記載のマルチビュースタイル変換方法。
[20]上記第1ガイドフィルタが第1ガイド鮮明化フィルタを含み、上記第1ガイド鮮明化フィルタが、上記第1画像内の第1複数のエッジに基づいて上記第1スタイル化画像を鮮明化し、
上記第2ガイドフィルタが第2ガイド鮮明化フィルタを含み、上記第2ガイド鮮明化フィルタが、上記第2画像内の第2複数のエッジに基づいて上記第2スタイル化画像を鮮明化する、上記[19]に記載のマルチビュースタイル変換方法。
[21]上記第1画像および上記スタイル変換モデルに基づいて上記第1スタイル化画像を生成するステップをさらに含む、上記[15]に記載のマルチビュースタイル変換方法。
[22]上記スタイル変換モデルが、複数のターゲットスタイル画像に関する機械学習を介して訓練されたスタイル変換ニューラルネットワークを含む、上記[21]に記載のマルチビュースタイル変換方法。
[23]ターゲットスタイル画像を受信するステップと、
上記ターゲットスタイル画像へのニューラルスタイル変換(NST)アルゴリズムの適用に基づいてターゲットスタイルを識別するステップと、
上記ターゲットスタイルに基づいて上記スタイル変換モデルを生成するステップとをさらに含む、上記[21]に記載のマルチビュースタイル変換方法。
[24]上記第1視差マップが、上記第1画像および上記第2画像に基づいて生成され、上記第2画像の第2複数の画像点に対する上記第1画像の第1複数の画像点の水平座標の差を表し、
第2視差マップが、上記第1画像および上記第2画像に基づいて生成され、上記第1画像内の上記第1複数の画像点に対する上記第2画像内の上記第2複数の画像点の水平座標の差を表す、上記[15]に記載のマルチビュースタイル変換方法。
[25]上記第1スタイル化画像および上記第1視差マップに基づいて、第1外挿画像であって、上記第1画像に関連付けられた上記シーンの上記第1視点に基づいて第3視点に外挿された第1合成視点を表す第1外挿画像を生成するステップと、
上記第2スタイル化画像および上記第2視差マップに基づいて、第2外挿画像であって、上記第2画像に関連付けられた上記シーンの上記第2視点に基づいて第4視点に外挿された第2合成視点を表す第2外挿画像を生成するステップとをさらに含む、上記[16]に記載のマルチビュースタイル変換方法。
[26]上記第1スタイル化画像を第1の所望の出力視点から再投影することに基づいて第1スタイル化視点画像を生成するステップと、
上記第2スタイル化画像を第2の所望の出力視点から再投影することに基づいて第2スタイル化視点画像を生成するステップとをさらに含む、上記[16]に記載のマルチビュースタイル変換方法。
[27]上記第1の所望の出力視点が、デバイスマルチビューディスプレイに関連付けられた第1デバイス視点に基づき、
上記第2の所望の出力視点が、上記デバイスマルチビューディスプレイに関連付けられた第2デバイス視点に基づく、上記[26]に記載のマルチビュースタイル変換方法。
[28]第3の所望の出力視点から第3スタイル化画像を再投影することに基づいて第3スタイル化視点画像を生成するステップと、
第4の所望の出力視点から第4スタイル化画像を再投影することに基づいて第4スタイル化視点画像を生成するステップとをさらに含む、上記[26]に記載のマルチビュースタイル変換方法。
【図面の簡単な説明】
【0005】
【
図1A】本明細書に記載の原理と一致する実施形態による、一例におけるマルチビューディスプレイの斜視図を示す。
【0006】
【
図1B】本明細書に記載の原理と一致する実施形態による、一例におけるマルチビューディスプレイのビュー方向に対応する特定の主角度方向を有する光ビームの角度成分のグラフ表示を示す。
【0007】
【
図2】本明細書に記載の原理と一致する実施形態による、一例におけるマルチビュースタイル変換方法のフローチャートを示す。
【0008】
【
図3】本明細書に記載の原理と一致する実施形態による、一例におけるガイドフィルタの適用を示す。
【0009】
【
図4】本明細書に記載の原理と一致する実施形態による、一例におけるマルチビュースタイル変換出力アレイのフローチャートを示す。
【0010】
【
図5A】本明細書に記載の原理と一致する実施形態による、一例におけるマルチビュースタイル変換方法の結果を示す。
【
図5B】本明細書に記載の原理と一致する実施形態による、一例におけるマルチビュースタイル変換方法の結果を示す。
【
図5C】本明細書に記載の原理と一致する実施形態による、一例におけるマルチビュースタイル変換方法の結果を示す。
【0011】
【
図6A】本明細書に記載の原理と一致する実施形態による、様々な例におけるマルチビュースタイル変換デバイスを示す。
【
図6B】本明細書に記載の原理と一致する実施形態による、様々な例におけるマルチビュースタイル変換デバイスを示す。
【発明を実施するための形態】
【0012】
特定の例および実施形態は、上記参照図に示された特徴に加えて、およびその代わりに、他の特徴を有する。これらおよび他の特徴は、上記参照図を参照することにより、以下に詳述される。
【0013】
本明細書に記載の原理による例は、電子ディスプレイへ適用されたマルチビュースタイル変換を提供する。特に、本明細書に記載の原理の実施形態は、すべての画像にわたってコンシステントな結果を生成する方法で、マルチビュー画像の個々のビューにスタイル変換を適用する方法を提供してもよい。いくつかの実施形態では、マルチビュースタイル変換は、携帯デバイス上でグラフィックスプロセッシングユニット(GPU)アクセラレーションを用いて実行されてもよい。様々な実施形態によれば、マルチビュースタイル変換は、個々のアルゴリズムをシステムから切り離すことができるモジュール式パイプラインを含む。
【0014】
いくつかの実施形態では、ニューラルネットワークを使用して、2個より多い視点を有するマルチビュー画像にニューラルスタイル変換を提供してもよい。様々な実施形態によれば、本明細書に記載のマルチビュースタイル変換は、すべてのビュー間で実質的にコンシステントであり、一対のビューの両方からのステレオ情報を使用し、携帯プラットフォームでのオンデマンド性のためにGPUアクセラレーションがされ得るスタイル変換をもたらしてもよい。
【0015】
様々な実施形態によれば、電子ディスプレイのバックライトは、(例えば、異なる色の)光を回折的に結合するためにマルチビーム回折格子を使用してもよく、またはより一般には、マルチビーム要素を使用して、導光体からの光を散乱させて、結合され、散乱され、または放射された光を、電子ディスプレイの1個のビュー方向または複数のビュー方向に対応する、異なる主角度方向に向けてもよい。いくつかの例または実施形態では、異なる主角度方向を有する光ビーム(「異なる方向の光ビーム」とも呼ばれる)を使用して、またいくつかの実施形態では、異なる色を有する光ビームを使用して、マルチビュー画像として3次元(3D)情報を表示してもよい。例えば、異なる方向の異なる色の光ビームは、変調され、「眼鏡を使わない」3Dまたはマルチビュー電子ディスプレイのピクセルとして機能する場合がある。
【0016】
本明細書では、「2次元ディスプレイ」すなわち「2Dディスプレイ」は、画像が見られる方向に関係なく(すなわち、2Dディスプレイの所定の視野角内または視野範囲内で)実質的に同じ画像のビューを提供するように構成されたディスプレイとして定義される。多くのスマートフォンおよびコンピュータモニターに見られる従来の液晶ディスプレイ(LCD)は、2Dディスプレイの例である。本明細書では、対照的に、「マルチビューディスプレイ」は、マルチビュー画像の異なるビューを、異なるビュー方向に、または異なるビュー方向から提供するように構成された電子ディスプレイまたはディスプレイシステムとして定義される。特に、異なるビューは、マルチビュー画像のシーンまたはオブジェクトの異なる斜視図を表してもよい。本明細書に記載の片側バックライトおよび片側マルチビューディスプレイの用途には、携帯電話(例えば、スマートフォン)、時計、タブレットコンピュータ、携帯コンピュータ(例えば、ラップトップコンピュータ)、パソコン、コンピュータモニター、自動車ディスプレイコンソール、カメラディスプレイ、ならびに様々な他の携帯もしくは実質的に非携帯の、ディスプレイアプリケーションおよびデバイスが含まれるが、これらに限定されない。
【0017】
図1Aは、本明細書に記載の原理と一致する実施形態による、一例におけるマルチビューディスプレイ110の斜視図を示す。
図1Aに示すように、マルチビューディスプレイ100は、見られるマルチビュー画像を表示するためのスクリーン112を備える。スクリーン112は、例えば、電話(例えば、携帯電話、スマートフォンなど)、タブレットコンピュータ、ラップトップコンピュータ、デスクトップコンピュータのコンピュータモニター、カメラディスプレイ、または実質的にいかなる他のデバイスの電子ディスプレイ、のディスプレイスクリーンであってもよい。
【0018】
マルチビューディスプレイ100は、スクリーン112に対して異なるビュー方向116にマルチビュー画像の異なるビュー114を提供する。ビュー方向116は、スクリーン112から様々な異なる主角度方向に延びる矢印として示され、異なるビュー114は、矢印(すなわち、ビュー方向116を図示する)の終端に網掛けされた多角形ボックスとして示され、4個のビュー114および4ビュー方向116のみが示されているが、それらに限定するものではなくすべては例として示されている。
図1Aでは異なるビュー114がスクリーンの上にあるように示されているが、マルチビュー画像がマルチビューディスプレイ110に表示される場合、ビュー114は実際にはスクリーン112に、またはその近くに現れることに留意されたい。スクリーン112の上にビュー114を描画することは、図示を簡単にすることだけを目的としており、特定のビュー114に対応するビュー方向116のそれぞれ1つの方向からマルチビューディスプレイ110を見ることを表すことを意味する。マルチビューディスプレイ100によって提供されるマルチビュー画像の異なるビュー114とは反対に、2Dディスプレイが一般に表示画像の単一のビュー(例えば、複数の異なるビュー114のうちの1個のビュー)を提供するように構成されることを除いて、2Dディスプレイは、マルチビューディスプレイ110と実質的に同様であり得る。
【0019】
ビュー方向、または同等に、マルチビューディスプレイのビュー方向に対応する方向を有する光ビームは、一般に、本明細書の定義により、角度成分{θ,φ}によって与えられる主角度方向を有する。角度成分θは、本明細書では光ビームの「仰角成分」または「仰角」と呼ばれる。角度成分φは、光ビームの「方位角成分」または「方位角」と呼ばれる。定義により、仰角θは(例えば、マルチビューディスプレイスクリーンの面に垂直な)鉛直面における角度であり、方位角φは(例えば、マルチビューディスプレイスクリーンの面に平行な)水平面における角度である。
【0020】
図1Bは、本明細書に記載の原理と一致する実施形態による、一例におけるマルチビューディスプレイのビュー方向(例えば、
図1Aのビュー方向116)に対応する特定の主角度方向を有する光ビーム120の角度成分{θ,φ}のグラフ表示を示す。さらに、光ビーム120は、本明細書の定義により、特定の点から放射または発散される。すなわち、定義により、光ビーム120は、マルチビューディスプレイ内の特定の原点に関連付けられた中心光線を有する。
図1Bは、光ビーム(またはビュー方向)の原点Oも示す。
【0021】
本明細書では、「回折格子」は、一般に、回折格子に入射する光の回折を提供するように配置された複数の機構(すなわち、回折機構)として定義される。いくつかの例では、複数の機構は、周期的または準周期的に配置されてもよい。例えば、回折格子は、1次元(1D)アレイに配置された複数の機構(例えば、材料表面の複数の溝または隆起部)を含んでいてもよい。他の例では、回折格子は、機構の2次元(2D)アレイであってもよい。回折格子は、例えば、材料表面のバンプまたは穴の2Dアレイであってもよい。
【0022】
したがって、本明細書の定義により、「回折格子」は、回折格子に入射する光の回折を提供する構造である。光がライトガイドから回折格子に入射する場合、提供される回折または回折散乱は、回折格子が回折によって導光体からの光を結合し得るという点で、「回折結合」をもたらす場合があり、したがって「回折結合」と呼ばれてもよい。回折格子はまた、回折によって(すなわち、回折角において)光の角度をリダイレクトまたは変化させる。特に、回折の結果として、回折格子を出る光は、一般に、回折格子に入射する光(すなわち、入射光)の伝播方向とは異なる伝播方向を有する。回折による光の伝播方向の変化は、本明細書では「回折的リダイレクション」と呼ばれる。したがって、回折格子は、回折格子に入射する光を回折的にリダイレクトする回折機構を含む構造であると理解されてもよく、光が導光体から入射する場合、回折格子はまた、導光体からの光を回折的に結合してもよい。
【0023】
さらに、本明細書の定義により、回折格子の機構は、「回折機構」と呼ばれ、材料表面での、材料表面内の、および材料表面上(すなわち、2つの材料間の境界)の1つまたはそれ以上の機構であってもよい。材料表面は、例えば、導光体の表面であってもよい。回折機構は、表面での、表面内の、または表面上の1つまたはそれ以上の溝、隆起部、穴、およびバンプを含むがこれらに限定されない、光を回折する様々な構造のいずれかを含んでいてもよい。例えば、回折格子は、材料表面内に、複数の実質的に平行な溝を含んでもよい。別の例では、回折格子は、材料表面から隆起する複数の平行な隆起部を含んでいてもよい。回折機構(例えば、溝、隆起部、穴、バンプなど)は、1つまたはそれ以上の正弦波プロファイル、矩形プロファイル(例えば、バイナリ回折格子)、三角形プロファイル、および鋸歯プロファイル(例えば、ブレーズド格子)を含むがこれらに限定されない、回折を提供する様々な断面形状またはプロファイルのいずれかを有していてもよい。
【0024】
本明細書に記載の様々な例によれば、回折格子(例えば、以下に説明するように、マルチビーム要素の回折格子)を使用して、導光体(例えば、導光板)からの光を回折的に外側に散乱してまたは外側に結合してもよい。特に、局所的に周期的な回折格子の回折角θ
mまたは局所的に周期的な回折格子によって提供される回折角θ
mは、以下の式(1)によって与えられ、
【数1】
式中、λは光の波長であり、mは回折次数であり、nは導光体の屈折率であり、dは回折格子の機構間の距離または間隔であり、θ
iは回折格子への光の入射角である。簡単にするために、式(1)は、回折格子が導光体の表面に隣接し、導光体の外側の材料の屈折率が1に等しい(すなわち、n
out=1)と仮定する。一般に、回折次数mには整数が与えられる。回折格子によって生成される光ビームの回折角θ
mは、式(1)によって与えられてもよく、回折次数は正(例えば、m>0)である。例えば、回折次数mが1に等しい(すなわち、m=1)場合、一次回折が提供される。
【0025】
本明細書では、「マルチビュー画像」および「マルチビューディスプレイ」という用語で使用される、「マルチビュー」または同等に「マルチビュー」という用語は、複数のビューのビュー間の、異なる視点を表す、または角度視差を含む複数のビューとして定義される。さらに、本明細書では、「マルチビュー」という用語は、本明細書の定義により、2個より多い異なるビュー(すなわち、最低3個のビューであり、一般には3個より多いビュー)を明確に含む。したがって、本明細書で使用される「マルチビューディスプレイ」は、シーンまたは画像を表すために2個の異なるビューのみを含む立体ディスプレイとは明確に区別される。しかしながら、マルチビュー画像およびマルチビューディスプレイは2個より多いビューを含む場合があるが、本明細書の定義により、マルチビュー画像は、一度にマルチビューのうちの2個のみ(例えば、1つの眼につき1個のビュー)を選択することによって、対の立体画像として(例えば、マルチビューディスプレイで)見られてもよいことに留意されたい。
【0026】
「マルチビューピクセル」は、本明細書では、マルチビューディスプレイの、同様の複数の異なるビューの各々の「ビュー」ピクセルを表すサブピクセルのセットとして定義される。特に、マルチビューピクセルは、マルチビュー画像の異なるビューの各々のビューピクセルに対応する、またはビューピクセルを表す個々のサブピクセルを有していてもよい。さらに、マルチビューピクセルのサブピクセルは、本明細書の定義により、サブピクセルの各々が異なるビューのうちの1個に対応する所定のビュー方向に関連付けられているという点で、いわゆる「指向性ピクセル」である。さらに、様々な例および実施形態によれば、マルチビューピクセルのサブピクセルによって表される異なるビューピクセルは、異なるビューの各々において、同等または少なくとも実質的に同様の位置または座標を有していてもよい。例えば、第1マルチビューピクセルは、マルチビュー画像の異なるビューの各々の{x1,y1}に位置するビューピクセルに対応する個々のサブピクセルを有していてもよく、第2マルチビューピクセルは、マルチビュー画像の異なるビューの各々の{x2,y2}に位置するビューピクセルに対応する個々のサブピクセルを有していてもよい。
【0027】
本明細書では、「マルチビュー画像」は、複数の画像(すなわち、3個より多い画像)として定義され、複数の画像の各々は、マルチビュー画像の異なるビュー方向に対応する異なるビューを表す。したがって、マルチビュー画像は、マルチビューディスプレイに表示される場合、深度の知覚を容易にし得、したがって、例えば、見る人には3Dシーンの画像であるように見え得る画像(例えば、2次元画像)の集合である。
【0028】
本明細書に記載の原理と一致する実施形態は、集積回路(IC)、超大規模集積(VLSI)回路、特定用途集積回路(ASIC)、フィールドプログラマブルゲートアレイ(FPGA)、デジタル信号プロセッサ(DSP)、グラフィックスプロセッシングユニット(GPU)などのうちの1つまたはそれ以上、およびファームウェア、ソフトウェア(例えばプログラムモジュールまたは命令セット)、ならびに上記のうちの2つまたはそれ以上の組み合わせを含むがこれらに限定されない、様々なデバイスおよび回路を使用して実装されてもよい。例えば、一実施形態または要素は、ASICまたはVLSI回路内の回路要素として実装されてもよい。ASICまたはVLSI回路を使用する実装は、ハードウェアベース回路の実装の例である。
【0029】
別の例では、一実施形態は、動作環境、またはソフトウェアベースのモデリング環境(例えば、マサチューセッツ州、ネイティックにあるMathWorks社のMATLAB(登録商標))であって、コンピュータによってさらに実行される(例えば、メモリに格納され、プロセッサ、または、汎用コンピュータのグラフィックスプロセッサによって実行される)モデリング環境で実行されるコンピュータプログラミング言語(例えば、C/C++)を使用するソフトウェアとして実装されてもよい。1つまたはそれ以上の、コンピュータプログラムまたはソフトウェアが、コンピュータプログラムメカニズムを構成してもよく、プログラミング言語は、コンピュータのプロセッサまたはグラフィックスプロセッサによって実行されるように、コンパイルまたはインタープリタされてもよく、例えば、構成可能であっても、または構成されてもよい(これらは、この説明では交換可能に使用される場合がある)。
【0030】
さらに別の例では、本明細書に記載の装置、デバイス、またはシステム(例えば、画像プロセッサ、カメラなど)のブロック、モジュール、すなわち要素は、実際の、すなわち物理的な回路を使用して(例えば、ICまたはASICとして)実装されてもよく、別のブロック、モジュール、すなわち要素は、ソフトウェアまたはファームウェアで実装されてもよい。特に、本明細書の定義によれば、いくつかの実施形態は、実質的にハードウェアベースの回路手法、またはデバイス(例えば、IC、VLSI、ASIC、FPGA、DSP、ファームウェアなど)を使用して実装されてもよく、他の実施形態はまた、例えば、ソフトウェアを実行するためのコンピュータプロセッサまたはグラフィックスプロセッサを使用して、ソフトウェアまたはファームウェアとして、あるいはソフトウェアもしくはファームウェアとハードウェアベースの回路との組み合わせとして実装されてもよい。
【0031】
さらに、本明細書で使用される場合、冠詞「a」は、特許技術における「a」の通常の意味、すなわち「1つまたはそれ以上」を有することを意図している。例えば、「マルチビューディスプレイ」は1つまたはそれ以上のマルチビューディスプレイを意味し、したがって、本明細書では「マルチビューディスプレイ」は「(複数の)マルチビューディスプレイ」を意味する。また、本明細書における「上部(top)」、「下部(bottom)」、「上方(upper)」、「下方(lower)」、「上(up)」、「下(down)」、「前(front)」、「後ろ(back)」、「第1(first)」、「第2(second)」、「左(left)」、または「右(right)」への言及はいずれも、本明細書における限定を意図するものではない。本明細書では、「約(about)」という用語は、値に適用される場合、一般に、その値を生成するために使用される機器の許容範囲内を意味するか、または特に明記しない限り、プラスまたはマイナス10%、もしくは、プラスまたはマイナス5%、もしくは、プラスまたはマイナス1%を意味し得る。さらに、本明細書で使用される「実質的に」という用語は、大部分、ほとんどすべて、またはすべて、もしくは約51%~約100%の範囲内の量を意味する。さらに、本明細書の例は、例示のみを意図しており、限定するものではなく説明の目的で提示されている。
【0032】
図2は、本明細書に記載の原理と一致する実施形態による、一例におけるマルチビュースタイル変換方法200のフローチャートを示す。
図2に示すように、マルチビュー
画像をスタイル化するための例示的な方法200は、スタイル情報および入力画像情報を受信することと、受信したスタイル情報と一致する複数の出力画像を合成することまたは提供することとを含む。例えば、方法200は、スタイルガイドG
s205、左視差マップΔ
l210、右視差マップΔ
r215、左ステレオ入力ビューI
l220、および右ステレオ入力ビューI
r225を受信することを含む。方法200は、左右の画像に関して説明されているが、左右の画像それぞれに対応する方法を適用してもよい。
【0033】
一例では、左ステレオ入力ビューIl220および右ステレオ入力ビューIr225には、対応する左視差マップΔl210および右視差マップΔr215が提供されてもよい。別の例では、視差マップ210および215は、左ステレオ入力ビューIl220および右ステレオ入力ビューIr225に基づいて推定されてもよい。一例では、視差マップ210および215は、複数の入力ステレオ画像について訓練されたニューラルネットワークに基づいて推定される。
【0034】
図2の例では、方法200は、スタイルガイドG
s205に基づいて左ステレオ入力ビューI
l220のスタイル化230をするためにスタイル変換ネットワークを適用してスタイル化左画像S
l240を生成することを含む。スタイル変換ネットワークを適用して一方の入力ステレオビューのみ、スタイル化230をすることは、様々な利点を提供する。2つのステレオ画像の一方のスタイル化230は、複数のビュー間のスタイルのコンシステンシーを提供し、それによって入力の小さな変化に対するスタイル変換ネットワークの感度によって引き起こされる影響を低減または排除する。
【0035】
例えば、各ビューを個別にスタイル化する際の問題は、ステレオビュー間の視差効果を含み得ることであり、この視差効果は、視覚的差異を引き起こす可能性があり、またはスタイル化フィーチャが、
図4の拡大画像450に示すような、スタイル化ステレオ画像間の位置または外観の変更をもたらし得る。このようなインコンシステンシーは、例えば、マルチビューディスプレイで3Dコンテンツを視聴する場合、見る人の疲労を引き起こす可能性がある。この問題に対するソリューションは、2つのステレオ画像のうちの一方に、スタイル化230を使用することを含み得る。このソリューションは、携帯電子デバイス(例えば、スマートフォン)の例えばマルチビューディスプレイデバイスに対して、計算コストの削減をさらに提供することができる。すなわち、一度スタイル化して多数の出力フレームまたは出力ビューを合成することは、すべての出力フレームまたは出力ビューを個別にスタイル化するよりも計算上かなり効率的である。本ソリューションの別の利点は、2つのステレオ画像のうちの一方のスタイル化230によって、様々なスタイル変換ネットワークとの互換性を改善できることを含み得る。例えば、このソリューションは、特にマルチビューレンダリングのために修正および再訓練することを低減または排除するのを助けることができ、それにより、方法200は、様々なスタイル変換ネットワークに、改善された機能を提供する場合があり、改善された品質および性能を提供する場合がある。
【0036】
方法200の例は、スタイル化右画像Sr245を生成するために、左視差マップΔl210に基づいて第1スタイル化左画像Sl240の再投影235をすることを含む。一例では、スタイル化左画像Sl240は、例えばビュー合成モジュールを使用して、右ステレオ入力ビューIr225と同じ視点のスタイル化右画像Sr245を生成するために再投影される。一例では、再投影235は、1つまたはそれ以上の中央処理装置(CPU)およびグラフィックスプロセッシングユニット(GPU)で実行されてもよい。一例では、再投影235は、例えば非遮蔽領域を塗りつぶすことのために近傍領域をサンプリングするための順方向ワーピング、深度テスト、およびインペインティング技術のうちの1つまたはそれ以上を含む。順方向ワーピングは、ソース画像に変換を適用する画像歪みプロセスである。ソース画像からのピクセルは、走査線順に処理されてもよく、結果は、ターゲット画像に投影される。深度テストは、シェーダによって処理される画像のフラグメント、または処理されるべき画像のフラグメントが、書き込まれているサンプルの深度に関してテストされる深度値を有するプロセスである。フラグメントは、テストが失敗したときに破棄される。また、深度バッファは、テストに合格したときにフラグメントの出力深度で更新される。インペインティングとは、画像の欠落または未知の領域を塗りつぶすことを指す。いくつかの技術は、近傍ピクセルに基づいてピクセル値を予測すること、または近傍ピクセルを未知の領域または欠落領域に反映することを含む。画像の欠落領域または未知の領域は、別のシーンオブジェクトによって部分的に覆われているシーンオブジェクトを指すシーンの非遮蔽から生じ得る。この点において、再投影は、元の視点からシーンの新しい視点を構築するための画像処理技術を含んでいてもよい。したがって、結果として生成されたスタイル化右画像Sr245は、スタイル化左ビューの右視点への再投影であり、スタイル化右画像Sr245のスタイルフィーチャは、生成されたスタイル化右画像Sr245内の対応する位置に移される。
【0037】
方法200の例は、ガイドフィルタモジュール250をスタイル化左画像S
l240に適用してフィルタ後スタイル化左ビューS
l’260を生成することと、同様にガイドフィルタモジュール255をスタイル化右画像S
r245に適用してフィルタ後スタイル化右ビューS
r’265を生成することとを含む。一例では、ガイドフィルタモジュール250は、エッジ認識ガイドフィルタリングを使用して、スタイル化左画像S
l240およびスタイル化右画像S
r245を精緻化するように構成されたフィルタを含む。エッジ認識ガイドフィルタリングは、左ステレオ入力ビューI
l220および右ステレオ入力ビューI
r225において検出されたエッジに基づくことができる。例えば、マルチビューディスプレイで画像を見る場合、エッジ配置の品質は、3D知覚体験を向上または低下させる可能性があるが、いくつかの例では、スタイル変換プロセスは、3Dシーン内のオブジェクトのエッジを劣化させる可能性がある。スタイル化画像240および245に、それぞれ対応する非スタイル化ビュー220および225をガイドとして使用してガイドフィルタモジュール250を適用することにより、エッジのスタイル化を低減しながら元の3Dオブジェクトのエッジを強化することができ、したがって、より没入型のまたはロバストな3D体験をもたらす。ガイドフィルタモジュール250の適用例は、以下に説明する
図3に示されている。
【0038】
方法200は、異なる視点にそれぞれ対応する複数のスタイル化画像S1、S2、S3、およびS4280を生成するための、フィルタ後スタイル化左ビューSl’260およびフィルタ後スタイル化右ビューSr’265の合成270を含む。一例では、合成270は、例えば左視差マップΔl210および右視差マップΔr215に基づくことができるように、フィルタ後スタイル化左ビューSl’260およびフィルタ後スタイル化右ビューSr’265を複数の視点x1、x2、...、xnに再投影することを含む。この再投影は、複数の視点x1、x2、...、xnに適用される再投影235と同様である。一例では、視点スタイル化画像S1、S2、S3、S4280の各々は、複数の視点x1、x2、...、xnの各々へのフィルタ後スタイル化左ビューSl’260およびフィルタ後スタイル化右ビューSr’265の再投影、ならびに左ステレオ入力ビューIl220および右ステレオ入力ビューIr225に対応する左右の視点への視点の近接度に基づくブレンドに基づく。
【0039】
図3は、本明細書に記載の原理と一致する実施形態による、一例におけるガイドフィルタ適用300を示す。
図3は、スタイル化画像Sの、ガイドフィルタ適用前のもの310、およびガイドフィルタ適用後のもの320一例を示す。拡大フィルタ前画像315および拡大フィルタ後画像325は、ガイドフィルタを適用することが、スタイル変換によって導入されたエッジの影響を低減しながら、元の3Dシーンにおけるエッジとのコンシステンシーを高めることを示している。
【0040】
図4は、本明細書に記載の原理と一致する実施形態による、一例におけるマルチビュースタイル変換出力アレイ400のフローチャートを示す。
図4に示すように、スタイルガイド405は
、左視差マップ410、右視差マップ415、左ステレオ入力ビュー420、右ステレオ入力ビュー425に適用される。第1の例示的なスタイル化画像対430および435は、スタイル化されて投影されたが、ガイドエッジフィルタを適用していない画像に対応する。第1の例示的なスタイル化画像対430および435からの拡大画像450に見られるように、インコンシステントなフィーチャ、およびその他のインコンシステントなスタイル化が、ガイドエッジフィルタを適用することなくスタイル化および投影された対のステレオ画像から生じ得る。これらのインコンシステンシーは、見る人の立体画像に集中する能力を低減させ、それによって3Dを見る疲労を増加させ得る。第2の例示的なスタイル化画像対460および465は、スタイル化、投影、およびガイドエッジフィルタを使用してフィルタ化された画像に対応する。第2の例示的なスタイル化画像対460および465からの拡大画像470に見られるように、フィーチャおよびスタイル化のコンシステンシーは、ガイドエッジフィルタの適用によって改善される。この改善されたコンシステンシーは、マルチビューディスプレイで複数の画像を見る際のユーザの集中力および快適さを改善する。
【0041】
マルチビュースタイル変換MSTのための本システムおよび方法は、他のソリューションに対して様々な利点を提供する。表1は、6つの異なる方法または技術の各々を使用して、4個のビュー(例えば、視点)、8個のビュー、および16個のビューを有するスタイル化マルチビュー画像をレンダリングするためのいくつかの実施形態における平均実行時間の比較を示す。
【表1】
【0042】
表1は、ベースラインのCPUおよびGPUのソリューション、手法AおよびB、ならびに本マルチビュースタイル変換(MST)のCPUおよびGPUのソリューションを比較している。ベースラインCPUおよびベースラインGPUのソリューションは、合成ビューの各々に個別にニューラルスタイル変換を単純に適用する。表1に示すように、本MSTCPUおよび本MSTGPUは、視点ビューの数に対して線形にスケーリングする。これは、線形にスケーリングしないベースラインCPUおよびベースラインGPUのソリューションと比較して、計算効率の改善を提供する。本MSTCPUおよび本MSTGPUは、スタイルコンシステントなビューをさらに生成し、したがって計算効率を改善する。
【0043】
本MSTCPUおよび本MSTGPUは、手法Aに対して改善を提供する。手法Aは、立体入力ビューの各々にニューラルスタイル変換を適用することと、その後、スタイル化された対の視差マップおよび元の視差マップを入力として使用して新規ビュー合成を実行することとを含む。手法Aは、ベースラインCPUおよびベースラインGPUよりも高速に実行されるが、レンダリングされたビューは、望ましくないゴーストアーチファクトおよび立体視対間の全体的にコンシステントなスタイル化を生成し、これが視聴疲労につながる可能性がある。
【0044】
手法Bは、手法Aよりも出力画像のスタイルのインコンシステンシーを改善しようとするものである。手法Bは、ニューラルスタイルを入力左画像のみに適用して、スタイル化左画像を作成し、その後、このスタイル化左画像のみから新規ビューを合成することを含む。手法Bは、元の自然な左右の画像の両方を同時に使用してビュー合成を実行することをさらに含み、この自然なマルチビュー画像は、スタイル化マルチビュー画像上のガイドフィルタパスのガイドとして使用される。結果として得られるマルチビュー画像は、ぶれアーチファクトを低減するために鮮明化される。この方法は、比較的鋭いエッジを有するコンシステントなスタイル化ビューを生成するが、手法Bは、スタイル化新規ビュー合成に左画像のみを使用するため、深度効果が限定される。さらに、手法Bは、ガイドフィルタリングステップにおける整列したエッジの低減をもたらし、出力ビューには、エッジの周りにゴーストアーチファクトが生成される。
【0045】
マルチビュースタイル変換方法200は、ベースライン、手法A、および手法Bに対する改善を提供し、同時に改善された計算効率を提供する。特に、マルチビュースタイル変換方法200は、携帯デバイス上でGPUアクセラレーションがされる場合を含む、オンデマンド性を有する改善されたマルチビューのコンシステントなスタイル化画像を提供する。
【0046】
図5A~
図5Cは、本明細書に記載の原理と一致する実施形態による、様々な例におけるマルチビュースタイル変換方法の結果500を示す。
図5Aは、入力510例えば元のステレオ対、視差マップ、およびスタイルガイドを受け取り、出力515を生成する、4ビューの一例を示す。同様に、
図5Bは、入力520を受け取り、出力525を生成する8ビューの一例を示し、
図5Cは、入力530を受け取り、出力535を生成する16ビューの一例を示す。
図5A~
図5Cに見られるように、本マルチビュースタイル変換方法200は、オブジェクトの位置、回転、または遮蔽に関係なく、各合成画像内のオブジェクトのコンシステントなスタイル化をもたらす。
図5A~
図5Cの例における異なるビューは、マルチビューディスプレイのそれぞれの異なるビューまたはビュー視点に対応することができる。
【0047】
図6A~
図6Bは、本明細書に記載の原理と一致する実施形態による、様々な例におけるマルチビュースタイル変換デバイス600を示す。
図6Aは、本明細書に記載の原理の実施形態による、一例におけるマルチビューディスプレイ628を含む電子デバイス600のブロック図を示す。図示するように、電子デバイス600は、グラフィックスプロセッシングユニット(GPU)610を備える。グラフィックスプロセッシングユニット610は、別個の3D視点を有するスタイル化マルチビュー画像612(例えばスタイル化マルチビュー画像)を生成するように構成される。
【0048】
スタイル化マルチビュー画像612を受信した後、ドライバ616は、スタイル化マルチビュー画像612をバッファ618に格納してもよい。バッファ618は、3Dビューを有するスタイル化マルチビュー画像612全体、例えば、3Dビデオのフルフレームを格納することができることに留意されたい。その後、マッピング回路620(例えば、制御論理またはルーティング論理、より一般にはマッピングまたは変換ブロック)は、スタイル化マルチビュー画像612を合成画像622に変換する。次に、ドライバ回路624は、合成画像622に基づいてピクセル駆動信号626をマルチビューディスプレイ628に向ける、すなわちマルチビューディスプレイ628にかける。いくつかの実施形態では、スタイル化マルチビュー画像612は、複数の異なるフォーマットのうちの1つを有する画像ファイルを有するか、またはそのような画像ファイルと互換性がある。
【0049】
別個のドライバ616の代わりに、いくつかの実施形態では、ドライバ616の機能の一部またはすべてがグラフィックスプロセッシングユニットに含まれる。これは、本明細書に記載の原理の別の実施形態による、一例におけるマルチビューディスプレイ628を含む電子デバイス630のブロック図を示す
図6Bに示されている。特に、
図6Bにおいて、グラフィックスプロセッシングユニット
610は、ドライバ616の構成要素を含む。
【0050】
図6Aおよび
図6Bは、マルチビューディスプレイ628を含む電子デバイスにおける画像処理技術を示しているが、いくつかの実施形態では、画像処理技術は、電子デバイス600および630のうちの1つの、1つまたはそれ以上の構成要素、例えばマルチビューディスプレイ628の1つまたはそれ以上の構成要素などに実装され、マルチビューディスプレイ628の残りの構成要素または電子デバイス600および630のうちの1つとは別に、または併せて提供され得る。
【0051】
いくつかの実施形態では、電子デバイス600および630は処理回路、例えば、メモリに格納された命令を実行するように構成された中央処理装置(CPU)を含んでいてもよい。この命令は、オペレーティングシステムによってサポートされるアプリケーションの一部であってもよい。この命令は、CPU、GPU、またはそれらの組み合わせによって実行されるソフトウェアプログラムルーチンの一部であってもよい。例えば、ビュー合成は、CPUまたはGPUによって実行されるソフトウェアとして実装されてもよく、ガイドフィルタは、CPUによって実行されるソフトウェアとして実装されてもよい。
【0052】
本開示の様々な態様は、本明細書で識別されるスタイル化の問題に対するソリューションの提供を助けることができる。例えば、例1は、処理回路と、命令を含むメモリとを備えるマルチビュースタイル変換システムであって、命令が処理回路によって実行されると、処理回路に、シーンの第1視点を表す第1画像、第1画像に対応する第1視差マップ、シーンの第2視点を表す第2画像、および第2画像に対応する第2視差マップを受信させ、第1画像に適用されたスタイル変換モデルを表す第1スタイル化画像を生成させ、第1スタイル化画像および第1視差マップに基づいて、第1スタイル化画像の第2視点への第1シフトを含むスタイル化シフト画像を生成させ、スタイル化シフト画像のガイドフィルタおよび第2画像に基づいて第2スタイル化画像を生成させ、ガイドフィルタが、第2画像に基づいて第2スタイル化画像におけるエッジ特性を処理させる、マルチビュースタイル変換システムを含むことができる。シフト画像(shifted image or shift image)は、元の画像からシフトされた視点ビューを有する画像である。シフトとは、画像のビューをシフトして新しい画像を生成することを指す。シフトは、再投影技術を使用して実行されてもよい。元の画像からシフト画像を生成するために、元の画像の様々な領域が引き伸ばされ、再配置され、またはワーピングされてもよい。
【0053】
例2において、例1の主題が、マルチビューディスプレイを備え、命令が、処理回路にさらに、スタイル化シフト画像および第1視差マップに基づいて第1スタイル化画像を生成させ、第2スタイル化画像および第2視差マップに基づいて第2スタイル化画像を生成させ、第1スタイル化画像および第2スタイル化画像が、マルチビューディスプレイによる同時使用のために構成され、命令が、処理回路にさらに、第1スタイル化画像および第2スタイル化画像をマルチビューディスプレイに表示させることを含む。
【0054】
例3において、例2の主題が、命令が、処理回路にさらに、第1スタイル化画像および第2スタイル化画像に基づいて複数のスタイル化視点ビューを合成させ、複数のスタイル化視点ビューをマルチビューディスプレイに表示させることを含む。
【0055】
例4において、例1~3の主題が、命令が、処理回路にさらに、第2スタイル化画像への第2ガイドフィルタの適用に基づいて第2フィルタ後画像を生成させ、第2スタイル化画像の生成が第2フィルタ後画像にさらに基づくことを含む。
【0056】
例5において、例4の主題が、命令が、処理回路にさらに、第1スタイル化画像への第1ガイドフィルタの適用に基づいて第1フィルタ後画像を生成させ、第1スタイル化画像の生成が、第1フィルタ後画像にさらに基づくことを含む。
【0057】
例6において、例5の主題が、第1ガイドフィルタが第1ガイド鮮明化フィルタを含み、第1ガイド鮮明化フィルタが、第1画像内の第1複数のエッジに基づいて第1スタイル化画像を鮮明化し、第2ガイドフィルタが第2ガイド鮮明化フィルタを含み、第2ガイド鮮明化フィルタが、第2画像内の第2複数のエッジに基づいて第2スタイル化画像を鮮明化することを含む。いくつかの実施形態では、ガイド鮮明化フィルタを使用して、低周波数を除去するハイパスフィルタを使用することにより、検出されたエッジを鮮明化してもよい。
【0058】
例7において、例1~例6の主題が、命令が、処理回路にさらに、第1画像およびスタイル変換モデルに基づいて第1スタイル化画像を生成させることを含む。
【0059】
例8において、例7の主題が、スタイル変換モデルが、複数のターゲットスタイル画像に関する機械学習を介して訓練されたスタイル変換ニューラルネットワークを含むことを含む。
【0060】
例9において、例7~例8の主題が、命令が、処理回路にさらに、ターゲットスタイル画像を受信させ、ターゲットスタイル画像へのニューラルスタイル変換(NST)アルゴリズムの適用に基づいてターゲットスタイルを識別させ、ターゲットスタイルに基づいてスタイル変換モデルを生成させることとを含む。
【0061】
例10において、例1~例9の主題が、命令が、処理回路にさらに、第1画像および第2画像に基づいて、第1視差マップであって、第2画像の第2複数の画像点に対する第1画像の第1複数の画像点の水平座標の差を表す第1視差マップを生成させ、第1画像および第2画像に基づいて第2視差マップであって、第1画像の第1複数の画像点に対する第2画像の第2複数の画像点の水平座標の差を表す第2視差マップを生成させることを含む。例えば、視差マップは、マルチビュー画像のビュー間の見かけのピクセル差を示す。この点において、視差マップは、ピクセルがマルチビューディスプレイのどこにレンダリングされるべきかを指定することによって、レンダリングされたピクセルの見かけの視差を制御する。視差が約0である場合、オブジェクトを表すピクセルが、見る人には、異なるビューにわたって同じ位置で見える。マルチビューディスプレイ上にレンダリングされる場合、視差が約0のピクセルは、見る人には、スクリーンディスプレイに位置するように見えるが、0でない視差を有するピクセルは、ディスプレイのスクリーンの前または後ろに表示される。
【0062】
異なるビューにわたる水平座標の差が、異なる視点から見た同じオブジェクトのピクセル位置の差をもたらし、視差を生じさせる。いくつかの実施形態では、視差マップが、鉛直視差、水平視差、またはその両方を示してもよい。したがって、異なるビューの、対応するピクセル間の差が、鉛直方向、水平方向、またはその両方におけるものであってもよい。
【0063】
例11において、例1~例10の主題が、命令が、処理回路にさらに、第1スタイル化画像および第1視差マップに基づいて、第1外挿画像であって、第1画像に関連付けられたシーンの第1視点に基づいて第3視点に外挿された第1合成視点を表す第1外挿画像をさせ、第2スタイル化画像および第2視差マップに基づいて、第2外挿画像であって、第2画像に関連付けられたシーンの第2視点に基づいて第4視点に外挿された第2合成視点を表す第2外挿画像を生成させ、第1外挿画像および第2外挿画像をマルチビューディスプレイに表示させることを含む。ビュー合成が、コンピュータビジョン技術、順方向ワーピング、深度テスト、インペインティング技術、またはそれらの任意の組み合わせを使用して、1個またはそれ以上の元のビューから新しいビューを人工的に予測、外挿、または内挿することを含んでいてもよい。
【0064】
例12において、例1~例11の主題が、命令が、処理回路にさらに、第1スタイル化画像を第1の所望の出力視点から再投影することに基づいて第1スタイル化視点画像を生成させ、第2スタイル化画像を第2の所望の出力視点から再投影することに基づいて第2スタイル化視点画像を生成させ、第1スタイル化視点画像および第2スタイル化視点画像をマルチビューディスプレイに表示させることを含む。所望の出力視点は、マルチビューディスプレイによって生成されるビューの主角度方向に対応する。
【0065】
例13において、例12の主題が、第1の所望の出力視点が、デバイスマルチビューディスプレイに関連付けられた第1デバイス視点に基づき、第2の所望の出力視点が、デバイスマルチビューディスプレイに関連付けられた第2デバイス視点に基づくことを含む。
【0066】
例14において、例12~例13の主題が、命令が、処理回路にさらに、第3の所望の出力視点から第3スタイル化画像を再投影することに基づいて第3スタイル化視点画像を生成させ、第4の所望の出力視点から第4スタイル化画像を再投影することに基づいて第4スタイル化画像を生成させ、前記第3スタイル化視点画像および前記第4スタイル化視点画像を前記マルチビューディスプレイに表示させることを含む。
【0067】
例15は、シーンの第1視点を表す第1画像、第1画像に対応する第1視差マップ、シーンの第2視点を表す第2画像、および第2画像に対応する第2視差マップを受信するステップと、第1画像に適用されたスタイル変換モデルを表す第1スタイル化画像を生成するステップと、第1スタイル化画像および第1視差マップに基づいて、第1スタイル化画像の第2視点への第1シフトを含むスタイル化シフト画像を生成するステップと、スタイル化シフト画像のガイドフィルタおよび第2画像に基づいて第2スタイル化画像を生成するステップであって、ガイドフィルタが、第2画像に基づいて第2スタイル化画像におけるエッジ特性を処理するステップとを含む、マルチビュースタイル変換方法である。
【0068】
例16において、例15の主題が、スタイル化シフト画像および第1視差マップに基づいて第1スタイル化画像を生成するステップと、第2スタイル化画像および第2視差マップに基づいて第2スタイル化画像を生成するステップとを含み、第1スタイル化画像および第2スタイル化画像が、マルチビューディスプレイによる同時使用のために構成される。
【0069】
例17において、例16の主題が、第1スタイル化画像および第2スタイル化画像に基づいて複数のスタイル化視点ビューを合成するステップを含む。
【0070】
例18において、例15~例17の主題が、第2スタイル化画像への第2ガイドフィルタの適用に基づいて第2フィルタ後画像を生成するステップを含み、第2スタイル化画像の生成が第2フィルタ後画像にさらに基づくことを含む。
【0071】
例19において、例18の主題が、第1スタイル化画像への第1ガイドフィルタの適用に基づいて第1フィルタ後画像を生成するステップを含み、第1スタイル化画像の生成が第1フィルタ後画像にさらに基づくことを含む。
【0072】
例20において、例19の主題が、第1ガイドフィルタが第1ガイド鮮明化フィルタを含み、第1ガイド鮮明化フィルタが、第1画像内の第1複数のエッジに基づいて第1スタイル化画像を鮮明化し、第2ガイドフィルタが第2ガイド鮮明化フィルタを含み、第2ガイド鮮明化フィルタが第2画像内の第2複数のエッジに基づいて第2スタイル化画像を鮮明化することを含む。
【0073】
例21において、例15~例20の主題が、第1画像およびスタイル変換モデルに基づいて第1スタイル化画像を生成するステップを含む。
【0074】
例22において、例21の主題が、スタイル変換モデルが、複数のターゲットスタイル画像に関する機械学習を介して訓練されたスタイル変換ニューラルネットワークを含むことを含む。
【0075】
例23において、例21~例22の主題が、ターゲットスタイル画像を受信するステップと、ターゲットスタイル画像へのニューラルスタイル変換(NST)アルゴリズムの適用に基づいてターゲットスタイルを識別するステップと、ターゲットスタイルに基づいてスタイル変換モデルを生成するステップとを含むことを含む。
【0076】
例24において、例15~例23の主題が、第1画像および第2画像に基づいて、第1視差マップであって、第2画像の第2複数の画像点に対する第1画像の第1複数の画像点の水平座標の差を表す第1視差マップを生成するステップと、第1画像および第2画像に基づいて、第2視差マップであって、第1画像の第1複数の画像点に対する第2画像の第2複数の画像点の水平座標の差を表す第2視差マップを生成するステップとを含む。
【0077】
例25において、例15~例24の主題が、第1スタイル化画像および第1視差マップに基づいて、第1外挿画像であって、第1画像に関連付けられたシーンの第1視点に基づいて第3視点に外挿された第1合成視点を表す第1外挿画像を生成するステップと、第2スタイル化画像および第2視差マップに基づいて、第2外挿画像であって、第2画像に関連付けられたシーンの第2視点に基づいて第4視点に外挿された第2合成視点を表す第2外挿画像を生成するステップとを含む。
【0078】
例26において、例15~例25の主題が、第1スタイル化画像を第1の所望の出力視点から再投影することに基づいて第1スタイル化視点画像を生成するステップと、第2スタイル化画像を第2の所望の出力視点から再投影することに基づいて第2スタイル化視点画像を生成するステップとを含む。
【0079】
例27において、例26の主題が、第1の所望の出力視点が、デバイスマルチビューディスプレイに関連付けられた第1デバイス視点に基づき、第2の所望の出力視点が、デバイスマルチビューディスプレイに関連付けられた第2デバイス視点に基づくことを含む。
【0080】
例28において、例26~例27の主題が、第3スタイル化画像を第の3所望の出力視点から再投影することに基づいて第3スタイル化視点画像を生成するステップと、第4スタイル化画像を第4の所望の出力視点から再投影することに基づいて第4スタイル化視点画像を生成するステップとを含む。
【0081】
こうして、第1スタイル化画像および第2スタイル化画像をマルチビューディスプレイに表示するマルチビュースタイル変換システムおよび方法の例および実施形態を説明した。上記の例は、本明細書に記載の原理を表す多数の特定の例の一部の例示にすぎないことを理解されたい。当分野の技術者は、以下の特許請求の範囲によって定義される範囲から逸脱することなく、多数の他の構成を容易に考案することができるは明らかである。
【符号の説明】
【0082】
100 マルチビューディスプレイ
110 マルチビューディスプレイ
112 スクリーン
114 ビュー
116 ビュー方向
120 光ビーム
200 マルチビュースタイル変換方法
210 視差マップ
220 非スタイル化ビュー
230 スタイル化
235 再投影
240 スタイル化画像
250 ガイドフィルタモジュール
255 ガイドフィルタモジュール
270 合成
300 ガイドフィルタ適用
310 ガイドフィルタ
315 拡大フィルタ前画像
320 ガイドフィルタ
325 拡大フィルタ後画像
400 マルチビュースタイル変換出力アレイ
405 スタイルガイド
410 左視差マップ
415 右視差マップ
420 左ステレオ入力ビュー
425 右ステレオ入力ビュー
430 スタイル化画像
450 拡大画像
460 スタイル化画像
470 拡大画像
500 結果
510 入力
515 出力
520 入力
525 出力
530 入力
535 出力
600 電子デバイス
610 グラフィックスプロセッシングユニット
612 スタイル化マルチビュー画像
616 ドライバ
618 バッファ
620 マッピング回路
622 合成画像
624 ドライバ回路
626 ピクセル駆動信号
628 マルチビューディスプレイ
630 電子デバイス
632 グラフィックスプロセッシングユニット