(19)【発行国】日本国特許庁(JP)
(12)【公報種別】特許公報(B2)
(11)【特許番号】
(24)【登録日】2024-07-12
(45)【発行日】2024-07-23
(54)【発明の名称】全方位映像の符号化及び復号
(51)【国際特許分類】
H04N 19/597 20140101AFI20240716BHJP
H04N 19/70 20140101ALI20240716BHJP
H04N 19/46 20140101ALI20240716BHJP
【FI】
H04N19/597
H04N19/70
H04N19/46
(21)【出願番号】P 2021517806
(86)(22)【出願日】2019-09-25
(86)【国際出願番号】 FR2019052254
(87)【国際公開番号】W WO2020070409
(87)【国際公開日】2020-04-09
【審査請求日】2022-08-01
(32)【優先日】2018-10-01
(33)【優先権主張国・地域又は機関】FR
(73)【特許権者】
【識別番号】591034154
【氏名又は名称】オランジュ
(74)【代理人】
【識別番号】100108453
【氏名又は名称】村山 靖彦
(74)【代理人】
【識別番号】100110364
【氏名又は名称】実広 信哉
(74)【代理人】
【識別番号】100133400
【氏名又は名称】阿部 達彦
(72)【発明者】
【氏名】ジョエル・ジュン
【審査官】間宮 嘉誉
(56)【参考文献】
【文献】国際公開第2018/150933(WO,A1)
【文献】特開2017-152905(JP,A)
【文献】特開2014-132721(JP,A)
【文献】特表2014-524707(JP,A)
【文献】国際公開第2013/022540(WO,A1)
【文献】JEONG, JongBeom et al.,3DoF+ 360 Video Location-Based Asymmetric Down-Sampling for View Synthesis to Immersive VR Video Streaming,Sensors 2018,Vol.18, No.9,MDPI,2018年09月18日,pp.1-20,[online],[retrieved on 2023-10-27],Retrieved from the Internet: <URL: https://www.mdpi.com/1424-8220/18/9/3148>,https://doi.org/10.3390/s18093148
【文献】DOMANSKI, Marek et al.,3D Video Compression by Coding of Disoccluded Regions,Proc. 19th IEEE International Conference on Image Processing 2012,米国,IEEE,2013年02月21日,pp.1317-1320,[online],[retrieved on 2023-10-27],Retrieved from the Internet: <URL: https://ieeexplore.ieee.org/document/6467110>,https://doi.org/10.1109/ICIP.2012.6467110
【文献】FEHN, Christoph et al.,Asymmetric Coding of Stereoscopic Video for Transmission over T-DMB,Proc. 3DTV Conference 2007,ギリシャ,IEEE,2007年11月12日,pp.1-4,[online],[retrieved on 2023-10-27],Retrieved from the Internet: <URL: https://ieeexplore.ieee.org/document/4379449>,https://doi.org/10.1109/3DTV.2007.4379449
(58)【調査した分野】(Int.Cl.,DB名)
H04N 7/12
H04N 19/00-19/98
IEEE Xplore
(57)【特許請求の範囲】
【請求項1】
符号化デバイスによって実施される、多数のビューのビュー形成部分の画像を符号化するための方法であって、前記多数のビューが、異なる視野角又は位置からの3Dシーンを同時に表す、方法であり、
- 前記ビューの前記画像を符号化するために第1の符号化方法又は第2の符号化方法を選択すること(C1)
であって、前記第1の符号化方法は、前記ビューの前記画像のオリジナルデータを符号化し、前記第2の符号化方法は、前記ビューの前記画像の処理から得られるデータを符号化する、選択することと、
- 選択されたものが前記第1の符号化方法か又は前記第2の符号化方法かを示す情報(flag_proc)を含むデータ信号を生成すること(C10、C12a;C10、C12b;C10、C12c)と、
- 前記第1の符号化方法が選択された場合は、前記ビューの前記画像のオリジナルデータを符号化すること(C11a)であって、前記第1の符号化方法が、符号化済みのオリジナルデータを提供する、符号化すること(C11a)と、
- 前記第2の符号化方法が選択された場合は、
- 前記ビューの前記画像の処理済みのデータを符号化すること(C11b)であって、前記データが、前記ビューの前記画像の
前記処理によって得られ、前記符号化が、処理済み且つ符号化済みのデータを提供する、符号化すること(C11b)と、
- 適用された前
記処理の説明情報を符号化すること(C11b)と
を含む、方法であり、
- 前記生成されたデータ信号が、
- 前記第1の符号化方法が選択された場合は、前記ビューの前記画像の前記符号化済みのオリジナルデータ、
- 前記第2の符号化方法が選択された場合は、前記ビューの前記画像の前記処理済み且つ符号化済みのデータ及び前
記処理の前記符号化済みの説明情報
をさらに含む、方法。
【請求項2】
- 前記ビューの前記画像の前記処理済みのデータが、前記ビューの前記画像のクロッピングの適用後の削除されなかった前記ビューの前記画像のデータであり、
- 前記処理の前記説明情報が、前記ビューの前記画像における1つ又は複数のクロッピング済みの領域の場所についての情報である、請求項1に記載の方法。
【請求項3】
- 前記ビューの前記画像の前記処理済みのデータが、所定のサンプリングファクタに従って及び少なくとも1つの所定の方向においてサンプリングが行われた前記ビューの前記画像の少なくとも1つの領域の前記データであり、
- 前記処理の前記説明情報が、前記ビューの前記画像における前記少なくとも1つのサンプリング済みの領域の場所についての情報の少なくとも1つのアイテムを含む、請求項1に記載の方法。
【請求項4】
- 前記ビューの前記画像の前記処理済みのデータが、フィルタリングが行われた前記ビューの前記画像の少なくとも1つの領域の前記データであり、
- 前記処理の前記説明情報が、前記ビューの前記画像における前記少なくとも1つのフィルタリング済みの領域の場所についての情報の少なくとも1つのアイテムを含む、請求項1に記載の方法。
【請求項5】
- 前記ビューの前記画像の前記処理済みのデータが、前記多数のビューのうちの別のビューの画像を使用して検出されたオクルージョン領域に対応する前記ビューの前記画像の画素であり、
- 前記処理の前記説明情報が、別のビューの前記画像に見られる前記ビューの前記画像の前記画素のインジケータを含む、請求項1に記載の方法。
【請求項6】
復号デバイスによって実施される、多数のビューのビュー形成部分の画像を表すデータ信号を復号するための方法であって、前記多数のビューが、異なる視野角又は位置からの3Dシーンを同時に表す、方法であり、
- 前記データ信号において、前記ビューの前記画像を第1の復号方法に従って復号すべきか又は第2の復号方法に従って復号すべきかを示す情報(flag_proc)のアイテムを読み取ること(D1)
であって、前記第1の復号方法は、前記ビューの前記画像の符号化されたオリジナルデータを復号し、前記第2の復号方法は、符号化された前記ビューの前記画像の処理から得られるデータを復号する、読み取ることと、
- 前記第1の復号方法である場合は、
- 前記データ信号において、前記ビューの前記画像と関連付けられた符号化済みのデータを読み取ること(D11a)と、
- 前記符号化済みのデータに基づいて、前記ビューの画像を再構築すること(D12a)であって、前記再構築済みのビューの前記画像が、前記ビューの前記画像の前記オリジナルデータを含む、再構築すること(D12a)と、
- 前記第2の復号方法である場合は、
- 前記データ信号において、前記ビューの前記画像と関連付けられた符号化済みのデータを読み取ること(D11b;D11c)と、
- 読み取られた前記符号化済みのデータに基づいて、前記ビューの前記画像の処理済みのデータ及び前記ビューの前記画像の前記オリジナルデータに適用された
前記ビューの前記画像の前記処理の説明情報を再構築すること(D12b)と、
を含む、方法。
【請求項7】
- 前記ビューの前記画像の前記処理済みのデータが、前記ビューの前記画像のクロッピングの適用後の削除されなかった前記ビューの前記画像のデータであり、
- 前
記処理の前記説明情報が、前記ビューの前記画像における1つ又は複数のクロッピング済みの領域の場所についての情報である、請求項
6に記載の方法。
【請求項8】
- 前記ビューの前記画像の前記処理済みのデータが、所定のサンプリングファクタに従って及び少なくとも1つの所定の方向においてサンプリングが行われた前記ビューの前記画像の少なくとも1つの領域の前記データであり、
- 前
記処理の前記説明情報が、前記ビューの前記画像における前記少なくとも1つのサンプリング済みの領域の場所についての情報の少なくとも1つのアイテムを含む、請求項
6に記載の方法。
【請求項9】
- 前記ビューの前記画像の前記処理済みのデータが、フィルタリングが行われた前記ビューの前記画像の少なくとも1つの領域の前記データであり、
- 前
記処理の前記説明情報が、前記ビューの前記画像における前記少なくとも1つのフィルタリング済みの領域の場所についての情報の少なくとも1つのアイテムを含む、請求項
6に記載の方法。
【請求項10】
- 前記ビューの前記画像の前記処理済みのデータが、前記多数のビューのうちの別のビューの画像を使用して検出されたオクルージョン
領域に対応する前記ビューの前記画像の画素であり、
- 前
記処理の前記説明情報が、別のビューの前記画像に見られる前記ビューの前記画像の前記画素のインジケータを含む、請求項
6に記載の方法。
【請求項11】
多数のビューのビュー形成部分の画像を符号化するためのデバイスであって、前記多数のビューが、異なる視野角又は位置からの3Dシーンを同時に表す、符号化デバイスであり、
- 前記ビューの前記画像のデータを符号化するために第1の符号化方法又は第2の符号化方法を選択すること
であって、前記第1の符号化方法は、前記ビューの前記画像のオリジナルデータを符号化し、前記第2の符号化方法は、前記ビューの前記画像の処理から得られるデータを符号化する、選択することと、
- 選択されたものが前記第1の符号化方法か又は前記第2の符号化方法かを示す情報を含むデータ信号を生成することと、
- 前記第1の符号化方法が選択された場合は、前記ビューの前記画像のオリジナルデータを符号化することであって、前記第1の符号化方法が、符号化済みのオリジナルデータを提供する、符号化することと、
- 前記第2の符号化方法が選択された場合は、
- 前記ビューの前記画像の処理済みのデータを符号化することであって、前記データが、前記ビューの前記画像の
前記処理によって得られ、前記符号化が、処理済み且つ符号化済みのデータを提供する、符号化することと、
- 適用された前
記処理の説明情報を符号化することと
を実施するように構成されたプロセッサを含む、符号化デバイスであり、
- 前記生成されたデータ信号が、
- 前記第1の符号化方法が選択された場合は、前記ビューの前記画像の前記符号化済みのオリジナルデータ、
- 前記第2の符号化方法が選択された場合は、前記ビューの前記画像の前記処理済み且つ符号化済みのデータ及び前
記処理の前記符号化済みの説明情報
をさらに含む、符号化デバイス。
【請求項12】
多数のビューのビュー形成部分の画像を表すデータ信号を復号するためのデバイスであって、前記多数のビューが、異なる視野角又は位置からの3Dシーンを同時に表す、復号デバイスであり、
- 前記データ信号において、前記ビューの前記画像を第1の復号方法に従って復号すべきか又は第2の復号方法に従って復号すべきかを示す情報(flag_proc)のアイテムを読み取ること
であって、前記第1の復号方法は、前記ビューの前記画像の符号化されたオリジナルデータを復号し、前記第2の復号方法は、符号化された前記ビューの前記画像の処理から得られるデータを復号する、読み取ることと、
- 前記第1の復号方法である場合は、
- 前記データ信号において、前記ビューの前記画像と関連付けられた符号化済みのデータを読み取ることと、
- 読み取られた前記符号化済みのデータに基づいて、前記ビューの画像を再構築することであって、前記再構築済みのビューの前記画像が、前記ビューの前記画像の前記オリジナルデータを含む、再構築することと、
- 前記第2の復号方法である場合は、
- 前記データ信号において、前記ビューの前記画像と関連付けられた符号化済みのデータを読み取ることと、
- 読み取られた前記符号化済みのデータに基づいて、前記ビューの画像を再構築することであって、前記ビューの前記再構築済みの画像が、前記処理済みのデータを得るために使用された
前記ビューの前記画像の前記処理の説明情報と関連付けられた前記ビューの前記画像の処理済みのデータを含む、再構築することと、
を実施するように構成されたプロセッサを含む、復号デバイス。
【請求項13】
コンピュータ上で実行されると、請求項1
~5のいずれか一項に記載の符号化方
法のステップを実行するためのプログラムコード命令を含む命令を含むコンピュータプログラム。
【請求項14】
コンピュータによって読み取ることができ、請求項
13に記載のコンピュータプログラムの命令を含む
コンピュータ可読記録媒体。
【請求項15】
コンピュータ上で実行されると、請求項6~10のいずれか一項に記載の復号方法のステップを実行するためのプログラムコード命令を含む命令を含むコンピュータプログラム。
【請求項16】
コンピュータによって読み取ることができ、請求項15に記載のコンピュータプログラムの命令を含むコンピュータ可読記録媒体。
【発明の詳細な説明】
【技術分野】
【0001】
本発明は、概して、全方位映像の分野に関し、具体的には、360°、180°などの映像に関する。より具体的には、本発明は、そのような映像を生成するために捕捉された360°、180°などのビューの符号化及び復号と、非捕捉中間視点の合成とに関する。
【0002】
本発明は、特に(ただし、排他的ではない)、現在のAVC及びHEVC映像コーダ並びにそれらの拡張(MVC、3D-AVC、MV-HEVC、3D-HEVCなど)において実施される映像符号化並びに対応する映像復号に適用することができる。
【背景技術】
【0003】
全方位映像(例えば、360°映像など)を生成するため、360°カメラを使用することは一般的なことである。そのような360°カメラは、球形プラットフォームに設置された多数の2D(二次元)カメラで形成されている。各2Dカメラは、3D(三次元)シーンの特定の角度を捕捉し、カメラによって捕捉されたビューのセットにより、360°×180°視野の3Dシーンを表す映像の生成が可能になる。また、単一の360°カメラを使用して360°×180°視野の3Dシーンを捕捉することも可能である。当然ながら、そのような視野は、より小さなもの(例えば、270°×135°)であり得る。
【0004】
次いで、そのような360°映像により、ユーザは、まるでユーザがその中心に位置付けられているかのようにシーンを見たり、ユーザの周囲全体を(360°にわたって)見渡したりすることができ、それにより、新しい映像鑑賞方法が提供される。そのような映像は、一般に、「頭部装着型デバイス」に相当するHMDとしても知られているバーチャルリアリティヘッドセットにおいて再生される。しかし、それらの映像は、適切なユーザ対話手段が装備された2Dスクリーン上に表示することもできる。360°シーンを捕捉するための2Dカメラの数は、使用されるプラットフォームによって異なる。
【0005】
360°映像を生成するため、様々な2Dカメラによって捕捉された多様なビューは、パノラマ2D画像を作成するために、ビュー間の重複を考慮した上で、端と端をつなげて並べられる。このステップは、「スティッチング」としても知られている。例えば、正距円筒投影(ERP)は、そのようなパノラマ画像を得るための考えられる投影の1つである。この投影によれば、2Dカメラの各々によって捕捉されたビューは、球面に投影される。キューブマッピングタイプの投影(立方体の面への投影)など、他のタイプの投影も可能である。次いで、表面に投影されたビューは、2Dパノラマ画像を得るために2D平面に投影され、2Dパノラマ画像は、所定の時刻における捕捉されたシーンのビューのすべてを含むものである。
【0006】
没入感を増大させるため、前述のタイプの多数の360°カメラを同時に使用してシーンを捕捉することができ、これらのカメラは、任意の方法でシーンに位置付けられる。360°カメラは、実際のカメラ(すなわち、物理的物体)でも、バーチャルカメラでもよく、バーチャルカメラの場合は、ビューは、ビュー生成ソフトウェアによって得られる。具体的には、そのようなバーチャルカメラは、実際のカメラによって捕捉されなかった3Dシーンの視点を表すビューの生成を可能にする。
【0007】
次いで、単一の360°カメラを使用して得られた360°ビューの画像又は多数の360°カメラ(実際のカメラ及びバーチャルカメラ)を使用して得られた360°ビューの画像は、例えば、
- 従来の2D映像コーダ(例えば、HEVC(「高効率映像符号化」の略語)規格に適合するコーダ)
- 従来の3D映像コーダ(例えば、MV-HEVC及び3D-HEVC規格に適合するコーダ)
を使用して符号化される。
【発明の概要】
【発明が解決しようとする課題】
【0008】
そのようなコーダは、多数の360°ビューの画像及びそのような360°ビューを使用した3Dシーンの360°表現の特定の幾何学が符号化されることは言うまでもなく、1つの360°ビューにおいて非常に大量のデータの画像が符号化されることを考慮すると、圧縮の観点から十分に効率的とは言えない。その上、360°カメラの2Dカメラによって捕捉されたビューは多様であるため、これらのコーダによってインター画像予測はほとんど又は全く使用されないことを理由に、前述のコーダは、360°ビューの異なる画像の符号化には適さない。特に、2つの2Dカメラによってそれぞれ捕捉された2つのビューの間では、予測できる同様のコンテンツはほとんどない。従って、360°ビューの画像はすべて、同じ方法で圧縮される。具体的には、これらのコーダでは、符号化予定の現在の360°ビューの画像に関して、符号化に次いで復号されるビューのこの画像を使用することになる非捕捉中間ビュー画像の合成の一環として、この画像のデータのすべてを符号化することが理にかなっているか又はこの画像のデータのほんの一部を符号化することが理にかなっているかを判断するための分析は実行されない。
【0009】
本発明の目的の1つは、前述の先行技術の欠点を修正することである。
【課題を解決するための手段】
【0010】
その目的のため、本発明の一対象は、符号化デバイスによって実施される、多数のビューのビュー形成部分の画像を符号化するための方法であって、多数のビューが、異なる視野角又は位置からの3Dシーンを同時に表す、方法であり、
- ビューの画像を符号化するために第1の符号化方法又は第2の符号化方法を選択することと、
- 選択されたものが第1の符号化方法か又は第2の符号化方法かを示す情報を含むデータ信号を生成することと、
- 第1の符号化方法が選択された場合は、ビューの画像のオリジナルデータを符号化することであって、第1の符号化方法が、符号化済みのオリジナルデータを提供する、符号化することと、
- 第2の符号化方法が選択された場合は、
- ビューの画像の処理済みのデータを符号化することであって、これらのデータが、ビューの画像のオリジナルデータに適用された画像処理によって得られ、符号化が、処理済み且つ符号化済みのデータを提供する、符号化することと、
- 適用された画像処理の説明情報を符号化することと
を含む、方法であり、
- 生成されたデータ信号が、
- 第1の符号化方法が選択された場合は、ビューの画像の符号化済みのオリジナルデータ、
- 第2の符号化方法が選択された場合は、ビューの画像の処理済み且つ符号化済みのデータ及び画像処理の符号化済みの説明情報
をさらに含む、方法に関する。
【0011】
本発明により、前述のタイプの符号化予定の現在のビューからの多数の画像の中から(上記画像は、符号化予定の延いては信号伝達予定の非常に大量のデータを表す)、符号化予定の各ビューの各画像に対して、2つの符号化技法、すなわち、
- 第1の符号化技法(それにより、1つ又は複数のビューの画像が従来方式(例えば、HEVC、MVC-HEVC、3D-HEVC)で符号化され、非常に優れた品質のビューを形成する再構築済みの画像がそれぞれ得られる)
- 第2の革新的な符号化技法(それにより、1つ又は複数の他のビューの画像の処理済みのデータが符号化され、処理済みの画像データが復号側で得られる。従って、処理済みの画像データは、これらの画像のオリジナルデータとは一致しないが、これらの画像の処理済み且つ符号化済みのデータの信号伝達コストがかなり減少するという利益が得られる)
を組み合わせることが可能である。
【0012】
その結果、他の各ビューの各画像に対して復号側で得られるもの(第2の符号化方法に従って符号化された処理済みのデータ)は、ビューの画像の対応する処理済みのデータと、符号化側でビューの画像のオリジナルデータに適用された画像処理の説明情報である。次いで、そのような処理済みのデータは、ビューの画像を形成するために対応する画像処理説明情報を使用して処理することができ、そのビューにより、従来の第1の復号方法に従って再構築されたビューの画像の少なくとも1つと共に使用して、特に効率的且つ効果的な方法での非捕捉中間ビューの画像の合成が可能になる。
【0013】
また、本発明は、復号デバイスによって実施される、多数のビューのビュー形成部分の画像を表すデータ信号を復号するための方法であって、多数のビューが、異なる視野角又は位置からの3Dシーンを同時に表す、方法であり、
- データ信号に基づいて、ビューの画像を第1の復号方法に従って復号すべきか又は第2の復号方法に従って復号すべきかを示す情報のアイテムを読み取ることと、
- 第1の復号方法である場合は、
- データ信号において、ビューの画像と関連付けられた符号化済みのデータを読み取ることと、
- 読み取られた符号化済みのデータに基づいて、ビューの画像を再構築することであって、再構築済みのビューの画像が、ビューの画像のオリジナルデータを含む、再構築することと、
- 第2の復号方法である場合は、
- データ信号において、ビューの画像と関連付けられた符号化済みのデータを読み取ることと、
- 読み取られた符号化済みのデータに基づいて、ビューの画像を再構築することであって、ビューの再構築済みの画像が、処理済みのデータを得るために使用された画像処理の説明情報と関連付けられたビューの画像の処理済みのデータを含む、再構築することと、
を含む、方法にも関する。
【0014】
特定の一実施形態によれば、
- ビューの画像の処理済みのデータは、ビューの画像のクロッピングの適用後の削除されなかったビューの画像のデータである。
- 画像処理の説明情報は、ビューの画像における1つ又は複数のクロッピング済みの領域の場所についての情報である。
【0015】
上記ビューの画像に適用されるそのようなクロッピング処理により、そのオリジナルデータの一部分の符号化を回避することができ、クロッピングされた1つ又は複数の領域に属するデータは符号化もデコーダへの信号伝達も行われないという理由で、上記ビューの画像と関連付けられた符号化済みのデータの伝送レートがかなり減少するという利益が得られる。レートの減少は、クロッピングされる1つ又は複数の領域のサイズに依存する。従って、復号後に再構築され、次いで、潜在的には、対応する画像処理説明情報を使用してその処理済みのデータが処理されることになるビューの画像は、そのオリジナルデータのすべてを含むものではないか、又は、少なくともビューのオリジナル画像とは異なるものである。しかし、このようにクロッピングされたビューのそのような画像を得ることにより、再構築された時点で、上記クロッピング済みのビューのそのような画像を使用することになる中間画像の合成の効果が害されることはない。現に、従来のデコーダ(例えば、HEVC、MVC-HEVC、3D-HEVC)を使用して再構築された1つ又は複数の画像を使用するそのような合成、上記ビューの画像及び従来方式で再構築された画像によって、中間ビューのオリジナル領域を回収することができる。
【0016】
別の特定の実施形態によれば、
- ビューの画像の処理済みのデータは、所定のサンプリングファクタに従って及び少なくとも1つの所定の方向においてサンプリングが行われたビューの画像の少なくとも1つの領域のデータである。
- 画像処理の説明情報は、ビューの画像における少なくとも1つのサンプリング済みの領域の場所についての情報の少なくとも1つのアイテムを含む。
【0017】
そのような処理は、この場合も、サンプリングの適用に次いで符号化されることから生じるデータのレートの減少を最適化することを目的として、上記ビューの画像の均一デグラデーションに助力する。このようにサンプリングされたビューのそのような画像の後続の再構築により、それがビューのオリジナル画像からデグラデーションした/オリジナル画像とは異なるビューの再構築済みの画像を提供するとしても(オリジナルデータはサンプリングに次いで符号化されている)、上記サンプリング済み且つ再構築済みのビューのそのような画像を使用することになる中間画像の合成の効果が害されることはない。現に、従来のデコーダ(例えば、HEVC、MVC-HEVC、3D-HEVC)を使用して再構築された1つ又は複数の画像を使用するそのような合成、これらの1つ又は複数の従来方式で再構築された画像において、上記ビューの画像のフィルタリング済みの領域に対応するオリジナル領域を回収することができる。
【0018】
別の特定の実施形態によれば、
- ビューの画像の処理済みのデータは、フィルタリングが行われたビューの画像の少なくとも1つの領域のデータである。
- 画像処理の説明情報は、ビューの画像における少なくとも1つのフィルタリング済みの領域の場所についての情報の少なくとも1つのアイテムを含む。
【0019】
そのような処理は、符号化済みのデータのレートの減少を最適化することを目的として、符号化に不要と考えられる上記ビューの画像のデータの削除に助力し、符号化済みのデータは、有利には、画像のフィルタリング済みのデータのみで形成される。
【0020】
このようにフィルタリングされたビューのそのような画像の後続の再構築により、それがビューのオリジナル画像からデグラデーションした/オリジナル画像とは異なるビューの再構築済みの画像を提供するとしても(オリジナルデータはフィルタリングに次いで符号化されている)、上記フィルタリング済み且つ再構築済みのビューのそのような画像を使用することになる中間画像の合成の効果が害されることはない。現に、従来のデコーダ(例えば、HEVC、MVC-HEVC、3D-HEVC)を使用して再構築された1つ又は複数の画像を使用するそのような合成、上記ビューの画像のフィルタリング済みの領域及び従来方式で再構築された画像によって、中間ビューのオリジナル領域を回収することができる。
【0021】
別の特定の実施形態によれば、
- ビューの画像の処理済みのデータは、多数のビューのうちの別のビューの画像を使用して検出されたオクルージョンに対応するビューの画像の画素である。
- 画像処理の説明情報は、別のビューの画像に見られるビューの画像の画素のインジケータを含む。
【0022】
先行する実施形態と同様に、そのような処理は、符号化済みのデータのレートの減少を最適化することを目的として、符号化に不要と考えられる上記ビューの画像のデータの削除に助力し、符号化済みのデータは、有利には、上記ビューの画像の画素のみで形成され、その欠如は、上記多数のビューのうちの現在のビューの別の画像において検出されている。
【0023】
ビューのそのような画像の後続の再構築により、それがビューのオリジナル画像からデグラデーションした/オリジナル画像とは異なるビューの再構築済みの画像を提供するとしても(オクルージョン領域のみが符号化されている)、上記ビューのそのような再構築済みの画像を使用することになる中間画像の合成の効果が害されることはない。現に、従来のデコーダ(例えば、HEVC、MVC-HEVC、3D-HEVC)を使用して再構築された1つ又は複数の画像を使用するそのような合成、現在のビューの画像及び従来方式で再構築された画像によって、中間ビューのオリジナル領域を回収することができる。
【0024】
別の特定の実施形態によれば、
- 符号化/復号されたビューの画像の処理済みのデータは、
- ビューの画像のオリジナルデータに基づいて、
- 第1の符号化/復号方法を使用して符号化/復号された少なくとも1つの他のビューの画像のオリジナルデータに基づいて、
- 潜在的には、処理済みのデータが第2の符号化/復号方法を使用して符号化/復号された少なくとも1つの他のビューの画像のオリジナルデータに基づいて、
計算された画素である。
- 上記画像処理の説明情報は、
- 計算されたビューの画像の画素のインジケータ、
- 第1の符号化/復号方法を使用して符号化/復号された少なくとも1つの他のビューの画像における、ビューの画像の画素を計算するために使用されたオリジナルデータの場所についての情報、
- 潜在的には、処理済みのデータが符号化/復号された少なくとも1つの他のビューの画像における、ビューの画像の画素を計算するために使用されたオリジナルデータの場所についての情報
を含む。
【0025】
別の特定の実施形態によれば、第1のビューの画像の処理済みのデータ及び少なくとも1つの第2のビューの画像の処理済みのデータは、単一の画像に組み合わされる。
【0026】
上記の実施形態に応じて、第2の復号方法に従って得られるビューの画像の処理済みのデータは、第1のビューの画像の処理済みのデータ及び少なくとも1つの第2のビューの画像の処理済みのデータを含む。
【0027】
特定の一実施形態によれば、
- ビューの画像の処理済み且つ符号化/復号済みのデータは、画像タイプのデータである。
- 画像処理の符号化/復号済みの説明情報は、画像タイプ及び/又はテキストタイプのデータである。
【0028】
また、本発明は、多数のビューのビュー形成部分の画像を符号化するためのデバイスであって、多数のビューが、異なる視野角又は位置からの3Dシーンを同時に表す、符号化デバイスであり、現在の時刻において、
- ビューの画像を符号化するために第1の符号化方法又は第2の符号化方法を選択することと、
- 選択されたものが第1の符号化方法か又は第2の符号化方法かを示す情報を含むデータ信号を生成することと、
- 第1の符号化方法が選択された場合は、ビューの画像のオリジナルデータを符号化することであって、第1の符号化方法が、符号化済みのオリジナルデータを提供する、符号化することと、
- 第2の符号化方法が選択された場合は、
- ビューの画像の処理済みのデータを符号化することであって、処理済みのデータが、ビューの画像のオリジナルデータに適用された画像処理によって得られ、符号化が、処理済み且つ符号化済みのデータを提供する、符号化することと、
- 適用された画像処理の説明情報を符号化することと
を実施するように構成されたプロセッサを含む、符号化デバイスであり、
- 生成されたデータ信号が、
- 第1の符号化方法が選択された場合は、ビューの画像の符号化済みのオリジナルデータ、
- 第2の符号化方法が選択された場合は、ビューの画像の処理済み且つ符号化済みのデータ及び画像処理の符号化済みの説明情報
をさらに含む、符号化デバイスにも関する。
【0029】
そのような符号化デバイスは、具体的には、前述の符号化方法を実施することができる。
【0030】
また、本発明は、多数のビューのビュー形成部分の画像を表すデータ信号を復号するためのデバイスであって、多数のビューが、異なる視野角又は位置からの3Dシーンを同時に表す、復号デバイスであり、現在の時刻において、
- データ信号において、ビューの画像を第1の復号方法に従って復号すべきか又は第2の復号方法に従って復号すべきかを示す情報のアイテムを読み取ることと、
- 第1の復号方法である場合は、
- データ信号において、ビューの画像と関連付けられた符号化済みのデータを読み取ることと、
- 読み取られた符号化済みのデータに基づいて、ビューの画像を再構築することであって、再構築済みのビューの画像が、ビューの画像のオリジナルデータを含む、再構築することと、
- 第2の復号方法である場合は、
- データ信号において、ビューの画像と関連付けられた符号化済みのデータを読み取ることと、
- 読み取られた符号化済みのデータに基づいて、ビューの画像を再構築することであって、ビューの再構築済みの画像が、処理済みのデータを得るために使用された画像処理の説明情報と関連付けられたビューの画像の処理済みのデータを含む、再構築することと、
を実施するように構成されたプロセッサを含む、復号デバイスにも関する。
【0031】
そのような復号デバイスは、具体的には、前述の復号方法を実施することができる。
【0032】
また、本発明は、前述の符号化方法に従って符号化されたデータを含むデータ信号にも関する。
【0033】
また、本発明は、コンピュータプログラムがプロセッサによって実行されると、上記で説明される特定の実施形態のいずれか1つに従って、本発明による復号方法又は符号化方法を実施するための命令を含む上記プログラムにも関する。
【0034】
このプログラムは、いかなるプログラミング言語も使用することができ、部分的にコンパイルされた形態又は他の任意の望ましい形態など、ソースコード、オブジェクトコード、又は、ソースコードとオブジェクトコードとの間の中間コードの形態であり得る。
【0035】
また、本発明は、上記で言及したものなどのコンピュータプログラム命令を含むコンピュータ可読記録媒体又は情報媒体も対象とする。
【0036】
記録媒体は、プログラムの格納が可能ないかなるエンティティ又はデバイスでもあり得る。例えば、媒体は、ROMなどの記憶手段(例えば、CD-ROM若しくは超小型電子回路ROM)又は磁気記録手段(例えば、USBキー若しくはハードディスク)を含み得る。
【0037】
その上、記録媒体は、無線又は他の手段によって、電気又は光ケーブルを介して伝達することができる電気又は光信号など、伝送可能媒体でもあり得る。本発明によるプログラムは、具体的には、インターネットタイプのネットワークからダウンロードすることができる。
【0038】
或いは、記録媒体は、プログラムが組み込まれた集積回路であり得、回路は、前述の符号化又は復号方法を実行するか又は実行する際に使用するように適応させる。
【0039】
他の特徴及び利点は、添付の図面を参照して以下で説明されている、純粋に説明に役立つ及び非限定的な例として提供されるいくつかの好ましい実施形態を読み進めることで、より明確に明らかになるであろう。
【図面の簡単な説明】
【0040】
【
図1】本発明の一実施形態による符号化方法によって実行される主要なアクションを示す。
【
図2A】
図1の符号化方法の実施に続いて生成することができるデータ信号の第1のタイプを示す。
【
図2B】
図1の符号化方法の実施に続いて生成することができるデータ信号の第2のタイプを示す。
【
図2C】
図1の符号化方法の実施に続いて生成することができるデータ信号の第3のタイプを示す。
【
図3A】現在の時刻において利用可能なビューの画像のすべてを符号化するための方法の第1の実施形態を示す。
【
図3B】現在の時刻において利用可能なビューの画像のすべてを符号化するための方法の第2の実施形態を示す。
【
図4A】第1の実施形態による、ビューの画像に適用される処理の例の各々を示す。
【
図4B】第1の実施形態による、ビューの画像に適用される処理の例の各々を示す。
【
図4C】第1の実施形態による、ビューの画像に適用される処理の例の各々を示す。
【
図4D】第1の実施形態による、ビューの画像に適用される処理の例の各々を示す。
【
図4E】第1の実施形態による、ビューの画像に適用される処理の例の各々を示す。
【
図5A】第2の実施形態による、ビューの画像に適用される処理の例の各々を示す。
【
図5B】第2の実施形態による、ビューの画像に適用される処理の例の各々を示す。
【
図5C】第2の実施形態による、ビューの画像に適用される処理の例の各々を示す。
【
図5D】第2の実施形態による、ビューの画像に適用される処理の例の各々を示す。
【
図6】第3の実施形態による、ビューの画像に適用される処理の例を示す。
【
図7】第4の実施形態による、ビューの画像に適用される処理の例を示す。
【
図8】第5の実施形態による、ビューの画像に適用される処理の例を示す。
【
図9】第6の実施形態による、ビューの画像に適用される処理の例を示す。
【
図10】
図1の符号化方法を実施する符号化デバイスを示す。
【
図11】本発明の一実施形態による復号方法によって実行される主要なアクションを示す。
【
図12A】現在の時刻において利用可能なビューの画像のすべてを復号するための方法の第1の実施形態を示す。
【
図12B】現在の時刻において利用可能なビューの画像のすべてを復号するための方法の第2の実施形態を示す。
【
図14】ビューの画像の合成の一実施形態を示し、
図11の復号方法に従って再構築されたビューの画像が使用される。
【
図15A】第1の実施形態による、その再構築の後にビューの画像に適用される処理の例の各々を示す。
【
図15B】第1の実施形態による、その再構築の後にビューの画像に適用される処理の例の各々を示す。
【
図15C】第1の実施形態による、その再構築の後にビューの画像に適用される処理の例の各々を示す。
【
図15D】第1の実施形態による、その再構築の後にビューの画像に適用される処理の例の各々を示す。
【
図16】第2の実施形態による、その再構築の後にビューの画像に適用される処理の例を示す。
【
図17】第3の実施形態による、その再構築の後にビューの画像に適用される処理の例を示す。
【
図18】第4の実施形態による、その再構築の後にビューの画像に適用される処理の例を示す。
【発明を実施するための形態】
【0041】
本発明は、主に、多数のビューの多数の現在の画像をそれぞれ符号化するためのスキームを提案し、多数のビューは、現在の時刻における、所定の位置又は所定の視野角による3Dシーンを表し、2つの符号化技法、すなわち、
- 第1の符号化技法(それにより、ビューの少なくとも1つの現在の画像が従来の符号化モード(例えば、HEVC、MV-HEVC、3D-HEVCなど)を使用して符号化される)
- 第2の革新的な符号化技法(それにより、前述のタイプの従来の符号化モード及び/又は他の任意の適切な符号化モードを使用して、ビューの少なくとも1つの現在の画像の処理データ(特定の画像処理を使用してこの画像のオリジナルデータの処理の適用から得られたもの)が符号化され、それにより、符号化ステップの前に実施された処理から得られるこの画像の符号化済みのデータの信号伝達コストがかなり減少する)
が利用可能である。
【0042】
それに応じて、本発明は、2つの復号技法、すなわち、
- 第1の復号技法(それにより、符号化の際に使用され且つデコーダに信号伝達された従来の符号化モードに対応する従来の復号モード(例えば、HEVC、MV-HEVC、3D-HEVCなど)を使用して、符号化済みのビューの少なくとも1つの現在の画像が再構築され、それにより、非常に優れた品質のビューの少なくとも1つの再構築済みの画像が得られる)
- 第2の革新的な復号技法(それにより、デコーダに信号伝達された符号化モード(すなわち、従来の符号化モード及び/又は他の適切な符号化モード)に対応する復号モードを使用して、ビューの少なくとも1つの画像の符号化済みの処理データが復号され、それにより、処理済みの画像データ及び得られた処理済みのデータの発生源である画像処理の説明情報が得られる。従って、この画像に対して復号側で得られた処理済みのデータは、第1の復号技法に従って復号された画像データとは異なり、そのオリジナルデータとは一致しない)
を組み合わせられるようにする復号スキームを提案する。
【0043】
そのような処理済み且つ復号済みの画像データ及び画像処理説明情報に基づいてその後に再構築されるビューの画像は、ビューのオリジナル画像(すなわち、そのオリジナルデータの処理に次いで符号化される前のもの)とは異なるものとなる。しかし、ビューのそのような再構築済みの画像は、第1の従来の復号技法に従って再構築された他のビューの画像と共に使用して、特に効率的且つ効果的な方法での中間ビューの画像の合成を可能にするビューの画像を構成する。
【0044】
6.例示的な符号化スキームの実装
以下では、例えば、3D-HEVC若しくはMV-HEVC規格又は同様のものに適合するいかなるタイプのマルチビュー映像コーダも使用することができる360°、180°又は他の全方位映像を符号化するための方法について説明する。
【0045】
図1を参照すると、そのような符号化方法は、多数のビューV
1、…、V
Nの一部を形成するビューの現在の画像に適用され、多数のビューは、多数の視野角又は多数の位置/向きによる3Dシーンをそれぞれ表す。
【0046】
共通の例によれば、映像(例えば、360°映像)を生成するために3つの全方位カメラが使用される事例では、
- 第1の全方位カメラは、例えば、360°×180°視野角で3Dシーンの中心に置くことができ、
- 第2の全方位カメラは、例えば、360°×180°視野角で3Dシーンの左側に置くことができ、
- 第3の全方位カメラは、例えば、360°×180°視野角で3Dシーンの右側に置くことができる。
【0047】
別のより非定型的な例によれば、α°映像(0°<α≦360°)を生成するために3つの全方位カメラが使用される事例では、
- 第1の全方位カメラは、例えば、360°×180°視野角で3Dシーンの中心に置くことができ、
- 第2の全方位カメラは、例えば、270°×135°視野角で3Dシーンの左側に置くことができ、
- 第3の全方位カメラは、例えば、180°×90°視野角で3Dシーンの右側に置くことができる。
【0048】
当然ながら、他の構成も可能である。
【0049】
上記多数のビューの少なくとも2つのビューは、同じ視野角からの3Dシーンを表すものでも、そうではないものでもよい。
【0050】
本発明による符号化方法は、現在の時刻において、
- ビューV1の画像IV1、
- ビューV2の画像IV2、
-…、
- ビューVkの画像IVk、
-…、
- ビューVNの画像IVN
を符号化するものである。
【0051】
対象のビューの画像は、同様に、テクスチャ画像又は深度画像であり得る。対象のビューの画像(例えば、画像IVk)は、例えば、Q個の画素など、数量Q(Q≧1)のオリジナルデータ(d1k…、dQk)を含む。
【0052】
次いで、符号化方法は、符号化予定のビューVkの少なくとも1つの画像IVkに対して、以下を含む。
【0053】
C1では、画像IVkに対して、第1の符号化方法MC1又は第2の符号化方法MC2が選択される。
【0054】
第1の符号化方法MC1が選択された場合は、C10において、符号化方法MC1が選択されたことを示すために、例えば、ビットを0に設定して、flag_procという情報が符号化される。
【0055】
C11aでは、例えば、HEVC、MV-HEVC、3D-HEVCなどの規格に適合するものなどの従来のコーダを使用して、画像IVkのQ個のオリジナルデータ(画素)d1k、…、dQkが符号化される。符号化C11aが完了すると、ビューVkの符号化済みの画像IVCkが得られる。次いで、符号化済みの画像IVCkは、Q個の符号化済みのオリジナルデータdc1k、dc2k、…、dcQkを含む。
【0056】
C12aでは、データ信号F1
kが生成される。
図2Aに示されるように、データ信号F1
kは、第1の符号化方法MC1の選択に関連するflag_proc=0という情報と、符号化済みのオリジナルデータdc1
k、dc2
k、…、dcQ
kとを含む。
【0057】
第2の符号化方法MC2が選択された場合は、C10において、符号化方法MC2が選択されたことを示すために、例えば、ビットを1に設定して、flag_procという情報が符号化される。
【0058】
C11bでは、符号化ステップの前に行われた画像IVkの処理から生じたデータDTkに符号化方法MC2が適用される。
【0059】
そのようなデータDTkは、
- 符号化ステップの前に特定の画像処理を使用して処理された画像IVkのオリジナルデータのすべて又は一部に相当する画像タイプ(画素)のデータ(その様々な詳細な例については、説明においてさらに記載する)、
- 符号化ステップC11bの前に画像IVkに適用された画像処理の説明情報(そのような説明情報は、例えば、テキスト及び/又は画像タイプである)
を含む。
【0060】
符号化C11bが完了すると、処理済み且つ符号化済みのデータDTCkが得られる。それらの処理済み且つ符号化済みのデータDTCkは、処理済み且つ符号化済みの画像IVTCkを表す。
【0061】
従って、処理済みのデータDTkは、画像IVkのオリジナルデータとは一致しない。
【0062】
例えば、これらの処理済みのデータDTkは、その解像度が処理前の画像IVkの解像度より高いか又は低い画像に相当する。従って、処理済みの画像IVkは、例えば、他のビューの画像に基づいて得られることを理由に、より大きなものでも、逆に、画像IVkから1つ又は複数のオリジナル画素を削除して得られることを理由に、より小さなものでもあり得る。
【0063】
別の例によれば、これらの処理済みのデータDTkは、処理済みの画像IVkの表現(YUV、RGBなど)のフォーマットが処理前の画像IVkのオリジナルフォーマットとは異なる画像や、画素を表すためのビット数(16ビット、10ビット、8ビットなど)が異なる画像に相当する。
【0064】
さらなる別の例によれば、これらの処理済みのデータDTkは、処理前の画像IVkのオリジナルテクスチャ又は色成分に対してデグラデーションした色又はテクスチャ成分に相当する。
【0065】
さらなる別の例によれば、これらの処理済みのデータDTkは、処理前の画像IVkのオリジナルコンテンツの特定の表現(例えば、画像IVkのフィルタリング済みのオリジナルコンテンツの表現)に相当する。
【0066】
処理済みのデータDTkが単なる画像データである(すなわち、例えば、画素のグリッドの形態である)事例では、符号化方法MC2は、第1の符号化方法MC1を実施するコーダと同様のコーダによって実施することができる。それは、ロッシー又はロスレスコーダであり得る。処理済みのデータDTkが画像データとは異なる(例えば、テキストタイプのデータなど)か、又は、画像データと画像データ以外のタイプのデータの両方を含む事例では、符号化方法MC2は、
- 特にテキストタイプのデータを符号化するために、ロスレスコーダによって、
- 特に画像データを符号化するために、ロッシー又はロスレスコーダによって(そのようなコーダは、第1の符号化方法MC1を実施するコーダと同一である可能性も、異なる可能性もある)
実施することができる。
【0067】
C12bでは、データ信号F2
kが生成される。
図2Bに示されるように、データ信号F2
kは、これらのデータがすべて画像データである事例では、第2の符号化方法MC2の選択に関連するflag_proc=1という情報と、処理済み且つ符号化済みのデータDTC
kとを含む。
【0068】
代替として、C12cでは、処理済み且つ符号化済みのデータDTCkが画像データとテキストタイプのデータの両方を含む事例では、2つの信号F3k、F’3kが生成される。
【0069】
図2Cに示されるように、
- データ信号F’3は、第2の符号化方法MC2の選択に関連するflag_proc=1という情報と、画像タイプの処理済み且つ符号化済みのデータDTC
kとを含み、
- データ信号F’3
kは、テキストタイプの処理済み且つ符号化済みのデータDTC
kを含む。
【0070】
たった今上記で説明した符号化方法は、次いで、利用可能な符号化予定のN個のビューの各画像IV1、IV2、…、IVNに対して、それらのいくつかのみに対して、又は、画像IVk(例えば、k=1)に限定して、実施することができる。
【0071】
図3A及び3Bに示される2つの例示的な実施形態によれば、例えば、符号化予定のN個の画像IV
1、…、IV
Nの中で、以下のように想定される。
- n個の最初の画像IV
1、…、IV
nは、第1の符号化技法MC1を使用して符号化される。n個の最初のビューV
1~V
nは、マスタビューと呼ばれるが、その理由は、再構築された時点で、n個のマスタビューの画像は、それらのオリジナルデータのすべてを含み、ユーザに必要な任意のビューの画像を合成するためにN-n個の他のビューのうちの1つ又は複数と共に使用するのに適しているためである。
- N-n個の他の画像IV
n+1、…、IV
Nは、第2の符号化方法MC2を使用して符号化する前に処理される。これらの処理されたN-n個の他の画像は、追加のビューと呼ばれるものに属する。
【0072】
n=0の場合は、すべてのビューのすべての画像IV1、…、IVNが処理される。n=N-1の場合は、N個の中の単一のビューの画像(例えば、第1のビューの画像)が処理される。
【0073】
N-n個の他の画像IVn+1、…、IVNの処理が完了すると、M-n個の処理済みのデータが得られる。M=Nの場合は、処理すべきビューの数だけ処理済みのデータが存在する。M<Nの場合は、処理の間に、N-n個のビューの少なくとも1つが削除されている。この事例では、第2の符号化方法MC2による符号化C11bが完了すると、削除されたビューのこの画像に関連する処理済みのデータは、ロスレスコーダを使用して符号化されるものであり、この画像及びこのビューの欠如を示す情報のみを含む。次いで、処理によって削除されたこの画像に対しては、どの画素も、HEVC、MVC-HEVC、3D-HEVCなどのタイプのコーダを使用した第2の符号化方法MC2を使用して符号化されることはない。
【0074】
図3Aの例では、C11aにおいて、HEVCタイプの従来のコーダを使用して、n個の最初の画像IV
1、…、IV
nが互いに独立して符号化される。符号化C11aが完了すると、n個の符号化済みの画像IVC
1、…、IVC
nがそれぞれ得られる。C12aでは、n個のデータ信号F1
1、…、F1
nがそれぞれ生成される。C13aでは、これらのn個のデータ信号F1
1、…、F1
nが連結され、データ信号F1が生成される。
【0075】
破線矢印によって表されるように、画像IV1、…、IVnは、N-n個の他の画像IVn+1、…、IVNの処理の間に使用することができる。
【0076】
依然として
図3Aを参照すると、C11bにおいて、HEVCタイプの従来のコーダを使用して、M-n個の処理済みのデータDT
n+1、…、DT
Mが互いに独立して符号化されるか(これらのM-n個の処理済みのデータがすべて画像タイプである場合)、或いは、画像タイプの処理済みのデータに対しては、HEVCタイプの従来のコーダを使用して互いに独立して符号化され、テキストタイプの処理済みのデータに対しては、ロスレスコーダによって符号化される(それらのデータが画像タイプとテキストタイプの両方である場合)。符号化C11bが完了すると、N-n個の処理済み且つ符号化済みのデータDTC
n+1、…、DTC
Nが、N-n個の画像IV
n+1、…、IV
Nのそれぞれと関連付けられたN-n個の符号化済みのデータとしてそれぞれ得られる。C12bでは、M-n個の処理済みのデータがすべて画像タイプである事例では、N-n個の処理済み且つ符号化済みのデータDTC
n+1、…、DTC
Nをそれぞれ含むN-n個のデータ信号F2
n+1、…、F2
Nがそれぞれ生成される。C12cでは、M-n個の処理済みのデータが画像タイプとテキストタイプの両方である事例では、
- 画像タイプのN-n個の処理済み且つ符号化済みのデータをそれぞれ含むN-n個のデータ信号F3
n+1、…、F3
Nが生成され、
- テキストタイプのN-n個の処理済み且つ符号化済みのデータをそれぞれ含むN-n個のデータ信号F’3
n+1…、F’3
Nが生成される。
【0077】
C13cでは、データ信号F3n+1、…F3N及びF’3n+1、…、F’3Nが連結され、データ信号F3が生成される。
【0078】
C14では、信号F1とF2が連結されるか、又は、信号F1とF3が連結され、復号方法によって復号することができるデータ信号Fが提供される。復号方法については、説明においてさらに記載する。
【0079】
図3Bの例では、C11aにおいて、MV-HEVC又は3D-HEVCタイプの従来のコーダを使用して、n個の最初の画像IV
1、…、IV
nが同時に符号化される。符号化C11aが完了すると、n個の符号化済みの画像IVC
1、…、IVC
nがそれぞれ得られる。C12aでは、単一の信号F1が生成され、単一の信号F1は、これらのn個の符号化済みの画像の各々と関連付けられた符号化済みのオリジナルデータを含む。
【0080】
破線矢印によって表されるように、最初の画像IV1、…、IVnは、N-n個の他の画像IVn+1、…、IVNの処理の間に使用することができる。
【0081】
依然として
図3Bを参照すると、C11bにおいて、MV-HEVC又は3D-HEVCタイプの従来のコーダを使用して、画像タイプのM-n個の処理済みのデータDT
n+1、…、DT
Mが同時に符号化されるか(これらのM-n個の処理済みのデータがすべて画像タイプである場合)、或いは、画像タイプの処理済みのデータに対しては、MV-HEVC又は3D-HEVCタイプの従来のコーダを使用して同時に符号化され、テキストタイプの処理済みのデータに対しては、ロスレスコーダによって符号化される(それらのデータが画像タイプとテキストタイプの両方である場合)。符号化C11bが完了すると、N-n個の処理済み且つ符号化済みのデータDTC
n+1、…、DTC
Nが、処理されたN-n個の画像IV
n+1、…、IV
Nのそれぞれと関連付けられたN-n個の処理済み且つ符号化済みのデータとしてそれぞれ得られる。C12bでは、M-n個の処理済みのデータがすべて画像タイプである事例では、画像タイプのN-n個の処理済み且つ符号化済みのデータDTC
n+1、…、DTC
Nを含む単一の信号F2が生成される。C12cでは、M-n個の処理済みのデータが画像タイプとテキストタイプの両方である事例では、
- 画像タイプの処理済み且つ符号化済みのデータを含む信号F3が生成され、
- テキストタイプの処理済み且つ符号化済みのデータを含む信号F’3が生成される。
【0082】
C14では、信号F1とF2が連結されるか、又は、信号F1とF3とF’3が連結され、復号方法によって復号することができるデータ信号Fが提供される。復号方法については、説明においてさらに説明する。
【0083】
当然ながら、符号化方法の他の組合せも可能である。
【0084】
図3Aの1つの可能な変形形態によれば、符号化方法MC1を実施するコーダがHEVCタイプのコーダであり、符号化方法MC2を実施するコーダがMV-HEVC若しくは3D-HEVCタイプのコーダであるか又はMV-HEVC若しくは3D-HEVCタイプのコーダ及びロッシーコーダを含むことも可能である。
【0085】
図3Bの1つの可能な変形形態によれば、符号化方法MC1を実施するコーダがMV-HEVC又は3D-HEVCタイプのコーダであり、符号化方法MC2を実施するコーダがHEVCタイプのコーダであるか又はHEVCタイプのコーダ及びロスレスコーダを含むことも可能である。
【0086】
ここでは、
図4A~4Eを参照して、第2の符号化方法MC2による符号化ステップC11b(
図1)の前に画像IV
kのオリジナルデータに適用される処理の第1の実施形態についての説明を提供する。
【0087】
これらの図に示される例では、画像IVkのオリジナルデータに適用される処理は、この画像の1つ又は複数の領域の水平方向若しくは垂直方向の又は両方向同時のクロッピングである。
【0088】
図4Aの例では、画像IV
kの左側の境界B1及び右側の境界B2がクロッピングされている。そのクロッピングは、境界B1及びB2の各々によって形成された画像IV
kの長方形領域の画素の削除を意味する。
【0089】
図4Bの例では、画像IV
kの上側の境界B3及び下側の境界B4がクロッピングされている。そのクロッピングは、境界B3及びB4の各々によって形成された画像IV
kの長方形領域の画素の削除を意味する。
【0090】
図4Cの例では、クロッピングは、画像IV
kに位置する長方形領域Z1に垂直方向に適用されている。
【0091】
図4Dの例では、クロッピングは、画像IV
kに位置する長方形領域Z2に水平方向に適用されている。
【0092】
図4Eの例では、クロッピングは、画像IV
kに位置する領域Z3に水平方向と垂直方向の両方に適用されている。
【0093】
次いで、符号化予定の処理済みのデータDT
kは、
- クロッピング(
図4A、4B、4E)後の削除されなかった画像IV
kの残りの領域Z
Rの画素、又は、クロッピング後の削除されなかった画像IV
kの残りの領域Z1
R及びZ2
R(
図4C、4D)の画素と、
- 適用されたクロッピングについて説明する情報と
を含む。
【0094】
例えば、
図4A、4B、4Eの事例では、適用されたクロッピングについて説明する情報は、テキストタイプのものであり、
- 画像IV
kの残りの領域Z
Rの一番左上に位置する画素の座標と、
- 画像IV
kの残りの領域Z
Rの一番右下に位置する画素の座標と
を含む。
【0095】
例えば、
図4C及び4Dの事例では、適用されたクロッピングについて説明する情報は、
- 画像IV
kの残りの領域Z1
Rの一番左上に位置する画素の座標と、
- 画像IV
kの残りの領域Z1
Rの一番右下に位置する画素の座標と、
- 画像IV
kの残りの領域Z2
Rの一番左上に位置する画素の座標と、
- 画像IV
kの残りの領域Z2
Rの一番右下に位置する画素の座標と
を含む。
【0096】
次いで、C11b(
図1)において、HEVC、3D-HEVC、MV-HEVCなどのタイプのコーダによって、残りの領域Z
R(Z1
RとZ2
Rのそれぞれ)の一番左上に位置する画素の座標と、残りの領域Z
R(Z1
RとZ2
Rのそれぞれ)の一番右下に位置する画素の座標とによって定義される長方形領域のオリジナルデータ(画素)が符号化される。適用されたクロッピングの説明情報は、その部分に対して、C11b(
図1)において、ロスレスコーダによって符号化される。
【0097】
変形形態として、適用されたクロッピングについて説明する情報は、削除される画素の行及び/又は列の数と、画像IVkにおけるこれらの行及び/又は列の位置を含む。
【0098】
一実施形態によれば、クロッピングによって削除されるデータ量は固定される。例えば、その量は、対象のビューの画像からX行及び/又はY列を体系的に削除するように決定することができる。この事例では、説明情報は、クロッピングについての情報のみ(又は各ビューに対するものではない)を含む。
【0099】
別の実施形態によれば、クロッピングによって削除されるデータ量は、ビューVkの画像IVkと利用可能な別のビューの画像との間で変更することができる。
【0100】
また、クロッピングによって削除されるデータ量は、例えば、画像IVkを捕捉したカメラの3Dシーンの位置にも依存し得る。従って、例えば、上記N個のビューの中の別のビューの画像が、画像IVkを捕捉したカメラの位置/向きとは異なる3Dシーンにおける位置/向きを有するカメラによって捕捉されている場合は、例えば、画像IVkに対して削除されたデータ量とは異なる削除されるデータ量が使用される。
【0101】
クロッピングの適用は、画像IVkが符号化される時刻にさらに依存し得る。例えば、現在の時刻では、画像IVkにクロッピングを適用することを決定する一方で、現在の時刻の前後の時刻では、画像IVkにそのようなクロッピング又はその件に関する任意の処理を適用しないことを決定することができる。
【0102】
最後に、クロッピングは、現在の時刻において1つ又は複数のビューの画像に適用することができる。ビューVkの画像IVkのクロッピング済みの領域は、現在の時刻において符号化予定の別のビューの画像のクロッピング済みの領域と同じであっても、同じでなくともよい。
【0103】
ここでは、
図5A~5Dを参照して、第2の符号化方法MC2による符号化ステップC11b(
図1)の前に画像IV
kのオリジナルデータに適用される処理の第2の実施形態についての説明を提供する。
【0104】
これらの図に示される例では、画像IVkのオリジナルデータに適用される処理は、この画像の1つ又は複数の領域の水平方向又は垂直方向のダウンサンプリングである。
【0105】
図5Aの例では、ダウンサンプリングは、画像IV
kの領域Z4に垂直方向に適用されている。
【0106】
図5Bの例では、ダウンサンプリングは、画像IV
kの領域Z5に水平方向に適用されている。
【0107】
図5Cの例では、ダウンサンプリングは、画像IV
k全体に適用されている。
【0108】
図5Dの例では、ダウンサンプリングは、画像IV
kの領域Z6に水平方向と垂直方向の両方に適用されている。
【0109】
次いで、符号化予定の処理済みのデータDT
kは、
- ダウンサンプリング済みの画像データ(画素)と、
- 適用されたダウンサンプリングについて説明する情報と
を含み、適用されたダウンサンプリングについて説明する情報は、例えば、
- 使用されたダウンサンプリングファクタ、
- 使用されたダウンサンプリング方向、
-
図5A、5B、5Dの事例では、画像IV
kのフィルタリング済みの領域Z4、Z5、Z6の場所、又は、
-
図5Cの事例では、画像IV
kの一番左上に位置する画素の座標、及び、画像IV
kの一番右下に位置する画素の座標(従って、この画像の完全なエリアを定義する)
などである。
【0110】
次いで、C11b(
図1)において、HEVC、3D-HEVC、MV-HEVCなどのタイプのコーダによって、ダウンサンプリング済みの画像データ(画素)が符号化される。適用されたダウンサンプリングの説明情報は、その部分に対して、C11b(
図1)において、ロスレスコーダによって符号化される。
【0111】
ダウンサンプリングファクタの値は、固定することも、画像IVkを捕捉したカメラの3Dシーンの位置に依存することも可能である。従って、例えば、上記N個のビューの中の別のビューの画像が、画像IVkを捕捉したカメラの位置/向きとは異なる3Dシーンにおける位置/向きを有するカメラによって捕捉されている場合は、例えば、別のダウンサンプリングファクタが使用される。
【0112】
ダウンサンプリングの適用は、ビューVkの画像が符号化される時刻にさらに依存し得る。例えば、現在の時刻では、画像IVkにダウンサンプリングを適用することを決定する一方で、現在の時刻の前後の時刻では、ビューVkの画像にそのようなダウンサンプリング又はその件に関する任意の処理を適用しないことを決定することができる。
【0113】
最後に、ダウンサンプリングは、現在の時刻において1つ又は複数のビューの画像に適用することができる。画像IVkのダウンサンプリング済みの領域は、現在の時刻において符号化予定の別のビューの画像のダウンサンプリング済みの領域と同じであっても、同じでなくともよい。
【0114】
ここでは、
図6を参照して、第2の符号化方法MC2による符号化ステップC11b(
図1)の前に画像IV
kのオリジナルデータに適用される処理の第3の実施形態についての説明を提供する。
【0115】
図6に示される例では、画像IV
kのオリジナルデータに適用された処理は、この画像のフィルタリングによる輪郭の検出である。例えば、2つの輪郭ED1及びED2が画像IV
kに存在する。それ自体周知の方法では、そのようなフィルタリングは、例えば、
- 輪郭ED1及びED2に輪郭検出フィルタを適用することと、
- 輪郭ED1及びED2の各々を取り囲む領域(
図6のハッチングによって表されている領域など)を増大するために輪郭ED1及びED2の拡大を適用することと、
- 斜線の入った領域の部分を形成しない(従って、符号化は不要であると考えられる)オリジナルデータのすべてを画像IV
kから削除することと
を含む。
【0116】
次いで、符号化予定の処理済みのデータDTkは、そのようなフィルタリングの事例では、
- 斜線の入った領域に含まれるオリジナル画素と、
- 適用されたフィルタリングについて説明する情報(例えば、斜線の入った領域に含まれない各画素に対して事前に定義された値など、例えば、事前に定義された値YUV=000によって表される)と
を含む。
【0117】
次いで、C11b(
図1)において、HEVC、3D-HEVC、MV-HEVCなどのタイプのコーダによって、斜線の入った領域に対応する画像データ(画素)が符号化される。適用されたフィルタリングの説明情報は、その部分に対して、C11b(
図1)において、ロスレスコーダによって符号化される。
【0118】
画像IVkに関連してたった今説明したフィルタリングは、上記N個のビューの中の他のビューの1つ又は複数の画像(ビューの画像によって異なり得るこれらの1つ又は複数の画像の領域)に適用することができる。
【0119】
ここでは、
図7を参照して、第2の符号化方法MC2による符号化ステップC11b(
図1)の前に画像IV
kのオリジナルデータに適用される処理の第4の実施形態についての説明を提供する。
【0120】
図7に示される例では、画像IV
kのオリジナルデータに適用された処理は、N個のビューの中の別のビューV
pの少なくとも1つの画像IV
pを使用した画像IV
kの少なくとも1つの領域Z
OCのオクルージョンの検出である(1≦p≦N)。
【0121】
それ自体周知の方法では、そのようなオクルージョン検出は、例えば、視差推定を使用して、画像IV
pに基づいて画像IV
kの領域Z
OCを探すものである。次いで、オクルージョン領域Z
OCは、例えば、数理形態学アルゴリズムを使用して拡大される。こうして拡大された領域Z
OCは、
図7では、ハッチングによって表されている。斜線の入った領域Z
OCの部分を形成しない(従って、符号化は不要であると考えられる)画像IV
kのオリジナルデータはすべて削除される。
【0122】
次いで、符号化予定の処理済みのデータDTkは、そのようなオクルージョン検出の事例では、
- 斜線の入った領域に含まれるオリジナル画素と、
- 適用されたオクルージョン検出について説明する情報(例えば、斜線の入った領域に含まれない各画素に対して事前に定義された値など、例えば、事前に定義された値YUV=000によって表される)と
を含む。
【0123】
次いで、C11b(
図1)において、HEVC、3D-HEVC、MV-HEVCなどのタイプのコーダによって、斜線の入った領域に対応する画像データ(画素)が符号化される。適用されたオクルージョン検出の説明情報は、その部分に対して、C11b(
図1)において、ロスレスコーダによって符号化される。
【0124】
ここでは、
図8を参照して、第2の符号化方法MC2による符号化ステップC11b(
図1)の前に画像IV
kのオリジナルデータに適用される処理の第5の実施形態についての説明を提供する。
【0125】
図8に示される例では、画像IV
kのオリジナルデータに適用された処理は、
- 画像IV
kのオリジナル画素に基づいて、
- C11a(
図1)において第1の符号化方法MC1を使用して符号化される1つ又は複数の他のビューの画像IV
j(1≦j≦n)のオリジナル画素に基づいて、
- 潜在的には、C11b(
図1)において処理済みの画素が第2の符号化方法MC2を使用して符号化される少なくとも1つの他のビューの画像IV
l(n+1≦l≦N)のオリジナル画素に基づいて、
画素を計算するものである。
【0126】
次いで、符号化予定の処理済みのデータDTkは、そのような計算の事例では、
- 計算された上記ビューの画像IVkの画素のインジケータ、
- 画像IVjにおける、画像IVkの画素を計算するために使用されたオリジナル画素の場所についての情報、
- 潜在的には、画像IVlにおける、画像IVkの画素を計算するために使用されたオリジナル画素の場所についての情報
を含む。
【0127】
前述の計算は、例えば、画像IVjのオリジナル画素からビューの画像IVkのオリジナル画素及び潜在的には画像IVlのオリジナル画素を差し引くものである。
【0128】
ここでは、
図9を参照して、第2の符号化方法MC2による符号化ステップC11b(
図1)の前に画像IV
kのオリジナルデータに適用される処理の第6の実施形態についての説明を提供する。
【0129】
図9に示される例では、画像IV
kのオリジナルデータに適用された処理は、
- 画像IV
kのオリジナル画素を処理して、処理済みのデータDT’
kを提供し、
- ビューVs(1≦s≦N)の画像IVsのオリジナル画素を処理して、処理済みのデータDTsを提供し、
- 画像IV
kの処理済みのデータDT’
kと画像IVsの処理済みのデータDTsをまとめて単一の画像IV
oneにするもの(得られたオリジナルの処理済みのデータDT
kは、C11b(
図1)において第2の符号化方法MC2を使用して符号化される)
である。
【0130】
図10は、本発明の特定の実施形態のいずれか1つによる符号化方法を実施するように設計された符号化デバイスCODの簡単な構造を示す。
【0131】
本発明の特定の一実施形態によれば、符号化方法によって実行されるアクションは、コンピュータプログラム命令によって実施される。その目的のため、符号化デバイスCODは、コンピュータの従来のアーキテクチャを有し、具体的には、メモリMEM_Cと、処理ユニットUT_Cとを含み、処理ユニットUT_Cは、例えば、プロセッサPROC_Cが装備され、メモリMEM_Cに格納されたコンピュータプログラムPG_Cによって駆動される。コンピュータプログラムPG_Cは、プログラムがプロセッサPROC_Cによって実行されると、上記で説明されるものなどの符号化方法のアクションを実施するための命令を含む。
【0132】
初期化において、コンピュータプログラムPG_Cのコード命令は、プロセッサPROC_Cによって実行される前に、例えば、RAMメモリ(図示せず)にロードされる。処理ユニットUT_CのプロセッサPROC_Cは、具体的には、コンピュータプログラムPG_Cの命令に従って、上記で説明される符号化方法のアクションを実施する。
【0133】
7.例示的な復号スキームの実装
以下では、例えば、3D-HEVC若しくはMV-HEVC規格又は同様のものに適合するいかなるタイプのマルチビュー映像デコーダも使用することができる360°、180°又は他の全方位映像を復号するための方法について説明する。
【0134】
図11を参照すると、そのような復号方法は、上記多数のビューV
1、…、V
Nの一部を形成するビューの現在の画像を表すデータ信号に適用される。
【0135】
本発明による復号方法は、
- ビューV1の画像IV1と関連付けられた符号化済みのデータを表すデータ信号、
- ビューV2の画像IV2と関連付けられた符号化済みのデータを表すデータ信号、
-…、
- ビューVkの画像IVkと関連付けられた符号化済みのデータを表すデータ信号、
-…、
- ビューVNの画像IVNと関連付けられた符号化済みのデータを表すデータ信号
を復号するものである。
【0136】
前述の復号方法を使用して再構築予定の対象のビューの画像は、同様に、テクスチャ画像又は深度画像であり得る。
【0137】
復号方法は、再構築予定のビューVkの少なくとも1つの画像IVkを表すデータ信号F1k、F2k又はF3k及びF’3kに対して、以下を含む。
【0138】
D1では、
図2A、2B、2Cにそれぞれ示されるような、データ信号F1
k、F2
k又はF3
k及びF’3
kにおいて、画像IV
kが第1の符号化方法MC1を使用して符号化されているか、又は、第2の符号化方法MC2を使用して符号化されているかを示すflag_procという情報が読み取られる。
【0139】
信号F1kの場合は、flag_procという情報は、0である。
【0140】
D11aでは、データ信号F1kにおいて、符号化済みの画像IVCkと関連付けられた符号化済みのデータdc1k、dc2k、…、dcQkが読み取られる。
【0141】
D12aでは、D11aにおいて読み取られた符号化済みのデータdc1
k、dc2
k、…、dcQ
kに基づいて、
図1のC11aにおいて符号化に適用された符号化方法MC1に対応する復号方法MD1を使用して、画像IVD
kが再構築される。その目的のため、画像IV
kは、例えば、HEVC、MVC-HEVC、3D-HEVCなどの規格に適合するものなど、従来のデコーダを使用して再構築される。
【0142】
復号D12aが完了すると、こうして再構築された画像IVD
kは、
図1のC11aにおいて符号化された画像IV
kのオリジナルデータd1
k、d2
k、…、dQ
kを含む。
【0143】
画像IVDkはオリジナル画像IVkと一致するため、例えば、中間ビューの合成の文脈において、使用に適したマスタ画像を構成する。
【0144】
D1では、信号F2k又はF3kの場合は、決定されたflag_procという情報は、1である。
【0145】
信号F2
kの場合は、D11bでは、データ信号F2
kにおいて、
図1のC11bにおいて得られるような処理済み且つ符号化済みの画像IVTC
kと関連付けられた処理済み且つ符号化済みのデータDTC
kが読み取られる。
【0146】
読み取られたこれらの処理済み且つ符号化済みのデータDTCkは、画像タイプのデータのみである。
【0147】
D12bでは、D11bにおいて読み取られた符号化済みのデータDTC
kに基づいて、
図1のC11bにおいて符号化に適用された符号化方法MC2に対応する復号方法MD2を使用して、処理済みの画像IVTD
kが再構築される。その目的のため、符号化済みのデータDTC
kは、例えば、HEVC、MVC-HEVC、3D-HEVCなどの規格に適合するものなど、従来のデコーダを使用して復号される。
【0148】
復号D12bが完了すると、こうして再構築された処理済みの画像IVTD
kは、復号済みのデータDTC
kに相当するものであり、
図1のC11bにおけるそれらの符号化前の画像IV
kの処理済みのデータDT
kを含む。
【0149】
処理済み且つ再構築済みの画像IVTD
kは、特定の画像処理を使用して処理された画像IV
kのオリジナルデータのすべて又は一部に相当する画像データ(画素)を含み、その様々な詳細な例については、
図4~9を参照して説明している。
【0150】
信号F3kの場合は、D11cにおいて、処理済み且つ符号化済みの画像IVTCkと関連付けられた処理済み且つ符号化済みのデータDTCkが読み取られる。
【0151】
その目的のため、
- 信号F3kにおいて、画像タイプの処理済み且つ符号化済みのデータDTCkが読み取られ、
- 信号F’3kにおいて、例えば、テキストタイプのデータ、又は、画像データと画像データ以外のタイプのデータの両方を含むものなど、画像データとは異なる処理済み且つ符号化済みのデータDTCkが読み取られる。
【0152】
処理済み且つ符号化済みのデータDTCkは、D12bにおいて復号方法MD2を使用して復号され、復号方法MD2は、
- 特に画像データを復号するために、ロッシー又はロスレスデコーダによって(そのようなデコーダは、第1の復号方法MD1を実施するデコーダと同一である可能性も、異なる可能性もある)、
- 特にテキストタイプのデータを復号するために、ロスレスデコーダによって
実施することができる。
【0153】
復号D12bが完了すると、
- 復号された画像タイプのデータDTC
kに相当する、こうして再構築された処理済みの画像IVTD
k、
- 符号化C11b(
図1)の前に画像IV
kに適用された処理の説明情報に相当するテキストタイプの処理済みのデータ
が得られる。
【0154】
第2の復号方法MD2によるそのような処理済み且つ再構築済みの画像IVTDkは、処理に次いでC11bで符号化される前の画像IVkのオリジナルデータのすべてを含むわけではない。しかし、第2の復号方法MD2によるビューのそのような再構築済みの画像は、優れた品質のビューの合成画像を得るために、例えば、中間画像の合成の文脈において、第1の復号方法MD1を使用して再構築されるマスタビューの画像に加えて使用することができる。
【0155】
たった今上記で説明した復号方法は、次いで、現在の時刻において、利用可能な再構築予定の符号化済みの画像IVC1、IVC2、…、IVCNの各々に対して、それらのいくつかのみに対して、又は、画像IVk(例えば、k=1)に限定して、実施することができる。
【0156】
図12A及び12Bに示される2つの例示的な実施形態によれば、例えば、再構築予定のN個の符号化済みの画像IVC
1、…、IVC
Nの中で、以下のように想定される。
- n個の最初の符号化済みの画像IVC
1、…、IVC
nは、n個のマスタビューの各々の画像をそれぞれ得るために、第1の復号技法MD1を使用して再構築される。
- N-n個の他の符号化済みの画像IVC
n+1、…、IVC
Nは、N-n個の追加のビューの各々の画像をそれぞれ得るために、第2の復号方法MD2を使用して再構築される。
【0157】
n=0の場合は、第2の復号方法MD2を使用して、1~N個のビューの画像IVC1、…、IVCNが再構築される。n=N-1の場合は、第2の復号方法MD2を使用して、単一のビューの画像が再構築される。
【0158】
図12Aの例では、D100において、
図3AのC14において生成されるようなデータ信号Fは、
- 2つのデータ信号(
図3AのC13aにおいて生成されるようなデータ信号F1、
図3AのC13bにおいて生成されるようなデータ信号F2)に、又は、
- 3つのデータ信号(
図3AのC13aにおいて生成されるようなデータ信号F1、
図3AのC13cにおいて生成されるようなデータ信号F3とF’3)に
分離される。
【0159】
信号F1及びF2の事例では、D110aにおいて、データ信号F1は、次に、ビューのn個の符号化済みの画像IVC1、…、IVCnをそれぞれ表すn個のデータ信号F11、…、F1nに分離される。
【0160】
D11aでは、n個のデータ信号F11、…、F1nの各々において、これらのn個の符号化済みの画像の各々と関連付けられた符号化済みのオリジナルデータdc11、…、dcQ1、…、dc1n、…、dcQnがそれぞれ決定される。
【0161】
D12aでは、D11aにおいて読み取られたそれらのそれぞれの符号化済みのオリジナルデータに基づいて、HEVCタイプの従来のデコーダを使用して、画像IVD1、…、IVDnが互いに独立して再構築される。
【0162】
依然として
図12Aを参照すると、D110bにおいて、データ信号F2は、次に、N-n個の処理済み且つ符号化済みのデータDTC
n+1、…、DTC
Nをそれぞれ表すN-n個のデータ信号F2
n+1、…、F2
Nに分離される。
【0163】
D11bでは、N-n個のデータ信号F2n+1、…、F2Nの各々において、再構築予定のN-n個の画像IVn+1、…、IVNの各々にそれぞれ相当するN-n個の処理済み且つ符号化済みのデータDTCn+1、…、DTCNがそれぞれ読み取られる。
【0164】
D12bでは、D11bにおいて読み取られたN-n個の処理済み且つ符号化済みのデータDTCn+1、…、DTCNに基づいて、HEVCタイプの従来のデコーダを使用して、処理済みの画像がそれぞれ互いに独立して再構築される。次いで、処理済み且つ再構築済みの画像IVTDn+1、…、IVTDNが得られる。
【0165】
信号F1、F3及びF’3の事例では、D110aにおいて、データ信号F1は、次に、n個の符号化済みの画像IVC1、…、IVCnをそれぞれ表すn個のデータ信号F11、…、F1nに分離される。
【0166】
D11aでは、n個のデータ信号F11、…、F1nの各々において、これらのn個の符号化済みの画像の各々と関連付けられた符号化済みのオリジナルデータdc11、…、dcQ1、…、dc1n、…、dcQnがそれぞれ読み取られる。
【0167】
D12aでは、D11aにおいて読み取られたそれらのそれぞれの符号化済みのオリジナルデータに基づいて、HEVCタイプの従来のデコーダを使用して、画像IVD1、…、IVDnが互いに独立して再構築される。
【0168】
D110cでは、
- データ信号F3は、次に、画像タイプのN-n個の処理済み且つ符号化済みのデータDTCn+1、…、DTCNをそれぞれ表すN-n個のデータ信号F3n+1、…、F3Nに分離され、
- データ信号F’3は、次に、テキスト又は別のタイプのN-n個の処理済み且つ符号化済みのデータDTCn+1、…、DTCNをそれぞれ表すN-n個のデータ信号F’3n+1、…、F’3Nに分離される。
【0169】
D11cでは、
- N-n個のデータ信号F3n+1、…、F3Nの各々において、再構築予定のN-n個の画像IVn+1、…、IVNの各々にそれぞれ相当する画像タイプのN-n個の処理済み且つ符号化済みのデータDTCn+1、…、DTCNがそれぞれ読み取られ、
- N-n個のデータ信号F’3n+1、…、F’3Nの各々において、再構築予定のN-n個の画像IVn+1、…、IVNの各々に対する処理の説明情報にそれぞれ相当するテキスト又は別のタイプのN-n個の処理済み且つ符号化済みのデータDTCn+1、…、DTCNがそれぞれ読み取られる。
【0170】
D12bでは、D11bにおいて読み取られたN-n個の処理済み且つ符号化済みのデータDTCn+1、…、DTCNに基づいて、HEVCタイプの従来のデコーダを使用して、N-n個の処理済みの画像がそれぞれ互いに独立して再構築される。次いで、処理済み且つ再構築済みの画像IVTDn+1、…、IVTDNが得られる。
【0171】
また、D12bでは、D11cにおいて読み取られたテキスト又は他のタイプのN-n個の処理済み且つ符号化済みのデータDTC
n+1、…、DTC
Nに基づいて、符号化において使用されたロスレスコーダに対応するデコーダを使用して、C11b(
図3A)におけるそれらの符号化前の画像IV
n+1、…、IV
Nの各々に適用された処理の再構築済みの説明情報も存在する。
【0172】
図12Bの例では、D100において、
図3BのC14において生成されるようなデータ信号Fは、
- 2つのデータ信号(
図3BのC12aにおいて生成されるようなデータ信号F1、
図3BのC12bにおいて生成されるようなデータ信号F2)に、又は、
- 3つのデータ信号(
図3BのC12aにおいて生成されるようなデータ信号F1、
図3BのC12cにおいて生成されるようなデータ信号F3とF’3)に
分離される。
【0173】
信号F1及びF2の事例では、D11aでは、データ信号F1において、n個の符号化済みのビューの画像IVC1,i、…、IVCn,iの各々とそれぞれ関連付けられた符号化済みのオリジナルデータdc11、…、dcQ1、…、dc1n、…、dcQnが読み取られる。
【0174】
D12aでは、D11aにおいて読み取られたそれらのそれぞれの符号化済みのオリジナルデータに基づいて、MV-HEVC又は3D-HEVCタイプの従来のデコーダを使用して、同時に、画像IVD1,i、…、IVDn,iが再構築される。
【0175】
図12BのD11bでは、データ信号F2において、再構築予定のN-n個のビューの画像IV
n+1、…、IV
Nの各々とそれぞれ関連付けられたN-n個の処理済み且つ符号化済みのデータDTC
n+1、…、DTC
Nが読み取られる。
【0176】
D12bでは、D11bにおいて読み取られたN-n個の処理済み且つ符号化済みのデータDTCn+1、…、DTCNに基づいて、MV-HEVC又は3D-HEVCタイプの従来のデコーダを使用して、同時に、N-n個の処理済みの画像がそれぞれ再構築される。次いで、処理済み且つ再構築済みの画像IVTDn+1、…、IVTDNが得られる。
【0177】
信号F1、F3及びF’3の事例では、D11aでは、データ信号F1において、n個の符号化済みのビューの画像IVC1、…、IVCnの各々とそれぞれ関連付けられた符号化済みのオリジナルデータdc11、…、dcQ1、…、dc1n、…、dcQnが読み取られる。
【0178】
D12aでは、D11aにおいて読み取られたそれらのそれぞれの符号化済みのオリジナルデータに基づいて、MV-HEVC又は3D-HEVCタイプの従来のデコーダを使用して、同時に、画像IVD1、…、IVDnが再構築される。
【0179】
図12BのD11cでは、データ信号F3において、再構築予定のN-n個の画像IV
n+1、…、IV
Nの各々とそれぞれ関連付けられた画像タイプのN-n個の処理済み且つ符号化済みのデータDTC
n+1、…、DTC
Nが読み取られる。
【0180】
D12bでは、D11cにおいて読み取られたN-n個の処理済み且つ符号化済みのデータDTCn+1、…、DTCNに基づいて、MV-HEVC又は3D-HEVCタイプの従来のデコーダを使用して、同時に、処理済みの画像がそれぞれ再構築される。次いで、ビューIVTDn+1、…、IVTDNの処理済み且つ再構築済みの画像が得られる。
【0181】
また、
図12BのD12bでは、D11cにおいて読み取られたテキスト又は他のタイプのN-n個の処理済み且つ符号化済みのデータDTC
n+1、…、DTC
Nに基づいて、符号化において使用されたロスレスコーダに対応するデコーダを使用して復号された、C11b(
図3B)におけるそれらの符号化前の画像IV
n+1、…、IV
Nの各々に適用された処理の再構築済みの説明情報も存在する。
【0182】
当然ながら、復号方法の他の組合せも可能である。
【0183】
図12Aの1つの可能な変形形態によれば、復号方法MD1を実施するデコーダがHEVCタイプのデコーダであり、復号方法MD2を実施するデコーダがMV-HEVC若しくは3D-HEVCタイプのデコーダであることも可能である。
【0184】
図12Bの1つの可能な変形形態によれば、復号方法MD1を実施するデコーダがMV-HEVC又は3D-HEVCタイプのデコーダであり、復号方法MD2を実施するデコーダがHEVCタイプのコーダであることも可能である。
【0185】
図13は、本発明の特定の実施形態のいずれか1つによる復号方法を実施するように設計された復号デバイスDECの簡単な構造を示す。
【0186】
本発明の特定の一実施形態によれば、復号方法によって実行されるアクションは、コンピュータプログラム命令によって実施される。その目的のため、復号デバイスDECは、コンピュータの従来のアーキテクチャを有し、具体的には、メモリMEM_Dと、処理ユニットUT_Dとを含み、処理ユニットUT_Dは、例えば、プロセッサPROC_Dが装備され、メモリMEM_Dに格納されたコンピュータプログラムPG_Dによって駆動される。コンピュータプログラムPG_Dは、プログラムがプロセッサPROC_Dによって実行されると、上記で説明されるものなどの復号方法のアクションを実施するための命令を含む。
【0187】
初期化において、コンピュータプログラムPG_Dのコード命令は、プロセッサPROC_Dによって実行される前に、例えば、RAMメモリ(図示せず)にロードされる。処理ユニットUT_DのプロセッサPROC_Dは、具体的には、コンピュータプログラムPG_Dの命令に従って、上記で説明される復号方法のアクションを実施する。
【0188】
一実施形態によれば、復号デバイスDECは、例えば、端末に含まれる。
【0189】
8.画像処理への本発明の例示的な適用
上記で既に説明したように、N個の再構築済みの画像IVD1、…、IVDn及びIVTDn+1、…、IVTDNは、ユーザに必要な中間ビューの画像を合成するために使用することができる。
【0190】
図14に示されるように、ユーザが任意のビューの画像の合成を必要とする事例では、マスタビューと見なされるビューIVD
1、…、IVD
nのn個の最初の再構築済みの画像は、S1において、画像合成モジュールに送信される。
【0191】
ビューのN-n個の処理済み且つ再構築済みの画像IVTDn+1、…、IVTDNは、ビューの追加の画像として、画像の合成において使用できるようにするため、S2において、それらの画像とそれぞれ関連付けられた復号済みの画像処理説明情報を使用して、処理する必要があり得る。
【0192】
処理S2が完了すると、ビューのN-n個の再構築済みの画像IVDn+1、…、IVDNが得られる。
【0193】
次いで、N-n個の再構築済みの画像IVDn+1、…、IVDNは、S3において、画像合成モジュールに送信される。
【0194】
S4では、n個の最初の再構築済みのビューの画像IVD1、…、IVDnの少なくとも1つ及び潜在的にはN-n個の再構築済みのビューのN-n個の画像IVDn+1、…、IVDNの少なくとも1つを使用して、ビューの画像が合成される。
【0195】
次いで、合成S4が完了すると、合成ビューの画像IVSYが得られる。
【0196】
n個の再構築済みの画像IVD
1、…、IVD
nもまた処理S2を行えることに留意すべきである。そのような処理S2は、表される視野角がn個の再構築済みの画像IVD
1、…、IVD
nの1つ又は複数の視野角と一致しないビューの画像をユーザUTが必要とする事例において必要であることが分かる。例えば、ユーザUTが120×90の視野を表すビューの画像を要求する一方で、n個の再構築済みの画像IVD
1、…、IVD
nの各々は360×180の視野角を表す場合がある。再構築済みの画像IVD
1、…、IVD
nに対する処理のそのような可能性は、
図14の破線矢印によって表されている。それに加えて、
図8及び9を参照して説明される処理のタイプに関連して、再構築済みの画像IVD
1、…、IVD
nは、N-n個の他の画像IV
n+1、…、IV
Nの処理の間に使用することができる。
【0197】
ここでは、
図15A~15Cを参照して、処理済み且つ再構築済みの画像IVTD
kのデータに適用された処理の第1の実施形態について説明する。そのような処理は、
図1のC11bにおける符号化前にサンプリングされた対応するビューの画像IV
kの初期の解像度を得るものである。
【0198】
図15Aの例では、符号化前に適用された処理は、
図5Aに示されるような画像IV
kの領域Z4の垂直方向のダウンサンプリングであると想定される。
【0199】
処理済み且つ再構築済みの画像IVTD
kに適用された処理は、画像IV
kの初期の解像度に戻すために、適用されたダウンサンプリングについて説明する情報を使用して、具体的には、
- 使用されたダウンサンプリングファクタ(それにより、対応するアップサンプリングファクタを決定することができる)、
- 使用されたダウンサンプリング方向(それにより、対応するアップサンプリング方向を決定することができる)、
- 画像IV
kのダウンサンプリング済みの領域Z4の場所
などを使用して、
図5Aにおいて適用されたダウンサンプリングに対応するアップサンプリングを領域Z4に適用するものである。
【0200】
図15Bの例では、符号化前に適用された処理は、
図5Bに示されるような画像IV
kの領域Z5の水平方向のダウンサンプリングであると想定される。
【0201】
処理済み且つ再構築済みの画像IVTD
kに適用された処理は、画像IV
kの初期の解像度に戻すために、適用されたダウンサンプリングについて説明する情報を使用して、具体的には、
- 使用されたダウンサンプリングファクタ(それにより、対応するアップサンプリングファクタを決定することができる)、
- 使用されたダウンサンプリング方向(それにより、対応するアップサンプリング方向を決定することができる)、
- 画像IV
kのダウンサンプリング済みの領域Z5の場所
などを使用して、
図5Bにおいて適用されたダウンサンプリングに対応するアップサンプリングを領域Z5に適用するものである。
【0202】
図15Cの例では、符号化前に適用された処理は、
図5Cに示されるような画像IV
k全体のダウンサンプリングであると想定される。
【0203】
処理済み且つ再構築済みの画像IVTD
kに適用された処理は、画像IV
kの初期の解像度に戻すために、適用されたダウンサンプリングについて説明する情報を使用して、具体的には、
- 使用されたダウンサンプリングファクタ(それにより、対応するアップサンプリングファクタを決定することができる)、
- 使用されたダウンサンプリング方向(それにより、対応するアップサンプリング方向を決定することができる)
などを使用して、
図5Cにおいて適用されたダウンサンプリングに対応するアップサンプリングを画像IVTD
kの画像データのすべてに適用するものである。
【0204】
図15Dの例では、符号化前に適用された処理は、
図5Dに示されるような画像IV
kの領域Z6の水平方向と垂直方向の両方のダウンサンプリングであると想定される。
【0205】
処理済み且つ再構築済みの画像IVTD
kに適用された処理は、画像IV
kの初期の解像度に戻すために、適用されたダウンサンプリングについて説明する情報を使用して、具体的には、
- 使用されたダウンサンプリングファクタ(それにより、対応するアップサンプリングファクタを決定することができる)、
- 使用されたダウンサンプリング方向(それにより、対応するアップサンプリング方向を決定することができる)、
- 画像IV
kのダウンサンプリング済みの領域Z6の場所
などを使用して、
図5Dにおいて適用されたダウンサンプリングに対応するアップサンプリングを領域Z6に適用するものである。
【0206】
ここでは、
図16を参照して、処理済み且つ再構築済みの画像IVTD
kのデータに適用された処理の第2の実施形態について説明する。そのような処理は、画像IV
kの符号化前にフィルタリングされているビューの画像IV
kの1つ又は複数の輪郭を復元するものである。
【0207】
図16の例では、符号化前に適用された処理は、
図6に示されるような画像IV
kの輪郭ED1及びED2のフィルタリングであると想定される。
【0208】
次いで、処理済み且つ再構築済みのビューの画像IVTDkに適用された処理は、適用されたフィルタリングについて説明する情報を使用して、具体的には、フィルタリングされなかった各画素に対する事前に定義された値(具体的には、事前に定義された値YUV=000)などを使用して、画像IVkの輪郭ED1及びED2を復元するものである。
【0209】
ここでは、
図17を参照して、処理済み且つ再構築済みの画像IVTD
kのデータに適用された処理の第3の実施形態について説明する。そのような処理は、
図8の処理の実施形態に従って符号化前に計算されたビューの画像IV
kの画素を再構築するものである。
【0210】
次いで、処理済み且つ再構築済みの画像IVTDkに適用された処理は、
- データ信号において読み取られたインジケータなど、計算されたビューの画像IVkの画素のインジケータを使用して、符号化において計算された上記ビューの画像IVkの画素を回収するもの、
- 画像IVkの画素を計算するために使用された画像IVjにおける画素の場所についての情報を使用して、第1の復号方法MD1を使用して再構築された少なくとも1つの他のビューの画像IVj(1≦j≦n)の画素を回収するもの、
- 潜在的には、処理済みの画素が第2の復号方法MD2を使用して復号された少なくとも1つの他のビューの画像IVl(n+1≦l≦N)の画素を回収するもの
である。
【0211】
次いで、処理済みのデータDTkの復号は、
- 少なくとも1つの他のビューの画像IVj(1≦j≦n)の画素に基づいて、
- 潜在的には、少なくとも1つの他のビューの画像IVl(n+1≦l≦N)の画素に基づいて、
画像IVkの画素を計算するものである。
【0212】
前述の計算は、例えば、画像IVkの画素を、再構築済みの画像IVjの画素と、そして潜在的には再構築済みの画像IVlの画素と組み合わせるものである。
【0213】
ここでは、
図18を参照して、処理済み且つ再構築済みの画像IVTD
kのデータに適用された処理の第4の実施形態について説明する。そのような処理は、
図9の処理の実施形態に従って符号化前に計算されたビューの画像IV
kの画素を再構築するものである。
【0214】
処理は、最初に、第2の復号方法MD2による再構築済みの画像IVDoneに適用される。次いで、その処理は、画像IVDoneに基づいて、
- 第2の復号方法MD2に従って復号された画像IVkの処理済みのデータDT’kに基づいて、
- 復号されたビューVs(1≦s≦N)の画像IVDsの処理済みのデータDTsに基づいて、
画像IVkの画素を再構築するものである。
【0215】
9.本発明の例示的な具体的な応用
第1の例によれば、4096×2048の画素の解像度を有するビューの6つの画像が360°タイプの6つのカメラによってそれぞれ捕捉されることが考慮される。6つの対応する360°深度マップを提供するため、深度推定方法が適用される。
【0216】
ビューV0の画像IV0は、従来方式で、第1の符号化方法MC1を使用して符号化され、ビューV1、V2、V3、V4、V5の5つの他の画像IV1、IV2、IV3、IV4、IV5は、符号化前にクロッピングが行われる。画像IV1、IV2、IV3、IV4、IV5の各々に適用された処理は、これらの画像の各々の右側及び左側の定数(例えば、200)の列を除去するものである。除去される列の数は、視野角が360°から120°に低減されるように選択されている。同様に、画像IV1、IV2、IV3、IV4、IV5の各々に適用された処理は、これらの画像の各々の上部及び下部からそれぞれ定数(例えば、100)の行を削除するものである。削除される行の数は、視野角が180°から120°に低減されるように選択されている。
【0217】
flag_procという情報のアイテムは、画像IV0に関連しては、0に設定され、flag_procという情報のアイテムは、画像IV1、IV2、IV3、IV4、IV5に関連しては、1に設定される。
【0218】
ビューの画像IV0は、HEVCコーダを使用して符号化される。単一のデータ信号F10が生成され、上記データ信号は、画像IV0の符号化済みのオリジナルデータ及びflag_proc=0という情報を含む。
【0219】
画像IV1、IV2、IV3、IV4、IV5の各々のクロッピング後の残りの領域のデータは、HEVCコーダを使用して符号化される。5つのデータ信号F21、F22、F23、F24、F25が生成され、データ信号はそれぞれ、flag_proc=1という情報と関連付けられた画像IV1、IV2、IV3、IV4、IV5の各々のクロッピング後の残りの領域の符号化済みのデータを含む。データ信号F10、F21、F22、F23、F24、F25は、連結され、次いで、デコーダに送信される。
【0220】
5つのデータ信号F21、F22、F23、F24、F25は、以下の方法で、クロッピング済みの領域の座標をさらに含み得る。
IV1、IV2、IV3、IV4、IV5:flag_proc=1、左上のポイント(h,v)=(0+200,0+100)、右下のポイント(h,v)=(4096-200,2048-100)、「h」は水平方向、「v」は垂直方向。
【0221】
デコーダ側では、flag_procという情報が読み取られる。
【0222】
flag_proc=0の場合は、ビューの画像IV0は、HEVCデコーダを使用して再構築される。
【0223】
flag_proc=1の場合は、処理済み且つ符号化済みのデータに相当する画像IV1、IV2、IV3、IV4、IV5は、HEVCデコーダを使用して再構築される。クロッピングによって削除されたこれらの画像のデータの再構築は不可能であるため、再構築された画像IV1、IV2、IV3、IV4、IV5には、処理は適用されない。しかし、合成アルゴリズムは、ユーザに必要な任意のビューの画像を生成するために、再構築された6つの画像IV0、IV1、IV2、IV3、IV4、IV5を使用する。
【0224】
5つのデータ信号F21、F22、F23、F24、F25がクロッピング済みの領域の座標をさらに含む事例では、これらの座標は、ユーザに必要なビューの画像を生成するために、合成アルゴリズムによって使用される。
【0225】
第2の例によれば、360°タイプの10個のカメラをシミュレーションするためにコンピュータによって生成された4096×2048のそれぞれの画素の解像度を有する10個の画像IV0、…、IV9が考慮される。画像IV0とIV9は処理しないことが決定されている。画像IV1~IV8のテクスチャ成分は、その部分に対して、水平方向に2倍及び垂直方向に2倍のダウンサンプリングが行われ、対応する深度成分は、その部分に対して、水平方向に4倍及び垂直方向に4倍のダウンサンプリングが行われる。その結果、画像IV1~IV8のテクスチャ成分の解像度は2048×1024になり、画像IV1~IV8の深度成分の解像度は1024×512になる。
【0226】
画像IV1~IV8に関連する画像データなどの処理データは、画像IV1~IV8の解像度2048×1024の8つのダウンサンプリング済みのテクスチャ成分と、画像IV1~IV8の解像度1025×512の8つのダウンサンプリング済みの深度成分とを含む。
【0227】
それに加えて、前述の処理データは、ビュー1~8の各画像IV1~IV8に対するダウンサンプリングファクタを示すテキストタイプのデータを含む。それらのデータは、
- IV1~IV8のテクスチャ:se_h=2、se_v=2(「se」はダウンサンプリング、「h」は水平方向、「v」は垂直方向)
- IV1~IV8の深度:se_h=4、ss_v=4
のように記載される。
【0228】
flag_procという情報のアイテムは、画像IV0及びIV9に関連しては、0に設定され、flag_procという情報のアイテムは、画像IV1~IV8に関連しては、1に設定される。
【0229】
画像IV0及びIV9は、MV-HEVCタイプのコーダを使用して同時に符号化され、それにより、flag_proc=0という情報及び画像IV0及びIV9の符号化済みのオリジナルデータを含む単一のデータ信号F1が生成される。
【0230】
また、画像IV1~IV8の2048×1024の解像度の8つのダウンサンプリング済みのテクスチャ成分及び画像IV1~IV8の1025×512の解像度の8つのダウンサンプリング済みの深度成分を含む画像IV1~IV8に関連する画像データなどの処理データも、MV-HEVCタイプのコーダを使用して同時に符号化され、それにより、ダウンサンプリング済み且つ符号化済みのテクスチャ及び深度データと関連付けられたflag_proc=1という情報を含む単一のデータ信号F2が生成される。ビュー1~8の各画像IV1~IV8に対するダウンサンプリングファクタを示すテキストタイプのデータは、その部分に対して、ロスレス符号化される。データ信号F1とF2は、連結され、次いで、デコーダに送信される。
【0231】
デコーダ側では、flag_procという情報が読み取られる。
【0232】
flag_proc=0の場合は、画像IV0及びIV9は、MV-HEVCデコーダを使用して、同時に再構築される。次いで、それらの初期の解像度である再構築済みの画像IVD0及びIVD9が得られる。
【0233】
flag_proc=1の場合は、それらのそれぞれのダウンサンプリング済み且つ符号化済みのテクスチャ及び深度データに相当する画像IV1~IV8は、MV-HEVCデコーダを使用して、同時に再構築される。次いで、ダウンサンプリング済み且つ再構築済みの画像IVDT1~IVDT8が得られる。8つの画像IV1~IV8の各々に相当するテキストタイプのデータも復号され、各画像IV1~IV8に対して使用されたダウンサンプリングファクタが提供される。
【0234】
次いで、ダウンサンプリング済み且つ再構築済みの画像IVDT1~IVDT8は、それらの対応するダウンサンプリングファクタを使用して処理される。処理が完了すると、再構築済みの画像IVD1~IVD8が得られ、それらの8つのそれぞれのテクスチャ成分は、4096×2048のそれらの初期の解像度であり、それらの8つのそれぞれの深度成分は、4096×2048のそれらの初期の解像度である。
【0235】
合成アルゴリズムは、ユーザに必要なビューの画像を生成するために、それらの初期の解像度のこうして構築された10個のビューの画像を使用する。
【0236】
第3の例によれば、360°タイプの4つのカメラをシミュレーションするためにコンピュータによって生成された4096×2048のそれぞれの画素の解像度を有する3つの画像IV0~IV2が考慮される。次いで、3つのテクスチャ成分及び3つの対応する深度成分が得られる。画像IV0は処理せず、画像IV1及びIV2のそれぞれに対するオクルージョンマップを抽出することが決定されている。その目的のため、画像IV1と画像IV0との間の視差推定が行われ、画像IV1のオクルージョンマスク(すなわち、画像IV0には見られない画像IV1の画素)が生成される。また、画像IV2と画像IV0との間でも視差推定が行われ、画像IV2のオクルージョンマスクが生成される。
【0237】
画像IV1及びIV2に関連する画像データなどの処理データは、画像IV1及びIV2のオクルージョンマスクの2つのテクスチャ成分と、画像IV1及びIV2のオクルージョンマスクの2つの深度成分とを含む。
【0238】
flag_procという情報のアイテムは、画像IV0に関連しては、0に設定され、flag_procという情報のアイテムは、画像IV1及びIV2に関連しては、1に設定される。
【0239】
画像IV0は、HEVCコーダを使用して符号化される。単一のデータ信号F10が生成され、上記データ信号は、画像IV0の符号化済みのオリジナルデータ及びflag_proc=0という情報を含む。
【0240】
画像IV1、IV2の各々のオクルージョンマスクの画像データ(テクスチャと深度)は、HEVCコーダを使用して符号化される。2つのデータ信号F21、F22が生成され、データ信号はそれぞれ、flag_proc=1という情報と関連付けられた画像IV1、IV2の各々のオクルージョンマスクの符号化済みの画像データを含む。データ信号F10、F21、F22は、連結され、次いで、デコーダに送信される。
【0241】
デコーダ側では、flag_procという情報が読み取られる。
【0242】
flag_proc=0の場合は、画像IV0は、HEVCデコーダを使用して再構築される。
【0243】
flag_proc=1の場合は、画像IV1、IV2の各々のオクルージョンマスクの符号化済みの画像データ(テクスチャと深度)に相当する画像IV1、IV2は、HEVCデコーダを使用して再構築される。オクルージョン検出の完了において削除されたこれらの画像のデータの再構築は不可能であるため、再構築された画像IV1、IV2には、処理は適用されない。しかし、合成アルゴリズムは、ユーザに必要なビューの画像を生成するために、再構築された画像IV0、IV1、IV2を使用することができる。
【0244】
第4の例によれば、4096×2048の画素の解像度を有する2つの画像IV0及びIV1が360°タイプの2つのカメラによってそれぞれ捕捉されることが考慮される。第1のビューの画像IV0は、従来方式で、第1の符号化方法MC1を使用して符号化され、第2のビューの画像IV1は、第2の符号化方法MC2による符号化前に処理される。そのような処理は、
- フィルタ(例えば、ソーベルフィルタなど)を使用して画像IV1の輪郭を抽出することと、
- 輪郭の周りの領域を増大するために、例えば、数理形態学作用素を使用して、輪郭の拡大を適用することと
を含む。
【0245】
画像IV1に関連する画像データなどの処理データは、輪郭の周りの領域内の画素と、輪郭の周りの領域外に位置する画素のそれぞれに相当する0に設定された画素とを含む。
【0246】
それに加えて、例えば、輪郭の周りの領域外に位置する画素が0に設定されることを示すマーキング情報(例えば、YUV=000)の形態で、テキストタイプのデータが生成される。0に設定された画素は、符号化も、デコーダへの信号伝達も行われない。
【0247】
画像IV0は、HEVCコーダを使用して符号化され、それにより、flag_proc=0という情報及び画像IV0の符号化済みのオリジナルデータを含むデータ信号F1が生成される。
【0248】
画像IV1の輪郭の周りの領域の画像データは、HEVCコーダを使用して符号化され、マーキング情報は、ロスレスコーダを使用して符号化される。次いで、データ信号F2が生成され、上記信号は、flag_proc=1という情報と、画像IV1の輪郭の周りの領域の符号化済みの画素と、符号化済みのマーキング情報のアイテムとを含む。
【0249】
デコーダ側では、flag_procという情報が読み取られる。
【0250】
flag_proc=0の場合は、画像IV0は、HEVCデコーダを使用して、そのオリジナル解像度で再構築される。
【0251】
flag_proc=1の場合は、画像IV1の輪郭の周りの領域の画像データに相当する画像IV1は、HEVCデコーダによって、0に設定された値の上記領域を取り囲む画素の復元を可能にするマーキング情報を使用して、再構築される。
【0252】
合成アルゴリズムは、ユーザに必要なビューの画像を生成するために、再構築された2つの画像IV0及びIV1を使用することができる。
【0253】
第5の例によれば、4096×2048の画素の解像度を有する4つの画像IV0~IV3が360°タイプの4つのカメラによってそれぞれ捕捉されることが考慮される。画像IV0は、従来方式で、第1の符号化方法MC1を使用して符号化され、画像IV1~IV3は、第2の符号化方法MC2による符号化前に処理される。そのような処理は、画像IV1~IV3のフィルタリングであり、その間、関心領域ROIが計算される。関心領域は、例えば、それらが多くの詳細を含むことを理由に最も関連性があると考えられる各画像IV1~IV3の1つ又は複数の領域を含む。
【0254】
そのようなフィルタリングは、例えば、以下の2つの方法のうちの1つに従って実行される。
- フィルタリングによって各画像IV1~IV3の顕著性マップを計算する。
- 各画像IV1~IV3の深度マップをフィルタリングする。深度マップは、各テクスチャ画素に対して、3Dシーンにおいて近距離深度値であるか又は遠距離深度値であるかによって特徴付けられる。閾値が定義され、この閾値を下回って位置する画像IV1、IV2、IV3の各画素は、カメラに近いシーンの物体と関連付けられる。次いで、この閾値を下回って位置する画素はすべて、関心領域であると考えられる。
【0255】
画像IV1~IV3に関連する画像データなどの処理データは、それらのそれぞれの関心領域内の画素を含み、これらの関心領域外に位置する画素にそれぞれ相当する画素は、0に設定される。
【0256】
それに加えて、例えば、関心領域外に位置する画素が0に設定されることを示すマーキング情報の形態で、テキストタイプのデータが生成される。0に設定された画素は、符号化も、デコーダへの信号伝達も行われない。
【0257】
画像IV0は、HEVCコーダを使用して符号化され、それにより、flag_proc=0という情報及び画像IV0の符号化済みのオリジナルデータを含むデータ信号F10が生成される。
【0258】
各画像IV1、IV2、IV3の関心領域の画像データは、HEVCコーダを使用して符号化され、マーキング情報は、ロスレスコーダを使用して符号化される。3つのデータ信号F21、F22、F23が生成され、これらの信号はそれぞれ、flag_proc=1という情報と関連付けられた画像IV1、IV2、IV3の各々の関心領域の符号化済みの画像データと、符号化済みのマーキング情報の対応するアイテムとを含む。データ信号F10、F21、F22、F23は、連結され、次いで、デコーダに送信される。
【0259】
デコーダ側では、flag_procという情報が読み取られる。
【0260】
flag_proc=0の場合は、画像IV0は、HEVCデコーダを使用して、そのオリジナル解像度で再構築される。
【0261】
flag_proc=1の場合は、そのそれぞれの関心領域の画像データに相当する各画像IV1~IV3は、HEVCデコーダによって、0に設定された値の上記領域を取り囲む画素の復元を可能にするマーキング情報を使用して、再構築される。
【0262】
合成アルゴリズムは、ユーザに必要なビューの画像を生成するために、再構築された4つの画像IV0、IV1、IV2、IV3を直接使用することができる。
【0263】
言うまでもなく、上記で説明される実施形態は、完全に非限定的な指摘として純粋に提供され、当業者によって、本発明の範囲から逸脱することなく、多くの変更を容易に行うことができる。