(19)【発行国】日本国特許庁(JP)
(12)【公報種別】特許公報(B2)
(11)【特許番号】
(24)【登録日】2023-05-12
(45)【発行日】2023-05-22
(54)【発明の名称】全方位ビデオを表すマルチビュービデオシーケンスを符号化及び復号化する方法及びデバイス
(51)【国際特許分類】
H04N 19/597 20140101AFI20230515BHJP
H04N 19/70 20140101ALI20230515BHJP
【FI】
H04N19/597
H04N19/70
(21)【出願番号】P 2020532700
(86)(22)【出願日】2018-11-26
(86)【国際出願番号】 FR2018052978
(87)【国際公開番号】W WO2019115899
(87)【国際公開日】2019-06-20
【審査請求日】2021-08-10
(32)【優先日】2017-12-15
(33)【優先権主張国・地域又は機関】FR
(73)【特許権者】
【識別番号】591034154
【氏名又は名称】オランジュ
(74)【代理人】
【識別番号】100099623
【氏名又は名称】奥山 尚一
(74)【代理人】
【氏名又は名称】松島 鉄男
(74)【代理人】
【識別番号】100125380
【氏名又は名称】中村 綾子
(74)【代理人】
【識別番号】100142996
【氏名又は名称】森本 聡二
(74)【代理人】
【識別番号】100166268
【氏名又は名称】田中 祐
(74)【代理人】
【識別番号】100170379
【氏名又は名称】徳本 浩一
(74)【代理人】
【識別番号】100180231
【氏名又は名称】水島 亜希子
(74)【代理人】
【氏名又は名称】有原 幸一
(72)【発明者】
【氏名】ジュング,ジョエル
(72)【発明者】
【氏名】レイ,バッパディティヤ
【審査官】岩井 健二
(56)【参考文献】
【文献】特開2007-159111(JP,A)
【文献】特開2017-130953(JP,A)
【文献】国際公開第2017/090988(WO,A1)
【文献】Johannes Sauer, et al.,Geometry correction for motion compensation of planar-projected 360VR video,Joint Video Exploration Team (JVET) of ITU-T SG 16 WP 3 and ISO/IEC JTC 1/SC 29/WG 11,JVET-D0067,2016年10月06日
(58)【調査した分野】(Int.Cl.,DB名)
H04N 19/00 - 19/98
(57)【特許請求の範囲】
【請求項1】
全方位ビデオを表すマルチビュービデオシーケンスを表す符号化されたデータ信号を復号化する方法であって、前記マルチビュービデオシーケンスは、少なくとも1つの第1のビュー及び1つの第2のビューを含み、該復号化する方法は、以下のステップ、すなわち、
前記第2のビューの平面から前記第1のビューの平面へ
の変換を表すホモグラフィ行列を得る(61)ことを可能にするパラメータを前記データ信号内で読み取るステップ(60)と、
前記第2のビューの画像を復号化するステップ(62)であって、前記第2のビューの前記画像は、ピクセルが前記ホモグラフィ行列を介して前記第1のビューの画像上に投影されたときに、前記第1のビューの前記画像に含まれる前記ピクセルを含むアクティブエリアと呼ばれるエリアを含む、前記第2のビューの画像を復号化するステップと
を含み、
前記第2のビューの前記画像を復号化する前記ステップは、
前記第1のビューの画像の以前に再構築されたピクセルと前記ホモグラフィ行列とから求められたピクセル値を含む基準画像を生成するステップ(620)と、
前記第2のビューの前記画像の少なくとも1つのブロックについて、以前に再構築された前記第2のビューの少なくとも1つの画像を含む基準画像リストであって、前記ブロックの少なくとも一部が前記アクティブエリアに属するときに生成される前記基準画像を含む基準画像リストに含まれる基準画像を表すインデックスを前記データ信号内で読み取るステップ(621)と、前記読み取られたインデックスによって示される前記基準画像から前記ブロックの前記少なくとも一部又は前記ブロックを再構築するステップ(625)と
を含む、方法。
【請求項2】
前記パラメータは、前記第1のビューに関連した第1のカメラと、前記第2のビューに関連した第2のカメラとにそれぞれ関連したカメラパラメータであり、前記方法は、前記カメラパラメータからの前記ホモグラフィ行列
の計算を更に含む、請求項1に記載の復号化する方法。
【請求項3】
前記パラメータは前記ホモグラフィ行列
の係数である、請求項1に記載の復号化する方法。
【請求項4】
前記アクティブエリア
の境界が、前記再構築されるブロックと交差しているとき、前記復号化する方法は、
前記基準画像リストに含まれる基準画像を表す別のインデックスを前記データ信号内で読み取ること
を更に含み、
前記基準画像リストは前記生成された基準画像を含まず、前記アクティブエリアに属しない前記再構築されるブロックの前記ピクセルは、前記読み取られた別のインデックスによって示される前記基準画像のピクセルから再構築される、請求項1~3のいずれか1項に記載の復号化する方法。
【請求項5】
前記方法は、前記第2のビューの平面から第3のビューの平面への前記変換を表す別のホモグラフィ行列を得ることを可能にするパラメータを前記データ信号内で読み取ることを更に含み、
前記別のホモグラフィ行列を介して前記第3のビューの画像内に投影される前記第2のビューの前記画像の少なくとも1つのピクセルは、前記第3のビューの前記画像に含まれ、
前記生成された基準画像は、前記第3のビューの前記画像の以前に再構築されたピクセルと前記別のホモグラフィ行列とから求められたピクセル値を更に含む、請求項1~4のいずれか1項に記載の復号化する方法。
【請求項6】
全方位ビデオを表すマルチビュービデオシーケンスをデータ信号に符号化する方法であって、前記マルチビュービデオシーケンスは、少なくとも1つの第1のビュー及び1つの第2のビューを含み、該符号化する方法は、以下のステップ、すなわち、
前記第2のビューの平面から前記第1のビューの平面へ
の変換を表すホモグラフィ行列を計算するステップ(40)と、
復号化の際に前記ホモグラフィ行列を得ることを可能にするパラメータをデータ信号に符号化するステップ(41)と、
前記第2のビューの画像を符号化するステップ(42)であって、前記第2のビューの前記画像は、ピクセルが前記ホモグラフィ行列を介して前記第1のビューの画像上に投影されたときに、前記第1のビューの前記画像に含まれる前記ピクセルを含むアクティブエリアと呼ばれるエリアを含む、前記第2のビューの画像を符号化するステップと
を含み、
前記画像を符号化する前記ステップは、
前記第1のビューの画像の以前に再構築されたピクセルと前記ホモグラフィ行列とから求められるピクセル値を含む基準画像を生成するステップ(420)と、
前記第2のビューの前記画像の少なくとも1つのブロックについて、以前に再構築された前記第2のビューの少なくとも1つの画像を含む基準画像リストであって、前記ブロックの少なくとも一部が前記アクティブエリアに属するときに生成される前記基準画像を含む基準画像リストに含まれる基準画像から前記ブロック又は前記ブロックの前記少なくとも一部を予測するステップ(424)と、前記ブロック又は前記ブロックの前記少なくとも一部を予測するのに用いられる前記基準画像を表すインデックスを前記データ信号に符号化するステップ(424)と
を含む、方法。
【請求項7】
前記パラメータは、前記第1のビューに関連した第1のカメラと、前記第2のビューに関連した第2のカメラとにそれぞれ関連したカメラパラメータである、請求項6に記載の符号化する方法。
【請求項8】
前記パラメータは前記ホモグラフィ行列の
係数である、請求項6に記載の符号化する方法。
【請求項9】
前記アクティブエリア
の境界が、前記符号化されるブロックと交差しているとき、前記符号化する方法は、
前記基準画像リストに含まれる基準画像を表す別のインデックスを前記データ信号に符号化すること
を更に含み、
前記基準画像リストは前記生成された基準画像を含まず、前記アクティブエリアに属しない前記符号化されるブロックの前記ピクセルは、前記別のインデックスによって示される前記基準画像のピクセルから予測される、請求項6~8のいずれか1項に記載の符号化する方法。
【請求項10】
前記方法は、
前記第2のビューの平面から第3のビューの平面への前記変換を表す別のホモグラフィ行列を計算することであって、前記別のホモグラフィ行列を介して前記第3のビューの画像内に投影される前記第2のビューの前記画像の少なくとも1つのピクセルは、前記第3のビューの前記画像に含まれる、計算することと、
前記別のホモグラフィ行列を得ることを可能にするパラメータを前記データ信号に符号化することと
を更に含み、
前記生成された基準画像は、前記第3のビューの前記画像の以前に再構築されたピクセルと前記別のホモグラフィ行列とから求められたピクセル値を更に含む、請求項6~9のいずれか1項に記載の符号化する方法。
【請求項11】
前記ブロックが前記アクティブエリアに属しないときは、前記生成された基準画像は前記基準画像リストに含まれない、請求項1~
5のいずれか1項に記載の方法。
【請求項12】
前記ブロックが前記アクティブエリアに属しないときは、前記生成された基準画像は前記基準画像リストに含まれない、請求項6~10のいずれか1項に記載の方法。
【請求項13】
全方位ビデオを表すマルチビュービデオシーケンスを表す符号化されたデータ信号を復号化するデバイスであって、前記マルチビュービデオシーケンスは、少なくとも1つの第1のビュー及び1つの第2のビューを含み、該復号化するデバイスは、
前記第2のビューの平面から前記第1のビューの平面へ
の変換を表すホモグラフィ行列を得ることを可能にするパラメータを前記データ信号内で読み取る手段と、
前記第2のビューの画像を復号化する手段であって、前記第2のビューの前記画像は、ピクセルが前記ホモグラフィ行列を介して前記第1のビューの画像上に投影されたときに、前記第1のビューの前記画像に含まれる前記ピクセルを含むアクティブエリアと呼ばるエリアを含む、前記第2のビューの画像を復号化する手段と
を備え、
前記第2のビューの前記画像を復号化する前記手段は、
前記第1のビューの画像の以前に再構築されたピクセルと前記ホモグラフィ行列とから求められたピクセル値を含む基準画像を生成する手段と、
前記第2のビューの前記画像の少なくとも1つのブロックについて、以前に再構築された前記第2のビューの少なくとも1つの画像を含む基準画像リストであって、前記ブロックの少なくとも一部が前記アクティブエリアに属するときに生成される前記基準画像を含む基準画像リストに含まれる基準画像を表すインデックスを前記データ信号から読み取る手段と、前記読み取られたインデックスによって示される前記基準画像から前記ブロック又は前記ブロックの前記少なくとも一部を再構築する手段と
を備える、デバイス。
【請求項14】
全方位ビデオを表すマルチビュービデオシーケンスをデータ信号に符号化するデバイスであって、前記マルチビュービデオシーケンスは、少なくとも1つの第1のビュー及び1つの第2のビューを含み、該符号化するデバイスは、
前記第2のビューの平面から前記第1のビューの平面へ
の変換を表すホモグラフィ行列を計算する手段と、
前記ホモグラフィ行列を得ることを可能にするパラメータを前記データ信号に符号化する手段と、
前記第2のビューの画像を符号化する手段であって、前記第2のビューの前記画像は、ピクセルが前記ホモグラフィ行列を介して前記第1のビューの画像上に投影されたときに、前記第1のビューの前記画像に含まれる前記ピクセルを含むアクティブエリアと呼ばれるエリアを含む、前記第2のビューの画像を符号化する手段と
を備え、
前記画像を符号化する前記手段は、
前記第1のビューの画像の以前に再構築されたピクセルと前記ホモグラフィ行列とから求められるピクセル値を含む基準画像を生成する手段と、
前記第2のビューの前記画像の少なくとも1つのブロックについて、以前に再構築された前記第2のビューの少なくとも1つの画像を含む基準画像リストであって、前記ブロックの少なくとも一部が前記アクティブエリアに属するときに生成される前記基準画像を含む基準画像リストに含まれる基準画像から前記ブロック又は前記ブロックの前記少なくとも一部を予測する手段と、前記ブロック又は前記ブロックの前記少なくとも一部を予測するのに用いられる前記基準画像を表すインデックスを前記データ信号に符号化する手段と
を備える、デバイス。
【請求項15】
コンピュータプログラムであって、該プログラムがプロセッサによって実行されると、請求項1~5又は11のいずれか1項に記載の復号化する方法を実施する命
令を含む、コンピュータプログラム。
【請求項16】
コンピュータプログラムであって、該プログラムがプロセッサによって実行されると、請求項6~10又は12のいずれか1項に記載の符号化する方法を実施する命令を含む、コンピュータプログラム。
【発明の詳細な説明】
【技術分野】
【0001】
本発明は、特に360度ビデオ、180度ビデオ等の全方位ビデオに関する。より詳細には、本発明は、そのようなビデオの符号化及び復号化に関する。
【背景技術】
【0002】
360度ビデオは、球形プラットフォーム上に設置された複数のカメラによってキャプチャされる。これらのカメラは、全ての方向のシーンをキャプチャするように配置されているので、ダイバージェント(divergent)であると言われる。各カメラはシーンの一部をキャプチャし、これらのカメラによってキャプチャされた全てのビューによって、360度視野によるシーンを表すビデオを生成することが可能になる。
【0003】
そのような360度ビデオは、その上、ユーザが、あたかもシーンの中心にいるようにシーンを見ることを可能にするとともに、自身の360度の周囲全体を見ることを可能にし、したがって、ビデオを鑑賞する新たな方法が提供される。そのようなビデオは、一般に、「Head Mounted Device(ヘッドマウントデバイス)」を表す名称HMDによっても知られている仮想現実ヘッドセット上に再現される。しかし、それらのビデオは、適合したユーザインタラクション手段を備える2D画面上に表示することもできる。360度シーンをキャプチャするカメラの数は、使用されるプラットフォームに応じて変化する。
【0004】
しかしながら、使用されるプラットフォームを問わず、2つの近傍のカメラは各々、これらの2つのカメラによってキャプチャされるデータが重複するシーンの部分をキャプチャする。換言すれば、360度でキャプチャされたシーンの一部は、2つの近傍のカメラによって各々キャプチャされた2つの各ビューの間で共通している。これは、2つのビュー、すなわち、第1のカメラによってキャプチャされたビュー1と、第1のカメラの右側に配置された第2のカメラによってキャプチャされたビュー2とを示す
図1に示されている。
図1では、ビュー1における右側のエリア(実線の枠で囲まれている)は、ビュー2における左側のエリア(実線の枠で囲まれている)と同じキャプチャされたシーンの部分に対応する。したがって、ビュー1及び2の間にシーンデータの重複が存在する。そのような重複は、ユーザが360度ビデオによって提供される視野を横断するときに切れ目のない移行を可能にするのに必要である。
【0005】
360度ビデオを生成するために、異なるカメラによってキャプチャされたダイバージェントビューは、ビューの間の重複を考慮して端から端に配置され、パノラマ2Dビューを生成する。このステップは「スティッチング」としても知られている。例えば、正距円筒投影(ERP:EquiRectangular projection)が、そのようなパノラマ画像を得る可能な投影である。この投影によれば、各ビューの画像は球形表面上に投影される。キューブマッピング型投影(立方体の面上への投影)等の他のタイプの投影も可能である。表面上に投影された画像は、次に、2D平面上に投影され、所与の時点においてキャプチャされたシーンの全てのビューを含む2D画像が得られる。
【0006】
このようにして得られた2D画像は、その後、従来の2Dビデオエンコーダ、例えば、HEVC(「High Efficiency Video Coding(高効率ビデオコーディング)」の略語)規格に準拠したエンコーダを用いて符号化される。
【0007】
この技法の主な不利点は、360度ビデオがユーザに戻されたときに、静止した中心点の回りに回転することによって視点を変化させることが可能であるが、例えば、前後左右に数センチメートル移動することによって、この中心点から変位することが可能でないということである。換言すれば、視点を変化させるには、回転しか可能でなく、他のあらゆる動き、特に並進は除外されている。したがって、そのような技法は、3自由度(「3 Degree Of Freedom」を表す3DoF)を提供するが、6自由度(6DoF)による自然な動きを提供しない。
【0008】
この不利点は、ユーザが回転運動しか行わないときであっても、実際には多くの小さな寄生する並進運動があるためなおさらいらつくことになる。そのような並進運動は正確にレンダリングされない。これによって、ユーザの脳によって予想されるものに完全に対応しているとは限らないピクセルがユーザに表示されるという結果がもたらされる。これは、HMDタイプの機器のユーザが感じる不快の主な原因の1つである。
【0009】
MV-HEVCエンコーダ及び3D-HEVCエンコーダは、マルチビューコンテンツを符号化するのに用いられる。そのようなエンコーダは、マルチビューコンテンツのビュー間の類似度を利用する。しかしながら、そのようなエンコーダは、シーンの外部に位置決めされた異なる中心を有するカメラによってキャプチャされる複数の直線ビュー又は収束ビューを取り扱うように設計されている。したがって、これらのエンコーダでは、「ベースライン距離」と呼ばれる2つのカメラ中心の間の距離が、奥行きマップの援助を受けて不一致を計算するのに用いられる。不一致は、その後、不一致補償による予測を介して幾つかのブロックの予測に用いられ、これによって、ビデオシーケンスの画像を符号化するときにビュー間類似度を利用することが可能になる。
【発明の概要】
【発明が解決しようとする課題】
【0010】
360度ビデオの場合に、ビューはダイバージェントであり、そのようなマルチビューエンコーダは、360度ビデオのビューの符号化には最適でなく、エンコーダによって用いられるビュー間予測はわずかであるか、使用されないことさえある。実際、360度ビデオの2つのビューの間には、ビューの間で予測することができる類似したコンテンツはほとんどない。
【0011】
加えて、2つの近傍のビューの間の重複エリアは、完全に類似しているとは限らない。実際、重複エリアのピクセルは、ビューの間で幾何学変換を受けており、重複エリアにおけるビュー間でのピクセルの単純なコピーは、効果のないビュー間予測をもたらす。
【0012】
したがって、現行技術水準を改善することが必要とされている。
【課題を解決するための手段】
【0013】
本発明は、現行技術水準を改善する。このために、本発明は、全方位ビデオを表すマルチビュービデオシーケンスを表す符号化されたデータ信号を復号化する方法に関し、マルチビュービデオシーケンスは、少なくとも1つの第1のビュー及び1つの第2のビューを含む。このような復号化する方法は、
第2のビューの平面から第1のビューの平面への変換を表すホモグラフィ行列を得ることを可能にするパラメータをデータ信号内で読み取ることと、
第2のビューの画像を復号化することであって、第2のビューの画像は、ピクセルがホモグラフィ行列を介して第1のビューの画像上に投影されたときに、第1のビューの画像に含まれる当該ピクセルを含むアクティブエリアと呼ばれるエリアを含む、第2のビューの画像を復号化することと
を含み、
第2のビューの画像を復号化することは、
第1のビューの画像の以前に再構築されたピクセルとホモグラフィ行列とから求められたピクセル値を含む基準画像を生成することと、
第2のビューの画像の少なくとも1つのブロックについて、以前に再構築された第2のビューの少なくとも1つの画像を含む基準画像リストに含まれる基準画像を表すインデックスをデータ信号内で読み取ることと、ブロックがアクティブエリアに属するか否かを判断することと、読み取られたインデックスによって示される上記基準画像から上記ブロックを再構築することであって、生成された基準画像は、上記ブロックがアクティブエリアに属するときは、上記基準画像リストに含まれ、生成された基準画像は、上記ブロックがアクティブエリアに属しないときは、上記基準画像リストに含まれない、再構築することと
を含む。
【0014】
したがって、本発明による方法は、ビュー間重複エリアに属するブロックの近傍のビューの間の冗長性を利用することによって、ダイバージェントビューを符号化するマルチビューエンコーダの圧縮性能を改善することを可能にする。
【0015】
有利には、ビュー間予測は、ビューの間の幾何学的歪を補償することを可能にするホモグラフィ行列を考慮することによって改善される。
【0016】
ビュー間重複エリアは、第1のビューの画像平面から第2のビューの画像平面への変換を表すホモグラフィ行列を用いて特定される。
【0017】
本発明によれば、復号化される画像のアクティブエリアに属するブロックについて、ホモグラフィ行列と以前に再構築されたビューの画像とによって生成される新たな基準画像を考慮することが可能であることによって、予測が改善される。そのような新たな基準画像は、アクティブエリアに属するブロックにのみ利用可能である。したがって、そのような新たな基準画像を基準画像リストに挿入することは、アクティブエリアに属しない他のブロックの基準画像をシグナリングするコストに影響を与えない。
【0018】
アクティブエリアに属するブロックのロケーションは、ホモグラフィ行列を介して復号化される画像のピクセルの、以前に再構築された画像上への投影から直接推論され、そのため、これらのブロックが新たな基準画像を用いることができるか否かを示す追加の情報を符号化する必要はない。
【0019】
ブロックがアクティブエリアに属しないときは、このブロックは、例えば、従来どおりに、イントラ予測によって以前に再構築されたピクセル、又は、画像間予測によって以前に符号化及び復号化された同じビューの別の画像に属するピクセルを用いて再構築される。
【0020】
有利には、基準画像は、第2のビューの平面内に画定される。より詳細には、アクティブエリアが、ホモグラフィ行列を用いて第1のビューの画像内に投影された全てのピクセルによって第2のビューの画像内に特定される。
【0021】
したがって、新たな基準画像は、ホモグラフィ行列によって第1のビューの画像上に投影された第2のビューの画像のピクセルに対応するアクティブピクセルと呼ばれるピクセルを含む。第1のビューの画像において対応関係を有しない基準画像のピクセルの残りは、非アクティブピクセルと呼ばれる。
【0022】
以下に述べる様々な実施の形態又は特徴は、上記で定義した復号化する方法の特徴に単独で追加することもできるし、互いに組み合わせて追加することもできる。
【0023】
本発明の特定の実施の形態によれば、パラメータは、第1のビューに関連した第1のカメラと、第2のビューに関連した第2のカメラとにそれぞれ関連したカメラパラメータであり、方法は、当該カメラパラメータからの上記ホモグラフィ行列の計算を更に含む。
【0024】
本発明のこの特定の実施の形態によれば、ホモグラフィ行列は、復号化の間に、特に各カメラの焦点距離及び第1のビューのカメラと第2のビューのカメラとの間の回転角度を表す角度分離等の、マルチビューシーケンスを表すデータ信号に符号化されたカメラパラメータから計算される。
【0025】
本発明の別の特定の実施の形態によれば、パラメータはホモグラフィ行列の係数である。
【0026】
本発明のこの特定の実施の形態によれば、復号化の際にホモグラフィ行列を再計算する必要はない。その係数は、エンコーダにおいて計算され、マルチビューシーケンスを表すデータ信号において送信される。この結果、デコーダにおける計算複雑度はより低くなる。
【0027】
本発明の別の特定の実施の形態によれば、アクティブエリアの境界が、再構築されるブロックと交差しているとき、復号化する方法は、
基準画像群に含まれる基準画像を表す別のインデックスをデータ信号内で読み取ること
を更に含み、
上記基準画像群は生成された基準画像を含まず、アクティブエリアに属しない再構築されるブロックのピクセルは、読み取られた上記別のインデックスによって示される基準画像のピクセルから再構築される。
【0028】
本発明のこの特定の実施の形態は、アクティブエリアの境界に位置しているブロックのセグメンテーションを、このセグメンテーションを符号化するとともに、これらのブロックのピクセルの予測を、境界に対するブロック内のピクセルの位置に従って適合させる情報の符号化を必要とすることなく提供することを可能にする。
【0029】
本発明の別の特定の実施の形態によれば、復号化する方法は、第2のビューの平面から第3のビューの平面への変換を表す別のホモグラフィ行列を得ることを可能にするパラメータをデータ信号内で読み取ることを更に含み、
上記別のホモグラフィ行列を介して第3のビューの画像内に投影される第2のビューの画像の少なくとも1つのピクセルは、第3のビューの画像に含まれ、
生成された基準画像は、第3のビューの画像の以前に再構築されたピクセルと上記別のホモグラフィ行列とから求められたピクセル値を更に含む。
【0030】
本発明のこの特定の実施の形態は、以前に再構築された別のビューの画像を考慮して新たな基準画像を生成することを可能にする。したがって、第2のビューを予測するのに別のビューも利用可能であるとき、非アクティブピクセルのエリアが削減される。実際、第2のビューから第3のビューに切り替わることを可能にする上記別のホモグラフィ行列は、ピクセルが当該別のホモグラフィ行列を介して第3のビューの画像上に投影されたときに、第3のビューの画像に含まれる当該ピクセルに対応する新たなアクティブエリアを基準画像内に画定することを可能にする。
【0031】
本発明は、全方位ビデオを表すマルチビュービデオシーケンスをデータ信号に符号化する方法にも関し、マルチビュービデオシーケンスは、少なくとも1つの第1のビュー及び1つの第2のビューを含む。復号化する方法は、
第2のビューの平面から第1のビューの平面への変換を表すホモグラフィ行列を計算することと、
復号化の際に上記ホモグラフィ行列を得ることを可能にするパラメータをデータ信号に符号化することと、
第2のビューの画像を符号化することであって、第2のビューの画像は、ピクセルがホモグラフィ行列を介して第1のビューの画像上に投影されたときに、第1のビューの画像に含まれるピクセルを含むアクティブエリアと呼ばれるエリアを含む、第2のビューの画像を符号化することと
を含み、
上記画像を符号化することは、
第1のビューの画像の以前に再構築されたピクセルとホモグラフィ行列とから求められるピクセル値を含む基準画像を生成することと、
第2のビューの画像の少なくとも1つのブロックについて、ブロックがアクティブエリアに属するか否かを判断することと、以前に再構築された第2のビューの少なくとも1つの画像を含む基準画像リストに含まれる基準画像から上記ブロックを予測することであって、生成された基準画像は、上記ブロックがアクティブエリアに属するときは上記基準画像リストに含まれ、生成された基準画像は、上記ブロックがアクティブエリアに属しないときは上記基準画像リストに含まれない、予測することと、上記ブロックを予測するのに用いられる基準画像を表すインデックスをデータ信号に符号化することと
を含む。
【0032】
本発明の特定の実施の形態によれば、パラメータは、第1のビューに関連した第1のカメラと、第2のビューに関連した第2のカメラとにそれぞれ関連したカメラパラメータである。
【0033】
本発明の別の特定の実施の形態によれば、パラメータはホモグラフィ行列のパラメータである。
【0034】
本発明の別の特定の実施の形態によれば、アクティブエリアの境界が、符号化されるブロックと交差しているとき、符号化する方法は、
基準画像群に含まれる基準画像を表す別のインデックスをデータ信号に符号化すること
を更に含み、
上記基準画像群は生成された基準画像を含まず、アクティブエリアに属しない符号化されるブロックのピクセルは、上記別のインデックスによって示される基準画像のピクセルから予測される。
【0035】
本発明の別の特定の実施の形態によれば、符号化する方法は、
第2のビューの平面から第3のビューの平面への変換を表す別のホモグラフィ行列を計算することであって、当該別のホモグラフィ行列を介して第3のビューの画像内に投影される第2のビューの画像の少なくとも1つのピクセルは、第3のビューの画像に含まれる、計算することと、
上記別のホモグラフィ行列を得ることを可能にするパラメータをデータ信号に符号化することと
を更に含み、
生成された基準画像は、第3のビューの画像の以前に再構築されたピクセルと上記別のホモグラフィ行列とから求められたピクセル値を更に含む。
【0036】
本発明は、全方位ビデオを表すマルチビュービデオシーケンスを表す符号化されたデータ信号を復号化するデバイスにも関し、マルチビュービデオシーケンスは、少なくとも1つの第1のビュー及び1つの第2のビューを含み、復号化するデバイスは、
第2のビューの平面から第1のビューの平面への変換を表すホモグラフィ行列を得ることを可能にするパラメータをデータ信号内で読み取る手段と、
第2のビューの画像を復号化する手段であって、第2のビューの画像は、ピクセルがホモグラフィ行列を介して第1のビューの画像上に投影されたときに、第1のビューの画像に含まれる当該ピクセルを含むアクティブエリアと呼ばれるエリアを含む、第2のビューの画像を復号化する手段と
を備え、
第2のビューの画像を復号化する上記手段は、
第1のビューの画像の以前に再構築されたピクセルとホモグラフィ行列とから求められたピクセル値を含む基準画像を生成する手段と、
第2のビューの画像の少なくとも1つのブロックについて、以前に再構築された第2のビューの少なくとも1つの画像を含む基準画像リストに含まれる基準画像を表すインデックスをデータ信号から読み取る手段と、ブロックがアクティブエリアに属するか否かを判断する手段と、読み取られたインデックスによって示される上記基準画像から上記ブロックを再構築する手段であって、生成された基準画像は、上記ブロックがアクティブエリアに属するときは、上記基準画像リストに含まれ、生成された基準画像は、上記ブロックがアクティブエリアに属しないときは、上記基準画像リストに含まれない、再構築する手段と
を備える。
【0037】
本発明は、全方位ビデオを表すマルチビュービデオシーケンスをデータ信号に符号化するデバイスにも関し、マルチビュービデオシーケンスは、少なくとも1つの第1のビュー及び1つの第2のビューを含み、符号化するデバイスは、
第2のビューの平面から第1のビューの平面への変換を表すホモグラフィ行列を計算する手段と、
上記ホモグラフィ行列を得ることを可能にするパラメータをデータ信号に符号化する手段と、
第2のビューの画像を符号化する手段であって、第2のビューの画像は、ピクセルがホモグラフィ行列を介して第1のビューの画像上に投影されたときに、第1のビューの画像に含まれる当該ピクセルを含むアクティブエリアと呼ばれるエリアを含む、第2のビューの画像を符号化する手段と
を備え、
上記画像を符号化する上記手段は、
第1のビューの画像の以前に再構築されたピクセルとホモグラフィ行列とから求められるピクセル値を含む基準画像を生成する手段と、
第2のビューの画像の少なくとも1つのブロックについて、ブロックがアクティブエリアに属するか否かを判断する手段と、以前に再構築された第2のビューの少なくとも1つの画像を含む基準画像リストに含まれる基準画像から上記ブロックを予測する手段であって、生成された基準画像は、上記ブロックがアクティブエリアに属するときは上記基準画像リストに含まれ、生成された基準画像は、上記ブロックがアクティブエリアに属しないときは上記基準画像リストに含まれない、予測する手段と、上記ブロックを予測するのに用いられる基準画像を表すインデックスをデータ信号に符号化する手段と
を備える。
【0038】
本発明の特定の実施の形態によれば、上記復号化する方法及び上記符号化する方法は、それぞれコンピュータプログラムによって実施される。本発明は、コンピュータプログラムであって、当該プログラムがプロセッサによって実行されると、上記で説明した特定の実施の形態のうちの任意の1つによる復号化する方法又は符号化する方法を実施する命令を含む、コンピュータプログラムにも関する。そのようなプログラムは、任意のプログラミング言語を用いることができる。このプログラムは、通信ネットワークからダウンロードすることができ、及び/又は、コンピュータ可読媒体に保存することができる。このプログラムは、任意のプログラミング言語を用いることができ、ソースコードの形態、オブジェクトコードの形態、若しくは部分的にコンパイルされた形態等のソースコードとオブジェクトコードとの間の中間コードの形態、又は他の任意の所望の形態のものとすることができる。
【0039】
本発明は、コンピュータによって可読であり、上述したようなコンピュータプログラムの命令を含む記録媒体又は情報媒体にも関する。上述した記録媒体は、プログラムを記憶することが可能な任意のエンティティ又はデバイスとすることができる。例えば、媒体は、ROM、例えば、CD ROM若しくは超小型電子回路ROM、又はそれ以外に磁気記録手段、例えば、フロッピィディスク若しくはハードディスク等の記憶手段を含むことができる。他方、記録媒体は、電気ケーブル若しくは光ケーブルを介して、無線によって又は他の手段によって送ることができる電気信号又は光信号等の伝送可能媒体に対応することができる。本発明によるプログラムは、特に、インターネットタイプのネットワークからダウンロードすることができる。或いは、記録媒体は、プログラムが組み込まれた集積回路に対応することができ、この回路は、対象となる方法を実行するように又は実行において使用されるように適合されている。
【0040】
本発明の他の特徴及び利点は、限定する例ではなく単なる説明例として与えられている特定の実施形態及び添付図面の以下の説明を読むことによってより明確になる。
【図面の簡単な説明】
【0041】
【
図1】2つのカメラによってキャプチャされ、重複エリアを有する2つのダイバージェントビューを示す図である。
【
図2】ダイバージェントビューをキャプチャする一例を概略的に示す図である。
【
図3】隣接するビューが
図2に示すシステムに従って配置される場合の1つ又は2つの重複エリアを有するビューの2つの例を概略的に示す図である。
【
図4】本発明の特定の実施形態による全方位ビデオを符号化する方法のステップを概略的に示す図である。
【
図5】中心ビューの左側ビュー及び右側ビューから符号化又は復号化される中心ビューの、本発明の特定の実施形態に従って生成される基準画像の一例を示す図である。
【
図6】本発明の特定の実施形態による全方位ビデオを復号化する方法のステップを概略的に示す図である。
【
図7】符号化又は復号化される画像のアクティブエリアと非アクティブエリアとの間の境界を通って交差するブロックの一例を示す図である。
【
図8】本発明の特定の実施形態による全方位ビデオを符号化するデバイスを概略的に示す図である。
【
図9】本発明の特定の実施形態による全方位ビデオを復号化するデバイスを概略的に示す図である。
【
図10A】本発明の特定の実施形態による全方位ビデオを表す符号化されたデータ信号を概略的に示す図である。
【
図10B】本発明の特定の実施形態による全方位ビデオを表す符号化されたデータ信号を概略的に示す図である。
【
図11】2つのダイバージェントカメラA及びBのそれぞれの2つの画像平面上の3D空間の点Pの投影を示す図である。
【発明を実施するための形態】
【0042】
1.一般原理
本発明の目的のうちの1つは、全方位ビデオがマルチビューエンコーダによって符号化されるときのそのようなビデオの符号化を改良することである。このマルチビューエンコーダでは、各ビューは、以前に符号化された同じビューの画像に関する時間予測によって又は別のビューの画像に関するビュー間予測によって符号化される。
【0043】
全方位ビデオのビューを符号化するときのビュー間予測を改善するために、新たな基準画像が、符号化されるビューの近傍のビューの以前に符号化された画像から生成される。より詳細には、符号化又は復号化されるビューからこの符号化又は復号化されるビューに隣接するビューの画像へのピクセルの投影を可能にするホモグラフィ行列が計算される。隣接するビューの画像の境界に投影する符号化又は復号化されるビューのピクセルは、その場合、符号化又は復号化される画像のアクティブエリアを画定する。そのようなアクティブエリアは、その場合、隣接するビューの画像のピクセルが以前に再構築されているときは、これらのピクセルから予測することができる。ビュー間予測は、このように、ビュー間重複のエリアを考慮することによって全方位ビデオのビューを符号化するときに改善される。
【0044】
有利には、現在のビューの画像ブロックを符号化又は復号化するために、新たな基準画像が、隣接するビューの以前に再構築されたピクセル及びホモグラフィ行列から生成される。符号化又は復号化されるブロックが、符号化又は復号化される画像のアクティブエリアに少なくとも部分的に属するとき、この新たな基準画像は、基準画像リストにおいて用いることができる。
【0045】
したがって、この新たな基準画像をシグナリングするコストは、アクティブエリアに属しない他のブロックの符号化に影響を与えない。
【0046】
2.実施の例
図2は、6つのビュー(V1~V6)が、
図2における点Cによって表されるプラットフォーム上に配置された6つのカメラからそれぞれキャプチャされる、ダイバージェントビューキャプチャの一例を概略的に示している。
図2では、各カメラの視野は実線又は点線によって表され、各カメラに関連したビューの画像平面は、カメラの視野と同じ実線又は点線を用いて表されている。ビューごとに、現在のビューとその左側ビュー及び右側ビューとのそれぞれの間に重複エリアが存在することが見て取れる。換言すれば、2つの隣接した又は近傍のビューは、各カメラによってそれぞれキャプチャされたシーンの同じ3Dデータを表すピクセルを有する。例えば、
図2において、エリアZC1はビューV1とV6との間の重複を示し、エリアZC2はビューV2とV3との間の重複を示し、エリアZC5はビューV5とV6との間の重複を示す。
【0047】
しかしながら、隣接するビューの重複エリアからの情報を現在のビューの符号化に用いるには、隣接するビューが以前に符号化及び再構築されていることが必要である。
【0048】
したがって、例えば、ビューの符号化の順序がV1、V2、V3、V4、V5及びV6である場合には、ビューV1は、どのビューもまだ符号化されていないので、重複エリアに関する予測なしに符号化される。ビューV1の画像は、例えば、ビューV1の以前に符号化された画像に関する時間予測によって符号化されることになる。
【0049】
ビューV2、V3、V4及びV5の符号化は、同じビューの以前に符号化された画像に関する時間予測、及び/又は、現在のビューV2、V3、V4及びV5とそれぞれの右側のビューV1、V2、V3、V4との間の重複エリアを用いたビュー間予測を実施することができる。
【0050】
ビューV6の符号化は、同じビューの以前に符号化された画像に関する時間予測、及び/又は、現在のビューV6と右側のビューV5との間の重複エリアを用いたビュー間予測、及び/又は、現在のビューV6と左側のビューV1との間の重複エリアを用いたビュー間予測を用いることができる。
【0051】
例えば、
図3に示すように、ビューV6の場合には、ビューV1とビューV6との重複を表すエリアZA1、及び、ビューV5とビューV6との重複を表す重複エリアZA5をビューV6の予測に用いることができる。
【0052】
別の例によれば、ビューV3の場合には、ビューV2とビューV3との重複を表すエリアZA2をビューV3の予測に用いることができる。
【0053】
以下で説明される全方位ビデオを符号化及び復号化する方法は、一般に、N個のビューを有するマルチビュー画像シーケンスの場合に適用される。Nは2以上の整数である。
【0054】
全方位ビデオを符号化及び復号化する方法は、以下で一般的に説明されており、任意のタイプのマルチビュービデオエンコーダ/デコーダ、例えば、3D-HEVC規格若しくはMV-HEVC規格、又はそれ以外のものに組み込むことができる。
【0055】
図4は、本発明の特定の実施形態による全方位ビデオを符号化する方法のステップを概略的に示している。
【0056】
ステップ40の間に、符号化される各ビューkについて、符号化されるビューkの平面から符号化されるビューkに隣接するビュー(例えば、k-1)の平面への変換を表すホモグラフィ行列が計算される。ここで、符号化されるビューに隣接するビューの画像は以前に符号化及び再構築されていると考えられる。したがって、ここでは、ビューk-1の画像は、同じビューの以前に符号化及び再構築された画像に関する時間予測によって又はビュー間予測によって以前に符号化及び再構築されていると考えられる。
【0057】
符号化される現在のビューkが、それぞれの側部において以前に符号化及び再構築された2つのビューと隣接しているときは、符号化されるビューの平面から右側のビューの平面への変換と、符号化されるビューの平面から左側のビューの平面への変換とにそれぞれ対応する2つのホモグラフィ行列がそれぞれ計算される。
【0058】
ビューkの符号化は以下で検討される。隣接するビューk-1は、以前に符号化及び再構築されており、ビューkと重複エリアを有するものである。
【0059】
ここで、ビューkの画像の少なくとも1つのピクセルがビューk-1の画像上に投影される場合に、ビューkはビューk-1と重複エリアを有すると考えられる。そのようなピクセルは、その場合、ビューkの画像のアクティブエリアと呼ばれるエリアに存在する。
【0060】
ステップ40の間に、隣接するビューk-1と符号化される現在のビューkとの間のホモグラフィ行列が、隣接するビューk-1及び現在のビューkにそれぞれ関連したカメラパラメータから計算される。
【0061】
ホモグラフィ行列の計算を、2つのダイバージェントカメラA及びBのキャプチャ視野が表されている
図11に関して説明する。カメラAの主軸は、カメラAの画像平面PL
Aに垂直な軸に対応する軸z
Aである。隣接するカメラBは、カメラAの軸Z
Aに対してθsepの角度で回転される。カメラBの主軸は、カメラBの画像平面PL
Bに垂直な軸に対応する軸z
Bである。
【0062】
3D空間の点P(px,py,pz)は、カメラAの画像平面PL
AにおけるP
A(pax,pay)及びカメラBの画像平面PL
BにおけるP
B(pbx,pby)に投影される。点P、P
A、P
Bの間の関係は以下の式によって与えられる。
【数1】
この式において、K
A及びK
Bは、
【数2】
等のカメラA及びBの内部パラメータを表す。ただし、f
A及びf
BはそれぞれカメラA及びBの焦点距離である。R
A2Bは、y軸の回りの角度θsepの時計回り回転に対応する、カメラBの主軸z
Bに向けたカメラAの主軸z
Aの回転を表す。R
B2Aは、y軸の回りの角度θsepの反時計回り回転に対応する、カメラAの主軸z
Aに向けたカメラBの主軸z
Bの回転を表す。
【数3】
【0063】
式(2)は、更に以下のように記述することができる。
【数4】
【0064】
式(1)によって与えられるPの値を代入することによって、P
AとP
Bとの間の関係を以下の式によって推論することができる。
【数5】
【0065】
したがって、点PA及びPBは、ホモグラフィ行列Hを介して結び付けられる。
【0066】
したがって、行列Hのパラメータは、カメラA及びBの焦点距離と、2つのカメラの間の角度のずれθsepとから得ることができる。
【0067】
ステップ40の間に、ビューkからビューk-1への変換を表すホモグラフィ行列Hk,k-1のパラメータが、ビューk及びk-1にそれぞれ関連したカメラの焦点距離と、これらの2つのカメラの間の分離角θsepとから計算される。
【0068】
ステップ41の間に、ホモグラフィ行列Hk,k-1を得ることを可能にするパラメータが、全方位ビデオを表すデータ信号内に符号化される。
【0069】
1つの変形形態によれば、3×3ホモグラフィ行列Hk,k-1の9つの係数が信号内に符号化される。
【0070】
別の変形形態によれば、ビューk-1のカメラ及びビューkのカメラの内部パラメータ及び外部パラメータ、すなわち、これらのカメラの焦点距離及びこれらの2つのカメラの間の分離角θsepが信号内に符号化される。この変形形態によれば、ホモグラフィ行列Hk,k-1をデコーダにおいて再計算する必要がある。
【0071】
ステップ41に続いて、現在のビューkが画像ごとにデータ信号内に符号化される。ステップ42の間に、ビューkの時刻tの現在の画像
【数6】
が符号化される。
【0072】
このために、ステップ420の間に、新たな基準画像I
refが生成される。この新たな基準画像I
refは、隣接するビューk-1の同じ時刻tにおける画像であって、以前に符号化及び再構築された画像
【数7】
のピクセルから生成される。このために、基準画像の各ピクセルについて、基準画像のピクセル(x,y)が、ホモグラフィ行列H
k,k-1によってビューk-1の基準フレーム内の点(x’,y’)に投影される。ピクセル(x,y)は、点(x’,y’)が画像
【数8】
に属する場合には、ビューk-1の画像
【数9】
に投影される。投影されたピクセルが画像
【数10】
に属しない場合、すなわち、投影されたピクセルがこの画像の境界の外部にある場合には、基準画像内のピクセルの値は、デフォルト値、例えば128に設定される。このピクセルは非アクティブピクセルと呼ばれる。
【0073】
投影されたピクセルが画像
【数11】
内にある場合、すなわち、投影されたピクセルがこの画像の境界内にある場合には、基準画像内のピクセルの値は、画像ピクセル
【数12】
から取得される。その場合、このピクセルは、アクティブピクセルと呼ばれる。
【0074】
投影されたピクセルが画像
【数13】
のグリッドのピクセルに対応する場合には、基準画像内に投影されたピクセルの値は、画像
【数14】
の対応するピクセルの値を取る。そうでない場合、すなわち、投影されたピクセルが画像
【数15】
内のサブピクセル位置に位置している場合には、基準画像内に投影されたピクセルの値は、従来どおりに、画像
【数16】
内に投影されたピクセルの位置を取り囲む画像
【数17】
のグリッドのピクセルの値から補間される。
【0075】
アクティブピクセル及び非アクティブピクセルは、このように、基準画像内のアクティブエリア及び非アクティブエリアを画定する。
【0076】
符号化されるビューkが、以前に符号化及び再構築されたもう1つの隣接するビューk+1を有する場合には、ステップ420は、この時、ビューkとビューk+1との間で計算されたホモグラフィ行列と、ビューk+1からの画像
【数18】
とを用いて反復される。
【0077】
図5は、現在のビューの左側近傍ビュー及び右側近傍ビューから、現在のビューについて本発明の特定の実施形態に従って生成された基準画像の一例を示している。
図5の例では、隣接する左側及び右側の各ビューについて1つずつの2つのホモグラフィ行列が用いられた。隣接するビューの間の重複エリアのみが、ホモグラフィ行列による投影を介して基準画像内に再構築されることが見て取れる。実際、
図5では、基準画像は、非アクティブエリア(灰色エリア)と、現在のビューと左側のビュー及び右側のビューとの重複をそれぞれ表す2つのアクティブエリアZAg及びZAdとを提示している。
【0078】
図4を再び参照すると、ビューkの現在の画像
【数19】
は、その後、符号化される。このために、この画像は、ピクセルブロックにカットされ、画像のこれらのピクセルブロックは、以下で見られるように、空間予測、時間予測又はビュー間予測によって符号化されるように走査される。
【0079】
現在の画像
【数20】
の各ブロックB
kについて、以下のステップが実施される。
【0080】
ステップ421の間に、ブロックBkが現在の画像のアクティブエリアに位置しているか否かが判断される。換言すれば、ブロックBkがアクティブピクセルを含むか否かが判断される。
【0081】
基準画像が、符号化される現在のビューの画像平面に表されるとき、符号化される現在のビューの画像内のアクティブエリア及び非アクティブエリアは基準画像のアクティブエリア及び非アクティブエリアに対応することに留意されたい。
【0082】
したがって、ここで説明する本発明の特定の実施形態によれば、ブロックBkの全てのピクセルがアクティブである場合、すなわち、ブロックBkの全てのピクセルがアクティブエリアにある場合には、ブロックBkはアクティブエリアに属する。
【0083】
ブロックBkがアクティブエリアに属する場合には、ステップ422の間に、新たな基準画像Irefが、ブロックBkを符号化するために基準画像のリストに追加される。そうでない場合、すなわち、ブロックBkがアクティブエリアに属しない場合には、ブロックBkを符号化するための基準画像のリストは変更されず、符号化される現在のビューkの以前に再構築された画像のみを含む。
【0084】
ステップ423の間に、ブロックBkの符号化モードが決定される。例えば、レート歪最適化が実施され、この間に、ブロックBkに利用可能な全ての符号化モードが比較選択の対象になる。より詳細には、レート歪最適化の間に、従来どおり、空間予測又は画像内予測による符号化モードが検査されるとともに、基準画像のリストを用いた時間予測による符号化モードが検査される。
【0085】
ここで説明する本発明の特定の実施形態によれば、有利には、現在のブロックの符号化モードを決定するエンコーダの従来の動作は変更されない。実際、ブロックBkがアクティブエリアに位置しているとき、新たな基準画像は基準画像のリストに追加済みである。したがって、レート歪最適化は、ステップ420の間に生成された新たな基準画像に関する予測を用いる符号化モードが、従来のイントラ符号化モード又はインタ符号化モードよりもブロックBkにとって好都合である場合には、この符号化モードを選択する。従来、時間予測符号化モードが検査されるとき、現在のブロックと基準画像リストの基準画像内のピクセルブロックとの間の動きが、例えば、ブロックマッチング方法によって推定される。
【0086】
ステップ424の間に、ブロックBkの最良の符号化モードが決定されると、このブロックのデータがデータ信号内に符号化される。従来どおりに、予測ブロックは、ステップ423の間に決定された符号化モードに従って構築される。
【0087】
特に、ステップ423において決定された符号化モードが、新たな基準画像に関する予測を用いる場合には、予測ブロックは、例えば、ステップ423において求められた現在のブロックBkの動きベクトル又は不一致情報によって指し示される新たな基準画像内のピクセルブロックに対応する。
【0088】
現在のブロックBkと予測ブロックとの間の差を計算することによって、残差ブロックが得られる。予測残差は、例えば、DCT(「Discrete Cosine Transform(離散コサイン変換)」を表す)タイプの変換によって変換され、定量化され、エントロピエンコーダによって符号化される。予測モードもデータ信号内に符号化されるとともに、予測に用いられる動きベクトル又は不一致ベクトル、基準画像のインデックス等の関連した符号化パラメータがデータ信号内に符号化される。
【0089】
従来どおりに、現在のブロックBkは、次のブロックの符号化の予測としての機能を果たすために再構築される。
【0090】
ステップ425の間に、現在の画像の全てのブロックが符号化されたか否かが確認される。符号化されるブロックがまだ存在する場合には、方法は、符号化される画像内の次のブロックに切り替わり、ステップ421に戻る。そうでない場合には、現在の画像の符号化は終了する。再構築された現在の画像は、次の画像又は後続のビューを符号化するための基準画像としての機能を果たすために記憶される。
【0091】
図10Aは、
図4に関して説明した本発明の特定の実施形態による全方位ビデオを表す符号化されたデータ信号の一例を概略的に示している。そのようなデータ信号は、ビューkの平面から近傍のビューk-1の平面への変換を表すホモグラフィ行列を得ることを可能にするパラメータPARを含む。ビューkの各画像について、符号化されたデータDATは、画像のアクティブエリアの少なくとも1つのブロックについて、このブロックを再構築するのに用いられる基準画像リストからの基準画像を示すインデックスidxを含む。
【0092】
図6は、本発明の特定の実施形態による全方位ビデオを表す符号化されたデータ信号を復号化する方法のステップを概略的に示している。例えば、符号化されたデータ信号は、
図4に関して説明した符号化方法に従って生成されたものである。ここでは、ビューk-1に隣接する現在のビューkの復号化が検討される。上記と同様に、ビューk-1の画像は以前に復号化及び再構築されていると考えられる。
【0093】
ステップ60の間に、復号化されるビューkの平面から隣接するビューk-1の平面への変換を表すホモグラフィ行列Hk,k-1を得ることを可能にするパラメータが、信号内で読み取られる。
【0094】
1つの変形形態によれば、3×3ホモグラフィ行列Hk,k-1の9つのパラメータが信号内で読み取られる。別の変形形態によれば、ビューk-1及びビューkのカメラの内部パラメータ及び外部パラメータ、すなわち、カメラの焦点距離及び2つのカメラの間の分離角θsepが信号内で読み取られる。
【0095】
ステップ61の間に、ホモグラフィ行列Hk,k-1が得られる。行列のパラメータが信号内で読み取られると、これらのパラメータから、ホモグラフィ行列Hk,k-1が直接得られる。
【0096】
読み取られたパラメータがカメラパラメータに対応するとき、ホモグラフィ行列Hk,k-1は、上記で与えられた式(3)を用いて計算される。
【0097】
ステップ61に続いて、現在のビューkは、データ信号に含まれるデータから画像ごとに復号化される。ステップ62の間に、ビューkの時刻tの現在の画像
【数21】
が復号化される。
【0098】
このために、ステップ620の間に、新たな基準画像I
refが生成される。新たな基準画像I
refは、隣接するビューk-1の同じ時刻tにおける画像であって、以前に再構築された画像
【数22】
のピクセルから生成される。
図4のステップ420に関して説明したものと同じメカニズムが基準画像I
refを生成するために実施される。
【0099】
次に、ビューkの現在の画像
【数23】
が復号化される。このために、この画像は、ピクセルブロックにカットされ、画像のこれらのピクセルブロックは、復号化及び再構築されるように走査される。
【0100】
現在の画像
【数24】
の各ブロックB
kについて、以下のステップが実施される。
【0101】
ステップ621の間に、ブロックBkの符号化されたデータが信号内で読み取られる。特に、ブロックBkが、基準画像リストに含まれる基準画像に関する予測(画像間予測)によって符号化されているとき、基準画像インデックスが読み取られる。従来どおりに、画像が画像間予測によって符号化されている場合、基準画像リストは、再構築される現在の画像と同じビューから以前に再構築された少なくとも1つの画像を含む。符号化モード、動きベクトル又は不一致情報、予測残差係数等の現在のブロックBkの他の情報も、場合によって信号内で読み取ることができる。従来どおりに、ブロックについて読み取られたデータは、エントロピデコーダによって復号化される。復号化された係数に、符号化において実施された量子化と逆の量子化を適用し、量子化を解除された復号化係数に、符号化において実施された変換と逆の変換を適用することによって、残差ブロックが得られる。
【0102】
ステップ622の間に、ブロックBkが現在の画像のアクティブエリアに位置しているか否かが判断される。換言すれば、ブロックBkがアクティブピクセルを含むか否かが判断される。
【0103】
ここで説明する本発明の特定の実施形態によれば、ブロックBkの全てのピクセルがアクティブである場合、すなわち、ブロックBkの全てのピクセルがアクティブエリアにある場合には、ブロックBkはアクティブエリアに属する。
【0104】
ブロックBkがアクティブエリアに属する場合には、ステップ623の間に、新たな基準画像Irefが、基準画像のリストに追加される。そうでない場合、すなわち、ブロックBkがアクティブエリアに属しない場合には、ブロックBkを復号化するための基準画像のリストは変更されず、復号化される現在のビューkの以前に再構築された画像のみを含む。
【0105】
次に、ステップ624の間に、ブロックBkの予測が従来どおりに計算される。ここで説明する本発明の特定の実施形態によれば、有利には、現在のブロックを予測するデコーダの従来の動作は変更されない。
【0106】
ブロックBkがアクティブエリアに位置しているとき、新たな基準画像は、基準画像リストに追加済みである。したがって、現在のブロックBkの予測ブロックの構築は、現在のブロックについて求められた動き情報又は不一致情報及び信号内で読み取られた基準インデックスによって示される基準画像からの動き補償又は不一致補償によって行われる。
【0107】
ステップ625の間に、現在のブロックBkが再構築される。このために、ステップ624の間に構築された予測ブロックは、ステップ621の間に得られた残差ブロックに追加される。
【0108】
ステップ626の間に、現在の画像の全てのブロックが復号化されたか否かが確認される。復号化されるブロックがまだ存在する場合には、方法は、復号化される画像における次のブロックに進み、ステップ621に戻る。そうでない場合には、現在の画像の復号化は終了する。再構築された現在の画像は、後続の画像又は後続のビューを復号化する基準画像としての機能を果たすために記憶される。
【0109】
上記で説明した本発明の特定の実施形態では、符号化又は復号化されるブロックBkの全てのピクセルがアクティブである場合、すなわち、ブロックBkの全てのピクセルがアクティブエリアにある場合に、ブロックBkは現在の画像のアクティブエリアに属すると判断される。
【0110】
本発明の別の特定の実施形態では、符号化又は復号化されるブロックの少なくとも1つのピクセルがアクティブピクセルである場合に、ブロックBkはアクティブエリアに属すると判断される。
【0111】
本発明の上記特定の実施形態によれば、符号化方法及び復号化方法は、符号化又は復号化されるブロックの全てのピクセルがアクティブであるときは類似する。
【0112】
同じことは、符号化又は復号化されるブロックの全てのピクセルが非アクティブであるときも当てはまる。
【0113】
上記別の実施形態によれば、少なくとも1つのアクティブピクセル及び少なくとも1つの非アクティブピクセルを含む、符号化又は復号化されるブロックについて、そのようなブロックの予測が適合される。
【0114】
図7は、符号化又は復号化される画像のアクティブエリア71と非アクティブエリア72との間の境界70を通って交差する符号化又は復号化されるブロックの一例を示している。
【0115】
このタイプのブロックの場合、
図4のステップ424及び
図6のステップ624において決定された予測ブロックが、ステップ420及び620において生成された新たな基準画像を用いて構築されるとき、この予測ブロックは、その場合、このブロックのアクティブエリア71には、新たな基準画像に関する動き補償によって得られたピクセルを含むとともに、このブロックの非アクティブエリア72には、基準画像リストに含まれる現在のビューの以前に再構築された画像に関する動き補償によって得られたピクセルを含む。したがって、アクティブエリアと非アクティブエリアとの間の境界を通って交差するブロックの場合、
-第1の基準インデックスが、信号内に符号化されるか又は信号から復号化される。この第1の基準インデックスは、ブロックのアクティブエリアを符号化するのに用いられる基準画像のインデックスに対応する;及び
-ブロックの非アクティブエリアを符号化するのに用いられる現在のビューの以前に再構築された基準画像のインデックスに対応する第2の基準インデックスが、信号内に符号化されるか又は信号から復号化される。
【0116】
そのような信号の一例を
図10Bに示す。
図10Bのデータ信号は、現在のビューの平面から近傍のビューの平面への変換を表すホモグラフィ行列を得ることを可能にするパラメータPARを含む。現在のビューの各画像について、符号化されたデータDATは、画像のアクティブエリアと非アクティブエリアとの間の境界を通って交差する少なくとも1つのブロックについて、ブロックを再構築するのに用いられる、基準画像リストからの基準画像を示す2つのインデックスidx1及びidx2を含む。
【0117】
代替的に、第1のインデックスidx1が、ブロックのアクティブエリアに用いられる基準画像がステップ420又は620において生成された新たな基準画像に対応することを示す場合にのみ、第2のインデックスidx2は、画像のアクティブエリアと非アクティブエリアとの間の境界を通って交差するブロックの信号内に符号化される。この変形形態によれば、ブロックを予測するのに用いられる基準画像が、現在のビューから以前に再構築された画像であるとき、第2のインデックスを符号化する必要はない。
【0118】
図8は、上記で説明した本発明の特定の実施形態のうちの任意の1つによる符号化方法を実施するように適合された符号化デバイスCODの簡略化した構造を示している。
【0119】
そのような符号化デバイスは、メモリMEMと、例えばプロセッサPROCを備え、メモリMEMに記憶されたコンピュータプログラムPGによって制御される処理ユニットUTとを備える。コンピュータプログラムPGは、当該プログラムがプロセッサPROCによって実行されると、前述したような符号化方法のステップを実施する命令を含む。
【0120】
初期化において、コンピュータプログラムPGのコード命令は、例えば、プロセッサPROCによって実行される前に処理ユニットのメモリ(図示せず)内にロードされる。処理ユニットUTのプロセッサPROCは、特に、コンピュータプログラムPGの命令に従って、
図4及び
図7に関して説明した符号化方法のステップを実施する。
【0121】
本発明の特定の実施形態によれば、符号化デバイスは、特に、符号化デバイスが、全方位ビデオを表す符号化されたデータ信号を通信ネットワークを介して送信することを可能にする通信インタフェースCOMを備える。
【0122】
本発明の特定の実施形態によれば、上記で説明した符号化デバイスは端末に含まれる。
【0123】
図9は、上記で説明した本発明の特定の実施形態のうちの任意の1つによる復号化方法を実施するように適合された復号化デバイスDECの簡略化した構造を示している。
【0124】
そのような復号化デバイスは、メモリMEM0と、例えばプロセッサPROC0を備え、メモリMEM0に記憶されたコンピュータプログラムPG0によって制御される処理ユニットUT0とを備える。コンピュータプログラムPG0は、当該プログラムがプロセッサPROC0によって実行されると、上述したような復号化方法のステップを実施する命令を含む。
【0125】
本発明の特定の実施形態によれば、復号化デバイスDECは、特に、復号化デバイスが、全方位ビデオを表す符号化されたデータ信号を通信ネットワークを介して受信することを可能にする通信インタフェースCOM0を備える。
【0126】
初期化において、コンピュータプログラムPG0のコード命令は、例えば、プロセッサPROC0によって実行される前に処理ユニットのメモリ(図示せず)内にロードされる。処理ユニットUT0のプロセッサPROC0は、特に、コンピュータプログラムPG0の命令に従って、
図6及び
図7に関して説明した復号化方法のステップを実施する。
【0127】
本発明の特定の実施形態によれば、上記で説明した復号化デバイスは端末に含まれる。
なお、出願当初の特許請求の範囲の記載は以下の通りである。
請求項1:
全方位ビデオを表すマルチビュービデオシーケンスを表す符号化されたデータ信号を復号化する方法であって、前記マルチビュービデオシーケンスは、少なくとも1つの第1のビュー及び1つの第2のビューを含み、該復号化する方法は、以下のステップ、すなわち、
前記第2のビューの平面から前記第1のビューの平面への前記変換を表すホモグラフィ行列を得る(61)ことを可能にするパラメータを前記データ信号内で読み取るステップ(60)と、
前記第2のビューの画像を復号化するステップ(62)であって、前記第2のビューの前記画像は、ピクセルが前記ホモグラフィ行列を介して前記第1のビューの画像上に投影されたときに、前記第1のビューの前記画像に含まれる前記ピクセルを含むアクティブエリアと呼ばれるエリアを含む、前記第2のビューの画像を復号化するステップと
を含み、
前記第2のビューの前記画像を復号化する前記ステップは、
前記第1のビューの画像の以前に再構築されたピクセルと前記ホモグラフィ行列とから求められたピクセル値を含む基準画像を生成するステップ(620)と、
前記第2のビューの前記画像の少なくとも1つのブロックについて、以前に再構築された前記第2のビューの少なくとも1つの画像を含む基準画像リストに含まれる基準画像を表すインデックスを前記データ信号内で読み取るステップ(621)と、前記ブロックが前記アクティブエリアに属するか否かを判断するステップ(622)と、前記読み取られたインデックスによって示される前記基準画像から前記ブロックを再構築するステップ(625)であって、前記生成された基準画像は、前記ブロックが前記アクティブエリアに属するときは、前記基準画像リストに含まれ、前記生成された基準画像は、前記ブロックが前記アクティブエリアに属しないときは、前記基準画像リストに含まれない、再構築するステップと
を含む、方法。
請求項2:
前記パラメータは、前記第1のビューに関連した第1のカメラと、前記第2のビューに関連した第2のカメラとにそれぞれ関連したカメラパラメータであり、前記方法は、前記カメラパラメータからの前記ホモグラフィ行列の前記計算を更に含む、請求項1に記載の復号化する方法。
請求項3:
前記パラメータは前記ホモグラフィ行列の前記係数である、請求項1に記載の復号化する方法。
請求項4:
前記アクティブエリアの前記境界が、前記再構築されるブロックと交差しているとき、前記復号化する方法は、
前記基準画像群に含まれる基準画像を表す別のインデックスを前記データ信号内で読み取ること、
を更に含み、
前記基準画像群は前記生成された基準画像を含まず、前記アクティブエリアに属しない前記再構築されるブロックの前記ピクセルは、前記読み取られた別のインデックスによって示される前記基準画像のピクセルから再構築される、請求項1~3のいずれか1項に記載の復号化する方法。
請求項5:
前記方法は、前記第2のビューの平面から第3のビューの平面への前記変換を表す別のホモグラフィ行列を得ることを可能にするパラメータを前記データ信号内で読み取ることを更に含み、
前記別のホモグラフィ行列を介して前記第3のビューの画像内に投影される前記第2のビューの前記画像の少なくとも1つのピクセルは、前記第3のビューの前記画像に含まれ、
前記生成された基準画像は、前記第3のビューの前記画像の以前に再構築されたピクセルと前記別のホモグラフィ行列とから求められたピクセル値を更に含む、請求項1~4のいずれか1項に記載の復号化する方法。
請求項6:
全方位ビデオを表すマルチビュービデオシーケンスをデータ信号に符号化する方法であって、前記マルチビュービデオシーケンスは、少なくとも1つの第1のビュー及び1つの第2のビューを含み、該符号化する方法は、以下のステップ、すなわち、
前記第2のビューの平面から前記第1のビューの平面への前記変換を表すホモグラフィ行列を計算するステップ(40)と、
復号化の際に前記ホモグラフィ行列を得ることを可能にするパラメータをデータ信号に符号化するステップ(41)と、
前記第2のビューの画像を符号化するステップ(42)であって、前記第2のビューの前記画像は、ピクセルが前記ホモグラフィ行列を介して前記第1のビューの画像上に投影されたときに、前記第1のビューの前記画像に含まれる前記ピクセルを含むアクティブエリアと呼ばれるエリアを含む、前記第2のビューの画像を符号化するステップと
を含み、
前記画像を符号化する前記ステップは、
前記第1のビューの画像の以前に再構築されたピクセルと前記ホモグラフィ行列とから求められるピクセル値を含む基準画像を生成するステップ(420)と、
前記第2のビューの前記画像の少なくとも1つのブロックについて、前記ブロックが前記アクティブエリアに属するか否かを判断するステップ(421)と、以前に再構築された前記第2のビューの少なくとも1つの画像を含む基準画像リストに含まれる基準画像から前記ブロックを予測するステップ(424)であって、前記生成された基準画像は、前記ブロックが前記アクティブエリアに属するときは前記基準画像リストに含まれ、前記生成された基準画像は、前記ブロックが前記アクティブエリアに属しないときは前記基準画像リストに含まれない、予測するステップと、前記ブロックを予測するのに用いられる前記基準画像を表すインデックスを前記データ信号に符号化するステップ(424)と
を含む、方法。
請求項7:
前記パラメータは、前記第1のビューに関連した第1のカメラと、前記第2のビューに関連した第2のカメラとにそれぞれ関連したカメラパラメータである、請求項6に記載の符号化する方法。
請求項8:
前記パラメータは前記ホモグラフィ行列の前記パラメータである、請求項6に記載の符号化する方法。
請求項9:
前記アクティブエリアの前記境界が、前記符号化されるブロックと交差しているとき、前記符号化する方法は、
前記基準画像群に含まれる基準画像を表す別のインデックスを前記データ信号に符号化すること
を更に含み、
前記基準画像群は前記生成された基準画像を含まず、前記アクティブエリアに属しない前記符号化されるブロックの前記ピクセルは、前記別のインデックスによって示される前記基準画像のピクセルから予測される、請求項6~8のいずれか1項に記載の符号化する方法。
請求項10:
前記方法は、
前記第2のビューの平面から第3のビューの平面への前記変換を表す別のホモグラフィ行列を計算することであって、前記別のホモグラフィ行列を介して前記第3のビューの画像内に投影される前記第2のビューの前記画像の少なくとも1つのピクセルは、前記第3のビューの前記画像に含まれる、計算することと、
前記別のホモグラフィ行列を得ることを可能にするパラメータを前記データ信号に符号化することと
を更に含み、
前記生成された基準画像は、前記第3のビューの前記画像の以前に再構築されたピクセルと前記別のホモグラフィ行列とから求められたピクセル値を更に含む、請求項6~9のいずれか1項に記載の符号化する方法。
請求項11:
全方位ビデオを表すマルチビュービデオシーケンスを表す符号化されたデータ信号を復号化するデバイスであって、前記マルチビュービデオシーケンスは、少なくとも1つの第1のビュー及び1つの第2のビューを含み、該復号化するデバイスは、
前記第2のビューの平面から前記第1のビューの平面への前記変換を表すホモグラフィ行列を得ることを可能にするパラメータを前記データ信号内で読み取る手段と、
前記第2のビューの画像を復号化する手段であって、前記第2のビューの前記画像は、ピクセルが前記ホモグラフィ行列を介して前記第1のビューの画像上に投影されたときに、前記第1のビューの前記画像に含まれる前記ピクセルを含むアクティブエリアと呼ばれるエリアを含む、前記第2のビューの画像を復号化する手段と
を備え、
前記第2のビューの前記画像を復号化する前記手段は、
前記第1のビューの画像の以前に再構築されたピクセルと前記ホモグラフィ行列とから求められたピクセル値を含む基準画像を生成する手段と、
前記第2のビューの前記画像の少なくとも1つのブロックについて、以前に再構築された前記第2のビューの少なくとも1つの画像を含む基準画像リストに含まれる基準画像を表すインデックスを前記データ信号から読み取る手段と、前記ブロックが前記アクティブエリアに属するか否かを判断する手段と、前記読み取られたインデックスによって示される前記基準画像から前記ブロックを再構築する手段であって、前記生成された基準画像は、前記ブロックが前記アクティブエリアに属するときは、前記基準画像リストに含まれ、前記生成された基準画像は、前記ブロックが前記アクティブエリアに属しないときは、前記基準画像リストに含まれない、再構築する手段と
を備える、デバイス。
請求項12:
全方位ビデオを表すマルチビュービデオシーケンスをデータ信号に符号化するデバイスであって、前記マルチビュービデオシーケンスは、少なくとも1つの第1のビュー及び1つの第2のビューを含み、該符号化するデバイスは、
前記第2のビューの平面から前記第1のビューの平面への前記変換を表すホモグラフィ行列を計算する手段と、
前記ホモグラフィ行列を得ることを可能にするパラメータを前記データ信号に符号化する手段と、
前記第2のビューの画像を符号化する手段であって、前記第2のビューの前記画像は、ピクセルが前記ホモグラフィ行列を介して前記第1のビューの画像上に投影されたときに、前記第1のビューの前記画像に含まれる前記ピクセルを含むアクティブエリアと呼ばれるエリアを含む、前記第2のビューの画像を符号化する手段と
を備え、
前記画像を符号化する前記手段は、
前記第1のビューの画像の以前に再構築されたピクセルと前記ホモグラフィ行列とから求められるピクセル値を含む基準画像を生成する手段と、
前記第2のビューの前記画像の少なくとも1つのブロックについて、前記ブロックが前記アクティブエリアに属するか否かを判断する手段と、以前に再構築された前記第2のビューの少なくとも1つの画像を含む基準画像リストに含まれる基準画像から前記ブロックを予測する手段であって、前記生成された基準画像は、前記ブロックが前記アクティブエリアに属するときは前記基準画像リストに含まれ、前記生成された基準画像は、前記ブロックが前記アクティブエリアに属しないときは前記基準画像リストに含まれない、予測する手段と、前記ブロックを予測するのに用いられる前記基準画像を表すインデックスを前記データ信号に符号化する手段と
を備える、デバイス。
請求項13:
コンピュータプログラムであって、該プログラムがプロセッサによって実行されると、請求項1~5のいずれか1項に記載の復号化する方法を実施する命令、及び/又は、請求項6~10のいずれか1項に記載の符号化する方法を実施する命令を含む、コンピュータプログラム。