(58)【調査した分野】(Int.Cl.,DB名)
【発明の概要】
【発明が解決しようとする課題】
【0008】
これまでに知られているこれらの方法には、既存の単眼符号化技術に最小限の変更が必要である。しかしながら、これらは、多眼の対の2つの視点間に存在する冗長度を軽減する能力が限られている。結果として、多眼視の符号化は、単一の単眼視の符号化と比較すると大きなオーバーヘッドをもたらす。さらに、2つより多いカメラ視点を符号化するための先行サポートがない。
【課題を解決するための手段】
【0009】
従来技術のこれらの及びその他の欠点及び不都合は、多視点映像符号化方法及びその装置に関する本発明によって対処される。
【0010】
本発明の一実施態様によれば、映像符号器(video encoder)が提供される。この映像符号器は、ブロックの予測を可能にする時間予測と視点間予測との間で選択することによってピクチャ(picture)のブロックを符号化する符号器を含んでいる。このピクチャは、多視点映像コンテンツに対応し、同じ又は同様のシーンに対して異なる視点を有する一連のピクチャのうちの1つである。このピクチャは、異なる視点のうちの1つを表す。高レベル構文を使用して、ブロックの視点間予測の利用を示す。
【0011】
本発明の他の実施態様によれば、映像符号器が提供される。この映像符号器は、視差ベクトルを用いてピクチャのブロックを符号化する符号器を含んでいる。ピクチャは、多視点映像コンテンツに対応し、符号化されて、国際標準化機構/国際電気標準化会議動画専門家グループ4パート10の高度動画像圧縮符号化標準/国際電気通信連合の電気通信部門によるH.264の勧告及びその拡張のうちの少なくとも1つに準拠したビットストリームを生じる。
【0012】
本発明のさらに他の実施態様によれば、映像符号器が提供される。この映像符号器は、時間的に同じ場所に位置するブロックの時間的に同じ場所に位置する視差ベクトル及び隣接する視差ベクトルのうちの少なくとも1つを用いる視差ベクトル予測子に基づいて、多視点映像コンテンツに対応するピクチャのブロックを符号化する符号器を含んでいる。
【0013】
本発明のさらに他の実施態様によれば、映像符号化方法が提供される。この映像符号化方法は、ブロックの予測を可能にする時間的予測と視点間予測との間で選択することによってピクチャのブロックを符号化するステップを含んでいる。このピクチャは、多視点映像コンテンツに対応し、同じ又は同様のシーンに対して異なる視点を有する一連のピクチャのうちの1つである。ピクチャは、異なる視点のうちの1つを表す。高レベル構文を使用して、ブロックの視点間予測の利用を示す。
【0014】
本発明のさらなる実施態様によれば、映像符号化方法が提供される。この映像符号化方法は、視差ベクトルを用いてピクチャのブロックを符号化するステップを含み、このピクチャは多視点映像コンテンツに対応し、符号化されて、国際標準化機構/国際電気標準化会議動画専門家グループ4パート10の高度動画像圧縮符号化標準/国際電気通信連合の電気通信部門によるH.264の勧告及びその拡張のうちの少なくとも1つに準拠したビットストリームを生じる。
【0015】
本発明のまたさらなる実施態様によれば、映像符号化方法が提供される。この映像符号化方法は、時間的に同じ場所に位置するブロックの時間的に同じ場所に位置する視差ベクトル及び隣接する視差ベクトルのうちの少なくとも1つを用いる視差ベクトル予測子に基づいて、多視点映像コンテンツに対応するピクチャのブロックを符号化するステップを含んでいる。
【0016】
本発明の他の実施態様によれば、映像復号器(video decoder)が提供される。この映像復号器は、ブロックの予測を可能にする時間的予測と視点間予測との間で選択することによってピクチャのブロックを復号化する復号器を含んでいる。ピクチャは、多視点映像コンテンツに対応し、同じ又は同様のシーンに対して異なる視点を有する一連のピクチャのうちの1つである。ピクチャは、異なる視点のうちの1つを表す。高レベル構文が読まれて、ブロックの視点間予測の利用を判定する。
【0017】
本発明のさらに他の実施態様によれば、映像復号器が提供される。この映像復号器は、視差ベクトルを用いてピクチャのブロックを復号化する復号器を含んでいる。ピクチャは、多視点映像コンテンツに対応し、国際標準化機構/国際電気標準化会議動画専門家グループ4パート10の高度動画像圧縮符号化標準/国際電気通信連合の電気通信部門によるH.264の勧告及びその拡張のうちの少なくとも1つに準拠したビットストリームから復号化される。
【0018】
本発明の他の実施態様によれば、映像復号器が提供される。この映像復号器は、時間的に同じ場所に位置するブロックの時間的に同じ場所に位置する視差ベクトル及び隣接する視差ベクトルのうちの少なくとも1つを用いる視差ベクトル予測子に基づいて、多視点映像コンテンツに対応するピクチャのブロックを復号化する復号器を含んでいる。
【0019】
本発明のさらに他の実施態様によれば、映像復号化方法が提供される。この映像復号化方法は、ブロックの予測を可能にする時間的予測と視点間予測との間で選択することによってピクチャのブロックを復号化するステップを含んでいる。ピクチャは、多視点映像コンテンツに対応し、同じ又は同様のシーンに対して異なる視点を有する一連のピクチャのうちの1つである。ピクチャは、異なる視点のうちの1つを表す。高レベル構文が読まれて、ブロックの視点間予測の利用を判定する。
【0020】
本発明のまたさらに他の実施態様によれば、映像復号化方法が提供される。この映像復号化方法は、視差ベクトルを用いてピクチャのブロックを復号化するステップを含んでいる。ピクチャは、多視点映像コンテンツに対応し、国際標準化機構/国際電気標準化会議動画専門家グループ4パート10の高度動画像圧縮符号化標準/国際電気通信連合の電気通信部門によるH.264の勧告及びその拡張のうちの少なくとも1つに準拠したビットストリームから復号化される(400)。
【0021】
本発明のさらなる実施態様によれば、映像復号化方法が提供される。この映像復号化方法は、時間的に同じ場所に位置するブロックの時間的に同じ場所に位置する視差ベクトル及び隣接する視差ベクトルのうちの少なくとも1つを用いる視差ベクトル予測子に基づいて、多視点映像コンテンツに対応するピクチャのブロックを復号化するステップを含んでいる。
【0022】
本発明のこれらの及びその他の実施態様、特徴、ならびに利点は、添付の図面と併せて読まれる次の例示的実施形態の詳細な説明から明らかになるであろう。
【発明を実施するための形態】
【0024】
本発明は、添付の例示的な図と併せてよりよく理解されることが可能である。
【0025】
本発明は、多視点映像符号化方法及び多視点映像復号化方法その装置を対象とする。
【0026】
本明細書の記述は、本発明の原理を説明する。したがって、当業者は、本明細書に明確に記載又は表示されていないが、本発明の原理を実現し、本発明の趣旨と範囲内に含まれる様々な構成を考案することができるであろうと認識される。
【0027】
本明細書に列挙したあらゆる例及び仮定的用語は、本発明の原理及び発明者によって与えられる概念を理解して当技術を促進する助けとする教育上の目的のためであり、このような具体的に列挙した例及び条件への限定ではないと解釈されたい。
【0028】
さらに、本発明の原理、実施態様、及び実施形態、ならびにその特定の例を列挙する本明細書中のあらゆる記載は、その構造的均等物と機能的均等物を共に包含するものである。さらに、このような均等物は、現在知られている均等物及び将来開発される均等物、すなわち、構造にかかわらず同じ機能を行うように開発されるいかなる要素をも含むものである。
【0029】
したがって、例えば、当業者には、本明細書に示したブロック図は、本発明の原理を実現する例示的回路の概念図を表す。同様に、コンピュータ又はプロセッサが明確に示されているかどうかにかかわらず、いかなるフローチャート、流れ図、状態遷移図、擬似コードなども、実質的にコンピュータ可読媒体で表示されてコンピュータ又はプロセッサによって実行されることが可能である様々なプロセスを表す。
【0030】
図に示した様々な要素の機能は、専用のハードウェア、及び適切なソフトウェアと関連してソフトウェアを実行することができるハードウェアを使用して提供されることが可能である。プロセッサによって提供される場合、この機能は、単一の専用のプロセッサによって、単一の共有プロセッサによって、又はいくつかを共有することができる複数の個々のプロセッサによって、提供されることが可能である。さらに、「プロセッサ」又は「コントローラ」という用語の明示的な使用は、ソフトウェアを実行することができるハードウェアを排他的に指すと解釈されるべきではなく、暗に、デジタル信号プロセッサ(「DSP」)のハードウェア、ソフトウェアを格納するリードオンリーメモリ(「ROM」)、ランダムアクセスメモリ(「RAM」)、及び不揮発記憶装置を含む場合がある。
【0031】
また、従来型及び/又はカスタム型の他のハードウェアを含む場合もある。同様に、図に示したいかなるスイッチも、単に概念上のものである。これらの機能は、プログラム論理の動作によって、専用論理によって、プログラム制御と専用論理の相互作用によって、又は手動でも実行されることが可能であり、特定の技術は、状況からより具体的に理解されるように実装者によって選択可能である。
【0032】
特許請求の範囲では、特定の機能を行う手段として表されるいかなる要素も、この機能を行ういかなる方法をも包含するものとし、例えば、a)この機能を実行する回路素子の組合せ、又は、b)この機能を実行する、ソフトウェアを実行するための適切な回路と結合される、ファームウェア、マイクロコードなどを含む任意の形態の該ソフトウェアを含んでいる。このような特許請求の範囲によって定義される本発明は、説明される様々な手段によって提供される機能が、特許請求の範囲が要求する方法で組み合わされ、1つにまとめられるということに属する。したがって、これらの機能を提供することができるいかなる手段も、本明細書に示した手段と同等であるとみなす。
【0033】
本明細書における、本原理の「1つの実施形態」又は「一実施形態」への言及は、本実施形態と関連して説明した特定の特徴、構造、特性、その他が、本原理の少なくとも1つの実施形態に含まれることを意味する。したがって、本明細書にわたって様々な箇所で現れる「1つの実施形態では」又は「一実施形態では」という語句は、必ずしもすべて同じ実施形態を指しているとは限らない。
【0034】
図1は、本発明に係る多視点映像符号化装置の一実施形態を説明するためのブロック図で、全体として参照符号100で例示的な多視点映像符号化(MVC)符号器を示している。この符号器100は、出力を変圧器110の入力と信号通信で接続された結合器105を含んでいる。変圧器110の出力は、量子化器115の入力と信号通信で接続されている。量子化器115の出力は、エントロピ符号器120の入力及び逆量子化器125の入力と信号通信で接続されている。逆量子化器125の出力は、逆変圧器130の入力と信号通信で接続されている。逆変圧器130の出力は、結合器135の第1の非反転入力と信号通信で接続されている。結合器135の出力は、イントラ予測器145の入力及びデブロッキングフィルタ150の入力と信号通信で接続されている。デブロッキングフィルタ150の出力は、(視点i用)参照ピクチャ記憶装置155の入力と信号通信で接続されている。参照ピクチャ記憶装置155の出力は、動き補償器175の第1の入力及び動き推定器180の第1の入力と信号通信で接続されている。動き推定器180の出力は、動き補償器175の第2の入力と信号通信で接続されている。
【0035】
(その他の視点用)参照ピクチャ記憶装置160の出力は、視差/照度推定器170の第1の入力及び視差/照度補償器165の第1の入力と信号通信で接続されている。視差/照度推定器170の出力は、視差/照度補償器165の第2の入力と信号通信で接続されている。
【0036】
エントロピ符号器120の出力は、符号器100の出力として利用可能である。結合器105の非反転入力は、符号器100の入力として利用可能であり、視差/照度推定器170の第2の入力、及び動き推定器180の第2の入力と信号通信で接続されている。スイッチ185の出力は、結合器135の第2の非反転入力、及び結合器105の非反転入力と信号通信で接続されている。スイッチ185は、動き補償器175の出力と信号通信で接続された第1の入力と、視差/照度補償器165の出力と信号通信で接続された第2の入力と、イントラ予測器145の出力と信号通信で接続された第3の入力とを含んでいる。
【0037】
モード判定モジュール140は、出力をスイッチ185に接続され、スイッチ185によってどの入力が選択されるかを制御するようになっている。
【0038】
図2は、本発明に係る多視点映像復号化装置の一実施形態を説明するためのブロック図で、全体として参照符号200で例示的な多視点映像符号化(MVC)復号器を示している。この復号器200は、出力を逆量子化器210の入力と信号通信で接続されたエントロピ復号器205を含んでいる。逆量子化器の出力は、逆変圧器215の入力と信号通信で接続されている。逆変圧器215の出力は、結合器220の第1の非反転入力と信号通信で接続されている。結合器220の出力は、デブロッキングフィルタ225の入力及びイントラ予測器230の入力と信号通信で接続されている。デブロッキングフィルタ225の出力は、(視点i用)参照ピクチャ記憶装置240の入力と信号通信で接続されている。参照ピクチャ記憶装置240の出力は、動き補償器235の第1の入力と信号通信で接続されている。
【0039】
(その他の視点用)参照ピクチャ記憶装置245の出力は、視差/照度補償器250の第1の入力と信号通信で接続されている。
【0040】
エントロピ復号器205の入力は、復号器200への入力として利用可能であり、残りのビットストリームを受信する。さらに、モードモジュール260の入力も、復号器200への入力として利用可能であり、制御構文を受信してスイッチ255によってどの入力が選択されるかを制御する。さらに、動き補償器235の第2の入力が、復号器200の入力として利用可能であり、動きベクトルを受信する。また、視差/照度補償器250の第2の入力が、復号器200の入力として利用可能であり、視差ベクトル及び照度補償構文を受信する。
【0041】
スイッチ255の出力は、結合器220の第2の非反転入力と信号通信で接続されている。スイッチ255の第1の入力は、視差/照度補償器250の出力と信号通信で接続されている。スイッチ255の第2の入力は、動き補償器235の出力と信号通信で接続されている。スイッチ255の第3の入力は、イントラ予測器230の出力と信号通信で接続されている。モードモジュール260の出力は、スイッチ255と信号通信で接続され、スイッチ255によってどの入力が選択されるかを制御する。デブロッキングフィルタ225の出力は、復号器の出力として利用可能である。
【0042】
多視点映像符号化(MVC)は、多視点シーケンスを符号化するための圧縮の構成である。多視点映像符号化(MVC)シーケンスは、異なる視点から同じシーンを取り込む2つ以上の映像シーケンスのセットである。
【0043】
多視点映像源は、同じシーンの複数の視点を含むので、複数の視点の画像間には高い相関関係がある。したがって、時間的冗長度(temporal redundancy)に加えて視点的冗長度(view redundancy)を利用することができ、異なる視点にわたって視点予測を行うことによってこれを実行する。結果として、本明細書に記載した本発明の原理の実施形態は、時間と視点間の両方の予測を含むことができる。
【0044】
説明のために、本発明の実施形態を、本明細書ではMPEG−4 AVC標準に関して説明する。しかしながら、本発明は、MPEG−4 AVC標準に限定されず、本発明の教示が本明細書で提供されると、当技術分野及び関連技術分野の専門家は、本原理の範囲を維持しながら本原理を適用することができる、多視点映像符号化が可能であるこの映像符号化標準及びその他の映像符号化標準を企図するであろうことが理解される。MPEG−4 AVC標準に関して、本明細書に説明された本原理の実施形態は、例えば、デブロッキングフィルタの変更、及び/又は構文のエントロピ符号化を含むことができる。
【0045】
一実施形態では、スライスレベルにおいて、視点間予測リストを導入して視差予測を可能にし、視点間符号化タイプの構文を付加して視差予測の符号化タイプを示す。マクロブロック(MB)レベルでは、フラグ構文を導入して、各信号ブロックに動き補償又は視差補償が用いられているかどうかを示す。さらに、MPEG−4 AVC標準を対象とする実施形態で利用することができる他の変更は、例えば、デブロッキングフィルタ、コンテキスト適応型2値算術符号化(Context Adaptive Binary Arithmetic Coding、CABAC)の新しい構文のコンテキスト、ならびにパラメータセットレベル及びスライスヘッダレベルの追加構文を含んでいる。
【0046】
次に、本発明の一実施形態による視点間符号化タイプ及び視点間参照リストに関して説明する。
【0047】
MPEG−4 AVC標準は、2つの予測リスト、List0及びList1を形成することにより、フレーム間予測を行う。したがって、List0の1つの参照ピクチャのみを用いることにより、又は2つの参照ピクチャ、すなわち、各リストから1つずつを用いることにより、現フレームの画像ブロックを補償することができる。スライスヘッダでは、slice_type構文が送信されて、各スライスの時間的符号化タイプを示す。slice_type=P_SLICEのとき、List0のみが、動き補償(motion compensation)に使用される。slice_type=B_SLICEのとき、List0及びList1の両方が、動き補償に使用されることが可能である。
【0048】
異なる視点間で視点間予測を可能にするために、本発明の一実施形態は、2つの新しい予測リスト、ViewList0及びViewList1を使用することを含んでいる。ViewList0/ViewList1のピクチャは、現在の視点以外のカメラ視点からの参照ピクチャである。スライスヘッダの新しい構文view_slice_typeは、視点間予測の符号化タイプを示すために使用される。例えば、特定のスライスが、slice_type=B_SLICE及びview_slice_type=P_SLICEを有する場合、このスライスのマクロブロック(MB)は、B_SLICE符号化タイプとして時間的に符号化されるか、P_SLICE符号化タイプとして視点間符号化されることが可能である。
【0049】
MPEG−4 AVC標準フレームワークで視点間予測を可能にする代替的方法は、新しい視点予測リスト及び視点間符号化タイプを導入せずに、リストすなわちList0/List1の他の視点から参照ピクチャを挿入することを含んでいる。しかしながら、第1の手法の利点は、次のようなものである。第1の手法の1つの利点は、ViewList0/ViewList1の参照ピクチャが、視点間参照を含むだけであるので、ref_idxを送信することは、同じリストに同視点参照と視点間参照とを共に有するほどビットを費やさないということである。第1の手法の別の利点は、2つの新しいリスト、ViewList0/ViewList1を有することで、時間的予測及び視点間予測を与える個々の方法を提供することである。これは、List0/List1が時間的参照及び視点間参照を共に含む場合に関し、したがってMPEG−4 AVC標準の参照ピクチャのリストの構成を再命令する処理は、変更されることが必要となり、必然的により複雑になる。
【0050】
一実施形態では、各スライスの視点間参照リストは、次のルールに従って形成されることが可能である。第1のルールに関しては、スライスヘッダにおいて、視点間参照ピクチャの数及びそのview_id’sが、ViewList0及びViewList1に送られる。このview_id’sは、2つの視点間予測リストの各々で特有のものである。第2のルールに関しては、視点間予測リストの参照ピクチャが、スライスヘッダに見えるのと同じ順序で配列されている。参照される各視点について、最も近いピクチャ順序カウント(Picture Order Count;POC)数を有する参照ピクチャが、現スライスの視点間予測リストで使用される。
【0051】
視点間参照ピクチャをさらに柔軟に処理することができるように、追加の参照再命令構文を含むことができる。
【0052】
図3は、本発明の一実施形態により多視点映像コンテンツの参照リストを構成する例示的方法を示す流れ図で、全体として参照符号300で多視点映像コンテンツに参照リストを構成する例示的な方法を示している。この方法300は、判定ブロック310へ制御を渡す開始ブロック305を含んでいる。判定ブロック310は、現スライスタイプがPスライス又はBスライスであるかどうかを判定する。そうである場合、制御は機能ブロック315へ渡される。そうでない場合、制御は判定ブロック330へ渡される。
【0053】
機能ブロック315は、時間的参照を用いてList0を構成し、判定ブロック320へ制御を渡す。判定ブロック320は、現スライスタイプがBスライスであるかどうかを判定する。そうである場合、制御は機能ブロック325へ渡される。そうでない場合、制御は判定ブロック330へ渡される。
【0054】
機能ブロック325は、時間的参照を用いてList1を構成し、判定ブロック330へ制御を渡す。
【0055】
判定ブロック330は、現在の視点のスライスタイプがPスライス又はBスライスであるかどうかを判定する。そうである場合、制御は機能ブロック335へ渡される。そうでない場合、制御はループ端ブロック350へ渡される。
【0056】
機能ブロック335は、視点間参照を用いてViewList0を構成し、判定ブロック340へ制御を渡す。判定ブロック340は、現在の視点のスライスタイプがBスライスであるかどうかを判定する。そうである場合、制御は機能ブロック345へ渡される。そうでない場合、制御はループ端ブロック350へ渡される。
【0057】
機能ブロック345は、視点間参照を用いてViewList0を構成し、ループ端ブロック350へ制御を渡す。
【0058】
ループ端ブロック350は、可変mb=0からMacroBlocksInPic−1を用いてループの範囲を設定することを含み、各マクロブロックでループを開始し、機能ブロック355へ制御を渡す。機能ブロック355は、List0/List1を用いて現マクロブロックを符号化し、判定ブロック360へ制御を渡す。判定ブロック360は、現在の視点のスライスタイプがPスライス又はBスライスに等しいかどうかを判定する。そうである場合には、制御は機能ブロック365へ渡される。そうでない場合、制御は判定ブロック370へ渡される。
【0059】
機能ブロック365は、ViewList0/ViewList1を用いて現マクロブロックを符号化し、機能ブロック370へ制御を渡す。
【0060】
機能ブロック370は、ベストモードを選択し、mvc_prediction_flagを設定し、機能ブロック375へ制御を渡す。機能ブロック375は、動き/視差ベクトルのバッファ処理を行い、ループ端ブロック380へ制御を渡す。ループ端ブロックがループを終了し、機能ブロック385へ制御を渡す。機能ブロック385は、符号化されたピクチャを復号化されたピクチャのバッファ(dpb)に保存し、終了ブロック390へ制御を渡す。
【0061】
各スライスの視点間予測は、視点間符号化タイプ及び視点予測リストを用いて十分に設定可能であるので、多視点映像符号化(MVC)コーデックは、任意の視点の符号化順序及び視点拡張性をサポートすることができる。
【0062】
一実施形態では、MBレベルにおいてmvc_pred_flagと呼ばれる新しい構文が、各信号ブロックの符号化に時間的予測又は視点間予測が使用されるかどうかを示す。mvc_pred_flag=0の場合、slice_typeに応じて動き補償にList0/List1を利用する。mvc_pred_flag=1のとき、view_slice_typeに応じてViewList0/ViewList1を利用する。
【0063】
図4は、本発明の一実施形態により時間/視点間モードの判定を行う例示的方法を示す流れ図で、全体として参照符号400で時間的/視点間モードの判定を行う例示的方法を示している。この方法400は、判定ブロック410へ制御を渡す開始ブロック405を含んでいる。判定ブロック410は、現スライスタイプがPスライス又はBスライスであるかどうかを判定する。そうである場合、制御は機能ブロック415へ渡される。そうでない場合、制御は判定ブロック430へ渡される。
【0064】
機能ブロック415は、時間的参照を用いてList0を構成し、判定ブロック420へ制御を渡す。判定ブロック420は、現スライスタイプがBスライスであるかどうかを判定する。そうである場合、制御は機能ブロック425へ渡される。そうでない場合、制御は判定ブロック430へ渡される。
【0065】
機能ブロック425は、時間的参照を用いてList1を構成し、判定ブロック430へ制御を渡す。
【0066】
判定ブロック430は、現在の視点のスライスタイプがPスライス又はBスライスであるかどうかを判定する。そうである場合、制御は機能ブロック435へ渡される。そうでない場合、制御はループ端ブロック450へ渡される。
【0067】
機能ブロック435は、視点間参照を用いてViewList0を構成し、判定ブロック440へ制御を渡す。判定ブロック440は、現在の視点のスライスタイプがBスライスであるかどうかを判定する。そうである場合には、制御は機能ブロック445へ渡される。そうでない場合、制御はループ端ブロック450へ渡される。
【0068】
機能ブロック445は、視点間参照を用いてViewList0を構成し、ループ端ブロック450へ制御を渡す。
【0069】
ループ端ブロック450は、可変mb=0からMacroBlocksInPic−1を用いてループの範囲を設定することを含み、各マクロブロックでループを開始し、判定ブロック455へ制御を渡す。判定ブロック455は、mvc_prediction_flagが1に等しいかどうかを判定する。そうである場合、制御は機能ブロック460へ渡される。そうでない場合、制御は機能ブロック465へ渡される。
【0070】
機能ブロック460は、ViewList0/ViewList1を用いてマクロブロックを復号化し、機能ブロック470へ制御を渡す。
【0071】
機能ブロック465は、List0/List1を用いてマクロブロックを復号化し、機能ブロック470へ制御を渡す。
【0072】
機能ブロック470は、動き/視差ベクトルのバッファ処理を行い、ループ端ブロック475へ制御を渡す。ループ端ブロック475がループを終了し、機能ブロック480へ制御を渡す。機能ブロック480は、復号化されたピクチャを復号化されたピクチャのバッファ(dpb)に保存し、終了ブロック485へ制御を渡す。
【0073】
mvc_pred_dir構文を符号化するために、3つの新しいCABACコンテキストを追加する。コンテキストモデリングは、transform_size_8×8_flag構文と同じものである。
【0074】
MPEG−4 AVC標準の多視点拡張では、復号化されたピクチャのバッファ(dpb)は、多視点からの復号化されたピクチャを処理することができる必要がある。N個の入力視点があるとすると、本原理の一実施形態は、N個の個々のdpbを含むことができる。各dpbは、1つの特定の視点からの復号化されたピクチャを格納する。
【0075】
dpbを管理する代替的方法は、すべての視点のピクチャを単一dpbに入れることである。しかしながら、第1の手法には、次の利点がある。第1の手法の1つの利点は、各視点が、MPEG−4 AVC標準と同じ復号化された参照のマーキング処理を用いた、独自のdpbを有することである。このより簡略化された手法により、同じdpbで異なる視点のピクチャを管理する複雑さを軽減する。第1の手法の別の利点は、時間的相関関係が、一般に視点間相関関係より強力であるので、利用可能な時間的参照フレームの数を削減することが好ましくないことに関連する。各視点がそのdpbで独自の参照ピクチャを管理すれば、時間的予測は、同時放送の場合と同じ複数の参照フレームの予測能力を有する。
【0076】
従来の映像符号化と比較したMVC特有の特徴は、動きと視差とが共存していることである。視点間予測の視差ベクトル(DV)に対して、時間的に予測されるブロックは、動きベクトル(MV)を送る必要がある。
【0077】
同じスライスに動きベクトルと視差ベクトルの両方を処理する2つの例示的方法について、本明細書で説明する。しかしながら、本明細書で提供される本発明の教示があれば、当技術及び関連技術の専門家は、本発明の範囲を維持しながら、これらの同様の方法及びその他の同様の方法を企図するであろう。
【0078】
第1の方法では、各ブロックに対して、動きベクトル又は視差ベクトルを送って格納するが、両方を送って格納しない。動きベクトル又は視差ベクトルのどちらかが、構文mvc_pred_flagに応じて送られ、格納される。これは、必要となる記憶装置は少なくなるが、結合されたベクトル場は整合性がない。
【0079】
第2の方法では、各ブロックに、動きベクトルと視差ベクトルを共に格納する。これは、両方のベクトルを送るか、又は単に一方を送り、もう一方をベクトル場の補間を用いて埋めることで達成されることが可能である。この手法は、より多くの記憶領域を利用するが、動き及び視差フィールドの両方の整合性をよりよく保存することができる。
【0080】
第1の方法の例示的実施形態について、
図5と関連して示して説明する。第2の方法の例示的実施形態について、
図6と関連して示して説明する。
【0081】
図5は、本発明の一実施形態により、多視点映像コンテンツに対応する同じスライスに対して動きベクトル及び視差ベクトルを処理する例示的方法を示す流れ図で、全体として参照符号500で、多視点映像コンテンツに対応する同じスライスに動きベクトル及び視差ベクトルを処理する例示的方法が示されている。この方法500は、判定ブロック510へ制御を渡す開始ブロック505を含んでいる。判定ブロック510は、mvc_pred_flagが0に等しいかどうかを判定する。そうである場合、制御は機能ブロック515へ渡される。そうでない場合には、制御は判定ブロック520へ渡される。機能ブロック515は、視差ベクトル予測子を形成し、視差ベクトルDVを処理し、視差ベクトルDVをVectorBufferに格納し、終了ブロック525へ制御を渡す。
【0082】
機能ブロック520は、動きベクトル予測子を形成し、動きベクトルMVを処理し、動きベクトルMVをVectorBufferに格納し、終了ブロック525へ制御を渡す。
【0083】
図6は、本発明の一実施形態により、多視点映像コンテンツに対して動きベクトル及び視差ベクトルを処理する他の方法を示す流れ図で、全体として参照符号600で、多視点映像コンテンツに動きベクトル及び視差ベクトルを処理する他の方法を示している。この方法600は、機能ブロック610へ制御を渡す開始ブロック605を含んでいる。機能ブロック610は、視差ベクトル予測子を形成し、視差ベクトルDVを処理し、視差ベクトルDVをVectorBuffer1に格納し、機能ブロック615へ制御を渡す。機能ブロック615は、動きベクトル予測子を形成し、動きベクトルMVを処理し、動きベクトルMVをVectorBuffer2に格納し、終了ブロック620へ制御を渡す。
【0084】
同じスライスの符号化に動きベクトルと視差ベクトルとを共に有する意味は、次の側面、すなわち(1)動き/視差ベクトルの予測符号化と、(2)Direct及びSkipモードとに現れる。
【0085】
MPEG−4 AVC標準では、動きベクトルの成分は、隣接ブロックから中央値又は方向予測のいずれかを用いて差動符号化される。多視点映像符号化では、隣接ブロックは現ブロックとは異なる予測方向を有する可能性がある。動き/視差ベクトルの符号化におけるビットを節約するためには、最も相関性のある情報を用いて予測子を形成することが好ましい。隣接ブロックに利用可能である動きベクトルと視差ベクトルが共にあるかどうかに応じて、第1の方法では、同じ予測方向を有する隣接ブロックのみを使用し、第2の方法では、動きベクトルの予測子を形成する際に隣接ブロックの動きベクトルのみを使用し、視差予測子を形成する際に隣接ブロックの視差ベクトルのみを使用する。
【0086】
視差フィールドは、通常時間次元で不変であるので、空間的隣接ブロックの他に、時間的に同一場所に配置されるブロックを用いて視差予測を向上させることができる。
【0087】
MPEG−4 AVC標準のSkip及びDirectモードは、動きベクトルを送信することなく動きを表すことができるため、隣接するマクロブロック間にある時空相関関係をより有効に使う効果的な符号化ツールである。多視点映像符号化では、付加的な視点間相関関係を考慮するために、これらのモードが適用されるべきである。
【0088】
P_Skipモードでは、復元信号は、List0のインデックス0に位置するピクチャを参照するP_16×16マクロブロックタイプの予測信号と同様に取得される。P_Skipマクロブロックを復元するために使用される動きベクトルは、16×16ブロックの動きベクトル予測子と同様である。MVCでは、上述の動き/視差ベクトル予測子の適用が、P_Skipモードをより有用にするのに役立つ。
【0089】
B_SLICE符号化については、B_Skip/B_Direct_16×16/B_Direct_8×8モードが、動きと視差を結びつけることを考えるように適合されるべきである。MPEG−4 AVC標準では、2つの異なるDirectモード、すなわち時間Direct及び空間Directがサポートされている。
【0090】
時間Directモードでは、動きベクトルは、第1のList1参照で同一位置から導かれる。第1のList1参照が視差予測であるとき、システムは他のList1参照(ref_idx>0)で同一位置にある動きベクトルを探すか、又は空間的動きベクトル予測子を利用することができる。
【0091】
空間Directモードでは、動きベクトルは、P_SKIPにより用いられる同様の方法で、ただし、List0/List1を共に考慮に入れて導かれる。P_SKIPで行われた同じ適合は、List1で拡張されることも可能である。
【0092】
表1乃至表4は、本発明の様々な実施形態による構文を含む多視点映像符号化の様々な構文を示している。表1は、多視点映像符号化のシーケンスパラメータセットのRBSP構文を示している。表2は、多視点映像符号化のピクチャパラメータセットのRBSP構文を示している。表3は、多視点映像符号化のスライスヘッダの構文を示している。表4は、多視点映像符号化のマクロブロック層の構文を示している。
【0097】
次に、いくつかについては上述したが、本発明の多くの付随する利点/特徴のいくつかについて説明する。例えば、1つの利点/特徴は、ブロックの予測を可能にする時間的予測と視点間予測との間で選択することによってピクチャのブロックを符号化する符号器を含む映像符号器である。このピクチャは、多視点映像コンテンツに対応し、同じ又は同様のシーンに対して異なる視点を有する一連のピクチャのうちの1つである。このピクチャは、異なる視点のうちの1つを表す。高レベル構文を使用して、ブロックの視点間予測の利用を示す。
【0098】
他の利点/特徴は、上述の映像符号器であり、この符号器は、ピクチャを符号化し、国際標準化機構/国際電気標準化会議動画専門家グループ4パート10の高度動画像圧縮符号化標準/国際電気通信連合の電気通信部門によるH.264の勧告及びその拡張のうちの少なくとも1つに準拠したビットストリームを生じる。
【0099】
さらに他の利点/特徴は、上述の映像符号器であり、高レベル構文はスライスレベルの構文を含んでいる。
【0100】
さらに、他の利点/特徴は、上述の映像符号器であり、ブロックレベルの構文を用いてブロックに動き補償又は視差補償が適用されるかどうかを示している。
【0101】
さらに、他の利点/特徴は、視差ベクトルを用いてピクチャのブロックを符号化する符号器を含む映像符号器である。ピクチャは、多視点映像コンテンツに対応し、符号化されて、国際標準化機構/国際電気標準化会議動画専門家グループ4パート10の高度動画像圧縮符号化標準/国際電気通信連合の電気通信部門によるH.264の勧告及びその拡張のうちの少なくとも1つに準拠したビットストリームを生じる。
【0102】
また、他の利点/特徴は、上述の映像符号器であり、この符号器は、共にブロックに対応する動きベクトル及び視差ベクトルを単一ベクトル場で併用する。
【0103】
また、他の利点/特徴は、上述の映像符号器であり、この符号器は、そのブロックと同じ時間的予測フラッグ及び同じ視点間予測フラッグのうちの少なくとも1つを有する隣接ブロックから導き出された動きベクトル予測子及び視差ベクトル予測子のうちの少なくとも1つを用いてブロックを符号化する。
【0104】
さらに、他の利点/特徴は、上述の映像符号器であり、この符号器は、ブロックに対応する動きベクトル及び視差ベクトルの個々のベクトル場を用いてブロックを符号化する。
【0105】
また、他の利点/特徴は、上述の映像符号器であり、この符号器は、単に対応する動きベクトル場を参照する動きベクトル予測子及び単に対応する視差ベクトル場を参照する視差ベクトル予測子のうちの少なくとも1つを用いてブロックを符号化し、この動きベクトル場及び視差ベクトル場は個々のベクトル場に含まれる。
【0106】
また、他の利点/特徴は、時間的に同じ場所に位置するブロックの時間的に同じ場所に位置する視差ベクトル及び隣接する視差ベクトルのうちの少なくとも1つを用いる視差ベクトル予測子に基づいて、多視点映像コンテンツに対応するピクチャのブロックを符号化する符号器を含む映像符号器である。
【0107】
本発明のこれらの及びその他の特徴ならびに利点は、本明細書の教示に基づいて当業者によって容易に確認されることが可能である。本発明の教示は、ハードウェア、ソフトウェア、ファームウェア、専用プロセッサ、又はその組合せの様々な形態で実装されることが可能である。
【0108】
最も好ましくは、本発明の教示は、ハードウェアとソフトウェアの組合せとして実装される。さらに、ソフトウェアは、プログラム記憶装置に実体的に組み込まれたアプリケーションプログラムとして実装されることが可能である。アプリケーションプログラムは、任意の好適なアーキテクチャを含むマシンにアップロードされ、実行されることが可能である。好ましくは、マシンは、1つ又は複数の中央演算処理装置([CPU」)、ランダムアクセスメモリ([RAM」)、及び入力/出力(「I/O」)インターフェースなどのハードウェアを有するコンピュータプラットフォームに実装される。またコンピュータプラットフォームは、オペレーティングシステム及びマイクロ命令コードを含んでいる。本明細書に記載した様々な処理及び機能は、マイクロ命令コードの一部、又はアプリケーションプログラムの一部、又はその任意の組合せとすることができ、CPUによって実行されることが可能である。また、追加のデータ記憶装置及び印刷装置など、他の様々な周辺装置が、コンピュータプラットフォームに接続されることが可能である。
【0109】
さらに、添付の図面に描かれた構成システムの構成要素及び方法のいくつかは、ソフトウェアに実装されることが好ましいので、システム構成要素又はプロセスの機能ブロック間の実際の関係は、本発明がプログラムされる方法に応じて異なる可能性がある。本明細書の教示があれば、当業者は、本発明のこれらの及び同様の実装又は構成を企図することができるであろう。
【0110】
添付の図面を参照して説明のための実施形態を記載したが、本発明は、これらの厳密な実施形態に限定されず、本発明の範囲又は趣旨から逸脱することなく、当業者によって様々な変更及び修正がもたらされることが可能である。このような変更及び修正はすべて、添付の特許請求の範囲に示す本発明の範囲内に含まれるものとする。