【文献】
Ye-Kui Wang et al.,Signaling of Shot Changes,Joint Video Team (JVT) of ISO/IEC MPEG & ITU-T VCEG (ISO/IEC JTC1/SC29/WG11 and ITU-T SG16 Q.6) 4th Meeting: Klagenfurt, Austria,2002年 7月22日,[JVT-D099]
【文献】
Hendry et al.,Undiscardable Leading Pictures for CRA,Joint Collaborative Team on Video Coding (JCT-VC) of ITU-T SG16 WP3 and ISO/IEC JTC1/SC29/WG11 7th Meeting: Geneva, CH,2011年11月21日,[JCTVC-G158]
(58)【調査した分野】(Int.Cl.,DB名)
前記ビットストリームを獲得するチャネルと別個のチャネルを介して、前記メタデータ情報のデータベースを獲得する段階をさらに含むことを特徴とする請求項2に記載のビデオデータ処理方法。
ビデオデータを符号化し、復号可能リーディングピクチャ(decodable-leading picture)のビデオ処理に利用される場面に係わるメタデータ情報を生成するビデオ符号化部と、
前記メタデータ情報を含む、符号化されたビデオデータのビットストリームを生成するビットストリーム生成部と、を含み、
前記復号可能リーディングピクチャは、復号段階で現在RAPピクチャよりも先にディスプレイされ、
前記復号可能リーディングピクチャは、復号段階で、以前RAPピクチャを参照せず、前記現在RAPピクチャによって復号され、
前記復号可能リーディングピクチャの場面に係わるメタデータ情報が前記現在RAPピクチャの場面に係わるメタデータ情報と異なるとき、前記復号可能リーディングピクチャの場面に係わるメタデータ情報は、ディスプレイ順序において最も先行する復号可能リーディングピクチャの位置に挿入されるビデオデータ生成装置。
【発明を実施するための形態】
【0027】
第1側面による符号化されたビデオデータ処理方法は、符号化されたビデオデータのビットストリームを獲得する段階、前記ビットストリーム内のランダムアクセスポイントピクチャ後の復号順序を有するピクチャのビデオ処理に利用されるメタデータ情報を獲得する段階、及び前記ランダムアクセスポイントピクチャ後の復号順序を有するピクチャのうち復号されたビデオデータに対して、前記メタデータ情報に基づいて、ビデオ処理を行う段階を含んでもよい。
【0028】
以下、添付された図面を参照しながら、ただ例示のための実施形態によって、発明について詳細に説明する。下記実施形態、は発明を具体化するためのものであり、発明の権利範囲を制限したり限定したりするものではないということは、言うまでもない。詳細な説明及び実施形態から、発明が属する技術分野の当業者が容易に類推することができることは、発明の権利範囲に属すると解釈される。
【0029】
本明細書で使用される「構成される」または「含む」というような用語は、明細書上に記載されたさまざまな構成要素、またはさまざまな段階を必ずしもいずれも含むものであると解釈されるものではなく、そのうち一部の構成要素、または一部の段階は、含まれないこともあり、またはさらなる構成要素または段階をさらに含んでもよいとに解釈されなければならない。
【0030】
また、本明細書で使用される「第1」または「第2」というように序数を含む用語は、多様な構成要素についての説明に使用することができるが、前記構成要素は、前記用語によって限定されるものではない。前記用語は、1つの構成要素を他の構成要素から区別する目的のみに使用される。
【0031】
本実施形態は、符号化されたビデオデータ処理方法及びその装置、並びに符号化されたビデオデータ生成方法及びその装置に係わるものであり、以下の実施形態が属する技術分野において当業者に周知である事項については、詳細な説明を省略する。
【0032】
図1は、ビデオデータ処理システム10について説明するための図面である。
図1を参照すれば、ビデオデータ処理システム10は、ビデオデータ生成装置100とビデオデータ処理装置200とを含んでもよい。
【0033】
ビデオデータ生成装置100は、ビデオ符号化装置にもなる。ビデオデータ生成装置100は、入力された映像、すなわち、ビデオデータを符号化し、符号化されたビデオデータを生成することができる。
【0034】
ビデオデータ処理装置200は、ビデオ復号装置にもなる。ビデオデータ処理装置200は、符号化されたビデオデータを復号し、復号されたビデオデータを生成することができる。
【0035】
ビデオデータ生成装置100は、符号化されたビデオデータのビットストリーム(以下、ビデオビットストリーム)をビデオデータ処理装置200に伝送し、ビデオデータ処理装置200は、ビデオビットストリームを受信することができる。
【0036】
図2Aは、ビデオデータについて説明するための図面である。
【0037】
該ビデオデータは、ビデオフレーム、言い換えれば、ピクチャの連続である。ビデオデータは、ビデオシーケンス(video sequence)とも呼ばれる。
【0038】
ピクチャのグループ(GOP:group of pictures)は、ディスプレイ順序(display order)によって羅列されたピクチャのうち少なくとも1つのピクチャの連続を意味する。
【0039】
該ピクチャは、ビデオブロック、言い換えれば、LCUs(largest coding units)またはCTUs(coding treeblock units)の連続である。該ビデオブロックは、輝度(luminance)コンポーネントと彩度(chroma)コンポーネントとを有することができる。
【0040】
該ビデオ符号化装置は、1つのピクチャを複数個のスライスに分けることができる。このとき、スライスは、Iスライス、PスライスまたはBスライスにもなる。該Iスライスは、イントラ予測モード(intra prediction mode)を利用して予測されたものであり、Pスライスは、インタ予測モード(inter prediction mode)を利用して予測されたものであり、Bスライスは、双方向インタ予測モード(bi-directional inter prediction mode)を利用して予測されたものを意味する。
【0041】
図2Aを参照すれば、ビデオデータは、第1ピクチャから第8ピクチャまで複数個のピクチャを含んでいる。該ビデオデータに含まれたピクチャは、ディスプレイ順序による連続的なピクチャでもある。第1ピクチャから第4ピクチャまで、第1 GOPであり、第5ピクチャから第8ピクチャまで、第2 GOPである。
【0042】
任意のピクチャは、複数個のスライスに分けられ、そのスライスは、複数個のビデオブロックを含んでもよい。
図2Aを参照すれば、第3ピクチャは、第1スライスと第2スライスとに区分され、それぞれのスライスは、複数個のビデオブロック、すなわち、LCUを含んでもよい。
【0043】
ビデオ符号化時に、ビデオデータ、GOP、ピクチャ、スライス、CU(coding unit)それぞれは、ビデオ符号化属性を示すシンタックスデータ(syntax data)と係わる。ビデオ復号装置は、ビデオデータを復号するために、かようなシンタックスデータを利用することができる。該シンタックスデータは、シンタックスエレメント(syntax elements)を含むシンタックス構造(syntax structure)であり、パラメータ集合であると見ることができる。例えば、HEVC(high efficiency video coding)においては、VPS(video parameter set)、SPS(sequence parameter set)、PPS(picture parameter set)、APS(adaptive parameter set)などのパラメータ集合を定義している。
【0044】
図2Bは、符号化されたビデオデータについて説明するための図面である。
【0045】
符号化されたビデオデータは、復号順序(decoding order)または符号化順序(coding order)によるピクチャの連続である。符号化されたビデオデータは、符号化されたビデオシーケンス(coded video sequence)だも呼ばれる。
【0046】
図2Bを参照すれば、符号化されたビデオデータ(coded video data)は、第1ピクチャから第8ピクチャまで、複数個のピクチャを含んでいる。符号化されたビデオデータに含まれたピクチャは、復号順序による連続的なピクチャでもある。すなわち、符号化されたビデオデータは、ディスプレイ順序ではない復号順序によるピクチャの連続であるので、
図2Bに図示されているように、第5ピクチャと第6ピクチャとの順序が、
図2Aのビデオデータでの第5ピクチャと第6ピクチャとの順序と異なってもよい。言い替えれば、第6ピクチャは、第5ピクチャより先に復号される。
【0047】
図2Bを参照すれば、任意の1つのピクチャは、1つのアクセスユニット(access unit)に対応する。該アクセスユニットは、複数個のNAL(network abstraction layer)ユニットを含んでもよく、1つの符号化されたピクチャを含んでもよい。NALユニットは、VCL NALユニットと、non−VCL NALユニットとに区分される。該VCL NALユニットには、ビデオデータの1つのピクチャを構成するスライスに係わるデータが含まれてもよい。該non−VCLユニットには、スライスに係わるデータ以外の情報、例えば、パラメータ集合に係わるデータが含まれてもよい。
【0048】
図2Bを参照すれば、第3ピクチャは、ヘッダ(header)とNALユニットとの連続からなるということが分かる。従って、符号化されたビデオデータのビットストリーム、すなわち、該ビデオビットストリームは、復号順序による複数個のアクセスユニットの連続であると見ることができ、さらに詳細には、複数個のNALユニットの連続であると見ることができる。
【0049】
一方、本発明の一実施形態によるビデオデータ生成装置100は、ビデオビットストリームにメタデータ情報を含めることができる。本発明の一実施形態によるビデオデータ処理装置200は、該ビデオビットストリームからメタデータ情報を獲得し、復号されたビデオデータに対して、ディスプレイのためのビデオ処理を行うことができる。該メタデータ情報は、ビデオ処理に利用される情報であり、映像品質を高め、オリジナル映像に符合させるために、復号されたビデオデータにも適用されるデータを意味する。例えば、該メタデータ情報は、場面係わる情報であり、場面カット(scene cut)、場面分類(scene classification)、コンテンツの色空間(color space of contents)、色ボリューム(color volume)などに係わる情報にもなる。
【0050】
一方、該メタデータ情報は、それぞれの識別情報を有することができる。同じ識別情報を有するメタデータ情報が伝送される場合、最近伝送されたメタデータ情報が、以前に伝送されたメタデータ情報を部分的に更新したり全体的に代替したりすることができる。また、該メタデータ情報は、以前に伝送されたメタデータ情報を取り消す情報を含んでもよい。該メタデータ情報は、当該メタデータ情報をどのくらい持続させて適用するかということに係わる情報を含んでもよい。該メタデータ情報は、当該メタデータをビデオ処理に利用するとき、適用することができる所定値や条件などを含む少なくとも1つのパラメータを含んでもよい。
【0051】
該メタデータ情報は、SEI(supplemental enhancement information)メッセージまたはSEI NALユニットに含まれ、ビデオビットストリームに挿入される。該メタデータ情報は、各場面の開始部分に挿入され、その場面に含まれた複数個のピクチャに対応するビデオ処理時に適用される。このとき、ある場面の開始部分ではない部分にランダムアクセスが発生すれば、その場面に係わるメタデータ情報がなく、映像の品質が低下する。
【0052】
ランダムアクセスが発生しても、各場面に係わるメタデータ情報の損失がないようにするために、ビデオビットストリームに含まれた全てのピクチャの位置に、各ピクチャが属した場面のメタデータ情報を含めることができる。しかし、かような方式は、ビットレートにおいて、オーバーヘッドが発生してしまう。他の方式は、受信したビデオビットストリームを始めから最後まで分析し、ビデオビットストリームに含まれた各ピクチャのメタデータ情報を把握してメモリに保存しておき、ビデオ処理時に活用する方式である。しかし、かような方式は、リアルタイムストリーミングには適用し難く、ビデオビットストリームの受信がすでに完了した場合にのみ適用することができる。
【0053】
以下、ランダムアクセスが発生する状況を考慮し、メタデータ情報を含むビデオビットストリームの生成及び処理について説明する。
【0054】
図3Aは、一実施形態によるビデオデータ生成装置100の構成について説明するためのブロック図である。ビデオデータ生成装置100には、
図3Aに図示された構成以外にも、他の汎用的なハードウェア構成が含まれてもよいという点は、当該技術分野の当業者であるならば、理解することができるであろう。
【0055】
図3Aを参照すれば、ビデオデータ生成装置100は、ビデオ符号化部110とビットストリーム生成部130とを含んでもよい。
【0056】
ビデオ符号化部110は、ビデオデータを符号化することができる。ビデオ符号化部110は、ビデオデータ生成装置100に入力されたビデオを、符号化順序(coding order)による符号化されたビデオデータに生成することができる。
【0057】
ビデオ符号化部110は、符号化されたビデオデータが、ビデオデータ処理装置200で復号された後でビデオ処理されるとき、復号されたビデオデータに適用されるメタデータ情報を生成することができる。かようなメタデータ情報は、符号化されたビデオデータに対して、ランダムアクセスが発生する場合にも、ランダムアクセスが発生した地点後、復号順序を有するピクチャが復号された後、ビデオ処理が行われるように準備される。このとき、ランダムアクセスは、符号化されたビデオデータに対して、順次に復号してディスプレイせず、復号及びディスプレーする地点をジャンプしたり、ビデオを付け合せ(splicing)たりする場合などを意味する。
【0058】
言い替えれば、ビデオ符号化部110は、各場面の開始部分に挿入され、ビデオ処理に利用されるメタデータ情報を生成したり、ランダムアクセスポイントピクチャ(random access point picture)後の復号順序を有するピクチャのビデオ処理に利用されるメタデータ情報を生成したりすることができる。
【0059】
該ランダムアクセスポイントピクチャは、ランダムアクセスが起きた地点のピクチャを意味する。ランダムアクセスが可能なランダムアクセスポイントにもなるIRAP(intra random access point)ピクチャは、ランダムアクセス時、ビデオビットストリームにおいて復号順序上最初のピクチャであり、Iスライスのみを含んでもよい。IRAPピクチャは、CRA(clean random access)ピクチャ、BLA(broken link access)ピクチャ、またはIDR(instantaneous decoding refresh)ピクチャでもある。
【0060】
CRAピクチャは、ピクチャのグループ(GOP)が開かれた(open)構造を有するとき、ランダムアクセスポイントにもなるピクチャである。CRAピクチャも、IRAPピクチャであるので、Iスライスのみを含み、ビデオビットストリームにおいて、復号順序上最初のピクチャにもなり、ビデオビットストリーム中間になってもよい。ビデオビットストリームが中間で断絶(cut)されたり、損失されたり、またはピクチャのスプライシングが発生したりし、CRAピクチャにおいてランダムアクセスが発生すれば、復号順序がCRAピクチャに先行する先行ピクチャは可用ではなくなる(unavailable)。リーディングピクチャの参照ピクチャにもなる先行ピクチャが可用ではなくなれば、可用ではないピクチャを参照するリーディングピクチャは、正常に復号されない。
【0061】
BLAピクチャは、符号化されたピクチャがスプライシングされたり、ビデオビットストリームが中間で断絶されたりするとき、ランダムアクセスポイントとして、ビデオビットストリーム中間に存在するピクチャを意味する。BLAピクチャは、CRAピクチャと類似した機能及び性質を有する。ただし、ランダムアクセスが発生したとき、BLAピクチャは、新たなシーケンスの始まりと見なされるために、CRAピクチャと異なり、BLAピクチャがデコーダに受信されるとき、映像に係わるパラメータ情報が再びいずれも受信される。BLAピクチャは、ビデオ符号化装置100からも決まり、ビデオ符号化装置100から、ビデオビットストリームを受信した外部装置において、CRAピクチャをBLAピクチャに変更することもできる。例えば、ビデオビットストリームがスプライシングされる場合、ビデオビットストリームを受信した外部装置は、CRAピクチャをBLAピクチャに変更して映像を復号するビデオ復号装置200に提供し、このとき、映像に係わるパラメータ情報も、外部装置からビデオ復号装置200に新たに提供される。
【0062】
一方、ビデオ符号化部110は、ビデオデータ処理装置200において、ランダムアクセスが発生しても、ビデオ処理に利用される各場面のメタデータ情報が損失されないように、ビデオビットストリームの各場面に属する全てのピクチャ位置に含めるためのメタデータ情報に係わる識別情報を生成することもできる。
【0063】
ビットストリーム生成部130は、メタデータ情報を含む、符号化されたビデオデータのビットストリームを生成することができる。ビットストリーム生成部130は、メタデータ情報を各場面の開始部分に挿入したり、ランダムアクセスが起こるランダムアクセスポイントピクチャ、及び周辺ピクチャを考慮し、メタデータ情報を適切なところに挿入したりすることにより、メタデータ情報を含むビデオビットストリームを生成することができる。ランダムアクセスが起こる場合、飛ばした一部ピクチャとメタデータ情報とは復号されないために、ランダムアクセスポイントピクチャ後の復号順序を有するピクチャに対して、復号後にビデオ処理を行うように、ビデオビットストリームに、メタデータ情報が挿入される位置が重要である。
【0064】
ビットストリーム生成部130は、ランダムアクセスポイントピクチャの位置と、ランダムアクセスポイントピクチャ後の復号順序を有する少なくとも1つのピクチャから構成される場面の場面カットの位置とにメタデータ情報を挿入し、ビットストリームを生成することができる。このとき、該場面カットは、複数個のピクチャからなるある場面が、複数個のピクチャからなる他の場面に転換される部分を意味する。該ランダムアクセスポイントピクチャの位置が、任意の場面に対する場面カットの位置に該当すれば、ビットストリーム生成部130は、場面カットに対応する場面に係わるメタデータ情報でもって、ランダムアクセスポイントピクチャの位置に挿入するメタデータ情報の代わりをすることができる。同一メタデータ情報を重複して挿入しないようにするためである。
【0065】
場面カットの位置は、各場面に属したピクチャのうち、ディスプレイ順序上で最初ピクチャの位置に該当する。任意の場面に係わるメタデータ情報は、その任意の場面以前の場面に対応する場面カット位置に挿入することができる。それは、メタデータの復号に必要となる時間を考慮し、実際メタデータが適用される場面より以前の場面に対応する場面カット位置に挿入することにより、メタデータの復号によるディレイを最小化したりなくしたりするためである。
【0066】
一方、ビデオビットストリームにおいて、ランダムアクセスポイントピクチャの位置によって、ランダムアクセスポイントピクチャよりディスプレイ順序では先行するが、復号順序では後になるリーディングピクチャ(leading picture)もある。該リーディングピクチャは、正常に復号可能なリーディングピクチャ(decodable leading picture)と、復号不可能なリーディングピクチャとに分けることができる。ランダムアクセスポイントピクチャの位置によって、復号可能なリーディングピクチャが存在しなかったり、ランダムアクセスポイントピクチャと同じであるか、あるいは異なる場面に属する少なくとも1つの復号可能なリーディングピクチャが存在したりする。
【0067】
ビットストリーム生成部130は、ランダムアクセスポイントピクチャに対して、リーディングピクチャが存在せず、ランダムアクセスポイントピクチャ位置が、場面カットの位置ではなければ、ランダムアクセスポイントピクチャが属した場面に係わるメタデータ情報を、ランダムアクセスポイントピクチャ位置に挿入し、ビットストリームを生成することができる。
【0068】
ビットストリーム生成部130は、ランダムアクセスポイントピクチャに対して、複数個の復号可能なリーディングピクチャが存在する場合、復号可能なリーディングピクチャがいずれもランダムアクセスポイントピクチャと異なる場面に属すれば、ランダムアクセスポイントピクチャが属した場面に係わるメタデータ情報を、ランダムアクセスポイントピクチャ位置に挿入し、復号可能なリーディングピクチャが属した場面に係わるメタデータ情報を、ディスプレイ順序上、最初に復号可能なリーディングピクチャの位置に挿入し、ビットストリームを生成することができる。
【0069】
ビットストリーム生成部130は、ランダムアクセスポイントピクチャに対して、複数個の復号可能なリーディングピクチャが存在する場合、復号可能なリーディングピクチャがいずれもランダムアクセスポイントピクチャと同じ場面に属すれば、ディスプレイ順序上、最初に復号可能なリーディングピクチャの位置に、複数個の復号可能なリーディングピクチャが含まれた場面に係わるメタデータ情報を挿入し、ビットストリームを生成することができる。ただし、復号可能なリーディングピクチャにもかかわらず、復号されないか、あるいはビデオビットストリームから除去される場合がある場合に備え、復号可能なリーディングピクチャが、ランダムアクセスポイントピクチャと同じ場面に属するとき、ディスプレイ順序上、最初に復号可能なリーディングピクチャの位置と、ランダムアクセスポイントピクチャの位置とのいずれにもメタデータ情報を挿入し、ビットストリームを生成することもできる。また、復号可能なリーディングピクチャが除去される場合、そのピクチャの位置に含まれていたメタデータ情報を、同じ場面に属したランダムアクセスポイントピクチャの位置に移すこともできる。ビデオ復号過程またはビデオ出力過程において、復号不可能なリーディングピクチャ及び/または復号可能なリーディングピクチャが除去される場合があるからである。
【0070】
一方、ビットストリーム生成部130は、メタデータ情報に係わる識別情報を含む、符号化されたビデオデータのビットストリームを生成することもできる。ビデオ符号化部110において、メタデータ情報に係わる識別情報を生成した場合、メタデータの代わりに、メタデータ情報に係わる識別情報が含まれるように、ビデオビットストリームを生成することができる。メタデータ情報を直接含めるより、ファイルサイズを小さくし、オーバーヘッドが発生しないように、メタデータに係わる識別情報をビデオビットストリームの所定位置に含めるのである。ただし、ビットストリーム生成部130がメタデータ情報に係わる識別情報を含むビデオビットストリームを生成する場合、当該メタデータを除いた当該メタデータをビデオ処理に利用するとき、適用することができる所定値や条件などを含むパラメータを含めてもよい。
【0071】
メタデータ情報を含むメタデータ情報のデータベースは、メタデータ情報に係わる識別情報が含まれたビデオビットストリームと独立した別個のチャネルを介して、ビデオデータ生成装置100からビデオデータ処理装置200に伝送される。該メタデータ情報のデータベースは、ビデオデータ処理装置200の所定保存空間に保存された少なくとも1つのメタデータ情報を意味する。該メタデータ情報のデータベースは、1回または複数回にわたって、ビデオデータ生成装置100からビデオデータ処理装置200に伝送され、ビデオデータ処理装置200に保存される。ビデオデータ処理装置200は、メタデータ情報に係わる識別情報を利用して、ビデオデータ処理に使用されるメタデータ情報を、メタデータ情報のデータベースから探し出すことができる。該メタデータ情報のデータベースは、ビデオデータ生成装置100からビデオビットストリームが伝送される以前に、ビデオデータ処理装置200に伝送されるか、あるいは別個のチャネルを介して共に伝送される。
【0072】
図3Bは、一実施形態によるビデオデータ処理装置200の構成について説明するためのブロック図である。ビデオデータ処理装置200には、
図3Bに図示された構成以外にも、他の汎用的なハードウェア構成が含まれてもよいという点は、当該技術分野の当業者であるならば、理解することができるであろう。
【0073】
ビデオデータ処理装置200は、ビットストリーム獲得部210、ビデオ復号部230及びビデオ処理プロセッサ250を含んでもよい。
【0074】
ビットストリーム獲得部210は、ビデオビットストリームを獲得することができる。ビットストリーム獲得部210は、ビデオデータ処理装置200に受信されたビデオビットストリームを獲得し、ビデオ復号部230に伝達することができる。
【0075】
ビデオ復号部230は、ビデオビットストリームを復号することができる。ビデオ復号部230は、符号化されたビデオデータが復号された後、ビデオ処理されるとき、復号されたビデオデータに利用されるメタデータ情報を、ビデオビットストリームから抽出することができる。かようなメタデータ情報は、符号化されたビデオデータに対して、ランダムアクセスが発生する場合、ランダムアクセスポイントピクチャ後の復号順序を有するピクチャが復号された後、ビデオ処理が行われるように、ランダムアクセスポイントピクチャ以後の復号されたビデオデータから抽出することができる。
【0076】
ビデオ処理プロセッサ250は、ビデオビットストリームにおいて、ランダムアクセスポイントピクチャ後の復号順序を有するピクチャのビデオ処理に利用されるメタデータ情報を獲得することができる。
【0077】
ビデオ処理プロセッサ250は、ビデオビットストリームにおいて、ランダムアクセスポイントピクチャの位置と、ランダムアクセスポイントピクチャ後の復号順序を有する少なくとも1つのピクチャから構成される場面の場面カット(scene cut)の位置とに基づいて、メタデータ情報を獲得することができる。このとき、ランダムアクセスポイントピクチャの位置が、任意の場面に対する場面カットの位置に該当すれば、ビデオ処理プロセッサ250は、場面カットに対応する場面に係わるメタデータ情報を、ランダムアクセスポイントピクチャの位置から獲得するメタデータ情報として使用することができる。
【0078】
該場面カットの位置は、各場面に属したピクチャのうち、ディスプレイ順序上で最初ピクチャの位置に該当する。任意の場面に係わるメタデータ情報は、任意の場面以前の場面に対応する場面カット位置で獲得することができる。それは、メタデータの復号によるディレイを最小化するか、あるいはなくするために、メタデータの復号に必要となる時間を考慮し、実際メタデータが適用される場面より以前の場面に対応する場面カット位置にメタデータが挿入された場合である。
【0079】
一方、ランダムアクセスポイントピクチャの位置によって、復号可能なリーディングピクチャが存在しないか、あるいはランダムアクセスポイントピクチャと同じであるか、あるいは異なる場面に属する少なくとも1つの復号可能なリーディングピクチャが存在することができる。
【0080】
ビデオ処理プロセッサ250は、ランダムアクセスポイントピクチャに対して、リーディングピクチャが存在せず、ランダムアクセスポイントピクチャ位置が、場面カットの位置ではなければ、ランダムアクセスポイントピクチャ位置に基づき、ランダムアクセスポイントピクチャが属した場面に係わるメタデータ情報を獲得することができる。
【0081】
ビデオ処理プロセッサ250は、ランダムアクセスポイントピクチャに対して、複数個の復号可能なリーディングピクチャが存在する場合、復号可能なリーディングピクチャがいずれもランダムアクセスポイントピクチャと異なる場面に属すれば、ランダムアクセスポイントピクチャ位置に基づき、ランダムアクセスポイントピクチャが属した場面に係わるメタデータ情報を獲得し、ディスプレイ順序上、最初に復号可能なリーディングピクチャの位置に基づき、復号可能なリーディングピクチャが属した場面に係わるメタデータ情報を獲得することができる。ビデオ処理プロセッサ250は、ランダムアクセスポイントピクチャに対して、複数個の復号可能なリーディングピクチャが存在する場合、復号可能なリーディングピクチャがいずれもランダムアクセスポイントピクチャと同じ場面に属すれば、ディスプレイ順序上、最初に復号可能なリーディングピクチャの位置に基づき、複数個の復号可能なリーディングピクチャが含まれた場面に係わるメタデータ情報を獲得することができる。ただし、復号可能なリーディングピクチャにもかかわらず、復号されないか、あるいはビデオビットストリームから除去される場合がある場合に備え、復号可能なリーディングピクチャがランダムアクセスポイントピクチャと同じ場面に属するとき、ディスプレイ順序上、最初に復号可能なリーディングピクチャの位置と、ランダムアクセスポイントピクチャの位置とのいずれにもメタデータ情報が含まれてもよいので、2つの位置いずれにも基づき、メタデータ情報を獲得することができる。また、復号可能なリーディングピクチャが除去される場合、そのピクチャの位置に含まれていたメタデータ情報が同じ場面に属したランダムアクセスポイントピクチャの位置に移されるので、そのときは、ランダムアクセスポイントピクチャの位置に基づき、メタデータ情報を獲得することができる。
【0082】
ビデオ処理プロセッサ250は、ランダムアクセスポイントピクチャ後の復号順序を有するピクチャのうち復号されたビデオデータに対して、獲得したメタデータ情報に基づいて、ビデオ処理を行うことができる。
【0083】
一方、ビデオ処理プロセッサ250は、ビデオデータ生成装置100において、ビデオビットストリームの所定位置にメタデータ情報に係わる識別情報を含め、ビデオビットストリームを伝送した場合、メタデータ情報に係わる識別情報として、メタデータ情報のデータベースからメタデータ情報を獲得することもできる。例えば、メタデータ情報に係わる識別情報は、ビデオビットストリームの各場面に属する全てのピクチャ位置に含まれてもよい。メタデータ情報に係わる識別情報とマッチングするメタデータ情報を、メタデータ情報のデータベースから獲得することができる。メタデータ情報のデータベースは、ビデオビットストリームが受信されるチャネルと別個のチャネルでビデオデータ生成装置100から受信され、ビデオビットストリームより事前に受信されたものでもある。
【0084】
以下、符号化されたビデオデータのビットストリーム生成する過程と、符号化されたビデオデータのビットストリーム処理する過程とについて具体的な例を挙げて説明する。
図4、並びに
図5A及び
図5Bでは、ランダムアクセスに備え、メタデータ情報に係わる識別情報を利用するビデオビットストリームについて詳細に説明し、
図6Aないし
図6Cでは、ランダムアクセスに備え、メタデータ情報を挿入させるビデオビットストリーム内の最適位置を考慮するビデオビットストリームについて詳細に説明する。
【0085】
図4は、一実施形態による、メタデータ情報に係わる識別情報を利用した、符号化されたビデオデータのビットストリーム生成方式及びビットストリーム処理方式について説明するための図面である。
【0086】
図4を参照すれば、ビデオデータ生成装置100は、ビデオデータ処理装置200にビデオビットストリームを伝送することができる。ビデオビットストリームは、ビデオデータ処理装置200でランダムアクセスが発生しても、ビデオ処理に利用される各場面のメタデータ情報が損失されないように、ビデオビットストリームの各場面に属する全てのピクチャ位置に、メタデータ情報に係わる識別情報を含んでもよい。メタデータ情報に係わる識別情報は、メタデータ情報のID(identification)、メタデータ情報の位置情報などにもなる。各場面に属する全てのピクチャ位置に、メタデータ情報を直接含めるよりファイルサイズを小さくし、オーバーヘッドが発生しないように、メタデータに係わる識別情報を含めたのである。メタデータ情報に係わる識別情報は、メタデータ情報のデータベースにおいてメタデータ情報を問い合わせ、メタデータ情報を獲得するのに利用される。
【0087】
一方、各場面に属する全てのピクチャに、メタデータ情報に係わる識別情報を含めてもよいが、さらにファイルサイズを小さくするために、メタデータ情報に係わる識別情報の伝送頻度をさらに低めることもできる。例えば、同じ場面に属したピクチャに対して、所定数のピクチャごとに、メタデータ情報に係わる識別情報を伝送することもできる。
【0088】
該メタデータ情報は、メタデータ情報に係わる識別情報が含まれたビデオビットストリームと独立したビデオデータ生成装置100から、ビデオデータ処理装置200に伝送される。全てのメタデータ情報を有するデータベースの一部または全部が、ビデオデータ生成装置100からビデオデータ処理装置200に伝送される。該メタデータ情報は、ビデオビットストリームが伝送されるチャネルと別個のチャネルで伝送され、ビデオビットストリームより事前に送られる。例えば、SPS(sequence parameter set)またはPPS(picture parameter set)のようなシンタックスデータ(syntax data)が伝送される安全なチャネルを介して、メタデータ情報が伝送される。一部または全てのメタデータ情報は、長ターム(long term)を有して周期的に伝送される。メタデータ情報に係わる識別情報の伝送頻度は、メタデータ情報を問い合わせることができるメタデータ情報のデータベースの伝送頻度より高い。
【0089】
図5A及び
図5Bは、メタデータ情報に係わる識別情報を伝送するメッセージのフォーマットを示した図面である。
【0090】
図5Aのメッセージフォーマットは、メタデータ情報に係わる識別情報と、メタデータ情報とをいずれも含む形態であり、メッセージフォーマット内の条件文によって、メタデータ情報が含まれるか否かということが決定される。
図5Aにおいて、「meta_data_info_present_flag」値が「true」であるならば、メタデータ情報を含んで伝送することができ、「meta_data_info_present_flag」値が「false」であるならば、メタデータ情報に係わる識別情報だけ含まて伝送することができる。従って、各ピクチャごとに、メタデータ情報に係わる識別情報を含めて伝送させるときは、「meta_data_info_present_flag」値を「false」に設定して伝送することができる。
【0091】
図5Bのメッセージフォーマットは、
図5Aのように、条件文によって伝送するデータ種類を区分せず、メタデータ情報と、メタデータ情報に係わる識別情報とをそれぞれ伝送するために、別途のメッセージフォーマットに作ったものである。
図5Bにおいて、「meta_data_info」メッセージフォーマットが、メタデータ情報を伝送することができる形態であり、「meta_data_pointer」メッセージフォーマットが、メタデータ情報に係わる識別情報を伝送することができる形態である。従って、各ピクチャごとに、メタデータ情報に係わる識別情報を含めて伝送させるときは、「meta_data_pointer」メッセージフォーマットで伝送することができる。
【0092】
図6Aは、一実施形態による、メタデータ情報を挿入させるビデオビットストリーム内の最適位置を考慮した、符号化されたビデオデータのビットストリーム生成方式及びビットストリーム処理方式について説明するための図面である。
【0093】
図6Aを参照すれば、ディスプレイ順序と復号順序とが異なる、ビデオデータの一部分を確認することができる。ディスプレイ順序または出力順序(output order)を見れば、第26ピクチャから第32ピクチャに該当し、第26ピクチャから順次にディスプレイされるピクチャの連続であると見ることができる。一方、復号順序(decoding order)を見れば、ディスプレイ順序上で、第27ピクチャに該当するピクチャが、最も早い復号順序24に該当し、ディスプレイ順序上で、第32ピクチャに該当するピクチャが、最も遅い復号順序34に該当するということが分かる。
【0094】
図6Aに図示されているように、ランダムアクセスが、ディスプレイ順序上で、第31ピクチャに該当するピクチャに発生すると仮定する場合、ランダムアクセスポイントピクチャは、ディスプレイ順序上で、第31ピクチャに該当するピクチャになる。ディスプレイ順序上で、第31ピクチャに該当するピクチャの復号順序は、28であるために、復号順序が28以後のピクチャだけ復号される。従って、ディスプレイ順序上で、第26ピクチャと第27ピクチャは、復号順序がそれぞれ27及び24であるために、復号されることがない。
【0095】
図6Aを参照すれば、ディスプレイ順序上で、第28ピクチャ、第29ピクチャ、第30ピクチャは、ランダムアクセスポイントピクチャである第31ピクチャよりディスプレイ順序は先立つが、復号順序が遅れるので、リーディングピクチャに該当する。特に、それらは、復号可能なリーディングピクチャに該当する。一方、ディスプレイ順序と復号順序とがいずれもランダムアクセスポイントピクチャより遅れるピクチャをトレーリングピクチャ(trailing picture)という。
図6Aを参照すれば、ディスプレイ順序上で第32ピクチャは、ランダムアクセスポイントピクチャである第31ピクチャより、ディスプレイ順序と復号順序とがいずれも遅れるので、トレーリングピクチャに該当する。かようなビデオデータを符号化し、ビデオビットストリームに生成する場合、各場面に対応するメタデータ情報を挿入したビデオビットストリームは、ランダムアクセスを考慮し、次のように生成することができる。
【0096】
図6Aを参照すれば、復号順序が28であるピクチャにランダムアクセスが発生したので、復号順序が28以後のピクチャのためのメタデータ情報が、ビデオビットストリーム生成時に挿入されなければならない。
図6Aに図示されているように、復号順序上で29、30、31であるピクチャは、復号可能なリーディングピクチャであり、ランダムアクセスポイントピクチャが属した第2場面と異なる第1場面に該当するピクチャであるので、第1メタデータ情報m1が挿入されなければならない。復号順序上で28、34であるピクチャは、第2場面に該当するピクチャであるので、第2メタデータ情報m2が挿入されなければならない。ただし、ビデオビットストリーム生成時、ディスプレイ順序や場面の順序と係わりなく、復号順にピクチャが羅列されるので、メタデータ情報は、復号順序を考慮し、メタデータ情報が最も先に必要なピクチャの位置を優先させ、メタデータ情報を挿入するが、一度挿入されたメタデータ情報については、重複的に含まれないようにしなければならない。
【0097】
図6Aに図示されているように、ランダムアクセスが発生し、復号順序が28であるピクチャがランダムアクセスポイントピクチャになる場合、ランダムアクセスポイントピクチャが属した場面である第2場面に係わる第2メタデータ情報がランダムアクセスポイントピクチャの位置に挿入される。このとき、ランダムアクセスポイントピクチャの位置は、ランダムアクセスポイントピクチャの前後位置にもなり、
図6Aに図示されているように、ランダムアクセスポイントピクチャの前に位置するように、第2メタデータ情報を挿入することができる。
【0098】
次に、復号順序が29、30、31であるピクチャは、第1場面に該当するピクチャであり、第1場面に係わる第1メタデータ情報が、第1場面の場面カットの位置に挿入される。このとき、第1場面の場面カットの位置は、第1場面に属したピクチャの前後位置にもなり、特に、第1場面に属したピクチャのうち、ディスプレイ順序上で最初ピクチャの位置にもなる。
図6Aに図示されているように、第1場面に属したピクチャのうち、復号順序が30であるピクチャがディスプレイ順序上で、最初ピクチャの位置になるので、復号順序が30であるピクチャの前に位置するように、第1メタデータ情報を挿入することができる。一方、復号順序が29、31であるピクチャは、復号順序が30であるピクチャの前に挿入された第1メタデータ情報を活用することができるので、第1メタデータ情報を重複して挿入する必要がない。
【0099】
次に、復号順序が32以後のピクチャについても、各ピクチャが属する場面に該当するメタデータ情報を、その場面のカットの位置に挿入するが、すでに挿入されたメタデータ情報は、重複して挿入しない。
図6Aに図示されているように、復号順序が34であるピクチャは、第2場面に該当するピクチャであるが、第2メタデータ情報は、ランダムアクセスポイントピクチャの前に位置するように、すでに挿入されているので、第2メタデータ情報を重複して挿入しない。
【0100】
このように、ランダムアクセスを考慮して生成された、メタデータ情報を含むビデオビットストリームは、ビデオデータ処理装置200において、ランダムアクセスが発生する場合、ビデオビットストリームの生成過程の逆過程に基づいて処理される。言い替えれば、ビデオデータ処理装置200は、ランダムアクセスポイントピクチャ後の復号順序を有するピクチャのうち、復号可能なピクチャが属する各場面に係わるメタデータ情報が、ビデオビットストリームに最初に挿入された位置に基づき、メタデータ情報を獲得し、復号されたピクチャに対して、獲得したメタデータ情報に基づき、ビデオ処理を行うことができる。
【0101】
図6Bは、他の実施形態による、メタデータ情報を挿入させるビデオビットストリーム内の最適位置を考慮した、符号化されたビデオデータのビットストリーム生成方式及びビットストリーム処理方式について説明するための図面である。
【0102】
図6Bに図示されたビデオデータの一部分は、
図6Aで説明したビデオデータの一部分と、ディスプレイ順序と復号順序とが一致する。ただし、第0場面に該当するピクチャと、第1場面に該当するピクチャとが異なる。言い替えれば、復号可能なリーディングピクチャが、ランダムアクセスポイントピクチャが属した場面と異なる複数個の場面にそれぞれ属する場合である。ディスプレイ順序上で、第28ピクチャに該当するピクチャが、
図6Aに図示されたところと異なり、第1場面ではない第0場面に属する場合、符号化されたビデオデータのビットストリーム生成方式及びビットストリーム処理方式の差異について以下で説明する。
【0103】
図6Bに図示されているように、ランダムアクセスポイントピクチャは、ディスプレイ順序上で、第31ピクチャに該当するピクチャであり、ディスプレイ順序上で、第31ピクチャに該当するピクチャの復号順序が28であるために、復号順序が28以後のピクチャだけ復号される。ディスプレイ順序上で、第28ピクチャ、第29ピクチャ、第30ピクチャは、復号可能なリーディングピクチャに該当する。ディスプレイ順序上で、第32ピクチャは、トレーリングピクチャに該当する。かようなビデオデータを符号化し、ビットストリームに生成する場合、各場面に対応するメタデータ情報を挿入したビデオビットストリームは、ランダムアクセスを考慮し、次のように生成することができる。
【0104】
図6Bを参照すれば、復号順序が28であるピクチャに、ランダムアクセスが発生したので、復号順序が28以後のピクチャのためのメタデータ情報が、ビデオビットストリーム生成時に挿入されなければならない。復号順序上で29、30、31であるピクチャは、復号可能なリーディングピクチャである。このうち、復号順序上で30であるピクチャは、第0場面に該当するピクチャであるので、第0メタデータ情報m0が、ビデオビットストリーム生成時に挿入されなければならない。復号順序上で29、31であるピクチャは、第1場面に該当するピクチャであるので、第1メタデータ情報m1が、ビデオビットストリーム生成時に挿入されなければならない。復号順序上で28、34であるピクチャは、第2場面に該当するピクチャであるので、第2メタデータ情報m2が挿入されなければならない。
【0105】
図6Bに図示されているように、ランダムアクセスが発生し、復号順序が28であるピクチャが、ランダムアクセスポイントピクチャになる場合、ランダムアクセスポイントピクチャが属した場面である第2場面に係わる第2メタデータ情報m2が、ランダムアクセスポイントピクチャの前に位置するように、ビデオビットストリームに挿入される。
【0106】
次に、復号順序が29であるピクチャは、第1場面に該当するピクチャであり、第1場面に係わる第1メタデータ情報m1が第1場面の場面カットの位置に挿入される。
図6Bに図示されているように、第1場面に属したピクチャのうち、復号順序が29であるピクチャがディスプレイ順序上で最初ピクチャの位置になるので、第1メタデータ情報m1は、復号順序が29であるピクチャの前に位置するように、ビデオビットストリームに挿入される。
【0107】
次に、復号順序が30であるピクチャは、第0場面に該当するピクチャであり、第0場面に係わる第0メタデータ情報m0が、ビデオビットストリームに挿入される必要がある。ただし、
図6Bに図示されているように、第0場面に属したピクチャのうち復号順序が30であるピクチャが、唯一復号可能であるので、第0メタデータ情報m0は、復号順序が30であるピクチャの前に位置するように、ビデオビットストリームに挿入される。
【0108】
次に、復号順序が31であるピクチャは、復号順序が29であるピクチャの前にすでに挿入された第1メタデータ情報を活用することができるので、第1メタデータ情報m1を重複して挿入する必要がない。
【0109】
次に、復号順序が32以後のピクチャについても、各ピクチャが属する場面に該当するメタデータ情報を、その場面のカットの位置に挿入するが、すでに挿入されたメタデータ情報は、重複して挿入しない。
図6Bに図示されているように、復号順序が34であるピクチャは、第2場面に該当するピクチャであるが、第2メタデータ情報m2は、ランダムアクセスポイントピクチャの前に位置するように、すでに挿入されているので、第2メタデータ情報を重複して挿入しない。
【0110】
そのように、ランダムアクセスを考慮して生成された、メタデータ情報を含むビデオビットストリームは、ビデオデータ処理装置200でランダムアクセスが発生する場合、ビデオビットストリームの生成過程の逆過程に基づいて処理される。言い替えれば、ビデオデータ処理装置200は、ランダムアクセスが発生したランダムアクセスポイントピクチャ後の復号順序を有するピクチャのうち、復号可能なピクチャが属する各場面に係わるメタデータ情報が初めて挿入された位置に基づき、メタデータ情報を獲得し、復号されたピクチャに対して、獲得したメタデータ情報に基づき、ビデオ処理を行うことができる。
【0111】
図6Cは、さらに他の実施形態による、メタデータ情報を挿入させるビデオビットストリーム内の最適位置を考慮した、符号化されたビデオデータのビットストリーム生成方式及びビットストリーム処理方式について説明するための図面である。
【0112】
図6Cを参照すれば、ディスプレイ順序が、第26ピクチャから第36ピクチャに該当し、第26ピクチャから順次にディスプレイされるピクチャの連続であると見ることができる。一方、ピクチャ間の関係を示した矢印によって、復号順序(decoding order)を見れば、ディスプレイ順序と異なるということが分かる。
【0113】
図6Cに図示されているように、ランダムアクセスがディスプレイ順序上で、第35ピクチャに該当するピクチャに発生すると仮定する場合、ランダムアクセスポイントピクチャは、ディスプレイ順序上で、第35ピクチャに該当するピクチャになる。ディスプレイ順序上で、第26ピクチャと第27ピクチャとに該当するピクチャは、ランダムアクセスポイントピクチャより先立つ符号化順序を有するので、第35ピクチャに対するランダムアクセスを考慮したビデオビットストリームに該当しない。
図6Cを参照するとき、第35ピクチャに対するランダムアクセス発生を考慮したビデオビットストリームには、第35ピクチャ後の復号順序を有するピクチャだけ該当する。すなわち、復号順序によって、ディスプレイ順序上のピクチャを並べれば、第35ピクチャ、第31ピクチャ、第29ピクチャ、第28ピクチャ、第30ピクチャ、第33ピクチャ、第32ピクチャ、第34ピクチャ及び第36ピクチャが、第35ピクチャに対するランダムアクセス発生を考慮したビデオビットストリームに該当する。ただし、ディスプレイ順序上の第28ピクチャないし第30ピクチャは、復号不可能なリーディングピクチャであり、復号が不可能であるので、第28ピクチャないし第30ピクチャのためのメタデータ情報は、ビデオビットストリームに挿入する必要がない。
【0114】
一方、
図6Cでは、復号可能なリーディングピクチャのうち、第1場面に属する第32ピクチャ、第33ピクチャ及び第34ピクチャに対する第1メタデータ情報m1を、ビデオビットストリームのいずれの位置に入れるかということに係わる2つの方式をいずれも示している。
【0115】
まず、オプション1のビデオビットストリーム(video bitstream of option1)は、メタデータ情報を各場面に属するピクチャのディスプレイ順序上、最初ピクチャの位置に挿入する方式である。それによれば、第1場面に属する第32ピクチャ、第33ピクチャ及び第34ピクチャのうち第32ピクチャが、ディスプレイ順序上、最初ピクチャに該当するので、第32ピクチャの前の位置に、第1メタデータm1を挿入したということが分かる。前述の
図6A及び
図6Bの場合、各場面に属するピクチャのディスプレイ順序上、最初のピクチャの位置に各場面に対応するメタデータを挿入させた方式であるということが分かる。
【0116】
次に、オプション2のビデオビットストリーム(video bitstream of option 2)は、メタデータ情報を、各場面に属するピクチャの符号化順序上、最初ピクチャの位置に挿入する方式である。それによれば、第1場面に属する第32ピクチャ、第33ピクチャ及び第34ピクチャのうち第33ピクチャが、復号順序上、最初ピクチャに該当するので、第33ピクチャの前の位置に、第1メタデータm1を挿入したということが分かる。前述の
図6A及び
図6Bの場合、各場面に属するピクチャの復号順序上、最初のピクチャの位置に、各場面に対応するメタデータを挿入させた方式に撚ることも可能である。
【0117】
一方、ランダムアクセスに備えたビデオビットストリーム生成及びビデオビットストリーム処理について、
図4及び
図5で説明したメタデータ情報に係わる識別情報を利用して、ビットレートを減らす方式と、
図6Aないし
図6Cで説明したメタデータ情報を挿入させるビデオビットストリーム内の最適位置を考慮する方式とを融合し、ビットストリーム内の最適位置にメタデータ情報に係わる識別情報を伝送する方式を使用することもできる。
【0118】
図7Aは、一実施形態による、符号化されたビデオデータ生成方法に係わるフローチャートである。先に、ビデオデータ生成装置100について説明した内容は、以下省略されるにしても、符号化されたビデオデータ生成方法についても、そのまま適用される。
【0119】
段階710において、ビデオデータ生成装置100は、ビデオデータを符号化することができる。ビデオデータ生成装置100は、入力されたビデオを、符号化順序(coding order)による符号化されたビデオデータを生成することができる。
【0120】
段階720において、ビデオデータ生成装置100は、各場面の開始部分に挿入され、ビデオ処理に利用されるメタデータ情報を生成するか、あるいはランダムアクセスポイントピクチャ後の復号順序を有するピクチャのビデオ処理に利用されるメタデータ情報を生成することができる。ビデオデータ生成装置100は、符号化されたビデオデータが復号された後、ビデオ処理に利用されるメタデータ情報を生成することができる。かようなメタデータ情報は、符号化されたビデオデータに対してランダムアクセスが発生する場合にも、ランダムアクセスポイントピクチャ後の復号順序を有するピクチャが復号された後、ビデオ処理が行われるように準備することができる。
【0121】
一方、ビデオデータ生成装置100は、ビデオデータ処理装置200でランダムアクセスが発生しても、ビデオ処理に利用される各場面のメタデータ情報が損失されないように、ビデオビットストリームの各場面に属する全てのピクチャ位置に含めるためのメタデータ情報に係わる識別情報を生成することもできる。
【0122】
段階730において、ビデオデータ生成装置100は、メタデータ情報、またはメタデータ情報に係わる識別情報を含む、符号化されたビデオデータのビットストリームを生成することができる。ビデオデータ生成装置100は、メタデータ情報を、各場面の開始部分に挿入するか、あるいはランダムアクセスが起こりうるランダムアクセスポイントピクチャと、周辺のピクチャとを考慮し、メタデータ情報を適切なところに挿入させることにより、メタデータ情報を含むビデオビットストリームを生成することができる。
【0123】
ビデオデータ生成装置100は、ランダムアクセスポイントピクチャの位置と、ランダムアクセスポイントピクチャ後の復号順序を有する少なくとも1つのピクチャから構成される場面の場面カットの位置とにメタデータ情報を挿入し、ビットストリームを生成することができる。このとき、ランダムアクセスポイントピクチャの位置が、任意の場面に係わる場面カットの位置に該当すれば、ビデオデータ生成装置100は、場面カットに対応する場面に係わるメタデータ情報でもって、ランダムアクセスポイントピクチャの位置に挿入するメタデータ情報の代わりをすることができる。同一メタデータ情報を重複して挿入しないようにするためである。
【0124】
場面カットの位置は、各場面に属したピクチャのうち、ディスプレイ順序上で、最初ピクチャの位置に該当する。任意の場面に係わるメタデータ情報はそ、の任意の場面以前の場面に対応する場面カット位置に挿入することができる。それは、メタデータの復号に必要となる時間を考慮し、実際メタデータが適用される場面より以前の場面に対応する場面カット位置に挿入することにより、メタデータの復号によるディレイを最小化したりなくしたりするためである。
【0125】
一方、ランダムアクセスポイントピクチャの位置によって復号可能なリーディングピクチャが存在しないか、ランダムアクセスポイントピクチャと同じであるか、あるいは異なる場面に属する複数個の復号可能なリーディングピクチャが存在することがある。
【0126】
ビデオデータ生成装置100は、ランダムアクセスポイントピクチャに対して、リーディングピクチャが存在せず、ランダムアクセスポイントピクチャ位置が、場面カットの位置ではなければ、ランダムアクセスポイントピクチャが属した場面に係わるメタデータ情報を、ランダムアクセスポイントピクチャ位置に挿入し、ビットストリームを生成することができる。
【0127】
ビデオデータ生成装置100は、ランダムアクセスポイントピクチャに対して、複数個の復号可能なリーディングピクチャが存在する場合、復号可能なリーディングピクチャが、いずれもランダムアクセスポイントピクチャと異なる場面に属すれば、ランダムアクセスポイントピクチャが属した場面に係わるメタデータ情報を、ランダムアクセスポイントピクチャ位置に挿入し、復号可能なリーディングピクチャが属した場面に係わるメタデータ情報を、ディスプレイ順序上、最初に復号可能なリーディングピクチャの位置に挿入し、ビットストリームを生成することができる。
【0128】
ビデオデータ生成装置100は、ランダムアクセスポイントピクチャに対して、複数個の復号可能なリーディングピクチャが存在する場合、復号可能なリーディングピクチャが、いずれもランダムアクセスポイントピクチャと同じ場面に属すれば、ディスプレイ順序上、最初に復号可能なリーディングピクチャの位置に、複数個の復号可能なリーディングピクチャが含まれた場面に係わるメタデータ情報を挿入し、ビットストリームを生成することができる。ただし、復号可能なリーディングピクチャにもかかわらず、復号されないか、あるいはビデオビットストリームから除去される場合がある場合に備え、復号可能なリーディングピクチャが、ランダムアクセスポイントピクチャと同じ場面に属するとき、ディスプレイ順序上、最初に復号可能なリーディングピクチャの位置と、ランダムアクセスポイントピクチャの位置とのいずれにもメタデータ情報を挿入し、ビットストリームを生成することもできる。また、復号可能なリーディングピクチャが除去される場合、そのピクチャの位置に含まれていたメタデータ情報を、同じ場面に属したランダムアクセスポイントピクチャの位置に移すようにすることもできる。
【0129】
一方、ビデオデータ生成装置100は、メタデータ情報に係わる識別情報を含む、符号化されたビデオデータのビットストリームを生成することもできる。ビデオデータ生成装置100において、メタデータ情報に係わる識別情報を生成した場合、メタデータの代わりに、メタデータ情報に係わる識別情報が含まれるように、ビデオビットストリームを生成することができる。ビデオデータ生成装置100は、メタデータに係わる識別情報が、ビデオビットストリームの所定位置に含まれるように、ビデオビットストリームを生成することができる。メタデータ情報を含むメタデータ情報のデータベースは、メタデータ情報に係わる識別情報が含まれたビデオビットストリームと独立した別個のチャネルを介して、ビデオデータ生成装置100から、ビデオデータ処理装置200に伝送される。
【0130】
図7Bは、一実施形態による、符号化されたビデオデータ処理方法に係わるフローチャートである。先に、ビデオデータ処理装置200について説明した内容は、以下で省略されるにしても、符号化されたビデオデータ処理方法についても、そのまま適用される。
【0131】
段階810において、ビデオデータ処理装置200は、ビデオビットストリームを獲得することができる。ビデオデータ処理装置200は、獲得したビデオビットストリームを復号することができる。ビデオデータ処理装置200は、符号化されたビデオデータが復号された後でビデオ処理されるとき、復号されたビデオデータに利用されるメタデータ情報を、ビデオビットストリームから抽出することができる。かようなメタデータ情報は、符号化されたビデオデータに対して、ランダムアクセスが発生する場合、ランダムアクセスポイントピクチャ後の復号順序を有するピクチャが復号された後、ビデオ処理が行われるように、ランダムアクセスポイントピクチャ以後の復号されたビデオデータから抽出することができる。
【0132】
段階820において、ビデオデータ処理装置200は、ビデオビットストリームにおいて、ランダムアクセスポイントピクチャ後の復号順序を有するピクチャのビデオ処理に利用されるメタデータ情報を獲得することができる。
【0133】
ビデオデータ処理装置200は、ビデオビットストリームにおいて、ランダムアクセスポイントピクチャの位置と、ランダムアクセスポイントピクチャ後の復号順序を有する少なくとも1つのピクチャから構成される場面の場面カット(scene cut)の位置とに基づいて、メタデータ情報を獲得することができる。このとき、ランダムアクセスポイントピクチャの位置が、任意の場面に係わる場面カットの位置に該当すれば、ビデオデータ処理装置200は、場面カットに対応する場面に係わるメタデータ情報を、ランダムアクセスポイントピクチャの位置から獲得するメタデータ情報として使用することができる。
【0134】
場面カットの位置は、各場面に属したピクチャのうち、ディスプレイ順序上で、最初ピクチャの位置に該当する。任意の場面に係わるメタデータ情報は、任意の場面以前の場面に対応する場面カット位置で獲得することができる。それは、メタデータの復号によるディレイを最小化したりなくしたりするために、メタデータの復号に必要となる時間を考慮し、実際メタデータが適用される場面より以前の場面に対応する場面カット位置に、メタデータが挿入された場合である。
【0135】
一方、ランダムアクセスポイントピクチャの位置によって復号可能なリーディングピクチャが存在しないとか、ランダムアクセスポイントピクチャと同じであるか、あるいは異なる場面に属する少なくとも1つの復号可能なリーディングピクチャが存在することがある。
【0136】
ビデオデータ処理装置200は、ランダムアクセスポイントピクチャに対して、リーディングピクチャが存在せず、ランダムアクセスポイントピクチャ位置が、場面カットの位置ではなければ、ランダムアクセスポイントピクチャ位置に基づき、ランダムアクセスポイントピクチャが属した場面に係わるメタデータ情報を獲得することができる。
【0137】
ビデオデータ処理装置200は、ランダムアクセスポイントピクチャに対して、複数個の復号可能なリーディングピクチャが存在する場合、復号可能なリーディングピクチャが、いずれもランダムアクセスポイントピクチャと異なる場面に属すれば、ランダムアクセスポイントピクチャ位置に基づき、ランダムアクセスポイントピクチャが属した場面に係わるメタデータ情報を獲得し、ディスプレイ順序上、最初に復号可能なリーディングピクチャの位置に基づき、復号可能なリーディングピクチャが属した場面に係わるメタデータ情報を獲得することができる。
【0138】
ビデオデータ処理装置200は、ランダムアクセスポイントピクチャに対して、複数個の復号可能なリーディングピクチャが存在する場合、復号可能なリーディングピクチャがいずれもランダムアクセスポイントピクチャと同じ場面に属すれば、ディスプレイ順序上、最初に復号可能なリーディングピクチャの位置に基づき、複数個の復号可能なリーディングピクチャが含まれた場面に係わるメタデータ情報を獲得することができる。ただし、復号可能なリーディングピクチャにもかかわらず、復号されないか、あるいはビデオビットストリームから除去される場合がある場合に備え、復号可能なリーディングピクチャが、ランダムアクセスポイントピクチャと同じ場面に属するとき、ディスプレイ順序上、最初に復号可能なリーディングピクチャの位置と、ランダムアクセスポイントピクチャの位置とのいずれにも、メタデータ情報が含まれてもよいので、2つの位置いずれにも基づき、メタデータ情報を獲得することができる。また、復号可能なリーディングピクチャが除去される場合、そのピクチャの位置に含まれていたメタデータ情報が、同じ場面に属したランダムアクセスポイントピクチャの位置に移されるので、そのときは、ランダムアクセスポイントピクチャの位置に基づき、メタデータ情報を獲得することができる。
【0139】
一方、ビデオデータ処理装置200は、ビデオデータ生成装置100において、ビデオビットストリームの所定位置に、メタデータ情報に係わる識別情報を含めてビデオビットストリームを伝送した場合、メタデータ情報に係わる識別情報として、メタデータ情報のデータベースから、メタデータ情報を獲得することもできる。例えば、メタデータ情報に係わる識別情報は、ビデオビットストリームの各場面に属する全てのピクチャ位置に含まれてもよい。ビデオデータ処理装置200は、メタデータ情報に係わる識別情報とマッチングするメタデータ情報を、メタデータ情報のデータベースから獲得することができる。メタデータ情報のデータベースは、ビデオビットストリームが受信されるチャネルと別個のチャネルで、ビデオデータ生成装置100から受信され、ビデオビットストリームより事前に受信されたものでもある。
【0140】
段階830において、ビデオデータ処理装置200は、ランダムアクセスポイントピクチャ後の復号順序を有するピクチャのうち復号されたビデオデータに対して、獲得したメタデータ情報に基づいて、ビデオ処理を行うことができる。
【0141】
一方、前述の本発明の実施形態による符号化されたビデオデータ処理方法、及び符号化されたビデオデータ生成方法は、コンピュータで実行されるプログラムに作成可能であり、コンピュータで読取り可能な記録媒体を利用して、かようなプログラムを動作させる汎用デジタルコンピュータで具現される。かようなコンピュータで読取り可能な記録媒体は、マグネチック記録媒体(例えば、ROM(read-only memory)、フロッピー(登録商標)ディスク、ハードディスクなど)、光学的判読媒体(例えば、CD−ROM(compact disc read only memory)、DVD(digital versatile disc)など)のような記録媒体を含む。
【0142】
以上、実施形態を中心に説明した。開示された実施形態が属する技術分野において当業者であるならば、開示された実施形態が、本質的な特性から外れない範囲で変形された形態に具現されるということを理解することができるであろう。従って、開示された実施形態は、限定的な観点ではなく、説明的な観点から考慮されなければならない。本実施形態による発明の範囲は、前述の説明ではなく、特許請求の範囲に示されており、それと同等な範囲内にある全ての差異は、発明の範囲に含まれているものと理解するものである。