特許第6395750号(P6395750)IP Force 特許公報掲載プロジェクト 2022.1.31 β版

知財求人 - 知財ポータルサイト「IP Force」

▶ ドルビー ラボラトリーズ ライセンシング コーポレイションの特許一覧

特許6395750ハイダイナミックレンジ信号のための信号再構成
<>
  • 特許6395750-ハイダイナミックレンジ信号のための信号再構成 図000058
  • 特許6395750-ハイダイナミックレンジ信号のための信号再構成 図000059
  • 特許6395750-ハイダイナミックレンジ信号のための信号再構成 図000060
  • 特許6395750-ハイダイナミックレンジ信号のための信号再構成 図000061
  • 特許6395750-ハイダイナミックレンジ信号のための信号再構成 図000062
  • 特許6395750-ハイダイナミックレンジ信号のための信号再構成 図000063
  • 特許6395750-ハイダイナミックレンジ信号のための信号再構成 図000064
  • 特許6395750-ハイダイナミックレンジ信号のための信号再構成 図000065
  • 特許6395750-ハイダイナミックレンジ信号のための信号再構成 図000066
  • 特許6395750-ハイダイナミックレンジ信号のための信号再構成 図000067
< >
(19)【発行国】日本国特許庁(JP)
(12)【公報種別】特許公報(B2)
(11)【特許番号】6395750
(24)【登録日】2018年9月7日
(45)【発行日】2018年9月26日
(54)【発明の名称】ハイダイナミックレンジ信号のための信号再構成
(51)【国際特許分類】
   H04N 9/64 20060101AFI20180913BHJP
   H04N 1/46 20060101ALI20180913BHJP
   G06T 1/00 20060101ALI20180913BHJP
【FI】
   H04N9/64 Z
   H04N1/46
   G06T1/00 510
【請求項の数】15
【外国語出願】
【全頁数】27
(21)【出願番号】特願2016-54345(P2016-54345)
(22)【出願日】2016年3月17日
(65)【公開番号】特開2017-169134(P2017-169134A)
(43)【公開日】2017年9月21日
【審査請求日】2016年8月10日
(73)【特許権者】
【識別番号】507236292
【氏名又は名称】ドルビー ラボラトリーズ ライセンシング コーポレイション
(74)【代理人】
【識別番号】100101683
【弁理士】
【氏名又は名称】奥田 誠司
(74)【代理人】
【識別番号】100155000
【弁理士】
【氏名又は名称】喜多 修市
(74)【代理人】
【識別番号】100135703
【弁理士】
【氏名又は名称】岡部 英隆
(74)【代理人】
【識別番号】100188813
【弁理士】
【氏名又は名称】川喜田 徹
(74)【代理人】
【識別番号】100202197
【弁理士】
【氏名又は名称】村瀬 成康
(72)【発明者】
【氏名】アトキンス,ロビン
(72)【発明者】
【氏名】イン,ペン
(72)【発明者】
【氏名】ルー,タオラン
(72)【発明者】
【氏名】ピットラーツ,ジャクリン,アン
【審査官】 大室 秀明
(56)【参考文献】
【文献】 国際公開第2014/130343(WO,A2)
【文献】 特開2008−040305(JP,A)
【文献】 資料HDR作3−3「HDR-TVに関するITU-R SG6会合(2016年1-2月)の結果」,情報通信議会 情報通信技術分科会 放送システム委員会 HDR作業班(第3回) 配布資料,総務省,2016年 2月29日,p.1-16,[オンライン],[検索日 2017.10.26],URL,http://www.soumu.go.jp/main_content/000402269.pdf
【文献】 LU Taoran, PU Fangjun, YIN Peng, CHEN Tao, HUSAK Walt, PYTLARZ Jaclyn, ATKINS Robin, FR-HLICH Jan, SU Guan-Ming,ITP Colour Space and Its Compression Performance for High Dynamic Range and Wide Colour Gamut Video Distribution,ZTE COMMUNICATIONS,中国,ZTE CORPORATION,2016年 2月 5日,Issue No.1,p.32-38,[オンライン],[検索日 2017.10.26],URL,http://wwwen.zte.com.cn/endata/magazine/ztecommunications/2016/1/articles/201603/P020160311294995790791.pdf
(58)【調査した分野】(Int.Cl.,DB名)
G06T 1/00−1/40
G06T 3/00−5/50
G06T 9/00−9/40
H04N 1/40−1/409
H04N 1/46−1/62
H04N 9/44−9/78
(57)【特許請求の範囲】
【請求項1】
ハイダイナミックレンジ画像の処理を改善する方法であって、以下を包含する、方法:
プロセッサによって、RGB BT.2020色空間にあるハイダイナミックレンジ入力画像にアクセスすることと、
前記ハイダイナミックレンジ入力画像を、XYZ色空間にある第1の画像へと色変換することと、
第1の3×3色変換行列を前記第1の画像に適用することにより、第の色空間にある第2の画像を生成することであって、前記第1の3×3色変換行列は、
【数1】
を包含し、前記第1の3×3色変換行列は、XYZからLMSへの3×3色変換行列にクロストーク行列を乗算することによって生成され、
前記第2の画像の各色成分に非線形関数を適用することにより、第3の画像を生成することと、
前記第3の画像に第2の3×3色変換行列を適用することにより、出力画像を生成することであって、前記第2の3×3色変換行列は、
【数2】
を包含する。
【請求項2】
前記XYZからLMSへの3×3色変換行列は、
【数3】
を包含し、
前記クロストーク行列は、
【数4】
を包含する、請求項1に記載の方法。
【請求項3】
前記ハイダイナミックレンジ入力画像を、前記XYZ色空間にある前記第1の画像へと色変換し、さらに、前記第1の3×3色変換行列を前記第1の画像に適用することにより、前記第1の色空間にある前記第2の画像を生成する工程は、前記RGB BT.2020色空間から前記XYZ色空間への変換に用いる色変換行列に、前記XYZからLMSへの3×3色変換行列および前記クロストーク行列を乗算することによって、前記RGB BT.2020色空間から前記第1の色空間への変換に用いる第3の3×3色変換行列を生成することを包含し、
前記第3の3×3色変換行列は、
【数5】
を包含する、請求項2に記載の方法。
【請求項4】
前記非線形関数は電気光学伝達関数の逆関数を包含する、請求項に記載の方法。
【請求項5】
前記電気光学伝達関数はSMPTE ST 2084規格にしたがって決定される、請求項に記載の方法。
【請求項6】
受信機において、再構成された色空間において符号化された入力画像を再構築する方法であって、前記再構成された色空間は、色相コスト関数を最小にすることに基づいて生成される色回転行列を用いて、広色域空間に基づき生成され、前記色相コスト関数は、旧式の色空間における第1の色相値と、前記広色域空間における回転された第2の色相値との尺度の差分に基づいており、以下を包含する、方法:
前記再構成された色空間にある入力画像を受け取ることと、
第1の3×3色変換行列を適用することにより、第1の色空間にある第1の画像を生成することであって、前記第1の3×3色変換行列は
【数6】
を包含し、
前記第1の画像の各色成分に非線形関数を適用することにより、第2の画像を生成することと、
前記第2の画像に第2の3×3色変換行列を適用することにより、RGB BT.2020色空間にある出力画像を生成することであって、前記第2の3×3色変換行列は、
【数7】
を包含する。
【請求項7】
前記非線形関数は電気光学伝達関数(EOTF)を包含する、請求項に記載の方法。
【請求項8】
前記電気光学伝達関数はSMPTE ST 2084規格にしたがって決定される、請求項に記載の方法。
【請求項9】
前記非線形関数はハイブリッドログガンマ(HLG)EOTF関数を包含する、請求項に記載の方法。
【請求項10】
受信機において、再構成された色空間において符号化された入力画像を再構築する方法であって、前記再構成された色空間は、色相コスト関数を最小にすることに基づいて生成される色回転行列を用いて、広色域空間に基づき生成され、前記色相コスト関数は、旧式の色空間における第1の色相値と、前記広色域空間における回転された第2の色相値との尺度の差分に基づいており、以下を包含する、方法:
前記再構成された色空間にある入力画像を受け取ることと、
第1の3×3色変換行列を適用することにより、第1の色空間にある第1の画像を生成することであって、前記第1の3×3色変換行列は
【数8】
を包含し、
前記第1の画像の各色成分に非線形関数を適用することにより、第2の画像を生成することと、
前記第2の画像に第2の3×3色変換行列を適用することにより、XYZ色空間にある第3の画像を生成することであって、前記第2の3×3色変換行列は
【数9】
を包含し、
前記第3の画像をXYZ色空間からターゲット色空間に色変換することにより、前記ターゲット色空間にある出力画像を生成すること。
【請求項11】
前記非線形関数は電気光学伝達関数(EOTF)を包含する、請求項10に記載の方法。
【請求項12】
前記電気光学伝達関数はSMPTE ST 2084規格にしたがって決定される、請求項11に記載の方法。
【請求項13】
前記再構成された色空間はICtCp色空間を包含する、請求項6または請求項10に記載の方法。
【請求項14】
プロセッサを備え、請求項1から13に記載の方法のうちいずれかを行うように構成された装置。
【請求項15】
コンピュータ読み取り可能な非一時的記憶媒体であって、1つ以上のプロセッサを用いて請求項1から13にしたがって方法を実行するための、コンピュータにより実行可能な命令を格納した、記憶媒体。
【発明の詳細な説明】
【技術分野】
【0001】
本発明は、画像全般に関する。より具体的には、本発明の一実施形態は、下位互換性を改善するための、ハイダイナミックレンジを有する画像の信号再構成に関する。
【背景技術】
【0002】
本明細書において、用語「ダイナミックレンジ」(DR)は、人間の視覚システム(HVS)が画像においてある範囲の強度(例えば、輝度、ルマ)(例えば、最暗部(黒)から最も明るい白(すなわち)まで)を知覚する能力に関連し得る。この意味では、DRはシーン−リファード(scene−referred)の強度に関する。DRはまた、ディスプレイデバイスが特定の幅を有する強度範囲を妥当にまたは近似的に描画する能力にも関連し得る。この意味では、DRは、ディスプレイ−リファード(display−referred)の強度に関する。本明細書中の任意の箇所において、ある特定の意味が特に明示的に指定されている場合を除いて、この用語はどちらの意味としても(例えば、区別なく)使用できるものとする。
【0003】
本明細書において、ハイダイナミックレンジ(HDR)という用語は、人間の視覚システム(HVS)において14〜15桁ほどにわたるDR幅に関する。実際において、人間が広範囲の強度範囲を同時に知覚し得るDRは、HDRに対して幾分端折られ得る。本明細書において、エンハンストダイナミックレンジ(EDR)または視覚ダイナミックレンジ(VDR)という用語は、個別にまたは区別なく、人間の視覚システム(HVS)(眼球運動を含み、シーンまたは画像にわたってある程度の明順応変化を可能にする)が、あるシーンまたは画像中において知覚可能なDRに関する。本明細書において、EDRは、5〜6桁にわたるDRに関連し得る。従って、真のシーンリファードのHDRに対しては幾分狭いものの、EDRは広いDR幅を表し、HDRとも呼ばれ得る。
【0004】
実際において、画像は1つ以上の色成分(例えばルマYおよびクロマCbおよびCr)を有しており、各色成分は、画素あたりnビットの精度(例えばn=8)で表される。線形輝度符号化(linear luminance coding)を用いた場合、n≦8の画像(例えばカラー24ビットJPEG画像)はスタンダードダイナミックレンジとされ、n>8の画像はエンハンストダイナミックレンジの画像とされる。EDRおよびHDR画像はまた、Industrial Light and Magicが開発したOpenEXRファイルフォーマットなどの高精度の(例えば16ビット)浮動小数点フォーマットを用いて、格納および配信され得る。
【0005】
ある映像ストリームが与えられたとき、その符号化パラメータに関する情報は、典型的にはメタデータとしてビットストリーム中に埋め込まれる。本明細書において、「メタデータ」の語は、符号化ビットストリームの一部として送信され、デコーダが復号化画像を描画することを助ける、任意の補助的情報に関する。そのようなメタデータは、本明細書において記載されるような、色空間または色域情報、リファレンスディスプレイパラメータ、および補助的な信号パラメータなどを含むが、これらに限定されない。
【発明の概要】
【発明が解決しようとする課題】
【0006】
ほとんどのコンシューマー用デスクトップディスプレイは現在、200〜300cd/m2またはニトの輝度をサポートしている。ほとんどのコンシューマー用HDTVは300〜500ニトの範囲であるが、新しいモデルは1000ニト(cd/m2)に達する。このような従来のディスプレイはしたがって、HDRやEDRに対し、より低いダイナミックレンジ(LDR)(またはスタンダードダイナミックレンジ(SDR)とも呼ばれる)の典型例となる。キャプチャ機器(例えばカメラ)およびHDRディスプレイ(例えばDolby LaboratoriesのPRM−4200プロフェッショナルリファレンスモニター)両方の進化によって、HDRコンテンツの普及率が高まるにつれ、HDRコンテンツはカラーグレーディングされてより高いダイナミックレンジ(例えば1,000ニトから5,000ニト以上)をサポートするHDRディスプレイ上に表示されることがある。一般的に、限定しないが、本開示の方法はSDRよりも高い任意のダイナミックレンジに関連する。本発明者らの理解によれば、ハイダイナミックレンジ画像の符号化のための、改良された手法が望まれる。
【0007】
本節に記載されているアプローチは、探求し得るアプローチではあるが、必ずしもこれまでに着想または探求されてきたアプローチではない。従って、特に反対の記載がない限り、本節に記載されたアプローチのいずれも、本節に記載されているという理由だけで従来技術としての適格性を有すると考えるべきではない。同様に、特に反対の記載がない限り、本節に基づいて、1以上のアプローチに関して特定される問題が、いずれかの先行技術において認識されたことがあると考えるべきではない。
【図面の簡単な説明】
【0008】
本発明の一実施形態を、限定ではなく例示として、添付図面の各図により示す。これらの図において、類似の要素には同種の参照符号を付している。
【0009】
図1図1は、映像配信パイプラインのためのプロセス例を示す。
図2図2は、IPT−PQ色空間への色変換のプロセス例を示す。
図3図3は、信号再構成および符号化のプロセス例を示す。
図4図4は、本発明の一実施形態における、ST 2084 IPTとBT 1866 IPTとの間の輝度再構成のためのトーンマッピング曲線例を示す。
図5図5は、本発明の一実施形態における色空間再構成を用いた、下位互換的な符号化および復号化のためのシステム例を示す。
図6図6は、本発明の一実施形態における、色回転・スケーリング行列を生成するためのプロセスフロー例を示す。
図7A図7Aは、本発明の一実施形態における、色相・彩度再構成関数を示す。
図7B図7Bは、本発明の一実施形態における、色相・彩度再構成関数を示す。
図8図8は、本発明の一実施形態における、IPT−PQとYCbCr−ガンマ色空間との間の色相・彩度再構成の例を示す。
図9図9は、本発明の一実施形態におけるEETF関数の一例を示す。
【発明を実施するための形態】
【0010】
ハイダイナミックレンジ(HDR)画像の信号再構成および符号化を、本明細書に記載する。以下の説明においては、便宜上、本発明を完全に理解できるように、多数の詳細事項を説明する。ただし、これらの詳細事項が無くても本発明を実施可能であることは明白であろう。他方、本発明の説明を不必要に煩雑にしたり、不明瞭にしたり、難読化したりしないように、周知の構造およびデバイスの細かな詳細までは説明しない。
【0011】
概要
本明細書に説明する実施形態例は、ハイダイナミックレンジ画像の再構成および符号化に関する。下位互換的な復号化を改善する方法において、エンコーダ中で、プロセッサは画像データベースにアクセスし、
第1の色空間における前記データベース内の画像の第1の色相値を算出し、
第2の色空間における前記データベース内の画像の第2の色相値を算出し、
色相コスト関数を最小にすることに基づき、色相回転角を算出し、ここで、前記色相コスト関数は第1の色相値と回転された第2の色相値との差分の尺度(difference measure)に基づいており、
前記色相回転角に基づいて、色回転行列を生成する。
【0012】
一実施形態において、前記第1の色空間はガンマベース(gamma−based)のYCbCr色空間であり、前記第2の色空間はPQベース(PQ−based)のIPT色空間である。
【0013】
一実施形態において、前記色回転行列は、好適な色空間に基づき、再構成された色空間を生成するために用いられる。前記再構成された色空間を用いて画像は符号化され、前記色回転行列に関する情報が、前記エンコーダからデコーダへ伝えられる。
【0014】
一実施形態において、再構成された色空間において符号化された入力画像をデコーダ中で再構築する方法であって、前記デコーダは、
再構成された色空間にある符号化された入力画像を受け取り、ここで、前記再構成された色空間は、好適な色空間のクロマ成分を回転させて、旧式の色空間の1つ以上のパラメータを近似することにより生成されており、
エンコーダから前記デコーダへと送信されたメタデータにアクセスし、ここで、前記メタデータは前記符号化された入力画像に対して関連付けられており、かつ前記メタデータは、
色回転・スケーリング行列が存在するか否かを示すフラグと、
前記フラグが色回転・スケーリング行列の存在を示している場合において、前記色回転・スケーリング行列用の複数の係数と、
を含んでおり、
前記符号化された入力画像を復号化することにより、前記再構成された色空間における復号化された画像を生成し、
前記再構成された色空間における前記復号化された画像と、前記色回転・スケーリング行列とに基づき、前記好適な色空間における復号化された画像を生成する。
【0015】
別の実施形態において、エンコーダ中で、プロセッサは、
好適な色空間にある入力画像を受け取り、
色相回転関数にアクセスし、ここで前記色相回転関数は、前記好適な色空間にある入力画像中の1つの画素の色相値について、ある色相コスト条件にしたがえば旧式の色空間中の1つの色相値にマッチするような、回転された色相出力値を生成し、
前記入力画像と前記色相回転関数とに基づき、再構成された画像を生成し、
前記再構成された画像を符号化することにより、符号化された再構成画像を生成する。
【0016】
別の実施形態において、デコーダ中で、プロセッサは、
再構成された色空間において符号化された入力画像にアクセスし、
前記入力画像に関連付けられたメタデータにアクセスし、ここで、前記メタデータは、前記入力画像を好適な色空間から前記再構成された色空間へと変換するために用いられる、色相回転関数に対して関連付けられたデータを含んでおり、ここで前記色相回転関数は、前記好適な色空間にある入力画像中の1つの画素の色相値について、ある色相コスト条件にしたがえば旧式の色空間中の1つの色相値にマッチするような、回転された色相出力値を生成し、入力画像と、前記色相回転関数に関連付けられたデータとに基づき、前記好適な色空間における出力画像を生成する。
【0017】
映像供給処理パイプライン例
図1は、従来の映像配信パイプライン(100)のプロセス例を示しており、映像のキャプチャから映像コンテンツの表示までの、様々な段を示している。映像フレームのシーケンス(102)を、画像生成ブロック(105)を用いてキャプチャまたは生成する。映像フレームは、デジタル的にキャプチャされるか(例えばデジタルカメラにより)あるいはコンピュータ(例えばコンピュータアニメーションを用いて)によって生成され、これにより映像データ(107)が得られる。あるいは映像フレーム(102)は、銀塩カメラによってフィルムに取得されてもよい。フィルムをデジタルフォーマットに変換することによって、映像データ(107)が得られてもよい。プロダクションフェーズ(110)において、映像データ(107)は編集され、映像プロダクションストリーム(112)を得る。
【0018】
プロダクションストリーム(112)の映像データは次に、ブロック(115)のプロセッサに提供されて、ポストプロダクション編集を受ける。ポストプロダクション編集(115)は、画像の特定の領域の色または明るさを調節または変更することにより、映像制作者の制作意図にしたがって、画質を上げたり、その画像が特定の見え方をするようにすることを含み得る。これは、「カラータイミング」あるいは「カラーグレーディング」と呼ばれることがある。ブロック(115)において、その他の編集(例えば、シーン選択およびシーケンシング、画像クロッピング、コンピュータ生成された視覚的特殊効果の追加など)を行うことにより、プロダクションの、配信用の最終バージョン(117)を作成してもよい。ポストプロダクション編集(115)において、映像イメージは、リファレンスディスプレイ(125)上で視聴される。
【0019】
ポストプロダクション(115)の後、最終プロダクションとしての映像データ(117)は、下流のテレビ受像機、セットトップボックス、映画館などの復号化・再生機器まで供給されるために、符号化ブロック(120)に供給されてもよい。いくつかの実施形態において、符号化ブロック(120)は、符号化されたビットストリーム(122)を生成するための、ATSC、DVB、DVD、ブルーレイおよびその他の供給フォーマットに規定されるような音声および映像エンコーダを有していてもよい。受信機において、符号化されたビットストリーム(122)は、復号化ユニット(130)により復号化されることにより、信号(117)と同一またはこれに近い近似を表す、復号化された信号(132)を生成し得る。受信機は、リファレンスディスプレイ(125)と全く異なる特性を有し得るターゲットディスプレイ(140)に取り付けられていてもよい。その場合、ディスプレイマネジメントブロック(135)を用いてディスプレイマッピング化信号(137)を生成することで、復号化された信号(132)のダイナミックレンジを、ターゲットディスプレイ(140)の特性にマッピングしてもよい。
【0020】
IPT−PQ色空間
好適な実施形態において、限定しないが、処理パイプラインの一部、例えば、符号化(120)、復号化(130)、およびディスプレイマネジメント(135)を、ここにおいてIPT−PQ色空間と呼ぶものの中で行い得る。ディスプレイマネジメント用途でのIPT−PQ色空間の使用の一例を、R.Atkinsら「Display Management for High Dynamic Range Video」WIPO公開WO 2014/130343に見出すことができる。その全文を本願において援用する。「Development and testing of a color space(ipt) with improved hue uniformity」、F. EbnerおよびM.D. Fairchild、Proc.6th Color Imaging Conference:Color Science, Systems, and Applications、IS&T、アリゾナ州スコッツデール、1998年11月、pp.8−13(以降Ebner文献と呼ぶ。本願においてその全文を援用する)に記載されたIPT色空間は、人間の視覚システムにおける錐体間の色差のモデルである。この意味においては、YCbCrやCIE−Lab色空間のようなものであるが、いくつかの科学研究において、これらの空間よりも人間の視覚処理をよりよく模擬するものであることが分かっている。CIE−Labと同様に、IPTは何らかの基準輝度に対して正規化された空間である。一実施形態において、正規化は、ターゲットディスプレイの最大輝度(例えば5,000ニト)に基づく。
【0021】
本明細書において、用語「PQ」は知覚的量子化を指す。人間の視覚システムは、光レベルの増大に対して非常に非線形的に反応する。人間が刺激を見る能力は、その刺激の輝度、その刺激の大きさ、その刺激を構成する空間周波数、および、その刺激を見ている瞬間までに目が適応した輝度レベルに影響される。好適な実施形態において、知覚的量子化器関数は、線形入力グレイレベルを、人間の視覚システムにおけるコントラスト感度閾値によりマッチした出力グレイレベルにマッピングする。PQマッピング関数の例は、J.S. Millerらの米国特許Ser.No.9,077,994(‘994特許と呼ぶ)」に記載されており、この出願の全文を本願に援用する。その一部は、SMPTE ST 2084:2014規格において、「High Dynamic Range Electro−optical Transfer Function of Mastering Reference Displays」2014年8月16日の名称で採用されている(全文を本願に援用する)。ある固定刺激サイズに対して、それぞれの輝度レベル(即ち、刺激レベル)について、最高感度の適応レベルおよび最高感度の空間周波数(HVSモデルによる)に応じて、その輝度レベルにおける最小可視コントラストステップを選択する。物理的な陰極線管(CRT)装置の応答曲線を表しており、人間の視覚システムの応答の仕方に対して非常に大まかな類似性を偶然有し得る従来のガンマ曲線と比較して、‘994特許において決定されているPQ曲線は、比較的シンプルな関数モデルを用いながら人間の視覚システムの本当の視覚応答を模擬している。
【0022】
図2は、一実施形態におけるIPT−PQ色空間への色変換のための、プロセス例(200)をより詳細に示す。図2に示すように、第1の色空間(例えばRGB)にある入力信号(202)が与えられたとき、知覚的に補正されたIPT色空間(IPT−PQ)における色空間変換は、以下のステップを含み得る。すなわち、
a)オプションのステップ(210)により、入力信号(202)の画素値(例えば0から4095)を、0と1の間のダイナミックレンジを有する画素値に正規化してもよい。
b)入力信号(202)が(例えばBT.1866またはSMPTE ST 2084に準拠して)ガンマ符号化またはPQ符号化されている場合、オプションのステップ(215)として、信号の電気光学伝達関数(EOTF)(信号メタデータにより提供される)を用いて、ソースディスプレイによる符号値から輝度への変換を、戻すか取り消してもよい。例えば、入力信号がガンマ符号化されている場合、このステップでは逆ガンマ関数を適用する。入力信号がSMPTE ST 2084に従いPQ符号化されているなら、このステップは逆PQ関数を適用する。実際においては、予め算出された1−Dルックアップテーブル(LUT)を用いて正規化ステップ(210)および逆非線形的符号化(215)を行うことにより、線形信号217を生成してもよい。
c)ステップ(220)において、線形信号217を元の色空間(例えばRGB、XYZなど)からLMS色空間へと変換する。例えば、もし元の信号がRGBならば、このステップは2つのステップを包含し得る。すなわち、RGBからXYZへの色変換および、XYZからLMSへの色変換である。一実施形態において、限定しないが、XYZからLMSへの変換は、以下により与えられてもよい。
【数1】
【0023】
別の実施形態において、本願においてその全文を援用する2014年9月26日付け出願の「Encoding and decoding perceptually−quantized video content」の名称を有する米国仮特許出願Ser.No.62/056,093(また2015年9月24日付けでPCT/US2015/051964としても出願)に記載されているように、XYZからLMSへの変換の一部として以下のクロストーク行列
【数2】
を導入することにより、IPT−PQ色空間での全体的な符号化効率はさらに増大され得る。例えば、c=0.02について、クロストーク行列に式(1a)の3×3行列を乗算することにより、以下が得られる。
【数3】
同様に、c=0.04について、別の実施形態において、クロストーク行列に、元のXYZからLMSへの行列(例えば式(1a))を乗算することにより、以下が得られる。すなわち、
【数4】
d)Ebner文献によれば、従来のLMSからIPTへの色空間変換は、まずLMSデータに非線形のべき関数を適用し、次に線形変換行列を適用することを含む。データをLMSからIPTに変換したのちにPQ関数を適用することによりIPT−PQドメインに入れることも可能であるが、好適な実施形態においては、ステップ(225)でのLMSからIPTへの非線形的符号化のための従来のべき関数に替えて、代わりにL、MおよびS成分の各々のPQ非線形的符号化を行う。
e)LMSからIPTへの線形変換(例えばEbner文献に定義される)を用いることにより、ステップ(230)は、信号222のIPT−PQ色空間への変換を完了する。例えば、一実施形態において、L’M’S’からIPT−PQへの変換は、以下によって与えられ得る。
【数5】
別の実施形態において、実験からI’成分はS’成分に依存せずに導出することが好ましくあり得ることがわかっており、したがって式(2a)は、
【数6】
となる。
【0024】
IPT−PQ対YCbCr−ガンマ
MPEG−1、MPEG−2、AVC、HEVCなどの既存のビデオ圧縮規格のほとんどは、YCbCr色空間におけるガンマ符号化された画像用にテスト、評価、および最適化されている。しかし実験結果から、各色成分につき画素あたり10ビット以上のハイダイナミックレンジ画像に対しては、IPT−PQ色空間がより良い表現フォーマットを提供し得ることがわかっている。HDRやさらに広色域の信号により適した色空間(例えばIPT−PQ)で信号符号化すれば、よりよい全体的な画質は生み得るが、旧式のデコーダ(例えばセットトップボックスなど)が適正な復号化および色変換を行うことができない可能性がある。新しい色空間を知らないような機器であっても妥当な画(像)を生成できるように下位互換性を改善するため、発明者らの理解によれば、新規な信号再構成技術が必要である。
【0025】
図3は、一実施形態における信号再構成および符号化のプロセス例を示す。図3に示すように、入力(302)を与えられると、順方向色再構成ブロック(305)は、必要に応じて色変換および/または再構成関数を適用することにより、好適な色空間(例えばIPT−PQ−r)における信号(307)を生成する。また再構成に関連するメタデータ(309)も生成し、これがエンコーダ(310)、デコーダ(315)、および逆方向色再構成(320)などの符号化パイプライン中の後のブロックに伝えられてもよい。
【0026】
デコーダは、符号化された信号(315)を受け取ったあと、復号化(315)(HEVC復号化など)を適用して、復号化された信号(317)を生成する。好適なHDR−WCG符号化色空間(例えばIPT−PQ−r)を知っているデコーダは、適正な逆方向または逆(backward or reverse)再構成(320)を適用することにより、適正な色空間(例えばIPT−PQ)にある信号(322)を生成する。そして、信号(322)を、追加的な後処理、格納、または表示のために、YCbCrまたはRGBに変換してもよい。
【0027】
好適なHDR−WCG符号化空間を知らない旧式のデコーダは、HDR−WCG空間を、旧式の色空間(例えばガンマ符号化されたYCbCr)として扱うかもしれない。しかし、順方向色再構成(305)のおかげで、デコーダの出力(317)に対し逆方向再構成その他の色変換が適用されていないにもかかわらず、出力(317)はなお妥当な画質を有し得る。
【0028】
色再構成
限定するものではないが、IPT−PQ色空間を考える。一実施形態において、線形再構成行列(例えば3×3行列)を生成することにより、IPT−PQ信号における肌色(skin tones)を、YCbCr−ガンマ信号における肌色に、知覚的にマッチさせる。このような色変換は、IPT色空間でのほとんどの画像処理用途の性能に影響を与えない一方で、旧式の機器による色再生を大きく改善する。肌色に代えてあるいは肌色に加えて、群葉や空などの他の重要な色にマッチするように同様な変換行列を生成してもよい。一実施形態において、再構成行列は以下のように算出され得る。すなわち、
【0029】
a)例えば反射率スペクトルなどの肌色カラーのデータベースをロードし、これらをXYZなどの機器独立的な色空間に変換する。
【0030】
b)肌色のデータベースを、XYZから旧式の色空間フォーマット(例えばYCbCr,Rec.709)に変換する。このステップは例えば、以下のサブステップを含んでもよい。すなわち、
b.1)データベースをRGBに変換(Rec.709)、
b.2)RGB値(例えばBT.1886に準拠)にガンマを適用することにより、ガンマ符号化されたR’G’B’信号を生成、
b.3)R’G’B’信号をYCbCr−ガンマ値(例えばRec.709に準拠)に変換、
b.4)YCbCr−ガンマ信号の色相(例えば
【数7】
)値を算出、および
b.5)YCbCr−ガンマ信号の彩度値(例えば
【数8】
)を算出。
【0031】
c)データベース中の肌色値を、好適なカラーフォーマット(例えば、IPT−PQ)で算出する。このステップは、以下のサブステップを含み得る。すなわち、
c.1)XYZからLMSへ変換、
c.2)PQ(例えばST 2084準拠)を適用することにより、LMSからL’M’S’へ、そしてI’P’T’へと変換、
c.3)色相値(例えば
【数9】
を算出、および
c.4)彩度値(
【数10】
)を算出。
【0032】
d)回転または再構成されたIPT−PQ(例えばIPT−PQ−r)における肌色が、YCbCr−ガンマにおける肌色と整合するように、IPT値を回転するための回転行列を算出。一実施形態においてこのステップは、2つの色空間内のサンプルの、色相および彩度値に関するコスト関数を、最適化することにより算出される。例えば、一実施形態においてコスト関数は、旧式の色空間(例えばYCbCr)と、回転された好適なHDR色空間(例えばIPT−PQ)との間の平均二乗誤差(MSE)を表していてもよい。例えば、
【数11】
が、色相に関連するコスト関数を表すとする。ここで、HueIPT−PQ−rは、再構成された色(すなわち、IPT−PQ−r)の色相を表しており、
【数12】
と定義できる。ここで、すべての逆tan関数は、(−π,π)で算出される。
【0033】
一実施形態において、ある基準にしたがってコスト関数を最小にする角度「a」の値(これをa’と表記する)を見出すための、当該分野において公知の最適化法を適用し得る。例えば、MATLAB関数fminunc(fun,x0)を、fun=CostHおよびx0=0.1で適用してもよい。所与のa’について、回転行列Rを、以下のように定義し得る。
【数13】
【0034】
一例として、サンプルデータベースに基づけば、一実施形態において、a’=71.74度について、
【数14】
である。
【0035】
Rおよび元のL’M’S’からI’P’T’への行列であるLMS2IPTmat(例えば式(2)を参照)を与えられたとき、再構成されたIPT−PQ−r色空間への変換は、以下のように定義される新しいLMS2IPTmat−r行列を用い得る。すなわち、
LMS2IPTmat−r=RT*LMS2IPTmat=((LMS2IPT matT*R))T (7)
ここで、ATは、行列Aの転置行列を表す。
【0036】
一実施形態において、肌色の色相を整合させることに加えて、彩度を整合させてもよい。これは、以下のステップを含み得る。すなわち、
a)Rを元のIPT−PQデータに適用して、色回転されたクロマ値PRおよびTRデータを生成する。
b)彩度コスト関数、例えば元の色空間およびターゲット色空間における彩度値間のMSEなど、を定義する。すなわち、
【数15】
ここで、
【数16】
c)b’が、CostSを最適化するb値を表すとする。すると、スケーリングベクトル
【数17】
をクロマ回転行列に適用することで、1つの色回転・スケーリング3×3行列
【数18】
を形成し得る。
【0037】
いくつかの実施形態において、色相コスト関数および彩度コスト関数(例えば式(3)および(8)を、1つの色相/彩度コスト関数にまとめ、a’とb’の両方について同時に解いてもよい。例えば、式(11)より、一実施形態において、
【数19】
について、式(4)は、
【数20】
と変形し得、最適なa’および最適なbi’(i=1から4)スケーリング係数の両方について、式(3)を解くことができる。
【0038】
例えば、一実施形態において、a’=65度およびb1’=1.4、b2’=1.0、b3’=1.4、およびb4’=1.0について、式(12)より以下が得られる。
【数21】
【0039】
トーン再構成
提案した回転行列Rにより色再生を改善し得るが、しかし復号化された画像(317)は依然として、非線形的EOTF符号化関数間における差異(例えばST 2084とBT 1866など)のために、低いコントラストを有するように知覚されるかもしれない。一実施形態において、1−Dトーンマッピング曲線を輝度チャンネル(例えばI’)に適用することによって、コントラストを改善してもよい。このステップは、以下のサブステップを含み得る。すなわち、
a)トーンマッピング曲線(例えばS字状)を適用することにより、元のHDRの最大明るさ(例えば4,000ニト)の元のコンテンツから、SDRのターゲット明るさ(例えば100ニト)へマッピング。そのようなS字関数の一例を、本願においてその全文を援用するA.BallestadおよびA.Kostinの米国特許第8,593,480号「Method and Apparatus for Image Data Transformation」に、見出すことができる。別の再構成関数の例がまた、本願においてその全文を援用するWIPO公開WO2014/160705「Encoding perceptually−quantized video content in multi−layer VDR coding」にも開示されている。I'T=f(I')がトーンマッピング関数f()の出力を表すとして、
b)I'Tを線形化(例えば逆PQまたはガンマ関数を適用)することにより、線形ITデータを生成、および
c)線形化されたIT信号に対して旧式のEOTF符号化(例えばBT.1866)符号化を適用することにより、ガンマ符号化された輝度信号を生成。これは、圧縮されてエンコーダに送信される。
【0040】
ST 2084(PQ)およびBT 1866間におけるそのようなマッピングの一例を、図4に示す。この曲線は、より高いミッドトーンコントラスト、より低い黒部、およびより明るい(コントラストのより少ない)ハイライトを有している。これにより、トーンスケールを標準的なSDRに対してより近く整合させ、もし入力が旧式の機器によって復号化されたとしても画像が視聴可能であるようになる。図4において、限定はしないが、入力値および出力値は(0,1)に正規化されている。
【0041】
再構成情報は、エンコーダからパイプラインの残り部分に対して、メタデータとして伝えられ得る。再構成パラメータは、与えられた映像シーケンスについて可能なかぎり最高の性能を得るために、フレーム毎、シーン毎、またはシーケンス毎などの様々な時間関係で決定されてよい。
【0042】
本説明ではIPT−PQ色空間について述べているが、これらの手法は他の色空間およびカラーフォーマットについても等しく適用可能である。例えば、同様な手法を適用することにより、異なるバージョンのYCbCr間(例えば、Rec.709 YCbCrとRec.2020 YCbCrなど)にわたって、下位互換性を改善することができる。このように、一実施形態において、本明細書に記載した信号再構成法を用いてRec.2020ビットストリームを調節することにより、旧式のRec.709デコーダを用いて復号化された際にも、よりよい色相・彩度出力を得ることができる。
【0043】
図6は、一実施形態における、色回転・スケーリング行列を生成するための、プロセスフロー例を示す。ある画像データベース(605)を与えられると、ステップ(610)は、第1の(旧式)色空間(例えば、YCbCr−ガンマ)において、データベース内の画像についての色相および彩度値を算出する。ステップ(615)は、第2の(好適な)色空間(例えば、IPT−PQ)において、データベース内の画像についての色相を算出する。
【0044】
色相に関連するコスト関数(例えば式(3))を与えられると、ステップ(620)は、ある最小化コスト条件(例えば平均二乗誤差(MSE))にしたがって最適である回転角a’を求める。この回転角a’は、旧式の色空間において算出された色相群と、回転された好適な色空間において算出された色相群との距離を最小にするものである。ステップ(625)において、a’の値を用いて色回転行列を生成する。
【0045】
また、オプションとして彩度スケーラを算出してもよい。彩度コスト関数(例えば式8)を与えられると、ステップ(630)は、オプションとして、ある最小化コスト条件にしたがって(例えば第1の色空間にある信号の彩度と色回転された好適な色空間にあるスケーリングされた信号の彩度との間のMSEなど)、最適なスケーラb’を求める(640、645)。
【0046】
最後に、ステップ(635)において、回転角およびスケーラを組み合わせることにより、色回転・スケーリング行列(例えば式(11))を生成する。
【0047】
エンコーダにおいては、色回転・スケーリング行列を、好適な色空間にある入力データに適用することにより、再構成された色空間にあるデータを生成する。データは符号化(圧縮)され、色回転・スケーリング行列に関連する情報とともにデコーダに送信される。
【0048】
デコーダにおいては、旧式のデコーダの場合、旧式の色空間において符号化されたものとしてデータを復号化するであろう。間違った色空間情報を用いているにもかかわらず、ダイナミックレンジは下がるものの、画像は依然として十分な質で視聴可能である。より新しくフル機能のデコーダは、受け取ったメタデータ情報(色回転・スケーリング行列)を利用して、画像データを好適な色空間において復号化することにより、視聴者にデータの持つハイダイナミックレンジをフルに提供し得る。
【0049】
再構成情報用のSEIメッセージシンタックス
上記のように、一実施形態において、回転(R)行列およびスケーリングベクトル(S)は、(230)におけるL’M’S’からI’P’T’への変換行列により吸収されてもよい。トーン再構成曲線は順方向色再構成(305)の一部分であってもよい。両方の場合において、適応的再構成情報(すなわち、行列およびトーンマッピング曲線)は、2015年7月16日付け出願の米国特許仮出願Ser.No.62/193390において提案されているシンタックスを用いて、エンコーダからデコーダに送信され得る。本願においてその全文を援用する。
【0050】
別の実施形態において、図5に示すように、新たな色回転およびスケールブロック(510)をエンコーダ(500A)に追加してもよい。このブロックは、色変換(200)(例えばRGBからIPT−PQ)の後に追加され得るが、好ましくは順方向再構成(305)の前に追加される。デコーダ(500B)において、対応する逆色回転・スケーリングブロック(515)を、逆方向再構成ボックス(320)の後に追加してもよい。図5に示すように、オプションとしてのカラーフォーマット変換ボックス(例えば4:4:4から4:2:0(505)、または4:2:0から4:4:4(520))を、符号化および/または復号化パイプラインに必要に応じて追加してもよい。
【0051】
シンタックス的には、3×3回転行列、または単に2×2行列を指定すればよい。なぜなら、典型的には輝度チャンネル(例えばYまたはI)は変更されないままだからである。表1は、色回転・スケーリング行列を伝えるためのSEIメッセージングの一例を提供する。ただし、信号送信はSEIメッセージに限定されない。SPS、PPSその他などの任意の高レベルシンタックスに挿入され得る。
表1:色回転・スケーリング行列のためのSEIメッセージング例
【表1】
【0052】
colour_rotation_scale_matrix_present_flagが1に等しいことは、0から1の範囲(両端を含む)にあるcおよびiについて、シンタックス要素colour_rotation_scale_coeffs[c][i]が存在することを示す。colour_rotation_scale_matrix_present_flagが0に等しいことは、0から1の範囲(両端を含む)にあるcおよびiについて、シンタックス要素colour_rotation_scale_coeffs[c][i]が存在しないことを示す。
【0053】
colour_rotation_scale_coeffs[c][i]は、2×2色回転およびスケール行列係数の値を指定する。colour_rotation_scale_coeffs[c][i]の値は、−2^15から2^15−1(両端を含む)の範囲になる。colour_rotation_scale_coeffs[c][i]が存在しないときは、デフォルトの色回転およびスケール行列行列が用いられる。
【0054】
一実施形態において、エンコーダおよびデコーダの両方が色回転・スケーリング行列を知っており(例えば新しい色空間を相互に定義することにより)、色回転行列をエンコーダからデコーダに信号送信する必要がない場合がある。別の実施形態においては、色回転・スケーリング行列は、IPT−PQとともにVUI(ビデオユーザビリティ情報)中において参照されてもよい。
【0055】
多色相・彩度再構成
いくつかの実施形態において、多数の色相に対して再構成を適用することが有利である場合がある。これは、再構成された色空間を旧式の色にマッチさせる精度を増大させるが、デコーダにおいて追加的な演算というコストが発生する。例えばN個の色相(例えば肌色、空、草木など)について再構成を最適化する問題を考える。一実施形態において、前述した処理を繰り返すことにより、最適角度および彩度の組を、色相の関数として決定することができる。例えば、様々な色相群に対してデータベース画像を用いることにより、最適な(回転角、彩度スケール)値の組を生成し得る。例えば{(a1,b1),(a2,b2),...,(aN,bN)}である。あるいはより一般的に、画素pについて
【数22】
が最適なクロマ(色相)回転および彩度スケーリング値を示すとする。ここで、h(p)は画素pの色相の尺度を表す。例えば、IPT−PQ色空間について、fHおよびfS関数は、色相関数h(p)および彩度関数s(p)的に算出することが可能である。すなわち、
【数23】
【0056】
関数fH(h(p))およびfS(h(p))は、当該分野において公知の様々な方法、例えばルックアップテーブルまたは区分的線形または非線形多項式として表現および格納されればよく、またメタデータとしてエンコーダからデコーダへと伝えられることができる。
【0057】
H(h(p))およびfS(h(p))が与えられたとき、エンコーダは、各画素に対して以下の再構成関数
【数24】
を適用することにより、適切な再構成された信号を生成する。例えば、IPT−PQ色空間について、画素pについての再構成されたP’およびT’色成分は、以下を用いて導出してもよい。すなわち、
【数25】
【0058】
デコーダにおいては、プロセスは逆である。例えば、fH(h(p))およびfS(h(p))が与えられたとき、式(14)および(16)から、デコーダは、
【数26】
を生成する。
【0059】
デコーダにおける除算を避けるために、いくつかの実施形態において、エンコーダはfS(h(p))の逆数(例えば1/b(p)値)を、デコーダに信号送信し得る。IPT−PQ空間における入力データに対し、元のデータを、
【数27】
として生成し得る。
【0060】
式(17)より、逆再構成を適用して好適な色空間にあるデータを回復することは、三角関数演算を必要とする。いくつかの実施形態において、三角関数演算はルックアップテーブルを用いて行い得る。一例として、式(18)より、式(19)は以下のように書き換え得る。
【数28】
これらの演算は、コサインおよびサイン関数を算出するために適切なルックアップテーブルを用いることにより、さらに簡素化することができる。
【0061】
図7Aは、旧式の色空間がYCbCr−ガンマである場合に、再構成されたIPT−PQ−r(これは旧式の機器にとっては、YCbCrとして見える)から色相を変換してIPT−PQに戻す、逆方向再構成関数の一例を示す。図7Bは、彩度を調整するための、対応する逆方向再構成関数を示す。図8は、好適な色空間IPT−PQ(820)を調節して、旧式のYCbCr色空間(810)の特性にマッチさせる様子を示す。光線(830)は、回転およびスケーリングを表している。
【0062】
別の実施形態において、PおよびT値を色相のコサインまたはサイン関数的に算出する代わりに、色相の他の何らかの関数(例えばf(tan-1(h(p))))に基づいて生成されたルックアップテーブルを有するより単純なデコーダを構築することもできる。例えば、所与の再構成された画素値成分P'r(p)およびT'r(p)について、一実施形態において、デコーダは、元の画素値を以下のように回復し得る。すなわち、
【数29】
ここで、v()およびw()は、再構成された色空間における画像が、旧式の色空間における色相および彩度の組にマッチするように生成された、色相に関連する関数を表す。v()およびw()関数は、前述のようにメタデータを用いてエンコーダからデコーダへと伝えられてもよく、あるいはエンコーダおよびデコーダの両方が知っている、確立された符号化プロトコルまたは規格の一部であってもよい。
【0063】
ICTP色空間
ICTPはICtCp(またはIPT)とも呼ばれ、ハイダイナミックレンジおよび広色域(wide color gamut:WCG)信号を処理するために特に設計された、新しい提案としての色空間である。ITP−PQと同様に、I(Intensity:強度)は、PQ符号化された信号の明るさを表し、第3軸(Tritan Axis)CTは、青−黄色の知覚に対応し、第1軸(Protan Axis)CPは、赤−緑の色知覚に対応する。上に述べたIPT−PQの特徴に加えて、ICTPにおいては、
・前述のように、クロマを回転し肌色をYCbCrにより近く整合
・XYZからLMSへの行列が、WCG画像についてのよりよい均一性および線形性のために最適化
・L’M’S’からICtCpへの行列が、HDRおよびWCG画像についての等輝度性(isoluminance)および安定性を改善するために最適化
されている。
【0064】
本明細書において、用語「等輝度性」は、輝度(例えばICtCpのI、またはY’Cb’Cr’のY’)がいかによく輝度Yに対応するかの尺度を意味する。間接的にこれは、ある色空間がいかによくルマをクロマから分離するかを測っている。発明者の行った実験から、ICtCpのIは、Y’Cb’Cr’のY’よりも、よりルマに近く対応することがわかっている。
【0065】
実装の観点から言えば、ICTP色空間を用いることは、従来のガンマ符号化されたYCbCrを用いるのと同じハードウェアおよび信号フローを必要とする。例えば、カメラパイプラインにおいてガンマ補正されたYCbCr(Y’Cb’Cr’)を使用することを考える。XYZから開始して、プロセスは以下のステップを必要とする。
a)3×3行列を用い、XYZからRGB BT.2020へと変換、
b)ステップa)の出力に逆EOTF(またはOETF)を適用、および
c)ステップb)の出力に3×3行列を適用。
【0066】
図2に示したように、ICTP色を用いることは、以下のステップを必要とする。
a)ステップ(220)にて、好適な実施形態においては以下の3×3行列を用いて、XYZからLMSへ変換する。すなわち、
【数30】
これは式(1a)のXYZからLMSへの3×3行列を、c=0.04であるクロストーク行列と組み合わせることに相当する(式(1c)も参照のこと)。
b)ステップ(225)において、PQ非線形性を適用することにより、前述のように信号(222)をL’M’S’に変換。
c)ステップ(230)において、3×3行列を用いてL’M’S’からICTPへ変換。この3×3行列は好適な実施形態において、以下のように定義し得る。すなわち、
【数31】
式(23)は、式(12b)の回転行列に、式(2b)の元のL’M’S’からI’P’T’への行列を乗算することに相当する。
【0067】
別の実施形態において、ステップa)からc)までを、以下のようにも表現し得る。
【数32】

ここで、RGBBT.2020は、BT.2020における3つのRGB値を表し、EOTF-1ST2084は、SMPTE ST 2084に従ったEOTFの逆関数を表す。いくつかの実施形態において、EOTF-1ST2084関数を、ハイブリッドログガンマ(Hybrid Log−Gamma:HLG)関数などの、別の非線形的量子化関数により置き換えてもよい。完全な参考が必要であれば、適切な式を表2にも要約しておく。下付き文字Dは、ディスプレイ光を意味する。
表2:ICTPへの色変換
【表2】
【0068】
ICTPから元の色空間へと戻る変換は、同様なアプローチをたどる。一実施形態において、これは以下のステップを含み得る。すなわち、
a)ICTPからL’M’S’へと変換。これは式(23)の逆行列、すなわち
【数33】
を用いて行う。
b)L’M’S’信号から、信号のEOTF関数(例えばST 2084の定義に準拠)を用いて、LMSへと変換。
c)式(22)の逆行列、例えば
【数34】
を用いて、LMSからXYZへと変換。
【0069】
一実施形態において、対応するL’M’S’からRGBへの行列、およびICTPからL’M’S’への行列は、以下で与えられる。
【数35】
【数36】
【0070】
リファレンスディスプレイ管理
ハイダイナミックレンジのコンテンツが、そのコンテンツのマスタリングのために用いられたリファレンスディスプレイよりも、低いダイナミックレンジを有するディスプレイ上で視聴されることもある。HDRコンテンツをより低ダイナミックレンジのディスプレイ上で視聴するためには、ディスプレイマッピングを行う必要がある。これは、ディスプレイにおけるEETF(電気−電気的伝達関数(electrical−electrical transfer function))の形をとり得る。これは典型的には、ディスプレイにEOTFを適用する前に適用される。この関数は、品良くハイライトと影とをロールオフするためのトゥとショルダー(toe and shoulder)を提供することにより、表現意図を保持することとディテールを維持することとの間のバランスを保つ。図9は、フルの0〜10,000ニトのダイナミックレンジから、0.1〜1,000ニトの能力を有するターゲットディスプレイへのEETFマッピングの一例を示す。このEETFはPQ信号に導入され得る。プロットした点は、マッピングの効果を示す。すなわち、意図された光がどのように実際の表示光に変化するかを示している。
【0071】
以下に、様々な黒および白輝度レベルを有するディスプレイに対しこのトーンマッピング関数を実装するための、数学的ステップを示す。このEETFは、非線形ドメインにおいて、ICTPまたはY’C’BC’Rのルマチャンネル、あるいはRGBのチャンネルに対し個別に適用され得る。
EETFの計算:
【0072】
トーンマッピング曲線の中央領域は、ソースからターゲットへの一対一対応として定義される。エルミートスプラインを用いて追加的なトゥ/ショルダーロールオフを計算することにより、ダイナミックレンジをターゲットディスプレイの能力まで減少させる。
【0073】
スプラインのターニングポイント(トゥスタート(TS)およびショルダースタート(SS))を最初に定義する。これらは、ロールオフが始まる点である。minLumおよびmaxLumがターゲットディスプレイの最小および最大輝度値を表すとすると、
【数37】
である。
【0074】
正規化されたPQ符号語で表現されたソース入力信号であるE1を与えられると、出力E2は以下のように算出される。
【数38】
エルミートスプライン式:
【数39】
【0075】
別の実施形態において、
ステップ1:
【数40】
ステップ2:
【数41】
エルミートスプライン式
【数42】
ここで
【数43】
【0076】
得られたEETF曲線は、ICTPの強度Iチャンネル、またはY’C’BC’RのルマYチャンネルに適用することができる。特記すべきオプションをいくつかあげておくと、
1)ICTPのI−EETFを介して、ICTPの強度(I)チャンネルを処理

2=EETF(I1
・グレースケールをより正確に調節する
・カラーシフト無し
・彩度の変更が必要であり、以下の等式を用いてCTおよびCPチャンネルに適用しなければならない。すなわち、
【数44】
2)Y’C’BC’RのY’−EETFを介して、Y’C’BC’RのルマY’チャンネルを処理

Y’2=EETF(Y’1
・グレースケールをより正確に調節する
・カラーシフトは限定的
・彩度の変更が必要であり、以下の等式を用いてC’BおよびC’Rチャンネルに適用しなければならない。すなわち、
【数45】
【0077】
コンピュータシステム実装例
本発明の実施形態は、コンピュータシステム、電子回路およびコンポーネントで構成されたシステム、マイクロコントローラ、フィールドプログラマブルゲートアレイ(FPGA)または他のコンフィギュラブルまたはプログラマブルロジックデバイス(PLD)、離散時間またはデジタル信号プロセッサ(DSP)、特定用途向けIC(ASIC)などの集積回路(IC)デバイス、および/または、このようなシステム、デバイスまたはコンポーネントを1つ以上含む装置、を用いて実施し得る。このコンピュータおよび/またはICは、本明細書に記載のようなエンハンストダイナミックレンジを有する画像の信号再構成および符号化に関する命令を行い、制御し、または実行し得る。このコンピュータおよび/またはICは、本明細書に記載の信号再構成および符号化プロセスに関する様々なパラメータまたは値のいずれを演算してもよい。画像およびビデオ実施形態は、ハードウェア、ソフトウェア、ファームウェア、および、その様々な組み合わせで実施され得る。
【0078】
本発明の特定の態様は、本発明の方法をプロセッサに行わせるためのソフトウェア命令を実行するコンピュータプロセッサを含む。例えば、ディスプレイ、エンコーダ、セットトップボックス、トランスコーダなどの中の1つ以上のプロセッサは、そのプロセッサがアクセス可能なプログラムメモリ内にあるソフトウェア命令を実行することによって、上記のようなHDR画像の信号再構成および符号化に関する方法を実装し得る。本発明は、プログラム製品形態で提供されてもよい。このプログラム製品は、データプロセッサによって実行された時に本発明の方法をデータプロセッサに実行させるための命令を含む1セットの、コンピュータ読み取り可能な信号を格納する任意の非一時的媒体を含み得る。本発明によるプログラム製品は、様々な形態をとり得る。例えば、このプログラム製品は、フロッピーディスク、ハードディスクドライブを含む磁気データ記憶媒体、CD ROM、DVDを含む光学データ記憶媒体、ROM、フラッシュRAMなどを含む電子データ記憶媒体、などの物理的媒体を含み得る。このプログラム製品上のコンピュータ可読信号は、任意に、圧縮または暗号化されていてもよい。
【0079】
上記においてあるコンポーネント(例えば、ソフトウェアモジュール、プロセッサ、アセンブリ、デバイス、回路など)に言及している場合、そのコンポーネントへの言及(「手段」への言及を含む)は、そうでないと明記されている場合を除いて、当該コンポーネントの機能を果たす(例えば、機能的に均等である)あらゆるコンポーネント(上記した本発明の実施形態例に出てくる機能を果たす開示構造に対して構造的に均等ではないコンポーネントも含む)を、当該コンポーネントの均等物として、含むものと解釈されるべきである。
【0080】
均等物、拡張物、代替物、その他
HDR画像の効率的な信号再構成および符号化に関する実施形態例を上述した。この明細書中において、各実装毎に異なり得る多数の具体的な詳細に言及しながら本発明の実施形態を説明した。従って、本発明が如何なるものかおよび出願人は本発明が如何なるものであると意図しているかについての唯一且つ排他的な指標は、後の訂正を含む、これら請求項が生じる具体的な形態の、本願から生じる1組の請求項である。当該請求項に含まれる用語に対して本明細書中に明示したあらゆる定義が、請求項内で使用される当該用語の意味を決定するものとする。よって、請求項に明示的に記載されていない限定事項、構成要素、特性、特徴、利点または属性は、いかなる形であれ請求の範囲を限定するものではない。従って、本明細書および図面は、限定的ではなく、例示的であると認識されるべきものである。
図1
図2
図3
図4
図5
図6
図7A
図7B
図8
図9