IP Force 特許公報掲載プロジェクト 2022.1.31 β版

知財求人 - 知財ポータルサイト「IP Force」

▶ 華為技術有限公司の特許一覧

特許7503655トーンマッピング曲線のためのパラメータセットの決定
<>
  • 特許-トーンマッピング曲線のためのパラメータセットの決定 図1
  • 特許-トーンマッピング曲線のためのパラメータセットの決定 図2
  • 特許-トーンマッピング曲線のためのパラメータセットの決定 図3
  • 特許-トーンマッピング曲線のためのパラメータセットの決定 図4
  • 特許-トーンマッピング曲線のためのパラメータセットの決定 図5
  • 特許-トーンマッピング曲線のためのパラメータセットの決定 図6
  • 特許-トーンマッピング曲線のためのパラメータセットの決定 図7
  • 特許-トーンマッピング曲線のためのパラメータセットの決定 図8
  • 特許-トーンマッピング曲線のためのパラメータセットの決定 図9
  • 特許-トーンマッピング曲線のためのパラメータセットの決定 図10
  • 特許-トーンマッピング曲線のためのパラメータセットの決定 図11
  • 特許-トーンマッピング曲線のためのパラメータセットの決定 図12
  • 特許-トーンマッピング曲線のためのパラメータセットの決定 図13
  • 特許-トーンマッピング曲線のためのパラメータセットの決定 図14
< >
(19)【発行国】日本国特許庁(JP)
(12)【公報種別】特許公報(B2)
(11)【特許番号】
(24)【登録日】2024-06-12
(45)【発行日】2024-06-20
(54)【発明の名称】トーンマッピング曲線のためのパラメータセットの決定
(51)【国際特許分類】
   H04N 19/85 20140101AFI20240613BHJP
   H04N 19/186 20140101ALI20240613BHJP
   H04N 19/117 20140101ALI20240613BHJP
【FI】
H04N19/85
H04N19/186
H04N19/117
【請求項の数】 16
(21)【出願番号】P 2022567467
(86)(22)【出願日】2020-05-08
(65)【公表番号】
(43)【公表日】2023-06-13
(86)【国際出願番号】 CN2020089105
(87)【国際公開番号】W WO2021223193
(87)【国際公開日】2021-11-11
【審査請求日】2022-12-14
(73)【特許権者】
【識別番号】503433420
【氏名又は名称】華為技術有限公司
【氏名又は名称原語表記】HUAWEI TECHNOLOGIES CO.,LTD.
【住所又は居所原語表記】Huawei Administration Building, Bantian, Longgang District, Shenzhen, Guangdong 518129, P.R. China
(74)【代理人】
【識別番号】100107766
【弁理士】
【氏名又は名称】伊東 忠重
(74)【代理人】
【識別番号】100070150
【弁理士】
【氏名又は名称】伊東 忠彦
(74)【代理人】
【識別番号】100135079
【弁理士】
【氏名又は名称】宮崎 修
(72)【発明者】
【氏名】チェン,フゥ
(72)【発明者】
【氏名】ワン,イチョアン
(72)【発明者】
【氏名】シュイ,ウエイウエイ
(72)【発明者】
【氏名】ユィ,チュアンホ
(72)【発明者】
【氏名】アルシナ,エレナ アレクサンドロヴナ
【審査官】間宮 嘉誉
(56)【参考文献】
【文献】特開2017-49992(JP,A)
【文献】特表2018-525905(JP,A)
【文献】米国特許出願公開第2018/0144692(US,A1)
【文献】米国特許出願公開第2017/0103729(US,A1)
【文献】特開2018-66909(JP,A)
(58)【調査した分野】(Int.Cl.,DB名)
H04N 7/12
H04N 19/00-19/98
IEEE Xplore
(57)【特許請求の範囲】
【請求項1】
トーンマッピング曲線のためのパラメータセットを決定する方法であって、当該方法は、
複数のパラメータセットを取得するステップであって、各パラメータセットは、トーンマッピング曲線を定義し、各パラメータセットは、複数の高ダイナミックレンジHDRビデオフレームのうちの1つに基づいて導出されたものである、ステップと、
前記複数のパラメータセットを時間的にフィルタリングして、時間的にフィルタリングされたパラメータセットを取得するステップと、
を含み、
前記複数のパラメータセットを取得するステップは、
第1HDRビデオフレームの第1パラメータセットを取得して、前記第1パラメータセットをキューにプッシュするステップと、
第2HDRビデオフレームの第2パラメータセットを取得して、前記第1HDRビデオフレームと前記第2HDRビデオフレームとの間でシーン変化が生じなかった場合に、前記第2パラメータセットをキューにプッシュするステップと、
を含み、
前記複数のパラメータセットを時間的にフィルタリングして、時間的にフィルタリングされたパラメータセットを取得するステップは、
前記キュー内のパラメータセットの平均を計算して、前記時間的にフィルタリングされたパラメータセットを取得するステップ、
を含む、方法。
【請求項2】
前記複数のパラメータセットを時間的にフィルタリングすることは、前記複数のパラメータセットのうちのパラメータの少なくとも一部の加重平均又は平均を計算することを含む、
請求項1に記載の方法。
【請求項3】
前記時間的にフィルタリングされたパラメータセットに基づいて、前記トーンマッピング曲線を生成するステップ、
を更に含む、請求項1又は2に記載の方法。
【請求項4】
各パラメータセットは、前記トーンマッピング曲線を直接又は間接的に定義する、
請求項1乃至3のいずれかに記載の方法。
【請求項5】
各パラメータセットは、それぞれのHDRビデオフレームのメタデータ又は前記トーンマッピング曲線の1つ以上の曲線パラメータを含む、
請求項1乃至4のいずれかに記載の方法。
【請求項6】
各パラメータセットは、それぞれのHDRビデオフレームから抽出されたメタデータを含み、
前記時間的にフィルタリングされたパラメータセットは、時間的にフィルタリングされたメタデータを含む、
請求項1乃至5のいずれかに記載の方法。
【請求項7】
前記時間的にフィルタリングされたメタデータに基づいて、前記トーンマッピング曲線の1つ以上の曲線パラメータを計算するステップ、
を更に含む、請求項6に記載の方法。
【請求項8】
前記1つ以上の曲線パラメータに基づいて、前記トーンマッピング曲線を生成するステップ、
を更に含む、請求項7に記載の方法。
【請求項9】
各パラメータセットは、それぞれのHDRビデオフレームから抽出されたメタデータに基づいて計算された前記トーンマッピング曲線の1つ以上の曲線パラメータを含み、
前記時間的にフィルタリングされたパラメータセットは、1つ以上の時間的にフィルタリングされた曲線パラメータを含む、
請求項1乃至5のいずれかに記載の方法。
【請求項10】
前記1つ以上の時間的にフィルタリングされた曲線パラメータに基づいて前記トーンマッピング曲線を生成するステップ、
を更に含む、請求項9に記載の方法。
【請求項11】
前記トーンマッピング曲線は、
【数1】

によって与えられ、
ここで、Lは、HDRビデオフレームの入力画素の輝度であり、m_nは、第1値でありm_mは、第2値でありm_bは、所定の知覚量子化PQ値であり、m_pは、輝度制御係数であり、m_aは、出力画素の最大輝度を定義するスケーリング係数であり、
1つ以上の曲線パラメータは、m_p及びm_aを含む、
請求項1乃至10のいずれかに記載の方法。
【請求項12】
前記複数のHDRビデオフレームとともに前記時間的にフィルタリングされたパラメータセットを送信又は記憶するステップ、
を更に含む、請求項1乃至11のいずれかに記載の方法。
【請求項13】
前記複数のパラメータセットを取得するステップは、
前記シーン変化が生じた場合、前記キューをクリアするステップ、
更に含む、請求項に記載の方法。
【請求項14】
HDRビデオフレームを符号化するためのエンコーダであって、当該エンコーダは、
請求項1、2、4乃至7、9、11乃至13のいずれかに記載の方法を実行するように構成される、
エンコーダ。
【請求項15】
HDRビデオフレームを復号するためのデコーダであって、当該デコーダは、
請求項1乃至13のうちの一項に記載の方法を実行するように構成される、
デコーダ。
【請求項16】
プロセッサによって実行されると、該プロセッサに、請求項1乃至13のいずれかに記載の方法を実行させるプログラムコードを含むコンピュータ読取可能記憶媒体。
【発明の詳細な説明】
【技術分野】
【0001】
本開示は、一般に、ビデオ処理の分野に関し、より具体的には、高ダイナミックレンジ(HDR:high dynamic range)のビデオ又は画像処理に関する。特に、本開示は、HDRビデオフレームをトーンマッピングするためのトーンマッピング曲線のためのパラメータセットを決定する方法に関する。さらに、本開示はまた、それぞれHDRビデオフレームを符号化又は復号するためのエンコーダ及びデコーダにも関する。エンコーダ又はデコーダは、本方法を実行するよう構成され得る。
【背景技術】
【0002】
デジタルイメージングでは、ダイナミックレンジは、撮影されているシーンのルミナンス範囲、所与のデジタルカメラ又はフィルムがキャプチャすることができるルミナンス範囲の限界又はディスプレイが可能なルミナンス範囲を定義することができる。実際、典型的な実世界のシーンのダイナミックレンジは、しばしば10-3~10nitの間である。比較すると、消費者ディスプレイは、典型的に、はるかに小さなダイナミックレンジを有する。そのような実世界のシーンをこのようなディスプレイ上に表示することが望まれる場合、HDRをより低いダイナミックレンジにスケールダウンする必要性があり、このプロセスはトーンマッピングと呼ばれる。トーンマッピングは、一般に、非線形マッピングである。
【0003】
HDR画像及びビデオ処理では、nit又はcd/m単位の光信号を0と1の間の電気信号に変換するために、知覚量子化(PQ:Perception Quantization)曲線がしばしば使用される。典型的なPQ曲線の方程式は、以下のように与えられる:
【数1】
ここで、Lは、線形領域の輝度値であり、0nit~10000nitの間の範囲であり、Lは、R値又はG値又はB値又はルミナンス成分Yとすることができる。
【0004】
L’は、PQ領域の電気信号を示し、[0,1]の範囲内に含まれ、これは、しばしば、PQ値又はPQ領域の値と呼ばれる。
【数2】
【0005】
PQ変換関数(transfer function)の入力は線形領域の光信号であり、出力はPQ領域の電気信号である。1対1のマッピングがあるため、量子化が適用されない場合、入力値と出力値は実際には等価である。単にそれらは2つの異なる領域、すなわち線形領域とPQ領域にあるにすぎない。
【0006】
PQ光-電気変換関数(PQ OETF)が量子化のためにしばしば使用される。線形領域のHDR画像は、最初にPQ領域に変換され、次に10ビット又は12ビットに量子化される。PQ領域の画像は、コーデックによって記憶されるか又は圧縮される。PQ領域における量子化は、人間の視覚系が非線形であるため、人間の視覚系に対してより均一である。線形領域における量子化が実施された場合、知覚歪み(perceptual distortion)はずっと大きくなるであろう。
【0007】
上述のように、ディスプレイのダイナミックレンジ及びピーク輝度はしばしば、実世界のシーンのもの、あるいはソースHDR画像又はビデオのものよりも小さい。したがって、例えばHDRビデオフレームをディスプレイに適合させるために、トーンマッピングを使用することができる。非線形曲線をトーンマッピングに使用することができる。トーンマッピング曲線がビデオシーケンス内のすべてのHDRビデオフレームに対して同じである場合、これは静的トーンマッピングと呼ばれる。しかしながら、静的トーンマッピングは、各HDRビデオフレームの画像統計に適合しないため、最適ではない。比較すると、動的トーンマッピングは、各HDRビデオフレームの統計に適合し、したがって、トーンマッピング曲線は、フレームごとに異なる。動的トーンマッピングは、ディスプレイのダイナミックレンジを最大限活用し、より高い品質を有することが期待される。
【0008】
しかしながら、動的トーンマッピングは制御がより難しく、1つの一般的な問題はちらつきである。画像統計はフレームごとに異なるため、トーンマッピング曲線も同様に異なる。特定のアプリケーションにおいて、メタデータは、トーンマッピング手順をガイドするためのコンテンツの鍵情報又は特徴を含み、ソース(エンコーダ)と受信者(デコーダ)との間の「ブリッジ」として重要な役割を果たす。しかしながら、コンテンツは、状況によっては、連続するフレーム間で大きく変化する可能性があり、したがって、メタデータ及び対応するトーンマッピング曲線も変化する可能性がある。これにより、ディスプレイが不安定になり、「ちらつき」という名前の現象が生じる可能性がある。
【0009】
上述のちらつきの問題を解決するための既存のアプローチは、以下で明らかにされるように、例えばSMPTE 2094-10、SMPTE 2094-20、SMPTE 2094-30及びSMPTE 2094-40で標準化された動的トーンマッピングスキームによって与えられる。動的トーンマッピングは、トーンマッピング曲線パラメータが適応的に計算されること、すなわち、画像を変化させるように適合され、したがって、フレームごとに異なることを意味する。動的トーンマッピングは、ディスプレイのダイナミックレンジのより効率的な使用を可能にする。しかしながら、これらの既存のアプローチは、ちらつきの問題を満足に解決しない。
【0010】
Rafal Mantiuk等(Display Adaptive Tone Mapping、ACM Transactions on Graphics 27(3)、2008年8月)によって提案された従来の方法1400は、動的トーンマッピングのためのちらつき防止フィルタを含み、図14に図示されている。この方法1400では、動的メタデータが、HDRソース(例えばHDRビデオフレーム)から抽出1401され、対応するトーンマッピング曲線が、メタデータに基づいて生成1402される。次いで、ちらつきを克服するために、トーンマッピング曲線が急速に変化するとき、トーンマッピング1404を実行する前に、トーンマッピング曲線が時間的にフィルタリング1403される。特に、ウインドウ化された線形位相FIRデジタルフィルタが、トーンマッピング結果を得る前に、トーンマッピング曲線のノードに適用される。
【0011】
しかしながら、この方法は、以前のフレームのトーンマッピング曲線をメモリに保存する必要があるという欠点がある。さらに、完全なトーンマッピング曲線を時間的にフィルタリングすること(temporally filtering)は、かなり複雑なプロセスである。例えば128の値のルックアップテーブル(LUT)がトーンマッピング曲線を表現するために使用され、16のサイズのフィルタリングウィンドウが採用される場合、128×16の値がメモリに記憶される必要がある。
【発明の概要】
【発明が解決しようとする課題】
【0012】
上述の問題点及び欠点を考慮して、本開示の実施形態は、HDRビデオ又はビデオフレームの品質を改善するため、例えばちらつきを低減するための効率的な方法を提供することを目的とする。
【課題を解決するための手段】
【0013】
本目的は、包含される独立請求項において提供される実施形態によって達成される。実施形態の有利な実装は、従属請求項において更に定義される。
【0014】
第1態様によると、本開示は、トーンマッピング曲線のためのパラメータセットを決定する方法に関し、当該方法は、複数のパラメータセットを取得するステップであって、各パラメータセットは、トーンマッピング曲線を定義し、各パラメータセットは、複数のHDRビデオフレームのうちの1つに基づいて導出される、ステップと、複数のパラメータセットを時間的にフィルタリングして、時間的にフィルタリングされたパラメータセットを取得するステップと、を含む。
【0015】
第1態様の方法によると、トーンマッピング曲線自体が時間的にフィルタリングされるのではなく、トーンマッピング曲線を定義するパラメータセットが時間的にフィルタリングされる。したがって、時間リソースと計算リソースの両方を節約することができる。特に、計算複雑性及びメモリ要件は、トーンマッピング曲線全体を時間的にフィルタリングするときと比較して小さくなる。加えて、時間的にフィルタリングされたパラメータセットに基づいてトーンマッピング曲線を取得することができ、これにより、表示されるコンテンツ(特にHDRビデオ)の安定性が改善され、ちらつきが減少されるか又は全くなくなることさえある。特に、ちらつきは、複数のHDRビデオフレームの連続するHDRビデオフレームの間でシーンが急速に変化するときにも減少される。
【0016】
メタデータは、例えばそのHDRフレーム及び/又は例えば同じシーンの他のHDRフレームから導出又は抽出される、HDRフレームの輝度特性を定義する統計データであり得るか又はこれを含み得る。
【0017】
本方法は、エンコーダ、デコーダ、エンコーダとデコーダを含むシステム、HDRシステム、HDRテレビジョン(TV)、HDRカラーグレーディングソフトウェア、HDRビデオトランスコーダ等のような電子デバイスによって(例えば完全に又は部分的に)実行され得る。
【0018】
第1態様の実装形態において、複数のパラメータセットの時間的フィルタリングは、複数のパラメータセットのうちのパラメータの少なくとも一部の加重平均又は平均を算出することを含む。
【0019】
これは、パラメータセットを時間的にフィルタリングするための効率的かつ効果的な方法を提供する。
【0020】
第1態様の実装形態において、方法は、時間的にフィルタリングされたパラメータセットに基づいて、トーンマッピング曲線を生成するステップを更に含む。
【0021】
このようにして生成されたトーンマッピング曲線は、特に、複数のHDRビデオフレームがHDRビデオフレームよりも低いダイナミックレンジを有するディスプレイ上に表示されるときに、ちらつきの減少をもたらす。
【0022】
第1態様の実装形態において、各パラメータセットは、トーンマッピング曲線を直接又は間接的に定義する。
【0023】
例えばトーンマッピング曲線を直接定義するパラメータセットは、曲線パラメータを含み得る。トーンマッピング曲線を間接的に定義するパラメータセットは、メタデータを含み得、当該メタデータからそのような曲線パラメータが算出され得る。
【0024】
第1態様の実装形態において、各パラメータセットは、HDRビデオフレームのメタデータ又はトーンマッピング曲線の1つ以上の曲線パラメータを含む。
【0025】
第1態様の実装形態において、各パラメータセットは、それぞれのHDRビデオフレームから抽出されたメタデータを含み、時間的にフィルタリングされたパラメータセットは、時間的にフィルタリングされたメタデータを含む。
【0026】
第1態様の実装形態において、方法は、時間的にフィルタリングされたメタデータに基づいて、トーンマッピング曲線の1つ以上の曲線パラメータを計算するステップを更に含む。
【0027】
第1態様の実装形態において、方法は、1つ以上の曲線パラメータに基づいて、トーンマッピング曲線を生成するステップを更に含む。
【0028】
このようにして、トーンマッピング曲線自体の代わりに、メタデータを時間的にフィルタリングすることに基づいて、上述のちらつきの問題を低減することができる。
【0029】
第1態様の実装形態において、各パラメータセットは、それぞれのHDRビデオフレームから抽出されたメタデータに基づいて計算されたトーンマッピング曲線の1つ以上の曲線パラメータを含み、時間的にフィルタリングされたパラメータセットは、1つ以上の時間的にフィルタリングされた曲線パラメータを含む。
【0030】
第1態様の実装形態において、方法は、1つ以上の時間的にフィルタリングされた曲線パラメータに基づいてトーンマッピング曲線を生成するステップを更に含む。
【0031】
このようにして、トーンマッピング曲線自体の代わりに、トーンマッピング曲線の曲線パラメータを時間的にフィルタリングすることに基づいて、上述したちらつきの問題を低減することができる。
【0032】
第1態様の実装形態において、トーンマッピング曲線は、
【数3】
によって与えられ、
ここで、Lは、HDRビデオフレームの入力画素の輝度であり、m_nは、第1値であり、特にm_n=1であり、m_mは、第2値であり、特にm_m=2.4であり、m_bは、所定の知覚量子化PQ値であり、m_pは、輝度制御係数であり、m_aは、出力画素の最大輝度を定義するスケーリング係数であり、1つ以上の曲線パラメータは、m_p及びm_aを含む。
【0033】
このトーンマッピング曲線はまた、フェニックス曲線とも呼ばれ、HDRビデオフレームを低ダイナミックレンジディスプレイ上に表示するときに、特に低いちらつきと安定性をもたらす。
【0034】
第1態様の実装形態において、方法は、補足/副情報として、例えば基本メタデータ又はアーティスティックメタデータとして、時間的にフィルタリングされたパラメータセットを複数のHDRビデオフレームとともに送信又は記憶するステップを更に含む。
【0035】
第1態様の実装形態において、方法は、第1HDRビデオフレームの第1パラメータセットを取得し、第1パラメータセットをキューにプッシュするステップと、第2HDRビデオフレームの第2パラメータセットを取得するステップと、第1HDRビデオフレームと第2HDRビデオフレームとの間でシーン変化が生じたかどうかを検出し、シーン変化が生じなかった場合、第2パラメータセットをキューにプッシュするステップと、時間的にフィルタリングされたパラメータセットを取得するために、キュー内のパラメータセットの平均を計算するステップと、を更に含む。
【0036】
これは、パラメータセットを時間的にフィルタリングし、時間的にフィルタリングされたパラメータセットを取得するための、簡単であるが効率的な方法を提供する。
【0037】
第1態様の実装形態において、方法は、シーン変化が生じた場合、キューをクリアするステップを更に含む。
【0038】
シーン変化は、本方法によって、例えばシーン変化の場合に急速に/劇的に変化する、例えばHDRビデオフレームの1つ以上の特性(例えば画像統計)に基づいて検出され得る。
【0039】
第1態様の実装形態において、方法はエンコーダによって及び/又はデコーダによって実行される。
【0040】
第2態様によると、本開示は、HDRビデオフレームを符号化するためのエンコーダに関し、当該エンコーダは、第1態様及び/又は第1態様の実装形態のいずれかによる方法を実行するように構成される。
【0041】
第3態様によると、本開示は、HDRビデオフレームを復号するためのデコーダに関し、当該デコーダは、第1態様及び/又は第1態様の実装形態のいずれかによる方法を実行するように構成される。
【0042】
第4態様によると、本開示は、トーンマッピング曲線を生成するためのシステムに関し、当該システムは、第2態様によるエンコーダ及び/又は第3態様によるデコーダを含む。
【0043】
エンコーダ、デコーダ及びシステムは、第1態様の方法及びその実装形態に関して上述したものと同じ利点及び効果を達成する。
【0044】
第5態様によると、本開示は、プロセッサによって実行されると、特に、第2態様によるエンコーダのプロセッサによって及び/又は第3態様によるデコーダのプロセッサによって実行されると、第1態様及び/又はそのいずれかの実装形態による方法を実行するためのプログラムコードを含むコンピュータプログラムに関する。
【0045】
第6態様によると、本開示は、プロセッサによって実行されると、第1態様及び/又はその実装形態のいずれかによる方法を実行させるための実行可能なプログラムコードを記憶する、非一時的な記憶媒体を提供する。
【0046】
本出願で説明されるすべてのデバイス、要素、ユニット及び手段は、ソフトウェア又はハードウェア要素又はそれらの任意の種類の組合せで実装されることができることに留意されたい。本出願で説明される様々なエンティティによって実行されるすべてのステップ、並びに様々なエンティティによって実行されるように説明される機能性は、それぞれのエンティティがそれぞれのステップ及び機能性を実行するように適合されるか又は構成されることを意味するように意図される。特定の実施形態の以下の説明において、外部エンティティによって実行される特定の機能性又はステップが、その特定のステップ又は機能性を実行するそのエンティティの特定の詳細な要素の説明に反映されていない場合であっても、これらの方法及び機能性を、それぞれのソフトウェア又はハードウェア要素又はそれらの任意の種類の組合せにおいて実装することができることは、当業者にとって明らかであるべきである。
【図面の簡単な説明】
【0047】
上述の態様及び実装形態(本発明の実施形態)は、添付の図面に関連して、以下の具体的な実施形態の説明において説明される:
【0048】
図1】一実施形態による、デバイス(例えばHDRビデオフレームをそれぞれ符号化及び復号するためのエンコーダ又はデコーダ)の概略表現を示す図である。
【0049】
図2】一実施形態による、トーンマッピング曲線のためのパラメータセットを決定する方法の概略図である。
【0050】
図3】一実施形態による、決定されたパラメータセットに基づいてデコーダによって生成され得る、異なる例示的なトーンマッピング曲線を示す図である。
【0051】
図4】異なる動作モードについての例示的なメタデータの概略表現を示す図である。
【0052】
図5】従来例による2つのトーンマッピング曲線と、一実施形態に従って生成されるトーンマッピング曲線との性能比較を示す図である。
【0053】
図6】一実施形態による、複数のパラメータセットを時間的にフィルタリングするための手順の概略図である。
【0054】
図7】本発明の一実施形態による、メタデータがエンコーダにおいて時間的にフィルタリングされる方法の概略図である。
【0055】
図8】本発明の一実施形態による、メタデータがデコーダにおいて時間的にフィルタリングされる方法の概略図である。
【0056】
図9】本発明の一実施形態による、トーンマッピング曲線の曲線パラメータがデコーダにおいて時間的にフィルタリングされる方法の概略図である。
【0057】
図10】本発明の一実施形態による、メタデータがエンコーダにおいて時間的にフィルタリングされる方法の概略図である。
【0058】
図11】本発明の一実施形態による、トーンマッピング曲線の曲線パラメータがエンコーダにおいて時間的にフィルタリングされる方法の概略図である。
【0059】
図12】本発明の一実施形態による、メタデータがエンコーダにおいて時間的にフィルタリングされる方法の概略図である。
【0060】
図13】HDR動的トーンマッピングプロセスの例示的なパイプラインの例を示す図である。
【0061】
図14】トーンマッピング曲線を時間的にフィルタリングすることにより、ちらつき問題に対処する従来のアプローチの概略表現である。
【発明を実施するための形態】
【0062】
図1は、本発明の一実施形態によるデバイス100の概略表現を示す。デバイス100は、HDRビデオフレーム101を符号化するためのエンコーダであり得る。あるいは、デバイス100は、HDRビデオフレーム101を復号するためのデコーダであり得る。デバイス100は、トーンマッピング曲線300(例えば例示的なトーンマッピング曲線300について図3を参照されたい)のためのパラメータセットを決定する方法200(図2に示される方法200の概略図も参照されたい)を実行するように構成され得る。特に、決定されたパラメータセットは、トーンマッピング曲線300を生成するためにデコーダによって更に使用され得る。次に、トーンマッピング曲線300を使用して、HDRビデオフレーム101をトーンマッピングすることができる。
【0063】
少なくとも1つのそのようなエンコーダ及び/又は1つのそのようなデコーダを含むシステム(例えばそのようなシステムの様々な例について、図7図11を参照されたい)が更に形成され得る。特に、本発明の一実施形態によるデバイス100は、通常、このようなシステムで動作する。当該システムでは、一般に、HDRビデオビットストリームがエンコーダからデコーダに送信される。ビットストリームは、HDRビデオフレーム101及び様々な種類のメタデータを含み得る。
【0064】
特に、本発明の実施形態は、図13に示されるように(特に、エンコーダ及びデコーダのシステムを示す)パイプライン1300のブロック1301/1302又はブロック1303/1304で実装され得る。特に、方法200は、デコーダ又はエンコーダのいずれかにおいて、これらのブロックで実行され得る。
【0065】
デバイス100は、(図2及び図3に関連して)複数のパラメータセット102を取得201するように構成され得、ここで、各パラメータセット102は、トーンマッピング曲線300を定義し、各パラメータセット102は、複数のHDRビデオフレーム101、例えば以前に処理されたHDRビデオフレーム101(エンコーダ)又はコーディングされたHDRビデオフレーム101(デコーダ)、のうちの1つに基づいて導出される。さらに、デバイス100は、複数のパラメータセット102を時間的にフィルタリング202して、時間的にフィルタリングされたパラメータセット103を取得するよう構成される。
【0066】
これにより、後により詳細に説明されるように、各パラメータセット102は、それぞれのHDRビデオフレーム101のメタデータ402(例えば図4では基本メタデータ402と称される、例示的なメタデータ402について図4を参照されたい)を含み得る。メタデータ402は、例えばそれぞれのHDRビデオフレーム101から抽出され得る(すなわち、取得ステップ201として)。メタデータ402は、次いで、時間的にフィルタリング202されて、時間的にフィルタリングされたメタデータ402(例えば図7を参照されたい)を取得し得、トーンマッピング曲線300の1つ以上の曲線パラメータ502(例えば例示的な曲線パラメータ502について図4を参照されたい)を、時間的にフィルタリングされたメタデータ403に基づいて計算され得る。さらに、トーンマッピング曲線300が、1つ以上の曲線パラメータ502に基づいて生成され得る。
【0067】
あるいは、各パラメータセット102は、トーンマッピング曲線300の1つ以上の曲線パラメータ502を含み得る。トーンマッピング曲線300の1つ以上の曲線パラメータ502は、それぞれのHDRビデオフレーム101から抽出されたメタデータ402に基づいて計算され得る(すなわち、取得ステップ201として)。曲線パラメータ502が、時間的にフィルタリング202されて、時間的にフィルタリングされた曲線パラメータ503(例えば図9を参照されたい)を取得し得、次に、トーンマッピング曲線300が、時間的にフィルタリングされた曲線パラメータ503に基づいて生成され得る。
【0068】
パラメータセット102(すなわち、メタデータ402又は曲線パラメータ502のいずれか)の時間的フィルタリング202は、エンコーダ又はデコーダ(したがって、デバイス100として機能する;様々な実施形態は、図7図12に関連して後述される)で行われ得る。また、時間的にフィルタリングされたメタデータ402に基づいて曲線パラメータ502を生成することも、エンコーダ又はデコーダで行われ得る。トーンマッピング曲線300は、典型的に、デコーダで生成される。トーンマッピング曲線300自体の代わりに、パラメータセット102の時間的フィルタリング202は、前述したように、様々な利点をもたらす。
【0069】
デバイス100(エンコーダ又はデコーダ)は、本明細書で説明されるデバイス100の様々な動作を実行、実施又は開始するよう構成される処理回路(図1には図示されず)を含み得る。処理回路は、ハードウェア及びソフトウェアを含み得る。ハードウェアは、アナログ回路又はデジタル回路、あるいはアナログ回路とデジタル回路の両方を含み得る。デジタル回路は、特定用途向け集積回路(ASIC)、フィールドプログラマブルアレイ(FPGA)、デジタル信号プロセッサ(DSP)又は多目的プロセッサのような構成要素を含み得る。一実施形態では、処理回路は、1つ以上のプロセッサと、該1つ以上のプロセッサに接続される非一時的なメモリとを含む。非一時的なメモリは、1つ以上のプロセッサによって実行されると、デバイス100に、本明細書で説明される動作又は方法を実行、実施又は開始させる、実行可能プログラムコードを担持し得る。
【0070】
特に、デバイス100は、方法200を実行するため、すなわち、パラメータセット102を取得201し、パラメータセット102を時間的にフィルタリング202して、フィルタリングされたパラメータセット103を取得するための上述のステップを実行するようデバイス100を制御するためのプログラムコードを含むコンピュータプログラムを実行するために、プロセッサを含み得る。
【0071】
本発明の実施形態によると、例示的なトーンマッピング曲線300は、本開示において「フェニックス曲線」とも称されるが、以下によって与えられ得る:
【数4】
ここで、Lは、HDRビデオフレーム101の入力画素の輝度であり、m_nは第1値であり、特にm_n=1であり、m_mは第2値であり、特にm_m=2.4であり、m_bは、所定の知覚量子化PQ値であり、m_pは輝度制御係数(brightness control factor)であり、m_aは出力画素の最大輝度を定義するスケーリング係数である。
「フェニックス曲線」を使用する他の実施形態は、他のパラメータを使用してもよく、例えばm_mは1~5の範囲であってよく、m_nは0.5~2の範囲であってもよい。
【0072】
実施形態は、他の非線形トーンマッピング曲線(「フェニックス曲線」以外)を使用してもよく、これらの他の非線形曲線を定義するために使用されるメタデータの時間的フィルタリングを実施するか又はこれらの他の非線形曲線の曲線パラメータの時間的フィルタリングを直接実施してもよい。
【0073】
上述の曲線パラメータ502は、特に、パラメータm_p及びm_aを含み得る。
【0074】
時間的にフィルタリングされたパラメータセット103は、デコーダによって、このようなフェニックス・トーンマッピング曲線300を生成するために使用され得る。それにより、パラメータセット102のフィルタリングは、エンコーダ又はデコーダによって行われ得る。例えば時間的にフィルタリングされたパラメータセット103は、パラメータm_p及びm_aを含む、時間的にフィルタリングされた曲線パラメータ503を含み得る。
【0075】
これにより、パラメータm_pは輝度制御係数の物理的な意味を有し、m_pが大きいほど輝度は高くなる。さらに、m_aは、トーンマッピング曲線300で実行されるトーンマッピングの最大出力輝度を制御するスケーリング係数である。トーンマッピング曲線300を、PQ領域において設計することができる。換言すれば、トーンマッピング曲線300の入力L及び出力は、両方ともPQ値を参照することができる。入力Lは0から1の範囲であり、ここで、PQ値0は線形領域では0nitであり、PQ値1は線形領域では10000nitである。出力値は、0から、PQ領域の最大表示輝度以下のPQ値の範囲である。
【0076】
異なる最大入力輝度及び最大表示輝度を有するトーンマッピング曲線300のいくつかの例300A、300B及び300Cが図3にプロットされている。例示的なトーンマッピング曲線300A、300B及び300Cは、デコーダによって生成され得るが、特に、(例えばHDRビデオフレーム101に関連する)異なる最大入力輝度と(例えばHDRビデオフレーム101がトーンマッピングされるディスプレイの)最大表示輝度に基づいて生成される。さらに、一例として、m_p=5.0である。トーンマッピング曲線300Aは、デコーダによって、10000nitの最大入力輝度と500nitの最大表示輝度に基づいて生成され得る。さらに、トーンマッピング曲線300Bは、デコーダによって、10000nitの最大入力輝度と1000nitの最大表示輝度に基づいて生成され得る。さらに、トーンマッピング曲線300Cは、デコーダによって、4000nitの最大入力輝度と1000nitの最大表示輝度に基づいて生成され得る。
【0077】
エンコーダ及びデコーダのシステムが動作する異なるモードが存在してもよく、本発明の実施形態は異なるように適用されてもよい。システムのモードに応じて、エンコーダ及びデコーダは異なるように動作されてよく、デバイス100は、エンコーダ又はデコーダのいずれかであり得る。すなわち、本発明の実施形態による方法200は、モードに応じてエンコーダ又はデコーダにおいて実行され得る。エンコーダ及びデコーダは、一般に、モードにおいて異なる役割を有し得る。
【0078】
一例として、China Ultra-HD Video Industrial Alliance(CUVA)HDR規格(CUVA HDR規格)を参照して、第1モードは、以下では「自動モード」と称されてよく、第2モードは、以下では「アーティスティックモード(artistic mode)」と称されてよい。これらのモードの両方において、トーンマッピング曲線300を定義するパラメータセット102は、上述のように、時間的にフィルタリング202され得る。CUVA HDR規格のこれら2つのモードは、以下で簡単に説明される:
【0079】
自動モード(モードフラグtone_mapping_mode=0)。この第1モードでは、トーンマッピング曲線300を生成するための曲線パラメータ502は、デコーダにおいて、(基本)メタデータ402に基づいて計算される。メタデータ402(又は一部の実施形態では時間的にフィルタリングされたメタデータ403)は、エンコーダによってデコーダに提供される。例示的なメタデータ402は、図4に示されており、典型的な画像統計を含み得、例えば1つ以上のHDRビデオフレーム101に関して、最小輝度値、最大輝度値、平均輝度値及び/又は輝度値の分散を含み得る。メタデータ402(又は一部の実施形態では時間的にフィルタリングされたメタデータ403)は、曲線パラメータ502を計算するのに十分であり得るパラメータの最小セットを含み得る。例えばメタデータ402は、以下のように4つのパラメータを含み得る(CUVA HDR規格を参照):
・minimum_maxrgb_pq:フレーム内のすべての画素のmaxrgb値の最小値。値はPQ領域内である。
・average_maxrgb_pq:フレーム内のすべての画素のmaxrgb値の平均。
・variance_maxrgb_pq:フレーム内のすべての画素のmaxrgb値の90パーセンタイルのmaxrgb値と、フレーム内のすべてのmaxrgb値の10パーセンタイルのmaxrgb値との間の差。
・maximum_maxrgb_pq:フレーム内のすべての画素のmaxrgb値の最大値。値はPQ領域内である。
【0080】
ここで、画素のmaxrgb値は、画素のR値、G値及びB値の最大値である。値はPQ領域内である。また、上記で与えられた4つのパラメータはすべて、PQ領域の値である(したがって、各値の名前は_pqで終了している)。
【0081】
アーティスティックモード(モードフラグtone_mapping_mode=1)。この第2モードでは、1つ以上の曲線パラメータ502は、コンテンツ生成の段階で又はトランスコーディングの段階でアルゴリズムを使用して決定される、例えば計算され得る。アーティスティックモードでは、TH1、TH2、TH3、TH強度のような追加の三次スプラインパラメータと、m_a、m_p、m_bのような計算された「フェニックス」曲線パラメータ502が使用され得る。図4に例示的に示されているように、計算された曲線パラメータ502(又は一部の実施形態では時間的にフィルタリングされた曲線パラメータ503)は、(更なるメタデータ401として、例えば「アーティスティックモードメタデータ」として)メタデータ402に追加され、メタデータ402と、更なるメタデータ401と、任意にカラーメタデータ404とを含む、拡張メタデータを形成し得る。拡張メタデータは、デコーダに送信され得る。デコーダは次いで、曲線パラメータ502又は503が、HDRビデオフレーム101が表示されることになるディスプレイに適している場合、トーンマッピングを直接実行するために(すなわち、曲線パラメータ502又は時間的にフィルタリングされた曲線パラメータ503に基づいて、トーンマッピング曲線300を生成し、生成されたトーンマッピング曲線300でトーンマッピングを実行するために)、曲線パラメータ502(又は一部の実施形態では時間的にフィルタリングされた曲線パラメータ503)を使用するよう構成され得る。デコーダはまた、これらの予め計算された曲線パラメータ502又は503を破棄し、自動モードに戻すようにも構成されることができる、すなわち、デコーダは、メタデータ402に基づいて新たな曲線パラメータ502を計算し得る。この2つの組合せも可能である。特に、アーティスティックモードは、曲線パラメータ502又は503が、エンコーダによって更なるメタデータ401として予め計算されて、デコーダに送信され得ることを意味する。カラー関連のメタデータ404も続くことができるが、それらは任意である。
【0082】
「アーティスティックモード」は、必ずしも人間の芸術家又はカラーリストが関与していることを意味するものではないことに留意する価値がある。人工知能(AI)は、カラーグレーディングにおける人間の芸術家又はカラーリストに取って代わり、曲線パラメータ502を決定するのに役立ち得る。したがって、上述の定義による、自動モードとアーティスティックモードとの根本的な違いは、自動モードでは、(基本)メタデータ402のみが送信されるのに対し、アーティスティックモードでは、曲線パラメータ502又は503がエンコーダで計算され、拡張メタデータに埋め込まれ得ることである。
【0083】
以下に、(基本)メタデータ402に基づいて、曲線パラメータ502、特にパラメータm_p及びm_aを計算する方法を、図4に関して説明する。メタデータ402内の4つのパラメータとは別に、他のすべての変数は、中間値又は予め設定された値のいずれかであり得る。したがって、曲線パラメータ502、すなわち、m_a及びm_pは、例示的な基本メタデータ402における4つのパラメータが与えられると、決定されることができる。以下で使用されるパラメータについては、CUVA HDR規格を参照する。
【0084】
第1に、MAX1とmax_lumの中間値が計算され得る。ここで、メタデータ402のうちの2つのパラメータ、すなわち、average_maxrgb及びvariance_maxrgbが使用され得る。
【数5】
A、Bは、予め設定された重み付け係数であり、MINは、max_lumの下限閾値の予め設定された値である。MaxRefDisplayは、基準ディスプレイ(reference display)のピーク輝度である。基準ディスプレイは、カラーリストがカラーグレーディング中にHDRビデオを表示するディスプレイである。標準基準ディスプレイピーク輝度は、1000nit又は4000nitであり得るが、実際には他の値も存在し得る。
【0085】
第2に、パラメータm_pが、以下のように計算され得る:
【数6】
ここで、avgLは、フレーム内のすべての画素のmaxRGB値の平均であり、TPL0とTPH0は、avgLの予め設定された閾値であり、PvalueH0とPvalueH1は、m_pの予め設定された閾値であり、g0(w0)は重みである。
【0086】
第3に、パラメータm_pが、max_lumを使用して更新され得る:
【数7】
ここで、TPL1とTPH1は、max_lumの予め設定された閾値であり、PdeltaH1とPdeltaL1は、m_pオフセットの予め設定された閾値であり、g1(w1)は重みである。
【0087】
最後に、パラメータm_aが、m_pを使用して計算され得る。このステップでは、他の中間値H(L)が算出される。
【数8】
ここで、MaxDISPLAYとMinDISPLAYは、ディスプレイの最大輝度と最小輝度を意味し、MaxSourceとMinSourceは、ソースHDRビデオの最大輝度と最小輝度(maxRGB値)を意味する。
【0088】
有利には、例えば本発明の実施形態に従って生成されたトーンマッピング曲線300は、図5に示されるように、従来のトーンマッピング曲線よりも安定しており、ここで、C1及びC2は、従来のトーンマッピング曲線を表し(グラフC1は、真ん中のグラフであり、C2は、3つのグラフのうちの下のグラフである)、「フェニックス」は、(例えば図3に示される実施例のような)本発明の実施形態によるトーンマッピング曲線300(図5の3つのグラフのうちの上のグラフによって示される改善された性能)を表す。「フェニックス」トーンマッピング曲線300は、従来のトーンマッピング曲線よりも本質的により安定しているため、トーンマッピング曲線300全体を時間的にフィルタリングするために多くの計算を費やす必要はない。したがって、本発明の実施形態によると、代わりに、パラメータセット102(メタデータ402又は曲線パラメータ502)のみを時間的にフィルタリング202することができる。例えば128の値のルックアップテーブル(LUT)に記憶されるであろう完全なトーンマッピング曲線300を時間的にフィルタリングすることと比較して、例えばメタデータ402は、上述の4つのパラメータのみを含み得る。したがって、例えばメタデータ402を時間的にフィルタリング202することは、トーンマッピング曲線300を完全にフィルタリングすることよりも128/4=32倍、効率的である。
【0089】
図6は、本発明の一実施形態によるデバイス100として機能するエンコーダ又はデコーダによって実行され得るとき、フィルタリングされたパラメータセット103を取得するための例示的な手順の概略図を示す。本手順は、上述のように、メタデータ402をフィルタリングするため及び曲線パラメータ502をフィルタリングするために同様に機能する。本手順は、以下のステップを含む:
【0090】
最初に、第1HDRビデオフレーム101の少なくとも第1パラメータセット102が取得201され得、取得された第1パラメータセット102がキュー(図示せず)にプッシュされ得る。次いで、第2HDRビデオフレーム101の第2パラメータセット102が、(図示されるように)取得201され得る。次に、第1HDRビデオフレーム101と第2HDRビデオフレーム101との間でシーン変化が生じたかどうかが(ブロック601において)検出され得る。シーン変化が生じなかった場合(ブロック601においてN)、第2パラメータセット102が(ブロック602において)キューにプッシュされる。シーン変化が生じた場合(ブロック601においてY)、キューは(ブロック603において)クリアされる。第1のケース(ブロック601においてN)では、キュー内のパラメータセット102の平均が、時間的フィルタリングステップ202として(ブロック604において)計算され、時間的にフィルタリングされたパラメータセット103を取得し得る。
【0091】
一実施形態では、複数のパラメータセット102の時間的フィルタリング202は、複数のパラメータセット102のパラメータの加重平均(例えばブロック604で行われるような)又は少なくともその一部の平均を算出することを含む。
【0092】
特に、時間領域においてHDRビデオフレーム101のフィルタリングされたパラメータセット103を得るために、キューの加重平均を(ブロック604において)算出することができる。時間的フィルタリング202は、以下の式に基づいて実行され得る:
【数9】
ここで、Q(k)はキュー内のk番目の値、wは重みである。すべての重みの合計は1に等しい。デフォルトでは、すべての重みは等しくてよい、すなわち、w=1/nである。一実施形態では、現在のHDRビデオフレーム101(図6では「第2フレーム」)により近いHDRビデオフレーム101のパラメータセットに、より大きな重みを割り当てることができる。テストは、このような実施形態が、等しい重みと比較して、品質における小さな利益しか提供しないことを示した。したがって、等しい利益を有する実施形態は、ほぼ同様の品質を提供するが、それほど複雑ではないので、効率的な実装形態を提供する。nは必ずしもキューの最大長とは限らないことに留意されたい。ビデオの開始にHDRビデオフレーム101において、シーンカット(すなわち、シーンの変化)が生じる場合、nは0にリセットされてよく、次いで、キューの最大長に到達するまで、フレームごとに1ずつ増加され得る。キューがいっぱいになると、ルール「先入れ先出し」ルールに従い得る。換言すれば、キュー内の最も古いHDRビデオフレーム101のパラメータセット102がポップアウトされ得、最も新しいHDRビデオフレーム101のパラメータセット102がプッシュインされ得る。
【0093】
図6の手順は、時間リソースと計算リソースの両方をパラメータセット102の時間的フィルタリング202によって節約することができ、トーンマッピング曲線300が、時間的にフィルタリングされたパラメータセット103に基づいて計算されると、フリッカなしに、表示されるコンテンツの安定性がなお保証され得るという利点を有する。時間的にフィルタリング202するためのキューの長さは、フレームレートに依存し、デフォルトでは0.5秒~1秒のHDRビデオフレーム101の数に依存する可能性がある。例えばHDRビデオのフレームレートが30fps(フレーム毎秒)である場合、妥当なキューの長さは15~30である可能性がある。一実施形態では、2の累乗をキューの長さとしてとってよく、したがって、32を、30fpsのソフトウェアで、16を15fpsのソフトウェアでとることができる。
【0094】
図7のこの手順を、(例えば基本)メタデータ402を時間的にフィルタリング202するため、並びに曲線パラメータ502、例えばパラメータm_p及びm_aを時間的にフィルタリングするために使用することができる。アーティスティックモードでは、曲線パラメータm_p及びm_aは拡張メタデータの一部であり得、また、拡張メタデータを時間的にフィルタリングすることも可能である。
【0095】
本発明の実施形態は、時間的フィルタリング202を、メタデータ402と曲線パラメータ502の両方に適用することができることを含むが、以下の2つの理由から、メタデータ402をフィルタリングすることがより有利であり得る:
1)パラメータm_a及びm_pのような曲線パラメータ502は、メタデータ402の非線形関数とすることができる。したがって、非線形領域でそのような曲線パラメータ502をフィルタリングすることは、制御することがより困難であり得る。メタデータ402は、このような線形フィルタリングにより適している可能性がある。
2)自動モードでは、パラメータm_a及びm_pのような曲線パラメータ502をフィルタリングすることは、デコーダにおいてのみ使用され得る。自動モードでは、曲線パラメータ502はエンコーダによってデコーダに送信されないため、曲線パラメータ502をエンコーダにおいてフィルタリングすること不可能であり得る。しかし、自動モードにおいて、メタデータ402をフィルタリングすることは、デコーダだけでなくエンコーダにおいても実施されることができる。
【0096】
上述の実施形態は、トーンマッピング曲線300全体を時間的にフィルタリングすることと比較して、計算複雑性及びメモリ要件が低減されるという利点を提供する。さらに、潜在的なちらつき現象は回避又は低減され、連続するHDRビデオフレーム101の間でシーンが急速に変化するときであっても、表示されるコンテンツの安定性を保証することができる。
【0097】
以下では、第1モードのため(例えば自動モードのため)のいくつかの特定の実施形態が、図7図9に関して説明される。
【0098】
図7は、デバイス100が、エンコーダとデコーダのシステム内のエンコーダである実施形態を示す。特に、メタデータ402(パラメータセット102である)の時間的フィルタリング202は、エンコーダで行われる。
【0099】
特に、エンコーダは、最初に、複数のHDRビデオフレーム101からメタデータ402を(取得ステップ201として)抽出701する。次いで、メタデータ402は、エンコーダにおいて時間的にフィルタリング202される。時間的フィルタリング202に関して、図6に示されるものと同じ処理手順がメタデータ402に使用され得る。フィルタリングされたメタデータ403(フィルタリングされたパラメータセット103である)を取得した後、フィルタリングされたメタデータ403がデコーダに提供される。デコーダは、時間的にフィルタリングされたメタデータ403に基づいて曲線パラメータ502を計算702する。さらに、デコーダは、曲線パラメータ502に基づいてトーンマッピング曲線300を生成703する。
【0100】
図8は、デバイス100が、エンコーダとデコーダのシステム内のデコーダである別の実施形態を示す。特に、メタデータ402(パラメータセット102である)の時間的フィルタリング202は、デコーダで行われる。
【0101】
特に、エンコーダは、最初に、複数のHDRビデオフレーム101からメタデータ402を抽出701し、メタデータ402をデコーダに送信する。デコーダは、(取得ステップ201として)メタデータ402を受信し、メタデータ402を時間的にフィルタリング202して、時間的にフィルタリングされたメタデータ403(フィルタリングされたパラメータセット103である)を取得する。デコーダにおける時間的フィルタリング202に関して、図6に示されるものと同じ処理手順がメタデータ402に使用され得る。フィルタリングされたメタデータ403を取得した後、デコーダでトーンマッピング曲線300を生成703するために、トーンマッピング曲線パラメータ502がデコーダにおいて算出702される。
【0102】
図9は、デバイス100が、エンコーダとデコーダのシステム内のデコーダである別の実施形態を示す。特に、曲線パラメータ503(パラメータセット102である)の時間的フィルタリング202は、デコーダで行われる。
【0103】
特に、エンコーダは、最初に、複数のHDRビデオフレーム101からメタデータ402を抽出701し、それをデコーダに送信する。次いで、デコーダは、(取得ステップ201として)曲線パラメータ502を計算702し、その後、曲線パラメータ502を時間的にフィルタリング202して、時間的にフィルタリングされた曲線パラメータ503(フィルタリングされたパラメータセット103である)を取得する。時間的フィルタリング202に関して、図6に示されるものと同じ処理手順が、曲線パラメータ502に使用され得る。フィルタリングされた曲線パラメータ503を取得した後、デコーダは、時間的にフィルタリングされた曲線パラメータ503に基づいてトーンマッピング曲線300を生成703する。
【0104】
以下では、第2モードのため(例えばアーティスティックモードのため)のいくつかの特定の実施形態が、図10図12に関して説明される。
【0105】
図10は、デバイス100が、エンコーダとデコーダのシステム内のエンコーダである実施形態を示す。特に、メタデータ402(パラメータセットである)の時間的フィルタリング202は、エンコーダで行われる。
【0106】
特に、エンコーダは、最初に、(取得ステップ201として)複数のHDRビデオフレーム101からメタデータ402を抽出701する。次いで、メタデータが、エンコーダにおいて時間的にフィルタリング202され、フィルタリングされたメタデータ103(時間的にフィルタリングされたパラメータセット103である)を取得する。時間的フィルタリング202に関して、図6に示されるものと同じ処理手順が、メタデータ402に使用され得る。フィルタリングされたメタデータ403を取得した後、エンコーダは、曲線パラメータ502を計算702し、曲線パラメータを、更なるメタデータ401としてメタデータ402に追加1000して、拡張メタデータ1001を取得し得る。この拡張メタデータ1001は、デコーダに送信され、デコーダは、そこから更なるメタデータ401を抽出し、したがって、曲線パラメータ502を抽出し、抽出した曲線パラメータ502に基づいてトーンマッピング曲線300を生成703する。
【0107】
図11は、デバイス100が、エンコーダとデコーダのシステム内のエンコーダである実施形態を示す。特に、曲線パラメータ502(パラメータセット102である)の時間的フィルタリング202は、エンコーダで行われる。
【0108】
特に、エンコーダは、最初に、複数のHDRビデオフレーム101からメタデータ402を抽出701する。次いで、エンコーダは、(取得ステップ201として)曲線パラメータ502を計算702する。次に、曲線パラメータ502は、エンコーダにおいて時間的にフィルタリング202され、フィルタリングされた曲線パラメータ503(時間的にフィルタリングされたパラメータセット103である)を取得する。時間的フィルタリング202に関して、図6に示されものと同じ処理手順が、曲線パラメータ502に使用され得る。時間的にフィルタリングされた曲線パラメータ503を取得した後、エンコーダは、時間的にフィルタリングされた曲線パラメータ503を、更なるメタデータ401としてメタデータ402に追加1000して、拡張メタデータ1001を取得し得る。この拡張メタデータ1001は、デコーダに送信され、デコーダは、そこから更なるメタデータ401を抽出し、したがって、時間的にフィルタリングされた曲線パラメータ503を抽出し、これらの曲線パラメータ503に基づいてトーンマッピング曲線300を生成703する。
【0109】
図12は、デバイス100が、エンコーダとデコーダのシステム内のエンコーダである実施形態を示す。特に、メタデータ402(パラメータセット102である)の時間的フィルタリング202は、エンコーダで行われる。
【0110】
図12は、特に、SMPTE 2094-10について、メタデータ402の時間的フィルタリング202を適用するための例を示す。この実施形態では、メタデータ402の一部(したがって、フィルタリングされたパラメータセット103である、時間的にフィルタリングされたメタデータ403の一部)である「順応点(adaptation point)」が、エンコーダによって、トーンマッピング曲線パラメータ502 c1、c2及びc3を計算702するために使用され得る。時間的フィルタリング202を、特に、順応点に適用する、すなわち、時間的にフィルタリングされた順応点を取得するために適用することができる。次いで、時間的にフィルタリングされたメタデータ402は、拡張メタデータ1001内の更なるメタデータ401として(例えば埋め込みアーティスティックモードメタデータとして)デコーダに送信される。最後に、トーンマッピング曲線300は、抽出された更なるメタデータ401に基づいて、したがって曲線パラメータ502に基づいて、デコーダによって生成703される。
【0111】
同様に、SMPTE 2094-40では、アンカー点が曲線パラメータ502を決定するために使用されてよく、したがって、特に、時間的フィルタリング202をそのようなアンカー点にも適用することができる。SMPTE 2094-20及び2094-30では、「ShadowGainControl」、「MidtoneWidthAdjustmentFactor」及び「HighlighGainControl」を含むメタデータ402内の3つのパラメータ502が、トーンマッピング曲線300を決定し、したがって、時間的フィルタリング202を、特に、これらの3つのパラメータに適用することができる。
【0112】
上記の実施形態のすべてにおいて、メタデータ402は動的メタデータであり得る、すなわち、メタデータ402は、フレーム101ごとに変化し得る。さらに、上記の実施形態のすべてにおいて、曲線パラメータ502は、パラメータm_a及びm_pであってよく、これは、フェニックス・トーンマッピング曲線300を定義するために使用され得る。
【0113】
図9図11に図示される上記の実施形態では、メタデータ402は、例えばメタデータ402を時間的フィルタリング202する前又は後に、曲線パラメータ502を計算するために使用され得る。次に、三次スプラインパラメータ及び計算された曲線パラメータ502が、拡張メタデータ1001に埋め込まれる、更なるメタデータ401として結合され得る。
【0114】
図13は、本発明の実施形態を実装するよう構成されるHDR動的トーンマッピングプロセスの信号処理パイプライン1300の例を示す。システムの入力は、HDRビデオ、例えばHDRビデオのHDRビデオフレームである。一般に、このHDRビデオは、カラーリストがより良い品質又は特定の芸術的意図のためにカラーグレーディングシステムを使用してビデオを編集していた、ポストプロダクション段階の出力であり得る。HDRビデオはピーク輝度が高く、しばしば1000nit又は2000nitである可能性があり、近い将来には4000nit又は10000nitである可能性がある。さらに、ビデオの画素値はPQ領域内である。
【0115】
HDR前処理ブロック1301では、HDRビデオは、入力と同じままである。しかしながら、メタデータは計算される。さらに、HDRビデオコーディングブロック1302では、HDRビデオは、例えばビデオコーデックによって、例えばH.265又は(国内、国際又は専有の)任意の他のビデオ規格に従うビデオコーデックによって圧縮される。さらに、メタデータはビデオストリームのヘッダに埋め込まれ、これは、エンコーダからデコーダに送信される(又はデコーダによる後の取り出しのために記憶媒体に記憶される)。HDRビデオ復号ブロック1303では、デコーダは、HDRビデオビットストリームを受信し、圧縮された(又はコーディングされた)ビデオを復号し、ヘッダからメタデータを抽出する。
【0116】
さらに、HDR動的トーンマッピングブロック1304では、HDRビデオをディスプレイ容量に適合させるためにトーンマッピングが実行される。
【0117】
例えばHDR前処理ブロック1301及び/又はHDR動的トーンマッピングブロック1304は、本発明の実施形態を実装し得る。
【0118】
本発明を、実装だけでなく実施例として様々な実施形態に関連して説明してきた。しかしながら、他の変形が、図面、本開示及び独立請求項の研究から、特許請求に係る請求項を実施する当業者によって理解され、実施され得る。請求項並びに本説明において、「含む(comprising)」という語は、他の要素又はステップを除外せず、不定冠詞「a」又は「an」は複数を除外しない。単一要素又は他のユニットが、請求項に記載された幾つかのエンティティ又はアイテムの機能を満たすことがある。特定の手段が相互に異なる従属請求項に記載されているという単なる事実は、これらの手段の組合せが有利な実装において使用することができないことを示すものではない。
図1
図2
図3
図4
図5
図6
図7
図8
図9
図10
図11
図12
図13
図14