(19)【発行国】日本国特許庁(JP)
(12)【公報種別】公表特許公報(A)
(11)【公表番号】
(43)【公表日】2024-12-03
(54)【発明の名称】SDR-HDR局所的再構成のためのノイズ除去
(51)【国際特許分類】
G06T 5/94 20240101AFI20241126BHJP
G06T 5/70 20240101ALI20241126BHJP
【FI】
G06T5/94
G06T5/70
【審査請求】有
【予備審査請求】未請求
(21)【出願番号】P 2024532163
(86)(22)【出願日】2022-11-01
(85)【翻訳文提出日】2024-07-29
(86)【国際出願番号】 US2022048619
(87)【国際公開番号】W WO2023096728
(87)【国際公開日】2023-06-01
(32)【優先日】2021-11-29
(33)【優先権主張国・地域又は機関】EP
(32)【優先日】2021-11-29
(33)【優先権主張国・地域又は機関】US
(81)【指定国・地域】
【公序良俗違反の表示】
(特許庁注:以下のものは登録商標)
(71)【出願人】
【識別番号】507236292
【氏名又は名称】ドルビー ラボラトリーズ ライセンシング コーポレイション
(74)【代理人】
【識別番号】100101683
【氏名又は名称】奥田 誠司
(74)【代理人】
【識別番号】100155000
【氏名又は名称】喜多 修市
(74)【代理人】
【識別番号】100188813
【氏名又は名称】川喜田 徹
(74)【代理人】
【識別番号】100202197
【氏名又は名称】村瀬 成康
(72)【発明者】
【氏名】リュー,ルンゼ
(72)【発明者】
【氏名】ファン,ツォン‐ウェイ
(72)【発明者】
【氏名】スゥ,グワン‐ミーン
【テーマコード(参考)】
5B057
【Fターム(参考)】
5B057BA02
5B057CA01
5B057CA08
5B057CA12
5B057CA16
5B057CB01
5B057CB08
5B057CB12
5B057CB16
5B057CC02
5B057CE02
5B057CE05
5B057CE06
5B057CE11
5B057DB02
5B057DB06
5B057DB09
(57)【要約】
方法の例は、第1のダイナミックレンジの画像を第1のダイナミックレンジよりも低い第2のダイナミックレンジの入力画像から生成することに関する。第2のダイナミックレンジの入力画像に関する共起統計量の第1の配列が生成される。複数の再構成関数候補の中から再構成関数を選択するための再構成関数インデックス値の第2の配列が生成される。第1のダイナミックレンジの再構成画像を生成するために、共起統計量の第1の配列に少なくとも部分的に基づいてノイズ除去操作が行われる一方、再構成関数のインデックス値の第2の配列に少なくとも部分的に基づいて再構成操作が行われる。
【特許請求の範囲】
【請求項1】
第1のダイナミックレンジの画像を第2のダイナミックレンジの入力画像から生成する方法であって、
前記第2のダイナミックレンジの入力画像に関する共起統計量の第1の配列を生成するステップであって、共起統計量は、画像または値の配列において共に現れる一対の値の頻度の尺度であり、前記共起統計量の第1の配列は、ノイズ除去される前の再構成関数インデックス値の第3の配列から導出されたバイナリクラスタマスクから収集された共起統計量の第4の配列と、前記入力画像から導出されたクリップ化量子化画像から収集された共起統計量の第5の配列との組み合わせである、ステップと、
複数の再構成関数候補の中から再構成関数を選択するための再構成関数インデックス値の第2の配列を生成するステップであって、前記再構成関数インデックス値の第2の配列は、前記ノイズ除去される前の再構成関数インデックス値の第3の配列に対して前記ノイズ除去操作が行われることによって生成されたノイズ除去された再構成関数インデックス値の配列を表す、ステップと、
(a)前記共起統計量の第1の配列に少なくとも部分的に基づくノイズ除去操作、および(b)前記再構成関数インデックス値の第2の配列に少なくとも部分的に基づく再構成操作を行って、前記第1のダイナミックレンジの再構成画像を生成するステップと、
を含む方法。
【請求項2】
前記バイナリクラスタマップは、前記ノイズ除去される前の再構成関数インデックス値の第3の配列に標準偏差フィルタリングを適用するステップから生成される、
請求項1に記載の方法。
【請求項3】
前記標準偏差フィルタリングは、前記ノイズ除去される前の再構成関数インデックス値の第3の配列に、少なくとも2つの異なる空間フィルタリングカーネルサイズを用いて適用される、
請求項2に記載の方法。
【請求項4】
前記共起統計量の第5の配列は、前記入力画像から導出されたクリップ化量子化画像または前記入力画像の一方がダウンサンプリングされた後に、前記クリップ化量子化画像から収集される、
請求項1から3のいずれかに記載の方法。
【請求項5】
前記共起統計量の第4の配列は、第1の共起行列内に格納され、前記共起統計量の第5の配列は、第2の共起行列内に格納され、前記第1の配列内の画素位置における共起統計量は、前記第1の共起行列内の前記画素位置における第1の共起統計量および前記第2の共起行列内の前記画素位置における第2の共起統計量の平均値または最小値の一方を表す、
請求項1から4のいずれかに記載の方法。
【請求項6】
前記再構成関数インデックス値の第2の配列内において表される画素位置における各再構成関数インデックス値は、中間のノイズ除去された再構成関数インデックス値の配列内において表される同じ画素位置における第1の再構成関数インデックス値と、ノイズ除去される前の再構成関数インデックス値の配列内において表される同じ画素位置における第2の再構成関数インデックス値との加重和として生成される、
請求項1から5のいずれかに記載の方法。
【請求項7】
前記加重和は、重みマスク値の配列内の同じ画素位置における重み要素を用いて特定され、前記重みマスク値の配列は、前記ノイズ除去される前の再構成関数インデックス値の配列に標準偏差フィルタリングを適用するステップから得られる、
請求項6に記載の方法。
【請求項8】
前記共起統計量の第1の配列は、レターボックス内の画素位置の共起統計量を除く関心領域マップを用いて生成され、前記レターボックスは、レターボックス、ピラーボックス、卵形、または他の形状などの任意の形状の1つまたは複数の静的領域を指す、
請求項1から7のいずれかに記載の方法。
【請求項9】
前記共起統計量の第1の配列は、共起統計量のサンプリングされる前の配列からダウンサンプリングされる、
請求項1から8のいずれかに記載の方法。
【請求項10】
前記再構成関数インデックス値の第2の配列は、前記第2のダイナミックレンジのノイズ除去された画像内のノイズ除去されたコードワードに少なくとも部分的に基づいて生成され、前記第2のダイナミックレンジの前記ノイズ除去された画像内の前記ノイズ除去されたコードワードは、前記第2のダイナミックレンジの前記入力画像内のノイズ除去される前のコードワードに対して前記ノイズ除去操作が行われることによって生成され、コードワードは画素値を指す、
請求項1に記載の方法。
【請求項11】
前記第1のダイナミックレンジの前記再構成された画像は、前記入力画像または前記ノイズ除去された画像の一方に対して前記再構成操作を行うステップから生成される、
請求項10に記載の方法。
【請求項12】
前記共起統計量の第1の配列は、前記入力画像内の前記ノイズ除去される前のコードワードから収集される、
請求項10または11に記載の方法。
【請求項13】
前記第1のダイナミックレンジは、ハイダイナミックレンジを表し、前記第2のダイナミックレンジは、前記ハイダイナミックレンジよりも低いスタンダードダイナミックレンジを表す、
請求項1から12のいずれかに記載の方法。
【請求項14】
プロセッサを備え、請求項1から13に記載の方法のうちのいずれか1つを行うように構成された装置。
【請求項15】
請求項1から13に記載された方法のいずれかに従って、1つまたは複数のプロセッサを用いて方法を実行するためのコンピュータ実行可能命令を記憶した非一時的コンピュータ読み取り可能な記憶媒体。
【発明の詳細な説明】
【技術分野】
【0001】
[関連出願への参照]
本願は、2021年11月29日に出願された米国仮出願第63/283,684号および2021年11月29日に出願された欧州特許出願第21210983.9号に基づく優先権を主張するものであり、それらの両方の出願の開示内容をすべて本願に援用する。
【0002】
本開示は、概して画像処理操作に関する。より詳細には、本開示のある実施形態は、ビデオコーデックに関する。
【背景技術】
【0003】
本明細書において、用語「ダイナミックレンジ」(DR)は、人間の視覚システム(HVS)が、画像におけるある範囲の強度(例えば、輝度、ルマ)、例えば最も暗いグレー(黒)から最も明るい白(ハイライト)までを知覚する能力に関連し得る。この意味では、DRはシーン-リファード(scene-referred)の強度に関する。DRはまた、ディスプレイデバイスが特定の幅を有する強度範囲を妥当にまたは近似的に描画する能力にも関連し得る。この意味では、DRは、ディスプレイ-リファード(display-referred)の強度に関する。本明細書中の任意の箇所において、ある特定の意味が特に明示的に指定されている場合を除いて、この用語はどちらの意味としても(例えば、区別なく)使用できるものとする。
【0004】
本明細書において、ハイダイナミックレンジ(HDR)という用語は、人間の視覚システム(HVS)において14~15桁ほどにわたるDR幅に関する。実際において、人間が広範囲の強度範囲を同時に知覚し得るDRは、HDRに対して幾分端折られ得る。本明細書において、エンハンストダイナミックレンジ(EDR)または視覚ダイナミックレンジ(VDR)という用語は、個別にまたは区別なく、人間の視覚システム(HVS)(眼球運動を含み、シーンまたは画像にわたってある程度の明順応変化を可能にする)が、あるシーンまたは画像中において知覚可能なDRに関する。本明細書において、EDRは、5~6桁にわたるDRに関連し得る。真のシーンリファードのHDRに対しては幾分狭いものの、EDRは広いDR幅を表し、HDRとも呼ばれ得る。
【0005】
実際において、画像は、色空間の1つ以上の色成分(例えばルマYおよびクロマCbおよびCr)を有しており、各色成分は、画素あたりnビットの精度(例えばn=8)で表される。非線形輝度符号化(non-linear luminance coding)(例えば、ガンマ符号化)を用いた場合、n≦8の画像(例えば、カラー24ビットJPEG画像)は、スタンダードダイナミックレンジとされ、n>8の画像はエンハンストダイナミックレンジの画像とされ得る。
【0006】
あるディスプレイについてのリファレンス電気光学伝達関数(EOTF)は、入力ビデオ信号の明度(color values)(例えば輝度)からそのディスプレイによって生成される出力スクリーン明度(例えばスクリーン輝度)への関係を特徴づける。例えば、その開示内容を全て本願に援用するITU Rec.ITU-R BT. 1886、「Reference electro-optical transfer function for flat panel displays used in HDTV studio production」(2011年3月)では、フラットパネルディスプレイについてのリファレンスEOTFを定義している。あるビデオストリームが与えられたとき、そのEOTFに関する情報は、(画像)メタデータとしてビットストリーム中に埋め込まれる。本明細書において、「メタデータ」という用語は、符号化ビットストリームの一部として送信され、デコーダが復号化画像を描画することを助ける、任意の補助的情報に関する。そのようなメタデータは、本明細書において記載されるような、色空間または色域情報、リファレンスディスプレイパラメータ、および補助的な信号パラメータなどを含むが、これらに限定されない。
【0007】
本明細書において、用語「PQ」は知覚的な輝度振幅(luminance amplitude)の量子化を指す。人間の視覚システムは、光レベルの増大に対して非常に非線形的に反応する。人間が刺激を見る能力は、その刺激の輝度、その刺激の大きさ、その刺激を構成する空間周波数、および、その刺激を見ている瞬間までに目が適応した輝度レベルに影響される。いくつかの実施形態において、知覚的量子化器関数は、線形入力グレイレベルを、人間の視覚システムにおけるコントラスト感度閾値によりマッチした出力グレイレベルにマッピングする。PQマッピング関数の一例が、その開示内容を全て本願に援用する、SMPTE ST 2084:2014 "High Dynamic Range EOTF of Mastering Reference Displays"(以下、「SMPTE」)に記載されている。ここでは、ある固定刺激サイズに対して、それぞれの輝度レベル(例えば、刺激レベルなど)について、最高感度の適応レベルおよび最高感度の空間周波数(HVSモデルによる)に応じて、その輝度レベルにおける最小可視コントラストステップを選択する。
【発明の概要】
【発明が解決しようとする課題】
【0008】
200~1000cd/m2またはニトの輝度をサポートするディスプレイは、EDR(または、EDR)に対し、より低いダイナミックレンジ(LDR)(または、スタンダードダイナミックレンジ(SDR)とも呼ばれる)の典型例となる。EDRコンテンツは、より高いダイナミックレンジ(例えば、1000ニト~5000ニト以上)をサポートするEDRディスプレイ上で表示され得る。そのようなディスプレイは、高輝度能力(例えば、0から10,000以上ニト)をサポートする代替的なEOTFを用いて定義され得る。そのようなEOTFの一例が、SMPTE ST 2084:2014およびRec.ITU-R BT.2100, "Image parameter values for high dynamic range television for use in production and international programme exchange" (06/2027)に定義されている。本願発明者によって理解されるように、ハイダイナミックレンジを有し、視覚的アーチファクトを全くまたはほとんど有さないビデオコンテンツを生成するための改善された技術が所望される。
【0009】
本節に記載されている手法は、探求し得る手法ではあるが、必ずしもこれまでに着想または探求されてきた手法ではない。従って、別途示唆のない限り、本節に記載された手法のいずれも、本節に記載されているという理由だけで従来技術としての適格性を有すると考えるべきではない。同様に、別途示唆のない限り、1以上の手法に関して特定される問題が、本節に基づいて、いずれかの先行技術において認識されたことがあると考えるべきではない。
【図面の簡単な説明】
【0010】
添付図面の各図において、本発明のある実施形態を限定する事なく例示する。同様の部材には同様の参照符号が付されている。
【0011】
【
図1】
図1は、ビデオ供給パイプラインのプロセス例を示す。
【0012】
【
図2A】
図2Aは、局所的再構成のためのノイズ除去を適用するためのフロー例を例示する。
【
図2B】
図2Bは、局所的再構成のためのノイズ除去を適用するためのフロー例を例示する。
【
図2C】
図2Cは、局所的再構成のためのノイズ除去を適用するためのフロー例を例示する。
【
図2D】
図2Dは、局所的再構成のためのノイズ除去を適用するためのフロー例を例示する。
【
図2E】
図2Eは、局所的再構成のためのノイズ除去を適用するためのフロー例を例示する。
【
図2F】共起統計量を収集するための操作例を例示する。
【
図2G】
図2Gは、クリッピングおよび量子化操作例を例示する。
【
図2I】
図2Iは、バイナリクラスタマップを得るための処理フロー例を例示する。
【
図2J】
図2Jは、共起統計量を有するノイズ除去再構成関数インデックスマップ例を例示する。
【
図2K】
図2Kは、重みマスクを生成するための処理フロー例を例示する。
【0013】
【
図3A】
図3Aは、共起統計量の共起行列または配列例を例示する。
【
図3B】
図3Bは、標準偏差マップのクリッピングおよび正規化例を例示する。
【0014】
【0015】
【
図5】
図5は、コンピュータまたは本明細書に記載のコンピューティングデバイスが実装され得るハードウエアプラットホーム例の簡略化したブロック図を例示する。
【発明を実施するための形態】
【0016】
以下の説明においては、便宜上、本発明を完全に理解できるように、多数の詳細事項を説明する。ただし、これらの詳細事項が無くても本発明を実施可能であることは明白であろう。他方、本発明の説明を不必要に煩雑にしたり、不明瞭にしたり、難読化したりしないように、周知の構造およびデバイスの細かな詳細までは説明しない。
【0017】
[概要]
本明細書に記載のノイズ除去技術は、SDR画像データなどの比較的狭いダイナミックレンジの画像データを、局所的なコントラストおよび彩度が強調されたHDR画像データなどのより高いダイナミックレンジの画像データに(逆向き)再構成またはアップコンバートする再構成技術とともに実装できる。これらの技術は、得られたHDR画像データにおいて、画質を向上させ、視覚的アーチファクト(SDR画像データにおけるノイズによって誘発される)を防止または低減するのに役立つことが可能である。
【0018】
本明細書において、「アップコンバート」または「(逆向き)再構成」は、局所的または大域的再構成操作などの再構成操作を介して、より低いダイナミックレンジの画像データをより高いダイナミックレンジの画像データに変換することを指す。局所的再構成は、局所的再構成関数インデックスマップに従って、入力画像の異なる画素に異なる再構成関数またはマッピングを適用するアップコンバージョンまたは逆向き再構成操作を指す。したがって、局所的再構成において、局所的再構成関数インデックスマップにおいて特定され、かつ、入力画像の第1の画素に適用される第1の再構成関数は、同じ局所的再構成関数インデックスマップにおいて特定され、かつ、入力画像の第2の異なる画素に適用される第2の再構成関数とは異なる関数であり得る。
【0019】
局所的再構成関数インデックスマップは、特定の再構成関数またはマッピングを識別するために使用される(例えば、2次元配列などの)インデックス値を含む。インデックス値は、入力SDR画像に対して行われた(エッジ保存、境界保存などの)空間フィルタリングから計算された(局所的な)L1-mid値を含み得るが、必ずしもこれらのみに限定されない。
【0020】
例示的な局所的再構成操作および局所的再構成関数インデックスマップ(例えば、L1-mid値等を含む)は、2021年10月1日付け出願のPCT出願第PCT/US2021/053241号に記載されており、その内容全体は、本明細書に完全に記載されているかのように本明細書において援用される。大域的操作例は、2015年3月20日付け出願の米国仮特許出願第62/136,402号(また、2018年1月18日付け公開の米国特許出願公開第2018/0020224号)および2019年5月9日付け出願のPCT出願第PCT/US2019/031620号に記載されており、それらの内容全体は、本明細書に完全に記載されているかのように本明細書において援用される。
【0021】
局所的再構成操作などの再構成操作は、ダイナミックレンジ(画像部分から画像全体までにおける最も暗いものから最も明るいものまで)、局所的コントラストまたは大域的コントラスト、局所的または大域的彩度などに関して、画像コンテンツにおける視覚的品質を高めるためにSDR-HDRアップコンバージョンにおいて使用され得る。
【0022】
しかし、フィルムグレインノイズ、カメラノイズなどのノイズが元のまたは入力SDR画像に存在し得る。加えて、ビデオ圧縮などの画像処理/符号化操作からもノイズが導入され得る。これらのノイズは、入力SDR画像を再構成するステップから生成されたHDR画像に導入され、かつ、当該HDR画像においてさらに強調または拡大されて、視覚的に目立つ視覚的アーチファクトになり得る。そのような視覚的アーチファクトは、大画面画像ディスプレイ上において特に問題になり得る。なぜなら、人間の視覚システム(HVS)は、大画面画像ディスプレイ上では、モバイルデバイスなどの小さな画面の画像ディスプレイと比較して、より多くかつより詳細なディテールを解像できるからである。
【0023】
本明細書に記載の技術は、共起フィルタリングを用いて再構成関数インデックスマップをノイズ除去するために実装できる。次に、その結果のノイズ除去された再構成関数インデックスマップは、SDR画像コンテンツなどの入力画像コンテンツに対して局所的再構成操作などの再構成操作を行うために使用され、ノイズの原因となる視覚的アーチファクトを比較的含まないHDR画像コンテンツなどの比較的高品質な画像コンテンツを生成できる。HDR画像コンテンツは、大画面画像ディスプレイを含むがこれに限定されない様々なHDR画像ディスプレイ上でレンダリングできる。
【0024】
本明細書に記載の例示的な実施形態は、第1のダイナミックレンジの画像を第1のダイナミックレンジよりも低い第2のダイナミックレンジの入力画像から生成することに関する。第2のダイナミックレンジの入力画像に関連した共起統計量の第1の配列が生成される。複数の再構成関数候補の中から再構成関数を選択するための再構成関数インデックス値の第2の配列が生成される。第1のダイナミックレンジの再構成画像を生成するために、共起統計量の第1の配列に少なくとも部分的に基づいてノイズ除去操作が行われる一方、再構成関数のインデックス値の第2の配列に少なくとも部分的に基づいて再構成操作が行われる。
【0025】
[ビデオ供給処理パイプライン例]
図1は、ビデオキャプチャ/生成からHDRまたはSDRディスプレイまでの様々な段階を示すビデオ供給パイプライン(100)のプロセス例を図示する。HDRディスプレイの例は、TV、モバイルデバイス、ホームシアターなどとともに動作する画像ディスプレイを含み得るが、それらに限定されない。SDRディスプレイの例は、SDR TV、モバイルデバイス、ホームシアターディスプレイ、ヘッドマウントディスプレイデバイス、ウェアラブルディスプレイデバイスなどを含み得るが、それらに限定されない。なお、再構成ノイズ除去は、エンコーダ/サーバ側(ビデオ圧縮前)またはデコーダ/再生側(ビデオ展開後)のいずれにおいても行うことができる。再生側再構成ノイズ除去をサポートするために、
図1に図示したものとは異なるシステム構成が使用されてもよい。
図1に図示される処理コンポーネントによって使用されるものとは異なる画像メタデータフォーマットを用いて、これらの異なるシステム構成において画像メタデータを伝送してもよい。例示のみを目的として、
図1を用いて、ノイズ除去された局所的再構成関数インデックスマップなどのノイズ除去された再構成関数インデックスマップを生成するためにサーバ側で行われる再構成ノイズ除去処理を例示または図示する。
【0026】
1シーケンスの連続した入力SDR画像102などのビデオフレームは、SDR-HDRアップコンバート115またはその中のノイズ除去ブロック105によって受信され得る。これらのSDR画像(102)は、ビデオソースから受信されるか、または、ビデオデータストアから取り込まれ得る。SDR画像(102)の一部またはすべては、例えば、(人間の入力を伴わない自動の、手動の、人間の入力を伴う自動の手段等によって)ビデオ編集または変換操作、カラーグレーディング操作などを介して、ソース画像から生成され得る。ソース画像は、デジタル的にキャプチャされるか(例えば、デジタルカメラなどによって)、フィルム上にキャプチャされたアナログカメラ画像をデジタルフォーマットに変換されるか、(例えば、コンピュータアニメーション、画像レンダリングなどを用いて)コンピュータによって生成され得る。SDR画像(102)は、映画リリース、アーカイブされたメディア番組、メディア番組ライブラリ、ビデオ録画/クリップ、メディア番組、テレビ番組、ユーザ生成ビデオコンテンツなどのうちの1つ以上に関する画像であり得る。付加として、オプションとして、または代替として、いくつかの操作シナリオにおいて、SDR画像(102)は、元の再構成される前のHDR画像または元の構成される前のSDR画像などのソース画像を前向き再構成することによって生成された再構成SDR画像であり得る。
【0027】
ノイズ除去ブロック(105)は、連続するSDR画像(102)のシーケンス内の各SDR画像に関してノイズ除去操作を行う。例えば、ノイズ除去ブロック(105)は、SDR画像(102)と同じ視覚的意味のコンテンツを描写するが、SDR画像(102)と比較して、より高いダイナミックレンジ、より鮮やかな色、より少ないノイズ、より少ない視認可能な視覚的アーチファクト等を有する、1シーケンスの対応する連続する(再構成された)HDR画像のうちのそれぞれの(再構成された)HDR画像を生成するために、連続するSDR画像(102)のシーケンス内の各SDR画像にノイズ除去された局所的再構成操作を適用するために使用されるノイズ除去された局所的再構成関数インデックスマップを生成し得る。
【0028】
SDR画像(102)の一部またはすべておよび/または対応するノイズ除去された局所的再構成関数インデックスマップは、SDR-HDRアップコンバージョンブロック(115)によって使用され、逆向き再構成マッピング(例えば、BLUT、逆向き再構成関数/曲線または多項式集合、MMR係数など)を生成できる。逆向き再構成マッピングは、入力SDR画像(102)に適用された際に、対応するHDR画像107を生成する。
【0029】
HDR画像(107)は、HDRビデオエンコーダ120によって、ビデオ信号122(例えば、符号化ビットストリームなど)または1セットの連続するビデオセグメント内に符号化され得る。ビデオ信号(122)が与えられると、携帯電話などの受信側デバイスは、受信側デバイスの表示能力内で、SDR画像データとともにメタデータを用いて、HDRなどのダイナミックレンジがより高く、色がより鮮やかで、ノイズがより少なく、視覚的アーチファクトがより少ないなどの画像を生成およびレンダリングすることを、デバイス上におけるビデオ信号(122)の内部処理または後処理の一部として、決定できる。
【0030】
ビデオ信号またはビデオセグメントの例としては、シングルレイヤビデオ信号/セグメントなどが含まれ得るが、必ずしもこれらに限定されない。いくつかの実施形態において、HDRビデオエンコーダ(120)は、ビデオ信号(122)またはビデオセグメントを生成するために、ATSC、DVB、DVD、Blu-Ray、および他の供給フォーマットによって定義されるものなどのオーディオエンコーダおよびビデオエンコーダを含み得る。
【0031】
次に、ビデオ信号(122)またはビデオセグメントは、モバイルデバイス、タブレットコンピュータ、復号および再生デバイス、メディアソースデバイス、メディアストリーミングクライアントデバイス、テレビ受像機(例えば、スマートテレビ、大画面テレビ、壁掛けテレビなど)、セットトップボックス、映画館などの受信機にダウンストリーム供給される。
【0032】
いくつかの操作シナリオにおいて、一旦HDR画像がノイズ除去局所的再構成を介して生成されると、ビデオエンコーダは、ビデオ信号の(例えば、ベースレイヤなど)におけるSDR画像を符号化する代わりに、ビデオ信号の(例えば、ベースレイヤなど)におけるHDR画像または局所的に再構成されたHDR画像から導出されたあるバージョンのHDR画像を符号化できる。そのようなビデオ信号から復号化されたHDR画像は、HDRディスプレイ上で直接視聴可能であり得る。
【0033】
[局所的再構成のためのノイズ除去]
図2Aは、入力SDR画像から対応するHDR画像を生成するために、ノイズ除去された再構成関数インデックスマップを用いて局所的再構成操作(例えば、212など)を適用するための第1のフロー例を例示する。画像処理システム、その中の処理ブロック(例えば、
図1の105など)は、このプロセスフローを実装または行い得る。いくつかの操作シナリオにおいて、入力SDR画像202が与えられると、大域的再構成HDR画像が生成するために大域的再構成関数204が選択される。大域的再構成HDR画像は、入力SDR画像(202)から局所的再構成操作(212)によって生成される出力HDR画像214に対するHDRの主な見え方(look)を決定または表現するために使用される。
【0034】
いくつかの操作シナリオにおいて、SDR画像からHDR画像を生成するために使用される(逆向き)再構成関数は、再構成関数インデックス値によって特定され得る。非限定的な例において、再構成関数インデックス値は、L1-mid値を用いて特定され得る。L1-mid値などの再構成関数インデックス値の例は、前述の米国仮特許出願第63/086,699に記載されている。
【0035】
入力SDR画像(202)からHDR画像(214)を生成するために、画素単位レベルまでのノイズ除去操作と組み合わせて局所的再構成演算を適用する目的は、HDR画像(214)の局所領域の局所的な明るさレベルを変化させることなく、かつ、入力SDR画像(202)内に存在するノイズに由来する可視アーチファクトを有することなく、HDR画像(214)のその局所領域における局所的なコントラスト比を高めるとともに、ノイズ除去操作と組み合わせた局所的再構成操作から生成されたHDR画像(214)において大域的な再構成関数(204)から生成された大域的再構成HDR画像の同じ主なHDRの見え方を維持することである。
【0036】
視覚オブジェクト/キャラクタのエッジ/境界に隣接して変化する局所的な明るさレベルから生成され得る、ハロ(halo)アーチファクトなどの一般的なアーチファクトを防止または低減することを助けるように、マルチレベルエッジ保存フィルタリング206などの高精度フィルタリングを入力SDR画像(202)に適用して、フィルタリングされた画像にし得る。フィルタリングされた画像は、入力SDR画像(202)の異なる局所領域(画素単位の精度まで、または各画素周辺の局所領域まで)における局所的な明るさレベル(または局所領域固有の明るさレベル)を導出または推定するために使用され得る。入力SDR画像(202)の異なる局所領域(画素単位の精度まで、または各画素周辺の局所領域まで)における推定された局所的な明るさレベルは、HDR画像(214)内の局所的なL1-mid値(画素単位の精度まで、または各画素周辺の局所領域まで)などの局所的再構成関数インデックス値を推定または予測するために使用され得る。L1-mid値などの再構成関数インデックス値の予測の例は、前述の米国仮特許出願第63/086,699に記載されている。
【0037】
局所的再構成操作の効率または応答時間を改善するために、1ファミリの局所的再構成関数208を、システム起動期間中に、本明細書に記載の画像処理システムにおいてロードまたは構築(例えば、最初に、予めなど)してもよい。局所的再構成関数(208)のファミリのロードまたは構築は、1シーケンスの連続する入力SDR画像のうちの各入力画像(例えば、202など)に対してノイズ除去操作と組み合わせた局所的再構成操作を適用して、1シーケンスの対応する連続する出力HDR画像のうちの対応するHDR画像(例えば、214など)にすることを、局所的再構成関数(208)のファミリに少なくとも部分的に基づいて行う前に、行われ得る。局所的再構成関数(208)のファミリは、大域的再構成関数(204)を選択するために使用される複数の基本再構成関数から、例えば、外挿および/または補間を介して、生成され得るが、これに限定されない。局所的再構成関数(208)のファミリのうちの各局所的再構成関数は、大域的再構成関数(204)または大域的再構成関数(204)が選択される複数の基本再構成関数のうちの各基本再構成関数の場合と同様に、L1-mid値などの各再構成関数インデックス値を全体的または部分的に用いて、インデックス付けまたは識別され得る。
【0038】
上記のように、入力SDR画像(202)にマルチレベルエッジ保存フィルタリング(206)を適用することによって生成されたフィルタリングされた画像は、局所的な明るさレベルを生成または推定するために使用され得る。局所的な明るさレベルは、局所的再構成関数インデックス値を生成または予測するための予測モデルにおいて、大域的再構成関数と組み合わせて、または、大域的再構成関数を参照して、使用され得る。これらの局所的再構成関数インデックス値は、(ノイズ除去される前の)局所的再構成関数インデックスマップ210のインデックスを形成する。
【0039】
本明細書に記載の技術において、(ノイズ除去される前の)局所的再構成関数インデックスマップ(210)を用いて局所的再構成関数(208)のファミリ内の画素固有の局所的再構成関数を参照する代わりに、インデックスマップ(210)がノイズ除去ブロック(「提案されたノイズ除去モジュール」と表記する)252によって最初にノイズ除去されて、ノイズ除去された局所的再構成関数インデックスマップ254を生成する。
【0040】
ノイズ除去された局所的再構成関数インデックスマップ(254)内でインデックス(または、その値)によって参照された画素固有の局所的再構成関数は、局所的再構成操作(212)によって画素単位で入力SDR画像(202)に適用されて、ルーマチャネルおよびクロマチャネルにおけるSDRコードワードを逆向き再構成して、ルーマチャネルおよびクロマチャネルにおけるHDR画像(214)の再構成されたHDRコードワードにし得る。微調整された(画素単位の精度まで)非線形関数の形態のこれらの画素固有の局所的再構成関数のそれぞれは、HDR画像(214)において局所的なコントラストおよび/または彩度を高めるために使用され得る。
【0041】
ノイズ除去ブロック(252)は、ノイズ除去された局所再構成関数インデックスマップ(254)から再構成関数インデックスマップ(210)のノイズを低減または除去することによって、入力SDR画像(202)に由来するノイズの増大を回避する。
【0042】
図2Aに例示されるように、ノイズ除去ブロック(252)は、共起統計量を収集するための第1の処理ブロック256を含む。第1の処理ブロック(256)は、入力SDR画像(202)および(ノイズ除去される前の)再構成関数インデックスマップ(210)を入力として受け取り、入力SDR画像(202)からの画素の共起統計量および入力SDR画像(202)の背景エリアおよびテクスチャエリアを表すバイナリクラスタマップ内の画素の共起統計量を収集する。バイナリクラスタマップおよびバイナリクラスタマスクという用語は、いずれもバイナリクラスタマップと通常呼ばれるものを指す同義語として使用される。
【0043】
ノイズ除去ブロック(252)は、再構成関数インデックスマップをノイズ除去するための第2の処理ブロック258を含む。第2の処理ブロック(258)は、第1の処理ブロック(256)から2つの共起統計量を入力として受け取り、2つの共起統計量の組み合わせを用いて、(ノイズ除去される前の)再構成関数インデックスマップ(210)をノイズ除去された再構成関数インデックスマップ(254)に平滑化する。次に、ノイズ除去された再構成関数インデックスマップ(254)は、局所再構成操作(212)において用いて、SDR-HDR局所再構成を行い、HDR画像(214)を生成し得る。ノイズ除去ブロック(252)の第2の処理ブロック(258)によって行われる平滑化は、HDR画像(214)のノイズを低減する役割を有する。付加として、オプションとして、または代替的として、HDR画像(214)における非ノイズ画像コンテンツを過度に平滑化することによって生じ得るHDR画像(214)における非ノイズ画像コンテンツの強調の意図しない低減を回避するために、重みマスクが標準偏差マップから得られ、平滑化操作において適用され得る。
【0044】
図2Bは、入力SDR画像から導出されるノイズ除去されたSDR画像から、対応するHDR画像を生成するために局所的再構成操作(例えば、212など)を適用するための第2のフロー例を例示する。画像処理システム、その中の処理ブロック(例えば、
図1の105など)は、このプロセスフローを実装または行い得る。いくつかの操作シナリオにおいて、入力SDR画像202が与えられると、ノイズ除去ブロック260が入力SDR画像(202)に対してノイズ除去操作を行うことによって、ノイズ除去されたSDR画像262が導出される。ノイズ除去されたSDR画像(262)を入力として用いて、ノイズ除去されたSDR画像(262)に対して大域的再構成を行うステップから大域的再構成HDR画像を生成するために、大域的再構成関数204が選択される。大域的再構成HDR画像は、入力SDR画像(202)から局所的再構成演算(212)によって生成されるべき出力HDR画像214の主なHDRの見え方を決定または表現するために使用される。
【0045】
視覚オブジェクト/キャラクタのエッジ/境界に隣接して変化する局所的な明るさレベルから生成され得るハロ(halo)アーチファクトなどの一般的なアーチファクトを防止または低減することを助けるように、マルチレベルエッジ保存フィルタリング206などの高精度フィルタリングをノイズ除去されたSDR画像(262)に適用して、フィルタリングされた画像にし得る。フィルタリングされた画像は、入力SDR画像(202)の異なる局所領域(画素単位の精度まで、または各画素周辺の局所領域まで)における局所的な明るさレベル(または、局所領域固有の明るさレベル)を導出または推定するために使用され得る。ノイズ除去されたSDR画像(262)の異なる局所領域(画素単位の精度まで、または各画素周辺の局所領域まで)における推定された局所的な明るさレベルは、HDR画像(214)における局所的なL1-mid値(画素単位の精度まで、または各画素周辺の局所領域まで)などの局所的再構成関数インデックス値を推定または予測するために使用され得る。これらの局所的再構成関数インデックス値は、局所的再構成関数インデックスマップ210のインデックスを形成する。
【0046】
局所的再構成関数インデックスマップ(210)内のインデックス(または、その値)によって参照された画素固有の局所的再構成関数は、局所的再構成操作(212)によって画素単位で入力SDR画像(202)に適用されて、ルーマチャネルおよびクロマチャネルにおける入力SDRコードワードを逆向き再構成して、ルーマチャネルおよびクロマチャネルにおけるHDR画像(214)の再構成されたHDRコードワードにし得る。微調整された(画素単位の精度まで)非線形関数の形態のこれらの画素固有の局所的再構成関数のそれぞれは、HDR画像(214)において局所的なコントラストおよび/または彩度を高めるために使用され得る。
【0047】
ノイズ除去ブロック(260)は、ノイズ除去されたSDR画像(262)から入力SDR画像(202)のノイズを低減または除去することによって、入力SDR画像(202)に由来するノイズの増大を回避する。付加として、オプションとして、または代替的として、非ノイズ画像コンテンツの平滑化を回避するために、入力SDR画像(202)において、ノイズの影響を受けた画像コンテンツのみにおいて、または、空間領域(ハイライト領域や明るい領域など)において、低減またはノイズ除去を制限するようにマスクが設計され得る。
【0048】
付加として、オプションとして、または代替として、
図2Bに示されるように入力SDR画像(202)に対して局所的再構成操作(212)を適用する代わりに、
図2Cに例示されるように、ノイズ除去操作を伴う局所的再構成操作(例えば、212など)を適用するための第3のフロー例において、局所的再構成関数インデックスマップ(210)においてインデックス(または、その値)によって参照された画素固有の局所的再構成関数が、局所的再構成操作(212)によって画素単位でノイズ除去されたSDR画像(262)に適用され、ノイズ除去されたSDR画像(262)のルーマチャネルおよびクロマチャネルにおけるノイズ除去されたSDRコードワードを逆向きに再構成して、ルーマチャネルおよびクロマチャネルにおけるHDR画像(214)の再構成されたHDRコードワードにし得る。
【0049】
図2Dは、
図2Bまたは
図2Cのノイズ除去ブロック(260)を用いて行われる操作例を例示する。図示されるように、ノイズ除去ブロック(260)は、共起統計量を収集するための第1の処理ブロック266を含む。第1の処理ブロック(266)は、入力として入力SDR画像(202)を受け取り、入力SDR画像(202)から画素の共起統計量を収集する。ノイズ除去ブロック(260)は、入力SDR画像をノイズ除去するための第2の処理ブロック268を含む。第2の処理ブロック(268)は、第1の処理ブロック(266)から共起統計量を入力として受け取り、共起統計量を用いて、入力SDR画像(202)を平滑化して、ノイズ除去されたSDR画像(262)にする。次に、ノイズ除去されたSDR画像(262)は、SDR-HDR局所的再構成などの後の処理において使用されて、HDR画像(214)を生成し得る。ノイズ除去ブロック(260)の第2の処理ブロック(268)によって行われる平滑化は、HDR画像(214)においてノイズを低減する役割を有する。付加として、オプションとして、または代替的として、HDR画像(214)における非ノイズ画像コンテンツを過度に平滑化することによって生じ得るHDR画像(214)における非ノイズ画像コンテンツの強調の意図しない低減を回避するために、重みマスクが標準偏差マップから取得され、平滑化操作において適用され得る。
【0050】
図2Eは、入力SDR画像から対応するHDR画像を生成するために、ノイズ除去演算と組み合わせて局所的再構成操作(例えば、212など)を適用するための第4のフロー例を例示する。第1のフロー例について
図2Aに例示した処理ブロックに加えて、この第4のフロー例においては、入力SDR画像(262)に対してノイズ除去操作を行ってノイズ除去されたSDR画像を生成するために、ノイズ除去ブロック(260)が追加される。さらに、
図2Aに示したように入力SDR画像(202)に対して局所的再構成演算(212)を適用する代わりに、
図2Eに例示するこの第4のフロー例においては、局所再構成関数インデックスマップ(210)内のインデックス(または、その値)によって参照された画素固有の局所再構成関数が、局所再構成演算(212)によって画素単位でノイズ除去されたSDR画像(262)に適用され、ノイズ除去されたSDR画像(262)のルーマチャネルおよびクロマチャネルにおけるノイズ除去されたSDRコードワードを逆向きに再構成して、ルーマチャネルおよびクロマチャネルにおけるHDR画像(214)の再構成されたHDRコードワードにし得る。第4の例において、入力SDR画像(202)のノイズ除去および(ノイズ除去される前の)再構成関数マップインデックス(210)のノイズ除去の両方を用いて、比較的強力なノイズ除去を達成することができる。
【0051】
[共起統計量の収集]
いくつかの操作シナリオにおいて、画像平滑化操作は、共起フィルタまたは共起フィルタリング(CoF)を用いて行うことができる。CoFを用いた画像平滑化には、共起統計量を収集し、CoFを用いて画像を平滑化することを含む。CoFを用いたノイズ除去の例は、Jevnisek, Roy J., and Shai, Avidan, “Co-occurrence filter, ”Proceedings of the IEEE Conference on Computer Vision and Pattern Recognition, pp.3184-3192 (2017)に見出すことができる。その全体を本明細書において援用する。
【0052】
単一チャネルの画像Iが与えられると、画素値aおよびbの共起統計量C(a,b)を以下から得ることができる。
【数1】
ここで、pおよびqは、I中においてそれぞれ画素値aおよびbを有する2つの画素の位置を表し、[・]は、内側に囲まれている当該式が真の場合に1に等しく、当該式が偽の場合に0に等しく、σは、標準偏差を表し、d(p,q)は、pおよびq間のユークリッド距離を表す。p=(i,j),q=(v,w)の場合、そのユークリッド距離は、以下によって与えられ得る。
【数2】
ここで、iおよびjは、それぞれ画素配列または画像フレームにおける画素位置pの行と列を表し、vおよびwは、それぞれ当該画素配列または画像フレームにおける画素位置qの行と列を表す。
【0053】
共起行列Mの行列要素は、以下のように、それぞれが同じ画素値aおよびbの対を表す画素対の共起統計量を格納するために用いられ得る。
【数3】
ここで、h(a)は、画像において値aを有する画素の数をカウントするものであり、したがって、h(a)=Σ
p[Ip=a]である。共起行列Mの大きさは、
【数4】
であり、ここで、B
Sは、入力画像Iのビット深度であり、画像Iが表される色空間の、単一チャネルにおけるすべての可能なコードワードを含むコードワード空間のビット深度を表す。
【0054】
共起行列Mを用いて、以下のように、サイズがH×Wである入力画像Iを平滑化して、(出力、平滑化)画像Jを得ることができる。
【数5】
ここで、N(p)は、(例えば、矩形状などの)ウィンドウまたは画素近傍における画素位置pの近傍画素位置を表す。ウィンドウは、
【数6】
と表すことができる。ここで、k
sは、ウィンドウまたは画素近傍の半ウィンドウサイズを示す。上記式(3)において、
【数7】
であり、ここで、σ
sは、標準偏差を表す。
【0055】
あくまで例示であるが、フル高詳細またはHD(1920×1080)の入力画像Iに対して、例示的な標準偏差は、σs=10であり、および例示的な半ウィンドウサイズは、ks=ceil(σs)=10であり得る。同じコンテンツであるが異なる大きさを有する入力画像に対して、標準偏差は、画像サイズに比例するように設定され得る。
【0056】
共起フィルタリングは、下記の表1におけるバイラテラルフィルタリングと比較可能である。バイラテラルフィルタリングにおいて、
【数8】
という項は、pおよびqにおける画素が共に平滑化されるべきかどうかを決定または制御(例えば、フィルタリング強度など)し、フィルタリングされた画像内の急峻なエッジを保存するために使用される。比較として、共起フィルタリングは、同じガウシアン項
【数9】
を共通にし、かつ、共起統計量M(I
p,I
q)を用いて、pおよびqにおける画素が共に平滑化されるべきかどうかを決定または制御(例えば、フィルタリング強度など)する。バイラテラルフィルタリングとは異なり、共起フィルタリングは、比較的頻繁に共起する異なる画素値を用いて画素を平滑化できる。
【表1】
【0057】
スライディングウィンドウを用いて共起統計量を計算または収集するための手順例を下記の表2に例示する。
【表2】
【0058】
CoFを用いて入力画像を平滑化するための手順例を以下の表3に例示する。入力画像の境界は、平滑化画像において比較的良く保存され、比較的頻度の高い共起画素値は、比較的強く平滑化され得る。
【表3】
【0059】
図2Fは、本明細書に記載のノイズ除去操作のための共起統計量を収集するための操作例を例示する。図示するように、処理ブロック270の第1のインスタンスは、入力SDR画像202を受け取り、入力SDR画像(202)内の画素の共起統計量を収集/取得し得る。入力SDR画像(202)内の画素の共起統計量は、M
1と表記される第1の共起行列内に格納または収集され得る。
【0060】
付加として、オプションとして、または代替として、処理ブロック272は、再構成関数インデックスマップ210を受け取り、再構成関数インデックスマップ(210)からバイナリクラスタマップを生成または取得し得る。バイナリクラスタマップは、再構成関数インデックスマップ(210)を背景エリアおよびテクスチャエリア、入力SDR画像(202)内の画素の共起統計量に区分け、仕切り、または分割する。処理ブロック(270)の第2のインスタンスは、バイナルクラスタマップのクラスタの共起統計量を収集/取得する。バイナリクラスタマップのクラスタの共起統計量は、M2と表記される第2の共起行列内に格納または収集され得る。
【0061】
いくつかの操作シナリオにおいて、入力SDR画像(例えば、
図2Aから
図2Cおよび
図2Eの202など)の共起統計量が収集され、そして対応する再構成関数インデックスマップ内の画素位置の画素値またはインデックス値を平滑化すべきかどうか、および、どのように平滑化すべきかを決定または制御(例えば、フィルタリング強度など)するために使用され得る。比較として、再構成関数インデックスマップの共起統計量は、収集されなくてもよく、かつ、対応する再構成関数インデックスマップ内の画素位置の画素値またはインデックス値を平滑化すべきかどうか、および、どのように平滑化すべきかを決定または制御(例えば、フィルタリング強度など)するために使用されなくてもよい。これは、再構成関数インデックスマップの画素位置における類似の画素値またはインデックス値が、入力SDR画像の同じ画素位置における非常に異なる画素値に対応可能であるためである。したがって、画素値またはインデックス値の共起統計量は、再構成関数インデックスマップ内の画素位置の画素値またはインデックス値が平滑化されるべきかどうか、およびどのように平滑化されるべきかを決定または制御(例えば、フィルタリング強度など)するには不正確であり得る。
【0062】
例示のみを目的として、入力(例えば、YCbCr、SDRなど)画像は、入力画像が表現される色空間の各チャンネルにおけるビット深度が8である画像であり得る。(例えば、YCbCr、RGBなどの)色空間などの3チャンネル色空間の各チャンネルにおけるビット深度が8であるコードワード空間における可能な値の総数は、2563×2563であるので、すべての画素値対に対する共起行列Mのサイズまたは大きさ(dimensions)は、2563×2563になる。このサイズは、メモリ消費と計算コストが比較的高いため、実際には大きすぎて使用できないことがあり得る。また、特定の画素値対(a,b)に対して、比較的高い信頼度で(a,b)の共起統計量を取得または収集するには十分な数の画素が存在しないことがあり得る。
【0063】
いくつかの操作シナリオにおいて、各画素値対に対して比較的低いメモリ使用量、比較的高い計算効率、および比較的十分な数の画素を確保することを助けるように、チャネルあたり8ビットの入力画像が量子化され得る。次に、量子化された入力画像は、共起統計量を収集するために使用され得る。
【0064】
入力画像を量子化する可能な方法は、入力画像内の画素値間でK平均ベースのクラスタリングを適用することであり得る。しかし、この方法ではまだ時間がかかり得る。
【0065】
いくつかの操作シナリオにおいて、K平均よりも計算効果または効率の高い量子化方法が適用または実装され得る。
図2Gに例示されるように、Sと表示される入力画像のルーマまたはYチャネルコードワードを含む単一チャネル画像S
Yがクリップまたは量子化され得る。例えば、単一チャネル画像S
Y(後で詳述するように、レターボックスにおけるレターボックス画素を除く)のルーマまたはYチャネルコードワードの5パーセンタイルおよび95パーセンタイル(aおよびbと表記する)が単一チャネル画像S
Yに対して識別され得る。本明細書において使用されるように、「レターボックス」という用語は、矩形、レターボックス、ピラーボックス、卵形、または他の形状などの任意の形状のパディングされた暗色、単色、着色、もしくは白色のエリア、またはレターボックス、ピラーボックス、卵形、またはその他の形状などの任意の形状の非アクティブ(静的)領域のうちの1つ以上を指し得る。単一チャネル画像S
Yの画素値(または、ルマ/Yコードワード)は、以下のように、これらのパーセンタイルaおよびbを下限および上限として用いてクリップされ、S
Ycとして表記されるクリップ化単一チャネル画像を取得し得る。
【数10】
【0066】
クリップされた単一チャンネル画像S
Ycは、以下のように、さらにnBins=8個の均一な区間に量子化され、S
Qと表記される量子化クリップ化単一チャンネル画像を生成することができる。
【数11】
ここで、正則化項(または、eps)ε=10
-4は、ゼロ(0)による除算を防ぐために使用される。区間の数nBinsは、比較的速い処理速度および比較的高いノイズ除去品質の両方を確保するために選択または設定する(例えば、8、異なる数など)ことができる。区間の数がより少ないと、処理が速くなり得るが、画像内の(例えば、比較的小さいなどの)エッジをぼけさせる可能性がより高くなり得る。
【0067】
クリップ化単一チャネル画像S
Ycから量子化クリップ化単一チャネル画像S
Qを得た後、S
Qから共起統計量が収集され得る。いくつかの操作シナリオにおいて、関心領域マップP(例えば、レターボックス確率マップ、周辺エリア確率マップなどを補完する)を用いて、入力画像内に存在し得る任意のレターボックスエリア内の画素の影響を除外し得る。レターボックス確率マップまたは周辺エリア確率マップの例は、T-W HuangおよびG-M Suによる2021年6月11日付け出願の米国仮特許出願シリアル第63/209,602号に見出すことができ、その内容全体は、本明細書に完全に記載されているかのように本明細書において援用される。したがって、式(1)および式(2)は、以下のように、関心領域マップPを用いて変更または調節され得る。
【数12】
【0068】
nBinsに対応する量子化レベルが8であるため、共起行列M1は、8×8のサイズを有する。上記のように、フルHD(1920×1080)の入力画像に対して、σは、例えば10の値となるように選択または設定され得、かつ、半ウィンドウサイズkは、例えば10の値となるように選択または設定され得る。異なる入力画像サイズに対して、σおよびkは、画像サイズに比例するか、または画像サイズとともにスケール化するように選択または設定できる。
【0069】
いくつかの操作シナリオにおいて、
図2Hに例示されるように、量子化画像S
Qは、共起統計量の収集を加速するためにダウンサンプリングされ得る。例えば、サイズH×Wの量子化画像S
Qは、各行および各列におけるD画素(または、ダウンサンプリング係数)毎に1画素を選択することによってダウンサンプリングされ、その結果、サイズ
【数13】
のダウンサンプリング画像S
Qdが得られ得る。非限定的な例において、ダウンサンプリング係数 D=4は、共起を収集すること、および、共起統計量における歪みを回避することを加速するために選択または設定され得る。関心領域マップPは、ダウンサンプリングレターボックス確率P
d(または、対応するダウンサンプリングされた相補的周辺エリア確率マップ)を得るために、同じダウンサンプリング係数を用いて同様にダウンサンプリングされ得る。共起行列M
1は、以下のように共起統計量を格納するために得られ得る。
【数14】
ここで、
【数15】
は、ダウンサンプリングされた画像S
Qd内の値aの画素の総数を計算またはカウントするものである。ダウンサンプリングされた画像を用いて、標準偏差および半ウィンドウサイズが、
【数16】
となるようにダウンサンプリングされ得る。いくつかの操作シナリオにおいて、実際に比較的速い速度を達成するために、画像ダウンサンプリングを最初に単一チャネル画像S
Yに適用し、次に画素値量子化を行って、S
Qdを得ることができる。
【0070】
図3Aは、入力画像から生成された量子化ダウンサンプリングされた単一チャネル画像から計算されたサイズ8×8の共起行列M
1の例を例示する。図示されるように、行列の対角線に沿った、または、対角線に近い要素は、同じような画素値間の比較的強い共起を示す比較的大きな値である一方、行列の対角線から外れた、または、対角線から離れた要素は、比較的大きな差の画素値間の比較的弱い共起を示す比較的小さな値である。
【0071】
いくつかの操作シナリオにおいて、共起統計量は、再構成関数インデックスマップ内のテクスチャエリアにおける共起統計量が比較的大きくあり得る場合でも、入力画像のテクスチャエリアにおける平滑化を防止または低減するために、または、入力画像の背景エリア内の平滑化を制限または限定することを助けるように、再構成関数インデックスマップ内で識別されたクラスタから収集され得る。再構成関数インデックスマップは、背景エリアに対するクラスタとテクスチャエリアに対するクラスタとの2つのクラスタを有するバイナリマップKに仕切られるか、または、分割され得る。バイナリマップKは、背景エリア内の画素に対して行われるべき平滑化操作を制限または限定することを助けるように使用できるが、但し入力画像のこれらの背景エリアからの共起統計量が比較的大きいことを条件とする。一方、バイナリマップKは、入力画像のこれらのテクスチャエリアからの共起統計量がたまたま比較的大きい場合であっても、テクスチャエリア内の画素を用いた平滑化を回避することを助けるように使用できる。付加として、オプションとして、または代替として、後でさらに詳述するように、重みマスクをさらに用いて、入力画像のテクスチャエリアの平滑化を回避できる。
【0072】
背景エリア内の画素値の標準偏差は、テクスチャエリア内の画素値の標準偏差と比較して相対的に小さいので、画素が背景エリアまたはテクスチャエリアのどちらに属するかを決定するために、加重標準偏差フィルタリングからなどの局所的標準偏差が使用され得る。
【0073】
標準偏差マップ(または、stdマップ)は、入力画像に対して標準偏差フィルタを用いて得ることができる。画素の位置が与えられると、当該画素の周りの画素パッチまたは近傍内の画素値は、X={x
1,…,x
N}と表記され得る。ここで、x
iは、i番目の画素値である。パッチXのこれらの画素値の分散Var(X)は、以下のように得ることができる。
【数17】
【0074】
しかし、入力画像内にレターボックスが存在する場合、入力画像内に存在するレターボックスの境界における(局所的な)分散は、比較的大きい可能性がある。加重標準フィルタリングを行って、入力画像の異なる画素位置における局所的分散および/または局所的標準偏差を得てもよい。例えば、パッチXの画素値の局所的分散Var’(X)は、上記式(10)の代わりに、以下のように得ることができる。
【数18】
ここで、各画素値x
iに対する個別の重み付け係数w
i∈[0,1]は、関心領域マップPから得ることができる。加重標準偏差フィルタリングを用いて局所的分散を計算するための手順の例を以下の表4に例示する。
【表4】
【0075】
加重標準偏差フィルタリングの(空間フィルタリング)カーネルサイズが小さいと、エッジなどのより詳細なディテールを有する分散マップまたは標準偏差マップが生じ得る。カーネルサイズが大きいと、よりぼけた分散マップまたは標準偏差マップが生じ得る。
【0076】
図2Iは、再構成関数インデックスマップから導出される標準偏差マップから、バイナリクラスタマップKを得るための処理フロー例を例示する。k
1=3およびk
2=51などの2つの異なるカーネルサイズを有する再構成関数インデックスマップに加重標準偏差フィルタリングを適用して、それぞれstd_map
1およびstd_map
2と表示される2つの標準偏差マップを導出し得る。より小さいカーネルサイズを有する加重標準偏差フィルタリングを用いて、結果として得られる標準偏差マップstd_map
1において再構成関数インデックスマップ内のエッジを検出または保存できる。標準偏差マップstd_map
1に、さらに、σ
bなどの標準偏差(3、4、5などの値を有する)を用いたガウシアンフィルタを適用することによって、ぼけたstd_map
1を生成できる。以下のように、ぼけたstd_map
1と(ぼけてない)std_map
2の両方を、t
1(18、20、22などの値を有する)、t
2(65、70、75、80などの値を有する)を有する閾値と別々に比較(または、閾値処理)して2つのバイナリマップを得ることができる。
【数19】
【0077】
バイナリマップimg
1とimg
2は、以下のように組み合わせるか、または、乗算して、バイナリクラスタマップKを得ることができる。
【数20】
【0078】
画素位置は、当該画素位置がバイナリマップimg1とimg2の両方における背景エリア内にある場合、背景エリア内にあると判定され得る。ぼかしのための閾値、カーネル、標準偏差などに対して使用されるこれらのパラメータは、異なる空間解像度のビデオフレームに対して異なるように経験的に選択できる。
【0079】
第2の共起行列を関心領域マップP(または、対応する周辺エリア確率マップ)と共に用いて、以下のようにバイナリクラスタマップKの共起統計量を生成および格納できる。
【数21】
【0080】
いくつかの操作シナリオにおいて、バイナリクラスタマップKをダウンサンプリングステップからダウンサンプリングバイナリクラスタマップを生成し、ダウンサンプリングバイナリクラスタマップを用いて共起統計量を第2の共起行列M2に収集し得る。
【0081】
バイナリクラスタマップKからの共起統計量の例を以下の表5に例示する。示されているように、背景エリアに対する共起統計量C(1,1)は、比較的大きく、背景エリア内の画素値を平滑化するのに役立つことができる。サイズが2×2である第2の共起行列M
2は、後でさらに詳細に記載するように、再構成関数インデックスマップをノイズ除去するために(第1の)共起行列M
1と組み合わせることができる。
【表5】
【0082】
[共起フィルタリングおよびノイズ除去]
図2Jは、共起統計量を有するノイズ除去された再構成関数インデックスマップ例を例示する。ノイズ除去を背景エリア内に限定することを助け、テクスチャエリア内の局所的再構成ステップからの強調を保存することを助けるように、Lとして表記される(ノイズ除去される前の)再構成関数インデックスマップから重みマスクWが生成または取得される。再構成関数インデックスマップLは、計算される前の共起行列M
1およびM
2を用いて平滑化され、L
dと表記される中間のノイズ除去された再構成関数インデックスマップを生成する。以下のように、L
fと表記される最終的なノイズ除去された再構成関数インデックスマップが、重みマスク内で特定された重み要素(または、重み付け係数)を用いて、(ノイズ除去される前の)再構成関数インデックスマップLと中間のノイズ除去された再構成関数インデックスマップL
dとの加重和として生成され得る。
【数22】
ここで、「.*」と表記される演算子は、当該演算子の前の第1の因数と当該演算子の後の第2の因数との間の画素単位の乗算演算を表す。より具体的には 最終的なノイズ除去された再構成関数インデックスマップL
fの複数の画素位置のうちの特定の画素位置における最終的な再構成関数インデックス値は、(ノイズ除去される前の)再構成関数インデックスマップLの対応する複数の画素位置のうちの特定の画素位置における(ノイズ除去される前の)再構成関数インデックス値と、中間のノイズ除去された再構成関数インデックスマップL
dの対応する複数の画素位置のうちの特定の画素位置における中間の再構成関数インデックス値との、重みマスクWの対応する複数の画素位置のうちの特定の画素位置における重み要素(または、重み付け係数)を用いた加重和である。
【0083】
図2Kは、重みマスクWを生成するための処理フロー例を例示する。再構成関数インデックスマップLのバイナリクラスタマップKから第2の共起行列M
2内に収集された共起統計量は、比較的大きな共起統計値を有し得、重みマスクWを用いずに使用される場合、テクスチャエリア内の画素または画素値が背景エリア内の画素または画素値のように平滑化され、それにより、テクスチャエリア内に描画された画像ディテールの望ましくないぼけを引き起こし、局所的再構成操作による画像ディテールの所望の強調を低減/打ち消しし得る。
【0084】
重みマスクWは、テクスチャエリアにおける画像ディテールまたはその所望の強調を保存するために使用され得る。再構成関数インデックスマップLの(例えば、加重などの)分散または標準偏差マップは、(例えば、加重などの)標準偏差フィルタリングを用いて生成され、ワイトマスクWを得るために使用され得る。テクスチャエリアは、比較的大きな空間周波数視覚コンテンツを有するので、分散または標準偏差マップは、テクスチャエリア内において比較的大きな値を有する。
【0085】
図2Kおよび
図2Iに例示する非限定的な例において、加重標準偏差フィルタリングをk
2=51などのカーネルサイズを有する再構成関数インデックスマップに適用して、標準偏差マップstd_map
2を導出し得る。標準偏差マップstd_map
2は、σ
0=5などの標準偏差のガウシアンフィルタを用いてぼかされ得る。
図3Bに例示されるように、ぼけた標準偏差マップは、下限および上限[l,h]にクリップされ得る。次に、下限および上限[l,h]内のクリップされた値は、[0,1]などの正規化値範囲に正規化されて、(最終的な)重みマスクWを得ることができる。再構成関数インデックス値範囲の例は、値範囲[0,4095]の一部またはすべてであり得る。下限および上限[l,h]は、経験的に選択され、[60,200]、[50,210]、[40,220]などのうちのいずれでもよい。クリッピングおよび正規化演算は、以下のように、ぼけた標準偏差マップ内の各画素に関数f
cnを適用することに相当し得る。
【数23】
【0086】
ぼけた標準偏差マップに対してクリッピングおよび正規化演算を用いて重みマスクWを生成するための手順例を以下の表6に例示する。
【表6】
【0087】
テクスチャエリアに存在する可能性のある画素位置に対して、当該画素位置におけるぼけた標準偏差は、比較的大きい可能性がある。これに対応して、重みマスクW内の当該画素位置に対する重み要素は、相対的に小さくなる可能性があり、かつ、最終的なノイズ除去された再構成関数インデックスマップLf内の当該画素位置に対する最終的な再構成関数インデックス値への寄与は、中間のノイズ除去された再構成関数インデックスマップLdからよりも、元の(ノイズ除去前の)再構成関数インデックスマップLからのほうがより大きい。その結果、元の再構成関数インデックスマップ内で特定された局所的再構成操作からのテクスチャエリアの強化は、そうでない場合よりも、より良好に保存され、かつ、平滑化操作による影響をより受けなくすることができる。
【0088】
図2Jに図示するように、中間のノイズ除去された再構成関数インデックスマップL
dは、(ノイズ除去される前の)再構成関数インデックスマップLを共起行列M
1およびM
2を用いて平滑化することによって生成できる。例として、限定しないが、一例において、以下のように、共起行列M
1およびM
2内の共起値の平均を最終的な共起値とすることができる。
【数24】
【0089】
代替として、平均値の代わりに、
【数25】
の最小値を最終的な共起値とする。この例において、共起行列M
1およびM
2内の共起統計量の両方が比較的大きい場合に、画素対pおよびqが共起フィルタリングを用いて共に平滑化される傾向がある。
【0090】
共起行列M
1およびM
2から組み合わされた最終的な共起値は、以下のように、(ノイズ除去される前の)再構成関数インデックスマップLをノイズ除去するために使用できる。
【数26】
ここで、標準偏差σ
sは、フルHD(1920×1080)の入力画像に対して、10などの例示的な値に設定され得、半ウィンドウサイズk
sは、10などの例示的な値に設定され得る。フルHDでない画像に対しては、標準偏差σ
sは、画像サイズに比例してスケーリングされるように設定され得る。
【0091】
標準偏差σsに対する値が比較的大きいと、フィルタリングされた画像が比較的滑らかにされ得る。背景エリア内におけるノイズ除去の結果は、視覚的に良くなり得るが、テクスチャエリアは、よりぼかされ得る。
【0092】
再構成関数インデックスマップをノイズ除去するための手順例を以下の表7に例示する。
【表7】
【0093】
再構成関数インデックスマップのノイズ除去は、ダウンサンプリングを用いて加速され得る。例えば、再構成関数インデックスマップの行および列内のD
s個の画素(または、ダウンサンプリング係数)毎に1画素が、ノイズ除去操作に関係する計算を実施するために選択または使用され得る。非限定的な例において、出力画像(例えば、
図2Aから2Cおよび
図2Eの214など)の視覚的品質を保存しながら高速処理速度を達成するために、ダウンサンプリング係数D
s=4が選択または設定され得る。画素位置pにおいて、中間の平滑化された、または、(ノイズ除去された)関数インデックスマップL
d内のインデックス値は、以下のように計算され得る。
【数27】
ここで、N
d(p)は、行と列内のD
s個の画素毎に1画素だけが共起フィルタリングのために選択または使用されるような、画素近傍内におけるpの近傍画素位置を表す。一方、ガウシアンフィルタ内の標準偏差σ
sは、ダウンサンプリングを用いない標準偏差と同じままでよく、例えば、σ
s=10などである。
【0094】
ダウンサンプリングを用いて再構成関数インデックスマップをノイズ除去するための手順例を以下の表8に例示する。
【表8】
【0095】
いくつかの操作シナリオにおいて、局所的再構成のためのノイズ除去において線形セグメントベースの構造が使用され得る。線形セグメントベースの構造の例は、H.KaduおよびG-M.Suによる米国特許第10,397,576号、「Reshaping curve optimization in HDR coding」に記載されており、その内容全体は、本明細書に完全に記載されているかのように本明細書において援用される。
【0096】
本明細書において記載の一部またはすべての技術は、放送ビデオアプリケーション、リアルタイムストリーミングアプリケーションなどのためのリアルタイム操作の一部として実装および/または行うことができる。付加として、オプションとして、または代替として、本明細書において記載の一部またはすべての技術は、非リアルタイムストリーミングアプリケーション、映画アプリケーションなどのための時間遅延またはオフライン操作の一部として実装および/または行うことができる。
【0097】
[処理フロー例]
図4は、ある実施形態にかかる、第1のダイナミックレンジの画像を第1のダイナミックレンジよりも低い第2のダイナミックレンジの入力画像から生成するための処理フロー例を例示する。いくつかの実施形態において、このプロセスフローは、1つまたは複数のコンピューティングデバイスまたはコンポーネント(例えば、符号化デバイス/モジュール、トランスコードデバイス/モジュール、復号化デバイス/モジュール、逆トーンマッピングデバイス/モジュール、トーンマッピングデバイス/モジュール、メディアデバイス/モジュール、逆マッピング生成および適用システムなど)によって行われ得る。ブロック402において、画像処理システムは、第2のダイナミックレンジの入力画像に関する共起統計量の第1の配列を生成する。
【0098】
ブロック404において、画像処理システムは、複数の再構成関数候補の中から再構成関数を選択するための再構成関数インデックス値の第2の配列を生成する。
【0099】
ブロック406において、画像処理システムは、(a)共起統計量の第1の配列に少なくとも部分的に基づくノイズ除去操作と、(b)再構成関数インデックス値の第2の配列に少なくとも部分的に基づく再構成操作とを行って、第1のダイナミックレンジの再構成画像を生成する。
【0100】
ある実施形態において、再構成関数インデックス値の第2の配列は、ノイズ除去される前の再構成関数インデックス値の第3の配列にノイズ除去操作が行われることによって生成されたノイズ除去された再構成関数インデックス値の配列である。
【0101】
ある実施形態において、共起統計量の第1の配列は、ノイズ除去される前の再構成関数インデックス値の第3の配列から導出されたバイナリクラスタマスクから収集された共起統計量の第4の配列と、入力画像から導出されたクリップ化量子化画像から収集された共起統計量の第5の配列との組み合わせである。共起統計量の第1の配列が共起統計量の第4の配列と共起統計量の第5の配列との組み合わせであることは、共起統計量の第1の配列が第4の配列と第5の配列とを含むことを意味する。第4の配列および第5の配列は、加算されて1つの配列になるのではない。ある例において、言い換えると、第2のダイナミックレンジの入力画像に対して、まず、ノイズ除去される前の再構成関数インデックスマップ(第3の配列)が計算される。次に、ノイズ除去される前の再構成関数マップ(第3の配列)を用いて、バイナリクラスタマップが計算され、次に、バイナリクラスタマップの共起統計量(第4の配列)が計算される。他方、入力画像は、クリップされ、そして量子化され、共起統計量(第5の配列)が計算される。次に、両方の共起統計量(第4の配列および第5の配列)が組み合わされて、組み合わせ共起統計量(第1の配列)を形成する。次に、組み合わされた共起統計量(第1の配列)を用いて、ノイズ除去される前の再構成関数インデックスマップ(第3の配列)をノイズ除去し、ノイズ除去された共起統計量(第2の配列)を得る。次に、ノイズ除去された共起統計量(第2の配列)を用いて、第1のダイナミックレンジの再構成画像が生成される。
【0102】
ある実施形態では、バイナリクラスタマスクは、ノイズ除去される前の再構成関数インデックス値の第3の配列に標準偏差フィルタリングを適用するステップから生成される。
【0103】
ある実施形態では、標準偏差フィルタリングは、ノイズ除去される前の再構成関数インデックス値の第3の配列に、少なくとも2つの異なる空間フィルタリングカーネルサイズを用いて適用される。
【0104】
ある実施形態において、共起統計量の第5の配列は、クリップ化量子化画像または入力画像の一方がダウンサンプリングされた後に、入力画像から導出されたクリップ化量子化画像から収集される。
【0105】
ある実施形態において、共起統計量の第4の配列は、第1の共起行列内に格納され、ここで、共起統計量の第5の配列は、第2の共起行列内に格納され、第1の配列内の画素位置における共起統計量は、第1の共起行列内の画素位置における第1の共起統計量および第2の共起行列内の画素位置における第2の共起統計量の平均値または最小値の一方を表す。
【0106】
ある実施形態において、再構成関数インデックス値の第2の配列内において表された画素位置における各再構成関数インデックス値は、中間のノイズ除去された再構成関数インデックス値の配列内において表された同じ画素位置における第1の再構成関数インデックス値と、ノイズ除去される前の再構成関数インデックス値の配列内において表された同じ画素位置における第2の再構成関数インデックス値との加重和として生成される。
【0107】
ある実施形態において、加重和は、重みマスクの配列内の同じ画素位置における重み要素を用いて特定される。重みマスク値の配列は、標準偏差フィルタリングをノイズ除去される前の再構成関数インデックス値の配列に適用するステップから得られる。
【0108】
ある実施形態において、再構成関数インデックス値の第2の配列は、第2のダイナミックレンジのノイズ除去された画像内のノイズ除去されたコードワードに少なくとも部分的に基づいて生成される。第2のダイナミックレンジのノイズ除去された画像内のノイズ除去されたコードワードは、第2のダイナミックレンジの入力画像内のノイズ除去される前のコードワードに対してノイズ除去操作が行われることによって生成される。
【0109】
ある実施形態において、第1のダイナミックレンジの再構成された画像は、入力画像またはノイズ除去された画像の一方に対して再構成操作を行うステップから生成される。
【0110】
ある実施形態において、共起統計量の第1の配列は、入力画像内のノイズ除去される前のコードワードから収集される。
【0111】
ある実施形態において、第1のダイナミックレンジは、ハイダイナミックレンジを表す。第2のダイナミックレンジは、ハイダイナミックレンジよりも低いスタンダードダイナミックレンジを表す。
【0112】
ある実施形態において、ディスプレイデバイス、モバイルデバイス、セットトップボックス、マルチメディアデバイスなどの、あるコンピューティングデバイスは、上記方法のいずれかを行うように構成される。ある実施形態において、ある装置は、プロセッサを含み、上記方法のいずれかを行うように構成される。ある実施形態において、ある非一時的なコンピュータ読み取り可能な記憶媒体は、ソフトウェア命令を記憶する。ソフトウェア命令は、1つ以上のプロセッサによって実行される際に、上記方法のいずれかを行わせる。
【0113】
ある実施形態において、あるコンピューティングデバイスは、1つ以上のプロセッサおよび1セットの命令を含む1つ以上の記憶媒体を含む。1セットの命令は、1つ以上のプロセッサによって実行される際に、上記方法のいずれかを行わせる。
【0114】
なお、別々の実施形態を本明細書において記載するが、本明細書に記載の実施形態および/または部分的な実施形態の任意の組み合わせが更なる実施形態を形成し得る。
【0115】
[コンピュータシステムの実装例]
本発明の実施形態は、コンピュータシステム、電子回路およびコンポーネントで構成されたシステム、マイクロコントローラ、フィールドプログラマブルゲートアレイ(FPG
A)または他のコンフィギュラブルまたはプログラマブルロジックデバイス(PLD)、離散時間またはデジタル信号プロセッサ(DSP)、特定用途向けIC(ASIC)などの集積回路(IC)デバイス、および/または、このようなシステム、デバイスまたはコンポーネントを1つ以上含む装置、を用いて実施し得る。このコンピュータおよび/またはICは、本明細書に記載のエンハンストダイナミックレンジを有する画像の適応型知覚的量子化に関する命令を行い、制御し、または実行し得る。このコンピュータおよび/またはICは、本明細書に記載の適応型知覚的量子化プロセスに関する様々なパラメータまたは値のいずれを演算してもよい。画像およびビデオ実施形態は、ハードウェア、ソフトウェア、ファームウェア、および、その様々な組み合わせで実施され得る。
【0116】
本発明の特定の態様は、本開示の方法をプロセッサに行わせるためのソフトウェア命令を実行するコンピュータプロセッサを含む。例えば、ディスプレイ、エンコーダ、セットトップボックス、トランスコーダなどの中の1つ以上のプロセッサは、そのプロセッサがアクセス可能なプログラムメモリ内にあるソフトウェア命令を実行することによって、上記のHDR画像の適応型知覚的量子化に関する方法を実装し得る。本発明の実施形態は、プログラム製品形態で提供されてもよい。このプログラム製品は、データプロセッサによって実行された時に本発明のある実施形態の方法をデータプロセッサに実行させるための命令を含む1セットの、コンピュータ読み取り可能な信号を格納する任意の非一時的媒体を含み得る。本発明の実施形態によるプログラム製品は、様々な形態をとり得る。例えば、このプログラム製品は、フロッピーディスク、ハードディスクドライブを含む磁気データ記憶媒体、CD ROM、DVDを含む光学データ記憶媒体、ROM、フラッシュRAMなどを含む電子データ記憶媒体、などの物理的媒体を含み得る。このプログラム製品上のコンピュータ可読信号は、任意に、圧縮または暗号化されていてもよい。
【0117】
上記においてあるコンポーネント(例えば、ソフトウェアモジュール、プロセッサ、アセンブリ、デバイス、回路など)に言及している場合、そのコンポーネントへの言及(「手段」への言及を含む)は、そうでないと明記されている場合を除いて、当該コンポーネントの機能を果たす(例えば、機能的に均等である)あらゆるコンポーネント(上記した本発明の実施形態例に出てくる機能を果たす開示構造に対して構造的に均等ではないコンポーネントも含む)を、当該コンポーネントの均等物として、含むものと解釈されるべきである。
【0118】
一実施形態によると、本明細書に記載の技術は、1つ以上の専用コンピューティングデバイスによって実装される。専用コンピューティングデバイスは、上記技術を行うようにハードワイヤードであってもよいし、または上記技術を行うように永続的にプログラムされた1つ以上の特定用途向け集積回路(ASIC)またはフィールドプログラマブルゲートアレイ(FPGA)などのデジタル電子デバイスを含んでもよし、またはファームウェア、メモリ、他の記憶体、またはそれらの組み合わせにおけるプログラム命令にしたがって上記技術を行うようにプログラムされた、1つ以上の汎用ハードウェアプロセッサを含んでもよい。また、そのような専用コンピューティングデバイスは、カスタムハードワイヤードロジック、ASIC、またはFPGAをカスタムプログラミングと組み合わせて上記技術を達成し得る。専用コンピューティングデバイスは、デスクトップコンピュータシステム、ポータブルコンピュータシステム、携帯デバイス、ネットワーキングデバイス、またはハードワイヤードおよび/もしくはプログラムロジックを含んで上記技術を実装する任意の他のデバイスであり得る。
【0119】
例えば、
図5は、本発明のある実施形態が実装され得るコンピュータシステム500を例示するブロック図である。コンピュータシステム500は、バス502または情報を送受信するための他の通信機構と、バス502に接続された、情報を処理するためのハードウェアプロセッサ504とを含む。ハードウェアプロセッサ504は、例えば、汎用マイクロプロセッサであり得る。
【0120】
また、コンピュータシステム500は、バス502に接続された、情報およびプロセッサ504によって実行されることになる命令を記憶するためのランダムアクセスメモリ(RAM)または他のダイナミック記憶デバイスなどのメインメモリ506を含む。また、メインメモリ506は、プロセッサ504によって実行されるべき命令の実行中の一時的変数または他の中間情報を記憶するために使用され得る。そのような命令は、プロセッサ504がアクセス可能な非一時的な記憶媒体に記憶される場合は、コンピュータシステム500を、命令において特定される動作を行うようにカスタマイズされた専用マシンにする。
【0121】
コンピュータシステム500は、バス502に接続された、静的情報およびプロセッサ504のための命令を記憶するための読み取り専用メモリ(ROM)508または他の静的記憶デバイスをさらに含む。情報および命令を記憶するために、磁気ディスクまたは光学ディスクなどの記憶デバイス510が提供され、バス502に接続される。
【0122】
コンピュータシステム500は、情報をコンピュータユーザに対して表示するための液晶ディスプレイなどのディスプレイ512にバス502を介して接続され得る。プロセッサ504に情報およびコマンド選択を送受信するために、英数字キーまたは他のキーを含む入力デバイス514がバス502に接続される。プロセッサ504に方向情報およびコマンド選択を送受信するための、およびディスプレイ512上のカーソル移動を制御するための他の種類のユーザ入力デバイスは、マウス、トラックボール、またはカーソル方向キーなどのカーソル制御516である。この入力デバイスは、典型的には2つの軸(第1の軸(例えば、x)および第2の軸(例えば、y))における2つの自由度を有する。これにより、そのデバイスは、平面において位置を特定できる。
【0123】
コンピュータシステム500は、コンピュータシステムと組み合わされてコンピュータシステム500を専用マシンにするか、またはプログラムする、ハードワイヤードロジック、1つ以上のASICまたはFPGA、ファームウェアおよび/またはプログラムロジックを用いて、上記技術を実装し得る。一実施形態によると、本明細書に記載される技術は、メインメモリ506に含まれる1つ以上のシーケンスの1つ以上の命令をプロセッサ504が実行することに応答して、コンピュータシステム500によって行われる。そのような命令は、記憶デバイス510などの別の記憶媒体からメインメモリ506に読み込まれ得る。メインメモリ506に含まれる命令シーケンスを実行することによって、プロセッサ504は、本明細書に記載のプロセスステップを行う。別の実施形態において、ハードワイヤードな回路をソフトウェア命令の代わりに、またはそれに組み合わせて使用し得る。
【0124】
本明細書で使用する用語「記憶媒体」は、マシンを特定のやり方で動作させるデータおよび/または命令を記憶する任意の非一時的媒体を指す。そのような記憶媒体は、不揮発性媒体および/または揮発性媒体を含み得る。非揮発性媒体は、例えば、記憶デバイス510などの光学または磁気ディスクを含む。揮発性媒体は、メインメモリ506などのダイナミックメモリを含む。記憶媒体の一般的な形態は、例えば、フロッピーディスク、フレキシブルディスク、ハードディスク、ソリッドステートドライブ、磁気テープ、または任意の他の磁気データ記憶媒体、CD-ROM、任意の他の光学データ記憶媒体、穴のパターンを有する任意の物理媒体、RAM、PROM、およびEPROM、FLASH-EPROM、NVRAM、任意の他のメモリチップまたはカートリッジを含む。
【0125】
記憶媒体は、伝送媒体とは異なるが、それと併せて使用され得る。伝送媒体は、情報を記憶媒体間で転送することに関与する。例えば、伝送媒体は、同軸ケーブル、銅ワイヤ、および光ファイバを含み、バス502を含むワイヤを含む。また、伝送媒体は、電波データ通信および赤外データ通信中に生成される音波または光波などの音波または光波の形態をとり得る。
【0126】
様々な形態の媒体が1つ以上のシーケンスの1つ以上の命令を実行のためのプロセッサ504に伝送することに関与し得る。例えば、命令は、最初は遠隔のコンピュータの磁気ディスクまたはソリッドステートドライブ上に担持され得る。遠隔コンピュータは、命令をそのダイナミックメモリにロードしたり、命令を、モデムを用いて電話回線を介して送信したりし得る。コンピュータシステム500に対して局所的なモデムは、電話回線上でデータを受信し、赤外送信機を用いてデータを赤外信号に変換し得る。赤外検出器が赤外信号において伝送されるデータを受信し得る。そして、適切な回路がデータをバス502上に配置し得る。バス502は、データをメインメモリ506に伝送する。プロセッサ504は、メインメモリ506から命令を取り込んで、実行する。メインメモリ506によって受信された命令は、プロセッサ504による実行の前または後のいずれかに、必要に応じて記憶デバイス510上に記憶され得る。
【0127】
また、コンピュータシステム500は、バス502に接続された通信インターフェース518を含む。通信インターフェース518は、ローカルネットワーク522に接続されたネットワークリンク520に接続する双方向データ通信を提供する。例えば、通信インターフェース518は、サービス総合デジタル網(ISDN)カード、ケーブルモデム、衛星モデム、またはデータ通信接続を対応する種類の電話回線に与えるためのモデムであり得る。別の例として、通信インターフェース518は、データ通信接続を互換性のあるLANに与えるためのローカルエリアネットワーク(LAN)カードであり得る。また、無線リンクが実装され得る。任意のそのような実装において、通信インターフェース518は、様々な種類の情報を表すデジタルデータストリームを伝送する電気、電磁または光学信号を送信および受信する。
【0128】
ネットワークリンク520は、典型的には、データ通信を1つ以上のネットワークを介して他のデータデバイスに与える。例えば、ネットワークリンク520は、ローカルネットワーク522を介してホストコンピュータ524、またはインターネットサービスプロバイダ(ISP)526によって操作されるデータ設備に接続を与え得る。次に、ISP526は、データ通信サービスを、現在一般的に「インターネット」と呼ばれるワールドワイドパケットデータ通信ネットワーク528を介して提供する。ローカルネットワーク522およびインターネット528の両方は、デジタルデータストリームを伝送する電気、電磁、または光学信号を使用する。コンピュータシステム500へおよびからデジタルデータを伝送する、様々なネットワークを介する信号ならびにネットワークリンク520上のおよび通信インターフェース518を介した信号は、伝送媒体の形態例である。
【0129】
コンピュータシステム500は、ネットワーク、ネットワークリンク520、および通信インターフェース518を介して、メッセージを送信し、プログラムコードなどのデータを受信し得る。インターネット例において、サーバ530は、アプリケーションプログラムについてのリクエストされたコードをインターネット528、ISP526、ローカルネットワーク522、および通信インターフェース518を介して送信し得る。
【0130】
受信されたコードは、受信されるとプロセッサ504によって実行され得るか、および/または後で実行するために、記憶デバイス510または他の不揮発性記憶体に記憶され得る。
【0131】
[均等物、拡張物、代替物、その他]
この明細書中において、実装毎に異なり得る多数の具体的な詳細に言及しながら本発明の実施形態を説明した。従って、本発明の請求される実施形態が如何なるものかおよび出願人が本発明の請求される実施形態が如何なるものであると意図しているかについての唯一且つ排他的な指標は、後の訂正を含む、これら請求項が生じる具体的な形態の、本願から生じる1組の請求項である。当該請求項に含まれる用語に対して本明細書中に明示したあらゆる定義が、請求項内で使用される当該用語の意味を決定するものとする。よって、請求項に明示的に記載されていない限定事項、構成要素、特性、特徴、利点または属性は、いかなる形であれ請求の範囲を限定するものではない。従って、本明細書および図面は、限定的ではなく、例示的であると認識されるべきものである。
【0132】
[列挙実施形態例]
本発明は、本明細書に記載のいずれの形態においても実施され得る。そのような形態は、本発明のいくつかの部分の構造、特徴および機能を説明する、以下の列挙実施形態例(enumerated example embodiment:EEE)を含むが、それらに限定されない。
EEE1.
第1のダイナミックレンジの画像を第2のダイナミックレンジの入力画像から生成する方法であって、
前記第2のダイナミックレンジの入力画像に関する共起統計量の第1の配列を生成するステップと、
複数の再構成関数候補の中から再構成関数を選択するための再構成関数インデックス値の第2の配列を生成するステップと、
(a)前記共起統計量の第1の配列に少なくとも部分的に基づくノイズ除去操作、および(b)前記再構成関数インデックス値の第2の配列に少なくとも部分的に基づく再構成操作を行って、前記第1のダイナミックレンジの再構成画像を生成するステップと、
を含む方法。
EEE2.
前記再構成関数インデックス値の第2の配列は、ノイズ除去される前の再構成関数インデックス値の第3の配列に前記ノイズ除去操作が行われることによって生成されたノイズ除去された再構成関数インデックス値の配列を表す、
EEE1の方法。
EEE3.
前記共起統計量の第1の配列は、前記ノイズ除去される前の再構成関数インデックス値の第3の配列から導出されたバイナリクラスタマスクから収集された共起統計量の第4の配列と、前記入力画像から導出されたクリップ化量子化画像から収集された共起統計量の第5の配列との組み合わせである、
EEE2の方法。
EEE4.
前記バイナリクラスタマスクは、前記ノイズ除去される前の再構成関数インデックス値の第3の配列に標準偏差フィルタリングを適用するステップから生成される、
EEE3の方法。
EEE5.
前記標準偏差フィルタリングは、前記ノイズ除去される前の再構成関数インデックス値の第3の配列に対して、少なくとも2つの異なる空間フィルタリングカーネルサイズを用いて適用される、
EEE4の方法。
EEE6.
前記共起統計量の第5の配列は、前記入力画像から導出されたクリップ化量子化画像または前記入力画像の一方がダウンサンプリングされた後に、前記クリップ化量子化画像から収集される、
EEE3から5のいずれかの方法。
EEE7.
前記共起統計量の第4の配列は、第1の共起行列内に格納され、前記共起統計量の第5の配列は、第2の共起行列内に格納され、前記第1の配列内の画素位置における共起統計量は、前記第1の共起行列内の前記画素位置における第1の共起統計量および前記第2の共起行列内の前記画素位置における第2の共起統計量の平均値または最小値の一方を表す、
EEE3から6のいずれかの方法。
EEE8.
前記再構成関数インデックス値の第2の配列内において表される画素位置における各再構成関数インデックス値は、中間のノイズ除去された再構成関数インデックス値の配列内において表される同じ画素位置における第1の再構成関数インデックス値と、ノイズ除去される前の再構成関数インデックス値の配列内において表される同じ画素位置における第2の再構成関数インデックス値との加重和として生成される、
EEE1から7のいずれかの方法。
EEE9.
前記加重和は、重みマスク値の配列内の同じ画素位置における重み要素を用いて特定され、前記重みマスク値の配列は、前記ノイズ除去される前の再構成関数インデックス値の配列に標準偏差フィルタリングを適用するステップから得られる、
EEE8の方法。
EEE10.
前記共起統計量の第1の配列は、レターボックス内の画素位置の共起統計量を除く関心領域マップを用いて生成される、
EEE1から9のいずれかの方法。
EEE11.
前記共起統計量の第1の配列は、共起統計量のサンプリングされる前の配列からダウンサンプリングされる、
EEE1から10のいずれかの方法。
EEE12.
前記再構成関数インデックス値の第2の配列は、前記第2のダイナミックレンジのノイズ除去された画像内のノイズ除去されたコードワードに少なくとも部分的に基づいて生成され、前記第2のダイナミックレンジの前記ノイズ除去された画像内の前記ノイズ除去されたコードワードは、前記第2のダイナミックレンジの前記入力画像内のノイズ除去される前のコードワードに対して前記ノイズ除去操作が行われることによって生成される、
EEE1の方法。
EEE13.
前記第1のダイナミックレンジの前記再構成された画像は、前記入力画像または前記ノイズ除去された画像の一方に対して前記再構成操作を行うステップから生成される、
EEE12の方法。
EEE14.
前記共起統計量の第1の配列は、前記入力画像内の前記ノイズ除去される前のコードワードから収集される、
EEE12またはEEE13の方法。
EEE15.
前記第1のダイナミックレンジは、ハイダイナミックレンジを表し、前記第2のダイナミックレンジは、前記ハイダイナミックレンジよりも低いスタンダードダイナミックレンジを表す、
EEE1から14のいずれかの方法。
EEE16.
プロセッサを備え、EEE1から15に記載の方法のうちのいずれか1つを行うように構成された装置。
EEE17.
EEE1から15に記載された方法のうちのいずれかに従って、1つまたは複数のプロセッサを用いて方法を実行するためのコンピュータ実行可能命令を記憶した非一時的コンピュータ読み取り可能な記憶媒体。
EEE18.
EEE1から15に記載された方法のうちのいずれか1つを行うように構成されたコンピュータシステム。
【手続補正書】
【提出日】2024-07-29
【手続補正1】
【補正対象書類名】特許請求の範囲
【補正対象項目名】全文
【補正方法】変更
【補正の内容】
【特許請求の範囲】
【請求項1】
第1のダイナミックレンジの画像を第2のダイナミックレンジの入力画像から生成する方法であって、
前記第2のダイナミックレンジの入力画像に関する共起統計量の第1の配列を生成するステップであって、共起統計量は、画像または値の配列において共に現れる一対の値の頻度の尺度であり、前記共起統計量の第1の配列は、ノイズ除去される前の再構成関数インデックス値の第3の配列から導出されたバイナリクラスタマスクから収集された共起統計量の第4の配列と、前記入力画像から導出されたクリップ化量子化画像から収集された共起統計量の第5の配列との組み合わせである、ステップと、
複数の再構成関数候補の中から再構成関数を選択するための再構成関数インデックス値の第2の配列を生成するステップであって、前記再構成関数インデックス値の第2の配列は、前記ノイズ除去される前の再構成関数インデックス値の第3の配列に対して前記ノイズ除去操作が行われることによって生成されたノイズ除去された再構成関数インデックス値の配列を表す、ステップと、
(a)前記共起統計量の第1の配列に少なくとも部分的に基づくノイズ除去操作、および(b)前記再構成関数インデックス値の第2の配列に少なくとも部分的に基づく再構成操作を行って、前記第1のダイナミックレンジの再構成画像を生成するステップと、
を含む方法。
【請求項2】
前記バイナリクラスタマップは、前記ノイズ除去される前の再構成関数インデックス値の第3の配列に標準偏差フィルタリングを適用するステップから生成される、
請求項1に記載の方法。
【請求項3】
前記標準偏差フィルタリングは、前記ノイズ除去される前の再構成関数インデックス値の第3の配列に、少なくとも2つの異なる空間フィルタリングカーネルサイズを用いて適用される、
請求項2に記載の方法。
【請求項4】
前記共起統計量の第5の配列は、前記入力画像から導出されたクリップ化量子化画像または前記入力画像の一方がダウンサンプリングされた後に、前記クリップ化量子化画像から収集される、
請求項
1に記載の方法。
【請求項5】
前記共起統計量の第4の配列は、第1の共起行列内に格納され、前記共起統計量の第5の配列は、第2の共起行列内に格納され、前記第1の配列内の画素位置における共起統計量は、前記第1の共起行列内の前記画素位置における第1の共起統計量および前記第2の共起行列内の前記画素位置における第2の共起統計量の平均値または最小値の一方を表す、
請求項
1に記載の方法。
【請求項6】
前記再構成関数インデックス値の第2の配列内において表される画素位置における各再構成関数インデックス値は、中間のノイズ除去された再構成関数インデックス値の配列内において表される同じ画素位置における第1の再構成関数インデックス値と、ノイズ除去される前の再構成関数インデックス値の配列内において表される同じ画素位置における第2の再構成関数インデックス値との加重和として生成される、
請求項
1に記載の方法。
【請求項7】
前記加重和は、重みマスク値の配列内の同じ画素位置における重み要素を用いて特定され、前記重みマスク値の配列は、前記ノイズ除去される前の再構成関数インデックス値の配列に標準偏差フィルタリングを適用するステップから得られる、
請求項6に記載の方法。
【請求項8】
前記共起統計量の第1の配列は、レターボックス内の画素位置の共起統計量を除く関心領域マップを用いて生成され、前記レターボックスは、レターボックス、ピラーボックス、卵形、または他の形状などの任意の形状の1つまたは複数の静的領域を指す、
請求項
1に記載の方法。
【請求項9】
前記共起統計量の第1の配列は、共起統計量のサンプリングされる前の配列からダウンサンプリングされる、
請求項
1に記載の方法。
【請求項10】
前記再構成関数インデックス値の第2の配列は、前記第2のダイナミックレンジのノイズ除去された画像内のノイズ除去されたコードワードに少なくとも部分的に基づいて生成され、前記第2のダイナミックレンジの前記ノイズ除去された画像内の前記ノイズ除去されたコードワードは、前記第2のダイナミックレンジの前記入力画像内のノイズ除去される前のコードワードに対して前記ノイズ除去操作が行われることによって生成され、コードワードは画素値を指す、
請求項1に記載の方法。
【請求項11】
前記第1のダイナミックレンジの前記再構成された画像は、前記入力画像または前記ノイズ除去された画像の一方に対して前記再構成操作を行うステップから生成される、
請求項10に記載の方法。
【請求項12】
前記共起統計量の第1の配列は、前記入力画像内の前記ノイズ除去される前のコードワードから収集される、
請求項
10に記載の方法。
【請求項13】
前記第1のダイナミックレンジは、ハイダイナミックレンジを表し、前記第2のダイナミックレンジは、前記ハイダイナミックレンジよりも低いスタンダードダイナミックレンジを表す、
請求項
1に記載の方法。
【請求項14】
プロセッサを備え、請求項1から13に記載の方法のうちのいずれか1つを行うように構成された装置。
【請求項15】
請求項1から13に記載された方法のいずれかに従って、1つまたは複数のプロセッサを用いて方法を実行するためのコンピュータ実行可能命令を記憶した非一時的コンピュータ読み取り可能な記憶媒体。
【国際調査報告】