(19)【発行国】日本国特許庁(JP)
(12)【公報種別】公表特許公報(A)
(11)【公表番号】
(43)【公表日】2024-01-17
(54)【発明の名称】画像特徴の復元
(51)【国際特許分類】
H04N 19/85 20140101AFI20240110BHJP
H04N 19/103 20140101ALI20240110BHJP
H04N 19/136 20140101ALI20240110BHJP
H04N 19/174 20140101ALI20240110BHJP
【FI】
H04N19/85
H04N19/103
H04N19/136
H04N19/174
【審査請求】有
【予備審査請求】未請求
(21)【出願番号】P 2023540789
(86)(22)【出願日】2021-01-29
(85)【翻訳文提出日】2023-07-19
(86)【国際出願番号】 CN2021074426
(87)【国際公開番号】W WO2022141734
(87)【国際公開日】2022-07-07
(32)【優先日】2021-01-04
(33)【優先権主張国・地域又は機関】EP
(81)【指定国・地域】
(71)【出願人】
【識別番号】516227559
【氏名又は名称】オッポ広東移動通信有限公司
【氏名又は名称原語表記】GUANGDONG OPPO MOBILE TELECOMMUNICATIONS CORP., LTD.
【住所又は居所原語表記】No. 18 Haibin Road,Wusha, Chang’an,Dongguan, Guangdong 523860 China
(74)【代理人】
【識別番号】100120031
【氏名又は名称】宮嶋 学
(74)【代理人】
【識別番号】100107582
【氏名又は名称】関根 毅
(74)【代理人】
【識別番号】100152205
【氏名又は名称】吉田 昌司
(74)【代理人】
【識別番号】100137523
【氏名又は名称】出口 智也
(72)【発明者】
【氏名】マレク、ドマンスキー
(72)【発明者】
【氏名】トマシュ、グラジェク
(72)【発明者】
【氏名】スワボミル、マコービアク
(72)【発明者】
【氏名】スワボミル、ロゼク
(72)【発明者】
【氏名】オルギエルド、スタンキエビチ
(72)【発明者】
【氏名】ヤクブ、スタンコウスキー
【テーマコード(参考)】
5C159
【Fターム(参考)】
5C159MA04
5C159MA05
5C159MC11
5C159ME01
5C159PP04
5C159RC11
5C159TA01
5C159TA16
5C159TB06
5C159TD01
5C159UA02
5C159UA05
(57)【要約】
ビデオデータの復号化は、画像ビットストリームを取得することと、特徴ビットストリームを取得することであって、特徴ビットストリームに残差特徴セットが示され、残差特徴セットは、オリジナル画像データから検出された第1特徴セットから、オリジナル画像データを符号化することにより生成された符号化画像データから検出された第2特徴セットを減算することにより得られることと、復号化された画像ビットストリームから、復号化された特徴セットを検索することと、復号化された特徴セットと特徴ビットストリームを復号化することにより取得された残差特徴セットとに基づいて、入力画像データから検出された特徴を示す第1特徴セットを復元することと、を含む。
【特許請求の範囲】
【請求項1】
ビデオデータの復号化方法であって、
画像ビットストリームを取得するステップと、
特徴ビットストリームを取得するステップであって、前記特徴ビットストリームに残差特徴セットが示されるステップと、
復号化された前記画像ビットストリームから、復号化された特徴セットを検索するステップと、
前記復号化された特徴セットと前記残差特徴セットに基づいて、復元された特徴セットを取得するステップであって、前記残差特徴セットは前記特徴ビットストリームを復号化するにより得られるものである、ステップと、を含む、ビデオデータの復号化方法。
【請求項2】
前記復元された特徴セットは、前記復号化された特徴セットと、前記特徴ビットストリームを復号化して得られる前記残差特徴セットとの和によって取得される、
請求項1に記載のビデオデータの復号化方法。
【請求項3】
前記ビデオデータの復号化方法は、
前記特徴ビットストリームに対して圧縮の展開と復号化を行い、前記残差特徴セットを得るステップを更に含む、
請求項1又は2に記載のビデオデータの復号化方法。
【請求項4】
前記ビデオデータの復号化方法は、
前記画像ビットストリームと前記復元された特徴セットに基づいて、再構築データを生成するステップを更に含む、
請求項1ないし3のいずれか一項に記載のビデオデータの復号化方法。
【請求項5】
前記ビデオデータの復号化方法は、
前記画像ビットストリームを復号化するステップを更に含む、
請求項1ないし4のいずれか一項に記載のビデオデータの復号化方法。
【請求項6】
前記ビデオデータの復号化方法は、
前記特徴ビットストリームを復号化するステップを更に含む、
請求項1ないし5のいずれか一項に記載のビデオデータの復号化方法。
【請求項7】
ビデオデータの符号化方法であって、
入力された画像データを符号化して、符号化された画像データを得るステップであって、前記符号化された画像データは、画像ビットストリームを生成する基礎とされるステップと、
前記入力された画像データに対して特徴検出を行い、第1特徴セットを得るステップと、
前記符号化された画像データに対して特徴検出を行い、第2特徴セットを得るステップと、
前記第1特徴セットと前記第2特徴セットを組み合わせ、特徴増強データを得るステップと、を含む、ビデオデータの符号化方法。
【請求項8】
前記ビデオデータの符号化方法は、
前記符号化された画像データを復号化して、復号化を経由した符号化画像データを得、前記復号化を経由した符号化画像データに対して特徴検出を行い、前記第2特徴セットを得るステップを更に含む、
請求項7に記載のビデオデータの符号化方法。
【請求項9】
前記ビデオデータの符号化方法は、
前記符号化された画像データに基づいて、画像ビットストリームを生成するステップを更に含む、
請求項7又は8に記載のビデオデータの符号化方法。
【請求項10】
前記ビデオデータの符号化方法は、
前記特徴増強データに基づいて、特徴ビットストリームを生成するステップを更に含む、
請求項7ないし9のいずれか一項に記載のビデオデータの符号化方法。
【請求項11】
前記特徴ビットストリームを生成することは、前記特徴増強データを符号化するステップを含む、
請求項10に記載のビデオデータの符号化方法。
【請求項12】
前記ビデオデータの符号化方法は、
ビットストリームを多重化し、符号化した形態の前記画像データを復号化側に伝送するステップを更に含む、
請求項7ないし11のいずれか一項に記載のビデオデータの符号化方法。
【請求項13】
前記第1特徴セットと前記第2特徴セットを組み合わせるステップは、前記第1特徴セットと前記第2特徴セットを結合して、前記特徴増強データを生成するステップを含む、
請求項7ないし12のいずれか一項に記載のビデオデータの符号化方法。
【請求項14】
前記第1特徴セットと前記第2特徴セットを組み合わせるステップは、選択される特徴のみが前記特徴増強データを生成するために使用することができるように、前記第1特徴セットと前記第2特徴セット内の特徴を選択するステップを含む、
請求項7ないし13のいずれか一項に記載のビデオデータの符号化方法。
【請求項15】
前記第1特徴セットと前記第2特徴セットを組み合わせるステップは、第1特徴セットと前記第2特徴セットの両方に存在する特徴を省略するステップを含む、
請求項7ないし14のいずれか一項に記載のビデオデータの符号化方法。
【請求項16】
前記画像データは、ピクチャー、画像、画像ストリーム/ピクチャーストリーム、ビデオ、映画を含むデータ、ピクチャー、画像、画像ストリーム/ピクチャーストリーム、ビデオ、映画を示すデータ、及び/又は処理されてピクチャー、画像、画像ストリーム/ピクチャーストリーム、ビデオ、映画が得られるデータを含み、ストリーム、ビデオ又は映画は、1つ又は複数の画像を含む、
請求項7ないし15のいずれか一項に記載のビデオデータの符号化方法。
【請求項17】
前記ビデオデータの符号化方法は、
符号化待ちの画像データを得るステップを更に含む、
請求項7ないし16のいずれか一項に記載のビデオデータの符号化方法。
【請求項18】
すべてのステップは、符号化側で実行される、
請求項7ないし17のいずれか一項に記載のビデオデータの符号化方法。
【請求項19】
処理リソースとメモリリソースとを含む、ビデオデータの復号化機器であって、前記処理リソースは、前記メモリリソースにアクセスしてコードを取得し、前記コードは、動作中で、前記処理リソースに、
画像ビットストリームを取得するステップと、
特徴ビットストリームを取得するステップであって、前記特徴ビットストリームに残差特徴セットが示されるステップと、
復号化された前記画像ビットストリームから、復号化された特徴セットを検索するステップと、
前記復号化された特徴セットと前記残差特徴セットに基づいて、復元された特徴セットを取得するステップであって、前記残差特徴セットは前記特徴ビットストリームを復号化するにより得られるものである、ステップと、
を実行させる、
ビデオデータの復号化機器。
【請求項20】
通信ネットワークによって、前記画像ビットストリームと前記特徴ビットストリームを伝送する通信データを受信するように構成される、通信インターフェースを備える、
請求項19に記載のビデオデータの復号化機器。
【請求項21】
前記通信インターフェースは、無線モバイルネットワークを介して通信を行うことに適合する、
請求項20に記載のビデオデータ復号化機器。
【請求項22】
取得された前記画像ビットストリームと前記特徴ビットストリームに基づいて生成されるコンテンツを表示するように構成される、表示ユニットを備える、
請求項19ないし21のいずれか一項に記載のビデオデータ復号化機器。
【請求項23】
処理リソースとメモリリソースとを含む、ビデオデータの符号化機器であって、前記処理リソースは、前記メモリリソースにアクセスしてコードを取得し、前記コードは、動作中で、前記処理リソースに、
入力された画像データを符号化して、符号化された画像データを得るステップであって、前記符号化された画像データは、画像ビットストリームを生成する基礎とされるステップと、
前記入力された画像データに対して特徴検出を行い、第1特徴セットを得るステップと、
前記符号化された画像データに対して特徴検出を行い、第2特徴セットを得るステップと、
前記第1特徴セットと前記第2特徴セットを組み合わせ、特徴増強データを得るステップと、
を実行させる、
ビデオデータの符号化機器。
【請求項24】
コードを含むコンピュータプログラムであって、前記コードは、動作中で、処理リソースに、
入力された画像データを符号化して、符号化された画像データを得るステップであって、前記符号化された画像データは、画像ビットストリームを生成する基礎とされるステップと、
前記入力された画像データに対して特徴検出を行い、第1特徴セットを得るステップと、
前記符号化された画像データに対して特徴検出を行い、第2特徴セットを得るステップと、
前記第1特徴セットと前記第2特徴セットを組み合わせ、特徴増強データを得るステップと、
を実行させる、
コンピュータプログラム。
【請求項25】
コードを含むコンピュータプログラムであって、前記コードは、動作中で、処理リソースに、
画像ビットストリームを取得するステップと、
特徴ビットストリームを取得するステップであって、前記特徴ビットストリームに残差特徴セットが示されるステップと、
復号化された前記画像ビットストリームから、復号化された特徴セットを検索するステップと、
前記復号化された特徴セットと前記残差特徴セットに基づいて、復元された特徴セットを取得するステップであって、前記残差特徴セットは前記特徴ビットストリームを復号化するにより得られるものである、ステップと、
を実行させる、
コンピュータプログラム。
【請求項26】
請求項2ないし6のいずれか一項に記載のビデオデータの復号化方法及び請求項8ないし18のいずれか一項に記載のビデオデータの符号化方法を実行することに適用される、請求項19、23、24及び25のいずれか一項に記載の主題。
【発明の詳細な説明】
【技術分野】
【0001】
本開示は、画像及び/又はビデオ処理の技術分野に関し、特に、画像、ピクチャー、ピクチャーストリーム及びビデオのコーディング、復号化又は符号化に関する。より具体的には、本開示は、画像と、これらの画像から抽出された特徴の共同符号化と復号化に関する。具体的な態様において、本開示は、対応する方法及び機器に関する。
【背景技術】
【0002】
ビデオ圧縮は、挑戦的な技術であり、特に無線伝送にとって非常に重要である。従来のビデオと画像の圧縮は、画像特徴やビデオ特徴の符号化と全く関わりのないものとして進化してきた。このような方法は現代のアプリケーションにとっては非効率的であり、コネクテッドカー、高度な物流、スマートシティ、スマートビデオ監視、及び自動車、ドローン、無人トラックやトラクターを含む自律走行車、並びに物事のインターネットシステム(IoT)及拡張現実や仮想現実システムに関連する他の様々なアプリケーションなどのようにアプリケーションは、ビデオに基づくシステムの様々な機能において高度なビデオ分析を行う必要がある。物理的、技術的、経済的な制約により、ほとんどのこのようなシステムは、容量が限られている伝送リンク、特に、スループットが限られた無線リンクを使用する。したがって、圧縮技術は、これらのアプリケーションにとって非常に重要である。
【0003】
上記のアプリケーションにおいて、ビデオ又は画像は、通常、人間に利用されることなく、ナビゲーションシステム、自動識別・分類システム、順序付けシステム、事故防止システム、セキュリティシステム、監視システム、アクセス制御システム、交通制御システム、火災・爆発防止システム及び多くの他のシステムなどのような異なる種類の機械に利用される。このようなアプリケーションにおいて、圧縮技術は、展開された圧縮画像又はビデオを使用する際に、自動ビデオ分析が妨げられないように設計されなければならない。
【0004】
従来の画像/ビデオ圧縮モードは、人間が感知する復号化後の画像/ビデオの比較的良好な品質を維持しながら、ビット数を削減することである。上記のアプリケーションにおいて、人間が感知する良好な画像/ビデオ品質に対して、ビデオ/画像品質だけが求められているわけではない。同様に、或いはそれ以上に重要なのは、展開された圧縮画像又はビデオに基づく高度なビデオ分析の效率と精度である。冒頭で述べたように、今後の実用化されるアプリケーションでは、画像/ビデオと視覚的特徴(即ち、視覚情報から抽出された特徴)の同時符号化と復号化が必要となる。本開示は、当該課題に関連する。
【0005】
コーディングは、通常、符号化と復号化とを含む。符号化は、画像又はビデオのコンテンツを圧縮し、画像又はビデオコンテンツのフォーマットを変更する可能性のあるプロセスである。符号化は、有線又は無線ネットワークで画像又はビデオを伝送するために必要な帯域幅を削減するため、重要である。一方、復号化は、符号化又は圧縮された画像又はビデオに対して復号化又は圧縮の展開を行うプロセスである。符号化と復号化は、異なる機器に適用されるため、コーデック(codec)と呼ばれる符号化と復号化の標準が開発されている。コーデックは、通常、画像とビデオに対して符号化と復号化を行うためのアルゴリズムである。
【0006】
通常、画像データは、エンコーダ側で符号化されてビットストリームが生成される。これらのビットストリームは、データ通信を介して復号化側に伝送され、復号化側で、これらのビットストリームは復号化されて画像データを再構築する。したがって、画像とビデオは、ビットストリームの形でデータ通信によってエンコーダ(送信側)からデコーダ(受信側)に移動することができ、前記データ通信の制限により、ビットストリームにおけるデータの損失及び/又は遅延が生じる可能性があり、最終的に、復号化側と受信側の画像品質を低下させる可能性がある。画像データのコーディングと特徴検出は、通信のためにデータを大幅に削減したが、従来の技術には、まだ様々な欠点が存在している。
【0007】
よって、画像又はビデオ及び視覚特徴に対して共同コーディングを行うための効果的な技術が必要である。同じ総ビットレートにおいて、復号化された画像又はビデオと視覚特徴は、画像又はビデオと視覚特徴の独立したコーディングと比較して、より良い品質を維持する必要がある。
【発明の概要】
【0008】
上記の課題と欠点は、独立請求項の主題によって解决される。従属請求項において、さらなる好ましい実施例を限定する。具体的に、本開示の実施例は、ビットストリームを伝送するためのデータ通信に必要なデータスループットを維持、或いは低減しながら、受信側で再構築された画像又はビデオデータの品質と忠実度という実質的な利点を提供することができる。さらなる利点は、符号化/送信側及び復号化/受信側のいずれか1つにおけるデータ処理の低減も含み得る。
【0009】
本開示の1つの態様によれば、ビデオデータの復号化方法を提供し、前記方法は、画像ビットストリームを取得するステップと、特徴ビットストリームを取得するステップであって、特徴ビットストリームに残差特徴セットが示されるステップと、復号化された画像ビットストリームから、復号化された特徴セットを検索するステップと、復号化された特徴セットと残差特徴セットに基づいて、復元された特徴セットを取得するステップと、を含み、ここで、残差特徴セットは、特徴ビットストリームから復号化により得られるものである。
【0010】
本開示の他の態様によれば、ビデオデータの符号化方法を提供し、前記方法は、入力された画像データを符号化して、符号化された画像データを得るステップであって、符号化された画像データは、画像ビットストリームを生成する基礎とされるステップと、入力された画像データに対して特徴検出を行い、第1特徴セットを得るステップと、符号化された画像データに対して特徴検出を行い、第2特徴セットを得るステップと、第1特徴セットと第2特徴セットを組み合わせ、特徴増強データを得るステップと、を含む。
【0011】
本開示の他の態様によれば、処理リソースとメモリリソースとを含む、ビデオデータの復号化機器を提供し、処理リソースは、メモリリソースをアクセスしてコードを取得し、コードは、動作中で、処理リソースに、画像ビットストリームを取得するステップと、特徴ビットストリームを取得するステップであって、特徴ビットストリームに残差特徴セットが示されるステップと、復号化された画像ビットストリームから、復号化された特徴セットを検索するステップと、復号化された特徴セットと残差特徴セットに基づいて、復元された特徴セットを取得するステップと、を実行させ、ここで、残差特徴セットは、特徴ビットストリームから復号化により得られるものである。
【0012】
本開示の他の態様によれば、処理リソースとメモリリソースとを含む、ビデオデータの符号化機器を提供し、処理リソースは、メモリリソースにアクセスしてコードを取得し、コードは、動作中で、処理リソースに、入力された画像データを符号化して、符号化された画像データを得るステップであって、符号化された画像データは、画像ビットストリームを生成する基礎とされるステップと、入力された画像データに対して特徴検出を行い、第1特徴セットを得るステップと、符号化された画像データに対して特徴検出を行い、第2特徴セットを得るステップと、第1特徴セットと第2特徴セットを組み合わせ、特徴増強データを得るステップと、を実行させる。
【0013】
本開示の他の態様によれば、コードを含むコンピュータプログラムを提供し、コードは、動作中で、処理リソースに、入力された画像データを符号化して、符号化された画像データを得るステップであって、符号化された画像データは、画像ビットストリームを生成する基礎とされるステップと、入力された画像データに対して特徴検出を行い、第1特徴セットを得るステップと、符号化された画像データに対して特徴検出を行い、第2特徴セットを得るステップと、第1特徴セットと第2特徴セットを組み合わせ、特徴増強データを得るステップと、を実行させる。
【0014】
本開示の1つの態様によれば、コードを含むコンピュータプログラムを提供し、コードは、動作中で、処理リソースに、画像ビットストリームを取得するステップと、特徴ビットストリームを取得するステップであって、特徴ビットストリームに残差特徴セットが示されるステップと、復号化された画像ビットストリームから、復号化された特徴セットを検索するステップと、復号化された特徴セットと残差特徴セットに基づいて、復元された特徴セットを取得するステップと、を実行させ、ここで、残差特徴セットは、特徴ビットストリームから復号化により得られる。
【図面の簡単な説明】
【0015】
【
図1B】従来技術の一般的な使用例及び本開示の実施例を使用する環境の概略図を示す。
【
図3A】本開示の実施例による、符号化側の一般的な機器の実施例の概略図を示す。
【
図3B】本開示の実施例による、復号化側の一般的な機器の実施例の概略図を示す。
【
図4A】本開示の一般的な方法実施例のフローチャートを示す。
【
図4B】本開示の一般的な方法実施例のフローチャートを示す。
【発明を実施するための形態】
【0016】
以下、図面を参照して本開示の実施例を説明し、これらの実施例は、本開示の概念をより良く理解するために提案されるが、本開示を限定するものとして見なすべきではない。
【0017】
図1Aは、画像(本開示全体において、ビデオ、視覚情報又は画像データの形態の画像ストリームとして同義に理解される)と視覚特徴(即ち、これらの画像又は視覚情報から抽出された特徴)を別々に符号化及び復号化する従来の構成の概略図を示す。通常、オリジナル画像と抽出された特徴の両方が符号化(圧縮)され、2つの独立したビットストリームの形で復号化側に伝送される。復号化側では、符号化されたオリジナル画像と符号化された抽出された特徴を復号化することにより、再構築画像と再構築特徴を得る。通常、本開示の実施例は、オリジナル画像データを復元、再構築するために、符号化側では、画像データの形で提供されるビデオから特徴を抽出し、特徴ビットストリームの形でビデオの残差データを符号化し、復号化側では、受信された画像データの形で提供されるビデオから特徴を抽出し、受信された特徴ビットストリームの形のビデオの残差データを復号化することが考えられる。
【0018】
より具体的には、符号化側1では、画像31、画像ストリーム又はビデオであるか、それとも画像31、画像ストリーム又はビデオの一部である入力画像データ41(オリジナル画像データとも呼ばれる)を処理する。画像データ41は、エンコーダ11と、オリジナル特徴データ42を生成する特徴抽出器12に入力される。特徴エンコーダ13を用いてオリジナル特徴データ42を符号化し、それにより、符号化側1で2つのビットストリーム、即ち、画像ビットストリーム45と特徴ビットストリーム46を生成する。いくつかの実施例において、2つのビットストリームは、更に別個に伝送される。他のいくつかの実施例において、2つのビットストリームを1つのビットストリームに多重化/混合することができ、例えば、特徴ビットストリームは、画像ビットストリームに埋め込まれることができる。通常、本開示の文脈において、「画像データ」という用語は、ピクチャー、画像/画像ストリーム/ピクチャーストリーム、ビデオ、映画を含むすべてのデータ、ピクチャー、画像/画像ストリーム/ピクチャーストリーム、ビデオ、映画を示すすべてのデータ、及び/又は処理されてピクチャー、画像/画像ストリーム/ピクチャーストリーム、ビデオ、映画が得られるすべてのデータを含み、特に、ストリーム、ビデオ又は映画は、1つ又は複数の画像を含み得る。
【0019】
この2つのビットストリーム45、46は、例えば、任意の種類の適切なデータ接続、通信インフラストラクチャ及び適用可能なプロトコルによって、符号化側1から復号化側2に伝送される。例えば、ビットストリーム45、46は、サーバによって提供され、インターネットと、1つ又は複数の通信ネットワークによってモバイル機器に伝送され、モバイル機器でビットストリームを復号化し、ユーザが当該モバイル機器のディスプレイ機器で画像を見ることができるように、対応する表示データを生成する。
【0020】
復号化側2では、この2つのビットストリームを受信、復元する。画像ストリームデコーダ21は、画像ビットストリーム45を復号化して、1つ又は複数の再構築画像を生成する。特徴デコーダ22は、特徴ビットストリーム46を復号化して、1つ又は複数の再構築特徴を生成する。画像と特徴は、復号化側2で使用、処理及び表示される対応する画像データ32を生成する基礎になる。
【0021】
図1Bは、従来技術の一般的な使用例及び本開示の実施例を使用する環境の概略図を示す。復号化側1に、データセンタ、サーバ、処理機器、データメモリなどの機器51が配置され、画像データを記憶し、画像ビットストリーム45と特徴ビットストリーム46を生成するように構成される。ビットストリーム45、46は、任意の適切なネットワークとデータ通信インフラストラクチャ60を介して復号化側2に伝送され、復号化側2では、例えば、モバイル機器52は、ビットストリーム45、46を受信し、これらを復号化し、更に、画像ビットストリームと、復元された画像データを示す、復元された第1特徴セットとに基づいて、再構築データを生成する。適切な復号化及び処理を用いて、(ターゲット)モバイル機器52のディスプレイ53に1つ又は複数の画像を表示するための表示データを生成することができる。
【0022】
上述したように、符号化側では、画像データを符号化してビットストリームを生成する。これらのビットストリームは、データ通信を介して復号化側に伝送され、復号化側で、これらのビットストリームは復号化されて画像データを再構築する。明らかに、画像は、ビットストリームの形でデータ通信を介してエンコーダ(送信側)からデコーダ(受信側)に移動することができ、しかも、前記データ通信の制限により、ビットストリームにおけるデータの損失及び/又は遅延が生じる可能性があり、最終的に、復号化側と受信側の画像品質を低下させる可能性がある。画像データのコーディングと特徴検出は、通信のためにデータを大幅に削減したが、従来の技術には、まだ様々な欠点が存在し、受信機で再構築された画像データの品質はまだ満足できるものではない。
【0023】
図2Aは、本開示の実施例を実現できる構成の概略図を示す。一般に、本開示は、符号化側に焦点を当てた実施例がある一方で、復号化側に焦点を当てた実施例がある。これらの実施例は独立して保護を主張するものであるが、これらは、プラグとソケットに類似するコンポーネントのように相互作用が可能である。符号化側に焦点を当てた実施例によれば、オリジナル画像データと符号化後に復号化された画像データとから特徴を検出して、ビットストリームが、符号化側1から復号化側2に伝送されることができる。復号化側2では、符号化されたオリジナル画像と符号化された抽出特徴を復号化することにより、再構築画像と再構築特徴を得る。
【0024】
より具体的には、符号化側1で、入力画像データ31を処理し、画像データ31は、画像、画像ストリーム又はビデオであっても良く、又は画像、画像ストリーム又はビデオの一部であっても良い。通常、「入力画像データ」という用語は、符号化してネットワーク上で伝送する必要があるオリジナル画像データを指す。ある意味で、オリジナル画像データは、比較的に無損失の高品質の画像データの基本入力データとすることができる。画像データ31をエンコーダ11及びオリジナル特徴データ42を生成する特徴抽出器12に入力する。当該実施例によれば、符号化された画像データ45は、さらにデコーダ16で復号化され、好ましく、当該デコーダ16も符号化側1に配置され、それによって再構築された画像データを得ることに有利であり、当該再構築された画像データは、前にエンコーダ11によって提供された圧縮又は符号化された特徴及び/又は特性を含み得る。そのため、復号化を経由した符号化画像データ43が生成され、それは他の特徴抽出器14に供給され、当該特徴抽出器14は、他の特徴データ43を生成し、当該特徴データ43は、復号化を経由した比較的に低品質である符号化画像データ43から抽出された特徴を含み、及び/又は示すことができる。
【0025】
特徴データ42と他の特徴データ43の両方は、予測器15に供給され、当該予測器15で、オリジナル入力画像データ41からの特徴抽出器12による比較的高品質の特徴42、及び符号化されたビデオ/画像の画像データ45からの特徴抽出器14による比較的低品質の特徴43が到着し、符号化されたビデオ/画像の画像データ45は、少なくとも何らかの形で復号化側でも利用可能である。予測器15では、入力画像データから検出された第1特徴セット42内の特徴から、符号化された画像データから検出された第2特徴セット43内の特徴を減算し、当該符号化画像データは、符号化により、入力画像データから生成されるものである。このようにして、残差特徴セットを得、当該残差特徴セットは、特徴ビットストリーム46を生成するための基礎であり、当該特徴ビットストリーム46は、減算の結果としての残差特徴セットを示す。
【0026】
このようにして、復号化側で既に存在しているデータから得られることができる内容(画像やビデオの一般的なデータという意味で)を特徴ビットストリームで伝送することを回避することができ、比較的低品質の特徴セットが復号化側で得られることができるためである。したがって、当該実施例において、比較的低品質の特徴に基づいて、比較的高品質の特徴セットを予測する。
【0027】
1つの実施例において、対応する予測は、例えば、以下の式で提出される対応する特徴の値の減算を含む。
【0028】
結果特徴 = 高品質特徴 - 低品質特徴
(result_feature = high_quality_feature - low_quality_feature)。
【0029】
対応するすべての特徴に対して当該公式を適用することができる。代替案において、以下のように、比較的高品質の特徴セットから比較的低品質の特徴セットを減算することにより、結果特徴セットを得るように、特徴セットを予測する。
【0030】
結果特徴セット = 高品質特徴セット - 低品質特徴セット
(result_feature_set = high_quality_feature_set- low_quality_feature_set)。
【0031】
通常、上記の減算とは、比較的高品質の特徴セットから、比較的低品質の特徴セット内に既に存在している要素を削除することを意味する。
【0032】
他の実施例において、特徴データ42と他の特徴データ43は、特徴増強データ44を生成するために選択的に多重化され、オリジナル画像データ内の特徴に関する情報及び復号化を経由した符号化画像データ内の特徴に関する情報の一部のみを、復号化側で復号化時に使用するために残す。例えば、この2つの画像データに同時に存在する特徴は省略することができ、明らかに当該特徴が既に画像ビットストリーム45によって復号化側に十分に伝送されているためである。このような実施例において、予測器15は、加算器として機能することができ、特徴データ42は、加算(+)され、他の特徴データ43は、減算(-)される。
【0033】
言い換えれば、復号化側では、伝送される画像ビットストリームに符号化された画像から比較的低品質の特徴を抽出し、伝送される特徴ビットストリームに増強データを追加して符号化し、それにより、特徴を再構築することができる。そのため、特徴に関連する符号化データは、すべての特徴ではなく、特に、他の画像ビットストリームによって伝送される特徴ではなく、限られた増強データのみから構成される。このようにして、従来方案より下記の利点があり、即ち、1)関わるビットストリームのサイズを減少する利点があり、すべての画像特徴を直接伝送するにはより多くの情報を符号化する必要があり、より大きなビットストリームが必要であるためである。2)画像特徴を全く伝送せず、復号化側で特徴を抽出する場合と比較して、品質を維持又は向上させることができ、前者において、復号化された画像が劣化し、低品質の特徴しか得られない可能性がある。
【0034】
特徴エンコーダ13を用いて特徴増強データ44を符号化して、符号化側1で2つのビットストリーム、即ち、画像ビットストリーム45と特徴ビットストリーム46を生成させる。この2つのビットストリーム45、46は、例えば、任意の種類の適切なデータ接続、通信インフラストラクチャ及び適用可能なプロトコルによって、符号化側1から復号化側2に伝送される。例えば、ビットストリーム45、46は、サーバによって提供され、インターネットと、1つ又は複数の通信ネットワークによってモバイル機器に伝送され、モバイル機器でビットストリームを復号化し、ユーザが当該モバイル機器のディスプレイ機器で画像を見ることができるように、対応する表示データを生成する。
【0035】
復号化側に焦点を当てた実施例によれば、復号化側2で画像ビットストリーム45と特徴ビットストリーム46を得る。特徴ビットストリーム46に、残差特徴セットが示され、画像ビットストリーム45を復号化することにより、復号化された特徴セットを得ることができ、つまり、デコーダ21によって、復号化された画像ビットストリーム48を得ることができる。復号化された特徴セット49及び、特徴ビットストリーム46から復号化された残差特徴セット47に基づいて、復元された特徴セット50を得、デコーダ22を用いて、特徴ビットストリーム46を復号化し、残差特徴セット47を得ることができる。
【0036】
他の実施例において、下記の選択肢のいずれか1つを適用する。第1に、潜在的に符号化側で、符号化によって入力画像データから、得られる画像ビットストリームを生成することができる。第2に、入力画像データから検出された特徴セットから、入力画像データを符号化することにより生成された符号化画像データから検出された特徴セットを減算することにより、残差特徴セットを得る。潜在的に、符号化側で残差特徴セットを得ることができる。第3に、復元された特徴セットに、入力画像データから検出される特徴が示されることができる。第4に、選択的な予測によって、特徴ビットストリームを生成することができる。特徴ビットストリームによって符号化された画像データから予測されていない特徴のみを伝送する。通常、「入力画像データ」という用語は、符号化してネットワーク上で伝送する必要があるオリジナル画像データを指する。ある意味で、オリジナル画像データは、比較的に無損失の高品質の画像データの基本入力データとすることができる。
【0037】
言い換えれば、符号化側で符号化によって入力画像データから画像ビットストリーム45を生成することができ、例えば、データ通信(例えば、インターネット、モバイルネットワークなど)によって画像ビットストリーム45を受信することができる。特徴ビットストリーム46に、残差特徴セットが示されており、残差特徴セットは、入力画像データから検出された特徴セットから、入力画像データを符号化することにより生成された符号化画像データから検出された特徴セットを減算することにより得られるものである。ある意味では、特徴ビットストリーム46によって、特徴の圧縮された差分セットを伝送する。
【0038】
画像デコーダ21において、画像ビットストリーム45は、復号化画像ビットストリーム48を生成するために復号化され、当該復号化画像ビットストリーム48は更に処理されて復号化側で表示される画像データ32を生成する。復号化画像データ48は、更に、特徴抽出器24に供給され、特徴セット49の形で比較的低品質の特徴セット43を実質的に再現する。特徴デコーダ22において、特徴ビットストリーム46は、残差特徴セット47を得るために復号化される。25において、特徴セット50は復元され、当該特徴セットに、復号化された特徴セットから検出された入力画像データ内の特徴49と、特徴ビットストリームから復号化された残差特徴セット47とが実質的に示され又は含まれる。このようにして、最初に符号化側1で特徴セット42の形で提供される比較的高品質の特徴セット全体を復号化側で再現すると同時に、特徴ビットストリーム46を伝送するために必要なデータ量を削減することができる。通常、オリジナル画像データ及び符号化後に復号化された画像データから特徴を検出して、ビットストリームを符号化側1から復号化側2に伝送する。復号化側2では、符号化されたオリジナル画像と符号化された抽出の特徴を復号化することにより、再構築画像と再構築特徴を得る。
【0039】
言い換えれば、復号化側2では、特徴の予測(デコーダ24で抽出された比較的低品質の特徴)、及び特徴ビットストリーム46で伝送される予測誤差の種類に基づいて、画像の特徴を再構築する。
【0040】
したがって、本開示の実施例は、1つ又は複数の利点を提供することができ、ここで、最初に符号化され、その後に復号化されたビデオから特徴を抽出することにより、特徴検出の精度を向上させる。各ビットストリームを伝送する際にビデオ伝送のビットレートが低い場合、これらの特徴は、著しく劣化する可能性がある。このようにして、
図2を参照して説明された特徴ビットストリーム46のように、特徴の符号化された増強データの追加ストリームによって特徴の忠実度を改善することができる。これは、特に、特徴のサイマル放送(simulcast)圧縮よりも効率的である。
【0041】
したがって、本開示の実施例は、オリジナル画像から抽出された特徴のコーディングを考慮し、再構築画像から抽出された特徴に基づいてこれらの特徴を予測することを含む。通常、本開示の実施例は、単色とカラーの画像/ビデオ、静止画と動画(ビデオ)、線形フィルタリング、非線形フィルタリング、ニューラルネットワークベースの特徴抽出方法に特に重点を置いたフィルタリングを含むがこれに限定されない様々な適用可能な特徴抽出方法及び検出方法が考えられる。このような特徴抽出方法は、スケール不変特徴変換(SIFT)、ビデオ分析用コンパクト記述子(CDVA)及び視覚検索用コンパクト記述子(CDVS)などの離散特徴を生成することができる。
【0042】
更に、本開示の実施例は、JPEG、JPEG 2000、JPEG XR、PNG、MPEG-2(H.262)、AVC(H.264)、AVS(任意のバージョン)、HEVC(H.265)、VC-1、HEVC(H.266)、AV 1、EVC、VVCなどを含むが、これに限定されない、様々な適用可能なビデオコーデックのいずれか1つに適用されることができる。更に、実施例は、実際に採用される圧縮技術に依存しなくてもよく、例えば、エンコーダ/デコーダ11、11’、13、21、22のいずれかで採用される、画像とビデオの圧縮及び特徴の増強データを符号化し圧縮する圧縮技術を利用することができる。
【0043】
図2Bは、本開示の他の構成の実施例の概略図を示す。自らで再構築画像を提供するエンコーダ11’が採用されるため、符号化側1でデコーダ(例えば、
図2Aのデコーダ16)を使用する必要がない以外に、他の様態及び素子は、
図2Aを組み合わせて開示及び説明した様態及び素子と同じ又は類似する。当該実施例において、他の特徴データ43を生成するために、符号化された画像データを他の特徴抽出器14に直接供給することができる。
【0044】
図3Aは、本開示の実施例による、符号化側の一般的な機器の実施例の概略図を示す。符号化機器70は、処理リソース71、アクセスメモリ72及びインターフェース73を含む。前記アクセスメモリ72によって、コードを記憶するか又はコードにアクセスすることができ、当該コードは、本開示で説明及び解説されるように、本開示の任意の方法実施例の1つ又は複数のステップを実行することを処理リソース71に指示する。
【0045】
具体的に、コードは、下記の処理を行うように処理リソース71に指示することができ、即ち、通信インターフェース73を介して符号化待ちの画像データ31を取得し、当該画像データ31を符号化することにより、符号化された画像データを得、画像ビットストリーム45を生成する基礎として、当該画像ビットストリームは、通信インターフェース73を介して復号化側に出力する。選択的に、符号化データの復号化を実行するコードが存在してもよい。符号化された又は復号化された符号化画像データから特徴検出を行って第2特徴セットを得る。符号化されたもの自身が再構築画像を有する場合、復号化を省略してもよい。得られた画像データに対してさらなる特徴検出を行い、第1特徴セットを得る。第1特徴セットと第2特徴セットを組み合わせることにより、第1特徴セットと第2特徴セットを結合して、特徴増強データ46を得、当該データは、他のビットストリームとして出力されることができる。
【0046】
処理リソースは、1つ又は複数の中央処理ユニット(CPU)などの処理ユニットとして実施されてもよく、又はデータセンタ又は所謂クラウドコンピューティングの形で存在する分散処理能力及び/又は共有処理能力によって提供されてもよい。類似する考慮は、ハードディスクドライブ(HDD)、ソリッドステートドライブ(SSD)、ランダムアクセスメモリ(RAM)、フラッシュメモリを含むが、これらに限定されないローカルメモリによって実施されることができるアクセスメモリに適する。同様に、データセンタ及び/又はクラウドメモリストレージなどの、分散及び/又は共有メモリストレージも適用可能である。
【0047】
図3Bは、本開示の実施例による、復号化側の一般的な機器の実施例の概略図を示す。復号化装置80は、処理リソース81、アクセスメモリ82及びインターフェース83を含む。アクセスメモリ82は、コードを記憶するか又はコードにアクセスすることができ、当該コードは、本開示で説明及び解説されるように、本開示の任意の方法実施例の1つ又は複数のステップを実行することを処理リソース81に指示する。更に、機器80は、表示ユニット84を含み得、表示ユニット84は、処理リソース81から表示データを受信して、画像データと一致するコンテンツを表示することができる。機器80は、通常、コンピュータ、パーソナルコンピュータ、タブレットコンピュータ、ノートブックコンピュータ、スマートフォン、携帯電話、ビデオプレーヤー、テレビセットトップボック、受信機など、当技術分野で知られているようなものであってよい。
【0048】
具体的に、コードは、通信インターフェース83を介して画像ビットストリーム45と特徴ビットストリーム46を取得することを処理リソース81に指示することができる。特徴ビットストリームに残差特徴セットが示されることができ、当該残差特徴セットは、入力画像データ又はオリジナル画像データから検出された特徴セットから、入力画像データ又はオリジナル画像データを符号化することにより生成された符号化画像データから検出された特徴セットを減算することにより得られる。コードは、復号化された画像ビットストリームから復号化された特徴セットを検索し、復号化された特徴セットと、特徴ビットストリームから復号化された残差特徴セットに基づいて、復元された特徴セットを得ることを処理リソース81に指示することができる。コードは更に、表示ユニット84上で表示される表示データを生成することを処理リソース81に指示することができる。
【0049】
図4Aは、本開示の一般的な方法実施例のフローチャートを示す。具体的に、ビデオデータの符号化方法を示し、当該方法は、以下のステップを含む。選択可能なステップS1において、符号化待ちの入力画像データを取得する。当該入力画像データは、ステップS2で符号化されることによって符号化された画像データを得、当該符号化された画像データは、画像ビットストリームを生成する基礎となる。選択的に、ステップS3において、当該符号化された画像データを復号化し、ステップS4において、復号化された画像データに対して特徴検出を行い、第2特徴セットを得る。ステップS2における符号化されたもの自身が再構築画像を有する場合、ステップS3の復号化を省略してもよいし、当該方法は、ステップS3の後のステップS4に直接実行してもよい。ステップS5において、更に、入力された画像データに対して特徴検出を行い、第1特徴セットを得る。ステップS6において、本開示の他の場所でより詳しく説明したように、第1特徴セット及び第2特徴セットを用いて残差特徴セットを生成する。
【0050】
図4Bは、本開示の一般的な方法実施例のフローチャートを示す。具体的に、ビデオデータの復号化方法を示し、当該方法は、以下のステップを含む。ステップS11において、符号化によって入力/オリジナルの画像データから生成できる画像ビットストリームを取得する。ステップS13において、特徴ビットストリームを取得する。特徴ビットストリームに残差特徴セットが示されており、当該残差特徴セットは、入力画像データ又はオリジナル画像データから検出された特徴セットから、入力画像データ又はオリジナル画像データを符号化することにより生成された符号化画像データから検出された特徴セットを減算することにより得られる。ステップS14において、特徴ビットストリームを復号化して、残差特徴セットを得る。当該方法は更に、以下のステップを含む。ステップS12において、画像ビットストリームを復号化する。ステップS15において、復号化された画像ビットストリームから復号化された特徴セットを検索する。ステップS16において、復号化された特徴セットと、特徴ビットストリームから復号化された残差特徴セットに基づいて、復元された特徴セットを得る。
【0051】
詳細な実施例について説明したが、これらの実施例は、独立請求項によって限定される本開示をより良く理解するためのものであり、本開示を限定するものと見なすべきではない。
【手続補正書】
【提出日】2024-01-04
【手続補正1】
【補正対象書類名】特許請求の範囲
【補正対象項目名】全文
【補正方法】変更
【補正の内容】
【特許請求の範囲】
【請求項1】
ビデオデータの復号化方法であって、
画像ビットストリームを取得するステップと、
特徴ビットストリームを取得するステップであって、前記特徴ビットストリームに残差特徴セットが示されるステップと、
復号化された前記画像ビットストリームから、復号化された特徴セットを検索するステップと、
前記復号化された特徴セットと前記残差特徴セットに基づいて、復元された特徴セットを取得するステップであって、前記残差特徴セットは前記特徴ビットストリームを復号化するにより得られるものである、ステップと、を含む、ビデオデータの復号化方法。
【請求項2】
前記復元された特徴セットは、前記復号化された特徴セットと、前記特徴ビットストリームを復号化して得られる前記残差特徴セットとの和によって取得される、
請求項1に記載のビデオデータの復号化方法。
【請求項3】
前記ビデオデータの復号化方法は、
前記特徴ビットストリームに対して圧縮の展開と復号化を行い、前記残差特徴セットを得るステップを更に含む、
請求項1又は2に記載のビデオデータの復号化方法。
【請求項4】
前記ビデオデータの復号化方法は、
前記画像ビットストリームと前記復元された特徴セットに基づいて、再構築データを生成するステップを更に含む、
請求項1ないし3のいずれか一項に記載のビデオデータの復号化方法。
【請求項5】
ビデオデータの符号化方法であって、
入力された画像データを符号化して、符号化された画像データを得るステップであって、前記符号化された画像データは、画像ビットストリームを生成する基礎とされるステップと、
前記入力された画像データに対して特徴検出を行い、第1特徴セットを得るステップと、
前記符号化された画像データに対して特徴検出を行い、第2特徴セットを得るステップと、
前記第1特徴セットと前記第2特徴セットを組み合わせ、特徴増強データを得るステップと、を含む、ビデオデータの符号化方法。
【請求項6】
前記ビデオデータの符号化方法は、
前記符号化された画像データを復号化して、復号化を経由した符号化画像データを得、前記復号化を経由した符号化画像データに対して特徴検出を行い、前記第2特徴セットを得るステップを更に含む、
請求項5に記載のビデオデータの符号化方法。
【請求項7】
前記ビデオデータの符号化方法は、
前記符号化された画像データに基づいて、画像ビットストリームを生成するステップを更に含む、
請求項5又は6に記載のビデオデータの符号化方法。
【請求項8】
前記ビデオデータの符号化方法は、
前記特徴増強データに基づいて、特徴ビットストリームを生成するステップを更に含む、
請求項5ないし7のいずれか一項に記載のビデオデータの符号化方法。
【請求項9】
前記特徴ビットストリームを生成することは、前記特徴増強データを符号化するステップを含む、
請求項8に記載のビデオデータの符号化方法。
【請求項10】
前記ビデオデータの符号化方法は、
ビットストリームを多重化し、符号化した形態の前記画像データを復号化側に伝送するステップを更に含む、
請求項5ないし9のいずれか一項に記載のビデオデータの符号化方法。
【請求項11】
前記第1特徴セットと前記第2特徴セットを組み合わせるステップは、前記第1特徴セットと前記第2特徴セットを結合して、前記特徴増強データを生成するステップを含む、
請求項5ないし10のいずれか一項に記載のビデオデータの符号化方法。
【請求項12】
前記第1特徴セットと前記第2特徴セットを組み合わせるステップは、選択される特徴のみが前記特徴増強データを生成するために使用することができるように、前記第1特徴セットと前記第2特徴セット内の特徴を選択するステップを含む、
請求項5ないし11のいずれか一項に記載のビデオデータの符号化方法。
【請求項13】
前記第1特徴セットと前記第2特徴セットを組み合わせるステップは、第1特徴セットと前記第2特徴セットの両方に存在する特徴を省略するステップを含む、
請求項5ないし12のいずれか一項に記載のビデオデータの符号化方法。
【請求項14】
処理リソースとメモリリソースとを含む、ビデオデータの復号化機器であって、前記処理リソースは、前記メモリリソースにアクセスしてコードを取得し、前記コードは、前記処理リソースに、請求項1ないし4のいずれか一項に記載のビデオデータの復号化方法を実行させるように構成される、
ビデオデータの復号化機器。
【請求項15】
処理リソースとメモリリソースとを含む、ビデオデータの符号化機器であって、前記処理リソースは、前記メモリリソースにアクセスしてコードを取得し、前記コードは、前記処理リソースに、請求項1ないし4のいずれか一項に記載のビデオデータの符号化方法を実行させるように構成される、
ビデオデータの符号化機器。
【国際調査報告】