(19)【発行国】日本国特許庁(JP)
(12)【公報種別】公表特許公報(A)
(11)【公表番号】
(43)【公表日】2024-04-23
(54)【発明の名称】データ処理方法及びシステム
(51)【国際特許分類】
H04N 19/117 20140101AFI20240416BHJP
H04N 19/167 20140101ALI20240416BHJP
H04N 19/172 20140101ALI20240416BHJP
H04N 19/85 20140101ALI20240416BHJP
【FI】
H04N19/117
H04N19/167
H04N19/172
H04N19/85
【審査請求】有
【予備審査請求】未請求
(21)【出願番号】P 2023568177
(86)(22)【出願日】2022-05-20
(85)【翻訳文提出日】2023-11-05
(86)【国際出願番号】 CN2022094004
(87)【国際公開番号】W WO2022247735
(87)【国際公開日】2022-12-01
(31)【優先権主張番号】202110594135.5
(32)【優先日】2021-05-28
(33)【優先権主張国・地域又は機関】CN
(81)【指定国・地域】
【公序良俗違反の表示】
(特許庁注:以下のものは登録商標)
(71)【出願人】
【識別番号】523059604
【氏名又は名称】于 江鴻
【氏名又は名称原語表記】YU,Jianghong
【住所又は居所原語表記】Room 601, Unit 1, Building 24, Changchun Street Xicheng District Beijing 100053 China
(74)【代理人】
【識別番号】100205936
【氏名又は名称】崔 海龍
(74)【代理人】
【識別番号】100132805
【氏名又は名称】河合 貴之
(72)【発明者】
【氏名】于 江鴻
【テーマコード(参考)】
5C159
【Fターム(参考)】
5C159LA00
5C159LC09
5C159MA04
5C159MA05
5C159MA21
5C159TA68
5C159TB08
5C159TC04
5C159TC10
5C159TD12
5C159TD15
5C159UA02
5C159UA05
5C159UA12
5C159UA13
5C159UA14
(57)【要約】
本明細書によるデータ処理方法及びシステムは、初期フレームを複数のユニットに分割し、異なるエッジ調整係数を用いて各ユニットの中周波数から高周波数領域での振幅を調整することができる。現在のユニットにおける中周波数から高周波数領域の振幅が大きい場合、1より小さく0より大きいエッジ調整係数を用いて、中周波数から高周波数領域の振幅を低減することによって、データ情報量を減少させ、データ圧縮の効率を向上させる。現在のユニットにおける中周波数から高周波数領域の振幅が小さい場合、1より大きいエッジ調整係数を用いて、中周波数から高周波数領域の振幅を増強し、ディテール損失を回避する。データ伸長の場合、前記方法及びシステムは、エッジ調整係数に対応するエッジ補償係数を用いて、各ユニットの中周波数から高周波数領域の振幅に対してエッジ補償を行い、前記エッジ調整が施された圧縮データを、初期フレームの明瞭度又は前記初期フレームよりも高い明瞭度に復元し、伸長フレームを得ることができる。
【選択図】
図3A
【特許請求の範囲】
【請求項1】
データ処理方法であって、
初期データにおける、予め設定されたバイト数の初期データを含む初期フレームを選択することと、
前記初期フレームに対してデータ圧縮を行い、圧縮フレームを得ることと、を含み、ここで、前記データ圧縮は、前記圧縮中フレームに対してエッジ調整を行うことを含み、前記圧縮中フレームは、前記初期フレームと、前記データ圧縮過程において前記圧縮フレームになる前の前記初期フレームのいずれかのデータ状態とを含み、
ここで、前記エッジ調整は、それらに対応するエッジ調整係数を用いて、前記圧縮中フレームの複数のユニットのうちの各ユニットの中周波数から高周波数領域での振幅を調整して、前記圧縮中フレームの前記中周波数から前記高周波数領域での振幅を低減することを含み、前記エッジ調整係数が0より大きい、ことを特徴とするデータ処理方法。
【請求項2】
前述した、圧縮中フレームに対してエッジ調整を行うことは、
予め設定されたユニットサイズに基づいて前記圧縮中フレームを前記複数のユニットに分割することと、
それらに対応する前記エッジ調整係数を用いて、前記各ユニットの中周波数から高周波数領域での振幅を調整することと、を含む、ことを特徴とする請求項1に記載のデータ処理方法。
【請求項3】
前述した、それらに対応する前記エッジ調整係数を用いて、前記各ユニットの中周波数から高周波数領域での振幅を調整することは、前記各ユニットに対して、
予め設定された符号化関数群から一つの関数を符号化関数として選択し、前記符号化関数によってそれらを調整して、第1のユニットを得て、それらの周波数領域内の低周波数領域での成分が保持されているが中周波数から高周波数領域での成分が減衰されるようにすることと、
それらと前記第1のユニットとの差を求め、それらに対応する第1のエッジを取得することであって、前記第1のエッジはそれらの前記中周波数から前記高周波数領域での成分を含むことと、
それらに対応する前記エッジ調整係数を用いて前記第1のエッジの振幅を調整して、それらに対応する符号化エッジを得ることと、
前記第1のユニットと前記符号化エッジを重畳することとを含む、ことを特徴とする請求項2に記載のデータ処理方法。
【請求項4】
前述した、それらに対応する前記エッジ調整係数を用いて前記第1のエッジの振幅を調整することは、
前記第1のエッジのエッジ値が予め設定された第1の閾値より小さいことを確定し、1より大きい前記エッジ調整係数によって前記第1のエッジの振幅を増強すること、又は
前記第1のエッジのエッジ値が予め設定された第2の閾値より大きいことを確定し、1により小さい前記エッジ調整係数によって前記第1のエッジの振幅を低減すること、を含む、ことを特徴とする請求項3に記載のデータ処理方法。
【請求項5】
前述した、1より大きい前記エッジ調整係数によって前記第1のエッジの振幅を増強することは、
予め設定された第1のエッジ調整係数群から一つの係数を前記エッジ調整係数として選択して、前記第1のエッジの振幅を増強することであって、前記第1のエッジ調整係数群における係数がいずれも1より大きいことを含み、
前述した、1より小さい前記エッジ調整係数によって前記第1のエッジの振幅を低減することは、
予め設定された第2のエッジ調整係数群から一つの係数を前記エッジ調整係数として選択して、前記第1のエッジの振幅を低減することであって、前記第2のエッジ調整係数群における係数がいずれも1より小さいことを含む、ことを特徴とする請求項4に記載のデータ処理方法。
【請求項6】
前述した、それらに対応する前記エッジ調整係数を用いて前記第1のエッジの振幅を調整することは、
歪曲率及び符号化率の加重値を最適化目標とし、最適化アルゴリズムに基づいて、前記エッジ調整係数を取得し、前記エッジ調整係数により前記第1のエッジの振幅を調整することを含む、ことを特徴とする請求項3に記載のデータ処理方法。
【請求項7】
前述した、前記初期フレームに対してデータ圧縮を行うことは、
前記初期フレームに対してまず前記エッジ調整を行い、次に前記エッジ調整された初期フレームを予測し残差を求める方法、
前記初期フレームに対してまず予測を行って予測フレームを得て、次に前記初期フレーム及び前記予測フレームに対して前記エッジ調整を行い、残差を求める方法、及び
前記初期フレームに対してまず予測を行い、残差を求め、次に前記残差に対して前記エッジ調整を行う方法のうちの少なくとも一つを含む、ことを特徴とする請求項3に記載のデータ処理方法。
【請求項8】
前記圧縮フレームは、前記複数のユニットのうちの各ユニットに対応する前記符号化関数及び前記エッジ調整係数をさらに含む、ことを特徴とする請求項7に記載のデータ処理方法。
【請求項9】
データ処理システムであって、
データを処理するための少なくとも一つの命令セットが記憶されている少なくとも一つの記憶媒体と、
前記少なくとも一つの記憶媒体と通信的に接続される少なくとも一つのプロセッサとを含み、
ここで、前記システムが作動する場合、前記少なくとも一つのプロセッサは、前記少なくとも一つの命令セットを読み取り、且つ前記少なくとも一つの命令セットの指示に従って請求項1~8のいずれか一項に記載のデータ処理方法を実行する、ことを特徴とするデータ処理システム。
【請求項10】
データ処理方法であって、
圧縮データを取得することであって、前記圧縮データは初期フレームに対してデータ圧縮を行って得られた圧縮フレームを含み、前記データ圧縮はエッジ調整を含むことと、
前記圧縮フレームに対してデータ伸長を行い、伸長フレームを得ることと、を含み、前記データ伸長は、伸長中フレームに対してエッジ補償を行うことを含み、前記伸長中フレームは、前記圧縮フレームと、前記データ伸長過程において前記伸長フレームになる前の前記圧縮フレームのいずれかのデータ状態とを含み、
ここで、前記エッジ補償と前記エッジ調整とは予め設定された相関関係にある、ことを特徴とするデータ処理方法。
【請求項11】
前記エッジ調整は、それらに対応するエッジ調整係数を用いて、圧縮中フレームの複数のユニットのうちの各ユニットの中周波数から高周波数領域での振幅を調整して、前記圧縮中フレームの前記中周波数から前記高周波数領域での振幅を低減することを含み、前記エッジ調整係数が0より大きく、前記圧縮中フレームは、前記初期フレームと、前記データ圧縮過程において前記圧縮フレームになる前の前記初期フレームのいずれかのデータ状態とを含み、
前記エッジ補償は、前記相関関係に基づいて、前記エッジ調整係数に対応するエッジ補償係数を用いて、前記伸長中フレームの前記複数のユニットのうちの前記各ユニットの中周波数から高周波数領域での振幅を補償することを含む、ことを特徴とする請求項10に記載のデータ処理方法。
【請求項12】
前述した、圧縮中フレームに対してエッジ調整を行うことは、
予め設定されたユニットサイズに基づいて前記圧縮中フレームを前記複数のユニットに分割することと、
それらに対応する前記エッジ調整係数を用いて、前記各ユニットの中周波数から高周波数領域での振幅を調整することであって、前記各ユニットに対して、
予め設定された符号化関数群から一つの関数を符号化関数として選択し、前記符号化関数によってそれらを調整して、第1のユニットを得て、それらの周波数領域内の低周波数領域での成分が保持されているが中周波数から高周波数領域での成分が減衰されるようにすることと、
それらと前記第1のユニットとの差を求め、それらに対応する第1のエッジを取得することであって、前記第1のエッジはそれらの前記中周波数から前記高周波数領域での成分を含むことと、
それらに対応する前記エッジ調整係数を用いて前記第1のエッジの振幅を調整して、それらに対応する符号化エッジを得ることと、
前記第1のユニットと前記符号化エッジを重畳することとを含むこととを含む、ことを特徴とする請求項11に記載のデータ処理方法。
【請求項13】
前述した、伸長中フレームに対してエッジ補償を行うことは、
予め設定された前記ユニットサイズに基づいて前記伸長中フレームを前記複数のユニットに分割することと、
前記エッジ調整係数に対応する前記エッジ補償係数を用いて、前記各ユニットの中周波数から高周波数領域での振幅を補償することと、を含む、ことを特徴とする請求項12に記載のデータ処理方法。
【請求項14】
前述した、前記エッジ調整係数に対応する前記エッジ補償係数を用いて、前記各ユニットの中周波数から高周波数領域での振幅を補償することは、前記各ユニットに対して、
復号化関数を確定し、前記復号化関数によってそれらを調整して、第2のユニットを得て、それらの周波数領域内の低周波数領域での成分が保持されているが中周波数から高周波数領域での成分が減衰されるようにすることと、
それらと前記第2のユニットとの差を求め、それらに対応する第2のエッジを取得することであって、前記第2のエッジはそれらの前記中周波数から前記高周波数領域での成分を含むことと、
前記エッジ調整係数に対応する前記エッジ補償係数を用いて前記第2のエッジの振幅を補償して、それらに対応する復号化エッジを得ることと、
前記現在のユニットと前記復号化エッジを重畳することとを含む、ことを特徴とする請求項13に記載のデータ処理方法。
【請求項15】
前述した、復号化関数を確定することは、
予め設定された復号化関数群から一つの関数を前記復号化関数として選択することを含む、ことを特徴とする請求項14に記載のデータ処理方法。
【請求項16】
前述した、前記エッジ調整係数に対応する前記エッジ補償係数を用いて前記第2のエッジの振幅を補償することは、
予め設定されたエッジ補償係数群から一つの係数を前記エッジ補償係数として選択して、前記第2のエッジの振幅を補償することを含む、ことを特徴とする請求項14に記載のデータ処理方法。
【請求項17】
前記圧縮フレームは、前記圧縮中フレームにおける複数のユニットのうちの各ユニットに対応する前記符号化関数及び前記エッジ調整係数を含む、ことを特徴とする請求項14に記載のデータ処理方法。
【請求項18】
前述した、復号化関数を確定することは、
予め設定された復号化関数群から前記符号化関数に対応する関数を前記復号化関数として選択することを含む、ことを特徴とする請求項17に記載のデータ処理方法。
【請求項19】
前述した、前記エッジ調整係数に対応する前記エッジ補償係数を用いて前記第2のエッジの振幅を補償することは、
前記エッジ調整係数と前記エッジ補償係数との相関関係に基づいて、前記エッジ補償係数を確定して、前記第2のエッジの振幅を補償することを含む、ことを特徴とする請求項17に記載のデータ処理方法。
【請求項20】
前述した、前記圧縮フレームに対してデータ伸長を行うことは、
前記圧縮フレームに対してまず復号化を行い、次に前記エッジ補償を行う方法、
前記圧縮フレームに対して前記復号化を行う間に前記エッジ補償を行う方法、及び
前記圧縮フレームに対してまず前記エッジ補償を行い、次に前記復号化を行う方法のうちの少なくとも一つを含む、ことを特徴とする請求項10に記載のデータ処理方法。
【請求項21】
前記相関関係は、
前記エッジ補償により、前記伸長フレームの低周波数から中周波数領域の任意の周波数での振幅が前記初期フレームの85%以上になることを含む、ことを特徴とする請求項10に記載のデータ処理方法。
【請求項22】
前記相関関係は、
前記エッジ補償により、前記初期フレームに対して前記伸長フレームの中周波数領域での振幅が穏やかに増加することをさらに含む、ことを特徴とする請求項21に記載のデータ処理方法。
【請求項23】
前記相関関係は、
前記エッジ補償により、前記初期フレームに対して前記伸長フレームの高周波数領域での振幅が穏やかに低減することをさらに含む、ことを特徴とする請求項21に記載のデータ処理方法。
【請求項24】
データ処理システムであって、
データを処理するための少なくとも一つの命令セットが記憶されている少なくとも一つの記憶媒体と、
前記少なくとも一つの記憶媒体と通信的に接続される少なくとも一つのプロセッサとを含み、
ここで、前記システムが作動する場合、前記少なくとも一つのプロセッサは、前記少なくとも一つの命令セットを読み取り、且つ前記少なくとも一つの命令セットの指示に従って請求項10~23のいずれか一項に記載のデータ処理方法を実行する、ことを特徴とするデータ処理システム。
【発明の詳細な説明】
【技術分野】
【0001】
本明細書は、データ処理分野に関し、特にデータ処理方法及びシステムに関する。
【背景技術】
【0002】
インターネット技術の普及、特に移動端末の普及に伴い、通信ネットワークにはますます多くのタイプのデータが現れるようになり、コンピュータの普及に伴い、ますます多くのデータ、例えば、ビデオデータ、オーディオデータなどがますます多くのネットワーク及び記憶リソースを占有するようになってきた。データには膨大な情報量が含まれ、記憶及び伝送に対する要求が高いことが多いため、記憶及び伝送を容易にするために、データを圧縮し、必要な時に圧縮されたデータを伸長し復元することがしばしば行われる。そのため、データ圧縮及び伸長技術はますます多く応用されている。
【0003】
例えば、ビデオ及び画像圧縮技術は、ここ数十年でますます多く応用されてきた。ビデオには膨大な情報量が含まれることが多い。従来のラジオ、映画、テレビ放送から現在の大量の監視及びインターネットアプリケーションに至るまでの圧縮後の画像ビデオ及び画像は、ますます多くのネットワーク及び記憶リソースを占有するようになっている。これにより、ネットワークを介してビデオの生データをある端末から別の端末に伝送する場合、大量のネットワークリソースを占有することになる。これにより、リアルタイムのビデオ伝送の場合に、画面のスムーズな伝送が困難になることがある。そのため、伝送を容易にするために、ビデオデータを伝送する前に、まずデータ圧縮装置で圧縮する必要がある。圧縮されたビデオが伝送媒体を介してデータ伸長装置に伝送された後、データ伸長装置は、前記ビデオを伸長してビデオ画像を少なくとも部分的に復元する。
【0004】
従来技術における主なビデオ圧縮規格は、H.264及びH.265規格である。伝送前、通常、H.264及びH.265規格に従って符号化器でビデオを全体的に圧縮し、伝送後に、H.264及びH.265規格に従って復号化器でビデオを全体的に伸長する。しかし、ビデオを全体的に圧縮する上記処理方法は、計算量と伸長後のビデオ明瞭度とのバランスに関して満足のいくものではない。それは、H.264及びH.265規格が、前記原ビデオを処理する場合に様々な複雑なアルゴリズムによって原フレームの予測フレームを生成し、そして前記原フレームと前記予測フレームとの残差を記録する必要があるからである。前記予測フレームが前記原フレームに近いほど、残差が小さくなり、ビデオを符号化した後のデータ量が少なくなる。符号化をより容易にするために、原フレームをフィルタリングすることによって原フレーム画像における高周波数情報を減少させる方法が一般的である。フーリエ変換から分かるように、画像において、物体のエッジ部分の周波数情報は豊かである場合が多く、エッジ部分の高周波数成分は、通常、他の緩やかな領域の高周波数成分より大きい。そのため、高周波数情報が減少したフレーム画像は、視覚的にぼやけている(つまり画像の明瞭度が低下した)が、予測フレームとフィルタリングされた原フレームとの残差をより小さくすることができる。これにより、ビデオ符号化に必要な計算量及び符号化後のデータストリームはいずれも大幅に低減された。しかしながら、フレーム予測の技術は、非常に複雑であり、大量の計算リソースを占有する。ビデオの符号化・復号化システムを例にとると、平均で符号化効率が30%~40%向上するごとに、計算量は約10倍増加する。それとともに、伝送後のデータは、伸長された後に明瞭度が低下し、且つ様々なノイズ、例えば、ブロッキングアーティファクト又はリンギングアーティファクトが発生することが多い。前記ブロッキングアーティファクトとは、画像処理における、ブロックベースのフーリエ変換によって生じる画像エッジの不連続現象を指す。前記リンギングアーティファクトとは、画像処理において、ある画像に対してスペクトル調整処理を行う際、選択したスペクトル調整関数の値に大きな変化がある(つまり導関数が激しく変化する領域が存在する)場合、鐘が叩かれた後に空気振動が発生するように、階調が激しく変化する部分で出力画像に階調振動が発生することを指す。前記ノイズは画像エッジに多く現れる。ある出力画像に強いノイズが存在する場合、データの明瞭度に対する人々のますます高まる要求を満たすことができない。そのため、データの圧縮効率をさらに向上させるとともにデータ伸長後の明瞭度を向上させ、ノイズを除去することは、データ圧縮及び伸長技術分野で求められている目標である。
【0005】
そのため、データの伝送効率及びデータ伸長後の明瞭度を向上させるために、圧縮効率がより高く、且つデータ伸長がより鮮明なデータ処理方法及びシステムが必要とされている。
【発明の概要】
【0006】
本明細書は、圧縮効率がより高く、且つデータ伸長がより鮮明なデータ処理方法及びシステムを提供する。ビデオデータを例にとると、前記データ処理方法及びシステムは、初期ビデオデータにおける初期フレームを複数のユニットに分割し、各ユニットの中周波数から高周波数領域の振幅を取得し、異なるエッジ調整係数を用いて各ユニットにおける中周波数から高周波数領域の振幅を調整することによって、前記初期フレームの前記中周波数から前記高周波数領域での振幅を低減することができる。現在のユニットにおける中周波数から高周波数領域の振幅が大きく、現在のユニットには強いエッジが含まれることを示す場合、1より小さく0より大きいエッジ調整係数を用いて、現在のユニットの中周波数から高周波数領域の振幅を調整して、現在のユニットの中周波数から高周波数領域の振幅を低減することによって、現在のユニットにおける中周波数から高周波数領域内の信号強度を低下させて、データ情報量を減少させ、予測し残差を求める際にデータ圧縮の効率を向上させることができる。現在のユニットにおける中周波数から高周波数領域の振幅が小さく、現在のユニットには弱いエッジが含まれることを示す場合、1より大きいエッジ調整係数を用いて、現在のユニットの中周波数から高周波数領域の振幅を調整して、現在のユニットの中周波数から高周波数領域の振幅を増強することによって、現在のユニットにおける弱いエッジがデータ圧縮(予測し残差を求める)中に失われることを回避し、ディテール損失を回避する。前記データ処理方法及びシステムは、データ圧縮の効率を向上させるとともに弱いエッジのデータ情報量を増加させることによって、データ圧縮過程でディテール損失を引き起こすことを回避し、即ちデータ圧縮効率を向上させるとともにデータ歪みを減少させることができる。
【0007】
圧縮フレームに対してデータ伸長を行う場合、前記方法及びシステムは、データ圧縮際のユニットをデータ伸長ユニットとして、エッジ調整係数に対応するエッジ補償係数を用いて、各ユニットの中周波数から高周波数領域の振幅に対してエッジ補償を行うことによって、データ圧縮過程で低下した中周波数から高周波数領域の振幅を補償して、伸長フレームを得ることができる。前記エッジ補償は前記エッジ調整に対応し、エッジ補償係数とエッジ調整係数との間には対応する関係が存在する。前記エッジ補償は、前記エッジ調整が施された圧縮データを初期フレームの明瞭度又は前記初期フレームよりも高い明瞭度に復元することができる。つまり、復号化側は、符号化・復号化の計算量を著しく増加することなく、少なくとも伸長データの重要な周波数内のデータを初期フレームの明瞭度に復元することができ、さらに初期フレームよりも高い明瞭度を取得することができる。
【0008】
初期フレームのエッジ調整過程におけるエッジ調整係数がいずれも0より大きく、圧縮フレームにおける情報が欠落していないため、前記エッジ調整係数と前記エッジ補償係数との関係及びそれぞれの特徴に基づいて、エッジ調整係数及びエッジ補償係数を設計し、圧縮フレームにおける情報を復元することができる。前記方法及びシステムは、データの圧縮効率を著しく向上させ、データの伝送効率を向上させ、データロスを減少させ、ディテール損失を回避するとともに、ノイズを除去し、伸長後のデータの明瞭度を向上させることができる。
【0009】
これに基づいて、第1の態様によれば、本明細書は、データ処理方法を提供し、前記方法は、初期データにおける、予め設定されたバイト数の初期データを含む初期フレームを選択することと、前記初期フレームに対してデータ圧縮を行い、圧縮フレームを得ることとを含み、ここで、前記データ圧縮は、前記圧縮中フレームに対してエッジ調整を行うことを含み、前記圧縮中フレームは、前記初期フレームと、前記データ圧縮過程において前記圧縮フレームになる前の前記初期フレームのいずれかのデータ状態とを含み、ここで、前記エッジ調整は、それらに対応するエッジ調整係数を用いて、前記圧縮中フレームの複数のユニットのうちの各ユニットの中周波数から高周波数領域での振幅を調整して、前記圧縮中フレームの前記中周波数から前記高周波数領域での振幅を低減することを含み、前記エッジ調整係数が0より大きい。
【0010】
いくつかの実施例において、前述した、圧縮中フレームに対してエッジ調整を行うことは、予め設定されたユニットサイズに基づいて前記圧縮中フレームを前記複数のユニットに分割することと、それらに対応する前記エッジ調整係数を用いて、前記各ユニットの中周波数から高周波数領域での振幅を調整することとを含む。
【0011】
いくつかの実施例において、前述した、それらに対応する前記エッジ調整係数を用いて、前記各ユニットの中周波数から高周波数領域での振幅を調整することは、前記各ユニットに対して、予め設定された符号化関数群から一つの関数を符号化関数として選択し、前記符号化関数によってそれらを調整して、第1のユニットを得て、それらの周波数領域内の低周波数領域での成分が保持されているが中周波数から高周波数領域での成分が減衰されるようにすることと、それらと前記第1のユニットとの差を求め、それらに対応する第1のエッジを取得することであって、前記第1のエッジはそれらの前記中周波数から前記高周波数領域での成分を含むことと、それらに対応する前記エッジ調整係数を用いて前記第1のエッジの振幅を調整して、それらに対応する符号化エッジを得ることと、前記第1のユニットと前記符号化エッジを重畳することとを含む。
【0012】
いくつかの実施例において、前述した、それらに対応する前記エッジ調整係数を用いて前記第1のエッジの振幅を調整することは、前記第1のエッジのエッジ値が予め設定された第1の閾値より小さいことを確定し、1より大きい前記エッジ調整係数によって前記第1のエッジの振幅を増強すること、又は前記第1のエッジのエッジ値が予め設定された第2の閾値より大きいことを確定し、1により小さい前記エッジ調整係数によって前記第1のエッジの振幅を低減することを含む。
【0013】
いくつかの実施例において、前述した、1より大きい前記エッジ調整係数によって前記第1のエッジの振幅を増強することは、予め設定された第1のエッジ調整係数群から一つの係数を前記エッジ調整係数として選択して、前記第1のエッジの振幅を増強することであって、前記第1のエッジ調整係数群における係数がいずれも1より大きいことを含み、前述した、1より小さい前記エッジ調整係数によって前記第1のエッジの振幅を低減することは、予め設定された第2のエッジ調整係数群から一つの係数を前記エッジ調整係数として選択して、前記第1のエッジの振幅を低減することであって、前記第2のエッジ調整係数群における係数がいずれも1より小さいことを含む。
【0014】
いくつかの実施例において、前述した、それらに対応する前記エッジ調整係数を用いて前記第1のエッジの振幅を調整することは、歪曲率及び符号化率の加重値を最適化目標とし、最適化アルゴリズムに基づいて、前記エッジ調整係数を取得し、前記エッジ調整係数により前記第1のエッジの振幅を調整することを含む。
【0015】
いくつかの実施例において、前述した、前記初期フレームに対してデータ圧縮を行うことは、前記初期フレームに対してまず前記エッジ調整を行い、次に前記エッジ調整された初期フレームを予測し残差を求める方法、前記初期フレームに対してまず予測を行って予測フレームを得て、次に前記初期フレーム及び前記予測フレームに対して前記エッジ調整を行い、残差を求める方法、及び前記初期フレームに対してまず予測を行い、残差を求め、次に前記残差に対して前記エッジ調整を行う方法のうちの少なくとも一つを含む。
【0016】
いくつかの実施例において、前記圧縮フレームは、前記複数のユニットのうちの各ユニットに対応する前記符号化関数及び前記エッジ調整係数をさらに含む。
【0017】
第2の態様によれば、本明細書は、データ処理システムをさらに提供し、前記システムは、少なくとも一つの記憶媒体と少なくとも一つのプロセッサとを含み、前記少なくとも一つの記憶媒体には、データを処理するための少なくとも一つの命令セットが記憶されており、前記少なくとも一つのプロセッサは、前記少なくとも一つの記憶媒体に通信的に接続され、ここで、前記システムが作動する場合、前記少なくとも一つのプロセッサは、前記少なくとも一つの命令セットを読み取り、且つ前記少なくとも一つの命令セットの指示に従って本明細書の第1の態様に記載のデータ処理方法を実行する。
【0018】
第3の態様によれば、本明細書は、データ処理方法をさらに提供し、前記方法は、圧縮データを取得することであって、前記圧縮データは初期フレームに対してデータ圧縮を行って得られた圧縮フレームを含み、前記データ圧縮はエッジ調整を含むことと、前記圧縮フレームに対してデータ伸長を行い、伸長フレームを得ることとを含み、前記データ伸長は、伸長中フレームに対してエッジ補償を行うことを含み、前記伸長中フレームは、前記圧縮フレームと、前記データ伸長過程において前記伸長フレームになる前の前記圧縮フレームのいずれかのデータ状態とを含み、ここで、前記エッジ補償と前記エッジ調整とは予め設定された相関関係にある。
【0019】
いくつかの実施例において、前記エッジ調整は、それらに対応するエッジ調整係数を用いて、圧縮中フレームの複数のユニットのうちの各ユニットの中周波数から高周波数領域での振幅を調整して、前記圧縮中フレームの前記中周波数から前記高周波数領域での振幅を低減することを含み、前記エッジ調整係数が0より大きく、前記圧縮中フレームは、前記初期フレームと、前記データ圧縮過程において前記圧縮フレームになる前の前記初期フレームのいずれかのデータ状態とを含み、前記エッジ補償は、前記相関関係に基づいて、前記エッジ調整係数に対応するエッジ補償係数を用いて、前記伸長中フレームの前記複数のユニットのうちの前記各ユニットの中周波数から高周波数領域での振幅を補償することを含む。
【0020】
いくつかの実施例において、前述した、圧縮中フレームに対してエッジ調整を行うことは、予め設定されたユニットサイズに基づいて前記圧縮中フレームを前記複数のユニットに分割することと、それらに対応する前記エッジ調整係数を用いて、前記各ユニットの中周波数から高周波数領域での振幅を調整することであって、前記各ユニットに対して、予め設定された符号化関数群から一つの関数を符号化関数として選択し、前記符号化関数によってそれらを調整して、第1のユニットを得て、それらの周波数領域内の低周波数領域での成分が保持されているが中周波数から高周波数領域での成分が減衰されるようにすることと、それらと前記第1のユニットとの差を求め、それらに対応する第1のエッジを取得することであって、前記第1のエッジはそれらの前記中周波数から前記高周波数領域での成分を含むことと、それらに対応する前記エッジ調整係数を用いて前記第1のエッジの振幅を調整して、それらに対応する符号化エッジを得ることと、前記第1のユニットと前記符号化エッジを重畳することとを含むこととを含む。
【0021】
いくつかの実施例において、前述した、伸長中フレームに対してエッジ補償を行うことは、予め設定された前記ユニットサイズに基づいて前記伸長中フレームを前記複数のユニットに分割することと、前記エッジ調整係数に対応する前記エッジ補償係数を用いて、前記各ユニットの中周波数から高周波数領域での振幅を補償することとを含む。
【0022】
いくつかの実施例において、前述した、前記エッジ調整係数に対応する前記エッジ補償係数を用いて、前記各ユニットの中周波数から高周波数領域での振幅を補償することは、前記各ユニットに対して、復号化関数を確定し、前記復号化関数によってそれらを調整して、第2のユニットを得て、それらの周波数領域内の低周波数領域での成分が保持されているが中周波数から高周波数領域での成分が減衰されるようにすることと、それらと前記第2のユニットとの差を求め、それらに対応する第2のエッジを取得することであって、前記第2のエッジはそれらの前記中周波数から前記高周波数領域での成分を含むことと、前記エッジ調整係数に対応する前記エッジ補償係数を用いて前記第2のエッジの振幅を補償して、それらに対応する復号化エッジを得ることと、前記現在のユニットと前記復号化エッジを重畳することとを含む。
【0023】
いくつかの実施例において、前述した、復号化関数を確定することは、予め設定された復号化関数群から一つの関数を前記復号化関数として選択することを含む。
【0024】
いくつかの実施例において、前述した、前記エッジ調整係数に対応する前記エッジ補償係数を用いて前記第2のエッジの振幅を補償することは、予め設定されたエッジ補償係数群から一つの係数を前記エッジ補償係数として選択して、前記第2のエッジの振幅を補償することを含む。
【0025】
いくつかの実施例において、前記圧縮フレームは、前記圧縮中フレームにおける複数のユニットのうちの各ユニットに対応する前記符号化関数及び前記エッジ調整係数を含む。
【0026】
いくつかの実施例において、前述した、復号化関数を確定することは、予め設定された復号化関数群から前記符号化関数に対応する関数を前記復号化関数として選択することを含む。
【0027】
いくつかの実施例において、前述した、前記エッジ調整係数に対応する前記エッジ補償係数を用いて前記第2のエッジの振幅を補償することは、前記エッジ調整係数と前記エッジ補償係数との相関関係に基づいて、前記エッジ補償係数を確定して、前記第2のエッジの振幅を補償することを含む。
【0028】
いくつかの実施例において、前述した、前記圧縮フレームに対してデータ伸長を行うことは、前記圧縮フレームに対してまず復号化を行い、次に前記エッジ補償を行う方法、前記圧縮フレームに対して前記復号化を行う間に前記エッジ補償を行う方法、及び前記圧縮フレームに対してまず前記エッジ補償を行い、次に前記復号化を行う方法のうちの少なくとも一つを含む。
【0029】
いくつかの実施例において、前記相関関係は、前記エッジ補償により、前記伸長フレームの低周波数から中周波数領域の任意の周波数での振幅が前記初期フレームの85%以上になることを含む。
【0030】
いくつかの実施例において、前記相関関係は、前記エッジ補償により、前記初期フレームに対して前記伸長フレームの中周波数領域での振幅が穏やかに増加することをさらに含む。
【0031】
いくつかの実施例において、前記相関関係は、前記エッジ補償により、前記初期フレームに対して前記伸長フレームの高周波数領域での振幅が穏やかに低減することをさらに含む。
【0032】
第4の態様によれば、本明細書は、データ処理システムをさらに提供し、前記システムは、少なくとも一つの記憶媒体と少なくとも一つのプロセッサとを含み、前記少なくとも一つの記憶媒体には、データを処理するための少なくとも一つの命令セットが記憶されており、前記少なくとも一つのプロセッサは、前記少なくとも一つの記憶媒体に通信的に接続され、ここで、前記システムが作動する場合、前記少なくとも一つのプロセッサは、前記少なくとも一つの命令セットを読み取り、且つ前記少なくとも一つの命令セットの指示に従って本明細書の第3の態様に記載のデータ処理方法を実行する。
【0033】
本明細書によるデータ処理方法及びシステムの他の機能は、以下に続く説明で部分的に記述される。説明によれば、以下の数字及び例に示される内容は、当業者にとって自明である。本明細書によるデータ処理方法、システム及び記憶媒体の創造的な態様は、以下の詳細な例に記載の方法、装置及び組み合わせの実践又は使用によって十分に解釈され得る。
【図面の簡単な説明】
【0034】
本明細書の実施例における技術案をより明確に説明するために、以下では、実施例の説明で使用する必要がある図面を簡単に説明するが、明らかなことに、以下の説明における図面は、本明細書の一部の実施例に過ぎず、当業者にとっては、創造的な労力を払うことなく、これらの図面に基づいて他の図面を入手することができる。
【
図1】本明細書の実施例によるデータ処理システムの概略図である。
【
図2】本明細書の実施例によるデータ処理のデータ圧縮装置の概略図である。
【
図3A】本明細書の実施例によるデータ圧縮及びデータ伸長のフローチャートである。
【
図3B】本明細書の実施例によるデータ圧縮及びデータ伸長のフローチャートである。
【
図3C】本明細書の実施例によるデータ圧縮及びデータ伸長のフローチャートである。
【
図4A】本明細書の実施例による、データを圧縮するデータ処理方法のフローチャートである。
【
図4B】本明細書の実施例によるエッジ調整のフローチャートである。
【
図5】本明細書の実施例によるエッジ調整の構造ブロック図である。
【
図6】本明細書の実施例による符号化関数のグラフである。
【
図7A】本明細書の実施例による、圧縮フレームを伸長するデータ処理方法のフローチャートである。
【
図7B】本明細書の実施例によるエッジ補償のフローチャートである。
【
図8】本明細書の実施例によるエッジ補償の構造フローチャートである。
【
図9A】本明細書の実施例による全体的調整関数H
0(f)のグラフである。
【
図9B】本明細書の実施例による全体的調整関数H
0(f)のグラフである。
【
図9C】本明細書の実施例による全体的調整関数H
0(f)のグラフである。
【
図9D】本明細書の実施例による全体的調整関数H
0(f)のグラフである。
【
図10A】本明細書の実施例による通常モードの全体的調整関数H
0(f)、エッジ調整関数H
1(f)及び復号化関数H
2(f)のグラフである。
【
図10B】本明細書の実施例による増強モードの全体的調整関数H
0(f)、エッジ調整関数H
1(f)及び復号化関数H
2(f)のグラフである。
【発明を実施するための形態】
【0035】
以下の説明は、当業者が本明細書における内容を作成及び使用することを可能にするために、本明細書の特定の適用シーンと要件を提供した。開示された実施例に対する様々な部分的な修正は、当業者にとって明らかであり、且つここで定義された一般原理は、本明細書の精神及び範囲から逸脱することなく、他の実施例及び用途に適用され得る。そのため、本明細書は、示された実施例に限定されるものではなく、請求項と一致する最も広い範囲である。
【0036】
ここで使用される用語は、特定の例示的な実施例を説明する目的のためだけのものであり、限定するものではない。例えば、文脈が別途明確に指示しない限り、ここで使用される単数形「一」、「一つ」及び「該」は、複数形を含むものでもあり得る。本明細書で使用される場合、「含む」、「包含」及び/又は「含有」という用語は、関連する整数、ステップ、動作、要素及び/又はコンポーネントの存在を意味するが、一つ又は複数の他の特徴、整数、ステップ、動作、要素、コンポーネント及び/又はグループの存在を排除するものではなく、又は該システム/方法に他の特徴、整数、ステップ、動作、要素、コンポーネント及び/又はグループが追加されてもよい。
【0037】
以下の説明を考慮すると、本明細書のこれらの特徴及び他の特徴、並びに構造の関連素子の動作及び機能、並びに部品の組み合わせ及び製造の経済性を明らかに向上させることができる。図面を参照すると、その全ては本明細書の一部を形成する。しかしながら、図面は、例示及び説明のみを目的とし、本明細書の範囲を限定することを意図していないことが明確に理解されるべきである。図面は縮尺どおりに描かれていないことも理解されるべきである。
【0038】
本明細書で使用されるフローチャートは、本明細書のいくつかの実施例によるシステム実現の動作を示す。フローチャートの動作は順序を違えて実現され得ることが明確に理解されるべきである。逆に、動作は、逆順で、又は同時に実現され得る。なお、フローチャートに一つ又は複数の他の動作を追加してもよい。フローチャートから一つ又は複数の動作を除去してもよい。
【0039】
一態様では、本明細書は、データ処理システム100(以下にシステム100と略称する)を提供する。第2の態様では、本明細書は、データを圧縮するデータ処理方法P200を記述し、第3の態様では、本明細書は、圧縮フレームを伸長するデータ処理方法P300を記述する。
【0040】
図1は、データ処理システム100の概略図を示した。システム100は、データ圧縮装置200と、データ伸長装置300と、伝送媒体120とを含んでもよい。
【0041】
データ圧縮装置200は、圧縮される初期データにおける初期フレームを受信し、本明細書で提案されるデータ処理方法P200を用いて初期データを圧縮して圧縮フレームを生成することができる。データ圧縮装置200は、本明細書に記述されるデータ処理方法P200を実行するデータ又は命令を記憶し、且つ前記データ及び/又は命令を実行することができる。
【0042】
データ伸長装置300は、圧縮フレームを受信し、本明細書で提案されるデータ処理方法P300を用いて圧縮フレームを伸長して伸長フレームを得ることができる。データ伸長装置300は、本明細書に記述されるデータ処理方法P300を実行するデータ又は命令を記憶し、前記データ及び/又は命令を実行することができる。
【0043】
データ圧縮装置200及びデータ伸長装置300は、広範囲の装置を含んでもよい。例えば、データ圧縮装置200及びデータ伸長装置300は、デスクトップコンピュータ、モバイルコンピューティングデバイス、ノート(例えば、ラップトップ)コンピュータ、タブレットコンピュータ、セットトップボックス、スマートフォンなどのハンドセット、テレビ、カメラ、表示装置、デジタルメディアプレーヤー、ビデオゲームコンソール、車載コンピュータなどを含んでもよい。
【0044】
図1に示すように、データ圧縮装置200とデータ伸長装置300は、伝送媒体120を介して接続され得る。伝送媒体120は、情報及び/又はデータの伝送を容易にすることができる。伝送媒体120は、圧縮フレームをデータ圧縮装置200からデータ伸長装置300に伝送できる任意のデータキャリアであってもよい。例えば、伝送媒体120は、記憶媒体(例えば、光ディスク)、有線又は無線通信媒体であってもよい。前記通信媒体は、ネットワークであってもよい。いくつかの実施例において、伝送媒体120は、任意のタイプの有線又は無線ネットワークであってもよいし、それらの組み合わせであってもよい。例えば、伝送媒体120は、ケーブルネットワーク、有線ネットワーク、光ファイバネットワーク、電気通信ネットワーク、イントラネット、インターネット、ローカルエリアネットワーク(LAN)、ワイドエリアネットワーク(WAN)、無線ローカルエリアネットワーク(WLAN)、メトロポリタンエリアネットワーク(MAN)、ワイドエリアネットワーク(WAN)、公衆交換電話網(PSTN)、ブルートゥースネットワーク、ZigBeeネットワーク、近距離通信(NFC)ネットワークなどを含んでもよい。データ伸長装置300及びデータ圧縮装置200における一つ又は複数のコンポーネントは、データ及び/又は情報を伝送するために伝送媒体120に接続されてもよい。伝送媒体120は、ルータ、スイッチ、基地局、又はデータ圧縮装置200からデータ伸長装置300への通信を容易にする他の装置を含んでもよい。別の実施例において、伝送媒体120は、記憶媒体、例えば、大容量メモリ、リムーバブルメモリ、揮発性リードライトメモリ、リードオンリメモリ(ROM)など、又はそれらの任意の組み合わせであってもよい。例示的大容量メモリは、磁気ディスク、光ディスク、ソリッドステートドライブなどの非一時的な記憶媒体(non-transitory storage medium)を含み得る。リムーバブルメモリは、フラッシュドライブ、フロッピーディスク、光ディスク、メモリカード、zip磁気ディスク、磁気テープなどを含み得る。典型的な揮発性リードライトメモリは、ランダムアクセスメモリ(RAM)を含み得る。RAMは、ダイナミックRAM(DRAM)、ダブルデータレート同期式ダイナミックRAM(DDR SDRAM)、スタティックRAM(SRAM)、サイリスタRAM(T-RAM)及びゼロキャパシタRAM(Z-RAM)などを含み得る。ROMは、マスクROM(MROM)、プログラマブルROM(PROM)、消去可能なプログラマブルROM(PEROM)、電気的消去可能プログラマブルROM(EEPROM)、光ディスク(CD-ROM)及びデジタル多用途ディスクROMなどを含み得る。いくつかの実施例において、伝送媒体120はクラウドプラットフォームであってもよい。単なる例として、前記クラウドプラットフォームは、プライベートクラウド、パブリッククラウド、ハイブリッドクラウド、コミュニティクラウド、分散型クラウド、インタークラウドなどの形態、又は上記形態に類似する形態、又はこれらの上記形態の任意の組み合わせを含み得る。
【0045】
図1に示すように、データ圧縮装置200は、初期データを受信し、本明細書に記述されるデータ処理方法P200の命令を実行し、初期データに対してデータ圧縮を行い、圧縮フレームを生成し、前記圧縮フレームは伝送媒体120を介してデータ伸長装置300に伝送され、データ伸長装置300は、本明細書に記述されるデータ処理方法P300の命令を実行し、圧縮フレームに対してデータ伸長を行い、伸長フレームを得る。
【0046】
図2は、データ処理のデータ圧縮装置200の概略図を示した。データ圧縮装置200は、本明細書に記述されるデータ処理方法P200を実行することができる。前記データ処理方法P200は、本明細書の他の部分で紹介される。
【0047】
図2に示すように、データ圧縮装置200は、少なくとも一つの記憶媒体230と、少なくとも一つの圧縮側プロセッサ220とを含む。いくつかの実施例において、データ圧縮装置200は、通信ポート250と、内部通信バス210とをさらに含んでもよい。それとともに、データ圧縮装置200は、I/Oコンポーネント260をさらに含んでもよい。
【0048】
内部通信バス210は、記憶媒体230と圧縮側プロセッサ220を含む様々なシステムコンポーネントに接続されてもよい。
【0049】
I/Oコンポーネント260は、データ圧縮装置200と他のコンポーネントとの間の入力/出力をサポートする。
【0050】
記憶媒体230は、データ記憶装置を含んでもよい。前記データ記憶装置は、非一時的な記憶媒体であってもよいし、一時的な記憶媒体であってもよい。例えば、前記データ記憶装置は、磁気ディスク232、読み取り専用記憶媒体(ROM)234又はランダムアクセス記憶媒体(RAM)236のうちの一つ又は複数を含んでもよい。記憶媒体230は、前記データ記憶装置に記憶されている少なくとも一つの命令セットをさらに含む。前記命令は、コンピュータプログラムコードであり、前記コンピュータプログラムコードは、本明細書によるデータ処理方法を実行するプログラム、ルーチン、オブジェクト、コンポーネント、データ構造、プロセス、モジュールなどを含んでもよい。
【0051】
通信ポート250は、データ圧縮装置200と外部とのデータ通信に用いられる。例えば、データ圧縮装置200は、通信ポート250を介して伝送媒体120に接続され得る。
【0052】
少なくとも一つの圧縮側プロセッサ220は、内部通信バス210を介して、少なくとも一つの記憶媒体230に通信的に接続される。少なくとも一つの圧縮側プロセッサ220は、上記少なくとも一つの命令セットを実行するためのものである。システム100が作動する場合、少なくとも一つの圧縮側プロセッサ220は、前記少なくとも一つの命令セットを読み取り、且つ前記少なくとも一つの命令セットの指示に従ってデータ処理方法P200を実行する。圧縮側プロセッサ220は、データ処理方法P200に含まれる全てのステップを実行することができる。圧縮側プロセッサ220は、一つ又は複数のプロセッサの形態であってもよく、いくつかの実施例において、圧縮側プロセッサ220は、一つ又は複数のハードウェアプロセッサ、例えば、マイクロコントローラ、マイクロプロセッサ、縮小命令セットコンピュータ(RISC)、専用集積回路(ASIC)、特定用途向け命令セットプロセッサ(ASIP)、中央処理ユニット(CPU)、グラフィックス処理ユニット(GPU)、物理処理ユニット(PPU)、マイクロコントローラユニット、デジタル信号プロセッサ(DSP)、フィールドプログラマブルゲートアレイ(FPGA)、アドバンスドRISCマシン(ARM)、プログラマブルロジックデバイス(PLD)、一つ又は複数の機能を実行できる任意の回路もしくはプロセッサなど、又はそれらの任意の組み合わせを含んでもよい。単に問題を説明するために、本明細書では、データ圧縮装置200には一つの圧縮側プロセッサ220のみが説明されている。しかしながら、注意すべきこととして、本明細書におけるデータ圧縮装置200は、複数のプロセッサをさらに含んでもよく、そのため、本明細書に開示された動作及び/又は方法ステップは、本明細書に記載されるように一つのプロセッサによって実行されてもよいし、複数のプロセッサによって共同で実行されてもよい。例えば、本明細書において、データ圧縮装置200の圧縮側プロセッサ220がステップA及びステップBを実行する場合、理解すべきこととして、ステップA及びステップBは、二つの異なる圧縮側プロセッサ220によって共同で又は別々に実行されてもよい(例えば、第1のプロセッサがステップAを実行し、第2のプロセッサがステップBを実行し、又は第1の及び第2のプロセッサがステップA及びBを共同で実行する)。
【0053】
上記構造ではデータ圧縮装置200について説明したが、この構造はデータ伸長装置300にも適用可能である。データ伸長装置300は、本明細書に記述されるデータ処理方法P300を実行することができる。前記データ処理方法P300は、本明細書の他の部分で紹介される。
【0054】
データ処理方法P200、P300及びシステム100は、データの圧縮及び伸長に用いられて、前記データの伝送効率を向上させ、リソース及びスペースを節約することができる。前記データは、非リアルタイムデータであってもよいし、リアルタイムデータであってもよい。従来のラジオ、映画、テレビ放送から現在の大量の監視及びインターネットアプリケーションまでには、様々なデータが存在する。例えば、前記データは、非リアルタイムのビデオデータ、オーディオデータ又は画像データなどであってもよい。前記データはさらに、リアルタイムの地図データ、リアルタイムのセンサデータ、リアルタイムのビデオ監視データ、ネットワーク観測データ、気象データ、航空宇宙データなどであってもよい。例えば、前記データは、自動運転車が走行中に基地局から受信する地図データであってもよい。本明細書は、前記データの具体的なカテゴリについては限定しない。本明細書に記載のデータ処理方法P200、P300及びシステム100は、異なるカテゴリのデータを処理する際の方法及びステップが一致しており、説明を容易にするために、本明細書ではビデオデータの処理を例として説明する。
【0055】
データ圧縮及びデータ伸長では、フレーム単位で圧縮及び伸長を行うことが多い。フレームは、データ系列を構成する処理単位である。初期データには、一つ又は複数の初期フレームが含まれてもよい。各初期フレームは、予め設定されたバイト数の初期データを含む。ビデオ圧縮では、前記初期データは初期ビデオデータであってもよく、前記初期フレームは初期ビデオデータにおけるフレーム画像であってもよい。従来のビデオ圧縮技術では、通常、H.264及びH.265規格で初期ビデオデータを符号化することによって、前記ビデオデータを圧縮するという目的を達成する。H.264及びH.265規格でビデオデータを符号化する場合に、主に予測符号化という技術的手段を用い、即ちビデオデータにおける初期データを予測して予測値を得て、予測値と前記初期データの初期値とを減算して残差値を得ることによって、前記ビデオデータを圧縮する。復元及び伸長(即ち復号化)の場合に、残差値と予測値とを加算すれば前記初期フレームを復元することができる。
【0056】
本明細書によるデータ処理方法P200、P300及びシステム100は、データ圧縮を行う場合に、エッジ調整と符号化を組み合わせて、符号化際のデータ量を低減しビデオデータの圧縮効率を向上させ、ビデオの伝送効率を向上させることができ、データ伸長を行う場合に、エッジ補償と復号化を組み合わせて、エッジ調整及び符号化が施された圧縮データを伸長することによって、伸長後のデータを初期データに復元することができる。
【0057】
データ処理方法P200は、前記ビデオデータに対してデータ圧縮を行うことができる。データ処理方法P200は、符号化(即ち予測し残差を求める)とエッジ調整を組み合わせる方法を用いて、初期フレームに対してデータ圧縮を行い、圧縮フレームを得ることができる。具体的には、データ処理方法P200は、圧縮中フレームに対して前記エッジ調整及び前記符号化を行うことができる。前記圧縮中フレームは、前記初期フレームと、前記データ圧縮過程において前記圧縮フレームになる前の前記初期フレームのいずれかのデータ状態とを含む。前記エッジ調整は、処理されるデータのスペクトログラムの振幅を調整することを指す。例えば、前記エッジ調整は、前記処理されるデータのその周波数領域内の選択された領域での振幅、例えば、中周波数領域の振幅、高周波数領域の振幅、さらに例えば、低周波数から中周波数領域の振幅、さらに例えば、中周波数から高周波数領域の振幅などを調整することができる。いくつかの実施例において、前記エッジ調整は、0より大きく1より小さいエッジ調整係数でその周波数領域内の選択された領域の振幅の減衰を実現することによって、前記処理されるデータにおけるデータ情報量を低減することができる。当業者であれば理解できるように、振幅が減衰されたデータは、選択された周波数領域内での周波数成分が小さくなり、データにおける情報量が減少したため、振幅が減衰されたデータを符号化する際の効率を向上させ、圧縮率を向上させることができる。
【0058】
データ処理方法P300は、データ処理方法P200により前記データ圧縮が行われた前記圧縮フレームに対してデータ伸長を行い、伸長フレームを得ることによって、前記ビデオデータを復元することができる。データ処理方法P300は、復号化(即ち残差値及び予測値に基づいて圧縮中フレームを復元する)とエッジ補償を組み合わせる方法を用いて、前記圧縮フレームに対してデータ伸長を行うことによって、前記圧縮フレームにおけるデータを復元することができる。具体的には、データ処理方法P300は、伸長中フレームに対して前記エッジ補償及び前記復号化を行うことができる。前記伸長中フレームは、前記圧縮フレームと、前記データ伸長過程において前記伸長フレームになる前の前記圧縮フレームのいずれかのデータ状態とを含んでもよい。前記エッジ補償は、他の計算誤差を考慮することなく、前記エッジ調整が施されたデータをエッジ調整前の状態に完全に復元するか又は近似的に復元することができる。
【0059】
そのため、データ処理方法P200、P300及びシステム100は、ビデオデータの圧縮効率を著しく向上させ、ビデオデータ圧縮際のデータロスを減少させ、ビデオの伝送効率、復元率及び伸長ビデオの明瞭度を向上させ、伸長後のビデオにおけるノイズを減少させることができる。前記エッジ調整及び前記エッジ補償の具体的なプロセスについては、後の説明で詳しく説明する。
【0060】
システム100がビデオデータに対してデータ圧縮を行う場合、前記エッジ調整と前記符号化の順序は、交換されてもよいし、交差して行われてもよい。前記エッジ調整は、前記符号化の前に行われてもよいし、前記符号化の後に行われてもよい。同様に、システム100が圧縮フレームに対してデータ伸長を行う場合、前記エッジ補償と前記復号化の順序は、交換されてもよいし、交差して行われてもよい。説明すべきこととして、伸長後のデータ情報が初期データにおける情報を復元できることを確保するために、前記データ伸長における前記エッジ補償及び前記復号化の順序と前記データ圧縮における前記エッジ調整及び前記符号化の順序とは対応しているべきであり、即ち前記エッジ補償及び前記復号化は、前記エッジ調整及び前記符号化と対称的に逆方向に動作することができる。例えば、前記圧縮フレームが前記エッジ調整を行ってから前記符号化を行うことで得られたものであれば、前記圧縮フレームに対してデータ伸長を行う場合に、まず前記復号化を行い、次に前記エッジ補償を行うべきである。説明を容易にするために、本発明者らは、データ圧縮処理前の前記初期フレームにおけるデータをP0と定義し、データ伸長装置300により伸長して得られた伸長フレームにおけるデータをP4と定義する。
【0061】
データ処理方法P200において、データ圧縮装置200は、前記初期フレームに対してデータ圧縮を行う際に、前記初期フレームに対して前記エッジ調整を行ってから前記符号化を行ってもよいし、前記初期フレームに対して前記符号化を行ってから前記エッジ調整を行ってもよい。
図3A~
図3Cは、本明細書の実施例によるいくつかのデータ圧縮及びデータ伸長のフローチャートを示した。
【0062】
図3Aは、本明細書の実施例によるデータ圧縮及びデータ伸長のフローチャートを示した。
図3Aに示すように、データ圧縮装置200が初期データに対してデータ圧縮を行うことは以下のとおりであってもよい。データ圧縮装置200は、まず前記初期フレームP
0に対して前記エッジ調整を行い、次に前記符号化を行い、即ち前記エッジ調整後の初期フレームに対して予測を行い、残差を求め、予測データPI及び残差データRを得て、前記予測データPI及び前記残差データRをビットストリーム生成モジュールに入力して合成し、前記圧縮フレームを得る。前記圧縮フレームは、前記予測データPIと前記残差データRとを含む。ここで、前記圧縮中フレームは、前記初期フレームP
0であってもよい。説明を容易にするために、本発明者らは、前記エッジ調整後のデータを符号化調整フレームP
1と定義する。前述のように、前記エッジ調整は、前記圧縮中フレーム(初期フレームP
0)を複数のユニットに分割し、対応するエッジ調整係数を用いて各ユニットに対して前記エッジ調整を行うことができる。いくつかの実施例において、データ圧縮装置200はさらに、前記エッジ調整における各ユニットに対応する符号化関数及びエッジ調整係数をもビットストリーム生成モジュールに入力して合成することができる。即ち前記圧縮フレームは、前記エッジ調整における前記各ユニットに対応する前記符号化関数及び前記エッジ調整係数をさらに含んでもよい。説明を容易にするために、本発明者らは、前記圧縮フレームにおける前記各ユニットに対応する前記符号化関数及び前記エッジ調整係数のデータを符号化データRAMI(Regional Amplitude Modulation Information)と定義する。説明を容易にするために、
図3Aにおいて、本発明者らは、前記圧縮フレームに符号化データRAMIが含まれることを例として説明する。前記エッジ調整における前記符号化関数及び前記エッジ調整係数については、後の説明で詳しく説明する。
図3Aに示すデータ圧縮方法は、符号化効率を向上させ、前記圧縮フレームにおけるデータ量をさらに減少させ、圧縮率を向上させることができるとともに、データロスを減少させ、ディテール損失を回避することができる。
【0063】
図3Aに示すように、データ伸長装置300が前記圧縮フレームに対してデータ伸長を行うことは以下のとおりであってもよい:データ伸長装置300は、前記圧縮フレームに対して前記復号化を行ってから前記エッジ補償を行う。具体的には、データ伸長装置300は、まず前記圧縮フレームに対して前記復号化を行い、即ちビットストリーム解析モジュールにより前記圧縮フレームを解析し、前記予測データPI、前記残差データR及び符号化データRAMIを生成し、次に前記予測データPIに基づいて予測して予測フレームを得て、前記残差データRと重畳して、復号化フレームを得ることができる。説明を容易にするために、本発明者らは、前記復号化フレームにおけるデータをP
2と定義する。そしてデータ伸長装置300は、符号化データRAMIに基づいて、符号化データRAMIに対応する復号化データを用いて、復号化フレームP
2に対して前記エッジ補償を行い、前記伸長フレームP
4を得て出力する。前記伸長中フレームは、前記復号化フレームP
2であってもよい。前述のように、前記エッジ補償は、前記伸長中フレーム(復号化フレームP
2)を複数のユニットに分割し、前記エッジ調整係数に対応するエッジ補償係数を用いて各ユニットに対して前記エッジ補償を行うことができる。前記復号化データは、前記各ユニットに対応する復号化関数及びエッジ補償係数を含んでもよい。前記復号化関数は前記符号化関数に対応し、前記エッジ補償係数は前記エッジ調整係数に対応する。そのため、データ伸長装置300は、前記符号化データRAMIに基づいて、前記各ユニットに対応する前記復号化関数及び前記エッジ補償係数を確定することができる。前記エッジ補償に対応する前記復号化関数及び前記エッジ補償係数の具体的な内容については、後の説明で詳しく説明する。説明を容易にするために、本発明者らは、伸長フレームP
4と初期データP
0との間の伝達関数を全体的スペクトル調整関数H
0(f)と定義する。
図3Aに示す形態は、前記圧縮フレームにおけるデータ量を減少させることによって、前記初期データの圧縮率及び符号化効率を向上させ、前記初期データの伝送効率を向上させることができるとともに、データロスを減少させ、ディテール損失を回避することができる。
【0064】
データ圧縮装置200が初期データに対してデータ圧縮を行うことは、前記エッジ調整を前記符号化過程に組み込むことであってもよい。前記エッジ調整は、前記符号化過程の任意の段階で行われ得る。それに応じて、前記エッジ補償も前記復号化過程の対応する段階で行われ得る。
【0065】
図3Bは、本明細書の実施例によるデータ圧縮及びデータ伸長のフローチャートを示した。
図3Bに示すように、データ圧縮装置200が初期データに対してデータ圧縮を行うことは以下のとおりであってもよい。データ圧縮装置200は、まず前記初期フレームP
0を予測し、予測フレーム及び予測データPIを得て、次に前記初期フレームP
0及び前記予測フレームに対して前記エッジ調整を行い、残差を求め、前記残差データRを得て、前記予測データPI、前記残差データR及び前記符号化データRAMIをビットストリーム生成モジュールに入力して合成し、前記圧縮フレームを得る。前記圧縮中フレームは、前記予測フレーム及び前記初期フレームP
0であってもよい。
図3Bに示すデータ圧縮の具体的な動作は、動作順序が異なる点を除いて、
図3Aに示す態様と同様である。前記エッジ調整の内容については、後の説明で詳しく説明する。
【0066】
図3Bに示すように、データ伸長装置300が前記圧縮フレームに対してデータ伸長を行うことは以下のとおりであってもよい:データ伸長装置300は、前記圧縮フレームに対して前記復号化を行う間に前記エッジ補償を行う。具体的には、データ伸長装置300は、まずビットストリーム解析モジュールにより前記圧縮フレームを解析し、前記予測データPI、前記残差データR及び前記符号化データRAMIを生成し、前記予測データPIに基づいて予測して予測フレームを得て、前記符号化データRAMIに基づいて、対応する復号化データを用いて前記予測フレームに対して前記エッジ補償を行い、前記エッジ補償が施された前記予測フレームと前記残差データRを重畳し、重畳されたデータに対して前記エッジ補償を行い、前記伸長フレームP
4を得ることができる。前記伸長中フレームは、前記予測フレーム及び前記予測フレームと前記残差データRとの重畳データであってもよい。説明を容易にするために、本発明者らは、前記重畳フレームにおけるデータをP
3と定義する。具体的には、前記重畳フレームP
3におけるエッジに対する前記エッジ補正の具体的な過程は、後に詳しく説明する。
【0067】
図3Bに示す形態は、前記圧縮フレームにおけるデータ量を減少させることによって、前記初期データの圧縮率及び符号化効率を向上させ、前記初期データの伝送効率を向上させることができるとともに、データロスを減少させ、ディテール損失を回避することができる。
【0068】
図3Cは、本明細書の実施例によるデータ圧縮及びデータ伸長のフローチャートを示した。
図3Cに示すように、データ圧縮装置200が初期データに対してデータ圧縮を行うことは以下のとおりであってもよい:データ圧縮装置200は、まず前記初期フレームP
0に対して予測を行い、残差を求め、予測データPI及び残差R
1を得て、次に前記残差R
1に対して前記エッジ調整を行い、前記残差データRを得て、前記エッジ調整が施された残差データR、予測データPI及び前記符号化データRAMIをビットストリーム生成モジュールに入力して合成し、前記圧縮フレームを生成する。前記圧縮中フレームは、前記残差R
1であってもよい。
図3Cに示すデータ圧縮形態の具体的な動作は、動作順序が異なる点を除いて、
図3Aに示す態様と同様である。前記エッジ調整の内容については、後の説明で詳しく説明する。
【0069】
図3Cに示すように、データ伸長装置300が前記圧縮フレームに対してデータ伸長を行うことは以下のとおりであってもよい。データ伸長装置300は、ビットストリーム解析モジュールにより前記圧縮フレームを解析し、前記予測データPI及び前記残差データRを生成し、そして予測データPIに基づいて予測して予測フレームを得て、前記符号化データRAMIに基づいて、対応する復号化データを用いて前記残差データRに対して前記エッジ補償を行い、残差R
1を得て、前記残差R
1と前記予測フレームを重畳し、前記伸長フレームP
4を得る。前記伸長中フレームは、前記残差データRであってもよい。
【0070】
図3Cに示す形態は、前記圧縮フレームにおけるデータ量を減少させることによって、前記初期データの圧縮率及び符号化効率を向上させ、前記初期データの伝送効率を向上させることができるとともに、データロスを減少させ、ディテール損失を回避することができる。
【0071】
図4Aは、データを圧縮するデータ処理方法P200のフローチャートを示した。前述のように、データ圧縮装置200は、データ処理方法P200を実行することができる。具体的には、データ圧縮装置200における記憶媒体は少なくとも一つの命令セットを記憶することができる。前記命令セットは、データ処理方法P200を完了するようデータ圧縮装置200における圧縮プロセッサ220に指示することができるように構成される。前記データ圧縮装置200が作動する場合、圧縮プロセッサ220は、前記命令セットを読み取り、データ処理方法P200を実行することができる。
図4Aに示すように、前記方法P200は以下を含んでもよい。
【0072】
S220:初期データにおける初期フレームP0を選択する。
【0073】
フレームは、データ系列を構成する処理単位である。データ処理の場合、フレーム単位で計算することが多い。前記初期データは、一つ又は複数の初期フレームを含んでもよい。前記初期フレームP0は、予め設定されたバイト数の初期データを含む。前述のように、本明細書では、ビデオデータを例として説明するため、前記初期データは、初期ビデオデータであってもよく、前記初期フレームP0は、初期ビデオデータにおけるフレーム画像であってもよい。ステップS220において、データ圧縮装置200は、前記初期データから一部のフレーム画像を前記初期フレームP0として選択してもよいし、前記初期データにおける全てのフレーム画像を前記初期フレームP0として選択してもよい。データ圧縮装置200は、前記初期データ応用シナリオに応じて前記初期フレームP0を選択することができる。前記初期データが、精度及び圧縮品質がそれほど要求されないシナリオに適用される場合、一部のフレーム画像を前記初期フレームP0として選択してもよく、例えば、奥まった場所の監視画像はほとんどの場合に画面に異物がないため、前記奥まった場所の監視画像の大多数のフレーム画像が同じであり、データ圧縮装置200は、その中から一部のフレーム画像を前記初期フレームP0として選択して圧縮し伝送してもよい。さらに例えば、高解像度のテレビ再生ビデオの場合、視聴効果を確保するために、データ圧縮装置200は、全てのフレーム画像を前記初期フレームP0として選択して圧縮し伝送してもよい。
【0074】
S240:前記初期フレームP0に対して前記データ圧縮を行い、圧縮フレームを得る。
【0075】
前記データ圧縮は、圧縮中フレームに対する前記エッジ調整及び前記符号化を含んでもよい。前述した、前記圧縮中フレームに対して前記エッジ調整を行うことは、前記圧縮中フレームをエッジ調整装置に入力してエッジ調整を行うことであってもよい。前記圧縮中フレームは、前記初期フレームP0と、前記データ圧縮過程において前記圧縮フレームになる前の前記初期フレームP0のいずれかのデータ状態とを含んでもよい。例えば、前記圧縮中フレームは、前記初期フレームP0と、前記エッジ調整及び符号化を行う過程における前記初期フレームP0のいずれかのデータ状態、例えば、初期フレーム、予測フレーム、残差フレームなどとを含む。
【0076】
前記エッジ調整は、前記圧縮中フレームのスペクトログラムの振幅を調整することを指す。例えば、前記エッジ調整は、前記圧縮中フレームのその周波数領域内の選択された領域での振幅、例えば、中周波数領域の振幅、高周波数領域の振幅、さらに例えば、低周波数から中周波数領域の振幅、さらに例えば、中周波数から高周波数領域の振幅などを調整することができる。いくつかの実施例において、前記エッジ調整は、一つのエッジ調整係数により、その周波数領域内の選択された領域の振幅に対する調整を実現することができる。例えば、前記エッジ調整は、0より大きく1より小さいエッジ調整係数でその周波数領域内の選択された領域の振幅の減衰を実現することによって、前記圧縮中フレームにおけるデータ情報量を低減することができる。異なる形態のデータに対して、周波数に対する受信者の感度が異なるため、前記データ圧縮動作は、異なる形態のデータに応じて、周波数領域で異なる領域を選択して振幅減衰を行ってもよい。1フレームのデータスペクトルにおける中周波数から高周波数成分は、主にこのフレームのデータにおけるデータ変化の激しい領域、つまりデータのエッジデータに集まっている。前述のように、ビデオデータを例にとると、例えば、1フレームの画像の場合、前記中周波数から高周波数までのデータは、主に前記画像中の物体のエッジ、つまりこのフレームの画像のエッジデータに集まっている。画像中の物体のエッジ部分には大量の中周波数及び高周波数情報があり、中周波数及び高周波数領域はより多くのデータを搬送する。そのため、中周波数から高周波数領域の振幅の低減は、前記圧縮中フレームのエッジデータを視覚的にぼやかすとともに、画像における情報量を大幅に減少させる。説明すべきこととして、低周波数領域の振幅の低減も、画像における情報量を減少させる。本明細書では、ビデオデータを例にとると、前記エッジ調整は、前記圧縮中フレームの中周波数から高周波数領域の振幅を調整し、例えば、中周波数から高周波数領域の振幅を減衰して、中周波数から高周波数領域のデータ情報量を低減することであってもよい。当業者であれば理解できるように、エッジ調整処理が施されていない場合に比べて、エッジ調整処理が施された中間状態フレームにおける中周波数から高周波数領域の振幅が減衰し、データ情報量も減少したため、エッジ調整処理が施された中間状態フレームは、符号化においてより高い圧縮率を有する。
【0077】
ビデオデータ圧縮を例にとると、データ処理方法P200は、エッジ調整と符号化を組み合わせる方法を用いて前記初期フレームP
0を圧縮して、中周波数から高周波数領域の振幅を調整することによって、データ情報量を減少させ、ビデオデータの圧縮率をさらに向上させ、ビデオ伝送の効率を向上させることができる。前述のように、前述した、前記初期フレームP
0に対してデータ圧縮を行う場合、前記エッジ調整と前記符号化の順序は、交換されてもよいし、交差して行われてもよい。ステップS240は、
図3A、
図3B及び
図3Cに示すデータ圧縮方法のうちの少なくとも一つを含んでもよい。説明を容易にするために、本明細書は、
図3Aに示す方法を例として、ステップS240を詳しく説明する。つまり、データ圧縮装置200は、前記初期フレームP
0に対して、まず前記エッジ調整を行い、前記初期フレームP
0の中周波数から高周波数領域での振幅を減衰して、前記初期フレームP
0のエッジ情報をぼやかし、符号化調整フレームP
1を得て、前記初期フレームP
0における情報量を減少させることによって、圧縮後の前記初期フレームP
0が占有するスペースリソースを低減し、次に符号化調整フレームP
1に対して符号化を行い(即ち予測し残差を求め)、前記符号化調整フレームP
1に対して予測を行って前記符号化調整フレームP
1の予測フレーム及び前記予測データPIを得て、続いて前記符号化調整フレームP
1の予測フレームと前記符号化調整フレームP
1とを減算して残差データRを得て、残差データR並びに前記予測データPI及び前記符号化データRAMIをビットストリーム生成モジュールに入力して合成し、前記圧縮フレームを得る。データ処理方法P200は、前記符号化調整フレームP
1の符号化効率を向上させ、前記圧縮フレームにおけるデータ量をさらに減少させ、符号化効率を向上させ、圧縮率を向上させることができる。前記エッジ調整のオブジェクトが前記初期フレームP
0であるため、前記圧縮中フレームは前記初期フレームP
0である。ビデオデータを例にとると、ステップS240では、前述した、前記圧縮中フレーム(初期フレーム)に対して前記データ圧縮を行うことは、データ圧縮装置200の少なくとも一つの圧縮側プロセッサ220により、
S242:前記圧縮中フレーム(初期フレームP
0)に対して前記エッジ調整を行い、前記符号化調整フレームP
1を得るステップを実行することを含んでもよい。
図4Bは、本明細書の実施例によるエッジ調整のフローチャートを示し、
図5は、本明細書の実施例によるエッジ調整の構造ブロック図を示した。
図4B及び
図5に示すように、ステップS242は、データ圧縮装置200の少なくとも一つの圧縮側プロセッサ220により以下のステップを実行することを含んでもよい。
【0078】
S242-2:予め設定されたユニットサイズに基づいて前記圧縮中フレーム(初期フレームP0)を複数のユニットに分割する。
【0079】
知られているように、画像データ及びビデオデータに対して前記符号化を行う場合、処理するデータ処理ユニットは、1フレームのデータであってもよいし、1フレームのデータの一部であってもよい。例えば、1フレームのデータを複数の領域に分割し、そして各領域をそれぞれ符号化してもよい。ビデオデータを例にとると、該領域は、1フレームもしくは1フィールドの画像、又は1フレーム/フィールドの画像の一部であってもよい。例えば、ビデオ符号化において、画像をスライス(slice)、タイル(tile)、符号化ユニット(coding unit、CU)、マクロブロック(macroblock)(macroblock)、ブロック(block)、又はサブブロック(subblock)をさらに分割する。一つの領域は、通常、NxNの方形であるか、又はMxNの長方形である。領域は、上記名前を含むが、それらに限られない。説明を容易にするために、本発明者らは、各領域を一つのユニットと定義する。前記エッジ調整は、上記ユニットを調整オブジェクトとして、各ユニットに対して前記エッジ調整を行うことができる。ここで、前記ユニットの大きさは、必要に応じに任意に選択することができ、即ちM及びNの値は、任意の整数、例えば、4、8、16、32、16、128、又は256であってもよく、さらにより小さい値、例えば、2であってもよい。いくつかの実施例において、前記ユニットは、一つの画素のみを含んでもよい。1フレームの画像の解像度が高いほど、前記ユニットのサイズを大きくすることもできる。前述のように、前記圧縮中フレーム(初期フレームP0)は複数のユニットに分割されてもよい。説明を容易にするために、本発明者らは、初期フレームP0におけるi行目及びj列目のユニットのデータをP0
ijと定義する。
【0080】
S242-4:それらに対応する前記エッジ調整係数を用いて、前記各ユニットの中周波数から高周波数領域での振幅を調整する。
【0081】
ビデオデータを例にとると、前記エッジ調整は、それらに対応するエッジ調整係数を用いて、前記圧縮中フレーム(初期フレームP0)の複数のユニットのうちの各ユニットの中周波数から高周波数領域での振幅を調整して、前記圧縮中フレーム(初期フレームP0)全体の前記中周波数から前記高周波数領域での振幅を低減することであってもよい。前記エッジ調整係数については、後の説明で詳しく説明する。i行目及びj列目のユニットP0
ijに対して前記エッジ調整を行う場合、ステップS242-4は、現在のユニットP0
ijに対して、
S242-42:予め設定された符号化関数群から一つの関数を符号化関数H1
ij(f)として選択し、前記符号化関数H1
ij(f)によって現在のユニットP0
ijを調整して、第1のユニットP1b
ijを得て、それらの周波数領域内の低周波数領域での成分が保持されているが中周波数から高周波数領域での成分が減衰されるようにするステップを実行することを含んでもよい。
【0082】
ここで、H1
ij(f)は、i行目及びj列目の現在のユニットP0
ijに対応する符号化関数を表す。符号化関数H1
ij(f)は、周波数領域内でローパスフィルタであってもよく、前記初期フレームP0における現在のユニットP0
ijの振幅を周波数領域において滑らかに低下させて、前記初期フレームP0における現在のユニットP0
ijの周波数領域内の低周波数領域での成分が保持されているが中周波数から高周波数領域での成分が減衰されるようにすることによって、現在のユニットP0
ijに対応する第1のユニットP1b
ijを得る。実現に必要な計算量を節約し、リンギングアーティファクトの発生を回避するために、符号化関数H1
ij(f)は、前記現在のユニットP0
ijの周波数領域内の振幅を滑らかに遷移させるべきである。符号化関数H1
ij(f)は、滑らかに遷移する任意の形態のローパスフィルタであってもよく、本明細書はこれについて限定しない。
【0083】
説明すべきこととして、リンギングアーティファクトを回避するために、前記符号化関数H1
ij(f)は、滑らかに遷移する曲線であり、曲線における前記振幅調整利得の急激な変化を回避する。前述のように、前記リンギングアーティファクトとは、画像処理において、ある画像に対してスペクトル調整処理を行う際、選択した符号化関数H1
ij(f)には速い変化があれば、画像に「リンギング」が発生することを指す。いわゆる「リンギング」は、鐘が叩かれた後に空気振動が発生するように、出力画像の階調が激しく変化する部分で発生する振動を指す。リンギングアーティファクトは画像エッジに多く現れる。
【0084】
前記符号化関数H1
ij(f)によって現在のユニットP0
ijを調整することは、時間領域において符号化畳み込みカーネルを用いて前記現在のユニットP0
ijに対して畳み込みを行うと表現されてもよい。前記符号化関数H1
ij(f)によって現在のユニットP0
ijを調整することは、前記現在のユニットP0
ijに対して、周波数領域において伝達関数H1
ij(f)(即ち符号化関数)と乗算するか、又は時間領域で対応する畳み込み計算を行うと表現されてもよい。前記現在のユニットP0
ijがデジタル化されたデータである場合、前記畳み込み演算は、前記符号化関数H1
ij(f)に対応する符号化畳み込みカーネルを選択して畳み込み演算を行ってもよい。説明を容易にするために、本明細書は、時間領域で畳み込みを行うことを例として、前記符号化関数H1
ij(f)によって現在のユニットP0
ijを調整することを説明する。しかし、当業者であれば分かるように、周波数領域において符号化関数H1
ij(f)と乗算する形態も本明細書が保護すべき範囲である。
【0085】
データ圧縮装置200の記憶媒体には、前記符号化関数群が記憶されてもよい。前記符号化関数群には、少なくとも一つの異なる符号化関数が含まれてもよい。各符号化関数は一つの符号化畳み込みカーネルに対応する。つまり、データ圧縮装置200の記憶媒体には、少なくとも一つの符号化畳み込みカーネルが含まれてもよい。データ圧縮装置200は、前記現在のユニットP0
ijに対して畳み込みを行う場合、前記符号化関数群から任意の一つの関数を現在のユニットP0
ijに対応する符号化関数H1
ij(f)として選択し、対応する畳み込みカーネルを前記符号化畳み込みカーネルとして、前記現在のユニットP0
ijに対して畳み込みを行ってもよい。
【0086】
一つの画像に対してエッジ調整処理を行う場合、選択した符号化関数には数値が激しく変化する領域が存在すれば、実現には次数のより高い畳み込みカーネル又は畳み込みカーネルの組み合わせが必要となる。これは、不要な演算量の増加を意味する。それとともに、高次畳み込みカーネルは、階調又は色が激しく変化する位置で、リンギングアーティファクトと呼ばれる強い色振動を出力画像に発生させる可能性が高くなる。リンギングアーティファクトは画像エッジに多く現れる。周波数領域内のH1
ij(f)前記現在のユニットP0
ijに対する前記符号化関数による振幅調整利得を滑らかに遷移させることによって、前記振幅調整利得の急激な変化を回避することができる。例えば、前記低周波数領域と前記中周波数領域がつながっていない場合、前記符号化関数H1
ij(f)は、周波数領域において、前記現在のユニットP0
ijの中低周波数領域の振幅を調整して、前記振幅調整利得の中低周波数領域での変化を滑らかで連続的にすることができる。
【0087】
前記符号化関数H1
ij(f)に対応する符号化畳み込みカーネルにおける負係数の和の絶対値と非負係数の和との比は0.1未満である。例えば、いくつかの実施例において、前記符号化畳み込みカーネルにおける畳み込みカーネル係数はいずれも非負数であってもよい。ビデオデータを例にとると、前記符号化畳み込みカーネルに多くの負係数が存在する場合、画像エッジでの画素値は大きく異なり、大きい画素値に負係数を乗算すると、畳み込みの最終的な結果を小さくすることになり、画像にすれば画素が暗くなる。畳み込み結果に負数が現れ、且つ負数の絶対値が大きい場合、符号なし整数計算で畳み込み結果を計算する際、符号なし整数計算結果の反転を引き起こす可能性があり、値が負数である符号なし補数値を取ると、畳み込み結果を大きくすることになり、画像にすれば画素が明るくなる。そのため、前記符号化畳み込みカーネルを設計する際、前記符号化畳み込みカーネルの係数をいずれも非負数にするか、又は前記符号化畳み込みカーネルにおける負係数の和の絶対値と非負係数の和との比を0.1未満にしてもよく、即ち絶対値の小さい負係数が前記符号化畳み込みカーネルにわずかに存在することが許容される。
【0088】
図6は、本明細書の実施例による符号化関数H
1
ij(f)の概略グラフを示した。横軸は正規化周波数fであり、縦軸は符号化関数H
1
ij(f)の振幅調整利得H
1である。前記横軸の正規化周波数fは、低周波数領域、中低周波数領域、中周波数領域、中高周波数領域及び高周波数領域に分けられ得る。低周波数、中周波数及び高周波数領域の定義は、データの種類によって異なっていてもよい。
図6に示すように、横軸の正規化周波数の最大値は0.5である。前記高周波数領域は、正規化された周波数領域における(d、0.5]の間の周波数を含んでもよい。ここで、dは、前記高周波数領域の周波数下限である。例えば、dは、前記正規化された周波数領域における0.35、0.36、0.37、0.38、0.39、0.4、0.41、0.42、0.43、0.44及び0.45のうちのいずれか一つの周波数であってもよい。いくつかの実施例において、前記高周波数は、正規化された周波数領域における(0.33、0.5]の間の周波数を含んでもよい。例えば、前記高周波数は、前記正規化された周波数領域における0.33、0.34、0.35、0.36、0.37、0.38、0.39、0.4、0.41、0.42、0.43、0.44、0.45、0.46、0.47、0.48、0.49、0.5のうちの任意の二つの周波数の間の区間を含んでもよく、ここで、0.5は前記正規化された最大周波数である。前記中周波数領域は、(b、c]の間の周波数を含んでもよく、ここで、bは、前記中周波数領域の周波数下限であり、cは、前記中周波数領域の周波数上限である。例えば、前記中周波数領域の周波数下限bは、前記正規化された周波数領域における0.15、0.16、0.17、0.18、0.19、0.2、0.21、0.22、0.23、0.24、0.25、0.26、0.27及び0.28のうちのいずれか一つの周波数であってもよく、前記中周波数領域の周波数上限cは、前記正規化された周波数領域における0.35、0.34、0.33、0.32及び0.31のうちのいずれか一つの周波数であってもよい。前記低周波数領域は、正規化された周波数領域における[0、a]の間の周波数を含んでもよい。ここで、aは、前記低周波数領域の周波数上限である。前記低周波数領域の周波数上限aは、前記正規化された周波数領域における0.01、0.02、0.03、0.04、0.05、0.06、0.07、0.08、0.09、0.10、0.12、0.13、0.14及び0.15のうちのいずれか一つの周波数であってもよい。前記低周波数領域と前記中周波数領域がつながっていない場合、両者の間の周波数領域は中低周波数領域と呼ばれる。前記中周波数領域と前記高周波数領域がつながっていない場合、両者の間の周波数領域は中高周波数領域と呼ばれる。
【0089】
符号化関数H1
ij(f)は、中周波数から高周波数領域の成分をフィルタリングすることができる。符号化関数H1
ij(f)における阻止帯域区間は、周波数0.15~0.50の間の任意の区間であってもよい。例えば、符号化関数H1
ij(f)における阻止帯域区間は、0.15、0.17、0.19、0.21、0.23、0.25、0.27、0.29、0.31、0.33、0.35、0.37、0.39、0.41、0.43、0.45及び0.50などの数値のうちの任意の二つによって規定される区間内にあってもよい。符号化関数H1
ij(f)における通過帯域区間は、周波数0~0.35の間の任意の区間であってもよい。例えば、符号化関数H1
ij(f)における通過帯域区間は、0、0.02、0.04、0.06、0.08、0.10、0.12、0.14、0.15、0.17、0.19、0.21、0.23、0.25、0.27、0.29、0.21、0.23及び0.35などの数値のうちの任意の二つによって規定される区間内にあってもよい。
【0090】
説明すべきこととして、
図6は単にビデオデータを例として説明し、当業者であれば分かるように、前記符号化関数H
1
ij(f)の曲線は
図6に示す形態に限定されるものではなく、前記現在のユニットP
0
ijの振幅を周波数領域において滑らか低下させて、前記初期フレームP
0における現在のユニットP
0
ijの周波数領域内の低周波数領域での成分が保持されているが中周波数から高周波数領域での成分が減衰されるようにすることができる全ての符号化関数H
1
ij(f)及び符号化関数H
1
ij(f)の線形組み合わせH
1
ij(f)=Σ
m=1
nk
mH
1m
ij(f)、又は符号化関数H
1
ij(f)の積組み合わせH
1
ij(f)=Π
q=1
nk
qH
1q
ij(f)、又は線形組み合わせと積組み合わせとの組み合わせは、いずれも本明細書の保護範囲に属する。ここで、m≧1であり、H
1
ij(f)=Σ
m=1
nk
mH
1m
ij(f)は、n個の関数の線形組み合わせを表し、H
1
ij(f)は、m番目の関数を表し、k
mは、m番目の関数に対応する重みを表す。q≧1でありH
1
ij(f)=Π
q=1
nk
qH
1q
ij(f)は、n個の関数の積組み合わせを表し、k
qは、q番目の関数に対応する重みを表し、H
1q
ij(f)は、任意の関数であってもよい。
【0091】
表1は、本明細書の実施例による符号化畳み込みカーネルのパラメータテーブルを示した。表1は、符号化畳み込みカーネルのパラメータを例示的に列挙しており、ここで、表1の各行は、一つの符号化畳み込みカーネルを表す。8ビットビデオ画像の場合に、符号化畳み込みで得られた前記第1のユニットP
F
ijにおける画素ビットの階調値が0~255以内であることを確保する必要があるため、本実施例では、畳み込み後の結果を16で除算する必要がある。前記符号化畳み込みカーネルは、前記符号化関数H
1
ij(f)に基づいてフーリエ変換によって得られたものである。表1では単に例示的に説明し、当業者であれば分かるように、前記符号化畳み込みカーネルは表1に示すパラメータに限定されるものではなく、前記現在のユニットP
0
ijの振幅を周波数領域において滑らかに低下させて、前記初期フレームP
0における現在のユニットP
0
ijの周波数領域内の低周波数領域での成分が保持されているが中周波数から高周波数領域での成分が減衰されるようにすることができる全ての符号化畳み込みカーネルは、いずれも本明細書の保護範囲に属する。
【表1】
【0092】
前述のように、前記エッジ調整において、データ圧縮装置200は、各ユニットに対してステップS242-42を実行することができる。各ユニットP0
ijは、符号化関数H1
ij(f)によって調整された後に、いずれも対応する第1のユニットP1b
ijを得る。全てのユニットに対応する符号化関数H1
ij(f)を組み合わせて符号化関数H1(f)を構成する。各ユニットに対応する符号化関数H1
ij(f)は、各ユニットが所在する位置に応じて組み合わせて符号化関数H1(f)を生成することができ、符号化関数H1(f)は行列と見なされ得る。説明すべきこととして、異なるユニットに対してステップS242-42を実行する際、同じ符号化関数(即ち符号化畳み込みカーネル)を選択してもよいし、異なる符号化関数(即ち符号化畳み込みカーネル)を選択してもよい。即ち異なるユニットP0
ijに対応する符号化関数H1
ij(f)は、同じであってもよいし、異なっていてもよい。
【0093】
全てのユニットに対応する第1のユニットP
1b
ijを組み合わせて第1のフレームP
1bを構成する。各ユニットに対応する第1のユニットP
1b
ijは、各ユニットが所在する位置に応じて組み合わせて第1のフレームP
1bを生成することができ、第1のフレームP
1bはぼやけた画像である。P
0とP
0bとの間の関係は以下の式で表されてもよい。
【数1】
【0094】
図4B及び
図5に示すように、i行目及びj列目のユニットP
0
ijに対して前記エッジ調整を行う場合、ステップS242-4は、現在のユニットP
0
ijに対して、
S242-44:現在のユニットP
0
ijと第1のユニットP
1b
ijとの差を求め、現在のユニットP
0
ijに対応する第1のエッジE
1b
ijを取得するステップを実行することを含んでもよい。
【0095】
各フレームのデータスペクトルにおける中周波数から高周波数成分は、主にこのフレームのデータにおけるデータ変化の激しい領域、つまりデータのエッジデータに集まっている。例えば、1フレームの画像の場合、前記中周波数から高周波数までのデータは、主に前記画像中の物体のエッジ、つまりこのフレームの画像のエッジデータに集まっている。前記符号化関数H
1
ij(f)は、現在のユニットP
0
ijの周波数領域内の振幅を滑らかに低下させて、中周波数から高周波数領域の成分を減衰する。そのため、第1のユニットP
1b
ijは、現在のユニットP
0
ijにおけるエッジ情報が除去されたデータであると理解され得る。次に、現在のユニットP
0
ijと前記第1のユニットP
1b
ijとの差を求め、現在のユニットP
0
ijのエッジ、即ち第1のエッジE
1b
ijを得ることができる。そのため、前記第1のエッジE
1b
ijは、現在のユニットP
0
ijの前記中周波数から前記高周波数領域での成分を含む。前記第1のエッジE
1b
ijは、現在のユニットP
0
ijにおけるエッジ情報を含む。各ユニットP
0
ijは、ステップS242-44の後に、いずれも対応する第1のエッジE
1b
ijを得る。全てのユニットに対応する第1のエッジE
1b
ijを組み合わせて第1のエッジフレームE
1bを構成する。各ユニットに対応する第1のエッジE
1b
ijは、各ユニットが所在する位置に応じて組み合わせて第1のエッジフレームE
1bを生成することができる。前記第1のエッジフレームE
1bは以下の式で表されてもよい。
【数2】
【0096】
図4B及び
図5に示すように、i行目及びj列目のユニットP
0
ijに対して前記エッジ調整を行う場合、ステップS242-4は、現在のユニットP
0
ijに対して、
S242-46:現在のユニットP
0
ijに対応する前記エッジ調整係数を用いて第1のエッジE
1b
ijの振幅を調整して、現在のユニットP
0
ijに対応する符号化エッジE
1m
ijを得るステップを実行することを含んでもよい。
【0097】
説明を容易にするために、本発明者らは、前記エッジ調整に対応する前記エッジ調整係数をg1と定義する。本発明者らは、i行目及びj列目のユニットP0
ijに対応するエッジ調整係数をg1
ijと定義する。1フレームの画像には、強いエッジが存在する場合があり、弱いエッジが存在する場合もあり、さらに強いエッジと弱いエッジの両方が存在する場合もある。前記強いエッジは、隣接する画素間の画素値の差が大きいエッジであってもよい。前記弱いエッジは、隣接する画素間の画素値の差が小さいエッジであってもよい。ステップS242-2で初期フレームP0を複数のユニットに分割することによって、初期フレームP0を複数の小さい領域に分割する。前記ユニットのサイズが小さいほど、ユニットに含まれるエッジが単一である。前記ユニットが十分に小さい場合、各ユニットには強いエッジのみが含まれてもよいし、弱いエッジのみが含まれてもよい。そのため、ステップS242-2で初期フレームP0を複数のユニットに分割することによって、データ圧縮装置200は、各ユニットのエッジ情報を個別に調整することができる。
【0098】
画像データ又はビデオデータの場合、規格H.264/H.265を用いて前記画像データ又はビデオデータを符号化する際、いくつかの画像及びビデオのディテール損失をある程度引き起こす可能性がある。つまり、隣接する画素間の差分が小さい弱いエッジは、前記符号化処理の後、その差分がより小さくなったり消えたりすることがあり、それによって画像データ又はビデオデータにおけるディテール損失を引き起こす。そのため、隣接する画素ビット間の差分が小さい弱いエッジが符号化及び復号化過程で失われることを回避するために、前記エッジ調整は、隣接する画素ビット間の差分が小さい弱いエッジの中周波数から高周波数領域での振幅を増強することによって、前記弱いエッジにおける隣接する画素間の画素値の差分を増加させ、弱いエッジが符号化で失われることを回避し、ディテール損失を回避し、符号化及び復号化後に、ディテール部分が依然として保持されるようにすることができる。
【0099】
隣接する画素間の差分が大きい強いエッジは、符号化及び復号化処理後に消えることはない。前記エッジ調整は、隣接する画素ビット間の差分が大きい前記強いエッジの中周波数から高周波数領域での振幅を減衰して、前記強いエッジにおける隣接する画素間の画素値の差分を減少させることによって、前記強いエッジに含まれるデータ情報を減少させ、圧縮率を向上させることができる。前記強いエッジは、隣接する画素ビット間の差分が十分に大きく、前記エッジ調整により振幅が減衰されても、保持されているエッジが依然として十分に大きく、符号化及び復号化処理後に消えることはない。
【0100】
ビデオデータを例にとると、前記エッジ調整係数g1
ijを用いて第1のエッジE1b
ijの振幅を調整する場合、伸長際に情報をより良く復元できるように、初期フレームP0に含まれる情報を可能な限り失わないように保持するべきである。そのため、エッジ調整係数g1
ijは0より大きくなければならない。エッジ調整係数g1
ijにより処理された符号化エッジE1m
ijの中周波数から高周波数領域での振幅もゼロより大きく、いかなるデータロスも発生しない。そのため、圧縮後のデータを伸長する際に全てのデータを復元することができる。さもなければ、エッジ調整係数g1
ijにゼロ点が存在すれば、ゼロ点に対応するユニット内の中周波数から高周波数領域のデータが失われる可能性があり、伸長際に復号化側は失われたデータを復元できないため、初期データを復元することができなくなる。
【0101】
ステップS242-46では、データ圧縮装置200は、現在のユニットP0
ijに対応する第1のエッジE1b
ijのエッジ値の大きさに基づいて、現在のユニットP0
ijに対応するエッジ調整係数g1
ijを確定することができる。異なるユニットP0
ijは、異なるエッジ調整係数g1
ijを有し得る。前記エッジ値は、第1のエッジE1b
ijにおける画素に対応する値であってもよい。ステップS242-46は以下を含んでもよい。
【0102】
S242-462:現在のユニットP0
ijに対応する前記第1のエッジE1b
ijのエッジ値が予め設定された第1の閾値より小さいことを確定し、1より大きい前記エッジ調整係数g1
ijによって前記第1のエッジE1b
ijの振幅を増強する。
【0103】
S242-464:現在のユニットP0
ijに対応する前記第1のエッジE1b
ijのエッジ値が予め設定された第2の閾値より大きいことを確定し、1より小さい前記エッジ調整係数g1
ijによって前記第1のエッジE1b
ijの振幅を低減する。
【0104】
ステップS242-462では、現在のユニットP0
ijに対応する第1のエッジE1b
ijのエッジ値が前記第1の閾値より小さい場合、現在のユニットには、多くの細かいディテールを含む弱いエッジが含まれることを意味する。この場合に、1より大きいエッジ調整係数g1
ijを用いて現在のユニットP0
ijに対応する第1のエッジE1b
ijの中周波数から高周波数領域の振幅を調整して、現在のユニットP0
ijに対応する第1のエッジE1b
ijの中周波数から高周波数領域の振幅を増強し、現在のユニットP0
ijの信号対ノイズ比を維持し、それによって現在のユニットP0
ijにおける弱いエッジがデータ圧縮(予測し残差を求める)中に失われることを回避し、ディテール損失を回避し、符号化効果を確保する。データ処理方法P200は、データ圧縮の効率を向上させるとともに、弱いエッジのデータ情報量を増加させることによって、データ圧縮過程でディテール損失を引き起こすことを回避し、即ちデータ圧縮効率を向上させるとともにデータ歪みを減少させることができる。前記第1の閾値は、5、10、15、20、25、30、35、40、45、50などであってもよい。いくつかの実施例において、前記第1の閾値は、より小さくてもよく、例えば、1、2、3、4などであってもよい。いくつかの実施例において、前記第1の閾値は、5~30の間の任意の数であってもよい。
【0105】
ステップS242-464では、現在のユニットP0
ijに対応する第1のエッジE1b
ijにおけるエッジ値が前記第2の閾値より大きく、現在のユニットP0
ijには強いエッジが含まれることを意味する場合、1より小さく0よい大きいエッジ調整係数g1
ijを用いて、現在のユニットP0
ijに対応する第1のエッジE1b
ijの中周波数から高周波数領域の振幅を調整して、現在のユニットP0
ijに対応する第1のエッジE1b
ijの中周波数から高周波数領域の振幅を低減することによって、現在のユニットP0
ijに対応する第1のエッジE1b
ijにおける中周波数から高周波数領域内の信号の強度を低下させ、それによってデータ情報量を減少させ、予測し残差を求める際にデータ圧縮の効率を向上させることができる。前記第2の閾値は、前記第1の閾値より大きくてもよいし、前記第1の閾値に等しくてもよい。
【0106】
指摘すべきこととして、第1の閾値と第2の閾値が等しくない場合、第1のエッジE1b
ijにおけるエッジ値が前記第1の閾値と第2の閾値との間(第1の閾値及び第2の閾値を含む)にあるエッジ値に対して、エッジ調整を行わなくてもよく、この場合、前記エッジ調整係数g1
ijは1であってもよい。
【0107】
いくつかの実施例において、データ圧縮装置200の記憶媒体には、第1のエッジ調整係数群と第2のエッジ調整係数群が予め記憶されていてもよい。前記第1のエッジ調整係数群には少なくとも一つの係数が含まれている。且つ前記第1のエッジ調整係数群における係数はいずれも1より大きい。前記第1のエッジ調整係数群における係数は、1より大きい任意の数であってもよい。データ圧縮装置200は、ステップS242-462を実行する際、予め設定された前記第1のエッジ調整係数群から一つの係数を前記エッジ調整係数g1
ijとして選択して、前記第1のエッジE1b
ijの振幅を増強することができる。いくつかの実施例において、データ圧縮装置200は、予め設定された前記第1のエッジ調整係数群から前記エッジ調整係数g1
ijを選択する際、前記第1のエッジE1b
ijにおけるエッジ値の大きさに応じて選択することができる。第1のエッジE1b
ijのエッジ値が大きいほど、それに対応するエッジ調整係数g1
ijが小さくなり、第1のエッジE1b
ijのエッジ値が小さいほど、それに対応するエッジ調整係数g1
ijが大きくなる。
【0108】
前記第2のエッジ調整係数群には少なくとも一つの係数が含まれている。且つ前記第2のエッジ調整係数群における係数は、いずれも0より大きく1より小さい係数である。前記第2のエッジ調整係数群における係数は、0より大きく1より小さい任意の数であってもよい。データ圧縮装置200は、ステップS242-464を実行する際、予め設定された第2のエッジ調整係数群から一つの係数を前記エッジ調整係数g1
ijとして選択して、前記第1のエッジの振幅E1b
ijを低減することができる。いくつかの実施例において、データ圧縮装置200は、予め設定された前記第2のエッジ調整係数群から前記エッジ調整係数g1
ijを選択する際、前記第1のエッジE1b
ijにおけるエッジ値の大きさに応じて選択することができる。第1のエッジE1b
ijのエッジ値が大きいほど、それに対応するエッジ調整係数g1
ijが小さくなり、第1のエッジE1b
ijのエッジ値が小さいほど、それに対応するエッジ調整係数g1
ijが大きくなる。
【0109】
いくつかの実施例において、データ圧縮装置200はさらに、最適化アルゴリズムによって現在のユニットP0
ijに対応するエッジ調整係数g1
ijを確定することができる。具体的には、データ圧縮装置200は最適化方程式を確立することができる。例えば、データ圧縮装置200は、現在のユニットP0
ijに対応する歪曲率及び符号化率の加重値を最適化目標としてもよい。即ち現在のユニットP0
ijに対応する歪曲率及び符号化率の加重値の最小化を最適化目標とし、最適化アルゴリズムに基づいて、エッジ調整係数g1
ijに対して反復計算を行うことによって、前記エッジ調整係数g1
ijを確定し、前記エッジ調整係数g1
ijによって前記第1のエッジE1b
ijの振幅を調整する。
【0110】
前述のように、前記エッジ調整において、データ圧縮装置200は、各ユニットに対してステップS242-46を実行することができる。各ユニットP0
ijに対応する第1のエッジE1b
ijは、エッジ調整係数g1
ijによって調整された後に、いずれも対応する符号化エッジE1m
ijを得る。全てのユニットに対応するエッジ調整係数g1
ijを組み合わせてエッジ調整係数g1を構成する。各ユニットに対応するエッジ調整係数g1
ijは、各ユニットが所在する位置に応じて組み合わせてエッジ調整係数g1を生成することができる。エッジ調整係数g1は行列と見なされ得る。説明すべきこととして、異なるユニットP0
ijに対応するエッジ調整係数g1
ijは、同じであってもよいし、異なっていてもよい。
【0111】
全てのユニットに対応する符号化エッジE
1m
ijを組み合わせて符号化エッジフレームE
1mを構成する。各ユニットに対応する符号化エッジE
1m
ijは、各ユニットが所在する位置に応じて組み合わせて符号化エッジフレームE
1mを生成することができる。E
1mとE
1bとの間の関係は以下の式で表されてもよい。
【数3】
【0112】
図4B及び
図5に示すように、i行目及びj列目のユニットP
0
ijに対して前記エッジ調整を行う場合、ステップS242-4は、現在のユニットP
0
ijに対して、
S242-48:前記第1のユニットP
1b
ijと符号化エッジE
1m
ijを重畳して、現在のユニットP
0
ijに対応する符号化ユニットP
1
ijを得るステップを実行することを含んでもよい。
【0113】
各ユニットP
0
ijに対応する第1のユニットP
1b
ij及び符号化エッジE
1m
ijは、重畳後に、いずれも対応する符号化ユニットP
1
ijを得る。全てのユニットに対応する符号化ユニットP
1
ijを組み合わせて符号化調整フレームP
1を構成する。各ユニットに対応する符号化ユニットP
1
ijは、各ユニットが所在する位置に応じて組み合わせて符号化調整フレームP
1を生成することができる。P
1とE
1m及びP
1bとの間の関係は以下の式で表されてもよい。
【数4】
【0114】
式(1)~式(4)から分かるように、P
1とP
0との間の関係は以下の式で表されてもよい。
【数5】
【0115】
説明を容易にするために、本発明者らは、P
1とP
0との間の伝達関数を符号化伝達関数H
E(f)に定義し、符号化伝達関数H
Eは以下の式で表されてもよい。
【数6】
【0116】
これにより、ステップS242-2で初期フレームP0を複数のユニットに分割することによって、初期フレームP0を複数の小さい領域に分割し、このように各ユニットの特徴に基づいて異なるエッジ調整係数g1
ijを選択することによって、中周波数から高周波数領域の成分信号強度をより柔軟に調整し、符号化效果とビットストリーム大きさの間でより良いバランスを実現することができることが分かる。
【0117】
図4Aに示すように、ステップS240は以下をさらに含んでもよい。
S244:前記符号化調整フレームP
1に対して前記符号化を行い(予測し残差を求め)、前記予測データPI及び前記残差データRを得る。
S246:前記予測データPI及び前記残差データRを前記ビットストリーム生成モジュールに入力し合成して、前記圧縮フレームを得る。
【0118】
いくつかの実施例において、ステップS240は、
S248:初期フレームP0の前記エッジ調整過程における各ユニットの符号化関数H1
ij(f)及びエッジ調整係数g1
ijを前記ビットストリーム生成モジュールに入力し合成して、前記圧縮フレームを得るステップをさらに含んでもよい。
【0119】
つまり初期フレームP0に対応する符号化関数H1(f)及びエッジ調整係数g1を前記ビットストリーム生成モジュールに入力し合成して、前記圧縮フレームを得る。即ち前記圧縮フレームは、前記予測データPIと前記残差データRとを含むだけでなく、前記複数のユニットのうちの各ユニットに対応する前記符号化関数H1
ij(f)及び前記エッジ調整係数g1
ijをさらに含む。前記各ユニットに対応する前記符号化関数H1
ij(f)及び前記エッジ調整係数g1
ijは前述の符号化データRAMIである。説明すべきこととして、エッジ調整係数g1はエッジ調整係数g1
ijの間の差であってもよく、即ち前記複数のユニットのうちの一つを基本データとして、他のユニットに対応するエッジ調整係数g1
ijはそれらと基本データとの間の差である。エッジ調整係数g1はまた、エッジ調整係数g1
ijとその近くのあるエッジ調整係数g1
(i-m,j-n)との差であってもよい。ここで、m及びnは、いずれも整数であり、同時にゼロにならない。このようにエッジ調整係数g1におけるデータ量をさらに減少させ、圧縮率をさらに向上させることができる。
【0120】
データ圧縮装置200が前記初期フレームP0に対して前記エッジ調整を行った後に、前記符号化調整フレームP1を得る。前記符号化調整フレームP1における強いエッジの中周波数から高周波数までの振幅は減衰される。前記符号化調整フレームP1における弱いエッジの中周波数から高周波数までの振幅が増強されるが、データ圧縮装置200は、前記初期フレームP0に対して前記エッジ調整を行うことによって、符号化調整フレームP1全体のデータ情報量を減少させる。データ圧縮装置200はまた、符号化調整フレームP1に対して符号化及びビットストリーム生成計算を行い、前記初期フレームP0に対する符号化効率を向上させることによって、前記初期フレームの圧縮率を向上させ、前記初期データの伝送効率を向上させることができる。それとともに、前記符号化調整フレームP1における弱いエッジの中周波数から高周波数までの振幅の増強は、ディテール損失を回避することができる。
【0121】
以上のように、データ処理方法P200は、前記初期フレームに対して前記エッジ調整を同時に行うことができ、前記初期フレームの圧縮率を向上させ、符号化効率及び前記初期データの伝送効率を向上させるとともに、データ損失を減少させ、ディテール損失を回避することができる。
【0122】
図7Aは、圧縮フレームを伸長するデータ処理方法P300のフローチャートを示した。前述のように、データ伸長装置300は、データ処理方法P300を実行することができる。具体的には、データ伸長装置300における記憶媒体は少なくとも一つの命令セットを記憶することができる。前記命令セットは、データ処理方法P300を完了するようデータ伸長装置300における伸長プロセッサに指示することができるように構成される。前記データ伸長装置300が作動する場合、伸長端プロセッサは、前記命令セットを読み取り、データ処理方法P300を実行することができる。説明を容易にするために、本発明者らは、
図3Aに示す方法で前記データ処理方法P300を説明する。前記方法P300は以下を含んでもよい。
【0123】
S320:圧縮データを取得する。前記圧縮データは前記圧縮フレームを含む。
【0124】
前記圧縮データは、データ処理方法P200により前記初期データにおける前記初期フレームに対してデータ圧縮を行って得られた前記圧縮フレームを含んでもよい。前記圧縮フレームは、圧縮された予測データPI及び残差データRを含む。いくつかの実施例において、前記圧縮フレームは、前記圧縮中フレームにおける複数のユニットのうちの各ユニットに対応する符号化関数H
1
ij(f)及びエッジ調整係数g
1
ij、即ち符号化関数H
1(f)及びエッジ調整係数g
1、つまり前述の符号化データRAMIをさらに含む。説明を容易にするために、以下の説明では、本発明者らは、前記圧縮フレームが符号化関数H
1(f)とエッジ調整係数g
1とをさらに含むことを例として説明する。
図3Aに示すように、ステップS320は、前記圧縮フレームを前記ビットストリーム解析モジュールに入力して分析し計算して、前記予測データPI及び前記残差データR、並びに符号化関数H
1(f)及びエッジ調整係数g
1を得ることを含んでもよい。前述のように、本出願では、フレームは、データ系列を構成する一般的な処理単位である。データ処理の場合、フレーム単位で計算することが多い。データ圧縮装置200がデータを圧縮するデータ処理方法P200では、前記初期データをフレーム単位で圧縮してもよい。データ伸長装置300が圧縮フレームを伸長する場合にも、フレーム単位でデータ伸長を行ってもよい。
【0125】
S340:前記圧縮フレームに対してデータ伸長を行い、伸長フレームを得る。
【0126】
前記データ伸長は、前記圧縮フレームに対して伸長計算を行い、伸長フレームを得て、前記伸長フレームを前記初期データに復元するかもしくは実質的に復元するか、又は前記伸長フレームを前記初期データよりも明瞭にすることを指す。ビデオデータを例にとると、前記伸長フレームの低周波数から中周波数領域の任意の周波数での振幅を前記初期フレームの閾値又は閾値以上に復元すると、人間の目には、前記伸長フレームと前記初期フレームとの相違点を認識することが困難になる。前記閾値は、80%~90%の間の任意の値であってもよい。例えば、前記閾値は、80%、81%、82%、83%、84%、85%、86%、87%、88%、89%、90%のうちの任意の二つの数により定義される閉区間内の任意の値であってもよい。例えば、前記データ伸長は、前記伸長フレームの低周波数から中周波数領域の任意の周波数での振幅を前記初期フレームの85%±3%以上にするべきである。
【0127】
前記データ伸長は、伸長中フレームに対してエッジ補償を行い、前記エッジ補償が施されたデータを復号化することによって、必要な伸長フレームを得ることを含む。前記伸長中フレームは、伸長中の1フレームのデータであり、前記圧縮フレームと、前記伸長過程において前記伸長フレームになる前の前記圧縮フレームのいずれかのデータ状態とを含む。
【0128】
ビデオデータを例にとると、前記データ処理方法P200は、エッジ調整と符号化を組み合わせる方法を用いて前記初期フレームを圧縮して、ビデオデータの圧縮率をさらに向上させ、ビデオ伝送の効率を向上させる。ビデオ伸長技術では、データ処理方法P300は、復号化(即ち残差データR及び予測データPIに基づいて圧縮中フレームを復元する)とエッジ補償を組み合わせる方法を用いて、前記圧縮フレームを伸長して、必要な伸長フレームを得ることによって、前記圧縮フレームにおけるデータを復元することができる。前記伸長中フレームは、前記圧縮フレームと、前記予測データPI及び残差データRに基づいて復号化する過程における前記圧縮フレームのいずれかのデータ状態とを含んでもよい。例えば、前記伸長中フレームは、前記圧縮フレームであってもよいし、復号化で得られた復号化フレーム、又は予測で得られた予測フレームなどであってもよい。
【0129】
前述のように、前記データ圧縮は、前記エッジ調整によって前記圧縮中フレームの中周波数から高周波数領域の振幅を調整し、例えば、中周波数から高周波数領域の振幅を減衰して、中周波数から高周波数領域のデータ情報量を低減することによって、前記圧縮中フレームにおけるデータ情報量を低減することであってもよい。ビデオデータを例にとると、画像中の物体のエッジ部分には大量の中周波数及び高周波数情報があり、中周波数及び高周波数領域がより多くのデータを搬送するため、中周波数から高周波数領域の振幅の低減は、前記圧縮中フレームのエッジデータを視覚的にぼやかすとともに、画像における情報量を大幅に減少させる。そのため、前記データ伸長は、エッジ補償によって前記圧縮フレームの中周波数から高周波数領域の振幅を補償し、例えば、中周波数から高周波数領域の振幅を増強して、それを前記初期フレームの状態を復元するか、又は前記初期フレームの状態よりも増強することであってもよい。
【0130】
前記圧縮フレームに対する前記データ伸長に適用される前記エッジ補償は、前記伸長中フレームをエッジ補償装置に入力してエッジ補償を行うことを指す。前記エッジ補償は前記エッジ調整に対応してもよく、つまり前記エッジ補償と前記エッジ調整とは予め設定された相関関係にあるべきである。前記エッジ補償と前記エッジ調整との相関関係を詳しく設定することにより、前記エッジ調整された圧縮フレームは、前記エッジ補償及び前記データ処理が施された後、他の計算誤差を考慮することなく、エッジ調整前のデータ指標(例えば、画像データの画像明瞭度)に完全に又は実質的に復元され、さらにいくつかの指標が符号化調整前のデータを上回る(例えば、復号化後の画像の明瞭度が原画像を上回る)。前述のように、前記エッジ調整過程で符号化データRAMI(符号化関数H1(f))及びエッジ調整係数g1)が生成される。前記エッジ補償と前記エッジ調整とが予め設定された相関関係にあることは、前記エッジ補償における復号化データ(復号化関数H2(f)及びエッジ補償係数g2)同士が予め設定された相関関係にあることであってもよい。復号化データ(復号化関数H2(f)及びエッジ補償係数g2)及び符号化データRAMI(符号化関数H1(f)及びエッジ調整係数g1)と復号化データ(復号化関数H2(f)及びエッジ補償係数g2)との間の相関関係については、後の説明で詳しく説明する。
【0131】
具体的には、ステップS340は以下を含んでもよい。
S342:前記圧縮フレームを復号化して、復号化フレームP2を得る。
【0132】
前記方法P300では、前記伸長中フレームは前記復号化フレームP
2であってもよい。前記圧縮フレームは、データ圧縮装置200により前記符号化調整フレームP
1を符号化して得られたものであってもよい。データ伸長装置300は、前記圧縮フレームを復号化して前記復号化フレームP
2を得ることができる。即ち前記予測データPIに基づいて予測して予測フレームを得て、前記残差データRと重畳して、復号化データP
2を得て、前記復号化データP
2は前記復号化フレームのデータP
2である。符号化及び復号化過程にはある程度の誤差が存在する可能性があり、符号化・復号化過程による偏差が非常に小さいと仮定すると、前記復号化フレームP
2と前記符号化調整フレームP
1が実質的に一致しているため、P
1とP
2との間の関係は以下の式で表されてもよい。
【数7】
【0133】
S344:前記伸長中フレーム(復号化フレームP2)に対して前記エッジ補償を行い、前記伸長フレームP4を得る。
【0134】
図7Bは、本明細書の実施例によるエッジ補償のフローチャートを示し、
図8は、本明細書の実施例によるエッジ補償の構造フローチャートを示した。
図7B及び
図8に示すように、ステップS344は、データ伸長装置300の少なくとも一つの伸長端プロセッサによって以下のステップを実行することを含んでもよい。
【0135】
S344-2:予め設定された前記ユニットサイズに基づいて前記伸長中フレーム(復号化フレームP2)を前記複数のユニットに分割する。前記伸長中フレーム(復号化フレームP2)に対する分割方法は、ステップS242-2における前記圧縮中フレーム(初期フレームP0)に対する分割方法と一致してもよく、各ユニットが互いに対応し、ここでこれ以上説明しない。説明を容易にするために、本発明者らは、復号化フレームP2におけるi行目及びj列目のユニットのデータをP2
ijと定義する。
【0136】
S344-4:前記エッジ調整係数に対応するエッジ補償係数を用いて、前記各ユニットの中周波数から高周波数領域での振幅を補償する。
【0137】
圧縮フレームに対してデータ伸長を行う場合、データ処理方法P300は、データ圧縮際のユニットをデータ伸長ユニットとして、エッジ調整係数に対応するエッジ補償係数を用いて、各ユニットの中周波数から高周波数領域の振幅に対してエッジ補償を行うことによって、データ圧縮過程で低下した中周波数から高周波数領域の振幅を補償して、伸長フレームを得ることができる。前記エッジ補償は前記エッジ調整に対応し、エッジ補償係数とエッジ調整係数との間には対応する関係が存在する。前記エッジ補償は、前記エッジ調整が施された圧縮データを初期フレームの明瞭度又は前記初期フレームよりも高い明瞭度に復元することができる。前記エッジ補償は、前記伸長中フレーム(復号化フレームP2)の前記複数のユニットのうちの前記各ユニットに対して、前記相関関係に基づいて、前記エッジ調整係数に対応するエッジ補償係数を用いて、それらの中周波数から高周波数領域の振幅を補償することであってもよい。前記相関関係及び前記エッジ補償係数については、後の説明で詳しく説明する。i行目及びj列目のユニットP2
ijに対して前記エッジ補償を行う場合、ステップS344-4は、現在のユニットP2
ijに対して、
S344-42:復号化関数H2
ij(f)を確定し、前記復号化関数H2
ij(f)によって現在のユニットP2
ijを調整し、第2のユニットP2b
ijを得て、それらの周波数領域内の低周波数領域での成分が保持されているが中周波数から高周波数領域での成分が減衰されるようにするステップを実行することを含んでもよい。
【0138】
ここで、H2
ij(f)は、i行目及びj列目の現在のユニットP2
ijに対応する復号化関数を表す。復号化関数H2
ij(f)は、周波数領域内でローパスフィルタであってもよく、前記復号化フレームP2における現在のユニットP2
ijの振幅を周波数領域において滑らかに低下させて、前記復号化フレームP2における現在のユニットP2
ijの周波数領域内の低周波数領域での成分が保持されているが中周波数から高周波数領域での成分が減衰されるようにすることによって、現在のユニットP2
ijに対応する第2のユニットP2
ijを得る。実現に必要な計算量を節約しリンギングアーティファクトの発生を回避するために、復号化関数H2
ij(f)は、前記現在のユニットP2
ijの周波数領域内の振幅を滑らかに遷移させるべきである。復号化関数H2
ij(f)は、滑らかに遷移する任意の形態のローパスフィルタであってもよく、本明細書はこれについて限定しない。
【0139】
説明すべきこととして、リンギングアーティファクトを回避するために、前記復号化関数H2
ij(f)は、滑らかに遷移する曲線であり、曲線における前記振幅調整利得の急激な変化を回避する。前述のように、前記リンギングアーティファクトとは、画像処理において、ある画像に対してスペクトル調整処理を行う際、選択した復号化関数H2
ij(f)には速い変化があれば、画像に「リンギング」が発生することを指す。いわゆる「リンギング」は、鐘が叩かれた後に空気振動が発生するように、出力画像の階調が激しく変化する部分で発生する振動を指す。リンギングアーティファクトは画像エッジに多く現れる。
【0140】
前記エッジ補償処理の方法は種々あるが、従来技術では、ハイパスフィルタ又はバンドパスフィルタを用いて復号化フレームP2を直接フィルタリングし、前記復号化フレームP2における低周波数領域の成分をフィルタリングし、前記復号化フレームP2における中周波数から高周波数領域の成分を抽出することによって、エッジ情報を抽出する場合がある。しかし前記ハイパスフィルタ及びバンドパスフィルタに対応する畳み込みカーネルの係数には負係数が多く現れる。前述のように、畳み込みカーネルには負係数が多く現れる場合、前記畳み込みカーネルによって畳み込みを行って得られた画像には強いリンギングアーティファクトが現れる可能性がある。そのため、リンギングアーティファクトを回避するために、本明細書に記載のデータ伸長は、滑らかに遷移する復号化関数H2
ij(f)を用いて前記復号化フレームP2を調整し、前記復号化フレームP2における中周波数から高周波数領域の成分をフィルタリングし、そして前記復号化フレームP2と前記復号化関数H2
ij(f)により調整されたデータとの差を求めれば、前記エッジ情報を得ることができ、エッジ補償係数を用いて前記エッジ情報を調整して、それを初期状態に復元するか、又は前記初期状態よりも増強する。上記方法でエッジ情報を取得する場合、全ての係数が非負数であるか、又は負係数の和の絶対値と非負係数の和との比が0.1より小さい復号化畳み込みカーネルを設計すれば、リンギングアーティファクトの発生を回避することができる。
【0141】
前記エッジ調整と同様に、前記復号化関数H2
ij(f)によって現在のユニットP2
ijを調整することは、時間領域において復号化畳み込みカーネルを用いて前記現在のユニットP2
ijに対して畳み込みを行うと表現されてもよい。そのため、前記エッジ補償で使用される復号化畳み込みカーネルと前記エッジ調整で使用される符号化畳み込みカーネルも対応する相関関係にあるべきである。つまり符号化関数H1
ij(f)と復号化関数H2
ij(f)も対応する相関関係にあるべきである。つまり符号化関数H1
ij(f)及び前記符号化畳み込みカーネルに対応する復号化関数H2
ij(f)及び復号化畳み込みカーネルを選択することにより、二つの方法で同じ効果を達成することができる。説明を容易にするために、本明細書は、時間領域において畳み込みを行うことを例として前記エッジ補償を説明するが、当業者であれば分かるように、周波数領域において復号化関数H2
ij(f)と乗算するによってスペクトル調整を行う形態も本明細書が保護すべき範囲である。
【0142】
一つの画像に対してエッジ調整処理を行う場合、選択した復号化関数には数値が激しく変化する領域が存在すれば、実現には次数のより高い畳み込みカーネル又は畳み込みカーネルの組み合わせが必要となる。これは、不要な演算量の増加を意味する。それとともに、高次畳み込みカーネルは、階調又は色が激しく変化する位置で、リンギングアーティファクトと呼ばれる強い色振動を出力画像に発生させる可能性が高くなる。リンギングアーティファクトは画像エッジに多く現れる。周波数領域内のH2
ij(f)前記現在のユニットP2
ijに対する前記復号化関数による振幅調整利得を滑らかに遷移させることによって、前記振幅調整利得の急激な変化を回避することができる。例えば、前記低周波数領域と前記中周波数領域がつながっていない場合、前記復号化関数H2
ij(f)は、周波数領域において、前記現在のユニットP2
ijの中低周波数領域の振幅を調整して、前記振幅調整利得の中低周波数領域での変化を滑らかで連続的にすることができる。
【0143】
リンギングアーティファクトを回避するために、前記復号化畳み込みカーネルにおける負係数の和の絶対値と非負係数の和との比は閾値より小さい。例えば、前記閾値は、0.01、0.02、0.03、0.04、0.05、0.06、0.07、0.08、0.09、0.1、0.2、0.3、0.4のうちのいずれか一つの値又は任意の二つの数により定義される区間内の任意の値であってもよい。例えば、前記復号化畳み込みカーネルにおける畳み込みカーネル係数は、いずれも非負数であると選択されてもよい。復号化関数H2
ij(f)において、中周波数から高周波数領域に対する振幅調整利得は、0であり、一定の誤差範囲内で変動することができる。前記誤差範囲は、0、±1%、±2%、±3%、±4%、±5%、±6%、±7%、±8%、±9%、±10%、±11%、±12%、±13%、±14%、±15%、±16%、±17%、±18%、±19%、±20%、±21%、±22%、±23%、±24%、±25%、±26%、±27%、±28%、±29%、±30%、±31%、±32%、±33%、±34%、±35%などの数値のうちの任意の二つにより規定される区間内にあってもよい。
【0144】
復号化関数H2
ij(f)によって直流部分、即ち周波数が0である部分で振幅調整利得が1であるように維持して、初期フレームにおける基礎情報を保持できることを確保することができる。そのため、前記復号化関数H2
ij(f)によって現在のユニットP2
ijを調整する場合、前記低周波数領域に対する振幅調整利得は、周波数が0である位置の振幅調整利得1から中周波数領域の0に近い振幅調整利得に滑らかに遷移する。
【0145】
前述のように、符号化関数H1
ij(f)と復号化関数H2
ij(f)も対応する相関関係にあるべきである。つまり、復号化関数H2
ij(f)は、符号化関数H1
ij(f)に対応するべきである。データ伸長装置300の記憶媒体には、復号化関数群が記憶されてもよい。前記復号化関数群には、少なくとも一つの異なる復号化関数が含まれてもよい。各復号化関数は一つの復号化畳み込みカーネルに対応する。つまり、データ伸長装置300の記憶媒体には、少なくとも一つの復号化畳み込みカーネルが含まれてもよい。いくつかの実施例において、データ伸長装置300の記憶媒体には、復号化関数H2
ij(f)と符号化関数H1
ij(f)との間の対応関係がさらに記憶されてもよい。
【0146】
前述のように、いくつかの実施例において、前記圧縮フレームには、前記符号化データRAMI、即ち符号化関数H1(f)及びエッジ調整係数g1、つまり各ユニットに対応する符号化関数H1
ij(f)及びエッジ調整係数g1
ijが含まれている。データ伸長装置300は、前記現在のユニットP2
ijに対して畳み込みを行う際、符号化関数H1(f)及び復号化関数H2
ij(f)と符号化関数H1
ij(f)との間の対応関係に基づいて、予め設定された前記復号化関数群から現在のユニットP2
ijの符号化関数H1
ij(f)に対応する関数を現在のユニットP2
ijに対応する復号化関数H2
ij(f)として選択し、前記少なくとも一つの復号化畳み込みカーネルから現在のユニットP2
ijに対応する復号化関数H2
ij(f)に対応する畳み込みカーネルを前記復号化畳み込みカーネルとして選択し、前記現在のユニットP2
ijに対して畳み込みを行うことができる。
いくつかの実施例において、前記圧縮フレームには、前記符号化データRAMI、即ち符号化関数H1(f)及びエッジ調整係数g1が含まれていない。この場合、データ伸長装置300は、前記現在のユニットP2
ijに対して畳み込みを行う際、予め設定された前記復号化関数群から任意に一つの関数を前記復号化関数H2
ij(f)として選択し、それに対応する畳み込みカーネルを前記復号化畳み込みカーネルとして用いて、現在のユニットP2
ijに対して畳み込みを行うことができる。データ伸長装置300は、また経験値に依存して前記復号化関数群から復号化関数H2
ij(f)を選択し、例えば、機械学習によって復号化関数H2
ij(f)を選択することができる。
【0147】
いくつかの実施例において、復号化関数H
2
ij(f)は、符号化関数H
1
ij(f)と同じであってもよい。
図6に示すグラフは、復号化関数H
2
ij(f)であってもよい。当業者であれば分かるように、前記現在のユニッP
2
ijの振幅を周波数領域において滑らかに低下させて、前記復号化フレームP
2における現在のユニットP
2
ijの周波数領域内の低周波数領域での成分が保持されているが中周波数から高周波数領域での成分が減衰されるようにすることができる全ての復号化関数H
2
ij(f)及び復号化関数H
2
ij(f)の線形組み合わせH
2
ij(f)=Σ
m=1
nk
mH
2m
ij(f)、又は復号化関数H
2
ij(f)の積組み合わせH
2
ij(f)=Π
q=1
nk
qH
2q
ij(f)、又は線形組み合わせと積組み合わせとの組み合わせは、いずれも本明細書の保護範囲に属する。ここで、m≧1であり、H
2
ij(f)=Σ
m=1
nk
mH
2m
ij(f)は、n個の関数の線形組み合わせを表し、H
2m
ij(f)は、m番目の関数を表し、k
mは、m番目の関数に対応する重みを表す。q≧1であり、H
2
ij(f)=Π
q=1
nk
qH
2q
ij(f)は、n個の関数の積組み合わせを表し、k
qは、q番目の関数に対応する重みを表し、H
2q
ij(f)は、任意の関数であってもよい。
【0148】
前述のように、前記エッジ補償において、データ伸長装置300は、各ユニットに対してステップS344-42を実行することができる。各ユニットP2
ijは、復号化関数H2
ij(f)により調整された後に、いずれも対応する第2のユニットP2b
ijを得る。全てのユニットに対応する復号化関数H2
ij(f)を組み合わせて復号化関数H2(f)を得る。各ユニットに対応する復号化関数H2
ij(f)は、各ユニットが所在する位置に応じて組み合わせて復号化関数H2(f)を生成することができる。復号化関数H2(f)は行列と見なされ得る。
【0149】
全てのユニットに対応する第2のユニットP
2b
ijを組み合わせて第2のフレームP
2bを構成する。各ユニットに対応する第2のユニットP
2b
ijは、各ユニットが所在する位置に応じて組み合わせて第2のフレームP
2bを生成することができる。第2のフレームP
2bはぼやけた画像である。P
2とP
2bとの間の関係は以下の式で表されてもよい。
【数8】
【0150】
図7B及び
図8に示すように、i行目及びj列目のユニットP
2
ijに対して前記エッジ補償を行う場合、ステップS344-4は、現在のユニットP
2
ijに対して、
S344-44:現在のユニットP
2
ijと前記第2のユニットP
2b
ijとの差を求め、現在のユニットP
2
ijに対応する第2のエッジE
2b
ijを取得するステップを実行することをさらに含んでもよい。
【0151】
各フレームのデータスペクトルにおける中周波数から高周波数成分は、主にこのフレームのデータにおけるデータ変化の激しい領域、つまりデータのエッジデータに集まっている。例えば、1フレームの画像の場合、前記中周波数から高周波数までのデータは、主に前記画像中の物体のエッジ、つまりこのフレームの画像のエッジデータに集まっている。前記復号化関数H
2
ij(f)は、現在のユニットP
2
ijの周波数領域内の振幅を滑らかに低下させて、中周波数から高周波数領域の成分を減衰する。そのため、第2のユニットP
2b
ijは、現在のユニットP
2
ijにおけるエッジ情報が除去されたデータであると理解され得る。次に、現在のユニットP
2
ijと前記第2のユニットP
2b
ijとの差を求め、現在のユニットP
2
ijのエッジ、即ち第2のエッジE
2b
ijを得ることができる。そのため、前記第2のエッジE
2b
ijは、現在のユニットP
2
ijの前記中周波数から前記高周波数領域での成分を含む。前記第2のエッジE
2b
ijは、現在のユニットP
2
ijにおけるエッジ情報を含む。各ユニットP
2
ijは、ステップS344-44の後に、いずれも対応する第2のエッジE
2b
ijを得る。全てのユニットに対応する第2のエッジE
2b
ijを組み合わせて第2のエッジフレームE
2bを構成する。各ユニットに対応する第2のエッジE
2b
ijは、各ユニットが所在する位置に応じて組み合わせて第2のエッジフレームE
2bを生成することができる。前記第2のエッジフレームE
2bは以下の式で表されてもよい。
【数9】
【0152】
図7B及び
図8に示すように、i行目及びj列目のユニットP
2
ijに対して前記エッジ補償を行う場合、ステップS344-4は、現在のユニットP
2
ijに対して、
S344-46:現在のユニットP
2
ijのエッジ調整係数g
1
ijに対応する前記エッジ補償係数を用いて第2のエッジE
2b
ijの振幅を補償して、現在のユニットP
2
ijに対応する復号化エッジE
2m
ijを得るステップを実行することをさらに含んでもよい。
【0153】
説明を容易にするために、本発明者らは、前記エッジ補償に対応する前記エッジ補償係数をg2と定義する。本発明者らは、i行目及びj列目のユニットP2
ijに対応するエッジ補償係数をg2
ijと定義する。前述のように、前記エッジ調整は、前記圧縮中フレームにおける強いエッジのその周波数領域の中周波数から高周波数領域での振幅を減衰し、前記圧縮中フレームのエッジデータをぼやかすことによって、符号化によるデータ量を減少させることができる。前記エッジ補償は、前記エッジ調整が施されたデータを復元し、さらに増強することができる。つまり、前記エッジ補償は、前記伸長中フレームにおける中周波数から高周波数領域の振幅を減衰前の状態に完全に復元するか又は実質的に復元し、さらに前記減衰前の状態よりも増強することができる。つまり、エッジ調整係数g1
ijとエッジ補償係数g2
ijとは予め設定された前記相関関係にあり、即ちエッジ調整係数g1
ijとエッジ補償係数g2
ijは互いに対応する。データ伸長装置300の記憶媒体には、エッジ補償係数群が記憶されてもよい。前記エッジ補償係数群には、少なくとも一つの異なる係数が含まれてもよい。いくつかの実施例において、データ伸長装置300の記憶媒体には、エッジ調整係数g1
ijとエッジ補償係数g2
ijとの間の対応関係がさらに記憶されてもよい。
【0154】
前述のように、いくつかの実施例において、前記圧縮フレームには、前記符号化データRAMI、即ち符号化関数H1(f)及びエッジ調整係数g1、つまり各ユニットに対応する符号化関数H1
ij(f)及びエッジ調整係数g1
ijが含まれている。データ伸長装置300は、ステップS344-46を実行する際、エッジ調整係数g1
ijとエッジ補償係数g2
ijとの前記相関関係に基づいて、予め設定された前記エッジ補償係数群から現在のユニットP2
ijのエッジ調整係数g1
ijに対応するエッジ補償係数g2
ijを現在のユニットP2
ijに対応するエッジ補償係数g2
ijとして選択し、前記第2のエッジE2b
ijの振幅を補償することができる。
【0155】
いくつかの実施例において、前記圧縮フレームには、前記符号化データRAMI、即ち符号化関数H1(f)及びエッジ調整係数g1が含まれていない。この場合、データ伸長装置300は、ステップS344-46を実行する際、予め設定された前記エッジ補償係数群から任意に一つの係数を現在のユニットP2
ijに対応するエッジ補償係数g2
ijとして選択し、前記第2のエッジE2b
ijの振幅を補償することができる。データ伸長装置300は、また経験値に依存して前記エッジ補償係数群からエッジ補償係数g2
ijを選択し、例えば、機械学習によってエッジ補償係数g2
ijを選択することができる。
【0156】
全てのユニットに対応する復号化エッジE
2m
ijを組み合わせて復号化エッジフレームE
2mを構成する。各ユニットに対応する復号化エッジE
2m
ijは、各ユニットが所在する位置に応じて組み合わせて復号化エッジフレームE
2mを生成することができる。E
2mとE
2bとの間の関係は以下の式で表されてもよい。
【数10】
【0157】
図7B及び
図8に示すように、i行目及びj列目のユニットP
0
ijに対して前記エッジ補償を行う場合、ステップS344-4は、現在のユニットP
2
ijに対して、
S344-48:現在のユニットP
2
ijと復号化エッジE
2m
ijを重畳して、現在のユニットP
2
ijに対応する復号化ユニットP
4
ijを得るステップを実行することを含んでもよい。
【0158】
各ユニットP
2
ij及び復号化エッジE
2m
ijは、重畳後に、いずれも対応する復号化ユニットP
4
ijを得る。全てのユニットに対応する復号化ユニットP
4
ijを組み合わせて伸長フレームP
4を構成する。各ユニットに対応する復号化ユニットP
4
ijは、各ユニットが所在する位置に応じて組み合わせて伸長フレームP
4を生成することができる。P
4とE
2m及びP
2との間の関係は以下の式で表されてもよい。
【数11】
【0159】
式(8)~式(11)から分かるように、P
2とP
4との間の関係は以下の式で表されてもよい。
【数12】
【0160】
説明を容易にするために、本発明者らは、P
4とP
2との間の伝達関数を復号化伝達関数H
D(f)と定義し、復号化伝達関数H
Dは以下の式で表されてもよい。
【数13】
【0161】
式(5)、(6)、(12)及び(13)に基づいて、P
0とP
4との間の関係は以下の式で表されてもよい。
【数14】
【0162】
ビデオデータを例にとると、人間の目が低周波数から中周波数領域の情報に敏感であるため、前記エッジ調整の設計は初期フレームP
0における中周波数から高周波数領域のみの振幅を減衰し、符号化調整フレームP
1には初期フレームP
0における低周波数の周波数情報が保持されている。前記復号化フレームP
2と前記符号化調整フレームP
1が実質的に一致しているため、復号化フレームP
2にも低周波数の周波数情報が保持されている。一方、前記エッジ補償の設計は、復号化フレームP
2における中周波数から高周波数領域のみの振幅を補償した。そのため、伸長フレームP
4には初期フレームP
0における低周波数の周波数情報が保持されている。理論的には、他のアルゴリズムによる偏差を考慮することなく、前記エッジ補償により復号化フレームP
2における中周波数から高周波数領域の振幅を補償して得られた伸長フレームP
4は、初期フレームP
0における中周波数の全ての周波数情報を完全に復元するか又は実質的に復元することができる。つまり前記データ伸長は、中周波数の任意の周波数において、前記データ圧縮が施されたデータを復元し、さらに増強することができる。そのため、データ伸長後、前記伸長フレームP
4は、低周波数の任意の周波数での振幅が前記初期フレームP
0にほぼ等しく、中周波数領域の任意の周波数での振幅が約前記初期フレームP
0以上でなければならない。前述した、ほぼ等しいというのは、前記伸長フレームP
4の振幅が前記初期フレームP
0の振幅に等しく、一定の誤差範囲内で変動することを指す。ビデオデータを例にとると、前記伸長フレームP
4の低周波数から中周波数領域の任意の周波数での振幅を前記初期フレームP
0の85%又は85%以上に復元すると、人間の目には、前記伸長フレームP
4と前記初期フレームP
0との相違点を認識することが困難になる。そのため、データ伸長後に、前記伸長フレームP
4の低周波数から中周波数領域の任意の周波数での振幅は、前記初期フレームP
0の85%以上でなければならない。即ち前記誤差範囲は、前記伸長フレームP
4の低周波数から中周波数領域の任意の周波数での振幅を前記初期フレームP
0の85%未満にするべきではない。人間の目が高周波数領域の情報に敏感でないため、前記伸長フレームP
4における高周波数領域に関する情報は、高品質が求められるシナリオに対応するように保持されてもよいし、不要な高周波ノイズを抑制するように減衰されてもよい。つまり、前記伸長フレームP
4の高周波数の任意の周波数での振幅は、前記初期フレームP
0にほぼ等しくてもよいし、前記初期フレームP
0より低くてもよく、さらに前記初期フレームP
0より大きくてもよい。P0とP
4との間の関係は以下の式で表されてもよい。
【数15】
又は
【数16】
【0163】
説明すべきこととして、式では、一定範囲の誤差が許容される。例えば、P4≧P0とは、P4の基準値がP0以上である場合に、P4が一定の誤差範囲内で変動することが許容されることであってもよい。つまり、P4=P0の際、P4は、負の誤差の場合に、P4がP0よりわずかに小さいことを許容する。ここでの式は、P4とP0との基本関係式を示しただけであり、誤差が式に記述されていない。当業者であれば分かるように、誤差範囲内の変動により、伸長フレームP4の低周波数から中周波数領域の振幅が前記初期フレームP0よりわずかに小さくなる場合も本明細書の保護範囲に属する。以下の式においても、一定範囲の誤差が許容される。以下においても、P4の振幅が前記初期フレームP0以上であるという基本的な関係についてのみ説明する。誤差範囲内の変動については、当業者は自ら推論することができる。
【0164】
説明を容易にするために、本発明者らが、P
0とP
4との間の全体的スペクトル調整関数をH
0(f)と定義すれば、P
0とP
4との間の関係は以下の式で表されてもよい。
【数17】
【0165】
そうであれば、全体的スペクトル調整関数H
0(f)は以下の式で表されてもよい。
【数18】
又は
【数19】
ここで、f
0は人間の目が敏感な周波数の境界値であり、ビデオデータの場合、f
0は、0.33であってもよいし、0.33より大きいか又は小さい他の数値であってもよい。データの種類によって、f
0の値は異なる。
【0166】
上記式(18)~(19)におけるH0(f)は、選択された周波数領域区間H0(f)≒1である場合、前記伸長フレームP4の選択された周波数領域区間内でのデータを前記初期フレームP0に復元することができ、選択された周波数領域区間H0(f)>1である場合、前記伸長フレームP4の選択された周波数領域区間内でのデータを増強することができ、即ち前記伸長フレームP4の選択された領域での振幅は前記初期フレームP0より高い。例えば、初期フレームP0がビデオにおける1フレームである場合、選択された周波数領域区間においてH0(f)を1より大きくすれば、明瞭度の増強を実現することができる。説明を容易にするために、本発明者らは、H0(f)≒1を通常モードと定義し、H0(f)>1を増強モードと定義する。以下では、本発明者らは、ビデオデータを例として、全体的スペクトル調整関数H0(f)を詳しく説明する。
【0167】
図9Aは、本明細書の実施例による全体的調整関数H
0(f)のグラフを示した。
図9Bは、本明細書の実施例による全体的調整関数H
0(f)のグラフを示した。
図9Cは、本明細書の実施例による全体的調整関数H
0(f)のグラフを示した。
図9Dは、本明細書の実施例による全体的調整関数H
0(f)のグラフを示した。
図9A~
図9Dに示すように、横軸は正規化周波数fであり、縦軸は全体的スペクトル調整関数H
0(f)の振幅調整利得H
0である。
図9A~9Dにおけるグラフは、異なる全体的スペクトル調整関数H
0(f)を表す。横軸の正規化周波数の最大値は0.5である。前記横軸の正規化周波数fは、低周波数領域、中低周波数領域、中周波数領域、中高周波数領域及び高周波数領域に分けられ得る。(0、a]の間の周波数は低周波数に属し、(a、b]の間の周波数は中低周波数に属し、(b、c]の間の周波数は中周波数に属し、(c、d]の間の周波数は中高周波数に属し、(d、0.5]の間の周波数は高周波数に属する。ここで、a、b、c、d、eの値は、
図6を参照し、ここでこれ以上説明しない。
【0168】
人間の目が、ビデオデータにおける高周波数のデータより、低周波数から中周波数までのデータの方に敏感であるため、データ伸長後に、前記初期フレームP
0に対して、前記伸長フレームP
4の低周波数から中周波数領域の情報が失われないように維持するべきであり、つまり、全体的スペクトル調整関数H
0(f)は、前記伸長フレームP
4の低周波数から中周波数領域での振幅を前記初期フレームP
0の85%以上にするべきであり、さらに前記初期フレームP
0より大きくしてもよい。人間の目が高周波数領域の情報に敏感でないため、前記伸長フレームP
4の高周波数領域での振幅は異なる応用シナリオに応じて選択することができ、例えば、明瞭度要求が低いシナリオで、前記伸長フレームP
4の高周波数領域での振幅は前記初期フレームP
0より小さくてもよい。明瞭度要求が非常に高い偵察シナリオでは、前記伸長フレームP
4の高周波数領域での振幅は、前記初期フレームP
0にほぼ等しいか、又は前記初期フレームP
0より大きくてもよい。
図9A~9Dに示すように、全体的調整関数H
0(f)の低周波数から中周波数領域(低周波数及び中周波数領域を含む)の任意の周波数fでの振幅調整利得H
0が1より大きいか又は1にほぼ等しいことによって、伸長後の伸長フレームP
4の振幅は前記初期フレームP
0の85%未満であり、明瞭度を復元するか又は増強し、視覚的観察効果を向上させる。ここでは、前述した、1にほぼ等しいというは、1に等しい一定の誤差範囲内で変動することを指してもよい。前記誤差範囲は、0、±1%、±2%、±3%、±4%、±5%、±6%、±7%、±8%、±9%、±10%、±11%、±12%、±13%、±14%、±15%などの数値のうちの任意の二つにより規定される区間内にあってもよい。説明を容易にするために、本発明者らは、全体的調整関数H
0(f)の高周波数領域での振幅調整利得を第1の振幅調整利得と定義し、中周波数領域での振幅調整利得を第2の振幅調整利得と定義し、低周波数領域での振幅調整利得を第3の振幅調整利得と定義する。前記第3の振幅調整利得値、第2の振幅調整利得値及び第1の振幅調整利得値は、前記誤差範囲内で変動することができる。
【0169】
図9Aに示すように、全体的調整関数H
0(f)の低周波数から高周波数領域での第3の振幅調整利得値、第2の振幅調整利得値及び第1の振幅調整利得値がいずれも1にほぼ等しく、それにより前記伸長フレームP
4の低周波数から高周波数領域での振幅がいずれも前記初期フレームP
0の85%以上であり、それにより前記伸長フレームP
4の低周波数から高周波数領域でのデータは、初期フレームP
0の状態に穏やかに復元するか又は実質的に復元することができる。
【0170】
図9Bに示すように、全体的調整関数H
0(f)の低周波数から中周波数領域での第3の振幅調整利得値及び第2の振幅調整利得値がいずれも1にほぼ等しく、それにより前記伸長フレームP
4の低周波数から中周波数領域でのデータは、初期フレームP
0の状態に穏やかに復元するか又は実質的に復元することができる。全体的調整関数H
0(f)の高周波数領域での第1の振幅調整利得値が1より小さく、それにより前記伸長フレームP
4の高周波数領域での振幅は、前記初期フレームP
0に対して穏やかに低下して、高周波数ノイズを抑制する。前記振幅の穏やかな低下は、前記振幅が第1の振幅調整利得値で減衰することであってもよいし、前記振幅が前記第1の振幅調整利得値付近の一定の誤差範囲内で減衰することであってもよい。例えば、前記第1の振幅調整利得は、0~1の間の任意の数値であってもよい。例えば、前記第1の振幅調整利得値は、0、0.04、0.08、0.12、0.16、0.20、0.24、0.28、0.32、0.36、0.40、0.44、0.48、0.52、0.56、0.60、0.64、0.68、0.72、0.76、0.80、0.84、0.88、0.92、0.96及び1などの数値のうちの任意の二つによって規定される区間内にあってもよい。
図9Bに示すように、前記全体的調整関数H
0(f)の高周波数領域(概ね0.4~0.5の区間)での第1の振幅調整利得は約0.6である。第2及び第3の振幅調整利得値はいずれも1付近である。第2及び第3の振幅調整利得値は、一定の誤差範囲内で変動することができ、例えば、第2及び第3の振幅調整利得値は、0.85、0.90、0.95、1、1.05、1.10、及び1.15などの数値のうちの任意の二つによって規定される区間内にあってもよい。
【0171】
図9Cに示すように、全体的調整関数H
0(f)の低周波数領域での第3の振幅調整利得値が1にほぼ等しく、それにより前記伸長フレームP
4の低周波数領域でのデータは、初期フレームP
0の状態に穏やかに復元するか又は実質的に復元することができる。全体的調整関数H
0(f)の中周波数領域での第2の振幅調整利得値及び高周波数領域での第1の振幅調整利得値がいずれも1より大きく、それにより前記伸長フレームP
4の中周波数から高周波数領域での振幅が前記初期フレームP
0に対して穏やかに増加し、それによって中周波数から高周波数領域でのデータ明瞭度を増強する。前記振幅の穏やかな増加は、前記振幅が第2の振幅調整利得値及び第1の振幅調整利得値で増強することであってもよいし、前記振幅が前記第2の振幅調整利得値及び前記第1の振幅調整利得値付近の一定の誤差範囲内で増強することであってもよい。前記第2の振幅調整利得値と前記第1の振幅調整利得値の大きさが実質的に一致してもよいし、前記第2の振幅調整利得値が前記第1の振幅調整利得値より大きいか、又は前記第2の振幅調整利得値が前記第1の振幅調整利得値より小さくてもよい。
図9Cに示すグラフにおいて、前記第2の振幅調整利得値と前記第1の振幅調整利得値のサイズは実質的に一致している。前記第2の振幅調整利得値及び前記第1の振幅調整利得値は1より大きい任意の数値であってもよい。例えば、前記第2の振幅調整利得値及び前記第1の振幅調整利得値は、1、1.1、1.2、1.3、1.4、1.5、1.6、1.7、1.8、1.9、2、2.1、2.2及び2.4などの数値のうちの任意の二つによって規定される区間内にあってもよい。
図9Cに示すように、前記全体的調整関数H
0(f)の中周波数から高周波数領域での第2の振幅調整利得及び第1の振幅調整利得は約1.2である。
【0172】
図9Dに示すように、全体的調整関数H
0(f)の低周波数領域での第3の振幅調整利得値が1にほぼ等しく、それにより前記伸長フレームP
4の低周波数領域でのデータは、初期フレームP
0の状態に穏やかに復元するか又は実質的に復元することができる。全体的調整関数H
0(f)の中周波数領域での第2の振幅調整利得値が1より大きく、それにより前記伸長フレームP
4の中周波数での振幅が前記初期フレームP
0に対して穏やかに増加し、それによって中周波数領域のデータ明瞭度を増強する。全体的調整関数H
0(f)の高周波数領域での第1の振幅調整利得値が1より小さく、それにより前記伸長フレームP
4の高周波数領域での振幅が前記初期フレームP
0に対して穏やかに低下し、それによって敏感でない高周波数領域のデータ量を低下させて、高周波数ノイズを抑制する。
図9Dに示すグラフは、データ量を減少させるとともに、明瞭度を増強することができる。前記第2の振幅調整利得値は、1より大きい任意の数値であってもよい。前記第1の振幅調整利得は、0~1の間の任意の数値であってもよい。
図9Dに示すように、前記全体的調整関数H
0(f)は、中周波数領域での第2の振幅調整利得が約1.2であり、高周波数領域での第1の振幅調整利得が約0.6である。
【0173】
さらに、前記高周波数領域と前記中周波数領域がつながっていない場合、前記全体的スペクトル調整関数H0(f)はさらに、高周波数領域の振幅を調整して、前記振幅調整利得の中高周波数領域での変化を滑らかで連続的にすることができる。
【0174】
さらに、前記中周波数領域と前記低周波数領域がつながっていない場合、前記全体的スペクトル調整関数H0(f)はさらに、中低周波数領域の振幅を調整して、前記振幅調整利得の中低周波数領域での変化を連続的にすることができる。
【0175】
前記全体的調整関数H0(f)の曲線は、滑らかに遷移する曲線である。工学的実現では、前記伸長フレームP4の低周波数から中周波数領域での振幅が前記初期フレームP0にほぼ等しいか又はそれより大きいことを実現した上で、前記全体的調整関数H0(f)の曲線には、伸長の効果に影響を及ぼさない小範囲の変動が存在することが許容され得る。ビデオデータ以外の他の形態のデータについて、前記全体的調整関数H0(f)のパラメータは、データに対する受信者の感度に基づいて設置されてもよい。データに対する受信者の感度は、データの形態によって異なる。
【0176】
説明を容易にするために、本発明者らは、式(18)に示す状況を例として説明する。式(17)及び式(18)と併せると、前記伸長フレームP
4は以下の式で表されてもよい。
【数20】
【0177】
図10Aは、本明細書の実施例による通常モードの全体的調整関数H
0(f)、符号化関数H
1(f)、符号化伝達関数H
E(f)及び復号化伝達関数H
D(f)のグラフを示した。
図10Bは、本明細書の実施例による増強モードの全体的調整関数H
0(f)、符号化関数H
1(f)、符号化伝達関数H
E(f)及び復号化伝達関数H
D(f)のグラフを示した。
図10A及び
図10Bで使用される符号化畳み込みカーネルと復号化畳み込みカーネルは同じであり、いずれも表1に示す畳み込みカーネルである。
図10Aにおいて、エッジ調整係数g
1=0.5であり、エッジ補償係数g
2=0.96である。
図10Bにおいて、エッジ調整係数g
1=0.5であり、エッジ補償係数g
2=1.6である。
図10A及び
図10Bに示すように、横軸は正規化周波数fであり、縦軸は振幅調整利得Hである。
図10Aに示すように、任意の周波数領域での全体的スペクトル調整関数H
0(f)≒1であり、全体的スペクトル調整関数H
0(f)は前記伸長フレームに対して通常モードのスペクトル調整を行い、即ち全体的スペクトル調整関数H
0(f)において、全ての周波数に関する情報が完全に保持され、前記伸長フレームにおけるデータは、前記初期フレームにおけるデータに実質的に復元することができる。
図10Bに示すように、低周波数領域での全体的スペクトル調整関数H
0(f)≒1であり、中周波数から高周波数領域での全体的スペクトル調整関数H
0(f)>1である。全体的スペクトル調整関数H
0(f)は、前記伸長フレームの中周波数から高周波数領域に対して増強モードのスペクトル調整を行い、即ち全体的スペクトル調整関数H
0(f)において、中周波数から高周波数領域に関する情報を増強し、前記伸長フレームにおける中周波数から高周波数領域のデータは、前記初期フレームにおける中周波数から高周波数領域のデータに比べて増強される。説明すべきこととして、
図10A及び
図10Bに示すグラフは、単に例示的な説明に過ぎず、当業者であれば分かるように、H
0(f)、H
1(f)、H
E(f)及びH
D(f)のグラフは
図10A及び
図10Bに示す形態に限定されるものではなく、式(18)及び式(19)を満たす全てのH
0(f)、H
1(f)、H
E(f)及びH
D(f)グラフはいずれも本明細書の保護範囲に属する。
【0178】
以上のように、本明細書によるデータ処理システム100は、前記初期データを圧縮する際、データ圧縮装置200によって方法P200を実行し、初期ビデオデータにおける初期フレームを複数のユニットに分割し、各ユニットの中周波数から高周波数領域の振幅を取得し、異なるエッジ調整係数を用いて各ユニットにおける中周波数から高周波数領域の振幅を調整することによって、前記初期フレームの前記中周波数から前記高周波数領域での振幅を低減することができる。現在のユニットにおける中周波数から高周波数領域の振幅が大きく、現在のユニットには強いエッジが含まれることを示す場合、1より小さく0より大きいエッジ調整係数を用いて、現在のユニットの中周波数から高周波数領域の振幅を調整して、現在のユニットの中周波数から高周波数領域の振幅を低減することによって、現在のユニットにおける中周波数から高周波数領域内の信号強度を低下させて、データ情報量を減少させ、予測し残差を求める際にデータ圧縮の効率を向上させることができる。現在のユニットにおける中周波数から高周波数領域の振幅が小さく、現在のユニットには弱いエッジが含まれることを示す場合、1より大きいエッジ調整係数を用いて、現在のユニットの中周波数から高周波数領域の振幅を調整して、現在のユニットの中周波数から高周波数領域の振幅を増強することによって、現在のユニットにおける弱いエッジがデータ圧縮(予測し残差を求める)中に失われることを回避し、ディテール損失を回避する。前記データ処理方法P200及びシステム100は、データ圧縮の効率を向上させるとともに弱いエッジのデータ情報量を増加させることによって、データ圧縮過程でディテール損失を引き起こすことを回避し、即ちデータ圧縮効率を向上させるとともにデータ歪みを減少させることができる。
【0179】
本明細書によるデータ処理システム100は、前記圧縮フレームに対してデータ伸長を行う際、データ伸長装置300によって方法P300を実行し、データ圧縮際のユニットをデータ伸長ユニットとして、エッジ調整係数に対応するエッジ補償係数を用いて、各ユニットの中周波数から高周波数領域の振幅に対してエッジ補償を行うことによって、データ圧縮過程で低下した中周波数から高周波数領域の振幅を補償して、伸長フレームを得ることができる。前記エッジ補償は前記エッジ調整に対応し、エッジ補償係数とエッジ調整係数との間には対応する関係が存在する。前記エッジ補償は、前記エッジ調整が施された圧縮データを初期フレームの明瞭度又は前記初期フレームよりも高い明瞭度に復元することができる。つまり、復号化側は、符号化・復号化の計算量を著しく増加することなく、少なくとも伸長データの重要な周波数内のデータを初期フレームの明瞭度に復元することができ、さらに初期フレームよりも高い明瞭度を取得することができる。初期フレームのエッジ調整過程におけるエッジ調整係数がいずれも0より大きく、圧縮フレームにおける情報が欠落していないため、前記エッジ調整係数と前記エッジ補償係数との関係及びそれぞれの特徴に基づいて、エッジ調整係数及びエッジ補償係数を設計し、圧縮フレームにおける情報を復元することができる。前記方法及びシステムは、データの圧縮効率を著しく向上させ、データの伝送効率を向上させ、データロスを減少させ、ディテール損失を回避するとともに、ノイズを除去し、伸長後のデータの明瞭度を向上させることができる。
本明細書はまた、非一時的な記憶媒体を提供し、データ処理を行うための少なくとも一組の実行可能な命令が記憶されており、前記実行可能な命令は、プロセッサにより実行される場合、データ処理方法P200のステップを実施するように前記プロセッサに指示する。いくつかの可能な実施形態において、本明細書の各態様はさらに、プログラムコードを含むプログラムプロダクトの形態で実現され得る。前記プログラムプロダクトがデータ圧縮装置200上で作動する場合、前記プログラムコードは、本明細書に記載されるデータ処理のステップをデータ圧縮装置200に実行させるためのものである。上記方法を実現するためのプログラムプロダクトは、携帯型コンパクトディスクリードオンリメモリ(CD-ROM)を用いてもよく、プログラムコードを含み、データ圧縮装置200、例えば、パソコン上で作動可能である。しかしながら、本明細書のプログラムプロダクトは、これに限定されるものではなく、本明細書では、可読記憶媒体は、プログラムを含むか又は記憶する任意の有形媒体であってもよく、該プログラムは、命令実行システム(例えば、圧縮側プロセッサ220)によって使用されてもよく、又はそれと組み合わせて使用されてもよい。前記プログラムプロダクトは、一つ又は複数の可読媒体の任意の組み合わせを用い得る。可読媒体は、可読信号媒体又は可読記憶媒体であってもよい。可読記憶媒体は、例えば、電気、磁気、光学、電磁、赤外線、又は半導体のシステム、装置もしくはデバイス、又は以上の任意の組み合わせであってもよいが、これらに限定されない。可読記憶媒体は、更なる具体例として、一つ又は複数の導線を有する電気接続、携帯型ディスク、ハードディスク、ランダムアクセスメモリ(RAM)、リードオンリメモリ(ROM)、消去可能なプログラマブルリードオンリーメモリ(EPROM又はフラッシュメモリ)、光ファイバ、携帯型コンパクトディスクリードオンリメモリ(CD-ROM)、光学メモリデバイス、磁気メモリデバイス、又はこれらの任意の適切な組み合わせを含む。前記コンピュータ可読記憶媒体は、ベースバンドで又は搬送波の一部として伝搬され、可読性のプログラムコードが搭載されるデータ信号を含んでもよい。このように伝搬されるデータ信号は、電磁信号、光信号、又はこれらの任意の適切な組み合わせなどの様々な形態をとることができるが、これらに限定されない。可読記憶媒体はさらに、可読記憶媒体以外の任意の可読媒体であってもよく、該可読媒体は、命令実行システム、装置又はデバイスにより使用され、又はそれらと組み合わせて使用されるプログラムを送信、伝搬又は伝送することができる。可読記憶媒体に含まれるプログラムコードは、任意の好適な媒体で伝送することができ、無線、有線、光ケーブル、RFなど、又は上記の任意の適切な組み合わせを含むが、これらに限定されない。本明細書の動作を実行するためのプログラムコードは、Java、C++などのようなオブジェクト指向プログラミング言語、「C」言語などのような一般的な手続き型プログラミング言語又は類似のプログラミング言語を含む一つ又は複数のプログラミング言語の任意の組み合わせで記述され得る。プログラムコードは、全部がデータ圧縮装置200に実行されたり、一部がデータ圧縮装置200に実行されたり、独立したソフトウェアパケットとして実行されたり、一部がデータ圧縮装置200に実行されるとともに他部がリモート計算機器に実行されたり、全部がリモート計算機器に実行されたりし得る。リモート計算機器に関する場合、リモート計算機器は、伝送媒体120を介してデータ圧縮装置200に接続されてもよく、又は外部計算機器に接続されてもよい。
【0180】
以上、本明細書の特定の実施例について説明した。他の実施例は、添付の特許請求の範囲内にある。いくつかの場合に、特許請求の範囲に記載される動作又はステップは、実施例とは異なる順序で実行されてもよく、且つ依然として所望の結果を実現することができる。また、図面に示されるプロセスは、所望の結果を実現するために、必ずしも特定の順序又は連続的な順序を示す必要はない。いくつかの実施形態において、マルチタスク処理及び並列処理も可能であり、又は有利であり得る。
【0181】
以上のように、本詳細な開示内容を読めば、当業者であれば分かるように、前記の詳細な開示内容は、単なる例として提示され得、且つ限定的なものではなくてもよい。ここでは明記されていないが、当業者であれば理解できるように、本明細書は、実施例に対する様々な合理的な変更、改良、及び修正を網羅する必要がある。これらの変更、改良、及び修正は、本明細書によって提示されることを意図しており、且つ本明細書の例示的な実施例の精神及び範囲内にある。
【0182】
なお、本明細書におけるいくつかの用語は、本明細書の実施例を説明するために用いられている。例えば、「一実施例」、「実施例」及び/又は「いくつかの実施例」は、該実施例に関連して説明された特定の特徴、構造又は特性が、本明細書の少なくとも一つの実施例に含まれ得ることを意味する。そのため、本明細書の各部分において、「実施例」又は「一実施例」又は「代替実施例」に対する二つ以上の引用が必ずしも同じ実施例を指すとは限らないことは、強調され理解されるべきである。なお、特定の特徴、構造又は特性は、本明細書の一つ又は複数の実施例において好適に組み合わされてもよい。
【0183】
理解すべきこととして、本明細書の実施例の前記の説明において、一つの特徴の理解を容易にするために、本明細書は、本明細書を簡略化する目的で、様々な特徴を単一の実施例、図面又はそれらの説明に組み合わせる。しかしながら、これらの特徴の組み合わせが必須であるとは言えず、当業者は、本明細書を読む時に、そのうちの一部の特徴を抽出して単独の実施例として理解することが十分に可能である。つまり、本明細書における実施例は、複数の二次的実施例の統合として理解され得る。各二次的実施例の内容は、前述の開示された単一の実施例の全ての特徴よりも少ない場合にも成立する。
【0184】
本明細書に引用される各特許、特許出願、特許出願の刊行物、及び他の資料、例えば、記事、書籍、明細書、刊行物、文書、物品などは、参照によりここに組み込まれ得る。あらゆる目的のための全ての内容は、それに関連する任意の訴求書履歴、本文書と一致しないかもしくは矛盾する任意の同一の訴求書履歴、又は請求項の最も広い範囲に対する制限効果を有する任意の同一の訴求書履歴を除いて、現在又は今後、本文書と関連付けられる。例えば、含まれる任意の資料に関連する用語の説明、定義及び/又は使用と、本文書の関連する用語の説明、定義及び/又は使用との間にいずれかの不一致又は矛盾が存在する場合には、本文書における用語が優先して適用するものとする。
【0185】
最後に、本明細書に開示された出願の実施形態は、本明細書の実施形態の原理についての説明であることを理解されたい。他の修正された実施例も本明細書の範囲内にある。そのため、本明細書に開示された実施例は、単なる例に過ぎず、限定するものではない。当業者は、本明細書における実施例に基づいて、代替的な構成を用いて本明細書における出願を実現することができる。そのため、本明細書の実施例は、出願において正確に説明された実施例に限定されない。
【手続補正書】
【提出日】2023-11-05
【手続補正1】
【補正対象書類名】特許請求の範囲
【補正対象項目名】全文
【補正方法】変更
【補正の内容】
【特許請求の範囲】
【請求項1】
データ処理方法であって、
初期データにおける、予め設定されたバイト数の初期データを含む初期フレームを選択することと、
前記初期フレームに対してデータ圧縮を行い、圧縮フレームを得ることと、を含み、ここで、前記データ圧縮は、前記圧縮中フレームに対してエッジ調整を行うことを含み、前記圧縮中フレームは、前記初期フレームと、前記データ圧縮過程において前記圧縮フレームになる前の前記初期フレームのいずれかのデータ状態とを含み、
ここで、前記エッジ調整は、それらに対応するエッジ調整係数を用いて、前記圧縮中フレームの複数のユニットのうちの各ユニットの中周波数から高周波数領域での振幅を調整して、前記圧縮中フレームの前記中周波数から前記高周波数領域での振幅を低減することを含み、前記エッジ調整係数が0より大きい、ことを特徴とするデータ処理方法。
【請求項2】
前述した、圧縮中フレームに対してエッジ調整を行うことは、
予め設定されたユニットサイズに基づいて前記圧縮中フレームを前記複数のユニットに分割することと、
それらに対応する前記エッジ調整係数を用いて、前記各ユニットの中周波数から高周波数領域での振幅を調整することと、を含む、ことを特徴とする請求項1に記載のデータ処理方法。
【請求項3】
前述した、それらに対応する前記エッジ調整係数を用いて、前記各ユニットの中周波数から高周波数領域での振幅を調整することは、前記各ユニットに対して、
予め設定された符号化関数群から一つの関数を符号化関数として選択し、前記符号化関数によってそれらを調整して、第1のユニットを得て、それらの周波数領域内の低周波数領域での成分が保持されているが中周波数から高周波数領域での成分が減衰されるようにすることと、
それらと前記第1のユニットとの差を求め、それらに対応する第1のエッジを取得することであって、前記第1のエッジはそれらの前記中周波数から前記高周波数領域での成分を含むことと、
それらに対応する前記エッジ調整係数を用いて前記第1のエッジの振幅を調整して、それらに対応する符号化エッジを得ることと、
前記第1のユニットと前記符号化エッジを重畳することとを含む、ことを特徴とする請求項2に記載のデータ処理方法。
【請求項4】
前述した、それらに対応する前記エッジ調整係数を用いて前記第1のエッジの振幅を調整することは、
前記第1のエッジのエッジ値が予め設定された第1の閾値より小さいことを確定し、1より大きい前記エッジ調整係数によって前記第1のエッジの振幅を増強すること、又は
前記第1のエッジのエッジ値が予め設定された第2の閾値より大きいことを確定し、1により小さい前記エッジ調整係数によって前記第1のエッジの振幅を低減すること、
又は
歪曲率及び符号化率の加重値を最適化目標とし、最適化アルゴリズムに基づいて、前記エッジ調整係数を取得し、前記エッジ調整係数により前記第1のエッジの振幅を調整することを含む、ことを特徴とする請求項3に記載のデータ処理方法。
【請求項5】
前述した、1より大きい前記エッジ調整係数によって前記第1のエッジの振幅を増強することは、
予め設定された第1のエッジ調整係数群から一つの係数を前記エッジ調整係数として選択して、前記第1のエッジの振幅を増強することであって、前記第1のエッジ調整係数群における係数がいずれも1より大きいことを含み、
前述した、1より小さい前記エッジ調整係数によって前記第1のエッジの振幅を低減することは、
予め設定された第2のエッジ調整係数群から一つの係数を前記エッジ調整係数として選択して、前記第1のエッジの振幅を低減することであって、前記第2のエッジ調整係数群における係数がいずれも1より小さいことを含む、ことを特徴とする請求項4に記載のデータ処理方法。
【請求項6】
前述した、前記初期フレームに対してデータ圧縮を行うことは、
前記初期フレームに対してまず前記エッジ調整を行い、次に前記エッジ調整された初期フレームを予測し残差を求める方法、
前記初期フレームに対してまず予測を行って予測フレームを得て、次に前記初期フレーム及び前記予測フレームに対して前記エッジ調整を行い、残差を求める方法、及び
前記初期フレームに対してまず予測を行い、残差を求め、次に前記残差に対して前記エッジ調整を行う方法のうちの少なくとも一つを含
み、
ここで、前記圧縮フレームは、前記複数のユニットのうちの各ユニットに対応する前記符号化関数及び前記エッジ調整係数をさらに含む、ことを特徴とする請求項3に記載のデータ処理方法。
【請求項7】
データ処理システムであって、
データを処理するための少なくとも一つの命令セットが記憶されている少なくとも一つの記憶媒体と、
前記少なくとも一つの記憶媒体と通信的に接続される少なくとも一つのプロセッサとを含み、
ここで、前記システムが作動する場合、前記少なくとも一つのプロセッサは、前記少なくとも一つの命令セットを読み取り、且つ前記少なくとも一つの命令セットの指示に従って請求項1~
6のいずれか一項に記載のデータ処理方法を実行する、ことを特徴とするデータ処理システム。
【請求項8】
データ処理方法であって、
圧縮データを取得することであって、前記圧縮データは初期フレームに対してデータ圧縮を行って得られた圧縮フレームを含み、前記データ圧縮はエッジ調整を含むことと、
前記圧縮フレームに対してデータ伸長を行い、伸長フレームを得ることと、を含み、前記データ伸長は、伸長中フレームに対してエッジ補償を行うことを含み、前記伸長中フレームは、前記圧縮フレームと、前記データ伸長過程において前記伸長フレームになる前の前記圧縮フレームのいずれかのデータ状態とを含み、
ここで、前記エッジ補償と前記エッジ調整とは予め設定された相関関係にある、ことを特徴とするデータ処理方法。
【請求項9】
前記エッジ調整は、それらに対応するエッジ調整係数を用いて、圧縮中フレームの複数のユニットのうちの各ユニットの中周波数から高周波数領域での振幅を調整して、前記圧縮中フレームの前記中周波数から前記高周波数領域での振幅を低減することを含み、前記エッジ調整係数が0より大きく、前記圧縮中フレームは、前記初期フレームと、前記データ圧縮過程において前記圧縮フレームになる前の前記初期フレームのいずれかのデータ状態とを含み、
前記エッジ補償は、前記相関関係に基づいて、前記エッジ調整係数に対応するエッジ補償係数を用いて、前記伸長中フレームの前記複数のユニットのうちの前記各ユニットの中周波数から高周波数領域での振幅を補償することを含む、ことを特徴とする請求項
8に記載のデータ処理方法。
【請求項10】
前述した、圧縮中フレームに対してエッジ調整を行うことは、
予め設定されたユニットサイズに基づいて前記圧縮中フレームを前記複数のユニットに分割することと、
それらに対応する前記エッジ調整係数を用いて、前記各ユニットの中周波数から高周波数領域での振幅を調整することであって、前記各ユニットに対して、
予め設定された符号化関数群から一つの関数を符号化関数として選択し、前記符号化関数によってそれらを調整して、第1のユニットを得て、それらの周波数領域内の低周波数領域での成分が保持されているが中周波数から高周波数領域での成分が減衰されるようにすることと、
それらと前記第1のユニットとの差を求め、それらに対応する第1のエッジを取得することであって、前記第1のエッジはそれらの前記中周波数から前記高周波数領域での成分を含むことと、
それらに対応する前記エッジ調整係数を用いて前記第1のエッジの振幅を調整して、それらに対応する符号化エッジを得ることと、
前記第1のユニットと前記符号化エッジを重畳することとを含むこととを含
み、
前述した、伸長中フレームに対してエッジ補償を行うことは、
予め設定された前記ユニットサイズに基づいて前記伸長中フレームを前記複数のユニットに分割することと、
前記エッジ調整係数に対応する前記エッジ補償係数を用いて、前記各ユニットの中周波数から高周波数領域での振幅を補償することと、を含む、ことを特徴とする請求項
9に記載のデータ処理方法。
【請求項11】
前述した、前記エッジ調整係数に対応する前記エッジ補償係数を用いて、前記各ユニットの中周波数から高周波数領域での振幅を補償することは、前記各ユニットに対して、
復号化関数を確定し、前記復号化関数によってそれらを調整して、第2のユニットを得て、それらの周波数領域内の低周波数領域での成分が保持されているが中周波数から高周波数領域での成分が減衰されるようにすることと、
それらと前記第2のユニットとの差を求め、それらに対応する第2のエッジを取得することであって、前記第2のエッジはそれらの前記中周波数から前記高周波数領域での成分を含むことと、
前記エッジ調整係数に対応する前記エッジ補償係数を用いて前記第2のエッジの振幅を補償して、それらに対応する復号化エッジを得ることと、
前記現在のユニットと前記復号化エッジを重畳することとを含む、ことを特徴とする請求項
10に記載のデータ処理方法。
【請求項12】
前述した、復号化関数を確定することは、
予め設定された復号化関数群から一つの関数を前記復号化関数として選択すること
、又は
予め設定された復号化関数群から前記符号化関数に対応する関数を前記復号化関数として選択することを含む、ことを特徴とする請求項
11に記載のデータ処理方法。
【請求項13】
前述した、前記エッジ調整係数に対応する前記エッジ補償係数を用いて前記第2のエッジの振幅を補償することは、
予め設定されたエッジ補償係数群から一つの係数を前記エッジ補償係数として選択して、前記第2のエッジの振幅を補償すること
、又は
前記エッジ調整係数と前記エッジ補償係数との相関関係に基づいて、前記エッジ補償係数を確定して、前記第2のエッジの振幅を補償することを含む、ことを特徴とする請求項
11に記載のデータ処理方法。
【請求項14】
前記相関関係は、
前記エッジ補償により、前記伸長フレームの低周波数から中周波数領域の任意の周波数での振幅が前記初期フレームの85%以上になること
と、
前記エッジ補償により、前記初期フレームに対して前記伸長フレームの中周波数領域での振幅が穏やかに増加するか、又は前記エッジ補償により、前記初期フレームに対して前記伸長フレームの高周波数領域での振幅が穏やかに低減することと、を含む、ことを特徴とする請求項10に記載のデータ処理方法。
【請求項15】
データ処理システムであって、
データを処理するための少なくとも一つの命令セットが記憶されている少なくとも一つの記憶媒体と、
前記少なくとも一つの記憶媒体と通信的に接続される少なくとも一つのプロセッサとを含み、
ここで、前記システムが作動する場合、前記少なくとも一つのプロセッサは、前記少なくとも一つの命令セットを読み取り、且つ前記少なくとも一つの命令セットの指示に従って請求項
8~
14のいずれか一項に記載のデータ処理方法を実行する、ことを特徴とするデータ処理システム。
【国際調査報告】