特許第6722651号(P6722651)IP Force 特許公報掲載プロジェクト 2022.1.31 β版

知財求人 - 知財ポータルサイト「IP Force」

▶ コリン,ジャン−クロードの特許一覧

特許6722651画像のタイプに応じて圧縮アルゴリズムを選択する方法
<>
  • 特許6722651-画像のタイプに応じて圧縮アルゴリズムを選択する方法 図000011
  • 特許6722651-画像のタイプに応じて圧縮アルゴリズムを選択する方法 図000012
  • 特許6722651-画像のタイプに応じて圧縮アルゴリズムを選択する方法 図000013
  • 特許6722651-画像のタイプに応じて圧縮アルゴリズムを選択する方法 図000014
  • 特許6722651-画像のタイプに応じて圧縮アルゴリズムを選択する方法 図000015
  • 特許6722651-画像のタイプに応じて圧縮アルゴリズムを選択する方法 図000016
  • 特許6722651-画像のタイプに応じて圧縮アルゴリズムを選択する方法 図000017
< >
(19)【発行国】日本国特許庁(JP)
(12)【公報種別】特許公報(B2)
(11)【特許番号】6722651
(24)【登録日】2020年6月24日
(45)【発行日】2020年7月15日
(54)【発明の名称】画像のタイプに応じて圧縮アルゴリズムを選択する方法
(51)【国際特許分類】
   H04N 19/12 20140101AFI20200706BHJP
   H04N 19/14 20140101ALI20200706BHJP
   H04N 19/172 20140101ALI20200706BHJP
   H04N 19/593 20140101ALI20200706BHJP
   H04N 19/63 20140101ALI20200706BHJP
【FI】
   H04N19/12
   H04N19/14
   H04N19/172
   H04N19/593
   H04N19/63
【請求項の数】14
【全頁数】11
(21)【出願番号】特願2017-503569(P2017-503569)
(86)(22)【出願日】2015年7月9日
(65)【公表番号】特表2017-530578(P2017-530578A)
(43)【公表日】2017年10月12日
(86)【国際出願番号】FR2015000142
(87)【国際公開番号】WO2016012667
(87)【国際公開日】20160128
【審査請求日】2018年7月2日
(31)【優先権主張番号】14/01695
(32)【優先日】2014年7月24日
(33)【優先権主張国】FR
(73)【特許権者】
【識別番号】516106748
【氏名又は名称】コリン,ジャン−クロード
(74)【代理人】
【識別番号】110002398
【氏名又は名称】特許業務法人小倉特許事務所
(72)【発明者】
【氏名】ジェルヴェ,タン マルク−エリック
(72)【発明者】
【氏名】ルベ,ブルノ
(72)【発明者】
【氏名】ベッソー,ニコラス
(72)【発明者】
【氏名】ギミオ,イヴ
(72)【発明者】
【氏名】プティフィス,ミカエル
(72)【発明者】
【氏名】ローク,セバスティアン
【審査官】 坂東 大五郎
(56)【参考文献】
【文献】 特開平07−111595(JP,A)
【文献】 特開平11−252563(JP,A)
【文献】 米国特許出願公開第2010/0158400(US,A1)
【文献】 米国特許出願公開第2007/0201751(US,A1)
(58)【調査した分野】(Int.Cl.,DB名)
H04N 19/00−19/98
(57)【特許請求の範囲】
【請求項1】
画像の少なくとも1つのカラーレイヤーの全ての画素の光度値の分布を表す指標を計算し,
前記指標を所定の閾値と比較して,画像の少なくとも1つのカラーレイヤー全体画像のタイプを決定し,決定した画像のタイプに応じて,以下の3つのクラスのうちの1つに画像を分類し;
前記画像のタイプがグラフィックタイプなら,第1のクラス,
前記画像のタイプが高コントラストタイプなら,第2のクラス,
前記画像のタイプが低コントラストタイプなら,第3のクラス,
画像のクラスに応じて,圧縮処理のタイプを選択し,
画像が前記第1のクラスである場合,カラーレイヤーの画素の元の値と,前記レイヤーに隣接する画素の復元値との差分処理を行い:
画像が前記第3のクラスである場合,周波数処理を行い,
画像が前記第2のクラスである場合,
ロス無し,又は準ロス無しでの圧縮の場合,カラーレイヤーの画素の元の値と,前記レイヤーの隣接する画素の復元値との差分からなる処理を使用した圧縮を行い,
その他の場合,周波数処理を行う,
ことを特徴とする画像を圧縮するための方法。
【請求項2】
前記計算は,前記画像の光度を表すカラーレイヤー上で実行されることを特徴とする請求項1記載の方法。
【請求項3】
各色相について,色相値(k=0〜255)に対応する各色相で,画像を分類するために,
この色相を持つ画素数n(k)が計算され,次いで,
対象とする色相(k)の画素数n(k)と,その近傍の画素数の所定比率分との間の差分を取ることにより,色相の集中の指標が計算され,次いで,
前記色相の集中の指標(E(k))は,所定の閾値より高くなるよう維持され,これらの集中の指標の各々は,画素の総数に従った係数で除算されて画像のサイズに応じて換算され,次いで,
カラーレイヤー全体にわたって各色相について取得された前記色相の集中の指標(E(k))の結果を集計して求めたメトリック(FD,FD2)を前記光度の分布を表す指標とする
ことを特徴とする請求項2記載の方法。
【請求項4】
それぞれの前記所定比率は,近傍のうち最も遠い行で最も減少されるようにしたことを特徴とする請求項3記載の方法。
【請求項5】
前記近傍として,1つ隣の行(k−1及びk+1)及び2つ隣の行(k−2及びk+2)が使用され,1つ隣の行の各々,即ち対象とする色相(k)のすぐ隣の行に対し80%の前記所定比率を適用し,2つ隣の行の各々,即ち1つ隣の行のすぐ隣の行に対しては20%の前記所定比率を適用することを特徴とする請求項3又は4記載の方法。
【請求項6】
近傍の値に適用される前記所定比率の合計は1に等しいことを特徴とする請求項3〜5何れか1項記載の方法。
【請求項7】
保持された集中の指標の各々は,1より大きい数で巾乗されることを特徴とする請求項3〜6何れか1項記載の方法。
【請求項8】
保持された集中の指標の各々は,2で巾乗されることを特徴とする請求項7記載の方法。
【請求項9】
前記光度の分布を表す指標の計算を,最も代表的なカラーレイヤーを選択して行い,該最も代表的なカラーレイヤーを選択する前に,比色変換が入力データに適用されることを特徴とする請求項1〜8何れか1項記載の方法。
【請求項10】
YCrCb変換が,RGB又はBGRタイプの入力データに対して適用されることを特徴とする請求項9記載の方法。
【請求項11】
入力データ又は比色変換後のデータはYCbCr又はYUVタイプであり,画像の光度を表しているカラーレイヤーはカラーレイヤーYであることを特徴とする請求項1〜10何れか1項記載の方法。
【請求項12】
前記指標の計算は,画像全体に渡る特有のRGBの組合せ数を計算することを含むことを特徴とする請求項1記載の方法。
【請求項13】
画像全体に渡る特有のRGBの組合せ数は,画像の画素の数に従った係数により除算されることを特徴とする請求項12記載の方法。
【請求項14】
画像全体に渡る特有のRGBの組合せ数,又は画像の画素の数に従った係数により除算された画像全体に渡る特有のRGBの組合せ数は,前記指標として一組の閾値と比較され,次いで,この画像は以下のルールに従って分類される,
第1の閾値未満であれば,この画像は第1のクラスに分類され,
第1の閾値より大きい第2の閾値を超えるときには,この画像は第3のクラスに分類され,
第1の閾値と第2の閾値との間にあれば,この画像は第2のクラスに分類される,
ことを特徴とする請求項12又は13記載の方法。
【発明の詳細な説明】
【発明の詳細な説明】
【0001】
画像は,全く異なるタイプに属し得る。特に,明瞭なラインからなる非常に「グラフィック」な画像と,多くの色彩のグラデーションからなる,より「自然」な画像とがある。
【0002】
各々の圧縮アルゴリズムは,独自のデータ表現を使用している。例えば,ウェーブレットによる圧縮では,周波数変換により画像を連続するサブ画像に分割するのに対して,或るコーデック,特に本願出願人により開発されたものは,画像の数値間の差分を取っている。
【0003】
したがって,本発明は,画像データのタイプを使用して最良のデータの表現を符号化時に自動的に選択し,ファイルヘッダに含められた情報を使用して復元時に逆変換を実行するコーデックを規定することを提案する。
【0004】
アルゴリズムのタイプの各々は,ある程度,或る画像のタイプに適合されている。特に,周波数表現は,低コントラストの画像に非常に良く適合するのに対して,差分表現は,グラフィックや高コントラストの画像に良く適合する。
【0005】
方法の各々(差分/ウェーブレット)は,ロス有り又はロス無しのモードで使用できる。変換は,レイヤーの各々に個別に適用される。これに対して,変換のタイプの選択は,例えば,予めYCbCr変換を受けている画像の場合にはY,或いは,ロス無しの比色変換(transformation colorimetrique)の場合には画像の最も光度を表すレイヤーのように,最も代表的と考えられるレイヤーに適用される。
【0006】
使用されるアルゴリズムがウェーブレットによる圧縮であるときには,この変換は,ウェーブレットと二値符号化の特有な実施により,又はJpeg2000若しくはPGFのような標準的なフォーマットを使用して実行できる。以下の例では,これには限定されないが,使用するウェーブレットのフォーマットはJpeg2000及びPGFである。
【0007】
使用されるアルゴリズムが差分による変換であるときには,この差分による変換は,同一のレイヤーで2つの隣接する画素の値間の差分を取り,次いで,所定の除数Qでこの差分を量子化することにより構成される。誤差が伝搬しないように,以下に定義される復元値に対して差分が取られる。同様に,もし,2方向に差分を取ることが可能なら,復元値を使用して,最も低い差分を生成するであろう方向が決定される。それから,圧縮時と復元時との差分が計算される。
【0008】
より詳細な方法では,この符号化の方法は,以下のようにして実行される。
【0009】
変換される行列は,二次元での画像のレイヤーを表すものとして考える。以下のような命名法が適用される。
i,jは行列の初期値であり,iは行番号を示し,jは列番号を示す。
i,jは対応する圧縮値を示し,Di,jは対応する復元値を示す。
したがって,5×5行列において数値の配置は以下のようになる。
【0010】
以下の数値で,同様に,量子化係数Q=3で,各Vi,jについての数値例を取り上げる。

差分は,1番から最後まで,左から右に,各行毎に取られる。
最初の値V1,1は,そのまま保持される。
最初の水平ラインでは,各値V1,jについて,それの左に位置する復元値D1,j-1に対して差分が取られ,それから,これらが量子化され,丸め(arrondit)られる。このことから,以下のようになる。
1,1=C1,1=V1,1=0;
1,2=ROUND((V1,2−D1,1)/Q)=ROUND((0−0)/3)=0
1,2=ROUND(D1,1+(C1,2*Q))=ROUND(0+0*3)=0

行の終わりまで,同様である。
【0011】
これに続く行の各々について,前記行の第1のボックスの圧縮値Ci,1は,現在の値Vi,1と上述のすぐ上の復元値Di-1,1との間の差分を取ることにより,計算される。
したがって,これは,例えば第2の行を算出する。
2,1=ROUND((V2,1−D1,1)/Q)=ROUND((0−0)/3)=0
2,1=ROUND(D1,1+(C2,1*Q))=ROUND(0+(0*3))=0
【0012】
その行のこれに続く値の各々に関して,もし,(Di-1,j−Di-1,j-1)が絶対値として(Di,j-1−Di-1,j-1)より小さい場合,値Vi,jの各々について,差分は水平方向に計算され,そして,反対の場合には,差分は垂直方向に計算される。
【0013】
このことから,値V2,2については:
・(D1,2−D1,1)の絶対値は0;
・(D2,1−D1,1)の絶対値は0;
・2つの値が等しいとき,垂直差分が選択される;
・したがって,圧縮値は次のように計算される:C2,2=ROUND((V2,2−D1,2)/Q)=ROUND((0−0)/3)=0
・それから,復元値が計算される:D2,2=ROUND(D1,2+(C2,2*Q)=ROUND(0+0*3)=0

このことから,値V2,3については:
・(D1,3−D1,2)の絶対値は0;
・(D2,2−D1,2)の絶対値は0;
・2つの値が等しいとき,垂直差分が選択される;
・したがって,圧縮値は次のように計算される:C2,3=ROUND((V2,3−D1,3)/Q)=ROUND((255−0)/3)=85
・それから,復元値が計算される:D2,3=ROUND(D1,3+(C2,3*Q))=ROUND(0+85*3)=255
【0014】
このことから,値V2,4については:
・(D1,4−D1,3)の絶対値は0;
・(D2,3−D1,3)の絶対値は255;
・前者の差分(水平)値の方が小さいので,水平差分が選択される;
・したがって,圧縮値は次のように計算される:C2,4=ROUND((V2,4−D2,3)/Q)=ROUND((253−255)/3)=−1
・次いで,復元値が計算される:D2,4=ROUND(D2,3+(C2,4*Q))=ROUND(255−1*3)=252
【0015】
反復処理を通じて,この行列について,以下のような圧縮及び復元値が取得される。
Q=1のとき,この変換はロス無しであり,Q>1のとき,この変換はロスを伴う。
【0016】
このデータの変換は,「APE」と呼ばれている。
この「APE」変換が一度実行されると,RLE(ランレングス符号)変換が適用され,それから,取得されたデータがBzip2アルゴリズムを使って圧縮される。それから,各レイヤーの画像について,一連の圧縮が続けられる:APE,RLE,Bzip
【図面の簡単な説明】
【0017】
なし
【0018】
この実施形態では,ウェーブレットによる2つの方法による圧縮,例えばJpeg2000及びPGF,並びに,上述の一連の圧縮APE,RLE,Bzipが,3つの異なる画像に対して適用される。
図1は,白の背景に多数の文字が含まれる画面のコピーであり,「グラフィック」タイプの画像の例を示している。
図2は,ビルや空と光などとの間に高いコントラストがある街での写真である。これは,「高コントラスト」タイプの画像の例を表している。
図3は,多彩な色彩のグラデーションが含まれている航空ショーの写真である。これは,「低コントラスト」タイプの画像の例を表している。
【0019】
これらの方法(APE/RLE/Bzip,Jpeg2000,PGF)の各々の有効性は,PSNRカーブと呼ばれるものを使用して表され,これは,圧縮し,復元した後の,復元画像の質を表している。各符号化パラメータは,ファイルサイズと,0と100との間のPSNRとして参照される質の値に対応する。PSNRは,標準的な計測法であり,ここでは,レイヤーYに対し計算され,100が実現可能な最高の質であり,ロスの無い圧縮に対応する。圧縮は,等価なサイズならより良いPSNRを有するときに,又は等価なPSNRのときにはサイズがより小さい場合に,他方に対しより高い性能を有すると考察される。
【0020】
図4及び以下の表は,図1に示される画像についての画像サイズに係るPSNRでの変化を示している。
【0021】
図5及び以下の表は,図2に示される画像についての画像サイズに係るPSNRでの変化を示している。
【0022】
図6及び以下の表は,図3に示される画像についての画像サイズに係るPSNRでの変化を示している。
【0023】
したがって,以下のことが観察される。
・ウェーブレットを使用する符号化は,サイズ/質のパフォーマンスが近接する傾向があるのに対して,APEで取得した結果は全く異なる。
・画像1(グラフィック画像)の場合,全ての場合について,APEの方が優れている。
・画像2(高コントラスト画像)の場合,APEの方が高品質の点では良いが,最も高圧縮なのはウェーブレットによる符号化である。
・画像3(低コントラスト画像)の場合,全ての場合について,ウェーブレットによる符号化の方が優れている。
【0024】
本発明の第1の実施形態では,比色変換,この例ではYCbCrの後に,アルゴリズムの選択が行われる。
【0025】
アルゴリズムの選択のために,以下が実行される。
・最も代表的なレイヤー(理想的にはY)で,各値の数がカウントされる。
図7に示すように,値のヒストグラムが構築される。
・通常では0と255との間となる各値kについて,この値がレイヤーに存在する回数n(k)が記録される。
【0026】
したがって,このレイヤーの画素の数は,n(k)の総計に等しくなる。
・メトリック「FD2」は,ヒストグラムの「ピーク」特性の概念を提供している。

・メトリックFD2は,画像のレイヤーの全部に渡って,又は一部に対して実行される。
・FD2が高くなる程,値はより集中している。
【0027】
したがって,異なるタイプの画像は異なる等級に属することが容易に分かり,この式は真に識別力がある。
【0028】
・画像は以下のように区分される。
・FD2>0.075:グラフィック画像(1)
・FD2> 10-4 :高コントラスト画像(2)
・それ以外:低コントラスト画像(3)
【0029】
・もし,FD2>0.075なら,差分による変換,例えばAPE+RLE+zlibが選択される。
・高コントラスト画像の場合,差分による変換,例えばロス無し及び準ロス無しモードのAPE+RLE+zlibが選択され,さもなければ,ウェーブレットによる符号化が選択される。
・低コントラスト画像の場合,ウェーブレットによる符号化,例えばJPEG又はPGFタイプが全ての場合に実行される。
・画像のタイプがファイルヘッダに保存される。
・復元時に,画像タイプに応じて逆の処理が実行される。
【0030】
第2の実施形態では,当該画像に特有のRGBカラーの3色組の数がカウントされ,これは,好ましくは画像の画素数に従った係数により除算することにより画像のサイズに応じて換算されている。画像のサイズに応じて換算されている画像の特有のRGBカラーの3色組の数が,所定の閾値未満のときには,この画像はグラフィック画像であると考えられ,これが第1の閾値より大きい第2の閾値を超えるときには,この画像は低コントラスト画像であると考えられる。これら2つの閾値の間にあれば,この画像は高コントラスト画像であると考えられる。
【0031】
第1の実施形態と同様の変換が,その後適用される。
・高コントラスト画像の場合,差分による変換,例えばロス無し及び準ロス無しモードのAPE+RLE+zlibが,さもなければ,ウェーブレットによる符号化が選択される。
・低コントラスト画像の場合,ウェーブレットによる符号化,例えばJPEG又はPGFタイプが全ての場合に実行される。
・画像のタイプがファイルヘッダに保存される。
・復元時に,画像タイプに応じて逆の処理が実行される。
【0032】
より一般的には:
以下の特徴を有する,画像を圧縮するための方法が提案される。
画像の少なくとも1つのレイヤーの全てに渡って画素の光度の分布を表す指標を計算し,
前記指標を所定の閾値と比較して,少なくとも1つのレイヤーの全体の画像のタイプを決定し,決定した画像のタイプに応じて,画像を以下の3つのクラスのうちの1つに分類する;
前記画像のタイプがグラフィックタイプなら,第1のクラス,
前記画像のタイプが高コントラストタイプなら,第2のクラス,
前記画像のタイプコントラストタイプなら,第3のクラス,
画像のクラスに応じて圧縮処理タイプを選択する;
画像が第1のクラスなら差分処理を行い,
画像が第3のクラスなら,好ましくはウェーブレットを使用する,周波数処理を行い,
画像が第2のクラスなら:
ス無し又は準ロス無しの圧縮を選択する場合差分処理を行い,
その他の場合,好ましくはウェーブレットを使用した周波数処理を行う。
【0033】
好適には,この計算は,その画像の最も特徴的なレイヤー(例えばレイヤーY)の全てに渡って実行される。
【0034】
好適には,これらのステップは,入力データに対して,ロスを伴う又はロスを伴わない比色変換に先立って行うことができる。例えば,RGB入力データに対してYCbCr変換が適用できる。
【0035】
色相の値(8ビットのレイヤーの場合,好ましくはk=0〜255)に対応する各色相で画像を分類するために,各色相についてこの色相を持つ画素数n(k)が計算され,それから,値kの周辺の画像の色相の集中の指標が,例えば:
E(k)=n(k)−0.4(n(k−1)+n(k+1))−0.1(n(k−2)+n(k+2)),
で計算される。
この計算は,対象とする色相(k)の画素数n(k)と,その近傍の画素数,好ましくは1つ隣の行(k−1及びk+1)及び2つ隣の行(k−2及びk+2)の画素数の所定比率分との間の差分を取ることにより行われ,それぞれの前記所定比率は,近傍のうち最も遠い行において最も減少され,例えば1つ隣の行の各々,即ち対象とする色相(k)のすぐ隣の行に対しては80%であり,2つ隣の行の各々,即ち1つ隣の行のすぐ隣の行に対して例えば20%である。
【0036】
好ましくは,近傍の値に対する前記所定比率の合計は1に等しい。この例では,比率の合計は,実際上1に等しい。
(0.4+0.4+0.1+0.1=1)
【0037】
値k周辺の色相の集中に関する指標(E(k))は,次いで,所定の閾値より高い値,好ましくは集中を表す正の指標,即ちMax(E(k),0)に維持され,そして,集中の指標の各々は,画像のサイズに応じて,例えば画像の画素の総数(N)で除算されて換算される。
【0038】
好ましくは,画像のタイプの間のより良い識別のため,即ちクラス分けを容易にするために,Max(E(k))/Nの結果は,厳密に1より大きい値,好ましくは2で,巾乗される。
【0039】
次いで,レイヤーの全てのこれらの結果を集計することで,好ましくは,レイヤーの色相の全てに渡って取得された結果の総和を取ることにより,メトリック(FD)が取得される。そのような例は以下に示される。
FD2=Σ(Max(E(k))/N)2 kは0から255まで変化
図1
図2
図3
図4
図5
図6
図7