特許第6982846号(P6982846)IP Force 特許公報掲載プロジェクト 2022.1.31 β版

知財求人 - 知財ポータルサイト「IP Force」

<>
  • 6982846-画像処理装置 図000012
  • 6982846-画像処理装置 図000013
  • 6982846-画像処理装置 図000014
  • 6982846-画像処理装置 図000015
  • 6982846-画像処理装置 図000016
  • 6982846-画像処理装置 図000017
  • 6982846-画像処理装置 図000018
  • 6982846-画像処理装置 図000019
  • 6982846-画像処理装置 図000020
  • 6982846-画像処理装置 図000021
  • 6982846-画像処理装置 図000022
  • 6982846-画像処理装置 図000023
  • 6982846-画像処理装置 図000024
  • 6982846-画像処理装置 図000025
  • 6982846-画像処理装置 図000026
< >
(19)【発行国】日本国特許庁(JP)
(12)【公報種別】特許公報(B2)
(11)【特許番号】6982846
(24)【登録日】2021年11月25日
(45)【発行日】2021年12月17日
(54)【発明の名称】画像処理装置
(51)【国際特許分類】
   G06T 5/00 20060101AFI20211206BHJP
   H04N 1/409 20060101ALI20211206BHJP
   H04N 5/213 20060101ALI20211206BHJP
   H04N 5/208 20060101ALI20211206BHJP
【FI】
   G06T5/00 705
   H04N1/409
   H04N5/213
   H04N5/208
【請求項の数】14
【全頁数】21
(21)【出願番号】特願2017-121407(P2017-121407)
(22)【出願日】2017年6月21日
(65)【公開番号】特開2019-8407(P2019-8407A)
(43)【公開日】2019年1月17日
【審査請求日】2020年6月4日
(73)【特許権者】
【識別番号】311001347
【氏名又は名称】ノーリツプレシジョン株式会社
(74)【代理人】
【識別番号】100124039
【弁理士】
【氏名又は名称】立花 顕治
(74)【代理人】
【識別番号】100179213
【弁理士】
【氏名又は名称】山下 未知子
(74)【代理人】
【識別番号】100170542
【弁理士】
【氏名又は名称】桝田 剛
(72)【発明者】
【氏名】北 耕次
【審査官】 山田 辰美
(56)【参考文献】
【文献】 特開2010−178302(JP,A)
【文献】 特開2011−065339(JP,A)
【文献】 特開2010−054356(JP,A)
(58)【調査した分野】(Int.Cl.,DB名)
G06T 5/00
H04N 1/409
H04N 5/213
H04N 5/208
IEEE Xplore
(57)【特許請求の範囲】
【請求項1】
劣化画像のエッジを強調しつつノイズを除去する画像処理装置であって、
前記劣化画像内で注目画素の位置を移動させながら、前記注目画素の近傍領域にフィルタを適用するフィルタリング部
を備え、
前記フィルタの重みは、複数種類のガウス関数の積として表され、
前記フィルタリング部は、前記注目画素毎に、前記重みを異なるように設定
前記複数種類のガウス関数には、前記注目画素に対する画素値差に依存するガウス関数が含まれ、
前記フィルタリング部は、前記画素値差に依存するガウス関数の標準偏差と、前記画素値差との関係を表す回帰直線に基づいて、前記注目画素毎に、前記標準偏差を異なる値に設定する、
画像処理装置。
【請求項2】
前記フィルタリング部は、前記劣化画像の勾配画像の二値化画像を作成し、前記二値化画像に現れる線の線幅に沿って両側にある画素の画素値差に応じて、前記画素値差に依存するガウス関数の前記標準偏差を設定する、
請求項に記載の画像処理装置。
【請求項3】
前記複数種類のガウス関数には、前記注目画素からの距離に依存するガウス関数が含まれ、
前記フィルタリング部は、前記劣化画像のボケ量を算出し、前記ボケ量に応じて、前記距離に依存するガウス関数の標準偏差を設定する、
請求項1又は2に記載の画像処理装置。
【請求項4】
前記フィルタリング部は、前記劣化画像の勾配画像の二値化画像を作成し、前記二値化画像に現れる線の線幅に応じて、前記ボケ量を算出する、
請求項に記載の画像処理装置。
【請求項5】
前記フィルタは、バイラテラルフィルタ又はトリラテラルフィルタである、
請求項1からのいずれかに記載の画像処理装置。
【請求項6】
前記フィルタリング部は、2回以上の所定の回数、前記劣化画像に前記フィルタを適用する、
請求項1からのいずれかに記載の画像処理装置。
【請求項7】
劣化画像のエッジを強調しつつノイズを除去する画像処理方法であって、
前記劣化画像内で注目画素の位置を移動させながら、前記注目画素の近傍領域にフィルタを適用するステップ
を含み、
前記フィルタの重みは、複数種類のガウス関数の積として表され、
前記フィルタを適用するステップでは、前記注目画素毎に、前記重みが異なるように設定され、
前記複数種類のガウス関数には、前記注目画素に対する画素値差に依存するガウス関数が含まれ、
前記フィルタを適用するステップでは、前記画素値差に依存するガウス関数の標準偏差と、前記画素値差との関係を表す回帰直線に基づいて、前記注目画素毎に、前記標準偏差が異なる値に設定される、
画像処理方法。
【請求項8】
劣化画像のエッジを強調しつつノイズを除去する画像処理プログラムであって、
前記劣化画像内で注目画素の位置を移動させながら、前記注目画素の近傍領域にフィルタを適用するステップ
をコンピュータに実行させ、
前記フィルタの重みは、複数種類のガウス関数の積として表され、
前記フィルタを適用するステップでは、前記注目画素毎に、前記重みが異なるように設定され、
前記複数種類のガウス関数には、前記注目画素に対する画素値差に依存するガウス関数が含まれ、
前記フィルタを適用するステップでは、前記画素値差に依存するガウス関数の標準偏差と、前記画素値差との関係を表す回帰直線に基づいて、前記注目画素毎に、前記標準偏差が異なる値に設定される、
画像処理プログラム。
【請求項9】
劣化画像のエッジを強調しつつノイズを除去する画像処理装置であって、
前記劣化画像内で注目画素の位置を移動させながら、前記注目画素の近傍領域にフィルタを適用するフィルタリング部
を備え、
前記フィルタの重みは、複数種類のガウス関数の積として表され、
前記フィルタリング部は、前記注目画素毎に、前記重みを異なるように設定し、
前記複数種類のガウス関数には、前記注目画素に対する画素値差に依存するガウス関数が含まれ、
前記フィルタリング部は、前記注目画素毎に、前記画素値差に依存するガウス関数の標準偏差を異なる値に設定し、
前記劣化画像の勾配画像の二値化画像を作成し、前記二値化画像に現れる線の線幅に沿って両側にある画素の画素値差に応じて、前記画素値差に依存するガウス関数の前記標準偏差を設定する、
画像処理装置。
【請求項10】
劣化画像のエッジを強調しつつノイズを除去する画像処理方法であって、
前記劣化画像内で注目画素の位置を移動させながら、前記注目画素の近傍領域にフィルタを適用するステップ
を含み、
前記フィルタの重みは、複数種類のガウス関数の積として表され、
前記フィルタを適用するステップでは、前記注目画素毎に、前記重みが異なるように設定され、
前記複数種類のガウス関数には、前記注目画素に対する画素値差に依存するガウス関数が含まれ、
前記フィルタを適用するステップでは、前記注目画素毎に、前記画素値差に依存するガウス関数の標準偏差が異なる値に設定され、
前記劣化画像の勾配画像の二値化画像が作成され、前記二値化画像に現れる線の線幅に沿って両側にある画素の画素値差に応じて、前記画素値差に依存するガウス関数の前記標準偏差が設定される、
画像処理方法。
【請求項11】
劣化画像のエッジを強調しつつノイズを除去する画像処理プログラムであって、
前記劣化画像内で注目画素の位置を移動させながら、前記注目画素の近傍領域にフィルタを適用するステップ
をコンピュータに実行させ、
前記フィルタの重みは、複数種類のガウス関数の積として表され、
前記フィルタを適用するステップでは、前記注目画素毎に、前記重みが異なるように設定され、
前記複数種類のガウス関数には、前記注目画素に対する画素値差に依存するガウス関数が含まれ、
前記フィルタを適用するステップでは、前記注目画素毎に、前記画素値差に依存するガウス関数の標準偏差が異なる値に設定され、
前記劣化画像の勾配画像の二値化画像が作成され、前記二値化画像に現れる線の線幅に沿って両側にある画素の画素値差に応じて、前記画素値差に依存するガウス関数の前記標準偏差が設定される、
画像処理プログラム。
【請求項12】
劣化画像のエッジを強調しつつノイズを除去する画像処理装置であって、
前記劣化画像内で注目画素の位置を移動させながら、前記注目画素の近傍領域にフィルタを適用するフィルタリング部
を備え、
前記フィルタの重みは、複数種類のガウス関数の積として表され、
前記フィルタリング部は、前記注目画素毎に、前記重みを異なるように設定し、
前記複数種類のガウス関数には、前記注目画素からの距離に依存するガウス関数が含まれ、
前記フィルタリング部は、前記劣化画像のボケ量を算出し、前記ボケ量に応じて、前記距離に依存するガウス関数の標準偏差を設定し、
前記劣化画像の勾配画像の二値化画像を作成し、前記二値化画像に現れる線の線幅に応じて、前記ボケ量を算出する、
画像処理装置。
【請求項13】
劣化画像のエッジを強調しつつノイズを除去する画像処理方法であって、
前記劣化画像内で注目画素の位置を移動させながら、前記注目画素の近傍領域にフィルタを適用するステップ
を含み、
前記フィルタの重みは、複数種類のガウス関数の積として表され、
前記フィルタを適用するステップでは、前記注目画素毎に、前記重みが異なるように設定され、
前記複数種類のガウス関数には、前記注目画素からの距離に依存するガウス関数が含まれ、
前記フィルタを適用するステップでは、前記劣化画像のボケ量が算出され、前記ボケ量に応じて、前記距離に依存するガウス関数の標準偏差が設定され、
前記劣化画像の勾配画像の二値化画像が作成され、前記二値化画像に現れる線の線幅に応じて、前記ボケ量が算出される、
画像処理方法。
【請求項14】
劣化画像のエッジを強調しつつノイズを除去する画像処理プログラムであって、
前記劣化画像内で注目画素の位置を移動させながら、前記注目画素の近傍領域にフィルタを適用するステップ
をコンピュータに実行させ、
前記フィルタの重みは、複数種類のガウス関数の積として表され、
前記フィルタを適用するステップでは、前記注目画素毎に、前記重みが異なるように設定され、
前記複数種類のガウス関数には、前記注目画素からの距離に依存するガウス関数が含まれ、
前記フィルタを適用するステップでは、前記劣化画像のボケ量が算出され、前記ボケ量に応じて、前記距離に依存するガウス関数の標準偏差が設定され、
前記劣化画像の勾配画像の二値化画像が作成され、前記二値化画像に現れる線の線幅に応じて、前記ボケ量が算出される、
画像処理プログラム。
【発明の詳細な説明】
【技術分野】
【0001】
本発明は、劣化画像のエッジを強調しつつノイズを除去する画像処理装置、方法及びプログラムに関する。
【背景技術】
【0002】
画像に含まれるノイズを除去し、画像を平滑化することができるフィルタの1つとして、ガウシアンフィルタが有名である。ガウシアンフィルタは、画像を走査しながら画像に含まれる局所領域に順次適用されるフィルタであり、フィルタのカーネルの重みが、中心の画素から離れるほどガウス関数に従って小さくなるように設定されたフィルタである。
【0003】
しかしながら、画像にガウシアンフィルタを適用すると、ノイズが除去される一方で、画像に含まれるエッジ(輪郭線)がボケてしまう傾向にある。この欠点を補うのが、バイラテラルフィルタである。バイラテラルフィルタは、カーネルの重みが、中心の画素からの距離に依存するガウス関数と、中心の画素に対する画素値差に依存するガウス関数との積で表される(例えば、特許文献1,2等参照)。これら2つのガウス関数は、いずれもガウス分布の標準偏差をパラメータとしており、距離に依存するガウス関数の標準偏差を調整することにより、フィルタリング後の画像のボケ具合(ノイズの改善度合い)が決定される。また、画素値差に依存するガウス関数の標準偏差を調整することにより、フィルタリング後の画像におけるエッジの強調度合いが決定される。そして、従来、画像にバイラテラルフィルタが適用されるとき、画像内においてフィルタが適用される局所領域の位置に関係なく、画像全体に対して上述した2つの標準偏差が、ひいては画像全体に対してカーネルの重みが一律に設定される。
【先行技術文献】
【特許文献】
【0004】
【特許文献1】特開2013−187645号公報
【特許文献2】特開2016−85543号公報
【発明の概要】
【発明が解決しようとする課題】
【0005】
しかしながら、画像の特徴は、局所領域毎に異なる。にもかかわらず、画像のあらゆる局所領域に一律の重みを有するフィルタを適用するのでは、十分なノイズ除去効果とエッジ強調効果との両方を得ることは難しいことがある。
【0006】
また、例えば、画像の細部を観察したい場合には、しばしば画像が拡大されるが、このとき、場合によっては、拡大によりボケた画像のエッジを強調することが必要となり得る。そして、一般的な補間アルゴリズム(バイキュービック等)で画像を拡大し、一般的なエッジ強調アルゴリズム(ラプラシアンフィルター、アンシャープマスク等)でエッジを補正する場合、拡大倍率が大きければボケが強くなるため、画像にはシュートやハロー、ジャギー等の各種アーティファクト(ノイズ)が表れて、画質が低下し得る。
【0007】
本発明は、画像に含まれるエッジを強調しつつ、エッジの周辺のアーティファクトを除去することができる画像処理装置、方法及びプログラムを提供することを目的とする。
【課題を解決するための手段】
【0008】
本発明の第1観点に係る画像処理装置は、劣化画像のエッジを強調しつつノイズを除去する画像処理装置であって、フィルタリング部を備える。前記フィルタリング部は、前記劣化画像内で注目画素の位置を移動させながら、前記注目画素の近傍領域にフィルタを適用する。前記フィルタの重みは、複数種類のガウス関数の積として表される。前記フィルタリング部は、前記注目画素毎に、前記重みを異なるように設定する。
【0009】
本発明の第2観点に係る画像処理装置は、第1観点に係る画像処理装置であって、前記複数種類のガウス関数には、前記注目画素に対する画素値差に依存するガウス関数が含まれる。前記フィルタリング部は、前記注目画素毎に、前記画素値差に依存するガウス関数の標準偏差を異なる値に設定する。
【0010】
本発明の第3観点に係る画像処理装置は、第2観点に係る画像処理装置であって、前記フィルタリング部は、前記劣化画像の勾配画像の二値化画像を作成し、前記二値化画像に現れる線の線幅に沿って両側にある画素の画素値差に応じて、前記画素値差に依存するガウス関数の前記標準偏差を設定する。
【0011】
本発明の第4観点に係る画像処理装置は、第1観点から第3観点のいずれかに係る画像処理装置であって、前記複数種類のガウス関数には、前記注目画素からの距離に依存するガウス関数が含まれる。前記フィルタリング部は、前記劣化画像のボケ量を算出し、前記ボケ量に応じて、前記距離に依存するガウス関数の標準偏差を設定する。
【0012】
本発明の第5観点に係る画像処理装置は、第4観点に係る画像処理装置であって、前記フィルタリング部は、前記劣化画像の勾配画像の二値化画像を作成し、前記二値化画像に現れる線の線幅に応じて、前記ボケ量を算出する。
【0013】
本発明の第6観点に係る画像処理装置は、第1観点から第5観点のいずれかに係る画像処理装置であって、前記フィルタは、バイラテラルフィルタ又はトリラテラルフィルタである。
【0014】
本発明の第7観点に係る画像処理装置は、第1観点から第6観点のいずれかに係る画像処理装置であって、前記フィルタリング部は、2回以上の所定の回数、前記劣化画像に前記フィルタを適用する。
【0015】
本発明の第8観点に係る画像処理方法は、劣化画像のエッジを強調しつつノイズを除去する画像処理方法であって、前記劣化画像内で注目画素の位置を移動させながら、前記注目画素の近傍領域にフィルタを適用するステップを含む。前記フィルタの重みは、複数種類のガウス関数の積として表される。前記フィルタを適用するステップでは、前記注目画素毎に、前記重みが異なるように設定される。
【0016】
本発明の第9観点に係る画像処理プログラムは、劣化画像のエッジを強調しつつノイズを除去する画像処理プログラムであって、前記劣化画像内で注目画素の位置を移動させながら、前記注目画素の近傍領域にフィルタを適用するステップをコンピュータに実行させる。前記フィルタの重みは、複数種類のガウス関数の積として表される。前記フィルタを適用するステップでは、前記注目画素毎に、前記重みが異なるように設定される。
【発明の効果】
【0017】
本発明の第1観点によれば、複数種類のガウス関数の積として表されるフィルタの重みが、画像全体に対して一律に設定されるのではなく、画像内においてフィルタが適用される位置に応じて異なるように設定される。その結果、局所領域毎の特徴を反映しながら、画像に含まれるエッジを強調しつつ、エッジの周辺のアーティファクトを除去することができる。
【図面の簡単な説明】
【0018】
図1】本発明の一実施形態に係る画像処理装置のブロック図。
図2】画像データが取り込まれる前の基本画面の図。
図3】画像データが取り込まれた後の基本画面の図。
図4】1のタイムラインに属する静止画群を示す図。
図5】本発明の一実施形態に係るエッジ保存型ノイズ除去処理(特殊バイラテラル処理)の流れを示すフローチャート。
図6】(a)パターン画像。(b)(a)のブレ画像。(c)(b)からさらにブレの進んだブレ画像。(d)(a)の勾配画像の二値化画像。(e)(b)の勾配画像の二値化画像。(f)(c)の勾配画像の二値化画像。
図7】画素値差PVDと、良好なエッジ強調の効果が得られる標準偏差σPとの関係を示すグラフ。
図8】ボケ量ωと、良好なエッジ強調の効果が得られる標準偏差σRとの関係を示すグラフ。
図9】(a)エッジの両側での画素値差PVD=72のパターン画像の拡大画像。(b)エッジの両側での画素値差PVD=52のパターン画像の拡大画像。(c)エッジの両側での画素値差PVD=28のパターン画像の拡大画像。(d)(a)に7回特殊バイラテラル処理を実行した画像。(e)(b)に7回特殊バイラテラル処理を実行した画像。(f)(c)に7回特殊バイラテラル処理を実行した画像。
図10】実施例及び比較例1〜4のためのサンプル画像。
図11】サンプル画像の劣化画像、並びに実施例及び比較例1〜4に係る補正画像の例。
図12】別のサンプル画像の劣化画像、並びに実施例及び比較例1〜4に係る補正画像の例。
図13】さらに別のサンプル画像の劣化画像、並びに実施例及び比較例1〜4に係る補正画像の例。
図14】サンプル画像、及び2〜6の拡大倍率で作成された劣化画像に対する実施例に係る補正画像。
図15図14のサンプル画像に基づいて2〜6の拡大倍率で作成された劣化画像に対する実施例及び比較例1〜4に係る補正画像。
【発明を実施するための形態】
【0019】
以下、図面を参照しつつ、本発明の幾つかの実施形態に係る画像処理装置、プログラム及び方法について説明する。
【0020】
<1.画像処理装置の構成>
図1に示す画像処理装置1は、本発明の第1実施形態に係る画像処理装置である。画像処理装置1は、ハードウェアとしては、汎用のパーソナルコンピュータである。画像処理装置1には、CD−ROMやUSBメモリ等のコンピュータが読み取り可能な記録媒体60から、或いはLANやインターネット等のネットワーク経由で画像処理プログラム2が提供され、インストールされている。画像処理プログラム2は、動画及び静止画に対する画像処理を支援するためのアプリケーションソフトウェアである。画像処理プログラム2は、画像処理装置1に後述する動作に含まれるステップを実行させる。
【0021】
画像処理装置1は、ディスプレイ10、入力部20、記憶部30及び制御部40を有する。これらの部10〜40は、互いにバス線やケーブル等の通信線5を介して接続されており、適宜、通信可能である。ディスプレイ10は、液晶ディスプレイ等から構成され、後述する画面等をユーザに対し表示する。入力部20は、マウスやキーボート、タッチパネル等から構成され、画像処理装置1に対するユーザからの操作を受け付ける。記憶部30は、ハードディスクやフラッシュメモリ等から構成される不揮発性の記憶領域である。制御部40は、CPU、ROM及びRAM等から構成される。
【0022】
画像処理プログラム2は、記憶部30内に格納されている。記憶部30内には、ソフトウェア管理領域50が確保されている。ソフトウェア管理領域50は、画像処理プログラム2が使用する領域である。ソフトウェア管理領域50内には、オリジナル画像領域51及び加工ファイル領域52が確保されている。各領域51,52の役割については、後述する。
【0023】
制御部40は、記憶部30内に格納されている画像処理プログラム2を読み出して実行することにより、仮想的に表示制御部41及び画像処理部42として動作する。表示制御部41は、ディスプレイ10上に表示される画面、ウィンドウ、ボタンその他の全ての要素の表示を制御する。画像処理部42は、様々な種類の画像処理を実行する。各部41,42の動作の詳細は、後述する。
【0024】
<2.画像処理装置の動作>
制御部40は、ユーザが入力部20を介して所定の操作を行ったことを検出すると、画像処理プログラム2を起動する。画像処理プログラム2が起動されると、基本画面W1(図2参照)がディスプレイ10上に表示される。
【0025】
<2−1.画像データの取込み>
基本画面W1は、オリジナル画像領域51への画像データの取込みの命令をユーザから受け付ける。オリジナル画像領域51へ取り込まれた画像データは、後述する再生処理及び画像処理の対象になる。制御部40は、静止画ファイル又は動画ファイルから、オリジナル画像領域51へ画像データを取り込む。なお、本明細書において、静止画ファイルとは、静止画形式のデータファイルであり、動画ファイルとは、動画形式のデータファイルである。
【0026】
静止画ファイルから画像データを取り込む場合、ユーザは、入力部20を操作することにより、1の静止画ファイルを指定するか、又は1のフォルダを指定する。前者の場合、制御部40は、その静止画ファイルの記憶部30内のアドレスパス及びファイル名をユーザに入力させる。後者の場合、制御部40は、そのフォルダの記憶部30内のアドレスパス及びフォルダ名をユーザに入力させる。その後、制御部40は、指定された静止画ファイル又は指定されたフォルダ内の全ての静止画ファイルを、オリジナル画像領域51に静止画ファイル群として保存する。なお、本明細書において、「群」という場合には、その要素数は複数とは限らず、1つであってもよい。
【0027】
一方、動画ファイルから画像データを取り込む場合、ユーザは、入力部20を操作することにより、1の動画ファイルの記憶部30内のアドレスパス及びファイル名を入力する。表示制御部41は、ユーザが動画ファイルを指定したことを検出すると、基本画面W1上に動画取込みウィンドウ(図示されない)を重ねて表示させる。動画取込みウィンドウは、指定された動画ファイルのタイムラインの全区間うち、任意の区間の選択をユーザから受け付ける。制御部40は、ユーザが入力部20を介して特定の区間を選択したことを検出すると、選択された区間に含まれるフレーム群に1対1で対応する静止画ファイル群を生成する。その後、制御部40は、この静止画ファイル群をオリジナル画像領域51に保存する。従って、本実施形態では、後述する再生処理及び画像処理の対象となる画像データは、動画ファイルではなく、静止画ファイルである。
【0028】
なお、制御部40は、オリジナル画像領域51へ取り込まれた静止画ファイル群が動画ファイルに由来するものではなく、静止画ファイルに由来するものであっても、静止画ファイル群に含まれるファイルをタイムラインに沿って配列されているものと認識する。配列は、ファイルの属性(ファイル名、作成日時、更新日時等)から自動的に判断される。
【0029】
<2−2.再生処理>
オリジナル画像領域51へ静止画ファイル群が取り込まれると、表示制御部41は、基本画面W1上に表示ウィンドウW2(図3参照)を重ねて表示させる。表示ウィンドウW2は、オリジナル画像領域51へ取り込まれた静止画ファイル群のタイムラインの数だけ作成される。
【0030】
表示ウィンドウW2内には、まず、オリジナル画像領域51へ取り込まれた静止画ファイル群に含まれる1の静止画ファイル(例えば、タイムライン上で先頭のフレームに対応する静止画ファイル)が表示される。その後、後述するとおり、表示ウィンドウW2内に表示されるフレームは、ユーザの操作を受けて切り替わる。
【0031】
図3に示すとおり、基本画面W1上には、ウィンドウ選択プルダウンメニューT1、再生ボタンT2、コマ送りボタンT3、コマ戻しボタンT4及びタイムラインバーT5が配置されている。
【0032】
表示ウィンドウW2が複数存在する場合であっても、アクティブな表示ウィンドウW2は1つである。ウィンドウ選択プルダウンメニューT1は、どの表示ウィンドウW2をアクティブとするかの選択をユーザから受け付ける。以下、アクティブな表示ウィンドウW2に対応するタイムラインを、アクティブタイムラインと呼び、アクティブタイムラインに属するフレーム群を、アクティブフレーム群と呼ぶ。また、アクティブな表示ウィンドウW2内に現在表示されているフレームを、アクティブフレームと呼ぶ。
【0033】
表示制御部41は、アクティブな表示ウィンドウW2内で、アクティブフレーム群を動画として再生可能である。再生ボタンT2は、アクティブフレーム群の動画としての再生の命令をユーザから受け付ける。表示制御部41は、ユーザが入力部20を介して再生ボタンT2を押下したことを検出すると、アクティブな表示ウィンドウW2内に、アクティブフレーム群に含まれるフレームを、タイムラインに沿って順次コマ送りの形式で表示させる。なお、再生は、再生ボタンT2が押下された時点のアクティブフレームから開始する。また、再生ボタンT2は、再生の停止の命令をユーザから受け付ける。表示制御部41は、再生中にユーザが入力部20を介して再生ボタンT2を押下したことを検出すると、アクティブな表示ウィンドウW2内の表示を、その時点のアクティブフレームに固定する。
【0034】
コマ送りボタンT3、コマ戻しボタンT4はそれぞれ、アクティブフレームを、アクティブタイムラインに沿って1つ後、1つ前のフレームへ切り替える命令をユーザから受け付ける。
【0035】
タイムラインバーT5は、アクティブタイムラインを図式的に示すオブジェクトである。タイムラインバーT5は、そのバーが延びる方向に、アクティブフレーム群に含まれるフレーム数で等分に分割されている。タイムラインバーT5上の左からn番目の分割領域は、アクティブタイムライン上でn番目のフレームに対応する(nは、自然数)。
【0036】
図3に示すように、表示制御部41は、タイムラインバーT5上において、選択フレーム群に対応する分割領域A1と、非選択フレーム群に対応する分割領域A2とを、異なる表示形式で表示する。選択フレーム群とは、アクティブタイムライン上で現在選択されている区間に属するフレーム群である。非選択フレーム群とは、アクティブタイムライン上で現在選択されていない区間に属するフレーム群である。
【0037】
タイムラインバーT5は、アクティブタイムライン上の任意の区間の選択をユーザから受け付ける。このとき選択される区間は、連続区間であってもよいし、図3に示すように、不連続区間であってもよい。具体的には、ユーザは、入力部20を介してタイムラインバーT5上の分割領域を操作することにより、アクティブフレーム群の中から、任意のフレームを任意の数だけ選択することができる。分割領域は、同時に複数選択が可能である。表示制御部41は、ユーザによりタイムラインバーT5上の分割領域が選択される度に、アクティブフレームを最新に選択された分割領域に対応するフレームに直ちに切り替える。画像処理部42は、選択フレーム群を後述される画像処理の対象として認識する。
【0038】
<2−3.画像処理>
画像処理部42は、選択フレーム群に対し、明るさ/コントラスト/彩度調整、拡大/縮小、ノイズ除去、シャープネス、歪曲補正、エッジ保存型ノイズ除などの複数の画像処理モジュールを実行可能である。画像処理モジュールは、画像処理プログラム2に組み込まれている。
【0039】
ユーザは、入力部20を介して基本画面W1を操作することにより、画像処理モジュールの中から任意のものを、任意の順番に、任意の回数だけ選択することが可能である。画像処理部42は、ユーザが画像処理モジュールを選択したことを検出する度に、その時点の選択フレーム群に対しその画像処理モジュールを実行する。なお、選択フレーム群に対し画像処理モジュールを実行するとは、選択フレーム群に含まれる各フレームに対しその画像処理モジュールを実行することである。
【0040】
フレームに対し画像処理モジュールが1回、2回、3回,・・・と、順次実行されてゆくにつれて、そのフレームは、第1次、第2次、第3次,・・・と、順次加工されてゆく。第0次フレームは、オリジナル画像領域51に保存されている静止画ファイルに対応する。第(m+1)次フレームは、第m次フレームの静止画ファイルに対し画像処理モジュールを1回実行した後の静止画ファイルに対応する(mは、0以上の整数)。画像処理部42は、第1次以降のフレームに対応する静止画ファイルを順次生成し、これらの静止画ファイルを加工ファイル領域52内にそれぞれ別個に保存する。
【0041】
図4は、1のタイムラインに属する画像群が画像処理プログラム2によりどのように管理されるかを示す概念図である。図4において、横軸のN軸は、タイムライン上のフレームの順番を示しており、縦軸のM軸は、加工の順番を示している。図4のN−M空間内の座標(n,m)に対応する四角形は、画像I(n,m)を表している。画像I(n,m)は、タイムライン上でn番目のフレームの第m次の画像である(nは、自然数であり、mは、0以上の整数である)。
【0042】
制御部40は、各フレームについて、現在選択されている座標mの値をパラメータmsとして管理する。オリジナル画像領域51へ静止画ファイル群が取り込まれた直後、座標msは、初期値0である。その後、画像処理モジュールが1回実行される度に、そのフレームの座標msは1ずつインクリメントされる。また、ユーザは、入力部20を介して所定の操作を行うことにより、任意のフレームの座標msを自在に変更することができる。なお、フレームに対し画像処理モジュールを実行するとは、そのフレームの第ms次の画像に対し画像処理モジュールを実行することである。従って、座標msを変更することには、画像処理モジュールの実行の対象を変更するという意味がある。また、フレームを表示するとは、そのフレームの座標msの画像を表示することである。従って、座標msを変更することには、アクティブな表示ウィンドウW2内に表示される対象を変更するという意味もある。
【0043】
<3.エッジ保存型ノイズ除去>
画像処理プログラム2に実装されている画像処理の1つである、エッジ保存型ノイズ除去処理とは、名前の通り、画像のエッジを強調しつつノイズを除去する処理である。エッジ保存型ノイズ除去処理には、一般的なバイラテラルフィルタによるフィルタリング処理(以下、一般バイラテラル処理という)と、特殊なバイラテラルフィルタによるフィルタリング処理(以下、特殊バイラテラル処理という)とが含まれる。特殊バイラテラル処理とは、一般バイラテラル処理を応用した超解像技術に係る処理である。
【0044】
上記2種類のフィルタリング処理は、バイラテラルフィルタを用いて対象画像Fをフィルタリングし、補正画像Gを得る処理である。今、対象画像Fの左上からx方向(横方向)にi番目でy方向(縦方向)にj番目の位置(すなわち、(i,j)の位置)の画素の画素値を、f(i,j)と表す(i=1,2,・・・,I,j=1,2,・・・,J,Iは、対象画像Fの横画素数、Jは、対象画像Fの縦画素数)。このとき、補正画像Gの(i,j)の位置の画素の画素値g(i,j)は、下式のとおり表される。
【数1】
【数2】
【0045】
上式中、kは、バイラテラルフィルタのカーネルのサイズを決定する定数である。また、wgt(i,j,m,n)は、バイラテラルフィルタが適用される局所領域内の各画素に割り当てられる重みを表している。この重みwgt(i,j,m,n)は、数2のとおり、複数種類のガウス関数の積として表される。右辺の1つ目のexp関数は、バイラテラルフィルタが適用される局所領域の中心の画素(注目画素)からの距離に依存するガウス関数である。また、右辺の2つ目のexp関数は、注目画素に対する画素値差に依存するガウス関数である。これら2つのガウス関数は、いずれもガウス分布の標準偏差σR,σPをパラメータとしており、距離に依存するガウス関数の標準偏差σRを調整することにより、補正画像Gのボケ具合(ノイズの改善度合い)が決定される。また、画素値差に依存するガウス関数の標準偏差σPを調整することにより、補正画像Gをボケた状態からエッジが強調された状態まで変化させることができる。
【0046】
一般バイラテラル処理では、上述した標準偏差σR,σP、ひいてはカーネルの重みが、対象画像F全体に対して一律に設定される。他方、本実施形態に係る特殊バイラテラル処理では、カーネルの重みが、対象画像F全体に対して一律に設定されるのではなく、対象画像F内においてフィルタが適用される位置に応じて異なるように設定される。その結果、局所領域毎の特徴を反映しながら、対象画像Fにおけるエッジを強調しつつ、対象画像Fのエッジ周辺のアーティファクトを除去することができる。なお、本実施形態では、標準偏差σPが注目画素毎に設定されるため、注目画素が対象画像F内において(i,j)の位置にあるときの標準偏差σPを、σP(i,j)と表すことがある。
【0047】
以下、図5を参照しつつ、特殊バイラテラル処理の流れについて詳細に説明する。特殊バイラテラル処理は、選択フレーム群に含まれる各フレームを対象として実行される。なお、図5では、簡単のため、1枚のフレーム(対象画像F)に対する処理を説明するが、実際には、選択フレーム群に含まれる各フレームに対し、同様の処理が繰り返し実行されるものとする。
【0048】
まず、ステップS1において、画像処理部42は、対象画像Fの勾配画像G1を作成する。勾配画像G1とは、対象画像Fに含まれる各画素値のx方向(横方向)及びy方向(縦方向)の勾配(隣接画素間の画素値の増分)を表す画像である。勾配画像G1の(i,j)の位置の画素の画素値g1(i,j)は、以下の式に従って算出される(i=1,2,・・・,I,j=1,2・・・,J)。
【数3】
ただし、
【数4】
である。ただし、f(0,j)及びf(i,0)の値としては、この例に限られないが、0等の適当な値を設定することができる。
【0049】
続くステップS2では、画像処理部42は、勾配画像G1の二値化画像G2を作成する。二値化のための閾値は、本実施形態では8であるが、他の数値を設定することも可能である。また、本実施形態では、g1(i,j)が閾値以上の場合に、g2(i,j)=H=1に設定され、g1(i,j)が閾値より小さい場合に、g2(i,j)=L=0に設定される。なお、g2(i,j)は、二値化画像G2の(i,j)の位置の画素の画素値である。
【0050】
図6(a)〜(c)は、それぞれブレ量の異なる3枚のパターン画像を示す。より具体的には、図6(b)は、図6(a)の画像を拡大した画像であり、図6(c)は、図6(b)の画像をさらに拡大した画像である。また、図6(d)〜図6(f)は、それぞれ図6(a)〜(c)の画像をステップS1,S2の方法で作成した二値化画像G2である。図6からも分かるとおり、二値化画像G2においては、対象画像Fに含まれるエッジが幅のある線として現れる。また、線の幅は、ボケが強い程太くなる。そのため、二値化画像G2に現れる線の線幅は、対象画像Fのボケ量ωを表す指標となる。
【0051】
続いて、図5に示すとおり、画像処理部42は、二値化画像G2を左上の画素から右下の画素までラスタスキャンし、g2(i,j)=H=1の場合に、ステップS3〜S8を実行する。一方、g2(i,j)=L=0の場合は、ステップS3〜S8が省略される。
【0052】
ステップS3では、画像処理部42は、二値化画像G2の(i,j)の位置の画素(注目画素)の勾配方向φ(i,j)を、以下の式に従って算出する。
【数5】
【0053】
続くステップS4では、画像処理部42は、二値化画像G2内において(i,j)の位置の注目画素から勾配方向φ(i,j)に進みながら、g2(i,j)=L=0となる画素P1を探索する。また、続くステップS5では、画像処理部42は、二値化画像G2内において(i,j)の位置の注目画素から勾配方向φ(i,j)の逆方向に進みながら、g2(i,j)=L=0となる画素P2を探索する。さらに、ステップS6では、画素P1,P2間の距離を決定する。この距離は、画素数に基づいて表される。
【0054】
画素P1,P2は、画素値Hの注目画素から勾配方向φ(i,j)又はその逆方向に進みながら、画素値がLに切り替わる画素である。従って、画素P1,P2間の距離とは、二値化画像G2に現れる線の線幅、すなわち、対象画像Fのボケ量ωを表すことができる。
【0055】
続くステップS7では、画像処理部42は、画素P1,P2間の画素値差PVDを算出する。PVDは、画素P1の画素値と画素P2の画素値との差分の絶対値として算出される。PVDは、二値化画像G2に現れる線の線幅に沿って両側にある画素間の画素値差である。ところで、対象画像Fにおいてエッジの両側の画素間の画素値差が大きければ大きい程、エッジは明瞭になると言える。従って、PVDは、エッジの明瞭さを表す指標となる。
【0056】
続くステップS8では、画像処理部42は、画素値差PVDに応じて、標準偏差σP(i,j)を設定する。具体的には、予め定められている以下の式にステップS7のPVDを代入することにより、σP(i,j)を算出する。本実施形態では、注目画素毎にσP(i,j)が異なる値に設定される。
【数6】
【0057】
一般バイラテラルフィルタによる平滑化では、対象画像F全体に同じ標準偏差σPを用いるため、エッジ部分における画素値差PVDが小さい場合には、エッジが保存されずに平滑化される。逆に、エッジ部分におけるPVDが大きいと、エッジの強調効果が生じない。従って、エッジ部分におけるPVDに応じて重みを変化させると、それぞれのエッジを急峻にすることが可能である。
【0058】
数6の式は、本発明者らが行った実験により得られた式である。本実験について、図7及び表1を参照しつつ、詳しく説明する。
【表1】
【0059】
まず、本発明者は、その両側において様々な画素値差PVDを有するエッジを含む画像を用意し、それぞれを様々な拡大倍率(2〜6倍)で拡大した拡大画像を作成した。そして、標準偏差σPを様々に変化させながら、これらの拡大画像にバイラテラルフィルタを順次適用した。なお、重みを設定するためのもう1つの標準偏差σRは、後述するステップS10と同様に設定された。そして、バイラテラルフィルタが適用された補正画像の中から、最も良好なエッジ強調の効果が得られる画像を目視にて選択し、選択された画像に対応するσPを、良好なエッジ強調の効果が得られるσPとして決定した。表1は、このようなσPとPVDとの関係をまとめたものである。
【0060】
表1中の拡大倍率は、拡大画像のボケ量ωを表している。よって、表1からは、良好なエッジ強調の効果が得られる標準偏差σPは、画像のボケ具合に依存しないことが分かった。一方で、良好なエッジ強調の効果が得られるσPは、画素値差PVDに応じて変化することが分かった。
【0061】
図7は、表1の結果に基づいて、良好なエッジ強調の効果が得られる標準偏差σPと、画素値差PVDとの関係をまとめたグラフである。数6は、σPとPVDとの関係を表す回帰直線である。従って、数6の式によれば、ステップS7で得られたPVDに基づいて、良好なエッジ強調の効果が得られるσPを算出することができる。
【0062】
続いて、二値化画像G2に含まれる各画素に対するステップS3〜S8が終了すると、ステップS9に進む。ステップS9では、画像処理部42は、ステップS6で得られた画素P1,P2間の距離、すなわち、二値化画像G2に現れる線の線幅に応じて、対象画像F全体としてのボケ量ωを算出する。より具体的には、ボケ量ωは、二値化画像G2に含まれるg2(i,j)=H=1となる全ての画素に対して得られた画素P1,P2間の距離の平均値として算出される。
【0063】
続くステップS10では、画像処理部42は、ボケ量ωに応じて、標準偏差σRを設定する。具体的には、予め定められている以下の式にステップS9のωを代入することにより、σRを算出する。
【数7】
【0064】
対象画像Fに含まれるエッジを急峻にする効果を得るためには、ボケ量ωが大きい程、標準偏差σRも大きくすることが必要となり得る。数7の式は、本発明者らが行った実験により得られた式である。本実験について、図8及び表2を参照しつつ、詳しく説明する。
【表2】
【0065】
まず、本発明者は、図6(a)のパターン画像を様々な拡大倍率で拡大した劣化画像(例えば、図6(b)及び(c)の画像)を作成し、これらの画像全体としてのボケ量ωを算出した。次に、標準偏差σRを様々に変化させながら、劣化画像にバイラテラルフィルタを順次適用し、こうして得られた補正画像においてエッジが最も急峻となったときのσRを、良好なエッジ強調の効果が得られるσRとして決定した。なお、バイラテラルフィルタの重みを設定するためのもう1つの標準偏差σPは、前述のステップS8と同様に設定された。表2は、このようなσRとωとの関係をまとめたものである。ところで、数6及び数7の回帰式を導出する過程において、最初の段階では、ωとσRとの関係、PVDとσPとの関係、及びσR,σPの相互関係が分からない。よって、後述する図9のような様々なPVDを有するパターン画像を複数の強度でぼかしたサンプル画像を多数作成し、σR及びσPを様々に変化させながら、サンプル画像の変化と各標準偏差σR,σPとの関係を調査した。
【0066】
また、図8は、表2の結果に基づいて、良好なエッジ強調の効果が得られる標準偏差σRと、ボケ量ωとの関係をまとめたグラフである。数7は、σRとωとの関係を表す回帰直線である。従って、数7の式によれば、ステップS9で得られたωに基づいて、良好なエッジ強調の効果が得られるσRを算出することができる。
【0067】
ステップS10が終了すると、図5に示すとおり、画像処理部42は、対象画像Fを左上の画素から右下の画素までラスタスキャンし、対象画像Fに含まれる各画素(注目画素)に対し、ステップS11,S12を実行する。
【0068】
ステップS11では、画像処理部42は、既出の標準偏差σR,σP(i,j)に基づいて、対象画像F内において注目画素が(i,j)の位置にあるときのバイラテラルフィルタのカーネルの重みの配列を設定する。より具体的には、上述した数2の式に従って、m=−k,−(k−1),・・・,0,・・・,(k−1),k及びn=−k,−(k−1),・・・,0,・・・,(k−1),kに対し、バイラテラルフィルタのカーネル内の(m,n)の位置での重みwgt(i,j,m,n)を算出する。ただし、上述したことから明らかなとおり、g2(i,j)=L=0の場合、標準偏差σPは算出されない。従って、図5に示すとおり、この場合には、σP=1に設定される。なお、対象画像Fの端部では、ミラー(折り返し)により対象画像Fのサイズを広げることにより、wgt(i,j,m,n)が算出される。
【0069】
続くステップS12では、画像処理部42は、数1の式に従って、(i,j)の位置にある注目画素の近傍領域に、ステップS11で算出された重みwgt(i,j,m,n)に基づくバイラテラルフィルタを適用し、補正画像Gに含まれる(i,j)の位置の画素の画素値g(i,j)を算出する。図5に示すとおり、このステップS12は、注目画素毎に所定の回数Qだけ、繰り返し実行される。Qの数は、特に限定されないが、好ましくは2回以上である。そして、対象画像Fに含まれる各画素に対するステップS11,S12が終了すると、補正画像Gが作成される。その後、特殊バイラテラル処理が終了する。
【0070】
ところで、図9(a)〜(c)の画像は、エッジの両側での画素値差PVDがそれぞれ72,52,28となるように図6(a)のパターン画像の画素値を調整した後、これらのパターン画像を5倍拡大してボケさせた画像である。一方、図9(d)〜(f)は、それぞれ図9(a)〜(c)の画像に対し、Q=7として特殊バイラテラル処理を実行した結果を表している。この実験では、PVDに関わらず、Q=7のときに、エッジを急峻にする効果が十分に発揮されるという結果を得た。よって、Q=7であることが好ましい。
【0071】
<4.用途>
画像処理プログラム2は、多種多様な静止画及び動画に対する画像処理を取り扱うことができるが、例えば、警察等の機関が事件の捜査のために防犯カメラの監視映像を解析するのにも利用され得る。防犯カメラにおいては、注目する人や物等の対象が小さく映り込んでいることが多い。そのため、対象を詳細に観察するために画像を拡大し、さらにこれらを鮮鋭化すると、画像にはシュートやハロー、ジャギー等の各種アーティファクト(ノイズ)が表れ、しばしば画質が劣化する。この点、上述した特殊バイラテラル処理は、このような劣化画像のエッジを強調しつつ、アーティファクトを除去するのに特に好ましく使用することができる。
【0072】
<5.変形例>
以上、一実施形態について説明したが、本発明は上記実施形態に限定されるものではなく、その趣旨を逸脱しない限りにおいて、種々の変更が可能である。例えば、以下の変更が可能である。また、以下の変形例の要旨は、適宜組み合わせることができる。
【0073】
<5−1>
上記実施形態では、バイラテラルフィルタの重みを決定する標準偏差を注目画素毎に異なるものとしたが、同様のアルゴリズムは、例えばトリラテラルフィルタにも適用することができる。
【0074】
<5−2>
上記実施形態では、画素値差に依存するガウス関数の標準偏差σPのみが注目画素毎に可変とされたが、距離に依存するガウス関数の標準偏差σRについても同様に可変とすることができる。また、標準偏差σRを注目画素毎に可変としつつ、標準偏差σPを画像全体に対し一定とすることもできる。
【実施例】
【0075】
以下に、本発明の実施例について説明するが、本発明はこれに限定されない。
【0076】
図10に示されるサンプル画像を含む87枚のサンプル画像を用意し、これらの画像をそれぞれ標準偏差σ=1.2,1.5,1.8,2.1,2.4のガウスフィルターでぼかし、バイキュービック法により1/2,1/3,1/4,1/5,1/6倍に縮小した。さらに、これらの画像をバイキュービック法により元のサイズに拡大した。こうして得られた各劣化画像に対し、上記実施形態に係る特殊バイラテラル処理(実施例)、及び以下の4つの文献に示される補正処理(比較例1〜4)を実行し、補正画像を得た。
【0077】
比較例1: 国際公開第2006/041127号, "劣化情報復元方法と復元装置"
比較例2: 北耕次ら、"図形パッチ学習型超解像", 電気学会論文誌C(電子・情報・システム部門誌), Vol.136, No.7, pp.929-237, 2016.
比較例3:合志清ら、"非線形超解像技術の提案と画質評価”, 電子情報通信学会技術研究報告. PRMU2012−62, pp.59-64, 2012.
比較例4:Lingfeng Wangら,"Edge-Directed Single-Image Super-Resolution via Adaptive Gradient Magnitude Self-Interpolation", IEEE TRANSACTIONS ON CIRCUITS AND SYSTEMS FOR VIDEO TECHNOLOGY, VOL.23, NO.8, pp.1289-1299, 2013.
【0078】
図11図13に、劣化画像並びに実施例及び比較例1〜4に係る補正画像の例を示す。なお、図11図13は、それぞれ拡大倍率が3倍、4倍、5倍の結果である。比較例1では、低倍率拡大における結果は良好であるが、高倍率になるにつれて、拡大する前の画素パターンが顕著に認められる。比較例3及び比較例4では、エッジの改善効果は大きいが、比較例3については図11及び図13、比較例4については図12及び図13に見られる様に、エッジの縁取り現象が比較的発生しやすい傾向がある。これらの手法の土台になっているアンシャープマスクまたはラプラシアンフィルターの特徴であると言える。また、比較例2では、曲線のみを学習するため、補正画像のエッジは非常に滑らかある。しかし、劣化が増すにつれて復元のための緻密な情報が学習データ中に多く必要となるため、曲線のみでは情報量が十分でなく、図13のように復元効果が極端に悪くなることがある。これに対し、実施例に係る手法によれば、エッジ周辺のアーティファクトが減少しており、さらにエッジが急峻に保たれることが確認された。
【0079】
図14は、様々な拡縮の倍率で作成された劣化画像に対する、実施例に係る補正画像を示す。図15は、同画像に基づいて様々な拡縮の倍率で作成された劣化画像に対する、比較例1〜4及び実施例に係る補正画像を示す。これらを見ると、実施例では、バイラテラルフィルタの持つ平滑化効果が確認された。にもかかわらず、比較例1〜4よりもエッジ周辺のアーティファクトが少なく、より明瞭なエッジが倍率に関わらず安定して得られた。
【0080】
また、87枚のサンプル画像に基づく劣化画像、並びに比較例1〜4及び実施例に係る補正画像に対し、上記実施形態のステップ9で定義されたボケ量ωを算出し、その拡大倍率毎の平均値を表3にまとめた。ωは、エッジが急峻なほど小さくなり、エッジが緩やかであるほど大きくなる。さらに、エッジが急峻でもその周辺にアーティファクトがあると、ωは大きくなる。表3によると、実施例に係るωは、比較例1〜4のいずれよりも顕著に小さい。よって、実施例に係る手法によれば、エッジ周辺のアーティファクトを排除しつつ、エッジを急峻に保つことができることが確認された。
【表3】
【符号の説明】
【0081】
1 画像処理装置
2 画像処理プログラム
42 画像処理部(フィルタリング部)
図1
図2
図3
図4
図5
図6
図7
図8
図9
図10
図11
図12
図13
図14
図15