(19)【発行国】日本国特許庁(JP)
(12)【公報種別】公表特許公報(A)
(11)【公表番号】
(43)【公表日】2024-06-28
(54)【発明の名称】周辺エリア検出および画像フィルタリングのためのブレンディング
(51)【国際特許分類】
G06T 7/00 20170101AFI20240621BHJP
【FI】
G06T7/00 300G
【審査請求】有
【予備審査請求】未請求
(21)【出願番号】P 2023576121
(86)(22)【出願日】2022-06-01
(85)【翻訳文提出日】2024-02-09
(86)【国際出願番号】 US2022031795
(87)【国際公開番号】W WO2022260907
(87)【国際公開日】2022-12-15
(32)【優先日】2021-06-11
(33)【優先権主張国・地域又は機関】EP
(32)【優先日】2021-06-11
(33)【優先権主張国・地域又は機関】US
(81)【指定国・地域】
(71)【出願人】
【識別番号】507236292
【氏名又は名称】ドルビー ラボラトリーズ ライセンシング コーポレイション
(74)【代理人】
【識別番号】100101683
【氏名又は名称】奥田 誠司
(74)【代理人】
【識別番号】100155000
【氏名又は名称】喜多 修市
(74)【代理人】
【識別番号】100188813
【氏名又は名称】川喜田 徹
(74)【代理人】
【識別番号】100202197
【氏名又は名称】村瀬 成康
(72)【発明者】
【氏名】ファン,ツォン‐ウェイ
(72)【発明者】
【氏名】スゥ,グワン‐ミーン
【テーマコード(参考)】
5L096
【Fターム(参考)】
5L096AA02
5L096DA01
5L096EA02
5L096EA06
5L096EA39
5L096EA43
5L096FA35
5L096GA30
5L096GA55
(57)【要約】
周辺エリアを検出してブレンドするための方法およびシステムであって、画像フィルタリングにおける当該エリアに起因するフィルタリングアーティファクトを回避する方法およびシステムが開示される。開示される方法は、補償ステップを含み、ロゴおよびクローズキャプションを含む、レターボックス、ピラーボックス、楕円、または他の形状などの任意の形状のパディングされたエリアを有する任意の画像に適用され得る。そのような方法は、圧縮アーティファクトおよびノイズの可能性がある画像内の周辺エリアを検出し、次にブレンディングを実行することにより、任意の画像フィルタリング処理に対する周辺エリアの影響を最小化する。
【特許請求の範囲】
【請求項1】
画像中の周辺エリアを検出する方法であって、
前記画像の境界エリアのヒストグラムを計算することと、
前記ヒストグラムのピークおよび幅を求めることと、
前記ヒストグラムのピークおよび幅に基づき、前記画像中の周辺エリアの存在を分類することにより、ピーク検出スコアを生成することと、
前記画像の前記境界エリアにおける最小の可能な周辺エリア上のピークに属する画素の比率に基づいて、前記画像中の前記周辺エリアの存在を分類することにより、境界検出スコアを生成することと、
前記ピークと前記境界検出スコアとの組み合わせに基づいて、合計スコアを生成することと、
前記合計スコアに基づいて前記周辺エリアの存在を検出することと、
を含む方法。
【請求項2】
前記周辺エリアを周辺エリアマスクとして表す平滑化フィルタを用いて、前記ヒストグラムの前記ピークをモデル化することをさらに含む、請求項1に記載の方法。
【請求項3】
前記平滑化フィルタはガウシアンカーネルを含む、請求項2に記載の方法。
【請求項4】
前記周辺エリアマスクに基づいて周辺エリア確率マップを生成することをさらに含む、請求項2または3のいずれかに記載の方法。
【請求項5】
前記周辺エリア確率マップを生成することは、
スケーリングされた区分的ガウシアンカーネルを用いて確率を計算することと、
前記確率を逆投影して前記周辺エリア確率マップを生成することと、
を含む、請求項4に記載の方法。
【請求項6】
前記周辺エリア確率マップに基づき、前記周辺エリアと前記画像の主要な対象とをブレンドすることをさらに含む、請求項4または5のいずれかに記載の方法。
【請求項7】
前記ブレンドすることは重み付けガウシアンフィルタリングを用いて行われる、請求項6に記載の方法。
【請求項8】
前記周辺エリア確率マップに基づいてブレンディング重みを計算することと、
前記画像および前記ブレンディング重みに基づいて重み付け画像を生成することと、
をさらに含む、請求項7に記載の方法。
【請求項9】
前記ブレンディング重みをガウシアンフィルタリングすることによりフィルタ化重みを生成することと、
前記重み付け画像をガウシアンフィルタリングすることによりフィルタ化重み付け画像を生成することと、
前記フィルタ化重み付け画像および前記フィルタ化重みに基づいて、重み付けフィルタ画像を生成することと、
をさらに含む、請求項8に記載の方法。
【請求項10】
前記画像と前記重み付けフィルタ画像との重み付け加算を用いて、前記ブレンド画像を生成することをさらに含む、請求項9に記載の方法。
【請求項11】
前記ブレンドすることは、距離変換を伴うミラーリングを用いて行われる、請求項6に記載の方法。
【請求項12】
前記ミラーリングは、
前記周辺エリアマスクに閾値処理を行うことにより、二値画像内容マスクを生成することと、
前記二値画像内容マスクにモルフォロジー平滑化を適用することと、
前記二値画像内容マスクの距離変換を計算することと、
前記距離変換を用いて、前記周辺エリア内の各画素について、前記各画素に最も近い画像内容エリア中の画素群を特定することと、
最も近い画素群のインデックスマップを生成することと、
前記画像および前記最も近い画素群のインデックスマップを用いて、ブレンド画像を生成することと、
を含む、請求項11に記載の方法。
【請求項13】
前記ブレンド画像をフィルタリングすることにより、フィルタリングされたブレンド画像を生成することをさらに含む、請求項12に記載の方法。
【請求項14】
前記フィルタリングは、エッジ保存フィルタリングを含む、請求項13に記載の方法。
【請求項15】
前記画像と前記フィルタリングされたブレンド画像との重み付け加算を行うことをさらに含む、請求項12から14のいずれかに記載の方法。
【請求項16】
前記重み付け加算は、前記周辺エリア確率マップに基づいて行われる、請求項15に記載の方法。
【請求項17】
前記画像のYチャンネル、Uチャンネル、Vチャンネル、またはそれらの組み合わせが前記画像を表現するために用いられる、請求項1から16のいずれかに記載の方法。
【請求項18】
請求項1から17のいずれかに記載の方法を実行するように構成されたハードウェア、ソフトウェア、またはその両方を備えるビデオデコーダ。
【発明の詳細な説明】
【技術分野】
【0001】
(関連出願への相互参照)
本出願は、2021年6月11日出願の米国仮出願第63/209,602号および2021年6月11日出願のEP出願第21178935.9号の優先権の利益を主張するものであり、これらの各出願の全体を本願に援用する。
【0002】
(技術分野)
本開示は、一般に画像処理に関する。特に、本開示は、画像フィルタリングのための周辺エリア検出およびブレンディングに関する。
【背景技術】
【0003】
一般に、画像は、その画像の主要な対象の周辺にある非アクティブエリアを含み得る。そのような非アクティブエリアは、任意の形状(例えば、矩形、円形、楕円形もしくは他の幾何学的形状)または任意の不規則形状であり得る。さらに、画像内の非アクティブエリアは、テキスト、ラベル、またはキャプションを含み得る。画像フィルタリングにおいて、周辺エリアに起因するフィルタリングアーティファクトを回避するために、周辺エリアを検出してブレンドすることが強く望まれる。既存のフィルタリング処理では、周辺エリアはノイズがない矩形であると仮定され、画像フィルタリング中に除外される。これは、ノイズがないインハウスのスタジオのコンテンツに対してはうまく機能するかもしれない。しかし、周辺エリアにロゴ、テキスト、またはノイズを有する他の映像コンテンツや、矩形でない周辺エリアの場合、既存の基本的な方法では、周辺エリア付近にバンディング/ハローアーティファクトが発生する可能性がある。このようなフィルタリングアーティファクトは、局所的再構成(local reshaping)や他のフィルタリング出力に基づく処理のような更なる処理において増幅され、視覚的品質を低下させる可能性がある。
【発明の概要】
【0004】
本明細書で使用する「周辺エリア」(surround area)という用語は、画像またはビデオフレーム(典型的には、「アクティブエリア」と呼ばれる)の周囲の非アクティブ(静的)領域を指す。周辺エリアの例としては、典型的な16:9のテレビフレーム内における様々なビデオ/フィルムのアスペクト比に対応するための、レターボックスまたはピラーボックスとして知られる黒い帯が挙げられる。周辺エリアは、矩形、円、楕円、その他の不規則形状など、任意の形状を持つことができる。周辺エリアは典型的には、黒や灰色などの「単調な」色で区別されるが、多くの場合、テキスト(字幕など)やグラフィック(ロゴなど)がこれらのエリアの上に重ねられ得る。
【0005】
開示される方法および装置は、画像フィルタリングにおける周辺エリアによるフィルタリングアーティファクトを回避するために、周辺エリアを検出してブレンドするための効率的なフレームワークを提供する。
【0006】
レターボックスやピラーボックスのような矩形エリアしか扱えない既存の方法と比較して、本開示の方法は、レターボックス、ピラーボックス、楕円その他の形状などの、任意の形状のパディングされた暗色、単色、カラー、または白色のエリアを有する任意の画像に適用することができる。さらに、本開示の方法は、テキスト、ロゴ、およびクローズキャプションを含む周辺エリアにも適用可能である。以下により詳細に説明されるように、本開示の方法は、そのようなテキスト、ロゴ、およびクローズキャプションを周辺エリアから除外する。
【0007】
説明される方法は、圧縮アーティファクトおよびノイズの可能性がある画像内の周辺エリアを検出し、次にブレンディングを実行することによって、画像フィルタリング処理に対する周辺エリアの影響を最小化する。
【0008】
本発明の一実施形態は、画像中の周辺エリアを検出する方法であって、前記画像の境界エリアのヒストグラムを計算することと、前記ヒストグラムのピークおよび幅を求めることと、前記ヒストグラムのピークおよび幅に基づき、前記画像中の周辺エリアの存在を分類することにより、ピーク検出スコアを生成することと、前記画像の前記境界エリアにおける最小の可能な周辺エリア上のピークに属する画素の比率に基づいて、前記画像中の前記周辺エリアの存在を分類することにより、境界検出スコアを生成することと、前記ピークと前記境界検出スコアとの組み合わせに基づいて、合計スコアを生成することと、前記合計スコアに基づいて前記周辺エリアの存在を検出することと、を含む、方法である。
【0009】
いくつかの実施形態では、方法はコンピュータで実装され得る。例えば、本方法は、1つまたは複数のプロセッサおよび1つまたは複数の非一時的記憶媒体を含む制御システムを介して、少なくとも部分的に実装され得る。
【0010】
本明細書に記載する方法の一部または全ては、1つ以上の非一時的媒体上に格納される命令(例えばソフトウェア)に従って1つまたは複数のデバイスが実施することができる。そのような非一時的媒体は、本明細書に記載のものなどのメモリデバイスを含むことができ、ランダムアクセスメモリ(RAM)デバイス、リードオンリーメモリ(ROM)デバイスなどを含むがこれに限定されない。したがって、本開示で説明する主題のいくつかの革新的な態様を、ソフトウェアを格納した非一時的媒体に実装することができる。ソフトウェアは例えば、本明細書に記載するようなものなどの、制御システムの1つまたは複数の構成要素によって実行可能であってよい。例えば、上記ソフトウェアは、本明細書に記載する方法の1つ以上を実行するための命令を含み得る。
【0011】
本開示の少なくともいくつかの態様は、装置(単数または複数)によって実装され得る。例えば、1つまたは複数のデバイスが、本明細書において開示される方法を少なくとも部分的に実行するように構成され得る。いくつかの様態では、装置は、インターフェースシステムと制御システムとを含んでいてもよい。インターフェースシステムは、1つ以上のネットワークインターフェース、制御システムとメモリシステムとの間の1つ以上のインターフェース、制御システムと別のデバイスとの間の1つ以上のインターフェースおよび/または1つ以上の外部デバイスインターフェースを含み得る。制御システムは、1つ以上の汎用のシングルチップもしくはマルチチッププロセッサ、デジタルシグナルプロセッサ(DSP)、特定用途向け集積回路(ASIC)、フィールドプログラマブルゲートアレイ(FPGA)もしくは他のプログラマブルロジックデバイス、ディスクリートゲートもしくはトランジスタロジック、ディスクリートハードウェアコンポーネント、のうち少なくとも1つを含み得る。したがって、いくつかの様態において制御システムは、1つ以上のプロセッサに動作可能に結合された1つ以上のプロセッサおよび1つ以上の非一時的記憶媒体を含み得る。
【0012】
本明細書において記載された主題の1つ以上の様態の詳細は、添付の図面および以下の説明に記載されている。他の特徴、態様および利点は以下の説明、図面および特許請求の範囲から明らかになるであろう。以下の図の相対的な寸法は、縮尺通りに描かれていない場合があることに留意されたい。様々な図面における同様の参照番号および名称は一般に同様の要素を示すが、異なる参照番号は異なる図面間で異なる要素を必ずしも指定しない。
【図面の簡単な説明】
【0013】
図1は、本開示の一実施形態による周辺エリア検出およびブレンディングの例示的なフローチャートを示す。
【0014】
図2は、本開示の一実施形態による周辺エリア検出処理の例示的なフローチャートを示す。
【0015】
図3は、本開示の一実施形態による周辺エリアヒストグラムを計算するために使用される境界領域を有する例示的な画像を示す。
【0016】
図4は、本開示の一実施形態に従って計算された画像の境界エリアの例示的なヒストグラムを示す。
【0017】
図5は、本開示の一実施形態によるピーク分類器におけるスコア対観測ノイズの線形変動を示す例示的なグラフである。
【0018】
図6は、本開示の一実施形態による境界分類器における画素の比率の関数としてのスコアを示す例示的なグラフである。
【0019】
図7は、本開示の一実施形態による例示的な分類器マージンを示す。
【0020】
図8A~8B、
図9A~9B、および
図10A~10Bは、本開示の一実施形態による周辺エリア検出処理の例示的な性能を示す。
【0021】
図10Cは、不規則形状の周辺エリアを含む画像例を示す。
【0022】
図11は、本開示の一実施形態による周辺エリアブレンディング処理の例示的なフローチャートを示す。
【0023】
図12は、本開示の一実施形態に従って適用される重み付けガウシアンフィルタリング処理の例示的なフローチャートを示す。
【0024】
図13は、本開示の一実施形態に従って適用される距離変換処理を伴うミラーリングの例示的なフローチャートを示す。
【0025】
図14は、本開示の一実施形態による補償/後処理手順の例示的なフローチャートを示す。
【発明を実施するための形態】
【0026】
図1の例示的な実施形態に示すように、開示される方法は、2つの構成要素またはステップ、すなわち周辺エリア検出(10)および周辺エリアブレンディング(10’)を含む。入力画像(11)が与えられると、まず周辺エリアヒストグラム(12)特性が分析される。次に、ソフト判定境界を持つ周辺エリア分類器(13)を用いて、入力画像(11)に周辺エリアが存在する可能性を検出する。周辺エリアが検出された場合、例えばガウシアンカーネルを用いて周辺エリアの画素値がモデル化され(14)、出力として周辺エリア確率マップ(15)が生成される。
【0027】
ステップ(10’)では、周辺エリア付近のフィルタリングアーティファクトを回避するために、入力画像(11)と生成された周辺エリア確率マップ(15)との組み合わせに基づいて、周辺エリアがステップ(16)に示すようにブレンドされる。本開示の一実施形態によれば、フィルタリング処理(17)は、任意の種類の画像フィルタリングであってよい(例えば、"Adaptive Local Reshaping For SDR-To-HDR Up-Conversion"についての本開示の出願人によって2020年10月2日に出願され、その全体が本願に援用される米国仮出願第63/086,699号)に記載されたエッジ保存フィルタリング)。フィルタリング(17)の後、ステップ(18)に示すように、初期フィルタ画像における以前にブレンドされた周辺エリアは、元の入力画像(11)と一致するように補償される。最後に、補償フィルタ画像は、フィルタリング出力に基づく局所的再構成その他の処理などのさらなる処理(19)に送られる。以下では、周辺エリア検出(10)およびブレンディング(10’)の例示的な実施形態についてより詳細に説明する。
【0028】
A.周辺エリア検出
図2は、本開示の一実施形態による周辺エリア検出処理の例示的な図である。ステップ(20)に示すように、入力画像(21)が与えられると、まず画像(21)の境界領域のヒストグラム(22)が計算され、続いてヒストグラム(23)のピークの計算と計算されたピークの幅の計算とが行われる。次のステップ(20’)の一部として、ピーク分類器(24)が用いられ、ピークの特性に基づき、その画像が周辺エリアを有するか否かが分類される。さらに、ステップ(20’)の追加部分として、境界分類器(25)も用いられ、画像境界の特性に基づいて、入力画像(21)内に周辺エリアが存在する可能性を判定する。ステップ(2425)の結果が統合され、それらの結果に基づいて合計スコア(26)が求められる。周辺エリアが検出された場合、周辺エリアの画素値は、続く周辺エリアモデリングステップ(20”)において、例えばガウシアンカーネル(27)を用いてモデル化される。ガウシアンカーネル(27)によって、周辺エリア確率マップ(28)が出力として生成される。以下では、
図2のダイアグラムの要素をより詳細に説明する。
【0029】
A.1.周辺エリアヒストグラム
本開示の一実施形態によれば、周辺エリアについて2つの仮定がなされ得る:1)画像内の周辺エリアは、ノイズを含む一定の画素値を有し、2)周辺エリアは画像の境界に「張り付いている(stuck)」。これらの2つの仮定に基づき、周辺エリアが存在する場合、画像の境界領域のヒストグラムにピークが存在することが予想される。
【0030】
以下では、入力画像とそのYチャンネルをそれぞれSおよびS
Yと表す。説明のために、
図3は、周辺エリアヒストグラムを計算するために用いられる境界領域(31)を有する例示的な画像(30)を示している。画像の幅と高さをそれぞれWとHと表す。効率化のため、本開示の全体を通して、例示的な実施形態では、開示される検出フレームワークにおいてYチャンネルのみを考慮し、本開示の全体を通して入力画像のYチャンネルを入力画像と呼ぶが、他の実施形態では、他のチャンネル(例えばクロマ)も入力として使用され得る。
【0031】
引き続き
図3を参照すると、境界領域(31)は、最上部と最下部のH
L行の間、および最左端と最右端のW
Lの列の間に位置すると定義することができる。経験的に、幅W
Lと高さH
Lは、例えばW
L=round(0.05×W)およびH
L=round(0.05×H)と設定され得る。ヒストグラムは、画素値s
startから始まるビン幅w
binのN
B個のビンを有すると考えられる。周辺エリアはより暗い画素値を有し得るため、完全な輝度範囲についてヒストグラムを計算する必要はなく、より暗い部分のみについて計算すればよい。一例として、0から1023の画素値範囲を有する10ビット入力画像について、種々のパラメータを、s
start=0、w
bin=1およびN
B=128のように設定してもよい。s
startはヒストグラムが開始する画素値であり、N
Bはヒストグラム中のビン数であり、そしてw
binは各ビンの幅である。
【0032】
以下の表は、本開示の教示に従って画像の境界領域のヒストグラムがどのように計算されるかの例を示す。
【表1】
【0033】
境界領域のヒストグラムが計算されると、ヒストグラムの中で最も高いピークとその幅が、潜在的な周辺エリア画素値として計算される。ピークは最大値を有する最左端の連続するビンとして定義され、幅はヒストグラム値が最大値に対する比率r
peakに低下するピークの両側におけるビンによって定義される。例としてr
peakは、r
peak=exp(-0.5)≒0.6065として設定され得る。これにより、ピークがガウス分布に近い場合、ピークの幅の半分が標準偏差に近くなる。
図4は、例示的なヒストグラムおよびピークを示す。b
MLおよびb
MRは、ピークの連続する最大値を定義する最左端および最右端のビンである。b
SLおよびb
SRは、ピークの幅を定義する最左端および最右端のビンである。オプションとして、画像ノイズがまばらすぎる場合は、ヒストグラムに対して何らかの平滑化(例えばガウシアンカーネルによる畳み込み)を行ってもよい。次の表は、ヒストグラム中のピークがどのように計算されるかの例を示している。
【表2】
【0034】
A.2.周辺エリア分類器
以下では、「分類器」(classifier)という用語は、ヒストグラムの特徴を取り込んで、周辺エリアが存在するか否かを示すスコアを予測するモジュールを指す。ゼロよりも大きいスコアは周辺エリアがあることを意味し、ゼロ以下のスコアは周辺エリアがないことを意味する。
【0035】
前節で説明した内容を考慮し、ヒストグラム中の潜在的なピークが発見されたものとして、次のステップは、そのようなピークが周辺エリアによるものであるかを示すことであり得る。このようなステップを実行するために、本開示の教示による2つの分類器を定義することができる。すなわち、1)ピーク分類器、2)境界分類器である。後述するように、精度を向上させるため、これらの分類器からの出力結果を組み合わせることができる。
【0036】
A.2.1.ピーク分類器
一実施形態では、ピーク分類器はピークの幅に基づいて周辺エリアを予測する。理想的には、ノイズがないシナリオでは、ピークの幅は0、すなわちb
SR=b
SLであるべきである。しかし、現実的な条件では、画像に圧縮アーティファクトやその他のノイズが存在する可能性がある。ノイズは、例えば、標準偏差σ
noiseを有する加法的なホワイトガウシアンノイズであり得る。その場合、画像に周辺エリアがある場合、ピークの幅の半分はσ
noiseに近いはずである。このように、観測ノイズ(ピークの幅の半分)Δb
peak=(b
SR-b
SL)/2が与えられると、ピーク特性の検出スコアは、例えば次式(1)に示すような区分的線形関数を用いて定義することができる。スコアs
peakが大きいほど、周辺エリアが存在する可能性が高い。
【数1】
【0037】
式(1)において、θ
peakはピーク特性の判定閾値である。θ
peak,posおよびθ
peak,negは、それぞれピーク特性のプラス側およびマイナス側にマージンを追加した判定閾値である。さらに、θ
peak,pos<θ
peak<θ
peak,negである。式1より、Δb
peak<θ
peakのとき、スコアは徐々に増加し、Δb
peak=θ
peak,posにおいて1になることがわかる。一方Δb
peak≧θ
peakのとき、スコアは徐々に減少し、Δb
peak=θ
peak,negにおいて-1になる。
図5は、Δb
peakの関数としてのs
peakを示す例示的なグラフ(500)である。ここで、-∞<s
peak<∞であるが、後で最終的な合計スコアにおいては[-1,1]にクリッピングされ得る。判定閾値のデフォルト値は、例えば、θ
peak=1.5σ
noise、θ
peak,pos=σ
noise、およびθ
peak,neg=2σ
noiseのように定義することができる。さらに、デフォルトノイズは、例えば、10ビット入力画像に対してレベルσ
noise=2として定義することができるが、予想されるノイズが既知である場合には、ユーザによって調整されてもよい。入力画像にノイズがないことがわかっている場合は、σ
noiseを0に近い非常に小さな数値に設定してもよい。
【0038】
A.2.2.境界分類器
境界分類器の機能は、境界特性に基づいて周辺エリアを予測することである。画像境界上のより多くの画素がピークに属するほど、そのピークは周辺エリアに由来するものである可能性が高くなる。従って、周辺エリアの最小の幅および高さW
L,min、H
L,minがあらかじめ定義されれば、画像の4つの境界(上、下、左、右)において、最小の可能な周辺エリア上のピークに属する画素の比率を求めることができる。一実施形態では、周辺エリアはいずれの境界にもあり得るため、4つの境界からの最大比率が考慮される。経験的に、周辺エリアの最小の幅および高さは、例えば、W
L,min=round(0.01×W)およびH
L,min=round(0.01×H)のように設定され得る。以下の表は、最小の可能な周辺エリア上のピークに属する画素の比率r
boundaryを計算する方法の一例である。
【表3】
【0039】
上の表を参照すると、比率r
boundaryが高いほど、そのピークが周辺エリアに由来する可能性が高い。したがって、境界特性の検出スコアは、例えば以下の式2に示す区分的線形関数を用いて定義され得る。スコアが大きいほど、周辺エリアが存在する可能性が高い。
【数2】
式2において、θ
boundaryは境界特性の判定閾値である。θ
boundary,posおよびθ
boundary,negは、それぞれ境界特性のプラス側およびマイナス側にマージンを追加した判定閾値である。さらにθ
boundary,pos>θ
boundary>θ
boundary,negである。式(2)より、r
boundary≧θ
boundaryのとき、スコアは徐々に増加し、r
boundary=θ
boundary,posにおいて1になることがわかる。一方r
boundary<θ
boundaryのとき、スコアは徐々に減少し、r
boundary=θ
boundary,negにおいて-1になる。
図6は、s
boundaryをr
boundaryの関数として示すグラフ(600)を表す。ここで、-∞<s
boundary<∞であるが、後で最終的な合計スコアにおいてはs
boundaryが[-1,1]にクリッピングされ得る。一実施形態では、判定閾値のデフォルト値は、例えばθ
boundary=0.5、θ
boundary,pos=0.75、およびθ
boundary,neg=0.25のように設定され得る。
【0040】
A.2.3合計検出スコア
合計検出スコアを計算するために、前節の2つの弱い分類器は組み合わせられ、ソフトな分類マージンを有するより正確な分類器が得られる。周辺エリアは、上記の両分類器における基準を満たし得る。一実施形態では、以下の式3に示すように、合計検出スコアとしての最小スコアが、合計スコア計算のために考慮される。
【数3】
つまり、両分類器が高いスコアを予測した場合、周辺エリアがあると宣言される。スコアが大きいほど、周辺エリアがある可能性が高く、逆もまた同様である。
図7は、組み合わせ分類器およびソフト分類マージンを示す。図示されるように、領域(71、72、73、74)は、それぞれS
total=1、0<S
total<1、-1<S
total<0、およびS
total=-1である領域に対応する。
【0041】
A.3.周辺エリアモデリング
図7を参照する。前節で開示したことの結果より、もし合計検出スコアS
total>0である場合、ピーク特性b
ML、b
MR、b
SL、b
SRを有する周辺エリアが存在すると結論づけることができる。ピークは、例えばガウシアンカーネルを用いてモデル化されてもよく、これにより周辺エリアを滑らかな周辺エリアマスクとして表現することができる。一実施形態では、ピークの左右において2つのガウシアンカーネルが使用される。さらに、以下の式4に示すように、このような両側のガウシアンカーネルの平均値は、ピークの最大値間の中心として定義される。
【数4】
式5a、5bにそれぞれ示す左側および右側の標準偏差は、ピークの中心から幅までとして定義される。数値の安定のため、最小値は0.5にクリッピングしてもよい。
【数5】
以下の式6に示すように、確率はスケーリングされた区分的ガウシアンカーネルを使ってモデル化される:
【数6】
上記式6で算出された確率が逆投影される(back-projected)ことで、周辺エリア確率マップが得られる。以下の表は、周辺エリア確率マップのための逆投影処理がどのように行われるかの一例を示している。
【表4】
【0042】
以下では、矩形および楕円形の周辺エリアの場合、ならびにテキストを含む周辺エリアの場合における、開示された方法の性能を示すいくつかの例示的な結果を示す。
【0043】
図8Aは、周辺エリア(81)と矩形形状の主エリア(82)とを含む画像の例である。
図8Bは、上で開示された周辺エリア検出処理を適用した後の結果を示している。結果として検出された周辺エリア(81’)および主エリア(82’)が分かる。
【0044】
図9Aは、周辺エリア(91)と楕円形状の主エリア(92)とを含む画像の例である。
図9Bは、上で開示された周辺エリア検出処理を適用した後の結果を示している。結果として検出された周辺エリア(91’)および主エリア(92’)も示されている。
【0045】
図10Aは、周辺エリア(101)と矩形形状を有する主エリア(102)とを含む画像の例を示す。周辺エリア(101)には、テキスト(103)も含まれている。テキストは、例えば、クローズキャプション、識別情報、ロゴなどであり得る。
図10Bは、上で開示された周辺エリア検出処理を適用した後の結果を示している。結果として検出された周辺エリア(101’)、主エリア(102’)、およびテキスト(103’)が、テキスト/ロゴ(103’)を含まない周辺エリア(101’)の領域を識別する確率マップとともに示されている。
【0046】
図10Cは、周辺エリア(1010)と主エリア(1020)とを含む画像の例である。周辺エリア(1010)が任意の不規則形状を有していることが分かる。上述した方法は、
図10Cの画像例にも同様に適用可能である。
【0047】
本開示の実施形態によれば、合計検出スコアStotal≦0の場合、周辺エリアは存在しないと結論づけられ、周辺エリア確率マップMLは0で埋められ得る。
【0048】
B.周辺エリアブレンディング
上述の周辺エリア確率マップの推定によれば、周辺エリア近傍のフィルタリングアーティファクトが、米国仮出願第63/086,699号(その全体が本願に援用される)に記載されているエッジ保存フィルタなどの画像フィルタリング処理において周辺エリアを回避することによって低減され得る。フィルタリングアーティファクトは、主に、画像内容(content)エリアと周辺エリアとの間の画素値の傾向の不一致に起因する。本開示の教示に従ってフィルタリングアーティファクトを低減する効率的な方法は、周辺エリアを近傍の画像内容とブレンドすることである。この場合、画像内容エリアと周辺エリアとの間の不一致はほとんどないため、フィルタリングアーティファクトが低減される。別の見方をすれば、このアプローチは、周辺エリアに欠落した画像内容を塗り直すことに似ている。フィルタリング中において欠落した画像内容を画像フィルタが見ることができれば、フィルタリングアーティファクトは最小になる。フィルタリング境界を処理する一般的な方法として、境界画素の繰り返し、ミラーリング、周期的パディングなどがあるが、これらは矩形の画像内容に対するものであり、任意の形状を有する周辺エリアの境界を処理することはできない。
【0049】
図11は、本開示の一実施形態による、前処理/ブレンディングステップ(1110)および後処理/補償ステップ(1120)を含む、周辺エリアブレンディング処理の例示的なフローチャートを示す。先に開示したように入力画像(1101)および検出された周辺エリア確率マップ(1102)が与えられると、ステップ(1103)において、周辺エリアが画像の主エリアとブレンドされ、ブレンド画像(1104)が生成される。ブレンディングステップ(1103)は、例えば、1)重み付けガウシアンフィルタリング、または2)距離変換を伴うミラーリングを実施することができる。ブレンド画像(1104)は、次にフィルタリング処理(1105)に送られる。フィルタリング処理(1105)はオプショナルなステップであり、米国仮出願第63/086,699号(その全体を本願に援用する)のエッジ保存フィルタなど、任意のフィルタリング処理から構成され得る。フィルタリング(1105)の後、元の周辺エリアを回復する必要がある。したがって、初期フィルタ画像(1106)は、周辺エリアの画素値が元の入力画像(1101)と同じになるように補償される。その結果、補償画像(1107)が生成され、これは、オプションとしてさらなる処理(1108)を経ることができる。さらなる処理(1108)の例は、例えば、米国仮出願第63/086,699号に記載されているような局所的再構成である。以下では、
図11に示すブレンディング処理の種々の要素をより詳細に説明する。
【0050】
B.1.重み付けガウシアンフィルタリング
前述のように、ブレンディングの例示的な方法は、重み付けガウシアンフィルタリングを使用することである。
図12は、重み付けガウシアンフィルタリング処理の例示的なフローチャートを示す。ここでの目的は、周辺エリアを近傍の画像内容で満たすことである。従って、ブレンディング重み(1208)Qは、以下の式7に示すように定義される:
【数7】
ここでM
Lは周辺エリア確率マップ(1207)を表す。ある画素が周辺エリアに属する確率が大きいほど、重みおよびブレンディングへの寄与は小さくなり、逆もまた同様である。演算子(1220、1230)、すなわち.*および./は、それぞれ要素毎の乗算と除算である。入力画像(1201)が与えられ、ブレンディング重み(1208)を適用することにより、重み付け画像(1202)、すなわち
が得られる。ここで
は[0,1]スケールで正規化された入力画像
(
)
を表し、B
Sは入力画像のビット深度である。重み付け画像(1202)にガウシアンフィルタリング(1203)を適用した後、ステップ(1204)に示すように、フィルタ化重み付け画像(filtered weighted image)、すなわち
が得られる。ここで
は標準偏差σ
blendを有するガウシアンフィルタリングを表す。さらに、ブレンディング重みQにもガウシアンフィルタリング(1203’)を適用することによって、フィルタ化重み(1210)である
が得られる。フィルタ化重み付けSDR(1204)とフィルタ化重み(1210)との組み合わせに要素毎の除算演算子(1230)を適用した後、重み付けフィルタ画像(1205)、すなわち
が得られる。上述の処理は、式(8)として示される以下の数式によって要約することができる。
【数8】
経験的に、σ
blendは、例えば、局所的再構成のための次のフィルタリング処理で使用される最大フィルタリングカーネルサイズとなるように選択され得る。さらに、0による除算を避けるために、
が0である画素位置においては
は
に等しく設定してもよい。
が常に正となるように、Qの最小値は、非常に小さい数(例えば10
-6)にクリップされてもよい。近似的ガウシアンフィルタの実装の詳細は、例えば、上述の米国仮出願第63/086,699号に記載されている。
【0051】
図12をさらに参照すると、重み付けガウシアンフィルタリングの後、
中の周辺エリアは、近傍の画像内容によって埋められる。ただし、画像内容エリアもフィルタリングされる。これは、不連続性を除去することのみが望まれ、画像内容を変更することは望まれないため、望ましくない可能性がある。したがって、入力画像(1201)、ブレンディング重み(1208)、および重み付けフィルタ画像(1205)に基づいて最終的なブレンド画像(1206)を得るために、以下の式9に示すように重み付け加算が実施され得る。
【数9】
結果として、画像の内容がブレンド画像(1206)に保持される。
【0052】
B.2距離変換を伴うミラーリング
前述のように、周辺エリアブレンディングの別の例示的な方法は、距離変換を伴うミラーリングを使用することである。このような方法を示すフローチャートを
図13に示す。本開示の教示によれば、近傍の画像内容をミラーリングすることによって、周辺エリアを埋めることができる。周辺エリア確率マップに基づいて(1302)、周辺エリアマスクに対する閾値処理が実行され、二値画像内容マスクが得られる。次に、小さいノイズを除去するために、モルフォロジー平滑化処理(1303)が適用される。これは以下の式(10)で表される。
【数10】
閾値θ
Mは、たとえばθ
M=exp(-0.5)≒0.6065のように設定される。関数1(x)は条件xが真ならば1、条件xが偽ならば0である。演算子M
open,seおよびM
close,seは、それぞれ、構造化要素(structuring element)seについてのモルフォロジー的開閉である。seに対し、矩形のサイズの構造化要素、例えば、5×5を用いることにする。二値画像内容マスク
の距離変換(1304)が次に計算され得る。距離変換(1304)は、各画素から二値画像内の最も近い非ゼロ画素までの距離を求める(その全体を本願に援用する参考文献[2]も参照)使用される距離尺度は、例えば、L
1距離(都市ブロック距離またはマンハッタン距離とも呼ばれる)であってよい。
【0053】
引き続き
図13のフローチャートを参照する。周辺エリア内の各画素に最も近い画像内容エリア中の画素は既知である(前述した参考文献[2]も参照)。次に、最も近い画素を原点として使用して、周辺エリアの画素を画像内容とブレンドするための点反射を実行することができる。最も近い画素のx-およびy-インデックスマップ(1305)をI
xおよびI
yと表すと、ブレンド画像(1306)は以下の式11のように得られる。
【数11】
さらに、点反射後の画素位置が画像エリア外にある場合は、代わりに画像境界上の最も近い画素が選択される。下の表は、距離変換を伴うミラーリングの実行方法の例である。
【表5】
がすべて0の場合、距離変換は計算されず、ブレンド画像は単純に
のように設定される。
【0054】
(周辺エリア補償)
式11を参照する。一実施形態では、ブレンド画像
は、フィルタリングアーティファクトを回避し、初期フィルタ画像を得るために、画像フィルタリング処理に送られ得る。これは以下の式12で表される。
【数12】
演算子IF(.)は、参考文献[1]のエッジ保存フィルタなど、任意の画像フィルタリング演算であり得る。
はフィルタリング演算後の結果を表し、以下ではこれを初期フィルタ画像と呼ぶ。ブレンドされた(前処理された)画像には、元の入力画像にはない余分な画像内容が周辺エリアに含まれており、初期フィルタ画像も同様であるため、局所的再構成[1]などのさらなる処理に送る前に、補償(後処理)する必要がある。
図14は、そのような補償/後処理手順の一例のフローチャートである。初期フィルタ画像(1402)
、初期入力画像(1401)
、および周辺エリア確率マップ(1403)M
Lに基づいて、補償フィルタ画像(1404)
が、以下の式13に示すように計算される:
【数13】
周辺エリア中の画素についてM
Lは1に近く、
は
に近くなる。言い換えれば、以前にブレンドされた周辺エリアは補償され、元の入力画像と同じになり、局所的再構成のような更なる処理への準備が整う。
【0055】
上述の開示された実施形態では、説明のためにYチャンネルのヒストグラムが、ルマによって区別され得る周辺エリアのために用いられている。いくつかの実施形態(例えば、ルマが十分でない場合)では、Yチャンネルのヒストグラムに基づいて開示された方法と同じ方法でUチャンネルおよびVチャンネルのヒストグラムが分類のためにさらに用いられ得る。さらに、Y、U、Vチャンネルの分類結果を組み合わせて、改善された結果を得ることもできる。一例として、Y、UおよびVによって検出された周辺エリアを統合したものを全体の検出された周辺エリアとみなしてもよい。
【0056】
本開示の数々の実施形態を記載した。しかし、本開示の趣旨および範囲から離れることなく様々な改変を成し得ることが理解されるであろう。従って、他の実施形態が、以下に続く請求項の範囲に含まれる。
【0057】
本開示は、本明細書に記載したいくつかの革新的な態様、およびこれらの革新的な態様が実施され得る文脈の例を説明する目的で、特定の様態に向けられている。しかしながら、本明細書における教示は、様々な異なる方法で適用することができる。さらに、説明される実施形態は、様々なハードウェア、ソフトウェア、ファームウェア等で実装され得る。例えば、本願の態様は、装置、複数のデバイスを含むシステム、方法、コンピュータプログラム製品等において、少なくとも部分的に具現化され得る。したがって、本願の態様は、ハードウェアの実施形態、ソフトウェアの実施形態(ファームウェア、常駐ソフトウェア、マイクロコードなどを含む)、および/またはソフトウェアとハードウェアの両方の態様を組み合わせた実施形態の形をとることができる。そのような実施形態は、本明細書では、「回路」、「モジュール」、「デバイス」、「装置」または「エンジン」と呼ばれることがある。本出願のいくつかの態様は、その上に具現化されたコンピュータ読み取り可能なプログラムコードを有する1つ以上の非一時的媒体に具現化されたコンピュータプログラム製品の形をとることができる。このような非一時的媒体としては、例えば、ハードディスク、ランダムアクセスメモリ(RAM)、リードオンリーメモリ(ROM)、消去可能プログラマブルリードオンリーメモリ(EPROMまたはフラッシュメモリ)、ポータブルコンパクトディスクリードオンリーメモリ(CD-ROM)、光学記憶装置、磁気記憶装置、またはこれらの任意の適切な組み合わせが挙げられる。従って、本開示の教示は、図に示され、および/または本明細書に記載される様態に限定されることを意図するものではなく、広い適用性を有する。
【0058】
上記に提示した例は、当該分野に通常の熟練を有する当業者に対し、本開示の実施形態を作成して使用する方法を完全に開示かつ説明するものとして提供されているのであって、発明者/発明者らが自らの開示であると考えるものの範囲を限定するようには意図されていない。
【0059】
本明細書中に開示された方法およびシステムを実行するための上記の態様に対する改変であって当該分野の当業者にとって明らかなものは、以下に続く請求項の範囲に含まれるものとして意図されている。本明細書において言及された全ての特許および公開は、本開示が関する当該分野の当業者の技術レベルを示す。本開示に引用された全ての文献は、各文献が個別にその全ての開示内容を援用されている場合と同程度に、援用される。
【0060】
本開示は、特定の方法またはシステムには限定されず、もちろん変化し得ることを理解されたい。また、本明細書で用いられる用語は、特定の実施形態を記載する目的のためだけのものであり、限定するようには意図されていないことも理解されたい。本明細書および添付の請求項において用いるとき、単数形の「a」、「an」、および「the」は、内容によって明らかにそうでないと決まらない限り、複数の指示対象を含む。「複数(plurality)」という用語は、内容によって明らかにそうでないと決まらない限り、2つ以上の指示対象を含む。別の定義がない限り、本明細書で用いられる全ての技術的および科学的な用語は、本開示が関連する当該技術の当業者によって一般に理解されるものと同一の意味を有する。
(参考文献)
[1] William M. Wells, "Efficient Synthesis of Gaussian Filters by Cascaded Uniform Filters," IEEE Transactions on Pattern Analysis and Machine Intelligence, vol.8, no.2, pp.234-239, 1986.
[2] Maurer, Calvin, Rensheng Qi, and Vijay Raghavan, "A Linear Time Algorithm for Computing Exact Euclidean Distance Transforms of Binary Images in Arbitrary Dimensions," IEEE Transactions on Pattern Analysis and Machine Intelligence, vol.25, no.2, pp.265-270, 2003.
【手続補正書】
【提出日】2024-02-13
【手続補正1】
【補正対象書類名】特許請求の範囲
【補正対象項目名】全文
【補正方法】変更
【補正の内容】
【特許請求の範囲】
【請求項1】
画像中の
非アクティブエリアを検出する方法であって、
前記画像の
境界に位置する予め定められたエリアのヒストグラムを計算することと、
前記ヒストグラムのピークおよび
前記ピークの幅を求めることと、
前記ヒストグラムのピークおよび
前記ピークの幅に基づき、前記画像中の
非アクティブエリアの存在を分類することにより、ピーク検出スコアを生成することと、
前記画像の前記境界
に位置する前記予め定められたエリアにおける
予め定められた最小の可能な
非アクティブエリア上のピークに属する画素の比率に基づいて、前記画像中の前記
非アクティブエリアの存在を分類することにより、境界検出スコアを生成することと、
前記ピーク
検出スコアと前記境界検出スコアとの組み合わせに基づいて、
トータルスコアを生成することと、
前記
トータルスコアに基づいて前記
非アクティブエリアの存在を検出することと、
を含む方法。
【請求項2】
前記
非アクティブエリアを
非アクティブエリアマスクとして表す平滑化フィルタを用いて、前記ヒストグラムの前記ピークをモデル化することをさらに含む、請求項1に記載の方法。
【請求項3】
前記平滑化フィルタはガウシアンカーネルを含む、請求項2に記載の方法。
【請求項4】
前記
非アクティブエリアマスクに基づいて
非アクティブエリア確率マップを生成することをさらに含
み、
前記非アクティブエリア確率マップは、前記画像中の全ての画素について、前記画像の画素が前記非アクティブエリアに属する確率を与える、
請求項2または3のいずれかに記載の方法。
【請求項5】
前記
非アクティブエリア確率マップを生成することは、
スケーリングされた区分的ガウシアンカーネルを用いて確率を計算することと、
前記確率を逆投影して前記
非アクティブエリア確率マップを生成することと、
を含む、請求項4に記載の方法。
【請求項6】
前記
非アクティブエリア確率マップに基づき、前記
非アクティブエリアと前記画像の主要な対象とをブレンドすることをさらに含む、請求項4または5のいずれかに記載の方法。
【請求項7】
前記ブレンドすることは重み付けガウシアンフィルタリングを用いて行われる、請求項6に記載の方法。
【請求項8】
前記
非アクティブエリア確率マップに基づいてブレンディング重みを計算することと、
前記画像および前記ブレンディング重みに基づいて重み付け画像を生成することと、
をさらに含む、請求項7に記載の方法。
【請求項9】
前記ブレンディング重みをガウシアンフィルタリングすることによりフィルタ化重みを生成することと、
前記重み付け画像をガウシアンフィルタリングすることによりフィルタ化重み付け画像を生成することと、
前記フィルタ化重み付け画像および前記フィルタ化重みに基づいて、重み付けフィルタ画像を生成することと、
をさらに含む、請求項8に記載の方法。
【請求項10】
前記画像と前記重み付けフィルタ画像との重み付け加算を用いて、
ブレンド画像を生成することをさらに含む、請求項9に記載の方法。
【請求項11】
前記ブレンドすることは、距離変換を伴うミラーリングを用いて行われる、請求項6に記載の方法。
【請求項12】
前記ミラーリングは、
前記
非アクティブエリアマスクに閾値処理を行うことにより、二値画像内容マスクを生成することと、
前記二値画像内容マスクにモルフォロジー平滑化を適用することと、
前記二値画像内容マスクの距離変換を計算することと、
前記距離変換を用いて、前記
非アクティブエリア内の各画素について、前記各画素に最も近い画像内容エリア中の画素群を特定することと、
最も近い画素群のインデックスマップを生成することと、
前記画像および前記最も近い画素群のインデックスマップを用いて、ブレンド画像を生成することと、
を含む、請求項11に記載の方法。
【請求項13】
前記ブレンド画像をフィルタリングすることにより、フィルタリングされたブレンド画像を生成することをさらに含む、請求項12に記載の方法。
【請求項14】
前記フィルタリングは、エッジ保存フィルタリングを含む、請求項13に記載の方法。
【請求項15】
前記画像と前記フィルタリングされたブレンド画像との重み付け加算を行うことをさらに含む、請求項
13に記載の方法。
【請求項16】
前記重み付け加算は、前記
非アクティブエリア確率マップに基づいて行われる、請求項15に記載の方法。
【請求項17】
前記画像は、アクティブエリアおよび前記非アクティブエリアを含み、
検出された前記非アクティブエリアは、一定の画素値およびノイズを有するエリアであり、前記画像の境界に位置しており、
前記非アクティブエリアは前記画像の静的なエリアである、
請求項1から16のいずれかに記載の方法。
【請求項18】
前記予め定められたエリアは、前記画像の最上部(HL)の行の間および最下部(HL)の行の間、および/または、前記画像の最左部(WL)の列の間および最右部(WL)の列の間に位置する、請求項1から17のいずれかに記載の方法。
【請求項19】
前記画像中の前記非アクティブエリアの存在を分類することにより前記境界検出スコアを生成することは、前記予め定められたエリアにおける最小の可能な非アクティブエリア上のピークに属する画素の最大比率に基づく、請求項1から18のいずれかに記載の方法。
【請求項20】
前記ピーク検出スコアおよび前記境界検出スコアは、前記非アクティブエリアの存在の可能性が高いほど高い、請求項1から19のいずれかに記載の方法。
【請求項21】
前記トータルスコアは、前記ピーク検出スコアと前記境界検出スコアとの最小値に基づく、請求項1から20のいずれかに記載の方法。
【請求項22】
前記ピークの幅は、前記ヒストグラムの値が前記ヒストグラムの最大値のある比率に低下する前記ピークの両側におけるビンによって定義される、請求項1から21のいずれかに記載の方法。
【請求項23】
コンピュータによって実行されたときに前記コンピュータに請求項1から22のいずれかに記載の方法を実行させる命令を含むコンピュータプログラム。
【手続補正2】
【補正対象書類名】明細書
【補正対象項目名】0008
【補正方法】変更
【補正の内容】
【0008】
本発明の一実施形態は、画像中の周辺エリアを検出する方法であって、前記画像の境界エリアのヒストグラムを計算することと、前記ヒストグラムのピークおよび幅を求めることと、前記ヒストグラムのピークおよび幅に基づき、前記画像中の周辺エリアの存在を分類することにより、ピーク検出スコアを生成することと、前記画像の前記境界エリアにおける最小の可能な周辺エリア上のピークに属する画素の比率に基づいて、前記画像中の前記周辺エリアの存在を分類することにより、境界検出スコアを生成することと、前記ピークと前記境界検出スコアとの組み合わせに基づいて、トータルスコアを生成することと、前記トータルスコアに基づいて前記周辺エリアの存在を検出することと、を含む、方法である。
【手続補正3】
【補正対象書類名】明細書
【補正対象項目名】0028
【補正方法】変更
【補正の内容】
【0028】
A.周辺エリア検出
図2は、本開示の一実施形態による周辺エリア検出処理の例示的な図である。ステップ(20)に示すように、入力画像(21)が与えられると、まず画像(21)の境界領域のヒストグラム(22)が計算され、続いてヒストグラム(23)のピークの計算と計算されたピークの幅の計算とが行われる。次のステップ(20’)の一部として、ピーク分類器(24)が用いられ、ピークの特性に基づき、その画像が周辺エリアを有するか否かが分類される。さらに、ステップ(20’)の追加部分として、境界分類器(25)も用いられ、画像境界の特性に基づいて、入力画像(21)内に周辺エリアが存在する可能性を判定する。ステップ(24
、25)の結果が統合され、それらの結果に基づいて
トータルスコア(26)が求められる。周辺エリアが検出された場合、周辺エリアの画素値は、続く周辺エリアモデリングステップ(20”)において、例えばガウシアンカーネル(27)を用いてモデル化される。ガウシアンカーネル(27)によって、周辺エリア確率マップ(28)が出力として生成される。以下では、
図2のダイアグラムの要素をより詳細に説明する。
【手続補正4】
【補正対象書類名】明細書
【補正対象項目名】0037
【補正方法】変更
【補正の内容】
【0037】
式(1)において、θ
peakはピーク特性の判定閾値である。θ
peak,posおよびθ
peak,negは、それぞれピーク特性のプラス側およびマイナス側にマージンを追加した判定閾値である。さらに、θ
peak,pos<θ
peak<θ
peak,negである。式1より、Δb
peak<θ
peakのとき、スコアは徐々に増加し、Δb
peak=θ
peak,posにおいて1になることがわかる。一方Δb
peak≧θ
peakのとき、スコアは徐々に減少し、Δb
peak=θ
peak,negにおいて-1になる。
図5は、Δb
peakの関数としてのs
peakを示す例示的なグラフ(500)である。ここで、-∞<s
peak<∞であるが、後で最終的な
トータルスコアにおいては[-1,1]にクリッピングされ得る。判定閾値のデフォルト値は、例えば、θ
peak=1.5σ
noise、θ
peak,pos=σ
noise、およびθ
peak,neg=2σ
noiseのように定義することができる。さらに、デフォルトノイズは、例えば、10ビット入力画像に対してレベルσ
noise=2として定義することができるが、予想されるノイズが既知である場合には、ユーザによって調整されてもよい。入力画像にノイズがないことがわかっている場合は、σ
noiseを0に近い非常に小さな数値に設定してもよい。
【手続補正5】
【補正対象書類名】明細書
【補正対象項目名】0039
【補正方法】変更
【補正の内容】
【0039】
上の表を参照すると、比率r
boundaryが高いほど、そのピークが周辺エリアに由来する可能性が高い。したがって、境界特性の検出スコアは、例えば以下の式2に示す区分的線形関数を用いて定義され得る。スコアが大きいほど、周辺エリアが存在する可能性が高い。
【数2】
式2において、θ
boundaryは境界特性の判定閾値である。θ
boundary,posおよびθ
boundary,negは、それぞれ境界特性のプラス側およびマイナス側にマージンを追加した判定閾値である。さらにθ
boundary,pos>θ
boundary>θ
boundary,negである。式(2)より、r
boundary≧θ
boundaryのとき、スコアは徐々に増加し、r
boundary=θ
boundary,posにおいて1になることがわかる。一方r
boundary<θ
boundaryのとき、スコアは徐々に減少し、r
boundary=θ
boundary,negにおいて-1になる。
図6は、s
boundaryをr
boundaryの関数として示すグラフ(600)を表す。ここで、-∞<s
boundary<∞であるが、後で最終的な
トータルスコアにおいてはs
boundaryが[-1,1]にクリッピングされ得る。一実施形態では、判定閾値のデフォルト値は、例えばθ
boundary=0.5、θ
boundary,pos=0.75、およびθ
boundary,neg=0.25のように設定され得る。
【手続補正6】
【補正対象書類名】明細書
【補正対象項目名】0040
【補正方法】変更
【補正の内容】
【0040】
A.2.3
.トータル検出スコア
トータル検出スコアを計算するために、前節の2つの弱い分類器は組み合わせられ、ソフトな分類マージンを有するより正確な分類器が得られる。周辺エリアは、上記の両分類器における基準を満たし得る。一実施形態では、以下の式3に示すように、
トータル検出スコアとしての最小スコアが、
トータルスコア計算のために考慮される。
【数3】
つまり、両分類器が高いスコアを予測した場合、周辺エリアがあると宣言される。スコアが大きいほど、周辺エリアがある可能性が高く、逆もまた同様である。
図7は、組み合わせ分類器およびソフト分類マージンを示す。図示されるように、領域(71、72、73、74)は、それぞれS
total=1、0<S
total<1、-1<S
total<0、およびS
total=-1である領域に対応する。
【手続補正7】
【補正対象書類名】明細書
【補正対象項目名】0041
【補正方法】変更
【補正の内容】
【0041】
A.3.周辺エリアモデリング
図7を参照する。前節で開示したことの結果より、もし
トータル検出スコアS
total>0である場合、ピーク特性b
ML、b
MR、b
SL、b
SRを有する周辺エリアが存在すると結論づけることができる。ピークは、例えばガウシアンカーネルを用いてモデル化されてもよく、これにより周辺エリアを滑らかな周辺エリアマスクとして表現することができる。一実施形態では、ピークの左右において2つのガウシアンカーネルが使用される。さらに、以下の式4に示すように、このような両側のガウシアンカーネルの平均値は、ピークの最大値間の中心として定義される。
【数4】
式5a、5bにそれぞれ示す左側および右側の標準偏差は、ピークの中心から幅までとして定義される。数値の安定のため、最小値は0.5にクリッピングしてもよい。
【数5】
以下の式6に示すように、確率はスケーリングされた区分的ガウシアンカーネルを使ってモデル化される:
【数6】
上記式6で算出された確率が逆投影される(back-projected)ことで、周辺エリア確率マップが得られる。以下の表は、周辺エリア確率マップのための逆投影処理がどのように行われるかの一例を示している。
【表4】
【手続補正8】
【補正対象書類名】明細書
【補正対象項目名】0047
【補正方法】変更
【補正の内容】
【0047】
本開示の実施形態によれば、トータル検出スコアStotal≦0の場合、周辺エリアは存在しないと結論づけられ、周辺エリア確率マップMLは0で埋められ得る。
【国際調査報告】