【課題を解決するための手段】
【0007】
第1の態様では、被写体の画像品質を評価するための、コンピュータで実施される方法が提供され、上記方法は、
上記画像の2つ以上の部分画像の特徴と上記被写体の包括的なモデルとの類似度を判定するステップにおいて、上記包括的なモデルが同じタイプの複数の異なる被写体の複数の訓練画像(training images)の組み合わせに基づいて決められ、
前記モデルが部分モデルを有し、前記部分モデルの各々が複数の訓練画像からの複数の部分画像からモデル化され、前記部分モデルの各々が前記画像の前記部分画像に対応し、類似度の判定が、各部分画像の特徴とそれに対応する部分モデルによってモデル化された特徴との類似度に基づいて決められるステップと、
上記画像の品質を、上記2つ以上の部分画像の上記判定された類似度に基づいて判定するステップと、を含む。
【0008】
1つの利点は、画像と、同一したがって単一の包括的モデルとの類似度のみから画像品質を判定できるので、品質評価に入力パラメータが必要ない点である。他の利点は、この方法では、被写体の実物の要素(顔の場合は目や鼻など)を検出する必要がない点である。その結果、他の利点は、この方法が、各要素の検出が不可能である低い解像度画像など、低い品質画像の使用に適している点である。
【0009】
1つの利点は、同じタイプの異なる被写体の複数の画像から1つのモデルが構築される点である。その結果、類似度の判定が、実物の参照画像との一連の比較に基づいて行われない。これにより、計算時間が短縮され、リアルタイムの品質判定が可能になる。例えば、この計算時間は、ストリーミング・ビデオの次のフレームとの間の時間よりも短い。計算時間は、この方法のスケーリング(scaling)にとっても重要になる。
【0010】
1つの利点は、部分画像を評価することによって、類似度の判定ごとに考慮する必要があるピクセル数が低減される点である。その結果、メモリの必要量と計算時間が低減される。他の利点は、個々の部分画像の計算を並列化して、現行のマルチコア・コンピュータ・アーキテクチャを最大限に利用できる点である。
【0011】
場合により、上記方法は画像の前処理ステップとして使用され、場合により、判定された画像品質に基づいて追加処理が行われる。1つの利点は、より優れた品質の追加処理用画像の選択に、上記の品質判定を使用することができ、それにより追加処理の精度が向上する点である。
【0012】
場合により、各訓練画像が、品質を決める複数の好ましい特性を有する。他の利点は、新たな好ましい特性を有する訓練画像の異なるセットを使用するだけで、同じ方法を使用して、異なる品質(つまり異なる前処理の目的に適合するように異なる特性セットに基づいて決められた品質)を判定できる点である。
【0013】
場合により、上記好ましい特性は、所定の被写体内移動、所定の回転、所定のスケール、所定の解像度、所定の姿勢、所定の照度であり、上記被写体が顔である場合である。
【0014】
場合により、各部分モデルは平均ベクトルおよび分散行列に基づいて決められ、この平均ベクトルおよび分散行列は、上記部分モデルが基にしている各訓練画像の部分画像の特徴に基づいて決められる。1つの利点は、モデルが2つのパラメータだけに基づいて決められる点である。その結果、類似度を判定する複雑さが低減される。
【0015】
場合により、部分画像の特徴が、上記部分画像のより低い周波数成分のみにほぼ基づいて決められる。場合により、上記モデルが、訓練画像のより低い周波数成分のみにほぼ基づいて決められる。画像の部分画像とモデルとの類似度の判定は、画像の部分画像のより低い周波数成分と上記モデルとの類似度のみに基づいて決めることができる。1つの利点は、より低い周波数成分のみを使用することにより、画像の全成分の使用と比較して複雑さが低減される点である。より低い周波数成分のみを使用することによりまた、より認識に有用な識別的成分ではなく、記述のための生成的(generative)成分に上記方法が絞られる。品質の確実な判定に、少数の成分しか(3つなど)必要ない。さらに、低い周波数成分を使用すると、主として高い周波数帯域にある顔の表情の変化に対する感度が低減される。
【0016】
場合により、特徴がHaar−like特徴、LBPまたはSIFTに基づいて決められる。1つの利点は、上記方法が、所与の状況にいっそう適し得る他の特徴生成方法との併用に柔軟に対応できる点である。
【0017】
場合により、部分画像のより低い周波数成分が、離散コサイン変換に基づいて決められる。
【0018】
場合により、被写体が顔である。
【0019】
場合により、部分モデルによってモデル化された上記特徴が、上記部分モデルが基にしている各訓練画像の部分画像の上記特徴の平均値である。
【0020】
場合により、類似度の判定が、部分モデルが基にしている各訓練画像の部分画像の特徴に基づいて決められる平均値および分散行列に特徴付けられるガウス確率密度関数に基づいて決められる。
【0021】
場合により、類似度の判定が、上記ガウス確率密度関数に基づいて上記画像の上記部分画像の上記特徴の確率を判定するステップを含む。1つの利点は、ガウス確率密度関数が、部分画像の特徴の確率を正確に推定する簡単な方法である点である。他の利点は、ガウス確率密度関数が、異なる訓練画像または他の入力パラメータの変更に合わせて変換する必要がない値を返す点である。したがって、品質の閾値は固定したままにでき、異なる状況に適合させる必要がない。
【0022】
場合により、画像の2つ以上の部分画像とモデルとの類似度を判定するステップが、部分画像ごとに独立して実行される。
【0023】
類似度の判定が、部分画像ごとに1つの類似度基準判定するステップを含み、上記画像品質の判定が、上記2つ以上の部分画像の上記判定された類似度の結合に基づいて決められる。他の利点は、単一の品質スコアが直接判定される点である。その結果、融合法(fusion method)は必要ない。融合法では、例えばコントラストや鮮鋭度、解像度、幾何形状、姿勢、照射角などの異なる画像品質面が異なるアルゴリズムによって別々に測定され、1つの品質スコア生成するために融合される。
【0024】
場合により、全ての部分画像の類似度を結合するステップが、部分画像ごとに独立して確率を判定するステップと、画像の部分画像ごとの確率に基づいて結合確率を判定するステップを含む。1つの利点は、部分画像ごとの確率を独立して判定することによって、これらの確率を単に掛けるだけで結合確率を判定できる点である。この乗算は対数の合計に都合よく変換することができ、その結果、計算の複雑さが低減する。
【0025】
画像の部分画像は、部分モデルが基にしている各訓練画像の部分画像に対応する。典型的には、画像の部分画像は位置合わせされるはず、つまり、その画像内の、対応する部分モデルが基にしている訓練画像の部分画像と同じ位置に、位置合わせされるはずである。画像の部分画像間の空間的関係は、訓練画像の部分画像間の空間的関係と同一である。
【0026】
場合により、上記方法がさらに、対数正規化関数に基づいて画像を正規化するステップを含む。1つの利点は、対数正規化関数によって、より小さい輝度値は増幅され、より大きな輝度値は圧縮され、それによって上記方法の効率が高められる点である。
【0027】
場合により、上記方法がさらに、上記画像の上記判定された品質の指標を出力として提供するステップを含む。場合により、上記方法がさらに、上記画像の上記判定された品質の指標を不揮発性メモリに記憶するステップを含む。
【0028】
場合により、上記方法がさらに、複数の画像のそれぞれの品質を判定するために、上記複数の異なる画像ごとに上記方法を繰り返すステップと、
上記判定された品質に基づいて上記画像の追加処理を実行するステップと、を含む。
【0029】
場合により、追加処理が、より高い品質を有する画像に、より大きな重みを与えるステップを含む。例えば、上記方法は、より高い品質を有する複数の画像のサブセットを識別するステップと、複数の顔画像のサブセットに対して追加処理を実行するステップとを含むことができる。別の例では、追加処理により、より良い品質を有する画像をより強調することができる。
【0030】
他の例では、場合により、所定の数のより良好な品質を有する画像が追加処理のために識別されるように、上記画像がランキングに基づいて決められる。1つの利点は、追加処理が最も機能する画像数を事前に決めることができる点である。
【0031】
場合により、追加処理が、上記の画像のサブセットなどに対して顔認識または顔照合を実行する。1つの利点は、顔認識のために複数の画像の全てではなく、判定された品質に基づいて決められたより少ない数しか考慮する必要がない点である。その結果、低い品質の顔画像によって顔認識の結果が損なわれることはない。さらなる結果として、多数の低い品質の顔画像とほんの少数の高い品質の顔画像からなるセットにおいて、高い品質の顔画像が外れ値として廃棄されることがなくなる。
【0032】
場合により、上記の顔画像のサブセットの選択が、閾値よりも良い品質を有する顔画像のみが選択されるように品質閾値に基づいて決められる。1つの利点は、顔画像を受け取りながら、その画像を追加処理のために使用するか廃棄するかどうか顔画像ごとに独立して決定することができる点である。
【0033】
場合により、画像は、ビデオのフレームなどの一続きの画像からのものである。
【0034】
場合により、上記方法がさらに、フレーム内の被写体を検出し、上述の方法で使用するための画像を形成するために、検出された被写体に基づいてフレームを切り出す(crop)最初のステップを含む。
【0035】
場合により、上記方法がさらに、画像からの2つ以上の部分画像を識別するステップを含む。
【0036】
第2の態様では、コンピュータによって実行されたときに上述の方法を上記コンピュータに実行させる、不揮発性のコンピュータ読み取り可能な媒体上に記録されたソフトウェア、すなわちコンピュータ命令も提供される。
【0037】
第3の態様では、被写体の画像の品質を評価するためのコンピュータが存在し、上記コンピュータは、
同じタイプの複数の異なる被写体の複数の訓練画像の組み合わせに基づいて決められた上記被写体の包括的なモデルを記憶するためのコンピュータ記憶装置において、
前記モデルが部分モデルを有し、前記部分モデルの各々が複数の訓練画像からの複数の部分画像からモデル化され、前記部分モデルの各々が前記画像の前記部分画像に対応する、コンピュータ記憶装置と、
上記画像の2つ以上の部分画像の特徴と上記モデルとの類似度を判定するためのプロセッサにおいて、類似度の判定が、各部分画像の特徴とそれに対応する部分モデルによってモデル化された特徴との類似度に基づいて決められ、上記判定された類似度に基づいて上記画像の品質を判定するためのプロセッサと、を備える。
【0038】
上述の第1の態様の任意選択的な特徴は、等しく第2および第3の態様の任意選択の特徴になる。
【0039】
次に、本発明の例について説明する。