(58)【調査した分野】(Int.Cl.,DB名)
【発明を実施するための形態】
【0021】
以下、添付図面を参照しながら各実施例について詳細に説明する。
【0022】
[実施例1]
実施例1では、ショットに含まれる画像の1又は複数の代表色を用いて、ショットの統合を判定する。
【0023】
<構成>
図2は、実施例1における画像処理装置10の概略構成の一例を示すブロック図である。
図2に示すように、画像処理装置10は、制御部102、主記憶部104、補助記憶部106、ドライブ装置108、ネットワークI/F部110、入力部112、及び表示部114を有する。これら各構成は、バスを介して相互にデータ送受信可能に接続されている。
【0024】
制御部102は、コンピュータの中で、各装置の制御やデータの演算、加工を行うプロセッサである。制御部102は、例えばCPU(Central Processing Unit)やDSP(Digital Signal Processor)である。
【0025】
また、制御部102は、主記憶部104又は補助記憶部106に記憶されたシーン生成処理のプログラムを実行する演算装置である。制御部102は、入力部112や記憶装置からデータを受け取り、演算、加工した上で、表示部114や記憶装置などに出力する。
【0026】
主記憶部104は、ROM(Read Only Memory)やRAM(Random Access Memory)などである。主記憶部104は、制御部102が実行する基本ソフトウェアであるOS(Operating System)やアプリケーションソフトウェアなどのプログラムやデータを記憶又は一時保存する記憶装置である。
【0027】
補助記憶部106は、HDD(Hard Disk Drive)などであり、アプリケーションソフトウェアなどに関連するデータを記憶する記憶装置である。
【0028】
ドライブ装置108は、記録媒体116、例えばフレキシブルディスクからプログラムを読み出し、記憶装置にインストールする。
【0029】
また、この記録媒体116に格納された所定のプログラムは、ドライブ装置108を介して画像処理装置10にインストールされる。インストールされた所定のプログラムは、画像処理装置10により実行可能となる。
【0030】
ネットワークI/F部110は、有線及び/又は無線回線などのデータ伝送路により構築されたLAN(Local Area Network)、WAN(Wide Area Network)などのネットワークを介して接続された周辺機器と画像処理装置10とのインターフェースである。
【0031】
入力部112は、カーソルキー、数字入力及び各種機能キー等を備えたキーボード、表示部114の表示画面上でキーの選択等を行うためのマウスやスライドパッド等を有する。また、入力部112は、ユーザが制御部102に操作指示を与えたり、データを入力したりするためのユーザインターフェースである。
【0032】
表示部114は、LCD(Liquid Crystal Display)等により構成され、制御部102から入力される表示データに応じた表示が行われる。
【0033】
画像処理装置10は、例えばPC(Personal Computer)であり、少なくとも制御部102や主記憶部104や補助記憶部106を有するコンピュータであればよい。
【0034】
<機能>
次に、実施例1における画像処理装置10の機能について説明する。
図3は、実施例1における画像処理装置10の機能の一例を示すブロック図である。
図3に示す画像処理装置10は、第1記憶部202、シーン生成部204、第2記憶部206を有する。
【0035】
なお、シーン生成部204は、例えば制御部102によりシーン生成プログラムを実行されることで実現でき、第1記憶部202及び第2記憶部206は、例えば補助記憶部106又は主記憶部104により実現できる。また、第1記憶部202及び第2記憶部206は、同じ記憶部にあり、それぞれの記憶領域が設けられる構成でもよい。
【0036】
また、他の画像処理装置15は、映像取得部152、ショット分割部154を少なくとも有する。なお、映像取得部152とショット分割部154とは、画像処理装置10に含まれるように実装されてもよい。
【0037】
映像取得部152は、地上デジタル放送の映像、ネットワークから配信された映像、又は記録媒体に記録された映像を取得する。映像取得部152は、取得した映像をショット分割部154に出力する。
【0038】
ショット分割部154は、公知の技術を用いて映像を分割したショットを抽出する。ショットの転換点を検出する技術として、例えば、前後のフレームの輝度又は色のヒストグラムの類似度を用いる方法がある(例えば、特開2008−83894号公報参照)。
【0039】
ショット分割部154は、ショットに分割した後、各ショットに含まれる各画像を代表画像として、第1記憶部202に記録する。代表画像は、例えばショットの最初の画像であるが、これに限られない。代表画像は、P
1〜P
Nの符号で表し、画像P
1などとも表記する。
【0040】
画像処理装置10の第1記憶部202は、ショットの代表画像系列P
1〜P
Nを記憶する。なお、第1記憶部202は、各代表画像に対応するショットも記憶しておく。第1記憶部202に記憶された各代表画像は、シーン生成部204に出力される。
【0041】
シーン生成部204は、色リスト生成部210、判定部220を有する。シーン生成部204は、各ショットの代表画像の代表色を用いて、ショットの統合の判定結果に基づいてシーンを生成する。シーンは、例えば、同じ場面の画像系列とする。
【0042】
色リスト生成部210は、例えば、映像が分割された各ショットに含まれる各画像(各代表画像)に対し、この各画像の色分布に基づいて各画像の1又は複数の代表色を示す色リストを生成する。色分布は、RGB色空間を所定個の色に分割し、分割された所定個の色のヒストグラムを表す。この所定個の色を代表色とも称す。
【0043】
色リスト生成部210は、初期化部212、リスト生成部214を有する。初期化部212は、色リスト生成に必要なパラメータを初期化する。初期化部212は、例えば、代表画像の処理した数を表すパラメータiを1に設定し、シーンの個数を表すパラメータMを1に設定し、現在の統合色リストを表すILを空集合に設定する。統合色リストは、ショット統合判定の対象画像より前の1又は複数の画像の色リストを含む色リストである。
【0044】
リスト生成部214は、画像P
iに対して、RGB色空間を所定個(K個)に分割したヒストグラム計算を行う。Kは、例えば色成分毎に8個に分割して、8×8×8=512(=K)とする。つまり、リスト生成部214は、一例として、RGB色空間を約500個の色に分割する。
【0045】
リスト生成部214は、分割したK個の「ヒストグラム領域」(H
1〜H
K)の中心のRGB値を求める。このRGB値を中心RGB値とも称す。例えば、ヒストグラム領域H
1の中心RGB値を(R
1,G
1,B
1)とする。リスト生成部214は、ヒストグラム領域の度数を0に初期化する。
【0046】
リスト生成部214は、画像P
iの各画素に対して、各画素のRGB値に最も近い中心RGB値を有するH
jの度数をインクリメントする。これにより、画像P
iに対する色のヒストグラムが生成される。
【0047】
図4は、色のヒストグラムの一例を示す図である。
図4に示すように、ヒストグラム領域H
1〜H
Kそれぞれに、度数がカウントされる。ヒストグラム領域の各Hには、中心RGB値が対応付けられる。
【0048】
図3に戻り、リスト生成部214は、色のヒストグラムの各度数の最大値を最大度数とする。リスト生成部214は、最大度数の所定の割合以上の度数を有する色を色リストに含める。所定の割合をR
1と称する。R
1は、例えば30%(0.3)とし、予め適切な値が設定される。例えば、リスト生成部214は、最大度数のR
1以上の度数を持つH
jの中心RGB値の集合{(R
1,G
1,B
1),(R
2,G
2,B
2),…,(R
k,G
k,B
k)}を、画像P
iの「色リスト」L
iとする。この例では、jは少なくとも1,2,Kを含む。
【0049】
なお、実施例では、画像内に含まれる代表的な色を抽出したいので、最大度数のR
1以上の度数を用いる。これにより、同じような比率で多くの色が存在する画像の場合、同じような比率の多くの色全てを代表色として抽出できる。リスト生成部214は、生成した色リストL
iを判定部220に出力する。
【0050】
判定部220は、判定の対象画像の色リストと、対象画像より前の1又は複数の画像の色リストが統合された色リストとを比較し、比較結果に基づいて対象画像を含むショットと、1又は複数の画像を含むショットとを統合するか否かを判定する。統合された色リストは、統合リストとも称す。判定部220は、リスト統合部222、ショット統合部224を有する。
【0051】
まず、判定部220は、iが1であるかを判定し、i=1であれば、ショット統合部224によりシーンS
Mに画像P
iを含むショットを加え、リスト統合部222により統合色リストILにL
iを加える。
【0052】
判定部220は、次の式により、判定指標Dを計算する。
D=(L
iにもILにも含まれる色の数)/(L
iに含まれる色の数)
判定指標Dは、「画像P
iが現在のシーンと同じシーンのショット代表画像かどうか」の目安となる値である。判定部220は、Dが高い値ならば現在のシーンの場面が継続、Dが低い値ならば場面切り換わりと判定する。
【0053】
例えば、Dが閾値R
2以上(D≧R
2)であれば、判定部220は、画像P
iは現在のシーンと同じ場面の画像」と判定し、ショット統合部224は、シーンS
Mに画像P
iを含むショットを加え、リスト統合部222は、統合色リストILにL
iを加える。閾値R
2は、例えば0.7などであり、予め適切な値が設定される。
【0054】
例えば、Dが閾値R
2未満(D<R
2)であれば、判定部220は、画像P
iは現在のシーンと違う場面の画像(場面転換点)」と判定し、M=M+1に設定する。このとき、ショット統合部224は、シーンS
Mに画像P
iを含むショットを加え、リスト統合部222は、統合色リストILを一度空集合とし、新たにL
iを加える。
【0055】
ショット統合部224は、Mが変更された時点で、変更前MのシーンS
Mを第2記憶部206に記録する。シーンS
Mは、統合されたショットもあれば、1つのショットもありうる。
【0056】
次に、シーン生成部204は、変数iに1を加算し、次の画像に対して、色リスト生成、統合判定処理を行う。
【0057】
第2記憶部206は、シーン生成部204により生成されたシーンS
Mを記憶する。つまり、第2記憶部206は、判定部220による判定結果により統合されたショット及び統合されていないショットをシーンS
Mとして記憶する。これにより、適切にシーン転換を判定し、同じシーンのショットを統合することができる。
【0058】
<処理例>
次に、実施例1による画像処理装置10の処理例について、各ショットの代表画像の例を用いて説明する。
【0059】
図5は、処理手順(その1)の一例を示す図である。
図5に示す例では、色リスト生成部210は、最初のショットに含まれる画像P
1の色リストL
1を生成する。画像P
1に現れる色の中で、最大度数のR
1未満の色は色リストL
1には含まれずに切り捨てられる。
【0060】
図6は、処理手順(その2)の一例を示す図である。
図6に示す例では、ショット統合部224は、シーンS
1に画像P
1を含むショットを追加する。また、リスト統合部222は、統合色リストILにL
1を追加する。
【0061】
図7は、処理手順(その3)の一例を示す図である。
図7に示す例では、色リスト生成部210は、次のショットに含まれる画像P
2の色リストL
2を生成する。
図7に示す例では、目の部分の色が色リストL
2に含まれずに切り捨てられる。
【0062】
図8は、処理手順(その4)の一例を示す図である。
図8に示す例では、判定部220は、判定指標Dを次のように算出する。
D=(ILに含まれるL
2の色の数=4)/(L
2の色の数=5)=0.8
図8に示すように、色リストL
2の色のうち、C
5の色だけが、統合色リストILに含まれていない。よって、Dは、4/5=0.8となる。
【0063】
図9は、処理手順(その5)の一例を示す図である。
図9に示す例では、D=0.8>R
2(例えば0.7)なので、ショット統合部224は、シーンS
1に画像P
2を含むショットを追加する。また、リスト統合部222は、統合色リストILにL
2を追加する。統合色リストにおいて、重複した色は1つの色として扱われる。
図9に示す統合色リストILには、
図8に示す色リストL
2のC
5の色が新たに追加される。
【0064】
図10は、処理手順(その6)の一例を示す図である。
図10に示す例では、色リスト生成部210は、次のショットに含まれる画像P
3の色リストL
3を生成する。
図10に示す例では、抽出された全ての色が、最大度数のR
1以上の度数を有する。
【0065】
図11は、処理手順(その7)の一例を示す図である。
図11に示す例では、判定部220は、判定指標Dを次のように算出する。
D=(ILに含まれるL
3の色の数=4)/(L
3の色の数=5)=0.8
図11に示すように、色リストL
3の色のうち、C
8の色だけが、統合色リストILに含まれていない。よって、Dは、4/5=0.8となる。
【0066】
図12は、処理手順(その8)の一例を示す図である。
図12に示す例では、D=0.8>R
2(例えば0.7)なので、ショット統合部224は、シーンS
1に画像P
3を含むショットを追加する。また、リスト統合部222は、統合色リストILにL
3を追加する。統合色リストにおいて、重複した色は1つの色として扱われる。
図12に示す統合色リストILには、
図11に示す色リストL
3のC
8の色が新たに追加される。
【0067】
図13は、処理手順(その9)の一例を示す図である。
図13に示す例では、色リスト生成部210は、次のショットに含まれる画像P
4の色リストL
4を生成する。
図13に示す例では、太陽の周縁部の色が色リストL
4に含まれずに切り捨てられる。
【0068】
図14は、処理手順(その10)の一例を示す図である。
図14に示す例では、判定部220は、判定指標Dを次のように算出する。
D=(ILに含まれるL
4の色の数=1)/(L
4の色の数=3)=0.333
図14に示すように、色リストL
4の色のうち、C
1の色だけが、統合色リストILに含まれている。よって、Dは、1/3=0.333となる。
【0069】
図15は、処理手順(その11)の一例を示す図である。
図15に示す例では、D=0.333<R
2(例えば0.7)なので、ショット統合部224は、Mを更新し、シーンS
2に画像P
4を含むショットを追加する。また、リスト統合部222は、今までの統合色リストを初期化し、新たな統合色リストILにL
3を追加する。よって、
図15に示す統合色リストILは、
図14に示す色リストL
4と同じである。
【0070】
上記のような手順で、画像P
iから色リストを生成し、対象画像の色リストと統合色リストとを用いて、ショットの統合を判定していく。よって、
図15に示すように、画像P
1〜P
3を含むそれぞれのショットを同じシーンとして統合することができる。
【0071】
<動作>
次に、実施例1における画像処理装置10の動作について説明する。
図16は、実施例1における画像処理の一例を示すフローチャートである。
図16に示すステップS101で、初期化部212は、処理に必要なパラメータiとMを初期化する。初期化部212は、例えば、iとMとに1を設定する。
【0072】
ステップS102で、リスト生成部214は、ショット統合判定の対象画像P
iから色のヒストグラムを計算する。色のヒストグラムでは、上記した通り、RGB色空間でK個に分割した色の度数が計算される。
【0073】
ステップS103で、リスト生成部214は、ヒストグラムの各色の度数を用いて色リストL
iを生成する。色リストの生成処理は、
図17により後述する。
【0074】
ステップS104で、判定部220は、変数iが1であるか否かを判定する。i=1であれば(ステップS104−YES)ステップS105に進み、i=1でなければ(ステップS104−NO)ステップS106に進む。
【0075】
ステップS105で、ショット統合部224は、シーンS
Mに画像P
iを含むショットを追加し、リスト統合部222は、統合色リストILに色リストL
iを追加する。また、判定部220は、iをインクリメントし、色リスト生成部210に対し、画像P
iでの処理を指示する。
【0076】
ステップS106で、判定部220は、判定指標Dを計算する。判定指標Dは、画像P
iが現在のシーンと同様のシーンのショットの代表画像かどうかを示す値である。
【0077】
ステップS107で、判定部220は、D≧R
2であるか否かを判定する。D≧R
2であれば(ステップS107−YES)ステップS108に進み、D<R
2であれば(ステップS107−NO)ステップS109に進む。
【0078】
ステップS108で、ショット統合部224は、シーンS
Mに画像P
iを含むショットを追加し、リスト統合部222は、統合色リストILに色リストL
iを追加する。
【0079】
ステップS109で、判定部220は、Mをインクリメントする。ステップS110で、ショット統合部224は、シーンS
Mに画像P
iを含むショットを追加し、リスト統合部222は、統合色リストILを初期化した後に色リストL
iを追加する。
【0080】
ステップS111で、判定部220は、iをインクリメントし、色リスト生成部210に対し、画像P
iでの処理を指示する。
【0081】
ステップS112で、判定部220は、i>Nであるか否かを判定する。Nは、ショットの代表画像の総数である。i>Nであれば(ステップS112−YES)処理を終了し、i≦Nであれば(ステップS112−NO)ステップS102に戻る。
【0082】
これにより、統合色リストを用いてショットの統合を判定することができるので、背景の色特徴が大きく変化しても、適切に同じ場面(シーン)と判断し、適切にショットを統合することができる。
【0083】
図17は、色リスト生成処理の一例を示すフローチャートである。
図17に示すステップS201で、リスト生成部214は、生成したヒストグラムの最大度数h
maxを特定する。以下では、ヒストグラムの領域Hの度数をhで表す。
【0084】
ステップS202で、リスト生成部214は、ヒストグラムの領域の変数t(1≦t≦K)を1に設定する。
【0085】
ステップS203で、リスト生成部214は、h
t≧h
max×R
1であるか否かを判定する。h
t≧h
max×R
1であれば(ステップS203−YES)ステップS204に進み、h
t≧h
max×R
1でなければ(ステップS203−NO)ステップS205に進む。
【0086】
ステップS204で、リスト生成部214は、色リストL
iにH
tを含める。ステップS205で、リスト生成部214は、変数tをインクリメントする。
【0087】
ステップS206で、リスト生成部214は、t>Kであるか否かを判定する。t>Kであれば(ステップS206−YES)処理を終了し、t>Kでなければ(ステップS206−NO)ステップS203に戻る。
【0088】
これにより、リスト生成部214は、各画像P
iに対し、1又は複数の代表色を示す色リストを生成することができる。
【0089】
以上、実施例1によれば、音声信号を用いずに、場面転換を適切に検出してショットを統合することができる。
【0090】
[実施例2]
次に、実施例2における画像処理装置について説明する。実施例2では、色リストを生成する際、背景領域のみから色リストを生成する。これにより、より適切にショットの統合の判定を行うことができる。
【0091】
<構成>
実施例2における画像処理装置の構成は、
図2に示す構成と同様であるため、同じ符号を用いて説明する。
【0092】
<機能>
図18は、実施例2における画像処理装置20の機能の一例を示すブロック図である。
図18に示す画像処理装置20の機能のうち、
図3に示す機能と同様のものは同じ符号を付す。以降では、実施例1の機能と異なる機能について主に説明する。
【0093】
色リスト生成部310は、初期化部212、背景領域抽出部312、リスト生成部314を有する。
【0094】
背景領域抽出部312は、各画像P
iから背景領域を抽出する。抽出方法としては、予め設定された背景領域を抽出してもよいし、公知の背景領域抽出処理を行ってもよい。例えば、背景領域抽出部312は、オブジェクト抽出処理を行って、抽出したオブジェクト以外を背景領域として設定してもよい。
【0095】
図19は、予め設定された背景領域の一例を示す図である。
図19に示す例では、画像P
iの高さをHE、幅をWIとする。
図19に示す背景領域は、両サイドの幅WI/4、画像P
iの上からHE/4の領域である。
図19に示す背景領域の例は、あくまでも一例に過ぎない。
【0096】
リスト生成部314は、背景領域抽出部312により抽出された領域に対し、色リストL
iを生成する。色リストの生成処理は、実施例1と同様である。
【0097】
なお、映像のジャンルについて、ドラマやクイズ番組などのジャンルの場合には、中央に人物が映る場合が多く、さらに人物は変わる場合が多いので、背景領域を用いて色リストを生成すると、より適切にショットを統合することができるようになる。
【0098】
よって、色リスト生成部310は、映像のジャンルコードを抽出し、抽出したジャンルコードが予め設定された所定のジャンルコードであれば、背景領域から色リストを生成する。また、色リスト生成部310は、抽出したジャンルコードが予め設定された所定のジャンルコード以外であれば、実施例1と同様に画像全体から色リストを生成してもよい。
【0099】
<動作>
次に、実施例2における画像処理装置20の動作について説明する。実施例2における画像処理は、基本的な処理は実施例1と同様であり、異なる処理は、
図16のステップS102である。
【0100】
実施例2では、ステップS102の処理で、リスト生成部314が、背景画像に対して、色のヒストグラムを計算する。その他の処理は、実施例1と同様である。
【0101】
以上、実施例2によれば、背景領域から色リストを生成するので、より適切にショットの統合判定を行うことができる。また、背景領域を用いる場合に特に効果を発揮するジャンルを調査し、調べたジャンルを予め色リスト生成部310に登録しておくことで、所定のジャンルの映像のみに対して、背景領域を用いて色リストを生成することができる。
【0102】
[変形例1]
次に、上記各実施例の変形例1について説明する。変形例1では、判定部220は、映像のジャンルに応じて閾値R
2を変更する。例えば、スポーツ映像(サッカーなど)は、シーンが変わっても背景が同様であることが多いので、多くのショットが一つのシーンとして統合されてしまう。
【0103】
そこで、閾値R
2を適応的に変更することで、シーンチェンジをジャンルに応じて変更するようにする。例えば、スポーツ番組などでは、R
2の値を大きくすることで、同様のシーンでも、シーンチェンジを発生しやすくする。また、判定部220は、ジャンル毎に、閾値R
2を準備してもよい。
【0104】
図20は、変形例1の閾値テーブルの一例を示す図である。
図20に示すように、閾値テーブルは、ジャンル毎に、閾値R
2が対応付けられている。例えば、ジャンル「スポーツ」には、閾値「R
21」が対応付けられ、ジャンル「クイズ番組」には、閾値「R
22」が対応付けられる。例えば、R
21はR
22よりも大きい値が設定される。
【0105】
これにより、判定部220は、映像のジャンルに応じて、シーンチェンジの判定閾値を変更することで、より適切なショットの統合判定を行うことができる。
【0106】
[変形例2]
次に、上記各実施例の変形例2について説明する。変形例2では、第2記憶部206に記憶されたシーンに対し、それぞれの統合色リストを対応付ける。
【0107】
図21は、変形例2における統合色リストを対応付けたシーンテーブルの一例を示す図である。
図21に示すように、生成されたシーンに対し、統合色リストが対応付けられている。例えば、シーンS
1には、統合色リストIL1が対応付けられる。
【0108】
これにより、変形例2における画像処理装置は、統合色リストを用いて映像検索を行ったり、類似する統合色リストを有するシーンをさらに統合したりすることができるようになる。
【0109】
なお、上記の画像処理装置で実行されるプログラムは、実施例で説明した各部を含むモジュール構成となっている。実際のハードウェアとしては、制御部102が補助記憶部106からプログラムを読み出して実行することにより上記各部のうち1又は複数の各部が主記憶部104上にロードされ、1又は複数の各部が主記憶部104上に生成されるようになっている。
【0110】
また、上述した実施例で説明したシーン生成処理は、コンピュータに実行させるためのプログラムとして実現されてもよい。このプログラムをサーバ等からインストールしてコンピュータに実行させることで、前述したシーン生成処理を実現することができる。
【0111】
また、このプログラムを記録媒体116に記録し、このプログラムが記録された記録媒体116をコンピュータなどに読み取らせて、前述したシーン生成処理を実現させることも可能である。
【0112】
なお、記録媒体116は、CD−ROM、フレキシブルディスク、光磁気ディスク等の様に情報を光学的,電気的或いは磁気的に記録する記録媒体、ROM、フラッシュメモリ等の様に情報を電気的に記録する半導体メモリ等、様々なタイプの記録媒体を用いることができる。
【0113】
以上、実施例について詳述したが、特定の実施例に限定されるものではなく、特許請求の範囲に記載された範囲内において、上記実施例以外にも種々の変形及び変更が可能である。