(58)【調査した分野】(Int.Cl.,DB名)
前記時間差の算定においては、互いに関連性があるN−1個の収録データと、前記N−1個の収録データに対する関連性が不明な1個の収録データとを含む前記N個の収録データについて、前記収録データ対毎の時間差を算定し、
前記評価においては、前記N個の収録データの中に関連性がない収録データが含まれていると評価した場合に、前記1個の収録データを前記N−1個の収録データに対する関連性がない収録データと判定する
請求項1の収録データ解析方法。
N個(Nは3以上の自然数)の収録データを循環的に配列したときに相前後する2個の収録データで構成されるN個の収録データ対の各々について、当該収録データ対の前記2個の収録データの各々における収録対象の時間変化を表す時間信号の相互相関の絶対値が最大となる時間差を算定する算定部と、
前記N個の収録データ対にわたる時間差の合計値が閾値を上回るか否かに応じて、前記N個の収録データの中に関連性がない収録データが含まれているか否かを評価する評価部と
を具備する収録データ解析装置。
【発明を実施するための形態】
【0013】
<第1実施形態>
図1は、第1実施形態に係る収録データ編集システム10の構成図である。収録データ編集システム10は、音響(例えば音声や楽音)および動画を処理するためのコンピュータシステムであり、
図1に例示される通り、制御装置22と記憶装置24と収録データ取得装置26と表示装置32と放音装置34と操作装置36とを具備する。例えば携帯電話機やスマートフォン、タブレット端末、パーソナルコンピュータ等の可搬型の情報処理装置で収録データ編集システム10は好適に実現され得るが、据置型の情報処理装置で収録データ編集システム10を実現することも可能である。
【0014】
制御装置22は、収録データ編集システム10の各要素を統括的に制御する演算処理装置(例えばCPU)である。収録データ取得装置26は、複数の収録装置の各々が撮影した収録データXを取得する。収録装置は、音響を収音する収音装置と動画を撮像する撮像装置とを具備する映像機器であり、例えば、音響および動画の収録に専用されるデジタルカムコーダ等の映像機器や、収録機能を搭載した携帯電話機またはスマートフォン等の情報端末である。収録データXは、収録装置が収録した音響と動画とを表すデータである。
【0015】
第1実施形態の収録データ取得装置26は、N個の収録データXを取得する(Nは3以上の自然数)。具体的には、収録データ取得装置26は、N個の収録データXを、例えばWi-Fi(登録商標)やBluetooth(登録商標)等の公知の近距離無線通信により各収録装置から取得することや、各収録装置が収録した収録データXを保存する記憶装置からインターネット等の通信網を介して取得することが可能である。
【0016】
記憶装置24は、例えば磁気記録媒体や半導体記録媒体等の公知の記録媒体で構成され、制御装置22が実行するプログラムや制御装置22が使用する各種のデータを記憶する。第1実施形態の記憶装置24は、収録データ取得装置26が取得したN個の収録データX(X1,X2,……,XN)を記憶する。N個の収録データXをあらかじめ記憶装置24に保存しておくことも可能である。この場合、収録データ編集システム10から収録データ取得装置26は省略され得る。また、収録データ編集システム10が通信可能なサーバに記憶装置24(すなわちクラウドストレージ)を設置することも可能である。この場合、収録データ編集システム10から記憶装置24は省略され得る。
【0017】
複数の収録装置の各々は、例えば相異なる位置で共通の収録対象(被写体)の音響および動画を並列に収録する。例えば、音響ホール等の共通の音響空間の相異なる地点に複数の収録装置が配置されて各々が別個の角度から例えば舞台や観客の様子を収録して収録データXを生成する。第1実施形態の収録データXは、収音装置が収音した音響を表す音響信号と撮像装置が撮像した動画を表す画像信号とを含む。例えば、舞台に設置された放音装置(例えばスピーカー)から舞台で行われる演劇用の楽曲の演奏音が再生されている場合、各収録装置が収録する収録データXの音響には、演奏音(ただし音量等の音響特性は相違し得る)が共通に含有される。
【0018】
各収録装置の利用者は、自身の収録装置による収録を別々に開始する。したがって、音響や動画の収録の開始点は、N個の収録データXの間で厳密には一致せず、収録データX毎に相違し得る。つまり、N個の収録データXには、時間差がある。
【0019】
記憶装置24には、基本的には、相互に関連性のあるN個の収録データXが記憶される。しかし、記憶装置24に記憶されるN個の収録データXの中には、例えば収録装置の利用者の操作ミス等により、他の収録データXとの関連性がない収録データXが混在する可能性がある。相互に関連性がある収録データXとは、収録の対象(被写体)や場所が相互に共通し(内容的な関連)、かつ、収録期間が時間軸上で部分的に重複する(時間的な関連)関係にある収録データXである。例えば信頼性のある利用者(例えば収録対象のイベントの関係者)が内容的および時間的に関連するように収録したN−1個の収録データXについては関連性が担保される。また、収録位置や収録時間を示すデータが収録データXに付加された場合を想定すると、収録位置や収録時間の共通性を解析することで、互いに関連性があるN−1個の収録データXを確保できる。他方、関連性がない収録データXとは、内容的な関連および時間的な関連の少なくとも一方がない収録データXである。関連性がない収録データXとは、例えば、他の収録データXの収録期間と同じ期間に収録しているが異なるイベントの様子を収録した収録データX(収録対象の部分的な重複がない場合)や、収録したイベントは同じであるが他の収録データXの収録の終了以降に収録を開始した収録データX(収録期間の時間軸上の部分的な重複がない場合)などである。つまり、関連性がない収録データXは、他の複数の収録データXが共通に含有する音響を含まない。第1実施形態では、N個の収録データX1〜XNが、互いに関連性があるN−1個の収録データX1〜XN-1と、N−1個の収録データX1〜XN-1に対する関連性が不明な1個の収録データXNとを含む場合を想定する。N−1個の収録データX1〜XN-1は、互いに関連性があることが任意の方法で予め確認された収録データXである。
【0020】
図1の表示装置32(例えば液晶表示パネル)は、制御装置22から指示された画像を表示する。放音装置34(例えばスピーカーやヘッドホン)は、制御装置22から指示された音響を放音する。操作装置36は、利用者からの指示を受付ける入力機器であり、例えば利用者による操作を検知する複数の操作子や表示装置32の表示面に対する利用者の接触を検知するタッチパネルで構成される。
【0021】
制御装置22は、記憶装置24に記憶されたプログラムを実行することで、N個の収録データXを処理するための複数の機能(収録データ解析部40,編集処理部46)を実現する。なお、制御装置22の一部の機能を音響処理または画像処理の専用の電子回路で実現した構成や、制御装置22の機能を複数の装置に分散した構成も採用され得る。
【0022】
収録データ解析部40は、
図2に例示される通り、収録装置が生成したN個の収録データX(X1〜XN)を循環的に配列したときに相前後する2個の収録データX(Xi,Xj)間の時間差Oij(i,j=1〜N,i≠j)を特定し、時間差Oijの合計値SからN個の収録データの中に関連性がない収録データXが含まれているか否かを評価する。N個の収録データX1〜XNの循環的な配列とは、N個の収録データX1〜XNを直列に配列するとともに最後の収録データXNに先頭の収録データX1を後続させた配列(環状配列)を意味する。したがって、N個の収録データX1〜XNの循環的な配列には、相前後する2個の収録データX(Xi,Xj)で構成されるN個の対(以下「収録データ対」という)Pijが包含される。すなわち、数値iと数値jとの組合せは、(i,j)=(1,2),(2,3),……(N−1,N),(N,1)のN通りである。
図2から理解される通り、時間差Oijは、収録データXiを基準としたときの収録データXjの相対的な時間(オフセット)を意味する。なお、循環的に配列されたN個の収録データXの順列は任意である。
【0023】
図1に例示される通り、第1実施形態の収録データ解析部40は、算定部42と評価部44とを具備する。算定部42は、N個の収録データX(X1,X2,……,XN)を循環的に配列したときに相前後する2個の収録データXで構成されるN個の収録データ対Pijの各々について、当該収録データ対Pijの2個の収録データXの各々における音響信号の時間差Oijを算定する。
【0024】
具体的には、算定部42は、N個の収録データ対Pijの各々について、収録データXiと収録データXjとの間における音響信号の相互相関Cij(τ)の絶対値|Cij(τ)|が最大となる時間差τを収録データ対Pijの時間差Oijとして算定する。相互相関Cij(τ)は、以下の数式(1)で表現される通り、収録データXiに含まれる音響信号yi(t)の始点と収録データXjに含まれる音響信号yj(t)の始点とを時間軸上で一致させてから、音響信号yi(t)に対する音響信号yj(t)の時間差(時間軸上のシフト量)τを変数として両者間の時間波形の相関の程度を示した数値列である。収録データXiと収録データXjとが関連性がない場合、前述した通り、収録データXiと収録データXjとは共通の音響を含有しないため、相互相関Cij(τ)は有意な値をとらない。なお、時間差τは、負の数値もとり得る。したがって、例えば、収録データXjが時間軸上で収録データXiの後方に位置する場合に時間差Oijは正数となり、収録データXjが時間軸上で収録データXiの前方に位置する場合に時間差Oijは負数となる。
【数1】
【0025】
また、相互相関Cij(τ)は、数式(2)で表現される通り、音響信号yi(t)の周波数スペクトルYi(f)と音響信号yj(t)の周波数スペクトルYj(f)とのクロススペクトルの逆フーリエ変換(IFFT)で算出することも可能である。fは周波数を意味し、Yi
*(f)は、Yi(f)の複素共役である。数式(2)の演算により相互相関Cij(τ)を算定する構成によれば、数式(1)を演算する構成と比較して、相互相関Cij(τ)を算出する計算量を低減できるという利点がある。
【数2】
【0026】
図3は、相互に関連性があるN−1個の収録データX(X1〜XN-1)の説明図である。
図2に例示される通り、N−1個の収録データXについて相互に関連性がある場合、N−1個の収録データ対Pijにわたる時間差Oijの合計値S(S=O12+O23+……+ON-11)は0に近い数値(理想的には0)となる。
【0027】
ここで、相互に関連性があるN−1個の収録データX1〜XN-1に、関連性が不明な1個の収録データ(以下「未知収録データ」という)XNを加えてN個の収録データX1〜XNとした場合を想定する。未知収録データXNについて収録データX1〜XN-1との間で関連性がある場合、
図2に例示される通り、N個の収録データ対Pijにわたる時間差Oijの合計値S(S=O12+O23+……+ON1)は0に近い数値(理想的には0)となる。他方、未知収録データXNについて収録データX1〜XN-1との間で関連性がない場合、
図4に例示される通り、収録データXN-1と未知収録データXNとが時間軸上で部分的に重複していない(つまり関連性がない)ため、収録データ対Pijの相互相関Cij(τ)が有意な値とならない。したがって、時間差Oijの合計値Sは0から乖離した数値となる。以上の説明から理解される通り、時間差Oijの合計値Sは、関連性がない収録データXがN個の収録データXに含まれているか否か(未知収録データXについて収録データX1〜XN-1との関連性があるか否か)の指標として利用可能である。すなわち、時間差Oijの合計値Sが0から離れる場合、N個の収録データXの中に関連性がない収録データXが含まれていると推定できる。
【0028】
以上の傾向を考慮して、
図1の評価部44は、N個の収録データ対Pijにわたる時間差Oijの合計値Sに応じて、N個の収録データXの中に関連性がない収録データXが含まれているか否かを評価する。第1実施形態では、前述した通り、N個の収録データX1〜XNは、互いに関連性があるN−1個の収録データX1〜XN-1と、N−1個の収録データX1〜XN-1に対する関連性が不明な1個の未知収録データXNとを含む。以上の前提のもとでは、N個の収録データXの中に関連性のない収録データXが含まれている場合には、未知収録データXNについて他のN−1個の収録データX1〜XN-1との関連性がないことを意味する。なお、第1実施形態において未知収録データXNは、N−1個の収録データX1〜XN−1の配列の末尾に加えるが、未知収録データXNを加える位置は任意である。
【0029】
第1実施形態の評価部44は、N個の収録データ対Pijにわたる時間差Oijの合計値Sが所定の閾値を上回る場合、未知収録データXNをN−1個の収録データXに対する関連性がない収録データXと判定するとともにN個の収録データXから除外する。一方、第1実施形態の評価部44は、N個の収録データ対Pijにわたる時間差Oijの合計値Sが所定の閾値を下回る場合、未知収録データXNをN−1個の収録データXに対する関連性がある収録データXと判定し、N個の収録データXからは除外しない。なお、閾値は、実験的または統計的に選定される。
【0030】
図1の編集処理部46は、未知収録データXNをN−1個の収録データX1〜XN-1に対する関連性がないと評価部44が判定した場合、N−1個の収録データX1〜XN-1を相互に同期させたコンテンツZを生成する。一方、編集処理部46は、未知収録データXNをN−1個の収録データX1〜XN-1に対する関連性があると評価部44が判定した場合、N個の収録データX1〜XNを相互に同期させたコンテンツZを生成する。収録データXの同期とは、各収録データXの音響および動画の時間軸を複数の収録データXについて相互に合致させた状態を意味する。なお、収録データXの同期には公知の技術が任意に採用され得るが、算定部42で算定した時間差Oijを使用して複数の収録データXを同期することも可能である。
図1の編集処理部46で生成されたコンテンツZは、制御装置22の指示により再生される。具体的には、コンテンツZの動画は表示装置32で表示され、コンテンツZの音響は放音装置34で放音される。
【0031】
ところで、N−1個の収録データX1〜XN-1と関連性がない収録データXNを除外せずにN個の収録データX1〜XNを同期する構成によれば、本来ならば同期しない収録データXNについて、時間軸上の関係が誤推定されてしまう。第1実施形態では、N−1個の収録データX1〜XN-1と関連性がない収録データXNが除外されるから、互いに関連性がある収録データXだけを対象として相互に同期させることが可能である。
【0032】
なお、N−1個の収録データX1〜XNと関連性がない収録データXNをN個の収録データX1〜XNから除外する方法としては、例えば、収録データXの収録期間(例えば開始時刻と終了時刻)を示す情報を参照して、N−1個の収録データX1〜XN-1と時間的な関連性がない収録データXNを除外する構成(以下「対比例」という)も想定される。しかし、対比例では、同時期に収録された結果として時間的な関連はあるけれども内容的な関連がない収録データXNが、N−1個の収録データX1〜XN-1と関連性があると誤判定されて除外されない。これに対して第1実施形態では、時間差Oijの合計値Sに応じてN−1個の収録データX1〜XN-1と関連性がない収録データXを判定することができるので、時間的な関連はあるが内容的な関連がない収録データXNについても、適切に除外することが可能である。また、収録期間を示す情報が存在しない収録データXについて評価できるという利点もある。
【0033】
図5は、制御装置22がコンテンツZを生成する処理のフローチャートである。操作装置36に対する利用者からの指示を契機として
図5の処理が開始される。例えば、収録データ取得装置26が、舞台で実演される演劇の様子を相異なる位置から収録した互いに関連性があるN−1個の収録データXと、N−1個の収録データXに対する関連性が不明な1個の未知収録データXとを含むN個の収録データXを取得した場合を想定する。
図5の処理を開始すると、算定部42は、N個の収録データ対Pij(P12〜PN1)の各々について、相互相関Cij(τ)の絶対値|Cij(τ)|が最大となる時間差τを、収録データ対Pijの音響信号yi(t)と音響信号yj(t)との時間差Oij(O12〜ON1)として算定する(SA1)。
【0034】
評価部44は、N個の収録データ対Pijにわたる時間差Oijの合計値Sを算出する(SB1)。次に、評価部44は、N個の収録データXの中に関連性がない収録データXが含まれているか否かを、合計値Sと閾値との比較により評価する(SB2)。具体的には、N個の収録データ対Pijにわたる時間差Oijの合計値Sが所定の閾値を上回る場合、評価部44は、未知収録データXをN−1個の収録データXに対する関連性がない収録データXと判定して(SB2:YES)、N個の収録データXから除外する(SB3)。他方、N個の収録データ対Pijにわたる時間差Oijの合計値Sが所定の閾値を下回る場合、評価部44は、未知収録データXについてN−1個の収録データXに対する関連性があると判定し(SB2:NO)、N個の収録データXから除外しない(SB4)。
【0035】
編集処理部46は、評価部44による処理の結果を踏まえてコンテンツZを生成する(SC1)。具体的には、編集処理部46は、関連性がない収録データXNを評価部44が除外した場合(SB3)、N−1個の収録データXを相互に同期させたコンテンツZを生成し、未知収録データXをN個の収録データXから評価部44が除外しなかった場合(SB4)、未知収録データXを含むN個の収録データXを相互に同期させたコンテンツZを生成する。以上に説明した通り、算定部42は、N個の収録データ対Pijの時間差Oijを算定する処理(ステップSA1)を行い、評価部44は、N個の収録データXの中に関連性がない収録データXが含まれているか否かを評価する処理(ステップSB1〜SB4)を行う。
【0036】
以上の説明から理解される通り、第1実施形態では、N個の収録データXを循環的に配列したときのN個の収録データ対Pijにわたる時間差Oijの合計値Sに応じて、N個の収録データXの中に関連性がない収録データXが含まれているか否かを適切に評価できる。
【0037】
関連性の有無が不明なN個の収録データXに関する時間差Oijの合計値Sに応じて、関連性のない収録データXの有無を評価するだけでは、N個のうちの何れの収録データXが、他の収録データXに対する関連性がないものであるのかまでは特定できない。第1実施形態では特に、互いに関連性があることが既知であるN−1個の収録データXと、N−1個の収録データXに対する関連性が不明である1個の収録データXとを含むN個の収録データXについて、収録データ対Pij毎の時間差Oijの合計値Sに応じて関連性の有無が評価されるから、1個の収録データXNについてN−1個の収録データXとの関連性の有無を判定することが可能である。
【0038】
<第2実施形態>
本発明の第2実施形態について説明する。なお、以下に例示する各形態において作用や機能が第1実施形態と同様である要素については、第1実施形態の説明で使用した符号を流用して各々の詳細な説明を適宜に省略する。
【0039】
第1実施形態では、1個の未知収録データXについて他の収録データXとの関連性があるか否かを評価したが、第2実施形態では複数の収録データXの各々について他の収録データXと関連性があるか否かを評価する。
【0040】
図6は、第2実施形態に係る収録データ編集システム10の構成図である。第1実施形態の記憶装置24は、互いに関連性があるN−1個の収録データXと1個の未知収録データXとを記憶するが、第2実施形態の記憶装置24は、互いに関連する複数の収録データXと、他の収録データXに対する関連性が不明な複数の未知収録データXとを記憶する。
【0041】
第2実施形態の収録データ解析部40の処理においては、
図7に例示される通り、相互に関連性があることが既知である複数の収録データXの集合(以下「関連データ群」という)C1と、関連データ群C1内の収録データXとの関連性の有無が不明である複数の未知収録データXの集合(以下「未知データ群」という)C2と、未知データ群C2の複数の未知収録データXのうち関連データ群C1の収録データXとの関連性が否定された収録データXの集合(以下「無関連データ群」という)C3とを便宜的に想定する。
図6に例示される通り、第2実施形態の収録データ解析部40は、第1実施形態と同様の算定部42および評価部44に選択部48を追加した構成であり、未知データ群C2に含まれる複数の未知収録データXの各々について、関連データ群C1の複数の収録データXとの関連性の有無を評価する。
【0042】
図6の選択部48は、未知データ群C2から1個の未知収録データXを対象収録データXとして順次に選択する。第2実施形態の算定部42は、選択部48が選択した1個の対象収録データXと関連データ群C1内の複数(N−1個)の収録データXとを含むN個の収録データXについて、第1実施形態と同様に、収録データ対Pij毎に時間差Oijを算定する。第2実施形態の評価部44は、時間差Oijの合計値Sに応じて、対象収録データXについて関連データ群C1内の各収録データXとの関連性の有無(関連性がない収録データXがN個の収録データXの中に含まれるか否か)を、第1実施形態と同様に評価する。第2実施形態の評価部44は、
図7に例示される通り、対象収録データXについて関連性が肯定された場合、対象収録データXを未知データ群C2から関連データ群C1に移行する一方、対象収録データXについて関連性が否定された場合は、対象収録データXを未知データ群C2から無関連データ群C3に移行する。収録データ解析部40(選択部48,算定部42,評価部44)での処理は、未知データ群C2から収録データXがなくなるまで、つまり空になるまで反復される。第2実施形態の編集処理部46は、収録データ解析部40での処理が完了した後、関連データ群C1に含まれる複数の収録データXを相互に同期させたコンテンツZを第1実施形態と同様に生成する。
【0043】
図8は、第2実施形態における制御装置22がコンテンツZを生成する処理のフローチャートである。第1実施形態と同様に、操作装置36に対する利用者からの指示を契機として
図8の処理が開始される。
図8の処理を開始すると、選択部48は、未知データ群C2から1個の対象収録データXを選択する(SD1)。算定部42は、選択部48が選択した1個の対象収録データXと関連データ群C1内の複数(N−1個)の収録データXとを含むN個の収録データXについて、収録データ対Pij毎に時間差Oijを算定する(SA1)。評価部44は、N個の収録データ対Pijにわたる時間差Oijの合計値Sを算出する(SB1)。次に、評価部44は、N個の収録データXの中に関連性がない収録データXが含まれているか否かを、合計値Sと閾値との比較により評価する(SB2)。具体的には、N個の収録データ対Pijにわたる時間差Oijの合計値Sが所定の閾値を上回る場合、評価部44は、未知収録データXNを関連データ群C1に対する関連性がない収録データXと判定して(SB2:YES)、対象収録データXを未知データ群C2から無関連データ群C3に移行する(SB3)。他方、N個の収録データ対Pijにわたる時間差Oijの合計値Sが所定の閾値を下回る場合、評価部44は、対象収録データXを関連データ群C1に対する関連性がある収録データXと判定して(SB2:NO)、対象収録データXを未知データ群C2から関連データ群C1に移行する(SB4)。したがって、関連データ群C1の収録データXの総数が1だけ増加する。そして、対象収録データXを関連データ群C1に移行すると(すなわち関連データ群C1に対する対象収録データXの関連性が肯定されると)、評価部44は、無関連データ群C3に含まれる全ての収録データXを未知データ群C2に移行する(SB5)。すなわち、無関連データ群C3が初期化される。
【0044】
ここで、1個の対象収録データXを未知データ群C2から関連データ群C1に移行した場合、過去の評価で関連性が否定された無関連データ群C3内の収録データXについて関連性の有無を再評価すると、関連性が肯定される場合がある。例えば、
図9に例示される通り、関連データ群C1に含まれる収録データX1および収録データX2と、対象収録データXN(破線)との3個の収録データXとについて関連性を評価した場合、対象収録データXNは収録データX2と時間軸上で部分的に重複していないため、関連データ群C1(収録データX1,X2)に対する関連性がないと判定され無関連データ群C3に追加される。しかし、評価部44が収録データX3を関連データ群C1に追加した場合、無関連データ群C3に含まれる対象収録データXN(実線)は、
図9に例示される通り、収録データX3とは時間軸上で部分的に重複するため、評価部44が再び評価すると、関連データ群C1(収録データX1〜X3)に対する関連性が肯定される。そこで、対象収録データXNを未知データ群C2から関連データ群C1に移行した場合(SB4)、評価部44は、前述の通り、無関連データ群C3に含まれる全ての収録データXを未知データ群C2に移行し(SB5)、評価部44で再評価する。
【0045】
評価部44が対象収録データXを移行すると(SB3,SB4)、選択部48は、未知データ群C2に収録データXがあるか否か、つまり未知データ群C2が空であるか否かを判断する(SD2)。未知データ群C2が空である場合(SD2:YES)、編集処理部46は、関連データ群C1に含まれる複数の収録データXを相互に同期させたコンテンツZを生成する(SC1)。一方、未知データ群C2が空でない場合(SD2:NO)、収録データ解析部40は、未知データ群C2内の各未知収録データXについてステップSD1〜SB4の処理を反復する。以上に説明した通り、選択部48は、未知データ群C2から対象収録データXを選択する処理(SD1,SD2)を行い、算定部42は、N個の収録データ対Pijの時間差Oijを算定する処理(SA1)を行い、評価部44は、N個の収録データXの中に関連性がない収録データXが含まれているか否かを評価する処理(SB1〜SB5)を行う。第2実施形態の収録データ解析部40(選択部48,算定部42,評価部44)は、関連データ群C1に対する関連性がない収録データXを未知データ群C2から除外する処理と言える。
【0046】
第2実施形態においても第1実施形態と同様の効果が実現される。第2実施形態では特に、関連性の有無が不明な複数の収録データXを、関連データ群C1と無関連データ群C3とに分類することが可能である。また、第2実施形態では、対象収録データXが関連データ群C1に移行されるたびに、無関連データ群C3の収録データXが未知データ群C2に移行される。したがって、無関連データ群C3に一度は移行された収録データXでも、関連データ群C1に新たに移行された収録データXとの関連性があれば、関連データ群C1に改めて選別され得る。すなわち、関連性がある複数の収録データXを漏れなく関連データ群C1に選別することが可能である。
【0047】
<変形例>
以上に例示した各態様は多様に変形され得る。具体的な変形の態様を以下に例示する。以下の例示から任意に選択された2個以上の態様は、相互に矛盾しない範囲で適宜に併合され得る。
【0048】
(1)前述の各形態では、収録データ対Pijの各収録データXに含まれる音響信号y(t)の時間差τに応じて時間差Oijを算定したが、時間差τの算出に使用される信号は音響信号y(t)に限定されない。例えば、各収録データXの音響に共通の発話内容が含まれる場合は、各収録データXの発話内容を音声認識により解析し、解析結果を2個の収録データX間で比較することで時間差Oijを算出することも可能である。また、音響信号y(t)から抽出される特徴量(例えば音高)の時間変化を示す時間信号を2個の収録データX間で比較する(例えば相互相関Cij(τ)を算定する)ことで時間差Oijを算定してもよい。さらには、収録データ対Pijに含まれる動画を表す画像信号から、例えば画像の明度の時間変化を示す時間信号を生成し、2個の収録データX間で時間信号を比較することで時間差Oijを算定することも可能である。以上の説明から理解される通り、時間差Oijの算定に使用される信号は、収録データ対Pijの2個の収録データXの各々における収録対象(音響または動画)の時間変化を表す時間信号であれば任意である。ただし、音響信号y(t)は収録条件(例えば撮影位置)に応じた時間変動の相違が小さいという傾向を考慮すると、音響信号y(t)を使用した前述の各形態の構成では、動画等の時間信号を使用した構成と比較して、複数の収録データX1〜XNの間の時間差Oijを高精度に特定できるという利点がある。
【0049】
(2)前述の各形態では、相互相関Cij(τ)に応じて収録データ対Pijの時間差Oijを算定したが、時間差Oijの算定に利用する指標は相互相関Cij(τ)に限定されない。例えば正規化相互相関に応じて収録データ対Pijの時間差Oijを算定することも可能である。時間差Oijの算定に利用する指標は、収録データ対Pijの2個の収録データXの各々における収録対象の時間変化を表す時間信号の時間差Oijが算出できれば任意である。
【0050】
(3)前述の各形態では、相互相関Cij(τ)の絶対値|Cij(τ)|が最大となる時間差τを時間差Oijとして確定したが、相互相関Cij(τ)の絶対値|Cij(τ)|から特定される複数の候補値から時間差Oijを選択することも可能である。例えば、算定部42は、相互相関Cij(τ)の絶対値|Cij(τ)|の相異なる極大点(例えば絶対値|Cij(τ)|の移動平均の極大点)に対応する複数の時間差τを時間差Oijの候補として特定し、複数の候補値の何れかを時間差Oijとして算定する。例えば、複数の候補値のうち合計値Sの絶対値が最小となる候補値が時間差Oijとして選択される。以上の構成では、時間差Oijを高精度に特定することが可能である。
【0051】
(4)前述の各形態では、評価部44は、互いに関連性があるN−1個の収録データXと関連性が不明の1個の未知収録データXとを含むN個の収録データXの中に関連性がない収録データXが含まれているか否かを評価したが、互いに関連性がある複数の収録データXと複数の未知収録データXとを含むN個の収録データXについて、時間差Oijの合計値Sに応じて関連性の有無を評価することも可能である。すなわち、未知収録データXは複数でもよい。
【0052】
(5)前述の各形態では、編集処理部46を収録データ編集システム10に搭載したが、編集処理部46を収録データ編集システム10とは別個のサーバ装置や端末装置に搭載することも可能である。この場合、収録データ編集システム10は、相互に関連する複数の収録データXをサーバ装置や端末装置に送信する。以上の説明から理解される通り、前述の各形態における収録データ編集システム10は、N個の収録データXについて時間差Oijを解析することで、互いに関連性があるN−1個の収録データXに対して関連性がない収録データXを除外する収録データ解析部40を具備する装置(すなわち収録データ解析装置)の例示であり、本発明の収録データ解析装置において編集処理(編集処理部46)は必須ではない。
【0053】
(6)第2実施形態では、記憶装置24が記憶する複数の未知収録データXの全てについて関連性の有無を評価したが、記憶装置24が記憶する未知収録データXの一部について関連性の有無を評価することも可能である。例えば、収録データ解析部40は、各収録データXの収録期間(例えば開始時刻と終了時刻)を示す時間情報を未知収録データXとともに記憶装置24から取得し、時間情報が示す収録時間が時間軸上でN−1個の収録データXと重複する未知収録データXを特定して第2実施形態と同様の動作を実行する。すなわち、N−1個の収録データXに対して関連性がないことが明白である未知収録データXが処理対象から除外される。なお、時間情報から未知収録データXとN−1個の収録データXとの関連性の有無を評価することも可能であるが、実際には、収録装置で計測される時刻には収録装置毎に誤差が生じ得るから、第2実施形態の構成で未知収録データXの関連性の有無を評価する意義はある。以上の構成によれば、N−1個の収録データXと関連性がない未知収録データXを処理対象から除外することができるから、記憶装置24が記憶する全部の未知収録データXを処理対象とする構成と比較して、収録データ解析部40の処理負荷を軽減することが可能である。
【0054】
(7)前述の各形態で例示した収録データ解析部40は、前述の通り制御装置22とプログラムとの協働で実現される。プログラムは、コンピュータが読取可能な記録媒体に格納された形態で提供されてコンピュータにインストールされ得る。記録媒体は、例えば非一過性(non-transitory)の記録媒体であり、CD-ROM等の光学式記録媒体(光ディスク)が好例であるが、半導体記録媒体や磁気記録媒体等の公知の任意の形式の記録媒体を包含し得る。
【0055】
(8)本発明は、前述の各形態に係る収録データ解析部40の動作方法(収録データ解析方法)としても特定され得る。具体的には、本発明の第1態様に係る収録データ解析方法においては、コンピュータ(単体の装置のほか、相互に別体の複数の装置で構成されたコンピュータシステムも含む)が、N個(Nは3以上の自然数)の収録データXを循環的に配列したときに相前後する2個の収録データXで構成されるN個の収録データ対Pijの各々について、当該収録データ対Pijの2個の収録データXの各々における収録対象の時間変化を表す時間信号の時間差Oijを算定し、N個の収録データ対Pijにわたる時間差Oijの合計値Sに応じて、N個の収録データXの中に関連性がない収録データXが含まれているか否かを評価する。
【0056】
また、本発明の第2態様に係る収録データ解析方法においては、コンピュータ(単体の装置のほか、相互に別体の複数の装置で構成されたコンピュータシステムも含む)が、複数の収録データXを含む未知データ群C2から対象収録データXを順次に選択する一方、対象収録データXの選択毎に、互いに関連性がある複数の収録データXを含む関連データ群C1と当該対象収録データXとを含むN個(Nは3以上の自然数)の収録データXを循環的に配列したときに相前後する2個の収録データXで構成されるN個の収録データ対Pijの各々について、当該収録データ対Pijの2個の収録データXの各々における収録対象の時間変化を表す時間信号の時間差Oijを算定し、N個の収録データ対Pijにわたる時間差Oijの合計値Sに応じて、関連データ群C1に対する対象収録データXの関連性の有無を評価し、当該関連性が肯定された場合に当該対象収録データXを未知データ群C2から関連データ群C1に移行する。