(58)【調査した分野】(Int.Cl.,DB名)
複数の撮像装置が所定の領域を撮影することにより生成した複数の撮像画像データと、前記複数の撮像装置が前記所定の領域を撮影している複数の位置で取得された複数の音データと、を関連付けて取得するデータ取得部と、
前記複数の音データのうち少なくとも一部の音データに含まれている音のうち、所定の音以外の音の状態に基づいて、前記複数の撮像画像データのうち特定の撮像画像データである特定撮像画像データの表示態様を決定する表示態様決定部と、
前記表示態様決定部が決定した表示態様で前記特定撮像画像データを表示させるように前記複数の撮像画像データを表示部に表示させる表示制御部と、
を有する画像処理装置。
前記表示態様決定部は、前記複数の音データのうち、第1音データに対応する第1撮像画像データの前記表示部における表示サイズよりも、第1音データよりも大きな音に対応する第2音データに対応する第2撮像画像データの前記表示サイズが大きくなるように前記表示態様を決定する、
請求項2に記載の画像処理装置。
前記撮像画像データには、当該撮像画像データが取得された撮像装置を識別するための撮像装置識別情報が含まれており、前記音データには、当該音データが取得された装置を識別するための音声装置識別情報が含まれており、
前記表示態様決定部は、前記音声装置識別情報と、前記複数の撮像装置それぞれを特定するための前記撮像装置識別情報とが関連付けられた関連情報を参照することにより、前記表示態様を決定する、
請求項1から4のいずれか一項に記載の画像処理装置。
前記撮像画像データには、当該撮像画像データが取得された位置を示す第1位置情報が含まれており、前記音データには、当該音データが取得された位置を示す第2位置情報が含まれており、
前記表示態様決定部は、前記第1位置情報が示す位置から最も近い位置に対応する前記第2位置情報に対応する前記音データの状態に基づいて前記表示態様を決定する、
請求項1から5のいずれか一項に記載の画像処理装置。
複数の撮像装置が所定の領域を撮影することにより生成した複数の撮像画像データと、前記複数の撮像装置が前記所定の領域を撮影している複数の位置で取得された複数の音データと、を関連付けて取得するデータ取得部と、
前記複数の音データのうち少なくとも一部の音データが示す音の状態に基づいて、前記複数の撮像画像データのうち特定の撮像画像データである特定撮像画像データの表示態様を決定する表示態様決定部と、
前記表示態様決定部が決定した表示態様で前記特定撮像画像データを表示させるように前記複数の撮像画像データを表示部に表示させる表示制御部と、
を有し、
前記撮像画像データには、当該撮像画像データが取得された位置を示す第1位置情報が含まれており、前記音データには、当該音データが取得された位置を示す第2位置情報が含まれており、
前記表示態様決定部は、前記第1位置情報が示す位置から最も近い位置に対応する前記第2位置情報に対応する前記音データの状態に基づいて前記表示態様を決定する、画像処理装置。
【発明の概要】
【発明が解決しようとする課題】
【0004】
従来の端末は、予め定められた配置またはユーザが任意に設定した配置で複数の動画を表示していた。しかし、複数の動画のいずれかにおいて、多くのユーザの関心を惹きつけるような注目シーンが配信されても、ユーザが他の動画を閲覧している場合には当該シーンを見逃してしまう可能性があった。
【0005】
そこで、本発明はこれらの点に鑑みてなされたものであり、動画の内容に適した表示態様でユーザが複数の動画を閲覧できるようにすることを目的とする。
【課題を解決するための手段】
【0006】
本発明の第1の態様の画像処理装置は、複数の撮像装置が所定の領域を撮影することにより生成した複数の撮像画像データと、前記複数の撮像装置が前記所定の領域を撮影している複数の位置で取得された複数の音データと、を関連付けて取得するデータ取得部と、前記複数の音データのうち少なくとも一部の音データが示す音の状態に基づいて、前記複数の撮像画像データのうち特定の撮像画像データである特定撮像画像データの表示態様を決定する表示態様決定部と、前記表示態様決定部が決定した表示態様で前記特定撮像画像データを表示させるように前記複数の撮像画像データを表示部に表示させる表示制御部と、を有する。
【0007】
前記表示態様決定部は、前記少なくとも一部の音データに対応する音の大きさに基づいて前記表示態様を決定してもよい。
【0008】
前記表示態様決定部は、前記複数の音データのうち、第1音データに対応する第1撮像画像データの前記表示部における表示サイズよりも、第1音データよりも大きな音に対応する第2音データに対応する第2撮像画像データの前記表示サイズが大きくなるように前記表示態様を決定してもよい。
【0009】
前記表示態様決定部は、前記少なくとも一部の音データに対応する音の内容に基づいて前記表示態様を決定してもよい。
【0010】
前記撮像画像データには、当該撮像画像データが取得された撮像装置を識別するための撮像装置識別情報が含まれており、前記音データには、当該音データが取得された装置を識別するための音声装置識別情報が含まれており、前記表示態様決定部は、前記音識別情報と、前記複数の撮像装置それぞれを特定するための前記撮像装置識別情報とが関連付けられた関連情報を参照することにより、前記表示態様を決定してもよい。
【0011】
前記撮像画像データには、当該撮像画像データが取得された位置を示す第1位置情報が含まれており、前記音データには、当該音データが取得された位置を示す第2位置情報が含まれており、前記表示態様決定部は、前記第1位置情報が示す位置から最も近い位置に対応する前記第2位置情報に対応する前記音データの状態に基づいて前記表示態様を決定してもよい。
【0012】
前記表示態様決定部は、前記音データに含まれている音のうち、所定の音以外の音の状態に基づいて前記表示態様を決定してもよい。
【0013】
前記データ取得部は、前記複数の撮像装置それぞれに設けられた指向性マイクロフォンにより取得された前記複数の音データを取得してもよい。
【0014】
本発明の第2の態様の画像処理方法は、コンピュータが、複数の撮像装置が所定の領域を撮影することにより生成した複数の撮像画像データと、前記複数の撮像装置が前記所定の領域を撮影している複数の位置で取得された複数の音データと、を関連付けて取得するステップと、前記複数の音データのうち少なくとも一部の音データが示す音の状態に基づいて、前記複数の撮像画像データのうち特定の撮像画像データである特定撮像画像データの表示態様を決定するステップと、決定した表示態様で前記特定撮像画像データを表示させるように前記複数の撮像画像データを表示部に表示させるステップと、を実行する。
【0015】
本発明の第3の態様のプログラムは、コンピュータを、複数の撮像装置が所定の領域を撮影することにより生成した複数の撮像画像データと、前記複数の撮像装置が前記所定の領域を撮影している複数の位置で取得された複数の音データと、を関連付けて取得するデータ取得部と、前記複数の音データのうち少なくとも一部の音データが示す音の状態に基づいて、前記複数の撮像画像データのうち特定の撮像画像データである特定撮像画像データの表示態様を決定する表示態様決定部と、前記表示態様決定部が決定した表示態様で前記特定撮像画像データを表示させるように前記複数の撮像画像データを表示部に表示させる表示制御部と、として機能させる。
【発明の効果】
【0016】
本発明によれば、動画の内容に適した表示態様でユーザが複数の動画を閲覧できるようになるという効果を奏する。
【発明を実施するための形態】
【0018】
[画像処理システムSの概要]
図1及び
図2は画像処理システムSの概要を説明するための図である。画像処理システムSは、それぞれ異なるアングルから所定の領域を撮影する複数の撮像装置であるカメラC(
図1においてはC1〜C5)が出力した複数の撮像画像データに基づく画像を、画像を見る人(以下、「ユーザ」という)が使用するディスプレイに同時に表示するシステムである。カメラCは、例えば競技が開催されている競技場、又はイベントが開催されているイベント会場に設置されており、所定の領域は、それぞれのカメラCが撮影可能な領域である。本明細書において、複数のカメラC1〜C5のそれぞれを区別する必要がない場合、カメラCと称することがある。
【0019】
図1は、複数のカメラC1〜C5が競技場に設置されている状態を示す模式図である。
図2は、複数のカメラC1〜C5が作成した複数の撮像画像データに基づく画像がディスプレイに表示された状態を示す図である。撮像画像データは、例えば動画像であるが、静止画像であってもよい。
【0020】
画像処理システムSは、複数のカメラC1〜C5のそれぞれの位置で取得された音の状態に基づいて、ディスプレイに表示する画像の態様を変化させることができるという特徴を有する。音の状態は、例えば音の大きさ、音の内容又は音の周波数のように、カメラCが撮影している領域の状態と関連性がある情報により表される。画像処理システムSにおいては、例えば、大きな音が取得された位置のカメラCで撮影された画像が、ディスプレイにおいて他の画像よりも目立つように表示される。例えば、大きな音が取得された位置のカメラCで撮影された画像が、他の画像よりも大きく表示されたり、特別な枠で囲まれた状態で表示されたりする。
【0021】
図2(a)は、ディスプレイにおける複数の領域R1〜R5のそれぞれに、カメラC1〜C5で撮影された画像が表示されている状態を示している。
図2(a)においては、カメラC1で撮影された画像が、最も大きい領域R1に表示されており、他の画像は、領域R1よりも小さな領域R2〜R5に表示されている。
【0022】
図2(b)は、
図2(a)の状態の後に、カメラC5で取得された音が、他のカメラC1〜C4で取得された音よりも大きい場合にディスプレイに表示された画像の例を示している。
図2(b)においては、
図2(a)において領域R1に表示されていたカメラC1で撮影された画像に代わって、カメラC5で撮影された画像が領域R1に表示されている。画像処理システムSにおいては、このように、大きく表示される画像が、撮影された位置において取得された音の状態によって変化するので、例えば大きな歓声が起きた位置に近い位置で撮影された画像が大きく表示される。その結果、多くのユーザの関心を惹きつけるような注目シーンをユーザが見逃しにくくなる。
【0023】
図3は、画像処理システムSのシステム構成図である。画像処理システムSは、複数のカメラC(C1〜C5)と、サーバ1と、ユーザ端末2とを有する。複数のカメラC、サーバ1及びユーザ端末2は、ネットワークNを介して各種のデータを送受信する。ネットワークNは、インターネット又は携帯電話網等を含む。
【0024】
サーバ1は、ネットワークNを介して、複数のカメラCそれぞれから撮像画像データと音データを取得する。サーバ1は、取得した音データが示す音の状態に基づいて、ユーザ端末2に表示させる際の表示態様を他の画像と異なる表示態様にするべき撮像画像データを決定する。サーバ1は、決定した表示態様で複数の撮像画像データに基づく画像をユーザ端末2に表示させるようにユーザ端末2を制御する画像処理装置の一例である。
【0025】
ユーザ端末2は、サーバ1から配信される複数の撮像画像データに基づく複数の画像を表示するディスプレイを有する端末であり、例えば、スマートフォン、タブレット又はパーソナルコンピュータである。ユーザ端末2の台数は任意である。画像処理システムSにおいては、例えば、ユーザ端末2がサーバ1から複数の撮像画像データ及び少なくとも1つの音データの配信を受けて、配信された複数の撮像画像データを同時に表示するが、ユーザ端末2は、サーバ1を介することなく複数のカメラCから複数の撮像画像データ及び少なくとも1つの音データを取得し、少なくとも1つの音データが示す音の状態に基づく表示態様で複数の撮像画像データに基づく画像をディスプレイに表示してもよい。
【0026】
<第1実施形態>
まず、サーバ1が表示態様を決定する実施形態について説明する。この場合、ユーザ端末2は、サーバ1から指示された表示態様に基づいて複数の撮像画像データに基づく複数の画像をディスプレイに表示する。
【0027】
[サーバ1の構成]
図4は、サーバ1の構成を示す図である。サーバ1は、通信部11と、記憶部12と、制御部13とを有する。制御部13は、データ取得部131、表示態様決定部132及び表示制御部133を有する。
【0028】
通信部11は、ネットワークNを介して複数のカメラC及びユーザ端末2との間でデータを送受信するための通信インターフェースを有する。通信部11は、複数のカメラCから受信した複数の撮像画像データ及び音データをデータ取得部131に入力する。また、通信部11は、表示制御部133から入力された配信用の撮像画像データ及び音データを、ネットワークNを介してユーザ端末2へと送信する。
【0029】
記憶部12は、ROM(Read Only Memory)、RAM(Random Access Memory)及びハードディスク等の記憶媒体を有する。記憶部12は、制御部13が実行するプログラムを記憶している。また、記憶部12は、通信部11が受信した複数の撮像画像データを一時的に記憶する。
【0030】
制御部13は、例えばCPU(Central Processing Unit)を有しており、記憶部12に記憶されたプログラムを実行することにより、データ取得部131、表示態様決定部132及び表示制御部133として機能する。
【0031】
データ取得部131は、通信部11を介して、複数のカメラCが所定の領域を撮影することにより生成した複数の撮像画像データと、複数の撮像装置が所定の領域を撮影している複数の位置で取得された複数の音データと、を関連付けて取得する。データ取得部131は、例えば複数のカメラCそれぞれに設けられた指向性マイクロフォンにより取得された複数の音データを取得する。複数のカメラCが競技場に設置されている場合、観客席の歓声に基づいて、目立つように表示される撮像画像データが選択されるように、データ取得部131は、カメラCが撮影する向きと反対向きに指向性を有するマイクロフォンにより取得された複数の音データを取得してもよい。
【0032】
データ取得部131は、カメラCが出力した撮像画像データと、カメラCの位置において取得された音に対応する音データとを同時に取得してもよく、共通の識別情報が付された撮像画像データと音データとを別々に取得してもよい。データ取得部131は、取得した撮像画像データ及び音データを表示態様決定部132に入力する。データ取得部131は、取得した撮像画像データ及び音データを記憶部12に記憶させてもよい。
【0033】
表示態様決定部132は、複数の音データのうち少なくとも一部の音データが示す音の状態に基づいて、複数の撮像画像データのうち特定の撮像画像データである特定撮像画像データの表示態様を決定する。特定撮像画像データは、撮像画像データに関連付けてデータ取得部131が取得した音データに対応する音の状態が、他の撮像画像データに関連付けられた音データに対応する音の状態と異なる特徴を有する撮像画像データである。
【0034】
表示態様決定部132は、このような特定撮像画像データの表示態様を、他の撮像画像データよりもユーザが見る確率が高まるようにする。表示態様決定部132は、例えば、特定撮像画像データを他の撮像画像データよりも大きな表示態様に決定したり、特別な枠を付けた表示態様に決定したりする。
図2に示した例の場合、表示態様決定部132は、領域R1に特定撮像画像データが表示されるように表示態様を決定する。表示態様決定部132は、特定撮像画像データを表示する領域に、他の撮像画像データを表示する領域と異なる色の枠を表示するようにしたり、枠を点滅させるようにしたりしてもよい。表示態様決定部132は、特定撮像画像データを表示する領域に、他の撮像画像データを表示する領域には表示されないマークを表示させてもよい。
【0035】
表示態様決定部132は、少なくとも一部の音データに対応する音の大きさに基づいて表示態様を決定する。この場合、特定撮像画像データに対応する音の状態は、例えば大歓声の音を含む状態であり、他の撮像画像データに対応する音よりも大きなレベルの状態である。一例として、表示態様決定部132は、複数の音データのうち、第1音データに対応する第1撮像画像データの表示サイズよりも、第1音データよりも大きな音に対応する第2音データに対応する第2撮像画像データの表示サイズが大きくなるように表示態様を決定する。表示態様決定部132がこのように動作することで、大歓声が取得された位置のカメラCが出力した撮像画像データをユーザが視認しやすくなるので、ユーザが注目すべきシーンをユーザが見逃しにくくなる。
【0036】
表示態様決定部132は、所定の閾値以上の音量に対応する撮像画像データを特定撮像画像データとして、他の撮像画像データの表示態様と異なる表示態様にしてもよい。所定の閾値以上は、例えばユーザにより設定された値、又は大歓声の音量に対応する値である。複数の撮像画像データが特定撮像画像データに該当する場合、表示態様決定部132は、複数の特定撮像画像データを他の撮像画像データの表示態様と異なる表示態様にしてもよい。表示態様決定部132がこのように動作することで、ユーザが注目すべき画像が複数ある場合に、ユーザが複数の画像を見ることができる。
【0037】
表示態様決定部132は、少なくとも一部の音データに対応する音の内容に基づいて表示態様を決定してもよい。例えば、表示態様決定部132は、音データに含まれている音のうち、所定の音以外の音の状態に基づいて表示態様を決定する。表示態様決定部132は、音声認識をしたり、音の性状を解析したりすることにより、音データが示す音の内容が、ユーザが注目すべきシーンが撮影された位置と関係ない所定の音(例えば場内アナウンスの声又は外来音)であるか否かを判定する。表示態様決定部132は、音データが示す音の内容が、ユーザが注目すべきシーンが撮影された位置と関係ないと判定した場合、このような音データが示す音が、他の位置で取得された音よりも大きいとしても、このような音に対応する撮像画像データを他の撮像画像データと異なる表示態様にしない。
【0038】
一方、表示態様決定部132は、特定の音の内容が、ユーザが注目すべきシーンが撮影された位置と関係する内容(例えば大歓声の声)である場合、他の位置で取得された歓声以外の音よりも小さいとしても、特定の音に対応する撮像画像データを他の撮像画像データよりも目立つ表示態様にする。表示態様決定部132がこのように動作することで、ユーザが注目する必要がない画像が目立つように表示されてしまうことを防げる。
【0039】
撮像画像データには、撮像画像データが取得されたカメラCを識別するための撮像装置識別情報が含まれており、音データには、音データが取得された音声装置(例えばマイクロフォン)を識別するための音声
装置識別情報が含まれていてもよい。この場合、表示態様決定部132は、記憶部12に記憶された、音声
装置識別情報と撮像装置識別情報とが関連付けられた関連情報を参照することにより、撮像画像データに対応する音データを特定する。そして、特定した音データが示す音の状態に基づいて、表示態様を決定する。表示態様決定部132がこのように動作することで、カメラCに内蔵されていない外部マイクロフォンで音データが取得された場合であっても、音の状態に基づく表示態様にすることができる。
【0040】
撮像画像データには、当該撮像画像データが取得された位置を示す第1位置情報が含まれており、音データには、当該音データが取得された位置を示す第2位置情報が含まれていてもよい。この場合、表示態様決定部132は、第1位置情報が示す位置から最も近い位置に対応する第2位置情報に対応する音データの状態に基づいて表示態様を決定する。
【0041】
すなわち、表示態様決定部132は、第2位置情報が含まれた複数の音データをデータ取得部131が取得した場合に、撮像画像データを出力したカメラCから最も近い位置に設置されたマイクロフォンで取得された音データが示す音の状態に基づいて表示態様を決定する。表示態様決定部132がこのように動作することで、複数の外部マイクロフォンで音データが取得された場合であっても、最も適した音の状態に基づく表示態様にすることができるので、適切な表示態様にすることができる。
【0042】
表示制御部133は、表示態様決定部132が決定した表示態様で、複数の撮像画像データのうち特定の撮像画像データである特定撮像画像データを表示させるように複数の撮像画像データをユーザ端末2のディスプレイに表示させるようにユーザ端末2を制御する。表示制御部133は、例えば、最も大きな歓声を示す音データに対応する撮像データに、特定撮像画像データであることを示すフラグを付した状態で当該撮像データをユーザ端末2に送信することで、ユーザ端末2が、特定撮像画像データに対応する画像をユーザが注目しやすいように表示できるようにする。表示制御部133は、表示態様決定部132が決定した表示態様で構成された画面のデータをユーザ端末2に送信することにより、表示態様決定部132が決定した表示態様で特定撮像画像データをユーザ端末2に表示させてもよい。
【0043】
[画像処理システムSにおける動作シーケンス]
図5は、複数のカメラC、サーバ1及びユーザ端末2の動作シーケンスを示す図である。複数のカメラCは、サーバ1に対して撮像画像データ及び音データを送信する。表示態様決定部132は、データ取得部131が取得した音データが示す音の状態を特定し(S11)、特定した音の状態に基づいて、複数の撮像画像データに対応する複数の画像の表示態様を決定する(S12)。表示制御部133は、表示態様決定部132が決定した表示態様に対応する画面データを作成し(S13)、作成した画面データと音データとを関連付けてユーザ端末2に送信する。ユーザ端末2は、サーバ1から受信した画面データに基づく画面をディスプレイに表示する(S14)。
【0044】
複数のカメラC、サーバ1及びユーザ端末2は、複数のカメラCが撮像画像データ及び音データを送信している間、
図5に示す処理を繰り返す。複数のカメラC、サーバ1及びユーザ端末2がこのように動作することで、ユーザ端末2が、
図2(b)に示したように、多くのユーザの関心を惹きつけるような注目シーンをユーザが見やすいようにディスプレイに表示することができる。
【0045】
<第2の実施形態>
第1の実施形態においては、サーバ1が音の状態に基づいて表示態様を決定したが、ユーザ端末2が表示態様を決定してもよい。この場合、サーバ1は、複数のカメラCとユーザ端末2との間で撮像画像データを中継する中継装置として機能する。
【0046】
図6は、ユーザ端末2の構成を示す図である。ユーザ端末2は、表示部20と、通信部21と、記憶部22と、制御部23とを有する。制御部23は、データ取得部231、表示態様決定部232及び表示制御部233を有する。
【0047】
表示部20は、複数の撮像画像データに基づく画像を表示するディスプレイである。表示部20は、表示制御部233が作成した画面データを表示する。
【0048】
通信部21は、ネットワークNを介してサーバ1から撮像画像データ及び音データを受信するための通信インターフェースである。通信部21は、受信した撮像画像データ及び音データをデータ取得部231に入力する。
【0049】
記憶部22は、ROM及びRAMを含む記憶媒体である。記憶部22は、制御部23が実行するプログラムを記憶している。記憶部22は、通信部21が受信した撮像画像データ及び音データを一時的に記憶してもよい。
【0050】
制御部23は、例えばCPUを有しており、記憶部22に記憶されたプログラムを実行することにより、データ取得部231、表示態様決定部232及び表示制御部233として機能する。
【0051】
データ取得部231は、第1実施形態に係るサーバ1が有するデータ取得部131と同等の動作を実行する。例えば、データ取得部231は、通信部21を介して、複数のカメラCが所定の領域を撮影することにより生成した複数の撮像画像データと、複数の撮像装置が所定の領域を撮影している複数の位置で取得された複数の音データと、を関連付けて取得する。データ取得部231は、取得した撮像画像データ及び音データを表示態様決定部232に入力する。
【0052】
表示態様決定部232は、第1実施形態に係るサーバ1が有する表示態様決定部132と同等の動作を実行する。例えば、表示態様決定部232は、複数の音データのうち少なくとも一部の音データが示す音の状態に基づいて、複数の撮像画像データのうち特定の撮像画像データである特定撮像画像データの表示態様を決定する。表示態様決定部232は、データ取得部131が実行する他の動作も実行することができる。表示態様決定部232は、決定した表示態様を表示制御部233に通知する。
【0053】
表示制御部233は、第1実施形態に係るサーバ1が有する133と同等の動作を実行する。例えば、表示制御部233は、表示態様決定部232が決定した表示態様で、複数の撮像画像データのうち特定の撮像画像データである特定撮像画像データを表示させるように複数の撮像画像データを表示部20に表示させる。表示制御部233は、例えば、表示態様決定部232が決定した表示態様に基づいて
図2に示したような画面のデータを作成し、作成したデータを表示部20に送信することにより、
図2に示したような画面を表示部20に表示させる。
【0054】
図7は、第2の実施形態における複数のカメラC、サーバ1及びユーザ端末2の動作シーケンスを示す図である。複数のカメラCは、サーバ1に対して撮像画像データ及び音データを送信する。サーバ1は、受信した撮像画像データ及び音データを、予め登録された一以上のユーザ端末2に対して配信する。
【0055】
ユーザ端末2の表示態様決定部232は、データ取得部231が取得した音データが示す音の状態を特定し(S21)、特定した音の状態に基づいて、複数の撮像画像データに対応する複数の画像の表示態様を決定する(S22)。表示制御部233は、表示態様決定部232が決定した表示態様に対応する画面データを作成し(S23)、作成した画面データを表示部20に表示させる(S24)。
【0056】
複数のカメラC、サーバ1及びユーザ端末2は、複数のカメラCが撮像画像データ及び音データを送信している間、
図7に示す処理を繰り返す。複数のカメラC、サーバ1及びユーザ端末2がこのように動作することで、ユーザ端末2が、
図2(b)に示したように、多くのユーザの関心を惹きつけるような注目シーンをユーザが見やすいようにディスプレイに表示することができる。
【0057】
[画像処理システムSによる効果]
以上説明したように、画像処理システムSにおいては、サーバ1又はユーザ端末2が、複数のカメラCが出力した複数の撮像画像データ及び複数の音データを取得すると、複数の音データのうち少なくとも一部の音データが示す音の状態に基づいて、複数の撮像画像データのうち特定の撮像画像データである特定撮像画像データの表示態様を決定する。そして、ユーザ端末2は、
図2(b)に示したように、例えば大きな歓声を含む音データに対応する撮像画像データを、他の撮像画像データよりも大きく表示する。画像処理システムSがこのように構成されていることで、例えばユーザが注目すべき画像をユーザが見逃すことがないように、動画の内容に適した表示態様でユーザが複数の動画を閲覧できるようになる。
【0058】
以上、本発明を実施の形態を用いて説明したが、本発明の技術的範囲は上記実施の形態に記載の範囲には限定されず、その要旨の範囲内で種々の変形及び変更が可能である。例えば、装置の全部又は一部は、任意の単位で機能的又は物理的に分散・統合して構成することができる。また、複数の実施の形態の任意の組み合わせによって生じる新たな実施の形態も、本発明の実施の形態に含まれる。組み合わせによって生じる新たな実施の形態の効果は、もとの実施の形態の効果を併せ持つ。
【解決手段】サーバ1は、複数のカメラが所定の領域を撮影することにより生成した複数の撮像画像データと、複数のカメラが所定の領域を撮影している複数の位置で取得された複数の音データと、を関連付けて取得するデータ取得部131と、複数の音データのうち少なくとも一部の音データが示す音の状態に基づいて、複数の撮像画像データのうち特定の撮像画像データである特定撮像画像データの表示態様を決定する表示態様決定部132と、表示態様決定部132が決定した表示態様で特定撮像画像データを表示させるように複数の撮像画像データをユーザ端末のディスプレイに表示させる表示制御部133と、を有する。