IP Force 特許公報掲載プロジェクト 2022.1.31 β版

知財求人 - 知財ポータルサイト「IP Force」

▶ 株式会社GRAVITASの特許一覧

特許7118379映像編集装置、映像編集方法、及びコンピュータプログラム
<>
  • 特許-映像編集装置、映像編集方法、及びコンピュータプログラム 図1
  • 特許-映像編集装置、映像編集方法、及びコンピュータプログラム 図2
  • 特許-映像編集装置、映像編集方法、及びコンピュータプログラム 図3
  • 特許-映像編集装置、映像編集方法、及びコンピュータプログラム 図4
  • 特許-映像編集装置、映像編集方法、及びコンピュータプログラム 図5
  • 特許-映像編集装置、映像編集方法、及びコンピュータプログラム 図6
  • 特許-映像編集装置、映像編集方法、及びコンピュータプログラム 図7
  • 特許-映像編集装置、映像編集方法、及びコンピュータプログラム 図8
  • 特許-映像編集装置、映像編集方法、及びコンピュータプログラム 図9
  • 特許-映像編集装置、映像編集方法、及びコンピュータプログラム 図10
  • 特許-映像編集装置、映像編集方法、及びコンピュータプログラム 図11
  • 特許-映像編集装置、映像編集方法、及びコンピュータプログラム 図12
  • 特許-映像編集装置、映像編集方法、及びコンピュータプログラム 図13
  • 特許-映像編集装置、映像編集方法、及びコンピュータプログラム 図14
< >
(19)【発行国】日本国特許庁(JP)
(12)【公報種別】特許公報(B1)
(11)【特許番号】
(24)【登録日】2022-08-05
(45)【発行日】2022-08-16
(54)【発明の名称】映像編集装置、映像編集方法、及びコンピュータプログラム
(51)【国際特許分類】
   H04N 5/91 20060101AFI20220808BHJP
   H04N 5/92 20060101ALI20220808BHJP
   H04N 5/765 20060101ALI20220808BHJP
   H04N 21/854 20110101ALI20220808BHJP
   H04N 5/265 20060101ALI20220808BHJP
【FI】
H04N5/91
H04N5/92 010
H04N5/765
H04N21/854
H04N5/265
【請求項の数】 9
(21)【出願番号】P 2021025637
(22)【出願日】2021-02-19
【審査請求日】2021-03-16
【早期審査対象出願】
【前置審査】
(73)【特許権者】
【識別番号】521075262
【氏名又は名称】株式会社GRAVITAS
(74)【代理人】
【識別番号】100099324
【弁理士】
【氏名又は名称】鈴木 正剛
(72)【発明者】
【氏名】田所 貴司
【審査官】川中 龍太
(56)【参考文献】
【文献】特開2018-117312(JP,A)
【文献】米国特許出願公開第2019/0076741(US,A1)
【文献】特開2012-195811(JP,A)
【文献】特開2019-169851(JP,A)
【文献】国際公開第2014/024475(WO,A1)
【文献】国際公開第2015/125815(WO,A1)
【文献】特開2009-296159(JP,A)
【文献】国際公開第2006/129496(WO,A1)
(58)【調査した分野】(Int.Cl.,DB名)
H04N 5/76 - 5/956
G11B 27/00 - 27/06
H04N 21/854
H04N 5/265
(57)【特許請求の範囲】
【請求項1】
一つのイベントを複数の撮影装置で撮影して得られ、前記一つのイベントの 映像作品成に用いられた未編集の複数の素材映像を格納する映像格納手段と、
前記複数の素材映像を用いてユーザの要求に応じた前記一つのイベントの編集映像を作成する編集手段と、を備え、
前記編集手段は、前記映像格納手段に格納されている前記複数の素材映像の各々に対して、シーン毎に、映っている内容がわかるようにメタデータを付加し、外部から編集基準が入力されたときに当該編集基準と前記複数の素材映像との合致度を前記メタデータに基づいて算出するとともに、前記合致度に応じて抽出したいくつかの素材映像を用いて前記編集映像を作成することを特徴とする、映像編集装置。
【請求項2】
前記編集手段は、前記複数の素材映像のそれぞれについてシーン毎に前記編集基準への合致度を算出し、シーン毎に合致度が最も高い素材映像を抽出し、抽出した素材映像を用いて前記編集映像を作成することを特徴とする、
請求項1記載の映像編集装置。
【請求項3】
前記編集手段は、予め素材映像に映っている人物の顔画像を学習しており、各素材映像から顔認証技術によりシーン毎の人物を抽出し、抽出した人物を該シーンにタグ付けしておき、前記編集基準への合致度をシーン毎のタグに基づいて算出することを特徴とする、
請求項1又は2記載の映像編集装置。
【請求項4】
前記編集基準を入力するユーザ端末を操作するユーザの登録情報を格納する登録情報格納手段と、
前記編集映像を、該編集映像を作成するための前記編集基準を入力したユーザの登録情報に紐付けて格納する編集映像格納手段と、
前記編集映像を他のユーザのユーザ端末へ出力可能にする映像出力手段と、をさらに備えることを特徴とする、
請求項1~のいずれか1項記載の映像編集装置。
【請求項5】
前記登録情報格納手段は、前記登録情報に該ユーザの嗜好を表す嗜好データを付加して格納しており、
前記編集手段は、前記編集基準及び前記嗜好データに基づいて前記編集映像を作成することを特徴とする、
請求項記載の映像編集装置。
【請求項6】
前記編集映像と該編集映像の作成に用いられた前記編集基準に基づいて、該編集基準を入力したユーザの嗜好データを学習する学習手段をさらに備えることを特徴とする、
請求項記載の映像編集装置。
【請求項7】
前記素材映像と同期して録音された録音データを格納する録音データ格納手段と、
作成された前記編集映像を表示する表示手段と、
前記編集映像を前記表示手段に表示させる際に、前記編集映像に含まれる録音データを前記録音データ格納手段から抽出して所定のスピーカへ出力する音出力手段と、をさらに備えることを特徴とする、
請求項1~のいずれか1項記載の映像編集装置。
【請求項8】
一つのイベントを複数の撮影装置で撮影して得られ、前記一つのイベントの 映像作品成に用いられた未編集の複数の素材映像を格納する映像格納手段を備えた装置により実行される方法であって、
前記映像格納手段に格納されている前記複数の素材映像の各々に対して、シーン毎に、映っている内容がわかるようにメタデータを付加するステップと、
外部から編集基準を取得するステップと、
前記編集基準と前記素材映像との合致度を前記メタデータに基づいて算出するステップと、
算出された前記合致度に応じたいくつかの素材映像を前記映像格納手段から抽出するステップと、
抽出した素材映像を用いてユーザの要求に応じた前記一つのイベントの編集映像を作成するステップと、を含む、
映像編集方法。
【請求項9】
コンピュータを、請求項1~のいずれか1項記載の映像編集装置として動作させるためのコンピュータプログラム。
【発明の詳細な説明】
【技術分野】
【0001】
本発明は、商用の映像作品の作成に用いられた複数の映像を編集して別の映像を作成するための映像編集装置に関する。
【背景技術】
【0002】
コンサートのようなイベントを映像作品として商品化する場合、複数台、例えば30台程度のビデオカメラにより様々なアングルから撮影された映像を編集して一本の映像作品とすることが多い。編集前の映像を「素材映像」と呼ぶ。映像作品は、記録媒体に記録されて販売あるいは配信される。商用の映像作品は、複数のビデオカメラから得られる複数の素材映像、特定の編集基準、例えば特定目的に適合するプロフェッショナルな基準に基づいて一つの映像に選別・編集されて作成されるのが通常である。また、撮影前に所定のシナリオを作成し、このシナリオに基づいて自動的に素材映像を編集する装置もある。特許文献1には、シナリオに基づいて撮影素材を編集することで映像作品を作成する技術が開示されている。
【先行技術文献】
【特許文献】
【0003】
【文献】特開2002-016871号公報
【発明の概要】
【発明が解決しようとする課題】
【0004】
複数のビデオカメラから得られた複数の素材映像は、映像作品となる映像以外の部分が使用されない。映像作品に使用されない素材映像は日の目を見ることが無く、通常はそのまま死蔵される。しかし、ユーザにとっては素材映像の映像作品に含まれない部分に自身が欲する映像が含まれる場合がある。素材映像の映像作品に含まれない部分をユーザに開放するサービスは、現状提供されていない。
【0005】
本発明は、上述の問題に鑑み、素材映像をユーザが編集して独自の映像作品を作成することが可能な映像編集装置を提供することを目的とする。
【課題を解決するための手段】
【0006】
本発明の映像編集装置は、一つのイベントを複数の撮影装置で撮影して得られ、前記一つのイベントの映像作品成に用いられた未編集の複数の素材映像を格納する映像格納手段と、前記複数の素材映像を用いてユーザの要求に応じた前記一つのイベントの編集映像を作成する編集手段と、を備え、前記編集手段は、前記映像格納手段に格納されている前記複数の素材映像の各々に対して、シーン毎に、映っている内容がわかるようにメタデータを付加し、外部から編集基準が入力されたときに当該編集基準と前記複数の素材映像との合致度を前記メタデータに基づいて算出するとともに、前記合致度に応じて抽出したいくつかの素材映像を用いて前記編集映像を作成することを特徴とする。
【発明の効果】
【0007】
本発明によれば、第1編集基準の下では使用されなかった素材映像をユーザが第2編集基準の下で編集して独自の映像作品を作成することが可能となる。
【図面の簡単な説明】
【0008】
図1】映像編集システムの構成説明図。
図2】映像編集装置の機能ブロック図。
図3】映像データ取得の説明図。
図4】(a)~(d)は、データ構成の例示図。
図5】ユーザ端末の機能ブロック図。
図6】選択画面の例示図。
図7】操作画面の例示図。
図8】タグ付けの説明図。
図9】(a)、(b)は、シーン抽出の説明図。
図10】編集映像の説明図。
図11】映像編集シーケンスのシーケンス図。
図12】ホーム画面の例示図。
図13】表示画面の例示図。
図14】(a)、(b)は、変形例の映像編集装置の構成説明図。
【発明を実施するための形態】
【0009】
以下に、本発明の実施形態について図面を用いて説明する。
(全体構成)
図1は、本発明を適用した、映像編集装置を含む映像編集システムの構成説明図である。この映像編集システム1は、映像編集装置10とユーザ端末20とがネットワークNを介して通信可能に構成される。映像編集装置10は、複数の映像データを格納したサーバである。ユーザ端末20は、パーソナルコンピュータ、スマートフォン、タブレット端末等、ユーザが自己の管理下で操作可能な情報処理端末である。ユーザ端末20は、図1では二台示しているが、台数は任意であり、一台であっても良く、あるいは三台以上であってもよい。
【0010】
映像編集装置10は、CPU(Central Processing Unit)101、ROM(Read Only Memory)102、RAM(Random Access Memory)103、ストレージ104を含むコンピュータ部品と、通信インタフェース(I/F)105とを備える。コンピュータ部品と通信I/F105は、バス106を介して通信可能に接続される。CPU101は、ROM102に格納されたコンピュータプログラムを実行することで映像編集装置10の動作を制御する。RAM103は、CPU101が処理を実行する際の作業領域を提供する。
【0011】
ストレージ104は、HDD(Hard Disk Drive)、SSD(Solid State Drive)等の大容量記憶装置である。ストレージ104には、コンサート、演劇等のイベントの出演者(アーティスト)を撮影した素材映像を含む複数の映像データが格納される。ストレージ104には、また、複数の映像データが得られたイベントで集音された音声を含む音声データも格納される。通信インタフェース105は、ネットワークNの通信プロトコルに応じた通信をユーザ端末20との間で行う。
【0012】
ユーザ端末20は、CPU201、ROM202、RAM203、通信インタフェース(I/F)204、操作部205、ディスプレイ206、及びスピーカ207を備える。各部は、バス208を介して通信可能に接続される。CPU201は、ROM202に格納されたコンピュータプログラムを実行することにより、ユーザ端末20の動作を制御する。RAM203は、CPU201が処理を実行する際の作業領域を提供する。
【0013】
操作部205は、入力インタフェースであり、後述するユーザからの様々な操作入力を受け付ける。受け付ける操作入力は、例えば映像編集装置10に格納される複数の映像データを編集するための指示、その他の情報処理の指示である。操作部205を通じて入力された指示はCPU201へ送信される。CPU201は、操作部205から取得した指示に応じた情報処理を行う。ディスプレイ206は、CPU201の制御により、ユーザによる指示の入力を行う際の入力画面や、映像編集装置10から取得した映像を表示する。スピーカ207は、CPU201の制御により、映像編集装置10から取得した音声を出力する。通信インタフェース204は、ネットワークNの通信プロトコルに応じた通信を映像編集装置10との間で行う。
【0014】
このような構成の映像編集システム1では、ユーザ端末20が、操作部205から入力された指示の内容に応じて、ユーザの嗜好に基づく編集基準を含む編集指示を生成する。ユーザ端末20は、生成した編集指示を、通信インタフェース204によりネットワークNを介して映像編集装置10へ送信する。
【0015】
映像編集装置10は、通信インタフェース105によりユーザ端末20から送信された編集指示を取得する。映像編集装置10は、取得した編集指示に基づいてストレージ104内の複数の映像データを編集して一つの編集映像を表す編集映像データを生成する。映像編集装置10は、編集映像データ及び該編集映像データに同期した音声データを、通信インタフェース105によりネットワークNを介してユーザ端末20へ送信する。
【0016】
ユーザ端末20は、通信インタフェース204により映像編集装置10から送信された編集映像データ及び音声データを取得する。ユーザ端末20は、取得した編集映像データを処理して得られた編集映像をディスプレイ206に表示し、且つ取得した音声データを処理して得られた音声をスピーカ207から出力する。このようにしてユーザ端末20のユーザは、自身の嗜好に合った映像及び音声を視聴することができる。
【0017】
次に、映像編集装置10及びユーザ端末20について詳細に説明する。
(映像編集装置)
図2は、映像編集装置10の機能ブロック図である。各機能ブロックは、CPU101がコンピュータプログラムを実行することで実現されるほか、少なくとも一部がハードウェアにより実現されてもよい。映像編集装置10は、映像格納部110、音声格納部111、登録情報格納部112、編集映像格納部113、映像編集部114、ユーザ管理部115、嗜好学習部116、入力部117、及び出力部118として機能する。つまり、コンピュータ部品をこのような機能ブロックとして動作させる。
【0018】
映像格納部110、音声格納部111、登録情報格納部112、及び編集映像格納部113は、CPU101及びストレージ104により実現される。映像編集部114、ユーザ管理部115、及び嗜好学習部116は、CPU101により実現される。入力部117及び出力部118は、CPU101及び通信インタフェース105により実現される。
【0019】
映像格納部110は、複数の映像データを格納する。複数の映像データは、一つのイベント会場に設置された複数のビデオカメラにより撮影された素材映像を含む。これらの素材映像は、イベントに関する商用の映像作品を作成(編集)する際に用いられた素材映像であるが、クリエータによるプロフェッショナルな編集基準に基づいて編集された編集映像(第1編集映像)から除外された未編集状態の素材映像である。このような未編集の素材映像は、従来は映像作品の作成後に廃棄されるのが一般的であった。
【0020】
図3は、映像データ取得の説明図である。図3はコンサート会場で用いられる複数の撮影装置(ビデオカメラC1~C25)の配置例を示す。各ビデオカメラC1~C25は、ステージ300上を様々なアングルから撮影するように配置されている。本例の場合、ビデオカメラC1~C16は、客席からステージ300を撮影する。ビデオカメラC17~C19は、ステージ300上で使用される。ビデオカメラC20~C22は、クレーン等の特別機材に設置されてステージ300を撮影する。ビデオカメラC23はステージ300を中央から撮影し、ビデオカメラC24はステージ300を右側から撮影し、ビデオカメラC25はステージ300を左側から撮影する。
【0021】
各ビデオカメラC1~C25には、それぞれ役割が与えられている。本例では、ビデオカメラC1、C3、C5、C7、C9は、それぞれ特定の出演者の顔のアップを撮影する。ビデオカメラC2、C4、C6、C8、C10は、それぞれ特定の出演者の全身を撮影する。ビデオカメラC11~C13は、全出演者を撮影する。ビデオカメラC14~C16は、メインで歌っている出演者を撮影する。ビデオカメラC17、C18は、ステージ300で近距離から他の出演者(メンバー)を撮影する。ビデオカメラC19は、演奏者を撮影する。また、ビデオカメラC1~C25の他に、楽屋でメンバーを撮影するためのビデオカメラが用いられてもよい。
【0022】
各ビデオカメラC1~C25で撮影された映像は、素材映像としてクリエータにより映像作品の作成に用いられた後に、ストレージ104の映像格納部110に格納される。なお、ビデオカメラC1~C25の撮影と同時に、コンサート会場(イベント会場)では、集音装置により音声が録音される。録音された音声を含む音声データは、音声格納部111に格納される。
【0023】
登録情報格納部112は、ユーザ端末20により映像格納部110に格納された素材映像の編集の指示を行うユーザの登録情報を含む登録データを格納する。編集映像格納部113は、ユーザの指示により編集作成された編集映像を含む編集映像データを格納する。
【0024】
図4は、映像格納部110、音声格納部111、登録情報格納部112、及び編集映像格納部113に格納される各データのデータ構成の例示図である。図4(a)は、映像格納部110に格納される映像データの構成例示図である。図4(b)は、音声格納部111に格納される音声データの構成例示図である。図4(c)は、登録情報格納部112に格納される登録データの構成例示図である。図4)は、編集映像格納部113に格納される編集映像データの構成例示図である。
【0025】
図4(a)の映像データは、素材映像に、その素材映像が撮影されたイベントを識別するイベントID及び該素材映像を撮影したビデオカメラを識別するカメラIDが付与された構造のものである。素材映像は、イベントID及びカメラIDにより、どのイベントのどのビデオカメラで撮影された映像であるかを特定することができる。
【0026】
コンサートを撮影した素材映像の多くは、再生時間が2時間程度である。素材映像に映る出演者は、シーンに応じて変化する。そのために素材映像には、シーン毎に映っている出演者及びその表情がわかるようにタグ付けされる。その際、一画面に映る出演者が複数であれば、できるだけ中央に位置し且つ大きく映る出演者がわかるようなタグ付けや、全ての出演者がわかるようなタグ付けが行われる。素材映像には、このようなタグや再生時間がメタデータとして付加されている。
【0027】
図4(b)の音声データは、音声に、その音声が録音されたイベントを識別するイベントIDが付与された構造のものである。映像データと音声データとはイベントIDにより紐付けされる。再生時には、映像と音声が同期して再生される。そのための同期信号が映像データと音声データに含まれる。
【0028】
図4(c)の登録データは、ユーザの個人情報(登録情報)に、ユーザを識別するユーザID及びそのユーザが作成した編集映像を識別する編集映像IDが付与された構造のものである。登録データには、そのユーザの嗜好を表す後述の嗜好データが付加される。ユーザの個人情報は、ユーザがユーザ端末20の操作部205から入力する。
【0029】
映像編集装置10は、ユーザ管理部115により登録情報格納部112を管理する。ユーザ管理部115は、ユーザ端末20から取得したユーザの個人情報にユーザIDを付与して登録データを作成し、登録情報格納部112に格納する。個人情報は、ユーザの名前や連絡先、ログイン時のパスワード等である。編集映像IDは、該ユーザが素材映像を独自に編集して編集映像を作成した際に、該編集映像を識別するために付与される。編集映像IDは、ユーザが編集映像を作成するたびに登録データに追加される。
【0030】
図4(d)の編集映像データは、ユーザが作成した編集映像に編集映像IDが付与された構造のものである。映像編集部114は、編集映像に編集映像IDを付与して作成した編集映像データを編集映像格納部113に格納する。ユーザ管理部115は、編集映像に編集映像IDが付与されると、該編集映像を作成したユーザの登録データに該編集映像IDを追加する。編集映像IDにより、登録データと編集映像が紐付けられる。編集映像は、映像が再生可能であればよく、映像そのものの他に、例えば編集映像に使用された素材映像のシーンを指示する情報を組み合わせて構成されていてもよい。例えば、編集映像は、再生時間が0秒~5秒は第1の素材映像のシーンを指示し、再生時間が5秒~8秒は第2の素材映像のシーンを指示し、…といったように、再生時間と使用する素材映像のシーンが明確になるような情報の組み合わせであってもよい。
【0031】
映像編集部114は、映像格納部110に格納された複数の素材映像をユーザ端末20から取得する編集指示に含まれる編集基準(第2編集基準)に基づいて編集し、ユーザの嗜好に合った編集映像を作成する。映像編集部114は、編集映像の作成前に素材映像を解析し、例えば顔認証技術により、シーン毎の映像内の出演者を特定する。映像編集部114は、特定した出演者がわかるように、上記の通り素材映像にタグ付けを行う。
【0032】
映像編集部114は、編集基準と各素材映像に付加されたタグにより、編集基準に合致する映像を判定して複数の素材映像から抽出する。映像編集部114は、抽出した映像を組み合わせることで、一つの編集映像を作成する。映像編集部114は、例えば編集基準との合致度を各素材映像のシーン毎に算出する。映像編集部114は、シーン毎に合致度が最も高い素材映像を抽出して編集映像を作成する。その際、映像編集部114は、該ユーザの嗜好データがあれば、嗜好データと編集基準を用いて合致度を算出してもよい。嗜好データを加味することで、よりユーザの嗜好に合致した編集映像が自動的に得られる。
編集映像は、ユーザ端末20へ送信されるとともに、編集映像IDを付与されて編集映像格納部113へ格納される。
【0033】
嗜好学習部116は、編集基準及び編集映像を教師データとしてユーザの嗜好を学習する。嗜好学習部116は、ユーザ端末20から取得した編集基準と、該編集基準基づいて作成された編集映像とを取得する。嗜好学習部116は、取得した編集基準と編集映像により機械学習を行い、該ユーザの嗜好データを作成する。嗜好データは、ユーザ管理部115により当該ユーザの登録データに付加される。嗜好学習部116は、ユーザが編集映像の作成を指示するたびに機械学習を行い、嗜好データを更新する。そのため、ユーザが編集映像を多数作成することで、よりユーザの嗜好に合った編集映像が作成される。
【0034】
入力部117は、ユーザ端末20から送信される編集指示等の指示を取得する。出力部118は、編集映像を表す編集映像データと該編集映像に対応する音声データをユーザ端末20へ送信する。
【0035】
(ユーザ端末)
次に、ユーザ端末20の構成例を説明する。図5は、ユーザ端末20の機能ブロック図である。各機能は、CPU201がコンピュータプログラムを実行することで実現されるほか、少なくとも一部がハードウェアにより実現されてもよい。本実施形態では、ユーザ端末20に映像編集装置10を用いて編集映像を作成するためのアプリケーションソフトウェアをインストールして実行することで、各機能が実現される例を説明する。
【0036】
ユーザ端末20は、入力部210、出力部211、出力制御部212、送信データ生成部213、及び通信制御部214として機能する。つまり、このような機能ブロックとして動作する。入力部210は、CPU201及び操作部205により実現される。出力部211は、CPU201、ディスプレイ206、及びスピーカ207により実現される。出力制御部212及び送信データ生成部213は、CPU201により実現される。通信制御部214は、CPU201及び通信インタフェース204により実現される。
【0037】
入力部210は、操作部205によりユーザが入力した指示等を受け付ける。出力部211は、出力制御部212の制御により、ディスプレイ206に画面を表示し、スピーカ207から音を出力する。送信データ生成部213は、入力部210で受け付けた指示等に基づいて、映像編集装置10へ送信する送信データを生成する。
【0038】
映像編集装置10への送信データとして編集指示を生成する処理について説明する。この場合、出力制御部212は、映像編集装置10を用いて編集映像を作成するための操作画面をディスプレイ206に表示させる。映像編集装置10を用いて編集映像を作成するためのアプリケーションソフトウェアが実行されると、ディスプレイ206には、まず、どのイベントの素材映像を編集するかを選択する選択画面が表示される。図6は選択画面の例示図である。選択画面には、イベント名とイベントの開催日が表示される。ユーザは、操作部205により、選択画面から編集するイベントを選択する。
【0039】
イベントが選択されると、ディスプレイ206には、編集基準を設定するための操作画面が表示される。図7は、この場合の操作画面の例示図である。操作画面は、メインビューワ701、メンバー選択ボタン702、パラメータ調整バー703、物販フィールド704、共有ボタン705、及び保存ボタン706を含む。メインビューワ701には、編集映像が表示される。メンバー選択ボタン702及びパラメータ調整バー703は、ユーザが所望の編集基準を入力するために用いられる。物販フィールド704は、選択画面で選択されたイベントの関連グッズを紹介するフィールドであり、関連グッズの販売サイトにリンクされている。
【0040】
ユーザは、メンバー選択ボタン702により希望のメンバーを選択する。メンバー選択ボタン702により選択されるメンバーは、当該イベントの出演者である。ユーザは、パラメータ調整バー703により希望メンバーの映り具合(引き/寄せ)、他のメンバーの映り具合、おすすめの映像等を設定することができる。送信データ生成部213は、これらの設定を編集基準として編集指示を作成する。
【0041】
通信制御部214は、映像編集装置10との間で通信を行う。例えば通信制御部214は、映像編集装置10へ編集指示を送信する。通信制御部214は、編集指示に基づいて編集された編集映像データ及び音声データを映像編集装置10から取得して出力制御部212へ送信する。出力制御部212は、取得した編集映像データに基づく編集映像をメインビューワ701に表示し、取得した音声データに基づく音声をスピーカ207から出力する。これによりユーザは、自身の嗜好に合った編集映像を視聴することができる。
【0042】
(映像編集)
以上のような映像編集システム1による映像編集の一例について説明する。上記の通り映像編集は映像編集部114により行われる。ここでは、編集基準として「メンバーA」の寄せ画像が設定された場合について説明する。
【0043】
映像編集部114は、予め各メンバーの顔画像を学習しており、各素材映像から顔認証技術によりメンバーを抽出する。例えば、映像編集部114は、素材映像のシーン毎にメンバーを抽出する。映像編集部114は、例えば映像に含まれるメンバーが変化するたびにシーンが切り替わったと判断する。映像編集部114は、抽出したメンバーを素材映像の該シーンにタグ付けする。図8は、素材映像にメンバーのタグ付けを行った場合の説明図である。
【0044】
図8の素材映像は、主にメンバーAを撮影するビデオカメラで撮影された映像である。図8では、第1シーン(再生時間t0~t1)に、「メンバーA、C、D」がタグ付けされる。第2シーン(再生時間t1~t2)に、「メンバーA、B」がタグ付けされる。第3シーン(再生時間t2~t3)に、「メンバー全員」がタグ付けされる。第4シーン(再生時間t3~t4)に、「メンバーA」がタグ付けされる。第5シーン(再生時間t5~)に、「メンバーA、F」がタグ付けされる。
【0045】
すべての素材映像にタグ付けした映像編集部114は、編集基準に基づいて編集映像を編集する。編集基準としてメンバーAが指定されている場合には、各素材映像からメンバーAが含まれる映像(シーン)が抽出されて編集映像が作成される。図9は、シーン抽出の説明図である。図9(a)、図9(b)は、同じタイミングで異なるビデオカメラにより撮影された映像である。いずれの映像にもメンバーA、B、Cの三人が含まれる。
【0046】
この場合、図9(a)の映像ではメンバーAが最も大きく映し出され、図9(b)の映像ではメンバーAが二番目に大きく映し出される。映像編集部114は、それぞれの映像に対して編集基準との合致度を算出する。編集基準が「メンバーA」の寄せ画像であるため、図9(a)の合致度が図9(b)の合致度よりも高い値となる。そのために映像編集部114は、図9(a)の映像を含むシーンを抽出することになる。この際、映像編集部114は、ユーザの嗜好データを合致度の基準に付加してもよい。例えばユーザが映像の中心にメンバーAが映されることを好む場合、映像中のメンバーAの大きさの他に、メンバーAの位置も合致度に含まれることになる。
【0047】
映像編集部114は、このように各素材映像から抽出したシーンを組み合わせて編集映像を作成する。図10は、シーンを組み合わせた編集映像の説明図である。図10では、複数のビデオカメラから得られた複数の素材映像に対して映っているメンバーのタグ付けがシーン毎に行われており、映像編集部114は、タグにより編集基準に合致した編集映像を自動的に作成する。
【0048】
映像編集部114は、編集基準が「メンバーA」である場合に、各素材映像から「メンバーA」のタグが付加されたシーンを取り込んで組み合わせ、編集映像を作成する。複数の素材映像で同じタイミングでメンバーAがタグ付けされている場合、映像編集部114は、図9で説明したような合致度に応じて取り込むシーンを選択する。図10の編集映像は、各素材映像から網掛けで示されるシーンが選択されて構成される。従来のプロフェッショナルな編集基準では各メンバーに偏りなくシーンが選択されて映像作品が完成する。これに対して本実施形態のようにユーザの嗜好に基づく編集基準では、メンバーに偏りのある編集映像が作成される。
【0049】
(映像編集シーケンス)
以上のような構成の映像編集システム1による映像編集シーケンスについて説明する。図11は、映像編集シーケンスのシーケンス図である。前提として、ユーザはユーザ登録されており、複数の素材映像は映像格納部110に格納されている。
【0050】
ユーザは、ユーザ端末20により、映像編集装置10を用いて編集映像を作成するためのアプリケーションソフトウェアを起動する(S101)。アプリケーションソフトウェアの起動により、ユーザ端末20のディスプレイ206には、ホーム画面が表示される(S102)。図12は、ホーム画面の例示図である。ホーム画面は、「ログインID」フィールド1201、「パスワード」フィールド1202、「映像編集」ボタン1203、及び「視聴」ボタン1204を含む。ユーザは、操作部205により「ログインID」フィールド1201にログインIDを入力し、「パスワード」フィールド1202にパスワードを入力する。その後、ユーザは、操作部205により「映像編集」ボタン1203と「視聴」ボタン1204のいずれかを選択する。映像編集を行う場合、ユーザは「映像編集」ボタン1203を選択する。
【0051】
ユーザが操作部205によりホーム画面から「映像編集」ボタン1203を選択することで、ディスプレイ206に図6の選択画面が表示される(S103)。この際、ユーザ端末20は、映像編集装置10から映像格納部110に格納された素材映像のイベント名及び開催日の一覧を要求する。映像編集装置10は、この要求に応じてイベント名及び開催日一覧をユーザ端末20へ送信する(S201)。これによりユーザ端末20は、イベント名及び開催日一覧を取得する。ユーザは、操作部205により選択画面から編集を行うイベントを選択する。ユーザが操作部205により選択画面から編集対象のイベントを選択することで、ディスプレイ206に図7の操作画面が表示される(S104)。
【0052】
ユーザは、操作部205により操作画面から所望の編集条件を選択する。図7の例では、ユーザは、メンバー選択ボタン702及びパラメータ調整バー703により、希望のメンバー及び希望メンバーの映り具合等を設定する。送信データ生成部213は、これらの設定を編集基準として編集指示を作成する。送信データ生成部213は、選択された条件に基づく編集基準を含んだ編集指示を生成する(S105)。編集指示には、ホーム画面で入力されたユーザのユーザID及びパスワードも含まれる。ユーザ端末20は、送信データ生成部213で生成した編集指示を、通信制御部214によりネットワークNを介して映像編集装置10へ送信する(S106)。
【0053】
映像編集装置10は、入力部117によりユーザ端末20から送信された編集指示を取得する(S202)。映像編集装置10は、ユーザ管理部115により登録データを参照し、編集指示に含まれるユーザID及びパスワードによるユーザ認証を行う(S203)。以下の処理は、ユーザ認証が成功した場合に実行される。ユーザ認証が失敗した場合、映像編集装置10は、ユーザID及びパスワードの再度の入力を促す通知をユーザ端末20へ送信し、ユーザ認証を再度行う。
【0054】
映像編集装置10は、映像編集部114により編集指示に含まれる編集基準に基づいて上記のような素材映像の編集を行い、編集映像を作成する(S204)。映像編集装置10は、編集映像を表す編集映像データ及び該当する音声の音声データを、出力部118によりネットワークNを介してユーザ端末20へ送信する(S205)。
【0055】
また、映像編集部114は、作成した編集映像にユーザIDを付加して編集映像格納部113に格納する(S206)。映像編集装置10は、嗜好学習部116により、今回の処理で取得した編集基準と作成した編集映像を学習して嗜好データを生成し、登録情報格納部112の該当する登録データに付加する。既に登録データに嗜好データが付加されている場合には、嗜好データを更新する(S207)。
【0056】
ユーザ端末20は、通信制御部214により映像編集装置10から送信された編集映像データ及び音声データを取得する(S107)。ユーザ端末20の出力制御部212は、編集映像データ及び音声データを出力可能な形式に変換し、出力部211により出力する(S108)。出力部211は、ディスプレイ206により編集映像を表示し、スピーカ207により音声を出力する。
【0057】
編集映像は、図7の操作画面のメインビューワ701に表示されてもよいが、別の表示画面に表示されてもよい。図13は、編集映像を表示する表示画面の例示図である。この表示画面は、S106の処理で編集指示がユーザ端末20から映像編集装置10へ送信された後に、図7の操作画面から切り替わって表示される。表示画面は、メインビューワ701、コメント欄1301、共有ボタン1302、及び保存ボタン1303を含む。編集映像は、メインビューワ701に表示される。
【0058】
ユーザは、共有ボタン1302を押下することで、表示中の編集映像を他のユーザと共有することが可能となる。共有された場合、コメント欄1301には、自身と他のユーザのコメントが表示可能となる。ユーザは、保存ボタン1303を押下することで、表示中の編集映像をユーザ端末20内に保存することができる。なお、映像編集装置10がS206の処理で編集映像を格納するか否かは、保存ボタン1303の押下により決められてもよい。
【0059】
図13の表示画面は、図12の「視聴」ボタン1204が選択された場合にも表示される。この場合、ユーザは、自身が作成した編集映像の他に、他のユーザが作成して共有に設定された編集映像を視聴することができる。
【0060】
図14は、変形例の映像編集装置の構成説明図である。図14(a)は、映像編集装置30のハードウェア構成を示し、図14(b)は、映像編集装置30の機能ブロックを示す。映像編集装置30は、図1の映像編集装置10とユーザ端末20を一体にした構成である。
【0061】
映像編集装置30は、図1の映像編集装置10に操作部107、ディスプレイ108、及びスピーカ109を追加した構成である。操作部107は、図1のユーザ端末20の操作部205と同様の機能を有する入力インタフェースである。ディスプレイ108は、図1のユーザ端末20のディスプレイ206と同様の機能であるが、画面サイズ、画質等が向上した表示装置である。スピーカ109は、図1のユーザ端末20のスピーカ207と同様の機能であるが、より高音質である。
【0062】
映像編集装置30は、図2の映像編集装置10の機能ブロックと同様の構成であるが、入力部119及び出力部120の機能が異なる。すなわち、入力部119はネットワークNを介すことなく、操作部107から直接、編集指示等の指示を受け付けることになる。出力部120は、ネットワークNを介して編集映像データ及び音声データを送信することなく、ディスプレイ108及びスピーカ109から直接、編集映像及び音声を出力することになる。
【0063】
また、映像編集装置30は、記録媒体に編集映像を記録してユーザに提供可能としてもよい。この場合、映像編集装置30は、USBメモリ、DVD、Blu-ray(登録商標)等の記録媒体への書込装置を備える。ユーザは、映像編集装置30により編集映像を作成した後に、該編集映像の記録媒体への書き込みを指示する。映像編集装置30は、この指示に応じて編集映像を記録媒体へ書き込む。このように作成された記録媒体はユーザに提供され、ユーザにより使用される。
【0064】
このような映像編集装置30は、例えば最新のディスプレイ108やスピーカ109を備えた専用の施設に設置される。ユーザ端末20は、高性能のパーソナルコンピュータを用いる場合であっても、臨場感には限界がある。それに対して例えば専用の施設に映像編集装置30を設置する場合には、ユーザは、高画質、高音質の高臨場感で編集映像を楽しむことができるようになる。
【0065】
以上のような映像編集システム1により、従来、廃棄あるいは死蔵されるしかなかった未編集状態の素材映像の有効活用が可能となる。ユーザは、例えばプロフェッショナルな編集基準とは異なる独自の編集基準で素材映像を編集することができるため、コンサート等のイベントを、自分好みの独自の映像作品としてカスタマイズして楽しむことができる。そのため、ユーザは、同じイベントであっても、異なる見方で継続的に楽しむことができる。また、自分が編集した映像作品と他のユーザが編集した映像作品とを比べあったり、評価しあったりすることもできるようになる。
【要約】
【課題】素材映像をユーザが編集して独自の映像作品を作成することが可能な映像編集装置を提供する。
【解決手段】映像編集装置10は、所定の第1編集基準に基づく映像作品から除外された未編集状態の複数の素材映像を格納する映像格納部110と、ユーザ端末から第1編集基準とは異なる第2編集基準を取得する入力部117と、映像格納部110に格納された複数の素材映像の中から第2編集基準に合致する映像を抽出して第2編集映像を作成する映像編集部114と、第2編集映像をユーザ端末へ出力する出力部118とを備える。
【選択図】図2
図1
図2
図3
図4
図5
図6
図7
図8
図9
図10
図11
図12
図13
図14