(19)【発行国】日本国特許庁(JP)
(12)【公報種別】特許公報(B2)
(11)【特許番号】
(24)【登録日】2022-08-10
(45)【発行日】2022-08-19
(54)【発明の名称】動画コンテンツ生成方法および生成プログラム
(51)【国際特許分類】
H04N 21/854 20110101AFI20220812BHJP
H04N 21/845 20110101ALI20220812BHJP
H04N 21/439 20110101ALI20220812BHJP
【FI】
H04N21/854
H04N21/845
H04N21/439
(21)【出願番号】P 2018168950
(22)【出願日】2018-09-10
【審査請求日】2021-08-19
【権利譲渡・実施許諾】特許権者において、権利譲渡・実施許諾の用意がある。
(73)【特許権者】
【識別番号】518286312
【氏名又は名称】株式会社クロスフェーダー
(74)【代理人】
【識別番号】110000475
【氏名又は名称】特許業務法人みのり特許事務所
(72)【発明者】
【氏名】武下 幸太
(72)【発明者】
【氏名】名波 俊兵
【審査官】鈴木 順三
(56)【参考文献】
【文献】特開2004-096617(JP,A)
【文献】特開2011-024033(JP,A)
【文献】特表2006-512820(JP,A)
【文献】特開2016-111386(JP,A)
【文献】特開2002-112113(JP,A)
(58)【調査した分野】(Int.Cl.,DB名)
H04N 21/00 - 21/858
(57)【特許請求の範囲】
【請求項1】
映像情報と音声情報とを含む第1素材コンテンツから動画コンテンツを生成する動画コンテンツ生成方法であって、
記憶装置から前記第1素材コンテンツを読み込む第1読込工程と、
読み込まれた前記第1素材コンテンツを前記映像情報と前記音声情報とに分離するコンテンツ分離工程と、
分離された前記音声情報に基づいて、N個(ただし、Nは2以上の整数)の抽出開始点を決定する抽出開始点決定工程と、
分離された前記映像情報から、N個の前記抽出開始点のそれぞれを始点としたN個の分割映像情報を抽出する分割映像抽出工程と、
前記記憶装置から音楽情報である第2素材コンテンツと該第2素材コンテンツに対応する合成情報とを読み込む第2読込工程と、
前記合成情報に基づいて前記音楽情報と前記分割映像情報とを合成することにより、前記動画コンテンツを生成するコンテンツ合成工程と、
を備え、
前記合成情報は、前記音楽情報が表すビートに同期した複数の映像切替点を含み、
前記複数の映像切替点は、N個のグループのいずれかに属しており、
前記コンテンツ合成工程において、同じグループに属する前記映像切替点のそれぞれをN個のうちのいずれかの前記分割映像情報の始点とする
ことを特徴とする動画コンテンツ生成方法。
【請求項2】
前記抽出開始点決定工程において、分離された前記音声情報に含まれる複数の音量ピーク点のうちの上位N個の時間を前記抽出開始点とする
ことを特徴とする請求項1に記載の動画コンテンツ生成方法。
【請求項3】
前記第1素材コンテンツおよび前記第2素材コンテンツの選択に関する指令を受け付ける指令受付工程をさらに備え、
前記第1読込工程において、前記指令に基づいて前記記憶装置に予め記憶されている複数の前記第1素材コンテンツのうちの1つを読み込み、
前記第2読込工程において、前記指令に基づいて前記記憶装置に予め記憶されている複数の前記第2素材コンテンツのうちの1つと該1つに対応する前記合成情報とを読み込む
ことを特徴とする請求項1または請求項2に記載の動画コンテンツ生成方法。
【請求項4】
前記合成情報は、MIDI形式で記述されており、
前記N個のグループは、音階に対応している
ことを特徴とする請求項1~3のいずれか一項に記載の動画コンテンツ生成方法。
【請求項5】
映像情報と音声情報とを含む第1素材コンテンツから動画コンテンツを生成する動画コンテンツ生成方法を情報処理装置に実行させる動画コンテンツ生成プログラムであって、
前記情報処理装置に、
記憶装置から前記第1素材コンテンツを読み込む第1読込工程と、
読み込まれた前記第1素材コンテンツを前記映像情報と前記音声情報とに分離するコンテンツ分離工程と、
分離された前記音声情報に基づいて、N個(ただし、Nは2以上の整数)の抽出開始点を決定する抽出開始点決定工程と、
分離された前記映像情報から、N個の前記抽出開始点のそれぞれを始点としたN個の分割映像情報を抽出する分割映像抽出工程と、
前記記憶装置から音楽情報である第2素材コンテンツと該第2素材コンテンツに対応する合成情報とを読み込む第2読込工程と、
前記合成情報に基づいて前記音楽情報と前記分割映像情報とを合成することにより、前記動画コンテンツを生成するコンテンツ合成工程と、
を実行させ、
前記合成情報は、前記音楽情報が表すビートに同期した複数の映像切替点を含み、
前記複数の映像切替点は、N個のグループのいずれかに属しており、
前記コンテンツ合成工程において、同じグループに属する前記映像切替点のそれぞれがN個のうちのいずれかの前記分割映像情報の始点とされる
ことを特徴とする動画コンテンツ生成プログラム。
【請求項6】
前記抽出開始点決定工程において、分離された前記音声情報に含まれる複数の音量ピーク点のうちの上位N個に対応する時間が前記抽出開始点とされる
ことを特徴とする請求項5に記載の動画コンテンツ生成プログラム。
【請求項7】
前記情報処理装置に、前記第1素材コンテンツおよび前記第2素材コンテンツの選択に関する指令を受け付ける指令受付工程をさらに実行させ、
前記第1読込工程において、前記指令に基づいて前記記憶装置に予め記憶されている複数の前記第1素材コンテンツのうちの1つが読み込まれ、
前記第2読込工程において、前記指令に基づいて前記記憶装置に予め記憶されている複数の前記第2素材コンテンツのうちの1つと該1つに対応する前記合成情報とが読み込まれる
ことを特徴とする請求項5または請求項6に記載の動画コンテンツ生成プログラム。
【請求項8】
前記合成情報は、MIDI形式で記述されており、
前記N個のグループは、音階に対応している
ことを特徴とする請求項5~7のいずれか一項に記載の動画コンテンツ生成プログラム。
【発明の詳細な説明】
【技術分野】
【0001】
本発明は、映像情報と音声情報とを含む第1素材コンテンツから新たな動画コンテンツを生成する方法およびプログラムに関し、特に、ユーザ自身が作成した第1素材コンテンツとプリセットされた第2素材コンテンツとを合成することにより新たな動画コンテンツを生成する方法およびプログラムに関する。
【背景技術】
【0002】
近年のスマートフォンの普及に伴い、高価な機材を用意しなくても、簡単に動画を撮影することが可能となってきている。また、高速な通信環境が整備されたことにより、近年では、スマートフォンで撮影した動画を一般に公開することも容易である。
【0003】
このような状況を活かしたスマートフォン向けアプリケーションソフトウェアとして、「TikTok(登録商標)」が知られている。TikTokのユーザは、以下の手順により、オリジナルな動画を生成して一般に公開することができる(例えば、非特許文献1,2参照)。
(1)プリセットされた複数の音楽からBGMとする音楽を選択する。
(2)選択したBGMに合うような動画を撮影する。
(3)撮影した動画をアップロードする。
また、ユーザは、撮影した動画をアップロードする前に、フィルターまたはタイム効果と呼ばれる複数の特殊効果の中から選択した1以上の特殊効果を施すことにより、撮影した動画を装飾することもできる。
【先行技術文献】
【非特許文献】
【0004】
【文献】"Tik Tok (アプリ)"、[online]、ウィキペディア フリー百科事典、[平成30年9月3日検索]、インターネット〈URL:https://ja.wikipedia.org/wiki/Tik_Tok_(%E3%82%A2%E3%83%97%E3%83%AA)〉
【文献】"無料の動画作成アプリ『Tik Tok』の基本的な使い方-曲の挿入・動画の保存方法など紹介!"、[online]、平成30年4月18日、ドハック、[平成30年9月3日検索]、インターネット〈URL:https://dohack.jp/video/tik-tok〉
【発明の概要】
【発明が解決しようとする課題】
【0005】
上記アプリケーションソフトウェアを用いた動画の生成では、BGMに合うような動画を撮影したり、撮影した動画に特殊効果を施したりする際に、ユーザの美的センスが求められる。このため、上記アプリケーションソフトウェアは、自分自身の美的センスに自信のない者にとっては非常にとっつきづらいものとなっていた。
【0006】
本発明は、上記事情に鑑みてなされたものであって、誰もが簡単に見栄えのよい動画コンテンツを生成することができる動画コンテンツ生成方法および生成プログラムを提供することを課題とする。
【課題を解決するための手段】
【0007】
上記課題を解決するために、本発明に係る動画コンテンツ生成方法は、映像情報と音声情報とを含む第1素材コンテンツから動画コンテンツを生成する動画コンテンツ生成方法であって、
記憶装置から前記第1素材コンテンツを読み込む第1読込工程と、読み込まれた前記第1素材コンテンツを前記映像情報と前記音声情報とに分離するコンテンツ分離工程と、分離された前記音声情報に基づいて、N個(ただし、Nは2以上の整数)の抽出開始点を決定する抽出開始点決定工程と、分離された前記映像情報から、N個の前記抽出開始点のそれぞれを始点としたN個の分割映像情報を抽出する分割映像抽出工程と、前記記憶装置から音楽情報である第2素材コンテンツと該第2素材コンテンツに対応する合成情報とを読み込む第2読込工程と、前記合成情報に基づいて前記音楽情報と前記分割映像情報とを合成することにより、前記動画コンテンツを生成するコンテンツ合成工程とを備え、
前記合成情報は、前記音楽情報が表すビートに同期した複数の映像切替点を含み、前記複数の映像切替点は、N個のグループのいずれかに属しており、前記コンテンツ合成工程において、同じグループに属する前記映像切替点のそれぞれをN個のうちのいずれかの前記分割映像情報の始点とする、との構成を有している。
【0008】
上記動画コンテンツ生成方法は、前記抽出開始点決定工程において、分離された前記音声情報に含まれる複数の音量ピーク点のうちの上位N個の時間を前記抽出開始点とする、との構成を有していてもよい。
【0009】
上記動画コンテンツ生成方法は、前記第1素材コンテンツおよび前記第2素材コンテンツの選択に関する指令を受け付ける指令受付工程をさらに備え、前記第1読込工程において、前記指令に基づいて前記記憶装置に予め記憶されている複数の前記第1素材コンテンツのうちの1つを読み込み、前記第2読込工程において、前記指令に基づいて前記記憶装置に予め記憶されている複数の前記第2素材コンテンツのうちの1つと該1つに対応する前記合成情報とを読み込む、との構成を有していてもよい。
【0010】
なお、前記合成情報は、MIDI形式で記述することができる。この場合は、前記N個のグループを音階で表現することができる。
【0011】
また、上記課題を解決するために、本発明に係る動画コンテンツ生成プログラムは、映像情報と音声情報とを含む第1素材コンテンツから動画コンテンツを生成する動画コンテンツ生成方法を情報処理装置に実行させる動画コンテンツ生成プログラムであって、
前記情報処理装置に、記憶装置から前記第1素材コンテンツを読み込む第1読込工程と、読み込まれた前記第1素材コンテンツを前記映像情報と前記音声情報とに分離するコンテンツ分離工程と、分離された前記音声情報に基づいて、N個(ただし、Nは2以上の整数)の抽出開始点を決定する抽出開始点決定工程と、分離された前記映像情報から、N個の前記抽出開始点のそれぞれを始点としたN個の分割映像情報を抽出する分割映像抽出工程と、前記記憶装置から音楽情報である第2素材コンテンツと該第2素材コンテンツに対応する合成情報とを読み込む第2読込工程と、前記合成情報に基づいて前記音楽情報と前記分割映像情報とを合成することにより、前記動画コンテンツを生成するコンテンツ合成工程とを実行させ、
前記合成情報は、前記音楽情報が表すビートに同期した複数の映像切替点を含み、前記複数の映像切替点は、N個のグループのいずれかに属しており、前記コンテンツ合成工程において、同じグループに属する前記映像切替点のそれぞれがN個のうちのいずれかの前記分割映像情報の始点とされる、との構成を有していてもよい。
【0012】
上記動画コンテンツ生成プログラムは、前記抽出開始点決定工程において、分離された前記音声情報に含まれる複数の音量ピーク点のうちの上位N個に対応する時間が前記抽出開始点とされる、との構成を有していてもよい。
【0013】
上記動画コンテンツ生成プログラムは、前記情報処理装置に、前記第1素材コンテンツおよび前記第2素材コンテンツの選択に関する指令を受け付ける指令受付工程をさらに実行させ、前記第1読込工程において、前記指令に基づいて前記記憶装置に予め記憶されている複数の前記第1素材コンテンツのうちの1つが読み込まれ、前記第2読込工程において、前記指令に基づいて前記記憶装置に予め記憶されている複数の前記第2素材コンテンツのうちの1つと該1つに対応する前記合成情報とが読み込まれる、との構成を有していてもよい。
【0014】
なお、前記合成情報は、MIDI形式で記述することができる。この場合は、前記N個のグループを音階で表現することができる。
【発明の効果】
【0015】
本発明によれば、誰もが簡単に見栄えのよい動画コンテンツを生成することができる動画コンテンツ生成方法および生成プログラムを提供することができる。
【図面の簡単な説明】
【0016】
【
図1】本発明の実施例に係る動画コンテンツ生成プログラムを実行している最中のスマートフォンの概略的な構成を示すブロック図である。
【
図2】本発明の実施例に係る動画コンテンツ生成方法のフロー図である。
【
図3】
図2に示すコンテンツ分離工程を説明するための図である。
【
図4】
図2に示す抽出開始点決定工程を説明するための図である。
【
図5】
図2に示す分割映像抽出工程を説明するための図である。
【
図6】
図2に示す第2読込工程において読み込まれる音楽情報および合成情報の構成を示す図である。
【
図7】
図2に示すコンテンツ合成工程の前半部分を説明するための図である。
【
図8】
図2に示すコンテンツ合成工程の後半部分を説明するための図である。
【
図9】本発明の変形例1に係る動画コンテンツ生成方法のフロー図である。
【
図10】本発明の変形例2に係る動画コンテンツ生成プログラムを実行している最中のスマートフォンの概略的な構成を示すブロック図である。
【
図11】本発明の変形例2に係る動画コンテンツ生成方法のフロー図である。
【
図12】本発明の変形例2に係る動画コンテンツ生成方法の別のフロー図である。
【
図13】本発明の変形例3に係る動画コンテンツ生成プログラムを実行している最中のスマートフォンの概略的な構成を示すブロック図である。
【
図14】本発明の変形例3に係る動画コンテンツ生成方法の第2読込工程において読み込まれる音楽情報、合成情報および特殊効果情報の構成を示す図である。
【発明を実施するための形態】
【0017】
以下、添付図面を参照しながら、本発明に係る動画コンテンツ生成方法および生成プログラムの一実施例について説明する。
【0018】
[実施例]
図1に、スマートフォン10の概略的な構成を示す。同図に示すように、スマートフォン10は、MPU(Micro Processor Unit)からなる情報処理装置11と、メモリからなる記憶装置12と、カメラ13と、マイク14と、タッチパネルディスプレイ15と、スピーカー16とを備えている。
【0019】
情報処理装置11は、第1素材コンテンツ生成部20と動画コンテンツ生成部21とを有している。このうち、第1素材コンテンツ生成部20は、標準的に備えられた動画撮影プログラムがユーザによって実行されたときに情報処理装置11内に形成される機能ブロックである。一方、動画コンテンツ生成部21は、本実施例に係る動画コンテンツ生成プログラムがユーザによって実行されたときに情報処理装置11内に形成される機能ブロックである。
【0020】
第1素材コンテンツ生成部20は、カメラ13が出力する映像信号とマイクが出力する音声信号とに基づいて、映像情報と音声情報とを含む第1素材コンテンツ(動画ファイル)を生成し、これを記憶装置12に記憶させる。
【0021】
記憶装置12は、第1素材コンテンツに加え、音楽情報である第2素材コンテンツ、およびこれに対応する合成情報をさらに記憶している。第2素材コンテンツおよび合成情報は、予め記憶されていてもよいし、本実施例に係る動画コンテンツ生成プログラムがユーザによって実行されたときに記憶されてもよい。第2素材コンテンツおよび合成情報については、後で詳しく説明する。
【0022】
なお、本実施例では、本実施例に係る動画コンテンツ生成プログラムがユーザによって実行された時に、各1つの第1素材コンテンツ、第2素材コンテンツおよび合成情報が記憶装置12に既に記憶されているものとする。
【0023】
動画コンテンツ生成部21は、前述した通り、本実施例に係る動画コンテンツ生成プログラムがユーザによって実行されたときに形成される。動画コンテンツ生成部21は、本実施例に係る動画コンテンツ生成方法を実行することにより、記憶装置12に記憶された第1素材コンテンツおよび第2素材コンテンツを合成情報に基づいて合成し、新たな動画コンテンツを生成する。言い換えると、本実施例に係る動画コンテンツ生成プログラムは、情報処理装置11に本実施例に係る動画コンテンツ生成方法を実行させることにより、新たな動画コンテンツを生成する。
【0024】
動画コンテンツ生成部21は、生成した動画コンテンツをタッチパネルディスプレイ15およびスピーカー16を介して再生することができる。この他、動画コンテンツ生成部21は、生成した動画コンテンツを不図示の通信部を介してアップロードしたり、記憶装置12に記憶させたりすることもできる。
【0025】
続いて、
図2を参照しながら、本実施例に係る動画コンテンツ生成方法(すなわち、動画コンテンツ生成部21の動作)について説明する。
【0026】
第1読込工程S1において、動画コンテンツ生成部21は、記憶装置12から第1素材コンテンツを読み込む。前述した通り、第1素材コンテンツは、ユーザ自身が撮影した動画に関するファイルであり、映像情報と音声情報とを含んでいる。
【0027】
工程S1の次に実行されるコンテンツ分離工程S2において、動画コンテンツ生成部21は、工程S1で読み込まれた第1素材コンテンツを映像情報と音声情報とに分離する(
図3参照)。
【0028】
工程S2の次に実行される抽出開始点決定工程S3において、動画コンテンツ生成部21は、工程S2で分離された音声情報を解析して当該音声情報に含まれる音量ピーク点のうちの上位N個(ただし、Nは2以上の整数。本実施例では、N=7)を特定するとともに、これらに対応する時間を抽出開始点とする。
図4に示すように、本実施例では、音量ピーク点P1,P2,・・・,P6,P7に対応する時間t1,t2,・・・,t6,t7が抽出開始点となる。
【0029】
工程3の次に実行される分割映像抽出工程S4において、動画コンテンツ生成部21は、工程S2で分離された映像情報から、工程S3で決定された7個の抽出開始点t1,t2,・・・,t6,t7のそれぞれを始点とした7個の分割映像情報V1,V2,・・・,V6,V7を抽出する(
図5参照)。より詳しくは、動画コンテンツ生成部21は、抽出開始点t1-t2間の情報を分割映像情報V1として抽出し、抽出開始点t2-t3間の情報を分割映像情報V2として抽出し、・・・、抽出開始点t6-t7間の情報を分割映像情報V6として抽出し、抽出開始点t7と当該映像情報の終端との間の情報を分割映像情報V7として抽出する。
【0030】
工程S4の次に実行される第2読込工程S5において、動画コンテンツ生成部21は、記憶装置12から第2素材コンテンツおよびこれに対応する合成情報を読み込む。
【0031】
図6(A)に、読み込まれた第2素材コンテンツに含まれる音楽情報を示す。また、
図6(B)に、読み込まれた合成情報を示す。これらの図から明らかなように、合成情報は、音楽情報が表すビートに同期した複数の映像切替点SW1,SW2,・・・,SW15,SW16を含んでいる。そして、複数の映像切替点SW1,SW2,・・・,SW15,SW16は、7個のグループC3,D3,E3,F3,G3,A3,B3のいずれかに属している。例えば、映像切替点SW1,SW14はグループC3に属し、映像切替点SW10,SW11,SW12,SW13はグループF3に属している。
【0032】
合成情報は、MIDI(Musical Instrument Digital Interface)形式で記述されている。MIDI形式を利用することにより、7個のグループC3,D3,E3,F3,G3,A3,B3のいずれかに属する複数の映像切替点の時間的な位置を容易に記述することができる。なお、C3、D3、E3、F3、G3、A3およびB3は、それぞれ、第3オクターブの音階「ド」、「レ」、「ミ」、「ファ」、「ソ」、「ラ」および「シ」を意味する。
【0033】
工程S5の次に実行されるコンテンツ合成工程S6において、動画コンテンツ生成部21は、合成情報に含まれる映像切替点SW1,SW2,・・・,SW15,SW16に基づいて、工程S4で抽出された7個の分割映像情報V1,V2,・・・,V6,V7と第2素材コンテンツに含まれる音楽情報とを合成する。
【0034】
より具体的には、動画コンテンツ生成部21は、まず、7個の分割映像情報V1,V2,・・・,V6,V7と7個のグループC3,D3,E3,F3,G3,A3,B3とを対応付ける。本実施例では、この対応付けをランダムに行い、その結果、グループC3と分割映像情報V1、グループD3と分割映像情報V3、グループE3と分割映像情報V5、グループF3と分割映像情報V6、グループG3と分割映像情報V2、グループA3と分割映像情報V4、およびグループB3と分割映像情報V7が対応付けられたものとする(
図7参照)。
【0035】
続いて、動画コンテンツ生成部21は、グループC3に属する映像切替点SW1,SW14が分割映像情報V1の開始点となり、グループD3に属する映像切替点SW6が分割映像情報V3の開始点となり、グループE3に属する映像切替点SW5が分割映像情報V5の開始点となり、グループF3に属する映像切替点SW10,SW11,SW12,SW13が分割映像情報V6の開始点となり、グループG3に属する映像切替点SW15が分割映像情報V2の開始点となり、グループA3に属する映像切替点SW2,SW4,SW7,SW9,SW16が分割映像情報V4の開始点となり、グループB3に属する映像切替点SW3,SW8が分割映像情報V7の開始点となるように分割映像情報V1,V2,・・・,V6,V7を繋ぎ合わせ、繋ぎ合わせたものと音声情報とを合成する(
図8参照)。
【0036】
このとき、動画コンテンツ生成部21は、例えば、映像切替点S1-S2間の時間が分割映像情報V1の時間よりも短い場合は、分割映像情報V1の先頭の一部分だけを使用し、映像切替点S1-S2間の時間が分割映像情報V1の時間よりも長い場合は、分割映像情報V1の最終フレーム(静止画)で穴埋めをする。
【0037】
このように、本実施例に係る動画コンテンツ生成方法および生成プログラムによれば、美的センスが必要となる作業をユーザが行わなくても、ユーザが作成した第1素材コンテンツに含まれる音声情報と予め用意された合成情報とに基づいて、第1素材コンテンツに含まれる映像情報が第2素材コンテンツに含まれる音楽情報(BGM)に合うように編集され、見栄えのよい新たな動画コンテンツが得られる。
【0038】
なお、本発明に係る動画コンテンツ生成方法および生成プログラムには、以下に例示する複数の変形例がある。
【0039】
[変形例1]
第2読込工程S5は、第1読込工程S1の前に実行されてもよいし(
図9(A)参照)、第1読込工程S1-分割映像抽出工程S4と同時並行的に実行されてもよい(
図9(B)参照)。つまり、本発明では、コンテンツ合成工程S6の前に、第1読込工程S1-分割映像抽出工程S4と第2読込工程S5とが実行されていればよい。
【0040】
[変形例2]
図10に示すように、記憶装置12は、複数の第1素材コンテンツと、複数の第2素材コンテンツと、複数の第2素材コンテンツのそれぞれに対応する合成情報とを記憶していてもよい。この場合は、
図11に示すように、第1読込工程S1および第2読込工程S5の前に、選択指令受付工程S7を実行する必要がある。
【0041】
選択指令受付工程S7において、動画コンテンツ生成部21は、記憶装置12に記憶されている複数の第1素材コンテンツおよび第2素材コンテンツに関する情報を選択肢としてタッチパネルディスプレイ15に表示させるとともに、タッチパネルディスプレイ15を介して入力された第1素材コンテンツおよび第2素材コンテンツの選択に関するユーザからの指令を受け付ける。そして、第1読込工程S1において、動画コンテンツ生成部21は、ユーザによって選択された第1素材コンテンツを読み込む。第2読込工程S5についても同様である。
【0042】
なお、第1読込工程S1および第2読込工程S5を直列的に実行する場合は、第1素材コンテンツおよび第2素材コンテンツの選択に関する指令を受け付ける選択指令受付工程S7を第1読込工程S1の前に実行してもよいし(
図12(A)参照)、第1素材コンテンツの選択に関する指令を受け付ける選択指令受付工程S7Aを第1読込工程S1の前に実行するとともに、第2素材コンテンツの選択に関する指令を受け付ける選択指令受付工程S7Bを第2読込工程S5の前に実行してもよい(
図12(B)参照)。
【0043】
[変形例3]
図13に示すように、記憶装置12は、第2素材コンテンツに対応する特殊効果情報をさらに記憶していてもよい。この場合、動画コンテンツ生成部21は、第2読込工程S5において、第2素材コンテンツとともに合成情報および特殊効果情報を読み込む。ただし、動画コンテンツ生成部21は、特殊効果情報が存在しない第2素材コンテンツについては、第2素材コンテンツとともに合成情報のみを読み込む。
【0044】
図14に示すように、特殊効果情報は、複数の特殊効果適用期間EF1,EF2,・・・,EF6,EF7を含んでいる。そして、特殊効果適用期間EF1,EF2,・・・,EF6,EF7は、4個のグループC4,D4,E4,F4のいずれかに属している。
【0045】
グループC4に属する特殊効果適用期間EF1,EF4,EF6は、特殊効果「拡大」を適用する期間であり、グループD4に属する特殊効果適用期間EF7は、特殊効果「フェイドアウト」を適用する期間であり、グループE4に属する特殊効果適用期間EF2,EF5は、特殊効果「早送り」を適用する期間であり、グループF4に属する特殊効果適用期間EF3は、特殊効果「スローモーション」を適用する期間である。
【0046】
特殊効果情報は、MIDI形式で記述されている。MIDI形式を利用することにより、4個のグループC4,D4,E4,F4のいずれかに属する特殊効果適用期間の時間的な範囲を容易に記述することができる。なお、C4、D4、E4およびF4は、それぞれ、第4オクターブの音階「ド」、「レ」、「ミ」および「ファ」を意味する。
【0047】
動画コンテンツ生成部21は、コンテンツ合成工程S6において、複数の分割映像情報を繋ぎ合わせたものに特殊効果情報にしたがった特殊効果を適用する。そして、動画コンテンツ生成部21は、特殊効果を適用した後の映像情報と音楽情報とを合成する。
【0048】
特殊効果の種類を増やす場合は、例えば、第4オクターブの音階「ソ」、「ラ」、「シ」を意味するG4、A4、B4を利用すればよい。また、合成情報および特殊効果情報は、MIDI形式で記述された単一のファイルであってもよい。
【0049】
[その他の変形例]
(1)動画コンテンツ生成部21は、第1素材コンテンツの音声情報に含まれる音量ピーク点以外のものに基づいて抽出開始点を決定してもよい。例えば、動画コンテンツ生成部21は、音声情報の音量が急激に増加/減少した点を抽出開始点としてもよい。
【0050】
(2)動画コンテンツ生成部21は、コンテンツ合成工程S6を実行した後に、N個の分割映像情報とN個のグループとのランダムな対応付けのやり直しの要否についての指令を受け付けてもよい。対応付けをやり直すことにより、第1素材コンテンツ自体および第2素材コンテンツ自体に何も変更を加えなくても、様々な動画コンテンツを生成することができる。
【0051】
(3)動画コンテンツ生成部21は、ランダムにではなく、予め定められたルールにしたがってN個の分割映像情報とN個のグループとを対応付けてもよい。
【0052】
(4)動画コンテンツ生成部21は、抽出開始点決定工程S3を実行する前に、抽出開始点の決定に関するユーザからの指令を受け付けてもよい。この指令には、抽出開始点決定工程S3において解析を行うべき範囲の指定や、抽出開始点の直接的な指定が含まれる。なお、ユーザによってM個(ただし、Mは1以上N以下の整数)の抽出開始点が指定された場合、動画コンテンツ生成部21は、音声情報を解析することによって(N-M)個の抽出開始点を決定することになる。また、ユーザによって抽出開始点が指定された場合、動画コンテンツ生成部21は、当該指定に係る抽出開始点を始点とする分割映像情報を多くの映像切替点を含むグループ(
図6に示す一例では、5個の映像切替点SW2,SW4,SW7,SW9,SW16を含むグループA3)に対応付けることが好ましい。
【0053】
(5)動画コンテンツ生成部21は、コンテンツ合成工程S6を実行した後に、抽出開始点の決定に関する指令を受け付けてもよい。指令を受け付けた場合、動画コンテンツ生成部21は、抽出開始点決定工程S3、分割映像抽出工程S4およびコンテンツ合成工程S6を再度実行する。なお、動画コンテンツ生成部21は、コンテンツ合成工程S6を実行した後に、抽出開始点の決定に関する指令に加え、対応付けのやり直しの要否についての指令を受け付けてもよい。
【0054】
(6)動画コンテンツ生成部21は、選択指令受付工程S7,S7Bにおいて、第2素材コンテンツに関する情報をユーザに提示する代わりに、曲調に関する選択肢(例えば、楽しい、悲しい等)と曲のテンポに関する選択肢(例えば、ゆっくり、はやい等)をユーザに提示してもよい。この場合、ユーザは、曲調とテンポを選択することにより、間接的に第2素材コンテンツを選択することになる。
【0055】
(7)第1素材コンテンツに含まれる音声情報は、右側音声情報および左側音声情報からなっていてもよい。この場合は、例えば、右側音声情報および左側音声情報の一方、またはこれらを平均化したものに基づいて、抽出開始点を決定することができる。
【0056】
(8)合成情報および特殊効果情報は、MIDI以外の形式で記述されていてもよい。
【0057】
(9)情報処理装置11は、スマートフォンに備えられたものに限定されない。
【符号の説明】
【0058】
10 スマートフォン
11 情報処理装置
12 記憶装置
13 カメラ
14 マイク
15 タッチパネルディスプレイ
16 スピーカー
20 第1素材コンテンツ生成部
21 動画コンテンツ生成部