IP Force 特許公報掲載プロジェクト 2022.1.31 β版

知財求人 - 知財ポータルサイト「IP Force」

▶ ヤマハ株式会社の特許一覧

特開2022-65786情報処理方法、情報処理システムおよびプログラム
<>
  • 特開-情報処理方法、情報処理システムおよびプログラム 図1
  • 特開-情報処理方法、情報処理システムおよびプログラム 図2
  • 特開-情報処理方法、情報処理システムおよびプログラム 図3
  • 特開-情報処理方法、情報処理システムおよびプログラム 図4
  • 特開-情報処理方法、情報処理システムおよびプログラム 図5
  • 特開-情報処理方法、情報処理システムおよびプログラム 図6
  • 特開-情報処理方法、情報処理システムおよびプログラム 図7
  • 特開-情報処理方法、情報処理システムおよびプログラム 図8
  • 特開-情報処理方法、情報処理システムおよびプログラム 図9
  • 特開-情報処理方法、情報処理システムおよびプログラム 図10
  • 特開-情報処理方法、情報処理システムおよびプログラム 図11
  • 特開-情報処理方法、情報処理システムおよびプログラム 図12
  • 特開-情報処理方法、情報処理システムおよびプログラム 図13
  • 特開-情報処理方法、情報処理システムおよびプログラム 図14
  • 特開-情報処理方法、情報処理システムおよびプログラム 図15
  • 特開-情報処理方法、情報処理システムおよびプログラム 図16
< >
(19)【発行国】日本国特許庁(JP)
(12)【公報種別】公開特許公報(A)
(11)【公開番号】P2022065786
(43)【公開日】2022-04-28
(54)【発明の名称】情報処理方法、情報処理システムおよびプログラム
(51)【国際特許分類】
   H04N 5/262 20060101AFI20220421BHJP
   H04N 5/93 20060101ALI20220421BHJP
   G09G 5/36 20060101ALI20220421BHJP
   G09G 5/00 20060101ALI20220421BHJP
   G09G 5/22 20060101ALI20220421BHJP
【FI】
H04N5/262
H04N5/93
G09G5/36 510M
G09G5/00 510Q
G09G5/36 510A
G09G5/00 550H
G09G5/22 680L
【審査請求】未請求
【請求項の数】12
【出願形態】OL
(21)【出願番号】P 2020174484
(22)【出願日】2020-10-16
(71)【出願人】
【識別番号】000004075
【氏名又は名称】ヤマハ株式会社
(74)【代理人】
【識別番号】110003177
【氏名又は名称】特許業務法人旺知国際特許事務所
(72)【発明者】
【氏名】安立 直之
(72)【発明者】
【氏名】石川 克己
(72)【発明者】
【氏名】井芹 大智
(72)【発明者】
【氏名】小池 祐二
(72)【発明者】
【氏名】齋藤 謙一良
(72)【発明者】
【氏名】加藤 康之介
【テーマコード(参考)】
5C023
5C053
5C182
【Fターム(参考)】
5C023AA11
5C023AA34
5C023AA38
5C023CA01
5C023CA04
5C053HA01
5C053LA01
5C053LA04
5C053LA14
5C182AA02
5C182AA03
5C182AB02
5C182AB08
5C182AB11
5C182AC02
5C182AC33
5C182AC43
5C182BA01
5C182BA06
5C182BA14
5C182BA75
5C182BC22
5C182BC25
5C182CA11
5C182CA33
5C182CA34
5C182CB42
5C182CB44
5C182CB47
5C182CB54
5C182DA64
(57)【要約】
【課題】時間軸上において動画が再生される期間と当該動画に付加される音声が再生される期間との関係を利用者が容易に把握できるようにする。
【解決手段】端末装置10は、動画の再生とともに再生される音声を表す文字列Qを取得する文字列取得部32と、時間軸上において動画が再生される動画再生期間を表す第1画像と、時間軸上において音声が再生される音声再生期間を表す第2画像と、文字列Qと、を表示装置16に表示させる表示制御部33とを具備する。
【選択図】図3
【特許請求の範囲】
【請求項1】
動画の再生とともに再生される音声を表す文字列を取得し、
時間軸上において前記動画が再生される動画再生期間を表す第1画像と、前記時間軸上において前記音声が再生される音声再生期間を表す第2画像と、前記文字列と、を表示装置に表示させる
コンピュータにより実現される情報処理方法。
【請求項2】
前記第2画像は、前記時間軸の方向における表示長が前記音声再生期間の時間長に対応する画像である
請求項1の情報処理方法。
【請求項3】
前記時間軸上における前記第2画像の位置を利用者からの指示に応じて変化させる
請求項2の情報処理方法。
【請求項4】
前記文字列は、前記第2画像の内側に表示される
請求項2または請求項3の情報処理方法。
【請求項5】
前記音声再生期間の一部が前記動画再生期間の外側に位置することを報知する
請求項2から請求項4の何れかの情報処理方法。
【請求項6】
前記第2画像のうち前記動画再生期間の外側に対応する部分と、前記動画再生期間の内側に対応する部分とを、相異なる態様で表示する
請求項2から請求項4の何れかの情報処理方法。
【請求項7】
前記文字列のうち、前記動画再生期間の外側に対応する部分と、前記動画再生期間の内側に対応する部分とを、相異なる態様で表示する
請求項2から請求項4の何れかの情報処理方法。
【請求項8】
前記文字列のうち前記動画再生期間の外側に対応する部分を表示しない
請求項1から請求項4の何れかの情報処理方法。
【請求項9】
前記音声再生期間の終点が前記動画再生期間の終点よりも後方に位置する場合に前記音声再生期間を短縮し、前記短縮後の音声再生期間の終点が前記動画再生期間の終点に一致するように前記第2画像を表示させる
請求項1から請求項5の何れかの情報処理方法。
【請求項10】
前記文字列の文字数が閾値を下回る場合に、前記第2画像の内側に前記文字列を表示させ、
前記文字数が前記閾値を上回る場合に、前記第2画像の外側に前記文字列を表示させる
請求項1から請求項9の何れかの情報処理方法。
【請求項11】
動画の再生とともに再生される音声を表す文字列を取得する文字列取得部と、
時間軸上において前記動画が再生される動画再生期間を表す第1画像と、前記時間軸上において前記音声が再生される音声再生期間を表す第2画像と、前記文字列と、を表示装置に表示させる表示制御部と
を具備する情報処理システム。
【請求項12】
動画の再生とともに再生される音声を表す文字列を取得する文字列取得部、および、
時間軸上において前記動画が再生される動画再生期間を表す第1画像と、前記時間軸上において前記音声が再生される音声再生期間を表す第2画像と、前記文字列と、を表示装置に表示させる表示制御部、
としてコンピュータを機能させるプログラム。
【発明の詳細な説明】
【技術分野】
【0001】
本開示は、動画に音声を付加する技術に関する。
【背景技術】
【0002】
動画と音声とを含むコンテンツを生成するための各種の技術が従来から提案されている。例えば特許文献1には、利用者が入力した文字列に対応する音声を、撮影済の動画に付加する技術が開示されている。
【先行技術文献】
【特許文献】
【0003】
【特許文献1】特開2020-53832号公報
【発明の概要】
【発明が解決しようとする課題】
【0004】
動画に音声を付加する場面では、時間軸上において動画が再生される期間と時間軸上において音声が再生される期間との関係を利用者が簡便に把握したいという要求がある。以上の事情を考慮して、本開示のひとつの態様は、時間軸上において動画が再生される期間と当該動画に付加される音声が再生される期間との関係を利用者が容易に把握できるようにすることを目的のひとつとする。
【課題を解決するための手段】
【0005】
以上の課題を解決するために、本開示のひとつの態様に係る情報処理方法は、動画の再生とともに再生される音声を表す文字列を取得し、時間軸上において前記動画が再生される動画再生期間を表す第1画像と、前記時間軸上において前記音声が再生される音声再生期間を表す第2画像と、前記文字列と、を表示装置に表示させる。
【0006】
本開示のひとつの態様に係る情報処理システムは、動画の再生とともに再生される音声を表す文字列を取得する文字列取得部と、時間軸上において前記動画が再生される動画再生期間を表す第1画像と、前記時間軸上において前記音声が再生される音声再生期間を表す第2画像と、前記文字列と、を表示装置に表示させる表示制御部とを具備する。
【0007】
本開示のひとつの態様に係るプログラムは、動画の再生とともに再生される音声を表す文字列を取得する文字列取得部、および、時間軸上において前記動画が再生される動画再生期間を表す第1画像と、前記時間軸上において前記音声が再生される音声再生期間を表す第2画像と、前記文字列と、を表示装置に表示させる表示制御部、としてコンピュータを機能させる。
【図面の簡単な説明】
【0008】
図1】第1実施形態に係る情報システムの構成を例示するブロック図である。
図2】端末装置の構成を例示するブロック図である。
図3】端末装置の機能的な構成を例示するブロック図である。
図4】制御データの模式図である。
図5】通常状態における操作画面の模式図である。
図6】超過状態における操作画面の模式図である。
図7】制御装置の具体的な手順を例示するフローチャートである。
図8】第2実施形態における表示領域の模式図である。
図9】第3実施形態における表示領域の模式図である。
図10】第3実施形態における制御処理の一部を例示するフローチャートである。
図11】第3実施形態における制御データの模式図である。
図12】第4実施形態における表示領域の模式図である。
図13】第4実施形態における制御処理の一部を例示するフローチャートである。
図14】変形例における表示領域の模式図である。
図15】変形例において表示装置が表示する画像の模式図である。
図16】変形例における操作画面の模式図である。
【発明を実施するための形態】
【0009】
A:第1実施形態
図1は、第1実施形態における情報システム100の構成を例示するブロック図である。第1実施形態の情報システム100は、端末装置10と編集システム20とを具備する。端末装置10と編集システム20とは、例えばインターネット等の通信網30を介して相互に通信する。
【0010】
端末装置10は、例えば携帯電話機、スマートフォン、タブレット端末またはパーソナルコンピュータ等の情報端末である。端末装置10は、素材データDを編集システム20に送信する。素材データDは、動画データVaと制御データXとを含む。動画データVaは、動画を表すデータである。制御データXは、複数の文字で構成される文字列Qを含むデータである。文字列Qは、端末装置10の利用者により指示される。
【0011】
編集システム20は、端末装置10から受信した素材データDを利用してコンテンツCを生成するコンピュータシステムである。コンテンツCは、動画を表す動画データVbと、音声を表す音声データYとを含む映像コンテンツである。音声データYが表す音声は、動画データVbの動画に対して並行に再生される。
【0012】
編集システム20は、動画編集部21と音声合成部22とを具備する。動画編集部21は、素材データDの動画データVaを編集することで動画データVbを生成する。動画編集部21による動画の編集は、例えば画質の調整等の各種の画像処理を含む。
【0013】
音声合成部22は、制御データXの文字列Qを適用した音声合成により、当該文字列Qに対応する音声(以下「発話音声」という)を表す音声データYを生成する。発話音声は、文字列Qの読上げにより仮想的な発話者が発音する音声である。音声合成部22による音声合成には、公知の技術が任意に採用される。以上の説明から理解される通り、制御データXの文字列Qは、動画の再生とともに再生される音声(すなわち動画に付加される音声)を表す。すなわち、音声データYが表す発話音声は、動画に対して並行に再生される音声である。
【0014】
動画データVbと音声データYとを含むコンテンツCが編集システム20から端末装置10に送信される。端末装置10は、編集システム20から受信したコンテンツCを再生する。すなわち、動画データVbが表す動画と音声データYが表す発話音声とが並列に再生される。なお、素材データDを送信する端末装置10とは別個の装置に対して編集システム20がコンテンツCを送信してもよい。
【0015】
第1実施形態におけるコンテンツCは、例えば企業を紹介するコンテンツである。例えば企業自体を紹介するコンテンツ、または、企業が取扱う製品を紹介するコンテンツ等の各種のコンテンツCが生成される。したがって、動画データVaおよび動画データVbが表す動画は、企業内の風景または商品等を撮像した動画である。また、音声データYが表す発話音声は、企業または商品等を解説する音声であり、文字列Qは、企業または商品等を解説する語句または文章である。ただし、動画または音声(文字列Q)の内容は任意であり、以上の例示には限定されない。
【0016】
図2は、端末装置10の具体的な構成を例示するブロック図である。端末装置10は、制御装置11と記憶装置12と通信装置13と撮像装置14と操作装置15と表示装置16と放音装置17とを具備する。なお、端末装置10は、単体の装置で実現されるほか、相互に別体で構成された複数の装置でも実現される。
【0017】
制御装置11は、端末装置10の各要素を制御する単数または複数のプロセッサである。具体的には、例えばCPU(Central Processing Unit)、SPU(Sound Processing Unit)、DSP(Digital Signal Processor)、FPGA(Field Programmable Gate Array)、またはASIC(Application Specific Integrated Circuit)等の1種類以上のプロセッサにより、制御装置11が構成される。
【0018】
記憶装置12は、制御装置11が実行するプログラムと制御装置11が使用する各種のデータとを記憶する単数または複数のメモリである。記憶装置12は、例えば磁気記録媒体もしくは半導体記録媒体等の公知の記録媒体、または、複数種の記録媒体の組合せで構成される。また、端末装置10に対して着脱される可搬型の記録媒体、または制御装置11が通信網30を介して書込または読出を実行可能な記録媒体(例えばクラウドストレージ)を、記憶装置12として利用してもよい。
【0019】
通信装置13は、編集システム20との間で通信網30を介して通信する。具体的には、通信装置13は、素材データDを編集システム20に送信する。また、通信装置13は、編集システム20から送信されたコンテンツCを受信する。
【0020】
撮像装置14は、被写体の撮像により動画データVaを生成する画像入力機器である。例えば、撮像装置14は、撮影レンズ等の光学系と、光学系からの入射光を受光する撮像素子と、撮像素子による受光量に応じた動画データVaを生成する処理回路とを具備する。
【0021】
操作装置15は、利用者からの指示を受付ける指示入力機器である。操作装置15は、例えば利用者が操作する複数の操作子、または、利用者による接触を検知するタッチパネルである。利用者は、操作装置15を操作することで任意の文字列Qを指示することが可能である。なお、利用者は、事前に用意された複数の候補から文字列Qを選択してもよい。
【0022】
表示装置16は、制御装置11から指示された画像を表示する。具体的には、表示装置16は、コンテンツCの動画データVbが表す動画を表示する。表示装置16は、例えば液晶パネルまたは有機EL(ElectroLuminescence)パネル等の表示パネルで構成される。なお、端末装置10とは別体で構成された表示装置16を、当該端末装置10に有線または無線で接続してもよい。
【0023】
放音装置17は、制御装置11から指示された音響を放音する。具体的には、放音装置17は、コンテンツCの音声データYが表す発話音声を放音する。放音装置17は、例えばスピーカ装置、ヘッドホンまたはイヤホンである。なお、端末装置10とは別体で構成された放音装置17を、当該端末装置10に有線または無線で接続してもよい。以上の説明から理解される通り、表示装置16および放音装置17は、コンテンツCを再生する再生装置として機能する。
【0024】
図3は、端末装置10の機能的な構成を例示するブロック図である。端末装置10の制御装置11は、記憶装置12に記憶されたプログラムを実行することで、複数の機能(動画データ取得部31,文字列取得部32,表示制御部33,放音制御部34および通信制御部35)を実現する。
【0025】
動画データ取得部31は、動画データVaを取得する。具体的には、動画データ取得部31は、撮像装置14が生成した動画データVaを取得する。ただし、動画データ取得部31は、他の装置から通信網30を介して動画データVaを取得してもよい。また、動画データ取得部31は、動画データVaに対して各種の編集処理を実行してもよい。
【0026】
文字列取得部32は、文字列Qを取得する。具体的には、文字列取得部32は、操作装置15に対する操作で利用者が指示した文字列Qを取得する。なお、文字列取得部32は、例えば利用者が発音した音声に対する音声認識により、文字列Qを生成してもよい。また、文字列取得部32は、事前に用意された複数の候補の何れかを利用者からの指示に応じて文字列Qとして取得してもよい。
【0027】
通信制御部35は、通信装置13による編集システム20との通信を制御する。具体的には、通信制御部35は、動画データVaと制御データXとを含む素材データDを通信装置13から編集システム20に送信する。なお、動画データVaと制御データXとは、通信装置13から個別に送信されてもよい。すなわち、動画データVaと制御データXとは、相互に独立した別個のデータでもよい。また、通信制御部35は、編集システム20から送信されたコンテンツCを通信装置13により受信する。なお、動画データVbと音声データYとは、編集システム20から個別に送信されてもよい。すなわち、動画データVbと音声データYとは、相互に独立した別個のデータでもよい。
【0028】
図4は、制御データXの模式図である。第1実施形態の制御データXは、文字列Qに加えて発音開始点Pを含む。発音開始点Pは、文字列Qに対応する発話音声の再生が開始される時点である。例えば、動画データVbが表す動画の始点を基準とした時刻により発音開始点Pが指定される。
【0029】
図3の表示制御部33は、表示装置16に画像を表示させる。例えば、表示制御部33は、コンテンツCの動画データVbが表す動画を表示装置16に表示させる。放音制御部34は、放音装置17に音声を放音させる。例えば、放音制御部34は、コンテンツCの音声データYが表す発話音声を放音装置17に放音させる。以上の説明から理解される通り、表示制御部33および放音制御部34は、コンテンツCの再生を制御する要素に相当する。
【0030】
動画データVbが表す動画のほか、表示制御部33は、図5に例示される操作画面Gを表示装置16に表示させる。操作画面Gは、利用者が文字列Qおよび発音開始点Pを指示するために参照する画像である。操作画面Gに対して指示された文字列Qおよび発音開始点Pを含む制御データXが編集システム20に送信される。すなわち、表示装置16は、動画データVbの動画の表示前に操作画面Gを表示する。
【0031】
操作画面Gは、入力領域41と表示領域42と操作画像43と操作画像44とを含む画像である。操作画像43および操作画像44は、操作装置15を利用して利用者が操作可能なソフトウェアボタンである。
【0032】
入力領域41は、利用者が文字列Qを入力するための入力欄である。利用者は、操作装置15を操作することで所望の文字列Qを入力領域41に入力する。入力領域41に文字列Qが入力された状態で操作画像43を操作することで、利用者は当該文字列Qを指示できる。また、利用者は、操作画像43の操作後に、入力領域41内の文字列Qを変更してから操作画像43を再操作することで、変更後の文字列Qを指示することが可能である。以上の説明から理解される通り、文字列取得部32は、操作画像43の操作を契機として文字列Qを取得する。操作画像44は、素材データDの送信を利用者が指示するための画像である。
【0033】
表示領域42は、時間軸τが設定された領域である。時間軸τは、横方向に延在する仮想的な軸線である。表示領域42には、第1画像50と第2画像60と文字列Qとが表示される。
【0034】
第1画像50は、動画データVaが表す動画が時間軸τ上において再生される期間(以下「動画再生期間」という)を表す画像である。具体的には、第1画像50は、端部51と端部52と軸線部53とを含む画像である。端部51は、時間軸τ上における動画再生期間の始点を意味する。端部52は、時間軸τ上における動画再生期間の終点を意味する。軸線部53は、端部51と端部52とにわたり時間軸τの方向に延在する直線状の画像である。時間軸τの方向における第1画像50の表示長(すなわち表示上の全長)は、動画再生期間の時間長に対応する。すなわち、軸線部53上の各地点は、動画再生期間内の各時点を意味する。
【0035】
第2画像60は、音声データYが表す発話音声が時間軸τ上において再生される期間(以下「音声再生期間」という)を表す画像である。具体的には、第2画像60は、端部61と端部62とにわたる矩形状の画像である。端部61は、時間軸τ上における音声再生期間の始点(すなわち発音開始点P)を意味する。端部62は、時間軸τ上における音声再生期間の終点を意味する。したがって、時間軸τの方向における第2画像60の表示長Lは、音声再生期間の時間長に対応する。第1画像50と第2画像60とは、共通の時間軸τのもとで表示される。
【0036】
表示制御部33は、文字列取得部32が取得した文字列Qの文字数Nに応じて第2画像60の表示長Lを制御する。文字数Nは、文字列Qを構成する音節の総数である。文字列Qに含まれる読点も文字数Nの1個として計数される。なお、文字列Qを構成する文字の総数を文字数Nとして計数してもよい。
【0037】
具体的には、表示制御部33は、文字数Nと発話速度Hとに応じて音声再生期間の時間長Tを算定する。発話速度Hは、発話音声における発話の速度である。具体的には、単位時間内に発話される文字の個数により発話速度Hは表現される。第1実施形態における発話速度Hは、所定の基準値h0に設定される。基準値h0は、例えば300文字/分である。表示制御部33は、以下の数式(1)により時間長T(秒)を算定し、時間長Tに比例する表示長Lの第2画像60を表示する。
T=(N/H)×60 (1)
【0038】
例えば、図5の例示の通り「この商品は、従来品の半分の重さです。」という文字列Qが指示された場合を想定すると、文字数Nは「25」であるから、時間長Tは5秒と算定される。したがって、時間軸τにおいて5秒間に相当する表示長Lの第2画像60が表示領域42に表示される。以上の通り、第1実施形態においては、時間軸τの方向における第2画像60の表示長Lが音声再生期間の時間長Tに対応する。したがって、動画再生期間の時間長に対する音声再生期間の時間長の関係を、利用者が直観的に把握できる。
【0039】
表示制御部33は、文字列取得部32が取得した文字列Qを、第2画像60の内側に表示する。具体的には、文字列Qを構成する複数の文字が第2画像60の枠内において時間軸τの方向に配列される。第2画像60は、文字列Qの全体を内包可能な表示長Lで表示される。以上の通り、第1実施形態においては、第2画像60の内側に文字列Qが表示されるから、音声再生期間内における発話音声の内容を利用者が容易に把握できる。
【0040】
利用者は、操作装置15を操作することで、第2画像60を時間軸τの方向(正方向および負方向)に移動させることを指示できる。表示制御部33は、時間軸τ上における第2画像60および文字列Qの位置を、利用者からの指示に応じて変化させる。第2画像60の内側に文字列Qが位置する状態と第2画像60の表示長Lとは、第2画像60の移動の前後にわたり維持される。第2画像60の移動は、時間軸τ上における音声再生期間の移動に相当する。素材データDの発音開始点Pは、時間軸τの方向における第2画像60の端部61の位置に応じて設定される。以上の説明から理解される通り、利用者は、第2画像60の位置を変化させることで、時間軸τ上における音声再生期間の位置を簡便に調整できる。
【0041】
図5においては、第2画像60の全体が時間軸τ上において第1画像50に重複する状態(以下「通常状態」という)が例示されている。通常状態は、音声再生期間の全部が動画再生期間に内包される状態である。通常状態においては、動画データVbが表す動画の再生に並行して文字列Q(発話音声)の全体が発話音声として再生される。
【0042】
他方、第2画像60が時間軸τの方向に移動した結果、図6に例示される通り、第2画像60の端部62が時間軸τ上において第1画像50の端部52の後方(すなわち右側)に位置する場合がある。以上の状態は、音声再生期間の終点が動画再生期間の終点よりも後方に位置する状態(以下「超過状態」という)である。超過状態は、第2画像60のうち端部62側の部分60bが、時間軸τの方向において第1画像50の端部52の後方にはみ出した状態である。超過状態では、第2画像60は、時間軸τ上において第1画像50に重複する部分60aと、第1画像50に重複しない部分60bとに区別される。
【0043】
第2画像60の部分60aは、第1画像50が表す動画再生期間の内側に対応する部分であり、音声再生期間のうち動画再生期間に重複する期間を意味する。すなわち、部分60aは、発話音声のうち動画データVbの動画に対して並行に再生される部分に相当する。他方、第2画像60の部分60bは、第1画像50が表す動画再生期間の外側に対応する部分であり、音声再生期間のうち動画再生期間に重複しない期間を意味する。すなわち、部分60bは、発話音声のうち動画データVbの動画に対して並行に再生されない部分に相当する。時間軸τの方向における部分60bの表示長は、第1画像50に対する第2画像60の位置に応じて変化する。例えば、時間軸τ上で第2画像60が後方に位置するほど、部分60bの表示長は長くなる。部分60bの表示長は、音声再生期間のうち動画再生期間に重複しない期間の時間長を意味する。音声再生期間のうち動画再生期間の終点以降の期間の発話音声は再生されない。
【0044】
超過状態において、表示制御部33は、第2画像60の部分60aと部分60bとを相異なる態様で表示する。なお、画像の表示について「態様」とは、利用者が視覚的に弁別可能な画像の性状を意味する。例えば、色の3属性である色相(色調),彩度および明度(階調)のほか、模様または形状も、「態様」の概念に包含される。例えば、部分60aと部分60bとは相異なる色相で表示される。したがって、利用者は、第2画像60の部分60aと部分60bとを視覚的に区別することが可能である。すなわち、第1実施形態によれば、音声再生期間のうち動画再生期間に重複しない期間の有無または長短を、利用者が容易に把握できる。
【0045】
また、超過状態においては、文字列Qは、第2画像60の部分60a内に位置する部分Qaと、部分60b内に位置する部分Qbとに区別される。文字列Qの部分Qaは、動画再生期間の内側に対応する部分であり、文字列Qのうち動画再生期間内に発音される部分を意味する。文字列Qの部分Qbは、動画再生期間の外側に対応する部分であり、文字列Qのうち動画再生期間内に発音されない部分を意味する。超過状態において、表示制御部33は、文字列Qのうち部分Qaと部分Qbとを相異なる態様で表示する。例えば、部分Qaと部分Qbとは相異なる色相で表示される。したがって、利用者は、文字列Qの部分Qaと部分Qbとを視覚的に区別することが可能である。すなわち、第1実施形態によれば、文字列Qのうち動画再生期間内に発音されない部分の有無または長短を、利用者が容易に把握できる。
【0046】
なお、時間軸τ上で第2画像60の全部が第1画像50に重複する状態においては、第2画像60の全体が、図6の部分60aと同様の態様で表示される。すなわち、第2画像60のうち動画再生期間の外側に対応する部分60bが発生した場合に、表示制御部33は、当該部分60bの態様を変化させる。同様に、文字列Qのうち動画再生期間の外側に対応する部分Qbが発生した場合に、表示制御部33は、当該部分Qbの態様を変化させる。部分60bまたは部分Qbの態様を変化させる表示制御部33の動作は、音声再生期間の一部が動画再生期間の外側に位置すること(すなわち通常状態から超過状態に遷移したこと)を利用者に報知する動作に相当する。以上の構成によれば、音声再生期間の一部が動画再生期間に重複しないことを利用者が容易に把握できる。
【0047】
図7は、端末装置10の制御装置11が実行する処理(以下「制御処理」という)Sの具体的な手順を例示するフローチャートである。操作装置15に対する利用者からの指示を契機として制御処理Sが開始される。
【0048】
制御処理Sが開始されると、動画データ取得部31は、撮像装置14から動画データVaを取得する(Sa1)。表示制御部33は、動画データVaが表す動画の動画再生期間を表す第1画像50を操作画面Gの表示領域42に表示させる(Sa2)。文字列取得部32は、利用者による文字列Qの指示を待機する(Sa3:NO)。利用者による文字列Qが指示されると(Sa3:YES)、文字列取得部32は、当該文字列Qを取得する(Sa4)。
【0049】
表示制御部33は、文字列Qの文字数Nと発話速度Hとに応じて第2画像60の表示長Lを設定する(Sa5)。具体的には、表示制御部33は、文字数Nと発話速度Hとに応じて音声再生期間の時間長Tを算定し、当該時間長Tに対応する表示長Lを設定する。表示制御部33は、表示長Lの第2画像60を表示領域42に表示させる(Sa6)。また、表示制御部33は、第2画像60の内側に文字列Qを表示させる(Sa7)。
【0050】
文字列取得部32は、取得済の文字列Qの変更が利用者により指示されたか否かを判定する(Sa8)。変更が指示された場合(Sa8:YES)、文字列取得部32は、変更後の文字列Qを取得する(Sa4)。表示制御部33は、変更後の文字列Qについて、第2画像60の表示長Lの設定(Sa5)と当該第2画像60の表示(Sa6)と当該文字列Qの表示(Sa7)とを実行する。
【0051】
他方、文字列Qの変更が指示されない場合(Sa8:NO)、表示制御部33は、第2画像60の移動が利用者から指示されたか否かを判定する(Sa9)。変更が指示された場合(Sa9:YES)、表示制御部33は、利用者からの指示に応じて第2画像60を時間軸τの方向に移動させる(Sa10)。他方、第2画像60の移動が指示されない場合(Sa9:NO)、表示制御部33は、第2画像60を移動させることなく処理をステップSa13に移行する。
【0052】
第2画像60を移動させると(Sa10)、表示制御部33は、移動後の第2画像60の端部62が動画再生期間の外側に位置するか否かを判定する(Sa11)。すなわち、超過状態に該当するか否かが判定される。端部62が動画再生期間の外側に位置する場合(Sa11:YES)、表示制御部33は、第2画像60のうち部分60bの態様を変更する(Sa12)。すなわち、第2画像60のうち動画再生期間の内側に対応する部分60aと当該動画再生期間の外側に対応する部分60bとが相異なる態様で表示される。他方、第2画像60の全部が動画再生期間の内側に位置する場合(Sa11:NO)、表示制御部33は、部分60bの態様の変更(Sa12)を実行しない。
【0053】
通信制御部35は、操作画像44が利用者により操作されたか否かを判定する(Sa13)。すなわち、素材データDの送信が利用者から指示されたか否かが判定される。操作画像44が操作されない場合(Sa13:NO)、制御装置11は、文字列Qの変更が指示されたか否かの判定(Sa8)に処理を移行する。
【0054】
他方、操作画像44が操作された場合(Sa13:YES)、通信制御部35は、動画データVaと制御データXとを含む素材データDを通信装置13から編集システム20に送信する(Sa14)。制御データXは、現時点の文字列Qと、第2画像60の端部61の位置に応じた発音開始点Pとを含む。
【0055】
以上の手順で端末装置10から送信された素材データDを受信すると、編集システム20の音声合成部22は、文字列Qを適用した音声合成により音声データYを生成する。音声合成においては、発話速度Hの基準値h0(300文字/分)で文字列Qを発話した発話音声の音声データYが生成される。動画データVaに対する編集で動画編集部21が生成した動画データVbと、音声合成部22が生成した音声データYとを含むコンテンツCが編集システム20から端末装置10に送信される。コンテンツCにおいては、動画データVbが表す動画の動画再生期間のうち発音開始点Pから発話音声が開始されるように、動画データVbに音声データYが付加される。
【0056】
通信制御部35は、編集システム20から送信されたコンテンツCを通信装置13により受信する(Sa15)。表示制御部33は、コンテンツCの動画データVaが表す動画を表示装置16に表示させ(Sa16)、放音制御部34は、コンテンツCの音声データYが表す発話音声を放音装置17に放音させる(Sa17)。すなわち、利用者が指示した文字列Qに対応する発話音声と撮像装置14が撮像した動画とが並行に再生される。発話音声の発音は、動画再生期間のうち第2画像60の位置に応じた発音開始点Pから開始される。
【0057】
以上の説明から理解される通り、第1実施形態においては、時間軸τ上の動画再生期間を表す第1画像50と、当該時間軸τ上の音声再生期間を表す第2画像60と、発話音声を表す文字列Qとが、表示装置16に表示される。したがって、時間軸τ上における動画再生期間と音声再生期間との関係、および、音声再生期間内に発音される発話音声の文字列Qを、利用者が容易に把握できる。
【0058】
B:第2実施形態
第2実施形態について説明する。なお、以下に例示する各形態において機能が第1実施形態と同様である要素については、第1実施形態の説明で使用した符号を流用して各々の詳細な説明を適宜に省略する。
【0059】
図8は、第2実施形態における操作画面Gのうち表示領域42の模式図である。図8には、超過状態における表示領域42が例示されている。通常状態における表示領域42は第1実施形態(図5)と同様である。
【0060】
第2実施形態の表示制御部33は、超過状態において、文字列Qのうち動画再生期間の外側に対応する部分Qbを表示しない。すなわち、文字列Qのうち第2画像60の部分60bに重複する部分Qbが消去される。第2画像60の部分60aと部分60bとが相異なる態様で表示される点は第1実施形態と同様である。
【0061】
第2実施形態においても第1実施形態と同様の効果が実現される。また、第2実施形態においては、文字列Qのうち動画再生期間の外側に対応する部分が表示されないから、文字列Qのうち動画再生期間に重複しない部分Qbの有無または長短を利用者が容易に把握できる。
【0062】
なお、図8においては、文字列Qの部分Qbを表示しない構成を例示したが、以上の構成とともに、超過状態において、第2画像60のうち動画再生期間の外側に対応する部分60bを表示しない構成も採用される。また、超過状態において、文字列Qの部分Qbの表示を維持したまま、第2画像60の部分60bを消去する構成も想定される。
【0063】
C:第3実施形態
図9は、第3実施形態における操作画面Gのうち表示領域42の模式図である。図9には、超過状態における表示領域42が例示されている。通常状態における表示領域42は第1実施形態(図5)と同様である。
【0064】
第3実施形態では、第2画像60のうち端部62側の一部が動画再生期間の外側に位置する超過状態において音声再生期間が短縮される。すなわち、音声再生期間の終点が動画再生期間の終点よりも後方に位置する場合に音声再生期間が短縮される。具体的には、表示制御部33は、音声再生期間の始点を維持したまま、音声再生期間の終点が動画再生期間の終点に一致するように、音声再生期間を短縮する。
【0065】
表示制御部33は、短縮後の音声再生期間の時間長Tに対応する表示長Lで第2画像60を表示させる。具体的には、図9に例示される通り、時間軸τ上において第2画像60の端部62が第1画像50の端部52に一致するように、第2画像60が時間軸τの方向に短縮される。第2画像60の端部61の位置は変更されない。また、表示制御部33は、利用者が指示した文字列Qの文字数Nに応じた初期的な表示長Lで第2画像60が表示される場合と、音声再生期間の超過により第2画像60が短縮された場合とで、第2画像60の態様を相違させる。すなわち、表示制御部33は、第2画像60のうち端部62側の一部が動画再生期間の外側に位置する場合に、第2画像60の態様を変化させる。第2画像60の態様を変化させる以上の動作は、音声再生期間の一部が動画再生期間の外側に位置することを利用者に報知する動作に相当する。
【0066】
図10は、第3実施形態における制御処理Sの一部を例示するフローチャートである。第3実施形態においては、図7に例示した制御処理SのうちステップSa12が、図10のステップSb1-Sb3に置換される。
【0067】
利用者からの指示に応じた移動後の第2画像60の端部62が動画再生期間の外側に位置する場合(Sa11:YES)、表示制御部33は、音声再生期間を短縮する(Sb1)。具体的には、表示制御部33は、音声再生期間の始点を維持したまま、音声再生期間の終点が動画再生期間の終点に一致するように音声再生期間を短縮する。表示制御部33は、第2画像60を変更する(Sb2)。具体的には、表示制御部33は、短縮後の音声再生期間の時間長Tに応じた表示長Lとなるように第2画像60を時間軸τの方向に短縮する。また、表示制御部33は、第2画像60の全体の態様を変化させる。すなわち、通常状態と超過状態とでは第2画像60が相異なる態様で表示される。
【0068】
また、表示制御部33は、短縮後の音声再生期間内に文字列Qの全体が発音されるように発話速度Hを調整する(Sb3)。すなわち、表示制御部33は、短縮後の音声再生期間の時間長Tと文字列Qの文字数Nとに応じて発話速度Hを設定する。具体的には、発話速度Hは、基準値h0を上回る数値(以下「調整値」という)h1に設定される。例えば、短縮後の音声再生期間が短いほど、調整値h1は大きい数値に設定される。
【0069】
操作画面Gの操作画像44が操作された場合(Sa13:YES)、通信制御部35は、第1実施形態と同様に、動画データVaと制御データXとを含む素材データDを通信装置13から編集システム20に送信する(Sa14)。第3実施形態の制御データXは、図11に例示される通り、文字列Qと発音開始点Pとに加えて発話速度Hを含む。音声再生期間が短縮されていない場合の発話速度Hは、第1実施形態と同様に基準値h0に設定される。他方、音声再生期間が短縮された場合の発話速度Hは、基準値h0を上回る調整値h1に設定される。したがって、発話速度Hが調整値h1である場合に音声合成部22が生成する発話音声の時間長は、発話速度Hが基準値h0である場合の発話音声の時間長よりも短い。すなわち、音声合成部22は、短縮後の音声再生期間内に発話音声が発音されるように音声データYを生成する。
【0070】
第3実施形態においても第1実施形態と同様の効果が実現される。また、第3実施形態においては、第2画像60の端部62が第1画像50の端部52よりも後方に位置する場合に音声再生期間が短縮される。したがって、動画再生期間内に文字列Qの全部を発音する発話音声を生成できる。第3実施形態においては特に、音声再生期間の終点が動画再生期間の終点に一致するように音声再生期間が短縮されるから、発話音声の全体を動画に対して重複させる作業が容易である。
【0071】
D:第4実施形態
図12は、第4実施形態における操作画面Gのうち表示領域42の模式図である。第1画像50が表す動画再生期間が長い場合には特に、第2画像60の表示長Lが第1画像50に対して相対的に短くなる可能性が高い。第2画像60の表示長Lが短い場合でも利用者が文字列Qを容易に確認できるように、第4実施形態においては、文字列Qの文字数Nが閾値Nthを上回る場合に、図12に例示される通り、第2画像60の外側に文字列Qを表示する。具体的には、第2画像60の近傍に配置された補助画像70の内側に文字列Qが表示される。
【0072】
図13は、第4実施形態における制御処理Sの一部を例示するフローチャートである。第4実施形態においては、図7に例示した制御処理SのうちステップSa7が、図13のステップSc1-Sc4に置換される。
【0073】
第1実施形態と同様の手順で第2画像60を表示すると(Sa6)、表示制御部33は、第2画像60の表示長Lに応じて閾値Nthを設定する(Sc1)。具体的には、表示制御部33は、表示長Lが大きいほど、閾値Nthを大きい数値に設定する。表示制御部33は、文字列Qの文字数Nが閾値Nthを下回るか否かを判定する(Sc2)。文字数Nが閾値Nthを下回る場合(Sc2:YES)、表示制御部33は、第1実施形態と同様に、第2画像60の内側に文字列Qを表示させる(Sc3)。
【0074】
他方、文字数Nが閾値Nthを上回る場合(Sc2:NO)、表示制御部33は、第2画像60の外側に文字列Qを表示させる(Sc4)。具体的には、表示制御部33は、第2画像60の外側に矩形状の補助画像70を配置し、当該補助画像70の内側に文字列Qを配置する。文字列Qを構成する文字のサイズは、当該文字列Qが第2画像60の内側に表示される場合と外側に表示される場合とで共通する。ただし、文字列Qを構成する文字のサイズは、例えば文字数Nに応じて変更されてもよい。また、文字数Nが閾値Nthに等しい場合には、第2画像60の内側に文字列Qを表示してもよいし(Sc3)、第2画像60の外側に文字列Qを表示してもよい(Sc4)。
【0075】
第2画像60の内側に文字列Qが表示される場合、超過状態では、第1実施形態と同様に、第2画像60のうち部分60aと部分60bとが相異なる態様で表示され、かつ、文字列Qのうち部分Qaと部分Qbとが相異なる態様で表示される。他方、第2画像60の外側に文字列Qが表示される場合、超過状態では、第2画像60のうち部分60aと部分60bとが相異なる態様で表示され、補助画像70内の文字列Qは全体にわたり共通の態様で表示される。
【0076】
第4実施形態においても第1実施形態と同様の効果が実現される。また、第5実施形態においては、文字数Nが閾値Nthを上回る場合には第2画像60の外側に文字列Qが表示される。したがって、音声再生期間(第2画像60の表示長L)が比較的に短い場合でも、利用者が文字列Qの全体を容易に把握できる。
【0077】
E:変形例
以上に例示した各態様に付加される具体的な変形の態様を以下に例示する。以下の例示から任意に選択された2以上の態様を、相互に矛盾しない範囲で適宜に併合してもよい。
【0078】
(1)前述の各形態においては、音声再生期間の終点が動画再生期間の終点の後方に位置する場合に着目したが、音声再生期間の始点が動画再生期間の始点の前方に位置する場合にも、前述の各形態と同様の構成が採用される。
【0079】
例えば、第1実施形態と同様に、表示制御部33は、第2画像60のうち動画再生期間の始点の前方に位置する部分と、動画再生期間の内側に対応する部分とを、相異なる態様で表示してもよい。また、表示制御部33は、文字列Qのうち動画再生期間の始点の前方に位置する部分と、動画再生期間の内側に位置する部分とを、相異なる態様で表示してもよい。
【0080】
また、第2実施形態と同様に、表示制御部33は、文字列Qのうち動画再生期間の始点の前方に位置する部分を消去してもよい。また、表示制御部33は、第2画像60のうち動画再生期間の始点の前方に位置する部分を消去してもよい。
【0081】
第3実施形態と同様に、表示制御部33は、第2画像60の端部61が第1画像50の端部51よりも前方に位置する場合に、音声再生期間を短縮してもよい。例えば、音声再生期間の始点が動画再生期間の始点の前方に位置する場合に、音声再生期間の始点が動画再生期間の始点に一致するように音声再生期間が短縮される。
【0082】
(2)前述の各形態においては、動画再生期間内に1個の音声再生期間が設定される場合を例示したが、図14に例示される通り、動画再生期間内に複数の音声再生期間が設定されてもよい。表示制御部33は、相異なる文字列Qの音声再生期間に対応する複数の第2画像60を表示領域42に表示させる。表示制御部33は、操作装置15に対する利用者からの指示に応じて、複数の第2画像60の各々を時間軸τの方向に個別に移動させる。
【0083】
なお、2以上の音声再生期間が時間軸τ上において相互に重複しないように表示制御部33が各音声再生期間を自動的に調整してもよい。例えば、表示制御部33は、2以上の音声再生期間が重複するような第2画像60の移動の指示を受付けない形態が想定される。また、表示制御部33は、時間軸τ上で2個の第2画像60が重複する場合に、当該2個の第2画像60のうち一方を消去してもよい。また、表示制御部33は、時間軸τ上で2個の第2画像60が重複する場合に、当該2個の第2画像60のうち一方を、他方に重複しない位置に自動的に移動させてもよい。
【0084】
(3)前述の各形態においては、第1画像50と第2画像60と文字列Qとを表示領域42に表示したが、図15に例示される通り、コンテンツCの動画データVbが表す動画75を表示装置16に表示させる期間内に、表示制御部33が、当該動画75とともに文字列Qを表示してもよい。
【0085】
表示制御部33は、動画75のうち特定の被写体(以下「目標物」という)76とは重複しない位置に文字列Qを配置する。目標物76は、例えば任意の人物または特定の物体等、動画75内において相対的に面積が大きい被写体である。目標物76の認識には、顔認識等の公知の画像認識が任意に採用される。例えば、顔認識により認識された人物を目標物76として特定する構成、または、顔認識により認識された人物の近傍に位置する大面積の物体を目標物76として特定する構成が想定される。
【0086】
(4)第1実施形態では、超過状態において、第2画像60の部分60aと部分60bとが相異なる態様で表示される。第2実施形態では、超過状態において、文字列Qの部分Qb(または第2画像60の部分60b)が消去される。第3実施形態では、通常状態と超過状態とにおいて第2画像60が相異なる態様で表示される。以上の構成は、音声再生期間の一部が動画再生期間の外側に位置すること(すなわち超過状態)を利用者に報知するための具体的な形態である。ただし、超過状態を利用者に報知するための形態は以上の例示に限定されない。
【0087】
例えば、図16に例示される通り、超過状態を利用者に報知するための報知画像78を、表示領域42とは別個に操作画面Gに配置してもよい。表示制御部33は、通常状態と超過状態とで報知画像78の表示の態様を相違させる。例えば、表示制御部33は、通常状態から超過状態に遷移すると、報知画像78の表示の態様を変化させる。以上の構成によれば、利用者は、報知画像78の態様の変化により、音声再生期間の一部が動画再生期間の外側に位置することを認識できる。なお、以上の説明においては画像の表示により利用者に超過状態を報知したが、例えば放音制御部34が警報音を放音装置17に放音させることで、超過状態を利用者に報知してもよい。
【0088】
(5)前述の各形態において例示した端末装置10の機能は、編集システム20に搭載されてもよい。動画データ取得部31は、端末装置10から送信された動画データVaを取得し、文字列取得部32は、端末装置10から送信された文字列Qを取得する。表示制御部33は、操作画面Gを表す画像データを端末装置10に送信することで、端末装置10の表示装置16に操作画面Gを表示させる。以上の機能が搭載された編集システム20には、前述の各形態で例示した任意の構成が採用される。表示装置16に操作画面Gを表示させる機能を具備するコンピュータシステム(端末装置10または編集システム20)は、「情報処理システム」として包括的に表現される。また、前述の各形態において例示した編集システム20の機能(動画編集部21および音声合成部22)は、端末装置10に搭載されてもよい。
【0089】
(6)前述の各形態に例示した機能は、前述の通り、複数のプロセッサ(例えば制御装置11)と記録媒体(例えば記憶装置12)に記憶されたプログラムとの協働により実現される。以上の機能を実現するためのプログラムは、コンピュータが読取可能な記録媒体に格納された形態で提供されてコンピュータにインストールされ得る。記録媒体は、例えば非一過性(non-transitory)の記録媒体であり、CD-ROM等の光学式記録媒体(光ディスク)が好例であるが、半導体記録媒体または磁気記録媒体等の公知の任意の形式の記録媒体も包含される。なお、非一過性の記録媒体とは、一過性の伝搬信号(transitory, propagating signal)を除く任意の記録媒体を含み、揮発性の記録媒体も除外されない。また、配信装置が通信網を介してプログラムを配信する構成では、当該配信装置においてプログラムを記憶する記憶装置が、前述の非一過性の記録媒体に相当する。
【0090】
F:付記
以上に例示した形態から、例えば以下の構成が把握される。
【0091】
本開示のひとつの態様(態様1)に係る情報処理方法は、動画の再生とともに再生される音声を表す文字列を取得し、時間軸上において前記動画が再生される動画再生期間を表す第1画像と、前記時間軸上において前記音声が再生される音声再生期間を表す第2画像と、前記文字列と、を表示装置に表示させる。以上の態様においては、動画再生期間を表す第1画像と、当該動画の再生とともに再生される音声の音声再生期間を表す第2画像とが、共通の時間軸のもとで表示され、かつ、当該音声を表す文字列が表示される。したがって、時間軸上における動画再生期間と音声再生期間との関係、および、音声再生期間内に発音される音声の文字列を、利用者が容易に把握できる。
【0092】
態様1の具体例(態様2)において、前記第2画像は、前記時間軸の方向における表示長が前記音声再生期間の時間長に対応する画像である。以上の態様においては、時間軸の方向における第2画像の表示長が音声再生期間の時間長に対応する。したがって、動画再生期間の時間長に対する音声再生期間の時間長の関係を、利用者が直観的に把握できる。なお、「音声再生期間の時間長」は、文字列に対応する音声を実際に合成した場合における当該音声の時間長、または、文字列の文字数から推定される当該音声の時間長である。
【0093】
態様2の具体例(態様3)において、前記時間軸上における前記第2画像の位置を利用者からの指示に応じて変化させる。以上の態様においては、利用者は、第2画像の位置を変化させることで、時間軸上における音声再生期間の位置を簡便に調整できる。
【0094】
態様2または態様3の具体例(態様4)において、前記文字列は、前記第2画像の内側に表示される。以上の態様においては、第2画像の内側に文字列が表示されるから、音声再生期間内における音声の内容を利用者が容易に把握できる。
【0095】
態様2から態様4の何れかの具体例(態様5)において、前記音声再生期間の一部が前記動画再生期間の外側に位置することを報知する。以上の態様においては、音声再生期間の一部が動画再生期間の外側に位置することが利用者に報知される。したがって、音声再生期間の一部が動画再生期間に重複しないことを利用者が容易に把握できる。
【0096】
態様2から態様4の何れかの具体例(態様6)において、前記第2画像のうち前記動画再生期間の外側に対応する部分と、前記動画再生期間の内側に対応する部分とを、相異なる態様で表示する。以上の態様においては、第2画像のうち、動画再生期間の外側に対応する部分と当該動画再生期間の内側に対応する部分とが、相異なる態様で表示される。したがって、音声再生期間のうち動画再生期間に対して重複しない期間の有無または長短を、利用者が容易に把握できる。
【0097】
態様2から態様4の何れかかの具体例(態様7)において、前記文字列のうち、前記動画再生期間の外側に対応する部分と、前記動画再生期間の内側に対応する部分とを、相異なる態様で表示する。以上の態様においては、文字列のうち、動画再生期間の外側に対応する部分と当該動画再生期間の内側に対応する部分とが、相異なる態様で表示される。したがって、文字列のうち動画再生期間内に発音されない部分の有無または長短を、利用者が容易に把握できる。
【0098】
態様1から態様4の何れかの具体例(態様8)において、前記文字列のうち前記動画再生期間の外側に対応する部分を表示しない。以上の態様においては、文字列のうち、動画再生期間の外側に対応する部分が表示されない。したがって、音声を表す文字列のうち動画再生期間に対して重複しない部分の有無または長短を利用者が容易に把握できる。
【0099】
態様1から態様5の何れかの具体例(態様9)において、前記音声再生期間の終点が前記動画再生期間の終点よりも後方に位置する場合に前記音声再生期間を短縮し、前記短縮後の音声再生期間の終点が前記動画再生期間の終点に一致するように前記第2画像を表示させる。以上の態様においては、音声再生期間の終点が動画再生期間の終点よりも後方に位置する場合に、音声再生期間の終点が動画再生期間の終点に一致するように音声再生期間が短縮される。したがって、音声の全体を動画に対して重複させる作業が容易である。
【0100】
態様1から態様9の何れかの具体例(態様10)において、前記文字列の文字数が閾値を下回る場合に、前記第2画像の内側に前記文字列を表示させ、前記文字数が前記閾値を上回る場合に、前記第2画像の外側に前記文字列を表示させる。以上の態様においては、文字列の文字数が閾値を下回る場合には、第2画像の内側に文字列が表示され、文字数が閾値を上回る場合には、第2画像の外側に文字列が表示される。したがって、音声が比較的に短い場合であっても、利用者が文字列の全体を容易に把握できる。
【0101】
本開示のひとつの態様に係る情報処理システムは、動画の再生とともに再生される音声を表す文字列を取得する文字列取得部と、時間軸上において前記動画が再生される動画再生期間を表す第1画像と、前記時間軸上において前記音声が再生される音声再生期間を表す第2画像と、前記文字列と、を表示装置に表示させる表示制御部とを具備する。
【0102】
本開示のひとつの態様に係るプログラムは、動画の再生とともに再生される音声を表す文字列を取得する文字列取得部、および、時間軸上において前記動画が再生される動画再生期間を表す第1画像と、前記時間軸上において前記音声が再生される音声再生期間を表す第2画像と、前記文字列と、を表示装置に表示させる表示制御部、としてコンピュータを機能させる。
【符号の説明】
【0103】
100…情報システム、10…端末装置、11…制御装置、12…記憶装置、13…通信装置、14…撮像装置、15…操作装置、16…表示装置、17…放音装置、20…編集システム、21…動画編集部、22…音声合成部、31…動画データ取得部、32…文字列取得部、33…表示制御部、34…放音制御部、35…通信制御部、41…入力領域、42…表示領域、43,44…操作画像、50…第1画像、60…第2画像、70…補助画像、75…動画、76…目標物、78…報知画像。
図1
図2
図3
図4
図5
図6
図7
図8
図9
図10
図11
図12
図13
図14
図15
図16