IP Force 特許公報掲載プロジェクト 2022.1.31 β版

知財求人 - 知財ポータルサイト「IP Force」

▶ ヤマハ株式会社の特許一覧

特許7468111再生制御方法、制御システムおよびプログラム
<>
  • 特許-再生制御方法、制御システムおよびプログラム 図1
  • 特許-再生制御方法、制御システムおよびプログラム 図2
  • 特許-再生制御方法、制御システムおよびプログラム 図3
  • 特許-再生制御方法、制御システムおよびプログラム 図4
  • 特許-再生制御方法、制御システムおよびプログラム 図5
  • 特許-再生制御方法、制御システムおよびプログラム 図6
  • 特許-再生制御方法、制御システムおよびプログラム 図7
  • 特許-再生制御方法、制御システムおよびプログラム 図8
< >
(19)【発行国】日本国特許庁(JP)
(12)【公報種別】特許公報(B2)
(11)【特許番号】
(24)【登録日】2024-04-08
(45)【発行日】2024-04-16
(54)【発明の名称】再生制御方法、制御システムおよびプログラム
(51)【国際特許分類】
   G10K 15/02 20060101AFI20240409BHJP
【FI】
G10K15/02
【請求項の数】 10
(21)【出願番号】P 2020074260
(22)【出願日】2020-04-17
(65)【公開番号】P2021173766
(43)【公開日】2021-11-01
【審査請求日】2023-02-20
(73)【特許権者】
【識別番号】000004075
【氏名又は名称】ヤマハ株式会社
(74)【代理人】
【識別番号】110003177
【氏名又は名称】弁理士法人旺知国際特許事務所
(72)【発明者】
【氏名】入山 達也
【審査官】渡部 幸和
(56)【参考文献】
【文献】特開2010-134203(JP,A)
【文献】特開2008-96483(JP,A)
【文献】特開2002-268666(JP,A)
【文献】特開平10-20885(JP,A)
【文献】特開2010-128099(JP,A)
(58)【調査した分野】(Int.Cl.,DB名)
G10K 15/00
H04N 21/00
(57)【特許請求の範囲】
【請求項1】
第1利用者による指示に応じた第1再生要求を第1端末装置から受信し、
第2利用者による指示に応じた第2再生要求を第2端末装置から受信し、
前記第1再生要求に応じた音を表す第1音響信号と、前記第1音響信号が表す音とは音響特性が異なる音であって前記第2再生要求に応じた音を表す第2音響信号とを取得し、
前記第1音響信号と前記第2音響信号とを混合し、
前記混合後の音響信号が表す音を再生システムに再生させる
コンピュータシステムにより実現される再生制御方法。
【請求項2】
前記音響特性は、音高、音量、音質、周波数特性、残響特性、音高の時間変化、音像の定位位置、および継続長のうちの1以上を含む
請求項1の再生制御方法。
【請求項3】
前記第1再生要求は、前記第1利用者が指示した第1文字列を含み、
前記第2再生要求は、前記第2利用者が指示した第2文字列を含み、
前記取得においては、
前記第1文字列に対応する音声を表す前記第1音響信号を、当該第1文字列を適用した音声合成処理により生成し、
前記第2文字列に対応する音声を表す前記第2音響信号を、当該第2文字列を適用した音声合成処理により生成する
請求項1または請求項2の再生制御方法。
【請求項4】
前記音声合成処理においては、
前記第1利用者の属性に応じた音響特性の前記第1音響信号を生成し、
前記第2利用者の属性に応じた音響特性の前記第2音響信号を生成する
請求項3の再生制御方法。
【請求項5】
前記音声合成処理においては、
前記第1文字列に応じた音響特性の前記第1音響信号を生成し、
前記第2文字列に応じた音響特性の前記第2音響信号を生成する
請求項3または請求項4の再生制御方法。
【請求項6】
前記混合においては、
前記第1音響信号の始点と前記第2音響信号の始点とを時間軸上の特定期間内に調整し、前記調整後の前記第1音響信号と前記第2音響信号とを混合する
請求項1から請求項5の何れかの再生制御方法。
【請求項7】
前記調整においては、
前記第1音響信号の始点と前記第2音響信号の始点とを前記特定期間内に分散させる
請求項6の再生制御方法。
【請求項8】
前記特定期間は、前記再生システムが設置される音響空間内において収音される音の音量に応じて設定される
請求項6または請求項7の再生制御方法。
【請求項9】
第1利用者による指示に応じた第1再生要求を第1端末装置から受信し、第2利用者による指示に応じた第2再生要求を第2端末装置から受信する受信部と、
前記第1再生要求に応じた音を表す第1音響信号と、前記第1音響信号が表す音とは音響特性が異なる音であって前記第2再生要求に応じた音を表す第2音響信号とを取得する取得部と、
前記第1音響信号と前記第2音響信号とを混合する混合部と、
前記混合後の音響信号が表す音を再生システムに再生させる再生部と
を具備する制御システム。
【請求項10】
第1利用者による指示に応じた第1再生要求を第1端末装置から受信し、第2利用者による指示に応じた第2再生要求を第2端末装置から受信する受信部、
前記第1再生要求に応じた音を表す第1音響信号と、前記第1音響信号が表す音とは音響特性が異なる音であって前記第2再生要求に応じた音を表す第2音響信号とを取得する取得部、
前記第1音響信号と前記第2音響信号とを混合する混合部、および、
前記混合後の音響信号が表す音を再生システムに再生させる再生部
としてコンピュータを機能させるプログラム。
【発明の詳細な説明】
【技術分野】
【0001】
本開示は、例えば音響ホール等の音響空間における音の再生を制御する技術に関する。
【背景技術】
【0002】
例えば音響ホール等の音響空間で実施されるコンサートまたはライブ等のイベントを、多数の利用者が遠隔地において視聴するためのシステムが従来から提案されている(例えば特許文献1)。
【先行技術文献】
【特許文献】
【0003】
【文献】米国特許第9131016号明細書
【発明の概要】
【発明が解決しようとする課題】
【0004】
しかし、遠隔地の利用者が音響空間内のイベントを視聴する状況では、音響空間内に所在する歌唱者または演奏者等の実演者が、自身の実演を視聴している利用者の状況を把握し難いという課題がある。例えば、遠隔地の利用者の総数または反応を、実演者は把握できない。
【課題を解決するための手段】
【0005】
以上の課題を解決するために、本開示のひとつの態様に係る再生制御方法は、第1利用者による指示に応じた第1再生要求を第1端末装置から受信し、第2利用者による指示に応じた第2再生要求を第2端末装置から受信し、前記第1再生要求に応じた音を表す第1音響信号と、前記第1音響信号が表す音とは音響特性が異なる音であって前記第2再生要求に応じた音を表す第2音響信号とを取得し、前記第1音響信号と前記第2音響信号とを混合し、前記混合後の音響信号が表す音を再生システムに再生させる。
【0006】
本開示のひとつの態様に係る制御システムは、第1利用者による指示に応じた第1再生要求を第1端末装置から受信し、第2利用者による指示に応じた第2再生要求を第2端末装置から受信する受信部と、前記第1再生要求に応じた音を表す第1音響信号と、前記第1音響信号が表す音とは音響特性が異なる音であって前記第2再生要求に応じた音を表す第2音響信号とを取得する取得部と、前記第1音響信号と前記第2音響信号とを混合する混合部と、前記混合後の音響信号が表す音を再生システムに再生させる再生部とを具備する。
【0007】
本開示のひとつの態様に係るプログラムは、第1利用者による指示に応じた第1再生要求を第1端末装置から受信し、第2利用者による指示に応じた第2再生要求を第2端末装置から受信する受信部、前記第1再生要求に応じた音を表す第1音響信号と、前記第1音響信号が表す音とは音響特性が異なる音であって前記第2再生要求に応じた音を表す第2音響信号とを取得する取得部、前記第1音響信号と前記第2音響信号とを混合する混合部、および、前記混合後の音響信号が表す音を再生システムに再生させる再生部としてコンピュータを機能させる。
【図面の簡単な説明】
【0008】
図1】第1実施形態における通信システムの構成を例示するブロック図である。
図2】端末装置の構成を例示するブロック図である。
図3】受付処理の具体的な手順を例示するフローチャートである。
図4】制御システムの構成を例示するブロック図である。
図5】再生制御処理の具体的な手順を例示するフローチャートである。
図6】第4実施形態における再生制御処理の具体的な手順を例示するフローチャートである。
図7】第4実施形態の再生制御処理における設定処理および調整処理の説明図である。
図8】第5実施形態における設定処理の説明図である。
【発明を実施するための形態】
【0009】
A:第1実施形態
図1は、第1実施形態に係る通信システム100の構成を例示するブロック図である。通信システム100は、複数(N個)の端末装置10_1~10_Nと制御システム20と収録システム30と再生システム40とを具備する(Nは2以上の自然数)。以下の説明においては、N個の端末装置10_1~10_Nのうち任意の1個の端末装置10_n(n=1~N)に関連する要素の符号に添字_nを付加する。なお、端末装置10_nの個数Nは可変の数値である。
【0010】
収録システム30および再生システム40は、各種のイベントが実施される施設200内に設置される。施設200は、音楽イベントが実施される音響空間である。音楽イベントにおいては実演者Pが実演する。例えば実演者Pが楽曲を歌唱するライブ、または実演者Pが楽器を演奏するコンサート等の各種の音楽イベントが想定される。例えば音響ホール、ライブハウスまたは野外ステージ等が施設200の具体例である。なお、第1実施形態においては、施設200内に聴衆が存在しない場合を想定する。例えば感染症の蔓延の防止等の種々の事情により、施設200内に聴衆が存在しない状況で音楽イベントが実施される。通常の音楽イベントにおいては実演者Pが施設200内の聴衆の状況を把握できるが、第1実施形態の音楽イベントにおいては、施設200内の聴衆の状況を実演者Pが把握できない。
【0011】
収録システム30は、施設200内で実施される音楽イベントの動画を収録する。具体的には、収録システム30は、音楽イベントの映像を撮像する撮像装置と、音楽イベントの音を収音する収音装置とを具備する。撮像装置が撮像する映像と収音装置が収音する音とで構成される動画が収録システム30により生成される。
【0012】
再生システム40は、施設200内に音を再生する。再生システム40は、例えば施設200内の相異なる場所に設置された複数の放音装置(例えばスピーカ装置)を具備する。音楽イベントの実演者Pは、当該音楽イベントにおける実演中に再生システム40による再生音を聴取可能である。収録システム30および再生システム40は、制御システム20と通信可能である。
【0013】
制御システム20は、配信制御部20aと再生制御部20bとを具備する。配信制御部20aは、収録システム30が収録した動画を表す動画データMをN個の端末装置10_1~10_Nの各々に配信する。動画データMは、例えば音楽イベントの進行に並行して実時間的に各端末装置10_nに対してストリーミング配信される。再生制御部20bは、N個の端末装置10_1~10_Nの各々の利用者U_nからの指示に応じた音を再生システム40に再生させる。なお、配信制御部20aを具備するシステムと再生制御部20bを具備するシステムとを個別に設置してもよい。
【0014】
N個の端末装置10_1~10_Nの各々は、例えばスマートフォンまたはタブレット端末等の可搬型の情報端末である。なお、据置型または可搬型のパーソナルコンピュータを端末装置10_nとして利用してもよい。各端末装置10_nは、例えば移動体通信網またはインターネット等の通信網300を介して制御システム20と通信する。端末装置10_nの利用者U_nは、施設200の外側に位置する。例えば、利用者U_nは、施設200から遠隔の地点(例えば自宅)に所在する。
【0015】
図2は、端末装置10_nの構成を例示するブロック図である。端末装置10_nは、制御装置11と記憶装置12と通信装置13と再生装置14と操作装置15とを具備する。なお、端末装置10_nは、単体の装置として実現されるほか、相互に別体で構成された複数の装置の集合としても実現される。
【0016】
制御装置11は、端末装置10_nの各要素を制御する単数または複数のプロセッサで構成される。例えば、制御装置11は、CPU(Central Processing Unit)、SPU(Sound Processing Unit)、DSP(Digital Signal Processor)、FPGA(Field Programmable Gate Array)、またはASIC(Application Specific Integrated Circuit)等の1種類以上のプロセッサにより構成される。
【0017】
記憶装置12は、制御装置11が実行するプログラムと制御装置11が使用する各種のデータとを記憶する単数または複数のメモリである。記憶装置12は、例えば磁気記録媒体または半導体記録媒体等の公知の記録媒体により構成される。なお、複数種の記録媒体の組合せにより記憶装置12を構成してもよい。
【0018】
通信装置13は、通信網300を介して制御システム20と通信する。例えば、通信装置13は、制御システム20から送信された動画データMを受信する。再生装置14は、制御装置11による制御のもとで、映像と音とを含む動画を再生する。具体的には、再生装置14は、映像を表示する表示装置と、音を放射する放音装置とを具備する。
【0019】
制御装置11は、通信装置13が受信した動画データMが表す動画を再生装置14に再生させる。すなわち、音楽イベントの進行に並行して当該音楽イベントの動画が各端末装置10_nの再生装置14により再生される。以上の説明から理解される通り、相異なる端末装置10_nを利用する複数(N人)の利用者U_1~U_Nが、施設200の外側において音楽イベントの動画を視聴する。
【0020】
操作装置15は、利用者U_nからの指示を受付ける入力機器である。操作装置15は、例えば、利用者U_nが操作する複数の操作子、または、利用者U_nによる接触を検知するタッチパネルである。
【0021】
利用者U_nは、操作装置15を操作することで所望の文字列X_nを入力する。具体的には、利用者U_nは、再生装置14が再生する音楽イベントの動画を視聴しながら、任意の時点において文字列X_nを指示できる。文字列X_nは、例えば音楽イベントの実演者Pに対する歓声を表す1個以上の語句で構成される。例えば「オー」「ワー」等の感嘆詞または実演者Pの名前等の各種の文字列X_nが利用者U_nにより指示される。すなわち、文字列X_nは、例えば施設200内の聴衆が所在する通常の音楽イベントにおいて当該聴衆が実演者Pに対して発声する声援を表す文字列である。
【0022】
図3は、端末装置10_nの制御装置11が文字列X_nに関して実行する処理(以下「受付処理」という)Saの具体的な手順を例示するフローチャートである。動画データMが表す動画が再生される期間内に所定の周期で受付処理Saが反復される。
【0023】
受付処理Saが開始されると、制御装置11は、利用者U_nから文字列X_nを受付けたか否かを判定する(Sa1)。文字列X_nを受付けた場合(Sa1:YES)、制御装置11は、当該文字列X_nを含む再生要求R_nを通信装置13から制御システム20に送信する(Sa2)。再生要求R_nは、文字列X_nに対応する音声を施設200内に再生することを要求するデータである。他方、文字列X_nを受付けない場合(Sa1:NO)、再生要求R_nの送信(Sa2)は実行されない。以上の説明から理解される通り、N個の端末装置10_1~10_Nの各々から、利用者U_nによる指示に応じた再生要求R_nが並列または順次に制御システム20に送信される。
【0024】
なお、以下の説明においては、N人の利用者U_1~U_Nのうち任意の2人の利用者U_n1および利用者U_n2に便宜的に着目する場合がある(n1≠n2)。例えば、前述の受付処理Saにより、利用者U_n1が指示した文字列X_n1を含む再生要求R_n1が端末装置10_n1から送信され、利用者U_n2が指示した文字列X_n2を含む再生要求R_n2が端末装置10_n2から送信される。
【0025】
なお、端末装置10_n1は「第1端末装置」の一例であり、端末装置10_n2は「第2端末装置」の一例である。また、利用者U_n1は「第1利用者」の一例であり、利用者U_n2は「第2利用者」の一例である。再生要求R_n1は「第1再生要求」の一例であり、再生要求R_n2は「第2再生要求」の一例である。文字列X_n1は「第1文字列」の一例であり、文字列X_n2は「第2文字列」の一例である。
【0026】
図4は、制御システム20の構成を例示するブロック図である。制御システム20は、制御装置21と記憶装置22と通信装置23とを具備する。なお、制御システム20は、単体の装置として実現されるほか、相互に別体で構成された複数の装置の集合としても実現される。
【0027】
制御装置21は、制御システム20の各要素を制御する単数または複数のプロセッサで構成される。例えば、制御装置21は、CPU、SPU、DSP、FPGA、またはASIC等の1種類以上のプロセッサにより構成される。
【0028】
記憶装置22は、制御装置21が実行するプログラムと制御装置21が使用する各種のデータとを記憶する単数または複数のメモリである。記憶装置22は、例えば磁気記録媒体または半導体記録媒体等の公知の記録媒体により構成される。なお、複数種の記録媒体の組合せにより記憶装置22を構成してもよい。
【0029】
通信装置23は、通信網300を介してN個の端末装置10_1~10_Nの各々と通信する。例えば、通信装置23は、収録システム30が収録した動画を表す動画データMを各端末装置10_nに送信する。また、通信装置23は、N個の端末装置10_1~10_Nの各々から送信された再生要求R_nを受信する。なお、通信装置23が通信網300を介して収録システム30または再生システム40と通信してもよい。
【0030】
図5は、制御装置21(再生制御部20b)が実行する処理(以下「再生制御処理」という)Sbの具体的な手順を例示するフローチャートである。例えば所定の周期で再生制御処理Sbが反復される。
【0031】
再生制御処理Sbが開始されると、制御装置21は、各端末装置10_nから送信された再生要求R_nを通信装置23により受信する(Sb1)。すなわち、制御装置21は、N個の端末装置10_1~10_Nのうち1以上の端末装置10_nから再生要求R_nを受信する。例えば、制御装置21は、再生要求R_n1を端末装置10_n1から受信し、再生要求R_n2を端末装置10_n2から受信する。以上の通り、制御装置21は、複数の端末装置10_nの各々から再生要求R_nを受信する要素(受信部)として機能する。
【0032】
制御装置21は、再生要求R_nに応じた音響信号Y_nを、端末装置10_nから受信した再生要求R_n毎に生成する(Sb2)。例えば、再生要求R_n1に応じた音響信号Y_n1と再生要求R_n2に応じた音響信号Y_n2とが生成される。音響信号Y_nは、再生要求R_nに含まれる文字列X_nに対応する音声の波形を表す信号である。すなわち、仮想的な発話者が文字列X_nを読上げたときに発音される音声を表す音響信号Y_nが生成される。具体的には、音楽イベントの実演者Pに対する歓声を表す音響信号Y_nが生成される。音響信号Y_nの時間長は、文字列X_nを構成する文字数に応じた可変長である。例えば、文字列X_nの文字数が多いほど音響信号Y_nの時間長は長い。
【0033】
制御装置21は、音響信号Y_n毎に音高が相違するように各音響信号Y_nを生成する。例えば、音響信号Y_n1の音高と音響信号Y_n2の音高とは相違する。音響信号Y_n1は「第1音響信号」の一例であり、音響信号Y_n2は「第2音響信号」の一例である。
【0034】
第1実施形態の制御装置21は、文字列X_nを適用した音声合成処理により音響信号Y_nを生成する。例えば、制御装置21は、文字列X_n1を適用した音声合成処理により音響信号Y_n1を生成し、文字列X_n2を適用した音声合成処理により音響信号Y_n2を生成する。音響信号Y_nの生成には公知の音声合成技術が任意に採用される。例えば、複数の音声素片を接続する素片接続型の音声合成処理が音響信号Y_nの生成に利用される。また、例えば深層ニューラルネットワークまたはHMM(Hidden Markov Model)等の統計モデルを利用する統計モデル型の音声合成処理を、音響信号Y_nの生成に利用してもよい。音声合成処理に適用されるパラメータを調整することで、音響信号Y_n毎に音高を相違させることが可能である。以上の説明から理解される通り、制御装置21は、再生要求R_nに応じた音響信号Y_nを取得する要素(取得部)として機能する。
【0035】
制御装置21は、複数の音響信号Y_nを混合することで音響信号Zを生成する(Sb3)。時間軸上における各音響信号Y_nの位置は、再生要求R_nを受信した時点に応じて設定される。例えば、再生要求R_n2の受信前に再生要求R_n1が受信された場合、音響信号Y_n1の始点が音響信号Y_n2の始点前となるように、音響信号Y_n1と音響信号Y_n2とが混合される。以上の説明から理解される通り、制御装置21は、複数の音響信号Y_nを混合する要素(混合部)として機能する。
【0036】
なお、複数の音響信号Y_nを一斉に混合することも可能であるが、複数の音響信号Y_nを段階的に混合してもよい。例えば、制御装置21は、複数の音響信号Y_nを複数の集合に区分し、集合毎に2以上の音響信号Y_nを混合することで中間信号を生成する(第1段階)。そして、制御装置21は、相異なる集合に対応する複数の中間信号をさらに混合することで音響信号Zを生成する(第2段階)。また、各音響信号Y_nに残響効果等の各種の音響効果を付与したうえで複数の音響信号Y_nを混合してもよい。複数の音響信号Y_nを段階的に混合する構成では、段階毎に音響効果を付与する構成が想定される。
【0037】
制御装置21は、音響信号Zが表す音を再生システム40に再生させる(Sb4)。具体的には、制御装置21は、音響信号Zを再生システム40に供給することで、当該音響信号Zが表す音を再生させる。すなわち、制御装置21は、混合後の音響信号Zが表す音を再生システム40に再生させる要素(再生部)として機能する。
【0038】
以上の説明から理解される通り、複数の利用者U_nから指示された歓声の混合音が施設200内に再生される。第1実施形態においては、各音響信号Y_nが表す音響の音響特性が相違するから、複数の音響信号Y_nの間で音響特性が共通する構成と比較して、音楽イベントの実演者Pが利用者U_nの状況を把握し易いという利点がある。例えば、実演者Pは、利用者U_nの総数(規模)または反応を把握できる。
【0039】
第1実施形態においては、各利用者U_nが指示した文字列X_nに対応する音声を表す音響信号Y_nが、当該文字列X_nを適用した音声合成処理により生成される。したがって、各利用者U_nが指示した任意の文字列X_nに対応する多様な音響信号Y_nを生成できるという利点がある。
【0040】
B:第2実施形態
第2実施形態を説明する。なお、以下に例示する各態様において機能が第1実施形態と同様である要素については、第1実施形態の説明と同様の符号を流用して各々の詳細な説明を適宜に省略する。
【0041】
各端末装置10_nの記憶装置12は、利用者U_nの属性を表す属性情報を記憶する。利用者U_nの属性は、例えば利用者U_nの年齢または性別である。第2実施形態の再生要求R_nは、第1実施形態と同様の文字列X_nと、記憶装置12に記憶された属性情報とを含む。具体的には、制御装置21は、受付処理Saにおいて、利用者U_nから文字列X_nを受付けると(Sa1:YES)、当該文字列X_nと利用者U_nの属性情報とを含む再生要求R_nを通信装置13から制御システム20に送信する(Sa2)。
【0042】
制御システム20の制御装置21は、再生制御処理Sbの音声合成処理において、各再生要求R_n内の属性情報に応じた声質の音響信号Y_nを生成する(Sb2)。具体的には、制御装置21は、属性情報が表す年齢が低いほど明瞭度が高い音声(すなわち若年者の音声)の音響信号Y_nを生成する。明瞭度が高い音声とは、例えば調波成分が非調波成分(気息成分)と比較して顕著な音声である。また、制御装置21は、属性情報が表す性別に応じて男声または女声の何れかの音響信号Y_nを生成する。以上の説明から理解される通り、第2実施形態の制御装置21は、利用者U_n1の属性に応じた声質の音響信号Y_n1を生成し、利用者U_n2の属性に応じた声質の音響信号Y_n2を生成する。複数の音響信号Y_nの混合と音響信号Zの再生とは第1実施形態と同様である。
【0043】
第2実施形態においても第1実施形態と同様の効果が実現される。また、第2実施形態においては、各利用者U_nの属性に応じた多様な声質の音響信号Y_nを生成できる。また、音楽イベントを聴取する複数の利用者U_nの概略的な属性を、再生システム40による再生音を受聴する実演者Pが把握できるという利点もある。なお、音響信号Y_nが表す音の声質は、利用者U_nの属性に整合した声質である必要はない。例えば、利用者U_nの属性情報が表す性別が男声である場合に、女声を表す音響信号Y_nを生成してもよい。すなわち、利用者U_nの属性に応じて音響信号Y_nの声質(音響特性の一例)が変化する構成であればよい。
【0044】
C:第3実施形態
第3実施形態における制御システム20の制御装置21は、再生制御処理Sbの音声合成処理において、文字列X_nに応じた音量の音響信号Y_nを生成する(Sb2)。具体的には、制御装置21は、文字列X_nの文字数が多いほど音量が大きい音響信号Y_nを生成する。以上の説明から理解される通り、第3実施形態の制御装置21は、文字列X_n1に応じた音量の音響信号Y_n1を生成し、文字列X_n2に応じた音量の音響信号Y_n2を生成する。
【0045】
第3実施形態においても第1実施形態と同様の効果が実現される。また、第3実施形態においては、各利用者U_nが指示した文字列X_nに応じた多様な音量の音響信号Y_nを生成できる。なお、利用者U_nの属性に応じて音響信号Y_nの声質を制御する第2実施形態の構成と、文字列X_nに応じて音響信号Y_nの音量を制御する第3実施形態の構成とを併合してもよい。
【0046】
また、以上の説明において文字列X_nの文字数に応じた音量の音響信号Y_nを生成したが、音響信号Y_nの音量に反映される文字列X_nの条件は文字数に限定されない。例えば、文字列X_nが特定の語句である場合に音響信号Y_nの音量を大きい数値に設定する構成も想定される。すなわち、文字列X_nに応じて音響信号Y_nの音量(音響特性の一例)が変化する構成であればよい。
【0047】
D:第4実施形態
例えば音楽イベントの終盤では、例えば「アンコール」等の歓声が所定の周期で反復的に発音される。以上の事情を考慮すると、各端末装置10_nの利用者U_nは、「アンコール」のような文字列X_nを所定の周期で反復的に指示することが想定される。第4実施形態は、以上のように反復的に指示される文字列X_nに対応する音を施設200内に再生する場合に利用される形態である。
【0048】
図6は、第4実施形態における再生制御処理Sbの具体的な手順を例示するフローチャートである。再生制御処理Sbにおいて各再生要求R_nに対応する音響信号Y_nを生成すると(Sb2)、制御システム20の制御装置21は、設定処理Sc1と調整処理Sc2とを実行する。
【0049】
図7は、設定処理Sc1および調整処理Sc2の説明図である。設定処理Sc1は、時間軸上に基準時点Qを設定する処理である。制御装置21は、時間軸上に例えば所定の間隔で複数の基準時点Qを設定する。なお、実演者Pが実演する楽曲の拍点を基準時点Qとしてもよい。
【0050】
また、設定処理Sc1において、制御装置21は、基準時点Q毎に特定期間Dを設定する。各基準時点Qに対応する特定期間Dは、当該基準時点Qを含む所定長の期間である。具体的には、基準時点Qを始点とする期間が特定期間Dとして例示される。ただし、基準時点Qを中点または終点とする期間を特定期間Dとしてもよい。
【0051】
調整処理Sc2は、複数の音響信号Y_nの時間軸上の位置を調整する処理である。調整処理Sc2において、制御装置21は、複数の音響信号Y_nの始点を特定期間D内に調整する。具体的には、制御装置21は、時間軸上の所定の期間(以下「単位期間」という)C内に受信した複数の再生要求R_nにそれぞれ対応する複数の音響信号Y_nの各々の始点を、当該単位期間Cの直後の特定期間D内に調整する。単位期間Cは、相前後する2個の特定期間Dの始点間の期間である。例えば、図7の例示の通り、1個の単位期間C内に再生要求R_n1と再生要求R_n2とが受信された場合、制御装置21は、再生要求R_n1に対応する音響信号Y_n1の始点と再生要求R_n2に対応する音響信号Y_n2の始点とを、当該単位期間Cの直後の特定期間D内に調整する。
【0052】
また、調整処理Sc2において、制御装置21は、複数の音響信号Y_nの始点を特定期間D内に分散させる。すなわち、制御装置21は、複数の音響信号Y_nの始点が特定期間D内の1個の時点に一致しないように各音響信号Y_nの始点を分散させる。例えば、図7の例示の通り、音響信号Y_n1の始点と音響信号Y_n2の始点とが特定期間D内に分散される。
【0053】
具体的には、特定期間D内の基準時点Qを最大度数として特定期間Dの終点にかけて度数が減少する度数分布に音響信号Y_nの始点の個数が従うように、複数の音響信号Y_nの各々の始点が特定期間D内において分散される。すなわち、複数の音響信号Y_nの始点は、基準時点Qに集中しつつ特定期間D内に適度に分散される。
【0054】
制御装置21は、以上に例示した調整処理Sc2による調整後の複数の音響信号Y_nを混合することで音響信号Zを生成する。制御装置21は、第1実施形態と同様に、音響信号Zが表す音を再生システム40に再生させる(Sb4)。以上の説明から理解される通り、相異なる利用者U_nが指示した文字列X_nに対応する音声の再生が、特定期間D内に集中して開始される。複数の特定期間Dの各々について以上の処理が順次に実行されるから、複数の文字列X_nに対応する音が特定の周期で発音される状況が施設200内に再現される。
【0055】
第4実施形態においても第1実施形態と同様の効果が実現される。また、第4実施形態においては、複数の音響信号Y_nの各々の始点が時間軸上の特定期間D内に集約されるから、相異なる利用者U_nからの指示に応じた複数の音が一斉に発音される状況を再生システム40により再現できる。
【0056】
なお、複数の音響信号Y_nの始点が特定期間D内において一致した場合、利用者U_nの総数を実演者Pが把握し難い可能性がある。第4実施形態においては、複数の音響信号Y_nの始点が特定期間D内において分散されるから、複数の音響信号Y_nの始点が一致する場合と比較して、利用者U_nの総数を実演者Pが把握し易いという利点もある。
【0057】
E:第5実施形態
第1実施形態から第4実施形態においては、施設200内に聴衆が存在しない場合を想定した。第5実施形態においては、施設200内に聴衆が存在する場合を想定する。収録システム30の収音装置は、実演者Pによる実演で発音される音(例えば歌唱音または楽器音等)と、施設200内の観衆により発音される音(例えば歓声または拍手音等)とを含む音を収音する。
【0058】
図8は、第5実施形態における設定処理Sc1の説明図である。設定処理Sc1において、制御システム20の制御装置21は、施設200内に存在する音の音量Vを特定する。具体的には、制御装置21は、収録システム30の収音装置が収音する音を解析することで音量Vを算定する。
【0059】
設定処理Sc1において、制御装置21は、音量Vに応じて特定期間Dを設定する。具体的には、制御装置21は、音量Vが所定の閾値Vthを超過する時点を基準時点Qとして設定し、当該基準時点Qを含む特定期間Dを設定する。例えば、施設200内の聴衆が実演者Pによる実演に並行して手拍子する場面を想定すると、手拍子の拍点が基準時点Qとして設定される。聴衆が周期的に手拍子する状況では、時間軸上に複数の基準時点Qが周期的に設定される。設定処理Sc1により設定された基準時点Qおよび特定期間Dを利用した調整処理Sc2の内容は第4実施形態と同様である。
【0060】
第5実施形態においても第1実施形態および第4実施形態と同様の効果が実現される。また、第5実施形態においては、施設200内の音量Vに応じて特定期間Dが設定されるから、再生システム40による音の再生を、施設200内の音量Vの変化(例えば施設200内の聴衆の盛上がり)に連動させることが可能である。すなわち、施設200内の観衆による歓声と、施設200外の各利用者U_nによる指示に応じた音とを、施設200内に一体的に発音することが可能である。
【0061】
F:変形例
以上に例示した各態様に付加される具体的な変形の態様を以下に例示する。以下の例示から任意に選択された複数の態様を、相互に矛盾しない範囲で適宜に併合してもよい。
【0062】
(1)前述の各形態においては、各音響信号Y_nの音高、音量および声質を相違させたが、音響信号Y_n毎に相違させる音響特性は以上の例示に限定されない。例えば、周波数特性、残響特性(例えば残響時間)、音高の時間変化(ピッチベンド)、音像の定位位置、発音の継続長等、任意の音響特性が音響信号Y_n毎に設定される。2種類以上の音響特性を音響信号Y_n毎に相違させてもよい。
【0063】
なお、第2実施形態においては利用者U_nの属性に応じて音響信号Y_nの声質を制御したが、音響信号Y_nに関する声質以外の音響特性を利用者U_nの属性に応じて制御してもよい。また、第3実施形態においては文字列X_nに応じて音響信号Y_nの音量を制御したが、音響信号Y_nに関する音量以外の音響特性を文字列X_nに応じて制御してもよい。
【0064】
(2)前述の各形態においては、文字列X_nに応じた音響信号Y_nを音声合成処理により生成したが、音響信号Y_nを取得する方法は以上の例示に限定されない。例えば、事前に収録または合成された音響信号Y_nを記憶装置22から読出してもよい。例えば、利用者U_nから指示されることが想定される複数の文字列の各々について、当該文字列に対応する音声を表す音響信号が記憶装置22に記憶される。制御装置21は、記憶装置22に記憶された複数の音響信号のうち、利用者U_nによる指示に応じた文字列X_nに対応する音響信号を音響信号Y_nとして記憶装置22から読出す。以上の説明から理解される通り、音響信号Y_nの取得には、音声合成処理により音響信号Y_nを生成する処理のほか、事前に収録または合成された音響信号Y_nを記憶装置22から読出す処理も包含される。
【0065】
なお、音声合成処理により音響信号Y_nを生成する処理と、事前に用意された音響信号Y_nを読出す処理とを併用してもよい。例えば、文字列X_nに対応する音響信号Y_nが記憶装置22に記憶されている場合、制御装置21は、当該音響信号Y_nを記憶装置22から読出す。他方、文字列X_nに対応する音響信号Y_nが記憶装置22に記憶されていない場合、制御装置21は、当該文字列X_nを適用した音声合成処理により音響信号Y_nを生成する。
【0066】
(3)前述の各形態においては、動画データMが表す動画の再生と利用者U_nからの指示の受付とを端末装置10_nが実行したが、利用者U_nからの指示を受付ける端末装置10_nとは別個の再生装置に動画データMの動画を再生させてもよい。動画を再生する再生装置は、例えばスマートフォンまたはタブレット端末等の情報端末のほか、テレビジョン受像機等の映像機器でもよい。
【0067】
(4)前述の各形態においては、利用者U_nが文字列X_nを指示したが、利用者U_nによる文字列X_nの入力は必須ではない。例えば、相異なる文字列に対応する複数の選択肢の何れかを、利用者U_nが操作装置15により選択する。端末装置10_nは、利用者U_nが選択した選択肢の識別情報を含む再生要求R_nを制御システム20に送信する。制御システム20の制御装置21は、相異なる識別情報について記憶装置22に記憶された複数の音響信号のうち、再生要求R_n内の識別情報に対応する音響信号を音響信号Y_nとして記憶装置22から読出す。以上の構成においても、各音響信号Y_nの音響特性を相違させることで、第1実施形態と同様の効果が実現される。
【0068】
(5)前述の各形態においては、音響信号Y_nが音声(発話音)を表す構成を例示したが、音響信号Y_nが表す音は音声に限定されない。例えば、種々の効果音を表す音響信号Y_nを制御装置21が取得してもよい。音響信号Y_nが表す効果音としては、例えば、拍手または指笛により発音される音、または、太鼓等の楽器の演奏により発音される楽音が例示される。
【0069】
(6)再生要求R_nの通信における通信遅延が大きいほど、利用者U_nが遠隔に位置するという傾向がある。以上の傾向を考慮すると、特定期間D内における各音響信号Y_nの始点の位置を通信遅延に応じて分散させてもよい。例えば、通信遅延が大きいほど基準時点Qに対する時間差が大きくなるように、各音響信号Y_nの始点が特定期間D内において調整される。以上の構成によれば、制御システム200からの距離が同等である利用者U_nについて音響信号Y_nの始点が近接する。
【0070】
(7)各利用者U_nは、基本的には、相前後する楽曲演奏の間隔内において文字列X_nを入力することが想定される。しかし、例えば通信遅延等の事情により、楽曲演奏の間隔内に利用者U_nが指示した文字列X_nを含む再生要求R_nが、直後の楽曲の開始後に制御システム20に到達する場合がある。以上の事情を想定すると、例えば音楽イベントにおける楽曲の演奏中には、再生システム40による音の再生を停止する構成も想定される。
【0071】
例えば、制御システム20の制御装置21は、施設200内で楽曲が演奏されているか否かを、収録システム30の収音装置が収音する音を解析することで判定する。なお、音楽イベントの運営者が楽曲の演奏の有無を制御システム20に指示してもよい。楽曲が演奏されていないと判定した場合、制御装置21は、前述の各形態と同様に、音響信号Zを再生システム40に供給することで施設200内に音を再生させる。他方、楽曲が演奏されていると判定した場合、制御装置21は、再生システム40に対する音響信号Zの供給を停止する。楽曲の演奏中に、音響信号Y_nの生成(Sb2)および混合(Sb3)を停止してもよい。楽曲が演奏されている場合に、演奏されていない場合と比較して音響信号Zの音量を低下させてから、当該音響信号Zを再生システム40に供給してもよい。
【0072】
(8)前述の各形態においては音楽イベントを例示したが、前述の各形態が適用される場面は音楽イベントに限定されない。例えば、複数の競技者(チーム)がスポーツで競技する競技イベント、俳優が出演する演劇イベント、ダンサーが実演するダンスイベント、講演者が講演する講演イベント、学校や学習塾等の各種の教育機関が生徒に授業を提供する教育イベント等、特定の目的で実施される各種のイベントに、前述の各形態は適用される。
【0073】
(9)以上に例示した制御システム20の機能は、前述の通り、制御装置21を構成する単数または複数のプロセッサと、記憶装置22に記憶されたプログラムとの協働により実現される。プログラムは、コンピュータが読取可能な記録媒体に格納された形態で提供されてコンピュータにインストールされ得る。記録媒体は、例えば非一過性(non-transitory)の記録媒体であり、CD-ROM等の光学式記録媒体(光ディスク)が好例であるが、半導体記録媒体または磁気記録媒体等の公知の任意の形式の記録媒体も包含される。なお、非一過性の記録媒体とは、一過性の伝搬信号(transitory, propagating signal)を除く任意の記録媒体を含み、揮発性の記録媒体も除外されない。また、配信装置が通信網を介してプログラムを配信する構成では、当該配信装置においてプログラムを記憶する記録媒体が、前述の非一過性の記録媒体に相当する。
【0074】
G:付記
以上に例示した形態から、例えば以下の構成が把握される。
【0075】
本開示のひとつの態様(態様1)に係る再生制御方法は、第1利用者による指示に応じた第1再生要求を第1端末装置から受信し、第2利用者による指示に応じた第2再生要求を第2端末装置から受信し、前記第1再生要求に応じた音を表す第1音響信号と、前記第1音響信号が表す音とは音響特性が異なる音であって前記第2再生要求に応じた音を表す第2音響信号とを取得し、前記第1音響信号と前記第2音響信号とを混合し、前記混合後の音響信号が表す音を再生システムに再生させる。以上の構成においては、第1利用者からの指示に応じた音と第2利用者からの指示に応じた音との混合音が再生システムから再生される。第1音響信号が表す音と第2音響信号が表す音とは音響特性が相違するから、再生システムによる再生音の受聴者(例えば各種のイベントの実演者)が、利用者の状況(例えば総数または反応)を把握し易いという利点がある。
【0076】
態様1の具体例(態様2)において、前記音響特性は、音高、音量、音質、周波数特性、残響特性、音高の時間変化、音像の定位位置、および継続長のうちの1以上を含む。
【0077】
態様1または態様2の具体例(態様3)において、前記第1再生要求は、前記第1利用者が指示した第1文字列を含み、前記第2再生要求は、前記第2利用者が指示した第2文字列を含み、前記取得においては、前記第1文字列に対応する音声を表す前記第1音響信号を、当該第1文字列を適用した音声合成処理により生成し、前記第2文字列に対応する音声を表す前記第2音響信号を、当該第2文字列を適用した音声合成処理により生成する。以上の態様によれば、利用者が指示した任意の文字列に対応する多様な音響信号を生成できる。
【0078】
態様3の具体例(態様4)において、前記音声合成処理においては、前記第1利用者の属性に応じた音響特性の前記第1音響信号を生成し、前記第2利用者の属性に応じた音響特性の前記第2音響信号を生成する。以上の態様によれば、利用者の属性に応じた多様な音響特性の音響信号を生成できる。
【0079】
態様3または態様4の具体例(態様5)において、前記音声合成処理においては、前記第1文字列に応じた音響特性の前記第1音響信号を生成し、前記第2文字列に応じた音響特性の前記第2音響信号を生成する。以上の態様によれば、利用者が指示した文字列に応じた多様な音響特性の音響信号を生成できる。
【0080】
態様1から態様5の何れかの具体例(態様6)において、前記混合においては、前記第1音響信号の始点と前記第2音響信号の始点とを時間軸上の特定期間内に調整し、前記調整後の前記第1音響信号と前記第2音響信号とを混合する。以上の態様によれば、第1音響信号および第2音響信号の各々の始点が時間軸上の特定期間内に集約される。したがって、複数の音が一斉に発音される状況を再生システムにより再現できる。
【0081】
態様6の具体例(態様7)において、前記調整においては、前記第1音響信号の始点と前記第2音響信号の始点とを前記特定期間内に分散させる。以上の態様によれば、第1音響信号の始点と第2音響信号の始点とが特定期間内に分散されるから、第1音響信号の始点と第2音響信号の始点とが時間軸上で一致する場合と比較して、利用者の総数(規模)を受聴者が把握し易い音を再生できる。
【0082】
態様6または態様7の具体例(態様8)において、前記特定期間は、前記再生システムが設置される音響空間内において収音される音の音量に応じて設定される。以上の態様によれば、音響空間内の音量に応じて特定期間が設定されるから、再生システムによる混合音の再生を、音響空間内の音量の変化(例えば音響空間内の聴衆の盛上がり)に連動せることが可能である。
【0083】
なお、本開示は、前述の各態様(態様1から態様8)に係る再生制御方法を実現する制御システム、または、当該再生制御方法をコンピュータシステムに実行させるプログラム、としても実現される。
【符号の説明】
【0084】
100…通信システム、200…施設、300…通信網、10_n(10_1~10_N)…端末装置、11…制御装置、12…記憶装置、13…通信装置、14…再生装置、15…操作装置、20…制御システム、20a…配信制御部、20b…再生制御部、21…制御装置、22…記憶装置、23…通信装置、30…収録システム、40…再生システム、U_n(U_1~U_N)…利用者、P…実演者、R_n(R_1~R_N)…再生要求、Q…基準時点、D…特定期間。
図1
図2
図3
図4
図5
図6
図7
図8