(19)【発行国】日本国特許庁(JP)
(12)【公報種別】特許公報(B2)
(11)【特許番号】
(24)【登録日】2024-11-25
(45)【発行日】2024-12-03
(54)【発明の名称】再生制御方法、制御システムおよびプログラム
(51)【国際特許分類】
G10L 19/00 20130101AFI20241126BHJP
H04N 21/233 20110101ALI20241126BHJP
H04N 21/239 20110101ALI20241126BHJP
【FI】
G10L19/00 312E
G10L19/00 312F
H04N21/233
H04N21/239
(21)【出願番号】P 2020155484
(22)【出願日】2020-09-16
【審査請求日】2023-07-21
(73)【特許権者】
【識別番号】000004075
【氏名又は名称】ヤマハ株式会社
(74)【代理人】
【識別番号】110003177
【氏名又は名称】弁理士法人旺知国際特許事務所
(72)【発明者】
【氏名】瀬戸 優樹
【審査官】土井 悠生
(56)【参考文献】
【文献】特開2021-170707(JP,A)
【文献】国際公開第2017/002642(WO,A1)
【文献】特開2012-129800(JP,A)
【文献】特開2011-199550(JP,A)
【文献】特開2010-103751(JP,A)
【文献】特開2003-116119(JP,A)
【文献】特表2015-507855(JP,A)
(58)【調査した分野】(Int.Cl.,DB名)
G10L 13/00-99/00
H04N 21/233
H04N 21/239
(57)【特許請求の範囲】
【請求項1】
相異なる端末装置の利用者による入力に応じた複数の入力データをイベントの進行に並行して受信し、
前記複数の入力データの一部である1以上の第1入力データを選択し、
前記複数の入力データのうち前記1以上の第1入力データ以外の1以上の第2入力データについて、明瞭度を低下させる第2音響処理を実行し、
前記1以上の第1入力データに応じた第1音と、前記第2音響処理後の第2音とを、前記イベントの進行に並行して再生させる
コンピュータにより実現される再生制御方法。
【請求項2】
前記第1音と前記第2音との再生においては、前記イベントの動画の視聴者が使用する装置に前記第1音と前記第2音とを再生させる
請求項1の再生制御方法。
【請求項3】
前記第1音と前記第2音との再生においては、前記イベントが実施される場所に設置された再生システムに前記第1音と前記第2音とを再生させる
請求項1の再生制御方法。
【請求項4】
前記1以上の第1入力データは、2以上の第1入力データであり、
前記再生システムは、第1再生部と第2再生部とを含み、
前記第1音と前記第2音との再生においては、
前記2以上の第1入力データのうち一部の第1入力データに応じた前記第1音と前記第2音とを前記第1再生部に再生させ、
前記2以上の第1入力データのうち他の一部の第1入力データに応じた前記第1音と前記第2音とを前記第2再生部に再生させる
請求項3の再生制御方法。
【請求項5】
前記1以上の第1入力データは、2以上の第1入力データであり、
前記2以上の第1入力データについて、加工処理および混合処理を含む第1音響処理を実行し、
前記第1音と前記第2音との再生においては、前記第1音響処理後の前記第1音と前記第2音とを再生させる
請求項1から請求項3の何れかの再生制御方法。
【請求項6】
前記1以上の第1入力データの選択においては、前記複数の入力データから前記1以上の第1入力データをランダムに選択する
請求項1から請求項
5の何れかの再生制御方法。
【請求項7】
前記1以上の第1入力データの選択においては、前記複数の入力データのうち、登録文字列に相関または相違する発話内容の音を表す前記1以上の第1入力データを選択する
請求項1から請求項
5の何れかの再生制御方法。
【請求項8】
相異なる端末装置の利用者による入力に応じた複数の入力データをイベントの進行に並行して受信する受信処理部と、
前記複数の入力データの一部である1以上の第1入力データを選択する選択処理部と、
前記複数の入力データのうち前記1以上の第1入力データ以外の1以上の第2入力データについて、明瞭度を低下させる第2音響処理を実行し、前記1以上の第1入力データに応じた第1音と、前記第2音響処理後の第2音とを、前記イベントの進行に並行して再生させる再生制御部と
を具備する制御システム。
【請求項9】
相異なる端末装置の利用者による入力に応じた複数の入力データをイベントの進行に並行して受信する受信処理部、
前記複数の入力データの一部である1以上の第1入力データを選択する選択処理部、および、
前記複数の入力データのうち前記1以上の第1入力データ以外の1以上の第2入力データについて、明瞭度を低下させる第2音響処理を実行し、前記1以上の第1入力データに応じた第1音と、前記第2音響処理後の第2音とを、前記イベントの進行に並行して再生させる再生制御部
としてコンピュータを機能させるプログラム。
【発明の詳細な説明】
【技術分野】
【0001】
本開示は、音の再生を制御する技術に関する。
【背景技術】
【0002】
例えばスポーツイベントまたは音楽イベント等の各種のイベントに、遠隔地の多数の利用者が関与するためのシステムが、従来から提案されている。例えば特許文献1には、遠隔地の利用者が端末装置に入力した音声を、イベントが実施される場所(以下「実施場所」という)に設置された出力装置に再生させる技術が開示されている。
【先行技術文献】
【特許文献】
【0003】
【発明の概要】
【発明が解決しようとする課題】
【0004】
しかし、特許文献1の技術においては、遠隔地にいる多数の利用者の音声が混合された状態で実施場所の出力装置により再生される。したがって、各利用者の音声をイベントの観覧者が明瞭に聴取できないという課題がある。以上の事情を考慮して、本開示のひとつの態様は、複数の端末装置から受信したデータに応じた音をイベントにおいて聴取し易くすることを目的とする。
【課題を解決するための手段】
【0005】
以上の課題を解決するために、本開示のひとつの態様に係る再生制御方法は、相異なる端末装置の利用者による入力に応じた複数の入力データをイベントの進行に並行して受信し、前記複数の入力データの一部である1以上の第1入力データを選択し、前記1以上の第1入力データに応じた第1音を前記イベントの進行に並行して再生させる。
【0006】
本開示のひとつの態様に係る制御システムは、相異なる端末装置の利用者による入力に応じた複数の入力データをイベントの進行に並行して受信する受信処理部と、前記複数の入力データの一部である1以上の第1入力データを選択する選択処理部と、前記1以上の第1入力データに応じた第1音を前記イベントの進行に並行して再生させる再生制御部とを具備する。
【0007】
本開示のひとつの態様に係るプログラムは、相異なる端末装置の利用者による入力に応じた複数の入力データをイベントの進行に並行して受信する受信処理部、前記複数の入力データの一部である1以上の第1入力データを選択する選択処理部、および、前記1以上の第1入力データに応じた第1音を前記イベントの進行に並行して再生させる再生制御部、としてコンピュータを機能させる。
【図面の簡単な説明】
【0008】
【
図1】第1実施形態における情報システムの構成を例示するブロック図である。
【
図2】再生装置の構成を例示するブロック図である。
【
図3】端末装置の構成を例示するブロック図である。
【
図4】制御システムの構成を例示するブロック図である。
【
図5】制御システムの機能的な構成を例示するブロック図である。
【
図6】再生制御処理の具体的な手順を例示するフローチャートである。
【
図7】第2実施形態における制御システムの機能的な構成を例示するブロック図である。
【
図8】第2実施形態における再生制御処理の具体的な手順を例示するフローチャートである。
【
図9】第3実施形態における再生制御部の動作に関する説明図である。
【
図10】第4実施形態における再生制御部の構成を例示するブロック図である。
【
図11】第5実施形態における情報システムの部分的な構成を例示するブロック図である。
【
図12】第5実施形態における再生制御処理の具体的な手順を例示するフローチャートである。
【
図13】第6実施形態における制御システムの機能的な構成を例示するブロック図である。
【
図14】第6実施形態における再生制御処理の具体的な手順を例示するフローチャートである。
【発明を実施するための形態】
【0009】
A:第1実施形態
図1は、第1実施形態に係る情報システム100の構成を例示するブロック図である。情報システム100は、施設200内で実施されるイベントに関するサービスを複数の利用者Uaに提供するコンピュータシステムである。
【0010】
例えば、1以上の出場者が出場するスポーツイベント、または1以上の出演者が音楽を演奏または歌唱する音楽イベント、等の各種のイベントが施設200内で実施される。スポーツイベントが実施される施設200は、例えば競技場または体育館である。音楽イベントが実施される施設200は、例えば音響ホール、ライブハウスまたは野外ステージである。
【0011】
施設200を利用する複数の利用者Ubが施設200内に所在する。複数の利用者Ubは、例えば、スポーツイベントに出場する出場者、音楽イベントに出演する出演者、イベントを管理および運営する運営者、またはイベントを観覧する観覧者を含む。なお、感染症の蔓延の防止等の種々の事情により、施設200内に観覧者が存在しない状況でイベントが実施される場合もある。
【0012】
複数の利用者Uaの各々は、施設200の外側に所在する。具体的には、利用者Uaは、施設200から遠隔の地点(例えば自宅)に位置する。ただし、利用者Uaが施設200内に所在してもよい。各利用者Uaは、再生装置21および端末装置22を利用可能である。端末装置22は、例えばスマートフォンまたはタブレット端末等の可搬型の情報端末である。なお、据置型のパーソナルコンピュータを端末装置22として利用してもよい。
【0013】
再生装置21は、施設200内で実施されるイベントの状況を表すコンテンツCを再生する。
図2は、再生装置21の構成を例示するブロック図である。コンテンツCは、映像を表す映像データC1と、音を表す音響データC2とで構成される。再生装置21は、映像データC1が表す映像を表示する表示装置31と、音響データC2が表す音を再生する放音装置32とを具備する。例えば、放送電波により伝送されるテレビ番組をコンテンツCとして再生するテレビジョン受像機が、再生装置21として利用される。また、例えばスマートフォンまたはタブレット端末等の情報端末も再生装置21として利用される。多数の利用者Uaが視聴可能な大型の映像機器(パブリックビューイング)を再生装置21として利用してもよい。なお、コンテンツCは、音のみで構成されるラジオ番組でもよい。
【0014】
図1に例示される通り、情報システム100は、収録システム11と配信システム12と再生システム13と制御システム14とを具備する。収録システム11および再生システム13は、施設200内に設置される。収録システム11は、配信システム12と通信する。再生システム13は、制御システム14と通信する。なお、配信システム12と制御システム14とを単体の装置として構成してもよい。
【0015】
収録システム11は、施設200内で実施されるイベントの動画を収録する。具体的には、収録システム11は、イベントの映像を撮像する撮像装置と、当該イベントの音を収音する収音装置とを具備する(図示略)。撮像装置が撮像する映像と収音装置が収音する音とで構成される動画が収録システム11により生成される。
【0016】
配信システム12は、収録システム11が収録した動画を含むコンテンツCを複数の再生装置21の各々に配信する。配信システム12は、各端末装置22にもコンテンツCを配信可能である。具体的には、配信システム12は、施設200内のイベントの進行に並行して実時間的にコンテンツCを配信(すなわちライブ配信)する。各再生装置21は、配信システム12から通信網300を介してコンテンツCを受信し、当該コンテンツCをイベントの進行に並行して再生する。利用者Uaは、再生装置21が再生するコンテンツCを視聴することで、イベントの状況を実時間的に把握できる。以上の説明から理解される通り、利用者Uaは、施設200内で実施されるイベントの観覧者(具体的にはコンテンツCの視聴者)である。
【0017】
再生システム13は、施設200内に音を再生する。再生システム13は、例えば施設200内の相異なる場所に設置された複数の放音装置(例えばスピーカ装置)を具備する。施設200内の利用者Ubは、再生システム13が再生する音を施設200内において聴取可能である。制御システム14は、再生システム13による音の再生を制御するコンピュータシステムである。制御システム14は、通信網300を介して複数の端末装置22の各々と通信可能である。
【0018】
図3は、各端末装置22の構成を例示するブロック図である。端末装置22は、制御装置41と記憶装置42と通信装置43と操作装置44と再生装置45と収音装置46とを具備する。なお、端末装置22は、単体の装置として実現されるほか、相互に別体で構成された複数の装置でも実現される。
【0019】
制御装置41は、端末装置22の各要素を制御する単数または複数のプロセッサで構成される。例えば、制御装置41は、CPU(Central Processing Unit)、SPU(Sound Processing Unit)、DSP(Digital Signal Processor)、FPGA(Field Programmable Gate Array)、またはASIC(Application Specific Integrated Circuit)等の1種類以上のプロセッサにより構成される。
【0020】
記憶装置42は、制御装置41が実行するプログラムと制御装置41が使用する各種のデータとを記憶する単数または複数のメモリである。記憶装置42は、例えば磁気記録媒体または半導体記録媒体等の公知の記録媒体により構成される。なお、複数種の記録媒体の組合せにより記憶装置42を構成してもよい。通信装置43は、通信網300を介して制御システム14と通信する。
【0021】
操作装置44は、利用者Uaからの指示を受付ける入力機器である。操作装置44は、例えば、利用者Uaが操作する複数の操作子、または、利用者Uaによる接触を検知するタッチパネルである。
【0022】
再生装置45は、動画を再生する。例えば、再生装置45は、再生装置21と同様にコンテンツCを再生可能である。例えば、再生装置45は、
図2に例示した再生装置21と同様に、映像データC1が表す映像を表示する表示装置31と、音響データC2が表す音を再生する放音装置32とを具備する。なお、通信装置43が配信システム12から受信するコンテンツCを再生装置45が再生してもよい。すなわち、再生装置21は省略されてもよい。
【0023】
収音装置46は、利用者Uaが発音した音声(以下「入力音声」という)を収音するマイクロホンである。具体的には、収音装置46は、入力音声の波形を表す音響信号Vを生成する。利用者Uaは、再生装置21または再生装置45を利用してコンテンツCを視聴しながら、所望の時点で収音装置46に対して入力音声を発音する。入力音声は、例えば、イベントの出場者または出演者を応援する音声、イベントの進行に対する歓声、またはイベントに対する不満を表す罵声等である。なお、音響信号Vをアナログからデジタルに変換するA/D変換器の図示は便宜的に省略されている。なお、第1実施形態においては収音装置46が端末装置22に搭載された構成を例示するが、端末装置22とは別体の収音装置46を有線または無線により端末装置22に接続してもよい。
【0024】
制御装置41は、収音装置46が生成する音響信号Vから入力データDを生成する。第1実施形態の入力データDは、入力音声の波形を表すサンプル列で構成される音響データである。すなわち、入力データDは、利用者Uaによる入力(すなわち音声入力)に応じたデータである。制御装置41は、操作装置44に対する利用者Uaからの操作を契機として入力データDを生成する。例えば、操作装置44の操作が継続されている期間、または、操作装置44に対する操作で指示された2個の時点間の期間において、音響信号Vから入力データDが生成される。なお、端末装置22を利用者Uaが振動させる動作等を契機として、当該端末装置22が入力データDを送信してもよい。
【0025】
通信装置43は、制御装置41が生成した入力データDを制御システム14に送信する。以上の説明から理解される通り、イベントの進行に並行して、複数の端末装置22の各々から制御システム14に対して入力データDが並列または順次に送信される
【0026】
図4は、制御システム14の構成を例示するブロック図である。制御システム14は、制御装置51と記憶装置52と通信装置53とを具備する。なお、制御システム14は、単体の装置として実現されるほか、相互に別体で構成された複数の装置の集合としても実現される。
【0027】
制御装置51は、制御システム14の各要素を制御する単数または複数のプロセッサで構成される。例えば、制御装置51は、CPU、SPU、DSP、FPGA、またはASIC等の1種類以上のプロセッサにより構成される。
【0028】
記憶装置52は、制御装置51が実行するプログラムと制御装置51が使用する各種のデータとを記憶する単数または複数のメモリである。記憶装置52は、例えば磁気記録媒体または半導体記録媒体等の公知の記録媒体により構成される。なお、複数種の記録媒体の組合せにより記憶装置52を構成してもよい。
【0029】
通信装置53は、通信網300を介して複数の端末装置22の各々と通信する。通信装置53は、複数の端末装置22の各々から送信された入力データDを受信する。
【0030】
図5は、制御システム14の機能的な構成を例示するブロック図である。制御装置51は、記憶装置52に記憶されたプログラムを実行することで複数の機能(受信処理部61、選択処理部62および再生制御部63)として機能する。
【0031】
受信処理部61は、各端末装置22から送信された入力データDを通信装置53により受信する。すなわち、受信処理部61は、相異なる端末装置22の利用者Uaによる入力音声を表す複数の入力データDを受信する。受信処理部61による複数の入力データDの受信は、イベントの進行に並行して所定の周期で反復される。
【0032】
選択処理部62は、受信処理部61が受信した複数の入力データDのうちN個の入力データD(以下「選択データD1」という)を選択する。第1実施形態における選択データD1の個数Nは、2以上の自然数である。個数Nは、例えば、事前に指定された固定値に設定される。N個の選択データD1は、複数の入力データDのうちの一部である。すなわち、選択処理部62は、複数の入力データDの一部を選択データD1として選択する。第1実施形態の選択処理部62は、複数の入力データDからランダムにN個の選択データD1を選択する。以上の構成によれば、選択処理部62がN個の選択データD1を選択する処理の負荷が軽減される。選択処理部62によるN個の選択データD1の選択は、受信処理部61による入力データDの受信毎に反復される。なお、選択データD1は「第1入力データ」の一例である。
【0033】
なお、入力データDをランダムに選択する処理は、複数の入力データDからN個の選択データD1を直接的に選択する処理のほか、利用者Uaを選択する第1処理、または、端末装置22を選択する第2処理としても実現される。第1処理は、選択処理部62が、事前に登録された複数の利用者UaからN人の利用者Uaをランダムに選択し、当該N人の利用者Uaにそれぞれ対応するN個の入力データDを選択データD1として選択する処理である。第2処理は、選択処理部62が、事前に登録された複数の端末装置22からN個の端末装置22をランダムに選択し、当該N個の端末装置22から受信したN個の入力データDを選択データD1として選択する処理である。
【0034】
図5の再生制御部63は、選択処理部62が選択したN個の選択データD1に応じた音(以下「選択音」という)を、施設200内の再生システム13に再生させる。選択音は、イベントの進行に並行して再生される。したがって、施設200内の利用者Ub(出場者,出演者,運営者または観覧者)は選択音を聴取する。以上の説明から理解される通り、再生制御部63は、イベントの観覧者に対して選択音を再生させる。選択音は「第1音」の一例である。
【0035】
他方、受信処理部61が受信した複数の入力データDのうち選択処理部62により選択されないM個の入力データD(以下「非選択データD2」という)に応じた音は再生されない(Mは1以上の自然数)。すなわち、M個の非選択データD2は、再生システム13による再生に寄与しない。以上の通り、複数の入力データDのうちN個の選択データD1以外のM個の非選択データD2は、選択音の再生において無視される。したがって、M個の非選択データD2に応じた音も再生する構成と比較して、再生制御部63による処理の負荷を軽減できる。
【0036】
第1実施形態の再生制御部63は、N個の選択データD1に対する音響処理により音響信号Xを生成し、音響信号Xを再生システム13に供給することで再生システム13に選択音を再生させる。すなわち、相異なる選択データD1が表すN個の入力音声に対する音響処理で生成された選択音が再生システム13により再生される。
【0037】
音響処理は、加工処理と混合処理とを含むミキシング処理である。加工処理は、N個の選択データD1の各々が表す入力音声を加工する信号処理である。具体的には、加工処理は、各入力音声の音色を調整する処理、各入力音声の定位を制御する処理、各入力音声に各種の音響効果を付与する処理、または、N個の入力音声の相互間の音量比を調整する処理を含む。混合処理は、加工処理後のN個の入力音声を混合する信号処理である。以上に例示した音響処理により、受聴者がN個の入力音声の各々を明瞭に識別可能な選択音の音響信号Xが生成される。
【0038】
図6は、制御装置51が実行する処理(以下「再生制御処理」という)Saの具体的な手順を例示するフローチャートである。再生制御処理Saは、例えば所定の周期で反復される。
【0039】
再生制御処理Saが開始されると、制御装置51(受信処理部61)は、相異なる端末装置22から送信された複数の入力データDを通信装置53により受信する(Sa1)。制御装置51(選択処理部62)は、複数の入力データDからランダムにN個の選択データD1を選択する(Sa2)。制御装置51(再生制御部63)は、N個の選択データD1に応じた選択音を再生システム13に再生させる(Sa3)。
【0040】
以上の説明から理解される通り、第1実施形態においては、相異なる端末装置22の利用者Uaによる入力に応じた複数の入力データDからN個の選択データD1が選択され、N個の選択データD1に応じた選択音がイベントの進行に並行して再生される。したがって、受信処理部61が受信した全部の入力データDに応じた音が再生される構成と比較して、受聴者が選択音(さらには各入力音声)を聴感的に識別し易い。また、第1実施形態においては、N個の選択データD1に応じた再生音が、イベントが実施される施設200内に再生される。したがって、施設200から遠隔に所在する端末装置22の利用者Uaが、施設200内におけるイベントの雰囲気に関与できる。
【0041】
第1実施形態においては、N個の選択データD1に対して加工処理と混合処理とを含む音響処理が実行される。したがって、N個の選択データD1が表す入力音声の混合音を再生する構成と比較して、各端末装置22の利用者Uaが発音した入力音声を受聴者が明瞭に聴取し易いという利点がある。
【0042】
B:第2実施形態
第2実施形態を説明する。なお、以下に例示する各態様において機能が第1実施形態と同様である要素については、第1実施形態の説明と同様の符号を流用して各々の詳細な説明を適宜に省略する。
【0043】
図7は、第2実施形態における制御システム14の機能的な構成を例示するブロック図である。第2実施形態の記憶装置52は条件データQを記憶する。条件データQは、選択処理部62がN個の選択データD1を選択するための条件を規定するデータである。具体的には、条件データQは、複数の登録文字列Wr(Wr1,Wr2,…)が登録されたリストである。
【0044】
第2実施形態の制御装置51は、第1実施形態と同様の要素(受信処理部61,選択処理部62および再生制御部63)に加えて音声認識部64として機能する。音声認識部64は、受信処理部61が受信した複数の入力データDの各々について音声認識を実行することで発話文字列Wiを特定する。発話文字列Wiは、入力データDが表す入力音声の発話内容に対応する文字列である。入力データDから発話文字列Wiを特定するための音声認識処理には、公知の技術が任意に採用される。
【0045】
第2実施形態の選択処理部62は、条件データQにより規定される条件のもとで複数の入力データDからN個の選択データD1を選択する。具体的には、選択処理部62は、条件データQに登録された複数の登録文字列Wrの何れかに相関する発話文字列Wiが特定された入力データDを、選択データD1として複数の入力データDから選択する。登録文字列Wrと発話文字列Wiとの相関とは、登録文字列Wrと発話文字列Wiとが相互に類似または一致する関係である。すなわち、選択処理部62は、複数の登録文字列Wrの何れかに類似または一致する発話文字列Wiが特定された入力データDを、選択データD1として選択する。したがって、選択データD1の個数Nは、各利用者Uaによる発話内容に応じた可変値である。すなわち、登録文字列Wrに類似または一致する語句を発音した利用者Uaが多いほど、選択データD1の個数Nは増加する。
【0046】
選択処理部62が選択したN個の選択データD1に応じた選択音を再生システム13に再生させる動作は、第1実施形態と同様である。以上の説明から理解される通り、再生システム13による再生が許容される発話内容が条件データQに登録される。すなわち、条件データQは、再生が許容される入力音声の発話内容について条件を規定する。
【0047】
図8は、第2実施形態における再生制御処理Sbの具体的な手順を例示するフローチャートである。再生制御処理Sbは、例えば所定の周期で反復される。
【0048】
再生制御処理Sbが開始されると、制御装置51(受信処理部61)は、第1実施形態と同様に、複数の入力データDを通信装置53により受信する(Sb1)。制御装置51(音声認識部64)は、複数の入力データDの各々に対する音声認識処理により、各入力データDの発話文字列Wiを特定する(Sb2)。制御装置51(選択処理部62)は、登録文字列Wrに相関する発話文字列Wiが特定された入力データDを、選択データD1として選択する(Sb3)。制御装置51(再生制御部63)は、第1実施形態と同様に、N個の選択データD1に応じた選択音を再生システム13に再生させる(Sb4)。
【0049】
第2実施形態においても第1実施形態と同様の効果が実現される。また、第2実施形態においては、登録文字列Wrに相関する発話内容の入力音声を表す入力データDが選択データD1として選択される。したがって、不適切な文字列を含む選択音が再生される可能性を低減できる。
【0050】
なお、以上の説明においては、登録文字列Wrに相関する発話内容の入力データDを選択したが、選択処理部62は、条件データQに登録された複数の登録文字列Wrとは相違する発話内容の入力データDを選択データD1として選択してもよい。すなわち、選択処理部62は、条件データQの登録文字列Wrとは相違する発話文字列Wiが特定された入力データDを、選択データD1として選択する。したがって、登録文字列Wrに相関する発話文字列Wiに対応する入力データDは選択されない。以上の説明から理解される通り、条件データQには、選択処理部62による選択が許容される入力データDの条件と、選択処理部62による選択が禁止される入力データDの条件との何れかが規定される。
【0051】
C:第3実施形態
図9は、第3実施形態における再生制御部63の動作に関する説明図である。
図9に例示される通り、第3実施形態の再生システム13は、施設200内の相異なる場所に設置されたK個の再生部16_1~16_Kを含む。各再生部16_k(k=1~K)は、音響信号X_kが表す選択音を再生するスピーカ装置である。
【0052】
第3実施形態の再生制御部63は、選択処理部62が選択したN個の選択データD1からKチャネルの音響信号X_1~X_Kを生成する。各音響信号X_kは、N個の選択データD1を区分したK個の組(以下「選択データ組」という)の何れかに対応する。例えば、選択データD1の個数Nが音響信号X_kの総数Kの整数倍(z倍)である場合を想定すると(N=z・K)、K個の選択データ組の各々は、z個の選択データD1で構成される。再生制御部63は、第k番目の選択データ組を構成するz個の選択データD1から音響信号X_kを生成する。具体的には、再生制御部63は、第k番目の選択データ組のz個の選択データD1に対して音響処理(加工処理および混合処理)を実行することで、選択音を表す音響信号X_kを生成する。なお、各音響信号X_kの生成に使用される選択データD1の個数zを、音響信号X_k毎に相違させてもよい。
【0053】
各音響信号X_kは、K個の再生部16_1~16_Kのうち1個の再生部16_kに供給される。各再生部16_kは、音響信号X_kが表す選択音を再生する。具体的には、再生部16_kは、K個の選択データ組のうち第k番目の選択データ組を構成するz個の選択データD1に応じた選択音を再生する。選択データD1の個数Nが音響信号X_kの総数Kと一致する場合(z=1)を想定すると、K個の再生部16_1~16_Kの各々が、相異なる1個の選択データD1に応じた選択音を再生する。
【0054】
いま、任意の2個の再生部16_k1および再生部16_k2に着目する(k1,k2=1~K,k1≠k2)。再生部16_k1には音響信号X_k1が供給され、再生部16_k2には音響信号X_k2が供給される。再生部16_k1は、第k1番目の選択データ組を構成するz個の選択データD1に応じた選択音を再生する。同様に、再生部16_k2は、第k2番目の選択データ組を構成するz個の選択データD1に応じた選択音を再生する。すなわち、再生制御部63は、N個の選択データD1のうち一部(第k1番目の選択データ組)の選択データD1に応じた選択音を、再生部16_k1に再生させる。また、再生制御部63は、N個の選択データD1のうち他の一部(第k2番目の選択データ組)の選択データD1に応じた選択音を、再生部16_k2に再生させる。再生部16_k1は「第1再生部」の一例であり、再生部16_k2は「第2再生部」の一例である。
【0055】
第3実施形態においても第1実施形態と同様の効果が実現される。また、第3実施形態においては、N個の選択データD1のうち一部の選択データD1に応じた選択音と、他の一部の選択データD1に応じた選択音とが、別個の再生部16により再生される。したがって、N個の選択データD1に応じた選択音が1個の再生部16により再生される構成と比較して、各端末装置22の利用者Uaが発音した入力音声を受聴者が明瞭に聴取し易いという利点がある。なお、N個の選択データD1の選択に条件データQを利用する第2実施形態の構成は、第3実施形態に適用されてもよい。
【0056】
D:第4実施形態
第1実施形態から第3実施形態においては、N個の選択データD1に応じた選択音を再生システム13に再生させる構成を例示した。第4実施形態の再生制御部63は、N個の選択データD1に応じた選択音に加えて、M個の非選択データD2に応じた音(以下「非選択音」という)を再生システム13に再生させる。M個の非選択データD2は、前述の通り、受信処理部61が受信した複数の入力データDのうちN個の選択データD1以外の入力データDである。なお、M個の非選択データD2は、N個の選択データD1以外の複数の入力データDのうちの一部でもよい。非選択データD2は、「第2入力データ」の一例である。
【0057】
図10は、第4実施形態における再生制御部63の構成を例示するブロック図である。第4実施形態の再生制御部63は、第1処理部631と第2処理部632と混合部633とを具備する。
【0058】
第1処理部631は、N個の選択データD1に対する第1音響処理により音響信号Y1を生成する。第1音響処理は、第1実施形態において例示した音響処理と同様に、加工処理と混合処理とを含むミキシング処理である。したがって、第4実施形態の音響信号Y1は、第1実施形態における音響信号Xに相当する。すなわち、第1処理部631による第1音響処理により、受聴者がN個の入力音声の各々を明瞭に識別可能な選択音の音響信号Y1が生成される。
【0059】
第2処理部632は、M個の非選択データD2に対する第2音響処理により音響信号Y2を生成する。第2音響処理は、各非選択データD2が表す入力音声の明瞭度を低下させる信号処理である。すなわち、音響信号Y2が表す非選択音は、受聴者が音韻(すなわち発話内容)を聴感的に識別できない音声である。具体的には、第2音響処理は、入力音声の音量を低減する処理、音韻が識別されない雑音成分(例えば白色雑音)を入力音声に混合する処理、音韻が識別されない雑音成分に入力音声を変換または置換する処理、または、入力音声の複数の調波成分を低減する処理、等の各種の処理を含む。すなわち、第2処理部632による第2音響処理により、受聴者がM個の入力音声の各々を明瞭に識別できない非選択音の音響信号Y2が生成される。
【0060】
混合部633は、第1処理部631が生成した音響信号Y1と第2処理部632が生成した音響信号Y2とを混合することで音響信号Xを生成する。例えば、混合部633は、音響信号Y1と音響信号Y2との加重和により音響信号Xを生成する。音響信号Y2の加重値を音響信号Y1の加重値よりも小さい数値に設定してもよい。
【0061】
混合部633により生成された音響信号Xが再生システム13に供給される。すなわち、音響信号Y1が表す明瞭な選択音と音響信号Y2が表す不明瞭な非選択音とが施設200内に再生される。以上の説明から理解される通り、第4実施形態の再生制御部63は、N個の選択データD1に応じた選択音と、M個の非選択データD2に応じた非選択音とを、再生システム13に再生させる。
【0062】
第4実施形態においても第1実施形態と同様の効果が実現される。また、第4実施形態においては、N個の選択データD1に応じた選択音とともに、M個の非選択データD2に応じた非選択音が再生される。したがって、施設200内のイベントの雰囲気に関与できる利用者Uaを増加させることが可能である。また、M個の非選択データD2については明瞭度を低下させる第2音響処理が実行されるから、N個の選択データD1に応じた選択音を受聴者が聴取し易い状態は維持される。なお、第2実施形態または第3実施形態の構成を第4実施形態に適用してもよい。
【0063】
E:第5実施形態
図11は、第5実施形態における情報システム100の部分的な構成を例示するブロック図である。第5実施形態における受信処理部61および選択処理部62の構成および動作は、第1実施形態と同様である。例えば、選択処理部62は、受信処理部61が受信した複数の入力データDからN個の選択データD1を選択する。
【0064】
第5実施形態における制御システム14の再生制御部63は、選択処理部62が選択したN個の選択データD1から音響信号Xを生成し、音響信号Xを配信システム12に送信する。音響信号Xは、例えば通信網300を介して制御システム14から配信システム12に送信される。N個の選択データD1から音響信号Xを生成するための音響処理は第1実施形態と同様である。なお、再生制御部63は、再生システム13に対する音響信号Xの供給に並行して当該音響信号Xを配信システム12に送信する。ただし、再生システム13に対する音響信号Xの供給は省略されてもよい。すなわち、再生システム13は省略されてもよい。
【0065】
配信システム12は、制御システム14から受信した音響信号XをコンテンツCの音響データC2に合成する。混合後の音響データC2は、収録システム11が施設200内で収音した音と、N個の選択データD1に応じた選択音との混合音を表す。再生装置21または再生装置45の放音装置32は、配信システム12から受信した音響データC2が表す音を再生する。すなわち、施設200内で収音された音とともに、N個の選択データD1に応じた選択音が放音装置32から再生される。以上の説明から理解される通り、第5実施形態の再生制御部63は、コンテンツCの視聴者が使用する装置(再生装置21または再生装置45)に選択音を再生させる。すなわち、利用者Uaが発音した入力音声が、当該利用者Uaの放音装置32(再生装置21または再生装置45)により再生される。
【0066】
図12は、第5実施形態における再生制御処理Scの具体的な手順を例示するフローチャートである。第1実施形態と同様に、再生制御処理Scは、例えば所定の周期で反復される。
【0067】
再生制御処理Scが開始されると、制御装置51(受信処理部61)は、第1実施形態と同様に、相異なる端末装置22から送信された複数の入力データDを通信装置53により受信する(Sc1)。制御装置51(選択処理部62)は、第1実施形態と同様に、複数の入力データDからN個の選択データD1を選択する(Sc2)。制御装置51(再生制御部63)は、N個の選択データD1に応じた音響信号Xを配信システム12に送信することで、N個の選択データD1に応じた選択音を再生装置21または再生装置45に再生させる(Sc3)。
【0068】
以上に例示した通り、第5実施形態においては、相異なる端末装置22の利用者Uaによる入力に応じた複数の入力データDからN個の選択データD1が選択され、N個の選択データD1に応じた選択音がイベントの進行に並行して再生される。したがって、第1実施形態と同様に、受信処理部61が受信した全部の入力データDに応じた音が再生される構成と比較して、受聴者が選択音を聴感的に識別し易い。また、第5実施形態においては、N個の選択データD1に応じた再生音が、コンテンツCの視聴者が使用する装置(再生装置21または再生装置45)により再生される。したがって、施設200から遠隔に所在する端末装置22の利用者Uaが、再生装置21または再生装置34が再生するコンテンツCの雰囲気に関与できる。
【0069】
なお、以上の説明においては、第1実施形態の構成を基礎として第5実施形態を例示したが、第2実施形態から第4実施形態の構成が第5実施形態に適用されてもよい。例えば、選択処理部62が条件データQを参照してN個の選択データD1を選択する第2実施形態の構成は、第5実施形態にも同様に適用される。また、再生制御部63がKチャネルの音響信号X_1~X_Kを生成する第3実施形態の構成も第5実施形態に適用される。各音響信号X_kが表す選択音が、再生装置21または再生装置45に搭載されたK個の再生部(例えばスピーカ装置)の何れかにより再生される。また、第4実施形態の構成を第5実施形態に適用してもよい。例えば、N個の選択データD1に応じた選択音とM個の非選択データD2に応じた非選択音との混合音を表す音響信号Xが配信システム12に送信され、当該音響信号Xが音響データC2に合成される。再生装置21または再生装置45の放音装置32は、N個の選択データD1に応じた選択音とM個の非選択データD2に応じた非選択音とを再生する。
【0070】
F:第6実施形態
図13は、第6実施形態における制御システム14の機能的な構成を例示するブロック図である。第6実施形態の制御システム14における制御装置51は、記憶装置52に記憶されたプログラムを実行することで、選択処理部71と受信処理部72と再生制御部73とを実現する。
【0071】
選択処理部71は、情報システム100によるサービスの提供先として登録された複数の端末装置22のうちN個の端末装置(以下「選択端末」という)22を選択する。N個の選択端末22は、複数の端末装置22のうちの一部である。選択処理部71がN個の選択端末22を選択する方法は任意である。例えば、選択処理部71は、複数の端末装置22からランダムにN個の選択端末22を選択する。また、選択処理部71は、複数の端末装置22のうち所定の条件を充足するN個の選択端末22を選択する。所定の条件は任意であるが、例えば、通信速度が閾値を上回ること等、通信環境に関する条件が想定される。選択処理部71は、選択/非選択を表す制御データGを複数の端末装置22の各々に送信する。なお、複数の端末装置22のうちN個の選択端末22のみに限定して、選択を意味する制御データGを送信してもよい。
【0072】
N個の選択端末22の各々は、第1実施形態と同様に、利用者Uaによる入力に応じた入力データDを制御システム14に送信する。具体的には、利用者Uaによる入力音声の波形を表す音響データが、入力データDとして各選択端末22から制御システム14に送信される。各選択端末22による入力データDの送信は、施設200内のイベントの進行に並行して順次に実行される。
【0073】
他方、複数の端末装置22のうちN個の選択端末22以外のM個の端末装置(以下「非選択端末」という)22から入力データDは送信されない。すなわち、各非選択端末22は、利用者Uaによる音声の入力を受付けた場合でも入力データDの送信を実行しない。したがって、相異なる選択端末22に対応するN個の入力データDが、イベントの進行に並行して制御システム14に順次に送信される。すなわち、第6実施形態においては、複数の端末装置22のうちの一部である1以上の端末装置22(選択端末22)から入力データDが送信される。
【0074】
受信処理部72は、N個の選択端末22の各々から送信された入力データDを通信装置53により受信する。受信処理部61によるN個の入力データDの受信は、イベントの進行に並行して所定の周期で反復される。
【0075】
再生制御部73は、受信処理部72が受信したN個の入力データDに応じた選択音を再生システム13に再生させる。具体的には、再生制御部73は、N個の入力データDに対する音響処理により音響信号Xを生成し、音響信号Xを再生システム13に供給することで選択音を再生させる。すなわち、相異なる入力データDが表すN個の入力音声に対する音響処理で生成された選択音が再生システム13により再生される。音響処理は、第1実施形態と同様に、加工処理と混合処理とを含むミキシング処理である。施設200内の利用者Ubは、イベントの進行に並行して選択音を聴取する。
【0076】
図14は、制御装置51が実行する再生制御処理Sdの具体的な手順を例示するフローチャートである。選択処理部71による選択端末22の選択と制御データGの送信との実行後に、例えば所定の周期で再生制御処理Sdが反復される。
【0077】
再生制御処理Sdが開始されると、制御装置51(受信処理部72)は、相異なる選択端末22から送信されたN個の入力データDを通信装置53により受信する(Sd1)。制御装置51(再生制御部73)は、N個の入力データDに応じた選択音を再生システム13に再生させる(Sd2)。
【0078】
以上の説明から理解される通り、第6実施形態においては、複数の端末装置22の一部であるN個の選択端末22の各々から入力データDが受信され、N個の入力データDに応じた選択音がイベントの進行に並行して再生される。したがって、複数の端末装置22の全部から送信された入力データDに応じた選択音が再生される構成と比較して、受聴者が選択音を聴感的に識別し易い。また、非選択端末22は入力データDを送信しないから、選択音の再生に必要な通信量を削減できるという利点もある。
【0079】
なお、第3実施形態と同様の構成は、第6実施形態にも適用される。すなわち、再生制御部73は、受信処理部72が受信したN個の入力データDからKチャネルの音響信号X_1~X_Kを生成する。音響信号X_1~X_Kの生成には第3実施形態と同様の処理が採用される。各音響信号X_kは、再生システム13に含まれるK個の再生部16_1~16_Kのうち1個の再生部16_kに供給される。すなわち、各再生部16_kは、音響信号X_kが表す選択音を再生する。
【0080】
また、第5実施形態と同様の構成は、第6実施形態にも適用される。すなわち、再生制御部73は、N個の入力データDから生成した音響信号Xを配信システム12に送信する。配信システム12は、制御システム14から受信した音響信号XをコンテンツCの音響データC2に合成する。したがって、再生装置21または再生装置45の放音装置32は、N個の入力データDに応じた選択音を再生する。すなわち、第6実施形態の再生制御部73は、コンテンツCの視聴者が使用する装置(再生装置21または再生装置45)に選択音を再生させる。以上の説明から理解される通り、利用者Uaが発音した入力音声が、当該利用者Uaの放音装置32(再生装置21または再生装置45)により再生される。
【0081】
G:変形例
以上に例示した各態様に付加される具体的な変形の態様を以下に例示する。以下の例示から任意に選択された複数の態様を、相互に矛盾しない範囲で適宜に併合してもよい。
【0082】
(1)選択処理部62が複数の入力データDからN個の選択データD1を選択する方法は、前述の各形態において例示した方法に限定されない。選択処理部62がN個の選択データD1を選択する方法としては、例えば以下の態様1Aから態様1Dが例示される。
【0083】
[態様1A]
態様1Aにおいては、複数の利用者Uaのうち特定の利用者Uaの入力データDを選択処理部62が選択する。具体的には、複数の利用者Uaのうち特定の条件を充足する利用者Uaの識別情報(または当該利用者Uaの端末装置22の識別情報)が記憶装置52に記憶される。例えば、電子決済処理により所定額の支払が完了した利用者Uaの識別情報、または、情報システム100によるサービスに利用されるポイントの所定量を消費した利用者Uaの識別情報が、記憶装置52に記憶される。選択処理部62は、受信処理部61が受信した複数の入力データDのうち、記憶装置52に識別情報が記憶された利用者Uaの端末装置22から受信した入力データDを選択データD1として選択する。また、電子決済処理による支払額またはポイントの消費量に応じて、利用者Uaの入力データDが単位時間内に選択データD1として選択される回数を利用者Ua毎に変更してもよい。
【0084】
[態様1B]
態様1Bにおいては、各利用者Uaの属性に応じて選択処理部62が各利用者Uaの入力データDを選択する。例えば、複数の利用者Uaの各々について複数種の属性が記憶装置52に記憶される。利用者Uaの属性は、例えば年齢または性別等である。スポーツイベントにおいては利用者Uaが応援するチームを当該利用者Uaの属性として登録してもよい。選択処理部62は、複数の利用者Uaのうち特定の属性が登録された利用者Uaの入力データDを選択データD1として選択する。スポーツイベントにおけるホームチームおよびアウェイチームの何れかを応援する利用者Uaの入力データDを選択処理部62が選択してもよい。入力データDの選択対象となる利用者Uaの属性を選択処理部62が経時的に変化させてもよい。
【0085】
また、第1属性の利用者Uaの複数の入力データDから選択される選択データD1の個数と、第2属性の利用者Uaの複数の入力データDから選択される選択データD1の個数とが所定の比率になるように、選択処理部62がN個の選択データD1を選択してもよい。例えばホームチームを応援する利用者Uaに対応する選択データD1の個数と、アウェイチームを応援する利用者Uaに対応する選択データD1の個数とが所定の比率となるように、選択処理部62がN個の選択データD1を選択する。
【0086】
[態様1C]
態様1Cにおいては、各利用者Uaの端末装置22から入力データDを受信した時点に応じて選択処理部62がN個の選択データD1を選択する。例えば、時間軸上の複数の期間の各々において、受信処理部61が受信した複数の入力データDのうち当該期間内における受信の順番でN個の選択データD1を選択処理部62が選択する。
【0087】
[態様1D]
態様1Dにおいては、複数の入力データDのうち管理者が手動で指示した入力データDを、選択処理部62が選択データD1として選択する。管理者は、例えばイベントの運営者または情報システム100の運営者である。例えば、各入力データDから特定された発話文字列Wiを管理者が視認し、複数の入力データDのうち発話文字列Wiが特定の条件を充足する入力データDを管理者が指示する。例えば適切な発話文字列Wiに対応する入力データDが指示される。選択処理部62は、複数の入力データDのうち管理者が指示した入力データDを選択データD1として選択する。
【0088】
なお、以上の各形態(第1実施形態から5実施形態および態様1Aから態様1D)から選択された2以上の方法の組合せによりN個の選択データD1を選択してもよい。例えば、選択処理部62は、態様1Aから態様1Dのうち1以上の方法により選択された複数の選択データD1からN個の選択データD1をランダムに選択してもよい。また、第6実施形態におけるN個の選択端末22の選択にも、以上の各形態において例示した選択データD1の選択と同様の方法が適用される。
【0089】
(2)前述の各形態においては、収音装置46に対する入力音声の波形を表す音響データを入力データDとして例示したが、入力データD(選択データD1または非選択データD2)の形式は以上の例示に限定されない。前述の各形態において例示した形式以外の入力データDの形式としては、例えば以下の態様2Aから態様2Cが例示される。
【0090】
[態様2A]
態様2Aにおける入力データDは、利用者Uaが指示した文字列を表す文字列データである。例えば、操作装置44に対する操作で利用者Uaが指示した文字列を表す入力データDが、端末装置22から制御システム14に送信される。制御システム14の再生制御部63は、選択データD1に対する音声合成処理により合成信号を生成し、相異なる選択データD1から生成したNチャネルの合成信号から音響信号Xを生成する。音声合成処理には公知の技術が任意に採用される。態様2Aによれば、各利用者Uaが指示した文字列を表す選択音が再生される。
【0091】
[態様2B]
態様2Bにおける入力データDは、事前に登録された複数の音(以下「登録音」という)のうちの何れかを指示する指示データである。登録音は、歓声または罵声等、イベントにおいて発音され得る各種の音声である。例えば、操作装置44に対する操作で利用者Uaが選択した登録音を示す入力データDが端末装置22から制御システム14に送信される。制御システム14の再生制御部63は、相異なる登録音の波形を表す複数の登録信号のうち選択データD1が示す登録音の登録信号を記憶装置52から取得し、相異なる選択データD1について取得したNチャネルの登録信号から音響信号Xを生成する。態様2Bによれば、各利用者Uaが指示した登録音が再生される。
【0092】
[態様2C]
前述の各形態においては、イベントの進行に並行して利用者Uaが発話した入力音声を表す入力データDを端末装置22から制御システム14に送信した。態様2Cにおいては、例えばイベントの開始前に収音装置46による収音で生成された音響データを、イベントの進行に並行して入力データDとして利用する。例えば、相異なる入力音声を表す音響データが端末装置22の記憶装置42に記憶される。制御装置41は、操作装置44に対する操作で利用者Uaが選択した音響データを入力データDとして通信装置43から制御システム14に送信する。なお、記憶装置42に記憶された音響データを、制御装置41が利用者Uaからの指示に応じて編集または加工してもよい。公知の音響処理技術により制御装置41が音響データを自動的に編集または加工してもよい。
【0093】
前述の各形態において例示した入力データDと、態様2Aから態様2Cに例示した入力データDとは、利用者Uaによる入力に応じた音声を示すデータとして包括的に表現される。利用者Uaによる入力は、例えば、収音装置46を利用した音声入力、または操作装置44を利用した手動入力である。ただし、入力データDが示す音は、音声(すなわち人間の肉声)に限定されない。例えば、入力データDが示す音は、拍手音、指笛音または楽器音等の音声以外の音でもよい。したがって、入力データDは、利用者Uaによる入力に応じた音を示すデータとして包括的に表現される。
【0094】
(3)第5実施形態においては、N個の選択データD1に応じた音響信号XをコンテンツCの音響データC2に合成したが、音響信号Xを音響データC2に合成する構成および動作は必須ではない。例えば、制御システム14の再生制御部63は、通信網300を介して音響信号Xを端末装置22に直接的に送信してもよい。端末装置22の制御装置41は、通信装置43が受信した音響信号Xが表す選択音を再生装置45の放音装置32に再生させる。第5実施形態および変形例3を包含するひとつの態様における再生制御部63は、コンテンツC(すなわちイベントの動画)の視聴者が使用する装置が選択音を再生するように動作すれば足り、当該装置による選択音の再生のための具体的な構成および動作は任意である。再生装置21および再生装置45は、視聴者が使用する装置の一例である。
【0095】
(4)前述の各形態においては、再生システム13により選択音を再生したが、選択音を表す文字列(以下「選択文字列」という)を、例えば施設200内の表示装置(図示略)に表示してもよい。例えば、再生制御部63は、音響信号Xに対する音声認識処理により選択文字列を推定し、当該選択文字列を表示装置に表示させる。第1言語で表現された選択文字列を公知の機械翻訳処理により第2言語に翻訳したうえで表示装置に表示してもよい。また、選択文字列(第1言語または第2言語)を表す文字列データを制御システム14から端末装置22に送信することで、端末装置22における再生装置45の表示装置31(または再生装置21の表示装置31)に選択文字列を表示させてもよい。なお、以上の説明においては、選択音を表す選択文字列を表示させる形態を例示したが、選択音に応じて変化する画像(例えばアイコン)を、再生制御部63が、施設200内の表示装置または表示装置31に表示させてもよい。
【0096】
(5)受信処理部61による入力データDの受信の回数(以下「受信回数」という)を、施設200内の表示装置または利用者Uaの表示装置31に表示させてもよい。受信回数は、複数の利用者Uaが入力音声を発話した回数の合計とも換言される。受信処理部61は、入力データDの受信に並行して受信回数を計数し、再生制御部63は、当該受信回数を施設200内の表示装置または利用者Uaの表示装置31に表示させる。
【0097】
(6)第2実施形態において、N個の選択データD1の選択に使用される条件データQを順次に切替えてもよい。具体的には、選択処理部62は、記憶装置52に記憶された複数の条件データQの各々をイベントの進行に並行して順番に選択し、選択状態の条件データQを利用してN個の選択データD1を選択する。以上の構成によれば、選択音としての再生が許容される発話文字列Wiが経時的に変化する。
【0098】
具体的には、選択処理部62は、イベントのシーン毎に条件データQを変更する。例えば、第1チームと第2チームとが競技するスポーツイベントを想定する。選択処理部62は、第1チームが攻撃している期間内においては、第1チームの選手名が登録文字列Wrとして登録された条件データQを有効化する。したがって、利用者Uaが発音した第1チームの選手名が、選択音として再生され易い。他方、第2チームが攻撃している期間内においては、第2チームの選手名が登録文字列Wrとして登録された条件データQを有効化する。したがって、利用者Uaが発音した第2チームの選手名が、選択音として再生され易い。
【0099】
以上の例示から理解される通り、条件データQを経時的に変更することで、イベントのシーン毎に適切な選択音を再生できる。なお、選択処理部62は、収録システム11が収録した映像を解析する公知のシーン識別技術によりイベントのシーンを識別する。また、制御システム14の管理者がイベントの進行に並行して手動でシーンを指示してもよい。
【0100】
(7)前述の各形態においては、選択処理部62が複数(N≧2)の選択データD1を選択したが、選択処理部62が1個(N=1)の選択データD1を選択してもよい。また、前述の第1実施形態においては、選択データD1の個数Nを固定値としたが、第2実施形態の例示からも理解される通り、個数Nは可変値でもよい。例えば、受信処理部61が受信した入力データDの総数に対して所定の係数(例えば1未満の数値)を乗算した数値を選択データD1の個数Nとして設定してもよい。
【0101】
(8)前述の各形態においてはスポーツイベントおよび音楽イベントを例示したが、前述の各形態が適用されるイベントは以上の例示に限定されない。例えば、ダンサーが実現するダンスイベント、俳優が出演する演劇イベント、講演者が講演する講演イベント、学校や学習塾等の各種の教育機関が生徒に授業を提供する教育イベント等、特定の目的で実施される各種のイベントに、前述の各形態は適用される。
【0102】
(9)以上に例示した制御システム14の機能は、前述の通り、制御装置51を構成する単数または複数のプロセッサと、記憶装置52に記憶されたプログラムとの協働により実現される。プログラムは、コンピュータが読取可能な記録媒体に格納された形態で提供されてコンピュータにインストールされ得る。記録媒体は、例えば非一過性(non-transitory)の記録媒体であり、CD-ROM等の光学式記録媒体(光ディスク)が好例であるが、半導体記録媒体または磁気記録媒体等の公知の任意の形式の記録媒体も包含される。なお、非一過性の記録媒体とは、一過性の伝搬信号(transitory, propagating signal)を除く任意の記録媒体を含み、揮発性の記録媒体も除外されない。また、配信装置が通信網を介してプログラムを配信する構成では、当該配信装置においてプログラムを記憶する記録媒体が、前述の非一過性の記録媒体に相当する。
【0103】
H:付記
以上に例示した形態から、例えば以下の構成が把握される。
【0104】
本開示のひとつの態様(態様1)に係る再生制御方法は、相異なる端末装置の利用者による入力に応じた複数の入力データをイベントの進行に並行して受信し、前記複数の入力データの一部である1以上の第1入力データを選択し、前記1以上の第1入力データに応じた第1音を前記イベントの進行に並行して再生させる。以上の態様においては、相異なる端末装置から受信した複数の入力データのうち1以上の第1入力データが選択され、当該1以上の第1入力データに応じた第1音がイベントの進行に並行して再生される。したがって、複数の端末装置から受信した全部の入力データに応じた第1音が再生される構成と比較して、受聴者が第1音を聴感的に識別し易い。
【0105】
「入力データ」は、利用者による入力に応じた任意のデータである。具体的には、入力データは、利用者による入力に応じた音を示すデータである。例えば、収音装置が利用者から収音した音響の波形を表す音響データ、利用者が指示した文字列を表す文字列データ、または、複数の音のうち利用者が選択した音を表す選択データが、「入力データ」の具体例である。文字列データを入力データとして端末装置から受信する態様においては、例えば当該文字列データに対する音声合成処理で生成される第1音が再生される。また、選択データを入力データとして端末装置から受信する態様においては、例えば事前に登録された複数の音のうち当該選択データが示す音が第1音として再生される。
【0106】
「複数の入力データの一部である1以上の第1入力データを選択する処理」は、複数の入力データの一部を第1入力データとして直接的に選択する態様のほか、複数の端末装置から1以上の端末装置を選択し、複数の入力データのうち選択された1以上の端末装置から受信した入力データを第1入力データとして選択する態様(すなわち端末装置を選択することで入力データを間接的に選択する態様)も包含する。
【0107】
第1音が再生される対象は、例えばイベントの観覧者または関係者である。イベントの関係者は、例えばイベントを管理および運営する運営者、または、イベントに参加する参加者(例えば音楽イベントの出演者またはスポーツイベントの出場者)である。また、「イベントの観覧者」は、イベントが実施される場所(以下「実施場所」という)に実際に所在する観覧者、または、当該イベントの動画を視聴する観覧者(すなわち動画の視聴者)である。実施場所に所在する観覧者または関係者に対する第1音の再生は、例えば実施場所に設置された再生システムに第1音を再生させる動作、または、観覧者または関係者が使用する端末装置に第1音を再生させる動作を含む。また、イベントの動画を視聴する観覧者に対する第1音の再生は、当該観覧者が使用する装置に第1音を再生させる動作を含む。なお、動画の視聴に使用される装置と第1音を再生する装置との異同は不問である。
【0108】
「1以上の第1入力データに応じた第1音を再生させる」処理は、1以上の第1入力データに応じた第1音を、第1入力データ以外の第2入力データに応じた第2音と比較して優先的に再生させることを意味する。したがって、「第1音の再生」は、複数の入力データのうち1以上の第1入力データに応じた第1音のみを選択的に再生させる動作のほか、1以上の第1入力データに応じた第1音を、第1入力データ以外の1以上の第2入力データに応じた第2音と比較して優先的に(例えば第2音と比較して大きい音量で)再生させる動作を含む。
【0109】
態様1の具体例(態様2)において、前記第1音の再生においては、前記イベントの動画の視聴者が使用する装置に前記第1音を再生させる。以上の態様においては、複数の入力データから選択された1以上の第1入力データに応じた第1音が、動画の視聴者が使用する装置により再生される。したがって、例えば実施場所から遠隔に所在する端末装置の利用者が、イベントの動画の雰囲気に関与できる。
【0110】
「イベントの動画の視聴者が使用する装置に第1音を再生させる」処理の具体例は、例えば、第1音を表す音響データを観覧者の装置に送信することで当該装置に第1音を再生させる動作である。観覧者の装置に音響データを送信する方法は任意である。例えば、観覧者が視聴する動画を表す動画データに音響データを混合して当該装置に送信してもよいし、動画データとは独立に音響データを送信してもよい。
【0111】
態様1の具体例(態様3)において、前記第1音の再生においては、前記イベントが実施される場所に設置された再生システムに前記第1音を再生させる。以上の態様においては、複数の入力データから選択された1以上の第1入力データに応じた第1音がイベントの実施場所にて再生されるから、例えば実施場所から遠隔に所在する端末装置の利用者が、当該実施場所におけるイベントの雰囲気に関与できる。
【0112】
態様3の具体例(態様4)において、前記1以上の第1入力データは、2以上の第1入力データであり、前記再生システムは、第1再生部と第2再生部とを含み、前記第1音の再生においては、前記2以上の第1入力データのうち一部の第1入力データに応じた前記第1音を前記第1再生部に再生させ、前記2以上の第1入力データのうち他の一部の第1入力データに応じた前記第1音を前記第2再生部に再生させる。以上の態様においては、複数の入力データから選択された2以上の第1入力データのうち一部の第1入力データに応じた第1音と、他の一部の第1入力データに応じた第1音とが、別個の再生部により再生される。したがって、各端末装置の利用者による入力に応じた音を、受聴者が明瞭に聴取し易いという利点がある。
【0113】
態様1から態様3の何れかの具体例(態様5)において、前記1以上の第1入力データは、2以上の第1入力データであり、前記2以上の第1入力データについて、加工処理および混合処理を含む第1音響処理を実行し、前記第1音の再生においては、前記第1音響処理後の前記第1音を再生させる。以上の態様においては、2以上の第1入力データに応じた音について、加工処理と混合処理とを含む第1音響処理が実行される。したがって、各端末装置の利用者による入力に応じた音を、受聴者が明瞭に聴取し易いという利点がある。
【0114】
態様1から態様5の何れかの具体例(態様6)において、前記複数の入力データのうち前記1以上の第1入力データ以外の1以上の第2入力データに応じた音は再生されない。以上の態様においては、複数の入力データのうち第1入力データ以外の第2入力データは、第1音の再生において無視される。したがって、音を再生する処理の負荷を軽減できる。
【0115】
態様1から態様5の何れかの具体例(態様7)において、前記複数の入力データのうち前記1以上の第1入力データ以外の1以上の第2入力データについて、明瞭度を低下させる第2音響処理を実行し、前記第1音の再生においては、当該第1音と、前記第2音響処理後の第2音とを再生させる。以上の態様においては、複数の入力データのうち1以上の第1入力データに応じた第1音とともに、第1入力データ以外の1以上の第2入力データに応じた第2音が再生される。したがって、イベントの雰囲気に関与できる利用者を増加させることが可能である。また、1以上の第2入力データについては明瞭度を低下させる第2音響処理が実行される。したがって、第1音と第2音とが並列に再生される構成にも関わらず、受聴者が第1音を聴取し易い状態は維持される。
【0116】
第2音響処理は、1以上の第2入力データに応じた第2音の発話内容の識別性(受聴者が発話内容を聴感的に識別できる可能性)を低下させる処理である。具体的には、第2音響処理は、第2入力データが表す音の音量を低下させる処理、音韻が識別されない雑音成分(例えば白色雑音)を混合する処理、または、入力音声の複数の調波成分を低減する処理、等の各種の処理を含む。
【0117】
態様1から態様7の何れかの具体例(態様8)において、前記1以上の第1入力データの選択においては、前記複数の入力データから前記1以上の第1入力データをランダムに選択する。以上の態様によれば、複数の入力データから1以上の第1データを選択する処理の負荷が軽減される。
【0118】
態様1から態様7の何れかの具体例(態様9)において、前記1以上の第1入力データの選択においては、前記複数の入力データのうち、登録文字列に相関または相違する発話内容の音を表す前記1以上の第1入力データを選択する。以上の態様によれば、不適切な文字列を含む第1音が再生される可能性を低減できる。
【0119】
本開示のひとつの態様(態様10)に係る制御システムは、相異なる端末装置の利用者による入力に応じた複数の入力データをイベントの進行に並行して受信する受信処理部と、前記複数の入力データの一部である1以上の第1入力データを選択する選択処理部と、前記1以上の第1入力データに応じた第1音を前記イベントの進行に並行して再生させる再生制御部とを具備する。
【0120】
本開示のひとつの態様(態様11)に係るプログラムは、相異なる端末装置の利用者による入力に応じた複数の入力データをイベントの進行に並行して受信する受信処理部、前記複数の入力データの一部である1以上の第1入力データを選択する選択処理部、および、前記1以上の第1入力データに応じた第1音を前記イベントの進行に並行して再生させる再生制御部、としてコンピュータを機能させる。
【符号の説明】
【0121】
100…情報システム、200…施設、300…通信網、11…収録システム、12…配信システム、13…再生システム、14…制御システム、21…再生装置、22…端末装置、31…表示装置、32…放音装置、41,51…制御装置、42,52…記憶装置、43,53…通信装置、44…操作装置、45…再生装置、46…収音装置、61,72…受信処理部、62,71…選択処理部、63,73…再生制御部、631…第1処理部、632…第2処理部、633…混合部、64…音声認識部。