(19)【発行国】日本国特許庁(JP)
(12)【公報種別】特許公報(B2)
(11)【特許番号】
(24)【登録日】2024-08-13
(45)【発行日】2024-08-21
(54)【発明の名称】配信音声遅延調整装置、配信音声遅延調整システム、および配信音声遅延調整プログラム
(51)【国際特許分類】
H04N 21/242 20110101AFI20240814BHJP
H04N 21/233 20110101ALI20240814BHJP
H04N 21/258 20110101ALI20240814BHJP
G10K 15/02 20060101ALI20240814BHJP
【FI】
H04N21/242
H04N21/233
H04N21/258
G10K15/02
(21)【出願番号】P 2020081259
(22)【出願日】2020-05-01
【審査請求日】2023-02-06
(73)【特許権者】
【識別番号】591275481
【氏名又は名称】株式会社アイ・オー・データ機器
(74)【代理人】
【識別番号】110000671
【氏名又は名称】IBC一番町弁理士法人
(72)【発明者】
【氏名】細野 昭雄
(72)【発明者】
【氏名】島田 康晴
【審査官】鈴木 順三
(56)【参考文献】
【文献】特開2011-223639(JP,A)
【文献】特開2013-115782(JP,A)
【文献】特表平08-500222(JP,A)
【文献】特開2015-149705(JP,A)
【文献】特表2000-507403(JP,A)
【文献】特表2013-543712(JP,A)
【文献】特開2016-171418(JP,A)
(58)【調査した分野】(Int.Cl.,DB名)
H04N 21/00 - 21/858
G10K 15/00 - 15/12
(57)【特許請求の範囲】
【請求項1】
開催されるイベントに合わせてリアルタイム配信するための配信音声に関する配信音声情報を配信用端末から取得する取得部と、
前記取得部によって取得された前記配信音声情報を、前記配信音声を聴取するユーザーのユーザー端末にリアルタイムで配信可能な配信部と、
前記配信音声情報が前記ユーザー端末において出力されるタイミングの遅延の程度を調整する調整部と、
前記イベントに関する音声の発生位置と、前記配信音声情報を出力する前記ユーザー端末の位置との間の距離を特定する特定部と、を有し、
前記調整部は、前記特定部によって特定された前記距離に応じて前記遅延の程度を調整し、
前記配信部は、前記調整部において調整された前記遅延の程度に応じて前記配信音声情報を配信する配信音声遅延調整装置。
【請求項2】
前記遅延の程度を調整するための遅延設定を受け付ける設定部をさらに有し、
前記調整部は、前記設定部において受け付けられた前記遅延設定を考慮して、前記遅延の程度を調整する請求項
1に記載の配信音声遅延調整装置。
【請求項3】
前記設定部は、前記ユーザー端末において前記ユーザーから受け付けられた指示に基づいて、前記遅延設定を受け付ける請求項
2に記載の配信音声遅延調整装置。
【請求項4】
開催されるイベントに合わせてリアルタイム配信するための配信音声に関する配信音声情報を配信用端末から取得する取得部と、
前記取得部によって取得された前記配信音声情報を、前記配信音声を聴取するユーザーのユーザー端末にリアルタイムで配信可能な配信部と、
前記配信音声情報が前記ユーザー端末において出力されるタイミングの遅延の程度を調整する調整部と、
前記遅延の程度を調整するための遅延設定を受け付ける設定部と、を有し、
前記設定部は、前記ユーザー端末において前記ユーザーから受け付けられた指示に基づいて、前記遅延設定を受け付け、
前記調整部は、前記設定部において受け付けられた前記遅延設定を考慮して、前記遅延の程度を調整し、
前記配信部は、前記調整部において調整された前記遅延の程度に応じて前記配信音声情報を配信する配信音声遅延調整装置。
【請求項5】
前記配信音声は、テレビ放送されるイベントの映像に合わせてリアルタイム配信するためのものであり、
前記映像には、当該映像に関するタイムスタンプを示すタイムスタンプ情報が表示され、
前記調整部は、前記映像および前記配信音声を視聴するユーザーが使用する前記ユーザー端末において、前記映像を撮影して解析し、当該映像に含まれるタイムスタンプ情報を取得して得られたタイムスタンプに基づいて、前記遅延の程度を調整する請求項1~4のいずれかに記載の配信音声遅延調整装置。
【請求項6】
開催されるイベントに合わせてリアルタイム配信するための配信音声に関する配信音声情報を配信用端末から取得する取得部と、
前記取得部によって取得された前記配信音声情報を、前記配信音声を聴取するユーザーのユーザー端末にリアルタイムで配信可能な配信部と、
前記配信音声情報が前記ユーザー端末において出力されるタイミングの遅延の程度を調整する調整部と、を有し、
前記配信音声は、テレビ放送されるイベントの映像に合わせてリアルタイム配信するためのものであり、
前記映像には、当該映像に関するタイムスタンプを示すタイムスタンプ情報が表示され、
前記調整部は、前記映像および前記配信音声を視聴するユーザーが使用する前記ユーザー端末において、前記映像を撮影して解析し、当該映像に含まれるタイムスタンプ情報を取得して得られたタイムスタンプに基づいて、前記遅延の程度を調整し、
前記配信部は、前記調整部において調整された前記遅延の程度に応じて前記配信音声情報を配信する配信音声遅延調整装置。
【請求項7】
前記配信音声は、テレビ放送されるイベントの映像に合わせてリアルタイム配信するためのものであり、
前記映像に含まれる映像内音声には、当該映像に関するタイムスタンプを示すタイムスタンプ情報が含まれ、
前記調整部は、前記映像および前記配信音声を視聴するユーザーが使用する前記ユーザー端末において、前記映像内音声を取得して解析し、当該映像内音声に含まれるタイムスタンプ情報を取得して得られたタイムスタンプに基づいて、前記遅延の程度を調整する請求項1~
6のいずれかに記載の配信音声遅延調整装置。
【請求項8】
開催されるイベントに合わせてリアルタイム配信するための配信音声に関する配信音声情報を配信用端末から取得する取得部と、
前記取得部によって取得された前記配信音声情報を、前記配信音声を聴取するユーザーのユーザー端末にリアルタイムで配信可能な配信部と、
前記配信音声情報が前記ユーザー端末において出力されるタイミングの遅延の程度を調整する調整部と、を有し、
前記配信音声は、テレビ放送されるイベントの映像に合わせてリアルタイム配信するためのものであり、
前記映像に含まれる映像内音声には、当該映像に関するタイムスタンプを示すタイムスタンプ情報が含まれ、
前記調整部は、前記映像および前記配信音声を視聴するユーザーが使用する前記ユーザー端末において、前記映像内音声を取得して解析し、当該映像内音声に含まれるタイムスタンプ情報を取得して得られたタイムスタンプに基づいて、前記遅延の程度を調整し、
前記配信部は、前記調整部において調整された前記遅延の程度に応じて前記配信音声情報を配信する配信音声遅延調整装置。
【請求項9】
前記配信部は、
予め用意された配信タイミングの異なる複数の配信音声情報を配信可能であり、
前記遅延の程度に応じて、前記複数の配信音声情報の中から使用する配信音声情報を選択することによって、前記配信音声情報が前記ユーザー端末において出力されるタイミングを調整する請求項1~
8のいずれかに記載の配信音声遅延調整装置。
【請求項10】
開催されるイベントに合わせてリアルタイム配信するための配信音声に関する配信音声情報を配信用端末から取得する取得部と、
前記取得部によって取得された前記配信音声情報を、前記配信音声を聴取するユーザーのユーザー端末にリアルタイムで配信可能な配信部と、
前記配信音声情報が前記ユーザー端末において出力されるタイミングの遅延の程度を調整する調整部と、を有し、
前記配信部は、前記調整部において調整された前記遅延の程度に応じて前記配信音声情報を配信するものであって、前記配信部は、予め用意された配信タイミングの異なる複数の配信音声情報を配信可能であり、前記遅延の程度に応じて、前記複数の配信音声情報の中から使用する配信音声情報を選択することによって、前記配信音声情報が前記ユーザー端末において出力されるタイミングを調整する配信音声遅延調整装置。
【請求項11】
前記取得部は、前記配信音声情報に基づいて前記配信音声をテキスト化した情報であるテキスト情報をさらに取得する請求項1~
10のいずれかに記載の配信音声遅延調整装置。
【請求項12】
開催されるイベントに合わせてリアルタイム配信するための配信音声に関する配信音声情報を配信用端末から取得する取得部と、
前記取得部によって取得された前記配信音声情報を、前記配信音声を聴取するユーザーのユーザー端末にリアルタイムで配信可能な配信部と、
前記配信音声情報が前記ユーザー端末において出力されるタイミングの遅延の程度を調整する調整部と、を有し、
前記取得部は、前記配信音声情報に基づいて前記配信音声をテキスト化した情報であるテキスト情報を取得し、
前記配信部は、前記調整部において調整された前記遅延の程度に応じて前記配信音声情報を配信する配信音声遅延調整装置。
【請求項13】
前記取得部は、前記配信用端末から、前記配信用端末の周囲の騒音レベルに関する情報をさらに取得し、
前記配信部は、前記取得部によって取得された前記配信用端末の周囲の騒音レベルが所定の閾値以上である場合、前記配信音声情報とあわせて、前記配信音声情報に基づいて取得された前記テキスト情報を配信する請求項
11または12に記載の配信音声遅延調整装置。
【請求項14】
前記取得部は、前記ユーザー端末の周囲の騒音レベルに関する情報をさらに取得し、
前記配信部は、前記取得部によって取得された前記ユーザー端末の周囲の騒音レベルが所定の閾値以上である場合、前記配信音声情報とあわせて、前記配信音声情報に基づいて取得された前記テキスト情報を配信する請求項
11~13のいずれかに記載の配信音声遅延調整装置。
【請求項15】
前記取得部は、前記配信音声情報または前記テキスト情報に基づいて、他の言語に翻訳された前記配信音声を示す情報をさらに取得し、
前記配信部は、前記配信音声情報とあわせて、前記他の言語に翻訳された前記情報を配信する請求項
11~
14のいずれかに記載の配信音声遅延調整装置。
【請求項16】
請求項1~
15のいずれかに記載の配信音声遅延調整装置と、
配信される前記配信音声情報を受信するユーザー端末と、を有し、
前記ユーザー端末は、前記配信音声情報が前記遅延の程度に沿って出力されるように、前記配信音声情報の出力タイミングを調整する出力部を有する配信音声遅延調整システム。
【請求項17】
前記出力部は、前記配信部から取得する配信音声情報を前記複数の配信音声情報の中から選択することによって、前記配信音声情報の出力タイミングを調整する請求項
9または10を引用する請求項
16に記載の配信音声遅延調整システム。
【請求項18】
前記出力部は、受信した前記配信音声情報を所定の時間バッファリングすることによって前記配信音声情報の出力タイミングを調整する請求項
16または
17に記載の配信音声遅延調整システム。
【請求項19】
前記出力部は、配信される前記配信音声情報の配信遅延状況を考慮して前記配信音声情報の出力タイミングを調整する請求項
16~
18のいずれかに記載の配信音声遅延調整システム。
【請求項20】
開催されるイベントに合わせてリアルタイム配信するための配信音声に関する配信音声情報を配信用端末から取得するステップ(a)と、
前記イベントに関する音声の発生位置と、前記配信音声情報を出力するユーザー端末の位置との間の距離を特定するステップ(a1)と、
前記ステップ(a)において取得された前記配信音声情報を、前記配信音声を聴取するユーザーの
前記ユーザー端末にリアルタイムで配信するステップ(b)と、
前記配信音声情報が前記ユーザー端末において出力されるタイミングの遅延の程度を調整するステップ(c)と、を有し、
前記ステップ(c)は、前記ステップ(a1)によって特定された前記距離に応じて前記遅延の程度を調整し、
前記ステップ(b)は、前記ステップ(c)において調整された前記遅延の程度に応じて前記配信音声情報を配信する処理を、コンピューターに実行させるための配信音声遅延調整プログラム。
【請求項21】
開催されるイベントに合わせてリアルタイム配信するための配信音声に関する配信音声情報を配信用端末から取得するステップ(a)と、
前記ステップ(a)において取得された前記配信音声情報を、前記配信音声を聴取するユーザーのユーザー端末にリアルタイムで配信するステップ(b)と、
前記配信音声情報が前記ユーザー端末において出力されるタイミングの遅延の程度を調整するステップ(c)と、
前記ユーザー端末において前記ユーザーから受け付けられた指示に基づいて、前記遅延の程度を調整するための遅延設定を受け付けるステップ(c1)と、を有し、
前記ステップ(c)は、前記ステップ(c1)によって受け付けられた前記遅延設定を考慮して、前記遅延の程度を調整し、
前記ステップ(b)は、前記ステップ(c)において調整された前記遅延の程度に応じて前記配信音声情報を配信する処理を、コンピューターに実行させるための配信音声遅延調整プログラム。
【発明の詳細な説明】
【技術分野】
【0001】
本発明は、配信音声遅延調整装置、配信音声遅延調整システム、および配信音声遅延調整プログラムに関する。
【背景技術】
【0002】
コンサートや航空ショー等のイベントをイベント会場で観覧する際に、楽しい実況や詳しい解説を聴きながら観覧したいというニーズがある。また、近年では、テレビで放送されるスポーツイベントの生中継等を鑑賞する際に、テレビ番組によって公式に提供される実況や解説だけでなく、多種多様なキャスターによる実況や解説を聴きながら中継を鑑賞したいというニーズも生まれている。
【0003】
しかしながら、たとえば敷地の広いイベント会場でユーザーがイベントを鑑賞する際、イベントが行われている位置と、イベントを鑑賞するユーザーの位置との距離が離れている場合、イベントにおいて発生した音声は、距離に応じて遅延してユーザーに到達する。また、テレビの生中継は、デジタル放送におけるエンコードおよびデコード等の影響により、映像が撮影されている現地の時刻よりも、少なくとも2~3秒程度遅延して放送されることが知られている。この遅延時間は、経由するネットワークや機器、受像機のデコード性能等によっても変動し、さらに、放送局の都合等によって、テレビの生中継は数分程度遅延させて放映されることもある。一方、これらのイベント会場やテレビの生中継における遅延に比べて、インターネット等を介して音声を配信する場合、遅延は1秒程度に抑えられる。
【0004】
したがって、イベント会場でイベントを鑑賞するユーザーや、テレビで放映されるイベントの映像を視聴するユーザーに向けて、同じイベントの解説・実況等の音声をインターネット経由で配信する場合、次のような問題が生じる。まず、イベント会場のユーザーにおいては、イベントにおいて実際に発生している音声と配信される音声との間でタイミングのずれが生じてしまう。たとえば、コンサート会場において次の曲が聞こえてくる前に、配信される音声によって次の曲名が告げられてしまっては、ユーザーにとっては興醒めであり、演者にとっても不都合である。また、テレビを視聴するユーザーにおいては、テレビの映像と配信される音声のタイミングがずれてしまうという問題がある。たとえば、サッカーの試合の中継等において、映像ではまだゴールが決められていないのに、音声ではゴールが決められたことが伝えられてしまっては、ユーザーにとって興醒めであり不都合である。
【0005】
上記のような問題に関連して、放送局において、放送とストリーミングの両方を用いて映像および音声を配信する場合に、放送とストリーミングのタイミングを同期させる技術が開示されている(特許文献1参照)。特許文献1には、ストリーミング情報に収録時刻情報を予め付加しておくとともに、受信装置において放送信号の受信時刻情報を記録しておき、受信装置においてストリーミング情報の収録時刻情報と放送の受信時刻情報とが同期するようにストリーミング情報と放送信号を再生することが記載されている。
【先行技術文献】
【特許文献】
【0006】
【発明の概要】
【発明が解決しようとする課題】
【0007】
しかしながら、上記特許文献1記載の技術は、1つの放送局においてストリーミング情報および放送信号を生成して、1つの受信装置においてそれらを受信する場合にのみ適用可能な技術であり、本発明において問題としている上記のような状況については何ら考慮されていない。
【0008】
本発明は、上記のような事情に鑑みてなされたものであり、開催されるイベントに合わせて解説・実況等の音声をリアルタイム配信する場合に、ユーザーに対して音声が出力されるタイミングを適切に調整することができる配信音声遅延調整装置、配信音声遅延調整システム、および配信音声遅延調整プログラムを提供することを目的とする。
【課題を解決するための手段】
【0009】
上記目的は、下記の手段によって達成される。
【0010】
配信音声遅延調整装置は、取得部、配信部、調整部、および特定部を有する。取得部は、開催されるイベントに合わせてリアルタイム配信するための配信音声に関する配信音声情報を配信用端末から取得する。配信部は、取得部によって取得された配信音声情報を、配信音声を聴取するユーザーのユーザー端末にリアルタイムで配信可能に構成される。調整部は、配信音声情報がユーザー端末において出力されるタイミングの遅延の程度を調整する。特定部は、イベントに関する音声の発生位置と、配信音声情報を出力するユーザー端末の位置との間の距離を特定する。調整部は、特定部によって特定された距離に応じて遅延の程度を調整する。配信部は、調整部において調整された遅延の程度に応じて配信音声情報を配信する。
また、配信音声遅延調整装置は、取得部、配信部、調整部、および設定部を有する。取得部は、開催されるイベントに合わせてリアルタイム配信するための配信音声に関する配信音声情報を配信用端末から取得する。配信部は、取得部によって取得された配信音声情報を、配信音声を聴取するユーザーのユーザー端末にリアルタイムで配信可能に構成される。調整部は、配信音声情報がユーザー端末において出力されるタイミングの遅延の程度を調整する。設定部は、遅延の程度を調整するための遅延設定を受け付ける。設定部は、ユーザー端末においてユーザーから受け付けられた指示に基づいて、遅延設定を受け付ける。調整部は、設定部において受け付けられた遅延設定を考慮して、遅延の程度を調整する。配信部は、調整部において調整された遅延の程度に応じて配信音声情報を配信する。
また、配信音声遅延調整装置は、取得部、配信部、および調整部を有する。取得部は、開催されるイベントに合わせてリアルタイム配信するための配信音声に関する配信音声情報を配信用端末から取得する。取得部によって取得された配信音声情報を、配信音声を聴取するユーザーのユーザー端末にリアルタイムで配信可能に構成される。調整部は、配信音声情報がユーザー端末において出力されるタイミングの遅延の程度を調整する。配信音声は、テレビ放送されるイベントの映像に合わせてリアルタイム配信するためのものであり、映像には、当該映像に関するタイムスタンプを示すタイムスタンプ情報が表示される。調整部は、映像および配信音声を視聴するユーザーが使用するユーザー端末において、映像を撮影して解析し、当該映像に含まれるタイムスタンプ情報を取得して得られたタイムスタンプに基づいて、遅延の程度を調整する。配信部は、調整部において調整された遅延の程度に応じて配信音声情報を配信する。
また、配信音声遅延調整装置は、取得部、配信部、および調整部を有する。取得部は、開催されるイベントに合わせてリアルタイム配信するための配信音声に関する配信音声情報を配信用端末から取得する。取得部によって取得された配信音声情報を、配信音声を聴取するユーザーのユーザー端末にリアルタイムで配信可能に構成される。調整部は、配信音声情報がユーザー端末において出力されるタイミングの遅延の程度を調整する。配信音声は、テレビ放送されるイベントの映像に合わせてリアルタイム配信するためのものであり、映像に含まれる映像内音声には、当該映像に関するタイムスタンプを示すタイムスタンプ情報が含まれる。調整部は、映像および配信音声を視聴するユーザーが使用するユーザー端末において、映像内音声を取得して解析し、当該映像内音声に含まれるタイムスタンプ情報を取得して得られたタイムスタンプに基づいて、遅延の程度を調整する。配信部は、調整部において調整された遅延の程度に応じて配信音声情報を配信する。
また、配信音声遅延調整装置は、取得部、配信部、および調整部を有する。取得部は、開催されるイベントに合わせてリアルタイム配信するための配信音声に関する配信音声情報を配信用端末から取得する。配信部は、取得部によって取得された配信音声情報を、配信音声を聴取するユーザーのユーザー端末にリアルタイムで配信可能に構成される。調整部は、配信音声情報がユーザー端末において出力されるタイミングの遅延の程度を調整する。配信部は、調整部において調整された遅延の程度に応じて配信音声情報を配信するものであって、配信部は、予め用意された配信タイミングの異なる複数の配信音声情報を配信可能であり、遅延の程度に応じて、複数の配信音声情報の中から使用する配信音声情報を選択することによって、配信音声情報がユーザー端末において出力されるタイミングを調整する。
また、配信音声遅延調整装置は、取得部、配信部、および調整部を有する。取得部は、開催されるイベントに合わせてリアルタイム配信するための配信音声に関する配信音声情報を配信用端末から取得する。配信部は、取得部によって取得された配信音声情報を、配信音声を聴取するユーザーのユーザー端末にリアルタイムで配信可能に構成される。調整部は、配信音声情報がユーザー端末において出力されるタイミングの遅延の程度を調整する。取得部は、配信音声情報に基づいて配信音声をテキスト化した情報であるテキスト情報を取得する。配信部は、調整部において調整された遅延の程度に応じて配信音声情報を配信する。
【0011】
配信音声遅延調整システムは、上記の配信音声遅延調整装置と、配信される配信音声情報を受信するユーザー端末とを有する。ユーザー端末は、配信音声情報が遅延の程度に沿って出力されるように、配信音声情報の出力タイミングを調整する出力部を有する。
【0012】
配信音声遅延調整プログラムは、ステップ(a)、ステップ(a1)、ステップ(b)、およびステップ(c)をコンピューターに実行させるように構成される。ステップ(a)は、開催されるイベントに合わせてリアルタイム配信するための配信音声に関する配信音声情報を配信用端末から取得する。ステップ(a1)は、イベントに関する音声の発生位置と、配信音声情報を出力するユーザー端末の位置との間の距離を特定する。ステップ(b)は、ステップ(a)において取得された配信音声情報を、配信音声を聴取するユーザーのユーザー端末にリアルタイムで配信する。ステップ(c)は、ステップ(a1)によって特定された距離に応じて遅延の程度を調整する。ステップ(c)は、配信音声情報がユーザー端末において出力されるタイミングの遅延の程度を調整する。ステップ(b)は、ステップ(c)において調整された遅延の程度に応じて配信音声情報を配信する。
また、配信音声遅延調整プログラムは、ステップ(a)、ステップ(b)、ステップ(c)、およびステップ(c1)をコンピューターに実行させるように構成される。ステップ(a)は、ステップ(a)は、開催されるイベントに合わせてリアルタイム配信するための配信音声に関する配信音声情報を配信用端末から取得する。ステップ(b)は、ステップ(a)において取得された配信音声情報を、配信音声を聴取するユーザーのユーザー端末にリアルタイムで配信する。ステップ(c)は、配信音声情報がユーザー端末において出力されるタイミングの遅延の程度を調整する。ステップ(c1)は、ユーザー端末においてユーザーから受け付けられた指示に基づいて、遅延の程度を調整するための遅延設定を受け付ける。ステップ(c)は、ステップ(c1)によって受け付けられた遅延設定を考慮して、遅延の程度を調整する。ステップ(b)は、ステップ(c)において調整された遅延の程度に応じて配信音声情報を配信する。
【発明の効果】
【0013】
本発明の配信音声遅延調整装置によれば、開催されるイベントに合わせてリアルタイム配信するための配信音声に関する配信音声情報を配信用端末から取得して、配信音声を聴取するユーザーのユーザー端末にリアルタイムで配信する際に、配信音声情報がユーザー端末において出力されるタイミングの遅延の程度を調整し、調整された遅延の程度に応じて配信音声情報を遅延させて配信する。これにより、開催されるイベントに合わせて解説・実況等の音声をリアルタイム配信する場合に、ユーザーに対して音声が出力されるタイミングを適切に調整することができる。
【図面の簡単な説明】
【0014】
【
図1】第1実施形態に係る配信音声遅延調整装置が適用される配信音声遅延調整システムの概略構成を示す図である。
【
図2】ユーザー端末の概略構成を示すブロック図である。
【
図3】配信用端末の概略構成を示すブロック図である。
【
図4】サーバーの概略構成を示すブロック図である。
【
図5】サーバーの機能構成を示すブロック図である。
【
図6A】第1実施形態に係る配信音声遅延調整システムにおいて実行される処理の流れの一例を示すシーケンスチャートである。
【
図6B】第1実施形態に係る配信音声遅延調整システムにおいて実行される処理の流れの他の例を示すシーケンスチャートである。
【
図7】第2実施形態に係る配信音声遅延調整装置が適用される配信音声遅延調整システムの概略構成を示す図である。
【
図8】第2実施形態に係る配信音声遅延調整システムにおいて実行される処理の流れを示すシーケンスチャートである。
【
図9】変形例に係る配信音声遅延調整システムにおいて実行される処理の流れを示すシーケンスチャートである。
【発明を実施するための形態】
【0015】
以下、添付した図面を参照して、本発明の実施形態を説明する。なお、図面の説明において同一の要素には同一の符号を付し、重複する説明を省略する。また、図面の寸法比率は、説明の都合上誇張されており、実際の比率とは異なる場合がある。
【0016】
<第1実施形態>
第1実施形態においては、イベント会場でイベントを観覧するユーザーに対してリアルタイム配信される音声の遅延を調整する例について説明する。
【0017】
<システムの全体構成>
図1は、第1実施形態に係る配信音声遅延調整装置が適用される配信音声遅延調整システムの概略構成を示す図である。本実施形態の配信音声遅延調整システムは、イベント会場でイベントを観覧するユーザーのユーザー端末10にリアルタイム配信される配信音声の遅延を調整する。
【0018】
図1に示すように、配信音声遅延調整システムは、ユーザー端末10、配信用端末20、およびサーバー30から構成される。
【0019】
ユーザー端末10は、リアルタイム配信される音声を聴取するユーザーが使用するスマートフォン、タブレットPC等の情報端末である。
【0020】
配信用端末20は、音声をリアルタイム配信する配信者が使用する端末または装置である。
【0021】
サーバー30は、たとえば、配信用端末20を用いたリアルタイム配信サービスを提供する事業者によって設けられ、配信用端末20から送信された配信音声情報をユーザー端末10に配信する。サーバー30は、互いに配信タイミングが異なる複数の配信音声情報を保有し、ユーザー端末10に配信する。なお、サーバー30は、1つだけ設けられ、1つのサーバー30が配信タイミングを異ならせて配信音声情報をユーザー端末10に配信してもよい。あるいは、サーバー30は複数設けられてもよい。この場合、各サーバー30は、通信環境やネットワーク遅延が異なるように互いに隔離されて配置されてもよい。
【0022】
各構成は、ネットワークを介して接続され、有線または無線の各種通信方式によって通信可能である。以下、各構成について詳細に説明する。
【0023】
<ユーザー端末10>
図2は、ユーザー端末の概略構成を示すブロック図である。
【0024】
図2に示すように、ユーザー端末10は、制御部11、記憶部12、通信部13、操作表示部14、および音声入出力部15を備える。各構成要素は、バスを介して相互に通信可能に接続されている。
【0025】
制御部11は、CPU(Central Processing Unit)を備え、プログラムに従い、上述した各構成要素の制御や各種の演算処理を実行する。本実施形態において、制御部11は、出力部として機能する。
【0026】
記憶部12は、予め各種プログラムや各種データを記憶するROM(Read Only Memory)、作業領域として一時的にプログラムやデータを記憶するRAM(Random Access Memory)、各種プログラムや各種データを記憶するハードディスク等を備える。
【0027】
通信部13は、ネットワークを介して、他の端末や装置と通信するためのインターフェースを備える。通信部13は、たとえば、サーバー30と各種データの送受信を行う。
【0028】
操作表示部14は、たとえば、タッチパネル式のディスプレイであり、各種情報を表示すると共に、ユーザーからの各種入力を受け付ける。
【0029】
音声入出力部15は、音声を入力するためのマイクまたは音声入力端子等と、音声を出力するためのスピーカーまたは音声出力端子等によって構成される。音声入出力部15は、たとえば、サーバー30から取得された配信音声情報に対応する音声を出力したり、音声の入力を受け付けたりする。
【0030】
<配信用端末20>
図3は、配信用端末の概略構成を示すブロック図である。
【0031】
図3に示すように、配信用端末20は、制御部21、記憶部22、通信部23、操作表示部24、および音声入出力部25を備える。各構成要素は、バスを介して相互に通信可能に接続されている。
【0032】
配信用端末20の制御部21、記憶部22、通信部23、操作表示部24、および音声入出力部25は、ユーザー端末10の制御部11、記憶部12、通信部13、操作表示部14、および音声入出力部15と同様の機能を有するため、さらなる説明を省略する。配信用端末20の制御部21や音声入出力部25等の各構成は、高品質なリアルタイム音声配信を実現するため、専用の高性能な機材によって構成されうる。たとえば、配信用端末20は、高性能なマイクおよびヘッドフォンを有するヘッドセットと、マイクによって取得された音声情報をリアルタイム配信に有利な形式のデータに変換するプロセッサーと、生成されたデータを送信する通信モジュール等とをケースに一体的に収納して構成される。
【0033】
<サーバー30>
図4は、サーバーの概略構成を示すブロック図である。
【0034】
図4に示すように、サーバー30は、制御部31、記憶部32、および通信部33を備える。各構成要素は、バスを介して相互に通信可能に接続されている。本実施形態において、サーバー30は、配信音声遅延調整装置として機能する。
【0035】
サーバー30の制御部31、記憶部32、および通信部33は、ユーザー端末10の制御部11、記憶部12、および通信部13と同様の機能を有するため、さらなる説明を省略する。
【0036】
記憶部32には、配信用端末20から送信された配信音声情報が記憶される。また、記憶部32には、配信タイミングや遅延時間に関する情報も記憶される。また、記憶部32には、イベントに関する音声の発生位置である音源の位置に関する情報や、ユーザー端末10の位置に関する情報も記憶される。音源の位置に関する情報は、イベントごとに予め設定されてもよく、音源に設けた情報端末によって取得されたGPS位置情報をサーバー30に送信することによって取得されてもよい。ユーザー端末10の位置に関する情報は、たとえばユーザー端末10によって取得されたGPS位置情報をサーバー30に送信することによって取得される。上記の位置に関する情報は、たとえば緯度経度等の所定の座標系における位置に対応する座標情報として記憶される。
【0037】
<サーバー30の機能>
図5は、サーバー制御部の機能構成を示すブロック図である。
【0038】
図5に示すように、サーバー30の制御部31は、プログラムを読み込んで処理を実行することによって、取得部311、配信部312、調整部313、特定部314、および設定部315として機能する。
【0039】
取得部311は、開催されるイベントに合わせてリアルタイム配信される配信音声に関する配信音声情報を配信用端末20から取得する
配信部312は、取得部311によって取得された配信音声情報を、配信音声を聴取するユーザーのユーザー端末10にリアルタイムで配信可能に構成される。
【0040】
調整部313は、配信音声情報がユーザー端末10において出力されるタイミングの遅延の程度を調整する。
【0041】
特定部314は、イベントに関する音声の発生位置と、配信音声情報を出力するユーザー端末10の位置との間の距離を特定する。
【0042】
設定部315は、遅延の程度を調整するための遅延設定を受け付ける。
【0043】
<第1実施形態の配信音声遅延調整システムにおける処理>
図6Aは、第1実施形態に係る配信音声遅延調整システムにおいて実行される処理の流れの一例を示すシーケンスチャートである。
図6Bは、第1実施形態に係る配信音声遅延調整システムにおいて実行される処理の流れの他の例を示すシーケンスチャートである。
図6Aおよび
図6Bのシーケンスチャートに示される各構成の処理は、各構成の記憶部にプログラムとして記憶されており、各装置の制御部が各部を制御することにより実行される。
【0044】
図6Aに示すように、配信用端末20は、音声入出力部25を介して、配信者によって発せられる配信用の音声である配信音声を取得する(ステップS201)。
【0045】
続いて、配信用端末20は、ステップS201の処理において取得した配信音声に基づいて、リアルタイム配信に適した形式の配信音声情報を生成し(ステップS202)、サーバー30に送信する。
【0046】
ユーザー端末10は、操作表示部14の操作等を介してユーザーから音声配信指示を受け付け(ステップS101)、サーバー30に音声配信要求を送信する。
【0047】
サーバー30は、イベントに関する音声の発生位置である音源の位置と、ユーザー端末10の位置との間の距離を特定する(ステップS301)。サーバー30は、記憶部32に記憶されている音源の位置に関する情報とユーザー端末10の位置に関する情報に基づいて、音源の位置とユーザー端末10の位置との間の距離を算出して特定する。
【0048】
サーバー30は、ステップS301の処理において特定された音源の位置と、ユーザー端末10の位置との間の距離に応じて、配信音声情報をユーザー端末10に配信するタイミングの遅延の程度を調整する(ステップS302)。たとえば、野外イベント等において音源とユーザー端末10とが1km程度離れている場合、音源において発生する音声が、空気中を伝わってユーザーの位置に届くまでには3秒程度かかる。一方、リアルタイム配信される音声は、1秒程度の遅延でユーザー端末10に届いてしまう。この場合、サーバー30は、ユーザー端末10の位置との間の距離に応じて、配信音声情報をユーザー端末10に配信するタイミングを2秒程度遅延させるように遅延の程度を調整する。
【0049】
このとき、サーバー30は、自機の中で配信タイミングの異なる複数の配信音声情報のファイルを用意しておき、その中から適切なファイルを選択して配信してもよい。あるいは、サーバー30は、配信タイミングの異なる別のサーバー30から配信音声情報を配信させてもよい。
【0050】
サーバー30は、ステップS302の処理において遅延の程度を調整した上で、配信音声情報をユーザー端末10に送信する。サーバー30は、配信音声情報とあわせて、配信タイミングの遅延の程度を示す情報をユーザー端末10に送信する。
【0051】
ユーザー端末10は、サーバー30から送信された配信音声情報に基づいて、音声入出力部15を介して配信音声を出力する(ステップS102)。
【0052】
続いて、ユーザー端末10は、ユーザーから遅延設定を受け付けたか否かを判断する(ステップS103)。ユーザーは、ユーザー端末10から出力された配信音声を聴いて、イベントの音源から直接届く音とタイミングが合っているか否かを判断し、判断結果に応じてユーザー端末10に遅延設定(遅延時間設定)を入力する。ユーザー端末10は、たとえば遅延設定を調整するためのスライダー型のスイッチまたはボタンを操作表示部14に表示して、ユーザーからの操作を受け付けることによって遅延設定を受け付ける。
【0053】
遅延設定を受け付けていない場合(ステップS103:NO)、ユーザー端末10は、ステップS104の処理に進む。
【0054】
遅延設定を受け付けている場合(ステップS103:YES)、ユーザー端末10は、受け付けた遅延設定を示す情報をサーバー30に送信する。
【0055】
サーバー30は、ユーザー端末10から送信された遅延設定に基づいて、遅延の程度を再度調整し(ステップS303)、配信タイミングが調整された配信音声情報をユーザー端末10に送信する。このとき、サーバー30は、配信音声情報とあわせて、配信タイミングの遅延の程度を示す情報をユーザー端末10に送信する。
【0056】
続いて、ユーザー端末10は、出力タイミングの調整が必要であるか否かを判断する(ステップS104)。ユーザー端末10は、たとえばステップS103の処理において受け付けた遅延設定と、サーバー30から送信された配信音声情報の遅延の程度を示す情報に基づいて、出力タイミングの調整の要否を判断する。あるいは、ユーザー端末10は、サーバー30から送信された配信音声情報を出力して、配信音声を聴いたユーザーから出力タイミングの調整の要否に関する指示を受け付けてもよい。
【0057】
出力タイミングの調整が必要でない場合(ステップS104:NO)、ユーザー端末10は、ステップS106の処理に進む。
【0058】
出力タイミングの調整が必要である場合(ステップS104:YES)、ユーザー端末10は、サーバー30から送信された配信音声情報を出力するタイミングを調整する(ステップS105)。たとえば、ユーザー端末10は、サーバー30から送信された配信音声情報をすぐに出力せずに、所定の時間バッファリングしてから出力することによって、出力タイミングを調整する。
【0059】
続いて、ユーザー端末10は、サーバー30から送信された配信音声情報に基づいて、音声入出力部15を介して配信音声を出力する(ステップS106)。
【0060】
なお、上記のステップS103の遅延設定に関する処理と、ステップS104~S105の出力タイミングの調整に関する処理とは、あわせて実行されてもよく、あるいはいずれかの処理が択一的に実行されてもよい。たとえば、ステップS103の処理においてユーザーが配信音声を2秒遅延させたいという指示をユーザー端末10に入力した場合、ユーザー端末10は、サーバー30に対して配信タイミングを1秒遅延させるための遅延設定を送信して1秒遅延した配信音声情報を取得し、取得した配信音声情報を1秒バッファリングしてから出力してもよい。これにより、ユーザーが所望する配信音声の2秒遅延を実現できる。
【0061】
また、上記の
図6Aの例では、ステップS301の処理において、サーバー30によって音源の位置とユーザー端末10の位置との間の距離が特定される例について説明したが、当該距離はユーザー端末10によって特定されてもよい。たとえば、
図6Bに示すように、ユーザー端末10は、ステップS101の処理を実行後にサーバー30から音源の位置に関する情報の提供を受けてもよい。この場合、ユーザー端末10は、ステップS1011の処理において、サーバー30から受信した音源の位置に関する情報と自機の位置情報に基づいて、音源の位置とユーザー端末10の位置との間の距離を算出して特定し、特定した距離を示す情報をサーバー30に送信する。これにより、サーバー30は、ステップS301の処理において、ユーザー端末10から送信された情報に基づいて、音源の位置とユーザー端末10の位置との間の距離を特定して、その後の処理において遅延の程度を調整するための基準値として使用することができる。
【0062】
以上のように、本実施形態の配信音声遅延調整システムによれば、開催されるイベントに合わせてリアルタイム配信するための配信音声に関する配信音声情報を配信用端末20から取得して、配信音声を聴取するユーザーのユーザー端末10にリアルタイムで配信する際に、配信音声情報がユーザー端末10において出力されるタイミングの遅延の程度を調整し、調整された遅延の程度に応じて配信音声情報を遅延させて配信する。これにより、開催されるイベントに合わせて実況や解説等の音声をリアルタイム配信する場合に、ユーザーに対して音声が出力されるタイミングを適切に調整することができる。
【0063】
また、配信音声遅延調整装置システムによれば、イベントに関する音声の発生位置と、配信音声情報を出力するユーザー端末10の位置との間の距離を特定し、特定された距離に応じて遅延の程度を調整する。これにより、たとえば敷地の広いイベント会場でユーザーがイベントを鑑賞する際に、イベントにおいて発生した音声とリアルタイム配信される実況や解説等の音声のタイミングを適切に合わせることができる。
【0064】
<第2実施形態>
第2実施形態においては、デジタル放送によるテレビの生中継でイベントを観覧するユーザーに対してリアルタイム配信される配信音声の遅延を調整する例について説明する。
【0065】
<システムの全体構成>
図7は、第2実施形態に係る配信音声遅延調整装置が適用される配信音声遅延調整システムの概略構成を示す図である。本実施形態の配信音声遅延調整システムは、デジタル放送によるテレビの生中継でイベントを観覧するユーザーのユーザー端末10にリアルタイム配信される配信音声の遅延を調整する。
【0066】
図7に示すように、配信音声遅延調整システムは、ユーザー端末10、配信用端末20、およびサーバー30から構成される。ユーザーはテレビ40において放映される生中継の映像を視聴しつつ、ユーザー端末10に配信される配信音声を聴取する。テレビ40において放映される生中継の映像は、イベント会場内のテレビ中継用設備50によって撮影され、テレビ局システム60や電波塔等の設備を介してテレビ40に届けられる。
【0067】
この際、生中継の映像は、デジタル放送におけるエンコードおよびデコード等の影響により、イベント会場内において映像が撮影されている時刻よりも、少なくとも2~3秒程度遅延して放映される。また、遅延時間は経由するネットワークや機器、受像機のデコード性能等によっても変動する。さらに、放送局の都合等によって、テレビの生中継は数分~数十分程度遅延して放映されることもある。一方、インターネット等のネットワーク経由でユーザー端末10に配信される音声の遅延時間は1秒程度に抑えられる。
【0068】
第2実施形態の配信音声遅延調整システムに含まれるユーザー端末10、配信用端末20、およびサーバー30の構成は、第1実施形態の配信音声遅延調整システムの構成と同様であるため、さらなる説明を省略する。
【0069】
<第2実施形態の配信音声遅延調整システムにおける処理>
図8は、第2実施形態に係る配信音声遅延調整システムにおいて実行される処理の流れを示すシーケンスチャートである。
【0070】
図8に示すように、配信用端末20は、音声入出力部25を介して、配信者によって発せられる配信音声を取得する(ステップS211)。
【0071】
続いて、配信用端末20は、ステップS211の処理において取得した配信音声に基づいて、リアルタイム配信に適した形式の配信音声情報を生成し(ステップS212)、サーバー30に送信する。
【0072】
ユーザー端末10は、操作表示部14の操作等を介してユーザーから音声配信指示を受け付け(ステップS111)、サーバー30に音声配信要求を送信する。サーバー30は、ユーザー端末10からの音声配信要求に応じて、配信用端末20から受信している配信音声情報をユーザー端末10に送信する。このとき、第1実施形態と同様に、配信タイミングに関する遅延の程度の調整が行われてもよい。たとえば、通信距離に応じて通信の遅延の程度が変動するような環境においては、配信用端末20の位置とユーザー端末10の位置との間の距離を特定して、特定された距離に応じて遅延の程度が調整されてもよい。
【0073】
ユーザー端末10は、サーバー30から送信された配信音声情報に基づいて、音声入出力部15を介して配信音声を出力する(ステップS112)。
【0074】
続いて、ユーザー端末10は、遅延設定を受け付けたか否かを判断する(ステップS113)。
【0075】
たとえば、ユーザーは、ユーザー端末10から出力された配信音声を聴いて、テレビ40において放映されているイベントの映像および音声とタイミングが合っているか否かを判断し、判断結果に応じてユーザー端末10に遅延設定を入力することができる。
【0076】
あるいは、テレビ40において放映される映像に、当該映像に関するタイムスタンプを符号化してタイムスタンプ情報として含めておき、タイムスタンプ情報を含む映像がテレビ40の画面に表示されてもよい。この場合、ユーザーは、ユーザー端末10に設けられているカメラを用いて当該映像を撮影する。ユーザー端末10は、撮影した映像を解析して当該映像に含まれるタイムスタンプ情報を取得し、得られたタイムスタンプと、ユーザー端末10に保持されている時刻情報とを比較することによってテレビの映像の遅延の状況を判断する。ユーザー端末10は、遅延の状況に応じて適切な遅延設定を決定して入力として受け付けることができる。
【0077】
また、テレビ40において放映される映像に含まれる映像内音声に、当該映像に関するタイムスタンプを符号化してタイムスタンプ情報として含めておき、タイムスタンプ情報を含む音声がテレビ40のスピーカーから出力されてもよい。この場合、ユーザーは、ユーザー端末10の音声入出力部15を用いて映像内音声を取得する。ユーザー端末10は、取得した映像内音声を解析して当該映像内音声に含まれるタイムスタンプ情報を取得し、得られたタイムスタンプと、ユーザー端末10に保持されている時刻情報とを比較することによってテレビの映像の遅延の状況を判断する。ユーザー端末10は、遅延の状況に応じて適切な遅延設定を決定して入力として受け付けることができる。
【0078】
遅延設定を受け付けていない場合(ステップS113:NO)、ユーザー端末10は、ステップS114の処理に進む。
【0079】
遅延設定を受け付けている場合(ステップS113:YES)、ユーザー端末10は、受け付けた遅延設定を示す情報をサーバー30に送信する。
【0080】
このとき、配信用端末20も、配信者から遅延設定を受け付けたか否かを判断してもよい(ステップS213)。たとえば、配信者は、配信用端末20からサーバー30に音声配信要求を送信して、サーバー30から配信音声情報を取得する。そして、配信者は、音声入出力部25から出力された配信音声を聴いて、テレビにおいて放映されているイベントの映像および音声とタイミングが合っているか否かを判断し、判断結果に応じて配信用端末20に遅延設定を入力することができる。なお、上記の処理を行う主体は、配信者のみに限定されず、イベントに関わるスタッフや、配信に関わるスタッフ等が、たとえば自身が保有するスマートフォン等の情報端末とテレビを使用して行ってもよい。
【0081】
遅延設定を受け付けていない場合(ステップS213:NO)、配信用端末20は、ステップS211の処理に戻る。
【0082】
遅延設定を受け付けている場合(ステップS213:YES)、配信用端末20は、受け付けた遅延設定を示す情報をサーバー30に送信する。
【0083】
サーバー30は、ユーザー端末10および/または配信用端末20から送信された遅延設定に基づいて、遅延の程度を調整し(ステップS311)、配信タイミングが調整された配信音声情報をユーザー端末10に送信する。このとき、サーバー30は、配信音声情報とあわせて、配信タイミングの遅延の程度を示す情報をユーザー端末10に送信する。
【0084】
ステップS114~S116の各処理は、第1実施形態のステップS104~S106の各処理と同様であるため、さらなる説明を省略する。また、第1実施形態と同様に、ステップS113の遅延設定に関する処理と、ステップS114~S115の出力タイミングの調整に関する処理とは、あわせて実行されてもよく、あるいはいずれかの処理が択一的に実行されてもよい。
【0085】
ここで、配信タイミングの遅延の程度を調整して出力タイミングを調整する処理の例について具体例を挙げて説明する。
【0086】
<処理例1>
処理例1においては、1つのサーバー30において、配信タイミングが異なる複数の配信音声情報を記憶する。たとえば、サーバー30は、遅延なしの配信音声情報、配信タイミングを2秒遅延させた配信音声情報、30秒遅延させた配信音声情報、1分遅延させた配信音声情報等の複数の配信音声情報を準備する。なお、用意される配信音声情報の数や配信タイミングは上記の例に限定されない。
【0087】
サーバー30は、必要な遅延の程度に応じて、複数の配信音声情報の中から、適切な配信タイミングの配信音声情報を選択してユーザー端末10に配信する。この選択は、ユーザー端末10によって実行されてもよい。この場合、サーバー30は、保有している配信音声情報の配信タイミング(遅延時間情報)を、予めユーザー端末10に通知しておく。
【0088】
ユーザー端末10は、必要な遅延時間(遅延設定)と、配信音声情報の配信タイミングを考慮して、受信した配信音声情報を必要な時間バッファリングしてから出力する。
【0089】
たとえば、配信音声を45秒遅延させたい場合、ユーザー端末10は、サーバー30から、30秒遅延した配信音声情報を取得し、15秒バッファリングした上で出力することにより、45秒遅延させて配信音声を出力することができる。
【0090】
<処理例2>
処理例2においては、複数のサーバー30において、配信タイミングが異なる複数の配信音声情報を記憶する。たとえば、複数のサーバー30は、それぞれ通信環境やネットワーク遅延が異なるように互いに隔離されて、異なる地域に配置される。複数のサーバー30は、それぞれ、遅延なしの配信音声情報、配信タイミングを2秒遅延させた配信音声情報、30秒遅延させた配信音声情報、1分遅延させた配信音声情報等の複数の配信音声情報を用意する。なお、用意される配信音声情報の数や配信タイミングは上記の例に限定されない。
【0091】
ユーザー端末10は、上記の異なる地域に配置された複数のサーバー30に対して、テスト信号を送信し、それぞれのサーバー30からの応答を確認することによって、各サーバー30のネットワーク遅延の状況を確認する。ユーザー端末10は、必要な遅延時間(遅延設定)と、配信音声情報の配信タイミング(遅延時間情報)と、ネットワーク遅延の状況を考慮して、受信した配信音声情報を必要な時間バッファリングしてから出力する。
【0092】
たとえば、配信音声を45秒遅延させたい場合、ユーザー端末10は、各サーバー30のネットワーク遅延による配信遅延状況を確認し、ネットワーク遅延が最も少ないサーバー30(たとえばネットワーク遅延1秒とする)を選択する。この場合、ユーザー端末10は、当該サーバー30から、30秒遅延した配信音声情報を取得し、1秒のネットワーク遅延を考慮して、14秒バッファリングした上で出力することにより、45秒遅延させて配信音声を出力することができる。
【0093】
以上のように、本実施形態の配信音声遅延調整システムによれば、テレビ40において放送されるイベントの映像に合わせてリアルタイム配信するための配信音声に関して、ユーザー端末10によってテレビ40の映像に含まれるタイムスタンプ情報を取得して、得られたタイムスタンプに基づいて遅延の程度を調整する。これにより、テレビ放送で生中継されるイベントに合わせて実況や解説等の音声をリアルタイム配信する場合に、ユーザーに対して音声が出力されるタイミングを適切かつ容易に調整することができる。
【0094】
また、本実施形態の配信音声遅延調整システムによれば、テレビ40において放送されるイベントの映像に合わせてリアルタイム配信するための配信音声に関して、ユーザー端末10によってテレビ40の映像内音声に含まれるタイムスタンプ情報を取得して、得られたタイムスタンプに基づいて遅延の程度を調整する。これにより、テレビ放送で生中継されるイベントに合わせて実況や解説等の音声をリアルタイム配信する場合に、ユーザーに対して音声が出力されるタイミングを適切かつ容易に調整することができる。
【0095】
また、第1および第2実施形態の配信音声遅延調整装置システムによれば、遅延の程度を調整するための遅延設定を受け付け可能であり、受け付けられた遅延設定を考慮して、遅延の程度を調整する。これにより、より柔軟かつ適切に配信される音声のタイミングを調整することができる。
【0096】
また、第1および第2実施形態の配信音声遅延調整装置システムによれば、ユーザー端末10においてユーザーから受け付けられた指示に基づいて、遅延設定を受け付ける。これにより、実際にリアルタイム配信された音声を聴いているユーザーの感覚に合わせて配信される音声のタイミングを適切に調整することができる。
【0097】
また、第1および第2実施形態の配信音声遅延調整装置システムにおいて、サーバー30は、予め用意された配信タイミングの異なる複数の配信音声情報を配信可能であり、遅延の程度に応じて、複数の配信音声情報の中から使用する配信音声情報を選択することによって、配信音声情報がユーザー端末10において出力されるタイミングを調整する。これにより、サーバー30において、異なる配信タイミングを実現するために複雑な処理を構築する必要がなくなる。サーバー30は、予め用意された配信タイミングの異なる配信音声情報を選択するだけで配信タイミングを変更することができ、処理を簡略化して処理リソースを節約することができる。
【0098】
また、第1および第2実施形態の配信音声遅延調整装置システムにおいて、ユーザー端末10は、配信音声情報が遅延の程度に沿って出力されるように、配信音声情報の出力タイミングを調整する。これにより、ユーザー端末10においても配信音声情報の出力タイミングを調整できる。したがって、ユーザー端末10ごとに異なるネットワークの遅延の状況やユーザー端末10の処理スペック等に応じて、リアルタイム配信される音声がユーザーに対して出力されるタイミングをより適切に調整することができる。
【0099】
また、第1および第2実施形態の配信音声遅延調整装置システムにおいて、ユーザー端末10は、サーバー30から取得する配信音声情報を複数の配信音声情報の中から選択することによって、配信音声情報の出力タイミングを調整する。これにより、ユーザーは、取得する配信音声情報を選択して配信音声情報の出力タイミングを調整できる。したがって、ユーザー端末10ごとに異なるネットワークの遅延の状況やユーザー端末10の処理スペック等に応じて、リアルタイム配信される音声がユーザーに対して出力されるタイミングをより適切に調整することができる。
【0100】
また、第1および第2実施形態の配信音声遅延調整装置システムにおいて、ユーザー端末10は、受信した配信音声情報を所定の時間バッファリングすることによって配信音声情報の出力タイミングを調整する。これにより、ユーザー端末10は、必要な遅延設定および、取得する配信音声情報の配信タイミング、さらにユーザー端末10ごとに異なるネットワークの遅延の状況やユーザー端末10の処理スペック等に応じて、リアルタイム配信される音声がユーザーに対して出力されるタイミングをより適切に調整することができる。
【0101】
また、第1および第2実施形態の配信音声遅延調整装置システムにおいて、ユーザー端末10は、配信される配信音声情報の配信遅延状況を確認した上で、配信遅延状況を考慮して配信音声情報の出力タイミングを調整する。これにより、ユーザー端末10は、リアルタイム配信される音声がユーザーに対して出力されるタイミングをより適切に調整することができる。
【0102】
<変形例>
上記の各実施形態において、配信音声を取得および出力する際の周囲の環境に応じて、配信音声に加えて、音声を解析してテキスト化した情報も配信する変形例について説明する。
【0103】
<システムの全体構成>
変形例に係る配信音声遅延調整システムの構成は、第1実施形態および第2実施形態と同様であるため、さらなる説明を省略する。
【0104】
<変形例に係る配信音声遅延調整システムにおける処理>
変形例に係る配信音声遅延調整システムにおけるリアルタイム音声配信処理および配信音声遅延処理の基本的な流れは、第1実施形態および第2実施形態と同様であるため、さらなる説明を省略する。以下、周囲の状況に応じて配信音声をテキスト化した情報を配信する処理の例について詳細に説明する。
【0105】
図9は、変形例に係る配信音声遅延調整システムにおいて実行される処理の流れを示すシーケンスチャートである。
【0106】
図9に示すように、配信用端末20は、音声入出力部25を介して、配信者によって発せられる配信音声を取得するとともに、周囲の騒音レベルを取得する(ステップS221)。
【0107】
続いて、配信用端末20は、ステップS221の処理において取得した配信音声に基づいて、リアルタイム配信に適した形式の配信音声情報を生成し(ステップS222)、騒音レベルを示す情報とともにサーバー30に送信する。
【0108】
ユーザー端末10は、操作表示部14の操作等を介してユーザーから音声配信指示を受け付けるとともに、周囲の騒音レベルを取得し(ステップS121)、サーバー30に音声配信要求および騒音レベルを示す情報を送信する。
【0109】
サーバー30は、配信用端末20およびユーザー端末10から送信された騒音レベルを示す情報に基づいて、配信用端末20およびユーザー端末10の周囲の騒音レベルが所定の閾値よりも大きいか否かを判断する(ステップS321)。
【0110】
騒音レベルが所定の閾値よりも大きくない場合(ステップS321:NO)、サーバー30は、配信用端末20から送信された配信音声情報をユーザー端末10に送信する。
【0111】
騒音レベルが所定の閾値よりも大きい場合(ステップS321:YES)、サーバー30は、配信音声情報を公知の音声認識手法を用いて解析して配信音声に対応するテキスト情報を生成する(ステップS322)。テキスト情報には、配信音声の再生タイミングに対応付けてテキストを表示できるように、時間に関する情報も含まれる。
【0112】
続いて、サーバー30は、配信用端末20から送信された配信音声情報に、ステップS321の処理において生成されたテキスト情報を付加して(ステップS323)、ユーザー端末10に送信する。
【0113】
ユーザー端末10は、サーバー30から送信された配信音声情報に基づいて配信音声を出力する(ステップS112)。このとき、ユーザー端末10は、サーバー30からテキスト情報を受信している場合には、配信音声にあわせてテキスト情報を操作表示部24に表示する。
【0114】
なお、上記の実施形態においては騒音レベルに応じてテキスト情報の生成および配信の実施要否を判断する例について説明したが、これに限定されない。たとえば、ユーザーの聴覚等の都合に応じて、テキスト情報を生成して配信してもよい。あるいは、配信者およびユーザーの間で使用する言語が異なる場合に、生成したテキスト情報について公知の自動翻訳技術を用いて自動翻訳を実施し、翻訳されたテキスト情報を字幕として配信してもよい。
【0115】
以上のように、本実施形態の配信音声遅延調整システムにおいて、配信音声情報には、音声に基づいて取得されたテキスト情報が含まれる。これにより、配信音声の内容を音声によって明確に伝達しにくい状況においても、配信される内容を確実にユーザーに届けることができる。
【0116】
また、本実施形態の配信音声遅延調整システムによれば、配信用端末の周囲の騒音レベルに関する情報を取得し、騒音レベルが所定の閾値以上である場合、配信音声情報とあわせてテキスト情報を配信する。これにより、配信される音声に騒音が混ざる場合においても、ユーザーに対して配信内容を確実に伝えることができる。
【0117】
また、本実施形態の配信音声遅延調整システムによれば、ユーザー端末の周囲の騒音レベルに関する情報を取得し、騒音レベルが所定の閾値以上である場合、配信音声情報とあわせてテキスト情報を配信する。これにより、ユーザーの周囲の騒音が大きく配信される音声をユーザーが明瞭に聞き取れない場合においても、ユーザーに対して配信内容を確実に伝えることができる。
【0118】
なお、本発明は、上述した各実施形態のみに限定されるものではなく、特許請求の範囲内において、種々改変することができる。
【0119】
たとえば、上記の各実施形態では、サーバー30が配信音声遅延調整装置を構成する場合を例として説明したが、これに限定されない。たとえば、ユーザー端末10や、サーバー30以外のサーバーやコントローラー等の外部機器が、配信音声遅延調整装置の機能の一部または全部を実行してもよい。
【0120】
また、上記の各実施形態では、ユーザー端末10、配信用端末20、およびサーバー30が1つの独立した装置として構成される例について主に説明したが、装置の構成はこれに限定されない。ユーザー端末10、配信用端末20、およびサーバー30は、複数の装置から構成されてもよく、あるいは他の機能を有する装置に含まれて構成されてもよい。たとえば、サーバー30は、多数のサーバーから構成されるクラウドサーバー上に分散して構成されてもよい。あるいは、サーバー30の機能を有するアプリケーションがユーザー端末10にインストールされ、ユーザー端末10においてサーバー30の処理が実行されてもよい。
【0121】
また、上記の各実施形態では、ユーザー端末10として、ユーザーによって使用されるスマートフォン、タブレットPC等を例に挙げて説明したが、ユーザー端末10の実施態様はこれに限定されない。ユーザー端末10は、たとえばユーザーの頭部に装着される眼鏡型の情報端末や腕部に装着されるリストバンド状の情報端末等のウェアラブル端末であってもよく、あるいはユーザーの体内に埋め込まれる埋込型の情報端末等であってもよい。
【0122】
また、上記の各実施形態におけるシーケンスチャートおよびフローチャートの処理単位は、処理の理解を容易にするために、主な処理内容に応じて分割したものである。処理ステップの分類の仕方や処理の順序によって、本願発明が制限されることはない。各処理は、さらに多くの処理ステップに分割することもできる。また、1つの処理ステップが、さらに多くの処理を実行してもよく、各処理ステップの順序は本実施形態のフローチャートと異なってもよい。
【0123】
また、上記の各実施形態は、それぞれ別々の実施形態として説明したが、各実施形態の処理は、適宜組み合わせられて実行されうる。
【0124】
上述した実施形態に係るシステムにおける各種処理を行う手段および方法は、専用のハードウェア回路、またはプログラムされたコンピューターのいずれによっても実現することが可能である。上記プログラムは、たとえば、フレキシブルディスクおよびCD-ROM等のコンピューター読み取り可能な記録媒体によって提供されてもよいし、インターネット等のネットワークを介してオンラインで提供されてもよい。この場合、コンピューター読み取り可能な記録媒体に記録されたプログラムは、通常、ハードディスク等の記憶部に転送され記憶される。また、上記プログラムは、単独のアプリケーションソフトとして提供されてもよいし、システムの一機能としてその装置のソフトウエアに組み込まれてもよい。
【符号の説明】
【0125】
10 ユーザー端末、
11 制御部、
12 記憶部、
13 通信部、
14 操作表示部、
15 音声入出力部、
20 配信用端末、
21 制御部、
22 記憶部、
23 通信部、
24 操作表示部、
25 音声入出力部、
30 サーバー、
31 制御部、
311 取得部、
312 配信部、
313 調整部、
314 特定部、
315 設定部、
32 記憶部、
33 通信部、
40 テレビ、
50 テレビ中継用設備、
60 テレビ局システム。