(19)【発行国】日本国特許庁(JP)
(12)【公報種別】特許公報(B2)
(11)【特許番号】
(24)【登録日】2024-04-12
(45)【発行日】2024-04-22
(54)【発明の名称】サーバ装置
(51)【国際特許分類】
G10K 15/04 20060101AFI20240415BHJP
H04M 3/56 20060101ALI20240415BHJP
【FI】
G10K15/04 302D
H04M3/56 A
(21)【出願番号】P 2020143600
(22)【出願日】2020-08-27
【審査請求日】2023-07-27
(73)【特許権者】
【識別番号】390004710
【氏名又は名称】株式会社第一興商
(74)【代理人】
【識別番号】100111202
【氏名又は名称】北村 周彦
(74)【代理人】
【識別番号】100187562
【氏名又は名称】沼田 義成
(72)【発明者】
【氏名】執行 里恵
【審査官】堀 洋介
(56)【参考文献】
【文献】特開2015-011155(JP,A)
【文献】韓国登録特許第10-1987473(KR,B1)
【文献】特開2009-258529(JP,A)
【文献】特開2010-074199(JP,A)
(58)【調査した分野】(Int.Cl.,DB名)
G10K 15/04
H04M 3/56
(57)【特許請求の範囲】
【請求項1】
複数の端末装置と通信可能に接続され、前記複数の端末装置の間のオンライン会議を運用するサーバ装置であって、
前記オンライン会議中に各端末装置から送信された音声データを受信する受信部と、
各端末装置から受信した前記音声データに基づいて、カラオケ演奏の開始及び終了を検出する第1の検出部と、
一の端末装置の前記音声データからカラオケ演奏の開始を検出した場合に、当該一の端末装置に対して他の端末装置の前記音声データの送信を中断し、前記一の端末装置の前記音声データからカラオケ演奏の終了を検出した場合に、前記一の端末装置に対する前記他の端末装置の前記音声データの送信を再開するように制御する送信制御部と、を有することを特徴とするサーバ装置。
【請求項2】
前記第1の検出部は、前記音声データから少なくとも所定音量以上の音楽データを抽出した場合にカラオケ演奏の開始を検出することを特徴とする請求項1に記載のサーバ装置。
【請求項3】
前記一の端末装置の前記音声データからカラオケ演奏の開始を検出した場合に、当該音声データを記憶部に記憶する記憶制御部と、
前記一の端末装置の前記音声データからカラオケ演奏の開始を検出した場合に、前記他の端末装置の前記音声データに基づいてカラオケ歌唱の開始を検出する第2の検出部と、を有し、
前記記憶制御部は、前記他の端末装置の前記音声データからカラオケ歌唱の開始を検出した場合に、前記他の端末装置の前記音声データを前記一の端末装置の前記音声データに同期させて前記記憶部に記憶することを特徴とする請求項1又は2に記載のサーバ装置。
【請求項4】
前記第2の検出部は、前記一の端末装置の前記音声データ及び前記他の端末装置の前記音声データの比較結果が所定条件を満足する場合に、前記他の端末装置のカラオケ歌唱の開始を検出することを特徴とする請求項3に記載のサーバ装置。
【発明の詳細な説明】
【技術分野】
【0001】
本発明は、サーバ装置に関する。
【背景技術】
【0002】
サーバ装置には、Zoom(登録商標)等のオンライン会議アプリケーションを搭載した複数の端末装置と通信可能に接続して、複数の端末装置の間のオンライン会議を運用するものがある。換言すれば、上記のオンライン会議用のサーバ装置と複数の端末装置とからオンライン会議システムが構成され、各端末装置の利用者は、このシステムを利用することにより、直接会うことなくオンラインで会議を開催することができる。
【0003】
また最近では、感染症等の影響を懸念して、利用者が、飲食店に来店したり家に訪問したりすることなく、上記のオンライン会議システムを利用することでオンラインで飲み会を開催する、いわゆるオンライン飲み会が実施されている。オンライン飲み会では、利用者がパーソナルコンピュータや家庭用ゲーム機等に搭載されたアプリケーションを使用することで、利用者同士でオンラインでカラオケを楽しむことがある。
【0004】
また、特許文献1に記載のテレビ会議システムは、複数の異なる会議場内にそれぞれ設置されるテレビ会議端末と,各テレビ会議端末に対応して設置され、会議場内のユーザが所持する無線送信機から発信される識別コードを検知する無線受信機と、テレビ会議端末及び無線受信機とネットワークを介して接続されるテレビ会議管理装置とを備える。このテレビ会議システムでは、テレビ会議端末を会議室や自宅の書斎、カラオケ店等に設置し、利用者の無線送信機と接続することにより、複数の場所をテレビ会議により接続して遠隔パーティを実現可能にしている。
【先行技術文献】
【特許文献】
【0005】
【発明の概要】
【発明が解決しようとする課題】
【0006】
上記のようなオンライン飲み会が行われれば、利用者の外出が抑制され、感染症等の拡大を抑制することができる。オンライン会議システムでは、オンライン飲み会の中でカラオケを楽しむ機能を拡充することで、オンライン飲み会を促進することができる。
【0007】
しかしながら、オンライン飲み会でカラオケを楽しむとき、一の利用者(歌唱者)がカラオケを歌唱中に、それを聞いている他の利用者(聴衆)も一緒に歌唱する場合がある。この場合、オンライン会議システムでは、他の利用者の歌唱が歌唱者に送信され、歌唱者は他の利用者の歌唱をうるさく不快に感じるおそれがある。また、他の利用者の歌唱を禁止すると、オンライン飲み会の盛り上がりに水を差すことになる。これにより、利用者がオンライン飲み会でのカラオケを楽しむことができず、カラオケの利用が減少して、オンライン飲み会が促進されなくなるおそれもある。
【0008】
本発明の目的は、オンライン飲み会で歌唱者がカラオケを歌唱するときに他の利用者の歌唱によって生じる不快感を抑制することができるオンライン会議用のサーバ装置を提供することである。
【課題を解決するための手段】
【0009】
上記課題を解決するために、本発明のサーバ装置は、複数の端末装置と通信可能に接続され、前記複数の端末装置の間のオンライン会議を運用するサーバ装置であって、前記オンライン会議中に各端末装置から送信された音声データを受信する受信部と、各端末装置から受信した前記音声データに基づいて、カラオケ演奏の開始及び終了を検出する第1の検出部と、一の端末装置の前記音声データからカラオケ演奏の開始を検出した場合に、当該一の端末装置に対して他の端末装置の前記音声データの送信を中断し、前記一の端末装置の前記音声データからカラオケ演奏の終了を検出した場合に、前記一の端末装置に対する前記他の端末装置の前記音声データの送信を再開するように制御する送信制御部と、を有する。
【発明の効果】
【0010】
本発明によれば、オンライン飲み会で歌唱者がカラオケを歌唱するときに他の利用者の歌唱によって生じる不快感を抑制することができる。
【図面の簡単な説明】
【0011】
【
図1】本発明の第1の実施形態のサーバ装置を備えたオンライン会議システムを示すブロック図である。
【
図2】本発明の第1の実施形態のサーバ装置の音声データ送信動作を示すフローチャートである。
【
図3】本発明の第2の実施形態のサーバ装置を備えたオンライン会議システムを示すブロック図である。
【
図4】本発明の第2の実施形態のサーバ装置の音声データ送信動作を示すフローチャートである。
【発明を実施するための形態】
【0012】
(第1の実施形態)
[オンライン会議システム]
以下、本発明の第1の実施形態のオンライン会議用のサーバ装置3を備えたオンライン会議システム1について説明する。
図1は、第1の実施形態のオンライン会議システム1の構成を示すブロック図である。
図1に示すように、第1の実施形態のオンライン会議システム1は、複数の端末装置2と、オンライン会議用のサーバ装置3とを備えている。複数の端末装置2とサーバ装置3とは、インターネットや移動体通信網等のネットワーク4を介して通信可能に接続される。オンライン会議システム1で実施されるオンライン会議は、複数の端末装置2の利用者が開催するオンライン飲み会等の会合に利用可能である。
【0013】
[端末装置]
各端末装置2は、当該端末装置2の周囲の音声及び映像を入力する入力部10、ネットワーク4を介して音声及び映像を送受信する通信部11、受信した音声及び映像を出力する出力部12を備える。各端末装置2は、例えば、スマートフォン、タブレット端末、パーソナルコンピュータ等で構成される。各端末装置2は、オンライン会議を利用する利用者が保有する装置であって、Zoom(登録商標)等のオンライン会議アプリケーションを搭載(インストール)している。
【0014】
各端末装置2の入力部10は、音声を集音するマイクを内蔵し、あるいは外部機器のマイクを接続することで、音声の入力機能を実現する。また、入力部10は、映像を撮影するカメラを内蔵し、あるいは外部機器のカメラを接続することで、映像の入力機能を実現する。
【0015】
各端末装置2の通信部11は、ネットワーク4を介して通信を行うインタフェースである。各端末装置2がオンライン会議アプリケーションを起動させると、通信部11は、サーバ装置3と通信可能に接続される。このとき、各端末装置2は、例えばサーバ装置3に展開される所定の仮想的なルームに参加可能となり、当該ルームに参加している複数の端末装置2の間でオンライン会議を実行する。オンライン会議の実行中では、通信部11は、入力部10により入力した音声及び映像をそれぞれ音声データ及び映像データとしてサーバ装置3へ送信する。また、オンライン会議の実行中では、通信部11は、他の端末装置2によりサーバ装置3へ送信された音声データ及び映像データをサーバ装置3から受信する。
【0016】
各端末装置2の出力部12は、音声を出力するスピーカを内蔵し、あるいは外部機器のスピーカを接続することで、音声の出力機能を実現し、通信部11によりサーバ装置3から受信した他の端末装置2の音声データを出力する。また、出力部12は、映像を出力するディスプレイ等の表示装置を内蔵し、あるいは外部機器の表示装置を接続することで、映像の出力機能を実現し、通信部11によりサーバ装置3から受信した他の端末装置2の映像データを出力する。
【0017】
なお、各端末装置2は、カラオケ演奏を実行するカラオケ用アプリケーションを搭載(インストール)していてもよい。オンライン会議アプリケーションの実行中でも、カラオケ用アプリケーションは実行可能である。
【0018】
[サーバ装置]
サーバ装置3は、オンライン会議アプリケーションを搭載した複数の端末装置2と通信可能に接続して、各端末装置2のオンライン会議アプリケーションを通じて複数の端末装置2の間のオンライン会議を運用する装置である。サーバ装置3は、オンライン会議システム1を運営する管理者等が保有、管理する装置である。サーバ装置3は、例えば上記したように所定の仮想的なルームを展開し、当該ルームに参加している複数の端末装置2の間でオンライン会議を実行する。
【0019】
サーバ装置3は、制御部20、記憶部21及び通信部22を備える。制御部20は、CPU(Central Processing Unit)等を有して構成され、サーバ装置3を統括制御する。記憶部21は、ROM(Read Only Memory)、RAM(Random Access Memory)、HDD(Hard Disc Drive)等の記憶媒体を有して構成される。記憶部21は、サーバ装置3の各部及び各機能を制御するためのプログラムやデータを記憶し、制御部20が、記憶部21に記憶されたプログラムやデータに基づいて演算処理を実行することにより、各部及び各機能を制御する。
【0020】
通信部22は、ネットワーク4を介して通信を行うインタフェースであり、オンライン会議アプリケーションを起動させる各端末装置2と通信可能に接続される。通信部22は、各端末装置2から音声データ及び映像データを受信する受信部23として機能すると共に、受信した音声データ及び映像データを複数の端末装置2のそれぞれへ送信する送信部24として機能する。
【0021】
また、サーバ装置3の制御部20は、記憶部21に記憶されたプログラムを実行することにより、第1の検出部26、第2の検出部27、記憶制御部28及び送信制御部29として動作する。
【0022】
第1の検出部26は、オンライン会議の音声データに基づいてカラオケ演奏の開始及び終了を検出する。具体的には、第1の検出部26は、受信部23により各端末装置2から受信した音声データを解析して、各音声データから音楽データや音声キーワード等を検出する。音楽データは、各端末装置2の音声データから抽出されるカラオケ演奏音であり、例えば、楽曲の前奏区間に対応するカラオケ演奏音がカラオケ演奏開始に対応する。音声キーワードは、各端末装置2の音声データから抽出される会話音声であり、例えば、「カラオケ」、「歌う」、「演奏開始」等がカラオケ演奏開始に対応する。第1の検出部26は、検出した音楽データや音声キーワード等がカラオケ演奏開始に対応するか否かを判定してカラオケ演奏の開始を検出する。
【0023】
第1の検出部26は、各端末装置2の音声データから少なくとも所定音量以上でカラオケ演奏開始に対応する音楽データ(前奏区間に対応するカラオケ演奏音等)を検出し始めたときに、カラオケ演奏開始を検出する。ここで、所定音量とは、例えば、端末装置2を使用している利用者の会話音量と同等レベルの音量である。カラオケ演奏開始の検出後、第1の検出部26は、音楽データ又は所定音量以上の音楽データを所定時間以上検出しなくなったときに、カラオケ演奏終了を検出する。第1の検出部26は、カラオケ演奏開始からカラオケ演奏終了まではカラオケ演奏中と判定する。
【0024】
第1の検出部26は、オンライン会議を実行中の端末装置2のカラオケ用アプリケーションにより出力されるカラオケ演奏音を検出し、あるいは、この端末装置2以外の他の機器(例えば、カラオケ装置、家庭用ゲーム機、家庭用ゲーム機に接続されるテレビ、スマートフォン、タブレット端末、パーソナルコンピュータ等)のカラオケ機能により出力されるカラオケ演奏音を検出してもよい。
【0025】
なお、第1の検出部26は、記憶部21に予め記憶したデータパターンに基づいて、あるいは、外部の人工知能サーバ等によって機械学習された学習モデルに基づいて、各音声データを解析してカラオケ演奏を検出してよい。
【0026】
また、第1の検出部26は、カラオケ演奏が検出された音声データを送信した端末装置2を、歌唱者の端末装置2と判定し、その他の端末装置2を聴衆の端末装置2と判定してよい。第1の検出部26は、一人の歌唱者に対応する端末装置2又は二人以上の歌唱者に対応する端末装置2を判定してよい。また、第1の検出部26は、歌唱者に対応する一つの端末装置2又は二つ以上の端末装置2を判定してよい。
【0027】
第2の検出部27は、オンライン会議の音声データに基づいてカラオケ歌唱の開始及び終了を検出する。具体的には、第2の検出部27は、受信部23により各端末装置2から受信した音声データを解析して、各音声データから歌唱データを検出する。歌唱データは、各端末装置2の音声データから抽出されるカラオケ歌唱音である。第2の検出部27は、検出した歌唱データがカラオケ歌唱開始に対応するか否かを判定してカラオケ歌唱の開始を検出する。
【0028】
第2の検出部27は、第1の検出部26によりカラオケ演奏を検出している場合に、各端末装置2の音声データから歌唱データを検出し始めたときに、カラオケ歌唱開始を検出する。カラオケ歌唱開始の検出後、第2の検出部27は、歌唱データを所定時間以上検出しなくなったとき、又は第1の検出部26によりカラオケ演奏終了を検出したときに、カラオケ歌唱終了を検出する。第2の検出部27は、カラオケ歌唱開始からカラオケ歌唱終了まではカラオケ歌唱中と判定する。また、第2の検出部27は、各端末装置2の音声データから少なくとも所定音量以上の歌唱データを抽出した場合にカラオケ歌唱を検出してもよい。
【0029】
なお、第2の検出部27は、第1の検出部26によりカラオケ演奏が検出された歌唱者の端末装置2の音声データだけでなく、聴衆の端末装置2の音声データについても、カラオケ歌唱を検出してよい。換言すれば、第2の検出部27は、カラオケ歌唱を検出した端末装置2が、歌唱者の端末装置2であるか聴衆の端末装置2であるかを判定できる。
【0030】
また、第2の検出部27は、記憶部21に予め記憶したデータパターンに基づいて、あるいは、外部の人工知能サーバ等によって機械学習された学習モデルに基づいて、各音声データを解析してカラオケ歌唱を検出してよい。
【0031】
記憶制御部28は、オンライン会議中の複数の端末装置2から通信部22の受信部23が受信した音声データを、必要に応じて記憶部21に記憶するように制御する。また、記憶制御部28は、記憶部21に記憶した音声データを、必要に応じて削除するように制御する。
【0032】
送信制御部29は、オンライン会議中の複数の端末装置2から通信部22の受信部23が受信した音声データ及び映像データを、各端末装置2へ送信するように通信部22の送信部24を制御する。具体的には、送信制御部29は、複数の端末装置2のそれぞれの映像データを各端末装置2へ送信するように制御する。送信制御部29は、音声送信の通常モードとして、複数の端末装置2のそれぞれの音声データのうち、一の端末装置2から受信した音声データを、当該一の端末装置2へ送信せずに、他の端末装置2のみへ送信するように制御する。
【0033】
また、送信制御部29は、第1の検出部26により歌唱者の端末装置2の音声データからカラオケ演奏開始を検出している場合には、音声送信の歌唱時モードとして、聴衆の端末装置2の音声データを歌唱者の端末装置2へ送信しないように、すなわち送信中断を行うように制御する。なお、送信制御部29は、歌唱時モードでは、聴衆の端末装置2に対する音声データの送信は、通常モードと同様である。
【0034】
カラオケ演奏開始の検出後、このカラオケ演奏を検出している間は、送信制御部29は、聴衆の端末装置2の音声データについて歌唱者の端末装置2への送信中断を継続するように制御する。そして、送信制御部29は、第1の検出部26により歌唱者の端末装置2の音声データからカラオケ演奏終了を検出したとき、聴衆の端末装置2の音声データについて歌唱者の端末装置2への送信中断を解除して、歌唱者の端末装置2への送信を再開するように制御する。
【0035】
[オンライン会議における音声データ送信動作]
次に、第1の実施形態において、オンライン会議システム1のオンライン会議におけるサーバ装置3による音声データ送信動作の例について説明する。
図2は、第1の実施形態の音声データ送信動作の例を示すフローチャートである。このオンライン会議動作の例では、複数の利用者が、端末装置2A、端末装置2B、端末装置2C及び端末装置2Dを使用していて、オンライン会議システム1を利用してオンライン飲み会を開催している。
図2のフローチャートでは、サーバ装置3に加えて端末装置2Aと端末装置2B~2Dとが図示され、端末装置2B~2Dはそれぞれ同様のフローを経由する。
【0036】
オンライン飲み会において、端末装置2A~2Dは、周囲から入力した音声データをサーバ装置3へ送信している(ステップS1、S2)。
【0037】
サーバ装置3の受信部23は、端末装置2A~2Dのそれぞれから音声データを受信する(ステップS3)。
【0038】
サーバ装置3の第1の検出部26は、各端末装置2A~2Dのそれぞれの音声データに基づき、音楽データが検出されたか否かを判定して、カラオケ演奏が開始したか否かを検出する(ステップS4)。
【0039】
第1の検出部26がカラオケ演奏の開始を検出していない場合(ステップS4:NO)、サーバ装置3の送信制御部29は、通常モードとして、一の端末装置2から受信した音声データを他の端末装置2のみへ送信するように制御する。例えば、送信制御部29は、端末装置2Aに対して端末装置2B、2C、2Dの音声データを送信し、端末装置2Bに対して端末装置2A、2C、2Dの音声データを送信し、端末装置2Cに対して端末装置2A、2B、2Dの音声データを送信し、端末装置2Dに対して端末装置2A、2B、2Cの音声データを送信するように制御する(ステップS5)。
【0040】
複数の端末装置2A~2Dは、サーバ装置3から各端末装置2A~2Dの音声データを受信して、各利用者に向けて出力する(ステップS6、S7)。
【0041】
一方、第1の検出部26は、例えば、端末装置2Aの音声データから、所定音量以上でカラオケ演奏開始に対応する音楽データを検出した場合、この端末装置2A及びその利用者(歌唱者)によるカラオケ演奏の開始を検出する。また、第1の検出部26は、この端末装置2Aを歌唱者の端末装置2Aと判定すると共に、他の端末装置2B~2Dを聴衆の端末装置2B~2Dと判定する。
【0042】
このように端末装置2Aのカラオケ演奏の開始が検出された場合(ステップS4:YES)、送信制御部29は、歌唱時モードとして、歌唱者の端末装置2Aに対する聴衆の端末装置2B~2Dの音声データの送信を中断するように制御する(ステップS8)。なお、送信制御部29は、歌唱時モードでは、聴衆の端末装置2B~2Dに対する音声データの送信はそのまま維持するように制御する(ステップS9)。すなわち、送信制御部29は、端末装置2Bに対して端末装置2A、2C、2Dの音声データを送信し、端末装置2Cに対して端末装置2A、2B、2Dの音声データを送信し、端末装置2Dに対して端末装置2A、2B、2Cの音声データを送信するように制御する。
【0043】
端末装置2Aの音声データからカラオケ演奏が検出されている間、聴衆の端末装置2B~2Dは、サーバ装置3から各端末装置2A~2Dの音声データを受信して、各利用者に向けて出力する(ステップS7)。一方、歌唱者の端末装置2Aは、サーバ装置3から各端末装置2B~2Dの音声データを受信せず、出力しない。
【0044】
また、カラオケ演奏開始の検出後、第1の検出部26は、カラオケ演奏の開始が検出された歌唱者の端末装置2Aの音声データに基づき、音楽データを検出しなくなったか否かを判定して、カラオケ演奏が終了したか否かを検出する(ステップS4)。
【0045】
第1の検出部26がカラオケ演奏の終了を検出していない場合(ステップS4:YES)、送信制御部29は、歌唱時モードを維持し、歌唱者の端末装置2Aに対する音声データの送信中断を維持するように制御する(ステップS8)。
【0046】
一方、第1の検出部26がカラオケ演奏の終了を検出した場合(ステップS4:NO)、送信制御部29は、歌唱時モードから通常モードへと戻して、歌唱者の端末装置2Aに対する音声データの送信を中断前の状態に戻して聴衆の端末装置2B~2Dの音声データを送信するように制御する(ステップS5)。なお、送信制御部29は、歌唱者の端末装置2Aが歌唱時モードであっても、聴衆の端末装置2B~2Dに対する音声データの送信はそのまま維持するように制御する(ステップS5)。
【0047】
端末装置2Aのカラオケ演奏の開始を検出してからカラオケ演奏を検出しなくなり、すなわち、端末装置2Aのカラオケ演奏の終了を検出した後、複数の端末装置2A~2Dは、サーバ装置3から各端末装置2A~2Dの音声データを受信して、各利用者に向けて出力する(ステップS6、S7)。
【0048】
なお、上記の第1の実施形態では、送信制御部29は、第1の検出部26により歌唱者の端末装置2の音声データからカラオケ演奏を検出したときに、歌唱時モードとして、歌唱者の端末装置2に対する聴衆の端末装置2の音声データの送信を中断する例を説明したが、本発明はこの例に限定されない。例えば、他の実施形態では、送信制御部29は、第1の検出部26により歌唱者の端末装置2の音声データからカラオケ演奏を検出すると共に、第2の検出部27により歌唱者の端末装置2の音声データからカラオケ歌唱を検出している間に、歌唱時モードとして、歌唱者の端末装置2に対する聴衆の端末装置2の音声データの送信を中断するようにしてもよい。
【0049】
あるいは、他の実施形態では、送信制御部29は、第2の検出部27により聴衆の端末装置2の音声データからカラオケ歌唱を検出している場合に、歌唱時モードとして、全ての聴衆の端末装置2の音声データ又はカラオケ歌唱を検出した聴衆の端末装置2の音声データの送信を中断するようにしてもよい。
【0050】
上記したように、本発明の第1の実施形態のサーバ装置3は、各端末装置2から受信した音声データに基づいて、カラオケ演奏の開始及び終了を検出する第1の検出部26と、一の端末装置2の音声データからカラオケ演奏の開始を検出した場合に、当該一の端末装置2(すなわち、歌唱者の端末装置2)に対して他の端末装置2(すなわち、聴衆の端末装置2)の音声データの送信を中断し、一の端末装置2の音声データからカラオケ演奏の終了を検出した場合に、一の端末装置2に対する他の端末装置2の音声データの送信を再開するように制御する送信制御部29と、を有する。
【0051】
これにより、複数の端末装置2のオンライン飲み会において、カラオケ演奏が音声データに含まれる端末装置2を歌唱者の端末装置2として認識することができる。そして、歌唱者がカラオケ演奏を開始して歌唱をしている間、歌唱者の端末装置2へは、聴衆の端末装置2の音声データが送信されない。そのため、歌唱者が流したカラオケ演奏に合わせて、聴衆が歌唱を行った場合でも、聴衆の歌唱は、歌唱者の端末装置2で出力されることがないので、歌唱者は、聴衆の歌唱をうるさく不快に感じることがないので、オンライン飲み会でのカラオケをより楽しむことができる。
【0052】
このように、本発明のサーバ装置3は、オンライン飲み会で歌唱者がカラオケを歌唱するときに他の利用者の歌唱によって生じる不快感を抑制することができる。また、聴衆は歌唱者を邪魔することがなく歌唱者のカラオケに乗じることができ、歌唱を禁止されないのでオンライン飲み会の盛り上がりに水を差すことがなく、オンライン飲み会でのカラオケをより楽しむことができる。従って、オンライン飲み会でのカラオケの利用を促進して、オンライン飲み会を促進することができる。
【0053】
また、上記したように、第1の実施形態において、第1の検出部26は、音声データから少なくとも所定音量以上の音楽データを抽出した場合にカラオケ演奏の開始を検出する。これにより、端末装置2の周囲でカラオケ歌唱を目的として流れるカラオケ演奏と、カラオケ歌唱を目的としていないBGMやテレビ等の音楽とを識別することができる。従って、不用意に音声データの送信が中断されることを抑制することができる。
【0054】
(第2の実施形態)
以下、本発明の第2の実施形態のオンライン会議用のサーバ装置3を備えたオンライン会議システム1について説明する。
図3は、第2の実施形態のオンライン会議システム1の構成を示すブロック図である。
図3に示すように、第2の実施形態のオンライン会議システム1は、第1の実施形態のオンライン会議システム1と同様に、複数の端末装置2と、オンライン会議用のサーバ装置3とを備えている。第2の実施形態の説明において、第1の実施形態と同一の構成要素には第1の実施形態と同一の符号を付し、その説明を省略する。
【0055】
第2の実施形態のサーバ装置3は、制御部20、記憶部21及び通信部22を備える。制御部20は、記憶部21に記憶されたプログラムを実行することにより、第1の検出部26、第2の検出部27、記憶制御部28及び送信制御部29に加えて、再生制御部30として動作する。第2の実施形態において、制御部20は、歌唱者の音楽データ及び歌唱データと聴衆の歌唱データとを同期して記憶するように各部を制御する。
【0056】
第2の実施形態の第2の検出部27は、上記した同期記憶を行う前提として、第1の検出部26により一の端末装置2(すなわち、歌唱者の端末装置2)の音声データからカラオケ演奏の開始を検出すると共に、第2の検出部27により一の端末装置2の音声データからカラオケ歌唱の開始を検出した場合に、他の端末装置2(すなわち、聴衆の端末装置2)の音声データに基づいて聴衆のカラオケ歌唱の開始を検出する。すなわち、第2の検出部27は、オンライン飲み会において歌唱者がカラオケ演奏の下でカラオケ歌唱を行っている場合、上記した同期記憶を行うために、聴衆のカラオケ歌唱を識別して検出する。
【0057】
このとき、第2の検出部27は、歌唱者の端末装置2の音声データからカラオケ演奏が検出されている間、聴衆の端末装置2の音声データから検出される歌唱データを、全てカラオケ歌唱として検出してよい。あるいは、第2の検出部27は、聴衆の端末装置2の音声データから検出される歌唱データが所定音量以上の場合に、その歌唱データをカラオケ歌唱として検出してもよい。
【0058】
特に、第2の検出部27は、歌唱者の端末装置2の音声データ及び聴衆の端末装置2の音声データの比較結果が所定条件を満足する場合に、聴衆の端末装置2のカラオケ歌唱の開始を検出するようにしてもよい。第2の検出部27は、歌唱者の端末装置2の音声データに含まれる音楽データ(すなわち、カラオケ演奏音)及び歌唱データと、聴衆の端末装置2の音声データに含まれる歌唱データとを比較する。このとき、第2の検出部27は、同じ演奏区間(歌唱区間)を比較するように、歌唱者の音楽データ及び歌唱データと聴衆の歌唱データを取得する。
【0059】
第2の検出部27は、例えば、歌唱者の音楽データ及び歌唱データからリズム及び音程を抽出すると共に、聴衆の歌唱データからリズム及び音程を抽出して、歌唱者のリズム及び音程と、聴衆のリズム及び音程とを比較する。そして、第2の検出部27は、歌唱者のリズム及び音程と、聴衆のリズム及び音程とのマッチング率を算出し、マッチング率が所定閾値(例えば、80%)以上の場合に、所定条件を満足すると判定するとよい。なお、第2の検出部27は、マッチング等の比較判定を行った歌唱データの開始時点にさかのぼって、聴衆の端末装置2のカラオケ歌唱の開始を検出するとよい。
【0060】
第2の実施形態の記憶制御部28は、上記した同期記憶を行う前提として、第1の検出部26により歌唱者の端末装置2の音声データからカラオケ演奏の開始を検出した場合に、歌唱者の端末装置2の音声データを記憶部21に記憶する。このとき、記憶制御部28は、第1の検出部26により歌唱者の端末装置2の音声データからカラオケ演奏の終了を検出するまで、歌唱者の端末装置2の音声データを記憶部21に記憶する。すなわち、記憶制御部28は、カラオケ演奏の開始から終了まで、カラオケ演奏の音楽データ及びカラオケ歌唱の歌唱データを記憶部21に記憶する。
【0061】
なお、記憶制御部28は、常時、端末装置2の音声データを一時的に記憶していて、カラオケ演奏の開始が検出された歌唱者の端末装置2の音声データを演奏開始時点(例えば、前奏区間の開始時点)にさかのぼって記憶部21に記憶するとよい。
【0062】
また、記憶制御部28は、第1の検出部26及び第2の検出部27により歌唱者の端末装置2の音声データからカラオケ演奏及びカラオケ歌唱を検出している場合であって、第2の検出部27により聴衆の端末装置2の音声データからカラオケ歌唱の開始を検出した場合に、聴衆の端末装置2の音声データを記憶部21に記憶する。
【0063】
なお、記憶制御部28は、常時、端末装置2の音声データを一時的に記憶していて、カラオケ歌唱の開始が検出された聴衆の端末装置2の音声データを歌唱開始時点にさかのぼって記憶部21に記憶するとよい。
【0064】
特に、記憶制御部28は、同じカラオケ演奏での歌唱者の端末装置2の音声データと聴衆の端末装置2の音声データとを同期して同期歌唱データとして記憶部21に記憶する。換言すれば、記憶制御部28は、第2の検出部27により歌唱者の端末装置2の音声データ及び聴衆の端末装置2の音声データの比較結果が所定条件を満足すると判定した場合に、歌唱者の端末装置2の音声データと聴衆の端末装置2の音声データとを同期して記憶部21に記憶する。
【0065】
記憶制御部28は、歌唱者の端末装置2の音声データと聴衆の端末装置2の音声データとを関連付けて同時再生できるように同期して処理される同期歌唱データとしてもよく、あるいは、歌唱者の端末装置2の音声データと聴衆の端末装置2の音声データとを合成して同期して生成される同期歌唱データとしてもよい。
【0066】
なお、記憶制御部28は、第2の検出部27による比較結果が所定条件を満足する時間が比較的短い場合には、同期記憶を行わず、一方、所定時間以上満足している場合には、同期歌唱データの記憶を行うようにしてもよい。
【0067】
記憶制御部28は、例えば、歌唱者の端末装置2の歌唱データの開始時点に、聴衆の端末装置2の歌唱データの開始時点を合わせるように、両音声データを同期して記憶部21に記憶するとよい。このとき、記憶制御部28は、第2の検出部27によるカラオケ歌唱の開始の検出時点や、端末装置2での音声データの入力時点や、端末装置2の音声データのサーバ装置3での受信時点を参照して、歌唱データの開始時点を取得してもよい。
【0068】
ところで、歌唱者は、カラオケ演奏を直接的に聴いているため、カラオケ演奏のリズムに対して遅延時間なくカラオケ歌唱していると解される。一方、聴衆は、カラオケ演奏の音声データが歌唱者の端末装置2からサーバ装置3へ送信された後、サーバ装置3から聴衆の端末装置2へ送信されてから、聴衆の端末装置2から出力されるカラオケ演奏を聴いてカラオケ歌唱することになる。そのため、歌唱者に比べて、聴衆がカラオケ演奏を聴くまでには、少なくとも歌唱者の端末装置2からサーバ装置3への送信時間とサーバ装置3から聴衆の端末装置2への送信時間とに相当する遅延時間が発生することになる。
【0069】
すなわち、サーバ装置3では、歌唱者の端末装置2から送信される音楽データ及び歌唱データに比べて、聴衆の歌唱者の端末装置2から送信される歌唱データは、この遅延時間だけ遅れて受信される。従って、第2の検出部27は、歌唱者の音楽データ及び歌唱データのリズムと、聴衆の歌唱データのリズムとを比較する場合、この遅延時間を取り除いて行うとよい。また、記憶制御部28は、第2の検出部27によるカラオケ歌唱の開始の検出時点や、端末装置2の音声データのサーバ装置3での受信時点を同期記憶のために判定する場合、この遅延時間を取り除いて行うとよい。
【0070】
再生制御部30は、記憶制御部28により記憶部21に記憶した同期歌唱データの再生を制御する。具体的には、再生制御部30は、歌唱者の端末装置2に表示させるオンライン会議アプリケーションの表示画面に、同期歌唱データの再生要求ボタン等の操作キーを表示する。なお、複数の同期歌唱データが記憶部21に記憶されている場合、再生要求ボタンは、同期歌唱データを選択可能にしてよい。歌唱者の端末装置2は、再生要求ボタンの操作に応じて再生要求をサーバ装置3へ送信し、サーバ装置3は、歌唱者の端末装置2から再生要求を受信する。
【0071】
再生制御部30は、同期歌唱データが記憶されたオンライン会議中(オンライン飲み会中)に再生要求を受信すると、同期歌唱データを全ての端末装置2に送信する。この場合、通常モードの送信制御部29は、オンライン会議中の複数の端末装置2のそれぞれの音声データを、各端末装置2へ送信している。そのため、各端末装置2は、オンライン会議中の音声データと同期歌唱データとを受信して合わせて出力部12で出力する。
【0072】
一方、再生制御部30は、オンライン会議終了後に再生要求を受信すると、同期歌唱データを歌唱者の端末装置2のみに送信する。そのため、歌唱者の端末装置2のみが、同期歌唱データを受信して出力部12で出力する。
【0073】
第2の実施形態において、オンライン会議システム1のオンライン会議におけるサーバ装置3による音声データ送信動作の例について説明する。
図4は、第2の実施形態の音声データ送信動作の例を示すフローチャートである。
【0074】
第2の実施形態の音声データ送信動作は、第1の実施形態の音声データ送信動作と同様に進行し、第1の実施形態の音声データ送信動作との相違点は、サーバ装置3において第2の検出部27及び記憶制御部28による同期記憶フロー(ステップS11~S)を含むことである。
【0075】
同期記憶フローでは、先ず、第1の検出部26により端末装置2Aのカラオケ演奏の開始が検出された場合(ステップS4:YES)、記憶制御部28は、歌唱者の端末装置2Aの音声データを記憶部21に記憶する(ステップS11)。また、第2の検出部27が、聴衆の端末装置2B~2Dの音声データに基づいて、例えば、端末装置2Bの聴衆の音声データから歌唱データを検出すると(ステップS12:YES)、記憶制御部28は、歌唱者の端末装置2Aの音声データと聴衆の端末装置2Bの音声データとを同期して同期歌唱データとして記憶部21に記憶する(ステップS13)。
【0076】
なお、第1の検出部26が端末装置2Aのカラオケ演奏の開始を検出してからカラオケ演奏を検出しなくなり、すなわち、カラオケ演奏の終了を検出した場合(ステップS4:NO)、記憶制御部28は同期記憶を終了する(ステップS14)。
【0077】
上記したように、本発明の第2の実施形態のサーバ装置3は、一の端末装置2(歌唱者の端末装置2)の音声データからカラオケ演奏の開始を検出した場合に、当該音声データを記憶部21に記憶する記憶制御部28と、一の端末装置2の音声データからカラオケ演奏の開始を検出した場合に、他の端末装置2(聴衆の端末装置2)の音声データに基づいてカラオケ歌唱の開始を検出する第2の検出部27と、を有する。記憶制御部28は、他の端末装置2の音声データからカラオケ歌唱の開始を検出した場合に、他の端末装置2の音声データを一の端末装置2の音声データに同期させて記憶部21に記憶する。
【0078】
これにより、サーバ装置3は、歌唱者がカラオケ歌唱を行っている間に、聴衆の歌唱を歌唱者へ出力していない場合でも、歌唱者は、カラオケ歌唱の終了後等に、歌唱者と聴衆とのカラオケ歌唱の同期記憶データを再生することが可能となる。カラオケ演奏の終了後であれば、聴衆の歌唱が、歌唱者の歌唱を邪魔することなく、歌唱者はうるさく不快に感じることもない。また、歌唱者の歌唱に対する聴衆の歌唱にハモリが入っていた場合等、歌唱者又は聴衆がカラオケ歌唱の確認を所望することがあり、オンライン飲み会では、同期記憶データの再生を所望する場合がある。このように、歌唱者及び聴衆のカラオケ歌唱の同期記憶データは、カラオケの盛り上がりを高め、カラオケの利用を促進し、更にオンライン飲み会の盛り上がりを高めることができる。
【0079】
また、上記したように、第2の実施形態において、第2の検出部27は、一の端末装置2の音声データ及び他の端末装置2の音声データの比較結果が所定条件を満足する場合に、他の端末装置2のカラオケ歌唱の開始を検出する。これにより、聴衆の音声データのうちで、歌唱者のカラオケ歌唱と同時に聴きたいものだけを、カラオケ歌唱と認識して同期記憶させることができる。例えば、歌唱者のカラオケ歌唱に関係のない音楽や邪魔になる音楽等は、同期記憶から除外することができ、カラオケの盛り上がりに関係のある音楽だけを同期記憶させることができる。
【0080】
また、本実施形態では、各端末装置2がオンライン会議アプリケーションを使用することで、サーバ装置3で展開されるオンライン会議に参加する例を説明したが、端末装置2は、オンライン会議アプリケーションに限らず、ブラウザやその他のプログラムやソフトウェアによってオンライン会議に参加してもよい。
【0081】
また、本発明は、請求の範囲及び明細書全体から読み取ることのできる発明の要旨又は思想に反しない範囲で適宜変更可能であり、そのような変更を伴うサーバ装置もまた本発明の技術思想に含まれる。
【符号の説明】
【0082】
1 オンライン会議システム
2 端末装置
3 サーバ装置
4 ネットワーク
10 入力部
11 通信部
12 出力部
20 制御部
21 記憶部
22 通信部
23 受信部
24 送信部
26 第1の検出部
27 第2の検出部
28 記憶制御部
29 送信制御部
30 再生制御部