【文献】
おうちカラオケ カラオケ@DAM for WEB,日本,株式会社第一興商,2021年 5月12日,インターネット<https://www.clubdam.com/app/karaokeAtDam/forweb/index.html?this_display_date=2021-04-28&last_display_date=2021-04-21>
(58)【調査した分野】(Int.Cl.,DB名)
Webブラウザプログラムは、オーディオエンジンプログラムにおける楽曲音声の再生位置に基づき、楽曲情報中の少なくとも歌詞表示について、その再生位置を調整して表示部に表示させることを特徴とする
請求項1に記載のカラオケシステム。
オーディオエンジンプログラムは、マイクロホンから入力されるマイク音声、もしくは、マイク音声の特性を、所定のプロトコルとは異なるプロトコルを使用して、Webブラウザプログラムに送信し、
Webブラウザプログラムは、受信したマイク音声、もしくは、マイク音声の特性に基づいて歌唱評価処理を行うことを特徴とする
請求項1または請求項2に記載のカラオケシステム。
【発明の概要】
【発明が解決しようとする課題】
【0004】
ところで、現在、カラオケ装置の新規開発にあたっては、既存のカラオケ装置に基づいて行われることが一般的である。しかしながら、新規開発において既存のカラオケ装置をベースとした新たなプログラムの開発、修正には、労力、コスト、時間を伴うものとなっている。特に、ベースとなった既存のカラオケ装置において、初期開発から年月が経っている場合には、労力、コスト、時間の負担はますます増加することが考えられる。
【0005】
特許文献1には、携帯電話機をカラオケ選曲リモコン装置として使用することのできる携帯電話機の応用プログラムが開示されている。この携帯電話機の応用プログラムは、携帯電話機に搭載されたブラウザを使用してカラオケ選曲を行うことを可能としている。
【0006】
特許文献1にみられるように、携帯電話機等の情報処理装置に搭載されたブラウザは、汎用的なプログラムであって、各種情報の閲覧には適したものである。現在、ブラウザは、Youtube(登録商標)でよく知られるように音声再生機能や動画再生機能も有しており、文字、静止画以外の情報も容易に扱うことが可能となっている。
【0007】
出願人は、カラオケ装置においても、情報処理で使用されるWebブラウザ(ブラウザ)を使用することで、カラオケ装置の開発にかかる各種負担を削減することを検討している。しかしながら、Webブラウザは、カラオケの機能に特化されたものでは無い。カラオケでは、演奏に伴って順次モニタに表示される歌詞を見ながら歌唱者がマイクロホンで歌い、入力される歌唱音を演奏とミキシングしてスピーカで放音することが通常である。このカラオケにおける基本機能をWebブラウザで実現した場合、音声信号を入力してスピーカで放音する処理に時間がかかってしまうことが分かった。このような状況では、自分の発した声がスピーカから遅れてきこえてしまう等、カラオケ装置での歌唱における致命的な欠点となってしまうことが考えられる。
【0008】
本発明は、このような課題を考慮したものであって、各種情報処理装置で使用されるWebブラウザを使用することで新規開発における各種負担を削減するとともに、Webブラウザを使用した場合においても、スピーカから放音される音声信号の遅延を抑えて、快適に歌唱することができるカラオケシステム、並びに、カラオケ用プログラムを提供することを目的としている。
【課題を解決するための手段】
【0009】
そのため本発明に係るカラオケシステムは、以下の構成を採用したことを特徴としている。
Webブラウザプログラムと、オーディオエンジンプログラムと、を備えたカラオケシステムであって、
Webブラウザプログラムは、所定のプロトコルを使用してオーディオエンジンプログラムと通信を可能とし、カラオケシステムの内部、あるいは、外部に設けられたサーバから楽曲情報を受信し、受信した楽曲情報に基づいて再生を実行し、再生された楽曲音声をオーディオエンジンプログラムに出力し、
オーディオエンジンプログラムは、マイクロホンから入力されるマイク音声を加工した後、Webブラウザプログラムから受信した楽曲音声をミキシングしてスピーカに出力
し、
Webブラウザプログラムは、オーディオエンジンプログラムに対して、マイク音声の加工に関するパラメータを送信し、
オーディオエンジンプログラムは、受信したパラメータに基づいてマイク音声を加工することを特徴とする。
【0010】
さらに本発明に係るカラオケシステムにおいて、
Webブラウザプログラムは、オーディオエンジンプログラムにおける楽曲音声の再生位置に基づき、楽曲情報中の少なくとも歌詞表示について、その再生位置を調整して表示部に表示させることを特徴とする。
【0012】
さらに本発明に係るカラオケシステムにおいて、
オーディオエンジンプログラムは、マイクロホンから入力されるマイク音声、もしくは、マイク音声の特性を、所定のプロトコルとは異なるプロトコルを使用して、Webブラウザプログラムに送信し、
Webブラウザプログラムは、受信したマイク音声、もしくは、マイク音声の特性に基づいて歌唱評価処理を行うことを特徴とする。
【0013】
さらに本発明に係るカラオケシステムにおいて、
Webブラウザプログラムは、第1の情報処理装置で実行され、
オーディオエンジンプログラムは、第2の情報処理装置で実行されることを特徴とする。
【0014】
また本発明に係るカラオケ用プログラムは、
カラオケシステムにおいて実行されるWebブラウザプログラムと連携して実行されるカラオケ用プログラムであって、
Webブラウザプログラムは、所定のプロトコルを使用してオーディオエンジンプログラムと通信を可能とし、カラオケシステムの内部、あるいは、外部に設けられたサーバから楽曲情報を受信し、受信した楽曲情報に基づいて演奏を実行し、楽曲音声をオーディオエンジンプログラムに出力し、
オーディオエンジンプログラムは、マイクロホンから入力されるマイク音声を加工した後、Webブラウザプログラムから受信した楽曲音声をミキシングしてスピーカに出力
し、
Webブラウザプログラムは、オーディオエンジンプログラムに対して、マイク音声の加工に関するパラメータを送信し、
オーディオエンジンプログラムは、受信したパラメータに基づいてマイク音声を加工することを特徴とする。
【発明の効果】
【0015】
本発明に係るカラオケシステム、及び、カラオケ用プログラムによれば、情報処理装置で使用されるWebブラウザプログラムを少なくとも楽曲情報の再生に使用し、マイクロホンから入力されるマイク音声の処理には、Webブラウザプログラムとは異なるオーディオエンジンプログラムを使用することとしている。このような構成により、カラオケシステムの新規開発における各種負担を削減するとともに、Webブラウザプログラムを使用した場合においても、スピーカから放音されるマイク音声信号の遅延を抑えて、快適に歌唱することを可能としている。また、Webブラウザプログラムは、所定のプロトコルを使用して通信を行うため、例えば、HTTPプロトコルのように汎用性のあるプロトコルを使用した場合、Webブラウザプログラム、あるいは、オーディオエンジンプログラムの開発、修正を容易にすることが可能となる。また、既存のWebサービスとの親和性も容易であるため、既存のWebサービスと連携を取ったカラオケ機能を構築することも容易となる。
【0016】
さらに、本発明に係るカラオケシステム、及び、カラオケ用プログラムによれば、オーディオエンジンプログラムにおける楽曲音声の再生位置に基づき、楽曲情報中の少なくとも歌詞表示について、その再生位置を調整して表示部に表示させることとしている。このような構成により、オーディオエンジンプログラムにおける楽曲音声と、Webブラウザプログラムにおける歌詞表示との間におけるずれを抑制し、ユーザに対して適切な歌唱位置を通知することが可能となる。
【0017】
さらに、本発明に係るカラオケシステム、及び、カラオケ用プログラムによれば、Webブラウザプログラムから出力されるパラメータでオーディオエンジンプログラムを制御することが可能となり、例えば、Webブラウザプログラムでユーザインターフェイスを実現して受け付けたパラメータでマイク音声の加工を制御することが可能となる。
【0018】
さらに、本発明に係るカラオケシステム、及び、カラオケ用プログラムによれば、オーディオエンジンプログラムからマイク音声、もしくは、マイク音声の特性をWebブラウザプログラムに送信することで、歌唱採点等の歌唱評価、並びに、歌唱評価の出力表示をWebブラウザプログラムで行うことが可能となる。その際、所定のプロトコルとは異なるプロトコルを使用することで、Webブラウザプログラムからオーディオエンジンプログラムに楽曲音声を送信する通信に対する遅延などの支障を抑制することも可能となる。
【0019】
さらに、本発明に係るカラオケシステム、及び、カラオケ用プログラムによれば、Webブラウザプログラムは、第1の情報処理装置で実行され、オーディオエンジンプログラムは、第2の情報処理装置で実行されることとしている。このような構成により、カラオケシステムを異なる情報処理装置で実現することが可能となる。
【発明を実施するための形態】
【0021】
図1は、本実施形態のカラオケシステムの構成を示す図であって、特に、カラオケ装置1については、そのハードウェア構成を示している。本実施形態におけるカラオケシステムは、ハードウェア構成として、カラオケ装置1、表示部31、マイクロホン32、スピーカ33、ルータ34、外部サーバ4を有して構成されている。
【0022】
本実施形態のカラオケ装置1は、一般的なパーソナルコンピュータを使用することが可能であって、制御部としてのCPU11、RAM12、記憶部13、画像処理部15、音響処理部16を有して構成されている。記憶部13には、カラオケ装置1でカラオケ機能を実現するためのWebブラウザプログラム、オーディオエンジンプログラムが記憶されている。CPU11は、これらプログラムを読み出してRAM12に展開し、処理を実行することで楽曲の演奏に合わせて歌唱を行うことを可能とするカラオケ機能を実現する。画像処理部15は、ユーザに対して視覚的な情報を表示部31に表示する機能を有する。音響処理部16は、マイクロホン32から入力される歌唱音声の入力、歌唱音声、再生された楽曲音声をスピーカ33から放音する機能を有している。
【0023】
カラオケ装置1は、ユーザからの各種操作を受け付ける入力部14、そして、外部サーバ4と通信するための通信部17を有して構成されている。本実施形態のカラオケ装置1は、カラオケ店舗、あるいは、個人宅に設置されたルータ34、インターネット回線等の通信網を介して外部サーバ4と通信を行う。カラオケ装置1は、通信部17による通信機能を使用して、外部サーバ4に蓄積されている楽曲情報を受信し、再生することでカラオケ機能を実現する。本実施形態では、外部サーバ4からカラオケ装置1に対して、ストリーミングにより楽曲情報を配信しているが、このような配信形態のみならず、外部サーバ4から配信された楽曲情報をカラオケ装置1に蓄積して再生する配信形態を採用してもよい。
【0024】
図2は、
図1と同様、本実施形態のカラオケシステムの構成を示す図であって、カラオケ装置1については、
図1ではハードウェア構成を示していたのに対し、
図2では、ソフトウェア構成を示している点において異なっている。
図1のカラオケ装置1において、カラオケ機能を実現する場合、カラオケ装置1のCPU11は、記憶部13からローカルWebサーバプログラム21、Webブラウザプログラム22、オーディオエンジンプログラム23を読み出して、それぞれのプログラムの処理を実行する。なお、以下の説明では、ローカルWebサーバプログラム21、Webブラウザプログラム22、オーディオエンジンプログラム23について、末尾に記載するプログラムを省略し、ローカルWebサーバ21、Webブラウザ22、オーディオエンジン23と呼ぶことにする。
【0025】
Webブラウザ22は、各種OSに実装され、インターネットブラウザ等として機能する一般的なプログラムである。従来のカラオケ装置では、オリジナルのプログラムを使用することが一般的であった。したがって、カラオケ装置を新規開発するには、このようなオリジナルのプログラムをベースとして開発を進めることとなり、その開発、修正には、労力、コスト、時間を伴うものとなっていた。本実施形態のカラオケ装置1は、このような状況を課題として開発されたものであり、カラオケ機能を実現するための各種処理(操作UI処理、カラオケ再生処理、歌詞表示処理、採点処理)を、各種情報処理装置において一般的に実装、使用されているWebブラウザ22を使用している。なお、既存のWebブラウザ22において、上述するカラオケ機能を実現するための各種処理が困難である場合には、Webブラウザ22で機能するアドオンプログラムを付加することで処理を実現することが可能である。
【0026】
このようにカラオケ機能を実現するためWebブラウザ22を使用することで、以下に示すメリットを得ることが可能となる。第1のメリットとしては、Webブラウザ22が、その広く一般的に使用される汎用性により、カラオケ機能を実現するための各種プログラムの開発、修正が容易になる。第2のメリットとしては、Webブラウザ22は、汎用性のあるプロトコル(本実施形態ではHTTPを使用)で通信することで、他のプログラム、他の構成との通信を容易に行う、あるいは、その通信環境の開発が容易になる。また、第3のメリットとしては、インターネットの閲覧に使用されるWebブラウザ22を使用することで、既存のWebサービスと連携したカラオケ機能を容易に実現することが可能となる。
【0027】
ローカルWebサーバ21は、上述するWebブラウザ22のメリットを活かすため、HTTPプロトコルを使用して、Webブラウザ22との通信を行う。なお、このローカルWebサーバ21は、必ずしも設ける必要は無いが、ローカルWebサーバ21を設けることで、外部サーバ4との通信時におけるキャッシュ機能を実現することが可能となる。また、カラオケ装置1を外部サーバ4と接続しない構成(スタンドアロン構成)として使用する場合において、そのキャッシュ機能により、見かけ上、外部サーバ4を有する場合と同じように使用することが可能となる。したがって、スタンドアロン構成時においても、何らWebブラウザ22に修正をかける必要なく、外部サーバ4と接続時と同じ環境で使用することも可能となる。
【0028】
Webブラウザ22を使用することで、カラオケ機能を実現する際の使用環境、開発環境は良好となることが考えられるが、ここで一つ重要な問題がある。カラオケ機能には、マイクロホン32からマイク音声を入力し、エコー等の音響効果を付与した後、再生される楽曲音声とミキシングしてスピーカ33から放音出力する処理(マイク音声処理)が必要とされる。このマイク音声処理における遅延の許容値は、大きくても10ミリ秒程度であり、単なる楽曲再生やビデオ再生に許容される遅延の許容値と比べて非常に厳しいものとなっている。現状のWebブラウザ22で、カラオケ機能に必要とされる全ての処理を実行した場合、マイク音声処理は遅延の許容値を超えてしまい、マイクロホン32から入力されるマイク音声がスピーカ33から遅れて聞こえ、歌唱が困難になってしまう。
【0029】
そのため、本実施形態のカラオケ装置1では、カラオケ機能を実現するプログラムとして、Webブラウザ22以外に、上述するマイク音声処理を実行するオーディオエンジン23を設けたことを特徴としている。オーディオエンジン23は、マイクロホン32から入力されるマイク音声信号を受信し、マイク音声信号にエコーをかける等の加工(音響効果付与)を行う。また、オーディオエンジン23は、Webブラウザ22で再生された楽曲音声信号を受信して、加工されたマイク音声信号とミキシングしてスピーカ33に出力する処理を実行する。
【0030】
オーディオエンジン23は、HTTPプロトコルを使用して、Webブラウザ22と通信する。
図2には、Webブラウザ22とオーディオエンジン23は、2つのプロトコル(HTTPプロトコル、WebSocketプロトコル)を使用して通信を行うことが示されているが、カラオケ機能の基本的な機能を実現するには、HTTPプロトコルのみで構わない。WebSocketプロトコルは、Webブラウザ22で採点処理を行う際、オーディオエンジン23からWebブラウザ22に対して、マイク音声を送信する場合に使用される。
【0031】
図3は、本実施形態のマイク入出力処理を示すフロー図である。オーディオエンジン23は、マイクロホン32から入力されるマイク音声信号を、AD変換処理23bにて、デジタル信号(マイク音声データ)に変換(S102)する。そして、一定量のマイク音声データを取り出し(S102)、マイク音声データ処理23cにて、エコーを付与する等の加工が施される(S103)。なお、マイク音声データ処理23cの加工において使用される各種パラメータは、Webブラウザ22の操作UI処理等において、入力部14を使用して設定されたパラメータであって、Webブラウザ22からオーディオエンジン23に対してHTTPプロトコルを使用して送信される。オーディオエンジン23側のマイク音声データ処理23cでは、受信したパラメータに基づいて、マイク音声データを加工し、ミキサー処理23dに出力する。
【0032】
また、Webブラウザ22において、カラオケ再生処理が実行される場合、オーディオエンジン23は、HTTPプロトコルを使用して、楽曲音声データを受信する。受信した楽曲音声データ処理23aでは、受信した楽曲音声データをミキサー処理23dに出力する。ミキサー処理23dは、マイク音声データ処理23cで出力されるマイク音声データと、楽曲音声データ処理23aで出力される楽曲音声データをミキシング(S105)し、ミキシングデータとしてDA変換処理23eに出力する。DA変換処理23eは、ミキシングデータをアナログ信号に変換(S106)して、スピーカ33に出力する。
【0033】
このように、本実施形態のカラオケ装置1は、Webブラウザ22において、楽曲情報の再生処理であるカラオケ再生処理を実行し、マイクロホン32から入力されるマイク音声信号については、Webブラウザ22を使用せず、オーディオエンジン23を使用することで、前述するようなマイク音声信号に対する遅延を抑制し、歌唱に好適なカラオケ機能を実現することを可能としている。また、カラオケ再生処理等に、汎用性のあるWebブラウザ22を使用することで、開発環境の良好化を図ることが可能となり、開発、修正、機能追加等を迅速に行うことが可能となる。また、Webブラウザ22は、汎用性のあるHTTPプロトコルを通信に使用しているため、オーディオエンジン23、ローカルWebサーバ21等の周囲機能についても、既存の開発環境を利用し、迅速な開発、修正を行うことが可能となる。
【0034】
図4は、本実施形態のカラオケ再生処理(Webブラウザ側)を示すフロー図である。カラオケ装置1において、カラオケ機能の開始が指示された場合、
図2で説明したローカルWebサーバ21、Webブラウザ22、オーディオエンジン23において処理が開始される。
図4は、これら処理中、Webブラウザ22の処理を示すフロー図である。Webブラウザ22は、オーディオエンジン23との接続処理を実行する(S200)。そして、Webブラウザ22は、オーディオエンジン23間との遅延測定処理(S201)を実行する。この遅延測定処理は、Webブラウザ22が楽曲音声データをオーディオエンジン23に送信してから、実際に演奏されるまでの遅延時間を計測(予測)するための処理である。この遅延測定処理としては、Webブラウザ22からオーディオエンジン23にメッセージを送信し、オーディオエンジン23からそのレスポンスを受信して往復にかかった時間(あるいは往復にかかった時間の1/2)を、遅延時間とする形態(プル型)、あるいは、オーディオエンジン23自身で遅延時間を計測し、Webブラウザ22に報告する形態(プッシュ型)を採用することが考えられる。
【0035】
遅延測定処理(S201)の実行後、楽曲情報の再生にあたって、各種パラメータ(再生位置、再生速度)の初期化、パラメータ適用時刻の記録が実行される(S202)。そして、ローカルWebサーバ21から楽曲情報のストリーム受信を開始する(S203)。この楽曲情報には、楽曲音声データ、映像データ、歌詞データが含まれており、Webブラウザ22は、映像データ、歌詞データに基づいて映像を形成し、表示部31に表示させる。また、Webブラウザ22は、楽曲音声データをオーディオエンジン23に送信する。
【0036】
その際、Webブラウザ22は、オーディオエンジン23との間の遅延時間を使用し、映像データ、歌詞データの再生位置を調整する再生位置調整処理(S250)を実行する。特に、遅延時間を考慮しない場合、特に、歌詞データについては、オーディオエンジン23からスピーカ33から放音出力される演奏音との間で同期が取れなくなることが考えられる。具体的には、Webブラウザ22側で歌詞表示処理、すなわち、歌うべき歌詞を表示部31に表示させた後、演奏音の進行に合わせて歌詞の色変えを行う処理と、オーディオエンジン23からの楽曲音声の出力との間にずれが生じてしまう。
【0037】
本実施形態では、再生位置調整処理(S250)を実行することで、Webブラウザ22側の歌詞表示処理と、オーディオエンジン23側の楽曲音声データの放音処理との間のずれを抑制し、適切な歌唱位置をユーザに通知することを可能としている。また、映像データについても、同様に再生位置を適切に調整することが可能となる。本実施形態の再生位置調整処理(S250)では、遅延測定処理(S201)で測定した遅延時間を初期値として使用し、楽曲情報の再生期間中、ストリームの再生位置を更新することで、Webブラウザ22とオーディオエンジン23間の遅延時間が変動した場合であっても適切に追従することが可能となっている。
【0038】
図5は、本実施形態の再生位置調整処理(S250)を示すフロー図である。再生位置調整処理(S250)では、ストリームから所定量をデコードして、映像データ、楽曲音声データ、歌詞データを取得する(S251)。ストリームから取得した楽曲音声データは、オーディオエンジン23に送信される(S252)。そして、Webブラウザ22は、オーディオエンジン23から、楽曲音声データの現在の再生位置、再生速度の取得を試みる(S253)。現在の再生位置、再生速度が取得できた場合(S254:Yes)には、再生位置、再生速度、パラメータ適用時刻を更新(S255)して、オーディオエンジン23における楽曲音声データの現在の推定再生位置を求める(S256)。一方、再生位置、再生速度、パラメータ適用時刻が取得できなかった場合(S254:No)、保持している再生位置、再生速度、パラメータ適用時刻を使用して、オーディオエンジン23における楽曲音声データの現在の推定再生位置を求める(S256)。
【0039】
Webブラウザ22は、S256求めた推定再生位置を使用して、映像データ、及び、歌詞データの再生位置を更新する(S257)。このように、再生位置調整処理(S250)では、オーディオエンジン23における楽曲音声データの推定再生位置を使用して、映像データ、及び、歌詞データの再生位置を調整することで、スピーカ33から放音出力される楽曲音声と、表示部31に表示される映像、歌詞を同期させることが可能となる。特に、表示部31に表示される歌詞については、スピーカ33から放音される楽曲音声と遅延を抑制した同期を取ることが可能となり、ユーザに対して歌唱位置を適切に通知することが可能となる。
【0040】
以上、
図1〜
図5を使用して説明したように、本実施形態のカラオケ装置1は、一般的なパーソナルコンピュータで汎用性があるとともに、周辺機能(プログラム)との整合性を取りやすいHTTPプロトコルを使用するWebブラウザ22を使用することで、カラオケ機能の開発、修正を容易にしている。また、カラオケ機能を実現するにあたって、マイクロホン32から入力されるマイク音声信号については、マイク音声信号がスピーカ33から出力されるまでの処理をWebブラウザ22ではなく、別途設けたオーディオエンジン23で処理することで、マイク音声信号に対する遅延を抑え、歌唱しやすい環境を実現している。更に、このようにカラオケ機能をWebブラウザ22と、オーディオエンジン23に分けて実現する場合において、両者間の再生位置のずれを考慮して、映像データ、歌詞データの再生位置を調整することで、楽曲の演奏と映像、歌詞の表示のずれを抑制することが可能となっている。特に、歌詞データの再生位置を調整することで、適切な歌唱位置をユーザに通知することが可能となっている。なお、再生位置調整処理は、少なくとも歌詞データに対して行えばよく、映像データについては行わないこととしてもよい。
【0041】
上記実施形態中、
図2には、Webブラウザ22とオーディオエンジン23間でWebSocketプロトコルを使用する形態について説明しておく。このWebSocketプロトコルによる通信は、楽曲を演奏して歌唱を行う通常のカラオケ機能では使用されず、オーディオエンジン23からWebブラウザ22に対して、マイク音声データを送信する必要がある場合に使用される。例えば、Webブラウザ22側で採点処理(歌唱評価処理)を行う場合、マイクロホン32を使用して取得したマイク音声データを複製し、WebSocketプロトコルを使用して、Webブラウザ22側に送信する。Webブラウザ22側では、受信したマイク音声データを使用して採点処理を実行する。採点処理は、カラオケ基本機能と異なり、多少の遅延は許容される処理である。そのため、楽曲を演奏しながら、歌唱すべき歌詞を表示するカラオケ基本機能以外(オプション機能)の通信には、HTTPプロトコル(第1のプロトコル)とは異なるWebSocket(第2のプロトコル)を使用することで、カラオケ基本機能に対する遅延等の影響を抑え、カラオケ基本機能における良好な通信を確保することを可能としている。なお、本実施形態では、Webブラウザ22において、採点処理を行うため、オーディオエンジン23からマイク音声データを受信しているが、マイク音声データに代え、マイク音声データの特性を受信することとしてもよい。
【0042】
図6、
図7は、他の実施形態のカラオケシステムを説明するための図であり、
図6は、カラオケシステムのハードウェア構成であり、
図7は、カラオケシステムのソフトウェア構成を示す図である。
図6に示されるように、本実施形態のカラオケシステムは、ハードウェア構成として、カラオケ装置1(第2の情報処理装置)、タブレット端末5(第1の情報処理装置)、マイクロホン32、スピーカ33、ルータ34、アクセスポイント35、外部サーバ4を有して構成されている。
【0043】
カラオケ装置1は、
図1で説明したハードウェア構成と同様、CPU11、RAM12、記憶部13、入力部14、音響処理部16、通信部17を有しているが、画像処理部15を必ずしも必要としない点において異なっている。この画像処理部15の代用となるのがタブレット端末5である。タブレット端末5は、ルータ34に通信接続されるアクセスポイント35と無線通信を行うことが可能となっている。したがって、タブレット端末5は、アクセスポイント35、ルータ34を介してカラオケ装置1と通信することが可能である。タブレット端末5とカラオケ装置1は、このようなLAN環境を使用した通信のみならず、互いに直接通信(ピア・ツー・ピア)することとしてもよい。
【0044】
図7は、このようなカラオケシステムのソフトウェア構成を示す図である。本実施形態では、カラオケ機能を実行するにあたって、タブレット端末5においてWebブラウザ51が立ち上がる。このWebブラウザ51は、前述の実施形態と同様、操作UI処理、カラオケ再生処理、歌詞表示処理、採点表示処理を実行する。Webブラウザ51で形成された各種画像、映像は、タブレット端末5の表示部52に表示される。
【0045】
一方、カラオケ装置1側では、ローカルWebサーバ21と、オーディオエンジン23が実行される。ローカルWebサーバ21と、オーディオエンジン23は、前述の実施形態と同様、HTTPプロトコルを使用してWebブラウザ51と通信を行う。但し、タブレット端末5とカラオケ装置1は、アクセスポイント35を介して通信を行う点において前述の実施形態と異なっている。Webブラウザ51は、カラオケ再生処理で再生された楽曲音声データを、HTTPプロトコルを使用してオーディオエンジン23に送信する。楽曲音声データは、アクセスポイント35を介して無線送信され、オーディオエンジン23によってスピーカ33から放音出力されることになるが、再生位置調整処理S250では、アクセスポイント35を使用することによる遅延時間も考慮した形態で、映像データ、歌詞データの再生位置を調整することができるため、スピーカ33から放音出力される楽曲音声と、表示部52に表示される映像、及び、歌詞間のずれを抑制することが可能となる。
【0046】
このように、Webブラウザ51と、オーディオエンジン23は、異なる情報処理装置(この場合、カラオケ装置1とタブレット端末5)で実行することも可能である。Webブラウザ51と、オーディオエンジン23の間は、汎用性のあるHTTPプロトコルで通信するため、このように異なる情報処理装置で実行する場合においても、前述の実施形態と同様に、カラオケシステムを容易に構築することが可能である。
【0047】
また、前述の実施形態と同様、Webブラウザ51における採点処理では、Webブラウザ51は、オーディオエンジン23からWebSocketを使用して、マイク音声データの複製を受信し、楽曲情報に含まれる主旋律情報と比較する等して、歌唱評価値となる得点を算出する。
【0048】
なお、
図7で説明した実施形態では、ローカルWebサーバ21は、カラオケ装置1側に設けることとしているが、タブレット端末5側に設けることとしてもよい。また、本実施形態では、Webブラウザ51を搭載する情報処理装置として、タブレット端末5を使用しているが、Webブラウザ51を搭載する情報処理装置には、タブレット端末5のみならず、スマートホン、パーソナルコンピュータ等を使用することが可能である。