特許第6873549号(P6873549)IP Force 特許公報掲載プロジェクト 2022.1.31 β版

知財求人 - 知財ポータルサイト「IP Force」

▶ 株式会社ディーアンドエムホールディングスの特許一覧

特許6873549オーディオ装置およびコンピュータで読み取り可能なプログラム
<>
  • 特許6873549-オーディオ装置およびコンピュータで読み取り可能なプログラム 図000002
  • 特許6873549-オーディオ装置およびコンピュータで読み取り可能なプログラム 図000003
  • 特許6873549-オーディオ装置およびコンピュータで読み取り可能なプログラム 図000004
< >
(19)【発行国】日本国特許庁(JP)
(12)【公報種別】特許公報(B2)
(11)【特許番号】6873549
(24)【登録日】2021年4月23日
(45)【発行日】2021年5月19日
(54)【発明の名称】オーディオ装置およびコンピュータで読み取り可能なプログラム
(51)【国際特許分類】
   G10L 21/0208 20130101AFI20210510BHJP
   G10L 15/20 20060101ALI20210510BHJP
【FI】
   G10L21/0208 100B
   G10L15/20 370D
【請求項の数】2
【全頁数】12
(21)【出願番号】特願2017-63309(P2017-63309)
(22)【出願日】2017年3月28日
(65)【公開番号】特開2018-165787(P2018-165787A)
(43)【公開日】2018年10月25日
【審査請求日】2019年9月26日
(73)【特許権者】
【識別番号】309039716
【氏名又は名称】株式会社ディーアンドエムホールディングス
(74)【代理人】
【識別番号】100104570
【弁理士】
【氏名又は名称】大関 光弘
(72)【発明者】
【氏名】松永 圭司
【審査官】 上田 雄
(56)【参考文献】
【文献】 特開2009−216835(JP,A)
【文献】 特開2000−354300(JP,A)
【文献】 特開2009−017331(JP,A)
【文献】 国際公開第2016/024345(WO,A1)
【文献】 特開2005−318636(JP,A)
【文献】 KOGA, Kentaro, et al.,Improvement of In-Car Speech Recognition by Acoustic Echo Canceller with Maximum Likelihood,15th World Congress on ITS,2008年11月
(58)【調査した分野】(Int.Cl.,DB名)
G10L 21/00−21/18
G10L 15/00−15/34
(57)【特許請求の範囲】
【請求項1】
音声操作受付機能を有するオーディオ装置であって、
マルチチャンネルオーディオ信号を再生して複数のスピーカに出力するオーディオ再生手段と、
ユーザから音声操作を受け付けるための音声操作受付用マイクと、
オーディオ再生中に前記複数のスピーカから前記音声操作受付用マイクに回り込んだ回り込み信号をキャンセルするためのエコーバックパラメータを決定するパラメータ決定手段と、
オーディオ再生中に前記音声操作受付用マイクで集音された集音信号に対して、前記パラメータ決定手段により決定された前記エコーバックパラメータでフィルタリングを行うフィルタ処理手段と、
前記フィルタ処理手段によりフィルタリングされた集音信号に対して音声認識処理を実施して前記音声操作を受け付ける音声操作受付手段と
音場環境測定用マイクと、を備え、
前記パラメータ決定手段は、
テスト信号を前記複数のスピーカから順番に出力して前記音声操作受付用マイクにより集音するとともに、ユーザの聴取位置に設置された前記音場環境測定用マイクにより集音し、
前記スピーカ毎に、当該テスト信号に対する前記音声操作受付用マイクの集音信号の遅延時間および減衰率を測定するとともに、当該テスト信号に対する前記音場環境測定用マイクの集音信号の遅延時間および減衰率を測定し、
前記スピーカ毎に測定した前記音声操作受付用マイクの集音信号の前記遅延時間および前記減衰率に基づいて前記エコーバックパラメータを決定するとともに、前記スピーカ毎に測定した前記音場環境測定用マイクの前記遅延時間および前記減衰率に基づいて、前記スピーカ各々の出力特性パラメータを決定し
前記オーディオ再生手段は、
前記スピーカ毎に、前記パラメータ決定手段により決定された前記スピーカの出力特性パラメータに従って当該スピーカから出力するオーディオ信号を補正する
ことを特徴とするオーディオ装置。
【請求項2】
音声操作受付機能を有するオーディオ装置としてコンピュータを機能させるための、コンピュータで読み取り可能なプログラムであって、
前記プログラムは、前記コンピュータを
マルチチャンネルオーディオ信号を再生して複数のスピーカに出力するオーディオ再生手段
オーディオ再生中に、前記複数のスピーカから、ユーザから音声操作を受け付けるための音声操作受付用マイクに回り込んだ回り込み信号をキャンセルするためのエコーバックパラメータを決定するパラメータ決定手段
オーディオ再生中に前記音声操作受付用マイクで集音された集音信号に対して、前記パラメータ決定手段により決定された前記エコーバックパラメータでフィルタリングを行うフィルタ処理手段、および
前記フィルタ処理手段によりフィルタリングされた集音信号に対して音声認識処理を実施して前記音声操作を受け付ける音声操作受付手段、として機能させ、
前記パラメータ決定手段は、
テスト信号を前記複数のスピーカから順番に出力して前記音声操作受付用マイクにより集音するとともに、ユーザの聴取位置に設置された音場環境測定用マイクにより集音し、
前記スピーカ毎に、当該テスト信号に対する前記音声操作受付用マイクの集音信号の遅延時間および減衰率を測定するとともに、当該テスト信号に対する前記音場環境測定用マイクの集音信号の遅延時間および減衰率を測定し、
前記スピーカ毎に測定した前記音声操作受付用マイクの集音信号の前記遅延時間および前記減衰率に基づいて前記エコーバックパラメータを決定するとともに、前記スピーカ毎に測定した前記音場環境測定用マイクの前記遅延時間および前記減衰率に基づいて、前記スピーカ各々の出力特性パラメータを決定し
前記オーディオ再生手段は、
前記スピーカ毎に、前記パラメータ決定手段により決定された前記スピーカの出力特性パラメータに従って当該スピーカから出力するオーディオ信号を補正する
ことを特徴とするコンピュータで読み取り可能なプログラム。
【発明の詳細な説明】
【技術分野】
【0001】
本発明は、音声操作受付機能を有するオーディオ装置に関する。
【背景技術】
【0002】
特許文献1には、複数のスピーカを用いてマルチチャンネルオーディオ再生を行うマルチチャネル対応オーディオ装置が開示されている。このマルチチャンネル対応オーディオ装置では、スピーカ毎に、スピーカから出力されたテスト信号をユーザの聴取位置に設置されたマイクで集音し、その遅延時間、減衰率を測定することにより、各スピーカから出力されるオーディオ信号がユーザの聴取位置で最適となるように各スピーカの出力特性(遅延時間、音響特性)を設定している。
【0003】
また、特許文献2には、音声操作受付機能を有するオーディオ装置が開示されている。このオーディオ装置によれば、ユーザは、楽曲の選曲や音量レベルの調整等を音声により操作することができ、使い勝手が向上する。
【0004】
また、特許文献3には、音声通話等において、スピーカから出力された音声信号がマイクで集音されることにより発生するエコーをキャンセルするエコーキャンセラが開示されている。このエコーキャンセラでは、スピーカから出力される音声信号とマイクの集音信号との相関を解析し、スピーカからマイクに回り込む回り込み信号の遅延量を算出する。そして、スピーカから出力される音声信号をこの遅延量だけ遅延させた遅延信号を生成し、この遅延信号を用いてマイクの集音信号に含まれている回り込み信号をキャンセルしている。
【先行技術文献】
【特許文献】
【0005】
【特許文献1】特開2000−354300号公報
【特許文献2】特開2014−219614号公報
【特許文献3】特開2006−14359号公報
【発明の概要】
【発明が解決しようとする課題】
【0006】
近年、特許文献1に記載のようなマルチチャンネル対応オーディオ装置においても、特許文献2に記載のような音声操作受付機能が求められている。しかしながら、マルチチャンネル対応オーディオ装置に音声操作受付機能を追加した場合、つぎのような問題が生じる。すなわち、マルチチャンネルオーディオ再生中に音声操作を受け付ける場合、複数のスピーカから出力されたオーディオ信号がマイクに回り込み、回り込み信号として、ユーザから受け付けた音声操作用の音声信号とともにマイクに集音される。このため、音声操作用の音声信号の音声認識率が低下して、音声操作の受付に失敗する可能性がある。
【0007】
ここで、特許文献3に記載のエコーキャンセラを用いて、複数のスピーカからマイクに回り込んだ回り込み信号をマイクの集音信号からキャンセルすることも考えられる。しかし、このエコーキャンセラでは、複数のスピーカのそれぞれについて、スピーカから出力されるオーディオ信号とマイクの集音信号との相関を解析し、スピーカからマイクに回り込む回り込み信号の遅延量を算出して、スピーカから出力されるオーディオ信号をこの遅延量だけ遅延させた遅延信号を生成し、マイクの集音信号に含まれている回り込み信号をこの遅延信号を用いてキャンセルする。この処理をリアルタイムで実施するためには、大きな処理能力が要求され、コストアップとなる。
【0008】
本発明は上記事情に鑑みてなされたものであり、その目的は、オーディオ再生中でも音声操作をより確実に受け付けることができるオーディオ装置を提供することにある。
【課題を解決するための手段】
【0009】
上記課題を解決するために、本発明では、オーディオ再生とは別に、スピーカから出力されたテスト信号を音声操作受付用マイクで集音し、その遅延時間および減衰率に基づいて、スピーカから音声操作受付用マイクに回り込んだ回り込み信号を集音信号からキャンセルするためのエコーバックパラメータを決定する。そして、オーディオ再生中に音声操作受付用マイクで集音された集音信号に対して、この決定されたエコーバックパラメータでフィルタリングを行い、フィルタリングされた集音信号に対して音声認識処理を実施して音声操作を受け付ける。
【0010】
例えば、本発明は、
音声操作受付機能を有するオーディオ装置であって、
マルチチャンネルオーディオ信号を再生して複数のスピーカに出力するオーディオ再生手段と、
ユーザから音声操作を受け付けるための音声操作受付用マイクと、
オーディオ再生中に前記複数のスピーカから前記音声操作受付用マイクに回り込んだ回り込み信号をキャンセルするためのエコーバックパラメータを決定するパラメータ決定手段と、
オーディオ再生中に前記音声操作受付用マイクで集音された集音信号に対して、前記パラメータ決定手段により決定された前記エコーバックパラメータでフィルタリングを行うフィルタ処理手段と、
前記フィルタ処理手段によりフィルタリングされた集音信号に対して音声認識処理を実施して前記音声操作を受け付ける音声操作受付手段と
音場環境測定用マイクと、を備え、
前記パラメータ決定手段は、
テスト信号を前記複数のスピーカから順番に出力して前記音声操作受付用マイクにより集音するとともに、ユーザの聴取位置に設置された前記音場環境測定用マイクにより集音し、
前記スピーカ毎に、当該テスト信号に対する前記音声操作受付用マイクの集音信号の遅延時間および減衰率を測定するとともに、当該テスト信号に対する前記音場環境測定用マイクの集音信号の遅延時間および減衰率を測定し、
前記スピーカ毎に測定した前記音声操作受付用マイクの集音信号の前記遅延時間および前記減衰率に基づいて前記エコーバックパラメータを決定するとともに、前記スピーカ毎に測定した前記音場環境測定用マイクの前記遅延時間および前記減衰率に基づいて、前記スピーカ各々の出力特性パラメータを決定し
前記オーディオ再生手段は、
前記スピーカ毎に、前記パラメータ決定手段により決定された前記スピーカの出力特性パラメータに従って当該スピーカから出力するオーディオ信号を補正する
【発明の効果】
【0011】
本発明では、オーディオ再生に先立って、スピーカから出力されたテスト信号を音声操作受付用マイクで集音してエコーバックパラメータを決定することにより、オーディオ再生中に音声操作受付用マイクで集音された集音信号に対して、このエコーバックパラメータでフィルタリングを行い、フィルタリングされた集音信号に対して音声認識処理を実施することができる。このため、オーディオ再生中におけるユーザの音声認識率が向上し、オーディオ再生中の音声操作をより確実に受け付けることができる。
【0012】
また、本発明では、オーディオ再生に先立ってエコーバックパラメータを決定することができるので、オーディオ再生中の処理負担を軽減でき、これにより、オーディオ再生中の音声操作受付に要求される処理能力の増大を抑制することができる。
【図面の簡単な説明】
【0013】
図1図1は、本発明の一実施の形態に係るマルチチャンネルオーディオシステム1の概略構成図である。
図2図2は、オーディオ再生装置2の概略機能構成図である。
図3図3は、オーディオ再生装置2のパラメータ決定処理を説明するためのフロー図である。
【発明を実施するための形態】
【0014】
以下に、本発明の一実施の形態について、図面を参照して説明する。
【0015】
図1は、本実施の形態に係るマルチチャンネルオーディオシステム1の概略構成図である。
【0016】
図示するように、本実施の形態に係るマルチチャンネルオーディオシステム1は、アクセスポイント6およびWAN、LAN等のネットワーク7を介してメディアサーバ8に接続されている。メディアサーバ8は、マルチチャンネル対応の楽曲データをマルチチャンネルオーディオシステム1に提供する。
【0017】
マルチチャンネルオーディオシステム1は、オーディオ再生装置2と、オーディオ再生装置2に接続された複数台のスピーカ3−1〜3−5(以下、単にスピーカ3とも呼ぶ)と、ユーザの聴取位置における音場環境測定の際に用いられる音場環境測定用マイク4と、オーディオ再生装置2を遠隔操作するためのリモートコントローラ5と、を備えている。なお、図1では5台のスピーカ3を示しているが、スピーカ3は2台あるいは4台以上でもよい。
【0018】
オーディオ再生装置2は、音声操作受付用マイク20−1、20−2(以下、単に音声操作受付用マイク20とも呼ぶ)を備えており、リモートコントローラ5による遠隔操作に加えて、音声操作受付用マイク20による音声操作も受け付ける。そして、オーディオ再生装置2は、リモートコントローラ5による遠隔操作あるいは音声操作受付用マイク20による音声操作によりユーザから楽曲データの選曲を受け付けて、選曲された楽曲データをメディアサーバ8からダウンロードして、複数のスピーカ3を用いてマルチチャンネルオーディオ再生する。この際、オーディオ再生装置2は、音場環境測定用マイク4を用いて事前実施した音場環境測定の結果に基づいて決定された各スピーカ3の出力特性パラメータに従い、各スピーカ3から出力されるオーディオ信号をユーザの聴取位置で最適となるように補正する。
【0019】
また、オーディオ再生装置2は、音場環境測定の際に、各スピーカ3から音声操作受付用マイク20に回り込んだ回り込み信号を音声操作受付用マイク20の集音信号からキャンセルするためのエコーバックパラメータを決定している。そして、マルチチャンネルオーディオ再生中、このエコーバックパラメータに従い音声操作受付用マイク20の集音信号をフィルタリングすることにより、音声操作受付用マイク20の集音信号に含まれている回り込み信号をキャンセルする。これにより、音声操作受付用マイク20の集音信号に含まれているユーザ音声の音声認識率を向上させ、マルチチャンネルオーディオ再生中でも音声操作を受付可能としている。
【0020】
図2は、オーディオ再生装置2の概略機能構成図である。
【0021】
図示するように、オーディオ再生装置2は、ユーザから音声操作を受け付けるためのマイクである音声操作受付用マイク20−1、20−2と、ネットワークインターフェース部21と、音場環境測定用マイク接続部22と、スピーカ接続部23と、出力特性パラメータ記憶部24と、エコーバックパラメータ記憶部25と、マルチチャンネルオーディオ再生部26と、フィルタ処理部27と、音声認識部28と、操作受付部29と、パラメータ決定部30と、テスト信号発生部31と、主制御部32と、を備えている。
【0022】
ネットワークインターフェース部21は、アクセスポイント6を介してリモートコントローラ5と通信したり、あるいは、アクセスポイント6およびネットワーク7を介してメディアサーバ8と通信したりするためのインターフェースである。
【0023】
音場環境測定用マイク接続部22は、音場環境測定の際に用いられる音場環境測定用マイク4を接続するための接続端子である。
【0024】
スピーカ接続部23は、スピーカ3を接続するためのインターフェースであり、チャンネル毎に該当チャンネルに対応するスピーカ3を接続するための接続端子であるチャンネル1接続端子230−1〜チャンネル5接続端子230−5(以下、単にチャンネル接続端子230とも呼ぶ)を有する。
【0025】
出力特性パラメータ記憶部24には、チャンネル毎に、該当チャンネルに対応するチャンネル接続端子230から出力されるオーディオ信号の出力特性(遅延時間、音響特性)を補正するためのパラメータである出力特性パラメータが記憶される。
【0026】
エコーバックパラメータ記憶部25には、音声操作受付用マイク20毎に、各スピーカ3から該当音声操作受付用マイク20に回り込んだ回り込み信号を該当音声操作受付用マイク20の集音信号からキャンセルするためのエコーバックパラメータが記憶される。
【0027】
マルチチャンネルオーディオ再生部26は、マルチチャンネル対応の楽曲データをチャンネル毎のオーディオ信号に再生する。そして、チャンネル毎に、再生したオーディオ信号を、出力特性パラメータ記憶部24に記憶されている該当チャンネルの出力特性パラメータに従って補正して、該当チャンネルのチャンネル接続端子230から出力する。これにより、楽曲データをマルチチャンネルオーディオ再生する。
【0028】
フィルタ処理部27は、音声操作受付用マイク20毎に、エコーバックパラメータ記憶部25に記憶されている該当音声操作受付用マイク20のエコーバックパラメータに従って、該当音声操作受付用マイク20の集音信号にフィルタリングを行い、この集音信号に含まれている回り込み信号をキャンセルする。
【0029】
音声認識部28は、フィルタ処理部27によりフィルタリングされた音声操作受付用マイク20の集音信号に対して音声認識処理を行って、ユーザ音声を特定する。
【0030】
操作受付部29は、ネットワークインターフェース部21を介してリモートコントローラ5による遠隔操作を受け付けたり、または、フィルタ処理部27および音声認識部28を介して音声操作受付用マイク20による音声操作を受け付けたり、あるいは、図示していない操作パネルから操作を受け付けたりする。
【0031】
パラメータ決定部30は、チャンネル毎に出力特性パラメータを決定して出力特性パラメータ記憶部24に記憶するとともに、音声操作受付用マイク20毎にエコーバックパラメータを決定してエコーバックパラメータ記憶部25に記憶する。
【0032】
テスト信号発生部31は、パラメータ決定部30が出力特性パラメータおよびエコーバックパラメータを決定する際に用いられ、チャンネル1接続端子230−1〜チャンネル5接続端子230−5から順番に出力するピンクノイズ等のテスト信号を発生する。
【0033】
主制御部32は、オーディオ再生装置2の各部20〜31を統括的に制御する。
【0034】
つぎに、上記構成のオーディオ再生装置2の動作について説明する。
【0035】
[マルチチャンネルオーディオ再生処理]
操作受付部29は、ネットワークインターフェース部21を介してリモートコントローラ5から受け付けたユーザの遠隔操作により、または、フィルタ処理部27および音声認識部28を介して音声操作受付用マイク20から受け付けたユーザの音声操作により、あるいは、図示していない操作パネルから受け付けたユーザの操作により、楽曲データが選曲されると、選曲された楽曲データを主制御部32に通知する。
【0036】
これを受けて、主制御部32は、ネットワークインターフェース部21を介してメディアサーバ8にアクセスして、メディアサーバ8から、選曲された楽曲データをダウンロードする。そして、ダウンロードした楽曲データをマルチチャンネルオーディオ再生部26に出力する。
【0037】
マルチチャンネルオーディオ再生部26は、主制御部32から楽曲データを受け取ると、この楽曲データをチャンネル毎のオーディオ信号に再生する。そして、チャンネル毎に、再生したオーディオ信号を、出力特性パラメータ記憶部24に記憶されている該当チャンネルの出力特性パラメータに従ってユーザの聴取位置で最適となるように補正し、該当チャンネルのチャンネル接続端子230から出力する。これにより、楽曲データをマルチチャンネルオーディオ再生する。
【0038】
[マルチチャンネルオーディオ再生中の音声操作受付処理]
マルチチャンネルオーディオ再生中において、フィルタ処理部27は、音声操作受付用マイク20毎に、該当音声操作受付用マイク20の集音信号に対して、エコーバックパラメータ記憶部25に記憶されている該当音声操作受付用マイク20のエコーバックパラメータに従ってフィルタリングを行う。このフィルタリングにより、各スピーカ3から音声操作受付用マイク20に回り込み、この音声操作受付用マイク20の集音信号に混入した回り込み信号がキャンセルされる。その後、フィルタ処理部27は、フィルタリングされた各音声操作受付用マイク20の集音信号を音声認識部28に出力する。
【0039】
音声認識部28は、フィルタ処理部27から受け取った各音声操作受付用マイク20の集音信号に対して音声認識処理を行って、ユーザ音声を特定する。そして、特定したユーザ音声の認識内容を操作受付部29に渡す。
【0040】
操作受付部29は、音声認識部28から受け取ったユーザ音声の認識内容が音声操作を示しているか否かを判断し、音声操作ならばその操作内容を主制御部32に通知する。これを受けて、主制御部32は、操作受付部29より受け付けた操作内容に従った処理を実行する。
【0041】
[パラメータ決定処理]
パラメータ決定処理は、マルチチャンネルオーディオ再生処理に先立って実施され、マルチチャンネルオーディオ再生処理に用いる出力特性パラメータ、およびマルチチャンネルオーディオ再生中の音声操作受付処理に用いるエコーバックパラメータを決定する。
【0042】
図3は、オーディオ再生装置2のパラメータ決定処理を説明するためのフロー図である。このフローは、ユーザの聴取位置に設置された音場環境測定用マイク4が音場環境測定用マイク接続部22に接続された状態で、操作受付部29が、ネットワークインターフェース部21を介してリモートコントローラ5から、あるいは、図示していない操作パネルから、音場環境の測定指示を受け付けることにより開始される。
【0043】
まず、主制御部32は、カウント値Nを「1」に設定する(S1)。それから、主制御部32は、テスト信号発生部31にチャンネルNへのテスト信号出力を指示する。これを受けて、テスト信号発生部31は、チャンネルN接続端子230−Nにテスト信号を出力する(S2)。このテスト信号は、チャンネルN接続端子230−Nに接続されたスピーカ3から出力されると同時にパラメータ決定部30に入力される。
【0044】
さて、チャンネルN接続端子230−Nに接続されたスピーカ3から出力されたテスト信号は、音場環境測定用マイク接続部22に接続された音場環境測定用マイク4で集音され、音場環境測定用マイク4の集音信号としてパラメータ決定部30に入力される。パラメータ決定部30は、音場環境測定用マイク4の集音信号からテスト信号を検出すると(S3)、この検出信号と、テスト信号発生部31から入力されたテスト信号とを比較し、ユーザの聴取位置におけるチャネルNの音場環境として、検出信号のテスト信号に対する遅延時間、減衰率を測定する(S4)。
【0045】
それから、パラメータ決定部30は、測定したチャネルNの音場環境に基づいて、チャンネルNのスピーカ3から出力されるオーディオ信号がユーザの聴取位置で最適となるように、このスピーカ3から出力されるオーディオ信号を補正するための出力特性パラメータ(遅延時間、音響特性)を決定する(S5)。
【0046】
また、チャンネルN接続端子230−Nに接続されたスピーカ3から出力されたテスト信号は、音声操作受付用マイク20−1、20−2で集音され、それぞれ、音声操作受付用マイク20−1、20−2の集音信号としてパラメータ決定部30に入力される。パラメータ決定部30は、音声操作受付用マイク20−1、20−2各々の集音信号からテスト信号を検出すると(S6)、各検出信号と、テスト信号発生部31から入力されたテスト信号とを比較し、テスト信号に対する各検出信号の遅延時間、減衰率を測定する(S7)。
【0047】
それから、パラメータ決定部30は、音声操作受付用マイク20−1について測定した遅延時間、減衰率に基づいて、チャンネルNのスピーカ3から音声操作受付用マイク20−1に回り込んだ回り込み信号を音声操作受付用マイク20−1の集音信号からキャンセルするためのチャンネルNのエコーバックパラメータ(フィルタリングのパラメータ)を決定する。同様に、音声操作受付用マイク20−2について測定した遅延時間、減衰率に基づいて、チャンネルNのスピーカ3から音声操作受付用マイク20−2に回り込んだ回り込み信号を音声操作受付用マイク20−2の集音信号からキャンセルするためのチャンネルNのエコーバックパラメータを決定する(S8)。
【0048】
つぎに、パラメータ決定部30は、カウント値Nが最後のチャンネル番号(チャンネル接続端子230の総数と一致)に達しているか否かを判断する(S9)。カウント値Nが最後のチャンネル番号に達していない場合(S9でNO)、カウント値Nを一つインクリメントして(S10)、S2に戻る。
【0049】
一方、カウント値Nが最後のチャンネル番号に達している場合(S9でYES)、パラメータ決定部30は、これまでに決定したすべてのチャンネルの出力特性パラメータを出力特性パラメータ記憶部24に記憶する(S11)。
【0050】
また、パラメータ決定部30は、音声操作受付用マイク20−1について決定したすべてのチャンネルのエコーバックパラメータを統合し、音声操作受付用マイク20−1のエコーバックパラメータとしてエコーバックパラメータ記憶部25に記憶する。同様に、音声操作受付用マイク20−2について決定したすべてのチャンネルのエコーバックパラメータを統合し、音声操作受付用マイク20−2のエコーバックパラメータとしてエコーバックパラメータ記憶部25に記憶する(S12)。
【0051】
以上、本発明の一実施の形態について説明した。
【0052】
本実施の形態では、オーディオ再生に先立って、スピーカ3から出力されたテスト信号を音声操作受付用マイク20で集音してエコーバックパラメータを決定することにより、オーディオ再生中に音声操作受付用マイク20で集音された集音信号に対して、この決定されたエコーバックパラメータでフィルタリングを行い、フィルタリングされた集音信号に対し音声認識処理を実施することができる。このため、オーディオ再生中におけるユーザ音声の音声認識率が向上し、オーディオ再生中の音声操作をより確実に受け付けることができる。
【0053】
また、本実施の形態では、オーディオ再生に先立ってエコーバックパラメータを決定することができるので、オーディオ再生中の処理負担を軽減でき、これにより、オーディオ再生中の音声操作受付に要求される処理能力の増大を抑制することができる。
【0054】
また、本実施の形態では、各スピーカ3から出力される共通のテスト信号を用いて、エコーバックパラメータおよび出力特性パラメータの両方を決定しているので、エコーバックパラメータおよび出力特性パラメータを決定するための作業をそれぞれ別途に行う必要がなく、使い勝手が向上する。また、エコーバックパラメータおよび出力特性パラメータの両方ともに、スピーカ3から出力されるテスト信号に対する検出信号の遅延時間、減衰率に基づいて決定しているので、エコーバックパラメータ決定のための機能ブロックおよび出力特性パラメータ決定のための機能ブロックを実現するハードウエアあるいはソフトウエアを共用することが可能となり、その分、コストを下げることができる。
【0055】
なお、本発明は上記の実施の形態に限定されるものではなく、その要旨の範囲内で数々の変形が可能である。
【0056】
例えば、上記の実施の形態では、スピーカ3が複数台ある場合を例にとり説明したが、本発明はこれに限定されない。スピーカ3がマルチチャンネル対応のスピーカである場合、スピーカ3は1台であってもよい。
【0057】
また、上記の実施の形態では、音声操作受付用マイク20が2つある場合を例にとり説明したが(音声操作受付用マイク20−1、20−2)、音声操作受付用マイク20は1つまたは3つ以上でもよい。また、音声操作受付用マイク20は、オーディオ再生装置2に内蔵されていてもよいし、あるいは外付けされているものでもよい。
【0058】
また、上記の実施の形態では、メディアサーバ8から楽曲データをダウンロードして再生する場合を例にとり説明したが、本発明はこれに限定されない。例えば、オーディオ再生装置2に、楽曲データを記憶する楽曲データ記憶部、あるいは楽曲データが記憶されたメディアから楽曲データを読み取る楽曲データ読取部を設けて、楽曲データ記憶部から、あるいは楽曲データ読取部を介してメディアから、楽曲データを取得し再生するようにしてもよい。
【0059】
また、上記の実施の形態において、図2に示すオーディオ装置2の機能構成は、ASIC(Application Specific Integrated Circuit)、FPGA(Field Programmable Gate Array)等の集積ロジックICによりハード的に実現されるものでもよいし、あるいはDSP(Digital Signal Processor)等の計算機によりソフトウエア的に実現されるものでもよい。または、CPUと、メモリと、フラッシュメモリ、ハードディスクドライブ等の補助記憶装置と、無線LANアダプタ等の通信装置と、スピーカと、を備えたPC等の汎用コンピュータにおいて、CPUが所定のプログラムを補助記憶装置からメモリ上にロードして実行することにより実現されるものでもよい。
【符号の説明】
【0060】
1:マルチチャンネルオーディオシステム、2:オーディオ再生装置、 3、3−1〜3−5:スピーカ、 4:音場環境測定用マイク、 5:リモートコントローラ、 6:アクセスポイント、 7:ネットワーク、 8:メディアサーバ、 20、20−1、20−2:音声操作受付用マイク、 21:ネットワークインターフェース部、 22:音場環境測定用マイク接続部、 23:スピーカ接続部、 24:出力特性パラメータ記憶部、 25:エコーバックパラメータ記憶部、 26:マルチチャンネルオーディオ再生部、 27:フィルタ処理部、 28:音声認識部、 29:操作受付部、 30:パラメータ決定部、 31:テスト信号発生部、 32:主制御部、 230、230−1〜230−5:チャンネル接続端子
図1
図2
図3