IP Force 特許公報掲載プロジェクト 2022.1.31 β版

知財求人 - 知財ポータルサイト「IP Force」

▶ ヤマハ株式会社の特許一覧

特開2024-130675音信号処理方法、音信号処理装置及び音信号処理プログラム
<図1>
  • 特開-音信号処理方法、音信号処理装置及び音信号処理プログラム 図1
  • 特開-音信号処理方法、音信号処理装置及び音信号処理プログラム 図2
  • 特開-音信号処理方法、音信号処理装置及び音信号処理プログラム 図3
  • 特開-音信号処理方法、音信号処理装置及び音信号処理プログラム 図4
  • 特開-音信号処理方法、音信号処理装置及び音信号処理プログラム 図5
  • 特開-音信号処理方法、音信号処理装置及び音信号処理プログラム 図6
  • 特開-音信号処理方法、音信号処理装置及び音信号処理プログラム 図7
  • 特開-音信号処理方法、音信号処理装置及び音信号処理プログラム 図8
  • 特開-音信号処理方法、音信号処理装置及び音信号処理プログラム 図9
  • 特開-音信号処理方法、音信号処理装置及び音信号処理プログラム 図10
  • 特開-音信号処理方法、音信号処理装置及び音信号処理プログラム 図11
< >
(19)【発行国】日本国特許庁(JP)
(12)【公報種別】公開特許公報(A)
(11)【公開番号】P2024130675
(43)【公開日】2024-09-30
(54)【発明の名称】音信号処理方法、音信号処理装置及び音信号処理プログラム
(51)【国際特許分類】
   H04R 3/00 20060101AFI20240920BHJP
【FI】
H04R3/00 320
H04R3/00 310
【審査請求】未請求
【請求項の数】15
【出願形態】OL
(21)【出願番号】P 2023040533
(22)【出願日】2023-03-15
(71)【出願人】
【識別番号】000004075
【氏名又は名称】ヤマハ株式会社
(74)【代理人】
【識別番号】110000970
【氏名又は名称】弁理士法人 楓国際特許事務所
(72)【発明者】
【氏名】鵜飼 訓史
【テーマコード(参考)】
5D220
【Fターム(参考)】
5D220AA01
5D220AB08
5D220BA30
5D220BB04
(57)【要約】
【課題】話者音声を入力している時のノイズを低減することができる音声処理装置を提供する。
【解決手段】音信号処理方法は、過去の会議の環境情報と、過去の音処理パラメータと、の関係を蓄積し、現在の会議の環境情報を取得し、蓄積した前記関係及び所定の推論アルゴリズムに基づいて、取得した前記現在の会議の環境情報に対応する現在の音処理パラメータを求め、音信号を受け付け、求めた前記現在の音処理パラメータに基づいて、受け付けた前記音信号に音処理を施す。
【選択図】 図3
【特許請求の範囲】
【請求項1】
過去の会議の環境情報と、過去の音処理パラメータと、の関係を蓄積し、
現在の会議の環境情報を取得し、
蓄積した前記関係及び所定の推論アルゴリズムに基づいて、取得した前記現在の会議の環境情報に対応する現在の音処理パラメータを求め、
音信号を受け付け、
求めた前記現在の音処理パラメータに基づいて、受け付けた前記音信号に音処理を施す、
音信号処理方法。
【請求項2】
前記過去の音処理パラメータ及び前記現在の音処理パラメータには、ノイズリダクション量が含まれており、
前記音処理において、前記現在の音処理パラメータの前記ノイズリダクション量に基づいて、前記音信号にノイズリダクションを行い、
前記ノイズリダクションを行った音信号を送信する、
請求項1に記載の音信号処理方法。
【請求項3】
前記過去の音処理パラメータ及び前記現在の音処理パラメータには、スピーカ音量が含まれており、
前記音処理において、前記現在の音処理パラメータの前記スピーカ音量に基づいて前記音信号の音量を制御し、
前記音量を制御した前記音信号をスピーカに出力する、
請求項1に記載の音信号処理方法。
【請求項4】
前記過去の音処理パラメータ及び前記現在の音処理パラメータには、ノイズリダクション量及びスピーカ音量が含まれており、
前記音信号は、マイクで収音した第1音信号と、他装置から受信した第2音信号と、を含み、
前記音処理において、前記現在の音処理パラメータの前記ノイズリダクション量に基づいて、前記第1音信号にノイズリダクションを行い、
前記ノイズリダクションを行った前記第1音信号を送信し、
前記現在の音処理パラメータの前記スピーカ音量に基づいて前記第2音信号の音量を制御し、
前記音量を制御した前記第2音信号をスピーカに出力する、
請求項1に記載の音信号処理方法。
【請求項5】
前記過去の会議の環境情報及び前記現在の会議の環境情報には、曜日、時間帯、場所、会議人数、会議メンバー、議題、部屋環境の少なくとも一つに関する情報が含まれている、
請求項1に記載の音信号処理方法。
【請求項6】
前記推論アルゴリズムは、蓄積した前記関係に基づいて前記環境情報の入力に対して前記音処理パラメータを出力する所定のネットワークモデルであり、
前記現在の会議の環境情報を前記所定のネットワークモデルに入力して前記現在の音処理パラメータを求める、
請求項1乃至請求項5のいずれか1項に記載の音信号処理方法。
【請求項7】
蓄積した前記関係は、複数の前記過去の会議の環境情報及び複数の前記過去の音処理パラメータを記憶するデータベースであり、
前記推論アルゴリズムは、特定のルールで前記データベースから、前記の現在の会議の環境情報と一致している前記過去の会議の環境情報を探し出し、探し出した前記過去の会議の環境情報に対応する前記過去の音処理パラメータに基づいて、前記現在の音処理パラメータを求める、
請求項1乃至請求項5のいずれか1項に記載の音信号処理方法。
【請求項8】
前記推論アルゴリズムは、二つ以上の前記過去の会議の環境情報を探し出した場合、当該二つ以上の過去の会議の環境情報に対応する二つ以上の前記過去の音処理パラメータに統計処理を用いて前記現在の音処理パラメータを求める、
請求項7に記載の音信号処理方法。
【請求項9】
前記推論アルゴリズムは、前記の現在の会議の環境情報と一致している前記過去の会議の環境情報がない場合、前記データベースに記憶された前記複数の過去の音処理パラメータの全ての平均値、又は前記の現在の会議の環境情報と近似する複数の前記過去の音処理パラメータの平均値を前記現在の音処理パラメータとする、
請求項7に記載の音信号処理方法。
【請求項10】
過去の会議の環境情報と、過去の音処理パラメータと、の関係を蓄積し、
現在の会議の環境情報を取得し、
蓄積した前記関係及び所定の推論アルゴリズムに基づいて、取得した前記現在の会議の環境情報に対応する現在の音処理パラメータを求め、
音信号を受け付け、
求めた前記現在の音処理パラメータに基づいて、受け付けた前記音信号に音処理を施す、
処理を実行するプロセッサを備えた音信号処理装置。
【請求項11】
前記過去の音処理パラメータ及び前記現在の音処理パラメータには、ノイズリダクション量が含まれており、
前記プロセッサは、
前記音処理において、前記現在の音処理パラメータの前記ノイズリダクション量に基づいて、前記音信号にノイズリダクションを行い、
前記ノイズリダクションを行った音信号を送信する、
請求項10に記載の音信号処理装置。
【請求項12】
前記過去の音処理パラメータ及び前記現在の音処理パラメータには、スピーカ音量が含まれており、
前記プロセッサは、
前記音処理において、前記現在の音処理パラメータの前記スピーカ音量に基づいて前記音信号の音量を制御し、
前記音量を制御した前記音信号をスピーカに出力する、
請求項10に記載の音信号処理装置。
【請求項13】
前記過去の音処理パラメータ及び前記現在の音処理パラメータには、ノイズリダクション量及びスピーカ音量が含まれており、
前記音信号は、マイクで収音した第1音信号と、他装置から受信した第2音信号と、を含み、
前記プロセッサは、
前記音処理において、前記現在の音処理パラメータの前記ノイズリダクション量に基づいて、前記第1音信号にノイズリダクションを行い、
前記ノイズリダクションを行った前記第1音信号を送信し、
前記現在の音処理パラメータの前記スピーカ音量に基づいて前記第2音信号の音量を制御し、
前記音量を制御した前記第2音信号をスピーカに出力する、
請求項10に記載の音信号処理装置。
【請求項14】
前記過去の会議の環境情報及び前記現在の会議の環境情報には、曜日、時間帯、場所、会議人数、会議メンバー、議題、部屋環境の少なくとも一つに関する情報が含まれている、
請求項10に記載の音信号処理装置。
【請求項15】
過去の会議の環境情報と、過去の音処理パラメータと、の関係を蓄積し、
現在の会議の環境情報を取得し、
蓄積した前記関係及び所定の推論アルゴリズムに基づいて、取得した前記現在の会議の環境情報に対応する現在の音処理パラメータを求め、
音信号を受け付け、
求めた前記現在の音処理パラメータに基づいて、受け付けた前記音信号に音処理を施す、
処理を情報処理装置に実行させる音信号処理プログラム。
【発明の詳細な説明】
【技術分野】
【0001】
本発明の一実施形態は、音信号処理方法、音信号処理装置及び音信号処理プログラムに関する。
【背景技術】
【0002】
特許文献1には、音声を出力する電子機器と、電子機器の位置情報を提供する配信装置及び通信端末と、近辺で行われる会議の会議情報を提供する配信装置及び通信端末と、を備える音量制御システムが開示されている。位置情報には、電子機器の位置が含まされている。会議情報には、少なくとも会議が行われる日時及び場所が含まれている。音量制御システムは、電子機器の位置及び電子機器が動作する日時に行われている会議の場所に基づいて電子機器の最大音量を設定する。具体的に、電子機器の位置と会議の場所とが近い程、電子機器の最大音量を小さくする。
【先行技術文献】
【特許文献】
【0003】
【特許文献1】特開2015-154418号公報
【発明の概要】
【発明が解決しようとする課題】
【0004】
特許文献1の発明は、近辺で重要な会議が行われている場合、会議の状況を把握してプロジェクタ等の音声を出力する機器を手動で調整することが難しい。したがって、特許文献1の発明は、上手く機器を調整できずにその会議に悪い影響を与える虞がある。また、特許文献1の発明は、近辺での会議情報に基づいて調整するものであって、自端末の過去の会議の環境情報に基づくものではない。
【0005】
また、特許文献1の発明は、会議の環境に応じて最適な音処理を行う発明ではない。
【0006】
以上の事情を考慮して、本開示のひとつの態様は、会議の環境に応じて最適な音処理を行う音声処理方法を提供することを目的とする。
【課題を解決するための手段】
【0007】
音信号処理方法は、過去の会議の環境情報と、過去の音処理パラメータと、の関係を蓄積し、現在の会議の環境情報を取得し、蓄積した前記関係及び所定の推論アルゴリズムに基づいて、取得した前記現在の会議の環境情報に対応する現在の音処理パラメータを求め、音信号を受け付け、求めた前記現在の音処理パラメータに基づいて、受け付けた前記音信号に音処理を施す。
【発明の効果】
【0008】
本発明の一実施形態によれば、会議の環境に応じて最適な音処理を行うことができる。
【図面の簡単な説明】
【0009】
図1】音信号処理装置1の構成を示すブロック図である。
図2】プロセッサ12の機能的構成を示すブロック図である。
図3】プロセッサ12の動作を示すフローチャートである。
図4】データベース142を構築する時のプロセッサ12の機能的構成を示すブロック図である。
図5】データベース142に蓄積される関係を示す図である。
図6】取得した現在の会議の環境情報の一例を示す図である。
図7】抽出された環境情報を示す図である。
図8】求めた現在の音処理パラメータを示す図である。
図9】変形例1に係るプロセッサ12の機能ブロック図である。
図10】変形例2に係るプロセッサ12の機能ブロック図である。
図11】変形例3に係るプロセッサ12の機能ブロック図である。
【発明を実施するための形態】
【0010】
図1は、音信号処理装置1の構成を示すブロック図である。音信号処理装置1は、マイク11、プロセッサ12、RAM13、フラッシュメモリ14、通信インタフェース(I/F)15、スピーカ16、及びユーザI/F17を備えている。
【0011】
マイク11は、音声を収音する。プロセッサ12は、マイク11で収音した第1音信号を、通信I/F15を介して他の装置に送信する。また、プロセッサ12は、通信I/F15を介して他の装置から受信した第2音信号をスピーカ16に出力する。スピーカ16は、入力した音信号に基づく音を出力する。
【0012】
プロセッサ12は、CPU、DSP、またはSoC(System on a Chip)等からなる。プロセッサ12は、記憶媒体であるフラッシュメモリ14からプログラムを読み出し、RAM13に一時記憶することで、種々の動作を行う。プログラムは、音信号処理プログラム141を含む。なお、プログラムは、自装置に記憶しておく必要はない。プログラムは、必要な状況に応じて他装置(サーバ)から受信してもよい。
【0013】
フラッシュメモリ14は、プロセッサ12の動作用プログラムを記憶している。例えば、フラッシュメモリ14は、上記音信号処理プログラム141を記憶している。プロセッサ12は、音信号処理プログラム141により、本発明の音信号処理方法を実行する。
【0014】
ユーザI/F17は、例えばリモートコントローラー、ボタン、フェーダー、回転操作子、タッチパネル、マウス、あるいはキーボード等からなる。
【0015】
図2は、プロセッサ12の機能的構成を示すブロック図である。プロセッサ12は、ノイズリダクション121、ノイズ推定器122、環境情報入力部123、及びボリューム制御器124を有する。これら機能的構成は、音信号処理プログラム141により構成される。また、フラッシュメモリ14は、データベース142を有する。
【0016】
ノイズ推定器122は、マイク11で収音した第1音信号に基づいてノイズを推定する。ノイズリダクション121は、ノイズ推定器122で推定したノイズに基づいてマイク11で収音した第1音信号にノイズリダクションを施す。ノイズの推定及びノイズリダクションは、どの様な手法であってもよい。例えば、ノイズ推定器122は、音信号の所定区間のパワースペクトルの平均値をノイズとして推定する。ノイズリダクション121は、ウィーナーフィルタ法やスペクトルサブトラクション法等の所定の手法により、音信号にノイズリダクションを施す。通信I/F15は、ノイズリダクション121の処理後の音信号を他の装置に送信する。
【0017】
また、ボリューム制御器124は、通信I/F15を介して他の装置から受信した第2音信号の音量を調整し、音量を制御した第2音信号をスピーカ16に出力する。スピーカ音量は、ユーザI/F17を介して利用者により受け付ける。なお、ノイズリダクション121におけるノイズリダクション量も、ユーザI/F17を介して利用者により受け付けてもよい。
【0018】
環境情報入力部123は、会議の環境情報を受け付ける。会議の環境情報は、曜日、時間帯、場所、会議人数、会議メンバー、議題、部屋環境の少なくとも一つに関する情報を含む。環境情報入力部123は、会議の環境情報として、例えばインターネットのサーバから現在の曜日及び時間帯の情報を取得する。あるいは、環境情報入力部123は、自装置で管理されている現在の曜日及び時間帯の情報を取得してもよい。会議の場所、会議人数、会議メンバー、議題、及び部屋環境は、ユーザI/F17を介して利用者から受け付ければよい。あるいは、会議の場所は、GPS等の位置情報から取得してもよい。会議人数及び会議メンバーは、不図示のカメラで撮影した画像から推定してもよい。部屋環境は、閉じられた空間(例えば会議室)であるか、オープンスペースであるか、あるいは、部屋の大きさ等の情報を含む。
【0019】
データベース142は、会議の環境情報及び音処理パラメータの関係を蓄積している。音処理パラメータは、本実施形態では、ノイズリダクション121におけるノイズリダクション量(以下、NR量と称する。)及びボリューム制御器124におけるスピーカ音量(以下、SP音量と称する。)である。
【0020】
プロセッサ12は、環境情報入力部123から現在の会議の環境情報を取得し、データベース142に蓄積した前記関係及び所定の推論アルゴリズムに基づいて、取得した現在の会議の環境情報に対応する現在の音処理パラメータを求める。
【0021】
図3は、プロセッサ12により実行される音信号処理方法の動作を示すフローチャートである。プロセッサ12は、過去の会議の環境情報と、過去の音処理パラメータと、の関係をデータベース142に蓄積する(S11)。図4は、データベース142を構築する時のプロセッサ12の機能的構成を示すブロック図である。
【0022】
環境情報入力部123は、会議の環境情報として、例えば現在の曜日及び時間帯の情報を取得する。環境情報入力部123は、取得した現在の曜日及び時間帯の情報をデータベース142に入力する。ノイズ推定器122及びボリューム制御器124は、それぞれ現在のNR量及びスピーカ音量をデータベース142に入力する。
【0023】
図5は、データベース142に蓄積される上記関係を示す図である。データベース142は、環境情報入力部123から取得した現在の曜日及び時間帯の情報と、ノイズ推定器122及びボリューム制御器124から取得した現在のNR量及びスピーカ音量を対応付けて記憶する。図5の例では、データベース142は、会議の環境情報として午前9時及び月曜日の情報と、NR量20dB及びSP音量70dBSPLと、を対応付けて記憶する。また、データベース142は、午前10時及び月曜日の情報と、NR量32dB及びSP音量80dBSPLと、を対応付けて記憶する。また、データベース142は、午前10時及び火曜日の情報と、NR量21dB及びSP音量72dBSPLと、を対応付けて記憶する。このようにして、データベース142は、過去の会議の環境情報と、過去の音処理パラメータと、の関係を蓄積する。
【0024】
図3に戻り、環境情報入力部123は、現在の会議の環境情報を取得する(S12)。図6は、取得した現在の会議の環境情報の一例を示す図である。環境情報入力部123は、例えば、現在の曜日及び時間帯の情報として、午前10時及び水曜日の情報を取得する。
【0025】
ノイズ推定器122及びボリューム制御器124は、それぞれ、データベース142に蓄積した上記関係(過去の会議の環境情報及び音処理パラメータの関係)及び所定の推論アルゴリズムに基づいて、取得した現在の会議の環境情報に対応する現在の音処理パラメータを求める(S13)。
【0026】
所定の推論アルゴリズムとは、例えば、特定のルールでデータベース142から、現在の会議の環境情報と一致している過去の会議の環境情報を探し出し、探し出した過去の会議の環境情報に対応する過去の音処理パラメータに基づいて、現在の音処理パラメータを求めるアルゴリズムである。
【0027】
より具体的には、プロセッサ12は、まず、過去の会議の環境情報のうち最も優先度の高い情報について一致する過去の会議の環境情報を探し出す。この例では、最も優先度の高い情報(優先度1)は、時間帯の情報である。プロセッサ12は、時間帯の情報として現在の午前10時に一致する過去の会議の環境情報を探し出す。図5に示したデータベース142の例において、プロセッサ12は、図7に示す様に、午前10時に一致する番号2及び番号3の環境情報を抽出する。
【0028】
仮に、プロセッサ12は、現在の時間帯の情報で一致する過去の会議の環境情報を探し出すことができなかった場合に、次に優先度の高い情報(優先度2)を用いて過去の会議の環境情報を探し出す。この例では優先度2の情報は、曜日である。プロセッサ12は、現在の時間帯の情報で一致する過去の会議の環境情報を探し出すことができなかった場合に、曜日の一致する過去の会議の環境情報を探し出す。
【0029】
プロセッサ12は、一つの環境情報を抽出した場合には、当該環境情報に対応付いている過去の音処理パラメータを、現在の音処理パラメータとして読み出す。プロセッサ12は、二つ以上の環境情報を抽出した場合には、所定の統計処理を用いて現在の音処理パラメータを求める。所定の統計処理は、例えば平均値、重み付き平均値、中央値、最頻値、または最大値等である。
【0030】
プロセッサ12は、例えば番号2及び番号3に対応付いているNR量及びSP音量の平均値を求める。その結果、プロセッサ12は、図8に示す様に、NR量27dB及びSP音量76dBSPLを現在の音処理パラメータとして求める。
【0031】
なお、プロセッサ12は、現在の会議の環境情報と一致する過去の会議の環境情報がない場合、データベース142における複数の過去の音処理パラメータの全ての平均値、または現在の会議の環境情報と近似する複数の過去の音処理パラメータの平均値を現在の音処理パラメータとしてもよい。
【0032】
図3に戻り、プロセッサ12は、音信号を受け付け(S14)、求めた現在の音処理パラメータに基づいて、受け付けた音信号に音処理を施す(S15)。より具体的には、プロセッサ12は、マイク11で収音した第1音信号に対して、求めたNR量27dBでノイズリダクションを施す。また、プロセッサ12は、通信I/F15を介して他の装置から受信した第2音信号の音量を、求めたSP音量76dBSPLに調整し、音量を制御した音信号をスピーカ16に出力する。
【0033】
最適なNR量及びSP音量は、ノイズ量に依存する。ノイズ量に対してNR量が多すぎると、第1音信号に含まれる話者の声の音質が劣化する。ノイズ量に対してNR量が少なすぎると、第1音信号に含まれるノイズが目立つ。また、ノイズ量に対してSP音量が小さすぎると、第2音信号に含まれる遠隔地の話者の音声が聞こえ難い。ノイズ量に対してSP音量が大きすぎると、周囲の人に迷惑になる。一方で、オフィスや自宅等では、時間帯によりノイズ量が異なる場合が多い。例えば午前10時頃~午後3時頃は、オフィスに出勤する人が多くなり、人の声等のノイズ量が多くなる。午前10時より前あるいは、午後3時より後はオフィスに居る人が減り、ノイズ量が少なくなる。また、例えば、月曜日はオフィスに出勤する人が多くなり、金曜日は人が少なくなる。このように、最適な音処理パラメータは、時間帯及び曜日により大きく異なる。このようなノイズ量と環境の関係は、利用者のオフィスや自宅等により異なる。そのため、最適な音処理パラメータを自動的に設定することは非常に難しい。例えば、特開2020-202448号公報に開示された発明は、マイクで収音した音からノイズを推定して、最適なノイズリダクションを行うことができるが、現在のノイズを推定するためには時間がかかり、また遠端側が無音になるまで待つ必要があり最適なノイズリダクションを行うためには時間がかかる。このように、会議の最初から最適な音処理パラメータを自動的に設定することは非常に難しい。これに対して、本実施形態の音信号処理装置1は、過去の会議の環境情報と過去の音処理パラメータの関係を蓄積し、取得した現在の会議の環境情報に対応する現在の音処理パラメータを求めることで、会議の最初から、現在の会議の環境に応じた最適な音処理パラメータを自動的に設定することができる。蓄積された過去の会議の環境情報と過去の音処理パラメータの関係は、利用者毎のオフィスや自宅等の過去の会議の結果により蓄積されている。その結果、利用者は、現在の会議の環境に応じた最適な音処理パラメータが自動的に設定された、最適な音環境で会議を行うという新たな顧客体験を得ることができる。
【0034】
(変形例1)
図9は、変形例1に係るプロセッサ12の機能ブロック図である。上記実施形態では、過去の音処理パラメータ及び現在の音処理パラメータには、NR量及びSP音量の両方が含まれており、音信号は、マイクで収音した第1音信号と、他装置から受信した第2音信号と、を含み、プロセッサ12は、NR量に基づいて第1音信号にノイズリダクションを行い、SP音量に基づいて第2音信号の音量を制御した。
【0035】
これに対して、変形例1では、過去の音処理パラメータ及び現在の音処理パラメータには、NR量が含まれており、プロセッサ12は、NR量に基づいて第1音信号にノイズリダクションを行う。
【0036】
このように、本発明は、SP音量に基づいて第2音信号の音量を制御する処理を省略してもよい。この場合、ボリューム制御器124は、SP音量を、ユーザI/F17を介して利用者により受け付ける。
【0037】
(変形例2)
図10は、変形例2に係るプロセッサ12の機能ブロック図である。変形例2では、過去の音処理パラメータ及び現在の音処理パラメータには、SP音量が含まれており、プロセッサ12は、SP音量に基づいて第2音信号の音量を制御する。
【0038】
このように、本発明は、NR量に基づいて第1音信号にノイズリダクションを施す処理を省略してもよい。
【0039】
(変形例3)
図11は、変形例3に係るプロセッサ12の機能ブロック図である。上記実施形態における推論アルゴリズムは、データベース142から過去の会議の環境情報を読み出して、特定のルールに基づいて現在の音処理パラメータを求めた。
【0040】
変形例3に係る推論アルゴリズムは、蓄積した会議の環境情報及び音処理パラメータの関係に基づいて環境情報の入力に対して音処理パラメータを出力するネットワークモデル151により、現在の音処理パラメータを求める。ネットワークモデル151は、訓練済のディープニューラルネットワークモデル、あるいは重み付きネットワークモデル等の各種のネットワークモデルである。
【0041】
上述した様に、例えば午前10時頃~午後3時頃は、オフィスに出勤する人が多くなり、人の声等のノイズ量が多くなる。午前10時より前あるいは、午後3時より後はオフィスに居る人が減り、ノイズ量が少なくなる。また、例えば、月曜日はオフィスに出勤する人が多くなり、金曜日は人が少なくなる。このように、会議の環境情報及びノイズ量は、相関関係を有する。最適なNR量及びSP音量は、ノイズ量に依存する。つまり、ノイズ量及び音処理パラメータは相関関係を有する。したがって、会議の環境情報及び音処理パラメータは相関関係を有する。よって、ネットワークモデル151は、会議の環境情報及び音処理パラメータの関係を規定することができる。
【0042】
ネットワークモデル151は、環境情報入力部123から現在の会議の環境情報を入力し、現在の音処理パラメータを出力する。このように、音信号処理装置1は、所定のネットワークモデルを用いることでも、現在の音処理パラメータを求めることができる。
【0043】
本実施形態の説明は、すべての点で例示であって、制限的なものではないと考えられるべきである。本発明の範囲は、上述の実施形態ではなく、特許請求の範囲によって示される。さらに、本発明の範囲は、特許請求の範囲と均等の範囲を含む。
【0044】
例えば、音処理パラメータは、上記のNR量及びSP音量に限らない。音処理パラメータは、例えば、オートゲインコントロールにおけるゲインカーブ、ノイズゲートのレベル、収音ビームのビーム到達距離等も含まれる。
【符号の説明】
【0045】
1 :音信号処理装置
11 :マイク
12 :プロセッサ
13 :RAM
14 :フラッシュメモリ
15 :通信I/F
16 :スピーカ
17 :ユーザI/F
121 :ノイズリダクション
122 :ノイズ推定器
123 :環境情報入力部
124 :ボリューム制御器
141 :音信号処理プログラム
142 :データベース
151 :ネットワークモデル
図1
図2
図3
図4
図5
図6
図7
図8
図9
図10
図11