特開2024-130675 | 知財ポータル「IP Force」

知財求人 - 知財ポータルサイト「IP Force」

▶ ヤマハ株式会社の特許一覧

特開2024-130675音信号処理方法、音信号処理装置及び音信号処理プログラム

書誌要約請求の範囲詳細な説明課題実施例実施するための形態図面の説明

目に優しい文字サイズ小中大 PDF Top

<図1>

< >

1
2
3
4
5
6
7
8
9
10
11

(19)【発行国】日本国特許庁(JP)

(12)【公報種別】公開特許公報(A)

(11)【公開番号】P2024130675

(43)【公開日】2024-09-30

(54)【発明の名称】音信号処理方法、音信号処理装置及び音信号処理プログラム

(51)【国際特許分類】

H04R 3/00 20060101AFI20240920BHJP

【ＦＩ】

H04R3/00 320

H04R3/00 310

【審査請求】未請求

【請求項の数】15

【出願形態】ＯＬ

(21)【出願番号】P 2023040533

(22)【出願日】2023-03-15

(71)【出願人】

【識別番号】000004075

【氏名又は名称】ヤマハ株式会社

(74)【代理人】

【識別番号】110000970

【氏名又は名称】弁理士法人楓国際特許事務所

(72)【発明者】

【氏名】鵜飼訓史

【テーマコード（参考）】

5D220

【Ｆターム（参考）】

5D220AA01

5D220AB08

5D220BA30

5D220BB04

(57)【要約】

【課題】話者音声を入力している時のノイズを低減することができる音声処理装置を提供する。
【解決手段】音信号処理方法は、過去の会議の環境情報と、過去の音処理パラメータと、の関係を蓄積し、現在の会議の環境情報を取得し、蓄積した前記関係及び所定の推論アルゴリズムに基づいて、取得した前記現在の会議の環境情報に対応する現在の音処理パラメータを求め、音信号を受け付け、求めた前記現在の音処理パラメータに基づいて、受け付けた前記音信号に音処理を施す。
【選択図】図３

【特許請求の範囲】

【請求項1】

過去の会議の環境情報と、過去の音処理パラメータと、の関係を蓄積し、
現在の会議の環境情報を取得し、
蓄積した前記関係及び所定の推論アルゴリズムに基づいて、取得した前記現在の会議の環境情報に対応する現在の音処理パラメータを求め、
音信号を受け付け、
求めた前記現在の音処理パラメータに基づいて、受け付けた前記音信号に音処理を施す、
音信号処理方法。

【請求項2】

前記過去の音処理パラメータ及び前記現在の音処理パラメータには、ノイズリダクション量が含まれており、
前記音処理において、前記現在の音処理パラメータの前記ノイズリダクション量に基づいて、前記音信号にノイズリダクションを行い、
前記ノイズリダクションを行った音信号を送信する、
請求項１に記載の音信号処理方法。

【請求項3】

前記過去の音処理パラメータ及び前記現在の音処理パラメータには、スピーカ音量が含まれており、
前記音処理において、前記現在の音処理パラメータの前記スピーカ音量に基づいて前記音信号の音量を制御し、
前記音量を制御した前記音信号をスピーカに出力する、
請求項１に記載の音信号処理方法。

【請求項4】

前記過去の音処理パラメータ及び前記現在の音処理パラメータには、ノイズリダクション量及びスピーカ音量が含まれており、
前記音信号は、マイクで収音した第１音信号と、他装置から受信した第２音信号と、を含み、
前記音処理において、前記現在の音処理パラメータの前記ノイズリダクション量に基づいて、前記第１音信号にノイズリダクションを行い、
前記ノイズリダクションを行った前記第１音信号を送信し、
前記現在の音処理パラメータの前記スピーカ音量に基づいて前記第２音信号の音量を制御し、
前記音量を制御した前記第２音信号をスピーカに出力する、
請求項１に記載の音信号処理方法。

【請求項5】

前記過去の会議の環境情報及び前記現在の会議の環境情報には、曜日、時間帯、場所、会議人数、会議メンバー、議題、部屋環境の少なくとも一つに関する情報が含まれている、
請求項１に記載の音信号処理方法。

【請求項6】

前記推論アルゴリズムは、蓄積した前記関係に基づいて前記環境情報の入力に対して前記音処理パラメータを出力する所定のネットワークモデルであり、
前記現在の会議の環境情報を前記所定のネットワークモデルに入力して前記現在の音処理パラメータを求める、
請求項１乃至請求項５のいずれか１項に記載の音信号処理方法。

【請求項7】

蓄積した前記関係は、複数の前記過去の会議の環境情報及び複数の前記過去の音処理パラメータを記憶するデータベースであり、
前記推論アルゴリズムは、特定のルールで前記データベースから、前記の現在の会議の環境情報と一致している前記過去の会議の環境情報を探し出し、探し出した前記過去の会議の環境情報に対応する前記過去の音処理パラメータに基づいて、前記現在の音処理パラメータを求める、
請求項１乃至請求項５のいずれか１項に記載の音信号処理方法。

【請求項8】

前記推論アルゴリズムは、二つ以上の前記過去の会議の環境情報を探し出した場合、当該二つ以上の過去の会議の環境情報に対応する二つ以上の前記過去の音処理パラメータに統計処理を用いて前記現在の音処理パラメータを求める、
請求項７に記載の音信号処理方法。

【請求項9】

前記推論アルゴリズムは、前記の現在の会議の環境情報と一致している前記過去の会議の環境情報がない場合、前記データベースに記憶された前記複数の過去の音処理パラメータの全ての平均値、又は前記の現在の会議の環境情報と近似する複数の前記過去の音処理パラメータの平均値を前記現在の音処理パラメータとする、
請求項７に記載の音信号処理方法。

【請求項10】

【請求項11】

前記過去の音処理パラメータ及び前記現在の音処理パラメータには、ノイズリダクション量が含まれており、
前記プロセッサは、
前記音処理において、前記現在の音処理パラメータの前記ノイズリダクション量に基づいて、前記音信号にノイズリダクションを行い、
前記ノイズリダクションを行った音信号を送信する、
請求項１０に記載の音信号処理装置。

【請求項12】

前記過去の音処理パラメータ及び前記現在の音処理パラメータには、スピーカ音量が含まれており、
前記プロセッサは、
前記音処理において、前記現在の音処理パラメータの前記スピーカ音量に基づいて前記音信号の音量を制御し、
前記音量を制御した前記音信号をスピーカに出力する、
請求項１０に記載の音信号処理装置。

【請求項13】

前記過去の音処理パラメータ及び前記現在の音処理パラメータには、ノイズリダクション量及びスピーカ音量が含まれており、
前記音信号は、マイクで収音した第１音信号と、他装置から受信した第２音信号と、を含み、
前記プロセッサは、
前記音処理において、前記現在の音処理パラメータの前記ノイズリダクション量に基づいて、前記第１音信号にノイズリダクションを行い、
前記ノイズリダクションを行った前記第１音信号を送信し、
前記現在の音処理パラメータの前記スピーカ音量に基づいて前記第２音信号の音量を制御し、
前記音量を制御した前記第２音信号をスピーカに出力する、
請求項１０に記載の音信号処理装置。

【請求項14】

前記過去の会議の環境情報及び前記現在の会議の環境情報には、曜日、時間帯、場所、会議人数、会議メンバー、議題、部屋環境の少なくとも一つに関する情報が含まれている、
請求項１０に記載の音信号処理装置。

【請求項15】

【発明の詳細な説明】

【技術分野】

【0001】

本発明の一実施形態は、音信号処理方法、音信号処理装置及び音信号処理プログラムに関する。

【背景技術】

【0002】

特許文献１には、音声を出力する電子機器と、電子機器の位置情報を提供する配信装置及び通信端末と、近辺で行われる会議の会議情報を提供する配信装置及び通信端末と、を備える音量制御システムが開示されている。位置情報には、電子機器の位置が含まされている。会議情報には、少なくとも会議が行われる日時及び場所が含まれている。音量制御システムは、電子機器の位置及び電子機器が動作する日時に行われている会議の場所に基づいて電子機器の最大音量を設定する。具体的に、電子機器の位置と会議の場所とが近い程、電子機器の最大音量を小さくする。

【先行技術文献】

【特許文献】

【0003】

【特許文献1】特開２０１５－１５４４１８号公報

【発明の概要】

【発明が解決しようとする課題】

【0004】

特許文献１の発明は、近辺で重要な会議が行われている場合、会議の状況を把握してプロジェクタ等の音声を出力する機器を手動で調整することが難しい。したがって、特許文献１の発明は、上手く機器を調整できずにその会議に悪い影響を与える虞がある。また、特許文献１の発明は、近辺での会議情報に基づいて調整するものであって、自端末の過去の会議の環境情報に基づくものではない。

【0005】

また、特許文献１の発明は、会議の環境に応じて最適な音処理を行う発明ではない。

【0006】

以上の事情を考慮して、本開示のひとつの態様は、会議の環境に応じて最適な音処理を行う音声処理方法を提供することを目的とする。

【課題を解決するための手段】

【0007】

音信号処理方法は、過去の会議の環境情報と、過去の音処理パラメータと、の関係を蓄積し、現在の会議の環境情報を取得し、蓄積した前記関係及び所定の推論アルゴリズムに基づいて、取得した前記現在の会議の環境情報に対応する現在の音処理パラメータを求め、音信号を受け付け、求めた前記現在の音処理パラメータに基づいて、受け付けた前記音信号に音処理を施す。

【発明の効果】

【0008】

本発明の一実施形態によれば、会議の環境に応じて最適な音処理を行うことができる。

【図面の簡単な説明】

【0009】

【図1】音信号処理装置１の構成を示すブロック図である。

【図2】プロセッサ１２の機能的構成を示すブロック図である。

【図3】プロセッサ１２の動作を示すフローチャートである。

【図4】データベース１４２を構築する時のプロセッサ１２の機能的構成を示すブロック図である。

【図5】データベース１４２に蓄積される関係を示す図である。

【図6】取得した現在の会議の環境情報の一例を示す図である。

【図7】抽出された環境情報を示す図である。

【図8】求めた現在の音処理パラメータを示す図である。

【図9】変形例１に係るプロセッサ１２の機能ブロック図である。

【図10】変形例２に係るプロセッサ１２の機能ブロック図である。

【図11】変形例３に係るプロセッサ１２の機能ブロック図である。

【発明を実施するための形態】

【0010】

図１は、音信号処理装置１の構成を示すブロック図である。音信号処理装置１は、マイク１１、プロセッサ１２、ＲＡＭ１３、フラッシュメモリ１４、通信インタフェース（Ｉ／Ｆ）１５、スピーカ１６、及びユーザＩ／Ｆ１７を備えている。

【0011】

マイク１１は、音声を収音する。プロセッサ１２は、マイク１１で収音した第１音信号を、通信Ｉ／Ｆ１５を介して他の装置に送信する。また、プロセッサ１２は、通信Ｉ／Ｆ１５を介して他の装置から受信した第２音信号をスピーカ１６に出力する。スピーカ１６は、入力した音信号に基づく音を出力する。

【0012】

プロセッサ１２は、ＣＰＵ、ＤＳＰ、またはＳｏＣ（ＳｙｓｔｅｍｏｎａＣｈｉｐ）等からなる。プロセッサ１２は、記憶媒体であるフラッシュメモリ１４からプログラムを読み出し、ＲＡＭ１３に一時記憶することで、種々の動作を行う。プログラムは、音信号処理プログラム１４１を含む。なお、プログラムは、自装置に記憶しておく必要はない。プログラムは、必要な状況に応じて他装置（サーバ）から受信してもよい。

【0013】

フラッシュメモリ１４は、プロセッサ１２の動作用プログラムを記憶している。例えば、フラッシュメモリ１４は、上記音信号処理プログラム１４１を記憶している。プロセッサ１２は、音信号処理プログラム１４１により、本発明の音信号処理方法を実行する。

【0014】

ユーザＩ／Ｆ１７は、例えばリモートコントローラー、ボタン、フェーダー、回転操作子、タッチパネル、マウス、あるいはキーボード等からなる。

【0015】

図２は、プロセッサ１２の機能的構成を示すブロック図である。プロセッサ１２は、ノイズリダクション１２１、ノイズ推定器１２２、環境情報入力部１２３、及びボリューム制御器１２４を有する。これら機能的構成は、音信号処理プログラム１４１により構成される。また、フラッシュメモリ１４は、データベース１４２を有する。

【0016】

ノイズ推定器１２２は、マイク１１で収音した第１音信号に基づいてノイズを推定する。ノイズリダクション１２１は、ノイズ推定器１２２で推定したノイズに基づいてマイク１１で収音した第１音信号にノイズリダクションを施す。ノイズの推定及びノイズリダクションは、どの様な手法であってもよい。例えば、ノイズ推定器１２２は、音信号の所定区間のパワースペクトルの平均値をノイズとして推定する。ノイズリダクション１２１は、ウィーナーフィルタ法やスペクトルサブトラクション法等の所定の手法により、音信号にノイズリダクションを施す。通信Ｉ／Ｆ１５は、ノイズリダクション１２１の処理後の音信号を他の装置に送信する。

【0017】

また、ボリューム制御器１２４は、通信Ｉ／Ｆ１５を介して他の装置から受信した第２音信号の音量を調整し、音量を制御した第２音信号をスピーカ１６に出力する。スピーカ音量は、ユーザＩ／Ｆ１７を介して利用者により受け付ける。なお、ノイズリダクション１２１におけるノイズリダクション量も、ユーザＩ／Ｆ１７を介して利用者により受け付けてもよい。

【0018】

環境情報入力部１２３は、会議の環境情報を受け付ける。会議の環境情報は、曜日、時間帯、場所、会議人数、会議メンバー、議題、部屋環境の少なくとも一つに関する情報を含む。環境情報入力部１２３は、会議の環境情報として、例えばインターネットのサーバから現在の曜日及び時間帯の情報を取得する。あるいは、環境情報入力部１２３は、自装置で管理されている現在の曜日及び時間帯の情報を取得してもよい。会議の場所、会議人数、会議メンバー、議題、及び部屋環境は、ユーザＩ／Ｆ１７を介して利用者から受け付ければよい。あるいは、会議の場所は、ＧＰＳ等の位置情報から取得してもよい。会議人数及び会議メンバーは、不図示のカメラで撮影した画像から推定してもよい。部屋環境は、閉じられた空間（例えば会議室）であるか、オープンスペースであるか、あるいは、部屋の大きさ等の情報を含む。

【0019】

データベース１４２は、会議の環境情報及び音処理パラメータの関係を蓄積している。音処理パラメータは、本実施形態では、ノイズリダクション１２１におけるノイズリダクション量（以下、ＮＲ量と称する。）及びボリューム制御器１２４におけるスピーカ音量（以下、ＳＰ音量と称する。）である。

【0020】

プロセッサ１２は、環境情報入力部１２３から現在の会議の環境情報を取得し、データベース１４２に蓄積した前記関係及び所定の推論アルゴリズムに基づいて、取得した現在の会議の環境情報に対応する現在の音処理パラメータを求める。

【0021】

図３は、プロセッサ１２により実行される音信号処理方法の動作を示すフローチャートである。プロセッサ１２は、過去の会議の環境情報と、過去の音処理パラメータと、の関係をデータベース１４２に蓄積する（Ｓ１１）。図４は、データベース１４２を構築する時のプロセッサ１２の機能的構成を示すブロック図である。

【0022】

環境情報入力部１２３は、会議の環境情報として、例えば現在の曜日及び時間帯の情報を取得する。環境情報入力部１２３は、取得した現在の曜日及び時間帯の情報をデータベース１４２に入力する。ノイズ推定器１２２及びボリューム制御器１２４は、それぞれ現在のＮＲ量及びスピーカ音量をデータベース１４２に入力する。

【0023】

図５は、データベース１４２に蓄積される上記関係を示す図である。データベース１４２は、環境情報入力部１２３から取得した現在の曜日及び時間帯の情報と、ノイズ推定器１２２及びボリューム制御器１２４から取得した現在のＮＲ量及びスピーカ音量を対応付けて記憶する。図５の例では、データベース１４２は、会議の環境情報として午前９時及び月曜日の情報と、ＮＲ量２０ｄＢ及びＳＰ音量７０ｄＢＳＰＬと、を対応付けて記憶する。また、データベース１４２は、午前１０時及び月曜日の情報と、ＮＲ量３２ｄＢ及びＳＰ音量８０ｄＢＳＰＬと、を対応付けて記憶する。また、データベース１４２は、午前１０時及び火曜日の情報と、ＮＲ量２１ｄＢ及びＳＰ音量７２ｄＢＳＰＬと、を対応付けて記憶する。このようにして、データベース１４２は、過去の会議の環境情報と、過去の音処理パラメータと、の関係を蓄積する。

【0024】

図３に戻り、環境情報入力部１２３は、現在の会議の環境情報を取得する（Ｓ１２）。図６は、取得した現在の会議の環境情報の一例を示す図である。環境情報入力部１２３は、例えば、現在の曜日及び時間帯の情報として、午前１０時及び水曜日の情報を取得する。

【0025】

ノイズ推定器１２２及びボリューム制御器１２４は、それぞれ、データベース１４２に蓄積した上記関係（過去の会議の環境情報及び音処理パラメータの関係）及び所定の推論アルゴリズムに基づいて、取得した現在の会議の環境情報に対応する現在の音処理パラメータを求める（Ｓ１３）。

【0026】

所定の推論アルゴリズムとは、例えば、特定のルールでデータベース１４２から、現在の会議の環境情報と一致している過去の会議の環境情報を探し出し、探し出した過去の会議の環境情報に対応する過去の音処理パラメータに基づいて、現在の音処理パラメータを求めるアルゴリズムである。

【0027】

より具体的には、プロセッサ１２は、まず、過去の会議の環境情報のうち最も優先度の高い情報について一致する過去の会議の環境情報を探し出す。この例では、最も優先度の高い情報（優先度１）は、時間帯の情報である。プロセッサ１２は、時間帯の情報として現在の午前１０時に一致する過去の会議の環境情報を探し出す。図５に示したデータベース１４２の例において、プロセッサ１２は、図７に示す様に、午前１０時に一致する番号２及び番号３の環境情報を抽出する。

【0028】

仮に、プロセッサ１２は、現在の時間帯の情報で一致する過去の会議の環境情報を探し出すことができなかった場合に、次に優先度の高い情報（優先度２）を用いて過去の会議の環境情報を探し出す。この例では優先度２の情報は、曜日である。プロセッサ１２は、現在の時間帯の情報で一致する過去の会議の環境情報を探し出すことができなかった場合に、曜日の一致する過去の会議の環境情報を探し出す。

【0029】

プロセッサ１２は、一つの環境情報を抽出した場合には、当該環境情報に対応付いている過去の音処理パラメータを、現在の音処理パラメータとして読み出す。プロセッサ１２は、二つ以上の環境情報を抽出した場合には、所定の統計処理を用いて現在の音処理パラメータを求める。所定の統計処理は、例えば平均値、重み付き平均値、中央値、最頻値、または最大値等である。

【0030】

プロセッサ１２は、例えば番号２及び番号３に対応付いているＮＲ量及びＳＰ音量の平均値を求める。その結果、プロセッサ１２は、図８に示す様に、ＮＲ量２７ｄＢ及びＳＰ音量７６ｄＢＳＰＬを現在の音処理パラメータとして求める。

【0031】

なお、プロセッサ１２は、現在の会議の環境情報と一致する過去の会議の環境情報がない場合、データベース１４２における複数の過去の音処理パラメータの全ての平均値、または現在の会議の環境情報と近似する複数の過去の音処理パラメータの平均値を現在の音処理パラメータとしてもよい。

【0032】

図３に戻り、プロセッサ１２は、音信号を受け付け（Ｓ１４）、求めた現在の音処理パラメータに基づいて、受け付けた音信号に音処理を施す（Ｓ１５）。より具体的には、プロセッサ１２は、マイク１１で収音した第１音信号に対して、求めたＮＲ量２７ｄＢでノイズリダクションを施す。また、プロセッサ１２は、通信Ｉ／Ｆ１５を介して他の装置から受信した第２音信号の音量を、求めたＳＰ音量７６ｄＢＳＰＬに調整し、音量を制御した音信号をスピーカ１６に出力する。

【0033】

最適なＮＲ量及びＳＰ音量は、ノイズ量に依存する。ノイズ量に対してＮＲ量が多すぎると、第１音信号に含まれる話者の声の音質が劣化する。ノイズ量に対してＮＲ量が少なすぎると、第１音信号に含まれるノイズが目立つ。また、ノイズ量に対してＳＰ音量が小さすぎると、第２音信号に含まれる遠隔地の話者の音声が聞こえ難い。ノイズ量に対してＳＰ音量が大きすぎると、周囲の人に迷惑になる。一方で、オフィスや自宅等では、時間帯によりノイズ量が異なる場合が多い。例えば午前１０時頃～午後３時頃は、オフィスに出勤する人が多くなり、人の声等のノイズ量が多くなる。午前１０時より前あるいは、午後３時より後はオフィスに居る人が減り、ノイズ量が少なくなる。また、例えば、月曜日はオフィスに出勤する人が多くなり、金曜日は人が少なくなる。このように、最適な音処理パラメータは、時間帯及び曜日により大きく異なる。このようなノイズ量と環境の関係は、利用者のオフィスや自宅等により異なる。そのため、最適な音処理パラメータを自動的に設定することは非常に難しい。例えば、特開２０２０－２０２４４８号公報に開示された発明は、マイクで収音した音からノイズを推定して、最適なノイズリダクションを行うことができるが、現在のノイズを推定するためには時間がかかり、また遠端側が無音になるまで待つ必要があり最適なノイズリダクションを行うためには時間がかかる。このように、会議の最初から最適な音処理パラメータを自動的に設定することは非常に難しい。これに対して、本実施形態の音信号処理装置１は、過去の会議の環境情報と過去の音処理パラメータの関係を蓄積し、取得した現在の会議の環境情報に対応する現在の音処理パラメータを求めることで、会議の最初から、現在の会議の環境に応じた最適な音処理パラメータを自動的に設定することができる。蓄積された過去の会議の環境情報と過去の音処理パラメータの関係は、利用者毎のオフィスや自宅等の過去の会議の結果により蓄積されている。その結果、利用者は、現在の会議の環境に応じた最適な音処理パラメータが自動的に設定された、最適な音環境で会議を行うという新たな顧客体験を得ることができる。

【0034】

（変形例１）
図９は、変形例１に係るプロセッサ１２の機能ブロック図である。上記実施形態では、過去の音処理パラメータ及び現在の音処理パラメータには、ＮＲ量及びＳＰ音量の両方が含まれており、音信号は、マイクで収音した第１音信号と、他装置から受信した第２音信号と、を含み、プロセッサ１２は、ＮＲ量に基づいて第１音信号にノイズリダクションを行い、ＳＰ音量に基づいて第２音信号の音量を制御した。

【0035】

これに対して、変形例１では、過去の音処理パラメータ及び現在の音処理パラメータには、ＮＲ量が含まれており、プロセッサ１２は、ＮＲ量に基づいて第１音信号にノイズリダクションを行う。

【0036】

このように、本発明は、ＳＰ音量に基づいて第２音信号の音量を制御する処理を省略してもよい。この場合、ボリューム制御器１２４は、ＳＰ音量を、ユーザＩ／Ｆ１７を介して利用者により受け付ける。

【0037】

（変形例２）
図１０は、変形例２に係るプロセッサ１２の機能ブロック図である。変形例２では、過去の音処理パラメータ及び現在の音処理パラメータには、ＳＰ音量が含まれており、プロセッサ１２は、ＳＰ音量に基づいて第２音信号の音量を制御する。

【0038】

このように、本発明は、ＮＲ量に基づいて第１音信号にノイズリダクションを施す処理を省略してもよい。

【0039】

（変形例３）
図１１は、変形例３に係るプロセッサ１２の機能ブロック図である。上記実施形態における推論アルゴリズムは、データベース１４２から過去の会議の環境情報を読み出して、特定のルールに基づいて現在の音処理パラメータを求めた。

【0040】

変形例３に係る推論アルゴリズムは、蓄積した会議の環境情報及び音処理パラメータの関係に基づいて環境情報の入力に対して音処理パラメータを出力するネットワークモデル１５１により、現在の音処理パラメータを求める。ネットワークモデル１５１は、訓練済のディープニューラルネットワークモデル、あるいは重み付きネットワークモデル等の各種のネットワークモデルである。

【0041】

上述した様に、例えば午前１０時頃～午後３時頃は、オフィスに出勤する人が多くなり、人の声等のノイズ量が多くなる。午前１０時より前あるいは、午後３時より後はオフィスに居る人が減り、ノイズ量が少なくなる。また、例えば、月曜日はオフィスに出勤する人が多くなり、金曜日は人が少なくなる。このように、会議の環境情報及びノイズ量は、相関関係を有する。最適なＮＲ量及びＳＰ音量は、ノイズ量に依存する。つまり、ノイズ量及び音処理パラメータは相関関係を有する。したがって、会議の環境情報及び音処理パラメータは相関関係を有する。よって、ネットワークモデル１５１は、会議の環境情報及び音処理パラメータの関係を規定することができる。

【0042】

ネットワークモデル１５１は、環境情報入力部１２３から現在の会議の環境情報を入力し、現在の音処理パラメータを出力する。このように、音信号処理装置１は、所定のネットワークモデルを用いることでも、現在の音処理パラメータを求めることができる。

【0043】

本実施形態の説明は、すべての点で例示であって、制限的なものではないと考えられるべきである。本発明の範囲は、上述の実施形態ではなく、特許請求の範囲によって示される。さらに、本発明の範囲は、特許請求の範囲と均等の範囲を含む。

【0044】

例えば、音処理パラメータは、上記のＮＲ量及びＳＰ音量に限らない。音処理パラメータは、例えば、オートゲインコントロールにおけるゲインカーブ、ノイズゲートのレベル、収音ビームのビーム到達距離等も含まれる。

【符号の説明】

【0045】

１：音信号処理装置
１１：マイク
１２：プロセッサ
１３：ＲＡＭ
１４：フラッシュメモリ
１５：通信Ｉ／Ｆ
１６：スピーカ
１７：ユーザＩ／Ｆ
１２１：ノイズリダクション
１２２：ノイズ推定器
１２３：環境情報入力部
１２４：ボリューム制御器
１４１：音信号処理プログラム
１４２：データベース
１５１：ネットワークモデル

【図1】