IP Force 特許公報掲載プロジェクト 2022.1.31 β版

知財求人 - 知財ポータルサイト「IP Force」

▶ 日本キャステム株式会社の特許一覧

<>
  • 特開-音声通話装置およびプログラム 図1
  • 特開-音声通話装置およびプログラム 図2
  • 特開-音声通話装置およびプログラム 図3
  • 特開-音声通話装置およびプログラム 図4
  • 特開-音声通話装置およびプログラム 図5
  • 特開-音声通話装置およびプログラム 図6
  • 特開-音声通話装置およびプログラム 図7
  • 特開-音声通話装置およびプログラム 図8
  • 特開-音声通話装置およびプログラム 図9
  • 特開-音声通話装置およびプログラム 図10
  • 特開-音声通話装置およびプログラム 図11
  • 特開-音声通話装置およびプログラム 図12
  • 特開-音声通話装置およびプログラム 図13
  • 特開-音声通話装置およびプログラム 図14
  • 特開-音声通話装置およびプログラム 図15
  • 特開-音声通話装置およびプログラム 図16
  • 特開-音声通話装置およびプログラム 図17
  • 特開-音声通話装置およびプログラム 図18
< >
(19)【発行国】日本国特許庁(JP)
(12)【公報種別】公開特許公報(A)
(11)【公開番号】P2024177954
(43)【公開日】2024-12-24
(54)【発明の名称】音声通話装置およびプログラム
(51)【国際特許分類】
   H04R 3/00 20060101AFI20241217BHJP
   H04R 1/40 20060101ALI20241217BHJP
   H04R 3/02 20060101ALI20241217BHJP
   H04B 3/23 20060101ALI20241217BHJP
【FI】
H04R3/00 320
H04R1/40 320Z
H04R3/02
H04B3/23
【審査請求】有
【請求項の数】7
【出願形態】OL
(21)【出願番号】P 2023096398
(22)【出願日】2023-06-12
(71)【出願人】
【識別番号】594009302
【氏名又は名称】日本キャステム株式会社
(74)【代理人】
【識別番号】110000121
【氏名又は名称】IAT弁理士法人
(72)【発明者】
【氏名】阿部 拓夫
【テーマコード(参考)】
5D220
5K046
【Fターム(参考)】
5D220BA06
5D220BB03
5D220BC05
5D220CC04
5D220CC06
5K046AA01
5K046HH57
5K046HH61
5K046HH69
5K046HH79
(57)【要約】
【課題】 スピーカと、複数のマイクを備え、近端から遠端への音声通話を行う音声通話装置において、複数のマイクに入力する音声信号に指向性を与え、また、スピーカから出力される音声による生ずるエコーを抑制できる音声通話装置を提供する。
【解決手段】 音声信号に指向性を与えるビームフォーマ部は、複数のマイク間の特性を適応フィルタで推定し、推定したフィルタ係数を周波数領域に展開して、マイク間の位相差を求めて、指向性を付与する。また、周波数領域の所定の幅でノイズを抑制してから、スピーカから出力された音声信号によって生ずるエコーを抑制し、さらにハウリング抑制を行うように、近端から遠端への経路で音声処理を行う。
【選択図】図1

【特許請求の範囲】
【請求項1】
複数のマイクを備え、前記複数のマイクの一つを基準マイクとし、前記複数のマイクに入力される音声について、所望の方向から到来する音声を通過させ、他の方向から到来する音声を抑圧する指向性を付与するビームフォーマ部を備えた音声通話装置であって、
前記ビームフォーマ部は、
前記複数のマイクから入力した音声信号を用いて、マイク間特性フィルタ係数を推定する適応フィルタである遅延分析部と、
前記推定された前記マイク間特性フィルタ係数を周波数領域に変換して、前記複数のマイクから入力した音声信号の位相差を検出し、前記複数のマイクに入力される音声の通過域または阻止域の指向性方向を決定する指向性分析部と、
前記指向性分析部で決定された通過方向の音声は、通過させ、阻止方向の音声を阻止する指向性を付与するフィルタ係数を生成して時間領域に変換し、変換されたフィルタ係数で前記基準マイク以外の他のマイクからの音声信号に重みづけ処理する指向性フィルタ部と、
前記基準マイクから入力した音声信号から前記指向性フィルタ部で重みづけ処理した他のマイクからの音声信号を減算して通過方向の音声信号を通過させる減算部と
を備えたことを特徴とする音声通話装置。
【請求項2】
送話入力端に入力された音声信号を送話出力端から出力し、受話入力端に入力された音声信号を受話出力端のスピーカから出力し、
前記送話入力端と前記送話出力端との間に設けられ、前記受話出力端から出力された音声信号により生ずるエコーを抑圧するエコーキャンセラ
を備えた音声通話装置であって、
前記エコーキャンセラは、
前記送話入力端に入力される音声信号に対して、周波数変換して所定の周波数幅の領域のノイズを検出して、所定の周波数幅ごとのノイズ成分を抑圧するノイズ抑圧部と、
前記受話出力端のスピーカから出力された受話音声信号による疑似反響信号を推定する適応フィルタを有して前記ノイズ抑圧部でノイズ成分が抑圧された音声信号からエコーを抑圧するエコー抑圧部と、
エコー抑圧された音声信号に対してハウリング抑圧処理を行うハウリング抑圧部と
を備えることを特徴とする音声通話装置。
【請求項3】
請求項2に記載の音声通話装置の送話入力端に、請求項1記載のビームフォーマ部の出力が接続された
ことを特徴とする音声通話装置。
【請求項4】
請求項3記載の音声通話装置であって、
前記遅延分析部は、
前記エコー抑圧部の適応フィルタが推定動作中に適応動作する動作中マイク間特性推定適応フィルタと、推定動作中でないときに適応動作する非動作中マイク間特性推定適応フィルタとを備え、
前記受話出力端に前記受話入力端の音声信号が出力して前記エコー抑圧部の適応フィルタが推定動作中は、前記動作中マイク間特性推定適応フィルタを動作させ、前記受話出力端に音声信号が出力していないときは、前記非動作中マイク間特性推定適応フィルタを動作させる
ことを特徴とする音声通話装置。
【請求項5】
請求項4に記載の音声通話装置であって、
前記エコー抑圧部は、前記エコーを抑圧できた推定フィルタ係数を初期値として記憶する記憶部を有し、
前記遅延分析部は、前記動作中マイク間特性推定フィルタで推定したフィルタ係数を初期値として記憶する記憶部を有する、
ことを特徴とする音声通話装置。
【請求項6】
コンピュータに、
複数のマイクを備え、前記複数のマイクの一つを基準マイクとし、前記複数のマイクに入力される音声について、所望の方向から到来する音声を通過させ、他の方向から到来する音声を抑圧する指向性を付与するビームフォーマ部であって、
前記複数のマイクから入力した音声信号を用いて、マイク間特性フィルタ係数を推定する適応フィルタである遅延分析部と、
前記推定された前記マイク間特性フィルタ係数を周波数領域に変換して、前記複数のマイクから入力した音声信号の位相差を検出し、前記複数のマイクに入力される音声の通過域または阻止域の指向性方向を決定する指向性分析部と、
前記指向性分析部で決定された通過方向の音声は、通過させ、阻止方向の音声を阻止する指向性を付与するフィルタ係数を生成して時間領域に変換し、変換されたフィルタ係数で前記基準マイク以外の他のマイクからの音声信号に重みづけ処理する指向性フィルタ部と、
前記基準マイクから入力した音声信号から前記指向性フィルタ部で重みづけ処理した他のマイクからの音声信号を減算して通過方向の音声信号を通過させる減算部と
の処理を実行させるプログラム。
【請求項7】
コンピュータに
送話入力端に入力された音声信号を送話出力端から出力し、受話入力端に入力された音声信号を受話出力端のスピーカから出力し、
前記送話入力端と前記送話出力端との間に設けられ、前記受話出力端から出力された音声信号により生ずるエコーを抑制するエコーキャンセラ
を備えた音声通話装置であって、
前記エコーキャンセラが、
前記送話入力端に入力される音声信号に対して、周波数変換して所定の周波数幅の領域のノイズを検出して、所定の周波数幅ごとのノイズ成分を抑圧し、
前記受話出力端のスピーカから出力された受話音声信号による疑似反響信号を推定する適応フィルタを有してノイズ成分が抑圧された音声信号からエコーを抑圧し、
エコー抑圧された音声信号に対してハウリング抑圧を行う
処理を実行させるプログラム。
【発明の詳細な説明】
【技術分野】
【0001】
本発明は、音声通話装置およびプログラムに関する。
【背景技術】
【0002】
異なる空間の間で会話ができるようにするため、相手話者の音声を拡声するスピーカと、音声を入力するマイクとを備えた音声通話装置がある。特に、ハンズフリー通話に対応した装置では、スピーカから拡声された音声が、マイクに入力される、エコー(反響音)により、相手話者にとって発話した声が遅れて聞こえることで会話を妨げるため、スピーカとマイクとの間で生ずるエコーをキャンセルするエコーキャンセラが使用されている。また、マイク周辺のノイズが不快である場合には、ノイズ抑圧を行うことが一般的となっている。
【0003】
エコーキャンセラは、スピーカとマイクとの信号から適応フィルタによって、線形フィルタを推定し、マイクからの信号から減算することで、エコーの減衰を実現している。しかし、マイクの信号にスピーカに由来しない成分が多く混在すると、エコーの減衰の妨げになる。このため、背景騒音ノイズの大きさとエコー減衰の困難さに応じて挿入損失量の方式を変える方法が提案されている。(例えば特許文献1参照)。
【0004】
また、同じ空間内での会話を行う音声通話装置として、自動車内の運転者と後部座席の人との間でハンズフリーで会話を行う音声通話装置が提案されている(特許文献2)。さらに、ビームフォーマと言われる音源定位、音源分離を行う手法が知られている(非特許文献1)。
【先行技術文献】
【特許文献】
【0005】
【特許文献1】特開2007-324675号公報
【特許文献2】特開2015-713210号公報
【非特許文献1】浅野太著 音響テクノロジーシリーズ1 “音のアレイ信号処理-音源の定位・追跡と分離-”日本音響学会編,コロナ社,2011
【発明の概要】
【発明が解決しようとする課題】
【0006】
一つの空間内に、二つの音声通話装置を置いて、ハンズフリー通話を行おうとすることがある。このような要望が行われる場所では、背景雑音が会話の妨げになる、あるいは生の声では聞き取りづらいなどの現象がある。また、異なる空間で会話ができる音声通話装置を一つの空間で複数接続して会話を行う場合では、一つの空間内でノイズが発生していると、双方の装置のマイクにノイズが入力されることで、エコーキャンセラに期待するエコー減衰量が得られない、あるいはハウリングの原因になるなどの問題があった。
【0007】
また、特許文献2で提案された自動車内でハンズフリーで通話を行う音声通話装置は、話者を認識するには、話者がマイクに向かって話していることをカメラ装置を用いて判定して話者を判定している。このため、カメラ装置や撮像画像で話者を判断するための情報処理が必要で、処理が複雑になり、また装置のコストが大きくなる。
【0008】
本発明は、かかる問題に鑑みてなされたものであり、その目的とするところは、同じ空間内において離れた位置に存在する話者間で、ノイズや距離によって相手の声が聞き取りづらい場合であっても、通話状態が維持できる音声通話装置を提供しようとするものである。また、カメラ装置などを用いることなく、話者の音声を通過させる指向性を付与するビームフォーミングを実現できる音声通話装置およびプログラムを提供しようとするものである。
【課題を解決するための手段】
【0009】
本発明の一側面は、複数のマイクを備え、複数のマイクの一つを基準マイクとし、複数のマイクに入力される音声について、所望の方向から到来する音声を通過させ、他の方向から到来する音声を抑圧する指向性を付与するビームフォーマ部を備えた音声通話装置であって、ビームフォーマ部は、複数のマイクから入力した音声信号を用いて、マイク間特性フィルタ係数を推定する適応フィルタである遅延分析部と、推定されたマイク間特性フィルタ係数を周波数領域に変換して、複数のマイクから入力した音声信号の位相差を検出し、複数のマイクに入力される音声の通過域または阻止域の指向性方向を決定する指向性分析部と、指向性分析部で決定された通過方向の音声は、通過させ、阻止方向の音声を阻止する指向性を付与するフィルタ係数を生成して時間領域に変換し、変換されたフィルタ係数で基準マイク以外の他のマイクからの音声信号に重みづけ処理する指向性フィルタ部と、基準マイクから入力した音声信号から指向性フィルタ部で重みづけ処理した他のマイクからの音声信号を減算して通過方向の音声信号を通過させる減算部とを備えたことを特徴とする。
【0010】
本発明の他の側面は、送話入力端に入力された音声信号を送話出力端から出力し、受話入力端に入力された音声信号を受話出力端のスピーカから出力し、送話入力端と送話出力端との間に設けられ、受話出力端から出力された音声信号により生ずるエコーを抑制するエコーキャンセラを備えた音声通話装置であって、エコーキャンセラは、送話入力端に入力される音声信号に対して、周波数変換して所定の周波数幅の領域のノイズを検出して、所定の周波数幅ごとのノイズ成分を抑圧するノイズ抑圧部と、受話出力端のスピーカから出力された受話音声信号による疑似反響信号を推定する適応フィルタを有してノイズ抑圧部でノイズ成分が抑圧された音声信号からエコーを抑圧するエコー抑圧部と、エコー抑圧された音声信号に対してハウリング抑圧処理を行うハウリング抑圧部とを備えることを特徴とする。
【0011】
本発明の他の側面は、上記の送話入力端に入力された音声信号を送話出力端から出力し、受話入力端に入力された音声信号を受話出力端のスピーカから出力し、送話入力端と送話出力端との間に設けられ、受話出力端から出力された音声信号により生ずるエコーを抑制するエコーキャンセラを備えた音声通話装置に、複数のマイクを備え、複数のマイクの一つを基準マイクとし、複数のマイクに入力される音声について、所望の方向から到来する音声を通過させ、他の方向から到来する音声を抑圧する指向性を付与するビームフォーマ部を備え、ビームフォーマ部は、適応フィルタを備えて、基準マイクに入力される音声に対して、他のマイクに入力された音声がどのような特性で入力されたかを示すマイク間特性フィルタ係数を推定して、推定されたマイク間特性フィルタ係数を周波数変換し、変換されたマイク間特性フィルタ係数から複数のマイクからの音声信号間の位相差を検出して、位相差に基づいて、複数のマイクからの音声信号に指向性を付与することを特徴とする。
【発明の効果】
【0012】
本発明によれば、適応フィルタによって音声信号の指向性付与ができるので、高価なカメラ装置や、複雑な音声情報処理を行う必要のない音声通話装置を実現できる。
【図面の簡単な説明】
【0013】
図1図1は、本発明一実施の形態の音声通話装置の構成を示す図である。
図2図2は、マイクとスピーカの配置例を示す図である。
図3図3は、ビームフォーマ部の構成を示すブロック図である。
図4図4は、エコーキャンセラの構成を示すブロック図である。
図5図5は、遅延分析部の構成例を示す図である。
図6図6は、指向性分析部の処理内容を示すフロー図である。
図7図7は、マイク間特性フィルタ係数抜き取りを説明する図である。
図8図8は、抜き取られたマイク間特性フィルタ係数の例を示す図である。
図9図9は、抜き取られたマイク間特性フィルタ係数の例を示す図である。
図10図10は、抜き取られたマイク間特性フィルタ係数の例を示す図である。
図11図11は、推定指向の通過域の例を示す図である。
図12図12は、推定指向の通過域の別の例を示す図である。
図13図13は、スピーカに対する指向の通過域の例を示す図である。
図14図14は、重みづけマイク間特性フィルタ係数戻し変換を説明する図である。
図15図15は、ノイズ抑圧部の処理内容を示すフロー図である。
図16図16は、ノイズ抑圧部でのパワー計算と最大最小更新を説明する図である。
図17図17は、ハウリング分析部の構成を示すブロック図である。
図18図18は、ハウリング分析部での処理を説明する図である。
【発明を実施するための形態】
【0014】
以下に、本発明の一実施の形態に係る音声通話装置について説明する。図1は、音声通話装置1の構成例を示す図である。なお、以下で説明する実施の形態は、いずれも本発明の好ましい一具体例を示すものである。以下の実施の形態で示される数値、構成要素、構成要素の配置位置および接続形態の順序、フローチャートにおける処理の順序等は、一例であり、本発明を限定する主旨ではない。また、各図は、必ずしも厳密に図示されたものではない。
【0015】
この実施の形態の音声通話装置1は、例えば、自動車の前部座席と後部座席とにそれぞれ設けて接続して、ハンズフリーの通話を行う音声通話装置である。
【0016】
音声通話装置1は、ビームフォーマ部10と、エコーキャンセラ20、マイク11、マイク12、スピーカ13とを備えている。マイク11、12は、ビームフォーマ部10に接続され、スピーカ13は、エコーキャンセラ20に接続されている。ビームフォーマ部10は、マイク11、12から入力された音声信号に指向性を付与して、所望の方向から到来する音声を通過させ、他方の方向から到来する音声を抑圧して、ビームフォームを形成する。すなわち、話者の音声を通過させ、他の方向の音声を阻止するように指向性を付与する音声処理を施す。そして、エコーキャンセラ20は、適応フィルタを内蔵しており、入力された音声信号の疑似反響信号を推定して、エコーを抑圧するとともに、ノイズの抑圧、ハウリングの抑圧、送話受話の損失を分配する。
【0017】
図2は、ビームフォーマ部10に接続されるマイク11、12と、スピーカ13との位置関係を示す図である。スピーカ13の中心は、2等辺三角形のマイク11、12との等辺の交点に位置し、マイク11、マイク12は、2等辺三角形の他の交点に位置する。このような位置であると、スピーカ13の音は二つのマイクに対して等距離の指向性として扱うことができる。
【0018】
図3は、ビームフォーマ部10の構成を示す図である。ビームフォーマ部10は、遅延分析部111、指向性分析部112、指向性フィルタ部113、指向性フィルタリング減算部114、基準マイク遅延部115、遅延分析初期値記憶部116を備えている。マイク11の入力は、基準マイク遅延部115に入力され、遅延基準マイク遅延部115の出力およびマイク12の出力が遅延分析部111に入力される。遅延分析部111の出力は、指向性分析部112に入力され、指向性分析部112の出力およびマイク12の出力は、指向性フィルタ部113に入力される。指向性フィルタ部113の出力および基準マイク遅延部115の出力は、指向性フィルタリング減算部114に入力され、その出力は、エコーキャンセラ20の送話入力端に入力される。また、エコーキャンセラ20の適応フィルタの動作状態の信号(アンチロス分析部状態260)が遅延分析部111と、指向性分析部112とに入力されている。
【0019】
図4は、エコーキャンセラ20の構成を示す図である。エコーキャンセラ20は、送話入力端204、送話出力端205、受話入力端202、受話出力端203を有しており、スピーカ13は、受話出力端203に接続されている。送話入力端204は、ビームフォーマ部10の送話出力端に接続されており、ビームフォーマ部10で指向性が制御されたマイク11、12の音声信号が入力される。
【0020】
エコーキャンセラ20は、ノイズ抑圧部、エコー抑圧部、ハウリング抑圧部、損失量分配部を有しており、スピーカ13の出力された音声によるエコーや背景ノイズ、ハウリングを抑圧し、所望の損失を会話が成立するように受話経路、送話経路に分配する。
【0021】
エコーキャンセラ20の構成において、ノイズ抑圧部は、ノイズ抑圧部212である。エコー抑圧部を担うのは、適応フィルタであるアンチロス分析部211、環境遅延部213、アンチロスフィルタ部214、アンチロス減算部215、アンチロス分析初期値記憶部225になる。ハウリング抑圧部は、ハウリング分析部216、ハウリング抑圧フィルタ部217になる。損失量分配部は、ロスダンパ部218、送話音声判定部219、受話音声判定部220、受話損失挿入部221、送話損失挿入部222、送話側遅延部223、受話側遅延部224になる。
エコーキャンセラ20の動作については、後述する。
【0022】
(ビームフォーマ部の説明)
ビームフォーマ部10の動作について説明する。ビームフォーマ部10は、二つのマイク11、12から入力された音声信号から適応フィルタでマイク間特性フィルタ係数を推定し、推定したマイク間特性フィルタ係数を周波数領域に変換して、周波数成分ごとの位相から二つのマイクの音声の位相差を分析する。この周波数領域で分析した位相差で通したい音を把握することで、通したい方向の音声を通過させ、抑圧したい方向の音声を抑圧するように、指向性を与えてビームフォームを形成する。このビームフォーマ部10は、マイクからの音声信号については周波数領域に変換せずに時間領域で処理し、適応フィルタで求めたフィルタ係数(二つのマイク間の特性を表すフィルタ係数)を周波数領域で分析することで、二つのマイクに到来する音源の位相差を求めて指向性を与えることを特徴としている。
【0023】
遅延分析部111の適応フィルタでの推定では、マイク11に入力された信号を基準として、一つの音源がマイク12にどのような特性で入力されたかをフィルタ係数として含んでいる。すなわち、マイク12の音声信号が、マイク11の音声に対して早く到着しているか、遅く到着しているかの位相差の情報が推定したマイク間特性フィルタ係数152に入っている。このマイク間特性フィルタ係数152を分析することで、音源に対する位相差を求めて指向性を与えることができる。
【0024】
マイク11からの音声信号は、基準マイク遅延部115で、長さ「mic1_delay」分遅延して、出力される。遅延分析部111は、このマイク11の遅延された音声信号と、マイク12から入力された音声信号とに基づいて、適応フィルタでマイク間の特性をマイク間特性フィルタ係数として推定してマイク間特性フィルタ係数152として出力する。
【0025】
図5に示すように、遅延分析部111は、エコーキャンセラ20のエコーキャンセラ部の適応フィルタであるアンチロス分析部211が推定動作中に動作するALP動作中マイク間特性推定適応フィルタ302と、非動作中に動作する非ALP動作中マイク間特性推定適応フィルタ303とをそれぞれ備えており、アンチロス分析部211からのアンチロス分析部状態260が適応推定動作中のときは、ALP動作中マイク間特性推定適応フィルタ302が推定動作して、マイク間特性フィルタ係数152を出力する。アンチロス分析部211からのアンチロス分析部状態260が非適応推定動作中のときは、非ALP動作中マイク間特性推定適応フィルタ303が推定動作して、マイク間特性フィルタ係数152を出力する。これにより、スピーカ13から、受話音声が出力されているか否かによって、スピーカ13から出力される音声による影響を軽減することができる。スピーカ13から音声が出力されているときは、話者の方向が検知できず、また、スピーカ13が鳴っているときに、遅延分析部111の適応フィルタを追従させると、アンチロス分析部211の収束性能に影響を与えてしまう。このため、エコーキャンセラ20のアンチロス分析部211の適応フィルタが動作しているときと、動作してないときのマイク間特性推定適応フィルタをそれぞれ備えることで、収束性能への影響を小さくし、また、非動作中には、通過させたい話者の指向性がわかる係数を生成することができる。
【0026】
なお、マイク間特性フィルタ係数の長さは、「mic1mic2_coeff_len」とする。これは、例えば、ディジタル信号処理のサンプリング周波数を16kHzとし、遅延分析部111の適応フィルタをFIRフィルタとして、遅延時間12msとするとき、192タップに相当する。
【0027】
遅延分析初期値記憶部116は、ALP動作中マイク間特性推定適応フィルタ302のフィルタ係数の初期値を記憶し、適応フィルタの初期値として使用する。
【0028】
図6は、指向性分析部112の指向性処理動作のフローを示す図である。指向性分析部112は、遅延分析部111で推定したマイク間特性フィルタ係数152を入力して、周波数領域に変換し、変換された周波数領域のマイク間特性フィルタ係数から位相差を分析して、二つのマイク間に付与する指向性を重みづけフィルタ係数として生成する。
【0029】
まず、図7に示すように、マイク間特性フィルタ係数152の先頭からマイク間特性フィルタ係数の長さのフィルタ係数を抜き出す(マイク間特性フィルタ係数抜き取り310)。マイク間特性フィルタ係数152の先頭から、「mic1_delayオフセット」を中心に、「coeff_fft_len」の長さをマイク間特性周波数分析入力信号401とする。長さ「coeff_fft_len」がマイク間特性フィルタ係数152の長さである「mic1mic2_coeff_len」より大きい場合は、上書きされていない要素については「0」で埋め、小さい場合は、条件が重なる部分のみ上書きする。これは、マイク間の特性としていろいろな特性が畳み込まれたフィルタ係数から周波数分析できるように、FFT(Fast Fourier Transform高速フーリエ変換)に都合のよいように抜き取って、「mic1_delay」を中心とした信号をFFTの入力信号とするものである。そして、マイク間特性周波数分析入力信号401をFFTで周波数領域に変換して、マイク間特性複素フィルタ係数402として出力する(マイク間特性FFT311)。そして位相差計算312において、マイク間特性複素フィルタ係数402(周波数領域に変換されている)の位相差を得る(位相差計算312)。
【0030】
マイク間特性複素フィルタ係数の位相差の計算について説明する。
マイク間特性複素フィルタ係数のインパルス応答から、二つのマイクに対して同じ信号の大きさが入力されたと仮定すれば、下記の式(3)~(5)の関係から、1サンプル遅延、1サンプル進みの時の位相差になるので、時間から角度を求めることができる式(6)が導かれる。これにより、通過させたい方向の周波数成分のF[n]に対して、通過させたい方向が入った場合には、通過に値する「0または0に近い値」、阻止したい方向には、阻止に値する「1または1に近い値」を掛ける操作をする。これを全部の周波数領域に対して行って、時間領域に戻すと、通過したい方向が抜け、阻止したい方向が減衰するので、指向性を与えることができる。
【0031】
FFTでは、フーリエ変換[F(n)]は、時間領域の数列f(k)を式(1)のような関係で表すことができる。
【数1】
ここで、Nは、高速離散フーリエ変換の長さで2のべき乗、kは、時間領域での標本点、nは、周波数領域での標本点である。
また、nは、各分析周波数ωnに対して以下の関係をもつものとする(式2)。
【数2】
ここで、fsは、サンプリング周波数[Hz]である。
周波数領域から時間領域に変換するIFFT(Inverse Fast Fourier Transform 逆高速フーリエ変換)は、式(3)で表すことができる。
【数3】
【0032】
極座標では、フーリエ変換F[n]は、(式4)のように表すことができる。
【数4】
マイク間特性複素フィルタ係数402を極座標で表現し、「θn」に注目して(式5)を周波数要素間の位相差とする。
【数5】
【0033】
但し0≦n<coeff_fft_len/2,diff[0]=0とする。diff[n]にはdiff[n-1]の差が最も近い値になるように2πを加減する。diff[n]の値は周囲雑音や他の話者の影響を受け、値の変動が大きいため、移動平均をとるなどして調整を行ったものを推定指向値403とする。また、指向性分析313は、推定指向値403を以下の特性から指向性を推定し、通過域か阻止域かでマイク間特性複素フィルタ係数の各標本値に乗ずるための推定指向値乗数404を算出する。
【0034】
図8のような長さ「coeff_fft_len」でオフセット「coeff_fft_len/2」が「1」、それ以外が「0」であるデータ列をFFTにかけて得られる複素数列のうち、複素数列[n]と複素数列[n+1]の位相差はπ[rad]になり(式6)と考えられる。
【数6】
【0035】
また、図9のような長さ「coeff_fft_len」で先頭からオフセット「coeff_fft_len/2+1」が「1」、それ以外が「0」であるデータ列をFFTにかけて得られる複素数列[0]と複素数列「[coeff_fft_len/2]」の位相差はπ[rad]かつ直線位相であるから(式7)と考えられる。
【数7】
この時のdiff[n]の値はマイク11よりマイク12がサンプリング周波数に対する1サンプル分遅く到達するときの位相差となる。
【0036】
また、図10のような長さ「coeff_fft_len」で先頭からオフセット「coeff_fft_len/2-1」が「1」、それ以外が「0」であるデータ列をFFTにかけて得られる複素数列[0]と複素数列「[coeff_fft_len/2]」の位相差は-π[rad]かつ直線位相であるから(式8)と考えられる。
【数8】
【0037】
この時のdiff[n]の値はマイク11よりマイク12がサンプリング周波数に対する1サンプル分早く到達する位相差となる。この関係に照らし合わせれば、遅延時間「delaytime」を指定値として(式9)から閾値を算出することができる。
【数9】
ここで「Thres」が負の時はマイク11よりマイク12が早く到達、正の時は遅く到達することを意味し、「delaytime=1/fs[s]」であるとき(式9)は(式7)となり、「delaytime=-1/fs[s]」であるとき(式9)は(式8)となる。
このように、フーリエ変換されたマイク間特性フィルタ係数からマイク間の位相差direction[n]を求めることができる。
【0038】
図11に示すようにマイク11、マイク12に対して話者が話者nの位置から話者fの位置の間に存在するとする。この時話者nの位置では「Delay0near[s]」だけマイク11がマイク12より多く音声の到達時間がかかることを示し、話者fの位置では「Delay0far[s]」だけマイク11がマイク12より多く音声の到達時間がかかることを示す。この場合(式10)、(式11)として表す。
【数10】
【0039】
推定指向値403の値が「Taker0NearThres」から「Taker0FarThres」の範囲であれば通過域の信号として扱い、これに外れると阻止域として扱う。斜線部分が通過を期待する領域となる。
【0040】
また、図12のように話者1、話者2毎に2つの遅延値を設定することで2つの通過域を設定することもできる。
この時、阻止域に相手側の音声通話端末のスピーカ13の端末が存在することでハウリングを避けることが期待できる。また、通過域であっても阻止したい各分析周波数については阻止域として扱う。主に最も低い分析周波数はこれに該当する。さらに、エコーキャンセラ20のアンチロス分析部状態260の2状態においてアンチロス分析部211が推定動作中のときに、図13に示すようにスピーカ13の方向についてはスピーカ通過域として扱って、通過域よりスピーカ13通過域を優先する。これによりアンチロス分析部211の適応フィルタへの影響を減らすことができる。
【0041】
通過域、阻止域、スピーカ通過域に基づき推定指向値乗数404に初期値を1.0(0dB)として、阻止域は保持(0dB)、通過域のときは大きな減衰量(例えば-40dB未満)、スピーカ通過域のときは通過域と阻止域の間でエコー消去に影響のない程度の減衰量(例えば-14dB)で更新する。なおFFTの回転子の方向によっては方向を示す正負が反転する。
【0042】
指向性情報付加314は、マイク間特性複素フィルタ係数402に推定指向値乗数404を乗じて、重みづけマイク間特性複素フィルタ係数405を出力する。
マイク間特性IFFT315は、重みづけマイク間特性複素フィルタ係数405をIFFTしてマイク間特性周波数分析出力信号406を出力する。
【0043】
マイク間特性フィルタ係数戻し変換316は、図14のようにマイク間特性周波数分析出力信号406の「coeff_fft_len/2」の位置を重みづけマイク間特性フィルタ係数151のオフセット「mic1_delay」の位置に合わせて上書きする。重みづけマイク間特性フィルタ係数151の長さ「mic1mic2_coeff_len」が「coeff_fft_len」より大きい場合、上書きされていない要素については「0」で埋め、小さい場合は条件が重なる部分のみ上書きする。
【0044】
指向性フィルタ部113は、重みづけマイク間特性フィルタ係数151でマイク12からの音声信号をフィルタリングし、指向性フィルタリング減算部114で、基準マイク遅延部115の出力からフィルタリングした結果を減算する。
ここで、推定指向値乗数404で1.0(0dB)未満の重みづけをした周波数帯の信号が残るようになる。
【0045】
上記のビームフォーマ部10は、マイク11、12の二つのマイク間の特性によるビームフォームを説明したが、マイクは、2つに限らない。3つのマイクを設けた場合には、隣り合う二つのマイクの遅延和を用いればよい。
【0046】
(エコーキャンセラの説明)
エコーキャンセラ20の動作を説明する。
遠端の通話相手との通話のため、受話入力端202から受話側遅延部224、受話損失挿入部221を経て受話出力端203に至る経路を受話経路とし、送話入力端204からノイズ抑圧部212、アンチロス減算器215、ハウリング抑圧フィルタ部217、送話側遅延部223、送話損失挿入部222、を経て送話出力端205に至る経路を送話経路とする。受話出力端203には、スピーカ13が接続され、通話相手の音声信号がスピーカ13に出力される。また、送話入力端204には、マイク11、12、ビームフォーマ部10を介して、近端の送話者の音声信号が入力され、遠端の通話相手とハンズフリーでの通話を可能としている。
【0047】
受話経路の受話音声判定部220は、受話入力端202の信号のパワーをとり、閾値を超えたときに音声有とそうでないときは音声なしと判断する。受話側遅延部224では、受話音声判定部220の判定結果が出るまでの時間相当の遅延を目安に受話経路に挿入する。受話損失挿入部221では、ロスダンパ部218からの受話損失挿入量226を受話側遅延部224の出力信号に乗ずる。受話出力端203は、受話側遅延部224の出力と接続し、スピーカ13に接続する。
【0048】
(エコー抑圧部の説明)
環境遅延部213は、受話出力端203からノイズ低減済み送話経路信号251までの到達時間を目安に遅延をかけた遅延受話出力信号253を出力する。アンチロス分析部211では、遅延受話出力信号253とノイズ低減済み送話経路信号251の関係を適応フィルタで推定し、アンチロスフィルタ係数254にふさわしいフィルタ係数を推定する。すなわち、エコーキャンセラとしての疑似反響信号の推定動作をする。アンチロス分析部211で、LMS(Least Mean Square)のような推定方法を用いる場合、遅延受話出力信号253の自己相関を用いる。その自己相関の値がある一定以上あるときに適応フィルタで係数の推定動作を行うこととし、その時アンチロス分析部211の推定状態を示す信号であるアンチロス分析部状態260を推定動作中として出力する。一定以下の値であるときは適応フィルタでの係数の推定動作を停止し、アンチロス分析部状態260を非推定動作中として出力する。アンチロス分析部状態260は、ビームフォーマ部10に出力される。
【0049】
アンチロスフィルタ部214は、遅延受話出力信号253をアンチロスフィルタ係数254でフィルタリングし、アンチロス減算部215で、フィルタリングした遅延受話信号を、ノイズ低減済み送話経路信号251から減算し、アンチロス済み送話信号259を出力する。
【0050】
アンチロス済み信号259をアンチロス分析部211に入力し、ノイズ低減済み送話経路信号251とともに減衰量を監視し、アンチロス分析部211は、現在のアンチロスフィルタ係数254より減衰が期待できると確認できたときにアンチロスフィルタ係数254を更新する。
アンチロス分析部211で、適切なアンチロスフィルタ係数254が推定できれば、ノイズ低減済み送話経路信号251に含まれたスピーカ13から出力した信号成分を減衰することができ、ロスダンパ部218で推定する損失量を減らせることができる。よく減衰できているアンチロスフィルタ係数254は、アンチロス分析初期値記憶部225に記憶させ、次回起動時の初期値として使用できる。
【0051】
(ハウリング抑圧部)
ハウリング抑圧フィルタ部217は、アンチロス済み信号259をハウリング抑制フィルタ係数255でフィルタリングし、ハウリング抑圧フィルタ部出力信号256を出力する。
【0052】
(損失量分配部の説明)
送話音声判定部219は、ノイズ低減済み送話経路信号251、アンチロス済み信号259から音声の有無を判定する。ノイズ低減済み送話経路信号251とアンチロス済み信号259との相関性が高くノイズ低減済み送話経路信号251のパワーが大きい場合、または、ノイズ低減済み送話経路信号251とアンチロス済み信号259との相関性が低いが、ノイズ低減済み送話経路信号251のパワーが大きく、かつアンチロス済み信号259のパワーとの比が小さい(10dB未満)などの場合などは、送話音声有と判断し、ノイズ低減済み送話経路信号251のパワー、アンチロス済み信号259のパワーが小さいなどそれ以外の時は送話音声なしと判断する。
【0053】
ロスダンパ部218は、受話損失挿入部221、送話損失挿入部222に損失量を分配する。
アンチロスフィルタ係数254の面積を残響量として、アンチロス済み信号259をノイズ低減済み送話経路信号251で除算した結果をアンチロス減衰量として、残響量にアンチロス減衰量を乗じた結果の逆数を端損失量とする。なお、端損失量が0dB(1.0)を超える場合は1とする。ハウリング抑圧フィルタ部出力信号256がアンチロスフィルタで期待する信号の大きさになっていないとき、それを補うための損失量をNLP(Non Linear Processor)損失量とする。
【0054】
ロスダンパ部218は、受話入力端202の信号のパワーを監視し、受話信号上限値を超える場合には、受話信号上限値になるための損失量を受話信号レベル損失量として保持する。受話入力端202の信号のパワーが十分に小さくなったときは、受話信号レベル損失量は0dBを上限に増幅する。また、ハウリング抑圧フィルタ部出力信号256の信号のパワーを監視し、送話信号上限値を超える場合には、送話信号上限値になるための減衰量を送話信号レベル損失量として保持する。ハウリング抑圧フィルタ部出力信号256のパワーが十分に小さくなったときは、送話信号レベル損失量は0dBを上限に増幅する。そのほかに無音時の損失として無音時損失量を用意する。
【0055】
受話音声判定部220、送話音声判定部219の判定結果において、受話音声、送話音声ともに無しの判断結果時には、受話経路には端損失量か受話信号レベル損失量か、無音時損失量のうち最も減衰する損失量を受話損失挿入量226とし、送話経路には送話信号レベル損失量か、無音時損失量のうち最も減衰する損失量を送話損失挿入量227とする。
受話音声無、送話音声有の判断結果時には、受話経路には端損失量か受話信号レベル損失量か、無音時損失量のうち最も減衰する損失量を受話損失挿入量226とし、送話経路には送話信号レベル損失量を送話損失挿入量227とする。
受話音声有、送話音声無の判断結果時には、受話経路には受話信号レベル損失量を受話損失挿入量226とし、送話経路には端損失量かNLP損失量か、送話信号レベル損失量のうち最も減衰する損失量を送話損失挿入量227とする。
受話音声、送話音声ともに有の判断結果時には、受話経路には端損失量の平方根か受話信号レベル損失量のうち最も減衰する損失量を受話損失挿入量226とし、送話経路には端損失量の平方根か送話信号レベル損失量かのうち最も減衰する損失量を送話損失挿入量227とするなど、音声判定に従って、的確に受話損失挿入部221、送話損失挿入部222に損失量を分配する。
【0056】
(ノイズ抑圧部の説明)
ノイズ抑圧部212は、図15に示すように、送話入力端204から送話音声を入力しノイズ低減処理を行ってノイズ低減済み送話経路信号251を出力する。本実施の形態のエコーキャンセラ20のノイズ抑圧部212は、適応フィルタを用いるエコー抑圧部の前段で、周波数領域の所定の周波数幅でノイズ低減処理を行って、ノイズ低減済み送話経路信号251を出力する。
【0057】
図15は、ノイズ抑圧部212の処理を説明するフローである。
まず、送話入力端204に入力した音声信号のFFTを行って、周波数領域に変換する(送話経路FFT502)。送話経路FFT502は、送話入力端204の信号を「noise_fblength/2」個と1フレーム前の「noise_fblength/2」個のデータを連続して並べ、「noise_fblength」個のデータを構成しハニング窓を乗じてFFTを行い、長さ「noise_fblength/2+1」の送話入力複素信号602を出力する。「noise_fblength」の長さは1標本点が100Hz~200Hzの幅になるように選択する。
そして、パワー計算503では送話入力複素信号602を(式4)に当てはめ、大きさを表す「|F(n)|」を送話入力スペクトル653とし、送話入力スペクトル653の平均をとった送話入力パワー603を出力する。
【0058】
最大最小更新504では、図16のようなサブバンドを構成し、送話入力パワー603の最小値とその位置として標本点を保存、更新する。
図16は、サブバンドの一例であるが、「noise_fblength」を4つの領域分割にして、領域「0」は送話入力パワー603の1データを1サブバンドとして2サブバンド、領域「1」は送話入力複素信号602の3データを1サブバンドとして2サブバンド、のように領域ごとにデータの個数を定義して1つのサブバンドとして長さ「noise_sblen」で構成する。
サブバンド毎に最小パワー値とその位置を多重に保持する最小パワー履歴保持部604に用意する。
【0059】
各サブバンドの最小値を求めるときの例を示す。送話入力パワー603をsin_power[m]、最小パワー履歴保持部604をpowmin[bf][sbm]とする。bfはpowminの多重度で保持したい時間分の長さとなる。sbmは0≦sbm<noise_sblenである。図16において、サブバンド3の最小値を求める場合にはsin_power[5]、sin_power[6]、sin_power[7]と、powmin[updateidx][3].powのうち最も小さい値がsin_power[5]であれば、powmin[updateidx][3].powをsin_power[5]で更新し、位置の保存としてpowmin[updateidx][3].posを5で更新する。ここで0≦updateidx<bfである。powmin[updateidx][3].powが最小値であれば保持する。同様なことをすべてのサブバンドに対して更新する。これをpowmin[updateidx]に対して、一定期間、例えば100ms行い、updateidxを1加算しつつnoise_sblenなったときには、「0」とし、繰り返し行う。これによって、長時間(例えば1秒~2秒分)における最小値とその位置を保持する。最大パワー履歴保持部654についても、最大値とその位置を同様に行い、その位置を最大パワー履歴保持部654に保持する。
【0060】
サブバンドノイズレベル推定505は、最小パワー履歴保持部604で保持される値の中でサブバンド毎に最も小さい最小パワー値をノイズレベルとして、その時の最小パワー値と位置をそれぞれ時定数で平均化して、サブバンドノイズレベル推定保持部605に保持かつ出力する。また、ノイズの減衰量を増やしたい場合には、各サブバンドの最大パワー履歴保持部654から最大パワーを選択し、最大パワーと最小パワーの差が大きい場合にはアンチロス分析部211の推定動作への影響が少ない値で、例えば((最大パワー)-(最小パワー))×0.1 など)をサブバンドノイズレベル推定保持部605に加える。
【0061】
サブバンドノイズレベル推定フルバンド拡張506は、サブバンドノイズレベル推定保持部605の最小値とその位置を隣り合うサブバンドの最小値と位置から補完して、フルバンド長「noise_fblength/2+1」に拡張したフルバンド推定ノイズレベル606を出力する。
フルバンドレベル推定補正507は、フルバンド推定ノイズレベル606の標本点毎に送話入力スペクトル653の変化に応じた補正や、送話入力スペクトル653より大きいフルバンド推定ノイズレベル606については送話入力スペクトル653で更新し、フルバンド推定ノイズレベル606を(式4)の|F[n]|とし、θを送話入力複素信号602と同じ値にした補正済み推定ノイズ複素信号607を出力する。
【0062】
ノイズレベル減算508は、送話入力複素信号602から補正済み推定ノイズ複素信号607を減算したノイズ低減済み送話入力複素信号608を出力する。
【0063】
出力スペクトルピークホールド509は、ノイズ低減済み送話入力複素信号608のスペクトルを標本点毎に監視し、該当する値の更新を行う。送話入力ピークホールド252よりスペクトルが大きければ、送話入力ピークホールド252の値を更新する。第一の一定時間(例えば50ms)以上スペクトルが、送話入力ピークホールド252の1.0未満を乗じた値、例えば0.5より下回らない場合に、該当する標本点に対するノイズ抑圧即時ハウリング抑圧減衰値257を、例えば0.001dBのような1.0未満の値を、スペクトルが減衰に転じるか、ノイズ抑圧即時ハウリング抑圧減衰値257の制限値に、到達、例えば-6dBに達するまで逐次乗ずる。第二の一定時間、例えば200ms以上スペクトルが減衰に転じない場合には、送話入力ピークホールド保持状態とする。この送話入力ピークホールド保持状態は、ホールド解除261からホールド解除ONのときに解かれる。送話入力ピークホールド保持状態ではなくスペクトルの値が十分に小さいときにノイズ抑圧即時ハウリング抑圧減衰値257を、例えば0.001dBのような1.0より大きい値を1.0以上になるまで逐次乗じてその後は乗算を止め、1.0とし、ノイズ抑圧即時ハウリング抑圧減衰値257が1.0になってから送話入力ピークホールド252の値を現在のスペクトルになるまで、例えば-0.001dBのような1.0未満の値を乗じ、達したら乗算をやめる。
【0064】
送話経路IFFT510は、ノイズ低減済み送話入力複素信号608をIFFT(逆高速フーリエ変換)した後、ハニング窓を乗じたうえで、前のフレーム処理の結果と合成し、「noise_fblength/2」の長さのノイズ低減済み送話経路信号251を出力する。
【0065】
(ハウリング抑圧部の説明)
ハウリング抑圧部は、アンチロス減算部215で減算され出力されたアンチロス済み送話信号259の、ハウリング抑圧を行う。
ハウリング分析部216は図17に示すように、ベースハウリング抑制分析部801と即時ハウリング抑制分析部802が出力する減衰量をハウリング抑圧フィルタ合成部803で乗じてハウリング抑制フィルタ係数255を生成する。ハウリング抑圧フィルタ係数255は1ms~2ms程度の長さにする。
【0066】
ベースハウリング抑制分析部801は、アンチロスフィルタ係数254が更新されたときにベースハウリング抑圧減衰値901を更新する。
アンチロスフィルタ係数254から図18に示すように係数のピークとなる標本点を範囲に入れた長さを抜き取り、FFTをかけて周波数領域に変換し、スペクトルに注目し、図18のようにスペクトルのピークに対して一定以下(例えば、ピークの-20dB)の標本点を減衰して、送話入力ピークホールド252のピークと通常信号上限値以上のスペクトルを示す標本点を減衰するハウリング抑圧フィルタ係数255の長さに合わせたベースハウリング抑圧減衰値901を出力する。ベースハウリング抑圧減衰値901が更新されたときにホールド解除261をON、ノイズ抑圧部で送話入力ピークホールド保持状態が解かれていれば、ホールド解除261をOFFとして出力する。
【0067】
即時ハウリング抑制分析部802は、ノイズ抑圧即時ハウリング抑圧減衰値257をハウリング抑圧フィルタ係数255の長さに合わせた即時ハウリング抑圧減衰値902を出力する。
ハウリング抑圧フィルタ合成部803は、ベースハウリング抑圧減衰値901と即時ハウリング抑圧減衰値902とを標本点ごとに比較して小さい値を選択し、IFFTをかけ、ハウリング抑制フィルタ係数255として出力する。
【0068】
この実施形態の音声通話装置は、車の前席と後席に配置して接続して用いることで、車両の同一空間内でハンズフリーでの通話ができる。また、周囲の騒音についてもノイズ抑圧をしているので、走行中の騒音も抑圧できる。
なお、本実施の形態の音声通話装置は、車での音声通話装置として説明したが、騒音のある環境内、例えば工場、倉庫などの同一空間内での通話を行う装置としても利用することができる。
【0069】
上述のように実施形態としての音声通話装置1を説明したが、この音声通話装置1のビームフォーマ部10、エコーキャンセラ20は、CPU、メモリを備えた汎用の情報処理装置に、ソフトウェアとしてのプログラムをインストールすることで、ピームフォーマ部10、エコーキャンセラ20の各処理を実行させることができる。
【0070】
[発明のまとめ]
上述したように、マイク11、12を備え、マイク11を基準マイクとし、マイク11、12に入力される音声について、所望の方向から到来する音声を通過させ、他の方向から到来する音声を抑圧する指向性を付与するビームフォーマ部10を備えた音声通話装置1であって、ビームフォーマ部10は、適応フィルタを備え、適応フィルタにより、マイク11に入力される音声に対して、マイク12に入力された音声がどのような特性で入力されたかを示すマイク間特性フィルタ係数を推定して、推定されたマイク間特性フィルタ係数を周波数変換し、変換されたマイク間特性フィルタ係数からマイク11、12からの音声信号間の位相差を検出して、位相差に基づいて、マイク11、12からの音声信号に指向性を付与する。
【0071】
これにより、適応フィルタによってマイク間の位相差を検出して、音声信号の指向性付与ができるので、高価なカメラ装置や、複雑な画像情報処理などを行う必要のない音声通話装置を実現できる。
【0072】
ビームフォーマ部10は、マイク11、12から入力した音声信号を用いて、マイク間特性フィルタ係数152を推定する適応フィルタである遅延分析部111と、推定されたマイク間特性フィルタ係数152を周波数領域に変換して、マイク11、12から入力した音声信号の位相差を検出し、マイク11、12に入力される音声の通過域または阻止域の指向性方向を決定する指向性分析部112と、指向性分析部112で決定された通過方向の音声は、通過させ、阻止方向の音声を阻止する指向性を付与するフィルタ係数を生成して時間領域に変換し、変換されたフィルタ係数でマイク12からの音声信号に重みづけ処理する指向性フィルタ部113と、マイク11から入力した音声信号から指向性フィルタ部113で重みづけ処理したマイク12からの音声信号を減算して通過方向の音声信号を通過させる減算部114とを備える。
【0073】
これにより、適応フィルタを用いることでビームフォームを行うことができる。
【0074】
送話入力端204に入力された音声信号を送話出力端205から出力し、受話入力端202に入力された音声信号を受話出力端203のスピーカ13から出力し、送話入力端204と送話出力端205との間に設けられ、受話出力端203から出力された音声信号により生ずるエコーを抑制するエコーキャンセラ20を備えた音声通話装置1であって、エコーキャンセラ20は、送話入力端204に入力される音声信号に対して、周波数変換して所定の周波数幅の領域のノイズを検出して、所定の周波数幅ごとのノイズ成分を抑圧するノイズ抑圧部212と、ノイズ抑圧部212でノイズ成分が抑圧された音声信号に、送話入力端204から入力される音声信号が受話出力端203のスピーカ13から出力された受話音声信号による疑似反響信号を推定する適応フィルタを有してエコーを抑圧するエコー抑圧部であるアンチロス分析部211、環境遅延部213、アンチロスフィルタ部214、アンチロス減算部215と、エコー抑圧された音声信号に対してハウリング抑圧処理を行うハウリング抑圧部であるハウリング分析部216、ハウリング抑圧フィルタ部217とを備える。
【0075】
これにより、周囲騒音があっても明瞭な音声通話が可能である。
【0076】
音声通話装置1は、ビームフォーマ部10と、エコーキャンセラ20とを備える。
【0077】
これにより、騒音のある同一空間内でも、ハンズフリーで明瞭な音声通話が可能になる。
【0078】
遅延分析部111は、アンチロス分析部211の適応フィルタが推定動作中に適応動作するALP動作中マイク間特性推定適応フィルタ302と、推定動作中でないときに適応動作する非ALP動作中マイク間特性推定適応フィルタ303とを備え、受話出力端203に受話入力端202の音声信号が出力してアンチロス分析部211の適応フィルタが推定動作中は、動作中マイク間特性推定適応フィルタ302を動作させ、受話出力端に音声信号が出力していないときは、前記非動作中マイク間特性推定適応フィルタ303を動作させる。
【0079】
これにより、アンチロス分析部211の適応フィルタは、受話出力端から出力される信号成分を減衰する適切なアンチロスフィルタ係数を推定できる。
【符号の説明】
【0080】
1 音声通話装置
10 ビームフォーマ部
11,12 マイク
13 スピーカ
20 エコーキャンセラ
111 遅延分析部
112 指向性分析部
113 指向性フィルタ部
114 指向性フィルタリング減算部
115 基準マイク遅延部
116 遅延分析初期値記憶部
202 受話入力端
203 受話出力端
204 送話入力端
205 送話出力端
211 アンチロス分析部
212 ノイズ抑圧部
213 環境遅延部
214 アンチロスフィルタ部
215 アンチロス減算部
216 ハウリング分析部
217 ハウリング抑圧フィルタ部
218 ロスダンパ部
219 送話音声判定部
220 受話音声判定部
221 受話損失挿入部
222 送話損失挿入部
223 送話側遅延部
224 受話側遅延部
225 アンチロス分析初期値記憶部
302 ALP動作中マイク間特性推定適応フィルタ
303 非ALP動作中マイク間特性推定適応フィルタ
801 ベースハウリング抑制分析部
802 即時ハウリング抑制分析部
803 ハウリング抑圧フィルタ合成部

図1
図2
図3
図4
図5
図6
図7
図8
図9
図10
図11
図12
図13
図14
図15
図16
図17
図18