特許第6096437号(P6096437)IP Force 特許公報掲載プロジェクト 2022.1.31 β版

知財求人 - 知財ポータルサイト「IP Force」

▶ 株式会社ザクティの特許一覧

<>
  • 特許6096437-音声処理装置 図000002
  • 特許6096437-音声処理装置 図000003
  • 特許6096437-音声処理装置 図000004
  • 特許6096437-音声処理装置 図000005
  • 特許6096437-音声処理装置 図000006
  • 特許6096437-音声処理装置 図000007
  • 特許6096437-音声処理装置 図000008
  • 特許6096437-音声処理装置 図000009
  • 特許6096437-音声処理装置 図000010
  • 特許6096437-音声処理装置 図000011
  • 特許6096437-音声処理装置 図000012
  • 特許6096437-音声処理装置 図000013
  • 特許6096437-音声処理装置 図000014
  • 特許6096437-音声処理装置 図000015
< >
(19)【発行国】日本国特許庁(JP)
(12)【公報種別】特許公報(B2)
(11)【特許番号】6096437
(24)【登録日】2017年2月24日
(45)【発行日】2017年3月15日
(54)【発明の名称】音声処理装置
(51)【国際特許分類】
   H04R 3/00 20060101AFI20170306BHJP
   H04R 1/40 20060101ALI20170306BHJP
【FI】
   H04R3/00 320
   H04R1/40 320A
【請求項の数】3
【全頁数】14
(21)【出願番号】特願2012-186269(P2012-186269)
(22)【出願日】2012年8月27日
(65)【公開番号】特開2014-45317(P2014-45317A)
(43)【公開日】2014年3月13日
【審査請求日】2015年7月21日
(73)【特許権者】
【識別番号】313003417
【氏名又は名称】株式会社ザクティ
(74)【代理人】
【識別番号】100103056
【弁理士】
【氏名又は名称】境 正寿
(72)【発明者】
【氏名】吉田 昌弘
【審査官】 渡邊 正宏
(56)【参考文献】
【文献】 国際公開第2009/078105(WO,A1)
【文献】 特開2010−245984(JP,A)
【文献】 国際公開第2011/103488(WO,A1)
【文献】 特開2009−055343(JP,A)
【文献】 特開2011−061422(JP,A)
(58)【調査した分野】(Int.Cl.,DB名)
H04R 1/20− 1/40
H04R 3/00− 3/14
H04R 29/00
(57)【特許請求の範囲】
【請求項1】
並列的に取得されたM個(M:2以上の整数)の音声信号の各々をN個(N:2以上の整数)の周波数にそれぞれ対応するN個の信号成分に分類する分類手段、
前記分類手段の出力を参照して前記N個の周波数の各々に対応するM個の信号成分の間の位相差を検出する検出手段、
前記検出手段によって検出されたN個の位相差の中から閾値以上の値を示す位相差を特定する特定手段、および
前記特定手段によって特定された位相差が抑制されるように前記M個の音声信号の遅延量を調整する調整手段を備え、
前記閾値は前記M個の音声信号をそれぞれ取得するM個のマイクロフォンの間の距離に基づく値を示す、
音声処理装置。
【請求項2】
前記特定手段は、前記検出手段によって検出されたN個の位相差の中から前記閾値以上の値を示すL個(L:整数)の位相差を特定し、
前記特定手段によって特定されたL個の位相差の平均値を算出する算出手段を有し、
前記調整手段は、前記算出手段によって算出された位相差の平均値が抑制されるように前記M個の音声信号の遅延量を調整する
請求項1記載の音声処理装置。
【請求項3】
前記閾値は前記M個の音声信号が前記M個のマイクロフォンを結ぶ直線の延長線上の方向から到来する場合の位相差を表す、
請求項1ないし2のいずれかに記載の音声処理装置。
【発明の詳細な説明】
【技術分野】
【0001】
この発明は、音声処理装置に関し、特に並列的に取得された複数の音声信号のゲインを調整する、音声処理装置に関する。
【背景技術】
【0002】
この種の装置の一例が、特許文献1に開示されている。この背景技術によれば、一方のマイクロフォンによって捉えられた音声信号は、アンプおよび第1LPFを介して第1検波器に入力される。また、他方のマイクロフォンによって捉えられた音声信号は、可変利得アンプおよび第2LPFを介して第2検波器に入力される。第1検波器の出力および第2検波器の出力は比較器によって互いに比較され、可変利得アンプの増幅率は比較結果に基づいて調整される。これによって、マイクロフォンの感度のばらつきを抑制することができる。
【先行技術文献】
【特許文献】
【0003】
【特許文献1】特開2005−136628号公報
【発明の概要】
【発明が解決しようとする課題】
【0004】
しかし、背景技術では、マイクロフォンへの音声信号の入射角によって可変利得アンプの増幅率が調整されることはなく、各マイクロフォンによって捉えられた音声信号間の位相のばらつきが抑制されることもない。このため、背景技術では、調整後の音声信号の品質に限界がある。
【0005】
それゆえに、この発明の主たる目的は、音声信号の品質を高めることができる、音声処理装置を提供することである。
【課題を解決するための手段】
【0006】
この発明に従う音声処理装置(10:実施例で相当する参照符号。以下同じ)は、並列的に取得されたM個(M:2以上の整数)の音声信号の各々をN個(N:2以上の整数)の周波数にそれぞれ対応するN個の信号成分に分類する分類手段(54, S1~S5, S13~S15)、分類手段の出力を参照してN個の周波数の各々に対応するM個の信号成分の間の位相差を検出する検出手段(S7~S11)、検出手段によって検出されたN個の位相差の中から第1閾値(TH1)を下回る位相差を特定する第1特定手段(S19)、および第1特定手段によって特定された位相差を定義するM個の信号成分の間のレベル差が抑制されるようにM個の音声信号の振幅を調整する第1調整手段(50, S23~S25, S33~S37)を備える。
【0007】
好ましくは、第1閾値はM個の音声信号をそれぞれ取得するM個のマイクロフォン(34L, 34R)の間の距離とM個の音声信号の許容入射角の上限とに基づく値を示す。
【0008】
好ましくは、検出手段によって検出されたN個の位相差の中から第2閾値(TH2)以上の値を示す位相差を特定する第2特定手段(S21, S27)、および第2特定手段によって特定された位相差が抑制されるようにM個の音声信号の遅延量を調整する第2調整手段(52, S39~S41)がさらに備えられる。
【0009】
さらに好ましくは、第2閾値はM個の音声信号をそれぞれ取得するM個のマイクロフォン(34L, 34R)の間の距離に基づく値を示す。
【0010】
好ましくは、分類手段はM個(M:2以上の整数)の音声信号の各々をフーリエ変換する変換手段(54)を含む。
【0011】
この発明に従う音声処理装置(10)は、並列的に取得されたM個(M:2以上の整数)の音声信号の各々をN個(N:2以上の整数)の周波数にそれぞれ対応するN個の信号成分に分類する分類手段(54, S1~S5, S13~S15)、分類手段の出力を参照してN個の周波数の各々に対応するM個の信号成分の間の位相差を検出する検出手段(S7~S11)、検出手段によって検出されたN個の位相差の中から閾値(TH2)以上の値を示す位相差を特定する特定手段(S21, S27)、および特定手段によって特定された位相差が抑制されるようにM個の音声信号の遅延量を調整する調整手段(52, S39~S41)を備える。
【0012】
この発明に従う音声処理装置(10)は、並列的に取得された複数の音声信号の相対位相差情報を検出する検出手段(S1~S15)、部品ばらつきによって生じる複数の音声信号の間の振幅・位相ずれを検出手段によって検出された相対位相差情報に基づいて判別する判別手段(S17~S21, S29~S31)、複数の音声信号の振幅および位相を補正する補正手段(50, 52)、および判別手段の判別結果に基づいて補正手段の補正量を調整する調整手段(S23~S27, S33~S41)を備える。
【0013】
この発明に従う音声処理プログラムは、音声処理装置(10)のプロセッサ(56)に、並列的に取得されたM個(M:2以上の整数)の音声信号の各々をN個(N:2以上の整数)の周波数にそれぞれ対応するN個の信号成分に分類する分類ステップ(S1~S5, S13~S15)、分類ステップの出力を参照してN個の周波数の各々に対応するM個の信号成分の間の位相差を検出する検出ステップ(S7~S11)、検出ステップによって検出されたN個の位相差の中から閾値(TH1)を下回る位相差を特定する特定ステップ(S19)、および特定ステップによって特定された位相差を定義するM個の信号成分の間のレベル差が抑制されるようにM個の音声信号の振幅を調整する調整ステップ(50, S23~S25, S33~S37)を実行させるための、音声処理プログラムである。
【0014】
この発明に従う音声処理方法は、音声処理装置(10)のプロセッサ(56)によって実行される音声処理方法であって、並列的に取得されたM個(M:2以上の整数)の音声信号の各々をN個(N:2以上の整数)の周波数にそれぞれ対応するN個の信号成分に分類する分類ステップ(S1~S5, S13~S15)、分類ステップの出力を参照してN個の周波数の各々に対応するM個の信号成分の間の位相差を検出する検出ステップ(S7~S11)、検出ステップによって検出されたN個の位相差の中から閾値(TH1)を下回る位相差を特定する特定ステップ(S19)、および特定ステップによって特定された位相差を定義するM個の信号成分の間のレベル差が抑制されるようにM個の音声信号の振幅を調整する調整ステップ(50, S23~S25, S33~S37)を備える。
【0015】
この発明に従う音声処理プログラムは、音声処理装置(10)のプロセッサ(56)に、並列的に取得されたM個(M:2以上の整数)の音声信号の各々をN個(N:2以上の整数)の周波数にそれぞれ対応するN個の信号成分に分類する分類ステップ(54, S1~S5, S13~S15)、分類ステップの出力を参照してN個の周波数の各々に対応するM個の信号成分の間の位相差を検出する検出ステップ(S7~S11)、検出ステップによって検出されたN個の位相差の中から閾値(TH2)以上の値を示す位相差を特定する特定ステップ(S21, S27)、および特定ステップによって特定された位相差が抑制されるようにM個の音声信号の遅延量を調整する調整ステップ(52, S39~S41)を実行させるための、音声処理プログラムである。
【0016】
この発明に従う音声処理方法は、音声処理装置(10)のプロセッサ(56)によって実行される音声処理方法であって、並列的に取得されたM個(M:2以上の整数)の音声信号の各々をN個(N:2以上の整数)の周波数にそれぞれ対応するN個の信号成分に分類する分類ステップ(54, S1~S5, S13~S15)、分類ステップの出力を参照してN個の周波数の各々に対応するM個の信号成分の間の位相差を検出する検出ステップ(S7~S11)、検出ステップによって検出されたN個の位相差の中から閾値(TH2)以上の値を示す位相差を特定する特定ステップ(S21, S27)、および特定ステップによって特定された位相差が抑制されるようにM個の音声信号の遅延量を調整する調整ステップ(52, S39~S41)を備える。
【発明の効果】
【0017】
M個の音声信号の振幅は、第1閾値を下回る位相差を定義するM個の信号成分の間のレベル差が抑制されるように調整される。つまり、第1閾値に相当する角度を下回る角度で入射された音声成分のレベル差が抑制される。これによって、音声信号の品質が向上する。
【0018】
M個の音声信号の位相は、閾値以上の位相差が抑制されるように調整される。つまり、閾値をマイク間隔から決まる理論上の最大閾値とすることで、品質バラツキの影響で生じた最大位相差を上回る位相差を抑制する。この抑制処理を繰り返すことにより、どの方向から到来した音に対しても位相差が最大閾値以内に収まるようになる。この結果、品質バラツキによる遅延が補正され、音声信号の品質が向上する。
【0019】
この発明の上述の目的,その他の目的,特徴および利点は、図面を参照して行う以下の実施例の詳細な説明から一層明らかとなろう。
【図面の簡単な説明】
【0020】
図1】(A)はこの発明の一実施例の基本的構成を示すブロック図であり、(B)はこの発明の他の実施例の基本的構成を示すブロック図である。
図2】この発明の一実施例の構成を示すブロック図である。
図3図2実施例に適用される音声処理回路の構成の一例を示すブロック図である。
図4図3に示す音声処理回路に設けられた制御回路の動作の一部を示すフロー図である。
図5図3に示す音声処理回路に設けられた制御回路の動作の他の一部を示すフロー図である。
図6図3に示す音声処理回路に設けられた制御回路の動作のその他の一部を示すフロー図である。
図7】マイクロフォンに入射される音声信号の一例を示す図解図である。
図8】(A)はLチャネル周波数成分の波形の一例を示す図解図であり、(B)はRチャネル周波数成分の波形の一例を示す図解図である。
図9】マイクロフォンに入射される音声信号の他の一例を示す図解図である。
図10】(A)はLチャネル周波数成分の波形の他の一例を示す図解図であり、(B)はRチャネル周波数成分の波形の他の一例を示す図解図である。
図11】マイクロフォンに入射される音声信号のその他の一例を示す図解図である。
図12】(A)はLチャネル周波数成分の波形のその他の一例を示す図解図であり、(B)はRチャネル周波数成分の波形のその他の一例を示す図解図である。
図13図2実施例に適用される音声処理回路の構成の他の一例を示すブロック図である。
図14図2実施例に適用される音声処理回路の構成のその他の一例を示すブロック図である。
【発明を実施するための形態】
【0021】
以下、この発明の実施の形態を図面を参照しながら説明する。
[基本的構成1]
【0022】
図1(A)を参照して、この実施例の音声処理装置は、基本的に次のように構成される。分類手段1aは、並列的に取得されたM個(M:2以上の整数)の音声信号の各々をN個(N:2以上の整数)の周波数にそれぞれ対応するN個の信号成分に分類する。検出手段2aは、分類手段1aの出力を参照してN個の周波数の各々に対応するM個の信号成分の間の位相差を検出する。第1特定手段3aは、検出手段2aによって検出されたN個の位相差の中から第1閾値を下回る位相差を特定する。第1調整手段4aは、第1特定手段3aによって特定された位相差を定義するM個の信号成分の間のレベル差が抑制されるようにM個の音声信号の振幅を調整する。
【0023】
M個の音声信号の振幅は、第1閾値を下回る位相差を定義するM個の信号成分の間のレベル差が抑制されるように調整される。つまり、第1閾値に相当する角度を下回る角度で入射された音声成分のレベル差が抑制されるように、M個の音声信号の全域の振幅が調整される。これによって、マイク感度のバラツキが補正され、音声信号の品質が向上する。
[基本的構成2]
【0024】
図1(B)を参照して、他の実施例の音声処理装置は、基本的に次のように構成される。分類手段1bは、並列的に取得されたM個(M:2以上の整数)の音声信号の各々をN個(N:2以上の整数)の周波数にそれぞれ対応するN個の信号成分に分類する。検出手段2bは、分類手段1bの出力を参照してN個の周波数の各々に対応するM個の信号成分の間の位相差を検出する。特定手段3bは、検出手段2bによって検出されたN個の位相差の中から閾値以上の値を示す位相差を特定する。調整手段4bは、特定手段3bによって特定された位相差が抑制されるようにM個の音声信号の遅延量を調整する。
【0025】
M個の音声信号の位相は、閾値以上の位相差が抑制されるように調整される。つまり、閾値をマイク間隔から決まる理論上の最大閾値とすることで、品質バラツキの影響で生じた最大位相差を上回る位相差を抑制する。この抑制処理を繰り返すことにより、どの方向から到来した音に対しても位相差が最大閾値以内に収まるようになる。この結果、品質バラツキによる遅延が補正され、音声信号の品質が向上する。
[実施例]
【0026】
図2を参照して、この実施例のディジタルカメラ10は、ドライバ18aおよび18bによってそれぞれ駆動されるフォーカスレンズ12および絞りユニット14を含む。これらの部材を経た光学像は、イメージャ16の撮像面に照射され、光電変換を施される。
【0027】
電源が投入されると、CPU30は、動画取り込み処理を実行するべく、ドライバ18cに露光動作および電荷読み出し動作の繰り返しを命令する。ドライバ18cは、周期的に発生する垂直同期信号Vsyncに応答して、イメージャ16の撮像面を露光し、かつ撮像面で生成された電荷をラスタ走査態様で読み出す。イメージャ16からは、読み出された電荷に基づく生画像データが周期的に出力される。
【0028】
カメラ処理回路20は、イメージャ16から出力された生画像データに白バランス調整,色分離,YUV変換などの処理を施す。これによって生成されたYUV形式の画像データは、メモリ制御回路22を通してSDRAM24のYUV画像エリア24aに書き込まれる。LCDドライバ26は、YUV画像エリア24aに格納された画像データをメモリ制御回路22を通して繰り返し読み出し、読み出された画像データに基づいてLCDモニタ28を駆動する。この結果、撮像面で捉えられたシーンを表すリアルタイム動画像(スルー画像)がモニタ画面に表示される。
【0029】
カメラ処理回路20はまた、YUV変換によって生成されたYデータをCPU30に与える。CPU30は、与えられたYデータにAE処理を施して適正EV値を算出し、算出された適正EV値を定義する絞り量および露光時間をドライバ18bおよび18cにそれぞれ設定する。これによって、スルー画像の明るさが確保される。CPU30はまた、前処理回路20から与えられたYデータの高周波成分を参照してAF処理を継続的に実行する。これによってフォーカスレンズ12が合焦点近傍に継続的に配置され、スルー画像の鮮鋭度が確保される。
【0030】
キー入力装置32に設けられたムービボタン32mvが操作されると、CPU30は、音声処理回路36およびメモリI/F38を起動する。音声処理回路36は、マイクロフォン34Lおよび34Rからそれぞれ出力されたLチャネルの音声データおよびRチャネルの音声データに後述する音声処理を施す。処理を施されたLチャネルの音声データおよびRチャネルの音声データは、メモリ制御回路22を介してSRAM24の音声エリア24bに書き込まれる。
【0031】
メモリI/F38は、新規の画像ファイルを着脱自在の記録媒体38に作成し(作成した画像ファイルはオープンされる)、YUV画像エリア24aに格納された画像データおよび音声エリア24bに格納された2チャネルの音声データをメモリ制御回路22を通して繰り返し読み出し、そして読み出された画像データおよび音声データをオープン状態の画像ファイルに収める。
【0032】
ムービボタン34mvが再度操作されると、CPU30は、音声処理回路36およびメモリI/F38を停止する。メモリI/F38は、YUV画像エリア24aおよび音声エリア24bからのデータ読み出しを終了し、オープン状態の画像ファイルをクローズする。これによって、撮像シーンを継続的に表す動画像と撮像シーン周辺の音声とがファイル形式で記録媒体40に記録される。
【0033】
音声処理回路36は、図3に示すように構成される。Lチャネルの音声データおよびRチャネルの音声データはそれぞれ、振幅補正系50を形成する振幅補正回路50Lおよび50Rに入力される。振幅補正回路50Lおよび50Rの各々は、入力された音声データの振幅を制御回路56の設定に従って補正し、補正後の音声データを遅延補正系52に与える。Lチャネルの音声データは遅延補正回路52Lに入力され、Rチャネルの音声データは遅延補正回路52Rに入力される。遅延補正回路52Lおよび52Rの各々は、入力された音声データを制御回路56の設定に従って遅延させ、遅延後の音声データをメモリ制御回路22に向けて出力する。
【0034】
遅延補正を施されたLチャネルの音声データおよびRチャネルの音声データはまた、FFT(Fast Fourier Transform)解析系52を形成するFFT解析回路54Lおよび54Rにそれぞれ入力される。FFT解析回路54Lおよび54Rの各々は、入力された音声データにフーリエ変換を施し、これによって得られた解析結果つまりNmax個(Nmax:2以上の整数)の周波数成分を制御回路56に与える。
【0035】
Lチャネルの周波数成分とRチャネルの周波数成分との位相差が1/2周期(=π)以上ずれる周波数については、チャネル間の位相差を的確に判別することができない。このため、Nmax個の周波数成分の各々の周波数は、数1を満足する必要がある。
[数1]
D/V*2πf<π
D:マイクロフォン34Lおよび34Rの間隔
V:音速
f:周波数
【0036】
なお、間隔Dを20ミリメートルとし、音速を340m/秒とすると、Nmax個の周波数成分はいずれも8.5kHzを下回る周波数のデータ成分に相当する。
【0037】
制御回路56は、こうして与えられた周波数成分に基づいて振幅補正系50および遅延補正系52の設定を制御する。制御回路56は、具体的にはDSP(Digital Signal Processor)であり、図4図6に示すフロー図に従う処理を1024サンプル毎に実行する。なお、振幅補正系50および遅延補正系52の設定は、電源投入時に初期化される。また、Lチャネルの音声データおよびRチャネルの音声データはいずれも48kHzのクロック周波数でサンプルされたデータに相当する。
【0038】
図4を参照して、ステップS1ではLチャネルの音声データのFFT解析結果をFFT解析回路54Lから取得し、ステップS3ではRチャネルの音声データのFFT解析結果をFFT解析回路54Rから取得する。取得が完了すると、ステップS5で変数Nを“1”に設定する。
【0039】
ステップS7ではLチャネルに属するN番目の周波数成分の位相を“Ph_L(N)”として算出し、ステップS9ではRチャネルに属するN番目の周波数成分の位相を“Ph_R(N)”として算出する。位相Ph_L(N)は数2に従って算出され、位相Ph_R(N)は数3に従って算出される。
[数2]
Ph_L(N)=atan(real(f_N_L)/imag(f_N_L))
atan:アークタンジェント
real(f_N_L):Lチャネルに属するN番目の周波数成分の実部
imag(f_N_L):Lチャネルに属するN番目の周波数成分の嘘部
[数3]
Ph_L(R)=atan(real(f_N_R)/imag(f_N_R))
real(f_N_R):Rチャネルに属するN番目の周波数成分の実部
imag(f_N_R):Rチャネルに属するN番目の周波数成分の嘘部
【0040】
ステップS11では、こうして算出された位相Ph_L(N)およびPh_R(N)の差分絶対値を“ΔPh(N)”として算出する。ステップS13では、変数Nが最大値Nmaxに達したか否かを判別する。判別結果がNOであればステップS15で変数NをインクリメントしてからステップS7に戻り、判別結果がYESであればステップS17に進む。
【0041】
ステップS17では、変数Nを再度“1”に設定する。ステップS19では差分絶対値ΔPh(N)が閾値TH1を下回るか否かを判別し、ステップS21では差分絶対値ΔPh(N)が閾値TH2以上であるか否かを判別する。ここで、閾値TH1は数4に従って算出され、閾値TH2は数5に従って算出される。なお、数4における“85°”は、同振幅で検出することが可能な正面方向からの音声信号とみなせる角度の限界に相当する。数5は、マイクを結ぶ直線の延長線上の方向から到来した場合の位相差を表し、理論上の最大位相差を示す。
[数4]
TH1=D*cos85°/V*2πf
[数5]
TH2=D*cos0°/V*2πf
【0042】
ステップS19の判別結果がYESであれば、Lチャネルに属するN番目の周波数成分のレベルをステップS23で保存し、Rチャネルに属するN番目の周波数成分のレベルをステップS25で保存する。ステップS21の判別結果がYESであれば、ステップS27で差分絶対値ΔPh(N)を保存する。
【0043】
ステップS25またはS27の処理が完了するか、或いはステップS19およびS21の判別結果がいずれもNOであれば、変数Nが最大値Nmaxに達したか否かをステップS29で判別する。判別結果がNOであればステップS31で変数NをインクリメントしてからステップS19に戻り、判別結果がYESであればステップS33に進む。
【0044】
ステップS33では、ステップS23の処理によって保存されたレベルの平均値を“LVav_L”として算出する。ステップS35では、ステップS25の処理によって保存されたレベルの平均値を“LVav_R”として算出する。ステップS37では、算出された平均値LVav_LおよびLVav_Rの差分絶対値が抑制されるように振幅補正回路50Lおよび50Rの設定を調整する。
【0045】
ステップS39では、ステップS27の処理によって保存された差分絶対値の平均値を“ΔPhav”として算出する。ステップS41では、算出された平均値ΔPhavが抑制されるように、遅延補正回路52Lおよび52Rの設定を調整する。調整が完了すると、注目する1024サンプルに対する処理を終了する。
【0046】
図7に示すように音声信号が前方から入射した場合、或る周波数に属するLチャネルのデータ成分およびRチャネルのデータ成分はそれぞれ図8(A)に示す波形および図8(B)に示す波形を描く。また、図9に示すように音声信号が斜め右前方から入射した場合、或る周波数に属するLチャネルのデータ成分およびRチャネルのデータ成分はそれぞれ図10(A)に示す波形および図10(B)に示す波形を描く。さらに、図11に示すように音声信号が右側から入射した場合、或る周波数に属するLチャネルのデータ成分およびRチャネルのデータ成分はそれぞれ図12(A)に示す波形および図12(B)に示す波形を描く。
【0047】
ここで、図8(B),図10(B)または図12(B)に実線で示す波形は、振幅補正回路50Rの特性が振幅補正回路50Lの特性と一致し、かつ遅延補正回路52Rの特性が遅延補正回路52Lの特性と一致する場合のRチャネルのデータ成分の変化を表す。
【0048】
また、図8(B),図10(B)または図12(B)に一点鎖線で示す波形は、振幅補正回路50Rの特性が振幅補正回路50Lの特性と相違し、かつ遅延補正回路52Rの特性が遅延補正回路52Lの特性と一致する場合のRチャネルのデータ成分の変化を表す。
【0049】
さらに、図8(B),図10(B)または図12(B)に破線で示す波形は、振幅補正回路50Rの特性が振幅補正回路50Lの特性と一致し、かつ遅延補正回路52Rの特性が遅延補正回路52Lの特性と相違する場合のRチャネルのデータ成分の変化を表す。
【0050】
振幅補正回路50Lと振幅補正回路50Rとの間での特性の相違は、部品の性能のばらつきに起因して発生する。遅延補正回路52Lと遅延補正回路52Rとの間での特性の相違も、部品の性能のばらつきに起因して発生する。
【0051】
また、音声信号の入射角が図7図9および図11の間で相違することから、図10(B)に波形の位相は図8(B)に示す波形の位相よりも進み、図12(B)に波形の位相は図10(B)に示す波形の位相よりも進む。
【0052】
これを踏まえて、図5に示すステップS19の判別結果は、図7または図9に示す要領で入射された音声信号についてYESを示す一方、図11に示す要領で入射された音声信号についてはNOを示す。これに対して、図5に示すステップS21の判別結果は、図7または図9に示す要領で入射された音声信号についてNOを示す一方、図11に示す要領で入射された音声信号についてはYESを示す。
【0053】
したがって、振幅補正系50の設定は、図8(A)に示す波形のレベルと図8(B)に示す波形のレベルとの相違が抑制されるように調整され、或いは図10(A)に示す波形のレベルと図10(B)に示す波形のレベルとの相違が抑制されるように調整される。これに対して、遅延補正系52の設定は、図12(A)に示す波形の位相と図12(B)に示す波形の位相との相違が抑制されるように調整される。
【0054】
以上の説明から分かるように、制御回路56は、並列的に取得された2チャネルの音声データの各々をNmax(Nmax:2以上の整数)の周波数にそれぞれ対応するNmax個の周波数成分に分類し(S1~S5, S13~S15)、Nmax個の周波数の各々に対応する2つの周波数成分の間の位相差を差分絶対値ΔPh(1)〜ΔPh(Nmax)として検出する(S7~S11)。制御回路56はまた、検出された差分絶対値ΔPh(1)〜ΔPh(Nmax)の中から閾値TH1を下回る差分絶対値を特定し(S19)、特定された差分絶対値を定義する2つの周波数成分の間のレベル差が抑制されるように振幅補正系50の設定を調整する(S23~S25, S33~S37)。ここで、閾値TH1は、マイクロフォン34Lおよび34Rの間の距離と音声の許容入射角の上限とに基づく値を示す。
【0055】
制御回路56はまた、Nmax個の差分絶対値ΔPh(1)〜ΔPh(Nmax)の中から閾値TH2以上の値を示す差分絶対値を特定し(S21, S27)、特定された差分絶対値に相当する位相差が抑制されるように遅延補正系52の設定を調整する(S39~S41)。ここで、閾値TH2もまた、マイクロフォン34Lおよび34Rの間の距離に基づく値を示す。
【0056】
このように、音声データの振幅は、閾値TH1を下回る差分絶対値を定義する2つの周波数成分の間のレベル差が抑制されるように調整される。換言すれば、閾値TH1に相当する角度を下回る角度で入射された音声成分のレベル差が抑制されるように、M個の音声信号の全域の振幅が調整される。また、音声データの遅延量は、閾値TH2以上の差分絶対値に相当する位相差が抑制されるように調整される。換言すれば、閾値TH2をマイク間隔から決まる理論上の最大閾値とすることで、品質バラツキの影響で生じた最大位相差を上回る位相差を抑制する。この抑制処理を繰り返すことにより、どの方向から到来した音に対しても位相差が最大閾値以内に収まるようになる。この結果、品質バラツキによる遅延が補正され、音声信号の品質が向上する。
【0057】
なお、この実施例の音声処理回路36は図3に示すように構成されるが、音声処理回路36は図13または図14に示すように構成してもよい。
【0058】
図13によれば、FFT解析系54は振幅補正系50の前段に設けられ、逆FFT系58が遅延補正系52の後段に設けられる。Lチャネルの音声データはFFT解析回路54Lを介して振幅補正回路50Lに与えられ、Rチャネルの音声データはFFT解析回路54Rを介して振幅補正回路50Rに与えられる。また、制御回路56は、遅延補正系52の出力に基づいて図4図6に示す処理を実行する。さらに、遅延補正回路52Lの出力は逆FFT回路58Lによって音声データに戻された後にメモリ制御回路22に向けて出力され、遅延補正回路52Rの出力は逆FFT回路58Rによって音声データに戻された後にメモリ制御回路22に向けて出力される。
【0059】
図14によれば、振幅補正回路50Lおよび遅延補正回路52Lの代わりに位相・振幅補正フィルタ60Lが設けられ、振幅補正回路50Rおよび遅延補正回路52Rの代わりに位相・振幅補正フィルタ60Rが設けられる。位相・振幅補正フィルタ60Lおよび60Rはいずれも、指向性を制御したり、ステレオ感を強調するための重み付けフィルタに相当する。このとき、図6に示すステップS37およびS41では、重み付けフィルタ60Lおよび60Rの設定が調整される。
【0060】
また、この実施例では、図3に示す制御回路56としてDSPを採用しているが、DSPに代えてCPUを採用するようにしてもよい。この場合、図4図6に示す処理に相当する制御プログラムは、図示しないフラッシュメモリに記憶される。
【符号の説明】
【0061】
10 …ディジタルカメラ
16 …イメージャ
24 …SDRAM
30 …CPU
36 …音声処理回路
50 …振幅補正系
52 …遅延補正系
54 …FFT解析系
56 …制御回路
図1
図2
図3
図4
図5
図6
図7
図8
図9
図10
図11
図12
図13
図14