特許第6369612号(P6369612)IP Force 特許公報掲載プロジェクト 2022.1.31 β版

知財求人 - 知財ポータルサイト「IP Force」

▶ 株式会社ニコンの特許一覧

<>
  • 特許6369612-音処理装置および音処理プログラム 図000002
  • 特許6369612-音処理装置および音処理プログラム 図000003
  • 特許6369612-音処理装置および音処理プログラム 図000004
  • 特許6369612-音処理装置および音処理プログラム 図000005
  • 特許6369612-音処理装置および音処理プログラム 図000006
  • 特許6369612-音処理装置および音処理プログラム 図000007
< >
(19)【発行国】日本国特許庁(JP)
(12)【公報種別】特許公報(B2)
(11)【特許番号】6369612
(24)【登録日】2018年7月20日
(45)【発行日】2018年8月8日
(54)【発明の名称】音処理装置および音処理プログラム
(51)【国際特許分類】
   H04S 1/00 20060101AFI20180730BHJP
   H04S 7/00 20060101ALI20180730BHJP
   G10L 21/0208 20130101ALI20180730BHJP
   H04R 3/00 20060101ALI20180730BHJP
   H04N 5/232 20060101ALI20180730BHJP
【FI】
   H04S1/00 200
   H04S7/00 370
   G10L21/0208 100Z
   H04R3/00 320
   H04N5/232
【請求項の数】4
【全頁数】14
(21)【出願番号】特願2017-160246(P2017-160246)
(22)【出願日】2017年8月23日
(62)【分割の表示】特願2013-17863(P2013-17863)の分割
【原出願日】2013年1月31日
(65)【公開番号】特開2017-229086(P2017-229086A)
(43)【公開日】2017年12月28日
【審査請求日】2017年8月23日
(31)【優先権主張番号】特願2012-19627(P2012-19627)
(32)【優先日】2012年2月1日
(33)【優先権主張国】JP
(73)【特許権者】
【識別番号】000004112
【氏名又は名称】株式会社ニコン
(74)【代理人】
【識別番号】100166338
【弁理士】
【氏名又は名称】関口 正夫
(74)【代理人】
【識別番号】100152054
【弁理士】
【氏名又は名称】仲野 孝雅
(72)【発明者】
【氏名】岡崎 光宏
【審査官】 渡邊 正宏
(56)【参考文献】
【文献】 特開2008−227595(JP,A)
【文献】 特開2000−004494(JP,A)
(58)【調査した分野】(Int.Cl.,DB名)
G10K 11/00−13/00
G10L 13/00−13/10
G10L 19/00−19/26
G10L 21/00−21/18
G10L 25/00−25/93
G10L 99/00
H04N 5/232
H04R 1/10
H04R 3/00− 3/14
H04R 5/00− 5/04
H04R 25/00−25/04
H04S 1/00− 7/00
(57)【特許請求の範囲】
【請求項1】
第1音データを出力する第1集音部と第2音データを出力する第2集音部とを有する集音部と、
前記第1音データと前記第2音データとの、複数の周波数領域における振幅の比を算出する算出部と、
前記第1音データと前記第2音データとのうち少なくとも一方から、一部の音データを除去する除去部と、
少なくとも一方から前記一部の音データが除去された前記第1音データと前記第2音データの前記周波数領域における振幅の比を、除去前の前記第1音データと前記第2音データとの前記複数の周波数領域における振幅の比に近づける処理部
とを備える音処理装置。
【請求項2】
請求項1に記載の音処理装置であって
前記除去部で除去する音データは、カメラレンズの機構を駆動することにより発生する音データである音処理装置。
【請求項3】
請求項2に記載の音処理装置であって、
前記カメラレンズの機構を駆動することにより発生する音データを検出する検出部を備え、
前記処理部は、前記検出部で検出した前記音データに基づいて、前記第1音データと前記第2音データの少なくとも一方から前記音データを除去する音処理装置。
【請求項4】
第1集音部による第1音データと、第2集音部による第2音データとを入力する処理と、
前記第1音データと前記第2音データとの、複数の周波数領域における振幅の比を算出する処理と、
前記第1音データと前記第2音データとのうち少なくとも一方から、一部の音データを除去する処理と、
少なくとも一方から前記一部の音データが除去された前記第1音データと前記第2音データの前記周波数領域における振幅の比を、除去前の前記第1音データと前記第2音データとの前記複数の周波数領域における振幅の比に近づける処理
とをコンピュータに実行させるプログラム。
【発明の詳細な説明】
【技術分野】
【0001】
本発明は、音処理装置および音処理プログラムに関するものである。
【背景技術】
【0002】
複数の集音装置を備えたステレオ録音が可能な撮像装置として、動画撮影時にオートフォーカス(以後、「AF」と略記する)等の駆動音の発生に合わせてノイズ低減処理を行うものがある。
ステレオ等の複数チャンネルの有する音信号の雑音を抑制する雑音抑制装置においては、ステレオ成分の雑音を抑制する技術が知られている(特許文献1等参照)。
【先行技術文献】
【特許文献】
【0003】
【特許文献1】特開2008−283385号公報
【発明の概要】
【発明が解決しようとする課題】
【0004】
ところで、ステレオ録音時において、駆動音の発生に合わせてノイズ低減処理を行うと、ノイズ低減処理に起因して音信号のバランスが変化してしまうことがあり、その結果、音像が変位し、再生時に違和感を生じさせるという問題がある。
【0005】
本発明の課題は、ノイズ低減処理に伴う音像の変位を抑制できる音処理装置および音処理プログラムを提供することである。
【課題を解決するための手段】
【0006】
本発明の音処理装置は、第1音データを出力する第1集音部と第2音データを出力する第2集音部とを有する集音部と、前記第1音データと前記第2音データとの、複数の周波数領域における振幅の比を算出する算出部と、前記第1音データと前記第2音データとのうち少なくとも一方から、一部の音データを除去する除去部と、少なくとも一方から前記一部の音データが除去された前記第1音データと前記第2音データの前記周波数領域における振幅の比を、除去前の前記第1音データと前記第2音データとの前記複数の周波数領域における振幅の比に近づける処理部とを備える構成とした。
本発明のプログラムは、第1集音部による第1音データと、第2集音部による第2音データとを入力する処理と、前記第1音データと前記第2音データとの、複数の周波数領域における振幅の比を算出する処理と、前記第1音データと前記第2音データとのうち少なくとも一方から、一部の音データを除去する処理と、少なくとも一方から前記一部の音データが除去された前記第1音データと前記第2音データの前記周波数領域における振幅の比を、除去前の前記第1音データと前記第2音データとの前記複数の周波数領域における振幅の比に近づける処理とをコンピュータに実行させる構成とした。
【発明の効果】
【0007】
本発明によれば、ノイズ低減処理に伴う音像の変位を抑制できる音処理装置および音処理プログラムを提供できる。
【図面の簡単な説明】
【0008】
図1】本発明における音処理装置の一実施形態であるカメラを示し、(a)はそのブロック構成図、(b)は概念正面図である。
図2】音情報処理部におけるノイズ低減処理とその補正の説明図である。
図3】音情報処理部におけるノイズ低減処理と補正のフローチャートである。
図4】音像変位を説明する図である。
図5】第2実施形態にかかる音情報処理部におけるノイズ低減処理と補正のフローチャートである。
図6】ノイズ低減処理部分の前後の信号比変化と対応させた補正を説明する図である。
【発明を実施するための形態】
【0009】
以下、図面等を参照して、本発明の実施形態について説明する。
(第1実施形態)
図1は、本発明における音処理装置の一実施形態であるカメラ1を示し、図1(a)はそのブロック構成図、図1(b)はカメラ1の概念正面図である。
図1(a)に示すように、カメラ1は、カメラ本体10と、レンズ鏡筒20とにより構成されている。カメラ1は、自動的に合焦するオートフォーカス(以下AFと略記する)機能を備えている。また、カメラ1は、静止画と動画の何れも撮影可能であって、動画撮影時には画像と同時に音をステレオで記録可能である。
【0010】
カメラ本体10は、撮像素子11と、画像処理部12と、ステレオ集音装置13と、音情報処理部14と、記憶部15と、制御部16と、出力部18と、入力部19とを備えている。
撮像素子11は、CCD等の光電変換素子により構成され、レンズ鏡筒20の結像光学系によって結像された被写体像光を電気信号に変換する。
画像処理部12は、撮像素子11から出力されるアナログの画像情報をA/D変換すると共に画像処理して画像データを生成する。
【0011】
ステレオ集音装置13は、図1(b)に示すように、左右一対のマイク(左マイク13L,右マイク13R)を備えている。左マイク13Lと右マイク13Rとは、カメラ1を横位置で構えた状態においてレンズ鏡筒20の中心を通る鉛直線を挟む略対称位置に配置されている。各マイク13L,13Rは、それぞれ外部の音を集音してアナログ信号として検出し、音情報処理部14に出力する。
音情報処理部14は、ステレオ集音装置13から入力される音信号をA/D変換してデジタル信号とすると共にノイズ低減処理を行う。音情報処理部14は、ノイズ低減処理係る機能部として、ノイズ低減処理部14Aと、補正部14Bと、を備えている。これらについては、後に詳述する。
【0012】
記憶部15は、画像処理部12が出力する画像データおよび音情報処理部14が出力する音データを記憶する。記憶部15は、バッファーやカメラに内蔵されたメモリでもよいし、またSDカードやHDD等の外部の記憶媒体でもよい。
【0013】
出力部18は、記憶部15に記憶された画像データ及び音データを出力する。出力部18は、外部機器へ音情報(電気信号)を出力するためのインターフェース等である。外部機器とは、これに限定されないが、例えばPC、外部スピーカ、携帯電話等である。ただし、これに限定されず、出力部18は、カメラ1に設けられた背面液晶及びスピーカであってもよい。なお、出力部18がスピーカの場合、出力部18は音情報(電気信号)を音に変換する変換部も備える。
【0014】
入力部19は、外部機器からデータを入力するためのインターフェース等である。
外部機器とデータのやり取り(通信)をする際には、出力部18と入力部19は別体となっていなくてもよく、入力部19と出力部18が一体となっているような構成であってもよい。
なお、外部機器とは、これに限定されないが、例えばPC、外部マイク、携帯電話等である。
【0015】
制御部16は、CPU等を備えて構成され、設定された撮像条件(例えば、絞り値、露出値等)に応じて、レンズ鏡筒20の後述する各構成要素を含めたカメラ1の各構成要素を統括制御する。たとえば、制御部16は、後述するレンズ鏡筒20におけるAF駆動用モータ22を駆動する駆動制御信号を生成し、レンズ制御部24に出力する。
【0016】
レンズ鏡筒20は、フォーカシングレンズ、手振れ補正レンズ、ズーミングレンズ等を備える結像光学系(図示省略)と、AFエンコーダ21と、AF駆動用モータ22と、を備えている。
AFエンコーダ21は、フォーカシングレンズの位置を検出してレンズ制御部24および制御部16に出力する。レンズ制御部24は、検出されたフォーカシングレンズの位置情報を制御部16に出力する。
AF駆動用モータ22は、レンズ制御部24から入力されるAFレンズの位置を制御するための駆動制御信号に応じて、AFレンズを移動駆動する。
【0017】
そして、カメラ1は、使用者による図示しないシャッタボタンの押圧操作によって撮影が指令されると、制御部16によって制御されて撮影作用を行う。
すなわち、撮像素子11によって被写体像光を電気信号に変換し、画像処理部12によって処理した画像データを、記憶部15に記憶させる(撮影する)。制御部16は、撮影時において、レンズ制御部24、AF駆動用モータ22を介してAFレンズを移動駆動するAF制御を行う。
【0018】
動画撮影時においては、撮像素子11は、被写体像光を電気信号に変換して順次取り込み、記憶部15を介して1秒間に所定のフレーム(コマ数)の画像を記憶する。また、前述したように、音情報処理部14が集音した音データを、画像データと共に記憶部15を介して記憶(録音)する。動画撮影時には、撮影期間を通してAF制御が行われる。
【0019】
ここで、ステレオ集音装置13が集音した音情報は、音情報処理部14に入力される。音情報処理部14は、ステレオ集音装置13が集音した音に含まれるAF制御にかかる駆動ノイズ(AF駆動音)を低減処理する。そして、音情報処理部14は、駆動ノイズ(AF駆動音)が低減処理された音情報を記憶部15に出力する。
【0020】
ただし、上記の処理の流れに限定されない。例えば変形形態として、1)制御部16は、ステレオ集音装置13が集音した音を、一旦、記憶部15に記憶させる、2)制御部16は、その記憶された音データをノイズ低減処理部14Aへ出力する、3)低減処理部14Aは音データに対して低減処理を施す、4)次いで、制御部16は、低減処理された音データを、再度、記憶部15に記憶する、といった処理の流れでも良い。
【0021】
本実施形態の処理の流れに戻り、前述した図1に加えて図2図4を参照し、音情報処理部14について詳細に説明する。図2は、音情報処理部14におけるノイズ低減処理とその補正の説明図である。図3は、音情報処理部14におけるノイズ低減処理と補正のフローチャートである。図4は、音像変位を説明する図である。
【0022】
音情報処理部14は、前述したように、ノイズ低減処理部14Aと、補正部14Bとを備えている。
ノイズ低減処理部14Aは、ノイズ周波数スペクトルSNを用い、スペクトル減算法によってAF駆動音に対するノイズ低減処理を行う。ノイズ周波数スペクトルSNは、図2(b)に一例を示すような、予め記憶している動作ノイズ情報又は過去に集音した音情報から推定したものである。
【0023】
具体的に説明すると、ノイズ低減処理部14Aは、ステレオ集音装置13(左マイク13L,右マイク13R)から入力されてデジタル化された音信号を、所定の長さで区切ったフレーム単位でフーリエ変換等により周波数解析を行う。
そして、図2(a)に一例を示すような複数の周波数帯域(f1〜f8)に分割した周波数スペクトルSIL,SIRを得る。
その周波数スペクトルSIL,SIRから図2(b)に示すノイズ周波数スペクトルSNを減算してノイズ成分を除去する。
さらに、必要に応じて、信号の下限規制等のフロアリング処理を行って、図2(c)に示すノイズ低減処理後の周波数スペクトルSSL,SSRを補正部14Bに出力する。
【0024】
このノイズ低減処理部14Aによるノイズ低減処理は、AF駆動音が含まれるフレームに対して、フレーム毎に行われる。
AF駆動音が含まれるフレームの検知は、たとえば、AFレンズの位置を検出するAFエンコーダ21の出力に基づいて(AFレンズが移動するとAFエンコーダ21の出力が変化する)行われる。
なお、図2(a)における周波数スペクトルSIL,SIRに対する網掛け部位は、AF駆動音が含まれない目的音のみの周波数スペクトルを参考的に示すものである。
【0025】
ここで、ノイズ低減処理部14Aによるノイズ低減処理は、ステレオ集音装置13における左右のマイク(左マイク13L,右マイク13R)からの音信号に対して、それぞれ独立して行われる。
ただし、左マイク13Lおよび右マイク13Rはレンズ鏡筒20に対して略対称に配置されているため、入力されるAFノイズ(AF駆動音)は同一であるものとしてノイズ周波数スペクトルSNは同一のものを用いる。
なお、左マイク13Lおよび右マイク13Rはレンズ鏡筒20に対して略対称に配置される形態に限定されず、光軸に対した左右非対称であってもよい。
【0026】
補正部14Bは、
・ノイズ低減処理部14Aによるノイズ低減処理前の周波数スペクトル(処理前スペクトル)SIL,SIRの、各周波数帯域(f1〜f8)における左右の信号比(処理前比、基準比)と、
・ノイズ低減処理部14Aによるノイズ低減処理後の周波数スペクトル(処理後スペクトル)SSL,SSRの各周波数帯域(f1〜f8)における左右の信号比(処理後比、第1の関係)と、
を各々比較する。
【0027】
補正部14Bは、その比較結果に基づいて、処理後比RSが処理前比RIと、各周波数帯域において、それぞれ略一致するように補正して補正後比RC(第2の関係)、補正後の周波数スペクトル(補正後スペクトル)SCL,SCRを求める。
そして、補正部14Bは、この補正後スペクトルSCL,SCRを記憶部15に出力する。
【0028】
以下、この補正部14Bによる補正について、図2に即してより詳細に説明する。
(処理前スペクトル)
図2(a)に示すように、ノイズ低減処理部14Aによるノイズ低減処理前における左マイク13Lから入力した音(音信号L)の周波数スペクトル(処理前スペクトル(L))における各周波数帯域(f1〜f8)の振幅をSIL1〜SIL8とする。
右マイク13Rから入力した音(音信号R)の周波数スペクトル(処理前スペクトル(R))における各周波数帯域(f1〜f8)の振幅をSIR1〜SIR8とする。
処理前スペクトルの周波数帯域(f1〜f8)ごとの振幅の左/右信号比(以下、この左/右信号比を処理前比とする)は、RI1=SIL1/SIR1,・・・,RI8=SIL8/SIR8となる。
【0029】
(処理後スペクトル)
また、図2(c)に示すように、ノイズ低減処理部14Aによるノイズ低減処理後の音信号Lの周波数スペクトル(処理後スペクトル(L))における各周波数帯域(f1〜f8)の振幅をSSL1〜SSL8とする。
ノイズ低減処理部14Aによるノイズ低減処理後の音信号Rの周波数スペクトル(処理後スペクトル(R))における各周波数帯域(f1〜f8)の振幅をSSR1〜SSR8とする。
処理後スペクトルの周波数帯域(f1〜f8)ごとの振幅の左/右信号比(以下、この左/右信号比を処理後比とする)は、RS1=SSL1/SSR1,・・・,RS8=SSL8/SSR8となる。
【0030】
(補正後スペクトル)
補正部14Bは、処理前比(RI1〜RI8)と、処理後比(RS1〜RS8)と、
を各周波数帯域(f1〜f8)において比較する。
そして、補正部14Bは、図2(d)に示すように、処理後比(RS1〜RS8)が処理前比(RI1〜RI8)と各々等しくなるように補正する。そして、補正後スペクトル(L)(SCL1〜SCL8)及び補正後スペクトル(R)(SCR1〜SCR8)を得る。
【0031】
ここで、補正後スペクトルを得る方式には、増加補正と、減少補正と、平均補正と、がある。
【0032】
(増加補正)
増加補正は、処理後スペクトル(L)又は処理後スペクトル(R)の何れかの振幅を大きく補正して、処理後比RSを処理前比RIに一致させるものである。
1.処理後比RSnが処理前比RInより大きい場合
(1)補正後スペクトル(L)を求める(L固定)
処理後スペクトル(L)SSLnを補正後スペクトル(L)SCLnとする(SCLn=SSLn)
(2)補正後スペクトル(R)を求める
そして、(1)で求めた補正後スペクトル(L)SCLnに対する比が、処理前比RInと等しくなるように、補正後スペクトル(R)SCRnを求める。
このとき、処理後比RSnは、処理前比RInより大きいので、処理後スペクトル(L)と同じ値の補正後スペクトル(L)SCLに対して処理前比を満たすように、処理後スペクトル(R)SSRを補正すると、補正後スペクトル(R)SCRnは、処理後スペクトル(R)SSRnより大きくなる(SCRn>SSRn)。
【0033】
2.処理後比RSnが処理前比RInより小さい場合
(1)補正後スペクトル(R)を求める(R固定)
処理後スペクトル(R)SSRnを補正後スペクトル(R)SCRnとする(SCRn=SSRn)
(2)補正後スペクトル(L)を求める
そして、(1)で求めた補正後スペクトル(R)SCRnに対する比が、処理前比RInと等しくなるように、補正後スペクトル(L)SCLnを求める。
このとき、SCLn>SSLnとなる。
なお、上記「n」には、各周波数帯域を示す数字(1〜8)が入る。
【0034】
上記の増加補正において、補正後スペクトルの振幅は、本実施形態においてノイズ低減処理前の振幅以下であるが、これに限定されない。例えば、ノイズ低減処理後のスペクトルを一旦増幅した後にスペクトルの振幅を補正した場合には、補正後のスペクトルの振幅はノイズ低減処理前の振幅よりも大きくなることがある。
【0035】
3.具体例
具体例として、図2(a)〜(e)中に示すように、周波数スペクトルにおける周波数帯域f3に左右で差があり、周波数帯域f3における左右(L,R)の振幅値がノイズ低減処理前(6,3)で、ノイズ低減処理によって(4,1)に変化したとする。
この場合、処理前比RI3は6/3=2、処理後比RS3は4/1=4、と異なる。補正後における左右信号比(補正後比)RC3を処理前比RI3と等しくするため、ノイズ低減処理後の右(R)の振幅値を1から2に補正する。
その結果、補正後におけるL、Rの振幅値は(4,2)となり、処理前比2と等しくなる。
このような増加補正によれば、目的音の劣化を抑えることができ、人の音がある場合や目的音が大きくノイズがあまり気にならない場合等に適する。
【0036】
(減少補正)
減少補正は、処理後スペクトル(L)又は処理後スペクトル(R)の何れかの振幅を小さく補正して、処理後比RSを処理前比RIに一致させるものである。
1.処理後比RSnが処理前比RInより大きい場合
(1)補正後スペクトル(R)を求める(R固定)
処理後スペクトル(R)SSRnを補正後スペクトル(R)SCRnとする(SCRn=SSRn)
(2)補正後スペクトル(L)を求める
そして、(1)で求めた補正後スペクトル(R)SCRnに対する比が、処理前比RInと等しくなるように、補正後スペクトル(L)SCLnを求める。
このとき、SCLn<SSLnとなる。
【0037】
2.処理後比RSnが処理前比RInより小さい場合
(1)補正後スペクトル(L)を求める(L固定)
処理後スペクトル(L)SSLnを補正後スペクトル(L)SCLnとする(SCLn=SSLn)
(2)補正後スペクトル(R)を求める
そして、(1)で求めた補正後スペクトル(L)SCLnに対する比が、処理前比RInと等しくなるように、補正後スペクトル(R)SCRnを求める。
このとき、SCRn<SSRnとなる。
このような減少補正は、ノイズ低減効果が高く、人声のない静かな場合等に適する。
【0038】
なお上記の減少補正において、補正後スペクトルの振幅は、本実施形態においてノイズ低減処理後の振幅以下であるが、これに限定されない。例えば、ノイズ低減処理後のスペクトルを一旦増幅した後にスペクトルの振幅を補正した場合には、補正後のスペクトルの振幅はノイズ低減処理後の振幅よりも大きくなることがある。また、増幅の度合いに応じては、ノイズ低減処理前の振幅よりも大きくなることもある。
【0039】
(平均補正)
平均補正は、前述した増加補正と減少補正とを折衷したものである。ノイズ低減処理後の左右の周波数スペクトルにおける振幅の和を、処理後比RSn=処理前比RInとなるように左右に振り分けて補正するものである。
【0040】
上記各補正方式は、補正する対象や状況に応じて、補正方式を切り換えて適用するように構成してもよい。補正方式の切り換えは、公知の技術である音認識や撮像情報から顔認識や人物認識を利用して行うことができる。たとえば、人物が大きく撮影されている場合や人の音入力が認識された場合および入力が大きい場合には増加補正を適用し、人物が認識されないその他の場合には減少補正を適用するように構成すれば良い。
【0041】
なお、本実施形態では、処理後比RS(第1の関係)を処理前比RI(基準関係)に一致させる例について説明した。しかし、本実施形態はそれに限定されない。補正後比RCは必ずしもRC=処理前比RIでなくても良く、RCは処理前比RIを含む所定の範囲内であればよい。また、補正後比RCの所定の範囲とは、処理後比RSよりも処理前比RIに近い値となる範囲である。
【0042】
すなわち、仮に、処理後比RS(第1の関係)の音を聞くことができたとすると、補正後比RCの音の定位は、第1の関係(処理後比RS)の音の定位よりも、処理前比RIの音の定位に近い。
また、補正後比RCの所定の範囲とは、補正後比RCが処理前比RIのプラスマイナス5%以内に含まれるような範囲と定めてもよい。
【0043】
また、補正後比RCの所定の範囲とは、ノイズ低減処理前の音像の位置に対して、補正後の音像の位置がプラスマイナス30°以内に含まれるような範囲であってもよい。このように、補正後比RCの所定の範囲を、補正後の音像の位置が所定の角度の範囲に含まれるような範囲として定めてもよい。また補正後比RCの所定の範囲とは、補正後の音像の位置がプラスマイナス30°よりも狭い、プラスマイナス15°以内に含まれる範囲であってもよい。
【0044】
つぎに、図3に示すフローチャートに沿って、ノイズ低減処理部14Aおよび補正部14Bによるノイズ低減処理と補正制御の流れを説明する。なお、図3中および以下の説明では、ステップを「S」とも略記する。
ノイズ低減処理部14Aによるノイズ低減処理と補正部14Bによる補正は、前述したようにAFエンコーダ21の出力等のAF駆動情報に基づいてスタートする。つまり、AF駆動時のみに機能する。
【0045】
ノイズ低減処理と補正制御は、まず、補正部14Bがノイズ低減処理部14Aによるノイズ低減処理前におけるそのフレームの処理前比RIを演算し(S301)、ノイズ低減処理部14Aによってノイズ低減処理を行う(S302)。
ついで、補正部14Bが、ノイズ低減処理部14Aによるノイズ低減処理後の処理後比RSを演算し(S303)、その処理後比RSと処理前比RIとを比較する(S304)。
ステップ304において両者が等しくないと判断された場合(No)には、補正部14Bによってノイズ低減処理後の信号に補正を行う(S305)。一方、ステップ304において両者が等しいと判断された場合(Yes)には、補正することなく制御を終了する。
【0046】
上記のように、補正部14Bは、周波数スペクトルの各周波数帯域における処理後比を、処理前比と略一致するように補正する。
これにより、ステレオ信号をノイズ発生タイミングに合わせてノイズ低減処理を行った際に、そのノイズ低減処理に起因する目的音の音像変位を抑制することができる。
【0047】
すなわち、図4に概念図を示すように、人物Mから見た目的音の音像位置に対して、ノイズ低減処理のみで補正しない処理音の音像が大きく移動してしまう場合でも、補正によって音像の移動を小さく抑えることができる。その結果、ノイズ低減処理時(AF駆動時)において映像と音像とが突然乖離するといった違和感のある音像変位を防ぐことができるものである。
また、本実施形態において音処理は、全周波数帯域において行うものでなくてもよく、一部の周波数帯域に対して音処理を行ってもよい。一部の周波数帯域の例としては、ノイズが特に検出される周波数帯域や、可聴の周波数帯域、極端な高周波や低周波をカットした周波数帯域があげられる。
【0048】
(第2実施形態)
つぎに、本発明の第2実施形態について説明する。
図5は、第2実施形態にかかる音情報処理部14におけるノイズ低減処理と補正のフローチャートである。図2図3と同様に、周波数スペクトルにおける周波数帯域f3について説明する。
本第2実施形態は、補正の基準とする左右信号比(処理前比)を、ノイズ(AF駆動音)発生の無い部分(フレーム)から取得するものである。なお、機構的な構成は、前述した第1実施形態と全く同様であり、説明は省略する。以下の説明中における構成要素の符号等は、図1参照のこと。
本第2実施形態では、補正の基準とする左右信号比を、ノイズ低減処理部分の直前または直後の部分から求める。なお、直前の信号比を利用する場合にはリアルタイムの処理(逐次処理)が可能であるが、直後の信号比を利用する場合には逐次処理が難しく後処理の場合にのみ適用可能である。
【0049】
このように、ノイズ(AF駆動音)が混入していない部分から左右信号比を求めてこれを補正の基準とすることで、ノイズの影響を受けずに目的音の左右比を求めることができる。
ただし、目的音の時間変化が大きい場合は、ノイズ低減処理部分の直前と、ノイズ低減処理部分とで、目的音のスペクトル(左右信号比)が大きく変化することがあり、実際に発生している目的音の音像移動に追従できないことがある。このようなことを防ぐため、補正の基準とする左右信号比を、ノイズ低減処理部分の直前から求めた左右信号比と、前述した第1実施形態のようにノイズ低減処理部分の左右信号比と、の何れかを選択可能とすることが好ましい。
【0050】
この補正基準となる左右信号比を選択して適用する場合におけるノイズ低減処理および補正を、図5に示すフローチャートに沿って説明する。
まず、補正部14Bが、AFエンコーダ21の出力等のAF駆動情報に基づいてノイズ低減処理をスタートする直前のフレームの左右の信号比RIbを演算し(S501)、ノイズ低減処理に入った後にノイズ低減処理部14Aによるノイズ低減処理前における各フレームの左右の信号比RIaを演算する(S502)。
【0051】
そして、信号比RIbと信号比RIaとの差(絶対値)を、予め定められた閾値Aと比較判定する(S503)。
ステップ503において、信号比RIbと信号比RIaとの差が閾値A以下と判定された場合(Yes)には、信号比RIbを基準比RIとして設定する(S504)。一方、ステップ503において、信号比RIbと信号比RIaとの差が閾値Aを越えていると判定された場合(No)には、信号比RIaを基準比RIとして設定する(S505)。
【0052】
その後、ノイズ低減処理部14Aによってノイズ低減処理を行い(S506)、ついで、補正部14Bが、ノイズ低減処理部14Aによるノイズ低減処理後の左右の信号比RSを演算し(S507)、そのノイズ低減処理後左右信号比RSとノイズ低減処理前左右信号比RIとを比較する(S508)。
ステップ508において両者が等しくないと判断された場合(No)には、補正部14Bによってノイズ低減処理後の信号に補正を行う(S509)。一方、ステップ508において両者が等しいと判断された場合(Yes)には、補正することなく制御を終了する。
【0053】
上記構成では、ノイズ低減処理部分の直前から求めた左右信号比RIbとノイズ低減処理部分の左右信号比RIaとを比較し、その差が小さい場合には、目的音の音像の移動が小さいと判断してノイズの影響を受けない信号比RIbを基準信号比RIとして採用し、差が所定量より大きい場合には、目的音の音像の移動が大きいと判断して信号比RIaを基準信号比RIとして採用するものである。
このような構成によれば、目的音の音像の移動が小さい場合には処理部分の直前と処理部分の音像の連続性を保つことができ、目的音の音像の移動が大きい場合には違和感のない円滑な音像移動を再現できる。
【0054】
なお、事後処理(逐次処理でなく一旦記録した後に、読み出して行う処理)となるが、ノイズ低減処理部分の直前と直後の部分(フレーム)の左右信号比をそれぞれ求め、その変化率に対応させて左右の信号比率を変化させても良い。つまり、ノイズ低減処理部分の直前と直後において左右信号比が大きく異なる場合は、音源が左右に移動したと考えられるため、ノイズ低減処理部分の直前と直後の左右の信号比の変化と対応するように音像を移動させる処理を行うものである。
【0055】
図6は、このような処理の説明図である。
図6(a)に示すように、フレーム4〜10がノイズ低減処理フレームである場合、フレーム3が直前部分、フレーム11が直後部分のフレームである。
図6(b)において、SFL3は直前(フレーム3)の左スペクトル、SFR3は直前(フレーム3)の右スペクトル、SFL11は直後(フレーム11)の左スペクトル、SFR11は直後(フレーム11)の右スペクトルである。
【0056】
ここで、たとえば、周波数帯域f3について見ると、
左側:SFL11のf3(振幅1.5)は、SFL3のf3(振幅3)より減少している。
右側:SFR11のf3(振幅3)は、SFR3のf3(振幅1)より増加している。
これは、ノイズ低減処理フレーム4〜10の間に音源が左側から右側に移動していることを示す。
【0057】
そこで、ノイズ低減処理フレーム4〜10における左右の信号比(処理前比)については、図6(c)に示すように、直前(フレーム3)の左右の信号比(3/1=3)から、直後(フレーム11)の左右の信号比(1.5/3=0.5)へ、連続して変化するようにして補正の基準値となる信号比を求める。
具体的には、直前と直後の値(3と0.5)と直前と直後の間にあるフレーム(7つ)とに基づいて、各フレームでの左右の信号比の値を求める。具体的にはフレーム4〜10間で2.5/8の値ずつ左右比を減少させるような補正を行う。
f3以外の周波数帯域についても、各々同様の処理を行う。
その結果、処理直前から処理中、処理直後の左右の信号比が連続的に変化し、音像の移動が滑らかになり、違和感を軽減することができる。
【0058】
以上、本実施形態によると、以下の効果を有する。
(1)カメラ1における補正部14Bは、ノイズ低減処理後における周波数スペクトルの各周波数帯域における左右の信号比を、ノイズ低減処理前における周波数スペクトルの各周波数帯域における左右の信号比と略一致するように補正する。これにより、ステレオ信号をノイズ発生タイミングに合わせてノイズ低減処理する際に、そのノイズ低減処理に起因して生ずる目的音の音像変位を抑制することができる。その結果、ノイズ低減処理時(AF駆動時)における音像変位による違和感を防ぐことができる。
【0059】
(変形形態)
以上、説明した実施形態に限定されることなく、以下に示すような種々の変形や変更が可能であり、それらも本発明の範囲内である。
(1)上記実施形態は、本発明を音処理装置としてのカメラに適用したものである。しかし、本発明はこれに限らず、コンピュータを上記各構成要素として機能させるプログラムとして提供されるものであっても良い。
【0060】
(2)上記実施形態は、本発明をカメラにおけるAF駆動音によるノイズを低減するように構成したものである。しかし、本発明はこれに限らず、ズーミングやブレ補正装置の作動ノイズの低減にも適用可能なものであり、さらに、カメラに限らず録音機能を備える光学機器に適用可能である。
【0061】
(3)本実施形態では、カメラ本体10に音情報処理部14が含まれている例について説明したが、これに限定されず、カメラに備わるステレオマイクで録音した後、音処理装置のほうにデータを送信し、音処理装置で低減処理を行ってもよい。すなわち、音を集音する部分と、音の低減処理を施す部分とが分離していてもよい。
この場合、一例として以下のような流れで処理が行われる。
カメラ等に備わるステレオマイクで周囲の音が録音される。
そして、そのステレオマイクで録音した音が音データに変換され、記憶部に記憶される。
録音の際にAF等のカメラ備わる機能の動作が行われた場合は、周囲の音を録音した音データとカメラに備わる機能の動作(例えばAFの動作)を行ったタイミングとを関連づけて記憶させる。
次に、記憶部に記憶された音データと動作タイミングとが出力部を介して、別体の音処理装置、例えばPC等に出力される。
音処理装置は、制御部、記憶部、ノイズ低減処理部(以下、これらをSP制御部、SP記憶部、SPノイズ低減処理部という)を備える。
SP制御部は、カメラから入力部を介して入力されたその音データと動作タイミングと音データをSP記憶部に記憶させる。
SP制御部は、SP記憶部に記憶された音データをSP低減処理部へ出力し、SP低減処理部は音データに対してAF音などの雑音の低減を行う。
なお、音の低減処理は、音データと共に記憶されている機能の動作タイミングに基づいて行う。その後、SP制御部は、低減処理された音データをSP記憶部に記憶させる。このようにして、音データに対して低減処理を施してもよい。
【0062】
なお、実施形態及び変形形態は、適宜組み合わせて用いることもできるが、詳細な説明は省略する。また、本発明は以上説明した実施形態によって限定されることはない。
【符号の説明】
【0063】
1:カメラ、13:ステレオ集音装置、13L:左マイク、13R:右マイク、14:音情報処理部、14A:ノイズ低減処理部、14B:補正部、20:レンズ鏡筒、21:AFエンコーダ、22:AF駆動用モータ、SIL,SIR:ノイズ低減処理前の周波数スペクトル、RI:処理前比、SN:ノイズ周波数スペクトル、SSL,SSR:ノイズ低減処理後の周波数スペクトル、RS:処理後比、SCL,SCR:補正後の周波数スペクトル
図1
図2
図3
図4
図5
図6