特許第6297858号(P6297858)IP Force 特許公報掲載プロジェクト 2022.1.31 β版

知財求人 - 知財ポータルサイト「IP Force」

▶ 株式会社熊谷組の特許一覧

<>
  • 特許6297858-音源推定用画像の作成装置 図000004
  • 特許6297858-音源推定用画像の作成装置 図000005
  • 特許6297858-音源推定用画像の作成装置 図000006
  • 特許6297858-音源推定用画像の作成装置 図000007
  • 特許6297858-音源推定用画像の作成装置 図000008
< >
(19)【発行国】日本国特許庁(JP)
(12)【公報種別】特許公報(B2)
(11)【特許番号】6297858
(24)【登録日】2018年3月2日
(45)【発行日】2018年3月20日
(54)【発明の名称】音源推定用画像の作成装置
(51)【国際特許分類】
   H04R 3/00 20060101AFI20180312BHJP
   G01S 3/808 20060101ALI20180312BHJP
   H04R 1/40 20060101ALI20180312BHJP
   H04N 5/225 20060101ALI20180312BHJP
【FI】
   H04R3/00 320
   G01S3/808
   H04R1/40 320A
   H04N5/225
【請求項の数】3
【全頁数】9
(21)【出願番号】特願2014-33814(P2014-33814)
(22)【出願日】2014年2月25日
(65)【公開番号】特開2015-159458(P2015-159458A)
(43)【公開日】2015年9月3日
【審査請求日】2016年11月18日
(73)【特許権者】
【識別番号】000001317
【氏名又は名称】株式会社熊谷組
(74)【代理人】
【識別番号】100080296
【弁理士】
【氏名又は名称】宮園 純一
(74)【代理人】
【識別番号】100141243
【弁理士】
【氏名又は名称】宮園 靖夫
(72)【発明者】
【氏名】北原 成郎
(72)【発明者】
【氏名】大脇 雅直
(72)【発明者】
【氏名】財満 健史
【審査官】 菊池 充
(56)【参考文献】
【文献】 特開2012−129873(JP,A)
【文献】 特開2012−221926(JP,A)
【文献】 特開2011−238985(JP,A)
【文献】 特開2006−308409(JP,A)
【文献】 特開2011−035472(JP,A)
【文献】 特開昭62−259072(JP,A)
【文献】 特開2000−097759(JP,A)
【文献】 特開2000−356674(JP,A)
【文献】 米国特許第07035418(US,B1)
(58)【調査した分野】(Int.Cl.,DB名)
H04R 3/00 − 3/14
G01S 3/80 − 3/86
H04R 1/36 − 1/40
H04N 5/222− 5/257
(57)【特許請求の範囲】
【請求項1】
複数のマイクロフォンを備えた音源から伝搬される音の音圧信号を採取する音採取手段と、前記各マイクロフォンに入力する音圧信号の到達時間差から周波数毎に音源方向を推定する音源方向推定手段と、音源方向の映像を撮影する撮影手段と、前記音源方向推定手段で推定された音源方向のデータと前記撮影手段で撮影された音源方向の映像信号である画像データとを合成して、前記推定された音源方向を示す図形が描画された画像である音源推定用画像を作成する音源推定用画像作成手段と、前記音源推定用画像を表示画面に表示する表示手段とを備えた音源推定用画像の作成装置において、
前記音源推定用画像作成手段で作成された音源推定用画像から、オクターブバンド毎の音源方向を示す図形が描画された画像であるバンド画像を作成するバンド画像作成手段を設けるとともに、
前記表示手段は、複数枚のバンド画像を同一画面に並べて表示することを特徴とする音源推定用画像の作成装置。
【請求項2】
前記バンド画像作成手段で作成された周波数帯域が隣り合った2つ以上のバンド画像を重ね合わせた画像である重合バンド画像を作成する重合バンド画像作成手段を更に設けたことを特徴とする請求項1に記載の音源推定用画像の作成装置。
【請求項3】
前記音採取手段は、互いに交わる2つの直線上にそれぞれ所定の間隔で配置された第1及び第2のマイクロフォン対と、前記2組のマイクロフォン対の作る平面上にない第5のマイクロフォンとを備え、
前記音源方向推定手段は、前記2組のマイクロフォン対を構成するマイクロフォン間の位相差と、前記第5のマイクロフォンと前記2組のマイクロフォン対を構成する4個のマイクロフォンのそれぞれとで構成される4組のマイクロフォン対を構成するマイクロフォン間の位相差とを用いて音源方向を推定することを特徴とする請求項1または請求項2に記載の音源推定用画像の作成装置。
【発明の詳細な説明】
【技術分野】
【0001】
本発明は、複数のマイクロフォンで採取した音の情報と、撮影手段で撮影した映像の情報とを用いて、音源を推定するための画像を作成する装置に関するものである。
【背景技術】
【0002】
従来、複数のマイクロフォンから互いに交わる直線状に配置された複数のマイクロフォン対を構成し、対となる2つのマイクロフォン間の位相差に相当する到達時間差と、他の対となる2つのマイクロフォン間の到達時間差との比から音源方向を推定するとともに、CCDカメラ等の映像採取手段を設けて前記推定した音源方向の映像を撮影し、音源方向の映像を撮影した画像データと音源方向のデータとを合成して、映像中に推定した音源方向と音圧レベルとを図形で表示した音源推定用画像を作成し、この音源推定用画像をディスプレイ等の表示画面に表示することで、音源を視覚的に把握する技術が開示されている(例えば、特許文献1参照)。
【先行技術文献】
【特許文献】
【0003】
【特許文献1】特開2011−238985号公報
【発明の概要】
【発明が解決しようとする課題】
【0004】
しかしながら、前記従来の方法では、音源方向と音圧レベルとを表示した図形を周波数毎に表示しているため、近い場所に異なる周波数帯域の音源が存在する場合には、これらの音源を判別できない場合があった。
【0005】
本発明は、従来の問題点に鑑みてなされたもので、近い場所に異なる周波数の音源が複数存在していても、音源を確実に推定することのできる音源推定用画像を作成する装置を提供することを目的とする。
【課題を解決するための手段】
【0006】
本発明は、複数のマイクロフォンを備えた音源から伝搬される音の音圧信号を採取する音採取手段と、前記各マイクロフォンに入力する音圧信号の到達時間差から周波数毎に音源方向を推定する音源方向推定手段と、音源方向の映像を撮影する撮影手段と、前記音源方向推定手段で推定された音源方向のデータと前記撮影手段で撮影された音源方向の映像信号である画像データとを合成して、前記推定された音源方向を示す図形が描画された画像である音源推定用画像を作成する音源推定用画像作成手段と、前記音源推定用画像を表示画面に表示する表示手段とを備えた音源推定用画像の作成装置において、前記音源推定用画像作成手段で作成された音源推定用画像から、オクターブバンド毎の音源方向を示す図形が描画された画像であるバンド画像を作成するバンド画像作成手段を設けるとともに、前記表示手段は、複数枚のバンド画像を同一画面に並べて表示することを特徴とする。
これにより、周波数毎の差異が見やすくなるので、近い場所に異なる周波数の音源が複数存在していても、音源を確実に推定することができる。


【0007】
また、本発明は、前記バンド画像作成手段で作成された周波数帯域が隣り合った2つ以上のバンド画像を重ね合わせた画像である重合バンド画像を作成する重合バンド画像作成手段を更に設けたことを特徴とする。
重合バンド画像の周波数領域は、バンド画像の周波数領域よりも広いので、少ない数の画像で音源を推定することができる。また、注目する周波数範囲が複数のバンドに跨っている場合には、バンド画像に代えて、重合バンド画像を用いて音源を推定した方が、音源を効果的に特定することができる。
【0008】
また、本発明は、前記音採取手段が、互いに交わる2つの直線上にそれぞれ所定の間隔で配置された第1及び第2のマイクロフォン対と、前記2組のマイクロフォン対の作る平面上にない第5のマイクロフォンとを備え、前記音源方向推定手段は、前記2組のマイクロフォン対を構成するマイクロフォン間の位相差と、前記第5のマイクロフォンと前記2組のマイクロフォン対を構成する4個のマイクロフォンのそれぞれとで構成される4組のマイクロフォン対を構成するマイクロフォン間の位相差とを用いて音源方向を推定することを特徴とする。
これにより、少ないマイクロフォン数で、効率よくかつ正確に音源方向の水平角θと仰角φとを推定することができるので、精度の高い音源推定用画像を作成することができる。
なお、前記発明の概要は、本発明の必要な全ての特徴を列挙したものではなく、これらの特徴群のサブコンビネーションもまた、発明となり得る。
【図面の簡単な説明】
【0009】
図1】本発明の実施の形態に係る音源推定用画像作成装置の構成を示す機能ブロック図である。
図2】音採取手段を構成するマイクロフォンの配置を示す図である。
図3】音源推定用画像の一例を示す図である。
図4】バンド画像の作成方法とバンド画像の一例を示す図である。
図5】本実施の形態に係るバンド画像の作成方法を示すフローチャートである。
【発明を実施するための形態】
【0010】
以下、本発明の実施の形態について、図面に基づき説明する。
図1は、本実施の形態に係る音源推定用画像作成装置1の構成を示す図で、音源推定用画像作成装置1は、音・映像採取ユニット10と、データ処理部20と、記憶・演算部30と、表示手段40とを備える。
音・映像採取ユニット10は、音採取手段11と、映像採取手段としてのCCDカメラ(以下、カメラという)12と、マイクロフォン固定部13と、カメラ支持台14と、支柱15と、回転台16と、基台17とを備える。
音採取手段11は複数のマイクロフォンM1〜M5を備え、図示しない音源から伝播される音の音圧信号を測定する。
マイクロフォンM1〜M5の配置は、図2に示すように、4個のマイクロフォンM1〜M4を、互いに直交する2直線(ここでは、x軸とy軸)上にそれぞれ所定の間隔Lで配置された2組のマイクロフォン対(M1,M3)及びマイクロフォン対(M2,M4)を構成するように配置するとともに、第5のマイクロフォンM5を前記マイクロフォンM1〜M4の作る平面上にない位置(ここでは、Z軸上)に配置する。
本例では、マイクロフォンM5を、マイクロフォンM1〜M4の作る正方形を底面とする四角錐の頂点の位置に配置した。これにより、更に4組のマイクロフォン対(M5, M1)〜(M5, M4)が構成される。
【0011】
カメラ12の撮影方向は、図1の白抜きの矢印に示すように、2組のマイクロフォン対(M1,M3)及びマイクロフォン対(M2,M4)が配置される直交する2直線の交点を通り前記2直線とほぼ45°をなす方向に設定してある。なお、カメラ12の撮影方向としては、マイクロフォンM1からマイクロフォンM3へ向かう方向(図2のX軸方向)など、他の方向であってもよい。
本例では、カメラ12の撮影方向を、音源が存在すると推定される方向になるように、音・映像採取ユニット10を設置する。
マイクロフォン固定部13にはマイクロフォンM1〜M5が設置され、カメラ支持台14にはカメラ12が設置され、マイクロフォン固定部13とカメラ支持台14とは、3本の支柱15によって連結されている。つまり、音採取手段11とカメラ12とは一体化されている。なお、マイクロフォンM1〜M5は、カメラ12の上部に配置される。
また、基台17は3脚から成る支持部材で、この基台17上に回転台16が設置されている。カメラ支持台14は回転台16の回転部材16rに搭載されている。
これにより、回転部材16rを回転させることにより、音採取手段11とカメラ12とを一体に回転させることができる。
【0012】
データ処理部20は、音データ入出力手段21と映像入出力手段22とを備える。
音データ入出力手段21は、増幅器21aと、A/D変換器21bとを備える。
増幅器21aはローパスフィルタを備え、マイクロフォンM1〜M5で採取した音の音圧信号から高周波ノイズ成分を除去するとともに、前記各音圧信号を増幅してA/D変換器21bに出力する。
A/D変換器21bは、音圧信号をA/D変換して得られた音圧波形データを記憶・演算部30のデータ記憶手段31に送る。
映像入出力手段22は、カメラ12で撮影した映像信号を入力し、この映像信号をA/D変換して得られた画像データをデータ記憶手段31に送る。
【0013】
記憶・演算部30は、データ記憶手段31と、音源方向推定手段32と、音源推定用画像作成手段33と、バンド画像作成手段34とを備える。
記憶・演算部30を構成する各手段は、例えば、パーソナルコンピュータのソフトウェアとメモリーとにより構成される。
データ記憶手段31は、音圧波形データと画像データとを記憶する。
音源方向推定手段32は、データ記憶手段31に記憶された音圧波形データを用いて、音源方向である水平角θと仰角φとを周波数f毎に算出するとともに、マイクロフォンM5に入力した音圧レベルを計測してこれを音源から伝播された音の音圧レベルとする。なお、水平角θと仰角φの算出方法については後述する。
音源推定用画像作成手段33は、音源方向推定手段32で算出された周波数毎の音源データである音源方向のデータ(水平角θと仰角φ)及び音圧レベルと、データ記憶手段31に記憶された撮影方向の画像データとを合成し、画像中に音源の方向を示す図形(ここでは、円とした)が周波数f毎に描画された音源推定用画像Gを作成してバンド画像作成手段34に送る。
図3は、音源推定用画像Gの一例を示す図で、音・映像採取ユニット10を図示しない工場の入り口に設置して、工場内の工作機械Hのどの個所から騒音が発生しているかを推定した。同図の横軸は水平角θで、縦軸は仰角φである。この例では、水平角θの範囲及び仰角φの範囲をそれぞれ−80°≦θ≦+80°、−50°≦φ≦+50°とした。
工作機械Hの音源推定用画像Gをみると、同図の四角い枠で囲った領域Dに音源の方向を示す図形が多いことがわかる。
【0014】
バンド画像作成手段34は、図4(a)に示すように、音源推定用画像Gから、オクターブバンド毎の画像である複数のバンド画像Gpを作成する。
具体的には、オクターブバンドとして、1/3オクターブバンドを用い、中心周波数fp(p=1〜17)を、例えば、125Hz,160Hz,200Hz,…………,3.15kHz,4kHz,5kHzとすると、バンド画像Gpは17枚となる。
1/3オクターブバンドの場合、中心周波数がfpであるバンド画像Gpは、周波数帯域が[fp/1.125,1.125・fp]の音の音源が表示された画像となる。
なお、オクターブバンドとして、1オクターブバンドを用いてもよい。
図4(b)は、図3に示した音源推定用画像Gから作成した、中心周波数がfp=500Hzのバンド画像G7で、図4(c)は、中心周波数がfp=2kHzのバンド画像G13である。
図3と、図4(b)及び図4(c)とを比較してわかるように、図3の音源推定用画像Gでは、同図の四角い枠で囲った領域Dでは、音源方向を示す図形が重なっていて音源の特定が難しいが、図4(b)及び図4(c)のバンド画像G7,G13では、各図の矢印で示すように、領域Dの異なる箇所A,Bにそれぞれ周波数の異なる音源が存在していることが分かる。したがって、本例のように、音源推定用画像Gからバンド画像Gpを作成して表示すれば、周波数毎の差異が見やすくなるので、近い場所に異なる周波数の音源が複数存在していても、音源を確実に推定することができる。
表示手段40は、液晶ディスプレイ等の表示画面40Mを備え、バンド画像作成手段34で作成されたバンド画像Gpを表示画面40Mに表示する。
【0015】
次に、音源推定用画像作成装置1によるバンド画像Gpの作成方法について、図5のフローチャートを参照して説明する。
まず、音・映像採取ユニット10とデータ処理部20と記憶・演算部30と表示手段40とを接続した後、音・映像採取ユニット10を計測点にセットする(ステップS10)。
そして、カメラ12の撮影方向を測定予定場所に向け、表示画面40Mを見てカメラ12が測定予定場所を撮影していることを確認した後、マイクロフォンM1〜M5にて音を採取すると同時に、カメラ12にて測定予定場所の映像を採取する(ステップS11)。
計測点から測定予定場所を見たときに視野が映像視野よりも大きい場合には、回転台16を、例えば、3°/sec.程度のゆっくりした速度で、測定予定場所の中央部を中心に往復回転させながら、音と映像とを採取するようにすればよい。回転範囲としては±60°程度が適当である。なお、音・映像採取ユニット10を固定して測定し、測定終了後に回転台16を適宜回転させて撮影方向を音源があると推定される方向に変更した後、再度、測定してもよい。
【0016】
次に、マイクロフォンM1〜M5の出力信号である音圧信号を増幅してA/D変換して得られた音圧波形データをデータ記憶手段31に保存するとともに、カメラ12の映像信号をA/D変換し、このA/D変換した画像データをデータ記憶手段31に保存する(ステップS12)。
次に、データ記憶手段31に保存された音圧波形データを抽出し、この音圧波形データを用いて音源データである音源方向と音圧レベルとを算出する(ステップS13)。
音源方向は、音圧波形データをFFTにて周波数解析し、周波数毎にマイクロフォンM1〜M5間のそれぞれの位相差を求め、この求められた位相差から周波数毎に音源の方向を推定する。なお、本例では、位相差に代えて、位相差に比例する物理量である到達時間差Dijを用いて音源方向である水平角θ及び仰角φを求めている。
具体的には、各マイクロフォン対(Mi, Mj)の位相差(到達時間差Dij)から、当該計測点から見た音源方向を推定する。
水平角θと仰角φとは以下の式(1)及び式(2)で表わせる。
【数1】
ここで、到達時間差Dijは、マイクロフォンMiに到達する音圧信号と、このマイクロフォンMiに対して対となるマイクロフォンMjに到達する音圧信号との時間差であり、この対となる2つのマイクロフォンMi及びマイクロフォンMjに入力される信号のクロススペクトルPij(f)を求め、更に、対象とする前記周波数fの位相角情報Ψ(rA/D)を用いて、以下の式(3)により算出される。
【数2】
なお、音源方向と音圧レベルとは周波数毎に計測する。
また、マイクロフォンM5に入力される信号の大きさを音圧信号の大きさとする。
【0017】
次に、横軸が水平角θで縦軸を仰角φであるマップ上に、図3に示したような、音源方向(θ,φ)と音圧信号の周波数及び大きさとを表示した円が表示された音源推定用画像Gを作成し、データ記憶手段31に記憶する(ステップS14)。円の径が音圧レベルを表し、円の模様もしくは色が音圧信号の周波数を表す。
そして、図4に示したように、音源推定用画像Gから、オクターブバンド毎の画像である複数のバンド画像Gpを作成する(ステップS15)。
最後に、表示手段40の表示画面40Mにバンド画像Gpを表示する(ステップS16)。表示画面40Mに表示するバンド画像Gpは一枚ずつであってもよいし、複数枚のバンド画像Gpを同一画面に並べて表示してもよい。
【0018】
以上、本発明を実施の形態を用いて説明したが、本発明の技術的範囲は前記実施の形態に記載の範囲には限定されない。前記実施の形態に、多様な変更または改良を加えることが可能であることが当業者にも明らかである。そのような変更または改良を加えた形態も本発明の技術的範囲に含まれ得ることが、特許請求の範囲から明らかである。
【0019】
例えば、前記実施の形態では、バンド画像Gpを用いて音源を確実に推定したが、重合バンド画像作成手段を設けて、バンド画像作成手段34で作成されたバンド画像Gpのうちの周波数帯域が隣り合った2つ以上のバンド画像を重ね合わせた画像である重合バンド画像Gp,q(p,q=1〜17、但し、p<q)を作成して表示すれば、少ない画像数で音源を推定することができる。
重合バンド画像Gp,qとしては、例えば、中心周波数が160Hz〜2kHzのバンド画像G2, G3, ……, G13を重ね合わせて作成した低域重合バンド画像G2,13や、中心周波数が1kHz〜5kHzのバンド画像G10, G11, ……, G17を重ね合わせて作成した高域重合バンド画像G10,17などを用いることができる。
重合バンド画像Gp,qは、周波数領域がバンド画像Gpよりも広いので、少ない画像数で音源を推定することができる。また、注目する周波数範囲が複数のオクターブバンドに跨っている場合に、重合バンド画像Gp,qを用いて音源を推定した方が、音源を効果的に特定することができる。
【符号の説明】
【0020】
1 音源推定用画像作成装置、
10 音・映像採取ユニット、11 音採取手段、12 CCDカメラ(カメラ)、
13 マイクロフォン固定部、14 カメラ支持台、15 支柱、16 回転台、
16r 回転部材、17 基台、
20 データ処理部、21 音データ入出力手段、21a 増幅器、
21b A/D変換器、22 映像入出力手段、
30 記憶・演算部、31 データ記憶手段、32 音源方向推定手段、
33 音源推定用画像作成手段、34 バンド画像作成手段、
40 表示手段、40M 表示画面、M1〜M5 マイクロフォン。
図1
図2
図3
図4
図5