(19)【発行国】日本国特許庁(JP)
(12)【公報種別】公開特許公報(A)
(11)【公開番号】P2024090148
(43)【公開日】2024-07-04
(54)【発明の名称】音波センサ装置、識別装置、音データ取得方法、及びプログラム
(51)【国際特許分類】
G01H 9/00 20060101AFI20240627BHJP
【FI】
G01H9/00 Z
【審査請求】未請求
【請求項の数】6
【出願形態】OL
(21)【出願番号】P 2022205844
(22)【出願日】2022-12-22
【新規性喪失の例外の表示】特許法第30条第2項適用申請有り 2022年2月10日に国立大学法人大阪大学 令和3年度 情報システム工学コース卒業研究発表会にて公開 2022年2月28日に第73回情報処理学会ユビキタスコンピューティングシステム研究会オンライン会議にて公開
(71)【出願人】
【識別番号】000004226
【氏名又は名称】日本電信電話株式会社
(71)【出願人】
【識別番号】504176911
【氏名又は名称】国立大学法人大阪大学
(74)【代理人】
【識別番号】100107766
【弁理士】
【氏名又は名称】伊東 忠重
(74)【代理人】
【識別番号】100070150
【弁理士】
【氏名又は名称】伊東 忠彦
(74)【代理人】
【識別番号】100124844
【弁理士】
【氏名又は名称】石原 隆治
(72)【発明者】
【氏名】岸野 泰恵
(72)【発明者】
【氏名】尾原 和也
(72)【発明者】
【氏名】村上 友規
(72)【発明者】
【氏名】アベセカラ ヒランタ
(72)【発明者】
【氏名】前川 卓也
【テーマコード(参考)】
2G064
【Fターム(参考)】
2G064AB01
2G064AB02
2G064AB13
2G064BA02
2G064BD02
2G064CC02
2G064DD02
(57)【要約】
【課題】所望の周波数に対応する音データを取得する際の消費電力を削減する。
【解決手段】音波センサ装置において、ある特定の周波数の音に反応を示す音波センサと、前記音波センサから出力される信号を増幅し、増幅した当該信号を、前記音波センサによる反応の有無を示すデータに変換する変換部とを備える。
【選択図】
図1
【特許請求の範囲】
【請求項1】
ある特定の周波数の音に反応を示す音波センサと、
前記音波センサから出力される信号を増幅し、増幅した当該信号を、前記音波センサによる反応の有無を示すデータに変換する変換部と
を備える音波センサ装置。
【請求項2】
複数の周波数の音に対応する複数の音波センサと、
前記複数の音波センサに対応する複数の変換部と
を備える請求項1に記載の音波センサ装置。
【請求項3】
前記変換部は、
前記音波センサから出力される信号を増幅する増幅回路と、
前記増幅回路により増幅された前記信号を入力するコンパレータと、
前記コンパレータから出力される矩形波を、最小値が閾値を上回る波形に変換するRC回路と
を備える請求項1に記載の音波センサ装置。
【請求項4】
請求項1ないし3のうちいずれか1項に記載の前記音波センサ装置から出力されるデータを入力する入力部と、
前記データを特徴量として用いることにより環境音の識別を行う識別部と
を備える識別装置。
【請求項5】
ある特定の周波数の音に反応を示す音波センサと、変換部とを備える音波センサ装置が実行する音データ取得方法であって、
前記音波センサが、前記特定の周波数の音に反応を示すステップと、
前記変換部が、前記音波センサから出力される信号を増幅し、増幅した当該信号を、前記音波センサによる反応の有無を示すデータに変換するステップと
を備える音データ取得方法。
【請求項6】
コンピュータを、請求項4に記載の識別装置における各部として機能させるためのプログラム。
【発明の詳細な説明】
【技術分野】
【0001】
本発明は、環境音認識技術に関連するものである。
【背景技術】
【0002】
スマートデバイスの普及やセンサの小型化に伴い、これらを用いた環境音認識の研究が盛んに行われている。環境音認識とは音データに対応する環境音クラスを分類結果として出力するタスクであり、主に(1)環境音収集、(2)音響特徴量抽出、(3)環境音分類の3つのプロセスで構成される。
【先行技術文献】
【特許文献】
【0003】
【発明の概要】
【発明が解決しようとする課題】
【0004】
従来の環境音認識では、上記(2)の音響特徴量抽出のプロセスにおいて、高いサンプリング周波数で得られたサウンドクリップに対して周波数解析処理を行うため、その処理を実行する装置の消費電力が大きくなるという課題があった。このような課題は、環境音認識に限定されず、所望の周波数に対応する音のデータを利用する様々な応用分野で生じ得る課題である。
【0005】
本発明は上記の点に鑑みてなされたものであり、所望の周波数に対応する音データを取得する際の消費電力を削減するための技術を提供することを目的とする。
【課題を解決するための手段】
【0006】
開示の技術によれば、ある特定の周波数の音に反応を示す音波センサと、
前記音波センサから出力される信号を増幅し、増幅した当該信号を、前記音波センサによる反応の有無を示すデータに変換する変換部と
を備える音波センサ装置が提供される。
【発明の効果】
【0007】
開示の技術によれば、所望の周波数に対応する音データを取得する際の消費電力を削減することが可能となる。
【図面の簡単な説明】
【0008】
【
図1】環境音認識システムの全体構成例を示す図である。
【
図2】センサアレイ100と識別装置200の構成例を示す図である。
【
図3】環境音認識システムの他の構成例を示す図である。
【
図4】環境音認識システムの他の構成例を示す図である。
【
図5】音波センサ部の処理を説明するためのフローチャートである。
【
図6】増幅回路からの出力波形の例を示す図である。
【
図7】RC回路からの出力波形の例を示す図である。
【
図9】コーン型共振子の材質及び厚さと共振周波数との関係を示す図である。
【
図10】識別装置200のハードウェア構成例を示す図である。
【発明を実施するための形態】
【0009】
以下、図面を参照して本発明の実施の形態(本実施の形態)を説明する。以下で説明する実施の形態は一例に過ぎず、本発明が適用される実施の形態は、以下の実施の形態に限られるわけではない。
【0010】
なお、以下では、本発明に係る技術を環境音認識に利用する形態を説明するが、本発明に係る技術の適用分野は、環境音認識に限定されるわけではない。
【0011】
(課題、実施の形態の概要)
前述したとおり、環境音認識は、主に(1)環境音収集、(2)音響特徴量抽出、(3)環境音分類の3つのプロセスで構成される。
【0012】
環境音認識を行う装置として、ウェアラブルデバイスや電池駆動の小型センサノードを用いることが想定されている。これらの装置は一般に電池で駆動することから、電池の駆動時間を延伸するために、環境音認識のための消費電力をできるだけ抑えることが望ましい。
【0013】
しかし、従来の環境音認識技術では、(2)の音響特徴量抽出において、高いサンプリング周波数で得られたサウンドクリップに対して周波数解析処理を行うため、消費電力が大きくなってしまう。
【0014】
一般的に、音声信号処理では、FFT等により音を周波数成分に分解し、各周波数の音の強度を得ることで信号処理を進めていく。しかしFFTの計算には浮動小数点の乗算が必要となり、大きな消費電力を要してしまう。また、非力な装置(例えばマイクロコンピュータ)では、その計算ができない場合もある。なお、ある特定の周波数の音の強度を得ることは、所望の周波数の音データを取得することの例である。
【0015】
そこで、本実施の形態では、消費電力の大きいFFT処理等の周波数解析処理を必要とせずに、所望の周波数の音データを取得して、環境音認識を実現している。
【0016】
すなわち、本実施の形態では、ある特定の周波数(共振周波数)に反応を示す低消費電力の音波センサを用いる。そして、異なる共振周波数を持つ音波センサを組み合わせたセンサアレイを用いることで、環境音の様々な周波数成分に関する情報を得ることができる。センサアレイに含まれる各音波センサはそれぞれの共振周波数を含む環境音に反応する。これにより、周波数解析処理を行うことなく、センサアレイと単純な電子回路の構成で周波数別の音の強度を測定することができ、少ない消費電力で、環境音分類(環境音認識)を行うことが可能となる。
【0017】
(システム全体構成例)
図1に、本実施の形態における環境音認識システムの全体構成例を示す。
図1に示すように、本実施の形態における環境音認識システムは、センサアレイ100と識別装置200を有する。
【0018】
センサアレイ100は、音波センサを含む音波センサ部10~30を有する。
図1の例において、音波センサ部10における音波センサの共振周波数は40kHzであり、音波センサ部20における音波センサの共振周波数は30kHzであり、音波センサ部10における音波センサの共振周波数は20kHzである。
【0019】
なお、
図1に示すセンサアレイ100は3つの音波センサ(音波センサ部)を備えるが、これは一例である。センサアレイ100が備える音波センサ(音波センサ部)の数は2でもよいし、4以上でもよい。
【0020】
また、センサアレイ100における複数の音波センサ(あるいは複数の音波センサ部)の配置については特定の配置に限定されない。例えば、
図1に示すような一次元の配置でもよいし、2次元の配置(例:平面に格子状に並べる)でもよいし、3次元の配置(例:球面の表面あるいは立方体の表面に配置する)でもよいし、これら以外の配置でもよい。また、目的によっては、1つのみの音波センサを使用することとしてもよい。
【0021】
図1の例において、環境音に40kHzの音と20kHzの音が含まれている場合、共振周波数が40kHzと20kHzの音波センサのみが反応するため、その反応パターンから環境音に含まれる周波数成分の情報を獲得できる。
【0022】
図1の例では、音波センサの反応があった場合に、その音波センサを備える音波センサ部から1が出力され、音波センサの反応がない場合には、その音波センサを備える音波センサ部から0が出力される。なお、このようにバイナリデータを出力することは一例であり、それぞれのセンサの反応の強度の配列を出力することも可能である。
【0023】
識別装置200は、上記のバイナリデータを入力し、それを環境音認識のための音響特徴量として使用する。識別装置200は、当該音響特徴量に基づいて、環境音のクラスを識別(分類)する。学習時の動作も同様であり、識別装置200は、センサアレイ100から取得した音響特徴量を用いて学習を行う。
【0024】
(装置構成例、動作例)
本実施の形態におけるセンサアレイ100における各音波センサ部は、低消費電力の音波センサと単純な電子回路から構成される。そのため、消費電力の小さい音波センサ部を実現できる。
【0025】
図2に、センサアレイ100と識別装置200の構成例を示す。
図2に示すように、センサアレイ100は、周波数1用の音波センサ部10と、周波数2用の音波センサ部20と、周波数3用の音波センサ部30を備える。なお、音波センサ部を「音波センサ回路」と呼んでもよい。また、音波センサ部を「音波センサ装置」と呼んでもよい。1つ以上の音波センサ部(又は1つ以上の音波センサ)を備えるセンサアレイ100を「音波センサ装置」と呼んでもよい。
【0026】
音波センサ部10は、音波センサ11、増幅回路12、コンパレータ13、RC回路14を備える。音波センサ部20、30はそれぞれ音波センサ部10と同じ構成を有する。すなわち、音波センサ部20は、音波センサ21、増幅回路22、コンパレータ23、RC回路24を備え、音波センサ部30は、音波センサ31、増幅回路32、コンパレータ33、RC回路34を備える。識別装置200は、入力部210、識別部220、及び出力部230を備える。
【0027】
音波センサ部10(20、30も同様)と識別装置200における各部の詳細については後述する。
【0028】
音波センサ部10が備える音波センサ11は、圧電素子を含み、共振周波数付近の音を受けたときに、物質(圧電素子)に圧力を加えると電圧が発生する圧電効果によって微小な電圧を発生させる。この反応を特徴量として用いるために必要となる回路として、電圧を増幅する増幅回路12、反応の有無を判定するコンパレータ13が含まれている。増幅回路12とコンパレータ13は、例えば、2つのオペアンプで構成可能な回路であるため消費電力が小さい。音波センサ部20、30についても同様である。
【0029】
上述の構成を採用することで、FFT処理を行わずに周波数成分に関する情報を得ることができるため、消費電力を抑えた環境音認識を実現することが可能となる。
【0030】
ここで、「増幅回路+コンパレータ+RC回路」は、音波センサで得られた情報をバイナリデータへ変換するので、「増幅回路+コンパレータ+RC回路」を「変換部」と呼んでもよい。
【0031】
図2に示す構成例は、センサアレイ100内の各音波センサ部に音波センサと変換部が含まれる構成である。このような構成に代えて、
図3に示すように、音波センサと変換部が分離した構成を採用してもよい。
【0032】
また、
図4に示すように、複数の音波センサのそれぞれの情報(具体的には電圧)から、各音波センサに対応するバイナリデータを出力する1つの変換部を備える構成を採用してもよい。当該1つの変換部内には、音波センサごとの「増幅回路+コンパレータ+RC回路」が含まれていてもよいし、複数の音波センサの情報に対する処理をまとめて行う1つの「増幅回路+コンパレータ+RC回路」が含まれていてもよい。
【0033】
<音波センサ部の動作例>
続いて、音波センサ部10の動作について、
図5のフローチャートの手順に沿って説明する。以下の説明では「音波センサ部10」を例にとって説明するが、以下の説明は、
図2に示した音波センサ部10~30のいずれにもあてはまる説明である。
【0034】
S1において、音波センサ11は、周波数1の成分を持つ音を受けると、圧電効果により、電圧(電圧の変化)を発生させる。つまり、音波センサ11は周波数1の成分を持つ音に反応する。音波センサ11の直接の出力は微小な電圧の変化でしかない。
【0035】
そのため、S2において、増幅回路12は、音波センサ11からの出力である電圧を増幅する。
【0036】
ここで、増幅回路12からの出力に対してマイクロコンピュータ等でA/D変換を行うことが考えられるが、その場合、複数の音波センサの出力を同時に取得することが難しくなり、その処理のための消費電力の増加が見込まれる。
【0037】
そこで、本実施の形態では、S3において、まずコンパレータ13が、音波センサ11の共振周波数の音(つまり電圧)が閾値を超えたか否かを判定する。
【0038】
音波の強度を直接取得しようとすると、高速に1/0を繰り返し安定的に音の強度を取得することができない。そのため、S4において、RC回路14によってディレイをかける。
【0039】
これにより、RC回路14からの出力を受信する識別装置200の入力部210は、例えば、閾値を超える電圧を1、閾値以下の電圧を0として、安定的に音の強度に対応する入力値を取得できるようになる。
【0040】
増幅回路12からの出力の波形のイメージを
図6に示す。
図6(及び
図7)における横軸は時間であり、縦軸は電圧である。
図6に示す波形を入力した「コンパレータ13とRC回路14」の出力の波形イメージを
図7に示す。
【0041】
図6に示すとおり、増幅回路12からの出力の波形は正弦波であるため、音波センサ11が反応していても閾値を下回る瞬間が存在するが、
図7に示すとおり、「コンパレータ13とRC回路14」を用いることで、音波センサ11が反応している場合には電圧が閾値を下回らないようにすることができる。
【0042】
上述した処理は音波センサ部10の変換部における回路の信号処理で行われるため、識別装置200において、小型のマイクロコンピュータを使用した場合でも、高速に(例えば1ミリ秒間隔で)音の強度を取得することが可能となる。
【0043】
以下、音波センサ部10を構成する各部について詳細に説明する。以下においても、「音波センサ部10」を例にとって説明するが、以下の説明は、
図2に示した音波センサ部10~30のいずれにもあてはまる説明である。また、音波センサ部10~30に共通の事項に関して、符号を付けないで説明する場合もある。
【0044】
<音波センサ>
本実施の形態では、音波センサとして、市販されている、圧電素子(例えば圧電セラミックス)を有する音波センサ(超音波センサ)を改造したものを使用している。
【0045】
本実施の形態における音波センサにおける振動子の構造の例を
図8に示す。
図8の右側が振動子を横から見た図であり、左側が、振動子を下から見た図である。
図8にはサイズが示されているが、このサイズは一例である。
【0046】
図8に示すように、振動子は、コーン型共振子、金属板、及び圧電素子を有する。当該振動子が電極端子に接続されることで音波センサが構成される。
【0047】
圧電素子を用いた市販の音波センサは約0.1mmの厚さのアルミのコーン型共振子を利用している。本実施の形態では、コーン型共振子を、市販のものから改造することで、所望の共振周波数を持つ音波センサを実現している。
【0048】
具体的には、コーン型共振子の素材としてアルミと真鍮の2種類の素材を用い、コーン型共振子を構成する金属板の厚さとして、0.1mm、0.5mm、及び、1mmの複数の厚さの金属板を用いる。
【0049】
上記の素材及び厚さの組み合わせにより、
図9に示す共振周波数を持つ音波センサを実現することができる。例えば、素材が真鍮で厚さが0.5mmのコーン型共振子を使用すると、共振周波数のピークが26kHz-29kHzとなる音波センサを実現することができる。なお、
図9のような素材及び厚さを使用することは一例である。
【0050】
また、音波センサの共振周波数は、圧電素子のサイズ(大きさ)、あるいは圧電素子の厚さによっても変化する。圧電素子のサイズ、圧電素子の厚さ、コーン型共振子の素材、及び、コーン型共振子を構成する金属板の厚さを組み合わせることで、様々な共振周波数を持つ音波センサを実現することが可能である。
【0051】
<増幅回路12>
増幅回路12では、音波センサ11からの入力信号を識別装置200(例:マイクロコンピュータ)で取り扱えるレベルまで増幅する。
【0052】
増幅回路12の構成は特定の構成に限定されないが、例えば、増幅回路12は、オペアンプを用いた非反転増幅回路、ノイズを取り除くバンドパスフィルタ、基準の電圧を識別装置200への入力に適したレベルに引き上げるバイパス回路を含む。増幅回路12による信号の増幅率は、例えば、32db(約40倍)である。
【0053】
<コンパレータ13>
コンパレータ13は、2つの電圧を比較する回路であり、増幅回路12の出力電圧が閾値電圧を超えると1(例えば電源電圧)を出力し、増幅回路12の出力電圧が閾値電圧を超えなければ0(例えばグラウンドレベル)を出力する。
【0054】
コンパレータ13により、音波センサ11に対応する共振周波数の音が一定のレベルを超えたか否かを示す情報を出力できるようになる。しかし、入力音の周波数は数十kHzを想定しているため、コンパレータ13は、1/0の出力が数十μ秒で繰り返される矩形波を出力することになる。このままでは識別装200でのデジタル入力のタイミングによって1/0が切り替わり、安定して音の強度を取得することができない。そこで、下記のRC回路14を使用する。
【0055】
<RC回路14>
コンパレータ13の後段にRC回路14が接続される。RC回路14は抵抗とコンデンサからなる単純な回路であるが、これを用いて矩形波の立ち下りにディレイ(遅延)をかけることで、識別装置200の入力部210における1/0の判定の閾値を上回る電圧を出力し続けられるようにする。つまり、音波センサ11が対象の共振周波数の音を検知している間(音波センサ11が反応している間)は、識別装置200の入力部210に入力される電圧が閾値を上回るようにすることができる。
【0056】
RC回路14の設計方法(抵抗RとコンデンサCの大きさをどのようにするか)については、特定の方法に限定されないが、例えば、想定される入力の音波の周波数から波形のピークの間の時間を計算し、RC回路14の時定数がこれよりも長くなるように設計する。これにより対象となる周波数の強度が一定以上の間、出力が1(出力が閾値を超える状態)を維持できるようになる。
【0057】
共振周波数40kHzの音波センサを使用する場合の抵抗RとコンデンサCの大きさの決定の例について説明する。
【0058】
ここでは、コンパレータ13の出力電圧Vccを5Vとし、識別装置200の入力部210における閾値(1と判断するための閾値)を2.5Vとする。時定数はτ=RCである。RC回路13の出力である矩形波の立ち下がりの時の電圧Voutは、Vout=Vcc×e-t/τで表される。tは立ち下がりからの経過時間を表す。
【0059】
Vcc=5V、Vout=2.5Vとすると、t=0.693RCとなる。周波数が40kHzであるので,ピークから次のピークが来るまでの時間は25μsである。よって、25μsの間に出力電圧が2.5Vを下回らないようにする条件は「t>25×10-6」で表せる。
【0060】
よって、25μsの間に出力電圧が2.5Vを下回らないようにするRCの条件は「RC>36.067×10-6」となる。立ち上がりが遅いと最初の反応も遅れるので、条件を満たし、RCの値ができるだけ小さくなるような抵抗RとコンデンサCの組み合わせを選ぶことが好ましい。
【0061】
<識別装置200>
識別装置200は、音波センサ部から出力される信号を用いて、環境音のクラスを識別(分類)できる装置であればどのような装置でもよい。例えば、識別装置200は、汎用的なコンピュータ(いわゆるPC)とプログラムで実現することができる。
【0062】
本実施の形態では、識別装置200として、Arduino(登録商標)等のマイクロコンピュータを使用することを想定している。
【0063】
図2に示したように、識別装置200は、入力部210、識別部220、出力部230を備える。入力部210をデジタル入力ポートと呼んでもよい。入力部210は、各音波センサ部から出力される信号(電圧)を受信し、音波センサ部ごとに、その信号の電圧が閾値を超えると1を出力し、閾値以下であれば0を出力する。すなわち、識別装置200は単純にデジタル入力を取得するだけで、それぞれの周波数の音の強度を取得できる。
【0064】
なお、各音波センサ部から出力される、レベルが閾値を超える信号をデジタルデータの「1」と見なし、レベルが閾値以下の信号をデジタルデータの「0」と見なしてもよい。
【0065】
識別部220は、入力部210から出力されたデータ(具体的には各時刻のバイナリ配列)を特徴量として入力することで、環境音のクラスを認識(識別)する。出力部230は識別結果を出力する。
【0066】
識別部220は、例えば機械学習モデルで実現できる。機械学習モデルとしてはどのようなものを使用してもよく、例えば、SVM、ニューラルネットワーク等を使用することができる。
【0067】
なお、対応する周波数は音波センサの共振周波数になるため、ターゲットとする環境音に特徴的な周波数が含まれていない場合には、認識に失敗する可能性がある。そのため、例えば、事前に環境音の特徴を調査しそれに合わせた周波数の音波センサを備えたセンサアレイを用意することで目的の環境音を識別できるようにする。あるいは、5kHz毎に音波センサを用意するなど広い範囲の周波数を扱えるような音波センサを備えるセンサアレイを用意することで幅広い環境音に対応できるようにする。
【0068】
(識別装置200のハードウェア構成例)
上述したとおり、識別装置200は、コンピュータにプログラムを実行させることにより実現できる。このコンピュータは、物理的なコンピュータであってもよいし、クラウド上の仮想マシンであってもよい。
【0069】
すなわち、識別装置200は、コンピュータに内蔵されるCPUやメモリ等のハードウェア資源を用いて、識別装置200で実施される処理に対応するプログラムを実行することによって実現することが可能である。上記プログラムは、コンピュータが読み取り可能な記録媒体(可搬メモリ等)に記録して、保存したり、配布したりすることが可能である。また、上記プログラムをインターネットや電子メール等、ネットワークを通して提供することも可能である。
【0070】
図10は、上記コンピュータのハードウェア構成例を示す図である。
図10のコンピュータは、それぞれバスBSで相互に接続されているドライブ装置1000、補助記憶装置1002、メモリ装置1003、CPU1004、インタフェース装置1005、表示装置1006、入力装置1007、出力装置1008等を有する。
【0071】
当該コンピュータでの処理を実現するプログラムは、例えば、CD-ROM又はメモリカード等の記録媒体1001によって提供される。プログラムを記憶した記録媒体1001がドライブ装置1000にセットされると、プログラムが記録媒体1001からドライブ装置1000を介して補助記憶装置1002にインストールされる。但し、プログラムのインストールは必ずしも記録媒体1001より行う必要はなく、ネットワークを介して他のコンピュータよりダウンロードするようにしてもよい。補助記憶装置1002は、インストールされたプログラムを格納すると共に、必要なファイルやデータ等を格納する。
【0072】
メモリ装置1003は、プログラムの起動指示があった場合に、補助記憶装置1002からプログラムを読み出して格納する。CPU1004は、メモリ装置1003に格納されたプログラムに従って、識別装置200に係る機能を実現する。インタフェース装置1005は、センサアレイ100あるいはネットワーク等に接続するためのインタフェースとして用いられる。表示装置1006はプログラムによるGUI(Graphical User Interface)等を表示する。入力装置1007はキーボード及びマウス、ボタン、又はタッチパネル等で構成され、様々な操作指示を入力させるために用いられる。出力装置1008は演算結果を出力する。
【0073】
(実施の形態の効果について)
本実施の形態に係るセンサアレイを使用した手法(提案手法と呼ぶ)の効果を検証する実験を行った。この実験では、以下の3条件(1)~(3)で家電製品を動作させたときの状態認識の精度と消費電力を調査した。家電製品としては、電動シェイバー、シュレッダー、ミキサー、ドリルドライバー、超音波歯ブラシの5つを用意し、動作音をハイレゾ対応のマイクで録音し、録音した音データを解析することで認識精度の評価を行った。すなわち、ここでの実験では、録音された音データに対してPC上でFFTを行い、疑似的なバイナリデータを再現して評価を行った。
【0074】
(1)提案手法(高周波数帯):39kHz-41kHz、31kHz-34kHz、29kHz-31kHz、26kHz-29kHz、25kHz-27kHzのそれぞれについて、周波数成分の振幅と音波センサが反応する振幅を参照して設定した閾値を基に形成したバイナリデータを入力とする。これは、上記周波数に対応した5つの音波センサを組み合わせたセンサアレイの理想的な反応データでの分類精度を確認するためのものである。
【0075】
(2)提案手法(全周波数帯):FFTを行った結果の3kHz毎の周波数成分の振幅と閾値を基に形成したバイナリデータを入力とする。これは、0-48kHzの全周波数帯をカバーする理想的な16個の音波センサからなるセンサアレイの分類精度を確認するためのものである。
【0076】
(3)FFT(マイクロコンピュータ):FFTを行った結果の4kHzまでの周波数成分を分類器の入力とする。これは典型的なマイクロコンピュータの処理限界である。
【0077】
以上が条件(1)~(3)である。
【0078】
消費電力については、高周波数帯の場合は、5つの音波センサのデータを取得する電子回路を試作し、その消費電力から、音のバイナリデータ取得を1ミリ秒ごとに繰り返す際の消費電力を計算した。全周波数の場合は高周波数帯の場合を参考にセンサの個数が12個になった場合の消費電力を計算した。FFTについては、一般的なマイクロコンピュータにFFTによるデータ処理を実装しその消費電力から、1回のFFTに必要な消費電力を計算した。
【0079】
精度と消費電力の実験結果を
図11に示す。提案手法では、マイクロコンピュータ上でFFTの計算を行わないため、消費電力を大きく抑えることができる。一方で認識精度については、実験に用いた家電が低い周波数に特徴が出るものが多かったため、低周波数の含まれるFFT及び全周波数帯域に比べて、高周波数帯のみを用いた方法は精度が低下した。
【0080】
ただし、対象となる音の発生源に合わせた音波センサを使用することで、提案手法においても、高い精度で認識を行うことが期待できる。
【0081】
上記のように、提案手法では、大きく消費電力を抑えられ、システムの低電力化、長寿命化に効果がある。また、対象となる音の発生源に合わせた音波センサを用いることで、高い精度で環境音の認識を行うことが可能になる。
【0082】
従来技術において使用することが想定される低消費電力なマイクロコンピュータでは、音波を高速にFFTで処理するような音声信号処理を行うことは難しいため、高速に周波数ごとの音波の強度を得て環境を識別することも難しかった。
【0083】
これに対し、提案手法のように、複数の音波センサを備えるセンサアレイを用いることで、低い消費電力で環境音の周波数ごとの音波の情報を獲得できるようになった。これにより環境音からその状況を識別するような応用をより広い場面で利用できるようになる。
【0084】
以上の実施形態に関し、更に以下の付記を開示する。
【0085】
<付記>
(付記項1)
ある特定の周波数の音に反応を示す音波センサと、
前記音波センサから出力される信号を増幅し、増幅した当該信号を、前記音波センサによる反応の有無を示すデータに変換する変換部と
を備える音波センサ装置。
(付記項2)
複数の周波数の音に対応する複数の音波センサと、
前記複数の音波センサに対応する複数の変換部と
を備える付記項1に記載の音波センサ装置。
(付記項3)
前記変換部は、
前記音波センサから出力される信号を増幅する増幅回路と、
前記増幅回路により増幅された前記信号を入力するコンパレータと、
前記コンパレータから出力される矩形波を、最小値が閾値を上回る波形に変換するRC回路と
を備える付記項1又は2に記載の音波センサ装置。
(付記項4)
付記項1ないし3のうちいずれか1項に記載の前記音波センサ装置から出力されるデータを入力する入力部と、
前記データを特徴量として用いることにより環境音の識別を行う識別部と
を備える識別装置。
(付記項5)
ある特定の周波数の音に反応を示す音波センサと、変換部とを備える音波センサ装置が実行する音データ取得方法であって、
前記音波センサが、前記特定の周波数の音に反応を示すステップと、
前記変換部が、前記音波センサから出力される信号を増幅し、増幅した当該信号を、前記音波センサによる反応の有無を示すデータに変換するステップと
を備える音データ取得方法。
(付記項6)
コンピュータを、付記項4に記載の識別装置における各部として機能させるためのプログラムを記憶した非一時的記憶媒体。
【0086】
以上、本実施の形態について説明したが、本発明はかかる特定の実施形態に限定されるものではなく、特許請求の範囲に記載された本発明の要旨の範囲内において、種々の変形・変更が可能である。
【符号の説明】
【0087】
10、20、30 音波センサ部
11、21、31 音波センサ
12、22、32 増幅回路
13、23、33 コンパレータ
14、24、34 RC回路
100 センサアレイ
200 識別装置
210 入力部
220 識別部
230 出力部
1000 ドライブ装置
1001 記録媒体
1002 補助記憶装置
1003 メモリ装置
1004 CPU
1005 インタフェース装置
1006 表示装置
1007 入力装置
1008 出力装置