特許第5983332号(P5983332)IP Force 特許公報掲載プロジェクト 2022.1.31 β版

知財求人 - 知財ポータルサイト「IP Force」

▶ 株式会社JVCケンウッドの特許一覧

特許5983332音声情報報知装置、音声情報報知方法およびプログラム
(19)【発行国】日本国特許庁(JP)
(12)【公報種別】特許公報(B2)
(11)【特許番号】5983332
(24)【登録日】2016年8月12日
(45)【発行日】2016年8月31日
(54)【発明の名称】音声情報報知装置、音声情報報知方法およびプログラム
(51)【国際特許分類】
   G01S 7/56 20060101AFI20160818BHJP
【FI】
   G01S7/56 Z
【請求項の数】6
【全頁数】20
(21)【出願番号】特願2012-249168(P2012-249168)
(22)【出願日】2012年11月13日
(65)【公開番号】特開2014-98573(P2014-98573A)
(43)【公開日】2014年5月29日
【審査請求日】2015年3月31日
(73)【特許権者】
【識別番号】308036402
【氏名又は名称】株式会社JVCケンウッド
(72)【発明者】
【氏名】岩間 茂彦
【審査官】 横井 亜矢子
(56)【参考文献】
【文献】 特表2010−510690(JP,A)
【文献】 特開2005−099418(JP,A)
【文献】 特開2008−064892(JP,A)
【文献】 特開2006−114942(JP,A)
【文献】 特開2008−271465(JP,A)
【文献】 特開2010−011269(JP,A)
(58)【調査した分野】(Int.Cl.,DB名)
G01S 1/72−1/82
G01S 3/80−3/86
G01S 5/18−5/30
G01S 7/52−7/64
G01S 15/00−15/96
G10L 13/00−99/00
H04R 1/20−1/40
H04R 3/00−3/14
(57)【特許請求の範囲】
【請求項1】
数のマイクロフォンから入力された音声信号に基づき音源の方向を特定する音源位置特定部、
装置の向きに対応し、優先度の異なる複数の音源エリアを設定する音源エリア設定部、
前記音源位置特定部により特定された音源の方向に対して、前記音源エリア設定部により設定された前記複数の音源エリアへの属性を判断する音源属性判断部、
前記音源属性判断部による判断結果に基づき、音声信号に対する報知形態を変えて報知する報知制御部、
前記装置の周囲におけるユーザの位置関係を検出するユーザ検出部を備え、
前記音源エリア設定部は、前記ユーザ検出部により検出したユーザの位置および前記音源位置特定部が特定した音源位置を用いて、前記ユーザの位置に基づき、優先度の異なる複数の音源エリアの設定を行う、
ことを特徴とする音声情報報知装置。
【請求項2】
前記音源位置特定部は、音源の方向に加えて音源までの距離をさらに特定し、
前記音源エリア設定部は、前記装置を中心とした所定距離範囲に対して最も優先度の低い音源エリアを設定する、
ことを特徴とする請求項1に記載の音声情報報知装置。
【請求項3】
前記音源エリア設定部は、前記装置の向きと前記ユーザ検出部が検出したユーザとの向きが同一であるとして、前記ユーザの位置に基づき、優先度の異なる複数の音源エリアを設定する、
ことを特徴とする、請求項1又は請求項2に記載の音声情報報知装置。
【請求項4】
前記音源エリア設定部は、前記装置に対する前記ユーザ検出部が検出したユーザの方向に対応し、前記ユーザの位置に基づき、優先度の異なる複数の音源エリアを設定する、
ことを特徴とする、請求項1又は請求項2に記載の音声情報報知装置。
【請求項5】
複数のマイクロフォンから入力された音声信号に基づき音源の方向を特定する音源位置特定ステップ、
装置の向きに対応し、優先度の異なる複数の音源エリアを設定する音源エリア設定ステップ、
前記音源位置特定ステップにおいて特定された音源の方向に対して、前記音源エリア設定ステップにおいて設定された前記複数の音源エリアへの属性を判断する音源属性判断ステップ、
前記音源属性判断ステップによる判断結果に基づき、音声信号に対する報知形態を変えて報知する報知ステップ、
前記装置の周囲におけるユーザの位置関係を検出するユーザ検出ステップを有し、
前記音源エリア設定ステップは、前記ユーザ検出部により検出したユーザの位置および前記音源位置特定ステップが特定した音源位置を用いて、前記ユーザの位置に基づき、優先度の異なる複数の音源エリアの設定を行う
ことを特徴とする音声情報報知方法。
【請求項6】
音声情報報知装置が備えるコンピュータに、
複数のマイクロフォンから入力された音声信号に基づき音源の方向を特定する音源位置特定ステップ、
前記装置の向きに対応し、優先度の異なる複数の音源エリアを設定する音源エリア設定ステップ、
前記音源位置特定ステップにおいて特定された音源の方向に対して、前記音源エリア設定ステップにおいて設定された前記複数の音源エリアへの属性を判断する音源属性判断ステップ、
前記音源属性判断ステップによる判断結果に基づき、音声信号に対する報知形態を変えて報知する報知ステップ、
前記装置の周囲におけるユーザの位置関係を検出するユーザ検出ステップを実行させ、
前記音源エリア設定ステップは、前記ユーザ検出部により検出したユーザの位置および前記音源位置特定ステップが特定した音源位置を用いて、前記ユーザの位置に基づき、優先度の異なる複数の音源エリアの設定を行う
ことを特徴とするプログラム。
【発明の詳細な説明】
【技術分野】
【0001】
本発明は、周囲の音声を取得して報知するための、音声情報報知装置、音声情報報知方法およびプログラムに関する。
【背景技術】
【0002】
聴覚に障害がある場合や、健常者であってもヘッドフォンの利用により周辺の音声情報を認識できない場合がある。このような場合において、周辺の音声情報を取得して視覚や触覚を用いてユーザに音声情報を報知する装置がある(特許文献1、特許文献2)。
【先行技術文献】
【特許文献】
【0003】
【特許文献1】特開2010−251916号公報
【特許文献2】特開2005−99418号公報
【発明の概要】
【発明が解決しようとする課題】
【0004】
聴覚に障害があるユーザは、周囲の音声が聞き取れなくとも、視覚によってある程度周囲の状況を把握することができる。しかし、視野角の外や視野角の周辺方向からの情報は、視覚によって気付かないことが多く、これらのエリアからの音声信号は、ユーザの前方からの音声信号に対して優先的に報知される必要がある。
【0005】
本発明はこのような問題点に鑑みなされたものであり、ユーザが視覚的に状況把握できない視野角方向からの音声信号を優先的に報知する、音声情報報知装置、音声情報報知方法およびプログラムを提供することを目的とする。
【課題を解決するための手段】
【0006】
上記目的を達成するために、本発明に関わる音声情報報知装置(100)は、複数のマイクロフォン(20)から入力された音声信号に基づき音源の方向を特定する音源位置特定部(113)、前記装置の向きに対応し、優先度の異なる複数の音源エリアを設定する音源エリア設定部(114)、前記音源位置特定部(113)により特定された音源の方向に対して、前記音源エリア設定部(114)により設定された前記複数の音源エリアへの属性を判断する音源属性判断部(115)、前記音源属性判断部(115)による判断結果に基づき、音声信号に対する報知形態を変えて報知する報知制御部(117)、前記装置の周囲におけるユーザの位置関係を検出するユーザ検出部(116)を備え、前記音源エリア設定部は、前記ユーザ検出部により検出したユーザの位置および前記音源位置特定部が特定した音源位置を用いて、前記ユーザの位置に基づき、優先度の異なる複数の音源エリアの設定を行うことを特徴とする。
【0007】
また、本発明に係る音声情報表示方法は、複数のマイクロフォン(20)から入力された音声信号に基づき音源の方向を特定する音源位置特定ステップ、装置の向きに対応し、優先度の異なる複数の音源エリアを設定する音源エリア設定ステップ、前記音源位置特定ステップにおいて特定された音源の方向に対して、前記音源エリア設定ステップにおいて設定された前記複数の音源エリアへの属性を判断する音源属性判断ステップ、前記音源属性判断ステップによる判断結果に基づき、音声信号に対する報知形態を変えて報知する報知ステップ、前記装置の周囲におけるユーザの位置関係を検出するユーザ検出ステップを有し、前記音源エリア設定ステップは、前記ユーザ検出部により検出したユーザの位置および前記音源位置特定ステップが特定した音源位置を用いて、前記ユーザの位置に基づき、優先度の異なる複数の音源エリアの設定を行うことを特徴とする。
【0008】
また、本発明に係るプログラムは、音声情報報知装置(100)が備えるコンピュータ(110)に、複数のマイクロフォン(20)から入力された音声信号に基づき音源の方向を特定する音源位置特定ステップ、前記装置の向きに対応し、優先度の異なる複数の音源エリアを設定する音源エリア設定ステップ、前記音源位置特定ステップにおいて特定された音源の方向に対して、前記音源エリア設定ステップにおいて設定された前記複数の音源エリアへの属性を判断する音源属性判断ステップ、前記音源属性判断ステップによる判断結果に基づき、音声信号に対する報知形態を変えて報知する報知ステップ、前記装置の周囲におけるユーザの位置関係を検出するユーザ検出ステップを実行させ、前記音源エリア設定ステップは、前記ユーザ検出部により検出したユーザの位置および前記音源位置特定ステップが特定した音源位置を用いて、前記ユーザの位置に基づき、優先度の異なる複数の音源エリアの設定を行うことを特徴とする。
【発明の効果】
【0009】
本発明によれば、ユーザが視覚的に状況把握できない視野角方向からの音声信号を優先的に報知することを可能とする。
【図面の簡単な説明】
【0010】
図1】本実施形態に係る音声情報報知装置の外観斜視図である。
図2】本実施形態に係る音声情報報知装置の構成ブロック図である。
図3】第1の実施形態に係る音声情報報知装置の動作例を示すフローチャートである。
図4】音源方向の例を示す概念図である。
図5】音源方向特定処理の例を示すフローチャートである。
図6】音源方向とマイクロフォン毎の入力音圧レベルの例を示す概念図である。
図7】音源エリア設定処理の例を示すフローチャートである。
図8】音源エリア設定例を示す概念図である。
図9】音源属性判断処理の例を示すフローチャートである。
図10】音源属性判断の例を示す概念図である。
図11】報知処理の例を示すフローチャートである。
図12】報知画面例を示す概念図である。
図13】報知画面例を示す概念図である。
図14】音源エリア設定例を示す概念図である。
図15】第2の実施形態に係る音声情報報知装置の動作例を示すフローチャートである。
図16】ユーザ位置入力画面例を示す概念図である。
図17】音源位置特定処理の例を示すフローチャートである。
図18】音源エリア設定処理の例を示すフローチャートである。
図19】音源エリア設定例を示す概念図である。
図20】音源エリア設定例を示す概念図である。
図21】第3の実施形態に係る音声情報報知装置の動作例を示すフローチャートである。
図22】ユーザ検出処理の例を示すフローチャートである。
図23】ユーザ検出処理を説明する概念図である。
【発明を実施するための形態】
【0011】
以下、本発明の実施形態に係る音声情報報知装置100の構成について、図1および図2を参照して説明する。
【0012】
音声情報報知装置100の一例として、図1に示すように表示機能を備えた小型の装置を用いる。具体的には、携帯電話端末やタブレット端末のように、小型で持ち運び容易であることが好ましい。また、音声情報報知装置100は、専用の装置に加えて携帯電話や各種情報端末に音声情報報知装置100として動作させるためのプログラムをインストールすることによって実現してもよい。この場合、音声情報報知装置100として動作する携帯電話や各種情報端末には、4方向またはそれ以上のマイクロフォン20を接続または装着し、マイクロフォン20に入力される音声信号は携帯電話や各種情報端末に入力される。
【0013】
音声情報報知装置100は、図1に示すように、その筐体10が構成する面に表示部140の表示面を備え、矩形の筐体10の4隅に各々マイクロフォン20を備える。
【0014】
音声情報報知装置100の4隅に備えられたマイクロフォン20は、便宜的に、マイクロフォン20A、マイクロフォン20B、マイクロフォン20C、マイクロフォン20Dとしてそれらの位置を示す。本実施形態においては、マイクロフォン20は表示部140を囲うように4箇所配置しているが、マイクロフォン20の配置位置や個数は、音源方向や音源までの距離が特定できる構成であれば限定されない。また、音声情報報知装置100の形状も矩形に限定されない。マイクロフォン20は、各々が音声を検出する方向に対して指向性を有するものであることが好ましい。
【0015】
音声情報報知装置100は、その構成として図2に示すように、制御部110、音声信号入力部120、記憶部130、表示部140、操作部150、センサ部170、通信部180、振動部190、マイクロフォン20を備える。センサ部170、通信部180および振動部190は、必要に応じて備えられていてもよい。また、音声情報報知装置100は、例えば装置の各部を動作させる電源供給機能など他に図示しない各種必要な構成要素を備える。
【0016】
制御部110は、音声情報報知装置100を構成する各部の動作制御、各種データの処理または演算等を行う。制御部110は、例えば、CPU(Central Processing Unit)、RAM(Random Access Memory)、ROM(Read Only Memory)、DSP(Digital Signal Processor)等により構成され、ROMに記憶された各種プログラムを実行することにより音声情報報知装置100を構成する各部の動作制御や各部より入力された信号やデータの処理または演算、ファイルの処理等を行う。
【0017】
制御部110は、実行されるプログラムによって各種機能を実現する。本実施形態において制御部110は、表示制御部111、操作制御部112、音源位置特定部113、音源エリア設定部114、音源属性判断部115、ユーザ検出部116、報知制御部117、音認識部118、通信制御部119を実現する。
【0018】
表示制御部111は、表示部140に対して各種情報を表示させる制御を行う。例えば、記憶部130に記憶されている各種表示形態や文字等の表示、図示しないタッチパネル操作部に連動した各種GUI(Graphical User Interface)などを表示させる。
【0019】
操作制御部112は、操作部150が操作されることによって生成する操作信号に基づいた処理を実行させる制御を行う。
【0020】
音源位置特定部113は、マイクロフォン20に入力された音声信号の各々の入力レベルや位相差に基づき、音声信号が発せられた方向である音源方向および音源までの方向を特定する制御を行う。
【0021】
音源エリア設定部114は、音声情報報知装置100の向きに対応した優先度の異なる複数の音源エリア、またはユーザの位置に基づいた優先度の異なる複数の音源エリアの設定を行う。音源エリア設定部114が設定する音源エリアは、ユーザの視野角に応じた音源エリアであり、主に、後方、側方、前方の順に優先度を高く設定する。
【0022】
音源属性判断部115は、音源位置特定部113により特定された音源の方向に対して、音源エリア設定部114が設定した複数の音源エリアへの属性を判断する。
【0023】
ユーザ検出部116は、ユーザ入力によるユーザ位置と音声情報報知装置100との位置関係を取得する。また、ユーザ検出部116は、後述する赤外線センサアレイ171により音声情報報知装置100の周辺に存在する人の存在有無およびユーザの特定、特定したユーザと音声情報報知装置100との位置関係を検出する。
【0024】
報知制御部117は、音源属性判断部115による判断結果に基づいた報知制御を行う。報知制御部117による報知は、例えば報知形態に応じて表示部140の表示形態を変化させる形態であり、報知制御部117の制御に基づき、表示部140への表示を表示制御部111が制御することにより、各種報知形態の表示を実行させる。また、報知制御部117による報知制御は、振動部190を併用したものであってもよい。
【0025】
音認識部118は、マイクロフォン20から入力され、音声信号入力部120から取得した音声データに対して、例えば記憶部130に記憶されている各種音のパターンデータと照合し、入力された音声の特定を行う。音認識部118による音声データの照合は、通信制御部119の制御により通信部180を用いて外部のサーバ等により照合してもよい。
【0026】
通信制御部119は、通信部180による通信動作を制御する。具体的には、通信部180によるデータや制御情報等の送受信の制御等である。
【0027】
音声信号入力部120は、制御部110の制御によりマイクロフォン20から入力された音声信号を制御部110が処理するためのデータに変換する。音声信号入力部120は、例えば、A/D変換部121および増幅部122から構成される。増幅部122は、マイクロフォン20から入力される音声信号を増幅する、例えばオペアンプ等である。A/D変換部121は、増幅部122が増幅した音声信号を、A/D(Analog - Digital)変換し、制御部110に音声データを送出する。
【0028】
記憶部130は、例えばフラッシュメモリやHDD(Hard Disk Drive)より構成され、音声情報報知装置100に必要な各種データや、マイクロフォン20等外部から入力される記録対象のデータが記憶され、制御部110の処理によって記憶動作や読み出し動作が行われる。記憶部130は音声情報報知装置100に内蔵されるものに限らず、所定のインターフェースによって接続される外部の記憶デバイスであってもよい。外部の記憶デバイスの一例としては、USB(Universal Serial Bus)端子に接続されるUSBメモリや外部HDD装置、所定のメモリカードスロットにより接続されるメモリカードなどである。
【0029】
表示部140は、例えば液晶表示素子や有機EL(Electro Luminescence)表示素子、およびそれらを駆動する回路ユニット等からなり、表示制御部111の制御により各種表示内容や表示形態が表示される。
【0030】
操作部150は、音声情報報知装置100に対してユーザが各種処理や動作指示を行うためのユーザインターフェースであり、例えば、押ボタン式や回転式の操作手段、または表示部140に重ねて設けられた図示しないタッチパネル操作部により構成される。操作部150が操作されることにより、操作に基づく信号が後述する操作制御部112に出力され、操作に基づく各部の動作や各種処理が実行される。
【0031】
センサ部170は、音声情報報知装置100において用いる各種センサにより構成され、各種センサにおける信号を制御部110に送出する。本実施形態においては赤外線センサアレイ171が備えられており、赤外線センサアレイ171からの出力に基づき、音声情報報知装置100の周囲における人の有無および位置関係をユーザ検出部116が検出する。センサ部170は、上記に加えて加速度センサや気圧センサ等を備えていてもよい。
【0032】
通信部180は、通信制御部119の制御により他の装置や基地局等との通信を行う装置であり、通信のためのアンテナも含む。通信部180の通信方式は、Wi−Fi方式、携帯電話向け通信方式に加えてブルートゥース方式等の短距離通信方式であってもよく、複数備えられていてもよい。
【0033】
振動部190は、報知制御部117の制御により振動を行う振動モータ等の振動素子である。
【0034】
次に、図3から図13を用いて、音声情報報知装置100における第1の実施形態としての処理について説明する。
【0035】
図3は、音声情報報知装置100における第1の実施形態全体のフローであり、図3のフローによる処理は、音声情報報知装置100の電源がONとなっている間、または音声情報報知装置100において、音声に対する報知を行う処理が選択され実行されている間、逐次実行されている。また、図3の各処理は、支障が無い範囲で処理の順序は変更されてもよい。
【0036】
先ず、制御部110は、マイクロフォン20に入力され、音声信号入力部120から取得した音声データに基づいて、所定音圧以上の音声信号がマイクロフォン20のいずれかまたは複数のマイクロフォン20に入力されたか否かを判断する(ステップS10)。つまり、音声情報報知装置100の電源がONとなっている間、または音声情報報知装置100において、音声に対する報知を行う処理が選択され実行されている間は、常時マイクロフォン20から入力される音声データが制御部110に入力され、ステップS10がYesとなることが、図3に示す処理のトリガとなる。
【0037】
ステップS10における音圧の判定は、例えば、音声信号入力部120から入力された音声データに対して、入力信号のレベルに応じてパルス幅のHレベルとLレベルの比率を変えるPWM(Pulse Width Modulation)変換を行い、そのパルス幅により判断する。このPWM変換は、周波数帯域毎に行ってもよい。その場合は、PWM変換前にBPF(Band Pass Filter)により、所望の周波数帯域毎に音声データを選別する。また、PWM変換は、複数のマイクロフォン20毎に行う。
【0038】
ステップS10において判断される所定音圧は、任意に設定されてもよいが、具体例として音圧レベルが70dB以上とする。この数値は、予め設定されていてもよく、ユーザの聴覚レベルに合わせて設定が変更可能であってもよい。
【0039】
また、ステップS10における判断は、音声信号入力部120から入力された音声データを、人の声に基づく音声とそれ以外の音声とに分離し、人の声以外の音声を対象としてもよい。
【0040】
ステップS10において、所定音圧以上の音声信号が入力されていないと判断された場合(ステップS10:No)、ステップS10の処理を再度実行する。ステップS10において、所定音圧以上の音声信号が入力されたと判断された場合(ステップS10:Yes)、音源位置特定部113は、入力された各マイクロフォン20による音声データに基づき、音源の方向を特定する(ステップS11)。
【0041】
ステップS11の処理を、図4から図6に基づき説明する。先ず、説明を容易にするため、音声情報報知装置100と音源の方向を図4により定義する。図4は、音声情報報知装置100が表示部140の表示面を地面と水平として用いられた場合の各方向を示している。
【0042】
図5は、音源位置特定部113における音源方向特定処理の一例を示している。音源位置特定部113による音源方向特定処理は、図5に示したものに限らず、例えば、特開平01−089895号公報や、特開2010−154260号公報に記載された技術など、任意の方法を用いてもよい。ここでは、音圧レベル差による音源方向特定処理について説明する。
【0043】
先ず、音源位置特定部113は、ステップS10において検出した所定音圧レベル以上の音声信号に基づく入力データのピーク位置を特定する(ステップS111)。音声信号に基づくピーク位置は、各マイクロフォン20の指向性の違いにより入力レベルの差はあるものの、全てのマイクロフォン20においてほぼ同一位置においてピークが検出されるため、全てのマイクロフォン20においてピークを特定してもよく、任意のマイクロフォンにおいてピークを特定してもよい。ここでいうほぼ同一位置とは、音源方向から見た各マイクロフォン20の配置位置による距離の差に基づくピーク位置のずれが生じるためである。ステップS111の処理においては、このピーク位置のずれは同一とみなしてもよい。
【0044】
次に、音源位置特定部113は、ステップS111において特定したピーク位置におけるマイクロフォン毎の音圧割合を検出する(ステップS112)。
【0045】
図6は、図4に示す音源方向とマイクロフォン20の配置位置に基づく音圧レベルを示した図である。各々のマイクロフォン20はその配置方向に指向性を備えているため、マイクロフォン20Aは方向B、マイクロフォン20Bは方向D、マイクロフォン20Cは方向F、マイクロフォン20Dは方向Hで、入力音圧が最大となる。また、方向Cにおいてはマイクロフォン20Aとマイクロフォン20Bとの入力音圧が同一となり、方向Eにおいてはマイクロフォン20Bとマイクロフォン20Cとの入力音圧が同一となる。同様に、方向Gにおいてはマイクロフォン20Cとマイクロフォン20Dとの入力音圧が同一となり、方向Aにおいてはマイクロフォン20Dとマイクロフォン20Aとの入力音圧が同一となる。
【0046】
ステップS112においては、特定されたピーク位置における各々のマイクロフォン20の音圧に対して、図6のような音源方向毎に各マイクロフォン20の音圧レベルの割合を示すデータと対比することで、最も近い音圧レベルの割合を検出する。
【0047】
次に、音源位置特定部113は、ステップS112において検出した音圧レベルの割合に基づき、その割合に対応する音源方向を特定する(ステップS113)。
【0048】
ステップS113において特定される音源方向は、図4に例示した方向Aから方向Hに限らず、図6に示すように、各々の方向の間の値をとってもよい。また、ステップS111において特定されるピーク位置は、マイクロフォン20から入力される全ての音声信号におけるピーク位置を求める必要はなく、例えばステップS10において判断される所定音圧以上の入力が連続的または断続的に0.5秒以上継続した場合としてもよい。
【0049】
次に、音源エリア設定部114は、音声情報報知装置100を中心とした音源エリアを設定する(ステップS12)。ステップS12において設定される音源エリアは、図3のように、所定音圧以上の音声信号入力毎に行ってもよいが、予めデフォルト値として設定されていてもよく、ユーザがタッチパネル等の操作部150を用いて設定可能としてもよい。
【0050】
図7および図8に基づきステップS12の音源エリア設定処理について説明する。ステップS12の音源エリア設定処理は、音声情報報知装置100の位置とユーザの位置とがほぼ一致し、さらに音声情報報知装置100の前方とユーザの前方とが一致することを前提とし、音声情報報知装置100を中心とした音源エリアを設定するものである。
【0051】
先ず、音源エリア設定部114は、音声情報報知装置100の後方を優先度の高いエリアAと設定する(ステップS121)。音声情報報知装置100の前方や後方の定義は、音声情報報知装置100が通常用いられる向きによって定義される。例えば、表示部140に表示される情報のデフォルト状態における表示方向などにより定義されてもよい。図4に示す例の場合、マイクロフォン20Aおよびマイクロフォン20Dを備える方向Aを前方とし、マイクロフォン20Bおよびマイクロフォン20Cを備える方向Eを後方として定義する。
【0052】
エリアAとして設定される範囲は、図8に示すように音声情報報知装置100の前方を0度とした場合、90度から270度の範囲として設定される。この範囲は、ユーザが視覚による認識ができない範囲であることが適切であるため、上記の角度による範囲に限定されない。例えば、80度から280度の範囲などであってもよい。
【0053】
次に、音源エリア設定部114は、音声情報報知装置100の側方から前方30度を優先度が中レベルであるエリアBとして設定する(ステップS122)。図8の例においては、音声情報報知装置100の前方を0度とした場合、60度から90度および270度から300度の範囲がエリアBとして設定される。エリアBの設定範囲は、例えば、ユーザが両眼視できない範囲であることが適切であるため、上記角度による範囲に限定されない。例えば、側方から前方30度ではなく、音声情報報知装置100の前方を0度として、70度から100度および260度から290度の範囲などであってもよい。
【0054】
次に、音源エリア設定部114は、音声情報報知装置100の前方を優先順位の低いエリアCとして設定する(ステップS123)。図8の例においては、音声情報報知装置100の前方を0度とした場合、300度から60度の範囲がエリアCとして設定される。エリアCの設定範囲は、例えば、ユーザが両眼視可能な範囲であることが適切である。また、ステップS121からステップS123の順番や設定方法は限定されない。
【0055】
ステップS12において音源エリアが設定された後、または予め音源エリアが設定されている場合はステップS11において音源方向が特定された後、音源属性判断部115は、ステップS11において特定された音源方向がステップS12において設定された音源エリアのいずれに属しているかを判断する(ステップS13)。
【0056】
図9および図10に基づきステップS13の音源属性判断処理について説明する。先ず、音源属性判断部115は、ステップS11において特定された音源方向がステップS12において設定されたエリアCの範囲に属するか否かを判断する(ステップS131)。エリアCの範囲の例として、音声情報報知装置100を中心として300度から60度の範囲であるか否かを判断する。ステップS131において属すると判断された場合(ステップS131:Yes)、音源はエリアCに属していると判断される(ステップS133)。
【0057】
ステップS131において、エリアCの範囲に属していないと判断された場合(ステップS131:No)、ステップS12において設定されたエリアBの範囲に属するか否かを判断する(ステップS132)。エリアBの範囲の例として、音声情報報知装置100を中心として270度から300度または60度から90度の範囲であるか否かを判断する。ステップS132において属すると判断された場合(ステップS132:Yes)、音源はエリアBに属していると判断される(ステップS134)。
【0058】
ステップS132において、エリアBの範囲に属していないと判断された場合(ステップS132:No)、音源はエリアAに属していると判断される(ステップS135)。また、音源方向の属性を判断するステップは上述した順番に限定されず、エリアCやエリアBへの属性を最初に判断してもよい。
【0059】
このように判断された音源方向の属性は、図10に示すように、図4に示す音源方向の例を対応付けると、方向Aから方向Bより15度進んだ範囲および方向Hの15度手前から方向Aまでの方向である音源をエリアCに属していると判断する。同様に、方向Bから15度進んだ方向から方向Cおよび方向Gから方向Hの15度手前までの方向である音源をエリアBに属していると判断する。同様に、方向Cから方向Gまでの方向である音源をエリアAに属していると判断する。
【0060】
ステップS13において音源属性が判断された後、報知制御部117は音源の属性に基づいた報知を行う(ステップS14)。図11から図13に基づきステップS14の報知処理について説明する。
【0061】
先ず、報知制御部117は、ステップS13において音源属性が判断された音源の属性がエリアAに属しているか否かを判断する(ステップS141)。ステップS141においてエリアAに属していると判断された場合(ステップS141:Yes)、エリアAに対応した報知を実行する(ステップS143)。ステップS141においてエリアAに属していないと判断された場合(ステップS141:No)、音源の属性がエリアBに属しているか否かを判断する(ステップS142)。
【0062】
ステップS142においてエリアBに属していると判断された場合(ステップS142:Yes)、エリアBに対応した報知を実行する(ステップS144)。ステップS142においてエリアBに属していないと判断された場合(ステップS142:No)、エリアCに対応した報知を実行する(ステップS145)。ステップS141からステップS142による判断は、上述した順番に限定されない。
【0063】
ステップS143からステップS145において実行される報知処理は、様々な報知形態が適用されるが、エリアAに対応する報知形態はエリアCに対応する報知形態に比してユーザが気付きやすい報知形態であることが好ましい。表1に、報知形態の具体的な例を示す。
【表1】
【0064】
表1における報知例1は、音声信号の音源方向を示す表示図形のサイズを異ならせた例であり、優先度の高いエリアAは表示図形のサイズを大きくし、優先度が低のエリアCは表示図形のサイズを小さくし、優先度が中のエリアBは表示図形のサイズをエリアAの表示図形サイズより小さくエリアCの表示図形サイズより大きく設定されている。
【0065】
図12は、報知例1に基づく表示形態を示しており、便宜的に複数の音源方向に基づく表示図形を複数同時に示している。例えば、表示図形300AはエリアAに属する方向からの音源を表し、表示図形300BはエリアBに属する方向からの音源を表し、表示図形300CはエリアCに属する方向からの音源を表している図形である。各々の表示図形300は、音源方向の属性に基づき表示サイズが異なっている。各々の表示図形300における矢印はステップS11において特定された音源の方向を示し、数字は各々の音源方向における音声信号の音圧レベルを数値により示している。例えば、表示図形300に80と表示された場合は、その表示図形における矢印の方向からピーク値が約80dBの音声信号を検出したことを示す。報知例1において表示サイズを変更する対象は、表示図形300に限らず、各々の音源方向に対応して表示される文字サイズであってもよい。
【0066】
報知例2は、図12の例に基づき説明すると、表示図形300Aを赤色系統の色を用いて表示させ、表示図形300Bを黄色系統の色を用いて表示させ、表示図形300Cを緑色系統の色を用いて表示させる。各々の表示図形300の表示色は上記に限定されないが、優先度が高くなるにつれユーザが視認しやすい色や、危険であることを認識できる色であればよい。
【0067】
報知例3は、図13に示すように、表示図形300Aの表示色を濃く表示させ、表示図形300Bの表示色を通常の濃さで表示させ、表示図形300Cの表示色を薄く表示させる。各々の表示図形の色は同一であっても異なっていてもよく、優先度が高くなるにつれユーザが視認しやすい色の濃さであればよい。
【0068】
報知例4は、報知に振動部190を用いたまたは併用した場合である。音源方向がエリアAに属している場合は振動部190を振動させ、それ以外は振動させない。振動部190における振動の強さが連続的または断続的に変化可能である場合は、優先度が高くなるにつれ振動の強さを強くしてもよい。
【0069】
報知例5は、表示図形300の表示時間を優先度に対応させた例であり、優先度の高いエリアAは、表示図形300Aの表示を音声信号の検出後、例えば20秒間表示を継続させる。優先度が中のエリアBは、表示図形300Bの表示を音声信号の検出後、例えば10秒回表示を継続させる。優先度が低いエリアCは、表示図形300Cの表示を音声信号の検出後、例えば5秒間表示を継続させる。上述した各報知例は、単独で実行してもよく、組み合わせて実行されてもよい。
【0070】
また、上記実施形態においては、ステップS11の処理において音源の方向のみを特定していたが、音源位置特定部113が音源の方向に加えて音源までの距離を特定する場合についても説明する。音源位置特定部113における音源の方向および距離の特定は、各マイクロフォン20に入力された音声データの音圧および位相差等を用いて、上述した特開平01−089895号公報や、特開2010−154260号公報に記載された技術など、任意の手法を用いる。
【0071】
音源位置特定部113によって特定された音源の方向および距離を用いて、音源エリア設定部114は、図14に示すような音源エリアを設定する。図14に示すエリアA、エリアBおよびエリアCは上述した実施形態と同一であるが、音源エリア設定部114は、音声情報報知装置100から音源までの距離が所定距離以内についてはエリアDを設定する。
【0072】
音源エリア設定部114においてエリアDを設定する理由としては、音声情報報知装置100を中心として所定距離以内における音源は、ユーザが発した音声信号である可能性が高い場合や、ユーザがその発生を認識しやすい音声信号である可能性が高いためである。ここでいう所定距離とは、例えば1.0mから2.0mが適切である。
【0073】
図14の場合、音源属性判断部115は、音源の方向による音源属性判断以前に、その音源までの距離が所定距離以内であれば、その音源はエリアDに属する判断を行う。また、報知制御部117は、その音源の属性がエリアDである場合は、報知を実行しない。
【0074】
本実施形態においては、音声情報報知装置100を中心として、ユーザが視覚的に状況把握できない視野角方向からの音声信号を優先的に報知するため、例えば、ユーザが音声情報報知装置100を把持しながらの利用である場合や、ユーザの直近に音声情報報知装置100を置いた状態における利用時などに適切である。
【0075】
次に、図15から図20を用いて、音声情報報知装置100における第2の実施形態としての処理について説明する。第1の実施形態においては、音声情報報知装置100の位置とユーザの位置とがほぼ一致し、さらに音声情報報知装置100の前方とユーザの前方とが一致することを前提として、音声情報報知装置100を中心とした音源エリアを設定したが、第2の実施形態においては、音声情報報知装置100の位置とユーザの位置が異なっている場合において、ユーザを中心とした音源エリアを設定するものである。第2の実施形態の説明においては、第1の実施形態と同一の処理についてはその説明を省略する。
【0076】
図15においては、図3と同一処理であるステップS10の前に、ユーザ位置の入力処理(ステップS21)および音声情報報知装置100の方向に対するユーザの基準方向設定処理(ステップS22)が実行される。
【0077】
ステップS21におけるユーザ位置入力処理は、例えば表示制御部111は図16に示すような表示を行う。図16は、音声情報報知装置100を中心としたユーザの方向および距離を特定するためのスケールが表示された例であり、ユーザはこの表示に対して、例えばタッチパネル等の操作部150を用いてユーザ位置を入力する。図16におけるユーザ位置350は、ユーザにより入力された結果の例を示し、この場合、音声情報報知装置100の前方を基準としてユーザ位置350が110度の方向1.0mであることが入力されている。
【0078】
このような入力結果に基づき、ユーザ検出部116は、入力されたユーザ位置350と音声情報報知装置100との位置関係を取得する。
【0079】
次に、ユーザ検出部116は、音声情報報知装置100の方向に対するユーザ位置の基準方向を設定する(ステップS22)。ユーザ位置の基準方向とは、音源エリアを設定するために予め設定するユーザの前方の向きである。ステップS21においては、ユーザの位置の取得は可能であるが、ユーザがその位置においていずれの方向を向いているかの検出は困難なためである。
【0080】
ステップS22において設定されるユーザ位置の基準方向の例としては、音声情報報知装置100の前方の向きが常にユーザの前方の向きと同一方向であると設定する。また、他の例としては、ユーザ位置から見た音声情報報知装置100の方向が常にユーザの前方の向きであると設定する。これらの設定は、予め設定されていてもよく、ユーザの操作によって切り換え可能としてもよい。また、音声情報報知装置100が用いられる条件によって自動的に切り換えられてもよい。
【0081】
ステップS10において、所定音圧以上の音声信号の入力が確認された後、音源位置特定部113は入力された各マイクロフォン20による音声データに基づき、ユーザ位置を中心とした音源の位置を特定する(ステップS23)。ステップS23の処理を、図17を用いて説明する。
【0082】
先ず、音源位置特定部113は、上述した公知の手法等を用いて、各マイクロフォン20に入力された音声データの音圧および位相差等に基づき音声情報報知装置100を中心とした音源の方向および距離を特定する(ステップS231)。ステップS231において、音源の方向に加えて音源までの距離を特定する理由としては、上述した第1の実施形態における理由に加えて、音源が音声情報報知装置100とユーザ位置350までの距離の間に存在する場合に音声情報報知装置100から見た音源方向とユーザ位置から見た音源方向とが異なる結果となるためである。
【0083】
次に、音源位置特定部113は、ステップS231において特定した音声情報報知装置100を中心とした音源の方向および距離を、ステップS21において入力されたユーザの位置に基づき、ユーザ位置を中心とした音源の方向および距離に補正する(ステップS232)。
【0084】
次に、音源エリア設定部114は、ユーザ位置に対応した音源エリアを設定する(ステップS24)。ステップS24において設定される音源エリアについても、第1の実施形態同様に、所定音圧以上の音声信号入力毎に行ってもよいが、予めデフォルト値として設定されていてもよく、ユーザがタッチパネル等の操作部150を用いて設定可能としてもよい。
【0085】
ステップS24の処理を図18に基づき説明する。ステップS24においても、図3におけるステップS12と同様に、ユーザ位置の後方をエリアAと設定し(ステップS241)、ユーザ位置の側方から前方20度をエリアBと設定し(ステップS242)、ユーザ位置の前方をエリアCと設定する(ステップS243)。また、図14と同様に、ユーザ位置から音源までの距離が所定距離以内である場合にはエリアDを設定してもよい。
【0086】
このような処理によってユーザ位置を中心として設定された音源エリアの例を、図19および図20に示す。図19は、ステップS22において音声情報報知装置100の前方の向きが常にユーザの前方の向きと同一方向であると設定された場合を示す。図19においては、音声情報報知装置100から見たユーザ位置350は、角度θ方向で距離dである。このユーザ位置350においてユーザの前方の向きが音声情報報知装置100の前方の向きと同一であるとして、各音源エリアが設定されている。図20は、ステップS22においてユーザ位置から見た音声情報報知装置100の方向が常にユーザの前方の向きであると設定された場合を示す。図20においては、音声情報報知装置100から見たユーザ位置350は、角度θ方向で距離dである。このユーザ位置350においてユーザ位置から見た音声情報報知装置100の方向がユーザの前方であるとして、各音源エリアが設定されている。
【0087】
このような処理により、ユーザ位置を中心とした音源エリアに基づく報知を行うことができる。
【0088】
次に、図21から図23を用いて、音声情報報知装置100における第3の実施形態としての処理について説明する。第3の実施形態においては、第2の実施形態と同様にユーザ位置を中心した音源エリアに基づく報知を行うが、そのユーザ位置をユーザによる入力ではなく赤外線センサ等により検出するものである。第3の実施形態の説明においては、第1の実施形態および第2の実施形態と同一の処理についてはその説明を省略する。
【0089】
図21は、音声情報報知装置100における第3の実施形態の全体のフローである。図21においては、図15におけるステップS21のユーザ位置入力処理に代えて、ステップS31におけるユーザ位置検出処理が実行される。
【0090】
ステップS31におけるユーザ位置検出処理は、ユーザ検出部116が赤外線センサアレイ171からの出力に基づいて行う。先ず、ユーザ検出部116は、赤外線センサアレイ171における赤外線検出感度が最大となるように制御する(ステップS310)。例えば、図23における最外周の破線円が赤外線検出感度最大時の検出範囲であるとする。具体例としては半径約5m程度を想定する。
【0091】
次に、ユーザ検出部116はステップS310の検出感度において人を検出したか否かを判断する(ステップS311)。ステップS311において人が検出されていないと判断された場合(ステップS311:No)、赤外線センサアレイ171の検出範囲内に人が存在していないため、人の検出ができない。したがって、制御部110は赤外線センサアレイ171により検出したユーザ位置に対応した音源エリア設定を行うモードではなく、第1の実施形態として説明した音声情報報知装置100を中心とした音源エリア設定を行うモードとする(ステップS314)。ステップS314における処理は、他のモードや他の処理であってもよい。
【0092】
ステップS311において人を検出したと判断された場合(ステップS311:Yes)、ユーザ検出部116はステップS311において検出した人が複数であるか否かを判断する(ステップS312)。図23の最外周の破線円内には、人物360Aおよび人物360Cが検出されている。また、人物360Bは赤外線センサアレイ171の最大感度においても検出されなかった人物である。
【0093】
ステップS321において、検出された人が複数ではなく単数であると判断された場合(ステップS312:No)、ユーザ検出部116は検出された人をユーザとしてその位置情報を取得する(ステップS315)。ステップS321において検出された人が複数であると判断された場合(ステップS312:Yes)、ユーザ検出部116は赤外線センサアレイ171における赤外線検出感度を低減させ(ステップS313)、ステップS311からの処理を実行する。ここで低減させる赤外線センサアレイ171の赤外線検出感度は、段階的であることが好ましく、例えば図23に示す破線円のように3段階の赤外線検出感度である場合、1段階低減させる。この場合における具体例としての検出範囲は半径約3m程度を想定する。
【0094】
図23の例においては、人物360Cがユーザであると判断され、音声情報報知装置100からの位置情報が取得される。
【0095】
図21におけるステップS31の処理は、一旦実行された場合、ユーザによる再検出操作が行われるまでユーザ位置を保持してもよく、例えば5分毎など所定時間間隔で実行されてもよい。
【0096】
このような処理により、自動的に検出したユーザ位置を中心とした音源エリアに基づく報知を行うことができる。
【0097】
本発明の実施の形態は、その要旨を逸脱しない限り、様々に変更可能である。音源エリアの設定をエリアAからエリアCの3区分としたが、2区分であっても3以上であってもよい。また、各エリアの区分角度を左右対称としたが、ユーザの視覚にあわせた非対象のエリアであってもよい。
【0098】
また、上記各実施形態においては、報知制御部117による報知を、表示部140および振動部190を用いた報知について説明したが、ユーザが音源方向およびその音源の危険度を認識できる報知形態であれば、これらの報知に限定されない。
【0099】
また、エリアAに属する音源の報知については、音声信号入力部120から取得した音声信号に対し、音認識部118が音の照合を行うことで、照合結果としての音の種類を表す表示を表示部140に表示させてもよい。例えば、エリアAに属する方向より救急車のサイレン音を検出した場合、図12図13のエリアAに対応する表示図形300A上に、救急車であることが判断できる文字列や記号を表示させる。
【0100】
音認識部118による音の照合は、記憶部130に記録されている音のデータベースに基づいて照合してもよく、通信制御部119により制御される通信部180を用いて無線接続される他のサーバに記録されている音のデータベースに基づいて照合してもよい。
【符号の説明】
【0101】
20:マイクロフォン、100:音声情報表示装置、110:制御部、113:音源位置特定部、114:音源エリア設定部、115:音源属性判断部、116:ユーザ検出部、117:報知制御部
図1
図2
図3
図4
図5
図6
図7
図8
図9
図10
図11
図12
図14
図15
図16
図17
図18
図19
図20
図21
図22
図23
図13