特許6947183 | 知財ポータル「IP Force」

知財求人 - 知財ポータルサイト「IP Force」

▶ ソニー株式会社の特許一覧

特許6947183音源位置推定装置及びウェアラブルデバイス

書誌要約請求の範囲詳細な説明課題実施例実施するための形態図面の説明

目に優しい文字サイズ小中大 PDF Top

< >

1
2
3
4
5
6
7
8
9
10
11
12
13

(19)【発行国】日本国特許庁(JP)

(12)【公報種別】特許公報(B2)

(11)【特許番号】6947183

(24)【登録日】2021年9月21日

(45)【発行日】2021年10月13日

(54)【発明の名称】音源位置推定装置及びウェアラブルデバイス

(51)【国際特許分類】

H04R 1/02 20060101AFI20210930BHJP

H04R 3/00 20060101ALI20210930BHJP

H04R 1/40 20060101ALI20210930BHJP

G10L 25/51 20130101ALI20210930BHJP

【ＦＩ】

H04R1/02 107

H04R3/00 320

H04R1/40 320A

G10L25/51 400

【請求項の数】14

【全頁数】17

(21)【出願番号】特願2018-539560(P2018-539560)

(86)(22)【出願日】2017年8月2日

(86)【国際出願番号】JP2017028102

(87)【国際公開番号】WO2018051663

(87)【国際公開日】20180322

【審査請求日】2020年7月2日

(31)【優先権主張番号】特願2016-178745(P2016-178745)

(32)【優先日】2016年9月13日

(33)【優先権主張国】JP

(73)【特許権者】

【識別番号】000002185

【氏名又は名称】ソニーグループ株式会社

(74)【代理人】

【識別番号】110002147

【氏名又は名称】特許業務法人酒井国際特許事務所

(72)【発明者】

【氏名】小山裕一郎

(72)【発明者】

【氏名】関矢俊之

【審査官】北原昂

(56)【参考文献】

【文献】特開２０１３−０７２９７７（ＪＰ，Ａ）

【文献】特表２００３−５３５５２９（ＪＰ，Ａ）

【文献】国際公開第２０１６／０６３５８７（ＷＯ，Ａ１）

【文献】国際公開第２０１７／０６５０９２（ＷＯ，Ａ１）

【文献】米国特許出願公開第２０１７／０１９５７６７（ＵＳ，Ａ１）

(58)【調査した分野】（Int.Cl.，ＤＢ名）

Ｈ０４Ｒ１／０２

Ｈ０４Ｒ３／００

Ｈ０４Ｒ１／４０

Ｇ１０Ｌ２５／５１

(57)【特許請求の範囲】

【請求項1】

リング状のウェアラブルデバイスに設けられた複数のマイクロフォンで得られる音声に基づいて、音源の周波数スペクトルを取得するスペクトル取得部と、
前記周波数スペクトルに基づいて複数の前記マイクロフォンから前記音源までのそれぞれの距離を演算する距離演算部と、
前記リング状のウェアラブルデバイスを円に近似して、前記リング状のウェアラブルデバイスを含む円柱面に前記音源が位置するものとして、前記それぞれの距離を半径とする球面と前記円柱面との交点を求めることで前記音源の位置を演算する音源位置演算部と、
を備える、音源位置推定装置。

【請求項2】

前記音源位置演算部は、前記音源の位置を演算した後、前記音源の位置を再演算する際には、前記円柱面における前記円から前記音源までの距離を固定値として最適化演算を行うことで前記音源の位置を再演算する、請求項１に記載の音源位置推定装置。

【請求項3】

前記マイクロフォンは２つ設けられ、
音源位置演算部は、前記それぞれの距離を半径とする球面を表す２つの式と前記円柱面を表す式を連立して解くことで、前記球面と前記円柱面との交点を求める、請求項１又は２に記載の音源位置推定装置。

【請求項4】

前記マイクロフォンは３つ以上設けられ、
前記スペクトル取得部は、線形最適化により前記周波数スペクトルを取得する、請求項１又は２に記載の音源位置推定装置。

【請求項5】

前記マイクロフォンは３つ以上設けられ、
音源位置演算部は、前記それぞれの距離を半径とする球面を表す式と、前記円柱面を表す式とに基づいて、非線形最適化により前記音源の位置を演算する、請求項１又は２に記載の音源位置推定装置。

【請求項6】

前記音源位置演算部は、前記円柱面を表す式を制約条件として、非線形化最適化により前記音源の位置を演算する、請求項５に記載の音源位置推定装置。

【請求項7】

前記音源位置演算部は、前記リング状のウェアラブルデバイスを前記円に近似したことにより前記円柱面を表す式に含まれる誤差を考慮して、非線形化最適化により前記音源の位置を演算する、請求項５に記載の音源位置推定装置。

【請求項8】

前記マイクロフォンは前記円の中心に対して点対称の位置に設けられ、
前記音源位置演算部は、前記円柱面を表す式の代わりに、前記それぞれの距離と前記円の直径との関係を示す式を用いて前記球面と前記円柱面との交点を求める、請求項３に記載の音源位置推定装置。

【請求項9】

前記音源位置演算部は、前記音源の位置を演算した後、演算した前記音源の位置と複数の前記マイクロフォンのそれぞれの位置とに基づいて、複数の前記マイクロフォンから前記音源までのそれぞれの距離を再計算する、請求項１〜８のいずれか１項に記載の音源位置推定装置。

【請求項10】

前記音源位置演算部により再計算された前記音源までのそれぞれの距離に基づいて、ビームフォーミング処理が行われる、請求項９に記載の音源位置推定装置。

【請求項11】

前記スペクトル取得部は、複数の前記マイクロフォンで観測された信号をＡＤ変換し、帯域分割処理を行うことにより、前記周波数スペクトルを取得する、請求項１〜１０のいずれか１項に記載の音源位置推定装置。

【請求項12】

複数のマイクロフォンが設けられたリング状の筐体と、
複数の前記マイクロフォンで得られる音声に基づいて、音源の周波数スペクトルを取得するスペクトル取得部と、前記周波数スペクトルに基づいて複数の前記マイクロフォンから前記音源までのそれぞれの距離を演算する距離演算部と、前記筐体を円に近似して、前記筐体を含む円柱面に前記音源が位置するものとして、前記それぞれの距離を半径とする球面と前記円柱面との交点を求めることで前記音源の位置を演算する音源位置演算部と、を備える、音源位置推定装置と、
を備える、ウェアラブルデバイス。

【請求項13】

前記円柱面に前記音源が位置するように、身体の装着部位に対する前記筐体の傾きを調整する傾き調整部を備える、請求項１２に記載のウェアラブルデバイス。

【請求項14】

前記円柱面に前記音源が位置するように、前記筐体におけるリングの直径を調整する直径調整部を備える、請求項１２又は１３に記載のウェアラブルデバイス。

【発明の詳細な説明】

【技術分野】

【0001】

本開示は、音源位置推定装置及びウェアラブルデバイスに関する。

【背景技術】

【0002】

従来、例えば下記の特許文献１には、耳掛け式イヤホン装置において、装着位置のずれを防止することを想定した技術が記載されている。

【先行技術文献】

【特許文献】

【0003】

【特許文献1】特開２０１０−１９３３４４号公報

【発明の概要】

【発明が解決しようとする課題】

【0004】

近時においては、時計型デバイス、眼鏡型デバイスなど、各種のウェアラブルデバイスが出現している。これらのウェアラブルデバイスは、使用中に身体に対する位置ずれ（装着ずれ）を起こす場合がある。

【0005】

装着ずれが発生すると、ウェアラブルデバイスの動作に支障が生じる場合がある。特に、ウェアラブルデバイスがマイクロフォンを備えている場合、装着ずれによって音源に対するマイクロフォンの位置が変化してしまい、適正に音声情報を取得できなくなることがある。

【0006】

上記特許文献１に記載された技術は、耳掛け式イヤホン装置における装着ずれを防止することは想定しているが、装着ずれが発生した場合の対処については何ら考慮していなかった。

【0007】

このため、ウェアラブルデバイスに装着ずれが発生した場合であっても、装着ずれに起因する音源の位置を推定できるようにすることが望まれていた。

【課題を解決するための手段】

【0008】

本開示によれば、リング状のウェアラブルデバイスに設けられた複数のマイクロフォンで得られる音声に基づいて、音源の周波数スペクトルを取得するスペクトル取得部と、前記周波数スペクトルに基づいて複数の前記マイクロフォンから前記音源までのそれぞれの距離を演算する距離演算部と、前記リング状のウェアラブルデバイスを円に近似して、前記リング状のウェアラブルデバイスを含む円柱面に前記音源が位置するものとして、前記それぞれの距離を半径とする球面と前記円柱面との交点を求めることで前記音源の位置を演算する音源位置演算部と、を備える、音源位置推定装置が提供される。

【0009】

また、本開示によれば、複数のマイクロフォンが設けられたリング状の筐体と、複数の前記マイクロフォンで得られる音声に基づいて、音源の周波数スペクトルを取得するスペクトル取得部と、前記周波数スペクトルに基づいて複数の前記マイクロフォンから前記音源までのそれぞれの距離を演算する距離演算部と、前記筐体を円に近似して、前記筐体を含む円柱面に前記音源が位置するものとして、前記それぞれの距離を半径とする球面と前記円柱面との交点を求めることで前記音源の位置を演算する音源位置演算部と、を備える、音源位置推定装置と、を備えるウェアラブルデバイスが提供される。

【発明の効果】

【0010】

以上説明したように本開示によれば、ウェアラブルデバイスに装着ずれが発生した場合であっても、装着ずれに起因する音源の位置を推定することが可能となる。
なお、上記の効果は必ずしも限定的なものではなく、上記の効果とともに、または上記の効果に代えて、本明細書に示されたいずれかの効果、または本明細書から把握され得る他の効果が奏されてもよい。

【図面の簡単な説明】

【0011】

【図1】本開示の一実施形態に係るネックバンド型デバイスの概略構成について説明する。

【図2】開口部の位置がユーザの正面を向いている正しい装着状態を示す模式図である。

【図3】図２に対してネックバンド型デバイスの開口部が手前側に回転し、装着ずれが発生した状態を示す模式図である。

【図4】口元座標（ｘ_０，ｙ_０，ｚ_０）とネックバンド型デバイスとの位置関係を示す模式図である。

【図5】マイクロフォンが２つ設けられた場合に、マイク座標（ｘ_１，ｙ_１，ｚ_１）とマイク座標（ｘ_２，ｙ_２，ｚ_２）から口元座標（ｘ_０，ｙ_０，ｚ_０）および口元座標と各マイク座標の距離ｄ_１，ｄ_２を求める手法を説明するための模式図である。

【図6】マイクロフォンが３つ以上（ｎ個）設けられた場合に、マイク座標（ｘ_ｉ，ｙ_ｉ，ｚ_ｉ）から口元座標（ｘ_０，ｙ_０，ｚ_０）および口元座標と各マイク座標の距離ｄ_ｉを求める手法を説明するための模式図である。

【図7】マイクロフォンが点対称の位置にある場合を示す模式図である。

【図8】ネックバンド型デバイスにおける音源位置を推定する音源位置推定装置１００の構成を示す模式図である。

【図9】ビームフォーミング演算部の構成を示す模式図である。

【図10】角度θと直径ｄを所望の値にするための構成を示す模式図である。

【図11】角度θと直径ｄを所望の値にするための構成を示す模式図である。

【図12】角度θと直径ｄを所望の値にするための構成を示す模式図である。

【図13】角度θと直径ｄを所望の値にするための構成を示す模式図である。

【発明を実施するための形態】

【0012】

以下に添付図面を参照しながら、本開示の好適な実施の形態について詳細に説明する。なお、本明細書及び図面において、実質的に同一の機能構成を有する構成要素については、同一の符号を付することにより重複説明を省略する。

【0013】

なお、説明は以下の順序で行うものとする。
１．本実施形態に係るネックバンドの外観
２．ネックバンド型デバイスの装着ずれ
３．音源位置を特定するための演算
４．最適化計算について
５．音源位置推定装置の構成例
６．ビームフォーミング処理について
７．ネックバンド型デバイスの傾きと直径の設定

【0014】

１．本実施形態に係るネックバンド型デバイスの外観
まず、図１を参照して、本開示の一実施形態に係るネックバンド型デバイス（リング状デバイス）１０００の概略構成について説明する。図１に示すように、本実施形態に係るネックバンド型デバイス１０００は、円形のリング状とされ、開口部１００２が設けられている。ユーザは、開口部１００２を開くことで、ネックバンド型デバイス１０００を首に装着することができる。

【0015】

ネックバンド型デバイス１０００は、マイクロフォン１０１０、スピーカ１０２０、カメラ１０３０、ＧＰＳ１０４０を備える。ネックバンド型デバイス１０００は、ユーザの声の音声情報を音声認識により取得し、音声情報に応じて、スピーカ１０２０から音を発することでユーザに情報を提供する。また、ネックバンド型デバイス１０００は、カメラ１０３０による撮像により画像情報を取得することができる。また、ネックバンド型デバイス１０００は、ＧＰＳ１０４０で取得したユーザの位置情報に応じて、推奨する場所、店舗等の情報をユーザに伝えることもできる。

【0016】

以上のようなネックバンド型デバイス１０００の機能は、基本的にユーザが発した声による指令に基づいて、ユーザがネックバンド型デバイス１０００の操作を行うことなく、ハンズフリーによって実現される。このため、マイクロフォン１０１０がユーザの声を正確に認識するように構成されている。

【0017】

２．ネックバンド型デバイスの装着ずれ
ネックバンド型デバイス１０００のようにユーザの体に固定されていないデバイスでは、基準とする装着状態からずれた状態となることがある（このようなずれを「装着ずれ」と称することとする）。図２及び図３は、装着ずれを説明するための模式図である。図２は、通常装着時を示しており、開口部１００２の位置がユーザの正面を向いており、正しい装着状態を示している。一方、図３は、図２に対してネックバンド型デバイス１０００の開口部１００２が手前側に回転し、装着ずれが発生した状態を示している。

【0018】

ネックバンド型デバイス１０００に複数のマイクロフォン１０１０を搭載することにより、ユーザの音声を強調する信号処理を行うことができるが、装着ずれがある場合には、ユーザの口元から各マイクロフォン１０１０までの伝達特性を逐次推定するような適応的な信号処理が必要となる。このため、本実施形態では、ネックバンド型デバイス１０００に装着ずれがある場合においても、高性能な信号処理を可能とする。以下、詳細に説明する。

【0019】

３．音源位置を特定するための演算
図１に示したように、ネックバンド型デバイス１０００の形状は円Ｃに倣った略円形状である。このため、ネックバンド型デバイス１０００の筐体に搭載された複数のマイクロフォン１０１０も円周上に存在する。これにより、図３に示した装着ずれは、ネックバンド型デバイス１０００が張る２次元平面Ｐ（以降、回転面と呼ぶ）内における回転運動であり、その回転軸Ｓはネックバンド型デバイス１０００が作る円Ｃの中心を通ると考えてよい。

【0020】

図２及び図３に示すように、本実施形態に係るネックバンド型デバイス１０００では、装着時に回転面と水平面のなす角度θとネックバンド型デバイス１０００（円Ｃ）の直径ｄを適切に選ぶことにより、ユーザの口元から回転面へ垂線Ｖを下ろした場合に、ネックバンド型デバイス１０００が作る円Ｃに交わるようにする。このような幾何学的関係を作ることで、装着ずれの程度に関わらず、垂線Ｖと円Ｃは交わることになる。角度θと直径ｄの具体的な設定方法、調整方法については、後述する。

【0021】

このような幾何学的関係において、ユーザの口元座標（ｘ_０，ｙ_０，ｚ_０）は、ネックバンド型デバイス１０００の円Ｃを含む円柱の側面上の点であると数学的に表現することができる。図４は、口元座標（ｘ_０，ｙ_０，ｚ_０）とネックバンド型デバイス１０００との位置関係を示す模式図である。図４において、座標軸はネックバンド型デバイス１０００に固定して定義している。また、図４では、マイクロフォン１０１０が３つ設けられた構成を示している。

【0022】

図４に示すように、ユーザの口元座標（ｘ_０，ｙ_０，ｚ_０）は、円Ｃを含む円柱の側面上の点であると考えることができるため、以下の式（１）が成立する。

【0023】

【数1】

・・・（１）

【0024】

式（１）を用いることで、既知のマイクロフォン１０１０の座標（マイク座標）から口元座標（ｘ_０，ｙ_０，ｚ_０）を求めることができる。図５は、マイクロフォン１０１０が２つ設けられた場合に、マイク座標（ｘ_１，ｙ_１，ｚ_１）とマイク座標（ｘ_２，ｙ_２，ｚ_２）から口元座標（ｘ_０，ｙ_０，ｚ_０）を求める手法を説明するための模式図である。

【0025】

ここで、時刻ｔにおけるユーザの音声信号をｓ（ｔ）とする。ｓ（ｔ）のフーリエ変換をｓ（ω）と表す。ただし、ω=２πｆは角周波数、ｆは周波数である。以降では、ある狭帯域信号に限定し、ｓ（ω）を単にｓと表すことにし、周波数スペクトルと呼ぶ。図５において、口元座標（ｘ_０，ｙ_０，ｚ_０）と各マイク座標の距離をｄ_１，ｄ_２とすると、各マイクロフォン１０１０で観測された周波数スペクトルｐ_１，ｐ_２は、以下の式（２）、式（３）で表すことができる。ただし、ｊは虚数単位、ｅｘｐ（ａ）はａの指数関数を表す。

【0026】

【数2】

・・・（２），（３）

【0027】

また、ｐ_１≠ｐ_２であれば、振幅比と位相差の関係から、以下の式（４）、式（５）により距離ｄ_１，ｄ_２が求まる。

【0028】

【数3】

・・・（４），（５）

【0029】

一方、幾何学的な関係から以下の式（６）、式（７）が成立する。
ｄ_１^２＝（ｘ_１−ｘ_０）^２＋（ｙ_１−ｙ_０）^２＋ｚ_０^２・・・（６）
ｄ_２^２＝（ｘ_２−ｘ_０）^２＋（ｙ_２−ｙ_０）^２＋ｚ_０^２・・・（７）

【0030】

式（６）、式（７）に式（４）、式（５）から求まる距離ｄ_１，ｄ_２を代入し、式（１）を加えて連立方程式を解くことができる。式（６）、式（７）は球面を表す方程式であり、式（１）は円柱面を表す方程式であるため、口元座標（ｘ_０，ｙ_０，ｚ_０）はそれらの交点として得ることができる。

【0031】

解の算出には解析的な方法を用いても良いし、ニュートン法などの数値的な方法を用いても良い。交点（解）は２点存在する場合があるため、その場合にはｙ_０＞０として１点に決定する。すなわち、装着ずれは±９０度以内と仮定する。

【0032】

以上のように、式（６）、式（７）のみでは口元座標を算出することはできないが、本実施形態のネックバンド型デバイス１０００に特有な式（１）の関係を用いることにより、通常では算出不可能な口元座標を算出できる。また、口元座標のｚ_０が一度既知になると、ｚ_０は装着ずれに応じて変化することはないため、以降は３つの方程式（式（１）、式（６）、式（７））に対して未知数が２つになり、最適化によりｘ_０，ｙ_０を算出することが可能となる。なお、最適化計算の手法については、後で詳細に説明する。このように、ネックバンド型デバイス１０００が存在する平面と垂直な軸に射影した口元座標を時間的に一定の値として扱うことで、推定パラメータ数を減らして最適化計算を行うことができる。そして、算出したｘ_０，ｙ_０から距離ｄ_１，ｄ_２を再計算することにより、距離ｄ_１，ｄ_２をより高精度に算出することが可能である。これにより、例えばビームフォーミングなどの性能を大幅に向上することができる。また、口元座標に基づいてネックバンド型デバイス１０００側で装着ずれの有無が分かるため、スピーカ１０２０から音声を発する等の手法によりユーザに装着ずれが発生していることを警告できる。

【0033】

図６は、マイクロフォン１０１０が３つ以上（ｎ個）設けられた場合に、マイク座標（ｘ_ｉ，ｙ_ｉ，ｚ_ｉ）から口元座標（ｘ_０，ｙ_０，ｚ_０）を求める手法を説明するための模式図である。なお、ｉ＝１，．．．，ｎとする。

【0034】

図６において、口元座標（ｘ_０，ｙ_０，ｚ_０）と各マイク座標の距離をｄ_ｉとすると、各マイクロフォン１０１０で観測された周波数スペクトルｐ_ｉは、以下の式（８）で表すことができる。

【0035】

【数4】

・・・（８）

【0036】

また、振幅比と位相差の関係から、以下の式（９）、式（１０）が得られる。この際、求めたいｄ_ｉの数よりも式の数の方が多いため、線形最適化によりｄ_ｉを得ることができる。

【0037】

【数5】

・・・（９），（１０）

【0038】

また、マイクロフォン１０１０が２つの場合と同様に、幾何学的関係から以下の式（１１）が成り立つ。
ｄ_ｉ^２＝（ｘ_１−ｘ_ｉ）^２＋（ｙ_１−ｙ_ｉ）^２＋ｚ_０^２・・・（１１）

【0039】

以上により、未知数はｘ_０，ｙ_０，ｚ_０の３つであり、ｎ＋１本の方程式が得られるため、非線形最適化により口元座標（ｘ_０，ｙ_０，ｚ_０）を決定できる。また、得られた口元座標（ｘ０，ｙ０，ｚ０）の値を用いて距離ｄ_ｉを算出することにより、より高精度な距離ｄ_ｉを得ることができる。

【0040】

最適化計算では、式（９）、式（１０）において、以下のような誤差λｉ，μｉが含まれるものとする（但し、ｉ＝１の場合を除く）。

【0041】

【数6】

・・・（９）’，（１０）’

【0042】

そして、最適化計算では、式（９）’、式（１０）’において、以下の二乗誤差を最小にするｄ_ｉ（ｉ＝１，・・・，ｎ）を求める。

【0043】

【数7】

【0044】

最適化計算において、方程式の数が１つ増えることにより、距離ｄ_ｉの精度が向上する。これにより、マイクロフォン１０１０から口元への伝達特性（ステアリングベクトル）が正確に得られることになり、ビームフォーミング等の信号処理の性能が向上する。特にｎ≧３の場合には、ｎ＝３では未知数の数と方程式の数が一致するため、最適化計算を行うことができないが、本実施形態に係る方法により最適化計算を行うことで精度の向上が期待できる。また、上記と同様、ｚ_０が既知になると、未知数の数が減ることにより、より精度の向上が期待できる。

【0045】

図７は、マイクロフォン１０１０が点対称の位置にある場合を示す模式図である。２つのマイクロフォン１０１０から口元座標（ｘ_０，ｙ_０，ｚ_０）までの距離をｌ_１，ｌ_２とすると、タレスの定理により以下の式（１２）の関係が常に成立する。
ｌ_１^２＋ｌ_２^２＝ｄ^２・・・（１２）

【0046】

口元座標（ｘ_０，ｙ_０，ｚ_０）と各マイク座標の距離をｄ_１，ｄ_２とすると、式（１２）は以下の式（１５）のように変形できる。
ｄ_１^２＋ｄ_２^２＝ｄ^２＋２ｚ_０^２・・・（１３）

【0047】

式（１３）が常に成り立つとして、式（１）の代わりに用いることで、口元座標（ｘ_０，ｙ_０，ｚ_０）を求めることができる。

【0048】

４．最適化計算について
本実施形態における最適化計算では、式（１）の扱い方により２つの方法が考えられる。ここでは一般化のため、任意の位置に３つ以上のマイクロフォン１０１０が配置されている場合を考える。

【0049】

第１の方法は、制約付き最適化である。この方法では、ネックバンド型デバイス１０００の形状が充分に理想的であり、式（１）が誤差なく成立すると考えられる場合に、式（１）を制約条件として以下の式（１６）の二乗誤差を最小にする（ｘ_０，ｙ_０，ｚ_０）を求める。

【0050】

【数8】

・・・（１６）

【0051】

第２の方法は、制約無し最適化であって、ネックバンド型デバイス１０００の形状が条件を充分には満たしていない場合に、式（１）にも誤差が含まれると考え、以下の式（１７）、式（１８）を設定する。

【0052】

【数9】

・・・（１９），（２０）

【0053】

そして、以下の式（１９）の二乗誤差を最小にする（ｘ_０，ｙ_０，ｚ_０）を求める。

【0054】

【数10】

・・・（１９）

【0055】

５．音源位置推定装置の構成例
図８は、上述した演算によりネックバンド型デバイス１０００における音源位置を推定する音源位置推定装置１００の構成を示す模式図である。図８に示すように、音源位置推定装置１００は、スペクトル取得部１０２、音源距離演算部１０４、音源位置演算部１０６、を有して構成されている。音源位置演算部１０６によって算出された距離ｄｉは、ビームフォーミング演算部１０８へ送られる。スペクトル取得部１０２は、マイクロフォン１０１０で観測された信号をＡＤ変換し、帯域分割処理を行うことにより、周波数スペクトルｐｉを取得する。音源距離演算部１０４は、上述した式（４）、式（５）（または式（９）、式（１０））に基づいて、口元座標とマイク座標との距離ｄ_ｉを求める。音源位置演算部１０６は、上述した式（１）、式（６）、式（７）（または式（１）、式（１１））に基づいて、口元座標（ｘ_０，ｙ_０，ｚ_０）を演算する。また、音源位置演算部１０６は、求めた口元座標（ｘ_０，ｙ_０，ｚ_０）とマイク座標に基づいて、距離ｄ_ｉを再計算し、より高精度に距離ｄ_ｉを算出する。ビームフォーミング演算部１０８は、高精度に再計算された距離ｄｉに基づいて、ビームフォーミング処理を行う。図８に示す音源位置推定装置１００は、ネックバンド型デバイス１０００の内部に設けられるが、音源位置推定装置１００を外部機器（クラウドコンピュータ等）に設け、ネックバンド型デバイス１０００から外部機器へ必要なパラメータを送信し、外部機器側で演算された音源位置をネックバンド型デバイス１０００が受信しても良い。図８に示す音源位置推定装置１００の各構成要素は、回路（ハードウェア）、またはＣＰＵなどの中央演算処理装置とこれを機能させるためのプログラム（ソフトウェア）から構成されることができる。また、そのプログラムは、メモリ等の記録媒体に格納されることができる。

【0056】

６．ビームフォーミング処理について
図９は、ビームフォーミング演算部１０８の構成を示す模式図である。ビームフォーミング演算部１０８は、スペクトル取得部１０８ａ、ビームフォーミング処理部１０８ｂ、ビームフォーミング係数算出部１０８ｃを有して構成される。なお、スペクトル取得部１０８ａは、スペクトル取得部１０２と同一の機能を有する構成要素である。

【0057】

上述のように、口元座標（ｘ_０，ｙ_０，ｚ_０）と各マイクロフォン１０１０のマイク座標（ｘ_ｉ，ｙ_ｉ，ｚ_ｉ）との距離ｄ_ｉを精度良く求めることができるため、以下に説明するように、ビームフォーミング演算部１０８におけるビームフォーミング処理の性能向上を達成できる。先ず、得られた距離ｄ_ｉを用いて、口元から各マイクロフォン１０１０までの伝達関数を並べた以下の式（２０）のようなベクトル（ステアリングベクトル）を作成する。但し、式（２０）において、ｃは音速、ｎはマイクロフォン１０１０の数である。また、上付きのＴは転置を表す。

【0058】

【数11】

・・・（２０）

【0059】

各マイクロフォン１０１０での周波数スペクトルを並べたベクトルｐ（式（２１）参照）に対してフィルタｗを乗じて目的信号以外の信号を抑圧する場合、目的音源は変化しないという拘束の下で出力パワーを最小にする以下の最適化問題の解として、以下の式（２２）からフィルタｗを得ることができる。

【0060】

【数12】

・・・（２２）

【0061】

但し、Ｅ［α］はαの期待値である、また上付きのＨは共役転置を表す。この最適化問題の解はｐの共分散行列であるＲ（式（２３）参照）を用いて以下の式（２４）ように表すことができる。

【0062】

【数13】

・・・（２３），（２４）

【0063】

このようにして得られたフィルタｗを用いて、以下の式（２５）からｑを得ることでビームフォーミング処理を実現する。

【0064】

【数14】

・・・（２５）

【0065】

図９に示す構成において、スペクトル取得部１０８ａは、マイクロフォン１０１０で観測された信号をＡＤ変換し、帯域分割処理を行うことにより、周波数スペクトルｐｉを取得する。スペクトル取得部１０８ａは、図８のスペクトル取得部１０２と同様の機能を有するため、両者は一体に構成されていて良い。ビームフォーミング処理部１０８ｂは、式（２５）の演算処理を行う。また、ビームフォーミング係数算出部では、式（２３）、式（２４）によりフィルタｗを算出する処理を行う。

【0066】

以上のように本実施形態によれば、ネックバンド型デバイス１０００において音源位置（口元座標（ｘ_０，ｙ_０，ｚ_０））を算出することが可能となり、装着ずれがある状況下における各種信号処理（特にステアリングベクトルを用いたビームフォーミング）の性能を向上させることができる。また、マイクロフォン１０１０が２つの場合であっても、音源位置（口元座標）を算出することができる。更に、装着ずれをより高精度に検出してユーザへ通知することも可能となる。

【0067】

７．ネックバンド型デバイスの傾きと直径の調整
次に、ネックバンド型デバイス１０００の角度θと直径ｄの設定について説明する。上述した演算によりユーザの口元座標（ｘ_０，ｙ_０，ｚ_０）を算出する際には、角度θと直径ｄを所定値に定めておくことが望ましい。図１０〜図１３は、角度θと直径ｄを所望の値にするための構成を示す模式図である。ネックバンド型デバイス１０００の内周面には、図１０に示す領域Ａにおいて、図１１に示すような傾斜面（傾き調整部）１００４が設けられている。傾斜面１００４は、ネックバンド型デバイス１０００がユーザの首に装着された場合に、首と接触する。このため、傾斜面１００４の角度を最適な角度に設定することで、角度θを所望の値に設定することができる。好適には、ネックバンド型デバイス１０００の開口部１００２側に重みを持たせておくことにより、傾斜面１００４を確実にユーザの首に接触させることができる。傾斜面１００４を備えるアタッチメントをネックバンド型デバイス１０００に装着できるようにしても良い。

【0068】

また、図１０に示す領域Ｂにおいて、角度θを設定する部材を設けても良い。ネックバンド型デバイス１０００の開口部１００２の近傍に部材を設け、ネックバンド型デバイス１０００の前方（開口部１００２側）に重みをもたせておくことにより、装着者の体表（鎖骨周辺）とネックバンド型デバイス１０００の筐体のすき間を埋めて角度を固定することもできる。図１２は、ネックバンド型デバイス１０００の開口部１００２の近傍に突起部（傾き調整部）１００６を設けた例を示す模式図である。この構成では、ネックバンド型デバイス１０００がユーザの首に装着された場合に、突起部１００６の先端が鎖骨の近傍に当接する。このため、突起部１００６の長さを最適な長さに設定することで、角度θを所望の値に設定することができる。また、図１３は、図１２の突起部１００６の代わりに、前方に行くにつれて太さが増す傾斜部（傾き調整部）１００８を設けた例を示す模式図である。図１３の構成例において、傾斜部１００８の鎖骨側への長さを最適な長さに設定することで、角度θを所望の値に設定することができる。突起部１００６、または傾斜部１００８を備えるアタッチメントをネックバンド型デバイス１０００に装着できるようにしても良い。

【0069】

図１０に示すように、ネックバンド型デバイス１０００には、スライダー（直径調整部）１１００が設けられており、後側筐体１１１０に対して前部筐体１１２０がスライド可能とされている。これにより、後側筐体１１１０に対して前部筐体１１２０がスライドさせることで、ネックバンド型デバイス１０００の直径ｄを所望の値に設定することができる。なお、異なる直径ｄのネックバンド型デバイス１０００を複数用意し、その中から所望の直径ｄを有するネックバンド型デバイス１０００を選択するなどの手法を用いる場合は、ネックバンド型デバイス１０００にスライダー１１００を設けなくても良い。

【0070】

なお、上述した傾斜面１００４、突起部１００６、傾斜部１００８、スライダー１１００による角度θ、直径ｄの設定は、平均的なユーザの身体（首回り）の寸法に応じて予め設定されていても良いし、傾斜面１００４、突起部１００６、傾斜部１００８、スライダー１１００を事後的に調整することで、個々のユーザに応じて角度θ、直径ｄを調整するものであっても良い。

【0071】

以上説明したように本実施形態によれば、ネックバンド型デバイス１０００における音源の位置（ユーザの口元の位置）を高精度に推定することができる。従って、音源の位置に基づいてビームフォーミング処理などの各種処理を最適に行うことが可能となる。

【0072】

以上、添付図面を参照しながら本開示の好適な実施形態について詳細に説明したが、本開示の技術的範囲はかかる例に限定されない。本開示の技術分野における通常の知識を有する者であれば、特許請求の範囲に記載された技術的思想の範疇内において、各種の変更例または修正例に想到し得ることは明らかであり、これらについても、当然に本開示の技術的範囲に属するものと了解される。

【0073】

また、本明細書に記載された効果は、あくまで説明的または例示的なものであって限定的ではない。つまり、本開示に係る技術は、上記の効果とともに、または上記の効果に代えて、本明細書の記載から当業者には明らかな他の効果を奏しうる。

【0074】

なお、以下のような構成も本開示の技術的範囲に属する。
（１）リング状のウェアラブルデバイスに設けられた複数のマイクロフォンで得られる音声に基づいて、音源の周波数スペクトルを取得するスペクトル取得部と、
前記周波数スペクトルに基づいて複数の前記マイクロフォンから前記音源までのそれぞれの距離を演算する距離演算部と、
前記リング状のウェアラブルデバイスを円に近似して、前記リング状のウェアラブルデバイスを含む円柱面に前記音源が位置するものとして、前記それぞれの距離を半径とする球面と前記円柱面との交点を求めることで前記音源の位置を演算する音源位置演算部と、
を備える、音源位置推定装置。
（２）前記音源位置演算部は、前記音源の位置を演算した後、前記音源の位置を再演算する際には、前記円柱面における前記円から前記音源までの距離を固定値として最適化演算を行うことで前記音源の位置を再演算する、前記（１）に記載の音源位置推定装置。
（３）前記マイクロフォンは２つ設けられ、
音源位置演算部は、前記それぞれの距離を半径とする球面を表す２つの式と前記円柱面を表す式を連立して解くことで、前記球面と前記円柱面との交点を求める、前記（１）又は（２）に記載の音源位置推定装置。
（４）前記マイクロフォンは３つ以上設けられ、
前記スペクトル取得部は、線形最適化により前記周波数スペクトルを取得する、前記（１）又は（２）に記載の音源位置推定装置。
（５）前記マイクロフォンは３つ以上設けられ、
音源位置演算部は、前記それぞれの距離を半径とする球面を表す式と、前記円柱面を表す式とに基づいて、非線形最適化により前記音源の位置を演算する、（１）又は（２）に記載の音源位置推定装置。
（６）前記音源位置演算部は、前記円柱面を表す式を制約条件として、非線形化最適化により前記音源の位置を演算する、前記（５）に記載の音源位置推定装置。
（７）前記音源位置演算部は、前記リング状のウェアラブルデバイスを前記円に近似したことにより前記円柱面を表す式に含まれる誤差を考慮して、非線形化最適化により前記音源の位置を演算する、前記（５）に記載の音源位置推定装置。
（８）前記マイクロフォンは前記円の中心に対して点対称の位置に設けられ、
前記音源位置演算部は、前記円柱面を表す式の代わりに、前記それぞれの距離と前記円の直径との関係を示す式を用いて前記球面と前記円柱面との交点を求める、前記（３）に記載の音源位置推定装置。
（９）前記音源位置演算部は、前記音源の位置を演算した後、演算した前記音源の位置と複数の前記マイクロフォンのそれぞれの位置とに基づいて、複数の前記マイクロフォンから前記音源までのそれぞれの距離を再計算する、前記（１）〜（８）のいずれかに記載の音源位置推定装置。
（１０）前記音源位置演算部により再計算された前記音源までのそれぞれの距離に基づいて、ビームフォーミング処理が行われる、前記（９）に記載の音源位置推定装置。
（１１）前記スペクトル取得部は、複数の前記マイクロフォンで観測された信号をＡＤ変換し、帯域分割処理を行うことにより、前記周波数スペクトルを取得する、前記（１）〜（１０）のいずれかに記載の音源位置推定装置。
（１２）複数のマイクロフォンが設けられたリング状の筐体と、
複数の前記マイクロフォンで得られる音声に基づいて、音源の周波数スペクトルを取得するスペクトル取得部と、前記周波数スペクトルに基づいて複数の前記マイクロフォンから前記音源までのそれぞれの距離を演算する距離演算部と、前記筐体を円に近似して、前記筐体を含む円柱面に前記音源が位置するものとして、前記それぞれの距離を半径とする球面と前記円柱面との交点を求めることで前記音源の位置を演算する音源位置演算部と、を備える、音源位置推定装置と、
を備える、ウェアラブルデバイス。
（１３）前記円柱面に前記音源が位置するように、身体の装着部位に対する前記筐体の傾きを調整する傾き調整部を備える、前記（１２）に記載のウェアラブルデバイス。
（１４）前記円柱面に前記音源が位置するように、前記筐体におけるリングの直径を調整する直径調整部を備える、前記（１２）又は（１３）に記載のウェアラブルデバイス。

【符号の説明】

【0075】

１００音源位置推定装置
１０２スペクトル取得部
１０４音源距離演算部
１０６音源位置演算部
１００４，１００８傾斜部
１００６突起部
１００８スライダー

【図1】