(19)【発行国】日本国特許庁(JP)
(12)【公報種別】特許公報(B2)
(11)【特許番号】6389080
(24)【登録日】2018年8月24日
(45)【発行日】2018年9月12日
(54)【発明の名称】ボイスキャンセリング装置
(51)【国際特許分類】
G10K 11/178 20060101AFI20180903BHJP
H04R 3/00 20060101ALI20180903BHJP
【FI】
G10K11/178 100
H04R3/00 310
H04R3/00 320
【請求項の数】7
【全頁数】13
(21)【出願番号】特願2014-159918(P2014-159918)
(22)【出願日】2014年8月5日
(65)【公開番号】特開2015-187694(P2015-187694A)
(43)【公開日】2015年10月29日
【審査請求日】2016年12月27日
(31)【優先権主張番号】特願2014-52302(P2014-52302)
(32)【優先日】2014年3月14日
(33)【優先権主張国】JP
(73)【特許権者】
【識別番号】000208891
【氏名又は名称】KDDI株式会社
(74)【代理人】
【識別番号】100135068
【弁理士】
【氏名又は名称】早原 茂樹
(72)【発明者】
【氏名】堀内 俊治
【審査官】
須藤 竜也
(56)【参考文献】
【文献】
特開2005−250389(JP,A)
【文献】
特開平06−113002(JP,A)
【文献】
特開平10−020867(JP,A)
【文献】
特開2008−250270(JP,A)
【文献】
特開2010−173605(JP,A)
【文献】
特開2007−226036(JP,A)
(58)【調査した分野】(Int.Cl.,DB名)
G10K 11/178
H04R 3/00
(57)【特許請求の範囲】
【請求項1】
人の口の周辺に配置され、発話音声を抑制するボイスキャンセリング装置であって、
発声方向口側に向かって、発声された第1の音声信号を入力するマイクと、
発声方向外側に向かって前記マイクとの間の距離dに配置され、第1の音声信号に基づく第2の音声信号を出力するものであり、口を中心として弧状に設置された1つ以上のN個のスピーカと、
前記マイクから入力された第1の音声信号に音声伝達特性Wを畳み込むことによって、前記スピーカへ出力すべき第2の音声信号を生成し、第1の音声信号と第2の音声信号との間の入出力遅延時間Tに音波速度Vを乗算した距離Dが、前記距離dよりも短くなる(距離d>距離D)ように、遅延を生じる帯域フィルタを備えることなく、当該入出力遅延時間Tを達成するべく高サンプリングレートで処理する信号処理手段と
を有し、
前記音声伝達特性Wは、口から放射方向外側に離れた任意面の複数のM個の測定マイクを用いて、M=Nの関係にある場合、当該任意面で第1の音声信号が逆位相化されるように、以下の式によって算出される
W=−G−G0
G−任意面の測定マイクが、当該ボイスキャンセリング装置のスピーカから
出力された音声信号を収音した際の音声伝達特性の逆行列
G0任意面の測定マイクが、人の口から発声された音声信号を収音した際の
音声伝達特性の転置行列
ことを特徴とするボイスキャンセリング装置。
【請求項2】
人の口の周辺に配置され、発話音声を抑制するボイスキャンセリング装置であって、
発声方向口側に向かって、発声された第1の音声信号を入力するマイクと、
発声方向外側に向かって前記マイクとの間の距離dに配置され、第1の音声信号に基づく第2の音声信号を出力するものであり、口を中心として弧状に設置された1つ以上のN個のスピーカと、
前記マイクから入力された第1の音声信号に音声伝達特性Wを畳み込むことによって、前記スピーカへ出力すべき第2の音声信号を生成し、第1の音声信号と第2の音声信号との間の入出力遅延時間Tに音波速度Vを乗算した距離Dが、前記距離dよりも短くなる(距離d>距離D)ように、遅延を生じる帯域フィルタを備えることなく、当該入出力遅延時間Tを達成するべく高サンプリングレートで処理する信号処理手段と
を有し、
前記音声伝達特性Wは、口から放射方向外側に離れた任意面の複数のM個の測定マイクを用いて、M>Nの関係にある場合、当該任意面で第1の音声信号が逆位相化されるように、以下の式によって算出される
W=−G+G0
G+任意面の測定マイクが、当該ボイスキャンセリング装置のスピーカから
出力された音声信号を収音した際の音声伝達特性の
Moore-Penroseの疑似逆行列
G0任意面の測定マイクが、人の口から発声された音声信号を収音した際の
音声伝達特性の転置行列
ことを特徴とするボイスキャンセリング装置。
【請求項3】
有線を介して携帯端末に接続可能な音声信号通信手段を更に有し、
前記マイクによって入力された第1の言語の音声信号を、前記携帯端末へ送信し、
前記携帯端末から受信した第2の言語の音声信号を、前記信号処理手段に加えて、
口から発声された第1の言語の音声信号が抑制されると共に、第1の言語の音声信号の通訳となる第2の言語の音声信号が前記スピーカから発声される
ことを特徴とする請求項1又は2のいずれか1項に記載のボイスキャンセリング装置。
【請求項4】
人の頭部(後頭部又は耳部)に着脱可能なヘッドセットについて、人の口の前近傍に位置するように設置されている
ことを特徴とする請求項1から3のいずれか1項に記載のボイスキャンセリング装置。
【請求項5】
口が近傍に位置するマイクを有する携帯端末について、人の口の前近傍に前記スピーカが位置するように設置されている
ことを特徴とする請求項1から3のいずれか1項に記載のボイスキャンセリング装置。
【請求項6】
手袋について、手の甲側に前記スピーカが配置され、手の平側に前記マイクが配置されるように設置されており、手の平で口の前を覆った際に作用させる
ことを特徴とする請求項1から3のいずれか1項に記載のボイスキャンセリング装置。
【請求項7】
人の口の前を覆うマスクについて、表面に前記スピーカが配置され、口側の裏面に前記マイクが配置されるように設置されている
ことを特徴とする請求項1から3のいずれか1項に記載のボイスキャンセリング装置。
【発明の詳細な説明】
【技術分野】
【0001】
本発明は、ユーザの発話音声に対する音声信号処理の技術に関する。
【背景技術】
【0002】
近年、ディジタル信号処理技術の発展に伴って、多様な用途に音声信号処理技術の需要が高まっている。商用ベースのサラウンドオーディオ機器にあっても、「3次元音声信号処理」が用いられてきている。3次元音声信号処理とは、一般的に、リスニングルームやシアターにおけるエンターテイメントの用途に適用したものであるが、ヒューマンインターフェースの用途にも適用が検討されてきている。具体的には、テレコミュニケーション、バーチャルリアリティ、視覚障害又は聴覚障害のある人の支援技術などに適用されてきている。
【0003】
3次元音声信号処理の再生方式によれば、以下の2つの方式に分類される。
周辺環境に発声する「スピーカ方式」
耳の周辺で発声する「ヘッドホン方式」
【0004】
「スピーカ方式」によれば、更に以下の2つの方式に分類される。
複数のスピーカを、聴取者を取り囲んで離散配置したステレオフォニック再生方式
複数のスピーカを、直線状又は円弧状に密集配置したスピーカアレイ再生方式
スピーカアレイ再生方式よれば、複数のスピーカそれぞれに与える音声信号の振幅や位相を適宜調整することによって、任意の波面を生成することができる(例えば特許文献1及び2参照)。具体的には、音場に対して、指向性を持たせたり、所望位置の音圧を高めたり又は低めたりすることができる。
【0005】
「ヘッドフォン方式」によれば、ユーザは情報機器を常に携帯し、屋内/屋外を問わず様々な場所で、音楽を聴くことができる。音楽を聴く場合、ヘッドフォン方式についてノイズキャンセラやノイズサプレッサのようなヒューマンインターフェース技術を適用することができる。
【0006】
携帯型情報機器が、スマートフォンのような携帯電話機である場合、相手方と電話で会話するために、ユーザの発話音声をマイクで収音する。但し、街頭、車内、駅のプラットホームのような雑音環境下では、ハンドセットやヘッドセットなどの口元に近接したマイクを用いても、ユーザの発話音声に、周辺雑音が妨害音として混入してしまうことがある。そのために、マイクにノイズキャンセラやノイズサプレッサの技術を適用した場合、以下の2つの方式に分類できる。
単一マイク方式 :雑音抑圧性能が低い
複数マイク方式(マイクアレイ):雑音抑圧性能が高い
【0007】
「マイクアレイ」とは、空間的に配置された複数のマイクそれぞれの受音信号について、マイクとその音源の空間的な位置関係に依存した時間差や振幅差を記録する(例えば非特許文献1参照)。この技術によれば、これらの時間差や振幅差の統計情報を用いて、目的音のみを選択的に収音し、又は、目的音と妨害音を分離することができる。
【0008】
他の実施形態として、ウェアラブル型の音声入出力装置も提案されている(例えば特許文献3参照)。
【先行技術文献】
【特許文献】
【0009】
【特許文献1】特開2009−231980号公報
【特許文献2】特開2009−200575号公報
【特許文献3】特表2001−523080号公報
【非特許文献】
【0010】
【非特許文献1】青木 真理子、古家 賢一、「騒音下音声強調における空間情報の利用について」、電子情報通信学会技術研究報告. EA, 応用音声 102(33), 23-30, 2002-04-19、[online]、[平成26年6月30日検索]、インターネット<URL:http://ci.nii.ac.jp/naid/110004023617>
【0011】
【非特許文献2】木下慶介、吉岡拓也、中谷智弘、「音声のブラインド残響除去:最新の研究動向」、IEICE Fundamentals Review vol.4 No.4、[online]、[平成26年6月30日検索]、インターネット<http://w2.gakkai-web.net/gakkai/ieice/vol4no4pdf/vol4no4_301.pdf>
【発明の概要】
【発明が解決しようとする課題】
【0012】
ユーザの発話音声は、発話した瞬間から、その音波が3次元空間に放射される。そのために、ユーザの発話音声は、通常、周囲に漏れ、他人に聞き取られる可能性がある。
【0013】
しかしながら、スマートフォンを用いて電話で会話しているユーザは、その会話内容を、周囲の他人に聞き取られたくないと考える。一方で、他人も、そのユーザが電話で会話している音声を非常に迷惑に感じる。そのために、電車両内や喫茶店内で、携帯電話による音声通話を禁止している場合も多い。
【0014】
これに対し、本願の発明者らは、ユーザ自身の発話音声が周囲に漏れず、他人に聞き取れない程度に抑圧することはできないか?と考えた。これによって、ユーザは、周辺環境を気にすることなく、スマートフォンを用いて電話で音声会話をすることができる。
【0015】
そこで、本発明は、ユーザ自身の発話音声が周囲に漏れず、他人に聞き取れない程度に抑圧することができるボイスキャンセリング装置を提供することを目的とする。
【課題を解決するための手段】
【0019】
本発明
によれば、人の口の周辺に配置され、発話音声を抑制するボイスキャンセリング装置であって、
発声方向口側に向かって、発声された第1の音声信号を入力するマイクと、
発声方向外側に向かってマイクとの間の距離dに配置され、第1の音声信号に基づく第2の音声信号を出力するものであり、口を中心として弧状に設置された1つ以上のN個のスピーカと、
マイクから入力された第1の音声信号に音声伝達特性Wを畳み込むことによって、スピーカへ出力すべき第2の音声信号を生成し、第1の音声信号と第2の音声信号との間の入出力遅延時間Tに音波速度Vを乗算した距離Dが、距離dよりも短くなる(距離d>距離D)ように、遅延を生じる帯域フィルタを備えることなく、当該入出力遅延時間Tを達成するべく高サンプリングレートで処理する信号処理手段と
を有し、
音声伝達特性Wは、口から放射方向外側に離れた任意面の複数のM個の測定マイクを用いて、M=Nの関係にある場合、当該任意面で第1の音声信号が逆位相化されるように、以下の式によって算出される
W=−G−G0
G−任意面の測定マイクが、当該ボイスキャンセリング装置のスピーカから
出力された音声信号を収音した際の音声伝達特性の逆行列
G0任意面の測定マイクが、人の口から発声された音声信号を収音した際の
音声伝達特性の転置行列
ことを特徴とする。
【0020】
本発明によれば、人の口の周辺に配置され、発話音声を抑制するボイスキャンセリング装置であって、
発声方向口側に向かって、発声された第1の音声信号を入力するマイクと、
発声方向外側に向かってマイクとの間の距離dに配置され、第1の音声信号に基づく第2の音声信号を出力するものであり、口を中心として弧状に設置された1つ以上のN個のスピーカと、
マイクから入力された第1の音声信号に音声伝達特性Wを畳み込むことによって、スピーカへ出力すべき第2の音声信号を生成し、第1の音声信号と第2の音声信号との間の入出力遅延時間Tに音波速度Vを乗算した距離Dが、距離dよりも短くなる(距離d>距離D)ように、遅延を生じる帯域フィルタを備えることなく、当該入出力遅延時間Tを達成するべく高サンプリングレートで処
理する信号処理手段と
を有し、
音声伝達特性Wは、口から放射方向外側に離れた任意面の複数のM個の測定マイクを用いて、M>Nの関係にある場合、当該任意面で第1の音声信号が逆位相化されるように、以下の式によって算出される
W=−G+G0
G+任意面の測定マイクが、当該ボイスキャンセリング装置のスピーカから
出力された音声信号を収音した際の音声伝達特性の
Moore-Penroseの疑似逆行列
G0任意面の測定マイクが、人の口から発声された音声信号を収音した際の
音声伝達特性の転置行列
ことを特徴とする。
【0021】
本発明のボイスキャンセリング装置における他の実施形態によれば、
有線を介して携帯端末に接続可能な音声信号通信手段を更に有し、
マイクによって入力された第1の言語の音声信号を、携帯端末へ送信し、
携帯端末から受信した第2の言語の音声信号を、信号処理手段に加えて、
口から発声された第1の言語の音声信号が抑制されると共に、第1の言語の音声信号の通訳となる第2の言語の音声信号がスピーカから発声される
ことも好ましい。
【0022】
本発明のボイスキャンセリング装置における他の実施形態によれば、
人の頭部(後頭部又は耳部)に着脱可能なヘッドセットについて、人の口の前近傍に位置するように設置されていることも好ましい。
【0023】
本発明のボイスキャンセリング装置における他の実施形態によれば、
口が近傍に位置するマイクを有する携帯端末について、人の口の前近傍にスピーカが位置するように設置されていることも好ましい。
【0024】
本発明のボイスキャンセリング装置における他の実施形態によれば、
手袋について、手の甲側にスピーカが配置され、手の平側にマイクが配置されるように設置されており、手の平で口の前を覆った際に作用させることも好ましい。
【0025】
本発明のボイスキャンセリング装置における他の実施形態によれば、
人の口の前を覆うマスクについて、表面にスピーカが配置され、口側の裏面にマイクが配置されるように設置されていることも好ましい。
【発明の効果】
【0026】
本発明のボイスキャンセリング装置によれば、ユーザ自身の発話音声が周囲に漏れず、他人に聞き取れない程度に抑圧することができる。
【図面の簡単な説明】
【0027】
【
図1】本発明におけるボイスキャンセリング装置の外観を表す構成図である。
【
図3】本発明のボイスキャンセリング装置の機能構成図である。
【
図4】任意面の測定マイクによる音声伝達特性の測定態様図である。
【
図5】ボイスキャンセリング装置を用いて、任意面の測定マイクによる音声伝達特性の測定態様図である。
【
図6】本発明のボイスキャンセリング装置によって抑制された、発声音波の伝搬を表す説明図である。
【
図7】本発明における発声音声の抑制を表すグラフである。
【
図8】携帯端末にボイスキャンセリング装置を搭載した使用態様図である。
【
図9】手袋にボイスキャンセリング装置を搭載した使用態様図である。
【
図10】マスクにボイスキャンセリング装置を搭載した使用態様図である。
【発明を実施するための形態】
【0028】
以下、本発明の実施の形態について、図面を用いて詳細に説明する。
【0029】
図1は、本発明におけるボイスキャンセリング装置の外観を表す構成図である。
【0030】
ボイスキャンセリング装置1は、ユーザの発話音声を抑制するべく、口周辺に配置される。そのために、ボイスキャンセリング装置1は、人の頭部(後頭部又は耳部)に着脱可能なヘッドセットに取り付けられる。ヘッドセットは、例えば棒状であって、左右の耳介にそれぞれ引っかけて、後頭部又は後頸部に固定される。保持部は、左右の耳介からそれぞれ顔の頬側面を経て、口の前近傍に位置する部分に、ボイスキャンセリング装置1を固定配置する。
【0031】
ボイスキャンセリング装置1は、マイク11と、スピーカ12とを有する。
マイク11:発声方向口側に向かって配置され、口から発声された第1の音声信号を
収音する。
スピーカ12:発声方向外側に向かって配置され、第2の音声信号を出力する。
【0032】
ボイスキャンセリング装置1は、有線を介して、スマートフォンのような携帯端末2に接続されるものであってもよい。これによって、スマートフォンのユーザインタフェース(例えばタッチパネルディスプレイ)から、ボイスキャンセリング装置1を、ユーザ操作に応じて制御することができる。
【0033】
図2は、発声音波の伝搬を表す説明図である。
【0034】
音波とは、一般に、空中を伝搬する弾性波のことをいう。波の性質として、反射、屈折、回折及び干渉がある。このうち、反射、屈折、回折は、ホイヘンスの原理で説明され、干渉は、重ね合わせの原理で説明される。重ね合わせの原理は、「2つ以上の進行波が媒質中を進むとき、任意の位置の合成波の変化は、個々の波による変位の代数和で与えられる。」というものである。一般に、「アクティブノイズキャンセラ/アクティブノイズサプレッサ」と称される技術は、この原理に基づいている。ボイスキャンセリング装置1の複数のスピーカ12は、
図2におけるユーザの口からの音波放射方向と一致するように配置されることが好ましい。
【0035】
図3は、本発明のボイスキャンセリング装置の機能構成図である。
【0036】
図3によれば、ボイスキャンセリング装置1は、マイク11側のA/D変換部101と、スピーカ12毎の信号処理部102及びD/A変換部103と、音声信号通信部13とを有する。ボイスキャンセリング装置1は、ユーザの口から放射された音波の広がりを、1つ以上のスピーカからその逆位相の音波を放射することによって、打ち消すことができる。
【0037】
A/D変換部101は、マイク11から入力したアナログ信号(第1の音声信号)をデジタル信号に変換し、そのデジタル信号を各信号処理部102へ出力する。
各信号処理部102は、例えばDSP(Digital Signal Processor)によって構成され、A/D変換部101から入力した第1のデジタル信号を逆位相化した第2のデジタル信号を生成する。信号処理部102は、第1のデジタル信号に、スピーカ12毎に異なる音声伝達特性Wiを畳み込むことによって、スピーカ12毎の第2のデジタル信号を出力する。第2のデジタル信号はそれぞれ、スピーカ12毎のD/A変換部103へ出力される。
各D/A変換部103は、信号処理部102から入力したデジタル信号(第2の音声信号)をアナログ信号に変換し、そのアナログ信号をスピーカ12へ出力する。
【0038】
ここで、本発明の特徴ある構成として、相互に逆向きに設置されたマイクとスピーカとの間の距離dが、以下の関係となるように設置される。
距離d
> 距離D(=入出力遅延時間T×音波速度V)
入出力遅延時間T:マイク11に音声信号が入力され、逆位相化された音声信号が
スピーカ12から出力されるまで時間
即ち、マイク11がユーザの発話音声を取得してから、スピーカ12から放射するまでの処理時間を確保しようとしている。
【0039】
入出力遅延は、主に、A/D変換部及びD/A変換部の前段及び後段に配置されるローパスフィルタの群によって生じる。例えば、ΔΣ型のA/D変換部及びD/A変換部におけるデシメーションフィルタ/インタポレーションフィルタによって生じる。このような帯域フィルタを備えた場合、距離d
>距離Dに構成することは難しい。
【0040】
これに対し、本発明のボイスキャンセリング装置1によれば、距離d
>距離Dに構成するために、「帯域フィルタ」を備えていない。また、信号処理部102は、帯域フィルタを備えないことによって生じるエイリアシングに対して、高サンプリングレートで、A/D変換処理と逆位相化処理とD/A変換処理とを実行する。これによって、距離d
>距離Dとなる入出力遅延時間T(1サンプルの最小遅延を短くする)を達成する。
【0041】
音波速度V=340m/s(気温依存)とした場合、サンプリングレート、入出力遅延時間及び距離Dの関係は、以下のようになる。
[サンプリングレート] [入出力遅延時間] [距離D] [距離d
>D]
2kHz 500us 約170mm 大きすぎる
8kHz 125us 約42.5mm 大きすぎる
48kHz 20us 約7mm 妥当
192kHz 5us 約2mm 最適
マイク11とスピーカ12との間の距離dが長くなるほど、ユーザの口元周辺で音声を打ち消すことができないために、漏れが大きくなる。また、距離dが長くなるほど、ユーザの口元周辺のボイスキャンセリング装置1のデザインにも影響する。
【0042】
<信号処理部102の音声伝達特性Wi>
図4は、任意面の測定マイクによる音声伝達特性の測定態様図である。
図5は、ボイスキャンセリング装置を用いて、任意面の測定マイクによる音声伝達特性の測定態様図である。
【0043】
信号処理部102は、逆位相化のスピーカ12毎の音声伝達特性を、予め記憶している。具体的には、音声伝達特性は、ユーザの発声方向外側に向かって配置された各スピーカ12と、任意面上に配置された複数の測定マイクとの間で、予め計測されたものである。
【0044】
図4及び
図5によれば、ユーザの顔から離隔した任意面上に、複数の測定マイクが配置されている。各測定マイクは、
図4によれば、ユーザの口から発声された音声信号を収音しており、
図5によれば、ボイスキャンセリング装置1の各スピーカ12から出力された音声信号を収音している。
【0045】
音声伝達特性Wは、口から放射方向外側に離れた任意面の複数のM個の任意面の測定マイクを用いて、M=Nの関係にある場合、以下の式によって算出される
W=−G
−G
0
G
−:任意面の測定マイクが、当該ボイスキャンセリング装置のスピーカから
出力された音声信号を収音した際の音声伝達特性の逆行列
G
0:任意面の測定マイクが、人の口から発声された音声信号を収音した際の
音声伝達特性の転置行列
【数1】
【0046】
一方で、音声伝達特性Wは、口から放射方向外側に離れた任意面の複数のM個の任意面の測定マイクを用いて、M>Nの関係にある場合、以下の式によって算出される
W=−G
+G
0
G
+:任意面の測定マイクが、当該ボイスキャンセリング装置のスピーカから
発声された音声信号を収音した際の、
音声伝達特性のMoore-Penroseの疑似逆行列(例えば非特許文献2参照)
G
0:任意面の測定マイクが、人の口から発声された音声信号を収音した際の
音声伝達特性の転置行列
【0047】
具体的には、G
0のインパルス応答と、G
−又はG
+のインパルス応答とを用いて、任意面で逆位相となって打ち消されるインパルス応答(音声伝達特性W)を算出する。
【0048】
図4及び
図5によれば、口周辺に設置される4(=N)個のスピーカ12から、例えば0.5m離れた任意面の16個(=M)の測定マイクまでの複数の音声伝達特性W1〜W4が算出される。具体的には、ヘッドアンドトルソシミュレータを用いることも好ましい。スピーカ毎の信号処理部102それぞれが、各音声伝達特性W1〜W4によって、マイク11から収音した音声信号に畳み込む。これによって、各スピーカ12から出力される音声信号は、ユーザの発話音声を任意面で抑制するように作用する。そして、ユーザの発話音声が、他人に聞き取れないように抑制される。
【0049】
図6は、本発明のボイスキャンセリング装置によって抑制された、発声音波の伝搬を表す説明図である。
【0050】
図6によれば、ボイスキャンセリング装置1に取り付けられたN(>1)個のスピーカは、口を中心として弧状に設置されている。破線は、聞き取れない程度に抑圧された音波の広がりを表す。
図2と
図6とを比較して、音波の広がりが抑制されていることが理解できる。
【0051】
図7は、本発明における発声音声の抑制を表すグラフである。
【0052】
図7のグラフは、横軸として周波数[Hz]を、縦軸として対数振幅スペクトル[dB]を表し、30秒の音声のオーバーオール平均がプロットされている。
図7によれば、上側の線がボイスキャンセリング無しの場合を表し、下側の線がボイスキャンセリング有りの場合を表す。ここで、周波数150Hz〜1kHz程度までで、6dB程度、抑圧できていることが確認できる。また、騒音レベルでは、20dBA近くまで抑圧できている。尚、スピーカ12は、約16cm間隔で配置され、空間エイリアシング定理によって、最高周波数は1kHz程度となっている。
【0053】
図8は、携帯端末にボイスキャンセリング装置を搭載した使用態様図である。
【0054】
図8によれば、スマートフォンのように、口が近傍に位置するマイクを有する携帯端末について、ボイスキャンセリング装置1が、口の前近傍にスピーカ12が位置するように配置される。ボイスキャンセリング装置1のスピーカ12が、携帯端末から伸長するものであってもよい。ユーザは、スマートフォンを用いて電話している際に、その発話音声がキャンセリングされる。
【0055】
図9は、手袋にボイスキャンセリング装置を搭載した使用態様図である。
【0056】
図9によれば、ボイスキャンセリング装置1がユーザの手袋となっている。手袋について、手の甲側にスピーカ12が配置され、手の平側にマイク11が配置されるように設置されており、手の平で口の前を覆った際に作用させる。人が電話をする態様として、口元を手で覆って隠すような仕草をする。手の甲側のスピーカ12からの出力される音声によって、ユーザの発話音声がキャンセリングされる。
【0057】
図10は、マスクにボイスキャンセリング装置を搭載した使用態様図である。
【0058】
図10によれば、ボイスキャンセリング装置1がマスクとなっている。人の口の前を覆うマスクについて、表面にスピーカ12が配置され、口側の裏面にマイク11が配置されるように設置されている。表面のスピーカ12からの出力される音声によって、ユーザの発話音声がキャンセリングされる。
【0059】
他の実施形態として、本発明のボイスキャンセリング装置は、同時通訳の用途に適する。ボイスキャンセリング装置は、有線を介して携帯端末に接続可能な音声信号通信部13を有する。
(S1)ボイスキャンセリング装置1は、マイク11によって入力された日本語(第1の言語)の音声信号を、携帯端末2へ送信する。
(S2)携帯端末2は、その音声信号を音声信号処理によって解析し、例えば外部の通訳サーバを介して翻訳する(Speech-to-Speechの音声翻訳)。日本語から英語(第2の言語)に同時翻訳され、携帯端末2は、その英語の音声信号を、ボイスキャンセリング装置1へ送信する。
(S3)ボイスキャンセリング装置1は、スピーカ12から、マイク11によって取得した日本語の音声信号をキャンセルすると共に、携帯端末2から受信した英語の音声信号を発声する。これによって、そのユーザの口から、日本語が抑制され、英語が発声されているように、他人は感じることができる。これは、Face-to-Faceのコミュニケーションの用途に適する。
【0060】
以上、詳細に説明したように、本発明のボイスキャンセリング装置によれば、ユーザ自身の発話音声が周囲に漏れず、他人に聞き取れない程度に抑圧することができる。
【0061】
前述した本発明の種々の実施形態について、本発明の技術思想及び見地の範囲の種々の変更、修正及び省略は、当業者によれば容易に行うことができる。前述の説明はあくまで例であって、何ら制約しようとするものではない。本発明は、特許請求の範囲及びその均等物として限定するものにのみ制約される。
【符号の説明】
【0062】
1 ボイスキャンセリング装置
11 マイク
12 スピーカ
13 音声信号通信部
101 A/D変換部
102 信号処理部
103 D/A変換部
2 スマートフォン、携帯端末