(19)【発行国】日本国特許庁(JP)
(12)【公報種別】公開特許公報(A)
(11)【公開番号】P2022146521
(43)【公開日】2022-10-05
(54)【発明の名称】電気式人工喉頭
(51)【国際特許分類】
A61F 2/20 20060101AFI20220928BHJP
G10K 15/04 20060101ALI20220928BHJP
A61F 2/70 20060101ALI20220928BHJP
【FI】
A61F2/20
G10K15/04 302Z
G10K15/04 303Z
A61F2/70
【審査請求】未請求
【請求項の数】10
【出願形態】OL
(21)【出願番号】P 2021047521
(22)【出願日】2021-03-22
(71)【出願人】
【識別番号】000115636
【氏名又は名称】リオン株式会社
(74)【代理人】
【識別番号】100120592
【弁理士】
【氏名又は名称】山崎 崇裕
(74)【代理人】
【識別番号】100192223
【弁理士】
【氏名又は名称】加久田 典子
(72)【発明者】
【氏名】藤田 知穂
(72)【発明者】
【氏名】伊藤 祐介
【テーマコード(参考)】
4C097
【Fターム(参考)】
4C097AA18
4C097BB02
4C097BB06
4C097CC01
4C097CC07
(57)【要約】
【課題】適切なイントネーションを付与する技術の提供。
【解決手段】電気式人工喉頭10は、所定のランダムノイズの生成等を行う信号制御部20と、生成されたランダムノイズに応じた振動を発生する振動部30と、ユーザの操作を受け付ける操作部40とを備えている。発明者らは、所定のランダムノイズ(例えば、ピンクノイズやこれに近い減衰傾度を有するカラードノイズ、帯域を制限したホワイトノイズ等)による振動を声道に与えながら普通に話すように口を動かすことで、健常者の発声に近いフォルマントシフトを生じさせて、発生する音声に自然なイントネーションを持たせることができることを見出し、振動の発生に所定のランダムノイズを用いる構成とした。電気式人工喉頭10は、作動スイッチ41をONに切り替えるだけで使用が可能となり、イントネーションを付与する上で特段の操作は不要であるため、どのようなユーザでも簡単に使用することができる。
【選択図】
図1
【特許請求の範囲】
【請求項1】
所定のランダムノイズの信号を生成して出力する信号制御部と、
前記信号制御部から出力された信号を振動に変換する振動部と
を備えた電気式人工喉頭。
【請求項2】
請求項1に記載の電気式人工喉頭において、
前記信号制御部は、
前記所定のランダムノイズの周波数特性を変更可能であることを特徴とする電気式人工喉頭。
【請求項3】
請求項2に記載の電気式人工喉頭において、
前記信号制御部は、
前記所定のランダムノイズの周波数帯域を制限可能であることを特徴とする電気式人工喉頭。
【請求項4】
請求項2又は3に記載の電気式人工喉頭において、
前記信号制御部は、
前記所定のランダムノイズにおける1オクターブ当たりの減衰量を調整可能であることを特徴とする電気式人工喉頭。
【請求項5】
請求項1から3のいずれかに記載の電気式人工喉頭において、
前記信号制御部は、
所定のホワイトノイズの信号を生成可能であることを特徴とする電気式人工喉頭。
【請求項6】
請求項5に記載の電気式人工喉頭において、
前記所定のホワイトノイズは、
周波数帯域が制限されていることを特徴とする電気式人工喉頭。
【請求項7】
請求項1から4のいずれかに記載の電気式人工喉頭において、
前記信号制御部は、
所定のカラードノイズの信号を生成可能であることを特徴とする電気式人工喉頭。
【請求項8】
請求項7に記載の電気式人工喉頭において、
前記所定のカラードノイズは、
1オクターブ当たりの減衰量が所定の大きさであることを特徴とする電気式人工喉頭。
【請求項9】
請求項1から8のいずれかに記載の電気式人工喉頭において、
前記振動部は、
前記信号制御部と同一の本体内に搭載されていることを特徴とする電気式人工喉頭。
【請求項10】
請求項1から8のいずれかに記載の電気式人工喉頭において、
前記振動部は、
前記信号制御部が搭載されている第1本体とは別の第2本体に搭載されており、前記第1本体と前記第2本体とは有線又は無線を介して接続されることを特徴とする電気式人工喉頭。
【発明の詳細な説明】
【技術分野】
【0001】
本発明は、電気式人工喉頭に関する。
【背景技術】
【0002】
電気式人工喉頭(electro larynx)は、病気で喉頭を摘出された人や人工呼吸器の使用のために気管切開をされた人などに広く使用されている。電気式人工喉頭は喉に押し当てて使用され、喉頭原音を模擬したブザー音による振動を喉に与えることにより発声させる(音声を生じさせる)のが一般的である。しかしながら、このようなブザー音を利用して生じる音声は、イントネーションが無く機械的な印象のものとなるため、違和感が拭えない。そこで、従来、自然な音声を生じさせるために、様々な工夫がなされている。
【0003】
例えば、ボイスコイルモータに入力するパルス信号の波形に周期の微小変化を与える技術(例えば、特許文献1を参照。)や、ユーザの操作により音源の周波数を調整可能とする技術(例えば、特許文献2を参照。)が知られている。また、マイクロホンが拾った音声を認識して文字情報に変換し、この文字情報に基づいて音声に合成する技術が開示されている(例えば、特許文献3を参照。)。
【先行技術文献】
【特許文献】
【0004】
【特許文献1】特開2008-242234号公報
【特許文献2】特開2008-199191号公報
【特許文献3】特開2019-087798号公報
【発明の概要】
【発明が解決しようとする課題】
【0005】
特許文献1に記載の技術によれば、健常者や喉頭摘出前の患者等からサンプリングされた母音の波形データに対応する周期及び音圧とともに、この波形データにみられる微小変化を有するパルス信号がボイスコイルモータに入力されるため、発せられる音声を人間の肉声にある程度は近づけることができると考えられるが、これによりイントネーションが付与されるものではない。
【0006】
また、特許文献2に記載の技術によれば、音源の周波数を調整可能ではあるものの、周波数帯域が限定的であるため、発せられる音声に適切な(望ましい、自然な)イントネーションを与えることができないと考えられる。また、操作部のコントロールが難しいため思うようにイントネーションを付与できず、音声が機械音のような単調なものとなることが推測される。
【0007】
そして、特許文献3に記載の技術によれば、音声合成時に文字情報が示す子音や母音の音声素片の音声波形をデータベースから読み出して時間軸上でつなぎ合わせることにより音声に合成するため、ある程度のイントネーションを与えることができると考えられるが、音声合成の前段階でなされる音声認識の精度や遅延等の問題があり、自然な会話を進行させることが困難である。
【0008】
本発明は、このような課題を鑑みてなされたものであり、適切なイントネーションを付与する技術の提供を課題とする。
【課題を解決するための手段】
【0009】
上記の課題を解決するため、本発明は以下の電気式人工喉頭を採用する。なお、以下の括弧書中の文言はあくまで例示であり、本発明はこれに限定されるものではない。
【0010】
本発明の電気式人工喉頭は、所定のランダムノイズの信号を生成して出力する信号制御部と、信号制御部から出力された信号を振動に変換する振動部とを備えている。
【0011】
発明者らの検証により、振動の発生に所定の周波数特性を有するランダムノイズを用いることで健常者の発声に近いフォルマントシフトを発生させることができることが分かっている。したがって、この態様の電気式人工喉頭によれば、声道に所定のランダムノイズによる振動を与えることができ、自然なイントネーションを伴った音声を発生させることができる。
【0012】
また、この態様の電気式人工喉頭によれば、上記のような振動を与えることで自然なイントネーションを伴った音声が発生させることができるため、従来の電気式人工喉頭において必要とされていた、イントネーションを付与するための外部からのコントロール(ユーザによる操作、センサを利用した制御等)が一切不要であるため、電気式人工喉頭の使用や管理におけるユーザの利便性を高めることができる。
【0013】
好ましくは、上記の態様の電気式人工喉頭において、信号制御部は、所定のランダムノイズの周波数特性を変更可能である。
【0014】
この態様の電気式人工喉頭によれば、ユーザがより聞き取り易いと感じる周波数特性を有するランダムノイズを自身の操作により選択することができるため、ユーザにとってより好ましい声質にすることが可能となる。
【0015】
より好ましくは、信号制御部は、所定のランダムノイズの周波数帯域を制限可能であり、また、所定のランダムノイズにおける1オクターブ当たりの減衰量を調整可能である。さらに好ましくは、上記の態様の電気式人工喉頭において、信号生成部は、所定のホワイトノイズ、より具体的には周波数帯域が制限されたホワイトノイズの信号を生成可能であり、また、所定のカラードノイズ、より具体的には1オクターブ当たりの減衰量(減衰傾度)が所定の大きさであるカラードノイズの信号を生成可能である。
【0016】
発明者らの検証により、振動に用いるランダムノイズをピンクノイズやこれに近い減衰傾度を有するカラードノイズとした場合や、周波数帯域が制限されたホワイトノイズとした場合に、良好なイントネーションを有する音声を発生させることが可能であることが分かっている。したがって、この態様の電気式人工喉頭によれば、良好なイントネーションを有する音声を発生させることができ、人の声により近い音質の声で話すことが可能となる。
【発明の効果】
【0017】
以上のように、本発明によれば、適切なイントネーションを付与することができる。
【図面の簡単な説明】
【0018】
【
図1】一実施形態の電気式人工喉頭10の構成を示す機能ブロック図である。
【
図2】電気式人工喉頭10の本体の実装に関する第1態様を示す図である。
【
図3】電気式人工喉頭10の本体の実装に関する第2態様を示す図である。
【
図5】健常者の通常の声のスペクトログラムである。
【
図6】健常者のささやき声のスペクトログラムである。
【
図7】ピンクノイズを用いて生じさせた音声のスペクトログラムである。
【発明を実施するための形態】
【0019】
以下、本発明の実施の形態について、図面を参照しながら説明する。なお、以下の各実施形態は好ましい例示であり、本発明はこの例示に限定されるものではない。
【0020】
〔電気式人工喉頭の構成〕
図1は、一実施形態の電気式人工喉頭10の構成を示す機能ブロック図である。
【0021】
電気式人工喉頭10は、大きく見ると、ランダムノイズの生成等を行う信号制御部20と、信号制御部20により生成されたランダムノイズに応じた振動を発生する振動部30と、電気式人工喉頭10のユーザによりなされる操作を受け付ける操作部40とを備えている。
【0022】
本実施形態は、振動の発生にランダムノイズを用いる点に特徴を有しているが、このような構成としたのは、発明者らが試行錯誤を重ねた末に、発声せずに話す真似をする(息を出さずに口の形状を変化させる)際に、声道に所定のランダムノイズ(例えば、ピンクノイズ)による振動を与えると、自然なイントネーションをもった音声が生じることを見出したためである。なお、ピンクノイズによる振動を与えることが自然なイントネーションを生み出す原理については、別の図面を参照しながらさらに後述する。
【0023】
信号制御部20は、例えば、ランダムノイズ生成部21、増幅部22、周波数特性変更部23等で構成される。また、操作部40は、例えば、ランダムノイズ生成部21に対応付けられた作動スイッチ41、増幅部22に対応付けられた音量ボタン42、周波数特性変更部23に対応付けられた調整ボタン43等で構成される。なお、図示されていないが、操作部40には、これらのスイッチやボタンとは別に、電気式人工喉頭10の電源スイッチが設けられている。電源としては、乾電池や充電式の内蔵バッテリを用いてもよいし、ACアダプタを接続して交流電源を用いてもよい。
【0024】
ランダムノイズ生成部21は、作動スイッチ41がONに切り替えられると、ランダムノイズを生成してその信号を増幅部22に出力する。また、ランダムノイズ生成部21は、作動スイッチ41がOFFに切り替えられると、ランダムノイズの生成を停止する。ランダムノイズとは、周波数や振幅、位相が時間的に不規則な雑音のことであるが、完全なランダムノイズである必要はなく、M系列ノイズのような疑似雑音でもよい。
【0025】
従来の電気式人工喉頭において用いられている一般的なブザー音は、多少の揺らぎがあるものの基本周波数が固定されているため、発声する音声にイントネーションがつかないという問題がある。これに対し、本実施形態においては、広帯域のランダムノイズを用いているため、自然なイントネーションを伴った音声を発生させることが可能となる。
【0026】
ところで、人間の耳は周波数が低くなるほど感度が低くなる傾向があるが、検証により、低い周波数帯域のエネルギーを大きくすると、人間の声を形成する周波数帯の音響エネルギーが大きくなるため、聴感上聞き取り易くなることが分かった。ピンクノイズの特性は、人間の耳と似たような特性であるため、振動にピンクノイズを用いることで、ホワイトノイズを用いる場合よりも良好な音声を発生させることができた。
【0027】
そこで、本実施形態においては、ランダムノイズ生成部21は、ランダムノイズの初期値をピンクノイズとしている。また、ホワイトノイズを用いる場合でも、帯域制限(例えば、100~4kHz等)を行うことにより、良好な音声を発生させることができた。そのため、ランダムノイズの初期値を、ピンクノイズに代えて、周波数帯域が制限されたホワイトノイズとしてもよい。或いは、ピンクノイズに代えて、これに近い減衰傾度(例えば、2dB/oct、4dB/oct等)を有するカラードノイズとしてもよい。
【0028】
なお、本実施形態においては、作動スイッチ41をランダムノイズ生成部21に対応付けているが、これに代えて、後述する振動部30(駆動部31)に対応付けて、振動のON/OFFの切り替えに用いてもよい。また、作動スイッチ41は、スイッチ(切替式)に代えてボタン等の部品で構成してもよい。その場合には、一度押下するとONに切り替わり再度押下するとOFFに切り替わる態様(切替式)としてもよいし、長押し中にONとなりその他はOFFとなる態様(押下式)としてもよい。
【0029】
増幅部22は、ランダムノイズ生成部21から出力された信号を、音量ボタン42の操作量に応じたゲインで増幅させて、駆動部31に出力する。なお、音量ボタン42は、ボタンに代えてつまみやスライダー等の部品で構成してもよい。
【0030】
周波数特性変更部23は、調整ボタン43の操作内容に応じて、ランダムノイズに関して予め用意された複数種類の周波数特性のうちいずれかを選択し、この周波数特性をランダムノイズ生成部21が生成するランダムノイズに適用する。これにより、ランダムノイズ生成部21は、選択された周波数特性を適用した(フィルタをかけた)ランダムノイズを生成することとなる。周波数特性としては、例えば、ランダムノイズの種類(ホワイトノイズ、ピンクノイズ、ブラウニアンノイズ等)、ランダムノイズの減衰傾度(1オクターブ当たりのパワー密度の減衰量)、ランダムノイズの周波数帯域等について、それぞれ複数のパターンが用意されている。
【0031】
なお、調整ボタン43は、ボタンの押下回数に応じた周波数特性を選択する態様としてもよいし、操作補助用の画面を別途設け、画面に表示された複数の周波数特性の中からいずれかを選択する態様としてもよい。或いは、予め複数種類の周波数特性を用意するのに代えて、ボタンの操作量等に応じてランダムノイズの傾度や周波数帯域を自由に調整可能な態様とすることも可能である。
【0032】
振動部30は、例えば、駆動部31及び振動伝達部32等で構成される。
【0033】
駆動部31は、増幅部22から出力された所定のランダムノイズの信号を振動に変換する。本実施形態においては、駆動部31に振動スピーカーを用いているが、これに限定されず、増幅部22から出力された信号の周波数帯域にわたって振動に変換可能な電気機械変換器であればよい。
【0034】
振動伝達部32は、駆動部31における振動発生部位に連結されており、喉の皮膚を介して声道に振動を伝える。すなわち、振動伝達部32は、皮膚(人体)に接触する部位であり、それに適した形状や材質等で形成されている。なお、駆動部31の振動発生部位がこうした形状や材質等の条件を満たしていれば、当該振動発生部位が振動伝達部32の役割を果たすことができるため、その場合には振動伝達部32を設けなくてもよい。
【0035】
〔本体の実装態様例〕
図2及び
図3は、本実施形態の電気式人工喉頭10の本体に関する実装態様の例を示す図である。なお、これらの図においては、本体の実装態様を説明する上で必要な符号のみを図示し、その他の符号の図示を省略している。
【0036】
図2は、電気式人工喉頭10の本体の第1実装態様を示している。第1実装態様においては、
図1に示された全ての機能ブロックが一体型の本体100に搭載されている。ユーザは、本体100を手に持ち、本体100の一端部に設けられた振動伝達部32を喉に押し当てて、話す際に作動スイッチ41をONにして使用する。このとき、普通に話すように口を動かす(口の形状を変化させる)と、口腔から話声が生じる。
【0037】
図3は、電気式人工喉頭10の本体の第2実装態様を示している。第2実装態様においては、本体200が複数に分かれており、
図1に示された機能ブロックのうち、例えば、振動部30が信号制御部20及び操作部40とは別体として設けられる。具体的には、信号制御部20及び操作部40がコントローラ(第1本体)200aに搭載されている一方、振動部30は装着体(第2本体)200bに搭載されており、信号制御部20と振動部30とは、有線又は無線により接続されている。
図3中(B)には、無線接続の例が図示されている。
【0038】
装着体200bには、装着後に振動伝達部32を喉に良好に接触させた状態を維持可能とする装着補助具(例えば、密着し易い素材で形成されたベルトや、面ファスナー等で着脱可能なベルト等)が設けられている。ユーザは、装着体200bを振動伝達部32が配置されている面を喉に当てて装着し、話す際にコントローラ200aに設けられた作動スイッチ41をONにして使用する。このとき、普通に話すように口を動かす(口の形状を変化させる)と、口腔から話声が生じる。振動伝達部32を手で固定する必要がないため、使用中におけるユーザの動きの自由度を高めることができる。また、作動スイッチ41が切替式であり、かつ長時間話し続ける場合等には、作動スイッチ41を一旦ONにした後は、使用中にコントローラ200aを手に持つ必要もないため、ハンズフリーでの使用が可能となり、動きの自由度を一層高めることができる。
【0039】
なお、
図2中(B)に示した本体100の形状や、
図3中(B)に示した本体200(コントローラ200a及び装着体200b)の形状は、本体の実装態様に関する理解を容易とするために一例を簡略的に表したものに過ぎず、本体の形状はこれらの形状に限定されない。
【0040】
〔自然なイントネーションを生み出す原理〕
ここで、ピンクノイズを用いた振動を与えるとなぜ自然なイントネーションが生じるのかについて、
図4~
図7を参照しながら説明する。
【0041】
音声の特徴を表す指標に、音源特徴量と声道特徴量がある。音源特徴量は、イントネーションを調整するものであり、基本周波数に関連する。これに対し、声道特徴量は、音韻や声質を調整するものであり、スペクトル包絡に関連する。
【0042】
図4中(A)は、音声の周波数スペクトル包絡を示している。このスペクトル包絡を周波数方向に縮めたり(
図4中(B))、伸ばしたり(
図4中(C))すると、同じ音韻であっても、太い声になったり、子供っぽい声となったりする。このようにスペクトル包絡が伸縮する現象を、フォルマントシフトという。
【0043】
図5は、健常者が通常の声(生声)で低音の「あ」と高音の「あ」を繰り返して発した音声のスペクトログラムである。
健常者が通常の声で低音の「あ」と高音の「あ」を繰り返して発声する場合には、口腔内の形状は変化させずに、声帯の振動頻度、すなわち基本周波数を変化させている。また、音声は、基本周波数とその倍音によりフォルマントが形成される。
【0044】
低音の「あ」と高音の「あ」のスペクトルを比較すると、隣り合う強調された周波数の間隔(第nフォルマントと第n+1フォルマントとの間隔)は、低音の「あ」を発声した際の間隔WLより高音の「あ」を発声した際の間隔WHの方が広がっており、フォルマントシフトが生じていることが分かる。このように、健常者が低音の「あ」と高音の「あ」を繰り返して発声する場合には、主に声帯の振動頻度を変化させて基本周波数を変化させることで、フォルマントシフトが生じている。
【0045】
図6は、健常者がささやき声で低音の「あ」と高音の「あ」を繰り返して発した音声のスペクトログラムである。
この場合にも、隣り合う強調された周波数の間隔(第nフォルマントと第n+1フォルマントとの間隔)は、低音の「あ」を発声した際の間隔W
Lより高音の「あ」を発声した際の間隔W
Hの方が広がっており、やはりフォルマントシフトが生じていることが分かる。ささやき声は、声帯を振動させずに発声したものであり、基本周波数が存在しない。つまり、健常者がささやき声で発声する場合には、声帯を振動させないため基本周波数というものは存在しないが、声道の形状を変化させることでフォルマントシフトが生じ、これにより声の高低を変化させているように聞こえる。
【0046】
図7は、ピンクノイズを用いて生じさせた音声、すなわち声道にピンクノイズによる振動を与え、発声せずに、低音の「あ」と高音の「あ」を発声する真似をした際に、口腔から生じた音(音声)のスペクトログラムである。
【0047】
図7から明らかなように、この場合の隣り合う強調された周波数の間隔(第nフォルマントと第n+1フォルマントとの間隔)も、低音の「あ」の発声を真似した際の間隔W
Lより高音の「あ」の発声を真似した際の間隔W
Hの方が広がっている。この結果から、ピンクノイズを用いて音声を生じさせる場合にも、健常者の通常の発声(
図5)やささやき声での発声(
図6)の場合と同様に、フォルマントシフトが生じていることが分かった。
【0048】
発明者らは、このようにして様々な検証を行った結果、ホワイトノイズやカラードノイズ等の広帯域信号で声道を振動させ、声道特徴量を変化させることで、音声にイントネーションを持たせることができることを見出した。また、ピンクノイズや帯域制限されたホワイトノイズを用いることで特に良好な音声を生じさせることができることも分かった。そこで、本実施形態においては、上述したような周波数特性を有するランダムノイズ(ピンクノイズやこれに近い減衰傾度を有するカラードノイズ、帯域制限されたホワイトノイズ等)を用いて振動を発生させている。
【0049】
以上のように、本実施形態によれば、以下のような効果が得られる。
(1)振動の発生に上述したような周波数特性を有するランダムノイズを用いることで、健常者の発声に近いフォルマントシフトを発生させることができるため、発生する音声に自然なイントネーションを持たせることができる。
【0050】
(2)上述したようなランダムノイズによる振動を与えることで自然なイントネーションを伴った音声が発生するため、普通に話すように口を動かすだけでイントネーションを付与することができる。具体的には、従来の電気式人工喉頭においては、イントネーションを付与するためにユーザに何らかの操作を要求したり、或いは、センサ等を利用した制御を行ったりし、そのような外部からのコントロールに基づいて音声処理を行っているのに対し、上述した実施形態においては、外部からのコントロールを必要としないため、使用や管理が非常に容易な電気式人工喉頭を提供することができる。
【0051】
(3)健常者のささやき声と似た広帯域に周波数成分を持つランダムノイズが振動の発生に用いられるため、基本周波数が固定されているブザー音を用いる従来の電気式人工喉頭と比較して、自然なイントネーションを伴ったささやき声を発生させることができ、人の声に近い音質で話すことが可能となる。
【0052】
(4)自然なイントネーションを伴った音声を生じさせることができるため、機械的な音声が発生する従来の電気式人工喉頭と比較して、表現が豊かになり、聞く側にとっても聞き取り易くなる。
【0053】
本発明は、上述した実施形態に制約されることなく、種々に変形して実施することが可能である。
【0054】
上述した実施形態においては、生成するランダムノイズの周波数特性を変更する機能(具体的には、周波数特性変更部23及び調整ボタン43)が設けられているが、この機能を搭載しない構成としてもよい。その場合には、ランダムノイズ生成部21は、予め定められた周波数特性を有するランダムノイズ、すなわち初期値として設定されたランダムノイズを常に生成することとなる。
【0055】
上述した実施形態においては、本体に関して2つの実装態様(一体型の本体100、分離型の本体200)が想定されているが、これに限定されず、さらに異なる態様により本体を実装してもよい。例えば、本体を複数に分ける態様とする場合に、
図3に示された第2実装態様とは異なる態様で、
図1に示された機能ブロックを複数の本体に分けて搭載することも可能である。
【0056】
その他、電気式人工喉頭10に関する説明の過程で挙げた構成や数値等はあくまで例示であり、本発明の実施に際して適宜に変形が可能であることは言うまでもない。
【符号の説明】
【0057】
10 電気式人工喉頭
20 信号制御部
21 ランダムノイズ生成部
22 増幅部
23 周波数特性変更部
30 振動部
31 駆動部
32 振動伝達部
40 操作部
41 作動スイッチ
42 音量ボタン
43 調整ボタン
100 一体型の本体
200 分離型の本体
200a コントローラ(第1本体)
200b 装着体(第2本体)