(58)【調査した分野】(Int.Cl.,DB名)
前記診断手段は、前記音階決定手段によって決定された最大の音階のオクターブに占める割合と最小の音階のオクターブに占める割合との差に基づいて、前記生体の心理状態、健康状態又は思考パターンを診断することを特徴とする請求項1乃至6のいずれか1つの項に記載の音声診断装置。
前記診断手段は、前記生体の感覚にそれぞれ関係している前記複数の音階について、複数のオクターブ毎に占める割合のバランスがとれているか否かに基づいて、前記生体の心理状態、健康状態又は思考パターンを診断することを特徴とする請求項1乃至7のいずれか1つの項に記載の音声診断装置。
前記音声入力手段は前記生体がストレス状態を感じている時に発生する音声データを入力することを特徴とする請求項1乃至8のいずれか1つの項に記載の音声診断装置。
前記音声入力手段は前記生体がリラックス状態を感じている時に発生する音声データを入力することを特徴とする請求項1乃至10のいずれか1つの項に記載の音声診断装置。
前記診断結果表示手段は、前記生体の心理状態、健康状態又は思考パターンが改善する前と後の前記分布図表を前記表示部に表示させることを特徴とする請求項12に記載の項に記載の音声診断装置。
【発明を実施するための最良の形態】
【0024】
以下、本発明の実施の形態について説明する。
図1は、本発明の実施形態例に係る音声診断装置、音声診断システム及び音声診断プログラムの構成を示すブロック図である。
【0025】
図1に示すように、本発明の実施形態例に係る音声診断システムSは、音声診断装置1と、通信ネットワーク2を介してデータの送受信を行い、表示部3を備えたユーザ端末4とを有し、ユーザ端末4によって入力された生体の音声データが通信ネットワーク2を介して音声診断装置1に入力される。
【0026】
ユーザ端末4は、生体であるユーザによって使用される端末であり、例えばネットワーク接続機能を備えたパーソナルコンピュータ、スマートフォン、テレビ、携帯用端末、携帯電話等の情報処理装置である。ユーザ端末4は、各種データを入力するためのキーボード、テンキー、マウス等の入力部4aと、各種データを表示するディスプレイ等の表示部3と、通信ネットワーク2と接続し、各種データの送受信を行うためのモデム、ターミナルアダプタ、DSU(Digital Service Unit)等の通信部4bと、各種データ(音声データを含む)を記憶する記憶部4cと、入力部4a、表示部3、通信部4b、記憶部4cを制御する制御部4dとを有する。なお、ユーザ端末4は、LAN(Local Area Network)等の他の通信ネットワークに所属していてもよい。
【0027】
ユーザ端末4は、生体であるユーザの音声を入力するための音声入力機器5が接続されている。音声入力機器5はユーザ端末4内に設けられていてもよい。音声入力機器5によって入力されたアナログ音声信号はPCM(Pulse Code Modulation)等の手法でデジタル音声信号に変換され、そのデジタル音声信号で構成された音声データは、ユーザ端末4の通信部4bを用いて通信ネットワーク2を介して音声診断装置1に送信される。
【0028】
音声診断装置1は、生体であるユーザに対して音声診断のサービスを提供する業者等が使用するサーバ等の情報処理装置であり、生体の音声データを入力する音声入力部6と、音声入力部6によって入力された音声データを音声周波数データに変換する音声周波数変換部7と、音声周波数変換部7によって変換された音声周波数データを、音階とオクターブとで区分けされた複数の領域を含む分布図表に分布させる分布部8と、分布部8によって分布された音声周波数データについて、オクターブに占める割合が最大になる音階及び/又は最小になる音階を決定する音階決定部9と、音階決定部9によって決定された最大及び/又は最小の音階と、音階に関係する生体の感覚のバランスとに基づいて、生体の心理状態、健康状態又は思考パターンを診断する診断部10と、診断部10によって診断された結果及び/又は分布図表を表示部12又はユーザ端末4の表示部3に表示させる診断結果表示部11と、各種データを表示する表示部12と、各種データ(音声データを含む)を記憶する記憶部13と、オクターブに占める各音階の割合を数字で表示部12又はユーザ端末4の表示部3に表示させる数字表示部16とを有する。
【0029】
通信ネットワーク2は、例えばインターネット(TCP/IP(Transmission Control Protocol/Internet Protocol)によるデータ転送網)である。
【0030】
音声診断プログラム14は、音声診断装置1の動作を制御するプログラムであり、CD−ROM、DVD等の光ディスク、磁気ディスク、半導体メモリ等の記録媒体に記録されていてもよく、通信ネットワーク2を介してダウンロードされるものでもよい。
【0031】
なお、生体であるユーザの音声を入力するための音声入力機器15を音声診断装置1に接続し、表示部12に診断結果や分布図表等のデータを表示させてもよい。音声入力機器15は音声診断装置1内に設けられていてもよい。
【0032】
また、音声診断装置1では、ユーザ端末4から送信されたID(識別番号)、パスワード、声紋データ等の情報に基づいて本人認証を行い、本人と確認できたユーザ端末4だけに音声診断サービスを提供できるような会員制サービスにしてもよい。
【0033】
図2は本発明の実施形態例に係る音声診断装置の動作を説明するためのフローチャート、
図3は分布図表の一例を示す説明図、
図4は分布図表の他の例を示す説明図、
図5(A)はオクターブにおいて各音階が占める領域の割合を数字で示した説明図、(B)は各音階の領域の占める割合が大きい順に左から右へ並べたことを示す説明図、(C)はオクターブにおいて占める割合が最大になる領域の音階と最小になる領域の音階を示す説明図である。、
図6(A)は生体の感覚にそれぞれ関係している音階を説明するための説明図、(B)及び(C)は周波数分布図、
図7(A)〜(E)は周波数分布図、
図8はテーブルからなる分布図表を9つのブロックに分割したことを示す説明図、
図9(A)〜(C)は
図8に示す9つのブロックのうち、音階の占める領域の割合が大きいブロックを○で示し、そのバランスを比較するための説明図である。
【0034】
まず、音声診断装置1の音声入力機器15から、又はユーザ端末4の音声入力機器5から通信ネットワーク2を介して生体の音声データが、音声診断装置1の音声入力部6に入力される(ステップS1)。音声データは例えば8〜12秒程度の間に人間によって発した声(音声)に関するデジタルデータである。
【0035】
次いで、音声周波数変換部7により、入力された音声データを音声周波数データに変換する(ステップS2)。
【0036】
ここで、音声周波数データへの変換では例えば、次の式からなるフーリエ変換が用いられる。
【0037】
【数1】
なお、コンピュータでの計算を高速にするため、プログラミング上では「Cooley-Tukey型FFTアルゴリズム」の手法を利用するのが好ましい。この手法については、下記のサイトに説明があるので、明細書での説明は省略する。http://sip.cua.edu/res/docs/courses/ee515/chapter08/ch8-2.pdf
次いで、分布部8により、変換された音声周波数データを、音階とオクターブとで区分けされた複数の領域を含む分布図表に分布させる(ステップS3)。
【0038】
分布図表としては、例えば
図3のように、音階とオクターブとの関係を表示したテーブルであってもよい。
【0039】
図3では各オクターブ毎の音階C(ド)、C#(ド#)、D(レ)、D#(レ#)、E(ミ)、F(ファ)、F#(ファ#)、G(ソ)、G#(ソ#)、A(ラ)、A#(ラ#)、B(シ)における周波数(横軸)とそのパワー(縦軸)が表示されている。
【0040】
また、
図3において(A)は8192〜15800Hzの周波数域のオクターブ、(B)は4096〜7900Hzの周波数域のオクターブ、(C)は2048〜3950Hzの周波数域のオクターブ、(D)は1024〜1975Hzの周波数域のオクターブ、(E)は512〜987Hzの周波数域のオクターブ、(F)は256〜493Hzの周波数域のオクターブ、(G)は128〜246Hzの周波数域のオクターブ、(H)は64〜123Hzの周波数域のオクターブである。
【0041】
ここで(A)及び(B)のオクターブが高音域、(C)、(D)及び(E)のオクターブが中音域、(F)、(G)及び(H)が低音域となる。
【0042】
分布図表としては、例えば
図4のように、円形に表示されたオクターブを音階毎に区分けして表示した図であってもよい。
【0043】
図4では円を12等分に区分し、音階R(ド)、C(ド#)、O(レ)、G(レ#)、Y(ミ)、L(ファ)、E(ファ#)、A(ソ)、B(ソ#)、N(ラ)、V(ラ#)、M(シ)における周波数とそのパワーが円上に表示されている。
【0044】
また、各音階の周波数の表示について、例えばR(ド)はレッド、C(ド#)はコーラル)、O(レ)はオレンジ、G(レ#)はゴールド、Y(ミ)はイエロー、L(ファ)はライムグリーン、E(ファ#)はエメラルドグリーン、A(ソ)はアクア、B(ソ#)はブルー、N(ラ)はネイビー、V(ラ#)はヴァイオレット、M(シ)はマゼンタのように色分けして表示してもよい。
【0045】
また、
図4において、例えば一番内側の円が64〜123Hzの周波数域のオクターブ、その次に内側の円が128〜246Hzの周波数域のオクターブ、その次に内側の円が4096〜7900Hzの周波数域のオクターブ、一番外側の円が8192〜15800Hzの周波数域のオクターブとなる。
【0046】
図4のように円上に音声周波数データを表示させることにより、外側の円における周波数域のオクターブについて目立つため、強調して表示させることが可能となる。
【0047】
次いで、音階決定部9により分布部8によって分布された音声周波数データについて、オクターブに占める割合が最大になる領域の音階及び/又は最小になる領域の音階を決定する(ステップS4)。
【0048】
具体的には、サンプリング時間あたりの各周波数帯における各音階の大きさ(dB)を測定し、それらを各周波数帯で単純に足し合わせ、各オクターブ内で、各音階の周波数帯のdBの総和比率を面積比率とする。
【0049】
例えば、あるオクターブ内で、各音階の周波数帯のdBの総和は以下のようになったとする。
C:1000dB、C#:3000dB、D:2000dB、D#:2500dB、E:1500dB、F:2500dB、F#:500dB、G:0dB、G#:100dB、A:600dB、A#:300dB、B:1000dB
この場合、オクターブにおいて音階が占める割合は、
C:6.6%、C#:20.0%、D:13.3%、D#:16.7%、E:10.0%、F:16.7%、F#:3.3%、G:0.0%、G#:0.7%、A:4.0%、A#:2.0%、B:6.7%
となり、数字表示部16によって表示部3,12に表示される(
図5(A)参照)。
【0050】
なお、各周波数帯の総和 ÷ サンプリング時間で計算すれば、より正確なデータが得られる。
【0051】
次いで、オクターブにおいて占める割合の大きい音階を左から右の順に並べて、数字表示部16によって表示部3,12に表示される(
図5(B)参照)。
【0052】
次いで、最大の音階と最小の音階を数字表示部16によって表示部3,12に表示される(
図5(C)参照)。この例では、最大の音階がC#、最小の音階がGであることがわかる。
【0053】
このように、オクターブに占める音階の割合を具体的な数字で示したり、最大の音階や最小の音階、あるいは最大の音階と最小の音階との差等を数字で示すことにより、それほど専門的な知識のない者であっても客観的かつ的確な診断が可能となる。
【0054】
次いで、診断部10により、音階決定部9によって決定された最大及び/又は最小の音階と、音階に関係する生体の感覚のバランスとに基づいて、生体の心理状態、健康状態又は思考パターンを診断し(ステップS5)、診断結果表示部11により、診断部10によって診断された結果及び/又は分布図表を表示部12やユーザ端末4の表示部3に表示させる(ステップS6)。記憶部13には最大及び/又は最小の音階、最大の音階と最小の音階との差等に応じた診断結果に関する情報が格納されている。
【0055】
ここで、本発明者は過去12年間で1万人以上の人間の声を診断し、8〜12秒の間に人間が発した声を分析することにより、その人の深層心理、思考パターン、相手にどのような影響を与えるか等がわかることを発見した。
【0056】
そして、人間が発する声の音階と、人間の感覚(五感)との関係性についてエビデンスをとったところ、
図6(A)に示すように、C〜D#が自己(自身自身)が抱く感覚(感情、本能等の感じる感覚)で、主に味覚・触覚・嗅覚が関係し、E〜Gが他者との係わりの中で抱く感覚(聞く感覚、聴く感覚)で、主に聴覚が関係し、G#〜Bが自己の外側で起きていることに対して抱く感覚(見る感覚、観る感覚)で、主に視覚が関係していることがわかった。
【0057】
例えば、
図6(B)に示すように、F#やGの音階の占める割合が最大の場合、他者思考つまり人を気にする傾向があると診断できる。認知症の者でこのパターンの傾向を示すことはほとんどいない。
【0058】
また、
図6(C)に示すように、C、C#の音階の占める割合が最大の場合、思いたったらすぐに行動する傾向があると診断できる。また、このパターンの者は、FやF#の音階の占める割合が最小になることが多く、相手を思いやる気持ちや理性を表す傾向が少ないと診断できる。認知症の者はこのパターンの場合が多いことがわかっている。
【0059】
また、
図7(A)に示すように、各音階の占める割合がほぼ均一の場合(最大の音階と最小の音階との差が小さい場合)、心理的に健康でバランスがとれて安定している傾向があると診断できる。
【0060】
図7(B)に示すように、D#、Eの音階で占めている場合、自己中心的で自分しか見えていない傾向があると診断できる。
【0061】
図7(C)に示すように、Gの音階で占めている場合、周りの者の影響を受けて振り回される傾向があると診断できる。また、パニック症の者はこのパターンの場合が多いことがわかっている。
【0062】
図7(D)に示すように、G#、A、A#の音階で占めている場合、頭で考えすぎているため、うつ状態の可能性があると診断できる。
【0063】
図7(E)に示すように、Cの音階で占めている場合、感情と行動が一緒になり、理性が働かない状態の傾向があると診断できる。また、認知症で徘徊する者はこのパターンの場合が多いことがわかっている。
【0064】
また、音階に応じて個性やキャリア診断も行うことが可能である。
【0065】
例えば、C(ド)の音階の占める割合が多い者は、行動力がある、現場での仕事が向いている等と診断できる。
【0066】
C#(ド#)の音階の占める割合が多い者は、本能的直感力がある、体を動かす仕事に向いている等と診断できる。
【0067】
D(レ)の音階の占める割合が多い者は、感性が豊かである、自分の感性を活かせる仕事が向いている等と診断できる。
【0068】
D#(レ#)の音階の占める割合が多い者は、意志力が強い、自分が腑に落ちることが仕事を選ぶ上で大事である等と診断できる。
【0069】
E(ミ)の音階の占める割合が多い者は、自分の意見を持っている、マイペースでできる仕事、自分が好奇心のある仕事が向いている等と診断できる。
【0070】
F(ファ)の音階の占める割合が多い者は、人を引っ張るリーダー的資質がある、自分の役割を与えられる仕事が向いている等と診断できる。
【0071】
F#(ファ#)の音階の占める割合が多い者は、共感力がある、コミュニケーション能力を活かした仕事に向いている等と診断できる。
【0072】
G(ソ)の音階の占める割合が多い者は、場の空気を汲み取れる、アイデアや創造力を活かせる仕事に向いている等と診断できる。
【0073】
G#(ソ#)の音階の占める割合が多い者は、全体を俯瞰し、ロジカル思考ができる。伝える、説明するといった分析する仕事に向いている等と診断できる。
【0074】
A(ラ)の音階の占める割合が多い者は、直観力、洞察力に長けている、コンサルティング、司令塔的な仕事が向いている等と診断できる。
【0075】
A#(ラ#)の音階の占める割合が多い者は、客観的思考を持っている、常に中立でいる、受容力を持って革新的な仕事に力を発揮する等と診断できる。
【0076】
B(シ)の音階の占める割合が多い者は、受容的な思考を持っている、気配り、サポートする仕事に向いている等と診断できる。
【0077】
また、生体の持つ心理状態を改善していくために必要な周波数を音階で特定することにより、よりスポット的に最短で効果を上げることができる。すなわち、その音階に影響を与える方法をこれまでのエビデンスから行動処方箋として体系化されている。
【0078】
例えば、C(ド)の音階の占める割合が低い場合には、「身体を動かす」という処方の診断がなされる。
【0079】
例えば、F#(ファ#)の音階の占める割合が低い場合には、「音楽を聴く」という処方の診断がなされる。
【0080】
例えば、B(シ)の音階の占める割合が低い場合には、「自然やペットと触れあう」という処方の診断がなされる。
【0081】
さらに、上記の行動処方箋を利用して、例えば、認知症の者は、C(ド)、C#(ド#)の音階で占めているので、E〜Bの音階に関係する感覚のバランスをとるように、「音楽を聴く」「自然やペットと触れあう」といった処方の診断がなされる。
【0082】
また、うつ病の者は、G#(ソ#)、A(ラ)、の音階で占めているので、
C-Gの音階に関係する感覚のバランスをとるように、「身体を動かす」「音楽を聴く」という処方の診断がなされる
【0083】
また、生体がストレス状態を感じている時に発生する音声データを入力してもよい。
【0084】
この場合、音階の占める割合が最大の音階がストレスの原因を示し、最小の音階がそのストレスの解決策を示すことがわかる。解決策の例としては、例えばジョギングの運動をした方がよい、ムード音楽を聴いた方がよい等であり、診断結果表示部11は、これらの解決策を表示部3,12に表示させてもよい。
【0085】
生体がストレス状態を感じている時に強くでる音階は、周波数として強く出ているということなので、本人が意識できていることということになる。つまり、本人にとっては自分で原因の確認ができることになる。
【0086】
認知症の者は、自分で確認することは難しいが、例えば家族の方が原因を知ることで、認知症本人とのコミュニケーションの中で、改善させることが可能である。例えば否定されるのが嫌だという原因の場合、家族が認知症の方に否定をしないように気をつけることで、徘徊が改善された例などもある。
【0087】
改善策としては本人も気付けていない、潜在の原因を知ることが解決策になることから、音階が占める割合が最小の音階を知ることが解決策になりえるのである。
【0088】
例えば解決策が自己肯定感を高めるということだとすると、一般の者であれば、ライフスタイルや自分自身の人生の中で、どうしたら自己肯定感が高まるかということで自分の生活を見直すきっかけになる。
【0089】
認知症の者では、家族の方が自己肯定感を取り戻せるような機会を作ったり、役割を与えたりすることで、自己肯定感が戻り、認知症の症状も改善も方向に進んでいくのである。
【0090】
また、生体がリラックス状態にある時に発生する音声データを入力してもよい。この場合、例えば音階は2050Hzからのオクターブの音階の中で占める割合が最大になっている音階を決定する。その決定された音階は、その者がリラックス状態になるためのきっかけ(スイッチ)となるものである。そして、その音階を毎日10分間程度、声に出して発生することにより、3つの感覚のバランスが改善され、認知症等の予防になることがわかった。
【0091】
診断結果表示部11では、リラックス状態になるための音階に関連する楽器の音、自然の音又は音楽の音データに関する音データ情報を表示部3、12に表示させてもよい。
【0092】
例えば、C(ド)の音階でリラックス状態になる者は、音、太鼓、打楽器の音やロック音楽の曲などが関連するので、それらの音データ情報を表示部3、12に表示させる。
【0093】
また、G(ソ)の音階でリラックス状態になる者は、ハープの音、チェロの音やバッハのプレリュードの曲などが関連するので、それらの音データ情報を表示部3、12に表示させる。
【0094】
また、診断結果表示部11では、音階に関連する本データに関する本データ情報を表示部3、12に表示させてもよい。例えば、能力開発を望む人の場合、C(ド)の音階の占める割合が低い場合は「お金や経済について学ぶ本」、G(ソ)の音階の占める割合が低い場合は「右脳開発系の本」、A(ラ)の音階の占める割合が低い場合は「コンサルタント系列の本」のように、音階とメンタル、能力の関係のデータに基づいて選書される。
【0095】
また、音声診断装置1には、音階に関連する楽器の音、自然の音又は音楽の音データ及び又は本データ(例えば電子書籍)を格納する記憶部13を有し、ユーザ端末4は、音声診断装置1の記憶部13に格納されている音データ及び又は本データを通信ネットワーク2を介してダウンロードできるように構成してもよい。
【0096】
図8では、テーブルからなる分布図表を、前述した生体の3つの感覚に関連する音階と、高周波数、中周波数、低周波数の3つのオクターブに基づいて9つのブロックに分割している。これによって、生体の3つの感覚のバランスと心の健康との関係を明確にすることができる。
【0097】
例えば、
図9(A)に示すように、○で示したオクターブの音階の中で占める割合が多い領域が各オクターブにわたって、生体の3つの感覚に対しバランスよく配置されている場合は、心の健康が保たれており、人間関係なども良好であると診断できる。
【0098】
図9(B)及び(C)のように、○で示したオクターブの音階の中で占める割合の多い領域が各オクターブにわたって、生体の3つの感覚が偏って配置されている場合は、心の健康が保たれておらず、何らかの対処が必要であると診断できる。
【0099】
図10は、円形の分布図表に周波数分布を表示した説明図であり、(A)は生体が改善する前の状態、(B)は改善後の状態を示す説明図である。
【0100】
リラックスしている時に発した時の声の波形は、普通に話した時の波形と比べると、普通に話した時に占める割合の少ない音階が出ていることがわかった。
また、各音階の占める割合が均一になっているほど、つまり最大の音階と最小の音階との差が少ないほど、心のバランスがとれたノーマルな状態だと考えられる(
図10(B)参照)。
【0101】
日常生活の中では中々リラックスできないので、自分が何の音階を発声するとリラックスするのかがわかっていると、リラックスできる状況でなくても、強制的に心をリラックスモードにすることができる。
【0102】
したがって、そのような音階を10分程度発声する習慣をとりいれると、心が整い、
図10(A)に示すような散在した分布状態から(B)に示すようなバランスの良好な分布状態に変えることが可能となり、心の状態がリラックス状態に改善されたことがわかる。
【0103】
なお、表示部3,12においては、必要なオクターブのデータだけ表示することもでき、指定したオクターブ、すべてのオクターブ等と適宜表示を変えることが可能である。
【0104】
本発明によれば、オクターブに占める割合が最大になる音階及び/又は最小になる音階と、音階に関係する生体の感覚のバランスとに基づいて、生体の心理状態、健康状態又は思考パターンを細かく分析でき、的確な診断を行うことができる。
【0105】
本発明は、上記実施の形態に限定されることはなく、特許請求の範囲に記載された技術的事項の範囲内において、種々の変更が可能である。
【解決手段】音声診断装置1は、生体の音声データを入力する音声入力部6と、音声入力部6によって入力された音声データを音声周波数データに変換する音声周波数変換部7と、音声周波数変換部7によって変換された音声周波数データを、音階とオクターブとで区分けされた複数の領域を含む分布図表に分布させる分布部8と、分布部8によって分布された音声周波数データについて、オクターブに占める割合が最大になる音階及び/又は最小になる音階を決定する音階決定部9と、音階決定部9によって決定された最大及び/又は最小の音階と、音階に関係する生体の感覚のバランスとに基づいて生体の心理状態、健康状態又は思考パターンを診断する診断部10と、診断部10によって診断された結果及び/又は分布図表を表示部3又はユーザ端末4の表示部3に表示させる診断結果表示部11とを有する。