IP Force 特許公報掲載プロジェクト 2022.1.31 β版

知財求人 - 知財ポータルサイト「IP Force」

▶ 株式会社イービーエムの特許一覧

特許7588445音声分析装置、音声分析システム、音声分析方法、及び音声分析プログラム
<>
  • 特許-音声分析装置、音声分析システム、音声分析方法、及び音声分析プログラム 図1
  • 特許-音声分析装置、音声分析システム、音声分析方法、及び音声分析プログラム 図2
  • 特許-音声分析装置、音声分析システム、音声分析方法、及び音声分析プログラム 図3
  • 特許-音声分析装置、音声分析システム、音声分析方法、及び音声分析プログラム 図4
  • 特許-音声分析装置、音声分析システム、音声分析方法、及び音声分析プログラム 図5
  • 特許-音声分析装置、音声分析システム、音声分析方法、及び音声分析プログラム 図6
  • 特許-音声分析装置、音声分析システム、音声分析方法、及び音声分析プログラム 図7
  • 特許-音声分析装置、音声分析システム、音声分析方法、及び音声分析プログラム 図8
  • 特許-音声分析装置、音声分析システム、音声分析方法、及び音声分析プログラム 図9
  • 特許-音声分析装置、音声分析システム、音声分析方法、及び音声分析プログラム 図10
  • 特許-音声分析装置、音声分析システム、音声分析方法、及び音声分析プログラム 図11
  • 特許-音声分析装置、音声分析システム、音声分析方法、及び音声分析プログラム 図12
  • 特許-音声分析装置、音声分析システム、音声分析方法、及び音声分析プログラム 図13
< >
(19)【発行国】日本国特許庁(JP)
(12)【公報種別】特許公報(B1)
(11)【特許番号】
(24)【登録日】2024-11-14
(45)【発行日】2024-11-22
(54)【発明の名称】音声分析装置、音声分析システム、音声分析方法、及び音声分析プログラム
(51)【国際特許分類】
   G10L 25/51 20130101AFI20241115BHJP
   G10L 25/90 20130101ALI20241115BHJP
【FI】
G10L25/51
G10L25/90
【請求項の数】 15
(21)【出願番号】P 2024105895
(22)【出願日】2024-07-01
【審査請求日】2024-07-01
(31)【優先権主張番号】P 2024074618
(32)【優先日】2024-05-02
(33)【優先権主張国・地域又は機関】JP
【早期審査対象出願】
(73)【特許権者】
【識別番号】501449481
【氏名又は名称】株式会社イービーエム
(74)【代理人】
【識別番号】100195327
【弁理士】
【氏名又は名称】森 博
(74)【代理人】
【識別番号】100200333
【弁理士】
【氏名又は名称】古賀 真二
(74)【代理人】
【識別番号】100229389
【弁理士】
【氏名又は名称】香田 淳也
(72)【発明者】
【氏名】柊木 匠
(72)【発明者】
【氏名】清賀 邦子
【審査官】土井 悠生
(56)【参考文献】
【文献】特開2023-114426(JP,A)
【文献】特開2017-192457(JP,A)
【文献】米国特許出願公開第2019/0374150(US,A1)
(58)【調査した分野】(Int.Cl.,DB名)
G10L 13/00-13/10
G10L 19/00-99/00
A61B 5/16
(57)【特許請求の範囲】
【請求項1】
利用者の音声データに基づいた分析を行う音声分析装置であって、
前記音声データに対する周波数分析により、オクターブを単位とした音域であるオクターブ音域における音階毎の特徴量である音階特徴量を抽出する特徴抽出部と、
感覚に基づいた基準である判断基準及び視点に基づいた基準である行動基準を基にして規定される特性要素と音階とを対応付けて、顕在意識に関連するオクターブ音域である顕在意識オクターブ音域、前意識に関連するオクターブ音域である前意識オクターブ音域、及び潜在意識に関連するオクターブ音域である潜在意識オクターブ音域における音階特徴量に基づいて、前記利用者の個性を判断する判断部と、を備えることを特徴とする音声分析装置。
【請求項2】
前記判断部が、音階特徴量に対する閾値を用いた、前記特徴抽出部が抽出する音階特徴量に対する判定により、前記利用者の個性を判断する請求項1に記載の音声分析装置。
【請求項3】
前記判断部が、前記判断基準及び前記行動基準に基づいて複数のタイプを規定して、前記閾値を用いた、前記特徴抽出部が抽出する前記潜在意識オクターブ音域の音階特徴量に対する判定により、前記利用者のタイプを判断する請求項2に記載の音声分析装置。
【請求項4】
前記判断部が、前記顕在意識オクターブ音域の音階特徴量と前記潜在意識オクターブ音域の音階特徴量との差分に関する情報を基に能力発揮度を規定して、前記特徴抽出部が抽出する前記顕在意識オクターブ音域の音階特徴量及び前記潜在意識オクターブ音域の音階特徴量に基づいて、前記利用者の能力発揮度を決定する請求項1に記載の音声分析装置。
【請求項5】
前記判断部の判断の結果を表示する表示部を更に備える請求項1に記載の音声分析装置。
【請求項6】
前記表示部が、前記特徴抽出部が抽出する音階特徴量を前記特性要素毎に表示する請求項5に記載の音声分析装置。
【請求項7】
前記表示部が、音階毎に規定される色を用いて、前記音階特徴量を表示する請求項6に記載の音声分析装置。
【請求項8】
前記音声データが、前記利用者が自分の名前を発声したデータである請求項1乃至7のいずれかに記載の音声分析装置。
【請求項9】
請求項1乃至4のいずれかに記載の音声分析装置と、前記利用者が使用する端末装置と、を備える音声分析システムであって、
前記端末装置が、前記利用者の音声データを前記音声分析装置に送信し、
前記音声分析装置が、前記判断部の判断の結果を前記端末装置に送信することを特徴とする音声分析システム。
【請求項10】
コンピュータが実行する、利用者の音声データに基づいた分析を行う音声分析方法であって、
前記音声データに対する周波数分析により、オクターブを単位とした音域であるオクターブ音域における音階毎の特徴量である音階特徴量を抽出する特徴抽出ステップと、
感覚に基づいた基準である判断基準及び視点に基づいた基準である行動基準を基にして規定される特性要素と音階とを対応付けて、顕在意識に関連するオクターブ音域である顕在意識オクターブ音域、前意識に関連するオクターブ音域である前意識オクターブ音域、及び潜在意識に関連するオクターブ音域である潜在意識オクターブ音域における音階特徴量に基づいて、前記利用者の個性を判断する判断ステップと、を有することを特徴とする音声分析方法。
【請求項11】
前記音声データが、前記利用者が自分の名前を発声したデータである請求項10に記載の音声分析方法。
【請求項12】
前記判断ステップでは、前記利用者に対するカウンセリングのために、前記利用者の個性を判断する請求項10に記載の音声分析方法。
【請求項13】
前記判断ステップでは、前記利用者に対する健康美容のアドバイスを含むカウンセリングのために、前記利用者の個性を判断する請求項12に記載の音声分析方法。
【請求項14】
前記顕在意識オクターブ音域の音階特徴量と前記潜在意識オクターブ音域の音階特徴量との差分に関する情報に基づいて、前記利用者の能力発揮度を求める請求項10に記載の音声分析方法。
【請求項15】
コンピュータに、請求項10乃至14のいずれに記載の音声分析方法を実行させるための音声分析プログラム。
【発明の詳細な説明】
【技術分野】
【0001】
本発明は、利用者の音声データに基づいた分析を行う音声分析装置、音声分析システム、音声分析方法、及び音声分析プログラムに関し、特に、利用者の個性に関連する分析を行う音声分析装置、音声分析システム、音声分析方法、及び音声分析プログラムに関する。
【背景技術】
【0002】
近年、人間関係や仕事において個性が重視されている。優秀な人材の採用や離職率低減のための適性検査、自分に適したキャリア形成のための自己診断等、個性を把握するための様々な試みがなされている。自分の個性に合わない人間関係や仕事環境に継続的に置かれた場合、ストレスや負荷を受け、体調不良やうつ病の原因になる可能性があり、会社としても、社員のモチベーションの低下等による生産性の低下を引き起こす可能性がある。
【0003】
個性を把握するために、適性検査やストレスチェック等のアンケート形式の方法が使用されることがある。しかし、個性には、本人が意識していない個性もあり、アンケート形式のような方法では、そのような個性を把握するのが難しい。元来、個性は多面性を有するので、自分の個性に適した人間関係や仕事環境等を構築するためには、本人が意識していない個性も含めて多面的に個性を把握する必要がある。多面的に個性を把握するに当たり、声に着目したものがある。声には様々な種類や特徴があり、発声者の体調、感情、思考等の多くの情報が有しているとの考えに基づいたものであり、声を分析することにより、個性を把握することができるとしている。このような声を分析することにより個性を把握しようとする技術が提案されている。
【0004】
例えば、特許文献1では、個体(発声者)から発せられた音声を分析することにより、発声者が有する特徴を把握する音声分析装置等が提案されている。特許文献1の音声分析装置は、音声に含まれる各音程の音量に基づいて特徴となる音程を特定し、特定した音程に基づいて発声者の特徴を把握する。特許文献1に記載の実施形態では、特徴となる音程として、最大音量の音程及び最小音量の音程を使用し、発声者の特徴を分類した特徴情報として、「色」、「質(クオリティー)」、「課題(イシュー)」、「曲情報」を使用し、特定した音程に基づいて発声者が有する「質」等の特徴情報を把握する。
【0005】
特許文献2では、生体(発声者)の音声の音階に基づいて、発声者の心理状態、健康状態又は思考パターンを分析し診断する音声診断装置等が提案されている。特許文献2の音声診断装置は、発声者の音声データを変換した音声周波数データから、オクターブに占める割合が最大になる音階及び/ 又は最小になる音階と、生体の感覚に関係している音階の占める割合とに基づいて、発声者の心理状態、健康状態又は思考パターンを診断する。特許文献2の音声診断装置では、人間が発する声の音階と、人間の感覚(五感)である味覚、触覚、嗅覚、聴覚及び視覚との関係性を用いて、診断を行う。
【0006】
特許文献3では、特許文献1の音声分析装置を、複数の個体(発声者)から発せられた音声を対象として適用する音声診断システムが提案されている。特許文献3の音声診断システムの処理内容は、特許文献1の音声分析装置と略同様である。特許文献3の音声診断システムでは、発声者の心理状態、健康状態又は思考パターンを診断するために、特許文献2の音声診断装置と同様の人間が発する声の音階と人間の感覚(五感)との関係性を用いるとしているが、具体的な診断方法は開示されていない。
【先行技術文献】
【特許文献】
【0007】
【文献】特開2007-212932号公報
【文献】特許第6029223号公報
【文献】特開2022-145373号公報
【発明の概要】
【発明が解決しようとする課題】
【0008】
しかしながら、特許文献1の音声分析装置では、特徴となる音程を特定し、特定した音程に対応する特徴情報を発声者の特徴としており、音程と特徴情報のみから発声者が有する特徴を把握しているので、多面性を有する個性を十分には把握できない可能性がある。特許文献2の音声診断装置では、音階と人間の感覚の関係性を用いて発声者の心理状態、健康状態又は思考パターンを診断しており、音階と感覚のみから診断しているので、やはり、個性を十分には把握できない可能性がある。特許文献3の音声診断システムは、特許文献1の音声分析装置と同様の処理を行うので、特許文献1の音声分析装置と同じ可能性を有する。
【0009】
本発明は上述のような事情よりなされたものであり、本発明の目的は、利用者の音声データに基づいて、利用者の個性を的確に判断することができる音声分析装置、音声分析システム、音声分析方法、及び音声分析プログラムを提供することにある。
【課題を解決するための手段】
【0010】
本発明者は、上記課題を解決すべく鋭意研究を重ねた結果、下記の発明が上記目的に合致することを見出し、本発明に至った。
すなわち、本発明は、以下の発明に係るものである。
【0011】
<1> 利用者の音声データに基づいた分析を行う音声分析装置であって、前記音声データに対する周波数分析により、オクターブを単位とした音域であるオクターブ音域における音階毎の特徴量である音階特徴量を抽出する特徴抽出部と、感覚に基づいた基準である判断基準及び視点に基づいた基準である行動基準を基にして規定される特性要素と音階とを対応付けて、顕在意識に関連するオクターブ音域である顕在意識オクターブ音域、前意識に関連するオクターブ音域である前意識オクターブ音域、及び潜在意識に関連するオクターブ音域である潜在意識オクターブ音域における音階特徴量に基づいて、前記利用者の個性を判断する判断部と、を備える音声分析装置。
<2> 前記判断部が、音階特徴量に対する閾値を用いた、前記特徴抽出部が抽出する音階特徴量に対する判定により、前記利用者の個性を判断する<1>に記載の音声分析装置。
<3> 前記判断部が、前記判断基準及び前記行動基準に基づいて複数のタイプを規定して、前記閾値を用いた、前記特徴抽出部が抽出する前記潜在意識オクターブ音域の音階特徴量に対する判定により、前記利用者のタイプを判断する<2>に記載の音声分析装置。
<4> 前記判断部が、前記顕在意識オクターブ音域の音階特徴量と前記潜在意識オクターブ音域の音階特徴量との差分に関する情報を基に能力発揮度を規定して、前記特徴抽出部が抽出する前記顕在意識オクターブ音域の音階特徴量及び前記潜在意識オクターブ音域の音階特徴量に基づいて、前記利用者の能力発揮度を決定する<1>から<3>のいずれかに記載の音声分析装置。
<5> 前記判断部の判断の結果を表示する表示部を更に備える<1>から<4>のいずれかに記載の音声分析装置。
<6> 前記表示部が、前記特徴抽出部が抽出する音階特徴量を前記特性要素毎に表示する<5>に記載の音声分析装置。
<7> 前記表示部が、音階毎に規定される色を用いて、前記音階特徴量を表示する<6>に記載の音声分析装置。
<8> 前記音声データが、前記利用者が自分の名前を発声したデータである<1>から<7>のいずれかに記載の音声分析装置。
<9> <1>から<4>のいずれかに記載の音声分析装置と、前記利用者が使用する端末装置と、を備える音声分析システムであって、前記端末装置が、前記利用者の音声データを前記音声分析装置に送信し、前記音声分析装置が、前記判断部の判断の結果を前記端末装置に送信する音声分析システム。
<10> 利用者の音声データに基づいた分析を行う音声分析方法であって、前記音声データに対する周波数分析により、オクターブを単位とした音域であるオクターブ音域における音階毎の特徴量である音階特徴量を抽出する特徴抽出ステップと、感覚に基づいた基準である判断基準及び視点に基づいた基準である行動基準を基にして規定される特性要素と音階とを対応付けて、顕在意識に関連するオクターブ音域である顕在意識オクターブ音域、前意識に関連するオクターブ音域である前意識オクターブ音域、及び潜在意識に関連するオクターブ音域である潜在意識オクターブ音域における音階特徴量に基づいて、前記利用者の個性を判断する判断ステップと、を有する音声分析方法。
<11> 前記音声データが、前記利用者が自分の名前を発声したデータである<10>に記載の音声分析方法。
<12> 前記判断ステップでは、前記利用者に対するカウンセリングのために、前記利用者の個性を判断する<10>または<11>に記載の音声分析方法。
<13> 前記判断ステップでは、前記利用者に対する健康美容のアドバイスを含むカウンセリングのために、前記利用者の個性を判断する<12>に記載の音声分析方法。
<14> 前記顕在意識オクターブ音域の音階特徴量と前記潜在意識オクターブ音域の音階特徴量との差分に関する情報に基づいて、前記利用者の能力発揮度を求める<10>から<13>のいずれかに記載の音声分析方法。
<15> コンピュータに、<10>から<14>のいずれに記載の音声分析方法を実行させるための音声分析プログラム。
【発明の効果】
【0012】
本発明の音声分析装置、音声分析システム、音声分析方法、及び音声分析プログラムによれば、音階毎の特徴量及び意識に関連するオクターブ音域という情報に基づいて、判断基準及び行動基準を基にして規定される特性要素を用いて利用者の個性を判断するので、多面性を有する個性を的確に判断することができる。
【図面の簡単な説明】
【0013】
図1】本発明に係る音声分析装置の構成例(第1実施形態)を示すブロック図である。
図2】記憶部に記憶される音階情報テーブルの例を示すイメージ図である。
図3】タイプ分類表の例を示す図である。
図4】記憶部に記憶されるタイプ情報テーブルの例を示すイメージ図である。
図5】判断部の構成例(第1実施形態)を示すブロック図である。
図6】音階特徴量を表示するグラフの例を示す図である。
図7】音階特徴量を表示するためのレーダーチャートの例を示す図であり、(A)は音階特徴量を表示する前の図、(B)は音階特徴量を表示した図である。
図8】タイプの特徴の表示例を示す図であり、(A)はタイプの特徴を表示するための表示欄を示す図、(B)はタイプDの表示例を示す図である。
図9】音声分析装置の動作例(第1実施形態)を示すフローチャートである。
図10】本発明に係る音声分析装置の構成例(第2実施形態)を示すブロック図である。
図11】判断部の構成例(第2実施形態)を示すブロック図である。
図12】本発明に係る音声分析システムの構成例(第3実施形態)を示す図である。
図13】音声分析装置の構成例(第3実施形態)を示すブロック図である。
【発明を実施するための形態】
【0014】
本発明では、利用者の音声データに基づいて、利用者の個性を判断する。個性とは、個人又は個体・個物に備わった、そのもの特有の性質と定義され、その人の強みや弱み、適性、得手や不得手等、その人が有する様々な特徴を示すものであり、本発明では、利用者の個性を、利用者が自分の名前等を発声した音声データに基づいて判断する。
【0015】
本発明では、利用者の音声データに対して周波数分析を行うことにより、オクターブを単位とした音域(オクターブ音域)における音階毎の特徴量(音階特徴量)を抽出する。オクターブは、全音階で、ある音から8番目の音、また、その音間の隔たりと定義され、2音(ある音及び8番目の音)の振動数(周波数)の比が1対2になるものである。具体的には、「ある音を基準として、周波数が2倍になる音」が「1オクターブ上の音」に相当し、「ある音を基準として、周波数が1/2倍になる音」が「1オクターブ下の音」に相当する。
本発明において、「オクターブ音域」は、この隔たりで区切られた音域であり、ある音が属するオクターブ音域には、その音の1オクターブ上の音及び1オクターブ下の音は属さず、上下のオクターブ音域にそれぞれ属することになる。一般的に西洋音楽では音階はオクターブを枠としており、1オクターブは12音階(7つの全音と5つの半音)で構成される。本発明では、例えばこの構成において、各音階の特徴量が、周波数分析により音階特徴量として抽出される。なお、オクターブの範囲や音階には様々な種類があり、本発明は、各種のオクターブの範囲及び音階に対応可能である。
【0016】
本発明では、人間の意識に関連するオクターブ音域における音階特徴量に基づいて、利用者の個性を判断する。具体的には、本人が自覚している意識である顕在意識に関連するオクターブ音域(顕在意識オクターブ音域)、本人が自覚していない意識である潜在意識に関連するオクターブ音域(潜在意識オクターブ音域)、及び顕在意識と潜在意識の干渉領域である前意識に関連するオクターブ音域(前意識オクターブ音域)における音階特徴量に基づいて、利用者の個性を判断する。
【0017】
また、本発明では、判断基準及び行動基準を基にして規定される、個性を構成する要素(特性要素)を、各音階に対応付けて、利用者の個性の判断に利用する。判断基準は感覚に基づいた基準であり、利用者の中ではどの感覚が優位であるのか、どこで判断しているのか、つまり優位に働く感覚を特定するために使用される。行動基準は視点に基づいた基準であり、利用者は誰にために行動するのか、誰に視点があるのか、つまり行動の起点や視点となる対象者を特定するために使用される。
【0018】
このように、本発明では、音階を基にして、意識や判断基準及び行動基準の情報を用いて個性を判断するので、利用者の個性を的確で幅広く判断することができる。判断結果は、例えば、メンタルヘルス、健康や美容のアドバイス等のカウンセリングに利用することができる。
【0019】
本発明では、音階特徴量に対して閾値を設定し、利用者の音声データから抽出される音階特徴量に対する閾値判定により、利用者の個性を判断することが可能である。また、判断基準及び行動基準に基づいて複数のタイプを規定して、潜在意識オクターブ音域の音階特徴量に対する閾値判定により、利用者のタイプを判断することが可能である。さらに、本発明では、顕在意識オクターブ音域の音階特徴量と潜在意識オクターブ音域の音階特徴量との差分に関する情報に基づいて、利用者が自分の能力をどのくらい発揮しているかを示す能力発揮度を求めることが可能である。
【0020】
本発明では、特性要素毎の音階特徴量や利用者のタイプ等の判断結果を表示することが可能である。音階特徴量を色で表示したり、判断結果をグラフ等で表示したりすることにより、利用者にわかりやすく結果を伝えることができる。
【0021】
本発明は、上述の処理を音声分析装置として実現しても良いし、音声分析装置に加え、利用者の音声データを送信する端末装置を備える音声分析システムとして実現しても良い。この場合、端末装置に、音声分析装置による判断結果等を表示させることも可能である。これにより、利用者は、音声分析装置より離れた場所等の任意の場所から、個性を判断してもらうことができる。本発明は、上述の処理を行う音声分析方法として実現しても良いし、その音声分析方法をコンピュータに実行させるための音声分析プログラムとして実現しても良い。
【0022】
以下に、本発明の実施の形態を、図面を参照して説明する。なお、各図において、同一構成要素には同一符号を付し、説明を省略することがある。また、以下の説明における構成等は例示であり、本発明はこれらに限定されるものではない。さらに、以下では、本発明を実施するための主要な構成及び動作を中心にして説明しており、本発明を実施するために必要となる汎用的な処理、例えば通信処理等については説明を簡略又は省略することがある。
【0023】
図1に、本発明に係る音声分析装置の構成例(第1実施形態)を示す。本実施形態の音声分析装置1は、利用者が発声した音声(音声データ)を用いて、利用者の個性を判断し、判断した結果を表示する。個性の判断では、予め規定された複数のタイプから、利用者が当てはまるタイプを判断し、タイプに応じた健康美容のアドバイス等を出力して、利用者に対するカウンセリングに利用することができるようになっている。
【0024】
音声分析装置1では、「感覚」、「視点」及び「意識」の観点から個性を定義して、利用者の個性を判断する。
【0025】
「感覚」の観点からは、人間の感覚のうちのどの感覚が優位であるのか、どこで判断しているのか、どこから情報を取っているのか等、優位に働く感覚に基づいて個性を定義する。音声分析装置1では、感覚として、感じる感覚である体感覚(触覚、嗅覚、味覚)、聞く感覚である聴感覚(聴覚)、及び見る感覚である視感覚(視覚、見る直観(視的直観)、直観)を使用する。
【0026】
「視点」の観点からは、誰のために行動するのか、誰に視点があるのか、誰のために頑張っているのか等、行動の起点や視点となる対象者に基づいて個性を定義する。音声分析装置1では、対象者を、自分、相手及び社会の3つに分類し、それぞれ自分軸、相手軸及び社会軸として個性を定義する。自分軸は、自分に視点があり、自分のために行動する傾向を示し、相手軸は、相手に視点があり、相手のために行動する傾向を示し、社会軸は、皆に視点があり、皆のために行動する傾向を示す。
【0027】
「意識」の観点からは、どの意識領域で感じているのか、どこに意識があるのか等、人間の意識に基づいて個性を定義する。音声分析装置1では、意識を、顕在意識、潜在意識及び前意識の3つの領域に区分する。顕在意識は、本人が自覚している意識であり、今の思考状態に当たる思考領域である。潜在意識は、本人が自覚していない意識であり、本人が元来有する資質や本質に当たる資質本質領域である。前意識は、顕在意識と潜在意識の干渉する部分の意識であり、意識して行っている部分が無意識で行える程になった部分で、主に習慣やクセとして表れる習慣クセ領域である。
【0028】
音声分析装置1では、感覚に基づいた基準を判断基準とし、視点に基づいた基準を行動基準として、判断基準及び行動基準を基にして、3つの意識(顕在意識、前意識及び潜在意識)それぞれにおいて、個性を構成する特性要素を規定している。また、判断基準及び行動基準に基づいて個性を複数のタイプに分類し、各タイプの特徴を規定している。
【0029】
音声分析装置1は、利用者の音声データに対する周波数分析によりオクターブ音域における音階特徴量を抽出する特徴抽出部11と、顕在意識に関連する顕在意識オクターブ音域、前意識に関連する前意識オクターブ音域及び潜在意識に関連する潜在意識オクターブ音域における音階特徴量に基づいて、利用者の個性を判断する判断部12と、判断部12の判断の結果を表示する表示部13と、特徴抽出部11及び判断部12で使用される各種情報をテーブルとして記憶する記憶部14を備える。
【0030】
特徴抽出部11は、利用者の音声データVd及び利用者の性別を示す性別情報Giを入力し、顕在意識オクターブ音域における音階特徴量を含む思考オクターブ特徴Tof、前意識オクターブ音域における音階特徴量を含む習慣オクターブ特徴Hof及び潜在意識オクターブ音域における音階特徴量を含む資質オクターブ特徴Nofを出力する。
【0031】
利用者は、例えば自分の名前を所定の時間(例えば6秒間)発声する。名前は自分の定義であるとの考えから、個性を判断するために使用する音声データとして、自分の名前を発声したデータを使用するのが好ましい。利用者が発声した音声は、音声分析装置1が備えるマイク等の音声入力手段を介して、特徴抽出部11に音声データVdとして入力される。また、利用者の性別(男性、女性)を示す性別情報Giが、音声分析装置1が備えるキーボード等のデータ入力手段を介して、特徴抽出部11に入力される。なお、音声分析装置1とは異なる装置等で利用者の音声を録音し、その音声を音声データVdとして特徴抽出部11に入力するようにしても良い。また、音声分析装置1に利用者の性別等を事前に登録しておき、利用者の個性を判断する際に、登録された性別を性別情報Giとして特徴抽出部11に入力するようにしても良い。
【0032】
特徴抽出部11は、入力された音声データVdに対して、周波数分析の一手法であるフーリエ変換を適用することにより、時間領域のデータである音声データVdを、周波数領域のデータ(以下、「振幅データ」とする)に変換する。フーリエ変換として、デジタル信号に対して一般的に使用されている離散フーリエ変換や高速フーリエ変換等を使用する。なお、音声データVdの前後には無音区間(発声されていない区間)が存在することがあるので、音声データVdを振幅データに変換する際に、この無音区間を削除するようにしても良い。また、フーリエ変換以外の周波数分析の手法を使用して、音声データVdを振幅データに変換しても良い。
【0033】
特徴抽出部11は、利用者が発声する音声は8オクターブの音域を有するとして、振幅データが分布する周波数領域を8つのオクターブ音域に分割し、さらに、1オクターブは12音階で構成されるとして、各オクターブ音域を12の音階の音域(以下、「音階音域」とする)に分割する。以下、8つのオクターブ音域を、周波数が低い順にオクターブ0、オクターブ1、…、オクターブ7と表記し、12音階はC、C#、D、D#、E、F、F#、G、G#、A、A#、Bの表記を使用して、各オクターブ音域での音階の表記を、オクターブ音域の表記の末尾の数字を音階の表記の末尾に付けて、例えば、オクターブ0での音階CはC0、オクターブ7での音階A#はA#7と表記する。なお、オクターブ音域を区別する必要がないときの音階は、総称的にC~Bの表記を使用する。
【0034】
具体的な分割方法は、各オクターブ音域での各音階の中心の値(以下、「音階中心周波数」とする)を決定し、隣接する2つの音階の音階中心周波数の中央に位置する周波数を、その2つの音階の音階音域の境界値とする。例えば、C1、C#1及びD1の音階中心周波数をそれぞれ約65Hz、69Hz及び73Hzとする場合、境界値は約67Hz及び71Hzとなり、C#1の音階音域は約67~71Hzとなる。特徴抽出部11は、例えば、オクターブ0において、約33HzをC0の音階中心周波数とし、その値から2~3Hz間隔で増加した値を、以降のC#0~B0それぞれの音階中心周波数とし、オクターブ1~7においては、1つ前のオクターブ音域での同じ音階の音階中心周波数を2倍にした値を、各オクターブ音域での各音階の音階中心周波数とする。このように設定した場合、C7の音階中心周波数は約4186Hz、B7の音階中心周波数を約7902Hzとなる。このような音階中心周波数の設定は、平均律等の音律に基づいて行われるものである。
【0035】
特徴抽出部11は、各オクターブ音域の各音階音域を所定の数(例えば350)だけ分割し、分割された音域(以下、「チャンネル音域」とする)に含まれる振幅データの平均値(以下、「チャンネル振幅」とする)を求める。8つのオクターブ音域、12個の音階音域、350個のチャンネル音域の場合、特徴抽出部11は、振幅データから、33600個のチャンネル振幅を求めることになる。そして、特徴抽出部11は、各チャンネル振幅が、そのチャンネル振幅に対応するチェンネル音域を含むオクターブ音域の中で最大のチャンネル振幅に対する割合(百分率)(以下、「チャンネル振幅比」とする)を求める。例えば、オクターブ1での最大のチャンネル振幅が50で、C1における1つのチャンネル音域でのチャンネル振幅が15の場合、そのチャンネル音域でのチャンネル振幅比は30(=15/50×100)となる。求められたチャンネル振幅比に対して、高域のチャンネル振幅比を抑えるために、特徴抽出部11は、高域の音階音域(例えばE5~B7)でのチャンネル振幅比の大きさを徐々に小さくする高域フィルタ処理を行っても良い。例えば、特徴抽出部11は、高域の音階音域でのチャンネル振幅比に、1から0.4へと漸減する乗数を乗算することにより、高域フィルタ処理を行う。高域のチャンネル振幅比を抑える必要がない場合等では、特徴抽出部11は、高域フィルタ処理を行わなくても良い。
【0036】
特徴抽出部11は、各オクターブ音域の各音階音域において、その音階音域に含まれる全てのチャンネル振幅比を積分した値(以下、「音階積分値」とする)を求める。8つのオクターブ音域、12個の音階音域、350個のチャンネル音域の場合、96個の音階積分値が求められる。
【0037】
音声分析装置1は、上述のように、3つの意識(顕在意識、前意識及び潜在意識)それぞれにおいて規定される特性要素に基づいて個性を判断している。個性を判断するに当たり、3つの意識それぞれに関連するオクターブ音域(顕在意識オクターブ音域、前意識オクターブ音域及び潜在オクターブ音域(以下、「意識オクターブ音域」と総称することがある))が、知見により予め決められている。1つの意識に対して複数のオクターブ音域が関連することがあり、それら全てを意識オクターブ音域とすることも、その中の1つを意識オクターブ音域とすることも可能である。また、周波数が低いオクターブ音域が潜在意識に、周波数が高いオクターブ音域が顕在意識に関連するとの考えから、各意識に関連するオクターブ音域に性別で違いを持たせることがある。例えば、音声分析装置1では、男性では、オクターブ6及び7が顕在意識に関連し、オクターブ2及び3が前意識に関連し、オクターブ0及び1が潜在意識に関連し、女性では、オクターブ6及び7が顕在意識に関連し、オクターブ3及び4が前意識に関連し、オクターブ1及び2が潜在意識に関連するとして、男性では、オクターブ7を意識オクターブ音域、オクターブ3を前意識オクターブ音域、オクターブ0を潜在オクターブ音域とし、女性の場合、オクターブ7が顕在意識オクターブ音域、オクターブ4を前意識オクターブ音域、オクターブ1を潜在オクターブ音域とする。
意識とオクターブ音域の対応は、意識対応情報テーブルとして予め記憶部14に記憶されている。
【0038】
特徴抽出部11は、入力する性別情報Giから利用者の性別を判断し、判断した性別における顕在意識オクターブ音域、前意識オクターブ音域及び潜在オクターブ音域であるオクターブ音域の情報を、記憶部14内の意識対応情報テーブルから意識オクターブ情報Coiとして読み出す。例えば、性別情報Giが「女性」の場合、顕在意識オクターブ音域、前意識オクターブ音域及び潜在オクターブ音域がそれぞれオクターブ7、4及び1であるという情報が、意識オクターブ情報Coiとして読み出される。
【0039】
特徴抽出部11は、意識オクターブ情報Coiにより各意識オクターブ音域に対応するオクターブ音域を確認した後、各意識オクターブ音域での音階積分値が、所定の範囲の整数値(例えば、0~10の整数値)となるように、正規化処理(ノーマライズ)を行う。例えば、性別毎に各意識オクターブ音域での音階積分値を除算する調整値を予め決めて、各意識オクターブ音域での音階積分値を、対応する調整値で除算し、除算結果を整数化する。調整値は、事前に収集した音声データ等を用いて予め求めておき、記憶部14が記憶する意識対応情報テーブルに、意識とオクターブ音域の対応関係と共に、格納しておく。例えば、顕在意識オクターブ音域、前意識オクターブ音域及び潜在オクターブ音域それぞれにおける調整値として、男性の場合は28、27及び24を、女性の場合は21、32及び25を格納しておく。
【0040】
整数化は、例えば、除算結果が1未満は0とし、1以上は小数点以下を四捨五入することにより行う。除算結果が10を超えた場合は、10に丸め込む。正規化処理を行われた音階積分値が、音階特徴量となる。なお、除算結果が10を超えることが頻発する場合等に対応できるように、調整値を変更できるようにしても良い。
【0041】
特徴抽出部11は、意識オクターブ情報Coiを入力する場合と同様に、性別情報Giから利用者の性別を判断し、判断した性別における各意識オクターブ音域での調整値を、記憶部14内の意識対応情報テーブルから調整値情報Nviとして読み出す。例えば、性別情報Giが「男性」の場合、顕在意識オクターブ音域、前意識オクターブ音域及び潜在オクターブ音域それぞれでの調整値28、27及び24が、調整値情報Nviとして読み出される。特徴抽出部11は、読み出した調整値を用いて、各意識オクターブ音域での音階積分値に対して正規化処理を行い、音階特徴量を求める。そして、顕在意識オクターブ音域における音階特徴量は思考オクターブ特徴Tofとして、前意識オクターブ音域における音階特徴量は習慣オクターブ特徴Hofとして、潜在意識オクターブ音域における音階特徴量は資質オクターブ特徴Nofとして出力される。なお、特徴抽出部11は、意識オクターブ情報Coiを読み出す際に、同時に調整値情報Nviを読み出すようにしても良い。
【0042】
判断部12は、思考オクターブ特徴Tof、習慣オクターブ特徴Hof及び資質オクターブ特徴Nofを入力し、利用者の個性を判断して、判断の結果を個性情報Pi及びタイプ情報Tiとして出力する。
【0043】
音声分析装置1は、上述のように、感覚に基づいた判断基準及び視点に基づいた行動基準を基にして、3つの意識(顕在意識、前意識及び潜在意識)それぞれにおいて規定される特性要素に基づいて個性を判断する。特性要素は音階と対応付けられており、さらに、各音階はその特徴を表す色とも対応付けられており、音階と色及び特性要素との対応は、音階情報テーブルとして予め記憶部14に記憶されている。
【0044】
音階情報テーブルの例を図2に示す。図2では、各音階に対応する色が2列目に記載されており、潜在意識、前意識及び顕在意識それぞれにおいて各音階に対応する特性要素が、3、4及び5列目に記載されている。
【0045】
音階と色の関係性については、共感覚の1つである色聴という現象も知られており、様々な研究が行われている。音声分析装置1では、知見に基づいて、各音階に対応する色を図2に示されるように規定している。各音階に対応する色は、その音階に対応する特性要素にも関係しており、音声分析装置1は、音階、色及び特性要素を密接に関連付けて、個性を判断する。
【0046】
特性要素は、判断基準及び行動基準に基づいて規定されている。
判断基準は感覚に基づいた基準であり、音声分析装置1では、感覚として、体感覚(触覚、嗅覚、味覚)、聴感覚(聴覚)及び視感覚(視覚、視的直観、直観)を使用する。そして、この3つの感覚と音階(色)の対応において、体感覚はC(レッド)~D(オレンジ)に関係しており、聴感覚はF#(エメラルドグリーン)に関係しており、視感覚はG#(ブルー)~A#(ヴァイオレット)に関係していると考え、この考えが特性要素の規定において反映されている。
行動基準は視点に基づいた基準であり、音声分析装置1では、視点として、自分軸、相手軸及び社会軸を使用する。そして、この3つの軸と音階(色)の対応において、自分軸はE(イエロー)に関係しており、相手軸はG(ターコイズブルー)に関係しており、社会軸はB(マゼンタピンク)に関係していると考え、この考えが特性要素の規定において反映されている。
【0047】
特性要素は、顕在意識、前意識及び潜在意識それぞれにおいて規定されており、基本的には上述の判断基準及び行動基準の考えを基に規定されているが、各意識の特性に合わせて、図2に示されているように、表現を変えているものがある。
なお、図2に示されている色及び特性要素は一例であり、これ以外の規定も可能である。
【0048】
また、音声分析装置1は、上述のように、判断基準及び行動基準に基づいて個性を複数のタイプに分類して、利用者のタイプの判断を行っている。タイプの分類は、行動基準で使用される自分軸、相手軸及び社会軸を少なくとも使用して、それに判断基準を組み合わせることにより、行われる。音声分析装置1は、例えば、図3に示されるように、13個のタイプに個性を分類する(以下、図3に示される表を「タイプ分類表」とする)。図3に示されるタイプ分類表では、13個のタイプ(タイプA~タイプM)毎に、各タイプが関係する行動基準及び判断基準の要素が記載されており、タイプを判断された利用者は、判断されたタイプに記載されている要素を有することを意味する。“-”は、関係する特定の要素がないことを示す。なお、図3に示されるタイプは一例であり、これ以外のタイプの分類も可能である。
【0049】
音声分析装置1は、各タイプの特徴を規定しており、その内容は、タイプ情報テーブルとして予め記憶部14に記憶されている。音声分析装置1は、タイプの特徴を、例えば「タイプ名」、「特性」、「得意なこと」、「苦手なこと」、「疲労タイプ名」、「疲労タイプの説明」、「健康美容アドバイス」等の項目に分けて規定しており、タイプ情報テーブルには、タイプ毎に、各項目の具体的な内容が記載されている。
【0050】
図4にタイプ情報テーブルの代表例として、タイプA~Eそれぞれの特徴の例を示す。図4では、各タイプにおいて、「タイプ名」、「特性」、「得意なこと」、「苦手なこと」、「疲労タイプ名」、「疲労タイプの説明」及び「健康美容アドバイス」の項目の順番で、特徴の具体的な内容が記載されている。タイプ情報テーブルに記載されている内容から、利用者は、自分のタイプの特徴の具体的な内容を理解することができる。
【0051】
判断部12は、特性要素に基づいて利用者の個性の判断を行う処理(以下、「特性分析処理」とする)と、利用者のタイプを判断する処理(以下、「タイプ判断処理」とする)を行う。図5に判断部12の構成例を示しており、判断部12は、特性分析処理を行う特性分析部121と、タイプ判断処理を行うタイプ判断部122を備える。判断部12に入力される思考オクターブ特徴Tof及び習慣オクターブ特徴Hofは特性分析部121に、資質オクターブ特徴Nofは特性分析部121及びタイプ判断部122に入力される。
【0052】
特性分析部121は、記憶部14に記憶されている音階情報テーブル内のデータ(色、特性要素)を音階情報Si1として読み出し、顕在意識での各音階のデータと思考オクターブ特徴Tofに含まれる音階特徴量を対応付け、前意識での各音階のデータと習慣オクターブ特徴Hofに含まれる音階特徴量を対応付け、潜在意識での各音階のデータと資質オクターブ特徴Nofに含まれる音階特徴量を対応付けて、個性情報Piとして出力する。音階特徴量の大きさが、その音階特徴量と対応付けられている特性要素の強さを示しており、音階特徴量が大きいほど、対応する特性要素を利用者が強く有していることを示す。
【0053】
タイプ判断部122は、資質オクターブ特徴Nofを用いて、タイプ判断処理を行う。潜在意識は本人が元々持っている資質本質の領域で、特性や適性を決める重要な領域であるとの考えから、潜在意識オクターブ音域における音階特徴量を含む資質オクターブ特徴Nofを用いて、利用者のタイプを判断する。
【0054】
利用者のタイプを判断するために、タイプ判断部122は、音階特徴量に対する閾値を予め設定し(例えば値が2の閾値)、資質オクターブ特徴Nofに含まれる音階特徴量に対して、閾値を用いた判定を行う。タイプ判断部122は、閾値を超えている音階特徴量に対応する音階の特性要素を、記憶部14に記憶されている音階情報テーブルから音階情報Si2として読み出す。そして、読み出した音階情報Si2を基に、タイプ判断部122は、図3に示されるタイプ分類表に従って、利用者のタイプを判断する。例えば、音階G及びG#の音階特徴量のみが閾値を超えていた場合、利用者は音階G及びG#の特性要素である相手軸及び視覚/思考を有するとして、利用者のタイプはタイプDと判断される。タイプ判断部122は、判断したタイプの特徴を、記憶部14に記憶されているタイプ情報テーブルから、タイプ情報Tiとして読み出して、出力する。
【0055】
表示部13は、個性情報Pi及びタイプ情報Tiを入力し、利用者の個性の判断結果として、音声分析装置1が備えるディスプレイ等の表示手段に表示する。
【0056】
表示部13は、個性情報Piを基に、例えば、図6に示されるように、3つの意識(潜在意識、前意識及び顕在意識)毎に、音階特徴量をグラフとして表示する。図6では、縦軸を音階特徴量、横軸を特性要素として音階特徴量を示した棒グラフを、意識毎に並べて表示している。グラフで表示することにより、各意識において顕著な特性要素を容易に把握でき、意識間での違いも容易に把握することができる。図6に示される棒グラフにおいて、各特性要素の棒を、その特性要素に対応する色を使用して表示するようにしても良い。色を使用することにより、全体的なイメージも表現できるようになる。また、タイプ判断部122で使用する閾値を個性情報Piに含ませ、潜在意識の棒グラフに加え、前意識及び顕在意識の棒グラフにおいて、閾値がわかるように、例えば閾値の位置に線を引いても良い。これにより、音階特徴量が閾値を超えている特性要素を容易に把握することができ、利用者の個性の把握の助けとなる。
【0057】
表示部13は、音階特徴量を、図7(A)に示されるようなレーダーチャートで表示しても良い。図7(A)に示されるレーダーチャートは正十二角形の形をしており、各頂点が音階に対応している。正十二角形の中心と各頂点が線分で結ばれており、中心を0として、各頂点に向かって同じ間隔で目盛りが設定されている。このレーダーチャートに、意識毎に、音階特徴量をプロットして線で結び、個性情報Piのデータを表示する。
【0058】
図6に示される音階特徴量を表示するグラフの例に対応するレーダーチャートでの表示例を図7(B)に示す。図7(B)では、潜在意識(潜在意識オクターブ音域)の音階特徴量を実線L1で、前意識(前意識オクターブ音域)の音階特徴量を破線L2で、顕在意識(顕在意識オクターブ音域)の音階特徴量を一点鎖線L3で、それぞれ表示している。図7(B)では、線種を変えることにより、各意識の音階特徴量を区別しているが、線の色を変えて区別するようにしても良い。また、可能ならば重合しても見えるように線の内側を半透明の色で着色して、個性情報Piのデータを表示するようにしても良い。このようなレーダーチャートを使用することにより、利用者の各意識での個性の特徴をイメージしやすいように表現でき、意識間での違いも明確に表現することできる。
【0059】
表示部13は、タイプ情報Tiを基に、利用者の個性のタイプ及びその特徴を表示する。例えば、図8(A)に示されるように、タイプの特徴の項目毎に表示欄を設け、タイプ情報Tiに含まれるタイプの特徴を表示する。図8(A)において、「タイプ」欄には上段にタイプ名、下段にタイプの特性を、「得意」欄には得意なことを、「苦手」欄には苦手なことを、「疲労タイプ」欄には上段に疲労タイプ名、下段に疲労タイプの説明を、「健康・美容」欄には健康美容アドバイスを、それぞれ表示する。例として、タイプDと判断された場合の表示例を図8(B)に示す。タイプDの場合、「タイプ」欄には「頭脳明晰タイプ」及び「客観的な視点を持ち、考える力に優れた人。常にたくさんの情報を取り入れ処理する頭脳明晰なタイプです。」と表示され、「得意」欄には「客観的な視点を持ち、冷静に、深く考えることの出来る頭脳明晰な人。ITやデザインなど視覚を使う物事にも長けています。また、相手の視点に立ち相手のために頑張ることの出来る人です。」と表示され、「苦手」欄には「思考力が高い分、考え過ぎる傾向も。また、自己主張が控えめで、リーダーシップを取ること、会話でのコミュニケーションは苦手に感じることもあります。」と表示され、「疲労タイプ」欄には「情報疲れタイプ」及び「いつもたくさんの情報をキャッチし処理しているため、心身共にゆっくり休まる時間が少ない傾向にあります。情報過多による疲れを感じやすいタイプです。」と表示され、「健康・美容」欄には「酷使しがちな目周り、頭のコリをほぐしてあげると全身の疲れの解消にもつながります。また、意識的にスマホやパソコンから離れる時間を作ってみましょう。」と表示される。
【0060】
このように、表示部13が、グラフや表等を用いて、利用者の個性の判断結果をわかりやすく表示することにより、利用者は自分の個性を的確に把握することができる。また、利用者に対してカウンセリングを行う場合、利用者が理解しやすい表示となっているので、納得性が高いカウンセリングを行うことができると共に、疲労タイプや健康美容アドバイスまで伝えることができるので、幅広いカウンセリングを行うことができる。
【0061】
記憶部14は、上述の意識対応情報テーブル、音階情報テーブル及びタイプ情報テーブルを記憶する。なお、記憶部14を、特徴抽出部11、判断部12及び表示部13での各処理において使用及び/又は算出されるデータの一時記憶領域として使用しても良い。
【0062】
このような音声分析装置1の構成において、その動作例を、図9のフローチャートを参照して説明する。
【0063】
特徴抽出部11は、音声データVd及び性別情報Giを入力し(ステップS10)、フーリエ変換により、音声データVdを振幅データに変換する(ステップS20)。次に、特徴抽出部11は、各オクターブ音域の各音階音域での各チャンネル音域に含まれる振幅データの平均値を、チャンネル振幅として求める(ステップS30)。そして、各オクターブ音域において最大のチャンネル振幅を用いて、特徴抽出部11は、各オクターブ音域の各音階音域の各チャンネル音域において、そのチャンネル音域のチャンネル振幅より、チャンネル振幅比を求める(ステップS40)。この際、高域フィルタ処理を行っても良い。
【0064】
特徴抽出部11は、各オクターブ音域の各音階音域において、その音階音域に含まれるチャンネル振幅比を積分して、音階積分値を求める(ステップS50)。そして、特徴抽出部11は、性別情報Giから利用者の性別を判断し、記憶部14に記憶されている意識対応情報テーブルから、判断した性別に応じた意識オクターブ情報Coi及び調整値情報Nviを入力する。特徴抽出部11は、意識オクターブ情報Coiより、顕在意識オクターブ音域、前意識オクターブ音域及び潜在オクターブ音域に対応するオクターブ音域を確認し(ステップS60)、調整値情報Nviに含まれる調整値を用いて、各意識オクターブ音域での音階積分値に対して正規化処理を行い、音階特徴量を求める(ステップS70)。特徴抽出部11は、顕在意識オクターブ音域における音階特徴量は思考オクターブ特徴Tofとして、前意識オクターブ音域における音階特徴量は習慣オクターブ特徴Hofとして、潜在意識オクターブ音域における音階特徴量は資質オクターブ特徴Nofとして、判断部12に出力する。
【0065】
判断部12では、特性分析部121は、思考オクターブ特徴Tof、習慣オクターブ特徴Hof及び資質オクターブ特徴Nofを入力し、記憶部14に記憶されている音階情報テーブルから音階情報Si1を読み出し、それらを対応付けることにより、特性分析処理を行い、個性情報Piを求める(ステップS80)。個性情報Piは表示部13に出力される。
【0066】
タイプ判断部122は、資質オクターブ特徴Nofを用いて、タイプ判断処理を行い(ステップS90)、判断したタイプの特徴を、記憶部14に記憶されているタイプ情報テーブルからタイプ情報Tiとして読み出す(ステップS100)。タイプ情報Tiは表示部13に出力される。
【0067】
表示部13は、個性情報Piに基づいて、図6及び/又は図7に示されるような形態で、音階特徴量を表示する(ステップS110)。また、表示部13は、タイプ情報Tiに基づいて、図8に示されるような形態で、利用者の個性のタイプ及びその特徴を表示する(ステップS120)。
なお、図9におけるデータ入力及び演算等の順番は適宜変更可能である。
【0068】
本実施形態に対して、以下のような変形が可能である。
【0069】
音声分析装置1では、音声データとして利用者の名前を発声した音声を使用しているが、利用者の名前以外を発声した音声データを使用しても良い。例えば、他の人の名前や会社名等の自分とは異なる対象の名前を発声した音声データを使用しても良い。この場合、発声した音声にはその対象に対する感情や気持ちが表出するという考えから、特性要素やタイプの特徴に、利用者の名前を発声した場合と違いが生じることがある。
【0070】
音声分析装置1では、判断部12は、顕在意識オクターブ音域、前意識オクターブ音域及び潜在オクターブ音域での音階特徴量を使用して利用者の個性を判断しており、他のオクターブ音域の音階特徴量は使用していないが、利用者の個性の判断に、他のオクターブ音域の音階特徴量を使用しても良い。逆に、特徴抽出部11は、音階特徴量を求めるまでの処理を、意識オクターブ音域のみに限定して行うようにしても良い。また、各意識に関連するオクターブ音域は性別で変えているが、性別以外、例えば年齢、人種等で変えても良い。
【0071】
音声分析装置1において、判断部12での特性分析部121の特性分析処理を表示部13が行うようにしても良い。すなわち、表示部13が、思考オクターブ特徴Tof、習慣オクターブ特徴Hof及び資質オクターブ特徴Nofを入力し、記憶部14に記憶されている音階情報テーブルから音階情報Si1を読み出して、これらを表示する。この場合、判断部12は、タイプ判断部122のみを備え、資質オクターブ特徴Nofのみを入力するようにしても良い。
また、判断部12でのタイプ判断部122は、判断したタイプのみを表示部13に出力し、表示部13が、入力したタイプに対応するタイプの特徴を、記憶部14に記憶されているタイプ情報テーブルから読み出して、表示するようにしても良い。
【0072】
音声分析装置1は、特徴抽出部11が出力する思考オクターブ特徴Tof、習慣オクターブ特徴Hof及び資質オクターブ特徴Nofを、例えば記憶部14に記憶するようにしても良い。過去に求めたこれらのデータを記憶することにより、利用者の個性の経時変化を確認することができる。経時変化を確認するということであれば、利用者の音声データVd及び/又はタイプ情報Tiを記憶しても良い。音声分析装置1が複数の利用者のデータを記憶する場合、利用者を特定できるように、例えば、利用者毎に、利用者を特定する識別番号等をそれらのデータと共に記憶する。
【0073】
本発明の他の実施形態について説明する。
【0074】
まず、本発明の第2の実施の形態について説明する。
第1実施形態での音声分析装置1では、判断部12は特性要素に基づいた利用者の個性の判断と利用者のタイプの判断を行っているが、これらに加えて、利用者が自分の能力をどのくらい発揮しているかを示す能力発揮度を求めることも可能である。
【0075】
能力発揮度も求める音声分析装置1の構成例(第2実施形態)を図10に示す。図1に示される第1実施形態での音声分析装置1と比べると、第2実施形態での音声分析装置2では、判断部12及び表示部13がそれぞれ判断部22及び表示部23に変わっている。
【0076】
判断部22は、音声分析装置1での判断部12と同様に、特性分析処理及びタイプ判断処理を行い、それらに加えて、能力発揮度を決定する。判断部22の構成例を図11に示す。図5に示される判断部12と比べると、判断部22では、発揮度決定部123が追加されている。そして、思考オクターブ特徴Tof及び資質オクターブ特徴Nofは、発揮度決定部123にも入力される。
【0077】
発揮度決定部123は、利用者の能力発揮度を決定する。
音声分析装置2では、資質本質領域である潜在意識に存在するものが、思考領域である顕在意識に表出すれば、能力を発揮しているとして、能力発揮度は顕在意識と潜在意識とのギャップで測ることができると考え、顕在意識オクターブ音域における音階特徴量と潜在意識オクターブ音域における音階特徴量との差分に関する情報を基に、能力発揮度を規定する。例えば、各音階において、顕在意識オクターブ音域での音階特徴量から潜在意識オクターブ音域での音階特徴量を引いた結果(差)を用いて、値がマイナスとなる差の数及び差の大きさを基に、能力発揮度を規定する。例えば、「値がマイナスとなる差がない」場合の能力発揮度を100とし、「値が-5以下となる差が5つある」場合の能力発揮度を10とする。
【0078】
発揮度決定部123は、特徴抽出部11から出力される思考オクターブ特徴Tof及び資質オクターブ特徴Nofを入力する。そして、発揮度決定部123は、音階毎に、思考オクターブ特徴Tofに含まれる音階特徴量と資質オクターブ特徴Nofに含まれる音階特徴量の差を算出し、算出された差を用いて、能力発揮度を決定する。決定された能力発揮度は、能力発揮度Adとして、表示部23に出力される。
【0079】
表示部23は、音声分析装置1での表示部13と同様に、個性情報Pi及びタイプ情報Tiを入力し、3つの意識毎の音階特徴量と利用者の個性のタイプを表示する。さらに、表示部23は、能力発揮度Adを入力し、利用者の能力発揮度を表示する。
【0080】
音声分析装置2の動作例は、発揮度決定部123による上記の動作と、表示部23での能力発揮度の表示の動作が加わるだけで、他は音声分析装置1の動作例と同様の動作である。
【0081】
本発明の第3の実施の形態について説明する。
第1実施形態での音声分析装置1は、利用者の音声データからの個性の判断を単体で行っているが、例えば、利用者の音声データの送信及び個性の判断結果の受信を行う端末装置と、利用者の音声データの受信及び個性の判断結果の送信を行う音声分析装置を備える音声分析システムにより利用者の個性の判断を行うことも可能である。端末装置と音声分析装置を、ネットワークを介して接続することにより、利用者は任意の場所から個性の判断を行うことができる。
【0082】
上述のような音声分析システムの構成例(第3実施形態)を図12に示す。
音声分析システム3は、利用者が使用する端末装置4と利用者の個性を判断する音声分析装置5を備え、それらが、インターネット等で構成されるネットワーク6を介して接続される。端末装置4として、例えばスマートフォン、タブレット、パーソナルコンピュータ等の通信機能を有する汎用の情報機器を使用し、音声データの送信や判断結果の受信等をプログラム(アプリケーションプログラム)によって実行する。音声分析装置5としては、例えば汎用のサーバを使用し、サーバ上で動作するプログラムによって利用者の個性の判断を行う。なお、端末装置4及び/又は音声分析装置5を、汎用の装置ではなく、専用の装置としても良く、処理の一部又は全部をハードウェアで実行しても良い。
【0083】
端末装置4は、マイク等の音声入力手段により、利用者が発声した音声を入力し、無線又は有線でネットワーク6と接続している通信手段により、音声データVdcとして音声分析装置5に送信する。また、タッチパネル等のデータ入力手段により、利用者の性別を示す情報を入力し、同じく、通信手段により性別情報Gicとして音声分析装置5に送信する。音声分析装置5が複数の端末装置4と接続可能な場合、音声データVdcや性別情報Gicを送信した端末装置4を特定できるように、例えば、端末装置4を特定する識別番号等(以下、「端末番号」とする)を端末装置4から音声分析装置5に送信する。なお、端末装置4とは異なる装置等で利用者の音声を録音し、その音声を端末装置4が音声データVdcとして音声分析装置5に送信するようにしても良い。また、音声分析装置5に利用者の性別等を事前に登録しておき、利用者を特定する識別番号等(以下、「利用者番号」とする)を端末装置4から音声分析装置5に送信し、それを基に音声分析装置5が利用者の性別を判別するようにしても良い。この際、利用者番号により端末装置4を特定できる場合は、端末番号を端末装置4から音声分析装置5に送信しなくても良い。端末装置4は、音声分析装置5に送信するこれらのデータを、1つのデータに纏めて送信するようにしても良い。
【0084】
音声分析装置5の構成例を図13に示す。図1に示される第1実施形態での音声分析装置1と比べると、第3実施形態での音声分析装置5は、表示部13を備えておらず、新たに通信部15を備えており、特徴抽出部11は、音声データVd及び性別情報Giを通信部15から入力し、判断部12は、個性情報Pi及びタイプ情報Tiを通信部15に出力する。
【0085】
通信部15は、音声分析装置5が備える通信手段を介して、端末装置4から送信される音声データVdc及び性別情報Gicを受信し、それぞれ音声データVd及び性別情報Giとして特徴抽出部11に出力する。この際、送信に必要な情報等が音声データVdc及び性別情報Gicに付加されていた場合、それらを除いて、音声データVd及び性別情報Giとして出力するようにしても良い。
【0086】
また、通信部15は、判断部12が出力する個性情報Pi及びタイプ情報Tiを入力し、それぞれ個性情報Pic及びタイプ情報Ticとして、通信手段を介して端末装置4に送信する。この際、送信に必要な情報(端末番号等)を付加する必要がある場合、個性情報Pi及びタイプ情報Tiにそれらを付加して、個性情報Pic及びタイプ情報Ticとして送信しても良い。なお、通信部15は、個性情報Pic及びタイプ情報Ticを、1つのデータに纏めて端末装置4に送信するようにしても良い。
【0087】
端末装置4は、音声分析装置5から送信される個性情報Pic及びタイプ情報Ticを、通信手段により受信する。そして、音声分析装置1での表示部13と同様に、個性情報Pic及びタイプ情報Ticを基に、音声分析装置5による利用者の個性の判断結果を、液晶パネル等の表示手段に表示する。この際、図6に示されるようなグラフや図7に示されるようなレーダーチャート等の画像を音声分析装置5が作成し、これらの画像の情報を個性情報Pic及びタイプ情報Ticとして端末装置4に送信し、端末装置4は、送信された画像の表示のみを行うようにしても良い。
【0088】
音声分析装置5の動作例は、通信部15による上記の動作が加わり、表示部13での動作がないだけで、他は音声分析装置1の動作例と同様の動作である。
【0089】
なお、音声分析装置5は、音声分析装置1と同様に表示部13を備えて、音声分析装置5でも利用者の個性の判断結果を表示するようにしても良い。この場合、端末装置4は、利用者の音声データ等の送信のみを行うようにしても良い。また、端末装置4は、アプリケーションプログラムを起動することにより、音声分析装置5とのデータの送受信等を行っているが、音声分析装置5に利用者の個性を判断するためのWebサイトを構築し、端末装置4に汎用のWebブラウザを搭載し、ネットワークプロトコルとしてHTTP(Hypertext Transfer Protocol)を使用して、音声分析装置5上のWebサイトと端末装置4上のWebブラウザの間で、ネットワーク6を介して、HTML(Hypertext Markup Language)ページ等の情報の送受信を行うことにより、音声分析装置5とのデータの送受信等を行うようにしても良い。
【0090】
上述の実施形態は、記憶部14をメモリとして、それ以外の構成要素の処理を、上述のようにプログラムとして実現することにより、コンピュータとメモリの構成で実現可能である。各構成要素は専用IC(Integrated Circuit)やFPGA(Field Programmable Gate Array)等のハードウェアでも実現可能である。また、上述の実施形態は装置又はシステムとしての形態で説明されているが、本発明は、方法又はプログラムとしての形態を取ることも可能である。
【0091】
なお、本発明は上記形態に限定されるものではなく、本発明の要旨を逸脱しない範囲で種々の変形が可能である。また、上記形態において明示的に開示されていない事項は、当業者が通常実施する範囲を逸脱するものではなく、通常の当業者であれば、容易に想定することが可能な値を採用することができる。
【符号の説明】
【0092】
1、2、5 音声分析装置
3 音声分析システム
4 端末装置
6 ネットワーク
11 特徴抽出部
12、22 判断部
13、23 表示部
14 記憶部
15 通信部
121 特性分析部
122 タイプ判断部
123 発揮度決定部
【要約】
【課題】利用者の音声データに基づいて、利用者の個性を的確に判断することができる音声分析装置、音声分析システム、音声分析方法、及び音声分析プログラムを提供する。
【解決手段】利用者の音声データに基づいた分析を行う音声分析装置であって、音声データに対する周波数分析により、オクターブを単位とした音域であるオクターブ音域における音階毎の特徴量である音階特徴量を抽出する特徴抽出部と、感覚に基づいた基準である判断基準及び視点に基づいた基準である行動基準を基にして規定される特性要素と音階とを対応付けて、顕在意識に関連するオクターブ音域である顕在意識オクターブ音域、前意識に関連するオクターブ音域である前意識オクターブ音域、及び潜在意識に関連するオクターブ音域である潜在意識オクターブ音域における音階特徴量に基づいて、利用者の個性を判断する判断部と、を備える。
【選択図】図1
図1
図2
図3
図4
図5
図6
図7
図8
図9
図10
図11
図12
図13