(19)【発行国】日本国特許庁(JP)
(12)【公報種別】公開特許公報(A)
(11)【公開番号】P2024037614
(43)【公開日】2024-03-19
(54)【発明の名称】所定対象用の感情辞書を生成するプログラム、装置、システム及び方法、並びに感情推定プログラム及び装置
(51)【国際特許分類】
G06F 40/30 20200101AFI20240312BHJP
G10L 15/10 20060101ALI20240312BHJP
G10L 15/06 20130101ALI20240312BHJP
【FI】
G06F40/30
G10L15/10 500N
G10L15/06 500Z
【審査請求】未請求
【請求項の数】10
【出願形態】OL
(21)【出願番号】P 2022142563
(22)【出願日】2022-09-07
(71)【出願人】
【識別番号】000208891
【氏名又は名称】KDDI株式会社
(74)【代理人】
【識別番号】100135068
【弁理士】
【氏名又は名称】早原 茂樹
(74)【代理人】
【識別番号】100141313
【弁理士】
【氏名又は名称】辰巳 富彦
(72)【発明者】
【氏名】ハンマールンド ハンプス
(72)【発明者】
【氏名】永田 雅俊
【テーマコード(参考)】
5B091
【Fターム(参考)】
5B091AA15
5B091CA12
5B091CB12
5B091CC04
(57)【要約】
【課題】所定の対象用の感情辞書を生成又は更新するための感情辞書情報を自動的に生成可能なプログラムを提供する。
【解決手段】本感情辞書生成プログラムは、所定の対象の音声データをテキストデータに変換する変換手段と、この音声データから感情識別モデルを用いて対象の感情に係る情報を決定する感情決定手段と、対象の語、句、節若しくは文と感情に係る情報とを対応付けて登録した感情辞書を生成又は更新するための感情辞書情報であって、変換後のテキストデータに含まれる語、句、節若しくは文と、決定された感情に係る情報とを対応付けた感情辞書情報を生成し出力する辞書生成手段としてコンピュータを機能させる。ここで辞書生成手段は、変換後のテキストデータと、このテキストデータに係る音声データから決定された感情に係る情報との組のうち、感情識別に係る確からしさが所定以上に高い組を用いて感情辞書情報を生成することも好ましい。
【選択図】
図1
【特許請求の範囲】
【請求項1】
取得された所定の対象の音声データをテキストデータに変換する変換手段と、
当該音声データから感情識別モデルを用いて当該対象の感情に係る情報を決定する感情決定手段と、
当該対象の語、句、節若しくは文と当該対象の感情に係る情報とを対応付けて登録した感情辞書を生成又は更新するための感情辞書情報であって、当該テキストデータに含まれる語、句、節若しくは文と、決定された感情に係る情報とを対応付けた感情辞書情報を生成し出力する辞書生成手段と
してコンピュータを機能させることを特徴とする感情辞書生成プログラム。
【請求項2】
前記辞書生成手段は、当該テキストデータと、該テキストデータに係る音声データから決定された当該感情に係る情報との組のうち、感情識別に係る確からしさが所定条件を満たすまでに高い組を用いて当該感情辞書情報を生成することを特徴とする請求項1に記載の感情辞書生成プログラム。
【請求項3】
請求項1又は2に記載の感情辞書生成プログラムによって生成又は更新された感情辞書を用い、当該対象によって表現された語、句、節若しくは文を含む推定対象データについての感情に係る情報を推定するプログラムであって、
取得された当該推定対象データに含まれる語、句、節若しくは文のうち、当該感情辞書に登録されていて、予め設定された複数種別の当該感情に係る情報のうちの1つに所定条件を満たすまでに強く対応付けられている語、句、節若しくは文を特定する感情語句等特定手段と、
当該推定対象データにおける特定された語、句、節若しくは文の有り無しに係る情報、及び、有りの場合において特定された語、句、節若しくは文に対応付けられている少なくとも1つの当該1つの感情に係る情報に基づき、当該推定対象データについての、又は当該推定対象データに含まれる語、句、節若しくは文についての感情に係る情報を決定する感情推定手段と
としてコンピュータを機能させることを特徴とする感情推定プログラム。
【請求項4】
前記感情語句等特定手段は、当該推定対象データに含まれる語、句、節若しくは文のうち、予め設定された複数種別の当該感情に係る情報のうちの1つに、対応度合いの平均からみて所定条件を満たすまでに大きく逸脱する形で強く対応付けられている語、句、節若しくは文を特定することを特徴とする請求項3に記載の感情推定プログラム。
【請求項5】
前記感情推定手段は、
当該推定対象データ内でウィンドウを順次スライドさせ、各位置のウィンドウにおいて、当該ウィンドウ内に当該特定された語、句、節若しくは文が少なくとも1つ存在する場合、当該特定された語、句、節若しくは文に対応付けられた当該1つの感情に係る情報のうちで所定条件を満たすまでに出現頻度の高いものを、当該ウィンドウについての感情に係る情報に決定し、
当該推定対象データに含まれる語、句、節若しくは文の各々について、当該語、句、節若しくは文を含む少なくとも1つの当該ウィンドウについて決定された感情に係る情報のうちで所定条件を満たすまでに出現頻度の高いものを、当該推定対象データに含まれる語、句、節若しくは文の各々についての感情に係る情報に決定する
ことを特徴とする請求項3に記載の感情推定プログラム。
【請求項6】
前記感情推定手段は、当該推定対象データが複数の文を含むものである場合、当該推定対象データに含まれる各文の前後に、パディング要素(padding element)を付与した上で、当該推定対象データ内でウィンドウを順次スライドさせ、当該文毎に、付与されたパディング要素を包含する当該文内を順次スライドした各ウィンドウについての感情に係る情報を決定することを特徴とする請求項5に記載の感情推定プログラム。
【請求項7】
取得された所定の対象の音声データをテキストデータに変換する変換手段と、
当該音声データから感情識別モデルを用いて当該対象の感情に係る情報を決定する感情決定手段と、
当該対象の語、句、節若しくは文と当該対象の感情に係る情報とを対応付けて登録した感情辞書を生成又は更新するための感情辞書情報であって、当該テキストデータに含まれる語、句、節若しくは文と、決定された感情に係る情報とを対応付けた感情辞書情報を生成し出力する辞書生成手段と
を有することを特徴とする感情辞書生成装置。
【請求項8】
所定の対象によって表現された語、句、節若しくは文を含む推定対象データについての感情に係る情報を推定する装置であって、
取得された当該対象の音声データをテキストデータに変換する変換手段と、
当該音声データから感情識別モデルを用いて当該対象の感情に係る情報を決定する感情決定手段と、
当該対象の語、句、節若しくは文と当該対象の感情に係る情報とを対応付けて登録した感情辞書を生成又は更新するための感情辞書情報であって、当該テキストデータに含まれる語、句、節若しくは文と、決定された感情に係る情報とを対応付けた感情辞書情報を生成し出力する辞書生成手段と、
取得された当該推定対象データに含まれる語、句、節若しくは文のうち、当該感情辞書情報によって生成又は更新された当該感情辞書に登録されていて、予め設定された複数種別の当該感情に係る情報のうちの1つに所定条件を満たすまでに強く対応付けられている語、句、節若しくは文を特定する感情語句等特定手段と、
当該推定対象データにおける特定された語、句、節若しくは文の有り無しに係る情報、及び、有りの場合において特定された語、句、節若しくは文に対応付けられている少なくとも1つの当該1つの感情に係る情報に基づき、当該推定対象データについての、又は当該推定対象データに含まれる語、句、節若しくは文についての感情に係る情報を決定する感情推定手段と
を有することを特徴とする感情推定装置。
【請求項9】
取得された所定の対象の音声データをテキストデータに変換する変換手段と、
当該音声データから感情識別モデルを用いて当該対象の感情に係る情報を決定する感情決定手段と、
当該対象の語、句、節若しくは文と当該対象の感情に係る情報とを対応付けて登録した感情辞書を生成又は更新するための感情辞書情報であって、当該テキストデータに含まれる語、句、節若しくは文と、決定された感情に係る情報とを対応付けた感情辞書情報を生成し出力する辞書生成手段と
を有することを特徴とする感情辞書生成システム。
【請求項10】
取得された所定の対象の音声データをテキストデータに変換し、当該音声データから感情識別モデルを用いて当該対象の感情に係る情報を決定するステップと、
当該対象の語、句、節若しくは文と当該対象の感情に係る情報とを対応付けて登録した感情辞書を生成又は更新するための感情辞書情報であって、当該テキストデータに含まれる語、句、節若しくは文と、決定された感情に係る情報とを対応付けた感情辞書情報を生成し、当該感情辞書情報によって当該感情辞書を生成又は更新するステップと
を有することを特徴とする、コンピュータによって実施される感情辞書生成方法。
【発明の詳細な説明】
【技術分野】
【0001】
本発明は、感情辞書(sentiment lexicon)を生成し利用する技術に関する。
【背景技術】
【0002】
医療・介護、教育やマーケティング等、様々な分野において、対象者の感情を推定するニーズが非常に高まっている。対象者の感情を適切に把握することができれば、例えばその感情に合ったより好適なサービスを対象者に提供することも可能となる。現在、このような感情推定にあたり、感情辞書(sentiment lexicon)を利用する方法が広く採用されている。ここで感情辞書は、使用された語句等と、そこに込められた感情の種別とを対応付けて登録した言語・感情対応モデルである。
【0003】
このような感情辞書を用いた感情推定は、非特許文献1に開示されているように、対象者が頭の中において外部に発する語句等を選択する際、その選択には通常、その時点における当人の感情状態が強く影響する可能性が高いことを理論的根拠としている。すなわち、対象者が使用した語句等を分析することにより、対象者のその時点での感情状態についての情報を取得することが可能となるのである。
【0004】
このような感情推定の例として、特許文献1には、感情辞書を用い、入力されたテキストデータにおける最初のシードワード(seed words)のセットに対して、(感情について)ポジティブ又はネガティブのラベルを付与し、これにより対象の感情を決定する技術が開示されている。ここで使用された感情辞書は、不特定多数のデータから生成された汎用モデルとなっている。
【先行技術文献】
【特許文献】
【0005】
【特許文献1】米国特許出願公開第2012/0046938号明細書
【非特許文献】
【0006】
【非特許文献1】James W. Pennebaker, Matthias R. Mehl, and Kate G. Niederhoffer, “Psychological Aspects of Natural Language Use: Our Words, Our Selves”, Annual Review of Psychology, Volume 54, pp 547-577, <https://doi.org/10.1146/annurev.psych.54.101601.145041>, 2003年
【非特許文献2】T. Rahman and C. Busso, "A personalized emotion recognition system using an unsupervised feature adaptation scheme," 2012 IEEE International Conference on Acoustics, Speech and Signal Processing (ICASSP), pp. 5117-5120, <https://doi.org/10.1109/ICASSP.2012.6289072>, 2012年
【発明の概要】
【発明が解決しようとする課題】
【0007】
このように多くの場合、感情推定には汎用モデルとしての感情辞書が使用されてきた。これに対し、対象者の感情状態をより正確に把握するためには、対象者専用のモデルを使用することが理想的である。そのため従来、人手による負担の重い更新作業によって、感情辞書をパーソナライズ(個別化)することも行われてきた。
【0008】
このようなモデルの個別化に関し、例えば非特許文献2には、発話データから感情を識別するシステムを、個々の対象者に適合したものにするよう試みた経緯が開示されている。具体的には、仮訓練済みの(pre-trained )モデルによる音響(音声)特徴量と、ある特定の対象者における音響(音声)特徴量との潜在的な不一致を解消する処理が試みられている。しかしながら一般に、感情辞書そのものを、人手によらず自動的にパーソナライズする試みはなされてこなかったのである。
【0009】
そこで、本発明は、所定の対象用の感情辞書を生成又は更新するための感情辞書情報を自動的に生成可能な感情辞書生成プログラム、感情辞書生成装置、感情辞書生成システム及び感情辞書生成方法を提供することを目的とする。また、このように生成された感情辞書を用いて、この対象の感情を推定する感情推定プログラム及び感情推定装置を提供することを目的とする。
【課題を解決するための手段】
【0010】
本発明によれば、
取得された所定の対象の音声データをテキストデータに変換する変換手段と、
当該音声データから感情識別モデルを用いて当該対象の感情に係る情報を決定する感情決定手段と、
当該対象の語、句、節若しくは文と当該対象の感情に係る情報とを対応付けて登録した感情辞書を生成又は更新するための感情辞書情報であって、当該テキストデータに含まれる語、句、節若しくは文と、決定された感情に係る情報とを対応付けた感情辞書情報を生成し出力する辞書生成手段と
してコンピュータを機能させる感情辞書生成プログラムが提供される。
【0011】
この本発明による感情辞書生成プログラムにおいて、辞書生成手段は、当該テキストデータと、該テキストデータに係る音声データから決定された当該感情に係る情報との組のうち、感情識別に係る確からしさが所定条件を満たすまでに高い組を用いて当該感情辞書情報を生成することも好ましい。
【0012】
本発明によれば、また、以上に述べた感情辞書生成プログラムによって生成又は更新された感情辞書を用い、当該対象によって表現された語、句、節若しくは文を含む推定対象データについての感情に係る情報を推定するプログラムであって、
取得された当該推定対象データに含まれる語、句、節若しくは文のうち、当該感情辞書に登録されていて、予め設定された複数種別の当該感情に係る情報のうちの1つに所定条件を満たすまでに強く対応付けられている語、句、節若しくは文を特定する感情語句等特定手段と、
当該推定対象データにおける特定された語、句、節若しくは文の有り無しに係る情報、及び、有りの場合において特定された語、句、節若しくは文に対応付けられている少なくとも1つの当該1つの感情に係る情報に基づき、当該推定対象データについての、又は当該推定対象データに含まれる語、句、節若しくは文についての感情に係る情報を決定する感情推定手段と
としてコンピュータを機能させる感情推定プログラムが提供される。
【0013】
この本発明による感情推定プログラムにおいて、感情語句等特定手段は、当該推定対象データに含まれる語、句、節若しくは文のうち、予め設定された複数種別の当該感情に係る情報のうちの1つに、対応度合いの平均からみて所定条件を満たすまでに大きく逸脱する形で強く対応付けられている語、句、節若しくは文を特定することも好ましい。
【0014】
また本発明による感情推定プログラムの一実施形態として、感情推定手段は、
当該推定対象データ内でウィンドウを順次スライドさせ、各位置のウィンドウにおいて、当該ウィンドウ内に当該特定された語、句、節若しくは文が少なくとも1つ存在する場合、当該特定された語、句、節若しくは文に対応付けられた当該1つの感情に係る情報のうちで所定条件を満たすまでに出現頻度の高いものを、当該ウィンドウについての感情に係る情報に決定し、
当該推定対象データに含まれる語、句、節若しくは文の各々について、当該語、句、節若しくは文を含む少なくとも1つの当該ウィンドウについて決定された感情に係る情報のうちで所定条件を満たすまでに出現頻度の高いものを、当該推定対象データに含まれる語、句、節若しくは文の各々についての感情に係る情報に決定する
ことも好ましい。
【0015】
また、上記のウィンドウを用いる実施形態において、感情推定手段は、当該推定対象データが複数の文を含むものである場合、当該推定対象データに含まれる各文の前後に、パディング要素(padding element)を付与した上で、当該推定対象データ内でウィンドウを順次スライドさせ、当該文毎に、付与されたパディング要素を包含する当該文内を順次スライドした各ウィンドウについての感情に係る情報を決定することも好ましい。
【0016】
本発明によれば、さらに、
取得された所定の対象の音声データをテキストデータに変換する変換手段と、
当該音声データから感情識別モデルを用いて当該対象の感情に係る情報を決定する感情決定手段と、
当該対象の語、句、節若しくは文と当該対象の感情に係る情報とを対応付けて登録した感情辞書を生成又は更新するための感情辞書情報であって、当該テキストデータに含まれる語、句、節若しくは文と、決定された感情に係る情報とを対応付けた感情辞書情報を生成し出力する辞書生成手段と
を有する感情辞書生成装置が提供される。
【0017】
本発明によれば、また、所定の対象によって表現された語、句、節若しくは文を含む推定対象データについての感情に係る情報を推定する装置であって、
取得された当該対象の音声データをテキストデータに変換する変換手段と、
当該音声データから感情識別モデルを用いて当該対象の感情に係る情報を決定する感情決定手段と、
当該対象の語、句、節若しくは文と当該対象の感情に係る情報とを対応付けて登録した感情辞書を生成又は更新するための感情辞書情報であって、当該テキストデータに含まれる語、句、節若しくは文と、決定された感情に係る情報とを対応付けた感情辞書情報を生成し出力する辞書生成手段と、
取得された当該推定対象データに含まれる語、句、節若しくは文のうち、当該感情辞書情報によって生成又は更新された当該感情辞書に登録されていて、予め設定された複数種別の当該感情に係る情報のうちの1つに所定条件を満たすまでに強く対応付けられている語、句、節若しくは文を特定する感情語句等特定手段と、
当該推定対象データにおける特定された語、句、節若しくは文の有り無しに係る情報、及び、有りの場合において特定された語、句、節若しくは文に対応付けられている少なくとも1つの当該1つの感情に係る情報に基づき、当該推定対象データについての、又は当該推定対象データに含まれる語、句、節若しくは文についての感情に係る情報を決定する感情推定手段と
を有する感情推定装置が提供される。
【0018】
本発明によれば、さらに、
取得された所定の対象の音声データをテキストデータに変換する変換手段と、
当該音声データから感情識別モデルを用いて当該対象の感情に係る情報を決定する感情決定手段と、
当該対象の語、句、節若しくは文と当該対象の感情に係る情報とを対応付けて登録した感情辞書を生成又は更新するための感情辞書情報であって、当該テキストデータに含まれる語、句、節若しくは文と、決定された感情に係る情報とを対応付けた感情辞書情報を生成し出力する辞書生成手段と
を有する感情辞書生成システムが提供される。
【0019】
本発明によれば、さらにまた、
取得された所定の対象の音声データをテキストデータに変換し、当該音声データから感情識別モデルを用いて当該対象の感情に係る情報を決定するステップと、
当該対象の語、句、節若しくは文と当該対象の感情に係る情報とを対応付けて登録した感情辞書を生成又は更新するための感情辞書情報であって、当該テキストデータに含まれる語、句、節若しくは文と、決定された感情に係る情報とを対応付けた感情辞書情報を生成し、当該感情辞書情報によって当該感情辞書を生成又は更新するステップと
を有する、コンピュータによって実施される感情辞書生成方法が提供される。
【発明の効果】
【0020】
本発明による感情辞書生成プログラム、感情辞書生成装置、感情辞書生成システム及び感情辞書生成方法によれば、所定の対象用の感情辞書を生成又は更新するための感情辞書情報を自動的に生成することができる。また、本発明による感情推定プログラム及び感情推定装置によれば、このように生成された感情辞書を用いて、この対象の感情を推定することが可能となる。
【図面の簡単な説明】
【0021】
【
図1】本発明による感情辞書生成装置及び感情推定装置の一実施形態を示す機能ブロック図である。
【
図2】本発明による感情辞書生成方法の一実施例を説明するための模式図である。
【
図3】本発明に係る感情語句等特定処理の一実施例を説明するための模式図である。
【
図4】本発明に係る感情推定処理の一実施例を説明するための模式図である。
【
図5】本発明に係る感情推定処理の一実施例を説明するための模式図である。
【発明を実施するための形態】
【0022】
以下、本発明の実施形態について、図面を用いて詳細に説明する。
【0023】
[感情辞書生成装置・感情推定装置]
図1は、本発明による感情辞書生成装置及び感情推定装置の一実施形態を示す機能ブロック図である。
【0024】
図1に示したスマートフォン1は、本発明による感情辞書生成装置及び感情推定装置の一実施形態となっており、本実施形態において所定の対象、例えば人(対象者)や対話ロボット等の発話・発声に係る音声データを用い、この対象専用の「感情辞書」(sentiment lexicon)を生成又は更新するための(感情辞書の構成要素としての)「感情辞書情報」を、人手によらず自動的に生成する。
【0025】
また、スマートフォン1は本実施形態において、この生成した「感情辞書情報」を、通信を介して外部の感情辞書データベース(DB)2へ送信し、対象専用の「感情辞書」を生成又は更新させるのである。ここで、この対象専用の「感情辞書」は、対象における(例えば対象によって表現された)語、句、節若しくは文と、そこに込められた対象の感情に係る情報(例えば、「怒り」、「喜び」、「悲しみ」、「驚き」及び「ニュートラル」の5つの感情種別のうちの1つ)とを対応付けて登録した言語・感情対応モデルとなっている。
【0026】
ちなみに本実施形態において、感情辞書DB2は、各々が各ユーザ(対象者)の専用辞書となっている多数の「感情辞書」をまとめて保存・管理しており、(スマートフォン1を含む)複数の本発明による感情辞書生成装置から、所定のユーザIDが紐づけられた「感情辞書情報」を受け付けて、当該ユーザIDに該当するユーザ(対象者)専用の「感情辞書」を生成・更新するのである。なお変更態様として、スマートフォン1が、1人のユーザ(対象者)について又は複数のユーザの各々について専用となる少なくとも1つの「感情辞書」を搭載し、自らの中でこの「感情辞書」を生成・更新してもよい。
【0027】
ここで、スマートフォン1(感情辞書生成装置)は、このような「感情辞書」を生成・更新すべく具体的に、
(A)(例えばマイク102によって)取得された所定の対象の発話・発声に係る「音声データ」を「テキストデータ」に変換するテキスト変換部111と、
(B)この「音声データ」から感情識別モデルを用いてこの対象の「感情に係る情報」、本実施形態では予め設定された複数の感情種別(例えば「怒り」、「喜び」、「悲しみ」、「驚き」及び「ニュートラル」の5つ)のうちの識別された1つ、を決定する感情決定部112と、
(C)「感情辞書」を生成又は更新するための「感情辞書情報」であって、上記(A)の「テキストデータ」に含まれる語、句、節若しくは文と、上記(B)で決定された「感情に係る情報」(識別された感情種別)とを対応付けた「感情辞書情報」を生成し出力する辞書生成部113と
を有している。
【0028】
このようにスマートフォン1は、所定の対象の「音声データ」から、この対象に係る語、句、節若しくは文と、この対象の「感情に係る情報」(例えば感情種別)とを決定し、これによりこの対象専用の「感情辞書」を生成又は更新するための(感情辞書の構成要素としての)「感情辞書情報」を、自動的に生成し出力することができるのである。ここで、生成・更新される対象専用の「感情辞書」は、例えば、所定の対象が如何なる感情状態のときに如何なる語句等の選択を行うのかについての情報を提供可能なモデルと捉えることもできる。ちなみに勿論、「感情に係る情報」は、上述したような5つの感情種別のうちの1つに限定されるものではなく、例えば、「ポジティブ」、「ネガティブ」及び「ニュートラル」のうちの1つであってもよい。
【0029】
また本実施形態において、所定の対象の「音声データ」として、例えばこの対象が種々様々なトピック(topics,話題)について述べているものを収集することによって、種々様々なトピックにも対応した拡張版の「感情辞書」を、自動的に生成・更新することも可能となる。例えば所定のトピックに関して頻出する人名、会社名や地名等の「固有名詞」の登録も、人手によらず自動的に行うことができるのである。ここで、例えばユーザAの「感情辞書」では“Iidabashi(飯田橋)”は「喜び」により強く対応付けられている一方、ユーザBの「感情辞書」では“Iidabashi(飯田橋)”は「驚き」により強く対応付けられている、といったことも生じ得るのである。
【0030】
なお、生成・更新される「感情辞書」は、後に示す実施例では、1つの単語と感情種別とを対応付けたものとなっているが、例えば、(文で連続する)2つ又はそれ以上の単語の集まりと感情種別とを対応付けたものとすることもできる。また同様に、1つ以上の(連続する)句と感情種別とを対応付けたもの、1つ以上の(連続する)節と感情種別とを対応付けたもの、又は1つ以上の(連続する)文と感情種別とを対応付けたものとすることも可能である。さらに、感情種別を対応付けるべき(登録すべき)単語として、名詞、動詞、形容詞や、副詞等の全ての品詞を採用してもよく、または、特定の品詞のみ、例えば名詞、動詞、形容詞及び副詞のみを採用することもできる。さらにまた、名詞や動詞等の変化形(例えば “tries”,“trying”や“tried”等)について、同じ語幹のものは1つのものとして(例えば“try”として)登録してもよく、または、各変化形についても個別に登録してもよい。
【0031】
また、以上に述べた「所定の対象」は、例えば人の場合、特定の1人に限定されるものではない。例えば、所定のグループのメンバや、所定地域の住人等、ある属性に関し1つの種別に分類される複数人を「所定の対象」とし、この複数人の集合(例えば1つのグループ)について専用となる「感情辞書」を生成・更新してもよいのである。
【0032】
さらに本実施形態において、スマートフォン1は、生成又は更新した所定の対象専用の「感情辞書」を用い、この対象に係る「推定対象データ」から対象の感情を推定する。具体的には「推定対象データ」から、後に詳細に説明する処理によって、対象の感情に係る情報、本実施形態では予め設定された複数の感情種別(例えば「怒り」、「喜び」、「悲しみ」、「驚き」及び「ニュートラル」の5つ)のうちの、該当すると推定される1つを生成し出力するのである。ここで、この対象に係る「推定対象データ」は、対象が記述・作成した文・文章のテキストデータや、対象の発話・発声に係る音声データ(を変換して生成されたテキストデータ)といったような、この対象によって表現・選択された語、句、節又は文を含むテキストデータや音声データである。
【0033】
また、本実施形態のスマートフォン1(感情辞書生成装置,感情推定装置)は、日本語、英語や、中国語等、様々な言語に対応可能となっている。例えば、該当するユーザID及び言語IDを付与した「感情辞書情報」を出力し、当該ユーザIDに該当するユーザ(対象者)が用いた言語(当該言語IDに該当する言語)に対応した、当該ユーザ(対象者)専用の「感情辞書」を生成・更新させることもできる。またこのように多様な「感情辞書」が利用できる場合、複数のユーザ(対象者)による様々な言語に係る「推定対象データ」の各々から、該当する「感情辞書」を適切に使い分けることにより、各ユーザ(対象者)の感情をより確実に推定することも可能となる。
【0034】
なお変更態様として、この後述べるように、本発明による感情辞書生成装置及び感情推定装置は、各々別の装置とすることも可能である。また、発明による感情辞書生成装置及び感情推定装置は、同じくこの後述べるように、スマートフォンに限定されるものではなく、例えば、感情辞書DB2、ドキュメントDB3、音声DB4、SNSサーバ5、又は電子メールサーバ6に搭載された又は付属する装置であってもよい。さらに言えば、上記(A)のテキスト変換部111、上記(B)の感情決定部112、及び上記(C)の辞書生成部113のうちの1つ、2つ又は全部は、他の構成部とは別の装置に含まれていてもよい。例えば、これら3つともそれぞれ、互いに異なる3つのサーバに含まれていてもよいのである。いずれにしてもこのような場合、上記(A)~(C)の全体をもって本発明による感情辞書生成システムが形成されることとなる。
【0035】
[装置機能構成,感情辞書生成プログラム・方法,感情推定プログラム・方法]
以下、本発明による感情辞書生成装置及び感情推定装置の一実施形態としてのスマートフォン1の機能構成について、より具体的に説明を行う。同じく
図1の機能ブロック図において、スマートフォン1は、通信インタフェース部101と、マイク102と、音声データ保存部103と、テキストデータ保存部104と、感情推定結果保存部105と、ユーザインタフェース(U・I)部106と、プロセッサ・メモリ(メモリ機能を備えた演算処理系)とを有する。
【0036】
ここで、このプロセッサ・メモリは、本発明による感情辞書生成プログラム及び感情推定プログラムの一実施形態を保存しており、また、コンピュータ機能を有していて、これら感情辞書生成プログラム及び感情推定プログラムを実行することによって、感情辞書生成処理及び感情推定処理を実施する。このことから、本発明による感情辞書生成装置及び感情推定装置は、本実施形態のようにスマートフォン等の携帯端末であってもよいが、本発明による感情辞書生成プログラム及び感情推定プログラムを搭載した、例えばタブレット型コンピュータ、ノート型コンピュータや、パーソナルコンピュータ(PC)であってもよく、さらにはHMD(Head Mounted Display)、スマートグラスや、スマートウォッチといったようなウェアラブル装置とすることもできる。また上述したように、非クラウドサーバや、クラウドサーバとすることも可能である。
【0037】
また、上記のプロセッサ・メモリは本実施形態において、テキスト変換部111と、感情決定部112と、辞書生成部113と、感情語句等特定部114と、感情推定部115と、通信制御部121と、入出力制御部122として機能する。ここで、テキスト変換部111、感情決定部112及び辞書生成部113は、プロセッサ・メモリに保存された本発明による感情辞書生成プログラムの実行によって具現する機能と捉えることができる。さらに、感情語句等特定部114及び感情推定部115は、同じくプロセッサ・メモリに保存された本発明による感情推定プログラムの実行によって具現する機能と捉えることが可能である。また、
図1の機能ブロック図におけるスマートフォン1の機能構成部間を矢印で接続して示した処理の流れは、本発明による感情辞書生成方法及び感情推定方法の一実施形態としても理解される。
【0038】
なお変更態様として、本発明による感情辞書生成装置及び感情推定装置は、それぞれ本発明による感情辞書生成プログラム及び感情推定プログラムを搭載した互いに異なる装置とすることもできる。すなわち、本発明による感情辞書生成装置及び感情推定装置のいずれも、以上に述べたような装置形態をとる個別の装置であってもよいのである。
【0039】
同じく
図1の機能ブロック図において、音声データ保存部103は本実施形態において、対象者の発話・発声に係る音声データを、マイク102の出力として取得し、又は音声DB4等から通信インタフェース部101及び通信制御部121を介して取得し、該当するユーザIDを付与した上で保存・管理する。
【0040】
テキストデータ保存部104は本実施形態において、対象者によって記述・作成されたテキストデータを、ドキュメントDB3、SNSサーバ5や、電子メールサーバ6等から通信インタフェース部101及び通信制御部121を介して取得し、該当するユーザIDを付与した上で保存・管理する。また、この後述べるテキスト変換部111から出力された(音声データの変換結果としての)テキストデータも取得し、該当するユーザIDを付与した上で保存・管理する。
【0041】
<感情辞書生成処理>
同じく
図1の機能ブロック図において、テキスト変換部111は本実施形態において、音声データ保存部103から取得された所定の対象の音声データをテキストデータに変換する。ここでこの変換処理は、公知の音声テキスト化アプリケーション、例えばGoogleドキュメント(登録商標)等、を用いて実施することも可能である。また例えば、取得された音声データを所定形式のデジタルデータに変換し、このデジタルデータを、ニューラルネットワーク(Neural Networks)等の機械学習アルゴリズムで構築された言語単位抽出モデルを用いてテキストデータに変換してもよい。また、テキスト変換部111は本実施形態において、必要であれば形態素解析等を実施し、テキストデータに含まれる単語(形態素)や語句等、さらにはその品詞種別を識別・把握するものであってもよい。
【0042】
感情決定部112は本実施形態において、音声データ保存部103から取得された所定の対象の発話・発声に係る音声データから、「感情識別モデル」を用いてこの対象の発話・発声時における感情種別(本実施形態では「怒り」、「喜び」、「悲しみ」、「驚き」及び「ニュートラル」の5つのうちの1つ)を決定する。例えば、この音声データを所定形式のデジタルデータ、例えば公知の音声データコーパスに収録されている音声デジタルデータと同形式のデータに変換して、このデジタルデータを、学習済みの「感情識別モデル」へ入力し、このモデルの出力として、(a)対象の発話・発声時における(推定される)感情種別と、(b)この感情種別の確からしさを表す信頼スコアとを取得してもよい。
【0043】
ここで「感情識別モデル」としては、機械学習アルゴリズムを用いて構築された種々のモデルが採用可能であり、例えば、メル周波数ケプストラム係数(MFCC,Mel-Frequency Cepstral Coefficients)、pitch、i-vectorsや、LLD(Low-Level Descriptors)等の手法によって、音声データより生成(変換)された所定形式のデジタルデータから音声特徴量を抽出し、次いで、この音声特徴量から、深層ニューラルネットワーク(DNN,Deep Neural Networks)、混合ガウスモデル(GMM,Gaussian Mixture Models)や、サポートベクタマシン(SVM,Support Vector Machines)等で構築された識別・分類器を用いて、推定される感情種別を出力するものとすることができる。
【0044】
同じく
図1の機能ブロック図において、辞書生成部113は本実施形態において、先に説明した(感情辞書DB2に格納された)感情辞書を生成又は更新するための感情辞書情報であって、
(a)テキストデータ保存部104から取得した、「所定の対象の音声データ」を変換して生成されたテキストデータに含まれる語、句、節若しくは文と、
(b)上記(a)と同一の「所定の対象の音声データ」について感情決定部112で決定された感情に係る情報(本実施形態では感情種別)と
を対応付けた感情辞書情報を生成し出力する。この生成された感情辞書情報は本実施形態において、通信制御部121及び通信インタフェース部101を介し、感情辞書DB2へ送信される。
【0045】
また辞書生成部113は、上記(a)のテキストデータ(に含まれる語、句、節若しくは文)と、このテキストデータに係る音声データから決定された上記(b)の感情種別(感情に係る情報)との組のうち、感情識別に係る確からしさ(本実施形態では感情識別モデルから出力された信頼スコア)が所定条件を満たすまでに高い組を用いて感情辞書情報を生成し出力することも好ましい。例えば、信頼スコアが0.8(80%)以上の組だけを用いて感情辞書情報を生成し出力してもよい。
【0046】
図2は、本発明による感情辞書生成方法の一実施例を説明するための模式図である。なお、本実施例を含め以下に示す実施例では、発話やテキストに係る言語として英語が用いられている。しかしながら上述したように、例えば日本語や中国語等、他の言語が用いられた場合でも同様にして、感情辞書生成処理を実施することができる。
【0047】
図2(A)に示したように、本実施例では最初に、対象者が“I hate you”との発話を行っている。辞書生成部113は、
(a)マイク102を介し取得されたこの発話に係る音声データについて決定された感情種別「怒り」及び信頼スコア(=0.8)を、感情決定部112から受け取り、
(b)受け取った信頼スコア(=0.8)が0.8以上であることを確認して、感情辞書情報の生成を決定し、
(c)テキスト変換部111から受け取った単語“I”、“hate”及び“you”の各々と、受け取った感情種別「怒り」とを対応付けた感情辞書情報を生成し、感情辞書DB2へ向けて出力している。
【0048】
また、この感情辞書情報を受け取った感情辞書DB2は、感情辞書テーブルに登録した単語“I”、“hate”及び“you”の各々について、感情種別「怒り」の欄のカウント数を1だけ増分する(ここではカウント数を1にしている)。
【0049】
次いで
図2(B)に示したように、対象者は“I hate this train”との発話を行っている。辞書生成部113は、この発話に係る音声データについて決定された感情種別「怒り」及び信頼スコア(=0.5)を、感情決定部112から受け取り、受け取った信頼スコア(=0.5)が0.8未満であることを確認して、感情辞書情報を生成しないことを決定している。その結果、感情辞書DB2において、この発話についての感情辞書への登録処理は行われない。
【0050】
さらにその後、
図2(C)に示したように、対象者は“I love you. I hate you.”との発話を行っている。ここで辞書生成部113は、発話“I love you.”に係る音声データについて決定された感情種別「喜び」及び信頼スコア(=0.9)、及び発話“I hate you.”に係る音声データについて決定された感情種別「怒り」及び信頼スコア(=0.9)を、感情決定部112から受け取る。また、受け取った信頼スコア(=0.9)がいずれも0.8以上であることを受けて、
(a)テキスト変換部111から受け取った単語“I”、“love”及び“you”の各々と、受け取った感情種別「喜び」とを対応付け、さらに、
(b)テキスト変換部111から受け取った単語“I”、“hate”及び“you”の各々と、受け取った感情種別「怒り」とを対応付けた
感情辞書情報を生成し、感情辞書DB2へ向けて出力している。
【0051】
また、この感情辞書情報を受け取った感情辞書DB2は、感情辞書テーブルに登録した単語“I”について、感情種別「喜び」の欄及び感情種別「怒り」の欄のカウント数を1だけ増分し、単語“hate”について、感情種別「怒り」の欄のカウント数を1だけ増分し、単語“you”について、感情種別「喜び」の欄及び感情種別「怒り」の欄のカウント数を1だけ増分し、さらに、単語“love”について、感情種別「喜び」の欄のカウント数を1だけ増分する。ここで感情辞書においては、1つの単語(例えば“I”)について、この単語が対象者の異なる感情状態において選択・使用されることも少なくないことから、異なる感情種別が対応付けて登録されることも十分にあり得るのである。
【0052】
辞書生成部113は、以上述べたような処理を繰り返し、所定以上の信頼性を有する感情辞書情報を生成して感情辞書DB2へ出力し、感情辞書DB2に対し所定以上の信頼性を有するテーブル形式の感情辞書を生成・更新させることができる。ここで、このように生成・更新される対象者専用の「感情辞書」は、例えば、この対象者が如何なる感情状態のときに如何なる語句等の選択を行うのかについての情報を提供可能なモデルと捉えることもできるのである。
【0053】
また、以上に述べたようなテキスト変換部111、感情決定部112及び辞書生成部113における処理は、例えば装置(スマートフォン1)のバックグラウンドとして常時、実施可能となっていて(待機状態となっていて)、例えば音声DB4やマイク102から対象者の音声データが取得され次第、実施されてもよい。これにより、対象者の感情辞書は適宜更新され、より登録語数の多い、且つより精度の高いものとなっていくのである。
【0054】
<感情推定処理>
図1の機能ブロック図に戻って、感情語句等特定部114は本実施形態において、取得された「所定の対象の推定対象データ」に含まれる語、句、節若しくは文のうち、この対象の感情辞書に登録されていて、且つこの感情辞書において、予め設定された複数種別の感情に係る情報(本実施形態では、複数の感情種別)のうちの1つに所定条件を満たすまでに強く対応付けられているような語、句、節若しくは文を特定する。具体的に本実施形態では、当該1つの感情種別についての後述する「tスコア」(t-score)が、所定閾値(例えば3.5)を超えているような語、句、節若しくは文を特定するのである。
【0055】
ここで上記の「所定の対象の推定対象データ」は、この対象が記述・作成した文・文章のテキストデータや、この対象の発話・発声に係る音声データ(を変換して生成されたテキストデータ)といったような、この対象によって表現・選択された語、句、節又は文を含むテキストデータや音声データである。
【0056】
具体的には、
(a)ドキュメントDB3から受信した、対象が記述・作成したエッセイや論文等のテキストデータ、
(b)音声DB4から受信した、対象の発話・発声に係る音声データ(を例えばテキスト変換部111で変換して生成されたテキストデータ)、
(c)SNS(Social Networking Service)サーバ6から受信した、対象によって投稿された投稿データ、
(d)電子メールサーバ6から受信した、対象によって発信された電子メールデータ、
(e)マイク102によって収集された対象の発話・発声に係る音声データ(を例えばテキスト変換部111で変換して生成されたテキストデータ)や、
(f)ユーザインタフェース106のキーボードやタッチパネルを用いて対象が入力したテキストデータ
等が、この「所定の対象の推定対象データ」として採用可能となっている。
【0057】
このように、本実施形態のスマートフォン1は、様々なタイプの「推定対象データ」を取り扱い可能となっている。すなわち、従来の音声データを用いた感情識別モデルと比較しても分かるように、様々なモダリティ(modality)に対応可能な感情推定装置となっているのである。
【0058】
ここで、ある語句等における1つの感情種別についての上記の「tスコア」tsは、次式
(1) ts=(ei-μ)/(σ×n-0.5)
によって算出される指標である。上式(1)において、eiはこの語句等におけるこの感情種別iのカウント数(該当欄の数値)であり、μ及びσはそれぞれ、この語句等におけるカウント数の全ての感情種別にわたっての平均値及び標準偏差であり、またnは、感情種別の数(例えば感情種別が「怒り」、「喜び」、「悲しみ」、「驚き」及び「ニュートラル」であればn=5)となっている。
【0059】
この対象の感情辞書において、ある感情種別についてのこのようなtスコアtsが、所定閾値(例えば3.5)を超えている語、句、節若しくは文は、当該ある感情種別に(対応度合いの平均からみて)所定条件を満たすまでに大きく逸脱する形で強く対応付けられていると言える。感情語句等特定部114は本実施形態において、推定対象データに含まれる語、句、節若しくは文のうち、ある感情種別に対しこのように強く対応付けられている語、句、節若しくは文を、当該ある感情種別に係る「感情語」、「感情句」、「感情節」又は「感情文」として特定するのである。
【0060】
なお、上記のtスコアtsの代わりとして、例えば偏差値(deviation value)といったような、対応度合いの平均からの逸脱度を示す指標ならば種々のものが使用可能である。
【0061】
図3は、本発明に係る感情語句等特定処理の一実施例を説明するための模式図である。
【0062】
図3(A)によれば、感情語句等特定部114は、感情辞書DB2に格納された所定の対象の感情辞書の情報を取り寄せて、登録されている各単語における各感情種別についてのtスコアtsを算出し、感情辞書DB2に対し、この算出結果をもとに、(各欄のカウント数をtスコアtsに書き換えた)tスコアベースの感情辞書を生成・更新させている。ちなみに変更態様として、感情語句等特定部114は、上記の算出結果をもとにしてtスコアベースの感情辞書を生成・更新し、自ら保存・管理してもよい。また、tスコアtsの算出が必要となる単語についてのみtスコアtsを算出し、その結果を保存・管理することもできる。さらに、感情辞書DB2が自ら、tスコアベースの感情辞書を生成・更新してもよいのである。
【0063】
次いで
図3(B)に示したように、感情語句等特定部114は、このtスコアベースの感情辞書を用いて、推定対象データ:“Today will be rough. I have English class, but my teacher is Abc-san. He always tries to embarrass me.”から感情語を特定している。
【0064】
感情語句等特定部114は具体的に、この推定対象データを構成する単語であってtスコアベースの感情辞書に登録されている単語のうち、ある感情種別についてのtスコア値が3.5を超えている単語である“English”及び“Abc-san”をそれぞれ、「喜び」に係る感情語及び「悲しみ」に係る感情語として特定しているのである。
【0065】
図1の機能ブロック図に戻って、感情推定部115は本実施形態において、
(a)推定対象データにおける特定された感情語、感情句、感情節若しくは感情文の有り無しに係る情報、及び、
(b)上記(a)において有りの場合において、特定された感情語、感情句、感情節若しくは感情文に対応付けられている少なくとも1つの感情に係る情報(本実施形態では感情種別)
に基づき、推定対象データについての、又は推定対象データに含まれる語、句、節若しくは文についての感情に係る情報(感情種別)を決定する。
【0066】
具体的に感情推定部115は、
(ア)推定対象データ内でウィンドウ(window)を順次スライドさせ、各位置のウィンドウにおいて、当該ウィンドウ内に特定された感情語、感情句、感情節若しくは感情文が少なくとも1つ存在する場合、この特定された感情語、感情句、感情節若しくは感情文に対応付けられた感情種別のうちで所定条件を満たすまでに出現頻度の高いもの(本実施形態では、最も出現頻度の高い感情種別)を、当該ウィンドウについての感情種別に決定し、
(イ)推定対象データに含まれる語、句、節若しくは文の各々について、当該語、句、節若しくは文を含む少なくとも1つのウィンドウについて決定された感情種別のうちで所定条件を満たすまでに出現頻度の高いもの(本実施形態では、出現頻度が50%を超える感情種別)を、この推定対象データに含まれる語、句、節若しくは文の各々についての感情種別に決定する。
【0067】
ここで本実施形態において、ウィンドウを用いて感情推定処理を行う理由は、対象者が発話や記述において自らの感情を込めるのは文中の単独の単語に対してではなく、むしろ感情に係る単語を含む文中の所定範囲に対してである場合が多いことによる。ウィンドウをスライドさせることにより、この感情の込められた所定範囲をより確実に捉えることができるのである。なおウィンドウのサイズは、例えば単語単位で順次スライドさせて当該ウィンドウ内の感情語に着目する場合、単語4つ分とすることができる。勿論、単語3つ分以下や単語5つ分以上のサイズとしてもよい。ちなみに使用される言語が英語である場合、周囲の語との関係が抽出し易く且つ単独の感情種別(感情語)が決定され易い、単語4つ分のサイズのウィンドウの使用が好適であることが、経験的に分かっている。
【0068】
またさらに、感情推定部115は本実施形態において、推定対象データが複数の文を含むものである場合、この推定対象データに含まれる各文の前後に、パディング要素(padding element, 後述する
図4及び
図5における“_”)を付与した上で、この推定対象データ内でウィンドウを順次スライドさせ、当該文毎に、付与されたパディング要素を包含する当該文内を順次スライドした各ウィンドウについての感情種別(感情に係る情報)を決定することも好ましい。なお文の区切りは、テキストデータ中における句点(英語の場合ピリオド)やクエスチョンマーク等の存在で判断することができる。
【0069】
ここでパディング要素は、1つの文に係るウィンドウ群において、文頭及び文末の単語も文中の他の単語と同等に扱うことができるように付与されるのであり、ウィンドウ中において感情種別のいずれにも対応付けられていない単語として扱われる。またそのことから、ウィンドウのサイズが大きくなるほど、より多くのパディング要素が各文の前後に付与されることも好ましい。例えば、サイズが単語4つ分のウィンドウを用いる場合、各文の前後にパディング要素“_”を2つ付加することも好ましいのである。
【0070】
さらに、推定対象データに含まれる語、句、節若しくは文のうち、上記(イ)のように感情種別が決定されるのは、感情辞書に登録されている語、句、節若しくは文であって、(全ての感情種別についての)合計カウント数が10以上となっているものに限定することも好ましい。またこの場合、上記(ア)のウィンドウは、含まれる単語のうちの所定以上(例えば75%以上)が合計カウント数について10未満の単語である際、その位置をスキップして次の位置にスライドする設定となっていてもよい。
【0071】
以下、以上に述べたウィンドウやパディング要素を用いた感情推定処理について、
図4及び
図5を用いて具体的に説明を行う。
【0072】
図4及び
図5は、本発明に係る感情推定処理の一実施例を説明するための模式図である。
【0073】
ここで本実施例においては、
図3に示した感情語句等特定処理の一実施例と同じデータ:“Today will be rough. I have English class, but my teacher is Abc-san. He always tries to embarrass me.”が、対象に係る推定対象データとなっており、また、
図3(B)に示されたように、この推定対象データのうち“English”及び“Abc-san”がそれぞれ、「喜び」に係る感情語、及び「悲しみ」に係る感情語として特定されている。
【0074】
最初に
図4には、この推定対象データに含まれる各文の前後にパディング要素“_”を2つ付加したデータに対し、サイズが単語4つ分のウィンドウを順次スライドさせた結果得られた、3つのウィンドウグループが示されている。ここで、各ウィンドウグループは、最初の2つがパディング要素“_”であるウィンドウから、最後の2つがパディング要素“_”であるウィンドウまでの複数のウィンドウで構成されている。すなわち、これら3つのウィンドウは、推定対象データに含まれる3つの文にそれぞれ対応するものとなっている。
【0075】
同じく
図4において、第1のウィンドウグループW1-1~W1-5は、文“Today will be rough.”に対応しており、各ウィンドウ(W1-1, W2-2, ・・・, W1-5)は、この文に含まれる単語を2つから4つまで含んでいる。ここで本実施例において、この第1のウィンドウグループのウィンドウはいずれも、この対象について特定された感情語(“English”, “Abc-san”)を全く含んでいない。
【0076】
これにより感情推定部115は、
(a)文“Today will be rough.”に係る感情種別、
(b)各ウィンドウ(W1-1, W1-2, ・・・, W1-5)に係る感情種別、及び
(c)当該文に含まれる各単語(“Today”, “will”, “be”, “rough”)に係る感情種別
を、全て「ニュートラル」に決定している。なおここで、これらに対し感情種別は決定できないとすることも可能である。
【0077】
また同じく
図4に示したように、第3のウィンドウグループW3-1~W3-7についても、上記の第1のウィンドウグループの場合と同様の結果が得られ、これにより感情推定部115は、
(a)文“He always tries to embarrass me.”に係る感情種別、
(b)各ウィンドウ(W3-1, W3-2, ・・・, W3-7)に係る感情種別、及び
(c)当該文に含まれる各単語(“He”, “always”, “tries”, “to”, “embarrass ”, “me”)に係る感情種別
を、「ニュートラル」に決定しているのである。なおここでも、これらに対し感情種別は決定できないとすることも可能である。ちなみに、仮に“embarrass ”が「悲しみ」に対応付けられた感情語であるとした場合、ウィンドウW3-4、W3-5、W3-6及びW3-7の各々に係る感情種別は、「悲しみ」に決定されることになる。またこの後詳細に説明する手法を用いることによって、単語“to”及び“me”に係る感情種別も「悲しみ」に決定されることになる。
【0078】
同じく
図4において、第2のウィンドウグループW2-1~W2-10は、文“I have English class, but my teacher is Abc-san.”に対応している。ここで、含まれるウィンドウ(W2-1, W2-2, ・・・, W2-10)のうち、4つのウィンドウ(W2-2, W2-3, W2-4, W2-5)は「喜び」に係る感情語(“English”)を1つ含み、3つのウィンドウ(W2-8, W2-9, W2-10)は「悲しみ」に係る感情語(“Abc-san”)を1つ含んでいる。また、その他のウィンドウ(W2-1, W2-6, W2-7)は感情語を全く含んでいない。
【0079】
これにより感情推定部115は、
(a)4つのウィンドウ(W2-2, W2-3, W2-4, W2-5)の各々について、最も出現頻度の高い(本実施例では各ウィンドウで唯一出現している)感情種別である「喜び」を、当該ウィンドウの感情種別に決定し、
(b)3つのウィンドウ(W2-8, W2-9, W2-10)の各々について、最も出現頻度の高い(本実施例では各ウィンドウで唯一出現している)感情種別である「悲しみ」を、当該ウィンドウの感情種別に決定し、
(c)その他のウィンドウ(W2-1, W2-6, W2-7)の各々については、感情種別「ニュートラル」を、当該ウィンドウの感情種別に決定している。
【0080】
また感情推定部115は、第2のウィンドウグループW2-1~W2-10において、感情種別が「喜び」に該当するウィンドウの数(4つ)が最も多いことから、このグループが対応している文“I have English class, but my teacher is Abc-san.”の感情種別を、「喜び」に決定してもよい。または、該当するウィンドウの数が(当該グループ内で)50%を超える感情種別は存在しないことから(「喜び」でも40%であるので)、この文の感情種別を「ニュートラル」に決定する、又は感情種別は決定できないとする設定であってもよい。
【0081】
次に、この第2のウィンドウグループW2-1~W2-10が対応している文“I have English class, but my teacher is Abc-san.”に含まれる各単語について、感情種別を決定する処理を、
図5を用いて説明する。
【0082】
図5(A)に示したように、第2のウィンドウグループにおいて、1つのウィンドウ(W2-1)、4つのウィンドウ(W2-2, W2-3, W2-4, W2-5)、2つのウィンドウ(W2-6, W2-7)、及び3つのウィンドウ(W2-8, W2-9, W2-10)の感情種別はそれぞれ、「ニュートラル」、「喜び」、「ニュートラル」及び「悲しみ」に決定されている。
【0083】
ここで最初に、第2のウィンドウグループが対応している当該文に含まれる単語“I”について、感情種別を決定する処理を説明する。
図5(B)に示したように、この単語“I”を含むウィンドウは、W2-1、W2-2及びW2-3の3つである。また、これら3つのウィンドウのうち、特定された感情語“English”を含むものは2つである。したがって、これら3つのウィンドウにおいて、感情語“English”の出現頻度は約67%(=2/3)となっている。その結果、感情語“English”は、設定された条件:「出現頻度が50%を超える感情語」に該当するので、感情推定部115は本実施例において、単語“I”の感情種別を、(感情語“English”に対応付けられた)感情種別「喜び」に決定している。
【0084】
次に、第2のウィンドウグループ対応している当該文に含まれる単語“my”について、感情種別を決定する処理を説明する。
図5(C)に示したように、この単語“my”を含むウィンドウは、W2-5、W2-6、W2-7及びW2-8の4つである。ここで、
(a)これら4つのウィンドウのうち、特定された感情語“English”を含むものは1つである。したがって、これら4つのウィンドウにおいて、感情語“English”の出現頻度は25%(=1/4)となっている。また、
(b)これら4つのウィンドウのうち、特定された感情語“Abc-san”を含むものも1つである。したがって、これら4つのウィンドウにおいて、感情語“Abc-san”の出現頻度も25%(=1/4)となっている。
【0085】
その結果、感情語“English”も感情語“Abc-san”も、設定された条件:「出現頻度が50%を超える感情語」に該当しないので、感情推定部115は本実施例において、単語“my”の感情種別を、顕著な感情種別(「怒り」、「喜び」、「悲しみ」及び「驚き」)ではない感情種別「ニュートラル」に決定している。なお変更態様として、このような場合に単語“my”に対し感情種別は決定できないとすることも可能である。
【0086】
ここで、仮にウィンドウW2-5だけでなくウィンドウW2-6及びW2-7にも感情語“English”が含まれているとすると、感情語“English”は、出現頻度が75%(=3/4)となるので、設定された条件:「出現頻度が50%を超える感情語」に該当することになる。この場合、単語“my”の感情種別は、(ウィンドウW2-8が感情語“Abc-san”を含むにもかかわらず)この感情語“English”に対応付けられた感情種別「喜び」に決定されることになる。また仮に、出現頻度について50%を超える感情語が複数存在する場合、その中で最も出現頻度の高い感情語に対応付けられた感情種別が採用されてもよい。またさらに、出現頻度について50%を超え且つ最大値をとる感情語が複数ある場合(例えばいずれの出現頻度も75%である場合)、感情種別「ニュートラル」が採用されてもよく、または感情種別の決定はできないとしてもよい。
【0087】
さらに以上に説明した方法をもって、当該文に含まれる他の単語についても感情種別を決定することができる。例えば単語“but”については、感情語“English”の出現頻度が50%(=2/4)となるので、感情種別は「ニュートラル」に決定される(又は感情種別が決定できないとされる)。さらに、例えば単語“teacher”についても、感情語“Abc-san”の出現頻度が50%(=2/4)となるので、感情種別は「ニュートラル」に決定される(又は感情種別が決定できないとされる)のである。
【0088】
なお変更態様として、上述した当該文に含まれる単語の感情種別を決定する処理において、「ニュートラル」と決定されたウィンドウは、感情語の出現頻度の計算において考慮しないことも可能である。例えば、単語“I”の感情種別を決定するにあたり、
図5(B)の3つのウィンドウ(W2-1, W2-2, W2-3)のうち、
図5(A)に示したように「ニュートラル」と決定されたウィンドウW2-1は、感情語“English”の出現頻度の計算に含めなくてもよい。この場合、感情語“English”の出現頻度は100%(=2/2)となり、感情語“English”は「出現頻度が50%を超える感情語」に該当するので、その結果、単語“I”の感情種別は「喜び」に決定されることになる。
【0089】
またこの変更態様において、単語“my”の感情種別を決定する場合、
図5(C)の4つのウィンドウ(W2-5, W2-6, W2-7, W2-8)のうち「ニュートラル」と決定されたウィンドウはW2-6及びW2-7の2つである。したがって、残りの2つのウィンドウ(W2-5, W2-8)で感情語の出現頻度を計算することになる。その結果、感情語“English”及び感情語“Abc-san”はいずれも、出現頻度が50%(=1/2)となり、「出現頻度が50%を超える感情語」に該当しないので、これにより、単語“my”の感情種別は「ニュートラル」に決定される(又は感情種別が決定できないとされる)。
【0090】
さらにこの変更態様において、上述した単語“but”については、感情語“English”の出現頻度が100%(=2/2)となるので、感情種別は「喜び」に決定される。また、同じく上述した単語“teacher”については、感情語“Abc-san”の出現頻度も100%(=2/2)となるので、感情種別は「悲しみ」に決定されるのである。
【0091】
また、更なる変更態様として、当該文に含まれる単語の感情種別を決定する処理において、決定対象の単語を含むウィンドウにおける出現頻度が最も高い(例えば最大値としての25%の出現頻度を示す)感情語に係る感情種別を、この単語の感情種別に決定してもよい。この場合、出現頻度の絶対値は感情種別の判断基準とはならない。またいずれも最高の出現頻度を示す(例えばいずれも最大値としての25%の出現頻度を示す)複数の感情語が存在している場合、この単語の感情種別は「ニュートラル」に決定されてもよい(又は感情種別が決定できないとされてもよい)。
【0092】
図1の機能ブロック図に戻って、感情推定部115は本実施形態において、推定対象データに係る各単語、各ウィンドウ、及び/又は(各)文に対し決定した感情種別の情報を、対応する単語等とのデータセットにして、感情推定結果保存部105へ出力し保存・管理させることができる。また、入出力制御部122を介しユーザインタフェース部106へ出力して、ユーザインタフェース部106のディスプレイに表示させてもよい。
【0093】
またこのように決定された感情種別の情報と対応する単語等とのデータセットは、ユーザIDが紐づけられた上で、通信制御部121を介し通信インタフェース部101から外部の情報処理装置に送信されて、当該装置で利用されてもよい。さらにこのデータセットには、決定された感情種別に係る感情語の出現頻度が更に対応付けられていてもよい。
【0094】
さらにまた、感情推定部115は、感情推定対象の単語等に、出現した各感情語に係る感情種別と、当該感情語の出現頻度とを対応付けたデータセットを、感情推定結果(感情に係る情報)として出力してもよい。このデータセットは、感情推定対象の単語等が、各感情種別に該当する確からしさについての情報となっているのである。
【0095】
以上詳細に説明したように、本発明によれば、所定の対象の音声データから、この対象用の感情辞書を生成又は更新するための(感情辞書の構成要素としての)感情辞書情報を、自動的に生成し出力することができる。また、好適な1つの実施形態をとる場合とはなるが、生成又は更新した所定の対象用の「感情辞書」を用い、この対象に係る推定対象データから対象の感情を推定することも可能となる。
【0096】
このような本発明に係る感情辞書生成・更新機能や感情推定機能は、対象者の発話や記載物からこの対象者の感情状態を(例えばリアルタイムで)把握したいニーズの存在する事業分野、具体的には医療、介護、教育、各種公共サービスや、マーケティング等の分野において、大いに役立つものとなり得るのである。例えば、心療内科等におけるカウンセリングにおいて、患者の発話や記載物から、この患者専用に生成した感情辞書を用いて、治療・アドバイスに役立つ患者の感情情報を取得することも可能となる。さらに、例えば対話ロボットが、対話先のユーザを(例えば顔情報に基づき)識別して、予め生成しておいたこのユーザ専用の感情辞書を選択し、選択したこの感情辞書を用いてこのユーザの感情状態を推定することにより、このユーザの感情状態に合った動作・振る舞いを実施することも可能となる。
【0097】
また、例えば子供達に対し質の高い、且つ個々の感情の傾向に合った教育を提供するために、本発明によって(子供達の発話や記載物から)推定された子供達の感情状態や感情推移・履歴の情報を活用することもできる。すなわち本発明によれば、国連が主導する持続可能な開発目標(SDGs)の目標4「すべての人々に包摂的かつ公平で質の高い教育を提供し、生涯学習の機会を促進する」に貢献することも可能となるのである。
【0098】
さらに、例えば大人達に対し、環境に害を及ぼさないディーセント・ワーク(働きがいのある人間らしい仕事)や、質の高い、且つ個々の感情の傾向に合った仕事を提供するために、本発明によって(大人達の発話や記載物から)推定された大人達の感情状態や感情推移・履歴の情報を活用することもできる。すなわち本発明によれば、国連が主導するSDGsの目標8「すべての人々のための包摂的かつ持続可能な経済成長、雇用およびディーセント・ワークを推進する」に貢献することも可能となるのである。
【0099】
またさらに、例えば消費者達に対し、個々の感情の傾向に沿った、持続可能な消費とライフスタイルについての教育を提供するために、本発明によって(消費者達の発話や記載物から)推定された消費者の感情状態や感情推移・履歴の情報を活用することもできる。すなわち本発明によれば、国連が主導するSDGsの目標12「持続可能な消費と生産のパターンを確保する」に貢献することも可能となるのである。
【0100】
以上に述べた本発明の種々の実施形態について、本発明の技術思想及び見地の範囲の種々の変更、修正及び省略は、当業者によれば容易に行うことができる。以上に述べた説明はあくまで例であって、何ら制約しようとするものではない。本発明は、特許請求の範囲及びその均等物として限定するものにのみ制約される。
【符号の説明】
【0101】
1 スマートフォン(感情推定装置,感情辞書生成装置)
101 通信インタフェース部
102 マイク
103 音声データ保存部
104 テキストデータ保存部
105 感情推定結果保存部
106 ユーザインタフェース(U・I)部
111 テキスト変換部
112 感情決定部
113 辞書生成部
114 感情語句等特定部
115 感情推定部
121 通信制御部
122 入出力制御部
2 感情辞書データベース(DB)
3 ドキュメントDB
4 音声DB
5 SNSサーバ
6 電子メールサーバ