特許第6192166号(P6192166)IP Force 特許公報掲載プロジェクト 2022.1.31 β版

知財求人 - 知財ポータルサイト「IP Force」

▶ 日本放送協会の特許一覧

<>
  • 特許6192166-意見種別推定装置及びそのプログラム 図000014
  • 特許6192166-意見種別推定装置及びそのプログラム 図000015
  • 特許6192166-意見種別推定装置及びそのプログラム 図000016
  • 特許6192166-意見種別推定装置及びそのプログラム 図000017
  • 特許6192166-意見種別推定装置及びそのプログラム 図000018
< >
(19)【発行国】日本国特許庁(JP)
(12)【公報種別】特許公報(B2)
(11)【特許番号】6192166
(24)【登録日】2017年8月18日
(45)【発行日】2017年9月6日
(54)【発明の名称】意見種別推定装置及びそのプログラム
(51)【国際特許分類】
   G06F 17/30 20060101AFI20170828BHJP
【FI】
   G06F17/30 220Z
   G06F17/30 170A
【請求項の数】6
【全頁数】13
(21)【出願番号】特願2013-263994(P2013-263994)
(22)【出願日】2013年12月20日
(65)【公開番号】特開2015-121846(P2015-121846A)
(43)【公開日】2015年7月2日
【審査請求日】2016年11月1日
(73)【特許権者】
【識別番号】000004352
【氏名又は名称】日本放送協会
(74)【代理人】
【識別番号】110001807
【氏名又は名称】特許業務法人磯野国際特許商標事務所
(74)【代理人】
【識別番号】100064414
【弁理士】
【氏名又は名称】磯野 道造
(74)【代理人】
【識別番号】100111545
【弁理士】
【氏名又は名称】多田 悦夫
(72)【発明者】
【氏名】小早川 健
【審査官】 吉田 誠
(56)【参考文献】
【文献】 特開2012−256283(JP,A)
【文献】 特開2004−227343(JP,A)
【文献】 国際公開第2013/179340(WO,A1)
(58)【調査した分野】(Int.Cl.,DB名)
G06F 17/30
(57)【特許請求の範囲】
【請求項1】
意見の内容を表した発言データに意見種別が予め設定され、前記発言データの意見種別に関する統計情報を推定する意見種別推定装置であって、
前記意見種別毎の混合比とピーク時刻と盛り上がりの急速さとをパラメータとした、発言時刻に依存した意見の形成過程を表す混合分布モデルを予め記憶すると共に、前記発言時刻が付加された前記発言データを前記意見種別毎に記憶する混合分布モデル記憶手段と、
前記混合分布モデル記憶手段の混合分布モデルに発言データを適用し、数値最適化手法によって前記パラメータを推定するパラメータ最適化手段と、
前記パラメータ最適化手段でパラメータが推定された混合分布モデルを用いて、前記意見種別に関する統計情報を推定する意見種別推定手段と、
を備えることを特徴とする意見種別推定装置。
【請求項2】
前記混合分布モデル記憶手段は、n種別目の前記意見種別のピーク時刻tと、前記n種別目の意見種別の盛り上がりの急速さαとを含んだ下記式(1)´のガウシアン分布p(t)が混合された混合分布モデルを、予め記憶することを特徴とする請求項1に記載の意見種別推定装置(但し、nは自然数)。
【数1】
【請求項3】
前記混合分布モデル記憶手段は、前記意見種別が2種別であり、第1の前記意見種別のピーク時刻tと、前記第1の意見種別の盛り上がりの急速さαと、第2の前記意見種別のピーク時刻tと、前記第2の意見種別の盛り上がりの急速さαとを前記式(1)´の引数として、前記第1の意見種別及び前記第2の意見種別の混合比β(0<β<1)とが含まれる下記式(2)の2混合分布モデルp(t)を予め記憶し、
【数2】
前記パラメータ最適化手段は、前記パラメータt,t,α,α,βを推定することを特徴とする請求項2に記載の意見種別推定装置(但し、‘;’は後に含まれる変数が式(1)´の引数であることを示す)。
【請求項4】
前記混合分布モデル記憶手段は、下記式(5)のように、前記意見種別が2種別であり、第1の意見種別で2つのガウシアン分布p11(t),p12(t)を重ね合わせた分布モデルと、第2の意見種別で2つのガウシアン分布p21(t),p22(t)を重ね合わせた分布モデルとの2混合分布モデルp(t)を予め記憶し、
【数3】
前記パラメータ最適化手段は、前記パラメータとして、
前記第1の意見種別及び前記第2の意見種別の混合比βと、
ガウシアン分布モデルp11(t),p12(t)の比率k(0<k<1)と、
ガウシアン分布モデルp11(t)でのピーク時刻t11,盛り上がりの急速さα11と、
ガウシアン分布モデルp12(t)でのピーク時刻t12,盛り上がりの急速さα12と、
ガウシアン分布モデルp21(t),p22(t)の比率k(0<k<1)と、
ガウシアン分布モデルp21(t)でのピーク時刻t21,盛り上がりの急速さα21と、
ガウシアン分布モデルp22(t)でのピーク時刻t22,盛り上がりの急速さα22と、
を推定することを特徴とする請求項2に記載の意見種別推定装置。
【請求項5】
前記混合分布モデル記憶手段は、前記ピーク時刻μと、スケールδと、第3種変形ベッセル関数Kλ(x)の次数λと、尖度αと、歪度γとを含んだ下記式(6)の一般化双曲型分布モデルgh(x)が2以上混合された混合分布モデルを、予め記憶することを特徴とする請求項1に記載の意見種別推定装置(但し、‘;’は後に含まれる変数が式(6)の引数であることを示す)。
【数4】
【請求項6】
コンピュータを、請求項1に記載の意見種別推定装置として機能させるための意見種別推定プログラム。
【発明の詳細な説明】
【技術分野】
【0001】
本願発明は、意見の内容を表した発言データから意見種別に関する統計情報を推定する意見種別推定装置及びそのプログラムに関する。
【背景技術】
【0002】
従来から、人間の手による書き込みを解析するために、自然言語処理が必要とされている。自然言語処理の前段では、意見種別を推定する技術が必要となる(特許文献1〜5及び非特許文献1,2)。この意見種別推定技術は、意見種別毎にラベルを付与するアルゴリズムであり、賛否を表す意見種別の場合、「賛成」または「反対」というラベルを意見に付与するものである。
【先行技術文献】
【特許文献】
【0003】
【特許文献1】特許第5224532号公報
【特許文献2】特許第5254888号公報
【特許文献3】特許第5278327号公報
【特許文献4】特許第5286298号公報
【特許文献5】特許第5221751号公報
【非特許文献】
【0004】
【非特許文献1】Jorge Nocedal,Stephen J.Wright,”Numerical Optimization”,Springer,2006年
【非特許文献2】大塚裕子、幹孝司、奥村学、“意見分析エンジン”、コロナ社、2007年
【発明の概要】
【発明が解決しようとする課題】
【0005】
しかし、従来の意見種別推定技術には、不適切なラベルを意見に付与するといった、ある程度の誤りが含まれてしまう。このため、従来の意見種別推定技術は、この技術を単独で用いた場合、賛否の数や割合といった意見種別に関する統計情報を求めるときに、その推定精度が向上しないという問題がある。
【0006】
ここで、意見種別推定技術に誤りが含まれる原因を検討する。各個人の意見形成過程では、他人の意見を参考にしながら自分の意見(賛否)を決めることが多い。にもかかわらず、従来の意見種別推定技術では、実際の意見形成過程が反映されておらず、誤りの原因になると考えられる。
【0007】
そこで、本願発明は、前記した問題を解決し、意見種別に関する統計情報の推定精度を向上させる意見種別推定装置及びそのプログラムを提供することを課題とする。
【課題を解決するための手段】
【0008】
前記した課題に鑑みて、本願発明に係る意見種別推定装置は、意見の内容を表した発言データに意見種別が予め設定され、発言データの意見種別に関する統計情報を推定する意見種別推定装置であって、混合分布モデル記憶手段と、パラメータ最適化手段と、意見種別推定手段と、を備えることを特徴とする。
【0009】
かかる構成によれば、意見種別推定装置は、混合分布モデル記憶手段によって、意見種別毎の混合比とピーク時刻と盛り上がりの急速さとをパラメータとした、発言時刻に依存した意見の形成過程を表す混合分布モデルを予め記憶すると共に、発言時刻が付加された前記発言データを前記意見種別毎に記憶する。また、意見種別推定装置は、パラメータ最適化手段によって、混合分布モデル記憶手段の混合分布モデルに発言データを適用し、数値最適化手法によってパラメータを推定する。
【0010】
そして、意見種別推定装置は、意見種別推定手段によって、意見の形成過程を表す混合分布モデルでパラメータが最適化されているので、この混合分布モデルを用いて、意見種別に関する統計情報を推定する。例えば、意見種別に関する統計情報は、全ての発言データに含まれる意見種別の発言の割合、又は、意見種別毎の発言数である。
【0011】
発言データとは、政治、経済等の分野における特定の事案について、ネットワーク上で不特定多数者が発言した意見の内容を表したテキストデータのことである。
意見種別とは、発言データの意見内容を予め設定した種別に分類したものである。例えば、意見種別として、意見の賛否を表す「賛成」や「反対」といったラベルをあげることができる。
意見種別毎の混合比は、混合分布モデルにおける各意見種別の割合を表すことになる。例えば、意見種別毎の混合比は、「賛成」の割合と、「反対」の割合とを表す。
【0012】
意見種別毎の分布モデルは、発言時刻に依存し、1以上のピークを有する分布モデルのことである(例えば、ガウシアン分布モデル)。つまり、意見種別毎の分布モデルは、発言時刻に依存することから、意見の形成過程が反映されていると言える。
混合分布モデルとは、意見種別毎の分布モデルを混合した確率モデルのことである。例えば、混合分布モデルとして、「賛成」の分布モデルと、「反対」の分布モデルとの2混合分布モデルをあげることができる。
【0013】
盛り上がりとは、ネットワーク上で発言が増加する速さのことである。例えば、ネットワーク上で特定の事案に関する発言が急速に増えている場合、盛り上がっていると言う。また、例えば、ネットワーク上で特定の事案に関する発言が少ない状態が継続する場合、盛り上がっていないと言う。
ネットワーク上での発言の増加の原因は、拡散による発言者の増加や、同一人物による繰り返し発言の増加が考えられる。この2つの原因は混在しているが、同一人物の発言を1回しか参照しないことによって、同一人物による繰り返し発言の影響を除去することが可能である。この場合、発言の増加が拡散を表す。
【0014】
本願発明に係る意見種別推定装置は、コンピュータが備えるCPU、メモリ、ハードディスク等のハードウェア資源を、前記した各手段として協調動作させる意見種別推定プログラムで実現することもできる。このプログラムは、通信回線を介して配布してもよく、CD−ROMやフラッシュメモリ等の記録媒体に書き込んで配布してもよい。
【発明の効果】
【0015】
本願発明によれば、以下のような優れた効果を奏する。
本願発明によれば、意見の形成過程を表す混合分布モデルのパラメータを最適化して、意見種別に関する統計情報を推定するので、その推定精度を向上させることができる。これによって、本願発明によれば、ネットワーク上の意見に意見種別を自動的に付加できるので、手動で意見種別を付加する労力を削減することができる。
【図面の簡単な説明】
【0016】
図1】本願発明の実施形態に係る発言解析装置の構成を示すブロック図である。
図2図1の意見種別付加手段が出力した発言データのデータ構造を説明する説明図である。
図3図1の混合分布モデル管理手段に記憶された混合分布モデルを説明する説明図である。
図4図1の発言解析装置の動作を示すブロック図である。
図5】本願発明の変形例において、分布モデルを説明する説明図である。
【発明を実施するための形態】
【0017】
図1を参照し、本願発明の実施形態について、適宜図面を参照しながら詳細に説明する。
図1のように、本願発明の実施形態に係る発言解析装置1は、ネットワーク上に存在する発言を解析するものであり、意見種別推定装置2と、発言解析手段30とを備える。
【0018】
[発言解析装置の構成]
発言解析装置1は、ネットワーク上に存在する発言データが入力される。この発言データは、例えば、ホームページ、ブログ又は掲示板に書き込まれた意見である。ここで、発言データは、発言時刻(意見が書き込まれた時刻)が付加され、発言時刻で集計(ソート)された時系列データであることとする。そして、発言解析装置1は、発言の解析(自然言語処理)の前段として、意見種別の割合を推定するため、発言データを意見種別推定装置2に出力する。
【0019】
意見種別推定装置2は、意見種別に関する統計情報として、発言解析装置1より入力された発言データから意見種別の割合を推定するものである。このため、意見種別推定装置2は、解析対象選別手段21と、意見種別付加手段22と、混合分布モデル管理手段(混合分布モデル記憶手段)23と、パラメータ最適化手段24と、意見種別推定手段25とを備える。
【0020】
解析対象選別手段21は、発言解析装置1から入力された全ての発言データのうち、解析対象とする発言データを選別するものである。例えば、解析対象選別手段21は、消費増税という政策の意見を解析したい場合、全ての発言データから、消費増税に関する発言データに絞り込む。より具体的には、解析対象選別手段21は、解析対象となる事案で特徴的なキーワード(例えば、‘消費増税’)を手動で設定し、このキーワードが含まれる発言データを選別する処理を行う。そして、解析対象選別手段21は、選別された発言データを、意見種別付加手段22に出力する。
なお、解析対象選別手段21は、キーワードが含まれる発言データを選別する処理に、設定されたキーワードの表記ゆれや類義語を同一語とみなす処理を組み合わせてもよい。
【0021】
意見種別付加手段22は、解析対象選別手段21から入力された発言データに意見種別を付加するものである。本実施形態では、意見種別付加手段22は、「賛成」又は「反対」という賛否を意見種別として、発言データに付加することとする。このとき、意見種別付加手段22は、従来の意見種別推定技術を用いて、意見種別を発言データに付加する。より具体的には、意見種別付加手段22は、参考文献1の4.2節「意見を含む文の自動抽出」及び4.3「評価分析の要素技術」に記載の手法を用いて、意見種別を発言データに付加できる。
参考文献1:大塚裕子、幹孝司、奥村学、“意見分析エンジン”、コロナ社、2007年
【0022】
ここで、発言データには、混合分布モデルに最適化手法を適用する際に意見種別が必要となるため、意見種別を発言データに付加する。当然、従来の意見種別推定技術を用いるため、発言データに付加された意見種別には、誤りが含まれている。
【0023】
また、発言データは、意見種別推定装置2に入力された時点で、発言時刻が付加されている。従って、図2のように、発言データは、発言時刻と、発言内容と、意見種別とが含まれている。図2には、経済政策に関する発言データを図示した。例えば、最初の意見は、2013年9月19日の10時34分に書き込まれ、「景気対策をやってほしい」という意見であり、経済政策に「賛成」であることを示す。また、2番目の意見は、2013年9月19日の10時35分に書き込まれ、「首相の経済対策をやめてほしい」という意見であり、経済政策に「反対」であることを示す。
【0024】
その後、意見種別付加手段22は、意見種別が付加された発言データを、発言種別毎に混合分布モデル管理手段23に出力する。このとき、意見種別付加手段22は、混合分布モデル管理手段23を介して、パラメータ最適化手段24にパラメータの最適化を指令する(パラメータ最適化指令)。
【0025】
混合分布モデル管理手段23は、意見種別付加手段22から入力された発言データと、混合分布モデルとを記憶、管理するものである。
【0026】
<混合分布モデル>
図3を参照し、混合分布モデルについて、説明する(適宜図1参照)
混合分布モデルとは、意見種別毎に設定された分布モデルを混合したものである。本実施形態では、混合分布モデルは、図3のように、「賛成」の分布モデル90と、「反対」の分布モデル91とを混合した2混合分布モデルである。
【0027】
本実施形態では、分布モデル90,91は、発言時刻に依存し、1以上のピークを有するガウシアン分布モデルである。ガウシアン分布モデルは、下記式(1)で表される。式(1)では、tが意見種別毎に意見がピークとなる時刻(ピーク時刻)であり、αが意見の盛り上がりの急速さを表す。
【0028】
【数1】
【0029】
従って、各分布モデル90,91は、下記式(1)´で表すことができる。式(1)´では、nが意見種別の数を表す(但し、nは自然数)。また、式(1)´では、意見種別nのピーク時刻tと、意見種別nの盛り上がりの急速さαとを表す。本実施形態では、n=1,2となり、n=1のとき「賛成」の分布モデル90を表し、n=2のとき「反対」の分布モデル91を表す。
【0030】
【数2】
【0031】
発言解析装置1が「賛成」と「反対」とが混在している発言データの解析を目的とすることから、「賛成」と「反対」の分布モデル90,91の2混合を行う(分布モデルの混合は混合分布モデルと呼ばれる)。この2混合分布モデルは、下記式(2)で表すことができる。この式(2)には、「賛成」のピーク時刻t、及び、「反対」のピーク時刻tが含まれることから、発言時刻に依存し、意見の形成過程が反映されていると言える。
【0032】
【数3】
【0033】
この式(2)では、「賛成」の盛り上がりの急速さαを表し、「反対」の盛り上がりの急速さαを表す。また、式(2)では、「賛成」と「反対」との混合比βを表す(但し、0<β<1)。つまり、式(2)では、「賛成」の割合βを表し、「反対」の割合(1−β)を表す。また、式(2)の引数に含まれるセミコロン「;」は、その後に含まれる変数が式(1)´のパラメータ(引数)であることを表す。
【0034】
ここで、式(2)の第1項における収束条件を検討する。式(2)のパラメータt,αを式(1)´に代入してαを前に出すと、下記の式(1)´´となる。この場合、式(1)´´の積分が1となる収束条件が必要となる(つまり、式(1)´´の累積が1となる)。この収束条件については、パラメータαも同様である。
【0035】
【数4】
【0036】
図1に戻り、意見種別推定装置2について、説明を続ける。
パラメータ最適化手段24は、混合分布モデル管理手段23に記憶された混合分布モデルに発言データを適用し、数値最適化手法を用いて、最適なパラメータを推定するものである。ここで、パラメータ最適化手段24は、意見種別付加手段22からパラメータ最適化指令が入力されたら、パラメータの最適化を開始する。また、パラメータ最適化手段24は、数値最適化手法として、最急降下法、BFGS(準ニュートン法)等の最尤推定法、又は、ベイズ推定法を利用することができる。
【0037】
例えば、最急降下法を用いる場合、混合分布モデル管理手段23には、パラメータt,t,α,α,βの初期値を予め設定しておく。そして、パラメータ最適化手段24は、最適な混合分布モデルが得られるまで(つまり、パラメータが収束するまで)、混合分布モデル管理手段23のパラメータt,t,α,α,βを繰り返し更新する。そして、パラメータ最適化手段24は、パラメータt,t,α,α,βの更新を終了したら、混合分布モデル管理手段23を介して、意見種別推定手段25に意見種別の割合の推定を指令する(意見種別推定指令)。
【0038】
意見種別推定手段25は、パラメータ最適化手段24でパラメータが推定された混合分布モデルを用いて、意見種別の割合を推定するものである。例えば、意見種別推定手段25は、パラメータ最適化手段24から意見種別推定指令が入力されたら、意見種別の割合を推定する。
【0039】
ここで、意見種別推定手段25は、パラメータt,t,α,α,βが推定された式(2)を用いることで、発言時刻及びその近傍で、意見種別の割合を推定することが可能となる。つまり、意見種別推定手段25は、式(2)から、発言データ全体に含まれる「賛成」の割合βと、「反対」の割合(1−β)とを推定することができる。
【0040】
また、意見種別推定手段25は、下記式(3)のように、ある時刻τにおける「賛成」の割合と、「反対」の割合とを推定することができる。
【0041】
【数5】
【0042】
さらに、意見種別推定手段25は、前記式(3)を一般化した式(4)を用いて、時刻区間(τ,τ)における「賛成」の割合と、「反対」の割合とを推定することができる。ここで、時刻区間(τ,τ)は、時刻τから時刻τまで間を表す。
【0043】
【数6】
【0044】
その後、意見種別推定手段25は、「賛成」の割合、及び、「反対」の割合を推定結果として、発言解析手段30に出力する。このとき、意見種別推定手段25は、推定結果と共に、混合分布モデル管理手段23から発言データを読み出して、発言解析手段30に出力する。
【0045】
なお、意見種別推定手段25は、前記式(2)から式(4)の何れを用いて意見種別の割合を算出するか、予め設定される。例えば、発言解析装置1の利用者が、前記式(2)から式(4)の何れを用いるか設定してもよい。
【0046】
以下、発言解析装置1の発言解析手段30について、説明する。
発言解析手段30は、意見種別推定手段25から入力された推定結果を用いて、発言データを解析するものである。ここで、発言解析手段30は、従来の自然言語処理を用いて、「賛成」及び「反対」が付加された発言データを解析することができる。そして、発言解析手段30は、発言データの解析結果を外部に出力する。
【0047】
[発言解析装置の動作]
図4を参照し、発言解析装置1の動作について、説明する(適宜図1参照)。
解析対象選別手段21は、全ての発言データのうち、解析対象とする発言データを選別する(ステップS1)。
【0048】
意見種別付加手段22は、ステップS1で選別された発言データに意見種別を付加する(ステップS2)。
パラメータ最適化手段24は、ステップS2で意見種別が付加された発言データを混合分布モデルに適用し、数値最適化手法を用いて、最適なパラメータを推定する(ステップS3)。
【0049】
意見種別推定手段25は、ステップS3で最適なパラメータが推定された混合分布モデルを用いて、意見種別の割合を推定する(ステップS4)。
発言解析手段30は、ステップS4の推定結果を用いて、発言データを解析する(ステップS5)。
【0050】
本願発明の実施形態に係る意見種別推定装置2は、意見の形成過程を表す混合分布モデルのパラメータを最適化して、意見種別の割合を推定するので、推定結果の推定精度を向上させることができる。これによって、意見種別推定装置2は、ネットワーク上の意見に意見種別を自動的に付加できるので、手動で意見種別を付加する労力を削減することができる。さらに、発言解析装置1は、高い精度の推定結果を用いるので、発言データの良好な解析結果を得ることができる。
【0051】
(変形例)
本願発明に係る意見種別推定装置は、前記した実施形態に限定されず、その趣旨を逸脱しない範囲で変形を加えることができる。
前記した実施形態では、図3のように、「賛成」の分布モデル90が1つのピークtを有することとしたが、これに限定されない。つまり、「賛成」の分布モデル90は、ある事案に関する発言が一度盛りあがったら、収束することを表している。だが実際には、ある事案に関する発言が収束した後、再び盛り上がることも考えられる。
【0052】
これを表すため、図5に示すように、「賛成」の分布モデル90aは、2つのガウシアン分布モデルを重ね合わせて、2つのピークt11,t12を有するように設定してもよい。また、「反対」の分布モデル91aは、2つのガウシアン分布モデルを重ね合わせて、2つのピークt21,t22を有するように設定してもよい。すなわち、図5の2混合分布モデルは、下記式(5)で表すことができる。この式(5)では、前記した式(1)´´と同様の拘束条件が必要となる。
【0053】
【数7】
【0054】
この式(5)では、「賛成」の分布モデル90aにおいて、t11がガウシアン分布モデルp11(t)でのピーク時刻を表し、α11がガウシアン分布モデルp11(t)での盛り上がりの急速さを表し、kがガウシアン分布モデルp11(t),p12(t)の比率を表す(但し、0<k<1)。
また、「賛成」の分布モデル90aにおいて、t12がガウシアン分布モデルp12(t)でのピーク時刻を表し、α12がガウシアン分布モデルp12(t)での盛り上がりの急速さを表す。
【0055】
また、「反対」の分布モデル91aにおいて、t21がガウシアン分布モデルp21(t)でのピーク時刻を表し、α21がガウシアン分布モデルp21(t)での盛り上がりの急速さを表し、kがガウシアン分布モデルp21(t),p22(t)の比率を表す(但し、0<k<1)。
また、「反対」の分布モデル91aにおいて、t22がガウシアン分布モデルp22(t)でのピーク時刻を表し、α22がガウシアン分布モデルp22(t)での盛り上がりの急速さを表す。ここでい、
【0056】
この場合、混合分布モデル管理手段23は、図5の2混合分布モデルを記憶、管理する。そして、パラメータ最適化手段24は、式(5)のパラメータt11,t12,t21,t22,α11,α12,α21,α22,k,k,βを推定する。さらに、意見種別推定手段25は、最適なパラメータが推定された式(5)を用いて、意見種別の割合を推定する。
【0057】
なお、図3において、「賛成」の分布モデル90及び「反対」の分布モデル91は、3つ以上のピークを含んでもよい。また、「反対」の分布モデル91のピーク時刻tが「賛成」の分布モデル90のピーク時刻tよりも先であってもよい。また、2混合分布モデルは、図3及び図5の例に限定されない。
【0058】
前記した実施形態では、意見種別が「賛成」又は「反対」の2種別としたが、これに限定されない。
例えば、意見種別は、「賛成」、「中立」又は「反対」の3種別としてもよい。この場合、混合分布モデル管理手段は、3混合分布モデルを記憶、管理する。
また、意見種別は、4種別以上であってもよい。この場合、混合分布モデル管理手段は、4種別以上の混合分布モデルを記憶、管理する。
つまり、意見種別がn種別であれば、混合分布モデル管理手段は、n混合分布モデルを記憶、管理する(nは2以上の整数)。
【0059】
前記した実施形態では、意見種別毎の分布モデルをガウシアン分布モデルとして説明したが、これに限定されない。例えば、パラメータ最適化手段は、意見種別毎の分布モデルとして、下記式(6)の一般化双曲型分布モデルgh(x)を利用することができる。一般化双曲型分布モデルでは、ピークに達する前とピークに達した後との時間推移に対称性がない場合でも、意見の形成過程を反映した分布モデルとして扱うことができる。
【0060】
【数8】
【0061】
この式(6)では、μがピーク時刻を表し、δがスケール(縦、横)を表し、λが第3種変形ベッセル関数Kλ(x)の次数を表す。ここで、α,γは分布の形状を決めるパラメータであり、αは尖度に、γは歪度(非対称性)に影響する。
【0062】
前記した実施形態では、意見種別推定装置を独立したハードウェアとして説明したが、本願発明は、これに限定されない。例えば、意見種別推定装置は、コンピュータが備えるCPU、メモリ、ハードディスク等のハードウェア資源を、解析対象選別手段と、意見種別付加手段と、混合分布モデル管理手段と、パラメータ最適化手段と、意見種別推定手段として協調動作させる意見種別推定プログラムで実現することもできる。
【産業上の利用可能性】
【0063】
本願発明に係る意見種別推定装置は、例えば、政策が問われる政治家又は行政機関、作品の評価が問われる芸術家、及び、商品の評判が問われる事業者が、ネットワーク上の発言を解析するのに利用することができる。
【符号の説明】
【0064】
1 発言解析装置
2 意見種別推定装置
21 解析対象選別手段
22 意見種別付加手段
23 混合分布モデル管理手段(混合分布モデル記憶手段)
24 パラメータ最適化手段
25 意見種別推定手段
30 発言解析手段
図1
図2
図3
図4
図5