【課題を解決するための手段】
【0006】
本発明に係るテキスト分析装置は、
多数のテキストデータを分析するためのテキスト分析装置であって、
分析対象に関連するテキストデータである分析対象テキストデータ群と、比較対象に関連するテキストデータである比較対象テキストデータ群と、を取得するテキストデータ群取得部と、
取得された前記分析対象テキストデータ群と前記比較対象テキストデータ群とのそれぞれに基づき、前記分析対象及び前記比較対象に関する複数の評価対象項目について、各評価対象項目に対する評価がポジティブであるかネガティブであるかを判定する評価判定部と、
前記評価判定部の判定結果に基づき分析用マップを表示するマップ情報を生成するマップ情報生成部と、を備え、
前記分析用マップは、
複数の前記評価対象項目のうち、前記分析対象における評価がポジティブであり、且つ、前記比較対象における評価がポジティブである前記評価対象項目をマッピングする第一部分と、
複数の前記評価対象項目のうち、前記分析対象における評価がポジティブであり、且つ、前記比較対象における評価がネガティブである前記評価対象項目をマッピングする第二部分と、
複数の前記評価対象項目のうち、前記分析対象における評価がネガティブであり、且つ、前記比較対象における評価がポジティブである前記評価対象項目をマッピングする第三部分と、
複数の前記評価対象項目のうち、前記分析対象における評価がネガティブであり、且つ、前記比較対象における評価がネガティブである前記評価対象項目をマッピングする第四部分と、の少なくともいずれかを備えたものであり、
前記マップ情報生成部は、前記マップ情報として、前記評価判定部の判定結果に基づき、各評価対象項目を前記分析用マップの対応する部分にマッピングしたものを生成するように構成されている。
【0007】
つまり、上記の分析用マップのうち、第一部分にマッピングされた項目は、分析対象と比較対象との両方がポジティブな評価であるため、分析対象の良い部分ではあっても、比較対象に対する関係では利点とはならない。これに対し、第二部分にマッピングされた項目は、分析対象における評価がポジティブであるものの、比較対象における評価がネガティブであるため、比較対象との関係における分析対象の強みとなっているといえる。また、第四部分にマッピングされた項目は、分析対象と比較対象との両方がネガティブな評価であるため、分析対象の良くない部分ではあっても、比較対象に対する関係では不利な点とはならない。これに対し、第三部分にマッピングされた項目は、分析対象における評価がネガティブであるのに、比較対象における評価がポジティブであるため、比較対象との関係で分析対象の弱みとなっているといえる。したがって、この構成によれば、複数の評価対象項目を上記の分析用マップにマッピングすることにより、各評価対象項目が、比較対象との関係で分析対象の強み又は弱みとなっているかを好適に判断することができる。
【0008】
1つの態様として、前記評価判定部は、各評価対象項目に対する評価を指標する評価値を算出し、算出した前記評価値に基づき当該評価対象項目がポジティブであるかネガティブであるかの判定を行うように構成されていると好適である。
【0009】
この構成によれば、評価対象項目についての評価を数値化することにより、ポジティブであるかネガティブであるかを画一的に判断できる。
【0010】
1つの態様として、前記マップ情報生成部は、前記評価値順に前記評価対象項目を並べてマッピングするように構成されていると好適である。
【0011】
1つの態様として、前記第一〜第四部分には、それぞれ前記評価値に応じた配置範囲が定められており、前記マップ情報生成部は、各評価対象項目を、当該評価対象項目の前記評価値に対応する前記配置範囲内に配置するように構成されていると好適である。
【0012】
1つの態様として、前記マップ情報生成部は、前記評価値の大きさに応じて、マッピングする前記評価対象項目の表示形態を変更可能に構成されていると好適である。
【0013】
これらの構成によれば、評価対象項目の評価値に応じた表示がなされるので、どの評価対象項目が特に強み・弱みとなるかをわかりやすく判断できる。
【0014】
1つの態様として、抽出された前記分析対象テキストデータ群と前記比較対象テキストデータ群とのそれぞれについて、各テキストデータに出現する主語と当該主語に関連する語とを抽出して集計する単語集計部を備えると好適である。
【0015】
この構成によれば、単語の集計によりその後の分析を行い易くできる。
【0016】
1つの態様として、前記評価判定部は、前記分析対象テキストデータ群と前記比較対象テキストデータ群とのそれぞれについて、前記単語集計部により集計された主語の少なくとも一部を前記評価対象項目とし、前記評価対象項目とする主語ごとに、当該主語に関連する語の集計結果に基づき、当該主語に対する評価がポジティブであるかネガティブであるかを判定するように構成されており、前記マップ情報生成部は、前記マップ情報として、前記評価判定部により判定の行われた主語のうち、前記分析対象テキストデータ群と前記比較対象テキストデータ群とで共通する主語をマッピング対象として、前記評価判定部の判定結果に基づき、各共通する主語を前記分析用マップの対応する部分にマッピングしたものを生成するように構成されていると好適である。
【0017】
分析者側が全ての評価対象項目を指定する場合、ユーザが評価しているものの分析者側が想定していない項目は分析結果から外れることになるが、これらの構成によれば、予め評価対象項目を定めることなく、テキストデータに含まれている主語を評価対象項目とすることができるので、ユーザが評価しているものの分析者側が想定していない項目も、確度高く分析結果に含めることができる。
【0018】
1つの態様として、前記評価判定部は、前記評価対象項目とする主語を出現頻度に応じて決定するように構成されていると好適である。
【0019】
テキストデータの数が多いほど、そこに含まれる主語の種類は多くなるが、この構成によれば、出現頻度に応じて評価対象項目とする主語を決定するため、出現頻度の高いより重要度の高い主語に限り評価対象項目とすることが可能になる。
【0020】
1つの態様として、前記評価判定部において前記評価対象項目とすべき主語を取得可能な評価対象項目取得部を備え、前記評価判定部は、前記評価対象項目取得部が取得した主語については、出現頻度に関わらず、前記評価対象項目とするように構成されていると好適である。
【0021】
この構成によれば、分析者側が分析結果に含めたい項目について、確実に分析結果に含めることができる。
【0022】
1つの態様として、各語には、これに関連する主語に対する評価を指標する数値が定められており、前記評価判定部は、前記評価対象項目とする主語に関連する語の集計結果に基づき、各語に対応する数値を用いて、当該主語に対する評価を指標する評価値を算出し、算出した前記評価値に基づき当該主語に対する評価がポジティブであるかネガティブであるかの判定を行うように構成されていると好適である。
【0023】
この構成によれば、評価対象項目とする主語に対する評価を画一的に判断できる。そして、主語に関連する語として、ポジティブなものとネガティブなものとが混在する場合には、当該主語に対する評価がポジティブであるかネガティブであるかの判断が難しくなるが、各語に対応する数値から求められる評価値を用いるから、ポジティブかネガティブかの判断を容易に行える。
【0024】
1つの態様として、前記マップ情報生成部は、前記分析用マップにマッピングされた主語とともに、当該主語に関連する語のうち代表的な語を併せて表示可能に構成されていると好適である。
【0025】
1つの態様として、前記マップ情報生成部は、前記マップ情報として、前記分析用マップにマッピングされた主語とともに、当該主語に関連する語のうち代表的な語を併せて表示可能なものを生成するように構成されていると好適である。
【0026】
これらの構成によれば、評価対象項目に具体的にどういう評価がなされているかを知ることができる。
【0027】
本発明に係るテキスト分析方法は、
コンピュータに実行させる、多数のテキストデータを分析するためのテキスト分析方法であって、
分析対象に関連するテキストデータである分析対象テキストデータ群と、比較対象に関連するテキストデータである比較対象テキストデータ群と、を取得するテキストデータ群取得工程と、
取得された前記分析対象テキストデータ群と前記比較対象テキストデータ群とのそれぞれに基づき、前記分析対象及び前記比較対象に関する複数の評価対象項目について、各評価対象項目に対する評価がポジティブであるかネガティブであるかを判定する評価判定工程と、
前記評価判定工程での判定結果に基づき分析用マップを表示するマップ情報を生成するマップ情報生成工程と、を備え、
前記分析用マップは、
複数の前記評価対象項目のうち、前記分析対象における評価がポジティブであり、且つ、前記比較対象における評価がポジティブである前記評価対象項目をマッピングする第一部分と、
複数の前記評価対象項目のうち、前記分析対象における評価がポジティブであり、且つ、前記比較対象における評価がネガティブである前記評価対象項目をマッピングする第二部分と、
複数の前記評価対象項目のうち、前記分析対象における評価がネガティブであり、且つ、前記比較対象における評価がポジティブである前記評価対象項目をマッピングする第三部分と、
複数の前記評価対象項目のうち、前記分析対象における評価がネガティブであり、且つ、前記比較対象における評価がネガティブである前記評価対象項目をマッピングする第四部分と、の少なくともいずれかを備えたものであり、
前記マップ情報生成工程では、前記マップ情報として、前記評価判定工程での判定結果に基づき、各評価対象項目を前記分析用マップの対応する部分にマッピングしたものを生成するように構成されている。
【0028】
本発明に係るテキスト分析プログラムは、
コンピュータに実行させる、多数のテキストデータを分析するためのテキスト分析プログラムであって、
分析対象に関連するテキストデータである分析対象テキストデータ群と、比較対象に関連するテキストデータである比較対象テキストデータ群と、を取得するテキストデータ群取得機能と、
取得された前記分析対象テキストデータ群と前記比較対象テキストデータ群とのそれぞれに基づき、前記分析対象及び前記比較対象に関する複数の評価対象項目について、各評価対象項目に対する評価がポジティブであるかネガティブであるかを判定する評価判定機能と、
前記評価判定機能による判定結果に基づき分析用マップを表示するマップ情報を生成するマップ情報生成機能と、を前記コンピュータに実行させ、
前記分析用マップは、
複数の前記評価対象項目のうち、前記分析対象における評価がポジティブであり、且つ、前記比較対象における評価がポジティブである前記評価対象項目をマッピングする第一部分と、
複数の前記評価対象項目のうち、前記分析対象における評価がポジティブであり、且つ、前記比較対象における評価がネガティブである前記評価対象項目をマッピングする第二部分と、
複数の前記評価対象項目のうち、前記分析対象における評価がネガティブであり、且つ、前記比較対象における評価がポジティブである前記評価対象項目をマッピングする第三部分と、
複数の前記評価対象項目のうち、前記分析対象における評価がネガティブであり、且つ、前記比較対象における評価がネガティブである前記評価対象項目をマッピングする第四部分と、の少なくともいずれかを備えたものであり、
前記マップ情報生成機能では、前記マップ情報として、前記評価判定機能による判定結果に基づき、各評価対象項目を前記分析用マップの対応する部分にマッピングしたものを生成するように構成されている。
【0029】
これらの構成によれば、上記した本発明に係るテキスト分析装置によるマップ情報の生成を好適に実現できる。