(19)【発行国】日本国特許庁(JP)
(12)【公報種別】公開特許公報(A)
(11)【公開番号】特開2019-109758(P2019-109758A)
(43)【公開日】2019年7月4日
(54)【発明の名称】テキスト分析装置、テキスト分析方法、及び、テキスト分析プログラム
(51)【国際特許分類】
G06F 16/00 20190101AFI20190614BHJP
G06F 16/30 20190101ALI20190614BHJP
【FI】
G06F17/30 220Z
G06F17/30 170A
G06F17/30 360Z
【審査請求】未請求
【請求項の数】6
【出願形態】OL
【全頁数】12
(21)【出願番号】特願2017-242917(P2017-242917)
(22)【出願日】2017年12月19日
(71)【出願人】
【識別番号】309007911
【氏名又は名称】サントリーホールディングス株式会社
(74)【代理人】
【識別番号】110001818
【氏名又は名称】特許業務法人R&C
(72)【発明者】
【氏名】是常 彰宏
(72)【発明者】
【氏名】岩下 仁
(72)【発明者】
【氏名】大野 仁史
(72)【発明者】
【氏名】村林 泰之
(72)【発明者】
【氏名】江澤 毅
(72)【発明者】
【氏名】北山 泰弘
(72)【発明者】
【氏名】塩崎 陽三
(57)【要約】
【課題】購買行動プロセスにおける次の段階へと消費者を行動させる要素を把握する。
【解決手段】分析対象に関する記載がある多数のテキストデータを分析するためのテキスト分析装置であって、多数のテキストデータが購買行動プロセスに基づき時系列的/段階的に複数の階層に分類されたものである複数のテキストデータ群のうち、時系列的/段階的に連続する少なくとも2つのテキストデータ群を取得するテキストデータ群取得部と、取得された各テキストデータ群について、当該テキストデータ群に出現する各単語を抽出する単語抽出部と、隣接する2つのテキストデータ群の組み合わせごとに、抽出された単語に基づき、両者で共通して出現する単語である共通単語を抽出する共通単語抽出部と、を備える。
【選択図】
図3
【特許請求の範囲】
【請求項1】
分析対象に関する記載がある多数のテキストデータを分析するためのテキスト分析装置であって、
前記多数のテキストデータが購買行動プロセスに基づき時系列的/段階的に複数の階層に分類されたものである複数のテキストデータ群のうち、時系列的/段階的に連続する少なくとも2つの前記テキストデータ群を取得するテキストデータ群取得部と、
取得された各テキストデータ群について、当該テキストデータ群に出現する各単語を抽出する単語抽出部と、
隣接する2つの前記テキストデータ群の組み合わせごとに、抽出された単語に基づき、両者で共通して出現する単語である共通単語を抽出する共通単語抽出部と、を備えるテキスト分析装置。
【請求項2】
抽出された前記共通単語に基づき、共通単語リストを生成する共通単語リスト生成部を備える請求項1に記載のテキスト分析装置。
【請求項3】
取得された各テキストデータ群について、前記単語抽出部により抽出された単語に基づき、各単語の共起関係を示す共起ネットワークを生成して、生成した各共起ネットワークを時系列的/段階的に並べて表示するグラフ情報を生成するグラフ情報生成部を備え、
前記グラフ情報生成部は、隣接する2つの前記テキストデータ群の各共起ネットワークにおいて、両共起ネットワークにおける各共通単語に対応するノードを、他の単語及び他の前記共通単語に対応するノードと識別可能で、且つ、両共起ネットワークで共通する形態で表示するように構成されている請求項1又は2に記載のテキスト分析装置。
【請求項4】
前記グラフ情報生成部は、抽出された単語のうち、出現頻度に応じた一部の単語に基づき前記共起ネットワークを生成するものであり、且つ、前記共通単語については、出現頻度に関わらず、優先的に共起ネットワークに含めるように構成されている請求項3に記載のテキスト分析装置。
【請求項5】
コンピュータに実行させる、分析対象に関する記載がある多数のテキストデータを分析するためのテキスト分析方法であって、
前記多数のテキストデータが購買行動プロセスに基づき時系列的/段階的に複数の階層に分類されたものである複数のテキストデータ群のうち、時系列的/段階的に連続する少なくとも2つの前記テキストデータ群を取得するテキストデータ群取得工程と、
取得された各テキストデータ群について、当該テキストデータ群に出現する各単語を抽出する単語抽出工程と、
隣接する2つの前記テキストデータ群の組み合わせごとに、抽出された単語に基づき、両者で共通して出現する単語である共通単語を抽出する共通単語抽出工程と、を備えるテキスト分析方法。
【請求項6】
コンピュータに実行させる、分析対象に関する記載がある多数のテキストデータを分析するためのテキスト分析プログラムであって、
前記多数のテキストデータが購買行動プロセスに基づき時系列的/段階的に複数の階層に分類されたものである複数のテキストデータ群のうち、時系列的/段階的に連続する少なくとも2つの前記テキストデータ群を取得するテキストデータ群取得機能と、
取得された各テキストデータ群について、当該テキストデータ群に出現する各単語を抽出する単語抽出機能と、
隣接する2つの前記テキストデータ群の組み合わせごとに、抽出された単語に基づき、両者で共通して出現する単語である共通単語を抽出する共通単語抽出機能と、を前記コンピュータに実行させるテキスト分析プログラム。
【発明の詳細な説明】
【技術分野】
【0001】
本発明は、分析対象に関する記載がある多数のテキストデータを分析するためのテキスト分析装置、テキスト分析方法、及び、テキスト分析プログラムに関する。
に関する。
【背景技術】
【0002】
近年、SNS等にユーザが書き込んだ特定の商品・サービスについての評価に関する記載のあるテキストデータを収集し、その分析結果をマーケティングに用いることが行われている。そして、その手法の一つとして、収集した各テキストデータにおいて共起語を求めることが行われている(例えば特開2007−219880号公報(特許文献1))。
【先行技術文献】
【特許文献】
【0003】
【特許文献1】特開2007−219880号公報
【発明の概要】
【発明が解決しようとする課題】
【0004】
共起語は、分析対象に対する評価の理由や原因となる可能性の高い語であるため、これを知ることで消費者に影響を与えている要素を判断することができる。しかし、消費者の購買行動プロセスは、AIDMA(Attention、Interest、Desire、Memory、Action)理論やAISAS(Attention、Interest、Search、Action、Share)理論で知られるように、複数の段階を経て購買まで至ると考えられており、最終的に何が消費者を購買まで至らしめているかを知るには、“Attention”から“Interest”へと消費者を行動させる要素など、消費者に影響を与えている要素の中から、さらに、購買行動プロセスにおけるある段階から次の段階へと消費者を行動させる要素を把握することが好ましい。
【0005】
そこで、購買行動プロセスにおける次の段階へと消費者を行動させる要素を把握することが可能なテキスト分析装置、テキスト分析方法、及び、テキスト分析プログラムが望まれる。
【課題を解決するための手段】
【0006】
本発明に係るテキスト分析装置は、
分析対象に関する記載がある多数のテキストデータを分析するためのテキスト分析装置であって、
前記多数のテキストデータが購買行動プロセスに基づき時系列的/段階的に複数の階層に分類されたものである複数のテキストデータ群のうち、時系列的/段階的に連続する少なくとも2つの前記テキストデータ群を取得するテキストデータ群取得部と、
取得された各テキストデータ群について、当該テキストデータ群に出現する各単語を抽出する単語抽出部と、
隣接する2つの前記テキストデータ群の組み合わせごとに、抽出された単語に基づき、両者で共通して出現する単語である共通単語を抽出する共通単語抽出部と、を備える。
【0007】
この構成によれば、購買行動プロセスにおける隣接する段階の間で共通して出現する単語を抽出することができる。つまり、隣接する段階の両方で出現する共通単語は、他の単語に比べ、後の段階へと消費者を行動させる要素である可能性が高いといえる。そのため、共通単語を抽出することにより、購買行動プロセスにおける次の段階へと消費者を行動させる要素を把握することができる。
【0008】
1つの態様として、抽出された前記共通単語に基づき、共通単語リストを生成する共通単語リスト生成部を備えると好適である。
【0009】
この構成によれば、共通単語リストにより共通単語を好適に把握できる。
【0010】
1つの態様として、取得された各テキストデータ群について、前記単語抽出部により抽出された単語に基づき、各単語の共起関係を示す共起ネットワークを生成して、生成した各共起ネットワークを時系列的/段階的に並べて表示するグラフ情報を生成するグラフ情報生成部を備え、前記グラフ情報生成部は、隣接する2つの前記テキストデータ群の各共起ネットワークにおいて、両共起ネットワークにおける各共通単語に対応するノードを、他の単語及び他の前記共通単語に対応するノードと識別可能で、且つ、両共起ネットワークで共通する形態で表示するように構成されていると好適である。
【0011】
この構成によれば、購買行動プロセスからみて隣接する2つのテキストデータ群の各共起ネットワーク間で共通単語を識別可能に表示することができるから、視覚的に把握しやすい形で、次の段階へと消費者を行動させると考えられる要素を示すことができる。
【0012】
1つの態様として、前記グラフ情報生成部は、抽出された単語のうち、出現頻度に応じた一部の単語に基づき前記共起ネットワークを生成するものであり、且つ、前記共通単語については、出現頻度に関わらず、優先的に共起ネットワークに含めるように構成されていると好適である。
【0013】
この構成によれば、共通単語については確実に共起ネットワークに含めることができる。
【0014】
本発明に係るテキスト分析方法は、
コンピュータに実行させる、分析対象に関する記載がある多数のテキストデータを分析するためのテキスト分析方法であって、
前記多数のテキストデータが購買行動プロセスに基づき時系列的/段階的に複数の階層に分類されたものである複数のテキストデータ群のうち、時系列的/段階的に連続する少なくとも2つの前記テキストデータ群を取得するテキストデータ群取得工程と、
取得された各テキストデータ群について、当該テキストデータ群に出現する各単語を抽出する単語抽出工程と、
隣接する2つの前記テキストデータ群の組み合わせごとに、抽出された単語に基づき、両者で共通して出現する単語である共通単語を抽出する共通単語抽出工程と、を備える。
【0015】
本発明に係るテキスト分析プログラムは、
コンピュータに実行させる、分析対象に関する記載がある多数のテキストデータを分析するためのテキスト分析プログラムであって、
前記多数のテキストデータが購買行動プロセスに基づき時系列的/段階的に複数の階層に分類されたものである複数のテキストデータ群のうち、時系列的/段階的に連続する少なくとも2つの前記テキストデータ群を取得するテキストデータ群取得機能と、
取得された各テキストデータ群について、当該テキストデータ群に出現する各単語を抽出する単語抽出機能と、
隣接する2つの前記テキストデータ群の組み合わせごとに、抽出された単語に基づき、両者で共通して出現する単語である共通単語を抽出する共通単語抽出機能と、を前記コンピュータに実行させる。
【0016】
これらの構成によれば、上記した本発明に係るテキスト分析装置による共通単語の抽出を好適に実現できる。
【図面の簡単な説明】
【0017】
【
図1】本実施形態に係るテキスト分析システムの構成図
【
図3】グラフ情報により示されるグラフの一例を示す図
【
図5】グラフ情報により示されるグラフの他の一例を示す図
【
図6】グラフ情報により示されるグラフの他の一例を示す図
【発明を実施するための形態】
【0018】
本発明に係るテキスト分析装置、テキスト分析方法、及び、テキスト分析プログラムの実施形態について、図面を参照して説明する。以下では、本発明に係るテキスト分析装置を、利用者側の端末1からの要求に応じてテキスト分析(いわゆるテキストマイニング)を行うテキスト分析システムに組み込んだ例について説明する。
図1は本実施形態に係るテキスト分析システムを示し、テキスト分析システムは、利用者側の端末1と、ネットワーク3を介して利用者側端末1と通信可能な処理サーバ(テキスト分析装置)2と、からなる。利用者側端末1には専用のアプリケーションが格納されており、利用者は、かかるアプリケーションを介して、いかなる分析を行うかについての指示と分析用のテキストデータを利用者側端末1から処理サーバ2に対して送信できるようになっている。そして、処理サーバ2は、利用者からの要求に応じて多数のテキストデータについてテキスト分析を行い、その結果を利用者側端末1に送信するようになっている。
【0019】
また、処理サーバ2は、目的とするテキスト分析をコンピュータに実行させるための単一の又は複数からなるテキスト分析プログラムを図示しない記憶部に格納しており、図示しないCPU等の処理部により当該テキスト分析プログラムに従う処理が実行されることで、利用者からの指示に応じて順番にテキスト分析を実行可能になっている。具体的には、かかるテキスト分析プログラムに従う処理の実行により、利用者からのテキスト分析の要求(ジョブ)が連続してなされても順番に処理を行えるように、本実施形態に係る処理サーバ2は、
図1に示すように、API部21と、ジョブ情報格納部22と、ファイル格納部23と、ジョブ制御部24と、ジョブ処理部25と、を備えたものとなっている。
【0020】
具体的に説明すると、API部21は、利用者側端末1からの要求を受け付けて処理し、利用者側端末1からの要求や受け付けた分析用のテキストデータをジョブ情報格納部22やファイル格納部23に送るようになっている。また、API部21は、ファイル格納部22に格納された分析結果を利用者側端末1に送信するようになっている。
【0021】
ジョブ情報格納部22は、API部21から送られる利用者側端末1からの要求に基づきジョブ情報を生成して、生成したジョブ情報を格納するようになっている。具体的には、生成されたジョブ情報は、要求を受け付けた順番に格納されるようになっている。
【0022】
ファイル格納部23は、API部21から送られる利用者側端末1から送信される分析用のテキストデータを取得し格納するものである。また、ジョブ制御部24から送られる分析結果も格納するようになっている。
【0023】
ジョブ制御部24は、ジョブ情報格納部22に格納されたジョブ情報の順番に従って、ジョブ処理部25に順次テキスト分析(ジョブ)を実行させるようになっている。また、ジョブ処理部25でのテキスト分析が終了すると、対応するジョブ情報をジョブ情報格納部22から消去するとともに、ジョブ処理部25からの分析結果をファイル格納部23に格納するようになっている。
【0024】
ジョブ処理部25については、詳しくは後述するが、ジョブ制御部24からの指示に応じて順次テキスト分析を行い、テキスト分析が終了すると分析結果をジョブ制御部24に返すようになっている。
【0025】
このように、処理サーバ2は、API部21により利用者側端末1からの要求を受け付けて、ジョブ情報格納部22に順次ジョブ情報を格納し、格納したジョブ情報に基づきジョブ制御部24がジョブ処理部25に順次ジョブを処理させるようになっている。
【0026】
そして、特に、本実施形態のテキスト分析システムでは、消費者の購買行動プロセスに着目し、消費者の購買行動を複数の段階にモデル化した購買行動モデルに基づき、分析対象に関する記載がある多数のテキストデータから、何が購買行動モデルの次の段階へと消費者を行動させる要素であるかを効果的に判断でき、最終的に、何が消費者を購買まで至らしめているかを判断できるようになっている。
【0027】
まず、本実施形態におけるテキスト分析の概要について説明すると、分析対象に関する記載がある多数のテキストデータを分析する際、購買行動プロセスに基づき時系列的/段階的に複数の階層に分類されたテキストデータ群を用い(例えば購入前の商品に対する感想に関するテキストデータ群と購入後の評価に関するテキストデータ群とに分類するなど)、分類されたテキストデータ群ごとにテキスト分析を行うようになっている。そして、購買行動プロセスにおいて隣接する階層のテキストデータ群の分析結果を比較したり、両者で共通して出現する単語を抽出することで、何が購買行動モデルの次の段階へと消費者を行動させる要素であるかを効果的に判断できるようになっている。
【0028】
例えば、購買行動モデルのうち、消費者の購買行動は“注意(Attention)”→“興味(Interest)”→“検索(Search)”→“購買(Action)”→“情報共有(Share)”の段階を経るとするAISAS理論を用いた場合、AISAS理論の“注意・興味”の階層に当たるものとしてはSNSにおけるCMや広告への評価やこれを見た感想のテキストデータが挙げられ、AISAS理論の“検索”の階層に当たるものとしてはウェブでの検索ワードのテキストデータが挙げられ、AISAS理論の“購買”の階層に当たるものとしては通販サイト等における商品のレビューのテキストデータが挙げられ、AISAS理論の“情報共有”の階層に当たるものとしてはSNSにおける商品の評価や感想のテキストデータが挙げられる。そして、このような観点から、分析対象(分析を行う商品やサービスなど)に関する記載があるテキストデータを、分析に用いる購買行動モデルの階層ごとに分類して収集すれば、購買行動プロセスに基づき時系列的/段階的に複数の階層に分類されたテキストデータ群を得ることができる。そして、各テキストデータ群についてテキスト分析を行うことで、購買行動プロセスにおける階層ごとの分析結果を得ることができる。
【0029】
また、購買行動プロセスにおける隣接する段階(例えば“注意・興味”と“検索”)の両方で出現する単語がある場合、その単語(共通単語)は、他の単語に比べ、購買行動プロセスにおけるある段階(例えば“注意・興味”)から次の段階(例えば“検索”)へと消費者を行動させる要素である可能性が高いといえる。本実施形態では、このような考えに基づき、共通単語を抽出したり、両段階の分析結果を比較した結果を利用者に示すようになっており、これにより、利用者が、購買行動プロセスにおける次の段階へと消費者を行動させる要素を好適に把握できるようになっている。以下では、本実施形態のテキスト分析システムにおける、かかる分析を行うための構成について具体的に説明する。
【0030】
本実施形態のテキスト分析システムでは、利用者側端末1の側で複数の階層に分類されたテキストデータ群を収集しておき、利用者側端末1の専用のアプリケーションで、テキスト分析に用いるテキストデータ群として、時系列的/段階的に連続するテキストデータ群の入力を少なくとも2つ求めるようになっている。そして、これに伴い、API部21は、利用者側端末1から、テキスト分析の要求とともに、時系列的/段階的に連続する少なくとも2つのテキストデータ群を取得するようになっている(つまり、API部21はテキストデータ群取得部として機能する)。
【0031】
そして、ジョブ処理部25は、何が購買行動モデルの次の段階へと消費者を行動させる要素であるかの判断を行うべく、
図1に示すように、単語抽出部251と、共通単語抽出部252と、グラフ情報生成部253と、共通単語リスト生成部254と、を備えている。
【0032】
単語抽出部251は、取得された各テキストデータ群について、当該テキストデータ群に出現する各単語を抽出するものである。具体的には、単語集計部251は、テキストデータ群ごとに、当該テキストデータ群中の各テキストデータについて形態素解析を行い、テキストデータを単語ごとに区切る。次に、各単語について品詞分類を行ったうえで、各単語のうち、主語として名詞を抽出するとともに、述語として形容動詞、動詞、形容詞を抽出して、出現回数をカウントする。そして、これを各テキストデータ群の全テキストデータについて行って、主語及び述語の出現回数を集計して、テキストデータ群ごとに、例えば
図2に示すような主語(名詞)及び述語(形容動詞、動詞、形容詞)を出現回数順に並べたリストを作成する。
【0033】
共通単語抽出部252は、隣接する2つのテキストデータ群の組み合わせごとに、抽出された単語に基づき、両者で共通して出現する単語である共通単語を抽出するものである。具体的には、単語抽出部251で作成されたリストを用いて、隣接する2つのテキストデータ群のリスト間で、隣接する2つのテキストデータ群間での共通単語を抽出する。そして、これを隣接する2つのテキストデータ群の組み合わせごとに行い、組み合わせごとに共通単語を抽出するようになっている。例えば4つのテキストデータ群の入力があった場合には、1番目と2番目のテキストデータ群間と、2番目と3番目のテキストデータ群間と、3番目と4番目のテキストデータ群間と、のそれぞれについて、両者の間の共通単語を抽出するようになっている。
【0034】
グラフ情報生成部253は、取得された各テキストデータ群について、単語抽出部251により抽出された単語に基づき、各単語の共起関係を示す共起ネットワークを生成して、生成した各共起ネットワークを時系列的/段階的に並べて表示するグラフ情報を生成するものである。具体的には、グラフ情報生成部253は、各テキストデータ群について、単語抽出部251で作成されたリストに基づき、所定数の単語を出力用の単語として決定し、決定された出力用の各単語の共起関係を当該テキストデータ群に基づき分析して、共起ネットワークを作成するようになっている。なお、作成される共起ネットワークでは、出現回数の多い単語ほどノードの大きさが大きくなるようになっている。そして、グラフ情報生成部253は、各テキストデータ群について共起ネットワークを作成し、
図3に示すように、各共起ネットワークを時系列的/段階的に並べて表示した出力グラフ4を作成する。例えば、
図3では、利用者側端末1から、プロセス1〜4に対応するテキストデータ群の入力があった例を示し、プロセス1〜4に関するそれぞれの共起ネットワークが、左上→右上→右下→左下の順に並べられたものとなっている。
【0035】
また、グラフ情報生成部253は、抽出された単語のうち、出現頻度に応じた一部の単語に基づき前記共起ネットワークを生成するようになっている。つまり、例えば出現回数の多い順に出力用の単語を決定したり、一定の出現回数を超えているもののみを出力用の単語とするなど、出力用の単語を出現頻度に応じて決定するようになっている。さらに、本実施形態では、グラフ情報生成部253は、共通単語については、出現頻度に関わらず、優先的に共起ネットワークに含めるように構成されている。つまり、出力用の単語を決定するとき、共通単語抽出部252で抽出された共通単語については、優先的に出力用の単語に含めるようになっている。このとき、出力用の単語に含めるようにする共通単語は、隣接するテキストデータ群との間の共通単語のみとしてもよいし、それ以外の共通単語も出力用の単語に含めてもよい(即ち、後述する共通単語リスト生成部254で作成される共通単語リスト中の全ての共通単語を出力用の単語に含めるようにしてもよい)。例えば4つのテキストデータ群の入力があった場合に、2番目のテキストデータ群についての共起ネットワークを作成するとき、1番目と2番目のテキストデータ群間の共通単語と、2番目と3番目のテキストデータ群間の共通単語と、を出力用の単語に優先的に含めるようにしてもよいし、さらに、3番目と4番目のテキストデータ群間の共通単語も出力用の単語に含めるようにしてもよい。
【0036】
さらに、グラフ情報生成部253は、隣接する2つのテキストデータ群の各共起ネットワークにおいて、両共起ネットワークにおける各共通単語に対応するノードを、他の単語及び他の共通単語に対応するノードと識別可能で、且つ、両共起ネットワークで共通する形態で表示するように構成されている。なお、各共通単語に対応するノードの表示形態は特に限定されないが、例えば本実施形態では、隣接する2つのテキストデータ群の共起ネットワーク間において、共通単語に対応するノードについては色つきで表示するようにし、且つ、共通単語ごとに異なる色を設定して、隣接する共起ネットワークで、同じ共通単語に対応するノードが同じ色で表示されるようにしてある。
【0037】
共通単語リスト生成部254は、抽出された共通単語に基づき、
図4に示すような共通単語リスト5を生成するものである。例えば、例えば4つのテキストデータ群の入力があった場合には、1番目と2番目のテキストデータ群間と、2番目と3番目のテキストデータ群間と、3番目と4番目のテキストデータ群間と、のそれぞれについての共通単語が共通単語抽出部252により抽出されることになるが、共通単語リスト生成部254は、各組み合わせで抽出された共通単語を一つにまとめた共通単語リスト5を生成する。
【0038】
このように、ジョブ処理部25では、
(1)時系列的/段階的に隣接する少なくとも2つのテキストデータ群を取得し、
(2)取得された各テキストデータ群について、当該テキストデータ群に出現する各単語が抽出し、
(3)隣接する2つのテキストデータ群の組み合わせごとに、抽出された単語に基づき共通単語を抽出し、
(4)取得された各テキストデータ群について、抽出された単語や共通単語に基づき共起ネットワークを生成して、生成した各共起ネットワークを時系列的/段階的に並べて表示するグラフ情報を生成し、
(5)抽出された共通単語に基づき、共通単語リストを生成する、
という(1)〜(5)の工程の処理を行うようになっている。
【0039】
また、グラフ情報生成部253は、グラフ情報として、共起ネットワークが並べられたグラフ4のみならず、利用者側端末1からの要求に応じて、他の種類のグラフも併せて生成して表示するものを生成するようにしてもよい。生成するグラフの種類は特に限定されないが、例えば
図5では、取得した全テキストデータ群について、各単語の出現回数を集計し、これをランキング順に上から並べたグラフ6、特定の単語又は単語の組み合わせの出現回数が、各テキストデータ群でどのように変化しているかを示すグラフ7、及び、いわゆる対応分析の結果を示すグラフ8を併せて表示したものを示している。そして、グラフ情報生成部253は、グラフ情報として、これらグラフ4,6〜8内のいずれかの項目(例えばグラフ4中のノードや、グラフ6,7中の棒グラフなど)が指示されたとき、当該項目についてのテキストデータの一例を表示するものを生成するように構成されている。このようにすることで、利用者に幅広い情報を示すことができる。
【0040】
そして、このようにしてグラフ情報生成部253や共通単語リスト生成部254で生成されたグラフ情報やリスト5は、ジョブ処理部25による分析結果として最終的に利用者側端末1へと送られ、利用者がグラフ4やリスト5を見ることができるようになる。このように、本実施形態によれば、購買行動プロセスにおける隣接する段階の間で共通して出現する単語を抽出し、共起ネットワークを並べたグラフ4やリスト5等の形式で共通単語をわかりやすく示すことができ、これにより、利用者は、購買行動プロセスにおける次の段階へと消費者を行動させる要素を把握することができる。
〔その他の実施形態〕
最後に、本発明に係るテキスト分析装置、テキスト分析方法、及び、テキスト分析プログラムのその他の実施形態について説明する。なお、以下のそれぞれの実施形態で開示される構成は、矛盾が生じない限り、他の実施形態で開示される構成と組み合わせて適用することも可能である。
【0041】
(1)上記の実施形態では、利用者端末1の側で収集した分析用のテキストデータ群を処理サーバ3側に送信する構成を例として説明した。しかし、本発明の実施形態はこれに限定されず、利用者端末1の側からの要求に応じて、処理サーバ3が、テキストデータ保存用のデータベースサーバなどの他装置から分析用のテキストデータ群を取得してもいいし、処理サーバ3が分析用のテキストデータ群を収集するようにしてもよい。
【0042】
(2)上記の実施形態では、購買行動モデルとしてAISAS理論を例に挙げたが、これに限られず、AIDAM理論など消費者の購買行動プロセスについての他の種々のモデルを用いることができる。
【0043】
(3)上記の実施形態では、
図3により、4つのテキストデータ群の入力があったときの出力グラフの例を示した。しかし、本発明の実施形態はこれに限定されず、ネットワークが2若しくは3、又は、5以上の時系列的/段階的に連続するテキストデータ群に基づき分析を行うようにしてもよい(この場合、出力される共起ネットワークは、テキスト分析を行うテキストデータ群の数に合わせて2若しくは3、又は、5以上に変化することになる)。また、ある購買行動モデルの全段階についての分析を行わなくてもよく、例えば全5段階のモデルがある場合にそのうちの連続する2段階のものについてのみ分析を行うようにするなど、その購買行動モデルの一部のみのテキストデータ群について分析を行うようにしてもよい。その他、購買行動モデルのある段階をさらに細かく細分化して(例えばAISAS理論の“情報共有”をさらに時系列的/段階的に細分化するなど)、その細分化したものを用いて分析を行うようにしてもよい。
【0044】
(4)その他の構成に関しても、本明細書において開示された実施形態は全ての点で例示であって、本発明の範囲はそれらによって限定されることはないと理解されるべきである。当業者であれば、本発明の趣旨を逸脱しない範囲で、適宜改変が可能であることを容易に理解できるであろう。従って、本発明の趣旨を逸脱しない範囲で改変された別の実施形態も、当然、本発明の範囲に含まれる。
【産業上の利用可能性】
【0045】
本発明は、テキスト分析に利用することができる。
【符号の説明】
【0046】
2 処理サーバ(テキスト分析装置)
21 API部(テキストデータ群取得部)
251 単語抽出部
252 共通単語抽出部
253 グラフ情報生成部
254 共通単語リスト生成部
5 共通単語リスト