IP Force 特許公報掲載プロジェクト 2022.1.31 β版

知財求人 - 知財ポータルサイト「IP Force」

▶ NECプラットフォームズ株式会社の特許一覧

特許7563830情報処理システム、情報処理方法、およびプログラム
<>
  • 特許-情報処理システム、情報処理方法、およびプログラム 図1
  • 特許-情報処理システム、情報処理方法、およびプログラム 図2
  • 特許-情報処理システム、情報処理方法、およびプログラム 図3
  • 特許-情報処理システム、情報処理方法、およびプログラム 図4
  • 特許-情報処理システム、情報処理方法、およびプログラム 図5
  • 特許-情報処理システム、情報処理方法、およびプログラム 図6
  • 特許-情報処理システム、情報処理方法、およびプログラム 図7
  • 特許-情報処理システム、情報処理方法、およびプログラム 図8
  • 特許-情報処理システム、情報処理方法、およびプログラム 図9
  • 特許-情報処理システム、情報処理方法、およびプログラム 図10
< >
(19)【発行国】日本国特許庁(JP)
(12)【公報種別】特許公報(B2)
(11)【特許番号】
(24)【登録日】2024-09-30
(45)【発行日】2024-10-08
(54)【発明の名称】情報処理システム、情報処理方法、およびプログラム
(51)【国際特許分類】
   G06Q 50/10 20120101AFI20241001BHJP
   G06F 40/279 20200101ALI20241001BHJP
   G06F 40/216 20200101ALI20241001BHJP
【FI】
G06Q50/10
G06F40/279
G06F40/216
【請求項の数】 9
(21)【出願番号】P 2023040780
(22)【出願日】2023-03-15
(65)【公開番号】P2024130851
(43)【公開日】2024-09-30
【審査請求日】2023-03-15
(73)【特許権者】
【識別番号】000227205
【氏名又は名称】NECプラットフォームズ株式会社
(74)【代理人】
【識別番号】100149548
【弁理士】
【氏名又は名称】松沼 泰史
(74)【代理人】
【識別番号】100181135
【弁理士】
【氏名又は名称】橋本 隆史
(72)【発明者】
【氏名】江戸 奏
【審査官】齊藤 貴孝
(56)【参考文献】
【文献】特開2006-338697(JP,A)
【文献】特開2004-102814(JP,A)
【文献】特開2002-140465(JP,A)
【文献】安達 由洋、外4名,感情語辞書を用いた日本語文の感情分析,可視化情報学会誌,日本,一般社団法人可視化情報学会,2021年06月01日,第41巻,第161号,p.21-27
(58)【調査した分野】(Int.Cl.,DB名)
G06Q 10/00-99/00
G06F 40/00-40/58
(57)【特許請求の範囲】
【請求項1】
調査対象についての自由記述形式のテキストを含むアンケート回答の情報を処理する情報処理システムであって、
前記テキストが、前記調査対象へのどのような評価を伴うかを判定する評価判定手段と、
前記テキストから、前記調査対象への否定的評価に関連する1以上の特徴語句を抽出する特徴語句抽出手段と、
前記テキストが前記調査対象への否定的評価を伴うと前記評価判定手段が判定したことに応答して、前記抽出された特徴語句に関連するメッセージを提示させるメッセージ手段と、
を備える、情報処理システム。
【請求項2】
前記メッセージは、
(1)前記否定的評価を低減または解消するための提案、
(2)前記調査対象についての説明、
(3)前記調査対象についての謝罪、および
(4)前記調査対象についての質問
からなる群より選択された1以上を含む、
請求項1に記載の情報処理システム。
【請求項3】
前記特徴語句抽出手段は、前記テキストにおける語句の出現数、前記テキストにおける語句の出現頻度、トピックモデル、および前記テキストから生成された共起ネットワークのうち1以上を使用して、前記テキストから前記特徴語句を抽出する、
請求項1または2に記載の情報処理システム。
【請求項4】
重みづけされた語句を前記テキストから抽出するか、または前記テキストから抽出された語句に重みづけを行う重要度評価手段をさらに備え、
前記特徴語句抽出手段は、前記重要度評価手段による重みづけの結果に基づいて、前記1以上の特徴語句を抽出する、
請求項1または2に記載の情報処理システム。
【請求項5】
前記評価判定手段は、テキストの文章ベクトルと当該テキストに伴う評価との関係を学習した学習済みモデルを使用して、前記判定を行う、
請求項1または2に記載の情報処理システム。
【請求項6】
前記メッセージ手段は、前記テキストが前記調査対象への否定的評価を伴うと前記評価判定手段が判定した場合に、前記否定的評価を低減または解消するための提案を含むメッセージを提示させる、
請求項1または2に記載の情報処理システム。
【請求項7】
前記メッセージ手段は、前記テキストが前記調査対象への否定的評価を伴うと前記評価判定手段が判定した場合に、前記調査対象についての質問を含むメッセージをアンケートの回答者に対して提示させる、
請求項1または2に記載の情報処理システム。
【請求項8】
コンピュータによって実行される情報処理方法であって、
アンケート回答に含まれる調査対象についての自由記述形式のテキストが、前記調査対象へのどのような評価を伴うかを判定することと、
前記テキストから、前記調査対象への否定的評価に関連する1以上の特徴語句を抽出することと、
前記テキストが前記調査対象への否定的評価を伴うと判定したことに応答して、前記抽出された特徴語句に関連するメッセージを提示させることと、
を含む、情報処理方法。
【請求項9】
アンケート回答に含まれる調査対象についての自由記述形式のテキストが、前記調査対象へのどのような評価を伴うかを判定することと、
前記テキストから、前記調査対象への否定的評価に関連する1以上の特徴語句を抽出することと、
前記テキストが前記調査対象への否定的評価を伴うと判定したことに応答して、前記抽出された特徴語句に関連するメッセージを提示させることと、
をコンピュータに実行させる、
プログラム。
【発明の詳細な説明】
【技術分野】
【0001】
本発明は、情報処理システム、情報処理方法、およびプログラムに関する。
【背景技術】
【0002】
自由記述形式の回答を含むアンケート結果を分析する技術が提案されている。
たとえば、特許文献1に記載されたアンケート結果表示システムは、選択肢から選択される要因項目評価と、要因項目評価を選択した理由を示す自由記述形式の詳細要因と、を含むアンケート回答を分析するものである。
【先行技術文献】
【特許文献】
【0003】
【文献】特開2020-149348号公報
【発明の概要】
【発明が解決しようとする課題】
【0004】
しかしながら、特許文献1に記載されたアンケート結果表示システムは、自由記述形式で回答された詳細要因の内容を、単に予め設定した複数の詳細要因項目のいずれかに分類するものである。このため、詳細要因項目として想定されていない語句が自由記述形式の回答に含まれていた場合には、アンケート出題者に提示される分析結果に当該語句が反映されない。そうすると、アンケート結果表示システムの出力結果は、自由記述形式のアンケート回答を十分に反映できていないものとなる。したがって、自由記述形式のアンケート回答に基づく出力内容の正確性を向上させる余地がある。
【0005】
そこで本発明は、上述の課題を解決する情報処理システム、情報処理方法、およびプログラムを提供することを目的とする。
【課題を解決するための手段】
【0006】
本発明の第1態様によれば、調査対象についての自由記述形式のテキストを含むアンケート回答の情報を処理する情報処理システムであって、前記テキストから、前記調査対象への否定的評価に関連する1以上の特徴語句を抽出する特徴語句抽出手段と、前記抽出された特徴語句に関連するメッセージを提示させるメッセージ手段と、を備える、情報処理システムが提供される。
【0007】
本発明の第2態様によれば、コンピュータによって実行される情報処理方法であって、アンケート回答に含まれる調査対象についての自由記述形式のテキストから、前記調査対象への否定的評価に関連する1以上の特徴語句を抽出することと、前記抽出された特徴語句に関連するメッセージを提示させることと、を含む、情報処理方法が提供される。
【0008】
本発明の第3態様によれば、アンケート回答に含まれる調査対象についての自由記述形式のテキストから、前記調査対象への否定的評価に関連する1以上の特徴語句を抽出することと、前記抽出された特徴語句に関連するメッセージを提示させることと、をコンピュータに実行させる、プログラムが提供される。
【発明の効果】
【0009】
本発明の実施形態によれば、自由記述形式のアンケート回答に基づく出力内容の正確性を向上させることができる。
【図面の簡単な説明】
【0010】
図1】第1実施形態に係る情報処理システム100を示すブロック図である。
図2】第1実施形態に係る情報処理システム100によるメッセージ生成処理の概要を示す図である。
図3】第1実施形態に係る情報処理システム100における情報の流れを示す図である。
図4】第1実施形態に係る情報処理システム100の処理フローを示すフローチャートである。
図5】第1実施形態に係る情報処理システム100の特徴語句208の抽出方法を示すフローチャートである。
図6】第2実施形態に係る情報処理システム100によるメッセージ生成処理の概要を示す図である。
図7】第3実施形態に係る情報処理システム100によるメッセージ生成処理の概要を示す図である。
図8】実施形態に係る情報処理システム800の最小構成を示す図である。
図9】実施形態に係る情報処理システム800の最小構成による処理フローを示すフローチャートである。
図10】少なくとも1つの実施形態に係るコンピュータの構成を示す概略ブロック図である。
【発明を実施するための形態】
【0011】
以下、実施形態の情報処理システム、情報処理方法、およびプログラムを、図面を参照して説明する。本明細書において、「XXに基づく」とは「少なくともXXに基づく」ことを意味し、XXに加えて別の要素に基づく場合も含む。また、「XXに基づく」とは、XXを直接に用いる場合に限定されず、XXに対して演算や加工が行われたものに基づく場合も含む。「XX」は、任意の要素(例えば情報)である。
【0012】
<第1実施形態>
(情報処理システム100の構成)
まず、図1図3を参照して、第1実施形態に係る情報処理システム100の構成について説明する。
図1は、第1実施形態に係る情報処理システム100を示すブロック図である。
図2は、第1実施形態に係る情報処理システム100によるメッセージ生成処理の概要を示す図である。
図3は、第1実施形態に係る情報処理システム100における情報の流れを示す図である。
【0013】
図1に示す情報処理システム100は、出題者10によって出題されたアンケートに対する回答者20の回答(以下、「アンケート回答」という。)の情報を処理するシステムである。アンケートは、特定の調査対象(たとえば、出題者10の製品またはサービス)についての回答を求めるものである。アンケート回答は、自由記述形式の回答を含む。アンケート回答は、自由記述形式の回答に加えて、選択形式の回答を含んでもよい。
【0014】
情報処理システム100は、たとえば、アンケート回答の集計および/または分析を行うアンケート分析システム、ネットリサーチなどにおける分類処理システムなどとして利用可能である。
【0015】
図1に示すように、情報処理システム100は、取得部110、回答データ記憶部120、モデル記憶部130、分析部140、メッセージ生成部160、および出力部170をその機能部として含む。情報処理システム100は、単独の情報処理装置(たとえば、コンピュータ、タブレット端末、スマートフォンなど)であってもよく、複数の情報処理装置の協働によって実現されるシステムであってもよい。以下では、情報処理システム100は、独立したシステムとして説明するが、各機能をプログラムとして提供することも可能である。情報処理システム100は、運用管理端末などの情報処理装置にプログラムをインストールすること、出題者10が利用する情報処理装置にプログラムをインストールすること、および/またはクラウド上の仮想サーバにプログラムをインストールすることによっても実現可能である。
【0016】
図2に示すように、情報処理システム100は、回答者20の自由記述データ124を含むアンケート回答情報122から特徴語句208を抽出し、この特徴語句208に基づくメッセージ210を出題者10に提示する。
【0017】
情報処理システム100は、個々のアンケート回答に対して上記処理を個別に実行してもよく、複数のアンケート回答が蓄積された集合に対して上記処理を実行してもよい。前者の場合には、個別のアンケート回答から特徴語句208が抽出され、個別にメッセージ210が生成され得る。この場合、個々の回答者20に最適化された特徴語句208およびメッセージ210を出力できるので、個別の回答者20に対するフォローを行うのに有益である。一方、後者の場合には、アンケート回答の集合から特徴語句208が抽出され、集合全体に対するメッセージ210が生成され得る。この場合、回答者20の集合全体の傾向に基づいて特徴語句208およびメッセージ210を出力できるので、全体最適な改善策を検討するのに有益である。
【0018】
図1に示すように、取得部110は、回答者20からアンケート回答情報122を取得する。取得部110は、回答者20が回答入力端末に入力したデータをアンケート回答情報122として取得してもよく、回答者20がアンケート用紙に記入した回答をOCR(Optical Character Reader:光学文字認識機能)などで電子化したデータをアンケート回答情報122として取得してもよい。
【0019】
回答データ記憶部120は、アンケート回答情報122を記憶する。アンケート回答情報122は、自由記述データ124を含む。自由記述データ124は、好ましくはテキストデータであるが、音声データなど他の形式のデータであってもよい。
【0020】
モデル記憶部130は、情報処理システム100の分析処理に使用される各種モデルを記憶する。たとえば、モデル記憶部130は、クラス分類モデル132、トピックモデル134、文章生成モデル136などの分析モデルを記憶する。
【0021】
分析部140は、アンケート回答情報122を分析する。具体的には、分析部140は、前処理部142、評価判定部144、および特徴語句抽出部146を含む。
【0022】
前処理部142(「前処理手段」の一例)は、アンケート回答情報122の自由記述データ124に対して、必要な前処理を実行する。具体的には、前処理部142は、自由記述データ124に対して自然言語処理を実行することにより、回答者20の自由記述式回答をコンピュータ処理可能な形式に変換する。たとえば、前処理部142は、自由記述データ124のテキストに対して自然言語処理を実行することによって、図3のようにテキストの文章ベクトル200を生成する。具体的には、前処理部142は、自由記述データ124に含まれる不要な情報を取り除くクリーニング処理、自由記述データ124を単語単位に分割する形態素解析処理、自由記述データ124中の表記ゆれを統一する正規化処理、処理対象外であるストップワードの除去処理などの処理を実行する。これにより、前処理部142は、自由記述データ124を、単語単位に分割されたクリーンなテキストに変換する。次いで、前処理部142は、テキストのベクトル化処理を実行する。ベクトル化の手法の例としては、TF-IDF(Term Frequency-Inverse Document Frequency)のようなBoW(Bag of Words)の手法、BERT(Bidirectional Encoder Representations from Transformers)やWord2Vecのような分散表現の手法などが挙げられる。
【0023】
評価判定部144(「評価判定手段」の一例)は、自由記述データ124のテキストが調査対象へのどのような評価を伴うかを判定する。たとえば、評価判定部144は、自由記述データ124のテキストが調査対象への否定的評価を伴うか否かを判定する。具体的には、評価判定部144は、自由記述データ124のテキストが調査対象への肯定的評価および否定的評価(さらに中立的評価を追加してもよい)のいずれを伴うかを判定するポジティブ・ネガティブ判定を実行することができる。
【0024】
評価判定部144は、クラス分類モデル132を使用して、判定を行うことができる。クラス分類モデル132は、テキストの文章ベクトルと当該テキストに伴う評価(たとえば、肯定的評価、否定的評価、および中立的評価のいずれか)との関係を学習した学習済みモデルであってよい。文章ベクトル200は、TF-IDF、BERT、Word2Vecなど任意の手法で得られたものであってよい。具体的には、評価判定部144は、モデル記憶部130に保存されたクラス分類モデル132を読み込み、自由記述データ124の文章ベクトル200をクラス分類モデル132に入力する。クラス分類モデル132は、テキストの文章ベクトル200が入力されたことに応答して、当該テキストがどのような評価を伴うかを推測することができる。評価判定部144は、図3のように、クラス分類モデル132の出力として、自由記述データ124における調査対象への評価を判定することができる。これにより、評価判定部144は、評価判定結果202を得ることができる。
【0025】
クラス分類モデル132の学習データは、予め用意した複数の自由記述テキストに対して評価のラベル付けを行うとともに、自然言語処理によって文章ベクトルを生成することによって得られる。入力としての文章ベクトルおよび出力としての評価ラベルの組を大量に学習させることにより、文章ベクトルと評価との関係を学習したクラス分類モデル132が得られる。クラス分類モデル132には、サポートベクターマシン(SVM)、決定木、ニューラルネットワークといった既知の任意のアルゴリズムが使用可能である。
【0026】
クラス分類モデル132は、予め訓練された学習済みモデルとしてモデル記憶部130に保存され得る。この場合、情報処理システム100を使用する前に、予め用意された学習データによるクラス分類モデル132の訓練が行われる。あるいは、クラス分類モデル132は、評価判定部144による評価判定時に(たとえば、リアルタイムで)学習を行ってもよい。この場合、ユーザ(たとえば、出題者10)は、蓄積されたアンケート回答のテキストに対して評価のラベル付けを行い、当該ラベル付けされたテキストの文章ベクトルおよびそのラベル情報の組を学習データとして、クラス分類モデル132の訓練を行うことができる。
【0027】
なお、評価判定部144による判定処理は、上記に限定されない。たとえば、評価判定部144は、機械学習モデルを使用せず、ルールベースで判定処理を行ってもよい。具体的には、評価判定部144は、予め作成した評価判定辞書を使用してもよい。評価判定辞書は、複数の語句と、各語句に付与された肯定的評価や否定的評価といった評価ラベルと、を含む語句リストである。この場合、評価判定部144は、評価判定辞書を読み込み、評価判定辞書を参照して、自由記述データ124における肯定的語句(ポジティブワード、ポジティブフレーズ)および否定的語句(ネガティブワード、ネガティブフレーズ)それぞれの出現数の比率を計算する。評価判定部144は、計算した肯定的語句および否定的語句の出現比率を重みとして、自由記述データ124のテキストがどのような評価を伴うかを判定する。
【0028】
あるいは、評価判定部144は、アンケート回答情報122に含まれる選択形式の回答に基づいて、判定処理を行ってもよい。たとえば、アンケートは、調査対象についての評価を尋ねる選択式質問(たとえば、「この製品を使用した感想を教えてください。」との質問および「非常に満足」「それなりに満足」「普通」「あまり満足していない」「非常に不満」などの選択肢)と、その評価の理由を尋ねる自由記述式質問(「上記の選択の理由を自由にお答えください。」)とを含んでよい。この場合、評価判定部144は、選択式質問の回答によって回答者20の評価を判定することができる。評価判定部144が自由記述形式のテキストに基づいて判定処理を行う場合、自由記述データ124のみに基づいて分析することが可能であるので、アンケートの冗長化を抑制できる点で好ましい。一方、選択式質問への回答を利用して判定処理を行う場合、判定処理の確実性が向上するとともに計算処理の負担を軽減できる点で好ましい。
【0029】
特徴語句抽出部146(「特徴語句抽出手段」の一例)は、自由記述データ124の前処理によって得られたテキストから、アンケート回答の内容を示す1以上の特徴的な語句(以下、「特徴語句」という。)を抽出する。ここで、「語句」とは、1つの単語、および、2以上の単語を含む連語、句、または節を包含する概念である。たとえば、「エアコン」、「高燃費」、「不十分な冷却性能」、「音がうるさい」などは、すべて語句に該当する。
【0030】
特徴語句抽出部146は、語句抽出部150および重要度評価部152を含む。
語句抽出部150は、図3のように、自由記述データ124から1以上の語句を特徴語句候補204として抽出する。具体的には、語句抽出部150は、自由記述データ124のテキストにおける語句の出現数または出現頻度、モデル記憶部130に保存されたトピックモデル134、自由記述データ124のテキストから生成された共起ネットワークなどの手法を使用して、特徴語句候補204を抽出する。これらの各手法の詳細は、図5を参照して後述する。なお、語句抽出部150の処理は、これらに限定されず、その他の任意の手法を使用可能である。
【0031】
重要度評価部152(「重要度評価手段」の一例)は、語句抽出部150により抽出された特徴語句候補204に対して重みづけを行い、各特徴語句候補204の重要度206を計算する。特徴語句抽出部146は、図3のように、重要度評価部152による重みづけの結果(すなわち、重要度206)に基づいて、特徴語句候補204から1以上の特徴語句208を抽出する。
【0032】
このようにして、特徴語句抽出部146は、特徴語句候補204を抽出するとともに各特徴語句候補204の重要度206を評価することによって、特徴語句208を抽出することができる。あるいは、特徴語句抽出部146は、重要度206を計算せず、特徴語句208を直接抽出してもよい。
【0033】
特徴語句抽出部146は、自由記述データ124のテキストが調査対象への否定的評価に関連する場合に、特徴語句208を抽出することができる。具体的には、特徴語句抽出部146は、自由記述データ124のテキストが調査対象への否定的評価を伴うと評価判定部144が判定した場合に、当該否定的評価を伴うと判定されたテキストから特徴語句208を生成する。逆に、評価判定部144による評価判定結果202が否定的評価以外であった場合には、特徴語句抽出部146は、特徴語句208の抽出を行わなくてもよい。これにより、情報処理システム100は、改善の必要を指摘していないアンケート回答を分析対象から除外することができるので、処理負荷が軽減され得る。
【0034】
メッセージ生成部160(「メッセージ手段」の一例)は、分析部140の分析結果に基づいて、メッセージ210を生成する。メッセージ生成部160により生成されるメッセージ210は、たとえば、アンケート回答の内容を踏まえた具体的なメッセージ210である。メッセージ210は、たとえば、回答者20による否定的評価を低減または解消するための提案文214を含む。具体的には、メッセージ生成部160は、特徴語句抽出部146によって抽出された特徴語句208が示す事項を改善するための提案を含むメッセージ210を生成することができる。
【0035】
たとえば、メッセージ生成部160は、図2に示すように、出題者10への主題文212および提案文214を生成することができる。メッセージ生成部160は、重要度206が大きい特徴語句Aについて、「特徴語句Aを改善する方法」「特徴語句Aを改善してください」といった主題文212を生成する。さらに、メッセージ生成部160は、特徴語句抽出部146により抽出された1以上の特徴語句208についての提案文214を生成する。メッセージ生成の対象である特徴語句208は、主題文212に含まれる特徴語句Aであってもよく、別の特徴語句208であってもよく、その両方であってもよい。メッセージ生成部160は、文章生成アルゴリズムを使用して、提案文214を含むメッセージ210を生成することができる。具体的には、メッセージ生成部160は、モデル記憶部130に保存された文章生成モデル136を読み込み、文章生成モデル136を使用して特徴語句208についての提案文214を生成する。提案文214は、出題者10に向けた、特徴語句208に関連する具体的な改善方法を含む。メッセージ210は、上記のようにして生成された主題文212および提案文214を含む。なお、メッセージ210は、主題文212および提案文214の一方のみを含んでもよい。
【0036】
文章生成モデル136に使用される文章生成アルゴリズムとしては、BERTやGPT-3(Generative Pre-trained Transformer 3)などのTransformerモデルが挙げられるが、これに限定されず、任意のアルゴリズムが使用可能である。文章生成モデル136は、予め大量のテキストを学習させることによって、自然な文章を生成することができる。
【0037】
メッセージ生成部160は、生成された「特徴語句Aを改善する方法」「特徴語句Aを改善してください」といった主題文212を文章生成モデル136に入力することによって、提案文214を生成してもよい。また、メッセージ生成部160は、特徴語句208を別の語句と組み合わせて文章生成モデル136に入力してもよい。別の語句は、たとえば、予め設定した語句(アンケートの調査対象についての語句、質問の前提に関する語句など)、選択式質問の回答から決定した語句などである。
【0038】
メッセージ生成部160は、自由記述データ124のテキストが調査対象への否定的評価に関連する場合に、メッセージ210を生成することができる。具体的には、メッセージ生成部160は、自由記述データ124のテキストが調査対象への否定的評価を伴うと評価判定部144が判定した場合に、当該否定的評価を低減または解消するための提案を含むメッセージ210を生成する。逆に、評価判定部144による評価判定結果202が否定的評価以外であった場合には、メッセージ生成部160は、メッセージ210の生成を行わなくてもよい。
【0039】
メッセージ生成部160は、生成されたメッセージ210を出力形式に変換して出力部170に送信する。出力部170(「メッセージ手段」の一例)は、メッセージ生成部160によって生成されたメッセージ210を出力し、出題者10に対して提示する。メッセージ210の提示方法は特に限定されず、テキストとして提示されてもよく、画像や音声などテキスト以外の形式で提示されてもよい。
【0040】
情報処理システム100が単独の情報処理装置で構成される場合には、当該情報処理装置は、単独で特徴語句208の抽出ならびにメッセージ210の生成および出力を実行することができる。情報処理システム100が複数の情報処理装置の協働によって実現される場合には、様々な形で上記の各機能の分散処理が行われてよい。たとえば、第1情報処理装置が、特徴語句208を抽出するとともに抽出された特徴語句208の情報を第2情報処理装置に送信し、第2情報処理装置が、特徴語句208に関連するメッセージ210を生成することができる。ユーザへのメッセージ210の提示は、第1情報処理装置、第2情報処理装置、および別の情報処理装置または提示装置のいずれが実行してもよい。特徴語句208の抽出を実行した第1情報処理装置は、当該第1情報処理装置の構成(たとえば、ディスプレイやスピーカーといった第1情報処理装置の出力インタフェース)または別の装置(たとえば、第2情報処理装置、別の情報処理装置または提示装置)をして、メッセージ210をユーザに提示させることができる。
【0041】
(情報処理システム100の処理フロー)
次いで、図4および図5を参照して、情報処理システム100による情報処理方法について説明する。
図4は、第1実施形態に係る情報処理システム100の処理フローを示すフローチャートである。
図5は、第1実施形態に係る情報処理システム100の特徴語句208の抽出方法を示すフローチャートである。
【0042】
情報処理システム100による情報処理方法は、アンケート回答に含まれる調査対象についての自由記述形式のテキストから、調査対象への否定的評価に関連する1以上の特徴語句208を抽出することと、抽出された特徴語句208に関連するメッセージ210を提示させることと、を含む。
【0043】
以下、情報処理システム100の処理フローについて具体的に説明する。図4に示すように、まずステップS401において、情報処理システム100は、回答者20の回答データの入力を受け付ける。ステップS402では、取得部110が、入力されたアンケート回答情報122を取得する。ステップS403では、前処理部142が、アンケート回答情報122に含まれる自由記述データ124の前処理を行い、自由記述データ124の文章ベクトル200を生成する。ステップS404では、評価判定部144が、前処理部142により生成された文章ベクトルを使用して、回答者20による調査対象の評価を判定する。評価判定結果202が否定的評価でない場合(ステップS405:No)、情報処理システム100は、処理を終了する。評価判定結果202が否定的評価である場合(ステップS405:Yes)、ステップS406では、語句抽出部150が、自由記述データ124から特徴語句候補204を抽出する。ステップS407では、重要度評価部152が、各特徴語句候補204の重みづけを行い、重要度206を計算する。ステップS408では、特徴語句抽出部146が、重要度206に基づいて、特徴語句候補204から特徴語句208を抽出する。ステップS409では、メッセージ生成部160が、抽出された特徴語句208についてのメッセージ210を生成する。ステップS410では、出力部170が、メッセージ210を出力する。
【0044】
次いで、図5を参照して、特徴語句候補204の抽出、重要度206の評価、および特徴語句208の抽出の手法について詳述する。特徴語句抽出部146は、上記のとおり、以下の(a)~(c)の特徴語句抽出手法を使用することができる。
(a)自由記述データ124のテキストにおける語句の出現数または出現頻度を利用する手法
(b)モデル記憶部130に保存されたトピックモデル134を利用する手法
(c)自由記述データ124のテキストから生成された共起ネットワークを利用する手法
【0045】
手法(a)の場合(ステップS501:出現数または出現頻度)、特徴語句抽出部146は、自由記述データ124のテキスト中の各語句の出現数または出現頻度に基づいて、特徴語句208を抽出することができる。
【0046】
具体的には、ステップS502において、特徴語句抽出部146は、自由記述データ124のテキストに含まれる語句ごとに、出現数または出現頻度を計算する。次いで、ステップS503において、特徴語句抽出部146は、出現数または出現頻度が大きい語句を、特徴語句208として抽出する。たとえば、特徴語句抽出部146は、出現数または出現頻度が所定の閾値より大きい語句を特徴語句208として抽出する。この場合、特徴語句抽出部146は、特徴語句候補204の抽出および重要度206の計算を行わずに、特徴語句208を自由記述データ124から直接抽出している。言い換えれば、特徴語句抽出部146は、重みづけされた語句を自由記述データ124から抽出している。なお、特徴語句抽出部146は、出現数または出現頻度の代わりに、出現数または出現頻度に依存する任意の関数を使用して特徴語句208を抽出してもよい。
【0047】
特徴語句抽出部146は、まず特徴語句候補204を抽出した後、重要度206を計算し、重要度206に基づいて特徴語句208を抽出してもよい。この場合、まず、語句抽出部150が、各語句の出現数または出現頻度を計算する。語句抽出部150は、出現数または出現頻度が大きい語句を特徴語句候補204として抽出する。次いで、重要度評価部152が、語句抽出部150が計算した出現数もしくは出現頻度、またはその関数に基づいて、特徴語句候補204の重みづけを行う。たとえば、重要度評価部152は、出現数の関数として、(特定語句の出現数)/(文書の総単語数)を計算する。特徴語句抽出部146は、語句の出現数、出現頻度、またはその関数の値を重要度206として使用することができる。特徴語句抽出部146は、出現数、出現頻度、またはその関数の値が大きい語句(たとえば、所定閾値より大きい語句)を特徴語句208として抽出する。
【0048】
手法(b)の場合(ステップS501:トピックモデル)、語句抽出部150は、トピックモデル134を使用して、特徴語句候補204を抽出することができる。トピックモデルとは、文書の中にある単語の種類や頻度を元に文書全体の潜在的な意味を解析する手法である。
【0049】
具体的には、ステップS504において、語句抽出部150が、モデル記憶部130に保存されたトピックモデル134を使用して、自由記述データ124のテキストのトピック(主題)を判定する。ステップS505では、語句抽出部150が、テキスト中で出現確率が高いトピックを特徴語句候補204として抽出することができる。
【0050】
ステップS506では、重要度評価部152が、テキストにおける各トピックの出現確率に基づいて、特徴語句候補204の重みづけを行う。たとえば、重要度評価部152は、トピックモデル134から出力される各トピックの出現確率またはその関数を重要度206として使用することができる。特徴語句抽出部146は、出現確率が大きいトピック(たとえば、所定閾値より大きいトピック)を特徴語句208として抽出する。
【0051】
手法(c)の場合(ステップS501:共起ネットワーク)、語句抽出部150は、自由記述データ124から生成された共起ネットワークに基づいて、特徴語句候補204を抽出することができる。共起ネットワークを使用することによって、文章中に出現する語句間の関係性を明らかにすることができる。これにより、どの語句が重視されていて、どの語句とともに出現する頻度が高いのかを可視化することができる。
【0052】
具体的には、ステップS507において、語句抽出部150が、自由記述データ124のテキストに含まれる語句間の共起ネットワークを生成する。ステップS508では、語句抽出部150が、共起ネットワークにおいて所定のネットワークを構成している語句を特徴語句候補204として抽出する。たとえば、語句抽出部150は、予め設定した対象語句とのネットワークを構成している語句を特徴語句候補204として抽出する。
【0053】
ステップS509では、重要度評価部152が、Jaccard係数の値に基づいて、特徴語句候補の重みづけを行う。Jaccard係数とは、語句Aと語句Bの少なくとも一方が含まれている文のうち、両方含まれている文の割合を示す値である。Jaccard係数は、共起性の強さ(すなわち、語句間の関連性)を表す指標であり、多くの文章で出現する語句間では大きくなり、出現頻度の低い語句間では小さくなる。たとえば、重要度評価部152は、評価対象である語句と、予め設定した対象語句との間のJaccard係数を計算する。特徴語句抽出部146は、Jaccard係数が大きい語句(たとえば、所定閾値より大きい語句)を特徴語句208として抽出する。
【0054】
特徴語句抽出部146は、上記の手法(a)~(c)の2以上を併用してもよい。あるいは、上記の手法(a)~(c)の1以上と別の手法とを併用してもよい。複数の手法によって特徴語句208を抽出することにより、特徴語句208の選定に自由度を持たせることができる。手法(a)では、特徴語句抽出部146は、語句間の関連性にかかわらず特徴語句208を選定し得るのに対し、手法(c)では、特徴語句抽出部146は、語句間の関連性に基づいて特徴語句208を選定する。手法(b)では、特徴語句抽出部146は、自由記述データ124のテキストに含まれる語句以外の語句(トピック)を特徴語句208として抽出することができる。
【0055】
(効果)
本実施形態に係る情報処理システム100によれば、自由記述形式のアンケート回答から特徴語句208を抽出し、抽出された特徴語句208に基づくメッセージ210を提示させることができる。これにより、自由記述形式のアンケート回答に基づくメッセージ210を提示するにあたって、元のアンケート回答の内容を精度よくメッセージ210に反映することができる。また、必ずしも特許文献1のように予め自由記述形式のアンケート回答を分類するためのカテゴリを設定する必要がないため、アンケート作成の効率が向上し得る。さらに、予めカテゴリを設定する場合に発生する可能性のある分析の恣意性を低減させることができるので、より客観的なメッセージ210を得ることができる。
【0056】
本実施形態に係る情報処理システム100は、自動的に特徴語句208の抽出を実行することができる。このため、重要な語句を手動で抽出する場合に比べて、アンケート回答の分析作業の効率性が格段に向上し得る。また、語句の抽出作業における属人的および主観的なブレが排除されるので、分析の精度が向上し得る。これにより、回答者20が重視するポイントが出題者10の予測できない事項である場合でも、当該ポイントを特徴語句208として抽出して、適切なメッセージ210を出力することができる。
【0057】
また、自由記述形式のアンケート回答をそのまま文章生成モデルに入力してメッセージ210を出力する場合の問題点として、たとえば以下が挙げられる。
(1)複雑でわかりにくいアンケート回答が入力された場合に、適切なメッセージ210を生成できないおそれがある。
(2)複雑でわかりにくいアンケート回答が入力された場合に、文章生成モデルに対して不適切な学習データが入力されてしまうおそれがある。
(3)外部サーバに保存された文章生成モデルを使用する場合に、アンケート回答結果がそのまま外部サーバに送信されるので、セキュリティ上問題となるおそれがある。
これに対し、本実施形態に係る情報処理システム100は、自由記述形式のアンケート回答から特徴語句208を抽出した上で、抽出した特徴語句208に基づくメッセージ210を出力する。したがって、上記の問題点(1)~(3)が軽減または解消され得る。
【0058】
ところで、一般的には、テキスト全体ではなく特定の語句を文章生成モデル136に入力する場合には、元のテキストの文脈を十分に読み取れなくなる可能性がある。その上、特徴語句208を抽出するという処理を挟むと、単純にテキストを文章生成モデル136に入力する場合に比べて、特徴語句208の抽出処理の分だけ計算負荷が増加する可能性がある。しかしながら、本実施形態では、分析対象は単純なアンケート回答であり、自由記述式回答における前提条件は予め十分に把握可能であるので、テキストから文脈を読み取る必要性は薄い。むしろ、短文のアンケート回答のテキストのみから文脈を読み取ることが困難な場合もある。このため、アンケート回答の分析においては、テキストをそのまま文章生成モデル136に入力せず、一旦テキストから特徴語句208を抽出することが有効であり得る。
【0059】
本実施形態に係る情報処理システム100は、否定的評価を低減または解消するための提案を含むメッセージを提示させることができる。これにより、アンケート回答を踏まえたネクストアクションが明確化され得る。このため、単にアンケート回答の要約として特徴語句208を提示する場合に比べて、出題者10が改善策を検討する負荷を軽減することができる。
【0060】
本実施形態に係る情報処理システム100は、アンケート回答のテキストに自然言語処理を行うことによって、テキストの文章ベクトルを生成する前処理部142を含む。文章ベクトルを計算処理対象とすることにより、テキストそのものを扱う場合に比べてデータ量を削減するとともに、計算処理を高速化することができる。
【0061】
本実施形態に係る情報処理システム100は、重みづけされた語句をアンケート回答のテキストから抽出するか、またはテキストから抽出された語句に重みづけを行う重要度評価部152を含む。これにより、情報処理システム100は、自動的に語句の重要度206を評価するので、手動での重みづけ作業を省略できる。また、上記の特徴語句抽出と同様に、語句の重みづけ作業における属人的および主観的なブレが排除されるので、分析の精度が向上し得る。
【0062】
本実施形態に係る情報処理システム100は、アンケート回答のテキストが、アンケート調査対象へのどのような評価を伴うかを判定する評価判定部144を含む。これにより、情報処理システム100は、アンケート回答が肯定的評価および否定的評価のいずれを伴うかを手動で判定する場合に比べて、アンケート回答の分析作業の効率性が格段に向上し得る。また、上記の特徴語句抽出および重みづけと同様に、評価判定作業における属人的および主観的なブレが排除されるので、分析の精度が向上し得る。
【0063】
<第2実施形態>
図6を参照して、第2実施形態に係る情報処理システム100について説明する。第2実施形態は、回答者20への質問文216を含むメッセージ210を出力する点で第1実施形態と相違する。以下では、主に上記実施形態との相違点について説明し、上記実施形態と共通する点についての説明は繰り返さない。
図6は、第2実施形態に係る情報処理システム100によるメッセージ生成処理の概要を示す図である。
【0064】
第2実施形態に係る情報処理システム100は、回答者20とリアルタイムでやりとりをすることができる。具体的には、図6に示すように、情報処理システム100は、回答者20が入力したアンケート回答情報122から特徴語句208を抽出し、特徴語句208から質問文216を含むメッセージ210を生成する。これにより、情報処理システム100は、回答者20がアンケート回答を入力したことに応答して、質問文216を含むメッセージ210をリアルタイムで生成し、回答者20に提示することができる。情報処理システム100は、メッセージ210とともに回答フォーム218を表示して、回答者20に質問文216へのさらなる回答を求めることができる。
【0065】
具体的には、第1実施形態と同様にして抽出された特徴語句208に基づいて、メッセージ生成部160が、追加の質問文216を生成する。たとえば、否定的評価を伴う自由記述データ124から「エアコンの冷却性能」という特徴語句208が抽出された場合には、メッセージ生成部160は、「エアコンの冷却性能」について回答者20の満足度を向上させるために必要な質問文216を生成する。この場合の質問としては、回答者20が冷却性能に不満を感じたタイミング、エアコンの使用環境、エアコンの使用年数、エアコンのメンテナンス状況、出題者10に対する回答者20の要望などが挙げられる。
【0066】
メッセージ生成部160は、質問文216に加えて、または質問文216の代わりに、調査対象についての説明文(たとえば、製品の使用方法やメンテナンス方法の説明文)、回答者20に対する提案文(たとえば、修理サービスやメンテナンスサービスの提案文)、回答者20に対する謝罪文など、任意のメッセージ210を生成してもよい。また、メッセージ生成部160は、回答者20に対する質問文216などのメッセージ210に加えて、第1実施形態と同様に、出題者10への提案文214を生成してもよい。
【0067】
メッセージ生成部160は、自由記述データ124のテキストが調査対象への否定的評価を伴うと評価判定部144が判定した場合に、調査対象についての追加の質問文216を含むメッセージ210を生成する。逆に、評価判定部144による評価判定結果202が否定的評価以外であった場合には、メッセージ生成部160は、質問文216を含むメッセージ210の生成を行わなくてよい。
【0068】
第2実施形態に係る情報処理システム100によれば、メッセージ210は、回答者20に対する質問文216を含む。これにより、情報処理システム100は、回答者20の回答に応じて、リアルタイムで回答者20に追加で質問することができる。このため、共通の質問をするだけでなく、回答者20の具体的な回答に応じて柔軟に様々な質問をすることができる。その結果、回答者20の具体的な事情を含む詳細なアンケート回答を取得することができる。
【0069】
<第3実施形態>
図7を参照して、第3実施形態に係る情報処理システム100について説明する。第3実施形態は、自由記述データ124のテキスト全体に対する評価判定の代わりに、またはそれに加えて、語句単位および/または分割されたテキスト単位で、評価判定部144による評価判定を実行する点で第1実施形態と相違する。以下では、主に上記実施形態との相違点について説明し、上記実施形態と共通する点についての説明は繰り返さない。
図7は、第3実施形態に係る情報処理システム100によるメッセージ生成処理の概要を示す図である。
【0070】
第3実施形態に係る情報処理システム100は、語句単位または分割されたテキスト単位で評価判定を実行する。具体的には、図7に示すように、評価判定部144による評価判定の前に、前処理部142が、自由記述データ124のテキストをいくつかのテキストに分割する。分割の単位は特に限定されず、文単位、節単位、句単位など機械的に分割してもよく、意味のあるまとまりに分割してもよい。テキストを分割する手法としては、任意の手法が使用可能である。次いで、評価判定部144が、分割されたテキストごとに評価判定を実行する。図7の例では、「XXX機能の使い勝手が悪い。」という文は否定的評価を伴うと判定されている一方、「YYY性能はいい感じ。」という文は肯定的評価を伴うと判定されている。次いで、特徴語句抽出部146が、否定的評価を伴うと判定された分割テキストに含まれる語句から特徴語句208を抽出する。特徴語句抽出部146は、否定的評価を伴うと判定されなかった分割テキストのみに含まれる語句は特徴語句208として抽出しなくてよい。
【0071】
その結果、特徴語句208として抽出される語句は、いずれも否定的評価を伴う分割テキストから抽出された語句となる。すなわち、抽出される特徴語句208は、いずれも否定的評価を伴う語句である。見方を変えれば、第3実施形態では、テキストに含まれる語句について評価判定を行っているともいえる。特徴語句抽出部146は、評価判定部144によって調査対象への否定的評価を伴うと判定された語句から1以上の特徴語句208を抽出することができる。
【0072】
なお、テキストに含まれる語句について評価判定を行う方法は、上記の分割されたテキストに対して評価判定を行う方法に限定されず、任意の手法が使用可能である。たとえば、各語句に対して評価判定を直接実行してもよく、予め設定した否定的語句と関連性の高い語句を、共起ネットワークなどを使用して抽出してもよい(この場合、テキストの評価判定は必ずしも必要ない)。
【0073】
第3実施形態に係る情報処理システム100によれば、アンケート回答のテキストの一部について(たとえば、分割されたテキストや、テキストに含まれる1以上の語句について)、評価判定処理を実行することができる。これにより、情報処理システム100は、テキスト全体に対してのみ評価判定処理を行う場合に比べて、否定的評価に関連する特徴語句208をより適切に抽出できる。その結果、アンケート回答の内容をより正確に反映した改善提案などのメッセージ210を提示することができる。
【0074】
図8は、実施形態に係る情報処理システム800の最小構成を示す図である。
図9は、実施形態に係る情報処理システム800の最小構成による処理フローを示すフローチャートである。
情報処理システム100は、少なくとも特徴語句抽出部810およびメッセージ部820の構成を備えればよい。
情報処理システム100は、調査対象についての自由記述形式のテキストを含むアンケート回答の情報を処理する。
特徴語句抽出部810は、テキストから、調査対象への否定的評価に関連する1以上の特徴語句を抽出する(ステップS901)。
メッセージ部820は、抽出された特徴語句に関連するメッセージを提示させる(ステップS902)。
【0075】
図10は、少なくとも1つの実施形態に係るコンピュータの構成を示す概略ブロック図である。
図10に示すように、コンピュータ1000は、CPU1010と、主記憶装置1020と、補助記憶装置1030と、インタフェース1040と、不揮発性記録媒体1050とを備える。
【0076】
上記の情報処理システム100の全部または一部が、コンピュータ1000に実装されてもよい。その場合、上述した各処理部の動作は、プログラムの形式で補助記憶装置1030に記憶されている。
【0077】
CPU1010は、プログラムを補助記憶装置1030から読み出して主記憶装置1020に展開し、当該プログラムに従って上記処理を実行する。また、CPU1010は、プログラムに従って、上述した各記憶部に対応する記憶領域を主記憶装置1020に確保する。各装置と他の装置との通信は、インタフェース1040が通信機能を有し、CPU1010の制御に従って通信を行うことで実行される。また、インタフェース1040は、不揮発性記録媒体1050用のポートを有し、不揮発性記録媒体1050からの情報の読み出し、および、不揮発性記録媒体1050への情報の書き込みを行う。
【0078】
情報処理システム100がコンピュータ1000に実装される場合、分析部140およびメッセージ生成部160ならびにその各部の動作は、プログラムの形式で補助記憶装置1030に記憶されている。CPU1010は、プログラムを補助記憶装置1030から読み出して主記憶装置1020に展開し、当該プログラムに従って上記処理を実行する。
【0079】
CPU1010は、プログラムに従って、回答データ記憶部120およびモデル記憶部130のための記憶領域を主記憶装置1020に確保する。他の装置との通信は、インタフェース1040が通信機能を有し、CPU1010の制御に従って動作することによって実行される。出力部170によるメッセージ210の表示は、インタフェース1040が表示装置を備え、CPU1010の制御に従ってメッセージ210を含む画像を表示することによって実行される。情報処理システム100とユーザとのインタラクションは、インタフェース1040が表示装置、コントローラ、マウス、および、キーボードなどの入出力デバイスを備え、CPU1010の制御に従って動作することによって実行される。
【0080】
上述したプログラムのうち1以上が不揮発性記録媒体1050に記録されていてもよい。この場合、インタフェース1040が不揮発性記録媒体1050からプログラムを読み出すようにしてもよい。そして、CPU1010が、インタフェース1040が読み出したプログラムを直接実行するか、あるいは、主記憶装置1020または補助記憶装置1030に一旦保存して実行するようにしてもよい。
【0081】
なお、情報処理システム100およびコンピュータ1000が行う処理の全部または一部を実行するためのプログラムをコンピュータ読み取り可能な記録媒体に記録して、この記録媒体に記録されたプログラムをコンピュータシステムに読み込ませ、実行することにより各部の処理を行ってもよい。ここでいう「コンピュータシステム」とは、OS(Operating System)や周辺機器などのハードウェアを含むものとする。「コンピュータ読み取り可能な記録媒体」とは、フレキシブルディスク、光磁気ディスク、ROM(Read Only Memory)、CD-ROM(Compact Disc Read Only Memory)などの可搬媒体、コンピュータシステムに内蔵されるハードディスクなどの記憶装置のことをいう。上記プログラムは、前述した機能の一部を実現するためのものであってもよく、さらに前述した機能をコンピュータシステムに既に記録されているプログラムとの組み合わせで実現できるものであってもよい。
【0082】
上記各実施形態では、情報処理システム100を構成する各部分はソフトウェア機能部として説明したが、LSIなどのハードウェア機能部であってもよい。
【0083】
以上、本開示の実施形態を説明したが、この実施形態は、例として示したものであり、本開示の範囲を限定することは意図していない。この実施形態は、その他の様々な形態で実施されることが可能であり、本開示の要旨を逸脱しない範囲で種々の省略、置き換え、変更を行うことができる。
【0084】
上記実施形態の一部または全部は、以下の付記のようにも記載され得るが、以下に限定されるものではない。
【0085】
(付記1)
調査対象についての自由記述形式のテキストを含むアンケート回答の情報を処理する情報処理システムであって、
前記テキストから、前記調査対象への否定的評価に関連する1以上の特徴語句を抽出する特徴語句抽出手段と、
前記抽出された特徴語句に関連するメッセージを提示させるメッセージ手段と、
を備える、情報処理システム。
【0086】
(付記2)
前記メッセージは、
(1)前記否定的評価を低減または解消するための提案、
(2)前記調査対象についての説明、
(3)前記調査対象についての謝罪、および
(4)前記調査対象についての質問
からなる群より選択された1以上を含む、
付記1に記載の情報処理システム。
【0087】
(付記3)
前記特徴語句抽出手段は、前記テキストにおける語句の出現数、前記テキストにおける語句の出現頻度、トピックモデル、および前記テキストから生成された共起ネットワークのうち1以上を使用して、前記テキストから前記特徴語句を抽出する、
付記1または2に記載の情報処理システム。
【0088】
(付記4)
前記特徴語句抽出手段は、前記テキストにおける出現数または出現頻度が大きい語句を特徴語句として抽出する、
付記3に記載の情報処理システム。
【0089】
(付記5)
重みづけされた語句を前記テキストから抽出するか、または前記テキストから抽出された語句に重みづけを行う重要度評価手段をさらに備える、
付記1~4のいずれか一つに記載の情報処理システム。
【0090】
(付記6)
前記特徴語句抽出手段は、前記重要度評価手段による重みづけの結果に基づいて、前記1以上の特徴語句を抽出する、
付記5に記載の情報処理システム。
【0091】
(付記7)
前記特徴語句抽出手段は、前記テキストにおける出現数または出現頻度が大きい語句を特徴語句候補として抽出し、
前記重要度評価手段は、前記テキストにおける出現数もしくは出現頻度またはその関数に基づいて、前記特徴語句候補の重みづけを行う、
付記5または6に記載の情報処理システム。
【0092】
(付記8)
前記特徴語句抽出手段は、トピックモデルによって前記テキストのトピックを特徴語句候補として抽出し、
前記重要度評価手段は、前記テキストにおける各トピックの出現確率に基づいて、前記特徴語句候補の重みづけを行う、
付記5または6に記載の情報処理システム。
【0093】
(付記9)
前記特徴語句抽出手段は、前記テキストから生成された語句間の共起ネットワークにおいて所定のネットワークを構成する語句を特徴語句候補として抽出し、
前記重要度評価手段は、Jaccard係数の値に基づいて、前記特徴語句候補の重みづけを行う、
付記5または6に記載の情報処理システム。
【0094】
(付記10)
前記テキストが、前記調査対象へのどのような評価を伴うかを判定する評価判定手段をさらに備える、
付記1~9のいずれか一つに記載の情報処理システム。
【0095】
(付記11)
前記評価判定手段は、前記テキストが前記調査対象への否定的評価を伴うか否かを判定する、
付記10に記載の情報処理システム。
【0096】
(付記12)
前記評価判定手段は、テキストの文章ベクトルと当該テキストに伴う評価との関係を学習した学習済みモデルを使用して、前記判定を行う、
付記10または11に記載の情報処理システム。
【0097】
(付記13)
前記特徴語句抽出手段は、前記テキストが前記調査対象への否定的評価に関連すると前記評価判定手段が判定した場合に、当該テキストから前記1以上の特徴語句を抽出する、
付記10~12のいずれか一つに記載の情報処理システム。
【0098】
(付記14)
前記評価判定手段は、前記テキストに含まれる1以上の語句について、前記調査対象への否定的評価を伴うか否かを判定する、
付記10~13のいずれか一つに記載の情報処理システム。
【0099】
(付記15)
前記特徴語句抽出手段は、前記評価判定手段によって前記調査対象への否定的評価を伴うと判定された1以上の語句から、前記1以上の特徴語句を抽出する、
付記14に記載の情報処理システム。
【0100】
(付記16)
前記メッセージ手段は、前記テキストが前記調査対象への否定的評価を伴うと前記評価判定手段が判定した場合に、前記否定的評価を低減または解消するための提案を含むメッセージを提示させる、
付記10~15のいずれか一つに記載の情報処理システム。
【0101】
(付記17)
前記メッセージ手段は、前記テキストが前記調査対象への否定的評価を伴うと前記評価判定手段が判定した場合に、前記調査対象についての質問を含むメッセージをアンケートの回答者に対して提示させる、
付記10~16のいずれか一つに記載の情報処理システム。
【0102】
(付記18)
前記メッセージ手段は、前記特徴語句が示す事項を改善するための提案を含むメッセージを提示させる、
付記1~17のいずれか一つに記載の情報処理システム。
【0103】
(付記19)
前記メッセージ手段は、文章生成アルゴリズムを使用して、前記メッセージを生成するメッセージ生成手段を含む、
付記1~18のいずれか一つに記載の情報処理システム。
【0104】
(付記20)
前記テキストに自然言語処理を行うことによって、前記テキストの文章ベクトルを生成する前処理手段をさらに備える、
付記1~19のいずれか一つに記載の情報処理システム。
【0105】
(付記21)
前記メッセージ手段は、個々のアンケート回答に基づいて前記メッセージを提示させる、
付記1~20のいずれか一つに記載の情報処理システム。
【0106】
(付記22)
前記メッセージ手段は、複数のアンケート回答の集合に基づいて前記メッセージを提示させる、
付記1~20のいずれか一つに記載の情報処理システム。
【0107】
(付記23)
コンピュータによって実行される情報処理方法であって、
アンケート回答に含まれる調査対象についての自由記述形式のテキストから、前記調査対象への否定的評価に関連する1以上の特徴語句を抽出することと、
前記抽出された特徴語句に関連するメッセージを提示させることと、
を含む、情報処理方法。
【0108】
(付記24)
アンケート回答に含まれる調査対象についての自由記述形式のテキストから、前記調査対象への否定的評価に関連する1以上の特徴語句を抽出することと、
前記抽出された特徴語句に関連するメッセージを提示させることと、
をコンピュータに実行させる、
プログラム。
【符号の説明】
【0109】
100…情報処理システム
110…取得部
120…回答データ記憶部
130…モデル記憶部
140…分析部
142…前処理部
144…評価判定部
146…特徴語句抽出部
150…語句抽出部
152…重要度評価部
160…メッセージ生成部
170…出力部
図1
図2
図3
図4
図5
図6
図7
図8
図9
図10