特許7563830 | 知財ポータル「IP Force」

知財求人 - 知財ポータルサイト「IP Force」

▶ ＮＥＣプラットフォームズ株式会社の特許一覧

特許7563830情報処理システム、情報処理方法、およびプログラム

書誌要約請求の範囲詳細な説明課題実施例実施するための形態図面の説明

目に優しい文字サイズ小中大 PDF Top

< >

1
2
3
4
5
6
7
8
9
10

(19)【発行国】日本国特許庁(JP)

(12)【公報種別】特許公報(B2)

(11)【特許番号】

(24)【登録日】2024-09-30

(45)【発行日】2024-10-08

(54)【発明の名称】情報処理システム、情報処理方法、およびプログラム

(51)【国際特許分類】

G06Q 50/10 20120101AFI20241001BHJP

G06F 40/279 20200101ALI20241001BHJP

G06F 40/216 20200101ALI20241001BHJP

【ＦＩ】

G06Q50/10

G06F40/279

G06F40/216

【請求項の数】 9

(21)【出願番号】P 2023040780

(22)【出願日】2023-03-15

(65)【公開番号】P2024130851

(43)【公開日】2024-09-30

【審査請求日】2023-03-15

(73)【特許権者】

【識別番号】000227205

【氏名又は名称】ＮＥＣプラットフォームズ株式会社

(74)【代理人】

【識別番号】100149548

【弁理士】

【氏名又は名称】松沼泰史

(74)【代理人】

【識別番号】100181135

【弁理士】

【氏名又は名称】橋本隆史

(72)【発明者】

【氏名】江戸奏

【審査官】齊藤貴孝

(56)【参考文献】

【文献】特開２００６－３３８６９７（ＪＰ，Ａ）

【文献】特開２００４－１０２８１４（ＪＰ，Ａ）

【文献】特開２００２－１４０４６５（ＪＰ，Ａ）

【文献】安達由洋、外４名，感情語辞書を用いた日本語文の感情分析，可視化情報学会誌，日本，一般社団法人可視化情報学会，2021年06月01日，第４１巻，第１６１号，ｐ．２１－２７

(58)【調査した分野】(Int.Cl.，ＤＢ名)

Ｇ０６Ｑ１０／００－９９／００

Ｇ０６Ｆ４０／００－４０／５８

(57)【特許請求の範囲】

【請求項1】

調査対象についての自由記述形式のテキストを含むアンケート回答の情報を処理する情報処理システムであって、
前記テキストが、前記調査対象へのどのような評価を伴うかを判定する評価判定手段と、
前記テキストから、前記調査対象への否定的評価に関連する１以上の特徴語句を抽出する特徴語句抽出手段と、
前記テキストが前記調査対象への否定的評価を伴うと前記評価判定手段が判定したことに応答して、前記抽出された特徴語句に関連するメッセージを提示させるメッセージ手段と、
を備える、情報処理システム。

【請求項2】

前記メッセージは、
（１）前記否定的評価を低減または解消するための提案、
（２）前記調査対象についての説明、
（３）前記調査対象についての謝罪、および
（４）前記調査対象についての質問
からなる群より選択された１以上を含む、
請求項１に記載の情報処理システム。

【請求項3】

前記特徴語句抽出手段は、前記テキストにおける語句の出現数、前記テキストにおける語句の出現頻度、トピックモデル、および前記テキストから生成された共起ネットワークのうち１以上を使用して、前記テキストから前記特徴語句を抽出する、
請求項１または２に記載の情報処理システム。

【請求項4】

重みづけされた語句を前記テキストから抽出するか、または前記テキストから抽出された語句に重みづけを行う重要度評価手段をさらに備え、
前記特徴語句抽出手段は、前記重要度評価手段による重みづけの結果に基づいて、前記１以上の特徴語句を抽出する、
請求項１または２に記載の情報処理システム。

【請求項5】

前記評価判定手段は、テキストの文章ベクトルと当該テキストに伴う評価との関係を学習した学習済みモデルを使用して、前記判定を行う、
請求項１または２に記載の情報処理システム。

【請求項6】

前記メッセージ手段は、前記テキストが前記調査対象への否定的評価を伴うと前記評価判定手段が判定した場合に、前記否定的評価を低減または解消するための提案を含むメッセージを提示させる、
請求項１または２に記載の情報処理システム。

【請求項7】

前記メッセージ手段は、前記テキストが前記調査対象への否定的評価を伴うと前記評価判定手段が判定した場合に、前記調査対象についての質問を含むメッセージをアンケートの回答者に対して提示させる、
請求項１または２に記載の情報処理システム。

【請求項8】

コンピュータによって実行される情報処理方法であって、
アンケート回答に含まれる調査対象についての自由記述形式のテキストが、前記調査対象へのどのような評価を伴うかを判定することと、
前記テキストから、前記調査対象への否定的評価に関連する１以上の特徴語句を抽出することと、
前記テキストが前記調査対象への否定的評価を伴うと判定したことに応答して、前記抽出された特徴語句に関連するメッセージを提示させることと、
を含む、情報処理方法。

【請求項9】

アンケート回答に含まれる調査対象についての自由記述形式のテキストが、前記調査対象へのどのような評価を伴うかを判定することと、
前記テキストから、前記調査対象への否定的評価に関連する１以上の特徴語句を抽出することと、
前記テキストが前記調査対象への否定的評価を伴うと判定したことに応答して、前記抽出された特徴語句に関連するメッセージを提示させることと、
をコンピュータに実行させる、
プログラム。

【発明の詳細な説明】

【技術分野】

【0001】

本発明は、情報処理システム、情報処理方法、およびプログラムに関する。

【背景技術】

【0002】

自由記述形式の回答を含むアンケート結果を分析する技術が提案されている。
たとえば、特許文献１に記載されたアンケート結果表示システムは、選択肢から選択される要因項目評価と、要因項目評価を選択した理由を示す自由記述形式の詳細要因と、を含むアンケート回答を分析するものである。

【先行技術文献】

【特許文献】

【0003】

【文献】特開２０２０－１４９３４８号公報

【発明の概要】

【発明が解決しようとする課題】

【0004】

しかしながら、特許文献１に記載されたアンケート結果表示システムは、自由記述形式で回答された詳細要因の内容を、単に予め設定した複数の詳細要因項目のいずれかに分類するものである。このため、詳細要因項目として想定されていない語句が自由記述形式の回答に含まれていた場合には、アンケート出題者に提示される分析結果に当該語句が反映されない。そうすると、アンケート結果表示システムの出力結果は、自由記述形式のアンケート回答を十分に反映できていないものとなる。したがって、自由記述形式のアンケート回答に基づく出力内容の正確性を向上させる余地がある。

【0005】

そこで本発明は、上述の課題を解決する情報処理システム、情報処理方法、およびプログラムを提供することを目的とする。

【課題を解決するための手段】

【0006】

本発明の第１態様によれば、調査対象についての自由記述形式のテキストを含むアンケート回答の情報を処理する情報処理システムであって、前記テキストから、前記調査対象への否定的評価に関連する１以上の特徴語句を抽出する特徴語句抽出手段と、前記抽出された特徴語句に関連するメッセージを提示させるメッセージ手段と、を備える、情報処理システムが提供される。

【0007】

本発明の第２態様によれば、コンピュータによって実行される情報処理方法であって、アンケート回答に含まれる調査対象についての自由記述形式のテキストから、前記調査対象への否定的評価に関連する１以上の特徴語句を抽出することと、前記抽出された特徴語句に関連するメッセージを提示させることと、を含む、情報処理方法が提供される。

【0008】

本発明の第３態様によれば、アンケート回答に含まれる調査対象についての自由記述形式のテキストから、前記調査対象への否定的評価に関連する１以上の特徴語句を抽出することと、前記抽出された特徴語句に関連するメッセージを提示させることと、をコンピュータに実行させる、プログラムが提供される。

【発明の効果】

【0009】

本発明の実施形態によれば、自由記述形式のアンケート回答に基づく出力内容の正確性を向上させることができる。

【図面の簡単な説明】

【0010】

【図1】第１実施形態に係る情報処理システム１００を示すブロック図である。

【図2】第１実施形態に係る情報処理システム１００によるメッセージ生成処理の概要を示す図である。

【図3】第１実施形態に係る情報処理システム１００における情報の流れを示す図である。

【図4】第１実施形態に係る情報処理システム１００の処理フローを示すフローチャートである。

【図5】第１実施形態に係る情報処理システム１００の特徴語句２０８の抽出方法を示すフローチャートである。

【図6】第２実施形態に係る情報処理システム１００によるメッセージ生成処理の概要を示す図である。

【図7】第３実施形態に係る情報処理システム１００によるメッセージ生成処理の概要を示す図である。

【図8】実施形態に係る情報処理システム８００の最小構成を示す図である。

【図9】実施形態に係る情報処理システム８００の最小構成による処理フローを示すフローチャートである。

【図10】少なくとも１つの実施形態に係るコンピュータの構成を示す概略ブロック図である。

【発明を実施するための形態】

【0011】

以下、実施形態の情報処理システム、情報処理方法、およびプログラムを、図面を参照して説明する。本明細書において、「ＸＸに基づく」とは「少なくともＸＸに基づく」ことを意味し、ＸＸに加えて別の要素に基づく場合も含む。また、「ＸＸに基づく」とは、ＸＸを直接に用いる場合に限定されず、ＸＸに対して演算や加工が行われたものに基づく場合も含む。「ＸＸ」は、任意の要素（例えば情報）である。

【0012】

＜第１実施形態＞
（情報処理システム１００の構成）
まず、図１～図３を参照して、第１実施形態に係る情報処理システム１００の構成について説明する。
図１は、第１実施形態に係る情報処理システム１００を示すブロック図である。
図２は、第１実施形態に係る情報処理システム１００によるメッセージ生成処理の概要を示す図である。
図３は、第１実施形態に係る情報処理システム１００における情報の流れを示す図である。

【0013】

図１に示す情報処理システム１００は、出題者１０によって出題されたアンケートに対する回答者２０の回答（以下、「アンケート回答」という。）の情報を処理するシステムである。アンケートは、特定の調査対象（たとえば、出題者１０の製品またはサービス）についての回答を求めるものである。アンケート回答は、自由記述形式の回答を含む。アンケート回答は、自由記述形式の回答に加えて、選択形式の回答を含んでもよい。

【0014】

情報処理システム１００は、たとえば、アンケート回答の集計および／または分析を行うアンケート分析システム、ネットリサーチなどにおける分類処理システムなどとして利用可能である。

【0015】

図１に示すように、情報処理システム１００は、取得部１１０、回答データ記憶部１２０、モデル記憶部１３０、分析部１４０、メッセージ生成部１６０、および出力部１７０をその機能部として含む。情報処理システム１００は、単独の情報処理装置（たとえば、コンピュータ、タブレット端末、スマートフォンなど）であってもよく、複数の情報処理装置の協働によって実現されるシステムであってもよい。以下では、情報処理システム１００は、独立したシステムとして説明するが、各機能をプログラムとして提供することも可能である。情報処理システム１００は、運用管理端末などの情報処理装置にプログラムをインストールすること、出題者１０が利用する情報処理装置にプログラムをインストールすること、および／またはクラウド上の仮想サーバにプログラムをインストールすることによっても実現可能である。

【0016】

図２に示すように、情報処理システム１００は、回答者２０の自由記述データ１２４を含むアンケート回答情報１２２から特徴語句２０８を抽出し、この特徴語句２０８に基づくメッセージ２１０を出題者１０に提示する。

【0017】

情報処理システム１００は、個々のアンケート回答に対して上記処理を個別に実行してもよく、複数のアンケート回答が蓄積された集合に対して上記処理を実行してもよい。前者の場合には、個別のアンケート回答から特徴語句２０８が抽出され、個別にメッセージ２１０が生成され得る。この場合、個々の回答者２０に最適化された特徴語句２０８およびメッセージ２１０を出力できるので、個別の回答者２０に対するフォローを行うのに有益である。一方、後者の場合には、アンケート回答の集合から特徴語句２０８が抽出され、集合全体に対するメッセージ２１０が生成され得る。この場合、回答者２０の集合全体の傾向に基づいて特徴語句２０８およびメッセージ２１０を出力できるので、全体最適な改善策を検討するのに有益である。

【0018】

図１に示すように、取得部１１０は、回答者２０からアンケート回答情報１２２を取得する。取得部１１０は、回答者２０が回答入力端末に入力したデータをアンケート回答情報１２２として取得してもよく、回答者２０がアンケート用紙に記入した回答をＯＣＲ（Optical Character Reader：光学文字認識機能）などで電子化したデータをアンケート回答情報１２２として取得してもよい。

【0019】

回答データ記憶部１２０は、アンケート回答情報１２２を記憶する。アンケート回答情報１２２は、自由記述データ１２４を含む。自由記述データ１２４は、好ましくはテキストデータであるが、音声データなど他の形式のデータであってもよい。

【0020】

モデル記憶部１３０は、情報処理システム１００の分析処理に使用される各種モデルを記憶する。たとえば、モデル記憶部１３０は、クラス分類モデル１３２、トピックモデル１３４、文章生成モデル１３６などの分析モデルを記憶する。

【0021】

分析部１４０は、アンケート回答情報１２２を分析する。具体的には、分析部１４０は、前処理部１４２、評価判定部１４４、および特徴語句抽出部１４６を含む。

【0022】

前処理部１４２（「前処理手段」の一例）は、アンケート回答情報１２２の自由記述データ１２４に対して、必要な前処理を実行する。具体的には、前処理部１４２は、自由記述データ１２４に対して自然言語処理を実行することにより、回答者２０の自由記述式回答をコンピュータ処理可能な形式に変換する。たとえば、前処理部１４２は、自由記述データ１２４のテキストに対して自然言語処理を実行することによって、図３のようにテキストの文章ベクトル２００を生成する。具体的には、前処理部１４２は、自由記述データ１２４に含まれる不要な情報を取り除くクリーニング処理、自由記述データ１２４を単語単位に分割する形態素解析処理、自由記述データ１２４中の表記ゆれを統一する正規化処理、処理対象外であるストップワードの除去処理などの処理を実行する。これにより、前処理部１４２は、自由記述データ１２４を、単語単位に分割されたクリーンなテキストに変換する。次いで、前処理部１４２は、テキストのベクトル化処理を実行する。ベクトル化の手法の例としては、ＴＦ－ＩＤＦ（Term Frequency-Inverse Document Frequency）のようなＢｏＷ（Bag of Words）の手法、ＢＥＲＴ(Bidirectional Encoder Representations from Transformers)やＷｏｒｄ２Ｖｅｃのような分散表現の手法などが挙げられる。

【0023】

評価判定部１４４（「評価判定手段」の一例）は、自由記述データ１２４のテキストが調査対象へのどのような評価を伴うかを判定する。たとえば、評価判定部１４４は、自由記述データ１２４のテキストが調査対象への否定的評価を伴うか否かを判定する。具体的には、評価判定部１４４は、自由記述データ１２４のテキストが調査対象への肯定的評価および否定的評価（さらに中立的評価を追加してもよい）のいずれを伴うかを判定するポジティブ・ネガティブ判定を実行することができる。

【0024】

評価判定部１４４は、クラス分類モデル１３２を使用して、判定を行うことができる。クラス分類モデル１３２は、テキストの文章ベクトルと当該テキストに伴う評価（たとえば、肯定的評価、否定的評価、および中立的評価のいずれか）との関係を学習した学習済みモデルであってよい。文章ベクトル２００は、ＴＦ－ＩＤＦ、ＢＥＲＴ、Ｗｏｒｄ２Ｖｅｃなど任意の手法で得られたものであってよい。具体的には、評価判定部１４４は、モデル記憶部１３０に保存されたクラス分類モデル１３２を読み込み、自由記述データ１２４の文章ベクトル２００をクラス分類モデル１３２に入力する。クラス分類モデル１３２は、テキストの文章ベクトル２００が入力されたことに応答して、当該テキストがどのような評価を伴うかを推測することができる。評価判定部１４４は、図３のように、クラス分類モデル１３２の出力として、自由記述データ１２４における調査対象への評価を判定することができる。これにより、評価判定部１４４は、評価判定結果２０２を得ることができる。

【0025】

クラス分類モデル１３２の学習データは、予め用意した複数の自由記述テキストに対して評価のラベル付けを行うとともに、自然言語処理によって文章ベクトルを生成することによって得られる。入力としての文章ベクトルおよび出力としての評価ラベルの組を大量に学習させることにより、文章ベクトルと評価との関係を学習したクラス分類モデル１３２が得られる。クラス分類モデル１３２には、サポートベクターマシン（ＳＶＭ）、決定木、ニューラルネットワークといった既知の任意のアルゴリズムが使用可能である。

【0026】

クラス分類モデル１３２は、予め訓練された学習済みモデルとしてモデル記憶部１３０に保存され得る。この場合、情報処理システム１００を使用する前に、予め用意された学習データによるクラス分類モデル１３２の訓練が行われる。あるいは、クラス分類モデル１３２は、評価判定部１４４による評価判定時に（たとえば、リアルタイムで）学習を行ってもよい。この場合、ユーザ（たとえば、出題者１０）は、蓄積されたアンケート回答のテキストに対して評価のラベル付けを行い、当該ラベル付けされたテキストの文章ベクトルおよびそのラベル情報の組を学習データとして、クラス分類モデル１３２の訓練を行うことができる。

【0027】

なお、評価判定部１４４による判定処理は、上記に限定されない。たとえば、評価判定部１４４は、機械学習モデルを使用せず、ルールベースで判定処理を行ってもよい。具体的には、評価判定部１４４は、予め作成した評価判定辞書を使用してもよい。評価判定辞書は、複数の語句と、各語句に付与された肯定的評価や否定的評価といった評価ラベルと、を含む語句リストである。この場合、評価判定部１４４は、評価判定辞書を読み込み、評価判定辞書を参照して、自由記述データ１２４における肯定的語句（ポジティブワード、ポジティブフレーズ）および否定的語句（ネガティブワード、ネガティブフレーズ）それぞれの出現数の比率を計算する。評価判定部１４４は、計算した肯定的語句および否定的語句の出現比率を重みとして、自由記述データ１２４のテキストがどのような評価を伴うかを判定する。

【0028】

あるいは、評価判定部１４４は、アンケート回答情報１２２に含まれる選択形式の回答に基づいて、判定処理を行ってもよい。たとえば、アンケートは、調査対象についての評価を尋ねる選択式質問（たとえば、「この製品を使用した感想を教えてください。」との質問および「非常に満足」「それなりに満足」「普通」「あまり満足していない」「非常に不満」などの選択肢）と、その評価の理由を尋ねる自由記述式質問（「上記の選択の理由を自由にお答えください。」）とを含んでよい。この場合、評価判定部１４４は、選択式質問の回答によって回答者２０の評価を判定することができる。評価判定部１４４が自由記述形式のテキストに基づいて判定処理を行う場合、自由記述データ１２４のみに基づいて分析することが可能であるので、アンケートの冗長化を抑制できる点で好ましい。一方、選択式質問への回答を利用して判定処理を行う場合、判定処理の確実性が向上するとともに計算処理の負担を軽減できる点で好ましい。

【0029】

特徴語句抽出部１４６（「特徴語句抽出手段」の一例）は、自由記述データ１２４の前処理によって得られたテキストから、アンケート回答の内容を示す１以上の特徴的な語句（以下、「特徴語句」という。）を抽出する。ここで、「語句」とは、１つの単語、および、２以上の単語を含む連語、句、または節を包含する概念である。たとえば、「エアコン」、「高燃費」、「不十分な冷却性能」、「音がうるさい」などは、すべて語句に該当する。

【0030】

特徴語句抽出部１４６は、語句抽出部１５０および重要度評価部１５２を含む。
語句抽出部１５０は、図３のように、自由記述データ１２４から１以上の語句を特徴語句候補２０４として抽出する。具体的には、語句抽出部１５０は、自由記述データ１２４のテキストにおける語句の出現数または出現頻度、モデル記憶部１３０に保存されたトピックモデル１３４、自由記述データ１２４のテキストから生成された共起ネットワークなどの手法を使用して、特徴語句候補２０４を抽出する。これらの各手法の詳細は、図５を参照して後述する。なお、語句抽出部１５０の処理は、これらに限定されず、その他の任意の手法を使用可能である。

【0031】

重要度評価部１５２（「重要度評価手段」の一例）は、語句抽出部１５０により抽出された特徴語句候補２０４に対して重みづけを行い、各特徴語句候補２０４の重要度２０６を計算する。特徴語句抽出部１４６は、図３のように、重要度評価部１５２による重みづけの結果（すなわち、重要度２０６）に基づいて、特徴語句候補２０４から１以上の特徴語句２０８を抽出する。

【0032】

このようにして、特徴語句抽出部１４６は、特徴語句候補２０４を抽出するとともに各特徴語句候補２０４の重要度２０６を評価することによって、特徴語句２０８を抽出することができる。あるいは、特徴語句抽出部１４６は、重要度２０６を計算せず、特徴語句２０８を直接抽出してもよい。

【0033】

特徴語句抽出部１４６は、自由記述データ１２４のテキストが調査対象への否定的評価に関連する場合に、特徴語句２０８を抽出することができる。具体的には、特徴語句抽出部１４６は、自由記述データ１２４のテキストが調査対象への否定的評価を伴うと評価判定部１４４が判定した場合に、当該否定的評価を伴うと判定されたテキストから特徴語句２０８を生成する。逆に、評価判定部１４４による評価判定結果２０２が否定的評価以外であった場合には、特徴語句抽出部１４６は、特徴語句２０８の抽出を行わなくてもよい。これにより、情報処理システム１００は、改善の必要を指摘していないアンケート回答を分析対象から除外することができるので、処理負荷が軽減され得る。

【0034】

メッセージ生成部１６０（「メッセージ手段」の一例）は、分析部１４０の分析結果に基づいて、メッセージ２１０を生成する。メッセージ生成部１６０により生成されるメッセージ２１０は、たとえば、アンケート回答の内容を踏まえた具体的なメッセージ２１０である。メッセージ２１０は、たとえば、回答者２０による否定的評価を低減または解消するための提案文２１４を含む。具体的には、メッセージ生成部１６０は、特徴語句抽出部１４６によって抽出された特徴語句２０８が示す事項を改善するための提案を含むメッセージ２１０を生成することができる。

【0035】

たとえば、メッセージ生成部１６０は、図２に示すように、出題者１０への主題文２１２および提案文２１４を生成することができる。メッセージ生成部１６０は、重要度２０６が大きい特徴語句Ａについて、「特徴語句Ａを改善する方法」「特徴語句Ａを改善してください」といった主題文２１２を生成する。さらに、メッセージ生成部１６０は、特徴語句抽出部１４６により抽出された１以上の特徴語句２０８についての提案文２１４を生成する。メッセージ生成の対象である特徴語句２０８は、主題文２１２に含まれる特徴語句Ａであってもよく、別の特徴語句２０８であってもよく、その両方であってもよい。メッセージ生成部１６０は、文章生成アルゴリズムを使用して、提案文２１４を含むメッセージ２１０を生成することができる。具体的には、メッセージ生成部１６０は、モデル記憶部１３０に保存された文章生成モデル１３６を読み込み、文章生成モデル１３６を使用して特徴語句２０８についての提案文２１４を生成する。提案文２１４は、出題者１０に向けた、特徴語句２０８に関連する具体的な改善方法を含む。メッセージ２１０は、上記のようにして生成された主題文２１２および提案文２１４を含む。なお、メッセージ２１０は、主題文２１２および提案文２１４の一方のみを含んでもよい。

【0036】

文章生成モデル１３６に使用される文章生成アルゴリズムとしては、ＢＥＲＴやＧＰＴ－３（Generative Pre-trained Transformer 3）などのＴｒａｎｓｆｏｒｍｅｒモデルが挙げられるが、これに限定されず、任意のアルゴリズムが使用可能である。文章生成モデル１３６は、予め大量のテキストを学習させることによって、自然な文章を生成することができる。

【0037】

メッセージ生成部１６０は、生成された「特徴語句Ａを改善する方法」「特徴語句Ａを改善してください」といった主題文２１２を文章生成モデル１３６に入力することによって、提案文２１４を生成してもよい。また、メッセージ生成部１６０は、特徴語句２０８を別の語句と組み合わせて文章生成モデル１３６に入力してもよい。別の語句は、たとえば、予め設定した語句（アンケートの調査対象についての語句、質問の前提に関する語句など）、選択式質問の回答から決定した語句などである。

【0038】

メッセージ生成部１６０は、自由記述データ１２４のテキストが調査対象への否定的評価に関連する場合に、メッセージ２１０を生成することができる。具体的には、メッセージ生成部１６０は、自由記述データ１２４のテキストが調査対象への否定的評価を伴うと評価判定部１４４が判定した場合に、当該否定的評価を低減または解消するための提案を含むメッセージ２１０を生成する。逆に、評価判定部１４４による評価判定結果２０２が否定的評価以外であった場合には、メッセージ生成部１６０は、メッセージ２１０の生成を行わなくてもよい。

【0039】

メッセージ生成部１６０は、生成されたメッセージ２１０を出力形式に変換して出力部１７０に送信する。出力部１７０（「メッセージ手段」の一例）は、メッセージ生成部１６０によって生成されたメッセージ２１０を出力し、出題者１０に対して提示する。メッセージ２１０の提示方法は特に限定されず、テキストとして提示されてもよく、画像や音声などテキスト以外の形式で提示されてもよい。

【0040】

情報処理システム１００が単独の情報処理装置で構成される場合には、当該情報処理装置は、単独で特徴語句２０８の抽出ならびにメッセージ２１０の生成および出力を実行することができる。情報処理システム１００が複数の情報処理装置の協働によって実現される場合には、様々な形で上記の各機能の分散処理が行われてよい。たとえば、第１情報処理装置が、特徴語句２０８を抽出するとともに抽出された特徴語句２０８の情報を第２情報処理装置に送信し、第２情報処理装置が、特徴語句２０８に関連するメッセージ２１０を生成することができる。ユーザへのメッセージ２１０の提示は、第１情報処理装置、第２情報処理装置、および別の情報処理装置または提示装置のいずれが実行してもよい。特徴語句２０８の抽出を実行した第１情報処理装置は、当該第１情報処理装置の構成（たとえば、ディスプレイやスピーカーといった第１情報処理装置の出力インタフェース）または別の装置（たとえば、第２情報処理装置、別の情報処理装置または提示装置）をして、メッセージ２１０をユーザに提示させることができる。

【0041】

（情報処理システム１００の処理フロー）
次いで、図４および図５を参照して、情報処理システム１００による情報処理方法について説明する。
図４は、第１実施形態に係る情報処理システム１００の処理フローを示すフローチャートである。
図５は、第１実施形態に係る情報処理システム１００の特徴語句２０８の抽出方法を示すフローチャートである。

【0042】

情報処理システム１００による情報処理方法は、アンケート回答に含まれる調査対象についての自由記述形式のテキストから、調査対象への否定的評価に関連する１以上の特徴語句２０８を抽出することと、抽出された特徴語句２０８に関連するメッセージ２１０を提示させることと、を含む。

【0043】

以下、情報処理システム１００の処理フローについて具体的に説明する。図４に示すように、まずステップＳ４０１において、情報処理システム１００は、回答者２０の回答データの入力を受け付ける。ステップＳ４０２では、取得部１１０が、入力されたアンケート回答情報１２２を取得する。ステップＳ４０３では、前処理部１４２が、アンケート回答情報１２２に含まれる自由記述データ１２４の前処理を行い、自由記述データ１２４の文章ベクトル２００を生成する。ステップＳ４０４では、評価判定部１４４が、前処理部１４２により生成された文章ベクトルを使用して、回答者２０による調査対象の評価を判定する。評価判定結果２０２が否定的評価でない場合（ステップＳ４０５：Ｎｏ）、情報処理システム１００は、処理を終了する。評価判定結果２０２が否定的評価である場合（ステップＳ４０５：Ｙｅｓ）、ステップＳ４０６では、語句抽出部１５０が、自由記述データ１２４から特徴語句候補２０４を抽出する。ステップＳ４０７では、重要度評価部１５２が、各特徴語句候補２０４の重みづけを行い、重要度２０６を計算する。ステップＳ４０８では、特徴語句抽出部１４６が、重要度２０６に基づいて、特徴語句候補２０４から特徴語句２０８を抽出する。ステップＳ４０９では、メッセージ生成部１６０が、抽出された特徴語句２０８についてのメッセージ２１０を生成する。ステップＳ４１０では、出力部１７０が、メッセージ２１０を出力する。

【0044】

次いで、図５を参照して、特徴語句候補２０４の抽出、重要度２０６の評価、および特徴語句２０８の抽出の手法について詳述する。特徴語句抽出部１４６は、上記のとおり、以下の（ａ）～（ｃ）の特徴語句抽出手法を使用することができる。
（ａ）自由記述データ１２４のテキストにおける語句の出現数または出現頻度を利用する手法
（ｂ）モデル記憶部１３０に保存されたトピックモデル１３４を利用する手法
（ｃ）自由記述データ１２４のテキストから生成された共起ネットワークを利用する手法

【0045】

手法（ａ）の場合（ステップＳ５０１：出現数または出現頻度）、特徴語句抽出部１４６は、自由記述データ１２４のテキスト中の各語句の出現数または出現頻度に基づいて、特徴語句２０８を抽出することができる。

【0046】

具体的には、ステップＳ５０２において、特徴語句抽出部１４６は、自由記述データ１２４のテキストに含まれる語句ごとに、出現数または出現頻度を計算する。次いで、ステップＳ５０３において、特徴語句抽出部１４６は、出現数または出現頻度が大きい語句を、特徴語句２０８として抽出する。たとえば、特徴語句抽出部１４６は、出現数または出現頻度が所定の閾値より大きい語句を特徴語句２０８として抽出する。この場合、特徴語句抽出部１４６は、特徴語句候補２０４の抽出および重要度２０６の計算を行わずに、特徴語句２０８を自由記述データ１２４から直接抽出している。言い換えれば、特徴語句抽出部１４６は、重みづけされた語句を自由記述データ１２４から抽出している。なお、特徴語句抽出部１４６は、出現数または出現頻度の代わりに、出現数または出現頻度に依存する任意の関数を使用して特徴語句２０８を抽出してもよい。

【0047】

特徴語句抽出部１４６は、まず特徴語句候補２０４を抽出した後、重要度２０６を計算し、重要度２０６に基づいて特徴語句２０８を抽出してもよい。この場合、まず、語句抽出部１５０が、各語句の出現数または出現頻度を計算する。語句抽出部１５０は、出現数または出現頻度が大きい語句を特徴語句候補２０４として抽出する。次いで、重要度評価部１５２が、語句抽出部１５０が計算した出現数もしくは出現頻度、またはその関数に基づいて、特徴語句候補２０４の重みづけを行う。たとえば、重要度評価部１５２は、出現数の関数として、（特定語句の出現数）／（文書の総単語数）を計算する。特徴語句抽出部１４６は、語句の出現数、出現頻度、またはその関数の値を重要度２０６として使用することができる。特徴語句抽出部１４６は、出現数、出現頻度、またはその関数の値が大きい語句（たとえば、所定閾値より大きい語句）を特徴語句２０８として抽出する。

【0048】

手法（ｂ）の場合（ステップＳ５０１：トピックモデル）、語句抽出部１５０は、トピックモデル１３４を使用して、特徴語句候補２０４を抽出することができる。トピックモデルとは、文書の中にある単語の種類や頻度を元に文書全体の潜在的な意味を解析する手法である。

【0049】

具体的には、ステップＳ５０４において、語句抽出部１５０が、モデル記憶部１３０に保存されたトピックモデル１３４を使用して、自由記述データ１２４のテキストのトピック（主題）を判定する。ステップＳ５０５では、語句抽出部１５０が、テキスト中で出現確率が高いトピックを特徴語句候補２０４として抽出することができる。

【0050】

ステップＳ５０６では、重要度評価部１５２が、テキストにおける各トピックの出現確率に基づいて、特徴語句候補２０４の重みづけを行う。たとえば、重要度評価部１５２は、トピックモデル１３４から出力される各トピックの出現確率またはその関数を重要度２０６として使用することができる。特徴語句抽出部１４６は、出現確率が大きいトピック（たとえば、所定閾値より大きいトピック）を特徴語句２０８として抽出する。

【0051】

手法（ｃ）の場合（ステップＳ５０１：共起ネットワーク）、語句抽出部１５０は、自由記述データ１２４から生成された共起ネットワークに基づいて、特徴語句候補２０４を抽出することができる。共起ネットワークを使用することによって、文章中に出現する語句間の関係性を明らかにすることができる。これにより、どの語句が重視されていて、どの語句とともに出現する頻度が高いのかを可視化することができる。

【0052】

具体的には、ステップＳ５０７において、語句抽出部１５０が、自由記述データ１２４のテキストに含まれる語句間の共起ネットワークを生成する。ステップＳ５０８では、語句抽出部１５０が、共起ネットワークにおいて所定のネットワークを構成している語句を特徴語句候補２０４として抽出する。たとえば、語句抽出部１５０は、予め設定した対象語句とのネットワークを構成している語句を特徴語句候補２０４として抽出する。

【0053】

ステップＳ５０９では、重要度評価部１５２が、Ｊａｃｃａｒｄ係数の値に基づいて、特徴語句候補の重みづけを行う。Ｊａｃｃａｒｄ係数とは、語句Ａと語句Ｂの少なくとも一方が含まれている文のうち、両方含まれている文の割合を示す値である。Ｊａｃｃａｒｄ係数は、共起性の強さ（すなわち、語句間の関連性）を表す指標であり、多くの文章で出現する語句間では大きくなり、出現頻度の低い語句間では小さくなる。たとえば、重要度評価部１５２は、評価対象である語句と、予め設定した対象語句との間のＪａｃｃａｒｄ係数を計算する。特徴語句抽出部１４６は、Ｊａｃｃａｒｄ係数が大きい語句（たとえば、所定閾値より大きい語句）を特徴語句２０８として抽出する。

【0054】

特徴語句抽出部１４６は、上記の手法（ａ）～（ｃ）の２以上を併用してもよい。あるいは、上記の手法（ａ）～（ｃ）の１以上と別の手法とを併用してもよい。複数の手法によって特徴語句２０８を抽出することにより、特徴語句２０８の選定に自由度を持たせることができる。手法（ａ）では、特徴語句抽出部１４６は、語句間の関連性にかかわらず特徴語句２０８を選定し得るのに対し、手法（ｃ）では、特徴語句抽出部１４６は、語句間の関連性に基づいて特徴語句２０８を選定する。手法（ｂ）では、特徴語句抽出部１４６は、自由記述データ１２４のテキストに含まれる語句以外の語句（トピック）を特徴語句２０８として抽出することができる。

【0055】

（効果）
本実施形態に係る情報処理システム１００によれば、自由記述形式のアンケート回答から特徴語句２０８を抽出し、抽出された特徴語句２０８に基づくメッセージ２１０を提示させることができる。これにより、自由記述形式のアンケート回答に基づくメッセージ２１０を提示するにあたって、元のアンケート回答の内容を精度よくメッセージ２１０に反映することができる。また、必ずしも特許文献１のように予め自由記述形式のアンケート回答を分類するためのカテゴリを設定する必要がないため、アンケート作成の効率が向上し得る。さらに、予めカテゴリを設定する場合に発生する可能性のある分析の恣意性を低減させることができるので、より客観的なメッセージ２１０を得ることができる。

【0056】

本実施形態に係る情報処理システム１００は、自動的に特徴語句２０８の抽出を実行することができる。このため、重要な語句を手動で抽出する場合に比べて、アンケート回答の分析作業の効率性が格段に向上し得る。また、語句の抽出作業における属人的および主観的なブレが排除されるので、分析の精度が向上し得る。これにより、回答者２０が重視するポイントが出題者１０の予測できない事項である場合でも、当該ポイントを特徴語句２０８として抽出して、適切なメッセージ２１０を出力することができる。

【0057】

また、自由記述形式のアンケート回答をそのまま文章生成モデルに入力してメッセージ２１０を出力する場合の問題点として、たとえば以下が挙げられる。
（１）複雑でわかりにくいアンケート回答が入力された場合に、適切なメッセージ２１０を生成できないおそれがある。
（２）複雑でわかりにくいアンケート回答が入力された場合に、文章生成モデルに対して不適切な学習データが入力されてしまうおそれがある。
（３）外部サーバに保存された文章生成モデルを使用する場合に、アンケート回答結果がそのまま外部サーバに送信されるので、セキュリティ上問題となるおそれがある。
これに対し、本実施形態に係る情報処理システム１００は、自由記述形式のアンケート回答から特徴語句２０８を抽出した上で、抽出した特徴語句２０８に基づくメッセージ２１０を出力する。したがって、上記の問題点（１）～（３）が軽減または解消され得る。

【0058】

ところで、一般的には、テキスト全体ではなく特定の語句を文章生成モデル１３６に入力する場合には、元のテキストの文脈を十分に読み取れなくなる可能性がある。その上、特徴語句２０８を抽出するという処理を挟むと、単純にテキストを文章生成モデル１３６に入力する場合に比べて、特徴語句２０８の抽出処理の分だけ計算負荷が増加する可能性がある。しかしながら、本実施形態では、分析対象は単純なアンケート回答であり、自由記述式回答における前提条件は予め十分に把握可能であるので、テキストから文脈を読み取る必要性は薄い。むしろ、短文のアンケート回答のテキストのみから文脈を読み取ることが困難な場合もある。このため、アンケート回答の分析においては、テキストをそのまま文章生成モデル１３６に入力せず、一旦テキストから特徴語句２０８を抽出することが有効であり得る。

【0059】

本実施形態に係る情報処理システム１００は、否定的評価を低減または解消するための提案を含むメッセージを提示させることができる。これにより、アンケート回答を踏まえたネクストアクションが明確化され得る。このため、単にアンケート回答の要約として特徴語句２０８を提示する場合に比べて、出題者１０が改善策を検討する負荷を軽減することができる。

【0060】

本実施形態に係る情報処理システム１００は、アンケート回答のテキストに自然言語処理を行うことによって、テキストの文章ベクトルを生成する前処理部１４２を含む。文章ベクトルを計算処理対象とすることにより、テキストそのものを扱う場合に比べてデータ量を削減するとともに、計算処理を高速化することができる。

【0061】

本実施形態に係る情報処理システム１００は、重みづけされた語句をアンケート回答のテキストから抽出するか、またはテキストから抽出された語句に重みづけを行う重要度評価部１５２を含む。これにより、情報処理システム１００は、自動的に語句の重要度２０６を評価するので、手動での重みづけ作業を省略できる。また、上記の特徴語句抽出と同様に、語句の重みづけ作業における属人的および主観的なブレが排除されるので、分析の精度が向上し得る。

【0062】

本実施形態に係る情報処理システム１００は、アンケート回答のテキストが、アンケート調査対象へのどのような評価を伴うかを判定する評価判定部１４４を含む。これにより、情報処理システム１００は、アンケート回答が肯定的評価および否定的評価のいずれを伴うかを手動で判定する場合に比べて、アンケート回答の分析作業の効率性が格段に向上し得る。また、上記の特徴語句抽出および重みづけと同様に、評価判定作業における属人的および主観的なブレが排除されるので、分析の精度が向上し得る。

【0063】

＜第２実施形態＞
図６を参照して、第２実施形態に係る情報処理システム１００について説明する。第２実施形態は、回答者２０への質問文２１６を含むメッセージ２１０を出力する点で第１実施形態と相違する。以下では、主に上記実施形態との相違点について説明し、上記実施形態と共通する点についての説明は繰り返さない。
図６は、第２実施形態に係る情報処理システム１００によるメッセージ生成処理の概要を示す図である。

【0064】

第２実施形態に係る情報処理システム１００は、回答者２０とリアルタイムでやりとりをすることができる。具体的には、図６に示すように、情報処理システム１００は、回答者２０が入力したアンケート回答情報１２２から特徴語句２０８を抽出し、特徴語句２０８から質問文２１６を含むメッセージ２１０を生成する。これにより、情報処理システム１００は、回答者２０がアンケート回答を入力したことに応答して、質問文２１６を含むメッセージ２１０をリアルタイムで生成し、回答者２０に提示することができる。情報処理システム１００は、メッセージ２１０とともに回答フォーム２１８を表示して、回答者２０に質問文２１６へのさらなる回答を求めることができる。

【0065】

具体的には、第１実施形態と同様にして抽出された特徴語句２０８に基づいて、メッセージ生成部１６０が、追加の質問文２１６を生成する。たとえば、否定的評価を伴う自由記述データ１２４から「エアコンの冷却性能」という特徴語句２０８が抽出された場合には、メッセージ生成部１６０は、「エアコンの冷却性能」について回答者２０の満足度を向上させるために必要な質問文２１６を生成する。この場合の質問としては、回答者２０が冷却性能に不満を感じたタイミング、エアコンの使用環境、エアコンの使用年数、エアコンのメンテナンス状況、出題者１０に対する回答者２０の要望などが挙げられる。

【0066】

メッセージ生成部１６０は、質問文２１６に加えて、または質問文２１６の代わりに、調査対象についての説明文（たとえば、製品の使用方法やメンテナンス方法の説明文）、回答者２０に対する提案文（たとえば、修理サービスやメンテナンスサービスの提案文）、回答者２０に対する謝罪文など、任意のメッセージ２１０を生成してもよい。また、メッセージ生成部１６０は、回答者２０に対する質問文２１６などのメッセージ２１０に加えて、第１実施形態と同様に、出題者１０への提案文２１４を生成してもよい。

【0067】

メッセージ生成部１６０は、自由記述データ１２４のテキストが調査対象への否定的評価を伴うと評価判定部１４４が判定した場合に、調査対象についての追加の質問文２１６を含むメッセージ２１０を生成する。逆に、評価判定部１４４による評価判定結果２０２が否定的評価以外であった場合には、メッセージ生成部１６０は、質問文２１６を含むメッセージ２１０の生成を行わなくてよい。

【0068】

第２実施形態に係る情報処理システム１００によれば、メッセージ２１０は、回答者２０に対する質問文２１６を含む。これにより、情報処理システム１００は、回答者２０の回答に応じて、リアルタイムで回答者２０に追加で質問することができる。このため、共通の質問をするだけでなく、回答者２０の具体的な回答に応じて柔軟に様々な質問をすることができる。その結果、回答者２０の具体的な事情を含む詳細なアンケート回答を取得することができる。

【0069】

＜第３実施形態＞
図７を参照して、第３実施形態に係る情報処理システム１００について説明する。第３実施形態は、自由記述データ１２４のテキスト全体に対する評価判定の代わりに、またはそれに加えて、語句単位および／または分割されたテキスト単位で、評価判定部１４４による評価判定を実行する点で第１実施形態と相違する。以下では、主に上記実施形態との相違点について説明し、上記実施形態と共通する点についての説明は繰り返さない。
図７は、第３実施形態に係る情報処理システム１００によるメッセージ生成処理の概要を示す図である。

【0070】

第３実施形態に係る情報処理システム１００は、語句単位または分割されたテキスト単位で評価判定を実行する。具体的には、図７に示すように、評価判定部１４４による評価判定の前に、前処理部１４２が、自由記述データ１２４のテキストをいくつかのテキストに分割する。分割の単位は特に限定されず、文単位、節単位、句単位など機械的に分割してもよく、意味のあるまとまりに分割してもよい。テキストを分割する手法としては、任意の手法が使用可能である。次いで、評価判定部１４４が、分割されたテキストごとに評価判定を実行する。図７の例では、「ＸＸＸ機能の使い勝手が悪い。」という文は否定的評価を伴うと判定されている一方、「ＹＹＹ性能はいい感じ。」という文は肯定的評価を伴うと判定されている。次いで、特徴語句抽出部１４６が、否定的評価を伴うと判定された分割テキストに含まれる語句から特徴語句２０８を抽出する。特徴語句抽出部１４６は、否定的評価を伴うと判定されなかった分割テキストのみに含まれる語句は特徴語句２０８として抽出しなくてよい。

【0071】

その結果、特徴語句２０８として抽出される語句は、いずれも否定的評価を伴う分割テキストから抽出された語句となる。すなわち、抽出される特徴語句２０８は、いずれも否定的評価を伴う語句である。見方を変えれば、第３実施形態では、テキストに含まれる語句について評価判定を行っているともいえる。特徴語句抽出部１４６は、評価判定部１４４によって調査対象への否定的評価を伴うと判定された語句から１以上の特徴語句２０８を抽出することができる。

【0072】

なお、テキストに含まれる語句について評価判定を行う方法は、上記の分割されたテキストに対して評価判定を行う方法に限定されず、任意の手法が使用可能である。たとえば、各語句に対して評価判定を直接実行してもよく、予め設定した否定的語句と関連性の高い語句を、共起ネットワークなどを使用して抽出してもよい（この場合、テキストの評価判定は必ずしも必要ない）。

【0073】

第３実施形態に係る情報処理システム１００によれば、アンケート回答のテキストの一部について（たとえば、分割されたテキストや、テキストに含まれる１以上の語句について）、評価判定処理を実行することができる。これにより、情報処理システム１００は、テキスト全体に対してのみ評価判定処理を行う場合に比べて、否定的評価に関連する特徴語句２０８をより適切に抽出できる。その結果、アンケート回答の内容をより正確に反映した改善提案などのメッセージ２１０を提示することができる。

【0074】

図８は、実施形態に係る情報処理システム８００の最小構成を示す図である。
図９は、実施形態に係る情報処理システム８００の最小構成による処理フローを示すフローチャートである。
情報処理システム１００は、少なくとも特徴語句抽出部８１０およびメッセージ部８２０の構成を備えればよい。
情報処理システム１００は、調査対象についての自由記述形式のテキストを含むアンケート回答の情報を処理する。
特徴語句抽出部８１０は、テキストから、調査対象への否定的評価に関連する１以上の特徴語句を抽出する（ステップＳ９０１）。
メッセージ部８２０は、抽出された特徴語句に関連するメッセージを提示させる（ステップＳ９０２）。

【0075】

図１０は、少なくとも１つの実施形態に係るコンピュータの構成を示す概略ブロック図である。
図１０に示すように、コンピュータ１０００は、ＣＰＵ１０１０と、主記憶装置１０２０と、補助記憶装置１０３０と、インタフェース１０４０と、不揮発性記録媒体１０５０とを備える。

【0076】

上記の情報処理システム１００の全部または一部が、コンピュータ１０００に実装されてもよい。その場合、上述した各処理部の動作は、プログラムの形式で補助記憶装置１０３０に記憶されている。

【0077】

ＣＰＵ１０１０は、プログラムを補助記憶装置１０３０から読み出して主記憶装置１０２０に展開し、当該プログラムに従って上記処理を実行する。また、ＣＰＵ１０１０は、プログラムに従って、上述した各記憶部に対応する記憶領域を主記憶装置１０２０に確保する。各装置と他の装置との通信は、インタフェース１０４０が通信機能を有し、ＣＰＵ１０１０の制御に従って通信を行うことで実行される。また、インタフェース１０４０は、不揮発性記録媒体１０５０用のポートを有し、不揮発性記録媒体１０５０からの情報の読み出し、および、不揮発性記録媒体１０５０への情報の書き込みを行う。

【0078】

情報処理システム１００がコンピュータ１０００に実装される場合、分析部１４０およびメッセージ生成部１６０ならびにその各部の動作は、プログラムの形式で補助記憶装置１０３０に記憶されている。ＣＰＵ１０１０は、プログラムを補助記憶装置１０３０から読み出して主記憶装置１０２０に展開し、当該プログラムに従って上記処理を実行する。

【0079】

ＣＰＵ１０１０は、プログラムに従って、回答データ記憶部１２０およびモデル記憶部１３０のための記憶領域を主記憶装置１０２０に確保する。他の装置との通信は、インタフェース１０４０が通信機能を有し、ＣＰＵ１０１０の制御に従って動作することによって実行される。出力部１７０によるメッセージ２１０の表示は、インタフェース１０４０が表示装置を備え、ＣＰＵ１０１０の制御に従ってメッセージ２１０を含む画像を表示することによって実行される。情報処理システム１００とユーザとのインタラクションは、インタフェース１０４０が表示装置、コントローラ、マウス、および、キーボードなどの入出力デバイスを備え、ＣＰＵ１０１０の制御に従って動作することによって実行される。

【0080】

上述したプログラムのうち１以上が不揮発性記録媒体１０５０に記録されていてもよい。この場合、インタフェース１０４０が不揮発性記録媒体１０５０からプログラムを読み出すようにしてもよい。そして、ＣＰＵ１０１０が、インタフェース１０４０が読み出したプログラムを直接実行するか、あるいは、主記憶装置１０２０または補助記憶装置１０３０に一旦保存して実行するようにしてもよい。

【0081】

なお、情報処理システム１００およびコンピュータ１０００が行う処理の全部または一部を実行するためのプログラムをコンピュータ読み取り可能な記録媒体に記録して、この記録媒体に記録されたプログラムをコンピュータシステムに読み込ませ、実行することにより各部の処理を行ってもよい。ここでいう「コンピュータシステム」とは、ＯＳ（Operating System）や周辺機器などのハードウェアを含むものとする。「コンピュータ読み取り可能な記録媒体」とは、フレキシブルディスク、光磁気ディスク、ＲＯＭ（Read Only Memory）、ＣＤ－ＲＯＭ（Compact Disc Read Only Memory）などの可搬媒体、コンピュータシステムに内蔵されるハードディスクなどの記憶装置のことをいう。上記プログラムは、前述した機能の一部を実現するためのものであってもよく、さらに前述した機能をコンピュータシステムに既に記録されているプログラムとの組み合わせで実現できるものであってもよい。

【0082】

上記各実施形態では、情報処理システム１００を構成する各部分はソフトウェア機能部として説明したが、ＬＳＩなどのハードウェア機能部であってもよい。

【0083】

以上、本開示の実施形態を説明したが、この実施形態は、例として示したものであり、本開示の範囲を限定することは意図していない。この実施形態は、その他の様々な形態で実施されることが可能であり、本開示の要旨を逸脱しない範囲で種々の省略、置き換え、変更を行うことができる。

【0084】

上記実施形態の一部または全部は、以下の付記のようにも記載され得るが、以下に限定されるものではない。

【0085】

（付記１）
調査対象についての自由記述形式のテキストを含むアンケート回答の情報を処理する情報処理システムであって、
前記テキストから、前記調査対象への否定的評価に関連する１以上の特徴語句を抽出する特徴語句抽出手段と、
前記抽出された特徴語句に関連するメッセージを提示させるメッセージ手段と、
を備える、情報処理システム。

【0086】

（付記２）
前記メッセージは、
（１）前記否定的評価を低減または解消するための提案、
（２）前記調査対象についての説明、
（３）前記調査対象についての謝罪、および
（４）前記調査対象についての質問
からなる群より選択された１以上を含む、
付記１に記載の情報処理システム。

【0087】

（付記３）
前記特徴語句抽出手段は、前記テキストにおける語句の出現数、前記テキストにおける語句の出現頻度、トピックモデル、および前記テキストから生成された共起ネットワークのうち１以上を使用して、前記テキストから前記特徴語句を抽出する、
付記１または２に記載の情報処理システム。

【0088】

（付記４）
前記特徴語句抽出手段は、前記テキストにおける出現数または出現頻度が大きい語句を特徴語句として抽出する、
付記３に記載の情報処理システム。

【0089】

（付記５）
重みづけされた語句を前記テキストから抽出するか、または前記テキストから抽出された語句に重みづけを行う重要度評価手段をさらに備える、
付記１～４のいずれか一つに記載の情報処理システム。

【0090】

（付記６）
前記特徴語句抽出手段は、前記重要度評価手段による重みづけの結果に基づいて、前記１以上の特徴語句を抽出する、
付記５に記載の情報処理システム。

【0091】

（付記７）
前記特徴語句抽出手段は、前記テキストにおける出現数または出現頻度が大きい語句を特徴語句候補として抽出し、
前記重要度評価手段は、前記テキストにおける出現数もしくは出現頻度またはその関数に基づいて、前記特徴語句候補の重みづけを行う、
付記５または６に記載の情報処理システム。

【0092】

（付記８）
前記特徴語句抽出手段は、トピックモデルによって前記テキストのトピックを特徴語句候補として抽出し、
前記重要度評価手段は、前記テキストにおける各トピックの出現確率に基づいて、前記特徴語句候補の重みづけを行う、
付記５または６に記載の情報処理システム。

【0093】

（付記９）
前記特徴語句抽出手段は、前記テキストから生成された語句間の共起ネットワークにおいて所定のネットワークを構成する語句を特徴語句候補として抽出し、
前記重要度評価手段は、Ｊａｃｃａｒｄ係数の値に基づいて、前記特徴語句候補の重みづけを行う、
付記５または６に記載の情報処理システム。

【0094】

（付記１０）
前記テキストが、前記調査対象へのどのような評価を伴うかを判定する評価判定手段をさらに備える、
付記１～９のいずれか一つに記載の情報処理システム。

【0095】

（付記１１）
前記評価判定手段は、前記テキストが前記調査対象への否定的評価を伴うか否かを判定する、
付記１０に記載の情報処理システム。

【0096】

（付記１２）
前記評価判定手段は、テキストの文章ベクトルと当該テキストに伴う評価との関係を学習した学習済みモデルを使用して、前記判定を行う、
付記１０または１１に記載の情報処理システム。

【0097】

（付記１３）
前記特徴語句抽出手段は、前記テキストが前記調査対象への否定的評価に関連すると前記評価判定手段が判定した場合に、当該テキストから前記１以上の特徴語句を抽出する、
付記１０～１２のいずれか一つに記載の情報処理システム。

【0098】

（付記１４）
前記評価判定手段は、前記テキストに含まれる１以上の語句について、前記調査対象への否定的評価を伴うか否かを判定する、
付記１０～１３のいずれか一つに記載の情報処理システム。

【0099】

（付記１５）
前記特徴語句抽出手段は、前記評価判定手段によって前記調査対象への否定的評価を伴うと判定された１以上の語句から、前記１以上の特徴語句を抽出する、
付記１４に記載の情報処理システム。

【0100】

（付記１６）
前記メッセージ手段は、前記テキストが前記調査対象への否定的評価を伴うと前記評価判定手段が判定した場合に、前記否定的評価を低減または解消するための提案を含むメッセージを提示させる、
付記１０～１５のいずれか一つに記載の情報処理システム。

【0101】

（付記１７）
前記メッセージ手段は、前記テキストが前記調査対象への否定的評価を伴うと前記評価判定手段が判定した場合に、前記調査対象についての質問を含むメッセージをアンケートの回答者に対して提示させる、
付記１０～１６のいずれか一つに記載の情報処理システム。

【0102】

（付記１８）
前記メッセージ手段は、前記特徴語句が示す事項を改善するための提案を含むメッセージを提示させる、
付記１～１７のいずれか一つに記載の情報処理システム。

【0103】

（付記１９）
前記メッセージ手段は、文章生成アルゴリズムを使用して、前記メッセージを生成するメッセージ生成手段を含む、
付記１～１８のいずれか一つに記載の情報処理システム。

【0104】

（付記２０）
前記テキストに自然言語処理を行うことによって、前記テキストの文章ベクトルを生成する前処理手段をさらに備える、
付記１～１９のいずれか一つに記載の情報処理システム。

【0105】

（付記２１）
前記メッセージ手段は、個々のアンケート回答に基づいて前記メッセージを提示させる、
付記１～２０のいずれか一つに記載の情報処理システム。

【0106】

（付記２２）
前記メッセージ手段は、複数のアンケート回答の集合に基づいて前記メッセージを提示させる、
付記１～２０のいずれか一つに記載の情報処理システム。

【0107】

（付記２３）
コンピュータによって実行される情報処理方法であって、
アンケート回答に含まれる調査対象についての自由記述形式のテキストから、前記調査対象への否定的評価に関連する１以上の特徴語句を抽出することと、
前記抽出された特徴語句に関連するメッセージを提示させることと、
を含む、情報処理方法。

【0108】

（付記２４）
アンケート回答に含まれる調査対象についての自由記述形式のテキストから、前記調査対象への否定的評価に関連する１以上の特徴語句を抽出することと、
前記抽出された特徴語句に関連するメッセージを提示させることと、
をコンピュータに実行させる、
プログラム。

【符号の説明】

【0109】

１００…情報処理システム
１１０…取得部
１２０…回答データ記憶部
１３０…モデル記憶部
１４０…分析部
１４２…前処理部
１４４…評価判定部
１４６…特徴語句抽出部
１５０…語句抽出部
１５２…重要度評価部
１６０…メッセージ生成部
１７０…出力部

【図1】

【図2】

【図3】

【図4】

【図5】

【図6】

【図7】

【図8】

【図9】

【図10】

知財求人

知財求人お知らせサービス

知財のニュースを調べる
- 知財ニュース
- 知財周辺ニュース
企業の特許を調べる
知財のセミナーを調べる
知財,特許事務所への求職・転職
特許事務所をさがす
弁理士試験を受ける
- 年の弁理士試験情報
- 弁理士試験の合格率など統計
知財の法律をしらべる
期限日をしらべる
- 今日に対して意見書・補正書の期限
- 今日に対して審査請求期限日
知財の判決をしらべる
コンテンツ・リンク
運営会社
プレスの皆様へ
- お問い合わせ
ユーザーの皆様
- お問い合わせ・フィードバック
広告掲載を希望の皆様へ
- 広告掲載について
- 求人広告の掲載について

IP Force 特許公報掲載プロジェクト 2022.1.31 β版