(19)【発行国】日本国特許庁(JP)
(12)【公報種別】公開特許公報(A)
(11)【公開番号】P2024036833
(43)【公開日】2024-03-18
(54)【発明の名称】アンケート作成方法およびプログラム
(51)【国際特許分類】
G06Q 50/10 20120101AFI20240311BHJP
G06Q 10/00 20230101ALI20240311BHJP
G06F 40/279 20200101ALI20240311BHJP
G06F 40/216 20200101ALI20240311BHJP
G06F 16/332 20190101ALI20240311BHJP
【FI】
G06Q50/10
G06Q10/00
G06F40/279
G06F40/216
G06F16/332
【審査請求】未請求
【請求項の数】6
【出願形態】OL
(21)【出願番号】P 2022141339
(22)【出願日】2022-09-06
(71)【出願人】
【識別番号】000005223
【氏名又は名称】富士通株式会社
(74)【代理人】
【識別番号】110002918
【氏名又は名称】弁理士法人扶桑国際特許事務所
(72)【発明者】
【氏名】濱▲崎▼ 良介
【テーマコード(参考)】
5B091
5B175
5L049
【Fターム(参考)】
5B091AA15
5B091CA01
5B175DA01
5B175FA01
5L049AA20
5L049CC20
(57)【要約】
【課題】調査したいサブトピックに応じた選択肢を回答欄に確実に設定する。
【解決手段】コンピュータは、所定のトピックに関する設問に対する回答から抽出することをアンケート実施者が希望するサブトピックを示す情報を取得する。次にコンピュータは、第1のアンケート画面2-1によるアンケート調査で自由記述欄2bに記載された自由記述回答を取得する。さらにコンピュータは、自由記述欄2bの自由記述回答から、サブトピックに対応するキーワードを抽出する。コンピュータは、抽出したキーワードの出現頻度を計数する。コンピュータは、出現頻度が高い方から所定数のキーワードにもとづいて、設問に対応する回答の選択肢2a2を決定する。そしてコンピュータは、設問、初期選択肢2a1、決定した選択肢2a2および自由記述欄2bを有する第2のアンケート画面2-2を出力する。
【選択図】
図3
【特許請求の範囲】
【請求項1】
所定のトピックに関する設問に対する回答から抽出することをアンケート実施者が希望するサブトピックを示す情報を取得し、
前記設問、回答の初期選択肢および回答の自由記述欄を有する第1のアンケート画面によるアンケート調査で前記自由記述欄に記載された自由記述回答を取得し、
前記自由記述欄の前記自由記述回答から、前記サブトピックに対応するキーワードを抽出し、
抽出した前記キーワードの出現頻度を計数し、
出現頻度が高い方から所定数の前記キーワードにもとづいて、前記設問に対応する回答の選択肢を決定し、
前記設問、前記初期選択肢、決定した前記選択肢および前記自由記述欄を有する第2のアンケート画面を出力する、
処理をコンピュータが実行するアンケート作成方法。
【請求項2】
前記サブトピックを示す情報を取得する処理では、1または複数の前記サブトピックを示すサブトピックリストを取得し、
前記サブトピックに対応する前記キーワードを抽出する処理では、前記自由記述回答の内容にもとづいて、前記自由記述回答に含まれる前記キーワードを、前記サブトピックリストに示される1または複数の前記サブトピックのうちのいずれかに分類し、
回答の前記選択肢を生成する処理では、前記サブトピックリストに示される1または複数の前記サブトピックそれぞれについて、分類された前記キーワードそれぞれのうちの出現頻度が高い方から所定数の前記キーワードを、前記選択肢として決定する、
請求項1記載のアンケート作成方法。
【請求項3】
前記サブトピックに対応する前記キーワードの数が所定数よりも多くなった場合、類似の意味を有する2以上の第1のキーワードを統合して、前記キーワードの数を前記所定数以下とする、
処理をコンピュータがさらに実行する請求項1または2に記載のアンケート作成方法。
【請求項4】
前記キーワードの数を前記所定数以下とする処理では、統合される前記第1のキーワードを、前記第1のキーワードそれぞれの意味を包含する意味を有する第2のキーワードに置き換え、前記第1のキーワードそれぞれの出現頻度の合計を、前記第2のキーワードの出現頻度とする、
請求項3記載のアンケート作成方法。
【請求項5】
前記サブトピックに対応する複数の前記選択肢を、肯定的な意味を表す肯定選択肢、否定的な意味を表す否定選択肢および中立的な意味を表す中立選択肢に分けて、前記第2のアンケート画面に前記肯定選択肢、前記否定選択肢および前記中立選択肢を出力する、
処理をコンピュータがさらに実行する請求項1または2に記載のアンケート作成方法。
【請求項6】
所定のトピックに関する設問に対する回答から抽出することをアンケート実施者が希望するサブトピックを示す情報を取得し、
前記設問、回答の初期選択肢および回答の自由記述欄を有する第1のアンケート画面によるアンケート調査で前記自由記述欄に記載された自由記述回答を取得し、
前記自由記述欄の前記自由記述回答から、前記サブトピックに対応するキーワードを抽出し、
抽出した前記キーワードの出現頻度を計数し、
出現頻度が高い方から所定数の前記キーワードにもとづいて、前記設問に対応する回答の選択肢を決定し、
前記設問、前記初期選択肢、決定した前記選択肢および前記自由記述欄を有する第2のアンケート画面を出力する、
処理をコンピュータに実行させるプログラム。
【発明の詳細な説明】
【技術分野】
【0001】
本発明は、アンケートの自由記述欄の回答からアンケートの選択肢を生成するアンケート作成方法およびプログラムに関する。
【背景技術】
【0002】
近年、情報処理端末などにアンケート画面を表示して、表示画面に入力された回答データを、ネットワークを通じて集計するアンケート調査が広く行われている。アンケート画面には、アンケートを実施する実施者が知りたいトピックに関する設問が示される。回答者は、アンケート画面に示された設問に対する回答を入力する。
【0003】
アンケート調査では、回答者の負担を少なくするために、予想される回答の選択肢を提示することが一般的である。ただしアンケート実施者が全ての回答を想定できるわけではない。そこで、アンケート実施者が想定した選択肢以外の意見を抽出するために、アンケート画面内に自由記述回答欄が設けられる場合がある。
【0004】
アンケート調査に関する技術としては、例えば、回答者から得られた自由回答を新たな選択肢として構成し、アンケートを実行していくほどに、回答者が登録されている選択肢の中から希望の選択肢を選べるようにするアンケート装置技術が提案されている。
【先行技術文献】
【特許文献】
【0005】
【発明の概要】
【発明が解決しようとする課題】
【0006】
アンケート実施者が知りたいトピックは、さらにサブトピックに分けることができる。例えば知りたいトピックが「改善したい職場課題」の場合、そのトピックには「キャリア」、「コミュニケーション」などのサブトピックが含まれる。アンケート実施者は、設問として設定したトピックに含まれる様々なサブトピックについて幅広く調査したい場合がある。またアンケート実施者は、設問として設定したトピックに含まれる一部のサブトピックについて重点的に調査したい場合もある。アンケート実施者は、調査したいサブトピックに関する回答の選択肢として適切なキーワードが分かっていれば、そのキーワードを回答の選択肢として設定する。これにより、そのサブトピックについて確実に調査することができる。
【0007】
しかし、調査したいサブトピックに関する回答の選択肢として適切なキーワードが不明な場合がある。その場合、サブトピックに関する回答の選択肢を、アンケート実施者が設定することは困難である。
【0008】
なお、自由記述欄の回答から生成したキーワードを回答の選択肢で追加していくことで、調査したいサブトピックに対応するキーワードについても回答の選択肢として追加される可能性がある。ただし、回答の選択肢が多すぎると回答者の負担となるため、回答欄に設定可能な選択肢の数には制限がある。この場合、例えば自由記述回答から得られたキーワードの回答での出現頻度が多いものから順に回答の選択肢として採用する案が考えられる。全体のキーワードのうちの出現頻度が多いキーワードから優先的に選択肢として採用すると、調査したいサブトピックに関するキーワードの出現頻度が相対的に低い場合に、調査したいサブトピックに関するキーワードが選択肢として登録されない。その結果、アンケート実施者が調査を希望するサブトピックに対する調査が不十分になってしまう。
【0009】
1つの側面では、本件は、調査したいサブトピックに応じた選択肢を回答欄に確実に設定可能とすることを目的とする。
【課題を解決するための手段】
【0010】
1つの案では、以下の処理をコンピュータが実行するアンケート作成方法が提供される。
コンピュータは、所定のトピックに関する設問に対する回答から抽出することをアンケート実施者が希望するサブトピックを示す情報を取得する。コンピュータは、設問、回答の初期選択肢および回答の自由記述欄を有する第1のアンケート画面によるアンケート調査で自由記述欄に記載された自由記述回答を取得する。コンピュータは、自由記述欄の自由記述回答から、サブトピックに対応するキーワードを抽出する。コンピュータは、抽出したキーワードの出現頻度を計数する。コンピュータは、出現頻度が高い方から所定数のキーワードにもとづいて、設問に対応する回答の選択肢を決定する。そしてコンピュータは、設問、初期選択肢、決定した選択肢および自由記述欄を有する第2のアンケート画面を出力する。
【発明の効果】
【0011】
1側面によれば、調査したいサブトピックに応じた選択肢を回答欄に確実に設定可能とする。
【図面の簡単な説明】
【0012】
【
図2】情報処理装置のハードウェアの一例を示す図である。
【
図3】アンケート画面作成方法の手順の一例を示す図である。
【
図4】情報処理装置の機能ブロックの一例を示す図である。
【
図5】設問・選択肢管理DBの一例を示す図である。
【
図6】サブトピック・キーワード対応管理DBの一例を示す図である。
【
図7】アンケートの回答収集および選択肢更新処理の手順の一例を示すフローチャートである。
【
図9】自由記述欄に記述される内容の一例を示す図である。
【
図10】サブトピックごとの選択肢決定の一例を示す図である。
【
図11】サブトピックごとの選択肢決定後の設問・選択肢管理テーブルの一例を示す図である。
【
図12】選択肢を更新後のアンケート画面の一例を示す図である。
【
図13】第2の実施の形態における情報処理装置の機能の一例を示すブロック図である。
【
図14】第2の実施の形態におけるサブトピック・キーワード対応管理DBの一例を示す図である。
【
図15】第2の実施の形態におけるアンケートの回答収集および選択肢更新処理の手順の一例を示すフローチャートである。
【
図16】キーワード統合の一例を説明するための図である。
【
図17】階層クラスタ法の一例を示す第1の図である。
【
図18】階層クラスタ法の一例を示す第2の図である。
【
図19】階層クラスタ法の一例を示す第3の図である。
【
図20】キーワード統合による上位概念のキーワードへの置き換えの一例を示す図である。
【
図21】第3の実施の形態における情報処理装置の機能の一例を示すブロック図である。
【
図22】サブトピック・主要文対応管理DBの一例を示す図である。
【
図23】第3の実施の形態におけるアンケートの回答収集および選択肢更新処理の手順の一例を示すフローチャートである。
【
図24】第3の実施の形態のアンケート画面の一例を示す図である。
【発明を実施するための形態】
【0013】
以下、本実施の形態について図面を参照して説明する。
[第1の実施の形態]
第1の実施の形態は、トピックに関する設問に対する回答として設定可能な選択肢の数に制限がある場合において、調査したいサブトピックに応じた選択肢を回答欄に確実に設定することが可能なアンケートシステムである。
【0014】
図1は、アンケートシステムの一例を示す図である。アンケートシステムは、情報処理装置10と、情報処理装置10にネットワークN1を介して接続された複数の回答者端末30,31,・・・とを有する。情報処理装置10は、ネットワークを介したアンケート調査を実施するコンピュータである。回答者端末30,31,・・・は、アンケートの回答者が使用するコンピュータである。
【0015】
情報処理装置10は、回答者端末30,31,・・・にアンケート画面を示すデータを送信する。アンケート画面には、設問への回答の選択肢と自由記述欄とが含まれる。回答者端末30,31,・・・を使用する回答者は、アンケート画面に示される設問への回答を回答者端末30,31,・・・に入力する。回答者端末30,31,・・・は、アンケート画面に対して入力された回答を情報処理装置10に送信する。情報処理装置10は、回答を集計する。このとき情報処理装置10は、自由記述欄に入力された回答(自由記述回答)に基づいて、アンケート画面に含める回答の選択肢を更新することができる。
【0016】
<ハードウェア>
図2は、情報処理装置のハードウェアの一例を示す図である。情報処理装置10は、プロセッサ101によって装置全体が制御されている。プロセッサ101には、バス109を介してメモリ102と複数の周辺機器が接続されている。プロセッサ101は、マルチプロセッサであってもよい。プロセッサ101は、例えばCPU(Central Processing Unit)、MPU(Micro Processing Unit)、またはDSP(Digital Signal Processor)である。プロセッサ101がプログラムを実行することで実現する機能の少なくとも一部を、ASIC(Application Specific Integrated Circuit)、PLD(Programmable Logic Device)などの電子回路で実現してもよい。
【0017】
メモリ102は、情報処理装置10の主記憶装置として使用される。メモリ102には、プロセッサ101に実行させるOS(Operating System)のプログラムやアプリケーションプログラムの少なくとも一部が一時的に格納される。また、メモリ102には、プロセッサ101による処理に利用する各種データが格納される。メモリ102としては、例えばRAM(Random Access Memory)などの揮発性の半導体記憶装置が使用される。
【0018】
バス109に接続されている周辺機器としては、ストレージ装置103、GPU(Graphics Processing Unit)104、入力インタフェース105、光学ドライブ装置106、機器接続インタフェース107およびネットワークインタフェース108がある。
【0019】
ストレージ装置103は、内蔵した記録媒体に対して、電気的または磁気的にデータの書き込みおよび読み出しを行う。ストレージ装置103は、情報処理装置10の補助記憶装置として使用される。ストレージ装置103には、OSのプログラム、アプリケーションプログラム、および各種データが格納される。なお、ストレージ装置103としては、例えばHDD(Hard Disk Drive)やSSD(Solid State Drive)を使用することができる。
【0020】
GPU104は画像処理を行う演算装置であり、グラフィックコントローラとも呼ばれる。GPU104には、モニタ21が接続されている。GPU104は、プロセッサ101からの命令に従って、画像をモニタ21の画面に表示させる。モニタ21としては、有機EL(Electro Luminescence)を用いた表示装置や液晶表示装置などがある。
【0021】
入力インタフェース105には、キーボード22とマウス23とが接続されている。入力インタフェース105は、キーボード22やマウス23から送られてくる信号をプロセッサ101に送信する。なお、マウス23は、ポインティングデバイスの一例であり、他のポインティングデバイスを使用することもできる。他のポインティングデバイスとしては、タッチパネル、タブレット、タッチパッド、トラックボールなどがある。
【0022】
光学ドライブ装置106は、レーザ光などを利用して、光ディスク24に記録されたデータの読み取り、または光ディスク24へのデータの書き込みを行う。光ディスク24は、光の反射によって読み取り可能なようにデータが記録された可搬型の記録媒体である。光ディスク24には、DVD(Digital Versatile Disc)、DVD-RAM、CD-ROM(Compact Disc Read Only Memory)、CD-R(Recordable)/RW(ReWritable)などがある。
【0023】
機器接続インタフェース107は、情報処理装置10に周辺機器を接続するための通信インタフェースである。例えば機器接続インタフェース107には、メモリ装置25やメモリリーダライタ26を接続することができる。メモリ装置25は、機器接続インタフェース107との通信機能を搭載した記録媒体である。メモリリーダライタ26は、メモリカード27へのデータの書き込み、またはメモリカード27からのデータの読み出しを行う装置である。メモリカード27は、カード型の記録媒体である。
【0024】
ネットワークインタフェース108は、ネットワークN1に接続されている。ネットワークインタフェース108は、ネットワークN1を介して、他のコンピュータまたは通信機器との間でデータの送受信を行う。ネットワークインタフェース108は、例えばスイッチやルータなどの有線通信装置にケーブルで接続される有線通信インタフェースである。またネットワークインタフェース108は、基地局やアクセスポイントなどの無線通信装置に電波によって通信接続される無線通信インタフェースであってもよい。
【0025】
情報処理装置10は、以上のようなハードウェアによって、第1の実施の形態の処理機能を実現することができる。なお回答者端末30,31,・・・も、情報処理装置10と同様のハードウェアで実現することができる。
【0026】
情報処理装置10は、例えばコンピュータ読み取り可能な記録媒体に記録されたプログラムを実行することにより、第1の実施の形態の処理機能を実現する。情報処理装置10に実行させる処理内容を記述したプログラムは、様々な記録媒体に記録しておくことができる。例えば、情報処理装置10に実行させるプログラムをストレージ装置103に格納しておくことができる。プロセッサ101は、ストレージ装置103内のプログラムの少なくとも一部をメモリ102にロードし、プログラムを実行する。また情報処理装置10に実行させるプログラムを、光ディスク24、メモリ装置25、メモリカード27などの可搬型記録媒体に記録しておくこともできる。可搬型記録媒体に格納されたプログラムは、例えばプロセッサ101からの制御により、ストレージ装置103にインストールされた後、実行可能となる。またプロセッサ101が、可搬型記録媒体から直接プログラムを読み出して実行することもできる。
【0027】
情報処理装置10は、例えばプロセッサ101により所定のプログラムを実行することで、調査したいサブトピックに応じた回答の選択肢を出力することができる。出力された選択肢は、アンケート画面の回答欄に設定される。情報処理装置10は、選択肢を出力するとき、アンケートの設問に対応するトピックをさらに詳細に分類したサブトピックのうち、アンケート実施者が特に詳細な調査を希望するサブトピックについての回答の選択肢を確実に出力する。これにより、調査の対象のサブトピックについての回答の選択肢を、確実にアンケート画面に含めることができる。
【0028】
<アンケート画面作成方法の概要>
以下、
図3を参照し、アンケート実施者が調査を希望するサブトピックについての回答の選択肢を確実に生成することができるアンケート画面作成方法の概要を説明する。
【0029】
図3は、アンケート画面作成方法の手順の一例を示す図である。
〔ステップS1〕情報処理装置10は、アンケート実施者が調査したいサブトピックを示す情報(例えばサブトピックの名称など)の入力を受け付ける。情報処理装置10は、アンケート実施者によって入力されたサブトピックを、調査対象に設定する。例えば「キャリア」などのサブトピックが調査対象に設定される。
【0030】
〔ステップS2〕情報処理装置10は、アンケート画面2-1(第1のアンケート画面)を出力する。アンケート画面2-1は、例えば回答者端末30,31,・・・に表示される。
【0031】
アンケート画面2-1には、アンケートで調査対象となっているトピックに関する設問、その設問に対する回答の選択肢2a1(初期選択肢)、および設問に対する自由記述欄2bが含まれる。選択肢2a1は、アンケートの設問に対する複数の回答候補であって回答者により任意に選択される。
図1の例では、アンケート画面2-1において、設問として「職場の改善すべき点について回答してください。」と示され、選択肢2a1には、「(1)残業」と「(2)予算」が示されている。また、自由記述欄2bは、回答者が自由に意見を記述できる欄である。
【0032】
〔ステップS3〕情報処理装置10は、回答者によってアンケート画面2-1に入力された回答を取得する。ここでは、情報処理装置10は、自由記述欄2bに入力された「キャリアパスが描けない。」という回答を取得したものとする。
【0033】
〔ステップS4〕情報処理装置10は、自由記述欄2bに入力された回答から、設定されたサブトピックに対応するキーワードを抽出し、抽出したキーワードを計数する。例えば「キャリアパスが描けない。」という回答からは、キーワード「キャリアパス」が抽出できる。また回答「キャリアパスが描けない。」には、サブトピックを表す「キャリア」の語句が含まれている。そのためキーワード「キャリアパス」は、サブトピック「キャリア」についてのキーワードであると判断される。そしてサブトピック「キャリア」についてのキーワード「キャリアパス」の出現頻度が1だけカウントアップされる。
【0034】
例えば情報処理装置10は、設定されたサブトピックのキーワードごとの出現頻度(回答に出現した回数の計数値)を、管理テーブルT1を用いて管理する。管理テーブルT1は、項目として、サブトピック、キーワードおよび出現頻度を有する。
図1の例では、サブトピック「キャリア」に対応付けて、キーワード「キャリアパス」、「キャリアアップ」などが管理テーブルT1に設定されている。「キャリアパス」の出現頻度は10であり、「キャリアアップ」の出現頻度は「8」である。それ以外のキーワードの出現頻度は8未満であるものとする。
【0035】
〔ステップS5〕情報処理装置10は、抽出したキーワードにもとづいてサブトピックに関連する選択肢2a2を生成し、生成した選択肢2a2をアンケート画面2-1に設定する。例えば設定されたサブトピックごとの選択肢として設定する個数が1つと設定されている場合、サブトピック「キャリア」に対応するキーワードのうち、出現頻度が最も高いキーワード「キャリアパス」が選択肢として追加されることになる。
【0036】
以後、情報処理装置10は、選択肢2a1、選択肢2a2および自由記述欄2bを有する新たなアンケート画面2-2(第2のアンケート画面)を生成し出力する。
このように、情報処理装置10では、アンケートの自由記述欄に入力された回答からサブトピックに対応するキーワードを抽出し、出現頻度の高いキーワードにもとづいてサブトピックに関する選択肢を生成して出力する。これにより、アンケート実施者が調査したいサブトピックに関する選択肢を有するアンケートを実施することができ、サブトピックに対応した回答を得ることができる。
【0037】
なお、
図3の例では、アンケート実施者が調査したいサブトピックが1つのみの例を示しているが、情報処理装置10は、アンケート実施者が調査したいサブトピックとして、複数のサブトピックの設定を受け付けることができる。その場合、情報処理装置10は、例えば設定されたサブトピックごとに、そのサブトピックのキーワードの出現頻度を計数する。そして情報処理装置10は、設定されたサブトピックごとに、出現頻度が多い所定数のキーワードを特定し、回答の選択肢とする。
【0038】
また情報処理装置10は、アンケート実施者が設定していないその他のサブトピックのキーワードについても、自由記述欄の回答から抽出し、出現頻度を計数してもよい。その場合、例えば情報処理装置10は、アンケート実施者が設定していないその他のサブトピックのキーワードのうち、出現頻度が大きい方から所定数のキーワードを、回答の選択肢とすることができる。
【0039】
以下、選択肢の自動生成を伴うアンケート調査を実施可能な情報処理装置10の機能および処理手順について詳細に説明する。なお、以下の説明では、アンケート実施者が調査したいサブトピックを複数設定可能であり、設定されていないその他のサブトピックのキーワードの中からも、出現頻度に応じた選択肢の出力を行うものとする。
【0040】
<機能ブロック>
図4は、情報処理装置の機能ブロックの一例を示す図である。情報処理装置10は、制御部11および記憶部12を備える。
【0041】
制御部11は、サブトピック設定部11a、設問・選択肢出力部11b、回答収集部11c、キーワード抽出部11d、サブトピック分類部11e、出現頻度計数部11f、および選択肢生成部11gを含む。記憶部12は、設問・選択肢管理DB(データベース)12aおよびサブトピック・キーワード対応管理DB12bを含む。
【0042】
サブトピック設定部11aは、アンケート実施者からの入力にもとづいて、重点的に調査するサブトピックを設定する。例えばサブトピック設定部11aは、アンケート実施者からのサブトピックリストの指定操作を受け付ける。サブトピックリストは、アンケート実施者によって指定されたサブトピックの識別情報(例えばサブトピック名)のリストである。サブトピック設定部11aは、指定されたサブトピックリストに示されるサブトピックを、サブトピック・キーワード対応管理DB12bに設定する。
【0043】
設問・選択肢出力部11bは、設問・選択肢管理DB12aからアンケートの設問および選択肢を抽出し、抽出した設問、選択肢、および自由記述欄を含むアンケート画面を出力する。例えば設問・選択肢出力部11bは、回答者端末30,31,・・・のいずれかが出力したアンケート画面取得要求に応じてアンケート画面を示す画面データを生成し、生成した画面データを、アンケート画面取得要求を出力した回答者端末に送信する。
【0044】
回答収集部11cは、アンケート画面を通じて、回答者によって選択された選択肢、および自由記述欄に入力された回答を収集する(回答者が回答しない場合もある)。例えば回答収集部11cは、アンケート画面を示す画面データを送信した回答者端末から、アンケート画面に示される設問に対する回答を受信する。
【0045】
キーワード抽出部11dは、自由記述欄に入力された回答からキーワードを抽出する。例えばキーワード抽出部11dは、自由記述欄に入力された文字列に対する形態素解析を行い、名詞などの所定の品詞の単語を抽出する。
【0046】
サブトピック分類部11eは、自由記述欄に入力された回答から抽出されたキーワードを、回答の内容に応じたサブトピックに分類する。例えばサブトピック分類部11eは、自由記述欄に入力された回答の文字列に、サブトピックリストに示されるサブトピック名(例えば「キャリア」)が含まれている場合、そのサブトピック名に対応するサブトピックに、抽出されたキーワードを分類する。なおサブトピック分類部11eは、サブトピックリストに示されるサブトピックのいずれにも該当しない場合、キーワードの分類を「その他」とする。
【0047】
出現頻度計数部11fは、サブトピックごとに、そのサブトピックに属するキーワードそれぞれの出現頻度を計数する。例えば出現頻度計数部11fは、サブトピック・キーワード対応管理DB12bから、自由記述欄に入力された回答が属するサブトピックに対応付けられたキーワードの中から、その回答から抽出されたキーワードを特定する。そして出現頻度計数部11fは、特定したキーワードの出現頻度に1を加算する。
【0048】
選択肢生成部11gは、設問に対する回答の選択肢として、アンケート実施者が調査したいサブトピックに対応する選択肢を生成する。例えば選択肢生成部11gは、自由記述欄におけるサブトピックに関する回答に含まれるキーワードのうち、出現頻度の高い方から所定数のキーワードを、回答の選択肢とする。
【0049】
設問・選択肢管理DB12aは、アンケートの設問および回答の選択肢を保存する。選択肢は、選択肢生成部11gによって動的に変更される。
サブトピック・キーワード対応管理DB12bは、サブトピックと、そのサブトピックに該当する回答に含まれていたキーワードとを対応付けて保存する。また、サブトピック・キーワード対応管理DB12bには、対応するサブトピックの回答内での各キーワードの出現頻度を示す出現頻度も含まれる。
【0050】
<設問・選択肢管理DB>
次に、設問・選択肢管理DB12aについて詳細に説明する。
図5は、設問・選択肢管理DBの一例を示す図である。設問・選択肢管理DB12aには、例えば設問・選択肢管理テーブルT21が格納される。設問・選択肢管理テーブルT21には、設問と設問に対する回答の選択肢とが設定されている。
図5の例では、設問には「この一週間で感じた、あなたやチームで改善すべき点について回答して下さい。」と設定されている。
【0051】
回答の選択肢は、初期設定選択肢とサブトピック別追加選択肢とに分かれている。初期設定選択肢は、アンケート実施者が設定した選択肢である。
図5の例では、初期設定選択肢には「残業」、「予算」、「物理リソース」の3つの選択肢が設定されている。サブトピック別追加選択肢は、設問に対する自由記述欄への回答にもとづいてサブトピックごとに特定された選択肢である。
図5の例では、サブトピック別追加選択肢は未設定である。
【0052】
<サブトピック・キーワード対応管理DB>
次にサブトピック・キーワード対応管理DB12bについて詳細に説明する。なお、以下の説明では、アンケート実施者が指定したサブトピックリストには、「キャリア」と「コミュニケーション」とが、サブトピックとして設定されているものとする。
【0053】
図6は、サブトピック・キーワード対応管理DBの一例を示す図である。サブトピック・キーワード対応管理DB12bには、例えばサブトピック・キーワード対応管理テーブルT11が格納される。
【0054】
サブトピック・キーワード対応管理テーブルT11は、項目として、サブトピック、キーワードおよび出現頻度を有する。
図6の例では、サブトピック「キャリア」に対して、キーワード「キャリアパス」、「キャリアアップ」、「1on1」が対応しており、「キャリアパス」の出現頻度は10、「キャリアアップ」の出現頻度は8、「1on1」の出現頻度は6である。
【0055】
また、サブトピック「コミュニケーション」に対して、キーワード「連絡不足」、「情報共有」、「孤立」が対応しており、「連絡不足」の出現頻度は9、「情報共有」の出現頻度は7、「孤立」の出現頻度は3である。
【0056】
サブトピックリストに含まれる「キャリア」と「コミュニケーション」のサブトピックのいずれにも属さないキーワードは、サブトピック「その他」として、サブトピック・キーワード対応管理テーブルT11に登録される。
図6の例では、サブトピック「その他」に対して、キーワード「業務量」、「空調」、「残業」などが対応しており、「業務量」の出現頻度は18、「空調」の出現頻度は15、「残業」の出現頻度は12である。
【0057】
なお、サブトピック・キーワード対応管理テーブルT11の初期状態では、サブトピックとして「その他」のみが設定されており、初期状態でのキーワードと出現頻度とは空欄である。アンケート実施者が調査を希望するサブトピックはサブトピックリストに示されており、サブトピックリストにもとづいて、サブトピック・キーワード対応管理テーブルT11にサブトピックが追加される。
【0058】
<アンケートの回答収集および選択肢更新処理手順>
次に、情報処理装置10における、アンケートの回答収集および選択肢更新処理の手順について説明する。
【0059】
図7は、アンケートの回答収集および選択肢更新処理の手順の一例を示すフローチャートである。以下、
図7に示す処理をステップ番号に沿って説明する。
〔ステップS11〕サブトピック設定部11aは、アンケート実施者が指定したサブトピックリストを取得する。例えばアンケート実施者は、サブトピックリストのファイルの格納場所とファイル名とを入力する。サブトピック設定部11aは、入力された格納場所から入力されたファイル名のファイルから、そのファイルに含まれるサブトピックリストを取得する。
【0060】
〔ステップS12〕サブトピック設定部11aは、取得したサブトピックリストに示されるサブトピックを、サブトピック・キーワード対応管理DB12bに設定する。例えばサブトピック設定部11aは、サブトピック・キーワード対応管理テーブルT11のサブトピックの欄に、サブトピックリストに示されるサブトピックを設定する。
【0061】
〔ステップS13〕選択肢生成部11gは、アンケートの設問と初期の選択肢を設定する。例えば選択肢生成部11gは、アンケート実施者から、設問の文と、初期の選択肢を示すキーワードとの入力を受け付ける。そして選択肢生成部11gは、入力された設問の文を、設問・選択肢管理テーブルT21の設問の欄に設定する。また選択肢生成部11gは、入力された初期の選択肢を、設問・選択肢管理テーブルT21の初期設定選択肢の欄に設定する。
【0062】
〔ステップS14〕設問・選択肢出力部11bは、アンケート画面を通じて設問・選択肢を回答者に提示する。例えば設問・選択肢出力部11bは、回答者端末30,31,・・・からアンケート画面の取得要求を受信すると、取得要求の送信元の回答者端末にアンケート画面の画面データを送信する。画面データを受信した回答者端末には、設問と設問に対する回答の選択肢と自由記述欄とを含むアンケート画面が表示される。
【0063】
〔ステップS15〕回答収集部11cは、アンケート画面に入力された回答を収集する。例えば回答収集部11cは、アンケート画面の画面データの送信先の回答者端末から、回答として選択された選択肢、および自由記述欄に入力された文字列を取得する。
【0064】
〔ステップS16〕回答収集部11cは、収集した回答に自由記述回答が含まれるか否かを判断する。回答収集部11cは、自由記述回答が含まれる場合、処理をステップS17に進める。また回答収集部11cは、自由記述回答が含まれない場合、処理をステップS14に進める。
【0065】
〔ステップS17〕キーワード抽出部11dは、自由記述回答からキーワードを抽出する。例えばキーワード抽出部11dは、自由記述欄に記載された文字列の形態素解析を行い、所定の品詞の単語を抽出する。
【0066】
〔ステップS18〕サブトピック分類部11eは、自由記述回答から抽出したキーワードを、設定されたサブトピックのいずれかに分類する。例えばサブトピック分類部11eは、「キャリア」または「コミュニケーション」などのサブトピックを示す文字列が自由記述回答に含まれる場合、その文字列に対応するサブトピックにキーワードを分類する。
【0067】
〔ステップS19〕出現頻度計数部11fは、抽出したキーワードを分類先のサブトピックに対応付け、そのサブトピック内での該当キーワードの出現頻度を計数する。例えば出現頻度計数部11fは、サブトピック・キーワード対応管理テーブルT11において、分類先のサブトピックに対応付けて、抽出したキーワードが登録されていない場合、該当サブトピックに対応付けて抽出したキーワードを登録する。その際、出現頻度計数部11fは、登録したキーワードの出現頻度に1を設定する。また出現頻度計数部11fは、サブトピック・キーワード対応管理テーブルT11において、分類先のサブトピックに対応付けて、抽出したキーワードが登録されている場合、該当キーワートの出現頻度に1を加算する。
【0068】
〔ステップS20〕選択肢生成部11gは、サブトピックごとの選択肢を決定する。例えば選択肢生成部11gは、サブトピック・キーワード対応管理テーブルT11において、サブトピックそれぞれについて、対応するキーワードのうち出現頻度が多い方から所定数のキーワードを選択肢に決定する。
【0069】
〔ステップS21〕選択肢生成部11gは、サブトピックごとに追加する選択肢を更新する。例えば選択肢生成部11gは、設問・選択肢管理テーブルT21のサブトピック別追加選択肢の欄の内容を、ステップS20で選択肢として決定したキーワードに更新する。すなわち、それ以前にサブトピック別追加選択肢の欄に設定されていたキーワードは削除され、ステップS20で選択肢として決定したキーワードに変更される。その後、処理がステップS14に進められる。
【0070】
これにより、以後は、更新後の選択肢が回答者に提示される。なお
図7の処理では、回答者からの1つの回答を収集するごとにステップS16~S21の処理を行っているが、一定期間(1時間、1日、10日、1月など)の回答を蓄積しておき、蓄積しておいた回答についてステップS16~S21の処理を実行してもよい。
【0071】
<アンケート画面内の選択肢の更新例>
次に、アンケート画面に表示される選択肢の更新例について具体的に説明する。
図8は、アンケート画面の一例を示す図である。回答者端末30に、アンケート実施者により指定されたサブトピックごとの選択肢が追加される前のアンケート画面30-1が表示されたものとする。例えば
図5に示す設問・選択肢管理テーブルT21に基づいて、アンケート画面30-1を示す画面データが生成される。そして生成された画面データが回答者端末30に送信され、送信先の回答者端末30にアンケート画面30-1が表示される。
【0072】
アンケート画面30-1には、設問、選択肢30a、および自由記述欄30bが表示される。「この一週間で感じた、あなたやチームで改善すべき点について回答して下さい。」という設問に対し、選択肢30aには、「(1)残業」、「(2)予算」、「(3)物理リソース」が示されている。各選択肢にはチェックボックス30cが示されている。なお、「(*)その他」は、上記以外の回答である場合に選択される。自由記述欄30bは、回答者が自由な意見を書き込めるテキストボックスである。
【0073】
回答者は表示されたアンケート画面30-1に示される設問に回答する。例えば回答者は、表示された選択肢30aの中に自身の意見と同じ選択肢があれば、その選択肢のチェックボックスをチェックする。また回答者は、表示された選択肢30aの中に自身の意見と同じ選択肢がなければ、「(*)その他」のチェックボックスをチェックし、自由記述欄30bに自身の意見を文章で入力する。
【0074】
回答者は、回答の入力が完了すると送信ボタン30dを押下する。送信ボタン30dが押されると、回答者端末30により、アンケート画面30-1に入力された回答データが情報処理装置10に送信される。回答データは情報処理装置10の回答収集部11cで収集される。そして自由記述欄に記述がある場合、記述内容が解析される。
【0075】
図9は、自由記述欄に記述される内容の一例を示す図である。例えば、
図9に示す自由記述欄回答例41に示すような回答が自由記述欄30bに記述される。自由記述欄30bに記述された回答からキーワードが抽出され、そのキーワードが属するサブトピックが判定される。
【0076】
例えば自由記述欄30bに「キャリアパスが描けない。」との回答が入力された場合、この回答からキーワード「キャリアパス」が抽出される。この回答にはサブトピック「キャリア」の文言が含まれることから、キーワード「キャリアパス」はサブトピック「キャリア」に分類される。
【0077】
また自由記述欄30bに「メンバ間コミュニケーションにおいて連絡不足になっている。」との回答が入力された場合、この回答からキーワード「連絡不足」が抽出される。この回答にはサブトピック「コミュニケーション」の文言が含まれていることから、キーワード「連絡不足」はサブトピック「コミュニケーション」に分類される。
【0078】
自由記述欄30bに記述された回答から抽出されたキーワードは、分類先のサブトピックごとに計数される。計数結果は、出現頻度で表される。そしてサブトピックごとに、出現頻度が大きい方から所定数のキーワードが選択肢に決定される。
【0079】
図10は、サブトピックごとの選択肢決定の一例を示す図である。
図10には、サブトピックごとに、出現頻度が最も高い1つのキーワードを選択肢に決定する場合の例が示されている。
【0080】
自由記述回答が「メンバ間コミュニケーションにおいて連絡不足になっている。」の場合、この回答からキーワード「連絡不足」が抽出される(ステップS31)。また、回答内に「コミュニケーション」との記載が含まれているため、抽出されたキーワード「連絡不足」は、サブトピック「コミュニケーション」に分類される(ステップS32)。そこで、サブトピック「コミュニケーション」に対応するキーワード「連絡不足」の出現頻度に1が加算される(ステップS33)。
図6に示すサブトピック・キーワード対応管理テーブルT11の例では、サブトピック「コミュニケーション」に対応するキーワード「連絡不足」の出現頻度は9であるため、この出現頻度が10に更新される。
【0081】
その後、サブトピックごとに、そのサブトピックに対応するキーワードが出現頻度によって降順でソートされる(ステップS34)。
図6に示すサブトピック・キーワード対応管理テーブルT11の例では、サブトピック「コミュニケーション」に対応するキーワードは、「(1)連絡不足、(2)情報共有、(3)孤立」の順となる。
【0082】
そしてサブトピックごとに上位のキーワードが選択肢として決定される(ステップS35)。例えばサブトピック「コミュニケーション」については、キーワード「連絡不足」が選択肢に決定される。
【0083】
同様に、他のサブトピックについても、選択肢とするキーワードが決定される。
図6に示すサブトピック・キーワード対応管理テーブルT11の例では、サブトピック「キャリア」についての選択肢は「キャリアパス」に決定され、サブトピック「その他」についての選択肢は「業務量」に決定される。選択肢として決定されたキーワードは設問・選択肢管理テーブルT21に設定される。
【0084】
図11は、サブトピックごとの選択肢決定後の設問・選択肢管理テーブルの一例を示す図である。
図11の例では、設問・選択肢管理テーブルT21のサブトピック別追加選択肢の欄に、「キャリアパス」、「連絡不足」、および「業務量」が設定されている。設問・選択肢管理テーブルT21が更新されたことにより、次回以降のアンケート画面に表示される選択肢も更新される。
【0085】
図12は、選択肢を更新後のアンケート画面の一例を示す図である。
図12には、
図11に示した設問・選択肢管理テーブルT21にもとづいて表示されたアンケート画面30-2が示されている。アンケート画面30-2では、サブトピックに関連する選択肢として「キャリアパス」、「連絡不足」、「業務量」という新たな選択肢30eが追加されている。
【0086】
<第1の実施の形態の効果>
図12に示したように、アンケート実施者が指定したサブトピックそれぞれに関連する選択肢が、確実にアンケート画面30-2に含められる。例えば全体での回答頻度が必ずしも高くはないキーワードであっても、アンケート実施者が指定したサブトピック内での出現頻度が高いキーワードであれば選択肢に決定される。
【0087】
これにより、アンケート実施者は、調査を希望するサブトピックを情報処理装置10に設定することで、指定されたサブトピックについての調査を容易に実施することができる。例えばアンケート実施者は、回答頻度が必ずしも高くはないと予想されるが、様々なサブトピックについて幅広く知りたい、またはあるサブトピックについて重点的に知りたいなどの意図がある場合がある。この場合、アンケート実施者は、該当のサブトピックを情報処理装置10に対して設定する。すると情報処理装置10により、設定されたサブトピックについての選択肢を含むアンケート画面を介したアンケート調査が実施される。
【0088】
しかも、第1の実施の形態によれば、アンケート実施者が設定したサブトピックについての自由記述欄への回答が少なくとも1つ存在すれば、そのサブトピックについての選択肢がアンケート画面に確実に含められる。すなわち、属するサブトピックを考慮せずに、全てのキーワードのうちの出現頻度が高い方から所定数を選択肢に決定すると、回答頻度が低いサブトピックのキーワードが、他の多数の自由回答のキーワードに埋もれてしまう。その結果、アンケート実施者が調査したいサブトピックのキーワードが選択肢として決定されない可能性がある。それに対して、第1の実施の形態では、アンケート実施者が指定したサブトピックのキーワードの中から選択肢を決定するため、そのサブトピックについての選択肢がアンケート画面に確実に含められることとなる。
【0089】
[第2の実施の形態]
第2の実施の形態は、サブトピックごとのキーワードの数が増えすぎた場合に、サブトピック内でキーワードを統合するものである。
【0090】
第1の実施の形態では、アンケート調査を長期間実施すると、サブトピックごとのキーワード数は増え続ける。1つのサブトピックに対応するキーワード数が増えすぎると、類似する概念のキーワードの出現頻度が別々で計数される。類似する複数のキーワードの出現頻度の合計は多いものの別々で計数すると出現頻度が少なくなる場合、回答者の多くが回答で意図している概念を示すキーワードが、回答の選択肢から漏れてしまう。そこで第2の実施の形態に係る情報処理装置では、対応するキーワードの数が所定数を超えたサブトピックについて、対応するキーワードのうちの類似する概念の複数のキーワードを、それらのキーワードの概念を包含する上位概念のキーワードに置き換える。これにより、キーワードが細かく分かれすぎて、回答者の多くが回答で意図している概念を示すキーワードが回答の選択肢から漏れてしまうことが抑止できる。
【0091】
以下、第2の実施の形態における第1の実施の形態との相違点について説明する。第2の実施の形態において第1の実施の形態と同じ機能を有する要素には第1の実施の形態と同じ符号を付し、その説明を省略する。
【0092】
<機能ブロック>
図13は、第2の実施の形態における情報処理装置の機能の一例を示すブロック図である。第2の実施の形態の情報処理装置10-1は、制御部11-1と記憶部12-1とを有する。第2の実施の形態の制御部11-1は、第1の実施の形態の制御部11が有する機能に加え、キーワード数計数部11hとキーワード統合部11iとを有する。
【0093】
キーワード数計数部11hは、サブトピックごとに、そのサブトピックに対応するキーワードの数を計数する。例えばキーワード数計数部11hは、出現頻度計数部11fによってサブトピックに対する新たなキーワードが設定されたことを検知すると、該当サブトピックの該当キーワードのキーワード数を1だけ増加させる。
【0094】
キーワード統合部11iは、対応するキーワード数が所定値を超えたサブトピックを検知すると、そのサブトピックに対応するキーワードの一部を統合する。例えばキーワード統合部11iは、意味的な距離が近い複数のキーワード(第1のキーワード)を統合し、別の1つのキーワード(第2のキーワード)に置き換える。置き換え後のキーワードの出現頻度は、統合されたキーワードの出現頻度の合計となる。
【0095】
記憶部12-1は、第1の実施の形態と同様の設問・選択肢管理DB12aと、キーワード種類数の計数に対応したサブトピック・キーワード対応管理DB12b-1とを記憶する。
【0096】
<サブトピック・キーワード対応管理DB>
図14は、第2の実施の形態におけるサブトピック・キーワード対応管理DBの一例を示す図である。第2の実施の形態におけるサブトピック・キーワード対応管理テーブルT11-1は、項目として、サブトピック、キーワード、出現頻度、およびキーワード数を有する。キーワード数は、サブトピックに対応するキーワードの数である。例えばサブトピック「キャリア」に対応するキーワードは「キャリアパス」、「キャリアアップ」、「1on1」の3種類であるため、サブトピック「キャリア」のキーワード数は3である。サブトピック「コミュニケーション」に対応するキーワードは「連絡不足」、「情報共有」、「孤立」の3種類であるため、サブトピック「コミュニケーション」のキーワード数は3である。
【0097】
図14に示す例では、アンケート実施者が調査対象に指定した2つのサブトピックそれぞれのキーワード数は3であり、キーワード数が多すぎるということはない。しかしアンケート調査を継続して実施し、アンケート画面内の回答の選択肢が回答者の回答しようとする内容と一致しない場合、自由記述による回答が行われ、各サブトピックに対応するキーワード数も増加する。あるサブトピックに対応するキーワード数が増加した場合でも、それらのキーワードのうち回答の選択肢に採用されるのは、出現頻度が上位の数個のみである。そのためあるサブトピックのキーワード数がある程度以上に増加すると、回答者が意図する回答の選択肢が、アンケート画面に含まれない可能性が高くなることを意味する。
【0098】
なお、1つのサブトピック当たりの選択肢の数を増やすことで、回答者が、選択肢の選択で回答を行うことができる可能性を高めることができるが、アンケート画面にリスティングされる選択肢の数を増やしすぎると回答者の負担を増やすこととなる。すなわち、回答の選択肢が多すぎると、回答者は、多数の選択肢の中から自身の意図する回答に最も近い概念の選択肢を選ぶこととなる。選択肢が多ければ、回答者の意見に近い選択肢が複数見つかることもある。すると、回答者は、どの選択肢がより自身の意見に近いのかの判断を繰り返し迫られることとなり、回答者の負担が大きくなる。
【0099】
そこで、第2の実施の形態の情報処理装置10-1は、1つのサブトピックに対応するキーワード数が所定の閾値を超えた場合、キーワードを統合して、上位概念のキーワードで置き換える。これにより、サブトピックごとの選択肢の数を増やさずに、回答者が、選択肢からの選択によって回答できる確率を向上させることができる。
【0100】
<アンケートの回答収集および選択肢更新処理手順>
図15は、第2の実施の形態におけるアンケートの回答収集および選択肢更新処理の手順の一例を示すフローチャートである。
図15に示す処理のうち、ステップS41~S49,S53~S54の処理は、それぞれ
図7に示すステップS11~S21の処理と同じである。以下、
図7の処理と異なるステップS50~S52の処理についてステップ番号に沿って説明する。
【0101】
〔ステップS50〕キーワード数計数部11hは、ステップS48で分類したサブトピックに対応するキーワード数を計数する。例えばキーワード数計数部11hは、出現頻度計数部11fがサブトピック・キーワード対応管理テーブルT11-1に新たなキーワードを出現頻度1で追加した場合、キーワードが追加されたサブトピックのキーワード数を1だけ加算する。
【0102】
〔ステップS51〕キーワード統合部11iは、ステップS48で分類したサブトピックに対応するキーワード数が閾値を超えたか否かを判断する。キーワード統合部11iは、キーワード数が閾値を超えた場合、処理をステップS52に進める。またキーワード統合部11iは、キーワード数が閾値以下であれば、処理をステップS53に進める。
【0103】
〔ステップS52〕キーワード統合部11iは、キーワード数が閾値を超えたサブトピックのキーワードを統合し、キーワード数を削減する。
キーワードの統合には、例えばデンドログラム(樹形図)を利用することができる。デンドログラムは、階層的クラスタリングによるクラスタ分析において、グループ化の様相を木の枝のような線で描画したグラフである。
【0104】
図16は、キーワード統合の一例を説明するための図である。デンドログラムd1において、AからFはそれぞれ、特定のサブトピックに対応するキーワードを表している。近い意味のキーワードは、デンドログラムd1上での距離も近くなる。
【0105】
キーワード数を削減する場合、アンケート実施者は、サブトピックに対応付けるキーワード数の閾値Nを予め設定する。キーワード統合部11iは、デンドログラムd1を用いて、意味的に近いキーワードのN個のまとまりを生成する。なお、意味的に近いキーワードのまとまりをクラスタと呼ぶ。
【0106】
例えばN=4の場合、意味的に近いキーワードA、Bが1つのクラスタにまとめられ、同様に意味的に近いキーワードE、Fが1つのクラスタにまとめられる。その結果、生成されるクラスタは{A、B}、{C}、{D}、{E、F}となる。複数のキーワードを含むクラスタは、上位概念の1つのキーワードに統合される。これにより6つあったキーワードが4つに削減される。
【0107】
またN=2の場合、クラスタ{A、B}とクラスタ{C}が意味的に近いため、1つのクラスタにまとめられる。またクラスタ{D}とクラスタ{E、F}が意味的に近いため、1つのクラスタにまとめられる。これにより、生成されるクラスタは{A、B、C}、{D、E、F}となる。これにより、6つあったキーワードが2つまで削減される。
【0108】
このように、キーワード統合部11iは、あるサブトピックに対応するキーワード数が所定数よりも多くなった場合、類似する意味を持つキーワード同士を統合してキーワード数を所定数まで抑える。その際、統合されたキーワードは上位概念のキーワードに置き換えられる。これにより、アンケート画面にリスティングする際の選択肢の数を増やさなくても、回答者が選択肢の中から回答を選択できる可能性を高めることができる。
【0109】
なお、キーワード間の類似度を計算するために、キーワード統合部11iは、各キーワードを、その意味に応じたベクトルに変換する。例えばキーワード統合部11iは、キーワードを抽出したときの自由記述欄に記載の文章内のキーワードの意味をベクトルに変換する。このようなキーワードの意味を示すベクトルを得る技術としては、例えば、Word2vec(Word2vec T.Mikolov etc, “Efficient Estimation of Word Representations in Vector Space.”2013)がある。キーワード統合部11iは、2つのキーワードそれぞれのベクトル間の類似度(例えばコサイン類似度)によって、キーワード間の類似度を計算することができる。
【0110】
またキーワード統合部11iは、クラスタを統合する場合、クラスタ間の距離が近いものから統合する。クラスタ間の距離の計算では、各クラスタに属するキーワードは、そのキーワードの意味に応じたベクトルを示す点で示される。
【0111】
クラスタ間の距離の計算には、例えば、最短距離法、最長距離法、群平均法、またはウォード法を利用することができる。最短距離法は、各クラスタにおいて、一番近いキーワード同士の距離を、"クラスタの距離"とする。最長距離法は、各クラスタにおいて、一番遠い点同士の距離を、"クラスタの距離"とする。群平均法は、クラスタ同士の全ての点同士の距離の平均を、"クラスタの距離"とする。ウォード法は、あるクラスタ同士が結合すると仮定したとき、結合後の全てのクラスタにおいて、クラスタの重心とクラスタ内の各点の距離の二乗和の合計が最小となるように、クラスタを結合させるものである。
【0112】
<階層クラスタ法によるデンドログラム作成>
デンドログラムは、階層クラスタ法を用いて作成することができる。以下、
図17~
図19を参照して、階層クラスタ法を用いたデンドログラムの作成手順を説明する。
【0113】
図17は、階層クラスタ法の一例を示す第1の図である。階層クラスタ法は、最も似ている組み合わせから順番にまとまり(クラスタ)にしていく方法である。階層クラスタ法では、途中過程を階層のように表していくことで、最終的にデンドログラムを生成することができる。
図17例では、AからEの5つのキーワードのクラスタリングを行っている。
【0114】
〔ステップS61〕AからEの各キーワードの意味を示すベクトルに応じた点が、座標上にプロットされている。AからEの点で最も距離の近い組み合わせはAとDである。よって、AとDが1つのクラスタ(AD)にまとめられる。そして、このクラスタ(AD)内の2点の代表点(例えば重心)が求められる。
図17において(AD)の代表点を×印で示している。デンドログラムでは、AとDが線で接続される。AとDを接続する線の横線部分の高さは、座標上でのAとDとの距離に応じた高さである。
【0115】
図18は、階層クラスタ法の一例を示す第2の図である。
〔ステップS62〕(AD)の代表点、B、C、Eの4点で、最も距離の近い組み合わせが探索される。
図18の例では、BとCが最も近い。そこでBとCをまとめたクラスタ(BC)が生成される。そしてクラスタ(BC)の代表点が求められる。
図18において(BC)の代表点を×印で示している。デンドログラムでは、BとCが線で接続される。BとCを接続する線の横線部分の高さは、座標上でのBとCとの距離に応じた高さである。
【0116】
〔ステップS63〕(AD)の代表点、(BC)の代表点、Eの3点で最も距離の近い組み合わせが探索される。ここでは(AB)の代表点と(CD)の代表点が最も近い。そこで、(AB)と(CD)をまとめたクラスタ(ABCD)が生成される。そしてクラスタ(ABCD)の代表点が求められる。
図18において(ABCD)の代表点を×印で示している。デンドログラムでは、(AD)と(BC)が線で接続される。(AD)と(BC)を接続する線の横線部分の高さは、座標上での(AD)と(BC)との距離に応じた高さである。
【0117】
図19は、階層クラスタ法の一例を示す第3の図である。
〔ステップS64〕最後にクラスタ(ABCD)とEをまとめるとデンドログラムd2のようになる。このデンドログラムd2では、A~Eのキーワード、または複数のキーワードをまとめたクラスタ間を接続する線の横線部分の高さが、キーワードまたはクラスタ間の距離を表す。
【0118】
<上位概念のキーワードへの置き換え>
サブトピックに対応するキーワード数が閾値を超えた場合、デンドログラムを用いて、キーワード数が閾値以下となるようにキーワードの統合が行われる。その際、統合されたキーワードが、それらのキーワードの概念を包含する概念のキーワードに置き換えられる。
【0119】
図20は、キーワード統合による上位概念のキーワードへの置き換えの一例を示す図である。
図20には、下位概念のキーワードとその上位概念のキーワードとの関係を表す辞書データt1が示されている。辞書データt1では、下位概念のキーワードからそのキーワードの上位概念のキーワードへ向けて矢印が示されている。例えば「協調」と「協働」の上位概念は「協力」である。また「情報共有」と「連絡」の上位概念は「コミュニケーション」である。さらに「協力」と「コミュニケーション」の上概念は「コラボレーション」である。
【0120】
図20には一例として小規模な辞書データt1を示しているが、キーワード統合部11iは、様々なキーワード間の概念の上下関係を示す大規模な辞書データを有する。そして複数のキーワードを統合することが決まった場合、キーワード統合部11iは、サブトピック・キーワード対応管理テーブルT11-1における統合対象のキーワードを、それらのキーワードの概念の包含する1つのキーワードに置き換える。キーワード統合部11iは、置き換えた後のキーワードの出現頻度として、統合されたキーワードそれぞれの出現頻度の合計を設定する。またキーワード統合部11iは、キーワードを統合したサブトピックのキーワード数を更新する。
【0121】
統合されたキーワードが回答の選択肢に決定された場合、上位概念のキーワードが選択肢としてアンケート画面に表示される。その際、上位概念のキーワードについてどのようなキーワードが統合されたのかをアンケート画面に表示してもよい。例えば「協調」と「協働」を統合した「協力」が選択肢に決定された場合、アンケート画面における選択肢を「協力(協調、協働を含む)」とすることができる。
【0122】
<第2の実施の形態の効果>
第2の実施の形態では、サブトピックに対応するキーワード数が増えすぎた場合に、キーワードを統合して、キーワード数を所定数以下に抑えることができる。これにより、自由記述欄による回答から抽出されたキーワードが多種多様であっても、意味的に近いキーワード同士が統合され、所定数のキーワードにまとめられる。その結果、アンケート画面に表示される選択肢の数を増やすことなく、回答者が選択肢を選択することで回答できる可能性を高めることができる。
【0123】
[第3の実施の形態]
第3の実施の形態は、サブトピックに対応する回答の選択肢として、肯定的(ポジティブ)、否定的(ネガティブ)、中立的(ニュートラル)それぞれの選択肢を用意するものである。
【0124】
<選択肢の分類>
アンケート画面には、アンケート実施者が設定したサブトピックそれぞれに対応する選択肢がリスティングされる。また同じサブトピックに関する選択肢であっても、肯定的、否定的、中立的な意見が存在しうる。意見が肯定的か、否定的か、中立的かといった情報は評価極性と呼ばれる。設問への回答の選択肢を評価極性ごとに分類してアンケート画面にリスティングして回答者に回答させることで、アンケート実施者は回答の集計効率を高めることができる。
【0125】
以下、第3の実施の形態における第1の実施の形態との相違点について説明する。第3の実施の形態において第1の実施の形態と同じ機能を有する要素には第1の実施の形態と同じ符号を付し、その説明を省略する。
【0126】
<機能ブロック>
図21は、第3の実施の形態における情報処理装置の機能の一例を示すブロック図である。第3の実施の形態の情報処理装置10-2は、制御部11-2と記憶部12-2とを有する。制御部11-2は、サブトピック設定部11a、設問・選択肢出力部11b、回答収集部11c、主要文抽出部11j、サブトピック分類部11e、出現頻度計数部11f、選択肢生成部11g、および評価極性判定部11kを有する。
【0127】
主要文抽出部11jは、自由記述欄に記述された回答から主要文を抽出する。主要文は、文章全体の意図を反映する文である。なお、主要文には、意見の結論を示すため、評価極性を持つ名詞が使用されることが想定される。そこで、例えば主要文抽出部11jは、予め用意された評価極性辞書に評価極性が示されているキーワードを含む文を、主要文とする。評価極性辞書とは、評価極性を持つ名詞に対して評価局性情報を付与した辞書データである。
【0128】
第3の実施の形態における出現頻度計数部11fは、抽出された主要文を、その主要文のサブトピックに対応付けて、サブトピック・主要文対応管理DB12b-2に格納する。また出現頻度計数部11fは、サブトピックに対応する主要文の出現頻度を計数する。
【0129】
評価極性判定部11kは、サブトピックごとの主要文の評価極性を判定する。例えば評価極性判定部11kは、主要文の形態素解析を行い、形態素から基本形を抽出する。次に評価極性判定部11kは、基本形で評価極性辞書を辞書引きし、ラベルに従って肯定/否定/中立を判定する。
【0130】
選択肢生成部11gは、サブトピックそれぞれについて、出現頻度が高い方から所定数の主要文を、選択肢に決定する。なお選択肢生成部11gは、アンケート実施者が、選択肢とする評価極性を指定している場合、指定された評価極性の主要文のうち、出現頻度が高い方から所定数の主要文を、選択肢に決定する。例えば評価極性「肯定」が指定されている場合、選択肢生成部11gは、評価極性「肯定」の主要文のうちの出現頻度が高い方から所定数の主要文を選択肢とする。
【0131】
記憶部12-2は、設問・選択肢管理DB12aとサブトピック・主要文対応管理DB12b-2とを有する。サブトピック・主要文対応管理DB12b-2は、サブトピックごとに、そのサブトピックに関する回答から抽出された主要文が登録されたデータベースである。
【0132】
図22は、サブトピック・主要文対応管理DBの一例を示す図である。サブトピック・主要文対応管理DB12b-2には、例えばサブトピック・主要文対応管理テーブルT11-2が格納されている。サブトピック・主要文対応管理テーブルT11-2には、サブトピックに対応付けて、そのサブトピックについての自由記述欄の回答から抽出された主要文と、その主要文の出現頻度とが設定されている。サブトピック・主要文対応管理テーブルT11-2に設定された主要文のうち、サブトピックごとに、出現頻度が多い所定数の主要文が、設問への回答の選択肢に決定される。
【0133】
<アンケートの回答収集および選択肢更新処理手順>
図23は、第3の実施の形態におけるアンケートの回答収集および選択肢更新処理の手順の一例を示すフローチャートである。
図23に示す処理のうち、ステップS71~S76の処理は、それぞれ
図7に示したフローチャートのステップS11~S16の処理と同様である。以下、ステップS77以降の処理について、ステップ番号に沿って説明する。
【0134】
〔ステップS77〕主要文抽出部11jは、自由記述欄に記載された回答から主要文を抽出する。例えばキーワード抽出部11dは、自由記述欄に記載された文章を解析して、文章に含まれる複数の文のうち、文章全体の意図が最も強く反映された文を主要文とする。
【0135】
〔ステップS78〕サブトピック分類部11eは、自由記述欄から抽出したキーワードを、設定されたサブトピックのいずれかに分類する。
〔ステップS79〕出現頻度計数部11fは、抽出した主要文を分類先のサブトピックに対応付け、そのサブトピック内での該当キーワードの出現頻度を計数する。例えば出現頻度計数部11fは、サブトピック・主要文対応管理テーブルT11-2において、分類先のサブトピックに対応付けて抽出した主要文が登録されていない場合、該当サブトピックに対応付けて、抽出した主要文を登録する。その際、出現頻度計数部11fは、登録した主要文の出現頻度に1を設定する。また出現頻度計数部11fは、サブトピック・主要文対応管理テーブルT11-2において、分類先のサブトピックに対応付けて、抽出した主要文が登録されてる場合、該当主要文の出現頻度に1を加算する。
【0136】
〔ステップS80〕評価極性判定部11kは、サブトピック・主要文対応管理テーブルT11-2に登録されている主要文それぞれの評価極性を判定する。例えば評価極性判定部11kは、評価極性辞書において肯定的(ポジティブ)であるとされている単語が主要文に含まれる場合、その主要文の評価極性を「肯定的」と判定する。また評価極性判定部11kは、評価極性辞書において否定的(ネガティブ)であるとされている単語が主要文に含まれる場合、その主要文の評価極性を「否定的」と判定する。さらに評価極性判定部11kは、評価極性辞書において中立的(ニュートラル)であるとされている単語が主要文に含まれる場合、その主要文の評価極性を「中立的」と判定する。評価極性判定部11kは、評価極性を判定した主要文に、その主要文の評価極性を示す情報を付与する。
【0137】
〔ステップS81〕選択肢生成部11gは、サブトピックごとの選択肢を決定する。例えば選択肢生成部11gは、サブトピック・主要文対応管理テーブルT11-2において、サブトピックそれぞれについて、対応する主要文のうち出現頻度が多い方から所定数の主要文を選択肢に決定する。
【0138】
なお肯定的回答、否定的回答、中立的回答のいずれが知りたいかについて、アンケート実施者が予め設定していた場合、選択肢生成部11gは、アンケート実施者が設定した評価極性の主要文の中から選択肢を決定してもよい。例えばアンケート実施者が肯定的回答を知りたいと設定していた場合、選択肢生成部11gは、評価極性が肯定的とされた主要文のうち、出現頻度が多い方から所定数の主要文を選択肢に決定する。
【0139】
〔ステップS82〕選択肢生成部11gは、サブトピックごとに追加する選択肢を更新する。例えば選択肢生成部11gは、設問・選択肢管理テーブルT21のサブトピック別追加選択肢の欄の内容を、ステップS81で選択肢として決定した主要文(評価極性を示す情報を含む)に更新する。すなわち、それ以前にサブトピック別追加選択肢の欄に設定されていた主要文は削除され、ステップS81で選択肢として決定した主要文に変更される。その後、処理がステップS74に進められる。
【0140】
その後の設問・選択肢提示処理(ステップS74)では、設問に対する回答の選択肢が、評価極性によって分類してアンケート画面に表示される。
図24は、第3の実施の形態のアンケート画面の一例を示す図である。アンケート画面30-3において、選択肢が肯定選択肢30e1、否定選択肢30e2および中立選択肢30e3と分類されて示されている。
【0141】
設問である「施策により変化したことはなんですか?」に対して、肯定選択肢30e1には、「(1)コミュニケーションが増えた」および「(2)上司とのコミュニケーションが増えた」という肯定的な意味の選択肢が示されている。また、否定選択肢30e2には、「(3)同僚との会話が減った」および「(4)仕事量が増えた」という否定的な意味の選択肢が示されている。さらに、中立選択肢30e3には、「(5)特に今までと変わりはない」という中立的な意味の選択肢が示されている。
【0142】
<第3の実施の形態の効果>
このように、肯定的回答、否定的回答、中立的回答が分類されてアンケート画面に表示されることにより、アンケート実施者は、肯定的、否定的、中立的な意見を容易に拾い上げることができ、集計効率を向上させることができる。
【0143】
なお評価極性の判定に関する技術は、例えば「乾 孝司, 奥村 学、”テキストを対象とした評価情報の分析に関する研究動向”、自然言語処理、13巻(2006)3号、pp.201-241、2006/07/10」に開示されている。
【0144】
[その他の実施の形態]
第3の実施の形態では、自由記述欄の回答から主要文を抽出して、主要文を文章のまま選択肢としているが、主要文に含まれる特徴的なキーワードを選択肢としてもよい。
【0145】
以上、実施の形態を例示したが、実施の形態で示した各部の構成は同様の機能を有する他のものに置換することができる。また、他の任意の構成物や工程が付加されてもよい。さらに、前述した実施の形態のうちの任意の2以上の構成(特徴)を組み合わせたものであってもよい。
【符号の説明】
【0146】
10 情報処理装置
11 制御部
12 記憶部
2-1、2-2 アンケート画面
2a1、2a2 選択肢
2b 自由記述欄
30,31,・・・ 回答者端末
N1 ネットワーク
T1 管理テーブル