IP Force 特許公報掲載プロジェクト 2022.1.31 β版

知財求人 - 知財ポータルサイト「IP Force」

▶ 国立大学法人 筑波大学の特許一覧 ▶ アイブリッジ株式会社の特許一覧

特開2023-28997不適切回答検出方法及びそのシステム、並びにそのプログラム
<>
  • 特開-不適切回答検出方法及びそのシステム、並びにそのプログラム 図1
  • 特開-不適切回答検出方法及びそのシステム、並びにそのプログラム 図2
  • 特開-不適切回答検出方法及びそのシステム、並びにそのプログラム 図3
  • 特開-不適切回答検出方法及びそのシステム、並びにそのプログラム 図4
  • 特開-不適切回答検出方法及びそのシステム、並びにそのプログラム 図5
< >
(19)【発行国】日本国特許庁(JP)
(12)【公報種別】公開特許公報(A)
(11)【公開番号】P2023028997
(43)【公開日】2023-03-03
(54)【発明の名称】不適切回答検出方法及びそのシステム、並びにそのプログラム
(51)【国際特許分類】
   G06Q 30/0203 20230101AFI20230224BHJP
【FI】
G06Q30/02 312
【審査請求】有
【請求項の数】19
【出願形態】OL
(21)【出願番号】P 2021135037
(22)【出願日】2021-08-20
(71)【出願人】
【識別番号】504171134
【氏名又は名称】国立大学法人 筑波大学
(71)【出願人】
【識別番号】500391763
【氏名又は名称】アイブリッジ株式会社
(74)【代理人】
【識別番号】110001737
【氏名又は名称】弁理士法人スズエ国際特許事務所
(72)【発明者】
【氏名】尾▲碕▼ 幸謙
【テーマコード(参考)】
5L049
【Fターム(参考)】
5L049BB02
(57)【要約】
【課題】 様々な調査に適用でき、不適切回答の検出精度を向上させた不適切回答検出方法及びそのシステム、並びにそのプログラムを提供することにある。
【解決手段】 本実施形態に係る不適切回答検出方法は、複数の回答データを取得し、対象回答データの回答に要した回答時間を取得し(S101)、対象回答データの複数のリッカート尺度項目に対して、同じ回答カテゴリを連続して選択した回数を求め(S102)、対象回答データの複数のリッカート尺度項目に対する回答カテゴリに基づいて、対象回答データの傾向を示す数値を求め(S103)、対象回答データの複数のリッカート尺度項目に対する複数のマハラノビス距離を演算し(S104)、複数の回答データのそれぞれの回答に要した回答時間の代表値を演算し(S105)、調査の項目数を取得して(S106)、対象回答データの回答が不適切であることを検出する(S107)。
【選択図】図2
【特許請求の範囲】
【請求項1】
複数のリッカート尺度項目を含む調査の複数の回答データを取得し、
前記複数の回答データのうち不適切回答を検出する対象回答データの回答に要した回答時間を取得し、
前記対象回答データの前記複数のリッカート尺度項目に対して、同じ回答カテゴリを連続して選択した回数を求め、
前記対象回答データの前記複数のリッカート尺度項目に対する回答カテゴリに基づいて、前記対象回答データの傾向を示す数値を求め、
前記対象回答データの前記複数のリッカート尺度項目に対する複数のマハラノビス距離を演算し、
前記複数の回答データのそれぞれの回答に要した回答時間の代表値を演算し、
前記調査の項目数を取得し、
前記回答時間、前記回数、前記傾向を示す数値、前記複数のマハラノビス距離、前記代表値、及び、前記項目数に基づいて、前記対象回答データの回答が不適切であることを検出すること
を含むことを特徴とする不適切回答検出方法。
【請求項2】
前記傾向を示す数値は、前記対象回答データの連続するリッカート尺度項目に対して、回答カテゴリが1つずつずらして選択された回数であること
を特徴とする請求項1に記載の不適切回答検出方法。
【請求項3】
前記傾向を示す数値は、前記対象回答データにおいて、a個の回答カテゴリがあるリッカート尺度項目に対して、b個の回答カテゴリのみに回答している割合が所定値以上か否かを示し、aは2以上であり、bはa未満であること
を特徴とする請求項1に記載の不適切回答検出方法。
【請求項4】
前記傾向を示す数値は、前記複数の回答データの各リッカート尺度項目の回答カテゴリの平均と前記対象回答データの各リッカート尺度項目の回答カテゴリとのそれぞれの乖離を合計した合計乖離値であること
を特徴とする請求項1に記載の不適切回答検出方法。
【請求項5】
前記調査は、自由記述回答項目を含み、
前記対象回答データの前記自由記述回答項目に対する自由記述回答の文字数に基づいて、前記対象回答データの回答が不適切であることを検出すること
を特徴とする請求項1に記載の不適切回答検出方法。
【請求項6】
前記調査は、自由記述回答項目を含み、
前記対象回答データの前記自由記述回答項目に対する自由記述回答に含まれるポジティブな単語のポジティブスコアに基づいて、前記対象回答データの回答が不適切であることを検出すること
を特徴とする請求項1に記載の不適切回答検出方法。
【請求項7】
前記ポジティブスコアは、前記自由記述回答の中で最も高いポジティブスコアであること
を特徴とする請求項6に記載の不適切回答検出方法。
【請求項8】
前記調査は、自由記述回答項目を含み、
前記対象回答データの前記自由記述回答項目に対する自由記述回答に含まれるポジティブな単語の文字数であるポジティブ文字数に基づいて、前記対象回答データの回答が不適切であることを検出すること
を特徴とする請求項1に記載の不適切回答検出方法。
【請求項9】
前記調査は、自由記述回答項目を含み、
前記対象回答データの前記自由記述回答項目に対する自由記述回答に含まれるネガティブな単語のネガティブスコアに基づいて、前記対象回答データの回答が不適切であることを検出すること
を特徴とする請求項1に記載の不適切回答検出方法。
【請求項10】
前記ネガティブスコアは、前記自由記述回答の中で最も高いネガティブスコアであること
を特徴とする請求項9に記載の不適切回答検出方法。
【請求項11】
前記調査は、自由記述回答項目を含み、
前記対象回答データの前記自由記述回答項目に対する自由記述回答に含まれるネガティブな単語の文字数であるネガティブ文字数に基づいて、前記対象回答データの回答が不適切であることを検出すること
を特徴とする請求項1に記載の不適切回答検出方法。
【請求項12】
前記調査は、自由記述回答項目を含み、
前記対象回答データの前記自由記述回答項目に対して自由記述回答をしたか否かに基づいて、前記対象回答データの回答が不適切であることを検出すること
を特徴とする請求項1に記載の不適切回答検出方法。
【請求項13】
前記調査は、自由記述回答項目を含み、
前記対象回答データの前記自由記述回答項目に対して実質的な内容を含まない特定の文章で回答したか否かに基づいて、前記対象回答データの回答が不適切であることを検出すること
を特徴とする請求項1に記載の不適切回答検出方法。
【請求項14】
機械学習による学習済みモデルを用いて、前記対象回答データの回答が不適切であることを検出すること
を含むことを特徴とする請求項1に記載の不適切回答検出方法。
【請求項15】
複数のリッカート尺度項目を含む調査の複数の回答データを記憶する回答データ記憶手段と、
前記回答データ記憶手段に記憶された前記複数の回答データのうち不適切回答を検出する対象回答データの回答に要した回答時間を取得する回答時間取得手段と、
前記対象回答データの前記複数のリッカート尺度項目に対して、同じ回答カテゴリを連続して選択した回数を演算する回数演算手段と、
前記対象回答データの前記複数のリッカート尺度項目に対する回答カテゴリに基づいて、前記対象回答データの傾向を示す数値を演算する回答傾向演算手段と、
前記対象回答データの前記複数のリッカート尺度項目に対する複数のマハラノビス距離を演算するマハラノビス距離演算手段と、
前記複数の回答データのそれぞれの回答に要した回答時間の代表値を演算する代表値演算手段と、
前記調査の項目数を取得する項目数取得手段と、
前記回答時間取得手段により取得された前記回答時間、前記回数演算手段により演算された前記回数、前記回答傾向演算手段により演算された前記傾向を示す数値、前記マハラノビス距離演算手段により演算された前記複数のマハラノビス距離、前記代表値演算手段により演算された前記代表値、及び、前記項目数取得手段により取得された前記項目数に基づいて、前記対象回答データの回答が不適切であることを検出する検出手段と
を備えることを特徴とする不適切回答検出システム。
【請求項16】
コンピュータが、複数のリッカート尺度項目を含む調査の複数の回答データを取得し、
前記コンピュータが、前記複数の回答データのうち不適切回答を検出する対象回答データの回答に要した回答時間を取得し、
前記コンピュータが、前記対象回答データの前記複数のリッカート尺度項目に対して、同じ回答カテゴリを連続して選択した回数を求め、
前記コンピュータが、前記対象回答データの前記複数のリッカート尺度項目に対する回答カテゴリに基づいて、前記対象回答データの傾向を示す数値を求め、
前記コンピュータが、前記対象回答データの前記複数のリッカート尺度項目に対する複数のマハラノビス距離を演算し、
前記コンピュータが、前記複数の回答データのそれぞれの回答に要した回答時間の代表値を演算し、
前記コンピュータが、前記調査の項目数を取得し、
前記コンピュータが、前記回答時間、前記回数、前記傾向を示す数値、前記複数のマハラノビス距離、前記代表値、及び、前記項目数に基づいて、前記対象回答データの回答が不適切であることを検出すること
を含むように機能させることを特徴とする不適切回答検出プログラム。
【発明の詳細な説明】
【技術分野】
【0001】
本発明の実施形態は、不適切回答を検出する不適切回答検出方法に関する。
【背景技術】
【0002】
一般に、調査において、不良回答を減らすことが知られている。例えば、不良回答を減らしてより多くの優良回答を効率的に収集することが開示されている(特許文献1参照)。
【先行技術文献】
【特許文献】
【0003】
【特許文献1】特開2016-95656号公報
【発明の概要】
【発明が解決しようとする課題】
【0004】
しかしながら、調査毎に調査内容は異なるため、全ての調査に適用できるような不適切回答の検出方法は知られていない。
本発明の目的は、様々な調査に適用でき、不適切回答の検出精度を向上させた不適切回答検出方法及びそのシステム、並びにそのプログラムを提供することにある。
【課題を解決するための手段】
【0005】
本発明の観点に従った不適切回答検出方法は、複数のリッカート尺度項目を含む調査の複数の回答データを取得し、前記複数の回答データのうち不適切回答を検出する対象回答データの回答に要した回答時間を取得し、前記対象回答データの前記複数のリッカート尺度項目に対して、同じ回答カテゴリを連続して選択した回数を求め、前記対象回答データの前記複数のリッカート尺度項目に対する回答カテゴリに基づいて、前記対象回答データの傾向を示す数値を求め、前記対象回答データの前記複数のリッカート尺度項目に対する複数のマハラノビス距離を演算し、前記複数の回答データのそれぞれの回答に要した回答時間の代表値を演算し、前記調査の項目数を取得し、前記回答時間、前記回数、前記傾向を示す数値、前記複数のマハラノビス距離、前記代表値、及び、前記項目数に基づいて、前記対象回答データの回答が不適切であることを検出することを含む。
【発明の効果】
【0006】
本発明によれば、様々な調査に適用でき、不適切回答の検出精度を向上させた不適切回答検出方法及びそのシステム、並びにそのプログラムを提供することができる。
【図面の簡単な説明】
【0007】
図1】本発明の第1実施形態に係る調査システムの構成を示す構成図。
図2】本実施形態に係る調査システムに適用される不適切回答検出方法の手順を示すフロー図。
図3】本実施形態に係るアンケートの各質問に対する回答者の合計乖離値に関する各種数値を示す概略図。
図4】本実施形態に係る不適切回答予測モデルを機械学習により構築する方法を示す概念図。
図5】第2実施形態に係る不適切回答検出方法に用いる説明変数を作成する手順を示すフロー図。
【発明を実施するための形態】
【0008】
(第1実施形態)
図1は、本発明の第1実施形態に係る調査システム1の構成を示す構成図である。なお、図面における同一部分には同一符号を付して、重複する説明を適宜省略する。
【0009】
調査システム1は、ネットワークNTを介して、調査を実施し、回答を収集するシステムである。調査システム1は、アンケートについて収集した回答データに対して、不適切な回答を検出する不適切回答検出機能を有する。なお、不適切回答検出機能は、どのようなシステムに適用してもよく、調査を行う機能を有していなくてもよい。また、不適切回答検出機能のみを有するシステムが構成されてもよい。
【0010】
回答者端末2は、調査システム1が行うアンケートに回答するために、回答者が使用する端末である。回答者端末2は、主にコンピュータで構成される。例えば、回答者端末2は、デスクトップ、ラップトップ、又は、タブレット等、どのようなタイプのコンピュータでもよいし、スマートフォン等の携帯電話でもよい。
【0011】
例えば、ネットワークNTは、インタネット、固定電話網、又は、移動電話網等であり、これらを組合せてもよいし、その他の通信網を使用してもよい。また、調査システム1は、調査に回答する回答者端末2と相互に通信可能であれば、どのような通信経路に接続されてもよい。
【0012】
調査システム1は、アンケート生成部11、アンケート回答部12、回答データ集計部13、適否判断部14、入力部15、出力部16、調査データ記憶部ST1、及び、回答データ記憶部ST2を備える。
【0013】
調査システム1は、主にコンピュータで構成される。例えば、コンピュータは、Webサーバである。コンピュータは、1つに限らず、ネットワークで構成されてもよい。なお、調査システム1は、アンケート生成部11、アンケート回答部12、及び、調査データ記憶部ST1を設けずに、アンケートの回答データを回答データ記憶部ST2に直接入力するようにしてもよい。
【0014】
アンケート生成部11は、調査データ記憶部ST1に記憶された調査に関するデータに基づいて、調査を実施するための質問が記載されたアンケートフォームFmを生成する。アンケート生成部11は、生成したアンケートフォームFmを外部からアクセス可能な状態に開示する。例えば、アンケート生成部11は、WebサイトにアンケートフォームFmを表示する。
【0015】
アンケート回答部12は、回答者端末2による回答データを受信する処理を行う。アンケート回答部12は、ネットワークNTを経由して回答者端末2から入力されたデータを、入力部15を介して受信する。アンケート回答部12は、受信したデータに基づいて、回答データを生成し、回答データ記憶部ST2に記録する。例えば、回答者は、Webサイトに表示されたアンケートフォームFmの入力欄に回答し、アンケート回答部12は、入力欄に入力されたデータを受け付ける。アンケート回答部12は、受け付けたデータに基づいて、回答データを生成する。
【0016】
回答データ集計部13は、回答データ記憶部ST2に記憶された複数の回答データを集計する。回答データ集計部13は、集計したデータを適否判断部14に送信する。集計する複数の回答データは、1回の調査に対する全ての回答データであるが、一部の回答データが含まれていなくてもよい。例えば、調査が継続中である場合は、集計が行われる時点で回答データ記憶部ST2に記憶されている回答データのみで、集計が行われてもよい。また、不適切であるか否かを判断する対象となる回答データDiを取り除いて、残りの回答データで集計が行われてもよい。
【0017】
適否判断部14は、予め決められた判定条件及び回答データ集計部13により集計されたデータに基づいて、選択された回答データDiが不適切であるか否か判断する。適否判断部14は、判断した回答データDiの適否を出力部16に出力する。
【0018】
入力部15は、例えば、回答者端末2からデータを受信するために、ネットワークNTと接続するためのネットワークインタフェースである。なお、入力部15は、調査システム1にアンケートの回答データを直接するための入力機器でもよい。例えば、このような入力機器は、キーボード、マウス、データ入力が可能なディスプレイ、又は、各種メディアの読取部などである。
【0019】
出力部16は、適否判断部14により判断された回答データDiの適否を提示する。例えば、出力部16は、ディスプレイへの表示、プリンタの印刷、又は、各種メディアへの書き込みをする。
【0020】
次に、調査で行われるアンケートの項目について説明する。アンケートの項目は、回答データDiが不適切であるか否か判断するために用いる説明変数を求めるための質問項目である。
【0021】
アンケートは、リッカート尺度形式の項目(以下、「リッカート尺度項目」という。)を複数含む。リッカート尺度項目は、質問に対して、段階的に分類された複数の選択肢の中から1つを選んで回答する形式の項目である。選択肢は、多くは3つ以上であるが、2つでもよい。例えば、リッカート尺度項目は、商店のサービスについて調査をするためのアンケートにおいて、「1.満足」、「2.やや満足」、「3.どちらともいえない」、「4.やや不満」、「5.不満」の5つの選択肢から1つを選ばせる回答形式の質問項目である。
【0022】
また、アンケートは、属性変数についての項目、及び、自由記述回答項目を含めてもよい。属性変数についての項目は、回答者に対して、性別、年齢、又は、婚姻状況(例えば、配偶者の有無)等の回答を求める質問項目である。自由記述回答項目は、回答者が自由に回答を記述する形式の質問項目である。
【0023】
図2は、本実施形態に係る調査システム1に適用される不適切回答検出方法の手順を示すフロー図である。
【0024】
適否判断部14は、回答データDiの回答者がアンケートの回答に要した回答時間を求める(ステップS101)。例えば、アンケートがコンピュータのプログラムにより実行される場合(Webサイト上のアンケート等)、アンケートを開始する操作してから、アンケートを終了する操作をするまでの時間を回答時間としてもよい。例えば、開始又は終了する操作は、画面に表示されたボタンの押下である。
【0025】
適否判断部14は、回答データDiにおいて、リッカート尺度の同じ回答カテゴリを連続して選択した回数を求める(ステップS102)。具体的には、ある質問項目の回答が1番から5番まである5つの選択肢のうち3番である場合、この質問項目の前の質問項目の回答も3番であれば、1回とカウントする。このようにして、最終のリッカート尺度項目の回答までカウントした回数がここで求める回数となる。
【0026】
なお、ここで説明した回数のカウントの仕方は一例であり、プログラム等において、条件等に応じて1回に限らず、2回又は3回以上の回数でカウントしてもよい。以降の回数のカウントの仕方についても同様である。
【0027】
適否判断部14は、回答データDiのリッカート尺度項目の回答カテゴリの傾向を示す変数を求める(ステップS103)。ここで、回答カテゴリの傾向を示す変数は、以下で説明するように大きく分けて3つあるが、少なくとも1つの変数を求めれば、いくつ求めてもよく、全ての変数を求めてもよい。求める変数によっては、一部の演算が回答データ集計部13で行われ、適否判断部14は、回答データ集計部13の演算結果を用いて、目的の変数を求めてもよい。なお、以降で説明する変数に限らず、リッカート尺度項目の回答カテゴリの傾向を示すような変数であれば、どのような変数を求めてもよい。
【0028】
1つ目の変数は、回答データDiの連続するリッカート尺度項目に対して、回答カテゴリが1つずつずらして選択された回数である。即ち、この変数は、連続するリッカート尺度項目に対する回答カテゴリがジグザグに選択された回数である。具体的には、ある質問項目の回答が5つの選択肢のうち3番である場合、この質問項目の前の質問項目の回答が2番か4番であれば、1回とカウントする。このようにして、最終のリッカート尺度項目の回答までカウントした回数がここで求める変数となる。
【0029】
2つ目の変数は、a個の回答カテゴリがあるリッカート尺度項目に対して、b個以下の回答カテゴリに回答している割合が所定値以上か否かを示す。ここで、aは2以上であり、bはa未満である。
【0030】
所定値が100%の場合、この変数は、b個以下の回答カテゴリのみに回答しているか否かを示す。具体例として、回答データDiにおいて、全てのリッカート尺度項目に対して、1番から5番の5つの回答カテゴリのうち、2番、3番又は4番の3つの回答カテゴリのみに回答していた場合について説明する。
【0031】
b=3の場合、この条件を満たすため、この変数は、この条件を満たすことを示す「1」に設定する。b=2の場合、この条件を満たさないため、この変数は、この条件を満たさないことを示す「0」に設定する。
【0032】
次に、所定値が90%であり、回答データDiにおいて、10個のリッカート尺度項目のうち9個のリッカート尺度項目に対しては、1番から5番の5つの回答カテゴリのうち、2番、3番又は4番の3つの回答カテゴリに回答し、残りの1個のリッカート尺度項目に対しては、1番の回答カテゴリに回答していた場合について説明する。
【0033】
b=3の場合、この条件を満たすため、この変数は、この条件を満たすことを示す「1」に設定する。b=2の場合、この条件を満たさないため、この変数は、この条件を満たさないことを示す「0」に設定する。
【0034】
なお、変数に設定する数値は、「0」と「1」を逆に設定してもよいし、これら以外の数値(例えば、正の数と負の数)を用いてもよい。また、この変数は、複数の条件に対応して、複数設けられてもよい。例えば、所定値が100%と90%のそれぞれについて、a=3かつb=2の場合とa=4かつb=3の場合の合計4つの変数が設けられてもよい。
【0035】
3つ目の変数は、複数の回答データにより集計された各リッカート尺度項目の回答カテゴリの平均と回答データDiの各リッカート尺度項目の回答カテゴリとの乖離を合計した合計乖離値である。例えば、各リッカート尺度項目の回答カテゴリの平均は、回答データ集計部13で演算され、その他の演算は、適否判断部14で行われる。
【0036】
図3は、アンケートの各質問Q1~Q3に対する回答者P1,P2,P3,P4,P5の合計乖離値に関する各種数値を示す概略図である。
【0037】
アンケートには、リッカート尺度項目として3つの質問Q1,Q2,Q3がある。各質問Q1~Q3に対して、選択肢である回答カテゴリは5つある。各回答カテゴリは、段階的に変化する内容に対応して、1~5のいずれかに数値化されている。
【0038】
まず、各質問Q1~Q3の平均を演算する。質問1に対して、各回答者P1~P5の回答カテゴリの数値は、それぞれ2、3、3、4、4である。したがって、質問Q1の平均は、3.2である。同様に、質問Q1,Q2のそれぞれの平均は、4、2.4となる。
【0039】
次に、各回答者P1~P5の各質問Q1~Q3に対する回答カテゴリの乖離を演算する。乖離は、質問Q1~Q3の平均と回答者P1~P5の回答カテゴリの数値との差分の絶対値である。回答者P1の質問Q1に対する回答カテゴリの数値は、2であり、質問Q1の平均は、3.2である。回答者P1の質問Q1に対する回答カテゴリの乖離は、2-3.2の絶対値で1.2になる。このようにして、各回答者P1~P5の各質問Q1~Q3に対する回答カテゴリの乖離を演算する。
【0040】
回答者P1の各質問Q1~Q3に対する回答カテゴリのそれぞれの乖離は、1.2、1、0.4である。回答者P1の合計乖離値は、各質問Q1~Q3に対する回答カテゴリの乖離の合計であり、2.6である。このようにして、各回答者P1~P5の合計乖離値を演算する。
【0041】
適否判断部14は、回答データDiのリッカート尺度項目に対するマハラノビス距離を演算する(ステップS104)。なお、適否判断部14は、リッカート尺度項目に対するマハラノビス距離のp値を演算してもよい。また、アンケート内において最も相関の大きい1対のリッカート尺度項目用いて、マハラノビス距離を演算してもよいし、このマハラノビス距離のp値を演算してもよい。相関のある1対のリッカート尺度項目とは、互いに質問内容が関連する2つのリッカート尺度項目である。
【0042】
ここで、マハラノビス距離について説明する。マハラノビス距離は、観測データベクトルと標本平均ベクトルとの離れ具合を表す統計量である。マハラノビス距離は、次式により求まる。
【0043】
【数1】
【0044】
図3に示すように、リッカート尺度項目が全部で3項目(質問Q1~Q3)である場合、3項目を使用して、回答データDiのマハラノビス距離を演算する。上式のxiは、iが回答者P1の場合に(2,3,2)というベクトルになる。平均ベクトルは、(3.2,4,2.4)となる。共分散行列Σは、図3の左の5×3のデータ行列から計算される共分散行列(3×3)である。この計算により、各回答者P1~P5に対して1つのマハラノビス距離が与えられる。マハラノビス距離のp値は、このように計算されたマハラノビス距離の大きさに対する検定結果のp値である。
【0045】
回答データ集計部13は、回答データDiが取得された調査における全ての回答データの回答時間の代表値を求める(ステップS105)。代表値は、例えば中央値であるが、平均値又は最頻値でもよいし、その他のどのような統計量を用いてもよい。ここでは、代表値は、中央値として説明する。例えば、ある調査に5人が回答し、回答時間が10分、15分、12分、14分、19分だったとする。このとき、この調査における回答時間の中央値は14分である。したがって、この調査の全ての回答データの回答時間の中央値は、14に設定される。このように、回答時間の中央値は、調査毎に異なる値に設定される。回答データ集計部13は、求めた回答時間の中央値を適否判断部14に送信する。
【0046】
適否判断部14は、回答データDiが取得されたアンケートの質問項目数を取得する(ステップS106)。例えば、ある調査を実施するためのアンケートに記載された全ての質問項目数が100項目であれば、この調査の全ての回答データの質問項目数は、100に設定される。このように、質問項目数は、調査毎に異なる値に設定される。
【0047】
適否判断部14は、上記で求めた数値及び変数等を含む各種情報を説明変数として、対象の回答データiが不適切か否かを判断する(ステップS107)。説明変数には、属性変数、及び、自由記述回答項目から得られる情報が含まれてもよい。例えば、適否判断部14は、調査内容に対応し、回答データiが不適切か否かを判断するための判断用関数を決定する。適否判断部14は、説明変数を引数として、決定した判断用関数を用いて、回答データiが不適切か否かを判断する。
【0048】
ここで、説明変数は、各調査データ内での相対的な値にするために、各調査データ内で標準化した値を用いるのが望ましい。例えば、「回答時間」を説明変数にする場合、第1の調査の「回答時間」は第1の調査のデータ内で標準化した値を説明変数にし、第2の調査の「回答時間」は第2の調査のデータ内で標準化した値を説明変数にする。仮に、第1の調査と第2の調査で同じ標準化していない回答時間があったとしても、第1の調査の方が平均的な回答時間が長いのであれば、標準化した回答時間は第2の調査の方が大きくなる。同様に、その他の変数についても、標準化可能であれば、標準化した値を説明変数に用いるのが望ましい。
【0049】
判断用関数は、予め適否判断部14に設定されていてもよいし、調査毎に、適否判断部14で自動的に作成されるようにしてもよい。また、判断用関数は、調査毎に、用いる説明変数又は条件式等を任意に変更してよい。さらに、判断用関数は、人為的に作成されたプログラム等でもよいし、コンピュータを用いた機械学習による学習済みの予測モデルを実行するプログラム等でもよいし、人とコンピュータが共に介在して作成されたプログラム等でもよい。
【0050】
図4を参照して、不適切回答予測モデルを機械学習により構築する方法について説明する。不適切回答予測モデルは、調査システム1の適否判断部14において、対象の回答データiが不適切か否かを判断するための判断用関数として用いられる。
【0051】
機械学習をさせるために用いる訓練データを収集するために、複数件の調査を実施する。この調査では、アンケートには、上記で説明した説明変数を得るための項目の他に、指示項目を含める。指示項目は、アンケートの回答者が適切な回答をするか否かを確かめるための質問である。例えば、指示項目の内容は、「選択肢の4番を選んでください。」というものである。これに対して、回答者が4番以外の選択肢を選択した場合、この回答者は、不適切回答者であることが認識できる。これにより、各調査の回答者の中で誰が不適切回答者であるか知ることができる。
【0052】
ここでは、k件の調査が実施され、各調査のサンプルサイズ(回答者の人数)は、全てnとする。なお、調査毎にサンプルサイズは、異なっていてもよい。
【0053】
k件の調査が実施されることで、k件の調査データSR1,SR2,…,SRkが得られる。各調査データSR1~SRkには、n人分の回答データが含まれる。各回答データから、性別、回答時間及びマハラノビス距離等の説明変数を作成する。
【0054】
次に、各調査について、指示項目から作成された不適切回答者であるか否かを表す変数と各種説明変数からなるデータ行列DM1,DM2,…,DMkを作成する。各データ行列DM1~DMkのサイズは、変数の個数をv個とすると、n×vである。調査はk件あるので、n×vのデータ行列DM1~DMkがk個作成される。
【0055】
このように作成されたデータ行列DM1~DMkは、訓練データ記憶部ST3に記憶される。訓練データ記憶部ST3に記憶されたデータ行列DM1~DMkのデータは、機械学習を行うための訓練データとして扱われる。
【0056】
機械学習部21は、訓練データ記憶部ST3に記憶された訓練データに基づいて、回答データが不適切回答であるか否かを予測する不適切回答予測モデルを構築するための機械学習を行う。機械学習部21は、指示項目から作成された変数を正解ラベル付きのデータとして、教師あり学習を行う。
【0057】
機械学習部21で行われる機械学習のアルゴリズムは、例えば、ランダムフォレストであるが、どのように機械学習が行われてもよい。例えば、機械学習のアルゴリズムは、ニューラルネットワーク、ディープラーニング、サポートベクターマシン(SVM)、又は、決定木等でもよく、これらを任意に組み合わせてもよい。
【0058】
このようにして、機械学習部21は、機械学習を行うことにより、不適切回答予測モデルを生成する。生成された不適切回答予測モデルは、そのまま適否判断部14の判断用関数として適用してもよいし、強化学習により更新されることを前提とした初期値の関数として用いてもよいし、人為的に修正されてもよい。
【0059】
なお、機械学習部21及び訓練データ記憶部ST3は、調査システム1の構成の一部でもよいし、調査システム1と関係なく独立して動作するコンピュータに実装されてもよい。
【0060】
本実施形態によれば、複数のリッカート尺度項目を含む調査の回答データに基づいて、回答データの傾向を示す数値を求め、この数値を含み、回答データから得られる各種情報に基づいて、回答データが不適切であることを検出することで、不適切回答の検出精度を向上させることができる。
【0061】
また、本実施形態は、調査を行うためのアンケートに複数のリッカート尺度項目を含めることで、不適切回答を検出することができるため、様々な調査内容に適用できる汎用性の高い検出方法である。
【0062】
さらに、本実施形態について、機械学習により構築した予測モデルを適用して実現し、パソコン、スマートフォン及びタブレット等の様々なデバイスで回答した回答データで検証したところ、いずれのデバイスにおいても不適切回答の検出に有効であることが実証された。したがって、本実施形態は、回答するデバイスに依存しない汎用性の高い検出方法である。
【0063】
(第2実施形態)
図5は、第2実施形態に係る不適切回答検出方法に用いる説明変数を作成する手順を示すフロー図である。
【0064】
本実施形態に係る不適切回答検出方法は、調査を実施するアンケートに、複数のリッカート尺度項目に加え、少なくとも1つの自由記述回答項目が含まれる場合に用いられる。自由記述回答項目は、質問に対して、回答者が回答を自由に記述する形式の項目である。
【0065】
本実施形態に係る不適切回答検出方法は、図1に示す第1実施形態に係る不適切回答検出方法で用いる説明変数に加え、不適切であるか否かを判断する対象の回答データiにおける自由記述回答項目に対する回答から得られる情報を説明変数として用いたものである。その他の点は、第1実施形態に係る不適切回答検出方法と同様である。
【0066】
適否判断部14は、回答データDiにおいて、自由記述回答の文字数を求める(ステップS201)。例えば、適否判断部14は、全ての自由記述回答のそれぞれの文字数をカウントし、各自由記述回答の文字数の合計を演算する。なお、求める文字数は、予め決められた自由記述回答項目に対する自由記述回答の文字数でもよいし、予め決められた一部の自由記述回答項目に対するそれぞれの自由記述回答の合計の文字数でもよい。
【0067】
適否判断部14は、回答データDiにおいて、自由記述回答のポジティブスコアを求める(ステップS202)。ポジティブスコアは、ポジティブな単語のそれぞれに対して設定されるスコアである。例えば、自由記述回答のポジティブスコアは、全ての自由記述回答に含まれる全てのポジティブな単語のポジティブスコアの合計であるが、予め決められた1つ以上の自由記述回答項目に含まれるポジティブスコアの合計でもよい。
【0068】
ここで、ポジティブな単語及びその単語のポジティブスコアは、適否判断部14に設定された辞書に格納される。辞書は、調査システム1用に独自に作成したものでもよいし、既知の辞書でもよいし、ネガティブな単語及びその単語のネガティブスコアも格納されたいわゆる極性辞書でもよい。
【0069】
適否判断部14は、回答データDiにおいて、自由記述回答のポジティブ文字数を求める(ステップS203)。具体的には、適否判断部14は、全ての自由記述回答に含まれる全てのポジティブな単語を抽出し、抽出したポジティブな単語の文字数の合計を演算する。
【0070】
適否判断部14は、回答データDiにおいて、全ての自由記述回答のネガティブ文字数を求める(ステップS204)。具体的には、適否判断部14は、全ての自由記述回答に含まれる全てのネガティブな単語を抽出し、抽出したネガティブな単語の文字数の合計を演算する。
【0071】
適否判断部14は、回答データDiにおいて、自由記述回答の中で最もポジティブな単語のポジティブスコアを求める(ステップS205)。具体的には、適否判断部14は、全ての自由記述回答に含まれる全てのポジティブな単語を抽出し、抽出したポジティブな単語の全てのポジティブスコアを求める。求めたポジティブスコアの中から最も高いポジティブスコアを求める。この最も高いポジティブスコアが最もポジティブな単語のポジティブスコアとなる。
【0072】
適否判断部14は、回答データDiにおいて、自由記述回答の中で最もネガティブな単語のネガティブスコアを求める(ステップS206)。具体的には、適否判断部14は、全ての自由記述回答に含まれる全てのネガティブな単語を抽出し、抽出したネガティブな単語の全てのネガティブスコアを求める。求めたネガティブスコアの中から最も高いネガティブスコアを求める。この最も高いネガティブスコアが最もネガティブな単語のネガティブスコアとなる。
【0073】
適否判断部14は、回答データDiにおいて、自由記述回答をしたか否かを判断する(ステップS207)。全ての自由記述回答項目に無回答(空欄)であれば、自由記述回答していないと判断する。なお、自由記述回答をしたか否かの判断は、予め判断条件を設けてもよい。例えば、回答が所定の文字数以下で、回答として意味を成していなければ、自由記述回答をしていないと判断してもよい。なお、適否判断部14は、全ての自由記述回答項目に対して、一定の割合(例えば、90%)以上が空欄であれば、自由記述回答していないと判断してもよい。
【0074】
適否判断部14は、回答データDiにおいて、自由記述回答をしていると判断した場合は「1」に設定し、そうでないと判断した場合は「0」に設定する。なお、設定する数値は、「0」と「1」を逆に設定してもよいし、これら以外の数値(例えば、正の数と負の数)を用いてもよい。
【0075】
適否判断部14は、回答データDiにおいて、自由記述回答に実質的な内容を含まない特定の文章で回答をしたかを判断する(ステップS208)。例えば、このような特定文章は、「無い」、「無し」、「特に無い」、又は、「特に無し」等であり、一部又は全部が平仮名又は片仮名でもよい。適否判断部14は、このような特定の文章を予め設定しておくことで、自由記述回答に特定の文章で回答をしたか否かを判断する。
【0076】
なお、適否判断部14は、複数の自由記述回答項目に対して、一定の割合以上の項目(例えば、全ての項目の80%)に特定の文章で回答した場合、少なくとも1つの項目に特定の文章で回答した場合、又は、全ての項目に特定の文章で回答した場合等の条件を設定して、特定の文章で回答したか否かを判断してもよい。
【0077】
適否判断部14は、回答データDiにおいて、実質的な内容を含まない特定の文章で回答をしていると判断した場合は「1」に設定し、そうでないと判断した場合は「0」に設定する。なお、設定する数値は、「0」と「1」を逆に設定してもよいし、これら以外の数値(例えば、正の数と負の数)を用いてもよい。
【0078】
適否判断部14は、上述のステップS201~208で求めた数値等を説明変数として加え、図2に示す第1実施形態に係る不適切回答検出方法のステップS107と同様に、対象の回答データiが不適切か否かを判断する。なお、適否判断部14は、上述のステップS201~208で求めた数値等のうち少なくとも1つを説明変数として加えればよい。
【0079】
本実施形態によれば、リッカート尺度項目及び自由記述回答項目を含む調査において、自由記述回答項目に対する回答から得られる説明変数を用いることで、第1実施形態よりも検出精度を向上させることができる。
【0080】
なお、本発明は上述した実施形態に限定されず、構成要素を削除、付加又は変更等をしてもよい。また、複数の実施形態について構成要素を組合せ又は交換等をすることで、新たな実施形態としてもよい。このような実施形態が上述した実施形態と直接的に異なるものであっても、本発明と同様の趣旨のものは、本発明の実施形態として説明したものとして、その説明を省略している。
【符号の説明】
【0081】
1…調査システム、2…回答者端末、11…アンケート生成部、12…アンケート回答部、13…回答データ集計部、14…適否判断部、15…入力部、16…出力部、Fm…アンケートフォーム、ST1…調査データ記憶部、ST2…回答データ記憶部。
図1
図2
図3
図4
図5
【手続補正書】
【提出日】2023-02-09
【手続補正1】
【補正対象書類名】特許請求の範囲
【補正対象項目名】全文
【補正方法】変更
【補正の内容】
【特許請求の範囲】
【請求項1】
複数のリッカート尺度項目を含む調査の複数の回答データを取得し、
前記複数の回答データのうち不適切回答を検出する対象回答データの回答に要した回答時間を取得し、
前記対象回答データの前記複数のリッカート尺度項目に対して、同じ回答カテゴリを連続して選択した回数を求め、
前記対象回答データの前記複数のリッカート尺度項目に対する回答カテゴリに基づいて、前記対象回答データの傾向を示す数値を求め、
前記対象回答データの前記複数のリッカート尺度項目に対する複数のマハラノビス距離を演算し、
前記複数の回答データのそれぞれの回答に要した回答時間の代表値を演算し、
前記調査の項目数を取得し、
前記回答時間、前記回数、前記傾向を示す数値、前記複数のマハラノビス距離、前記代表値、及び、前記項目数に基づいて、前記対象回答データの回答が不適切であることを検出することを含み、
前記傾向を示す数値は、前記対象回答データの連続するリッカート尺度項目に対して、回答カテゴリが1つずつずらして選択された回数であること
特徴とする不適切回答検出方法。
【請求項2】
複数のリッカート尺度項目を含む調査の複数の回答データを取得し、
前記複数の回答データのうち不適切回答を検出する対象回答データの回答に要した回答時間を取得し、
前記対象回答データの前記複数のリッカート尺度項目に対して、同じ回答カテゴリを連続して選択した回数を求め、
前記対象回答データの前記複数のリッカート尺度項目に対する回答カテゴリに基づいて、前記対象回答データの傾向を示す数値を求め、
前記対象回答データの前記複数のリッカート尺度項目に対する複数のマハラノビス距離を演算し、
前記複数の回答データのそれぞれの回答に要した回答時間の代表値を演算し、
前記調査の項目数を取得し、
前記回答時間、前記回数、前記傾向を示す数値、前記複数のマハラノビス距離、前記代表値、及び、前記項目数に基づいて、前記対象回答データの回答が不適切であることを検出することを含み、
前記傾向を示す数値は、前記対象回答データにおいて、a個の回答カテゴリがあるリッカート尺度項目に対して、b個の回答カテゴリのみに回答している割合が所定値以上か否かを示し、aは2以上であり、bはa未満であること
特徴とする不適切回答検出方法。
【請求項3】
複数のリッカート尺度項目を含む調査の複数の回答データを取得し、
前記複数の回答データのうち不適切回答を検出する対象回答データの回答に要した回答時間を取得し、
前記対象回答データの前記複数のリッカート尺度項目に対して、同じ回答カテゴリを連続して選択した回数を求め、
前記対象回答データの前記複数のリッカート尺度項目に対する回答カテゴリに基づいて、前記対象回答データの傾向を示す数値を求め、
前記対象回答データの前記複数のリッカート尺度項目に対する複数のマハラノビス距離を演算し、
前記複数の回答データのそれぞれの回答に要した回答時間の代表値を演算し、
前記調査の項目数を取得し、
前記回答時間、前記回数、前記傾向を示す数値、前記複数のマハラノビス距離、前記代表値、及び、前記項目数に基づいて、前記対象回答データの回答が不適切であることを検出することを含み、
前記傾向を示す数値は、前記複数の回答データの各リッカート尺度項目の回答カテゴリの平均と前記対象回答データの各リッカート尺度項目の回答カテゴリとのそれぞれの乖離を合計した合計乖離値であること
特徴とする不適切回答検出方法。
【請求項4】
前記調査は、自由記述回答項目を含み、
前記対象回答データの前記自由記述回答項目に対する自由記述回答の文字数に基づいて、前記対象回答データの回答が不適切であることを検出すること
を特徴とする請求項1から請求項3のいずれか1項に記載の不適切回答検出方法。
【請求項5】
前記調査は、自由記述回答項目を含み、
前記対象回答データの前記自由記述回答項目に対する自由記述回答に含まれるポジティブな単語のポジティブスコアに基づいて、前記対象回答データの回答が不適切であることを検出すること
を特徴とする請求項1から請求項3のいずれか1項に記載の不適切回答検出方法。
【請求項6】
前記ポジティブスコアは、前記自由記述回答の中で最も高いポジティブスコアであること
を特徴とする請求項に記載の不適切回答検出方法。
【請求項7】
前記調査は、自由記述回答項目を含み、
前記対象回答データの前記自由記述回答項目に対する自由記述回答に含まれるポジティブな単語の文字数であるポジティブ文字数に基づいて、前記対象回答データの回答が不適切であることを検出すること
を特徴とする請求項1から請求項3のいずれか1項に記載の不適切回答検出方法。
【請求項8】
前記調査は、自由記述回答項目を含み、
前記対象回答データの前記自由記述回答項目に対する自由記述回答に含まれるネガティブな単語のネガティブスコアに基づいて、前記対象回答データの回答が不適切であることを検出すること
を特徴とする請求項1から請求項3のいずれか1項に記載の不適切回答検出方法。
【請求項9】
前記ネガティブスコアは、前記自由記述回答の中で最も高いネガティブスコアであること
を特徴とする請求項に記載の不適切回答検出方法。
【請求項10】
前記調査は、自由記述回答項目を含み、
前記対象回答データの前記自由記述回答項目に対する自由記述回答に含まれるネガティブな単語の文字数であるネガティブ文字数に基づいて、前記対象回答データの回答が不適切であることを検出すること
を特徴とする請求項1から請求項3のいずれか1項に記載の不適切回答検出方法。
【請求項11】
前記調査は、自由記述回答項目を含み、
前記対象回答データの前記自由記述回答項目に対して自由記述回答をしたか否かに基づいて、前記対象回答データの回答が不適切であることを検出すること
を特徴とする請求項1から請求項3のいずれか1項に記載の不適切回答検出方法。
【請求項12】
前記調査は、自由記述回答項目を含み、
前記対象回答データの前記自由記述回答項目に対して実質的な内容を含まない特定の文章で回答したか否かに基づいて、前記対象回答データの回答が不適切であることを検出すること
を特徴とする請求項1から請求項3のいずれか1項に記載の不適切回答検出方法。
【請求項13】
機械学習による学習済みモデルを用いて、前記対象回答データの回答が不適切であることを検出すること
を含むことを特徴とする請求項1から請求項3のいずれか1項に記載の不適切回答検出方法。
【請求項14】
複数のリッカート尺度項目を含む調査の複数の回答データを記憶する回答データ記憶手段と、
前記回答データ記憶手段に記憶された前記複数の回答データのうち不適切回答を検出する対象回答データの回答に要した回答時間を取得する回答時間取得手段と、
前記対象回答データの前記複数のリッカート尺度項目に対して、同じ回答カテゴリを連続して選択した回数を演算する回数演算手段と、
前記対象回答データの前記複数のリッカート尺度項目に対する回答カテゴリに基づいて、前記対象回答データの傾向を示す数値を演算する回答傾向演算手段と、
前記対象回答データの前記複数のリッカート尺度項目に対する複数のマハラノビス距離を演算するマハラノビス距離演算手段と、
前記複数の回答データのそれぞれの回答に要した回答時間の代表値を演算する代表値演算手段と、
前記調査の項目数を取得する項目数取得手段と、
前記回答時間取得手段により取得された前記回答時間、前記回数演算手段により演算された前記回数、前記回答傾向演算手段により演算された前記傾向を示す数値、前記マハラノビス距離演算手段により演算された前記複数のマハラノビス距離、前記代表値演算手段により演算された前記代表値、及び、前記項目数取得手段により取得された前記項目数に基づいて、前記対象回答データの回答が不適切であることを検出する検出手段とを備え、
前記傾向を示す数値は、前記対象回答データの連続するリッカート尺度項目に対して、回答カテゴリが1つずつずらして選択された回数であること
特徴とする不適切回答検出システム。
【請求項15】
複数のリッカート尺度項目を含む調査の複数の回答データを記憶する回答データ記憶手段と、
前記回答データ記憶手段に記憶された前記複数の回答データのうち不適切回答を検出する対象回答データの回答に要した回答時間を取得する回答時間取得手段と、
前記対象回答データの前記複数のリッカート尺度項目に対して、同じ回答カテゴリを連続して選択した回数を演算する回数演算手段と、
前記対象回答データの前記複数のリッカート尺度項目に対する回答カテゴリに基づいて、前記対象回答データの傾向を示す数値を演算する回答傾向演算手段と、
前記対象回答データの前記複数のリッカート尺度項目に対する複数のマハラノビス距離を演算するマハラノビス距離演算手段と、
前記複数の回答データのそれぞれの回答に要した回答時間の代表値を演算する代表値演算手段と、
前記調査の項目数を取得する項目数取得手段と、
前記回答時間取得手段により取得された前記回答時間、前記回数演算手段により演算された前記回数、前記回答傾向演算手段により演算された前記傾向を示す数値、前記マハラノビス距離演算手段により演算された前記複数のマハラノビス距離、前記代表値演算手段により演算された前記代表値、及び、前記項目数取得手段により取得された前記項目数に基づいて、前記対象回答データの回答が不適切であることを検出する検出手段とを備え、
前記傾向を示す数値は、前記対象回答データにおいて、a個の回答カテゴリがあるリッカート尺度項目に対して、b個の回答カテゴリのみに回答している割合が所定値以上か否かを示し、aは2以上であり、bはa未満であること
特徴とする不適切回答検出システム。
【請求項16】
複数のリッカート尺度項目を含む調査の複数の回答データを記憶する回答データ記憶手段と、
前記回答データ記憶手段に記憶された前記複数の回答データのうち不適切回答を検出する対象回答データの回答に要した回答時間を取得する回答時間取得手段と、
前記対象回答データの前記複数のリッカート尺度項目に対して、同じ回答カテゴリを連続して選択した回数を演算する回数演算手段と、
前記対象回答データの前記複数のリッカート尺度項目に対する回答カテゴリに基づいて、前記対象回答データの傾向を示す数値を演算する回答傾向演算手段と、
前記対象回答データの前記複数のリッカート尺度項目に対する複数のマハラノビス距離を演算するマハラノビス距離演算手段と、
前記複数の回答データのそれぞれの回答に要した回答時間の代表値を演算する代表値演算手段と、
前記調査の項目数を取得する項目数取得手段と、
前記回答時間取得手段により取得された前記回答時間、前記回数演算手段により演算された前記回数、前記回答傾向演算手段により演算された前記傾向を示す数値、前記マハラノビス距離演算手段により演算された前記複数のマハラノビス距離、前記代表値演算手段により演算された前記代表値、及び、前記項目数取得手段により取得された前記項目数に基づいて、前記対象回答データの回答が不適切であることを検出する検出手段とを備え、
前記傾向を示す数値は、前記複数の回答データの各リッカート尺度項目の回答カテゴリの平均と前記対象回答データの各リッカート尺度項目の回答カテゴリとのそれぞれの乖離を合計した合計乖離値であること
特徴とする不適切回答検出システム。
【請求項17】
コンピュータが、複数のリッカート尺度項目を含む調査の複数の回答データを取得し、
前記コンピュータが、前記複数の回答データのうち不適切回答を検出する対象回答データの回答に要した回答時間を取得し、
前記コンピュータが、前記対象回答データの前記複数のリッカート尺度項目に対して、同じ回答カテゴリを連続して選択した回数を求め、
前記コンピュータが、前記対象回答データの前記複数のリッカート尺度項目に対する回答カテゴリに基づいて、前記対象回答データの傾向を示す数値を求め、
前記コンピュータが、前記対象回答データの前記複数のリッカート尺度項目に対する複数のマハラノビス距離を演算し、
前記コンピュータが、前記複数の回答データのそれぞれの回答に要した回答時間の代表値を演算し、
前記コンピュータが、前記調査の項目数を取得し、
前記コンピュータが、前記回答時間、前記回数、前記傾向を示す数値、前記複数のマハラノビス距離、前記代表値、及び、前記項目数に基づいて、前記対象回答データの回答が不適切であることを検出することを含むように機能させ、
前記傾向を示す数値は、前記対象回答データの連続するリッカート尺度項目に対して、回答カテゴリが1つずつずらして選択された回数であること
特徴とする不適切回答検出プログラム。
【請求項18】
コンピュータが、複数のリッカート尺度項目を含む調査の複数の回答データを取得し、
前記コンピュータが、前記複数の回答データのうち不適切回答を検出する対象回答データの回答に要した回答時間を取得し、
前記コンピュータが、前記対象回答データの前記複数のリッカート尺度項目に対して、同じ回答カテゴリを連続して選択した回数を求め、
前記コンピュータが、前記対象回答データの前記複数のリッカート尺度項目に対する回答カテゴリに基づいて、前記対象回答データの傾向を示す数値を求め、
前記コンピュータが、前記対象回答データの前記複数のリッカート尺度項目に対する複数のマハラノビス距離を演算し、
前記コンピュータが、前記複数の回答データのそれぞれの回答に要した回答時間の代表値を演算し、
前記コンピュータが、前記調査の項目数を取得し、
前記コンピュータが、前記回答時間、前記回数、前記傾向を示す数値、前記複数のマハラノビス距離、前記代表値、及び、前記項目数に基づいて、前記対象回答データの回答が不適切であることを検出することを含むように機能させ、
前記傾向を示す数値は、前記対象回答データにおいて、a個の回答カテゴリがあるリッカート尺度項目に対して、b個の回答カテゴリのみに回答している割合が所定値以上か否かを示し、aは2以上であり、bはa未満であること
特徴とする不適切回答検出プログラム。
【請求項19】
コンピュータが、複数のリッカート尺度項目を含む調査の複数の回答データを取得し、
前記コンピュータが、前記複数の回答データのうち不適切回答を検出する対象回答データの回答に要した回答時間を取得し、
前記コンピュータが、前記対象回答データの前記複数のリッカート尺度項目に対して、同じ回答カテゴリを連続して選択した回数を求め、
前記コンピュータが、前記対象回答データの前記複数のリッカート尺度項目に対する回答カテゴリに基づいて、前記対象回答データの傾向を示す数値を求め、
前記コンピュータが、前記対象回答データの前記複数のリッカート尺度項目に対する複数のマハラノビス距離を演算し、
前記コンピュータが、前記複数の回答データのそれぞれの回答に要した回答時間の代表値を演算し、
前記コンピュータが、前記調査の項目数を取得し、
前記コンピュータが、前記回答時間、前記回数、前記傾向を示す数値、前記複数のマハラノビス距離、前記代表値、及び、前記項目数に基づいて、前記対象回答データの回答が不適切であることを検出することを含むように機能させ、
前記傾向を示す数値は、前記複数の回答データの各リッカート尺度項目の回答カテゴリの平均と前記対象回答データの各リッカート尺度項目の回答カテゴリとのそれぞれの乖離を合計した合計乖離値であること
特徴とする不適切回答検出プログラム。
【手続補正2】
【補正対象書類名】明細書
【補正対象項目名】0005
【補正方法】変更
【補正の内容】
【0005】
本発明の観点に従った不適切回答検出方法は、複数のリッカート尺度項目を含む調査の複数の回答データを取得し、前記複数の回答データのうち不適切回答を検出する対象回答データの回答に要した回答時間を取得し、前記対象回答データの前記複数のリッカート尺度項目に対して、同じ回答カテゴリを連続して選択した回数を求め、前記対象回答データの前記複数のリッカート尺度項目に対する回答カテゴリに基づいて、前記対象回答データの傾向を示す数値を求め、前記対象回答データの前記複数のリッカート尺度項目に対する複数のマハラノビス距離を演算し、前記複数の回答データのそれぞれの回答に要した回答時間の代表値を演算し、前記調査の項目数を取得し、前記回答時間、前記回数、前記傾向を示す数値、前記複数のマハラノビス距離、前記代表値、及び、前記項目数に基づいて、前記対象回答データの回答が不適切であることを検出することを含み、前記傾向を示す数値は、前記対象回答データの連続するリッカート尺度項目に対して、回答カテゴリが1つずつずらして選択された回数である