(19)【発行国】日本国特許庁(JP)
(12)【公報種別】公開特許公報(A)
(11)【公開番号】P2023092749
(43)【公開日】2023-07-04
(54)【発明の名称】アンケート回答データ処理装置、アンケート回答データ処理方法及びアンケート回答データ処理用プログラム
(51)【国際特許分類】
G06Q 50/10 20120101AFI20230627BHJP
【FI】
G06Q50/10
【審査請求】未請求
【請求項の数】10
【出願形態】OL
(21)【出願番号】P 2021207944
(22)【出願日】2021-12-22
(71)【出願人】
【識別番号】514246299
【氏名又は名称】株式会社FIND
(74)【代理人】
【識別番号】110000958
【氏名又は名称】弁理士法人インテクト国際特許事務所
(74)【代理人】
【識別番号】100120189
【弁理士】
【氏名又は名称】奥 和幸
(74)【代理人】
【識別番号】100173510
【弁理士】
【氏名又は名称】美川 公司
(72)【発明者】
【氏名】山形 知大
(72)【発明者】
【氏名】富野 永和
【テーマコード(参考)】
5L049
【Fターム(参考)】
5L049CC20
(57)【要約】
【課題】アンケート調査の回答の集計時及びその後の当該回答の分析時に除外されるべき低品質な回答を効果的に除外することが可能なアンケート回答データ処理装置等を提供する。
【解決手段】質問に対する回答を求める形式によりネットワークを介して実施されたアンケートに対する回答の内容を示す内容データと、回答を識別するための識別データと、を含む回答データを複数取得し(ステップS1)、取得された回答データの中から、回答として既定された低品質基準に該当する低品質回答に対応する回答データを抽出して削除する(ステップS2乃至ステップS4)。このとき、当該低品質基準が、矛盾回答を判別するための基準、低反応回答を判別するための基準、及び分布疑義回答を判別するための基準のいずれか又は全てであるように構成される。
【選択図】
図5
【特許請求の範囲】
【請求項1】
質問に対する回答を求める形式によりネットワークを介して実施されたアンケートに対する当該回答の内容を示す内容データと、当該回答を識別するための識別データと、を含む回答データを複数取得する回答データ取得手段と、
前記取得された回答データの中から、前記回答として予め設定された低品質基準に該当する当該回答である低品質回答に対応する低品質回答データを抽出する抽出手段と、
前記抽出された低品質回答データを示す前記識別データに基づき、当該低品質回答データを前記取得された回答データから削除する削除手段と、
を備え、
前記低品質基準は、
(i)第1低品質基準:複数の前記質問への各前記回答が相互に矛盾している場合に、当該各回答を前記低品質回答とすること、
(ii)第2低品質基準:選択形式の前記質問への前記回答における選択数が予め設定された数より少ない当該回答を前記低品質回答とすること、及び、
(iii)第3低品質基準:前記回答が期待される回答者群と異なる回答者群に属する回答者による前記回答を前記低品質回答とすること、
のいずれか又は全てであることを特徴とする回答データ処理装置。
【請求項2】
請求項1に記載の回答データ処理装置において、
前記第1低品質基準が、一の前記アンケートに含まれている複数の前記質問それぞれへの前記回答が相互に矛盾していることであり、
前記抽出手段は、当該矛盾していることに該当する前記低品質回答に対応する前記低品質回答データを前記取得された回答データの中から抽出することを特徴とする回答データ処理装置。
【請求項3】
請求項2に記載の回答データ処理装置において、
前記第1低品質基準が、
請求項2に記載の前記第1低品質基準である第1低品質基準(a)、又は、
前記アンケートに対応する予備調査に含まれている前記質問と、当該アンケートに対応する本調査に含まれている前記質問と、が同旨であり、且つ当該各質問それぞれへの前記回答が相互に異なっていることである第1低品質基準(b)、
のいずれかであり、
前記抽出手段は、前記いずれかに該当する前記低品質回答に対応する前記低品質回答情報を前記取得された回答情報の中から抽出し、
前記第1低品質基準(b)の方が前記第1低品質基準(a)よりも前記回答としての低品質となるように、各前記第1低品質基準のそれぞれが点数化されており、
点数化された各前記第1低品質基準及び予め設定された削除数基準に基づいて、削除される前記低品質回答データの数を決定する決定手段を更に備え、
前記削除手段は、前記決定された数の前記低品質回答データを前記取得された回答データから削除することを特徴とする回答データ処理装置。
【請求項4】
請求項1から請求項3のいずれか一項に記載の回答データ処理装置において、
取得された複数の前記回答データを、予め設定されたクラスタ分析法により分類する分類手段を更に備え、
前記第2低品質基準が、前記分類の結果が予め設定された低品質基準に該当することであり、
前記抽出手段は、前記第2低品質基準に該当する前記低品質回答に対応する前記低品質回答データを前記取得された回答データの中から抽出することを特徴とする回答データ処理装置。
【請求項5】
請求項4に記載の回答データ処理装置において、
前記質問が、複数の選択肢を用いた選択式により前記回答を求める形式の質問であり、
前記低品質基準及び「該当なし」の前記回答であることがそれぞれ点数化されており、
前記点数化の点数及び予め設定された削除数基準に基づいて、削除される前記低品質回答データの数を決定する第2決定手段を更に備え、
前記削除手段は、前記決定された数の前記低品質回答データを、前記取得された回答データから削除することを特徴とする回答データ処理装置。
【請求項6】
請求項1から請求項5のいずれか一項に記載の回答データ処理装置において、
前記第3低品質基準が、前記回答が期待される前記回答者群に属する回答者数の全回答者数に対する割合と、前記異なる回答者群に属し且つ前記回答をした回答者数の前記全回答者数に対する割合と、の差が予め設定された基準以上であることであり、
前記抽出手段は、前記第3低品質基準に該当する前記異なる回答者群に属する回答者による前記低品質回答に対応する前記低品質回答データを前記取得された回答データの中から抽出することを特徴とする回答データ処理装置。
【請求項7】
請求項1から請求項6のいずれか一項に記載の回答データ処理装置において、
前記低品質回答データが削除された後の前記回答データに基づいて、当該削除された低品質回答データの数に対応した数の補完回答データであって前記削除された低品質回答データに代わる補完回答データを新たに生成する生成手段を更に備えることを特徴とする回答データ処理装置。
【請求項8】
請求項7に記載の回答データ処理装置において、
前記生成手段は、前記取得された回答データ全体の分布を参照して前記補完回答データを新たに生成することを特徴とする回答データ処理装置。
【請求項9】
回答データ取得手段と、抽出手段と、削除手段と、を備える回答データ処理装置において実行される回答データ処理方法であって、
質問に対する回答を求める形式によりネットワークを介して実施されたアンケートに対する当該回答の内容を示す内容データと、当該回答を識別するための識別データと、を含む回答データを前記回答データ取得手段により複数取得する回答データ取得工程と、
前記取得された回答データの中から、前記回答として予め設定された低品質基準に該当する当該回答である低品質回答に対応する低品質回答データを前記抽出手段により抽出する抽出工程と、
前記抽出された低品質回答データを示す前記識別データに基づき、当該低品質回答データを前記削除手段により前記取得された回答データから削除する削除工程と、
を含み、
前記低品質基準は、
(i)第1低品質基準:複数の前記質問への各前記回答が相互に矛盾している場合に、当該各回答を前記低品質回答とすること、
(ii)第2低品質基準:選択形式の前記質問への前記回答における選択数が予め設定された数より少ない当該回答を前記低品質回答とすること、及び、
(iii)第3低品質基準:前記回答が期待される回答者群と異なる回答者群に属する回答者による前記回答を前記低品質回答とすること、
のいずれか又は全てであることを特徴とする回答データ処理方法。
【請求項10】
回答データ処理装置に含まれるコンピュータを、
質問に対する回答を求める形式によりネットワークを介して実施されたアンケートに対する当該回答の内容を示す内容データと、当該回答を識別するための識別データと、を含む回答データを複数取得する回答データ取得手段、
前記取得された回答データの中から、前記回答として予め設定された低品質基準に該当する当該回答である低品質回答に対応する低品質回答データを抽出する抽出手段、及び、
前記抽出された低品質回答データを示す前記識別データに基づき、当該低品質回答データを前記取得された回答データから削除する削除手段、
として機能させる回答データ処理用プログラムであって、
前記低品質基準は、
(i)第1低品質基準:複数の前記質問への各前記回答が相互に矛盾している場合に、当該各回答を前記低品質回答とすること、
(ii)第2低品質基準:選択形式の前記質問への前記回答における選択数が予め設定された数より少ない当該回答を前記低品質回答とすること、及び、
(iii)第3低品質基準:前記回答が期待される回答者群と異なる回答者群に属する回答者による前記回答を前記低品質回答とすること、
のいずれか又は全てであることを特徴とする回答データ処理用プログラム。
【発明の詳細な説明】
【技術分野】
【0001】
本発明は、アンケート回答データ処理装置、アンケート回答データ処理方法及びアンケート回答データ処理用プログラムの技術分野に属する。より詳細には、質問に対する回答を求める形式によりインターネット等のネットワークを介して実施されたアンケートにおける上記回答を示す回答データの処理を行うアンケート回答データ処理装置及びアンケート回答データ処理方法並びに当該アンケート回答データ処理装置用のプログラムの技術分野に属する。
【背景技術】
【0002】
従来、例えば市場調査等を目的とした、いわゆるアンケート調査が一般的に行われている。このとき、これまで行われていたアンケート調査の方法は、例えば、無作為に選んだ家に質問状を郵送するか又はその家を訪問して当該質問状の質問への回答を依頼する方法や、街頭で無作為に通行者を選んで回答して貰う方法、或いは、無作為に選んだ家に電話をかけることで質問に対する回答を得る方法等が用いられていた。
【0003】
これに対し、いわゆるスマートフォンが広く普及している近年では、アンケート調査として、回答を期待する者が所有しているスマートフォンに質問の内容のデータをインターネット経由で送信し、その回答を再度インターネット経由で取得する方法が用いられることが多くなっている。このような、スマートフォンとインターネットを用いたアンケート調査には、安価且つ迅速に回答が集められるという利点がある。
【0004】
一方、スマートフォンとインターネットを用いた上記アンケート調査の方法では、スマートフォンの画面自体が小型であることや回答者の移動中に回答が入力されることが多いため、例えば質問数が多かったり多岐に渡ったりすると、その回答の信憑性が低下する(すなわち、「いい加減な回答」しか得られない)といった問題点がある。より具体的には、以下の(ア)項乃至(ウ)項のような問題点が、現実に存在している。
【0005】
(ア)異なる質問に対して相互に矛盾する回答をする回答者、より具体的に例えば、ある場所(例えば観光地)に「訪れたことがある」と回答しているにも拘わらず、一方ではその場所を「知らない」と回答する回答者等が一定数存在すること(なお以下では、このような回答者を単に「矛盾回答者」と称する)。
【0006】
(イ)例えば数十の飲料を含む質問をしても「どれも飲んだことがない」と回答する回答者、すなわち、例えば全ての選択肢を読むことが面倒になったと予想される回答者が一定数存在すること(なお以下では、このような回答者を単に「低反応者」と称する)。
【0007】
(ウ)例えば、一般的な統計上は十代の顧客が殆どいないとされている商品に関するアンケート調査において、「使っている」と回答した十代の回答者が他の年代の回答者に比べて過度に多い場合、すなわち、その十代の回答者を正当な回答者として扱うには統計分布上の疑義がある場合がある。このような回答者は、例えば、回答をすることにより得られる当該回答への報酬等を取得したいがゆえに虚偽の回答をしている可能性があると考えられる回答者である。
【0008】
そして、上記(ア)項乃至上記(ウ)項記載のような回答者を他の正当な回答をした回答者と同じように扱ってアンケート結果を集計した場合、当該アンケート結果としては、その統計的な分布に悪影響が及ぼされると共に、アンケート調査に対応した企画の意図や意思決定が誤ったものとなる可能性が生じることとなる。従って、上記(ア)項乃至上記(ウ)項記載のような回答者の回答をアンケート結果の集計から除外することが求められる。このような要請に応じることを目的として検討された先行技術を開示した文献としては、例えば下記特許文献1が挙げられる。
【0009】
この特許文献1に記載されている技術では、回答者が質問に回答するのに要した回答所要時間を計測し、質問ごとに、その質問の回答者の回答所要時間の代表値を求め、回答した質問における回答時間指数を回答者ごとに求めると共に、回答時間指数の和を回答した質問数で割って平均値を求め、平均値が小さい順に所定の割合の回答を除外してアンケート集計を行う構成とされている。
【先行技術文献】
【特許文献】
【0010】
【発明の概要】
【発明が解決しようとする課題】
【0011】
しかしながら、上記(ア)項乃至上記(ウ)項記載のような回答者は、いわゆる「アンケート調査慣れ」していることが考えられるため、例えば特許文献1に記載されている回答所要時間を適切にするような回答操作をわざとしたり、また、自身の回答の傾向を分散させたりすることで不適切回答者に見えないような回答操作をすることがあり、これらの結果として、上記(ア)項乃至上記(ウ)項記載のような回答者があたかも正当な回答者のように見えてしまう問題があった。
【0012】
更に、上記(ア)項乃至上記(ウ)項記載のような回答者から得られた回答データを除外することは、アンケート調査の結果としての回答データ自体を取得するアンケート調査実施者(例えば、当該アンケート調査を行う調査会社)であれば可能ではある。しかしながら、そのアンケート調査実施者から取得した回答データを分析する分析者(例えば、当該分析を行うアンケート分析会社)は、上記のような不適切な回答操作の結果として得られた回答データと他の正当な(すなわち信憑性が高い)回答データとを分別することが難しい。よって当該分析者は、当該回答操作の結果としての回答データを含んだ回答データ全体を対象とした分析(換言すれば、正確ではない分析)をせざるを得ないという問題点もあった。
【0013】
更にまた、例えば特開2021-179865号公報に記載された本発明の発明者等によるデータ生成方法のように、AI(Artificial Intelligence)を用いてアンケート調査の結果としての回答データの数を増やす(回答データを拡張する)ことを考える場合に、上記(ア)項乃至上記(ウ)項記載のような回答者から得られた回答データが元の回答データの中に含まれていると、それらが含まれた回答データに基づき上記AIによる回答データの拡張が行われることとなる。そしてその結果として、当該拡張後の回答データの品質が低下するという問題点もあった。
【0014】
そこで本発明は、上記の各問題点に鑑みて為されたもので、その課題の一例は、アンケート調査の回答の集計時及びその後の当該回答の分析時に除外されるべき低品質な回答を効果的に除外することが可能なアンケート回答データ処理装置及びアンケート回答データ処理方法並びに当該アンケート回答データ処理装置用のプログラムを提供することにある。
【課題を解決するための手段】
【0015】
上記の課題を解決するために、請求項1に記載の発明は、質問に対する回答を求める形式によりネットワークを介して実施されたアンケートに対する当該回答の内容を示す内容データと、当該回答を識別するための識別データと、を含む回答データを複数取得する処理部等の回答データ取得手段と、前記取得された回答データの中から、前記回答として予め設定された低品質基準に該当する当該回答である低品質回答に対応する低品質回答データを抽出する矛盾回答者クリーニング部等の抽出手段と、前記抽出された低品質回答データを示す前記識別データに基づき、当該低品質回答データを前記取得された回答データから削除する矛盾回答者クリーニング部等の削除手段と、を備え、前記低品質基準は、(i)第1低品質基準:複数の前記質問への各前記回答が相互に矛盾している場合に、当該各回答を前記低品質回答とすること、(ii)第2低品質基準:選択形式の前記質問への前記回答における選択数が予め設定された数より少ない当該回答を前記低品質回答とすること、及び、(iii)第3低品質基準:前記回答が期待される回答者群と異なる回答者群に属する回答者による前記回答を前記低品質回答とすること、のいずれか又は全てであるように構成される。
【0016】
上記の課題を解決するために、請求項9に記載の発明は、回答データ取得手段と、抽出手段と、削除手段と、を備える回答データ処理装置において実行される回答データ処理方法であって、質問に対する回答を求める形式によりネットワークを介して実施されたアンケートに対する当該回答の内容を示す内容データと、当該回答を識別するための識別データと、を含む回答データを前記回答データ取得手段により複数取得する回答データ取得工程と、前記取得された回答データの中から、前記回答として予め設定された低品質基準に該当する当該回答である低品質回答に対応する低品質回答データを前記抽出手段により抽出する抽出工程と、前記抽出された低品質回答データを示す前記識別データに基づき、当該低品質回答データを前記削除手段により前記取得された回答データから削除する削除工程と、を含み、前記低品質基準は、(i)第1低品質基準:複数の前記質問への各前記回答が相互に矛盾している場合に、当該各回答を前記低品質回答とすること、(ii)第2低品質基準:選択形式の前記質問への前記回答における選択数が予め設定された数より少ない当該回答を前記低品質回答とすること、及び、(iii)第3低品質基準:前記回答が期待される回答者群と異なる回答者群に属する回答者による前記回答を前記低品質回答とすること、のいずれか又は全てであるように構成される。
【0017】
上記の課題を解決するために、請求項10に記載の発明は、回答データ処理装置に含まれるコンピュータを、質問に対する回答を求める形式によりネットワークを介して実施されたアンケートに対する当該回答の内容を示す内容データと、当該回答を識別するための識別データと、を含む回答データを複数取得する回答データ取得手段、前記取得された回答データの中から、前記回答として予め設定された低品質基準に該当する当該回答である低品質回答に対応する低品質回答データを抽出する抽出手段、及び、前記抽出された低品質回答データを示す前記識別データに基づき、当該低品質回答データを前記取得された回答データから削除する削除手段、として機能させる回答データ処理用プログラムであって、前記低品質基準は、(i)第1低品質基準:複数の前記質問への各前記回答が相互に矛盾している場合に、当該各回答を前記低品質回答とすること、(ii)第2低品質基準:選択形式の前記質問への前記回答における選択数が予め設定された数より少ない当該回答を前記低品質回答とすること、及び、(iii)第3低品質基準:前記回答が期待される回答者群と異なる回答者群に属する回答者による前記回答を前記低品質回答とすること、のいずれか又は全てであるように構成される。
【0018】
請求項1、請求項9又は請求項10のいずれか一項に記載の発明によれば、質問に対する回答を求める形式によりネットワークを介して実施されたアンケートに対応する回答データを複数取得し、その回答データの中から低品質回答に対応する低品質回答データを抽出して削除する。このとき、低品質回答を抽出するための低品質基準として第1低品質基準乃至第3低品質基準のいずれか又は全てを用いる。よって、アンケートの回答の集計時及びその後の当該回答の分析時に除外されるべき低品質回答を効果的に除外することができる。
【0019】
上記の課題を解決するために、請求項2に記載の発明は、請求項1に記載の回答データ処理装置において、前記第1低品質基準が、一の前記アンケートに含まれている複数の前記質問それぞれへの前記回答が相互に矛盾していることであり、前記抽出手段は、当該矛盾していることに該当する前記低品質回答に対応する前記低品質回答データを前記取得された回答データの中から抽出するように構成される。
【0020】
請求項2に記載の発明によれば、請求項1に記載の発明の作用に加えて、第1低品質基準が、一のアンケートに含まれている複数の質問それぞれへの回答が相互に矛盾していることであり、当該矛盾していることに該当する低品質回答に対応する低品質回答データを回答データの中から抽出するので、適正な第1低品質基準を用いて低品質回答データを適格に抽出して削除することができる。
【0021】
上記の課題を解決するために、請求項3に記載の発明は、請求項2に記載の回答データ処理装置において、前記第1低品質基準が、請求項2に記載の前記第1低品質基準である第1低品質基準(a)、又は、前記アンケートに対応する予備調査に含まれている前記質問と、当該アンケートに対応する本調査に含まれている前記質問と、が同旨であり、且つ当該各質問それぞれへの前記回答が相互に異なっていることである第1低品質基準(b)、のいずれかであり、前記抽出手段は、前記いずれかに該当する前記低品質回答に対応する前記低品質回答情報を前記取得された回答情報の中から抽出し、前記第1低品質基準(b)の方が前記第1低品質基準(a)よりも前記回答としての低品質となるように、各前記第1低品質基準のそれぞれが点数化されており、点数化された各前記第1低品質基準及び予め設定された削除数基準に基づいて、削除される前記低品質回答データの数を決定する決定手段を更に備え、前記削除手段は、前記決定された数の前記低品質回答データを前記取得された回答データから削除するように構成される。
【0022】
請求項3に記載の発明によれば、請求項2に記載の発明の作用に加えて、第1低品質基準(a)及び第1低品質基準(b)それぞれが点数化されており、その点数化された各第1低品質基準及び既定の削除数基準に基づいて決定された数の低品質回答データを回答データから削除するので、より客観的な低品質基準を用いて低品質回答データを抽出して削除することができる。
【0023】
上記の課題を解決するために、請求項4に記載の発明は、請求項1から請求項3のいずれか一項に記載の回答データ処理装置において、取得された複数の前記回答データを、予め設定されたクラスタ分析法により分類する低反応者クリーニング部等の分類手段を更に備え、前記第2低品質基準が、前記分類の結果が予め設定された低品質基準に該当することであり、前記抽出手段は、前記第2低品質基準に該当する前記低品質回答に対応する前記低品質回答データを前記取得された回答データの中から抽出するように構成される。
【0024】
請求項4に記載の発明によれば、請求項1から請求項3のいずれか一項に記載の発明の作用に加えて、第2低品質基準が、複数の回答データを既定のクラスタ分析法により分類した結果が既定の低品質基準に該当することであり、当該第2低品質基準に該当する低品質回答に対応する低品質回答データを回答データの中から抽出するので、適正な第2低品質基準を用いて低品質回答データを適格に抽出して削除することができる。
【0025】
上記の課題を解決するために、請求項5に記載の発明は、請求項4に記載の回答データ処理装置において、前記質問が、複数の選択肢を用いた選択式により前記回答を求める形式の質問であり、前記低品質基準及び「該当なし」の前記回答であることがそれぞれ点数化されており、前記点数化の点数及び予め設定された削除数基準に基づいて、削除される前記低品質回答データの数を決定する低反応者クリーニング部等の第2決定手段を更に備え、前記削除手段は、前記決定された数の前記低品質回答データを、前記取得された回答データから削除するように構成される。
【0026】
請求項5に記載の発明によれば、請求項4に記載の発明の作用に加えて、質問が複数の選択肢を用いた選択式により回答を求める形式の質問であり、低品質基準及び「該当なし」の回答であることがそれぞれ点数化されており、当該点数化の点数及び既定の削除数基準に基づいて決定された数の低品質回答データを回答データから削除する。よって、より客観的な基準を用いて低品質回答データを適格に抽出して削除することができる。
【0027】
上記の課題を解決するために、請求項6に記載の発明は、請求項1から請求項5のいずれか一項に記載の回答データ処理装置において、前記第3低品質基準が、前記回答が期待される前記回答者群に属する回答者数の全回答者数に対する割合と、前記異なる回答者群に属し且つ前記回答をした回答者数の前記全回答者数に対する割合と、の差が予め設定された基準以上であることであり、前記抽出手段は、前記第3低品質基準に該当する前記異なる回答者群に属する回答者による前記低品質回答に対応する前記低品質回答データを前記取得された回答データの中から抽出するように構成される。
【0028】
請求項6に記載の発明によれば、請求項1から請求項5のいずれか一項に記載の発明の作用に加えて、第3低品質基準が、回答が期待される回答者群に属する回答者数の割合と、当該回答者群と異なる回答者群に属し且つ上記回答をした回答者数の割合と、の差が既定の基準以上である場合に、当該異なる回答者群に属する回答者による低品質回答に対応する低品質回答データを回答データの中から抽出する。よって、適正な第3低品質基準を用いて低品質回答データを適格に抽出して削除することができる。
【0029】
上記の課題を解決するために、請求項7に記載の発明は、請求項1から請求項6のいずれか一項に記載の回答データ処理装置において、前記低品質回答データが削除された後の前記回答データに基づいて、当該削除された低品質回答データの数に対応した数の補完回答データであって前記削除された低品質回答データに代わる補完回答データを新たに生成する生成部等の生成手段を更に備える。
【0030】
請求項7に記載の発明によれば、請求項1から請求項6のいずれか一項に記載の発明の作用に加えて、低品質回答データが削除された後の回答データに基づいて、削除された低品質回答データの数に対応した数の補完回答データを新たに生成するので、低品質回答データが削除された回答データを用いることで、当該低品質回答データが削除され且つ回答数としても必要十分な回答データを取得することができる。
【0031】
上記の課題を解決するために、請求項8に記載の発明は、請求項7に記載の回答データ処理装置において、前記生成手段は、前記取得された回答データ全体の分布を参照して前記補完回答データを新たに生成するように構成される。
【0032】
請求項8に記載の発明によれば、請求項7に記載の発明の作用に加えて、元の回答データ全体の分布を参照して補完回答データを新たに生成するので、元の回答データの分布に対応しつつ、回答数としても必要十分な回答データを取得することができる。
【発明の効果】
【0033】
以上説明したように、本発明によれば、質問に対する回答を求める形式によりネットワークを介して実施されたアンケートに対応する回答データを複数取得し、その回答データの中から低品質回答に対応する低品質回答データを抽出して削除する。このとき、低品質回答を抽出するための低品質基準として第1低品質基準乃至第3低品質基準のいずれか又は全てを用いる。
【0034】
従って、アンケートの回答の集計時及びその後の当該回答の分析時に除外されるべき低品質回答を効果的に除外することができる。
【図面の簡単な説明】
【0035】
【
図1】第1実施形態の矛盾回答者の回答例を示す図である。
【
図2】第1実施形態の低反応者の回答例を示す図である。
【
図3】第1実施形態の統計分布的な低品質回答の回答例を示す図である。
【
図4】第1実施形態のアンケート回答処理装置の概要構成を示すブロック図である。
【
図5】第1実施形態のアンケート回答処理を示すフローチャートである。
【
図6】第2実施形態のアンケート回答処理装置の概要構成を示すブロック図である。
【発明を実施するための形態】
【0036】
次に、本発明を実施するための形態について、図面に基づいて説明する。なお、以下に説明する各実施形態は、スマートフォン等の端末装置を使用する者を対象として行われた質問形式のアンケート調査の結果としての回答から上記(ア)項乃至上記(ウ)項記載のような回答者による回答を削除することで、当該アンケート調査としての品質を高めるアンケート回答処理装置に対して本発明を適用した場合の実施の形態である。なお以下の説明において、上記(ア)項乃至上記(ウ)項記載のような回答者による回答を、纏めて「低品質回答」と称する。
【0037】
(I)
第1実施形態
初めに、本発明の第1実施形態について、
図1乃至
図5を用いて説明する。
【0038】
(A)
低品質回答について
初めに、第1実施形態のアンケート回答処理装置について説明する前に、当該アンケート回答処理装置によるアンケート回答処理の対象となる低品質回答について、具体例を用いて説明する。なお、
図1は第1実施形態の矛盾回答者の回答例を示す図であり、
図2は第1実施形態の低反応者の回答例を示す図であり、
図3は第1実施形態の統計分布的な低品質回答の回答例を示す図である。
【0039】
第1実施形態のアンケート回答処理の対象となる低品質回答は、上述したように、上記(ア)項記載の矛盾回答者による回答、上記(イ)項記載の低反応者による回答、及び上記(ウ)項記載の統計分布上の疑義がある回答を含んでいる。なお以下の説明において、上記(ア)項記載の矛盾回答者による回答を「矛盾回答」と称し、上記(イ)項記載の低反応者による回答を「低反応回答」と称し、上記(ウ)項記載の統計分布上の疑義がある回答を「分布疑義回答」と称する。
【0040】
そして、上記矛盾回答は、上記矛盾回答者による「異なる質問に対して相互に矛盾する回答」であり、その例としては、例えば
図1に示すように、ドリンク(飲料)の認知の有無及び実際の飲用の有無に関するアンケート調査の調査結果D1において、「知っている」なる質問項目について「×」を選択したにも拘わらず、「飲んだことがある」なる質問項目について「○」を選択した回答DX1が挙げられる。当該矛盾回答をした矛盾回答者は、結局のところ「そのドリンクは知らない」にも拘わらず「そのドリンクを飲んだ」と答えていることになり、これらの回答は相互に矛盾している、すなわち
図1に例示する回答DX1は上記矛盾回答の典型例であることになる。
【0041】
次に、上記低反応回答は、上記低反応者による「多数の選択肢のいずれにも該当しない旨の安易な(手抜きの)回答」であり、その例としては、例えば
図2に示すように、多数の飲料について飲んだことがあるか否かのアンケート調査の調査結果D2において、「あてはまるものはない」(すなわち、飲んだことがある飲料は一つもない)を選択した回答DX2が挙げられる。当該低反応回答をした低反応者については、
図2に例示するくらいの数の飲料が選択肢として挙げられているにも拘わらず、「あてはまるものはない」と回答することは、通常は考え難い。よって、
図2に例示する回答DX2の回答者は、例えば全ての選択肢を読むことが面倒になったと予想される回答者(低反応者)であることになる。
【0042】
最後に、上記分布疑義回答は、上記統計分布上の虚偽回答をしていると推測される回答者による回答であり、その例としては、例えば
図3に示すように、ある商品又はサービスの顧客データ全体の統計分布の中では十代の男性の割合は極めて少ない(
図3において「0.6」と示されている)にも拘わらず、その商品又はサービスについてのあるアンケート調査の調査結果D3では十代の男性が最も多く回答した回答DX3(
図3において「16.5」と示されている)が挙げられる。このような分布疑義回答をした回答者は、正当な回答者として扱われるには元の統計分布上の疑義があると考えられ、例えば上述したように、所定の目的のために虚偽の回答をしている可能性があると考えられる回答者であることになる。
【0043】
(B)
第1実施形態のアンケート回答処理装置について
次に、上記端末装置を使用する者を対象として行われた質問形式のアンケート調査の結果である回答から上記低品質回答を削除する第1実施形態のアンケート回答処理装置について、
図4及び
図5を用いて具体的に説明する。なお、
図4は第1実施形態のアンケート回答処理装置の概要構成を示すブロック図であり、
図5は第1実施形態のアンケート回答処理を示すフローチャートである。このとき
図4においては、「データベース」を適宜「DB」と表している。また
図5に示すフローチャートでは、時系列的な処理の流れを実線矢印で、各処理におけるデータの流れを破線矢印で、それぞれ示している。
【0044】
図4に示すように、第1実施形態のアンケート回答処理装置Sは、具体的には例えばサーバコンピュータやパーソナルコンピュータ等により実現されるものであり、CPU等からなる処理部1と、HDD(Hard Disk Drive)又はSSD(Solid State Drive)等からなる記録部2と、キーボード及びマウス等からなる操作部3と、液晶ディスプレイ等からなるディスプレイ4と、により構成されている。
【0045】
また処理部1は、矛盾回答者クリーニング部10と、低反応者クリーニング部11と、統計分布クリーニング部12と、生成部13と、により構成されている。
【0046】
このとき、矛盾回答者クリーニング部10、低反応者クリーニング部11、統計分布クリーニング部12及び生成部13は、処理部1を構成するCPU等を含むハードウェアロジック回路により実現されてもよいし、後述する(
図5参照)第1実施形態のアンケート回答処理に相当するプログラムを上記CPU等が読み込んで実行することにより、ソフトウェア的に実現されてもよい。このとき上記プログラムは、記録部2に予め記録されているものを上記CPU等が読み込んでもよいし、図示しない外部のサーバ装置に記録されている当該プログラムをインターネット等のネットワークを介して上記CPU等が取得して用いるように構成してもよい。
【0047】
そして、処理部1が本発明の「回答データ取得手段」の一例に相当し、矛盾回答者クリーニング部10、低反応者クリーニング部11及び統計分布クリーニング部12が本発明の「抽出手段」の一例及び「削除手段」の一例にそれぞれ相当し、矛盾回答者クリーニング部10が本発明の「決定手段」の一例に相当する。また、低反応者クリーニング部11が本発明の「分類手段」の一例及び「第2決定手段」の一例にそれぞれ相当し、生成部13が本発明の「生成手段」の一例に相当する。
【0048】
以上の構成において、アンケート回答処理装置Sの処理部1は、調査結果データベース100及び統計データベース102にそれぞれ接続可能とされている。このとき、調査結果データベース100は、上記端末装置の使用者を対象として行われた質問形式のアンケート調査の結果(回答)としての回答データであって、当該回答の内容を示す内容データと、当該回答又はその回答者を識別するための識別データと、を含む回答データを格納するデータベースである。そして、調査結果データベース100に格納されている回答データには、上記低品質回答の回答データ(
図1乃至
図3参照)と、当該低品質回答ではない(すなわち、通常の正当な)回答の回答データと、が含まれている。これに対し、統計データベース102は、例えば公的な機関や地方自治体等が行った種々の且つ一般的な統計データを格納するデータベースである。これらの調査結果データベース100及び統計データベース102それぞれのデータは、記録部2に予め記録されているものであってもよいし、第1実施形態のアンケート回答処理が実行される度に図示しない外部のサーバ装置等からインターネット等のネットワークを介して取得されるものであってもよい。
【0049】
そして、アンケート回答処理装置Sでは、上記調査結果データベース100及び上記統計データベース102を用いつつ、調査結果データベース100を構成する回答データから低品質回答の回答データを削除する。これに加えてアンケート回答処理装置Sは、低品質回答の回答データを削除した後の調査結果データベース100を構成する回答データに基づき、当該削除前の調査結果データベース100を構成する回答データを参照しつつ、当該削除した回答データの総数に相当する数(例えば当該削除した回答データの数と同数)の補完回答データを生成する。なお、当該補完回答データの生成方法については、後ほど詳述する。
【0050】
その後アンケート回答処理装置Sは、上記削除後の調査結果データベース100に対して上記生成された補完回答データを加えて新たな高品質データベース103を生成する。このとき、新たに生成された高品質データベース103を構成する回答データの数は、低品質回答の回答データを削除する前の調査結果データベース100を構成する回答データの数と同一となる。
【0051】
より具体的に、先ずアンケート回答処理装置Sの処理部1の矛盾回答者クリーニング部10は、予め設定された矛盾回答の削除方法を用いて、調査結果データベース100を構成する回答データから矛盾回答の回答データを削除する。この矛盾回答の削除方法については、後ほど詳述する。
【0052】
次に処理部1の低反応者クリーニング部11は、予め設定された低反応回答の削除方法を用いて、調査結果データベース100を構成する回答データから低反応回答の回答データを削除する。この低反応回答の削除方法についても、後ほど詳述する。低反応者クリーニング部11による低反応回答の回答データの削除は、上記矛盾回答者クリーニング部10による矛盾回答の回答データの削除と並行して実行される。
【0053】
最後に処理部1の統計分布クリーニング部12は、予め設定された分布疑義回答の削除方法を用いて、統計データベース102に格納されている上記統計データに基づき、調査結果データベース100を構成する回答データから分布疑義回答の回答データを削除する。この分布疑義回答の削除方法についても、後ほど詳述する。統計分布クリーニング部12による分布疑義回答の回答データの削除は、上記矛盾回答者クリーニング部10による矛盾回答の回答データの削除及び上記低反応者クリーニング部11による低反応回答の回答データの削除それぞれと並行して実行される。
【0054】
そして、調査結果データベース100を構成する回答データから、矛盾回答、低反射回答及び分布疑義回答それぞれの回答データが削除された後の回答データは、クリーニング済みデータベース101として記録部2に一時的に記録される。
【0055】
次に、処理部1の生成部13は、矛盾回答者クリーニング部10、低反応者クリーニング部11及び統計分布クリーニング部12によりそれぞれ削除された回答データの数の総数と同数の上記補完回答データを、低品質回答の回答データの削除後の調査結果データベース100を構成する回答データに基づき、当該削除前の調査結果データベース100を構成する回答データを参照しつつ生成する。その後生成部13は、低品質回答の回答データを削除した後の調査結果データベース100に対して上記生成された補完回答データを加える。これにより生成部13は、上記高品質データベース103を構成すべき回答データであって、低品質回答の回答データを削除する前の調査結果データベース100を構成する回答データの数と同数の高品質の回答データを生成し、これらを上記高品質データベース103に格納する。
【0056】
なお、上述してきた各機能を実行するに当たって必要な操作は操作部3において実行され、当該操作に対応する操作信号が処理部1に出力される。これにより処理部1は、当該操作信号に基づき、上述してきた一連の機能を実行する。また、当該機能の実行に当たって必要な情報は、例えばディスプレイ4に表示され、アンケート回答処理装置Sの操作者等に提示される。
【0057】
次に、アンケート回答処理装置Sにおいて実行される第1実施形態のアンケート回答処理について、具体的に
図4及び
図5を用いて説明する。
【0058】
上述した機能を有するアンケート回答処理装置Sにより実行される第1実施形態のアンケート回答処理は、例えばアンケート回答処理装置Sの図示しない電源スイッチがオンとされたタイミングから開始される。なお、第1実施形態のアンケート回答処理の対象となる回答データは、予め調査結果データベース100に格納されているものとする。
【0059】
当該アンケート回答処理が開始されると、先ず、アンケート回答処理装置Sの処理部1は、当該アンケート回答処理の対象となる回答データを調査結果データベース100から取得する(ステップS1)。その後、調査結果データベース100から取得された回答データは、矛盾回答者クリーニング部10、低反応者クリーニング部11及び統計分布クリーニング部12に対して、それぞれに並行して同様に出力される。その後、調査結果データベース100から取得された回答データに対して、矛盾回答者クリーニング部10は上述した矛盾回答の削除処理(矛盾回答者クリーニング処理)を実行し(ステップS2)、低反応者クリーニング部11は上記低反応回答の削除処理(低反応者クリーニング処理)を実行し(ステップS3)、統計分布クリーニング部12は上記分布疑義回答の削除処理(統計分布クリーニング処理)を実行する(ステップS4)。そして、上記矛盾回答、上記低反応回答及び上記分布疑義回答がそれぞれ削除された調査結果データベース100の回答データは、それぞれ、クリーニング済みデータベース101に一時的に格納される。このとき、元の調査結果データベース100に格納されている回答データの数(換言すれば回答者の数。各データベースにおける回答データの数について、以下同様。)が1,000個であり、上記矛盾回答者クリーニング処理(ステップS2)により50個の回答が削除され、上記低反応者クリーニング処理(ステップS3)により100個の回答が削除され、上記統計分布クリーニング処理(ステップS4)により30個の回答が削除された場合に、クリーニング済みデータベース101に格納される回答データの数は820個であることになる。
【0060】
(a)第1実施形態の矛盾回答者クリーニング処理について
ここで、上記ステップS2の矛盾回答者クリーニング処理について、より具体的に説明する。当該矛盾回答者クリーニング処理においては、上記ステップS1で調査結果データベース100から取得した回答データにより示される回答の中から矛盾回答を判別するための判別手順(以下、当該判別手順を「矛盾回答判別手順」と称する)が予め設定されている。当該矛盾回答判別手順は、それを実現するためのプログラム等であって例えば記録部2に予め記録されているプログラム等を矛盾回答者クリーニング部10が読み出して実行することにより実現される。なお、第1実施形態の矛盾回答判別手順は、矛盾回答者クリーニング部10として固定化されたものではなく、例えば第1実施形態の矛盾回答者として排除されるべき回答者の属性等に基づいて変更可能とされている。また、以下に例示する第1実施形態の矛盾回答判別手順の複数の例については、それらを単独で用いてもよいし、二以上の当該判別手順を組み合わせて用いてもよい。
【0061】
そして、このような矛盾回答判別手順の第1例としては、
図1を用いて説明した回答DX1のように、一のアンケート調査に含まれている(又は一のアンケート調査に対応する)複数の質問それぞれへの回答が相互に矛盾している場合に、当該各回答を上記矛盾回答と判別する判別手順が挙げられる。
【0062】
次に、矛盾回答判別手順の第2例としては、上記矛盾回答判別手順の第1例のより具体的な例として、調査結果データベース100に記録されている回答データが得られたアンケート調査に対応する予備調査(いわゆるスクリーニング調査)に含まれている質問と、当該アンケート調査に対応する本調査に含まれている質問と、が同旨であるにも拘わらず、当該各質問それぞれへの回答が相互に異なっている(すなわち矛盾している)場合に、上記予備調査及び上記本調査それぞれにおける当該回答を上記矛盾回答と判別する判別手順が挙げられる。
【0063】
次に、矛盾回答判別手順の第3例として、矛盾回答における矛盾の程度を予め点数化(スコア化。以下同様。)しておくことが挙げられる。より具体的に、上記矛盾回答判別手順の第1例により矛盾回答と判別された回答をした回答者に対応する点数(スコア。以下同様。)を例えば「-100点」としてその旨を当該回答者に関連付けて記録し、上記矛盾回答判別手順の第2例により矛盾回答と判別された回答をした回答者の点数を「-70点」としてその旨を当該回答者に関連付けて記録する。そして、当該回答者ごとに点数を加算し、加算後の点数(負の数)が相対的に大きい回答者ほど矛盾回答者としての順位が低い(換言すれば、正常な回答者に近いことになる。以下同様。)回答者としてランキングする手順が挙げられる。
【0064】
最後に、矛盾回答判別手順の第4例として、上記矛盾回答判別手順の第1例乃至第3例で矛盾回答と判別された回答の回答データそれぞれの実際の削除方法の例としては、以下の方法が挙げられる。
(あ)矛盾回答と判別された回答の回答データを調査結果データベース100から全て削除すると共に、当該矛盾回答をした回答者(つまり矛盾回答者)の全てを、そのアンケートの集計対象から除外する方法
(い)上記第3例で矛盾回答と判別された回答の矛盾回答者につき、当該矛盾回答としての点数に応じてアンケートの集計対象から除外する方法。より具体的には、例えば、矛盾回答としての点数の集計結果が高い順に上位200人までの矛盾回答者を上記集計対象から除外する方法や、当該集計結果が高い矛盾回答者のうち上位10パーセントまでを上記集計対象から除外する方法が挙げられる。
【0065】
(b)第1実施形態の低反応者クリーニング処理について
次に、上記ステップS3の低反応者クリーニング処理について、より具体的に説明する。当該低反応者クリーニング処理では、上記ステップS1で調査結果データベース100から取得した回答データにより示される回答の中から低反応回答を判別するための判別手順(以下、当該判別手順を「低反応回答判別手順」と称する)が予め設定されている。当該低反応回答判別手順は、それを実現するためのプログラム等であって例えば記録部2に予め記録されているプログラム等を低反応者クリーニング部11が読み出して実行することにより実現される。なお、第1実施形態の低反応回答判別手順は、低反応者クリーニング部11として固定化されたものではなく、例えば第1実施形態の矛盾回答者として排除されるべき回答者の属性等に基づいて変更可能とされている。また、以下に例示する第1実施形態の低反応回答判別手順の複数の例については、それらを単独で用いてもよいし、二以上の当該判別手順を組み合わせて用いてもよい。
【0066】
そして、このような低反応回答判別手順の第1例としては、調査結果データベース100に記録されている回答データを対象としていわゆるクラスタ分析法による分析を行い、当該分析(分類)されたクラスタの中で最も低反応な(すなわち、質問における具体的な選択肢の選択が最も少ない)クラスタに属する回答者(低反応者)の回答を低反応回答と判別する判別手順が挙げられる。
【0067】
次に、低反応回答判別手順の第2例としては、
図2を用いて説明した回答DX2のように、一の質問における複数(多数)の選択肢について「該当する選択肢が一つもない」と回答した回答者(低反応者)の回答を低反応回答と判別する判別手順が挙げられる。
【0068】
また、低反応回答判別手順の第3例としては、複数の質問の全てについて「該当しない」と回答した回答者(低反応者)の回答を低反応回答と判別する判別手順が挙げられる。
【0069】
更に、低反応回答判別手順の第4例として、低反応回答における低反応の程度を予め点数化しておくことが挙げられる。より具体的に、上記低反応回答判別手順の第1例における最も低反応なクラスタに属する回答者に対応する点数を例えば「-90点」としてその旨を当該回答者に関連付けて記録し、上記低反応回答判別手順の第2例により低反応回答と判別された回答をした回答者の点数を「-30点」としてその旨を当該回答者に関連付けて記録し、上記低反応回答判別手順の第3例(質問数が三つの場合)により低反応回答と判別された回答をした回答者の点数を「-150点」としてその旨を当該回答者に関連付けて記録する。そして、当該回答者ごとに点数を加算し、加算後の点数(負の数)が相対的に大きい回答者ほど低反応者としての順位が低い回答者としてランキングする手順が挙げられる。
【0070】
最後に、低反応回答判別手順の第5例として、上記低反応回答判別手順の第1例乃至第4例で低反応回答と判別された回答の回答データそれぞれの実際の削除方法の例としては、以下の方法が挙げられる。
(あ)低反応回答と判別された回答の回答データを調査結果データベース100から全て削除すると共に、当該低反応回答をした回答者(つまり低反応者)の全てを、そのアンケートの集計対象から除外する方法
(い)上記第4例で低反応回答と判別された回答の低反応者につき、当該低反応回答としての点数に応じてアンケートの集計対象から除外する方法。より具体的には、例えば、低反応回答としての点数の集計結果が高い順に上位200人までの低反応者を上記集計対象から除外する方法、又は、当該集計結果が高い低反応者のうち上位10パーセントまでを上記集計対象から除外する方法
(う)上記低反応回答判別手順の第1例における最も低反応なクラスタに属する回答者の中で予め設定された三つの質問の全てについて「該当しない」と回答した回答者を上記集計対象から除外する方法
(え)上記矛盾回答者と上記低反応者とを合せて上記集計対象から除外する場合の上限を予め設定し、その上限以下の回答者を上記集計対象から除外する方法
【0071】
(c)第1実施形態の統計分布クリーニング処理について
次に、上記ステップS4の統計分布クリーニング処理について、より具体的に説明する。当該統計分布クリーニング処理では、上記ステップS1で調査結果データベース100から取得した回答データにより示される回答の中から、統計データベース102に格納されている上記統計データに基づいて分布疑義回答を判別するための判別手順(以下、当該判別手順を「分布疑義回答判別手順」と称する)が予め設定されている。当該分布疑義回答判別手順は、それを実現するためのプログラム等であって例えば記録部2に予め記録されているプログラム等を統計分布クリーニング部12が読み出して実行することにより実現される。なお、第1実施形態の分布疑義回答判別手順は、統計分布クリーニング部12として固定化されたものではなく、例えば第1実施形態の分布疑義回答をしたとして排除したい回答者の属性等に基づいて変更可能とされている。また、以下に例示する第1実施形態の分布疑義回答判別手順の複数の例については、それらを単独で用いてもよいし、二以上の当該判別手順を組み合わせて用いてもよい。
【0072】
そして、このような分布疑義回答判別手順の第1例としては、統計データベース102に格納されている上記統計データに基づき、調査結果データベース100に回答データが記録されている回答において統計的に不適切なセグメントに属する回答者からの当該回答(
図3符号「DX3」参照)を上記分布疑義回答と判別する判別手順が挙げられる。
【0073】
より具体的に例えば、上記統計データが性別及び年代別で十歳刻みのセグメントで統計が取られているとする。そして、調査結果データベース100に回答データが格納されている回答者を上記統計データと同様に性別及び年代別で十歳刻みのセグメントに分けたとき、当該セグメントごとの回答者数が、対応する上記統計データのセグメントに属する者の数から±10パーセント以上ずれている場合(例えば、統計データ上は男性十代が3パーセントしかいないはずなのに、調査結果データベース100に回答データが格納されている回答者で男性十代が18パーセントであった場合等)に、調査結果データベース100に回答データが格納されている当該男性十代の回答者の回答を上記分布疑義回答と判別する。
【0074】
次に、分布疑義回答判別手順の第2例としては、第1実施形態の統計分布クリーニング処理として、上記第1例と同様にセグメント化された統計データのセグメント(以下、「統計データセグメント」と称する)と調査結果データベース100に格納されている回答データのセグメント(以下、「回答データセグメント」と称する)とを比較し、対応する統計データセグメントの回答数に対応していない回答数の回答データセグメントに属する回答者数が、上記対応する統計データセグメントの回答数から±5パーセントのずれの範囲になるまで、回答データセグメントごとに同じ規則に沿ってそれに属する回答データを削減することとする。そして、その削減の対象となる回答データの回答を上記分布疑義回答と判別する判別手順が挙げられる。このとき、削除の対象となる上記回答データセグメントの回答の回答者について、例えば、上記矛盾回答者又は上記低反応者としての点数化における上位者から(すなわち、矛盾回答者又は低反応者に該当する蓋然性が高い回答者から)順に削減の対象とする。
【0075】
上記矛盾回答者クリーニング処理(ステップS2)、上記低反応者クリーニング処理(ステップS3)及び上記統計分布クリーニング処理(ステップS4)により、それぞれ低品質回答が削除されると、次に処理部1の生成部13は、低品質回答の回答データを削除した後の調査結果データベース100を構成する回答データに基づき、当該削除前の調査結果データベース100を構成する回答データを参照しつつ、例えば上記特開2021-179865号公報に記載された本発明の発明者等によるデータ生成方法を用いて、削除された低品質回答の回答データの数の総数と同数の上記補完回答データを新たに生成する(ステップS5)。このステップS5における上記補完回答データの生成に当たって、上記特開2021-179865号公報に記載されたAIを用いたデータ生成方法を用いれば、その補完回答データにより補完された回答データ全体の品質を向上させることができることになる。
【0076】
より具体的に、上記矛盾回答者クリーニング処理(ステップS2)により50個の回答が削除され、上記低反応者クリーニング処理(ステップS3)により100個の回答が削除され、上記統計分布クリーニング処理(ステップS4)により30個の回答が削除された場合に、生成部13は、上記データ生成方法等を用いて新たに180個の補完回答データを生成する。その後生成部13は、低品質回答の回答データを削除した後の調査結果データベース100の回答データを上記クリーニング済みデータベース101から取得し、当該取得した回答データに対して上記ステップS5で生成された補完回答データを追加する(ステップS6)。これにより生成部13は、低品質回答の回答データを削除する前の調査結果データベース100を構成する回答データの数と同数の高品質な回答データを生成し、これらを上記高品質データベース103に格納する(ステップS6)。
【0077】
その後処理部1は、例えば操作部3による終了操作等により第1実施形態のアンケート回答処理を終了するか否かを判定する(ステップS7)。ステップS7の判定において、当該アンケート回答処理を終了する場合(ステップS7:YES)、処理部1は、そのまま当該アンケート回答処理を終了する。一方、ステップS7の判定において、例えば他の調査結果データベース100を対象として当該アンケート回答処理を継続する場合(ステップS7:NO)、処理部1は、上記ステップS1に戻り、上記他の調査結果データベース100を対象として上述してきた処理を継続する。
【0078】
以上説明したように、第1実施形態のアンケート回答処理装置Sによるアンケート回答処理によれば、質問に対する回答を求める形式によりネットワークを介して実施されたアンケート調査に対応する回答データを複数取得し(
図5ステップS1参照)、その回答データの中から低品質回答の回答データを抽出して削除する(
図5ステップS2乃至ステップS4参照)。このとき、低品質回答の回答データとして矛盾回答(
図5ステップS2参照)の回答データ、低反応回答(
図5ステップS3参照)の回答データ及び分布疑義回答(
図5ステップS4参照)の回答データをそれぞれ削除するので、アンケートの回答の集計時及びその後の当該回答の分析時に除外されるべき低品質回答の回答データを効果的に除外(削除)することができる。
【0079】
また、上記矛盾回答判別手順の第1例乃至上記矛盾回答判別手順の第4例を用いて矛盾回答の回答データを判別する場合(
図5ステップS2参照)は、適格且つ適正に当該矛盾回答の回答データを抽出して削除することができる。
【0080】
このとき、上記矛盾回答判別手順の第3例又は第4例を用いて矛盾回答の回答データを判別する場合(
図5ステップS2参照)は、点数化による客観的な基準を用いて低品質回答の回答データを抽出して削除することができる。
【0081】
更に、上記低反応回答判別手順の第1例乃至上記低反応回答判別手順の第3例を用いて低反射回答の回答データを判別する場合(
図5ステップS3参照)は、適正な基準を用いて低反応回答の回答データを適格に抽出して削除することができる。
【0082】
更にまた、上記低反応回答判別手順の第4例を用いる場合には、より客観的な基準を用いて低反射回答の回答データを削除することができる。
【0083】
また、上記分布疑義回答判別手順により分布疑義回答の回答データを判別する場合(
図5ステップS4参照)は、適正な基準を用いて分布疑義回答の回答データを適格に抽出して削除することができる。
【0084】
更に、低品質回答の回答データが削除された後の回答データに基づいて、削除された低品質回答の数と同数の補完回答の補完回答データを新たに生成するので(
図5ステップS5及びステップS6参照)、低品質回答の回答データが削除された後の回答データを用いることで、低品質回答の回答データが削除され且つ回答データの数としても必要十分な高品質データベース103を構築することができる。
【0085】
このとき、上記補完回答データの生成に当たって例えばAIを用いたデータ生成方法を用いれば、その補完回答データにより補完された回答データ全体(すなわち、アンケート調査の補完された回答の回答データ全体)の品質を向上させることができる。また、上記ステップS5及びステップS6により生成される補完回答データの数は、上記削除された低品質回答の数と同数である他に、当該削除された低品質回答の数より少ない数であって当該削除された低品質回答の数に対応する数であってもよい。
【0086】
更にまた、補完回答データの生成に当たって、元の調査結果データベース100における分布を参照して補完回答データが新たに生成されるので、元の調査結果データベース100の分布に対応しつつ、回答数としても必要十分な高品質データベース103を構築することができる。
【0087】
なお、
図5に示す第1実施形態のアンケート回答処理においては、上記矛盾回答者クリーニング処理(ステップS2)、上記低反応者クリーニング処理(ステップS3)、及び上記統計分布クリーニング処理(ステップS4)が並行して実行される場合について説明したが、これ以外に、これらのクリーニング処理が直列に、すなわち、上記矛盾回答者クリーニング処理(ステップS2)→上記低反応者クリーニング処理(ステップS3)→上記統計分布クリーニング処理(ステップS4)の順に、時系列的に各クリーニング処理が実行されてもよい。
【0088】
また、上述した第1実施形態のアンケート回答処理では、当該アンケート回答処理における削除の対象となる低品質回答の回答データが、上述した矛盾回答の回答データ、低反応回答の回答データ又は分布疑義回答の回答データである場合について説明した。しかしながら、当該削除の対象となる低品質回答の回答データとしては、上記矛盾回答等の回答データに加えて、アンケート調査の回答者がそれに含まれる質問に回答するのに要した回答所要時間が予め設定された閾値よりも短い低時間回答の回答データを加えてもよい。この場合は、上述した矛盾回答の回答データ、低反応回答の回答データ又は分布疑義回答の回答データ或いは上記低時間回答の回答データのいずれか又は全てに該当する回答データを削除するように構成すればよい。
【0089】
(II)
第2実施形態
次に、本発明の他の実施形態である第2実施形態について、
図6を用いて説明する。なお、
図6は第2実施形態のアンケート回答処理装置の概要構成を示すブロック図である。
【0090】
上述した第1実施形態のアンケート回答処理では、調査結果データベース100から低品質回答の回答データを削除すると共に当該削除数と同数の補完回答データを新たに生成し、これらにより、低品質回答の回答データを削除する前の調査結果データベース100を構成する回答データの数と同数の高品質な回答データを生成して上記高品質データベース103に格納した。これに対し、以下に説明する第2実施形態のデータベース生成処理では、生成部13により新たな回答データを更に生成し、第1実施形態の高品質データベース103の回答データ数よりも更に回答データの数を増やした、例えば仮想市場データベースとしての新たな大規模データベースを生成する。
【0091】
なお、第2実施形態のアンケート回答処理装置のハードウェア的な構成は、基本的には第1実施形態のアンケート回答処理装置Sのハードウェア的な構成と同一である。よって以下の説明では、当該アンケート回答処理装置Sと同様の部材については同一の部材番号を付して細部の説明は省略する。
【0092】
図6に示すように、第2実施形態のアンケート回答処理装置S1の処理部1Aの生成部13Aは、第1実施形態の生成部13の機能に加えて、例えば統計データベース102を構成する統計データの分布等を参照しつつ、高品質データベース103の回答データに基づき、上記生成部13と同様の方法により、例えば高品質データ103の数に対応して予め設定された数の新たな回答データを更に生成する。
【0093】
その後、生成部13Aは、当該新たに生成された回答データと、高品質データベース103に既に格納されている回答データと、を合せて(すなわち回答データの拡張を行って)、第2実施形態の大規模データベース110を構成する回答データを生成し、当該大規模データベース110に格納する。
【0094】
以上説明した第2実施形態のアンケート回答処理によれば、第1実施形態のアンケート回答処理と同様の効果に加えて、大規模データベース110を簡易に構築することができるという効果を奏する。
【0095】
これに加えて、上述した第2実施形態のアンケート回答処理によれば、第1実施形態と同様の(例えばAIを用いて生成された)補完回答データを用いた回答データの拡張を行って大規模な仮想市場データベースを構築する場合に、その仮装市場データベースに含まれるデータの品質をも向上させることができる。
【産業上の利用可能性】
【0096】
以上それぞれ説明したように、本発明はデータベースを構成する回答データの処理の分野に利用することが可能であり、特に当該回答データの高品質化の分野に適用すれば特に顕著な効果が得られる。
【符号の説明】
【0097】
1、1A 処理部
2 記録部
3 操作部
4 ディスプレイ
10 矛盾回答者クリーニング部
11 低反応者クリーニング部
12 統計分布クリーニング部
13、13A 生成部
100 調査結果データベース
101 クリーニング済みデータベース
102 統計データベース
103 高品質データベース
110 大規模データベース
S、S1 アンケート回答処理装置
D1、D2、D3 調査結果
DX1、DX2、DX3 回答