特許第6482338号(P6482338)IP Force 特許公報掲載プロジェクト 2022.1.31 β版

知財求人 - 知財ポータルサイト「IP Force」

▶ 株式会社エヌ・ティ・ティ・データの特許一覧 ▶ 株式会社NTTデータ数理システムの特許一覧

特許6482338質問表回答テストデータ生成システム、質問表回答テストデータ生成方法及びプログラム
<>
  • 特許6482338-質問表回答テストデータ生成システム、質問表回答テストデータ生成方法及びプログラム 図000009
  • 特許6482338-質問表回答テストデータ生成システム、質問表回答テストデータ生成方法及びプログラム 図000010
  • 特許6482338-質問表回答テストデータ生成システム、質問表回答テストデータ生成方法及びプログラム 図000011
  • 特許6482338-質問表回答テストデータ生成システム、質問表回答テストデータ生成方法及びプログラム 図000012
  • 特許6482338-質問表回答テストデータ生成システム、質問表回答テストデータ生成方法及びプログラム 図000013
  • 特許6482338-質問表回答テストデータ生成システム、質問表回答テストデータ生成方法及びプログラム 図000014
  • 特許6482338-質問表回答テストデータ生成システム、質問表回答テストデータ生成方法及びプログラム 図000015
  • 特許6482338-質問表回答テストデータ生成システム、質問表回答テストデータ生成方法及びプログラム 図000016
  • 特許6482338-質問表回答テストデータ生成システム、質問表回答テストデータ生成方法及びプログラム 図000017
< >
(19)【発行国】日本国特許庁(JP)
(12)【公報種別】特許公報(B2)
(11)【特許番号】6482338
(24)【登録日】2019年2月22日
(45)【発行日】2019年3月13日
(54)【発明の名称】質問表回答テストデータ生成システム、質問表回答テストデータ生成方法及びプログラム
(51)【国際特許分類】
   G06Q 50/10 20120101AFI20190304BHJP
【FI】
   G06Q50/10
【請求項の数】5
【全頁数】24
(21)【出願番号】特願2015-56652(P2015-56652)
(22)【出願日】2015年3月19日
(65)【公開番号】特開2016-177490(P2016-177490A)
(43)【公開日】2016年10月6日
【審査請求日】2018年1月26日
(73)【特許権者】
【識別番号】000102728
【氏名又は名称】株式会社エヌ・ティ・ティ・データ
(73)【特許権者】
【識別番号】596065223
【氏名又は名称】株式会社NTTデータ数理システム
(74)【代理人】
【識別番号】110001634
【氏名又は名称】特許業務法人 志賀国際特許事務所
(72)【発明者】
【氏名】鍋谷 昴一
(72)【発明者】
【氏名】田辺 隆人
【審査官】 衣川 裕史
(56)【参考文献】
【文献】 特開2014−170494(JP,A)
【文献】 特開2014−186407(JP,A)
【文献】 特開2014−236858(JP,A)
【文献】 特開2007−102523(JP,A)
【文献】 特開2006−236035(JP,A)
【文献】 特開2001−175684(JP,A)
【文献】 特表2012−529716(JP,A)
【文献】 米国特許出願公開第2014/0115438(US,A1)
(58)【調査した分野】(Int.Cl.,DB名)
G06Q 10/00−99/00
G06F 11/07−11/36
(57)【特許請求の範囲】
【請求項1】
3個以上の質問としての回答項目を有する質問表から得られる、回答項目に対する答えである選択肢の選択による回答結果を示す質問表回答テストデータを、前記回答項目間の関連性に対応させて、前記回答項目における複数の選択肢の組合せにおける所定の回答パターンが任意の回答数となるように生成する質問表回答テストデータ生成システムであり、
前記回答項目及び当該回答項目毎における選択肢を入力する回答項目入力部と、
前記回答項目の前記選択肢における回答比率の合計である単純集計比率を設定する単純集計入力部と、
前記回答項目の各選択肢の組合せからなる回答パターンにおいて、所定の回答パターンの回答比率を制約する制約値を入力する制約値入力部と、
前記回答項目の2個をそれぞれ組合せて、当該2個の回答項目の選択肢からなる回答パターンの回答確率と、当該回答パターンに対応する当該2個の回答項目の単純集計の回答確率の積との差分が所定の範囲内とする目的関数下において、前記制約値に対応した前記質問表回答テストデータを生成する数理計画部と、
を備えることを特徴とする質問表回答テストデータ生成システム。
【請求項2】
前記制約値を満足させて、前記目的関数の前記差分が最も小さくなるように、前記テストデータを生成する
ことを特徴とする請求項1に記載の質問表回答テストデータ生成システム。
【請求項3】
前記回答パターン毎の前記回答確率の範囲内において、乱数を回答者数と同一数発生させ、前記乱数が対応する回答確率の前記回答パターンに対して前記回答者数を振り分ける回答者振分部をさらに有する
ことを特徴とする請求項1または請求項2に記載の質問表回答テストデータ生成システム。
【請求項4】
3個以上の質問としての回答項目を有する質問表から得られる、回答項目に対する答えである選択肢の選択による回答結果を示す質問表回答テストデータを、前記項目間の関連性に対応させて、前記回答項目における複数の選択肢の組合せにおける所定の回答パターンが任意の回答数となるように生成する質問表回答テストデータ生成方法であり、
回答項目入力部が、前記回答項目及び当該回答項目毎における選択肢を入力する回答項目入力過程と、
単純集計入力部が、前記回答項目の前記選択肢における回答比率の合計である単純集計比率を設定する単純集計比率入力過程と、
制約値入力部が、前記回答項目の各選択肢の組合せからなる回答パターンにおいて、所定の回答パターンの回答比率を制約する制約値を入力する制約値入力過程と、
数理計画部が、前記回答項目の2個をそれぞれ組合せて、当該2個の回答項目の選択肢からなる回答パターンの回答確率と、当該回答パターンに対応する当該2個の回答項目の単純集計の回答確率の積との差分が所定の範囲内とする目的関数下において、前記制約値に対応した前記質問表回答テストデータを生成する数理計画過程と、
を含むことを特徴とする質問表回答テストデータ生成方法。
【請求項5】
3個以上の質問としての回答項目を有する質問表から得られる、回答項目に対する答えである選択肢の選択による回答結果のア質問表回答テストデータを、前記項目間の関連性に対応させて、前記回答項目における複数の選択肢の組合せにおける所定の回答パターンが任意の回答数となるように生成する質問表回答テストデータ生成システムの動作をコンピュータに実行させるためのプログラムであり、
コンピュータを、
前記回答項目及び当該回答項目毎における選択肢を入力する回答項目入力手段、
前記回答項目の前記選択肢における回答比率の合計である単純集計比率を設定する単純集計比率入力手段、
前記回答項目の各選択肢の組合せからなる回答パターンにおいて、所定の回答パターンの回答比率を制約する制約値を入力する制約値入力手段、
前記回答項目の2個をそれぞれ組合せて、当該2個の回答項目の選択肢からなる回答パターンの回答確率と、当該回答パターンに対応する当該2個の回答項目の単純集計の回答確率の積との差分が所定の範囲内とする目的関数下において、前記制約値に対応した前記質問表回答テストデータを生成する数理計画手段、
として機能させるためのプログラム。
【発明の詳細な説明】
【技術分野】
【0001】
本発明は、数理計画法を用いて尤もらしい個別解を回答結果から求める質問表回答テストデータ生成システム、質問表回答テストデータ生成方法及びプログラムに関する。
【背景技術】
【0002】
従来から、質問表を用いたアンケート調査等を行って、アンケートの回答情報に対してクロス集計を行い、アンケート結果の解析を支援するアンケート解析支援装置がある(例えば、特許文献1参照)。
このようなアンケート解析支援装置を作成する際、このアンケート解析支援装置が出力するアンケートの解析結果が、想定された数値であるかかどうかのテストが行われる。このテストを実施するためには、テストするテストデータ(後述する質問回答テストデータ)が必要となる。
【0003】
すなわち、所定の知見が結論として得られるようなリアルなテストデータを用いてテストを行い、アンケート解析支援装置のデバッグを行う必要がある。ある程度複雑な解析結果を出力するようなアンケート解析支援装置をテストする場合、解析結果に対して有意(所定の知見)な結論がある程度反映されるようなテストデータでテストを行わないと、アンケート解析支援装置が正しく解析結果を出力しているか否かが判らない。
したがって、ある結論が導かれ、かつ尤もらしいテストデータが、アンケート解析結果支援装置のデバッグには必要となる。
【先行技術文献】
【特許文献】
【0004】
【特許文献1】特開2013−90297号公報
【発明の概要】
【発明が解決しようとする課題】
【0005】
上述したテストデータは、乱数を用いてアンケートの回答者数をアンケートの回答パターン(例えば、質問に対する選択肢の組合せ)毎に振り分けることで生成されていた。
しかしながら、アンケートの回答項目が3つ以上であり、かつ回答項目間の関連性に対して任意の数値を反映させた場合など、単純に乱数を利用して各回答パターンに対する回答者数を求めようとしても、尤もらしいアンケート結果としてのテストデータを求めることはできない。
【0006】
すなわち、回答項目が3個の場合、第1項目及び第2項目の2個の項目からなるクロス表の各欄に対して、回答として選択される確率を任意に設定し、乱数により回答者を振り分ける。
次に、第2項目及び第3項目の2個の項目からなるクロス表の各欄に対して、回答として選択される確率を任意に設定し、乱数により回答者を振り分ける。
この結果、第1項目及び第2項目のクロス表の各欄における回答者数と、第2項目及び第3項目及びクロス表の各欄における回答者数との各々が決定されると、この時点で第3項目と第1項目とのクロス表の各欄における比率はすでに決定されており、第3項目と第1項目のクロス表の所定の欄に対して確率を任意に設定することができない。
【0007】
上述したように、単純に乱数により、質問表の回答項目が3つ以上であり、かつ項目間の関連性に対して任意の数値を反映させる場合には、単純に乱数を利用しても、尤もらしい質問表の回答結果としての質問表回答テストデータを得ることはできない。
また、上述したように、単純に乱数を用いても関連性のある3つ以上の項目を有する質問表に対応する質問表回答テストデータを生成することができない。このため、質問表回答テストデータを乱数アンケートの解析処理を行った場合に、予め任意に有意な結論を得ることができる質問表回答テストデータを生成することはできない。
【0008】
本発明は、このような事情に鑑みてなされたもので、アンケートの項目が3つ以上であり、かつ項目間が関連性を有していても、質問表の解析処理の結果に有意な結論をもたせ、かつ尤もらしいアンケート結果としての質問表回答テストデータを得られる質問表回答テストデータ生成システム、質問表回答テストデータ生成方法及びプログラムを提供することを目的とする。
【課題を解決するための手段】
【0009】
この発明は上述した課題を解決するためになされたもので、本発明の質問表回答テストデータ生成システムは、3個以上の質問としての回答項目を有する質問表から得られる、回答項目に対する答えである選択肢の選択による回答結果を示す質問表回答テストデータを、前記回答項目間の関連性に対応させて、前記回答項目における複数の選択肢の組合せにおける所定の回答パターンが任意の回答数となるように生成する質問表回答テストデータ生成システムであり、前記回答項目及び当該回答項目毎における選択肢を入力する回答項目入力部と、前記回答項目の前記選択肢における回答比率の合計である単純集計比率を設定する単純集計入力部と、前記回答項目の各選択肢の組合せからなる回答パターンにおいて、所定の回答パターンの回答比率を制約する制約値を入力する制約値入力部と、前記回答項目の2個をそれぞれ組合せて、当該2個の回答項目の選択肢からなる回答パターンの回答確率と、当該回答パターンに対応する当該2個の回答項目の単純集計の回答確率の積との差分が所定の範囲内とする目的関数下において、前記制約値に対応した前記質問表回答テストデータを生成する数理計画部と、を備えることを特徴とする。
【0010】
本発明の質問表回答テストデータ生成システムは、前記制約値を満足させて、前記目的関数の前記差分が最も小さくなるように、前記テストデータを生成することを特徴とする。
【0011】
本発明の質問表回答テストデータ生成システムは、前記回答パターン毎の前記回答確率の範囲内において、乱数を回答者数と同一数発生させ、前記乱数が対応する回答確率の前記回答パターンに対して回答者数を振り分ける回答者振分部をさらに有することを特徴とする。
【0012】
本発明の質問表回答テストデータ生成方法は、3個以上の質問としての回答項目を有する質問表から得られる、回答項目に対する答えである選択肢の選択による回答結果を示す質問表回答テストデータを、前記項目間の関連性に対応させて、前記回答項目における複数の選択肢の組合せにおける所定の回答パターンが任意の回答数となるように生成する質問表回答テストデータ生成方法であり、回答項目入力部が、前記回答項目及び当該回答項目毎における選択肢を入力する回答項目入力過程と、単純集計入力部が、前記回答項目の前記選択肢における回答比率の合計である単純集計比率を設定する単純集計比率入力過程と、制約値入力部が、前記回答項目の各選択肢の組合せからなる回答パターンにおいて、所定の回答パターンの回答比率を制約する制約値を入力する制約値入力過程と、数理計画部が、前記回答項目の2個をそれぞれ組合せて、当該2個の回答項目の選択肢からなる回答パターンの回答確率と、当該回答パターンに対応する当該2個の回答項目の単純集計の回答確率の積との差分が所定の範囲内とする目的関数下において、前記制約値に対応した前記質問表回答テストデータを生成する数理計画過程と、を含むことを特徴とする。
【0013】
本発明のプログラムは、3個以上の質問としての回答項目を有する質問表から得られる、回答項目に対する答えである選択肢の選択による回答結果のア質問表回答テストデータを、前記項目間の関連性に対応させて、前記回答項目における複数の選択肢の組合せにおける所定の回答パターンが任意の回答数となるように生成する質問表回答テストデータ生成システムの動作をコンピュータに実行させるためのプログラムであり、コンピュータを、前記回答項目及び当該回答項目毎における選択肢を入力する回答項目入力手段、前記回答項目の前記選択肢における回答比率の合計である単純集計比率を設定する単純集計比率入力手段、前記回答項目の各選択肢の組合せからなる回答パターンにおいて、所定の回答パターンの回答比率を制約する制約値を入力する制約値入力手段、前記回答項目の2個をそれぞれ組合せて、当該2個の回答項目の選択肢からなる回答パターンの回答確率と、当該回答パターンに対応する当該2個の回答項目の単純集計の回答確率の積との差分が所定の範囲内とする目的関数下において、前記制約値に対応した前記質問表回答テストデータを生成する数理計画手段、として機能させるためのプログラムである。
【発明の効果】
【0014】
この発明によれば、アンケートの項目が3つ以上であり、かつ項目間が関連性を有していても、質問表に対する回答の解析処理の結果に有意な結論をもたせ、かつ尤もらしいアンケート結果としての質問表回答テストデータを得られる質問表回答テストデータ生成システム、質問表回答テストデータ生成方法及びプログラムを提供することができる。
【図面の簡単な説明】
【0015】
図1】クロス集計に用いるクロス集計表の概念図である。
図2】本発明の実施形態によるアンケート調査の回答結果のダミーであるアンケートテストデータを生成するアンケートテストデータ生成システムの構成例を示す概略ブロック図である。
図3】入力データ記憶部16に記憶されている回答項目テーブルの構成例を示す図である。
図4】入力データ記憶部16に記憶されている単純集計テーブルの構成例を示す図である。
図5】入力データ記憶部16に記憶されている制約条件テーブルの構成例を示す図である。
図6】演算データ記憶部17に記憶された回答項目における選択肢を組合わせたクロス集計表の構成例を示す図である。
図7】個別解として得られた全回答項目における選択肢の組合せのアンケートテストデータの個別回答パターンの一例を示す図である。
図8】演算データ記憶部17に記憶された回答者数が振り分けられたクロス集計表の構成例を示す図である。
図9】アンケートテストデータの生成の処理の流れ動作例を示すフローチャートである。
【発明を実施するための形態】
【0016】
本発明は、質問表を用いたアンケート調査などにおける回答項目(質問に回答して欲しい項目)と、クロス(交差)集計表における回答項目の選択肢(回答項目の質問に対して選択する答え)毎の回答率の単純集計の数値と、質問表の解析結果にある傾向を持たせるクロス集計表における予め指定された欄(マス目)に対応する回答パターン(以下、単に回答パターンとする)の回答率の制約条件(後述)とを入力することで、上記単純集計の数値と制約条件とを制約とし、制約を守った状態で、各欄の回答確率と、欄にてクロスする選択肢の各々の単純集計を乗算した回答確率との差分を最小とする目的条件下で数理計画を解いて、アンケート調査における全ての回答項目の選択肢の組合せである回答パターン(以下、個別回答パターンとする)の回答確率を個別解として求め、この個別解を基に対象となるアンケート調査の結果に対応する質問表回答テストデータを生成する。
【0017】
すなわち、求めた回答パターンの回答確率に対応させて乱数を予め設定された回答者の総数と同一回数発生させ、乱数が対応する回答確率の個別回答パターンに対応させて振り分ける処理を行い、振り分けた結果をクロス集計表の各欄に回答者数として記入する(後述)。
上記欄は、クロス集計表において回答項目の選択肢がクロスした場所、すなわちクロス集計表における欄でクロスする2個の回答項目の各々の選択肢の組合せの回答パターンを示している。そして、この欄には、2個の回答項目の各々の選択肢の組合せの回答パターンの回答率あるいは回答者数が入る。
【0018】
図1は、クロス集計に用いるクロス集計表の概念図である。回答項目S_1には、選択肢P_1、選択肢P_2、選択肢P_3及び選択肢P_4の4個の選択肢がある。回答項目S_2には、選択肢P_A、選択肢P_B、選択肢P_C、選択肢P_D及び選択肢P_Eの5個の選択肢がある。したがって、図1における回答パターンは、選択肢P_1、選択肢P_2、選択肢P_3及び選択肢P_4のいずれかと、選択肢P_A、選択肢P_B、選択肢P_C、選択肢P_D及び選択肢P_Eのいずれかとの組合せとなり、4個×5個となり、20個の種類がある。また、上記欄は、例えば、符号501で示すように、選択肢P_1と選択肢P_Aとのクロスする部分の回答パターンの回答率あるいは回答者数が示される場所である。
【0019】
単純集計K_1は、回答項目S_2の各選択肢に対応する(各選択肢の行における)選択肢P_1、選択肢P_2、選択肢P_3及び選択肢P_4の各々の数値の積算値の単純集計の数値値である。例えば、単純集計K_1の欄502には、選択肢P_Aに対応する(選択肢P_Aの行にある)選択肢P_1、選択肢P_2、選択肢P_3及び選択肢P_4の数値の各々の積算値を示す単純集計の数値が示されている。
また、単純集計は、回答項目S_1の各選択肢に対応する(各選択肢の列における)選択肢P_A、選択肢P_B、選択肢P_C、選択肢P_D及び選択肢P_Eの各々の数値の積算値の数値である。例えば、単純集計K_2の欄503には、選択肢P_1に対応する(選択肢1の列にある)選択肢P_A、選択肢P_B、選択肢P_C、選択肢P_D及び選択肢P_Eの数値の各々の積算値を示す単純集計の数値値が示されている。
【0020】
また、欄504には、単純集計K_1の合計値、単純集計K_2の合計値が示される。したがって、クロス集計表の各欄に示されているのが回答率の場合には欄504の数値は「1」となっている。一方、クロス集計表の各欄に示されているのが回答者数の場合には欄504の数値はアンケートに回答した全ての回答者数となっている。
【0021】
次に、図面を参照して、本発明の実施形態について説明する。図2は、本発明の実施形態によるアンケート調査の回答結果のダミーである質問表回答テストデータを生成する質問表回答テストデータ生成システムの構成例を示す概略ブロック図である。以下の本実施形態において、質問表を用いたアンケートにより構成及び動作の説明を行うため、質問表回答テストデータ生成システムをアンケートテストデータ生成システムとし、また質問表回答テストデータをアンケートテストデータとして示している。
図2におけるアンケートテストデータ(質問表回答テストデータ)生成システム1は、回答項目入力部11、単純集計入力部12、制約値入力部13、クロス集計表変数生成部14、数理計画部15、入力データ記憶部16、演算データ記憶部17及びアンケートテストデータ記憶部18を備えている。
【0022】
回答項目入力部11は、作業者から入力手段(不図示)を介して、アンケートテストデータを生成する対象のアンケート調査の回答項目及び回答者数の総数が入力されると、入力された回答項目を入力データ記憶部16の回答項目テーブルに書き込んで記憶させる。また、回答項目入力部11は、回答者数の総数を入力データ記憶部16に書き込んで記憶させる。本発明においては、回答項目が3つ以上のアンケート調査に対応したアンケートテストデータを生成する。本実施形態においては、回答者の保持する車に関するアンケート調査を行うとし、説明を簡単にするため回答項目を、地域、車種、メーカの3個として以下説明する。
【0023】
作業者は、アンケートテストデータを作成する対象のアンケート調査の回答項目として、上述した居住している地域(以下、単に地域)、所有している車種(以下、単に車種)、所有しているメーカ(以下、単にメーカ)を入力して設定する。また、作業者は、回答項目の居住している地域として東京、愛知、広島、栃木の4県を選択肢として入力し、回答項目の所有している車種としてセダン、SUV(sport utility vehicle)、ミニバン、セダン、軽(軽自動車)、その他の5種類を選択肢として入力し、回答項目の所有している車のメーカとしてA社、B社、D社の4社を選択肢として入力し、各々を開口項目の選択肢として設定する。
【0024】
図3は、入力データ記憶部16に記憶されている回答項目テーブルの構成例を示す図である。回答項目として、地域、車種及びメーカの3つの項目がある。また、地域には、選択肢として、東京、愛知、栃木及び広島の4県がある。また、車種には、選択肢として、セダン、軽、SUV、ミニバン、その他の5車種がある。メーカには、選択肢としては、A社、B社、C社、D社の4社がある。
【0025】
図2に戻り、単純集計入力部12は、作業者から入力手段を介して入力される、回答項目としての地域の単純集計として東京、愛知、栃木及び広島の各々における選択肢のセダン、軽、AUV、ミニバン、その他の車が選択された回答率の単純集計(合計)の数値を、入力データ記憶部16の単純集計テーブルに書き込んで記憶させる。また、単純集計入力部12は、作業者から入力手段を介して入力される、回答項目としての車種の単純集計としてセダン、軽、AUV、ミニバン、その他の各々における選択肢のA社、B社、C社、D社の車が選択された回答率の単純集計の数値を、入力データ記憶部16の単純集計テーブルに書き込んで記憶させる。また、単純集計入力部12は、作業者から入力手段を介して入力される、回答項目としての地域の単純集計としてA社、B社、C社、D社の各々における選択肢の東京、愛知、栃木及び広島を居住地として選択された回答率の単純集計の数値を、入力データ記憶部16の単純集計テーブルに書き込んで記憶させる。
【0026】
図4は、入力データ記憶部16に記憶されている単純集計テーブルの構成例を示す図である。図4(a)において、回答項目の地域の選択肢である東京、愛知、栃木及び広島の各々の回答率の単純集計の数値であり、他の回答項目の車種の選択肢のセダン、軽、AUV、ミニバン、その他の車の属性の回答率と、メーカの選択肢のA社、B社、C社、D社の属性の回答率とが含まれている。すなわち、車種におけるいずれの選択肢、及びメーカにおけるいずれの選択肢を選択したとしても、居住している地域の属性しか有さない単純集計の数値である。
【0027】
図4(b)において、回答項目の地域の選択肢であるセダン、軽、AUV、ミニバン、その他の各々回答率の単純集計の数値であり、他の回答項目の地域の選択肢の東京、愛知、栃木及び広島の属性の回答率と、メーカの選択肢のA社、B社、C社、D社の属性の回答率とが含まれている。すなわち、車種におけるいずれの選択肢、及びメーカにおけるいずれの選択肢を選択したとしても、居住している地域の属性しか有さない単純集計の数値である。
【0028】
図4(c)において、他の回答項目のメーカの選択肢のA社、B社、C社、D社の各々の回答率の単純集計の数値であり、地域の選択肢の東京、愛知、栃木及び広島の属性の回答率と、車種の選択肢のセダン、軽、AUV、ミニバン、その他の車の属性の回答率とが含まれている。すなわち、車種におけるいずれの選択肢、及び地域におけるいずれの選択肢を選択したとしても、居住している地域の属性しか有さない単純集計の数値である。
【0029】
図2に戻り、制約値入力部13は、作業者から入力手段を介して入力される、各クロス集計表における回答項目の各々の選択肢のクロスする欄、すなわち2つの回答項目の各々の選択肢の組合せである回答パターンの回答確率を制約する数値を、入力データ記憶部16の制約条件テーブルに書き込んで記憶させる。
【0030】
図5は、入力データ記憶部16に記憶されている制約条件テーブルの構成例を示す図である。制約条件テーブルには、作業者が入力した2つの回答項目の各々の選択肢の組合せである回答パターンの回答確率を制約する数値が制約条件として書き込まれている。
例えば、制約条件番号J_1には、東京で車を所有している人が所有している車の車種として軽と回答する回答率(回答する比率)PT=0.12以上とする制約条件が記載されている。
【0031】
この制約条件は、アンケート結果がアンケートを行う所定の回答項目において、回答者の選択肢における選択に所定の傾向を持たせたい場合、すなわちアンケート結果に対して所定の傾向を持たせたい場合、この傾向がアンケートテストデータに反映されるように、傾向を持たせたい選択肢の組合せに対し、回答パターンの回答率の数値範囲の制約として設定する。また、制約条件としては、作業者に予め設定されるクロス集計表における各選択肢の単純集計を満たすという制約も設定されている。
【0032】
ここで、制約条件番号J_1の制約条件は、地域の選択肢において居住地が東京と回答したなかにおいて、車種の選択肢において軽と回答する回答率が0.12以上となるように、欄552(後述する図6(b))の回答パターンの回答率を設定することを規定している。したがって、欄552の回答パターンの回答率は、回答率PT(=0.12)と、地域の選択肢において居住地が東京と回答した行の単純集計の数値K1_A(=0.35)とを乗算した、PT×K1_A(0.042)以上となる数値に設定される。この制約条件により、欄552の回答パターンの回答率は設定される。また、このとき、選択肢が軽の列における単純集計の数値と、選択肢が東京の行における単純集計の数値との各々は、作業者が制約条件とした数値となるように回答パターンの回答率が設定される。
【0033】
また、制約条件番号J_2には、愛知で車を所有している人が所有している車のメーカとしてA社と回答する回答率(回答する比率)PM=0.5以上とする制約条件が記載されている。すなわち、制約条件番号J_2の制約条件は、地域の選択肢において居住地が愛知と回答したなかにおいて、メーカの選択肢においてA社と回答する回答率が0.5以上となるように、欄554(後述する図6(c))の回答パターンの回答率を設定することを規定している。したがって、欄554の回答パターンの回答率は、回答率PM_1(=0.5)と、地域の選択肢において居住地が愛知と回答した行の単純集計の数値K1_A(=0.27)とを乗算した、PM_1×K1_A(0.135)以上となる数値に設定される。この制約条件により、欄554の回答パターンの回答率は設定される。この制約条件により、欄554の回答パターンの回答率は設定される。また、このとき、選択肢がA社の列における単純集計の数値と、選択肢が愛知の行における単純集計の数値との各々は、作業者が制約条件とした数値となるように回答パターンの回答率が設定される。
【0034】
また、制約条件番号J_3には、広島で車を所有している人が所有している車のメーカとしてD社と回答する回答率(回答する比率)PM=0.3以上とする制約条件が記載されている。すなわち、制約条件番号J_3の制約条件は、地域の選択肢において居住地が広島と回答したなかにおいて、メーカの選択肢においてD社と回答する回答率が0.3以上となるように、欄553(後述する図6(c))の回答パターンの回答率を設定することを規定している。したがって、欄553の回答パターンの回答率は、回答率PM_1(=0.3)と、地域の選択肢において居住地が広島と回答した行の単純集計の数値K1_B(=0.23)とを乗算した、PM_1×K1_B(0.069)以上となる数値に設定される。この制約条件により、欄553の回答パターンの回答率は設定される。この制約条件により、欄553の回答パターンの回答率は設定される。また、このとき、選択肢がD社の列における単純集計の数値と、選択肢が広島の行における単純集計の数値との各々は、作業者が制約条件とした数値となるように回答パターンの回答率が設定される。
【0035】
また、制約条件番号J_4には、B社の車を所有している人が所有している車の車種としてSUVと回答する回答率(回答する比率)MT=0.5以上とする制約条件が記載されている。
すなわち、制約条件番号J_4の制約条件は、車種の選択肢において車種がミニバンと回答したなかにおいて、メーカの選択肢においてB社と回答する回答率が0.5以上となるように、欄551(後述する図6(a))の回答パターンの回答率を設定することを規定している。したがって、欄551の回答パターンの回答率は、回答率MT(=0.3)と、車種の選択肢において車種がミニバンと回答した行の単純集計の数値K1_C(=0.17)とを乗算した、MT×K1_C(0.051)以上となる数値に設定される。この制約条件により、欄551の回答パターンの回答率は設定される。この制約条件により、欄551の回答パターンの回答率は設定される。また、このとき、選択肢がB社の列における単純集計の数値と、選択肢がミニバンの行における単純集計の数値との各々は、作業者が制約条件とした数値となるように回答パターンの回答率が設定される。
【0036】
図6は、演算データ記憶部17に記憶された回答項目における選択肢を組合わせたクロス集計表の構成例を示す図である。図6(a)は、回答項目S_1が車のメーカであり、回答項目S_2が車の車種であるクロス集計表である。また、図6(a)のクロス集計表は、メーカとしての選択肢のA社、B社、C社、D社の各々と、車種としての選択肢のセダン、SUV、ミニバン、軽、その他の各々との組合せで回答パターンの欄が形成されている。欄551は、図5の制約条件テーブルにおける制約条件番号J_4の制約条件が設定されている回答パターンを示している。また、列601、行602及び欄603は、後述する数理計画部15の処理の説明に用いるために付加されている。列601は、回答項目のA社の車を所有していると回答する車種毎の回答率の全てを積算した単純集計の列を示している。同様に、行602は、回答項目のセダンの車を所有していると回答するメーカ毎の回答率の全てを積算した単純集計の列を示している。
【0037】
図6(b)は、回答項目S_1が車の車種であり、回答項目S_2が車の所有者の住む地域であるクロス集計表である。また、図6(b)のクロス集計表は、車種としての選択肢のセダン、SUV、ミニバン、軽、その他の各々と、所有者の住む地域としての選択肢の東京、愛知、広島、栃木の各々との組合せで回答パターンの欄が形成されている。欄552は、図5の制約条件テーブルにおける制約条件番号J_1の制約条件が設定されている回答パターンを示している。
【0038】
図6(c)は、回答項目S_1が車のメーカであり、回答項目S_2が車の所有者の住む地域であるクロス集計表である。図6(c)のクロス集計表は、メーカとしての選択肢のA社、B社、C社、D社の各々と、所有者の住む地域としての選択肢の東京、愛知、広島、栃木の各々との組合せで回答パターンの欄が形成されている。欄553は、図5の制約条件テーブルにおける制約条件番号J_3の制約条件が設定されている回答パターンを示している。欄552は、図5の制約条件テーブルにおける制約条件番号J_2の制約条件が設定されている回答パターンを示している。
【0039】
図2に戻り、クロス集計表変数生成部14は、入力データ記憶部16に記憶されている回答項目テーブルを読み出す。そして、クロス集計表変数生成部14は、回答項目の2個を組合せとして順次選択し、この2個の各々の選択肢の組合せである回答パターンの数値を変数とするクロス集計表変数、すなわち、後述する図6(a)から図6(c)に示す3個のクロス集計表の各欄に対応するクロス集計表変数を生成する。すなわち、クロス集計表変数生成部14は、回答項目として車のメーカと、車の車種との各々の選択肢からなるクロス集計表と、回答項目として車の車種と、車の所有者の居住している地域との各々の選択肢からなるクロス集計表と、回答項目として車のメーカと、車の所有者の居住している地域との各々の選択肢の組合せからなるクロス集計表の各々の回答パターンの欄に対応するクロス集計表変数を生成する。そして、クロス集計表変数生成部14は、生成したクロス集計表の各欄に対応するクロス集計表変数を演算データ記憶部17に対して書き込んで記憶させる(すなわち、メモリである演算データ記憶部17上にクロス集計表変数を展開する)。このとき、クロス集計表変数生成部14は、入力データ記憶部16の単純集計テーブルから各選択肢の単純集計の数値を読み出し、生成したクロス集計表の対応する選択肢の単純集計のクロス集計表変数に対して書き込む。また、クロス集計表変数生成部14は、クロス集計表に対応させ、単純集計として以下の数理計画モデルの定式である(1)式、(2)式及び(3)式に用いるクロス集計表変数を生成する。(1)は車種の選択肢毎の単純集計の式であり、(2)式は地域の選択肢毎の単純集計の式であり、(3)式はメーカの選択肢毎の単純集計の式である。
【0040】
【数1】
【0041】
(1)式において、tは車種を示し、pが地域を示し、mがメーカを示している。また、tSum[t]は制約条件として入力された車種毎の単純集計であり、入力された車種毎の単純集計の数値が代入される。sum(x[p,t,m],(p,m))は、メーカ及び地域を含んでの車種の単純集計を各欄の回答パターンに対応するクロス集計表変数における回答確率の合計から求める式である。x[p,t,m]は、全ての回答項目の選択肢の組合せである個別回答パターンの回答確率(個別解)そのものである(x[p,t,m]≧0)。x[p,t,m]の後に記述されている(p,m)は、地域及びメーカの種別を含んでいることを示している。
例えば、図6(a)における車種の選択肢がセダンの行と、メーカの選択肢がA社(地域の属性を全て含む)、B社(地域の属性を全て含む)、C社(地域の属性を全て含む)、D社(地域の属性を全て含む)の各々の列が交差する欄の回答パターンに対応するクロス集計表変数における(選択肢がセダンの行の各欄に対応するクロス集計表変数における)回答確率の合計、すなわち単純集計を示す式である。
【0042】
【数2】
【0043】
(2)式において、tは車種を示し、pが地域を示し、mがメーカを示している。また、pSum[p]は制約条件として入力された地域毎の単純集計であり、入力された地域毎の単純集計の数値が代入される。sum(x[p,t,m],(t,m))は、車種及びメーカを含んでの地域の単純集計を各欄の回答パターンに対応するクロス集計表変数における回答確率の合計から求める式である。x[p,t,m]は、全ての回答項目の選択肢の組合せである個別回答パターンの回答確率(個別解)そのものである。x[p,t,m]の後に記述されている(t,m)は、車種及びメーカの種別を含んでいることを示している。
例えば、図6(b)における地域の選択肢が東京の行と、車種の選択肢がセダン(メーカの属性を全て含む)、SUV(メーカの属性を全て含む)、ミニバン(メーカの属性を全て含む)、軽(メーカの属性を全て含む)、その他(メーカの属性を全て含む)の各々の列が交差する欄の回答パターンに対応するクロス集計表変数における(選択肢が東京の行の各欄に対応するクロス集計表変数における)回答確率の合計、すなわち単純集計を示す式である。
【0044】
【数3】
【0045】
(3)式において、tは車種を示し、pが地域を示し、mがメーカを示している。また、mSum[m]は制約条件として入力されたメーカ毎の単純集計であり、入力されたメーカ毎の単純集計の数値が代入される。sum(x[p,t,m],(p,t))は、地域及び車種を含んでの地域の単純集計を各欄の回答パターンに対応するクロス集計表変数における回答確率の合計から求める式である。x[p,t,m]は、全ての回答項目の選択肢の組合せである個別回答パターンの回答確率(個別解)そのものである。x[p,t,m]の後に記述されている(p,t)は、地域及び車種の種別を含んでいることを示している。
例えば、図6(c)におけるメーカの選択肢がA社の列と、地域の選択肢が愛知(メーカの属性を全て含む)、広島(メーカの属性を全て含む)、東京(メーカの属性を全て含む)、栃木(メーカの属性を全て含む)の各々の行が交差する欄の回答パターンに対応するクロス集計表変数における(選択肢がA社の列の各欄に対応するクロス集計表変数における)回答確率の合計、すなわち単純集計を示す式である。
上述したように、クロス集計表変数生成部14は、(1)式、(2)式及び(3)に基づき、後述する図6(a)、図6(b)、図6(c)に示すクロス集計表の各欄に対応するクロス集計表変数を生成し、演算データ記憶部17に対して書き込んで記憶させる。
【0046】
図2に戻り、数理計画部15は、数理計画法の手法を用いて、アンケートテストデータを生成する際におけるクロス集計表の各回答パターンの回答率を、後述する目的関数と制約条件との基において最適化されるように、全ての回答項目の選択肢の組合せである個別回答パターンを個別解として解く。
また、本実施形態においては、数理計画法の計算手法として内点法を用いることにより、個別解として「0」が生成されず、アンケートにおいていずれの人間も回答しない回答パターンが一般的に存在しないことが知られており、アンケート調査として尤もらしい結果を得ることができる。
【0047】
制約条件は、すでに説明した図5における制約条件テーブルに記載されている予め設定された回答パターン(クロス集計表における回答パターン)の回答率に対する制約である。
また、単純集計テーブルに記載されている各回答項目の選択肢がクロスした欄に対する回答パターンの回答確率の単純集計の数値も制約条件(後述するように作業者が入力)である。
数値計画部15は、生成した個別回答パターンをクロス集計表の各(1)式、(2)式及び(3)式に対応して生成したクロス集計表変数に対して書き込む。すなわち、クロス集計表の各欄に対応する回答パターンの回答確率に対応するクロス集計表変数に対し、生成した個別回答パターンの回答確率から算出した各欄に対応する回答パターンの集計値である回答確率を代入していく。そして、数値計画部15は、それぞれ制約条件としての単純集計の数値となるように、個別回答パターンの回答確率を生成する。
【0048】
目的関数は、アンケートの結果として見たとき、尤もらしいアンケートテストデータを生成するために設定されている。この目的関数は、生成する個別解としてのアンケートテストデータを、回答パターンの欄をクロスする選択肢の単純集計の数値各々を乗算した結果と近い値とすることで、クロス集計表において制約されている単純集計の数値から読み取れる全国平均(単純集計から予想される回答率)から、回答パターンの回答率が大きく外れた解とならず、アンケート調査として尤もらしい個別解としての個別回答パターンの回答率を得ることができる。
【0049】
数理計画部15は、上記制約条件及び目的関数を満たすように、個別回答パターンの回答率を個別解として求めた上で、求めた個別回答パターンの回答率を用いて、クロス集計表における各欄の回答パターンの回答率を求め、演算データ記憶部17において各々対応する回答パターンのクロス集計表変数に代入する。そして、数理計画部15は、後述する数理計画モデルの定式((5)式から(7)式)に対応させ、各クロス集計表における回答パターン毎に、回答パターンに対応するクロス集計表変数における回答率と、この回答パターンの欄においてクロスする選択肢の単純集計に対応するクロス集計表変数における回答率の各々を乗算した結果(後述する単純集計積)との差分を求める。数理計画部15は、クロス集計表毎に、各回答パターンに対応する差分を積算し、集計表差分誤差(後述するsum(slackMT[m,t],(m,t))など)を算出する。
【0050】
そして、数理計画部15は、全てのクロス集計表の集計表差分誤差を加算し、加算結果を差分誤差とする。ここで、数理計画部15は、全てのクロス集計表における全ての回答パターンに対応する差分を積算し、積算結果を差分誤差とする構成としても良い。
数理計画部15は、上記制約条件を満たしつつ、目的関数で規定するように差分誤差(関数f)が最小となるように、最適化された個別解として個別回答パターンの回答率の数値を設定する。上記目的関数により、アンケートテストデータが、クロス集計表において制約されている単純集計の数値から読み取れる全国平均から大きく外れた解とならず、アンケート調査として尤もらしい個別解を得ることができる。
また、最小化を行う手法については各種あり、本発明においてはいずれを用いても良い。
【0051】
以下、上述した傾向を持たせたい選択肢の組合せの欄の回答パターンの回答率と、単純集計の回答率との対制約条件を満たし、かつ最もらしい各回答パターンの回答確率を得るとする目的関数として、個別解である個別回答パターンの回答率を求めるために用いる、本実施形態における数理計画モデルの定式の説明を行う。また、単純集計の回答率との対制約条件を示す数理計画モデルの定式は(1)式、(2)式及び(3)式として、すでに説明してあるため、以下においては、数理計画モデルの定式として、最もらしい各回答パターンの回答確率を得るとする目的関数を示す式の説明を行う。
ここで、尤もらしいアンケートテストデータを得るための目的関数とは、以下の(4)式に示すものである。
【0052】
【数4】
【0053】
この(4)式は、制約条件を満たした上で、関数fを最小化する目的関数である。関数fは、地域及び車種における尤もらしさに対応した関数sum(slackPT[p、t],(p、t))と、地域及び車種における尤もらしさに対応した関数sum(slackMT[m、t],(m、t))と、メーカ及び地域における尤もらしさに対応した関数sum(slackMP[m、p],(m、p))とを加算した関数(上述した集計表差分誤差であり、差分の範囲を示す差分制限値をクロス集計表毎に加算した関数)である。
関数sum(slackPT[p、t],(p、t))は、上述した集計表差分誤差であり、クロス集計表の欄に対応するクロス集計表変数における回答率に対して求めた、以下に示す(5)式で求めたslackPT[p、t]を、全てのクロス集計表変数にわたって加算して求めることを示す関数である。
【0054】
【数5】
【0055】
上記(5)式において、sum(x[p,t,m],m)の関数は、選択肢である地域(p)と車種(t)がクロスする欄の回答パターンに対応するクロス集計表変数における回答確率を示している。tSum[t]*pSum[p]は、地域の単純集計と車種の単純集計を乗算した単純集計積である。個別回答パターンが制約条件に対応して生成されるならば、上述したように、選択肢である地域(p)と車種(t)がクロスする欄の回答確率である。sum(x[p,t,m],m)とtSum[t]*pSum[p]とはほぼ等しくなる必要がある。また、slackPT[p,t]は、変数であり、選択肢がクロスした欄の回答確率と単純集計積との差分を制限する差分制限値であり、計算過程において数値が順次小さくなるように変更される。
関数sum(slackMT[m,t],(m,t))は、上述した集計表差分誤差であり、クロス集計表の欄に対応するクロス集計表変数における回答率に対して求めた、以下に示す(6)式で求めたslackMT[m,t]を、全てのクロス集計表変数にわたって加算して求めることを示す関数である。
【0056】
【数6】
【0057】
上記(6)式において、sum(x[p,t,m],p)の関数は、選択肢であるメーカ(m)と車種(t)がクロスする欄の回答パターンに対応するクロス集計表変数における回答確率を示している。tSum[t]*mSum[m]は、地域の単純集計と車種の単純集計を乗算した単純集計積である。個別回答パターンが制約条件に対応して生成されるならば、上述したように、選択肢である車種(t)とメーカ(m)がクロスする欄の回答確率である。sum(x[p,t,m],p)とtSum[t]*mSum[m]とはほぼ等しくなる必要がある。また、slackMT[m,t]は、変数であり、選択肢がクロスした欄の回答確率と単純集計積との差分を制限する差分制限値であり、計算過程において順次数値が小さくなるように変更される。
関数sum(slackMP[m、p],(m,p))は、上述した集計表差分誤差であり、クロス集計表の欄に対応するクロス集計表変数における回答率に対して求めた、以下に示す(7)式で求められたslackMP[m、p]を、全てのクロス集計表変数にわたって加算して求めることを示す関数である。
【0058】
【数7】
【0059】
上記(7)式において、sum(x[p,t,m],t)の関数は、選択肢であるメーカ(m)と地域(t)がクロスする欄の回答パターンに対応するクロス集計表変数における回答確率を示している。pSum[p]*mSum[m]は、地域の単純集計とメーカの単純集計を乗算した単純集計積である。個別回答パターンが制約条件に対応して生成されるならば、上述したように、選択肢である地域(p)とメーカ(m)がクロスする欄の回答確率である。sum(x[p,t,m],t)とpSum[p]*mSum[m]とはほぼ等しくなる必要がある。また、slackMP[m,p]は、変数であり、選択肢がクロスした欄の回答確率と単純集計積との差分を制限する差分制限値であり、計算過程において順次数値が小さくなるように変更される。
【0060】
上述したように、数理計画部15は、個別回答パターンの回答率を生成する毎に、クロス集計表変数生成部14が生成した図6の各クロス集計表における各欄に対応する回答パターンに対応するクロス集計表変数に対して、生成した個別回答パターンから上記欄の回答パターンに対応させた回答確率を算出して代入する。
そして、数理計画部15は、各欄の回答パターンの回答確率(例えば、上述したsum(x[p,t,m],m))と、この欄でクロスする選択肢の単純集計を乗算した単純集計積(例えば、上述したtSum[t]*pSum[p])との差分が差分制限値(例えば、上述したslackPT[p,t])の範囲に入るように個別回答パターンの回答率を繰り返して生成していく。すなわち、数理計画部15は、(5)式において、sum(x[p,t,m],m)と、tSum[t]*pSum[p]との差分の絶対値がslackPT[p,t]以下となるように、個別回答パターンの回答率を繰り返して個別解として生成する。
【0061】
このとき、数理計画部15は、図6(b)における地域及び車種の選択肢の組合せ全ての欄に対応する差分制限値slackPT[p、t]を加算して関数sum(slackPT[p、t],(p、t))を求め、図6(a)におけるメーカ及び車種の選択肢の組合せ全ての欄に対応する差分制限値slackMT[m、t]を加算して関数sum(slackMT[m、t],(m、t))を求め、図6(c)におけるメーカ及び地域の選択肢の組合せ全ての欄に対応する差分制限値slackMP[m、p]を加算して関数sum(slackMP[m、p],(m、p))を求める。そして、数理計画部15は、各クロス統計表の各欄の回答パターンにおける差分に対する差分制限値を変更して小さくする毎に、個別回答パターンの回答率を求め、新たに求められた個別回答パターンの回答率に基づく関数sum(slackPT[p、t],(p、t))、関数sum(slackMT[m,t],(m,t))及び関数sum(slackMP[m、p],(m,p))を加算し、関数fを最小化する個別回答パターンの回答率を求める処理を行う。
【0062】
例えば、図6(a)において、回答項目の車種における選択肢のセダンの行602と、回答項目のメーカにおける選択肢のA社の列601とがクロスした欄603の回答パターンにおける回答率をANS1Aとする。このANS1Aは、メーカがA社であり、車種がセダンである回答パターンの回答率である。このANS1Aは、メーカがA社であり、かつ車種がセダンである車を所有していると回答する回答率であり、回答項目が地域である選択肢の東京、愛知、広島及び栃木の各々におけるメーカがA社であり、かつ車種がセダンであるとする個別回答パターンの回答率(個別解)の合計である。
【0063】
上記(6)式に対応する差分は、行602のセダンを持っていると回答する回答率の単純集計の数値(tSum[t])であるK_1_A(0.43)と、列601のA社の車を持っていると回答する回答率の単純集計の数値(mSum[m])であるK_2_1(0.45)とを乗算した単純集計積KK_1_A(tSum[t]*mSum[m])を、欄603の回答パターンのクロス集計表変数における回答率ANS12(sum(x[p,t,m],p))から減算した結果である。また、この差分(ANS12−KK_1_A)が、絶対値|ANS12−KK_1_A|であり、数理計画部15は、差分制限値(すなわち、差分制限値slackMT[m、t])の範囲となるように、数理計画法における個別解としての個別回答パターンの回答率を求める。
同様に、数理計画部15は、図6(b)及び図6(c)におけるクロス集計表においても、クロス集計表の各々の各欄における変数における回答率とこの欄で交差する選択肢の単純集計の乗算結果との差分が、それぞれ設定される差分制限値の範囲となるように、個別回答パターンの回答率を求める。このとき、数理計画部15は、上述した差分を求めるために用いる、図6(a)、図6(b)及び図6(c)の各々の全ての回答パターン(クロス集計表の欄)の変数における回答率を、回答項目の各選択肢の組合せの個別回答パターンの回答確率を基に求める。
【0064】
そして、数理計画部15は、クロス集計表における全ての欄の回答パターンの各々と、その欄でクロスする選択肢各々の単純集計の数値との乗算結果との差分を絶対値が差分制限値の範囲内となるよう個別回答パターンの回答率を求める。そして、数理計画部15は、求めた差分制限値(例えば、slackMT[m,t])をクロス集計表の全ての欄の回答パターンにおいて求め、この差分制限値を全ての回答パターンで加算し、加算結果として集計表差分誤差(例えば、sum(slackMP[m、p],(m,p)))を求める。数理計画部15は、求めたクロス集計表毎の集計表差分誤差を全てのクロス集計表で加算して差分誤差(関数f)を求める。
【0065】
そして、数理計画部15は、数理計画法により、(1)式から(3)式において入力された単純集計の数値の制約条件を満たし、かつ傾向を持たせたい選択肢の組合せの欄の回答パターンの回答率に対する制約条件を満たしつつ、(5)式、(6)式及び(7)式を用いて目標関数としてアンケート調査の結果としての尤もらしさを付加するために、上述した集計表差分誤差の合計である差分誤差を示す(4)式における関数fが最小となるように、回答項目(本実施形態では3個)における2個の回答項目の組合せにおける全ての選択肢の組合せの個別回答パターン(地域の選択肢が4個、メーカの選択肢が4個、車種の選択肢が5個のため4×4×5の8通りの回答パターン)を求める。すなわち、数理計画部15は、全ての回答項目の選択肢の組合せの個別回答パターンの回答率を順次変更し、変更後の差分誤差を求める動作を繰り返し、(4)式を用いて最小化の手法によって、制約条件を満たした上で、目的関数で示すように差分誤差が最小となる個別回答パターンを個別解として求める。
【0066】
すなわち、数理計画部15は、すでに説明したように、傾向を持たせたい回答項目の選択肢の組合せの欄に対応する回答パターンのクロス集計表変数における回答率の数値範囲の制約条件、回答項目において供給された各選択肢における単純集計の回答率、及び上述した最もらしさを付加するための関数fを最小化するを満たすように、(1)式から(7)式の各々の数理計画モデルの定式を用いた数理計画法により、アンケートにおける個別回答パターンの個別解を求める。
【0067】
図7は、個別解として得られた全回答項目における選択肢の組合せのアンケートテストデータの個別回答パターンの一例を示す図である。図7(a)は、個別回答パターンのそれぞれの人数比を、個別解で得られた各個別回答パターンの回答率で示している。地域、車種及びメーカの各々における選択肢の組合せ毎に対応して、枠700で囲まれたそれぞれの選択肢の組合せの個別回答パターンの回答率、すなわち回答者数の全数に対する回答者の人数比が数理計画法により解く個別解であることが示されている。
数理計画部15は、求めた個別回答パターンの回答率を、演算データ記憶部17における図7(a)に示すアンケートテストデータ結果テーブルの対応する個別回答パターンに対応した欄に順次書き込む。
【0068】
一方、図7(b)は、個別回答パターンのそれぞれの人数を、個別解で得られた個別回答パターンの回答率から求めた、各回答パターンに対する回答者数で示している。この回答者数は、後述する回答振分部19が図7(a)の個別回答パターン回答率テーブルにおいて記載されている個別回答パターン毎の回答率から求めている。回答者振分部19は、求めた個別回答パターンの回答率に基づき、演算データ記憶部17における図7(b)に示す個別回答パターン回答率テーブルの対応する個別回答パターンに対応した欄に対し、回答者を振り分けて順次書き込む。
【0069】
回答者振分部19は、演算データ記憶部17から、個別回答パターンに対応させて上述した個別回答パターンの回答率を読み出すとともに、入力データ記憶部16から作業者が設定した回答者数を読み出す。
この個別回答パターンの回答率は、3個の回答項目のそれぞれの選択肢の組合せの個別回答パターンの各々が回答される回答率である。このため、この個別回答パターンの回答率に対応した比率により、回答者数を割り振ることにより、全ての回答項目の選択肢の組合せである各個別回答パターンを回答した回答者数を求めることができる。
【0070】
したがって、本実施形態の場合、すでに述べたが、地域が東京、愛知、広島、栃木の4個の選択肢であり、車種がセダン、SUV、ミニバン、軽、その他の5個の選択肢であり、メーカがA社、B社、C社、D社の4個の選択肢である。このため、3個の回答項目の選択肢の組合せ、すなわち回答パターンは、4×5×4=80通りある。
回答振分部19は、アンケートテストデータ記憶部18に対して、この組合せに対応するアンケートテストデータ結果テーブルを作成する。
そして、回答振分部19は、80種類の個別回答パターンの各々の回答確率を、アンケートテストデータ記憶部18のアンケートテストデータ結果テーブルに対して書き込んで記憶させる。
【0071】
また、本実施形態においては、回答確率に対応させて乱数を発生させることにより、各個別回答パターンに対する回答者の振分を行う。
すなわち、回答振分部19は、回答確率に対応した乱数を発生させて、この発生した乱数を各回答確率に対応した個別回答パターンに振り分ける。ここで、回答振分部19は、回答者数と同一の数の乱数を発生させ、発生した各々の乱数を用いて、順次上述した回答者の個別パターンへの振分作業を行う。
上述した処理により、回答振分部19は、各回答パターン毎の回答率に対応した回答者数を容易に設定することができる。
上述した振分作業は、例えば、1から0までの範囲において、0から1へ順番に(1から0へ順番としても良い)、各回答パターンの回答確率を加算していき、それぞれ加算した回答確率の数値範囲をその回答パターンの振分領域とする。
【0072】
したがって、0から1までが、80個の個別回答パターンによって、回答確率の数値に対応した振分領域に分割される。そして、0から1の間において乱数を発生させ、発生した乱数の数値が、どの回答パターンの回答確率の振分領域に入るかを検出し、1回の乱数の発生に対応して、回答パターンに回答者の1人を対応する振分領域に振り分ける。これを回答者数の総数に対応する回数を繰り返すことにより、回答確率の振分領域に対して、設定された回答者数の回答者全てを完全に振り分けることができる。この場合、必ず80個の回答パターンの回答率を加算した結果が0となるように、回答確率は最終的に調整しておく必要がある。
【0073】
図8は、演算データ記憶部17に記憶された回答者数が振り分けられたクロス集計表の構成例を示す図である。図8(a)は、図6(a)のクロス集計表に対応しており、回答項目S_1が車のメーカであり、回答項目S_2が車の車種であるクロス集計表である。また、図8(b)は、図6(b)のクロス集計表に対応しており、回答項目S_1が車の車種であり、回答項目S_2が車の所有者の住む地域であるクロス集計表である。図8(c)は、図6(c)のクロス集計表に対応しており、回答項目S_1が車のメーカであり、回答項目S_2が車の所有者の住む地域であるクロス集計表である。
【0074】
制約条件番号J_1の制約条件として、東京に居住していると回答した回答者が、車種の選択肢として軽と回答する回答率が0.12(=PT)となっている。図8(b)において、地域の選択肢として東京と、車種の選択肢として軽とのクロスする回答パターンの回答者数が420と決定されている。また、地域の選択肢として東京を選択した回答者数(選択肢が東京の単純集計)が3501となっているため、420を3501で除算すると、除算結果が0.1199となることにより、愛知に居住していると回答した回答者が、メーカの選択肢としてA社と回答する回答率が、制約条件番号J_1で制約した数値のほぼ0.12となっていることが判る。
【0075】
制約条件番号J_2の制約条件として、愛知に居住していると回答した回答者が、メーカの選択肢としてA社と回答する回答率が0.5(=PM_1)となっている。図8(c)において、地域の選択肢として愛知と、メーカの選択肢としてA社とのクロスする回答パターンの回答者数が1366と決定されている。また、地域の選択肢として愛知を選択した回答者数(選択肢が愛知の単純集計)が2696となっているため、1366を2698で除算すると、除算結果が0.507となることにより、愛知に居住していると回答した回答者が、メーカの選択肢としてA社と回答する回答率が、制約条件番号J_2で制約した数値のほぼ0.5となっていることが判る。
【0076】
制約条件番号J_3の制約条件として、広島に居住していると回答した回答者が、メーカの選択肢としてD社と回答する回答率が0.3(=PM_2)となっている。図8(c)において、地域の選択肢として広島と、メーカの選択肢としてD社とのクロスする回答パターンの回答者数が688と決定されている。また、地域の選択肢として広島を選択した回答者数(選択肢が広島の単純集計)が2300となっているため、688を2300で除算すると、除算結果が0.299となることにより、愛知に居住していると回答した回答者が、メーカの選択肢としてA社と回答する回答率が、制約条件番号J_3で制約した数値のほぼ0.3となっていることが判る。
【0077】
制約条件番号J_4の制約条件として、B社の車を有したと回答した回答者が、車種の選択肢としてSUVと回答する回答率が0.5(=MT)となっている。図8(a)において、車種の選択肢としてSUVと、メーカの選択肢としてB社とのクロスする回答パターンの回答者数が1250と決定されている。また、メーカの選択肢としてB社を選択した回答者数(選択肢がB社の単純集計)が2500となっているため、1250を2500で除算すると、除算結果が0.5となることにより、B社の車を有したと回答した回答者が、車種の選択肢としてSUVと回答する回答率が、制約条件番号J_4で制約した数値のほぼ0.5となっていることが判る。
【0078】
次に、作業者が入力した各回答項目における選択肢の回答率の単純集計も制約条件の数値である。図6(a)において、制約条件としての単純集計の数値(回答率)が、メーカにおけるA社の選択肢が0.45であり、B社の選択肢が0.25であり、C社の選択肢が0.20であり、D社の選択肢が0.1となっている。一方、図8(a)においては、回答者が振り分けられた結果の単純集計の数値(回答者数)が、メーカにおけるA社の選択肢が4499であり、B社の選択肢が2500であり、C社の選択肢が2002であり、D社の選択肢が999となっている。
【0079】
また、図6(a)において、制約条件としての単純集計の数値(回答率)が、車種におけるセダンの選択肢が0.43であり、SUVの選択肢が0.32であり、ミニバンの選択肢が0.17であり、軽の選択肢が0.05であり、その他の選択肢が0.03となっている。一方、図8(a)においては、回答者が振り分けられた結果の単純集計の数値(回答者数)が、車種におけるセダンの選択肢が4297であり、SUVの選択肢が3202であり、ミニバンの選択肢が1698であり、軽の選択肢が502であり、その他の選択肢が301となっている。
【0080】
また、図6(b)において、制約条件としての単純集計の数値(回答率)が、地域における東京の選択肢が0.35であり、愛知の選択肢が0.27であり、広島の選択肢が0.23であり、栃木の選択肢が0.15となっている。一方、図8(b)においては、回答者が振り分けられた結果の単純集計の数値(回答者数)が、地域における東京の選択肢が3501であり、愛知の選択肢が2698であり、広島の選択肢が2300であり、栃木の選択肢が1501となっている。
【0081】
したがって、回答者数の全数が10000であるため、回答者数の全数に対して、各選択肢の単純集計の回答者数の割合を求めると、制約条件として入力された各回答項目における選択肢の回答率の単純集計の数値とほぼ一致していることが判る。
【0082】
上述したように、本実施形態のアンケートテストデータ生成システムによれば、アンケート結果に有意な結論を持たせる制約条件を設定し、この制約条件を満たしつつ、回答パターンの回答確率が、回答パターンの欄でクロスする選択肢各々の単純集計を乗算した結果と近くする目的関数により、個別回答パターンを求めているため、アンケートの回答項目が3つ以上であり、かつ回答項目が相互に関連性を有していても、アンケートの解析処理の結果に有意な結論をもたせ、かつ実際にアンケートを行った場合に対応した尤もらしいアンケート結果としてのアンケートテストデータを得ることができる。
【0083】
次に、図9を用いて、本実施形態におけるアンケートテストデータ生成システムを用いたアンケートテストデータの生成の処理の流れを説明する。図9は、アンケートテストデータの生成の処理の流れ動作例を示すフローチャートである。
ステップS1:
作業者は、入力手段を介して、対象となるアンケート調査の3種類の回答項目として地域(東京、愛知、広島、栃木が選択肢)、車種(セダン、SUV、ミニバン、軽、その他が選択肢)及びメーカ(A社、B社、C社、D社)及び回答者数を、アンケートテストデータ生成システムに入力する。
回答項目入力部11は、入力データ記憶部16に対して回答者数を書き込んで記憶させる。また、回答項目入力部11は、入力された回答項目及び選択肢に基づき、図3に示す回答項目テーブルを生成し、入力データ記憶部16に対して書き込んで記憶させる。
【0084】
ステップS2:
作業者は、入力手段を介して、対象となるアンケート調査の回答項目である地域、車種、メーカの各々の選択肢毎の回答確率の単純集計の数値(回答率)を、アンケートテストデータ生成システムに入力する。
回答項目入力部11は、入力された単純集計の数値に基づき、図4に示す単純集計テーブルを生成し、入力データ記憶部16に対して書き込んで記憶させる。
【0085】
ステップS3:
作業者は、入力手段を介して、対象となるアンケート調査の回答項目の特定の選択肢のクロスした欄における回答率を求める際の制約条件を、すなわち制約条件番号J_1、制約条件番号J_2、制約条件番号J_3、制約条件番号J_4の各々の制約条件を、入力手段を介してアンケートテストデータ生成システムに入力する。
回答項目入力部11は、入力された制約条件の示す制約を行う数値に基づき、図5に示す制約条件テーブルを生成し、入力データ記憶部16に対して書き込んで記憶させる。
【0086】
ステップS4:
作業者によるアンケート調査の回答項目と、回答項目の各選択肢の回答率の単純集計の数値と、特定の回答パターンである欄を示す選択肢の組合せに対する制約条件とが入力されると、アンケートテストデータ生成システムは、アンケートテストデータの生成処理を開始する。
クロス集計表変数生成部14は、入力データ記憶部16の回答項目テーブルから、回答項目及び回答項目における選択肢を読み出し、図6に示すクロス集計表の各欄(選択肢の行と列とがクロスする欄)に対応する回答パターンの数値を変数とするクロス集計表変数、すなわち、後述する図6(a)から図6(c)に示す3個のクロス集計表の各欄に対応するクロス集計表変数を生成する。ここで、クロス集計表変数生成部14は、2つの回答項目として、回答項目S_1のメーカにおける選択肢であるA社、B社、C社、D社と、回答項目S_2の車種における選択肢であるセダン、SUV、ミニバン、軽、その他とにより、図6(a)に示すクロス集計表における各欄の回答パターンに対応するクロス集計表変数を生成する。
【0087】
同様に、クロス集計表変数生成部14は、2つの回答項目として、回答項目S_1の車種における選択肢であるセダン、SUV、ミニバン、軽、その他と、回答項目S_2の地域における選択肢である東京、愛知、広島、栃木とにより、図6(b)に示すクロス集計表における各欄の回答パターンに対応するクロス集計表変数を生成する。また、クロス集計表変数生成部14は、2つの回答項目として、回答項目S_1のメーカにおける選択肢であるA社、B社、C社、D社と、回答項目S_2の地域における選択肢である東京、愛知、広島、栃木とにより、図6(c)に示すクロス集計表における各欄の回答パターンに対応するクロス集計表変数を生成する。
【0088】
ステップS5:
クロス集計表変数生成部14は、上述のように生成したクロス集計表における単純集計の欄に対応するクロス集計表変数に対し、入力データ記憶部16から単純集計の数値を読み出し、図6(a)、図6(b)及び図6(c)の各々のクロス集計表の単純集計の欄に対応するクロス集計表変数に対して書き込む。
そして、クロス集計表変数生成部14は、生成した各クロス集計表のクロス集計表変数を演算データ記憶部17に対して書き込んで記憶させる。また、クロス集計表変数生成部14は、クロス集計表における各欄の回答パターンに対応するクロス集計表変数の生成が終了したことを、数理計画部15に対して通知する。
【0089】
ステップS6:
数理計画部15は、クロス集計表の指定された欄(回答パターン)に対応するクロス集計表変数における回答率の数値が制約条件を満たした上で、クロス集計表の各欄に対応する回答パターンの回答率と各欄の単純集計積との差分により求めた差分誤差が最小となるように、上記(4)式から(7)式を用いて、個別回答パターンの回答率を数理計画法により個別解として求める。
このとき、数理計画部15は、全ての個別回答パターンの回答率の各々を、制約条件を満たすように変更して順次生成し、目的関数で規定されている最小化を行い、制約条件を満たした上で、差分誤差が最小となる個別回答パターンを、(1)式から(7)式を用いて求める。
【0090】
ステップS7:
次に、回答振分部19は、入力データ記憶部16から、作業者が入力した回答者数を読み出す。
そして、回答振分部19は、回答確率に対応した乱数を、回答者数と同一の数を発生させて、この発生した乱数を各回答確率に対応した個別回答パターンに振り分ける。
このとき、回答振分部19は、1から0までの範囲において、0から1へ順番に、各回答パターンの回答確率を加算していき、それぞれ加算した回答確率の数値範囲をその回答パターンの振分領域とする。例えば、0に対して回答確率#1として0.05を加算し、次に0.05に対して回答確率#2として0.34を加算し、次に0.39に対して回答確率#3として0.21を加算し、…を繰り返し、全ての個別回答パターンの回答率を加算する。
【0091】
そして、回答確率#1の個別回答パターンを振分領域#1に対応させ、回答確率#2の個別回答パターンを振分領域#2に対応させ、回答確率#3の個別回答パターンを振分領域#3に対応させ、…を繰り返し、全ての個別回答パターンを振分領域に対応させる。例えば、このとき、振分領域#1の数値範囲xは0<x≦0.05であり、振分領域#2の数値範囲xは0.05<x≦0.39であり、振分領域#3の数値範囲xは0.39<x≦0.6となる。そして、0<y≦1の範囲yで乱数を発生させ、0.01が乱数として生成された場合、回答確率#2の個別回答パターンに回答者を1人振り分け、0.58が乱数として生成された場合、回答確率#3の個別回答パターンに回答者を1人振り分ける。このように、回答振分部19は、回答者数と同一の数の乱数を発生させ、発生した各々の乱数を用いて、順次上述した回答者の個別回答パターンへの振分作業を行い、各回答確率に対応する個別回答パターンの振分領域に対して、設定された回答者数の回答者全てを完全に振り分ける。
【0092】
ステップS8:
回答振分部19は、回答振分部19は、80種類の個別回答パターンの各々の回答確率を、アンケートテストデータ記憶部18のアンケートテストデータ結果テーブルに対して書き込んで記憶させる。回答振分部19は、作業者の指示により、図示しない表示画面に、上記アンケートテストデータ結果テーブルを表示させても良い。
また、回答振分部19は、求めた個別回答パターン毎の回答者数に基づき、各回答項目からなる図6に示すクロス集計表を生成する。
例えば、回答振分部19は、図6(a)のクロス集計表の場合、回答項目が車種であり選択肢をセダンと回答し、かつ回答項目がメーカであり選択肢をA社とした全ての個別回答パターンの回答者数を加算することで、A社の選択肢の列651とセダンの選択肢の行652とがクロスする欄653の回答者数が求められる。同様に、回答振分部19は、セダンの選択肢の行652において、回答項目が車種であり選択肢をセダンと回答し、かつ回答項目がメーカであり選択肢をB社、C社、D社と順次換え、セダンの選択肢の行652と、B社、C社、D社それぞれの列との交差する欄の回答者数を順次算出し、行652の行の欄の回答者数を積算し、選択肢がセダンの単純集計の数値としての回答者数を求める。
【0093】
また、回答振分部19は、A社のセダンの選択肢の列651において、回答項目がメーカであり選択肢をA社と回答し、かつ回答項目が車種であり選択肢をSUV、ミニバン、軽、その他と順次換え、A社の選択肢の列651と、SUV、ミニバン、軽、その他それぞれの行との交差する欄の回答者数を順次算出し、列651の列の欄の回答者数を積算し、選択肢がA社の単純集計の数値としての回答者数を求める。回答振分部19は、上述した処理を繰り返すことにより、図8(a)のクロス集計表を完成させ、アンケートテストデータ記憶部18に対して書き込んで記憶させる。
同様に、回答振分部19は、図8(b)及び図8(c)の各々も、上述した処理により生成し、アンケートテストデータ記憶部18に対して書き込んで記憶させる。
【0094】
また、図1における質問表回答テストデータ生成システムの機能を実現するためのプログラムをコンピュータ読み取り可能な記録媒体に記録して、この記録媒体に記録されたプログラムをコンピュータシステムに読み込ませ、実行することにより上述した質問表回答テストデータの生成処理を行ってもよい。なお、ここでいう「コンピュータシステム」とは、OSや周辺機器等のハードウェアを含むものとする。
【0095】
また、「コンピュータシステム」は、WWWシステムを利用している場合であれば、ホームページ提供環境(あるいは表示環境)も含むものとする。
また、「コンピュータ読み取り可能な記録媒体」とは、フレキシブルディスク、光磁気ディスク、ROM、CD−ROM等の可搬媒体、コンピュータシステムに内蔵されるハードディスク等の記憶装置のことをいう。さらに「コンピュータ読み取り可能な記録媒体」とは、インターネット等のネットワークや電話回線等の通信回線を介してプログラムを送信する場合の通信線のように、短時間の間、動的にプログラムを保持するもの、その場合のサーバやクライアントとなるコンピュータシステム内部の揮発性メモリのように、一定時間プログラムを保持しているものも含むものとする。また上記プログラムは、前述した機能の一部を実現するためのものであっても良く、さらに前述した機能をコンピュータシステムにすでに記録されているプログラムとの組み合わせで実現できるものであっても良い。
【0096】
以上、この発明の実施形態を図面を参照して詳述してきたが、具体的な構成はこの実施形態に限られるものではなく、この発明の要旨を逸脱しない範囲の設計等も含まれる。
【符号の説明】
【0097】
1…アンケートテストデータ生成システム
11…回答項目入力部
12…単純集計入力部
13…制約値入力部
14…クロス集計表変数生成部
15…数理計画部
16…入力データ記憶部
17…演算データ記憶部
18…アンケートテストデータ記憶部
19…回答者振分部
図1
図2
図3
図4
図5
図6
図7
図8
図9