(19)【発行国】日本国特許庁(JP)
(12)【公報種別】公開特許公報(A)
(11)【公開番号】P2023162917
(43)【公開日】2023-11-09
(54)【発明の名称】情報処理方法、情報処理装置、情報処理プログラム、および、該情報処理プログラムを記憶したコンピュータ読取可能な記憶媒体
(51)【国際特許分類】
G06N 20/00 20190101AFI20231101BHJP
【FI】
G06N20/00 160
【審査請求】未請求
【請求項の数】8
【出願形態】OL
(21)【出願番号】P 2022073632
(22)【出願日】2022-04-27
(71)【出願人】
【識別番号】000003137
【氏名又は名称】マツダ株式会社
(74)【代理人】
【識別番号】110001427
【氏名又は名称】弁理士法人前田特許事務所
(72)【発明者】
【氏名】目良 貢
(57)【要約】
【課題】行列データの解析に際し、第1及び第2の目的因子の値が0と1に別れた要因を従来よりも明確に捉える。
【解決手段】情報処理方法は、行列データにPLSA法を適用するステップS1と、PLSA法適用後の行列データにおいて特定の潜在クラスに属する対象者n
iそれぞれを基底とし、該対象者n
iそれぞれに割り当てられた因子p
jの値を各基底の成分とした多次元ベクトルを生成するステップS2と、多次元ベクトルにt-SNE法を適用することで低次元ベクトルを生成するステップS3と、第1及び第2の目的因子p
f,p
sに対応した低次元ベクトルと比較因子に対応した低次元ベクトルとの相対的な位置関係を可視化するステップS4とを備え、特定の潜在クラスを変更しかつ変更前後の両方でステップS2-S4を実行し、その実行結果を変更前後で比較することで第1及び第2の目的因子p
f,p
sの値が0又は1に別れた要因を分析する。
【選択図】
図3
【特許請求の範囲】
【請求項1】
プログラムを実行する演算部を備えるコンピュータを用いることによって、複数の分析対象者と、該複数の分析対象者それぞれに割り当てられた0又は1の値からなる複数の因子とを行列化してなる行列データを解析するとともに、該解析結果を可視化する情報処理方法であって、
前記演算部が前記行列データにPLSA法を適用することで、それぞれ異なる潜在クラスによってラベリングされたブロック行列からなるブロック対角行列に近付けるように、前記行列データをクラスタリングするPLSAステップと、
前記クラスタリング後の前記行列データにおいて、特定の潜在クラスに属する分析対象者それぞれを基底とし、該分析対象者それぞれに割り当てられた因子の値を各基底の成分とした多次元ベクトルを、前記複数の因子のうちの少なくとも一部の因子について、前記演算部が生成する分析対象抽出ステップと、
前記演算部が前記多次元ベクトルにt-SNE法を適用することで、前記多次元ベクトルを2次元または3次元の低次元ベクトルに次元圧縮する次元圧縮ステップと、
前記少なくとも一部の因子のうち異なる2つの因子をそれぞれ第1および第2の目的因子とし、前記特定の潜在クラスに属する他の因子を1つ又は複数の比較因子とすると、前記第1の目的因子に対応した低次元ベクトルと、前記第2の目的因子に対応した低次元ベクトルと、前記1つ又は複数の比較因子に対応した各低次元ベクトルとの相対的な位置関係を前記演算部が可視化するベクトル可視化ステップと、
前記ベクトル可視化ステップによって可視化された前記相対的な位置関係に基づいて、前記第1及び第2の目的因子の値が0と1に別れた要因を分析する要因分析ステップと、を備え、
前記第1および第2の目的因子を固定した状態で、前記特定の潜在クラスを一の潜在クラスから他の潜在クラスに変更するとともに、変更前後の前記特定の潜在クラスの両方で、前記分析対象抽出ステップ、前記次元圧縮ステップ及び前記ベクトル可視化ステップを実行し、該ベクトル可視化ステップの実行結果を変更前後で比較することで、前記要因分析ステップを実行する
ことを特徴とする情報処理方法。
【請求項2】
請求項1に記載された情報処理方法において、
前記ベクトル可視化ステップでは、
前記第1の目的因子に対応した前記低次元ベクトルと、前記1つ又は複数の比較因子の各々に対応した前記低次元ベクトルとのユークリッド距離を示す第1の距離と、
前記第2の目的因子に対応した前記低次元ベクトルと、前記1つ又は複数の比較因子の各々に対応した前記低次元ベクトルとのユークリッド距離を示す第2の距離と、を前記演算部が判定し、
前記要因分析ステップでは、
前記第1及び第2の距離の長短に基づいて、前記1つ又は複数の比較因子の中から、前記第1及び第2の目的因子の値に寄与した因子を探索する
ことを特徴とする情報処理方法。
【請求項3】
請求項2に記載された情報処理方法において、
前記要因分析ステップでは、前記1つ又は複数の比較因子のうち、
前記第1の目的因子に対して近距離かつ前記第2の目的因子に対して遠距離となる比較因子と、
前記第1の目的因子に対して遠距離かつ前記第2の目的因子に対して近距離となる比較因子と、のうちの少なくとも一方を探索し、
前記探索結果に基づいて、前記第1及び第2の目的因子の値が0と1に別れた要因を分析する
ことを特徴とする情報処理方法。
【請求項4】
請求項3に記載された情報処理方法において、
前記特定の潜在クラスは、前記PLSAステップによって取得された潜在クラスのうち、前記第1の目的因子および前記第2の目的因子のうちの少なくとも一方が属さない潜在クラスから選ばれる
ことを特徴とする情報処理方法。
【請求項5】
請求項1から4のいずれか1項に記載された情報処理方法において、
前記第1の目的因子は、所定の物品を所有しているか否かを示すフラグであり、
前記第2の目的因子は、前記所定の物品とは相違する別の物品を所要しているか否かを示すフラグであり、
前記所定の物品および前記別の部品は、製造者の異なる同種の物品である
ことを特徴とする情報処理方法。
【請求項6】
プログラムを実行する演算部を備えるコンピュータを備え、複数の分析対象者と、該複数の分析対象者それぞれに割り当てられた0又は1の値からなる複数の因子とを行列化してなる行列データを解析するとともに、該解析結果を可視化する情報処理装置であって、
前記演算部が前記行列データにPLSA法を適用することで、それぞれ異なる潜在クラスによってラベリングされたブロック行列からなるブロック対角行列に近付けるように、前記行列データをクラスタリングするPLSA手段と、
前記クラスタリング後の前記行列データにおいて、特定の潜在クラスに属する分析対象者それぞれを基底とし、該分析対象者それぞれに割り当てられた因子の値を各基底の成分とした多次元ベクトルを、前記複数の因子のうちの少なくとも一部の因子について、前記演算部が生成する分析対象抽出手段と、
前記演算部が前記多次元ベクトルにt-SNE法を適用することで、前記多次元ベクトルを2次元または3次元の低次元ベクトルに次元圧縮する次元圧縮手段と、
前記少なくとも一部の因子のうち異なる2つの因子をそれぞれ第1および第2の目的因子とし、前記特定の潜在クラスに属する他の因子を1つ又は複数の比較因子とすると、前記第1の目的因子に対応した低次元ベクトルと、前記第2の目的因子に対応した低次元ベクトルと、前記1つ又は複数の比較因子に対応した各低次元ベクトルとの相対的な位置関係を前記演算部が可視化するベクトル可視化手段と、
前記ベクトル可視化手段によって可視化された前記相対的な位置関係に基づいて、前記第1及び第2の目的因子の値が0と1に別れた要因を分析する要因分析手段と、を備え、
前記第1および第2の目的因子を固定した状態で、前記特定の潜在クラスを一の潜在クラスから他の潜在クラスに変更するとともに、変更前後の前記特定の潜在クラスの両方で、前記分析対象抽出手段、前記次元圧縮手段及び前記ベクトル可視化手段による処理を実行させ、該ベクトル可視化ステップの実行結果を変更前後で比較することで、前記要因分析手段による処理を実行させる
ことを特徴とする情報処理装置。
【請求項7】
プログラムを実行する演算部を備えるコンピュータに実行させることによって、複数の分析対象者と、該複数の分析対象者それぞれに割り当てられた0又は1の値からなる複数の因子とを行列化してなる行列データを解析するとともに、該解析結果を可視化する情報処理プログラムであって、
前記コンピュータに、
前記演算部が前記行列データにPLSA法を適用することで、それぞれ異なる潜在クラスによってラベリングされたブロック行列からなるブロック対角行列に近付けるように、前記行列データをクラスタリングするPLSAステップと、
前記クラスタリング後の前記行列データにおいて、特定の潜在クラスに属する分析対象者それぞれを基底とし、該分析対象者それぞれに割り当てられた因子の値を各基底の成分とした多次元ベクトルを、前記複数の因子のうちの少なくとも一部の因子について、前記演算部が生成する分析対象抽出ステップと、
前記演算部が前記多次元ベクトルにt-SNE法を適用することで、前記多次元ベクトルを2次元または3次元の低次元ベクトルに次元圧縮する次元圧縮ステップと、
前記少なくとも一部の因子のうち異なる2つの因子をそれぞれ第1および第2の目的因子とし、前記特定の潜在クラスに属する他の因子を1つ又は複数の比較因子とすると、前記第1の目的因子に対応した低次元ベクトルと、前記第2の目的因子に対応した低次元ベクトルと、前記1つ又は複数の比較因子に対応した各低次元ベクトルとの相対的な位置関係を前記演算部が可視化するベクトル可視化ステップと、
前記ベクトル可視化ステップによって可視化された前記相対的な位置関係に基づいて、前記第1及び第2の目的因子の値が0と1に別れた要因を分析する要因分析ステップと、を実行させ、
前記コンピュータに、
前記第1および第2の目的因子を固定した状態で、前記特定の潜在クラスを一の潜在クラスから他の潜在クラスに変更するとともに、変更前後の前記特定の潜在クラスの両方で、前記分析対象抽出ステップ、前記次元圧縮ステップ及び前記ベクトル可視化ステップを実行させ、該ベクトル可視化ステップの実行結果を変更前後で比較することで、前記要因分析ステップを実行させる
ことを特徴とする情報処理プログラム。
【請求項8】
請求項7に記載された情報処理プログラムを記憶している
ことを特徴とするコンピュータ読取可能な記憶媒体。
【発明の詳細な説明】
【技術分野】
【0001】
ここに開示する技術は、情報処理方法、情報処理装置、情報処理プログラム、および、該情報処理プログラムを記憶したコンピュータ読取可能な記憶媒体に関する。
【背景技術】
【0002】
複雑なビッグデータに対する分析手法として、いわゆる確率的潜在意味解析法(PLSA)が広く知られている。PLSAとは、解析対象とした行列を潜在変数毎にクラスタリングすることで、行成分および列成分のうちの少なくとも一方を低次元化する手法である。
【0003】
一例として、アンケート回答者を行成分とし、アンケート項目を列成分とし、アンケートの回答内容を値とした行列に対してPLSAを適用した場合、潜在変数によって分類された各潜在クラスには、1つまたは複数のアンケート回答者と、1つまたは複数のアンケート項目とが属することになる。
【0004】
この場合、前記行列に、「メーカAを好むか否か」、「メーカBを好むか否か」および「メーカCを好むか否か」等のアンケート項目が含まれていると仮定すると、「第1の潜在クラスに属する回答者はメーカAを好み、第2の潜在クラスに属する回答者はメーカBを好み、第3の潜在クラスに属する回答者はメーカCを好み、…」等、同じ潜在クラスに属するアンケート回答者に対し、アンケート項目に応じた解釈を与えることが可能になる。
【0005】
PLSAの具体的な応用例として、例えば下記特許文献1には、目的のデータおよび/または情報を獲得、分析ならびにマイニングする方法において、マイニングされたデータをクラスタリングするためにPLSAを用いることが開示されている。
【0006】
また、複雑な高次元データを低次元化するためのアルゴリズムとして、いわゆるt分布型確率的近傍埋め込み法(t-SNE)も知られている。t-SNEを用いることで、データ間の局所的な関係性を維持しつつ、高次元データを2次元または3次元データに変換することが可能になる。
【0007】
t-SNEの具体的な応用例として、例えば下記特許文献2には、参照データの各要素がマッピングされた2次元空間または3次元空間を生成するために、処理部がt-SNEを用いることが開示されている。
【先行技術文献】
【特許文献】
【0008】
【特許文献1】特表2009-525514号公報
【特許文献2】特開2019-91454号公報
【発明の概要】
【発明が解決しようとする課題】
【0009】
本願発明者らは、複数の分析対象者と、該複数の分析対象者それぞれに割り当てられた0又は1の値からなる複数の因子とを行列化してなる行列に対し、PLSAを用いた分析を試みた。
【0010】
この場合、PLSAによって得られる潜在クラスは、各潜在クラスに属する1人または複数人の分析対象者と、該分析対象者と同じ潜在クラスに属する1つまたは複数の因子とによって特徴付けられることになる。ここで、所定の潜在クラスに属する因子の値は、同じ潜在クラスに属する分析対象者の間で類似した値にはなるものの、完全に同一の値になるとは限らない。
【0011】
前述の例を用いて説明すれば、「メーカAを好む潜在クラスに分類されたアンケート回答者には、実際にメーカAの製品を所有している回答者(1の値が割り当てられた回答者)ばかりでなく、メーカAの製品を所有していない回答者(0の値が割り当てられた回答者)も含まれる」ことになる。
【0012】
本願発明者らは、いずれかの潜在クラスに属する2つの因子(以下、「第1の目的因子」および「第2の目的因子」という)の値が0と1に別れた要因を、それら第1および第2の目的因子と、他の因子との関係性から分析することを検討した。
【0013】
そうした分析を行うための手法としては、PLSAによるクラスタリング後の行列において、特定の潜在クラスに属する各因子を互いに異なるベクトルとみなすことで、その潜在クラスに属する分析対象者と同数の次元を有する多次元ベクトルを生成することが考えられる。この場合、第1の目的因子に対応したベクトルと、第2の目的因子に対応したベクトルと、他の因子に対応したベクトルとのユークリッド距離等を分析することで、第1および第2の目的因子の双方と同じ傾向を持った因子を抽出したり、それとは反対に、一方の目的因子と同傾向を有しかつ他方の目的因子と遭難する傾向を持った因子を抽出したりすることが可能になる。
【0014】
ところが、分析対象者が多数にわたる場合、前述のような多次元ベクトルは、可視化するのが容易ではなく、直感的にも把握しがたいという難点があった。そのため、特定の潜在クラスに属する各因子に対応した多次元ベクトルに対し、t-SNEを適用して低次元ベクトルへと変換することが考えられる。
【0015】
しかしながら、同じ潜在クラスに属する因子の値は、前述のように、同じ潜在クラスに属する分析対象者の間で類似した値となり得る。そのため、そうした因子に対応した低次元ベクトルだけでは、第1および第2の目的因子に対応した低次元ベクトルとの傾向の差を捉えるには不十分である。
【0016】
本開示は、かかる点に鑑みてなされたものであり、その目的とするところは、複数の分析対象者と、該複数の分析対象者それぞれに割り当てられた0又は1の値からなる複数の因子とを行列化してなる行列データの解析に際し、第1及び第2の目的因子の値が0と1に別れた要因を、従来よりも明確に捉えることにある。
【課題を解決するための手段】
【0017】
本開示の第1の態様は、プログラムを実行する演算部を備えるコンピュータを用いることによって、複数の分析対象者と、該複数の分析対象者それぞれに割り当てられた0又は1の値からなる複数の因子とを行列化してなる行列データを解析するとともに、該解析結果を可視化する情報処理方法に係る。
【0018】
そして、本開示の第1の態様によれば、前記情報処理方法は、前記演算部が前記行列データにPLSA法を適用することで、それぞれ異なる潜在クラスによってラベリングされたブロック行列からなるブロック対角行列に近付けるように、前記行列データをクラスタリングするPLSAステップと、前記クラスタリング後の前記行列データにおいて、特定の潜在クラスに属する分析対象者それぞれを基底とし、該分析対象者それぞれに割り当てられた因子の値を各基底の成分とした多次元ベクトルを、前記複数の因子のうちの少なくとも一部の因子について、前記演算部が生成する分析対象抽出ステップと、前記演算部が前記多次元ベクトルにt-SNE法を適用することで、前記多次元ベクトルを2次元または3次元の低次元ベクトルに次元圧縮する次元圧縮ステップと、前記少なくとも一部の因子のうち異なる2つの因子をそれぞれ第1および第2の目的因子とし、前記特定の潜在クラスに属する他の因子を1つ又は複数の比較因子とすると、前記第1の目的因子に対応した低次元ベクトルと、前記第2の目的因子に対応した低次元ベクトルと、前記1つ又は複数の比較因子に対応した各低次元ベクトルとの相対的な位置関係を前記演算部が可視化するベクトル可視化ステップと、前記ベクトル可視化ステップによって可視化された前記相対的な位置関係に基づいて、前記第1及び第2の目的因子の値が0と1に別れた要因を分析する要因分析ステップと、を備え、前記第1および第2の目的因子を固定した状態で、前記特定の潜在クラスを一の潜在クラスから他の潜在クラスに変更するとともに、変更前後の前記特定の潜在クラスの両方で、前記分析対象抽出ステップ、前記次元圧縮ステップ及び前記ベクトル可視化ステップを実行し、該ベクトル可視化ステップの実行結果を変更前後で比較することで、前記要因分析ステップを実行する。
【0019】
ここで、前記PLSAステップでは、ブロック対角行列に近付くように、所定の行列に対して並び替え(クラスタリング)が施されることになる。以下、クラスタリング後の行列を「準ブロック対角行列」ともいう。「準ブロック対角行列」の非ブロック対角部分は、ブロック対角行列の非ブロック対角部分とは異なり、非ゼロの値を取り得る。
【0020】
また、クラスタリング(言い換えると、ブロック対角行列に近付けるような行列の並び替え)によって得られる各ブロック行列は、それぞれ、潜在クラスに対応することになる。なお、ここでいう「ブロック行列」とは、前記準ブロック対角行列のブロック対角部分を構成する行列を指す。
【0021】
前記第1の態様によると、特定の潜在クラス(以下、単に「特定クラス」という)に属する分析対象者それぞれを基底とし、該分析対象者それぞれに割り当てられた因子の値を各基底の成分とした多次元ベクトルに対してt-SNE法を適用することで、その多次元ベクトルを低次元ベクトルに次元圧縮する。
【0022】
そして、低次元ベクトルの可視化に際し、いずれかの潜在クラスに属する第1及び第2の目的因子と、前記特定クラスに属する他の比較因子との比較を行う。その際、後者の比較因子に係る特定クラスについて、一の潜在クラスから他の潜在クラスに変更し、ベクトル可視化ステップによって可視化された内容を変更前後で比較する。
【0023】
すなわち、比較因子が属する特定クラスを変更しながら、各特定クラスにおいてベクトル可視化ステップによる可視化を行うことで、第1又は第2の目的因子に対応した低次元ベクトルと、比較因子に対応した低次元ベクトルとの違いを明確化することができる。そうして違いが明確化された状態で、各目的因子に近接又は離間する比較因子を探索することで、2つの目的因子の値が0又は1に別れた契機となり得る要因を、従来よりも明確に捉えることが可能になる。
【0024】
またそもそも、比較因子が属する特定クラスを変更することは、多次元ベクトルの基底となる分析対象者を変更することに等しい。そうして特定クラスを変更しつつ、各特定クラスにおいて目的因子と強く相関するような比較因子を探索することで、第1及び第2の目的因子の値が0と1に別れた要因を、従来よりも多方面から捉えることができるようになる。
【0025】
また、本開示の第2の態様によれば、前記ベクトル可視化ステップでは、前記第1の目的因子に対応した前記低次元ベクトルと、前記1つ又は複数の比較因子の各々に対応した前記低次元ベクトルとのユークリッド距離を示す第1の距離と、前記第2の目的因子に対応した前記低次元ベクトルと、前記1つ又は複数の比較因子の各々に対応した前記低次元ベクトルとのユークリッド距離を示す第2の距離と、を前記演算部が判定し、前記要因分析ステップでは、前記第1及び第2の距離の長短に基づいて、前記1つ又は複数の比較因子の中から、前記第1及び第2の目的因子の値に寄与した因子を探索する、としてもよい。
【0026】
前記第2の態様によると、前記要因分析ステップは、各ユークリッド距離の長短に基づいて因子を探索するように構成されている。このように構成することで、より直感的に理解し易い形式で可視化及び探索することが可能になる。これにより、第1及び第2の目的因子の値が0と1に別れた要因を捉える上で有利になる。
【0027】
また、本開示の第3の態様によれば、前記要因分析ステップでは、前記1つ又は複数の比較因子のうち、前記第1の目的因子に対して近距離かつ前記第2の目的因子に対して遠距離となる比較因子と、前記第1の目的因子に対して遠距離かつ前記第2の目的因子に対して近距離となる比較因子と、のうちの少なくとも一方を探索し、前記探索結果に基づいて、前記第1及び第2の目的因子の値が0と1に別れた要因を分析する、としてもよい。
【0028】
前記第3の態様によると、第1の目的因子に近接又は離間する比較因子と、第2の目的因子に近接又は離間する比較因子とを探索することで、2つの目的因子の値が別れた要因を、より的確に分析することができる。
【0029】
また、本開示の第4の態様によれば、前記特定の潜在クラスは、前記PLSAステップによって取得された潜在クラスのうち、前記第1の目的因子および前記第2の目的因子のうちの少なくとも一方が属さない潜在クラスから選ばれる、としてもよい。
【0030】
一般に、クラスタリングによって得られた各ブロック行列が、それぞれ潜在クラスに対応することから明らかなように、同じ潜在クラスに属する因子に対応した低次元ベクトルは、互いに類似した傾向(例えば、ベクトル長が同程度になったり、内積が1に近接したりする傾向)を示す。
【0031】
それに対し、第1及び/又は第2の目的因子が属する潜在クラスと、比較因子が属する特定クラスとを異ならせることで、各因子に対応した低次元ベクトル同士の違いを明確化することができる。そうして違いが明確化された状態で、第1及び/又は第2の目的因子に対して近接又は離間する比較因子を探索することで、その目的因子の値が0と1となった契機となり得る要因を、従来よりも明確に捉えることが可能になる。
【0032】
またそもそも、目的因子が属する潜在クラスと、比較因子が属する特定クラスとを異ならせた状態で比較因子の探索を行うことは、PLSA法を行った段階では異なる潜在クラスに分類されたものの、それでもなお、目的因子と強く相関するような比較因子を探索することに相当する。これは、従来のPLSA法では知り得ない知見であり、第1及び第2の目的因子の値が0と1となった要因を、従来よりも多方面から捉えることができるようになる。
【0033】
また、本開示の第5の態様によれば、前記第1の目的因子は、所定の物品を所有しているか否かを示すフラグであり、前記第2の目的因子は、前記所定の物品とは相違する別の物品を所要しているか否かを示すフラグであり、前記所定の物品および前記別の部品は、製造者の異なる同種の物品である、としてもよい。
【0034】
前記第5の態様によると、第1又は第2目的因子に対応した多次元ベクトルを構成する基底には、前記フラグが1となった分析対象者、すなわち、前記物品を実際に所有している分析対象者が含まれることになる。そうした多次元ベクトルに基づき生成された低次元ベクトルに対して前述の可視化を行うことで、前記物品を所有する契機となった要因、或いは、所有しない契機となった要因を、従来よりも多方面から捉えることが可能になる。
【0035】
ここで、例えば、第2の目的因子が、第1の目的因子の競合商品を所有しているか否かを示すフラグだった場合、第1及び第2の目的因子が0と1に別れた要因を探索することで、前記競合商品の改良点、訴求点等を明らかにすることが可能になる。それらの知見を分析することで、第1の目的因子に対応した商品の要改良点等を明確化(見える化)することができる。
【0036】
本開示の第6の態様は、プログラムを実行する演算部を備えるコンピュータを備え、複数の分析対象者と、該複数の分析対象者それぞれに割り当てられた0又は1の値からなる複数の因子とを行列化してなる行列データを解析するとともに、該解析結果を可視化する情報処理装置に係る。
【0037】
そして、本開示の第6の態様によれば、前記情報処理装置は、前記演算部が前記行列データにPLSA法を適用することで、それぞれ異なる潜在クラスによってラベリングされたブロック行列からなるブロック対角行列に近付けるように、前記行列データをクラスタリングするPLSA手段と、前記クラスタリング後の前記行列データにおいて、特定の潜在クラスに属する分析対象者それぞれを基底とし、該分析対象者それぞれに割り当てられた因子の値を各基底の成分とした多次元ベクトルを、前記複数の因子のうちの少なくとも一部の因子について、前記演算部が生成する分析対象抽出手段と、前記演算部が前記多次元ベクトルにt-SNE法を適用することで、前記多次元ベクトルを2次元または3次元の低次元ベクトルに次元圧縮する次元圧縮手段と、前記少なくとも一部の因子のうち異なる2つの因子をそれぞれ第1および第2の目的因子とし、前記特定の潜在クラスに属する他の因子を1つ又は複数の比較因子とすると、前記第1の目的因子に対応した低次元ベクトルと、前記第2の目的因子に対応した低次元ベクトルと、前記1つ又は複数の比較因子に対応した各低次元ベクトルとの相対的な位置関係を前記演算部が可視化するベクトル可視化手段と、前記ベクトル可視化手段によって可視化された前記相対的な位置関係に基づいて、前記第1及び第2の目的因子の値が0と1に別れた要因を分析する要因分析手段と、を備え、前記第1および第2の目的因子を固定した状態で、前記特定の潜在クラスを一の潜在クラスから他の潜在クラスに変更するとともに、変更前後の前記特定の潜在クラスの両方で、前記分析対象抽出手段、前記次元圧縮手段及び前記ベクトル可視化手段による処理を実行させ、該ベクトル可視化ステップの実行結果を変更前後で比較することで、前記要因分析手段による処理を実行させる。
【0038】
前記第6の態様によると、行列データの解析に際し、第1及び第2の目的因子の値が0と1に別れた要因を、従来よりも明確に捉えることができる。
【0039】
本開示の第7の態様は、プログラムを実行する演算部を備えるコンピュータに実行させることによって、複数の分析対象者と、該複数の分析対象者それぞれに割り当てられた0又は1の値からなる複数の因子とを行列化してなる行列データを解析するとともに、該解析結果を可視化する情報処理プログラムに係る。
【0040】
そして、本開示の第7の態様によれば、前記情報処理プログラムは、前記コンピュータに、前記演算部が前記行列データにPLSA法を適用することで、それぞれ異なる潜在クラスによってラベリングされたブロック行列からなるブロック対角行列に近付けるように、前記行列データをクラスタリングするPLSAステップと、前記クラスタリング後の前記行列データにおいて、特定の潜在クラスに属する分析対象者それぞれを基底とし、該分析対象者それぞれに割り当てられた因子の値を各基底の成分とした多次元ベクトルを、前記複数の因子のうちの少なくとも一部の因子について、前記演算部が生成する分析対象抽出ステップと、前記演算部が前記多次元ベクトルにt-SNE法を適用することで、前記多次元ベクトルを2次元または3次元の低次元ベクトルに次元圧縮する次元圧縮ステップと、前記少なくとも一部の因子のうち異なる2つの因子をそれぞれ第1および第2の目的因子とし、前記特定の潜在クラスに属する他の因子を1つ又は複数の比較因子とすると、前記第1の目的因子に対応した低次元ベクトルと、前記第2の目的因子に対応した低次元ベクトルと、前記1つ又は複数の比較因子に対応した各低次元ベクトルとの相対的な位置関係を前記演算部が可視化するベクトル可視化ステップと、前記ベクトル可視化ステップによって可視化された前記相対的な位置関係に基づいて、前記第1及び第2の目的因子の値が0と1に別れた要因を分析する要因分析ステップと、を実行させ、前記コンピュータに、前記第1および第2の目的因子を固定した状態で、前記特定の潜在クラスを一の潜在クラスから他の潜在クラスに変更するとともに、変更前後の前記特定の潜在クラスの両方で、前記分析対象抽出ステップ、前記次元圧縮ステップ及び前記ベクトル可視化ステップを実行させ、該ベクトル可視化ステップの実行結果を変更前後で比較することで、前記要因分析ステップを実行させる。
【0041】
前記第7の態様によると、行列データの解析に際し、第1及び第2の目的因子の値が0と1に別れた要因を、従来よりも明確に捉えることができる。
【0042】
また、本開示の第8の態様は、前記情報処理プログラムを記憶していることを特徴とするコンピュータ読取可能な記憶媒体に係る。
【0043】
前記第8の態様によると、行列データの解析に際し、第1及び第2の目的因子の値が0と1に別れた要因を、従来よりも明確に捉えることができる。
【発明の効果】
【0044】
以上説明したように、本開示によれば、第1及び第2の目的因子の値が0と1に別れた要因を、従来よりも明確に捉えることができる。
【図面の簡単な説明】
【0045】
【
図1】
図1は、情報処理装置のハードウェア構成を例示する図である。
【
図2】
図2は、情報処理装置のソフトウェア構成を例示する図である。
【
図3】
図3は、情報処理方法の手順を例示するフローチャートである。
【
図4】
図4は、PLSAステップの手順を例示するフローチャートである。
【
図6】
図6は、PLSAステップの基本概念を説明するための図である。
【
図7】
図7は、クラスタリング結果を例示する図である。
【
図8】
図8は、分析対象抽出ステップの手順を例示するフローチャートである。
【
図9A】
図9Aは、分析対象抽出ステップの基本概念を説明するための図である。
【
図9B】
図9Bは、特定クラス変更後の分析対象抽出ステップの基本概念を説明するための図である。
【
図10】
図10は、次元圧縮ステップの手順を例示するフローチャートである。
【
図11】
図11は、ベクトル可視化ステップの手順を例示するフローチャートである。
【
図12】
図12は、要因分析ステップの手順を例示するフローチャートである。
【
図13】
図13は、ベクトル可視化ステップによって可視化される内容を例示する図である。
【
図14】
図14は、第2のベクトル可視化ステップによって可視化される内容を例示する図である。
【
図15】
図15は、第3のベクトル可視化ステップによって可視化される内容を例示する図である。
【発明を実施するための形態】
【0046】
以下、本開示の実施形態を図面に基づいて説明する。なお、以下の説明は例示である。
【0047】
<装置構成>
図1は、本開示に係る情報処理装置(具体的には、情報処理装置を構成するコンピュータ1)のハードウェア構成を例示する図であり、
図2は、そのソフトウェア構成を例示する図である。
【0048】
図1に例示するように、コンピュータ1は、コンピュータ1全体の制御を司る中央処理装置(Central Processing Unit:CPU)3と、ブートプログラム等を記憶するリードオンリーメモリ(Read Only Memory:ROM)5と、メインメモリとして機能するランダムアクセスメモリ(Random Access Memory:RAM)7と、2次記憶装置としてのハードディスクドライブ(Hard Disk Drive:HDD)9と、を備える。なお、2次記憶装置としては、HDD9の代わりに、ソリッドステートドライブ(Solid State Drive:SSD)等を用いることもできる。
【0049】
これらの要素のうち、CPU3は、種々のプログラムを実行する。CPU3は、本実施形態における演算部として機能する。また、RAM7及びHDD9は、CPU3により実行されるプログラムを一時的または継続的に記憶する。RAM7及びHDD9は、それぞれ、本実施形態における記憶部として機能する。
【0050】
コンピュータ1はまた、ディスプレイ11と、ディスプレイ11上に表示される画像データを格納するグラフィックスメモリ(Video RAM:VRAM)13と、マンマシンインターフェースとしてのキーボード15及びマウス17と、を備える。ディスプレイ11は、CPU3による演算結果を表示することができ、本実施形態における表示部として機能する。また、本実施形態に係るコンピュータ1は、通信用のインターフェース21を解して外部機器との間でデータを送受することができる。
【0051】
図2に例示するように、HDD9のプログラムメモリには、オペレーティングシステム(Operating System:OS)19、PLSAプログラム29A、分析対象抽出プログラム29B、次元圧縮プログラム29C、ベクトル可視化プログラム29D、特定クラス変更プログラム29E、要因分析プログラム29F、アプリケーションプログラム39等が格納される。
【0052】
これらの要素のうち、PLSAプログラム29A、分析対象抽出プログラム29B、次元圧縮プログラム29C、ベクトル可視化プログラム29D、特定クラス変更プログラム29E及び要因分析プログラム29Fは、本実施形態における情報処理プログラム29を構成する。
【0053】
ここで、情報処理プログラム29とは、後述の情報処理方法を実行するためのプログラムであって、同方法を構成する各ステップをコンピュータ1に実行させるように構成されている。情報処理プログラム29は、コンピュータ読取可能な記憶媒体18に予め記憶されている。
【0054】
HDD9のプログラムメモリにおいて、PLSAプログラム29A、分析対象抽出プログラム29B、次元圧縮プログラム29C、ベクトル可視化プログラム29D、特定クラス変更プログラム29E及び要因分析プログラム29Fは、それぞれ、キーボード15、マウス17等から入力される指令に応じて起動される。その際、PLSAプログラム29A等は、HDD9からRAM7にロードされ、CPU3によって実行されることになる。
【0055】
一方、HDD9のデータメモリには、解析対象となる行列データ49と、その行列データ49をクラスタリングすることで得られるクラスタデータ59と、が格納される。
【0056】
この他、PLSAプログラム29A、分析対象抽出プログラム29B、次元圧縮プログラム29C、ベクトル可視化プログラム29D、特定クラス変更プログラム29E及び要因分析プログラム29Fを実行することで生成される種々のデータ、並びに、アプリケーションプログラム39の実行結果については、必要に応じて、HDD9のデータメモリに格納されたり、メインメモリとしてのRAM7に格納されたりする。
【0057】
以下、情報処理方法の具体的な方法論について詳細に説明する。
【0058】
<方法論>
図3は、情報処理方法の手順を例示するフローチャートである。
図3に例示した方法は、コンピュータ1を用いることによって、行列データ49を解析するとともに、その解析結果を可視化するものである。
【0059】
図3に示すように、情報処理方法は、PLSAステップ(ステップS1)と、分析対象抽出ステップ(ステップS2)と、次元圧縮ステップ(ステップS3)と、ベクトル可視化ステップ(ステップS4)と、特定クラス変更ステップ(ステップS6)と、要因分析ステップ(ステップS7)と、を順番に実行することで実施される。なお、ベクトル可視化ステップ及び要因分析ステップの実行結果は、いずれも、表示部としてのディスプレイ11上に表示することができる。
【0060】
これらのステップのうち、PLSAステップは、CPU3が前述のPLSAプログラム29Aを実行することで実施される。同様に、分析対象抽出ステップは、CPU3が分析対象抽出プログラム29Bを実行することで実施され、次元圧縮ステップは、CPU3が次元圧縮プログラム29Cを実行することで実施され、ベクトル可視化ステップは、CPU3がベクトル可視化プログラム29Dを実行することで実施され、特定クラス変更ステップは、CPU3が特定クラス変更プログラム29Eを実行することで実施され、要因分析ステップは、CPU3が要因分析プログラム29Fを実行することで実施される。
【0061】
CPU3がPLSAプログラム29A等を実行することで、コンピュータ1は、PLSAステップを実行するPLSA手段と、分析対象抽出ステップを実行する分析対象抽出手段と、次元圧縮ステップを実行する次元圧縮手段と、ベクトル可視化ステップを実行するベクトル可視化手段と、特定クラス変更ステップを実行する特定クラス変更手段と、要因分析ステップを実行する要因分析手段と、を備える情報処理装置として機能することになる。
【0062】
以下、情報処理方法を構成する各ステップについて順番に説明する。
【0063】
(PLSAステップ)
図4は、PLSAステップの手順を例示するフローチャートである。また、
図5は、行列データ49を例示する図であり、
図6は、PLSAステップの基本概念を説明するための図であり、
図7は、クラスタリング結果を例示する図である。
【0064】
ここで、
図4に例示するフローチャートは、
図3のステップS1において行われる処理を示している。すなわち、
図3において制御プロセスがステップS1に進むと、CPU3は、
図4のステップS11-S14を順番に実行することになる。
【0065】
PLSAステップは、CPU3が行列データ49にPLSA法を適用することで、それぞれ異なる潜在クラスによってラベリングされたブロック行列からなるブロック対角行列に近付けるように、前記行列データをクラスタリングするように構成されている。言い換えると、このPLSAステップは、それぞれ異なる潜在クラスによってラベリングされたブロック行列を含んだ前述の準ブロック対角行列となるように、行列データをクラスタリングするように構成されている。
【0066】
具体的に、
図4のステップS11において、CPU3が行列データ49を読み込む。
【0067】
この行列データ49は、複数の分析対象者ni(i=1,2,…,N)と、該複数の分析対象者niそれぞれに割り当てられた0又は1の値からなる複数の因子pj(j=1,2,…,M)とを行列化してなるものである。以下、「分析対象者」を単に「対象者」と記載する。対象者の人数(=N)は、好ましくは100人以上、さらに好ましくは1000となる。また、因子の数(=M)は、好ましくは100個以上、さらに好ましくは200個以上となる。
【0068】
特に本実施形態では、行列データ49の行成分が各対象者に対応し、列成分が各因子に対応するようになっている。すなわち、行列データ49に対応したN行M列の行列をXと表すと、Xの(i,j)成分は、i番目の対象者niにおける、j番目の因子pjの値を表すことになる。
【0069】
複数の因子pjは、それぞれ、各対象者niの性質、状態等を表すフラグとしてもよい。各対象者niの性質には、各対象者niの性別、性格及び嗜好が含まれる。各対象者niの状態には、各対象者niの年齢、健康状態及び所定の物品を所有しているか否を示すフラグが含まれる。複数の因子pjは、それぞれ、各対象者niに対するアンケートの回答結果としてもよい。仮の呼称として、各対象者niの性質及び状態を「価値観」と総称する場合がある。
【0070】
特に本実施形態では、各対象者n
iの嗜好として、複数の因子p
jに、メーカAによって製造された物品(例えば、A社製の自動車)を所有しているか否かを示すフラグ(
図5の因子p
1:「ユーザA」)と、この物品と同じ種類の物品であってかつメーカBによって製造された物品(例えば、B社製の自動車)を所有しているか否かを示すフラグ(
図5の因子p
2:「ユーザB」)と、この物品と同じ種類の物品であってかつメーカCによって製造された物品(例えば、C社製の自動車)を所有しているか否かを示すフラグ(
図5の因子p
3:「ユーザC」)とが含まれているものとする。
【0071】
詳しくは、
図5に示す例では、複数の因子p
jに、対象者n
iの性別を示すフラグ(因子p
4及び因子p
5)と、対象者n
iの年齢を示すフラグ(因子p
6及び因子p
7:「若年層」及び「熟年層」)と、対象者n
iの嗜好を示すフラグ(因子p
8~因子p
11)と、が含まれているものとする。
【0072】
さらに詳しくは、
図5に示す例では、複数の因子p
jに、「デザイン性を追求するか否か」を示すフラグ(因子p
8:「デザイン性」)と、「機能性を追求するか否か」を示すフラグ(因子p
9:「機能性」)と、「高級感を求めるか否か」を示すフラグ(因子p
10:「高級感」)と、「割安感を追求するか否か」を示すフラグ(因子p
11:「デザイン性」)と、が示されている。この他、視力の良否、認知状態の高低等、対象者n
iの健康状態を示すフラグを因子p
jに含めたり、集団行動を好むか否か等、対象者n
iの性格を示すフラグを因子p
jに含めたりしてもよい。
【0073】
なお、複数の因子p
jには、対象者n
iの年齢のように択一的に選ばれるフラグが含まれてもよいし、対象者n
iの嗜好のように重複を許すフラグが含まれていてもよい。例えば、
図5の因子p
6及び因子p
7に示すように、対象者n
iの年齢は、若年層及び熟年層のいずれか一方のフラグが1となり、他方のフラグは0となる。それに対し、同図の因子p
8及び因子p
9に示すように、対象者n
iの嗜好は、「デザイン性を追求するか否か」と「機能性を追求するか否か」の両方のフラグが1であってもよいし、片方のフラグが1であってもよいし、両方のフラグが0であってもよい。
【0074】
その後、ステップS11から続くステップS12において、演算部としてのCPU3が、ステップS11で読み込んだ行列データ49に対してPLSA法を適用する。PLSA法を適用することで、行列データ49は、ブロック対角行列に近づくように並び替えが施されることで、複数のクラスタClz(z=1,2,…,Z)にクラスタリングされることになる。ここで、ブロック行列(準ブロック対角行列のブロック対角部分)としての各クラスタCzは、いわゆる潜在クラス(潜在変数)zによってラベリングされることになる。
【0075】
PLSAは、行列データ49における行要素iと列要素jの同時確率分布P(i,j)を潜在クラスzによって展開し、下式(1)のように表したものに相当する。
【0076】
【0077】
上式に示すように、行要素iと列要素jは、双方とも、潜在クラスzを使って表現することができる。つまり、複数の対象者niがいずれかの潜在クラスzに分類されると同時に、複数の因子pjもいずれかの潜在クラスzに分類されることになる。これらの分類は、いずれも択一的に行われるようになっている。
【0078】
具体的な計算に際しては、いわゆるEMアルゴリズムを用いることによって、同時確率分布P(i,j)の対数尤度を最大にすることでクラスタリングを実行する。これにより、
図6の下段に示すように、対象者n
i及び因子p
jをそれぞれ第1クラスタCl
1(z=1)、第2クラスタCl
2(z=2)、第3クラスタCl
3(z=3)、…に分類することができる。各クラスタCl
zの構成成分は、フラグが1である確率が高いものが集まるように構成されている。換言すると、第1クラスタCl
1の(1,2)成分に示すように、各クラスタCl
zの構成成分は、必ずしも1になるとは限らない。
【0079】
なお、
図6の下段は、概略的な例示に過ぎない。前述のように対象者の人数を100人以上に設定しかつ因子の数を100個以上に設定した場合、各クラスタCl
zに属する対象者n
i及び因子p
jの数は、双方とも数十~百個程度に及び得る。
【0080】
その後、ステップS12から続くステップS13において、CPU3は、各潜在クラスzに顧客ID(対象者n
iの引数i)と、因子ID(因子p
jの引数j)を振り分ける。この振り分けによって、
図6に示すように、行列データ49を少なくとも2つ以上のクラスタに分類することができる。
【0081】
ここで、CPU3は、例えば、コンピュータ1の操作者による操作入力に基づいて、各クラスタClzを構成する1つ又は複数の因子pjを各クラスタClzの名称(看板)に設定することができる。この名称は、各クラスタClzの構成因子のうち、フラグが1となる確率が最も高い因子pjを選択してもよいし、操作者の目的に応じて、手動で選択してもよい。
【0082】
例えば
図6の場合、フラグが1となる確率が高い因子p
jとして、第1クラスタCl
1ではp
16とp
18が選択され、第2クラスタCl
2ではp
7とp
11が選択され、第3クラスタCl
3はp
2とp
12が選択されることになる。看板及び因子p
jの選択については、
図7も参照されたい。
【0083】
一方、例えば、「A社製品を所有するか、或いは、B社製品を所有するかを分かつ要因を知りたい」という目的に基づいて本開示を実施する場合、因子p1が属する第1クラスタCl1には「Aユーザ」、「A社指向」等の名称を付し、因子p2が属する第3クラスタCl3には「Bユーザ」、「B社指向」等の名称を付し、因子p1~p3のいずれも属さない第2クラスタCl2には、「その他ユーザ」等の名称を付すことができる。
【0084】
なお、所定の物品を示すか否かを示すフラグ(例えば、p
1)を因子p
jに含めた場合、各潜在クラスzに分類された対象者n
iには、例えば第1クラスタCl
1の対象者n
8、n
19及びn
21に示すように、実際にその物品(A社製品)を所有している者(p
1の値が1となった対象者)が含まれる。以下、そうした対象者n
iを「主要A社ユーザ」と呼称する場合がある。
図6に示す例では、対象者n
8,n
19,n
21が主要A社ユーザに相当する。
【0085】
また、各潜在クラスzに分類された対象者n
iには、前記主要A社ユーザに加え、第1クラスタCl
1の対象者n
18のように、「Aユーザ」と付された第1クラスタCl
1に属しつつも、その物品を所有していない者(p
1の値が0となった対象者)も含まれる。以下、そうした対象者n
iを「潜在A社ユーザ」と呼称する場合がある。
図6に示す例では、対象者n
18が潜在A社ユーザに相当する。
【0086】
また、各潜在クラスzに分類された対象者n
iには、主要A社ユーザ及び潜在A社ユーザに加え、第2クラスタCl
2の対象者n
1のように、「その他ユーザ」と付された第2クラスタCl
2等、「Aユーザ」以外のクラスタに属しつつも、A社製品を所有している者も含まれる。以下、そうした対象者n
iを「顕在A社ユーザ」と呼称する場合がある。
図6に示す例では、対象者n
1が顕在A社ユーザに相当する。
【0087】
以下、例えば、B社製品を所有しているか否かを示す因子p2が属する第3クラスタCl3に関し、同様に「主要B社ユーザ」、「潜在B社ユーザ」及び「顕在B社ユーザ」と呼称する場合がある。C社製品を所有しているか否かを示す因子p3を含んだ図外のクラスタClzについても同様である。
【0088】
続いて、ステップS13から続くステップS14において、CPU3は、クラスタデータ59として、潜在クラスz毎に、顧客IDと因子IDを並び変えた行列データ49をRAM7又はHDD9に格納する。つまり、ここでいうクラスタデータ59とは、
図6の下段に示すように、クラスタリング後の行列データ49に他ならない。そうして格納されたクラスタデータ59は、分析対象抽出ステップ等の後続の処理において、必要に応じて読み込まれる。ステップS14が完了すると、制御プロセスは、
図4に例示したフローからリターンし、
図3のステップS2へ進む。
【0089】
(分析対象抽出ステップ)
図8は、分析対象抽出ステップの手順を例示するフローチャートである。また、
図9Aは、分析対象抽出ステップの基本概念を説明するための図である。
【0090】
ここで、
図8に例示するフローチャートは、
図3のステップS2において行われる処理を示している。すなわち、
図3において制御プロセスがステップS2に進むと、CPU3は、
図8のステップS21-S24を順番に実行することになる。
【0091】
分析対象抽出ステップは、クラスタリング後の行列データ49、つまりクラスタデータ59において、特定の潜在クラス(以下、単に「特定クラス」ともいう)z’に属する対象者niそれぞれを基底とし、該対象者niそれぞれに割り当てられた因子pjの値を各基底の成分とした多次元ベクトルXz’,jを、全M個の複数の因子pjのうちの少なくとも一部についてCPU3が生成するように構成されている。
【0092】
具体的に、
図8のステップS21において、CPU3がクラスタデータ59を読み込む。前述のように、クラスタデータ59は、潜在クラスz毎に、顧客IDと因子IDを並び変えた行列データ49を示す。
【0093】
続いて、ステップS21から続くステップS22において、CPU3が、複数の潜在クラスzの中から特定クラスz’の選択を受け付ける。この選択は、例えば、コンピュータ1の操作者による操作入力に基づいて受け付けてもよいし、事前に特定クラスz’が記載された設定データをHDD9等から読み込んでもよい。
【0094】
本実施形態では、特定クラスz’の一例として、
図6及び
図9A等に示す第1クラスタCl
1、つまりz=1の「Aユーザ」が選択されたものとする。
【0095】
続いて、ステップS22から続くステップS23において、CPU3は、特定クラスz’に属する顧客IDを基底とし、各顧客IDに割り振られた因子pjの値を各基底の成分とした多次元ベクトルXz’,jを生成する。すなわち、多次元ベクトルXz’,jの次元数dは、特定クラスz’に属する対象者niの数dと一致することになる。
【0096】
また、多次元ベクトルXz’,jの生成に際して考慮される因子pjは、少なくとも3つ以上、好ましくは4つ以上となる。以下、少なくとも3つ以上の因子pjのうち、異なる2つの因子pjをそれぞれ「第1の目的因子pf」及び「第2の目的因子ps」と呼称する。
【0097】
また、前記少なくとも3つ以上の因子pjには、第1の目的因子pf及び第2の目的因子psの他に、特定クラスz’に属する1つ又は複数の因子pjが含まれるようになっている。以下、特定クラスz’に属する1つ又は複数の因子pjを「比較因子pj”」と呼称する。なお、特定クラスz’は、PLSAステップによって取得された潜在クラスzのうち、第1の目的因子pf及び第2の目的因子psのうちの少なくとも一方が属さない潜在クラスzから選ぶことができる。
【0098】
図9Aに示す例では、1つ又は複数の比較因子p
j”が属する特定クラスz’としてz’=1の第1クラスタCl
1が選択され、第1の目的因子p
fが属する潜在クラスとしてz=1の第1クラスタCl
1が選択され、第2の目的因子p
sが属する潜在クラスとしてz=3の第3クラスタCl
3が選択されている。これらの選択については、
図7も参照されたい。
【0099】
例えば、
図9Aに示す例では、特定クラスとしての第1クラスタCl
1に属する対象者n
iであるn
8、n
18、n
19及びn
21が多次元ベクトルX
1,jの基底となる。この場合、多次元ベクトルX
1,jは4次元(すなわちd=4)となる。
【0100】
前述のように、第1クラスタCl1に属する因子p1を第1の目的因子pfとし、第3クラスタCl3に属する因子p3を第2の目的因子psとした場合、それらに対応する多次元ベクトルX1,jは、それぞれ、
X1,1=(1,0,1,1)
X1,2=(0,1,0,1)
と表すことができる。この場合、第1の目的因子pfは、所定物品としてのA社製品を所有しているか否かを示すフラグとなり、第2の目的因子psは、所定物品とは相異する別の物品としてのB社製品を所有しているか否かを示すフラグとなる。
【0101】
一方、第1の目的因子pf及び第2の目的因子ps以外の他の因子pj、例えば、第1クラスタCl1に属する各因子pjに対応する多次元ベクトルX1,jは、
X1,16=(1,1,1,1)
X1,18=(1,1,1,1)
と表すことができる。
【0102】
続いて、ステップS23から続くステップS24において、CPU3は、ステップS23によって生成された多次元ベクトルX
z’,jを、RAM7又はHDD9に格納する。そうして格納された多次元ベクトルX
z’,jは、次元圧縮ステップ等の後続の処理において、必要に応じて読み込まれる。ステップS24が完了すると、制御プロセスは、
図8に例示したフローからリターンし、
図3のステップS3へ進む。
【0103】
(次元圧縮ステップ)
図10は、次元圧縮ステップの手順を例示するフローチャートである。
【0104】
ここで、
図10に例示するフローチャートは、
図3のステップS3において行われる処理を示している。すなわち、
図3において制御プロセスがステップS3に進むと、CPU3は、
図10のステップS31-S33を順番に実行することになる。
【0105】
次元圧縮ステップは、CPU3が多次元ベクトルXz’,jにt-SNE法を適用することで、多次元ベクトルXz’,jを2次元又は3次元の低次元ベクトルxz’,jに次元圧縮するように構成されている。
【0106】
具体的に、
図10のステップS31において、CPU3が多次元ベクトルX
z’,jを読み込む。
【0107】
続いて、ステップS31から続くステップS32において、CPU3が、ステップS31で読み込んだ多次元ベクトルXz’,jに対し、t-SNE法を適用する。例えば、高次元空間では多変量正規分布に基づく尺度でベクトルデータ間の距離を測り、低次元空間では自由度1のt分布に基づく尺度でベクトルデータ間の距離を測る。そして、CPU3が2つの分布間のカルバック・ライブラー情報量を最小化することで、次元圧縮を実行する。t-SNE法を適用することで、d次元の多次元ベクトルXz’,jを、2次元又は3次元の低次元ベクトルxz’,jへと変換することができる。
【0108】
本実施形態では、2次元の低次元ベクトルxz’,jに変換されたものとする。多次元ベクトルXz’,jの本数(考慮すべき因子pjの数)は、低次元ベクトルxz’,jの本数と同じである。
【0109】
続いて、ステップS32から続くステップS33において、CPU3は、ステップS32によって生成された低次元ベクトルx
z’,jを、RAM7又はHDD9に格納する。そうして格納された低次元ベクトルx
z’,jは、ベクトル可視化ステップ等の後続の処理において、必要に応じて読み込まれる。ステップS33が完了すると、制御プロセスは、
図10に例示したフローからリターンし、
図3のステップS4へ進む。
【0110】
なお、
図10に例示するフローによって得られる低次元ベクトルx
z’,jには、前述の第1の目的因子p
fに対応した低次元ベクトルx
z’,jと、第2の目的因子p
sに対応した低次元ベクトルx
z’,jと、他の1つ又は複数の比較因子p
j”が含まれることになる。
【0111】
(ベクトル可視化ステップ)
図11は、ベクトル可視化ステップの手順を例示するフローチャートである。また、
図13は、ベクトル可視化ステップによって可視化される内容を例示する図である。
【0112】
なお、本実施形態において可視化可能な情報は、全て、表示部としてのディスプレイ11上に表示することができる。また、ここいう表示部は、コンピュータ1に直に接続されたディスプレイ11には限定されない。ネットワーク等を介してコンピュータ1と間接的に接続されたディスプレイを表示部として用いてもよい。
【0113】
ここで、
図11に例示するフローチャートは、
図3のステップS4において行われる処理を示している。すなわち、
図3において制御プロセスがステップS4に進むと、CPU3は、
図4のステップS41-S46を順番に実行することになる。
【0114】
ベクトル可視化ステップは、第1の目的因子pfに対応した低次元ベクトルxz’,jと、第2の目的因子psに対応した低次元ベクトルxz’,jと、1つ又は複数の比較因子pj”に対応した各低次元ベクトルxz’,jと、の相対的な位置関係をCPU3が可視化するように構成されている。
【0115】
特に、本実施形態に係るベクトル可視化ステップでは、第1の目的因子pfに対応した低次元ベクトルxz’,jと、1つ又は複数の比較因子pj”の各々に対応した低次元ベクトルxz’,jとの間のユークリッド距離を示す第1の距離と、第2の目的因子psに対応した低次元ベクトルxz’,jと、1つ又は複数の比較因子pj”の各々に対応した低次元ベクトルxz’,jとの間のユークリッド距離を示す第2の距離と、をCPU3が可視化して判定するように構成されている。
【0116】
具体的に、
図11のステップS41において、CPU3が各低次元ベクトルx
z’,jを読み込む。
【0117】
続いて、ステップS41から続くステップS42において、CPU3は、第1の目的因子pfと、第2の目的因子psを決定する操作を受け付ける。第1及び第2の目的因子pff,psのうちの少なくとも一方は、前記ステップS22に示した特定クラスz’の選択時に決定してもよいし、前記ステップS23に示した処理の際に決定してもよい。
【0118】
具体的に、ステップS42において、CPU3は、いずれかの潜在クラスzに属する一の因子pjを第1の目的因子pfに選択し、いずれかの潜在クラスzに属する他の因子pjを第2の目的因子psに選択する。第2の目的因子psは、第1の目的因子pfとは異なる潜在クラスzに属することが好ましい。さらに好ましくは、第2の目的因子psに対応した多次元ベクトルXz’,jと、第1の目的因子pfに対応した前記多次元ベクトルXz’,jとは互いに直交する。
【0119】
なお、第1の目的因子pfとして、前述のように所定物品(A社製品)を所有しているか否かを示すフラグ(因子p1)を選択した場合、第2の目的因子psは、好ましくは、所定物品(A社製品)とは相異する別の物品を所有しているか否かを示すフラグとなる。この場合、所定物品と別の物品は、製造者の異なる同種の物品とすることがさらに好ましい。
【0120】
図6等に示した例の場合、第2の目的因子p
sとして、前記別の物品としてのB社製品を所有しているか否かを示すフラグ、つまり第3クラスタCl
3に属する因子p
2が選択されている。
【0121】
続いて、ステップS42から続くステップS43において、CPU3は、第1の目的因子p
fに対応した低次元ベクトルx
z’,jと、第2の目的因子p
sに対応した低次元ベクトルx
z’,jと、1つ又は複数の比較因子p
j”に対応した低次元ベクトルx
z’,jと、を表示部としてのディスプレイ11上に表示する(マッピングする)。その表示に際しては、
図13に示すように、各低次元ベクトルx
z’,jの始点を省略し、終点のみを表示することができる。
【0122】
図5、
図6及び
図9等を用いて例示したように、特定クラスz’としての第1クラスタCl
1が選択され(つまり、z’=1)、第1の目的因子p
fとして第1クラスタCl
1の因子p
1が選択され、第2の目的因子p
sとして第3クラスタCl
3の因子p
2が選択され、特定クラスz’における1つ又は複数の比較因子p
j”として第1クラスタCl
1の因子p
16及びp
18が選択され、2次元の低次元ベクトルx
1,jへと次元圧縮された場合を考える。
【0123】
この場合の、比較因子pj”は、前述のように、特定クラスz’に属する因子pjから選んでもよいし、特定クラスz’以外の他のクラスzに属する因子pjから選んでもよい。
【0124】
この場合における低次元ベクトルx
1,jの表示結果は、
図13に示す通りである。同図に示す“Pj”とは、因子p
jに対応した低次元ベクトルx
1,jの終点の位置座標を示している。すなわち、
図13の“P1”及び“P2”は、それぞれ、第1の目的因子p
fに対応した低次元ベクトルx
1,1の終点の位置座標と、第2の目的因子p
sに対応した低次元ベクトルx
1,2の終点の位置座標と、を示している。
【0125】
また、
図13の“P16”及び“P18”は、それぞれ、比較因子p
j”としての2つの因子p
16,p
18に対応した低次元ベクトルx
1,16,x
1,18の終点の位置座標を示している。
【0126】
ステップS43に示すように各低次元ベクトルx1,jの終点の位置座標を可視化することで、それに続くステップS44に示すように、低次元ベクトルx1,j間のユークリッド距離(距離)も、直感的な理解に堪えるレベルで可視化される。例えば、“P1”に対する“P16”及び“P18”のユークリッド距離が、前述の“第1の距離”に相当する。“P2”に対する“P16”及び“P18”のユークリッド距離が、前述の“第2の距離”に相当する。
【0127】
ステップS44では、ユークリッド距離の可視化を助けるべく、
図13の破線に示すように、第1の目的因子p
fに対応したP1と、第2の目的因子p
sに対応したP2とをそれぞれ中心としたサークルC
11,C
12を表示してもよい。この場合、各サークルC
11,C
12の内側に位置する比較因子p
j”は、第1の目的因子p
f及び/又は第2の目的因子p
sと近距離であると判定することができる。一方、各サークルC
11,C
12の外側に位置する比較因子p
j”は、第1の目的因子p
f及び/又は第2の目的因子p
sと遠距離であると判定することができる。2つのサークルC
11,C
12は、互いに同径としてもよい。
【0128】
そして、ステップS44から続くステップS45において、CPU3は、第1の目的因子pf及び第2の目的因子psに対して相対的に短距離の比較因子pj”と、相対的に遠距離の比較因子pj”とを抽出する。
【0129】
ここでは、相対的に近距離の比較因子pj”として、前述のサークルC11,C12の内側に位置する比較因子pj”を抽出することができる。同様に、相対的に遠距離の比較因子pj”として、前述のサークルC11,C12の外側に位置する比較因子pj”を抽出することができる。それらの抽出に際し、CPU3は、前述のように定義された、第1の目的因子pfに係る第1の距離と、第2の目的因子psに係る第2の距離と、を各比較因子pj”について算出する。
【0130】
そして、ステップS45から続くステップS46において、CPU3は、ステップS45における抽出結果と、抽出された各比較因子p
j”に係る第1及び第2の距離と、を、RAM7又はHDD9に格納する。そうして格納された低次元ベクトルx
z’,jは、要因分析ステップ等の後続の処理において、必要に応じて読み込まれる。ステップS46が完了すると、制御プロセスは、
図11に例示したフローからリターンする。
【0131】
その後、制御プロセスは、
図3のステップS4からステップS5へ進む。ステップS5では、以下に示す特定クラス変更ステップ(ステップS6)を行うか否かを判定し、この判定がYESの場合はステップS7へ進む一方、NOの場合はステップS6に進んで特定クラス変更ステップを実行する。
【0132】
(特定クラス変更ステップ)
図9Bは、特定クラスz’変更後の分析対象抽出ステップの基本概念を説明するための図である。また、
図14は、第2のベクトル可視化ステップによって可視化される内容を例示する図である。
【0133】
ステップS6に示す特定クラス変更ステップでは、第1及び第2の目的因子pf,psを固定した状態で、特定クラスz’の変更を実行する。具体的に、特定クラスz’を、一の潜在クラスから他の潜在クラスに変更する。
【0134】
図9B及び
図14等を用いた例示の場合、第2クラスタCl
2が新たに特定クラスz’に設定されたものとする。以下、変更後の特定クラスを「第2の特定クラス」と呼称し、当初の特定クラスと区別する場合がある。
【0135】
そうして特定クラスz’の変更が完了すると、制御プロセスは、
図3のステップS2へと戻る。その後、制御プロセスは、特定クラスz’の変更を反映しかつ第1及び第2の目的因子p
f,p
sを固定した状態で、分析対象抽出ステップ(ステップS2)と、次元圧縮ステップ(ステップS3)と、ベクトル可視化ステップ(ステップS4)とを再度実行する。
【0136】
つまり本実施形態では、変更前後の2つの特定クラスz’の両方で、分析対象抽出ステップ(ステップS2)と、次元圧縮ステップ(ステップS3)と、ベクトル可視化ステップ(ステップS4)と、が実行されるようになっている。
【0137】
ここで、再度実行される各ステップを、それぞれ第2の分析対象抽出ステップ、第2の次元圧縮ステップ、及び第2のベクトル可視化ステップと呼称すると、第2の分析対象抽出ステップでは、クラスタリング後の行列データ49において、第2の特定クラスに属する対象者それぞれを基底とし、該対象者それぞれに割り当てられた因子の値を各基底の成分とした第2の多次元ベクトルを、複数の因子のうちの少なくとも一部の因子について、CPU3が生成する。
【0138】
図9B等を用いた例示の場合、第2の多次元ベクトルは、「X
2,j」と表すことができる。この場合の第2の多次元ベクトルX
2,jは、第1クラスタCl
1に属する対象者n
8,n
18,n
19,n
21を基底とする代わりに、第2クラスタCl
2に属する対象者n
20,…,n
1を基底とすることになる。
【0139】
続いて、第2の次元圧縮ステップでは、CPU3が第2の多次元ベクトルにt-SNE法を適用することで、第2の多次元ベクトルを2次元または3次元の低次元ベクトルに次元圧縮する。
【0140】
図9B等を用いた例示の場合、低次元ベクトルは、「x
2,j」と表すことができる。この場合の低次元ベクトルx
2,jは、第2クラスタCl
2に属する対象者n
20,…,n
1を基底とした多次元ベクトルにt-SNEを適用することで生成されることになる。
【0141】
続いて、第2のベクトル可視化ステップでは、第2の多次元ベクトルに対応して得られた各低次元ベクトルx2,jに基づいて、第1の目的因子に対応した低次元ベクトルと、第2の目的因子に対応した低次元ベクトルと、1つ又は複数の比較因子に対応した低次元ベクトルとの間のユークリッド距離をCPU3が可視化することになる。
【0142】
ここでいう「第1の目的因子に対応した低次元ベクトル」とは、第2の多次元ベクトルに対応して得られたものを指す。すなわち、
図9B及び
図14等を用いた例示の場合、第2クラスタCl
2に属する対象者n
20,…,n
1を基底とし、かつ、第1の目的因子p
fとしての因子p
1の値を各基底の成分とした多次元ベクトルにt-SNEを適用することで生成されたものが、「第1の目的因子に対応した低次元ベクトル」に相当する。「第2の目的因子に対応した低次元ベクトル」についても同様である。
【0143】
第2のベクトル可視化ステップにおける低次元ベクトルx
3,jの表示結果は、
図14に示す通りである。同図に示す“Pj”とは、因子p
jに対応した低次元ベクトルx
2,jの終点の位置座標を示している。すなわち、
図14の“P1”及び“P2”は、それぞれ、第1の目的因子p
fに対応した低次元ベクトルx
2,1の終点の位置座標と、第2の目的因子p
sに対応した低次元ベクトルx
2,2の終点の位置座標と、を示している。
【0144】
また、
図14の“P7”及び“P11”は、それぞれ、比較因子p
j”としての2つの因子p
7,p
11に対応した低次元ベクトルx
2,7,x
2,11の終点の位置座標を示している。
【0145】
各低次元ベクトルx2,jの終点の位置座標を可視化することで、特定クラスz’変更後の第1及び第2の距離が、第1のベクトル可視化ステップと同様に可視化される。
【0146】
第2のベクトル可視化ステップでは、第1のベクトル可視化ステップと同様にユークリッド距離の可視化を助けるべく、
図14の破線に示すように、第1の目的因子p
fに対応したP1と、第2の目的因子p
sに対応したP2とをそれぞれ中心としたサークルC
21,C
22を表示してもよい。この場合、各サークルC
21,C
22の内側に位置する比較因子p
j”は、第1の目的因子p
f又は第2の目的因子p
sのうちの一方と近距離であるとみなすことができる。同様に、各サークルC
21,C
22の外側に位置する比較因子p
j”は、第1の目的因子p
f及び第2の目的因子p
sのうちの少なくとも一方と遠距離であるとみなすことができる。
【0147】
多次元ベクトルX
2,jの基底を変更したことにより、第1の目的因子p
f又は第2の目的因子p
sに対して近距離となる比較因子p
j”の内訳が、
図13に示す例から変化する。
【0148】
最終的に、第1のベクトル可視化ステップと同様に、CPU3は、第1の目的因子pf及び第2の目的因子psのそれぞれについて、相対的に短距離の比較因子pj”と相対的に遠距離の比較因子pj”とを抽出する。
【0149】
ここでは、相対的に近距離の比較因子pj”として、前述のサークルC21,C22の内側に位置する比較因子pj”を抽出することができる。同様に、相対的に遠距離の比較因子pj”として、前述のサークルC21,C22の外側に位置する比較因子pj”を抽出することができる。それらの抽出に際し、CPU3は、前述のように定義された、第1の目的因子pfに係る第1の距離と、第2の目的因子psに係る第2の距離と、を各比較因子pj”について算出する。
【0150】
(要因分析ステップ)
図12は、要因分析ステップの手順を例示するフローチャートである。
【0151】
図3のステップS7に示す要因分析ステップは、ベクトル可視化ステップによって可視化された相対的な位置関係に基づいて、第1及び第2の目的因子p
f,p
sの値が0と1に別れた要因を分析するように構成されている。
【0152】
具体的に、本実施形態では、分析対象抽出ステップ(ステップS2)と、次元圧縮ステップ(ステップS3)と、ベクトル可視化ステップ(ステップS4)と、の実行結果のうちのベクトル可視化ステップの実行結果を、特定クラス変更ステップによる特定クラスz’の変更前後で比較するとともに、双方を分析することで、要因分析ステップを実行するように構成されている。
【0153】
さらに具体的には、本実施形態に係るCPU3は、まず、特定クラスz’の変更前に探索(抽出)された比較因子pj”を、第1及び第2の目的因子pf,psに対して近い順に並べる(ステップS71)。
【0154】
-ステップS71の詳細-
まず、CPU3は、1回目のベクトル可視化ステップで得られた可視化結果(具体的には、第1及び第2の距離の長短)に基づいて、1つ又は複数の比較因子pj”の中から、第1及び第2の目的因子pf,psの値に寄与した因子を探索する。
【0155】
その際、CPU3は、1つ又は複数の比較因子pj”のうち、第1の目的因子pfに対して近距離かつ第2の目的因子psに対して遠距離となる比較因子pj”を探索する。
【0156】
この場合、第1の目的因子pfの値に寄与した因子pjの探索は、第1のサークルC11の内側に位置し、かつ第2のサークルC12の外側に位置する比較因子pj”をリストアップするとともに、そのリストを第1の目的因子pfに対する距離が近い順に並べることで行われるようになっている。
【0157】
図13に示す例では、第1の目的因子p
fとして、第1クラスタCl
1に属しかつA社製品を所有していることを示す因子p
1が用いられている。この場合、第1の目的因子p
fとの距離が近いということは、「因子p
1との相関が高い因子(A社製品を所有する契機となり得る因子)である」という仮の解釈を与えることが可能になる。
【0158】
それとは反対に、第1の目的因子pfとの距離が遠いということは、「A社製品を所有する契機とはなり難い因子である」という仮の解釈を与えることが可能になる。
【0159】
すなわち、
図13に例示した低次元ベクトルx
1,jは、実際にA社製品を所有している主要A社ユーザと、第1クラスタCl
1に属している(つまり、主要A社ユーザと同様の価値観を有する)ものの、A社製品を所有していない潜在A社ユーザと、を双方とも考慮した基底に基づいて生成されている。そうして生成された低次元ベクトルx
1,jと、実際にA社製品を所有していることを示す因子p
1との距離を分析することで、第1クラスタCl
1に属する因子p
jの中から、主要A社ユーザと潜在A社ユーザとを分かつ因子p
j、すなわち、A社製品を所有する契機となり得る因子p
jを探索することが可能になる。
【0160】
具体的に、CPU3は、1つ又は複数の比較因子pj”のうち、第1の目的因子pfに対して遠距離かつ第2の目的因子psに対して近距離となる比較因子pj”を探索する。
【0161】
この場合、第2の目的因子psの値に寄与した因子pjの探索は、第2のサークルC12の内側に位置し、かつ第1のサークルC11の外側に位置する比較因子pj”をリストアップするとともに、そのリストを第2の目的因子psに対する距離が近い順に並べることで行うことができる。
【0162】
図13に示す例では、第2の目的因子p
sとして、第3クラスタCl
3に属しかつB社製品を所有していることを示す因子p
2が用いられている。この場合、第2の目的因子p
sとの距離が近いということは、「因子p
1との相関が低く、かつ因子p
2との相関が高い因子(B社製品を所有する契機となり得る因子)である」という仮の解釈を与えることが可能になる。
【0163】
また、第2の目的因子psとの距離が遠いということは、「B社製品を所有する契機とはなり難い因子である」という仮の解釈を与えることが可能になる。
【0164】
すなわち、
図13に例示した低次元ベクトルx
1,jは、前述のように、主要A社ユーザ及び潜在A社ユーザを双方とも考慮した基底に基づいて生成されている。そうして生成された低次元ベクトルx
1,jと、A社製品ではなくB社製品を所有していることを示す因子p
2との距離を分析することで、第1クラスタCl
1に属する因子p
jの中から、主要A社ユーザと、潜在A社ユーザとを分かつ因子p
j、すなわち、A社製品を指向する価値観を有しつつも、他社製品を所有するに至った因子p
jを探索することが可能になる。
【0165】
第1の目的因子pf及び第2の目的因子psを双方とも設定することで、主要A社ユーザと潜在A社ユーザとを分かつ因子pjを多面的に探索することが可能になる。
【0166】
図13の例では、比較因子p
16,p
18は、第1クラスタCl
1に属しつつも、第1のサークルC
11と、第2のサークルC
12との両方の内側に位置している。これに対し、「第1クラスタCl
1に属する比較因子p
16,p
18は、A社製品を所有するか、或いは、B社製品を所有するかを分かつ契機とまでは云えない」という仮の解釈を与えることができる。
【0167】
その後、CPU3は、特定クラスz’の変更後に探索(抽出)された比較因子pj”を、第1及び第2の目的因子pf,psに対して近い順に並べる(ステップS72)。
【0168】
-ステップS72の詳細-
具体的に、ステップS72では、まず、特定クラスz’変更後に可視化された内容に基づいて、サークルC21の内側又は近傍に位置する比較因子pj”をリストアップするとともに、そのリストを第1の目的因子pfに対する距離(第1の距離)が近い順に並べる。
【0169】
すなわち、
図14に例示した低次元ベクトルx
2,jは、他社ユーザを考慮した基底に基づいて生成されている。他社ユーザには、その他社ユーザと同様の価値観を有しつつも、他社製品ではなくA社製品を所有するに至った顕在A社ユーザと、B社製品を所有するに至った顕在B社ユーザとが含まれ得る。
【0170】
したがって、そうして生成された低次元ベクトルx2,jと、実際にA社製品を所有していることを示す因子p1との距離を分析することで、第2クラスタCl2に属する因子pjの中から、顕在A社ユーザであるか否かを分かつ因子pj、すなわちA社製品を所有する契機となり得る因子pjを探索することが可能になる。
【0171】
そこで、本実施形態に係るステップS72では、CPU3は、2回目のベクトル可視化ステップによる可視化結果(特定クラスz’変更後に可視化された第2の距離の長短)に基づいて、特定クラスz’の変更前後の可視化結果を比較しつつ、複数の比較因子pj”の中から、第2の目的因子psの値に寄与した因子を探索する。
【0172】
例えば、特定クラスz’変更後に可視化された内容に基づいて、サークルC32の内側又は近傍に位置する比較因子pj”をリストアップするとともに、そのリストを第2の目的因子psに対する距離が近い順に並べ、特定クラスz’変更前の探索結果と比較る。
【0173】
すなわち、
図14に例示した低次元ベクトルx
2,jは、前述のように、他顕在A社ユーザ又は顕在B社ユーザを含み得る基底に基づいて生成されている。そうして生成された低次元ベクトルx
2,jと因子p
2との距離を分析することで、第2クラスタCl
2に属する因子p
jの中から、顕在A社ユーザ又は顕在B社ユーザに至った契機となった因子p
j、すなわち、潜在B社ユーザと顕在A社ユーザとを分かつ契機となり得る因子p
jを抽出することが可能になる。
【0174】
また、ステップS71と同様に、CPU3は、1つ又は複数の比較因子pj”のうち、第1の目的因子pfに対して近距離かつ第2の目的因子psに対して遠距離psとなる比較因子pj”を探索する。さらに、CPU3は、1つ又は複数の比較因子pj”のうち、第1の目的因子pfに対して遠距離かつ第2の目的因子psに対して近距離となる比較因子pj”を探索する。
【0175】
図14の例では、第2クラスタCl
2に属する比較因子p
7,p
11のうちの比較因子p
11は、第1のサークルC
11と、第2のサークルC
12との両方の外側に位置している。これに対し、「第2クラスタCl
2に属する比較因子p
11は、A社製品を所有する契機にならなければ、B社製品を所有する契機にもならない」という仮の解釈を与えることができる。
【0176】
それに対し、第2クラスタCl2に属するもう1つの比較因子p7は、第1のサークルC11の内側に位置しつつ、第2のサークルC12の外側に位置している。これに対し、「第2クラスタCl2に属する比較因子p7は、A社製品を所有するか、或いは、B社製品を所有するかを分かつ契機となり得る」という仮の解釈を与えることができる。
【0177】
すなわち、図例の場合、比較因子p7こそが、第1及び第2の目的因子pf,psの値が0と1に別れた要因であるという解釈を与えることができる。こうした分析を複数(例えば3以上)の特定クラスz’で行うことで、第1及び第2の目的因子pf,psの値が0と1に別れた要因に、より確実に到達することが可能となる。
【0178】
その後、ステップS72から続くステップS73において、CPU3は、ステップS71の探索結果と、ステップS72の探索結果とを羅列する。その際、前述の比較因子p
7のように、A社製品を所有するか、或いは、B社製品を所有するかを分かつ契機となり得るような因子を表示する。これにより、制御プロセスは、
図12に示すフローを完了し、
図3に示すフローからリターンする。
【0179】
<効果等>
以上説明したように、前記実施形態によると、特定クラスz’に属する対象者n
iそれぞれを基底とし、該対象者n
iそれぞれに割り当てられた因子p
jの値を各基底の成分とした多次元ベクトルX
z’,jに対してt-SNE法を適用することで、その多次元ベクトルX
z’,jを低次元ベクトルx
z’,jに次元圧縮する(
図3のステップS1-S3を参照)。
【0180】
そして、
図9A及び
図9B等を用いて説明したように、低次元ベクトルx
z’,jの可視化に際し、いずれかの潜在クラスzに属する第1及び第2の目的因子p
f,p
sと、特定クラスz’に属する他の比較因子p
j”との比較を行う。その際、後者の比較因子p
j”に係る特定クラスz’について、一の潜在クラスから他の潜在クラスに変更し、ベクトル可視化ステップによって可視化された内容を変更前後で比較する。
【0181】
すなわち、
図13及び
図14を用いて説明したように、比較因子p
j”が属する特定クラスz’を変更しながら、各特定クラスz’においてベクトル可視化ステップによる可視化を行うことで、第1又は第2の目的因子p
f,p
sに対応した低次元ベクトルx
z’,jと、比較因子p
j”に対応した低次元ベクトルx
z’,jとの違いを明確化することができる。そうして違いが明確化された状態で、各目的因子p
f,p
sに近接又は離間する比較因子p
j”を探索することで、2つの目的因子p
f,p
sの値が0又は1に別れた契機となり得る要因を、従来よりも明確に捉えることが可能になる。
【0182】
またそもそも、比較因子pj”が属する特定クラスz’を変更することは、多次元ベクトルXz’,jの基底となる対象者niを変更することに等しい。そうして特定クラスz’を変更しつつ、各特定クラスz’において目的因子pf,psと強く相関するような比較因子pj”を探索することで、第1及び第2の目的因子pf,psの値が0と1に別れた要因を、従来よりも多方面から捉えることができるようになる。
【0183】
また、
図13及び
図14を用いて説明したように、前記要因分析ステップは、各ユークリッド距離の長短に基づいて因子を探索するように構成されている。このように構成することで、より直感的に理解し易い形式で可視化及び探索することが可能になる。これにより、第1及び第2の目的因子p
f,p
sの値が0と1に別れた要因を捉える上で有利になる。
【0184】
また、
図13及び
図14を用いて説明したように、第1の目的因子p
fに近接又は離間する比較因子と、第2の目的因子p
sに近接又は離間する比較因子p
j”とを探索することで、2つの目的因子p
f,p
sの値が別れた要因を、より的確に分析することができる。
【0185】
また、一般に、クラスタリングによって得られた各ブロック行列が、それぞれ潜在クラスzに対応することから明らかなように、同じ潜在クラスzに属する因子に対応した低次元ベクトルxz,jは、互いに類似した傾向を示す。
【0186】
それに対し、
図14等に例示したように、第1及び/又は第2の目的因子p
f,p
sが属する潜在クラスzと、比較因子p
j”が属する特定クラスz’とを異ならせることで、各因子に対応した低次元ベクトルx
z’,j同士の違いを明確化することができる。そうして違いが明確化された状態で、第1及び/又は第2の目的因子p
f,p
sに対して近接又は離間する比較因子p
j”を探索することで、その目的因子p
f,p
sの値が0と1となった契機となり得る要因を、従来よりも明確に捉えることが可能になる。
【0187】
またそもそも、目的因子pf,psが属する潜在クラスzと、比較因子pj”が属する特定クラスz’とを異ならせた状態で比較因子pj”の探索を行うことは、PLSA法を行った段階では異なる潜在クラスに分類されたものの、それでもなお、目的因子pf,psと強く相関するような比較因子pj”を探索することに相当する。これは、従来のPLSA法では知り得ない知見であり、第1及び第2の目的因子pf,psの値が0または1となった要因を、従来よりも多方面から捉えることができるようになる。
【0188】
また、
図9A等に例示したように、第1の目的因子p
fに対応した多次元ベクトルを構成する基底には、A社製品を実際に所有している対象者(例えば、n
8、n
19,n
21)が含まれることになる。そうした多次元ベクトルに基づき生成された低次元ベクトルに対して前述の可視化を行うことで、A社製品を所有する契機となった要因、或いは、所有しない契機となった要因を、従来よりも多方面から捉えることが可能になる。
【0189】
ここで、例えば、第2の目的因子psが、第1の目的因子pfの競合商品を所有しているか否かを示すフラグだった場合、第1及び第2の目的因子pf,psが0と1に別れた要因を探索することで、前記競合商品の改良点、訴求点等を明らかにすることが可能になる。それらの知見を分析することで、第1の目的因子pfに対応した商品の要改良点等を明確化することができる。
【0190】
また、
図12等を用いて説明したように、第1の目的因子p
fの属する潜在クラス(図例ではz=1)と、第2の目的因子p
sの属する潜在クラス(図例ではz=3)を固定した状態で、特定クラスをz’=1からz’=2へと変更した分析を行う。変更前の分析と変更後の分析は、低次元ベクトルの生成に用いる対象者n
iの内訳が相違することになる。
【0191】
したがって、対象者niの内訳を異ならせた2つの分析結果を比較することで、目的因子pfの値が0または1となった要因を、より多方面から捉えることができるようになる。
【0192】
<追加処理>
なお、前記実施形態では、第1及び第2の目的因子pf,psをそれぞれ、第1クラスタCl1に属するp1と第3クラスタCl3に属するp2に固定した状態で、一の特定クラスとしてz’=1から、他の特定クラスとしてのz’=2へと変更したケースについて説明したが、本開示は、そうしたケースには限定されない。他の特定クラスとしてのz’=2から、さらに別の特定クラスへと変更し、その変更前後で得られた可視化内容を比較してもよい。
【0193】
例えば、z’=2から、さらに別の特定クラスとしてのz’=3へと変更したケースについて考える。この場合、コンピュータ1は、第1及び第2の目的因子pf,psをそれぞれ固定した状態で、さらに別の特定クラスに関する第3の分析対象抽出ステップと、第3の次元圧縮ステップと、第3のベクトル可視化ステップと、を実行することになる。
【0194】
図15は、さらに別の特定クラス(z’=3)における可視化内容(第3のベクトル可視化ステップによる可視化内容)を例示する図である。
図13及び
図14に加えて
図15を考慮することで、より多方面から捉えた分析を行うことができるようになる。
【0195】
なお、前記実施形態では、一の特定クラスとして第1の目的因子pfが属するz’=1の潜在クラスを用いるとともに、他の特定クラスとして第1及び第2の目的因子pf,psが双方とも属さないz’=3の潜在クラスを用いるように構成されていたが、本開示は、そうした構成には限定されない。
【0196】
例えば、一の特定クラスとして第1の目的因子pfが属する潜在クラスを用いる一方に、他の特定クラスとして第2の目的因子psが属する潜在クラスを用いてもよい。この場合、例えば、一の特定クラス及び他の特定クラスをそれぞれ健康度の高いクラスタと、健康度の低いクラスタに設定するとともに、第1及び第2の目的因子pf,psを、それぞれ、健康度の高いクラスタに属する「高視力」なる因子pjと、健康度の低いクラスタに属する「低視力」なる因子pjとに設定してもよい。
【0197】
そうした設定に対して本開示を適用することで、対象者niが「高視力」であるか、或いは、「低視力」であるかを分かつ要因を、従来のPLSA法及びt-SNE法では辿り付けない観点から導き出すことが可能になる。
【0198】
また、例えば
図14に示したように、一の特定クラス及び他の特定クラスを、それぞれ、第1及び第2の目的因子p
f,p
sが属さない潜在クラスから選択してもよい。例えば、一の特定クラス及び他の特定クラスをそれぞれ前述の「A社指向」及び「B社指向」のクラスタに設定しつつ、第1及び第2の目的因子p
f,p
sをそれぞれ「C社指向」及び「その他ユーザ」に属する因子p
jに設定してもよい。
【0199】
そうした設定に対して本開示を適用することで、対象者niがC社製品を所有する契機となった要因を、「A社指向」及び「B社指向」を構成する因子pjに基づいて、従来のPLSA法及びt-SNE法では辿り付けない観点から導き出すことが可能になる。
【0200】
《他の実施形態》
前記実施形態では、一のコンピュータ1によって実施されるものを例示したが、本開示は、その例には限定されない。本開示に係る情報処理方法及び情報処理プログラム29は、複数のコンピュータ1を用いて実行してもよい。また、本開示におけるコンピュータ1には、スーパーコンピュータ、PCクラスタ等の並列計算機も含まれる。
【符号の説明】
【0201】
1 コンピュータ(情報処理装置)
3 CPU(演算部)
7 RAM(記憶部)
9 HDD(記憶部)
11 ディスプレイ(表示部)
18 記憶媒体
29 情報処理プログラム
49 行列データ
S1 PLSAステップ
S2 分析対象抽出ステップ
S3 次元圧縮ステップ
S4 ベクトル可視化ステップ
S7 要因分析ステップ