(19)【発行国】日本国特許庁(JP)
(12)【公報種別】公開特許公報(A)
(11)【公開番号】P2023162922
(43)【公開日】2023-11-09
(54)【発明の名称】情報処理方法、情報処理装置、情報処理プログラム、および、該情報処理プログラムを記憶したコンピュータ読取可能な記憶媒体
(51)【国際特許分類】
G06N 20/00 20190101AFI20231101BHJP
【FI】
G06N20/00 160
【審査請求】未請求
【請求項の数】9
【出願形態】OL
(21)【出願番号】P 2022073637
(22)【出願日】2022-04-27
(71)【出願人】
【識別番号】000003137
【氏名又は名称】マツダ株式会社
(74)【代理人】
【識別番号】110001427
【氏名又は名称】弁理士法人前田特許事務所
(72)【発明者】
【氏名】目良 貢
(57)【要約】
【課題】行列データの解析に際し、特定の目的因子の値が0または1となった要因を、従来よりも明確に捉える。
【解決手段】情報処理方法は、行列データ49にPLSA法を適用するステップS1と、PLSA法適用後の行列データ49において特定の潜在クラスz’に属する対象者n
iそれぞれを基底とし、該対象者n
iそれぞれに割り当てられた因子p
jの値を各基底の成分とした多次元ベクトルを生成するステップS2と、多次元ベクトルにt-SNE法を適用することで低次元ベクトルを生成するステップS3と、特定の潜在クラスz’に属する目的因子p
fに対応した低次元ベクトルと、他の潜在クラスz”に属する各比較因子p
j”に対応した低次元ベクトルとの相対的な位置関係を可視化するステップS4と、可視化された相対的な位置関係に基づいて、目的因子の値が0または1となった要因を分析する要因分析ステップS7と、を備える。
【選択図】
図13
【特許請求の範囲】
【請求項1】
プログラムを実行する演算部を備えるコンピュータを用いることによって、複数の分析対象者と、該複数の分析対象者それぞれに割り当てられた0または1の値からなる複数の因子とを行列化してなる行列データを解析するとともに、該解析結果を可視化する情報処理方法であって、
前記演算部が前記行列データにPLSA法を適用することで、それぞれ異なる潜在クラスによってラベリングされたブロック行列からなるブロック対角行列に近付けるように、前記行列データをクラスタリングするPLSAステップと、
前記クラスタリング後の前記行列データにおいて、特定の潜在クラスに属する分析対象者それぞれを基底とし、該分析対象者それぞれに割り当てられた因子の値を各基底の成分とした多次元ベクトルを、前記特定の潜在クラス以外の他の潜在クラスに属する因子を含めて前記演算部が生成する分析対象抽出ステップと、
前記演算部が前記多次元ベクトルにt-SNE法を適用することで、前記多次元ベクトルを、2次元または3次元の低次元ベクトルに次元圧縮する次元圧縮ステップと、
前記特定の潜在クラスに属する一の因子を目的因子とし、前記他の潜在クラスに属する他の因子を複数の比較因子とすると、前記多次元ベクトルに対応して得られた各低次元ベクトルに基づいて、前記目的因子に対応した前記低次元ベクトルと、前記複数の比較因子の各々に対応した前記低次元ベクトルとの相対的な位置関係を前記演算部が可視化するベクトル可視化ステップと、
前記ベクトル可視化ステップによって可視化された前記相対的な位置関係に基づいて、前記目的因子の値が0または1となった要因を分析する要因分析ステップと、を備える
ことを特徴とする情報処理方法。
【請求項2】
請求項1に記載された情報処理方法において、
前記ベクトル可視化ステップでは、前記相対的な位置関係として、
前記目的因子に対応した前記低次元ベクトルと、前記複数の比較因子の各々に対応した前記低次元ベクトルとの間のユークリッド距離を前記演算部が可視化し、
前記要因分析ステップでは、
前記演算部が可視化した各ユークリッド距離の長短に基づいて、前記複数の比較因子の中から、前記目的因子の値に寄与した因子を探索する
ことを特徴とする情報処理方法。
【請求項3】
請求項2に記載された情報処理方法において、
前記目的因子は、所定の物品を所有しているか否かを示すフラグである
ことを特徴とする情報処理方法。
【請求項4】
請求項2に記載された情報処理方法において、
前記ベクトル可視化ステップでは、
前記複数の比較因子のうちの一の比較因子を第2の目的因子とし、
前記第2の目的因子に対応した前記低次元ベクトルと、該第2の目的因子を除いた残りの比較因子の各々に対応した前記低次元ベクトルとの間のユークリッド距離を前記演算部が可視化し、
前記要因分析ステップでは、
前記演算部が可視化した各ユークリッド距離の長短に基づいて、前記残りの比較因子の中から、前記第2の目的因子の値に寄与した因子を探索し、
前記第2の目的因子の値に寄与した因子と、前記目的因子の値に寄与した因子とを比較することで、前記目的因子の値が0または1となった要因を分析する
ことを特徴とする情報処理方法。
【請求項5】
請求項4に記載された情報処理方法において、
前記第2の目的因子が属する潜在クラスを第2の特定クラスと呼称すると、前記クラスタリング後の前記行列データにおいて、前記第2の特定クラスに属する分析対象者それぞれを基底とし、該分析対象者それぞれに割り当てられた因子の値を各基底の成分とした第2の多次元ベクトルを、前記第2の特定クラス以外の他の潜在クラスに属する因子を含めて前記演算部が生成する第2の分析対象抽出ステップと、
前記演算部が前記第2の多次元ベクトルにt-SNE法を適用することで、前記第2の多次元ベクトルを2次元または3次元の低次元ベクトルに次元圧縮する第2の次元圧縮ステップと、
前記第2の多次元ベクトルに対応して得られた各低次元ベクトルに基づいて、前記目的因子に対応した前記低次元ベクトルと、前記第2の目的因子に対応した前記低次元ベクトルと、前記残りの比較因子の各々に対応した前記低次元ベクトルとの間のユークリッド距離を前記演算部が可視化する第2のベクトル可視化ステップと、を備え、
前記要因分析ステップでは、
前記ベクトル可視化ステップにおいて前記演算部が可視化した各ユークリッド距離の長短に基づいて、前記残りの比較因子の中から、前記目的因子及び前記第2の目的因子それぞれの値に寄与した因子を探索する第1の探索ステップと、
前記第2のベクトル可視化ステップにおいて前記演算部が可視化した各ユークリッド距離の長短に基づいて、前記残りの比較因子の中から、前記目的因子及び前記第2の目的因子それぞれの値に寄与した因子を探索する第2の探索ステップと、を実行し、
前記第1の探索ステップによって探索された因子と、前記第2の探索ステップによって探索された因子とを比較することで、前記目的因子の値が0または1となった要因を分析する
ことを特徴とする情報処理方法。
【請求項6】
請求項4または5に記載された情報処理方法において、
前記目的因子は、所定の物品を所有しているか否かを示すフラグであり、
前記第2の目的因子は、前記所定の物品とは相違する別の物品を所要しているか否かを示すフラグであり、
前記所定の物品および前記別の部品は、製造者の異なる同種の物品である
ことを特徴とする情報処理方法。
【請求項7】
プログラムを実行する演算部を備えるコンピュータを備え、複数の分析対象者と、該複数の分析対象者それぞれに割り当てられた0または1の値からなる複数の因子とを行列化してなる行列データを解析するとともに、該解析結果を可視化する情報処理装置であって、
前記演算部が前記行列データにPLSA法を適用することで、それぞれ異なる潜在クラスによってラベリングされたブロック行列からなるブロック対角行列に近付けるように、前記行列データをクラスタリングするPLSA手段と、
前記クラスタリング後の前記行列データにおいて、特定の潜在クラスに属する分析対象者それぞれを基底とし、該分析対象者それぞれに割り当てられた因子の値を各基底の成分とした多次元ベクトルを、前記特定の潜在クラス以外の他の潜在クラスに属する因子を含めて前記演算部が生成する分析対象抽出手段と、
前記演算部が前記多次元ベクトルにt-SNE法を適用することで、前記多次元ベクトルを、2次元または3次元の低次元ベクトルに次元圧縮する次元圧縮手段と、
前記特定の潜在クラスに属する一の因子を目的因子とし、前記他の潜在クラスに属する他の因子を複数の比較因子とすると、前記多次元ベクトルに対応して得られた各低次元ベクトルに基づいて、前記目的因子に対応した前記低次元ベクトルと、前記複数の比較因子の各々に対応した前記低次元ベクトルとの相対的な位置関係を前記演算部が可視化するベクトル可視化手段と、
前記ベクトル可視化ステップによって可視化された前記相対的な位置関係に基づいて、前記目的因子の値が0または1となった要因を分析する要因分析手段と、を備える
ことを特徴とする情報処理装置。
【請求項8】
プログラムを実行する演算部を備えるコンピュータに実行させることによって、複数の分析対象者と、該複数の分析対象者それぞれに割り当てられた0または1の値からなる複数の因子とを行列化してなる行列データを解析するとともに、該解析結果を可視化する情報処理プログラムであって、
前記コンピュータに、
前記演算部が前記行列データにPLSA法を適用することで、それぞれ異なる潜在クラスによってラベリングされたブロック行列からなるブロック対角行列に近付けるように、前記行列データをクラスタリングするPLSAステップと、
前記クラスタリング後の前記行列データにおいて、特定の潜在クラスに属する分析対象者それぞれを基底とし、該分析対象者それぞれに割り当てられた因子の値を各基底の成分とした多次元ベクトルを、前記特定の潜在クラス以外の他の潜在クラスに属する因子を含めて前記演算部が生成する分析対象抽出ステップと、
前記演算部が前記多次元ベクトルにt-SNE法を適用することで、前記多次元ベクトルを、2次元または3次元の低次元ベクトルに次元圧縮する次元圧縮ステップと、
前記特定の潜在クラスに属する一の因子を目的因子とし、前記他の潜在クラスに属する他の因子を複数の比較因子とすると、前記多次元ベクトルに対応して得られた各低次元ベクトルに基づいて、前記目的因子に対応した前記低次元ベクトルと、前記複数の比較因子の各々に対応した前記低次元ベクトルとの相対的な位置関係を前記演算部が可視化するベクトル可視化ステップと、
前記ベクトル可視化ステップによって可視化された前記相対的な位置関係に基づいて、前記目的因子の値が0または1となった要因を分析する要因分析ステップと、を実行させる
ことを特徴とする情報処理プログラム。
【請求項9】
請求項8に記載された情報処理プログラムを記憶している
ことを特徴とするコンピュータ読取可能な記憶媒体。
【発明の詳細な説明】
【技術分野】
【0001】
ここに開示する技術は、情報処理方法、情報処理装置、情報処理プログラム、および、該情報処理プログラムを記憶したコンピュータ読取可能な記憶媒体に関する。
【背景技術】
【0002】
複雑なビッグデータに対する分析手法として、いわゆる確率的潜在意味解析法(PLSA)が広く知られている。PLSAとは、解析対象とした行列を潜在変数毎にクラスタリングすることで、行成分および列成分のうちの少なくとも一方を低次元化する手法である。
【0003】
一例として、アンケート回答者を行成分とし、アンケート項目を列成分とし、アンケートの回答内容を値とした行列に対してPLSAを適用した場合、潜在変数によって分類された各潜在クラスには、1つまたは複数のアンケート回答者と、1つまたは複数のアンケート項目とが属することになる。
【0004】
この場合、前記行列に、「メーカAを好むか否か」、「メーカBを好むか否か」および「メーカCを好むか否か」等のアンケート項目が含まれていると仮定すると、「第1の潜在クラスに属する回答者はメーカAを好み、第2の潜在クラスに属する回答者はメーカBを好み、第3の潜在クラスに属する回答者はメーカCを好み、…」等、同じ潜在クラスに属するアンケート回答者に対し、アンケート項目に応じた解釈を与えることが可能になる。
【0005】
PLSAの具体的な応用例として、例えば下記特許文献1には、目的のデータおよび/または情報を獲得、分析ならびにマイニングする方法において、マイニングされたデータをクラスタリングするためにPLSAを用いることが開示されている。
【0006】
また、複雑な高次元データを低次元化するためのアルゴリズムとして、いわゆるt分布型確率的近傍埋め込み法(t-SNE)も知られている。t-SNEを用いることで、データ間の局所的な関係性を維持しつつ、高次元データを2次元または3次元データに変換することが可能になる。
【0007】
t-SNEの具体的な応用例として、例えば下記特許文献2には、参照データの各要素がマッピングされた2次元空間または3次元空間を生成するために、処理部がt-SNEを用いることが開示されている。
【先行技術文献】
【特許文献】
【0008】
【特許文献1】特表2009-525514号公報
【特許文献2】特開2019-91454号公報
【発明の概要】
【発明が解決しようとする課題】
【0009】
本願発明者らは、複数の分析対象者と、該複数の分析対象者それぞれに割り当てられた0または1の値からなる複数の因子とを行列化してなる行列に対し、PLSAを用いた分析を試みた。
【0010】
この場合、PLSAによって得られる潜在クラスは、各潜在クラスに属する1人または複数人の分析対象者と、該分析対象者と同じ潜在クラスに属する1つまたは複数の因子とによって特徴付けられることになる。ここで、所定の潜在クラスに属する因子の値は、同じ潜在クラスに属する分析対象者の間で類似した値にはなるものの、完全に同一の値になるとは限らない。
【0011】
前述の例を用いて説明すれば、「メーカAを好む潜在クラスに分類されたアンケート回答者には、実際にメーカAの製品を所有している回答者(1の値が割り当てられた回答者)ばかりでなく、メーカAの製品を所有していない回答者(0の値が割り当てられた回答者)も含まれる」ことになる。
【0012】
本願発明者らは、特定の潜在クラスに属する特定の因子(以下、「目的因子」という)の値が0または1になった要因を、その目的因子と他の因子との関係性から分析することを検討した。
【0013】
そうした分析を行うための手法としては、特定の潜在クラスに対応した行列において、行成分または列成分をなす各因子を互いに異なるベクトルとみなすことで、その潜在クラスに属する分析対象者と同数の次元を有する多次元ベクトルを生成することが考えられる。この場合、目的因子に対応したベクトルと、他の因子に対応したベクトルとのユークリッド距離等を分析することで、目的因子の値と同じ傾向を持った因子を抽出したり、それとは反対に、目的因子の値と相反する傾向を持った因子を抽出したりすることが可能になる。
【0014】
ところが、分析対象者が多数にわたる場合、前述のような多次元ベクトルは、可視化するのが容易ではなく、直感的にも把握しがたいという難点があった。そのため、特定の潜在クラスに属する各因子に対応した多次元ベクトルに対し、t-SNEを適用して低次元ベクトルへと変換することが考えられる。
【0015】
しかしながら、同じ潜在クラスに属する因子の値は、前述のように、同じ潜在クラスに属する分析対象者の間で類似した値となり得る。そのため、そうした因子に対応した低次元ベクトルだけでは、目的因子に対応した低次元ベクトルとの傾向の差を捉えるには不十分である。
【0016】
本開示は、かかる点に鑑みてなされたものであり、その目的とするところは、複数の分析対象者と、該複数の分析対象者それぞれに割り当てられた0または1の値からなる複数の因子とを行列化してなる行列データの解析に際し、特定の目的因子の値が0または1となった要因を、従来よりも明確に捉えることにある。
【課題を解決するための手段】
【0017】
本開示の第1の態様は、プログラムを実行する演算部を備えるコンピュータを用いることによって、複数の分析対象者と、該複数の分析対象者それぞれに割り当てられた0または1の値からなる複数の因子とを行列化してなる行列データを解析するとともに、該解析結果を可視化する情報処理方法に係る。
【0018】
そして、本開示の第1の態様によれば、前記情報処理方法は、前記演算部が前記行列データにPLSA法を適用することで、それぞれ異なる潜在クラスによってラベリングされたブロック行列からなるブロック対角行列に近付けるように、前記行列データをクラスタリングするPLSAステップと、前記クラスタリング後の前記行列データにおいて、特定の潜在クラスに属する分析対象者それぞれを基底とし、該分析対象者それぞれに割り当てられた因子の値を各基底の成分とした多次元ベクトルを、前記特定の潜在クラス以外の他の潜在クラスに属する因子を含めて前記演算部が生成する分析対象抽出ステップと、前記演算部が前記多次元ベクトルにt-SNE法を適用することで、前記多次元ベクトルを、2次元または3次元の低次元ベクトルに次元圧縮する次元圧縮ステップと、前記特定の潜在クラスに属する一の因子を目的因子とし、前記他の潜在クラスに属する他の因子を複数の比較因子とすると、前記多次元ベクトルに対応して得られた各低次元ベクトルに基づいて、前記目的因子に対応した前記低次元ベクトルと、前記複数の比較因子の各々に対応した前記低次元ベクトルとの相対的な位置関係を前記演算部が可視化するベクトル可視化ステップと、前記ベクトル可視化ステップによって可視化された前記相対的な位置関係に基づいて、前記目的因子の値が0または1となった要因を分析する要因分析ステップと、を備える。
【0019】
ここで、前記PLSAステップでは、ブロック対角行列に近付くように、所定の行列に対して並び替え(クラスタリング)が施されることになる。以下、クラスタリング後の行列を「準ブロック対角行列」ともいう。「準ブロック対角行列」の非ブロック対角部分は、ブロック対角行列の非ブロック対角部分とは異なり、非ゼロの値を取り得る。
【0020】
前記第1の態様によると、特定の潜在クラス(以下、単に「特定クラス」という)に属する分析対象者それぞれを基底とし、該分析対象者それぞれに割り当てられた因子の値を各基底の成分とした多次元ベクトルに対してt-SNE法を適用することで、その多次元ベクトルを低次元ベクトルに次元圧縮する。
【0021】
そして、低次元ベクトルの可視化に際し、特定クラスに属する目的因子と、他の比較因子との比較を行うところ、後者の比較因子については、特定クラスに属する因子ではなく、それ以外の他の潜在クラスに属する因子を採用する。
【0022】
すなわち、クラスタリング(言い換えると、ブロック対角行列に近付けるような行列の並び替え)によって得られた各ブロック行列が、それぞれ潜在クラスに対応することから明らかなように、同じ潜在クラスに属する因子に対応した低次元ベクトルは、互いに類似した傾向(例えば、ベクトル長が同程度になったり、内積が1に近接したりする傾向)を示す。なお、ここでいう「ブロック行列」とは、前記準ブロック対角行列のブロック対角部分を構成する行列を指す。
【0023】
それに対し、特定クラスに属する目的因子と、他の潜在クラスに属する比較因子との比較を行うことで、低次元ベクトル同士の違いを明確化することができる。そうして違いが明確化された状態で、目的因子に近接又は離間する比較因子を探索することで、目的因子の値が0または1となった契機となり得る要因を、従来よりも明確に捉えることが可能になる。
【0024】
またそもそも、他の潜在クラスに属する比較因子との比較を行うことは、PLSA法を行った段階では異なる潜在クラスに分類されたものの、それでもなお、目的因子と強く相関するような比較因子を探索することに相当する。これは、従来のPLSA法では知り得ない知見であり、特定の目的因子の値が0または1となった要因を、従来よりも多方面から捉えることができるようになる。
【0025】
また、本開示の第2の態様によれば、前記ベクトル可視化ステップでは、前記相対的な位置関係として、前記目的因子に対応した前記低次元ベクトルと、前記複数の比較因子の各々に対応した前記低次元ベクトルとの間のユークリッド距離を前記演算部が可視化し、前記要因分析ステップでは、前記演算部が可視化した各ユークリッド距離の長短に基づいて、前記複数の比較因子の中から、前記目的因子の値に寄与した因子を探索する、としてもよい。
【0026】
前記第2の態様によると、前記要因分析ステップは、各ユークリッド距離の長短に基づいて因子を探索するように構成されている。このように構成することで、より直感的に理解し易い形式で可視化及び探索することが可能になる。これにより、特定の目的因子の値が0または1となった要因を捉える上で有利になる。
【0027】
また、本開示の第3の態様によれば、前記目的因子は、所定の物品を所有しているか否かを示すフラグである、としてもよい。
【0028】
前記第3の態様によると、目的因子に対応した多次元ベクトルを構成する基底には、前記フラグが1となった分析対象者、すなわち、前記物品を実際に所有している分析対象者が含まれることになる。そうした多次元ベクトルに基づき生成された低次元ベクトルに対して前述の可視化を行うことで、前記物品を所有する契機となった要因、或いは、所有しない契機となった要因を、従来よりも多方面から捉えることが可能になる。
【0029】
また、本開示の第4の態様によれば、前記ベクトル可視化ステップでは、前記複数の比較因子のうちの一の比較因子を第2の目的因子とし、前記第2の目的因子に対応した前記低次元ベクトルと、該第2の目的因子を除いた残りの比較因子の各々に対応した前記低次元ベクトルとの間のユークリッド距離を前記演算部が可視化し、前記要因分析ステップでは、前記演算部が可視化した各ユークリッド距離の長短に基づいて、前記残りの比較因子の中から、前記第2の目的因子の値に寄与した因子を探索し、前記第2の目的因子の値に寄与した因子と、前記目的因子の値に寄与した因子とを比較することで、前記目的因子の値が0または1となった要因を分析する、としてもよい。
【0030】
前記第4の態様によると、第2の目的因子を用いた分析を行うことで、第1の目的因子の値が0または1となった要因を、より多方面から捉えることができるようになる。例えば、第2の目的因子が、第1の目的因子の競合商品を所有しているか否かを示すフラグだった場合、第2の目的因子が0または1となった要因を探索することで、前記競合商品の改良点、訴求点等を明らかにすることが可能になる。それらの知見を分析することで、第1の目的因子に対応した商品の要改良点等を明確化(見える化)することができる。
【0031】
また、本開示の第5の態様によれば、前記情報処理方法は、前記第2の目的因子が属する潜在クラスを第2の特定クラスと呼称すると、前記クラスタリング後の前記行列データにおいて、前記第2の特定クラスに属する分析対象者それぞれを基底とし、該分析対象者それぞれに割り当てられた因子の値を各基底の成分とした第2の多次元ベクトルを、前記第2の特定クラス以外の他の潜在クラスに属する因子を含めて前記演算部が生成する第2の分析対象抽出ステップと、前記演算部が前記第2の多次元ベクトルにt-SNE法を適用することで、前記第2の多次元ベクトルを2次元または3次元の低次元ベクトルに次元圧縮する第2の次元圧縮ステップと、前記第2の多次元ベクトルに対応して得られた各低次元ベクトルに基づいて、前記目的因子に対応した前記低次元ベクトルと、前記第2の目的因子に対応した前記低次元ベクトルと、前記残りの比較因子の各々に対応した前記低次元ベクトルとの間のユークリッド距離を前記演算部が可視化する第2のベクトル可視化ステップと、を備え、前記要因分析ステップでは、前記ベクトル可視化ステップにおいて前記演算部が可視化した各ユークリッド距離の長短に基づいて、前記残りの比較因子の中から、前記目的因子及び前記第2の目的因子それぞれの値に寄与した因子を探索する第1の探索ステップと、前記第2のベクトル可視化ステップにおいて前記演算部が可視化した各ユークリッド距離の長短に基づいて、前記残りの比較因子の中から、前記目的因子及び前記第2の目的因子それぞれの値に寄与した因子を探索する第2の探索ステップと、を実行し、前記第1の探索ステップによって探索された因子と、前記第2の探索ステップによって探索された因子とを比較することで、前記目的因子の値が0または1となった要因を分析する、としてもよい。
【0032】
前記第5の態様によると、目的因子(第1の目的因子)の属する潜在クラスを特定クラスとした分析を行った後に、第2の目的因子の属する潜在クラスを特定クラスに変更した分析を行う。後者の分析は、第2の目的因子と同じ潜在クラスに属する分析対象者それぞれを基底とし、該分析対象者それぞれに割り当てられた因子の値を各基底の成分とした多次元ベクトルに基づいた分析となる。したがって、後者の分析と前者の分析は、低次元ベクトルの生成に用いる分析対象者の内訳が相違することになる。
【0033】
このように、分析対象者の内訳を異ならせた2つの分析結果を比較することで、目的因子の値が0または1となった要因を、より多方面から捉えることができるようになる。
【0034】
また、本開示の第6の態様によれば、前記目的因子は、所定の物品を所有しているか否かを示すフラグであり、前記第2の目的因子は、前記所定の物品とは相違する別の物品を所要しているか否かを示すフラグであり、前記所定の物品および前記別の部品は、製造者の異なる同種の物品である、としてもよい。
【0035】
前記第6の態様によると、第2の目的因子が0または1となった要因を探索することで、前記別の物品の改良点、訴求点等を明らかにすることが可能になる。これにより、前記所定の物品における要改良点等を明確化することができる。
【0036】
本開示の第7の態様は、プログラムを実行する演算部を備えるコンピュータを備え、複数の分析対象者と、該複数の分析対象者それぞれに割り当てられた0または1の値からなる複数の因子とを行列化してなる行列データを解析するとともに、該解析結果を可視化する情報処理装置に係る。
【0037】
そして、本開示の第7の態様によれば、前記情報処理装置は、前記演算部が前記行列データにPLSA法を適用することで、それぞれ異なる潜在クラスによってラベリングされたブロック行列からなるブロック対角行列に近付けるように、前記行列データをクラスタリングするPLSA手段と、前記クラスタリング後の前記行列データにおいて、特定の潜在クラスに属する分析対象者それぞれを基底とし、該分析対象者それぞれに割り当てられた因子の値を各基底の成分とした多次元ベクトルを、前記特定の潜在クラス以外の他の潜在クラスに属する因子を含めて前記演算部が生成する分析対象抽出手段と、前記演算部が前記多次元ベクトルにt-SNE法を適用することで、前記多次元ベクトルを、2次元または3次元の低次元ベクトルに次元圧縮する次元圧縮手段と、前記特定の潜在クラスに属する一の因子を目的因子とし、前記他の潜在クラスに属する他の因子を複数の比較因子とすると、前記多次元ベクトルに対応して得られた各低次元ベクトルに基づいて、前記目的因子に対応した前記低次元ベクトルと、前記複数の比較因子の各々に対応した前記低次元ベクトルとの相対的な位置関係を前記演算部が可視化するベクトル可視化手段と、前記ベクトル可視化ステップによって可視化された前記相対的な位置関係に基づいて、前記目的因子の値が0または1となった要因を分析する要因分析手段と、を備える。
【0038】
前記第7の態様によると、行列データの解析に際し、特定の目的因子の値が0または1となった要因を、従来よりも明確に捉えることができる。
【0039】
本開示の第8の態様は、プログラムを実行する演算部を備えるコンピュータに実行させることによって、複数の分析対象者と、該複数の分析対象者それぞれに割り当てられた0または1の値からなる複数の因子とを行列化してなる行列データを解析するとともに、該解析結果を可視化する情報処理プログラムに係る。
【0040】
そして、本開示の第8の態様によれば、前記情報処理プログラムは、前記コンピュータに、前記演算部が前記行列データにPLSA法を適用することで、それぞれ異なる潜在クラスによってラベリングされたブロック行列からなるブロック対角行列に近付けるように、前記行列データをクラスタリングするPLSAステップと、前記クラスタリング後の前記行列データにおいて、特定の潜在クラスに属する分析対象者それぞれを基底とし、該分析対象者それぞれに割り当てられた因子の値を各基底の成分とした多次元ベクトルを、前記特定の潜在クラス以外の他の潜在クラスに属する因子を含めて前記演算部が生成する分析対象抽出ステップと、前記演算部が前記多次元ベクトルにt-SNE法を適用することで、前記多次元ベクトルを、2次元または3次元の低次元ベクトルに次元圧縮する次元圧縮ステップと、前記特定の潜在クラスに属する一の因子を目的因子とし、前記他の潜在クラスに属する他の因子を複数の比較因子とすると、前記多次元ベクトルに対応して得られた各低次元ベクトルに基づいて、前記目的因子に対応した前記低次元ベクトルと、前記複数の比較因子の各々に対応した前記低次元ベクトルとの相対的な位置関係を前記演算部が可視化するベクトル可視化ステップと、前記ベクトル可視化ステップによって可視化された前記相対的な位置関係に基づいて、前記目的因子の値が0または1となった要因を分析する要因分析ステップと、を実行させる。
【0041】
前記第8の態様によると、行列データの解析に際し、特定の目的因子の値が0または1となった要因を、従来よりも明確に捉えることができる。
【0042】
また、本開示の第9の態様は、前記情報処理プログラムを記憶していることを特徴とするコンピュータ読取可能な記憶媒体に係る。
【0043】
前記第9の態様によると、行列データの解析に際し、特定の目的因子の値が0または1となった要因を、従来よりも明確に捉えることができる。
【発明の効果】
【0044】
以上説明したように、本開示によれば、行列データの解析に際し、特定の目的因子の値が0または1となった要因を、従来よりも明確に捉えることができる。
【図面の簡単な説明】
【0045】
【
図1】
図1は、情報処理装置のハードウェア構成を例示する図である。
【
図2】
図2は、情報処理装置のソフトウェア構成を例示する図である。
【
図3】
図3は、情報処理方法の手順を例示するフローチャートである。
【
図4】
図4は、PLSAステップの手順を例示するフローチャートである。
【
図6】
図6は、PLSAステップの基本概念を説明するための図である。
【
図7】
図7は、クラスタリング結果を例示する図である。
【
図8】
図8は、分析対象抽出ステップの手順を例示するフローチャートである。
【
図9】
図9は、分析対象抽出ステップの基本概念を説明するための図である。
【
図10】
図10は、次元圧縮ステップの手順を例示するフローチャートである。
【
図11】
図11は、ベクトル可視化ステップの手順を例示するフローチャートである。
【
図12】
図12は、要因分析ステップの手順を例示するフローチャートである。
【
図13】
図13は、ベクトル可視化ステップによって可視化される内容を例示する図である。
【
図14】
図14は、第2のベクトル可視化ステップによって可視化される内容を例示する図である。
【発明を実施するための形態】
【0046】
以下、本開示の実施形態を図面に基づいて説明する。なお、以下の説明は例示である。
【0047】
<装置構成>
図1は、本開示に係る情報処理装置(具体的には、情報処理装置を構成するコンピュータ1)のハードウェア構成を例示する図であり、
図2は、そのソフトウェア構成を例示する図である。
【0048】
図1に例示するように、コンピュータ1は、コンピュータ1全体の制御を司る中央処理装置(Central Processing Unit:CPU)3と、ブートプログラム等を記憶するリードオンリーメモリ(Read Only Memory:ROM)5と、メインメモリとして機能するランダムアクセスメモリ(Random Access Memory:RAM)7と、2次記憶装置としてのハードディスクドライブ(Hard Disk Drive:HDD)9と、を備える。なお、2次記憶装置としては、HDD9の代わりに、ソリッドステートドライブ(Solid State Drive:SSD)等を用いることもできる。
【0049】
これらの要素のうち、CPU3は、種々のプログラムを実行する。CPU3は、本実施形態における演算部として機能する。また、RAM7及びHDD9は、CPU3により実行されるプログラムを一時的または継続的に記憶する。RAM7及びHDD9は、それぞれ、本実施形態における記憶部として機能する。
【0050】
コンピュータ1はまた、ディスプレイ11と、ディスプレイ11上に表示される画像データを格納するグラフィックスメモリ(Video RAM:VRAM)13と、マンマシンインターフェースとしてのキーボード15及びマウス17と、を備える。ディスプレイ11は、CPU3による演算結果を表示することができ、本実施形態における表示部として機能する。また、本実施形態に係るコンピュータ1は、通信用のインターフェース21を解して外部機器との間でデータを送受することができる。
【0051】
図2に例示するように、HDD9のプログラムメモリには、オペレーティングシステム(Operating System:OS)19、PLSAプログラム29A、分析対象抽出プログラム29B、次元圧縮プログラム29C、ベクトル可視化プログラム29D、特定クラス変更プログラム29E、要因分析プログラム29F、アプリケーションプログラム39等が格納される。
【0052】
これらの要素のうち、PLSAプログラム29A、分析対象抽出プログラム29B、次元圧縮プログラム29C、ベクトル可視化プログラム29D、特定クラス変更プログラム29E及び要因分析プログラム29Fは、本実施形態における情報処理プログラム29を構成する。
【0053】
ここで、情報処理プログラム29とは、後述の情報処理方法を実行するためのプログラムであって、同方法を構成する各ステップをコンピュータ1に実行させるように構成されている。情報処理プログラム29は、コンピュータ読取可能な記憶媒体18に予め記憶されている。
【0054】
HDD9のプログラムメモリにおいて、PLSAプログラム29A、分析対象抽出プログラム29B、次元圧縮プログラム29C、ベクトル可視化プログラム29D、特定クラス変更プログラム29E及び要因分析プログラム29Fは、それぞれ、キーボード15、マウス17等から入力される指令に応じて起動される。その際、PLSAプログラム29A等は、HDD9からRAM7にロードされ、CPU3によって実行されることになる。
【0055】
一方、HDD9のデータメモリには、解析対象となる行列データ49と、その行列データ49をクラスタリングすることで得られるクラスタデータ59と、が格納される。
【0056】
この他、PLSAプログラム29A、分析対象抽出プログラム29B、次元圧縮プログラム29C、ベクトル可視化プログラム29D、特定クラス変更プログラム29E及び要因分析プログラム29Fを実行することで生成される種々のデータ、並びに、アプリケーションプログラム39の実行結果については、必要に応じて、HDD9のデータメモリに格納されたり、メインメモリとしてのRAM7に格納されたりする。
【0057】
以下、情報処理方法の具体的な方法論について詳細に説明する。
【0058】
<方法論>
図3は、情報処理方法の手順を例示するフローチャートである。
図3に例示した方法は、コンピュータ1を用いることによって、行列データ49を解析するとともに、その解析結果を可視化するものである。
【0059】
図3に示すように、情報処理方法は、PLSAステップ(ステップS1)と、分析対象抽出ステップ(ステップS2)と、次元圧縮ステップ(ステップS3)と、ベクトル可視化ステップ(ステップS4)と、特定クラス変更ステップ(ステップS6)と、要因分析ステップ(ステップS7)と、を順番に実行することで実施される。なお、ベクトル可視化ステップ及び要因分析ステップの実行結果は、いずれも、表示部としてのディスプレイ11上に表示することができる。
【0060】
これらのステップのうち、PLSAステップは、CPU3が前述のPLSAプログラム29Aを実行することで実施される。同様に、分析対象抽出ステップは、CPU3が分析対象抽出プログラム29Bを実行することで実施され、次元圧縮ステップは、CPU3が次元圧縮プログラム29Cを実行することで実施され、ベクトル可視化ステップは、CPU3がベクトル可視化プログラム29Dを実行することで実施され、特定クラス変更ステップは、CPU3が特定クラス変更プログラム29Eを実行することで実施され、要因分析ステップは、CPU3が要因分析プログラム29Fを実行することで実施される。
【0061】
CPU3がPLSAプログラム29A等を実行することで、コンピュータ1は、PLSAステップを実行するPLSA手段と、分析対象抽出ステップを実行する分析対象抽出手段と、次元圧縮ステップを実行する次元圧縮手段と、ベクトル可視化ステップを実行するベクトル可視化手段と、特定クラス変更ステップを実行する特定クラス変更手段と、要因分析ステップを実行する要因分析手段と、を備える情報処理装置として機能することになる。
【0062】
以下、情報処理方法を構成する各ステップについて順番に説明する。
【0063】
(PLSAステップ)
図4は、PLSAステップの手順を例示するフローチャートである。また、
図5は、行列データ49を例示する図であり、
図6は、PLSAステップの基本概念を説明するための図であり、
図7は、クラスタリング結果を例示する図である。
【0064】
ここで、
図4に例示するフローチャートは、
図3のステップS1において行われる処理を示している。すなわち、
図3において制御プロセスがステップS1に進むと、CPU3は、
図4のステップS11-S14を順番に実行することになる。
【0065】
PLSAステップは、CPU3が行列データ49にPLSA法を適用することで、それぞれ異なる潜在クラスによってラベリングされたブロック行列からなるブロック対角行列に近付けるように、前記行列データをクラスタリングするように構成されている。言い換えると、このPLSAステップは、それぞれ異なる潜在クラスによってラベリングされたブロック行列を含んだ前述の準ブロック対角行列となるように、行列データをクラスタリングするように構成されている。
【0066】
具体的に、
図4のステップS11において、CPU3が行列データ49を読み込む。
【0067】
この行列データ49は、複数の分析対象者ni(i=1,2,…,N)と、該複数の分析対象者niそれぞれに割り当てられた0又は1の値からなる複数の因子pj(j=1,2,…,M)とを行列化してなるものである。以下、「分析対象者」を単に「対象者」と記載する。対象者の人数(=N)は、好ましくは100人以上、さらに好ましくは1000となる。また、因子の数(=M)は、好ましくは100個以上、さらに好ましくは200個以上となる。
【0068】
特に本実施形態では、行列データ49の行成分が各対象者に対応し、列成分が各因子に対応するようになっている。すなわち、行列データ49に対応したN行M列の行列をXと表すと、Xの(i,j)成分は、i番目の対象者niにおける、j番目の因子pjの値を表すことになる。
【0069】
複数の因子pjは、それぞれ、各対象者niの性質、状態等を表すフラグとしてもよい。各対象者niの性質には、各対象者niの性別、性格及び嗜好が含まれる。各対象者niの状態には、各対象者niの年齢、健康状態及び所定の物品を所有しているか否を示すフラグが含まれる。複数の因子pjは、それぞれ、各対象者niに対するアンケートの回答結果としてもよい。仮の呼称として、各対象者niの性質及び状態を「価値観」と総称する場合がある。
【0070】
特に本実施形態では、各対象者n
iの嗜好として、複数の因子p
jに、メーカAによって製造された物品(例えば、A社製の自動車)を所有しているか否かを示すフラグ(
図5の因子p
1:「ユーザA」)と、この物品と同じ種類の物品であってかつメーカBによって製造された物品(例えば、B社製の自動車)を所有しているか否かを示すフラグ(
図5の因子p
2:「ユーザB」)と、この物品と同じ種類の物品であってかつメーカCによって製造された物品(例えば、C社製の自動車)を所有しているか否かを示すフラグ(
図5の因子p
3:「ユーザC」)とが含まれているものとする。
【0071】
詳しくは、
図5に示す例では、複数の因子p
jに、対象者n
iの性別を示すフラグ(因子p
4及び因子p
5)と、対象者n
iの年齢を示すフラグ(因子p
6及び因子p
7:「若年層」及び「熟年層」)と、対象者n
iの嗜好を示すフラグ(因子p
8~因子p
11)と、が含まれているものとする。
【0072】
さらに詳しくは、
図5に示す例では、複数の因子p
jに、「デザイン性を追求するか否か」を示すフラグ(因子p
8:「デザイン性」)と、「機能性を追求するか否か」を示すフラグ(因子p
9:「機能性」)と、「高級感を求めるか否か」を示すフラグ(因子p
10:「高級感」)と、「割安感を追求するか否か」を示すフラグ(因子p
11:「デザイン性」)と、が示されている。この他、視力の良否、認知状態の高低等、対象者n
iの健康状態を示すフラグを因子p
jに含めたり、集団行動を好むか否か等、対象者n
iの性格を示すフラグを因子p
jに含めたりしてもよい。
【0073】
なお、複数の因子p
jには、対象者n
iの年齢のように択一的に選ばれるフラグが含まれてもよいし、対象者n
iの嗜好のように重複を許すフラグが含まれていてもよい。例えば、
図5の因子p
6及び因子p
7に示すように、対象者n
iの年齢は、若年層及び熟年層のいずれか一方のフラグが1となり、他方のフラグは0となる。それに対し、同図の因子p
8及び因子p
9に示すように、対象者n
iの嗜好は、「デザイン性を追求するか否か」と「機能性を追求するか否か」の両方のフラグが1であってもよいし、片方のフラグが1であってもよいし、両方のフラグが0であってもよい。
【0074】
その後、ステップS11から続くステップS12において、演算部としてのCPU3が、ステップS11で読み込んだ行列データ49に対してPLSA法を適用する。PLSA法を適用することで、行列データ49は、ブロック対角行列に近づくように並び替えが施されることで、複数のクラスタClz(z=1,2,…,Z)にクラスタリングされることになる。ここで、ブロック行列(準ブロック対角行列のブロック対角部分)としての各クラスタCzは、いわゆる潜在クラス(潜在変数)zによってラベリングされることになる。
【0075】
PLSAは、行列データ49における行要素iと列要素jの同時確率分布P(i,j)を潜在クラスzによって展開し、下式(1)のように表したものに相当する。
【0076】
【0077】
上式に示すように、行要素iと列要素jは、双方とも、潜在クラスzを使って表現することができる。つまり、複数の対象者niがいずれかの潜在クラスzに分類されると同時に、複数の因子pjもいずれかの潜在クラスzに分類されることになる。これらの分類は、いずれも択一的に行われるようになっている。
【0078】
具体的な計算に際しては、いわゆるEMアルゴリズムを用いることによって、同時確率分布P(i,j)の対数尤度を最大にすることでクラスタリングを実行する。これにより、
図6の下段に示すように、対象者n
i及び因子p
jをそれぞれ第1クラスタCl
1(z=1)、第2クラスタCl
2(z=2)、第3クラスタCl
3(z=3)、…に分類することができる。各クラスタCl
zの構成成分は、フラグが1である確率が高いものが集まるように構成されている。換言すると、第1クラスタCl
1の(1,2)成分に示すように、各クラスタCl
zの構成成分は、必ずしも1になるとは限らない。
【0079】
なお、
図6の下段は、概略的な例示に過ぎない。前述のように対象者の人数を100人以上に設定しかつ因子の数を100個以上に設定した場合、各クラスタCl
zに属する対象者n
i及び因子p
jの数は、双方とも数十~百個程度に及び得る。
【0080】
その後、ステップS12から続くステップS13において、CPU3は、各潜在クラスzに顧客ID(対象者n
iの引数i)と、因子ID(因子p
jの引数j)を振り分ける。この振り分けによって、
図6に示すように、行列データ49を少なくとも2つ以上のクラスタに分類することができる。
【0081】
ここで、CPU3は、例えば、コンピュータ1の操作者による操作入力に基づいて、各クラスタClzを構成する1つ又は複数の因子pjを各クラスタClzの名称(看板)に設定することができる。この名称は、各クラスタClzの構成因子のうち、フラグが1となる確率が最も高い因子pjを選択してもよいし、操作者の目的に応じて、手動で選択してもよい。
【0082】
例えば
図6の場合、フラグが1となる確率が高い因子p
jとして、第1クラスタCl
1ではp
16とp
18が選択され、第2クラスタCl
2ではp
7とp
11が選択され、第3クラスタCl
3はp
2とp
12が選択されることになる。看板及び因子p
jの選択については、
図7も参照されたい。
【0083】
一方、例えば、「A社製品を所有しているか否かを分かつ要因を知りたい」という目的に基づいて本開示を実施する場合、因子p1が属する第1クラスタCl1には「Aユーザ」、「A社指向」等の名称を付し、因子p2が属する第3クラスタCl3には「Bユーザ」、「B社指向」等の名称を付し、因子p1~p3のいずれも属さない第2クラスタCl2には、「その他ユーザ」等の名称を付すことができる。
【0084】
なお、所定の物品を示すか否かを示すフラグ(例えば、p
1)を因子p
jに含めた場合、各潜在クラスzに分類された対象者n
iには、例えば第1クラスタCl
1の対象者n
8、n
19及びn
21に示すように、実際にその物品(A社製品)を所有している者(p
1の値が1となった対象者)が含まれる。以下、そうした対象者n
iを「主要A社ユーザ」と呼称する場合がある。
図6に示す例では、対象者n
8,n
19,n
21が主要A社ユーザに相当する。
【0085】
また、各潜在クラスzに分類された対象者n
iには、前記主要A社ユーザに加え、第1クラスタCl
1の対象者n
18のように、「Aユーザ」と付された第1クラスタCl
1に属しつつも、その物品を所有していない者(p
1の値が0となった対象者)も含まれる。以下、そうした対象者n
iを「潜在A社ユーザ」と呼称する場合がある。
図6に示す例では、対象者n
18が潜在A社ユーザに相当する。
【0086】
また、各潜在クラスzに分類された対象者n
iには、主要A社ユーザ及び潜在A社ユーザに加え、第2クラスタCl
2の対象者n
1のように、「その他ユーザ」と付された第2クラスタCl
2等、「Aユーザ」以外のクラスタに属しつつも、A社製品を所有している者も含まれる。以下、そうした対象者n
iを「顕在A社ユーザ」と呼称する場合がある。
図6に示す例では、対象者n
1が顕在A社ユーザに相当する。
【0087】
以下、例えば、B社製品を所有しているか否かを示す因子p2が属する第3クラスタCl3に関し、同様に「主要B社ユーザ」、「潜在B社ユーザ」及び「顕在B社ユーザ」と呼称する場合がある。C社製品を所有しているか否かを示す因子p3を含んだ図外のクラスタClzについても同様である。
【0088】
続いて、ステップS13から続くステップS14において、CPU3は、クラスタデータ59として、潜在クラスz毎に、顧客IDと因子IDを並び変えた行列データ49をRAM7又はHDD9に格納する。つまり、ここでいうクラスタデータ59とは、
図6の下段に示すように、クラスタリング後の行列データ49に他ならない。そうして格納されたクラスタデータ59は、分析対象抽出ステップ等の後続の処理において、必要に応じて読み込まれる。ステップS14が完了すると、制御プロセスは、
図4に例示したフローからリターンし、
図3のステップS2へ進む。
【0089】
(分析対象抽出ステップ)
図8は、分析対象抽出ステップの手順を例示するフローチャートである。また、
図9は、分析対象抽出ステップの基本概念を説明するための図である。
【0090】
ここで、
図8に例示するフローチャートは、
図3のステップS2において行われる処理を示している。すなわち、
図3において制御プロセスがステップS2に進むと、CPU3は、
図8のステップS21-S24を順番に実行することになる。
【0091】
分析対象抽出ステップは、クラスタリング後の行列データ49、つまりクラスタデータ59において、特定の潜在クラス(以下、単に「特定クラス」ともいう)z’に属する対象者niそれぞれを基底とし、該対象者niそれぞれに割り当てられた因子pjの値を各基底の成分とした多次元ベクトルXz’,jを、特定の潜在クラスz’以外の他の潜在クラスz”に属する因子pjを含めてCPU3が生成するように構成されている。ここで、「z”」は、「z」として取り得る値のうち、「z’」以外の全ての値を示す。
【0092】
具体的に、
図8のステップS21において、CPU3がクラスタデータ59を読み込む。前述のように、クラスタデータ59は、潜在クラスz毎に、顧客IDと因子IDを並び変えた行列データ49を示す。
【0093】
続いて、ステップS21から続くステップS22において、CPU3が、複数の潜在クラスzの中から特定クラスz’の選択を受け付ける。この選択は、例えば、コンピュータ1の操作者による操作入力に基づいて受け付けてもよいし、事前に特定クラスz’が記載された設定データをHDD9等から読み込んでもよい。
【0094】
本実施形態では、特定クラスz’の一例として、
図6及び
図9等に示す第1クラスタCl
1、つまりz=1の「Aユーザ」が選択されたものとする。
【0095】
続いて、ステップS22から続くステップS23において、CPU3は、特定クラスz’に属する顧客IDを基底とし、各顧客IDに割り振られた因子pjの値を各基底の成分とした多次元ベクトルXz’,jを生成する。すなわち、多次元ベクトルXz’,jの次元数dは、特定クラスz’に属する対象者niの数dと一致することになる。
【0096】
また、多次元ベクトルXz’,jの生成に際して考慮される因子pjは、少なくとも特定クラスz’に属する1つの因子pjと、特定クラスz’以外の他の潜在クラスz”に属する2以上の因子pjと、を含む。以下、前者の因子pjを「第1の目的因子pf」又は単に「目的因子pf」と呼称する場合がある。
【0097】
例えば、
図9に示す例では、特定クラスとしての第1クラスタCl
1に属する対象者n
iであるn
8、n
18、n
19及びn
21が多次元ベクトルX
1,jの基底となる。この場合、多次元ベクトルX
1,jは4次元(すなわちd=4)となる。
【0098】
また、第1クラスタCl
1に属する因子p
1を目的因子p
fとした場合、その目的因子p
fに対応する多次元ベクトルX
1,jは、
図9に示すように
X
1,1=(1,0,1,1)
と表すことができる。この場合の目的因子p
fは、所定物品としてのA社製品を所有しているか否かを示すフラグとなる。
【0099】
一方、特定クラスz’以外の他の潜在クラスz”、すなわち、第2クラスタCl2、第3クラスタCl3、…に属する各因子pjに対応する多次元ベクトルX1,jは、図内の範囲内では、
X1,7=(0,0,0,0),
X1,11=(0,0,0,0),
X1,2=(0,1,0,0),
X1,12=(0,0,1,0),
X1,17=(0,0,0,0)
と表すことができる。
【0100】
ここに着目すべき点として、「特定クラスz’以外の他の潜在クラスz”に対応する多次元ベクトルXz’,jは、ベクトルの各成分の値として、他の潜在クラスz”に属する因子pjの値を考慮するように設定されているが、ベクトルの基底として考慮すべき対象者niは、必ず、他の潜在クラスz”ではなく特定クラスz’に属する対象者niから選択される」、ことが挙げられる。
【0101】
詳細は後述するが、このように多次元ベクトルXz’,jを設定しておくことで、特定クラスz’に属する対象者niの状態・性質等を分かつ要因を、従来よりも明確に捉えることが可能になる。
【0102】
続いて、ステップS23から続くステップS24において、CPU3は、ステップS23によって生成された多次元ベクトルX
z’,jを、RAM7又はHDD9に格納する。そうして格納された多次元ベクトルX
z’,jは、次元圧縮ステップ等の後続の処理において、必要に応じて読み込まれる。ステップS24が完了すると、制御プロセスは、
図8に例示したフローからリターンし、
図3のステップS3へ進む。
【0103】
(次元圧縮ステップ)
図10は、次元圧縮ステップの手順を例示するフローチャートである。
【0104】
ここで、
図10に例示するフローチャートは、
図3のステップS3において行われる処理を示している。すなわち、
図3において制御プロセスがステップS3に進むと、CPU3は、
図10のステップS31-S33を順番に実行することになる。
【0105】
次元圧縮ステップは、CPU3が多次元ベクトルXz’,jにt-SNE法を適用することで、多次元ベクトルXz’,jを2次元又は3次元の低次元ベクトルxz’,jに次元圧縮するように構成されている。
【0106】
具体的に、
図10のステップS31において、CPU3が多次元ベクトルX
z’,jを読み込む。
【0107】
続いて、ステップS31から続くステップS32において、CPU3が、ステップS31で読み込んだ多次元ベクトルXz’,jに対し、t-SNE法を適用する。例えば、高次元空間では多変量正規分布に基づく尺度でベクトルデータ間の距離を測り、低次元空間では自由度1のt分布に基づく尺度でベクトルデータ間の距離を測る。そして、CPU3が2つの分布間のカルバック・ライブラー情報量を最小化することで、次元圧縮を実行する。t-SNE法を適用することで、d次元の多次元ベクトルXz’,jを、2次元又は3次元の低次元ベクトルxz’,jへと変換することができる。
【0108】
本実施形態では、2次元の低次元ベクトルxz’,jに変換されたものとする。多次元ベクトルXz’,jの本数(考慮すべき因子pjの数)は、低次元ベクトルxz’,jの本数と同じである。
【0109】
続いて、ステップS32から続くステップS33において、CPU3は、ステップS32によって生成された低次元ベクトルx
z’,jを、RAM7又はHDD9に格納する。そうして格納された低次元ベクトルx
z’,jは、ベクトル可視化ステップ等の後続の処理において、必要に応じて読み込まれる。ステップS33が完了すると、制御プロセスは、
図10に例示したフローからリターンし、
図3のステップS4へ進む。
【0110】
なお、
図10に例示するフローによって得られる低次元ベクトルx
z’,jには、前述の第1の目的因子(目的因子)p
fに対応した低次元ベクトルx
z’,jに加え、必要に応じて、後述の第2の目的因子p
sに対応した低次元ベクトルx
z’,jが含まれることになる。
【0111】
(ベクトル可視化ステップ)
図11は、ベクトル可視化ステップの手順を例示するフローチャートである。また、
図13は、ベクトル可視化ステップによって可視化される内容を例示する図である。
【0112】
なお、本実施形態において可視化可能な情報は、全て、表示部としてのディスプレイ11上に表示することができる。また、ここいう表示部は、コンピュータ1に直に接続されたディスプレイ11には限定されない。ネットワーク等を介してコンピュータ1と間接的に接続されたディスプレイを表示部として用いてもよい。
【0113】
ここで、
図11に例示するフローチャートは、
図3のステップS4において行われる処理を示している。すなわち、
図3において制御プロセスがステップS4に進むと、CPU3は、
図4のステップS41-S46を順番に実行することになる。
【0114】
ベクトル可視化ステップは、特定の潜在クラスz’に属する一の因子pjを目的因子pfとし、他の潜在クラスz”に属する他の因子pjを複数の比較因子pj”とすると、多次元ベクトルXz’,jに対応して得られた各低次元ベクトルxz’,jに基づいて、目的因子pfに対応した低次元ベクトルxz’,jと、複数の比較因子pj”の各々に対応した低次元ベクトルxz’,jと、の相対的な位置関係をCPU3が可視化するように構成されている。
【0115】
特に、本実施形態に係るベクトル可視化ステップでは、目的因子p’に対応した低次元ベクトルxz’,jと、複数の比較因子pj”の各々に対応した低次元ベクトルxz’,jとの間のユークリッド距離をCPU3が可視化するように構成されている。なお、ユークリッド距離に代えて、又は、ユークリッド距離に加えて、ベクトル間の内積を算出してもよい。
【0116】
具体的に、
図11のステップS41において、CPU3が各低次元ベクトルx
z’,jを読み込む。
【0117】
続いて、ステップS41から続くステップS42において、CPU3は、第1の目的因子pfと、必要に応じて第2の目的因子psを選択する操作を受け付ける。第1及び第2の目的因子pf,psのうちの少なくとも一方は、前記ステップS22に示した特定クラスz’の選択時に決定してもよいし、前記ステップS23に示した処理の際に決定してもよい。
【0118】
具体的に、ステップS42において、CPU3は、特定クラスz’に属する一の因子pjを第1の目的因子pfに選択し、前記他のクラスz”に属する2以上の因子pj(複数の比較因子pj”)のうちの一を第2の目的因子psに選択する。すなわち、第2の目的因子p2は、第1の目的因子p1とは異なる潜在クラスzに属することになる。好ましくは、第2の目的因子psに対応した多次元ベクトルXz’,jと、第1の目的因子pfに対応した前記多次元ベクトルXz’,jとは互いに直交する。
【0119】
なお、第1の目的因子pfとして、前述のように所定物品(A社製品)を所有しているか否かを示すフラグ(因子p1)を選択した場合、第2の目的因子psは、好ましくは、所定物品(A社製品)とは相異する別の物品を所有しているか否かを示すフラグとなる。この場合、所定物品と別の物品は、製造者の異なる同種の物品とすることがさらに好ましい。
【0120】
図6等に示した例の場合、第2の目的因子p
sとして、前記別の物品としてのB社製品を所有しているか否かを示すフラグ、つまり第3クラスタCl
3に属する因子p
2が選択されている。
【0121】
続いて、ステップS42から続くステップS43において、CPU3は、第1の目的因子p
fに対応した低次元ベクトルx
z’,jと、第2の目的因子p
sに対応した低次元ベクトルx
z’,jと、第2の目的因子p
s以外の比較因子p
j”に対応した低次元ベクトルx
z’,jと、を表示部としてのディスプレイ11上に表示する(マッピングする)。その表示に際しては、
図13に示すように、各低次元ベクトルx
z’,jの始点を省略し、終点のみを表示することができる。
【0122】
図5、
図6及び
図9等を用いて例示したように、特定クラスz’としての第1クラスタCl
1が選択され(つまり、z’=1)、第1の目的因子p
fとして第1クラスタCl
1の因子p
1が選択され、第2の目的因子p
sとして第3クラスタCl
3の因子p
2が選択され、2次元の低次元ベクトルx
1,jへと次元圧縮された場合を考える。第1の目的因子p
fの選択については、
図7も参照されたい。
【0123】
なお、比較因子pj”は、特定クラスz’以外の他のクラスz”に属する因子pjから選ばれることになる。例えば、上記例示の場合、第1クラスタCl1に属する因子pjは、比較因子pj”から除外されることに留意されたい。
【0124】
この場合における低次元ベクトルx
1,jの表示結果は、
図13に示す通りである。同図に示す“Pj”とは、因子p
jに対応した低次元ベクトルx
1,jの終点の位置座標を示している。すなわち、
図13の“P1”及び“P2”は、それぞれ、第1の目的因子p
fに対応した低次元ベクトルx
1,1の終点の位置座標と、第2の目的因子p
sに対応した低次元ベクトルx
1,2の終点の位置座標と、を示している。
【0125】
また、
図13における比較因子p
j”としては、第1の目的因子p
fとしてのp
1と、第2の目的因子p
sとしてのp
2と、第1クラスタCl
1に属する他の因子p
16,p
18と、を除いた残り16個の因子p
jが選択されている。
【0126】
ステップS43に示すように各低次元ベクトルx1,jの終点の位置座標を可視化することで、それに続くステップS44に示すように、低次元ベクトルx1,j間のユークリッド距離(距離)も、直感的な理解に堪えるレベルで可視化される。
【0127】
図13に例示したように、第2の目的因子p
sを追加で設定した場合、CPU3は、その第2の目的因子p
sに対応した低次元ベクトルx
1,jと、該第2の目的因子p
sを除いた残りの比較因子p
j”の各々に対応した低次元ベクトルx
1,jとの間のユークリッド距離を可視化してもよい。
【0128】
ステップS44では、ユークリッド距離の可視化を助けるべく、
図13の破線に示すように、第1の目的因子p
fに対応したP1と、第2の目的因子p
sに対応したP2とをそれぞれ中心としたサークルC
11,C
12を表示してもよい。この場合、各サークルC
11,C
12の内側に位置する比較因子p
j”は、第1の目的因子p
f及び/又は第2の目的因子p
sと近距離であると判定することができる。一方、各サークルC
11,C
12の外側に位置する比較因子p
j”は、第1の目的因子p
f及び/又は第2の目的因子p
sと遠距離であると判定することができる。2つのサークルC
11,C
12は、互いに同径としてもよい。
【0129】
そして、ステップS44から続くステップS45において、CPU3は、第1の目的因子pf及び第2の目的因子psに対して相対的に短距離の比較因子pj”を抽出する。
【0130】
ここでは、相対的に近距離の比較因子pj”として、前述のサークルC11,C12の内側に位置する比較因子pj”を抽出することができる。その際、第1の目的因子pf又は第2の目的因子psと、比較因子pj”とのユークリッド距離を算出する。
【0131】
そして、ステップS45から続くステップS46において、CPU3は、ステップS45における抽出結果と、抽出された各比較因子p
j”に係るユークリッド距離と、を、RAM7又はHDD9に格納する。そうして格納された低次元ベクトルx
z’,jは、要因分析ステップ等の後続の処理において、必要に応じて読み込まれる。ステップS46が完了すると、制御プロセスは、
図11に例示したフローからリターンする。
【0132】
ここで、第1の目的因子p
f及び第2の目的因子p
sのうち第1の目的因子p
fのみを設定した場合、制御プロセスは、
図3のステップS4から、ステップS5及びステップS6をスキップしてステップS7へ進む。
【0133】
一方、第1の目的因子p
f及び第2の目的因子p
sの両方を設定した場合、制御プロセスは、
図3のステップS4からステップS5へ進む。ステップS5では、以下に示す特定クラス変更ステップ(ステップS6)を行うか否かを判定し、この判定がYESの場合はステップS7へ進む一方、NOの場合はステップS6に進んで特定クラス変更ステップを実行する。
【0134】
なお、第1の目的因子pf及び第2の目的因子psの両方を設定した場合であっても、特定クラス変更ステップを必須とすることなく、これを省略してもよい。
【0135】
(特定クラス変更ステップ)
図14は、第2のベクトル可視化ステップによって可視化される内容を例示する図である。
【0136】
ステップS6に示す特定クラス変更ステップでは、特定クラスz’の変更を実行する。具体的に、第2の目的因子psが属する潜在クラスzを、新たに特定クラスz’に変更する。これにより、第1の目的因子psが属する潜在クラスzは、比較因子pj”の抽出元となる他の潜在クラスz”に再設定されることになる。
【0137】
図5、
図6、
図9及び
図14等を用いた例示の場合、第3クラスタCl
3が新たに特定クラスz’に設定され、第1クラスタCl
1は、他の潜在クラスz”に設定されたものとする。以下、変更後の特定クラス(第2の目的因子p
sが属する潜在クラス)を「第2の特定クラス」と呼称し、当初の特定クラスと区別する場合がある。
【0138】
そうして特定クラスz’の変更が完了すると、制御プロセスは、
図3のステップS2へと戻る。その後、制御プロセスは、特定クラスz’の変更を反映した状態で、分析対象抽出ステップ(ステップS2)と、次元圧縮ステップ(ステップS3)と、ベクトル可視化ステップ(ステップS4)とを再度実行する。その際、第1及び第2の目的因子p
f,p
sは、1回目の実行時と同一になるように固定されることになる。
【0139】
ここで、再度実行される各ステップを、それぞれ第2の分析対象抽出ステップ、第2の次元圧縮ステップ、及び第2のベクトル可視化ステップと呼称すると、第2の分析対象抽出ステップでは、クラスタリング後の行列データ49において、第2の特定クラスに属する対象者それぞれを基底とし、該対象者それぞれに割り当てられた因子の値を各基底の成分とした第2の多次元ベクトルを、第2の特定クラス以外の他の潜在クラスに属する因子を含めてCPU3が生成する。
【0140】
図14等を用いた例示の場合、第2の多次元ベクトルは、「X
3,j」と表すことができる。この場合の第2の多次元ベクトルX
3,jは、第1クラスタCl
1に属する対象者n
8,n
18,n
19,n
21を基底とする代わりに、第3クラスタCl
3に属する対象者n
4,n
12,…を基底とすることになる。
【0141】
続いて、第2の次元圧縮ステップでは、CPU3が第2の多次元ベクトルにt-SNE法を適用することで、第2の多次元ベクトルを2次元又は3次元の低次元ベクトルに次元圧縮する。
【0142】
図14等を用いた例示の場合、低次元ベクトルは、「x
3,j」と表すことができる。この場合の低次元ベクトルx
3,jは、第3クラスタCl
3に属する対象者n
4,n
12,…を基底とした多次元ベクトルにt-SNEを適用することで生成されることになる。
【0143】
続いて、第2のベクトル可視化ステップでは、第2の多次元ベクトルに対応して得られた各低次元ベクトルx3,jに基づいて、目的因子(第1の目的因子)に対応した低次元ベクトルと、第2の目的因子に対応した低次元ベクトルと、残りの比較因子の各々に対応した低次元ベクトルとの間のユークリッド距離をCPU3が可視化することになる。
【0144】
ここでいう「第1の目的因子に対応した低次元ベクトル」とは、第2の多次元ベクトルに対応して得られたものを指す。すなわち、
図14等を用いた例示の場合、第3クラスタCl
3に属する対象者n
4,n
12,…を基底とし、かつ、第1の目的因子p
fとしての因子p
1の値を各基底の成分とした多次元ベクトルにt-SNEを適用することで生成されたものが、「第1の目的因子に対応した低次元ベクトル」に相当する。「第2の目的因子に対応した低次元ベクトル」についても同様である。
【0145】
第2のベクトル可視化ステップにおける低次元ベクトルx
3,jの表示結果は、
図14に示す通りである。同図に示す“Pj”とは、因子p
jに対応した低次元ベクトルx
3,jの終点の位置座標を示している。すなわち、
図14の“P1”及び“P2”は、それぞれ、第1の目的因子p
fに対応した低次元ベクトルx
3,1の終点の位置座標と、第2の目的因子p
sに対応した低次元ベクトルx
3,2の終点の位置座標と、を示している。
【0146】
また、
図14における比較因子p
j”としては、第1の目的因子p
fとしてのp
1と、第2の目的因子p
sとしてのp
2と、第3クラスタCl
3に属する他の因子p
12,p
17と、を除いた残り16個の因子p
jが選択されている。
【0147】
各低次元ベクトルx3,jの終点の位置座標を可視化することで、特定クラスz’変更後の低次元ベクトルx3,j間のユークリッド距離(距離)が、第1のベクトル可視化ステップと同様に可視化される。
【0148】
第2のベクトル可視化ステップでは、第1のベクトル可視化ステップと同様にユークリッド距離の可視化を助けるべく、
図14の破線に示すように、第1の目的因子p
fに対応したP1と、第2の目的因子p
sに対応したP2とをそれぞれ中心としたサークルC
31,C
32を表示してもよい。この場合、各サークルC
31,C
32の内側に位置する比較因子p
j”は、第1の目的因子p
f又は第2の目的因子p
sのうちの一方と近距離であるとみなすことができる。
【0149】
多次元ベクトルX
3,jの基底を変更したことにより、第1の目的因子p
f又は第2の目的因子p
sに対して近距離となる比較因子p
j”の内訳が、
図13に示す例から変化し得る。
【0150】
最終的に、第1のベクトル可視化ステップと同様に、CPU3は、第1の目的因子pf及び第2の目的因子psに対して相対的に短距離の比較因子pj”を抽出する。ここでは、相対的に短距離の比較因子pj”として、前述のサークルC31,C32の内側又は近傍に位置する比較因子pj”を抽出することができる。その際、第1の目的因子pf又は第2の目的因子psと、比較因子pj”とのユークリッド距離を算出してもよい。
【0151】
(要因分析ステップ)
図3のステップS7に示す要因分析ステップは、ベクトル可視化ステップによって可視化された相対的な位置関係に基づいて、第1の目的因子p
fの値が0または1となった要因を分析するように構成されている。
【0152】
具体的に、本実施形態に係る要因分析ステップでは、CPU3が可視化した各ユークリッド距離の長短に基づいて、複数の比較因子pj”の中から、目的因子(第1の目的因子)pfの値に寄与した因子pjを探索する。
【0153】
以下、要因分析ステップの詳細を、特定クラス変更ステップを経由しないた場合と、特定クラス変更ステップを経由した場合と、のそれぞれについて説明する。
【0154】
1.特定クラス変更ステップを経由しない場合
この場合、第1の目的因子pfの値に寄与した因子pjの探索は、サークルC11の内側又は近傍に位置する比較因子pj”をリストアップするとともに、そのリストL11を第1の目的因子pfに対する距離が近い順に並べることで行われるようになっている。
【0155】
図13に示す例では、第1の目的因子p
fとして、第1クラスタCl
1に属しかつA社製品を所有していることを示す因子p
1が用いられている。この場合、第1の目的因子p
fとの距離が近いということは、「因子p
1とは異なるクラスタ(例えば、B社指向又はその他ユーザ)に属しつつも、因子p
1との相関が高い因子(A社製品を所有する契機となり得る因子)である」という仮の解釈を与えることが可能になる。
【0156】
それとは反対に、第1の目的因子pfとの距離が遠いということは、「因子p1とは異なるクラスタに属しつつ、それでいて、A社製品を所有する契機とはなり難い因子である」という仮の解釈を与えることが可能になる。
【0157】
すなわち、
図13等に例示した低次元ベクトルx
1,jは、実際にA社製品を所有している主要A社ユーザと、第1クラスタCl
1に属している(つまり、主要A社ユーザと同様の価値観を有する)ものの、A社製品を所有していない潜在A社ユーザと、を双方とも考慮した基底に基づいて生成されている。そうして生成された低次元ベクトルx
1,jと、実際にA社製品を所有していることを示す因子p
1との距離を分析することで、第1クラスタCl
1以外に属する因子p
jの中から、主要A社ユーザと潜在A社ユーザとを分かつ因子p
j、すなわち、A社製品を所有する契機となり得る因子p
jを探索することが可能になる。
【0158】
その際、第1クラスタCl1に属する因子pjではなく、それ以外のクラスタに属するpjに着目したことで、例えば、主要A社ユーザが有する価値観とは異なる観点から、主要A社ユーザと潜在A社ユーザとを分かつ因子pjを抽出することが可能になる。これにより、従来とは異なる観点から、“気づき”を促すことができる。
【0159】
また、第1の目的因子pfに加えて第2の目的因子psを設定した場合、CPU3が可視化した各ユークリッド距離の長短に基づいて、複数の比較因子pj”の中から、第2の目的因子psの値に寄与した因子を探索する。
【0160】
この探索は、サークルC12の内側又は近傍に位置する比較因子pj”をリストアップするとともに、そのリストL12を第2の目的因子psに対する距離が近い順に並べることで行うことができる。
【0161】
図13に示す例では、第2の目的因子p
sとして、第3クラスタCl
3に属しかつB社製品を所有していることを示す因子p
2が用いられている。この場合、第2の目的因子p
sとの距離が近いということは、「因子p
1との相関が低く、かつ因子p
2との相関が高い因子(B社製品を所有する契機となり得る因子)である」という仮の解釈を与えることが可能になる。
【0162】
また、第2の目的因子psとの距離が遠いということは、「B社製品を所有する契機とはなり難い因子である」という仮の解釈を与えることが可能になる。
【0163】
すなわち、
図13に例示した低次元ベクトルx
1,jは、前述のように、主要A社ユーザ及び潜在A社ユーザを双方とも考慮した基底に基づいて生成されている。そうして生成された低次元ベクトルx
1,jと、A社製品ではなくB社製品を所有していることを示す因子p
2との距離を分析することで、第1クラスタCl
1以外に属する因子p
jの中から、主要A社ユーザと、潜在A社ユーザとを分かつ因子p
j、すなわち、A社製品を指向する価値観を有しつつも、他社製品を所有するに至った因子p
jを探索することが可能になる。
【0164】
第1の目的因子pf及び第2の目的因子psを双方とも設定することで、主要A社ユーザと潜在A社ユーザとを分かつ因子pjを多面的に探索することが可能になる。
【0165】
2.特定クラス変更ステップを経由した場合
図12は、要因分析ステップの手順(特に、特定クラス変更ステップを経由した場合の手順)を例示するフローチャートである。
【0166】
この場合、CPU3は、まず、特定クラス変更ステップを経由しない場合の工程と同様に、特定クラスz’の変更前に探索(抽出)された比較因子pj”を、第1及び第2の目的因子pf,psに対して近い順に並べる(ステップS71)。このステップS71は、特定クラスz’の変更前に得られたユークリッド距離に基づいて、第1の目的因子pf及び第2の目的因子psそれぞれの値に寄与した因子を探索する第1の探索ステップに相当する。
【0167】
その後、CPU3は、特定クラスz’の変更後に探索(抽出)された比較因子pj”を、第1及び第2の目的因子pf,psに対して近い順に並べる(ステップS72)。このステップS72は、特定クラスz’の変更後に得られたユークリッド距離に基づいて、第1の目的因子pf及び第2の目的因子psそれぞれの値に寄与した因子を探索する第2の探索ステップに相当する。
【0168】
具体的に、前記ステップS72では、まず、特定クラスz’変更後に可視化された内容に基づいて、サークルC31の内側又は近傍に位置する比較因子pj”をリストアップするとともに、そのリストL31を第1の目的因子pfに対する距離が近い順に並べる。
【0169】
すなわち、
図14に例示した低次元ベクトルx
3,jは、主要B社ユーザと潜在B社ユーザを双方とも考慮した基底に基づいて生成されている。主要B社ユーザと潜在B社ユーザには、主要B社ユーザと同様の価値観を有しつつも、B社製品ではなくA社製品を所有するに至った顕在A社ユーザが含まれ得る。
【0170】
したがって、そうして生成された低次元ベクトルx3,jと、実際にA社製品を所有していることを示す因子p1との距離を分析することで、第3クラスタCl3以外に属する因子pjの中から、顕在A社ユーザであるか否かを分かつ因子pj、すなわちA社製品を所有する契機となり得る因子pjを探索することが可能になる。
【0171】
さらに、前記ステップS72では、特定クラスz’変更後にCPU3が可視化した各ユークリッド距離の長短に基づいて、複数の比較因子pj”の中から、第2の目的因子psの値に寄与した因子を探索する。
【0172】
具体的に、特定クラスz’変更後に可視化された内容に基づいて、サークルC32の内側又は近傍に位置する比較因子pj”をリストアップするとともに、そのリストL32を第2の目的因子psに対する距離が近い順に並べる。
【0173】
すなわち、
図14に例示した低次元ベクトルx
3,jは、前述のように、主要B社ユーザ及び潜在B社ユーザを双方とも考慮しかつ顕在A社ユーザを含み得る基底に基づいて生成されている。そうして生成された低次元ベクトルx
3,jと因子p
2との距離を分析することで、第3クラスタCl
3以外に属する因子p
jの中から、顕在A社ユーザであるか否かを分かつ因子p
j、すなわち、主要B社ユーザ及び潜在B社ユーザが、顕在A社ユーザにならなかった契機となり得る因子p
jを抽出することが可能になる。
【0174】
その後、ステップS72から続くステップS73は、第1の探索ステップによって探索された因子pjと、第2の探索ステップによって探索された因子pjとを比較することで、第1の目的因子pfの値が0または1となった要因を分析するように構成されている。
【0175】
具体的に、ステップS73では、CPU3は、特定クラスz’の変更前後で共通する比較因子p
j”を探索し、そうして探索された共通の比較因子p
j”をディスプレイ11に表示するとともに、その表示態様を変更する。表示態様の具体的な変更内容としては、共通の比較因子p
j”の表示色を異ならせてもよいし、共通の比較因子p
j”にハイライト等を付してもよいし、共通の比較因子p
j”に下線を付してもよいし、共通の比較因子p
j”の書体を変更してもよい
図15は、表示態様の変更例を示す図である。
図15に示す例は、
図13及び
図14において可視化された内容に基づいたものとされている。
【0176】
すなわち、
図15の上段には、特定クラスをz’=1に設定しかつ各ベクトルの基底に第1クラスタCl
1(A社指向)に属する対象者を用いた場合における、第1の目的因子p
fとしてのp
1に近接した4つの比較因子(P19,P11,P12及びP3を参照)と、第2の目的因子p
sとしてのp
2に近接した4つの比較因子(P17、P15、P14及びP10を参照)と、が表示されている。それらの比較因子は、p
1又はp
2に近いものから順番に並んでいる。
【0177】
一方、
図15の下段には、特定クラスをz’=3に設定しかつ各ベクトルの基底に第3クラスタCl
3(B社指向)に属する対象者を用いた場合における、第1の目的因子p
fとしてのp
1に近接した4つの比較因子(P15,P18,P19及びP9を参照)と、第2の目的因子p
sとしてのp
2に近接した4つの比較因子(P11、P16、P14及びP4を参照)と、が表示されている。それらの比較因子は、p
1又はp
2に近いものから順番に並んでいる。
【0178】
ここで、上段かつ第1の目的因子p
fの表示欄と、下段かつ第1の目的因子p
fの表示欄には、共通の比較因子として「P19」が表れている。これは、「A社指向の対象者であろうとも、B社指向の対象者であろうとも、因子p
19が、A社製品を所有する契機となる可能性が高い」という仮の解釈を与えることができる。そうした因子は、他の因子と比べて重要度が高いと考えられるため、
図15に示すように下線を付して表示する。
【0179】
同様に、上段かつ第2の目的因子p
sの表示欄と、下段かつ第2の目的因子p
sの表示欄には、共通の比較因子として「P14」が表れている。これは、「A社指向の対象者であろうとも、B社指向の対象者であろうとも、因子p
14が、B社製品を所有する契機となる可能性が高い」という仮の解釈を与えることができる。そうした因子は、他の因子と比べて重要度が高いと考えられるため、
図15に示すように下線を付して表示する。
【0180】
このように、特定クラスz’の変更前後で共通の比較因子pj”の表示態様を異ならせることで、他の比較因子pj”と比べて重要性の高い因子をユーザに視認させることができる。これにより、情報処理方法の使い勝手を向上させることが可能になる。
【0181】
その後、制御プロセスは、
図12に示すフローを完了し、
図3に示すフローからリターンする。
【0182】
<効果等>
以上説明したように、前記実施形態によると、特定クラスz’に属する対象者n
iそれぞれを基底とし、該対象者n
iそれぞれに割り当てられた因子p
jの値を各基底の成分とした多次元ベクトルX
z’,jに対してt-SNE法を適用することで、その多次元ベクトルX
z’,jを低次元ベクトルx
z’,jに次元圧縮する(
図3のステップS1-S3を参照)。
【0183】
そして、
図9等を用いて説明したように、低次元ベクトルx
z’,jの可視化に際し、特定クラスz’に属する第1の目的因子p
fと、他の比較因子p
j”との比較を行うところ、後者の比較因子p
j”については、特定クラスz’に属する因子ではなく、それ以外の他の潜在クラスz”に属する因子を採用する。
【0184】
すなわち、クラスタリングによって得られた各ブロック行列が、それぞれ潜在クラスzに対応することから明らかなように、同じ潜在クラスzに属する因子に対応した低次元ベクトルxz,jは、互いに類似した傾向を示す。
【0185】
それに対し、特定クラスz’に属する目的因子pfと、他の潜在クラスz”に属する比較因子pj”との比較を行うことで、低次元ベクトルxz’,j同士の違いを明確化することができる。そうして違いが明確化された状態で、目的因子pfに近接又は離間する比較因子pj”を探索することで、目的因子pj”の値が0または1となった契機となり得る要因を、従来よりも明確に捉えることが可能になる。
【0186】
またそもそも、他の潜在クラスz”に属する比較因子pj”との比較を行うことは、PLSA法を行った段階では異なる潜在クラスに分類されたものの、それでもなお、目的因子pfと強く相関するような比較因子pj”を探索することに相当する。これは、従来のPLSA法では知り得ない知見であり、特定の目的因子pfの値が0または1となった要因を、従来よりも多方面から捉えることができるようになる。
【0187】
また、
図13等を用いて説明したように、要因分析ステップは、各ユークリッド距離の長短に基づいて因子を探索するように構成されている。このように構成することで、より直感的に理解し易い形式で可視化及び探索することが可能になる。これにより、特定の目的因子p
fの値が0または1となった要因を捉える上で有利になる。
【0188】
また、
図9等に例示したように、目的因子p
fに対応した多次元ベクトルを構成する基底には、A社製品を実際に所有している対象者(例えば、n
8、n
19,n
21)が含まれることになる。そうした多次元ベクトルに基づき生成された低次元ベクトルに対して前述の可視化を行うことで、A社製品を所有する契機となった要因、或いは、所有しない契機となった要因を、従来よりも多方面から捉えることが可能になる。
【0189】
また、
図9等に例示したように、第2の目的因子p
sを用いた分析を行うことで、第1の目的因子p
sの値が0または1となった要因を、より多方面から捉えることができるようになる。例えば、第2の目的因子p
sが、第1の目的因子p
sの競合商品を所有しているか否かを示すフラグだった場合、第2の目的因子p
sが0または1となった要因を探索することで、前記競合商品の改良点、訴求点等を明らかにすることが可能になる。それらの知見を分析することで、第1の目的因子p
fに対応した商品の要改良点等を明確化(見える化)することができる。
【0190】
また、
図12等を用いて説明したように、目的因子(第1の目的因子)p
fの属する潜在クラス(図例ではz=1)を特定クラスz’とした分析を行った後に、第2の目的因子p
sの属する潜在クラス(図例ではz=3)を特定クラスz’に変更した分析を行う。後者の分析は、第2の目的因子p
sと同じ潜在クラスz’に属する対象者n
iそれぞれを基底とし、該対象者n
iそれぞれに割り当てられた因子p
jの値を各基底の成分とした多次元ベクトルに基づいた分析となる。したがって、後者の分析と前者の分析は、低次元ベクトルの生成に用いる対象者n
iの内訳が相違することになる。
【0191】
したがって、対象者niの内訳を異ならせた2つの分析結果を比較することで、目的因子pfの値が0または1となった要因を、より多方面から捉えることができるようになる。
【0192】
《他の実施形態》
前記実施形態では、一のコンピュータ1によって実施されるものを例示したが、本開示は、その例には限定されない。本開示に係る情報処理方法及び情報処理プログラム29は、複数のコンピュータ1を用いて実行してもよい。また、本開示におけるコンピュータ1には、スーパーコンピュータ、PCクラスタ等の並列計算機も含まれる。
【符号の説明】
【0193】
1 コンピュータ(情報処理装置)
3 CPU(演算部)
7 RAM(記憶部)
9 HDD(記憶部)
11 ディスプレイ(表示部)
18 記憶媒体
29 情報処理プログラム
49 行列データ
S1 PLSAステップ
S2 分析対象抽出ステップ
S3 次元圧縮ステップ
S4 ベクトル可視化ステップ
S7 要因分析ステップ