IP Force 特許公報掲載プロジェクト 2022.1.31 β版

知財求人 - 知財ポータルサイト「IP Force」

▶ データ・ケーキベーカ株式会社の特許一覧

特開2023-168169プリフェラブル・パフォーマンス・プロファイラを生成するデータ分析方法、システム、およびプログラム
<>
  • 特開-プリフェラブル・パフォーマンス・プロファイラを生成するデータ分析方法、システム、およびプログラム 図1
  • 特開-プリフェラブル・パフォーマンス・プロファイラを生成するデータ分析方法、システム、およびプログラム 図2
  • 特開-プリフェラブル・パフォーマンス・プロファイラを生成するデータ分析方法、システム、およびプログラム 図3
  • 特開-プリフェラブル・パフォーマンス・プロファイラを生成するデータ分析方法、システム、およびプログラム 図4
  • 特開-プリフェラブル・パフォーマンス・プロファイラを生成するデータ分析方法、システム、およびプログラム 図5
  • 特開-プリフェラブル・パフォーマンス・プロファイラを生成するデータ分析方法、システム、およびプログラム 図6
  • 特開-プリフェラブル・パフォーマンス・プロファイラを生成するデータ分析方法、システム、およびプログラム 図7
  • 特開-プリフェラブル・パフォーマンス・プロファイラを生成するデータ分析方法、システム、およびプログラム 図8
  • 特開-プリフェラブル・パフォーマンス・プロファイラを生成するデータ分析方法、システム、およびプログラム 図9
  • 特開-プリフェラブル・パフォーマンス・プロファイラを生成するデータ分析方法、システム、およびプログラム 図10
  • 特開-プリフェラブル・パフォーマンス・プロファイラを生成するデータ分析方法、システム、およびプログラム 図11
  • 特開-プリフェラブル・パフォーマンス・プロファイラを生成するデータ分析方法、システム、およびプログラム 図12
  • 特開-プリフェラブル・パフォーマンス・プロファイラを生成するデータ分析方法、システム、およびプログラム 図13
  • 特開-プリフェラブル・パフォーマンス・プロファイラを生成するデータ分析方法、システム、およびプログラム 図14
  • 特開-プリフェラブル・パフォーマンス・プロファイラを生成するデータ分析方法、システム、およびプログラム 図15
  • 特開-プリフェラブル・パフォーマンス・プロファイラを生成するデータ分析方法、システム、およびプログラム 図16
  • 特開-プリフェラブル・パフォーマンス・プロファイラを生成するデータ分析方法、システム、およびプログラム 図17
  • 特開-プリフェラブル・パフォーマンス・プロファイラを生成するデータ分析方法、システム、およびプログラム 図18
< >
(19)【発行国】日本国特許庁(JP)
(12)【公報種別】公開特許公報(A)
(11)【公開番号】P2023168169
(43)【公開日】2023-11-24
(54)【発明の名称】プリフェラブル・パフォーマンス・プロファイラを生成するデータ分析方法、システム、およびプログラム
(51)【国際特許分類】
   G06F 16/906 20190101AFI20231116BHJP
【FI】
G06F16/906
【審査請求】未請求
【請求項の数】9
【出願形態】書面
(21)【出願番号】P 2022088073
(22)【出願日】2022-05-13
(71)【出願人】
【識別番号】500559204
【氏名又は名称】データ・ケーキベーカ株式会社
(72)【発明者】
【氏名】唐澤 英安
【テーマコード(参考)】
5B175
【Fターム(参考)】
5B175FA03
5B175FB04
(57)【要約】
【課題】物事(物としてのプロダクツやコンポーネントや、事としてのサービスやイベントや経験)等が実現する価値のパフォーマンス(事物の良し悪し等)の評価がどのようなアトリビュート(属性)や要因と持っているかをかを分析するべく、より好ましいパフォーマンスを得たい物事をサブジェクトとし、その個別のアイテムが持つアトリビュートの個別のアイテムについてパフォーマンスを挙げているよりプリフェラブルなパフォーマンスを挙げているサブジェクトの要因や属性等の他具体的なプロファイルを明確にすることは重要である。
【解決手段】得られた複数のサブジェクトが定量型アトリビュートと、多くアトリビュートと共に文章等に定性型アトリビュートのアイテムを持つ場合、それらの関係を統合した複数のマトリックスとして構成し、特定の次元圧縮法で、1の少数次元の直交空間に各アイテムを布置し、アイテムのクラスタリングを行う方法を開発し、より好ましい(プリフェラブル)なパフォーマンスを上げる事象のプロフィールを得る。
【選択図】図5
【特許請求の範囲】
【請求項1】
3個以上のサブジェクトアイテムからなるサブジェクトが、少なくても1個以上の定量型アトリビュートと3個以上のアトリビュートアイテムからなる1個以上のアトリビュートとを持った行列で表現可能なデータを分析する方法であって、
前記各サブジェクトアイテムと前記各アトリビュートアイテムの間の前記各アイテムの関係を示す行列で表現可能なデータを取得する第1のステップと、
前記各アイテムの間の関係を示す行列で表現可能なデータを、2次元以上の1の多次元の直交空間上に座標を定める所定の方法で計算する第2のステップと、
前記得られた各アイテムの多次元の直交空間上の座標データを使って、前記各サブジェクトアイテムそしてまたは前記各アトリビュートアイテムを所定の方法でクラスタリングする第3のステップ
をコンピュータが実行するデータ分析法。
【請求項2】
前記請求項1記載の定量型アトリビュートが、3個以上にセグメント化しアイテム化されていない場合、前記定量型アトリビュートをセグメント化しアイテム化するステップを請求項1にステップを加えた処理
をコンピュータが実行するデータ分析法。
【請求項3】
前記請求項1の前記第2ステップの2次元以上の1の多次元の直交空間上に座標を定める所定の方法で計算する方法が、固有値分解またはシンギュラー・バリュー・デコンポジション(SVD)またはゼネラライズド・シンギュラー・バリュー・デコンポジション(GSVD)または交互代入最小2乗法(ALS:Alternative Least Squares)を使う計算
をコンピュータが実行する請求項1または、請求項2に記載のデータ分析法。
【請求項4】
前記請求項1の前記第3ステップの前記各サブジェクトアイテムそしてまたは前記各アトリビュートアイテムを所定の方法でクラスタリングする方法が、
最初に前記サブジェクトアイテムまたは前記あるアトリビュートのアイテムでクラスタリングし続いて前記各クラスタのアイテムをさらにクラスタリングする方法、
または前記所定の所定の方法でクラスタリングする方法が、任意の前記直交空間上の座標の組合せで前記サブジェクトまたは前記アトリビュートのあるアイテムをクラスタリングを行い併行してこれと直交する前記直交空間の座標の組合せでクラスタリングする方法で
また前記第3ステップの前記各サブジェクトアイテムそしてまたは前記各アトリビュートアイテムを所定の方法でクラスタリングする方法が、前記直交空間の前記各サブジェクトアイテムそしてまたは前記各アトリビュートアイテムの座標の各コサイン類似度でクラスタリングを行うステップを
コンピュータが実行する請求項1または請求項2または請求項3に記載のデータ分析法。
【請求項5】
学習データから得られた前記定量型のセグメント化されたアトリビュートアイテムと、前記識学習データとは別の識別用データのサブジェクトアイテムが、前記定量型のセグメント化されたアトリビュートアイテムと最も近いかを推定する方法で、
前記識別用のサブジェクトアイテムに関する定量型アトリビュートを除く前記各アトリビュートアイテムの前記直交空間の座標の重み付平均座標を得て、前記学習データの前記定量型アトリビュートを除く前記各アトリビュートアイテムの前記直交空間の座標の重み付平均座標とのコサイン類似度が最も1に近い前記定量型のセグメント化されたアトリビュートアイテムと推定するか、
もしくは前記識別用のサブジェクトアイテムに関する定量型アトリビュートを除く前記各アトリビュートアイテムの前記直交空間の座標の重み付平均座標を得て、前記学習用データで得られた各クラスタのいずれかに最も近いかを所定の方法で推定するかのステップ をコンピュータが実行する請求項1または、請求項1に加え請求項2、請求項3、請求項4のどれかのステップにさらに追加するデータ分析法。
【請求項6】
請求項5で記載の前記学習用データで得られた各クラスタのいずれかに最も近いかを所定の方法で推定する方法が、前記学習用のデータから得られた前記各クラスタを構成するアイテムの前記直交空間の座標平均値か、前記学習用のデータから各クラスタを構成する全てのサブジェクトアイテムの前記直交空間の座標と最もコサイン類似度が1に近い前記サブジェクトアイテムが所属するクラスタを持って推定するステップを
をコンピュータが実行する請求項1または、請求項1に加え請求項2、請求項3、請求項4のどれかのステップをさらに追加するデータ分析法。
【請求項7】
請求項1に加え、中間層を形成する1個以上のアトリビュートを組合せ、前記各サブジェクトアイテムと前記中間層を形成する各アトリビュートアイテムとの関係を示す行列で表現可能なデータを取得するステップと、
前記各アイテムの間の関係を示す行列で表現可能なデータを、2次元以上の1の多次元の直交空間上に座標を定める所定の方法で計算法するステップと、前記得られた各アイテムの多次元の直交空間上の座標データを使って、コサイン類似度で前記各サブジェクトアイテムそしてまたは前記各アトリビュートアイテムを所定の方法でクラスタリングするステップと
前記得られた各クラスタをアトリビュートアイテムとする各アイテムの間の関係を示す行列で表現可能なデータとして中間層を形成し前記サブジェクトに前記中間層を含むアトリビュートとを持たせたせた行列で表現可能なデータとして分析するステップを
請求項1または、請求項1に加え請求項2、請求項3、請求項4、請求項5、請求項6のどれかのステップをさらに追加する
コンピュータが実行するデータ分析法。
【請求項8】
3個以上のサブジェクトアイテムからなるサブジェクトが、少なくても1個以上の定量型アトリビュートと3個以上のアトリビュートアイテムからなるアトリビュートとを持った行列で表現可能なデータを分析するシステムであって、
前記分析システムは、外部からの指示を受け取る操作部と記憶するメモリー部と操作部からの指示を処理部が処理し結果をメモリー部に記憶させ操作部からの指示を出す処理部からなり、
前記各サブジェクトアイテムと前記各アトリビュートアイテムの間の前記各アイテムの関係を示す行列で表現可能なデータを処理部が取得する第1の手段と、
前記各アイテム間の関係を示す行列で表現可能なデータを、2次元以上の1の多次元の直交空間上に座標を定める所定の方法で変換する計算法を処理部が実行する第2の手段と、
前記得られた各アイテムの多次元の直交空間上の座標データを使って、前記各サブジェクトアイテムそしてまたは前記各アトリビュートアイテムをコサイン類似度で前記各サブジェクトアイテムそしてまたは前記アトリビュートアイテムを所定の手段でクラスタリングする処理を処理部が実行する第3の手段と、
前記定量型アトリビュートが、3個以上にセグメント化しアイテム化されていない場合、さらにセグメント化しアイテム化することを実行する手段と、
前記第2の手段の前記各アイテムの関係を示す行列で表現可能なデータを使って前記所定の計算法が、固有値分解またはシンギュラー・バリュー・デコンポジション(SVD)またはゼネラライズド・シンギュラー・バリュー・デコンポジション(GSVD)または交互代入最小2乗法(ALS:Alternative Least Squares)を使って、サブジェクトアイテムおよびまたはアトリビュートアイテムの座標の計算を処理部が実行する手段と、
前記第3の手段の前記所定の方法でクラスタリングする手段が、最初にクラスタリングし続いて前記各クラスタのアイテムをさらにクラスタリングする手段、
または、前記所定のクラスタリングする手段が任意の前記直交空間上の座標の組合せでクラスタリングを行い併行してこれと直交する前記直交空間の座標の組合せでクラスタリングを行う処理を実行する手段と、
学習データから得られた前記定量型のセグメント化されたアトリビュートアイテムと、前記識学習データとは別の識別用データのサブジェクトアイテムが、前記定量型のセグメント化されたアトリビュートアイテムと最も近いかを推定する方法で、
前記識別用のサブジェクトアイテムに関する定量型アトリビュートを除く前記各アトリビュートアイテムの前記直交空間の座標の重み付平均座標を得て、前記学習データの前記定量型アトリビュートを除く前記各アトリビュートアイテムの前記直交空間の座標の重み付平均座標とのコサイン類似度が最も1に近い前記定量型のセグメント化されたアトリビュートアイテムと推定するか、もしくは前記識別用のサブジェクトアイテムに関する定量型アトリビュートを除く前記各アトリビュートアイテムの前記直交空間の座標の重み付平均座標を得て、前記学習用データで得られた各クラスタのいずれかに最も近いかを所定の方法で推定するかの手段を備え、
前記学習用データで得られた各クラスタのいずれかに最も近いかを所定の方法で推定する方法が、前記学習用のデータから得られた前記各クラスタを構成するアイテムの前記直交空間の座標平均値か、前記学習用のデータから各クラスタを構成する全てのサブジェクトアイテムの前記直交空間の座標と最もコサイン類似度が1に近い前記サブジェクトアイテムが所属するクラスタを持って推定する手段と、
さらに中間層を形成する1個以上のアトリビュートを組合せ、前記各サブジェクトアイテムと前記中間層を形成する各アトリビュートアイテムとの関係を示す行列で表現可能なデータを取得する手段と、
前記各アイテムの間の関係を示す行列で表現可能なデータを、2次元以上の1の多次元の直交空間上に座標を定める所定の方法で計算法するステップと、前記得られた各アイテムの多次元の直交空間上の座標データを使って、コサイン類似度で前記各サブジェクトアイテムそしてまたは前記各アトリビュートアイテムを所定の方法でクラスタリングする手段と
前記得られた各クラスタをアトリビュートアイテムとする各アイテムの間の関係を示す行列で表現可能なデータとして中間層を形成し前記サブジェクトに前記中間層を含むアトリビュートとを持たせたせた行列で表現可能なデータとして分析する手段を
請求項1または、請求項1に加え請求項2、請求項3、請求項4、請求項5、請求項6のどれかの手段をさらに
コンピュータが実行するデータ分析するシステム。
【請求項9】
3個以上のサブジェクトアイテムからなるサブジェクトが、少なくても1個以上の定量型アトリビュートと3個以上のアトリビュートアイテムからなる1個以上のアトリビュートとを持った行列で表現可能なデータを分析するプログラムであって、
前記各サブジェクトアイテムと前記各アトリビュートアイテムの間の前記各アイテムの関係を示す行列で表現可能なデータを取得する第1のステップと、
前記各アイテムの間の関係を示す行列で表現可能なデータを、2次元以上の1の多次元の直交空間上に座標を定める所定の方法で計算する第2のステップと、
前記得られた各アイテムの多次元の直交空間上の座標データを使って、前記各サブジェクトアイテムそしてまたは前記各アトリビュートアイテムを所定の方法でクラスタリングする第3のステップ
前記定量型アトリビュートが、3個以上にセグメント化しアイテム化されていない場合、前記定量型アトリビュートをセグメント化しアイテム化するステップを加え、前記第2ステップの2次元以上の1の多次元の直交空間上に座標を定める所定の方法で計算する方法が、固有値分解またはシンギュラー・バリュー・デコンポジション(SVD)またはゼネラライズド・シンギュラー・バリュー・デコンポジション(GSVD)または交互代入最小2乗法(ALS:Alternative Least Squares)を使う計算をするステップと、
前記第3ステップの前記各サブジェクトアイテムそしてまたは前記各アトリビュートアイテムを所定の方法でクラスタリングするステップが、最初に前記サブジェクトアイテムまたは前記あるアトリビュートのアイテムでクラスタリングし続いて前記各クラスタのアイテムをさらにクラスタリングする方法、または前記所定の所定の方法でクラスタリングする方法が、任意の前記直交空間上の座標の組合せで前記サブジェクトまたは前記アトリビュートのあるアイテムをクラスタリングを行い併行してこれと直交する前記直交空間の座標の組合せでクラスタリングするステップと、
また前記第3ステップの前記各サブジェクトアイテムそしてまたは前記各アトリビュートアイテムを所定の方法でクラスタリングする方法が、前記直交空間の前記各サブジェクトアイテムそしてまたは前記各アトリビュートアイテムの座標の各コサイン類似度でクラスタリングを行うステップを行い、学習データから得られた前記定量型のセグメント化されたアトリビュートアイテムと、前記識学習データとは別の識別用データのサブジェクトアイテムが、前記定量型のセグメント化されたアトリビュートアイテムと最も近いかを推定する方法で、前記識別用のサブジェクトアイテムに関する定量型アトリビュートを除く前記各アトリビュートアイテムの前記直交空間の座標の重み付平均座標を得て、前記学習データの前記定量型アトリビュートを除く前記各アトリビュートアイテムの前記直交空間の座標の重み付平均座標とのコサイン類似度が最も1に近い前記定量型のセグメント化されたアトリビュートアイテムと推定するステップか、もしくは前記識別用のサブジェクトアイテムに関する定量型アトリビュートを除く前記各アトリビュートアイテムの前記直交空間の座標の重み付平均座標を得て、前記学習用データで得られた各クラスタのいずれかに最も近いかを所定の方法で推定するかのステップと、
前記学習用データで得られた各クラスタのいずれかに最も近いかを所定の方法で推定する方法が、前記学習用のデータから得られた前記各クラスタを構成するアイテムの前記直交空間の座標平均値か、前記学習用のデータから各クラスタを構成する全てのサブジェクトアイテムの前記直交空間の座標と最もコサイン類似度が1に近い前記サブジェクトアイテムが所属するクラスタを持って推定するステップと、
また、中間層を形成する1個以上のアトリビュートを組合せ、前記各サブジェクトアイテムと前記中間層を形成する各アトリビュートアイテムとの関係を示す行列で表現可能なデータを取得するステップと、前記各アイテムの間の関係を示す行列で表現可能なデータを、2次元以上の1の多次元の直交空間上に座標を定める所定の方法で計算法するステップと、前記得られた各アイテムの多次元の直交空間上の座標データを使って、コサイン類似度で前記各サブジェクトアイテムそしてまたは前記各アトリビュートアイテムを所定の方法でクラスタリングするステップと
前記得られた各クラスタをアトリビュートアイテムとする各アイテムの間の関係を示す行列で表現可能なデータとして中間層を形成し前記サブジェクトに前記中間層を含むアトリビュートとを持たせたせた行列で表現可能なデータとして分析するステップを
請求項1または、請求項1に加え請求項2、請求項3、請求項4、請求項5、請求項6のどれかのステップをさらに追加する処置を
コンピュータが実行するデータ分析プログラム。
【発明の詳細な説明】
【技術分野】
【0001】
物事(物としてのプロダクツやコンポーネントや、事としてのサービスやイベントや経験)等が実現する価値のパフォーマンス(事物の良し悪し等)の評価がどのようなアトリビュート(属性)と相関が高いかは、ビジネスや社会でも重要な問題である。本発明は、より好ましいパフォーマンスを得たい物事をサブジェクトとし、その個別のアイテムが持つアトリビュートの個別のアイテムについてパフォーマンスを挙げているよりプリフェラブルなパフォーマンスを挙げているサブジェクトのプロファイルを明確にすることを目的としている。
【0002】
従来からデータ分析の分野では、KPI(キー・パフォーマンス・インジケータ)としての、歩留り、売上、顧客満足度や、故障率、リスク度等の計量値や計数値や順序値等の定量型の特性値を、多重回帰分析等の定量型変数で説明する方法が発達してきたが、本発明の目的である定量型特性値とテキストやノミナル(表示要因)値等の定性型変数の相関関係の全体の関係を分析する方法に関するものである。
【背景技術】
【0003】
KPIを説明する、テキストを含むデータを使った分析では、形態素分解で得えられるキーワードの数が1000またはそれをを超えるケースがあり、サブジェクト・アイテム(事例のケース)の数が不足するケースが多い。こうした正解のある問題に対し不十分なデータを使って機械学習や回帰分析等適用すると、いわゆる過剰適応をし、得られたモデルの脆弱性が避けられない。また、回帰分析では、変数間に線形結合を使うため、データの持つ本来の構造を破壊し、必要以上に目的変数への説明を強制するため、共線性により得られたモデルの偏微計数が逆の方向へのガイドを与えることになる場合すらある。
【0004】
テキストマイニングでは、テキスト内のある言語単位(文字や形態素、品詞など)がN言語単位が隣接して生じる言語単位の共起関係(collocation)で、文書の特長の一端を示すものと考えることができるN-グラム統計が使われることが多い。ただ、言語単位(たとえば文字)の全数をMとしたとき、連続するN単位の可能な組み合わせ総数はMN個になる。ある言語単位についてNグラムを求める場合にMN個のNグラムの組み合わせ表を使う方法では,Nグラムの計算はNの増加とともに膨大となる。実際、JIS漢字6400文字を含むNグラムの可能な組み合わせはN=4で1600兆にもなり、これを機械学酒や回帰分析では過学習効果は避けられないし、いわゆるNP困難問題となり、計算できない。
本発明では、サブジェクトアイテムが持つ具体的な文章単位、もしくはパラグラフ単位を分析対象とすることで、その単位内に共起するキーワードデータを使うことで、実際に有効なアプローチを実現する。
【0005】
本発明は、KPIのような定量型アトリビュートと、テキストのような定性型アトリビュートやノミナル型アトリビュート等との関係性を把握し、サブジェクトアイテムがより好ましいケースで出現している具体的文章例や具体的なアトリビュートのプロファイルを明示することで、事象のパフォーマンスをより良いアトリビュート特性へとガイドすることを可能にする頑健な方法や手段やプログラムを提供することを特徴とする。
【0006】
従来、応用統計の分野では、目的変数や最適化したいKPIや正解がある問題に対し、回帰分析や判別法のような規範的分析法が多く発展されてきた。探索的な多次元データ解析の分野では、次元圧縮法で情報圧縮する方法では、計量型変数の場合、主成分分析法やその結果をクラスタリングする方法が使われてきた。
多次元のサービス特性と多次元の顧客特性をマッチングさせる方法に繋がるデータ分析法では、マーケティングの分野を中心に、質的な変数としてノミナル変数を扱う数量化3類、Dual Scaling,Correspondence Analysis、Multiple Correspondence Analysis, Gifi System,Homoguenitey Analysis等が研究され活用が広がってきた。
最近では、非規範的で、質的なノミナル変数やテキスト変数を扱う研究も急速に進んでいるが、これらの定性型や定量型の変数をフュージョンし統合的に扱う方法の開発は、まだ発展途上である。
【0007】
これらの定性型や定量型の変数を統合的に扱う方法として、こうした次元圧縮法で情報圧縮したテキストのキーワードや文章データやその他の変数の多次元の直交空間上で、サブジェクトアイテムをクラスタ化し、その多次元意味空間上に、KPIのような定量型でもセグメント化したアイテムを布置することで、関係するアトリビュートアイテムのみならず好ましいサブジェクトアイテムのプロファイルを見ることを可能にする。
【先行技術文献】
【特許文献】
【0008】
【特許文献1】特開2019-046423 データ・ケーキベーカ株式会社
【特許文献2】特開2020-009209 データ・ケーキベーカ株式会社
【特許文献3】特開2007-334871 データ・ケーキベーカ株式会社
【特許文献4】特開2007-334865 データ・ケーキベーカ株式会社
【特許文献5】特許7002162 株式会社hitohinto
【特許文献6】特開2021-184196 富士通株式会社
【特許文献7】特開2021-096708 株式会社日立製作所
【特許文献8】特開2020-077155 日本電信電話株式会社
【特許文献9】特開2020-052514 日本電気株式会社
【非特許文献】
【0009】
【非特許文献1】「Nonlinear Multivariate Analysis」、 Albert Gifi,JOHN WIKY&SONS,1990,p.523
【0010】
【非特許文献2】唐澤英安,嵯峨根勝郎,唐澤英長,小林稔、“コンセプト・コンパス・チャートによるクラスタリング法”,日本経営工学会2017年秋季大会予稿集,pp.204-206(2017)
【0011】
【非特許文献3】唐澤英長、唐澤英安、小林 稔、ふるさと納税にみる応援したい・されたい街のマッチング度ランキング分析 ~“連環データ分析”による“Preferable Performance Profiler”の応用~ 2022年5月22日(予定)、日本経営工学会2022年春季大会予稿集(予定)
【発明の概要】
【発明が解決しようとしている課題】
【0012】
好ましい(もしくは避けたい)パフォーマンスを実現している事象の背景や環境の特徴を理解し、改善し、ブレークスルーをしたい問題は多い。
ただ、そうしたサブジェクト(事象)は、通常多くのアトリビュート(属性)をもっており、具体的な対応策を創発するためには、それらの形式的な関係を理解するだけでは難しい場合が多い。
人間が具体的に言葉で語りまた文章に記録されたサブジェクトアイテムと多くのアトリビュートアイテムを含むデータには、具体的に知的なイメージを刺激し、有効な対応策を立てることを支援できる可能性があり、そうしたデータ分析法が望まれている。
【0013】
しかし従来のデータ分析の分野では、多重回帰分析や判別分析やサポートベクターマシンの様に、目的変数と説明変数を区別することを前提にしており、全てのアトリビュートを平等に扱う研究はあまりなかったと言える。またこうしたアトリビュートを正解のある教師データとするデータ方法には、データの数が足りないで過学習が避けられないとする問題があった。
多くの場合、原因の追求に関心があるが、条件付き確率の場合、フォワードプロバビリティを考えるのに比べ、バックワードプロバビリティを考えるのはより困難であると、Causal Effect Modelを提案したJudea Pearlは指摘している。人は得てして原因を考えたくなるが、これは困難で、むしろ対策を考えた方が良い場合が多い。
ただ原因も対策も、サブジェクトアイテムの分布データから見ることができる多くのアトリビュートアイテム間の全てのアイテム間の相関関係を同時に理解することがが重要となる。
【0014】
また統計学では、こうした計量的な多くのアトリビュートや多数のノミナルなアトリビュートを含むデータを分析法は、前者は多変量解析の主成分分析等また後者はコレスポンデンス分析等で扱っている。こうした多次元データ解析の分野では、いずれも次元圧縮法で情報圧縮を行う方法が主流である。
しかし、固有値分解や特異値分解でサブジェクトアイテムをrowアイテムとし、アトリビュートアイテムをcolumアイテムとしてこれらを同一空間に布置し単純に解釈したり同時にクラスタリングすることは、これらを開発した権威筋のテキストでは、厳しく注意または禁止されてきた。
【0015】
また、定量型やテキストデータのような定性型を同時に含む多様なタイプのアトリビュートを含むデータ分析法もあまりなかったと言える。
【0016】
また従来から、複数のクロス表を分析できる多重対応分析法は、rowカテゴリが1に限られており、複数のcolumカテゴリを扱う方法は、連環データ分析しかない。また、多重対応分析法では、クロス集計表として1枚のクロス表に集約して処理し、複数のプロファイルデータを扱っていない。連環データ分析が現れるまでは、複数のrowカテゴリとcolumカテゴリのアイテムを同一空間に布置するアルゴリズムは公開されていなかった。
【0017】
rowアイテムとcolumアイテムのグループ対グループのマッチング問題を扱う方法は、多くの組合せをスキャンする方法も研究されているが、アルゴリズムも面倒で、アイテム数が増大するとNP困難問題(計算不能問題)に陥ることになり、実用的では無かった。
【0018】
〔特許文献1〕特開2019-046423 データ・ケーキベーカ社
この特許は、連環データ分析の用法として、コンセプト・コンパス・チャート法があり、得られたサブジェクトアイテムが持つテキスト情報の全てを、MECE(全てを、漏れなく背反に)分類し、多次元の意味を持った直交空間上に、可視化できる。
このさらなる用法として、コンセプト・コンパス・レーダチャート法では、意味の近いクラスタに、そのサブジェクトアイテムが持つKPI等の定量型特性を、同時布置して表現できる方法が提案されているが、よりプレファラブルなパフォーマンスを実現しているサブジェクトやその他のアトリビュートアイテムのプロファイルを明示することまでは出来ない。
【0019】
〔特許文献2〕特開2020-009209 データ・ケーキベーカ社
この特許は、連環データ分析の用法として、マッチング・マインド・マップ法があり、2群のサブジェクトからなるマッチング問題や仲介者が居る2群マッチング問題を扱っているが、サブジェクトアイテムが持つKPI等の定量型特性をよりプレファラブルなパフォーマンスを実現するマッチング問題を扱うことは出来ない。
【0020】
〔特許文献3〕特開2007-334871 データ・ケーキベーカ社
この特許は、単独のマトリックスで表現可能な多次元データをより低次元の直交空間に次元圧縮することで表現できるデータ分析法であるが、サブジェクトアイテムが持つKPI等の定量型特性をよりプレファラブルなパフォーマンスを実現するマッチング問題を扱うことは出来ない。
【0021】
〔特許文献4〕特開2007-334865 データ・ケーキベーカ社
この特許は、サブジェクトやアトリビュートを共有する複数のマトリックスで表現可能な多次元データをより低次元の直交空間に次元圧縮することで表現できるデータ分析法であるが、サブジェクトアイテムが持つKPI等の定量型特性をよりプレファラブルなパフォーマンスを実現するマッチング問題を扱うことは出来ない。
【0022】
〔特許文献5〕特許7002162 株式会社hitohinto
この特許は、サブジェクトアイテムが持つKPI等の定量型特性と言葉などの定性型データを持ったデータの関係を調べることを目的としてはいるが、多次元直交空間に各アイテムを布置しよりプレファラブルなパフォーマンスを実現する問題を扱うことは出来ない。
【0023】
〔特許文献6〕特開2021-184196 富士通株式会社
この特許は、サブジェクトアイテムが定量型特性とプリコードされたセグメント項目を前提としたマトリックスで表現可能な定性型データの関係を調べることを目的としてはいるが、多次元直交空間に各アイテムを布置しよりプレファラブルなパフォーマンスを実現する問題を扱うことは出来ない。
【0024】
〔特許文献8〕特開2021-096708 株式会社日立製作所
この特許は、KPIと相関の高い要因を特定して業務改善のための示唆を獲得することを目的としてはいるが、多次元直交空間に各アイテムを布置しよりプレファラブルなパフォーマンスを実現することを扱うことは出来ない。
【0025】
〔特許文献9〕特開2020-077155 日本電信電話株式会社
この特許は、観測データをニューラルネットワークで学習しデータを分析した結果を出力するための圧縮データを中間層をCNN(Convolutional Neural Network)モデルを用いて分析結果との誤差等を最小化するように学習する学習部を構成することを目的としているが、多次元直交空間に各アイテムを布置しよりプレファラブルなパフォーマンスを実現することを扱うことは出来ない。
【0026】
〔特許文献10〕特開2020-052514 日本電気株式会社
この特許は、データ分析手法に対応するAIエンジンを選定し、学習ログデータで分析処理を実施させるが、さらに予測ログデータを使って新たな能力を付加することを目的としており、よりプレファラブルなパフォーマンスを実現することを扱うことは出来ない。
【0027】
〔非特許文献1〕
この文献は、多次元のマトリックスで表現可能なデータを、少ない次元の直交空間に情報圧縮する方法を提供しているが、定量型と定性型データを持ったデータの多次元直交空間に各アイテムを布置しよりプレファラブルなパフォーマンスを実現する問題を扱うことまでは扱っていない。
【0028】
〔非特許文献2〕
この文献は、連環データ分析の用法として、コンセプト・コンパス・チャート法として、多次元のマトリックスで表現可能なデータを、少ない次元の直交空間に情報圧縮する方法を提供しているが、定量型と定性型データを持ったデータの多次元直交空間に各アイテムを布置しよりプレファラブルなパフォーマンスを実現する問題を扱うことまでは扱っていない。
【0029】
〔非特許文献3〕
この文献は、本件の特許発明の1つの用法を提案している。
【課題を解決するための手段】
【0030】
本発明のデータ分析を行うコンピュータのシステムの構成を図1に示す。
データ分析システムとしてのコンピュータST150が、外部から指示やデータを取得する操作部ST111と、外部とのデータや指示をやり取りする通信部ST112と、データやプログラムを記憶する記憶部ST113と、データを演算する演算部ST114と、データを出力したり表示する出力部ST115と、操作部と通信部と記憶部と出力部と演算部を制御する制御部ST110と、各機能をもつ部を繋ぐ内部バス部ST116から構成されている。
【0031】
システムの各部を使ってコンピュータの制御部が処理するデータを処理のデータ分析法の構成を図2に示す。制御部ST110は、以下3の処理を行う手段を備えている。
制御部ST110が、サブジェクトアイテムと定量型アトリビュートとアトリビュートアイテムからなるアトリビュートとを持った行列で表現可能なデータを記憶部もしくは操作部から取得し記憶部に登録する手段ST211を有する。
さらに制御部が、記憶部からサブジェクトと定量型アトリビュートと各アトリビュートアイテムを2次元以上の1の多次元の直交空間上に座標を定める所定の方法で変換する計算法を演算部が実行する演算手段ST212を有する。
さらに、制御部が、記憶部から各アイテムの多次元座標を使ってアイテムをクラスタリングして記憶部に登録する手段ST213を有する。
【0032】
システムの各部を使ってコンピュータの制御部ST110が処理するデータを処理のデータ分析の処理部の構成を図3に示す。制御部ST110は、以下3の処理を行う処理部を備えている。
制御部ST110が、サブジェクトアイテムと定量型アトリビュートとアトリビュートアイテムからなるアトリビュートとを持った行列で表現可能なデータを記憶部もしくは操作部から取得し記憶部に登録する処理を行う登録部ST311を有する。
さらに制御部が、記憶部からサブジェクトと定量型アトリビュートと各アトリビュートアイテムを2次元以上の1の多次元の直交空間上に座標を定める所定の方法で変換する計算法を処理を実行する演算部ST312を有する。
さらに、制御部が、記憶部から各アイテムの多次元座標を使ってアイテムをクラスタリングする処理を実行する演算部ST313を有する。
【0033】
本発明の第一の観点では、3個以上のサブジェクトアイテムからなるサブジェクトが、少なくても1個以上の定量型アトリビュートと3個以上のアトリビュートアイテムからなるアトリビュートとを持った行列で表現可能なデータを分析する方法であって、
前記分析システムは、外部からの指示を受け取る操作部と記憶するメモリー部と操作部からの指示を処理部が処理し結果をメモリー部に記憶させ操作部からの指示を出す処理部からなり、
前記各サブジェクトアイテムと前記各アトリビュートアイテムの間の前記各アイテムの関係を示す行列で表現可能なデータを処理部が取得する第1のステップと、
前記各アイテム間の行列で表現可能なデータを、2次元以上の1の多次元の直交空間上に座標を定める所定の方法で変換する計算法を処理部が実行する第2のステップと、
前記得られた各アイテムの多次元の直交空間上の座標データを使って、コサイン類似度で前記各サブジェクトアイテムそしてまたは前記アトリビュートアイテムを所定の手段でクラスタリングする処理を処理部が実行する第3のステップと、
前記定量型アトリビュートが、3個以上にセグメント化しアイテム化されていない場合、さらにセグメント化しアイテム化することを実行するステップと、
前記第2の手段の前記各アイテムの関係を示す行列で表現可能なデータを使って前記所定の計算法が、固有値分解またはシンギュラー・バリュー・デコンポジション(SVD)またはゼネラライズド・シンギュラー・バリュー・デコンポジション(GSVD)または交互代入最小2乗法(ALS:Alternative Least Squares)を使って、サブジェクトアイテムおよびまたはアトリビュートアイテムの座標の計算を処理部が実行するステップと、
前記第3の手段の前記所定の方法でクラスタリングする手段が、最初にクラスタリングし続いて各クラスタの幾つかに付いてさらにクラスタリングする多段階のクラスタリングをする手段または、前記所定のクラスタリングする手段が任意の前記直交空間上の座標でクラスタリングを行い併行してこれと直交する前記直交空間上の座標のコサイン類似度でクラスタリングを行う処理を実行するステップと、
学習データから、請求項1または、請求項1に加え請求項2、請求項3、請求項4のどれかのステップを加えて求めた前記各アトリビュートアイテムまたは、前記各クラスタのどれに所属したアイテムであったかを区別した属性を持つ前記各アトリビュートアイテムの前記直交空間の座標を使い、
定量型アトリビュートを持たない前記識別用データのサブジェクトアイテムの前記直交空間の座標を、前記識別用のサブジェクトアイテムに関する定量型アトリビュートを除く各アトリビュートアイテムの前記直交空間の座標の重み付平均で推定するステップと
前記推定された識別用データのサブジェクトアイテムの前記直交空間の座標を使い、最も近い前記学習用データから得られたセグメント化された定量型アトリビュートアイテムの前記直交空間の座標でセグメント化された定量型アトリビュートアイテムと同定するステップ、
もしくは前記推定された識別用データのサブジェクトアイテムの前記直交空間の座標を使い、前記学習用データで得られた各クラステーを所定の方法で同定するステップで、
記載の前記推定された識別用データのサブジェクトアイテムの前記直交空間の座標を使い、前記学習用データで得られた各クラステーを所定の方法で同定するステップが、前記学習用のデータから得られた前記各クラスタを構成するアイテムの前記直交空間の座標平均値か、前記各クラスタを構成するアイテムの前記直交空間の座標の最も近い前記アイテムが所属するクラスタを持って同定するステップ
とをコンピュータが備えデータ分析を実行するする方法である。
【0034】
本発明の第2の観点では、3個以上のサブジェクトアイテムからなるサブジェクトが、少なくても1個以上の定量型アトリビュートと3個以上のアトリビュートアイテムからなるアトリビュートとを持った行列で表現可能なデータを分析するシステムであって、
前記分析システムは、外部からの指示を受け取る操作部と記憶するメモリー部と操作部からの指示を処理部が処理し結果をメモリー部に記憶させ操作部からの指示を出す処理部からなり、
前記各サブジェクトアイテムと前記各アトリビュートアイテムの間の前記各アイテムの関係を示す行列で表現可能なデータを処理部が取得する第1の手段と、
前記各アイテム間の行列で表現可能なデータを、2次元以上の1の多次元の直交空間上に座標を定める所定の方法で変換する計算法を処理部が実行する第2の手段と、
前記得られた各アイテムの多次元の直交空間上の座標データを使って、コサイン類似度で前記各サブジェクトアイテムそしてまたは前記アトリビュートアイテムを所定の手段でクラスタリングする処理を処理部が実行する第3の手段と、
前記定量型アトリビュートが、3個以上にセグメント化しアイテム化されていない場合、さらにセグメント化しアイテム化することを実行する手段と、
前記第2の手段の前記各アイテムの関係を示す行列で表現可能なデータを使って前記所定の計算法が、固有値分解またはシンギュラー・バリュー・デコンポジション(SVD)またはゼネラライズド・シンギュラー・バリュー・デコンポジション(GSVD)または交互代入最小2乗法(ALS:Alternative Least Squares)を使って、サブジェクトアイテムおよびまたはアトリビュートアイテムの座標の計算を処理部が実行する手段と、
前記第3の手段の前記所定の方法でクラスタリングする手段が、最初にクラスタリングし続いて各クラスタの幾つかに付いてさらにクラスタリングする多段階のクラスタリングをする手段または、前記所定のクラスタリングする手段が任意の前記直交空間上の座標でクラスタリングを行い併行してこれと直交する前記直交空間上の座標のコサイン類似度でクラスタリングを行う処理を実行する手段と、
学習データから、請求項1または、請求項1に加え請求項2、請求項3、請求項4のどれかのステップを加えて求めた前記各アトリビュートアイテムまたは、前記各クラスタのどれに所属したアイテムであったかを区別した属性を持つ前記各アトリビュートアイテムの前記直交空間の座標を使い、
定量型アトリビュートを持たない前記識別用データのサブジェクトアイテムの前記直交空間の座標を、前記識別用のサブジェクトアイテムに関する定量型アトリビュートを除く各アトリビュートアイテムの前記直交空間の座標の重み付平均で推定する手段と
前記推定された識別用データのサブジェクトアイテムの前記直交空間の座標を使い、最も近い前記学習用データから得られたセグメント化された定量型アトリビュートアイテムの前記直交空間の座標でセグメント化された定量型アトリビュートアイテムと同定する手段、
もしくは前記推定された識別用データのサブジェクトアイテムの前記直交空間の座標を使い、前記学習用データで得られた各クラステーを所定の方法で同定する手段で、
記載の前記推定された識別用データのサブジェクトアイテムの前記直交空間の座標を使い、前記学習用データで得られた各クラステーを所定の方法で同定する手段が、前記学習用のデータから得られた前記各クラスタを構成するアイテムの前記直交空間の座標平均値か、前記各クラスタを構成するアイテムの前記直交空間の座標の最も近い前記アイテムが所属するクラスタを持って同定する手段を
をコンピュータが実行するデータ分析法システム。
【0035】
本発明の第3の観点からは、3個以上のサブジェクトアイテムからなるサブジェクトが、少なくても1個以上の定量型アトリビュートと3個以上のアトリビュートアイテムからなるアトリビュートとを持った行列で表現可能なデータを分析するプログラムであって、
前記分析システムは、外部からの指示を受け取る操作部と記憶するメモリー部と操作部からの指示を処理部が処理し結果をメモリー部に記憶させ操作部からの指示を出す処理部からなり、
前記各サブジェクトアイテムと前記各アトリビュートアイテムの間の前記各アイテムの関係を示す行列で表現可能なデータを処理部が取得する第1のステップと、
前記各アイテム間の行列で表現可能なデータを、2次元以上の1の多次元の直交空間上に座標を定める所定の方法で変換する計算法を処理部が実行する第2のステップと、
前記得られた各アイテムの多次元の直交空間上の座標データを使って、コサイン類似度で前記各サブジェクトアイテムそしてまたは前記アトリビュートアイテムを所定の手段でクラスタリングする処理を処理部が実行する第3のステップと、
前記定量型アトリビュートが、3個以上にセグメント化しアイテム化されていない場合、さらにセグメント化しアイテム化することを実行するステップと、
前記第2の手段の前記各アイテムの関係を示す行列で表現可能なデータを使って前記所定の計算法が、固有値分解またはシンギュラー・バリュー・デコンポジション(SVD)またはゼネラライズド・シンギュラー・バリュー・デコンポジション(GSVD)または交互代入最小2乗法(ALS:Alternative Least Squares)を使って、サブジェクトアイテムおよびまたはアトリビュートアイテムの座標の計算を処理部が実行するステップと、
前記第3の手段の前記所定の方法でクラスタリングする手段が、最初にクラスタリングし続いて各クラスタの幾つかに付いてさらにクラスタリングする多段階のクラスタリングをする手段または、前記所定のクラスタリングする手段が任意の前記直交空間上の座標でクラスタリングを行い併行してこれと直交する前記直交空間上の座標のコサイン類似度でクラスタリングを行う処理を実行するステップと、
学習データから、請求項1または、請求項1に加え請求項2、請求項3、請求項4のどれかのステップを加えて求めた前記各アトリビュートアイテムまたは、前記各クラスタのどれに所属したアイテムであったかを区別した属性を持つ前記各アトリビュートアイテムの前記直交空間の座標を使い、
定量型アトリビュートを持たない前記識別用データのサブジェクトアイテムの前記直交空間の座標を、前記識別用のサブジェクトアイテムに関する定量型アトリビュートを除く各アトリビュートアイテムの前記直交空間の座標の重み付平均で推定するステップと
前記推定された識別用データのサブジェクトアイテムの前記直交空間の座標を使い、最も近い前記学習用データから得られたセグメント化された定量型アトリビュートアイテムの前記直交空間の座標でセグメント化された定量型アトリビュートアイテムと同定するステップ、
もしくは前記推定された識別用データのサブジェクトアイテムの前記直交空間の座標を使い、前記学習用データで得られた各クラステーを所定の方法で同定するステップで、
記載の前記推定された識別用データのサブジェクトアイテムの前記直交空間の座標を使い、前記学習用データで得られた各クラステーを所定の方法で同定するステップが、前記学習用のデータから得られた前記各クラスタを構成するアイテムの前記直交空間の座標平均値か、前記各クラスタを構成するアイテムの前記直交空間の座標の最も近い前記アイテムが所属するクラスタを持って同定するステップ
をコンピュータがデータ分析を実行するするプログラムである。
【発明の効果】
【0036】
本発明によれば、好ましい(もしくは避けたい)パフォーマンスを実現している事象の背景や環境の特徴を理解し、改善しブレークスルーをしたい問題に対して、好ましい事象の定量的な属性の抽象的な理解だけでは、具体的な対応策を、イメージし発想することは困難である。
そうした人間の5感に感じたデータは、言葉で語られ、文章で具体的に記録される場合が多く、そうした知的データを役立つデータ分析法として、物事(物としてのプロダクツやコンポーネントや、事としてのサービスやイベントや経験)等の実現する価値のパフォーマンス(事物の良し悪し等)の評価がどのようなアトリビュートアイテム(個別属性)と相関が高いかは、ビジネスや社会でも重要な問題である。
ただ、そうしたサブジェクトアイテムの分布における、定量型評価指標を含む多くのアトリビュートアイテム間の多次元の相関関係の分析の方法は、従来あまり研究されてこなかったが、本発明は、より好ましいパフォーマンスを得たい物事をサブジェクトとし、その個別のアイテムが持つアトリビュートの個別のアイテムについてパフォーマンスを挙げているプリフェラブル・パフォーマンスのプロファイルを明確にすることを目的としている。
【図面の簡単な説明】
【0037】
図1】本発明のコンピュータを使ったデータ分析システムS150の構成例である.
図2】制御部が処理するデータ分析方法の手段の構成例である.
図3】制御部が処理するデータ分析システムを構成する各処理部の構成例である。
図4】本発明のプログラムの処理手順を示す処理のフロー(1)のチャートである.
図5】本発明のプログラムの処理手順で定量型のデータを処理するフロー(2)のチャートである.
図6】本発明のプログラムの処理手順で操作部からの指示で次元数、クラスタリン法を処理するフロー(3)のチャートである.
図7】*データ分析プログラムのフローチャート(4)である
図8】各街をサブジェクトとし寄付納税のアトリビュートと固有の説明文とそのキーワードを持った元のデータの部分の例である。
図9】元のデータからアトリビュートとして「使途として選択できる分野」のクロス表データ例である。
図10】元のデータから別のアトリビュートとして「実施した事業の効果分野」のクロス表データ例である。
図11】元のデータから別のアトリビュートとして定量型の一人当りの寄付収入額の10%クオンタイルのクロス表データ例である。
図12】元のデータから別のアトリビュートとして定量型の一人当りの寄付収入額の10%クオンタイルのクロス表データに連続性を持たせるためのデータ例である。
図13】サブジェクトを共有する複数の全国の街を2次元の直交座標空間に布置しクラスタリングし定量型アトリビュートを布置した出力例である。
図14】上図に加え街が活用した分野を布置した出力例である。
図15】上図の結果をクラスタと定量型アトリビュートとの対応関係のヒートマップによる確認する例である。
図16】クラスタから定量型アトリビュートを同定するための対応関係のヒートマップによる例である。
図17】KPIのトップ10ランクに入った街のプロフィール結果の例である
図18】5層のデープラーニングに加え明示的に2層の連環表を挿入して6層を構成するデータ例である。
【発明を実施するための最良の形態】
【0038】
図13]は.全国720個の街をサブジェクトとし、表[1]から表[]次元圧縮法で情報圧縮し、2次元上に布置し5個にクラスタリングしたがほぼ均等に分類されその分布が点で示されている。各街の人口1人当りのネット寄付収入で、720の街を上位からトップの10パーセンタイルをQ0.01とし、以下10%づつ刻んでQ0.10までランク付けしたデータを布置した。2次元の直交座標空間上で反時計回りに11時の方向から、順次2時の方向まで連続して布置されている。
また、この結果から、KPIと5個のクラスタに明らかな相関がみられる。
【0039】
図12]は、ふるさと納税を得た街をサブジェクトとし、募集する際に納税者にその使途として選択できる分野を示した場合、その分野をアトリビュートアイテムとした連環度データの例の一部である。0は分野として示していない場合で、1は示している場合である。
【0040】
図14]は、街の活用結果の分野の布置結果、トップのQ0.01とQ0.02にコサイン類似度が近いのは、「教育関係事業の充実」で、「その他」は最も低く、また「地域のイメージ向上」も低い。また、「子育て支援等福祉施設の充実」は、トップのQ0.01とボトムQ0.10との間にあり、コサイン類似度も両者に近いポジションである。
【0041】
図12]は、ふるさと納税を得た街をサブジェクトとし、各街が人口一人当たりに得た寄付納税から経費を引いたネットの収益をKPIとし、全国の720の街のKPIを大きさの順に10パーセンタイルから10%刻みで100パーセンタイルまで10段階にセグメント化し、これをアトリビュートアイテムとして、その該当/非該当を[1,0]の連環度データとした例の一部である。なお、Q01は、全国トップの10パーセンタイルのKPIを有し、Q02はトップから20パーセンタイルであることを示している。
【0042】
図15]の「街の活用結果の分野」の本発明の結果を検証した結果である。
図15]から、トップのQ0.01とQ0.02にコサイン類似度が近いのは、「教育関係事業の充実」であったが、CL5の2ndが高い。また「その他」は最も低かったが、CL1の5thが76と多い。また、「子育て支援等福祉施設の充実」は、CL4 1stとCL1 5thの両者で多くなっている。
この集計表をクラスタと「街の活用結果の分野」の独立性を帰無仮説とする統計的検定を実施してみると高度に有意であることが確認できる
【0043】
図16]は、KPIが日本のトップの10パーセンタイルに入った街の一部である。
納税者からは(8)子供・子育てと、(1)街づくり・市民活動が選ばれており、街としても(4)子育て支援等福祉施策の充実が多い。また、街が有効に使った自由記述のテキストにも「児童生徒、子育て世帯、保育補助者、こども医療費助成、母子訪問」等が目立つ。
こうした、より好ましいプリフェラブルなパフォーマンスを挙げている街のプロファイラーを明示することは集計表のヒートマップからも可能である。
【0044】
本発明は、システムとしているが、装置でも、サーバと通信部を使って構成される装置でも構わない。
【0045】
コサイン類似度は、多次元空間上で2本のベクトルが原点を挟んで成す角度のコサインで定義される距離である。
【0046】
本発明の結果の出力は、表示部がディスプレイや印刷等の手段で成す場合や、クラウドやメモリー部に記憶する手段を含む。
【産業上の利用可能性】
【0047】
産業では、現在多用なステークホルダーからESGなどの多面的な評価が求められる時代となっており成果を問われKPIも多様になりつつある。またそれに対する対応も形式的な計量値に基づくだけでなく、現場の声や、プロダクツでもそれが実現するサービスに対する満足度等で具体的な言葉や文章による多様な定量的なKPIを説明するモデルが求められているが、本発明はそうしたニーズに応えるものである。
図1
図2
図3
図4
図5
図6
図7
図8
図9
図10
図11
図12
図13
図14
図15
図16
図17
図18