IP Force 特許公報掲載プロジェクト 2022.1.31 β版

知財求人 - 知財ポータルサイト「IP Force」

▶ 富士通株式会社の特許一覧

特開2024-53445指標項目特定方法および指標項目特定プログラム
<>
  • 特開-指標項目特定方法および指標項目特定プログラム 図1
  • 特開-指標項目特定方法および指標項目特定プログラム 図2
  • 特開-指標項目特定方法および指標項目特定プログラム 図3
  • 特開-指標項目特定方法および指標項目特定プログラム 図4
  • 特開-指標項目特定方法および指標項目特定プログラム 図5
  • 特開-指標項目特定方法および指標項目特定プログラム 図6
  • 特開-指標項目特定方法および指標項目特定プログラム 図7
  • 特開-指標項目特定方法および指標項目特定プログラム 図8
  • 特開-指標項目特定方法および指標項目特定プログラム 図9
< >
(19)【発行国】日本国特許庁(JP)
(12)【公報種別】公開特許公報(A)
(11)【公開番号】P2024053445
(43)【公開日】2024-04-15
(54)【発明の名称】指標項目特定方法および指標項目特定プログラム
(51)【国際特許分類】
   G06Q 10/00 20230101AFI20240408BHJP
【FI】
G06Q10/00
【審査請求】未請求
【請求項の数】7
【出願形態】OL
(21)【出願番号】P 2022159740
(22)【出願日】2022-10-03
(71)【出願人】
【識別番号】000005223
【氏名又は名称】富士通株式会社
(74)【代理人】
【識別番号】110002147
【氏名又は名称】弁理士法人酒井国際特許事務所
(72)【発明者】
【氏名】粂 照宣
【テーマコード(参考)】
5L010
5L049
【Fターム(参考)】
5L010AA01
5L049AA01
(57)【要約】
【課題】データ項目の値が全て欠損している場合でも、データ項目の値を補完可能にする。
【解決手段】情報処理装置1は、因果グラフを構成する構成要素のうち、指定される指標を計算する際に必要な指標項目名と同一項目名を有する構成要素を含む経路を特定し、指標項目名のうち、因果グラフのいずれの構成要素の項目名とも一致しない指標項目名である不足指標項目名と、特定された経路に含まれる構成要素の項目名と、の類似度を算出し、算出された類似度が所定条件を満たす構成要素の項目名を出力する。例えば、企業活動を客観的に評価するためのコンサルビジネスのツールに適用される。
【選択図】図7
【特許請求の範囲】
【請求項1】
因果グラフを構成する構成要素のうち、指定される指標を計算する際に必要な指標項目名と同一項目名を有する構成要素を含む経路を特定し、
前記指標項目名のうち、前記因果グラフのいずれの構成要素の項目名とも一致しない指標項目名である不足指標項目名と、特定された経路に含まれる構成要素の項目名と、の類似度を算出し、
算出された類似度が所定条件を満たす構成要素の項目名を出力する
処理をコンピュータが実行することを特徴とする指標項目特定方法。
【請求項2】
該特定する処理は、前記指標項目名と同一項目名を有する構成要素同士を含む経路が複数存在する場合には、複数存在する経路の中から、直接接続されている経路を優先して特定する
ことを特徴とする請求項1に記載の指標項目特定方法。
【請求項3】
該特定する処理は、さらに、該特定した経路の中から、ループする経路を排除する
ことを特徴とする請求項2に記載の指標項目特定方法。
【請求項4】
該算出する処理は、
該特定された経路に含まれる構成要素の項目名のうち、前記指標項目名と一致しない構成要素の項目名を抽出し、
前記不足指標項目名と、抽出された構成要素の項目名と、の類似度を算出する
ことを特徴とする請求項1に記載の指標項目特定方法。
【請求項5】
該算出する処理は、前記不足指標項目名の単語ベクトルと、前記構成要素の項目名の単語ベクトルとを、コサイン類似度を用いて類似度を算出する
ことを特徴とする請求項4に記載の指標項目特定方法。
【請求項6】
該出力する処理は、算出された類似度が最も高い項目名を出力する
ことを特徴とする請求項1に記載の指標項目特定方法。
【請求項7】
因果グラフを構成する構成要素のうち、指定される指標を計算する際に必要な指標項目名と同一項目名を有する構成要素を含む経路を特定し、
前記指標項目名のうち、前記因果グラフのいずれの構成要素の項目名とも一致しない指標項目名である不足指標項目名と、特定された経路に含まれる構成要素の項目名と、の類似度を算出し、
算出された類似度が所定条件を満たす構成要素の項目名を出力する
処理をコンピュータに実行させることを特徴とする指標項目特定プログラム。
【発明の詳細な説明】
【技術分野】
【0001】
本発明は、指標項目特定方法などに関する。
【背景技術】
【0002】
相互関係を有する複数成分からなる観測多次元データにおける健全データ群の情報に基づいて不良データにおける不具合値に対する推定値を算出する技術が開示されている(例えば、特許文献1参照)。ここでいう健全データとは、すべての成分が正常値であるデータのことをいう。ここでいう不良データとは、一部の成分が不具合値であるデータのことをいう。
【先行技術文献】
【特許文献】
【0003】
【特許文献1】特開2014-016905号公報
【発明の概要】
【発明が解決しようとする課題】
【0004】
しかしながら、データ項目(成分)の値が取得されない場合には、そのデータ項目(成分)の値を補完できないという問題がある。すなわち、従来技術では、データ項目(成分)の値が取得されており、成分の値が不具合値である場合を想定しているが、そもそもデータ項目の値が全て取得されない(全値が欠損値の)場合には推定値を算出できない。
【0005】
本発明は、1つの側面では、データ項目の値が全て欠損している場合でも、データ項目の値を補完可能にすることを目的とする。
【課題を解決するための手段】
【0006】
1つの態様では、指標項目特定方法は、因果グラフを構成する構成要素のうち、指定される指標を計算する際に必要な指標項目名と同一項目名を有する構成要素を含む経路を特定し、前記指標項目名のうち、前記因果グラフのいずれの構成要素の項目名とも一致しない指標項目名である不足指標項目名と、特定された経路に含まれる構成要素の項目名と、の類似度を算出し、算出された類似度が所定条件を満たす構成要素の項目名を出力する、処理をコンピュータが実行する。
【発明の効果】
【0007】
1実施態様によれば、データ項目のデータが全て欠損している場合でも、データ項目のデータを補完することが可能となる。
【図面の簡単な説明】
【0008】
図1図1は、実施例に係る情報処理装置の機能構成の一例を示すブロック図である。
図2図2は、実施例に係る因果分析結果データのデータ構造の一例を示す図である。
図3図3は、実施例に係る類似度データのデータ構造の一例を示す図である。
図4図4は、因果グラフの一例を示す図である。
図5図5は、実施例に係る特定処理の一例を示す図である。
図6図6は、実施例に係る算出処理の一例を示す図である。
図7図7は、実施例に係る出力の画面例を示す図である。
図8図8は、実施例に係る指標項目特定処理のフローチャートの一例を示す図である。
図9図9は、指標項目特定プログラムを実行するコンピュータの一例を示す図である。
【発明を実施するための形態】
【0009】
以下に、本願の開示する指標項目特定方法および指標項目特定プログラムの実施例を図面に基づいて詳細に説明する。なお、本発明は、実施例により限定されるものではない。
【0010】
まず、近年、ESG(Environment Social Governance)やSDGs(Sustainable Development Goals)等の企業活動を客観的に評価するための指標が定義されている。かかる指標は、企業外の外部組織によって定義される。このため、この指標を使うために必要なデータは、企業自身が収集する必要があるが、必ずしも必要な全てのデータを企業が収集しているとは限らない。また、収集していない不足データは、企業自身に関わる内容であるため、外部から収集したデータを補完することができない。
【0011】
不足データを収集するためには、企業が、企業内のシステムを変更したり、業務フローそのものを変更したりしなければならないため、コストがかかる。また、企業が、システムや業務フローを変更したとしても、データが収集されるまでには、時間がかかる。
【0012】
そこで、必要な全てのデータがない場合には、収集しているデータのデータ項目の中で代替可能なデータ項目が推定できれば、不足データを補完することが可能になる。以降では、指標に用いられるデータ項目における値が全て欠損している場合でも、データ項目の値を補完可能にする指標項目特定方法について説明する。
【実施例0013】
図1は、実施例に係る情報処理装置の機能構成の一例を示すブロック図である。図1に示す情報処理装置1は、対象の団体で収集されたデータを用いてデータ項目の因果分析を行ったうえで、データ項目とデータ項目にはない指標で必要な指標項目(不足指標項目)との間で項目名の類似度を計測し、不足指標項目を代替する項目を提示する。ここでいう指標とは、企業活動を客観的に評価するための評価指標のことをいい、複数の指標項目から構成される。また、ここでいう因果分析とは、2つのデータ項目について、原因と結果の関係(例えば、相関関係や時間的順序関係等)を分析することをいう。また、ここでいう団体とは、例えば、企業のことをいう。以降では、対象の団体を企業として説明する。
【0014】
情報処理装置1は、制御部10と、記憶部20とを有する。制御部10は、取得部11と、因果分析部12と、特定部13と、算出部14と、出力部15とを有する。記憶部20は、データDB(Data Base)21と、因果分析結果データ22と、類似度データ23と、を有する。
【0015】
データDB21は、企業によって収集される保有データを記憶する。データDB21は、複数のデータ項目ごとのデータを記憶する。なお、データDB21は、予め生成される。
【0016】
因果分析結果データ22は、データDB21によって記憶されたデータに対して因果分析した結果を示すデータである。因果分析結果データ23には、2つのデータ項目間について、例えば、原因と結果と関係性の強さとが記憶される。なお、因果分析結果データ22は、後述する因果分析部12によって生成される。
【0017】
ここで、因果分析結果データ22のデータ構造の一例について、図2を参照して説明する。図2は、実施例に係る因果分析結果データのデータ構造の一例を示す図である。図2に示すように、因果分析結果データ22は、Source、TargetおよびWeightを対応付けた情報である。Sourceは、原因となるデータ項目名を示す。Targetは、原因に対して結果となるデータ項目名を示す。Weightは、SourceとTargetとの間の関係性の強さを示す。Weightは、例えば、重みや因果率と称しても良い。Weightは、例えば、数値で表され、数値が大きい程関係性が強いことを表す。
【0018】
一例として、Sourceが「回収量」である場合に、Targetとして「原材料」、Weightとして「10.3」を記憶している。
【0019】
図1に戻って、類似度データ23は、データDB21に記憶されたデータ項目にはない、指標で必要な指標項目と、データ項目との間の項目名の類似度を示すデータである。ここでいう指標で必要な指標項目であるが、データ項目にはない指標項目は、不足指標項目という。類似度データ23には、データDB21に記憶されたデータ項目と、不足指標項目との間の項目名の類似度が記憶される。なお、類似度データ23は、後述する算出部14によって生成される。
【0020】
ここで、類似度データ23のデータ構造の一例について、図3を参照して説明する。図3は、実施例に係る類似度データのデータ構造の一例を示す図である。図3に示すように、類似度データ23は、指標項目名、代替候補および類似度を対応付けた情報である。指標項目名は、データDB21にはない不足指標項目の名称である。代替候補は、データDB21にあるデータ項目の中で、不足指標項目を代替可能なデータ項目の候補の名称である。類似度は、不足指標項目と、代替候補との類似度である。
【0021】
一例として、指標項目名が「運搬」である場合に、代替候補として「倉庫までの距離,保管数」、類似度として「0.74」を記憶している。また、指標項目名が「運搬」である場合に、代替候補として「保管数」、類似度として「0.64」を記憶している。また、指標項目名が「運搬」である場合に、代替候補として「売上」、類似度として「0.33」を記憶している。
【0022】
図1に戻って、取得部11は、対象の指標を取得する。例えば、取得部11は、対象の指標を計算するために、当該指標を計算する際に必要な指標項目名および計算式を含む、対象の指標を取得する。ここでいう指標は、企業活動を客観的に評価するための評価指標である。指標の一例として、「CO循環率」が挙げられる。CO循環率の計算式は、例えば、「製品回収量/原材料+加工+運搬+出荷+廃棄」で表わされる。対象の指標が「CO循環率」の場合には、取得部11は、指標項目名として「製品回収量」,「原材料」,「加工」,「運搬」,「出荷」および「廃棄」、計算式として「製品回収量/原材料+加工+運搬+出荷+廃棄」を取得する。
【0023】
因果分析部12は、データDB21に記憶されたデータを用いてデータ項目の因果関係を分析する。例えば、因果分析部12は、データDB21に記憶されたデータを用いて、データ項目間の関係性を計測する。すなわち、因果分析部12は、データ項目とデータ項目との間の関係の強さを計測する。そして、因果分析部12は、計測した結果を因果分析結果データ22に格納する。なお、因果分析は、例えば、LiNGAM(Linear N on-Gaussian Acyclic Model)という因果探索の計算用ライブラリを用いて実施されれば良い。そして、因果分析部12は、因果分析結果データ22から因果グラフを生成する。
【0024】
図4は、因果グラフの一例を示す図である。図4に示すように、因果グラフは、データDB21に記憶されたデータ項目間の因果関係を表わしている。因果グラフの各構成要素について、矢印の始点に原因となるデータ項目が配置され、矢印の終点に結果となるデータ項目が配置されている。矢印の横に示す値は、関係の強さを示す重みである。一例として、原因となるデータ項目として「回収量」が配置され、結果となるデータ項目として「原材料」が配置されている。そして、関係の強さを示す重みとして「0.37」が表わされている。また、原因となるデータ項目として「原材料」が配置され、結果となるデータ項目として「売上」が配置されている。そして、関係の強さを示す重みとして「0.18」が表わされている。なお、ここで示した因果グラフは、説明の便宜上簡易に接続する例を示したが、これに限定されず、複雑に接続する場合であっても良い。
【0025】
図1に戻って、特定部13は、因果グラフを構成する構成要素のうち、取得(指定)された指標項目名と同一の項目名を有する構成要素を含む経路を特定する。例えば、特定部13は、指標の計算に必要な指標項目名を順番に2つずつ選択する。そして、特定部13は、因果グラフを参照し、選択した2つの指標項目名と同一の2つの項目名を有する2つの構成要素を開始終了とする2点間の経路を特定する。
【0026】
そして、特定部13は、選択した2つの指標項目名に対する経路が複数特定される場合には、指標項目名と同一の項目名を有する構成要素同士が直結している経路を優先する。直結している経路を優先するのは、指標項目名と同一の項目名を有する構成要素同士が直結している経路があるということは、当該構成要素同士の因果関係が高いということになるので、この間に因果関係が切れている部分が含まれておらず、不足指標項目に対応する構成要素が含まれていないと判断できるからである。これにより、特定部13は、経路の数を減らすことができ、後述する不足指標項目に代替する構成要素を探索する探索アルゴリズムをシンプルにすることができる。
【0027】
また、特定部13は、特定した全経路のうち、ループしている経路を排除する。ループしている経路を排除するのは、経路の数を減らす(探索効率の観点の)ためである。これにより、特定部13は、後述する不足指標項目に代替する構成要素を探索する探索アルゴリズムの探索効率を向上させることができる。
【0028】
算出部14は、指標項目名のうち、因果グラフのいずれの構成要素の項目名とも一致しない指標項目名である不足指標項目名と、特定された経路に含まれる構成要素の項目名と、の類似度を算出する。例えば、算出部14は、指標の計算に用いられる指標項目名のうち、因果グラフのいずれの構成要素の項目名とも一致しない指標項目名である不足指標項目名を抽出する。算出部14は、因果グラフの特定された経路に含まれる構成要素の項目名のうち、指標項目名と一致しない構成要素の項目名の経路を抽出する。算出部14は、抽出された不足指標項目名と、抽出された構成要素の項目名と、の類似度を算出する。類似度の算出処理は、例えば、Word2Vecを利用して、不足指標項目名を示す単語を特徴ベクトルに変換し、構成要素の項目名を示す単語を特徴ベクトルに変換する。そして、類似度の算出処理は、不足指標項目名を示す特徴ベクトルと、構成要素の項目を示す特徴ベクトルとを、例えば、コサイン類似度を用いて類似度を算出する。なお、類似度の算出処理方法は、これに限定されるものではなく、その他の方法であっても良い。そして、算出部14は、不足指標項目名と、構成要素の項目名と、類似度とを対応付けて類似度データ23に格納する。
【0029】
出力部15は、類似度が所定条件を満たす構成要素の項目名を出力する。例えば、出力部15は、類似度データ23を参照し、不足指標項目名との類似度が最も高い構成要素の項目名を利用者に出力する。すなわち、出力部15は、因果グラフの特定された経路に含まれる構成要素の項目の中から、不足指標項目に名称が類似している項目を選択して出力する。これにより、出力部15は、不足指標項目の代替とできる可能性の高い項目を利用者に提示することが可能となる。すなわち、出力部15は、不足している指標項目を、保有しているデータ項目の中から代替することが可能になる。
【0030】
つまり、相関関係のある指標項目については、全て因果グラフ上で接続されている可能性が高い。このため、存在している指標項目を含む経路上の項目に、不足している指標項目(不足指標項目)に名称が類似する項目が存在する可能性が高い。そこで、出力部15は、存在している指標項目を含む経路上の項目の中から、不足指標項目に名称が最も類似している項目を選択して出力することで、不足指標項目の代替とできる可能性の高い項目を利用者に提示することが可能となる。
【0031】
[特定処理の一例]
図5は、実施例に係る特定処理の一例を示す図である。なお、取得部11は、対象の指標として「CO循環率」、指標項目名として「製品回収量」,「原材料」,「加工」,「運搬」,「出荷」および「廃棄」、計算式として「製品回収量/原材料+加工+運搬+出荷+廃棄」を取得したとする。また、因果分析部12は、企業が保有している全データの因果探索を行い、因果グラフを生成したとする。生成された因果グラフが、図5に示されている。なお、因果グラフには、指標を計算する際に必要の指標項目名として「回収量」,「原材料」,「加工」,「出荷」および「廃棄」が存在する。また、因果グラフには、指標を計算する際に必要な指標項目名のうち「運搬」が存在しない。
【0032】
このような状況の下、特定部13は、因果グラフを構成する構成要素のうち、指標を計算する際に必要な指標項目名と同一項目名を有する構成要素を含む経路を特定する。そして、特定部13は、指標項目名と同一項目名を有する構成要素同士を含む経路が複数存在する場合には、複数存在する経路の中から、直結して接続されている経路を優先する。一例として、「回収量」から「原材料」に直結して接続されている経路と、「回収量」と「原材料」との間に他の項目名が接続されている経路とが存在する場合には、特定部13は、直結して接続されている経路を優先して特定する。これは、「回収量」→「原材料」の因果関係があるので、この間に因果関係が切れている部分が含まれておらず、不足指標項目に対応する構成要素が含まれていないと判断できるからである。
【0033】
また、特定部13は、経路を特定する際、ループする経路を排除する。一例として、「倉庫までの距離」配下にループする経路が存在するとする。指標項目名と同一項目名を有する2つの構成要素「原材料」と「加工」との間には、例えば、「倉庫までの距離」→「保管数」が存在する。このため、特定部13は、「倉庫までの距離」でループを代替えできると判断し、ループする経路を排除することができる。
【0034】
この結果、特定部13は、図5で示す因果グラフの中の太い矢印で表わされる経路a0を特定する。
【0035】
これにより、特定部13は、経路の数を減らすことができ、不足指標項目に代替する構成要素を探索する探索アルゴリズムをシンプルにできるとともに、探索効率を向上させることができる。
【0036】
[算出処理の一例]
図6は、実施例に係る算出処理の一例を示す図である。図6では、図5で示した指標および因果グラフを用いて説明する。
【0037】
図6に示すように、算出部14は、指標の計算に用いられる指標項目名のうち、因果グラフのいずれの構成要素の項目名とも一致しない指標項目名である不足指標項目名を抽出する。ここでは、符号b1で示す「運搬」が、不足指標項目名として抽出される。
【0038】
そして、算出部14は、因果グラフの特定された経路に含まれる構成要素の項目名のうち、指標項目名と一致しない構成要素の項目名の経路を抽出する。ここでは、符号b2で示される「原材料」と「加工」との間の「倉庫までの距離」から「保管数」への経路が抽出される。符号b3で示される「原材料」と「加工」との間の「保管数」を含む経路が抽出される。符号b4で示される「原材料」と「加工」との間の「売上」を含む経路が抽出される。
【0039】
そして、算出部14は、抽出された不足指標項目名と、抽出された経路内の構成要素の項目名と、の類似度を算出する。ここでは、算出部14は、不足指標項目名「運搬」、抽出された経路内の構成要素の項目名「倉庫までの距離」,「保管数」、「売上」の各単語を特徴ベクトルに変換する。
【0040】
そして、算出部14は、不足指標項目名「運搬」と、符号b2で示される「倉庫までの距離」および「保管数」と、の類似度を、コサイン類似度を用いて算出する。ここでは、「運搬」の特徴ベクトルと、「倉庫までの距離」の特徴ベクトルと「保管数」の特徴ベクトルとを加算して得られる特徴ベクトルとを用いて、コサイン類似度「0.74」が算出される。
【0041】
そして、算出部14は、不足指標項目名「運搬」と、符号b3で示される「保管数」と、の類似度を、コサイン類似度を用いて算出する。ここでは、「運搬」の特徴ベクトルと、「保管数」の特徴ベクトルとを用いて、コサイン類似度「0.64」が算出される。
【0042】
そして、算出部14は、不足指標項目名「運搬」と、符号b4で示される「売上」と、の類似度を、コサイン類似度を用いて算出する。ここでは、「運搬」の特徴ベクトルと、「売上」の特徴ベクトルとを用いて、コサイン類似度「0.33」が算出される。
【0043】
この後、出力部15は、類似度が最も高い構成要素の項目名を利用者に出力する。ここでは、出力部15は、「倉庫までの距離」および「保管数」を利用者に出力する。すなわち、出力部15は、存在している指標項目を含む経路上の項目の中から、不足している指標項目「運搬」に名称が最も類似している項目「倉庫までの距離」および「保管数」を選択して出力する。
【0044】
これにより、出力部15は、不足している指標項目「運搬」の代替とできる可能性の高い項目を「倉庫までの距離」および「保管数」として利用者に提示することが可能となる。つまり、出力部15は、指標項目「運搬」を「倉庫までの距離」および「運搬」に代替できる可能性があることを利用者に意識付けることができる。
【0045】
なお、この後、利用者は、「運搬」の値を、1つの例として、以下のように計算するようにしても良い。すなわち、利用者は、「倉庫までの距離」の値および「保管数」に繋がる重み(1.43)を乗じた値と、「保管数」の値および「加工」に繋がる重み(-0.01)を乗じた値とを加算して得られる値として計算しても良い。かかる計算式は、1つの例であって、これに限定されるものではない。
【0046】
[出力の一例]
図7は、実施例に係る出力の画面例を示す図である。図7の上段には、「ファイル登録」のリストボックスと、「指標登録」のリストボックスと、が表わされている。「ファイル登録」のリストボックスには、データDB21に記憶された、企業によって収集された保有データである様々なファイルが登録されている。「指標登録」のリストボックスには、様々な指標についての指標名および計算式が登録されている。
【0047】
利用者が、「ファイル登録」のリストボックスから使用するファイルを選択し、「指標登録」のリストボックスから指標を選択する。ここでは、ファイルとして「E:¥xxx¥yyy¥abcde」というファイルが選択される。指標として「CO循環率」が選択される。すると、「CO循環率」の右横には、自動的に、「CO循環率」の計算式「=製品回収量/原材料+加工+運搬+出荷+廃棄」が表示される。
【0048】
そして、因果分析部12が、選択されたファイルを用いてデータ項目の因果関係を分析し、因果グラフを生成し、生成した因果グラフを表示する。図7の中段には、因果グラフが表示されている。
【0049】
そして、特定部13が、因果グラフを構成する構成要素のうち、選択された指標を計算する際に必要な指標項目名と同一の項目名を有する構成要素を含む経路を特定する。算出部14が、指標項目名のうち、因果グラフのいずれの構成要素の項目名とも一致しない指標項目名である不足指標項目名を抽出する。ここでは、「運搬」が不足指標項目名として抽出される。算出部14は、因果グラフの特定された経路に含まれる構成要素の項目名のうち、指標項目名と一致しない構成要素の項目名の経路を抽出する。ここでは、かかる経路として、「倉庫までの距離→保管数」,「保管数」、「売上」が抽出される。算出部14は、不足指標項目名と、抽出された経路内の構成要素の項目名と、の類似度を算出する。
【0050】
そして、出力部15は、不足指標項目に名称が類似している項目を代替候補として類似度とともに表示する。ここでは、図7の下段には、類似度の算出結果が表示されている。指標項目名「運搬」に対して、代替候補が「倉庫までの距離,保管数」である場合に、類似度として「0.74」が表示されている。指標項目名「運搬」に対して、代替候補が「保管数」である場合に、類似度として「0.64」が表示されている。指標項目名「運搬」に対して、代替候補が「売上」である場合に、類似度として「0.33」が表示されている。
【0051】
これにより、利用者は、指標項目「運搬」を、類似度が最大である「倉庫までの距離」および「運搬」に代替できる可能性があることを意識することができる。この結果、利用者は、指標項目のデータが全て欠損している場合でも、代替可能性のある項目のデータを用いることで、指標項目のデータを補完することが可能となる。
【0052】
[指標項目特定処理のフローチャート]
図8は、実施例に係る指標項目特定処理のフローチャートの一例を示す図である。なお、対象の指標が取得部11によって取得される。取得部11は、対象の指標を計算する際に必要な指標項目名および計算式を含む対象の指標を取得する。
【0053】
すると、因果分析部12は、データDB21に記憶されたデータを用いてデータ項目の因果関係を分析し、因果グラフを生成する(ステップS11)。
【0054】
そして、特定部13は、対象の指標の計算に必要な指標項目から2項目を選択する(ステップS12)。そして、特定部13は、因果グラフから、選択した2項目を開始と終了とする2点間の全経路を抽出する(ステップS13)。そして、特定部13は、全ての組合せを検証したか否かを判定する(ステップS14)。全ての組合せを検証していないと判定した場合には(ステップS14;No)、特定部13は、次の2項目を選択すべく、ステップS12に移行する。
【0055】
一方、全ての組合せを検証したと判定した場合には(ステップS14;Yes)、特定部13は、指標項目が含まれる全経路を抽出する(ステップS15)。特定部13は、抽出した全経路を参照し、指標項目名と同一の項目名を有する構成要素同士が直結している経路を優先する(ステップS16)。すなわち、特定部13は、2つの指標項目名と同一の項目名を有する構成要素同士を含む経路が複数存在する場合には、直結している経路を優先する。そして、特定部13は、抽出した全経路の中からループする経路を排除する(ステップS17)。
【0056】
そして、算出部14は、排除後の経路を参照し、指標の計算に必要な、不足している指標項目(不足指標項目)を取得する(ステップS18)。算出部14は、排除後の経路から、指標の計算に必要な指標項目に含まれないデータ項目名を抽出する(ステップS19)。すなわち、算出部14は、排除後の経路に含まれる構成要素の項目名のうち、指標項目名と一致しない構成要素の項目名を抽出する。そして、算出部14は、抽出したデータ項目名と、不足している指標項目名との類似度を計算する(ステップS20)。
【0057】
そして、算出部14は、全ての経路を検証したか否かを判定する(ステップS21)。全ての経路を検証していないと判定した場合には(ステップS21;No)、算出部14は、未検証の経路を検証すべく、ステップS19に移行する。
【0058】
一方、全ての経路を検証したと判定した場合には(ステップS21;Yes)、出力部15は、類似度が最も高いデータ項目名を利用者に出力する(ステップS22)。そして、制御部10は、指標項目特定処理を終了する。
【0059】
これにより、出力部15は、不足指標項目の代替とできる可能性の高い項目を利用者に提示することが可能となる。すなわち、出力部15は、保有しているデータ項目の中から不足な指標項目を代替することが可能となる。
【0060】
[実施例の効果]
上記実施例によれば、情報処理装置1は、因果グラフを構成する構成要素のうち、指定される指標を計算する際に必要な指標項目名と同一項目名を有する構成要素を含む経路を特定する。情報処理装置1は、指標項目名のうち、因果グラフのいずれの構成要素の項目名とも一致しない指標項目名である不足指標項目名と、特定された経路に含まれる構成要素の項目名と、の類似度を算出する。情報処理装置1は、算出された類似度が所定条件を満たす構成要素の項目名を出力する。かかる構成によれば、情報処理装置1は、情報処理装置1は、因果グラフを構成する構成要素の中に指標項目名と同一の項目名の構成要素がない場合であっても、当該指標項目名の代替とできる可能性の高い項目名を特定できる。この結果、情報処理装置1は、因果グラフを構成する構成要素の中に指標項目名と同一の項目名の構成要素がない場合であっても、当該指標項目名のデータを補完することが可能となる。すなわち、情報処理装置1は、データ項目のデータが全て欠損している場合でも、データ項目のデータを補完することが可能となる。
【0061】
また、上記実施例によれば、情報処理装置1は、指標項目名と同一項目名を有する構成要素同士を含む経路が複数存在する場合には、複数存在する経路の中から、直接接続されている経路を優先して特定する。かかる構成によれば、情報処理装置1は、指標項目名と同一項目名を有する構成要素同士を含む経路から無駄な経路を排除し、経路の数を減らすことができる。この結果、情報処理装置1は、類似度を効率的に算出できる。
【0062】
また、上記実施例によれば、情報処理装置1は、さらに、特定した経路の中から、ループする経路を排除する。かかる構成によれば、情報処理装置1は、ループする経路を予め排除し、経路の数を減らすことができる。この結果、情報処理装置1は、類似度を効率的に算出できる。
【0063】
また、上記実施例によれば、情報処理装置1は、特定された経路に含まれる構成要素の項目名のうち、指標項目名と一致しない構成要素の項目名を抽出する。情報処理装置1は、不足指標項目名と、抽出された構成要素の項目名と、の類似度を算出する。かかる構成によれば、情報処理装置1は、不足指標項目を、因果グラフを構成する、指標項目名と一致しない構成の項目に代用することが可能となる。
【0064】
また、上記実施例によれば、情報処理装置1は、不足指標項目名の単語ベクトルと、構成要素の項目名の単語ベクトルとを、コサイン類似度を用いて類似度を算出する。かかる構成によれば、情報処理装置1は、コサイン類似度を用いることで、因果グラフから、不足指標項目名の単語と類似する構成要素の項目名の単語を見つけることが可能となる。
【0065】
また、上記実施例によれば、情報処理装置1は、算出された類似度が最も高い項目名を出力する。かかる構成によれば、情報処理装置1は、不足指標項目名を代替する可能性が高い項目名を利用者に提示できる。
【0066】
[その他]
なお、上記実施例では、図示した情報処理装置1の各構成要素は、必ずしも物理的に図示の如く構成されていることを要しない。すなわち、情報処理装置1の分散・統合の具体的態様は図示のものに限られず、その全部または一部を、各種の負荷や使用状況などに応じて、任意の単位で機能的または物理的に分散・統合して構成することができる。例えば、取得部11と因果分析部12とを1つの機能部に統合しても良い。また、記憶部20を情報処理装置1の外部装置としてネットワーク経由で接続するようにしても良い。さらに、制御部10および記憶部20をクラウド上に置き、利用者は端末などからネットワークを介して当該クラウドに接続して、制御部10により実行される処理を利用することも可能である。このようにすることで、本発明の処理をサービスとして提供することができるようになる。
【0067】
また、上記実施例で説明した各種の処理は、予め用意されたプログラムをパーソナルコンピュータやワークステーションなどのコンピュータで実行することによって実現することができる。そこで、以下では、図1に示した情報処理装置1と同様の機能を実現する指標項目特定プログラムを実行するコンピュータの一例を説明する。図9は、指標項目特定プログラムを実行するコンピュータの一例を示す図である。
【0068】
図9に示すように、コンピュータ200は、各種演算処理を実行するCPU(Central Processing Unit)203と、ユーザからのデータの入力を受け付ける入力装置215と、表示装置209とを有する。また、コンピュータ200は、記憶媒体からプログラムなどを読取るドライブ装置213と、ネットワークを介して他のコンピュータとの間でデータの授受を行う通信I/F(Interface)217とを有する。また、コンピュータ200は、各種情報を一時記憶するメモリ201と、HDD(Hard Disk Drive)205を有する。そして、メモリ201、CPU203、HDD205、表示装置209、ドライブ装置213、入力装置215、通信I/F217は、バス219で接続されている。
【0069】
ドライブ装置213は、例えばリムーバブルディスク211用の装置である。HDD205は、指標項目特定プログラム205aおよび指標項目特定処理関連情報205bを記憶する。通信I/F217は、ネットワークと装置内部とのインターフェースを司り、他のコンピュータからのデータの入出力を制御する。通信I/F217には、例えば、モデムやLANアダプタなどを採用することができる。
【0070】
表示装置209は、カーソル、アイコンあるいはツールボックスをはじめ、文書、画像、機能情報などのデータを表示する表示装置である。表示装置209は、例えば、液晶ディスプレイや有機EL(Electro Luminescence)ディスプレイなどを採用することができる。
【0071】
CPU203は、指標項目特定プログラム205aを読み出して、メモリ201に展開し、プロセスとして実行する。かかるプロセスは情報処理装置1の各機能部に対応する。指標項目特定処理関連情報205bには、例えば、データDB21、因果分析結果データ22および類似度データ23が含まれる。そして、例えばリムーバブルディスク211が、指標項目特定プログラム205aなどの各情報を記憶する。
【0072】
なお、指標項目特定プログラム205aについては、必ずしも最初からHDD205に記憶させておかなくても良い。例えば、コンピュータ200に挿入されるフレキシブルディスク(FD)、CD-ROM、DVDディスク、光磁気ディスク、ICカードなどの「可搬用の物理媒体」に当該プログラムを記憶させておく。そして、コンピュータ200がこれらから指標項目特定プログラム205aを読み出して実行するようにしても良い。
【0073】
また、上記実施例で説明した情報処理装置1が行う指標項目特定処理は、例えば、企業活動を客観的に評価するためのコンサルビジネスのためのツールに適用可能である。例えば、指標項目特定処理は、因果グラフの経路を使って、指標の評価値を上げるためにはどの項目の値を上げた方が良いか等の現状の理解および将来の展望についてコンサルするためのツールに適用することができる。
【0074】
以上の実施例を含む実施形態に関し、さらに以下の付記を開示する。
【0075】
(付記1)因果グラフを構成する構成要素のうち、指定される指標を計算する際に必要な指標項目名と同一項目名を有する構成要素を含む経路を特定し、
前記指標項目名のうち、前記因果グラフのいずれの構成要素の項目名とも一致しない指標項目名である不足指標項目名と、特定された経路に含まれる構成要素の項目名と、の類似度を算出し、
算出された類似度が所定条件を満たす構成要素の項目名を出力する
処理をコンピュータが実行することを特徴とする指標項目特定方法。
【0076】
(付記2)該特定する処理は、前記指標項目名と同一項目名を有する構成要素同士を含む経路が複数存在する場合には、複数存在する経路の中から、直接接続されている経路を優先して特定する
ことを特徴とする付記1に記載の指標項目特定方法。
【0077】
(付記3)該特定する処理は、さらに、該特定した経路の中から、ループする経路を排除する
ことを特徴とする付記2に記載の指標項目特定方法。
【0078】
(付記4)該算出する処理は、
該特定された経路に含まれる構成要素の項目名のうち、前記指標項目名と一致しない構成要素の項目名を抽出し、
前記不足指標項目名と、抽出された構成要素の項目名と、の類似度を算出する
ことを特徴とする付記1に記載の指標項目特定方法。
【0079】
(付記5)該算出する処理は、前記不足指標項目名の単語ベクトルと、前記構成要素の項目名の単語ベクトルとを、コサイン類似度を用いて類似度を算出する
ことを特徴とする付記4に記載の指標項目特定方法。
【0080】
(付記6)該出力する処理は、算出された類似度が最も高い項目名を出力する
ことを特徴とする付記1に記載の指標項目特定方法。
【0081】
(付記7)因果グラフを構成する構成要素のうち、指定される指標を計算する際に必要な指標項目名と同一項目名を有する構成要素を含む経路を特定し、
前記指標項目名のうち、前記因果グラフのいずれの構成要素の項目名とも一致しない指標項目名である不足指標項目名と、特定された経路に含まれる構成要素の項目名と、の類似度を算出し、
算出された類似度が所定条件を満たす構成要素の項目名を出力する
処理をコンピュータに実行させることを特徴とする指標項目特定プログラム。
【0082】
(付記8)因果グラフを構成する構成要素のうち、指定される指標を計算する際に必要な指標項目名と同一項目名を有する構成要素を含む経路を特定する特定部と、
前記指標項目名のうち、前記因果グラフのいずれの構成要素の項目名とも一致しない指標項目名である不足指標項目名と、特定された経路に含まれる構成要素の項目名と、の類似度を算出する算出部と、
算出された類似度が所定条件を満たす構成要素の項目名を出力する出力部と、
を有することを特徴とする情報処理装置。
【符号の説明】
【0083】
1 情報処理装置
10 制御部
11 取得部
12 因果分析部
13 特定部
14 算出部
15 出力部
20 記憶部
21 データDB
22 因果分析結果データ
23 類似度データ
図1
図2
図3
図4
図5
図6
図7
図8
図9