IP Force 特許公報掲載プロジェクト 2022.1.31 β版

知財求人 - 知財ポータルサイト「IP Force」

7775624変数関係表示装置、該方法および該プログラム
<>
  • -変数関係表示装置、該方法および該プログラム 図1
  • -変数関係表示装置、該方法および該プログラム 図2
  • -変数関係表示装置、該方法および該プログラム 図3
  • -変数関係表示装置、該方法および該プログラム 図4
  • -変数関係表示装置、該方法および該プログラム 図5
  • -変数関係表示装置、該方法および該プログラム 図6
  • -変数関係表示装置、該方法および該プログラム 図7
  • -変数関係表示装置、該方法および該プログラム 図8
  • -変数関係表示装置、該方法および該プログラム 図9
  • -変数関係表示装置、該方法および該プログラム 図10
  • -変数関係表示装置、該方法および該プログラム 図11
  • -変数関係表示装置、該方法および該プログラム 図12
< >
(19)【発行国】日本国特許庁(JP)
(12)【公報種別】特許公報(B2)
(11)【特許番号】
(24)【登録日】2025-11-17
(45)【発行日】2025-11-26
(54)【発明の名称】変数関係表示装置、該方法および該プログラム
(51)【国際特許分類】
   G06N 20/00 20190101AFI20251118BHJP
   G06N 5/045 20230101ALI20251118BHJP
   G06F 18/211 20230101ALI20251118BHJP
   G06F 18/40 20230101ALI20251118BHJP
【FI】
G06N20/00 130
G06N5/045
G06F18/211
G06F18/40
【請求項の数】 9
(21)【出願番号】P 2021167383
(22)【出願日】2021-10-12
(65)【公開番号】P2023057729
(43)【公開日】2023-04-24
【審査請求日】2024-08-20
(73)【特許権者】
【識別番号】000003137
【氏名又は名称】マツダ株式会社
(74)【代理人】
【識別番号】100115381
【弁理士】
【氏名又は名称】小谷 昌崇
(74)【代理人】
【識別番号】100111453
【弁理士】
【氏名又は名称】櫻井 智
(72)【発明者】
【氏名】足立 崇勝
(72)【発明者】
【氏名】目良 貢
【審査官】多賀 実
(56)【参考文献】
【文献】国際公開第2018/207259(WO,A1)
【文献】足立 崇勝 ほか,「機械学習を用いたロードノイズ予測手法およびメカニズム解明支援技術の開発」,公益社団法人自動車技術会 2021年秋季大会学術講演会予稿集 [オンライン],2021年10月08日,文献番号20216123, pp.1-6
【文献】鈴木 圭 ほか,「脳波・心拍変動指標による感情推定の特徴量比較および機械学習による精度評価」,第83回(2021年)全国大会講演論文集(4) インタフェース コンピュータと人間社会,一般社団法人情報処理学会,2021年03月04日,pp.4-103~4-104
(58)【調査した分野】(Int.Cl.,DB名)
G06F 18/00-18/40
G06N 3/00-99/00
(57)【特許請求の範囲】
【請求項1】
所定の事象をモデル化したモデルにおける所定の個数の第1成分から成る説明変数と1または複数の第2成分から成る目的変数との変数間の関係を表示する変数関係表示装置であって、
表示を行う表示部と、
前記第2成分が1つである場合には、前記説明変数と前記目的変数の第2成分との部分モデルをランダムフォレストで生成する処理を、前記目的変数の第2成分について実施することによって、複数の部分モデルから成る前記モデルを生成し、前記第2成分が複数である場合には、前記説明変数と前記目的変数の1個の第2成分との部分モデルをランダムフォレストで生成する処理を、前記目的変数の第2成分ごとに全ての前記第2成分について実施することによって、複数の部分モデルから成る前記モデルを生成するモデル生成処理を行うモデル生成部と、
前記説明変数の第1成分ごとに、前記部分モデルの不純度に基づいて、前記説明変数が前記目的変数に与える影響の大きさの程度を表す指標である重要度をそれぞれ求める重要度処理を行う重要度処理部と、
前記重要度処理部で求めた各重要度を、前記説明変数の第1成分を一方軸とすると共に前記目的変数の第2成分を他方軸とする2次元空間にマトリクス状に、前記表示部に表示する表示処理部と、
表示すべき重要度の閾値および第2成分の各入力を受け付ける入力部とを備え、
前記表示処理部は、前記入力部で受け付けた閾値以上の重要度を持つ前記説明変数の第1成分と前記目的変数の第2成分との相関係数をさらに前記表示部に表示する、
変数関係表示装置。
【請求項2】
記表示処理部は、前記入力部で受け付けた第2成分に対して前記入力部で受け付けた閾値以上の重要度を持つ前記説明変数の第1成分と、前記入力部で受け付けた第2成分と、を対応付けてその重要度と共に前記表示部に表示する、
請求項1に記載の変数関係表示装置。
【請求項3】
前記閾値以上の重要度を持つ前記説明変数の第1成分と、前記入力部で受け付けた第2成分との対応付けは、線分によって表され、前記重要度は、前記線分の太さで表され、前記相関係数は、前記線分の周囲にその数値で表される
請求項1または請求項2に記載の変数関係表示装置。
【請求項4】
前記説明変数と前記目的変数との間に介在する直列で連鎖的に並ぶ1または複数の中間変数をさらに備え、
前記モデル生成部および前記重要度処理部それぞれは、前記説明変数から前記中間変数を経て前記目的変数に至る各変数間ごとについて、前記目的変数から前記説明変数へ向けて順次に、当該変数間において前段の変数を仮に説明変数に見なすとともに後段の変数を仮に目的変数に見なして前記モデル生成処理および前記重要度処理それぞれを実施し、
前記表示処理部は、前記変数間ごとに、前記重要度処理部で求めた各重要度を前記表示部に表示する、
請求項1ないし請求項3のいずれか1項に記載の変数関係表示装置。
【請求項5】
前記説明変数における所定の個数の第1成分として、初期説明変数を構成する複数の初期成分から、前記所定の個数の初期成分を選抜する説明変数選抜部をさらに備え、
前記説明変数選抜部は、
前記複数の初期成分から、前記所定の個数の初期成分であって互いに異なる初期成分の組み合わせを持つ組を複数生成し、前記複数の組を生成する際の1個の組を生成するごとに、当該1個の組の初期成分を仮に前記説明変数の第1成分と見なして前記モデル生成部に前記モデル生成処理を行わせることによって、複数の部分モデルから成る前記モデルを前記1個の組についての候補モデルとして生成する候補生成処理を行う候補生成部と、
前記候補生成部で生成した前記複数の組それぞれに対応した複数の候補モデルの中から、所定の評価関数で最も良い評価を与える候補モデルを選定し、前記選定した候補モデルに対応した組の前記所定の個数の初期成分を前記所定の個数の第1成分として選抜する選抜処理を行う選抜部とを備え、
前記所定の評価関数は、前記候補生成部で生成した候補モデルの推定精度に基づく関数であり、
前記モデル生成部は、前記選抜部で選抜した前記所定の個数の第1成分を前記説明変数の第1成分として前記モデルを生成する、
請求項1ないし請求項3のいずれか1項に記載の変数関係表示装置。
【請求項6】
前記初期説明変数と前記目的変数との間に介在する直列で連鎖的に並ぶ1または複数の中間変数をさらに備え、
前記候補生成部および前記選抜部それぞれは、前記初期説明変数から前記中間変数を経て前記目的変数に至る各変数間ごとについて、前記目的変数から前記初期説明変数へ向けて順次に、当該変数間において前段の変数を仮に初期説明変数に見なすとともに後段の変数を仮に目的変数に見なして前記候補生成処理および前記選抜処理それぞれを実施し、
前記モデル生成部は、前記初期説明変数から前記中間変数を経て前記目的変数に至る各変数間ごとについて、前記目的変数から前記初期説明変数へ向けて順次に、当該変数間において前段の変数を仮に初期説明変数に見なすとともに後段の変数を仮に目的変数に見なして前記選抜部で選抜した前記所定の個数の第1成分を前記説明変数の第1成分として前記モデルを生成し、
前記重要度処理部は、前記初期説明変数から前記中間変数を経て前記目的変数に至る各変数間ごとについて、前記目的変数から前記初期説明変数へ向けて順次に、当該変数間において前段の変数を仮に初期説明変数に見なすとともに後段の変数を仮に目的変数に見なして前記重要度処理を実施し、
前記表示処理部は、前記変数間ごとに、前記重要度処理部で求めた各重要度を前記表示部に表示する、
請求項5に記載の変数関係表示装置。
【請求項7】
前記所定の事象は、路面の凹凸に応じたタイヤへの振動入力に起因して車両の乗員に聞こえるロードノイズである、
請求項1ないし請求項6のいずれか1項に記載の変数関係表示装置。
【請求項8】
所定の事象をモデル化したモデルにおける所定の個数の第1成分から成る説明変数と1または複数の第2成分から成る目的変数との変数間の関係を表示する変数関係表示方法であって、
前記第2成分が1つである場合には、前記説明変数と前記目的変数の第2成分との部分モデルをランダムフォレストで生成する処理を、前記目的変数の第2成分について実施することによって、複数の部分モデルから成る前記モデルを生成し、前記第2成分が複数である場合には、前記説明変数と前記目的変数の1個の第2成分との部分モデルをランダムフォレストで生成する処理を、前記目的変数の第2成分ごとに全ての前記第2成分について実施することによって、複数の部分モデルから成る前記モデルを生成するモデル生成工程と、
前記説明変数の第1成分ごとに、前記部分モデルの不純度に基づいて、前記説明変数が前記目的変数に与える影響の大きさの程度を表す指標である重要度をそれぞれ求める重要度処理工程と、
前記重要度処理工程で求めた各重要度を、前記説明変数の第1成分を一方軸とすると共に前記目的変数の第2成分を他方軸とする2次元空間にマトリクス状に、表示部に表示する表示処理工程と、
表示すべき重要度の閾値および第2成分の各入力を受け付ける入力工程とを備え、
前記表示処理工程は、前記入力工程で受け付けた閾値以上の重要度を持つ前記説明変数の第1成分と前記目的変数の第2成分との相関係数をさらに前記表示部に表示する、
変数関係表示方法。
【請求項9】
所定の事象をモデル化したモデルにおける所定の個数の第1成分から成る説明変数と1または複数の第2成分から成る目的変数との変数間の関係を表示する変数関係表示プログラムであって、
コンピュータに、
前記第2成分が1つである場合には、前記説明変数と前記目的変数の第2成分との部分モデルをランダムフォレストで生成する処理を、前記目的変数の第2成分について実施することによって、複数の部分モデルから成る前記モデルを生成し、前記第2成分が複数である場合には、前記説明変数と前記目的変数の1個の第2成分との部分モデルをランダムフォレストで生成する処理を、前記目的変数の第2成分ごとに全ての前記第2成分について実施することによって、複数の部分モデルから成る前記モデルを生成するモデル生成工程と、
前記説明変数の第1成分ごとに、前記部分モデルの不純度に基づいて、前記説明変数が前記目的変数に与える影響の大きさの程度を表す指標である重要度をそれぞれ求める重要度処理工程と、
前記重要度処理工程で求めた各重要度を、前記説明変数の第1成分を一方軸とすると共に前記目的変数の第2成分を他方軸とする2次元空間にマトリクス状に、表示部に表示する表示処理工程と、
表示すべき重要度の閾値および第2成分の各入力を受け付ける入力工程と、を実行させるための変数関係表示プログラムであって
前記表示処理工程は、前記入力工程で受け付けた閾値以上の重要度を持つ前記説明変数の第1成分と前記目的変数の第2成分との相関係数をさらに前記表示部に表示する、変数関係表示プログラム
【発明の詳細な説明】
【技術分野】
【0001】
本発明は、所定の事象をモデル化したモデルにおける1または複数の成分(因子、項目)を持つ変数間の関係を表示する変数関係表示装置、変数関係表示方法および変数関係表示プログラムに関する。
【背景技術】
【0002】
所定の事象をシミュレーション(数値実験)する場合、前記所定の事象がモデル化され、前記所定の事象に関するモデルが生成される。このモデル化には、例えばサポートベクタマシンやクラスタリングやベイズ推定やニューラルネットワーク等の様々な手法が利用されており、その1つに、例えば非特許文献1および非特許文献2等に開示されたランダムフォレストがある。
【0003】
このランダムフォレスト(Random Forest)は、アンサンブル学習の一種であり、分類および回帰に利用できる。前記ランダムフォレストは、大略、前記アンサンブル学習の弱識別器(weak classifier)となる複数の決定木(決定木群)を備え、前記複数の決定木における各結果を平均することによりモデルの出力が求められる。前記決定木の根には、入力データが入力され、前記決定木の葉には、決定木の出力結果が与えられ、前記根から前記葉の間には、1または複数の階層から成るノードが設けられる。前記ノートでは、上位ノード(根またはノード)のデータが入力され、このデータが分割関数の評価結果に応じていずれかの下位ノード(ノードまたは葉)に入力され、この処理が、前記根から前記葉に至るまで再帰的に繰り返される。前記評価関数は、教師データによって個々の決定木ごとに学習され、決定されるが、前記ランダムフォレストでは、この学習の際に、ランダム性が導入される。このランダム性の導入は、複数の学習データSから決定木の学習に用いる学習データS0(∈S)をランダムに抽出する点と、分割関数のパラメータの取り得る値の集合Tの一部T0(∈T)をランダムに選択して利用する点との2点で実施される。
【先行技術文献】
【非特許文献】
【0004】
【文献】波部斉、「ランダムフォレスト」、情報処理学会研究報告、Vol.2021-CVIM-182、No.31、2021/5/23
【文献】波部斉、「ランダムフォレストの基礎と最近の動向」、映像情報メディア学会誌、Vol70、No.5、pp.788-791(2016)
【発明の概要】
【発明が解決しようとする課題】
【0005】
ところで、所定の事象をモデル化したモデルの説明変数が複数の成分(因子、項目)(第1成分)から成り、前記モデルの目的変数が1または複数の成分(第2成分)から成る場合、説明変数の成分が目的変数の成分に与える影響の大きさの程度(影響の度合い、重要度)が可視化できれば、因果関係の把握に便利であり、前記所定の事象の解析に貢献でき、前記所定の事象を生じる製品の開発に役立つ。特に、前記説明変数と前記目的変数との間に、直列で連鎖的に並ぶ1または複数の中間変数が介在する場合には、説明変数から中間変数を経て目的変数に至る様々な多数のルートが想定できることから、説明変数から中間変数を経て目的変数に至るプロセスにおける重要なルートが可視化できると、前記所定の事象の解析に大きく貢献できる。
【0006】
本発明は、上述の事情に鑑みて為された発明であり、その目的は、所定の事象をモデル化したモデルにおける変数間の重要性の関係を表示できる変数関係表示装置、変数関係表示方法および変数関係表示プログラムを提供することである。
【課題を解決するための手段】
【0007】
本発明者は、種々検討した結果、上記目的は、以下の本発明により達成されることを見出した。すなわち、本発明の一態様にかかる変数関係表示装置は、所定の事象をモデル化したモデルにおける所定の個数の第1成分から成る説明変数と1または複数の第2成分から成る目的変数との変数間の関係を表示する装置であって、表示を行う表示部と、前記説明変数と前記目的変数の1個の第2成分との部分モデルをランダムフォレストで生成する処理を、前記目的変数の第2成分ごとに全ての前記第2成分について実施することによって、複数の部分モデルから成る前記モデルを生成するモデル生成処理を行うモデル生成部と、前記説明変数の第1成分ごとに、前記部分モデルの不純度に基づいて、前記説明変数が前記目的変数に与える影響の大きさの程度を表す指標である重要度をそれぞれ求める重要度処理を行う重要度処理部と、前記重要度処理部で求めた各重要度を、前記説明変数の第1成分を一方軸とすると共に前記目的変数の第2成分を他方軸とする2次元空間にマトリクス状に、前記表示部に表示する表示処理部とを備える。
【0008】
このような変数関係表示装置は、ランダムフォレストで、複数の部分モデルから成るモデルを生成し、説明変数の第1成分ごとに、前記部分モデルの不純度に基づいて重要度をそれぞれ求め、各重要度を、前記説明変数の第1成分を一方軸とすると共に目的変数の第2成分を他方軸とする2次元空間にマトリクス状に、表示するので、所定の事象をモデル化したモデルにおける変数間の重要性の関係を表示できる。
【0009】
他の一態様では、上述の変数関係表示装置において、表示すべき重要度の閾値および第2成分の各入力を受け付ける入力部をさらに備え、前記表示処理部は、前記入力部で受け付けた第2成分に対して前記入力部で受け付けた閾値以上の重要度を持つ前記説明変数の第1成分と、前記入力部で受け付けた第2成分と、を対応付けてその重要度と共に前記表示部に表示する。好ましくは、上述の変数関係表示装置において、前記閾値以上の重要度を持つ前記説明変数の第1成分と、前記入力部で受け付けた第2成分との対応付けは、線分(エッジ)によって表され、前記重要度は、前記線分の太さで表される。好ましくは、上述の変数関係表示装置において、前記閾値以上の重要度を持つ前記説明変数の第1成分と、前記入力部で受け付けた第2成分との対応付けは、線分(エッジ)によって表され、前記重要度は、その数値で表される。
【0010】
このような変数関係表示装置は、表示すべき重要度の閾値および第2成分の各入力を受け付ける入力部をさらに備えるので、ユーザが着目した特定の第2成分に対し、前記閾値以上の重要度を持つ第1成分を表示でき、前記特定の第2成分に対する重要な第1成分を可視化できる。
【0011】
他の一態様では、これら上述の変数関係表示装置において、前記表示処理部は、前記入力部で受け付けた閾値以上の重要度を持つ前記説明変数の第1成分と前記目的変数の第2成分との相関係数をさらに前記表示部に表示する。好ましくは、上述の変数関係表示装置において、前記閾値以上の重要度を持つ前記説明変数の第1成分と、前記入力部で受け付けた第2成分との対応付けは、線分(エッジ)によって表され、前記重要度は、前記線分の太さで表され、前記相関係数は、前記線分の周囲にその数値で表される。
【0012】
このような変数関係表示装置は、重要度に加えて相関係数をさらに表示するので、前記相関係数に基づいて、前記閾値以上の重要度を持つ前記説明変数の第1成分と、前記入力部で受け付けた第2成分との間の線形性を認識できる。前記相関係数の絶対値が大きいほど、線形性が高く、逆に、前記相関係数の絶対値が小さいほど、線形性が低い(言い換えれば、非線形性が高い)。
【0013】
他の一態様では、これら上述の変数関係表示装置において、前記説明変数と前記目的変数との間に介在する直列で連鎖的に並ぶ1または複数の中間変数をさらに備え、前記モデル生成部および前記重要度処理部それぞれは、前記説明変数から前記中間変数を経て前記目的変数に至る各変数間ごとについて、前記目的変数から前記説明変数へ向けて順次に、当該変数間において前段の変数を仮に説明変数に見なすとともに後段の変数を仮に目的変数に見なして前記モデル生成処理および前記重要度処理それぞれを実施し、前記表示処理部は、前記変数間ごとに、前記重要度処理部で求めた各重要度を前記表示部に表示する。
【0014】
このような変数関係表示装置は、原因が中間体を順次に介して結果として現れる事象をモデル化したモデルにおける各変数間の重要性の各関係を表示できる。
【0015】
他の一態様では、これら上述の変数関係表示装置において、前記説明変数における所定の個数の第1成分として、初期説明変数を構成する複数の初期成分から、前記所定の個数の初期成分を選抜する説明変数選抜部をさらに備え、前記説明変数選抜部は、前記複数の初期成分から、前記所定の個数の初期成分であって互いに異なる初期成分の組み合わせを持つ組を複数生成し、前記複数の組を生成する際の1個の組を生成するごとに、当該1個の組の初期成分を仮に前記説明変数の第1成分と見なして前記モデル生成部に前記モデル生成処理を行わせることによって、複数の部分モデルから成る前記モデルを前記1個の組についての候補モデルとして生成する候補生成処理を行う候補生成部と、前記候補生成部で生成した前記複数の組それぞれに対応した複数の候補モデルの中から、所定の評価関数で最も良い評価を与える候補モデルを選定し、前記選定した候補モデルに対応した組の前記所定の個数の初期成分を前記所定の個数の第1成分として選抜する選抜処理を行う選抜部とを備え、前記所定の評価関数は、前記候補生成部で生成した候補モデルの推定精度に基づく関数であり、前記モデル生成部は、前記選抜部で選抜した前記所定の個数の第1成分を前記説明変数の第1成分として前記モデルを生成する。
【0016】
所定の事象をモデル化する場合、その説明変数における成分の個数が、例えば数千や数万や数十万等の膨大な数になってしまう場合がある。このような場合に、必ずしも説明変数における全ての成分が同等に目的変数に影響するとは限らず、目的変数に大きく影響する重要な成分が選抜(抽出、選定)できれば、比較的簡素なモデルで前記所定の事象をモデル化でき、前記選抜が望まれる。一方、いわゆる主成分分析によって主成分を求めることにより、主成分で構成される空間は、説明変数における成分の個数で表される説明変数の次元より低次元化できるが、説明変数で構成される空間が主成分で構成される空間に変換されるため、主成分の解釈が必要になってしまう。このため、説明変数の成分のままでの前記選抜が望ましい。上記変数関係表示装置は、説明変数選抜部をさらに備え、候補生成部で生成した候補モデルの推定精度に基づく評価関数で最も良い評価を与える候補モデルを選定し、前記選定した候補モデルに対応した組の所定の個数の初期成分を、複数の初期成分から第1成分として選抜するので、前記所定の個数の第1成分をより適切に選抜できる。
【0017】
他の一態様では、上述の変数関係表示装置において、前記初期説明変数と前記目的変数との間に介在する直列で連鎖的に並ぶ1または複数の中間変数をさらに備え、前記候補生成部および前記選抜部それぞれは、前記初期説明変数から前記中間変数を経て前記目的変数に至る各変数間ごとについて、前記目的変数から前記初期説明変数へ向けて順次に、当該変数間において前段の変数を仮に初期説明変数に見なすとともに後段の変数を仮に目的変数に見なして前記候補生成処理および前記選抜処理それぞれを実施し、前記モデル生成部は、前記初期説明変数から前記中間変数を経て前記目的変数に至る各変数間ごとについて、前記目的変数から前記初期説明変数へ向けて順次に、当該変数間において前段の変数を仮に初期説明変数に見なすとともに後段の変数を仮に目的変数に見なして前記選抜部で選抜した前記所定の個数の第1成分を前記説明変数の第1成分として前記モデルを生成し、前記重要度処理部は、前記初期説明変数から前記中間変数を経て前記目的変数に至る各変数間ごとについて、前記目的変数から前記初期説明変数へ向けて順次に、当該変数間において前段の変数を仮に初期説明変数に見なすとともに後段の変数を仮に目的変数に見なして前記重要度処理を実施し、前記表示処理部は、前記変数間ごとに、前記重要度処理部で求めた各重要度を前記表示部に表示する。
【0018】
このような変数関係表示装置は、原因が中間体を順次に介して結果として現れる事象をモデル化する際に、各間の各モデルでの所定の個数の第1成分をより適切に選抜でき、各間の各モデルにおける各変数間の重要性の各関係を表示できる。
【0019】
他の一態様では、これら上述の変数関係表示装置において、前記所定の事象は、路面の凹凸に応じたタイヤへの振動入力に起因して車両の乗員に聞こえるロードノイズである。好ましくは、上述の変数関係表示装置において、前記説明変数または前記初期説明変数は、車両におけるフロントサスペンション部品およびボディ主要骨格部品における互いに異なる複数の部品板厚であり、前記目的変数は、前記乗員の耳位置における音圧伝達特性(Sound Pressure Level(SPL))であり、前記中間変数は、直列で連鎖的に並ぶ2個の第1および第2中間変数を備え、前記第1中間変数は、前記フロントサスペンション部品および前記ボディ主要骨格部品に設定された複数の点(評価点、測定点)での、加振点応答特性(ポイントイナータンス(P/I))であり、前記第2中間変数は、前記複数の点での、タイヤ接地点を加振点とした振動伝達特性(A/F)である。
【0020】
これによれば、ロードノイズをモデル化したモデルにおける変数間の重要性の関係を表示できる変数関係表示装置が提供できる。
【0021】
本発明の他の一態様にかかる変数関係表示方法は、所定の事象をモデル化したモデルにおける所定の個数の第1成分から成る説明変数と1または複数の第2成分から成る目的変数との変数間の関係を表示する方法であって、前記説明変数と前記目的変数の1個の第2成分との部分モデルをランダムフォレストで生成する処理を、前記目的変数の第2成分ごとに全ての前記第2成分について実施することによって、複数の部分モデルから成る前記モデルを生成するモデル生成工程と、前記説明変数の第1成分ごとに、前記部分モデルの不純度に基づいて、前記説明変数が前記目的変数に与える影響の大きさの程度を表す指標である重要度をそれぞれ求める重要度処理工程と、前記重要度処理工程で求めた各重要度を、前記説明変数の第1成分を一方軸とすると共に前記目的変数の第2成分を他方軸とする2次元空間にマトリクス状に、表示部に表示する表示処理工程とを備える。
【0022】
本発明の他の一態様にかかる変数関係表示プログラムは、所定の事象をモデル化したモデルにおける所定の個数の第1成分から成る説明変数と1または複数の第2成分から成る目的変数との変数間の関係を表示するプログラムであって、コンピュータに、前記説明変数と前記目的変数の1個の第2成分との部分モデルをランダムフォレストで生成する処理を、前記目的変数の第2成分ごとに全ての前記第2成分について実施することによって、複数の部分モデルから成る前記モデルを生成するモデル生成工程と、前記説明変数の第1成分ごとに、前記部分モデルの不純度に基づいて、前記説明変数が前記目的変数に与える影響の大きさの程度を表す指標である重要度をそれぞれ求める重要度処理工程と、前記重要度処理工程で求めた各重要度を、前記説明変数の第1成分を一方軸とすると共に前記目的変数の第2成分を他方軸とする2次元空間にマトリクス状に、表示部に表示する表示処理工程と、を実行させる。
【0023】
このような変数関係表示方法および変数関係表示プログラムは、ランダムフォレストで、複数の部分モデルから成るモデルを生成し、説明変数の第1成分ごとに、前記部分モデルの不純度に基づいて重要度をそれぞれ求め、各重要度を、前記説明変数の第1成分を一方軸とすると共に目的変数の第2成分を他方軸とする2次元空間にマトリクス状に、表示するので、所定の事象をモデル化したモデルにおける変数間の重要性の関係を表示できる。
【発明の効果】
【0024】
本発明にかかる変数関係表示装置、変数関係表示方法および変数関係表示プログラムは、所定の事象をモデル化したモデルにおける変数間の重要性の関係を表示できる。
【図面の簡単な説明】
【0025】
図1】実施形態における、説明変数選抜機能付き変数関係表示装置の構成を示すブロック図である。
図2】前記変数関係表示装置における部分モデルの生成を説明するための図である。
図3】重要度マップを説明するための図である。
図4】重要度グラフを説明するための図である。
図5】一例として、目的変数における指定した第2成分に対する、各変数間における重要な成分を抽出する様子を説明するための図である。
図6】説明変数の選抜および変数関係の表示に関する前記変数関係表示装置の動作を示すフローチャートである。
図7】一例として、評価対象の車両の部品を説明するための図である。
図8】一例として、評価点(測定点、データ取得点)を説明するための図である。
図9】一例として、音圧伝達特性(SPL)の比較結果を示す図である。
図10】一例として、モデルの精度を、決定係数(R)によって評価した評価結果を示す図である。
図11】一例として、目的変数における指定した第2成分に対する重要度グラフを示す図である。
図12図11における0.6以上の重要度を持つ成分を説明するための図である。
【発明を実施するための形態】
【0026】
以下、図面を参照して、本発明の1または複数の実施形態が説明される。しかしながら、発明の範囲は、開示された実施形態に限定されない。なお、各図において同一の符号を付した構成は、同一の構成であることを示し、適宜、その説明を省略する。本明細書において、総称する場合には添え字を省略した参照符号で示し、個別の構成を指す場合には添え字を付した参照符号で示す。
【0027】
実施形態における変数関係表示装置は、所定の事象をモデル化したモデルにおける所定の個数の第1成分から成る説明変数と1または複数の第2成分から成る目的変数との変数間の関係を表示する装置である。この変数関係表示装置は、表示を行う表示部と、前記説明変数と前記目的変数の1個の第2成分との部分モデルをランダムフォレストで生成する処理を、前記目的変数の第2成分ごとに全ての前記第2成分について実施することによって、複数の部分モデルから成る前記モデルを生成するモデル生成処理を行うモデル生成部と、前記説明変数の第1成分ごとに、前記部分モデルの不純度に基づいて、前記説明変数が前記目的変数に与える影響の大きさの程度を表す指標である重要度をそれぞれ求める重要度処理を行う重要度処理部と、前記重要度処理部で求めた各重要度を、前記説明変数の第1成分を一方軸とすると共に前記目的変数の第2成分を他方軸とする2次元空間にマトリクス状に、前記表示部に表示する表示処理部とを備える。以下、このような変数関係表示装置について、より具体的に説明する。
【0028】
図1は、実施形態における、説明変数選抜機能付き変数関係表示装置の構成を示すブロック図である。図2は、前記変数関係表示装置における部分モデルの生成を説明するための図である。図2Aは、初期説明変数、中間変数および目的変数を説明するための図であり、図2Bは、ランダムフォレストにより、部分モデルの生成の様子を説明するための図である。なお、図2Bにおける「Terr 1,T」、「Result 1,T」、「Terr dn,T」および「Result dn,T」の「T」は、各ランダムフォレストモデルで決定木を生成する本数を意味する。図3は、重要度マップを説明するための図である。図4は、重要度グラフを説明するための図である。図5は、一例として、目的変数における指定した第2成分に対する、各変数間における重要な成分を抽出する様子を説明するための図である。
【0029】
実施形態における変数関係表示装置Aは、所定の事象をモデル化したモデルにおける所定の個数の第1成分から成る説明変数と1または複数の第2成分から成る目的変数との変数間の関係を表示する装置であり、本実施形態では、前記説明変数における所定の個数の第1成分として、初期説明変数を構成する複数の初期成分から、前記所定の個数の初期成分を選抜する説明変数選抜機能をさらに備える。このような変数関係表示装置Aは、例えば、図1に示すように、データ取得部1と、制御処理部2と、入力部3と、表示部4と、インターフェース部5と、記憶部6とを備える。
【0030】
データ取得部1は、制御処理部2に接続され、制御処理部2の制御に従って、所定の個数の第1成分から成る説明変数と1または複数の第2成分から成る目的変数とを備えるモデルで所定の事象をモデル化するために、初期説明変数および目的変数の各データを取得する装置である。本実施形態では、データ取得部1は、前記初期説明変数と前記目的変数との間に介在する直列で連鎖的に並ぶ1または複数の中間変数のデータも、さらに取得する。これら各中間変数は、1または複数の中間成分から成る。前記中間変数は、初期説明変数(または説明変数)から目的変数に至るまでの間にある変数で、直列的に繋がっており、互いに隣接する前後の変数は、ユーザが予め設定した入出力の関係にある(前の変数が後の変数の入力であって後の変数が前の変数の出力である関係)。このユーザが予め設定した入出力の関係は、物理現象的な因果関係にある関係であってよいが、このような物理現象的な因果関係にある関係に限らず、仮説に基づく関係も含まれる。各中間変数の中間成分の個数は、同じであっても、異なってもよい。なお、変数関係表示装置Aが説明変数選抜機能を備えない場合には、前記初期説明変数のデータに代え、説明変数のデータが取得される。
【0031】
前記所定の事象は、初期説明変数における複数の初期成分および目的変数の1または複数の第2成分が数値化できれば任意の事象(事柄、現象)であってよい。本実施形態では、中間変数もあるので、前記所定の事象は、中間変数の中間成分も数値化できる事象であればよい。
【0032】
データ取得部1は、例えば、初期説明変数の初期成分のデータや中間変数の中間成分のデータや目的変数の第2成分のデータを直接的にまたは間接的に測定する測定計であってよい。前記測定計で測定した測定結果は、部分モデルを生成し、候補モデル(またはモデル)を生成するための学習用データセットに利用するために、記憶部6に記憶され、蓄積される。
【0033】
初期説明変数の初期成分のデータや中間変数の中間成分のデータや目的変数の第2成分のデータは、CAE(Computer Aided Engineering)によって得られたシミュレーション結果のデータであってもよい。あるいは、例えば、データ取得部1は、CAEによって得られたシミュレーション結果のデータを入力する入力部であってよく、この場合では、後述の入力部3と兼用されてよい。入力された前記シミュレーション結果のデータは、学習用データセットとして利用するために、記憶部6に記憶される。前記CAEは、例えば、「河野勝人他、”衝突安全開発におけるCAEの進化”、マツダ技報、No.30(2012)、151-155」に開示されており、大略、非線形解析ソフトLS-DYNA(LSTC-Livemore Software Technology Crop.)による大規模有限要素モデルのシミュレーションである。
【0034】
あるいは、例えば、データ取得部1は、外部の機器との間でデータを入出力するインターフェース回路であってよく、この場合では、前記外部の機器は、前記測定結果または前記シミュレーション結果による初期説明変数の初期成分のデータや中間変数の中間成分のデータや目的変数の第2成分のデータを記憶した記憶媒体である。前記記憶媒体は、例えばUSB(Universal Serial Bus)メモリおよびSDカード(登録商標)等である。あるいは、例えば、データ取得部1は、前記測定結果または前記シミュレーション結果による初期説明変数の初期成分のデータや中間変数の中間成分のデータや目的変数の第2成分のデータを記録した記録媒体からデータを読み込むドライブ装置であってよく、この場合では、前記記録媒体は、例えばCD-ROM(Compact Disc Read Only Memory)、CD-R(Compact Disc Recordable)、DVD-ROM(Digital Versatile Disc Read Only Memory)およびDVD-R(Digital Versatile Disc Recordable)等のである。あるいは、例えば、データ取得部1は、外部の機器と通信信号を送受信する通信インターフェース回路であってよく、この場合では、前記外部の機器は、ネットワーク(WAN(Wide Area Network、公衆通信網を含む)やLAN(Local Area Network)等)を介して前記通信インターフェース回路に接続され、前記測定結果または前記シミュレーション結果による初期説明変数の初期成分のデータや中間変数の中間成分のデータや目的変数の第2成分のデータを管理するサーバ装置である。データ取得部1が上述のインターフェース回路や通信インターフェース回路である場合では、データ取得部1は、後述のIF部5と兼用されてよい。
【0035】
入力部3は、制御処理部2に接続され、例えば変数関係表示の開始を指示するコマンド等の各種コマンド、および、例えば、モデルの名称等の、変数関係表示装置Aの稼働を行う上で必要な各種データを変数関係表示装置Aに入力する装置であり、例えば、所定の機能を割り付けられた複数の入力スイッチ、キーボードおよびマウス等である。表示部4は、制御処理部2に接続され、制御処理部2の制御に従って、入力部3から入力されたコマンドやデータ、および、変数関係等を表示する装置であり、例えばCRTディスプレイ、LCD(液晶表示装置)および有機ELディスプレイ等の表示装置等である。
【0036】
なお、入力部3および表示部4は、タッチパネルにより構成されてもよい。このタッチパネルを構成する場合において、入力部3は、例えば抵抗膜方式や静電容量方式等の操作位置を検出して入力する位置入力装置である。このタッチパネルでは、表示部4の表示面上に位置入力装置が設けられ、表示部4に入力可能な1または複数の入力内容の候補が表示され、ユーザが、入力したい入力内容を表示した表示位置に触れると、位置入力装置によってその位置が検出され、検出された位置に表示された表示内容がユーザの操作入力内容として変数関係表示装置Aに入力される。このようなタッチパネルでは、ユーザは、入力操作を直感的に理解し易いので、ユーザにとって取り扱い易い変数関係表示装置Aが提供される。
【0037】
IF部5は、制御処理部2に接続され、制御処理部2の制御に従って、例えば、外部の機器との間でデータを入出力する回路であり、例えば、シリアル通信方式であるRS-232Cのインターフェース回路、Bluetooth(登録商標)規格を用いたインターフェース回路、および、USB規格を用いたインターフェース回路等である。また、IF部5は、例えば、データ通信カードや、IEEE802.11規格等に従った通信インターフェース回路等の、外部の機器と通信信号を送受信する通信インターフェース回路であってもよい。
【0038】
記憶部6は、制御処理部2に接続され、制御処理部2の制御に従って、各種の所定のプログラムおよび各種の所定のデータを記憶する回路である。前記各種の所定のプログラムには、例えば、制御処理プログラムが含まれ、前記制御処理プログラムには、例えば、変数関係表示装置Aの各部1、3~6を当該各部の機能に応じてそれぞれ制御する制御プログラムや、前記説明変数と前記目的変数の1個の第2成分との部分モデルをランダムフォレストで生成する処理を、前記目的変数の第2成分ごとに全ての前記第2成分について実施することによって、複数の部分モデルから成る前記モデルを生成するモデル生成プログラムや、前記説明変数の第1成分ごとに、前記部分モデルの不純度に基づいて、前記説明変数が前記目的変数に与える影響の大きさの程度を表す指標である重要度をそれぞれ求める重要度処理プログラムや、前記重要度処理プログラムで求めた各重要度を、前記説明変数の第1成分を一方軸とすると共に前記目的変数の第2成分を他方軸とする2次元空間にマトリクス状に、表示部4に表示する表示処理プログラムや、前記説明変数における所定の個数の第1成分として、初期説明変数を構成する複数の初期成分から、前記所定の個数の初期成分を選抜する説明変数選抜プログラム等が含まれる。前記各種の所定のデータには、例えば、学習用データセット(前記初期説明変数の初期成分のデータ、前記中間変数の中間成分のデータおよび前記目的変数の第2成分のデータ)や前記モデルの名称等の、これら各プログラムを実行する上で必要なデータが含まれる。このような記憶部6は、例えば不揮発性の記憶素子であるROM(Read Only Memory)や書き換え可能な不揮発性の記憶素子であるEEPROM(Electrically Erasable Programmable Read Only Memory)等を備える。そして、記憶部6は、前記所定のプログラムの実行中に生じるデータ等を記憶するいわゆる制御処理部2のワーキングメモリとなるRAM(Random Access Memory)等を含む。また、記憶部6は、比較的記憶容量の大きいハードディスク装置を備えて構成されてもよい。
【0039】
制御処理部2は、変数関係表示装置Aの各部1、3~6を当該各部の機能に応じてそれぞれ制御し、所定の事象をモデル化したモデルにおける所定の個数の第1成分から成る説明変数と1または複数の第2成分から成る目的変数との変数間の関係を表示し、この表示に際し、初期説明変数を構成する複数の初期成分から、前記所定の個数の初期成分を前記第1成分として選抜し、前記選抜した第1成分の説明変数でモデルを生成するための回路である。制御処理部2は、例えば、CPU(Central Processing Unit)およびその周辺回路を備えて構成される。制御処理部2は、制御処理プログラムが実行されることによって、制御部21、モデル生成部22、重要度処理部23、表示処理部24および説明変数選抜部25を機能的に備える。
【0040】
制御部21は、変数関係表示装置Aの各部1、3~6を当該各部の機能に応じてそれぞれ制御し、変数関係表示装置Aの全体制御を司るものである。
【0041】
モデル生成部22は、前記説明変数と前記目的変数の1個の第2成分との部分モデルをランダムフォレストで生成する処理を、前記目的変数の第2成分ごとに全ての前記第2成分について実施することによって、複数の部分モデルから成る前記モデルを生成するモデル生成処理を行うものである。
【0042】
重要度処理部23は、前記説明変数の第1成分ごとに、前記部分モデルの不純度に基づいて、前記説明変数が前記目的変数に与える影響の大きさの程度を表す指標である重要度をそれぞれ求める重要度処理を行うものである。
【0043】
表示処理部24は、重要度処理部23で求めた各重要度を、前記説明変数の第1成分を一方軸とすると共に前記目的変数の第2成分を他方軸とする2次元空間にマトリクス状に、表示部4に表示するものである。
【0044】
前記所定の事象をモデル化したモデルが、前記説明変数と前記目的変数との間に介在する直列で連鎖的に並ぶ1または複数の中間変数をさらに備える場合では、モデル生成部22および重要度処理部23それぞれは、前記説明変数から前記中間変数を経て前記目的変数に至る各変数間ごとについて、前記目的変数から前記説明変数へ向けて順次に、当該変数間において前段の変数を仮に説明変数に見なすとともに後段の変数を仮に目的変数に見なして前記モデル生成処理および前記重要度処理それぞれを実施し、表示処理部24は、前記変数間ごとに、重要度処理部23で求めた各重要度を表示部4に表示する。
【0045】
本実施形態では、初期説明変数の初期成分から説明変数の第1成分を選抜する場合を例に、上述の各処理について、より具体的に説明する。
【0046】
説明変数選抜部25は、前記説明変数における所定の個数の第1成分として、初期説明変数を構成する複数の初期成分から、前記所定の個数の初期成分を選抜するものである。より具体的には、説明変数選抜部25は、候補生成部251および選抜部252を機能的に備える。
【0047】
候補生成部251は、前記複数の初期成分から、前記所定の個数の初期成分であって互いに異なる初期成分の組み合わせを持つ組を複数生成し、前記複数の組を生成する際の1個の組を生成するごとに、当該1個の組の初期成分を仮に前記説明変数の第1成分と見なしてモデル生成部22に前記モデル生成処理を行わせることによって、複数の部分モデルから成る前記モデルを前記1個の組についての候補モデルとして生成する候補生成処理を行うものである。すなわち、候補生成部251は、前記複数の初期成分から、前記所定の個数の初期成分であって互いに異なる初期成分の組み合わせを持つ組を複数生成し、前記複数の組を生成する際の1個の組を生成するごとに、モデル生成部22で、前記初期説明変数と前記目的変数の1個の第2成分との部分モデルをランダムフォレストで生成する処理を前記目的変数の第2成分ごとに全ての前記第2成分について実施することによって、前記1個の組についての、複数の部分モデルから成る候補モデルを生成する候補生成処理を行うものである。
【0048】
前記所定の個数は、初期成分の個数より小さければ、任意の個数であってよい。前記所定の個数は、予め適宜に設定されてもよいが、本実施形態では、入力部3からユーザによって入力される。
【0049】
選抜部252は、候補生成部251で生成した前記複数の組それぞれに対応した複数の候補モデルの中から、所定の評価関数で最も良い評価を与える候補モデルを選定し、前記選定した候補モデルに対応した組の前記所定の個数の初期成分を前記所定の個数の第1成分として選抜する選抜処理を行うものである。
【0050】
前記所定の評価関数は、前記候補生成部で生成した候補モデルの推定精度(予測誤差)に基づく関数である。
【0051】
モデル生成部22は、選抜部252で選抜した前記所定の個数の第1成分を前記説明変数の第1成分として前記モデルを生成する。
【0052】
本実施形態では、中間変数があるので、これら候補生成部251および選抜部252それぞれは、前記初期説明変数から前記中間変数を経て前記目的変数に至る各変数間ごとについて、前記目的変数から前記初期説明変数へ向けて順次に、当該変数間において前段の変数を仮に初期説明変数に見なすとともに後段の変数を仮に目的変数に見なして前記候補生成処理および前記選抜処理それぞれを実施する。モデル生成部22は、前記初期説明変数から前記中間変数を経て前記目的変数に至る各変数間ごとについて、前記目的変数から前記初期説明変数へ向けて順次に、当該変数間において前段の変数を仮に初期説明変数に見なすとともに後段の変数を仮に目的変数に見なして選抜部252で選抜した前記所定の個数の第1成分を前記説明変数の第1成分として前記モデルを生成する。重要度処理部23は、前記初期説明変数から前記中間変数を経て前記目的変数に至る各変数間ごとについて、前記目的変数から前記初期説明変数へ向けて順次に、当該変数間において前段の変数を仮に初期説明変数に見なすとともに後段の変数を仮に目的変数に見なして前記重要度処理を実施する。表示処理部24は、前記変数間ごとに、重要度処理部23で求めた各重要度を表示部4に表示する。
【0053】
例えば、図2Aに示すように、複数dx個の初期成分(x、x、・・・、xdx)から成る初期説明変数X、複数dy個の第2成分(y、y、・・・、ydy)から成る目的変数Y、および、複数の中間変数から成る複数n個の中間変数C、・・・、Cの場合、候補生成処理および選抜処理は、目的変数Yから初期説明変数Xへ向けて順次に、目的変数Yと中間変数Cとの変数間、中間変数Cと図略の中間変数Cn-1との変数間、・・・、図略の中間変数Cと中間変数Cとの変数間、および、中間変数Cと初期説明変数Xとの変数間それぞれで実施される。なお、図2Aに示す例では、中間変数Cは、複数であるが、1個であってよい。目的変数Yの第2成分yは、複数であるが1個であってもよい。初期説明変数Xの初期成分xの個数dx、各中間変数Cの中間成分cの個数dおよび目的変数Yの第2成分yの個数dyは、全て同一個数であってよく、互いに異なる個数であってよく、一部で同一個数であってよい。すなわち、初期成分xが複数である限り、任意である。
【0054】
この変数間の実施では、候補生成処理および選抜処理は、前段の変数を仮に初期説明変数に見なすとともに後段の変数を仮に目的変数に見なして実施される。より具体的には、例えば、目的変数Yと中間変数Cとの変数間では、前段の中間変数Cが仮に初期説明変数と見なされ、後段の目的変数Yが仮に目的変数と見なされ(仮に目的変数と見なされるがこの場合は目的変数Y自体である)、中間変数Cと図略の中間変数Cn-1との変数間では、前段の中間変数Cn-1が仮に初期説明変数と見なされ、後段の中間変数Cが仮に目的変数と見なされ、・・・、図略の中間変数Cと中間変数Cとの変数間では、前段の中間変数Cが仮に初期説明変数と見なされ、後段の中間変数Cが仮に目的変数と見なされ、中間変数Cと初期説明変数Xとの変数間では、前段の初期説明変数Xが仮に初期説明変数と見なされ(仮に初期説明変数と見なされるがこの場合は初期説明変数X自体である)、後段の中間変数Cが仮に目的変数と見なされる。
【0055】
候補生成部251は、まず、目的変数Yと中間変数Cとの変数間において、仮に初期説明変数と見なした中間変数Cにおける複数の中間成分(cn1、cn2、・・・、cndn)(仮に初期成分と見なされた中間成分)から、前記所定の個数の中間変数の組(第1組)を生成する。
【0056】
候補生成部251は、次に、モデル生成部22を用いて、この生成した1個の第1組について、初期説明変数と見なした中間変数Cと目的変数Yの1個の第2成分yとの部分モデルをランダムフォレストで生成する。これによって、前記目的変数Yの1個の第2成分yについての部分モデルが生成される。
【0057】
そして、候補生成部251は、この処理を前記目的変数Yの第2成分yごとに全ての前記第2成分yについて実施する。
【0058】
これによって、前記生成した1個の第1組についての、複数dy個の部分モデルから成る、中間変数Cと目的変数Yとの候補モデル(第1候補モデル)が生成される。
【0059】
続いて、候補生成部251は、前記生成した第1組における中間成分(仮に初期成分と見なされた中間成分)の組み合わせとは異なる別の中間成分の組み合わせの組(第2組)を生成し、これら上述の各処理を実施する。これによって、前記生成した1個の第2組についての、複数dy個の部分モデルから成る、中間変数Cと目的変数Yとの候補モデル(第2候補モデル)が生成される。
【0060】
続いて、候補生成部251は、前記生成した第1および第2組における中間成分(仮に初期成分と見なされた中間成分)の各組み合わせとは異なる別の中間成分の組み合わせの組(第3組)を生成し、これら上述の各処理を実施する。これによって、前記生成した1個の第3組についての、複数dy個の部分モデルから成る、中間変数Cと目的変数Yとの候補モデル(第3候補モデル)が生成される。
【0061】
このような上述の処理が複数の組について実施され、これによって、例えば図2Bに示す複数の組それぞれに対応した複数の候補モデルが生成される。
【0062】
前記複数の組は、所定の個数の初期成分における全ての組み合わせについて生成されてもよいが、近似解または最適解を得るために、前記組の個数がユーザによって適宜に設定され、複数の初期成分から、無作為に前記所定の個数の初期成分が抽出されることでユーザが設定した個数の組が生成されてもよい。本実施形態では、後述するように、これら生成処理および選抜処理を抽出問題に帰着させ、いわゆる遺伝的アルゴリズムが用いられている。
【0063】
選抜部252は、上述のように候補生成部251で生成した複数の組それぞれに対応した複数の候補モデルそれぞれについて、前記所定の評価関数で評価値を求める。本実施形態では、前記所定の評価関数は、推定精度(予測誤差)であり、組における所定の個数の中間成分cを各部分モデルそれぞれに入力することによって求められた各第2成分の推定値(予測値)y^それぞれから、各第2成分の各値yそれぞれを減算することによって得られた各第2成分の各推定精度(各予測誤差)の平均値(各第2成分の各推定精度の総和を第2成分の総数dyで除算した除算結果)である(評価値q=(Σ(y^-y))/dy、評価値qが小さいほど評価が高い)。
【0064】
そして、選抜部252は、これら推定精度(評価値q)を比較し、最も良い評価を与える候補モデルを選定し、この選定した候補モデルに対応した組の前記所定の個数の中間成分cを前記所定の個数の第1成分として選抜する。
【0065】
これによって目的変数Yと中間変数Cとの変数間におけるモデルの第1成分が選抜される。
【0066】
そして、このような上述の各処理が、各変数間で目的変数から初期説明変数へ向けて順次に実施され、各変数間の各モデルの第1成分が選抜される。
【0067】
以上の、所定の個数の第1成分を選抜する処理は、次のように帰着できる。
【0068】
今、a個の変数とそのc通りの値の組み合わせサンプルから成るc×a行列がUとされ、Uからb個(b<a)の列だけ部分抽出したc×b行列がU’とされ、このU’とは別のc×d行列を表す目的変数がVとされる。行列U’を入力とし行列Vのq個(q≦d)の列をユーザが指定して出力としたランダムフォレスト回帰モデルを指定したときの推定精度(予測誤差)(合計q個分)を平均したものが次式1で表されるように目的関数Qと定義される。
【0069】
【数1】
ここで、V^[i、j]は、V[i、j]の推定値を表し、H={i、i、・・・、i}⊂{1、2、・・・、d}は、ユーザが指定した列に相当するインデックスiの集合である。例えばd=100であってユーザが6、24、30、50、80を指定した場合、H={6、24、30、50、80}となる。なお、式1でV上に記載される^は、記載の都合上、ここでは、「V^」と記載する。
【0070】
この目的関数Qを最小化するような最良の行列U’の抽出問題(すなわち、行列Uの列から最良のb個を選んで行列U’へと変換する組み合わせ最適化問題)を例えば遺伝的アルゴリズムを用いて解くことが実行される。前記遺伝的アルゴリズムは、通常、近似解の探索に利用される公知のアルゴリズムであり、大略、候補の個体を複数用意し、適応度の高い個体を優先的に選択して交叉や変異等の操作を繰り返しながら(世代交代しながら)解を探索する手法である。
【0071】
図1に戻って、モデル生成部22は、前記初期説明変数から前記中間変数を経て前記目的変数に至る各変数間ごとについて、前記目的変数から前記初期説明変数へ向けて順次に、当該変数間において前段の変数を仮に初期説明変数に見なすとともに後段の変数を仮に目的変数に見なして、選抜部252で選抜した前記所定の個数の第1成分を説明変数の第1成分として当該変数間のモデルを生成する。前記学習用データセットを用いて当該変数間のモデルが生成されてよく、あるいは、選抜部252で選定された最も良い評価を与える候補モデルが、当該変数間のモデルとされてよい。
【0072】
重要度処理部23は、前記初期説明変数から前記中間変数を経て前記目的変数に至る各変数間ごとについて、前記目的変数から前記初期説明変数へ向けて順次に、当該変数間において前段の変数を仮に初期説明変数に見なすとともに後段の変数を仮に目的変数に見なして、前記説明変数の第1成分ごとに、当該変数間のモデルにおける部分モデルの不純度に基づいて、当該変数間の重要度をそれぞれ求める。ランダムフォレストを実施するアルゴリズムは、例えばID3(Iterative Dichotomiser 3)、C4.5、C5.0、CARTおよびCHAID等があるが、例えば、CARTを用いる場合、個々の決定木は、各分岐においてジニ係数(Gini係数)の減少量を情報利得として最大化するように説明変数の条件を選び出し、その条件に従ってサンプル(上位ノードからの入力)を2つに分けることを繰り返している。前記不純度は、分岐の前後における誤差の改善度を表し、ジニ係数では、不純度△GI(t)は、ジニ係数の減少量(ジニ不純度)であり、△GI(t)=PGI(t)-PGI(t)-PGI(t)となり、ジニ係数GI(t)は、GI(t)=1-Σp(k|t)で表される(Σはkについて和を求める演算子である)。ここで、p(k|t)は、ノードt内のクラスkが正しく分類されている比率であり、GI(t)は、ノードの左側の枝のジニ係数であり、GI(t)は、ノードの右側の枝のジニ係数であり、Pは、分割前のサンプル数の比率であり、Pは、分割後の左側のサンプルの比率であり、Pは、分割後の右側のサンプルの比率である。上述のように生成される部分モデルの決定木群において、前記選抜された各第1成分によるジニ不純度の平均値は、第2成分の決定に対する各第1成分の重要度として扱うことができる。このため、本実施形態では、重要度処理部23は、前記選抜された各第1成分によるジニ不純度の平均値を求め、その0以上1以下に正規化した値を前記重要度として求める。
【0073】
そして、表示処理部24は、前記変数間ごとに、重要度処理部23で求めた各重要度を、前記説明変数の第1成分を一方軸とすると共に前記目的変数の第2成分を他方軸とする2次元空間にマトリクス状に、重要度マップ(重要度ヒートマップ)として表示部4に表示する。その1例が図3に示されている。図3には、中間変数Cn-1と中間変数Cとの変数間における重要度が図示されており、前段の中間変数Cn-1が仮に説明変数と見なされ、一方軸の縦軸とされ、後段の中間変数Cが仮に目的変数と見なされ、他方軸の横軸とされている。縦軸には、中間変数Cn-1と中間変数Cとの変数間で前記所定の個数の第1成分として選抜された中間変数Cn-1における所定の個数の中間成分が並び、横軸には、中間変数Cと目的変数Yとの変数間で前記所定の個数の第1成分として選抜された中間変数Cにおける所定の個数の中間成分が並んでいる。重要度の各値は、グレースケール(濃淡)で表され、最も濃い黒色が1であり、最も薄い白色が0である。
【0074】
そして、本実施形態では、入力部3は、さらに、表示すべき重要度の閾値および第2成分の各入力を受け付け、表示処理部24は、さらに、入力部3で受け付けた第2成分に対して前記入力部3で受け付けた閾値以上の重要度を持つ前記説明変数の第1成分と、前記入力部3で受け付けた第2成分と、を対応付けてその重要度と共に表示部4に表示する。より具体的には、前記閾値以上の重要度を持つ前記説明変数の第1成分と、前記入力部3で受け付けた第2成分との対応付けは、線分(エッジ)によって表され、前記重要度は、前記線分の太さで表される。その1例が図4の、平面視にて左側に示されている。図4の、平面視にて右側には、中間変数C’ k-1と中間変数C”との変数間における重要度マップが示されている。図4に示す例では、中間変数C”における第m番目の中間変数mthが前記表示すべき第2成分として指定されて入力され、0.6が前記表示すべき重要度の閾値として指定されて入力されており、中間変数C’ k-1における第1番目、第3番目および第16番目の中間変数C’ k-1[1]、C’ k-1[3]、C’ k-1[16]が0.6以上の重要度を持つ第1成分として抽出され、第1番目の中間変数C’ k-1[1]を表すノードND’ k-1[1]が第m番目の中間変数C”[m]を表すノードND”[m]と線分LN1で対応付けられ、第3番目の中間変数C’ k-1[3]を表すノードND’ k-1[3]が前記ノードND”[m]と線分LN2で対応付けられ、第16番目の中間変数C’ k-1[16]を表すノードND’ k-1[16]が前記ノードND”[m]と線分LN3で対応付けられている。重要度の値が大きいほど、線分LNの太さが太い(重要度の値が小さいほど、線分LNの太さが細い)。なお、重要度の表示態様は、線分の太さで表す表示態様に限らず、あるいは、例えば、前記重要度は、前記線分LNからの引き出し線や前記線分の周囲の配置等により前記線分LNに対応付けて、その数値で直接的に表されてもよい。
【0075】
中間変数がある場合、この入力部3で受け付けた第2成分に対して前記入力部3で受け付けた閾値以上の重要度を持つ成分の選択は、図5に示すように、実行される。図5の上段には、説明変数Xと第1中間変数Cとの変数間における重要度マップ(第1重要度マップ;X→C)が図示され、図5の中段には、第1中間変数Cと第2中間変数Cとの変数間における重要度マップ(第2重要度マップ;C→C)が図示され、図5の下段には、第2中間変数Cと目的変数Yとの変数間における重要度マップ(第3重要度マップ;C→Y)が図示されている。第3重要度マップ;C→Yの横軸には、目的変数Yの各第2成分yが1~dyまで順次に並び、その縦軸には、第2中間変数Cと目的変数Yとの変数間で第1成分として選抜された第2中間変数Cの各第2中間成分cが1~βまで順次に並んでいる。第2重要度マップ;C→Cの横軸には、第3重要度マップ;C→Yの縦軸に並んでいた第2中間変数Cの各第2中間成分cが1~βまで順次に並び、その縦軸には、第1中間変数Cと第2中間変数Cとの変数間で第1成分として選抜された第1中間変数Cの各第1中間成分cが1~αまで順次に並んでいる。第1重要度マップ;X→Cの横軸には、第2重要度マップ;C→Cの縦軸に並んでいた第1中間変数Cの各第1中間成分cが1~αまで順次に並び、その縦軸には、説明変数Xと第1中間変数Cとの変数間で第1成分として選抜された説明変数Xの各第1成分xが1~28まで順次に並んでいる。各変数間での第1成分を選抜する前記所定の個数が例えば250である場合には、α=β=250となる。表示すべき重要度の閾値が0.6であって、表示すべき第2成分がYである場合、まず、第3重要度マップ;C→Yの横軸に並ぶ各第2成分の中からYが選択され、この選択されたYの列に並ぶ各重要度の中から0.6以上の重要度が選択され、この0.6以上の重要度を持つ第2中間成分cが選択される。図5に示す例では、1個の第2中間成分c2eが選択されている。続いて、第2重要度マップ;C→Cの横軸に並ぶ第2中間変数Cの各第2中間成分cから、第2中間成分c2eが選択され、この選択された第2中間成分c2eの列に並ぶ各重要度の中から0.6以上の重要度が選択され、この0.6以上の重要度を持つ第1中間成分cが選択される。図5に示す例では、1個の第1中間成分c1eが選択されている。そして、第1重要度マップ;X→Cの横軸に並ぶ第1中間変数Cの各第1中間成分cから、第1中間成分c1eが選択され、この選択された第1中間成分c1eの列に並ぶ各重要度の中から0.6以上の重要度が選択され、この0.6以上の重要度を持つ第1成分xが選択される。図5に示す例では、2個の第1成分x、xが選択されている。これにより、目的変数Yの第2成分Yに影響する成分は、第2中間変数Cでは第2中間成分c2eとなり、第1中間変数Cでは第1中間成分c1eとなり、説明変数Xでは2個の第1成分x、xとなる。
【0076】
そして、表示処理部24は、説明変数Xにおける2個の第1成分x、xと第1中間変数Cの第1中間成分c1eとをその重要度に応じた太さの線分で結び、第1中間変数Cの第1中間成分c1eと第2中間変数Cの第2中間成分c2eとをその重要度に応じた太さの線分で結び、第2中間変数Cでは第2中間成分c2eと目的変数Yの第2成分Yとをその重要度に応じた太さの線分で結んだ重要度グラフを表示部4に表示する。
【0077】
以上の、目的変数における1個の第2成分から、中間変数を経て、説明変数に至るまで、重要な変数(閾値以上の重要度を持つ中間成分または第1成分)を連鎖的に構造化して可視化する処理は、次のように帰着できる。
【0078】
上述の選抜処理によって、今、説明変数Xから目的変数Yの間に合計N+1群からなるランダムフォレスト回帰モデル群(各群に含まれるモデルの個数は、d’、d’、・・・、d’、dy個)が存在しているとする。説明変数X側から数えて第s群に相当するランダムフォレスト回帰モデル群にかかる入力変数の重要度マップを与える行列をIで表すことにする。行列Iは、より具体的には、s=1のときd’×d’行列で表され、s=2、・・・、Nのときd’s-1×d’行列で表され、s=N+1のときd’×dy行列で表される。重要度の閾値tは、0<t<1なる定数として固定される。便宜上、次式2が定義される。ここでの表示方法として、任意のc×a行列Uは、そのa個のc次元列ベクトルを用いた次式3の形で必要に応じて表すことにする。
【0079】
【数2】
【0080】
【数3】
【0081】
まず、k=N+1として、次の第1および第2プロセスが実行される。
【0082】
この第1プロセスでは、m ∈{1、2、・・・・、d”}が1個、選択される。1個のターゲット変数(k=N+1の場合は、目的変数Yを構成する1個の第2成分(ゴール指標)そのものを表すノードとしてC”の第m 列ベクトルであるC”[m]が指定される。次に、このノードC”[m]に対してエッジを結び付けるべきノードの全てからなる集合Sk-1、mが次のようにして選定される。行列I’の第m列ベクトルであるI’[m](次元はdk-1)において閾値t以上の重要度を持つ成分のみを部分抽出したとき、それらに相当するインデックスの全てを横並びにした行ベクトルがMk、mとされ、その次元(すなわち、インデックスの個数)がd” k-1、mとされる。当然ながらd”k-1,m≦d’k-1であり,行ベクトルMk、mは、1×d”k-1,m行列の次式4を表している。
【0083】
【数4】
【0084】
これらに基づき、C’ k-1から合計d” k-1、m個の列ベクトルC’ k-1[Mk、m[1]]、C’ k-1[Mk、m[2]]、・・・、C’ k-1[Mk、m[d” k-1、m]]を部分抽出して集めた集合の次式5が然るべきノード集合として選定される。
【0085】
【数5】
【0086】
k-1、mの各ノードが入力とされ、ノードC”[m]が出力とされ、これらの間で重要度と比例した太さのエッジ(線分)を結び付けることを通して入出力関係が可視化される。なお、Mk、mの成分を集めたインデックス集合も次式6として定義される。
【0087】
【数6】
【0088】
次に、第2プロセスでは、mが変更されて前記第1プロセスが合計d” k-1回、繰り返し実行される。その後、次式7の和集合に属する重複を除くインデックスの個数がd”k-1で定義される。Rが集合{1,2、・・・、d’ k-1}の部分集合であるため、次式8で表される。
【0089】
【数7】
【0090】
【数8】
【0091】
同様に、次式9の和集合を考えると、Sに属する重複を除くノードの個数もd” k-1で表される。そこで、これらのノードをN次元列ベクトルとして全て横並びにしたN×d” k-1行列が次式10で定義される。k≧2のときは、I’ k-1をIk-1からd” k-1個の列だけ部分抽出したd’ k-2×d” k-1行列の次式11が定義される。
【0092】
【数9】
【0093】
【数10】
【0094】
【数11】
【0095】
k=N、N-1、・・・、2、1と降順に順次に第1および第2プロセスが実行されることにより、逐次的に入出力関係が拡大され、最終的にk=1の場合に説明変数Xから中間変数Cを経て目的変数Yに至る入出力関係が、エッジの太さで表された重要度と共に連鎖構造として可視化される。なお、重要度の閾値tが大きいほど、連鎖構造において現れるノードの総数が減少するので、各変数間における各成分間の関係性が解釈し易くなる。
【0096】
これら制御処理部2、入力部3、表示部4、IF部5および記憶部6は、例えば、デスクトップ型やノート型やタブレット型等のコンピュータによって構成可能である。
【0097】
次に、本実施形態の動作について説明する。図6は、説明変数の選抜および変数関係の表示に関する前記変数関係表示装置の動作を示すフローチャートである。
【0098】
このような構成の変数関係表示装置Aは、その電源が投入されると、必要な各部の初期化を実行し、その稼働を始める。制御処理部2には、その制御処理プログラムの実行によって、制御部21、モデル生成部22、重要度処理部23、表示処理部24および説明変数選抜部25が機能的に構成され、説明変数選抜部25には、候補生成部251および選抜部252が機能的に構成される。
【0099】
オペレータ(ユーザ)は、入力部3から、変数関係の表示開始の指示を入力すると、図6において、まず、変数関係表示装置Aは、制御処理部2の制御部21によって、データ取得部1から、初期説明変数および目的変数の各データを取得し、入力部3から前記所定の個数の入力を受け付ける(S1)。必要に応じて、中間変数のデータも取得される。
【0100】
続いて、変数関係表示装置Aは、制御処理部2における説明変数選抜部25の候補生成部251によって、前記複数の初期成分から、前記所定の個数の初期成分であって互いに異なる初期成分の組み合わせを持つ組を複数生成し、これら複数の組それぞれについての複数の候補モデルを生成する(S2)。
【0101】
続いて、変数関係表示装置Aは、制御処理部2における説明変数選抜部25の選抜部252によって、処理S2によって候補生成部251で生成した前記複数の組それぞれに対応した複数の候補モデルの中から、所定の評価関数で最も良い評価を与える候補モデルを選定し、この選定した候補モデルに対応した組の前記所定の個数の初期成分を前記所定の個数の第1成分として選抜する(S3)。
【0102】
続いて、変数関係表示装置Aは、制御処理部2のモデル生成部22によって、処理S3によって選抜部252で選抜した前記所定の個数の第1成分を説明変数とした前記所定の事象のモデルを生成する(S4)。
【0103】
続いて、変数関係表示装置Aは、制御処理部2の重要度処理部23によって、処理S3によって選抜部252で選抜した前記所定の個数の第1成分ごとに、部分モデルの不純度に基づいて重要度を求める(S5)。
【0104】
中間変数Cがある場合では、このような処理S2ないし処理S5の各処理が初期説明変数Xから中間変数Cを経て目的変数Yに至る各変数間ごとについて、前記目的変数Yから前記初期説明変数Xへ向けて順次に、当該変数間において前段の変数を仮に初期説明変数に見なすとともに後段の変数を仮に目的変数に見なして、実行される。
【0105】
続いて、変数関係表示装置Aは、制御処理部2の制御部21によって、入力部3から、表示すべき重要度の閾値および第2成分の各入力を受け付ける(S6)。
【0106】
続いて、変数関係表示装置Aは、制御処理部2の表示処理部24によって、例えば図3に示すような重要度マップを表示し、処理S6で受け付けた第2成分について、例えば図4に示すように重要度グラフを表示する(S7)。中間変数Cがある場合では、各変数間ごとの重要度マップが表示され、例えば後述の図11に示すような、説明変数Xから中間変数を経て目的変数Yに至るまでの各変数間における各成分間の関係を連鎖的に表す重要度グラフが表示される。なお、必要に応じて、重要度マップや重要度グラフは、IF部5から外部機器へ出力されてもよい。
【0107】
そして、変数関係表示装置Aは、制御処理部2の制御部21によって、処理を終了するか否かを判定する。例えば「Y」キーの入力操作等の、終了を指示する所定の第1入力操作を受け付けた場合には、変数関係表示装置Aは、終了と判定し(Yes)、本処理を終了する。一方、例えば「N」キーの入力操作等の、継続を指示する所定の第2入力操作を受け付けた場合には、変数関係表示装置Aは、終了ではないと判定し(No)、処理を処理S6に戻す。これにより、新たな異なる、表示すべき重要度の閾値および第2成分について、ユーザは、分析できる。
【0108】
次に、一実施例について説明する。図7は、一例として、評価対象の車両の部品を説明するための図である。図8は、一例として、評価点(測定点、データ取得点)を説明するための図である。図9は、一例として、音圧伝達特性(SPL)の比較結果を示す図である。図9の横軸は、周波数であり、その縦軸は、SPLである。図10は、一例として、モデルの精度を、決定係数(R)によって評価した評価結果を示す図である。図10の横軸は、種別であり、平面視にて左から右へ、P/I、A/FおよびSPLであり、その縦軸は、決定係数(R)である。図11は、一例として、目的変数における指定した第2成分に対する重要度グラフを示す図である。図12は、図11における0.6以上の重要度を持つ成分を説明するための図である。
【0109】
この一実施例では、所定の事象は、路面の凹凸に応じたタイヤへの振動入力に起因して車両の乗員に聞こえるロードノイズであり、初期説明変数Xは、図7に示すフロントサスペンションクロスメンバーおよびボディ主要骨格部品を含む28部品の板厚(dx=28)であり、目的変数Yは、SPL(乗員の耳位置における音圧伝達特性(Sound Pressure Level(SPL))である。中間変数Cは、図8に示す105個の評価点(測定点)におけるP/I(加振点応答特性(ポイントイナータンス)、第1中間変数C)およびA/F(タイヤ接地点を加振点とした振動伝達特性、第2中間変数C)である。部品板厚は、0.5~2.9[mm]の間で各々3水準が設定され、211仕様のCAEの解析結果が学習用データセットとして用いられた。各評価点では、2~450[Hz]の間で2[Hz]刻みとされ、第1中間変数Cの第1中間成分の個数d=23625であり、第2中間変数Cの第2中間成分の個数d=23625である。初期説明変数から説明変数の選抜では、説明変数Xではd‘x=28(選抜無し)であり、第1中間変数Cではd’=150(H={1、2、・・・、d’})であり、第2中間変数Cではd’=150(H={1、2、・・・、d’})である。目的変数Yは、2~420[Hz]の間で2[Hz]刻みとしたSPLであり、Hy={45、46、・・・、80}である(すなわち、Hyは、90[Hz]から160[Hz]の周波数帯のSPLに相当するインデックス集合)である。モデルの精度は、学習用データセットを基にした重要度分析の確からしさを評価するため、モデルの表現力(すなわち、与えられた学習用データセットのXをモデルに入力したときのC、C、Yの推定精度)により評価した。
【0110】
音圧伝達特性(SPL)の比較結果が図9に示されている。比較対象は、CAEの結果であり、図9における実線は、本実施形態によるモデルの推定結果であり、その破線は、CAEの結果である。モデルの精度を、決定係数(R)によりP/I、A/F、SPLの各変数の表現力を評価した結果が図10に示されている。図10に示す棒グラフは、縦軸をRとし、P/IおよびA/Fについては、選抜された150個の変数の個々に対応するRを平均した平均値であり、SPLについては、全周波数領域でのRを平均した平均値である。誤差棒は、Rに関する平均値±標準偏差の範囲である。図9および図10から、本実施形態における変数関係表示装置Aでは、説明変数が適切に選抜でき、ロードノイズがモデル化できている。
【0111】
図9に示すように、SPLが最大値となる100[Hz]を、表示すべき第2成分(ゴール指標)とし、表示すべき重要度の閾値を0.6とした場合において、その重要度グラフが図11に示され、図11に示す0.6以上の重要度を持つ成分の測定点が図12に示されている。目的変数Yにおける、表示すべき第2成分100[Hz]に対し、第2中間変数C;A/FのTop Ceiling(RH)の114[Hz]成分、Fr Window Lwr(LH)の78[Hz]成分、Fr Header(RH)の114[Hz]成分およびFr frame Fr(LH)の188[Hz]成分が他の第2中間変数Cより影響を与えている。第1中間変数C;P/Iにおいて、Roof Rail(RH)の90[Hz]成分、Roof Rail(LH)の94[Hz]成分、Fr Window Lwr(RH)の114[Hz]成分およびFr Window Lwr(RH)の40[Hz]成分が第2中間変数C;A/FのTop Ceiling(RH)の114[Hz]成分に他の第1中間変数Cより影響を与え、Fr Window Lwr(RH)の114[Hz]成分、Fr Window Lwr(RH)の40[Hz]成分およびDash Lwr Panel(Ctr)の282[Hz]成分が第2中間変数C;A/FのFr Window Lwr(LH)の78[Hz]成分に他の第1中間変数Cより影響を与え、Fr Window Lwr(RH)の40[Hz]成分およびDash Lwr Panelの282[Hz]成分が第2中間変数C;A/FのFr Header(RH)の114[Hz]成分に他の第1中間変数Cより影響を与え、Fr frame Rr(RH)の76[Hz]成分、Fr frame Fr(RH)の432[Hz]成分およびFr frame Rr(LH)の320[Hz]成分が第2中間変数C;A/FのFr frame Fr(LH)の188[Hz]成分に他の第1中間変数Cより影響を与えている。説明変数において、P13成分が第1中間変数C;P/IのRoof Rail(RH)の90[Hz]成分およびRoof Rail(LH)の94[Hz]成分それぞれに他の説明変数より影響を与え、P25成分が第1中間変数C;P/IのFr Window Lwr(RH)の114[Hz]成分、Fr Window Lwr(RH)の40[Hz]成分およびDash Lwr Panelの282[Hz]成分それぞれに他の説明変数より影響を与え、P01成分が第1中間変数C;P/IのFr frame Rr(RH)の76[Hz]成分、Fr frame Fr(RH)の432[Hz]成分およびFR frame Rr(LH)の320[Hz]成分それぞれに他の説明変数より影響を与えている。図11から、重要度が高い連鎖構造として、カウル板厚~フロントウィンドウP/I~フロントヘッダA/F~100[Hz]のSPLが確認でき、これは、従来、経験的に知られた関係性である。これにより、本実施形態における変数関係表示装置Aでは、説明変数が適切に選抜でき、ロードノイズがモデル化でき、説明変数Xから中間変数を経て目的変数Yに至るまでの各変数間における各成分間の関係が連鎖的に可視化できている。
【0112】
以上説明したように、実施形態における変数関係表示装置Aならびにこれに実装された変数関係表示方法および変数関係表示プログラムは、ランダムフォレストで、複数の部分モデルから成るモデルを生成し、説明変数の第1成分ごとに、前記部分モデルの不純度に基づいて重要度をそれぞれ求め、各重要度を、前記説明変数の第1成分を一方軸とすると共に目的変数の第2成分を他方軸とする2次元空間にマトリクス状に、表示するので、所定の事象をモデル化したモデルにおける変数間の重要性の関係を表示できる。
【0113】
上記変数関係表示装置A、変数関係表示方法および変数関係表示プログラムは、表示すべき重要度の閾値および第2成分の各入力を受け付けので、ユーザが着目した特定の第2成分に対し、前記閾値以上の重要度を持つ第1成分を表示でき、前記特定の第2成分に対する重要な第1成分を可視化できる。
【0114】
上記変数関係表示装置A、変数関係表示方法および変数関係表示プログラムは、説明変数(初期説明変数)と目的変数との間に介在する直列で連鎖的に並ぶ1または複数の中間変数がある場合を扱えるので、原因が中間体を順次に介して結果として現れる事象をモデル化したモデルにおける各変数間の重要性の各関係を表示できる。
【0115】
所定の事象をモデル化する場合、その説明変数における成分の個数が、例えば数千や数万や数十万等の膨大な数になってしまう場合がある。このような場合に、必ずしも説明変数における全ての成分が同等に目的変数に影響するとは限らず、目的変数に大きく影響する重要な成分が選抜(抽出、選定)できれば、比較的簡素なモデルで前記所定の事象をモデル化でき、前記選抜が望まれる。一方、いわゆる主成分分析によって主成分を求めることにより、主成分で構成される空間は、説明変数における成分の個数で表される説明変数の次元より低次元化できるが、説明変数で構成される空間が主成分で構成される空間に変換されるため、主成分の解釈が必要になってしまう。このため、説明変数の成分のままでの前記選抜が望ましい。上記変数関係表示装置A、変数関係表示方法および変数関係表示プログラムは、候補モデルの推定精度に基づく評価関数で最も良い評価を与える候補モデルを選定し、前記選定した候補モデルに対応した組の所定の個数の初期成分を、複数の初期成分から第1成分として選抜するので、前記所定の個数の第1成分をより適切に選抜できる。上記変数関係表示装置A、変数関係表示方法および変数関係表示プログラムは、初期成分のまま第1成分を選抜するので、いわゆる主成分分析では主成分の解釈が必要となるが、そのような解釈が必要なく、ユーザは、直感的に目的変数に影響を与える第1成分を認識できる。
【0116】
実施形態の実施例によれば、ロードノイズをモデル化したモデルにおける変数間の重要性の関係を表示できる変数関係表示装置Aが提供できる。
【0117】
なお、上述の実施形態において、表示処理部24は、入力部3で受け付けた閾値以上の重要度を持つ説明変数Xの第1成分xと目的変数Yの第2成分yとの相関係数をさらに表示部4に表示してもよい。例えば、前記相関係数は、前記閾値以上の重要度を持つ説明変数Xの第1成分xと、入力部3で受け付けた第2成分yとの対応付ける線分(エッジ)の周囲にその数値で表される。前記相関係数は、共分散をそれぞれの変数の標準偏差で割る公知の常套手段によって求められる。このような変数関係表示装置A、変数関係表示方法および変数関係表示プログラムは、重要度に加えて相関係数をさらに表示するので、前記相関係数に基づいて、前記閾値以上の重要度を持つ説明変数Xの第1成分xと、入力部3で受け付けた第2成分yとの間の線形性を認識できる。前記相関係数の絶対値が大きいほど、線形性が高く、逆に、前記相関係数の絶対値が小さいほど、線形性が低い(言い換えれば、非線形性が高い)。
【0118】
本発明を表現するために、上述において図面を参照しながら実施形態を通して本発明を適切且つ十分に説明したが、当業者であれば上述の実施形態を変更および/または改良することは容易に為し得ることであると認識すべきである。したがって、当業者が実施する変更形態または改良形態が、請求の範囲に記載された請求項の権利範囲を離脱するレベルのものでない限り、当該変更形態または当該改良形態は、当該請求項の権利範囲に包括されると解釈される。
【符号の説明】
【0119】
A 変数関係表示装置
1 データ取得部
2 制御処理部
3 入力部
4 表示部
5 インターフェース部(IF部)
6 記憶部
21 制御部
22 モデル生成部
23 重要度処理部
24 表示処理部
25 説明変数選抜部
251 候補生成部
252 選抜部
図1
図2
図3
図4
図5
図6
図7
図8
図9
図10
図11
図12