IP Force 特許公報掲載プロジェクト 2022.1.31 β版

知財求人 - 知財ポータルサイト「IP Force」

▶ NECソリューションイノベータ株式会社の特許一覧

特開2023-48581分析モデル作成支援装置、分析モデル作成支援方法、プログラム及び記録媒体
<>
  • 特開-分析モデル作成支援装置、分析モデル作成支援方法、プログラム及び記録媒体 図1
  • 特開-分析モデル作成支援装置、分析モデル作成支援方法、プログラム及び記録媒体 図2
  • 特開-分析モデル作成支援装置、分析モデル作成支援方法、プログラム及び記録媒体 図3
  • 特開-分析モデル作成支援装置、分析モデル作成支援方法、プログラム及び記録媒体 図4
  • 特開-分析モデル作成支援装置、分析モデル作成支援方法、プログラム及び記録媒体 図5
  • 特開-分析モデル作成支援装置、分析モデル作成支援方法、プログラム及び記録媒体 図6
  • 特開-分析モデル作成支援装置、分析モデル作成支援方法、プログラム及び記録媒体 図7
  • 特開-分析モデル作成支援装置、分析モデル作成支援方法、プログラム及び記録媒体 図8
  • 特開-分析モデル作成支援装置、分析モデル作成支援方法、プログラム及び記録媒体 図9
  • 特開-分析モデル作成支援装置、分析モデル作成支援方法、プログラム及び記録媒体 図10
  • 特開-分析モデル作成支援装置、分析モデル作成支援方法、プログラム及び記録媒体 図11
< >
(19)【発行国】日本国特許庁(JP)
(12)【公報種別】公開特許公報(A)
(11)【公開番号】P2023048581
(43)【公開日】2023-04-07
(54)【発明の名称】分析モデル作成支援装置、分析モデル作成支援方法、プログラム及び記録媒体
(51)【国際特許分類】
   G06F 16/906 20190101AFI20230331BHJP
【FI】
G06F16/906
【審査請求】未請求
【請求項の数】8
【出願形態】OL
(21)【出願番号】P 2021157993
(22)【出願日】2021-09-28
(71)【出願人】
【識別番号】000232092
【氏名又は名称】NECソリューションイノベータ株式会社
(74)【代理人】
【識別番号】100115255
【弁理士】
【氏名又は名称】辻丸 光一郎
(74)【代理人】
【識別番号】100201732
【弁理士】
【氏名又は名称】松縄 正登
(74)【代理人】
【識別番号】100154081
【弁理士】
【氏名又は名称】伊佐治 創
(72)【発明者】
【氏名】有元 貞士
【テーマコード(参考)】
5B175
【Fターム(参考)】
5B175FA03
5B175FB04
(57)【要約】      (修正有)
【課題】効率的に分析モデルを作成できる分析モデル作成支援装置、分析モデル作成支援方法、プログラム及び記録媒体を提供する。
【解決手段】分析モデル作成支援装置は、分析対象データ取得部、相関係数算出部、グループデータ作成部、データパターン作成部、分析モデル作成部、モデル精度算出部及び出力部を含む。分析対象データ取得部は、複数の数値データを含む分析対象データを取得する。相関係数算出部は、数値データ間の相関係数を算出する。グループデータ作成部は、相関係数に基づき、相関関係のある数値データ同士をグループ化したグループデータを作成する。データパターン作成部は、数値データ及び前記グループデータの少なくとも一方を含むデータパターンを生成する。分析モデル作成部は、データパターン毎の分析モデルを作成する。モデル精度算出部は、各分析モデルの精度を算出する。出力部は、分析モデルの精度を出力する。
【選択図】図1
【特許請求の範囲】
【請求項1】
分析対象データ取得部、相関係数算出部、グループデータ作成部、データパターン作成部、分析モデル作成部、モデル精度算出部、及び出力部を含み、
前記分析対象データ取得部は、複数の数値データを含む分析対象データを取得し、
前記相関係数算出部は、前記数値データ間の相関係数を算出し、
前記グループデータ作成部は、前記相関係数に基づき、相関関係のある数値データ同士をグループ化したグループデータを作成し、
前記データパターン作成部は、前記数値データ及び前記グループデータの少なくとも一方を含むデータパターンを生成し、
前記分析モデル作成部は、前記データパターンごとの分析モデルを作成し、
前記モデル精度算出部は、各分析モデルの精度を算出し、
前記出力部は、前記分析モデルの精度を出力する、分析モデル作成支援装置。
【請求項2】
相関係数出力部及び相関閾値取得部を含み、
前記相関係数出力部は、前記数値データ間の相関係数を出力し、
前記相関閾値取得部は、前記数値データ間の相関閾値を取得し、
前記グループデータ作成部は、前記相関係数及び前記相関閾値に基づき、数値データ間の相関関係を判定し、相関関係があると判定された数値データ同士をグループ化したグループデータを作成する、請求項1記載の分析モデル作成支援装置。
【請求項3】
グループデータ出力部及び代表データ取得部を含み、
前記グループデータ出力部は、前記グループデータを出力し、
前記代表データ取得部は、前記グループデータごとに、分析モデルの作成に使用する代表データを取得し、
前記分析モデル作成部は、前記グループデータを含むデータパターンの分析モデルの作成において、前記グループデータの数値データとして、前記代表データを使用して分析モデルを作成する、請求項1又は2記載の分析モデル作成支援装置。
【請求項4】
スコア定義情報取得部及びデータスコア算出部を含み、
前記スコア定義情報取得部は、前記数値データのスコア定義情報を取得し、
前記スコア定義情報は、前記分析モデルの精度と、データのスコア定義とが紐づけられた情報であり、
前記データスコア算出部は、前記分析モデルの精度と、前記スコア定義情報とに基づき、前記分析モデルの作成に使用した数値データごとのスコアを算出し、
前記出力部は、前記数値データのスコアを出力する、請求項1から3のいずれか一項に記載の分析モデル作成支援装置。
【請求項5】
選択データ取得部を含み、
前記選択データ取得部は、選択データ情報を取得し、
前記選択データ情報は、前記数値データのスコアに基づいてユーザが選択した選択データを含み、
前記データパターン作成部は、前記選択データ情報に基づき、データパターンを再作成し、
前記分析モデル作成部は、前記再作成されたデータパターンごとの分析モデルを作成し、
前記モデル精度算出部は、各分析モデルの精度を算出し、
前記出力部は、前記分析モデルの精度を出力する、請求項4記載の分析モデル作成支援装置。
【請求項6】
分析対象データ取得工程、相関係数算出工程、グループデータ作成工程、データパターン作成工程、分析モデル作成工程、モデル精度算出工程、及び出力工程を含み、
前記分析対象データ取得工程は、複数の数値データを含む分析対象データを取得し、
前記相関係数算出工程は、前記数値データ間の相関係数を算出し、
前記グループデータ作成工程は、前記相関係数に基づき、相関関係のある数値データ同士をグループ化したグループデータを作成し、
前記データパターン作成工程は、前記数値データ及び前記グループデータの少なくとも一方を含むデータパターンを生成し、
前記分析モデル作成工程は、前記データパターンごとの分析モデルを作成し、
前記モデル精度算出工程は、各分析モデルの精度を算出し、
前記出力工程は、前記分析モデルの精度を出力する、分析モデル作成支援方法。
【請求項7】
コンピュータに、分析対象データ取得手順、相関係数算出手順、グループデータ作成手順、データパターン作成手順、分析モデル作成手順、モデル精度算出手順、及び出力手順を実行させるためのプログラムであって、
前記分析対象データ取得手順は、複数の数値データを含む分析対象データを取得し、
前記相関係数算出手順は、前記数値データ間の相関係数を算出し、
前記グループデータ作成手順は、前記相関係数に基づき、相関関係のある数値データ同士をグループ化したグループデータを作成し、
前記データパターン作成手順は、前記数値データ及び前記グループデータの少なくとも一方を含むデータパターンを生成し、
前記分析モデル作成手順は、前記データパターンごとの分析モデルを作成し、
前記モデル精度算出手順は、各分析モデルの精度を算出し、
前記出力手順は、前記分析モデルの精度を出力する、プログラム。
【請求項8】
請求項7記載のプログラムを記録しているコンピュータ読み取り可能な記録媒体。

【発明の詳細な説明】
【技術分野】
【0001】
本発明は、分析モデル作成支援装置、分析モデル作成支援方法、プログラム及び記録媒体に関する。
【背景技術】
【0002】
電力需要予測、ローン可否診断、プラントの運転支援等、様々な分野において、複数の数値データに基づいて分析モデルを作成し、目的となるデータを予測することが行われている(特許文献1、2等)。
【先行技術文献】
【特許文献】
【0003】
【特許文献1】特開2005-332360号公報
【特許文献2】特開2019-144747号公報
【発明の概要】
【発明が解決しようとする課題】
【0004】
前記分析モデルの作成においては、予測精度を上げるために様々なデータを用意し、人手でデータの取捨選択を行い、分析モデルを作成する必要がある。しかしながら、データ量が増えれば増えるほど、分析モデルを作成するパターンが指数関数的に増加し、人手でデータの選別・評価を行うには手間がかかるという問題がある。
【0005】
そこで、本発明は、効率的に分析モデルを作成できる分析モデル作成支援装置を提供することを目的とする。
【課題を解決するための手段】
【0006】
前記目的を達成するために、本発明の分析モデル作成支援装置は、
分析対象データ取得部、相関係数算出部、グループデータ作成部、データパターン作成部、分析モデル作成部、モデル精度算出部、及び出力部を含み、
前記分析対象データ取得部は、複数の数値データを含む分析対象データを取得し、
前記相関係数算出部は、前記数値データ間の相関係数を算出し、
前記グループデータ作成部は、前記相関係数に基づき、相関関係のある数値データ同士をグループ化したグループデータを作成し、
前記データパターン作成部は、前記数値データ及び前記グループデータの少なくとも一方を含むデータパターンを生成し、
前記分析モデル作成部は、前記データパターンごとの分析モデルを作成し、
前記モデル精度算出部は、各分析モデルの精度を算出し、
前記出力部は、前記分析モデルの精度を出力する。
【0007】
本発明の分析モデル作成支援方法は、
分析対象データ取得工程、相関係数算出工程、グループデータ作成工程、データパターン作成工程、分析モデル作成工程、モデル精度算出工程、及び出力工程を含み、
前記分析対象データ取得工程は、複数の数値データを含む分析対象データを取得し、
前記相関係数算出工程は、前記数値データ間の相関係数を算出し、
前記グループデータ作成工程は、前記相関係数に基づき、相関関係のある数値データ同士をグループ化したグループデータを作成し、
前記データパターン作成工程は、前記数値データ及び前記グループデータの少なくとも一方を含むデータパターンを生成し、
前記分析モデル作成工程は、前記データパターンごとの分析モデルを作成し、
前記モデル精度算出工程は、各分析モデルの精度を算出し、
前記出力工程は、前記分析モデルの精度を出力する。
【0008】
本発明のプログラムは、コンピュータに、分析対象データ取得手順、相関係数算出手順、グループデータ作成手順、データパターン作成手順、分析モデル作成手順、モデル精度算出手順、及び出力手順を実行させるためのプログラムであって、
前記分析対象データ取得手順は、複数の数値データを含む分析対象データを取得し、
前記相関係数算出手順は、前記数値データ間の相関係数を算出し、
前記グループデータ作成手順は、前記相関係数に基づき、相関関係のある数値データ同士をグループ化したグループデータを作成し、
前記データパターン作成手順は、前記数値データ及び前記グループデータの少なくとも一方を含むデータパターンを生成し、
前記分析モデル作成手順は、前記データパターンごとの分析モデルを作成し、
前記モデル精度算出手順は、各分析モデルの精度を算出し、
前記出力手順は、前記分析モデルの精度を出力する、プログラムである。
【発明の効果】
【0009】
本発明によれば、効率的に分析モデルを作成できる。
【図面の簡単な説明】
【0010】
図1図1は、実施形態1の分析モデル作成支援装置の一例の構成を示すブロック図である。
図2図2は、実施形態1の分析モデル作成支援装置のハードウェア構成の一例を示すブロック図である。
図3図3は、実施形態1の分析モデル作成支援装置における処理の一例を示すフローチャートである。
図4図4は、実施形態2の分析モデル作成支援装置の一例の構成を示すブロック図である。
図5図5は、実施形態2の分析モデル作成支援装置における処理の一例を示すフローチャートである。
図6図6は、実施形態3の分析モデル作成支援装置の一例の構成を示すブロック図である。
図7図7は、実施形態3の分析モデル作成支援装置における処理の一例を示すフローチャートである。
図8図8は、実施形態4の分析モデル作成支援装置の一例の構成を示すブロック図である。
図9図9は、実施形態4の分析モデル作成支援装置における処理の一例を示すフローチャートである。
図10図10は、実施形態5の分析モデル作成支援装置の一例の構成を示すブロック図である。
図11図11は、実施形態5の分析モデル作成支援装置における処理の一例を示すフローチャートである。
【発明を実施するための形態】
【0011】
本発明の分析モデル作成支援装置は、例えば、教師あり学習による分析モデルの作成に利用できる。前記教師あり学習は、例えば、ロジスティック回帰、線形回帰、決定木、ランダムフォレスト、Elastic Net、サポートベクターマシン(SVM)、正則化、k近傍法(k-NN)、ナイーブベイズ、ニューラルネットワーク(NN)パーセプトロン等があげられる。
【0012】
本発明の実施形態について図を用いて説明する。本発明は、以下の実施形態には限定されない。以下の各図において、同一部分には、同一符号を付している。また、各実施形態の説明は、特に言及がない限り、互いの説明を援用でき、各実施形態の構成は、特に言及がない限り、組合せ可能である。
【0013】
[実施形態1]
図1は、本実施形態の分析モデル作成支援装置10の一例の構成を示すブロック図である。図1に示すように、本装置10は、分析対象データ取得部11、相関係数算出部12、グループデータ作成部13、データパターン作成部14、分析モデル作成部15、モデル精度算出部16、及び出力部17を含む。また、図示していないが、本装置10は、例えば、記憶部を含んでもよい。
【0014】
本装置10は、例えば、前記各部を含む1つの装置でもよいし、前記各部が、通信回線網を介して接続可能な装置でもよい。また、本装置10は、前記通信回線網を介して、後述する外部装置と接続可能である。前記通信回線網は、特に制限されず、公知のネットワークを使用でき、例えば、有線でも無線でもよい。前記通信回線網は、例えば、インターネット回線、WWW(World Wide Web)、電話回線、LAN(Local Area Network)、SAN(Storage Area Network)、DTN(Delay Tolerant Networking)、LPWA(Low Power Wide Area)、L5G(ローカル5G)、等があげられる。無線通信としては、例えば、Wi-Fi(登録商標)、Bluetooth(登録商標)、ローカル5G、LPWA等が挙げられる。前記無線通信としては、各装置が直接通信する形態(Ad Hoc通信)、インフラストラクチャ(infrastructure通信)、アクセスポイントを介した間接通信等であってもよい。本装置10は、例えば、システムとしてサーバに組み込まれていてもよい。また、本装置10は、例えば、本発明のプログラムがインストールされたパーソナルコンピュータ(PC、例えば、デスクトップ型、ノート型)、スマートフォン、タブレット端末等であってもよい。本装置10は、例えば、前記各部のうち少なくとも一つがサーバ上にあり、その他の前記各部が端末上にあるような、クラウドコンピューティングやエッジコンピューティング等の形態であってもよい。
【0015】
図2に、本装置10のハードウェア構成のブロック図を例示する。本装置10は、例えば、CPU101、メモリ102、バス103、記憶装置104、入力装置106、ディスプレイ(表示装置)107、通信デバイス(通信部)108等を含む。本装置10の各部は、それぞれのインタフェース(I/F)により、バス103を介して相互に接続されている。
【0016】
CPU101は、例えば、コントローラ(システムコントローラ、I/Oコントローラ等)等により、他の構成と連携動作し、本装置10の全体の制御を担う。本装置10において、CPU101により、例えば、本発明のプログラム105やその他のプログラムが実行され、また、各種情報の読み込みや書き込みが行われる。具体的には、例えば、CPU101が、分析対象データ取得部11、相関係数算出部12、グループデータ作成部13、データパターン作成部14、分析モデル作成部15、モデル精度算出部16、及び出力部17として機能する。本装置10は、演算装置として、CPUを含むが、GPU(Graphics Processing Unit)、APU(Accelerated Processing Unit)等の他の演算装置を備えてもよいし、CPUとこれらとの組合せを備えてもよい。
【0017】
バス103は、例えば、外部装置とも接続できる。前記外部装置は、例えば、外部記憶装置(外部データベース等)、プリンター、外部入力装置、外部表示装置、外部撮像装置等があげられる。本装置10は、例えば、バス103に接続された通信デバイス107により、外部ネットワーク(前記通信回線網)に接続でき、外部ネットワークを介して、他の装置と接続することもできる。
【0018】
メモリ102は、例えば、メインメモリ(主記憶装置)が挙げられる。CPU101が処理を行う際には、例えば、後述する記憶装置104に記憶されている本発明のプログラム105等の種々の動作プログラムを、メモリ102が読み込み、CPU101は、メモリ102からデータを受け取って、プログラムを実行する。前記メインメモリは、例えば、RAM(ランダムアクセスメモリ)である。また、メモリ102は、例えば、ROM(読み出し専用メモリ)であってもよい。
【0019】
記憶装置104は、例えば、前記メインメモリ(主記憶装置)に対して、いわゆる補助記憶装置ともいう。前述のように、記憶装置104には、本発明のプログラムを含む動作プログラムが格納されている。記憶装置104は、例えば、記録媒体と、記録媒体に読み書きするドライブとの組合せであってもよい。前記記録媒体は、特に制限されず、例えば、内蔵型でも外付け型でもよく、HD(ハードディスク)、CD-ROM、CD-R、CD-RW、MO、DVD、フラッシュメモリー、メモリーカード等が挙げられる。記憶装置104は、例えば、記録媒体とドライブとが一体化されたハードディスクドライブ(HDD)、及びソリッドステートドライブ(SSD)であってもよい。本装置10が前記記憶部を含む場合、例えば、記憶装置104は、前記記憶部として機能する。
【0020】
本装置10において、メモリ102及び記憶装置104は、ログ情報、外部データベース(図示せず)や外部の装置から取得した情報、本装置10によって生成した情報、本装置10が処理を実行する際に用いる情報等の種々の情報を記憶することも可能である。なお、少なくとも一部の情報は、例えば、メモリ102及び記憶装置104以外の外部サーバに記憶されていてもよいし、複数の端末にブロックチェーン技術等を用いて分散して記憶されていてもよい。
【0021】
本装置10は、例えば、さらに、入力装置106、ディスプレイ107を含む。入力装置106は、例えば、タッチパネル、トラックパッド、マウス等のポインティングデバイス;キーボード;カメラ、スキャナ等の撮像手段;ICカードリーダ、磁気カードリーダ等のカードリーダ;マイク等の音声入力手段;等があげられる。ディスプレイ107は、例えば、LEDディスプレイ、液晶ディスプレイ等の表示装置があげられる。本実施形態1において、入力装置106とディスプレイ107とは、別個に構成されているが、入力装置106とディスプレイ107とは、タッチパネルディスプレイのように、一体として構成されてもよい。
【0022】
つぎに、本実施形態の分析モデル作成支援方法の一例を、図3のフローチャートに基づき説明する。本実施形態の分析モデル作成支援方法は、例えば、図1又は図2の分析モデル作成支援装置10を用いて、次のように実施する。なお、本実施形態の分析モデル作成支援方法は、図1又は図2の分析モデル作成支援装置10の使用には限定されない。以下の説明においては、具体例として、下記表1に示す目的データの分析のための分析対象データとして、前記目的データそれぞれについて、データ1、データ2、データ3、及びデータ4のデータが存在する場合を例に挙げて説明するが、本発明の分析モデル作成支援方法は、以下の説明には何ら限定及び制限されない。
【0023】
【表1】
【0024】
まず、分析対象データ取得部11により、前記表1に示す複数の数値データ(データ1~データ4)を含む分析対象データを取得する(S1、分析対象データ取得工程)。前記分析対象データが含む数値データは、複数の数値データであればよく、その数の上限および種類は特に制限されない。前記分析対象データの具体例としては、例えば、気温、湿度、年収、家族構成(人数)等があげられる。前記分析データは、これに制限されず、例えば、テキストデータを変数データに変換したデータであってもよい。前記テキストデータは、例えば、天候(晴、曇、雨等)、職業(国家公務員、会社員、自営業等)、国(日本、アメリカ、イギリス等)等があげられる。分析対象データ取得部11は、例えば、バス103に接続された通信デバイス108により、前記通信回線網を介して装置外部のデータベースから前記分析対象データを取得してもよいし、分析対象データを計測している装置外のセンサ等から直接前記分析対象データを取得してもよいし、本発明の分析モデル作成支援装置10のメモリ102又は記憶装置104に記憶された前記分析対象データを取得してもよい。
【0025】
つぎに、相関係数算出部12は、前記数値データ間の相関係数を算出する(S2、相関係数算出工程)。前記数値データ間の相関係数は、例えば、下記式(1)に従い、2つの数値データ(変数A及び変数B)の共分散を、変数Aの標準偏差及び変数Bの標準偏差で割ることで算出できる。相関係数rは、例えば、-1から1までの値をとり、相関係数rが正の値である場合、変数A及び変数Bは正の相関があり、相関係数rが負の値である場合、変数A及びBには負の相関があるといえる。具体例として、下記表2に、前記表1に示すデータ1~データ4の相関係数を示す。
相関係数r=共分散/(変数Aの標準偏差×変数Bの標準偏差)……(1)
【0026】
【表2】
【0027】
つぎに、グループデータ作成部13は、前記相関係数に基づき、相関関係のある数値データ同士をグループ化したグループデータを作成する(S3、グループデータ作成工程)。具体的に、グループデータ作成部13は、前記相関係数が閾値を超えるデータについて、相関関係があると判定し、相関関係のある数値データ同士をグループ化する。前記閾値は、特に制限されず、予め指定された任意の値でもよいし、前記相関係数を確認したユーザにより設定された値でもよい。後者の形態については、実施形態2で後述する。具体例として、前記閾値が「0.9以上」に設定されている場合、グループデータ作成部13は、前記表2に示す相関係数から、データ1及びデータ2について相関関係があると判断し、下記表3に示すように、データ1及びデータ2をグループ化したグループデータ1を作成する。グループデータ作成部13は、例えば、数値データ間の相関が、例えば、正の相関である数値データ同士をグループ化してもよいし、負の相関である数値データ同士をグループ化してもよいが、正の相関がある数値データ同士をグループ化することが好ましい。
【0028】
【表3】
【0029】
つぎに、データパターン作成部14により、前記数値データ及び前記グループデータの少なくとも一方を含むデータパターンを作成する(S4、データパターン作成工程)。データパターン作成部14は、例えば、前記数値データ及び前記グループデータのすべての組み合わせパターンについてデータパターンを作成してもよいし、その一部の組み合わせパターンについてデータパターンを作成してもよい。具体例として、前記S3においてグループデータ1が作成されている場合、データパターン作成部14は、例えば、グループデータ1及びデータ3の組み合わせ1、グループデータ1、データ3、及びデータ4の組み合わせ2、グループデータ1及びデータ4の組み合わせ3、並びにデータ3及びデータ4の組み合わせ4、グループデータ1のみの組み合わせ5、データ3のみの組み合わせ6、データ4のみの組み合わせ7、の7つのデータパターンを作成する。
【0030】
つぎに、分析モデル作成部15により、前記データパターンごとの分析モデルを作成する(S5、分析モデル作成工程)。前記分析モデルの作成は、公知の分析モデル作成用AIエンジンと同様の方法が利用でき、例えば、分析モデル作成部15が、前記目的データ及び前記S4で作成したデータパターンを使用して、前記データパターンごとに前記分析モデル及び分析結果を生成してもよいし、装置10外の公知の分析モデル作成AIエンジンが作成した分析モデル及び分析結果を取得してもよい。後者の場合、例えば、分析モデル作成部15は、分析モデル作成支援装置10外の分析モデル作成AIエンジンに、前記目的データ及び前記S4で作成したデータパターンを出力し、前記データパターンごとに、前記AIエンジンが生成した分析モデル及び分析結果を取得することにより、前記分析モデルを作成できる。
【0031】
前記S5において、前記グループデータを含むデータパターンの分析モデルを作成する場合、前記グループデータが含む複数の数値データは、任意のデータを使用でき、例えば、前記グループデータが含む数値データのうち、先頭のデータを使用してもよいし、ユーザが指定した任意のデータを使用してもよい。後者の形態については、実施形態3で後述する。下記表4に、グループデータ1、データ3、及びデータ4の前記組み合わせ2のデータパターンを使用した分析モデルの例を示す。下記表4に示すモデルは、前記組み合わせ2のデータパターンにおいて、グループデータ1が含む数値データのうち、先頭のデータであるデータ1を使用した分析モデルによる予測結果である。
【0032】
【表4】
【0033】
つぎに、モデル精度算出部16により、各分析モデルの精度を算出する(S6、モデル精度算出工程)。具体的に、モデル精度算出部16は、例えば、実測値(前記目的データ)に対し、予測値(各データパターンの分析モデルによる予測結果)を評価することで前記分析モデルの精度を算出できる。モデル精度算出部16による、前記分析モデルの精度の算出方法は、例えば、作成した分析モデルの種類及び分析の目的に応じて適宜決定できる。前記分析モデルが、例えば、回帰分析モデルである場合は、平均誤差(ME:Mean Error)、二乗平均平方根誤差(RMSE:Root Mean Squared Error)、平均絶対誤差(MAE:Mean Absolute Error)、平均誤差率(MPE:Mean Percentage Error)、非金絶対誤差率(MAPE:Mean Absolute Percentage Error)、平均二乗誤差(MSE:Mean Squared Error)、決定係数(R2)等の手法が利用できる。また、前記分析モデルが、例えば、分類モデルである場合は、混同行列(Confusion matrix)、正解率(Accuracy)、適合率(Precision)、再現率(Recall)、F値(F-measure)等の手法が利用できる。前記精度算出方法は、例えば、分析モデル作成支援装置10のユーザが、目的に応じて適宜設定できる。
【0034】
下記表5に、各データパターンの分析モデルのモデル精度の具体例として、モデル精度算出部16が算出したRMSEの結果を示す。RMSEは、数値が0に近いほど実測値と予測値の誤差が小さい、すなわち、分析モデルの精度が高いことを示す。
【0035】
【表5】
【0036】
分析モデル作成支援装置10は、例えば、S4で作成した全てのデータパターンについて分析モデルの作成及び精度の算出が完了するまで前記S5及びS6を繰り返し実行してもよいし、所定の条件を満たすまでの間、前記S5及びS6を繰り返してもよい。前記所定の条件は、例えば、任意に指定した回数、分析モデルの精度が指定した精度の条件を超えるまで等の条件があげられる。前記所定の条件を満たすまでの間S5及びS6を繰り返す場合、例えば、前記S5における分析モデルの作成において、使用するデータが偏らないように、前記データパターンを平均的に選択していくことが好ましい。
【0037】
そして、出力部17は、前記分析モデルの精度を出力し(S7、出力工程)、分析モデル作成支援装置10の処理を終了する(END)。出力部17は、例えば、前記分析モデルの精度を、ディスプレイ107に出力(表示)してもよいし、通信回線網を介して外部装置に出力してもよい。
【0038】
本実施形態の分析モデル作成支援装置10によれば、例えば、相関係数算出部12により、数値データ間の相関係数を算出し、グループデータ作成部13により、相関関係のある数値データ同士をグループ化できる。このため、分析モデル作成支援装置10によれば、分析モデルの作成に使用するデータ数を削減することができるため、効率的に分析モデルを作成及び評価できる。
【0039】
[実施形態2]
本実施形態は、実施形態1の分析モデル作成支援装置10の構成に加えて、相関係数出力部及び相関閾値取得部を含むこと以外は、実施形態1の分析モデル作成支援装置10と同様であり、その説明を援用できる。本実施形態の分析モデル作成支援装置は、相関係数出力部及び相関閾値取得部を含み、前記相関係数出力部は、前記数値データ間の相関係数を出力し、前記相関閾値取得部は、前記数値データ間の相関閾値を取得し、前記グループデータ作成部は、前記相関係数及び前記相関閾値に基づき、数値データ間の相関関係を判定し、相関関係があると判定された数値データ同士をグループ化したグループデータを作成する。
【0040】
図4は、本実施形態の分析モデル作成支援装置10Aの一例の構成を示すブロック図である。図4に示すように、分析モデル作成支援装置10Aは、実施形態1の分析モデル作成支援装置10の構成に加えて、相関係数出力部21及び相関閾値取得部22を含む。分析モデル作成支援装置10Aのハードウェア構成は、図2の分析モデル作成支援装置10のハードウェア構成において、CPU101が、図1の分析モデル作成支援装置10の構成に代えて、図4の分析モデル作成支援装置10Aの構成を含む以外は同様である。
【0041】
つぎに、本実施形態の分析モデル作成支援方法について、図5のフローチャートを用いて説明する。本実施形態の分析モデル作成支援方法は、例えば、図4に示す本実施形態の分析モデル作成支援装置10Aを用いて実施できる。なお、本発明の分析モデル作成支援方法は、分析モデル作成支援装置10Aの使用に限定されない。
【0042】
まず、前記実施形態1の分析モデル作成支援方法におけるS1~S2と同様にして、S1~S2を実施する。
【0043】
つぎに、相関係数出力部21は、S2で算出した前記数値データ間の相関係数を出力する(S21、相関係数出力工程)。相関係数出力部21は、例えば、前記相関係数をディスプレイ107に出力(表示)してもよいし、通信回線網を介して外部装置に出力してもよい。
【0044】
つぎに、相関閾値取得部22は、前記数値データ間の相関閾値を取得する(S22、相関閾値取得工程)。ユーザは、出力された前記相関係数を確認し、数値データ間の相関関係の閾値となる相関閾値を設定し、分析モデル作成支援装置10Aの入力装置106により、前記相関閾値を入力する。相関閾値取得部22は、例えば、前記ユーザが入力した相関閾値を取得する。
【0045】
グループデータ作成部13は、前記相関係数及び前記S22で取得した前記相関閾値に基づいて数値データ間の相関関係を判定し、前記相関関係があると判定された数値データ同士をグループ化したグループデータを作成する(S3、グループデータ作成工程)。
【0046】
そして、前記実施形態1の分析モデル作成支援方法におけるS4~S7と同様にして、S4~S7を実施し、分析モデル作成支援装置10Aの処理を終了する(END)。
【0047】
本実施形態の分析モデル作成支援装置は、例えば、相関係数出力部21により、グループデータの作成前に、ユーザに数値データ間の相関係数を出力する。このため、ユーザは、分析を行う目的や手法に合わせて、数値データ間に相関関係があると判定する閾値を設定することができ、より効率的に分析モデルを作成できる。
【0048】
[実施形態3]
本実施形態は、実施形態1の分析モデル作成支援装置10の構成に加えて、グループデータ出力部及び代表データ取得部を含むこと以外は、実施形態1の分析モデル作成支援装置10と同様であり、その説明を援用できる。本実施形態の分析モデル作成支援装置は、グループデータ出力部及び代表データ取得部を含み、前記グループデータ出力部は、前記グループデータを出力し、前記代表データ取得部は、前記グループデータごとに、分析モデルの作成に使用する代表データを取得し、前記分析モデル作成部は、前記グループデータを含むデータパターンの分析モデルの作成において、前記グループデータの数値データとして、前記代表データを使用して分析モデルを作成する。
【0049】
図6は、本実施形態の分析モデル作成支援装置10Bの一例の構成を示すブロック図である。図6に示すように、分析モデル作成支援装置10Bは、実施形態1の分析モデル作成支援装置10の構成に加えて、グループデータ出力部31及び代表データ取得部32を含む。分析モデル作成支援装置10Bのハードウェア構成は、図2の分析モデル作成支援装置10のハードウェア構成において、CPU101が、図1の分析モデル作成支援装置10の構成に代えて、図6の分析モデル作成支援装置10Bの構成を含む以外は同様である。
【0050】
つぎに、本実施形態の分析モデル作成支援方法について、図7のフローチャートを用いて説明する。本実施形態の分析モデル作成支援方法は、例えば、図6に示す本実施形態の分析モデル作成支援装置10Bを用いて実施できる。なお、本発明の分析モデル作成支援方法は、分析モデル作成支援装置10Bの使用に限定されない。
【0051】
まず、前記実施形態1の分析モデル作成支援方法におけるS1~S3と同様にして、S1~S3を実施する。
【0052】
つぎに、グループデータ出力部31は、S3で作成したグループデータを出力する(S31、グループデータ出力工程)。グループデータ出力部31は、例えば、前記グループデータをディスプレイ107に出力(表示)してもよいし、通信回線網を介して外部装置に出力してもよい。
【0053】
つぎに、代表データ取得部32は、前記グループデータごとに、分析モデルの作成に使用する代表データを取得する(S32、代表データ取得工程)。ユーザは、出力された前記グループデータを確認し、グループデータが含む数値データのうち、分析モデルの作成に使用する代表データを決定し、分析モデル作成支援装置10Bの入力装置106により、前記グループデータごとに代表データを入力する。代表データ取得部32は、前記ユーザが入力した代表データを取得する。
【0054】
つぎに、データパターン作成部14は、前記数値データ及び前記グループデータの少なくとも一方を含むデータパターンを生成する(S4、データパターン作成工程)。また、前記グループデータを含むデータパターンの作成時において、データパターン作成部14は、例えば、前記S32で取得した前記代表データを、前記グループデータと紐づけて前記データパターンを作成してもよい。
【0055】
つぎに、分析モデル作成部15は、前記データパターンごとの分析モデルを作成する(S5、分析モデル作成工程)。実施形態2の分析モデル作成支援装置10Bの分析モデル作成部15は、例えば、前記グループデータを含むデータパターンの分析モデルの作成において、前記グループデータの数値データとして、前記代表データを使用して分析モデルを作成する。
【0056】
そして、前記実施形態1の分析モデル作成支援方法におけるS6~S7と同様にして、S6~S7を実施し、分析モデル作成支援装置10Bの処理を終了する(END)。
【0057】
本実施形態の分析モデル作成支援装置は、例えば、グループデータ出力部31により、分析モデルの作成前に、ユーザにグループデータを出力する。このため、ユーザは、分析を行う目的や手法に合わせて、グループデータのうち分析モデルの作成に使用する数値データを代表データとして選択することができ、より効率的に分析モデルを作成できる。
【0058】
[実施形態4]
本実施形態は、実施形態1の分析モデル作成支援装置10の構成に加えて、スコア定義情報取得部及びデータスコア算出部を含むこと以外は、実施形態1の分析モデル作成支援装置10と同様であり、その説明を援用できる。本実施形態の分析モデル作成支援装置は、スコア定義情報取得部及びデータスコア算出部を含み、前記スコア定義情報取得部は、前記数値データのスコア定義情報を取得し、前記スコア定義情報は、前記分析モデルの精度と、データのスコア定義とが紐づけられた情報であり、前記データスコア算出部は、前記分析モデルの精度と、前記スコア定義情報とに基づき、前記分析モデルの作成に使用した数値データごとのスコアを算出し、前記出力部は、前記数値データのスコアを出力する。
【0059】
図8は、本実施形態の分析モデル作成支援装置10Cの一例の構成を示すブロック図である。図8に示すように、分析モデル作成支援装置10Cは、実施形態1の分析モデル作成支援装置10の構成に加えて、スコア定義情報取得部41及びデータスコア算出部42を含む。分析モデル作成支援装置10Cのハードウェア構成は、図2の分析モデル作成支援装置10のハードウェア構成において、CPU101が、図1の分析モデル作成支援装置10の構成に代えて、図8の分析モデル作成支援装置10Cの構成を含む以外は同様である。
【0060】
つぎに、本実施形態の分析モデル作成支援方法について、図9のフローチャートを用いて説明する。本実施形態の分析モデル作成支援方法は、例えば、図8に示す本実施形態の分析モデル作成支援装置10Cを用いて実施できる。なお、本発明の分析モデル作成支援方法は、分析モデル作成支援装置10Cの使用に限定されない。
【0061】
まず、前記実施形態1の分析モデル作成支援方法におけるS1~S6と同様にして、S1~S6を実施する。
【0062】
つぎに、スコア定義情報取得部41は、前記数値データのスコア定義情報を取得する(S41、スコア定義情報取得工程)。前記スコア定義情報は、例えば、前記分析モデルの精度と、データのスコア定義とが紐づけられた情報である。下記表6に、前記スコア定義情報の具体例を示す。下記表6に示すスコア定義情報は、RMSEの算出結果と、データスコアとが紐づけられた情報である。なお、下記表6に示すスコア定義情報は一例であり、スコア定義情報は、例えば、分析を行う目的や手法に合わせて適宜設定できる。表6に示すスコア定義においては、一例として、RMSEが低いものほどスコアを高く、RMSEが高いものほどスコアを低く、すなわち、分析モデルの精度が高いものほど、数値データのスコアが高く、分析モデルの精度が低くなるほど数値データのスコアが低くなるように定義しているが、本発明はこれには何ら限定されない。
【0063】
【表6】
【0064】
つぎに、データスコア算出部42は、前記分析モデルの精度と、前記スコア定義情報とに基づき、前記分析モデルの作成に使用した数値データごとのスコアを算出する(S42、データスコア算出工程)。データスコア算出部42は、各分析モデルの精度と、前記スコア定義情報に基づき、各分析モデルの作成に使用したデータパターンが含む数値データのスコアを算出し、前記数値データごとに、前記数値データが含まれるデータパターンのスコアの平均値を、前記数値データのスコアとして算出できる。具体例として、下記表7に、分析モデルの精度が、前記表5に示す精度であり、前記スコア定義情報が、前記表6に示すものである場合におけるデータパターンのスコアを示す。下記表7に示すように、グループデータ1を含むデータパターンのスコアは、0、6、2、8であるため、グループデータ1のスコアは、4と算出できる。また、データ3を含むデータパターンのスコアは、6、6、8、6であるため、データ3のスコアは、6.5と算出できる。そして、データ4を含むデータパターンのスコアは、4、2、8、6であるため、データ4のスコアは、5と算出できる。
【0065】
【表7】
【0066】
そして、出力部17は、前記分析モデルの精度と、前記数値データのスコアとを出力し(S7、出力工程)、分析モデル作成支援装置10Cの処理を終了する(END)。
【0067】
本実施形態の分析モデル作成支援装置は、例えば、データスコア算出部42により、分析モデルの精度に基づいて、数値データごとのスコアを算出できる。このため、本実施形態の分析モデル作成支援装置によれば、分析モデルの作成に使用したデータの妥当性を評価でき、より効率的に分析モデルを作成できる。
【0068】
[実施形態5]
本実施形態は、実施形態4の分析モデル作成支援装置10Cの構成に加えて、選択データ取得部を含むこと以外は、実施形態4の分析モデル作成支援装置10Cと同様であり、その説明を援用できる。本実施形態の分析モデル作成支援装置は、選択データ取得部を含み、前記選択データ取得部は、選択データ情報を取得し、前記選択データ情報は、前記数値データのスコアに基づいてユーザが選択した選択データを含み、前記データパターン作成部は、前記選択データ情報に基づき、データパターンを再作成し、前記分析モデル作成部は、前記再作成されたデータパターンごとの分析モデルを作成し、前記モデル精度算出部は、各分析モデルの精度を算出し、前記出力部は、前記分析モデルの精度を出力する。
【0069】
図10は、本実施形態の分析モデル作成支援装置10Dの一例の構成を示すブロック図である。図10に示すように、分析モデル作成支援装置10Dは、実施形態4の分析モデル作成支援装置10Cの構成に加えて、選択データ取得部51を含む。分析モデル作成支援装置10Dのハードウェア構成は、図2の分析モデル作成支援装置10のハードウェア構成において、CPU101が、図1の分析モデル作成支援装置10の構成に代えて、図10の分析モデル作成支援装置10Dの構成を含む以外は同様である。
【0070】
つぎに、本実施形態の分析モデル作成支援方法について、図11のフローチャートを用いて説明する。本実施形態の分析モデル作成支援方法は、例えば、図10に示す本実施形態の分析モデル作成支援装置10Dを用いて実施できる。なお、本発明の分析モデル作成支援方法は、分析モデル作成支援装置10Dの使用に限定されない。
【0071】
まず、前記実施形態4の分析モデル作成支援方法におけるS1~S6、S41~S42、S7と同様にして、S1~S6、S41~S42、S7を実施する。
【0072】
つぎに、選択データ取得部51は、選択データ情報を取得する(S51、選択データ取得工程)。前記選択データ情報は、前記数値データのスコアに基づいてユーザが選択した選択データを含む。ユーザは、出力された前記数値データのスコアを確認し、分析データを使用するデータを選択し、分析モデル作成支援装置10Dの入力装置106により、選択したデータを選択データ情報として入力する。選択データ取得部51は、例えば、前記ユーザが入力した選択データ情報を取得する。前記選択データ情報は、例えば、必ず分析に使用する必須数値データと、任意に組み合わせ可能である任意数値データとを含んでもよい。
【0073】
つぎに、データパターン作成部14は、前記選択データ情報に基づき、データパターンを再作成する(S52、データパターン再作成工程)。データパターン作成部14は、前記選択データ情報が、前記必須数値データを含む場合、例えば、すべてのデータパターンが、前記必須数値データを含むように、データパターンを再作成する。具体例として、選択データ情報が、必須データとして、前記データ3を含み、前記任意データとして、前記データ4を含む場合を例に挙げて説明する。この場合データパターン作成部14は、例えば、データ3のみの組み合わせ1、及び、データ3及びデータ4の組み合わせ2の2つのデータパターンを作成する。
【0074】
つぎに、分析モデル作成部15は、前記再作成されたデータパターンごとに分析モデルを作成する(S52、分析モデル再作成工程)。そして、モデル精度算出部16は、再作成された各分析モデルの精度を算出し(S53、モデル精度再算出工程)、出力部17は、前記分析モデルの精度を出力し(S54、出力工程)、分析モデル作成支援装置10Dの処理を終了する(END)。
【0075】
本実施形態の分析モデル作成支援装置は、例えば、ユーザが選択した選択データ情報に基づいて、データパターンを再作成し、再作成されたデータパターンごとの分析モデルの精度を出力できる。このため、本実施形態の分析モデル作成支援装置によれば、より効率的に分析モデルを作成できる。分析モデルの作成時には、使用するデータだけでなく、どのようなパラメータを設定して分析モデルを作成するかにより、出力される分析モデルが変化する。本実施形態によれば、分析モデルの作成に使用するデータパターンをさらに削減できるため、パラメータを変更しての分析において特に有用である。
【0076】
[実施形態6]
本実施形態のプログラムは、前述の分析モデル作成支援方法の各工程を、コンピュータに実行させるためのプログラムである。具体的に、本実施形態のプログラムは、コンピュータに、分析対象データ取得手順、相関係数算出手順、グループデータ作成手順、データパターン作成手順、分析モデル作成手順、モデル精度算出手順、及び出力手順を実行させるためのプログラムである。
【0077】
前記分析対象データ取得手順は、複数の数値データを含む分析対象データを取得し、
前記相関係数算出手順は、前記数値データ間の相関係数を算出し、
前記グループデータ作成手順は、前記相関係数に基づき、相関関係のある数値データ同士をグループ化したグループデータを作成し、
前記データパターン作成手順は、前記数値データ及び前記グループデータの少なくとも一方を含むデータパターンを生成し、
前記分析モデル作成手順は、前記データパターンごとの分析モデルを作成し、
前記モデル精度算出手順は、各分析モデルの精度を算出し、
前記出力手順は、前記分析モデルの精度を出力する。
【0078】
また、本実施形態のプログラムは、コンピュータを、分析対象データ取得手順、相関係数算出手順、グループデータ作成手順、データパターン作成手順、分析モデル作成手順、モデル精度算出手順、及び出力手順として機能させるプログラムということもできる。
【0079】
本実施形態のプログラムは、前記本発明の分析モデル作成支援装置および分析モデル作成支援方法における記載を援用できる。前記各手順は、例えば、「手順」を「処理」と読み替え可能である。また、本実施形態のプログラムは、例えば、コンピュータ読み取り可能な記録媒体に記録されてもよい。前記記録媒体は、例えば、非一時的なコンピュータ可読記録媒体(non-transitory computer-readable storage medium)である。前記記録媒体は、特に制限されず、例えば、ランダムアクセスメモリ(RAM)、読み出し専用メモリ(ROM)、ハードディスク(HD)、光ディスク、フロッピー(登録商標)ディスク(FD)等があげられる。
【0080】
以上、実施形態を参照して本発明を説明したが、本発明は、上記実施形態に限定されるものではない。本発明の構成や詳細には、本発明のスコープ内で当業者が理解しうる様々な変更をできる。
【0081】
<付記>
上記の実施形態の一部または全部は、以下の付記のように記載されうるが、以下には限られない。
(付記1)
分析対象データ取得部、相関係数算出部、グループデータ作成部、データパターン作成部、分析モデル作成部、モデル精度算出部、及び出力部を含み、
前記分析対象データ取得部は、複数の数値データを含む分析対象データを取得し、
前記相関係数算出部は、前記数値データ間の相関係数を算出し、
前記グループデータ作成部は、前記相関係数に基づき、相関関係のある数値データ同士をグループ化したグループデータを作成し、
前記データパターン作成部は、前記数値データ及び前記グループデータの少なくとも一方を含むデータパターンを生成し、
前記分析モデル作成部は、前記データパターンごとの分析モデルを作成し、
前記モデル精度算出部は、各分析モデルの精度を算出し、
前記出力部は、前記分析モデルの精度を出力する、分析モデル作成支援装置。
(付記2)
相関係数出力部及び相関閾値取得部を含み、
前記相関係数出力部は、前記数値データ間の相関係数を出力し、
前記相関閾値取得部は、前記数値データ間の相関閾値を取得し、
前記グループデータ作成部は、前記相関係数及び前記相関閾値に基づき、数値データ間の相関関係を判定し、相関関係があると判定された数値データ同士をグループ化したグループデータを作成する、付記1記載の分析モデル作成支援装置。
(付記3)
グループデータ出力部及び代表データ取得部を含み、
前記グループデータ出力部は、前記グループデータを出力し、
前記代表データ取得部は、前記グループデータごとに、分析モデルの作成に使用する代表データを取得し、
前記分析モデル作成部は、前記グループデータを含むデータパターンの分析モデルの作成において、前記グループデータの数値データとして、前記代表データを使用して分析モデルを作成する、付記1又は2記載の分析モデル作成支援装置。
(付記4)
スコア定義情報取得部及びデータスコア算出部を含み、
前記スコア定義情報取得部は、前記数値データのスコア定義情報を取得し、
前記スコア定義情報は、前記分析モデルの精度と、データのスコア定義とが紐づけられた情報であり、
前記データスコア算出部は、前記分析モデルの精度と、前記スコア定義情報とに基づき、前記分析モデルの作成に使用した数値データごとのスコアを算出し、
前記出力部は、前記数値データのスコアを出力する、付記1から3のいずれかに記載の分析モデル作成支援装置。
(付記5)
選択データ取得部を含み、
前記選択データ取得部は、選択データ情報を取得し、
前記選択データ情報は、前記数値データのスコアに基づいてユーザが選択した選択データを含み、
前記データパターン作成部は、前記選択データ情報に基づき、データパターンを再作成し、
前記分析モデル作成部は、前記再作成されたデータパターンごとの分析モデルを作成し、
前記モデル精度算出部は、各分析モデルの精度を算出し、
前記出力部は、前記分析モデルの精度を出力する、付記4記載の分析モデル作成支援装置。
(付記6)
分析対象データ取得工程、相関係数算出工程、グループデータ作成工程、データパターン作成工程、分析モデル作成工程、モデル精度算出工程、及び出力工程を含み、
前記分析対象データ取得工程は、複数の数値データを含む分析対象データを取得し、
前記相関係数算出工程は、前記数値データ間の相関係数を算出し、
前記グループデータ作成工程は、前記相関係数に基づき、相関関係のある数値データ同士をグループ化したグループデータを作成し、
前記データパターン作成工程は、前記数値データ及び前記グループデータの少なくとも一方を含むデータパターンを生成し、
前記分析モデル作成工程は、前記データパターンごとの分析モデルを作成し、
前記モデル精度算出工程は、各分析モデルの精度を算出し、
前記出力工程は、前記分析モデルの精度を出力する、分析モデル作成支援方法。
(付記7)
相関係数出力工程及び相関閾値取得工程を含み、
前記相関係数出力工程は、前記数値データ間の相関係数を出力し、
前記相関閾値取得工程は、前記数値データ間の相関閾値を取得し、
前記グループデータ作成工程は、前記相関係数及び前記相関閾値に基づき、数値データ間の相関関係を判定し、相関関係があると判定された数値データ同士をグループ化したグループデータを作成する、付記6記載の分析モデル作成支援方法。
(付記8)
グループデータ出力工程及び代表データ取得工程を含み、
前記グループデータ出力工程は、前記グループデータを出力し、
前記代表データ取得工程は、前記グループデータごとに、分析モデルの作成に使用する代表データを取得し、
前記分析モデル作成工程は、前記グループデータを含むデータパターンの分析モデルの作成において、前記グループデータの数値データとして、前記代表データを使用して分析モデルを作成する、付記6又は7記載の分析モデル作成支援方法。
(付記9)
スコア定義情報取得工程及びデータスコア算出工程を含み、
前記スコア定義情報取得工程は、前記数値データのスコア定義情報を取得し、
前記スコア定義情報は、前記分析モデルの精度と、データのスコア定義とが紐づけられた情報であり、
前記データスコア算出工程は、前記分析モデルの精度と、前記スコア定義情報とに基づき、前記分析モデルの作成に使用した数値データごとのスコアを算出し、
前記出力工程は、前記数値データのスコアを出力する、付記6から8のいずれかに記載の分析モデル作成支援方法。
(付記10)
選択データ取得工程を含み、
前記選択データ取得工程は、選択データ情報を取得し、
前記選択データ情報は、前記数値データのスコアに基づいてユーザが選択した選択データを含み、
前記データパターン作成工程は、前記選択データ情報に基づき、データパターンを再作成し、
前記分析モデル作成工程は、前記再作成されたデータパターンごとの分析モデルを作成し、
前記モデル精度算出工程は、各分析モデルの精度を算出し、
前記出力工程は、前記分析モデルの精度を出力する、付記9記載の分析モデル作成支援方法。
(付記11)
コンピュータに、分析対象データ取得手順、相関係数算出手順、グループデータ作成手順、データパターン作成手順、分析モデル作成手順、モデル精度算出手順、及び出力手順を実行させるためのプログラムであって、
前記分析対象データ取得手順は、複数の数値データを含む分析対象データを取得し、
前記相関係数算出手順は、前記数値データ間の相関係数を算出し、
前記グループデータ作成手順は、前記相関係数に基づき、相関関係のある数値データ同士をグループ化したグループデータを作成し、
前記データパターン作成手順は、前記数値データ及び前記グループデータの少なくとも一方を含むデータパターンを生成し、
前記分析モデル作成手順は、前記データパターンごとの分析モデルを作成し、
前記モデル精度算出手順は、各分析モデルの精度を算出し、
前記出力手順は、前記分析モデルの精度を出力する、プログラム。
(付記12)
相関係数出力手順及び相関閾値取得手順を含み、
前記相関係数出力手順は、前記数値データ間の相関係数を出力し、
前記相関閾値取得手順は、前記数値データ間の相関閾値を取得し、
前記グループデータ作成手順は、前記相関係数及び前記相関閾値に基づき、数値データ間の相関関係を判定し、相関関係があると判定された数値データ同士をグループ化したグループデータを作成する、付記11記載のプログラム。
(付記13)
グループデータ出力手順及び代表データ取得手順を含み、
前記グループデータ出力手順は、前記グループデータを出力し、
前記代表データ取得手順は、前記グループデータごとに、分析モデルの作成に使用する代表データを取得し、
前記分析モデル作成手順は、前記グループデータを含むデータパターンの分析モデルの作成において、前記グループデータの数値データとして、前記代表データを使用して分析モデルを作成する、付記11又は12記載のプログラム。
(付記14)
スコア定義情報取得手順及びデータスコア算出手順を含み、
前記スコア定義情報取得手順は、前記数値データのスコア定義情報を取得し、
前記スコア定義情報は、前記分析モデルの精度と、データのスコア定義とが紐づけられた情報であり、
前記データスコア算出手順は、前記分析モデルの精度と、前記スコア定義情報とに基づき、前記分析モデルの作成に使用した数値データごとのスコアを算出し、
前記出力手順は、前記数値データのスコアを出力する、付記11から13のいずれかに記載のプログラム。
(付記15)
選択データ取得手順を含み、
前記選択データ取得手順は、選択データ情報を取得し、
前記選択データ情報は、前記数値データのスコアに基づいてユーザが選択した選択データを含み、
前記データパターン作成手順は、前記選択データ情報に基づき、データパターンを再作成し、
前記分析モデル作成手順は、前記再作成されたデータパターンごとの分析モデルを作成し、
前記モデル精度算出手順は、各分析モデルの精度を算出し、
前記出力手順は、前記分析モデルの精度を出力する、付記14記載のプログラム。
(付記16)
付記11から15のいずれかに記載のプログラムを記録しているコンピュータ読み取り可能な記録媒体。
【産業上の利用可能性】
【0082】
本発明によれば、分析モデルの作成に使用する数値データを削減することにより、効率的に分析モデルを作成できる。このため、本発明は、例えば、数値データを用いて分析を行う様々な分野において有用である。
【符号の説明】
【0083】
10、10A、10B、10C、10D 分析モデル作成支援装置
11 分析対象データ取得部
12 相関係数算出部
13 グループデータ作成部
14 データパターン作成部
15 分析モデル作成部
16 モデル精度算出部
17 出力部
21 相関係数出力部
22 相関閾値取得部
31 グループデータ出力部
32 代表データ取得部
41 スコア定義情報取得部
42 データスコア算出部
51 選択データ取得部
101 CPU
102 メモリ
103 バス
104 記憶装置
105 プログラム
106 入力装置
107 表示装置
108 通信デバイス

図1
図2
図3
図4
図5
図6
図7
図8
図9
図10
図11