IP Force 特許公報掲載プロジェクト 2022.1.31 β版

知財求人 - 知財ポータルサイト「IP Force」

▶ セイコーエプソン株式会社の特許一覧

特開2024-130662要因要素の抽出方法およびコンピュータープログラム
(19)【発行国】日本国特許庁(JP)
(12)【公報種別】公開特許公報(A)
(11)【公開番号】P2024130662
(43)【公開日】2024-09-30
(54)【発明の名称】要因要素の抽出方法およびコンピュータープログラム
(51)【国際特許分類】
   G06N 20/00 20190101AFI20240920BHJP
   G06Q 50/04 20120101ALI20240920BHJP
【FI】
G06N20/00 130
G06Q50/04
【審査請求】未請求
【請求項の数】18
【出願形態】OL
(21)【出願番号】P 2023040512
(22)【出願日】2023-03-15
(71)【出願人】
【識別番号】000002369
【氏名又は名称】セイコーエプソン株式会社
(74)【代理人】
【識別番号】100179475
【弁理士】
【氏名又は名称】仲井 智至
(74)【代理人】
【識別番号】100216253
【弁理士】
【氏名又は名称】松岡 宏紀
(74)【代理人】
【識別番号】100225901
【弁理士】
【氏名又は名称】今村 真之
(72)【発明者】
【氏名】眞柄 慎司
(72)【発明者】
【氏名】平岡 雅芸
(72)【発明者】
【氏名】青島 一郎
【テーマコード(参考)】
5L049
5L050
【Fターム(参考)】
5L049CC04
5L050CC04
(57)【要約】
【課題】収集したデータから層別分析に有用な要因要素として目的変数の説明変数を抽出する過程において、説明変数が量的データである場合に、量的データをカテゴリカルデータに変換した上で、層別分析に有用な要因要素を抽出できる技術を提供する。
【解決手段】要因要素の抽出方法は、データセットを準備する準備工程と、予測二値ラベルを付与する分類工程と、第1状態を示す正解二値ラベルが付与された対象の総数に対する、複数の対象ごとにおける第1状態を示す正解二値ラベルと一致する予測二値ラベルの数の割合である一致率が、予め定められた抽出閾値以上となるN個の候補要因要素を、目的変数の説明変数となる要因要素として抽出する抽出工程と、を備える。
【選択図】図2
【特許請求の範囲】
【請求項1】
対象を層別する場合における要因要素の抽出方法であって、
複数の前記対象ごとに、(i)前記対象が第1状態と第2状態とのいずれか一方の状態であることを示す目的変数である二値ラベルである正解二値ラベルと、(ii)前記対象に対するラベル分類の要因となり得るM個(Mは、2以上の整数)の候補要因要素ごとに取得された量的データと、を関連付けたデータセットを準備する準備工程と、
前記量的データを前記第1状態と前記第2状態とに分類する分類閾値を前記候補要因要素ごとに設定して、前記候補要因要素ごとの前記分類閾値により、前記候補要因要素ごとに前記量的データをラベル分類することで、複数の前記量的データのそれぞれに対して、前記二値ラベルである予測二値ラベルを付与する分類工程と、
前記第1状態を示す前記正解二値ラベルが付与された前記対象の総数に対する、複数の前記対象ごとにおける前記第1状態を示す前記正解二値ラベルと一致する前記予測二値ラベルの数の割合である一致率が、予め定められた抽出閾値以上となるN個(Nは、1以上M未満の整数)の前記候補要因要素を、前記目的変数の説明変数となる前記要因要素として抽出する抽出工程と、を備える、要因要素の抽出方法。
【請求項2】
請求項1に記載の要因要素の抽出方法であって、
前記抽出工程は、
(i)複数の前記候補要因要素の中から、複数の前記対象ごとにおいて、前記第1状態を示す前記正解二値ラベルと、前記第1状態を示す前記予測二値ラベルと、の一致率が最も高い前記候補要因要素を前記要因要素として抽出する抽出処理工程と、
(ii)前記第1状態を示す前記正解二値ラベルが付与された前記対象の総数に対する、前記抽出処理工程によって抽出された前記要因要素において、前記一致率の算出元のラベルである前記第1状態を示す前記予測二値ラベルの数の割合である占有割合が、予め定められた割合閾値以上であるか否かを判定する判定処理工程と、を備え、
前記占有割合が前記割合閾値以上である場合には、前記抽出工程を終了し、前記占有割合が前記割合閾値未満である場合には、前記抽出工程において、さらに、他の前記要因要素を抽出するために次ルーチンの前記抽出処理工程および前記判定処理工程を実行し、
前記次ルーチンにおける前記抽出処理工程では、前回までのルーチンにおいて抽出された前記要因要素を除いた複数の前記候補要因要素のうちで、前記前回までのルーチンにおいて前記一致率の算出元となった前記第1状態を示す前記正解二値ラベルが付与された前記対象を除いた残りの複数の前記対象ごとにおいて、前記第1状態を示す前記正解二値ラベルと一致する前記第1状態を示す前記予測二値ラベルの数の割合を前記一致率とみなして、前記一致率が最も高い前記候補要因要素を前記要因要素として抽出し、
前記次ルーチンにおける前記判定処理工程では、前記第1状態を示す前記正解二値ラベルが付与された前記対象の総数に対する、前記次ルーチンを含む今までの各ルーチンにおける前記一致率の算出元のラベルである前記第1状態を示す前記予測二値ラベルの総数の割合を前記占有割合とみなして、前記占有割合が前記割合閾値以上であるか否かを判定する、要因要素の抽出方法。
【請求項3】
請求項1に記載の要因要素の抽出方法であって、
前記分類工程は、前記分類閾値を設定する閾値設定工程を含み、
前記閾値設定工程は、複数の前記量的データに対して、前記候補要因要素ごとに決定木によって前記二値ラベルのラベル分類を行い、前記決定木において分岐条件となる値を前記分類閾値として設定する、要因要素の抽出方法。
【請求項4】
請求項3に記載の要因要素の抽出方法であって、
前記対象は、P個(Pは、4以上の整数)であり、
前記閾値設定工程は、前記決定木の分岐回数を2回以下にすることで、前記分類閾値の設定数を2個以下に制限する、要因要素の抽出方法。
【請求項5】
請求項4に記載の要因要素の抽出方法であって、
前記閾値設定工程は、前記決定木において、最初の分岐点である第1分岐点からさらに第2分岐点と第3分岐点とで分岐している場合に、前記第2分岐点を除外して前記第1分岐点と前記第3分岐点とで前記決定木を分岐させた状態における前記一致率である第1の一致率と、前記第3分岐点を除外して前記第1分岐点と前記第2分岐点とで前記決定木を分岐させた状態における前記一致率である第2の一致率と、を比較して、前記一致率が高い方の前記決定木における前記分岐点を、前記分類閾値に設定することで、前記分類閾値の前記設定数を2個に制限する、要因要素の抽出方法。
【請求項6】
請求項5に記載の要因要素の抽出方法であって、
前記閾値設定工程は、さらに、前記第2分岐点と前記第3分岐点とのうち、前記一致率がより低い前記分岐点を除外した前記決定木において、前記第1分岐点により定まる前記分類閾値により分類された後に、前記第2分岐点と前記第3分岐点とのいずれか一方の前記分岐点が除外されたことにより分類されることなく前記予測二値ラベルが出力される前記量的データについて、前記正解二値ラベルのうち、前記第1状態であることを示す前記正解二値ラベルの付与率が、前記第2状態であることを示す前記正解二値ラベルの付与率よりも高い場合には、前記第1状態であることを示す前記予測二値ラベルを出力し、前記第2状態であることを示す前記正解二値ラベルの前記付与率が、前記第1状態であることを示す前記正解二値ラベルの前記付与率よりも高い場合には、前記第2状態であることを示す前記予測二値ラベルを出力するラベル選定工程を含む、要因要素の抽出方法。
【請求項7】
請求項1に記載の要因要素の抽出方法であって、さらに、
前記正解二値ラベルと、前記抽出工程によって抽出された前記要因要素ごとの前記量的データに対して付与された前記予測二値ラベルと、を前記対象ごとに関連付けることで、前記目的変数と前記説明変数との関係をテーブル形式で表す初期テーブルデータを生成する初期テーブル生成工程を含むテーブル生成工程と、
前記初期テーブルデータに含まれる前記目的変数と前記説明変数との関係をベン図によって表す初期ベン図データを生成する初期ベン図生成工程を含むベン図生成工程と、
表示部によって、前記初期テーブルデータと前記初期ベン図データとを表示する初期表示工程を含むデータ表示工程と、を備える、要因要素の抽出方法。
【請求項8】
請求項7に記載の要因要素の抽出方法であって、
前記データ表示工程は、さらに、前記初期テーブルデータのいずれかに含まれる情報が使用者によって選択された場合に、前記初期テーブルデータにおいて選択された情報である第1選択情報に相当する前記初期ベン図データの領域である第1被選択領域を他の領域とは異なる表示態様で表示し、前記初期ベン図データに含まれるいずれかの領域が前記使用者によって選択された場合に、前記初期ベン図データにおいて選択された領域である第1選択領域に相当する前記初期テーブルデータの情報である第1被選択情報を他の情報とは異なる表示態様で表示する第1表示変更工程を含む、要因要素の抽出方法。
【請求項9】
請求項8に記載の要因要素の抽出方法であって、
前記第1表示変更工程は、前記初期テーブルデータに含まれるいずれかの情報が前記使用者によって選択された場合に、前記第1選択情報と前記第1被選択領域とをハイライト表示し、前記初期ベン図データに含まれるいずれかの領域が前記使用者によって選択された場合に、前記第1選択領域と前記第1被選択情報とをハイライト表示する、要因要素の抽出方法。
【請求項10】
請求項7に記載の要因要素の抽出方法であって、
前記データ表示工程は、さらに、前記初期テーブルデータにおいて選択された情報である第1選択情報と、前記初期ベン図データにおいて選択された領域である第1選択領域と、の少なくとも一方に関連する第1関連情報を前記表示部に表示する第1表示追加工程を含む、要因要素の抽出方法。
【請求項11】
請求項7に記載の要因要素の抽出方法であって、
前記データ表示工程は、さらに、
使用者が入力により指示を行うための第1入力指示画面を前記表示部に表示させる第1画面表示工程と、
前記第1画面表示工程において入力された前記指示を基に、前記初期テーブルデータに含まれるデータを更新する第1更新工程と、を含み、
前記第1入力指示画面は、前記初期ベン図データと、前記初期テーブルデータに含まれる前記データの編集内容を指定するための第1操作画面と、を含む、要因要素の抽出方法。
【請求項12】
請求項7に記載の要因要素の抽出方法であって、
前記抽出工程において前記要因要素として抽出される前記候補要因要素の数は4以上であり、
前記テーブル生成工程は、さらに、
(1a)前記初期テーブルデータに含まれる前記予測二値ラベルを前記要因要素ごとに分類したデータ群を生成するデータ群生成工程と、
(1b)複数の前記データ群にそれぞれ含まれる同一の前記対象について付与された前記予測二値ラベル同士を、予め定められた演算方法により、前記第1状態であることを示す前記予測二値ラベルと、前記第2状態であることを示す前記予測二値ラベルと、のいずれかの前記予測二値ラベルに分類し直すことで、前記データ群生成工程において生成した複数の前記データ群をまとめた複合データ群を生成するデータ群統合工程と、
(1c)前記正解二値ラベルと、前記複合データ群ごとに付与された前記予測二値ラベルと、を前記対象ごとに関連付けることで、前記目的変数と前記複合データ群との関係を前記テーブル形式で表す複合テーブルデータを生成する複合テーブル生成工程と、
(1d)前記正解二値ラベルと、前記複合データ群に含まれる前記データ群ごとの前記予測二値ラベルと、を前記対象ごとに関連付けることで、前記目的変数と前記複合データ群に含まれる前記データ群との関係を前記テーブル形式で表す詳細テーブルデータを生成する詳細テーブル生成工程と、を含み、
前記ベン図生成工程は、さらに、
(2a)前記複合テーブルデータに含まれる前記目的変数と前記複合データ群との関係を前記ベン図によって表す複合ベン図データを生成する複合ベン図生成工程と、
(2b)前記詳細テーブルデータに含まれる前記目的変数と前記データ群との関係を前記ベン図によって表す詳細ベン図データを生成する詳細ベン図生成工程と、を含み、
前記データ表示工程は、さらに、
(3a)前記表示部によって、前記複合テーブルデータと前記複合ベン図データとを表示する複合表示工程と、
(3b)前記複合テーブルデータと前記複合ベン図データとが前記表示部に表示された状態において、前記複合テーブルデータに含まれるいずれかの情報と、前記複合ベン図データに含まれるいずれかの領域と、の少なくとも一方が使用者によって選択された場合に、前記複合テーブルデータおよび前記複合ベン図データからドリルダウンすることで、選択された前記情報と選択された前記領域との少なくとも一方を含む前記詳細テーブルデータおよび前記詳細ベン図データを前記表示部に階層的に表示する階層表示工程と、を含む、要因要素の抽出方法。
【請求項13】
請求項12に記載の要因要素の抽出方法であって、
前記データ表示工程は、さらに、
前記複合テーブルデータのいずれかに含まれる情報が使用者によって選択された場合に、前記複合テーブルデータにおいて選択された情報である第2選択情報に相当する前記複合ベン図データの領域である第2被選択領域を他の領域とは異なる表示態様で表示し、前記複合ベン図データに含まれるいずれかの領域が前記使用者によって選択された場合に、前記複合ベン図データにおいて選択された領域である第2選択領域に相当する前記複合テーブルデータの情報である第2被選択情報を他の情報とは異なる表示態様で表示する第2表示変更工程と、
前記詳細テーブルデータのいずれかに含まれる情報が使用者によって選択された場合に、前記詳細テーブルデータにおいて選択された情報である第3選択情報に相当する前記詳細ベン図データの領域である第3被選択領域を他の領域とは異なる表示態様で表示し、前記詳細ベン図データに含まれるいずれかの領域が前記使用者によって選択された場合に、前記詳細ベン図データにおいて選択された領域である第3選択領域に相当する前記詳細テーブルデータの情報である第3被選択情報を他の情報とは異なる表示態様で表示する第3表示変更工程と、を含む、要因要素の抽出方法。
【請求項14】
請求項13に記載の要因要素の抽出方法であって、
前記第2表示変更工程は、前記複合テーブルデータに含まれるいずれかの情報が前記使用者によって選択された場合に、前記第2選択情報と前記第2被選択領域とをハイライト表示し、前記複合ベン図データに含まれるいずれかの領域が前記使用者によって選択された場合に、前記第2選択領域と前記第2被選択情報とをハイライト表示し、
前記第3表示変更工程は、前記詳細テーブルデータに含まれるいずれかの情報が前記使用者によって選択された場合に、前記第3選択情報と前記第3被選択領域とをハイライト表示し、前記詳細ベン図データに含まれるいずれかの領域が前記使用者によって選択された場合に、前記第3選択領域と前記第3被選択情報とをハイライト表示する、要因要素の抽出方法。
【請求項15】
請求項12に記載の要因要素の抽出方法であって、
前記データ表示工程は、さらに、
前記複合テーブルデータにおいて選択された情報である第2選択情報と、前記複合ベン図データにおいて選択された領域である第2選択領域と、の少なくとも一方に関連する第2関連情報を前記表示部に表示する第2表示追加工程と、
前記詳細テーブルデータにおいて選択された情報である第3選択情報と、前記詳細ベン図データにおいて選択された領域である第3選択領域と、の少なくとも一方に関連する第3関連情報を前記表示部に表示する第3表示追加工程と、を含む、要因要素の抽出方法。
【請求項16】
請求項12に記載の要因要素の抽出方法であって、
前記データ表示工程は、さらに、
使用者が入力により指示を行うための第2入力指示画面を前記表示部に表示させる第2画面表示工程と、
前記第2画面表示工程において入力された前記指示を基に、前記複合テーブルデータに含まれるデータを更新する第2更新工程と、を含み、
前記第2入力指示画面は、前記複合ベン図データと、前記複合テーブルデータに含まれる前記データの編集内容を指定するための第2操作画面と、を含む、要因要素の抽出方法。
【請求項17】
請求項12に記載の要因要素の抽出方法であって、
前記データ表示工程は、さらに、
前記使用者が入力により指示を行うための第3入力指示画面を前記表示部に表示させる第3画面表示工程と、
前記第3画面表示工程において入力された前記指示を基に、前記詳細テーブルデータに含まれるデータを更新する第3更新工程と、を含み、
前記第3入力指示画面は、前記詳細ベン図データと、前記詳細テーブルデータに含まれる前記データの編集内容を指定するための第3操作画面と、を含む、要因要素の抽出方法。
【請求項18】
対象を層別する場合における要因要素の抽出を行うためのコンピュータープログラムであって、
複数の前記対象ごとに、(i)前記対象が第1状態と第2状態とのいずれか一方の状態であることを示す目的変数である二値ラベルである正解二値ラベルと、(ii)前記対象に対するラベル分類の要因となり得るM個(Mは、2以上の整数)の候補要因要素ごとに取得された量的データと、を関連付けたデータセットを準備する準備機能と、
前記量的データを前記第1状態と前記第2状態とに分類する分類閾値を前記候補要因要素ごとに設定して、前記候補要因要素ごとの前記分類閾値により、前記候補要因要素ごとに前記量的データをラベル分類することで、複数の前記量的データのそれぞれに対して、前記二値ラベルである予測二値ラベルを付与する分類機能と、
前記第1状態を示す前記正解二値ラベルが付与された前記対象の総数に対する、複数の前記対象ごとにおける前記第1状態を示す前記正解二値ラベルと一致する前記予測二値ラベルの数の割合である一致率が、予め定められた抽出閾値以上となるN個(Nは、1以上M未満の整数)の前記候補要因要素を、前記目的変数の説明変数となる前記要因要素として抽出する抽出機能と、を備える、コンピュータープログラム。
【発明の詳細な説明】
【技術分野】
【0001】
本開示は、要因要素の抽出方法およびコンピュータープログラムの技術に関する。
【背景技術】
【0002】
従来、製品に品質上の不具合が発生した場合に実施する要因解析において、収集したデータをグループ分けして、グループごとに分析する層別分析に関する技術が知られている(特許文献1)。
【先行技術文献】
【特許文献】
【0003】
【特許文献1】特開2004-206454号公報
【発明の概要】
【発明が解決しようとする課題】
【0004】
収集したデータに対して層別分析を実行する場合、目的変数としてカテゴリカルデータを出力する必要がある。収集したデータから層別分析に有用な要因要素として目的変数の説明変数を抽出する過程において、説明変数が量的データである場合には、量的データをカテゴリカルデータに変換した上で、層別分析に有用な要因要素を抽出することが求められる。
【課題を解決するための手段】
【0005】
(1)本開示の一形態によれば、要因要素の抽出方法が提供される。対象を層別する場合における要因要素の抽出方法は、複数の前記対象ごとに、(i)前記対象が第1状態と第2状態とのいずれか一方の状態であることを示す目的変数である二値ラベルである正解二値ラベルと、(ii)前記対象に対するラベル分類の要因となり得るM個(Mは、2以上の整数)の候補要因要素ごとに取得された量的データと、を関連付けたデータセットを準備する準備工程と、前記量的データを前記第1状態と前記第2状態とに分類する分類閾値を前記候補要因要素ごとに設定して、前記候補要因要素ごとの前記分類閾値により、前記候補要因要素ごとに前記量的データをラベル分類することで、複数の前記量的データのそれぞれに対して、前記二値ラベルである予測二値ラベルを付与する分類工程と、前記第1状態を示す前記正解二値ラベルが付与された前記対象の総数に対する、複数の前記対象ごとにおける前記第1状態を示す前記正解二値ラベルと一致する前記予測二値ラベルの数の割合である一致率が、予め定められた抽出閾値以上となるN個(Nは、1以上M未満の整数)の前記候補要因要素を、前記目的変数の説明変数となる前記要因要素として抽出する抽出工程と、を備える。
【0006】
(2)本開示の他の形態によれば、コンピュータープログラムが提供される。対象を層別する場合における要因要素の抽出を行うためのコンピュータープログラムは、複数の前記対象ごとに、(i)前記対象が第1状態と第2状態とのいずれか一方の状態であることを示す目的変数である二値ラベルである正解二値ラベルと、(ii)前記対象に対するラベル分類の要因となり得るM個(Mは、2以上の整数)の候補要因要素ごとに取得された量的データと、を関連付けたデータセットを準備する準備機能と、前記量的データを前記第1状態と前記第2状態とに分類する分類閾値を前記候補要因要素ごとに設定して、前記候補要因要素ごとの前記分類閾値により、前記候補要因要素ごとに前記量的データをラベル分類することで、複数の前記量的データのそれぞれに対して、前記二値ラベルである予測二値ラベルを付与する分類機能と、前記第1状態を示す前記正解二値ラベルが付与された前記対象の総数に対する、複数の前記対象ごとにおける前記第1状態を示す前記正解二値ラベルと一致する前記予測二値ラベルの数の割合である一致率が、予め定められた抽出閾値以上となるN個(Nは、1以上M未満の整数)の前記候補要因要素を、前記目的変数の説明変数となる前記要因要素として抽出する抽出機能と、を備える。
【図面の簡単な説明】
【0007】
図1】抽出システムの概略構成を示すブロック図。
図2】要因要素の抽出方法を示すフローチャート。
図3】データセットの一例を示す図。
図4】分類工程を示すフローチャート。
図5】分類工程の詳細を説明するための図。
図6】閾値設定工程の詳細を説明するための図。
図7】抽出工程を示すフローチャート。
図8】抽出工程の詳細を説明するための図。
図9】テーブル生成工程を示すフローチャート。
図10】第1初期テーブルデータを示す図。
図11】第2初期テーブルデータを示す図。
図12】データ群生成工程を説明するための図。
図13】データ群統合工程の詳細を説明するための図。
図14】複合テーブルデータを示す図。
図15】詳細テーブルデータを示す図。
図16】ベン図生成工程を示すフローチャート。
図17】初期ベン図生成工程を示すフローチャート。
図18】第1テンプレート情報を示す図。
図19】第2テンプレート情報を示す図。
図20】第3テンプレート情報を示す図。
図21】初期変換データを示す図。
図22】初期ベン図データを示す図。
図23】複合ベン図生成工程を示すフローチャート。
図24】複合変換データを示す図。
図25】複合ベン図データを示す図。
図26】詳細ベン図生成工程を示すフローチャート。
図27】詳細変換データを示す図。
図28】詳細ベン図データを示す図。
図29】データ表示工程を示すフローチャート。
図30】初期表示画面と第1入力指示画面とを説明するための図。
図31】第1画面表示工程の後に実行される各工程を示すフローチャート。
図32】第1変更画面を示す図。
図33】第2変更画面を示す図。
図34】第3変更画面を示す図。
図35】新規表示画面を示す図。
図36】除外表示画面を示す図。
図37】第2画面表示工程の後に実行される各工程を示すフローチャート。
図38】第3画面表示工程の後に実行される各工程を示すフローチャート。
【発明を実施するための形態】
【0008】
A.実施形態:
図1は、抽出システム1の概略構成を示すブロック図である。抽出システム1は、対象を層別する場合における要因要素を抽出するためのシステムである。抽出システム1は、M個(Mは、2以上の整数)の候補要因要素の中から、目的変数である二値ラベルの説明変数となる要因要素を抽出する。二値ラベルは、複数の対象ごとに、対象が第1状態と第2状態とのいずれか一方の状態であることを示すラベルである。対象は、例えば、製造設備100を用いて製造される複数の製品や、製品を製造するための複数の製造工程である。候補要因要素は、例えば、製造工程において取得された製造パラメーターである。製造パラメーターは、製品を製造するために予め設定された製造条件である。製造パラメーターは、例えば、電流値、電圧値、周波数、膜圧、寸法、処理温度である。候補要因要素は、例えば、製造パラメーターの時系列変化の傾向を示す特徴パラメーターであってもよい。本実施形態では、抽出システム1は、対象であるP個(Pは、4以上の整数)の製品を不良品と良品とに層別する場合において、M個の候補要因要素の中から、製品が不良品であることを効率的に説明可能な要因要素を抽出する。よって、第1状態であることを示す二値ラベルは、製品が不良品であることを示すラベルである。第2状態であることを示す二値ラベルは、製品が良品であることを示すラベルである。対象とする各製品は、各製造工程において製造された製品を識別するために、製品に割り振られた識別子である製品IDにより区別する。なお、層別の対象、二値ラベルの種類、候補要因要素の種類、製造パラメーターの種類等は、これに限られるものではない。
【0009】
抽出システム1は、測定ユニット9と、抽出装置10と、を備える。測定ユニット9は、各製造工程における製造パラメーターの実測値を測定する複数の測定装置を有する。測定ユニット9を構成する各測定装置は、予め設定された製造パラメーターに応じて製造工程を実行した場合に、製造パラメーターの実測値を測定する。測定装置としては、例えば、電流センサーや電圧センサー、温度センサーが挙げられる。測定ユニット9は、製造工程において測定により取得した物理量である製造パラメーターの実測値を抽出装置10に送信する。なお、抽出システム1は、例えば、抽出装置10の後述する入力操作部5を介した使用者の入力により、製造パラメーターの実測値を取得してもよい。
【0010】
抽出装置10は、通信部3と、表示部4と、入力操作部5と、記憶部6と、CPU2と、を備える。抽出装置10は、例えば、各構成要素2~6を備えるコンピューターである。
【0011】
通信部3は、測定ユニット9等の外部機器と抽出装置10とを通信可能に接続する。表示部4は、CPU2の指令に応じて、各種情報を表示する。表示部4は、例えば、液晶ディスプレイである。入力操作部5は、抽出装置10の使用者からの入力を受け付ける。入力操作部5は、例えば、キーボードやマウスである。記憶部6は、抽出装置10の動作を制御する各種プログラムと、測定ユニット9から送信される測定データと、を含む各種情報を記憶する。記憶部6は、RAMやROM、書き換え可能な不揮発性メモリー等を含む。CPU2は、記憶部6に記憶されたプログラムを展開することにより、分類部22と、抽出部23と、テーブル生成部24と、ベン図生成部25と、表示制御部26として機能する。各機能の詳細は、後述する。
【0012】
図2は、要因要素の抽出方法を示すフローチャートである。本実施形態では、ステップS1の準備工程と、ステップS2の分類工程と、ステップS3の抽出工程と、ステップS4のテーブル生成工程と、ステップS5のベン図生成工程と、ステップS6のデータ表示工程と、がこの順に実行される。
【0013】
抽出方法において、まず、データセットDsを準備する準備工程が実行される。図3は、データセットDsの一例を示す図である。準備工程は、複数の対象Sbごとに、正解二値ラベルLcと量的データQとを関連付けたデータセットDsを準備する工程である。図3に示す例では、データセットDsにおいて、対象Sbである各製品を区別する製品IDと、正解二値ラベルLcと、候補要因要素Pcごとに取得された量的データQと、が関連付けられている。正解二値ラベルLcは、使用者等により、正解を示す二値ラベルとして予め設定されたラベルである。第1正解二値ラベルLc1は、第1状態を示す正解二値ラベルであり、本実施形態では、製品が不良品であることを示す正解二値ラベルLcである。第2正解二値ラベルLc2は、第2状態を示す正解二値ラベルであり、本実施形態では、製品が良品であることを示す正解二値ラベルLcである。量的データQは、対象Sbである製品に対するラベル分類の要因となり得るM個の候補要因要素Pcごとに取得された数値データである。換言すると、量的データQは、製品を不良品と良品とに層別する場合において、製品が不良品であることを効率的に説明可能な要因要素を抽出する手がかりとなる変数としての特徴量である。
【0014】
図2に示すように、準備工程の後に、分類部22は、分類閾値を設定して予測二値ラベルを付与する分類工程を実行する。図4は、分類工程を示すフローチャートである。図5は、分類工程の詳細を説明するための図である。分類工程は、分類閾値Tを候補要因要素Pcごとに設定して、候補要因要素Pcごとの分類閾値Tにより、候補要因要素Pcごとに量的データQをラベル分類することで、複数の各量的データQに予測二値ラベルLpを付与する工程である。分類閾値Tは、量的データQを第1状態と第2状態とにラベル分類するための閾値である。予測二値ラベルLpは、候補要因要素Pcごとの分類閾値により、候補要因要素Pcごとに量的データQをラベル分類したときに、複数の量的データQのそれぞれに付与される二値ラベルである。第1予測二値ラベルLp1は、第1状態を示す予測二値ラベルであり、本実施形態では、製品が不良品であることを示す予測二値ラベルLpである。第2予測二値ラベルLp2は、第2状態を示す予測二値ラベルであり、本実施形態では、製品が良品であることを示す予測二値ラベルLpである。予測二値ラベルLpには、いずれの候補要因要素Pcにより出力された予測二値ラベルLpであるかを示す識別子が紐付けられている。
【0015】
図4に示すように、分類工程では、まず、ステップS210において、分類部22は、データセットDsを取得する。
【0016】
ステップS210の後に、分類部22は、分類閾値Tを設定する閾値設定工程を実行する。図6は、閾値設定工程の詳細を説明するための図である。本実施形態では、分類部22は、閾値設定工程において、複数の量的データQに対して、候補要因要素Pcごとに決定木Dtによって二値ラベルのラベル分類を行い、決定木Dtにおいて分岐条件となる値を分類閾値Tとして設定する。このとき、分類部22は、図5および図6に示すように、閾値設定工程において、決定木Dtの分岐回数を2回以下にすることで、分類閾値Tの設定数を2個以下に制限する。これにより、設定した分類閾値Tによって量的データQをラベル分類した場合に、第1予測二値ラベルLp1と第2予測二値ラベルLp2とのいずれか一方が予測二値ラベルLpとして出力される。以下では、複数の量的データQに対して、候補要因要素Pcごとに決定木Dtによって二値ラベルのラベル分類を行った場合に、決定木Dtにおいて分岐条件となる値が3個存在する場合の分類閾値Tの設定方法について説明する。すなわち、複数の量的データQに対して、候補要因要素Pcごとに決定木Dtによって二値ラベルのラベル分類を行った場合に、決定木Dtの分岐回数が3回となる場合における分類閾値Tの設定方法について説明する。
【0017】
図4に示すように、ステップS220において、分類部22は、複数の量的データQに対して、候補要因要素Pcごとに決定木Dtを実行する。分類部22は、例えば、複数の量的データQに対して、候補要因要素Pcごとに決定木Dtを実行する学習済みの機械学習モデルを用いて、分類閾値Tを設定する。本実施形態では、機械学習モデルに用いられるアルゴリズムは、決定木アルゴリズムである。
【0018】
図4および図6に示すように、ステップS231において「Yes」と判定した場合、すなわち、決定木Dtの分岐回数が3回となることで、分類閾値Tの候補である候補分類閾値が3個抽出されている場合に、分類部22は、以下の処理を実行する。換言すると、決定木Dtにおいて、最初の分岐点Brである第1分岐点Br1からさらに第2分岐点Br2と第3分岐点Br3とに分岐している場合に、分類部22は、以下の処理を実行する。なお、決定木Dtの分岐回数が3回となる場合は、図6に示す第1の場合Pt1と第2の場合Pt2のいずれかである。以下においては、第2分岐点Br2と第3分岐点Br3とのいずれも除外していない決定木Dtを除外前決定木Dt0とも呼ぶ。
【0019】
図6に示す第1の場合Pt1、すなわち、除外前決定木Dt0が第1分岐点Br1からさらに第2分岐点Br2と第3分岐点Br3とに分岐している場合に、分類部22は、図4に示すステップS233において、第1の一致率Mr1を算出する。第1の一致率Mr1は、第1分岐状態Dd1おける、第1正解二値ラベルLc1が付与された対象Sbの総数に対する、複数の対象Sbごとにおける第1正解二値ラベルLc1と一致する第1予測二値ラベルLp1の数の割合である。第1分岐状態Dd1は、図6に示すように、除外前決定木Dt0における第2分岐点Br2を除外して、決定木Dtを第1分岐点Br1と第3分岐点Br3とで分岐させた状態である。つまり、第1の一致率Mr1は、第1分岐状態Dd1における分類閾値Tよって量的データQをラベル分類した場合の分類精度を表す指標である。第1の一致率Mr1が高いほど分類精度は高く、第1の一致率Mr1が低いほど分類精度は低い。以下においては、第1分岐状態Dd1の決定木Dtを第1決定木Dt1とも呼ぶ。
【0020】
図6に示す第2の場合Pt2、すなわち、除外前決定木Dt0が第1分岐点Br1からさらに第2分岐点Br2と第3分岐点Br3とに分岐している場合に、分類部22は、図4に示すステップS235において、第2の一致率Mr2を算出する。第2の一致率Mr2は、第2分岐状態Dd2における、第1正解二値ラベルLc1が付与された対象Sbの総数に対する、複数の対象Sbごとにおける第1正解二値ラベルLc1と一致する第1予測二値ラベルLp1の数の割合である。第2分岐状態Dd2は、図6に示すように、除外前決定木Dt0における第3分岐点Br3を除外して、決定木Dtを第1分岐点Br1と第2分岐点Br2とで分岐させた状態である。つまり、第2の一致率Mr2は、第2分岐状態Dd2における分類閾値Tよって量的データQをラベル分類した場合の分類精度を表す指標である。第2の一致率Mr2が高いほど分類精度は高く、第2の一致率Mr2が低いほど分類精度は低い。以下においては、第2分岐状態Dd2の決定木Dtを第2決定木Dt2とも呼ぶ。なお、ステップS233とステップS235とは、いずれが先に実行されてもよい。
【0021】
図4に示すように、ステップS235の後に、分類部22は、ステップS237において、第1の一致率Mr1と第2の一致率Mr2とを比較して、一致率Mr1,Mr2が高い方の決定木Dt1,Dt2における分岐点Brを分類閾値Tに設定する。具体的には、ステップS237において「Yes」と判定した場合、すなわち、第1の一致率Mr1が第2の一致率Mr2よりも高い場合に、分類部22は、ステップS238において、図6に示す第1決定木Dt1を採用する。そして、分類部22は、第2分岐点Br2を除外した第1決定木Dt1における第1分岐点Br1と第3分岐点Br3との値をそれぞれ、分類閾値Tに設定する。これに対して、図4に示すように、ステップS237において「No」と判定した場合、すなわち、第2の一致率Mr2が第1の一致率Mr1よりも高い場合に、分類部22は、ステップS239において、図6に示す第2決定木Dt2を採用する。そして、分類部22は、第3分岐点Br3を除外した第2決定木Dt2における第1分岐点Br1と第2分岐点Br2との値をそれぞれ、分類閾値Tに設定する。
【0022】
図4に示すように、ステップS238とステップS239とのいずれか一方を実行した後に、分類部22は、予測二値ラベルLpの選定を行うステップS240のラベル選定工程を実行する。ラベル選定工程は、閾値設定工程で採用された決定木Dt1,Dt2において、対象量的データQsの予測二値ラベルLpを選定する工程である。閾値設定工程で採用された決定木Dt1,Dt2とは、第2分岐点Br2と第3分岐点Br3とのうち、一致率Mr1,Mr2がより低い分岐点Br2,Br3を除外した決定木Dtである。対象量的データQsとは、第1分類閾値T1により分類された後に、第2分類閾値T2によって分類されることなく予測二値ラベルLpが出力される量的データQである。第1分類閾値T1は、第1分岐点Br1により定まる分類閾値Tである。第2分類閾値T2は、第2分岐点Br2と第3分岐点Br3とのうち、一致率Mr1,Mr2がより高い分岐点Brにより定まる分類閾値Tである。換言すると、第2分類閾値T2は、ステップS238およびステップS239において除外されることなく、第1決定木Dt1に残された第2分岐点Br2と、第2決定木Dt2に残された第3分岐点Br3と、のいずれかの分岐点Brにより定まる分類閾値Tである。つまり、対象量的データQsは、第2分岐点Br2と第3分岐点Br3とのいずれか一方が除外されたことにより分類されることなく予測二値ラベルLpが出力される量的データQである。
【0023】
ラベル選定工程において、分類部22は、正解二値ラベルLcのうち、第1正解二値ラベルLc1の付与率が第2正解二値ラベルLc2の付与率よりも高い場合には、対象量的データQsに対して、第1予測二値ラベルLp1を出力するように設定する。これに対して、分類部22は、正解二値ラベルLcのうち、第2正解二値ラベルLc2の付与率が第1正解二値ラベルLc1の付与率よりも高い場合には、対象量的データQsに対して、第2予測二値ラベルLp2を出力するように設定する。なお、第1正解二値ラベルLc1の付与率と第2正解二値ラベルLc2の付与率とが同一の場合には、決定木Dtにおいて、第1分岐点Br1のみが形成され、第2分岐点Br2と第3分岐点Br3とは形成されない。そのため、第1正解二値ラベルLc1の付与率と第2正解二値ラベルLc2の付与率とが同一の場合、ステップS233からステップS240までの各ステップは、省略される。
【0024】
図4に示すように、ラベル選定工程の後に、ステップS250において、分類部22は、ラベル一致率Mrを算出する。ラベル一致率Mrは、閾値設定工程で設定した分類閾値Tで予測二値ラベルLpを出力したときの第1正解二値ラベルLc1が付与された対象Sbの総数に対する、複数の対象Sbごとにおける第1正解二値ラベルLc1と一致する第1予測二値ラベルLp1の数の割合である。よって、閾値設定工程において、図6に示す第1決定木Dt1の第1分岐点Br1の値が第1分類閾値T1として設定され、第3分岐点Br3の値が第2分類閾値T2として設定された場合、分類部22は、第1の一致率Mr1をラベル一致率Mrとする。また、閾値設定工程において、第2決定木Dt2の第1分岐点Br1の値が第1分類閾値T1に設定され、第2分岐点Br2の値が第2分類閾値T2に設定された場合、分類部22は、第2の一致率Mr2をラベル一致率Mrとする。
【0025】
ステップS250の後に、分類部22は、ステップS270において、データセットDsに含まれる全ての候補要因要素Pcについて、分類閾値Tの設定とラベル一致率Mrの算出とが完了しているかを確認する。ステップS270において「Yes」と判定した場合、すなわち、データセットDsに含まれる全ての候補要因要素Pcについて、分類閾値Tの設定とラベル一致率Mrの算出とが完了している場合に、分類部22は、分類工程を終了する。これに対して、ステップS270において「No」と判定した場合、すなわち、データセットDsに含まれる少なくとも1個以上の候補要因要素Pcについて、分類閾値の設定とラベル一致率Mrの算出とが完了していない場合に、分類部22は、以下の処理を実行する。この場合、分類部22は、ステップS270において「Yes」と判定するまで、ステップS230からステップS270までの各ステップを繰り返し実行する。
【0026】
図2に示すように、分類工程の後に、抽出部23は、目的変数の説明変数となる候補要因要素Pcを抽出する抽出工程を実行する。図7は、抽出工程を示すフローチャートである。図8は、抽出工程の詳細を説明するための図である。図8には、図7の各ステップに対応するステップ番号を付している。抽出工程は、データセットDsに含まれるN個の候補要因要素Pcの中から、ラベル一致率Mrが予め定められた抽出閾値以上となるN個(Nは、1以上M未満の整数)の候補要因要素Pcを、目的変数の説明変数となる要因要素として抽出する工程である。本実施形態では、図7に示すように、抽出部23は、抽出工程において、抽出処理工程と判定処理工程とをこの順に実行して、説明変数となる要因要素を抽出する。
【0027】
抽出工程において、抽出部23は、まず、初回ルーチンにおける抽出処理工程であるステップS310を実行する。初回ルーチンにおける抽出処理工程では、抽出部23は、データセットDsに含まれる全ての候補要因要素Pcの中から、ラベル一致率Mrが最も高い候補要因要素Pcを、目的変数の説明変数となる要因要素として抽出する。図8に示す例では、ラベル一致率Mrが最も高い候補要因要素Pcは、複数の候補要因要素Pcのうち、候補要因要素Aである。よって、この場合、抽出部23は、候補要因要素Aを要因要素として抽出する。
【0028】
ステップS310の後に、抽出部23は、初回ルーチンにおける判定処理工程を実行する。初回ルーチンにおける判定処理工程では、抽出部23は、第1占有割合Hr1が予め定められた割合閾値以上であるか否かを判定して、抽出した要因要素とは異なる他の要因要素をさらに抽出するか否かを判定する。具体的には、ステップS320において、抽出部23は、図8に示すように、第1占有割合Hr1を算出する。第1占有割合Hr1は、第1正解二値ラベルLc1が付与された対象Sbの総数に対する、抽出処理工程によって抽出された要因要素において、ラベル一致率Mrの算出元のラベルである第1予測二値ラベルLp1の割合である。つまり、図8に示す例では、第1占有割合Hr1は、第1正解二値ラベルLc1が付与された製品の総数に対する、候補要因要素Aについて設定された分類閾値Tにより分類することで出力された第1予測二値ラベルLp1の割合である。
【0029】
図7に示すように、ステップS320の後に、抽出部23は、ステップS330において、第1占有割合Hr1と割合閾値とを比較する。割合閾値は、例えば、第1正解二値ラベルLc1が付与された対象の総数に対して90%となる値である。そして、ステップS330において「Yes」と判定した場合、すなわち、第1占有割合Hr1が割合閾値以上である場合に、抽出部23は、抽出工程を終了する。これに対して、ステップS330において「No」と判定した場合、すなわち、第1占有割合Hr1が割合閾値未満である場合に、抽出部23は、さらに他の要因要素を抽出するために、次ルーチンの抽出処理工程および判定処理工程を実行する。
【0030】
ステップS330において「No」と判定した場合に、抽出部23は、次ルーチンにおける抽出処理工程であるステップS340を実行する。次ルーチンにおける抽出処理工程では、抽出部23は、前回までのルーチンにおいて抽出された候補要因要素Pcを除いた残りの候補要因要素Pcのうちで、ラベル一致率Mrが最も高い候補要因要素Pcを要因要素として抽出する。つまり、分類部22は、残りの対象Sbごとにおいて、第1正解二値ラベルLc1と一致する第1予測二値ラベルLp1の数の割合をラベル一致率Mrとみなして、このラベル一致率Mrが最も高い候補要因要素Pcを要因要素として抽出する。残りの対象Sbとは、前回までのルーチンにおいて抽出された要因要素を除いた複数の候補要因要素Pcのうちで、前回までのルーチンにおいてラベル一致率Mrの算出元となった第1正解二値ラベルLc1が付与された対象Sbを除いた残りの複数の対象Sbである。図8に示す例では、候補要因要素Bは、候補要因要素Aの次にラベル一致率Mrが高い。よって、この場合、抽出部23は、候補要因要素Bを要因要素としてさらに抽出する。
【0031】
ステップS340の後に、抽出部23は、次ルーチンにおける判定処理工程を実行する。次ルーチンにおける判定処理工程では、抽出部23は、第2占有割合Hr2が予め定められた割合閾値以上であるか否かを判定して、今までに抽出した要因要素とは異なる他の要因要素をさらに抽出するか否かを判定する。具体的には、ステップS350において、抽出部23は、図8に示すように、第2占有割合Hr2を算出する。第2占有割合Hr2は、第1正解二値ラベルLc1が付与された対象Sbの総数に対する、次ルーチンを含む今までの各ルーチンにおけるラベル一致率Mrの算出元のラベルである第1予測二値ラベルLp1の総数の割合である。つまり、図8に示す例では、第2占有割合Hr2は、第1正解二値ラベルLc1が付与された製品の総数に対する、候補要因要素Aおよび候補要因要素Bについて設定された各分類閾値Tによりそれぞれ分類することで出力された第1予測二値ラベルLp1の総数の割合である。
【0032】
図7に示すように、ステップS350の後に、抽出部23は、ステップS360において、第2占有割合Hr2と割合閾値とを比較する。ここで言う割合閾値は、ステップS330における割合閾値と同一である。つまり、抽出部23は、第1正解二値ラベルLc1が付与された対象Sbの総数に対する、次ルーチンを含む今までの各ルーチンにおけるラベル一致率Mrの算出元のラベルである第1予測二値ラベルLp1の総数の割合を第1占有割合Hr1とみなして、割合閾値と比較する。そして、ステップS360において「Yes」と判定した場合、すなわち、第2占有割合Hr2が割合閾値以上である場合に、抽出部23は、抽出工程を終了する。一方、ステップS360において「No」と判定した場合、すなわち、第2占有割合Hr2が割合閾値未満である場合に、抽出部23は、第2占有割合Hr2が割合閾値以上となるまで、ステップS340からステップS360までの各ステップを繰り返し実行する。
【0033】
図2に示すように、抽出工程の後に、テーブル生成部24は、テーブルデータを生成するテーブル生成工程を実行する。図9は、テーブル生成工程を示すフローチャートである。
【0034】
ステップS410において、テーブル生成部24は、初期テーブルデータを生成する。初期テーブルデータは、目的変数と説明変数との関係をテーブル形式で表すデータである。図10は、抽出工程において要因要素Pdとして抽出された候補要因要素Pcの数が1以上3以下の場合に生成される初期テーブルデータDpの一例を示す図である。図10では、抽出工程において、複数の候補要因要素Pcの中から、候補要因要素Aと候補要因要素Bとの2個の候補要因要素Pcが要因要素Pdとして抽出された場合を例示している。以下においては、図10に示す初期テーブルデータDpを第1初期テーブルデータDp1とも呼ぶ。図11は、抽出工程において要因要素Pdとして抽出された候補要因要素Pcの数が4以上の場合に生成される初期テーブルデータDpの一例を示す図である。図11では、複数の候補要因要素Pcの中から、候補要因要素Cと候補要因要素Dと候補要因要素Eと候補要因要素Fとの4個の候補要因要素Pcが要因要素Pdとして抽出された場合を例示している。以下においては、図11に示す初期テーブルデータDpを第2初期テーブルデータDp2とも呼ぶ。テーブル生成部24は、正解二値ラベルLcと、抽出工程によって抽出された要因要素Pdごとの量的データQに対して付与された予測二値ラベルLpと、を対象Sbごとに関連付けることで、初期テーブルデータDpを生成する。図10および図11では、17個の製品IDのそれぞれに、正解二値ラベルLcと、要因要素Pdごとの予測二値ラベルLpとが関連付けられている。なお、各予測二値ラベルLpには、いずれの要因要素Pdにより出力された予測二値ラベルLpであるかを示す識別子が紐付けられている。つまり、同一の対象Sbについて、複数の要因要素Pdにより出力された同一種類の予測二値ラベルLp同士は、判別可能である。
【0035】
ステップS420において「No」と判定した場合、すなわち、抽出工程において要因要素Pdとして抽出された候補要因要素Pcの数が1以上3以下である場合、テーブル生成部24は、テーブル生成工程を終了する。つまり、ステップS410において、第1初期テーブルデータDp1が生成された場合、テーブル生成部24は、テーブル生成工程を終了する。
【0036】
ステップS420において「Yes」と判定した場合、すなわち、抽出工程において要因要素Pdとして抽出された候補要因要素Pcの数が4以上である場合、テーブル生成部24は、ステップS430を実行する。つまり、ステップS410において、第2初期テーブルデータDp2が生成された場合、テーブル生成部24は、ステップS430を実行する。なお、ベン図生成部25は、抽出工程において要因要素Pdとして抽出された候補要因要素Pcの数に関わらず、生成した初期テーブルデータDpを記憶部6に記憶させる。
【0037】
図12は、データ群生成工程を説明するための図である。図9に示すように、ステップS430において、テーブル生成部24は、図12に示す初期テーブルデータDp2に含まれる予測二値ラベルLpを要因要素Pdごとに分類したデータ群DgC~DgFを生成するデータ群生成工程を実行する。
【0038】
図9に示すように、ステップS440において、テーブル生成部24は、複合データ群Dgを生成するデータ群統合工程を実行する。図13は、データ群統合工程の詳細を説明するための図である。図13では、図12に示す2個のデータ群DgC,DgDを統合して、第1複合データ群Dg1を生成する場合を例示している。データ群統合工程において、テーブル生成部24は、図12に示す複数のデータ群DgC,DgDにそれぞれ含まれる同一の対象Sbについて付与された予測二値ラベルLp同士を、予め定められた演算方法により、分類し直す。具体的には、図13に示すように、テーブル生成部24は、複数のデータ群DgC,DgDにそれぞれ含まれる同一の対象Sbについて付与された予測二値ラベルLp同士を、第1予測二値ラベルLp1と第2予測二値ラベルLp2とのいずれかに分類し直す。これにより、テーブル生成部24は、データ群生成工程において生成した複数のデータ群DgC,DgDをまとめた第1複合データ群Dg1を生成する。図示は省略するが、テーブル生成部24は、第1複合データ群Dg1と同様に、図12に示す残りの2個のデータ群DgE,DgFを統合して、後述の図14に示す第2複合データ群Dg2を生成する。
【0039】
複合データ群Dgを生成するために用いられる予め定められた演算方法は、例えば、オア演算である。複数のデータ群DgC~DgFのそれぞれに含まれる同一の対象Sbについて付与された予測二値ラベルLp同士を、オア演算により分類し直す場合、テーブル生成部24は、以下の処理を実行する。同一の対象Sbについて、第1要因要素Pd1である要因要素Cと第2要因要素Pd2である要因要素Dとのいずれかにおいて、第1予測二値ラベルLp1が出力されている場合に、テーブル生成部24は、当該対象Sbを第1予測二値ラベルLp1に分類し直す。一方、同一の対象Sbについて、第1要因要素Pd1である要因要素Cと第2要因要素Pd2である要因要素Dとのいずれも、第2予測二値ラベルLp2が出力されている場合に、テーブル生成部24は、当該対象Sbを第2予測二値ラベルLp2に分類し直す。なお、複合データ群Dgを生成するために用いられる予め定められた演算方法は、これに限られるものではない。また、複合データ群Dgに含まれるデータ群DgC~DgFは、使用者による入力により手動で選択されてもよく、クラスター分析等により自動的に選択されてもよい。
【0040】
図9に示すように、ステップS450において、複合テーブルデータを生成する複合テーブル生成工程を実行する。図14は、図11に示す初期テーブルデータDp2から生成された複合テーブルデータDcを示す図である。複合テーブルデータDcは、目的変数と複合データ群Dg1,Dg2との関係をテーブル形式で表すデータである。複合テーブル生成工程において、テーブル生成部24は、正解二値ラベルLcと、複合データ群Dg1,Dg2ごとに付与された予測二値ラベルLpと、を対象Sbごとに関連付けることで、複合テーブルデータDcを生成する。テーブル生成部24は、生成した複合テーブルデータDcを記憶部6に記憶させる。
【0041】
図9に示すように、ステップS460において、テーブル生成部24は、詳細テーブルデータを生成する詳細テーブル生成工程を実行する。図15は、図14に示す第1複合データ群Dg1の詳細をテーブル形式で表す詳細テーブルデータDfを示す図である。詳細テーブルデータDfは、目的変数と複合データ群Dgに含まれるデータ群DgC~DgFとの関係をテーブル形式で表すデータである。詳細テーブル生成工程において、テーブル生成部24は、正解二値ラベルLcと、複合データ群Dgに含まれるデータ群DgC~DgFごとの予測二値ラベルLpと、を対象Sbごとに関連付けることで、詳細テーブルデータDfを生成する。テーブル生成部24は、生成した詳細テーブルデータDfを記憶部6に記憶させる。
【0042】
図2に示すように、テーブル生成工程の後に、ベン図生成部25は、ベン図データを生成するベン図生成工程を実行する。図16は、ベン図生成工程を示すフローチャートである。
【0043】
ステップS510において「No」と判定した場合、すなわち、抽出工程において要因要素Pdとして抽出された候補要因要素Pcの数が1以上3以下である場合、ベン図生成部25は、ステップS520の初期ベン図生成工程を実行して、初期ベン図データを生成する。初期ベン図データは、初期テーブルデータDpに含まれる目的変数と説明変数との関係をベン図によって表すデータである。一方で、ステップS510において「Yes」と判定した場合、すなわち、抽出工程において要因要素Pdとして抽出された候補要因要素Pcの数が4以上である場合、ベン図生成部25は、ステップS530の複合ベン図生成工程と、ステップS540の詳細ベン図生成工程と、をこの順に実行して、複合ベン図データと詳細ベン図データとを生成する。複合ベン図データは、複合テーブルデータDcに含まれる目的変数と説明変数との関係をベン図によって表すデータである。詳細ベン図データは、詳細テーブルデータDfに含まれる目的変数と説明変数との関係をベン図によって表すデータである。
【0044】
図17は、初期ベン図生成工程を示すフローチャートである。初期ベン図生成工程では、ベン図生成部25は、まず、ステップS521において、図10に示す第1初期テーブルデータDp1を取得する。
【0045】
図17に示すように、ステップS521の後に、ベン図生成部25は、ステップS522において、初期テーブルデータDpに含まれる要因要素Pdの数に応じたテンプレート情報を取得する。本実施形態では、テンプレート情報は、記憶部6に予め記憶されている。テンプレート情報は、配置情報と、領域情報と、を含む。配置情報は、全体集合を示す枠内の領域数および領域識別子によって区別される各領域の配置を示す情報である。領域情報は、ベン図の各領域に対応する領域識別子を示す情報である。具体的には、領域情報は、目的変数である正解二値ラベルLcと、説明変数として抽出された各要因要素Pdにより出力される各予測二値ラベルLpと、の組合せに応じた領域を区別するための領域識別子をリスト化した情報である。
【0046】
図18は、第1テンプレート情報Tp1を示す図である。第1テンプレート情報Tp1は、抽出工程において1個の要因要素Pdが抽出されることにより、初期テーブルデータDpに1個の要因要素Pdが含まれる場合に使用される。第1テンプレート情報Tp1は、配置情報としての第1配置情報Sp1と、領域情報としての第1領域情報Ar1と、を含む。抽出工程において1個の要因要素Pdが抽出される場合、目的変数である正解二値ラベルLcと、説明変数として抽出された要因要素Pdにより出力される予測二値ラベルLpと、の組合せは、4通りである。よって、第1配置情報Sp1では、異なる領域識別子A0~A3を割り当てた4個の領域によって全体集合Uが区分される。また、第1領域情報Ar1では、正解二値ラベルLcと第1要因要素Pd1により出力される予測二値ラベルLpとの組合せごとに、異なる領域識別子A0~A3が割り当てられている。
【0047】
図19は、第2テンプレート情報Tp2を示す図である。第2テンプレート情報Tp2は、抽出工程において2個の要因要素Pdが抽出されることにより、初期テーブルデータDpに2個の要因要素Pdが含まれる場合に使用される。第2テンプレート情報Tp2は、配置情報としての第2配置情報Sp2と、領域情報としての第2領域情報Ar2と、を含む。抽出工程において2個の要因要素Pdが抽出される場合、目的変数である正解二値ラベルLcと、説明変数として抽出された2個の要因要素Pdによりそれぞれ出力される予測二値ラベルLpと、の組合せは、8通りである。よって、第2配置情報Sp2では、異なる領域識別子A0~A7を割り当てた8個の領域によって全体集合Uが区分される。また、第2領域情報Ar2では、正解二値ラベルLcと第1要因要素Pd1および第2要因要素Pd2により出力される各予測二値ラベルLpとの組合せごとに、異なる領域識別子A0~A7が割り当てられている。
【0048】
図20は、第3テンプレート情報Tp3を示す図である。第3テンプレート情報Tp3は、抽出工程において3個の要因要素Pdが抽出されることにより、初期テーブルデータDpに3個の要因要素Pdが含まれる場合に使用される。第3テンプレート情報Tp3は、配置情報としての第3配置情報Sp3と、領域情報としての第3領域情報Ar3と、を含む。抽出工程において3個の要因要素Pdが抽出される場合、目的変数である正解二値ラベルLcと、説明変数として抽出された3個の要因要素Pdによりそれぞれ出力される予測二値ラベルLpと、の組合せは、16通りである。よって、第3配置情報Sp3では、異なる領域識別子A0~A15を割り当てた16個の領域によって全体集合Uが区分される。また、第3領域情報Ar3では、正解二値ラベルLcと、第1要因要素Pd1、第2要因要素Pd2、および第3要因要素Pd3により出力される予測二値ラベルLpと、の組合せごとに、異なる領域識別子A0~A15が割り当てられている。
【0049】
本実施形態では、図10に示すように、第1初期テーブルデータDp1には、第1要因要素Pd1としての要因要素Aと、第2要因要素Pd2としての要因要素Bと、の2個の要因要素Pdが含まれる。よって、ベン図生成部25は、目的変数である正解二値ラベルLcと、説明変数として抽出された2個の要因要素Pd1,Pd2により出力される各予測二値ラベルLpと、の関係を表すために、図17に示すステップS522において、図19に示す第2テンプレート情報Tp2を取得する。
【0050】
図17に示すように、ステップS522の後に、ベン図生成部25は、第1初期テーブルデータDp1から初期ベン図データを生成するための初期変換データ生成工程を実行する。図21は、図10に示す第1初期テーブルデータDp1から生成された初期変換データEpを示す図である。図17に示すように、初期変換データ生成工程では、ベン図生成部25は、まず、ステップS523において、第1初期テーブルデータDp1に含まれる正解二値ラベルLcおよび予測二値ラベルLpをそれぞれ、「0」と「1」とのいずれか一方によって表される2進数に変換する。本実施形態では、図21に示すように、ベン図生成部25は、第1正解二値ラベルLc1を「1」に変換し、第2正解二値ラベルLc2を「0」に変換している。また、ベン図生成部25は、第1予測二値ラベルLp1を「1」に変換し、第2予測二値ラベルLp2を「0」に変換している。
【0051】
図17に示すように、ステップS523の後に、ベン図生成部25は、ステップS524において、第1初期テーブルデータDp1に含まれる対象Sbごとに、初期ビット情報Bi1を生成する。初期ビット情報Bi1は、各対象Sbの正解二値ラベルLcと要因要素Pdごとの予測二値ラベルLpとを2進数に変換した2進数値を、予め定められた並び順により並べた数値列を示す情報である。本実施形態では、正解二値ラベルLcと要因要素Pdごとの予測二値ラベルLpとは、対象Sbごとに合計で3個ずつ存在する。よって、本実施形態における初期ビット情報Bi1は、2進数値を3個並べることにより生成される3桁の数値列を示す情報である。このとき、ベン図生成部25は、例えば、正解二値ラベルLcを2進数に変換した2進数値の位が、予測二値ラベルLpを2進数に変換した2進数値の位よりも小さくなるように、各2進数値を対象Sbごとに並べることで、初期ビット情報Bi1を生成する。本実施形態では、ベン図生成部25は、第1数値を最小桁である一の位とし、第2数値を十の位とし、第3数値を百の位とした初期ビット情報Bi1を生成する。第1数値は、正解二値ラベルLcを2進数に変換した2進数値である。第2数値は、各要因要素Pdにより出力された予測二値ラベルLpを2進数に変換した2進数値である。第3数値は、第2要因要素Pd2により出力された予測二値ラベルLpを2進数に変換した2進数値である。よって、例えば、製品IDが「0008」である対象Sbについて、ベン図生成部25は、「101」という3桁の数値列を初期ビット情報Bi1として生成する。
【0052】
図17に示すように、ステップS524の後に、ベン図生成部25は、ステップS525において、対象Sbごとに生成された初期ビット情報Bi1としての2進数値の数値列を10進数に変換する。これにより、ベン図生成部25は、領域識別子A0~A7に対応する領域番号を対象Sbごとに算出して、領域番号を含む領域識別子を各対象Sbに付与する。例えば、製品IDが「0015」である対象Sbでは、「100」という2進数値の数値列が初期ビット情報Bi1として生成されている。そこで、ベン図生成部25は、2進数値の数値列である「100」を10進数に変換する。このとき、2進数によって表された「100」を10進数によって表すと「4」である。よって、ベン図生成部25は、製品IDが「0015」である対象Sbに対して、10進数に変換することにより導き出された領域番号である「4」を含む領域識別子である「A4」を付与する。また、例えば、製品IDが「0013」である対象Sbでは、「010」という2進数値の数値列が初期ビット情報Bi1として生成されている。このとき、ベン図生成部25は、初期ビット情報Bi1である2進数値の数値列のうち、「1」が付与された最も大きい位よりも上位の「0」を含めることなく無視した状態で10進数に変換する。つまり、製品IDが「0013」である対象Sbでは、ベン図生成部25は、「1」が付与された最も大きい位である十の位よりも上位の百の位の「0」を含めることなく、2進数値の数値列である「10」を10進数に変換する。これにより、ベン図生成部25は、製品IDが「0013」である対象Sbに対して、10進数に変換することにより導き出された領域番号である「2」を含む領域識別子である「A2」を付与する。このように、ベン図生成部25は、第1初期テーブルデータDp1に含まれる全ての対象Sbについて、対象Sbごとに領域識別子A0~A7を付与する。
【0053】
図17に示すように、初期変換データ生成工程の後に、ベン図生成部25は、ステップS526において、テンプレート情報Tp2と初期変換データEpとを用いて、初期ベン図データを生成する。図22は、図21に示す初期変換データEpを用いて図10に示す第1初期テーブルデータDp1から生成した初期ベン図データBpを示す図である。図22に示す初期ベン図データBpでは、各領域の面積は、ラベル一致率Mrと対応していないが、他の実施形態では、初期ベン図データBpの各領域の面積がラベル一致率Mrと一致するように、初期ベン図データBpが生成されてもよい。ベン図生成部25は、生成した初期ベン図データBpを記憶部6に記憶させる。
【0054】
図23は、複合ベン図生成工程を示すフローチャートである。複合ベン図生成工程では、ベン図生成部25は、まず、ステップS531において、図14に示す複合テーブルデータDcを取得する。
【0055】
図23に示すように、ステップS531の後に、ベン図生成部25は、ステップS532において、複合テーブルデータDcに含まれる複合データ群Dgの数に応じたテンプレート情報Tp1~Tp3を取得する。本実施形態では、図14に示すように、複合テーブルデータDcには、第1複合データ群Dg1と第2複合データ群Dg2との2個の複合データ群Dgが含まれる。よって、ベン図生成部25は、目的変数である正解二値ラベルLcと、2個の複合データ群Dgに対応する各予測二値ラベルLpと、の関係を表すために、図19に示す第2テンプレート情報Tp2を取得する。
【0056】
図23に示すように、ステップS532の後に、ベン図生成部25は、複合テーブルデータDcから複合ベン図データを生成するための複合変換データ生成工程を実行する。図24は、図14に示す複合テーブルデータDcから生成された複合変換データEcを示す図である。図23に示すように、複合変換データ生成工程では、ベン図生成部25は、まず、ステップS533において、複合テーブルデータDcに含まれる正解二値ラベルLcおよび予測二値ラベルLpをそれぞれ、「0」と「1」とのいずれか一方によって表される2進数に変換する。本実施形態では、図24に示すように、ベン図生成部25は、第1正解二値ラベルLc1を「1」に変換し、第2正解二値ラベルLc2を「0」に変換している。また、ベン図生成部25は、第1予測二値ラベルLp1を「1」に変換し、第2予測二値ラベルLp2を「0」に変換している。
【0057】
図23に示すように、ステップS533の後に、ベン図生成部25は、ステップS534において、複合テーブルデータDcに含まれる対象Sbごとに、複合ビット情報Bi2を生成する。複合ビット情報Bi2は、各対象Sbの正解二値ラベルLcと複合データ群Dgごとの予測二値ラベルLpとを2進数に変換した2進数値を、予め定められた並び順により並べた数値列を示す情報である。本実施形態では、正解二値ラベルLcと複合データ群Dgごとの予測二値ラベルLpとは、対象Sbごとに合計で3個ずつ存在する。よって、本実施形態における複合ビット情報Bi2は、2進数値を3個並べることにより生成される3桁の数値列を示す情報である。2進数値の並べ方は、前述した初期ビット情報Bi1での並べ方と同様である。
【0058】
図23に示すように、ステップS534の後に、ベン図生成部25は、ステップS535において、対象Sbごとに生成された複合ビット情報Bi2としての2進数値の数値列を10進数に変換する。これにより、ベン図生成部25は、領域識別子A0~A7に対応する領域番号を対象Sbごとに算出して、領域番号を含む領域識別子A0~A7を各対象Sbに付与する。各対象Sbに領域識別子A0~A7を付与する方法は、初期変換データ生成工程と同様である。
【0059】
図23に示すように、複合変換データ生成工程の後に、ベン図生成部25は、ステップS536において、テンプレート情報Tp2と複合変換データEcとを用いて、複合ベン図データを生成する。図25は、図24に示す複合変換データEcを用いて図14に示す複合テーブルデータDcから生成した複合ベン図データBcを示す図である。図25に示す複合ベン図データBcでは、各領域の面積は、ラベル一致率Mrと対応していないが、他の実施形態では、複合ベン図データBcの各領域の面積がラベル一致率Mrと一致するように、複合ベン図データBcが生成されてもよい。ベン図生成部25は、生成した複合ベン図データBcを記憶部6に記憶させる。
【0060】
図26は、詳細ベン図生成工程を示すフローチャートである。詳細ベン図生成工程では、ベン図生成部25は、まず、ステップS541において、図15に示す詳細テーブルデータDfを取得する。
【0061】
図26に示すように、ステップS541の後に、ベン図生成部25は、ステップS542において、詳細テーブルデータDfに含まれる要因要素Pdの数に応じたテンプレート情報Tp1~Tp3を取得する。本実施形態では、図15に示すように、詳細テーブルデータDfには、第1要因要素Pd1としての要因要素Cと、第2要因要素Pd2としての要因要素Dと、の2個の要因要素Pdが含まれる。よって、ベン図生成部25は、目的変数である正解二値ラベルLcと、説明変数として抽出された2個の要因要素Pd1,Pd2により出力される各予測二値ラベルLpと、の関係を表すために、図26に示すステップS542において、図19に示す第2テンプレート情報Tp2を取得する。
【0062】
図26に示すように、ステップS542の後に、ベン図生成部25は、詳細テーブルデータDfから詳細ベン図データを生成するための詳細変換データ生成工程を実行する。図27は、図15に示す詳細テーブルデータDfから生成された詳細変換データEfを示す図である。図26に示すように、詳細変換データ生成工程では、ベン図生成部25は、まず、ステップS543において、詳細テーブルデータDfに含まれる正解二値ラベルLcおよび予測二値ラベルLpをそれぞれ、「0」と「1」とのいずれか一方によって表される2進数に変換する。本実施形態では、図27に示すように、ベン図生成部25は、第1正解二値ラベルLc1を「1」に変換し、第2正解二値ラベルLc2を「0」に変換している。また、ベン図生成部25は、第1予測二値ラベルLp1を「1」に変換し、第2予測二値ラベルLp2を「0」に変換している。
【0063】
図26に示すように、ステップS543の後に、ベン図生成部25は、ステップS544において、詳細テーブルデータDfに含まれる対象Sbごとに、詳細ビット情報Bi3を生成する。詳細ビット情報Bi3は、各対象Sbの正解二値ラベルLcと要因要素Pdごとの予測二値ラベルLpとを2進数に変換した2進数値を、予め定められた並び順により並べた数値列を示す情報である。本実施形態では、正解二値ラベルLcと要因要素Pdごとの予測二値ラベルLpとは、対象Sbごとに合計で3個ずつ存在する。よって、本実施形態における詳細ビット情報Bi3は、2進数値を3個並べることにより生成される3桁の数値列を示す情報である。2進数値の並べ方は、前述した初期ビット情報Bi1での並べ方と同様である。
【0064】
ステップS544の後に、ベン図生成部25は、ステップS545において、対象Sbごとに生成された詳細ビット情報Bi3としての2進数値の数値列を10進数に変換する。これにより、ベン図生成部25は、領域識別子A0~A7に対応する領域番号を対象Sbごとに算出して、領域番号を含む領域識別子A0~A7を各対象Sbに付与する。各対象Sbに領域識別子A0~A7を付与する方法は、初期変換データ生成工程と同様である。
【0065】
図26に示すように、詳細変換データ生成工程の後に、ベン図生成部25は、ステップS546において、テンプレート情報Tp2と詳細変換データEfとを用いて、詳細ベン図データBfを生成する。図28は、図27に示す詳細変換データEfを用いて図15に示す詳細テーブルデータDfから生成した詳細ベン図データBfを示す図である。図28に示す詳細ベン図データBfでは、各領域の面積は、ラベル一致率Mrと対応していないが、他の実施形態では、詳細ベン図データBfの各領域の面積がラベル一致率Mrと一致するように、詳細ベン図データBfが生成されてもよい。ベン図生成部25は、生成した詳細ベン図データBfを記憶部6に記憶させる。
【0066】
図2に示すように、ベン図生成工程の後に、表示制御部26は、テーブルデータDp,Dc,Dfとベン図データBp,Bc,Bfとの少なくとも一方を表示部4に表示させるデータ表示工程を実行する。図29は、データ表示工程を示すフローチャートである。ステップS610で「No」と判定した場合に、表示制御部26は、ステップS620のステップS620以降の各ステップを実行する。ステップS610で「No」と判定される場合とは、抽出工程において要因要素Pdとして抽出された候補要因要素Pcの数が1以上3以下となる場合である。すなわち、ステップS610で「No」と判定される場合とは、複合テーブルデータDcと複合ベン図データBcとが生成されることなく、第1初期テーブルデータDp1と初期ベン図データBpとが生成されている場合である。一方で、ステップS610において「Yes」と判定した場合に、表示制御部26は、ステップS630以降の各ステップを実行する。ステップS610において「Yes」と判定される場合とは、抽出工程において要因要素Pdとして抽出された候補要因要素Pcの数が4以上となる場合である。すなわち、ステップS610において「Yes」と判定される場合とは、初期ベン図データBpが生成されることなく、第2初期テーブルデータDp2と複合テーブルデータDcと複合ベン図データBcとが生成されている場合である。
【0067】
ステップS620において、表示制御部26は、初期表示画面Vpを表示部4に表示させる初期表示工程を実行する。図30は、初期表示画面Vpと第1入力指示画面Gtとを説明するための図である。初期表示画面Vpは、初期表示工程を実行した場合において表示部4に表示される表示画面である。初期表示工程において、表示制御部26は、図10に示す第1初期テーブルデータDp1と、図22に示す初期ベン図データBpとを、表示部4に同時に表示させる。このとき、図10に示す第1初期テーブルデータDp1から生成された図21に示す初期変換データEpでは、領域識別子として「A6」が付与された対象Sbが存在しない。そこで、表示制御部26は、「A6」という領域識別子が割り当てられた領域をグレーアウトさせた状態で、表示部4に初期ベン図データBpを表示させている。
【0068】
図29に示すように、ステップS620の後に、表示制御部26は、ステップS621において、第1入力指示画面Gtを表示部4に表示させる第1画面表示工程を実行する。本実施形態では、第1入力指示画面Gtは、初期ベン図データBpと、第1初期テーブルデータDp1と、第1初期テーブルデータDp1に含まれるデータの編集内容を指定するための第1操作画面Gsと、を含む。本実施形態では、第1操作画面Gsは、第1初期テーブルデータDp1に含まれるデータの編集内容を指定するための2つのチェックボックスCh1,Ch2を含む。なお、第1操作画面Gsの構成は、これに限られるものではない。第1操作画面Gsは、例えば、第1初期テーブルデータDp1に含まれるデータの編集内容を指定する指示リストをプルダウン表示することにより、指示内容の選択肢を選択可能とする構成であってもよい。
【0069】
図31は、第1画面表示工程が実行された後に実行される各工程を示すフローチャートである。図29および図31に示すように、ステップS621の後に、表示制御部26は、ステップS622を実行する。ステップS622において「No」と判定した場合に、表示制御部26は、データ表示工程を終了する。一方で、ステップS622において「Yes」と判定した場合に、表示制御部26は、ステップS623において、更新指示を受け付けたか否かを判定する。表示制御部26は、例えば、第1操作画面Gsに含まれる2つのチェックボックスCh1,Ch2のいずれかが選択されている場合に、更新指示を受け付けたと判定する。なお、ステップS622において「Yes」と判定される場合とは、第3の場合と第4の場合との少なくとも一方の場合である。第3の場合とは、第1入力指示画面Gtに含まれる第1初期テーブルデータDp1のいずれかに含まれる情報が使用者によって選択された場合である。第4の場合とは、第1入力指示画面Gtに含まれる初期ベン図データBpのいずれかに含まれる領域が使用者によって選択された場合である。以下においては、第1初期テーブルデータDp1において、使用者により選択された情報を第1選択情報と呼ぶ。第1選択情報に相当する初期ベン図データBpの領域を第1被選択領域と呼ぶ。初期ベン図データBpにおいて、使用者により選択された領域を第1選択領域と呼ぶ。第1選択領域に相当する第1初期テーブルデータDp1の情報を第1被選択情報と呼ぶ。
【0070】
ステップS623において「No」と判定した場合に、表示制御部26は、ステップS624において、第1変更画面を表示部4に表示させる第1表示変更工程を実行する。第1変更画面は、第1選択領域と、第1選択情報と、第1被選択領域と、第1被選択情報と、の少なくとも1つを、他の領域および情報とは異なる表示態様で表示部4に表示する表示画面である。
【0071】
図32は、第1変更画面Hp1を示す図である。第1変更画面Hp1は、第1入力指示画面Gtに含まれる初期ベン図データBpの1個の領域が使用者によって選択された場合に表示部4に表示される変更画面Hpである。初期ベン図データBpの1個の領域を選択する場合、使用者は、例えば、入力操作部5としてのマウスを操作して、第1入力指示画面Gtに含まれる初期ベン図データBpの各領域のうち、選択したい領域上をクリックする。また、この場合、使用者は、入力操作部5としてのキーボードを操作して、第1入力指示画面Gtに含まれる初期ベン図データBpの各領域のうち、選択したい領域を選択してもよい。図32に示す例では、第1選択領域Sa1は、初期ベン図データBpにおいて、「A7」という領域識別子が付与された領域である。また、第1被選択情報Fi1は、第1初期テーブルデータDp1において、製品IDが「0007」である対象Sbを示す行に記載された情報である。
【0072】
図33は、第2変更画面Hp2を示す図である。第2変更画面Hp2は、第1入力指示画面Gtに含まれる初期ベン図データBpの複数個の領域が使用者によって選択された場合に表示部4に表示される変更画面Hpである。初期ベン図データBpの複数個の領域を選択する場合、使用者は、例えば、入力操作部5としてのマウスを操作して、第1入力指示画面Gtに含まれる初期ベン図データBpの各領域のうち、選択したい領域をドラッグして囲い込む。また、この場合、使用者は、入力操作部5としてのマウスを操作して、選択したい領域間にまたがる境界線上をクリックしてもよい。図33に示す例では、第1選択領域Sa1は、初期ベン図データBpにおいて、「A5」および「A7」という領域識別子が付与された領域である。また、第1被選択情報Fi1は、第1初期テーブルデータDp1において、製品IDが「0007」、「0008」、「0009」、および「0010」である対象Sbを示す行に記載された情報である。
【0073】
図32および図33に示すように、第1表示変更工程において、表示制御部26は、第1選択領域Sa1に相当する第1被選択情報Fi1を、他の情報とは異なる表示態様で表示させる。本実施形態では、表示制御部26は、第1選択領域Sa1と第1被選択情報Fi1とをハイライト表示させている。
【0074】
図34は、第3変更画面Hp3を示す図である。第3変更画面Hp3は、第1初期テーブルデータDp1に含まれる第2要因要素Pd2としての要因要素Bが使用者によって選択された場合に表示部4に表示される変更画面Hpである。第1初期テーブルデータDp1の要因要素Bを選択する場合、使用者は、例えば、入力操作部5としてのマウスを操作して、第1入力指示画面Gtに含まれる第1初期テーブルデータDp1のうち、要因要素Bの予測二値ラベルLpを示す列の見出し部分をクリックする。また、この場合、使用者は、例えば、入力操作部5としてのマウスを操作して、第1入力指示画面Gtに含まれる第1初期テーブルデータDp1の行列のうち、選択したい行列をドラッグして囲い込んでもよい。図34に示す例では、第1選択情報Si1は、第1初期テーブルデータDp1において、要因要素Bを示す列に記載された情報である。また、第1被選択領域Fa1は、初期ベン図データBpにおいて、「A4」、「A5」、および「A7」とう領域識別子が付与された領域である。
【0075】
第1表示変更工程において、表示制御部26は、第1選択情報Si1に相当する第1被選択領域Fa1を、他の情報とは異なる表示態様で表示させる。本実施形態では、表示制御部26は、第1選択情報Si1と第1被選択領域Fa1とのうちで、第1条件および第2条件を満たす対象Sbを示す情報および領域をそれぞれ、異なる表示態様によりハイライト表示させている。第1条件を満たす対象Sbは、正解二値ラベルLcが第1正解二値ラベルLc1であり、かつ、要因要素Bにより出力された予測二値ラベルLpが第1予測二値ラベルLp1である対象Sbである。第2条件を満たす対象Sbは、正解二値ラベルLcが第2正解二値ラベルLc2であり、かつ、要因要素Bにより出力される予測二値ラベルLpが第1予測二値ラベルLp1である対象Sbである。
【0076】
図31に示すように、第1表示変更工程の後に、表示制御部26は、ステップS625において、図34に示す第1関連情報Puを表示部4に表示させる第1表示追加工程を実行する。第1関連情報Puは、第1選択情報Si1と第1選択領域Sa1との少なくとも一方に関連する情報である。本実施形態では、第1関連情報Puは、選択された要因要素Pdの種類と、データ数と、元の不良数と、ラベル一致率Mrと、を表す文字列である。図34に示す例では、データ数は、ハイライト表示した対象Sbの数である。データ数は、第1選択情報Si1ないし第1選択領域Sa1として選択された対象Sbの数であってもよい。また、元の不良数は、データ数としてカウントした対象Sbのうち、第1正解二値ラベルLc1が付与されている対象Sbの数である。なお、表示制御部26は、図32および図33に示す第1変更画面Hpにおいても、第1関連情報Puを表示させてもよい。
【0077】
図31に示すように、ステップS623において「Yes」と判定した場合、表示制御部26は、ステップS627において、第1更新工程を実行する。具体的には、第1更新工程において、表示制御部26は、第1画面表示工程において入力された指示を基に、第1初期テーブルデータDp1に含まれるデータを更新して、新規表示画面や除外表示画面を表示部4に表示させる。
【0078】
図35は、新規表示画面Npの一例を示す図である。新規表示画面Npは、第1選択情報Si1と第1選択領域Sa1とのいずれかが存在し、かつ、第1操作画面Gsに含まれる第1チェックボックスCh1が選択された場合に表示部4に表示される表示画面である。図35では、第1初期テーブルデータDp1に含まれる情報のうち、第1要因要素Pd1としての要因要素Aを示す行と、第2要因要素Pd2としての要因要素Bを示す行とが選択され、かつ、第1チェックボックスCh1が選択された場合を図示している。第1チェックボックスCh1は、第1選択領域Sa1と第1選択情報Si1との少なくともいずれかの選択範囲を基に新規分析を行う指示をするためのチェックボックスである。第1チェックボックスCh1が選択された場合、表示制御部26は、第1初期テーブルデータDp1に第1選択情報Si1に関する新たな情報を追加した更新後テーブルデータRpを生成して、表示部4に表示させる。図35に示す例では、更新後テーブルデータRpは、要因要素Aに係るデータ群DgAと要因要素Bに係るデータ群DgBとを統合した第1複合データ群Dg1に関する情報を第1初期テーブルデータDp1に追加したテーブル形式のデータである。表示制御部26は、例えば、図9に示すステップS430からステップS450までの各ステップと同様の処理を実行することで、第1複合データ群Dg1に関する情報を生成する。
【0079】
さらに、図35に示す例では、表示制御部26は、初期ベン図データBpに含まれる第1被選択領域Fa1と、更新後テーブルデータRpに含まれる追加情報Piと、をハイライト表示させている。追加情報Piは、更新後テーブルデータRpに含まれる情報であって、第1初期テーブルデータDp1に新たに追加された第1複合データ群Dg1に関する情報である。なお、新規表示画面Npの表示態様は、これに限られるものではない。
【0080】
図36は、除外表示画面Kpの一例を示す図である。除外表示画面Kpは、第1選択情報Si1と第1選択領域Sa1とのいずれかが存在し、かつ、第1操作画面Gsに含まれる第2チェックボックスCh2が選択された場合に表示部4に表示される表示画面である。図36では、初期ベン図データBpのうち、領域識別子が「A4」および「A5」である領域が選択され、かつ、第2チェックボックスCh2が選択された場合を図示している。第2チェックボックスCh2は、第1選択領域Sa1と第1選択情報Si1との少なくともいずれかの選択範囲を除外する指示を行うためのチェックボックスである。第2チェックボックスCh2が選択された場合、表示制御部26は、第1初期テーブルデータDp1に含まれる第1選択情報Si1と第1被選択情報Fi1とを、他の情報とは異なる表示態様で表示させる。図36に示す例では、表示制御部26は、初期ベン図データBpに含まれる第1選択領域Sa1と、第1初期テーブルデータDp1に含まれる第1被選択情報Fi1と、をグレーアウトさせた状態で、表示部4に表示させている。なお、除外表示画面Kpの表示態様は、これに限られるものではない。表示制御部26は、例えば、初期ベン図データBpに含まれる第1選択領域Sa1と、第1初期テーブルデータDp1に含まれる第1被選択情報Fi1と、を完全に削除した状態で、表示部4に表示させてもよい。
【0081】
図29に示すように、S610において「Yes」と判定した場合に、表示制御部26は、ステップS630において、複合表示画面を表示部4に表示させる複合表示工程を実行する。複合表示画面は、複合表示工程を実行した場合において表示部4に表示される表示画面である。複合表示工程において、表示制御部26は、図14二示す複合テーブルデータDcと、図25に示す複合ベン図データBcとを、表示部4に同時に表示させる。
【0082】
図29に示すように、複合表示工程の後に、表示制御部26は、ステップS631において、第2入力指示画面を表示部4に表示させる第2画面表示工程を実行する。第2入力指示画面は、例えば、複合ベン図データBcと、複合テーブルデータDcと、複合テーブルデータDcに含まれるデータの編集内容を指定するための第2操作画面と、を含む。
【0083】
第2画面表示工程の後に、表示制御部26は、ステップS640を実行する。ステップS640において「No」と判定した場合に、表示制御部26は、データ表示工程を終了する。一方で、ステップS640において「Yes」と判定した場合に、表示制御部26は、ステップS650を実行する。ステップS650において「No」と判定した場合、すなわち、階層表示指示を受け付けた場合に、表示制御部26は、後述の図37に示すステップS633を実行する。
【0084】
図37は、第2画面表示工程が実行された後に実行される各工程を示すフローチャートである。ステップS633において、表示制御部26は、更新指示を受け付けたか否かを判定する。表示制御部26は、例えば、第2操作画面に含まれるチェックボックスのいずれかが選択されている場合に、更新指示を受け付けたと判定する。なお、ステップS640において「Yes」と判定する場合とは、第5の場合と第6の場合との少なくとも一方の場合である。第5の場合とは、第2入力指示画面に含まれる複合テーブルデータDcのいずれかに含まれる情報が使用者によって選択された場合である。第6の場合とは、第2入力指示画面に含まれる複合ベン図データBcのいずれかに含まれる領域が使用者によって選択された場合である。以下においては、複合テーブルデータDcにおいて、使用者により選択された情報を第2選択情報と呼ぶ。第2選択情報に相当する複合ベン図データBcの領域を第2被選択領域と呼ぶ。複合ベン図データBcにおいて、使用者により選択された領域を第2選択領域と呼ぶ。第2選択領域に相当する複合テーブルデータDcの情報を第2被選択情報と呼ぶ。
【0085】
ステップS633において「No」と判定した場合に、表示制御部26は、ステップS634において、第2変更画面を表示部4に表示させる第2表示変更工程を実行する。第2変更画面は、第2選択領域と、第2選択情報と、第2被選択領域と、第2被選択情報と、の少なくとも1つを、他の領域および情報とは異なる表示態様で表示する表示画面である。第2表示変更工程において、表示制御部26は、例えば、第2選択領域と第2被選択情報とをハイライト表示させる。
【0086】
第2表示変更工程の後に、表示制御部26は、ステップS635において、第2関連情報を表示部4に表示させる第2表示追加工程を実行する。第2関連情報は、第2選択情報と第2選択領域との少なくとも一方に関する情報である。
【0087】
ステップS633において「Yes」と判定した場合、表示制御部26は、ステップS637において、第2更新工程を実行する。具体的には、第2更新工程において、表示制御部26は、第2画面表示工程において入力された指示を基に、複合テーブルデータDcに含まれるデータを更新して、新規表示画面や除外表示画面を表示部4に表示させる。
【0088】
図29に示すように、ステップS650において「Yes」と判定した場合、すなわち、階層化指示を受け付けた場合に、表示制御部26は、ステップS660において、階層表示工程を実行する。具体的には、階層表示工程において、表示制御部26は、第2選択情報と第2選択領域との少なくとも一方を含む詳細テーブルデータDfおよび詳細ベン図データBfを表示部4に階層的に表示させる。このとき、表示制御部26は、例えば、複合テーブルデータDcおよび複合ベン図データBcからドリルダウンすることで、詳細テーブルデータDfおよび詳細ベン図データBfを表示部4に表示させる。
【0089】
階層表示工程の後に、表示制御部26は、ステップS661において、第3入力指示画面を表示部4に表示させる第3画面表示工程を実行する。第3入力指示画面は、例えば、詳細ベン図データBfと、詳細テーブルデータDfと、詳細テーブルデータDfに含まれるデータの編集内容を指定するための第3操作画面と、を含む。
【0090】
図38は、第3画面表示工程の後に実行される各工程を示すフローチャートである。図29および図38に示すように、第3画面表示工程の後に、表示制御部26は、ステップS662を実行する。ステップS662において「No」と判定した場合に、表示制御部26は、データ表示工程を終了する。一方で、ステップS662において「Yes」と判定した場合に、表示制御部26は、ステップS663において、更新指示を受け付けたか否かを判定する。表示制御部26は、例えば、第2操作画面に含まれるチェックボックスのいずれかが選択されている場合に、更新指示を受け付けたと判定する。なお、ステップS662において「Yes」と判定される場合とは、第7の場合と第8の場合との少なくとも一方の場合である。第7の場合とは、第3入力指示画面に含まれる詳細テーブルデータDfのいずれかに含まれる情報が使用者によって選択された場合である。第8の場合とは、第3入力指示画面に含まれる詳細ベン図データBfのいずれかに含まれる領域が使用者によって選択された場合である。以下においては、詳細テーブルデータDfにおいて、使用者により選択された情報を第3選択情報と呼ぶ。第3選択情報に相当する詳細ベン図データBfの領域を第3被選択領域と呼ぶ。詳細ベン図データBfにおいて、使用者により選択された領域を第3選択領域と呼ぶ。第3選択領域に相当する詳細テーブルデータDfの情報を第3被選択情報と呼ぶ。
【0091】
ステップS663において「No」と判定した場合に、表示制御部26は、ステップS664において、第3変更画面を表示部4に表示させる第3表示変更工程を実行する。第3変更画面は、第3選択領域と、第3選択情報と、第3被選択領域と、第3被選択情報と、の少なくとも1つを、他の領域および情報とは異なる表示態様で表示部4に表示する表示画面である。第3表示変更工程において、表示制御部26は、例えば、第3選択領域と第3被選択情報とをハイライト表示させる。
【0092】
第3表示変更工程の後に、表示制御部26は、ステップS665において、第3関連情報を表示部4に表示させる第3表示追加工程を実行する。第3関連情報は、第3選択情報と第3選択領域との少なくとも一方に関する情報である。
【0093】
ステップS663において「Yes」と判定した場合、表示制御部26は、ステップS667において、第3更新工程を実行する。具体的には、第3更新工程において、表示制御部26は、第3画面表示工程において入力された指示を基に、詳細テーブルデータDfに含まれるデータを更新して、新規表示画面や除外表示画面を表示部4に表示させる。
【0094】
上記実施形態によれば、収集したデータが量的データQである場合において、複数の対象Sbごとに、第1状態と第2状態とのいずれか一方の状態であることを示す二値ラベルLc,Lpを付与することができる。これにより、収集した量的データQに対して層別分析を実行する場合に、目的変数としてカテゴリカルデータを出力することができる。
【0095】
また、上記実施形態によれば、収集した量的データQに付与した正解二値ラベルLcと予測二値ラベルLpとのラベル一致率Mrを算出することで、候補要因要素Pcを第1状態と第2状態とに分類する分類閾値Tを設定できる。このようにすると、収集した量的データQから層別分析に有用な要因要素Pdとして目的変数の説明変数を抽出する過程において、量的データQをカテゴリカルデータに変換することができる。これにより、説明変数が量的データQである場合において、量的データQをカテゴリカルデータに変換した上で、層別分析に有用な要因要素Pdを抽出することができる。
【0096】
また、上記実施形態によれば、ラベル一致率Mrが最も高い候補要因要素Pcから順に、予め定められたN個の候補要因要素Pcを説明変数となる要因要素Pdとして抽出することができる。これにより、M個の候補要因要素Pcの中から、層別分析に有用な要因要素Pdを容易に抽出することができる。
【0097】
また、上記実施形態によれば、占有割合が予め定められた割合閾値以上となるまで、抽出処理工程と判定処理工程とを繰り返し実行して、要因要素Pdを抽出することができる。これにより、目的変数を説明するために必要十分な個数の要因要素Pdを抽出することができる。
【0098】
また、上記実施形態によれば、複数の量的データQに対して、候補要因要素Pcごとに決定木Dtによって予測二値ラベルLpのラベル分類を行い、決定木Dtにおいて分岐条件となる値を分類閾値Tとして設定することができる。これにより、決定木Dtを用いて、分類閾値Tを容易に設定することができる。
【0099】
また、上記実施形態によれば、分類閾値Tの設定数を2個以下に制限することができる。これにより、初期ベン図データBpを表示部4に表示する場合に、初期ベン図データBpの領域数が過度に増える等により、視認性が低下することを抑制できる。
【0100】
また、上記実施形態によれば、第1の一致率Mr1と第2の一致率Mr2とを比較して、より一致率Mr1,Mr2が高い決定木Dtにおける分岐点Brを分類閾値Tに設定することで、分類閾値Tの設定数を2個以下に制限することができる。これにより、分類閾値Tによる分類精度をより確実に確保することができる。つまり、分類閾値Tの設定数を制限しつつ、正解二値ラベルLcと予測二値ラベルLpとのラベル一致率Mrがより高くなる分類閾値Tを複数の候補分類閾値の中から選択することができる。
【0101】
また、上記実施形態によれば、決定木Dtで分岐点Brが除外されることで分類されることなく予測二値ラベルLpが出力される量的データQに対して、第1正解二値ラベルLc1と第2正解二値ラベルLc2との付与率に応じて予測二値ラベルLpを出力できる。これにより、分類閾値Tの設定数を2個以下に制限した場合に、分類精度が低下することを抑制できる。つまり、分類閾値Tの設定数を2個以下に制限した場合に、正解二値ラベルLcと予測二値ラベルLpとのラベル一致率Mrが低下することを抑制できる。
【0102】
また、上記実施形態によれば、目的変数と説明変数との関係をテーブル形式で表す初期テーブルデータDpと、初期テーブルデータDpに含まれる目的変数と説明変数との関係をベン図によって表す初期ベン図データBpと、を生成することができる。さらに、上記実施形態によれば、表示部4によって、初期テーブルデータDpと初期ベン図データBpと、を初期表示画面Vpとして表示することができる。これにより、目的変数と説明変数との関係を可視化することができる。よって、表示部4に表示された初期表示画面Vpを視認することで、使用者は、目的変数と説明変数との関係や抽出された要因要素Pdの種類等を容易に確認することができる。
【0103】
また、上記実施形態によれば、第1選択領域Sa1と、第1選択情報Si1と、第1被選択領域Fa1と、第1被選択情報Fi1と、の少なくとも1つを、他の領域および情報とは異なる表示態様で表示することができる。これにより、使用者によって選択された領域および情報を、表示部4を介して、分かりやすく使用者に提示することができる。
【0104】
また、上記実施形態によれば、使用者によって選択された領域および情報をハイライト表示することで、他の領域および情報とは異なる表示態様で表示することができる。これにより、使用者によって選択された領域および情報を、表示部4を介して、より一層分かりやすく使用者に提示することができる。
【0105】
また、上記実施形態によれば、第1選択情報Si1と第1選択領域Sa1との少なくとも一方に関連する第1関連情報Puを表示部4に表示することができる。これにより、初期テーブルデータDpおよび初期ベン図データBpから読み取れる情報を、より分かりやすく使用者に提示することができる。
【0106】
また、上記実施形態によれば、使用者が入力により指示を行うための第1入力指示画面Gtであって、初期テーブルデータDpに含まれるデータの編集内容を指定するための第1操作画面Gsを含む第1入力指示画面Gtを表示部4に表示することができる。そして、第1入力指示画面Gtにおいて入力された指示を基に、初期テーブルデータDpに含まれるデータを更新することができる。これにより、層別分析に有用な要因要素Pdを抽出する過程における使用者の利便性を向上させることができる。
【0107】
また、上記実施形態によれば、第1入力指示画面Gtを介して入力された指示に応じて、第1選択領域Sa1と第1選択情報Si1との少なくともいずれかの選択範囲を基に新規分析を行ったり、選択範囲を除外したりできる。これにより、層別分析に有用な要因要素Pdを抽出する過程における使用者の利便性をさらに向上させることができる。また、ラベル一致率Mrをさらに向上させることが可能な説明変数を探索しやすくできる。
【0108】
また、上記実施形態によれば、要因要素Pdごとのデータ群DgA~DgFを統合した複合データ群Dgを生成して、複合データ群Dgに含まれる対象Sbごとの予測二値ラベルLpを付与し直すことで、複合テーブルデータDcを生成することができる。さらに、複合テーブルデータDcに含まれる目的変数と複合データ群Dgとの関係をベン図によって表す複合ベン図データBcを生成することができる。またさらに、上記実施形態によれば、表示部4によって、複合テーブルデータDcと複合ベン図データBcと、を複合表示画面として表示することができる。これにより、目的変数と複合データ群Dgとの関係を可視化することができる。よって、表示部4に表示された複合表示画面を視認することで、使用者は、目的変数と複合データ群Dgとの関係や複合データ群Dgに含まれる要因要素Pdの種類等を容易に確認することができる。
【0109】
また、上記実施形態によれば、第2選択領域と、第2選択情報と、第2被選択領域と、第2被選択情報と、の少なくとも1つを、他の領域および情報とは異なる表示態様で表示することができる。これにより、使用者によって選択された領域および情報を、表示部4を介して、分かりやすく使用者に提示することができる。
【0110】
また、上記実施形態によれば、第2選択情報と第2選択領域との少なくとも一方に関連する第2関連情報を表示部4に表示することができる。これにより、複合テーブルデータDcおよび複合ベン図データBcから読み取れる情報を、より分かりやすく使用者に提示することができる。
【0111】
また、上記実施形態によれば、使用者が入力により指示を行うための第2入力指示画面であって、複合テーブルデータDcに含まれるデータの編集内容を指定するための第2操作画面を含む第2入力指示画面を表示部4に表示させることができる。そして、第2入力指示画面において入力された指示を基に、複合テーブルデータDcに含まれるデータを更新することができる。これにより、層別分析に有用な要因要素Pdを抽出する過程における使用者の利便性を向上させることができる。
【0112】
また、上記実施形態によれば、第2入力指示画面を介して入力された指示に応じて、第2選択領域と第2選択情報との少なくともいずれかの選択範囲を基に新規分析を行ったり、選択範囲を除外したりできる。これにより、層別分析に有用な要因要素Pdを抽出する過程における使用者の利便性をさらに向上させることができる。
【0113】
また、上記実施形態によれば、目的変数と複合データ群Dgに含まれるデータ群DgA~DgFとの関係をテーブル形式で表す詳細テーブルデータDfを生成することができる。さらに、上記実施形態によれば、目的変数と複合データ群Dgに含まれるデータ群DgA~DgFとの関係をベン図によって表す詳細ベン図データBfを生成することができる。またさらに、上記実施形態によれば、表示部4によって、詳細テーブルデータDfと詳細ベン図データBfと、を詳細表示画面として表示することができる。これにより、目的変数と複合データ群Dgに含まれるデータ群DgA~DgFとの関係を可視化することができる。よって、表示部4に表示された詳細表示画面を視認することで、使用者は、目的変数と複合データ群Dgに含まれるデータ群DgA~DgFとの関係等を詳細に確認することができる。
【0114】
また、上記実施形態によれば、複合テーブルデータDcおよび複合ベン図データBcからドリルダウンすることで、使用者により選択された情報と選択された領域との少なくとも一方を含む詳細テーブルデータDfおよび詳細ベン図データBfを表示部4に階層的に表示することができる。これにより、複合テーブルデータDcと詳細テーブルデータDfとの関係、および、複合ベン図データBcと詳細ベン図データBfとの関係をより把握しやすくできる。
【0115】
また、上記実施形態によれば、第3選択領域と、第3選択情報と、第3被選択領域と、第3被選択情報と、の少なくとも1つを、他の領域および情報とは異なる表示態様で表示することができる。これにより、使用者によって選択された領域および情報を、表示部4を介して、分かりやすく使用者に提示することができる。
【0116】
また、上記実施形態によれば、第3選択情報と第3選択領域との少なくとも一方に関連する第3関連情報を表示部4に表示することができる。これにより、詳細テーブルデータDfおよび詳細ベン図データBfから読み取れる情報を、より分かりやすく使用者に提示することができる。
【0117】
また、上記実施形態によれば、使用者が入力により指示を行うための第3入力指示画面であって、詳細テーブルデータDfに含まれるデータの編集内容を指定するための第3操作画面を含む第3入力指示画面を表示部4に表示させることができる。そして、第3入力指示画面において入力された指示を基に、詳細テーブルデータDfに含まれるデータを更新することができる。これにより、層別分析に有用な要因要素を抽出する過程における使用者の利便性を向上させることができる。
【0118】
また、上記実施形態によれば、第3入力指示画面を介して入力された指示に応じて、第3選択領域と第3選択情報との少なくともいずれかの選択範囲を基に新規分析を行ったり、選択範囲を除外したりできる。これにより、層別分析に有用な要因要素Pdを抽出する過程における使用者の利便性をさらに向上させることができる。
【0119】
また、上記実施形態では、テーブルデータDp,Dc,Dfに含まれる正解二値ラベルLcと予測二値ラベルLpとを2進数に変換することで生成したビット情報Bi1~Bi3を10進数に変換することで、対象Sbごとに領域識別子A0~A15を付与できる。このとき、正解二値ラベルLcを2進数に変換した2進数値の位が、予測二値ラベルLpを2進数に変換した2進数値の位よりも小さくなるように、各2進数値を対象Sbごとに並べることで、ビット情報Bi1~Bi3を生成している。このようにすると、第1正解二値ラベルLc1が付与された対象Sbに対して奇数の領域番号を割り当てることができ、第2正解二値ラベルLc2が付与された対象Sbに対して偶数の領域番号を割り当てることができる。これにより、目的変数と説明変数との関係をより一層明確に示すことができる。
【0120】
また、上記実施形態によれば、ベン図データBp,Bc,Bfは、各領域の面積がラベル一致率Mrと一致するように生成されてもよい。ベン図データBp,Bc,Bfの各領域の面積がラベル一致率Mrと一致する場合、表示部4に表示された初期表示画面Vp、複合表示画面、および詳細表示画面を視認することで、使用者は、層別分析により有用な要因要素Pdを容易に把握することができる。
【0121】
B.他の実施形態:
B-1:他の実施形態1:
上記実施形態では、設定した分類閾値Tよって量的データQをラベル分類した場合の分類精度は、一致率Mr1,Mr2によって表されていた。これに対して、他の実施形態では、設定した分類閾値Tよって量的データQをラベル分類した場合の分類精度は、平均情報量を示すエントロピー、不平等さを示すジニ係数、2変数間の関連度合いを示すX値等によって示される不純度によって表されてもよい。このとき、不純度が高いほど分類精度は低く、不純度が低いほど分類精度は高い。よって、分類部22は、一致率Mr1,Mr2に代えて、不純度を示すエントロピー、ジニ係数、X値等を用いて、分類工程および抽出工程を実行してもよい。
【0122】
B-2.他の実施形態2:
候補分類閾値が2個以下であることにより、図4に示すステップS233からステップS240までの各ステップが実行されない場合、分類部22は、ステップS250において、以下の処理を実行する。この場合、分類部22は、第1正解二値ラベルLc1が付与された対象Sbの総数に対する、複数の対象Sbごとにおける第1正解二値ラベルLc1と一致する第1予測二値ラベルLp1の数の割合をラベル一致率Mrとする。
【0123】
B-3:他の実施形態3:
他の実施形態では、抽出工程において4個以上の要因要素Pdが抽出されることにより、初期テーブルデータDpに4個の要因要素Pdが含まれる場合に使用されるテンプレート情報が記憶部6に予め記憶されていてもよい。抽出工程においてN個の要因要素Pdが抽出される場合、目的変数である正解二値ラベルLcと、説明変数として抽出されたN個の要因要素Pdによりそれぞれ出力される予測二値ラベルLpと、の組合せは、2通りである。よって、この場合、配置情報において、ベン図の形状は、異なる領域識別子を割り当てた2個の領域によって区分される形状である。
【0124】
B-4:他の実施形態4:
他の実施形態では、表示制御部26は、初期表示画面Vpおよび第1変更画面Hpおいて、第1初期テーブルデータDp1に代えて、初期変換データEpを表示させてもよい。このようにすると、初期ベン図データBpにおける領域識別子A0~A7と、初期変換データEpにおける領域識別子A0~A7と、を同時に表示できる。これにより、初期ベン図データBpの各領域と、第1初期テーブルデータDp1の各行により示される各対象Sbの情報と、の関係を、使用者が把握しやすくできる。
【0125】
B-5.他の実施形態5:
他の実施形態では、データセットDsは、候補要因要素Pcごとに取得された量的データQと、候補要因要素Pcごとに取得したカテゴリカルデータと、の両者を含んでもよい。
【0126】
C.他の形態:
本開示は、上述の実施形態に限られるものではなく、その趣旨を逸脱しない範囲において種々の構成で実現することができる。例えば、発明の概要の欄に記載した各形態中の技術的特徴に対応する実施形態の技術的特徴は、上述の課題の一部又は全部を解決するために、あるいは、上述の効果の一部又は全部を達成するために、適宜、差し替えや、組み合わせを行うことが可能である。また、その技術的特徴が本明細書中に必須なものとして説明されていなければ、適宜、削除することが可能である。
【0127】
(1)本開示の一形態によれば、要因要素の抽出方法が提供される。対象を層別する場合における要因要素の抽出方法は、複数の前記対象ごとに、(i)前記対象が第1状態と第2状態とのいずれか一方の状態であることを示す目的変数である二値ラベルである正解二値ラベルと、(ii)前記対象に対するラベル分類の要因となり得るM個(Mは、2以上の整数)の候補要因要素ごとに取得された量的データと、を関連付けたデータセットを準備する準備工程と、前記量的データを前記第1状態と前記第2状態とに分類する分類閾値を前記候補要因要素ごとに設定して、前記候補要因要素ごとの前記分類閾値により、前記候補要因要素ごとに前記量的データをラベル分類することで、複数の前記量的データのそれぞれに対して、前記二値ラベルである予測二値ラベルを付与する分類工程と、前記第1状態を示す前記正解二値ラベルが付与された前記対象の総数に対する、複数の前記対象ごとにおける前記第1状態を示す前記正解二値ラベルと一致する前記予測二値ラベルの数の割合である一致率が、予め定められた抽出閾値以上となるN個(Nは、1以上M未満の整数)の前記候補要因要素を、前記目的変数の説明変数となる前記要因要素として抽出する抽出工程と、を備える。この形態によれば、収集したデータが量的データである場合において、複数の対象ごとに、第1状態と第2状態とのいずれか一方の状態であることを示す二値ラベルを付与することができる。これにより、収集した量的データに対して層別分析を実行する場合に、目的変数としてカテゴリカルデータを出力することができる。さらに、この形態によれば、収集した量的データに付与した正解二値ラベルと予測二値ラベルとの一致率を算出することで、候補要因要素を第1状態と第2状態とに分類する分類閾値を設定できる。このようにすると、収集した量的データから層別分析に有用な要因要素として目的変数の説明変数を抽出する過程において、量的データをカテゴリカルデータに変換することができる。これにより、説明変数が量的データである場合において、量的データをカテゴリカルデータに変換した上で、層別分析に有用な要因要素を抽出することができる。
【0128】
(2)上記形態において、前記抽出工程は、(i)複数の前記候補要因要素の中から、複数の前記対象ごとにおいて、前記第1状態を示す前記正解二値ラベルと、前記第1状態を示す前記予測二値ラベルと、の一致率が最も高い前記候補要因要素を前記要因要素として抽出する抽出処理工程と、(ii)前記第1状態を示す前記正解二値ラベルが付与された前記対象の総数に対する、前記抽出処理工程によって抽出された前記要因要素において、前記一致率の算出元のラベルである前記第1状態を示す前記予測二値ラベルの数の割合である占有割合が、予め定められた割合閾値以上であるか否かを判定する判定処理工程と、を備え、前記占有割合が前記割合閾値以上である場合には、前記抽出工程を終了し、前記占有割合が前記割合閾値未満である場合には、前記抽出工程において、さらに、他の前記要因要素を抽出するために次ルーチンの前記抽出処理工程および前記判定処理工程を実行し、前記次ルーチンにおける前記抽出処理工程では、前回までのルーチンにおいて抽出された前記要因要素を除いた複数の前記候補要因要素のうちで、前記前回までのルーチンにおいて前記一致率の算出元となった前記第1状態を示す前記正解二値ラベルが付与された前記対象を除いた残りの複数の前記対象ごとにおいて、前記第1状態を示す前記正解二値ラベルと一致する前記第1状態を示す前記予測二値ラベルの数の割合を前記一致率とみなして、前記一致率が最も高い前記候補要因要素を前記要因要素として抽出し、前記次ルーチンにおける前記判定処理工程では、前記第1状態を示す前記正解二値ラベルが付与された前記対象の総数に対する、前記次ルーチンを含む今までの各ルーチンにおける前記一致率の算出元のラベルである前記第1状態を示す前記予測二値ラベルの総数の割合を前記占有割合とみなして、前記占有割合が前記割合閾値以上であるか否かを判定してもよい。この形態によれば、一致率が最も高い候補要因要素から順に、予め定められたN個の候補要因要素を説明変数となる要因要素として抽出することができる。これにより、M個の候補要因要素の中から、層別分析に有用な要因要素を容易に抽出することができる。さらに、この形態によれば、占有割合が予め定められた割合閾値以上となるまで、抽出処理工程と判定処理工程とを繰り返し実行して、要因要素を抽出することができる。これにより、目的変数を予め定められた割合閾値以上に説明するために必要な要因要素を抽出することができる。
【0129】
(3)上記形態において、前記分類工程は、前記分類閾値を設定する閾値設定工程を含み、前記閾値設定工程は、複数の前記量的データに対して、前記候補要因要素ごとに決定木によって前記二値ラベルのラベル分類を行い、前記決定木において分岐条件となる値を前記分類閾値として設定してもよい。この形態によれば、複数の量的データに対して、候補要因要素ごとの決定木によって予測二値ラベルのラベル分類を行い、決定木において分岐条件となる値を分類閾値として設定することができる。これにより、決定木を用いて、分類閾値を容易に設定することができる。
【0130】
(4)上記形態において、前記対象は、P個(Pは、4以上の整数)であり、前記閾値設定工程は、前記決定木の分岐回数を2回以下にすることで、前記分類閾値の設定数を2個以下に制限してもよい。この形態によれば、分類閾値の設定数を2個以下に制限することができる。これにより、初期ベン図データを表示部に表示する場合に、初期ベン図データの領域数が過度に増える等により、視認性が低下することを抑制できる。
【0131】
(5)上記形態において、前記閾値設定工程は、前記決定木において、最初の分岐点である第1分岐点からさらに第2分岐点と第3分岐点とで分岐している場合に、前記第2分岐点を除外して前記第1分岐点と前記第3分岐点とで前記決定木を分岐させた状態における前記一致率である第1の一致率と、前記第3分岐点を除外して前記第1分岐点と前記第2分岐点とで前記決定木を分岐させた状態における前記一致率である第2の一致率と、を比較して、前記一致率が高い方の前記決定木における前記分岐点を、前記分類閾値に設定することで、前記分類閾値の前記設定数を2個に制限してもよい。この形態によれば、第1の一致率と第2の一致率とを比較して、より一致率が高い決定木における分岐点を分類閾値に設定することで、分類閾値の設定数を2個以下に制限することができる。
【0132】
(6)上記形態において、前記閾値設定工程は、さらに、前記第2分岐点と前記第3分岐点とのうち、前記一致率がより低い前記分岐点を除外した前記決定木において、前記第1分岐点により定まる前記分類閾値により分類された後に、前記第2分岐点と前記第3分岐点とのいずれか一方の前記分岐点が除外されたことにより分類されることなく前記予測二値ラベルが出力される前記量的データについて、前記正解二値ラベルのうち、前記第1状態であることを示す前記正解二値ラベルの付与率が、前記第2状態であることを示す前記正解二値ラベルの付与率よりも高い場合には、前記第1状態であることを示す前記予測二値ラベルを出力し、前記第2状態であることを示す前記正解二値ラベルの前記付与率が、前記第1状態であることを示す前記正解二値ラベルの前記付与率よりも高い場合には、前記第2状態であることを示す前記予測二値ラベルを出力するラベル選定工程を含んでもよい。この形態によれば、決定木で分岐点が除外されることによって分類されることなく予測二値ラベルが出力される量的データに対して、第1正解二値ラベルと第2正解二値ラベルとの付与率に応じて予測二値ラベルを出力することができる。これにより、分類閾値の設定数を2個以下に制限した場合に、予測二値ラベルによる分類精度が低下することを抑制できる。
【0133】
(7)上記形態において、さらに、前記正解二値ラベルと、前記抽出工程によって抽出された前記要因要素ごとの前記量的データに対して付与された前記予測二値ラベルと、を前記対象ごとに関連付けることで、前記目的変数と前記説明変数との関係をテーブル形式で表す初期テーブルデータを生成する初期テーブル生成工程を含むテーブル生成工程と、前記初期テーブルデータに含まれる前記目的変数と前記説明変数との関係をベン図によって表す初期ベン図データを生成する初期ベン図生成工程を含むベン図生成工程と、表示部によって、前記初期テーブルデータと前記初期ベン図データとを表示する初期表示工程を含むデータ表示工程と、を備えてもよい。この形態によれば、目的変数と説明変数との関係をテーブル形式で表す初期テーブルデータと、初期テーブルデータに含まれる目的変数と説明変数との関係をベン図によって表す初期ベン図データと、を生成することができる。さらに、この形態によれば、表示部によって、初期テーブルデータと初期ベン図データとを表示することができる。これにより、目的変数と説明変数との関係を可視化することができる。
【0134】
(8)上記形態において、前記データ表示工程は、さらに、前記初期テーブルデータのいずれかに含まれる情報が使用者によって選択された場合に、前記初期テーブルデータにおいて選択された情報である第1選択情報に相当する前記初期ベン図データの領域である第1被選択領域を他の領域とは異なる表示態様で表示し、前記初期ベン図データに含まれるいずれかの領域が前記使用者によって選択された場合に、前記初期ベン図データにおいて選択された領域である第1選択領域に相当する前記初期テーブルデータの情報である第1被選択情報を他の情報とは異なる表示態様で表示する第1表示変更工程を含んでもよい。この形態によれば、第1選択領域と、第1選択情報と、第1被選択領域と、第1被選択情報とを、他の領域および情報とは異なる表示態様で表示することができる。これにより、使用者によって選択された領域および情報を、表示部を介して、分かりやすく使用者に提示することができる。
【0135】
(9)上記形態において、前記第1表示変更工程は、前記初期テーブルデータに含まれるいずれかの情報が前記使用者によって選択された場合に、前記第1選択情報と前記第1被選択領域とをハイライト表示し、前記初期ベン図データに含まれるいずれかの領域が前記使用者によって選択された場合に、前記第1選択領域と前記第1被選択情報とをハイライト表示してもよい。この形態によれば、使用者によって選択された領域および情報をハイライト表示することで、他の領域および情報とは異なる表示態様で表示することができる。これにより、使用者によって選択された領域および情報を、表示部を介して、より一層分かりやすく使用者に提示することができる。
【0136】
(10)上記形態において、前記データ表示工程は、さらに、前記初期テーブルデータにおいて選択された情報である第1選択情報と、前記初期ベン図データにおいて選択された領域である第1選択領域と、の少なくとも一方に関連する第1関連情報を前記表示部に表示する第1表示追加工程を含んでもよい。この形態によれば、第1選択情報と第1選択領域との少なくとも一方に関連する第1関連情報を表示部に表示することができる。これにより、初期テーブルデータおよび初期ベン図データから読み取れる情報を、より分かりやすく使用者に提示することができる。
【0137】
(11)上記形態において、前記データ表示工程は、さらに、使用者が入力により指示を行うための第1入力指示画面を前記表示部に表示させる第1画面表示工程と、前記第1画面表示工程において入力された前記指示を基に、前記初期テーブルデータに含まれるデータを更新する第1更新工程と、を含み、前記第1入力指示画面は、前記初期ベン図データと、前記初期テーブルデータに含まれる前記データの編集内容を指定するための第1操作画面と、を含んでもよい。この形態によれば、使用者が入力により指示を行うための第1入力指示画面であって、初期テーブルデータに含まれるデータの編集内容を指定するための第1操作画面を含む第1入力指示画面を表示部に表示することができる。そして、第1入力指示画面において入力された指示を基に、初期テーブルデータに含まれるデータを更新することができる。これにより、層別分析に有用な要因要素を抽出する過程における使用者の利便性を向上させることができる。
【0138】
(12)上記形態において、前記抽出工程において前記要因要素として抽出される前記候補要因要素の数は4以上であり、前記テーブル生成工程は、さらに、(1a)前記初期テーブルデータに含まれる前記予測二値ラベルを前記要因要素ごとに分類したデータ群を生成するデータ群生成工程と、(1b)複数の前記データ群にそれぞれ含まれる同一の前記対象について付与された前記予測二値ラベル同士を、予め定められた演算方法により、前記第1状態であることを示す前記予測二値ラベルと、前記第2状態であることを示す前記予測二値ラベルと、のいずれかの前記予測二値ラベルに分類し直すことで、前記データ群生成工程において生成した複数の前記データ群をまとめた複合データ群を生成するデータ群統合工程と、(1c)前記正解二値ラベルと、前記複合データ群ごとに付与された前記予測二値ラベルと、を前記対象ごとに関連付けることで、前記目的変数と前記複合データ群との関係を前記テーブル形式で表す複合テーブルデータを生成する複合テーブル生成工程と、(1d)前記正解二値ラベルと、前記複合データ群に含まれる前記データ群ごとの前記予測二値ラベルと、を前記対象ごとに関連付けることで、前記目的変数と前記複合データ群に含まれる前記データ群との関係を前記テーブル形式で表す詳細テーブルデータを生成する詳細テーブル生成工程と、を含み、前記ベン図生成工程は、さらに、(2a)前記複合テーブルデータに含まれる前記目的変数と前記複合データ群との関係を前記ベン図によって表す複合ベン図データを生成する複合ベン図生成工程と、(2b)前記詳細テーブルデータに含まれる前記目的変数と前記データ群との関係を前記ベン図によって表す詳細ベン図データを生成する詳細ベン図生成工程と、を含み、前記データ表示工程は、さらに、(3a)前記表示部によって、前記複合テーブルデータと前記複合ベン図データとを表示する複合表示工程と、(3b)前記複合テーブルデータと前記複合ベン図データとが前記表示部に表示された状態において、前記複合テーブルデータに含まれるいずれかの情報と、前記複合ベン図データに含まれるいずれかの領域と、の少なくとも一方が使用者によって選択された場合に、前記複合テーブルデータおよび前記複合ベン図データからドリルダウンすることで、選択された前記情報と選択された前記領域との少なくとも一方を含む前記詳細テーブルデータおよび前記詳細ベン図データを前記表示部に階層的に表示する階層表示工程と、を含んでもよい。この形態によれば、要因要素ごとのデータ群を統合した複合データ群を生成して、複合データ群に含まれる対象ごとの予測二値ラベルを付与し直すことで、複合テーブルデータを生成することができる。さらに、複合テーブルデータに含まれる目的変数と複合データ群との関係をベン図によって表す複合ベン図データを生成することができる。またさらに、表示部によって、複合テーブルデータと複合ベン図データとを表示することができる。これにより、目的変数と複合データ群との関係を可視化することができる。また、この形態によれば、目的変数と複合データ群に含まれるデータ群との関係をテーブル形式で表す詳細テーブルデータを生成することができる。さらに、目的変数と複合データ群に含まれるデータ群との関係をベン図によって表す詳細ベン図データを生成することができる。またさらに、表示部によって、詳細テーブルデータと詳細ベン図データとを表示することができる。これにより、目的変数と複合データ群に含まれるデータ群との関係を可視化することができる。さらに、この形態によれば、複合テーブルデータおよび複合ベン図データからドリルダウンすることで、使用者により選択された情報と選択された領域との少なくとも一方を含む詳細テーブルデータおよび詳細ベン図データを表示部に階層的に表示することができる。
【0139】
(13)上記形態において、前記データ表示工程は、さらに、前記複合テーブルデータのいずれかに含まれる情報が使用者によって選択された場合に、前記複合テーブルデータにおいて選択された情報である第2選択情報に相当する前記複合ベン図データの領域である第2被選択領域を他の領域とは異なる表示態様で表示し、前記複合ベン図データに含まれるいずれかの領域が前記使用者によって選択された場合に、前記複合ベン図データにおいて選択された領域である第2選択領域に相当する前記複合テーブルデータの情報である第2被選択情報を他の情報とは異なる表示態様で表示する第2表示変更工程と、前記詳細テーブルデータのいずれかに含まれる情報が使用者によって選択された場合に、前記詳細テーブルデータにおいて選択された情報である第3選択情報に相当する前記詳細ベン図データの領域である第3被選択領域を他の領域とは異なる表示態様で表示し、前記詳細ベン図データに含まれるいずれかの領域が前記使用者によって選択された場合に、前記詳細ベン図データにおいて選択された領域である第3選択領域に相当する前記詳細テーブルデータの情報である第3被選択情報を他の情報とは異なる表示態様で表示する第3表示変更工程と、を含んでもよい。この形態によれば、第2選択領域と、第2選択情報と、第2被選択領域と、第2被選択情報とを、他の領域および情報とは異なる表示態様で表示することができる。さらに、この形態によれば、第3選択領域と、第3選択情報と、第3被選択領域と、第3被選択情報とを、他の領域および情報とは異なる表示態様で表示することができる。これにより、使用者によって選択された領域および情報を、表示部を介して、分かりやすく使用者に提示することができる。
【0140】
(14)上記形態において、前記第2表示変更工程は、前記複合テーブルデータに含まれるいずれかの情報が前記使用者によって選択された場合に、前記第2選択情報と前記第2被選択領域とをハイライト表示し、前記複合ベン図データに含まれるいずれかの領域が前記使用者によって選択された場合に、前記第2選択領域と前記第2被選択情報とをハイライト表示し、前記第3表示変更工程は、前記詳細テーブルデータに含まれるいずれかの情報が前記使用者によって選択された場合に、前記第3選択情報と前記第3被選択領域とをハイライト表示し、前記詳細ベン図データに含まれるいずれかの領域が前記使用者によって選択された場合に、前記第3選択領域と前記第3被選択情報とをハイライト表示してもよい。この形態によれば、使用者によって選択された領域および情報をハイライト表示することで、他の領域および情報とは異なる表示態様で表示することができる。これにより、使用者によって選択された領域および情報を、表示部を介して、より一層分かりやすく使用者に提示することができる。
【0141】
(15)上記形態において、前記データ表示工程は、さらに、前記複合テーブルデータにおいて選択された情報である第2選択情報と、前記複合ベン図データにおいて選択された領域である第2選択領域と、の少なくとも一方に関連する第2関連情報を前記表示部に表示する第2表示追加工程と、前記詳細テーブルデータにおいて選択された情報である第3選択情報と、前記詳細ベン図データにおいて選択された領域である第3選択領域と、の少なくとも一方に関連する第3関連情報を前記表示部に表示する第3表示追加工程と、を含んでもよい。この形態によれば、第2選択情報と第2選択領域との少なくとも一方に関連する第2関連情報を表示部に表示することができる。これにより、複合テーブルデータおよび複合ベン図データから読み取れる情報を、より分かりやすく使用者に提示することができる。さらに、この形態によれば、第3選択情報と第3選択領域との少なくとも一方に関連する第3関連情報を表示部に表示することができる。これにより、詳細テーブルデータおよび詳細ベン図データから読み取れる情報を、より分かりやすく使用者に提示することができる。
【0142】
(16)上記形態において、前記データ表示工程は、さらに、使用者が入力により指示を行うための第2入力指示画面を前記表示部に表示させる第2画面表示工程と、前記第2画面表示工程において入力された前記指示を基に、前記複合テーブルデータに含まれるデータを更新する第2更新工程と、を含み、前記第2入力指示画面は、前記複合ベン図データと、前記複合テーブルデータに含まれる前記データの編集内容を指定するための第2操作画面と、を含んでもよい。この形態によれば、使用者が入力により指示を行うための第2入力指示画面であって、複合テーブルデータに含まれるデータの編集内容を指定するための第2操作画面を含む第2入力指示画面を表示部に表示させることができる。そして、第2入力指示画面において入力された指示を基に、複合テーブルデータに含まれるデータを更新することができる。これにより、層別分析に有用な要因要素を抽出する過程における使用者の利便性を向上させることができる。
【0143】
(17)上記形態において、前記データ表示工程は、さらに、前記使用者が入力により指示を行うための第3入力指示画面を前記表示部に表示させる第3画面表示工程と、前記第3画面表示工程において入力された前記指示を基に、前記詳細テーブルデータに含まれるデータを更新する第3更新工程と、を含み、前記第3入力指示画面は、前記詳細ベン図データと、前記詳細テーブルデータに含まれる前記データの編集内容を指定するための第3操作画面と、を含んでもよい。この形態によれば、使用者が入力により指示を行うための第3入力指示画面であって、詳細テーブルデータに含まれるデータの編集内容を指定するための第3操作画面を含む第3入力指示画面を表示部に表示させることができる。そして、第3入力指示画面において入力された指示を基に、詳細テーブルデータに含まれるデータを更新することができる。これにより、層別分析に有用な要因要素を抽出する過程における使用者の利便性を向上させることができる。
【0144】
(18)本開示の他の形態によれば、要因要素の抽出プログラムが提供される。対象を層別する場合における要因要素の抽出を行うためのコンピュータープログラムは、複数の前記対象ごとに、(i)前記対象が第1状態と第2状態とのいずれか一方の状態であることを示す目的変数である二値ラベルである正解二値ラベルと、(ii)前記対象に対するラベル分類の要因となり得るM個(Mは、2以上の整数)の候補要因要素ごとに取得された量的データと、を関連付けたデータセットを準備する準備機能と、前記量的データを前記第1状態と前記第2状態とに分類する分類閾値を前記候補要因要素ごとに設定して、前記候補要因要素ごとの前記分類閾値により、前記候補要因要素ごとに前記量的データをラベル分類することで、複数の前記量的データのそれぞれに対して、前記二値ラベルである予測二値ラベルを付与する分類機能と、前記第1状態を示す前記正解二値ラベルが付与された前記対象の総数に対する、複数の前記対象ごとにおける前記第1状態を示す前記正解二値ラベルと一致する前記予測二値ラベルの数の割合である一致率が、予め定められた抽出閾値以上となるN個(Nは、1以上M未満の整数)の前記候補要因要素を、前記目的変数の説明変数となる前記要因要素として抽出する抽出機能と、を備える。この形態によれば、収集した量的データに付与した正解二値ラベルと予測二値ラベルとの一致率を算出することで、候補要因要素を第1状態と第2状態とに分類する分類閾値を設定できる。このようにすると、収集した量的データから層別分析に有用な要因要素として目的変数の説明変数を抽出する過程において、量的データをカテゴリカルデータに変換することができる。これにより、説明変数が量的データである場合において、量的データをカテゴリカルデータに変換した上で、層別分析に有用な要因要素を抽出することができる。
【0145】
上述した本開示の各形態の有する複数の構成要素はすべてが必須のものではなく、上述の課題の一部又は全部を解決するため、あるいは、本明細書に記載された効果の一部又は全部を達成するために、適宜、前記複数の構成要素の一部の構成要素について、その変更、削除、新たな他の構成要素との差し替え、限定内容の一部削除を行うことが可能である。また、上述の課題の一部又は全部を解決するため、あるいは、本明細書に記載された効果の一部又は全部を達成するために、上述した本開示の一形態に含まれる技術的特徴の一部又は全部を上述した本開示の他の形態に含まれる技術的特徴の一部又は全部と組み合わせて、本開示の独立した一形態とすることも可能である。
【0146】
本開示は、要因要素の抽出方法、および、要因要素の抽出方法を実行するためのコンピュータープログラム以外の種々の形態で実現することも可能である。例えば、要因要素の抽出方法を実行する抽出装置等の形態で実現することができる。
【符号の説明】
【0147】
1…抽出システム、2…CPU、3…通信部、4…表示部、5…入力操作部、6…記憶部、9…測定ユニット、10…抽出装置、22…分類部、23…抽出部、24…テーブル生成部、25…ベン図生成部、26…表示制御部、100…製造設備、A0~A15…領域識別子、Ar1…第1領域情報、Ar2…第2領域情報、Ar3…第3領域情報、Bc…複合ベン図データ、Bf…詳細ベン図データ、Bi1…初期ビット情報、Bi2…複合ビット情報、Bi3…詳細ビット情報、Bp…初期ベン図データ、Br…分岐点、Br1…第1分岐点、Br2…第2分岐点、Br3…第3分岐点、Ch1…第1チェックボックス、Ch2…第2チェックボックス、Dc…複合テーブルデータ、Dd1…第1分岐状態、Dd2…第2分岐状態、Df…詳細テーブルデータ、Dg…複合データ群、Dg1…第1複合データ群、Dg2…第2複合データ群、DgA~DgF…データ群、Dp…初期テーブルデータ、Dp1…第1初期テーブルデータ、Dp2…第2初期テーブルデータ、Ds…データセット、Dt…決定木、Dt0…除外前決定木、Dt1…第1決定木、Dt2…第2決定木、Ec…複合変換データ、Ef…詳細変換データ、Ep…初期変換データ、Fa1…第1被選択領域、Fi1…第1被選択情報、Gs…第1操作画面、Gt…第1入力指示画面、Hp…変更画面、Hp1…第1変更画面、Hp2…第2変更画面、Hp3…第3変更画面、Hr1…第1占有割合、Hr2…第2占有割合、Kp…除外表示画面、Lc…正解二値ラベル、Lc1…第1正解二値ラベル、Lc2…第2正解二値ラベル、Lp…予測二値ラベル、Lp1…第1予測二値ラベル、Lp2…第2予測二値ラベル、Mr…ラベル一致率、Mr1…第1の一致率、Mr2…第2の一致率、Np…新規表示画面、Pc…候補要因要素、Pd…要因要素、Pd1…第1要因要素、Pd2…第2要因要素、Pd3…第3要因要素、Pd4…第4要因要素、Pi…追加情報、Pt1…第1の場合、Pt2…第2の場合、Pu…第1関連情報、Q…量的データ、Qs…対象量的データ、Rp…更新後テーブルデータ、Sa1…第1選択領域、Sb…対象、Si1…第1選択情報、Sp1…第1配置情報、Sp2…第2配置情報、Sp3…第3配置情報、T…分類閾値、T1…第1分類閾値、T2…第2分類閾値、Tp1…第1テンプレート情報、Tp2…テンプレート情報、Tp3…第3テンプレート情報、U…全体集合、Vp…初期表示画面
図1
図2
図3
図4
図5
図6
図7
図8
図9
図10
図11
図12
図13
図14
図15
図16
図17
図18
図19
図20
図21
図22
図23
図24
図25
図26
図27
図28
図29
図30
図31
図32
図33
図34
図35
図36
図37
図38