(19)【発行国】日本国特許庁(JP)
(12)【公報種別】公開特許公報(A)
(11)【公開番号】P2024043000
(43)【公開日】2024-03-29
(54)【発明の名称】情報処理装置及び情報処理方法
(51)【国際特許分類】
G06N 99/00 20190101AFI20240322BHJP
【FI】
G06N99/00 180
【審査請求】未請求
【請求項の数】20
【出願形態】OL
(21)【出願番号】P 2022147965
(22)【出願日】2022-09-16
(71)【出願人】
【識別番号】318010018
【氏名又は名称】キオクシア株式会社
(74)【代理人】
【識別番号】100120031
【弁理士】
【氏名又は名称】宮嶋 学
(74)【代理人】
【識別番号】100107582
【弁理士】
【氏名又は名称】関根 毅
(74)【代理人】
【識別番号】100118843
【弁理士】
【氏名又は名称】赤岡 明
(74)【代理人】
【識別番号】100103263
【弁理士】
【氏名又は名称】川崎 康
(72)【発明者】
【氏名】鳥井 修
(72)【発明者】
【氏名】真鍋 晋一郎
(57)【要約】
【課題】目的変数に対する影響度の大きい説明変数を漏れなく迅速に抽出できる。
【解決手段】情報処理装置は、回帰解析対象である目的変数及び説明変数を取得する取得部と、第1回帰式を用いたスパースモデリングにより、前記説明変数の中から前記目的変数に対する影響度が高い複数の第1説明変数を抽出する第1処理部と、第2回帰式を用いたスパースモデリングにより、前記複数の第1説明変数に対する影響度が高い第2説明変数を抽出する第2処理部と、を備える。
【選択図】
図1
【特許請求の範囲】
【請求項1】
回帰解析対象である目的変数及び説明変数を取得する取得部と、
第1回帰式を用いたスパースモデリングにより、前記説明変数の中から前記目的変数に対する影響度が高い複数の第1説明変数を抽出する第1処理部と、
第2回帰式を用いたスパースモデリングにより、前記複数の第1説明変数に対する影響度が高い第2説明変数を抽出する第2処理部と、を備える、情報処理装置。
【請求項2】
前記第1処理部は、前記目的変数に対する影響度を表す第1回帰係数を用いて前記複数の第1説明変数を抽出し、
前記第2処理部は、前記複数の第1説明変数に対する影響度を表す第2回帰係数を用いて前記第2説明変数を抽出する、請求項1に記載の情報処理装置。
【請求項3】
前記第1処理部は、前記第1回帰式の値であるスコアが最小になる前記第1回帰係数に対応する前記複数の第1説明変数を演算し、
前記第2処理部は、前記第2回帰式の値であるスコアが最小になる前記第2回帰係数に対応する前記第2説明変数を演算する、請求項2に記載の情報処理装置。
【請求項4】
前記第1処理部は、
前記目的変数及び前記第1説明変数に基づいて前記第1回帰係数を更新する第1更新部と、
前記第1更新部で更新された前記第1回帰係数及び対応する前記第1説明変数から前記目的変数を回帰する場合の精度を表す回帰誤差を演算する第1演算部と、
前記第1演算部で演算された前記回帰誤差が小さくなるように前記第1回帰係数の数を演算する第2演算部と、
前記第2演算部の演算結果に基づいて、前記第1回帰式の値であるスコアを演算する第3演算部と、
前記第3演算部で演算された前記スコアが収束条件を満たすか否かを判定する第1判定部と、を備える、請求項3に記載の情報処理装置。
【請求項5】
前記第1処理部は、前記第1判定部にて前記スコアが前記収束条件を満たすと判定されるまで、前記第1更新部、前記第1演算部、前記第2演算部、及び前記第3演算部の処理を繰り返し行う、請求項4に記載の情報処理装置。
【請求項6】
前記第1判定部にて前記スコアが前記収束条件を満たすと判定された際の前記第1回帰係数が複数存在する場合には、そのうちの一つを選択する選択部を備え、
前記第2処理部は、前記選択部で選択された前記第1回帰係数に応じた前記第2回帰係数を用いて前記第2説明変数を抽出する、請求項4に記載の情報処理装置。
【請求項7】
前記第2処理部は、
前記複数の第1説明変数に基づいて、前記複数の第1説明変数に対する前記第2説明変数の影響度を表す前記第2回帰係数を更新する第2更新部と、
前記第2更新部で更新された前記第2回帰係数及び前記第2説明変数から前記複数の第1説明変数を回帰する場合の精度を表す回帰誤差を演算する第4演算部と、
前記第4演算部で演算された前記回帰誤差が小さくなるように前記第2回帰係数の数を演算する第5演算部と、
前記第5演算部の演算結果に基づいて、前記第2回帰式の値であるスコアを演算する第6演算部と、
前記第6演算部で演算された前記スコアが収束条件を満たすか否かを判定する第2判定部と、を備える、請求項6に記載の情報処理装置。
【請求項8】
前記第2処理部は、前記第2判定部にて前記スコアが前記収束条件を満たすと判定されるまで、前記第2更新部、前記第4演算部、前記第5演算部、及び前記第6演算部の処理を繰り返し行う、請求項7に記載の情報処理装置。
【請求項9】
前記第1処理部で抽出された前記複数の第1説明変数のそれぞれごとに、前記第2処理部で抽出された前記第2説明変数を特定する特定部を備える、請求項2に記載の情報処理装置。
【請求項10】
前記目的変数は不良率を含んでおり、
前記特定部は、前記第1処理部で抽出された前記複数の第1説明変数のそれぞれごとに、前記第2処理部で抽出された前記第2説明変数を不良要因として特定する、請求項9に記載の情報処理装置。
【請求項11】
前記不良要因と、対応する前記第1回帰係数及び前記第2回帰係数との少なくとも一方を表示する表示部を備える、請求項10に記載の情報処理装置。
【請求項12】
回帰解析対象である目的変数及び説明変数を取得する取得部と、
所定の回帰式を用いたスパークモデリングにより、前記説明変数の中から前記目的変数に対する影響度が高い複数の第1説明変数を抽出するとともに、前記複数の第1説明変数に対する影響度が高い第2説明変数を抽出する処理部を備える、情報処理装置。
【請求項13】
前記回帰式は、前記第1説明変数及び第1係数の乗算値と前記目的変数との差分に応じた値を演算する項と、前記第1係数に応じた値に第1正則化係数を乗じた値を演算する項と、前記第2説明変数及び第2係数の乗算値に応じた値に第2正則化係数を乗じた値を演算する項と、前記第2係数に応じた値に第3正則化係数を乗じた値を演算する項とを有する、請求項12に記載の情報処理装置。
【請求項14】
前記処理部は、
前記説明変数から抽出された第1説明変数及び前記目的変数に基づいて、前記目的変数に対する第1説明変数の影響度を表す前記第1係数を更新する更新部と、
前記更新部で更新された前記第1係数及び前記第1説明変数から前記目的変数を回帰する場合の回帰誤差を演算する第1演算部と、
前記第1演算部で演算された回帰誤差が小さくなるように前記第1係数の数を演算する第2演算部と、
前記第1説明変数から抽出された第2説明変数と前記第2係数とから多重共線性の誤差を演算する第3演算部と、
前記第2係数の数を演算する第4演算部と、
前記第4演算部の演算結果に基づいて、前記回帰式のスコアを演算するスコア演算部と、
前記スコア演算部で演算された前記スコアが所定の収束条件を満たすか否かを判定する判定部と、を備え、
前記更新部は、前記判定部にて前記スコアが前記収束条件を満たさないと判定されると、前記回帰誤差に基づいて前記第1係数を更新する、請求項13に記載の情報処理装置。
【請求項15】
前記処理部は、前記判定部にて前記スコアが前記収束条件を満たすと判定されるまで、前記第1演算部、前記第2演算部、前記第3演算部、前記第4演算部、及び前記更新部の処理を繰り返し行う、請求項14に記載の情報処理装置。
【請求項16】
前記判定部にて前記スコアが前記収束条件を満たすと判定されると、前記第1係数に対応する前記複数の第1説明変数と、前記第2係数に対応する前記第2説明変数とを出力する出力部を備える、請求項14に記載の情報処理装置。
【請求項17】
前記判定部にて前記スコアが前記収束条件を満たすと判定されると、前記第1係数及び前記第2係数の数を調整する調整部を備え、
前記出力部は、前記調整部で調整された前記第1係数に対応する前記第1説明変数と、前記第2係数に対応する前記第2説明変数とを出力する、請求項16に記載の情報処理装置。
【請求項18】
前記目的変数は、不良率を含んでおり、
前記出力部で出力される前記第1説明変数及び前記第2説明変数を不良要因として特定する不良要因特定部を備える、請求項16に記載の情報処理装置。
【請求項19】
前記不良要因と、対応する前記第1係数及び前記第2係数との少なくとも一方を表示する表示部を備える、請求項18に記載の情報処理装置。
【請求項20】
回帰解析対象である目的変数及び説明変数を取得し、
第1回帰式を用いたスパースモデリングにより、前記説明変数の中から前記目的変数に対する影響度が高い複数の第1説明変数を抽出し、
第2回帰式を用いたスパースモデリングにより、前記複数の第1説明変数に対する影響度が高い第2説明変数を抽出する、情報処理方法。
【発明の詳細な説明】
【技術分野】
【0001】
本発明の一実施形態は、情報処理装置及び情報処理方法に関する。
【背景技術】
【0002】
多数の説明変数のうち、目的変数に対する影響度の大きい説明変数を抽出することを目的としたスパースモデリングが知られている。
【0003】
抽出された複数の説明変数のうち、少なくとも一部の説明変数に対する影響度の大きい別の説明変数が存在する場合があり、既存のスパースモデリングでは、目的変数に対する影響度の大きい説明変数を漏れなく抽出できないおそれがある。
【0004】
また、説明変数同士が似通っている場合、既存のスパースモデリングでは、目的変数に対する影響度の大きい説明変数を適切に抽出できないおそれがある。
【先行技術文献】
【特許文献】
【0005】
【特許文献1】米国特許公開公報2019/0244124
【特許文献2】特開2022-32337号公報
【特許文献3】米国特許公開公報2020/0227166
【発明の概要】
【発明が解決しようとする課題】
【0006】
そこで、本発明の一実施形態では、目的変数に対する影響度の大きい説明変数の漏れを抑制しつつ迅速に抽出できる情報処理装置及び情報処理方法を提供するものである。
【課題を解決するための手段】
【0007】
上記の課題を解決するために、本発明の一実施形態によれば、回帰解析対象である目的変数及び説明変数を取得する取得部と、
第1回帰式を用いたスパースモデリングにより、前記説明変数の中から前記目的変数に対する影響度が高い複数の第1説明変数を抽出する第1処理部と、
第2回帰式を用いたスパースモデリングにより、前記複数の第1説明変数に対する影響度が高い第2説明変数を抽出する第2処理部と、を備える、情報処理装置が提供される。
【図面の簡単な説明】
【0008】
【
図1】第1の実施形態による情報処理装置のブロック図。
【
図2】
図1の情報処理装置の処理動作を示すフローチャート。
【
図3】第1の実施形態による情報処理装置で得られる結果を模式的に示す図。
【
図4】第1処理部で抽出される第1説明変数と、第2処理部4で抽出される第2説明変数とを示す図。
【
図5】一比較例による情報処理装置の概略構成を示すブロック図。
【
図7】第2の実施形態による情報処理装置の概略構成を示すブロック図。
【
図8】第2の実施形態による情報処理装置の処理動作を示すフローチャート。
【
図9】半導体ウエハを複数の工程で処理する過程で不良が発生する様子を模式的に示す図。
【
図11】解析対象の目的変数及び説明変数の第1例を示す図。
【
図12】第1の実施形態又は第2の実施形態による情報処理装置の第1例の分析結果を示す。
【
図13】本実施形態による情報処理装置を遺伝子の塩基配列と遺伝子疾患との関係性の解析に適用する例を示す図。
【発明を実施するための形態】
【0009】
以下、図面を参照して、情報処理装置及び情報処理方法の実施形態について説明する。以下では、情報処理装置の主要な構成部分を中心に説明するが、情報処理装置には、図示又は説明されていない構成部分や機能が存在しうる。以下の説明は、図示又は説明されていない構成部分や機能を除外するものではない。
【0010】
(第1の実施形態)
図1は第1の実施形態による情報処理装置1のブロック図である。
図1の情報処理装置1は、データベース部2と、第1処理部3と、第2処理部4を備えている。
【0011】
データベース部2は、回帰解析対象である目的変数及び説明変数を格納している。データベース部2は取得部を兼ねており、データベース部2から取得された目的変数及び説明変数は第1処理部3に供給される。また、データベース部2から取得された説明変数は第2処理部4にも供給される。
【0012】
データベース部2の代わりに、回帰解析対象をモニタして、モニタ画像などを目的変数又は説明変数として第1処理部3又は第2処理部4に供給してもよい。例えば、半導体ウエハの製造工程での不良解析を行う場合、製造工程で半導体ウエハを撮影して、その撮影画像を例えば説明変数として第1処理部3又は第2処理部4に供給してもよい。
【0013】
第1処理部3は、第1回帰式を用いたスパースモデリングにより、目的変数に対する影響度が高い複数の第1説明変数を抽出する。第1処理部3によって抽出される第1説明変数の数は2以上であればよい。第1処理部3で抽出された複数の第1説明変数は、第2処理部4に送られる。
【0014】
第2処理部4は、第2回帰式を用いたスパースモデリングにより、複数の第1説明変数に対する影響度が高い第2説明変数を抽出する。第2処理部4によって抽出される第2説明変数の数は1以上であればよく、複数の場合もありうる。
【0015】
第1処理部3と第2処理部4が採用するスパースモデリングの具体的な手法は特定の手法に限定されない。以下では、第1処理部3と第2処理部4がマルチタスクLassoによるスパースモデリングを使用する例を説明する。
【0016】
第1処理部3は、目的変数に対する影響度を表す第1回帰係数を用いて複数の第1説明変数を抽出する。第2処理部4は、複数の第1説明変数に対する影響度を表す第2回帰係数を用いて第2説明変数を演算する。
【0017】
より具体的な一例として、第1処理部3は、第1影響度更新部(第1更新部)11と、第1回帰誤差演算部(第1演算部)12と、第1影響度密度演算部(第2演算部)13と、第1スコア演算部(第3演算部)14と、第1収束判定部(第1判定部15)15とを有する。
【0018】
第1影響度更新部11は、目的変数及び第1説明変数に基づいて、目的変数に対する第1説明変数の影響度を表す第1回帰係数を更新する。
【0019】
第1回帰誤差演算部12は、第1影響度更新部11で更新された第1回帰係数及び第1説明変数から目的変数を回帰する場合の精度を表す回帰誤差を演算する。
【0020】
第1影響度密度演算部13は、第1回帰誤差演算部12で演算された回帰誤差が小さくなるように第1回帰係数の数(密度)を演算する。
【0021】
第1スコア演算部14は、第1影響度密度演算部13の演算結果及び第1回帰誤差演算部12の演算結果に基づいて、第1回帰式の値であるスコアを演算する。
【0022】
第1収束判定部15は、第1スコア演算部14で演算されたスコアが収束条件を満たすか否かを判定する。スコアは、できるだけ小さい方が望ましいため、第1収束判定部15は、スコアが所定の閾値未満になれば、収束条件を満たしたと判断してもよい。
【0023】
第1処理部3は、第1収束判定部15にてスコアが収束条件を満たすと判定されるまで、第1影響度更新部11、第1回帰誤差演算部12、第1影響度密度演算部13、及び第1スコア演算部14の処理を繰り返す。
【0024】
第2処理部4は、第2影響度更新部(第2更新部)21と、第2回帰誤差演算部(第4演算部)22と、第2影響度密度演算部23(第5演算部)と、第2スコア演算部(第6演算部)24と、第2収束判定部25(第2判定部)とを有する。
【0025】
第2影響度更新部21は、複数の第1説明変数のそれぞれに対する第2説明変数の影響度を表す第2回帰係数を更新する。
【0026】
第2回帰誤差演算部22は、第2影響度更新部21で更新された第2回帰係数及び第2説明変数から、対応する第1説明変数を回帰する場合の精度を表す回帰誤差を演算する。
【0027】
第2影響度密度演算部23は、第2回帰誤差演算部22で演算された回帰誤差が小さくなるように第2回帰係数の数(密度)を演算する。
【0028】
第2スコア演算部24は、第2影響度密度演算部23の演算結果に基づいて、第2回帰式の値であるスコアを演算する。
【0029】
第2収束判定部25は、第2スコア演算部24で演算されたスコアが収束条件を満たすか否かを判定する。本実施形態においては、スコアは、できるだけ小さい方が望ましいため、第2収束判定部25は、スコアが所定の閾値未満になれば、収束条件を満たしたと判断してもよい。
【0030】
第2処理部4は、第2収束判定部25にてスコアが収束条件を満たすと判定されるまで、第2影響度更新部21、第2回帰誤差演算部22、第2影響度密度演算部23、及び第2スコア演算部24の処理を繰り返す。
【0031】
図1の情報処理装置1において、目的変数を不良率として、不良要因を説明変数とする場合には、さらに、第1影響度受信部16と、第2影響度受信部26と、不良要因選択部(選択部)5と、不良要因特定部6と、不良要因表示部7と、影響度表示部8とを備えてもよい。なお、目的変数は不良率に限定されず、かつ説明変数は不良要因に限定されないため、不良要因選択部5は説明変数選択部、不良要因特定部6は説明変数特定部、不良要因表示部7は説明変数表示部と一般化することができるが、本明細書では目的変数が不良率で、かつ説明変数が不良要因の例を主に説明する。
【0032】
第1影響度受信部16は、第1処理部3で抽出された複数の第1説明変数に対応する複数の第1回帰係数(影響度)を受信する。第2影響度受信部26は、第2処理部4で抽出された第2説明変数に対応する第2回帰係数(影響度)を受信する。不良要因選択部5は、第1処理部3で抽出された複数の第1説明変数に対応する複数の第1回帰係数を順に選択して、第2処理部4内の第2影響度更新部21に供給する。
【0033】
不良要因特定部6は、第1処理部3で抽出された複数の第1説明変数と、第2処理部4で抽出された第2説明変数とを不良要因として特定する。不良要因表示部7は、不良要因特定部6で特定された不良要因を不図示の表示装置又は各種の電子機器の表示部に表示する。電子機器は、PC、タブレット、スマートフォンなどである。影響度表示部8は、複数の第1説明変数に対応する複数の影響度と、第2説明変数に対応する影響度とを表示装置又は電子機器の表示部に表示する。不良要因表示部7と影響度表示部8は、同一の表示装置又は電子機器の表示部に不良要因と影響度を表示してもよい。
【0034】
第1処理部3は、例えば、以下の式(1)に示す第1回帰式のスコアを最小化する第1回帰係数βを演算するとともに、大きな第1回帰係数βの成分に対応する複数の第1説明変数Xの成分を演算する。具体的には、複数の第1説明変数Xの成分(インデックス)I=(i1、i2、…)を求める。
【数1】
【0035】
式(1)の右辺第1項は、第1説明変数Xに第1回帰係数βを乗じた値と、目的変数Yとの差分のノルムであり、より具体的には、前述した差分の二乗和を平均化した値を演算する。右辺第2項は、第1回帰係数βのノルムに第1正則化係数λを乗じた正則化項である。
【0036】
第2処理部4は、i∈Iに対して、複数の第1説明変数Xのうち、更新対象成分(以下、i成分とする)以外をX'として、以下の式(2)に示す第2回帰式L'(β)を最小化する第2回帰係数β'を求め、大きな第2回帰係数β'の成分に対応する第2説明変数X'の成分(インデックス)Ii=(ji,1,ji,2,…)を求める。
【数2】
【0037】
式(2)の右辺第1項は、第2説明変数X’に第2回帰係数β’を乗じた値と、第1説明変数Xiとの差分のノルムであり、より具体的には、前述した差分の二乗和を平均化した値である。右辺第2項は、第2回帰係数β’のノルムに第2正則化係数λ’を乗じた正規化項である。
【0038】
図1の情報処理装置1は、式(1)で演算される複数の第1説明変数Iと、式(2)で演算される第2説明変数Iiとを出力する。
【0039】
図2は
図1の情報処理装置1の処理動作を示すフローチャートである。
図2のステップS1~S7は第1処理部3の処理動作を示し、ステップS8~S16は第2処理部4の処理動作を示し、ステップS17~S19は不良要因特定部6、不良要因表示部7、及び影響度表示部8の処理動作を示している。
【0040】
まず、第1処理部3は、データベース部2に登録されている目的変数と説明変数を読み出す(ステップS1)。ステップS1では、第1処理部3で最終的に抽出される複数の第1説明変数よりも多い数の説明変数を読み出す。
【0041】
第1影響度更新部11は、ステップS1で読み出された目的変数と説明変数に基づいて、目的変数に対する説明変数の影響度を表す第1回帰係数を更新する(ステップS2)。
【0042】
次に、第1回帰誤差演算部12は、ステップS2で更新された第1回帰係数と説明変数とから目的変数を回帰する場合の精度を表す回帰誤差を演算する(ステップS3)。次に、第1影響度密度演算部13は、ステップS3で演算された回帰誤差が小さくなるように第1回帰係数の数(密度)を演算する(ステップS4)。ステップS4の処理により、抽出される複数の第1説明変数の数と、対応する第1回帰係数の数とが調整される。
【0043】
次に、第1スコア演算部14は、ステップS4の演算結果に基づいて第1回帰式のスコアを演算する(ステップS5)。次に、第1収束判定部15は、スコアが所定の収束条件を満たすか否かを判定する(ステップS6)。スコアは、一般には小さいほど望ましいため、収束条件は、例えば、許容可能なスコアの上限値に設定される。
【0044】
ステップS6でスコアが収束条件を満たさないと判定されると、ステップS2~S6の処理を繰り返す。ステップS6でスコアが収束条件を満たすと判定されると、抽出された複数の第1説明変数に対応する複数の第1回帰係数が第1影響度受信部16に送られる(ステップS7)。抽出された複数の第1説明変数は複数の不良要因に対応する。
【0045】
不良要因選択部5は、複数の不良要因に対応する複数の第1回帰係数の中から一つを順に選択する(ステップS8)。すなわち、ステップS8では、不良要因ごとに選択する。次に、データベース部2から、対応する説明変数(第2説明変数)を取得する(ステップS9)。
【0046】
以降のステップS10~S15の処理は、ステップS8で選択した不良要因に対応する第1回帰係数ごとに行われる。まず、第2影響度更新部21は、選択した第1説明変数に対する第2説明変数の影響度を表す第1係数と第2係数を更新する(ステップS10)。第1係数は第2回帰式の回帰係数、第2係数は多重共線性の関係を表す係数である。第1係数は式(2)の第2回帰係数β’、第2係数は式(2)の第2正則化係数λ’に対応する。本明細書では、第1係数と第2係数が第2回帰係数に対応するものとする。
【0047】
次に、第2回帰誤差演算部22は、ステップS10で更新された第2回帰係数と第2説明変数から、選択した第1説明変数を回帰する場合の精度を表す回帰誤差を演算する(ステップS11)。次に、第2影響度密度演算部23は、ステップS11で演算された回帰誤差が小さくなるように第2係数の数(密度)を演算する(ステップS12)。
【0048】
次に、第2スコア演算部24は、ステップS12の演算結果に基づいて第2回帰式のスコアを演算する(ステップS13)。次に、第2収束判定部25は、スコアが所定の収束条件を満たすか否かを判定する(ステップS14)。
【0049】
ステップS14でスコアが収束条件を満たさないと判定されると、ステップS10~S14の処理を繰り返す。ステップS14でスコアが収束条件を満たすと判定されると、抽出された第2説明変数を第2影響度受信部26に送信する(ステップS15)。
【0050】
複数の不良要因についてステップS10~S15の処理が終わると、全不良要因についてステップS10~S15の処理を行ったか否かを判定する(ステップS16)。まだ処理を行っていない不良要因が残っていれば、ステップS8~S16の処理を繰り返す。
【0051】
全不良要因についてステップS10~S15の処理が終わると、不良要因特定部6は、第1処理部3の処理(ステップS2~S7)の処理で得られた複数の第1説明変数と、第2処理部4の処理(ステップS10~S15)の処理で得られた第2説明変数とを不良要因として特定する(ステップS17)。
【0052】
次に、不良要因表示部7は、ステップS15で特定された不良要因を表示する(ステップS18)。また、影響度表示部8は、不良要因に対応する複数の第1説明変数と第2説明変数それぞれに対応する影響度を表示する(ステップS19)。
【0053】
図3は第1の実施形態による情報処理装置1で得られる結果を模式的に示す図である。
図3の中央には、目的変数Yが配置されている。第1処理部3は、黒丸で示す目的変数Yに対する影響度が高い複数の第1説明変数(
図3の目的変数Yに実線で繋がる一部の灰色丸)X
1とX
2を抽出する。第2処理部4は、複数の第1説明変数に対する影響度が高い第2説明変数(
図3の各第1説明変数に実線で繋がる白ヌキ丸)を抽出する。
【0054】
これにより、第1の実施形態によれば、目的変数Yに対する影響度の高い複数の第1説明変数を抽出するだけでなく、個々の第1説明変数に対する影響度の高い第2説明変数も抽出でき、目的変数Yに対する影響度の高いすべての説明変数を漏れなく抽出できる。
【0055】
第2処理部4は、単体では目的変数Yに対する影響度は高くないものの、複数を組み合わせることで第1説明変数に対する影響度が高くなる第2説明変数を抽出することも可能である。
【0056】
図4は、第1処理部3で抽出される第1説明変数と、第2処理部4で抽出される第2説明変数とを示す図である。例えば、順位1では、第1処理部3は第1説明変数Aを抽出し、第2処理部4は第2説明変数A1、A2、A3、A4+A5を抽出する。A4とA5のそれぞれは、単体では第1説明変数Aに対する影響度が高くないが、A4とA5を組み合わせることで、第1説明変数Aに対する影響度が高くなることを示している。
【0057】
複数の第2説明変数を組み合わせることで、第1説明変数に対する影響度が高くなる具体例として、複数の第2説明変数を足し合わせる例(順位1)の他に、複数の第2説明変数を減算する例(順位2)、複数の第2説明変数の積和演算を行う例(順位4)、複数の第2説明変数の積差演算を行う例(順位5)などがある。
【0058】
図5は一比較例による情報処理装置100の概略構成を示すブロック図である。
図5の情報処理装置100は、半導体デバイスの製造工程での不良要因を解析することを目的としたブロック構成を示している。
【0059】
図5の情報処理装置100は、影響度更新部31と、回帰誤差演算部32と、影響度密度演算部33と、スコア演算部34と、収束判定部35と、不良要因特定部36と、不良要因表示部37と、影響度表示部38と、半導体観測部39と、類似特徴量演算部40とを備えている。
【0060】
半導体観測部39と類似特徴量演算部40以外の各ブロックは、
図1の同一名称のブロックと同様の処理を行うため、説明を省略する。半導体観測部39は、
図1のデータベース部2の代わりに設けられ、解析対象の半導体ウエハの不良解析に関する目的変数と説明変数を入力する。
【0061】
類似特徴量演算部40は、説明変数の特徴量に類似する類似特徴量を演算し、説明変数に類似する説明変数を抽出する。
【0062】
図5に示す一比較例による情報処理装置100は、類似特徴量演算部40を備えているため、目的変数に対する影響度の高い説明変数に類似する説明変数を抽出できるが、二段階に分けて回帰分析を行うわけではないため、目的変数に対する影響度の高い複数の第1説明変数のそれぞれに対して影響度の高い第2説明変数を抽出することはできない。よって、
図5の情報処理装置100では、
図3又は
図4に示す第2説明変数を抽出できない。
【0063】
このように、第1の実施形態では、目的変数に対して影響度の高い複数の第1説明変数を抽出するスパースモデリングを行った後、複数の第1説明変数に対して影響度の高い第2説明変数を抽出するスパースモデリングを行うため、目的変数に対して影響度の高い説明変数を実質的に漏れなく抽出できる。
【0064】
(第2の実施形態)
第1の実施形態では、二種類の回帰式を用いたスパースモデリングを行うため、回帰分析結果が得られるのに時間がかかるおそれがある。以下に説明する第2の実施形態は、1回の回帰分析で回帰分析結果が得られるようにしたものである。
【0065】
第2の実施形態による情報処理装置1が使用する回帰式には、式(3)に示すように、多重共線性の関係にある説明変数に関する項を含んでいる。式(3)のλ、λ2、λ3は正則化係数である。
【数3】
【0066】
式(3)の右辺第1項は、第1説明変数Xに第1係数βを乗じた値と、目的変数Yとの差分のノルムであり、より具体的には、前述した差分の二乗和を平均化した値に対応する。右辺第2項は、第1係数βのノルムに第1正則化係数λを乗じた値であり、より具体的には、第1係数βのノルムに第1正則化係数λを乗じた値の絶対値の和である。右辺第3項は、第2説明変数Xに第2係数Cを乗じた値のノルムに第2正則化係数λ2を乗じた値の絶対値である。右辺第4項は、第2係数Cのノルムに第3正則化係数λ3を乗じた値の絶対値である。
【0067】
多重共線性とは、説明変数同士に線形関係(一次従属関係)がある共線性が複数存在する場合を意味する。多重共線性の関係にある複数の説明変数が存在すると、目的変数に対する影響度の高い説明変数を適切に抽出できなくなるおそれがある。そこで、式(3)では、多重共線性に関する正則化項(右辺第3項と第4項)を設けて、多重共線性の関係にある説明変数を考慮に入れて、スパースモデリングを行う。
【0068】
図6A、
図6B、及び
図6Cは、は式(3)を説明する図である。
図6Aに示すように、式(3)の右辺の第3項と第4項は、多重共線性に関する正則化項である。この正則化項の値はできるだけ小さいことが望ましい。
【0069】
本明細書では、式(3)のβを第1係数、Cを第2係数と呼ぶ。第1係数βは回帰係数である。第2係数Cは多重共線性の関係を表す係数であり、
図6Bに示すように、例えばp次元×p次元の正方行列で表される係数である。Cの各列は多重共線性を表している。第2係数Cの値は、第1係数βに関連しているため、式(3)のスコアが最小になるように、正則化項の第2係数Cを求めることで、第1係数βについても求めたことになる。式(3)の第4項は、第2係数Cのノルムを表しており、できるだけ小さい値にするのが望ましい。
【0070】
式(3)の右辺第3項は、
図6Cに示すように、n次元×p次元の行列で表される説明変数Xと、
図6Bに示すp次元×p次元の行列で表される第2係数Cとの乗算であり、その乗算結果がゼロになるようにする。
【0071】
第2の実施形態による情報処理装置1は、式(3)の右辺第3項がゼロになり、かつ右辺第4項ができるだけ小さくなるように第2係数Cを求める。
【0072】
図7は第2の実施形態による情報処理装置1aの概略構成を示すブロック図である。
図7の情報処理装置1aは、データベース部(取得部)2と、処理部41を備えている。
図7のデータベース部2は
図1のデータベース部2と同様である。データベース部2は、処理部41の外側に配置されていてもよい。処理部41は、所定の回帰式を用いたスパークモデリングにより、目的変数に対する影響度が高い複数の第1説明変数を抽出するとともに、複数の第1説明変数に対する影響度が高い第2説明変数を抽出する。
【0073】
図7の処理部41は、影響度更新部(更新部)42と、回帰誤差演算部(第1演算部)43と、影響度密度演算部(第2演算部)44と、多重共線性誤差演算部(第3演算部)45と、多重共線性密度演算部(第4演算部)46と、スコア演算部47と、収束判定部(判定部)48とを有する。
【0074】
影響度更新部42は、説明変数から抽出された第1説明変数と目的変数に基づいて、目的変数に対する第1説明変数の影響度を表す回帰係数を更新する。
【0075】
回帰誤差演算部43は、影響度更新部42で更新された回帰係数及び第1説明変数から目的変数を回帰する場合の回帰誤差を表す回帰誤差を演算する。
【0076】
影響度密度演算部44は、回帰誤差演算部43で演算された回帰誤差が小さくなるように回帰係数の数(密度)を演算する。
【0077】
多重共線性誤差演算部45は、第2説明変数と第2係数から多重共線性の誤差を演算する。より具体的には、多重共線性誤差演算部45は、回帰式のスコアが最小になるように、式(3)の右辺第3項における第2説明変数と第2係数Cを求める。
【0078】
多重共線性密度演算部46は、第2係数の数(密度)を演算する。より具体的には、多重共線性密度演算部46は、回帰式のスコアが最小になるように、式(3)の右辺第4項の第2係数Cを求める。
【0079】
上述したように、第2係数Cは、第1係数βに関連する値であるため、多重共線性誤差演算部45と多重共線性密度演算部46の処理を行うことで、第2係数Cだけでなく、第1係数βを求めることになる。
【0080】
スコア演算部47は、多重共線性密度演算部46の演算結果に基づいて、式(3)に示す回帰式のスコアを演算する。
【0081】
収束判定部48は、スコア演算部47でされたスコアが収束条件を満たすか否かを判定する。スコアは、できるだけ小さい方が望ましいため、収束判定部48は、スコアが所定の閾値未満になれば、収束条件を満たしたと判断してもよい。
【0082】
図7の処理部41は、影響度調整部51を有していてもよい。影響度調整部51は、上述した多重共線性誤差演算部45及び多重共線性密度演算部46の処理を行って抽出された第1係数βと第2係数Cの数が多すぎる場合に、その数を適正な数に調整する処理を行う。
【0083】
また、
図7の情報処理装置1aは、不良要因特定部6、不良要因表示部7、及び影響度表示部8を備えていてもよい。
【0084】
不良要因特定部6は、影響度調整部51で調整された第1係数β及び第2係数Cに対応する第1説明変数及び第2説明変数を不良要因として特定する。不良要因表示部7と影響度表示部8の処理動作は、
図1と同様である。
【0085】
図8は第2の実施形態による情報処理装置1aの処理動作を示すフローチャートである。まず、処理部41は、データベース部2から目的変数と説明変数を取得する(ステップS21)。解析対象が半導体製造工程の半導体ウエハの場合、データベース部2の代わりに、半導体観測部などから目的変数と説明変数を取得してもよい。
【0086】
次に、影響度更新部42は、説明変数から抽出された第1説明変数と目的変数に基づいて、目的変数に対する第1説明変数の影響度を表す回帰係数を更新する(ステップS22)。
【0087】
次に、回帰誤差演算部43は、影響度更新部42で更新された回帰係数と第1説明変数とから目的変数を回帰する場合の精度を表す回帰誤差を演算する(ステップS23)。
次に、影響度密度演算部44は、回帰誤差演算部43で演算された回帰誤差が小さくなるように回帰係数の数(密度)を演算する(ステップS24)。
【0088】
次に、多重共線性誤差演算部45は、第2説明変数と第2係数から多重共線性の誤差を演算する(ステップS25)。より具体的には、多重共線性誤差演算部45は、回帰式のスコアが最小になるように、式(3)の右辺第3項における第2説明変数と第2係数Cを求める。
【0089】
次に、多重共線性密度演算部46は、第2係数の数(密度)を演算する(ステップS26)。より具体的には、多重共線性密度演算部46は、回帰式のスコアが最小になるように、式(3)の右辺第4項の第2係数Cを求める。
【0090】
次に、スコア演算部47は、多重共線性密度演算部46の演算結果に基づいて、式(3)に示す回帰式のスコアを演算する(ステップS27)。
【0091】
次に、収束判定部48は、スコア演算部47でされたスコアが収束条件を満たすか否かを判定する(ステップS28)。スコアが収束条件を満たないと判定されると、ステップS22~S28の処理を繰り返す。スコアが収束条件を満たすと判定されると、影響度調整部51は、上述した多重共線性誤差演算部45及び多重共線性密度演算部46の処理を行って抽出された第1係数βと第2係数Cの数が多すぎる場合に、その数を適正な数に調整する処理を行う(ステップS29)。
【0092】
次に、不良要因特定部6は、影響度調整部51で調整された第1係数β及び第2係数Cに対応する第1説明変数及び第2説明変数を不良要因として特定する(ステップS30)。
【0093】
次に、不良要因表示部7は、不良要因を表示する(ステップS31)。また、影響度表示部8は、第1係数βと第2係数Cからなる影響度を表示する(ステップS32)。
【0094】
このように、第2の実施形態では、1段階のスパースモデリングで、目的変数に対する影響度が高い複数の第1説明変数と、複数の第1説明変数に対する影響度が高い第2説明変数とを抽出できる。よって、二段階に分けてスパースモデリングを行う第1の実施形態よりも、情報処理装置1aの処理動作を簡略化することができ、より迅速に説明変数を抽出できる。
【0095】
また、第2の実施形態では、スパースモデリングに使用する回帰式に、多重共線性の関係にある説明変数に対する罰則項(正則化項)を含めるため、多重共線性の関係にある説明変数の影響を受けることなく、迅速に所望の説明変数を抽出できる。
【0096】
(第3の実施形態)
上述した第1及び第2の実施形態に係る情報処理装置1の用途は問わないが、例えば、半導体デバイスの製造工程における不良解析に用いることができる。半導体デバイスは、半導体ウエハ上に成膜や露光、エッチングなどの多数の工程を施して製造される。いずれかの工程の処理中に不良が発生するおそれがあり、どの工程でどのような不良が発生したかを解析することにより、不良の要因を特定して、その対策を図ることができ、歩留まりの向上につながる。
【0097】
図9は半導体ウエハを複数の工程で処理する過程で不良が発生する様子を模式的に示す図である。
図9では、半導体製造装置に搬入した半導体ウエハに対して、A工程からF工程までの計6工程を経て、処理済みの半導体ウエハを払い出す例を示している。
図9は、B工程で半導体ウエハの中央部に不良が生じ、E工程でさらにリング状の不良が生じる例を示している。
【0098】
半導体ウエハの電気的特性値又は何らかの測定値を目的変数として可視化することにより
図10のような4種類の参照画像に分類できたとする。参照画像IM1は不良なしの画像、参照画像IM2は中央部の不良のみを含む画像、参照画像IM3はリング状の不良のみを含む画像、参照画像IM4は中央部とリング状の不良の両方を含む画像である。
図10に示す4種類の参照画像は、他のチップと比較して測定値が高い、又は低い場合等に不良と見立てて、測定値が高い又は低いチップを色彩又は輝度変化で表現したものである。
【0099】
半導体ウエハの不良解析を行う場合、不良解析対象の半導体ウエハの電気的特性値又は測定値等を目的変数として可視化した画像が、参照画像IM1~IM4のいずれに該当するかを画像解析により検出することが考えられる。しかしながら、同一の半導体ウエハが、異なる複数の形態の不良を含む場合もあり、不良の形態の数が増えると、異なる複数の不良の組合せまで考慮に入れるとなると、参照画像の数が非常に多くなり、不良解析対象の画像の分類に多大な時間がかかってしまう。また、不良の形態ごとに、不良発生率が大きく異なる場合、不良発生率の低い不良の形態については、不良の真因を精度よく判定できないおそれがある。
【0100】
これに対して、上述した式(1)及び式(2)によるスパースモデリング、あるいは式(3)によるスパースモデリングを行うことで、目的変数に対する影響度の高い複数の第1説明変数と、複数の第1説明変数に対する影響度の高い第2説明変数とを迅速かつ正確に抽出できるため、不良の真因を精度よく判定できる。
【0101】
図11は解析対象の目的変数及び説明変数の第1例を示す図、
図12は第1の実施形態又は第2の実施形態による情報処理装置1の第1例の分析結果を示す図である。
図11に示すように、データベース部2には、インデックス(識別番号)、目的変数Y、説明変数Xからなるデータセットが登録されている。あるいは、
図11の各情報が不図示の半導体観測部などから入力されてもよい。
図11の例では、目的変数Yは不良率とクラスとを含んでいる。クラスは、例えば不良の種類を示す。不良率は、各クラスの不良率を示す。説明変数Xは、工程ごとの装置名、製造条件、処理温度、処理ガス圧力などの情報を含んでいる。
図11の説明変数のうち、各工程の装置名と製造条件は、非数値データからなるカテゴリ変数である。各工程の処理温度と処理ガス圧力は、数値データからなる連続変数である。
【0102】
図11では、説明変数のうち、A工程_処理ガス圧力とB工程_処理後膜厚が同一の例を示している。この場合、通常の統計分析では、両方の説明変数の区別がつかない。スパースモデリングでは、より少ない数の説明変数を取得するため、2つのうちのいずれか一方のみが選択される。2つのうち、A工程_処理ガス圧力が重要だったとしても、B工程_処理後膜厚が抽出されることも起こりえる。説明変数の総数が増えるほど、偶然類似する説明変数の数も増えて、所望の説明変数が抽出されない場合も起きやすくなる。
【0103】
本実施形態によれば、
図12に示すように、B工程_処理後膜厚を説明変数として抽出したとしても、その類似特徴量としてA工程_処理ガス圧力の説明変数を抽出することができる。
【0104】
図10~
図12では、本実施形態による情報処理装置1を半導体デバイスの製造不良の解析に適用する例を説明したが、本実施形態による情報処理装置1は、種々のデータの解析に適用可能である。
図13は本実施形態による情報処理装置1を遺伝子の塩基配列と遺伝子疾患との関係性の解析に適用する例を示す図である。
図13は、一塩基多型(SNP:Single Nucleotide Polymorphism)の変異を示している。
図13には、個々の検体ごとに、SNP1~SNP7の変異と疾患率とを対応づけている。本実施形態による情報処理装置1に、解析対象の検体のSNP1~SNP7を入力することで、疾患率を精度よく予測できる。
【0105】
図13は、SNP3とSNP5が偶然一致した例を示している。この場合も、統計分析上はSNP3とSNP5の区別がつかない。より重要な説明変数がSNP3だったとしても、SNP5が抽出されることが起こりえる。しかしながら、本実施形態によれば、SNP5を抽出したとしても、SNP5の類似特徴量としてSNP3も抽出できる。
【0106】
また、
図14に示すように、複数の説明変数を組み合わせことで目的変数に対する影響度が高くなる場合もありえる。
図14は2×要素A=3×要素B+2×要素Cを満たす場合がある例を示している。要素A、B、Cはいずれも説明変数である。例えば、3×要素B+2×要素Cが目的変数に対する影響度が高いとする。この場合、本来であれば、要素B(=100)と要素C(=50)を選択するべきであるが、誤って、要素A(=200)を選択するおそれがある。
【0107】
これに対して、第1又は第2の実施形態による情報処理装置1では、
図15に示すように、要素A(=200)を選択したとしても、類似特徴量として(3×要素B+2×要素C)/2を抽出できる。
【0108】
このように、第3の実施形態による情報処理装置1は、目的変数に対して影響を与える可能のある多数の説明変数を有する様々な分野において、目的変数に対する影響度の高い複数の第1説明変数と、複数の第1説明変数に対する影響度の高い第2説明変数とを精度よく抽出できる。
【0109】
上述した実施形態で説明した情報処理装置1、1aの少なくとも一部は、ハードウェアで構成してもよいし、ソフトウェアで構成してもよい。ソフトウェアで構成する場合には、情報処理装置1、1aの少なくとも一部の機能を実現するプログラムをフレキシブルディスクやCD-ROM等の記録媒体に収納し、コンピュータに読み込ませて実行させてもよい。記録媒体は、磁気ディスクや光ディスク等の着脱可能なものに限定されず、ハードディスク装置やメモリなどの固定型の記録媒体でもよい。
【0110】
また、情報処理装置1、1aの少なくとも一部の機能を実現するプログラムを、インターネット等の通信回線(無線通信も含む)を介して頒布してもよい。さらに、同プログラムを暗号化したり、変調をかけたり、圧縮した状態で、インターネット等の有線回線や無線回線を介して、あるいは記録媒体に収納して頒布してもよい。
【0111】
[付記]
[項目1]
回帰解析対象である目的変数及び説明変数を取得する取得部と、
第1回帰式を用いたスパースモデリングにより、前記説明変数の中から前記目的変数に対する影響度が高い複数の第1説明変数を抽出する第1処理部と、
第2回帰式を用いたスパースモデリングにより、前記複数の第1説明変数に対する影響度が高い第2説明変数を抽出する第2処理部と、を備える、情報処理装置。
[項目2]
前記第1処理部は、前記目的変数に対する影響度を表す第1回帰係数を用いて前記複数の第1説明変数を抽出し、
前記第2処理部は、前記複数の第1説明変数に対する影響度を表す第2回帰係数を用いて前記第2説明変数を抽出する、項目1に記載の情報処理装置。
[項目3]
前記第1処理部は、前記第1回帰式の値であるスコアが最小になる前記第1回帰係数に対応する前記複数の第1説明変数を演算し、
前記第2処理部は、前記第2回帰式の値であるスコアが最小になる前記第2回帰係数に対応する前記第2説明変数を演算する、項目2に記載の情報処理装置。
[項目4]
前記第1処理部は、
前記目的変数及び前記第1説明変数に基づいて前記第1回帰係数を更新する第1更新部と、
前記第1更新部で更新された前記第1回帰係数及び対応する前記第1説明変数から前記目的変数を回帰する場合の精度を表す回帰誤差を演算する第1演算部と、
前記第1演算部で演算された前記回帰誤差が小さくなるように前記第1回帰係数の数を演算する第2演算部と、
前記第2演算部の演算結果に基づいて、前記第1回帰式の値であるスコアを演算する第3演算部と、
前記第3演算部で演算された前記スコアが収束条件を満たすか否かを判定する第1判定部と、を備える、項目3に記載の情報処理装置。
[項目5]
前記第1処理部は、前記第1判定部にて前記スコアが前記収束条件を満たすと判定されるまで、前記第1更新部、前記第1演算部、前記第2演算部、及び前記第3演算部の処理を繰り返し行う、項目4に記載の情報処理装置。
[項目6]
前記第1判定部にて前記スコアが前記収束条件を満たすと判定された際の前記第1回帰係数が複数存在する場合には、そのうちの一つを選択する選択部を備え、
前記第2処理部は、前記選択部で選択された前記第1回帰係数に応じた前記第2回帰係数を用いて前記第2説明変数を抽出する、項目4又は5に記載の情報処理装置。
[項目7]
前記第2処理部は、
前記複数の第1説明変数に基づいて、前記複数の第1説明変数に対する前記第2説明変数の影響度を表す前記第2回帰係数を更新する第2更新部と、
前記第2更新部で更新された前記第2回帰係数及び前記第2説明変数から前記複数の第1説明変数を回帰する場合の精度を表す回帰誤差を演算する第4演算部と、
前記第4演算部で演算された前記回帰誤差が小さくなるように前記第2回帰係数の数を演算する第5演算部と、
前記第5演算部の演算結果に基づいて、前記第2回帰式の値であるスコアを演算する第6演算部と、
前記第6演算部で演算された前記スコアが収束条件を満たすか否かを判定する第2判定部と、を備える、項目6に記載の情報処理装置。
[項目8]
前記第2処理部は、前記第2判定部にて前記スコアが前記収束条件を満たすと判定されるまで、前記第2更新部、前記第4演算部、前記第5演算部、及び前記第6演算部の処理を繰り返し行う、項目7に記載の情報処理装置。
[項目9]
前記第1処理部で抽出された前記複数の第1説明変数のそれぞれごとに、前記第2処理部で抽出された前記第2説明変数を特定する特定部を備える、項目2乃至8のいずれか一項に記載の情報処理装置。
[項目10]
前記目的変数は不良率を含んでおり、
前記特定部は、前記第1処理部で抽出された前記複数の第1説明変数のそれぞれごとに、前記第2処理部で抽出された前記第2説明変数を不良要因として特定する、項目9に記載の情報処理装置。
[項目11]
前記不良要因と、対応する前記第1回帰係数及び前記第2回帰係数との少なくとも一方を表示する表示部を備える、項目10に記載の情報処理装置。
[項目12]
回帰解析対象である目的変数及び説明変数を取得する取得部と、
所定の回帰式を用いたスパークモデリングにより、前記説明変数の中から前記目的変数に対する影響度が高い複数の第1説明変数を抽出するとともに、前記複数の第1説明変数に対する影響度が高い第2説明変数を抽出する処理部を備える、情報処理装置。
[項目13]
前記回帰式は、前記第1説明変数及び第1係数の乗算値と前記目的変数との差分に応じた値を演算する項と、前記第1係数に応じた値に第1正則化係数を乗じた値を演算する項と、前記第2説明変数及び第2係数の乗算値に応じた値に第2正則化係数を乗じた値を演算する項と、前記第2係数に応じた値に第3正則化係数を乗じた値を演算する項とを有する、項目12に記載の情報処理装置。
[項目14]
前記処理部は、
前記説明変数から抽出された第1説明変数及び前記目的変数に基づいて、前記目的変数に対する第1説明変数の影響度を表す前記第1係数を更新する更新部と、
前記更新部で更新された前記第1係数及び前記第1説明変数から前記目的変数を回帰する場合の回帰誤差を演算する第1演算部と、
前記第1演算部で演算された回帰誤差が小さくなるように前記第1係数の数を演算する第2演算部と、
前記第1説明変数から抽出された第2説明変数と前記第2係数とから多重共線性の誤差を演算する第3演算部と、
前記第2係数の数を演算する第4演算部と、
前記第4演算部の演算結果に基づいて、前記回帰式のスコアを演算するスコア演算部と、
前記スコア演算部で演算された前記スコアが所定の収束条件を満たすか否かを判定する判定部と、を備え、
前記更新部は、前記判定部にて前記スコアが前記収束条件を満たさないと判定されると、前記回帰誤差に基づいて前記第1係数を更新する、項目13に記載の情報処理装置。
[項目15]
前記処理部は、前記判定部にて前記スコアが前記収束条件を満たすと判定されるまで、前記第1演算部、前記第2演算部、前記第3演算部、前記第4演算部、及び前記更新部の処理を繰り返し行う、項目14に記載の情報処理装置。
[項目16]
前記判定部にて前記スコアが前記収束条件を満たすと判定されると、前記第1係数に対応する前記複数の第1説明変数と、前記第2係数に対応する前記第2説明変数とを出力するする出力部を備える、項目14又は15に記載の情報処理装置。
[項目17]
前記判定部にて前記スコアが前記収束条件を満たすと判定されると、前記第1係数及び前記第2係数の数を調整する調整部を備え、
前記出力部は、前記調整部で調整された前記第1係数に対応する前記第1説明変数と、前記第2係数に対応する前記第2説明変数とを出力する、項目16に記載の情報処理装置。
[項目18]
前記目的変数は、不良率を含んでおり、
前記出力部で出力される前記第1説明変数及び前記第2説明変数を不良要因として特定する不良要因特定部を備える、項目16又は17に記載の情報処理装置。
[項目19]
前記不良要因と、対応する前記第1係数及び前記第2係数との少なくとも一方を表示する表示部を備える、項目18に記載の情報処理装置。
[項目20]
回帰解析対象である目的変数及び説明変数を取得し、
第1回帰式を用いたスパースモデリングにより、前記説明変数の中から前記目的変数に対する影響度が高い複数の第1説明変数を抽出し、
第2回帰式を用いたスパースモデリングにより、前記複数の第1説明変数に対する影響度が高い第2説明変数を抽出する、情報処理方法。
【0112】
本開示の態様は、上述した個々の実施形態に限定されるものではなく、当業者が想到しうる種々の変形も含むものであり、本開示の効果も上述した内容に限定されない。すなわち、特許請求の範囲に規定された内容およびその均等物から導き出される本開示の概念的な思想と趣旨を逸脱しない範囲で種々の追加、変更および部分的削除が可能である。
【符号の説明】
【0113】
1、1a 情報処理装置、2 データベース部、3 第1処理部、4 第2処理部、5 不良要因選択部、6 不良要因特定部、7 不良要因表示部、8 影響度表示部、11 第1影響度更新部、12 第1回帰誤差演算部、13 第1影響度密度演算部、14 第1スコア演算部、15 第1収束判定部、16 第1影響度受信部、21 第2影響度更新部、22 第2回帰誤差演算部、23 第2影響度密度演算部、24 第2スコア演算部、25 第2収束判定部、26 第2影響度受信部、31 影響度更新部、32 回帰誤差演算部、33 影響度密度演算部、34 スコア演算部、35 収束判定部、36 不良要因特定部、37 不良要因表示部、38 影響度表示部、39 半導体観測部、40 類似特徴量演算部、41 処理部、42 影響度更新部、43 回帰誤差演算部、44 影響度密度演算部、45 多重共線性誤差演算部、46 多重共線性密度演算部、47 スコア演算部、48 収束判定部、51 影響度調整部、100 情報処理装置