(19)【発行国】日本国特許庁(JP)
(12)【公報種別】公開特許公報(A)
(11)【公開番号】P2024042988
(43)【公開日】2024-03-29
(54)【発明の名称】情報処理装置及び情報処理方法
(51)【国際特許分類】
G06N 99/00 20190101AFI20240322BHJP
【FI】
G06N99/00 180
【審査請求】未請求
【請求項の数】19
【出願形態】OL
(21)【出願番号】P 2022147949
(22)【出願日】2022-09-16
(71)【出願人】
【識別番号】318010018
【氏名又は名称】キオクシア株式会社
(74)【代理人】
【識別番号】100120031
【弁理士】
【氏名又は名称】宮嶋 学
(74)【代理人】
【識別番号】100107582
【弁理士】
【氏名又は名称】関根 毅
(74)【代理人】
【識別番号】100118843
【弁理士】
【氏名又は名称】赤岡 明
(74)【代理人】
【識別番号】100103263
【弁理士】
【氏名又は名称】川崎 康
(72)【発明者】
【氏名】吉永 悠真
(72)【発明者】
【氏名】前園 淳
(72)【発明者】
【氏名】鳥井 修
(72)【発明者】
【氏名】冨岡 伸一郎
(72)【発明者】
【氏名】真鍋 晋一郎
(57)【要約】
【課題】回帰係数パラメータを迅速に更新する。
【解決手段】タスク及び特徴量で特徴づけられた複数の要素のそれぞれごとに、正則化項を含む所定の目的関数に基づいて回帰係数パラメータを更新する情報処理装置は、前記複数の要素から、前記回帰係数パラメータの更新対象である要素を選択する更新対象選択部と、前記更新対象選択部で選択されなかった要素の前記正則化項の値を固定化する非更新対象固定部と、前記更新対象選択部で選択されなかった要素の回帰係数パラメータに基づいて、前記更新対象選択部で選択された要素の回帰係数パラメータを更新するための計算式を選択する計算式選択部と、前記計算式選択部で選択された計算式に基づいて、前記更新対象選択部で選択された要素の回帰係数パラメータを更新するパラメータ更新部と、を備える。
【選択図】
図1
【特許請求の範囲】
【請求項1】
タスク及び特徴量で特徴づけられた複数の要素のそれぞれごとに、正則化項を含む所定の目的関数に基づいて回帰係数パラメータを更新する情報処理装置であって、
前記複数の要素から、前記回帰係数パラメータの更新対象である要素を選択する更新対象選択部と、
前記更新対象選択部で選択されなかった要素の前記正則化項の値を固定化する非更新対象固定部と、
前記更新対象選択部で選択されなかった要素の回帰係数パラメータに基づいて、前記更新対象選択部で選択された要素の回帰係数パラメータを更新するための計算式を選択する計算式選択部と、
前記計算式選択部で選択された計算式に基づいて、前記更新対象選択部で選択された要素の回帰係数パラメータを更新するパラメータ更新部と、を備える、情報処理装置。
【請求項2】
前記正則化項は、前記更新対象選択部で選択された要素についての第1項と、前記更新対象選択部で選択されなかったすべての要素についての第2項とを含み、
前記非更新対象固定部は、前記第2項をゼロとするとともに、前記更新対象選択部で選択された要素の回帰係数パラメータの絶対値に正則化パラメータを乗じた値を前記正則化項とする、請求項1に記載の情報処理装置。
【請求項3】
前記更新対象選択部で選択された要素の回帰係数パラメータが、前記回帰係数パラメータの切片に該当するか否かを判定する切片判定部を備え、
前記計算式選択部は、前記切片判定部で前記切片に該当すると判定されたか否かで、前記更新対象選択部で選択された要素の前記計算式を切り替える、請求項1に記載の情報処理装置。
【請求項4】
前記計算式選択部は、前記切片判定部で前記切片に該当すると判定された場合には、前記切片に対応する回帰係数パラメータを計算するための計算式を選択する、請求項3に記載の情報処理装置。
【請求項5】
前記計算式選択部は、前記切片判定部で前記切片に該当すると判定された場合には、前記切片を初期化するか否かにより、互いに異なる計算式を選択する、請求項4に記載の情報処理装置。
【請求項6】
説明変数及び前記回帰係数パラメータを前記目的関数に入力して演算される目的変数の確率分布の形態を判定する確率分布判定部と、
前記確率分布判定部で判定された確率分布の形態に基づいて、前記切片を初期化するか否かを判定する切片初期化判定部と、
前記切片を初期化すると判定されると、前記切片を初期化する切片初期化部と、を備え、
前記計算式選択部は、前記切片判定部で前記切片に該当すると判定された場合で、かつ前記切片初期化部で前記切片を初期化した場合には、前記目的変数の和を計算する前記計算式を選択する、請求項5に記載の情報処理装置。
【請求項7】
前記更新対象選択部は、前記確率分布判定部にてポアソン分布と判定された場合には、前記切片初期化部で前記切片を初期化した後に、前記回帰係数パラメータの更新対象である要素を選択する請求項6に記載の情報処理装置。
【請求項8】
前記更新対象選択部は、前記確率分布判定部にてガウス分布と判定された場合には、前記切片初期化部で前記切片を初期化することなく、前記回帰係数パラメータの更新対象である要素を選択する、請求項6に記載の情報処理装置。
【請求項9】
前記更新対象選択部は、前記複数の要素の並び順に要素を選択する、請求項1に記載の情報処理装置。
【請求項10】
前記更新対象選択部は、前記複数の要素のうち、回帰係数パラメータの絶対値が大きい順に要素を選択する、請求項1に記載の情報処理装置。
【請求項11】
前記更新対象選択部は、前記複数の要素のうち、回帰係数パラメータの更新前後の回帰係数パラメータの差分値の絶対値が大きい順に要素を選択する、請求項1に記載の情報処理装置。
【請求項12】
前記計算式選択部は、前記更新対象選択部で選択されなかったすべての要素の回帰係数パラメータがゼロか否かで、前記計算式を切り替える、請求項1に記載の情報処理装置。
【請求項13】
前記計算式選択部は、前記更新対象選択部で選択されなかったすべての要素の回帰係数パラメータの二乗和が所定の閾値以下か否かで、前記計算式を切り替える、請求項1に記載の情報処理装置。
【請求項14】
前記パラメータ更新部で更新された回帰係数パラメータが所定の収束条件を満たすか否かを判定する終了判定部を備え、
前記パラメータ更新部は、前記所定の収束条件を満たすまで、前記複数の要素の回帰係数パラメータの更新を繰り返し行う、請求項1に記載の情報処理装置。
【請求項15】
前記複数の要素は、それぞれ異なるタスクが割り当てられる第1方向と、それぞれ異なる特徴量が割り当てられる第2方向とに配置され、
前記更新対象選択部は、それぞれ異なるタスクとそれぞれ異なる特徴量とを有する2以上の要素を更新対象として同時に選択し、
前記パラメータ更新部は、前記更新対象選択部が選択した前記2以上の要素の回帰係数パラメータの更新を並行して行う、請求項1に記載の情報処理装置。
【請求項16】
前記計算式選択部は、前記複数の要素についてのn(nは2以上の整数)回目の前記複数の要素の回帰係数パラメータの更新の際に、前記n回目ですでに更新済みで前記更新対象選択部で選択されなかった要素の回帰係数パラメータに基づいて、前記更新対象選択部で選択された要素の回帰係数パラメータを更新するための計算式を選択する、請求項15に記載の情報処理装置。
【請求項17】
半導体基板の素子形成面が複数の領域に区分けされ、
前記複数の領域のそれぞれは、固有の前記タスク及び前記特徴量を有し、
前記半導体基板ごとに、前記タスクについての前記特徴量に基づいて、目的変数が設定される、請求項1に記載の情報処理装置。
【請求項18】
前記目的変数は、不良率を含む、請求項17に記載の情報処理装置。
【請求項19】
タスク及び特徴量で特徴づけられた複数の要素のそれぞれごとに、正則化項を含む所定の目的関数に基づいて回帰係数パラメータを更新する情報処理方法であって、
前記複数の要素から、前記回帰係数パラメータの更新対象である要素を選択し、
選択されなかった要素の前記正則化項の値を固定化し、
前記選択されなかった要素の回帰係数パラメータに基づいて、前記選択された要素の回帰係数パラメータを更新するための計算式を選択し、
前記選択された計算式に基づいて、前記選択された要素の回帰係数パラメータを更新する、情報処理方法。
【発明の詳細な説明】
【技術分野】
【0001】
本発明の一実施形態は、情報処理装置及び情報処理方法に関する。
【背景技術】
【0002】
膨大なデータの解析を手動で行うのは容易でないため、回帰モデルを利用して、コンピュータにてデータの解析を行う技術が提案されている。より具体的には、タスクごとに設定される特徴量について、全タスクをひとまとめにしたベクトル単位で回帰係数パラメータを更新する手法が提案されている。この手法では、回帰係数パラメータの更新を、収束条件を満たすまで繰り返し行う。
【0003】
回帰係数パラメータは、タスクごとに設けられるが、従来の手法では、n回目の回帰係数パラメータの更新は、(n-1)回目の回帰係数パラメータを用いて行われる。このため、各回のすべてのタスクの回帰係数パラメータが求まらない限り、次の回の回帰係数パラメータを求めることができず、タスクごとに設けられる回帰係数パラメータの更新に時間がかかるという問題がある。
【先行技術文献】
【特許文献】
【0004】
【特許文献1】米国特許公開公報2022/0076148
【特許文献2】特開2012-226511号公報
【特許文献3】米国特許公開公報2021/0174207
【発明の概要】
【発明が解決しようとする課題】
【0005】
そこで、本発明の一実施形態では、回帰係数パラメータを迅速に更新可能な情報処理装置及び情報処理方法を提供するものである。
【課題を解決するための手段】
【0006】
上記の課題を解決するために、本発明の一実施形態によれば、タスク及び特徴量で特徴づけられた複数の要素のそれぞれごとに、正則化項を含む所定の目的関数に基づいて回帰係数パラメータを更新する情報処理装置であって、
前記複数の要素から、前記回帰係数パラメータの更新対象である要素を選択する更新対象選択部と、
前記更新対象選択部で選択されなかった要素の前記正則化項の値を固定化する非更新対象固定部と、
前記更新対象選択部で選択されなかった要素の回帰係数パラメータに基づいて、前記更新対象選択部で選択された要素の回帰係数パラメータを更新するための計算式を選択する計算式選択部と、
前記計算式選択部で選択された計算式に基づいて、前記更新対象選択部で選択された要素の回帰係数パラメータを更新するパラメータ更新部と、を備える、情報処理装置が提供される。
【図面の簡単な説明】
【0007】
【
図1】第1の実施形態による情報処理装置の概略構成を示すブロック図。
【
図2】要素ごとの回帰係数パラメータの更新手順を模式的に示す図。
【
図3】一比較例による回帰係数パラメータの更新手順を示す図。
【
図4】一比較例による回帰係数パラメータの更新手順を示す図。
【
図6】式(15)で初期化した場合と、初期値をゼロとした場合の回帰係数パラメータの更新結果を示す図。
【
図7】第1の実施形態による情報処理装置の処理動作を示すフローチャート。
【
図8】
図7をより具体化した一例に係るフローチャート。
【
図9】半導体ウエハの不良解析を行う際のタスクと目的変数Yを説明する図。
【
図10A】要素の並び順に各要素を選択する方法を示す図。
【
図10B】、回帰係数パラメータの絶対値が大きい順に各要素を選択する方法を示す図。
【
図10C】回帰係数パラメータの更新前後の差分の絶対値が大きい順に各要素を選択する方法を示す図。
【
図11A】計算式選択部が行う第1選択方法を説明するフローチャート。
【
図11B】計算式選択部が行う第2選択方法を説明するフローチャート。
【
図12】更新対象選択部が選択する要素を説明する図。
【
図13】更新対象選択部が時刻ごとに選択する要素を予めスケジューリングする例を示す図。
【発明を実施するための形態】
【0008】
以下、図面を参照して、情報処理装置及び情報処理方法の実施形態について説明する。以下では、情報処理装置の主要な構成部分を中心に説明するが、情報処理装置には、図示又は説明されていない構成部分や機能が存在しうる。以下の説明は、図示又は説明されていない構成部分や機能を除外するものではない。
【0009】
(第1の実施形態)
図1は第1の実施形態による情報処理装置1の概略構成を示すブロック図である。
図1の情報処理装置1は、タスク及び特徴量で特徴づけられた複数の要素のそれぞれごとに、正則化項を含む所定の目的関数に基づいて回帰係数パラメータを更新するものである。回帰係数パラメータを繰り返し更新することにより、特徴量からなる説明変数と回帰係数パラメータを用いて目的変数を精度よく予測可能となる。
【0010】
図1の情報処理装置1は、入力部2と、分布判定部3と、切片初期化部4と、更新対象選択部5と、切片判定部6と、非更新対象固定部7と、計算式選択部8と、パラメータ更新部9と、終了判定部10と、出力部11とを備えている。
図1のうち、更新対象選択部5と、非更新対象固定部7と、計算式選択部8と、パラメータ更新部9は必須の構成部分であり、それ以外は任意の構成部分である。
【0011】
入力部2は、目的変数と説明変数を入力する。入力部2は、不図示のデータベース等から目的変数と説明変数を取得してもよい。目的変数は、例えば不良率である。説明変数は、不良率に影響を与える種々な要素であり、例えば、製造工程、製造装置、製造日付などである。また、入力部2は、回帰係数パラメータの初期値を入力する。
【0012】
分布判定部3は、説明変数及び回帰係数パラメータを回帰式に入力して演算される目的変数の確率分布の形態を判定する。確率分布の形態には、例えばガウス分布及びポアソン分布が含まれている。本明細書では、主にポアソン分布についての回帰係数パラメータの更新手順を説明する。
【0013】
切片初期化部4は、目的変数が特定の確率分布のときに、回帰係数パラメータの切片を初期化する。回帰係数パラメータの切片とは、回帰係数パラメータのオフセット値と呼ばれることもある。切片(オフセット値)を初期化するとは、切片を表す後述の式(10)の一部の項(右辺第2項以降をゼロにすることを指す。
【0014】
更新対象選択部5は、複数の要素から、回帰係数パラメータの更新対象である要素を選択する。第1の実施形態では、タスクごとに回帰係数パラメータの更新を行うため、更新対象選択部5は、原則として、一つの要素を選択する。ただし、後述するように、複数のタスクの回帰係数パラメータの更新処理を並行して行う場合には、更新対象選択部5は、複数の要素を選択する。
【0015】
切片判定部6は、更新対象選択部5で選択された要素の回帰係数パラメータが回帰係数パラメータの切片に該当するか否かを判定する。
【0016】
非更新対象固定部7は、更新対象選択部5で選択されなかった要素(非更新対象の要素)の正則化項の値を固定化する。(非更新対象の要素の正則化項の値を固定化することで、回帰係数パラメータの更新処理を簡略化することができる。
【0017】
計算式選択部8は、更新対象選択部5で選択されなかった要素(非更新対象の要素)の回帰係数パラメータに基づいて、更新対象選択部5で選択された要素(更新対象の要素)の回帰係数パラメータを更新するための計算式を選択する。計算式選択部8は、切片判定部6で切片に該当すると判定されたか否かで、更新対象選択部5で選択された要素の計算式を切り替える。より詳細には、計算式選択部8は、切片判定部6で切片に該当すると判定された場合には、切片に対応する回帰係数パラメータを計算するための計算式を選択する。計算式選択部8は、切片判定部6で切片に該当すると判定された場合には、切片を初期化するか否かにより、互いに異なる計算式を選択することもありえる。
【0018】
パラメータ更新部9は、計算式選択部8で選択された計算式に基づいて、更新対象選択部5で選択された要素の回帰係数パラメータを更新する。
【0019】
終了判定部10は、回帰係数パラメータの更新を複数回繰り返した結果、回帰係数パラメータが収束条件を満たしたか否かを判定する。収束条件を満たしていなければ、再度、回帰係数パラメータの更新を行い、収束条件を満たしていれば、最後に更新された回帰係数パラメータが出力部11に送られる。出力部11は、最後に更新された回帰係数パラメータを出力する。
【0020】
図2は要素20ごとの回帰係数パラメータの更新手順を模式的に示す図である。
図2の例では、第1方向X及び第2方向Yに沿って複数の要素20が配置されている。第1方向Xには複数のタスクが設けられ、第2方向Yには複数の特徴量が設けられている。各要素20は、タスクと特徴量によって特徴づけられている。
【0021】
図2には、第1方向Xに並んだ3つの要素20が示されており、一番右の要素20が更新対象の要素20aであり、その左側2つの要素20はすでに回帰係数パラメータの更新を行った非更新対象の要素20bである。
図2の例では、更新対象の要素20aの回帰係数パラメータを更新する際に、同一特徴量の近接する他の要素20bの回帰係数パラメータを利用する。よって、
図2の更新対象の要素20aの回帰係数パラメータは、その左側2つの非更新対象の要素20bの更新済みの回帰係数パラメータを用いて更新される。
【0022】
このように、第1の実施形態では、更新対象の要素20aの回帰係数パラメータを更新する際に、更新済みの回帰係数パラメータを即座に利用する点に特徴がある。これにより、新たに更新される回帰係数パラメータに、直前に更新された回帰係数パラメータを反映させることができ、回帰係数パラメータの精度を向上できる。
【0023】
図3及び
図4は一比較例による回帰係数パラメータの更新手順を示す図である。一比較例では、一点鎖線20Gに示すように、特徴量ごとに、全タスクをひとまとめにして、複数の要素20に対応する複数の回帰係数パラメータを更新する。この場合、
図4に示すように、k+1回目の回帰係数パラメータの更新を行うには、k回目の全タスクの回帰係数パラメータが求まっていることが前提となり、各回の回帰係数パラメータを更新するのに時間がかかってしまう。
【0024】
第1の実施形態による情報処理装置1では、正則化対数尤度関数を用いて回帰係数パラメータの更新を行う。具体的には、ポアソン分布における正則化対数尤度関数を目的関数として用いて回帰係数パラメータの更新を行うことができる。ポアソン分布における正則化対数尤度関数は、式(1)で表される。
【数1】
【0025】
式(1)において、nはデータ数、mはタスク数、pは特徴量数である。jはタスクの識別番号、kは特徴量の識別番号である。βkjは回帰係数パラメータ、λは正則化パラメータである。xは説明変数、yは目的変数である。Bはmaxに続く項を指し、maxは項Bを最大化する最大化問題であることを意味する。
【0026】
式(1)をそのまま解くのは困難であるため、テイラー展開を用いて回帰係数パラメータβの二次関数に近似すると、以下の式(2)が得られる。Bはminに続く項を指し、minは項Bを最小化する最小化問題であることを意味する。
【数2】
【0027】
式(2)のwijは式(3)で、zijは式(4)で表される。
【数3】
【0028】
本明細書では、数式中の記号βの上に~(チルダ)が付記された記号を「βチルダ」と表記する。βチルダは、更新途中の回帰係数パラメータの値を表す。
【0029】
式(2)を用いて、例えば半導体ウエハの不良解析を行う場合、nは半導体ウエハの枚数、mは半導体ウエハ上の領域分割数、pは半導体製造装置及び半導体製造工程等の不良要因数である。
【0030】
式(2)から、更新対象のパラメータが含まれる項βk'j'を抽出し、かつ正則化項を更新対象と非更新対象の回帰係数パラメータに分けて、非更新対象の回帰係数パラメータを更新途中の値で固定化すると、以下の式(5)が得られる。なお、以下の数式では、更新対象のパラメータの添え字にはシングルクォーテーションを付記しており、非更新対象のパラメータの添え字にはシングルクォーテーションを付記していない。更新対象の要素20aは、例えば
図5に示す位置に設けられる。
【数4】
【0031】
更新途中の値が全て0(βチルダk'j(j≠j')であれば、以下の式(6)に示すように、既存のLassoの目的関数と一致する。
【数5】
【0032】
式(5)の第2項は正則化項である。この正則化項に含まれる第1項β
2
k'j'は、更新対象選択部5で選択された更新対象の回帰係数パラメータの二乗である。正則化項に含まれる第2項は、更新対象選択部5で選択されなかったすべての要素の回帰係数パラメータの二乗和である。非更新対象固定部7により正則化項の第2項をゼロにすると、式(6)が得られる。この式(6)の第2項は正則化項であり、この正則化項は、更新対象選択部5で選択された更新対象の回帰係数パラメータβ
k'j'の絶対値に正則化パラメータλを乗じた値である。式(6)に既存の更新則を適用すると、βk'j'は以下の式(7)で表される。
【数6】
【0033】
式(7)では、更新後のパラメータであることを示すために、βk'j'の上に「^」(ハット)を付している。式(7)の右辺分子のS(x,λ)は、以下の式(8)で表される。式(8)のsign(x)は符号関数であり、例えばsign(x)は、x>0のときに1、x=0のときに0、x<0のときに-1である。
S(x,λ)=sign(x)max{|x|-λ,0} …(8)
【0034】
βチルダk'jがゼロでないタスクjが存在するとき、βk'j'で微分した値をゼロとおくと、以下の式(8)が得られる。
【数7】
【0035】
式(8)の左辺第二項の分母にβ
2
k'j'が含まれるため、このままではβk'j'について解くことができない。分母のβk'j'をβチルダk'j'に固定化することで、以下の式(9)に示すβk'j'の更新式が得られる。
【数8】
【0036】
式(1)の第1項をβ0j'で偏微分した値をゼロとし、その式をβ0j'について解くと、以下の式(10)が得られる。
【数9】
【0037】
式(10)のwijは、上述した式(3)と同様に、以下の式(11)で表される。
【数10】
【0038】
式(10)において、回帰係数パラメータをすべてゼロで初期化すると、式(10)の右辺第2項が大きな値となってしまい、wijを計算する際にコンピュータによる計算がオーバーフローするおそれがある。通常のコンピュータでは、64ビットの浮動小数点の計算において、exp(710)以上でオーバーフローする。
【0039】
そこで、第1の実施形態では、以下の式(12)に示すように、式(10)の右辺第2項と第3項の計算結果をゼロにするように、β0j'の値を定める。
【数11】
【0040】
正則化パラメータλが十分に大きいとき、βチルダkjはゼロとみなせるので、式(11)は式(13)のように変形される。
wij'=exp(βoj') …(13)
【0041】
式(13)を式(12)に代入すると、以下の式(14)が得られる。
【数12】
【0042】
式(14)をβ0j'について解くと、以下の式(15)が得られる。
【数13】
【0043】
式(15)で得られる回帰係数パラメータは、式(15)の右辺からわかるように、目的変数の和の計算結果に応じた値になる。
図6は式(15)で初期化した場合と、初期値をゼロとした場合の回帰係数パラメータの更新結果を示す図である。
図6では、式(15)で初期化した場合の回帰係数パラメータを黒丸、初期値=ゼロから更新した回帰係数パラメータを×にしている。
図6からわかるように、どちらの場合も回帰係数パラメータは一致しており、式(15)で切片を初期化することが妥当であることがわかる。
【0044】
図7は第1の実施形態による情報処理装置1の処理動作を示すフローチャートである。まず、入力部2から説明変数Xと目的変数Yを入力する(ステップS1)。次に、分布判定部3は、目的変数が従う確率分布の形態を判定する(ステップS2)。確率分布の形態として、例えば、ガウス分布、及びポアソン分布などがある。
【0045】
次に、切片初期化部4は、確率分布の形態に応じて、回帰係数パラメータの切片を初期化する(ステップS3)。確率分布の形態により、切片を初期化する手順が異なるため、ステップS3の処理手順は、ステップS2の判定結果により変わる。また、確率分布の形態によっては、ステップS3の初期化処理を省略する場合もありうる。確率分布がポアソン分布の場合には、上述した式(10)~式(15)の処理手順で回帰係数パラメータの切片を初期化する。
【0046】
次に、更新対象選択部5は、更新対象の要素20を選択する(ステップS4)。
図2で説明したように、第1の実施形態では、タスクと特徴量で特徴づけられる要素20ごとに回帰係数パラメータの更新を行うため、ステップS4では、原則として一つの要素20が選択される。なお、後述するように、複数の要素20の更新処理を並列して行う場合は、複数の要素20が同時に選択される場合もある。
【0047】
次に、切片判定部6は、ステップS4で選択された要素20の回帰係数パラメータが切片か否かを判定する(ステップS5)。ステップS5の判定処理は、例えば要素20の特徴量k=0であれば、切片であると判定する。すなわち、要素20の回路係数パラメータがβ0jのときに切片であると判定する。
【0048】
ステップS5で更新対象の要素20が切片と判定された場合、計算式選択部8は式(11)の計算式を選択し、この計算式に基づいてパラメータ更新部9は回帰係数パラメータを更新する(ステップS6)。
【0049】
ステップS5で更新対象の要素20が切片でないと判定された場合、非更新対象固定部7は、正則化項内の非更新対象の回帰係数パラメータを更新途中の値で固定する(ステップS7)。このステップS7では、例えば式(5)の計算を行う。
【0050】
次に、更新対象の要素20以外の要素20の回帰係数パラメータがすべてゼロか否かを判定する(ステップS8)。
【0051】
ステップS8がYESの場合、計算式選択部8は、式(7)の計算式を選択し、この計算式に基づいて、パラメータ更新部9は回帰係数パラメータを更新する(ステップS9)。ステップS8がNOの場合、計算式選択部8は、式(9)の計算式を選択し、この計算式に基づいて、パラメータ更新部9は回帰係数パラメータを更新する(ステップS10)。
【0052】
ステップS6、S9、又はS10の処理が終了すると、終了判定部10は、回帰係数パラメータが所定の収束条件を満たすか否かを判定する(ステップS11)。収束条件を満たさない場合、ステップS4以降の処理を繰り返す。収束条件を満たす場合、最後に更新した回帰係数パラメータを出力部11から出力する(ステップS12)。
【0053】
図8は
図7をより具体化した一例に係るフローチャートである。
図8では、
図7と共通する処理には同じステップ番号を付しており、以下では相違点を中心に説明する。
図8のフローチャートは、分布判定部3で判定される確率分布の形態がガウス分布又はポアソン分布である例を示している。よって、ステップS2の後に、ガウス分布か、又はポアソン分布かの判定処理が設けられる(ステップS20)。ステップS20がYESでポアソン分布であると判定されると、ステップS3~S12の処理が行われる。一方、ステップS20がNOでガウス分布であると判定されると、ステップS3の処理は省略して、ステップS4~S12の処理が行われる。このように、
図8のステップS20でポアソン分布であると判定された場合は、式(15)で回帰係数パラメータの切片を初期化する。一方、ポアソン分布でないと判定された場合は、必ずしも切片を初期化する必要はないため、回帰係数パラメータの切片を初期化せずにステップS4以降の処理を行う。よって、ステップS20の判定処理は、切片初期化判定部の判定処理に該当する。計算式選択部8は、ポアソン分布か否かで、異なる計算式を選択して回帰係数パラメータを更新することになる。
【0054】
図7及び
図8に示したフローチャートは、例えば半導体ウエハの不良解析に用いることができる。
図9は半導体ウエハの不良解析を行う際のタスクと目的変数Yを説明する図である。半導体ウエハの不良解析では、例えば半導体ウエハの面内不良率を目的変数Yとする。半導体ウエハの素子形成面が複数の領域に区分けされ、各領域をタスクとする。各領域の何らかの特徴量を説明変数Xとする。特徴量は、例えば、半導体ウエハの製造工程、半導体製造装置の種類、半導体ウエハの製造日付、半導体ウエハの製造に用いるチャンバの種類などである。
図9では、半導体ウエハの素子形成面を4つの領域r1~r4に区分けした例を示している。
【0055】
次に、
図7及び
図8のステップS4の更新対象選択部5の処理手順について詳細に説明する。
図10A、
図10B、及び
図10Cは更新対象選択部5の処理手順を説明する図である。
図10Aは、要素20の並び順に各要素20を選択する方法(以下、第1選択方法)を採用する。
図10Bは、回帰係数パラメータの絶対値が大きい順に各要素20を選択する方法(以下、第2選択方法)を採用する。
図10Cは、回帰係数パラメータの更新前後の差分の絶対値が大きい順に各要素20を選択する方法(以下、第3選択方法)を採用する。更新対象選択部5は、例えば第1~第3選択方法のいずれか一つを選択することができる。
【0056】
図10Aに示す第1選択方法では、更新対象選択部5は、第1方向Xに並ぶ複数のタスクのうち、左端のタスクを選択した状態で、説明変数である特徴量が並ぶ第2方向Yに沿って一つずつ要素20を選択して回帰係数パラメータの更新を行う。最後の特徴量に対応する要素20の更新が終わると、タスクを一つ右にずらして、同様の選択動作を繰り返す。このように、
図10Aに示す第1選択方法では、タスク及び特徴量の並び順に一つずつ要素20を選択して回帰係数パラメータを更新する。
【0057】
図10Bに示す第2選択方法では、更新対象選択部5は、複数の要素20を、回帰係数パラメータの絶対値が大きい順に選択する。
図10Bの例では、回帰係数パラメータが2.1の要素20、1.8の要素20、1.4の要素20、1.2の要素20、-1.1の要素20の順に選択される。回帰係数パラメータの絶対値が大きい順に選択する理由は、回帰係数パラメータが大きい説明変数ほど、目的変数に与える影響が大きいと考えられるためである。
【0058】
図10Cに示す第3選択方法では、更新対象選択部5は、複数の要素20を回帰係数パラメータの更新前後の差分の絶対値が大きい順に選択する。
図10Cの例では、左上端の要素20が最初に選択され、次は左上端の要素20の回帰係数パラメータ0.8との差分が最大である回帰係数パラメータ-0.1の要素20が選択される。次に、この要素20の回帰係数パラメータ-0.1との差分が最大である回帰係数パラメータ0.5の要素20が選択される。回帰係数パラメータの更新前後の差分の絶対値が大きい順に選択する理由は、差分の絶対値が大きい説明変数ほど、目的変数に与える影響が大きいと考えられるためである。
【0059】
なお、更新対象選択部5が要素20を選択する方法は任意であり、
図10A~
図10Cに示した方法に限定されない。
【0060】
図11A及び
図11Bは、
図7及び
図8のステップS8~S10の計算式選択部8の処理手順を説明する図である。
図11Aは計算式選択部8が行う第1選択方法を説明するフローチャート、
図11Bは計算式選択部8が行う第2選択方法を説明するフローチャートである。
【0061】
図11Aの第1選択方法では、
図7及び
図8のステップS8に示したように、更新対象の回帰係数パラメータ以外のすべての回帰係数パラメータがゼロか否かを判定する(ステップS8)。ステップS8でYES(ゼロ)と判定されると、ステップS9の処理を行い、NO(ゼロでないものがある)と判定されると、ステップS10の処理を行う。
【0062】
図11Bの第2選択方法では、更新対象の回帰係数パラメータ以外のすべての回帰係数パラメータの二乗和が所定の閾値以下か否かを判定する(ステップS8a)。ステップS8aがYES(閾値以下)の場合、ステップS9の処理を行う。ステップS8aがNO(閾値より大きい)場合、ステップS10の処理を行う。
図11Bの場合、閾値がゼロのときは、
図11Aの処理と同一になる。
【0063】
このように、第1の実施形態では、同一の特徴量(説明変数)を持つ複数の要素20をひとまとめにして回帰係数パラメータを更新する代わりに、直前に更新した他の要素20の回帰係数パラメータを用いて要素20ごとに回帰係数パラメータを更新する。これにより、ある要素20の更新した回帰係数パラメータを、次の要素20の回帰係数パラメータの更新にすぐに利用することができ、回帰係数パラメータの精度を向上できる。また、目的変数の確率分布の形態を判定し、目的変数の確率分布に応じて回帰係数パラメータの切片を初期化する。これにより、切片を固定化して回帰係数パラメータを更新でき、回帰係数パラメータの計算が実行不能になるおそれがなくなり、迅速かつ精度よく回帰係数パラメータを更新できる。
【0064】
また、回帰係数パラメータが切片でない場合、正則化項内の非更新対象の回帰係数パラメータを更新途中の値で固定化し、非更新対象のすべての回帰係数パラメータがゼロか否かで、回帰係数パラメータを更新するための計算式を切り替える。これにより、回帰係数パラメータを迅速かつ精度よく計算できる。
【0065】
(第2の実施形態)
第2の実施形態による情報処理装置1は、
図1と同様のブロック構成を備えている。第2の実施形態による情報処理装置1は、
図7又は
図8と同様のフローチャートに基づいて処理を行うが、
図7及び
図8のステップS4の更新対象選択部5が行う処理動作が第1の実施形態とは異なる。第2の実施形態による更新対象選択部5は、複数の要素20を同時に選択することができる。
【0066】
図12は更新対象選択部5が選択する要素20を説明する図である。
図12では、要素20を要素E1~E10と表記している。時刻t1では、要素E1のみを選択する。この場合、第2の実施形態による情報処理装置1は、直前の回(ステップ)で更新した他の要素20の回帰係数パラメータ、又は予め用意した回帰係数パラメータの初期値を用いて、要素E1の回帰係数パラメータを更新する。
【0067】
時刻t2では、更新対象選択部5は、要素E2とE3を選択する。要素E2は、要素E1の右隣に配置されている。よって、要素E2については、要素E1の更新済みの回帰係数パラメータを用いて回帰係数パラメータが更新される。一方、要素E3については、直前の回(ステップ)で更新した他の要素20の回帰係数パラメータ、又は予め用意した回帰係数パラメータの初期値を用いて、要素E3の回帰係数パラメータが更新される。要素E2とE3の回帰係数パラメータの更新処理は並行して行われる。
【0068】
時刻t3では、更新対象選択部5は、要素E3、E5、及びE6を選択する。要素E3については、要素E1とE2の更新済みの回帰係数パラメータを用いて、回帰係数パラメータが更新される。また、要素E5については、直前の回で更新した要素E4の回帰係数パラメータを用いて、回帰係数パラメータが更新される。また、要素E6については、直前の回(ステップ)で更新した他の要素20の回帰係数パラメータ、又は予め用意した回帰係数パラメータの初期値を用いて、要素E6の回帰係数パラメータが更新される。要素E3、E5、及びE6の回帰係数パラメータの更新処理は並行して行われる。
【0069】
時刻t4では、更新対象選択部5は、要素E4、E7、E9、E10を選択する。要素E4については、要素E1~E3の更新済みの回帰係数パラメータを用いて、回帰係数パラメータが更新される。また、要素E7については、要素E5とE6の更新済みの回帰係数パラメータを用いて、回帰係数パラメータが更新される。また、E9については、要素E8の更新済みの回帰係数パラメータを用いて、回帰係数パラメータが更新される。要素E10については、直前の回(ステップ)で更新した他の要素20の回帰係数パラメータ、又は予め用意した回帰係数パラメータの初期値を用いて、回帰係数パラメータが更新される。要素E4、E7、E9、及びE10の回帰係数パラメータの更新処理は並行して行われる。
【0070】
図12は、複数の要素20の並び順に、時刻によっては複数の要素20を同時に選択して、各要素20の回帰係数パラメータの更新処理を並行して行う例を示したが、更新対象選択部5は、必ずしも複数の要素20を並び順に選択する必要はない。
【0071】
図13は更新対象選択部5が時刻ごとに選択する要素20を予めスケジューリングする例を示す図である。
図13では、要素20を要素E1~E20と表記している。
図13の例では、更新対象選択部5は、kステップの時刻t1には要素E1、E7、E10、E20を選択し、時刻t2には要素E2、E12、E13、E19を選択し、時刻t3には要素E4、E5、E11、E14を選択する。また、更新対象選択部5は、k+1ステップの時刻t1には要素E3、E6、E9、E20を選択し、時刻t2には要素E1、E12、E15、E18を選択し、時刻t3には要素E2、E11、E16、E17を選択する。
【0072】
図12及び
図13は、更新対象選択部5が選択する要素20の一具体例であり、同時に選択する2以上の要素20は適宜変更可能である。
【0073】
このように、第2の実施形態による情報処理装置1では、更新対象選択部5が複数の要素20を同時に選択できるため、複数の要素20の回帰係数パラメータの更新処理を並行して行うことができ、より迅速に更新処理を行うことができる。
【0074】
上述した実施形態で説明した情報処理装置1の少なくとも一部は、ハードウェアで構成してもよいし、ソフトウェアで構成してもよい。ソフトウェアで構成する場合には、情報処理装置1の少なくとも一部の機能を実現するプログラムをフレキシブルディスクやCD-ROM等の記録媒体に収納し、コンピュータに読み込ませて実行させてもよい。記録媒体は、磁気ディスクや光ディスク等の着脱可能なものに限定されず、ハードディスク装置やメモリなどの固定型の記録媒体でもよい。
【0075】
また、情報処理装置1の少なくとも一部の機能を実現するプログラムを、インターネット等の通信回線(無線通信も含む)を介して頒布してもよい。さらに、同プログラムを暗号化したり、変調をかけたり、圧縮した状態で、インターネット等の有線回線や無線回線を介して、あるいは記録媒体に収納して頒布してもよい。
【0076】
[付記]
[項目1]
タスク及び特徴量で特徴づけられた複数の要素のそれぞれごとに、正則化項を含む所定の目的関数に基づいて回帰係数パラメータを更新する情報処理装置であって、
前記複数の要素から、前記回帰係数パラメータの更新対象である要素を選択する更新対象選択部と、
前記更新対象選択部で選択されなかった要素の前記正則化項の値を固定化する非更新対象固定部と、
前記更新対象選択部で選択されなかった要素の回帰係数パラメータに基づいて、前記更新対象選択部で選択された要素の回帰係数パラメータを更新するための計算式を選択する計算式選択部と、
前記計算式選択部で選択された計算式に基づいて、前記更新対象選択部で選択された要素の回帰係数パラメータを更新するパラメータ更新部と、を備える、情報処理装置。
[項目2]
前記正則化項は、前記更新対象選択部で選択された要素についての第1項と、前記更新対象選択部で選択されなかったすべての要素についての第2項とを含み、
前記非更新対象固定部は、前記第2項をゼロとするとともに、前記更新対象選択部で選択された要素の回帰係数パラメータの絶対値に正則化パラメータを乗じた値を前記正則化項とする、項目1に記載の情報処理装置。
[項目3]
前記更新対象選択部で選択された要素の回帰係数パラメータが、前記回帰係数パラメータの切片に該当するか否かを判定する切片判定部を備え、
前記計算式選択部は、前記切片判定部で前記切片に該当すると判定されたか否かで、前記更新対象選択部で選択された要素の前記計算式を切り替える、項目1又は2に記載の情報処理装置。
[項目4]
前記計算式選択部は、前記切片判定部で前記切片に該当すると判定された場合には、前記切片に対応する回帰係数パラメータを計算するための計算式を選択する、項目3に記載の情報処理装置。
[項目5]
前記計算式選択部は、前記切片判定部で前記切片に該当すると判定された場合には、前記切片を初期化するか否かにより、互いに異なる計算式を選択する、項目4に記載の情報処理装置。
[項目6]
説明変数及び前記回帰係数パラメータを前記目的関数に入力して演算される目的変数の確率分布の形態を判定する確率分布判定部と、
前記確率分布判定部で判定された確率分布の形態に基づいて、前記切片を初期化するか否かを判定する切片初期化判定部と、
前記切片を初期化すると判定されると、前記切片を初期化する切片初期化部と、を備え、
前記計算式選択部は、前記切片判定部で前記切片に該当すると判定された場合で、かつ前記切片初期化部で前記切片を初期化した場合には、前記目的変数の和を計算する前記計算式を選択する、項目5に記載の情報処理装置。
[項目7]
前記更新対象選択部は、前記確率分布判定部にてポアソン分布と判定された場合には、前記切片初期化部で前記切片を初期化した後に、前記回帰係数パラメータの更新対象である要素を選択する項目6に記載の情報処理装置。
[項目8]
前記更新対象選択部は、前記確率分布判定部にてガウス分布と判定された場合には、前記切片初期化部で前記切片を初期化することなく、前記回帰係数パラメータの更新対象である要素を選択する、項目6に記載の情報処理装置。
[項目9]
前記更新対象選択部は、前記複数の要素の並び順に要素を選択する、項目1乃至8のいずれか一項に記載の情報処理装置。
[項目10]
前記更新対象選択部は、前記複数の要素のうち、回帰係数パラメータの絶対値が大きい順に要素を選択する、項目1乃至8のいずれか一項に記載の情報処理装置。
[項目11]
前記更新対象選択部は、前記複数の要素のうち、回帰係数パラメータの更新前後の回帰係数パラメータの差分値の絶対値が大きい順に要素を選択する、項目1乃至8のいずれか一項に記載の情報処理装置。
[項目12]
前記計算式選択部は、前記更新対象選択部で選択されなかったすべての要素の回帰係数パラメータがゼロか否かで、前記計算式を切り替える、項目1乃至11のいずれか一項に記載の情報処理装置。
[項目13]
前記計算式選択部は、前記更新対象選択部で選択されなかったすべての要素の回帰係数パラメータの二乗和が所定の閾値以下か否かで、前記計算式を切り替える、項目1乃至11のいずれか一項に記載の情報処理装置。
[項目14]
前記パラメータ更新部で更新された回帰係数パラメータが所定の収束条件を満たすか否かを判定する終了判定部を備え、
前記パラメータ更新部は、前記所定の収束条件を満たすまで、前記複数の要素の回帰係数パラメータの更新を繰り返し行う、項目1乃至13のいずれか一項に記載の情報処理装置。
[項目15]
前記複数の要素は、それぞれ異なるタスクが割り当てられる第1方向と、それぞれ異なる特徴量が割り当てられる第2方向とに配置され、
前記更新対象選択部は、それぞれ異なるタスクとそれぞれ異なる特徴量とを有する2以上の要素を更新対象として同時に選択し、
前記パラメータ更新部は、前記更新対象選択部が選択した前記2以上の要素の回帰係数パラメータの更新を並行して行う、項目1乃至14のいずれか一項に記載の情報処理装置。
[項目16]
前記計算式選択部は、前記複数の要素についてのn(nは2以上の整数)回目の前記複数の要素の回帰係数パラメータの更新の際に、前記n回目ですでに更新済みで前記更新対象選択部で選択されなかった要素の回帰係数パラメータに基づいて、前記更新対象選択部で選択された要素の回帰係数パラメータを更新するための計算式を選択する、項目15に記載の情報処理装置。
[項目17]
半導体基板の素子形成面が複数の領域に区分けされ、
前記複数の領域のそれぞれは、固有の前記タスク及び前記特徴量を有し、
前記半導体基板ごとに、前記タスクについての前記特徴量に基づいて、目的変数が設定される、項目1乃至16のいずれか一項に記載の情報処理装置。
[項目18]
前記目的変数は、不良率を含む、項目17に記載の情報処理装置。
[項目19]
タスク及び特徴量で特徴づけられた複数の要素のそれぞれごとに、正則化項を含む所定の目的関数に基づいて回帰係数パラメータを更新する情報処理方法であって、
前記複数の要素から、前記回帰係数パラメータの更新対象である要素を選択し、
選択されなかった要素の前記正則化項の値を固定化し、
前記選択されなかった要素の回帰係数パラメータに基づいて、前記選択された要素の回帰係数パラメータを更新するための計算式を選択し、
前記選択された計算式に基づいて、前記選択された要素の回帰係数パラメータを更新する、情報処理方法。
【0077】
本開示の態様は、上述した個々の実施形態に限定されるものではなく、当業者が想到しうる種々の変形も含むものであり、本開示の効果も上述した内容に限定されない。すなわち、特許請求の範囲に規定された内容およびその均等物から導き出される本開示の概念的な思想と趣旨を逸脱しない範囲で種々の追加、変更および部分的削除が可能である。
【符号の説明】
【0078】
1 情報処理装置、2 入力部、3 分布判定部、4 切片初期化部、5 更新対象選択部、6 切片判定部、7 非更新対象固定部、8 計算式選択部、9 パラメータ更新部、10 終了判定部、11 出力部、20、20a、20b 要素