(19)【発行国】日本国特許庁(JP)
(12)【公報種別】特許公報(B2)
(11)【特許番号】
(24)【登録日】2024-06-07
(45)【発行日】2024-06-17
(54)【発明の名称】情報処理装置、情報処理方法およびプログラム
(51)【国際特許分類】
G06Q 50/04 20120101AFI20240610BHJP
G05B 19/418 20060101ALI20240610BHJP
G05B 23/02 20060101ALI20240610BHJP
G06Q 10/04 20230101ALI20240610BHJP
【FI】
G06Q50/04
G05B19/418 Z
G05B23/02 G
G06Q10/04
(21)【出願番号】P 2021091198
(22)【出願日】2021-05-31
【審査請求日】2023-03-13
(73)【特許権者】
【識別番号】000003078
【氏名又は名称】株式会社東芝
(74)【代理人】
【識別番号】110002147
【氏名又は名称】弁理士法人酒井国際特許事務所
(72)【発明者】
【氏名】高田 正彬
(72)【発明者】
【氏名】李 根
【審査官】貝塚 涼
(56)【参考文献】
【文献】特開2020-194377(JP,A)
【文献】特開2008-008772(JP,A)
【文献】特開2019-079120(JP,A)
【文献】岩田具治,外3名,分布が変化するデータにおけるモデル学習法,電子情報通信学会論文誌,一般社団法人電子情報通信学会,2009年03月01日,第J92-D巻,第3号,第361-370頁,ISSN 1880-4535
(58)【調査した分野】(Int.Cl.,DB名)
G06Q 10/00 - 99/00
G05B 19/418
G05B 23/02
(57)【特許請求の範囲】
【請求項1】
K個(Kは2以上の整数)の期間に得られる複数の入力データ
であって、時間に応じて傾向が変化する、製造に関する1つ以上の説明変数および1つ以上の目的変数を含む複数の前記入力データの入力を受け付ける受付部と、
K個の前記期間ごとに、前記期間に得られる複数の前記入力データを
用いた機械学習により、前記説明変数を入力して前記目的変数を出力する第1モデル
のパラメータを推定する第1モデル推定部と、
推定されたK個の前記第1モデルのパラメータを用いた機械学習により、前記第1モデルのパラメータごとに、前記期間の時間に関する第1時間パラメータ
を入力して前記期間に対応する第1モデルのパラメータを出力する第2モデルを推定し、推定した前記第2モデルに基づいて、指定された第2時間パラメータに対応する第1モデル
のパラメータを推定する
第2モデル推定部と、
を備える情報処理装置。
【請求項2】
前記第1時間パラメータは、期間の長さ、期間の開始時刻、および、期間の終了時刻のいずれかである、
請求項1に記載の情報処理装置。
【請求項3】
前記第2時間パラメータは、K個の前記期間の終了時刻以降の時刻を示す、
請求項2に記載の情報処理装置。
【請求項4】
前記第1モデル推定部は、前記第1モデルのパラメータがスパース性を有するように前記第1モデルを推定する、
請求項1~3のいずれか1項に記載の情報処理装置。
【請求項5】
前記第1モデル推定部は、第1期間に対して推定された第1モデルを初期値として第2期間に対する第1モデルを推定する転移学習を行う、
請求項1~4のいずれか1項に記載の情報処理装置。
【請求項6】
K個の前記期間の長さは、前記第1モデルの精度に基づいて決定される、
請求項1~5のいずれか1項に記載の情報処理装置。
【請求項7】
複数の前記入力データは、電子機器の状態に応じて変化するデータであり、
K個の前記期間の長さは、前記電子機器のメンテナンスの間隔に基づいて決定される、
請求項1~5のいずれか1項に記載の情報処理装置。
【請求項8】
前記第1モデルは、線形回帰モデル、多項式回帰モデル、ロジスティック回帰モデル、ポアソン回帰モデル、一般化線形モデル、一般化加法モデル、および、ニューラルネットワークモデルのいずれかである、
請求項1~7のいずれか1項に記載の情報処理装置。
【請求項9】
前記第1モデル推定部により推定された第1モデルと、前記
第2モデル推定部により推定された第1モデルと、を表示装置に表示する出力制御部をさらに備える、
請求項1~8のいずれか1項に記載の情報処理装置。
【請求項10】
前記第2モデルは、前記第1時間パラメータと、K個の第1モデルのパラメータとの関係を示す回帰モデルであり、
前記出力制御部は、さらに、前記回帰モデルを示す情報を前記表示装置に表示する、
請求項9に記載の情報処理装置。
【請求項11】
K個の前記期間は、前記第1時間パラメータが相互に異なる、
請求項1~10のいずれか1項に記載の情報処理装置。
【請求項12】
前記説明変数は、センサ値、加工条件を含む設定値、および、制御値のうち少なくとも一部を含み、
前記目的変数は、品質特性、不良率、並びに、良品および不良品のいずれかを示す情報のいずれかである、
請求項1~11のいずれか1項に記載の情報処理装置。
【請求項13】
情報処理装置が実行する情報処理方法であって、
K個(Kは2以上の整数)の期間に得られる複数の入力データ
であって、時間に応じて傾向が変化する、製造に関する1つ以上の説明変数および1つ以上の目的変数を含む複数の前記入力データの入力を受け付ける受付ステップと、
K個の前記期間ごとに、前記期間に得られる複数の前記入力データを
用いた機械学習により、前記説明変数を入力して前記目的変数を出力する第1モデル
のパラメータを推定する第1モデル推定ステップと、
推定されたK個の前記第1モデルのパラメータを用いた機械学習により、前記第1モデルのパラメータごとに、前記期間の時間に関する第1時間パラメータ
を入力して前記期間に対応する第1モデルのパラメータを出力する第2モデルを推定し、推定した前記第2モデルに基づいて、指定された第2時間パラメータに対応する第1モデル
のパラメータを推定する
第2モデル推定ステップと、
を含む情報処理方法。
【請求項14】
コンピュータに、
K個(Kは2以上の整数)の期間に得られる複数の入力データ
であって、時間に応じて傾向が変化する、製造に関する1つ以上の説明変数および1つ以上の目的変数を含む複数の前記入力データの入力を受け付ける受付ステップと、
K個の前記期間ごとに、前記期間に得られる複数の前記入力データを
用いた機械学習により、前記説明変数を入力して前記目的変数を出力する第1モデル
のパラメータを推定する第1モデル推定ステップと、
推定されたK個の前記第1モデルのパラメータを用いた機械学習により、前記第1モデルのパラメータごとに、前記期間の時間に関する第1時間パラメータ
を入力して前記期間に対応する第1モデルのパラメータを出力する第2モデルを推定し、推定した前記第2モデルに基づいて、指定された第2時間パラメータに対応する第1モデル
のパラメータを推定する
第2モデル推定ステップと、
を実行させるためのプログラム。
【発明の詳細な説明】
【技術分野】
【0001】
本発明の実施形態は、情報処理装置、情報処理方法およびプログラムに関する。
【背景技術】
【0002】
例えば半導体工場および化学プラントでは、生産性、歩留および信頼性の向上のために、品質特性を監視して傾向の変化を捉え、品質のばらつきを低減する取り組みが日々行われている。ばらつきを低減するには、ばらつきの原因を正確に把握することが必要である。このために、統計および機械学習を用いたモデル(回帰モデル、分類モデルなど)が活用されている。モデルの説明変数をセンサ値、制御値および設定値などのプロセスデータとし、目的変数を品質特性とすることで、品質特性のばらつきの原因を分析することができる。
【0003】
正確な分析には、より正確(高精度)にモデルを推定することが必要である。モデルの推定には、過去の一定期間のデータが用いられる。この期間(以下、データ期間)が短すぎるとデータ不足のため正確なモデルを推定することができない場合がある。逆にデータ期間が長すぎると、推定されたモデルによって最近の傾向を捉えることができない場合がある。
【先行技術文献】
【特許文献】
【0004】
【文献】特許第6299172号公報
【文献】米国特許第10453026号明細書
【非特許文献】
【0005】
【文献】A. Okuno et al.、“Extrapolation Towards Imaginary 0-Nearest Neighbour and Its Improved Convergence Rate”、 34th Conference on Neural Information Processing Systems (NeurIPS 2020), Vancouver, Canada.
【文献】M. Takada et al.,“Transfer Learning via $ell_1$ Regularization”, Advances in Neural Information Processing Systems (NeurIPS2020), 33, 14266-14277.
【発明の概要】
【発明が解決しようとする課題】
【0006】
本発明が解決しようとする課題は、より高精度なモデルを推定することができる情報処理装置、情報処理方法およびプログラムを提供することである。
【課題を解決するための手段】
【0007】
実施形態の情報処理装置は、受付部と第1モデル推定部と第2モデル推定部とを備える。受付部は、K個(Kは2以上の整数)の期間に得られる複数の入力データの入力を受け付ける。第1モデル推定部は、K個の期間ごとに、期間に得られる複数の入力データを用いて、入力データを入力して出力データを出力する第1モデルを推定する。第2モデル推定部は、期間の時間に関する第1時間パラメータと、第1モデルとの関係を表す第2モデルを推定し、推定した第2モデルに基づいて、指定された第2時間パラメータに対応する第1モデルを推定する。
【図面の簡単な説明】
【0008】
【
図1】第1の実施形態の情報処理システムのブロック図。
【
図2】第1の実施形態におけるモデル推定処理のフローチャート。
【
図3】線形回帰モデルによるモデル推定の例を示す図。
【
図5】モデルの推定方法を指定するための指定画面の例を示す図。
【
図6】モデルが推定された後の指定画面の例を示す図。
【
図7】第2の実施形態の情報処理システムのブロック図。
【
図8】第2の実施形態での回帰モデルの推定処理の概要を示す図。
【
図9】第1または第2の実施形態にかかる情報処理装置のハードウェア構成図。
【発明を実施するための形態】
【0009】
以下に添付図面を参照して、この発明にかかる情報処理装置の好適な実施形態を詳細に説明する。
【0010】
上記のように、従来技術では、データ期間を適切に設定しなければ、より高精度なモデルを推定することができない場合がある。特に、半導体工場および化学プラントなどでは、データ傾向が時々刻々と変化し(非定常性)、また、その挙動に曜日および季節などの周期性が乏しい(非周期的)。このため、データ期間が長すぎるとデータ傾向がなまり、適切に直近の傾向を反映したモデルが推定できない。通常は、それらのバランスを考慮してデータ期間の長さが設定される。
【0011】
他の方法として、データ期間の長さを設定する代わりに、現在からデータ取得時点の時間の長さに応じて重みを付与してモデル(時変係数モデル、変化係数モデル)を推定する方法が提案されている。この方法によれば、例えば直近のデータは重みを大きく、遠い過去のデータは重みを小さくするように目的関数を設計することで、より新しい傾向を捉えることができるモデルを推定することが可能となる。
【0012】
しかし上記の方法では、いずれも「現時点での傾向が捉えられない」という問題がある。すなわち、データ期間を適切に設定したとしても、データが得られているデータ期間の傾向しか捉えられないため、例えばデータが存在しない時点、または、極めて少ないデータしか得られていない時点の傾向を正確に捉えることができない。
【0013】
そこで、以下の実施形態では、現時点などのようにデータが不足している時点に対してもより正確に分析することができるモデルを推定する方式を実現する。
【0014】
(第1の実施形態)
第1の実施形態にかかる情報処理装置は、データ期間を様々に変えて複数のモデルを推定(構築)し、複数のモデルの時間軸方向の変化をさらにモデル化することで、データが不足する時点での傾向をより正確に分析できるモデルを推定する。これにより、例えばデータの急な傾向の変化を素早く検知することが可能となる。
【0015】
図1は、本実施形態の情報処理装置を含む情報処理システムの構成の一例を示すブロック図である。
図1に示すように、情報処理システムは、情報処理装置100と、管理システム200とが、ネットワーク300を介して接続された構成となっている。
【0016】
情報処理装置100および管理システム200それぞれは、例えばサーバ装置として構成することができる。情報処理装置100および管理システム200は、物理的に独立した複数の装置(システム)として実現されてもよいし、物理的に1つの装置内にそれぞれの機能が構成されてもよい。後者の場合、ネットワーク300は備えらえなくてもよい。情報処理装置100および管理システム200の少なくとも一方は、クラウド環境上で構築されてもよい。
【0017】
ネットワーク300は、例えば、LAN(ローカルエリアネットワーク)およびインターネットなどのネットワークである。ネットワーク300は、有線ネットワークおよび無線ネットワークのいずれであってもよい。情報処理装置100と、管理システム200とは、ネットワーク300を介することなく、コンポーネント間の直接的な有線接続または無線接続を用いてデータを送受信してもよい。
【0018】
管理システム200は、情報処理装置100が処理するモデル、および、モデルの学習(推定)および解析などに用いられるデータを管理するシステムである。管理システム200は、記憶部221と、通信制御部201と、を備えている。
【0019】
記憶部221は、管理システム200で実行される各種処理で用いられる各種情報を記憶する。例えば記憶部221は、モデルの推定に用いる入力データなどを記憶する。記憶部221は、フラッシュメモリ、メモリカード、RAM(Random Access Memory)、HDD(Hard Disk Drive)、および、光ディスクなどの一般的に利用されているあらゆる記憶媒体により構成することができる。
【0020】
モデルは、説明変数を入力して目的変数の推論結果を出力する。モデルは、例えば、線形回帰モデル、多項式回帰モデル、ロジスティック回帰モデル、ポアソン回帰モデル、一般化線形モデル、一般化加法モデル、および、ニューラルネットワークモデルなどである。モデルは、これらに限られるものではなく、パラメータを用いて表現されるモデルであればどのようなモデルであってもよい。
【0021】
モデルは、目的変数および説明変数を含む入力データを用いて学習することにより推定される。目的変数は、例えば、品質特性、不良率、並びに、良品および不良品のいずれかを示す情報などである。説明変数は、その他のセンサ値、加工条件などの設定値、および、制御値などである。
【0022】
通信制御部201は、情報処理装置100などの外部装置との間の通信を制御する。例えば通信制御部201は、入力データを情報処理装置100に送信する。
【0023】
上記各部(通信制御部201)は、例えば、1または複数のプロセッサにより実現される。例えば上記各部は、CPU(Central Processing Unit)などのプロセッサにプログラムを実行させること、すなわちソフトウェアにより実現してもよい。上記各部は、専用のIC(Integrated Circuit)などのプロセッサ、すなわちハードウェアにより実現してもよい。上記各部は、ソフトウェアおよびハードウェアを併用して実現してもよい。複数のプロセッサを用いる場合、各プロセッサは、各部のうち1つを実現してもよいし、各部のうち2以上を実現してもよい。
【0024】
情報処理装置100は、記憶部121と、入力デバイス122と、ディスプレイ123と、通信制御部101と、受付部102と、モデル推定部103(第1モデル推定部)と、モデル推定部104(第2モデル推定部)と、出力制御部105と、を備えている。
【0025】
記憶部121は、情報処理装置100で実行される各種処理で用いられる各種情報を記憶する。例えば記憶部121は、通信制御部101および受付部102を介して管理システム200から取得された情報(入力データなど)、モデル推定部103により推定されたモデルのパラメータ、および、モデル推定部104により推定されたモデルのパラメータなどを記憶する。記憶部121は、フラッシュメモリ、メモリカード、RAM、HDD、および、光ディスクなどの一般的に利用されているあらゆる記憶媒体により構成することができる。
【0026】
入力デバイス122は、ユーザなどにより情報を入力するためのデバイスである。入力デバイス122は、例えば、キーボードおよびマウスである。ディスプレイ123は、情報を出力する出力デバイスの一例であり、例えば液晶ディスプレイである。入力デバイス122およびディスプレイ123は、例えばタッチパネルのように一体化されてもよい。
【0027】
通信制御部101は、管理システム200などの外部装置との間の通信を制御する。例えば通信制御部101は、管理システム200から入力データなどを受信する。
【0028】
受付部102は、各種情報の入力を受け付ける。例えば受付部102は、通信制御部201および通信制御部101を介して管理システム200から受信された複数の入力データを受け付ける。複数の入力データは、例えば、時間に関する時間パラメータ(第1時間パラメータ)が相互に異なるK個(Kは2以上の整数)のデータ期間に得られる複数のデータである。この時間パラメータは、例えば、データ期間の長さ、データ期間の開始時刻(起点)、および、期間の終了時刻(終点)のいずれかである。
【0029】
データ期間は、予め定められてもよいし、ユーザ等により指定された値が用いられてもよい。またモデル推定部103が推定するモデルの精度に基づいてデータ期間が決定されてもよい。
【0030】
受付部102は、例えば、指定(決定)されたデータ期間の送信を管理システム200に要求し、要求に応じて管理システム200から送信された入力データを受け付ける。管理システム200から受信された複数の入力データから、指定されたデータ期間の入力データを受付部102またはモデル推定部103が抽出するように構成してもよい。
【0031】
モデル推定部103は、複数の入力データを用いて複数のモデルを推定する。例えばモデル推定部103は、K個のデータ期間ごとに、データ期間内に得られる複数の入力データを用いて、入力データを入力して出力データを出力するモデル(第1モデル)を推定する。
【0032】
モデル推定部104は、モデル推定部103により推定されたK個のモデルを用いて、指定された時間パラメータに対応するモデルを推定するための別のモデル(第2モデル)を推定する。例えばモデル推定部104は、時間パラメータと、推定されたK個のモデルとの関係を表すモデルを推定し、推定したモデルに基づいて、指定された時間パラメータ(第2時間パラメータ)に対応するモデルを推定する。この時間パラメータは、例えば、モデルを推定する時刻(現時点など)である。
【0033】
出力制御部105は、情報処理装置100により処理される各種情報の出力を制御する。例えば出力制御部105は、モデル推定部103により推定されたモデルと、モデル推定部104により推定されたモデルと、をディスプレイ123に表示する。
【0034】
出力制御部105は、情報処理装置100の外部の装置に情報を出力してもよい。例えば出力制御部105は、各モデルを表示するための情報を、表示装置を備える外部の装置に送信してもよい。
【0035】
上記各部(通信制御部101、受付部102、モデル推定部103、モデル推定部104、出力制御部105)は、例えば、1または複数のプロセッサにより実現される。例えば上記各部は、CPUなどのプロセッサにプログラムを実行させること、すなわちソフトウェアにより実現してもよい。上記各部は、専用のICなどのプロセッサ、すなわちハードウェアにより実現してもよい。上記各部は、ソフトウェアおよびハードウェアを併用して実現してもよい。複数のプロセッサを用いる場合、各プロセッサは、各部のうち1つを実現してもよいし、各部のうち2以上を実現してもよい。
【0036】
次に、このように構成された第1の実施形態にかかる情報処理装置100によるモデル推定処理について説明する。
図2は、第1の実施形態におけるモデル推定処理の一例を示すフローチャートである。
【0037】
受付部102は、管理システム200から複数のデータ期間に対応する複数の入力データを受け付ける(ステップS101)。モデル推定部103は、複数のデータ期間ごとに、このデータ期間に取得された複数の入力データを用いてモデルを推定する(ステップS102)。ここでは、モデル推定部103は、データ期間ごとに回帰モデルを推定するものとする。
【0038】
モデル推定部104は、複数のデータ期間に対応する複数の回帰モデルを用いて、これらの回帰モデルの時間変化を表すモデルを推定する(ステップS103)。またモデル推定部104は、推定したモデルを用いて、指定された時点(例えば現時点)の回帰モデルを推定する(ステップS104)。出力制御部105は、推定された回帰モデルを例えばディスプレイ123に表示し(ステップS105)、モデル推定処理を終了する。
【0039】
次に、モデル推定処理の詳細についてさらに説明する。以下では、工場(半導体工場)およびプラント(化学プラント)などにおける品質管理に適用するモデルの推定処理の例を主に説明する。
【0040】
半導体工場および化学プラントでは、品質特性のばらつきおよび変動を抑え、不良を低減することで、歩留を向上させることが求められる。そして、品質特性のばらつきおよび変動の要因を解明するために、回帰モデルおよび分類モデルなどのモデルが用いられる。これらのモデルは、目的変数と説明変数と日時とを含む入力データから推定される。
【0041】
上記のように、目的変数は例えば品質特性、不良率、および、良品/不良品などを示す情報である。説明変数は例えばその他のセンサ値、設定値および制御値などである。日時は、製造開始日時、製造完了日時、および、特定の装置での加工日時などである。
【0042】
説明変数は、予め前処理が実行されてもよい。前処理は、例えば、標準化、基準化、特定の関数による変換、交互作用項の追加、タイムラグ、タイムリード、ダミー変数化、エンコーディング、外れ値処理、および、欠損値処理などである。
【0043】
入力データは、管理システム200の記憶部221に記憶されている。受付部102は、通信制御部101を介して管理システム200から受信された入力データの入力を受け付ける。
【0044】
以下では、入力データの個数がn個(nは1以上の整数)であり、各入力データは、p個の説明変数x、1個の目的変数y、1個の日時を表す数値tを含むものとする。i番目(1≦i≦n)の入力データ(x
i,y
i,t
i)は、以下の(1)式で表される。
【数1】
【0045】
xiは説明変数を表すp次元ベクトル、yiは目的変数を表すスカラー、tiは日時を表すスカラーである。tiは、いずれかの日時を起点として数えた時間の長さ(日数、時間、分、秒など)を用いればよい。ここでは表記を簡単にするため、0=t1≦t2≦・・・≦tn=Tとする。起点とする日時はどのように定められてもよい。また時刻が順番に並んでいない場合は予めソートすればよい。
【0046】
以下、現時点(時刻T)での回帰モデルを推定する場合を例に説明する。従来の方法では、直近の入力データが収集されて、回帰モデルが推定される。例えばi
0(1≦i
0≦n)番目以降の入力データを用いて最小二乗法によりモデル化する場合、以下の(2)式で表される最適化問題を解くことにより回帰モデルが推定される。^β
0は1次元ベクトル、^βはp次元ベクトルを表す。記号「^」は、右の変数(この例ではβ)の上部に付されるハットを表す。β
Tの「T」は転置を表す。
【数2】
【0047】
このような方法で得られた回帰モデルは、時刻t_i0からTまでの期間の傾向を把握することはできるが、例えば時刻Tの時点での傾向をより正確に推定することができない。
【0048】
そこで、本実施形態では、複数のデータ期間の入力データから推定される複数の回帰モデルを活用する。まず、モデル推定部103は、K個の入力データとして、i1,i2,・・・,iK(1≦i1<i2<・・・<iK≦n)番目の入力データを用いる。
【0049】
次に、モデル推定部103は、以下の(3)式に示すように、時刻t_i
Kから時刻Tまでの入力データを用いた回帰モデルをK個推定する。この例では、データ期間の開示時刻(時刻t_i
K)が時間パラメータとして用いられると解釈することができる。
【数3】
【0050】
これにより、K個の回帰モデルと時刻の組(^β0
(k),^β(k),t_iK),k=1,・・・,Kが得られる。
【0051】
次に、モデル推定部104は、^β
j
(k)(j=0,1,・・・,p)とt_i
Kとの関係を表す別の回帰モデルを推定し、この回帰モデルを用いて、t=Tとしたときの回帰モデル^β
jを求める。例えばモデル推定部104は、j=0,1,・・・,pに対して以下の(4)式で表される最適化問題を解くことにより、回帰モデルの回帰係数^α
j0、^α
j1を求める。ここで、^α
j0、^α
j1はいずれもスカラー値である。
【数4】
【0052】
このように、複数のデータ期間の入力データを用いて複数の回帰モデルを推定した後、複数の回帰モデルの時間変化を再びモデル化し、現時点での回帰係数の予測値を算出することで、現時点の回帰モデルをより正確に推定することができる。
【0053】
(4)式は時刻Tの回帰モデルの推定方法を示すが、以下の(5)式に示すように、時刻Tより後、または時刻Tより前の時刻T’に対しても、同様に回帰モデルを推定することができる。
【数5】
【0054】
モデルの推定方法は(3)式のように最小二乗法を用いる方法に限られず、どのような方法であってもよい。例えば、Ridge、Lasso、SCAD(Smoothly Clipped Absolute Derivation)、MCP(Minimax Concave Penalty)、Lq(0≦q<1)ノルム、Elastic Net、L1/2ノルムなどのような罰則付き回帰を用いてもよい。これらの罰則付き回帰は、パラメータがスパース性を有するようにモデルを推定する方法であると解釈することができる。
【0055】
またモデル推定部103は、(3)式などで^β0
(k),^β(k)を求めるときに、時刻t_iKとから時刻Tまで(第1期間)の入力データを用いた回帰モデル^β(k)を初期推定量(初期値)として、時刻t_iK+1から時刻Tまで(第2期間)の入力データでの回帰モデルに転移学習を行うTransfer Lasso(非特許文献2)を用いてもよい。
【0056】
また、損失関数は二乗誤差に限られず、どのような関数が用いられてもよい。例えば、絶対値損失、分位損失、フーバー損失、イプシロン感度損失、ロジスティック損失、指数損失、ヒンジ損失、および、平滑化ヒンジ損失などのうち、採用するモデルの推定方法に適用可能などのような損失関数が用いられてもよい。
【0057】
また、モデル推定部103は、各入力データの信頼度および日時に応じて重みづけした損失関数を用いてもよい。
【0058】
また、推定するモデルは線形回帰モデルに限られず、多項式回帰モデル、ロジスティック回帰モデル、ポアソン回帰モデル、一般化線形モデル、一般化加法モデル、および、ニューラルネットワークモデルなどであってもよい。
【0059】
また、入力データの終点をTとしている(時刻t_iKから時刻Tまでの入力データを用いている)が、T以外の入力データを終点としてもよい。
【0060】
モデル推定部104によるモデルの推定方法についても、(4)式のように最小二乗法を用いる方法に限られず、モデル推定部103によるモデルの推定方法に対して説明したような他の方法であってもよい。
【0061】
また、^αj0、^αj1をjごとに求める方法を説明したが、モデル推定部104は、各jを1つのタスクとして捉えて全タスクを同時に最適化するマルチタスク学習を用いてもよい。さらに、モデルの推定を安定化させるために、モデル推定部104は、Ridge、Lasso、SCAD、MCP、Lq(0≦q<1)ノルム、Elastic Net、L1/2ノルムなどのような罰則付き回帰を用いてもよい。
【0062】
また、モデル推定部104は、(4)式の代わりに、以下の(6)式のような二次関数を用いたモデル化を行ってもよい。
【数6】
【0063】
例えば、品質特性に悪影響を与え始めたセンサ項目(説明変数)をユーザがより早期に捉えたい場合がある。例えば、現在の製造工程が安定しており、品質のわずかな低下を捉えて早期に対策する場合が考えられる。このとき、説明変数から目的変数を推定するモデル(第1モデル)を線形回帰モデルとすると、変化傾向を早期に捉えられない可能性がある。このような場合に、上記の(6)式のような二次関数を用いたモデル化を適用すれば、傾向の変化の加速度を考慮することができ、緊急性の高い項目を逃さずに監視することができる。
【0064】
図3は、線形回帰モデルによるモデル推定の例を示す図である。
図3の左のグラフは、以下のような3つの異なるデータ期間の入力データが用いられることを示す。この例では、データ期間は終了時点が現時点で共通するが、起点が相互に異なる。すなわちこの例では、起点が、相互に異なる時間パラメータに相当する。なお、この例では、共通の時点(終了時点)を基準とする期間の長さが、相互に異なる時間パラメータに相当すると解釈することもできる。
(A1)3か月前から現時点までの3か月
(B1)1か月前から現時点までの1か月
(C1)1週間前から現時点までの1週間
【0065】
図3の右のグラフは、データ期間の長さごとの回帰係数の変化を表す図である。なお回帰係数はベクトルであるが、説明の便宜のため
図3では1つの要素の変化が表されている。また
図3では、(A1)(B1)(C1)以外のデータ期間に対する回帰係数を表す点も示されている。
【0066】
右のグラフ内に記載された直線は、例えば(4)式により推定される線形回帰モデル(第2モデル)に相当する。モデル推定部104は、このような線形回帰モデルを用いて、例えば時刻Tに相当する期間0での回帰係数301、言い換えると、時刻Tでの回帰モデル(第1モデル)を推定することができる。この場合、回帰モデルを推定する時点が、指定された時間パラメータ(第2時間パラメータ)に相当する。
図3の例では、データ期間の長さが0である現時点(時刻T)が、指定された時間パラメータに相当する。
【0067】
時間パラメータは上記の例に限られない。例えば、相互に異なる時間パラメータは、ある時点を中心とする期間の長さ(幅)であってもよい。例えば、以下のような3つの異なるデータ期間を用いることができる。
(A2)1.5か月前の時点を中心とする3か月(3か月前から現時点まで)
(B2)1.5か月前の時点を中心とする1か月(2か月前から1か月前まで)
(C2)1.5か月前の時点を中心とする1週間
【0068】
このようなデータ期間は、例えば、現時点から1.5か月前の時点のデータが不足しており、この時点のモデルを推定するような場合に適している。
【0069】
また、例えば、以下のような3つの異なるデータ期間を用いることができる。この例は、長さが共通する期間の起点、または、終点が、相互に異なる時間パラメータに相当する。
(A3)3か月前から2か月前までの1か月
(B3)2か月前から1か月前までの1か月
(C3)1か月前から現時点までの1か月
【0070】
図4は、例えば(6)式のような二次関数を用いたモデル推定の例を示す図である。上述のように、二次関数を用いるモデルによれば、傾向の変化の加速度を考慮することができるため、変化の傾向をより早期に把握することが可能となる。
【0071】
モデル推定部103によるモデルの推定方法、および、モデル推定部104によるモデルの推定方法は、例えばユーザにより指定可能とされてもよい。
図5は、モデルの推定方法を指定するための指定画面の例を示す図である。
【0072】
図5に示すように、指定画面は、モデル表示欄501、選択欄502、実行ボタン511、および、キャンセルボタン512を含む。モデル表示欄501は、モデル推定部103により推定されたモデルを表示するための領域である。例えば出力制御部105は、モデル推定部103により推定されたモデルをモデル表示欄501に表示する。
【0073】
選択欄502は、モデル推定方法をユーザが選択(指定)するための領域である。ユーザがモデル推定方法を選択して実行ボタン511を押下すると、モデル推定部104は、選択されたモデル推定方法に従いモデルを推定する。なおキャンセルボタン512が押下された場合は、処理が中断される。
【0074】
図6は、モデルが推定された後の指定画面の例を示す図である。
図6に示すように、指定画面は、直線601と、回帰係数602と、を含む。直線601は、複数の回帰モデルから推定されたモデル(第2モデル)を示す情報に相当する。回帰係数602は、時刻Tでの回帰係数を表し、推定されたモデル(第1モデル)に相当する。例えば出力制御部105は、複数の回帰モデルから推定されたモデル(第2モデル)を示す情報、および、このモデルにより推定されたモデルをディスプレイ123に表示する。
【0075】
説明変数から目的変数を推定するモデル(第1モデル)が可視化された後、ユーザは、指定された時点でのモデルの推定に用いる推定方法を選択することができる。これにより、ユーザの納得性を向上させ、システムの柔軟性を上げることができる。
【0076】
ユーザが指定可能な項目は、モデル推定部104によるモデル推定方法に限られない。例えば出力制御部105は、以下のような項目を指定(選択)できるような画面をディスプレイ123に表示する機能を備えてもよい。
・モデル推定部103によるモデル推定方法
・モデル推定部103によるモデル推定に用いるデータ期間
・推定するモデルの説明変数
【0077】
このように、第1の実施形態では、データが不足する時点の分析も可能な、より高精度なモデルを推定することができる。
【0078】
(第2の実施形態)
製品を製造する製造装置(電子機器の一例)は、定期的にメンテナンスされる場合がある。例えば半導体製造装置は、製造加工に伴いダストが発生するため、定期的なメンテナンスが行われている。メンテナンスにより、製造装置の状態が変化するため、回帰モデルも大きく変化する場合がある。そこで、第2の実施形態にかかる情報処理装置は、メンテナンスの日時を利用してデータ期間を決定することにより、より正確な回帰モデルの推定を可能とする。
【0079】
図7は、本実施形態の情報処理装置100-2を含む情報処理システムの構成の一例を示すブロック図である。管理システム200およびネットワーク300は、第1の実施形態と同様であるため同一の符号を付し、説明を省略する。
図7に示すように、情報処理装置100-2は、記憶部121と、入力デバイス122と、ディスプレイ123と、通信制御部101と、受付部102と、モデル推定部103-2と、モデル推定部104と、出力制御部105と、を備えている。
【0080】
第2の実施形態では、モデル推定部103-2の機能が第1の実施形態と異なっている。その他の構成および機能は、第1の実施形態にかかる情報処理装置100のブロック図である
図1と同様であるので、同一符号を付し、ここでの説明は省略する。
【0081】
モデル推定部103-2は、メンテナンスの日時を考慮してデータ期間を決定する点が、第1の実施形態のモデル推定部103と異なっている。メンテナンスが行われると、製造装置の状態が変化し、複数の入力データは、製造装置の状態に応じて変化しうる。そこで、モデル推定部103-2は、メンテナンスの間隔に基づいて、K個のデータ期間を決定する。
【0082】
以下、メンテナンスの間隔に応じたモデル推定処理の詳細について説明する。
【0083】
各入力データのtiは、製造装置による加工が行われた日時を表すものとする。また、i=i_m1,・・・,i_mMの直後に、それぞれメンテナンスが行われたとする(合計M回)。便宜上、i_m0=1,i_mM+1=Tとする。
【0084】
モデル推定部103-2は、i_m
h-1からi_m
h(1≦h≦M+1)までの(M+1)個の期間をデータ期間として決定する。これらのデータ期間は、メンテナンス間隔ごと期間に相当すると解釈することができる。そしてモデル推定部103-2は、以下の(7)式に示すように、メンテナンス間隔ごとの(M+1)個の回帰モデルを推定する。
【数7】
【0085】
なお、^β(M+1)は、直近(M回目)のメンテナンス以降の入力データを用いて得られる回帰モデルを表す。^β(M+1)をそのまま現在の回帰モデルとしてもよいが、メンテナンスが頻繁に実行される場合、および、メンテナンスからの経過日数が少ない場合、データ不足で正確に現時点の回帰モデルを推定できない可能性がある。
【0086】
そこで、第1の実施形態と同様に、(M+1)個のデータ期間の回帰モデルと時刻との組み(^β0
(k),^β(k),t_iK),k=1,・・・,M+1を用いて、現時点(時刻T)での回帰モデルを推定する。
【0087】
なお(M+1)個のデータ期間は、起点(開始時刻)または終点(終了時刻)である時間パラメータが相互に異なると解釈することができる。この例ではデータ期間が(M+1)個であるため、第1の実施形態のK個を(M+1)個に置き換えることにより、第1の実施形態と同様の手法を適用できる。
【0088】
すなわち、モデル推定部104は、上記の(4)式の「K」を「M+1」に置き換えた式により、時間パラメータと、(M+1)個のモデルとの関係を表すモデルを推定することができる。
【0089】
図8は、本実施形態での回帰モデルの推定処理の概要を示す図である。横軸のデータ期間の長さは、現時点を基準としたデータ期間の起点までの長さに相当する。
図8では、約1.5か月前に行われたメンテナンスにより入力データの傾向が断続的に変化した例が示されている。本実施の形態では、メンテナンスが行われた日時で区分したデータ期間を用いてモデルが推定される。
【0090】
このように、第2の実施形態では、単にメンテナンス間隔ごとに1つの回帰モデルを推定するのではなく、メンテナンス間隔に相当する複数のデータ期間でそれぞれ複数のモデルを推定し、複数のモデルの時間軸方向の変化をさらにモデル化する。これにより、メンテナンスによる断続的な変動を考慮したより高精度な回帰モデルを推定することができる。
【0091】
以上説明したとおり、第1から第2の実施形態によれば、より高精度なモデルを推定することができる。
【0092】
次に、第1または第2の実施形態にかかる情報処理装置のハードウェア構成について
図9を用いて説明する。
図9は、第1または第2の実施形態にかかる情報処理装置のハードウェア構成例を示す説明図である。
【0093】
第1または第2の実施形態にかかる情報処理装置は、CPU51などの制御装置と、ROM(Read Only Memory)52やRAM53などの記憶装置と、ネットワークに接続して通信を行う通信I/F54と、各部を接続するバス61を備えている。
【0094】
第1または第2の実施形態にかかる情報処理装置で実行されるプログラムは、ROM52等に予め組み込まれて提供される。
【0095】
第1または第2の実施形態にかかる情報処理装置で実行されるプログラムは、インストール可能な形式または実行可能な形式のファイルでCD-ROM(Compact Disk Read Only Memory)、フレキシブルディスク(FD)、CD-R(Compact Disk Recordable)、DVD(Digital Versatile Disk)等のコンピュータで読み取り可能な記録媒体に記録してコンピュータプログラムプロダクトとして提供されるように構成してもよい。
【0096】
さらに、第1または第2の実施形態にかかる情報処理装置で実行されるプログラムを、インターネット等のネットワークに接続されたコンピュータ上に格納し、ネットワーク経由でダウンロードさせることにより提供するように構成してもよい。また、第1または第2の実施形態にかかる情報処理装置で実行されるプログラムをインターネット等のネットワーク経由で提供または配布するように構成してもよい。
【0097】
第1または第2の実施形態にかかる情報処理装置で実行されるプログラムは、コンピュータを上述した情報処理装置の各部として機能させうる。このコンピュータは、CPU51がコンピュータ読取可能な記憶媒体からプログラムを主記憶装置上に読み出して実行することができる。
【0098】
本発明のいくつかの実施形態を説明したが、これらの実施形態は、例として提示したものであり、発明の範囲を限定することは意図していない。これら新規な実施形態は、その他の様々な形態で実施されることが可能であり、発明の要旨を逸脱しない範囲で、種々の省略、置き換え、変更を行うことができる。これら実施形態やその変形は、発明の範囲や要旨に含まれるとともに、特許請求の範囲に記載された発明とその均等の範囲に含まれる。
【符号の説明】
【0099】
100 情報処理装置
101 通信制御部
102 受付部
103 モデル推定部
104 モデル推定部
105 出力制御部
121 記憶部
122 入力デバイス
123 ディスプレイ
200 管理システム
201 通信制御部
221 記憶部
300 ネットワーク