IP Force 特許公報掲載プロジェクト 2022.1.31 β版

知財求人 - 知財ポータルサイト「IP Force」

▶ 住友金属鉱山株式会社の特許一覧

特許7552036情報処理装置、情報処理方法およびプログラム
<>
  • 特許-情報処理装置、情報処理方法およびプログラム 図1
  • 特許-情報処理装置、情報処理方法およびプログラム 図2
  • 特許-情報処理装置、情報処理方法およびプログラム 図3
  • 特許-情報処理装置、情報処理方法およびプログラム 図4
  • 特許-情報処理装置、情報処理方法およびプログラム 図5
  • 特許-情報処理装置、情報処理方法およびプログラム 図6
  • 特許-情報処理装置、情報処理方法およびプログラム 図7
  • 特許-情報処理装置、情報処理方法およびプログラム 図8
  • 特許-情報処理装置、情報処理方法およびプログラム 図9
  • 特許-情報処理装置、情報処理方法およびプログラム 図10
  • 特許-情報処理装置、情報処理方法およびプログラム 図11
< >
(19)【発行国】日本国特許庁(JP)
(12)【公報種別】特許公報(B2)
(11)【特許番号】
(24)【登録日】2024-09-09
(45)【発行日】2024-09-18
(54)【発明の名称】情報処理装置、情報処理方法およびプログラム
(51)【国際特許分類】
   C30B 15/20 20060101AFI20240910BHJP
   G06Q 50/04 20120101ALI20240910BHJP
   C30B 29/30 20060101ALI20240910BHJP
【FI】
C30B15/20
G06Q50/04
C30B29/30 A
C30B29/30 B
【請求項の数】 7
(21)【出願番号】P 2020037993
(22)【出願日】2020-03-05
(65)【公開番号】P2021138573
(43)【公開日】2021-09-16
【審査請求日】2022-12-08
(73)【特許権者】
【識別番号】000183303
【氏名又は名称】住友金属鉱山株式会社
(74)【代理人】
【識別番号】100107766
【弁理士】
【氏名又は名称】伊東 忠重
(74)【代理人】
【識別番号】100070150
【弁理士】
【氏名又は名称】伊東 忠彦
(72)【発明者】
【氏名】吉田 智大
【審査官】今井 淳一
(56)【参考文献】
【文献】特開平10-310489(JP,A)
(58)【調査した分野】(Int.Cl.,DB名)
C30B 15/20
G06Q 50/04
C30B 29/30
(57)【特許請求の範囲】
【請求項1】
結晶の育成工程で測定される測定項目の値と、前記結晶の良不良の判定結果と、を取得する取得部と、
取得された前記測定項目から、互いに異なる属性を有する前記測定項目を少なくとも一つ含む複数の前記測定項目の組み合わせを候補項目として設定する設定部と、
設定された前記候補項目の値の組み合わせに基づいて前記結晶の良不良を予測するための、複数の予測モデルを生成する予測モデル生成部と、
生成された複数の前記予測モデルのそれぞれの評価値を、前記判定結果と、複数の前記予測モデルのそれぞれの予測結果と、に基づいて算出する算出部と、
算出された前記評価値に基づいて、前記候補項目の組み合わせを前記育成工程における制御対象とすべきパラメータとして決定する決定部と、
決定された前記パラメータの値前記結晶の良不良を学習するための学習モデルを生成する学習モデル生成部と、
前記学習モデルに基づいて、前記取得された前記測定項目についての前記結晶の良品を育成するための前記パラメータの値を学習し、前記結晶の良品を育成する場合の前記取得された前記測定項目についての前記パラメータの値を出力する学習部と、
を備える情報処理装置。
【請求項2】
前記算出部は、前記測定項目の値と、複数の前記予測モデルのそれぞれの予測値と、の2乗誤差が小さくなるような係数を用いた場合の尤度を、前記評価値として算出し、
前記決定部は、前記評価値と予め設定された閾値とに基づいて、前記パラメータを決定する、
請求項1に記載の情報処理装置。
【請求項3】
複数の前記予測モデルのそれぞれは、ロジスティック回帰モデルであって、
前記算出部は、前記ロジスティック回帰モデルの損失関数の係数を用いた場合の尤度を、前記評価値として算出する、
請求項2に記載の情報処理装置。
【請求項4】
前記算出部は、複数の前記予測モデルのそれぞれの再現率と適合率との調和平均を、前記評価値として算出し、
前記決定部は、前記評価値と予め設定された閾値とに基づいて、前記パラメータを決定する、
請求項1から3のいずれか1項に記載の情報処理装置。
【請求項5】
複数の前記予測モデルのそれぞれは、サポートベクターマシンであって、
前記決定部は、前記評価値が0.5以上の場合の前記候補項目の組み合わせを、前記パラメータとして決定する、
請求項4に記載の情報処理装置。
【請求項6】
コンピュータが、
結晶の育成工程で測定される測定項目の値と、前記結晶の良不良の判定結果と、を取得し、
取得された前記測定項目から、互いに異なる属性を有する前記測定項目を少なくとも一つ含む複数の前記測定項目の組み合わせを候補項目として設定し、
設定された前記候補項目の値の組み合わせに基づいて前記結晶の良不良を予測するための、複数の予測モデルを生成し、
生成された複数の前記予測モデルのそれぞれの評価値を、前記判定結果と、複数の前記予測モデルのそれぞれの予測結果と、に基づいて算出し、
算出された前記評価値に基づいて、前記候補項目の組み合わせを前記育成工程における制御対象とすべきパラメータとして決定し、
決定された前記パラメータの値前記結晶の良不良を学習するための学習モデルを生成し、
前記学習モデルに基づいて、前記取得された前記測定項目についての前記結晶の良品を育成するための前記パラメータの値を学習し、前記結晶の良品を育成する場合の前記取得された前記測定項目についての前記パラメータの値を出力する、
情報処理方法。
【請求項7】
コンピュータに、
結晶の育成工程で測定される測定項目の値と、前記結晶の良不良の判定結果と、を取得し、
取得された前記測定項目から、互いに異なる属性を有する前記測定項目を少なくとも一つ含む複数の前記測定項目の組み合わせを候補項目として設定し、
設定された前記候補項目の値の組み合わせに基づいて前記結晶の良不良を予測するための、複数の予測モデルを生成し、
生成された複数の前記予測モデルのそれぞれの評価値を、前記判定結果と、複数の前記予測モデルのそれぞれの予測結果と、に基づいて算出し、
算出された前記評価値に基づいて、前記候補項目の組み合わせを前記育成工程における制御対象とすべきパラメータとして決定するステップと、
決定された前記パラメータの値前記結晶の良不良を学習するための学習モデルを生成するステップと、
前記学習モデルに基づいて、前記取得された前記測定項目についての前記結晶の良品を育成するための前記パラメータの値を学習し、前記結晶の良品を育成する場合の前記取得された前記測定項目についての前記パラメータの値を出力するステップと、
を実行させるためのプログラム。
【発明の詳細な説明】
【技術分野】
【0001】
本発明は、情報処理装置、情報処理方法およびプログラムに関する。
【背景技術】
【0002】
従来から、チョクラルスキ法(Czochralski法)による単結晶の育成が行われている。例えば、タンタル酸リチウム(LiTaO;LT)、ニオブ酸リチウム(LiNbO;LN)等の育成では、クラックが入りやすく、結晶径の変動や不安定性、気泡、コア、転移などの問題から、育成条件の設定が非常に難しく、育成状態を評価するための技術が開発されている。
【0003】
例えば、特許文献1には、単結晶の育成状態を評価する方法として、測定重量の変動幅に基づく評価方法が開示されている。
【先行技術文献】
【特許文献】
【0004】
【文献】特開2019-112264号公報
【発明の概要】
【発明が解決しようとする課題】
【0005】
上述した従来の技術では、結晶の温度、雰囲気の温度、これらの温度変化や結晶の引き上げ速度など、制御対象となり得るパラメータの候補が非常に多いため、評価のためのサンプル数が十分でない場合には、結晶の良品を育成するためのパラメータの値を決めることが難しいという問題があった。
【0006】
本発明は、上記事情に鑑みてなされたものであり、多くのパラメータの候補の中から結晶の良品を育成するためのパラメータの値を学習することを目的としている。
【課題を解決するための手段】
【0007】
上記目的を達成するため、本発明の一態様に係る情報処理装置は、
結晶の育成工程で測定される測定項目から、前記育成工程における制御対象とすべきパラメータを決定する決定部と、
決定された前記パラメータの値に基づいて前記結晶の良不良を学習するための学習モデルを生成する学習モデル生成部と、
前記学習モデルに基づいて、前記結晶の良品を育成するための前記パラメータの値を学習する学習部と、を備える。
【発明の効果】
【0008】
多くのパラメータの候補の中から結晶の良品を育成するためのパラメータの値を学習することができる。
【図面の簡単な説明】
【0009】
図1】情報処理システムのシステム構成の一例を示す図である。
図2】情報処理装置のハードウェア構成の一例を示す図である。
図3】第一の実施形態に係る情報処理装置の機能の一例を示す図である。
図4】第一の実施形態に係るパラメータ選定処理の一例を示すフローチャートである。
図5】育成結果データの一例を示す第一の図である。
図6】育成結果データの一例を示す第二の図である。
図7】第二の実施形態に係るパラメータ選定処理の一例を示すフローチャートである。
図8】第三の実施形態に係るパラメータ選定処理の一例を示すフローチャートである。
図9】第四の実施形態に係る情報処理装置の機能の一例を示す図である。
図10】第四の実施形態に係る機械学習処理の一例を示すフローチャートである。
図11】第五の実施形態に係るパラメータ選定処理の一例を示すフローチャートである。
【発明を実施するための形態】
【0010】
(第一の実施形態)
以下に、図面を参照して、本発明の実施の形態について説明する。
【0011】
図1は、情報処理システムのシステム構成の一例を示す図である。
【0012】
情報処理システム1は、情報処理装置10と、育成管理データベース20と、を備える。
【0013】
情報処理装置10は、育成管理データベース20と通信可能に接続されている。情報処理装置10は、育成管理データベース20から育成結果データ30を受信して、受信した育成結果データ30を分析する。そして、情報処理装置10は、分析の結果を示す分析結果情報40を出力する。
【0014】
育成管理データベース20は、単結晶の育成状態を管理する情報を記憶する装置である。育成管理データベース20は、情報処理装置10に育成結果データ30を送信する。
【0015】
育成結果データ30は、単結晶の育成の結果を示すデータである。育成結果データ30は、単結晶の育成に関わる種々の測定項目の値と、育成した単結晶に対する良不良の判定結果と、が関連付けられたデータである。
【0016】
ここで、測定項目とは製造工程に係わる様々なデータを所定条件にそって取得した観測値であり、各観測値の名称である。具体的には、製品の生産にあたって必要な材料の種類、量、使用量、これらの品質に係わる指標、例えば、純度、温度や湿度などの環境条件が挙げられる。他にも、生産ラインの速度、工程に要する時間などといった生産工程の設備に係わる情報でもよい。これらの項目と決められた基準にそって収集され、育成管理データベース20に蓄積される。
【0017】
なお、図示しない測定装置が、測定された情報を情報処理装置10に直接送信しても良い。その場合、情報処理装置10は、記憶部11に一定量貯めた後に、利用するようにしてもよい。
【0018】
単結晶の育成法としては、気相法、液相法および固体法が知られている。例えば、気相法としては、昇華法、化学気相成長(CVD)法、ハイドライド気相成長法(Hydride Vapor Phase Epitaxy法)等がある。また、液相法としては、融液成長法として、チョクラルスキ法、フローティングゾーン(FZ)法、ブリッジマン法等があり、溶液成長法として、フラックス法、溶融引き上げ法(TSSG;Top Seeded Solution Growth法)、水熱合成法等がある。固相法としては、再結晶法、高圧合成法、固相エピタキシャル成長法、ゾルゲル法などがある。
【0019】
手法の違いによって、または得られた結晶を用いる製品によって、測定項目、制御対象とすべきパラメータ、得られた結晶の評価項目等が異なっても良い。例えば、液相から育成するチョクラルスキ法では、原料をるつぼ(坩堝)の中で溶融させ、その融液の表面にワイヤで固定した種結晶(単結晶の小片)を接触させ、ゆっくり回転させながら引き上げて所定の直径のインゴットを得る。
【0020】
この場合、測定項目として、日時、製品種別、各ロットのID以外に、炉、耐火物、ヒータなどの材料のサイズ、配置および使用回数、種結晶の長さおよび重量、育成時の雰囲気、引き上げ軸の位置、原料の融解処理の時間、開始/終了時刻、引き上げ処理の開始/終了時刻、引き上げ時の回転速度、インゴットの直胴部のサイズ、電圧・電流の出力値、冷却水の温度および循環量などが挙げられる。
【0021】
具体的な測定項目としては、肩部1開始時刻、肩部1終了時刻、肩部2開始時刻、肩部2終了時刻、直胴部開始時刻、直胴部終了時刻、肩部1ルツボ底温度傾き、肩部2ルツボ底温度傾き、直胴部ルツボ底温度傾き、全体ルツボ底温度傾き、肩部1出力変化量傾き、肩部2出力変化量傾き、直胴部出力変化量傾き、全体出力変化量傾き、固化熱発生時刻、固化熱発生熱量、固化熱発生時重量、ADCイン時間、出力上昇量、出力上昇時間、直胴部成長速度平均、直胴部成長速度最大、肩部1直径差平均、肩部2直径差平均、直胴直径差平均、出力変化量コブ面積、底付き発生時期、シーディング開始時刻、シーディング開始可能時間、平均チャンバーL温度、平均チャンバーR温度、平均チャンバー底温度、平均WCサポート温度、平均るつぼ台温度、平均割F右+窓温度、平均WC温度、平均割F左温度、平均メインチャンバー温度、平均トップチャンバー温度、平均総合OUT温度、平均総合IN温度、平均高周波電源温度、平均マッチングボックス温度、平均水冷ケーブル温度、平均オイルシール温度、平均チャンバー水冷管温度、平均チャンバー扉温度、平均チャンバー本体温度、平均ベースチャンバー温度、平均チャンバーL流量、平均チャンバーR流量、平均チャンバー底流量、平均WCサポート流量、平均るつぼ台流量、平均割F右+窓流量、平均WC流量、平均割F左流量、平均メインチャンバー流量、平均トップチャンバー流量、平均総合OUT流量、平均総合IN流量、平均高周波電源流量、平均マッチングボックス流量、平均水冷ケーブル流量、平均オイルシール流量、平均チャンバー水冷管流量、平均チャンバー扉流量、平均チャンバー本体流量、平均ベースチャンバー流量、最大チャンバーL温度、最大チャンバーR温度、最大チャンバー底温度、最大WCサポート温度、最大るつぼ台温度、最大割F右+窓温度、最大WC温度、最大割F左温度、最大メインチャンバー温度、最大トップチャンバー温度、最大総合OUT温度、最大総合IN温度、最大高周波電源温度、最大マッチングボックス温度、最大水冷ケーブル温度、最大オイルシール温度、最大チャンバー水冷管温度、最大チャンバー扉温度、最大チャンバー本体温度、最大ベースチャンバー温度、最大チャンバーL流量、最大チャンバーR流量、最大チャンバー底流量、最大WCサポート、流量、最大るつぼ台流量、最大割F右+窓流量、最大WC流量、最大割F左流量、最大メインチャンバー流量、最大トップチャンバー流量、最大総合OUT流量、最大総合IN流量、最大高周波電源流量、最大マッチングボックス流量、最大水冷ケーブル流量、最大オイルシール流量、最大チャンバー水冷管流量、最大チャンバー扉流量、最大チャンバー本体流量、最大ベースチャンバー流量、最小チャンバーL温度、最小チャンバーR温度、最小チャンバー底温度、最小WCサポート温度、最小るつぼ台温度、最小割F右+窓温度、最小WC温度、最小割F左温度、最小メインチャンバー温度、最小トップチャンバー温度、最小総合OUT温度、最小総合IN温度、最小高周波電源温度、最小マッチングボックス温度、最小水冷ケーブル温度、最小オイルシール温度、最小チャンバー水冷管温度、最小チャンバー扉温度、最小チャンバー本体温度、最小ベースチャンバー温度、最小チャンバーL流量、最小チャンバーR流量、最小チャンバー底流量、最小WCサポート流量、最小るつぼ台流量、最小割F右+窓流量、最小WC流量、最小割F左流量、最小メインチャンバー流量、最小トップチャンバー流量、最小総合OUT流量、最小総合IN流量、最小高周波電源流量、最小マッチングボックス流量、最小水冷ケーブル流量、最小オイルシール流量、最小チャンバー水冷管流量、最小チャンバー扉流量、最小チャンバー本体流量、最小ベースチャンバー流量、ルツボ温度差分、ハンチング収束時重量などをあげることができる。
【0022】
他に、結晶の評価の際に得られるデータを測定項目に加えてもよい。例えば、評価のためにカメラを用いている場合、カメラの画像を解析して得られるデータを測定項目に加えてもよい。
【0023】
分析結果情報40は、情報処理装置10による分析の結果を示す情報である。具体的には、分析結果情報40は、単結晶の育成において制御対象とすべきパラメータの選定結果を示す情報を含む。制御対象とすべきパラメータの選定結果とは、例えば、400個の測定項目の中から、制御対象とすべきパラメータとして、10個の測定項目を選定した結果である。
【0024】
次に、情報処理装置10のハードウェア構成について説明する。
【0025】
図2は、情報処理装置のハードウェア構成の一例を示す図である。
【0026】
情報処理装置10は、CPU(Central Processing Unit)101、主記憶装置102、補助記憶装置103、入力装置104、表示装置105、通信インターフェース装置106、ドライブ装置107を備える。これらの各装置は、バスで接続されている。
【0027】
CPU101は、情報処理装置10の動作を制御する主制御部であり、主記憶装置102に格納されたプログラムを読みだして実行することで、後述する各種の機能を実現する。
【0028】
主記憶装置102は、情報処理装置10の起動時に補助記憶装置103からプログラムを読み出して格納する。補助記憶装置103は、インストールされたプログラムを格納すると共に、後述する各種機能に必要なファイル、データ等を格納する。
【0029】
入力装置104は、各種の情報の入力を行うための装置であり、例えばキーボードやポインティングデバイス等により実現される。表示装置105は、各種の情報の表示を行うためものであり、例えばディスプレイ等により実現される。通信インターフェース装置106は、LANカード等を含み、育成管理データベース20との接続の為に用いられる。
【0030】
本実施形態に係るプログラムは、情報処理装置10を制御する各種プログラムの少なくとも一部である。プログラムは、例えば記憶媒体108の配布やネットワークからのダウンロード等によって提供される。プログラムを記録した記憶媒体108は、CD-ROM、フレキシブルディスク、光磁気ディスク等の様に情報を光学的、電気的或いは磁気的に記録する記憶媒体、ROM、フラッシュメモリ等の様に情報を電気的に記録する半導体メモリ等、様々なタイプの記憶媒体を用いることができる。
【0031】
また、プログラムは、プログラムを記録した記憶媒体108がドライブ装置107にセットされると、記憶媒体108からドライブ装置107を介して補助記憶装置103にインストールされる。ネットワークからダウンロードされたプログラムは、通信インターフェース装置106を介して補助記憶装置103にインストールされる。
【0032】
次に、情報処理装置10の機能について説明する。
【0033】
図3は、第一の実施形態に係る情報処理装置の機能の一例を示す図である。
【0034】
情報処理装置10は、記憶部11と、制御部12と、受付部13と、取得部14と、送信部15と、表示部16と、を備える。
【0035】
記憶部11は、各種のデータ、プログラム等を記憶する。具体的には、記憶部11は、設定情報111を記憶する。前述の補助記憶装置103は、記憶部11の一例である。
【0036】
設定情報111は、後述する各種処理の動作の設定を示す情報であって、各種の判定処理に使用される閾値等を含む。
【0037】
受付部13は、ユーザからの指示を受け付ける。前述の入力装置104は、受付部13の一例である。
【0038】
取得部14は、育成管理データベース20から育成結果データ30を取得する。前述の通信インターフェース装置106は、取得部14の一例である。
【0039】
制御部12は、後述する各種処理を実行する。具体的には、制御部12は、設定部121と、予測モデル生成部122と、算出部123と、決定部124と、を備える。
【0040】
設定部121は、取得部14によって取得された育成結果データ30に含まれる測定項目から、候補項目を設定する。具体的には、設定部121は、互いに異なる属性を有する測定項目を少なくとも一つ含む複数の測定項目の組み合わせを、候補項目として設定する。
【0041】
ここで、測定項目の属性とは、温度、流量、時刻等のように、測定の内容に応じて設定される種別である。設定情報111には、具体的な測定項目ごとの属性を示す情報が含まれる。例えば、「肩部1開始時刻」、「肩部1終了時刻」が、ともに「時刻」という属性を有する測定項目であることが、設定情報111に設定されている。
【0042】
また、設定情報111に設定される代わりに、育成結果データ30に、測定項目ごとの属性を示す情報が含まれていても良い。
【0043】
設定部121は、上述した属性を示す情報に基づいて、互いに異なる属性を有する測定項目を少なくとも一つ含む複数の測定項目の組み合わせを設定する。例えば、設定部121は、「時刻」、「温度」および「流量」という属性を有する測定項目の組み合わせとして、「肩部1開始時刻」、「平均ベースチャンバー温度」および「平均総合OUT流量」という組み合わせを、候補項目として設定する。
【0044】
予測モデル生成部122は、設定部121で設定された候補項目を入力パラメータの特徴量とする予測モデルを生成する。生成される予測モデルの出力値は、育成される単結晶の良不良の予測結果を示す情報である。
【0045】
本実施形態に係る予測モデル生成部122は、各候補項目の値を入力パラメータの特徴量とするロジスティック回帰モデルを生成する。ロジスティック回帰モデルは、入力パラメータに基づいて、ロジスティック回帰分析によって、予測結果を0または1に分類するための予測モデルである。本実施形態に係るロジスティック回帰モデルは、例えば、育成される単結晶が良の場合を0、不良の場合を1に分類するための予測モデルである。
【0046】
算出部123は、予測モデル生成部122によって生成された予測モデルの評価値を、育成結果データ30に含まれる判定結果と、予測モデルの予測結果と、に基づいて算出する。例えば、育成結果データ30に含まれる判定結果と、予測モデルの予測結果が近いほど、精度が高い予測モデルであるため、算出される評価値が高くなる。
【0047】
本実施形態に係る算出部123は、候補項目の値と、予測モデルの予測結果を示す値(予測値)と、の2乗誤差が小さくなるような偏回帰係数を用いた場合の尤度を、評価値として算出する。
【0048】
決定部124は、算出部123によって算出された評価値に基づいて、候補項目の組み合わせを、単結晶の育成工程における制御対象とすべきパラメータとして決定する。具体的には、決定部124は、算出部123によって複数の予測モデルの評価値を算出して、算出された評価値が高い予測モデルの入力パラメータとなった候補項目の組み合わせを、制御対象とすべきパラメータとして決定する。
【0049】
送信部15は、分析結果情報40を図示しない外部の装置に送信する。分析結果情報40は、決定部124によって決定された制御対象とすべきパラメータを含む。前述の通信インターフェース装置106は、送信部15の一例である。
【0050】
表示部16は、分析結果情報40を表示する。前述の表示装置105は、表示部16の一例である。
【0051】
送信部15および表示部16は、それぞれ、候補項目の組み合わせを制御対象とすべきパラメータとして出力する出力部として機能する。
【0052】
次に、情報処理システムの動作について、図面を参照して説明する。
【0053】
図4は、第一の実施形態に係るパラメータ選定処理の一例を示すフローチャートである。
【0054】
情報処理装置10は、受付部13がユーザからパラメータの選定を要求する指示を受けると、パラメータ選定処理を開始する。
【0055】
情報処理装置10がパラメータ選定処理を開始すると、情報処理装置10の取得部14は、測定項目の値と判定結果とが関連付けられたデータ、すなわち育成結果データ30を取得する(ステップS101)。
【0056】
図5は、育成結果データの一例を示す第一の図である。
【0057】
育成結果データ30は、項目として、「LotID」と、「測定項目」と、「判定結果」と、を含む。
【0058】
項目「LotID」の値は、生成された単結晶のロットを識別するための識別子である。なお、ロットとは同じ条件で生産される製品の最少単位を示す。したがって、同一の条件で育成された複数の単結晶は、すべて同一のロットに属する。
【0059】
項目「測定項目」の値は、具体的な測定項目ごとの測定値である。
【0060】
項目「判定結果」の値は、生成された単結晶の良不良を判定した結果である。
【0061】
育成結果データ30は、単結晶の育成工程で測定される測定項目の値と、単結晶の良不良の判定結果と、が関連付けられたデータである。例えば、図5に示される例では、測定項目(A,B,C,・・・,Q,R,・・・)の値である(10,u,0.1,・・・,1200,a,・・・)と、判定結果「○」と、が関連付けられている。また、測定項目(A,B,C,・・・,Q,R,・・・)の値である(1,b,0.8,・・・,980,c,・・・)と、判定結果「×」と、が関連付けられている。
【0062】
なお、これらの判定結果は、人によって判定された結果でも良いし、他の結晶の判定結果からコンピュータ等によって類推された結果でも良い。
【0063】
図6は、育成結果データの一例を示す第二の図である。
【0064】
育成結果データ30は、測定された複数の項目の演算結果を新たな測定項目として含んでも良い。
【0065】
例えば、育成結果データ30は、図6に示されるように、測定項目「C」の値と、測定項目「D」の値と、を加算した新たな測定項目「Y」を含み、測定項目「E」の値と、測定項目「F」の値と、を加算した新たな測定項目「Z」を含んでも良い。
【0066】
図4に戻り、次に、設定部121は、候補項目を設定する(ステップS102)。具体的には、設定部121は、設定情報111に設定された、測定項目ごとの属性を示す情報に基づいて、互いに異なる属性を有する測定項目を少なくとも一つ含む複数の測定項目の組み合わせを設定する。
【0067】
候補項目に設定する測定項目の数は、設定情報111に設定される。例えば、設定部121は、400個の測定項目から10個の測定項目をランダムに選択して、選択後にすべて同じ属性であった場合には、再度選択し直して、候補項目に設定する。
【0068】
あるいは、設定情報111には、属性ごとに候補項目に設定する測定項目の数が設定されていても良い。その場合、設定部121は、属性ごとに設定された数の測定項目の組み合わせを設定する。例えば、設定部121は、400個の測定項目から、温度の属性を有する4個の測定項目と、流量の属性を有する4個の測定項目と、時刻の属性を有する2個の測定項目と、をそれぞれランダムに選択して、候補項目に設定する。
【0069】
次に、予測モデル生成部122は、候補項目から良否を判定するためのロジスティック回帰モデルを生成する(ステップS103)。具体的には、予測モデル生成部122は、ステップS102で設定された候補項目の組み合わせのそれぞれの値を入力パラメータの特徴量とするロジスティック回帰モデルを生成する。生成されるロジスティック回帰モデルの出力値は、育成される単結晶が良の場合を0、不良の場合を1と分類した値である。
【0070】
ロジスティック回帰モデルの出力値yは、数1に示される式によって算出される。
【0071】
【数1】
【0072】
ここで、βは偏回帰係数で、xは入力パラメータの特徴量である。また、nは候補項目の数である。
【0073】
次に、算出部123は、候補項目の値と、ロジスティック回帰モデルの予測値と、の2乗誤差が小さくなるような偏回帰係数を用いた場合の尤度を算出する(ステップS104)。
【0074】
具体的には、偏回帰係数βの予測値は、数2によって表される。
【0075】
【数2】
【0076】
ここでは、yは、育成結果データ30に含まれる実際の判定結果であり、ypredは、予測結果である。そして、L1ノルムを拘束条件として、ロジスティック回帰モデルにL1正則化の手法を適用すると、損失関数は、数3に示される。
【0077】
【数3】
【0078】
ここで、λはラグランジュ乗数に相当する係数であり、0≦λ≦1である。係数λは、損失関数の罰則項λΣ|β|の罰則の強さを表す。
【0079】
算出部123は、これらの式を利用して、候補項目の値と、ロジスティック回帰モデルの予測値と、の2乗誤差が小さくなるような偏回帰係数βを用いた場合の尤度を算出する。
【0080】
次に、決定部124は、設定された候補項目から制御対象とすべきパラメータを仮決定する(ステップS105)。具体的には、決定部124は、予め設定情報111に設定された閾値Th1と、算出された尤度と、に基づいて、制御対象とすべきパラメータを仮決定する。閾値Th1はユーザによって決められている。
【0081】
例えば、決定部124は、係数λをパラメータ毎に比べた場合、係数λの大きさを変化させて、算出された尤度が最大になるようなλを用い、βの値が0以上の特徴量xの重要度を高くする。そして、決定部124は、重要度が閾値Th1以上の特徴量を複数選択する。
【0082】
また、λは0になる場合もあるため、決定部124は、λが0より大きい場合にβの値が大きくなる特徴量xをすべて選択しても良い。あるいは、決定部124は、βの値が大きくなる係数λの値を降順に並べて、上位複数の特徴量xを選択してもよい。
【0083】
そして、決定部124は、重要度が閾値Th1以上の特徴量を制御対象とすべきパラメータとして仮決定する。
【0084】
次に、情報処理装置10は、すべての測定項目を候補項目として設定したか否かを判定する(ステップS106)。情報処理装置10が、いずれかの測定項目を候補項目として設定していないと判定すると(ステップS106:No)、ステップS102に戻り、設定部121は、候補項目として設定していない測定項目の中から、候補項目を設定する。
【0085】
また、情報処理装置10が、すべての測定項目を候補項目として設定したと判定すると(ステップS106:Yes)、決定部124は、仮決定されたパラメータから制御対象とすべきパラメータを決定する(ステップS107)。
【0086】
具体的には、決定部124は、例えば、仮決定されたパラメータごとの重要度に基づいて順位付けをして、あらかじめ設定情報111に設定された個数のパラメータを、順位に基づいて決定しても良い。
【0087】
あるいは、情報処理装置10は、仮決定されたパラメータに相当する測定項目から、再度ステップS102からステップS106までの処理を実行して、さらにパラメータを選定することにより、設定された個数のパラメータを決定しても良い。
【0088】
設定するパラメータの個数は、設定情報111に設定されていなくても良い。例えば、ユーザによって都度指定されても良い。
【0089】
表示部16は、決定された制御対象とすべきパラメータを、分析結果情報40として表示する(ステップS108)。なお、送信部15は、決定された制御対象とすべきパラメータを示す分析結果情報40を、図示しない外部の装置に送信しても良い。
【0090】
本実施形態に係る情報処理システム1によれば、測定項目から制御対象の候補となる候補項目を設定し、機械学習の手法を繰り返し用いて制御対象とすべきパラメータを決定する。これによって、多くのパラメータの候補の中から制御対象とすべきパラメータを選定することができる。
【0091】
また、互いに異なる属性を有する複数の測定項目を、同列に扱うことによって、パラメータとしての有用性を比較することができる。
【0092】
(第二の実施形態)
以下に図面を参照して、第二の実施形態について説明する。第二の実施形態では、サポートベクターマシン(SVM;Support Vector Machine)による予測モデルを生成し、F1スコアを算出する点が、第一の実施形態と相違する。以下の第二の実施形態の説明では、第一の実施形態との相違点について説明し、第一の実施形態と同様の機能構成を有するものには、第一の実施形態の説明で用いた符号と同様の符号を付与し、その説明を省略する。
【0093】
図7は、第二の実施形態に係るパラメータ選定処理の一例を示すフローチャートである。
【0094】
本実施形態に係るパラメータ選定処理のステップS201およびステップS202は、第一の実施形態に係るパラメータ選定処理のステップS101およびステップS102と同じである。
【0095】
ステップS202に続いて、予測モデル生成部122は、候補項目から良否を判定するためのSVMによる予測モデルを生成する(ステップS203)。具体的には、予測モデル生成部122は、ステップS201で取得された育成結果データ30を訓練データとする機械学習によって、SVMによる予測モデルを生成する。生成されるSVMによる予測モデルの予測値は、育成される結晶の良不良を識別面によって識別した結果である。
【0096】
なお、算出部123は、育成結果データ30を訓練データとテストデータに分割して、分割された訓練データに基づいて学習しても良い。その場合、後述するステップS204においては、テストデータを使用して予測モデルを評価する。
【0097】
次に、算出部123は、予測モデルのF1スコアを算出する(ステップS204)。F1スコアとは、予測モデルの適合率(Precision)と再現率(Recall)から算出される予測モデルの精度を表す。具体的には、候補項目の値から単結晶の良否(OK/NG)を予測する場合に、予測では良品(OK)であったが、実際には不良品(NG)であった場合(表1;B)と、予測通り良品(OK)となる場合(表1;A)と、がある。同様に、予測では不良品(NG)であるが実際には良品(OK)となる場合(表1;C)と実際に不良品(NG)である場合(表1;D)があり得る。
【0098】
【表1】
【0099】
この場合に、OKと予測した総数(A+B)に対して実際にOK(A)であった確率Prは、予測モデルの適合率と呼ばれ、数4の式によって算出される。
【0100】
【数4】
【0101】
また、実際にOKであった総数(A+C)のうち、予測結果がOK(A)であった確率Reは、再現率と呼ばれ、数5の式によって算出される。
【0102】
【数5】
【0103】
適合率と再現率とは、いずれか一つだけでは正確な精度が評価できない場合があるため、両者の調和平均であるF1スコアを評価値として使用する。F1スコアは、数6の式によって算出される。
【0104】
【数6】
【0105】
算出部123は、上述の式によって、予測モデルを分析して、F1スコアを算出する。
【0106】
なお、不良品の数が、良品の数と比較して非常に少ない場合には、不良品を予測する適合率と再現率とを用いたF1スコアを評価値として使用しても良い。具体的には、NGと予測した総数(C+D)に対して実際にNG(D)であった確率Prは、予測モデルの適合率と呼ばれ、数7の式によって算出される。
【0107】
【数7】
【0108】
また、実際にNGであった総数(B+D)のうち、予測結果がNG(D)であった確率Reは、再現率と呼ばれ、数8の式によって算出される。
【0109】
【数8】
【0110】
そして、F1スコアは、数6の式によって算出される。
【0111】
なお、予測モデル生成部122および算出部123は、ステップS203およびステップS204において、K-分割交差検証を適用して、あらかじめ分割された訓練データとテストデータとをさらに入れ替えて、機械学習による予測モデルの更新と評価を繰り返し実行しても良い。このようにすれば、少ないサンプル数でも精度の高い評価ができる。
【0112】
次に、決定部124は、算出されたF1スコアが閾値Th2以上であるか否かを判定する(ステップS205)。閾値Th2は、あらかじめ設定情報111に設定された閾値であって、例えば、0.5である。なお、この0.5は、テストデータに含まれる良品と不良品との数の比に応じて、ランダムに良品と不良品とを分類した確率に相当する。
【0113】
決定部124は、算出されたF1スコアが閾値Th2以上であると判定すると(ステップS205:Yes)、設定された候補項目を制御対象とすべきパラメータとして仮決定する(ステップS206)。また、決定部124は、算出されたF1スコアが閾値Th2以上でないと判定すると(ステップS205:No)、ステップS206の処理をスキップする。
【0114】
次に、情報処理装置10は、すべての測定項目を候補項目として設定したか否かを判定する(ステップS207)。情報処理装置10が、いずれかの測定項目を候補項目として設定していないと判定すると(ステップS207:No)、ステップS202に戻り、設定部121は、候補項目として設定していない測定項目の中から、候補項目を設定する。
【0115】
また、情報処理装置10が、すべての測定項目を候補項目として設定したと判定すると(ステップS207:Yes)、決定部124は、仮決定されたパラメータから制御対象とすべきパラメータを決定する(ステップS208)。
【0116】
本実施形態に係るパラメータ選定処理のS208およびステップS209は、第一の実施形態に係るパラメータ選定処理のステップS107およびステップS108と同じである。
【0117】
本実施形態に係る予測モデルは、SVMである例を示したが、予測モデルの手法はこれに限られない。例えば、ランダムフォレスト、k近傍法、ロジスティック回帰、ニューラルネットワーク等でも良い。
【0118】
(第三の実施形態)
以下に図面を参照して、第三の実施形態について説明する。第三の実施形態は、第一の実施形態と第二の実施形態とを組み合わせた形態である。以下の第三の実施形態の説明では、第一の実施形態との相違点について説明し、第一の実施形態と同様の機能構成を有するものには、第一の実施形態の説明で用いた符号と同様の符号を付与し、その説明を省略する。
【0119】
図8は、第三の実施形態に係るパラメータ選定処理の一例を示すフローチャートである。
【0120】
本実施形態に係るパラメータ選定処理のステップS301からステップS307までは、第二の実施形態に係るパラメータ選定処理のステップS201からステップS207までと同じである。
【0121】
ステップS307の処理において、情報処理装置10が、すべての測定項目を候補項目として設定したと判定すると(ステップS307:Yes)、予測モデル生成部122は、候補項目から良否を判定するためのロジスティック回帰モデルを生成する(ステップS308)。
【0122】
次に、算出部123は、候補項目の値と、ロジスティック回帰モデルの予測値と、の2乗誤差が小さくなるような偏回帰係数を用いた場合の尤度を算出する(ステップS309)。
【0123】
次に、決定部124は、仮決定されたパラメータから制御対象とすべきパラメータを決定する(ステップS310)。そして、表示部16は、決定された制御対象とすべきパラメータを、分析結果情報40として表示する(ステップS311)。
【0124】
本実施形態に係る情報処理システム1によれば、SVMによる予測モデルを使用して1次解析を行い、さらにロジスティック回帰モデルを使用して2次解析を行う。これによって、制御対象とすべきパラメータの選定を高い精度で実行することができる。
【0125】
(第四の実施形態)
以下に図面を参照して、第四の実施形態について説明する。第四の実施形態では、決定されたパラメータに基づく学習モデルを生成して学習する点が、第三の実施形態と相違する。以下の第四の実施形態の説明では、第三の実施形態との相違点について説明し、第三の実施形態と同様の機能構成を有するものには、第三の実施形態の説明で用いた符号と同様の符号を付与し、その説明を省略する。
【0126】
図9は、第四の実施形態に係る情報処理装置の機能の一例を示す図である。
【0127】
本実施形態に係る情報処理装置10の制御部12は、学習モデル生成部125と、学習部126と、をさらに備える。
【0128】
学習モデル生成部125は、制御対象とすべきパラメータに基づく学習モデルを生成する。制御対象とすべきパラメータは、決定部124によって決定されたものである。
【0129】
学習部126は、学習モデル生成部125が生成した学習モデルを使用して、機械学習を行って、良品の単結晶を育成できるパラメータの値を決定する。
【0130】
図10は、第四の実施形態に係る機械学習処理の一例を示すフローチャートである。
【0131】
本実施形態に係る機械学習処理のステップS401からステップS410までの処理は、第三の実施形態に係るパラメータ選定処理のステップS301からステップS310までと同じである。
【0132】
ステップS410に続いて、学習モデル生成部125は、制御対象とすべきパラメータに基づく学習モデルを生成する(ステップS411)。制御対象とすべきパラメータは、ステップS410において決定部124によって決定されたものである。
【0133】
生成される学習モデルは、ロジスティック回帰モデルでも、SVMでも良く、ランダムフォレスト、k近傍法、ニューラルネットワーク等でも良い。すなわち、学習モデル生成部125は、予測モデル生成部122が生成した予測モデルと同様の学習モデルを生成しても良いし、全く別の学習モデルを生成しても良い。
【0134】
次に、学習部126は、生成された学習モデルを使用して、学習する(ステップS412)。具体的には、学習部126は、育成結果データ30を訓練データとして、機械学習によって、良品の単結晶を育成できるパラメータの値を決定する。決定するパラメータの値は、値の範囲によって指定されていても良い。
【0135】
次に、表示部16は、良品の単結晶を育成できるパラメータの値を、分析結果情報40として表示する(ステップS413)。なお、送信部15は、良品の単結晶を育成できるパラメータの値を示す分析結果情報40を、図示しない外部の装置に送信しても良い。
【0136】
本実施形態に係る情報処理システム1によれば、制御対象とすべきパラメータに基づく学習モデルを使用して、良品の単結晶を育成できるパラメータの値を示す情報を出力する。これによって、ユーザは、単結晶の育成条件を設定するための有用な情報を得ることができる。
【0137】
(第五の実施形態)
以下に図面を参照して、第五の実施形態について説明する。第五の実施形態では、F1スコアの変化率によって、データ数を増やす処理を実行する点が、第二の実施形態と相違する。以下の第五の実施形態の説明では、第二の実施形態との相違点について説明し、第二の実施形態と同様の機能構成を有するものには、第二の実施形態の説明で用いた符号と同様の符号を付与し、その説明を省略する。
【0138】
図11は、第五の実施形態に係るパラメータ選定処理の一例を示すフローチャートである。
【0139】
本実施形態に係るパラメータ選定処理のステップS501からステップS504までの処理は、第二の実施形態に係るパラメータ選定処理のステップS201からステップS204までの処理と同じである。
【0140】
ステップS504に続いて、算出部123は、テストデータのデータ数をk個増やして、F1スコアを算出する(ステップS504)。kは、設定情報111にあらかじめ設定された数値であって、例えば、100である。
【0141】
次に、決定部124は、直近で算出された2つのF1スコアの変化率を算出して、算出された変化率が閾値Th3より小さいか否かを判定する(ステップS506)。閾値Th3は、設定情報111にあらかじめ設定された閾値であって、例えば0.1である。
【0142】
決定部124が、F1スコアの変化率が閾値Th3より小さくないと判定すると(ステップS506:No)、ステップS505に戻り、さらにデータ数をk個増やして、F1スコアを算出する。
【0143】
また、決定部124が、F1スコアの変化率が閾値Th3より小さいと判定すると(ステップS506:Yes)、ステップS507の処理に進む。
【0144】
本実施形態に係るパラメータ選定処理のステップS507からステップS511までの処理は、第二の実施形態に係るパラメータ選定処理のステップS205からステップS209までの処理と同じである。
【0145】
本実施形態に係る情報処理システム1によれば、テストデータのデータ数の増加に対して、F1スコアの値の変化率が閾値Th3より小さくなるまで、テストデータのデータ数を増加する。これによって、十分な数のテストデータで予測モデルを精度良く評価することができる。
【0146】
上述した各実施形態では、単結晶の育成工程で測定される測定項目の値に基づいて、育成工程における制御対象とすべきパラメータを出力する例を示した。しかし、本発明の範囲はこれに限られない。単結晶は、製造の対象物の一例であって、他でも良い。また、育成工程は製造工程の一例であって、他でも良い。
【0147】
上述した各実施形態では、育成結果データ30に含まれる判定結果が良と不良の2値である例を示した。使用する予測モデルによっては、2値でなくても良い。例えば、製品の性能には問題ない程度だが、傷や汚れなど、製品に不要な要素が認められたものを、良「○」と不良「×」の間を示す「△」等として付け加えても良い。
【0148】
以上、各実施形態に基づき本発明の説明を行ってきたが、上記実施形態に示した要件に本発明が限定されるものではない。これらの点に関しては、本発明の主旨をそこなわない範囲で変更することができ、その応用形態に応じて適切に定めることができる。
【符号の説明】
【0149】
1 情報処理システム
10 情報処理装置
11 記憶部
12 制御部
13 受付部
14 取得部
15 送信部
16 表示部
20 育成管理データベース
30 育成結果データ
40 分析結果情報
111 設定情報
121 設定部
122 予測モデル生成部
123 算出部
124 決定部
図1
図2
図3
図4
図5
図6
図7
図8
図9
図10
図11