IP Force 特許公報掲載プロジェクト 2022.1.31 β版

知財求人 - 知財ポータルサイト「IP Force」

▶ 株式会社IHIの特許一覧

特開2023-165464機械学習モデル更新装置、機械学習モデル更新方法及び機械学習モデル更新プログラム
<>
  • 特開-機械学習モデル更新装置、機械学習モデル更新方法及び機械学習モデル更新プログラム 図1
  • 特開-機械学習モデル更新装置、機械学習モデル更新方法及び機械学習モデル更新プログラム 図2
  • 特開-機械学習モデル更新装置、機械学習モデル更新方法及び機械学習モデル更新プログラム 図3
  • 特開-機械学習モデル更新装置、機械学習モデル更新方法及び機械学習モデル更新プログラム 図4
  • 特開-機械学習モデル更新装置、機械学習モデル更新方法及び機械学習モデル更新プログラム 図5
  • 特開-機械学習モデル更新装置、機械学習モデル更新方法及び機械学習モデル更新プログラム 図6
< >
(19)【発行国】日本国特許庁(JP)
(12)【公報種別】公開特許公報(A)
(11)【公開番号】P2023165464
(43)【公開日】2023-11-16
(54)【発明の名称】機械学習モデル更新装置、機械学習モデル更新方法及び機械学習モデル更新プログラム
(51)【国際特許分類】
   G06N 20/00 20190101AFI20231109BHJP
【FI】
G06N20/00
【審査請求】未請求
【請求項の数】8
【出願形態】OL
(21)【出願番号】P 2022076480
(22)【出願日】2022-05-06
(71)【出願人】
【識別番号】000000099
【氏名又は名称】株式会社IHI
(74)【代理人】
【識別番号】100088155
【弁理士】
【氏名又は名称】長谷川 芳樹
(74)【代理人】
【識別番号】100113435
【弁理士】
【氏名又は名称】黒木 義樹
(74)【代理人】
【識別番号】100170818
【弁理士】
【氏名又は名称】小松 秀輝
(72)【発明者】
【氏名】斉藤 弘樹
(57)【要約】
【課題】学習モデルを更新するか否かの判断を適切に実行する。
【解決手段】機械学習モデル更新装置1は、運用データCを受ける入力手段11と、運用データCを構成するサンプルCSが、第1の学習モデルMの学習に用いた第1の学習データDの集合に内包されるか否かを評価する評価手段13と、評価手段13の結果を利用して第1の学習モデルMを第2の学習モデルMに更新するか否かの判定を行うための更新判定指標値θ1を得る算出手段14と、更新判定指標値θ1が更新条件を満たす場合に、第1の学習モデルMを第2の学習モデルMに更新する更新手段17と、を備える。
【選択図】図3
【特許請求の範囲】
【請求項1】
運用データを受ける入力手段と、
前記運用データを構成する要素が、第1の学習モデルの学習に用いた第1の学習データの集合に内包されるか否かを評価する評価手段と、
前記評価手段の結果を利用して前記第1の学習モデルを第2の学習モデルに更新するか否かの判定を行うための更新判定指標値を得る算出手段と、
前記更新判定指標値が更新条件を満たす場合に、前記第1の学習モデルを前記第2の学習モデルに更新する更新手段と、を備える機械学習モデル更新装置。
【請求項2】
前記更新手段は、
前記更新判定指標値を利用して前記第1の学習モデルを前記第2の学習モデルに更新するか否かを判定する更新判定手段と、
前記運用データを利用して前記第1の学習データを第2の学習データに更新する学習データ更新手段と、
前記第2の学習データを用いて前記第1の学習モデルを前記第2の学習モデルに更新する学習モデル更新手段と、を有する、請求項1に記載の機械学習モデル更新装置。
【請求項3】
前記評価手段は、前記要素ごとに前記第1の学習データの集合に内包されるか否かを評価した結果、前記要素が前記第1の学習データの集合に内包されない場合には、前記第1の学習データの集合に内包されないことを示すフラグを前記要素に付す、請求項1に記載の機械学習モデル更新装置。
【請求項4】
前記評価手段は、前記第1の学習データの集合から前記要素までの距離に基づいて内包されるか否かを評価する、請求項1に記載の機械学習モデル更新装置。
【請求項5】
前記算出手段は、前記運用データが含む前記要素の総数に対する前記フラグが付された前記要素の数の割合を、前記更新判定指標値として得る、請求項3に記載の機械学習モデル更新装置。
【請求項6】
前記更新条件は、閾値であり、
前記更新判定手段は、前記更新判定指標値が前記閾値を超えた場合に、前記第1の学習モデルを第2の学習モデルに更新すると判定する、請求項2に記載の機械学習モデル更新装置。
【請求項7】
運用データを受けるステップと、
前記運用データを構成する要素が、第1の学習モデルの学習に用いた第1の学習データの集合に内包されるか否かを評価するステップと、
前記評価することの結果を利用して前記第1の学習モデルを第2の学習モデルに更新するか否かの判定を行うための更新判定指標値を得るステップと、
前記更新判定指標値が更新条件を満たす場合に、前記第1の学習モデルを前記第2の学習モデルに更新するステップと、を含む機械学習モデル更新方法。
【請求項8】
運用データを受けるステップと、
前記運用データを構成する要素が、第1の学習モデルの学習に用いた第1の学習データの集合に内包されるか否かを評価するステップと、
前記評価することの結果を利用して前記第1の学習モデルを第2の学習モデルに更新するか否かの判定を行うための更新判定指標値を得るステップと、
前記更新判定指標値が更新条件を満たす場合に、前記第1の学習モデルを前記第2の学習モデルに更新するステップと、をコンピュータに実行させる、機械学習モデル更新プログラム。
【発明の詳細な説明】
【技術分野】
【0001】
本発明は、機械学習モデル更新装置、機械学習モデル更新方法及び機械学習モデル更新プログラムに関する。
【背景技術】
【0002】
機械学習を用いた推論装置は、推論の結果を改善するために学習モデルの更新を行う。例えば、推論に用いられる運用データを利用して学習モデルを更新するか否かの判断を行うことがある。特許文献1の装置は、複数のサンプルの集合である運用データを平均と分散とによって評価する。特許文献1の装置は、平均と分散とによる評価値を用いて、学習モデルを更新するか否かの判定を行う。
【0003】
例えば、特許文献1は、機械学習モデルを更新する機能を持った装置を開示する。この装置は、指標値の算出と、指標値の算出と、学習モデル更新と、をこの順に実行する。
【先行技術文献】
【特許文献】
【0004】
【特許文献1】特開2020-86778号公報
【発明の概要】
【発明が解決しようとする課題】
【0005】
運用データは、必ずしも正規分布に従うとは限らない。運用データが正規分布に従う場合には、平均と分散とによって複数のサンプルの集合を適切に評価できる。したがって、学習モデルを更新するか否かの判断を適切に実行できる。しかし、運用データが正規分布に従わない場合には、平均と分散とによって複数のサンプルの集合を適切に評価できない。その結果、学習モデルを更新するか否かの判断を適切に実行できないことが生じる。
【0006】
本発明は、学習モデルを更新するか否かの判断を適切に実行できる機械学習モデル更新装置、機械学習モデル更新方法及び機械学習モデル更新プログラムを提供する。
【課題を解決するための手段】
【0007】
本発明の一形態である機械学習モデル更新装置は、運用データを受ける入力手段と、運用データを構成する要素が、第1の学習モデルの学習に用いた第1の学習データの集合に内包されるか否かを評価する評価手段と、評価手段の結果を利用して第1の学習モデルを第2の学習モデルに更新するか否かの判定を行うための更新判定指標値を得る算出手段と、更新判定指標値が更新条件を満たす場合に、第1の学習モデルを第2の学習モデルに更新する更新手段と、を備える。
【0008】
機械学習モデル更新装置は、運用データを構成する要素ごとに、第1の学習モデルの学習に用いた第1の学習データの集合に内包されるか否かを、第1の学習モデルを第2の学習モデルに更新するか否かの条件として用いる。要素ごとに学習データの集合に内包されるか否を評価することによれば、運用データに含まれる要素の分布の態様に左右されることなく、更新の必要がある態様と更新の必要がない態様とを適切に判断できる。つまり、機械学習モデル更新装置は、学習モデルを更新するか否かの判断を適切に実行できる。
【0009】
上記の機械学習モデル更新装置の更新手段は、更新判定指標値を利用して第1の学習モデルを第2の学習モデルに更新するか否かを判定する更新判定手段と、運用データを利用して第1の学習データを第2の学習データに更新する学習データ更新手段と、第2の学習データを用いて第1の学習モデルを第2の学習モデルに更新する学習モデル更新手段と、を有してもよい。この構成によれば、第1の学習モデルを第2の学習モデルに好適に更新することができる。
【0010】
上記の機械学習モデル更新装置の評価手段は、要素ごとに第1の学習データの集合に内包されるか否かを評価した結果、要素が第1の学習データの集合に内包されない場合には、第1の学習データの集合に内包されないことを示すフラグを要素に付してもよい。この構成によれば、フラグの有無に基づく更新の判断を行うことが可能になる。
【0011】
上記の機械学習モデル更新装置の評価手段は、第1の学習データの集合から要素までの距離に基づいて内包されるか否かを評価してもよい。この構成によれば、フラグの有無に基づく更新の判断を行うことが可能になる。
【0012】
上記の機械学習モデル更新装置の算出手段は、運用データが含む要素の総数に対するフラグが付された要素の数の割合を、更新判定指標値として得てもよい。この構成によれば、更新の判断を容易に行うことが可能になる。
【0013】
上記の機械学習モデル更新装置における更新条件は、閾値であってもよい。更新判定手段は、更新判定指標値が閾値を超えた場合に、第1の学習モデルを第2の学習モデルに更新すると判定してもよい。この構成によれば、更新の判断をさらに容易に行うことが可能になる。
【0014】
本発明の別の形態である機械学習モデル更新方法は、運用データを受けるステップと、運用データを構成する要素が、第1の学習モデルの学習に用いた第1の学習データの集合に内包されるか否かを評価するステップと、評価することの結果を利用して第1の学習モデルを第2の学習モデルに更新するか否かの判定を行うための更新判定指標値を得るステップと、更新判定指標値が更新条件を満たす場合に、第1の学習モデルを第2の学習モデルに更新するステップと、を含む。機械学習モデル更新方法は、機械学習モデル更新装置と同様に、運用データに含まれる要素の分布の態様に左右されることなく、更新の必要がある態様と更新の必要がない態様とを適切に判断できる。
【0015】
本発明のさらに別の形態である機械学習モデル更新プログラムは、運用データを受けるステップと、運用データを構成する要素が、第1の学習モデルの学習に用いた第1の学習データの集合に内包されるか否かを評価するステップと、評価することの結果を利用して第1の学習モデルを第2の学習モデルに更新するか否かの判定を行うための更新判定指標値を得るステップと、更新判定指標値が更新条件を満たす場合に、第1の学習モデルを第2の学習モデルに更新するステップと、をコンピュータに実行させる。機械学習モデル更新プログラムも、機械学習モデル更新装置と同様に、運用データに含まれる要素の分布の態様に左右されることなく、更新の必要がある態様と更新の必要がない態様とを適切に判断できる。
【発明の効果】
【0016】
本発明の機械学習モデル更新装置、機械学習モデル更新方法及び機械学習モデル更新プログラムは、学習モデルを更新するか否かの判断を適切に実行できる。
【図面の簡単な説明】
【0017】
図1図1は、機械学習モデル更新装置が利用される様子を概略的に示す機能ブロック図である。
図2図2は、機械学習モデル更新装置を実現するコンピュータの構成図である。
図3図3は、機械学習モデル更新装置を含む情報提供装置の機能ブロック図である。
図4図4(a)は、更新前の学習データの一例である。図4(b)は、運用データの一例である。図4(c)は、判定する処理を説明するための概略図である。図4(d)は、更新後の学習データの一例である。
図5図5は、機械学習モデル更新装置が実行する機械学習モデル更新方法を含む情報提供処理のフローチャートである。
図6図6は、機械学習モデル更新装置が実行する機械学習モデル更新方法のフローチャートである。
【発明を実施するための形態】
【0018】
以下、添付図面を参照して、実施形態に係る機械学習モデル更新装置、機械学習モデル更新方法及び機械学習モデル更新プログラムを詳細に説明する。なお、図面の説明においては同一要素には同一符号を付し、重複する説明を省略する。
【0019】
図1は、機械学習モデル更新装置1の利用例を示す機能ブロック図である。機械学習モデル更新装置1は、例えば、対象設備201の監視又は制御に用いられる。対象設備201には、複数のセンサ202、203、204が設けられている。例えば、センサ202は、温度を計測する。センサ203は、圧力を計測する。センサ204は、流量を計測する。センサ202、203、204は、計測した値を情報提供装置100に出力する。
【0020】
センサ202、203、204から情報提供装置100に渡される情報を、「運用データC」と称する。つまり、運用データCは、時間と関連付けられた少なくとも1種類の計測値を含む。図1の例示では、運用データCは、温度と時間とが関連づけられたデータと、圧力と時間とが関連づけられたデータと、流量と時間とが関連づけられたデータと、を含む。さらに、例えば、温度と時間とが関連づけられたデータとは、ある時間に計測された温度の値を複数含む。つまり、データは、複数の数値を含む。これらの温度、流量及び圧力を示すひとつひとつの数値を、「サンプル」(要素)と称する。
【0021】
情報提供装置100は、運用データCを用いて、対象設備201に関する値を推論し、推論した結果を出力する。例えば、対象設備201に関する値は、対象設備201の稼働状況を監視するための値であってもよい。この場合には、情報提供装置100は、推論結果Rをディスプレイといった外部装置206に出力する。また、情報提供装置100は、推論結果Rを通信回線を通じて上流側の装置に送信してもよい。
【0022】
対象設備201に関する値は、対象設備201の監視に用いられるものに限定されない。対象設備201に関する値は、対象設備201の制御のための値であってもよい。この場合には、情報提供装置100は、推論結果Rをコントローラ205に出力する。コントローラ205は、推論結果Rを用いて制御信号Hを生成する。そして、コントローラ205は、制御信号Hを対象設備201に出力する。
【0023】
情報提供装置100は、機械学習モデル更新装置1と、記憶装置2と、推論装置3と、を有する。これらの機能ブロックは、コンピュータ300(図2参照)にて機械学習モデル更新プログラムPGを実行することによって実現される。
【0024】
機械学習モデル更新装置1は、いわゆる学習済みモデルを生成する。以下、学習済みモデルは、単に「学習モデルM」と称する。機械学習モデル更新装置1は、例えば、運用データCを利用して学習モデルMを生成する。機械学習モデル更新装置1が実行する学習モデルMの生成とは、最初の学習モデルMを生成する動作を含む。最初の学習モデルMを生成する動作は、例えば、学習フェーズと称する。さらに、機械学習モデル更新装置1が実行する学習モデルMの生成とは、既に生成された学習モデルMを更新することによって新たな学習モデルMを生成する動作も含む。学習モデルMを更新する動作は、例えば、更新フェーズと称する。機械学習モデル更新装置1は、生成した学習モデルMを記憶装置2に出力する。
【0025】
記憶装置2は、学習モデルMを記憶する。なお、記憶装置2は、学習モデルMとは別の様々な情報を記憶してよい。
【0026】
推論装置3は、学習モデルMと運用データCとを用いて、対象設備201に関する値を推論する。対象設備201に関する値を推論する動作は、推論フェーズと称する。推論装置3は、推論結果Rをコントローラ205や外部装置206に出力する。
【0027】
図2を参照して、機械学習モデル更新装置1のハードウェア構成について説明する。機械学習モデル更新装置1は、例えば、コンピュータ300によって機械学習モデル更新プログラムPGが実行されることによって実現される。機械学習モデル更新プログラムPGは、コンピュータ300に機械学習モデル更新方法を実行させるためのものである。
【0028】
機械学習モデル更新装置1は、1又は複数のコンピュータ300を含む。コンピュータ300は、プロセッサであるCPU(Central Processing Unit)301と、主記憶部302と、補助記憶部303と、通信制御部304と、入力装置305と、出力装置306とを有する。機械学習モデル更新装置1は、これらのハードウェアと、プログラム等のソフトウェアとにより構成された1又は複数のコンピュータ300によって構成される。
【0029】
機械学習モデル更新装置1が複数のコンピュータ300によって構成される場合には、これらのコンピュータ300はローカルで接続されてもよいし、インターネット又はイントラネットなどの通信ネットワークを介して接続されてもよい。この接続によって、論理的に1つの機械学習モデル更新装置1が構築される。
【0030】
CPU301は、オペレーティングシステムやアプリケーション・プログラムなどを実行する。主記憶部302は、ROM(Read Only Memory)およびRAM(Random Access Memory)により構成される。補助記憶部303は、ハードディスクおよびフラッシュメモリなどにより構成される記憶媒体である。補助記憶部303は、一般的に主記憶部302よりも大量のデータを記憶する。通信制御部304は、ネットワークカード又は無線通信モジュールにより構成される。入力装置305は、キーボード、マウス、タッチパネル、および、音声入力用マイクなどにより構成される。出力装置306は、ディスプレイおよびプリンタなどにより構成される。
【0031】
補助記憶部303は、予め、機械学習モデル更新プログラムPGおよび処理に必要なデータを格納している。機械学習モデル更新プログラムPGは、機械学習モデル更新装置1の各機能要素をコンピュータ300に実行させる。例えば、機械学習モデル更新プログラムPGは、CPU301又は主記憶部302によって読み込まれ、CPU301、主記憶部302、補助記憶部303、通信制御部304、入力装置305、および出力装置306の少なくとも1つを動作させる。例えば、機械学習モデル更新プログラムPGは、主記憶部302および補助記憶部303におけるデータの読み出しおよび書き込みを行う。
【0032】
機械学習モデル更新プログラムPGは、例えば、CD-ROM、DVD-ROM、半導体メモリなどの有形の記録媒体に記録された上で提供されてもよい。機械学習モデル更新プログラムPGは、データ信号として通信ネットワークを介して提供されてもよい。
【0033】
以下、機械学習モデル更新装置1について詳細に説明する。
【0034】
図3に示すように、機械学習モデル更新装置1は、いくつかの機能構成要素を含む。これらの機能構成要素は、コンピュータ300によって機械学習モデル更新プログラムPGが実行されることによってそれぞれ実現される。
【0035】
機械学習モデル更新装置1は、入力手段11と、学習モデル生成手段12と、評価手段13と、算出手段14と、更新判定手段15と、学習データ更新手段16と、を含む。そして、学習モデル生成手段12、更新判定手段15及び学習データ更新手段16は、更新手段17を構成する。なお、機械学習モデル更新装置1は、これらの機能構成要素とは別に、学習モデルMの更新に要する付加的な動作のための機能構成要素を必要に応じて備えてもよい。
【0036】
入力手段11は、情報提供装置100の外部から運用データCを受ける。入力手段11は、受けた運用データCを記憶装置2に渡す。記憶装置2は、運用データCを記憶する。入力手段11は、例えば、図2に示す通信制御部304又は入力装置305に対応してよい。入力手段11は、運用データCになんらのデータ処理を施すことなく、運用データCを記憶装置2に渡してもよい。また、入力手段11は、運用データCになんらかのデータ処理を施した後に、データ処理が施された運用データCを記憶装置2に渡してもよい。
【0037】
学習モデル生成手段12は、学習モデルMを生成する。学習モデル生成手段12は、記憶装置2から学習データDを受ける。学習モデル生成手段12は、学習データDを利用して学習を行う。そして、学習モデル生成手段12は、学習が終了した学習モデルMを記憶装置に渡す。学習モデル生成手段12は、新たな学習モデルMを生成することもできるし、既に記憶装置2に記憶されている学習モデルMを元にして新たな学習モデルMを生成することもできる。つまり、学習モデル生成手段12は、後述する学習データ更新手段16によって更新された学習データDを教師データとすることによって、更新された学習モデルMを得ることができる。従って、学習モデル生成手段12は、請求項に記載する学習モデル更新手段としても機能する。
【0038】
学習モデルMとしては、種々のモデルを採用することができる。例えば、学習モデルMとして、ニューラルネットワークモデルを採用してもよい。また、学習モデルMとして、決定木モデルを採用してもよい。本実施形態の機械学習モデル更新装置1では、学習データDに運用データCのサンプルが内包されるか否かを評価した結果を用いて学習モデルMの更新するか否かを判断している。このような判断において、決定木モデルは、相性がよい。
【0039】
評価手段13は、運用データCを構成するサンプルにフラグ付けを行う。評価手段13は、記憶装置2から学習データDと運用データCとを受ける。このときに評価手段13が記憶装置2から受ける学習データDは、今現在利用されている学習モデルMの生成に利用されたものである。さらに、評価手段13が記憶装置2から受ける運用データCは、今現在行われている推論処理に利用されたものであってよい。つまり、評価手段13が受ける学習データDは、評価手段13が受ける運用データCよりも時間的に過去のものであってもよい。
【0040】
評価手段13は、運用データCを構成するサンプルCS(図4(b)参照)が、学習データDの集合(図4(a)参照)に内包されるか否かを評価する。具体的には、評価手段13は、運用データCを構成する一つのサンプルCSを選択し、選択されたサンプルCSが学習データDの集合に内包されるか否かを評価する。つまり、評価手段13は、サンプルCSをひとつづつについて学習データDの集合に内包されるか否かを評価する(図4(c)参照)。従って、原理的には、運用データCに含まれるサンプルCSの数は、複数である必要なく、サンプルCSの数は1つであってもよい。サンプルの集合について、その集合の特性をよく表す平均や分散などの評価値を得るためには、十分な数のサンプルが必要である。しかし、評価手段13は、サンプルCSをひとつづつ処理するので、サンプルCSの数は必ずしも複数である必要はない。
【0041】
集合に内包されるか否かの評価には、種々の外れ値検知のアルゴリズムを用いてよい。外れ値検知のアルゴリズムとしては、例えば、局所外れ値因子法(Local Outlier Factor:LOF)、k近傍法(K Nearest Neighbor:kNN)が例示できる。これらの外れ値検知のアルゴリズムは、距離に基づいた検知手法である。なお、評価手段13が採用する外れ値検知は、必ずしも距離に基づいた検知手法である必要はない。例えば、評価手段13は、ニューラルネットワークを用いてサンプルCSが学習データDの集合に内包されるか否かを評価してもよい。
【0042】
評価手段13は、サンプルCSが学習データDの集合に内包されると評価した場合には、そのサンプルCSに学習データDの集合に内包されることを示す内包フラグを付す。例えば、学習データDの集合に内包されることを示す内包フラグとは、「0」という数値によって示してよい。
【0043】
評価手段13は、サンプルCSが学習データDの集合に内包されないと評価した場合には、そのサンプルCSに学習データDの集合に内包されないことを示す内包フラグを付す。例えば、学習データDの集合に内包されないことを示す内包フラグとは、「1」という数値によって示してよい。なお、評価手段13は、学習データDの集合に内包されないと評価したサンプルCSにのみ内包フラグを付してもよい。
【0044】
評価手段13は、内包フラグが付されたサンプルを含むフラグ付き運用データCFを算出手段14に渡す。
【0045】
算出手段14は、評価手段13からフラグ付き運用データCFを受ける。算出手段14は、フラグ付き運用データCFを用いて更新判定指標値θ1を得る。更新判定指標値θ1は、例えば、内包フラグ(1:学習データDの集合に内包されない)が付されたサンプルの数であってもよい。また、更新判定指標値θ1は、例えば、フラグ付き運用データCFが含むサンプルの総数に対する内包フラグ(1:学習データDの集合に内包されない)が付されたサンプルの割合であってもよい。算出手段14は、更新判定指標値θ1を更新判定手段15に渡す。
【0046】
更新判定手段15は、算出手段14から更新判定指標値θ1を受ける。更新判定手段15は、更新判定指標値θ1が更新条件を満たすか否を判定する。更新条件は、閾値であってもよい。例えば、更新判定手段15は、更新判定指標値θ1が総サンプル数に対する内包フラグ(1)が付されたサンプルの割合であるとき、その割合が予め定めた所定の数値よりも大きい場合(更新条件を満たす場合)に、学習モデルMを更新すると判定してよい。更新判定手段15は、更新条件を満たさない場合に、学習モデルMを更新しないと判定してよい。更新判定手段15は、判定結果θ2を学習データ更新手段16に渡す。
【0047】
学習データ更新手段16は、更新判定手段15から判定結果θ2を受ける。学習データ更新手段16は、更新判定指標値θ1が更新条件を満たす旨の判定結果θ2を受けたとき、学習データDを更新する。具体的には、学習データ更新手段16は、記憶装置2から学習データDと、運用データCと、を受ける。学習データ更新手段16は、運用データCを利用して学習データDを更新する。そして、学習データ更新手段16は、更新した学習データDを記憶装置2に渡す。
【0048】
学習データDを更新する手法には、特に制限はない。例えば、現在の学習データDに対して、内包フラグ(1:学習データDの集合に内包されない)が付されたサンプルCSのみを追加することによって、更新された学習データDを得てもよい。また、現在の学習データDに対して、内包フラグの内容を問わず、内包フラグが付された全てのサンプルを現在の学習データDに対して追加することによって、更新された学習データDを得てもよい(図4(d)参照)。
【0049】
次に、図5及び図6に示すフローチャートを参照しながら、機械学習モデル更新方法について説明する。
【0050】
まず、図5に示すように、第1の運用データCを受ける(ステップS1)。ステップS1は、入力手段11が実行する。次に、第1の運用データCを用いて第1の学習モデルMを得る(ステップS2)。ステップS2は、学習モデル生成手段12が実行する。このステップS1、S2は、いわゆる学習フェーズである。次に、第2の運用データCを受ける(ステップS3)。ステップS3は、入力手段11が実行する。そして、第2の運用データCと第1の学習モデルMとを用いて推論結果Rを得る(ステップS4)。ステップS4は、推論装置3が実行する。このステップS4は、いわゆる推論フェーズである。
【0051】
ここで、機械学習モデル更新方法(ステップS5)は、第2の運用データCを用いる。そこで、機械学習モデル更新方法は、推論フェーズが終了した後に行ってもよい。なお、機械学習モデル更新方法は、推論フェーズと並行して行ってもよい。機械学習モデル更新方法(ステップS5)の後に、第3の運用データCを受ける(ステップS6、ステップS7)。そして、第2の推論フェーズでは、機械学習モデル更新方法(ステップS5)の実行結果に応じて、更新された第2の学習モデルMを用いる処理(ステップS8)又は更新されない第1の学習モデルMを用いる処理(ステップS9)の何れかが実行される。
【0052】
以下、図6を参照しながら、機械学習モデル更新方法について詳細に説明する。いま、記憶装置2には、第1の学習データDと、第1の学習モデルMとが記憶されているとする。
【0053】
まず、第2の運用データCを受ける(ステップS51)。ステップS51は、入力手段11が実行する。次に、評価処理を実行する。評価処理は、評価手段13が実行する。具体的には、運用データCがM個のサンプルを含むとき、第m番目のサンプルCSについて第1の学習データDの集合に内包されるか否かを評価する(ステップS52)。内包される場合には(ステップS52:YES)、第mのサンプルに内包フラグ(0)を付す(ステップS53)。内包されない場合には(ステップS52:NO)、第mのサンプルに内包フラグ(1)を付す(ステップS54)。次に、全てのサンプルCSについて内包フラグを付したか否かを判定する(ステップS55)。全てのサンプルCSについて内包フラグを付していない場合には(ステップS55:NO)、再びステップS52を実行する。全てのサンプルCSについて内包フラグを付した場合には(ステップS55:YES)、次のステップS56を実行する。以上のステップS52~S55は、評価処理を構成する。
【0054】
更新判定指標値θ1を得る(ステップS56)。ステップS56は、算出手段14が実行する。次に、更新判定指標値θ1が更新条件を満たすか否かを判定する(ステップS57)。ステップS57は、更新判定手段15が実行する。
【0055】
更新判定指標値θ1が更新条件を満たさない場合には(ステップS57:NO)、学習データDを更新しない。この場合には、機械学習モデル更新の処理を終了する。その後、図5に示すステップS7及びステップS9が実行される。
【0056】
更新判定指標値θ1が更新条件を満たす場合には(ステップS57:YES)、第1の学習データDを更新することによって第2の学習データDを得る(ステップS58)。続いて、第2の学習データDを用いて第2の学習モデルMを得る(ステップS59)。ステップS59は、学習モデル生成手段12が実行する。その後、機械学習モデル更新の処理(ステップS5)を終了する。その後、図5に示すステップS6及びステップS8が実行される。
【0057】
機械学習モデル更新装置1は、運用データCを受ける入力手段11と、運用データCを構成するサンプルCSが、第1の学習モデルMの学習に用いた第1の学習データDの集合に内包されるか否かを評価する評価手段13と、評価手段13の結果を利用して第1の学習モデルMを更新するか否かの決定を行うための更新判定指標値θ1を得る算出手段14と、更新判定指標値θ1が更新条件を満たす場合に、第1の学習モデルMを第2の学習モデルMに更新する更新手段17と、を備える。
【0058】
機械学習モデル更新装置1は、運用データCを構成するサンプルCSごとに、第1の学習モデルMの学習に用いた第1の学習データDの集合に内包されるか否かを、第1の学習モデルMを第2の学習モデルMに更新するか否かの条件として用いる。サンプルCSごとに学習データMの集合に内包されるか否を評価することによれば、運用データCに含まれるサンプルCSの分布の態様に左右されることなく、更新の必要がある態様と更新の必要がない態様とを適切に判断できる。つまり、機械学習モデル更新装置1は、学習モデルMを更新するか否かの判断を適切に実行できる。
【0059】
上記の機械学習モデル更新装置1の更新手段17は、更新判定指標値θ1を利用して第1の学習モデルMを更新するか否かを決定する更新判定手段15と、運用データCを利用して第1の学習データDを第2の学習データMに更新する学習データ更新手段16と、第2の学習データDを用いて第1の学習モデルMを第2の学習モデルMに更新する学習モデル生成手段12と、を有する。この構成によれば、第1の学習モデルMを第2の学習モデルMに好適に更新することができる。
【0060】
上記の機械学習モデル更新装置1の評価手段13は、運用データCを構成するサンプルCSごとに第1の学習データMの集合に内包されるか否かを評価した結果、運用データCを構成するサンプルCSが第1の学習データDの集合に内包されない場合には、第1の学習データDの集合に内包されないことを示す内包フラグ(1)をサンプルCSに付す。この構成によれば、内包フラグの有無に基づく更新の判断を行うことが可能になる。
【0061】
上記の機械学習モデル更新装置1の評価手段13は、第1の学習データDの集合からサンプルCSまでの距離に基づいて内包されるか否かを評価する。この構成によれば、内包フラグの有無に基づく更新の判断を行うことが可能になる。
【0062】
上記の機械学習モデル更新装置1の算出手段14は、運用データCが含むサンプルCSの総数に対する内包フラグ(1)が付されたサンプルCSの数の割合を、更新判定指標値θ1として得る。この構成によれば、更新の判断を容易に行うことが可能になる。
【0063】
上記の機械学習モデル更新装置1において更新条件は、閾値である。更新判定手段15は、更新判定指標値θ1が閾値を超えた場合に、第1の学習モデルMを更新すると決定する。この構成によれば、更新の判断をさらに容易に行うことが可能になる。
【0064】
本発明の機械学習モデル更新装置、機械学習モデル更新方法及び機械学習モデル更新プログラムは、上述した実施形態に限定されない。
【0065】
算出手段14は、フラグ付き運用データCFに付された内包フラグの内容を利用して、更新判定指標値θ1を得た。具体的には、実施形態の算出手段14は、「内包する:0」又は「内包しない:1」の2値によって示される情報を用いて、更新判定指標値θ1を得た。評価手段13は、内包フラグを決定するための内部処理においていくつかの値を生成する。例えば、評価手段13は、「内包する:0」又は「内包しない:1」の判定結果を得るために、内部パラメータとして連続値で示されるスコアを用いる。評価手段13は、スコアが所定の数値より小さい場合には、「内包する:0」と判定する。評価手段13は、スコアが所定の数値より大きい場合には、「内包しない:1」と判定する。評価手段13は、「0」又は「1」で示される内包フラグに加えて、サンプルに対してスコアを付すことによりスコア付き運用データを出力してもよい。そして、算出手段14は、当該スコアを用いて更新判定指標値θ1を得てもよい。
【0066】
運用データCには特に制限はない。例えば、運用データCは、一日(24時間)に得られたデータであってもよい。運用データCは、一週間(24時間×7日)に得られたデータであってもよい。
【符号の説明】
【0067】
1 機械学習モデル更新装置
11 入力手段
12 学習モデル生成手段(学習モデル更新手段)
13 評価手段
14 算出手段
15 更新判定手段
16 学習データ更新手段
17 更新手段
C 運用データ
D 学習データ
M 学習モデル
R 推論結果
図1
図2
図3
図4
図5
図6