IP Force 特許公報掲載プロジェクト 2022.1.31 β版

知財求人 - 知財ポータルサイト「IP Force」

▶ 株式会社IHIの特許一覧

特開2024-20743推論装置、推論システム、及び推論方法
<>
  • 特開-推論装置、推論システム、及び推論方法 図1
  • 特開-推論装置、推論システム、及び推論方法 図2
  • 特開-推論装置、推論システム、及び推論方法 図3
  • 特開-推論装置、推論システム、及び推論方法 図4
  • 特開-推論装置、推論システム、及び推論方法 図5
  • 特開-推論装置、推論システム、及び推論方法 図6
< >
(19)【発行国】日本国特許庁(JP)
(12)【公報種別】公開特許公報(A)
(11)【公開番号】P2024020743
(43)【公開日】2024-02-15
(54)【発明の名称】推論装置、推論システム、及び推論方法
(51)【国際特許分類】
   G06N 20/00 20190101AFI20240207BHJP
【FI】
G06N20/00 130
【審査請求】未請求
【請求項の数】7
【出願形態】OL
(21)【出願番号】P 2022123163
(22)【出願日】2022-08-02
(71)【出願人】
【識別番号】000000099
【氏名又は名称】株式会社IHI
(74)【代理人】
【識別番号】100088155
【弁理士】
【氏名又は名称】長谷川 芳樹
(74)【代理人】
【識別番号】100113435
【弁理士】
【氏名又は名称】黒木 義樹
(74)【代理人】
【識別番号】100170818
【弁理士】
【氏名又は名称】小松 秀輝
(74)【代理人】
【識別番号】100124800
【弁理士】
【氏名又は名称】諏澤 勇司
(72)【発明者】
【氏名】伊藤 拓海
(57)【要約】
【課題】学習モデルのパラメータを機械学習によって効率よく更新すること。
【解決手段】推論装置3は、入力情報を基に機械学習の学習モデルを用いて推論結果を生成する推論部302と、学習モデルの複数のパラメータを教師データを用いた機械学習によって更新する学習部301と、を備え、学習部301は、学習モデルに関するデータ及び教師データを記憶する記憶部306,307と、外部の推論装置3から複数のパラメータのうちの一部のパラメータを受信するパラメータ受信部303と、一部のパラメータを記憶部307内の学習モデルに関するデータに反映するとともに、記憶部307に記憶された学習モデルの複数のパラメータを、記憶部306に記憶された教師データを用いて更新する学習演算部304と、更新された複数のパラメータのうちからランダムに選択された他部のパラメータを、外部の推論装置3に送信するパラメータ送信部305と、を含む。
【選択図】図2
【特許請求の範囲】
【請求項1】
外部からの入力情報を基に機械学習の学習モデルを用いて推論結果を生成する推論部と、
前記学習モデルの複数のパラメータを教師データを用いた機械学習によって更新する学習部と、を備え、
前記学習部は、
前記学習モデルに関するデータ及び前記教師データを記憶する記憶部と、
外部の推論装置から前記複数のパラメータのうちの一部のパラメータを受信するパラメータ受信部と、
前記一部のパラメータを前記記憶部内の前記学習モデルに関するデータに反映するとともに、前記記憶部に記憶された前記学習モデルによって特定される前記学習モデルの前記複数のパラメータを、前記記憶部に記憶された前記教師データを用いて更新する学習演算部と、
前記学習演算部によって更新された前記複数のパラメータのうちからランダムに選択された他部のパラメータを、外部の推論装置に送信するパラメータ送信部と、
を含む、推論装置。
【請求項2】
前記学習演算部は、前記学習演算部による前記教師データを用いた1エポックごとの機械学習処理の前に前記一部のパラメータを反映する、
請求項1に記載の推論装置。
【請求項3】
前記パラメータ送信部は、前記学習演算部による前記教師データを用いた1エポックごとの機械学習処理の後に選択された前記他部のパラメータを送信する、
請求項1又は2に記載の推論装置。
【請求項4】
前記学習演算部は、前記一部のパラメータを反映した前記学習モデルの推論精度が反映前後で向上する場合に、前記一部のパラメータを前記記憶部内の前記学習モデルに関するデータに反映する、
請求項1又は2に記載の推論装置。
【請求項5】
前記推論部による前記推論結果に基づいて外部装置を制御する制御部をさらに備える、
請求項1又は2に記載の推論装置。
【請求項6】
請求項1又は2に記載の推論装置を複数備え、
前記複数の推論装置は、互いにデータを送受信可能にネットワークを介して接続され、前記ネットワークを介して、互いに前記一部のパラメータあるいは前記他部のパラメータを送受信する、
推論システム。
【請求項7】
外部からの入力情報を基に機械学習の学習モデルを用いて推論結果を生成する推論部と、
前記学習モデルの複数のパラメータを教師データを用いた機械学習によって更新する学習部と、を備えた推論装置を用いた推論方法であって、
前記学習部が、前記学習モデルに関するデータ及び前記教師データを記憶部内に記憶し、
前記学習部が、外部の推論装置から前記複数のパラメータのうちの一部のパラメータを受信して、前記一部のパラメータを前記記憶部内の前記学習モデルに関するデータに反映し、
前記学習部が、記憶した前記学習モデルによって特定される前記学習モデルの前記複数のパラメータを、記憶した前記教師データを用いて更新し、
前記学習部が、更新した前記複数のパラメータのうちからランダムに選択された他部のパラメータを、外部の推論装置に送信する、
推論方法。
【発明の詳細な説明】
【技術分野】
【0001】
本開示は、推論情報を生成する推論装置、推論システム、及び推論方法に関するものである。
【背景技術】
【0002】
従来から、機械学習によって構築された学習モデルを用いて推論結果を生成する装置が知られている。例えば、特許文献1には、学習モデルを生成する学習部と、出力データを推定する推定部を備える機械学習モデル構築装置が記載されている。また、下記特許文献2には、学習モデルをクラウド側からダウンロードして適用するエッジサーバにおいて、ダウンロードした学習モデルの新バージョンに基づく新学習データおよび旧バージョンに基づく旧学習データと、教師データを比較・検証し、その結果に基づき適した新旧バージョンの一方を決定する技術が記載されている。また、下記特許文献3には、マスターエッジおよび計算エッジを含むL-DNNアーキテクチャが記載され、各デバイスが低速学習モジュールおよび高速学習モジュールを備え、オンデバイスでの学習を使用することが記載されている。
【先行技術文献】
【特許文献】
【0003】
【特許文献1】特開2020-86778号公報
【特許文献2】特開2019-139734号公報
【特許文献3】特開2020-520007号公報
【発明の概要】
【発明が解決しようとする課題】
【0004】
しかしながら、上述した特許文献1~3に記載の技術では、学習モデルを、推論部を備える装置内で生成するか、クラウド内で生成している。そのため、複数の推論装置において共通の構成の学習モデルを用いて推論結果を生成するシステムが構築された場合に、学習モデルのパラメータを機械学習によって効率よく更新することが困難である。
【0005】
そこで、本開示は、かかる課題に鑑みて為されたものであり、複数の推論装置を含むシステムが構築された場合に、学習モデルのパラメータを機械学習によって効率よく更新することができる推論装置を提供することを目的とする。
【課題を解決するための手段】
【0006】
上記課題を解決するため、本開示の一側面に係る推論装置は、外部からの入力情報を基に機械学習の学習モデルを用いて推論結果を生成する推論部と、学習モデルの複数のパラメータを教師データを用いた機械学習によって更新する学習部と、を備え、学習部は、学習モデルに関するデータ及び教師データを記憶する記憶部と、外部の推論装置から複数のパラメータのうちの一部のパラメータを受信するパラメータ受信部と、一部のパラメータを記憶部内の学習モデルに関するデータに反映するとともに、記憶部に記憶された学習モデルによって特定される学習モデルの複数のパラメータを、記憶部に記憶された教師データを用いて更新する学習演算部と、学習演算部によって更新された複数のパラメータのうちからランダムに選択された他部のパラメータを、外部の推論装置に送信するパラメータ送信部と、を含む。
【0007】
あるいは、本開示の他側面に係る推論方法は、外部からの入力情報を基に機械学習の学習モデルを用いて推論結果を生成する推論部と、学習モデルの複数のパラメータを教師データを用いた機械学習によって更新する学習部と、を備えた推論装置を用いた推論方法であって、学習部が、学習モデルに関するデータ及び教師データを記憶部内に記憶し、学習部が、外部の推論装置から複数のパラメータのうちの一部のパラメータを受信して、一部のパラメータを記憶部内の学習モデルに関するデータに反映し、学習部が、記憶した学習モデルによって特定される学習モデルの複数のパラメータを、記憶した教師データを用いて更新し、学習部が、更新した複数のパラメータのうちからランダムに選択された他部のパラメータを、外部の推論装置に送信する。
【0008】
上記一側面あるいは上記他側面によれば、推論装置内に、入力情報を基に推論結果を生成する推論部と、学習モデルの複数のパラメータを更新する学習部とが備えられ、学習部は、複数のパラメータのうちの一部のパラメータを外部の推論装置から受信して学習モデルに反映し、その学習モデルの複数のパラメータを教師データを用いた機械学習によって更新し、更新した複数のパラメータから他部のパラメータをランダムに選択して送信する。これにより、複数の推論装置を含むシステムを構築した場合に、複数の推論装置の間で学習モデルの複数のパラメータを選択的に相互に交換しながら、複数の推論装置ごとに、学習モデルを教師データを用いた機械学習によって構築できる。これにより、同一構成の学習モデルを用いる複数の推論装置において、学習モデルのパラメータを機械学習によって効率よく更新することができる。
【0009】
あるいは、本開示のさらなる他側面に係る推論システムは、上記推論装置を複数備え、上記複数の推論装置は、互いにデータを送受信可能にネットワークを介して接続され、ネットワークを介して、互いに一部のパラメータあるいは他部のパラメータを送受信する。
【0010】
上記のさらなる他側面によれば、複数の推論装置の間で学習モデルの複数のパラメータを、ネットワークを介して、選択的に相互に交換しながら、複数の推論装置ごとに、学習モデルを教師データを用いた機械学習によって構築できる。これにより、推論システム内で同一構成の学習モデルを用いる複数の推論装置において、学習モデルのパラメータを機械学習によって効率よく更新することができる。
【0011】
上記一側面においては、学習演算部は、学習演算部による教師データを用いた1エポックごとの機械学習処理の前に一部のパラメータを反映してもよい。
【0012】
かかる構成を採れば、教師データを用いた機械学習処理において、外部の推論装置によって更新された一部のパラメータを更新した後に複数のパラメータを更新でき、推論精度が高められた学習モデルを効率よく構築することができる。
【0013】
また、上記一側面においては、パラメータ送信部は、学習演算部による教師データを用いた1エポックごとの機械学習処理の後に選択された他部のパラメータを送信してもよい。
【0014】
この場合、外部の推論装置における教師データを用いた機械学習処理において、自己の推論装置によって更新された一部のパラメータを更新させた後に複数のパラメータを更新させることができ、外部の推論装置において推論精度が高められた学習モデルを効率よく構築することができる。
【0015】
また、上記一側面においては、学習演算部は、一部のパラメータを反映した学習モデルの推論精度が反映前後で向上する場合に、一部のパラメータを記憶部内の学習モデルに関するデータに反映してもよい。
【0016】
この場合、教師データを用いた機械学習処理において、外部の推論装置によって更新された一部のパラメータを、推論精度が向上する場合に更新するので、推論精度が高められた学習モデルをより効率よく構築することができる。
【0017】
また、上記一側面においては、推論部による推論結果に基づいて外部装置を制御する制御部をさらに備えてもよい。この場合、精度の高められた推論結果を基に外部装置を制御することができ、外部装置を適切に制御することができる。
【発明の効果】
【0018】
本開示によれば、複数の推論装置を含むシステムが構築された場合に、学習モデルのパラメータを機械学習によって効率よく更新することができる。
【図面の簡単な説明】
【0019】
図1】本開示の好適な一実施形態に係る推論システムの構成概略図である。
図2図1の推論装置の機能構成を示すブロック図である。
図3】推論システムの構成例を示すブロック図である。
図4】推論システムにおけるパラメータの反映のイメージを示す図である。
図5】本実施形態におけるトレーニング処理の手順を示すフローチャートである。
図6】本実施形態における推論処理の手順を示すフローチャートである。
【発明を実施するための形態】
【0020】
以下、添付図面を参照して本発明の実施形態を詳細に説明する。なお、図面の説明において同一又は相当要素には同一の符号を付し、重複する説明を省略する。
【0021】
図1は、本開示の一実施形態に係る推論システム1の構成概略図である。同図に示される推論システム1は、複数の推論装置を用いて、ある対象物を撮像した画像を基に対象物に関する推論結果を生成し、複数の推論装置による推論結果を基に外部装置を制御するコンピュータシステムである。複数の推論装置が生成する推論結果としては、対象物の種類、対象物の位置座標、あるいは、対象物の大きさ、等が挙げられる。外部装置の制御内容としては、アクチュエータの動作タイミング、アクチュエータの動作方向、あるいは、アクチュエータの動作速度等の制御が挙げられる。推論システム1の設置環境としては、工場における製造ライン、河川の沿岸、重機械の周囲、あるいは、道路の周辺、等の対象物である動体が存在する環境が挙げられる。
【0022】
推論システム1は、分散配置された複数の推論装置3を含む。これらの複数の推論装置3は、それぞれ、少なくとも1つの他の推論装置3(本実施形態では少なくとも3つの推論装置3)との間で、通信ネットワークNWを介してピアツーピア(P2P)でデータ通信が可能に接続されている。複数の推論装置3は、通信ネットワークNWとして、有線通信ネットワークを用いてもよいし、無線通信ネットワークを用いてもよい。複数の推論装置3は、後述するように、学習モデルの一部のパラメータあるいは他部のパラメータを送受信する。
【0023】
図2は、複数の推論装置3のそれぞれの機能構成を示すブロック図である。それぞれの推論装置3は、物理的には、1又は複数のCPU(あるいはGPU)と、RAM及びROM等の主記憶装置と、外部との間でデータを送受信するデータ送受信デバイスである通信モジュールと、半導体メモリ及びハードディスク装置等の補助記憶装置と、マウス、タッチパネル及びキーボード等の入力デバイスと、ディスプレイ及びスピーカ等の出力デバイスとを含むコンピュータシステムとして構成されている。また、それぞれの推論装置3には、カメラ、各種センサ(距離センサなど)等のセンシングデバイス5が電気的に接続されている。センシングデバイス5は、推論装置3の制御によって対象物に関する検出データ(撮像画像データ、距離データ等)を取得する。さらに、それぞれの推論装置3には、外部装置を制御するための操作用コントローラ等の制御装置7も電気的に接続されている。図2に示す推論装置3の各機能は、CPU、GPU、RAM等のハードウェア上に1又は複数の所定のコンピュータソフトウェアを読み込ませることにより、CPU、GPUの制御のもとで通信モジュール、入力デバイス、および出力デバイスを動作させるとともに、RAMや補助記憶装置におけるデータの読み出し及び書き込みを行うことで実現される。ただし、それぞれの推論装置は、1台のコンピュータによって構成されていてもよいし、2台以上のコンピュータによって構成されていてもよく、例えば、後述する学習部の機能と推論部の機能とが別々のコンピュータによって実現されてもよい。
【0024】
推論装置3は、機能的には、学習部301と推論部302とを備え、学習部301は、パラメータ受信部303、学習演算部304、パラメータ送信部305、教師データ記憶部306、及び、学習モデル記憶部307を含んで構成され、推論部302は、データ入力部308、推論演算部309、及び、データ出力部(制御部)310を含んで構成される。以下、推論装置3の各機能部の機能について詳細に説明する。
【0025】
パラメータ受信部303は、P2P接続された外部の推論装置3から、学習モデル記憶部307に予め記憶された学習モデルの複数のパラメータのうちの選択された一部のパラメータを受信する。ここで複数のパラメータとしては、学習モデルとして畳み込みニューラルネットワーク(CNN:Convolutional Neural Network)等のニューラルネットワークのモデルが採用されている場合には、ニューラルネットワーク内の2つのノード間のデータの伝達時に使用される重みパラメータ等が挙げられる。
【0026】
学習モデル記憶部307は、推論装置3においての推論処理において使用される機械学習の学習モデルのデータをその学習モデルの複数のパラメータとともに記憶するデータ記憶領域である。教師データ記憶部306は、学習モデル記憶部307に記憶された学習モデルの複数のパラメータを機械学習のトレーニングによって更新する際に使用される教師データを記憶するデータ記憶領域である。教師データ記憶部306に記憶される教師データは、予め推論装置3の外部から取得されたデータを含んでもよいし、推論装置3に接続されたセンシングデバイス5から受信される検出データを含んでもよい。この教師データは、学習モデルに入力される入力データとその入力データに対応する正解データ(ラベル)とが含まれうる。
【0027】
学習演算部304は、パラメータ受信部303によって受信された一部のパラメータを、学習モデル記憶部307に記憶されている学習モデルのデータに反映する。この際、学習演算部304は、一部のパラメータの反映後の学習モデルのデータを基に、その学習モデルに教師データ記憶部306に記憶されている教師データを入力し、その結果生成された推論結果の推論精度が、反映前の学習モデルを用いた推論結果の推論精度よりも向上する場合に、一部のパラメータを学習モデル記憶部307内の学習モデルのデータに上書きする(反映する)。
【0028】
さらに、学習演算部304は、学習モデル記憶部307に記憶されている学習モデルのデータによって特定される複数のパラメータを、教師データ記憶部306に記憶されているラベル付きの教師データを用いてトレーニングすることによって、更新する。なお、学習演算部304は、外部の複数の推論装置3のそれぞれから受信された一部のパラメータを、教師データを用いた1エポックごとのトレーニング(機械学習処理)の処理の前に反映する。また、学習演算部304は、トレーニングによって更新した複数のパラメータのうちの他部のパラメータを、学習モデル記憶部307に記憶されているデータの中からランダムに選択して読み出し、読み出した他部のパラメータをパラメータ送信部305に引き渡す。このとき、学習演算部304は、他部のパラメータの選択及び引き渡しを、教師データを用いた1エポックごとのトレーニング(機械学習処理)の処理の後のタイミングで実行する。
【0029】
パラメータ送信部305は、学習演算部304から1エポックのトレーニングの処理毎に引き渡された他部のパラメータを、外部の複数の推論装置3に送信する。このとき、送信先の外部の推論装置3は、自己の推論装置3にP2P接続されている全ての推論装置3であってもよいし、自己の推論装置3にP2P接続されている全ての推論装置3の中から選択された推論装置3であってもよい。
【0030】
データ入力部308は、センシングデバイス5によって取得された対象物に関する検出データの入力を受ける。また、データ入力部308は、入力された検出データを、その都度、教師データ記憶部306に教師データとして蓄積及び記憶するとともに、推論演算部309に引き渡す。
【0031】
推論演算部309は、データ入力部308から引き渡された検出データを、学習モデル記憶部307からデータを読み出すことによって機能する機械学習の学習モデルに入力し、その学習モデルによって出力される出力データを推論結果として生成する。推論演算部309の生成する推論結果は、例えば、対象物の種類、対象物の位置座標、あるいは、対象物の大きさ、等である。また、推論演算部309は、生成した推論結果を、入力データに対応した訓練データの正解データ(ラベル)として、教師データ記憶部306に記憶してもよい。
【0032】
データ出力部310は、推論演算部309によって生成された推論結果を基に、外部装置の制御内容を決定し、その制御内容を指示する制御信号を制御装置7に送信する。これにより、データ出力部310は、制御装置7を介して外部装置の動作を制御することができる。決定する制御内容としては、外部装置がアクチュエータの場合、アクチュエータの動作タイミング、アクチュエータの動作方向、あるいは、アクチュエータの動作速度等が挙げられる。
【0033】
図3には、推論システム1の構成例を示す。この例では、推論システム1には、2台の推論装置3が含まれ、互いにデータ通信可能に構成される。一方の推論装置3は、A地点に設置され、センシングデバイス5であるカメラと、アクチュエータを制御する制御装置7とが電気的に接続されている。他方の推論装置3は、A地点とは離れたB地点に設置され、センシングデバイス5であるカメラと、アクチュエータを制御する制御装置7とが電気的に接続されている。それぞれのセンシングデバイス5は、A地点とB地点との間を移動する対象物Sの撮像画像データを取得し、それぞれの推論装置3に入力する。それぞれの制御装置7は、それぞれの推論装置3から受信した制御信号を基に、外部装置の動作を制御する。
【0034】
図4には、N台(Nは任意の整数)の推論装置3によって構成される推論システム1におけるパラメータの反映のイメージを示す。ここでは、N台の推論装置3の学習モデル記憶部307においては、同一のアルゴリズム構成の学習モデルのデータが記憶されており、それぞれのデータには、同一種類および同一数の複数のパラメータP,P,…,Pが含まれている。ある推論装置3は、1エポックのトレーニングの処理の後に、更新した複数のパラメータPのうちの一部のパラメータeを、他の推論装置3に送信する。これに対して、他の推論装置3は、受信した一部のパラメータパラメータeを、学習モデルの推論精度が向上することを条件に自装置内に記憶されている複数のパラメータP中の該当するパラメータに上書き(反映)する。同様にして、複数の推論装置3の間で一部のパラメータe,e,eが送受信および上書きされる。
【0035】
以下、推論装置3における各種処理の動作手順について説明する。まず、図5を参照しながら、推論装置3のトレーニング処理の手順について説明する。
【0036】
まず、ある推論装置3のパラメータ受信部303が、外部の推論装置3から学習モデルの一部のパラメータを受信する(ステップS101)。次に、推論装置3の学習演算部304によって、一部のパラメータを反映後の学習モデルに教師データが入力されることにより推論結果が取得され、その推論結果と教師データに含まれる正解データ(ラベル)とを基に推論精度が算出される(ステップS102)。そして、学習演算部304によって、推論精度が一部のパラメータの反映前後で向上したか否かが判定される(ステップS103)。判定の結果、推論精度が低下した場合は(ステップS103;No)、学習モデルのデータへの一部のパラメータの反映がキャンセルされる一方で、推論精度が向上した場合は(ステップS103;Yes)、学習モデルのデータへの一部のパラメータの反映が実行される(ステップS104)。
【0037】
その後、推論装置3の学習演算部304によって、学習モデル記憶部307に記憶されている学習モデルの複数のパラメータが、学習モデルの教師データを用いた1エポックのトレーニングが実行されることにより、更新される(ステップS105)。次に、学習演算部304によって、更新された複数のパラメータの中の他部のパラメータが選択されて読み出される(ステップS106)。さらに、パラメータ送信部305によって、読み出された他部のパラメータがP2P接続された外部の推論装置3に送信される(ステップS107)。その後、外部の推論装置3からの一部のパラメータの受信の有無が監視され(ステップS108)、一部のパラメータの受信がある場合には(ステップS108;Yes)、推論装置3の処理がステップS101に戻されてトレーニング処理が繰り返され、一部のパラメータの受信がない場合には(ステップS108;No)、推論装置3におけるトレーニング処理が終了される。
【0038】
次に、図6を参照しながら、推論装置3の推論処理の手順について説明する。まず、センシングデバイス5から検出データが取得された(ステップS201)ことを契機に推論処理が開始される。検出データが取得されると、推論装置3の推論演算部309によって、学習モデル記憶部307から読み出されて機能する学習モデルに検出データが入力され、その結果、学習モデルから出力された出力データが推論結果として生成される(ステップS202)。そして、推論装置3のデータ出力部310によって、推論結果を基に制御装置7を介して外部装置の動作が制御される(ステップS203)。この外部装置の動作制御は、検出データの取得ごとに繰り返される。
【0039】
以上説明した推論システム1の推論装置3によれば、推論装置3内に、検出データを基に推論結果を生成する推論部302と、学習モデルの複数のパラメータを更新する学習部301とが備えられ、学習部301は、複数のパラメータのうちの一部のパラメータを外部の推論装置3から受信して学習モデルに反映し、その学習モデルの複数のパラメータを教師データを用いた機械学習によって更新し、更新した複数のパラメータから他部のパラメータをランダムに選択して送信する。これにより、複数の推論装置3を含む推論システム1を構築した場合に、複数の推論装置3の間で学習モデルの複数のパラメータを選択的に相互に交換しながら、複数の推論装置3ごとに、学習モデルを教師データを用いた機械学習によって構築できる。これにより、同一構成の学習モデルを用いる複数の推論装置3において、学習モデルのパラメータを機械学習によって効率よく更新することができる。
【0040】
また、複数の推論装置3を含む推論システム1の構成によれば、複数の推論装置3の間で学習モデルの複数のパラメータを、通信ネットワークNWを介して、選択的に相互に交換しながら、複数の推論装置3ごとに、学習モデルを教師データを用いた機械学習によって構築できる。これにより、推論システム1内で同一構成の学習モデルを用いる複数の推論装置3において、学習モデルのパラメータを機械学習によって効率よく更新することができる。
【0041】
特に、本実施形態によれば、学習モデルの構築を集中的に実行するサーバ装置が不要となり、システムの運用コストが削減される。また、サーバ装置における処理負荷の集中がなくなり処理負荷が複数の推論装置3に分散され、複数の推論装置3間で直接データ通信が可能とされているため、通信遅延による処理速度の低下が回避される。また、個々の推論装置3で学習が可能となるので、システムの冗長化、及び学習時のゼロダウンタイム化が実現される。さらに、複数の推論装置3による学習の並列化が可能となり、学習速度が高速化されるとともに、個々の推論装置3における学習処理の演算コストの増加を抑えることができる。また、推論装置3における学習モデルのダウンロードが不要となり、ネットワーク上の通信量が削減され、その結果システム全体の負荷が低下する。
【0042】
また、本実施形態によれば、推論装置3内で学習部301と推論部302が分けて備えられているので、推論処理のリアルタイム性が向上される。さらに、推論部302における推論結果が学習部301におけるトレーニング処理にフィードバックされているので、学習モデルの逐次の高精度化が実現される。
【0043】
本実施形態においては、学習演算部304が、教師データを用いた1エポックごとのトレーニング処理の前に一部のパラメータを反映し、パラメータ送信部305が、学習演算部304による教師データを用いた1エポックごとのトレーニング処理の後に選択された他部のパラメータを送信している。これにより、推論システム1に含まれる複数の推論装置3において推論精度が高められた学習モデルを効率よく構築することができる。
【0044】
また、本実施形態においては、学習演算部304が、一部のパラメータを反映した学習モデルの推論精度が反映前後で向上する場合に、一部のパラメータを学習モデル記憶部307内の学習モデルに関するデータに反映している。このような構成により、教師データを用いたトレーニング処理において、外部の推論装置3によって更新された一部のパラメータを、推論精度が向上する場合に更新するので、推論精度が高められた学習モデルをより効率よく構築することができる。
【0045】
また、本実施形態においては、推論演算部309による推論結果に基づいて外部装置を制御するデータ出力部310を備えている。これにより、精度の高められた推論結果を基に外部装置を制御することができ、外部装置を適切に制御することができる。
【0046】
以上、本発明の種々の実施形態について説明したが、本発明は上記実施形態に限定されるものではなく、各請求項に記載した要旨を変更しない範囲で変形し、又は他のものに適用したものであってもよい。
【0047】
上記実施形態は、下記のような制御例に適用することができる。
・外部装置としてのドローンの飛行制御を行う例。
・外部装置としてのアクチュエータの動作タイミング、動作方向、あるいは、動作速度を制御する例。
・学習モデルの入力データとして高度センサの高度データを用いる例。
・学習モデルの出力データ(推論結果)として、ドローンの自己位置、検出物体までの距離、検出物体の種類、あるいは検出物体の大きさを用いる例。
【0048】
本発明の推論装置は、[1]「外部からの入力情報を基に機械学習の学習モデルを用いて推論結果を生成する推論部と、学習モデルの複数のパラメータを教師データを用いた機械学習によって更新する学習部と、を備え、学習部は、学習モデルに関するデータ及び教師データを記憶する記憶部と、外部の推論装置から複数のパラメータのうちの一部のパラメータを受信するパラメータ受信部と、一部のパラメータを記憶部内の学習モデルに関するデータに反映するとともに、記憶部に記憶された学習モデルによって特定される学習モデルの複数のパラメータを、記憶部に記憶された教師データを用いて更新する学習演算部と、学習演算部によって更新された複数のパラメータのうちからランダムに選択された他部のパラメータを、外部の推論装置に送信するパラメータ送信部と、を含む、推論装置」である。
【0049】
本発明の推論装置は、[2]「 学習演算部は、学習演算部による教師データを用いた1エポックごとの機械学習処理の前に一部のパラメータを反映する、上記[1]に記載の推論装置」であってもよい。
【0050】
本発明の推論装置は、[3]「 パラメータ送信部は、学習演算部による教師データを用いた1エポックごとの機械学習処理の後に選択された他部のパラメータを送信する、上記[1]又は[2]に記載の推論装置」であってもよい。
【0051】
本発明の推論装置は、[4]「学習演算部は、一部のパラメータを反映した学習モデルの推論精度が反映前後で向上する場合に、一部のパラメータを記憶部内の学習モデルに関するデータに反映する、上記[1]~[3]のいずれかに記載の推論装置」であってもよい。
【0052】
本発明の推論装置は、[5]「推論部による推論結果に基づいて外部装置を制御する制御部をさらに備える、上記[1]~[4]のいずれかに記載の推論装置」であってもよい。
【0053】
本発明の推論システムは、[6]「上記[1]~[5]に記載の推論装置を複数備え、複数の推論装置は、互いにデータを送受信可能にネットワークを介して接続され、ネットワークを介して、互いに一部のパラメータあるいは他部のパラメータを送受信する、推論システム」である。
【符号の説明】
【0054】
1 推論システム
3 推論装置
5 センシングデバイス
7 制御装置
301 学習部
302 推論部
303 パラメータ受信部
304 学習演算部
305 パラメータ送信部
306 教師データ記憶部
307 学習モデル記憶部
308 データ入力部
309 推論演算部
310 データ出力部(制御部)
NW 通信ネットワーク
S 対象物
図1
図2
図3
図4
図5
図6