(19)【発行国】日本国特許庁(JP)
(12)【公報種別】公開特許公報(A)
(11)【公開番号】P2023129172
(43)【公開日】2023-09-14
(54)【発明の名称】Edge AIシステムにおけるアノテーションの全自動化を実現するシステム
(51)【国際特許分類】
G06N 20/00 20190101AFI20230907BHJP
【FI】
G06N20/00 130
【審査請求】未請求
【請求項の数】3
【出願形態】書面
(21)【出願番号】P 2022047549
(22)【出願日】2022-03-04
【公序良俗違反の表示】
(特許庁注:以下のものは登録商標)
1.TENSORFLOW
(71)【出願人】
【識別番号】510287773
【氏名又は名称】株式会社ヘッドウォータース
(72)【発明者】
【氏名】野口 修
(57)【要約】 (修正有)
【課題】人手により行われていたアノテーションの一連の作業を自動化することにより低コスト化を実現するシステムを提供する。
【解決手段】機械学習による物体検出の自動アノテーションのためのプロセッサによるシステムは、少なくとも1台のIoTエッジ・アプライアンス上で動作する軽量な学習済み機械学習モデルと、アプライアンスと比較して大規模な計算能力を保有するアプライアンスもしくは汎用サーバ上で動作する精密な学習済み機械学習モデルと、IoTエッジ・アプライアンス上で実行された物体検出の入力データと推論結果をネットワークを介して収集する装置と、を備える。装置は、2種類の学習済み機械学習モデルによる推論結果の差分から新たな教師データセットを生成する機能と、生成された教師データを用いた機械学習モデルの再学習機能と、学習済みモデルをネットワークを介してIoTエッジ・アプライアンスへ提供する機能と、を備える。
【選択図】なし
【特許請求の範囲】
【請求項1】
機械学習による物体検出の自動アノテーションのためのプロセッサによるシステムであって、少なくとも1台のIoTエッジ・アプライアンス上で動作する軽量な学習済み機械学習モデルと、前述のアプライアンスと比較して大規模な計算能力を保有するアプライアンスもしくは汎用サーバ上で動作する精密な学習済み機械学習モデルと、IoTエッジ・アプライアンス上で実行された物体検出の入力データと推論結果をネットワークを介して収集する装置を備え、上記2種類の学習済み機械学習モデルによる推論結果の差分から新たな教師データセットを生成する機能を備え、生成された教師データを用いた機械学習モデルの再学習機能を備え、学習済みモデルをネットワークを介してIoTエッジ・アプライアンスへ提供する機能を備え、それらの一連の処理に人手を介することなく機械による全自動処理を実現するシステム。
【請求項2】
前記IoTエッジ・アプライアンス上で動作する軽量な学習済みモデルと大規模な計算能力を保有するアプライアンスもしくは汎用サーバ上で動作する精密な学習済み機械学習モデルの予測結果の差分を計算し、IoTエッジ・アプライアンス上で動作する軽量な学習済みモデルを再学習するための教師データを自動で作成するシステム。
【請求項3】
前述の再学習されたIoTエッジ・アプライアンス上で動作する軽量な学習済みモデルをIoTエッジ・アプライアンスに自動で配信するシステム。
【発明の詳細な説明】
【技術分野】
【0001】
本発明は、アノテーションと呼ばれる機会に学習させる情報を付与する作業の中でも取り分け画像の物体検出の際に画像の特定範囲を矩形で示すと共に、矩形の範囲の示す物体の名称であるラベルを記入する一連の作業を自動化することにより、従来手法と比較して低コストでのAIシステムの運用を可能とするものである。
【背景技術】
【0002】
従来手法では、アノテーションは主に人手により行われている。
【0003】
一方で、AIによる推論を充分な精度で行うためには大量のアノテーション済みの教師データが必要となるが、これらの作業を人手で行うということは長時間の作業とそれに伴う高額な作業費が必要となる。
【0004】
また、AIシステムというものはある時点で到達した精度がその後も同様に維持されるということは稀であり、継続的に教師データを収集し、それによってAIシステムを再学習するという運用が求められる。
【発明の概要】
【発明が解決しようとする課題】
【0005】
しかし、前述のように従来手法によるアノテーションは人手による作業が主である。
【0006】
このために必要となる作業時間ならびに作業費用を継続する必要から、AIシステムは初期費用に加えてランニングコストも非常に高額とならざるを得ない。
【0007】
この事実は、AIシステムの社会実装を妨げる大きな要因のひとつとなっている。
【0008】
AIシステムの社会実装が進むシナリオとして、これまで人手で行っていた業務の中でも比較的単純な作業、従来のプログラミングによる処理のみでまかなえるほど単純な繰り返しではないものの、人の感覚で創造的とは呼べないような繰り返し作業をAIシステムに肩代わりさせることから始まり、徐々にその範囲を広げていくということが考えられるが、初期段階の繰り返し作業を任せるにはAIシステムはあまりにも高額であるために導入が進まないという問題がある。
【0009】
本発明の実施の形態は、上記の点に鑑みてなされたもので、人手により行われていたアノテーションの一連の作業を自動化することにより低コスト化を実現するものである。
【課題を解決するための手段】
【0010】
上記目的を達成するため、本発明の実施の形態は、Edge AIシステムによる画像の物体検出を行うための機械学習モデルの教師データを作成するためのアノテーション作業の自動化を行う。
【0011】
Edge AIシステムが利用する機械学習モデルは、IoTエッジ・アプライアンス上での動作を前提とした軽量なモデルであり、汎用サーバ上で動作する機械学習モデルと比較して精度で劣る場合が主であるため、この性能差を利用してIoTエッジ・アプライアンス上での推論結果を、汎用サーバ上で動作する高精度の機械学習モデルを用いた推論結果で訂正したアノテーションを行うことで自動化を実現する。
【発明の効果】
【0012】
人手により行われていたアノテーションの一連の作業を自動化することにより低コスト化を実現する。
【図面の簡単な説明】
【0013】
【
図1】実施形態に係るシステムの全体構成の一例を示す図である。
【
図2】実施形態に係るEdge AIシステムの構成の一例を示す図である。
【
図3】実施形態に係る汎用サーバAIシステムの構成の一例を示す図である。
【
図4】実施形態に係るアノテーション自動化システムの構成の一例を示す図である。
【発明を実施するための形態】
【0014】
以下、本発明の実施の形態(以降、「実施形態」とも表す。)について、図面を参照しながら詳細に説明する。
【0015】
<全体構成>
まず、本実施形態に係るシステムの全体構成について、
図1を参照しながら説明する。
図1は実施形態に係るシステムの全体構成の一例を示す図である。
【0016】
図1に示すように、本実施形態に係るシステムは、本実施形態の利用者であるIoTエッジ・アプライアンスとIoTエッジ・アプライアンス上での推論結果を蓄積するための推論結果蓄積サーバ、高度な機械学習モデルの動作する汎用サーバ、再学習したモデルをIoTエッジ・アプライアンスへ配布するためのモデル配信サーバから構成される。IoTエッジ・アプライアンスと推論結果蓄積サーバ、モデル配信サーバはインターネットを介して通信可能に接続されている。
【0017】
IoTエッジ・アプライアンスはサービス利用者の保有する端末であり、インターネット接続されておりHTTPプロトコルの利用が可能であることとTensorFlow形式の帰化学習モデルが利用可能であれば、PC、スマートフォンその他のデバイスの種類は問わない。
【0018】
IoTエッジ・アプライアンスの保有者は、本サービスの利用者であり、サービスの運営者とアクセス契約を締結したものである。
【0019】
IoTエッジ・アプライアンスは、本アプライアンス上で動作する軽量な機械学習モデルを用いて、画像の物体検出を行う。推論結果は、対象の画像および対象画像上の特定の範囲を矩形の起点の位置を示す縦横のピクセル位置であるXY座標および矩形の高さと幅および矩形の範囲内の物体の名称を示すラベルを情報として含むテキストデータからなる。
【0020】
IoTエッジ・アプライアンスは、上記の推論結果をインターネットを経由して推論結果蓄積サーバへ送信する。
【0021】
次に、上記の推論結果蓄積サーバ上に蓄積された推論結果に含まれる画像に対して、汎用サーバ上で汎用サーバ向けに作成された機械学習モデルを用いて物体検出を行う。
【0022】
IoTエッジ・アプライアンス上での推論結果と汎用サーバ上での推論結果は、機械の処理性能ならびにモデルの性能差により差異が生じる。
【0023】
この性能差に着目し、汎用サーバ上での推論結果である画像および対象画像上の特定の範囲を矩形の起点の位置を示す縦横のピクセル位置であるXY座標および矩形の高さと幅および矩形の範囲内の物体の名称を示すラベルを新たな教師データとする。
【0024】
上記の教師データを用いて、汎用サーバ上で、IoTエッジ・アプライアンス上での動作するための軽量機械学習モデルの再学習を行う。
【0025】
このようにして作成されたモデルは、IoTエッジ・アプライアンスへ配備するためのモデル配信サーバへ保存され、インターネットを経由してIoTエッジ・アプライアンスへ配備される。
【0026】
上記の各工程は自動化され、人手を介することなく実行される。