(19)【発行国】日本国特許庁(JP)
(12)【公報種別】公開特許公報(A)
(11)【公開番号】P2024115374
(43)【公開日】2024-08-26
(54)【発明の名称】評価方法、評価装置、および、コンピュータープログラム
(51)【国際特許分類】
G06T 7/00 20170101AFI20240819BHJP
G06V 10/82 20220101ALI20240819BHJP
【FI】
G06T7/00 350C
G06V10/82
【審査請求】未請求
【請求項の数】7
【出願形態】OL
(21)【出願番号】P 2023021039
(22)【出願日】2023-02-14
(71)【出願人】
【識別番号】000002369
【氏名又は名称】セイコーエプソン株式会社
(74)【代理人】
【識別番号】110000028
【氏名又は名称】弁理士法人明成国際特許事務所
(72)【発明者】
【氏名】漆畑 祐輝
(72)【発明者】
【氏名】渡邊 亮基
(72)【発明者】
【氏名】倉沢 光
【テーマコード(参考)】
5L096
【Fターム(参考)】
5L096AA06
5L096BA05
5L096BA17
5L096CA04
5L096DA02
5L096GA51
5L096HA11
5L096JA03
5L096KA04
(57)【要約】
【課題】機械学習モデルを用いる個別の目的に応じた学習セットを準備する必要が生じ得る。
【解決手段】対象データの評価を行う評価方法は、複数のベクトルニューロン層を有するベクトルニューラルネットワーク型の機械学習モデルに、対象データとは異なる種類の汎用学習データと、汎用学習データに対応するラベルとの学習セットを複数入力して、前記機械学習モデルを学習する工程と、基準特徴スペクトルを取得する工程と、対象特徴スペクトルを取得する工程と、基準特徴スペクトルと対象特徴スペクトルとの類似度であるスペクトル類似度を算出する工程と、スペクトル類似度を用いて対象データの評価を行う工程と、を備える。
【選択図】
図8
【特許請求の範囲】
【請求項1】
対象データの評価を行う評価方法であって、
(a)複数のベクトルニューロン層を有するベクトルニューラルネットワーク型の機械学習モデルに、前記対象データとは異なる種類の汎用学習データと、前記汎用学習データに対応するラベルとの学習セットを複数入力して、前記機械学習モデルを学習する工程と、
(b)前記工程(a)の後に、学習済み機械学習モデルに対して、前記対象データと同じ種類の基準データであって前記評価が予め定めた基準評価を示す基準データを入力して、前記学習済み機械学習モデルの特定層の出力から特徴スペクトルとしての基準特徴スペクトルを取得する工程と、
(c)前記工程(a)の後に、前記学習済み機械学習モデルに対して、評価対象の前記対象データを入力して、前記特定層の出力から前記特徴スペクトルとしての対象特徴スペクトルを取得する工程と、
(d)前記基準特徴スペクトルと前記対象特徴スペクトルとの類似度であるスペクトル類似度を算出する工程と、
(e)前記スペクトル類似度を用いて前記対象データの評価を行う工程と、を備える、評価方法。
【請求項2】
請求項1に記載の評価方法であって、
前記工程(e)は、2以上のクラスに関するクラス分類によって前記対象データの評価を行い、
前記基準評価は、基準クラスに分類された評価であり、
前記工程(e)は、
前記スペクトル類似度が予め定めた閾値以上である場合には、前記対象データを前記基準クラスに分類し、
前記スペクトル類似度が前記閾値未満である場合には、前記対象データを前記基準クラスとは異なるクラスに分類する、評価方法。
【請求項3】
請求項1に記載の評価方法であって、
複数のベクトルニューロン層は、入力されるデータである前記対象データの側から順に、中間層である畳み込みベクトルニューロン層と、出力層である分類ベクトルニューロン層とを有し、
前記特定層は、前記中間層である、評価方法。
【請求項4】
請求項1に記載の評価方法であって、
前記汎用学習データと前記基準データと前記対象データとはそれぞれ、時系列に並んだ複数のフレーム画像によって構成された動画像であり、
前記評価方法は、さらに、
(f)基準対象物の動きを撮像して取得された原基準動画像を構成する複数の基準フレーム画像を用いて、前記基準対象物を抽出した処理後基準フレーム画像を複数生成することで、時系列に並んだ複数の前記処理後基準フレーム画像を前記基準データとして生成する工程を有する、評価方法。
【請求項5】
請求項1に記載の評価方法であって、
前記汎用学習データと前記基準データと前記対象データとはそれぞれ、時系列に並んだ複数のフレーム画像によって構成された動画像であり、
前記評価方法は、さらに、
(g)評価対象物の動きを撮像して取得された原対象動画像を構成する複数の対象フレーム画像を用いて、前記評価対象物を抽出した処理後対象フレーム画像を複数生成することで、時系列に並んだ複数の前記処理後対象フレーム画像を前記対象データとして生成する工程を有する、評価方法。
【請求項6】
対象データの評価を行う評価装置であって、
複数のベクトルニューロン層を有するベクトルニューラルネットワーク型の機械学習モデルに、前記対象データとは異なる種類の汎用学習データと、前記汎用学習データに対応するラベルとの学習セットを複数入力して、前記機械学習モデルを学習する学習実行部と、
学習済み機械学習モデルに対して、前記対象データと同じ種類の基準データであって前記評価が基準評価を示す基準データを入力して、前記学習済み機械学習モデルの特定層の出力から特徴スペクトルとして基準特徴スペクトルを取得する第1取得部と、
前記学習済み機械学習モデルに対して、評価対象の前記対象データを入力して、前記特定層の出力から前記特徴スペクトルとしての対象特徴スペクトルを取得する第2取得部と、
前記基準特徴スペクトルと前記対象特徴スペクトルとの類似度であるスペクトル類似度を算出部と、
前記スペクトル類似度を用いて前記対象データの評価を行う評価部と、を備える、評価装置。
【請求項7】
対象データの評価を行うコンピューターに実行させるコンピュータープログラムであって、
(a)複数のベクトルニューロン層を有するベクトルニューラルネットワーク型の機械学習モデルに、前記対象データとは異なる種類の汎用学習データと、前記汎用学習データに対応するラベルとの学習セットを複数入力して、前記機械学習モデルを学習する機能と、
(b)前記機能(a)を実行した後に、学習済み機械学習モデルに対して、前記対象データと同じ種類の基準データであって前記評価が基準評価を示す基準データを入力して、前記学習済み機械学習モデルの特定層の出力から特徴スペクトルとしての基準特徴スペクトルを取得する機能と、
(c)前記機能(a)を実行した後に、前記学習済み機械学習モデルに対して、評価対象の前記対象データを入力して、前記特定層の出力から前記特徴スペクトルとしての対象特徴スペクトルを取得する機能と、
(d)前記基準特徴スペクトルと前記対象特徴スペクトルとの類似度であるスペクトル類似度を算出する機能と、
(e)前記スペクトル類似度を用いて前記対象データの評価を行う機能と、を備える、コンピュータープログラム。
【発明の詳細な説明】
【技術分野】
【0001】
本開示は、対象データを評価する技術に関する。
【背景技術】
【0002】
従来、複数のベクトルニューロン層を有するベクトルニューラルネットワーク型の機械学習モデルが知られている(特許文献1)。学習済み機械学習モデルでは、評価基準となる既知特徴スペクトルと、対象データの対象特徴スペクトルと、を比較したスペクトル類似度が算出される。既知特徴スペクトルや対象特徴スペクトルは、機械学習モデルのベクトルニューロン層の出力から取得される。
【先行技術文献】
【特許文献】
【0003】
【発明の概要】
【発明が解決しようとする課題】
【0004】
従来の技術では、機械学習モデルの学習に用いる学習セットのデータは、スペクトル類似度を算出するための既知特徴スペクトルの元となるデータと同じである。よって、従来の技術では、機械学習モデルの学習のために、既知特徴スペクトルの元となるデータ、すなわち機械学習モデルを用いる個別の目的に応じた学習セットを準備する必要が生じ得る。
【課題を解決するための手段】
【0005】
本開示の第1の形態によれば、対象データの評価を行う評価方法が提供される。この評価方法は、(a)複数のベクトルニューロン層を有するベクトルニューラルネットワーク型の機械学習モデルに、前記対象データとは異なる種類の汎用学習データと、前記汎用学習データに対応するラベルとの学習セットを複数入力して、前記機械学習モデルを学習する工程と、(b)前記工程(a)の後に、学習済み機械学習モデルに対して、前記対象データと同じ種類の基準データであって前記評価が予め定めた基準評価を示す基準データを入力して、前記学習済み機械学習モデルの特定層の出力から特徴スペクトルとしての基準特徴スペクトルを取得する工程と、(c)前記工程(a)の後に、前記学習済み機械学習モデルに対して、評価対象の前記対象データを入力して、前記特定層の出力から前記特徴スペクトルとしての対象特徴スペクトルを取得する工程と、(d)前記基準特徴スペクトルと前記対象特徴スペクトルとの類似度であるスペクトル類似度を算出する工程と、(e)前記スペクトル類似度を用いて前記対象データの評価を行う工程と、を備える。
【0006】
本開示の第2の形態によれば、対象データの評価を行う評価装置が提供される。この評価装置は、複数のベクトルニューロン層を有するベクトルニューラルネットワーク型の機械学習モデルに、前記対象データとは異なる種類の汎用学習データと、前記汎用学習データに対応するラベルとの学習セットを複数入力して、前記機械学習モデルを学習する学習実行部と、学習済み機械学習モデルに対して、前記対象データと同じ種類の基準データであって前記評価が基準評価を示す基準データを入力して、前記学習済み機械学習モデルの特定層の出力から特徴スペクトルとして基準特徴スペクトルを取得する第1取得部と、前記学習済み機械学習モデルに対して、評価対象の前記対象データを入力して、前記特定層の出力から前記特徴スペクトルとしての対象特徴スペクトルを取得する第2取得部と、前記基準特徴スペクトルと前記対象特徴スペクトルとの類似度であるスペクトル類似度を算出部と、前記スペクトル類似度を用いて前記対象データの評価を行う評価部と、を備える。
【0007】
本開示の第3の形態によれば、対象データの評価を行うコンピューターに実行させるコンピュータープログラムが提供される。このコンピュータープログラムは、(a)複数のベクトルニューロン層を有するベクトルニューラルネットワーク型の機械学習モデルに、前記対象データとは異なる種類の汎用学習データと、前記汎用学習データに対応するラベルとの学習セットを複数入力して、前記機械学習モデルを学習する機能と、(b)前記機能(a)を実行した後に、学習済み機械学習モデルに対して、前記対象データと同じ種類の基準データであって前記評価が基準評価を示す基準データを入力して、前記学習済み機械学習モデルの特定層の出力から特徴スペクトルとしての基準特徴スペクトルを取得する機能と、(c)前記機能(a)を実行した後に、前記学習済み機械学習モデルに対して、評価対象の前記対象データを入力して、前記特定層の出力から前記特徴スペクトルとしての対象特徴スペクトルを取得する機能と、(d)前記基準特徴スペクトルと前記対象特徴スペクトルとの類似度であるスペクトル類似度を算出する機能と、(e)前記スペクトル類似度を用いて前記対象データの評価を行う機能と、を備える。
【図面の簡単な説明】
【0008】
【
図3】機械学習モデルの学習工程を示すフローチャート。
【
図8】評価装置が実行する評価工程のフローチャート。
【
図9】ステップS130の詳細を示すフローチャート。
【
図10】スペクトル類似度の第1の算出方法を示す説明図。
【
図12】スペクトル類似度の第2の算出方法を示す説明図。
【
図14】本実施形態の評価装置の評価結果を示す図。
【発明を実施するための形態】
【0009】
A.実施形態:
図1は、実施形態における評価システム5を示す図である。この評価システム5は様々な対象データIDEを評価する装置であり、例えば、機器や部品などの製品が正常かどうかを評価したり、人の対象部位の疲労度を評価したりする。本実施形態では、対象データIDEは、動作中のロボットを撮像した動画像である。評価システム5は、動画像の評価を行うことで対象であるロボットの動作が正常であるかどうかを評価する。
【0010】
評価システム5は、評価装置100と、センサー装置400と、学習セット群LSGとを備える。センサー装置400は、評価対象となる対象データIDEや対象データIDEの元となる原評価データを取得するための装置である。センサー装置400は、例えば、撮像装置であったり、超音波を発信して反射した反射波を受信する超音波装置であったりする。本実施形態では、センサー装置400は、動画像や静止画像を撮像できるカメラである。センサー装置400は、有線や無線によって評価装置100とデータ通信可能である。学習セット群LSGは、後述する機械学習モデル200の学習に用いられる。学習セット群LSGは、例えば、評価装置100とは異なる外部記憶装置に記憶されていてもよいし、評価装置100の記憶装置120に記憶されていてもよい。外部記憶装置は、有線や無線によって評価装置100とデータ通信可能である。学習セット群LSGの詳細は後述する。
【0011】
評価装置100は、プロセッサー110と、記憶装置120と、インターフェイス回路130と、インターフェイス回路130に接続された入力デバイス140及び表示部150と、を備える。評価装置100は、例えば、パーソナルコンピューターである。評価装置100は、記憶装置120に記憶された学習済み機械学習モデル200を用いて、対象データIDEの評価を行う。
【0012】
プロセッサー110は、記憶装置120に記憶された各種プログラムを実行することで、学習実行部112と、データ処理部113と、スペクトル取得部114と、評価処理部118とを有する。
【0013】
学習実行部112は、学習セット群LSGを構成する複数の学習セットLSを機械学習モデル200に入力して、機械学習モデル200の学習処理を実行する。機械学習モデル200の詳細については後述する。
【0014】
データ処理部113は、センサー装置400などによって撮像され取得されたデータに対して画像処理などのデータ処理を実行する。データ処理113は、例えば、センサー装置400によって取得された動画像の各フレーム画像に対して、エッジ抽出処理や二値化処理や対象物を抽出する処理などを実行できる。
【0015】
スペクトル取得部114は、学習済み機械学習モデル200に対して入力データIDを入力することで、学習済み機械学習モデル200の特定層の出力から特徴スペクトルSpを取得する。スペクトル取得部114は、第1取得部115と、第2取得部116とを有する。特徴スペクトルSpの詳細は後述する。
【0016】
第1取得部115は、入力データIDの一例である基準データIDSを学習済み機械学習モデル200に対して入力して、学習済み機械学習モデル200の特定層の出力から特徴スペクトルSpとしての基準特徴スペクトルKSpを取得する。第1取得部115は、取得した基準特徴スペクトルKSpを、記憶装置120に記憶する。本実施形態では、複数の基準特徴スペクトルKSpが、基準特徴スペクトル群KSpGとして記憶装置120に記憶されている。基準データIDSは、入力データIDの他の一例である対象データIDEと同じ種類である。つまり、基準データIDSと対象データIDEとは、データの生成元となる対象の種類が同じである。本実施形態では、対象データIDEがロボットの動作を撮像した動画像であるので、基準データIDSも同種のロボットの動作を撮像した動画像である。つまり、本実施形態において、基準データIDSおよび対象データIDEは、時系列に並んだ複数のフレーム画像によって構成された動画像である。また基準特徴スペクトルKSpの生成元となる基準データIDSは、予め定めた基準評価を示すデータである。予め定めた基準評価は、対象データIDEの評価を行うための基準となる指標であればよく、本実施形態では基準クラスの一例である「正常」を示すラベルLBによって表されている。つまり、本実施形態における基準評価は、ロボットの動作が正常であるという評価を示し、基準クラスに分類された評価である。
【0017】
第2取得部116は、学習済み機械学習モデル200に対して、評価対象の対象データIDEを入力して、特定層の出力から特徴スペクトルSpとしての対象特徴スペクトルESpを取得する。第2取得部116は、取得した対象特徴スペクトルESpを記憶装置120に記憶する。
【0018】
評価処理部118は、対象データIDEの評価を行う。評価処理部118は、評価結果を表示部150に表示する。評価処理部118は、算出部117と、評価部119とを有する。
【0019】
算出部117は、基準特徴スペクトルKSpと対象特徴スペクトルESpとの類似度であるスペクトル類似度RSpを算出する。スペクトル類似度RSpの算出方法については後述する。
【0020】
評価部119は、算出されたスペクトル類似度RSpを用いて対象データIDEの評価を行う。例えば、評価部119は、2以上のクラスに関するクラス分類によって対象データIDEの評価を行う。本実施形態では、評価部119は、スペクトル類似度RSpが予め定めた閾値以上である場合には、対象データIDEを基準クラスである「正常」に分類する。一方で、評価部119は、スペクトル類似度RSpが閾値未満である場合には、対象データIDEを基準クラスとは異なるクラスに分類する。異なるクラスは、例えば「異常」のラベルが付されたクラスである。
【0021】
図2は、機械学習モデル200の構成を示す説明図である。この機械学習モデル200は、入力データIDの側から順に、畳み込み層220と、中間層の一つであるプライマリーベクトルニューロン層230と、中間層の一つである第1畳み込みベクトルニューロン層240と、中間層の一つである第2畳み込みベクトルニューロン層250と、出力層である分類ベクトルニューロン層260とを備える。これらの層220~260のうち、畳み込み層220が最も下位の層であり、分類ベクトルニューロン層260が最も上位の層である。以上のように、機械学習モデル200は、複数のベクトルニューロン層230,240,250,260を有するベクトルニューラルネットワーク型の機械学習モデルである。以下の説明では、層220,230,240,250,260をそれぞれ、「Conv層220」、「PrimeVN層230」、「ConvVN1層240」、「ConvVN2層250」、「ClassVN層260」とも呼ぶ。
【0022】
図2の例では2つの畳み込みベクトルニューロン層240,250を用いているが、畳み込みベクトルニューロン層の数は任意であり、畳み込みベクトルニューロン層を省略してもよい。但し、1つ以上の畳み込みベクトルニューロン層を用いることが好ましい。
【0023】
各層220~260の構成は、以下のように記述できる。
・Conv層220:Conv[32,5,2]
・PrimeVN層230:PrimeVN[16,1,1]
・ConvVN1層240:ConvVN1[12,3,2]
・ConvVN2層250:ConvVN2[6,3,1]
・ClassVN層260:ClassVN[M,4,1]
・ベクトル次元VD:VD=16
これらの各層の記述において、括弧前の文字列はレイヤー名であり、括弧内の数字は、順に、チャンネル数、カーネルの表面サイズ、及び、ストライドである。例えば、Conv層220のレイヤー名は「Conv」であり、チャンネル数は32、カーネルの表面サイズは5×5、ストライドは2である。
図2では、各層の下にこれらの記述が示されている。各層の中に描かれているハッチングを付した矩形は、隣接する上位層の出力ベクトルを算出する際に使用されるカーネルの表面サイズを表している。本実施形態では、入力データIDは、例えば動画像を構成する単位期間tmにおけるフレーム画像の集合なので、カーネルの表面サイズも2次元である。なお、各層の記述で用いたパラメーターの値は例示であり、任意に変更可能である。入力データIDが、29×29ピクセルの30枚のフレーム画像で構成されている場合には、入力データIDのチャンネル数は29×29×30となる。また、入力データIDのチャンネル数に関わらずConv層220による畳み込み処理によって、一定サイズの出力がなされる。
【0024】
Conv層220は、スカラーニューロンで構成された層である。他の層230~260は、ベクトルニューロンで構成された層である。ベクトルニューロンは、ベクトルを入出力とするニューロンである。上記の記述では、個々のベクトルニューロンの出力ベクトルの次元は16で一定である。以下では、スカラーニューロン及びベクトルニューロンの上位概念として「ノード」という語句を使用する。
【0025】
図2では、Conv層220について、ノード配列の平面座標を規定する第1軸x及び第2軸yと、奥行きを表す第3軸zとが示されている。また、Conv層220のx,y,z方向のサイズが13,13,32であることが示されている。x方向のサイズとy方向のサイズを「解像度」と呼ぶ。z方向のサイズは、チャンネル数である。これらの3つの軸x,y,zは、他の層においても各ノードの位置を示す座標軸として使用する。但し、
図2では、Conv層220以外の層では、これらの軸x,y,zの図示が省略されている。
【0026】
よく知られているように、畳み込み後の解像度W1は、次式で与えられる。
W1=Ceil{(W0-Wk+1)/S} (A1)
ここで、W0は畳み込み前の解像度、Wkはカーネルの表面サイズ、Sはストライド、Ceil{X}はXの小数点以下を切り上げる演算を行う関数である。
図2に示した各層の解像度は、入力データIDの解像度を29とした場合の例であり、実際の各層の解像度は入力データIDのサイズに応じて適宜変更される。
【0027】
ClassVN層260は、M個のチャンネルを有している。Mは、機械学習モデル200で判別されるクラスの数である。本実施形態において、Mは10であり、2つのクラス判定値Class_1~Class_10が出力される。なお、ClassVN層260のチャンネル数Mは、2以上の任意の整数に設定可能である。
【0028】
図2では、更に、各層220,230,240,250,260における部分領域Rnが描かれている。部分領域Rnの添え字「n」は、各層の符号である。例えば、部分領域R220は、Conv層220における部分領域を示す。「部分領域Rn」とは、各層において、第1軸xの位置と第2軸yとの位置で規定される平面位置(x,y)で特定され、第3軸zに沿った複数のチャンネルを含む領域である。部分領域Rnは、第1軸x、第2軸y、および第3軸zに対応する「Width」×「Height」×「Depth」の次元を有する。本実施形態では、1つの「部分領域Rn」に含まれるノードの数は「1×1×デプス数」、すなわち「1×1×チャンネル数」である。
【0029】
図2に示すように、例えば、ConvVN2層250の出力から特徴スペクトルSpが取得される。本開示において、スペクトル類似度RSpの算出に使用されるベクトルニューロン層を、「特定層」とも呼ぶ。特定層としては、ConvVN2層250以外の中間層でもよく、また出力層であるClassVN層260であってもよく、各ベクトルニューロン層230,240,250,260の2以上の層であってもよい。
【0030】
図3は、機械学習モデル200の学習工程を示すフローチャートである。学習工程では、ステップS10において、複数の学習セットLSが準備される。
図4は、学習セット群LSGを説明するための図である。学習セット群LSGは、複数の学習セットLSによって構成されている。各学習セットLSは、汎用学習データLDと、汎用学習データLDに対応するラベルLBとを有する。
【0031】
汎用学習データLDは、評価対象である対象データIDEとは異なる種類のデータである。汎用学習データLDは、機械学習モデル200の学習データとして汎用されている一般的なデータであり、本実施形態では手書きの数字を表す画像であるMNISTデータを元に生成される。具体的には、汎用学習データLDは、MNISTデータである画像を予め定めた回転方向Rに予め定めた時間tpだけ回転させた動画像である。汎用学習データLDは、一定時間間隔tvごとのM枚のフレーム画像FMLの集合である。「M」は、2以上の整数である。つまり、汎用学習データLDは、時系列に並んだ複数のフレーム画像によって構成された動画像である。
図4では、各汎用学習データLDについて、便宜上、1枚のフレーム画像FMLのみを示しているが、実際にはM枚のフレーム画像FMLから構成される。MNISTデータである画像は、本実施形態では「0」~「9」の手書き数字であり、数字ごとに数字の外形が異なる複数のデータが準備される。汎用学習データLDの画像回転速度は、汎用学習データLDごとに異なっていてもよいし同じであってもよい。また、汎用学習データLDの回転方向Rは、汎用学習データLDごとに異なっていても同じであってもよい。
【0032】
ラベルLBは、汎用学習データLDが表す数字を示し、数字ごとに異なるラベルが割り当てられている。本実施形態では、数字「0」~「9」を表す汎用学習データLDごとに、ラベル「0」~「9」のラベルが関連付けられている。
【0033】
図3に示すように、ステップS20において、学習実行部112は、学習セット群LSGの各学習セットLSを機械学習モデル200に入力して、機械学習モデル200の学習を実行する。具体的には、学習実行部112は、各汎用学習データLDと、各汎用学習データLDに関連付けられたラベルLBとの対応を再現するように、機械学習モデル200の学習を実行する。なお、学習セット群LSGの汎用学習データLDは、機械学習モデル200に適した形式であるNumpy形式にデータ変換されている。なお、機械学習モデル200に入力される他の入力データIDも汎用学習データLDと同様に、Numpy形式にデータ変換されている。
【0034】
次に、ステップS30において、第1取得部115は、基準データIDSを学習済み機械学習モデル200に入力して、機械学習モデル200の特定層の出力から基準特徴スペクトルKSpを取得する。取得された基準特徴スペクトルKSpは記憶装置120に記憶される。本実施形態において、特定層は、ConvVN2層250である。
【0035】
図5は、基準データIDSを説明するための図である。本実施形態における基準データIDSは、正常に動作している基準対象物としてのロボット900の動きを撮像した原基準動画像RDを元に生成した動画像である。ロボット900は、基台901と、基台901に接続されたアーム902とを有する。正常に動作しているロボット900では、アーム902が一定速度で始点と終点とを往復移動している。原基準動画像RDは、予め定めた基準時間ts、ロボット900が正常に動作している様子を撮像した基準フレーム画像FMK1~FMKNの集合である。予め定めた基準時間tsは、動画像である汎用学習データLDの動画の時間tpと同じであってもよいし、異なっていてもよい。また、基準フレーム画像FMK1~FMKNの数は、汎用学習データLDのフレーム画像FMLの数と同じであってもよいし異なっていてもよい。本実施形態では、原基準動画像RDは、N枚の基準フレーム画像FMK1~FMKNによって構成されている。「N」は2以上の整数である。N枚の基準フレーム画像FMK1~FMKNを区別することなく用いる場合には、基準フレーム画像FMKを用いる。
【0036】
データ処理部113は、原基準動画像RDを構成する複数の基準フレーム画像FMK1~FMKNを用いて、基準フレーム画像FMKから動いている基準対象物であるロボット900、詳細にはアーム902を抽出する画像処理を実行することで、処理後基準フレーム画像FMSを複数生成する。つまり、データ処理部113は、時系列に並んだ複数、本実施形態ではN枚の処理後基準フレーム画像FMSを基準データIDSとして生成する。データ処理部113は、複数の基準フレーム画像FMS1~FMSNの画素ごとに、画素値の平均値を算出する。そしてデータ処理部113は、複数の基準フレーム画像FMK1~FMKNごとに、基準フレーム画像FMKの各画素と、対応する画素の平均値との差分の絶対値を算出し、各画素における差分の絶対値の集合を処理後基準フレーム画像FMSとして生成する。これにより、処理後基準フレーム画像FMSからは静止している基台901や物体923,924や背景は取り除かれ、動いている基準対象物であるロボット900、詳細にはアーム902が抽出される。なお、基準フレーム画像FMK中から動いている基準対象物を抽出するデータ処理は、上記に限定されるものではない。例えば、データ処理部113は、パターン認識処理やエッジ抽出処理などのデータ処理を基準フレーム画像FMKに対して実行することで、基準対象物を抽出した処理後基準フレーム画像FMSを生成してもよい。
【0037】
また、基準データIDSは、複数準備されてもよい。本実施形態では、基準データIDSは複数準備される。複数の基準データIDSは、正常に動作しているロボット900の動画像を複数期間に分割した分割データのそれぞれを元に生成されてもよいし、正常に動作しているロボット900の動画像を個別に取得し、取得した動画像を元に生成してもよい。分割データを元に複数の基準データIDSが生成される場合には、一の基準データIDSの生成期間と他の基準データとの生成期間とが、一部重複していてもよいし重複していなくてもよい。
【0038】
図6は、学習済みの機械学習モデル200に任意の入力データIDを入力することによって得られる特徴スペクトルSpを示す説明図である。
図6では、具体例として1つの基準データIDSに応じた基準特徴スペクトルKSpを示す説明図である。
【0039】
図6の横軸は、ConvVN2層250の1つの部分領域R250に含まれる複数のノードの出力ベクトルに関するベクトル要素の位置である。このベクトル要素の位置は、各ノードにおける出力ベクトルの要素番号NDと、チャンネル番号NCとの組み合わせで表される。本実施形態では、ベクトル次元が16、つまり各ノードが出力する出力ベクトルの要素の数なので、出力ベクトルの要素番号NDは0から15までの16個である。また、ConvVN2層250のチャンネル数は6なので、チャンネル番号NCは0から5までの6個である。よって、特徴スペクトルSpの要素数は、16×6の96となる。この96の要素数から構成される特徴スペクトルSpによって、N枚の基準フレーム画像FMS1~FMSNによって構成された基準データIDSの特徴スペクトルSpが表される。特徴スペクトルSpは、1つの部分領域R250に含まれる各ベクトルニューロンの出力ベクトルの複数の要素値を、第3軸zに沿った複数のチャンネルにわたって配列したものである。
【0040】
図6の縦軸は、各スペクトル位置での特徴値CVを示す。この例では、特徴値CVは、出力ベクトルの各要素の値V
NDである。特徴値CVについては、平均値0へセンタリングするなどの統計処理を行ってもよい。なお、特徴値CVとしては、出力ベクトルの各要素の値V
NDと、後述する正規化係数とを乗算した値を使用してもよく、或いは、正規化係数をそのまま使用してもよい。後者の場合には、特徴スペクトルSpに含まれる特徴値CVの数はチャンネル数に等しく、6個である。なお、正規化係数は、そのノードの出力ベクトルのベクトル長さに相当する値である。
【0041】
1つの入力データIDに対してConvVN2層250の出力から得られる特徴スペクトルSpの数は、ConvVN2層250の平面位置(x,y)の数、すなわち、部分領域R250の数に等しいので、9個である。
【0042】
図7は、基準特徴スペクトル群KSpGの構成を示す説明図である。この例では、ConvVN2層250の出力から取得された既知特徴スペクトルとしての基準特徴スペクトルKSpの集合である基準特徴スペクトル群KSpGが示されている。なお、基準特徴スペクトル群KSpGとしては、少なくとも1つのベクトルニューロン層の出力から得られたものが登録されていればよく、ConvVN1層240やClassVN層260の出力から得られた基準特徴スペクトル群が登録されるようにしてもよい。
【0043】
基準特徴スペクトル群KSpGの個々のレコードは、層内の部分領域Rnの順序を示すパラメーターkと、データ番号を示すパラメーターqと、動画像における一定間隔ごとに区切られた単位期間を示すパラメーターtmと、基準特徴スペクトルKSpとを含んでいる。単位期間tmに含まれる時系列のフレーム画像の集合が、基準データIDSを構成する。例えば、同じデータ番号qの動画像を、単位期間tmごとに分割することで、複数の基準データIDSが生成される。基準特徴スペクトルKSpは、
図6の特徴スペクトルSpと同じものである。
【0044】
部分領域Rnのパラメーターkは、特定層に含まれる複数の部分領域Rnのいずれであるか、すなわち、平面位置(x,y)のいずれであるかを示す値を取る。ConvVN2層250については部分領域R250の数が16個なので、k=1~16である。データ番号のパラメーターqは、基準データIDSの元となる動画像を識別するための番号である。
【0045】
図8は、評価装置100が実行する評価工程のフローチャートである。まずステップS100において、対象データIDEが準備される。本実施形態では、原対象動画像を構成する複数の対象フレーム画像を用いて、評価対象物であるロボット900、詳細にはロボット900のアーム902を抽出した処理後対象フレーム画像を複数生成する。複数の評価フレーム画像は、センサー装置400によって取得された時系列に並んだ原対象動画像を構成する。この原対象動画像は、予め定めた予め定めた基準時間tsだけロボット900の動きを撮像したデータである。予め定めた基準時間tsは、基準データIDSの元データとなる原基準動画像RDの撮像時間である基準時間tsと同じであってもよいし異なっていてもよい。データ処理部113は、原基準動画像RDから基準データIDSを生成する画像処理と同じ方法で、原対象動画像から評価対象物である動いているロボット900のアーム902を抽出する画像処理を実行する。データ処理部113は、画像処理後の動画像から複数の単位期間tmごとのデータを抽出することで、複数の処理後対象フレーム画像から構成される対象データIDEが複数生成される。以上のように、データ処理部113は、ロボット900の動きを撮像して取得された原対象動画像を構成する複数の対象フレーム画像を用いて、ロボット900を抽出した処理後対象フレーム画像を複数生成する。これにより、データ処理部113は、時系列に並んだ複数の処理後対象フレーム画像を対象データIDEとして生成する。
【0046】
次に、ステップS110において、第2取得部116は、学習済み機械学習モデル200に対して、評価対象の対象データIDEを入力して、特定層であるConvVN2層250の出力から対象特徴スペクトルESpを取得する。対象特徴スペクトルESpのデータ構成は、
図6および
図7に示す基準特徴スペクトルKSpと同じである。
【0047】
次に、ステップS120において、算出部117は、基準特徴スペクトルKSpと対象特徴スペクトルESpとのスペクトル類似度RSpを算出する。対象特徴スペクトルESpは、
図6に示す特徴スペクトルSpと同じ構成であるスペクトル類似度RSpの算出方法の詳細は後述する。
【0048】
次に、ステップS130において、評価部119は、スペクトル類似度RSpを用いて対象データIDEの評価処理を実行する。
【0049】
図9は、ステップS130の詳細を示すフローチャートである。ステップS132において、評価部119は、スペクトル類似度RSpが閾値以上かどうかを判定する。評価部119は、スペクトル類似度RSpが閾値以上である場合には、ステップS134において対象データIDEを基準クラスに分類する。本実施形態では、上述のごとく、基準クラスはロボット900の動きが正常であることを示す「正常」のラベルである。一方で、評価部119は、スペクトル類似度RSpが閾値未満である場合には、ステップS136において、対象データIDEを基準クラスとは異なるクラスに分類する。本実施形態では、異なるクラスとは、ロボット900の動きに異常があることを示す「異常」のラベルである。また、本実施形態では、対象データIDEを構成する時系列に並んだ複数の処理後対象フレーム画像について、時系列に並ぶ複数の処理後対象フレーム画像に応じた個別対象特徴スペクトルIESpの集合ごと、すなわち単位期間tmごとにステップS130の評価処理が順次実行される。評価部119は、評価処理の結果を示す評価情報を表示部150に表示する。評価情報は、例えば、「異常」のラベル判定が成された時に、「異常」であることを示す情報と、「異常」のラベル分類が成された処理後対象フレーム画像の元となる対象フレーム画像が取得された時刻t、すなわち異常が発生した時刻情報と、を含む評価情報を表示部150に表示する。また評価情報は、スペクトル類似度RSpの大きさに応じた色情報であってもよい。例えば、評価部119は、スペクトル類似度RSpが高くなるに従い、赤色に近づく色を表示部に出力する。このように、評価部119は、スペクトル類似度RSpが閾値以上であるかどうかを判定することで、対象データIDEの単位期間tmごとのクラス分類を容易にできる。
【0050】
次にスペクトル類似度RSpの算出方法の一例について説明する。
図10は、スペクトル類似度RSpの第1の算出方法M1を示す説明図である。第1の算出方法M1では、まず、特定層であるConvVN2層250の出力から、部分領域Rn毎に局所スペクトル類似度S(j,k,tm)が算出される。また、本実施形態では、スペクトル類似度RSpの算出元が、複数のフレーム画像で構成された動画像である。よって、算出部117は、フレーム画像番号NFMが連続する時系列に並んだ一定数ごとのフレーム画像の集合である入力データIDを元に生成された特徴スペクトルSp同士のスペクトル類似度RSpを算出する。一定数は、
図9に示すステップS130の評価処理を実行する時間間隔Δtに応じた数である。動画像のフレームレートが60fpsである場合に、時間間隔Δtが0.5秒である場合には、一定数は30である。つまり、対象データIDEと基準データIDSのそれぞれは、フレーム画像番号NFMが連続する30個のフレーム画像の集合である。この対象データIDEと基準データIDSのそれぞれを入力データIDとして機械学習モデル200に入力することで生成された特徴スペクトルSp同士のスペクトル類似度RSpが算出される。スペクトル類似度RSpの算出元となる対象データIDEと基準データIDSのそれぞれについて、連続するフレーム画像番号NFMの数は同じであることが好ましい。またスペクトル類似度RSpの算出元となる対象データIDEと基準データIDSのそれぞれについて、対象データIDEを構成するフレーム画像のフレーム画像番号NFMと、基準データIDSを構成するフレーム画像のフレーム画像番号NFMとは一致していてもよいし、異なっていてもよい。以下では、スペクトル類似度RSpの算出方法の一例を説明する。
【0051】
第1の算出方法M1において、局所スペクトル類似度S(j,k,tm)は次式を用いて算出される。
S(j,k,tm)=max[G{ESp(j,k,tm), KSp(j,k=all,q=all,tm=all)}] (c1)
jは、特定層を示すパラメーターである。
kは、部分領域Rnを示すパラメーターである。
qは、データ番号を示すパラメーターである。
tmは、動画像における、一定間隔ごとに区切られた単位期間を示すパラメーターである。各単位期間の時間は同じである。
図10では、単位期間tmが「1」のときの図である。
G{a,b}は、aとbのスペクトル類似度を求める関数である。
ESp(j,k,tm)は、特定層jの特定の部分領域Rnの出力から得られる対象特徴スペクトルESpのうち、動画像である対象データIDEのパラメーターtmが示す単位期間に取得された複数のフレーム画像の集合に応じた対象特徴スペクトルESpである。
max[X]は、Xの値のうちの最大値を取る論理演算である。
KSp(j,k,q=all,tm=all)は、特定層jの特定の部分領域Rnの出力から得られる全てのデータ番号qの基準特徴スペクトルKSpのうち、全ての単位期間ごとに取得された複数のフレーム画像の集合に応じた基準特徴スペクトルKSpである。
なお、局所スペクトル類似度を求める関数G{a,b}としては、例えば、コサイン類似度を求める式や、距離に応じた類似度を求める式を使用できる。
【0052】
図11は、上記算出式(c1)の概念図である。上記式(c1)の算出方法において、対象データIDEの単位期間tm、例えば単位期間tm1に応じた特徴スペクトルSpに対するスペクトル類似度RSpの比較対象として、基準データIDSの全ての単位期間tm0~tm(N-1)のそれぞれに応じた特徴スペクトルSpが用いられる。また、対象データIDEの単位期間tm、例えば単位期間tm1に応じた特徴スペクトルSpに対するスペクトル類似度RSpの比較対象として、全てのデータ番号qの基準データIDSが用いられる。
【0053】
図12は、スペクトル類似度RSpの第2の算出方法M2を示す説明図である。第2の算出方法M2において、局所スペクトル類似度S(j,k nf,ff)は次式を用いて算出される。
S(j,k,tm)=max[G{ESp(j,k,tm), KSp(j,k,q=all,tm=all)}] (c2)
【0054】
上述した第1の算出方法M1では、特定層jのすべての部分領域kにおける基準特徴スペクトルKSp(j,k=all,q=all,tm=all)を用いていたのに対して、第2の算出方法M2では、個別対象特徴スペクトルIESpの部分領域kと同じ部分領域kに対する基準特徴スペクトルKSpのみを用いている。第2の算出方法M2における他の方法は、第1の算出方法M1と同じである。
【0055】
図13は、第3の算出方法M3を示す説明図である。第3の算出方法M3では、次式を用いてスペクトル類似度RSpが算出される。
RSp(j,k,tm)=max[G{ESp(j,k=all,tm), KSp(j,k=all,q=all,tm=all)}] (c2)
すなわち、ある単位期間tmの対象データIDEにおいて特定層jから生成された全ての部分領域Rnの出力から得られた複数の対象特徴スペクトルESpのそれぞれと、全ての基準データIDSのそれぞれについて、全ての部分領域Rnの出力から得られた基準特徴スペクトルKSpのそれぞれとを比較して、複数の個別スペクトル類似度Sを算出する。そして算出された個別スペクトル類似度Sのうちの最大値がスペクトル類似度RSpとして算出される。
【0056】
なお、上記の第1の算出方法M1~第3の算出方法M3に関し、同じ単位期間tmの対象データIDEと基準データIDSのそれぞれを比較して個別スペクトル類似度Sを算出することで、スペクトル類似度RSpを算出してもよい。
【0057】
図14は、本実施形態の評価装置100の評価結果を示す図である。MNISTデータの画像を汎用学習データLDとする学習セットLSを10000セット準備して、機械学習モデル200の学習が行われた。基準データIDSは、正常に動作するロボット900の動画像である。一方で、対象データIDEは、時刻t12までの一定期間が正常に動作し、時刻t12以降の残りの他期間が異常動作しているロボット900の動画像である。
図14に示す時刻t12以降のシングルハッチングで示した期間が、ロボット900が異常動作している期間である。スペクトル類似度RSpは、各単位期間の終了時点ごとに算出される。本実施形態では、例えば、時間t0~時間t1の単位期間におけるスペクトル類似度RSpは、時間t1の直後に算出される。また、
図9に示すステップS132の閾値thは、対象データIDEが示すロボット900が正常に動作している一定期間の単位期間ごとのスペクトル類似度RSpである正常時スペクトル類似度を元に設定している。具体的には、閾値thは、各正常時スペクトル類似度の平均値から、各正常時スペクトル類似度の分布の3σを差し引いた値に設定した。
【0058】
評価装置100が対象データIDEを評価した結果について、ロボット900が正常に動作している時刻t12までの期間において、スペクトル類似度RSpは閾値th以上であり、対象データIDEは正常を示す基準クラスに分類判定される。また、ロボット900が異常動作している時刻t12以降の期間において、スペクトル類似度RSpが閾値th未満である割合は90%を超えていた。よって、時刻t12以降の期間において、対象データIDEが異常を示すクラスに正しく分類判定される確率は高い。よって、汎用学習データLDを用いて学習を行った機械学習モデル200を用いた対象データIDEの評価結果の精度は高い。
【0059】
上記実施形態によれば、評価対象である対象データIDEとは異なる種類の汎用学習データLDを用いて機械学習モデル200を学習することで、対象データIDEの種類が異なり機械学習モデル200を用いる目的が異なった場合でも、目的ごとに機械学習モデル200に対する学習セットを準備する必要がない。またこの形態によれば、対象データIDEの評価は、出力層から出力される各クラスに応じた判定値を用いた評価ではなく、特定層の出力から取得された特徴スペクトルSpを用いて対象データIDEの評価を行っている。これにより、汎用学習データLDを用いて機械学習モデル200の学習を行った場合でも、対象データIDEの評価を精度良く行うことができる。
【0060】
また上記実施形態によれば、原基準動画像RDから基準対象物であるロボット900のアーム902を抽出した基準データIDSから基準特徴スペクトルKSpを取得している。これにより、スペクトル類似度RSpを算出するための比較元となるロボット900、特にロボット900の正常動作についての特徴をより表した特徴スペクトルSpを取得できる。よって、対象データIDEの評価精度をより向上できる。また上記実施形態によれば、原対象物動画像から評価対象物であるロボット900を抽出した対象データIDEから対象特徴スペクトルESpを取得していることから、ロボット900、特にロボット900の動きについての特徴をより表した特徴スペクトルSpを取得できる。これにより、対象データIDEの評価精度をより向上できる。
【0061】
B.他の実施形態:
B-1.他の実施形態1:
上記実施形態では、汎用学習データLD、基準データIDS、対象データIDEが動画像であったが、各データは、静止画像であってもよく、第1軸に物理量、第2軸に時間を規定した二次元データであってもよい。二次元データは、例えば、電圧の時間変化を示すデータである。また、上記実施形態では、対象データIDEが示すロボット900の動作が正常かどうかの判定を行うことを目的として、学習済みの機械学習モデル200が用いられたが、この目的以外にも学習済み機械学習モデル200が用いられてもよい。以下に具体例を説明する。
【0062】
本開示の評価装置100は、運動機器を用いた評価に適用できる。運動機器は、評価装置100と有線や無線によってデータ通信できる。運動機器は、例えば、トレッドミルやエアロバイク(登録商標)や筋力トレーニングマシンである。トレッドミルは、使用者の設定に基づきモーターによるベルトが移動し、使用者がベルト上を歩いたり走ったりする運動を行うことができる機器である。トレッドミルは、モーターおよびベルトを有するトレッドミル本体と、使用者の筋肉の状態を計測可能なセンサー装置400の一例である超音波装置と、トレッドミル本体および超音波装置を制御するためのコントローラーとを備える。筋力トレーニングマシンは、ウェイトトレーニングにおいて使用者のトレーニング対象となる対象部位に掛ける負荷を電気的に変更可能である。
【0063】
機械学習モデル200は、静止画像であるMNISTデータである汎用学習データLDと、汎用学習データLDに関連付けられたラベルLBとを一つのセットする複数の学習セットを用いて学習される。
【0064】
基準データIDSは、例えば、使用者以外の被験者における対象部位の筋肉の状態を示すデータであり、超音波装置によって取得された筋肉の超音波画像である。また、基準データIDSに関連付けられた基準評価は、被験者の対象部位における筋肉の状態が良好な状態、すなわち対象部位における筋肉に疲労を感じていない状態であることを示す。
【0065】
対象データIDEは、使用者が運動機器を用いて運動している時の対象部位における筋肉の超音波画像である。対象データIDEは、一定時間ごとに取得され評価される。評価装置100は、基準データIDSの基準特徴スペクトルKSpと、対象データIDEの対象特徴スペクトルESpとのスペクトル類似度RSpを算出する。評価部119は、算出されたスペクトル類似度RSpが閾値以上である場合には、使用者の対象部位が疲労していないことを示すクラス分類を行う。一方で、評価部119は、算出されたスペクトル類似度RSpが閾値未満である場合には、使用者の対象部位が疲労していることを示すクラス分類を行い、所定の後処理を行う。後処理としては、運動機器の負荷を下げたり運動機器による運動を停止したりすることを促す警告情報を表示部150によって表示させたり、運動機器に対して負荷を下げる指令や動作を停止する指令である負荷低減指令を送信したりする。トレッドミルにおいて負荷を下げる場合には、トレッドミルのコントローラーは、モーターの回転速度を減速させる。
【0066】
また、複数段階の基準評価ごとに基準データIDSが準備されてもよい。例えば、被験者の対象部位の疲労度を、複数段階に分類し、基準評価である疲労度ごとに対象データIDEを取得する。例えば、基準評価について、疲労度を「低」、「中」、「高」の三段階で表し、基準評価ごとに応じた基準データIDSからそれぞれ基準特徴スペクトルKSpが取得されてもよい。算出部117は、疲労度ごとに応じた基準特徴スペクトルKSpと、対象データIDEの対象特徴スペクトルESpとのスペクトル類似度RSpを基準評価ごと、すなわち疲労度ごとに算出する。評価部119は、基準評価ごとに算出された複数のスペクトル類似度RSpのうちで最も大きい値を示すスペクトル類似度RSpの算出元となった基準特徴スペクトルKSpを特定する。評価部119は、特定した基準特徴スペクトルKSpに関連付けられた基準評価、すなわち疲労度を使用者の対象部位の疲労度として評価する。評価部119は、評価した疲労度に応じた負荷設定指令を運動機器に指令を送信する。
【0067】
なお、対象データIDEや基準データIDSが動画像ではなく、時刻ごとに取得された静止画像や、一定時間の間、センサー装置400によって検出した電圧や電流などの物理量を示すデータである場合、上記第1の算出方法から第3の算出方法において、パラメーターtmは省略される。
【0068】
C.他の形態:
本開示は、上述した実施形態に限られるものではなく、その趣旨を逸脱しない範囲において種々の形態で実現することができる。例えば、本開示は、以下の形態(aspect)によっても実現可能である。以下に記載した各形態中の技術的特徴に対応する上記実施形態中の技術的特徴は、本開示の課題の一部又は全部を解決するために、あるいは、本開示の効果の一部又は全部を達成するために、適宜、差し替えや、組み合わせを行うことが可能である。また、その技術的特徴が本明細書中に必須なものとして説明されていなければ、適宜、削除することが可能である。
【0069】
(1)本開示の第1の形態によれば、対象データの評価を行う評価方法が提供される。この評価方法は、(a)複数のベクトルニューロン層を有するベクトルニューラルネットワーク型の機械学習モデルに、前記対象データとは異なる種類の汎用学習データと、前記汎用学習データに対応するラベルとの学習セットを複数入力して、前記機械学習モデルを学習する工程と、(b)前記工程(a)の後に、学習済み機械学習モデルに対して、前記対象データと同じ種類の基準データであって前記評価が予め定めた基準評価を示す基準データを入力して、前記学習済み機械学習モデルの特定層の出力から特徴スペクトルとしての基準特徴スペクトルを取得する工程と、(c)前記工程(a)の後に、前記学習済み機械学習モデルに対して、評価対象の前記対象データを入力して、前記特定層の出力から前記特徴スペクトルとしての対象特徴スペクトルを取得する工程と、(d)前記基準特徴スペクトルと前記対象特徴スペクトルとの類似度であるスペクトル類似度を算出する工程と、(e)前記スペクトル類似度を用いて前記対象データの評価を行う工程と、を備える。この形態によれば、評価対象である対象データとは異なる種類の汎用学習データを用いて機械学習モデルを学習することで、対象データの種類が異なり機械学習モデルを用いる目的が異なった場合でも、目的ごとに機械学習モデルに対する学習セットを準備する必要がない。またこの形態によれば、対象データの評価は、出力層から出力される各クラスに応じた判定値を用いた評価ではなく、特定層の出力から取得された特徴スペクトルを用いて対象データの評価を行っている。これにより、汎用学習データを用いて機械学習モデルの学習を行った場合でも、対象データの評価を精度良く行うことができる。
【0070】
(2)上記形態において、前記工程(e)は、2以上のクラスに関するクラス分類によって前記対象データの評価を行い、前記基準評価は、基準クラスに分類された評価であり、前記工程(e)は、前記スペクトル類似度が予め定めた閾値以上である場合には、前記対象データを前記基準クラスに分類し、前記スペクトル類似度が前記閾値未満である場合には、前記対象データを前記基準クラスとは異なるクラスに分類してもよい。この形態によれば、スペクトル類似度が閾値以上であるかどうかを判定することで、対象データのクラス分類を容易にできる。
【0071】
(3)上記形態において、複数のベクトルニューロン層は、入力されるデータである前記対象データの側から順に、中間層である畳み込みベクトルニューロン層と、出力層である分類ベクトルニューロン層とを有し、前記特定層は、前記中間層であってもよい。この形態によれば、中間層の出力から取得した特徴スペクトルを用いた対象データの評価を行うことができる。
【0072】
(4)上記形態において、前記汎用学習データと前記基準データと前記対象データとはそれぞれ、時系列に並んだ複数のフレーム画像によって構成された動画像であり、前記評価方法は、さらに、(f)基準対象物の動きを撮像して取得された原基準動画像を構成する複数の基準フレーム画像を用いて、前記基準対象物を抽出した処理後基準フレーム画像を複数生成することで、時系列に並んだ複数の前記処理後基準フレーム画像を前記基準データとして生成する工程を有していてもよい。この形態によれば、原基準動画像から基準対象物を抽出した基準データから基準特徴スペクトルを取得していることから、基準対象物の特徴をより表した特徴スペクトルを取得できる。これにより、対象データの評価精度をより向上できる。
【0073】
(5)上記形態において、前記汎用学習データと前記基準データと前記対象データとはそれぞれ、時系列に並んだ複数のフレーム画像によって構成された動画像であり、前記評価方法は、さらに、(g)評価対象物の動きを撮像して取得された原対象動画像を構成する複数の対象フレーム画像を用いて、前記評価対象物を抽出した処理後対象フレーム画像を複数生成することで、時系列に並んだ複数の前記処理後対象フレーム画像を前記対象データとして生成する工程を有していてもよい。
【0074】
(6)本開示の第2の形態によれば、対象データの評価を行う評価装置が提供される。この評価装置は、複数のベクトルニューロン層を有するベクトルニューラルネットワーク型の機械学習モデルに、前記対象データとは異なる種類の汎用学習データと、前記汎用学習データに対応するラベルとの学習セットを複数入力して、前記機械学習モデルを学習する学習実行部と、学習済み機械学習モデルに対して、前記対象データと同じ種類の基準データであって前記評価が基準評価を示す基準データを入力して、前記学習済み機械学習モデルの特定層の出力から特徴スペクトルとして基準特徴スペクトルを取得する第1取得部と、前記学習済み機械学習モデルに対して、評価対象の前記対象データを入力して、前記特定層の出力から前記特徴スペクトルとしての対象特徴スペクトルを取得する第2取得部と、前記基準特徴スペクトルと前記対象特徴スペクトルとの類似度であるスペクトル類似度を算出部と、前記スペクトル類似度を用いて前記対象データの評価を行う評価部と、を備える。この形態によれば、評価対象である対象データとは異なる種類の汎用学習データを用いて機械学習モデルを学習することで、対象データの種類が異なり機械学習モデルを用いる目的が異なった場合でも、目的ごとに機械学習モデルに対する学習セットを準備する必要がない。またこの形態によれば、対象データの評価は、出力層から出力される各クラスに応じた判定値を用いた評価ではなく、特定層の出力から取得された特徴スペクトルを用いて対象データの評価を行っている。これにより、汎用学習データを用いて機械学習モデルの学習を行った場合でも、対象データの評価を精度良く行うことができる。
【0075】
(7)本開示の第3の形態によれば、対象データの評価を行うコンピューターに実行させるコンピュータープログラムが提供される。このコンピュータープログラムは、(a)複数のベクトルニューロン層を有するベクトルニューラルネットワーク型の機械学習モデルに、前記対象データとは異なる種類の汎用学習データと、前記汎用学習データに対応するラベルとの学習セットを複数入力して、前記機械学習モデルを学習する機能と、(b)前記機能(a)を実行した後に、学習済み機械学習モデルに対して、前記対象データと同じ種類の基準データであって前記評価が基準評価を示す基準データを入力して、前記学習済み機械学習モデルの特定層の出力から特徴スペクトルとしての基準特徴スペクトルを取得する機能と、(c)前記機能(a)を実行した後に、前記学習済み機械学習モデルに対して、評価対象の前記対象データを入力して、前記特定層の出力から前記特徴スペクトルとしての対象特徴スペクトルを取得する機能と、(d)前記基準特徴スペクトルと前記対象特徴スペクトルとの類似度であるスペクトル類似度を算出する機能と、(e)前記スペクトル類似度を用いて前記対象データの評価を行う機能と、を備える。この形態によれば、評価対象である対象データとは異なる種類の汎用学習データを用いて機械学習モデルを学習することで、対象データの種類が異なり機械学習モデルを用いる目的が異なった場合でも、目的ごとに機械学習モデルに対する学習セットを準備する必要がない。またこの形態によれば、対象データの評価は、出力層から出力される各クラスに応じた判定値を用いた評価ではなく、特定層の出力から取得された特徴スペクトルを用いて対象データの評価を行っている。これにより、汎用学習データを用いて機械学習モデルの学習を行った場合でも、対象データの評価を精度良く行うことができる。
【0076】
本開示は、上記以外の種々の形態で実現することも可能である。例えば、コンピュータープログラムを記録した一時的でない記録媒体(non-transitory storage medium)等の形態で実現することができる。
【符号の説明】
【0077】
ESp…対象特徴スペクトル、FMK…基準フレーム画像、FML…フレーム画像、FMS…処理後基準フレーム画像、ID…データ、IDE…対象データ、IDS…基準データ、KSp…基準特徴スペクトル、KSpG…基準特徴スペクトル群、LB…ラベル、LD…汎用学習データ、LS…学習セット、LSG…学習セット群、Rn…部分領域、R…回転方向、RD…原基準動画像、Sp…特徴スペクトル、x…第1軸、y…第2軸、z…第3軸、5…評価システム、100…評価装置、110…プロセッサー、112…学習実行部、113…データ処理部、114…スペクトル取得部、115…第1取得部、116…第2取得部、117…算出部、118…評価処理部、119…評価部、120…記憶装置、130…インターフェイス回路、140…入力デバイス、150…表示部、200…機械学習モデル、220…畳み込み層、230…プライマリーベクトルニューロン層、240…第1畳み込みベクトルニューロン層、250…第2畳み込みベクトルニューロン層、260…分類ベクトルニューロン層、400…センサー装置、900…ロボット、901…基台、902…アーム、923,924…物体