(19)【発行国】日本国特許庁(JP)
(12)【公報種別】公開特許公報(A)
(11)【公開番号】P2023178454
(43)【公開日】2023-12-14
(54)【発明の名称】学習装置、学習方法及びプログラム
(51)【国際特許分類】
G06V 10/778 20220101AFI20231207BHJP
G06T 7/00 20170101ALI20231207BHJP
【FI】
G06V10/778
G06T7/00 350B
【審査請求】有
【請求項の数】24
【出願形態】OL
(21)【出願番号】P 2023183772
(22)【出願日】2023-10-26
(62)【分割の表示】P 2022531312の分割
【原出願日】2020-06-24
(71)【出願人】
【識別番号】000004237
【氏名又は名称】日本電気株式会社
(74)【代理人】
【識別番号】100110928
【弁理士】
【氏名又は名称】速水 進治
(72)【発明者】
【氏名】劉 健全
(72)【発明者】
【氏名】石原 賢太
(57)【要約】
【課題】異常を検出する推定モデルを生成するための教師画像を効率的に収集する。
【解決手段】本発明は、画像を取得する取得部と、取得された画像と、予め蓄積された異常状態を示す第1の画像との類似度を算出する類似度算出部と、類似度が第1の基準値以下の取得された画像を、正常状態を示す第2の画像として登録する登録部と、第1の画像及び第2の画像を用いた機械学習により、正常/異常を判別する推定モデルを生成する学習部と、を有する学習装置を提供する。
【選択図】
図2
【特許請求の範囲】
【請求項1】
画像を取得する取得手段と、
前記取得された画像と、予め蓄積された異常状態を示す第1の画像との類似度を算出する類似度算出手段と、
前記類似度が第1の基準値以下の前記取得された画像を、正常状態を示す第2の画像として登録する登録手段と、
前記第1の画像及び前記第2の画像を用いた機械学習により、正常/異常を判別する推定モデルを生成する学習手段と、
を有する学習装置。
【請求項2】
前記登録手段は、前記類似度が第2の基準値以上の前記取得された画像を、異常状態を示す第3の画像として登録し、
前記学習手段は、前記第1の画像、前記第2の画像及び前記第3の画像を用いた機械学習により、前記推定モデルを生成する請求項1に記載の学習装置。
【請求項3】
前記登録手段は、前記類似度が第2の基準値以上の前記取得された画像を、前記第1の画像として登録する請求項1に記載の学習装置。
【請求項4】
前記学習手段は、登録された画像の中から一部を選択し、選択した画像を用いた機械学習により、前記推定モデルを生成する請求項1から3のいずれか1項に記載の学習装置。
【請求項5】
前記推定モデルを用いて、前記取得された画像が示す状態を判別する学習時推定手段と、
前記学習時推定手段により異常状態を示すと判別された前記取得された画像を出力し、ユーザによる正誤入力を受付けるユーザ確認手段と、
をさらに有し、
前記登録手段は、前記正誤入力で異常状態を示すことが入力された前記取得された画像を、前記第1の画像として登録する請求項1から4のいずれか1項に記載の学習装置。
【請求項6】
前記学習手段は、互いに異なるアルゴリズムで学習する複数の前記推定モデル各々の学習を実行し、
前記学習時推定手段は、複数の前記推定モデル各々を用いて、前記取得された画像が示す状態を判別し、複数の前記推定モデル各々の判別結果を蓄積する請求項5に記載の学習装置。
【請求項7】
前記取得手段は、監視カメラが生成した画像を取得する請求項1から6のいずれか1項に記載の学習装置。
【請求項8】
コンピュータが、
画像を取得し、
前記取得された画像と、予め蓄積された異常状態を示す第1の画像との類似度を算出し、
前記類似度が第1の基準値以下の前記取得された画像を、正常状態を示す第2の画像として登録し、
前記第1の画像及び前記第2の画像を用いた機械学習により、正常/異常を判別する推定モデルを生成する学習方法。
【請求項9】
コンピュータを、
画像を取得する取得手段、
前記取得された画像と、予め蓄積された異常状態を示す第1の画像との類似度を算出する類似度算出手段、
前記類似度が第1の基準値以下の前記取得された画像を、正常状態を示す第2の画像として登録する登録手段、
前記第1の画像及び前記第2の画像を用いた機械学習により、正常/異常を判別する推定モデルを生成する学習手段、
として機能させるプログラム。
【請求項10】
請求項1から7のいずれか1項に記載の学習装置により生成された推定モデルを用いて正常/異常を判別する推定装置。
【発明の詳細な説明】
【技術分野】
【0001】
本発明は、学習装置、推定装置、学習方法及びプログラムに関する。
【背景技術】
【0002】
特許文献1は、正解及び不正解の教師画像に基づいた学習により、入力画像を、良画像又は不良画像に分類する推定モデルを生成する技術を開示している。良画像は、正解の教師画像との類似度合が高い画像であり、不良画像は正解の教師画像との類似度合が低い画像である。特許文献2は、異常行動を示す教師画像により異常行動を定義し、定義した異常行動を検出する推定モデルを生成する技術を開示している。
【先行技術文献】
【特許文献】
【0003】
【特許文献1】特開2020-35097号公報
【特許文献2】特開2019-053384号公報
【発明の概要】
【発明が解決しようとする課題】
【0004】
異常を検出する推定モデルを生成する技術において、教師画像を効率的に収集する技術が望まれている。特許文献1は、当該課題及び解決手段を開示していない。特許文献2に記載の技術の場合、異常行動を示す教師画像を大量に収集する必要がある。しかし、「異常」を示す教師画像を収集することは容易でない。本発明は、異常を検出する推定モデルを生成するための教師画像を効率的に収集する技術を提供することを課題とする。
【課題を解決するための手段】
【0005】
本発明によれば、
画像を取得する取得手段と、
前記取得された画像と、予め蓄積された異常状態を示す第1の画像との類似度を算出する類似度算出手段と、
前記類似度が第1の基準値以下の前記取得された画像を、正常状態を示す第2の画像として登録する登録手段と、
前記第1の画像及び前記第2の画像を用いた機械学習により、正常/異常を判別する推定モデルを生成する学習手段と、
を有する学習装置が提供される。
【0006】
また、本発明によれば、
コンピュータが、
画像を取得し、
前記取得された画像と、予め蓄積された異常状態を示す第1の画像との類似度を算出し、
前記類似度が第1の基準値以下の前記取得された画像を、正常状態を示す第2の画像として登録し、
前記第1の画像及び前記第2の画像を用いた機械学習により、正常/異常を判別する推定モデルを生成する学習方法が提供される。
【0007】
また、本発明によれば、
コンピュータを、
画像を取得する取得手段、
前記取得された画像と、予め蓄積された異常状態を示す第1の画像との類似度を算出する類似度算出手段、
前記類似度が第1の基準値以下の前記取得された画像を、正常状態を示す第2の画像として登録する登録手段、
前記第1の画像及び前記第2の画像を用いた機械学習により、正常/異常を判別する推定モデルを生成する学習手段、
として機能させるプログラムが提供される。
【0008】
また、本発明によれば、前記学習装置により生成された推定モデルを用いて正常/異常を判別する推定装置が提供される。
【発明の効果】
【0009】
本発明によれば、異常を検出する推定モデルを生成するための教師画像を効率的に収集することが可能となる。
【図面の簡単な説明】
【0010】
【
図1】本実施形態の学習装置の処理の流れの一例を示すフローチャートである。
【
図2】本実施形態の学習装置の機能ブロック図の一例である。
【
図3】本実施形態の学習装置の処理の流れの一例を詳細に示す図である。
【
図4】本実施形態の学習装置のハードウエア構成例を示す図である。
【
図5】本実施形態の学習装置の機能ブロック図の一例である。
【
図6】本実施形態の学習装置の処理の流れの一例を詳細に示す図である。
【発明を実施するための形態】
【0011】
以下、本発明の実施の形態について、図面を用いて説明する。尚、すべての図面において、同様な構成要素には同様の符号を付し、適宜説明を省略する。
【0012】
<第1の実施形態>
本実施形態の学習装置(以下、単に「学習装置」という場合がある)は、入力された画像が示す状態が、正常か異常かを判別する推定モデルを生成する。
【0013】
正常/異常の判別対象は、例えば場所(公園、駅、施設など)である。大多数の時間において観察される通常の状態が正常と判別され、通常の状態と異なる状態が異常と判別される。例えば異常行動を行っている人物が存在する状態や、その場所に常に存在する物が故障したり移動したりした状態等が異常と判別される。異常行動は、画像で観察される大多数の人が行う行動と異なる行動である。なお、判別対象は、その他、工場、店舗、施設、オフィス等の設備であってもよいし、その他であってもよい。いずれにおいても、大多数の時間において観察される通常の状態が正常と判別され、通常の状態と異なる状態が異常と判別される。
【0014】
学習装置は、
図1に示すサイクルを繰り返し実行することで、上記推定モデルを生成する。
図1に示すように、学習装置は、第1の画像登録処理S1、画像選択処理S2、学習処理S3、推定処理S4、ユーザ確認処理S5、第2の画像登録処理S6をこの順に繰り返し実行する。なお、処理順は、同様の作用効果が実現される範囲で変更してもよい。
【0015】
図2に、学習装置10の機能ブロック図の一例を示す。図示するように、学習装置10は、取得部11と、類似度算出部12と、登録部13と、学習部14と、学習時推定部15と、ユーザ確認部16と、画像記憶部17と、推定モデル記憶部18とを有する。これらの機能部により、
図1に示す各処理が実行される。
【0016】
図3は、
図1のサイクルをより詳細に示す図である。当該図を用いて、
図1に示す各処理及び
図2に示す各機能部の処理を説明する。
【0017】
「第1の画像登録処理S1」
第1の画像登録処理S1は、カメラが生成した画像と、予め登録されている異常状態を示す画像との類似度に基づき、カメラが生成した画像を分類・登録する処理である。
【0018】
図3の第1乃至第3の画像群DB17-1乃至17-3、カメラD14、類似度算出S10及び登録S11が、当該処理に関係する。そして、
図2の取得部11、類似度算出部12、登録部13及び画像記憶部17が、当該処理に関係する。第1乃至第3の画像群DB17-1乃至17-3は、
図2の画像記憶部17により実現される。
【0019】
まず、当該処理の前準備として、第1の画像群DB(データベース)17-1に、異常状態のラベルを付与されたラベル付き画像が記憶される。ユーザは、予め異常状態を示す画像をいくつか用意し、異常状態のラベルを付与して第1の画像群DB17-1に記憶させる。このようにして蓄積される第1の画像群DB17-1内の画像は、ユーザにより異常状態を示すことを確認された、信頼度の高いラベル付き画像である。なお、第1の画像群DB17-1に最初に記憶させる画像は、数十枚から数百枚程度でよく、大量の画像は不要である。この程度の数であれば、ラベル付き画像の収集に要するユーザ負担は大きくない。なお、予め異常状態を定義しておき、その異常状態を検出する推定モデルを生成する場合、一般的に、異常状態を示す教師画像を数千枚から数万枚以上用意する必要がある。第1の画像群DB17-1は、
図2の画像記憶部17に対応する。以下、第1の画像群DB17-1に記憶されている異常状態を示す画像を「第1の画像」と呼ぶ。
【0020】
取得部11は、カメラD14が生成した画像を取得する。カメラD14は、正常/異常の判別対象を撮影するカメラ(監視カメラ等)であってもよいし、判別対象と同種の対象を撮影するカメラであってもよい。カメラD14は、動画像を撮影してもよいし、動画像よりも長いフレーム間隔で連続的に静止画像を撮影してもよい。図では、1つのカメラD14が示されているが、複数のカメラD14が利用されてもよい。
【0021】
取得部11は、カメラD14が生成した画像をリアルタイム処理で取得してもよい。この場合、学習装置10とカメラD14とは互いに通信可能に構成される。その他、取得部11は、カメラD14が生成した画像をバッチ処理で取得してもよい。この場合、カメラD14が有する記憶装置、又は、その他の任意の記憶装置内にカメラD14が生成した画像が蓄積され、取得部11は任意のタイミングでその蓄積された画像を取得する。
【0022】
なお、本明細書において、「取得」とは、ユーザ入力に基づき、又は、プログラムの指示に基づき、「自装置が他の装置や記憶媒体に格納されているデータを取りに行くこと(能動的な取得)」、たとえば、他の装置にリクエストまたは問い合わせして受信すること、他の装置や記憶媒体にアクセスして読み出すこと等、および、ユーザ入力に基づき、又は、プログラムの指示に基づき、「自装置に他の装置から出力されるデータを入力すること(受動的な取得)」、たとえば、配信(または、送信、プッシュ通知等)されるデータを受信すること、また、受信したデータまたは情報の中から選択して取得すること、及び、「データを編集(テキスト化、データの並び替え、一部データの抽出、ファイル形式の変更等)などして新たなデータを生成し、当該新たなデータを取得すること」の少なくともいずれか一方を含む。
【0023】
類似度算出部12は、取得部11により取得された画像(以下、「取得画像」という)と、予め第1の画像群DB17-1に蓄積された異常状態を示す第1の画像との類似度を算出する(
図3のS10)。類似度算出部12は、第1の画像群DB17-1に蓄積された複数の第1の画像各々と、各取得画像との類似度を算出してもよい。その他、類似度算出部12は、第1の画像群DB17-1に蓄積された複数の第1の画像に基づき生成した1つの画像(例:平均画像)と、各取得画像との類似度を算出してもよい。
【0024】
なお、画像間の類似度の算出においては、様々な手法が提案されている。本実施形態では、あらゆる手法を採用することができる。例えば、類似度算出部12は、画像内から物体を検出し、検出結果の類似度(検出された物体の数の類似度、検出された物体の外観の類似度等)を算出してもよい。また、類似度算出部12は、深層学習で生成された画像解析を行う推定モデルに各画像を入力し、得られた画像の解析結果(画像が示す物体の認識結果、画像が示す場面の認識結果等)の類似度を算出してもよい。また、類似度算出部12は、画像の全体又は局所部分に現れる色や輝度の類似度を算出してもよい。
【0025】
登録部13は、類似度が第1の基準値以下の取得画像を、正常状態を示す第2の画像(正常状態のラベルを付与した画像)として第2の画像群DB(データベース)17-2に登録する(S11)。類似度算出部12が、第1の画像群DB17-1に蓄積された複数の第1の画像各々と、各取得画像との類似度を算出する場合、登録部13は、複数の第1の画像のすべてと類似度が第1の基準値以下である取得画像を、第2の画像として第2の画像群DB17-2に登録する。
【0026】
また、登録部13は、類似度が第2の基準値以上の取得画像を、異常状態を示す第3の画像(異常状態のラベルを付与した画像)として第3の画像群DB(データベース)17-3に登録する(S11)。類似度算出部12が、第1の画像群DB17-1に蓄積された複数の第1の画像各々と、各取得画像との類似度を算出する場合、登録部13は、複数の第1の画像の中の少なくとも1つとの類似度が第2の基準値以上である取得画像を、第3の画像として第3の画像群DB17-3に登録する。
【0027】
第3の画像群DB17-3には、このようにコンピュータにより第1の画像と所定レベル以上類似していると判定された画像が、異常状態を示す画像として登録される。この点で、ユーザにより異常状態を示すことを確認された、信頼度の高い第1の画像が記憶される第1の画像群DB17-1と異なる。
【0028】
第1の基準値と第2の基準値は同じ値であってもよいし、異なる値であってもよい。しかし、第1の基準値と第2の基準値とを異なる値とし、第1の基準値を十分に小さい値とするとともに、第2の基準値を十分に大きい値とすることで、第1の画像との類似度が高くもなく低くもないグレーゾーン(類似度が第1の基準値より大、第2の基準値未満)に存在する取得画像を、第2の画像や第3の画像として登録する不都合を抑制できる。
【0029】
「画像選択処理S2、学習処理S3」
画像選択処理S2は、第1乃至第3の画像群DB17-1乃至17-3に蓄積されている画像の中から、教師画像とする画像を選択する処理である。学習処理S3は、選択された画像を教師画像として、推定モデルDB(データベース)18-1に登録されている複数の推定モデル各々の学習を実行する処理である。
【0030】
図3の第1乃至第3の画像群DB17-1乃至17-3、推定モデルDB18-1、選択S12及び学習S13が、当該処理に関係する。そして、
図2の学習部14、画像記憶部17及び推定モデル記憶部18が、当該処理に関係する。推定モデルDB18-1は、
図2の推定モデル記憶部18により実現される。
【0031】
まず、推定モデルDB18-1には、複数の推定モデルの情報が記憶される。複数の推定モデルはいずれも、入力された画像が示す状態が、正常か異常かを判別するモデルである。複数の推定モデルは、学習及び推定のアルゴリズムが互いに異なる。例えば、複数の推定モデルは、深層学習で生成される。本実施形態では、例えば、ニューラルネットワーク、ベイジアンネットワーク、回帰分析、サポートベクトルマシン(SVM)、決定木、遺伝的アルゴリズム、最近傍法分類等で学習・生成された複数の推定モデルの情報が、推定モデルDB18-1に記憶される。
【0032】
学習部14は、第1乃至第3の画像群DB17-1乃至17-3に登録された画像の中から少なくとも一部を選択し(
図3のS12)、選択した画像を用いた機械学習により推定モデルを生成する(
図3のS13)。
【0033】
選択の手法は様々である。例えば、学習部14は、第1乃至第3の画像群DB17-1乃至17-3全体から予め定められた所定数の画像をランダムに選択してもよい。その他、学習部14は、第1の画像群DB17-1から予め定められた第1の所定数の画像をランダムに選択し、第2の画像群DB17-2から予め定められた第2の所定数の画像をランダムに選択し、第3の画像群DB17-3から予め定められた第3の所定数の画像をランダムに選択してもよい。第1乃至第3の所定数は、同数であってもよいし、異なってもよい。すなわち、第1乃至第3の画像群DB17-1乃至17-3各々から選択する画像の数の割合(選択する画像全体に対する割合)は、同じあってもよいし、異なってもよい。
【0034】
また、学習部14は、推定モデル毎に画像を選択してもよい。この場合、上記第1乃至第3の所定数や上記割合は、推定モデル毎に異なってもよい。
【0035】
学習部14は、画像を選択後、選択した第1乃至第3の画像を教師画像として、推定モデルDB(データベース)18-1に登録されている複数の推定モデル各々の学習を実行する。すなわち、学習部14は、第1乃至第3の画像を用いた機械学習(深層学習を含む概念)により、正常/異常を判別する推定モデルを生成する。
【0036】
「推定処理S4」
推定処理S4は、推定モデルDB(データベース)18-1に登録されている複数の推定モデル各々に取得画像を入力し、取得画像が示す状態を判別する処理である。
【0037】
図3の推定モデルDB18-1、カメラD14及び推定S14が、当該処理に関係する。そして、
図2の取得部11、学習時推定部15及び推定モデル記憶部18が、当該処理に関係する。
【0038】
学習時推定部15は、推定モデル記憶部18に記憶されている複数の推定モデル各々に取得画像を入力し、取得画像が示す状態(正常/異常)を判別する。なお、当該処理で推定モデルに入力される取得画像は、その推定モデルの生成(学習)にその時点で利用されていない取得画像である。例えば、学習時推定部15は、画像記憶部17に記憶される前の取得画像を利用して、当該判別を行うことができる。
【0039】
なお、複数の推定モデル各々の判別結果は、学習装置10内の記憶装置に蓄積されてもよい。
【0040】
「ユーザ確認処理S5」
ユーザ確認処理S5は、推定処理S4の判別結果をユーザに向けて出力し、その判別結果の正誤入力をユーザから受付ける処理である。
【0041】
図3の表示装置D15、抽出S15、出力S16及び正誤入力S17が、当該処理に関係する。そして、
図2のユーザ確認部16が、当該処理に関係する。
【0042】
ユーザ確認部16は、学習時推定部15による判別結果をユーザに向けて出力し(
図3のS16)、その判別結果の正誤入力をユーザから受付ける(
図3のS17)。例えば、ユーザ確認部16は、取得画像と判別結果(正常状態又は異常状態)とを出力し、その取得画像に対するその判別結果の正誤入力を受付ける。
【0043】
すべての取得画像に対して当該処理を実行するとユーザの負担が大きくなる。そこで、ユーザ確認部16は、所定の条件を満たす一部の取得画像を抽出し(
図3のS15)、抽出した一部の取得画像に対してのみ、判別結果の出力(
図3のS16)、及び、正誤入力の受付(
図3のS17)を行ってもよい。
【0044】
判別結果の出力、及び、正誤入力の受付が行われる一部の取得画像は、例えば、以下の中のいずれかであってもよい。
【0045】
・少なくとも1つの推定モデルにおいて、異常状態を示すと判別された取得画像。
・少なくとも1つの推定モデルにおいて、所定レベル以上の信頼度で異常状態を示すと判別された取得画像。
・所定数以上の推定モデルにおいて、異常状態を示すと判別された取得画像。
・所定数以上の推定モデルにおいて、所定レベル以上の信頼度で異常状態を示すと判別された取得画像。
・全ての推定モデルにおいて、異常状態を示すと判別された取得画像。
・全ての推定モデルにおいて、所定レベル以上の信頼度で異常状態を示すと判別された取得画像。
【0046】
判別結果の出力、及び、正誤入力の受付が行われる一部の取得画像は、上記の中のいずれかの取得画像に加えて、上記条件を満たさない取得画像(正常状態を示すと推測される取得画像)の中からランダムにピックアップされた取得画像を含んでもよい。
【0047】
ユーザ確認部16は、ディスプレイ、投影装置などの任意の出力装置を介して判別結果の出力を行い、キーボード、マウス、タッチパネル、物理ボタン、マイクなどの任意の入力装置を介して正誤入力を受付けてもよい。その他、ユーザ確認部16は、所定の携帯端末に判別結果を送信し、当該携帯端末に対してなされた正誤入力の内容を当該携帯端末から取得してもよい。その他、ユーザ確認部16は、任意のサーバ上に当該判別結果を任意の装置から閲覧可能な状態で保存してもよい。そして、ユーザ確認部16は、任意の装置から入力され、上記サーバに保存された正誤入力の内容を取得してもよい。なお、ここで例示した例はあくまで一例であり、これらに限定されない。
【0048】
「第2の画像登録処理S6」
第2の画像登録処理S6は、ユーザ確認処理S5で異常状態を示すことが入力された取得画像を、第1の画像として第1の画像群DB17-1に登録する処理である。
【0049】
図3の第1の画像群DB17-1及び登録S18が、当該処理に関係する。そして、
図2の登録部13及び画像記憶部17が、当該処理に関係する。
【0050】
登録部13は、ユーザ確認部16が受付ける正誤入力において、異常状態を示すことが入力された取得画像を、第1の画像として第1の画像群DB17-1に登録する。
【0051】
異常状態を示すことが入力された取得画像は、判別結果が「異常状態」であり正誤入力が「正しい」である取得画像や、判別結果が「正常状態」であり正誤入力が「誤り」である取得画像などが該当する、
【0052】
ここで、本実施形態の学習装置10の変形例を説明する。学習装置10は、第3の画像群DB17-3を有さなくてもよい。そして、登録部13は、第1の画像との類似度が第1の基準値以下の取得画像を第2の画像として第2の画像群DB17-2に登録する処理を実行し、第1の画像との類似度が第2の基準値以上の取得画像を第3の画像として第3の画像群DB17-3に登録する処理を実行しなくてもよい。この場合、登録部13による処理により、正常状態を示す画像が蓄積されていくこととなる。
【0053】
次に、学習装置10のハードウエア構成の一例を説明する。学習装置10の各機能部は、任意のコンピュータのCPU(Central Processing Unit)、メモリ、メモリにロードされるプログラム、そのプログラムを格納するハードディスク等の記憶ユニット(あらかじめ装置を出荷する段階から格納されているプログラムのほか、CD(Compact Disc)等の記憶媒体やインターネット上のサーバ等からダウンロードされたプログラムをも格納できる)、ネットワーク接続用インターフェイスを中心にハードウエアとソフトウエアの任意の組合せによって実現される。そして、その実現方法、装置にはいろいろな変形例があることは、当業者には理解されるところである。
【0054】
図4は、学習装置10のハードウエア構成を例示するブロック図である。
図4に示すように、学習装置10は、プロセッサ1A、メモリ2A、入出力インターフェイス3A、周辺回路4A、バス5Aを有する。周辺回路4Aには、様々なモジュールが含まれる。学習装置10は周辺回路4Aを有さなくてもよい。なお、学習装置10は物理的及び/又は論理的に分かれた複数の装置で構成されてもよいし、物理的及び/又は論理的に一体となった1つの装置で構成されてもよい。学習装置10が物理的及び/又は論理的に分かれた複数の装置で構成される場合、複数の装置各々が上記ハードウエア構成を備えることができる。
【0055】
バス5Aは、プロセッサ1A、メモリ2A、周辺回路4A及び入出力インターフェイス3Aが相互にデータを送受信するためのデータ伝送路である。プロセッサ1Aは、例えばCPU、GPU(Graphics Processing Unit)などの演算処理装置である。メモリ2Aは、例えばRAM(Random Access Memory)やROM(Read Only Memory)などのメモリである。入出力インターフェイス3Aは、入力装置、外部装置、外部サーバ、外部センサー、カメラ等から情報を取得するためのインターフェイスや、出力装置、外部装置、外部サーバ等に情報を出力するためのインターフェイスなどを含む。入力装置は、例えばキーボード、マウス、マイク、物理ボタン、タッチパネル等である。出力装置は、例えばディスプレイ、スピーカ、プリンター、メーラ等である。プロセッサ1Aは、各モジュールに指令を出し、それらの演算結果をもとに演算を行うことができる。
【0056】
次に、学習装置10の作用効果を説明する。
【0057】
本実施形態の学習装置10は、正常状態を示す画像と、異常状態を示す画像とを教師画像とした機械学習により、正常/異常を判別する推定モデルを生成する。推定モデルにおいては、大多数の時間において観察される通常の状態が正常と判別され、通常の状態と異なる状態が異常と判別される。
【0058】
かかる場合、予め定義していない異常状態が発生した場合であっても、その状態が正常状態と異なる状態である限り、異常状態として判別することができる。このため、異常状態を漏れなく検出することが可能となる。
【0059】
また、予め異常状態を定義しておき、その異常状態を検出する推定モデルを生成する場合、各異常状態を示す教師画像を多数用意する必要がある。しかし、異常状態を示す教師画像を用意するのは容易でない。本実施形態の場合、予め定義した異常状態を検出する推定モデルを生成する場合に比べて、用意すべき「異常状態を示す画像」の数が少なくなる。結果、ユーザの負担が軽減される。
【0060】
なお、本実施形態の場合、大量の「正常状態を示す画像」が必要になる。しかし、通常、多くの対象は「正常状態」であるので、そのような対象を撮影している画像から容易に「正常状態を示す画像」を収集することが可能である。
【0061】
また、本実施形態の場合、予め用意した少量(予め定義した異常状態を検出する推定モデルを生成するために要する異常状態を示す画像の数よりも少量であることを意味する)の「異常状態を示す画像」と、監視カメラ等が生成した画像との類似度判定の結果に基づき、「正常状態を示す画像」を自動的に蓄積していくことができる。このため、ユーザの負担が軽減される。
【0062】
また、本実施形態の場合、第2の画像登録処理S6により、「異常状態を示す画像」を増やしてくことができる。このように「異常状態を示す画像」を増やすことができるので、得られる推定モデルの推定精度が向上する。
【0063】
また、本実施形態の場合、第1の画像登録処理S1により、「異常状態を示す画像」を増やすこともできる。この場合、上述した第2の基準値を十分に高い値とすることで、より信頼度の高い「異常状態を示す画像」を増やすことができる。そして、「異常状態を示す画像」の増加により、得られる推定モデルの推定精度の向上が期待される。
【0064】
また、本実施形態の場合、異常状態を示す画像を、「ユーザにより異常状態を示すことを確認された、信頼度の高い第1の画像」と、「コンピュータにより第1の画像と所定レベルより類似していると判定された第3の画像」とに分けて管理することができる。そして、第1の画像のみを、
図3の類似度算出S10の参照対象とすることができる。このように、信頼度の高い第1の画像のみを参照対象とすることで、画像間の類似度に基づき正常状態/異常状態に分類する処理(
図3の類似度算出S10、登録S11)の信頼度が高まる。
【0065】
また、本実施形態の場合、複数の推定モデルを並行して学習することができる。このため、実際の推定場面(以下の実施形態で説明する推定装置による推定)において、その中からより好ましい結果が得られる推定モデルを選択して利用することが可能となる。
【0066】
<第2の実施形態>
図5に、本実施形態の学習装置10の機能ブロック図の一例を示す。また、
図6に、
図1のサイクルをより詳細に示す図を示す。第1の実施形態で説明した
図2及び
図3と、本実施形態の構成を示す
図5及び
図6とを比較すると、本実施形態の学習装置10は、第3の画像群DB17-3を有さず、画像記憶部17は第3の画像群を記憶しない点で異なる。
【0067】
第1の実施形態では、異常状態を示す画像を、「ユーザにより異常状態を示すことを確認された、信頼度の高い第1の画像」と、「コンピュータにより第1の画像と所定レベルより類似していると判定された第3の画像」とに分けて管理した。しかし、本実施形態の学習装置10は、このような管理を行わない。すなわち、「ユーザにより異常状態を示すことを確認された、信頼度の高い画像」及び「コンピュータにより当該信頼度の高い画像と所定レベルより類似していると判定された画像」をまとめて、「異常状態を示す第1の画像」として管理する。本実施形態の「第1の画像」は、異常状態を示す画像であり、第1の実施形態で説明した第1の画像及び第3の画像を含む概念である。
【0068】
登録部13は、第1の画像群DB17-1に登録されている第1の画像との類似度が第2の基準値以上である取得画像を、第1の画像として第1の画像群DB17-1に登録する。
【0069】
本実施形態の学習装置10のその他の構成は、第1の実施形態と同様である。
【0070】
以上説明した本実施形態の学習装置10によれば、第1の実施形態の学習装置10と同様の作用効果が実現される。また、異常状態を示す画像を効率的に収集することができる。なお、「ユーザにより異常状態を示すことを確認された、信頼度の高い画像」と「コンピュータにより当該信頼度の高い画像と所定レベルより類似していると判定された画像」の信頼度(異常状態を示すことの信頼度)は異なり得る。そして、信頼度の異なる画像を混ぜて管理すると、学習の精度や推定精度等に悪影響を及ぼし得る。しかし、上述した第2の基準値を十分に高い値にしておくと、このような不都合を軽減できる。
【0071】
<第3の実施形態>
本実施形態の推定装置は、第1又は第2の実施形態の学習装置10により生成された推定モデルを用いて、画像が示す状態(正常/異常)を判別する。
【0072】
本実施形態の推定装置は、上述のような特徴的な手法で十分かつ高精度な教師画像を収集し、当該教師画像に基づく学習で生成された推定モデルを用いることができるので、高い推定精度が得られる。
【0073】
以上、図面を参照して本発明の実施形態について述べたが、これらは本発明の例示であり、上記以外の様々な構成を採用することもできる。
【0074】
また、上述の説明で用いた複数のフローチャートでは、複数の工程(処理)が順番に記載されているが、各実施形態で実行される工程の実行順序は、その記載の順番に制限されない。各実施形態では、図示される工程の順番を内容的に支障のない範囲で変更することができる。また、上述の各実施形態は、内容が相反しない範囲で組み合わせることができる。
【0075】
上記の実施形態の一部又は全部は、以下の付記のようにも記載されうるが、以下には限定されない。
1. 画像を取得する取得手段と、
前記取得された画像と、予め蓄積された異常状態を示す第1の画像との類似度を算出する類似度算出手段と、
前記類似度が第1の基準値以下の前記取得された画像を、正常状態を示す第2の画像として登録する登録手段と、
前記第1の画像及び前記第2の画像を用いた機械学習により、正常/異常を判別する推定モデルを生成する学習手段と、
を有する学習装置。
2. 前記登録手段は、前記類似度が第2の基準値以上の前記取得された画像を、異常状態を示す第3の画像として登録し、
前記学習手段は、前記第1の画像、前記第2の画像及び前記第3の画像を用いた機械学習により、前記推定モデルを生成する1に記載の学習装置。
3. 前記登録手段は、前記類似度が第2の基準値以上の前記取得された画像を、前記第1の画像として登録する1に記載の学習装置。
4. 前記学習手段は、登録された画像の中から一部を選択し、選択した画像を用いた機械学習により、前記推定モデルを生成する1から3のいずれかに記載の学習装置。
5. 前記推定モデルを用いて、前記取得された画像が示す状態を判別する学習時推定手段と、
前記学習時推定手段により異常状態を示すと判別された前記取得された画像を出力し、ユーザによる正誤入力を受付けるユーザ確認手段と、
をさらに有し、
前記登録手段は、前記正誤入力で異常状態を示すことが入力された前記取得された画像を、前記第1の画像として登録する1から4のいずれかに記載の学習装置。
6. 前記学習手段は、互いに異なるアルゴリズムで学習する複数の前記推定モデル各々の学習を実行し、
前記学習時推定手段は、複数の前記推定モデル各々を用いて、前記取得された画像が示す状態を判別し、複数の前記推定モデル各々の判別結果を蓄積する1から5のいずれかに記載の学習装置。
7. 前記取得手段は、監視カメラが生成した画像を取得する1から6のいずれかに記載の学習装置。
8. コンピュータが、
画像を取得し、
前記取得された画像と、予め蓄積された異常状態を示す第1の画像との類似度を算出し、
前記類似度が第1の基準値以下の前記取得された画像を、正常状態を示す第2の画像として登録し、
前記第1の画像及び前記第2の画像を用いた機械学習により、正常/異常を判別する推定モデルを生成する学習方法。
9. コンピュータを、
画像を取得する取得手段、
前記取得された画像と、予め蓄積された異常状態を示す第1の画像との類似度を算出する類似度算出手段、
前記類似度が第1の基準値以下の前記取得された画像を、正常状態を示す第2の画像として登録する登録手段、
前記第1の画像及び前記第2の画像を用いた機械学習により、正常/異常を判別する推定モデルを生成する学習手段、
として機能させるプログラム。
10. 1から7のいずれかに記載の学習装置により生成された推定モデルを用いて正常/異常を判別する推定装置。
【符号の説明】
【0076】
10 学習装置
11 取得部
12 類似度算出部
13 登録部
14 学習部
15 学習時推定部
16 ユーザ確認部
17 画像記憶部
17-1 第1の画像群DB
17-2 第2の画像群DB
17-3 第3の画像群DB
18 推定モデル記憶部
18-1 推定モデルDB
D14 カメラ
D15 表示装置
【手続補正書】
【提出日】2023-11-02
【手続補正1】
【補正対象書類名】特許請求の範囲
【補正対象項目名】全文
【補正方法】変更
【補正の内容】
【特許請求の範囲】
【請求項1】
異常状態を示す第1画像及び正常状態を示す第2画像を用いた機械学習により得られた第1推定モデルを用いて判定され、正常状態と異常状態を含む複数の分類のうち物体が映る撮像画像に対して判定された分類を取得する取得手段と、
前記撮像画像ごとに前記判定された分類に対するユーザの正誤入力の結果を受信する受信手段と、
前記正誤入力により正常状態又は異常状態であると分類された前記撮像画像を前記第1画像及び前記第2画像とともに用いた機械学習により、画像に対して正常状態及び異常状態を判定する第2推定モデルを生成する学習手段と、
を有する学習装置。
【請求項2】
前記受信手段は、前記第1推定モデルが異常状態を示すと判定した前記撮像画像に対して、ユーザが前記正誤入力を行った結果を受信する、
請求項1に記載の学習装置。
【請求項3】
前記受信手段は、前記第1推定モデルが所定レベル以上の信頼度とともに異常状態を示すと判定した前記撮像画像に対して、ユーザが前記正誤入力を行った結果を受信する、
請求項2に記載の学習装置。
【請求項4】
前記受信手段は、前記第1推定モデルが正常状態を示すと判定した前記撮像画像に対して、ユーザが前記正誤入力を行った結果を受信する、
請求項1に記載の学習装置。
【請求項5】
前記受信手段は、表示装置に表示された画像に対してユーザが前記正誤入力を行った結果を受信する、請求項2から4のいずれか一項に記載の学習装置。
【請求項6】
前記取得手段は、前記第2推定モデルを用いて判定され、前記複数の分類のうち物体が映る撮像画像に対して判定された分類を取得する、
請求項1から5のいずれか一項に記載の学習装置。
【請求項7】
前記異常状態とは、前記物体の故障又は不良を示す、請求項1から6のいずれか一項に記載の学習装置。
【請求項8】
前記第1画像は予め蓄積された画像であり、前記第2画像は前記第1画像との類似度が基準値以下であり正常状態を示すと定められた画像である、請求項1から7のいずれか一項に記載の学習装置。
【請求項9】
コンピュータが、
異常状態を示す第1画像及び正常状態を示す第2画像を用いた機械学習により得られた第1推定モデルを用いて判定され、正常状態と異常状態を含む複数の分類のうち物体が映る撮像画像に対して判定された分類を取得する取得工程と、
前記撮像画像ごとに前記判定された分類に対するユーザの正誤入力の結果を受信する受信工程と、
前記正誤入力により正常状態又は異常状態であると分類された前記撮像画像を前記第1画像及び前記第2画像とともに用いた機械学習により、画像に対して正常状態及び異常状態を判定する第2推定モデルを生成する学習工程と、
を実行する学習方法。
【請求項10】
前記コンピュータは、前記受信工程では、前記第1推定モデルが異常状態を示すと判定した前記撮像画像に対して、ユーザが前記正誤入力を行った結果を受信する、
請求項9に記載の学習方法。
【請求項11】
前記コンピュータは、前記受信工程では、前記第1推定モデルが所定レベル以上の信頼度とともに異常状態を示すと判定した前記撮像画像に対して、ユーザが前記正誤入力を行った結果を受信する、
請求項10に記載の学習方法。
【請求項12】
前記コンピュータは、前記受信工程では、前記第1推定モデルが正常状態を示すと判定した前記撮像画像に対して、ユーザが前記正誤入力を行った結果を受信する、
請求項9に記載の学習方法。
【請求項13】
前記コンピュータは、前記受信工程では、表示装置に表示された画像に対してユーザが前記正誤入力を行った結果を受信する、請求項10から12のいずれか一項に記載の学習方法。
【請求項14】
前記コンピュータは、前記取得工程では、前記第2推定モデルを用いて判定され、前記複数の分類のうち物体が映る撮像画像に対して判定された分類を取得する、
請求項9から13のいずれか一項に記載の学習方法。
【請求項15】
前記異常状態とは、前記物体の故障又は不良を示す、請求項9から14のいずれか一項に記載の学習方法。
【請求項16】
前記第1画像は予め蓄積された画像であり、前記第2画像は前記第1画像との類似度が基準値以下であり正常状態を示すと定められた画像である、請求項9から15のいずれか一項に記載の学習方法。
【請求項17】
コンピュータを、
異常状態を示す第1画像及び正常状態を示す第2画像を用いた機械学習により得られた第1推定モデルを用いて判定され、正常状態と異常状態を含む複数の分類のうち物体が映る撮像画像に対して判定された分類を取得する取得手段、
前記撮像画像ごとに前記判定された分類に対するユーザの正誤入力の結果を受信する受信手段、
前記正誤入力により正常状態又は異常状態であると分類された前記撮像画像を前記第1画像及び前記第2画像とともに用いた機械学習により、画像に対して正常状態及び異常状態を判定する第2推定モデルを生成する学習手段、
として機能させるプログラム。
【請求項18】
前記受信手段は、前記第1推定モデルが異常状態を示すと判定した前記撮像画像に対して、ユーザが前記正誤入力を行った結果を受信する、
請求項17に記載のプログラム。
【請求項19】
前記受信手段は、前記第1推定モデルが所定レベル以上の信頼度とともに異常状態を示すと判定した前記撮像画像に対して、ユーザが前記正誤入力を行った結果を受信する、
請求項18に記載のプログラム。
【請求項20】
前記受信手段は、前記第1推定モデルが正常状態を示すと判定した前記撮像画像に対して、ユーザが前記正誤入力を行った結果を受信する、
請求項17に記載のプログラム。
【請求項21】
前記受信手段は、表示装置に表示された画像に対してユーザが前記正誤入力を行った結果を受信する、請求項18から20のいずれか一項に記載のプログラム。
【請求項22】
前記取得手段は、前記第2推定モデルを用いて判定され、前記複数の分類のうち物体が映る撮像画像に対して判定された分類を取得する、
請求項17から21のいずれか一項に記載のプログラム。
【請求項23】
前記異常状態とは、前記物体の故障又は不良を示す、請求項17から22のいずれか一項に記載のプログラム。
【請求項24】
前記第1画像は予め蓄積された画像であり、前記第2画像は前記第1画像との類似度が基準値以下であり正常状態を示すと定められた画像である、請求項17から23のいずれか一項に記載のプログラム。