特開2023-178454 | 知財ポータル「IP Force」

知財求人 - 知財ポータルサイト「IP Force」

▶ 日本電気株式会社の特許一覧

特開2023-178454学習装置、学習方法及びプログラム

書誌要約請求の範囲詳細な説明課題実施例実施するための形態図面の説明

目に優しい文字サイズ小中大 PDF Top

< >

1
2
3
4
5
6

(19)【発行国】日本国特許庁(JP)

(12)【公報種別】公開特許公報(A)

(11)【公開番号】P2023178454

(43)【公開日】2023-12-14

(54)【発明の名称】学習装置、学習方法及びプログラム

(51)【国際特許分類】

G06V 10/778 20220101AFI20231207BHJP

G06T 7/00 20170101ALI20231207BHJP

【ＦＩ】

G06V10/778

G06T7/00 350B

【審査請求】有

【請求項の数】24

【出願形態】ＯＬ

(21)【出願番号】P 2023183772

(22)【出願日】2023-10-26

(62)【分割の表示】P 2022531312の分割

【原出願日】2020-06-24

(71)【出願人】

【識別番号】000004237

【氏名又は名称】日本電気株式会社

(74)【代理人】

【識別番号】100110928

【弁理士】

【氏名又は名称】速水進治

(72)【発明者】

【氏名】劉健全

(72)【発明者】

【氏名】石原賢太

(57)【要約】

【課題】異常を検出する推定モデルを生成するための教師画像を効率的に収集する。
【解決手段】本発明は、画像を取得する取得部と、取得された画像と、予め蓄積された異常状態を示す第１の画像との類似度を算出する類似度算出部と、類似度が第１の基準値以下の取得された画像を、正常状態を示す第２の画像として登録する登録部と、第１の画像及び第２の画像を用いた機械学習により、正常／異常を判別する推定モデルを生成する学習部と、を有する学習装置を提供する。
【選択図】図２

【特許請求の範囲】

【請求項1】

画像を取得する取得手段と、
前記取得された画像と、予め蓄積された異常状態を示す第１の画像との類似度を算出する類似度算出手段と、
前記類似度が第１の基準値以下の前記取得された画像を、正常状態を示す第２の画像として登録する登録手段と、
前記第１の画像及び前記第２の画像を用いた機械学習により、正常／異常を判別する推定モデルを生成する学習手段と、
を有する学習装置。

【請求項2】

前記登録手段は、前記類似度が第２の基準値以上の前記取得された画像を、異常状態を示す第３の画像として登録し、
前記学習手段は、前記第１の画像、前記第２の画像及び前記第３の画像を用いた機械学習により、前記推定モデルを生成する請求項１に記載の学習装置。

【請求項3】

前記登録手段は、前記類似度が第２の基準値以上の前記取得された画像を、前記第１の画像として登録する請求項１に記載の学習装置。

【請求項4】

前記学習手段は、登録された画像の中から一部を選択し、選択した画像を用いた機械学習により、前記推定モデルを生成する請求項１から３のいずれか１項に記載の学習装置。

【請求項5】

前記推定モデルを用いて、前記取得された画像が示す状態を判別する学習時推定手段と、
前記学習時推定手段により異常状態を示すと判別された前記取得された画像を出力し、ユーザによる正誤入力を受付けるユーザ確認手段と、
をさらに有し、
前記登録手段は、前記正誤入力で異常状態を示すことが入力された前記取得された画像を、前記第１の画像として登録する請求項１から４のいずれか１項に記載の学習装置。

【請求項6】

前記学習手段は、互いに異なるアルゴリズムで学習する複数の前記推定モデル各々の学習を実行し、
前記学習時推定手段は、複数の前記推定モデル各々を用いて、前記取得された画像が示す状態を判別し、複数の前記推定モデル各々の判別結果を蓄積する請求項５に記載の学習装置。

【請求項7】

前記取得手段は、監視カメラが生成した画像を取得する請求項１から６のいずれか１項に記載の学習装置。

【請求項8】

コンピュータが、
画像を取得し、
前記取得された画像と、予め蓄積された異常状態を示す第１の画像との類似度を算出し、
前記類似度が第１の基準値以下の前記取得された画像を、正常状態を示す第２の画像として登録し、
前記第１の画像及び前記第２の画像を用いた機械学習により、正常／異常を判別する推定モデルを生成する学習方法。

【請求項9】

コンピュータを、
画像を取得する取得手段、
前記取得された画像と、予め蓄積された異常状態を示す第１の画像との類似度を算出する類似度算出手段、
前記類似度が第１の基準値以下の前記取得された画像を、正常状態を示す第２の画像として登録する登録手段、
前記第１の画像及び前記第２の画像を用いた機械学習により、正常／異常を判別する推定モデルを生成する学習手段、
として機能させるプログラム。

【請求項10】

請求項１から７のいずれか１項に記載の学習装置により生成された推定モデルを用いて正常／異常を判別する推定装置。

【発明の詳細な説明】

【技術分野】

【0001】

本発明は、学習装置、推定装置、学習方法及びプログラムに関する。

【背景技術】

【0002】

特許文献１は、正解及び不正解の教師画像に基づいた学習により、入力画像を、良画像又は不良画像に分類する推定モデルを生成する技術を開示している。良画像は、正解の教師画像との類似度合が高い画像であり、不良画像は正解の教師画像との類似度合が低い画像である。特許文献２は、異常行動を示す教師画像により異常行動を定義し、定義した異常行動を検出する推定モデルを生成する技術を開示している。

【先行技術文献】

【特許文献】

【0003】

【特許文献1】特開２０２０－３５０９７号公報

【特許文献2】特開２０１９－０５３３８４号公報

【発明の概要】

【発明が解決しようとする課題】

【0004】

異常を検出する推定モデルを生成する技術において、教師画像を効率的に収集する技術が望まれている。特許文献１は、当該課題及び解決手段を開示していない。特許文献２に記載の技術の場合、異常行動を示す教師画像を大量に収集する必要がある。しかし、「異常」を示す教師画像を収集することは容易でない。本発明は、異常を検出する推定モデルを生成するための教師画像を効率的に収集する技術を提供することを課題とする。

【課題を解決するための手段】

【0005】

本発明によれば、
画像を取得する取得手段と、
前記取得された画像と、予め蓄積された異常状態を示す第１の画像との類似度を算出する類似度算出手段と、
前記類似度が第１の基準値以下の前記取得された画像を、正常状態を示す第２の画像として登録する登録手段と、
前記第１の画像及び前記第２の画像を用いた機械学習により、正常／異常を判別する推定モデルを生成する学習手段と、
を有する学習装置が提供される。

【0006】

また、本発明によれば、
コンピュータが、
画像を取得し、
前記取得された画像と、予め蓄積された異常状態を示す第１の画像との類似度を算出し、
前記類似度が第１の基準値以下の前記取得された画像を、正常状態を示す第２の画像として登録し、
前記第１の画像及び前記第２の画像を用いた機械学習により、正常／異常を判別する推定モデルを生成する学習方法が提供される。

【0007】

また、本発明によれば、
コンピュータを、
画像を取得する取得手段、
前記取得された画像と、予め蓄積された異常状態を示す第１の画像との類似度を算出する類似度算出手段、
前記類似度が第１の基準値以下の前記取得された画像を、正常状態を示す第２の画像として登録する登録手段、
前記第１の画像及び前記第２の画像を用いた機械学習により、正常／異常を判別する推定モデルを生成する学習手段、
として機能させるプログラムが提供される。

【0008】

また、本発明によれば、前記学習装置により生成された推定モデルを用いて正常／異常を判別する推定装置が提供される。

【発明の効果】

【0009】

本発明によれば、異常を検出する推定モデルを生成するための教師画像を効率的に収集することが可能となる。

【図面の簡単な説明】

【0010】

【図1】本実施形態の学習装置の処理の流れの一例を示すフローチャートである。

【図2】本実施形態の学習装置の機能ブロック図の一例である。

【図3】本実施形態の学習装置の処理の流れの一例を詳細に示す図である。

【図4】本実施形態の学習装置のハードウエア構成例を示す図である。

【図5】本実施形態の学習装置の機能ブロック図の一例である。

【図6】本実施形態の学習装置の処理の流れの一例を詳細に示す図である。

【発明を実施するための形態】

【0011】

以下、本発明の実施の形態について、図面を用いて説明する。尚、すべての図面において、同様な構成要素には同様の符号を付し、適宜説明を省略する。

【0012】

＜第１の実施形態＞
本実施形態の学習装置（以下、単に「学習装置」という場合がある）は、入力された画像が示す状態が、正常か異常かを判別する推定モデルを生成する。

【0013】

正常／異常の判別対象は、例えば場所（公園、駅、施設など）である。大多数の時間において観察される通常の状態が正常と判別され、通常の状態と異なる状態が異常と判別される。例えば異常行動を行っている人物が存在する状態や、その場所に常に存在する物が故障したり移動したりした状態等が異常と判別される。異常行動は、画像で観察される大多数の人が行う行動と異なる行動である。なお、判別対象は、その他、工場、店舗、施設、オフィス等の設備であってもよいし、その他であってもよい。いずれにおいても、大多数の時間において観察される通常の状態が正常と判別され、通常の状態と異なる状態が異常と判別される。

【0014】

学習装置は、図１に示すサイクルを繰り返し実行することで、上記推定モデルを生成する。図１に示すように、学習装置は、第１の画像登録処理Ｓ１、画像選択処理Ｓ２、学習処理Ｓ３、推定処理Ｓ４、ユーザ確認処理Ｓ５、第２の画像登録処理Ｓ６をこの順に繰り返し実行する。なお、処理順は、同様の作用効果が実現される範囲で変更してもよい。

【0015】

図２に、学習装置１０の機能ブロック図の一例を示す。図示するように、学習装置１０は、取得部１１と、類似度算出部１２と、登録部１３と、学習部１４と、学習時推定部１５と、ユーザ確認部１６と、画像記憶部１７と、推定モデル記憶部１８とを有する。これらの機能部により、図１に示す各処理が実行される。

【0016】

図３は、図１のサイクルをより詳細に示す図である。当該図を用いて、図１に示す各処理及び図２に示す各機能部の処理を説明する。

【0017】

「第１の画像登録処理Ｓ１」
第１の画像登録処理Ｓ１は、カメラが生成した画像と、予め登録されている異常状態を示す画像との類似度に基づき、カメラが生成した画像を分類・登録する処理である。

【0018】

図３の第１乃至第３の画像群ＤＢ１７－１乃至１７－３、カメラＤ１４、類似度算出Ｓ１０及び登録Ｓ１１が、当該処理に関係する。そして、図２の取得部１１、類似度算出部１２、登録部１３及び画像記憶部１７が、当該処理に関係する。第１乃至第３の画像群ＤＢ１７－１乃至１７－３は、図２の画像記憶部１７により実現される。

【0019】

まず、当該処理の前準備として、第１の画像群ＤＢ（データベース）１７－１に、異常状態のラベルを付与されたラベル付き画像が記憶される。ユーザは、予め異常状態を示す画像をいくつか用意し、異常状態のラベルを付与して第１の画像群ＤＢ１７－１に記憶させる。このようにして蓄積される第１の画像群ＤＢ１７－１内の画像は、ユーザにより異常状態を示すことを確認された、信頼度の高いラベル付き画像である。なお、第１の画像群ＤＢ１７－１に最初に記憶させる画像は、数十枚から数百枚程度でよく、大量の画像は不要である。この程度の数であれば、ラベル付き画像の収集に要するユーザ負担は大きくない。なお、予め異常状態を定義しておき、その異常状態を検出する推定モデルを生成する場合、一般的に、異常状態を示す教師画像を数千枚から数万枚以上用意する必要がある。第１の画像群ＤＢ１７－１は、図２の画像記憶部１７に対応する。以下、第１の画像群ＤＢ１７－１に記憶されている異常状態を示す画像を「第１の画像」と呼ぶ。

【0020】

取得部１１は、カメラＤ１４が生成した画像を取得する。カメラＤ１４は、正常／異常の判別対象を撮影するカメラ（監視カメラ等）であってもよいし、判別対象と同種の対象を撮影するカメラであってもよい。カメラＤ１４は、動画像を撮影してもよいし、動画像よりも長いフレーム間隔で連続的に静止画像を撮影してもよい。図では、１つのカメラＤ１４が示されているが、複数のカメラＤ１４が利用されてもよい。

【0021】

取得部１１は、カメラＤ１４が生成した画像をリアルタイム処理で取得してもよい。この場合、学習装置１０とカメラＤ１４とは互いに通信可能に構成される。その他、取得部１１は、カメラＤ１４が生成した画像をバッチ処理で取得してもよい。この場合、カメラＤ１４が有する記憶装置、又は、その他の任意の記憶装置内にカメラＤ１４が生成した画像が蓄積され、取得部１１は任意のタイミングでその蓄積された画像を取得する。

【0022】

なお、本明細書において、「取得」とは、ユーザ入力に基づき、又は、プログラムの指示に基づき、「自装置が他の装置や記憶媒体に格納されているデータを取りに行くこと（能動的な取得）」、たとえば、他の装置にリクエストまたは問い合わせして受信すること、他の装置や記憶媒体にアクセスして読み出すこと等、および、ユーザ入力に基づき、又は、プログラムの指示に基づき、「自装置に他の装置から出力されるデータを入力すること（受動的な取得）」、たとえば、配信（または、送信、プッシュ通知等）されるデータを受信すること、また、受信したデータまたは情報の中から選択して取得すること、及び、「データを編集（テキスト化、データの並び替え、一部データの抽出、ファイル形式の変更等）などして新たなデータを生成し、当該新たなデータを取得すること」の少なくともいずれか一方を含む。

【0023】

類似度算出部１２は、取得部１１により取得された画像（以下、「取得画像」という）と、予め第１の画像群ＤＢ１７－１に蓄積された異常状態を示す第１の画像との類似度を算出する（図３のＳ１０）。類似度算出部１２は、第１の画像群ＤＢ１７－１に蓄積された複数の第１の画像各々と、各取得画像との類似度を算出してもよい。その他、類似度算出部１２は、第１の画像群ＤＢ１７－１に蓄積された複数の第１の画像に基づき生成した１つの画像（例：平均画像）と、各取得画像との類似度を算出してもよい。

【0024】

なお、画像間の類似度の算出においては、様々な手法が提案されている。本実施形態では、あらゆる手法を採用することができる。例えば、類似度算出部１２は、画像内から物体を検出し、検出結果の類似度（検出された物体の数の類似度、検出された物体の外観の類似度等）を算出してもよい。また、類似度算出部１２は、深層学習で生成された画像解析を行う推定モデルに各画像を入力し、得られた画像の解析結果（画像が示す物体の認識結果、画像が示す場面の認識結果等）の類似度を算出してもよい。また、類似度算出部１２は、画像の全体又は局所部分に現れる色や輝度の類似度を算出してもよい。

【0025】

登録部１３は、類似度が第１の基準値以下の取得画像を、正常状態を示す第２の画像（正常状態のラベルを付与した画像）として第２の画像群ＤＢ（データベース）１７－２に登録する（Ｓ１１）。類似度算出部１２が、第１の画像群ＤＢ１７－１に蓄積された複数の第１の画像各々と、各取得画像との類似度を算出する場合、登録部１３は、複数の第１の画像のすべてと類似度が第１の基準値以下である取得画像を、第２の画像として第２の画像群ＤＢ１７－２に登録する。

【0026】

また、登録部１３は、類似度が第２の基準値以上の取得画像を、異常状態を示す第３の画像（異常状態のラベルを付与した画像）として第３の画像群ＤＢ（データベース）１７－３に登録する（Ｓ１１）。類似度算出部１２が、第１の画像群ＤＢ１７－１に蓄積された複数の第１の画像各々と、各取得画像との類似度を算出する場合、登録部１３は、複数の第１の画像の中の少なくとも１つとの類似度が第２の基準値以上である取得画像を、第３の画像として第３の画像群ＤＢ１７－３に登録する。

【0027】

第３の画像群ＤＢ１７－３には、このようにコンピュータにより第１の画像と所定レベル以上類似していると判定された画像が、異常状態を示す画像として登録される。この点で、ユーザにより異常状態を示すことを確認された、信頼度の高い第１の画像が記憶される第１の画像群ＤＢ１７－１と異なる。

【0028】

第１の基準値と第２の基準値は同じ値であってもよいし、異なる値であってもよい。しかし、第１の基準値と第２の基準値とを異なる値とし、第１の基準値を十分に小さい値とするとともに、第２の基準値を十分に大きい値とすることで、第１の画像との類似度が高くもなく低くもないグレーゾーン（類似度が第１の基準値より大、第２の基準値未満）に存在する取得画像を、第２の画像や第３の画像として登録する不都合を抑制できる。

【0029】

「画像選択処理Ｓ２、学習処理Ｓ３」
画像選択処理Ｓ２は、第１乃至第３の画像群ＤＢ１７－１乃至１７－３に蓄積されている画像の中から、教師画像とする画像を選択する処理である。学習処理Ｓ３は、選択された画像を教師画像として、推定モデルＤＢ（データベース）１８－１に登録されている複数の推定モデル各々の学習を実行する処理である。

【0030】

図３の第１乃至第３の画像群ＤＢ１７－１乃至１７－３、推定モデルＤＢ１８－１、選択Ｓ１２及び学習Ｓ１３が、当該処理に関係する。そして、図２の学習部１４、画像記憶部１７及び推定モデル記憶部１８が、当該処理に関係する。推定モデルＤＢ１８－１は、図２の推定モデル記憶部１８により実現される。

【0031】

まず、推定モデルＤＢ１８－１には、複数の推定モデルの情報が記憶される。複数の推定モデルはいずれも、入力された画像が示す状態が、正常か異常かを判別するモデルである。複数の推定モデルは、学習及び推定のアルゴリズムが互いに異なる。例えば、複数の推定モデルは、深層学習で生成される。本実施形態では、例えば、ニューラルネットワーク、ベイジアンネットワーク、回帰分析、サポートベクトルマシン（ＳＶＭ）、決定木、遺伝的アルゴリズム、最近傍法分類等で学習・生成された複数の推定モデルの情報が、推定モデルＤＢ１８－１に記憶される。

【0032】

学習部１４は、第１乃至第３の画像群ＤＢ１７－１乃至１７－３に登録された画像の中から少なくとも一部を選択し（図３のＳ１２）、選択した画像を用いた機械学習により推定モデルを生成する（図３のＳ１３）。

【0033】

選択の手法は様々である。例えば、学習部１４は、第１乃至第３の画像群ＤＢ１７－１乃至１７－３全体から予め定められた所定数の画像をランダムに選択してもよい。その他、学習部１４は、第１の画像群ＤＢ１７－１から予め定められた第１の所定数の画像をランダムに選択し、第２の画像群ＤＢ１７－２から予め定められた第２の所定数の画像をランダムに選択し、第３の画像群ＤＢ１７－３から予め定められた第３の所定数の画像をランダムに選択してもよい。第１乃至第３の所定数は、同数であってもよいし、異なってもよい。すなわち、第１乃至第３の画像群ＤＢ１７－１乃至１７－３各々から選択する画像の数の割合（選択する画像全体に対する割合）は、同じあってもよいし、異なってもよい。

【0034】

また、学習部１４は、推定モデル毎に画像を選択してもよい。この場合、上記第１乃至第３の所定数や上記割合は、推定モデル毎に異なってもよい。

【0035】

学習部１４は、画像を選択後、選択した第１乃至第３の画像を教師画像として、推定モデルＤＢ（データベース）１８－１に登録されている複数の推定モデル各々の学習を実行する。すなわち、学習部１４は、第１乃至第３の画像を用いた機械学習（深層学習を含む概念）により、正常／異常を判別する推定モデルを生成する。

【0036】

「推定処理Ｓ４」
推定処理Ｓ４は、推定モデルＤＢ（データベース）１８－１に登録されている複数の推定モデル各々に取得画像を入力し、取得画像が示す状態を判別する処理である。

【0037】

図３の推定モデルＤＢ１８－１、カメラＤ１４及び推定Ｓ１４が、当該処理に関係する。そして、図２の取得部１１、学習時推定部１５及び推定モデル記憶部１８が、当該処理に関係する。

【0038】

学習時推定部１５は、推定モデル記憶部１８に記憶されている複数の推定モデル各々に取得画像を入力し、取得画像が示す状態（正常／異常）を判別する。なお、当該処理で推定モデルに入力される取得画像は、その推定モデルの生成（学習）にその時点で利用されていない取得画像である。例えば、学習時推定部１５は、画像記憶部１７に記憶される前の取得画像を利用して、当該判別を行うことができる。

【0039】

なお、複数の推定モデル各々の判別結果は、学習装置１０内の記憶装置に蓄積されてもよい。

【0040】

「ユーザ確認処理Ｓ５」
ユーザ確認処理Ｓ５は、推定処理Ｓ４の判別結果をユーザに向けて出力し、その判別結果の正誤入力をユーザから受付ける処理である。

【0041】

図３の表示装置Ｄ１５、抽出Ｓ１５、出力Ｓ１６及び正誤入力Ｓ１７が、当該処理に関係する。そして、図２のユーザ確認部１６が、当該処理に関係する。

【0042】

ユーザ確認部１６は、学習時推定部１５による判別結果をユーザに向けて出力し（図３のＳ１６）、その判別結果の正誤入力をユーザから受付ける（図３のＳ１７）。例えば、ユーザ確認部１６は、取得画像と判別結果（正常状態又は異常状態）とを出力し、その取得画像に対するその判別結果の正誤入力を受付ける。

【0043】

すべての取得画像に対して当該処理を実行するとユーザの負担が大きくなる。そこで、ユーザ確認部１６は、所定の条件を満たす一部の取得画像を抽出し（図３のＳ１５）、抽出した一部の取得画像に対してのみ、判別結果の出力（図３のＳ１６）、及び、正誤入力の受付（図３のＳ１７）を行ってもよい。

【0044】

判別結果の出力、及び、正誤入力の受付が行われる一部の取得画像は、例えば、以下の中のいずれかであってもよい。

【0045】

・少なくとも１つの推定モデルにおいて、異常状態を示すと判別された取得画像。
・少なくとも１つの推定モデルにおいて、所定レベル以上の信頼度で異常状態を示すと判別された取得画像。
・所定数以上の推定モデルにおいて、異常状態を示すと判別された取得画像。
・所定数以上の推定モデルにおいて、所定レベル以上の信頼度で異常状態を示すと判別された取得画像。
・全ての推定モデルにおいて、異常状態を示すと判別された取得画像。
・全ての推定モデルにおいて、所定レベル以上の信頼度で異常状態を示すと判別された取得画像。

【0046】

判別結果の出力、及び、正誤入力の受付が行われる一部の取得画像は、上記の中のいずれかの取得画像に加えて、上記条件を満たさない取得画像（正常状態を示すと推測される取得画像）の中からランダムにピックアップされた取得画像を含んでもよい。

【0047】

ユーザ確認部１６は、ディスプレイ、投影装置などの任意の出力装置を介して判別結果の出力を行い、キーボード、マウス、タッチパネル、物理ボタン、マイクなどの任意の入力装置を介して正誤入力を受付けてもよい。その他、ユーザ確認部１６は、所定の携帯端末に判別結果を送信し、当該携帯端末に対してなされた正誤入力の内容を当該携帯端末から取得してもよい。その他、ユーザ確認部１６は、任意のサーバ上に当該判別結果を任意の装置から閲覧可能な状態で保存してもよい。そして、ユーザ確認部１６は、任意の装置から入力され、上記サーバに保存された正誤入力の内容を取得してもよい。なお、ここで例示した例はあくまで一例であり、これらに限定されない。

【0048】

「第２の画像登録処理Ｓ６」
第２の画像登録処理Ｓ６は、ユーザ確認処理Ｓ５で異常状態を示すことが入力された取得画像を、第１の画像として第１の画像群ＤＢ１７－１に登録する処理である。

【0049】

図３の第１の画像群ＤＢ１７－１及び登録Ｓ１８が、当該処理に関係する。そして、図２の登録部１３及び画像記憶部１７が、当該処理に関係する。

【0050】

登録部１３は、ユーザ確認部１６が受付ける正誤入力において、異常状態を示すことが入力された取得画像を、第１の画像として第１の画像群ＤＢ１７－１に登録する。

【0051】

異常状態を示すことが入力された取得画像は、判別結果が「異常状態」であり正誤入力が「正しい」である取得画像や、判別結果が「正常状態」であり正誤入力が「誤り」である取得画像などが該当する、

【0052】

ここで、本実施形態の学習装置１０の変形例を説明する。学習装置１０は、第３の画像群ＤＢ１７－３を有さなくてもよい。そして、登録部１３は、第１の画像との類似度が第１の基準値以下の取得画像を第２の画像として第２の画像群ＤＢ１７－２に登録する処理を実行し、第１の画像との類似度が第２の基準値以上の取得画像を第３の画像として第３の画像群ＤＢ１７－３に登録する処理を実行しなくてもよい。この場合、登録部１３による処理により、正常状態を示す画像が蓄積されていくこととなる。

【0053】

次に、学習装置１０のハードウエア構成の一例を説明する。学習装置１０の各機能部は、任意のコンピュータのＣＰＵ（Central Processing Unit）、メモリ、メモリにロードされるプログラム、そのプログラムを格納するハードディスク等の記憶ユニット（あらかじめ装置を出荷する段階から格納されているプログラムのほか、ＣＤ（Compact Disc）等の記憶媒体やインターネット上のサーバ等からダウンロードされたプログラムをも格納できる）、ネットワーク接続用インターフェイスを中心にハードウエアとソフトウエアの任意の組合せによって実現される。そして、その実現方法、装置にはいろいろな変形例があることは、当業者には理解されるところである。

【0054】

図４は、学習装置１０のハードウエア構成を例示するブロック図である。図４に示すように、学習装置１０は、プロセッサ１Ａ、メモリ２Ａ、入出力インターフェイス３Ａ、周辺回路４Ａ、バス５Ａを有する。周辺回路４Ａには、様々なモジュールが含まれる。学習装置１０は周辺回路４Ａを有さなくてもよい。なお、学習装置１０は物理的及び／又は論理的に分かれた複数の装置で構成されてもよいし、物理的及び／又は論理的に一体となった１つの装置で構成されてもよい。学習装置１０が物理的及び／又は論理的に分かれた複数の装置で構成される場合、複数の装置各々が上記ハードウエア構成を備えることができる。

【0055】

バス５Ａは、プロセッサ１Ａ、メモリ２Ａ、周辺回路４Ａ及び入出力インターフェイス３Ａが相互にデータを送受信するためのデータ伝送路である。プロセッサ１Ａは、例えばＣＰＵ、ＧＰＵ（Graphics Processing Unit）などの演算処理装置である。メモリ２Ａは、例えばＲＡＭ（Random Access Memory）やＲＯＭ（Read Only Memory）などのメモリである。入出力インターフェイス３Ａは、入力装置、外部装置、外部サーバ、外部センサー、カメラ等から情報を取得するためのインターフェイスや、出力装置、外部装置、外部サーバ等に情報を出力するためのインターフェイスなどを含む。入力装置は、例えばキーボード、マウス、マイク、物理ボタン、タッチパネル等である。出力装置は、例えばディスプレイ、スピーカ、プリンター、メーラ等である。プロセッサ１Ａは、各モジュールに指令を出し、それらの演算結果をもとに演算を行うことができる。

【0056】

次に、学習装置１０の作用効果を説明する。

【0057】

本実施形態の学習装置１０は、正常状態を示す画像と、異常状態を示す画像とを教師画像とした機械学習により、正常／異常を判別する推定モデルを生成する。推定モデルにおいては、大多数の時間において観察される通常の状態が正常と判別され、通常の状態と異なる状態が異常と判別される。

【0058】

かかる場合、予め定義していない異常状態が発生した場合であっても、その状態が正常状態と異なる状態である限り、異常状態として判別することができる。このため、異常状態を漏れなく検出することが可能となる。

【0059】

また、予め異常状態を定義しておき、その異常状態を検出する推定モデルを生成する場合、各異常状態を示す教師画像を多数用意する必要がある。しかし、異常状態を示す教師画像を用意するのは容易でない。本実施形態の場合、予め定義した異常状態を検出する推定モデルを生成する場合に比べて、用意すべき「異常状態を示す画像」の数が少なくなる。結果、ユーザの負担が軽減される。

【0060】

なお、本実施形態の場合、大量の「正常状態を示す画像」が必要になる。しかし、通常、多くの対象は「正常状態」であるので、そのような対象を撮影している画像から容易に「正常状態を示す画像」を収集することが可能である。

【0061】

また、本実施形態の場合、予め用意した少量（予め定義した異常状態を検出する推定モデルを生成するために要する異常状態を示す画像の数よりも少量であることを意味する）の「異常状態を示す画像」と、監視カメラ等が生成した画像との類似度判定の結果に基づき、「正常状態を示す画像」を自動的に蓄積していくことができる。このため、ユーザの負担が軽減される。

【0062】

また、本実施形態の場合、第２の画像登録処理Ｓ６により、「異常状態を示す画像」を増やしてくことができる。このように「異常状態を示す画像」を増やすことができるので、得られる推定モデルの推定精度が向上する。

【0063】

また、本実施形態の場合、第１の画像登録処理Ｓ１により、「異常状態を示す画像」を増やすこともできる。この場合、上述した第２の基準値を十分に高い値とすることで、より信頼度の高い「異常状態を示す画像」を増やすことができる。そして、「異常状態を示す画像」の増加により、得られる推定モデルの推定精度の向上が期待される。

【0064】

また、本実施形態の場合、異常状態を示す画像を、「ユーザにより異常状態を示すことを確認された、信頼度の高い第１の画像」と、「コンピュータにより第１の画像と所定レベルより類似していると判定された第３の画像」とに分けて管理することができる。そして、第１の画像のみを、図３の類似度算出Ｓ１０の参照対象とすることができる。このように、信頼度の高い第１の画像のみを参照対象とすることで、画像間の類似度に基づき正常状態／異常状態に分類する処理（図３の類似度算出Ｓ１０、登録Ｓ１１）の信頼度が高まる。

【0065】

また、本実施形態の場合、複数の推定モデルを並行して学習することができる。このため、実際の推定場面（以下の実施形態で説明する推定装置による推定）において、その中からより好ましい結果が得られる推定モデルを選択して利用することが可能となる。

【0066】

＜第２の実施形態＞
図５に、本実施形態の学習装置１０の機能ブロック図の一例を示す。また、図６に、図１のサイクルをより詳細に示す図を示す。第１の実施形態で説明した図２及び図３と、本実施形態の構成を示す図５及び図６とを比較すると、本実施形態の学習装置１０は、第３の画像群ＤＢ１７－３を有さず、画像記憶部１７は第３の画像群を記憶しない点で異なる。

【0067】

第１の実施形態では、異常状態を示す画像を、「ユーザにより異常状態を示すことを確認された、信頼度の高い第１の画像」と、「コンピュータにより第１の画像と所定レベルより類似していると判定された第３の画像」とに分けて管理した。しかし、本実施形態の学習装置１０は、このような管理を行わない。すなわち、「ユーザにより異常状態を示すことを確認された、信頼度の高い画像」及び「コンピュータにより当該信頼度の高い画像と所定レベルより類似していると判定された画像」をまとめて、「異常状態を示す第１の画像」として管理する。本実施形態の「第１の画像」は、異常状態を示す画像であり、第１の実施形態で説明した第１の画像及び第３の画像を含む概念である。

【0068】

登録部１３は、第１の画像群ＤＢ１７－１に登録されている第１の画像との類似度が第２の基準値以上である取得画像を、第１の画像として第１の画像群ＤＢ１７－１に登録する。

【0069】

本実施形態の学習装置１０のその他の構成は、第１の実施形態と同様である。

【0070】

以上説明した本実施形態の学習装置１０によれば、第１の実施形態の学習装置１０と同様の作用効果が実現される。また、異常状態を示す画像を効率的に収集することができる。なお、「ユーザにより異常状態を示すことを確認された、信頼度の高い画像」と「コンピュータにより当該信頼度の高い画像と所定レベルより類似していると判定された画像」の信頼度（異常状態を示すことの信頼度）は異なり得る。そして、信頼度の異なる画像を混ぜて管理すると、学習の精度や推定精度等に悪影響を及ぼし得る。しかし、上述した第２の基準値を十分に高い値にしておくと、このような不都合を軽減できる。

【0071】

＜第３の実施形態＞
本実施形態の推定装置は、第１又は第２の実施形態の学習装置１０により生成された推定モデルを用いて、画像が示す状態（正常／異常）を判別する。

【0072】

本実施形態の推定装置は、上述のような特徴的な手法で十分かつ高精度な教師画像を収集し、当該教師画像に基づく学習で生成された推定モデルを用いることができるので、高い推定精度が得られる。

【0073】

以上、図面を参照して本発明の実施形態について述べたが、これらは本発明の例示であり、上記以外の様々な構成を採用することもできる。

【0074】

また、上述の説明で用いた複数のフローチャートでは、複数の工程（処理）が順番に記載されているが、各実施形態で実行される工程の実行順序は、その記載の順番に制限されない。各実施形態では、図示される工程の順番を内容的に支障のない範囲で変更することができる。また、上述の各実施形態は、内容が相反しない範囲で組み合わせることができる。

【0075】

上記の実施形態の一部又は全部は、以下の付記のようにも記載されうるが、以下には限定されない。
１．画像を取得する取得手段と、
前記取得された画像と、予め蓄積された異常状態を示す第１の画像との類似度を算出する類似度算出手段と、
前記類似度が第１の基準値以下の前記取得された画像を、正常状態を示す第２の画像として登録する登録手段と、
前記第１の画像及び前記第２の画像を用いた機械学習により、正常／異常を判別する推定モデルを生成する学習手段と、
を有する学習装置。
２．前記登録手段は、前記類似度が第２の基準値以上の前記取得された画像を、異常状態を示す第３の画像として登録し、
前記学習手段は、前記第１の画像、前記第２の画像及び前記第３の画像を用いた機械学習により、前記推定モデルを生成する１に記載の学習装置。
３．前記登録手段は、前記類似度が第２の基準値以上の前記取得された画像を、前記第１の画像として登録する１に記載の学習装置。
４．前記学習手段は、登録された画像の中から一部を選択し、選択した画像を用いた機械学習により、前記推定モデルを生成する１から３のいずれかに記載の学習装置。
５．前記推定モデルを用いて、前記取得された画像が示す状態を判別する学習時推定手段と、
前記学習時推定手段により異常状態を示すと判別された前記取得された画像を出力し、ユーザによる正誤入力を受付けるユーザ確認手段と、
をさらに有し、
前記登録手段は、前記正誤入力で異常状態を示すことが入力された前記取得された画像を、前記第１の画像として登録する１から４のいずれかに記載の学習装置。
６．前記学習手段は、互いに異なるアルゴリズムで学習する複数の前記推定モデル各々の学習を実行し、
前記学習時推定手段は、複数の前記推定モデル各々を用いて、前記取得された画像が示す状態を判別し、複数の前記推定モデル各々の判別結果を蓄積する１から５のいずれかに記載の学習装置。
７．前記取得手段は、監視カメラが生成した画像を取得する１から６のいずれかに記載の学習装置。
８．コンピュータが、
画像を取得し、
前記取得された画像と、予め蓄積された異常状態を示す第１の画像との類似度を算出し、
前記類似度が第１の基準値以下の前記取得された画像を、正常状態を示す第２の画像として登録し、
前記第１の画像及び前記第２の画像を用いた機械学習により、正常／異常を判別する推定モデルを生成する学習方法。
９．コンピュータを、
画像を取得する取得手段、
前記取得された画像と、予め蓄積された異常状態を示す第１の画像との類似度を算出する類似度算出手段、
前記類似度が第１の基準値以下の前記取得された画像を、正常状態を示す第２の画像として登録する登録手段、
前記第１の画像及び前記第２の画像を用いた機械学習により、正常／異常を判別する推定モデルを生成する学習手段、
として機能させるプログラム。
１０．１から７のいずれかに記載の学習装置により生成された推定モデルを用いて正常／異常を判別する推定装置。

【符号の説明】

【0076】

１０学習装置
１１取得部
１２類似度算出部
１３登録部
１４学習部
１５学習時推定部
１６ユーザ確認部
１７画像記憶部
１７－１第１の画像群ＤＢ
１７－２第２の画像群ＤＢ
１７－３第３の画像群ＤＢ
１８推定モデル記憶部
１８－１推定モデルＤＢ
Ｄ１４カメラ
Ｄ１５表示装置

【図1】

【図2】

【図3】

【図4】

【図5】

【図6】

【手続補正書】

【提出日】2023-11-02

【手続補正1】

【補正対象書類名】特許請求の範囲

【補正対象項目名】全文

【補正方法】変更

【補正の内容】

【特許請求の範囲】

【請求項1】

異常状態を示す第１画像及び正常状態を示す第２画像を用いた機械学習により得られた第１推定モデルを用いて判定され、正常状態と異常状態を含む複数の分類のうち物体が映る撮像画像に対して判定された分類を取得する取得手段と、
前記撮像画像ごとに前記判定された分類に対するユーザの正誤入力の結果を受信する受信手段と、
前記正誤入力により正常状態又は異常状態であると分類された前記撮像画像を前記第１画像及び前記第２画像とともに用いた機械学習により、画像に対して正常状態及び異常状態を判定する第２推定モデルを生成する学習手段と、
を有する学習装置。

【請求項2】

前記受信手段は、前記第１推定モデルが異常状態を示すと判定した前記撮像画像に対して、ユーザが前記正誤入力を行った結果を受信する、
請求項１に記載の学習装置。

【請求項3】

前記受信手段は、前記第１推定モデルが所定レベル以上の信頼度とともに異常状態を示すと判定した前記撮像画像に対して、ユーザが前記正誤入力を行った結果を受信する、
請求項２に記載の学習装置。

【請求項4】

前記受信手段は、前記第１推定モデルが正常状態を示すと判定した前記撮像画像に対して、ユーザが前記正誤入力を行った結果を受信する、
請求項１に記載の学習装置。

【請求項5】

前記受信手段は、表示装置に表示された画像に対してユーザが前記正誤入力を行った結果を受信する、請求項２から４のいずれか一項に記載の学習装置。

【請求項6】

前記取得手段は、前記第２推定モデルを用いて判定され、前記複数の分類のうち物体が映る撮像画像に対して判定された分類を取得する、
請求項１から５のいずれか一項に記載の学習装置。

【請求項7】

前記異常状態とは、前記物体の故障又は不良を示す、請求項１から６のいずれか一項に記載の学習装置。

【請求項8】

前記第１画像は予め蓄積された画像であり、前記第２画像は前記第１画像との類似度が基準値以下であり正常状態を示すと定められた画像である、請求項１から７のいずれか一項に記載の学習装置。

【請求項9】

コンピュータが、
異常状態を示す第１画像及び正常状態を示す第２画像を用いた機械学習により得られた第１推定モデルを用いて判定され、正常状態と異常状態を含む複数の分類のうち物体が映る撮像画像に対して判定された分類を取得する取得工程と、
前記撮像画像ごとに前記判定された分類に対するユーザの正誤入力の結果を受信する受信工程と、
前記正誤入力により正常状態又は異常状態であると分類された前記撮像画像を前記第１画像及び前記第２画像とともに用いた機械学習により、画像に対して正常状態及び異常状態を判定する第２推定モデルを生成する学習工程と、
を実行する学習方法。

【請求項10】

前記コンピュータは、前記受信工程では、前記第１推定モデルが異常状態を示すと判定した前記撮像画像に対して、ユーザが前記正誤入力を行った結果を受信する、
請求項９に記載の学習方法。

【請求項11】

前記コンピュータは、前記受信工程では、前記第１推定モデルが所定レベル以上の信頼度とともに異常状態を示すと判定した前記撮像画像に対して、ユーザが前記正誤入力を行った結果を受信する、
請求項１０に記載の学習方法。

【請求項12】

前記コンピュータは、前記受信工程では、前記第１推定モデルが正常状態を示すと判定した前記撮像画像に対して、ユーザが前記正誤入力を行った結果を受信する、
請求項９に記載の学習方法。

【請求項13】

前記コンピュータは、前記受信工程では、表示装置に表示された画像に対してユーザが前記正誤入力を行った結果を受信する、請求項１０から１２のいずれか一項に記載の学習方法。

【請求項14】

前記コンピュータは、前記取得工程では、前記第２推定モデルを用いて判定され、前記複数の分類のうち物体が映る撮像画像に対して判定された分類を取得する、
請求項９から１３のいずれか一項に記載の学習方法。

【請求項15】

前記異常状態とは、前記物体の故障又は不良を示す、請求項９から１４のいずれか一項に記載の学習方法。

【請求項16】

前記第１画像は予め蓄積された画像であり、前記第２画像は前記第１画像との類似度が基準値以下であり正常状態を示すと定められた画像である、請求項９から１５のいずれか一項に記載の学習方法。

【請求項17】

コンピュータを、
異常状態を示す第１画像及び正常状態を示す第２画像を用いた機械学習により得られた第１推定モデルを用いて判定され、正常状態と異常状態を含む複数の分類のうち物体が映る撮像画像に対して判定された分類を取得する取得手段、
前記撮像画像ごとに前記判定された分類に対するユーザの正誤入力の結果を受信する受信手段、
前記正誤入力により正常状態又は異常状態であると分類された前記撮像画像を前記第１画像及び前記第２画像とともに用いた機械学習により、画像に対して正常状態及び異常状態を判定する第２推定モデルを生成する学習手段、
として機能させるプログラム。

【請求項18】

前記受信手段は、前記第１推定モデルが異常状態を示すと判定した前記撮像画像に対して、ユーザが前記正誤入力を行った結果を受信する、
請求項１７に記載のプログラム。

【請求項19】

前記受信手段は、前記第１推定モデルが所定レベル以上の信頼度とともに異常状態を示すと判定した前記撮像画像に対して、ユーザが前記正誤入力を行った結果を受信する、
請求項１８に記載のプログラム。

【請求項20】

前記受信手段は、前記第１推定モデルが正常状態を示すと判定した前記撮像画像に対して、ユーザが前記正誤入力を行った結果を受信する、
請求項１７に記載のプログラム。

【請求項21】

前記受信手段は、表示装置に表示された画像に対してユーザが前記正誤入力を行った結果を受信する、請求項１８から２０のいずれか一項に記載のプログラム。

【請求項22】

前記取得手段は、前記第２推定モデルを用いて判定され、前記複数の分類のうち物体が映る撮像画像に対して判定された分類を取得する、
請求項１７から２１のいずれか一項に記載のプログラム。

【請求項23】

前記異常状態とは、前記物体の故障又は不良を示す、請求項１７から２２のいずれか一項に記載のプログラム。

【請求項24】

前記第１画像は予め蓄積された画像であり、前記第２画像は前記第１画像との類似度が基準値以下であり正常状態を示すと定められた画像である、請求項１７から２３のいずれか一項に記載のプログラム。

知財求人

知財求人お知らせサービス

知財のニュースを調べる
- 知財ニュース
- 知財周辺ニュース
企業の特許を調べる
知財のセミナーを調べる
知財,特許事務所への求職・転職
特許事務所をさがす
弁理士試験を受ける
- 年の弁理士試験情報
- 弁理士試験の合格率など統計
知財の法律をしらべる
期限日をしらべる
- 今日に対して意見書・補正書の期限
- 今日に対して審査請求期限日
知財の判決をしらべる
コンテンツ・リンク
運営会社
プレスの皆様へ
- お問い合わせ
ユーザーの皆様
- お問い合わせ・フィードバック
広告掲載を希望の皆様へ
- 広告掲載について
- 求人広告の掲載について

IP Force 特許公報掲載プロジェクト 2022.1.31 β版