特開2024-95309 | 知財ポータル「IP Force」

知財求人 - 知財ポータルサイト「IP Force」

▶ 日本電気株式会社の特許一覧

特開2024-95309情報処理装置、情報処理方法及びプログラム

書誌要約請求の範囲詳細な説明課題実施例実施するための形態図面の説明

目に優しい文字サイズ小中大 PDF Top

< >

1
2
3
4
5
6
7
8
9
10

(19)【発行国】日本国特許庁(JP)

(12)【公報種別】公開特許公報(A)

(11)【公開番号】P2024095309

(43)【公開日】2024-07-10

(54)【発明の名称】情報処理装置、情報処理方法及びプログラム

(51)【国際特許分類】

G06N 20/00 20190101AFI20240703BHJP

G06T 7/00 20170101ALI20240703BHJP

G06T 7/70 20170101ALI20240703BHJP

【ＦＩ】

G06N20/00 130

G06T7/00 350B

G06T7/70 Z

【審査請求】未請求

【請求項の数】10

【出願形態】ＯＬ

(21)【出願番号】P 2022212499

(22)【出願日】2022-12-28

(71)【出願人】

【識別番号】000004237

【氏名又は名称】日本電気株式会社

(74)【代理人】

【識別番号】110000338

【氏名又は名称】弁理士法人ＨＡＲＡＫＥＮＺＯＷＯＲＬＤＰＡＴＥＮＴ＆ＴＲＡＤＥＭＡＲＫ

(72)【発明者】

【氏名】田中勇貴

(72)【発明者】

【氏名】寺尾真

【テーマコード（参考）】

5L096

【Ｆターム（参考）】

5L096EA39

5L096FA66

5L096FA67

5L096FA69

5L096GA51

5L096HA11

5L096JA03

5L096KA04

(57)【要約】

【課題】正解なしデータを用いる機械学習において推論精度の高い学習モデルを生成する技術を提供する。
【解決手段】情報処理装置（１）は、画像データに画像の属性を示す属性情報及び正解ラベルが付された正解ありデータと、画像データに画像の属性を示す属性情報が付された正解なしデータとを取得する取得部（１１）と、上記正解ありデータの属性情報と上記正解なしデータの属性情報とにより定まる、当該正解ありデータと当該正解なしデータとの距離を算出する属性間距離算出部（１２）と、複数の上記正解なしデータの中から、上記正解ありデータとの距離が他の正解なしデータよりも小さい正解なしデータを抽出する抽出部（１３）と、上記正解ありデータと上記抽出部（１３）が抽出した正解なしデータとを用いて学習モデルのモデルパラメータを更新する更新部（１４）と、を備える。
【選択図】図１

【特許請求の範囲】

【請求項1】

画像データに画像の属性を示す属性情報及び正解ラベルが付された正解ありデータと、画像データに画像の属性を示す属性情報が付された正解なしデータとを取得する取得手段と、
前記正解ありデータの属性情報と前記正解なしデータの属性情報とにより定まる、当該正解ありデータと当該正解なしデータとの距離を算出する属性間距離算出手段と、
複数の前記正解なしデータの中から、前記正解ありデータとの距離が他の正解なしデータよりも小さい正解なしデータを抽出する抽出手段と、
前記正解ありデータと前記抽出手段が抽出した正解なしデータとを用いて学習モデルのモデルパラメータを更新する更新手段と、
を備える情報処理装置。

【請求項2】

前記抽出手段は、前記学習モデルの学習が進むにつれて抽出する正解なしデータの距離の最大値が大きくなるように前記正解なしデータの抽出を行う、
請求項１に記載の情報処理装置。

【請求項3】

前記抽出手段が抽出した正解なしデータを前記学習モデルに入力して得られる推論結果に基づき、当該正解なしデータに擬似ラベルを付与する擬似ラベル付与手段を更に備え、
前記更新手段は、前記擬似ラベルが付与された正解なしデータと、前記正解ありデータとを用いて前記学習モデルのモデルパラメータを更新する、
請求項１又は２に記載の情報処理装置。

【請求項4】

前記属性情報は、前記画像に含まれる物体の姿勢及び位置、撮影時刻、撮影時間帯、撮影装置の種類及び位置、並びに画質、の少なくともいずれかを示す情報を含み、
前記距離は、前記画像に含まれる物体の姿勢差及び位置の差、撮影時刻差、撮影時間帯の近さ、撮影装置の種類の類似の度合い、撮影装置の位置の差、並びに画質差、の少なくともいずれかに基づき算出される値である、
請求項１又は２に記載の情報処理装置。

【請求項5】

前記抽出手段が抽出した正解なしデータを前記学習モデルに入力して得られる推論結果が所定の条件を満たす正解なしデータに擬似ラベルを付与する擬似ラベル付与手段を更に備え、
前記抽出手段は、抽出した正解なしデータに対する前記擬似ラベルの付与率が所定の収束判定条件を満たす度に、抽出する正解なしデータの数を増加させる、
請求項２に記載の情報処理装置。

【請求項6】

前記抽出手段が抽出した正解なしデータを前記学習モデルに入力して得られる推論結果が所定の条件を満たす正解なしデータに擬似ラベルを付与する擬似ラベル付与手段を更に備え、
前記抽出手段は、抽出した正解なしデータに対する前記擬似ラベルの付与率が所定の閾値を超える度に、抽出する正解なしデータの数を増加させる、
請求項２に記載の情報処理装置。

【請求項7】

前記抽出手段は、前記学習モデルの学習時間が所定の閾値に達する毎に、抽出する正解なしデータの数を増加させる、
請求項２に記載の情報処理装置。

【請求項8】

前記抽出手段が抽出した正解なしデータを前記学習モデルに入力して得られる推論結果に基づき当該正解なしデータに擬似ラベルを付与する擬似ラベル付与手段と、
前記正解ありデータと前記学習モデルとを用いた推論結果と、当該正解ありデータの正解ラベルと、を用いて損失を算出する第１損失算出手段と、
前記正解なしデータと前記学習モデルとを用いた推論結果と、当該正解なしデータの擬似ラベルと、を用いて損失を算出する第２損失算出手段と、
を更に備え、
前記抽出手段は、前記第１損失算出手段が算出した損失と前記第２損失算出手段が算出した損失との和又は重み付き和が所定の収束判定条件を満たす度に、抽出する正解なしデータの数を増加させる、
請求項２に記載の情報処理装置。

【請求項9】

少なくとも１つのプロセッサが、
画像データに画像の属性を示す属性情報及び正解ラベルが付された正解ありデータと、画像データに画像の属性を示す属性情報が付された正解なしデータとを取得することと、
前記正解ありデータの属性情報と前記正解なしデータの属性情報とにより定まる、当該正解ありデータと当該正解なしデータとの距離を算出することと、
複数の前記正解なしデータの中から、前記正解ありデータとの距離が他の正解なしデータよりも小さい正解なしデータを抽出することと、
前記正解ありデータと前記抽出された正解なしデータとを用いて学習モデルのモデルパラメータを更新することと、
を含む、情報処理方法。

【請求項10】

コンピュータに、
画像データに画像の属性を示す属性情報及び正解ラベルが付された正解ありデータと、画像データに画像の属性を示す属性情報が付された正解なしデータとを取得する処理と、
前記正解ありデータの属性情報と前記正解なしデータの属性情報とにより定まる、当該正解ありデータと当該正解なしデータとの距離を算出する処理と、
複数の前記正解なしデータの中から、前記正解ありデータとの距離が他の正解なしデータよりも小さい正解なしデータを抽出する処理と、
前記正解ありデータと前記抽出された正解なしデータとを用いて学習モデルのモデルパラメータを更新する処理と、
を実行させるためのプログラム。

【発明の詳細な説明】

【技術分野】

【0001】

本発明は、機械学習により学習モデルを生成する技術に関する。

【背景技術】

【0002】

教師あり学習では、正解ラベルが付された大量の教師データを用いて学習を行うことで高精度な学習済モデルを構築することができる。しかしながら、教師データを大量に用意するためには大量の画像収集及び正解ラベル付け等を行う必要があり、作業コストが高いという問題がある。そこで、少ない正解ありデータと大量の正解なしデータとから学習済モデルを高精度に実現する手法が提案されている（例えば非特許文献１、特許文献１等参照）。

【先行技術文献】

【特許文献】

【0003】

【特許文献1】国際公開第２０１４／１３６３１６号

【非特許文献】

【0004】

【非特許文献1】Kihyuk Sohn et al., FixMatch: Simplifying Semi-Supervised Learning with Consistency and Confidence, NeurIPS (2020)

【発明の概要】

【発明が解決しようとする課題】

【0005】

しかしながら、非特許文献１及び特許文献１に記載の技術では、正解なしデータについて誤った擬似ラベルが生成されたり、学習がうまく進まなかったりするという問題があり、学習モデルの推論精度を高くするという観点において改善の余地がある。

【0006】

本発明の一態様は、上記の問題に鑑みてなされたものであり、その目的の一例は、正解なしデータを用いる機械学習において推論精度の高い学習モデルを生成する技術を提供することである。

【課題を解決するための手段】

【0007】

本発明の一態様に係る情報処理装置は、画像データに画像の属性を示す属性情報及び正解ラベルが付された正解ありデータと、画像データに画像の属性を示す属性情報が付された正解なしデータとを取得する取得手段と、前記正解ありデータの属性情報と前記正解なしデータの属性情報とにより定まる、当該正解ありデータと当該正解なしデータとの距離を算出する属性間距離算出手段と、複数の前記正解なしデータの中から、前記正解ありデータとの距離が他の正解なしデータよりも小さい正解なしデータを抽出する抽出手段と、前記正解ありデータと前記抽出手段が抽出した正解なしデータとを用いて学習モデルのモデルパラメータを更新する更新手段とを備える。

【0008】

本発明の一態様に係る情報処理方法は、少なくとも１つのプロセッサが、画像データに画像の属性を示す属性情報及び正解ラベルが付された正解ありデータと、画像データに画像の属性を示す属性情報が付された正解なしデータとを取得することと、前記正解ありデータの属性情報と前記正解なしデータの属性情報とにより定まる、当該正解ありデータと当該正解なしデータとの距離を算出することと、複数の前記正解なしデータの中から、前記正解ありデータとの距離が他の正解なしデータよりも小さい正解なしデータを抽出することと、前記正解ありデータと前記抽出された正解なしデータとを用いて学習モデルのモデルパラメータを更新することと、を含む。

【0009】

本発明の一態様に係るプログラムは、コンピュータに、画像データに画像の属性を示す属性情報及び正解ラベルが付された正解ありデータと、画像データに画像の属性を示す属性情報が付された正解なしデータとを取得する処理と、前記正解ありデータの属性情報と前記正解なしデータの属性情報とにより定まる、当該正解ありデータと当該正解なしデータとの距離を算出する処理と、複数の前記正解なしデータの中から、前記正解ありデータとの距離が他の正解なしデータよりも小さい正解なしデータを抽出する処理と、前記正解ありデータと前記抽出された正解なしデータとを用いて学習モデルのモデルパラメータを更新する処理と、を実行させるためのプログラムである。

【発明の効果】

【0010】

本発明の一態様によれば、正解なしデータを用いる機械学習において推論精度の高い学習モデルを生成することができる。

【図面の簡単な説明】

【0011】

【図1】例示的実施形態１に係る情報処理装置の構成を示すブロック図である。

【図2】例示的実施形態１に係る情報処理方法の流れを示すフロー図である。

【図3】例示的実施形態２に係る情報処理装置が行う機械学習の概要を示す図である。

【図4】例示的実施形態２に係る情報処理装置の構成を示すブロック図である。

【図5】例示的実施形態２に係る情報処理装置の機能構成及び処理の流れの一例を示すブロック図である。

【図6】例示的実施形態２に係る学習データ制御部の構成の一例を示す図である。

【図7】例示的実施形態２に係る属性間距離の具体例を示す図である。

【図8】例示的実施形態２に係る属性間距離の具体例を示す図である。

【図9】例示的実施形態２に係る属性間距離の具体例を示す図である。

【図10】各例示的実施形態に係る情報処理装置として機能するコンピュータの構成を示すブロック図である。

【発明を実施するための形態】

【0012】

〔例示的実施形態１〕
本発明の第１の例示的実施形態について、図面を参照して詳細に説明する。本例示的実施形態は、後述する例示的実施形態の基本となる形態である。

【0013】

（情報処理装置の構成）
本例示的実施形態に係る情報処理装置１の構成について、図１を参照して説明する。図１は、情報処理装置１の構成を示すブロック図である。情報処理装置１は、取得部１１（取得手段）、属性間距離算出部１２（属性間距離算出手段）、抽出部１３（抽出手段）及び更新部１４（更新手段）を備える。

【0014】

取得部１１は、画像データに画像の属性を示す属性情報及び正解ラベルが付された正解ありデータと、画像データに画像の属性を示す属性情報が付された正解なしデータとを取得する。属性間距離算出部１２は、上記正解ありデータの属性情報と上記正解なしデータの属性情報とにより定まる、上記正解ありデータと上記正解なしデータとの距離を算出する。抽出部１３は、複数の上記正解なしデータの中から、上記正解ありデータとの距離が他の正解なしデータよりも小さい正解なしデータを抽出する。更新部１４は、上記正解ありデータと抽出部１３が抽出した正解なしデータとを用いて学習モデルのモデルパラメータを更新する。

【0015】

以上のように、本例示的実施形態に係る情報処理装置１においては、画像データに画像の属性を示す属性情報及び正解ラベルが付された正解ありデータと、画像データに画像の属性を示す属性情報が付された正解なしデータとを取得する取得部１１と、上記正解ありデータの属性情報と上記正解なしデータの属性情報とにより定まる、当該正解ありデータと当該正解なしデータとの距離を算出する属性間距離算出部１２と、複数の上記正解なしデータの中から、上記正解ありデータとの距離が他の正解なしデータよりも小さい正解なしデータを抽出する抽出部１３と、上記正解ありデータと抽出部１３が抽出した正解なしデータとを用いて学習モデルのモデルパラメータを更新する更新部１４と、を備える構成が採用されている。このため、本例示的実施形態に係る情報処理装置１によれば、正解なしデータを用いる機械学習において推論精度の高い学習モデルを生成することができるという効果が得られる。

【0016】

（プログラム）
上述の情報処理装置１の機能は、プログラムによって実現することもできる。本例示的実施形態に係るプログラムは、コンピュータに、画像データに画像の属性を示す属性情報及び正解ラベルが付された正解ありデータと、画像データに画像の属性を示す属性情報が付された正解なしデータとを取得する処理と、上記正解ありデータの属性情報と上記正解なしデータの属性情報とにより定まる、当該正解ありデータと当該正解なしデータとの距離を算出する処理と、複数の上記正解なしデータの中から、上記正解ありデータとの距離が他の正解なしデータよりも小さい正解なしデータを抽出する処理と、上記正解ありデータと上記抽出された正解なしデータとを用いて学習モデルのモデルパラメータを更新する処理と、を実行させるためのプログラムである。

【0017】

（情報処理方法の流れ）
本例示的実施形態に係る情報処理方法Ｓ１の流れについて、図２を参照して説明する。図２は、情報処理方法Ｓ１の流れを示すフロー図である。なお、情報処理方法Ｓ１における各ステップの実行主体は、情報処理装置１が備えるプロセッサであってもよいし、他の装置が備えるプロセッサであってもよい。

【0018】

Ｓ１１では、少なくとも１つのプロセッサが、画像データに画像の属性を示す属性情報及び正解ラベルが付された正解ありデータと、画像データに画像の属性を示す属性情報が付された正解なしデータとを取得する。Ｓ１２では、少なくとも１つのプロセッサが、上記正解ありデータの属性情報と上記正解なしデータの属性情報とにより定まる、当該正解ありデータと当該正解なしデータとの距離を算出する。Ｓ１３では、少なくとも１つのプロセッサが、複数の上記正解なしデータの中から、上記正解なしデータとの距離が他の正解なしデータよりも小さい正解なしデータを抽出する。Ｓ１４では、少なくとも１つのプロセッサが、上記正解ありデータと抽出された正解なしデータとを用いて学習モデルのモデルパラメータを更新する。

【0019】

以上のように、本例示的実施形態に係る情報処理方法Ｓ１は、少なくとも１つのプロセッサが、画像データに画像の属性を示す属性情報及び正解ラベルが付された正解ありデータと、画像データに画像の属性を示す属性情報が付された正解なしデータとを取得することと、上記正解ありデータの属性情報と上記正解なしデータの属性情報とにより定まる、当該正解ありデータと当該正解なしデータとの距離を算出することと、複数の上記正解なしデータの中から、上記正解ありデータとの距離が他の正解なしデータよりも小さい正解なしデータを抽出することと、上記正解ありデータと上記抽出された正解なしデータとを用いて学習モデルのモデルパラメータを更新することと、を含む。このため、本例示的実施形態に係る情報処理方法Ｓ１によれば、正解なしデータを用いる機械学習において推論精度の高い学習モデルを生成することができるという効果が得られる。

【0020】

〔例示的実施形態２〕
（情報処理装置の概要）
本発明の第２の例示的実施形態について図面を参照して説明する。本例示的実施形態に係る情報処理装置１Ａは、機械学習により学習モデルを生成する。学習モデルとしては例えば、画像に含まれる物体（商品等）を識別するモデル、画像に含まれる人物の行動を認識するモデル、画像を分類するモデル、等が上げられる。本例示的実施形態に係る学習モデルは、画像分類に限らず、物体検知やセグメンテーションも含めた画像認識タスク一般に用いることができる。ただし、学習モデルは上述した例に限定されない。また、学習モデルの学習手法としては例えばニューラルネットワーク、ＳＶＭ（Support Vector Machine）、等が挙げられる。ただし、学習モデルの学習手法は上述した例に限定されない。推論フェーズにおける学習モデルの入力は、一例として画像データを含む。学習モデルの出力は、一例として物体（商品等）の識別結果、人物の行動の認識結果、画像の分類結果、等を示す情報を含む。

【0021】

情報処理装置１Ａは、正解ありデータと正解なしデータとを用いて学習モデルを生成する。正解ありデータは、画像データに属性情報及び正解ラベルが付されたデータである。正解ありデータは一例として、商品の撮影画像を表す画像データに、商品の姿勢を示す属性情報と、商品の種別を示すラベルが付されたデータである。正解なしデータは、画像データに属性情報が付されたデータであり、正解なしデータには正解ラベルが付されていない。正解なしデータは一例として、商品の撮影画像を表す画像データに、商品の姿勢を示す属性情報が付されたデータである。

【0022】

属性情報は、画像の属性を示す情報である。属性情報は、一例として、画像に含まれる物体の姿勢及び位置、撮影時刻、撮影時間帯（朝、昼、夕方、夜、等）、撮影装置の種類及び位置、並びに画質、の少なくともいずれかを示す情報を含む。物体の位置を示す情報は、一例として、物体の座標を示す情報、又は物体が置かれた棚を識別する情報等を含む。撮影時間帯を示す情報は、一例として、物体の撮影時刻が朝、昼、夕方、夜、等のどの時間帯に属するかを示す情報を含む。ただし、属性情報はこれらに限定されない。また、画像データとしては、例えば商品を撮影した画像を表すデータが挙げられるが、画像データはこれに限定されるものではなく、他のデータであってもよい。

【0023】

本例示的実施形態に係る情報処理装置１Ａは、正解なしデータを全て同列に扱って一括で学習に用いるのではなく、正解なしデータから抽出した一部の正解なしデータに擬似ラベルを付与し、擬似ラベルを付与した正解なしデータと正解ありデータとを用いて学習を行う。このとき、情報処理装置１Ａは、属性情報により定まる正解ありデータと正解なしデータとの距離に基づき、学習モデルの学習に用いる正解なしデータの抽出を行う。

【0024】

本例示的実施形態において、正解ありデータと正解なしデータとの距離は、正解ありデータの属性情報と正解なしデータの属性情報とにより定まる値である。以下の説明では、正解ありデータの属性情報と正解なしデータの属性情報とにより定まる上記距離を「属性間距離」ともいう。属性間距離は、一例として、画像に含まれる物体の姿勢差及び位置の差、撮影時刻差、撮影時間帯の近さ、撮影装置の種類の類似の度合い、撮影装置の位置の差、並びに画質差、の少なくともいずれかに基づき算出される値である。物体の姿勢差は一例として、物体の角度差（上下角の差及び／又は水平角の差）である。また、物体の位置の差は一例として、物体の座標差である。また、撮影装置の位置の差は一例として、撮影装置の座標差及び／又は撮影方向の角度差を含む。

【0025】

また、属性間距離は、画像の属性を示す複数の要素を組み合わせて算出される値であってもよい。属性間距離は例えば、画像に含まれる物体の角度差と撮影時刻差とを用いて算出される値であってもよい。ただし、属性間距離は上述した例に限定されない。属性間距離は例えば、撮影装置の種類の類似度を示す情報であってもよい。

【0026】

図３は、情報処理装置１Ａが行う機械学習の概要を示す図である。図３の例で、情報処理装置１Ａは、第１ステップ～第ｎステップのｎ回に分けて学習モデルの学習を行う。第１ステップにおいて、情報処理装置１Ａは、正解ありデータと、正解なしデータのうちの一部のデータとを用いて学習を行う。ここで、情報処理装置１Ａが第１ステップで用いる正解なしデータは、正解ありデータとの属性間距離が近い順に選択された一部の正解なしデータである。また、第２ステップにおいて、情報処理装置１Ａは第１ステップで用いた正解なしデータよりも正解ありデータとの属性間距離が遠いデータを含む正解なしデータを用いて学習を行う。また、第３ステップにおいて、情報処理装置１Ａは、更に遠い正解なしデータを用いて学習を行う。このように、情報処理装置１Ａは学習のステップが進むにつれて用いる正解なしデータを徐々に多くする。情報処理装置１Ａは、最終ステップである第ｎステップでは、正解ありデータと全ての正解なしデータとを用いて学習を行う。ただし、必ずしも最終ステップですべての正解なしデータを使う必要はなく、最終ステップにおいて学習に用いられないデータがあってもよい。

【0027】

このように本例示的実施形態では、情報処理装置１Ａは、属性間距離が正解ありデータとより近い正解なしデータを優先して学習に使用する。換言すると、情報処理装置１Ａは正解なしデータを学習に投入する順序を属性間距離に基づき制御する。属性間距離が正解ありデータとより近い正解なしデータを優先して学習に使用し、学習が進むにつれて学習に用いる正解なしデータの数を増やしていくことにより、本例示的実施形態によれば、擬似ラベルを精度よく生成することができ、これにより推論精度の高い学習モデルを生成することができる。

【0028】

（情報処理装置の構成）
図４は、本例示的実施形態に係る情報処理装置１Ａの構成を示すブロック図である。情報処理装置１Ａは、制御部１０Ａ、記憶部２０Ａ、通信部３０Ａ及び入出力部４０Ａを備える。制御部１０Ａは、学習データ制御部１２Ａ、パラメータ更新部１３Ａ、推論部１４Ａ、第１損失計算部１５Ａ、及び第２損失計算部１６Ａを備える。学習データ制御部１２Ａは、本明細書に係る取得手段、属性間距離算出手段、及び抽出手段の一例である。パラメータ更新部１３Ａは、本明細書に係る更新手段の一例である。推論部１４Ａは、本明細書に係る擬似ラベル付与手段の一例である。第１損失計算部１５Ａは、本明細書に係る損失算出手段及び第１損失算出手段の一例である。及び第２損失計算部１６Ａは、本明細書に係る損失算出手段及び第２損失算出手段の一例である。

【0029】

学習データ制御部１２Ａは、正解ありデータと正解なしデータとを取得する。学習データ制御部１２Ａは、例えば情報処理装置１Ａの入出力部４０Ａを介して正解ありデータ及び正解なしデータを取得してもよいし、また、通信部３０Ａを介して正解ありデータ及び正解なしデータを受信してもよい。また、学習データ制御部１２Ａは情報処理装置１Ａが内蔵する記憶装置又は外部記憶装置から正解ありデータ及び正解なしデータを読み出すことにより正解ありデータ及び正解なしデータを取得してもよい。

【0030】

また、学習データ制御部１２Ａは、正解ありデータと上記正解なしデータとの属性間距離を算出し、算出した属性間距離と学習モデルＬＭの学習の進捗状況とに応じて、取得した正解なしデータの中から学習モデルＬＭの学習に用いる正解なしデータを抽出する。学習データ制御部１２Ａが行う属性間距離の算出処理及び正解なしデータの抽出処理については後述する。

【0031】

推論部１４Ａは、学習モデルＬＭに画像データを入力することにより推論を行う。また、推論部１４Ａは、学習データ制御部１２Ａが抽出した正解なしデータを学習モデルＬＭに入力して得られる推論結果に基づき、当該正解なしデータに擬似ラベルを付与する。パラメータ更新部１３Ａは、擬似ラベルが付与された正解なしデータと、正解ありデータとを用いて学習モデルＬＭのモデルパラメータを更新する。パラメータ更新部１３Ａの更新方法については後述する。

【0032】

第１損失計算部１５Ａは、正解ありデータと学習モデルＬＭとを用いた推論結果と、当該正解ありデータの正解ラベルと、を用いて損失を算出する。第２損失計算部１６Ａは、正解なしデータと学習モデルＬＭとを用いた推論結果と、当該正解なしデータの擬似ラベルと、を用いて損失を算出する。

【0033】

通信部３０Ａは、情報処理装置１Ａの外部の装置と通信回線を介して通信する。通信回線の具体的構成は本例示的実施形態を限定するものではないが、通信回線は一例として、無線ＬＡＮ（Local Area Network）、有線ＬＡＮ、ＷＡＮ（Wide Area Network）、公衆回線網、モバイルデータ通信網、又は、これらの組み合わせである。通信部３０Ａは、制御部１０Ａから供給されたデータを他の装置に送信したり、他の装置から受信したデータを制御部１０Ａに供給したりする。

【0034】

入出力部４０Ａには、キーボード、マウス、ディスプレイ、プリンタ、タッチパネル等の入出力機器が接続される。入出力部４０Ａは、接続された入力機器から情報処理装置１Ａに対する各種の情報の入力を受け付ける。また、入出力部４０Ａは、制御部１０Ａの制御の下、接続された出力機器に各種の情報を出力する。入出力部４０Ａとしては、例えばＵＳＢ（Universal Serial Bus）などのインタフェースが挙げられる。

【0035】

記憶部２０Ａには、学習データ制御部１２Ａが取得する正解ありデータＴＤ１及び正解なしデータＴＤ２が記憶される。また、記憶部２０Ａには、学習モデルＬＭが記憶される。ここで、記憶部２０Ａに学習モデルＬＭが記憶されるとは、学習モデルＬＭを定めるモデルパラメータが記憶部２０Ａに記憶されることをいう。

【0036】

また、記憶部２０Ａには、進捗情報ＰＩが記憶される。進捗情報ＰＩは、学習モデルＬＭの機械学習の進捗状況を示す情報である。進捗情報ＰＩは一例として、学習ステップ数（学習時間）、正解なしデータに対する擬似ラベルの付与率、正解ありデータを用いて算出された損失、及び、正解なしデータを用いて算出された損失、の少なくともいずれかを示す情報を含む。ただし、進捗情報ＰＩは上述した例に限定されず、進捗情報ＰＩは学習の進捗状況を示す他の情報であってもよい。

【0037】

図５は、情報処理装置１Ａの機能構成及び処理の流れの一例を示すブロック図である。なお、図５における一方向性の矢印はある信号（データ）の流れの方向を端的に示したものであり、双方向性を排除するものではない。図５に示す学習データ制御部１２Ａ、パラメータ更新部１３Ａ、推論部１４Ａ、第１損失計算部１５Ａ、及び第２損失計算部１６Ａが行う処理の具体例について順に図面を参照しつつ説明する。

【0038】

（学習データ制御部）
図６は、学習データ制御部１２Ａの構成の一例を示す図である。なお、図６における一方向性の矢印はある信号（データ）の流れの方向を端的に示したものであり、双方向性を排除するものではない。図６の例で、学習データ制御部１２Ａは、属性間距離算出部１２１及び学習データ決定部１２２を備える。属性間距離算出部１２１は、正解ありデータの属性情報と正解なしデータの属性情報とを用いて属性間距離を算出する。属性間距離算出部１２１が算出する属性間距離については後述する。

【0039】

学習データ決定部１２２は、属性間距離算出部１２１が算出した属性間距離と、進捗情報ＰＩとに基づき、正解なしデータＴＤ２の中から学習に用いる正解なしデータを抽出する。ここで、学習データ決定部１２２が抽出する正解なしデータは、正解ありデータとの属性間距離が他の正解なしデータ（抽出されない正解データ）よりも小さいデータである。なお、正解ありデータが複数ある場合、属性間距離算出部１２１は一例として、正解なしデータのそれぞれについて複数の正解ありデータとの属性間距離を算出し、学習データ決定部１２２は、１つの正解なしデータについて算出された複数の属性間距離のうち最も小さい属性間距離を用いて上記抽出処理を行う。

【0040】

また、学習データ決定部１２２は、学習モデルＬＭの機械学習が進むにつれて抽出する正解なしデータの距離の最大値が大きくなるように正解なしデータの抽出を行う。以下では、学習モデルＬＭの学習に用いるデータ（正解ありデータと学習データ決定部１２２が抽出した正解なしデータ）を「学習データ」ともいう。

【0041】

（推論部）
図５の説明に戻る。図５において、推論部１４Ａは、正解ありデータに含まれる画像データを学習モデルＬＭに入力することにより得られる推論結果を、第１損失計算部１５Ａに供給する。推論結果は一例として、各ラベルの確からしさを示す推論スコアを含む。

【0042】

また、推論部１４Ａは、学習データ制御部１２Ａが抽出した正解なしデータに含まれる画像データを学習モデルＬＭに入力することにより得られる推論結果に基づき、正解なしデータに擬似ラベルを付与し、推論結果と擬似ラベルとを第２損失計算部１６Ａに供給する。このとき、推論部１４Ａは、全ての正解なしデータに擬似ラベルを付与するのではなく、学習データ制御部１２Ａが抽出した正解なしデータを学習モデルＬＭに入力して得られる推論結果が所定の条件を満たす正解なしデータに擬似ラベルを付与する。より具体的には、推論部１４Ａは一例として、推論スコアが所定の閾値を越えた正解なしデータに擬似ラベルを付与する。また、推論部１４Ａは、学習データ制御部１２Ａが抽出した正解なしデータに対する擬似データの付与率を示す情報を進捗情報ＰＩとして記憶部２０Ａに記憶する。

【0043】

（第１損失計算部）
第１損失計算部１５Ａは、推論部１４Ａによる正解ありデータの推論結果と当該正解ありデータの正解ラベルとを用いて損失を計算する。第１損失計算部１５Ａは、計算した損失をパラメータ更新部１３Ａに供給するとともに、進捗情報ＰＩとして記憶部２０Ａに記憶する。

【0044】

（第２損失計算部）
第２損失計算部１６Ａは、推論部１４Ａによる擬似ラベルが付された正解なしデータの推論結果と、当該正解なしデータに付された擬似ラベルとを用いて損失を計算する。第２損失計算部１６Ａは、計算した損失をパラメータ更新部１３Ａに供給するとともに、進捗情報ＰＩとして記憶部２０Ａに記憶する。

【0045】

（パラメータ更新部）
パラメータ更新部１３Ａは、第１損失計算部１５Ａが計算した損失と、第２損失計算部１６Ａが計算した損失とを用いて、学習モデルＬＭを規定するモデルパラメータを更新する。パラメータ更新部１３Ａは一例として、第１損失計算部１５が計算した損失及び第２損失計算部１６Ａが計算した損失が小さくなるように上記モデルパラメータを更新する。推論部１４Ａによる推論処理～パラメータ更新部１３Ａによるモデルパラメータの更新処理が繰り返し実行されることにより、学習モデルＬＭの学習が進行する。

【0046】

（属性間距離の具体例１～３）
ここで、属性間距離算出部１２１が算出する属性間距離の具体例１～３について図面を参照しつつ説明する。図７～図９は、属性間距離算出部１２１が算出する属性間距離の具体例１～３を示す図である。図７～図９の例において、正解ありデータ及び正解なしデータに含まれる画像データは、商品を撮影した撮影画像を表すデータである。

【0047】

（属性間距離の具体例１）
図７の例で、属性情報は、撮影画像に含まれる商品の姿勢（角度）を示す情報であり、属性間距離は、画像データに含まれる商品の姿勢（角度）の差に基づき定まる値である。この例で、姿勢の差が大きいほど属性間距離は大きくなる。

【0048】

図７の例で、正解ありデータに含まれる画像データは、一例として、商品を正面から撮影した画像を表すデータである。ここで、商品の正面とは、一例として、商品名が記されたラベル等が最も視認し易い方向である。ただし、正解ありデータに含まれる画像データは、商品を正面から撮影した画像を表すデータに限られず、商品を他の方向から撮影した画像を表すデータであってもよい。

【0049】

また、正解ありデータに含まれる属性情報は、撮影画像に含まれる商品の上下角が０度であり、水平角が０度である旨を示す情報である。ここで、上下角は鉛直方向における商品の角度であり、水平角は鉛直方向に垂直な方向における商品の角度である。すなわち、図７の例における正面方向は、上下角が０度であり、かつ水平角が０度である方向である。また、正解なしデータに含まれる画像データは、商品を様々な方向から撮影した画像を表すデータであり、正解なしデータに含まれる属性情報は、それぞれの撮影画像に含まれる商品の上下角と水平角とを示す情報である。

【0050】

ここで、正解ありデータの上下角をα_０、水平角をβ_０とし、正解なしデータの上下角をα_ｉ、水平角をβ_ｉとすると、属性間距離算出部１２１は、上下角の差分｜α_ｉ－α_０｜及び水平角の差分｜β_ｉ－β_０｜の少なくともいずれかを用いて属性間距離を算出する。属性間距離算出部１２１は、一例として、上下角の差分｜α_ｉ－α_０｜と水平角の差分｜β_ｉ－β_０｜の二乗和を属性間距離として算出してもよく、また、上下角の差分｜α_ｉ－α_０｜と水平角の差分｜β_ｉ－β_０｜の重み付け二乗和を属性間距離として算出してもよい。

【0051】

また、属性間距離算出部１２１は、水平角の差分を用いることなく上下角の差分のみを用いて属性間距離を算出してもよい。この場合、上下角が０度である正解ありデータとの距離は、例えば、上下０度の画像（水平角は任意）、上下３０度の画像（水平角は任意）、上下６０度の画像（水平角は任意）、…の順に大きくなる。この場合、上下角の差分が同じであれば距離も同じになる。

【0052】

また、属性間距離算出部１２１は、上下角の差分を用いて属性間距離を算出し、かつ、上下角の差分が同じである画像については水平角の差分が小さいほど距離が近くなるように、属性間距離を算出してもよい。この場合、上下角が０度、水平角が０である正解ありデータとの距離は、例えば、上下０度の画像、上下３０度の画像、上下６０度の画像、…の順に大きくなり、かつ、上下角の差分が同じである画像の正解ありデータとの距離は、水平角の差分が大きいほど、大きくなる。ただし、属性間距離を算出する手法は上述した例に限られず、属性間距離算出部１２１は他の手法により属性間距離を算出してもよい。

【0053】

（属性間距離の具体例２）
図８の例で、属性情報は、画像の撮影時刻を示す情報であり、属性間距離は、撮影時刻の差分に基づき定まる値である。この例で、時刻の差分が大きいほど属性間距離は大きくなる。この場合、正解ありデータに含まれる画像データは、ある時刻に撮影された画像を表すデータである。正解なしデータに含まれる画像データは、様々な時刻に撮影された画像を表すデータである。

【0054】

（属性間距離の具体例３）
図９の例において、属性情報は、撮影装置の位置（座標）、角度を示す情報であり、属性間距離は、撮影装置の位置の座標差、角度差に基づき定まる値である。この例では、撮影装置の座標差及び／又は角度差が大きいほど属性間距離は大きくなる。この場合、正解ありデータに含まれる画像データは、ある位置で撮影された画像を表すデータであり、正解なしデータに含まれる画像データは、様々な位置で撮影された画像を表すデータである。

【0055】

属性間距離算出部１２１は、一例として、座標の差分値と角度の差分値の二乗和を属性間距離として算出してもよく、また、座標の差分値と角度の差分値の重み付け二乗和を属性間距離として算出してもよい。

【0056】

（学習データの決定の具体例１～５）
次いで、学習データ決定部１２２が行う正解なしデータの抽出方法の具体例１～３について説明する。

【0057】

（学習データの決定の具体例１）
具体例１は、トータルの学習時間をＮ等分して、正解ありデータとの属性間距離が小さい順に１／Ｎずつ学習データを増やしていく手法である。換言すると、学習データ制御部１２Ａは、学習モデルＬＭの機械学習の学習時間が所定の閾値に達する毎に、抽出する正解なしデータの数を増加させる。また、このとき、学習データ制御部１２Ａは、複数の正解なしデータを距離に基づき複数のグループに分類し、学習モデルＬＭの機械学習が進むにつれて抽出するグループを増加させる。

【0058】

より具体的には、例えば、正解なしデータの総数が１００、Ｎ＝５、トータル学習時間が５、である場合、０～１の学習時間では、学習データ決定部１２２は正解ありデータとの属性間距離が他の正解なしデータよりも近い２０個の正解なしデータを抽出する。また、１～２の学習時間では、学習データ決定部１２２は正解ありデータとの属性間距離が他の正解なしデータよりも近い４０（２０＋２０）個の正解なしデータを抽出する。また、２～３の学習時間では、学習データ決定部１２２は正解ありデータとの属性間距離が他の正解なしデータよりも近い６０（４０＋２０）個の正解なしデータを抽出する。また、３～４の学習時間では、学習データ決定部１２２は正解ありデータとの属性間距離が他の正解なしデータよりも近い順に８０（６０＋２０）個の正解なしデータを抽出する。また、４～５の学習時間では、１００個（８０＋２０）個の正解なしデータを抽出する。

【0059】

（学習データの決定の具体例２）
具体例２は、学習データの一定数（例えば８割）に擬似ラベルが付与されたら、次の学習データを追加する、という手法である。換言すると、学習データ制御部１２Ａは、抽出した正解なしデータに対する擬似ラベルの付与率が所定の閾値を越える度に、抽出する正解なしデータの数を増加させる。

【0060】

より具体的には、学習データ制御部１２Ａは、例えば、学習データ制御部１２Ａが抽出した正解なしデータの８割に擬似ラベルが付与される度に、次の正解なしデータを学習データに追加する、という処理を繰り返し実行する。これにより、正解なしデータが属性間距離の近い順に徐々に学習に使用される。

【0061】

（学習データの決定の具体例３）
具体例３は、正解ありデータについて計算された損失がある程度落ち着いたら次の学習データを追加する、という手法である。換言すると、学習データ制御部１２Ａは、第１損失計算部１５Ａが算出した損失が所定の収束判定条件を満たす度に、抽出する正解なしデータの数を増加させる。ここで、収束判定条件は、損失がある程度収束したことを示す条件であり、一例として、損失の変化量が所定の閾値以下に収まっている、といった条件である。

【0062】

（学習データの決定の具体例４）
具体例４は、正解なしデータについて計算された損失がある程度落ち着いたら次の学習データを追加する、という手法である。換言すると、学習データ制御部１２Ａは、第２損失計算部１６Ａが算出した損失が所定の収束判定条件を満たす度に、抽出する正解なしデータの数を増加させる。収束判定条件は、損失がある程度収束したことを示す条件であり、一例として、損失の変化量が所定の閾値以下に収まっている、といった条件である。

【0063】

（学習データの決定の具体例５）
具体例５は、擬似ラベルの付与率がある程度落ち着いたら、次の学習データを追加する、という手法である。換言すると、学習データ制御部１２Ａは、抽出した正解なしデータに対する擬似ラベルの付与率が所定の収束判定条件を満たす度に、抽出する正解なしデータの数を増加させる。ここで、収束判定条件は、付与率がある程度収束したことを示す条件であり、一例として、付与率の変化量（増加量又は減少量）が所定の閾値以下に収まっている、といった条件である。

【0064】

（学習データの決定の具体例６）
具体例６は、正解あり損失と正解なし損失の和（もしくは重みつき和）がある程度収束したら次の学習データを追加する、という手法である。換言すると、学習データ制御部１２Ａは、第１損失計算部１５Ａが算出した損失と第２損失計算部１６Ａ手段が算出した損失との和又は重み付き和が所定の収束判定条件を満たす度に、抽出する正解なしデータの数を増加させる。ここで、収束判定条件は、上記和又は重み付き和がある程度収束したことを示す条件であり、一例として、上記和又は重み付き和の変化量（増加量又は減少量等）が所定の閾値以下に収まっている、といった条件である。

【0065】

ただし、学習データ制御部１２Ａが学習データを決定する手法は上述した例に限定されるものではなく、学習データ制御部１２Ａは他の手法により学習データを決定してもよい。また、学習データ制御部１２Ａは、上述の具体例１～５の一部又は全部の手法を組み合わせて学習データを決定してもよい。例えば、学習データ制御部１２Ａは、（ｉ）擬似ラベルの付与率が所定の閾値を越えた場合、（ｉｉ）正解ありデータについて算出された損失が所定の収束判定条件を満たした場合、及び、（ｉｉｉ）正解なしありデータについて算出された損失が所定の収束判定条件を満たした場合、の少なくともいずれかの場合に、学習データを追加してもよい。

【0066】

（情報処理装置の効果）
本例示的実施形態に係る情報処理装置１Ａの学習データ制御部１２Ａは、学習モデルＬＭの学習が進むにつれて抽出する正解なしデータの距離の最大値が大きくなるように、正解なしデータの抽出を行う構成が採用されている。このため、本例示的実施形態に係る情報処理装置１Ａによれば、正解ありデータの属性との類似度がより高い属性を有する正解なしデータを優先して学習に用いるとともに、学習に用いる正解なしデータを学習が進むにつれて増やすことができ、これにより、より推論精度の高い学習モデルを生成できるという効果が得られる。

【0067】

また、本例示的実施形態に係る情報処理装置１Ａにおいては、学習データ制御部１２Ａが抽出した正解なしデータを学習モデルＬＭに入力して得られる推論結果に基づき、当該正解なしデータに擬似ラベルを付与する推論部１４Ａを備え、パラメータ更新部１３Ａは、正解ありデータと擬似ラベルが付与された正解なしデータとを用いて学習モデルＬＭのモデルパラメータを更新するという構成が採用されている。このため、本例示的実施形態に係る情報処理装置１Ａによれば、擬似ラベルを精度よく生成できるとともに、生成された擬似ラベルを用いることでより推論精度の高い学習モデルを生成できるという効果が得られる。

【0068】

また、本例示的実施形態に係る情報処理装置１Ａにおいては、属性情報は、画像に含まれる物体の姿勢及び位置、撮影時刻、撮影時間帯、撮影装置の種類及び位置、並びに画質、の少なくともいずれかを示す情報を含み、距離は、画像に含まれる物体の姿勢差及び位置の差、撮影時刻差、撮影時間帯の近さ、撮影装置の種類の類似の度合い、撮影装置の位置の差、並びに画質差、の少なくともいずれかに基づき算出される値である。

【0069】

例えば同じ棚においてある商品では隣り合った商品は似ていると推定することができる。このように、正解ありデータにより類似した正解なしデータ（例えば物品の姿勢が正解なしデータに近い正解なしデータ、撮影時刻が正解なりデータに近い正解なしデータ、正解ありデータの商品と同じ棚に置かれた商品を撮影した画像を含む正解なしデータ、等）を他の正解なしデータよりも優先して学習に用いることで、学習モデルＬＭの推論精度を高くすることができる。

【0070】

また、本例示的実施形態に係る情報処理装置１Ａは、学習データ制御部１２Ａが抽出した正解なしデータを学習モデルＬＭに入力して得られる推論結果が所定の条件を満たす正解なしデータに擬似ラベルを付与する推論部１４Ａを備え、学習データ制御部１２Ａは、抽出した正解なしデータに対する前記擬似ラベルの付与率が所定の収束判定条件を満たす度に、抽出する正解なしデータの数を増加させる。学習モデルＬＭの学習が進むほど擬似ラベルの付与率は安定するため、本例示的実施形態に係る情報処理装置１Ａによれば、学習モデルＬＭの学習が進むについて学習に用いる正解なしデータを増やすことができ、これにより、推論精度の高い学習モデルＬＭを生成できるという効果が得られる。

【0071】

また、本例示的実施形態に係る情報処理装置１Ａは、学習データ制御部１２Ａが抽出した正解なしデータを学習モデルＬＭに入力して得られる推論結果が所定の条件を満たす正解なしデータに擬似ラベルを付与する推論部１４Ａを備え、学習データ制御部１２Ａは、抽出した正解なしデータに対する擬似ラベルの付与率が所定の閾値を越える度に、抽出する正解なしデータの数を増加させる。

【0072】

学習モデルＬＭの学習が進むほど擬似ラベルの付与率は高くなるため、本例示的実施形態に係る情報処理装置１Ａによれば、学習モデルＬＭの学習が進むにつれて学習に用いる正解なしデータを増やすことができ、これにより、推論精度の高い学習モデルＬＭを生成できるという効果が得られる。

【0073】

また、本例示的実施形態に係る情報処理装置１Ａの学習データ制御部１２Ａは、学習モデルＬＭの学習時間が所定の閾値に達する毎に、抽出する正解なしデータの数を増加させる。このため、本例示的実施形態に係る情報処理装置１Ａによれば、学習モデルＬＭの学習が進むにつれて学習に用いる正解なしデータを増やすことができ、これにより、推論精度の高い学習モデルＬＭを生成できるという効果が得られる。

【0074】

また、本例示的実施形態に係る情報処理装置１Ａの学習データ制御部１２Ａは、第１損失計算部１５Ａが算出した損失と第２損失計算部１６Ａが算出した損失との和又は重み付き和が所定の収束判定条件を満たす度に、抽出する正解なしデータの数を増加させる。学習モデルＬＭの学習が進むほど上記和又は重み付け和は安定するため、本例示的実施形態に係る情報処理装置１Ａによれば、学習モデルＬＭの学習が進むにつれて学習に用いる正解なしデータを増やすことができ、これにより、推論精度の高い学習モデルＬＭを生成できるという効果が得られる。

【0075】

また、本例示的実施形態に係る情報処理装置１Ａは、正解ありデータと学習モデルＬＭとを用いた推論結果と、当該正解ありデータの正解ラベルと、を用いて損失を算出する第１損失計算部１５Ａを備え、学習データ制御部１２Ａは、第１損失計算部１５Ａが算出した損失が所定の収束判定条件を満たす度に抽出する正解なしデータの数を増加させる。

【0076】

学習モデルＬＭの学習が進むほど損失は収束するため、本例示的実施形態に係る情報処理装置１Ａによれば、学習モデルＬＭの学習が進むにつれて学習に用いる正解なしデータを増やすことができ、これにより、推論精度の高い学習モデルＬＭを生成できるという効果が得られる。

【0077】

また、本例示的実施形態に係る情報処理装置１Ａは、学習データ制御部１２Ａが抽出した正解なしデータを学習モデルＬＭに入力して得られる推論結果に基づき当該正解なしデータに擬似ラベルを付与する推論部１４Ａと、上記正解なしデータと学習モデルＬＭとを用いた推論結果と、当該正解なしデータの擬似ラベルと、を用いて損失を算出する第２損失計算部１６Ａとを備え、学習データ制御部１２Ａは、第２損失計算部１６Ａが算出した損失が所定の収束判定条件を満たす度に、抽出する正解なしデータの数を増加させる。

【0078】

【0079】

また、本例示的実施形態に係る情報処理装置１Ａの学習データ制御部１２Ａは、複数の正解なしデータを距離に基づき複数のグループに分類し、機械学習が進むにつれて抽出するグループを増加させる。このため、本例示的実施形態に係る情報処理装置１Ａによれば、学習モデルＬＭの学習が進むにつれて学習に用いる正解なしデータを増やすことができ、これにより、推論精度の高い学習モデルＬＭを生成できるという効果が得られる。

【0080】

〔ソフトウェアによる実現例〕
情報処理装置１、１Ａの一部又は全部の機能は、集積回路（ＩＣチップ）等のハードウェアによって実現してもよいし、ソフトウェアによって実現してもよい。

【0081】

後者の場合、情報処理装置１、１Ａは、例えば、各機能を実現するソフトウェアであるプログラムの命令を実行するコンピュータによって実現される。このようなコンピュータの一例（以下、コンピュータＣと記載する）を図１０に示す。コンピュータＣは、少なくとも１つのプロセッサＣ１と、少なくとも１つのメモリＣ２と、を備えている。メモリＣ２には、コンピュータＣを情報処理装置１、１Ａとして動作させるためのプログラムＰが記録されている。コンピュータＣにおいて、プロセッサＣ１は、プログラムＰをメモリＣ２から読み取って実行することにより、情報処理装置１、１Ａの各機能が実現される。

【0082】

プロセッサＣ１としては、例えば、ＣＰＵ（Central Processing Unit）、ＧＰＵ（Graphic Processing Unit）、ＤＳＰ（Digital Signal Processor）、ＭＰＵ（Micro Processing Unit）、ＦＰＵ（Floating point number Processing Unit）、ＰＰＵ（Physics Processing Unit）、ＴＰＵ（Tensor Processing Unit）、量子プロセッサ、マイクロコントローラ、又は、これらの組み合わせなどを用いることができる。メモリＣ２としては、例えば、フラッシュメモリ、ＨＤＤ（Hard Disk Drive）、ＳＳＤ（Solid State Drive）、又は、これらの組み合わせなどを用いることができる。

【0083】

なお、コンピュータＣは、プログラムＰを実行時に展開したり、各種データを一時的に記憶したりするためのＲＡＭ（Random Access Memory）を更に備えていてもよい。また、コンピュータＣは、他の装置との間でデータを送受信するための通信インタフェースを更に備えていてもよい。また、コンピュータＣは、キーボードやマウス、ディスプレイやプリンタなどの入出力機器を接続するための入出力インタフェースを更に備えていてもよい。

【0084】

また、プログラムＰは、コンピュータＣが読み取り可能な、一時的でない有形の記録媒体Ｍに記録することができる。このような記録媒体Ｍとしては、例えば、テープ、ディスク、カード、半導体メモリ、又はプログラマブルな論理回路などを用いることができる。コンピュータＣは、このような記録媒体Ｍを介してプログラムＰを取得することができる。また、プログラムＰは、伝送媒体を介して伝送することができる。このような伝送媒体としては、例えば、通信ネットワーク、又は放送波などを用いることができる。コンピュータＣは、このような伝送媒体を介してプログラムＰを取得することもできる。

【0085】

〔付記事項１〕
本発明は、上述した実施形態に限定されるものでなく、請求項に示した範囲で種々の変更が可能である。例えば、上述した実施形態に開示された技術的手段を適宜組み合わせて得られる実施形態についても、本発明の技術的範囲に含まれる。

【0086】

〔付記事項２〕
上述した実施形態の一部又は全部は、以下のようにも記載され得る。ただし、本発明は、以下の記載する態様に限定されるものではない。
（付記１）
画像データに画像の属性を示す属性情報及び正解ラベルが付された正解ありデータと、画像データに画像の属性を示す属性情報が付された正解なしデータとを取得する取得手段と、前記正解ありデータの属性情報と前記正解なしデータの属性情報とにより定まる、当該正解ありデータと当該正解なしデータとの距離を算出する属性間距離算出手段と、複数の前記正解なしデータの中から、前記正解ありデータとの距離が他の正解なしデータよりも小さい正解なしデータを抽出する抽出手段と、前記正解ありデータと前記抽出手段が抽出した正解なしデータとを用いて学習モデルのモデルパラメータを更新する更新手段と、を備える情報処理装置。

【0087】

（付記２）
前記抽出手段は、前記学習モデルの学習が進むにつれて抽出する正解なしデータの距離の最大値が大きくなるように前記正解なしデータの抽出を行う、付記１に記載の情報処理装置。

【0088】

（付記３）
前記抽出手段が抽出した正解なしデータを前記学習モデルに入力して得られる推論結果に基づき、当該正解なしデータに擬似ラベルを付与する擬似ラベル付与手段を更に備え、前記更新手段は、前記擬似ラベルが付与された正解なしデータと、前記正解ありデータとを用いて前記学習モデルのモデルパラメータを更新する、付記１又は２に記載の情報処理装置。

【0089】

（付記４）
前記属性情報は、前記画像に含まれる物体の姿勢及び位置、撮影時刻、撮影時間帯、撮影装置の種類及び位置、並びに画質、の少なくともいずれかを示す情報を含み、前記距離は、前記画像に含まれる物体の姿勢差及び位置の差、撮影時刻差、撮影時間帯の近さ、撮影装置の種類の類似の度合い、撮影装置の位置の差、並びに画質差、の少なくともいずれかに基づき算出される値である、付記１から３のいずれか１つに記載の情報処理装置。

【0090】

（付記５）
前記抽出手段が抽出した正解なしデータを前記学習モデルに入力して得られる推論結果が所定の条件を満たす正解なしデータに擬似ラベルを付与する擬似ラベル付与手段を更に備え、前記抽出手段は、抽出した正解なしデータに対する前記擬似ラベルの付与率が所定の収束判定条件を満たす度に、抽出する正解なしデータの数を増加させる、付記２に記載の情報処理装置。

【0091】

（付記６）
前記抽出手段が抽出した正解なしデータを前記学習モデルに入力して得られる推論結果が所定の条件を満たす正解なしデータに擬似ラベルを付与する擬似ラベル付与手段を更に備え、前記抽出手段は、抽出した正解なしデータに対する前記擬似ラベルの付与率が所定の閾値を超える度に、抽出する正解なしデータの数を増加させる、付記２に記載の情報処理装置。

【0092】

（付記７）
前記抽出手段は、前記学習モデルの学習の学習時間が所定の閾値に達する毎に、抽出する正解なしデータの数を増加させる、付記２に記載の情報処理装置。

【0093】

（付記８）
前記抽出手段が抽出した正解なしデータを前記学習モデルに入力して得られる推論結果に基づき当該正解なしデータに擬似ラベルを付与する擬似ラベル付与手段と、前記正解ありデータと前記学習モデルとを用いた推論結果と、当該正解ありデータの正解ラベルと、を用いて損失を算出する第１損失算出手段と、前記正解なしデータと前記学習モデルとを用いた推論結果と、当該正解なしデータの擬似ラベルと、を用いて損失を算出する第２損失算出手段と、を更に備え、前記抽出手段は、前記第１損失算出手段が算出した損失と前記第２損失算出手段が算出した損失との和又は重み付き和が所定の収束判定条件を満たす度に、抽出する正解なしデータの数を増加させる、付記２に記載の情報処理装置。

【0094】

（付記９）
少なくとも１つのプロセッサが、画像データに画像の属性を示す属性情報及び正解ラベルが付された正解ありデータと、画像データに画像の属性を示す属性情報が付された正解なしデータとを取得することと、前記正解ありデータの属性情報と前記正解なしデータの属性情報とにより定まる、当該正解ありデータと当該正解なしデータとの距離を算出することと、複数の前記正解なしデータの中から、前記正解ありデータとの距離が他の正解なしデータよりも小さい正解なしデータを抽出することと、前記正解ありデータと前記抽出された正解なしデータとを用いて学習モデルのモデルパラメータを更新することと、を含む、情報処理方法。

【0095】

（付記１０）
コンピュータに、画像データに画像の属性を示す属性情報及び正解ラベルが付された正解ありデータと、画像データに画像の属性を示す属性情報が付された正解なしデータとを取得する処理と、前記正解ありデータの属性情報と前記正解なしデータの属性情報とにより定まる、当該正解ありデータと当該正解なしデータとの距離を算出する処理と、複数の前記正解なしデータの中から、前記正解ありデータとの距離が他の正解なしデータよりも小さい正解なしデータを抽出する処理と、前記正解ありデータと前記抽出された正解なしデータとを用いて学習モデルのモデルパラメータを更新する処理と、を実行させるためのプログラム。

【0096】

（付記１１）
前記正解ありデータと前記学習モデルとを用いた推論結果と、当該正解ありデータの正解ラベルと、を用いて損失を算出する損失算出手段、を更に備え、前記抽出手段は、前記損失算出手段が算出した損失が所定の収束判定条件を満たす度に抽出する正解なしデータの数を増加させる、付記２に記載の情報処理装置。

【0097】

（付記１２）
前記抽出手段が抽出した正解なしデータを前記学習モデルに入力して得られる推論結果に基づき当該正解なしデータに擬似ラベルを付与する擬似ラベル付与手段と、前記正解なしデータと前記学習モデルとを用いた推論結果と、当該正解なしデータの擬似ラベルと、を用いて損失を算出する損失算出手段と、を更に備え、前記抽出手段は、前記損失算出手段が算出した損失が所定の収束判定条件を満たす度に、抽出する正解なしデータの数を増加させる、付記２に記載の情報処理装置。

【0098】

（付記１３）
前記抽出手段は、複数の前記正解なしデータを前記距離に基づき複数のグループに分類し、前記学習モデルの学習が進むにつれて抽出するグループを増加させる、付記２、５から８、１１、及び１２のいずれか１つに記載の情報処理装置。

【0099】

（付記１４）
少なくとも１つのプロセッサを備え、前記プロセッサは、画像データに画像の属性を示す属性情報及び正解ラベルが付された正解ありデータと、画像データに画像の属性を示す属性情報が付された正解なしデータとを取得する取得処理と、前記正解ありデータの属性情報と前記正解なしデータの属性情報とにより定まる、当該正解ありデータと当該正解なしデータとの距離を算出する属性間距離算出処理と、複数の前記正解なしデータの中から、前記正解ありデータとの距離が他の正解なしデータよりも小さい正解なしデータを抽出する抽出処理と、前記正解ありデータと前記抽出処理において抽出された正解なしデータとを用いて学習モデルのモデルパラメータを更新する更新処理とを実行する情報処理装置。

【0100】

なお、この情報処理装置は、更にメモリを備えていてもよく、このメモリには、前記取得処理と、前記属性間距離算出処理と、前記抽出処理と、前記更新処理とを前記プロセッサに実行させるためのプログラムが記憶されていてもよい。また、このプログラムは、コンピュータ読み取り可能な一時的でない有形の記録媒体に記録されていてもよい。

【符号の説明】

【0101】

１、１Ａ情報処理装置
１１取得部
１２、１２１属性間距離算出部
１３抽出部
１４更新部
１２Ａ学習データ制御部
１２２学習データ決定部
１３Ａパラメータ更新部
１４Ａ推論部
１５Ａ第１損失計算部
１６Ａ第２損失計算部

【図1】