IP Force 特許公報掲載プロジェクト 2022.1.31 β版

ホーム > 特許ランキング > 株式会社日立国際電気

知財求人 - 知財ポータルサイト「IP Force」

青山学院大学 (神奈川県相模原市中央区淵野辺)

▶ 株式会社日立国際電気の特許一覧

特開2024-108533データ拡張装置、データ拡張方法およびデータ拡張プログラム

書誌要約請求の範囲詳細な説明課題実施例実施するための形態図面の説明

目に優しい文字サイズ小中大 PDF Top

< >

1
2
3
4
5
6
7
8
9
10

(19)【発行国】日本国特許庁(JP)

(12)【公報種別】公開特許公報(A)

(11)【公開番号】P2024108533

(43)【公開日】2024-08-13

(54)【発明の名称】データ拡張装置、データ拡張方法およびデータ拡張プログラム

(51)【国際特許分類】

G06F 18/214 20230101AFI20240805BHJP

G06N 20/00 20190101ALI20240805BHJP

【ＦＩ】

G06F18/214

G06N20/00 130

【審査請求】有

【請求項の数】11

【出願形態】ＯＬ

(21)【出願番号】P 2023012953

(22)【出願日】2023-01-31

(71)【出願人】

【識別番号】000001122

【氏名又は名称】株式会社日立国際電気

(74)【代理人】

【識別番号】110001678

【氏名又は名称】藤央弁理士法人

(72)【発明者】

【氏名】山根慶大

(72)【発明者】

【氏名】長谷川圭吾

(72)【発明者】

【氏名】小野豪一

(72)【発明者】

【氏名】北山晃

(57)【要約】

【課題】変換前後のデータ間の乖離を抑制すること。
【解決手段】データ拡張装置は、ドメイン逆変換器により第２学習用サンプルを第１学習用サンプルに疑似する疑似第１学習用サンプルに変換し、ドメイン順変換器により疑似第１学習用サンプルを第２学習用サンプルに疑似する疑似第２学習用サンプルに変換する第１変換処理と、第１変換処理によって出力された疑似第１学習用サンプルをリファレンスモデルに入力した結果得られる出力値である疑似第１出力値と、第２正解値と、に基づく損失値である疑似第１損失値を算出する第１算出処理と、第２学習用サンプルと疑似第２学習用サンプルとに基づく第２損失値を算出する第２算出処理と、第１算出処理によって算出された疑似第１損失値と第２算出処理によって算出された第２損失値とを統合した統合損失値が小さくなるように、ドメイン逆変換器およびドメイン順変換器を学習する第１学習処理と、を実行する。
【選択図】図２

【特許請求の範囲】

【請求項1】

プログラムを実行するプロセッサと、前記プログラムを記憶する記憶デバイスと、を有するデータ拡張装置であって、
前記記憶デバイスは、第１学習用サンプルと前記第１学習用サンプルの正解を示す第１正解値との組み合わせの集合である第１ドメインでの第１学習用データセットと、第２学習用サンプルと前記第２学習用サンプルの正解を示す第２正解値との組み合わせの集合である第２ドメインでの第２学習用データセットと、リファレンスモデルと、ドメイン順変換器と、ドメイン逆変換器と、を記憶し、
前記リファレンスモデルは、前記第１学習用サンプルを前記リファレンスモデルに入力した結果出力される第１出力値と前記第１正解値とに基づく第１損失値が小さくなるように学習された学習モデルであり、
前記ドメイン順変換器は、前記第１ドメインに関するデータを前記第２ドメインに関するデータに疑似するデータに変換する学習モデルであり、
前記ドメイン逆変換器は、前記第２ドメインに関するデータを前記第１ドメインに関するデータに疑似するデータに変換する学習モデルであり、
前記プロセッサは、
前記ドメイン逆変換器により前記第２学習用サンプルを前記第１学習用サンプルに疑似する疑似第１学習用サンプルに変換し、前記ドメイン順変換器により前記疑似第１学習用サンプルを前記第２学習用サンプルに疑似する疑似第２学習用サンプルに変換する第１変換処理と、
前記第１変換処理によって出力された前記疑似第１学習用サンプルを前記リファレンスモデルに入力した結果得られる出力値である疑似第１出力値と、前記第２正解値と、に基づく損失値である疑似第１損失値を算出する第１算出処理と、
前記第２学習用サンプルと前記疑似第２学習用サンプルとに基づく第２損失値を算出する第２算出処理と、
前記第１算出処理によって算出された疑似第１損失値と前記第２算出処理によって算出された第２損失値とを統合した統合損失値が小さくなるように、前記ドメイン逆変換器および前記ドメイン順変換器を学習する第１学習処理と、
を実行することを特徴とするデータ拡張装置。

【請求項2】

請求項１に記載のデータ拡張装置であって、
前記プロセッサは、
前記ドメイン逆変換器に前記第２学習用サンプルを入力した結果出力される前記疑似第１学習用サンプルを第３学習用サンプルとし、前記第２正解値を第３正解値として、関連付けることにより、第３学習用データセットを作成する作成処理、
を実行することを特徴とするデータ拡張装置。

【請求項3】

請求項２に記載のデータ拡張装置であって、
前記作成処理では、前記プロセッサは、前記第１学習用データセットを前記第３学習用データセットに追加する、
ことを特徴とするデータ拡張装置。

【請求項4】

請求項２に記載のデータ拡張装置であって、
前記記憶デバイスは、前記第３学習用データセットを用いて学習されるターゲットモデルを記憶し、
前記プロセッサは、
前記第３学習用サンプルを前記ターゲットモデルに入力した結果出力される第２出力値と前記第３正解値とに基づく第３損失値が小さくなるように、前記ターゲットモデルを学習する第２学習処理、
を実行することを特徴とするデータ拡張装置。

【請求項5】

請求項１に記載のデータ拡張装置であって、
前記プロセッサは、
前記ドメイン順変換器に前記第１学習用サンプルを入力した結果出力される前記疑似第２学習用サンプルを第３学習用サンプルとし、前記第１正解値を第３正解値として、関連付けることにより、第３学習用データセットを作成する作成処理、
を実行することを特徴とするデータ拡張装置。

【請求項6】

請求項５に記載のデータ拡張装置であって、
前記作成処理では、前記プロセッサは、前記第２学習用データセットを前記第３学習用データセットに追加する、
ことを特徴とするデータ拡張装置。

【請求項7】

請求項５に記載のデータ拡張装置であって、
前記記憶デバイスは、前記第３学習用データセットを用いて学習されるターゲットモデルを記憶し、
前記プロセッサは、
前記第３学習用サンプルを前記ターゲットモデルに入力した結果出力される第２出力値と前記第３正解値とに基づく第３損失値が小さくなるように、前記ターゲットモデルを学習する第２学習処理、
を実行することを特徴とするデータ拡張装置。

【請求項8】

請求項１に記載のデータ拡張装置であって、
前記プロセッサは、
前記第１学習用サンプルと、前記ドメイン逆変換器で前記疑似第２学習用サンプルから変換された疑似第１学習用サンプルと、に基づく第４損失値を算出する第３算出処理と、
前記第３算出処理によって算出された第４損失値が小さくなるように、前記ドメイン逆変換器および前記ドメイン順変換器を学習する第３学習処理と、
を実行することを特徴とするデータ拡張装置。

【請求項9】

請求項１に記載のデータ拡張装置であって、
前記プロセッサは、
前記第１学習用サンプルと、前記ドメイン逆変換器で前記疑似第２学習用サンプルから変換された疑似第１学習用サンプルと、に基づく第４損失値を算出する第３算出処理を実行し、
前記第１学習処理では、前記プロセッサは、前記第２損失値と前記疑似第１損失値と前記第３算出処理によって算出された第４損失値とを統合した統合損失値が小さくなるように、前記ドメイン逆変換器および前記ドメイン順変換器を学習する、
ことを特徴とするデータ拡張装置。

【請求項10】

プログラムを実行するプロセッサと、前記プログラムを記憶する記憶デバイスと、を有するデータ拡張装置が実行するデータ拡張方法であって、
前記記憶デバイスは、第１学習用サンプルと前記第１学習用サンプルの正解を示す第１正解値との組み合わせの集合である第１ドメインでの第１学習用データセットと、第２学習用サンプルと前記第２学習用サンプルの正解を示す第２正解値との組み合わせの集合である第２ドメインでの第２学習用データセットと、リファレンスモデルと、ドメイン順変換器と、ドメイン逆変換器と、を記憶し、
前記リファレンスモデルは、前記第１学習用サンプルを前記リファレンスモデルに入力した結果出力される第１出力値と前記第１正解値とに基づく第１損失値が小さくなるように学習された学習モデルであり、
前記ドメイン順変換器は、前記第１ドメインに関するデータを前記第２ドメインに関するデータに疑似するデータに変換する学習モデルであり、
前記ドメイン逆変換器は、前記第２ドメインに関するデータを前記第１ドメインに関するデータに疑似するデータに変換する学習モデルであり、
前記プロセッサは、
前記ドメイン逆変換器により前記第２学習用サンプルを前記第１学習用サンプルに疑似する疑似第１学習用サンプルに変換し、前記ドメイン順変換器により前記疑似第１学習用サンプルを前記第２学習用サンプルに疑似する疑似第２学習用サンプルに変換する第１変換処理と、
前記第１変換処理によって出力された前記疑似第１学習用サンプルを前記リファレンスモデルに入力した結果得られる出力値である疑似第１出力値と、前記第２正解値と、に基づく損失値である疑似第１損失値を算出する第１算出処理と、
前記第２学習用サンプルと前記疑似第２学習用サンプルとに基づく第２損失値を算出する第２算出処理と、
前記第１算出処理によって算出された疑似第１損失値と前記第２算出処理によって算出された第２損失値とを統合した統合損失値が小さくなるように、前記ドメイン逆変換器および前記ドメイン順変換器を学習する第１学習処理と、
を実行することを特徴とするデータ拡張方法。

【請求項11】

プロセッサにデータ拡張を実行させるデータ拡張プログラムであって、
前記プロセッサは、記憶デバイスにアクセス可能であり、
前記記憶デバイスは、第１学習用サンプルと前記第１学習用サンプルの正解を示す第１正解値との組み合わせの集合である第１ドメインでの第１学習用データセットと、第２学習用サンプルと前記第２学習用サンプルの正解を示す第２正解値との組み合わせの集合である第２ドメインでの第２学習用データセットと、リファレンスモデルと、ドメイン順変換器と、ドメイン逆変換器と、を記憶し、
前記リファレンスモデルは、前記第１学習用サンプルを前記リファレンスモデルに入力した結果出力される第１出力値と前記第１正解値とに基づく第１損失値が小さくなるように学習された学習モデルであり、
前記ドメイン順変換器は、前記第１ドメインに関するデータを前記第２ドメインに関するデータに疑似するデータに変換する学習モデルであり、
前記ドメイン逆変換器は、前記第２ドメインに関するデータを前記第１ドメインに関するデータに疑似するデータに変換する学習モデルであり、
前記プロセッサに、
前記ドメイン逆変換器により前記第２学習用サンプルを前記第１学習用サンプルに疑似する疑似第１学習用サンプルに変換し、前記ドメイン順変換器により前記疑似第１学習用サンプルを前記第２学習用サンプルに疑似する疑似第２学習用サンプルに変換する第１変換処理と、
前記第１変換処理によって出力された前記疑似第１学習用サンプルを前記リファレンスモデルに入力した結果得られる出力値である疑似第１出力値と、前記第２正解値と、に基づく損失値である疑似第１損失値を算出する第１算出処理と、
前記第２学習用サンプルと前記疑似第２学習用サンプルとに基づく第２損失値を算出する第２算出処理と、
前記第１算出処理によって算出された疑似第１損失値と前記第２算出処理によって算出された第２損失値とを統合した統合損失値が小さくなるように、前記ドメイン逆変換器および前記ドメイン順変換器を学習する第１学習処理と、
を実行させることを特徴とするデータ拡張プログラム。

【発明の詳細な説明】

【技術分野】

【0001】

本発明は、機械学習で使用される学習データを拡張するデータ拡張装置、データ拡張方法およびデータ拡張プログラムに関する。

【背景技術】

【0002】

機械学習はニューラルネットワークなどの公知の学習手段により、入力されたデータに基づく予測を実現する技術である。たとえば、カメラ等の撮像装置によって収集された画像を入力として、画像に写る物体が何であるかを出力する装置が存在する。

【0003】

上記の機械学習技術においては，様々なパターンのデータを学習することで予測精度を向上できるため、学習用データのパターンを増やすことやデータの収集に係るコストを削減する必要がある（たとえば、下記特許文献１を参照。）。

【0004】

特許文献１は、敵対的生成ネットワーク（ＧＡＮ）を用いて学習データに類似した合成データを作成するデータ拡張技術を開示する。具体的には、特許文献１の顔画像の生成方法は、ユーザが対話シーンにおいて入力した顔を含む第１の画像を受信するステップと、第１の画像をユーザに提示するステップと、バックグラウンドで、入力された画像に基づいて生成された顔属性情報を制約とする事前トレーニングされた敵対的生成ネットワークに第１の画像を入力し、敵対的生成ネットワークから出力された第２の画像を得るステップと、バックグラウンドで敵対的生成ネットワークから出力された第２の画像が得られたことに応答して、第２の画像をユーザに提示するステップと、を含む。

【先行技術文献】

【特許文献】

【0005】

【特許文献1】特開２０２１－１１４２７９号公報

【発明の概要】

【発明が解決しようとする課題】

【0006】

しかしながら，敵対的生成ネットワーク（ＧＡＮ）を用いたデータ拡張技術は、実際に収集された現実世界のデータとの乖離が大きく機械学習モデルの精度向上に寄与しない合成データを生成する場合がある。

【0007】

本発明は、変換前後のデータ間の乖離を抑制することを目的とする。

【課題を解決するための手段】

【0008】

本願において開示される発明の一側面となるデータ拡張装置は、プログラムを実行するプロセッサと、前記プログラムを記憶する記憶デバイスと、を有するデータ拡張装置であって、前記記憶デバイスは、第１学習用サンプルと前記第１学習用サンプルの正解を示す第１正解値との組み合わせの集合である第１ドメインでの第１学習用データセットと、第２学習用サンプルと前記第２学習用サンプルの正解を示す第２正解値との組み合わせの集合である第２ドメインでの第２学習用データセットと、リファレンスモデルと、ドメイン順変換器と、ドメイン逆変換器と、を記憶し、前記リファレンスモデルは、前記第１学習用サンプルを前記リファレンスモデルに入力した結果出力される第１出力値と前記第１正解値とに基づく第１損失値が小さくなるように学習された学習モデルであり、前記ドメイン順変換器は、前記第１ドメインに関するデータを前記第２ドメインに関するデータに疑似するデータに変換する学習モデルであり、前記ドメイン逆変換器は、前記第２ドメインに関するデータを前記第１ドメインに関するデータに疑似するデータに変換する学習モデルであり、前記プロセッサは、前記ドメイン逆変換器により前記第２学習用サンプルを前記第１学習用サンプルに疑似する疑似第１学習用サンプルに変換し、前記ドメイン順変換器により前記疑似第１学習用サンプルを前記第２学習用サンプルに疑似する疑似第２学習用サンプルに変換する第１変換処理と、前記第１変換処理によって出力された前記疑似第１学習用サンプルを前記リファレンスモデルに入力した結果得られる出力値である疑似第１出力値と、前記第２正解値と、に基づく損失値である疑似第１損失値を算出する第１算出処理と、前記第２学習用サンプルと前記疑似第２学習用サンプルとに基づく第２損失値を算出する第２算出処理と、前記第１算出処理によって算出された疑似第１損失値と前記第２算出処理によって算出された第２損失値とを統合した統合損失値が小さくなるように、前記ドメイン逆変換器および前記ドメイン順変換器を学習する第１学習処理と、を実行することを特徴とする。

【発明の効果】

【0009】

本発明の代表的な実施の形態によれば、変換前後のデータ間の乖離を抑制することができる。
前述した以外の課題、構成及び効果は、以下の実施例の説明により明らかにされる。

【図面の簡単な説明】

【0010】

【図1】図１は、データ拡張装置の機能的構成例１を示すブロック図である。

【図2】図２は、データ拡張装置の機能的構成例２を示すブロック図である。

【図3】図３は、ドメイン逆変換器およびドメイン順変換器による学習処理手順例を示すフローチャートである。

【図4】図４は、データ拡張装置の機能的構成例３を示すブロック図である。

【図5】図５は、データ拡張装置の機能的構成例４を示すブロック図である。

【図6】図６は、実施例１にかかるデータ拡張装置の運用例を示すフローチャートである。

【図7】図７は、データ拡張装置のハードウェア構成例を示すブロック図である。

【図8】図８は、データ拡張装置の機能的構成例５を示すブロック図である。

【図9】図９は、実施例２にかかるデータ拡張装置の運用例を示すフローチャートである。

【図10】図１０は、データ拡張装置の機能的構成例６を示すブロック図である。

【発明を実施するための形態】

【実施例0011】

＜データ拡張装置１００の機能的構成例１＞
図１は、データ拡張装置の機能的構成例１を示すブロック図である。データ拡張装置１００は、第１学習用データセット１０１を保持する。第１学習用データセット１０１は、第１ドメインで取得された複数の第１学習用サンプル１０２と、第１学習用サンプル１０２に対する第１正解値１０５と、を含む。ここで、第１ドメインとは、たとえば、第１学習用サンプル１０２を取得できる特定の場所や周辺環境、サンプル取得装置の設定値に依る第１学習用サンプル１０２のデータ分布を示す。

【0012】

サンプル取得装置がＡＩ（ＡｒｔｉｆｉｃｉａｌＩｎｔｅｌｌｉｇｅｎｃｅ）監視カメラである場合、特定の場所とは、たとえば、ＡＩ監視カメラの設置場所である。ＡＩ監視カメラは、撮影した画像データを解析して、被写体、被写体の行動、被写体で起きている事象を予測する。

【0013】

周辺環境とは、たとえば、ＡＩ監視カメラの設置場所周辺に存在する建物や道路、設置物である。サンプル取得装置の設定値とは、たとえば、ＡＩ監視カメラの撮影角度、画角、フレームレートなどの撮影条件である。第１学習用サンプル１０２は、たとえば、ＡＩ監視カメラで撮像された画像データである。第１学習用サンプル１０２に対する第１正解値１０５は、たとえば、第１学習用サンプル１０２が画像データであれば、当該画像データに映っている物体の名称を特定する識別情報である。

【0014】

リファレンスモデル１０３は、第１学習用サンプル１０２と第１正解値１０５とによって学習される機械学習モデルである。たとえば、リファレンスモデル１０３は、入力された画像データに写る物体の数を予測するモデルである。リファレンスモデル１０３の学習プロセスでは、データ拡張装置１００は、第１学習用サンプル１０２をリファレンスモデル１０３に入力し、第１出力値１０４を得る。

【0015】

第１出力値１０４は、リファレンスモデル１０３から出力される予測値であり、たとえば、第１学習用サンプル１０２に写る物体の数の予測値である。データ拡張装置１００は、第１損失関数１０６に基づいてリファレンスモデル１０３を更新する。第１損失関数１０６は、第１出力値１０４と第１学習用サンプル１０２に付随する第１正解値１０５との間のずれを示す損失を、第１損失値として算出する。データ拡張装置１００は、第１損失関数１０６の第１損失値が小さくなるようにリファレンスモデル１０３を更新する。第１損失関数１０６としては、たとえば、二乗誤差（平均二乗誤差や平均二乗誤差の平方根）や交差エントロピー誤差が用いられる。

【0016】

＜データ拡張装置１００の機能的構成例２＞
図２は、データ拡張装置１００の機能的構成例２を示すブロック図である。データ拡張装置１００は、第２学習用データセット２０１を用いて、第１学習用データセット１０１を拡張する。第２学習用データセット２０１は、第２ドメインで取得された複数の第２学習用サンプル２０２と、第２学習用サンプル２０２に対する第２正解値２０５と、を含む。ここで、第２ドメインとは、第１ドメインとは異なるドメインであり、たとえば、第２学習用サンプル２０２を取得できる特定の場所や周辺環境、サンプル取得装置の設定値を示す。

【0017】

たとえば、上記の例において、第１学習用サンプル１０２がＡＩ監視カメラで撮像された画像データであれば、第２学習用サンプル２０２も、第１学習用サンプル１０２が撮像されたＡＩ監視カメラと異なる場所で撮像された画像データである。第２学習用サンプル２０２に対する第２正解値２０５は、たとえば、第２学習用サンプル２０２が画像データであれば、当該画像データに映っている物体の数である。

【0018】

実施例１では、データ拡張装置１００は、第２学習用データセット２０１を、高精度に第１ドメインのデータセットに変換する。これにより、第２学習用データセット２０１から第１ドメインの特徴を含むデータを新たに生成するというデータ拡張が可能になる。したがって、第１ドメインの現場での第１学習用サンプル１０２の収集コストおよび第１正解値１０５の特定作業の労力が軽減される。

【0019】

ドメイン逆変換器２０３は、第２ドメインに関するデータを第１ドメインに関するデータに疑似するデータに変換する学習モデルである。具体的には、たとえば、ドメイン逆変換器２０３は、第２学習用サンプル２０２に含まれる第２ドメイン固有の特徴を、第１ドメインの特徴に変換し、変換結果として、第１学習用サンプル１０２の疑似データである疑似第１学習用サンプル２０４を出力する。

【0020】

疑似第１学習用サンプル２０４は、第２学習用サンプル２０２に基づいて、第１学習用データセット１０１に含まれる第１学習用サンプル１０２を疑似するデータである。たとえば、第１学習用サンプル１０２を青く茂った夏の風景、第２学習用サンプル２０２を雪の積もった冬の風景とした場合には、第２学習用サンプル２０２に映る物体形状を維持したまま雪が取り除かれ、葉が新たに生成された画像が疑似第１学習用サンプル２０４として生成される。このように、疑似第１学習用サンプル２０４は、第１学習用サンプル１０２をコピーしたデータではないが、第１学習用サンプル１０２と幾何学的な構図が似ているデータである。

【0021】

ドメイン順変換器２０６は、第１ドメインに関するデータを第２ドメインに関するデータに疑似するデータに変換する学習モデルである。具体的には、たとえば、ドメイン順変換器２０６は、疑似第１学習用サンプル２０４に含まれる第１ドメイン固有の特徴を、第２ドメインの特徴に変換し、変換結果として、第２学習用サンプル２０２の疑似データである疑似第２学習用サンプル２０７を出力する。

【0022】

疑似第２学習用サンプル２０７は、疑似第１学習用サンプル２０４に基づいて、第２学習用データセット２０１に含まれる第２学習用サンプル２０２を疑似するデータである。たとえば、第２学習用サンプル２０２を青く茂った夏の風景、疑似第１学習用サンプル２０４を雪の積もった冬の風景とした場合には、疑似第１学習用サンプル２０４に映る物体形状を維持したまま雪が取り除かれ、葉が新たに生成された画像が疑似第２学習用サンプル２０７として生成される。このように、疑似第２学習用サンプル２０７は、第２学習用サンプル２０２をコピーしたデータではないが、第２学習用サンプル２０２と幾何学的な構図が似ているデータである。

【0023】

データ拡張装置１００は、ドメイン逆変換器２０３による学習処理とドメイン順変換器２０６による学習処理とを並列実行する。データ拡張装置１００は、ドメイン逆変換器２０３による学習処理およびドメイン順変換器２０６による学習処理において、２種類の損失関数を用いる。１つは、第１損失関数１０６であり、もう１つは、第２損失関数２１０である。

【0024】

第１損失関数１０６は、図２においては、疑似第１出力値２０８と、疑似第１学習用サンプル２０４に付随する正解値との間のずれを示す損失を、疑似第１損失値として算出する損失関数である。疑似第１出力値２０８とは、疑似第１学習用サンプル２０４をリファレンスモデル１０３に入力した結果リファレンスモデル１０３から出力される出力値である。また、疑似第１学習用サンプル２０４に付随する正解値は、ドメイン逆変換器２０３に入力した第２学習用サンプル２０２に付随する第２正解値２０５としてもよい。

【0025】

たとえば、画像に写る物体を囲む矩形領域が正解値として与えられている場合、第２学習用サンプル２０２と疑似第１学習用サンプル２０４に写る物体位置やサイズ等が変化しない場合、同一の正解値を使用することができる。図２では、一例として、疑似第１学習用サンプル２０４に付随する正解値を、第２正解値２０５とする。

【0026】

第２損失関数２１０は、第２学習用サンプル２０２と疑似第２学習用サンプル２０７との間のずれを示す損失を、第２損失値として算出する損失関数である。疑似第２学習用サンプル２０７は、第２学習用サンプル２０２をドメイン逆変換器２０３に入力した結果出力される疑似第１学習用サンプル２０４を、さらにドメイン順変換器２０６に入力することにより、ドメイン順変換器２０６から出力される。第２損失関数２１０は、元に復元するための関数である。

【0027】

データ拡張装置１００は、ドメイン逆変換器２０３およびドメイン順変換器２０６の各々について、第１損失関数１０６と第２損失関数２１０に基づいて学習する。たとえば、データ拡張装置１００は、第１損失関数１０６からの疑似第１損失値と第２損失関数２１０からの第２損失値とを加算し、統合損失値とする。データ拡張装置１００は、当該統合損失値が減少するようにドメイン逆変換器２０３およびドメイン順変換器２０６の各々を更新する。

【0028】

このように、第１損失関数１０６に基づいてドメイン逆変換器２０３を更新することで、ドメイン逆変換器２０３は、リファレンスモデル１０３が予測しやすい疑似第２学習用サンプル２０７への変換を学習できる。リファレンスモデル１０３は、予め第１学習用データセット１０１で学習されているため、第１ドメインの特徴を含むサンプルに対して高精度な予測が期待される。

【0029】

したがって、ドメイン逆変換器２０３は、第２学習用サンプル２０２に含まれる第２ドメインの特徴を第１ドメインの特徴に変換することができる。また、第２損失関数２１０に基づいてドメイン逆変換器２０３およびドメイン順変換器２０６を更新することで、ドメイン逆変換器２０３およびドメイン順変換器２０６の各々への入力サンプルに含まれる特定の特徴を出力に反映するように学習できる。

【0030】

＜ドメイン逆変換器２０３およびドメイン順変換器２０６による学習処理＞
図３は、ドメイン逆変換器２０３およびドメイン順変換器２０６による学習処理手順例を示すフローチャートである。

【0031】

ステップＳ３０１：データ拡張装置１００は、第１学習用データセット１０１を用いてリファレンスモデル１０３を学習する（図１を参照）。

【0032】

ステップＳ３０２：データ拡張装置１００は、第２学習用データセット２０１から第２学習用サンプル２０２を読み出す（図２を参照）。

【0033】

ステップＳ３０３：データ拡張装置１００は、第２学習用サンプル２０２をドメイン逆変換器２０３に入力して逆変換を実行し、疑似第１学習用サンプル２０４を出力する（図２を参照）。

【0034】

ステップＳ３０４：データ拡張装置１００は、ステップＳ３０３で得られた疑似第１学習用サンプル２０４をリファレンスモデル１０３に入力し、疑似第１学習用サンプル２０４に対する予測値を疑似第１出力値２０８として出力する（図２を参照）。

【0035】

ステップＳ３０５：データ拡張装置１００は、疑似第１学習用サンプル２０４をドメイン順変換器２０６に入力して順変換を実行し、疑似第２学習用サンプル２０７を出力する（図２を参照）。

【0036】

ステップＳ３０６：データ拡張装置１００は、ステップＳ３０４で取得した疑似第１出力値２０８と第２正解値２０５とを第１損失関数１０６に入力して、疑似第１損失値を算出する（図２を参照）。

【0037】

ステップＳ３０７：データ拡張装置１００は、ステップＳ３０２で読みだした第２学習用サンプル２０２と、ステップＳ３０５で取得した疑似第２学習用サンプル２０７と、を第２損失関数２１０に入力して、第２損失値を算出する（図２を参照）。

【0038】

ステップＳ３０８：データ拡張装置１００は、ステップＳ３０６で取得した損失値とステップＳ３０７で取得した損失値に基づいてドメイン逆変換器２０３およびドメイン順変換器２０６を更新する（図２を参照）。

【0039】

ステップＳ３０９：データ拡張装置１００は、ステップＳ３０２～ステップＳ３０８を所定回数繰り返したか否かを判定する。所定回数繰り返していなければ（ステップＳ３０９：Ｎｏ）、ステップＳ３０２に戻る。所定回数繰り返していれば（ステップＳ３０９：Ｙｅｓ）、データ拡張装置１００は、ドメイン逆変換器２０３およびドメイン順変換器２０６による学習処理を終了する。

【0040】

＜データ拡張装置１００の機能的構成例３＞
図４は、データ拡張装置１００の機能的構成例３を示すブロック図である。データ拡張装置１００は、ドメイン逆変換器２０３を用いて、データ拡張を実行する。具体的には、たとえば、データ拡張装置１００は、第２学習用サンプル２０２をドメイン逆変換器２０３に入力する都度、疑似第１学習用サンプル２０４を出力する。それぞれ出力された疑似第１学習用サンプル２０４と第２学習用サンプル２０２に対応する第２正解値２０５との組み合わせの集合が、第３学習用データセット４０１となる。第３学習用データセット４０１は、第１学習用データセット１０１を含んでもよい。疑似第１学習用サンプル２０４は、第１ドメインの特徴を含むため、第１学習用データセット１０１のデータ拡張が達成される。なお、データ拡張装置１００は、第３学習用データセット４０１に、第１学習用データセット１０１を追加してもよい。

【0041】

＜データ拡張装置１００の機能的構成例４＞
図５は、データ拡張装置１００の機能的構成例４を示すブロック図である。データ拡張装置１００は、第３学習用データセット４０１から第３学習用サンプル５０１を抽出して、ターゲットモデル５０２に出力する。第３学習用サンプル５０１は、第３学習用データセット４０１に記憶されているサンプルであり、たとえば、疑似第１学習用サンプル２０４や第１学習用サンプル１０２を含む。

【0042】

ターゲットモデル５０２は、任意の構造を持つ機械学習モデルであり、リファレンスモデル１０３と同構造であってもよい。第３学習用サンプル５０１に含まれるドメイン固有の特徴は、リファレンスモデル１０３に基づいて、第１ドメインの特徴に変換されているため、リファレンスモデル１０３とターゲットモデル５０２を同構造とすることで、ターゲットモデル５０２の精度向上が期待できる。

【0043】

ターゲットモデル５０２は、第３学習用サンプル５０１が入力されると、第２出力値５０３を出力する。データ拡張装置１００は、第３損失関数５０５に基づいてターゲットモデル５０２を更新する。第３損失関数５０５は、第２出力値５０３と、第３学習用サンプル５０１に付随する第３正解値５０４と、の間のずれを示す損失を、第３損失値として算出する。

【0044】

第３正解値５０４は、第３学習用サンプル５０１が疑似第１学習用サンプル２０４であれば第２正解値２０５であり、第３学習用サンプル５０１が第１学習用サンプル１０２であれば、第１正解値１０５である。ターゲットモデル５０２は、第３損失関数５０５の第３損失値が小さくなるようにターゲットモデル５０２を更新する。

【0045】

実施例１では、このように学習されたターゲットモデル５０２は、第１ドメインのサンプル取得装置に実装される。

【0046】

＜データ拡張装置１００の運用例＞
図６は、実施例１にかかるデータ拡張装置１００の運用例を示すフローチャートである。

【0047】

ステップＳ３０１：データ拡張装置１００は、第１学習用データセット１０１を用いてリファレンスモデル１０３を学習する（図１を参照）。

【0048】

ステップＳ６０２：データ拡張装置１００は、リファレンスモデル１０３と第２学習用データセット２０１とを用いてドメイン順変換器２０６およびドメイン逆変換器２０３を学習する。具体的には、たとえば、データ拡張装置１００は、図３のステップＳ３０２～Ｓ３０９を実行する。

【0049】

ステップＳ６０３：データ拡張装置１００は、ステップＳ６０２で学習されたドメイン逆変換器２０３で第２学習用サンプル２０２の変換を実行し、疑似第１学習用サンプル２０４を出力する（図４を参照）。

【0050】

ステップＳ６０４：データ拡張装置１００は、疑似第１学習用サンプル２０４を含む第３学習用データセット４０１を作成する。

【0051】

ステップＳ６０５：データ拡張装置１００は、第３学習用データセット４０１を用いてターゲットモデル５０２を学習する（図５を参照）。

【0052】

＜データ拡張装置１００のハードウェア構成例＞
図７は、データ拡張装置１００のハードウェア構成例を示すブロック図である。データ拡張装置１００は、プロセッサ７０１と、記憶デバイス７０２と、入力デバイス７０３と、出力デバイス７０４と、通信インターフェース（通信ＩＦ）７０５と、を有する。プロセッサ７０１、記憶デバイス７０２、入力デバイス７０３、出力デバイス７０４、および通信ＩＦ７０５は、バス７０６により接続される。プロセッサ７０１は、データ拡張装置１００を制御する。記憶デバイス７０２は、プロセッサ７０１の作業エリアとなる。また、記憶デバイス７０２は、各種プログラムやデータを記憶する非一時的なまたは一時的な記録媒体である。記憶デバイス７０２としては、たとえば、ＲＯＭ（ＲｅａｄＯｎｌｙＭｅｍｏｒｙ）、ＲＡＭ（ＲａｎｄｏｍＡｃｃｅｓｓＭｅｍｏｒｙ）、ＨＤＤ（ＨａｒｄＤｉｓｋＤｒｉｖｅ）、フラッシュメモリがある。入力デバイス７０３は、データを入力する。入力デバイス７０３としては、たとえば、キーボード、マウス、タッチパネル、テンキー、スキャナ、マイク、センサがある。出力デバイス７０４は、データを出力する。出力デバイス７０４としては、たとえば、ディスプレイ、プリンタ、スピーカがある。通信ＩＦ７０５は、ネットワークと接続し、データを送受信する。

【0053】

なお、プロセッサ７０１の一例としてはＣＰＵ（ＣｅｎｔｒａｌＰｒｏｃｅｓｓｉｎｇＵｎｉｔ）やＧＰＵ（ＧｒａｐｈｉｃｓＰｒｏｃｅｓｓｉｎｇＵｎｉｔ）が考えられるが、所定の処理を実行する主体であれば他の半導体デバイスでもよい。

【0054】

このように、実施例１によれば、機械学習モデルの精度向上に寄与する合成データを生成することができる。たとえば、リファレンスモデル１０３の予測に影響を及ぼす特徴に絞った変換をドメイン逆変換器２０３が学習できるため，現実世界のデータと合成データの乖離を抑制することができる。したがって、第１学習用データセット１０１のデータ拡張が可能になる。

【実施例0055】

実施例２は、実施例１における第２学習用データセット２０１の拡張が求められる場合に対応する例である。たとえば、第２学習用データセット２０１に含まれる第２学習用サンプル２０２の数量が非常に少ない場合であっても、第２学習用データセット２０１をデータ拡張することにより、リファレンスモデル１０３の学習に必要な量のサンプルを確保することができる。実施例２では、実施例１との相違点について説明するため、実施例１との共通点については説明を省略する。

【0056】

＜データ拡張装置１００の機能的構成例５＞
図８は、データ拡張装置１００の機能的構成例５を示すブロック図である。データ拡張装置１００は、ドメイン順変換器２０６を用いて、データ拡張を実行する。具体的には、たとえば、データ拡張装置１００は、第１学習用サンプル１０２をドメイン順変換器２０６に入力する都度、疑似第２学習用サンプル２０７を出力する。実施例２では、それぞれ出力された疑似第２学習用サンプル２０７の集合が第３学習用データセット４０１となる。疑似第２学習用サンプル２０７は、第２ドメインの特徴を含むため、第２学習用データセット２０１のデータ拡張が達成される。なお、第３学習用データセット４０１は、第２学習用データセット２０１を含んでもよい。

【0057】

＜データ拡張装置１００の運用例＞
図９は、実施例２にかかるデータ拡張装置１００の運用例を示すフローチャートである。図６との相違点について説明する。

【0058】

ステップＳ９０３：データ拡張装置１００は、ステップＳ６０２で学習されたドメイン順変換器２０６で第１学習用サンプル１０２の変換を実行し、疑似第２学習用サンプル２０７を出力する（図６を参照）。

【0059】

ステップＳ９０４：データ拡張装置１００は、疑似第２学習用サンプル２０７を含む第３学習用データセット４０１を作成する。第３学習用データセット４０１は、疑似第２学習用サンプル２０７と第１正解値１０５との組み合わせである。なお、データ拡張装置１００は、第３学習用データセット４０１に、第２学習用データセット２０１を追加してもよい。

【0060】

このようなデータ拡張装置１００の運用により、第３学習用データセット４０１を構成する疑似第２学習用サンプル２０７は、第２ドメインの特徴を含むため、第２学習用データセット２０１のデータ拡張が達成される。

【0061】

実施例２においても、図５に示したように、ターゲットモデル５０２の更新が実行される。実施例２の場合、第３学習用データセット４０１の第３学習用サンプル５０１は、疑似第２学習用サンプル２０７であり、第３正解値５０４は、第１正解値１０５である。実施例２では、このように学習されたターゲットモデル５０２は、第２ドメインのサンプル取得装置に実装される。

【0062】

これにより、データ拡張装置１００は、第２学習用サンプル２０２が少量な第２ドメインの現場であっても、第１学習用サンプル１０２が大量に存在する第１学習用データセット１０１を、高精度に第２ドメインのデータセットに変換する。これにより、第２ドメインへの変換後の第１学習用データセット１０１を第２ドメインの現場のＡＩ監視カメラに適用するというデータ拡張が可能になる。したがって、第２ドメインの現場での第２学習用サンプル２０２の収集コストおよび第２正解値２０５の特定作業の労力が軽減される。

【実施例0063】

実施例３は、実施例２におけるドメイン順変換器２０６の出力である疑似第２学習用サンプル２０７の品質を向上し、現実世界で収集された第２学習用サンプル２０２との乖離を抑制する例である。実施例３では、実施例１および実施例２との相違点について説明するため、実施例１および実施例２との共通点については説明を省略する。

【0064】

＜データ拡張装置１００の機能的構成例６＞
図１０は、データ拡張装置１００の機能的構成例６を示すブロック図である。データ拡張装置１００において、ドメイン順変換器２０６は、第１学習用サンプル１０２を疑似第２学習用サンプル２０７に変換する。ドメイン逆変換器２０３は、ドメイン順変換器２０６によって出力された疑似第２学習用サンプル２０７を疑似第１学習用サンプル２０４に変換する。

【0065】

実施例３では、第２損失関数２１０は、第１学習用サンプル１０２と疑似第１学習用サンプル２０４との間のずれを示す損失を、第４損失値として算出する。疑似第１学習用サンプル２０４は、第１学習用サンプル１０２をドメイン順変換器２０６に入力した結果出力される疑似第２学習用サンプル２０７を、ドメイン逆変換器２０３に入力することにより、ドメイン逆変換器２０３から出力される。

【0066】

データ拡張装置１００は、図２に示した疑似第１損失値および第２損失値を用いたドメイン逆変換器２０３およびドメイン順変換器２０６の学習サイクルと、図１０に示した第４損失値を用いたドメイン逆変換器２０３およびドメイン順変換器２０６の学習サイクルと、を交互に実行する。

【0067】

また、データ拡張装置１００は、図２に示した疑似第１損失値および第２損失値を用いたドメイン逆変換器２０３およびドメイン順変換器２０６の学習サイクルと、図１０に示した第４損失値を用いたドメイン逆変換器２０３およびドメイン順変換器２０６の学習サイクルと、を同時に実行してもよい。

【0068】

具体的には、たとえば、データ拡張装置１００は、疑似第１損失値、第２損失値および第４損失値を加算し、統合損失値とする。そして、データ拡張装置１００は、当該統合損失値が減少するようにドメイン逆変換器２０３およびドメイン順変換器２０６の各々を更新する。これにより、データ拡張装置１００は、ドメイン逆変換器２０３およびドメイン順変換器２０６の各々の更新を１サイクルで実現することができる。

【0069】

実施例３によれば、ドメイン順変換器２０６は、現実世界で収集された第１学習用サンプル１０２に対する変換を学習するため、実施例２におけるドメイン順変換器２０６の出力である疑似第２学習用サンプル２０７の品質を向上し、現実世界で収集された第２学習用サンプル２０２との乖離を抑制することができる。

【0070】

以上説明したように、上述した実施例１～実施例３のデータ拡張装置１００によれば、実際に現実世界で取得されたデータを高精度に模擬し、機械学習モデルの精度向上に寄与する合成データを生成することができる。換言すれば、上述した実施例１～実施例３のデータ拡張装置１００によれば、変換前後のデータ間の乖離を抑制することができ、画像歪みを抑制したデータ拡張が実現可能になる。

【0071】

具体的には、データ拡張装置１００は、機械学習モデルの精度向上に寄与する合成データを生成することができる。たとえば、リファレンスモデル１０３の予測に影響を及ぼす特徴に絞った変換をドメイン逆変換器２０３およびドメイン順変換器２０６が学習できるため、現実世界のデータと合成データとの乖離（たとえば、第１学習用サンプル１０２と疑似第１学習用サンプル２０４との乖離、第２学習用サンプル２０２と疑似第２学習用サンプル２０７との乖離）を抑制することができる。

【0072】

すなわち、ドメインの違いによるデータの乖離（精度劣化）は、学習時と推論時のデータ分布の差異が原因と言われる。このため、第１ドメインで学習済みのリファレンスモデル１０３に対して推論精度が上がるような変換処理（図３）とは、疑似第１学習用サンプル２０４を第１学習用サンプル１０２に近づける変換処理を意味するため、第１ドメインへ変換（第２学習用サンプル２０２⇒疑似第１学習用サンプル２０４）を実現することができる。

【0073】

なお、本発明は前述した実施例に限定されるものではなく、添付した特許請求の範囲の趣旨内における様々な変形例及び同等の構成が含まれる。たとえば、前述した実施例は本発明を分かりやすく説明するために詳細に説明したものであり、必ずしも説明した全ての構成を備えるものに本発明は限定されない。また、ある実施例の構成の一部を他の実施例の構成に置き換えてもよい。また、ある実施例の構成に他の実施例の構成を加えてもよい。また、各実施例の構成の一部について、他の構成の追加、削除、または置換をしてもよい。

【0074】

また、前述した各構成、機能、処理部、処理手段等は、それらの一部又は全部を、たとえば集積回路で設計する等により、ハードウェアで実現してもよく、プロセッサがそれぞれの機能を実現するプログラムを解釈し実行することにより、ソフトウェアで実現してもよい。

【0075】

各機能を実現するプログラム、テーブル、ファイル等の情報は、メモリ、ハードディスク、ＳＳＤ（ＳｏｌｉｄＳｔａｔｅＤｒｉｖｅ）等の記憶装置、又は、ＩＣ（ＩｎｔｅｇｒａｔｅｄＣｉｒｃｕｉｔ）カード、ＳＤカード、ＤＶＤ（ＤｉｇｉｔａｌＶｅｒｓａｔｉｌｅＤｉｓｃ）の記録媒体に格納することができる。

【0076】

また、制御線や情報線は説明上必要と考えられるものを示しており、実装上必要な全ての制御線や情報線を示しているとは限らない。実際には、ほとんど全ての構成が相互に接続されていると考えてよい。