特許7286091 | 知財ポータル「IP Force」

知財求人 - 知財ポータルサイト「IP Force」

▶ オムロン株式会社の特許一覧 ▶ 国立大学法人京都大学の特許一覧

特許7286091推定システム、推定装置および推定方法

書誌要約請求の範囲詳細な説明課題実施例実施するための形態図面の説明

目に優しい文字サイズ小中大 PDF Top

< >

1
2
3
4
5
6
7
8
9
10
11
12
13
14

(19)【発行国】日本国特許庁(JP)

(12)【公報種別】特許公報(B2)

(11)【特許番号】

(24)【登録日】2023-05-26

(45)【発行日】2023-06-05

(54)【発明の名称】推定システム、推定装置および推定方法

(51)【国際特許分類】

G06N 20/00 20190101AFI20230529BHJP

【ＦＩ】

G06N20/00 130

【請求項の数】 7

(21)【出願番号】P 2019206383

(22)【出願日】2019-11-14

(65)【公開番号】P2021081794

(43)【公開日】2021-05-27

【審査請求日】2022-05-24

(73)【特許権者】

【識別番号】000002945

【氏名又は名称】オムロン株式会社

(73)【特許権者】

【識別番号】504132272

【氏名又は名称】国立大学法人京都大学

(74)【代理人】

【識別番号】110001195

【氏名又は名称】弁理士法人深見特許事務所

(72)【発明者】

【氏名】橋本敦史

(72)【発明者】

【氏名】飯山将晃

(72)【発明者】

【氏名】▲高▼橋龍平

(72)【発明者】

【氏名】薗頭元春

【審査官】千葉久博

(56)【参考文献】

【文献】特開２０１９－１５９８３５（ＪＰ，Ａ）

【文献】米国特許出願公開第２０１９／０２４４１０７（ＵＳ，Ａ１）

【文献】国際公開第２０１９／０８７９８７（ＷＯ，Ａ１）

(58)【調査した分野】(Int.Cl.，ＤＢ名)

Ｇ０６Ｎ２０／００

(57)【特許請求の範囲】

【請求項1】

推定システムであって、
正解が付与された複数のサンプルデータを含む第１のデータセット、および、正解が付与されていない複数のサンプルデータを含む第２のデータセットを用いて、推定モデルを生成する学習部と、
前記第２のデータセットに属し得る推定対象データを前記推定モデルに入力して、推定結果を決定する推定部とを備え、
前記推定モデルは、サンプルデータから、前記第１のデータセットおよび前記第２のデータセットに非依存の第１の特徴量、および、前記第１のデータセットまたは前記第２のデータセットに依存する第２の特徴量、を算出するエンコーダを含み、
前記学習部は、前記第１のデータセットに含まれる第１のサンプルデータと、前記第２のデータセットに含まれる、前記第１のサンプルデータに付与されている正解と同じ正解が付与されるべき第２のサンプルデータとのペアについて、前記第１のサンプルデータおよび前記第２のサンプルデータのいずれからも同じ第１の特徴量が算出されるように前記エンコーダを学習するように構成されている、推定システム。

【請求項2】

前記学習部は、敵対的ネットワークである学習用ネットワークにより、前記推定モデルを生成するように構成されている、請求項１に記載の推定システム。

【請求項3】

前記学習用ネットワークは、
第１のエンコーダおよび第１のデコーダからなる第１のエンコーダ・デコーダと、
第２のエンコーダおよび第２のデコーダからなる第２のエンコーダ・デコーダとを含み、
前記学習部による学習において、
前記第１のデータセットに含まれるサンプルは、前記第１のエンコーダ・デコーダおよび前記第２のエンコーダ・デコーダの順で配置された第１のネットワークに入力され、
前記第２のデータセットに含まれるサンプルは、前記第２のエンコーダ・デコーダおよび前記第１のエンコーダ・デコーダの順で配置された第２のネットワークに入力される、請求項２に記載の推定システム。

【請求項4】

前記学習部は、
前記第１のデータセットに含まれるサンプルを第１のネットワークに入力することで、前記第１のエンコーダから出力される前記第１の特徴量と、前記第２のエンコーダから出力される第１の疑似特徴量との誤差が最小化するように、前記第１のエンコーダ、前記第１のデコーダ、前記第２のエンコーダおよび前記第２のデコーダのモデルパラメータを最適化するように構成されており、
前記第２のデータセットに含まれるサンプルを第２のネットワークに入力することで、前記第２のエンコーダから出力される前記第１の特徴量と、前記第１のエンコーダから出力される第１の疑似特徴量との誤差が最小化するように、前記第１のエンコーダ、前記第１のデコーダ、前記第２のエンコーダおよび前記第２のデコーダのモデルパラメータを最適化するように構成されている、請求項３に記載の推定システム。

【請求項5】

前記学習部は、前記エンコーダからの出力が入力される識別器を、前記第１のデータセットに含まれるサンプルデータおよび対応する正解に基づいて学習するようにさらに構成されており、
前記推定モデルは、前記識別器をさらに含む、請求項１～４のいずれか１項に記載の推定システム。

【請求項6】

正解が付与された複数のサンプルデータを含む第１のデータセット、および、正解が付与されていない複数のサンプルデータを含む第２のデータセットを用いた学習によって生成された推定モデルを保持する記憶部と、
前記第２のデータセットに属し得る推定対象データを前記推定モデルに入力して、推定結果を決定する推定部とを備え、
前記推定モデルは、サンプルデータから、前記第１のデータセットおよび前記第２のデータセットに非依存の第１の特徴量、および、前記第１のデータセットまたは前記第２のデータセットに依存する第２の特徴量、を算出するエンコーダを含み、
前記エンコーダは、前記第１のデータセットに含まれる第１のサンプルデータと、前記第２のデータセットに含まれる、前記第１のサンプルデータに付与されている正解と同じ正解が付与されるべき第２のサンプルデータとのペアについて、前記第１のサンプルデータおよび前記第２のサンプルデータのいずれからも同じ第１の特徴量が算出されるように学習されている、推定装置。

【請求項7】

正解が付与された複数のサンプルデータを含む第１のデータセット、および、正解が付与されていない複数のサンプルデータを含む第２のデータセットを用いて、推定モデルを生成するステップと、
前記第２のデータセットに属し得る推定対象データを前記推定モデルに入力して、推定結果を決定するステップとを備え、
前記推定モデルは、サンプルデータから、前記第１のデータセットおよび前記第２のデータセットに非依存の第１の特徴量、および、前記第１のデータセットまたは前記第２のデータセットに依存する第２の特徴量、を算出するエンコーダを含み、
前記推定モデルを生成するステップは、前記第１のデータセットに含まれる第１のサンプルデータと、前記第２のデータセットに含まれる、前記第１のサンプルデータに付与されている正解と同じ正解が付与されるべき第２のサンプルデータとのペアについて、前記第１のサンプルデータおよび前記第２のサンプルデータのいずれからも同じ第１の特徴量が算出されるように前記エンコーダを学習するステップを含む、推定方法。

【発明の詳細な説明】

【技術分野】

【0001】

本発明は、実運用に適合可能な機械学習方法に関する。

【背景技術】

【0002】

近年のコンピューティング能力の飛躍的な向上によって、様々な分野に、コンピューティング能力を利用したＡＩ（Artificial Intelligence）と称されるソリューションが実現されつつある。

【0003】

このような取り組みの一つに、サイバーフィジカルシステム（ＣＰＳ：Cyber Physical System）がある。サイバーフィジカルシステムは、現実の世界との関わりを意識し、コンピューティング能力を利用して、社会的な課題を解決しようとする様々な試みを包含するものである。

【0004】

サイバーフィジカルシステムの実現には、様々な要素技術が必要であるが、その一つにUnsupervised Domain Adaptation問題が知られている。非特許文献１、非特許文献２および非特許文献３には、Unsupervised Domain Adaptation問題に対して、ｃｙｃｌｅＧＡＮと呼ばれる手法を適用することが開示されている。

【先行技術文献】

【非特許文献】

【0005】

【文献】Judy Hoffman, Eric Tzeng, Taesung Park, Jun-Yan Zhu, Phillip Isola, Kate Saenko, Alexei Efros, Trevor Darrell, "CyCADA: Cycle-Consistent Adversarial Domain Adaptation," Proceedings of the 35th International Conference on Machine Learning," PMLR 80:1989-1998, 2018, [2019年11月8日検索], インターネット<URL:https://github.com/jhoffman/cycada_release>

【文献】Paolo Russo, Fabio M. Carlucci, Tatiana Tommasi, Barbara Caputo, "From Source to Target and Back: Symmetric Bi-Directional Adaptive GAN," The IEEE Conference on Computer Vision and Pattern Recognition (CVPR), 2018, pp.8099-8108, [2019年11月8日検索], インターネット<URL:http://openaccess.thecvf.com/content_cvpr_2018/html/Russo_From_Source_to_CVPR_2018_paper.html>

【文献】Ashish Shrivastava, Tomas Pfister, Oncel Tuzel, Joshua Susskind, Wenda Wang, Russell Webb, "Learning From Simulated and Unsupervised Images Through Adversarial Training," The IEEE Conference on Computer Vision and Pattern Recognition (CVPR),2017, pp. 2107-2116, [2019年11月8日検索], インターネット<URL:https://arxiv.org/abs/1612.07828>

【発明の概要】

【発明が解決しようとする課題】

【0006】

本発明は、非特許文献１、非特許文献２および非特許文献３に開示される従来手法に比較して、より推定性能を高めた学習済みモデルを生成できる技術を提供することを一つの目的とする。

【課題を解決するための手段】

【0007】

本発明の一例に従う推定システムは、正解が付与された複数のサンプルデータを含む第１のデータセット、および、正解が付与されていない複数のサンプルデータを含む第２のデータセットを用いて、推定モデルを生成する学習部と、第２のデータセットに属し得る推定対象データを推定モデルに入力して、推定結果を決定する推定部とを含む。推定モデルは、サンプルデータから、第１のデータセットおよび第２のデータセットに非依存の第１の特徴量、および、第１のデータセットまたは第２のデータセットに依存する第２の特徴量、を算出するエンコーダを含む。学習部は、第１のデータセットに含まれる第１のサンプルデータと、第２のデータセットに含まれる、第１のサンプルデータに付与されている正解と同じ正解が付与されるべき第２のサンプルデータとのペアについて、第１のサンプルデータおよび第２のサンプルデータのいずれからも同じ第１の特徴量が算出されるようにエンコーダを学習するように構成されている。

【0008】

この構成によれば、各データセットに含まれるサンプルデータから、第１のデータセットおよび第２のデータセットに非依存の第１の特徴量、および、第１のデータセットまたは第２のデータセットに依存する第２の特徴量、を算出するようなエンコーダを用いる。そして、第２の特徴量ではなく、第１の特徴量に着目して、第２のデータセットの分布の形状を知ることなく、推定モデルの推定精度を高めることができる。

【0009】

学習部は、敵対的ネットワークである学習用ネットワークにより、推定モデルを生成するように構成されていてもよい。この構成によれば、敵対的ネットワークにより効率的に推定モデルを学習できる。

【0010】

学習用ネットワークは、第１のエンコーダおよび第１のデコーダからなる第１のエンコーダ・デコーダと、第２のエンコーダおよび第２のデコーダからなる第２のエンコーダ・デコーダとを含んでいてもよい。学習部による学習において、第１のデータセットに含まれるサンプルは、第１のエンコーダ・デコーダおよび第２のエンコーダ・デコーダの順で配置された第１のネットワークに入力され、第２のデータセットに含まれるサンプルは、第２のエンコーダ・デコーダおよび第１のエンコーダ・デコーダの順で配置された第２のネットワークに入力されてもよい。この構成によれば、第１のエンコーダ・デコーダおよび第２のエンコーダ・デコーダは共通化しつつ配置順序を異ならせることで、敵対的ネットワークにより効率的に推定モデルを学習できる。

【0011】

学習部は、第１のデータセットに含まれるサンプルを第１のネットワークに入力することで、第１のエンコーダから出力される第１の特徴量と、第２のエンコーダから出力される第１の疑似特徴量との誤差が最小化するように、第１のエンコーダ、第１のデコーダ、第２のエンコーダおよび第２のデコーダのモデルパラメータを最適化するように構成されており、第２のデータセットに含まれるサンプルを第２のネットワークに入力することで、第２のエンコーダから出力される第１の特徴量と、第１のエンコーダから出力される第１の疑似特徴量との誤差が最小化するように、第１のエンコーダ、第１のデコーダ、第２のエンコーダおよび第２のデコーダのモデルパラメータを最適化するように構成されていてもよい。この構成によれば、サンプルから算出される第１の特徴量と、当該第１の特徴量からデコーダおよびエンコーダを通じて算出される第１の疑似特徴量との誤差を最小化することで、推定モデルのモデルパラメータを効率的に学習できる。

【0012】

学習部は、エンコーダからの出力が入力される識別器を、第１のデータセットに含まれるサンプルデータおよび対応する正解に基づいて学習するようにさらに構成されていてもよい。推定モデルは、識別器をさらに含んでいてもよい。この構成によれば、推定モデルによる推定（識別）についての学習を効率的に行うことができる。

【0013】

本発明の別の一例に従う推定装置は、正解が付与された複数のサンプルデータを含む第１のデータセット、および、正解が付与されていない複数のサンプルデータを含む第２のデータセットを用いた学習によって生成された推定モデルを保持する記憶部と、第２のデータセットに属し得る推定対象データを推定モデルに入力して、推定結果を決定する推定部とを含む。推定モデルは、サンプルデータから、第１のデータセットおよび第２のデータセットに非依存の第１の特徴量、および、第１のデータセットまたは第２のデータセットに依存する第２の特徴量、を算出するエンコーダを含む。エンコーダは、第１のデータセットに含まれる第１のサンプルデータと、第２のデータセットに含まれる、第１のサンプルデータに付与されている正解と同じ正解が付与されるべき第２のサンプルデータとのペアについて、第１のサンプルデータおよび第２のサンプルデータのいずれからも同じ第１の特徴量が算出されるように学習されている。

【0014】

本発明のさらに別の一例に従う推定方法は、正解が付与された複数のサンプルデータを含む第１のデータセット、および、正解が付与されていない複数のサンプルデータを含む第２のデータセットを用いて、推定モデルを生成するステップと、第２のデータセットに属し得る推定対象データを推定モデルに入力して、推定結果を決定するステップとを含む。推定モデルは、サンプルデータから、第１のデータセットおよび第２のデータセットに非依存の第１の特徴量、および、第１のデータセットまたは第２のデータセットに依存する第２の特徴量、を算出するエンコーダを含む。推定モデルを生成するステップは、第１のデータセットに含まれる第１のサンプルデータと、第２のデータセットに含まれる、第１のサンプルデータに付与されている正解と同じ正解が付与されるべき第２のサンプルデータとのペアについて、第１のサンプルデータおよび第２のサンプルデータのいずれからも同じ第１の特徴量が算出されるようにエンコーダを学習するステップを含む。

【発明の効果】

【0015】

本発明によれば、従来手法に比較して、より推定性能を高めた学習済みモデルを生成できる。

【図面の簡単な説明】

【0016】

【図1】本実施の形態に係るロボットシステムの構成例を示す模式図である。

【図2】本実施の形態に係る推定モデルの構築および運用に係る処理手順を示す模式図である。

【図3】本実施の形態に係るロボットシステムのハードウェア構成例を示す模式図である。

【図4】本発明の関連技術に従うUnsupervised Domain Adaptation問題の解決手法の一例を説明するための図である。

【図5】本実施の形態に係るｃｙｃｌｅＧＡＮによりエンコーダを構築するための学習用ネットワークの一例を示す模式図である。

【図6】図５に示すｃｙｃｌｅＧＡＮによるエンコーダの構築を概念的に説明するための図である。

【図7】本実施の形態に係るｃｙｃｌｅＧＡＮによりエンコーダを構築するための学習用ネットワークの一例を示す模式図である。

【図8】図７に示される学習用ネットワークを利用した主目的識別器を構築する方法の一例を示す模式図である。

【図9】図７に示される学習用ネットワークを利用して構築されたエンコーダの運用フェーズでのネットワークの一例を示す模式図である。

【図10】本実施の形態に係る推定モデルを生成するための処理手順を示すフローチャートである。

【図11】本実施の形態に係る推定モデルにおけるモデルパラメータ共有の一例を説明するための図である。

【図12】本実施の形態に係る推定モデルの性能結果の実験例を説明するための模式図である。

【図13】図１２に示す実験における性能評価の一例を示す図である。

【図14】本実施の形態に係る推定モデルを利用する推定システムの構成例を示す模式図である。

【発明を実施するための形態】

【0017】

本発明の実施の形態について、図面を参照しながら詳細に説明する。なお、図中の同一または相当部分については、同一符号を付してその説明は繰り返さない。

【0018】

＜Ａ．適用例＞
まず、本発明が適用される場面の一例について説明する。

【0019】

図１は、本実施の形態に係るロボットシステム１の構成例を示す模式図である。図１を参照して、ロボットシステム１は、画像認識によってワーク８の位置および／または種類を特定し、アームの先端に配置されたハンド６によりワーク８を把持して、必要な操作を行う。

【0020】

ロボット２は、一例として、多関節型ロボットであり、関節に相当する複数の軸４を有しており、それぞれの軸４が回転または移動することによって、先端に配置されたハンド６を任意の位置および任意の姿勢に配置できる。ハンド６の近傍にカメラ２０が配置されており、カメラ２０により撮像された画像に対して認識処理が行われることで、ワーク８の位置および／または種類などが特定（推定）される。

【0021】

本実施の形態に係るロボットシステム１では、後述するような機械学習によって事前に構築された学習済みモデルである推定モデルが用いられる。推定モデルの推定精度を高めるためには、多数の教師データを含む学習用データセットを用いて機械学習を行う必要がある。

【0022】

一方で、教師データには正解（ラベル）を予め付与しておく必要があり、多数の教師データを用意することは容易ではない。そのため、シミュレーション上で予め位置および種類（すなわち、正解）が既知のワークを配置するとともに、当該ワークを仮想的に撮像（レンダリングあるいはビジュアライゼーション）することで、正解が付与された画像（すなわち、教師データ）を多数用意するような手法が用いられることが多い。

【0023】

このようなシミュレーションにより生成された多数の教師データを用いて、推定モデルを構築することで、推定精度を高めることができる。

【0024】

しかしながら、実際の運用においては、カメラ２０でワーク８が撮像される。シミュレーションにより生成された画像とカメラ２０で実際に撮像された画像とは、撮像条件などが全く同一ではないので、シミュレーションにより生成された多数の教師データを用いて構築した推定モデルをそのまま実運用に用いることはできない場合が多い。

【0025】

本実施の形態は、ある条件下で生成された教師データを用いて構築した推定モデルを必ずしも同一とは限らない条件下で運用することが可能な構成を提供する。

【0026】

図２は、本実施の形態に係る推定モデルの構築および運用に係る処理手順を示す模式図である。図２を参照して、まず、シミュレーション装置２００が生成した画像を含むデータセット（以下、「ソースデータセット３０」とも称す。）を用いて、推定モデル４０を構築する。

【0027】

この構築された推定モデル４０を、実際の運用で用いられる画像を含むデータセット（以下、「ターゲットデータセット５０」とも称す。）を用いて適合化することで、推定モデル６０を生成する。実際の運用では、この生成された推定モデル６０に対して、データ（以下、「推定対象データ７０」とも称す。）が入力されることで、推定結果６２が出力される。推定対象データ７０は、ターゲットデータセット５０に属し得るサンプルデータに相当する。

【0028】

なお、必ずしも推定モデル４０を構築する必要はなく、ソースデータセット３０およびターゲットデータセット５０から、推定モデル６０を直接構築してもよい。

【0029】

以下、本発明の具体的な応用例であるロボットシステム１の詳細な構成および処理について説明する。

【0030】

＜Ｂ．ロボットシステムのハードウェア構成＞
次に、図１に示すロボットシステム１のハードウェア構成の一例について説明する。

【0031】

図３は、本実施の形態に係るロボットシステム１のハードウェア構成例を示す模式図である。図３を参照して、ロボットシステム１は、ロボット２およびロボット２を制御するロボットコントローラ１００を含む。

【0032】

ロボット２は、カメラ２０に加えて、サーボドライバ１２およびモータ１４のセットを軸の数だけ有している。

【0033】

ロボットコントローラ１００は、本実施の形態に係る推定システムを構成する装置であり、カメラ２０で撮像された画像に基づいて、ロボット２を制御する。より具体的には、ロボットコントローラ１００は、カメラ２０から撮像された画像に対して認識処理を行い、その認識結果に応じて、１または複数のサーボドライバ１２へ指令を出力する。サーボドライバ１２の各々が指令に従って電力を供給することで、対応付けられているモータ１４が回転駆動され、モータ１４と機械的に結合されているロボット２の関節あるいはアームが動作する。

【0034】

ロボットコントローラ１００は、典型的には、汎用的なアーキテクチャに従うコンピュータ（例えば、汎用パソコンをベースとした産業用パソコン）を用いて実現される。

【0035】

ロボットコントローラ１００は、コンポーネントとして、プロセッサ１０２と、メインメモリ１０４と、ストレージ１１０と、通信インターフェイス１２２と、入力部１２４と、出力部１２６と、カメラインターフェイス１２８と、モータインターフェイス１３０とを含む。

【0036】

プロセッサ１０２は、ＣＰＵ（Central Processing Unit）、ＭＰＵ（Micro Processing Unit）、ＧＰＵ（Graphics Processing Unit）などで構成される。プロセッサ１０２としては、複数のコアを有する構成を採用してもよいし、プロセッサ１０２を複数配置してもよい。

【0037】

メインメモリ１０４は、ＤＲＡＭ（Dynamic Random Access Memory）やＳＲＡＭ（Static Random Access Memory）などの揮発性記憶装置などで構成される。ストレージ１１０は、例えば、ＨＤＤ（Hard Disk Drive）やＳＳＤ（Solid State Drive）などの不揮発性記憶装置などで構成される。プロセッサ１０２は、ストレージ１１０に格納された各種プログラムを読出して、メインメモリ１０４に展開して実行することで、後述するような各種処理を実現する。

【0038】

ストレージ１１０には、基本的な機能を実現するためのＯＳ１１２に加えて、機械学習プログラム１１４と、推定モデルを規定するモデルパラメータ１１６と、ロボット２を制御するための制御アプリケーション１１８とが格納されている。ストレージ１１０は、推定モデルを保持する記憶部に相当する。また、ストレージ１１０には、ソースデータセット３０が格納されることもある。

【0039】

プロセッサ１０２が機械学習プログラム１１４を実行することで、学習処理を実行して、推定モデル６０を生成する。また、プロセッサ１０２が制御アプリケーション１１８を実行することで、推定対象データ７０を推定モデル６０に入力して、推定結果を決定する推定部として機能する。

【0040】

通信インターフェイス１２２は、任意のネットワークを介して他の装置との間のデータの遣り取りを仲介する。

【0041】

入力部１２４は、キーボードやマウスなどで構成され、ユーザ操作を受け付ける。出力部１２６は、ディスプレイ、各種インジケータ、プリンタなどで構成され、プロセッサ１０２からの処理結果などを出力する。

【0042】

カメラインターフェイス１２８は、カメラ２０により撮像された画像を受信するとともに、カメラ２０に対して必要な指令を出力する。

【0043】

モータインターフェイス１３０は、プロセッサ１０２からの指示に従って、サーボドライバ１２へ必要な指令を出力する。

【0044】

ロボットコントローラ１００のプログラムは、コンピュータ読み出し可能な記録媒体（例えば、ＤＶＤ（Digital Versatile Disc）などの光学記録媒体）を介してインストールされてもよいが、ネットワーク上のサーバ装置などからダウンロードする形でインストールするようにしてもよい。また、本実施の形態に係るロボットコントローラ１００が提供する機能は、ＯＳが提供するモジュールの一部を利用する形で実現される場合もある。

【0045】

図３には、プロセッサ１０２がプログラムを実行することで、ロボットコントローラ１００として必要な機能が提供される構成例を示したが、これらの提供される機能の一部または全部を、専用のハードウェア回路（例えば、ＡＳＩＣ（Application Specific Integrated Circuit）またはＦＰＧＡ（Field-Programmable Gate Array）など）を用いて実装してもよい。

【0046】

＜Ｃ．Unsupervised Domain Adaptation問題＞
先に、Unsupervised Domain Adaptation問題について説明する。図１および図２を参照して説明したように、互いに異なるバイアス（傾向）をもつデータセット（ソースデータセット３０およびターゲットデータセット５０）が存在するとする。ここで、バイアスとは、典型的には、ソースデータセット３０が取得された環境（以下、「ソースドメイン」とも称す。）と、ターゲットデータセット５０が取得された環境（以下、「ターゲットドメイン」とも称す。）との相違などによるものである。

【0047】

ソースデータセット３０は、基本的には、正解が付与された複数のサンプルデータから構成される。但し、ソースデータセット３０には、正解が付与されていないサンプルデータが含まれていてもよい。ソースデータセット３０は、正解が付与された複数のサンプルデータを含む第１のデータセットに相当する。

【0048】

ターゲットデータセット５０は、基本的には、正解が付与されていない複数のサンプルデータから構成される。但し、ターゲットデータセット５０には、正解が付与されたサンプルデータが含まれていてもよい。ターゲットデータセット５０は、正解が付与されていない複数のサンプルデータを含む第２のデータセットに相当する。

【0049】

図１および図２に示す例を参照すると、シミュレーションにより生成するという環境がソースドメインであり、カメラ２０により実際に撮像するという環境がターゲットドメインに相当する。

【0050】

ソースドメインの学習用データセットは（ｘ_ｓ，ｙ_ｓ）の組で与えられ、ターゲットドメインの学習用データセットは（ｘ_ｔ）のみで与えられるとする。ここで、ｘ_ｓおよびｘ_ｔは、ソースドメインおよびターゲットドメインに含まれるサンプルデータの入力ベクトルをそれぞれ示し、ｔ_ｓは、対応するｔ_ｓに付与された正解（ラベル）を意味する。すなわち、ターゲットドメインに含まれるサンプルデータには、正解（ラベル）が付与されていないとする。

【0051】

このような前提において、ターゲットドメインに属するサンプルデータ群Ｘ_ｔに付与されるべき正解Ｙ_ｔを推定できる学習済みモデルを構築することが、Unsupervised Domain Adaptation問題の目標である。すなわち、正解Ｙ_ｔが存在しない状態で、分布Ｐｒ（ｙ｜Ｘ_ｔ）を算出できる学習済みモデルを構築することが目標となる。

【0052】

関連技術に従うUnsupervised Domain Adaptation問題の解決手法は、同じ推定値となるサンプルデータｘ_ｓ～Ｘ_ｓとサンプルデータｘ_ｔ～Ｘ_ｔとを同じ特徴量ｚに射影するエンコーダＥ（ｚ｜ｘ）を構築するというものである。

【0053】

ここで、同じ推定値となるペア（ｘ_ｓ，ｘ_ｔ）は特定できない、すなわちいずれのペア（ｘ_ｓ，ｘ_ｔ）が同じ推定値となるのかは未知である。そのため、個々のペアが同じ特徴量となるように、エンコーダを学習するのではなく、群として同じ特徴量となるように、エンコーダを学習する。すなわち、群として、分布Ｐｒ（ｙ｜ｘ_ｓ～Ｘ_ｓ）と分布Ｐｒ（ｙ｜ｘ_ｔ～Ｘ_ｔ）との形状が一致するように、エンコーダを学習する。

【0054】

図４は、本発明の関連技術に従うUnsupervised Domain Adaptation問題の解決手法の一例を説明するための図である。図４を参照して、ソースデータセット３０およびターゲットデータセット５０を想定する。ソースデータセット３０とターゲットデータセット５０との間には、未知のバイアス（あるいは、未知のバイアス差）が存在している。

【0055】

ソースデータセット３０（サンプルデータ群Ｘ_ｓ）は、第１の正解（ラベル）が付与されている１または複数のサンプルデータ３２と、第２の正解（ラベル）が付与されている１または複数のサンプルデータ３４とを含むものとする。

【0056】

一方、ターゲットデータセット５０（サンプルデータ群Ｘ_ｔ）は、第１の正解（ラベル）が付与されるべき１または複数のサンプルデータ５２と、第２の正解（ラベル）が付与されるべき１または複数のサンプルデータ５４とを含むものとする。但し、ターゲットデータセット５０に含まれるサンプルデータの正解は未知である。

【0057】

ここで、ソースデータセット３０およびターゲットデータセット５０に含まれるサンプルデータをエンコーダによる特徴量空間に射影したときの分布に着目する。ソースデータセット３０に含まれるサンプルデータ３２および３４は、それぞれ領域３６および３８に投影され、ターゲットデータセット５０に含まれるサンプルデータ５２および５４は、それぞれ領域５６および５８に投影されたとする。

【0058】

エンコーダは、領域３６および３８の分布と領域５６および５８の分布との形状が一致するように学習される。その上で、第１の正解（ラベル）に対応する領域３６および３８と、第２の正解（ラベル）が付与されている領域５６および５８とを識別する主目的識別器６４も学習される。エンコーダおよび主目的識別器６４から推定モデル６０（図６参照）が生成される。

【0059】

正解が付与されているサンプルデータを含むソースデータセット３０が存在していても、異なるバイアスをもつデータについては、推定精度が低下するが、上述したような手法によって構築されたエンコーダを適用することで、このような推定精度の低下を防止できる。

【0060】

＜Ｄ．解決手段＞
（ｄ１：課題の発見）
本願発明者らは、鋭意研究の結果、上述したような手法における本質的な課題およびそれに対する解決手段を見出した。すなわち、上述した手法は、暗黙的に分布Ｐｒ（ｙ｜ｘ_ｓ～Ｘ_ｓ）と分布Ｐｒ（ｙ｜ｘ_ｔ～Ｘ_ｔ）との形状が一致していることを仮定としているが、実際の正解Ｙ_ｔは未知であるので、このような仮定は、特殊な状況を除いて、偶然でしか成り立たないという本質的な問題がある。

【0061】

例えば、上述の図１および図２を参照して説明したように、シミュレーションにより生成された画像とカメラ２０で実際に撮像された画像との間で、正解の頻度分布を一致させるようなことは困難である。

【0062】

その結果、図４に示すように、本来、領域５６に射影されなければならないサンプルデータ５２のうち、誤って領域５８に射影されてしまうもの（誤射影サンプルデータ５３）が発生したり、領域５８に射影されなければならないサンプルデータ５４のうち、誤って領域５６に射影されてしまうもの（誤射影サンプルデータ５５）が発生したりし得る。なお、ターゲットデータセット５０に含まれるサンプルデータには正解が付与されていないので、このような誤った射影を検出することは理論上不可能である。

【0063】

（ｄ２：解決手段の概要）
本実施の形態に係る解決手段においては、分布Ｐｒ（ｙ｜ｘ_ｓ～Ｘ_ｓ）と分布Ｐｒ（ｙ｜ｘ_ｔ～Ｘ_ｔ）との形状が一致しているかどうかにかかわらず、サンプルデータｘ_ｓ～Ｘ_ｓおよびサンプルデータｘ_ｔ～Ｘ_ｔを同じ特徴量ｚに射影するエンコーダＥ（ｚ｜ｘ）を学習により構築する。

【0064】

より具体的には、ｃｙｃｌｅＧＡＮと呼ばれる手法を用いて、擬似的にサンプルデータｘ_ｓと同じ推定値ｙとなるであろう１次疑似サンプルデータｘ’_ｔを生成する。そして、サンプルデータｘ_ｓから算出した特徴量ｚと１次疑似サンプルデータｘ’_ｔから算出した特徴量ｚ’とが類似した値を示すように、誤差を最小化する。

【0065】

本手法においては、同じ推定値となるペアを一致させることを目的にエンコーダを学習する。すなわち、同じ推定値となるサンプルデータｘ_ｓ～Ｘ_ｓとサンプルデータｘ_ｔ～Ｘ_ｔとが同じ特徴量ｚに射影されるようになることを目的にエンコーダを学習する。このような学習方法を採用することで、分布Ｐｒ（ｙ｜ｘ_ｓ～Ｘ_ｓ）と分布Ｐｒ（ｙ｜ｘ_ｔ～Ｘ_ｔ）との形状が異なっていても推定精度を高めることができる。

【0066】

（ｄ３：基本学習用ネットワーク）
図５は、本実施の形態に係るｃｙｃｌｅＧＡＮによりエンコーダを構築するための学習用ネットワーク８０の一例を示す模式図である。図５を参照して、学習用ネットワーク８０は、一種の敵対的ネットワークであり、２種類のエンコーダとデコーダとの組を互いに組み合わせたものである。より具体的には、学習用ネットワーク８０は、エンコーダ８２とデコーダ８４との組、および、エンコーダ８６とデコーダ８８との組を含む。

【0067】

エンコーダ８２は、ソースデータセット３０に含まれるサンプルデータから特徴量を算出するための学習済みモデル（ＳｔｏＺ）であり、デコーダ８４は、特徴量からターゲットデータセット５０に含まれるサンプルデータを推定するための学習済みモデル（ＺｔｏＴ）である。

【0068】

同様に、エンコーダ８６は、ターゲットデータセット５０に含まれるサンプルデータから特徴量を算出するための学習済みモデル（ＴｔｏＺ）であり、デコーダ８８は、特徴量からソースデータセット３０に含まれるサンプルデータを推定するための学習済みモデル（ＺｔｏＳ）である。

【0069】

ソースデータセット３０に含まれるサンプルデータｘ_ｓ～Ｘ_ｓは、エンコーダ８２とデコーダ８４との組に入力され、その出力結果は、エンコーダ８６とデコーダ８８との組に入力される。

【0070】

同様に、ターゲットデータセット５０に含まれるサンプルデータｘ_ｔ～Ｘ_ｔは、エンコーダ８６とデコーダ８８との組に入力され、その出力結果は、エンコーダ８２とデコーダ８４との組に入力される。

【0071】

なお、学習用ネットワーク８０は、エンコーダ８２，８６およびデコーダ８４，８８の各々を２個ずつ含んでいるが、各々はモデルパラメータを共有している。そのため、同一の参照符号が付されているエンコーダおよびデコーダ同士は、同一のモデルである。

【0072】

ソースデータセット３０に含まれるサンプルデータｘ_ｓがエンコーダ８２に入力されることで、サンプルデータｘ_ｓの特徴量ｚ_ｓが算出される。特徴量ｚ_ｓがデコーダ８４に入力されることで、ターゲットデータセット５０に属するサンプルデータに模した１次疑似サンプルデータｘ’_ｔが算出される。

【0073】

さらに、１次疑似サンプルデータｘ’_ｔがエンコーダ８６に入力されることで、１次疑似サンプルデータｘ’_ｔの特徴量ｚ’_ｔが算出される。特徴量ｚ’_ｔがデコーダ８８に入力されることで、ソースデータセット３０に属するサンプルデータを模した２次疑似サンプルデータｘ”_ｓが算出される。

【0074】

一方、ターゲットデータセット５０に含まれるサンプルデータｘ_ｔがエンコーダ８６に入力されることで、サンプルデータｘ_ｔの特徴量ｚ_tが算出される。特徴量ｚ_tがデコーダ８８に入力されることで、ソースデータセット３０に属するサンプルデータに模した１次疑似サンプルデータｘ’_ｓが算出される。

【0075】

さらに、１次疑似サンプルデータｘ’_ｓがエンコーダ８２に入力されることで、１次疑似サンプルデータｘ’_ｓの特徴量ｚ’_ｓが算出される。特徴量ｚ’_ｓがデコーダ８４に入力されることで、ターゲットデータセット５０に属するサンプルデータを模した２次疑似サンプルデータｘ”_tが算出される。

【0076】

このような敵対的ネットワークである学習用ネットワーク８０は、以下のような手順（１－１），（１－２），（２－１），（２－２），（３－１），（３－２）で学習される。なお、手順（３－１），（３－２）の実行は任意である。

【0077】

（１－１）ソースデータセット３０に属するサンプルデータｘ_ｓと算出される２次疑似サンプルデータｘ”_ｓとの誤差を第１－１の損失関数とし、第１－１の損失関数の値が最小化するようにエンコーダ８２，８６およびデコーダ８４，８８のモデルパラメータを最適化する。

【0078】

（１－２）ターゲットデータセット５０に属するサンプルデータｘ_ｔと算出される２次疑似サンプルデータｘ”_tとの誤差を第１－２の損失関数とし、第１－２の損失関数の値が最小化するようにエンコーダ８２，８６およびデコーダ８４，８８のモデルパラメータを最適化する。

【0079】

（２－１）図示しない識別器（Discriminator）を用いて、ソースデータセット３０に属するサンプルデータｘ_ｓと１次疑似サンプルデータｘ’_ｓとを区別できることを第２－１の損失関数とし、第２－１の損失関数の値が最小化するように（すなわち、見分けがつかないように）、ｍｉｎｍａｘ戦略により、エンコーダ８２，８６およびデコーダ８４，８８のモデルパラメータを最適化する。

【0080】

（２－２）（２－１）と同様の識別器を用いて、ターゲットデータセット５０に属するサンプルデータｘ_ｔと１次疑似サンプルデータｘ’_ｔとを区別できることを第２－２の損失関数とし、第２－２の損失関数の値が最小化するように（すなわち、見分けがつかないように）、ｍｉｎｍａｘ戦略により、エンコーダ８２，８６およびデコーダ８４，８８のモデルパラメータを最適化する。

【0081】

ここで、同一性損失（identity loss）を損失関数として、さらにモデルパラメータを最適化してもよい。より具体的には、以下のような手順（３－１）および（３－２）で学習されてもよい。

【0082】

（３－１）ソースデータセット３０に含まれるサンプルデータｘ_ｓと、そのサンプルデータｘ_ｓをエンコーダ８６およびデコーダ８８に入力して算出される１次疑似サンプルデータｘ’_ｓとの間の誤差を第３－１の損失関数とし、第３－１の損失関数の値が最小化するようにエンコーダ８６およびデコーダ８８のモデルパラメータを最適化する。

【0083】

（３－２）ターゲットデータセット５０に含まれるサンプルデータｘ_ｔと、そのサンプルデータｘ_ｔをエンコーダ８２およびデコーダ８４に入力して算出される１次疑似サンプルデータｘ’_ｔとの間の誤差を第３－２の損失関数とし、第３－２の損失関数の値が最小化するようにエンコーダ８２およびデコーダ８４のモデルパラメータを最適化する。

【0084】

以上の手順によって、敵対的ネットワークである学習用ネットワーク８０の各モデルパラメータが最適化される。

【0085】

図６は、図５に示すｃｙｃｌｅＧＡＮによるエンコーダの構築を概念的に説明するための図である。図６を参照して、ソースデータセット３０およびターゲットデータセット５０を想定する。ソースデータセット３０とターゲットデータセット５０との間には、未知のバイアス（あるいは、未知のバイアス差）が存在している。

【0086】

【0087】

【0088】

ここで、ソースデータセット３０およびターゲットデータセット５０に含まれるサンプルデータのうち、第１の正解（ラベル）を推定値とするサンプルデータ３２とサンプルデータ５２とのペアが同じ特徴量６６となるように、エンコーダを学習する。

【0089】

同様に、ソースデータセット３０およびターゲットデータセット５０に含まれるサンプルデータのうち、第２の正解（ラベル）を推定値とするサンプルデータ３４とサンプルデータ５４とのペアが同じ特徴量６８となるように、エンコーダを学習する。

【0090】

すなわち、図５に示される学習用ネットワーク８０は、ソースデータセット３０に含まれるサンプルデータとターゲットデータセットに含まれるサンプルデータとのペアに着目して、一方のサンプルデータから出発して特徴量空間を経て他方の疑似サンプルデータ（１次疑似サンプルデータ）を算出するとともに、当該他方の疑似サンプルデータ（１次疑似サンプルデータ）から出発して特徴量空間を経て一方の疑似サンプルデータ（２次疑似サンプルデータ）を算出する。このような双方向の射影（すなわち、双方向の経路に沿った算出）によっても、いずれかのデータセットに含まれるサンプルデータと対応する２次疑似サンプルデータとが同一であることなどを目的として、敵対的な学習が実行される。

【0091】

このように、図５に示される学習用ネットワーク８０においては、同じ推定値となるペアを一致させることを目的にエンコーダを学習する。すなわち、同じ推定値となるサンプルデータｘ_ｓ～Ｘ_ｓとサンプルデータｘ_ｔ～Ｘ_ｔとが同じ特徴量ｚに射影されるようになることを目的にエンコーダを学習する。このような学習方法を採用することで、分布Ｐｒ（ｙ｜ｘ_ｓ～Ｘ_ｓ）と分布Ｐｒ（ｙ｜ｘ_ｔ～Ｘ_ｔ）との形状の一致を前提とすることなく、精度の高いエンコーダを構築できる。

【0092】

（ｄ４：改良学習用ネットワーク）
本願発明者らは、さらなる鋭意研究の結果、図５に示される学習用ネットワーク８０は、以下のような点においてさらなる改良が可能であることを見出した。

【0093】

図７は、本実施の形態に係るｃｙｃｌｅＧＡＮによりエンコーダを構築するための学習用ネットワーク９０の一例を示す模式図である。図７を参照して、学習用ネットワーク９０は、一種の敵対的ネットワークであり、２種類のエンコーダとデコーダとの組を互いに組み合わせたものである。敵対的ネットワークである学習用ネットワーク９０により、推定モデル６０を生成する。

【0094】

より具体的には、学習用ネットワーク９０は、エンコーダ９２とデコーダ９４との組（エンコーダ・デコーダ）、および、エンコーダ９６とデコーダ９８との組（エンコーダ・デコーダ）を含む。

【0095】

図７に示す学習用ネットワーク９０は、図５に示す学習用ネットワーク８０に比較して、エンコーダ９２，９６が２種類の特徴量ｚおよび特徴量ζを出力する点が異なっている。エンコーダ９２，９６によるエンコード結果を２種類の特徴量ｚおよび特徴量ζとしたのは、以下のような理由による。

【0096】

変数ａから変数ｂを推定する問題を、変数ｂを教師データとして学習した場合、本来的に変数ａと変数ｂとの間の依存関係の有無にかかわらず、変数ａは変数ｂに依存するようになる。図５に示す学習用ネットワーク８０についてみれば、特徴量ｚは、ソースドメインおよびターゲットドメインの別によらず、同じ値をもつべきであるが、実際には、特徴量ｚからサンプルデータｘ_ｓおよびサンプルデータｘ_ｔを予測する部分があるため、予測経路に応じて、サンプルデータｘ_ｓまたはサンプルデータｘ_ｔに依存してしまう。

【0097】

そのため、この依存関係を保持する特徴量ζと、予測経路に非依存な特徴量ｚとに分離することで、全体としてみた（ｚ，ζ）はドメインに依存するものの、特徴量ｚ単体ではドメイン非依存にすることができる。これによって、以下に説明するような第４－１および第４－２の損失関数の最小化においてドメイン非依存を実現できる。

【0098】

言い換えれば、特徴量ζがコンテンツの情報を示し、特徴量ｚがドメイン別の情報を示すと考えることもできる。

【0099】

このように、エンコーダ９２，９６は、サンプルデータから、ソースデータセット３０およびターゲットデータセット５０に非依存の特徴量ｚ（特徴量ｚ_ｓおよびｚ_ｔ）、および、ソースデータセット３０またはターゲットデータセット５０に依存する特徴量ζを算出する。

【0100】

そして、ソースデータセット３０に含まれるサンプルデータｘ_ｓと、ターゲットデータセット５０に含まれる、サンプルデータｘ_ｓとに付与されている正解と同じ正解が付与されるべき（すなわち、同じ推定値となる）サンプルデータｘ_ｔとのペアについて、サンプルデータｘ_ｓおよびサンプルデータｘ_ｔのいずれからも同じ特徴量ｚ（非依存の特徴量ｚ_ｓおよびｚ_ｔ）が算出されるように、エンコーダ９２，９６を学習する。

【0101】

すなわち、同じ推定値となるサンプルデータｘ_ｓ～Ｘ_ｓとサンプルデータｘ_ｔ～Ｘ_ｔとが同じ特徴量ｚ（非依存の特徴量ｚ_ｓおよびｚ_ｔ）に射影されるようになることを目的にエンコーダを学習する。

【0102】

このように、学習用ネットワーク９０においては、ソースデータセット３０およびターゲットデータセット５０に非依存の特徴量ｚ（特徴量ｚ_ｓおよびｚ_ｔ）に着目して、モデルパラメータを最適化する。

【0103】

【0104】

学習用ネットワーク９０を用いた学習においては、ソースデータセット３０に含まれるサンプルデータｘ_ｓは、エンコーダ９２とデコーダ９４との組（第１のエンコーダ・デコーダ）、および、エンコーダ９６とデコーダ９８との組（第２のエンコーダ・デコーダ）の順で配置されたネットワーク（第１のネットワーク）に入力される。

【0105】

一方、ターゲットデータセット５０に含まれるサンプルデータｘ_ｔは、エンコーダ９６とデコーダ９８との組（第２のエンコーダ・デコーダ）、および、エンコーダ９２とデコーダ９４との組（第１のエンコーダ・デコーダ）の順で配置されたネットワーク（第２のネットワーク）に入力される。

【0106】

図７に示す敵対的ネットワークである学習用ネットワーク９０は、以下のような手順（１－１），（１－２），（２－１），（２－２），（３－１），（３－２），（４－１），（４－２），（５）で学習される。なお、手順（３－１），（３－２）の実行は任意である。

【0107】

（１－１）ソースデータセット３０に属するサンプルデータｘ_ｓと算出される２次疑似サンプルデータｘ”_ｓとの誤差を第１－１の損失関数とし、第１－１の損失関数の値が最小化するようにエンコーダ９２，９６およびデコーダ９４，９８のモデルパラメータを最適化する。

【0108】

（１－２）ターゲットデータセット５０に属するサンプルデータｘ_ｔと算出される２次疑似サンプルデータｘ”_tとの誤差を第１－２の損失関数とし、第１－２の損失関数の値が最小化するようにエンコーダ９２，９６およびデコーダ９４，９８のモデルパラメータを最適化する。

【0109】

（２－１）図示しない識別器を用いて、ソースデータセット３０に属するサンプルデータｘ_ｓと１次疑似サンプルデータｘ’_ｓとを区別できることを第２－１の損失関数とし、第２－１の損失関数の値が最小化するように（すなわち、見分けがつかないように）、ｍｉｎｍａｘ戦略により、エンコーダ９２，９６およびデコーダ９４，９８のモデルパラメータを最適化する。

【0110】

（２－２）（２－１）と同様の識別器を用いて、ターゲットデータセット５０に属するサンプルデータｘ_ｔと１次疑似サンプルデータｘ’_ｔとを区別できることを第２－２の損失関数とし、第２－２の損失関数の値が最小化するように（すなわち、見分けがつかないように）、ｍｉｎｍａｘ戦略により、エンコーダ９２，９６およびデコーダ９４，９８のモデルパラメータを最適化する。

【0111】

【0112】

（３－１）ソースデータセット３０に含まれるサンプルデータｘ_ｓと、そのサンプルデータｘ_ｓをエンコーダ９６およびデコーダ９８に入力して算出される１次疑似サンプルデータｘ’_ｓとの間の誤差を第３－１の損失関数とし、第３－１の損失関数の値が最小化するようにエンコーダ９６およびデコーダ９８のモデルパラメータを最適化する。

【0113】

（３－２）ターゲットデータセット５０に含まれるサンプルデータｘ_ｔと、そのサンプルデータｘ_ｔをエンコーダ９２およびデコーダ９４に入力して算出される１次疑似サンプルデータｘ’_ｔとの間の誤差を第３－２の損失関数とし、第３－２の損失関数の値が最小化するようにエンコーダ９２およびデコーダ９４のモデルパラメータを最適化する。

【0114】

次に、特徴量ｚに着目して学習される。

【0115】

（４－１）ソースデータセット３０に属するサンプルデータｘ_ｓについて、エンコーダ９２から出力される特徴量ｚ_ｓと、後段にあるエンコーダ９６から出力される疑似特徴量ｚ’_ｔとの誤差を第４－１の損失関数とし、第４－１の損失関数の値が最小化するようにエンコーダ９２，９６およびデコーダ９４，９８のモデルパラメータを最適化する。

【0116】

（４－２）ターゲットデータセット５０に属するサンプルデータｘ_ｔについて、エンコーダ９６から出力される特徴量ｚ_ｔと、後段にあるエンコーダ９２から出力される疑似特徴量ｚ’_ｓとの誤差を第４－２の損失関数とし、第４－２の損失関数の値が最小化するようにエンコーダ９２，９６およびデコーダ９４，９８のモデルパラメータを最適化する。

【0117】

さらに、主目的識別器６４についての学習が行われる。

【0118】

（５）ソースデータセット３０に属するサンプルデータｘ_ｓについて、エンコーダ９２から出力される特徴量ｚ_ｓを主目的識別器６４に入力して出力される推定値ｙと、サンプルデータｘ_ｓの正解ｙ_ｓとの誤差を第５の損失関数とし、第５の損失関数の値が最小化するようにエンコーダ９２および主目的識別器６４のモデルパラメータを最適化する。このように、エンコーダ９２から出力される特徴量ｚ_ｓが入力される主目的識別器６４を、ソースデータセット３０に含まれるサンプルデータｘ_ｓおよび対応する正解に基づいて学習する。

【0119】

なお、ターゲットデータセット５０に含まれるサンプルデータｘ_ｔのうち正解が付与されているものを利用して、処理（５）を実行してもよい。すなわち、主目的識別器６４は、各データセット（ソースデータセット３０および／またはターゲットデータセット５０）に含まれるサンプルデータおよび対応する正解に基づいて学習してもよい。

【0120】

図８は、図７に示される学習用ネットワーク９０を利用した主目的識別器６４を構築する方法の一例を示す模式図である。図８を参照して、処理（５）は、エンコーダ９２および主目的識別器６４に着目して実行される。

【0121】

以上の手順によって、敵対的ネットワークである学習用ネットワーク９０の各モデルパラメータが最適化される。

【0122】

図９は、図７に示される学習用ネットワーク９０を利用して構築されたエンコーダの運用フェーズでのネットワークの一例を示す模式図である。図９を参照して、運用フェーズにおいては、エンコーダ９６および主目的識別器６４からなるネットワークが推定モデルとして用いられる。すなわち、エンコーダ９６に任意のサンプルデータｘを入力して算出される特徴量ｚ（特徴量ζは使用しない）を主目的識別器６４に入力することで、推定値ｙが算出される。

【0123】

図１０は、本実施の形態に係る推定モデルを生成するための処理手順を示すフローチャートである。図１０に示す各ステップは、典型的には、プロセッサ１０２が機械学習プログラム１１４を実行することで実現される（図３参照）。

【0124】

図１０を参照して、ソースデータセット３０およびターゲットデータセット５０が用意される（ステップＳ１００）。

【0125】

プロセッサ１０２は、図７に示される学習用ネットワーク９０を構成するエンコーダ９２，９６およびデコーダ９４，９８のモデルパラメータを初期化する（ステップＳ１０２）。そして、プロセッサ１０２は、以下のようなモデルパラメータの最適化処理を実行する。

【0126】

プロセッサ１０２は、ソースデータセット３０に属するサンプルデータｘ_ｓと算出される２次疑似サンプルデータｘ”_ｓとの誤差を最小化するようにエンコーダ９２，９６およびデコーダ９４，９８のモデルパラメータを最適化する（ステップＳ１０４）。また、プロセッサ１０２は、ターゲットデータセット５０に属するサンプルデータｘ_ｔと算出される２次疑似サンプルデータｘ”_tとの誤差を最小化するようにエンコーダ９２，９６およびデコーダ９４，９８のモデルパラメータを最適化する（ステップＳ１０６）。

【0127】

プロセッサ１０２は、ステップＳ１０４およびＳ１０６の最適化処理が予め定められた回数だけ繰り返し実行されたか否かを判断する（ステップＳ１０８）。ステップＳ１０４およびＳ１０６の最適化処理が予め定められた回数だけ繰り返し実行されていなければ（ステップＳ１０８においてＮＯ）、ステップＳ１０４およびＳ１０６の処理が繰り返される。

【0128】

ステップＳ１０４およびＳ１０６の最適化処理が予め定められた回数だけ繰り返し実行されていれば（ステップＳ１０８においてＹＥＳ）、プロセッサ１０２は、識別器を用いて、ソースデータセット３０に属するサンプルデータｘ_ｓと１次疑似サンプルデータｘ’_ｓとの間で見分けがつかないように、エンコーダ９２，９６およびデコーダ９４，９８のモデルパラメータを最適化する（ステップＳ１１０）。また、プロセッサ１０２は、識別器を用いて、ターゲットデータセット５０に属するサンプルデータｘ_ｔと１次疑似サンプルデータｘ’_ｔとの間で見分けがつかないように、エンコーダ９２，９６およびデコーダ９４，９８のモデルパラメータを最適化する（ステップＳ１１２）。

【0129】

プロセッサ１０２は、ステップＳ１１０およびＳ１１２の最適化処理が予め定められた回数だけ繰り返し実行されたか否かを判断する（ステップＳ１１４）。ステップＳ１１０およびＳ１１２の最適化処理が予め定められた回数だけ繰り返し実行されていなければ（ステップＳ１１４においてＮＯ）、ステップＳ１１０およびＳ１１２の処理が繰り返される。

【0130】

ステップＳ１１０およびＳ１１２の最適化処理が予め定められた回数だけ繰り返し実行されていれば（ステップＳ１１４においてＹＥＳ）、プロセッサ１０２は、ソースデータセット３０に含まれるサンプルデータｘ_ｓと、そのサンプルデータｘ_ｓをエンコーダ９６およびデコーダ９８に入力して算出される１次疑似サンプルデータｘ’_ｓとの間の誤差を最小化するようにエンコーダ９６およびデコーダ９８のモデルパラメータを最適化する（ステップＳ１１６）。また、プロセッサ１０２は、ターゲットデータセット５０に含まれるサンプルデータｘ_ｔと、そのサンプルデータｘ_ｔをエンコーダ９２およびデコーダ９４に入力して算出される１次疑似サンプルデータｘ’_ｔとの間の誤差を最小化するようにエンコーダ９２およびデコーダ９４のモデルパラメータを最適化する（ステップＳ１１８）。

【0131】

プロセッサ１０２は、ステップＳ１１６およびＳ１１８の最適化処理が予め定められた回数だけ繰り返し実行されたか否かを判断する（ステップＳ１２０）。ステップＳ１１６およびＳ１１８の最適化処理が予め定められた回数だけ繰り返し実行されていなければ（ステップＳ１２０においてＮＯ）、ステップＳ１１６およびＳ１１８の処理が繰り返される。

【0132】

ステップＳ１１６およびＳ１１８の最適化処理が予め定められた回数だけ繰り返し実行されていれば（ステップＳ１２０においてＹＥＳ）、プロセッサ１０２は、ソースデータセット３０に属するサンプルデータｘ_ｓについて、エンコーダ９２から出力される特徴量ｚ_ｓと、後段にあるエンコーダ９６から出力される疑似特徴量ｚ’_ｔとの誤差を最小化するようにエンコーダ９２，９６およびデコーダ９４，９８のモデルパラメータを最適化する（ステップＳ１２２）。また、プロセッサ１０２は、ターゲットデータセット５０に属するサンプルデータｘ_ｔについて、エンコーダ９６から出力される特徴量ｚ_ｔと、後段にあるエンコーダ９２から出力される疑似特徴量ｚ’_ｓとの誤差を最小化するようにエンコーダ９２，９６およびデコーダ９４，９８のモデルパラメータを最適化する（ステップＳ１２４）。

【0133】

プロセッサ１０２は、ステップＳ１２２およびＳ１２４の最適化処理が予め定められた回数だけ繰り返し実行されたか否かを判断する（ステップＳ１２６）。ステップＳ１２２およびＳ１２４の最適化処理が予め定められた回数だけ繰り返し実行されていなければ（ステップＳ１２６においてＮＯ）、ステップＳ１２２およびＳ１２４の処理が繰り返される。

【0134】

ステップＳ１２２およびＳ１２４の最適化処理が予め定められた回数だけ繰り返し実行されていれば（ステップＳ１２６においてＹＥＳ）、プロセッサ１０２は、ソースデータセット３０に属するサンプルデータｘ_ｓについて、エンコーダ９２から出力される特徴量ｚ_ｓを主目的識別器６４に入力して出力される推定値ｙと、サンプルデータｘ_ｓの正解ｙ_ｓとの誤差を最小化するようにエンコーダ９２および主目的識別器６４のモデルパラメータを最適化する（ステップＳ１２８）。

【0135】

プロセッサ１０２は、ステップＳ１２８の最適化処理が予め定められた回数だけ繰り返し実行されたか否かを判断する（ステップＳ１３０）。ステップＳ１２８の最適化処理が予め定められた回数だけ繰り返し実行されていなければ（ステップＳ１３０においてＮＯ）、ステップＳ１２８の処理が繰り返される。

【0136】

ステップＳ１２８の最適化処理が予め定められた回数だけ繰り返し実行されていれば（ステップＳ１３０においてＹＥＳ）、プロセッサ１０２は、エンコーダ９６および主目的識別器６４からなるネットワークが推定モデルとして出力する（ステップＳ１３２）。

【0137】

以上により、推定モデルの生成処理は終了する。そして、生成された推定モデルを用いた推定処理の運用が可能となる。

【0138】

（ｄ５：モデルパラメータの共有）
推定モデル４０（学習用ネットワーク９０）のモデルパラメータの一部を共有してもよい。

【0139】

図１１は、本実施の形態に係る推定モデルにおけるモデルパラメータ共有の一例を説明するための図である。図１１を参照して、例えば、エンコーダ９２とデコーダ９４との組（エンコーダ・デコーダ）、および、エンコーダ９６とデコーダ９８との組（エンコーダ・デコーダ）の間で、特徴量ζの算出に係るモデルパラメータを共有してもよい。なお、説明の便宜上、特徴量ｚの算出に係る部分は図示していない。

【0140】

図１１（Ａ）に示す例においては、エンコーダ９２とエンコーダ９６との間でモデルパラメータの一部が共有されている。

【0141】

より具体的には、エンコーダ９２は、入力側の内部処理を規定する共有パラメータ９２１と、出力側の内部処理を規定する個別パラメータ９２２とを含む。同様に、エンコーダ９６は、入力側の内部処理を規定する共有パラメータ９６１と、出力側の内部処理を規定する個別パラメータ９６２とを含む。

【0142】

エンコーダ９２およびエンコーダ９６をニューラルネットワークで構成した場合には、個別パラメータ９２２および個別パラメータ９６２は、最終層における特徴量ζ（ζ_ｓ，ζ_ｔ）の出力を規定する部分に相当する。個別パラメータ９２２および個別パラメータ９６２は、エンコーダ９２およびエンコーダ９６でそれぞれ個別の値を有している。一方、入力側の共有パラメータ９２１および共有パラメータ９６１は、互いに共有されている。

【0143】

また、図１１（Ａ）に示す例において、デコーダ９４とデコーダ９８との間でもモデルパラメータの一部が共有されていてもよい。

【0144】

より具体的には、デコーダ９４は、入力側の内部処理を規定する個別パラメータ９４１と、出力側の内部処理を規定する共有パラメータ９４２とを含む。同様に、デコーダ９８は、入力側の内部処理を規定する個別パラメータ９８１と、出力側の内部処理を規定する共有パラメータ９８２とを含む。

【0145】

デコーダ９４およびデコーダ９８をニューラルネットワークで構成した場合には、個別パラメータ９４１および個別パラメータ９８１は、入力される特徴量ζ（ζ_ｓ，ζ_ｔ）の差異を吸収する部分に相当する。個別パラメータ９４１および個別パラメータ９８１は、デコーダ９４およびデコーダ９８でそれぞれ個別の値を有している。一方、出力側の共有パラメータ９４２および共有パラメータ９８は、互いに共有されている。

【0146】

図１１（Ｂ）に示す例においては、デコーダ９４とデコーダ９８との間で特徴量ζ（ζ_ｓ，ζ_ｔ）に関するモデルパラメータが共有されている。より具体的には、デコーダ９４は、共有パラメータ９４４を有しており、デコーダ９８は、共有パラメータ９８４を有している。共有パラメータ９４４および共有パラメータ９８４は、互いに共有されている。共有パラメータ９４４および共有パラメータ９８４は、特徴量ζ_ｓ，ζ_ｔのうちいずれか一方を受け取るように適合化されたものとなる。すなわち、図１１（Ｂ）に示す構成は、図１１（Ａ）に示す構成において、個別パラメータ９４１および個別パラメータ９８１についても互いに共有するように変形したものに相当する。

【0147】

このように、特徴量ζに関するモデルパラメータを共有することで、推定モデルの学習をより効率的に行うことができる。

【0148】

また、モデルパラメータを共有することで、特徴量ζ（ζ_ｓ，ζ_ｔ）の出力の決定に用いられる情報量を増加させることができる。その結果、同じ推定値ｙを有している入力について、同じ特徴量ｚを出力し易くなる。

【0149】

＜Ｅ．性能結果の実験例＞
次に、本実施の形態に係る推定モデルの性能結果の実験例について説明する。

【0150】

図１２は、本実施の形態に係る推定モデルの性能結果の実験例を説明するための模式図である。図１２に示す実験例においては、人物姿勢の推定タスクを対象とした。人物姿勢の推定タスクは、画像からの回帰タスクの一種である。

【0151】

具体的には、既知のモーションキャプチャデータセット３０２に含まれる任意の姿勢を、レンダリング（３０４）することで生成したＤｅｐｔｈ画像をソースデータセット３０８として用いた。各Ｄｅｐｔｈ画像には、人手で関節位置の正解３０６（ラベル）を付与した。Panoptic Segmentationタスクとしての推定結果は、入力された画像に含まれる関節位置の種類およびその位置となる。

【0152】

一方、ターゲットデータセット３１４は、立体視カメラ３１２でユーザ３１０を実際に撮像して得られたＤｅｐｔｈ画像により構成した。

【0153】

Panoptic Segmentationタスクに応じた推定モデルを構築した。

【0154】

図１３は、図１２に示す実験における性能評価の一例を示す図である。図１３に示す性能評価は、推定対象データを推定モデルに入力し、その入力された推定対象データに対する推定結果（関節位置）が正解に対して２次元空間内で１０ピクセル以内に位置している確率を示す。図１３に示す性能評価は、画像上でのずれ（2Dpose）を評価したものである。

【0155】

図１３に示す性能評価においては、非特許文献１に開示される「CyCADA」という手法をベースラインとした。図１３を参照して、本実施の形態に係る推定モデルは、ベースラインに比較して、いずれの部位についてもより高い推定精度を有していることが分かる。

【0156】

このように、本実施の形態に係る推定モデルおよびその学習方法を採用することによって、関連技術に比較して、より高い推定性能を実現できていることが分かる。

【0157】

＜Ｆ．変形例＞
（ｆ１：分散配置）
上述の実施の形態に係るロボットコントローラ１００が、ターゲットデータセット５０を収集する処理および推定モデル６０を生成する処理を実行する構成を例示したが、このような構成に限られず、任意の構成を採用できる。

【0158】

図１４は、本実施の形態に係る推定モデルを利用する推定システムの構成例を示す模式図である。

【0159】

図１４（Ａ）には、ロボットコントローラ１００がソースデータセット３０およびターゲットデータセット５０を収集する処理１５０と、推定モデル６０を生成する処理１６０と、推定モデル６０を用いた推定処理とを実行する構成例を示す。

【0160】

図１４（Ｂ）には、ロボットコントローラ１００とサーバなどの外部装置２５０とが連係する構成例を示す。この構成例においては、ロボットコントローラ１００がソースデータセット３０およびターゲットデータセット５０を収集する処理１５０と、推定モデル６０を用いた推定処理とを実行し、外部装置２５０が推定モデル６０を生成する処理１６０を実行する。

【0161】

図１４（Ｃ）にも、ロボットコントローラ１００とサーバなどの外部装置２５０とが連係する構成例を示す。この構成例においては、外部装置２５０がソースデータセット３０およびターゲットデータセット５０を収集する処理１５０と、推定モデル６０を生成する処理１６０とを実行し、ロボットコントローラ１００が推定モデル６０を用いた推定処理を実行する。

【0162】

なお、図１４には典型的ないくつかの構成例を示すものであり、本発明の技術的範囲は、これらの構成例に限定されるものではない。要求される要件、仕様および目的などに応じて、任意の実装形態を採用できる。

【0163】

（ｆ２：データセットおよび推定対象データ）
図１および図２に示すロボットシステムにおいては、シミュレーションにより生成された画像（ＣＧ画像）からソースデータセットを生成し、カメラで実際に撮像された画像（実写画像）からターゲットデータセットを生成する例を示すがこれに限られず、任意の情報をデータセットとして用いることができる。また、複数のソースデータセット、および／または、複数のターゲットデータセットを用いてもよい。

【0164】

例えば、ＣＧ画像および実写画像のいずれについても、２Ｄカラー画像（以下、「ＲＧＢ画像」とも称す。）およびＤｅｐｔｈ画像の両方または一方を生成または取得することもできる。この場合、ＣＧのＲＧＢ画像（正解が付与されている）からなる第１のソースデータセットと、ＣＧのＤｅｐｔｈ画像（正解が付与されている）からなる第２のソースデータセットとを用意できるとともに、実写のＲＧＢ画像（正解無し）からなる第１のターゲットデータセットと、実写のＤｅｐｔｈ画像（正解無し）からなる第２のソースデータセットとを用意できる。

【0165】

このようなソースデータセットおよびターゲットデータセットを用いて、推定対象データとして、実写のＲＧＢ画像またはＤｅｐｔｈ画像を入力して、認識結果を出力するような推定モデルを構築できる。

【0166】

さらに、ＲＧＢ情報およびＤｅｐｔｈ情報を含むＣＧの３Ｄ画像（正解が付与されている）からなる第３のソースデータセットと、実写の３Ｄ画像（正解無し）からなる第３のターゲットデータセットとを用意できる。

【0167】

なお、ソースデータセットに正解が付与されていないデータが含まれていてもよいし、ターゲットデータセットに正解が付与されているデータが含まれていてもよい。

【0168】

（ｆ３：多数のデータセットに応じた学習用ネットワーク）
より多くのソースデータセットおよびターゲットデータセットを用いる場合には、用いるデータセットの数に応じて、エンコーダとデコーダとの組（エンコーダ・デコーダ）を適宜増加させるとともに、任意のデータセット間で敵対的ネットワークを構成できるように、エンコーダ・デコーダ同士を接続した、学習用ネットワークを採用すればよい。

【0169】

（ｆ４：エンコーダ・デコーダのネットワーク構造）
エンコーダとデコーダとの組（エンコーダ・デコーダ）は、入力されるサンプルデータの次元数および含まれる情報の種類などに応じたデータ構造のネットワークを採用できる。そのため、ソースデータセットのサンプルデータが入力されるエンコーダ・デコーダとターゲットデータセットのサンプルデータが入力されるエンコーダ・デコーダとは、同一のネットワーク構造が採用されてもよいし、異なるネットワーク構造が採用されてもよい。

【0170】

例えば、ＲＧＢ画像が入力されるエンコーダ・デコーダと、Ｄｅｐｔｈ画像が入力されるエンコーダ・デコーダとは、画素毎のチャネル数が異なっているため、入力層をはじめとする各層での次元数などが異なったものとなる。あるいは、画像データからなるソースデータセットを用いるとともに、テキストデータからなるターゲットデータセットを用いる場合には、アルゴリズム自体を異ならせてもよい。具体的には、画像データが入力されるエンコーダ・デコーダにはＣＮＮを採用し、テキストデータが入力されるエンコーダ・デコーダにはＲＮＮあるいは１Ｄ－ＣＮＮなどを採用してもよい。

【0171】

＜Ｇ．応用例＞
上述の説明においては、シミュレーションにより生成された画像（ＣＧ画像）とカメラで実際に撮像された画像（実写画像）との間のバイアス差を吸収する例について説明したが、本実施の形態に係る推定モデルは、この実装例に限らず任意のアプリケーションに適用可能である。すなわち、「環境」あるいは「ドメイン」は、可能な限り広く解釈できる。

【0172】

任意のセンシングデバイスで観測される任意の情報は、観測条件や観測環境が異なっていても、本実施の形態に係る手法により適用が可能である。例えば、ＦＡ（Factory Automation）の技術分野においては、本実施の形態に係る学習方法を適用することで、適用先の工場や設備などの環境差を埋め合わせることができる。

【0173】

具体的な適用例としては、人手でアノテーションした画像データを用いて学習した欠陥検査モデルにおいて、現場で収集された正解ラベル（欠陥の有無）が付与されていない画像データをターゲットデータセットとして追加的に学習することで、当該現場に適応された欠陥検査モデルを生成してもよい。あるいは、ある製品を撮像し画像データ（正解ラベル付与）をソースデータセットとし、当該製品に比較して外観がわずかに変化しただけの同系統の製品を撮像した画像データをターゲットデータセットとして、当該同系統の製品にも適用可能な欠陥検査モデルを生成してもよい。

【0174】

また、本実施の形態に係る手法は、作業者の姿勢を推定する推定モデルを生成する場合にも適用できる。例えば、作業者の行動を把握しようとする場合に、その作業者の正面にカメラを配置することができない場合も多い。このような場合には、作業者の上方にカメラを配置して、その作業者を真上から撮像せざるを得ない。カメラを作業者の上方に配置した場合には、カメラの視野内に写らない作業者の関節の位置などを適切にアノテーションすることは難しい。しかしながら、本実施の形態に係る手法によれば、実際にカメラを配置した位置に対応する視野におけるＣＧ画像（ソースデータセット）を生成できるので、このように生成されたソースデータセットを用いて、姿勢推定モデルを生成することで、実際にカメラで撮像された画像から、作業者の姿勢を容易に推定できる。

【0175】

さらに、シミュレーションの結果をソースデータセットとして用いることで、現実には存在しないセンサを仮想的に実現することもできる。例えば、シミュレーションによって生成されたＣＧ画像に、画像内の座標系と位置合わせできた状態の力場データを正解ラベルとして付与したものをソースデータセットとする。また、カメラなどにより撮像された画像データ（観測データ）（正解ラベルなし）をターゲットドメインとする。このようなソースデータセットとターゲットデータセットとを用いて力場推定モデルを生成するとともに、任意のタイミングで撮像された画像データを推定対象データとして力場推定モデルに入力することで、任意の位置に生じる力場を推定できる。

【0176】

シミュレーションにおいては、物体同士が接触して、作用力・反作用力が生じている箇所について、生じている力を力場として表現することができる（このような力場を推定対象となる）。一方、このような力場を現実に測定することは困難である。

【0177】

本実施の形態に係る手法により生成された力場推定モデルを用いることで、従来は、画像のみでは観測できなかった力場を推定できるようになる。すなわち、現実には存在しないセンサを仮想的に実現することもできる。

【0178】

さらに、センシングデバイスで観測される物理的な情報だけではなく、例えば、ＥＣ（electronic commerce）サイトでの販売実績といった人為的な情報にも適用可能である。例えば、あるＥＣサイトでの販売実績に基づいて、他のＥＣサイトでの販売実績を推定するといったアプリケーションが想定される。

【0179】

このように、本実施の形態に係る学習方法およびその学習方法により生成される推定モデルの応用先は、現実の世界に存在する様々な観測可能な情報に適用できる。

【0180】

＜Ｈ．付記＞
上述したような本実施の形態は、以下のような技術思想を含む。
［構成１］
推定システム（１）であって、
正解が付与された複数のサンプルデータを含む第１のデータセット（３０）、および、正解が付与されていない複数のサンプルデータを含む第２のデータセット（５０）を用いて、推定モデル（６０）を生成する学習部（１０２；１１４）と、
前記第２のデータセットに属し得る推定対象データ（７０）を前記推定モデルに入力して、推定結果（６２）を決定する推定部（１０２；１１８）とを備え、
前記推定モデルは、サンプルデータから、前記第１のデータセットおよび前記第２のデータセットに非依存の第１の特徴量、および、前記第１のデータセットまたは前記第２のデータセットに依存する第２の特徴量、を算出するエンコーダ（９６）を含み、
前記学習部は、前記第１のデータセットに含まれる第１のサンプルデータと、前記第２のデータセットに含まれる、前記第１のサンプルデータに付与されている正解と同じ正解が付与されるべき第２のサンプルデータとのペアについて、前記第１のサンプルデータおよび前記第２のサンプルデータのいずれからも同じ第１の特徴量が算出されるように前記エンコーダを学習するように構成されている、推定システム。
［構成２］
前記学習部は、敵対的ネットワークである学習用ネットワーク（９０）により、前記推定モデルを生成するように構成されている、構成１に記載の推定システム。
［構成３］
前記学習用ネットワークは、
第１のエンコーダ（９２）および第１のデコーダ（９４）からなる第１のエンコーダ・デコーダと、
第２のエンコーダ（９６）および第２のデコーダ（９８）からなる第２のエンコーダ・デコーダとを含み、
前記学習部による学習において、
前記第１のデータセットに含まれるサンプルは、前記第１のエンコーダ・デコーダおよび前記第２のエンコーダ・デコーダの順で配置された第１のネットワーク（９２，９４，９６，９８）に入力され、
前記第２のデータセットに含まれるサンプルは、前記第２のエンコーダ・デコーダおよび前記第１のエンコーダ・デコーダの順で配置された第２のネットワーク（９６，９８，９２，９４）に入力される、構成２に記載の推定システム。
［構成４］
前記学習部は、
前記第１のデータセットに含まれるサンプルを第１のネットワークに入力することで、前記第１のエンコーダから出力される前記第１の特徴量と、前記第２のエンコーダから出力される第１の疑似特徴量との誤差が最小化するように、前記第１のエンコーダ、前記第１のデコーダ、前記第２のエンコーダおよび前記第２のデコーダのモデルパラメータを最適化するように構成されており、
前記第２のデータセットに含まれるサンプルを第２のネットワークに入力することで、前記第２のエンコーダから出力される前記第１の特徴量と、前記第１のエンコーダから出力される第１の疑似特徴量との誤差が最小化するように、前記第１のエンコーダ、前記第１のデコーダ、前記第２のエンコーダおよび前記第２のデコーダのモデルパラメータを最適化するように構成されている、構成３に記載の推定システム。
［構成５］
前記学習部は、前記エンコーダからの出力が入力される識別器（６４）を、前記第１のデータセットに含まれるサンプルデータおよび対応する正解に基づいて学習するようにさらに構成されており、
前記推定モデルは、前記識別器をさらに含む、構成１～４のいずれか１項に記載の推定システム。
［構成６］
正解が付与された複数のサンプルデータを含む第１のデータセット（３０）、および、正解が付与されていない複数のサンプルデータを含む第２のデータセット（５０）を用いた学習によって生成された推定モデル（６０）を保持する記憶部（１１０）と、
前記第２のデータセットに属し得る推定対象データ（７０）を前記推定モデルに入力して、推定結果（６２）を決定する推定部（１０２；１１８）とを備え、
前記推定モデルは、サンプルデータから、前記第１のデータセットおよび前記第２のデータセットに非依存の第１の特徴量、および、前記第１のデータセットまたは前記第２のデータセットに依存する第２の特徴量、を算出するエンコーダ（９６）を含み、
前記エンコーダは、前記第１のデータセットに含まれる第１のサンプルデータと、前記第２のデータセットに含まれる、前記第１のサンプルデータに付与されている正解と同じ正解が付与されるべき第２のサンプルデータとのペアについて、前記第１のサンプルデータおよび前記第２のサンプルデータのいずれからも同じ第１の特徴量が算出されるように学習されている、推定装置。
［構成７］
正解が付与された複数のサンプルデータを含む第１のデータセット（３０）、および、正解が付与されていない複数のサンプルデータを含む第２のデータセット（５０）を用いて、推定モデル（６０）を生成するステップと、
前記第２のデータセットに属し得る推定対象データ（７０）を前記推定モデルに入力して、推定結果（６２）を決定するステップとを備え、
前記推定モデルは、サンプルデータから、前記第１のデータセットおよび前記第２のデータセットに非依存の第１の特徴量、および、前記第１のデータセットまたは前記第２のデータセットに依存する第２の特徴量、を算出するエンコーダ（９６）を含み、
前記推定モデルを生成するステップは、前記第１のデータセットに含まれる第１のサンプルデータと、前記第２のデータセットに含まれる、前記第１のサンプルデータに付与されている正解と同じ正解が付与されるべき第２のサンプルデータとのペアについて、前記第１のサンプルデータおよび前記第２のサンプルデータのいずれからも同じ第１の特徴量が算出されるように前記エンコーダを学習するステップを含む、推定方法。

【0181】

＜Ｉ．効果＞
本実施の形態によれば、より推定性能を高めた学習済みモデルを生成できる。

【0182】

今回開示された実施の形態はすべての点で例示であって制限的なものではないと考えられるべきである。本発明の範囲は、上記した説明ではなく、特許請求の範囲によって示され、特許請求の範囲と均等の意味および範囲内でのすべての変更が含まれることが意図される。

【符号の説明】

【0183】

１ロボットシステム、２ロボット、４軸、６ハンド、８ワーク、１２サーボドライバ、１４モータ、２０カメラ、３０，３０８ソースデータセット、３２，３４，５２，５４サンプルデータ、３６，５６，５８領域、４０，６０推定モデル、５０，３１４ターゲットデータセット、５３，５５射影サンプルデータ、６２推定結果、６４主目的識別器、６６，６８特徴量、７０推定対象データ、８０，９０学習用ネットワーク、８２，８６，９２，９６エンコーダ、８４，８８，９４，９８デコーダ、１００ロボットコントローラ、１０２プロセッサ、１０４メインメモリ、１１０ストレージ、１１４機械学習プログラム、１１６モデルパラメータ、１１８制御アプリケーション、１２２通信インターフェイス、１２４入力部、１２６出力部、１２８カメラインターフェイス、１３０モータインターフェイス、１５０，１６０処理、２００シミュレーション装置、２５０外部装置、３０２モーションキャプチャデータセット、３０６正解、３１０ユーザ、３１２立体視カメラ、９２１，９４２，９４４，９６１，９８２，９８４共有パラメータ、９２２，９４１，９６２，９８１個別パラメータ。

【図1】