特開2023-138274 | 知財ポータル「IP Force」

知財求人 - 知財ポータルサイト「IP Force」

▶ 株式会社リコーの特許一覧

特開2023-138274対話型機械学習システム、対話型機械学習方法、およびプログラム

書誌要約請求の範囲詳細な説明課題実施例実施するための形態図面の説明

目に優しい文字サイズ小中大 PDF Top

< >

1a
1b
2
3
4
5
6
7
8
9
10
11
12
13
14
15
16
17
18
19
20
21
22
23
24
25
26
27
28
29
30
31

(19)【発行国】日本国特許庁(JP)

(12)【公報種別】公開特許公報(A)

(11)【公開番号】P2023138274

(43)【公開日】2023-10-02

(54)【発明の名称】対話型機械学習システム、対話型機械学習方法、およびプログラム

(51)【国際特許分類】

G06N 20/00 20190101AFI20230922BHJP

【ＦＩ】

G06N20/00

【審査請求】未請求

【請求項の数】13

【出願形態】ＯＬ

(21)【出願番号】P 2022179870

(22)【出願日】2022-11-09

(31)【優先権主張番号】P 2022042669

(32)【優先日】2022-03-17

(33)【優先権主張国・地域又は機関】JP

(71)【出願人】

【識別番号】000006747

【氏名又は名称】株式会社リコー

(74)【代理人】

【識別番号】110002147

【氏名又は名称】弁理士法人酒井国際特許事務所

(72)【発明者】

【氏名】田中伶実

(72)【発明者】

【氏名】平野成伸

(72)【発明者】

【氏名】原島正豪

(57)【要約】

【課題】人間の均等知覚空間を効率的に取得することができる対話型機械学習システム、対話型機械学習方法、およびプログラムを提供する。
【解決手段】本発明は、主観評価用の入力データのデータ空間を、均等知覚空間としての潜在空間に変換する特徴抽出構造を学習する学習モデル部と、前記均等知覚空間に変換された前記入力データから、評価用データをサンプリングするサンプリング部と、前記評価用データを人間が評価する評価用ＵＩを提示する評価用ＵＩ部と、を備え、前記学習モデル部は、前記評価用ＵＩによる前記評価用データの評価結果を前記入力データとして、前記特徴抽出構造を学習する。
【選択図】図１ａ

【特許請求の範囲】

【請求項1】

主観評価用の入力データのデータ空間を、均等知覚空間としての潜在空間に変換する特徴抽出構造を学習する学習モデル部と、
前記均等知覚空間に変換された前記入力データから、評価用データをサンプリングするサンプリング部と、
前記評価用データを人間が評価する評価用ＵＩを提示する評価用ＵＩ部と、を備え、
前記学習モデル部は、前記評価用ＵＩによる前記評価用データの評価結果を前記入力データとして、前記特徴抽出構造を学習する、対話型機械学習システム。

【請求項2】

前記学習モデル部は、特徴抽出構造を有するEncoder部と、前記均等知覚空間に変換された前記データを前記データ空間に変換するDecoder部と、を有するAuto-Encoder構造を有する、請求項１に記載の対話型機械学習システム。

【請求項3】

前記サンプリング部は、前記均等知覚空間としての潜在空間における格子点と、前記データ空間における弁別距離に基づくその周辺点と、を前記評価用データとしてサンプリングする、請求項２に記載の対話型機械学習システム。

【請求項4】

前記学習モデル部は、前記入力データの各座標が前記データ空間中で持つ弁別楕円を記憶し、
前記サンプリング部は、前記格子点と、当該格子点が持つ前記弁別楕円中の点を前記周辺点と、を前記評価用データとしてサンプリングする、請求項３に記載の対話型機械学習システム。

【請求項5】

前記学習モデル部は、前記入力データの各座標の前記潜在空間における弁別楕円を記憶し、
前記サンプリング部は、前記格子点と、当該格子点が持つ前記弁別楕円中の点を前記周辺点と、を前記評価用データとしてサンプリングする、請求項３に記載の対話型機械学習システム。

【請求項6】

前記評価用ＵＩ部は、弁別評価または一対比較評価により前記評価用データを評価する前記評価用ＵＩを提示する、請求項４に記載の対話型機械学習システム。

【請求項7】

前記学習モデル部は、前記評価用ＵＩ部による前記評価用データの評価結果に基づいて、前記均等知覚空間において前記周辺点が正円化されるよう前記弁別楕円を更新する、請求項６に記載の対話型機械学習システム。

【請求項8】

前記学習モデル部は、前記弁別楕円を記憶する学習ステップと、前記弁別楕円に基づいて前記均等知覚空間を更新する学習ステップと、を別々に有する、請求項４または５に記載の対話型機械学習システム。

【請求項9】

前記特徴抽出構造の学習進度としての損失関数が所定基準を満たした場合、前記学習モデル部における前記特徴抽出構造の学習を終了させる終了判定部をさらに備える請求項１に記載の対話型機械学習システム。

【請求項10】

前記入力データは、画像であり、
前記学習モデル部は、前記画像の属性に基づいて前記潜在空間を整列化する、請求項１に記載の対話型機械学習システム。

【請求項11】

前記学習モデル部は、前記弁別楕円の内側と外側の差に基づいて、前記特徴抽出構造の学習を収束する、請求項４に記載の対話型機械学習システム。

【請求項12】

対話型機械学習システムで実行される対話型機械学習方法であって、
主観評価用の入力データのデータ空間を、均等知覚空間としての潜在空間に変換する特徴抽出構造を学習するステップと、
前記均等知覚空間に変換された前記入力データから、評価用データをサンプリングするステップと、
前記評価用データを人間が評価する評価用ＵＩを提示するステップと、
前記評価用ＵＩによる前記評価用データの評価結果を前記入力データとして、前記特徴抽出構造を学習するステップと、
を含む対話型機械学習方法。

【請求項13】

コンピュータを、
主観評価用の入力データのデータ空間を、均等知覚空間としての潜在空間に変換する特徴抽出構造を学習する学習モデル部と、
前記均等知覚空間に変換された前記入力データから、評価用データをサンプリングするサンプリング部と、
前記評価用データを人間が評価する評価用ＵＩを提示する評価用ＵＩ部と、して機能させ、
前記学習モデル部は、前記評価用ＵＩによる前記評価用データの評価結果を前記入力データとして、前記特徴抽出構造を学習する、プログラム。

【発明の詳細な説明】

【技術分野】

【0001】

本発明は、対話型機械学習システム、対話型機械学習方法、およびプログラムに関する。

【背景技術】

【0002】

人間と機械学習アルゴリズム間の効率的な協調を創出することにより、より良いユーザエクスペリエンスおよびより効果的な学習機構を目指す対話型機械学習システムが開示されている（非特許文献７，８参照）。

【発明の概要】

【発明が解決しようとする課題】

【0003】

ところで、上記の対話型機械学習システムには、主観評価に能動学習を適用することにより、弁別評価および一対比較評価のような簡単な評価方法を用いながら、効率的に均等知覚空間を取得することが求められている。

【0004】

本発明は、上記に鑑みてなされたものであって、人間の均等知覚空間を効率的に取得することができる対話型機械学習システム、対話型機械学習方法、およびプログラムを提供することを目的とする。

【課題を解決するための手段】

【0005】

上述した課題を解決し、目的を達成するために、本発明は、主観評価用の入力データのデータ空間を、均等知覚空間としての潜在空間に変換する特徴抽出構造を学習する学習モデル部と、前記均等知覚空間に変換された前記入力データから、評価用データをサンプリングするサンプリング部と、前記評価用データを人間が評価する評価用ＵＩを提示する評価用ＵＩ部と、を備え、前記学習モデル部は、前記評価用ＵＩによる前記評価用データの評価結果を前記入力データとして、前記特徴抽出構造を学習する。

【発明の効果】

【0006】

本発明によれば、人間の均等知覚空間を効率的に取得することができる、という効果を奏する。

【図面の簡単な説明】

【0007】

【図1a】図１ａは、本実施の形態にかかる対話型機械学習システムの全体像の一例を示す図である。

【図1b】図１ｂは、本実施の形態にかかる対話型機械学習システムのブロック図である。

【図2】図２は、本実施の形態にかかる対話型機械学習システムの機能ブロック図である。

【図3】図３は、本実施の形態にかかる対話型機械学習システムの機能ブロック図である。

【図4】図４は、第１の実施の形態にかかる対話型機械学習システムの主要部の構成を示したブロック図である。

【図5】図５は、第１の実施の形態にかかる対話型機械学習システムの機能ブロック図である。

【図6】図６は、第１の実施の形態にかかる対話型機械学習システムの学習モデル部が有するAuto-Encoder構造の一例を説明するための図である。

【図7】図７は、第１の実施の形態にかかる対話型機械学習システムにおける学習モデル部の損失関数の定義に用いる変数の一例を説明するための図である。

【図8】図８は、第１の実施の形態にかかる対話型機械学習システムにおける学習モデル部の損失関数の定義に用いる変数の一例を説明するための図である。

【図9】図９は、第１の実施の形態にかかる対話型機械学習システムの弁別評価部により提示される評価用ＵＩの一例を示す図である。

【図10】図１０は、第１の実施の形態にかかる対話型機械学習システムにおける検証用のデータの一例を説明するための図である。

【図11】図１１は、第２の実施の形態にかかる対話型機械学習システムの一対比較評価における評価用ＵＩの例を示す図である。

【図12】図１２は、第３の実施の形態にかかる対話型機械学習システムの主要部の構成を示したブロック図である。

【図13】図１３は、第３の実施の形態にかかる対話型機械学習システムの機能ブロック図である。

【図14】図１４は、第３の実施の形態にかかる対話型機械学習システムの学習モデル部の損失関数の定義に用いる変数の一例を説明するための図である。

【図15】図１５は、第３の実施の形態にかかる対話型機械学習システムの学習モデル部の損失関数の定義に用いる変数の一例を説明するための図である。

【図16】図１６は、第４の実施の形態にかかる対話型機械学習システムの主要部の構成を示したブロック図である。

【図17】図１７は、第４の実施の形態にかかる対話型機械学習システムの機能ブロック図である。

【図18】図１８は、第４の実施の形態にかかる対話型機械学習システムの圧縮モデルの構成の一例を示す図である。

【図19】図１９は、第４の実施の形態にかかる対話型機械学習システムの表現モデルの構成の一例を示す図である。

【図20】図２０は、第５の実施の形態にかかる対話型機械学習システムの主要部の構成を示したブロック図である。

【図21】図２１は、第５の実施の形態にかかる対話型機械学習システムの機能ブロック図である。

【図22】図２２は、第５の実施の形態にかかる対話型機械学習システムにおける学習モデル部の損失関数の定義に用いる変数の一例を説明するための図である。

【図23】図２３は、第５の実施の形態にかかる対話型機械学習システムにおける学習モデル部の損失関数の定義に用いる変数の一例を説明するための図である。

【図24】図２４は、第６の実施の形態にかかる対話型機械学習システムの主要部の構成の一例を示したブロック図である。

【図25】図２５は、第６の実施の形態にかかる対話型機械学習システムの機能ブロック図である。

【図26】図２６は、第６の実施の形態にかかる対話型機械学習システムの圧縮モデルの構成の一例を示す図である。

【図27】図２７は、第６の実施の形態にかかる対話型機械学習システムの表現モデルの構成の一例を示す図である。

【図28】図２８は、第７の実施の形態にかかる対話型機械学習システムにおける学習機能の一例を説明するための図である。

【図29】図２９は、第９の実施の形態にかかる対話型機械学習システムにおける処理の一例を説明するための図である。

【図30】図３０は、第１０の実施の形態にかかる対話型機械学習システムにおける処理の一例を説明するための図である。

【図31】図３１は、第１１の実施の形態にかかる対話型機械学習システムにおける処理の一例を説明するための図である。

【発明を実施するための形態】

【0008】

以下に添付図面を参照して、対話型機械学習システム、対話型機械学習方法、およびプログラムの実施の形態を詳細に説明する。

【0009】

人間の知覚の変化は、物理量の変化とは異なることが知られている。特に、色および質感の分野では、視覚の均等知覚空間を取得することが１つの課題となっており、これはカラー・マネジメントおよびカラー・キャリブレーションの基礎として利用されている（非特許文献１参照）。色の均等知覚空間は、CIE L*a*b*空間として一般によく知られており、その生成方法は、主観による色の弁別評価により均等に感じる色弁別楕円を取得し、その色弁別楕円を正円化する変換式を求めることで実施される（非特許文献２参照）。

【0010】

弁別評価および一対比較評価は、視覚の評価をする際に一般的に用いられる手法である。弁別評価および一対比較評価は、ＳＤ法と比べて個人差の少ない主観評価方法として知られる一方、データ数の二乗の試行回数を必要とする。例えば、色弁別楕円の生成には数時間を要する。さらに、質感のような多次元の因子が影響する感覚を評価するには、より膨大な試行時間が必要となり、因子数を限定したりデータ数の制約を設けたりする等の工夫を施す必要が生じる。そのため、質感評価においては、データの網羅性および因子設定の信頼性が課題として挙げられる。特許文献１では、色弱者の色知覚特性を効果的に取得する手法を提案している。

【0011】

また、能動学習による対話型機械学習システムが開発されている。能動学習法とは、例えば、創薬開発の現場等で、数十万から数百万個の全化合物の中からターゲットに対する活性を有する化合物を探索する必要があるような場合に、実測と学習とを繰り返すことでより少ない実測回数で高速に学習を行うことを可能とする手法である（特許文献２参照）。

【0012】

従来の能動学習システムとしては、例えば、特許文献３および特許文献４に記載されたものがある。主な能動学習法としては、例えば、Query by boosting法（以下、ブースティング法という）、Query By Committee法（以下、コミッティ法という）、およびQuery By Bagging法（以下、バギング法という）等がある（非特許文献３参照）。非特許文献４では、画像の属性に関する主観評価（一対比較法）において能動学習を用いることで、効率的に画像の属性に関する全順序を求める手法を提案している。しかしながら、非特許文献４および従来の能動学習が扱うモデルおよび能動学習法は、均等知覚空間の表現を想定しておらず、均等知覚空間を取得できない。

【0013】

そこで、本実施の形態にかかる対話型機械学習システムでは、人間の均等知覚空間を効率的に取得することができる対話型機械学習システム、対話型機械学習方法、およびプログラムを提供する。具体的には、均等知覚空間をAuto-Encoderの潜在空間で表現し、かつ均等知覚空間の取得に適した能動学習法（非特許文献５参照）であるQuery by Lattice法（以下、格子点法という）を用いても良い。

【0014】

次に、本実施の形態にかかる対話型機械学習システム、対話型機械学習方法、およびプログラムの第１～７の側面のそれぞれについて説明する。図１ａは、本実施の形態にかかる対話型機械学習システムの全体像の一例を示す図である。図１ｂは、本実施の形態にかかる対話型機械学習システムのブロック図である。図２および図３は、本実施の形態にかかる対話型機械学習システムの機能ブロック図である。

【0015】

第１の側面にかかる対話型機械学習システムでは、主観評価の結果に基づいて学習する能動学習装置であって、少なくとも、主観評価用の入力データのデータ空間を、均等知覚空間としての潜在空間と相互変換するAuto-Encoder構造を持つ学習モデル部を有する。

【0016】

具体的には、第１の側面にかかる対話型機械学習システムは、学習モデル部１０１、サンプリング部１０２、および評価用ＵＩ部１０３を有する。

【0017】

学習モデル部１０１は、Auto-Encoder構造を持ち、その潜在空間が均等知覚空間を表すように学習する。すなわち、学習モデル部１０１は、Encoder部およびDecoder部を有するAuto-Encoder構造を学習する学習モデル部の一例である。ここで、Encoder部は、入力データのデータ空間を、均等知覚空間としての潜在空間に変換する特徴抽出構造を有する。また、Decoder部は、均等知覚空間に変換されたデータをデータ空間に変換する。

【0018】

サンプリング部１０２は、格子点法に基づきデータをサンプリングする。すなわち、サンプリング部１０２は、均等知覚空間に変換された入力データから、評価用データをサンプリングするサンプリング部の一例である。

【0019】

評価用ＵＩ部１０３は、被験者である人物にサンプリングされた評価用データを提示（例えば、表示）し、提示した内容に基づいて被験者が回答するツールである。すなわち、評価用ＵＩ部１０３は、評価用データを人間が評価する評価用ＵＩを提示する評価用ＵＩ部の一例である。評価用ＵＩ部１０３が被験者に提示するデータは、人間が知覚できる情報であればよく、例えば、視覚情報、音声情報、触覚情報、味覚情報、嗅覚情報、これらを組み合わせた情報などがあげられる。評価用ＵＩ部１０３は、評価用データに合わせて適切な提示用のハードウェアを備えても良く、例えば、視覚情報に関わる評価用データにはディスプレイ装置を用いてもよく、音声情報に関わる評価用データの提示にはスピーカ装置を用いてもよい。すなわち、評価用ＵＩ部１０３は、人間のあらゆる知覚に関わる主観評価に適用することができる。そして、被験者が回答した結果は、次に学習モデル部１０１へ入力する学習データ（入力データ）になる。すなわち、学習モデル部１０１は、評価用ＵＩ部１０３による評価用データの評価結果を入力データとして、特徴抽出構造を含むAuto-Encoder構造を学習する。

【0020】

第２の側面にかかる対話型機械学習システムは、第１の側面にかかる対話型機械学習システムにおいて、サンプリング部１０２が、均等知覚空間としての潜在空間における格子点と、データ空間における弁別距離に基づくその周辺点と、を評価用データとして能動的に抽出する。第２の側面では、評価用データのサンプリングの方法として格子点法を用いることで、均等知覚空間において均等にデータをサンプリングすることができる。均等知覚空間において均等な格子点を取得することによるサンプリングは、知覚空間の表現において効率的にデータを取得することができる（非特許文献５参照）。

【0021】

第３の側面にかかる対話型機械学習システムは、第１の側面にかかる対話型機械学習システムにおいて、学習モデル部１０１が、入力データの各座標がデータ空間中で持つ弁別楕円を記憶する。そして、サンプリング部１０２は、格子点と、当該格子点が持つ弁別楕円中の点である前記周辺点と、を前記評価用データとしてサンプリングする。第３の側面によれば、弁別楕円を記憶し損失関数に利用することで、学習モデル部１０１がその潜在空間が均等知覚空間を表すように空間を補正することが容易になる。すなわち、第３の側面にかかる対話型機械学習システムは、格子点法を用いることで、均等知覚空間において均等にデータ（格子点）をサンプリングする。これにより、均等知覚空間の表現において効率的にデータを取得することができる（非特許文献５参照）。

【0022】

第４の側面にかかる対話型機械学習システムは、第１の側面にかかる対話型機械学習システムにおいて、評価用ＵＩ部１０３が、弁別評価または一対比較評価（相対評価）により評価用データを評価する評価用ＵＩを提示する。第４の側面によれば、弁別評価または一対比較評価を実施することにより、被験者の技能に依存しない、個人差の少ない評価結果を取得することができる。

【0023】

第５の側面にかかる対話型機械学習システムは、第１の側面にかかる対話型機械学習システムにおいて、入力データの各座標の潜在空間中で持つ弁別楕円を記憶し、損失関数を利用することで、学習モデル部１０１がその潜在空間が均等知覚空間を表すように空間を補正することを容易にする。

【0024】

第６の側面にかかる対話型機械学習システムは、第１の側面にかかる対話型機械学習システムにおいて、入力データの各座標の潜在空間における弁別楕円を記憶する。これにより、高次元の入力における弁別領域を潜在空間（１次元、２次元、３次元）において定義することができる。

【0025】

第７の側面にかかる対話型機械学習システムは、第１の側面にかかる対話型機械学習システムにおいて、弁別評価または一対比較評価を実施する評価用ＵＩ部１０３を有する。これにより、被験者の技能に依存せず、個人差の少ない結果を取得することができる。

【0026】

第８の側面にかかる対話型機械学習システムは、第１の側面にかかる対話型機械学習システムにおいて、評価用ＵＩ部１０３による評価用データの評価結果に基づいて、潜在空間の補正に関わるパラメータを更新する。

【0027】

具体的には、図４に示すように、学習モデル部１０１は、まず、入力データ全体を用いて事前学習する。ここで、学習モデル部１０１は、Auto-Encoder構造のため、教師なしで学習される。その後、図４に示すように、能動学習部分に入る。能動学習部分においては、まず、サンプリング部１０２が、格子点法に基づいて、サンプリングを実施する。その後、学習モデル部１０１が、人間による評価を受けて学習データを生成する。学習モデル部１０１における学習機能は、第１学習機能および第２学習機能の２段階に分かれている。第１学習機能は、弁別楕円を記憶する機能であり、第２学習機能は、潜在空間を補正する部分に関わるパラメータを学習する機能である。その後、終了判定部１０４が、学習の終了判定を行う。

【0028】

第９の側面にかかる対話型機械学習システムは、第１の側面にかかる対話型機械学習システムにおいて、学習モデル部１０１、評価用ＵＩ部１０３による評価用データの評価結果に基づいて、弁別楕円のパラメータを更新する。すなわち、学習モデル部１０１は、評価用ＵＩ部１０３による評価用データの評価結果に基づいて、均等知覚空間において周辺点が正円化されるよう弁別楕円を更新する。

【0029】

第１０の側面にかかる対話型機械学習システムは、まず、データ全体を用いて、学習モデルが事前学習される。例えば、学習モデルは、Auto-Encoder構造のため、教師なしで学習される。その後、学習モデルは、能動学習部分に入る。能動学習部分においては、サンプリング部１０２が格子点法に基づいてサンプリングを実施する。その後、評価用ＵＩ部１０３が、人間による評価結果を受けて学習データを生成する。学習モデル部１０１における学習は、（１）弁別楕円を記憶（更新）する学習ステップ（第１学習機能）および（２）弁別楕円に基づいて潜在空間を補正する学習ステップ（第２学習機能）の２ステップに分かれており、各ステップに関わるパラメータを学習する。その後、対話型機械学習システムは、学習モデルの学習の終了判定を行う。

【0030】

また、第１０の側面にかかる対話型機械学習システムは、第１の側面にかかる対話型機械学習システムにおいて、弁別楕円を更新する学習ステップと、更新された弁別楕円に基づいて均等知覚空間を更新する学習ステップと、を別々に有する。第６の側面では、２段階学習を採用することにより、１つのモデルが（１）弁別楕円を記憶する学習ステップ、（２）潜在空間を補正する学習ステップを精度よく実現できる。

【0031】

第１１の側面にかかる対話型機械学習システムは、第１の側面にかかる対話型機械学習システムにおいて、学習モデルの学習進度を評価する終了判定部１０４を有する。具体的には、第７の側面にかかる対話型機械学習システムは、学習モデルの学習進度としての損失関数が所定基準を満たした場合、学習モデルの学習を終了させる終了判定部１０４を備える。

【0032】

第１２の側面にかかる対話型機械学習システムでは、終了判定を利用することで、損失減少に依存しない終了の目安を与えることができる。能動学習においては、次に学習するデータはより判定が難しくなるように選出される。そのため、能動学習において損失は減少していくとは限らず、その低下の程度を見て終了を判定することは難しい。そこで、損失の変化がなくなった時点を、モデルの更新が終了した時点と決めて学習を終了させることを行う。

【0033】

第１３の側面にかかる対話型機械学習システムによれば、第１の側面にかかる対話型機械学習システムにおいて、学習モデル部１０１が、入力データの一例である画像の属性（例えば、人間の評価）に基づいて潜在空間を整列化する。第１学習機能および第２学習機能の２段階学習において、第２学習機能の潜在空間の補正では、弁別領域（楕円）が正円になるように潜在空間が補正される。そのため、潜在空間における順序の入れ替えを行いたい場合には、潜在空間の整列化を施す必要がある。具体的な内容については、第７の実施の形態に記載する。

【0034】

第１４の側面にかかる対話型機械学習システムによれば、第１の側面にかかる対話型機械学習システムにおいて、学習モデル部１０１が、弁別楕円の内側と外側の差に基づいて、特徴抽出構造の学習を収束する収束機能を有する。第１０の側面にかかる対話型機械学習システムおける終了判定部１０４は、損失の変化がなくなった時点を学習終了の目安としている。しかし、学習モデル部１０１自体が収束させる機能を有していれば、終了判定を行う必要はない。具体的な内容については、第８の実施の形態に記載する。

【0035】

（第１の実施の形態）
図４は、第１の実施の形態にかかる対話型機械学習システムの主要部の構成を示したブロック図である。図５は、第１の実施の形態にかかる対話型機械学習システムの機能ブロック図である。図６は、第１の実施の形態にかかる対話型機械学習システムの学習モデル部が有するAuto-Encoder構造の一例を説明するための図である。

【0036】

本実施の形態にかかる対話型機械学習システムは、CIE xy空間からCIE LAB空間（L=50）を取得することを目的とする能動学習システムである。つまり、本実施の形態にかかる対話型機械学習システムは、２次元のxyから、２次元のa*b*を求めるモデルを生成する。ここで、RGBでなくxyとした理由は、輝度値Lを固定することで入力を２次元とするためである。

【0037】

本実施の形態にかかる対話型機械学習システムは、図４に示すように、学習モデル部１０１と、サンプリング部１０２と、評価用ＵＩ部１０３と、を主な構成として有する。

【0038】

事前学習では、xyの様々な組み合わせの色データを入力として教師なし学習を行う。サンプリング部１０２における弁別評価では、提示された２色が同じか異なるかを二値で評価する。

【0039】

学習モデル部１０１は、Auto-Encoder構造を有している。Auto-Encoder構造は、図６に示すように、Encoder部とDecoder部を有し、Encoder部とDecoder部間の変数が存在する空間を潜在空間と呼ぶ。Encoder部は、入力された色（xy）を圧縮した潜在変数を出力するだけでなく、その色（xy）における弁別楕円のパラメータの出力も行う。Encoder部およびDecoder部のそれぞれの入出力は、色のxyとa*b*であり、これはxy-L*a*b*変換式（非特許文献２参照）により正解を求めることができる。

【0040】

ここで、学習モデル部１０１の損失関数について説明する。学習モデル部１０１には、（１）楕円パラメータを推定する学習ステップ（第１学習機能）および（２）潜在空間を表現する学習ステップ（第２学習機能）の２つの機能に関わる損失関数を定義する。

【0041】

図７および図８は、第１の実施の形態にかかる対話型機械学習システムにおける学習モデル部の損失関数の定義に用いる変数の一例を説明するための図である。（１）楕円パラメータの推定については、図７に記載の変数を用いた下記の式（１）の４つの損失項L_s，L_o，L_j，L_bを用いる。ここで、L_sはサンプリング距離について制約する項であり、L_oは、変数の大小関係や正負を制御する項である。L_jは判定損失であり、正しい判定を行えば低くなる。L_bは、境界損失であり、評価している外側と内側のサンプリングデータがそれぞれ「異」「同」と判定されれば低くなる。

【数1】

【0042】

（２）潜在空間の表現については、下記の式（２）の損失項を用いる。変数は、図８に準拠し、弁別楕円が潜在空間中で弁別閾を表すようにする。

【数2】

ここで、||sa||は、サンプリング距離に依存するため、サンプリング距離の更新と空間補正の更新を両立するのは困難である。そこで、（１）楕円パラメータの推定および（２）潜在空間の表現交互に学習することで、サンプリング距離の更新と潜在空間の更新を実現する。

【0043】

次に、サンプリング部１０２について説明する。サンプリング部１０２は、潜在空間が２次元のため、２次元空間中に等間隔な格子点を作成する。そして、サンプリング部１０２は、作成した格子点がデータ空間中で持つ弁別楕円（内側と外側の両者）に基づいて、任意の角度を用いて弁別楕円中の点（周辺点）をサンプリングする。このとき、弁別楕円の内側と外側に基づく周辺点のサンプリングでは、任意の角度は共有される。

【0044】

次に、弁別評価部（評価用ＵＩ部１０３）について説明する。図９は、第１の実施の形態にかかる対話型機械学習システムの弁別評価部により提示される評価用ＵＩの一例を示す図である。弁別評価においては、被験者は、評価用ＵＩに表示された２色を観察し、両者が同じと感じれば左キー、異なると感じれば右キーを入力する。そして、弁別評価による評価判定が３２回終了すると、学習モデル部１０１における学習ステップへ移行する。

【0045】

ここで、正解との比較について説明する。図１０は、第１の実施の形態にかかる対話型機械学習システムにおける検証用のデータの一例を説明するための図である。検証用のデータ（以下、検証用データという）として、図１０（ａ）に記載のL*a*b*空間（L=50）における正円をxyに変換したものを用いる。この検証用データを事前学習後のモデルで圧縮すると、図１０（ｂ）のような分布が得られ、円の中心点に対して、周辺点が正円ではなく楕円状になっていることがわかる。これは、事前学習後のモデルが、均等な知覚空間を表現できていないことを表す。

【0046】

一方、本能動システム（対話型機械学習システム）で１０分ほど学習済みのモデルで検証用データを圧縮すると、図１０（ｃ）のような分布が得られ、入力した検証用データ（図１０（ａ）参照）とほぼ同様の分布であることがわかる。これは、学習後のモデルが、十分に均等な知覚空間を表現できており、xy空間からL*a*b*空間に変換するモデルが得られたことを意味する。

【0047】

次に、学習済みモデルの利用例について説明する。学習済みモデルは、データ空間と均等知覚空間を相互変換する変換関数とみなせるため、xy色空間からL*a*b*色空間の変換関数であるxy→L*a*b*と同様に扱える。つまり、２つのデータの色差を、均等知覚空間上の距離として計算できる。また、均等知覚空間における原点（灰色）からの距離によって、色の彩度を計算することができる。

【0048】

学習済みモデルを変換関数として用いるのは、パラメータのメモリ上、好ましくない場合がある。その場合は、学習済みモデルを簡単な数式に置き換えることが考えられる。例えば、ランダムなデータを、学習済みモデルを用いて均等知覚空間上の数値に変換した後、データと均等知覚空間上の数値を入力として、数式の重回帰モデルを学習することが考えられる。

【0049】

このように、第１の実施の形態にかかる対話型機械学習システムによれば、主観評価に能動学習を適用することにより、簡単な評価方法を用いて、人間の均等知覚空間を効率的に取得することができる。

【0050】

（第２の実施の形態）
本実施の形態は、評価ＵＩ部における評価を弁別評価から一対比較評価（相対評価）に変え、それに応じて損失関数を変えた例であり、学習モデルの構成およびサンプリングについては、第１の実施の形態と同様である。

【0051】

本実施形態における学習モデル部１０１の損失関数について説明する。本実施の形態においても、第１の実施の形態と同様に、（１）楕円パラメータを推定する学習ステップおよび（２）潜在空間を表現するステップの２つの機能に関わる損失関数を定義する。（２）潜在空間の表現については、第１の実施の形態と同様のため説明を割愛する。以下では、（１）楕円パラメータの推定の損失関数について説明する。

【0052】

（１）楕円パラメータの推定については、図７に記載の変数を用いた下記の式（３）の３つの損失項L_s，L_o，L_jを用いる。L_s，L_oは、第１の実施の形態と同様である。L_jは、判定損失であり、正しく推定できれば小さな値をとる。L_jの意味合いとしては、“近い方が弁別範囲に含まれる”となる。

【数3】

【0053】

次に、相対評価部（評価用ＵＩ部１０３）について説明する。図１１は、第２の実施の形態にかかる対話型機械学習システムの一対比較評価における評価用ＵＩの例を示す図である。相対評価において、被験者は、評価用ＵＩに表示の２色および中央に表示の基準色を観察し、両者のうちどちらが基準色に近いかを判定する。左の色の方が基準色に近いと感じれば左キー、右の色の方が基準色に近いと感じれば右キーを入力する。相対評価による評価判定が１６回終了すると、学習モデル部１０１における学習ステップへ移行する。

【0054】

このように、第２の実施の形態にかかる対話型機械学習システムによれば、一対比較評価を実施することにより、被験者の技能に依存しない、個人差の少ない評価結果を取得することができる。

【0055】

（第３の実施の形態）
本実施の形態は、入出力するデータの次元を２次元から３次元に変え、それに応じてモデルを３次元対応させた例である。上述の実施の形態と同様の構成については説明を省略する。

【0056】

図１２は、第３の実施の形態にかかる対話型機械学習システムの主要部の構成を示したブロック図である。本実施の形態にかかる対話型機械学習システムは、CIE xy空間および輝度値LからCIE LAB空間を取得することを目的とする能動学習システムである。つまり、３次元のxyLから、３次元のL*a*b*を求めるモデルを生成する。

【0057】

図１３は、第３の実施の形態にかかる対話型機械学習システムの機能ブロック図である。図１４および図１５は、第３の実施の形態にかかる対話型機械学習システムの学習モデル部の損失関数の定義に用いる変数の一例を説明するための図である。本実施の形態にかかる対話型機械学習システムでは、事前学習部において、xyLのさまざまな組み合わせの色データを入力として教師なし学習を行う。

【0058】

本実施の形態では、学習モデル部１０１は、第１の実施の形態と同様に、Auto-Encoder構造を有しており、Encoder部とDecoder部を有する。Encoder部は、入力された色（xyL）を圧縮した潜在変数を出力するだけでなく、そのxyLにおける弁別楕円のパラメータの出力も行う。弁別楕円は、各軸方向の半径および２つの回転角度によって定義される。それぞれの入出力は、色のxyLとL*a*b*であり、これはxy-L*a*b*変換式（非特許文献２参照）により正解を求めることができる。

【0059】

ここで、学習モデル部１０１の損失関数について説明する。学習モデル部１０１には、第１の実施の形態と同様に、（１）楕円パラメータを推定する学習ステップ（第１学習機能）および（２）潜在空間を表現する学習ステップ（第２学習機能）の２つの機能に関わる損失関数を定義する。

【0060】

（１）楕円パラメータの推定については、図１４に記載の変数を用いた下記の式（４）の４つの損失項L_s，L_o，L_j，L_bを用いる。L_sはサンプリング距離について制約する項であり、L_oは変数の大小関係や正負を制御する項である。L_jは判定損失であり、正しい判定を行えば低くなる。L_bは境界損失であり、評価している外側と内側のサンプリングデータがそれぞれ「異」「同」と判定されれば低くなる。

【数4】

【0061】

また、（２）潜在空間の表現については、下記の式（５）の損失項を用いる。変数は、図１５に準拠し、弁別楕円の内側と外側の中心点が、潜在空間中で弁別閾を表すようにする。

【数5】

【0062】

次に、サンプリング部１０２について説明する。サンプリング部１０２は、潜在空間が３次元のため、３次元空間中に等間隔な格子点を作成する。そして、サンプリング部１０２は、その格子点がデータ空間中で持つ弁別楕円（内側と外側の両者）に基づいて、任意の角度を用いて弁別楕円中の点をサンプリングする。このとき、弁別楕円の内側と外側に基づくサンプリングでは、任意の角度は共有される。

【0063】

このように、第３の実施の形態にかかる対話型機械学習システムによれば、入出力の次元を２次元から３次元に変えた場合でも、上述の実施の形態と同様の作用効果を得ることができる。

【0064】

（第４の実施の形態）
本実施の形態は、ｎ次元の画像から１次元の自然さを表す軸を求める学習モデルを生成する例である。以下の説明では、上述の実施の形態と同様の構成については説明を省略する。

【0065】

図１６は、第４の実施の形態にかかる対話型機械学習システムの主要部の構成を示したブロック図である。本実施の形態にかかる対話型機械学習システムは、画像から属性である自然さにかかわる知覚空間を取得することを目的とする能動学習システムである。つまり、本実施の形態にかかる対話型機械学習システムは、ｎ次元（ｎ＞３）の画像から、１次元の自然さを表す軸を求めるモデルを生成する。

【0066】

図１７は、第４の実施の形態にかかる対話型機械学習システムの機能ブロック図である。図１８は、第４の実施の形態にかかる対話型機械学習システムの圧縮モデルの構成の一例を示す図である。図１９は、第４の実施の形態にかかる対話型機械学習システムの表現モデルの構成の一例を示す図である。本実施の形態にかかわる対話型機械学習システムでは、まず、図１７に示す圧縮モデルの定義と事前学習を行う。ここで、圧縮モデルは、ｎ次元の画像を２次元に圧縮するモデルであり、Auto-Encoder構造および主要なノード（主成分）を選択する手法（非特許文献６参照）を用いる。その後、図１９に示す均等知覚空間を表す表現モデルの定義と事前学習を行う。それぞれの表現モデルの事前学習は、画像および画像の２主成分の重みを入力として教師なし学習を行う。

【0067】

被験者は、評価用ＵＩ部１０３により提示される評価用ＵＩの２画像および中央に表示の基準画像を観察し、両者のうちどちらが基準画像に近いかを判定する。２画像のうち左の色の方が基準画像に近いと感じれば左キー、２画像のうち右の色の方が基準画像に近いと感じれば右キーを入力する。相対評価による評価判定が１６回終了すると、学習モデル部１０１における学習ステップへ移行する。

【0068】

本実施の形態では、圧縮モデルおよび表現モデルは、Auto-Encoder構造を有している。圧縮モデルでは、Encoder部は入力された画像を圧縮した潜在変数を出力し、その後、非主要な２ノード（２主成分）の重みを出力する（特許文献６参照）。表現モデルでは、Encoder部は入力された２主成分の重みを圧縮するだけでなく、その画像における弁別楕円のパラメータの出力も行う。圧縮モデルおよび表現モデルの損失関数、およびサンプリング部１０２については、第１の実施の形態と同様のため説明を割愛する。

【0069】

このように、第４の実施の形態にかかる対話型機械学習システムによれば、次元の画像から１次元の自然さを表す軸を求める学習モデルを生成する場合においても、第１の実施の形態と同様の作用効果を得ることができる。

【0070】

（第５の実施の形態）
本実施の形態は、弁別領域（例えば、弁別楕円）の記憶を、データ空間中ではなく潜在空間中で行う(以下、弁別領域の潜在記憶という)例である。以下の説明では、第３の実施の形態と同様の構成については説明を省略する。

【0071】

図２０は、第５の実施の形態にかかる対話型機械学習システムの主要部の構成を示したブロック図である。本実施の形態にかかる対話型機械学習システムは、CIE RGB空間からCIE LAB空間（L=50）を取得することを目的とする能動学習システムである。

【0072】

まず、弁別領域の潜在記憶について詳細を説明する。図２１は、第５の実施の形態にかかる対話型機械学習システムの機能ブロック図である。図２２および図２３は、第５の実施の形態にかかる対話型機械学習システムにおける学習モデル部の損失関数の定義に用いる変数の一例を説明するための図である。本実施の形態にかかる対話型機械学習システムの第３の実施の形態との差分は、３ステップ目の弁別領域の潜在記憶の初期化が含まれる点である。図２１の６ステップ目（第１学習機能）で新しい潜在記憶を更新し、それに基づいて７ステップ目（第２学習機能）で潜在空間の補正を行う。弁別領域の潜在記憶は、図２２中の弁別距離に基づいて初期化する。

【0073】

この手法のメリットは、様々な形状の弁別楕円で補正を繰り返すことによって、元々の弁別領域が楕円以外の複雑な形状の場合にも対応できる点である。もう１つのメリットとして、入力が何次元であろうと、出力が３次元以下の低次元空間であれば、図２１の学習（２）の学習ステップにおける潜在空間の補正を簡単に行える点である。もし、潜在空間をｎ次元（ｎ＞３）とする場合、図２３のＡｎをｎ次元の楕円として表現する必要があり、楕円の位置を求める式が複雑になる。複雑なこの式を学習構造に含めるのは実装が困難なため、できるだけ低次元の潜在空間を扱う方が好ましい。

【0074】

モデルの構成については第３の実施の形態と同様である。

【0075】

次に、モデルの損失関数について説明する。モデルは、第３の実施の形態と同様、（１）楕円パラメータを推定する学習ステップおよび（２）潜在空間を表現する学習ステップの２つの機能に関わる損失関数を有する。以下では、それぞれの損失関数について以下に説明する。

【0076】

（１）楕円パラメータの推定については、図２２に記載の変数を用いた下記の式（６）の損失項L_jを用いる。L_jは判定損失であり、正しい判定を行えば低くなる。

【数6】

【0077】

（２）潜在空間の表現についてには、下記の式（７）の損失項L_dを用いる。変数は、図２３に準拠し、弁別楕円が潜在空間中で弁別閾を表すようにする。

【数7】

ここで、||sa||はサンプリング距離に依存するため、サンプリング距離の更新と空間補正の更新を両立するのは困難である。そこで、第３の実施の形態と同様に、（１）楕円パラメータの推定および（２）潜在空間の表現を交互に学習することで、サンプリング距離の更新と潜在空間の更新を実現する。

【0078】

次に、サンプリング部１０２について説明する。サンプリング部１０２は、潜在空間が２次元のため、２次元空間中に等間隔な格子点を作成する。そして、サンプリング部１０２は、その格子点が潜在空間中で持つ弁別楕円に基づいて、任意の角度を用いて弁別楕円中の点をサンプリングする。

【0079】

第１の実施の形態では、内側と外側の弁別領域の点をサンプリングしている。しかし、弁別領域の潜在記憶においては、内側と外側の弁別領域の差分を徐々に狭めていくことができない。そこで、本実施の形態では，サンプリング部１０２は、弁別領域中のある点と９０度の角度をなす点をサンプリングする。こうすることで、楕円のパラメータの推定の精度を高めることができる。

【0080】

このように、第５の実施の形態にかかる対話型機械学習システムによれば、弁別楕円のパラメータの推定精度を向上させることができる。

【0081】

（第６の実施の形態）
本実施の形態は、弁別領域を潜在記憶とする点である。以下の説明では、第４の実施の形態と同様の構成については説明を省略する。

【0082】

図２４は、第６の実施の形態にかかる対話型機械学習システムの主要部の構成の一例を示したブロック図である。図２５は、第６の実施の形態にかかる対話型機械学習システムの機能ブロック図である。図２６は、第６の実施の形態にかかる対話型機械学習システムの圧縮モデルの構成の一例を示す図である。図２７は、第６の実施の形態にかかる対話型機械学習システムの表現モデルの構成の一例を示す図である。本実施の形態にかかる対話型機械学習システムは、図２４に示すように、圧縮モデルの定義と事前学習を行う。圧縮モデルは、ｎ次元の画像をｍ次元（ｍ＜ｎ，ｍ＞３）に圧縮するモデルである。その後、本実施の形態にかかる対話型機械学習システムは、図２７に示す均等知覚空間を表す表現モデルの定義と事前学習を行う。

【0083】

それぞれのモデルの事前学習は、画像および画像のｍ次元成分の重みを入力として教師なし学習を行う。被験者は、評価用ＵＩ部１０３により提示される評価用ＵＩの２画像および中央に表示の基準画像を観察し、２画像のうちどちらが基準画像に近いかを判定する。２画像のうち左の色の方が基準画像に近いと感じれば左キー、２画像のうち右の色の方が基準画像に近いと感じれば右キーを入力する。相対評価による評価判定が１６回終了すると、学習モデル部１０１の学習ステップへ移行する。

【0084】

次に、学習モデル部１０１の構成について説明する。学習モデル部１０１は、圧縮モデルおよび表現モデルを有する。圧縮モデルおよび表現モデルは、Auto-Encoder構造を有している。圧縮モデルでは、図２６に示すように、Encoder部は、入力された画像を圧縮した潜在変数を出力する。表現モデルでは、図２７に示すように、Encoder部は入力されたｍ次元成分の重みを圧縮するだけでなく、その画像における弁別楕円のパラメータの出力も行う。

【0085】

モデルの損失関数およびサンプリング部１０２については、第１の実施の形態と同様のため説明を割愛する。弁別領域の潜在記憶を用いることによる、第４の実施の形態からの改善点は、表現モデルの入力の次元を向上できる点である。この入力次元が小さすぎると、元の画像に復元することが困難になる。

【0086】

このように、第６の実施の形態にかかる対話型機械学習システムによれば、弁別領域の潜在記憶を用いることにより、表現モデルの入力の次元を向上させることができる。

【0087】

（第７の実施の形態）
本実施の形態は、入力データの一例である画像の属性に基づいて潜在空間を整列化する例である。以下の説明では、第６の実施の形態と同様の構成については説明を省略する。

【0088】

図２８は、第７の実施の形態にかかる対話型機械学習システムにおける学習機能の一例を説明するための図である。本実施の形態では、図２５に示す学習モデル部１０１の第２学習機能に、入力データの一例である画像の属性に基づく潜在空間の整列化が追加されている。ここで、画像の属性に基づいて、画像群を並べ替えかつ均等知覚空間を生成するタスクを考える。画像の属性は、画像から受ける抽象的な印象であっても良く、例えば、人物が笑っている度合い、スポーティさ、自然を含んでいる度合いである。

【0089】

色の場合と異なり、画像の属性の場合は、入力データが属性順に並んでいないため、それらを整列化する必要がある。従来研究のDeep Relative Attributes（非特許文献９参照。以下、ＤＲＡと言う。）では、図２８に示すように、２つの画像（入力画像）のそれぞれの特徴量を抽出し、抽出した各入力画像の特徴量を入力としてランキングを出力するランキング推定部２８０１と、２つのランキングから２つの入力画像の関係性（例えば、２つの入力画像のうちどちらが属性について強いか）を判定する関係推定部２８０２と、を有する。本実施の形態では、関係推定部２８０２を、図２５に示す学習モデル部１０１の第２学習機能に組み込むことで、画像の属性に基づく潜在空間の並べ替えおよび均等知覚空間の生成を行う。

【0090】

潜在空間の表現には、下記の式（８）の損失項を用いても良い。変数は、図１５に準拠し、弁別楕円の内側と外側の中心点が、潜在空間中で弁別閾を表すようにする。また、これに潜在空間の整列化のための損失Laを加える。

【数8】

【0091】

ここで、ｔは、正解の関係性（主観評価の結果と同義）、ｐは推定した関係性を表し、下記の式（９）で計算される。

【数9】

【0092】

ここでｒ₁とｒ₂は、それぞれ、図２７に示す自然さを表す１次元の値である。

【0093】

このように、第７の実施の形態にかかる対話型機械学習システムによれば、画像の属性に基づく潜在空間の並べ替えおよび均等知覚空間の生成が可能となる。

【0094】

（第８の実施の形態）
本実施の形態は、弁別楕円の内側と外側の差に基づいて収束化する例である。以下の説明では、第７の実施の形態と同様の構成については説明を省略する。

【0095】

本実施の形態では、学習モデル部１０１の第２学習機能に、弁別楕円の内側と外側の差に基づいて収束化する機能が追加されている。潜在空間の表現については、下記の式（１０）に示す損失項を用いる。変数は、図１５に準拠し、L_dは楕円を正円化するための損失、L_aは整列化のための損失であり、そこに特徴抽出構造の学習の収束化のための損失L_cを加える。さらに、重みｄでＬ_ｄとL_cを、下記の式（１０）のように、それぞれ重みづける。

【数10】

ここで、zはあるデータxをエンコードした潜在変数であり、z’は学習前の潜在変数を表す。重みdは内側と外側の楕円の差を表しており、これが小さくなるほどLは固定（収束）されることになる。

【0096】

これにより、第８の実施の形態にかかる対話型機械学習システムによれば、学習モデル部１０１自体が収束させる機能を有するので、終了判定を行う必要が無くなる。

【0097】

（第９の実施の形態）
本実施の形態は、モデルの差を可視化する例である。以下の説明では、上述の実施の形態と同様の構成については説明を省略する。

【0098】

図２９は、第９の実施の形態にかかる対話型機械学習システムにおける処理の一例を説明するための図である。本実施の形態にかかる対話型機械学習システムは、ある入力データに対する均等知覚空間を簡単に生成することを可能とするため、被験者一人一人の均等知覚空間を生成することが容易である。例えば、被験者Ａ、被験者Ｂの均等知覚空間をそれぞれU_A、U_Bとして生成した場合を想定する。均等知覚空間U_A上に均等知覚空間U_Bの弁別領域をプロットすれば、相対的な感度の高低を潜在空間中で可視化することができる。

【0099】

具体的には、まず、均等知覚空間U_A空間中で中心データをランダムに生成し、各中心データの円周上に比較データをプロットする（図２８（ａ）参照）。中心データおよび比較データをデコードしたものを、均等知覚空間U_B中にエンコードする。その結果の例が、図２９（ｂ）である。均等知覚空間U_Aと均等知覚空間U_Bが異なるとき、均等知覚空間U_A中での正円は、均等知覚空間U_B中での楕円として表現される。この楕円を観察することで、被験者Ａと被験者Ｂの感覚の差を知ることができる。

【0100】

このように、第９の実施の形態にかかる対話型機械学習システムによれば、色，質感，画像の属性といった入力データに対する均等知覚空間を、少ない主観評価だけで生成することを可能にする。そのため、被験者毎に均等知覚空間を生成することが容易であり、それらを比べることで被験者毎の知覚の差を可視化することが可能であるモデル間の間隔の差を知ることができる。

【0101】

（第１０の実施の形態）
本実施の形態は、均等知覚空間の生成を、認識タスクへ応用した例である。以下の説明では、上述の実施の形態と同様の構成については説明を省略する。

【0102】

図３０は、第１０の実施の形態にかかる対話型機械学習システムにおける処理の一例を説明するための図である。本実施の形態にかかる対話型機械学習システムでは、ある入力データに対する人間の感覚を等間隔に表現する均等知覚空間を生成する。例えば、数字のデータセットMNISTに対する均等知覚空間を生成すると、各数字らしさを等間隔に分布した均等知覚空間が生成される。すると、もっともその数字らしい“核データ”と、その数字を認識できる弁別領域と、が得られることになる。

【0103】

このように、第１０の実施の形態にかかる対話型機械学習システムによれば、核データからの距離に応じて、あるデータがどのクラスに分類されるかを判断可能である。さらに、弁別領域が明確になるため、数字間のあいまいで判断しづらい文字についても、人間が感じるように分類することが可能である。すなわち、生成した均等知覚空間に基づいた認識，認証，探索，異常検知等の他タスクへの応用も可能である。

【0104】

（第１１の実施の形態）
本実施の形態は、均等知覚空間の生成を、データの再構築に応用した例である。以下の説明では、上述の実施の形態と同様の構成については説明を省略する。

【0105】

図３１は、第１１の実施の形態にかかる対話型機械学習システムにおける処理の一例を説明するための図である。再構築したデータセットは、より認識が困難なデータを含むため、それを学習する他のモデルを通常のデータセット（再構築前のデータセット）で学習するよりも精度を向上させることができる。

【0106】

本実施の形態にかかる対話型機械学習システムは、あるデータに対する人間の感覚を等間隔に表現する均等知覚空間を生成する。例えば、数字のデータセットMNISTに対する均等知覚空間を生成すると、各数字らしさを等間隔に分布した均等知覚空間が生成される。すると、もっともその数字らしい核データと、その数字を認識できる弁別領域と、が得られることになる。核データから遠く、かつ弁別領域内のデータをデコードすることで、新しくかつ認識が困難なデータを生成することができる。さらに、複数の核データの中間点に近いデータを生成することで、分類間違いしやすいデータを新しく生成することも可能である。

【0107】

このように、第１１の実施の形態にかかる対話型機械学習システムによれば、再構築したデータセットは、より認識が困難なデータを含むため、それを学習する他のモデルを通常のデータセットで学習するよりも精度を向上させることができる。

【0108】

なお、本実施の形態の対話型機械学習システムで実行されるプログラムは、ＲＯＭ（Read Only Memory）等に予め組み込まれて提供される。本実施の形態の対話型機械学習システムで実行されるプログラムは、インストール可能な形式又は実行可能な形式のファイルでＣＤ－ＲＯＭ、フレキシブルディスク（ＦＤ）、ＣＤ－Ｒ、ＤＶＤ（Digital Versatile Disk）等のコンピュータで読み取り可能な記録媒体に記録して提供するように構成してもよい。

【0109】

さらに、本実施の形態の対話型機械学習システムで実行されるプログラムを、インターネット等のネットワークに接続されたコンピュータ上に格納し、ネットワーク経由でダウンロードさせることにより提供するように構成しても良い。また、本実施の形態の対話型機械学習システムで実行されるプログラムをインターネット等のネットワーク経由で提供または配布するように構成しても良い。

【0110】

本実施の形態の対話型機械学習システムで実行されるプログラムは、上述した各部（学習モデル部１０１、サンプリング部１０２、評価用ＵＩ部１０３、終了判定部１０４）を含むモジュール構成となっており、実際のハードウェアとしてはプロセッサの一例であるＣＰＵ（Central Processing Unit）が上記ＲＯＭからプログラムを読み出して実行することにより上記各部が主記憶装置上にロードされ、学習モデル部１０１、サンプリング部１０２、評価用ＵＩ部１０３、終了判定部１０４が主記憶装置上に生成されるようになっている。

【0111】

本発明の態様は、例えば、以下のとおりである。

【0112】

＜１＞主観評価用の入力データのデータ空間を、均等知覚空間としての潜在空間に変換する特徴抽出構造を学習する学習モデル部と、
前記均等知覚空間に変換された前記入力データから、評価用データをサンプリングするサンプリング部と、
前記評価用データを人間が評価する評価用ＵＩを提示する評価用ＵＩ部と、を備え、
前記学習モデル部は、前記評価用ＵＩによる前記評価用データの評価結果を前記入力データとして、前記特徴抽出構造を学習する、対話型機械学習システム。

【0113】

＜２＞前記学習モデル部は、特徴抽出構造を有するEncoder部と、前記均等知覚空間に変換された前記データを前記データ空間に変換するDecoder部と、を有するAuto-Encoder構造を有する、＜１＞に記載の対話型機械学習システム。

【0114】

＜３＞前記サンプリング部は、前記均等知覚空間としての潜在空間における格子点と、前記データ空間における弁別距離に基づくその周辺点と、を前記評価用データとしてサンプリングする、＜２＞に記載の対話型機械学習システム。

【0115】

＜４＞前記学習モデル部は、前記入力データの各座標が前記データ空間中で持つ弁別楕円を記憶し、
前記サンプリング部は、前記格子点と、当該格子点が持つ前記弁別楕円中の点を前記周辺点と、を前記評価用データとしてサンプリングする、＜３＞に記載の対話型機械学習システム。

【0116】

＜５＞前記学習モデル部は、前記入力データの各座標の前記潜在空間における弁別楕円を記憶し、
前記サンプリング部は、前記格子点と、当該格子点が持つ前記弁別楕円中の点を前記周辺点と、を前記評価用データとしてサンプリングする、＜３＞に記載の対話型機械学習システム。

【0117】

＜６＞前記評価用ＵＩ部は、弁別評価または一対比較評価により前記評価用データを評価する前記評価用ＵＩを提示する、＜４＞に記載の対話型機械学習システム。

【0118】

＜７＞前記学習モデル部は、前記評価用ＵＩ部による前記評価用データの評価結果に基づいて、前記均等知覚空間において前記周辺点が正円化されるよう前記弁別楕円を更新する、＜６＞に記載の対話型機械学習システム。

【0119】

＜８＞前記学習モデル部は、前記弁別楕円を記憶する学習ステップと、前記弁別楕円に基づいて前記均等知覚空間を更新する学習ステップと、を別々に有する、＜４＞または＜５＞に記載の対話型機械学習システム。

【0120】

＜９＞前記特徴抽出構造の学習進度としての損失関数が所定基準を満たした場合、前記学習モデル部における前記特徴抽出構造の学習を終了させる終了判定部をさらに備える＜１＞から＜７＞のいずれか一に記載の対話型機械学習システム。

【0121】

＜１０＞前記入力データは、画像であり、
前記学習モデル部は、前記画像の属性に基づいて前記潜在空間を整列化する、＜１＞から＜９＞のいずれか一に記載の対話型機械学習システム。

【0122】

＜１１＞前記学習モデル部は、前記弁別楕円の内側と外側の差に基づいて、前記特徴抽出構造の学習を収束する、＜４＞から＜８＞のいずれか一に記載の対話型機械学習システム。

【0123】

＜１２＞対話型機械学習システムで実行される対話型機械学習方法であって、
主観評価用の入力データのデータ空間を、均等知覚空間としての潜在空間に変換する特徴抽出構造を学習するステップと、
前記均等知覚空間に変換された前記入力データから、評価用データをサンプリングするステップと、
前記評価用データを人間が評価する評価用ＵＩを提示するステップと、
前記評価用ＵＩによる前記評価用データの評価結果を前記入力データとして、前記特徴抽出構造を学習するステップと、
を含む対話型機械学習方法。

【0124】

＜１３＞コンピュータを、
主観評価用の入力データのデータ空間を、均等知覚空間としての潜在空間に変換する特徴抽出構造を学習する学習モデル部と、
前記均等知覚空間に変換された前記入力データから、評価用データをサンプリングするサンプリング部と、
前記評価用データを人間が評価する評価用ＵＩを提示する評価用ＵＩ部と、して機能させ、
前記学習モデル部は、前記評価用ＵＩによる前記評価用データの評価結果を前記入力データとして、前記特徴抽出構造を学習する、プログラム。

【符号の説明】

【0125】

１０１学習モデル部
１０２サンプリング部
１０３評価用ＵＩ部
１０４終了判定部

【先行技術文献】

【特許文献】

【0126】

【特許文献1】特開２０１９－１６２４００号公報

【特許文献2】特許第５０４４９８０号公報

【特許文献3】特開平１１－３１６７５４号公報

【特許文献4】特開２００５－１０７７４３号公報

【非特許文献】

【0127】

【非特許文献1】Abhay Sharma, “Understanding color management”, John Wiley & Sons, 2018.

【非特許文献2】David L MacAdam, “Visual sensitivities to color differences in daylight.“, Josa, 32(5):247－274, 1942.

【非特許文献3】森下慎一編集、宮野悟編集、「発見科学とデータマイニング」、初版、共立出版、２００１年６月、ｐ．３１８

【非特許文献4】J.Tompkin, “Criteria Sliders: Learning Continuous Database Criteria via Interactive Ranking”, CVPR, 2017.

【非特許文献5】山本真史，3D-LUT によるディスプレイの色再現方式に関する研究，視覚情報基礎研究会，第25回，2015年

【非特許文献6】Ya Ju Fan, “Autoencoder node saliency : Selecting relevant latent representations”, Pattern Recognition (2018).

【非特許文献7】Chung Mu-Huan, “Interactive Machine Learning for Data Exfiltration Detection: Active Learning with Human Expertise”, IEEE Conference Proceedings, 2020.

【非特許文献8】Saleema Amershi, “Power to the People: The Role of Humans in Interactive Machine Learning”, AI Magazine, 2014.

【非特許文献9】Souri, Y.; Noury, E.; and Adeli, E. 2016. Deep relative attributes. In Asian conference on computer vision, 118-133. Springer.

【図1a】