IP Force 特許公報掲載プロジェクト 2022.1.31 β版

知財求人 - 知財ポータルサイト「IP Force」

▶ 株式会社リコーの特許一覧

特開2023-138274対話型機械学習システム、対話型機械学習方法、およびプログラム
(19)【発行国】日本国特許庁(JP)
(12)【公報種別】公開特許公報(A)
(11)【公開番号】P2023138274
(43)【公開日】2023-10-02
(54)【発明の名称】対話型機械学習システム、対話型機械学習方法、およびプログラム
(51)【国際特許分類】
   G06N 20/00 20190101AFI20230922BHJP
【FI】
G06N20/00
【審査請求】未請求
【請求項の数】13
【出願形態】OL
(21)【出願番号】P 2022179870
(22)【出願日】2022-11-09
(31)【優先権主張番号】P 2022042669
(32)【優先日】2022-03-17
(33)【優先権主張国・地域又は機関】JP
(71)【出願人】
【識別番号】000006747
【氏名又は名称】株式会社リコー
(74)【代理人】
【識別番号】110002147
【氏名又は名称】弁理士法人酒井国際特許事務所
(72)【発明者】
【氏名】田中 伶実
(72)【発明者】
【氏名】平野 成伸
(72)【発明者】
【氏名】原島 正豪
(57)【要約】
【課題】人間の均等知覚空間を効率的に取得することができる対話型機械学習システム、対話型機械学習方法、およびプログラムを提供する。
【解決手段】本発明は、主観評価用の入力データのデータ空間を、均等知覚空間としての潜在空間に変換する特徴抽出構造を学習する学習モデル部と、前記均等知覚空間に変換された前記入力データから、評価用データをサンプリングするサンプリング部と、前記評価用データを人間が評価する評価用UIを提示する評価用UI部と、を備え、前記学習モデル部は、前記評価用UIによる前記評価用データの評価結果を前記入力データとして、前記特徴抽出構造を学習する。
【選択図】図1
【特許請求の範囲】
【請求項1】
主観評価用の入力データのデータ空間を、均等知覚空間としての潜在空間に変換する特徴抽出構造を学習する学習モデル部と、
前記均等知覚空間に変換された前記入力データから、評価用データをサンプリングするサンプリング部と、
前記評価用データを人間が評価する評価用UIを提示する評価用UI部と、を備え、
前記学習モデル部は、前記評価用UIによる前記評価用データの評価結果を前記入力データとして、前記特徴抽出構造を学習する、対話型機械学習システム。
【請求項2】
前記学習モデル部は、特徴抽出構造を有するEncoder部と、前記均等知覚空間に変換された前記データを前記データ空間に変換するDecoder部と、を有するAuto-Encoder構造を有する、請求項1に記載の対話型機械学習システム。
【請求項3】
前記サンプリング部は、前記均等知覚空間としての潜在空間における格子点と、前記データ空間における弁別距離に基づくその周辺点と、を前記評価用データとしてサンプリングする、請求項2に記載の対話型機械学習システム。
【請求項4】
前記学習モデル部は、前記入力データの各座標が前記データ空間中で持つ弁別楕円を記憶し、
前記サンプリング部は、前記格子点と、当該格子点が持つ前記弁別楕円中の点を前記周辺点と、を前記評価用データとしてサンプリングする、請求項3に記載の対話型機械学習システム。
【請求項5】
前記学習モデル部は、前記入力データの各座標の前記潜在空間における弁別楕円を記憶し、
前記サンプリング部は、前記格子点と、当該格子点が持つ前記弁別楕円中の点を前記周辺点と、を前記評価用データとしてサンプリングする、請求項3に記載の対話型機械学習システム。
【請求項6】
前記評価用UI部は、弁別評価または一対比較評価により前記評価用データを評価する前記評価用UIを提示する、請求項4に記載の対話型機械学習システム。
【請求項7】
前記学習モデル部は、前記評価用UI部による前記評価用データの評価結果に基づいて、前記均等知覚空間において前記周辺点が正円化されるよう前記弁別楕円を更新する、請求項6に記載の対話型機械学習システム。
【請求項8】
前記学習モデル部は、前記弁別楕円を記憶する学習ステップと、前記弁別楕円に基づいて前記均等知覚空間を更新する学習ステップと、を別々に有する、請求項4または5に記載の対話型機械学習システム。
【請求項9】
前記特徴抽出構造の学習進度としての損失関数が所定基準を満たした場合、前記学習モデル部における前記特徴抽出構造の学習を終了させる終了判定部をさらに備える請求項1に記載の対話型機械学習システム。
【請求項10】
前記入力データは、画像であり、
前記学習モデル部は、前記画像の属性に基づいて前記潜在空間を整列化する、請求項1に記載の対話型機械学習システム。
【請求項11】
前記学習モデル部は、前記弁別楕円の内側と外側の差に基づいて、前記特徴抽出構造の学習を収束する、請求項4に記載の対話型機械学習システム。
【請求項12】
対話型機械学習システムで実行される対話型機械学習方法であって、
主観評価用の入力データのデータ空間を、均等知覚空間としての潜在空間に変換する特徴抽出構造を学習するステップと、
前記均等知覚空間に変換された前記入力データから、評価用データをサンプリングするステップと、
前記評価用データを人間が評価する評価用UIを提示するステップと、
前記評価用UIによる前記評価用データの評価結果を前記入力データとして、前記特徴抽出構造を学習するステップと、
を含む対話型機械学習方法。
【請求項13】
コンピュータを、
主観評価用の入力データのデータ空間を、均等知覚空間としての潜在空間に変換する特徴抽出構造を学習する学習モデル部と、
前記均等知覚空間に変換された前記入力データから、評価用データをサンプリングするサンプリング部と、
前記評価用データを人間が評価する評価用UIを提示する評価用UI部と、して機能させ、
前記学習モデル部は、前記評価用UIによる前記評価用データの評価結果を前記入力データとして、前記特徴抽出構造を学習する、プログラム。
【発明の詳細な説明】
【技術分野】
【0001】
本発明は、対話型機械学習システム、対話型機械学習方法、およびプログラムに関する。
【背景技術】
【0002】
人間と機械学習アルゴリズム間の効率的な協調を創出することにより、より良いユーザエクスペリエンスおよびより効果的な学習機構を目指す対話型機械学習システムが開示されている(非特許文献7,8参照)。
【発明の概要】
【発明が解決しようとする課題】
【0003】
ところで、上記の対話型機械学習システムには、主観評価に能動学習を適用することにより、弁別評価および一対比較評価のような簡単な評価方法を用いながら、効率的に均等知覚空間を取得することが求められている。
【0004】
本発明は、上記に鑑みてなされたものであって、人間の均等知覚空間を効率的に取得することができる対話型機械学習システム、対話型機械学習方法、およびプログラムを提供することを目的とする。
【課題を解決するための手段】
【0005】
上述した課題を解決し、目的を達成するために、本発明は、主観評価用の入力データのデータ空間を、均等知覚空間としての潜在空間に変換する特徴抽出構造を学習する学習モデル部と、前記均等知覚空間に変換された前記入力データから、評価用データをサンプリングするサンプリング部と、前記評価用データを人間が評価する評価用UIを提示する評価用UI部と、を備え、前記学習モデル部は、前記評価用UIによる前記評価用データの評価結果を前記入力データとして、前記特徴抽出構造を学習する。
【発明の効果】
【0006】
本発明によれば、人間の均等知覚空間を効率的に取得することができる、という効果を奏する。
【図面の簡単な説明】
【0007】
図1a図1aは、本実施の形態にかかる対話型機械学習システムの全体像の一例を示す図である。
図1b図1bは、本実施の形態にかかる対話型機械学習システムのブロック図である。
図2図2は、本実施の形態にかかる対話型機械学習システムの機能ブロック図である。
図3図3は、本実施の形態にかかる対話型機械学習システムの機能ブロック図である。
図4図4は、第1の実施の形態にかかる対話型機械学習システムの主要部の構成を示したブロック図である。
図5図5は、第1の実施の形態にかかる対話型機械学習システムの機能ブロック図である。
図6図6は、第1の実施の形態にかかる対話型機械学習システムの学習モデル部が有するAuto-Encoder構造の一例を説明するための図である。
図7図7は、第1の実施の形態にかかる対話型機械学習システムにおける学習モデル部の損失関数の定義に用いる変数の一例を説明するための図である。
図8図8は、第1の実施の形態にかかる対話型機械学習システムにおける学習モデル部の損失関数の定義に用いる変数の一例を説明するための図である。
図9図9は、第1の実施の形態にかかる対話型機械学習システムの弁別評価部により提示される評価用UIの一例を示す図である。
図10図10は、第1の実施の形態にかかる対話型機械学習システムにおける検証用のデータの一例を説明するための図である。
図11図11は、第2の実施の形態にかかる対話型機械学習システムの一対比較評価における評価用UIの例を示す図である。
図12図12は、第3の実施の形態にかかる対話型機械学習システムの主要部の構成を示したブロック図である。
図13図13は、第3の実施の形態にかかる対話型機械学習システムの機能ブロック図である。
図14図14は、第3の実施の形態にかかる対話型機械学習システムの学習モデル部の損失関数の定義に用いる変数の一例を説明するための図である。
図15図15は、第3の実施の形態にかかる対話型機械学習システムの学習モデル部の損失関数の定義に用いる変数の一例を説明するための図である。
図16図16は、第4の実施の形態にかかる対話型機械学習システムの主要部の構成を示したブロック図である。
図17図17は、第4の実施の形態にかかる対話型機械学習システムの機能ブロック図である。
図18図18は、第4の実施の形態にかかる対話型機械学習システムの圧縮モデルの構成の一例を示す図である。
図19図19は、第4の実施の形態にかかる対話型機械学習システムの表現モデルの構成の一例を示す図である。
図20図20は、第5の実施の形態にかかる対話型機械学習システムの主要部の構成を示したブロック図である。
図21図21は、第5の実施の形態にかかる対話型機械学習システムの機能ブロック図である。
図22図22は、第5の実施の形態にかかる対話型機械学習システムにおける学習モデル部の損失関数の定義に用いる変数の一例を説明するための図である。
図23図23は、第5の実施の形態にかかる対話型機械学習システムにおける学習モデル部の損失関数の定義に用いる変数の一例を説明するための図である。
図24図24は、第6の実施の形態にかかる対話型機械学習システムの主要部の構成の一例を示したブロック図である。
図25図25は、第6の実施の形態にかかる対話型機械学習システムの機能ブロック図である。
図26図26は、第6の実施の形態にかかる対話型機械学習システムの圧縮モデルの構成の一例を示す図である。
図27図27は、第6の実施の形態にかかる対話型機械学習システムの表現モデルの構成の一例を示す図である。
図28図28は、第7の実施の形態にかかる対話型機械学習システムにおける学習機能の一例を説明するための図である。
図29図29は、第9の実施の形態にかかる対話型機械学習システムにおける処理の一例を説明するための図である。
図30図30は、第10の実施の形態にかかる対話型機械学習システムにおける処理の一例を説明するための図である。
図31図31は、第11の実施の形態にかかる対話型機械学習システムにおける処理の一例を説明するための図である。
【発明を実施するための形態】
【0008】
以下に添付図面を参照して、対話型機械学習システム、対話型機械学習方法、およびプログラムの実施の形態を詳細に説明する。
【0009】
人間の知覚の変化は、物理量の変化とは異なることが知られている。特に、色および質感の分野では、視覚の均等知覚空間を取得することが1つの課題となっており、これはカラー・マネジメントおよびカラー・キャリブレーションの基礎として利用されている(非特許文献1参照)。色の均等知覚空間は、CIE L*a*b*空間として一般によく知られており、その生成方法は、主観による色の弁別評価により均等に感じる色弁別楕円を取得し、その色弁別楕円を正円化する変換式を求めることで実施される(非特許文献2参照)。
【0010】
弁別評価および一対比較評価は、視覚の評価をする際に一般的に用いられる手法である。弁別評価および一対比較評価は、SD法と比べて個人差の少ない主観評価方法として知られる一方、データ数の二乗の試行回数を必要とする。例えば、色弁別楕円の生成には数時間を要する。さらに、質感のような多次元の因子が影響する感覚を評価するには、より膨大な試行時間が必要となり、因子数を限定したりデータ数の制約を設けたりする等の工夫を施す必要が生じる。そのため、質感評価においては、データの網羅性および因子設定の信頼性が課題として挙げられる。特許文献1では、色弱者の色知覚特性を効果的に取得する手法を提案している。
【0011】
また、能動学習による対話型機械学習システムが開発されている。能動学習法とは、例えば、創薬開発の現場等で、数十万から数百万個の全化合物の中からターゲットに対する活性を有する化合物を探索する必要があるような場合に、実測と学習とを繰り返すことでより少ない実測回数で高速に学習を行うことを可能とする手法である(特許文献2参照)。
【0012】
従来の能動学習システムとしては、例えば、特許文献3および特許文献4に記載されたものがある。主な能動学習法としては、例えば、Query by boosting法(以下、ブースティング法という)、Query By Committee法(以下、コミッティ法という)、およびQuery By Bagging法(以下、バギング法という)等がある(非特許文献3参照)。非特許文献4では、画像の属性に関する主観評価(一対比較法)において能動学習を用いることで、効率的に画像の属性に関する全順序を求める手法を提案している。しかしながら、非特許文献4および従来の能動学習が扱うモデルおよび能動学習法は、均等知覚空間の表現を想定しておらず、均等知覚空間を取得できない。
【0013】
そこで、本実施の形態にかかる対話型機械学習システムでは、人間の均等知覚空間を効率的に取得することができる対話型機械学習システム、対話型機械学習方法、およびプログラムを提供する。具体的には、均等知覚空間をAuto-Encoderの潜在空間で表現し、かつ均等知覚空間の取得に適した能動学習法(非特許文献5参照)であるQuery by Lattice法(以下、格子点法という)を用いても良い。
【0014】
次に、本実施の形態にかかる対話型機械学習システム、対話型機械学習方法、およびプログラムの第1~7の側面のそれぞれについて説明する。図1aは、本実施の形態にかかる対話型機械学習システムの全体像の一例を示す図である。図1bは、本実施の形態にかかる対話型機械学習システムのブロック図である。図2および図3は、本実施の形態にかかる対話型機械学習システムの機能ブロック図である。
【0015】
第1の側面にかかる対話型機械学習システムでは、主観評価の結果に基づいて学習する能動学習装置であって、少なくとも、主観評価用の入力データのデータ空間を、均等知覚空間としての潜在空間と相互変換するAuto-Encoder構造を持つ学習モデル部を有する。
【0016】
具体的には、第1の側面にかかる対話型機械学習システムは、学習モデル部101、サンプリング部102、および評価用UI部103を有する。
【0017】
学習モデル部101は、Auto-Encoder構造を持ち、その潜在空間が均等知覚空間を表すように学習する。すなわち、学習モデル部101は、Encoder部およびDecoder部を有するAuto-Encoder構造を学習する学習モデル部の一例である。ここで、Encoder部は、入力データのデータ空間を、均等知覚空間としての潜在空間に変換する特徴抽出構造を有する。また、Decoder部は、均等知覚空間に変換されたデータをデータ空間に変換する。
【0018】
サンプリング部102は、格子点法に基づきデータをサンプリングする。すなわち、サンプリング部102は、均等知覚空間に変換された入力データから、評価用データをサンプリングするサンプリング部の一例である。
【0019】
評価用UI部103は、被験者である人物にサンプリングされた評価用データを提示(例えば、表示)し、提示した内容に基づいて被験者が回答するツールである。すなわち、評価用UI部103は、評価用データを人間が評価する評価用UIを提示する評価用UI部の一例である。評価用UI部103が被験者に提示するデータは、人間が知覚できる情報であればよく、例えば、視覚情報、音声情報、触覚情報、味覚情報、嗅覚情報、これらを組み合わせた情報などがあげられる。評価用UI部103は、評価用データに合わせて適切な提示用のハードウェアを備えても良く、例えば、視覚情報に関わる評価用データにはディスプレイ装置を用いてもよく、音声情報に関わる評価用データの提示にはスピーカ装置を用いてもよい。すなわち、評価用UI部103は、人間のあらゆる知覚に関わる主観評価に適用することができる。そして、被験者が回答した結果は、次に学習モデル部101へ入力する学習データ(入力データ)になる。すなわち、学習モデル部101は、評価用UI部103による評価用データの評価結果を入力データとして、特徴抽出構造を含むAuto-Encoder構造を学習する。
【0020】
第2の側面にかかる対話型機械学習システムは、第1の側面にかかる対話型機械学習システムにおいて、サンプリング部102が、均等知覚空間としての潜在空間における格子点と、データ空間における弁別距離に基づくその周辺点と、を評価用データとして能動的に抽出する。第2の側面では、評価用データのサンプリングの方法として格子点法を用いることで、均等知覚空間において均等にデータをサンプリングすることができる。均等知覚空間において均等な格子点を取得することによるサンプリングは、知覚空間の表現において効率的にデータを取得することができる(非特許文献5参照)。
【0021】
第3の側面にかかる対話型機械学習システムは、第1の側面にかかる対話型機械学習システムにおいて、学習モデル部101が、入力データの各座標がデータ空間中で持つ弁別楕円を記憶する。そして、サンプリング部102は、格子点と、当該格子点が持つ弁別楕円中の点である前記周辺点と、を前記評価用データとしてサンプリングする。第3の側面によれば、弁別楕円を記憶し損失関数に利用することで、学習モデル部101がその潜在空間が均等知覚空間を表すように空間を補正することが容易になる。すなわち、第3の側面にかかる対話型機械学習システムは、格子点法を用いることで、均等知覚空間において均等にデータ(格子点)をサンプリングする。これにより、均等知覚空間の表現において効率的にデータを取得することができる(非特許文献5参照)。
【0022】
第4の側面にかかる対話型機械学習システムは、第1の側面にかかる対話型機械学習システムにおいて、評価用UI部103が、弁別評価または一対比較評価(相対評価)により評価用データを評価する評価用UIを提示する。第4の側面によれば、弁別評価または一対比較評価を実施することにより、被験者の技能に依存しない、個人差の少ない評価結果を取得することができる。
【0023】
第5の側面にかかる対話型機械学習システムは、第1の側面にかかる対話型機械学習システムにおいて、入力データの各座標の潜在空間中で持つ弁別楕円を記憶し、損失関数を利用することで、学習モデル部101がその潜在空間が均等知覚空間を表すように空間を補正することを容易にする。
【0024】
第6の側面にかかる対話型機械学習システムは、第1の側面にかかる対話型機械学習システムにおいて、入力データの各座標の潜在空間における弁別楕円を記憶する。これにより、高次元の入力における弁別領域を潜在空間(1次元、2次元、3次元)において定義することができる。
【0025】
第7の側面にかかる対話型機械学習システムは、第1の側面にかかる対話型機械学習システムにおいて、弁別評価または一対比較評価を実施する評価用UI部103を有する。これにより、被験者の技能に依存せず、個人差の少ない結果を取得することができる。
【0026】
第8の側面にかかる対話型機械学習システムは、第1の側面にかかる対話型機械学習システムにおいて、評価用UI部103による評価用データの評価結果に基づいて、潜在空間の補正に関わるパラメータを更新する。
【0027】
具体的には、図4に示すように、学習モデル部101は、まず、入力データ全体を用いて事前学習する。ここで、学習モデル部101は、Auto-Encoder構造のため、教師なしで学習される。その後、図4に示すように、能動学習部分に入る。能動学習部分においては、まず、サンプリング部102が、格子点法に基づいて、サンプリングを実施する。その後、学習モデル部101が、人間による評価を受けて学習データを生成する。学習モデル部101における学習機能は、第1学習機能および第2学習機能の2段階に分かれている。第1学習機能は、弁別楕円を記憶する機能であり、第2学習機能は、潜在空間を補正する部分に関わるパラメータを学習する機能である。その後、終了判定部104が、学習の終了判定を行う。
【0028】
第9の側面にかかる対話型機械学習システムは、第1の側面にかかる対話型機械学習システムにおいて、学習モデル部101、評価用UI部103による評価用データの評価結果に基づいて、弁別楕円のパラメータを更新する。すなわち、学習モデル部101は、評価用UI部103による評価用データの評価結果に基づいて、均等知覚空間において周辺点が正円化されるよう弁別楕円を更新する。
【0029】
第10の側面にかかる対話型機械学習システムは、まず、データ全体を用いて、学習モデルが事前学習される。例えば、学習モデルは、Auto-Encoder構造のため、教師なしで学習される。その後、学習モデルは、能動学習部分に入る。能動学習部分においては、サンプリング部102が格子点法に基づいてサンプリングを実施する。その後、評価用UI部103が、人間による評価結果を受けて学習データを生成する。学習モデル部101における学習は、(1)弁別楕円を記憶(更新)する学習ステップ(第1学習機能)および(2)弁別楕円に基づいて潜在空間を補正する学習ステップ(第2学習機能)の2ステップに分かれており、各ステップに関わるパラメータを学習する。その後、対話型機械学習システムは、学習モデルの学習の終了判定を行う。
【0030】
また、第10の側面にかかる対話型機械学習システムは、第1の側面にかかる対話型機械学習システムにおいて、弁別楕円を更新する学習ステップと、更新された弁別楕円に基づいて均等知覚空間を更新する学習ステップと、を別々に有する。第6の側面では、2段階学習を採用することにより、1つのモデルが(1)弁別楕円を記憶する学習ステップ、(2)潜在空間を補正する学習ステップを精度よく実現できる。
【0031】
第11の側面にかかる対話型機械学習システムは、第1の側面にかかる対話型機械学習システムにおいて、学習モデルの学習進度を評価する終了判定部104を有する。具体的には、第7の側面にかかる対話型機械学習システムは、学習モデルの学習進度としての損失関数が所定基準を満たした場合、学習モデルの学習を終了させる終了判定部104を備える。
【0032】
第12の側面にかかる対話型機械学習システムでは、終了判定を利用することで、損失減少に依存しない終了の目安を与えることができる。能動学習においては、次に学習するデータはより判定が難しくなるように選出される。そのため、能動学習において損失は減少していくとは限らず、その低下の程度を見て終了を判定することは難しい。そこで、損失の変化がなくなった時点を、モデルの更新が終了した時点と決めて学習を終了させることを行う。
【0033】
第13の側面にかかる対話型機械学習システムによれば、第1の側面にかかる対話型機械学習システムにおいて、学習モデル部101が、入力データの一例である画像の属性(例えば、人間の評価)に基づいて潜在空間を整列化する。第1学習機能および第2学習機能の2段階学習において、第2学習機能の潜在空間の補正では、弁別領域(楕円)が正円になるように潜在空間が補正される。そのため、潜在空間における順序の入れ替えを行いたい場合には、潜在空間の整列化を施す必要がある。具体的な内容については、第7の実施の形態に記載する。
【0034】
第14の側面にかかる対話型機械学習システムによれば、第1の側面にかかる対話型機械学習システムにおいて、学習モデル部101が、弁別楕円の内側と外側の差に基づいて、特徴抽出構造の学習を収束する収束機能を有する。第10の側面にかかる対話型機械学習システムおける終了判定部104は、損失の変化がなくなった時点を学習終了の目安としている。しかし、学習モデル部101自体が収束させる機能を有していれば、終了判定を行う必要はない。具体的な内容については、第8の実施の形態に記載する。
【0035】
(第1の実施の形態)
図4は、第1の実施の形態にかかる対話型機械学習システムの主要部の構成を示したブロック図である。図5は、第1の実施の形態にかかる対話型機械学習システムの機能ブロック図である。図6は、第1の実施の形態にかかる対話型機械学習システムの学習モデル部が有するAuto-Encoder構造の一例を説明するための図である。
【0036】
本実施の形態にかかる対話型機械学習システムは、CIE xy空間からCIE LAB空間(L=50)を取得することを目的とする能動学習システムである。つまり、本実施の形態にかかる対話型機械学習システムは、2次元のxyから、2次元のa*b*を求めるモデルを生成する。ここで、RGBでなくxyとした理由は、輝度値Lを固定することで入力を2次元とするためである。
【0037】
本実施の形態にかかる対話型機械学習システムは、図4に示すように、学習モデル部101と、サンプリング部102と、評価用UI部103と、を主な構成として有する。
【0038】
事前学習では、xyの様々な組み合わせの色データを入力として教師なし学習を行う。サンプリング部102における弁別評価では、提示された2色が同じか異なるかを二値で評価する。
【0039】
学習モデル部101は、Auto-Encoder構造を有している。Auto-Encoder構造は、図6に示すように、Encoder部とDecoder部を有し、Encoder部とDecoder部間の変数が存在する空間を潜在空間と呼ぶ。Encoder部は、入力された色(xy)を圧縮した潜在変数を出力するだけでなく、その色(xy)における弁別楕円のパラメータの出力も行う。Encoder部およびDecoder部のそれぞれの入出力は、色のxyとa*b*であり、これはxy-L*a*b*変換式(非特許文献2参照)により正解を求めることができる。
【0040】
ここで、学習モデル部101の損失関数について説明する。学習モデル部101には、(1)楕円パラメータを推定する学習ステップ(第1学習機能)および(2)潜在空間を表現する学習ステップ(第2学習機能)の2つの機能に関わる損失関数を定義する。
【0041】
図7および図8は、第1の実施の形態にかかる対話型機械学習システムにおける学習モデル部の損失関数の定義に用いる変数の一例を説明するための図である。(1)楕円パラメータの推定については、図7に記載の変数を用いた下記の式(1)の4つの損失項Ls,Lo,Lj,Lbを用いる。ここで、Lsはサンプリング距離について制約する項であり、Loは、変数の大小関係や正負を制御する項である。Ljは判定損失であり、正しい判定を行えば低くなる。Lbは、境界損失であり、評価している外側と内側のサンプリングデータがそれぞれ「異」「同」と判定されれば低くなる。
【数1】
【0042】
(2)潜在空間の表現については、下記の式(2)の損失項を用いる。変数は、図8に準拠し、弁別楕円が潜在空間中で弁別閾を表すようにする。
【数2】
ここで、||sa||は、サンプリング距離に依存するため、サンプリング距離の更新と空間補正の更新を両立するのは困難である。そこで、(1)楕円パラメータの推定および(2)潜在空間の表現交互に学習することで、サンプリング距離の更新と潜在空間の更新を実現する。
【0043】
次に、サンプリング部102について説明する。サンプリング部102は、潜在空間が2次元のため、2次元空間中に等間隔な格子点を作成する。そして、サンプリング部102は、作成した格子点がデータ空間中で持つ弁別楕円(内側と外側の両者)に基づいて、任意の角度を用いて弁別楕円中の点(周辺点)をサンプリングする。このとき、弁別楕円の内側と外側に基づく周辺点のサンプリングでは、任意の角度は共有される。
【0044】
次に、弁別評価部(評価用UI部103)について説明する。図9は、第1の実施の形態にかかる対話型機械学習システムの弁別評価部により提示される評価用UIの一例を示す図である。弁別評価においては、被験者は、評価用UIに表示された2色を観察し、両者が同じと感じれば左キー、異なると感じれば右キーを入力する。そして、弁別評価による評価判定が32回終了すると、学習モデル部101における学習ステップへ移行する。
【0045】
ここで、正解との比較について説明する。図10は、第1の実施の形態にかかる対話型機械学習システムにおける検証用のデータの一例を説明するための図である。検証用のデータ(以下、検証用データという)として、図10(a)に記載のL*a*b*空間(L=50)における正円をxyに変換したものを用いる。この検証用データを事前学習後のモデルで圧縮すると、図10(b)のような分布が得られ、円の中心点に対して、周辺点が正円ではなく楕円状になっていることがわかる。これは、事前学習後のモデルが、均等な知覚空間を表現できていないことを表す。
【0046】
一方、本能動システム(対話型機械学習システム)で10分ほど学習済みのモデルで検証用データを圧縮すると、図10(c)のような分布が得られ、入力した検証用データ(図10(a)参照)とほぼ同様の分布であることがわかる。これは、学習後のモデルが、十分に均等な知覚空間を表現できており、xy空間からL*a*b*空間に変換するモデルが得られたことを意味する。
【0047】
次に、学習済みモデルの利用例について説明する。学習済みモデルは、データ空間と均等知覚空間を相互変換する変換関数とみなせるため、xy色空間からL*a*b*色空間の変換関数であるxy→L*a*b*と同様に扱える。つまり、2つのデータの色差を、均等知覚空間上の距離として計算できる。また、均等知覚空間における原点(灰色)からの距離によって、色の彩度を計算することができる。
【0048】
学習済みモデルを変換関数として用いるのは、パラメータのメモリ上、好ましくない場合がある。その場合は、学習済みモデルを簡単な数式に置き換えることが考えられる。例えば、ランダムなデータを、学習済みモデルを用いて均等知覚空間上の数値に変換した後、データと均等知覚空間上の数値を入力として、数式の重回帰モデルを学習することが考えられる。
【0049】
このように、第1の実施の形態にかかる対話型機械学習システムによれば、主観評価に能動学習を適用することにより、簡単な評価方法を用いて、人間の均等知覚空間を効率的に取得することができる。
【0050】
(第2の実施の形態)
本実施の形態は、評価UI部における評価を弁別評価から一対比較評価(相対評価)に変え、それに応じて損失関数を変えた例であり、学習モデルの構成およびサンプリングについては、第1の実施の形態と同様である。
【0051】
本実施形態における学習モデル部101の損失関数について説明する。本実施の形態においても、第1の実施の形態と同様に、(1)楕円パラメータを推定する学習ステップおよび(2)潜在空間を表現するステップの2つの機能に関わる損失関数を定義する。(2)潜在空間の表現については、第1の実施の形態と同様のため説明を割愛する。以下では、(1)楕円パラメータの推定の損失関数について説明する。
【0052】
(1)楕円パラメータの推定については、図7に記載の変数を用いた下記の式(3)の3つの損失項Ls,Lo,Ljを用いる。Ls,Loは、第1の実施の形態と同様である。Ljは、判定損失であり、正しく推定できれば小さな値をとる。Ljの意味合いとしては、“近い方が弁別範囲に含まれる”となる。
【数3】
【0053】
次に、相対評価部(評価用UI部103)について説明する。図11は、第2の実施の形態にかかる対話型機械学習システムの一対比較評価における評価用UIの例を示す図である。相対評価において、被験者は、評価用UIに表示の2色および中央に表示の基準色を観察し、両者のうちどちらが基準色に近いかを判定する。左の色の方が基準色に近いと感じれば左キー、右の色の方が基準色に近いと感じれば右キーを入力する。相対評価による評価判定が16回終了すると、学習モデル部101における学習ステップへ移行する。
【0054】
このように、第2の実施の形態にかかる対話型機械学習システムによれば、一対比較評価を実施することにより、被験者の技能に依存しない、個人差の少ない評価結果を取得することができる。
【0055】
(第3の実施の形態)
本実施の形態は、入出力するデータの次元を2次元から3次元に変え、それに応じてモデルを3次元対応させた例である。上述の実施の形態と同様の構成については説明を省略する。
【0056】
図12は、第3の実施の形態にかかる対話型機械学習システムの主要部の構成を示したブロック図である。本実施の形態にかかる対話型機械学習システムは、CIE xy空間および輝度値LからCIE LAB空間を取得することを目的とする能動学習システムである。つまり、3次元のxyLから、3次元のL*a*b*を求めるモデルを生成する。
【0057】
図13は、第3の実施の形態にかかる対話型機械学習システムの機能ブロック図である。図14および図15は、第3の実施の形態にかかる対話型機械学習システムの学習モデル部の損失関数の定義に用いる変数の一例を説明するための図である。本実施の形態にかかる対話型機械学習システムでは、事前学習部において、xyLのさまざまな組み合わせの色データを入力として教師なし学習を行う。
【0058】
本実施の形態では、学習モデル部101は、第1の実施の形態と同様に、Auto-Encoder構造を有しており、Encoder部とDecoder部を有する。Encoder部は、入力された色(xyL)を圧縮した潜在変数を出力するだけでなく、そのxyLにおける弁別楕円のパラメータの出力も行う。弁別楕円は、各軸方向の半径および2つの回転角度によって定義される。それぞれの入出力は、色のxyLとL*a*b*であり、これはxy-L*a*b*変換式(非特許文献2参照)により正解を求めることができる。
【0059】
ここで、学習モデル部101の損失関数について説明する。学習モデル部101には、第1の実施の形態と同様に、(1)楕円パラメータを推定する学習ステップ(第1学習機能)および(2)潜在空間を表現する学習ステップ(第2学習機能)の2つの機能に関わる損失関数を定義する。
【0060】
(1)楕円パラメータの推定については、図14に記載の変数を用いた下記の式(4)の4つの損失項Ls,Lo,Lj,Lbを用いる。Lsはサンプリング距離について制約する項であり、Loは変数の大小関係や正負を制御する項である。Ljは判定損失であり、正しい判定を行えば低くなる。Lbは境界損失であり、評価している外側と内側のサンプリングデータがそれぞれ「異」「同」と判定されれば低くなる。
【数4】
【0061】
また、(2)潜在空間の表現については、下記の式(5)の損失項を用いる。変数は、図15に準拠し、弁別楕円の内側と外側の中心点が、潜在空間中で弁別閾を表すようにする。
【数5】
【0062】
次に、サンプリング部102について説明する。サンプリング部102は、潜在空間が3次元のため、3次元空間中に等間隔な格子点を作成する。そして、サンプリング部102は、その格子点がデータ空間中で持つ弁別楕円(内側と外側の両者)に基づいて、任意の角度を用いて弁別楕円中の点をサンプリングする。このとき、弁別楕円の内側と外側に基づくサンプリングでは、任意の角度は共有される。
【0063】
このように、第3の実施の形態にかかる対話型機械学習システムによれば、入出力の次元を2次元から3次元に変えた場合でも、上述の実施の形態と同様の作用効果を得ることができる。
【0064】
(第4の実施の形態)
本実施の形態は、n次元の画像から1次元の自然さを表す軸を求める学習モデルを生成する例である。以下の説明では、上述の実施の形態と同様の構成については説明を省略する。
【0065】
図16は、第4の実施の形態にかかる対話型機械学習システムの主要部の構成を示したブロック図である。本実施の形態にかかる対話型機械学習システムは、画像から属性である自然さにかかわる知覚空間を取得することを目的とする能動学習システムである。つまり、本実施の形態にかかる対話型機械学習システムは、n次元(n>3)の画像から、1次元の自然さを表す軸を求めるモデルを生成する。
【0066】
図17は、第4の実施の形態にかかる対話型機械学習システムの機能ブロック図である。図18は、第4の実施の形態にかかる対話型機械学習システムの圧縮モデルの構成の一例を示す図である。図19は、第4の実施の形態にかかる対話型機械学習システムの表現モデルの構成の一例を示す図である。本実施の形態にかかわる対話型機械学習システムでは、まず、図17に示す圧縮モデルの定義と事前学習を行う。ここで、圧縮モデルは、n次元の画像を2次元に圧縮するモデルであり、Auto-Encoder構造および主要なノード(主成分)を選択する手法(非特許文献6参照)を用いる。その後、図19に示す均等知覚空間を表す表現モデルの定義と事前学習を行う。それぞれの表現モデルの事前学習は、画像および画像の2主成分の重みを入力として教師なし学習を行う。
【0067】
被験者は、評価用UI部103により提示される評価用UIの2画像および中央に表示の基準画像を観察し、両者のうちどちらが基準画像に近いかを判定する。2画像のうち左の色の方が基準画像に近いと感じれば左キー、2画像のうち右の色の方が基準画像に近いと感じれば右キーを入力する。相対評価による評価判定が16回終了すると、学習モデル部101における学習ステップへ移行する。
【0068】
本実施の形態では、圧縮モデルおよび表現モデルは、Auto-Encoder構造を有している。圧縮モデルでは、Encoder部は入力された画像を圧縮した潜在変数を出力し、その後、非主要な2ノード(2主成分)の重みを出力する(特許文献6参照)。表現モデルでは、Encoder部は入力された2主成分の重みを圧縮するだけでなく、その画像における弁別楕円のパラメータの出力も行う。圧縮モデルおよび表現モデルの損失関数、およびサンプリング部102については、第1の実施の形態と同様のため説明を割愛する。
【0069】
このように、第4の実施の形態にかかる対話型機械学習システムによれば、次元の画像から1次元の自然さを表す軸を求める学習モデルを生成する場合においても、第1の実施の形態と同様の作用効果を得ることができる。
【0070】
(第5の実施の形態)
本実施の形態は、弁別領域(例えば、弁別楕円)の記憶を、データ空間中ではなく潜在空間中で行う(以下、弁別領域の潜在記憶という)例である。以下の説明では、第3の実施の形態と同様の構成については説明を省略する。
【0071】
図20は、第5の実施の形態にかかる対話型機械学習システムの主要部の構成を示したブロック図である。本実施の形態にかかる対話型機械学習システムは、CIE RGB空間からCIE LAB空間(L=50)を取得することを目的とする能動学習システムである。
【0072】
まず、弁別領域の潜在記憶について詳細を説明する。図21は、第5の実施の形態にかかる対話型機械学習システムの機能ブロック図である。図22および図23は、第5の実施の形態にかかる対話型機械学習システムにおける学習モデル部の損失関数の定義に用いる変数の一例を説明するための図である。本実施の形態にかかる対話型機械学習システムの第3の実施の形態との差分は、3ステップ目の弁別領域の潜在記憶の初期化が含まれる点である。図21の6ステップ目(第1学習機能)で新しい潜在記憶を更新し、それに基づいて7ステップ目(第2学習機能)で潜在空間の補正を行う。弁別領域の潜在記憶は、図22中の弁別距離に基づいて初期化する。
【0073】
この手法のメリットは、様々な形状の弁別楕円で補正を繰り返すことによって、元々の弁別領域が楕円以外の複雑な形状の場合にも対応できる点である。もう1つのメリットとして、入力が何次元であろうと、出力が3次元以下の低次元空間であれば、図21の学習(2)の学習ステップにおける潜在空間の補正を簡単に行える点である。もし、潜在空間をn次元(n>3)とする場合、図23のAnをn次元の楕円として表現する必要があり、楕円の位置を求める式が複雑になる。複雑なこの式を学習構造に含めるのは実装が困難なため、できるだけ低次元の潜在空間を扱う方が好ましい。
【0074】
モデルの構成については第3の実施の形態と同様である。
【0075】
次に、モデルの損失関数について説明する。モデルは、第3の実施の形態と同様、(1)楕円パラメータを推定する学習ステップおよび(2)潜在空間を表現する学習ステップの2つの機能に関わる損失関数を有する。以下では、それぞれの損失関数について以下に説明する。
【0076】
(1)楕円パラメータの推定については、図22に記載の変数を用いた下記の式(6)の損失項Ljを用いる。Ljは判定損失であり、正しい判定を行えば低くなる。
【数6】
【0077】
(2)潜在空間の表現についてには、下記の式(7)の損失項Ldを用いる。変数は、図23に準拠し、弁別楕円が潜在空間中で弁別閾を表すようにする。
【数7】
ここで、||sa||はサンプリング距離に依存するため、サンプリング距離の更新と空間補正の更新を両立するのは困難である。そこで、第3の実施の形態と同様に、(1)楕円パラメータの推定および(2)潜在空間の表現を交互に学習することで、サンプリング距離の更新と潜在空間の更新を実現する。
【0078】
次に、サンプリング部102について説明する。サンプリング部102は、潜在空間が2次元のため、2次元空間中に等間隔な格子点を作成する。そして、サンプリング部102は、その格子点が潜在空間中で持つ弁別楕円に基づいて、任意の角度を用いて弁別楕円中の点をサンプリングする。
【0079】
第1の実施の形態では、内側と外側の弁別領域の点をサンプリングしている。しかし、弁別領域の潜在記憶においては、内側と外側の弁別領域の差分を徐々に狭めていくことができない。そこで、本実施の形態では,サンプリング部102は、弁別領域中のある点と90度の角度をなす点をサンプリングする。こうすることで、楕円のパラメータの推定の精度を高めることができる。
【0080】
このように、第5の実施の形態にかかる対話型機械学習システムによれば、弁別楕円のパラメータの推定精度を向上させることができる。
【0081】
(第6の実施の形態)
本実施の形態は、弁別領域を潜在記憶とする点である。以下の説明では、第4の実施の形態と同様の構成については説明を省略する。
【0082】
図24は、第6の実施の形態にかかる対話型機械学習システムの主要部の構成の一例を示したブロック図である。図25は、第6の実施の形態にかかる対話型機械学習システムの機能ブロック図である。図26は、第6の実施の形態にかかる対話型機械学習システムの圧縮モデルの構成の一例を示す図である。図27は、第6の実施の形態にかかる対話型機械学習システムの表現モデルの構成の一例を示す図である。本実施の形態にかかる対話型機械学習システムは、図24に示すように、圧縮モデルの定義と事前学習を行う。圧縮モデルは、n次元の画像をm次元(m<n,m>3)に圧縮するモデルである。その後、本実施の形態にかかる対話型機械学習システムは、図27に示す均等知覚空間を表す表現モデルの定義と事前学習を行う。
【0083】
それぞれのモデルの事前学習は、画像および画像のm次元成分の重みを入力として教師なし学習を行う。被験者は、評価用UI部103により提示される評価用UIの2画像および中央に表示の基準画像を観察し、2画像のうちどちらが基準画像に近いかを判定する。2画像のうち左の色の方が基準画像に近いと感じれば左キー、2画像のうち右の色の方が基準画像に近いと感じれば右キーを入力する。相対評価による評価判定が16回終了すると、学習モデル部101の学習ステップへ移行する。
【0084】
次に、学習モデル部101の構成について説明する。学習モデル部101は、圧縮モデルおよび表現モデルを有する。圧縮モデルおよび表現モデルは、Auto-Encoder構造を有している。圧縮モデルでは、図26に示すように、Encoder部は、入力された画像を圧縮した潜在変数を出力する。表現モデルでは、図27に示すように、Encoder部は入力されたm次元成分の重みを圧縮するだけでなく、その画像における弁別楕円のパラメータの出力も行う。
【0085】
モデルの損失関数およびサンプリング部102については、第1の実施の形態と同様のため説明を割愛する。弁別領域の潜在記憶を用いることによる、第4の実施の形態からの改善点は、表現モデルの入力の次元を向上できる点である。この入力次元が小さすぎると、元の画像に復元することが困難になる。
【0086】
このように、第6の実施の形態にかかる対話型機械学習システムによれば、弁別領域の潜在記憶を用いることにより、表現モデルの入力の次元を向上させることができる。
【0087】
(第7の実施の形態)
本実施の形態は、入力データの一例である画像の属性に基づいて潜在空間を整列化する例である。以下の説明では、第6の実施の形態と同様の構成については説明を省略する。
【0088】
図28は、第7の実施の形態にかかる対話型機械学習システムにおける学習機能の一例を説明するための図である。本実施の形態では、図25に示す学習モデル部101の第2学習機能に、入力データの一例である画像の属性に基づく潜在空間の整列化が追加されている。ここで、画像の属性に基づいて、画像群を並べ替えかつ均等知覚空間を生成するタスクを考える。画像の属性は、画像から受ける抽象的な印象であっても良く、例えば、人物が笑っている度合い、スポーティさ、自然を含んでいる度合いである。
【0089】
色の場合と異なり、画像の属性の場合は、入力データが属性順に並んでいないため、それらを整列化する必要がある。従来研究のDeep Relative Attributes(非特許文献9参照。以下、DRAと言う。)では、図28に示すように、2つの画像(入力画像)のそれぞれの特徴量を抽出し、抽出した各入力画像の特徴量を入力としてランキングを出力するランキング推定部2801と、2つのランキングから2つの入力画像の関係性(例えば、2つの入力画像のうちどちらが属性について強いか)を判定する関係推定部2802と、を有する。本実施の形態では、関係推定部2802を、図25に示す学習モデル部101の第2学習機能に組み込むことで、画像の属性に基づく潜在空間の並べ替えおよび均等知覚空間の生成を行う。
【0090】
潜在空間の表現には、下記の式(8)の損失項を用いても良い。変数は、図15に準拠し、弁別楕円の内側と外側の中心点が、潜在空間中で弁別閾を表すようにする。また、これに潜在空間の整列化のための損失Laを加える。
【数8】
【0091】
ここで、tは、正解の関係性(主観評価の結果と同義)、pは推定した関係性を表し、下記の式(9)で計算される。
【数9】
【0092】
ここでr1とr2は、それぞれ、図27に示す自然さを表す1次元の値である。
【0093】
このように、第7の実施の形態にかかる対話型機械学習システムによれば、画像の属性に基づく潜在空間の並べ替えおよび均等知覚空間の生成が可能となる。
【0094】
(第8の実施の形態)
本実施の形態は、弁別楕円の内側と外側の差に基づいて収束化する例である。以下の説明では、第7の実施の形態と同様の構成については説明を省略する。
【0095】
本実施の形態では、学習モデル部101の第2学習機能に、弁別楕円の内側と外側の差に基づいて収束化する機能が追加されている。潜在空間の表現については、下記の式(10)に示す損失項を用いる。変数は、図15に準拠し、Ldは楕円を正円化するための損失、Laは整列化のための損失であり、そこに特徴抽出構造の学習の収束化のための損失Lcを加える。さらに、重みdでLとLcを、下記の式(10)のように、それぞれ重みづける。
【数10】
ここで、zはあるデータxをエンコードした潜在変数であり、z’は学習前の潜在変数を表す。重みdは内側と外側の楕円の差を表しており、これが小さくなるほどLは固定(収束)されることになる。
【0096】
これにより、第8の実施の形態にかかる対話型機械学習システムによれば、学習モデル部101自体が収束させる機能を有するので、終了判定を行う必要が無くなる。
【0097】
(第9の実施の形態)
本実施の形態は、モデルの差を可視化する例である。以下の説明では、上述の実施の形態と同様の構成については説明を省略する。
【0098】
図29は、第9の実施の形態にかかる対話型機械学習システムにおける処理の一例を説明するための図である。本実施の形態にかかる対話型機械学習システムは、ある入力データに対する均等知覚空間を簡単に生成することを可能とするため、被験者一人一人の均等知覚空間を生成することが容易である。例えば、被験者A、被験者Bの均等知覚空間をそれぞれUA、UBとして生成した場合を想定する。均等知覚空間UA上に均等知覚空間UBの弁別領域をプロットすれば、相対的な感度の高低を潜在空間中で可視化することができる。
【0099】
具体的には、まず、均等知覚空間UA空間中で中心データをランダムに生成し、各中心データの円周上に比較データをプロットする(図28(a)参照)。中心データおよび比較データをデコードしたものを、均等知覚空間UB中にエンコードする。その結果の例が、図29(b)である。均等知覚空間UAと均等知覚空間UBが異なるとき、均等知覚空間UA中での正円は、均等知覚空間UB中での楕円として表現される。この楕円を観察することで、被験者Aと被験者Bの感覚の差を知ることができる。
【0100】
このように、第9の実施の形態にかかる対話型機械学習システムによれば、色,質感,画像の属性といった入力データに対する均等知覚空間を、少ない主観評価だけで生成することを可能にする。そのため、被験者毎に均等知覚空間を生成することが容易であり、それらを比べることで被験者毎の知覚の差を可視化することが可能であるモデル間の間隔の差を知ることができる。
【0101】
(第10の実施の形態)
本実施の形態は、均等知覚空間の生成を、認識タスクへ応用した例である。以下の説明では、上述の実施の形態と同様の構成については説明を省略する。
【0102】
図30は、第10の実施の形態にかかる対話型機械学習システムにおける処理の一例を説明するための図である。本実施の形態にかかる対話型機械学習システムでは、ある入力データに対する人間の感覚を等間隔に表現する均等知覚空間を生成する。例えば、数字のデータセットMNISTに対する均等知覚空間を生成すると、各数字らしさを等間隔に分布した均等知覚空間が生成される。すると、もっともその数字らしい“核データ”と、その数字を認識できる弁別領域と、が得られることになる。
【0103】
このように、第10の実施の形態にかかる対話型機械学習システムによれば、核データからの距離に応じて、あるデータがどのクラスに分類されるかを判断可能である。さらに、弁別領域が明確になるため、数字間のあいまいで判断しづらい文字についても、人間が感じるように分類することが可能である。すなわち、生成した均等知覚空間に基づいた認識,認証,探索,異常検知等の他タスクへの応用も可能である。
【0104】
(第11の実施の形態)
本実施の形態は、均等知覚空間の生成を、データの再構築に応用した例である。以下の説明では、上述の実施の形態と同様の構成については説明を省略する。
【0105】
図31は、第11の実施の形態にかかる対話型機械学習システムにおける処理の一例を説明するための図である。再構築したデータセットは、より認識が困難なデータを含むため、それを学習する他のモデルを通常のデータセット(再構築前のデータセット)で学習するよりも精度を向上させることができる。
【0106】
本実施の形態にかかる対話型機械学習システムは、あるデータに対する人間の感覚を等間隔に表現する均等知覚空間を生成する。例えば、数字のデータセットMNISTに対する均等知覚空間を生成すると、各数字らしさを等間隔に分布した均等知覚空間が生成される。すると、もっともその数字らしい核データと、その数字を認識できる弁別領域と、が得られることになる。核データから遠く、かつ弁別領域内のデータをデコードすることで、新しくかつ認識が困難なデータを生成することができる。さらに、複数の核データの中間点に近いデータを生成することで、分類間違いしやすいデータを新しく生成することも可能である。
【0107】
このように、第11の実施の形態にかかる対話型機械学習システムによれば、再構築したデータセットは、より認識が困難なデータを含むため、それを学習する他のモデルを通常のデータセットで学習するよりも精度を向上させることができる。
【0108】
なお、本実施の形態の対話型機械学習システムで実行されるプログラムは、ROM(Read Only Memory)等に予め組み込まれて提供される。本実施の形態の対話型機械学習システムで実行されるプログラムは、インストール可能な形式又は実行可能な形式のファイルでCD-ROM、フレキシブルディスク(FD)、CD-R、DVD(Digital Versatile Disk)等のコンピュータで読み取り可能な記録媒体に記録して提供するように構成してもよい。
【0109】
さらに、本実施の形態の対話型機械学習システムで実行されるプログラムを、インターネット等のネットワークに接続されたコンピュータ上に格納し、ネットワーク経由でダウンロードさせることにより提供するように構成しても良い。また、本実施の形態の対話型機械学習システムで実行されるプログラムをインターネット等のネットワーク経由で提供または配布するように構成しても良い。
【0110】
本実施の形態の対話型機械学習システムで実行されるプログラムは、上述した各部(学習モデル部101、サンプリング部102、評価用UI部103、終了判定部104)を含むモジュール構成となっており、実際のハードウェアとしてはプロセッサの一例であるCPU(Central Processing Unit)が上記ROMからプログラムを読み出して実行することにより上記各部が主記憶装置上にロードされ、学習モデル部101、サンプリング部102、評価用UI部103、終了判定部104が主記憶装置上に生成されるようになっている。
【0111】
本発明の態様は、例えば、以下のとおりである。
【0112】
<1> 主観評価用の入力データのデータ空間を、均等知覚空間としての潜在空間に変換する特徴抽出構造を学習する学習モデル部と、
前記均等知覚空間に変換された前記入力データから、評価用データをサンプリングするサンプリング部と、
前記評価用データを人間が評価する評価用UIを提示する評価用UI部と、を備え、
前記学習モデル部は、前記評価用UIによる前記評価用データの評価結果を前記入力データとして、前記特徴抽出構造を学習する、対話型機械学習システム。
【0113】
<2> 前記学習モデル部は、特徴抽出構造を有するEncoder部と、前記均等知覚空間に変換された前記データを前記データ空間に変換するDecoder部と、を有するAuto-Encoder構造を有する、<1>に記載の対話型機械学習システム。
【0114】
<3> 前記サンプリング部は、前記均等知覚空間としての潜在空間における格子点と、前記データ空間における弁別距離に基づくその周辺点と、を前記評価用データとしてサンプリングする、<2>に記載の対話型機械学習システム。
【0115】
<4> 前記学習モデル部は、前記入力データの各座標が前記データ空間中で持つ弁別楕円を記憶し、
前記サンプリング部は、前記格子点と、当該格子点が持つ前記弁別楕円中の点を前記周辺点と、を前記評価用データとしてサンプリングする、<3>に記載の対話型機械学習システム。
【0116】
<5> 前記学習モデル部は、前記入力データの各座標の前記潜在空間における弁別楕円を記憶し、
前記サンプリング部は、前記格子点と、当該格子点が持つ前記弁別楕円中の点を前記周辺点と、を前記評価用データとしてサンプリングする、<3>に記載の対話型機械学習システム。
【0117】
<6> 前記評価用UI部は、弁別評価または一対比較評価により前記評価用データを評価する前記評価用UIを提示する、<4>に記載の対話型機械学習システム。
【0118】
<7> 前記学習モデル部は、前記評価用UI部による前記評価用データの評価結果に基づいて、前記均等知覚空間において前記周辺点が正円化されるよう前記弁別楕円を更新する、<6>に記載の対話型機械学習システム。
【0119】
<8> 前記学習モデル部は、前記弁別楕円を記憶する学習ステップと、前記弁別楕円に基づいて前記均等知覚空間を更新する学習ステップと、を別々に有する、<4>または<5>に記載の対話型機械学習システム。
【0120】
<9> 前記特徴抽出構造の学習進度としての損失関数が所定基準を満たした場合、前記学習モデル部における前記特徴抽出構造の学習を終了させる終了判定部をさらに備える<1>から<7>のいずれか一に記載の対話型機械学習システム。
【0121】
<10> 前記入力データは、画像であり、
前記学習モデル部は、前記画像の属性に基づいて前記潜在空間を整列化する、<1>から<9>のいずれか一に記載の対話型機械学習システム。
【0122】
<11> 前記学習モデル部は、前記弁別楕円の内側と外側の差に基づいて、前記特徴抽出構造の学習を収束する、<4>から<8>のいずれか一に記載の対話型機械学習システム。
【0123】
<12> 対話型機械学習システムで実行される対話型機械学習方法であって、
主観評価用の入力データのデータ空間を、均等知覚空間としての潜在空間に変換する特徴抽出構造を学習するステップと、
前記均等知覚空間に変換された前記入力データから、評価用データをサンプリングするステップと、
前記評価用データを人間が評価する評価用UIを提示するステップと、
前記評価用UIによる前記評価用データの評価結果を前記入力データとして、前記特徴抽出構造を学習するステップと、
を含む対話型機械学習方法。
【0124】
<13> コンピュータを、
主観評価用の入力データのデータ空間を、均等知覚空間としての潜在空間に変換する特徴抽出構造を学習する学習モデル部と、
前記均等知覚空間に変換された前記入力データから、評価用データをサンプリングするサンプリング部と、
前記評価用データを人間が評価する評価用UIを提示する評価用UI部と、して機能させ、
前記学習モデル部は、前記評価用UIによる前記評価用データの評価結果を前記入力データとして、前記特徴抽出構造を学習する、プログラム。
【符号の説明】
【0125】
101 学習モデル部
102 サンプリング部
103 評価用UI部
104 終了判定部
【先行技術文献】
【特許文献】
【0126】
【特許文献1】特開2019-162400号公報
【特許文献2】特許第5044980号公報
【特許文献3】特開平11-316754号公報
【特許文献4】特開2005-107743号公報
【非特許文献】
【0127】
【非特許文献1】Abhay Sharma, “Understanding color management”, John Wiley & Sons, 2018.
【非特許文献2】David L MacAdam, “Visual sensitivities to color differences in daylight.“, Josa, 32(5):247-274, 1942.
【非特許文献3】森下慎一編集、宮野悟編集、「発見科学とデータマイニング」、初版、共立出版、2001年6月、p.318
【非特許文献4】J.Tompkin, “Criteria Sliders: Learning Continuous Database Criteria via Interactive Ranking”, CVPR, 2017.
【非特許文献5】山本真史,3D-LUT によるディスプレイの色再現方式に関する研究,視覚情報基礎研究会,第25回,2015年
【非特許文献6】Ya Ju Fan, “Autoencoder node saliency : Selecting relevant latent representations”, Pattern Recognition (2018).
【非特許文献7】Chung Mu-Huan, “Interactive Machine Learning for Data Exfiltration Detection: Active Learning with Human Expertise”, IEEE Conference Proceedings, 2020.
【非特許文献8】Saleema Amershi, “Power to the People: The Role of Humans in Interactive Machine Learning”, AI Magazine, 2014.
【非特許文献9】Souri, Y.; Noury, E.; and Adeli, E. 2016. Deep relative attributes. In Asian conference on computer vision, 118-133. Springer.
図1a
図1b
図2
図3
図4
図5
図6
図7
図8
図9
図10
図11
図12
図13
図14
図15
図16
図17
図18
図19
図20
図21
図22
図23
図24
図25
図26
図27
図28
図29
図30
図31