特許7143906 | 知財ポータル「IP Force」

知財求人 - 知財ポータルサイト「IP Force」

▶ 沖電気工業株式会社の特許一覧

特許7143906情報処理装置、情報処理方法およびプログラム

書誌要約請求の範囲詳細な説明課題実施例実施するための形態図面の説明

目に優しい文字サイズ小中大 PDF Top

< >

1
2
3
4
5
6
7
8
9
10
11

(19)【発行国】日本国特許庁(JP)

(12)【公報種別】特許公報(B2)

(11)【特許番号】

(24)【登録日】2022-09-20

(45)【発行日】2022-09-29

(54)【発明の名称】情報処理装置、情報処理方法およびプログラム

(51)【国際特許分類】

G06N 3/08 20060101AFI20220921BHJP

【ＦＩ】

G06N3/08

【請求項の数】 20

(21)【出願番号】P 2021005087

(22)【出願日】2021-01-15

(65)【公開番号】P2022109664

(43)【公開日】2022-07-28

【審査請求日】2021-01-15

【国等の委託研究の成果に係る記載事項】（出願人による申告）国等の委託研究の成果に係る特許出願（国立研究開発法人新エネルギー・産業技術総合開発機構「高効率・高速処理を可能とするＡＩチップ・次世代コンピューティングの技術開発／革新的ＡＩエッジコンピューティング技術の開発／ソフトテンソルプロセッサによる超広範囲センシングＡＩエッジ技術の研究開発」委託研究、産業技術力強化法第１７条の適用を受ける特許出願）

(73)【特許権者】

【識別番号】000000295

【氏名又は名称】沖電気工業株式会社

(74)【代理人】

【識別番号】100140958

【弁理士】

【氏名又は名称】伊藤学

(74)【代理人】

【識別番号】100137888

【弁理士】

【氏名又は名称】大山夏子

(74)【代理人】

【識別番号】100190942

【弁理士】

【氏名又は名称】風間竜司

(72)【発明者】

【氏名】川村聡志

(72)【発明者】

【氏名】加賀谷素子

(72)【発明者】

【氏名】須崎昌彦

【審査官】多賀実

(56)【参考文献】

【文献】国際公開第２０１９／１５０８１３（ＷＯ，Ａ１）

【文献】特開２０１１－２０３９９１（ＪＰ，Ａ）

【文献】特表２０１９－５２７４４０（ＪＰ，Ａ）

【文献】国際公開第２０２０／２６１１８３（ＷＯ，Ａ１）

【文献】国際公開第２０２０／０５４５５１（ＷＯ，Ａ１）

(58)【調査した分野】(Int.Cl.，ＤＢ名)

Ｇ０６Ｎ３／００－３／１２

Ｇ０６Ｎ７／０８－９９／００

(57)【特許請求の範囲】

【請求項1】

第１のラベル無しデータを取得する入力部と、
前記第１のラベル無しデータと、第１のニューラルネットワークとに基づいて、前記第１のラベル無しデータの特徴量を抽出する特徴抽出部と、
前記第１のラベル無しデータの特徴量に基づいて、前記第１のラベル無しデータの第１の推定ラベルを出力する識別部と、
前記第１の推定ラベルと一致する正解ラベルが対応付けられたラベル有りデータの特徴量と、前記第１のラベル無しデータの特徴量との距離に基づいて、前記第１の推定ラベルの第１の信頼度を算出し、前記第１の信頼度が所定の条件を満たす場合に、前記第１のラベル無しデータを誤判定データとして推定する誤判定データ推定部と、
前記誤判定データが作業者に提示されるように制御する提示制御部と、
前記第１の推定ラベルの修正データが前記作業者によって入力されたことに基づいて、前記修正データを前記誤判定データに対応付けて記録する記録制御部と、
を備える、情報処理装置。

【請求項2】

前記誤判定データ推定部は、前記第１の推定ラベルと一致する正解ラベルが対応付けられた複数のラベル有りデータの特徴量の平均値と、前記第１のラベル無しデータの特徴量との距離に基づいて、前記第１の信頼度を算出する、
請求項１に記載の情報処理装置。

【請求項3】

第１のラベル無しデータを取得する入力部と、
前記第１のラベル無しデータと、第１のニューラルネットワークとに基づいて、前記第１のラベル無しデータの特徴量を抽出する特徴抽出部と、
前記第１のラベル無しデータの特徴量に基づいて、前記第１のラベル無しデータの第１の推定ラベルを出力する識別部と、
複数のラベル無しデータの度数を推定ラベルごとに算出し、前記第１の推定ラベルと一致する推定ラベルに対応する度数に基づいて、前記第１の推定ラベルの第１の信頼度を算出し、前記第１の信頼度が所定の条件を満たす場合に、前記第１のラベル無しデータを誤判定データとして推定する誤判定データ推定部と、
前記誤判定データが作業者に提示されるように制御する提示制御部と、
前記第１の推定ラベルの修正データが前記作業者によって入力されたことに基づいて、前記修正データを前記誤判定データに対応付けて記録する記録制御部と、
を備える、情報処理装置。

【請求項4】

前記所定の条件は、前記第１の信頼度が、複数のラベル無しデータそれぞれの推定ラベルの信頼度の低いほうから所定の件数以内に入るという条件である、
請求項１～３のいずれか一項に記載の情報処理装置。

【請求項5】

第１のラベル無しデータを取得する入力部と、
前記第１のラベル無しデータと、第１のニューラルネットワークとに基づいて、前記第１のラベル無しデータの特徴量を抽出する特徴抽出部と、
前記第１のラベル無しデータの特徴量に基づいて、前記第１のラベル無しデータの第１の表現ベクトルを出力する表現ベクトル抽出部と、
複数のラベル無しデータそれぞれの表現ベクトルに対するグループ化に基づいて、前記第１の表現ベクトルに第１の割当ラベルを付与し、前記第１の割当ラベルの第１の信頼度を算出し、前記第１の信頼度が所定の条件を満たす場合に、前記第１のラベル無しデータを誤判定データとして推定する誤判定データ推定部と、
前記誤判定データが作業者に提示されるように制御する提示制御部と、
前記第１の割当ラベルの修正データが前記作業者によって入力されたことに基づいて、前記修正データを前記誤判定データに対応付けて記録する記録制御部と、
を備える、情報処理装置。

【請求項6】

前記誤判定データ推定部は、前記第１の割当ラベルと一致する第２の割当ラベルが割り当てられた第２の表現ベクトルと、前記第１の表現ベクトルとの距離に基づいて、前記第１の信頼度を算出する、
請求項５に記載の情報処理装置。

【請求項7】

前記誤判定データ推定部は、前記第１の割当ラベルと一致する第２の割当ラベルが割り当てられた複数の第２の表現ベクトルの平均値と、前記第１の表現ベクトルとの距離に基づいて、前記第１の信頼度を算出する、
請求項６に記載の情報処理装置。

【請求項8】

前記誤判定データ推定部は、前記複数のラベル無しデータの度数を割当ラベルごとに算出し、前記第１の割当ラベルと一致する割当ラベルに対応する度数に基づいて、前記第１の信頼度を算出する、
請求項５に記載の情報処理装置。

【請求項9】

前記所定の条件は、前記第１の信頼度が、前記複数のラベル無しデータそれぞれの割当ラベルの信頼度の低いほうから所定の件数以内に入るという条件である、
請求項５～８のいずれか一項に記載の情報処理装置。

【請求項10】

前記所定の件数は、前記作業者によって指定された値である、
請求項４または９に記載の情報処理装置。

【請求項11】

前記所定の件数は、あらかじめ決められた値である、
請求項４または９に記載の情報処理装置。

【請求項12】

前記所定の条件は、前記第１の信頼度が、閾値よりも低いという条件である、
請求項１～１１のいずれか一項に記載の情報処理装置。

【請求項13】

前記情報処理装置は、
前記誤判定データと前記修正データとに基づいて評価結果を得るラベル有りデータ評価部と、
前記評価結果に基づいて、前記第１のニューラルネットワークの重みパラメータの更新を行う更新部と、
を備える、請求項１～１２のいずれか一項に記載の情報処理装置。

【請求項14】

第１のラベル無しデータを取得する入力部と、
前記第１のラベル無しデータと、第１のニューラルネットワークとに基づいて、前記第１のラベル無しデータの特徴量を抽出する特徴抽出部と、
前記第１のラベル無しデータの特徴量に基づいて、前記第１のラベル無しデータの第１の推定ラベルを出力する識別部と、
前記第１の推定ラベルの第１の信頼度を算出し、前記第１の信頼度が所定の条件を満たす場合に、前記第１のラベル無しデータを誤判定データとして推定する誤判定データ推定部と、
前記誤判定データが作業者に提示されるように制御する提示制御部と、
前記第１の推定ラベルの修正データが前記作業者によって入力されたことに基づいて、前記修正データを前記誤判定データに対応付けて記録する記録制御部と、
前記誤判定データと前記修正データとに基づいて評価結果を得るラベル有りデータ評価部と、
前記評価結果に基づいて、前記第１のニューラルネットワークの重みパラメータの更新を行う更新部と、
を備える、情報処理装置。

【請求項15】

第１のラベル無しデータを取得することと、
前記第１のラベル無しデータと、第１のニューラルネットワークとに基づいて、前記第１のラベル無しデータの特徴量を抽出することと、
前記第１のラベル無しデータの特徴量に基づいて、前記第１のラベル無しデータの第１の推定ラベルを出力することと、
前記第１の推定ラベルと一致する正解ラベルが対応付けられたラベル有りデータの特徴量と、前記第１のラベル無しデータの特徴量との距離に基づいて、前記第１の推定ラベルの第１の信頼度を算出し、前記第１の信頼度が所定の条件を満たす場合に、前記第１のラベル無しデータを誤判定データとして推定することと、
前記誤判定データが作業者に提示されるように制御することと、
前記第１の推定ラベルの修正データが前記作業者によって入力されたことに基づいて、前記修正データを前記誤判定データに対応付けて記録することと、
を備える、情報処理方法。

【請求項16】

第１のラベル無しデータを取得することと、
前記第１のラベル無しデータと、第１のニューラルネットワークとに基づいて、前記第１のラベル無しデータの特徴量を抽出することと、
前記第１のラベル無しデータの特徴量に基づいて、前記第１のラベル無しデータの第１の推定ラベルを出力することと、
複数のラベル無しデータの度数を推定ラベルごとに算出し、前記第１の推定ラベルと一致する推定ラベルに対応する度数に基づいて、前記第１の推定ラベルの第１の信頼度を算出し、前記第１の信頼度が所定の条件を満たす場合に、前記第１のラベル無しデータを誤判定データとして推定することと、
前記誤判定データが作業者に提示されるように制御することと、
前記第１の推定ラベルの修正データが前記作業者によって入力されたことに基づいて、前記修正データを前記誤判定データに対応付けて記録することと、
を備える、情報処理方法。

【請求項17】

第１のラベル無しデータを取得することと、
前記第１のラベル無しデータと、第１のニューラルネットワークとに基づいて、前記第１のラベル無しデータの特徴量を抽出することと、
前記第１のラベル無しデータの特徴量に基づいて、前記第１のラベル無しデータの第１の表現ベクトルを出力することと、
複数のラベル無しデータそれぞれの表現ベクトルに対するグループ化に基づいて、前記第１の表現ベクトルに第１の割当ラベルを付与し、前記第１の割当ラベルの第１の信頼度を算出し、前記第１の信頼度が所定の条件を満たす場合に、前記第１のラベル無しデータを誤判定データとして推定することと、
前記誤判定データが作業者に提示されるように制御することと、
前記第１の割当ラベルの修正データが前記作業者によって入力されたことに基づいて、前記修正データを前記誤判定データに対応付けて記録することと、
を備える、情報処理方法。

【請求項18】

コンピュータを、
第１のラベル無しデータを取得する入力部と、
前記第１のラベル無しデータと、第１のニューラルネットワークとに基づいて、前記第１のラベル無しデータの特徴量を抽出する特徴抽出部と、
前記第１のラベル無しデータの特徴量に基づいて、前記第１のラベル無しデータの第１の推定ラベルを出力する識別部と、
前記第１の推定ラベルと一致する正解ラベルが対応付けられたラベル有りデータの特徴量と、前記第１のラベル無しデータの特徴量との距離に基づいて、前記第１の推定ラベルの第１の信頼度を算出し、前記第１の信頼度が所定の条件を満たす場合に、前記第１のラベル無しデータを誤判定データとして推定する誤判定データ推定部と、
前記誤判定データが作業者に提示されるように制御する提示制御部と、
前記第１の推定ラベルの修正データが前記作業者によって入力されたことに基づいて、前記修正データを前記誤判定データに対応付けて記録する記録制御部と、
を備える情報処理装置として機能させるプログラム。

【請求項19】

コンピュータを、
第１のラベル無しデータを取得する入力部と、
前記第１のラベル無しデータと、第１のニューラルネットワークとに基づいて、前記第１のラベル無しデータの特徴量を抽出する特徴抽出部と、
前記第１のラベル無しデータの特徴量に基づいて、前記第１のラベル無しデータの第１の推定ラベルを出力する識別部と、
複数のラベル無しデータの度数を推定ラベルごとに算出し、前記第１の推定ラベルと一致する推定ラベルに対応する度数に基づいて、前記第１の推定ラベルの第１の信頼度を算出し、前記第１の信頼度が所定の条件を満たす場合に、前記第１のラベル無しデータを誤判定データとして推定する誤判定データ推定部と、
前記誤判定データが作業者に提示されるように制御する提示制御部と、
前記第１の推定ラベルの修正データが前記作業者によって入力されたことに基づいて、前記修正データを前記誤判定データに対応付けて記録する記録制御部と、
を備える情報処理装置として機能させるプログラム。

【請求項20】

コンピュータを、
第１のラベル無しデータを取得する入力部と、
前記第１のラベル無しデータと、第１のニューラルネットワークとに基づいて、前記第１のラベル無しデータの特徴量を抽出する特徴抽出部と、
前記第１のラベル無しデータの特徴量に基づいて、前記第１のラベル無しデータの第１の表現ベクトルを出力する表現ベクトル抽出部と、
複数のラベル無しデータそれぞれの表現ベクトルに対するグループ化に基づいて、前記第１の表現ベクトルに第１の割当ラベルを付与し、前記第１の割当ラベルの第１の信頼度を算出し、前記第１の信頼度が所定の条件を満たす場合に、前記第１のラベル無しデータを誤判定データとして推定する誤判定データ推定部と、
前記誤判定データが作業者に提示されるように制御する提示制御部と、
前記第１の割当ラベルの修正データが前記作業者によって入力されたことに基づいて、前記修正データを前記誤判定データに対応付けて記録する記録制御部と、
を備える情報処理装置として機能させるプログラム。

【発明の詳細な説明】

【技術分野】

【0001】

本発明は、情報処理装置、情報処理方法およびプログラムに関する。

【背景技術】

【0002】

ニューラルネットワーク（以下、「ＮＮ」とも表記する。）は、画像認識などにおいて高い性能を有する。ＮＮの学習精度を高めるためには、膨大な入力データとそれに対応した教師データが必要となることが知られている。しかし、教師データの正解ラベルは人手によって付与される場合が多い。そのため、膨大な入力データに対して正解ラベルを付与する負担が作業者に掛かってしまう。

【0003】

近年、この課題を解決するため、収集した入力データのうち少量のデータに正解ラベルを付与し、残りのデータには正解ラベルを付与せずにＮＮの学習を行う半教師あり学習の研究、および、すべての入力データに正解ラベルを付与せずにＮＮの学習を行う教師無し学習の研究も盛んになっている。半教師あり学習および教師無し学習などによれば、作業者の負担が大きく削減され得る。

【0004】

非特許文献１に記載の手法は、特に画像認識における半教師あり学習の手法の一つであり、正解ラベルが付されていない画像に対して２種類のデータ拡張を施し、２種類のデータ拡張によって得られた２種類の画像同士を比較することに基づいて学習を行う手法である。これによって、学習精度を高めることが可能となる。

【0005】

非特許文献２に記載の手法は、特に画像認識における教師無し学習の手法の一つであり、複数の画像それぞれに対して２種類のデータ拡張を行い、２種類のデータ拡張によって得られた画像から特徴量を抽出し、同一画像間の特徴量を比較すること、および、異なる画像間の特徴量を比較することに基づいて、学習を行う手法である。これによって、学習精度を高めることが可能となる。

【0006】

非特許文献３に記載の手法は、正解ラベルが付与された入力データ（ラベル付きデータ）のみを用いて学習を行い、ＮＮを用いてラベル無しデータに擬似的にラベルを付与する手法である。非特許文献３に記載の手法においては、擬似的に付与されたラベルの信頼度が低い場合は、人手によるラベルの修正が行われる。

【先行技術文献】

【非特許文献】

【0007】

【文献】Kihyuk Sohn、他8名、"FixMatch:Simplifying Semi-Supervised Learning with Consistencyand Confidence"、[online]、［令和2年12月24日検索］、インターネット＜https://arxiv.org/abs/2001.07685＞

【文献】Ting Chen、他6名、"BigSelf-Supervised Models are Strong Semi-Supervised Learners"、[online]、［令和2年12月24日検索］、インターネット＜https://arxiv.org/abs/2006.10029＞

【文献】Gokhan Tur、他2名、"Combiningactive and semi-supervised learning for spoken language understanding"、[online]、［令和2年12月24日検索］、インターネット＜https://www.sciencedirect.com/science/article/abs/pii/S0167639304000962＞

【発明の概要】

【発明が解決しようとする課題】

【0008】

しかしながら、非特許文献１に記載されたような半教師あり学習においては、学習精度がラベルの付与に使う入力データに影響されやすい。また、非特許文献２に記載されたような教師なし学習においては、学習精度が学習に使う入力データに影響されやすい。また、ラベル付けが行われる入力データを人手によって決める場合には、ラベル付け作業とは別に、全部の入力データからラベル付けが行われる入力データの選定作業を行う必要がある。

【0009】

非特許文献３に記載された手法においては、ラベル付きデータのみを用いて学習が行われるため、ラベル付きデータの数が少ない場合には、十分に学習精度が上がらない可能性が高い。そのため、非特許文献３に記載された手法においては、ラベルの修正が必要なデータの数が多くなるため、ラベルの修正に掛かる作業者の負担が大きくなる可能性がある。

【0010】

そこで、学習精度の低下を抑制しつつ、作業者によるラベル付け作業の効率化を可能とする技術が提供されることが望まれる。

【課題を解決するための手段】

【0011】

上記問題を解決するために、本発明のある観点によれば、第１のラベル無しデータを取得する入力部と、前記第１のラベル無しデータと、第１のニューラルネットワークとに基づいて、前記第１のラベル無しデータの特徴量を抽出する特徴抽出部と、前記第１のラベル無しデータの特徴量に基づいて、前記第１のラベル無しデータの第１の推定ラベルを出力する識別部と、前記第１の推定ラベルの第１の信頼度を算出し、前記第１の信頼度が所定の条件を満たす場合に、前記第１のラベル無しデータを誤判定データとして推定する誤判定データ推定部と、前記誤判定データが作業者に提示されるように制御する提示制御部と、前記第１の推定ラベルの修正データが前記作業者によって入力されたことに基づいて、前記修正データを前記誤判定データに対応付けて記録する記録制御部と、を備える、情報処理装置が提供される。

【0012】

前記誤判定データ推定部は、前記第１の推定ラベルと一致する正解ラベルが対応付けられたラベル有りデータの特徴量と、前記第１のラベル無しデータの特徴量との距離に基づいて、前記第１の信頼度を算出してもよい。

【0013】

前記誤判定データ推定部は、前記第１の推定ラベルと一致する正解ラベルが対応付けられた複数のラベル有りデータの特徴量の平均値と、前記第１のラベル無しデータの特徴量との距離に基づいて、前記第１の信頼度を算出してもよい。

【0014】

前記誤判定データ推定部は、複数のラベル無しデータの度数を推定ラベルごとに算出し、前記第１の推定ラベルと一致する推定ラベルに対応する度数に基づいて、前記第１の信頼度を算出してもよい。

【0015】

前記所定の条件は、前記第１の信頼度が、複数のラベル無しデータそれぞれの推定ラベルの信頼度の低いほうから所定の件数以内に入るという条件であってもよい。

【0016】

また、本発明の別の観点によれば、第１のラベル無しデータを取得する入力部と、前記第１のラベル無しデータと、第１のニューラルネットワークとに基づいて、前記第１のラベル無しデータの特徴量を抽出する特徴抽出部と、前記第１のラベル無しデータの特徴量に基づいて、前記第１のラベル無しデータの第１の表現ベクトルを出力する表現ベクトル抽出部と、複数のラベル無しデータそれぞれの表現ベクトルに対するグループ化に基づいて、前記第１の表現ベクトルに第１の割当ラベルを付与し、前記第１の割当ラベルの第１の信頼度を算出し、前記第１の信頼度が所定の条件を満たす場合に、前記第１のラベル無しデータを誤判定データとして推定する誤判定データ推定部と、前記誤判定データが作業者に提示されるように制御する提示制御部と、前記第１の割当ラベルの修正データが前記作業者によって入力されたことに基づいて、前記修正データを前記誤判定データに対応付けて記録する記録制御部と、を備える、情報処理装置が提供される。

【0017】

前記誤判定データ推定部は、前記第１の割当ラベルと一致する第２の割当ラベルが割り当てられた第２の表現ベクトルと、前記第１の表現ベクトルとの距離に基づいて、前記第１の信頼度を算出してもよい。

【0018】

前記誤判定データ推定部は、前記第１の割当ラベルと一致する第２の割当ラベルが割り当てられた複数の第２の表現ベクトルの平均値と、前記第１の表現ベクトルとの距離に基づいて、前記第１の信頼度を算出してもよい。

【0019】

前記誤判定データ推定部は、前記複数のラベル無しデータの度数を割当ラベルごとに算出し、前記第１の割当ラベルと一致する割当ラベルに対応する度数に基づいて、前記第１の信頼度を算出してもよい。

【0020】

前記所定の条件は、前記第１の信頼度が、前記複数のラベル無しデータそれぞれの割当ラベルの信頼度の低いほうから所定の件数以内に入るという条件であってもよい。

【0021】

前記所定の件数は、前記作業者によって指定された値であってもよい。

【0022】

前記所定の件数は、あらかじめ決められた値であってもよい。

【0023】

前記所定の条件は、前記第１の信頼度が、閾値よりも低いという条件であってもよい。

【0024】

前記情報処理装置は、前記誤判定データと前記修正データとに基づいて評価結果を得るラベル有りデータ評価部と、前記評価結果に基づいて、前記第１のニューラルネットワークの重みパラメータの更新を行う更新部と、を備えてもよい。

【0025】

また、本発明の別の観点によれば、第１のラベル無しデータを取得することと、前記第１のラベル無しデータと、第１のニューラルネットワークとに基づいて、前記第１のラベル無しデータの特徴量を抽出することと、前記第１のラベル無しデータの特徴量に基づいて、前記第１のラベル無しデータの第１の推定ラベルを出力することと、前記第１の推定ラベルの第１の信頼度を算出し、前記第１の信頼度が所定の条件を満たす場合に、前記第１のラベル無しデータを誤判定データとして推定することと、前記誤判定データが作業者に提示されるように制御することと、前記第１の推定ラベルの修正データが前記作業者によって入力されたことに基づいて、前記修正データを前記誤判定データに対応付けて記録することと、を備える、情報処理方法が提供される。

【0026】

また、本発明の別の観点によれば、第１のラベル無しデータを取得することと、前記第１のラベル無しデータと、第１のニューラルネットワークとに基づいて、前記第１のラベル無しデータの特徴量を抽出することと、前記第１のラベル無しデータの特徴量に基づいて、前記第１のラベル無しデータの第１の表現ベクトルを出力することと、複数のラベル無しデータそれぞれの表現ベクトルに対するグループ化に基づいて、前記第１の表現ベクトルに第１の割当ラベルを付与し、前記第１の割当ラベルの第１の信頼度を算出し、前記第１の信頼度が所定の条件を満たす場合に、前記第１のラベル無しデータを誤判定データとして推定することと、前記誤判定データが作業者に提示されるように制御することと、前記第１の割当ラベルの修正データが前記作業者によって入力されたことに基づいて、前記修正データを前記誤判定データに対応付けて記録することと、を備える、情報処理方法が提供される。

【0027】

また、本発明の別の観点によれば、コンピュータを、第１のラベル無しデータを取得する入力部と、前記第１のラベル無しデータと、第１のニューラルネットワークとに基づいて、前記第１のラベル無しデータの特徴量を抽出する特徴抽出部と、前記第１のラベル無しデータの特徴量に基づいて、前記第１のラベル無しデータの第１の推定ラベルを出力する識別部と、前記第１の推定ラベルの第１の信頼度を算出し、前記第１の信頼度が所定の条件を満たす場合に、前記第１のラベル無しデータを誤判定データとして推定する誤判定データ推定部と、前記誤判定データが作業者に提示されるように制御する提示制御部と、前記第１の推定ラベルの修正データが前記作業者によって入力されたことに基づいて、前記修正データを前記誤判定データに対応付けて記録する記録制御部と、を備える情報処理装置として機能させるプログラムが提供される。

【0028】

また、本発明の別の観点によれば、コンピュータを、第１のラベル無しデータを取得する入力部と、前記第１のラベル無しデータと、第１のニューラルネットワークとに基づいて、前記第１のラベル無しデータの特徴量を抽出する特徴抽出部と、前記第１のラベル無しデータの特徴量に基づいて、前記第１のラベル無しデータの第１の表現ベクトルを出力する表現ベクトル抽出部と、複数のラベル無しデータそれぞれの表現ベクトルに対するグループ化に基づいて、前記第１の表現ベクトルに第１の割当ラベルを付与し、前記第１の割当ラベルの第１の信頼度を算出し、前記第１の信頼度が所定の条件を満たす場合に、前記第１のラベル無しデータを誤判定データとして推定する誤判定データ推定部と、前記誤判定データが作業者に提示されるように制御する提示制御部と、前記第１の割当ラベルの修正データが前記作業者によって入力されたことに基づいて、前記修正データを前記誤判定データに対応付けて記録する記録制御部と、を備える情報処理装置として機能させるプログラムが提供される。

【発明の効果】

【0029】

以上説明したように本発明によれば、学習精度の低下を抑制しつつ、作業者によるラベル付け作業の効率化を可能とする技術が提供される。

【図面の簡単な説明】

【0030】

【図1】本発明の第１の実施形態に係る学習装置の機能構成例を示す図である。

【図2】同実施形態に係る学習装置によって実行される学習段階の動作例を示すフローチャートである。

【図3】誤判定データの推定例について説明するための図である。

【図4】作業者に推定ラベルを修正させるためのラベル修正画面の例を示す図である。

【図5】同実施形態に係る学習装置によって実行される修正段階の動作例を示すフローチャートである。

【図6】本発明の第２の実施形態に係る学習装置の機能構成例を示す図である。

【図7】同実施形態に係る学習装置によって実行される学習段階の動作例を示すフローチャートである。

【図8】誤判定データの推定例について説明するための図である。

【図9】作業者に割当ラベルを修正させるためのラベル修正画面の例を示す図である。

【図10】同実施形態に係る学習装置によって実行される修正段階の動作例を示すフローチャートである。

【図11】学習装置の例としての情報処理装置のハードウェア構成を示す図である。

【発明を実施するための形態】

【0031】

以下に添付図面を参照しながら、本発明の好適な実施の形態について詳細に説明する。なお、本明細書及び図面において、実質的に同一の機能構成を有する構成要素については、同一の符号を付することにより重複説明を省略する。

【0032】

また、本明細書および図面において、実質的に同一の機能構成を有する複数の構成要素を、同一の符号の後に異なる数字を付して区別する場合がある。ただし、実質的に同一の機能構成を有する複数の構成要素等の各々を特に区別する必要がない場合、同一符号のみを付する。また、異なる実施形態の類似する構成要素については、同一の符号の後に異なるアルファベットを付して区別する場合がある。ただし、異なる実施形態の類似する構成要素等の各々を特に区別する必要がない場合、同一符号のみを付する。

【0033】

（０．実施形態の概要）
本発明の実施形態の概要について説明する。本発明の実施形態では、ニューラルネットワークの学習を行う学習装置について説明する。学習装置においては、学習用データに基づいてニューラルネットワークの学習が行われた後（学習段階）、学習時にラベル無しデータに付与されたラベルの修正が行われ（修正段階）、修正データに基づいて再度学習が行われる（再学習段階）。その後、識別装置において、学習済みのニューラルネットワークと識別用データ（テストデータ）とに基づいて推定ラベルが出力される。

【0034】

本発明の実施形態では、学習装置と識別装置とが同一のコンピュータによって実現される場合を主に想定する。しかし、学習装置と識別装置とは、別のコンピュータによって実現されてもよい。かかる場合には、学習装置によって生成された学習済みのニューラルネットワークが識別装置に提供される。例えば、学習済みのニューラルネットワークは、学習装置から識別装置に記録媒体を介して提供されてもよいし、通信を介して提供されてもよい。以下では、学習装置において実行される「学習段階」「修正段階」「再学習段階」について説明する。

【0035】

（１．第１の実施形態）
まず、本発明の第１の実施形態について説明する。本発明の第１の実施形態においては、学習装置によって半教師あり学習が行われる。図１は、本発明の第１の実施形態に係る学習装置１０の機能構成例を示す図である。図１に示されるように、本発明の第１の実施形態に係る学習装置１０は、入力部１１１と、誤判定データ推定部１１２と、提示制御部１１３と、提示部１１４と、記録制御部１１５と、操作部１１６と、特徴抽出部１２１と、識別部１２２と、ラベル有りデータ評価部１３１と、ラベル無しデータ評価部１３２と、更新部１３３とを備える。

【0036】

本発明の第１の実施形態では、特徴抽出部１２１と、識別部１２２とが、ニューラルネットワーク１２０に含まれる場合を主に想定する。すなわち、特徴抽出部１２１と、識別部１２２とは、ニューロンによって構築される計算グラフが処理順に接続されて構成されており、全体として１つのニューラルネットワークとみなされ得る。以下では、ニューラルネットワークを「ＮＮ」とも表記する。より詳細に、特徴抽出部１２１は、第１のニューラルネットワーク（以下、「特徴抽出ＮＮ」とも表記する。）を含み、識別部１２２は、第２のニューラルネットワーク（以下、「識別ＮＮ」とも表記する。）を含む。

【0037】

しかし、特徴抽出部１２１と、識別部１２２とは、具体的にどのような構成であってもよい。例えば、以下では、特徴抽出部１２１が特徴抽出ＮＮを含み、識別部１２２が識別ＮＮを含む場合を主に想定して説明する。しかし、識別部１２２は、識別ＮＮを含まずに特定の識別アルゴリズムに基づいて識別を行ってもよい。

【0038】

特徴抽出部１２１および識別部１２２の他、入力部１１１、誤判定データ推定部１１２、提示制御部１１３、記録制御部１１５、ラベル有りデータ評価部１３１、ラベル無しデータ評価部１３２および更新部１３３などは、ＣＰＵ（ＣｅｎｔｒａｌＰｒｏｃｅｓｓｉｎｇＵｎｉｔ）またはＧＰＵ（ＧｒａｐｈｉｃｓＰｒｏｃｅｓｓｉｎｇＵｎｉｔ）などの演算装置を含み、ＲＯＭ（ＲｅａｄＯｎｌｙＭｅｍｏｒｙ）により記憶されているプログラムが演算装置によりＲＡＭに展開されて実行されることにより、その機能が実現され得る。このとき、当該プログラムを記録した、コンピュータに読み取り可能な記録媒体も提供され得る。あるいは、これらのブロックは、専用のハードウェアにより構成されていてもよいし、複数のハードウェアの組み合わせにより構成されてもよい。演算装置による演算に必要なデータは、図示しない記憶部によって適宜記憶される。

【0039】

ラベル付きデータセット１０１、ラベル無しデータセット１０２および重みパラメータ１２３は、図示しない記憶部によって記憶される。かかる記憶部は、ＲＡＭ（ＲａｎｄｏｍＡｃｃｅｓｓＭｅｍｏｒｙ）、ハードディスクドライブまたはフラッシュメモリなどのメモリによって構成されてよい。

【0040】

初期状態において、重みパラメータ１２３には、初期値が設定されている。例えば、重みパラメータ１２３に設定される初期値は、ランダムな値であってよいが、どのような値であってもよい。例えば、重みパラメータ１２３に設定される初期値は、あらかじめ学習によって得られた学習済みの値であってもよい。

【0041】

（１－１．学習段階）
まず、本発明の第１の実施形態に係る学習装置１０によって実行される「学習段階」について説明する。

【0042】

（ラベル付きデータセット１０１）
ラベル付きデータセット１０１は、複数の学習用データ（入力データ）と当該複数の学習用データそれぞれに対応付けられた正解ラベルとを含んで構成される。以下では、正解ラベルが対応付けられた学習用データを「ラベル有りデータ」とも言う。正解ラベルは、人手または図示しない機能によって付与される。

【0043】

なお、本発明の実施形態では、ラベル有りデータが画像データである場合（特に、静止画像データである場合）を主に想定する。しかし、ラベル有りデータの種類は特に限定されず、次元数調整によって画像データ以外もラベル有りデータとして用いられ得る。例えば、ラベル有りデータは、複数のフレームを含んだ動画像データであってもよいし、音響データであってもよい。

【0044】

（ラベル無しデータセット１０２）
ラベル無しデータセット１０２は、正解ラベルがそれぞれ対応付けられていない複数の学習用データ（入力データ）を含んで構成される。以下では、正解ラベルが対応付けられていない学習用データを「ラベル無しデータ」とも言う。なお、本発明の実施形態では、ラベル無しデータが画像データである場合（特に、静止画像データである場合）を主に想定する。しかし、ラベル無しデータの種類は、ラベル有りデータの種類と同様に限定されない。

【0045】

（入力部１１１）
入力部１１１は、ラベル付きデータセット１０１およびラベル無しデータセット１０２からラベル有りデータおよび正解ラベルの組み合わせとラベル無しデータとを順次に取得する。入力部１１１は、ラベル有りデータおよび正解ラベルの組み合わせとラベル無しデータとを順次に特徴抽出部１２１に出力する。入力部１１１よりも後段の各ブロックにおいては、前段のブロックからの入力に基づいて順次に各自の処理が繰り返し実行される。

【0046】

なお、入力部１１１が、ラベル有りデータおよび正解ラベルの全部の組み合わせを特徴抽出部１２１に出力し終わる場合が想定される。かかる場合には、入力部１１１は、当該組み合わせを取得し直して特徴抽出部１２１に再度出力する動作を所定の回数繰り返してよい。同様に、入力部１１１が、ラベル無しデータの全部を特徴抽出部１２１に出力し終わる場合が想定される。かかる場合には、入力部１１１は、ラベル無しデータを取得し直して特徴抽出部１２１に再度出力する動作を所定の回数繰り返してよい。かかる場合には、入力部１１１よりも後段のブロックにおいても、前段のブロックからの再度の入力に基づいて順次に各自の処理が繰り返し実行されてよい。

【0047】

（特徴抽出部１２１）
特徴抽出部１２１は、入力部１１１から出力されたラベル有りデータと特徴抽出ＮＮとに基づいてラベル有りデータの特徴量を抽出する。より詳細に、特徴抽出部１２１は、重みパラメータ１２３から特徴抽出ＮＮのニューロンに対応する重みパラメータを取得し、取得した重みパラメータが設定された特徴抽出ＮＮにラベル有りデータを入力させたことに基づいて、特徴抽出ＮＮから出力されるデータをラベル有りデータの特徴量として得る。特徴抽出部１２１は、ラベル有りデータの特徴量を識別部１２２に出力する。

【0048】

特徴抽出部１２１は、入力部１１１から出力されたラベル無しデータと特徴抽出ＮＮとに基づいてラベル無しデータの特徴量を抽出する。より詳細に、特徴抽出部１２１は、重みパラメータが設定された特徴抽出ＮＮにラベル無しデータを入力させたことに基づいて、特徴抽出ＮＮから出力されるデータをラベル無しデータの特徴量として得る。特徴抽出部１２１は、ラベル無しデータの特徴量を識別部１２２に出力する。

【0049】

ここで、特徴抽出ＮＮの具体的な構成は限定されない。例えば、特徴抽出ＮＮとしては、畳み込み層およびプーリング層を主として構成されたニューラルネットワークが用いられてもよい。以下では、畳み込み層として、２次元畳み込み層が用いられる場合を主に想定するが、３次元畳み込み層が用いられてもよい。

【0050】

（識別部１２２）
識別部１２２は、特徴抽出部１２１によって抽出されたラベル有りデータの特徴量に基づいて、ラベル有りデータの推定ラベルを得る。より詳細に、識別部１２２は、重みパラメータ１２３から識別ＮＮのニューロンに対応する重みパラメータを取得し、取得した重みパラメータが設定された識別ＮＮにラベル有りデータの特徴量を入力させたことに基づいて、識別ＮＮから出力されるデータをラベル有りデータの推定ラベルとして得る。識別部１２２は、ラベル有りデータの推定ラベルをラベル有りデータ評価部１３１に出力する。

【0051】

さらに、識別部１２２は、特徴抽出部１２１によって抽出されたラベル無しデータの特徴量に基づいて、ラベル無しデータの推定ラベルを得る。より詳細に、識別部１２２は、重みパラメータが設定された識別ＮＮにラベル無しデータの特徴量を入力させたことに基づいて、識別ＮＮから出力されるデータをラベル無しデータの推定ラベルとして得る。識別部１２２は、ラベル無しデータの推定ラベルをラベル無しデータ評価部１３２に出力する。

【0052】

識別部１２２は、ラベル無しデータの推定ラベルとして、半教師あり学習の枠組みに基づく２種類の推定ラベルをラベル無しデータ評価部１３２に出力する。ここで、２種類の推定ラベルを得るためのアルゴリズムは、特定のアルゴリズムに限定されず、半教師あり学習に用いられるアルゴリズムが用いられてよい。

【0053】

例えば、入力部１１１が、ラベル無しデータセット１０２から取得したラベル無しデータに基づいて２種類のラベル無しデータを得てもよい。一例として、入力部１１１は、ラベル無しデータに対して２種類のデータ拡張を施すことによって２種類のラベル無しデータを得てもよい。このとき、入力部１１１は、特徴抽出部１２１に対して２種類のラベル無しデータを出力し、特徴抽出部１２１は、２種類のラベル無しデータそれぞれの特徴量を出力し、識別部１２２は、２種類のラベル無しデータそれぞれの特徴量に対応する推定ラベルを出力する。

【0054】

あるいは、入力部１１１から特徴抽出部１２１に出力されるラベル無しデータは１種類であり、特徴抽出部１２１および識別部１２２において、２種類の重みパラメータを使用してもよい。一例として、特徴抽出部１２１および識別部１２２は、入力部１１１から出力されるラベル無しデータに対して、重みパラメータ１２３の全部を適用して得たデータおよび重みパラメータ１２３の一部を適用して得たデータを２種類の推定ラベルとして得てもよい。このとき、識別部１２２から２種類の推定ラベルが出力される。

【0055】

識別ＮＮの具体的な構成は、特に限定されない。しかし、識別ＮＮの出力の形式は、ラベル有りデータに対応する正解ラベルの形式と合わせて設定されているのがよい。例えば、正解ラベルが分類問題のクラスである場合、識別ＮＮの出力は、クラス数分の長さを有するｏｎｅ－ｈｏｔベクトルであるとよい。

【0056】

（ラベル有りデータ評価部１３１）
ラベル有りデータ評価部１３１は、入力部１１１によって取得されたラベル有りデータに対応する正解ラベルに基づいて、識別部１２２から出力されたラベル有りデータの推定ラベルを評価してラベル有りデータに対応する評価結果を得る。より詳細に、ラベル有りデータ評価部１３１は、ラベル有りデータに対応する正解ラベルとラベル有りデータの推定ラベルとに応じた損失関数をラベル有りデータに対応する評価結果として算出する。

【0057】

ここで、損失関数は特定の関数に限定されず、一般的なニューラルネットワークにおいて用いられる損失関数と同様の損失関数が用いられてよい。例えば、損失関数は、ラベル有りデータに対応する正解ラベルとラベル有りデータの推定ラベルとの差分に基づく平均二乗誤差であってもよいし、ラベル有りデータに対応する正解ラベルとラベル有りデータの推定ラベルとの差分に基づく交差エントロピー誤差であってもよい。ラベル有りデータ評価部１３１は、ラベル有りデータに対応する評価結果を更新部１３３に出力する。

【0058】

（ラベル無しデータ評価部１３２）
ラベル無しデータ評価部１３２は、２種類の推定ラベルの一方を擬似的にラベル無しデータに対応する正解ラベルとし、他方をラベル無しデータの推定ラベルとする。なお、２種類の推定ラベルのどちらを正解ラベルとするかは限定されない。例えば、より弱いデータ拡張によって得られた推定ラベルが正解ラベルとされてもよい。あるいは、重みパラメータ１２３の全部の適用によって得られたデータが正解ラベルとされてもよい。

【0059】

ラベル無しデータ評価部１３２は、ラベル無しデータに対応する正解ラベルに基づいて、ラベル無しデータの推定ラベルを評価してラベル無しデータに対応する評価結果を得る。より詳細に、ラベル無しデータ評価部１３２は、ラベル無しデータに対応する正解ラベルとラベル無しデータの推定ラベルとに応じた損失関数をラベル無しデータに対応する評価結果として算出する。ラベル有りデータに対応する評価結果が算出されるときと同様に、損失関数は特定の関数に限定されない。ラベル無しデータ評価部１３２は、ラベル無しデータに対応する評価結果を更新部１３３に出力する。

【0060】

（更新部１３３）
更新部１３３は、ラベル有りデータ評価部１３１から出力されたラベル有りデータに対応する評価結果とラベル無しデータ評価部１３２から出力されたラベル無しデータに対応する評価結果とに基づいて、重みパラメータ１２３の更新を行う。これによって、ラベル有りデータの推定ラベルがラベル有りデータに対応する正解ラベルに近づくように、かつ、ラベル無しデータの推定ラベルがラベル無しデータに対応する正解ラベルに近づくように、重みパラメータ１２３が訓練され得る。

【0061】

例えば、更新部１３３は、ラベル有りデータに対応する評価結果とラベル無しデータに対応する評価結果との重み付き和（以下、単に「重み付き和」とも言う。）に基づいて、重みパラメータ１２３の更新を行ってよい。また、重みパラメータ１２３は、ラベル有りデータに対応する評価結果とラベル無しデータに対応する評価結果との重み付き和に基づく誤差逆伝播法（バックプロパゲーション）によって更新されてよい。

【0062】

なお、更新部１３３は、重みパラメータ１２３の更新が終わるたびに、学習の終了条件が満たされたか否かを判断する。学習の終了条件が満たされていないと判断した場合には、入力部１１１によって次の入力データ（ラベル有りデータおよび正解ラベルの組み合わせ、および、ラベル無しデータ）が取得され、特徴抽出部１２１、ラベル有りデータ評価部１３１、ラベル無しデータ評価部１３２および更新部１３３それぞれによって、当該次の入力データに基づく各自の処理が再度実行される。一方、更新部１３３によって、学習の終了条件が満たされたと判断された場合には、学習が終了される。

【0063】

なお、学習の終了条件は特に限定されず、ニューラルネットワーク１２０の学習がある程度行われたことを示す条件であればよい。具体的に、学習の終了件は、当該重み付き和の値が閾値よりも小さいという条件を含んでもよい。あるいは、学習の終了条件は、当該重み付き和の値の変化が閾値よりも小さいという条件（当該重み付き和の値が収束状態になったという条件）を含んでもよい。あるいは、学習の終了条件は、重みパラメータ１２３の更新が所定の回数行われたという条件を含んでもよい。あるいは、正解ラベルと推定ラベルとに基づいて精度（例えば、正解率など）が算出される場合、学習の終了条件は、精度が所定の割合（例えば、９０％など）を超えるという条件を含んでもよい。

【0064】

（学習段階の動作）
図２を参照しながら、本発明の第１の実施形態に係る学習装置１０によって実行される「学習段階」の動作の流れについて説明する。図２は、本発明の第１の実施形態に係る学習装置１０によって実行される学習段階の動作例を示すフローチャートである。

【0065】

まず、入力データの一部に対して作業者によって正解ラベルが付与されると、図示しない記憶部は、正解ラベルと正解ラベルが付与された入力データ（ラベル有りデータ）とを対応付けてラベル付きデータセット１０１として記憶するとともに、正解ラベルが付与されなかった入力データ（ラベル無しデータ）をラベル無しデータセット１０２として記憶する（Ｓ１０１）。入力部１１１は、ラベル付きデータセット１０１およびラベル無しデータセット１０２からラベル有りデータおよび正解ラベルの組み合わせとラベル無しデータとを取得する。

【0066】

特徴抽出部１２１は、重みパラメータ１２３から特徴抽出ＮＮのニューロンに対応する重みパラメータを取得し、取得した重みパラメータが設定された特徴抽出ＮＮにラベル有りデータを入力させたことに基づいて、特徴抽出ＮＮから出力されるデータをラベル有りデータの特徴量として得る（Ｓ１０２）。識別部１２２は、重みパラメータ１２３から識別ＮＮのニューロンに対応する重みパラメータを取得し、取得した重みパラメータが設定された識別ＮＮにラベル有りデータの特徴量を入力させたことに基づいて、識別ＮＮから出力されるデータをラベル有りデータの推定ラベルとして得る（Ｓ１０３）。

【0067】

特徴抽出部１２１は、特徴抽出ＮＮと１種類または２種類のラベル無しデータとに基づいて、特徴抽出ＮＮから出力されるデータを２種類のラベル無しデータそれぞれの特徴量として得る（Ｓ１０４）。識別部１２２は、識別ＮＮと２種類のラベル無しデータとに基づいて、識別ＮＮから出力されるデータを２種類の推定ラベルとして得る（Ｓ１０５）。なお、上記したように、ラベル無しデータの種類の増加は、入力部１１１によって行われてもよいし、特徴抽出部１２１および識別部１２２によって行われてもよい。

【0068】

ラベル有りデータ評価部１３１は、入力部１１１によって取得されたラベル有りデータに対応する正解ラベルに基づいて、識別部１２２から出力されたラベル有りデータの推定ラベルを評価してラベル有りデータに対応する評価結果を得る。

【0069】

ラベル無しデータ評価部１３２は、入力部１１１によって取得された２種類の推定ラベルの一方を擬似的にラベル無しデータに対応する正解ラベルとし、他方をラベル無しデータの推定ラベルとする。そして、ラベル無しデータ評価部１３２は、ラベル無しデータに対応する正解ラベルに基づいて、ラベル無しデータの推定ラベルを評価してラベル無しデータに対応する評価結果を得る（Ｓ１０６）。

【0070】

更新部１３３は、ラベル有りデータ評価部１３１から出力されたラベル有りデータに対応する評価結果とラベル無しデータ評価部１３２から出力されたラベル無しデータに対応する評価結果とに基づいて、重みパラメータ１２３の更新を行う（Ｓ１０７）。

【0071】

更新部１３３は、学習用データに基づく更新が終わるたびに、学習の終了条件が満たされたか否かを判断する（Ｓ１０８）。学習の終了条件が満たされていないと判断した場合には（Ｓ１０８において「ＮＯ」）、Ｓ１０１に動作が移行され、入力部１１１によって次の入力データが取得され、特徴抽出部１２１、識別部１２２、ラベル有りデータ評価部１３１およびラベル無しデータ評価部１３２それぞれによって、当該次の入力データに基づく各自の処理が再度実行される。一方、更新部１３３によって、学習の終了条件が満たされたと判断された場合には（Ｓ１０８において「ＹＥＳ」）、学習が終了される。

【0072】

以上、本発明の第１の実施形態に係る学習装置１０によって実行される「学習段階」の動作の流れについて説明した。

【0073】

（１－２．修正段階）
続いて、本発明の第１の実施形態に係る学習装置１０によって実行される「修正段階」について説明する。なお、以下では、「学習段階」において推定ラベルが一度算出されているものの、「修正段階」において推定ラベルが算出され直される場合を主に想定する。これによって、推定ラベルを記憶しておくために確保すべきメモリ領域が低減され得る。しかし、「学習段階」において、算出された推定ラベルが、図示しない記憶部によって記憶されてもよい。かかる場合には、「修正段階」において、図示しない記憶部によって記憶されている推定ラベルが用いられればよい。

【0074】

さらに、以下では、「修正段階」が「学習段階」の後に実行される場合を主に想定する。しかし、「学習段階」が実行されずに、「修正段階」が実行され、後に説明する「再学習」が実行されてもよい。かかる場合であっても、「修正段階」において、作業者によって正解ラベル（推定ラベルの修正データ）が入力される。「修正段階」においても、学習段階と同様に、入力部１１１、特徴抽出部１２１および識別部１２２において各自の処理が実行される。

【0075】

（誤判定データ推定部１１２）
誤判定データ推定部１１２は、識別部１２２から出力されたラベル無しデータ（第１のラベル無しデータ）の推定ラベル（第１の推定ラベル）の信頼度（第１の信頼度）を算出する。そして、誤判定データ推定部１１２は、算出した信頼度が所定の条件を満たす場合に、識別部１２２から出力されたラベル無しデータを誤判定データとして推定する。

【0076】

まず、信頼度の算出例について説明する。誤判定データ推定部１１２は、ラベル有りデータの特徴量および正解ラベルの全部の組み合わせを特徴抽出部１２１から取得する。そして、誤判定データ推定部１１２は、正解ラベルごとにラベル有りデータの特徴量の平均値を算出する。

【0077】

ここで、ラベル有りデータの数をＮ_Ｌとし、各ラベル有りデータの番号をｉ∈｛１，…，Ｎ_Ｌ｝とし、各ラベル有りデータの特徴量をｚ_ｉ ^Ｌとし、各ラベル有りデータの正解ラベルをｙ_ｉとすると、正解ラベルｃのラベル有りデータの特徴量の平均値ｚ_ｃ ^Ｌ（ａｖｅ）は、以下の式（１）のように表現され得る。

【0078】

【数1】

【0079】

｜Ｍ_ｃ｜は、Ｍ_ｃの数を示す。続いて、誤判定データ推定部１１２は、特徴抽出部１２１および識別部１２２からラベル無しデータの特徴量および推定ラベルの全部の組み合わせを順次に取得する。

【0080】

誤判定データ推定部１１２は、推定ラベル（第１の推定ラベル）と一致する正解ラベルが対応付けられたラベル有りデータの特徴量と、ラベル無しデータ（第１のラベル無しデータ）の特徴量との距離を算出する。

【0081】

ここで、誤判定データ推定部１１２によって算出される距離は、特定の距離に限定されない。例えば、誤判定データ推定部１１２によって算出される距離は、特徴量間のユークリッド距離であってもよいし、特徴量の類似度の算出に用いられるコサイン類似度であってもよい。そして、誤判定データ推定部１１２は、算出した距離に基づいて、推定ラベルの信頼度（第１の信頼度）を算出する。

【0082】

より詳細に、誤判定データ推定部１１２は、推定ラベルと一致する正解ラベルが対応付けられたラベル有りデータの特徴量の平均値を算出する。そして、誤判定データ推定部１１２は、算出した平均値とラベル無しデータの特徴量との距離に基づいて、推定ラベルの信頼度を算出する。ここでは、誤判定データ推定部１１２によって算出された距離が小さくなるほど、推定ラベルの信頼度が高くなる場合を想定する。

【0083】

さらに詳細に、ラベル無しデータの数をＮ_Ｕとし、各ラベル無しデータの番号をｉ∈｛１，…，Ｎ_Ｕ｝とし、各ラベル無しデータの特徴量をｚ_ｉ ^Ｕとし、各ラベル無しデータの推定ラベルをｙ_ｉ’とすると、推定ラベルｙ_ｉ’と一致する正解ラベルに対応するラベル有りデータの特徴量の平均値ｚ_ｙｉ ^Ｌ（ａｖｅ）とラベル無しデータの特徴量ｚ_ｉ ^Ｕとの距離ｄ_ｉは、以下の式（２）のように表現され得る。

【0084】

【数2】

【0085】

誤判定データ推定部１１２は、算出した距離ｄ_ｉが所定の条件を満たす場合に、ラベル無しデータを誤判定データとして推定する。より詳細に、距離ｄ_ｉが大きいほど、推定ラベルｙ_ｉ’が誤判定によって得られた可能性が高いと考えられる。

【0086】

そこで、誤判定データ推定部１１２は、各ラベル無しデータを距離ｄ_ｉが降順になるように（距離が大きい順に）並び変えてよい。そして、誤判定データ推定部１１２は、所定の条件の例として、距離ｄ_ｉが各距離の大きいほうから対象件数Ｘ個（所定の件数）以内に入るという条件（すなわち、信頼度が各ラベル無しデータの推定ラベルの信頼度の低いほうから対象件数以内に入るという条件）を満たすラベル無しデータを誤判定データとして推定してもよい。このとき、誤判定データ推定部１１２は、距離の降順を優先順位としてラベル無しデータの推定ラベルを修正対象としてよい。

【0087】

図３は、誤判定データの推定例について説明するための図である。図３を参照すると、特徴空間Ｆ１が示されており、特徴空間Ｆ１の中に、一つ目の正解ラベルに対応するラベル有りデータの特徴量の平均値Ｃ１１が存在している。同様に、二つ目の正解ラベルに対応するラベル有りデータの特徴量の平均値Ｃ１２、および、三つ目の正解ラベルに対応するラベル有りデータの特徴量の平均値Ｃ１３が存在している。

【0088】

また、特徴空間Ｆ１の中に、一つ目のラベル無しデータの特徴量Ａ１１が存在している。同様に、二つ目のラベル無しデータの特徴量Ａ１２、および、三つ目のラベル無しデータの特徴量Ａ１３が存在している。

【0089】

一つ目のラベル無しデータの推定ラベルは、ラベル有りデータの特徴量の平均値Ｃ１１に対応する一つ目の正解ラベルと一致する。そして、一つ目のラベル無しデータの特徴量Ａ１１と一つ目の正解ラベルに対応するラベル有りデータの特徴量の平均値Ｃ１１との距離が距離Ｄ１１として示されている。

【0090】

二つ目のラベル無しデータの推定ラベルは、ラベル有りデータの特徴量の平均値Ｃ１２に対応する二つ目の正解ラベルと一致する。そして、二つ目のラベル無しデータの特徴量Ａ１２と二つ目の正解ラベルに対応するラベル有りデータの特徴量の平均値Ｃ１２との距離が距離Ｄ１２として示されている。

【0091】

三つ目のラベル無しデータの推定ラベルは、ラベル有りデータの特徴量の平均値Ｃ１３に対応する三つ目の正解ラベルと一致する。そして、三つ目のラベル無しデータの特徴量Ａ１３と三つ目の正解ラベルに対応するラベル有りデータの特徴量の平均値Ｃ１３との距離が距離Ｄ１３として示されている。

【0092】

距離Ｄ１１～Ｄ１３のうち、一番目に大きい距離は距離Ｄ１１であり、二番目に大きい距離は距離Ｄ１２であり、三番目に大きい距離は距離Ｄ１３である。このとき、誤判定データ推定部１１２は、距離Ｄ１１に対応する一つ目のラベル無しデータ、距離Ｄ１２に対応する二つ目のラベル無しデータ、距離Ｄ１３に対応する三つ目のラベル無しデータの順に、優先して推定ラベルを修正対象としてよい。

【0093】

（提示制御部１１３）
提示制御部１１３は、誤判定データ推定部１１２によって推定された誤判定データが提示部１１４によって提示されるように提示部１１４を制御する。これによって、作業者は、誤判定データ（すなわち、推定ラベルが誤判定されたラベル無しデータ）に基づいて、推定ラベルの修正が可能となる。

【0094】

（提示部１１４）
提示部１１４は、作業者に対して視覚的な情報を提示する表示部（ディスプレイ）である場合を主に想定する。しかし、提示部１１４の具体的な形態は限定されない。例えば、ラベル無しデータが音響データである場合などには、提示部１１４は、作業者に対して聴覚的な情報を提示する音声出力部（スピーカ）などであってもよい。これによって、提示部１１４は、ラベル無しデータを聴覚的な情報として知覚した結果に基づいて、推定ラベルを修正することが可能となる。

【0095】

図４は、作業者に推定ラベルを修正させるためのラベル修正画面の例を示す図である。図４を参照すると、提示部１１４によって表示されるラベル修正画面Ｗ１が示されている。図４を参照すると、提示制御部１１３は、入力データＧ１が提示部１１４によって表示されるように提示部１１４を制御している。入力データＧ１は、推定ラベルが誤判定されたラベル無しデータ（誤判定データ）である。なお、複数の誤判定データのうち最も優先順位が高い誤判定データが最初に表示されてよい。

【0096】

さらに、提示制御部１１３は、誤判定データ（入力データＧ１）の推定ラベルＢ２２が提示部１１４によって表示されるように提示部１１４を制御している。作業者は、誤判定データ（入力データＧ１）および推定ラベルＢ２２などを見ながら、各種操作を操作部１１６に対して入力することが可能である。

【0097】

（操作部１１６）
操作部１１６は、作業者によって入力される各種操作を受け付ける機能を有する。ここでは、操作部１１６がマウスおよびキーボードによって構成される場合を主に想定する。しかし、操作部１１６の具体的な形態は限定されない。例えば、操作部１１６は、他の入力デバイス（例えば、タッチパネルなど）によって構成されてもよい。

【0098】

一例として、操作部１１６に対して、作業者が誤判定データを前に戻す操作（例えば、ボタンＢ１１を選択する操作）を入力すると、提示制御部１１３は、表示対象の誤判定データを前に切り替えてもよい。例えば、優先順位がより高い誤判定データに切り替えられてもよい。優先順位がより高い誤判定データがなければ、最も優先順位が低い誤判定データに切り替えられてもよい。このとき、推定ラベルＢ２２も、切り替え後の誤判定データの推定ラベルに切り替えられてよい。

【0099】

他の一例として、操作部１１６に対して、作業者が誤判定データを先に進める操作（例えば、ボタンＢ１２を選択する操作）を入力すると、提示制御部１１３は、表示対象の誤判定データを先に進めてもよい。例えば、優先順位がより低い誤判定データに切り替えられてもよい。優先順位がより低い誤判定データがなければ、最も優先順位が高い誤判定データに切り替えられてもよい。このとき、推定ラベルＢ２２も、切り替え後の誤判定データの推定ラベルに切り替えられてよい。

【0100】

なお、全部の誤判定データが同時に表示される場合には、作業者が誤判定データを前に戻す操作、および、作業者が誤判定データを先に進める操作などは不要である。

【0101】

なお、作業者が誤判定データを前に戻す操作によって、２つ以上前の誤判定データに戻されてもよい。あるいは、幾つ前の誤判定データに戻すかを、作業者が選択可能であってもよい。同様に、作業者が誤判定データを先に進める操作によって、２つ以上先の誤判定データに進められてもよい。あるいは、幾つ先の誤判定データに進めるかを、作業者が選択可能であってもよい。

【0102】

作業者は、推定ラベルの修正データを入力することが可能である。より詳細に、ラベル修正画面Ｗ１には、正解ラベルの入力欄Ｂ２３が含まれている。作業者は、現在表示されている誤判定データ（入力データＧ１）を見ながら、正解ラベルの入力欄Ｂ２３に対して、現在表示されている誤判定データに対応する正解ラベル（すなわち、現在表示されている誤判定データの推定ラベルの修正データ）を入力することが可能である。

【0103】

なお、作業者は、対象件数を指定することが可能であってよい。より詳細に、ラベル修正画面Ｗ１には、対象件数の入力欄Ｂ２１が含まれている。対象件数の入力欄Ｂ２１には、現在の対象件数が表示されている。作業者は、対象件数の入力欄Ｂ２１に対して、対象件数を入力することによって対象件数を指定することが可能である。このとき、誤判定データ推定部１１２は、作業者によって指定された対象件数に基づいて、誤判定データを推定し直してよい。あるいは、対象件数は、あらかじめ決められた値であってもよい。

【0104】

（記録制御部１１５）
記録制御部１１５は、推定ラベルの修正データを入力する操作に基づいて、当該修正データを正解ラベルとして現在表示されている誤判定データに対応付ける。そして、記録制御部１１５は、正解ラベルと誤判定データとの組み合わせを、正解ラベルとラベル有りデータとの組み合わせとして、図示しない記憶部に記録されているラベル付きデータセット１０１に追加する。

【0105】

より詳細に、操作部１１６に対して、作業者が修正を実行させる操作（例えば、ボタンＢ８０を選択する操作）を入力すると、記録制御部１１５は、正解ラベルの入力欄Ｂ２３において選択された値を修正データとして取得する。そして、記録制御部１１５は、取得した修正データと誤判定データとの組み合わせを、正解ラベルとラベル有りデータとの組み合わせとしてラベル付きデータセット１０１に追加する。

【0106】

一方、操作部１１６に対して、作業者が修正を取り消す操作（例えば、ボタンＢ７０を選択する操作）を入力すると、提示制御部１１３は、現在表示されている誤判定データ（入力データＧ１）の推定ラベルの修正を実行しなくてよい。

【0107】

記録制御部１１５は、推定ラベルの修正の終了条件が満たされたか否かを判断する。記録制御部１１５は、推定ラベルの修正の終了条件が満たされていないと判断した場合には、引き続き推定ラベルの修正が行われる。一方、記録制御部１１５は、推定ラベルの修正の終了条件が満たされたと判断された場合には、推定ラベルの修正を終了する。

【0108】

なお、推定ラベルの修正の終了条件は特に限定されない。例えば、推定ラベルの修正の終了条件は、作業者によって推定ラベルの修正を終了させる操作（例えば、ラベル修正画面Ｗ１を閉じる操作など）が入力されたという条件であってもよい。あるいは、推定ラベルの修正の終了条件は、推定ラベルの修正がある程度行われたことを示す条件であってもよい。具体的に、推定ラベルの修正がある程度行われたことを示す条件は、誤判定データの推定ラベルの修正が全部終了したという条件を含んでもよい。

【0109】

（修正段階の動作）
図５を参照しながら、本発明の第１の実施形態に係る学習装置１０によって実行される「修正段階」の動作の流れについて説明する。図５は、本発明の第１の実施形態に係る学習装置１０によって実行される修正段階の動作例を示すフローチャートである。

【0110】

入力部１１１は、ラベル付きデータセット１０１からラベル有りデータおよび正解ラベルの組み合わせを順次に取得する。特徴抽出部１２１は、重みパラメータ１２３から特徴抽出ＮＮのニューロンに対応する重みパラメータを取得し、取得した重みパラメータが設定された特徴抽出ＮＮにラベル有りデータを順次に入力させたことに基づいて、特徴抽出ＮＮから出力されるデータをラベル有りデータの特徴量として得る（Ｓ１１１）。

【0111】

誤判定データ推定部１１２は、ラベル有りデータの特徴量の平均値を正解ラベルごとに算出する（Ｓ１１２）。

【0112】

続いて、入力部１１１は、ラベル無しデータセット１０２からラベル無しデータを順次に取得する。特徴抽出部１２１は、重みパラメータが設定された特徴抽出ＮＮにラベル無しデータを順次に入力させたことに基づいて、特徴抽出ＮＮから出力されるデータをラベル無しデータの特徴量として得る（Ｓ１１３）。

【0113】

識別部１２２は、重みパラメータ１２３から識別ＮＮのニューロンに対応する重みパラメータを取得し、取得した重みパラメータが設定された識別ＮＮにラベル無しデータの特徴量を入力させたことに基づいて、識別ＮＮから出力されるデータをラベル無しデータの推定ラベルとして得る（Ｓ１１４）。

【0114】

誤判定データ推定部１１２は、ラベル無しデータの特徴量と推定ラベルに一致する正解ラベルが対応付けられたラベル有りデータの特徴量の平均値との距離を算出する（Ｓ１１５）。そして、誤判定データ推定部１１２は、作業者によって対象件数が指定された場合には、作業者によって指定された対象件数を取得する（Ｓ１１６）。

【0115】

誤判定データ推定部１１２は、対象件数のラベル無しデータを誤判定データとして推定する。提示制御部１１３は、対象件数のラベル無しデータを誤判定データとして距離が大きい順に表示されるように提示部１１４を制御する（Ｓ１１７）。記録制御部１１５は、作業者によって推定ラベルの修正データとして正解ラベルが入力された場合には、作業者によって入力された正解ラベルを取得する（Ｓ１１８）。

【0116】

記録制御部１１５は、作業者の操作に基づいて、取得した正解ラベルを現在表示されているラベル無しデータに対応付ける。そして、記録制御部１１５は、正解ラベルとラベル無しデータとの組み合わせを、ラベル付きデータセット１０１に保存する（Ｓ１１９）。推定ラベルの修正の終了条件が満たされていないと判断した場合には、引き続き推定ラベルの修正が行われる。一方、推定ラベルの修正の終了条件が満たされたと判断された場合には、推定ラベルの修正が終了する。

【0117】

以上、本発明の第１の実施形態に係る学習装置１０によって実行される「修正段階」の動作の流れについて説明した。

【0118】

（１－３．再学習段階）
続いて、本発明の第１の実施形態に係る学習装置１０によって実行される「再学習段階」について説明する。「再学習段階」においても、学習段階と同様にニューラルネットワーク１２０の学習が行われる。

【0119】

ただし、修正段階において、ラベル無しデータの推定ラベルが修正されており、ラベル付きデータセット１０１に存在するラベル付きデータ（正解ラベルに対応付けられたラベル有りデータ）が学習段階よりも増えている。そのため、再学習段階における学習精度は、学習段階における学習精度よりも向上することが期待される。

【0120】

以上、本発明の第１の実施形態に係る学習装置１０によって実行される「再学習段階」について説明した。

【0121】

（１－４．第１の実施形態のまとめ）
以上に説明したように、本発明の第１の実施形態に係る学習装置１０は、ラベル有りデータの特徴量とラベル無しデータの特徴量とに基づき、ラベルを付与すべき入力データを作業者に提示する機構を有する。かかる機構によって、作業者は、精度の向上に寄与することが期待される入力データに、効率的に正解ラベルを付与できるため、作業者によるラベル付与の負担が低減され得る。

【0122】

また、本発明の第１の実施形態によれば、半教師あり学習の枠組みを崩さずに、半教師あり学習の枠組みの外部に誤判定データを推定する機構を取り付けることが可能である。

【0123】

以上、本発明の第１の実施形態について説明した。

【0124】

（２．第２の実施形態）
続いて、本発明の第２の実施形態について説明する。本発明の第２の実施形態においては、学習装置によって教師なし学習が行われる。図６は、本発明の第２の実施形態に係る学習装置２０の機能構成例を示す図である。図６に示されるように、本発明の第２の実施形態に係る学習装置２０は、本発明の第１の実施形態に係る学習装置１０と同様に、入力部１１１と、提示制御部１１３と、提示部１１４と、記録制御部１１５と、操作部１１６と、特徴抽出部１２１と、ラベル有りデータ評価部１３１と、更新部１３３とを備える。なお、ラベル有りデータ評価部１３１は再学習段階において用いられる。

【0125】

さらに、本発明の第２の実施形態に係る学習装置２０は、誤判定データ推定部２１２と、表現ベクトル抽出部２２１と、ラベル無しデータ評価部２３２とを備える。以下では、誤判定データ推定部２１２、表現ベクトル抽出部２２１およびラベル無しデータ評価部２３２について主に説明を行う。

【0126】

本発明の第２の実施形態では、特徴抽出部１２１と、表現ベクトル抽出部２２１とが、ニューラルネットワーク１２０に含まれる場合を主に想定する。すなわち、特徴抽出部１２１と、表現ベクトル抽出部２２１とは、ニューロンによって構築される計算グラフが処理順に接続されて構成されており、全体として１つのニューラルネットワークとみなされ得る。表現ベクトル抽出部２２１は、第３のニューラルネットワーク（以下、「表現ベクトル抽出ＮＮ」とも表記する。）を含む。

【0127】

しかし、表現ベクトル抽出部２２１は、具体的にどのような構成であってもよい。例えば、以下では、表現ベクトル抽出部２２１が表現ベクトル抽出ＮＮを含む場合を主に想定して説明する。しかし、表現ベクトル抽出部２２１は、表現ベクトル抽出ＮＮを含まずに特定の表現ベクトル抽出アルゴリズムに基づいて表現ベクトルの抽出を行ってもよい。表現ベクトルについては後に詳細に説明する。

【0128】

また、本発明の第２の実施形態においては、初回の学習段階において、ラベル付きデータセット２０１は空である。すなわち、初回の学習段階において、ラベル付きデータセット２０１には、ラベル有りデータと正解ラベルとの組み合わせが存在しない。なお、このラベル付きデータセット２０１は、人手によって付与された正解ラベルを用いて再学習を行い、分類精度を上げる際に、利用することができる。

【0129】

誤判定データ推定部２１２、表現ベクトル抽出部２２１およびラベル無しデータ評価部２３２は、ＣＰＵまたはＧＰＵなどの演算装置を含み、ＲＯＭにより記憶されているプログラムが演算装置によりＲＡＭに展開されて実行されることにより、その機能が実現され得る。このとき、当該プログラムを記録した、コンピュータに読み取り可能な記録媒体も提供され得る。あるいは、これらのブロックは、専用のハードウェアにより構成されていてもよいし、複数のハードウェアの組み合わせにより構成されてもよい。演算装置による演算に必要なデータは、図示しない記憶部によって適宜記憶される。

【0130】

（２－１．学習段階）
まず、本発明の第２の実施形態に係る学習装置２０によって実行される「学習段階」について説明する。

【0131】

入力部１１１は、ラベル無しデータセット１０２からラベル無しデータを順次に取得する。入力部１１１は、ラベル無しデータを順次に特徴抽出部１２１に出力する。入力部１１１よりも後段の各ブロックにおいては、前段のブロックからの入力に基づいて順次に各自の処理が繰り返し実行される。特徴抽出部１２１は、入力部１１１から出力されたラベル無しデータと特徴抽出ＮＮとに基づいてラベル無しデータの特徴量を抽出する。特徴抽出部１２１は、ラベル無しデータの特徴量を表現ベクトル抽出部２２１に出力する。

【0132】

（表現ベクトル抽出部２２１）
表現ベクトル抽出部２２１は、特徴抽出部１２１によって抽出されたラベル無しデータの特徴量に基づいて、ラベル無しデータの表現ベクトルを得る。より詳細に、表現ベクトル抽出部２２１は、重みパラメータ１２３から表現ベクトル抽出ＮＮのニューロンに対応する重みパラメータを取得し、取得した重みパラメータが設定された表現ベクトル抽出ＮＮにラベル無しデータの特徴量を入力させたことに基づいて、表現ベクトル抽出ＮＮから出力されるデータをラベル無しデータの表現ベクトルとして得る。

【0133】

表現ベクトル抽出部２２１は、ラベル無しデータの表現ベクトルをラベル無しデータ評価部１３２に出力する。表現ベクトルは、特徴抽出部１２１によって抽出された特徴量から重要な情報だけが抽出された結果として、特徴量の次元よりも次元が小さくなった情報であり、「潜在変数」とも表現される。

【0134】

さらに詳細に、表現ベクトル抽出部２２１は、ラベル無しデータの表現ベクトルとして、教師なし学習の枠組みに基づく２種類の表現ベクトルを得る。２種類の表現ベクトルを得るためのアルゴリズムは、特定のアルゴリズムに限定されず、教師なし学習に用いられるアルゴリズムが用いられてよい。

【0135】

例えば、入力部１１１が、ラベル無しデータセット１０２から取得したラベル無しデータに基づいて２種類のラベル無しデータを得てもよい。一例として、入力部１１１は、ラベル無しデータに対して２種類のデータ拡張を施すことによって２種類のラベル無しデータを得てもよい。このとき、入力部１１１は、特徴抽出部１２１に対して２種類のラベル無しデータを出力し、特徴抽出部１２１は、２種類のラベル無しデータそれぞれの特徴量を出力し、表現ベクトル抽出部２２１は、２種類のラベル無しデータそれぞれの特徴量に対応する表現ベクトルを出力する。

【0136】

あるいは、入力部１１１から特徴抽出部１２１に出力されるラベル無しデータは１種類であり、特徴抽出部１２１および表現ベクトル抽出部２２１において、２種類の重みパラメータを使用してもよい。一例として、特徴抽出部１２１および表現ベクトル抽出部２２１は、入力部１１１から出力されるラベル無しデータに対して、重みパラメータ１２３の全部を適用して得たデータおよび重みパラメータ１２３の一部を適用して得たデータを２種類の表現ベクトルとして得てもよい。このとき、表現ベクトル抽出部２２１から２種類の表現ベクトルが出力される。

【0137】

（ラベル無しデータ評価部２３２）
ラベル無しデータ評価部２３２は、教師なし学習の枠組みに基づいて２種類の表現ベクトルを評価してラベル無しデータに対応する評価結果を得る。ここで、２種類の表現ベクトルの評価アルゴリズムは特定のアルゴリズムに限定されず、教師なし学習に用いられるアルゴリズムが用いられてよい。例えば、２種類の表現ベクトルの評価アルゴリズムは、対照学習のように同一のデータに対する２つの表現ベクトルの距離は近いかどうかを評価し、異なるデータ間の２つの表現ベクトルの距離は遠いかどうかを評価するアルゴリズムでもあってもよい。

【0138】

ラベル無しデータ評価部２３２は、ラベル無しデータに対応する評価結果を更新部１３３に出力する。更新部１３３は、ラベル無しデータ評価部１３２から出力されたラベル無しデータに対応する評価結果に基づいて、重みパラメータ１２３の更新を行う。重みパラメータ１２３は、ラベル無しデータに対応する評価結果に基づく誤差逆伝播法（バックプロパゲーション）によって更新されてよい。

【0139】

（学習段階の動作）
図７を参照しながら、本発明の第２の実施形態に係る学習装置２０によって実行される「学習段階」の動作の流れについて説明する。図７は、本発明の第２の実施形態に係る学習装置２０によって実行される学習段階の動作例を示すフローチャートである。

【0140】

まず、入力部１１１は、ラベル無しデータセット１０２からラベル無しデータを取得する。特徴抽出部１２１は、特徴抽出ＮＮと１種類または２種類のラベル無しデータとに基づいて、特徴抽出ＮＮから出力されるデータを２種類のラベル無しデータそれぞれの特徴量として得る。表現ベクトル抽出部２２１は、表現ベクトル抽出ＮＮと２種類のラベル無しデータとに基づいて、表現ベクトル抽出ＮＮから出力されるデータを２種類の表現ベクトルとして得る（Ｓ２０１）。なお、上記したように、ラベル無しデータの種類の増加は、入力部１１１によって行われてもよいし、特徴抽出部１２１および表現ベクトル抽出部２２１によって行われてもよい。

【0141】

ラベル無しデータ評価部２３２は、ラベル無しデータに対応する２種類の表現ベクトルに基づいて、２種類の表現ベクトルを評価してラベル無しデータに対応する評価結果を得る（Ｓ２０２）。更新部１３３は、ラベル無しデータ評価部２３２から出力されたラベル無しデータに対応する評価結果に基づいて、重みパラメータ１２３の更新を行う（Ｓ２０３）。

【0142】

更新部１３３は、学習用データに基づく更新が終わるたびに、学習の終了条件が満たされたか否かを判断する（Ｓ２０４）。学習の終了条件が満たされていないと判断した場合には（Ｓ２０４において「ＮＯ」）、Ｓ２０１に動作が移行される。一方、更新部１３３によって、学習の終了条件が満たされたと判断された場合には（Ｓ２０４において「ＹＥＳ」）、学習が終了される。

【0143】

以上、本発明の第２の実施形態に係る学習装置２０によって実行される「学習段階」の動作の流れについて説明した。

【0144】

（２－２．修正段階）
続いて、本発明の第２の実施形態に係る学習装置２０によって実行される「修正段階」について説明する。

【0145】

なお、本発明の第１の実施形態と同様に、「学習段階」が実行されずに、「修正段階」が実行され、後に説明する「再学習」が実行されてもよい。かかる場合であっても、「修正段階」において、作業者によって正解ラベル（割当ラベルの修正データ）が入力される。「修正段階」においても、学習段階と同様に、入力部１１１、特徴抽出部１２１および表現ベクトル抽出部２２１において各自の処理が実行される。

【0146】

（誤判定データ推定部２１２）
誤判定データ推定部２１２は、全部のラベル無しデータの表現ベクトルに対するグループ化に基づいて、各ラベル無しデータ（第１のラベル無しデータ）に割当ラベル（第１の割当ラベル）を付与する。そして、誤判定データ推定部２１２は、各ラベル無しデータに対応する割当ラベルの信頼度（第１の信頼度）を算出する。そして、誤判定データ推定部２１２は、算出した信頼度が所定の条件を満たす場合に、表現ベクトル抽出部２２１から出力されたラベル無しデータを誤判定データとして推定する。

【0147】

まず、信頼度の算出例について説明する。誤判定データ推定部２１２は、全部のラベル無しデータの表現ベクトルを表現ベクトル抽出部２２１から取得する。そして、誤判定データ推定部２１２は、全部のラベル無しデータの表現ベクトルに対するグループ化に基づいて、各表現ベクトルをＣクラスに分類する。誤判定データ推定部２１２は、分類されたクラスを示す割当ラベルｃ∈｛１，…，Ｃ｝を各表現ベクトルに対応付ける。

【0148】

ここで、グループ化の手法は特定の手法に限定されず、教師なし学習に用いられるグループ化の手法が用いられてよい。例えば、グループ化の手法には、ｋ近傍法またはｋ平均法などが用いられてもよい。続いて、誤判定データ推定部２１２は、割当ラベルｃごとにラベル無しデータの表現ベクトルの平均値を算出する。

【0149】

ここで、ラベル無しデータの数をＮ_Ｕとし、各ラベル無しデータの番号をｉ∈｛１，…，Ｎ_Ｕ｝とし、各ラベル無しデータの表現ベクトルをｚ_ｉ ^Ｕとし、各ラベル無しデータの割当ラベルをｙ_ｉとすると、割当ラベルｃのラベル無しデータの表現ベクトルの平均値ｚ_ｃ ^Ｕ（ａｖｅ）は、以下の式（３）のように表現され得る。

【0150】

【数3】

【0151】

続いて、誤判定データ推定部２１２は、割当ラベル（第１の割当ラベル）と一致する割当ラベル（第２の割当ラベル）が対応付けられたラベル無しデータの表現ベクトル（第２の表現ベクトル）と、ラベル無しデータ（第１のラベル無しデータ）の表現ベクトル（第１の表現ベクトル）との距離を算出する。

【0152】

ここで、誤判定データ推定部２１２によって算出される距離は、特定の距離に限定されない。例えば、誤判定データ推定部２１２によって算出される距離は、特徴量間のユークリッド距離であってもよいし、特徴量の類似度の算出に用いられるコサイン類似度であってもよい。そして、誤判定データ推定部２１２は、算出した距離に基づいて、割当ラベル（第１の割当ラベル）の信頼度（第１の信頼度）を算出する。

【0153】

より詳細に、誤判定データ推定部２１２は、割当ラベル（第１の割当ラベル）と一致する割当ラベル（第２の割当ラベル）が対応付けられたラベル無しデータ（第２のラベル無しデータ）の表現ベクトルの平均値を算出する。そして、誤判定データ推定部２１２は、算出した平均値とラベル無しデータ（第１のラベル無しデータ）の表現ベクトルとの距離に基づいて、割当ラベル（第１の割当ラベル）の信頼度（第１の信頼度）を算出する。ここでは、誤判定データ推定部２１２によって算出された距離が小さくなるほど、割当ラベルの信頼度が高くなる場合を想定する。

【0154】

さらに詳細に、ラベル無しデータの数をＮ_Ｕとし、各ラベル無しデータの番号をｉ∈｛１，…，Ｎ_Ｕ｝とし、各ラベル無しデータの表現ベクトルをｚ_ｉ ^Ｕとし、各ラベル無しデータの割当ラベルをｙ_ｉ’とすると、割当ラベルｙ_ｉ’と一致する割当ラベルに対応するラベル無しデータの表現ベクトルの平均値ｚ_ｙｉ ^Ｕ（ａｖｅ）とラベル無しデータの表現ベクトルｚ_ｉ ^Ｕとの距離ｄ_ｉは、以下の式（４）のように表現され得る。

【0155】

【数4】

【0156】

誤判定データ推定部２１２は、算出した距離ｄ_ｉが所定の条件を満たす場合に、ラベル無しデータを誤判定データとして推定する。より詳細に、距離ｄ_ｉが大きいほど、割当ラベルｙ_ｉ’が誤判定によって得られた可能性が高いと考えられる。

【0157】

そこで、誤判定データ推定部２１２は、各ラベル無しデータを距離ｄ_ｉが降順になるように（距離が大きい順に）並び変えてよい。そして、誤判定データ推定部２１２は、所定の条件の例として、距離ｄ_ｉが各距離の大きいほうから対象件数Ｘ個（所定の件数）以内に入るという条件（すなわち、信頼度が各ラベル無しデータの割当ラベルの信頼度の低いほうから対象件数以内に入るという条件）を満たすラベル無しデータを誤判定データとして推定してもよい。このとき、誤判定データ推定部２１２は、距離の降順を優先順位としてラベル無しデータに対応する割当ラベルを修正対象としてよい。

【0158】

図８は、誤判定データの推定例について説明するための図である。図８を参照すると、表現ベクトル空間Ｚ１が示されており、表現ベクトル空間Ｚ１の中に、一つ目の割当ラベルに対応するラベル無しデータの表現ベクトルの平均値Ｃ２１が存在している。同様に、二つ目の割当ラベルに対応するラベル無しデータの表現ベクトルの平均値Ｃ２２、および、三つ目の割当ラベルに対応するラベル無しデータの特徴量の平均値Ｃ２３が存在している。

【0159】

また、表現ベクトル空間Ｚ１の中に、一つ目のラベル無しデータの表現ベクトルＡ２１が存在している。同様に、二つ目のラベル無しデータの表現ベクトルＡ２２、および、三つ目のラベル無しデータの表現ベクトルＡ２３が存在している。

【0160】

一つ目のラベル無しデータに対応する割当ラベルは、ラベル無しデータの特徴量の平均値Ｃ２１に対応する一つ目の割当ラベルと一致する。そして、一つ目のラベル無しデータの表現ベクトルＡ２１と一つ目の割当ラベルに対応するラベル無しデータの表現ベクトルの平均値Ｃ２１との距離が距離Ｄ２１として示されている。

【0161】

二つ目のラベル無しデータに対応する割当ラベルは、ラベル無しデータの表現ベクトルの平均値Ｃ２２に対応する二つ目の割当ラベルと一致する。そして、二つ目のラベル無しデータの表現ベクトルＡ２２と二つ目の割当ラベルに対応するラベル無しデータの表現ベクトルの平均値Ｃ２２との距離が距離Ｄ２２として示されている。

【0162】

三つ目のラベル無しデータに対応する表現ベクトルは、ラベル無しデータの表現ベクトルの平均値Ｃ２３に対応する三つ目の割当ラベルと一致する。そして、三つ目のラベル無しデータの表現ベクトルＡ２３と三つ目の割当ラベルに対応するラベル無しデータの表現ベクトルの平均値Ｃ２３との距離が距離Ｄ２３として示されている。

【0163】

距離Ｄ２１～Ｄ２３のうち、一番目に大きい距離は距離Ｄ２１であり、二番目に大きい距離は距離Ｄ２２であり、三番目に大きい距離は距離Ｄ２３である。このとき、誤判定データ推定部２１２は、距離Ｄ２１に対応する一つ目のラベル無しデータ、距離Ｄ２２に対応する二つ目のラベル無しデータ、距離Ｄ２３に対応する三つ目のラベル無しデータの順に、優先して割当ラベルを修正対象としてよい。

【0164】

提示制御部１１３は、誤判定データ推定部１１２によって推定された誤判定データが提示部１１４によって提示されるように提示部１１４を制御する。これによって、作業者は、誤判定データ（すなわち、割当ラベルが誤判定されたラベル無しデータ）に基づいて、割当ラベルの修正が可能となる。

【0165】

図９は、作業者に割当ラベルを修正させるためのラベル修正画面の例を示す図である。図９を参照すると、提示部１１４によって表示されるラベル修正画面Ｗ２が示されている。作業者は、誤判定データ（入力データＧ１）などを見ながら、各種操作を操作部１１６に対して入力することが可能である。

【0166】

作業者は、割当ラベルの修正データを入力することが可能である。より詳細に、ラベル修正画面Ｗ２には、正解ラベルの入力欄Ｂ２３が含まれている。作業者は、現在表示されている誤判定データ（入力データＧ１）を見ながら、正解ラベルの入力欄Ｂ２３に対して、現在表示されている誤判定データに対応する正解ラベル（すなわち、現在表示されている誤判定データに対応する割当ラベルの修正データ）を入力することが可能である。

【0167】

記録制御部１１５は、割当ラベルの修正データを入力する操作に基づいて、当該修正データを正解ラベルとして現在表示されている誤判定データに対応付ける。そして、記録制御部１１５は、正解ラベルと誤判定データとの組み合わせを、正解ラベルとラベル有りデータとの組み合わせとして、図示しない記憶部に記録されているラベル付きデータセット１０１に追加する。

【0168】

【0169】

なお、本発明の第１の実施形態と同様に、記録制御部１１５は、割当ラベルの修正の終了条件が満たされたか否かを判断する。記録制御部１１５は、割当ラベルの修正の終了条件が満たされていないと判断した場合には、引き続き割当ラベルの修正が行われる。一方、記録制御部１１５は、割当ラベルの修正の終了条件が満たされたと判断された場合には、割当ラベルの修正を終了する。

【0170】

（修正段階の動作）
図１０を参照しながら、本発明の第２の実施形態に係る学習装置２０によって実行される「修正段階」の動作の流れについて説明する。図１０は、本発明の第２の実施形態に係る学習装置２０によって実行される修正段階の動作例を示すフローチャートである。

【0171】

入力部１１１は、ラベル無しデータセット１０２からラベル無しデータを順次に取得する。特徴抽出部１２１は、重みパラメータが設定された特徴抽出ＮＮにラベル無しデータを順次に入力させたことに基づいて、特徴抽出ＮＮから出力されるデータをラベル無しデータの特徴量として得る。

【0172】

表現ベクトル抽出部２２１は、重みパラメータ１２３から表現ベクトル抽出ＮＮのニューロンに対応する重みパラメータを取得し、取得した重みパラメータが設定された表現ベクトル抽出ＮＮにラベル無しデータの特徴量を入力させたことに基づいて、表現ベクトル抽出ＮＮから出力されるデータをラベル無しデータの表現ベクトルとして得る（Ｓ２１１）。

【0173】

誤判定データ推定部２１２は、各ラベル無しデータの表現ベクトルに対するグループ化に基づいて、各表現ベクトルを複数のクラスに分類する。そして、誤判定データ推定部２１２は、分類されたクラスを示す割当ラベルを各表現ベクトルに対応付ける。誤判定データ推定部２１２は、表現ベクトルの平均値を割当ラベルごとに算出する（Ｓ２１２）。

【0174】

誤判定データ推定部２１２は、ラベル無しデータの表現ベクトルと、当該ラベル無しデータの割当ラベルに一致する割当ラベルが対応付けられた表現ベクトルの平均値との距離を算出する（Ｓ２１３）。そして、誤判定データ推定部２１２は、作業者によって対象件数が指定された場合には、作業者によって指定された対象件数を取得する（Ｓ２１４）。

【0175】

誤判定データ推定部２１２は、対象件数のラベル無しデータを誤判定データとして推定する。提示制御部１１３は、対象件数のラベル無しデータを誤判定データとして距離が大きい順に表示されるように提示部１１４を制御する（Ｓ２１５）。記録制御部１１５は、作業者によって割当ラベルの修正データとして正解ラベルが入力された場合には、作業者によって入力された正解ラベルを取得する（Ｓ２１６）。

【0176】

記録制御部１１５は、作業者の操作に基づいて、取得した正解ラベルを現在表示されているラベル無しデータに対応付ける。そして、記録制御部１１５は、正解ラベルとラベル無しデータとの組み合わせを、ラベル付きデータセット１０１に保存する（Ｓ２１７）。割当ラベルの修正の終了条件が満たされていないと判断した場合には、引き続き割当ラベルの修正が行われる。一方、割当ラベルの修正の終了条件が満たされたと判断された場合には、割当ラベルの修正が終了する。

【0177】

以上、本発明の第２の実施形態に係る学習装置２０によって実行される「修正段階」の動作の流れについて説明した。

【0178】

（２－３．再学習段階）
続いて、本発明の第２の実施形態に係る学習装置２０によって実行される「再学習段階」について説明する。本発明の第２の実施形態に係る学習装置２０によって実行される「再学習段階」は、本発明の第１の実施形態に係る学習装置１０によって実行される「再学習段階」と同様である。

【0179】

以上、本発明の第２の実施形態に係る学習装置２０によって実行される「再学習段階」について説明した。

【0180】

（２－４．第２の実施形態のまとめ）
以上に説明したように、本発明の第２の実施形態に係る学習装置２０は、ラベル無しデータの表現ベクトルに基づき、ラベルを付与すべき入力データを作業者に提示する機構を有する。かかる機構によって、作業者は、精度の向上に寄与することが期待される入力データに、効率的に正解ラベルを付与できるため、作業者によるラベル付与の負担が低減され得る。

【0181】

また、本発明の第２の実施形態によれば、教師なし学習の枠組みを崩さずに、教師なし学習の枠組みの外部に誤判定データを推定する機構を取り付けることが可能である。

【0182】

以上、本発明の第２の実施形態について説明した。

【0183】

（３．ハードウェア構成例）
続いて、本発明の第１の実施形態に係る学習装置１０のハードウェア構成例について説明する。なお、本発明の第２の実施形態に係る学習装置２０のハードウェア構成は、本発明の第１の実施形態に係る学習装置１０と同様に実現され得る。

【0184】

以下では、本発明の第１の実施形態に係る学習装置１０のハードウェア構成例として、情報処理装置９００のハードウェア構成例について説明する。なお、以下に説明する情報処理装置９００のハードウェア構成例は、学習装置１０のハードウェア構成の一例に過ぎない。したがって、学習装置１０のハードウェア構成は、以下に説明する情報処理装置９００のハードウェア構成から不要な構成が削除されてもよいし、新たな構成が追加されてもよい。

【0185】

図１１は、本発明の第１の実施形態に係る学習装置１０の例としての情報処理装置９００のハードウェア構成を示す図である。情報処理装置９００は、ＣＰＵ（ＣｅｎｔｒａｌＰｒｏｃｅｓｓｉｎｇＵｎｉｔ）９０１と、ＲＯＭ（ＲｅａｄＯｎｌｙＭｅｍｏｒｙ）９０２と、ＲＡＭ（ＲａｎｄｏｍＡｃｃｅｓｓＭｅｍｏｒｙ）９０３と、ホストバス９０４と、ブリッジ９０５と、外部バス９０６と、インタフェース９０７と、入力装置９０８と、出力装置９０９と、ストレージ装置９１０と、通信装置９１１と、を備える。

【0186】

ＣＰＵ９０１は、演算処理装置および制御装置として機能し、各種プログラムに従って情報処理装置９００内の動作全般を制御する。また、ＣＰＵ９０１は、マイクロプロセッサであってもよい。ＲＯＭ９０２は、ＣＰＵ９０１が使用するプログラムや演算パラメータ等を記憶する。ＲＡＭ９０３は、ＣＰＵ９０１の実行において使用するプログラムや、その実行において適宜変化するパラメータ等を一時記憶する。これらはＣＰＵバス等から構成されるホストバス９０４により相互に接続されている。

【0187】

ホストバス９０４は、ブリッジ９０５を介して、ＰＣＩ（ＰｅｒｉｐｈｅｒａｌＣｏｍｐｏｎｅｎｔＩｎｔｅｒｃｏｎｎｅｃｔ／Ｉｎｔｅｒｆａｃｅ）バス等の外部バス９０６に接続されている。なお、必ずしもホストバス９０４、ブリッジ９０５および外部バス９０６を分離構成する必要はなく、１つのバスにこれらの機能を実装してもよい。

【0188】

入力装置９０８は、マウス、キーボード、タッチパネル、ボタン、マイクロフォン、スイッチおよびレバー等ユーザが情報を入力するための入力手段と、ユーザによる入力に基づいて入力信号を生成し、ＣＰＵ９０１に出力する入力制御回路等から構成されている。情報処理装置９００を操作するユーザは、この入力装置９０８を操作することにより、情報処理装置９００に対して各種のデータを入力したり処理動作を指示したりすることができる。

【0189】

出力装置９０９は、例えば、ＣＲＴ（ＣａｔｈｏｄｅＲａｙＴｕｂｅ）ディスプレイ装置、液晶ディスプレイ（ＬＣＤ）装置、ＯＬＥＤ（ＯｒｇａｎｉｃＬｉｇｈｔＥｍｉｔｔｉｎｇＤｉｏｄｅ）装置、ランプ等の表示装置およびスピーカ等の音声出力装置を含む。

【0190】

ストレージ装置９１０は、データ格納用の装置である。ストレージ装置９１０は、記憶媒体、記憶媒体にデータを記録する記録装置、記憶媒体からデータを読み出す読出し装置および記憶媒体に記録されたデータを削除する削除装置等を含んでもよい。ストレージ装置９１０は、例えば、ＨＤＤ（ＨａｒｄＤｉｓｋＤｒｉｖｅ）で構成される。このストレージ装置９１０は、ハードディスクを駆動し、ＣＰＵ９０１が実行するプログラムや各種データを格納する。

【0191】

通信装置９１１は、例えば、ネットワークに接続するための通信デバイス等で構成された通信インタフェースである。また、通信装置９１１は、無線通信または有線通信のどちらに対応してもよい。

【0192】

以上、本発明の第１の実施形態に係る学習装置１０のハードウェア構成例について説明した。

【0193】

（４．まとめ）
以上、添付図面を参照しながら本発明の好適な実施形態について詳細に説明したが、本発明はかかる例に限定されない。本発明の属する技術の分野における通常の知識を有する者であれば、特許請求の範囲に記載された技術的思想の範疇内において、各種の変更例または修正例に想到し得ることは明らかであり、これらについても、当然に本発明の技術的範囲に属するものと了解される。

【0194】

本発明の第１の実施形態および本発明の第２の実施形態では、誤判定データ推定部１１２が、所定の条件の例として、距離ｄ_ｉが各距離の大きいほうから対象件数Ｘ個以内に入るという条件を満たすラベル無しデータを誤判定データとして推定する例について主に説明した。しかし、所定の条件は、かかる条件に限定されない。例えば、誤判定データ推定部１１２は、所定の条件の例として、信頼度（第１の信頼度）が閾値よりも低いという条件を満たすラベル無しデータを誤判定データとして推定してもよい。かかる構成によれば、各ラベル無しデータを距離ｄ_ｉが降順になるように並び変える処理が不要になるため、誤判定データの推定に要する演算量が低減され得る。

【0195】

また、本発明の第１の実施形態では、誤判定データ推定部１１２が、推定ラベルと一致する正解ラベルが対応付けられたラベル有りデータの特徴量の平均値とラベル無しデータの特徴量との距離に基づいて、推定ラベルの信頼度を算出する例について主に説明した。しかし、信頼度の算出は、かかる例に限定されない。

【0196】

例えば、誤判定データ推定部１１２は、全部のラベル無しデータの度数を推定ラベルごとに算出し、信頼度（第１の推定ラベル）と一致する推定ラベルに対応する度数に基づいて、信頼度（第１の信頼度）を算出してもよい。一例として、推定ラベルに対応する度数が大きいほど信頼度が高くてもよい。すなわち、誤判定データ推定部１１２は、信頼度（第１の推定ラベル）と一致する推定ラベルに対応する度数が大きいほど、信頼度（第１の信頼度）を高くしてもよい。

【0197】

同様に、本発明の第２の実施形態では、誤判定データ推定部２１２は、割当ラベル（第１の割当ラベル）と一致する割当ラベル（第２の割当ラベル）が対応付けられたラベル無しデータ（第２のラベル無しデータ）の表現ベクトルの平均値とラベル無しデータ（第１のラベル無しデータ）の表現ベクトルとの距離に基づいて、割当ラベル（第１の割当ラベル）の信頼度（第１の信頼度）を算出する例について主に説明した。しかし、信頼度の算出は、かかる例に限定されない。

【0198】

例えば、誤判定データ推定部１１２は、全部のラベル無しデータの度数を割当ラベルごとに算出し、割当ラベル（第１の割当ラベル）と一致する割当ラベルに対応する度数に基づいて、信頼度（第１の信頼度）を算出してもよい。一例として、割当ラベルに対応する度数が大きいほど信頼度が高くてもよい。すなわち、誤判定データ推定部１１２は、割当ラベル（第１の割当ラベル）と一致する割当ラベルに対応する度数が大きいほど、信頼度（第１の信頼度）を高くしてもよい。

【符号の説明】

【0199】

１０、２０学習装置
１１１入力部
１１２、２１２誤判定データ推定部
１１３提示制御部
１１４提示部
１１５記録制御部
１１６操作部
１２０ニューラルネットワーク
１２１特徴抽出部
１２２識別部
１３１ラベル有りデータ評価部
１３２、２３２ラベル無しデータ評価部
１３３更新部
２２１表現ベクトル抽出部

【図1】