特許7521578 | 知財ポータル「IP Force」

知財求人 - 知財ポータルサイト「IP Force」

▶ 日本電気株式会社の特許一覧

特許7521578学習装置、学習方法、推論装置、推論方法、プログラム

書誌要約請求の範囲詳細な説明課題実施例実施するための形態図面の説明

目に優しい文字サイズ小中大 PDF Top

< >

1A
1B
2
3
4
5
6
7
8
9
10
11

(19)【発行国】日本国特許庁(JP)

(12)【公報種別】特許公報(B2)

(11)【特許番号】

(24)【登録日】2024-07-16

(45)【発行日】2024-07-24

(54)【発明の名称】学習装置、学習方法、推論装置、推論方法、プログラム

(51)【国際特許分類】

G06N 20/00 20190101AFI20240717BHJP

【ＦＩ】

G06N20/00 130

【請求項の数】 7

(21)【出願番号】P 2022518439

(86)(22)【出願日】2020-04-27

(86)【国際出願番号】 JP2020017963

(87)【国際公開番号】W WO2021220341

(87)【国際公開日】2021-11-04

【審査請求日】2022-10-05

(73)【特許権者】

【識別番号】000004237

【氏名又は名称】日本電気株式会社

(74)【代理人】

【識別番号】100149548

【弁理士】

【氏名又は名称】松沼泰史

(74)【代理人】

【識別番号】100181135

【弁理士】

【氏名又は名称】橋本隆史

(72)【発明者】

【氏名】吉田周平

【審査官】坂庭剛史

(56)【参考文献】

【文献】特開２０１９－０２１３１３（ＪＰ，Ａ）

【文献】米国特許出願公開第２０１８／０３３６４６４（ＵＳ，Ａ１）

【文献】特開２０１９－１４８１７４（ＪＰ，Ａ）

(58)【調査した分野】(Int.Cl.，ＤＢ名)

Ｇ０６Ｎ２０／００

(57)【特許請求の範囲】

【請求項1】

認識対象データと該認識対象データに付与された弱ラベルとの組の集合である学習用データセット中の前記認識対象データに対する認識結果を出力する認識手段と、
前記認識結果、前記学習用データセットに基づいて算出された交差行列、及び、前記弱ラベルを用いて認識損失を算出する認識損失算出手段と、
を備え、
前記学習用データセットは弱観測確率分布を備えたものであり、
前記弱観測確率分布は、前記認識対象データが属する真の正解クラスで条件づけた前記弱ラベルが従う確率分布であって、再構成可能なものであり、
前記認識損失算出手段は、
前記認識結果を共役ベクトルに変換する変換手段と、
前記共役ベクトルと前記交差行列との積を算出する交差行列積算出手段と、
前記共役ベクトルから正規化項を算出する正規化項算出手段と、
前記積と前記正規化項との和を算出し、前記認識損失として出力する総和算出手段と、を備え、
前記認識手段は、前記認識損失を利用した学習を行う、
学習装置。

【請求項2】

前記学習用データセットに基づいて前記交差行列を算出する交差行列算出手段、
をさらに備える請求項１に記載の学習装置。

【請求項3】

前記認識損失に基づいて前記認識手段のパラメータを更新する更新手段、
をさらに備え、
前記認識手段は、前記パラメータを学習モデルに設定する
請求項２に記載の学習装置。

【請求項4】

前記学習用データセットを供給する弱ラベルデータセット供給手段、
をさらに備える請求項１から請求項３のいずれか１項に記載の学習装置。

【請求項5】

前記学習用データセットは、エキスパートデータセットまたはＰＵデータセットのいずれかである
請求項１から請求項４のいずれか１項に記載の学習装置。

【請求項6】

認識対象データと該認識対象データに付与された弱ラベルとの組の集合である学習用データセット中の前記認識対象データに対する認識結果を出力する認識ステップと、
前記認識結果、前記学習用データセットに基づいて算出された交差行列、及び、前記弱ラベルを用いて認識損失を算出する認識損失算出ステップと、
を含み、
前記学習用データセットは弱観測確率分布を備えたものであり、
前記弱観測確率分布は、前記認識対象データが属する真の正解クラスで条件づけた前記弱ラベルが従う確率分布であって、再構成可能なものであり、
前記認識損失算出ステップは、
前記認識結果を共役ベクトルに変換する変換ステップと、
前記共役ベクトルと前記交差行列との積を算出する交差行列積算出ステップと、
前記共役ベクトルから正規化項を算出する正規化項算出ステップと、
前記積と前記正規化項との和を算出し、前記認識損失として出力する総和算出ステップと、
を含み、
前記認識ステップは、前記認識損失を利用した学習を行うステップをさらに含む、
ことをコンピュータが実行することにより行う学習方法。

【請求項7】

認識対象データと該認識対象データに付与された弱ラベルとの組の集合である学習用データセット中の前記認識対象データに対する認識結果を出力する認識ステップと、
前記認識結果、前記学習用データセットに基づいて算出された交差行列、及び、前記弱ラベルを用いて認識損失を算出する認識損失算出ステップと、
を含み、
前記学習用データセットは弱観測確率分布を備えたものであり、
前記弱観測確率分布は、前記認識対象データが属する真の正解クラスで条件づけた前記弱ラベルが従う確率分布であって、再構成可能なものであり、
前記認識損失算出ステップは、
前記認識結果を共役ベクトルに変換する変換ステップと、
前記共役ベクトルと前記交差行列との積を算出する交差行列積算出ステップと、
前記共役ベクトルから正規化項を算出する正規化項算出ステップと、
前記積と前記正規化項との和を算出し、前記認識損失として出力する総和算出ステップと、
を含み、
前記認識ステップは、前記認識損失を利用した学習を行うステップをさらに含む、
学習方法をコンピュータに実行させるためプログラム。

【発明の詳細な説明】

【技術分野】

【0001】

本発明は、学習装置、学習方法、推論装置、推論方法、プログラムに関する。

【背景技術】

【0002】

近年、機械学習を用いた認識技術は、画像認識の分野を中心に極めて高い性能を示すようになっている。機械学習に基づく認識技術の高い精度は、大量の正解付き学習データに支えられている。しかし、データの収集と正解付けにかかるコストは高く、特に多クラス分類の正解付けにかかるコストは、クラス数が増えるごとに増大する。

【0003】

多クラス分類において、全ての認識対象に対してそれが属するクラスを示す真の正解ラベルを付与する代わりに、真の正解ラベルから確率的に定まる弱ラベルを付与したデータセットを用いる手法が非特許文献１に提案されている。しかし、非特許文献１は、負の成分を含む交差行列を重みとして半正定値関数を足し上げて計算される損失関数を学習に使用しており、損失関数に負の寄与をもたらすデータに対して過適合を生ずる。

【先行技術文献】

【非特許文献】

【0004】

【文献】Ｃｉｄ－Ｓｕｅｉｒｏ，Ｊ．，Ｇａｒｃｉａ－Ｇａｒｃｉａ，Ｄ．、ａｎｄＳａｎｔｏｓ－Ｒｏｄｏｒｉｇｕｅｚ、Ｒ．， ”Ｃｏｎｓｉｓｔｅｎｃｙｏｆｌｏｓｓｅｓｆｏｒｌｅａｒｎｉｎｇｆｒｏｍｗｅａｋｌａｂｅｌｓ”，ＩｎＥＣＭＬ－ＰＫＤＤ，２０１４．

【発明の概要】

【発明が解決しようとする課題】

【0005】

この開示は、上記関連する技術を改善する学習装置、学習方法、推論装置、推論方法、プログラムを提供することを目的としている。

【課題を解決するための手段】

【0006】

本開示の一実施形態による学習装置は、認識対象データと該認識対象データに付与された弱ラベルとの組の集合である学習用データセット中の前記認識対象データに対する認識結果を出力する認識手段と、前記認識結果、前記学習用データセットに基づいて算出された交差行列、及び、前記弱ラベルを用いて認識損失を算出する認識損失算出手段と、を備え、前記学習用データセットは弱観測確率分布を備えたものであり、前記弱観測確率分布は、前記認識対象データが属する真の正解クラスで条件づけた前記弱ラベルが従う確率分布であって、再構成可能なものであり、前記認識損失算出手段は、前記認識結果を共役ベクトルに変換する変換手段と、前記共役ベクトルと前記交差行列との積を算出する交差行列積算出手段と、前記共役ベクトルから正規化項を算出する正規化項算出手段と、前記積と前記正規化項との和を算出し、前記認識損失として出力する総和算出手段と、を備え、前記認識手段は、前記認識損失を利用した学習を行う。

【0007】

本開示の一実施形態による学習方法は、認識対象データと該認識対象データに付与された弱ラベルとの組の集合である学習用データセット中の前記認識対象データに対する認識結果を出力する認識ステップと、前記認識結果、前記学習用データセットに基づいて算出された交差行列、及び、前記弱ラベルを用いて認識損失を算出する認識損失算出ステップと、を含み、前記学習用データセットは弱観測確率分布を備えたものであり、前記弱観測確率分布は、前記認識対象データが属する真の正解クラスで条件づけた前記弱ラベルが従う確率分布であって、再構成可能なものであり、前記認識損失算出ステップは、前記認識結果を共役ベクトルに変換する変換ステップと、前記共役ベクトルと前記交差行列との積を算出する交差行列積算出ステップと、前記共役ベクトルから正規化項を算出する正規化項算出ステップと、前記積と前記正規化項との和を算出し、前記認識損失として出力する総和算出ステップと、を含み、前記認識ステップは、前記認識損失を利用した学習を行うステップをさらに含む。

【0008】

本開示の一実施形態による学習装置用記録媒体は、認識対象データと該認識対象データに付与された弱ラベルとの組の集合である学習用データセット中の前記認識対象データに対する認識結果を出力する認識ステップと、前記認識結果、前記学習用データセットに基づいて算出された交差行列、及び、前記弱ラベルを用いて認識損失を算出する認識損失算出ステップと、を含み、前記学習用データセットは弱観測確率分布を備えたものであり、前記弱観測確率分布は、前記認識対象データが属する真の正解クラスで条件づけた前記弱ラベルが従う確率分布であって、再構成可能なものであり、前記認識損失算出ステップは、前記認識結果を共役ベクトルに変換する変換ステップと、前記共役ベクトルと前記交差行列との積を算出する交差行列積算出ステップと、前記共役ベクトルから正規化項を算出する正規化項算出ステップと、前記積と前記正規化項との和を算出し、前記認識損失として出力する総和算出ステップと、を含み、前記認識ステップは、前記認識損失を利用した学習を行うステップをさらに含む、学習方法をコンピュータに実行させるためプログラムを記録する。

【0009】

本開示の一実施形態による推論装置は、前述の学習装置により学習された認識手段と、前記認識手段の出力を共役ベクトルに変換する変換手段と、前記共役ベクトルをクラス事後確率に変換するクラス事後確率算出手段と、を備える。

【0010】

本開示の一実施形態による推論方法は、前述の学習装置により学習された認識手段を用いて、入力データの認識結果を出力する認識ステップと、前記認識結果を共役ベクトルに変換する変換ステップと、前記共役ベクトルをクラス事後確率に変換するクラス事後確率算出ステップと、を含む。

【0011】

本開示の一実施形態による推論装置用記録媒体は、前述の学習装置により学習された認識手段を用いて、入力データの認識結果を出力する認識ステップと、前記認識結果を共役ベクトルに変換する変換ステップと、前記共役ベクトルをクラス事後確率に変換するクラス事後確率算出ステップと、を含む、推論方法をコンピュータに実行させるためプログラムを記録する。

【図面の簡単な説明】

【0012】

【図1A】多クラス分類問題の場合の通常のデータセットの例を示す。

【図1B】多クラス分類問題の場合の弱ラベルデータセットの例（エキスパートデータセット）を示す。

【図2】学習装置のハードウェア構成の一例を示すブロック図である。

【図3】学習装置の機能構成を示すブロック図である。

【図4】認識損失算出部の詳細な機能構成を示すブロック図である。

【図5】学習装置の動作を示すフローチャートである。

【図6】認識損失算出部の動作を示すフローチャートである。

【図7】推論装置のハードウェア構成の一例を示すブロック図である。

【図8】推論装置の機能構成を示すブロック図である。

【図9】推論装置の動作を示すフローチャートである。

【図10】学習装置の最小構成図を示す図である。

【図11】学習装置の最小構成における動作を示すフローチャートである。

【発明を実施するための形態】

【0013】

以下、図面を参照して、本発明の好適な実施形態について説明する。

【0014】

［弱ラベルデータセット］
まず、本発明の実施形態において使用する弱ラベルを付与されたデータセット（以下、「弱ラベルデータセット」と呼ぶ）について説明する。

【0015】

本実施形態では、データ空間Ｘの要素ｘを正解候補集合Ｙの要素である正解クラスｙに分類する多クラス分類について考える。

【0016】

多クラス分類問題における通常の学習用データセットは、データ空間Ｘの要素であるデータｘと、正解候補集合Ｙの要素である正解クラスｙとの組（ｘ，ｙ）の集合Ｄ

【0017】

【数1】

【0018】

である。

【0019】

弱ラベルデータセットは、データ空間Ｘの要素であるデータｘと、弱ラベル集合Zの要素である弱ラベルｚとの組（ｘ，ｚ）の集合Ｄ_ｗ

【0020】

【数2】

【0021】

であり、弱観測確率分布

【0022】

【数3】

【0023】

を備えている。弱観測確率分布としては、

【0024】

【数4】

【0025】

を満たす交差行列Ｈを持つもの、すなわち再構成可能なものに限定する。ここでは、ｙとｙ’が等しい時に１の値を、異なる時に0の値を取る。データ空間Ｘの要素であるデータｘに対して、それに付与される弱ラベルｚは、弱ラベル集合Ｚの要素であり、データｘが属する真の正解クラスｙから弱観測確率分布に従って定まる。すなわち、データｘ_ｉが属する真のクラスがｙ_ｉである時、データｘ_ｉに弱ラベルｚ_ｉが付与される確率は、式（３）の弱観測確率分布を用いて

【0026】

【数5】

【0027】

で与えられる。実際に付与される弱ラベルｚ_ｉは、式（５）に従ってサンプルされる弱ラベルｚ_ｉの実現値である。

【0028】

次に、弱ラベルデータセットの具体例としてエキスパートデータセットとＰＵデータセットを説明する。これらの具体例に対しては、式（４）を満たす交差行列が存在する。但し、本発明の実施形態において使用する弱ラベルデータセットはエキスパートデータセットとＰＵデータセットに限らない。

【0029】

［１］エキスパートデータセット
「エキスパートデータセット」とは、多クラス分類のモデルを学習する際に使用できる学習用データセットであり、複数の部分データセットにより構成されるものである。具体的に、エキスパートデータセットは、以下の条件を具備するように構成される。
（Ａ）複数の部分データセットの各々には、正解候補集合Ｙに含まれるクラスの少なくとも一部が責任範囲として割り当てられている。
（Ｂ）正解候補集合Ｙに含まれる全てのクラスが、複数の部分データセットのいずれかに割り当てられている。
（Ｃ）部分データセットに含まれる各データには、当該部分データセットに割り当てられた責任範囲に属するクラスのいずれか、又は、当該認識対象のクラスが当該部分データセットの責任範囲に属さないことを示す弱ラベルが付与されている。

【0030】

条件（Ｃ）から、エキスパートデータセットにおける弱ラベル集合Ｚは、正解候補集合Ｙに含まれる各クラスと、各部分データセットの責任範囲外にあることを示すラベルとを含む。データ空間Ｘの要素であるデータｘが正解候補集合Ｙの要素である真のクラスｙに属するとき、このデータｘがどの部分データセットに含まれるかによってデータｘに付与される弱ラベルが決定される。データｘを含む部分データセットの責任範囲が真のクラスｙを含む場合、データｘに付与される弱ラベルｚは真のクラスｙを示す。他方、データｘを含む部分データセットの責任範囲が真のクラスｙを含まない場合、データｘには「真のクラスが当該部分データセットの責任範囲外である」ことを示す弱ラベルｚが付与される。このように、同じクラスｙに属するデータｘであっても、付与される弱ラベルｚが何であるかはどの部分データセットに含まれるかという確率的な要素によって定まる。また、条件（Ｂ）により、弱ラベルを決定する確率分布に対して交差行列Ｈが存在することが保証される。以上より、エキスパートデータセットは本発明で使用する「弱ラベルを付与されたデータセット」の要件を満たしている。

【0031】

図１Ｂは、エキスパートデータセットの例を示す。いま、画像データに基づいて１００クラスの多クラス分類を行う物体認識モデルを学習するものとする。エキスパートデータセットでは、複数の部分データセットを用意する。図１Ｂの例では、「水生哺乳類」、「人」などの複数の部分データセットが用意される。そして、各部分データセットには、それぞれ責任範囲が設定される。「水生哺乳類」の部分データセットには、５種類の水生哺乳類、「ビーバー」、「イルカ」、「カワウソ」、「アザラシ」、「クジラ」が責任範囲として割り当てられる。「人」の部分データセットには、５種類の人、「赤ん坊」、「男の子」、「女の子」、「男性」、「女性」が責任範囲として割り当てられる。ここで、責任範囲は、正解候補集合Ｙに含まれる全てのクラスが、少なくとも一つの部分データセットの責任範囲に含まれるように決定されている。即ち、いずれの部分データセットにも割り当てられていないクラスが存在しないように、１００クラスが複数の部分データセットに割り当てられている。言い換えると、複数の部分データセットにより、１００クラスの認識対象全てが網羅されるように責任範囲が決定されている。これにより、エキスパートデータセットによっても、１００クラスの多クラス分類の学習が可能となる。

【0032】

エキスパートデータセットでは、各部分データセットに含まれる各画像データに対しては、その責任範囲に属するカテゴリーのいずれかを示す正解ラベル、又は、その画像データのカテゴリーがその部分データセットの責任範囲に属さないことを示すラベルが用意される。図１Ｂの例では、「水生哺乳類」の部分データセットに含まれる画像データに対しては、「ビーバー」、「イルカ」、「カワウソ」、「アザラシ」、「クジラ」のいずれかを示す正解ラベル、又は、その画像データのカテゴリーがその部分データセットの責任範囲に属さないことを示す「水生哺乳類でない」というラベルが用意される。例えば、「赤ん坊」の画像が「水生哺乳類」の部分データセットに含まれる場合、この画像に対しては「水生哺乳類でない」というラベルが付与される。

【0033】

このようなエキスパートデータセットを用いると、学習データに対する正解付けの作業負荷が大幅に軽減される。図１Ａに示す通常のデータセットの場合、用意された全ての画像データに対して１００カテゴリーのいずれかを正解ラベルとして付与する必要がある。例えば、学習データとして６万枚の画像データが用意された場合、それら全てに対して１００カテゴリーのいずれかを正解ラベルとして割り当てる必要がある。これに対して、図１Ｂに示すエキスパートデータセットの場合には、６万枚の画像データを例えば２０の集合に分け、２０個の部分データセットを用意する。また、認識対象となる１００カテゴリーを２０の集合に分け、各部分データセットに責任範囲として５カテゴリーを割り当てる。こうすると、図１Ｂに示すように、各部分データセットに属する画像データに対しては、その部分データセットに属する５カテゴリーのいずれかの正解ラベル、又は、その部分データセットの責任範囲に属さないことを示す正解ラベルの合計６個の正解ラベルのいずれかを付与すればよい。即ち、各部分データセットに対して、６個の正解ラベルのいずれかを付与すればよい。

【0034】

［２］PUデータセット
この他の弱ラベルを付与されたデータセットの例として、PUデータセットを説明する。

【0035】

PUデータセットは、データ空間Xの要素であるデータｘを正クラス（Pと表記する）と負クラス（Nと表記する）に分類する２クラス分類問題のデータセットである。２クラス分類問題のデータセットでは、データｘに対してそれがPに属するかNに属するかを示すラベルが付与されている。すなわち、データセットに含まれる全てのデータに真の正解ラベルが付与されている。他方、PUデータセットのデータｘには、データｘがPに属することを示すラベルか、真の正解が未知であることを示すラベル（Uと表記する）が付与されている。すなわち、PUデータセットは弱ラベル集合Zを持ち、ZにはPに属することを示すラベルと真の正解が未知であることを示すラベルが含まれている。

【0036】

データ空間Xの要素であるデータｘが真の正解クラスPに属する場合、データｘに対して弱ラベル集合Zの要素であるPとUのいずれが付与されるかは確率的に定まる。他方、データｘが真の正解クラスNに属する場合、データｘに対して付与される弱ラベルは確率１でUである。

【0037】

真の正解クラスを見分けることに高度な専門知識やコストが必要な場合、PUデータセットを用いることで学習データに対する正解付けの作業負荷が大幅に軽減される。このことを入力画像に対してそれが病変を含む（正クラス・P）か、正常か（負クラス・N）を識別する医療画像識別を例に説明する。画像を見てそれが病変を含むか否かを判断するためには、医師の高度な専門知識を必要とする。そのため、２クラス分類問題を学習するための通常のデータセットを作成するためには、全ての画像を医師が確認し正解ラベルを付与する必要がある。他方、PUデータセットを作成するためには、全ての画像に対して診断をつける必要はなく、病変が含まれる（すなわちPである）画像が一定量収集された段階で、残りの画像のすべてに弱ラベルUを付与して学習データの作成を完了できる。

【0038】

［学習装置の実施形態］
次に、弱ラベルデータセットを用いた学習装置の実施形態について説明する。
（ハードウェア構成）
図２は、実施形態に係る学習装置のハードウェア構成を示すブロック図である。図示のように、学習装置１００は、インタフェース１０２と、プロセッサ１０３と、メモリ１０４と、記録媒体１０５と、データベース（ＤＢ）１０６と、を備える。

【0039】

インタフェース１０２は、外部装置との間でデータの入出力を行う。具体的には、学習装置１００の学習に用いられる弱ラベルデータセットがインタフェース１０２を通じて入力される。

【0040】

プロセッサ１０３は、ＣＰＵ（ＣｅｎｔｒａｌＰｒｏｃｅｓｓｉｎｇＵｎｉｔ）、又はＣＰＵとＧＰＵ（ＧｒａｐｈｉｃｓＰｒｏｃｅｓｓｉｎｇＵｉｔ）などのコンピュータであり、予め用意されたプログラムを実行することにより、学習装置１００の全体を制御する。具体的に、プロセッサ１０３は、後述する学習処理を実行する。

【0041】

メモリ１０４は、ＲＯＭ（ＲｅａｄＯｎｌｙＭｅｍｏｒｙ）、ＲＡＭ（ＲａｎｄｏｍＡｃｃｅｓｓＭｅｍｏｒｙ）などにより構成される。メモリ１０４は、学習装置１００が学習するモデルを記憶する。また、メモリ１０４は、プロセッサ１０３による各種の処理の実行中に作業メモリとしても使用される。

【0042】

記録媒体１０５は、ディスク状記録媒体、半導体メモリなどの不揮発性で非一時的な記録媒体であり、学習装置１００に対して着脱可能に構成される。記録媒体１０５は、プロセッサ１０３が実行する各種のプログラムを記録している。ここで、「各種プログラム」とは、図３から図６を用いて説明する学習装置１００の各機能をコンピュータにより実現するためのコンピュータプログラムを含むプログラムである。学習装置１００が各種の処理を実行する際には、記録媒体１０５に記録されているプログラムがメモリ１０４にロードされ、プロセッサ１０３により実行される。

【0043】

データベース１０６は、学習に使用される弱ラベルデータセットを記憶する。なお、上記に加えて、学習装置１００は、ユーザが指示や入力を行うためのキーボード、マウスなどの入力機器や表示部を備えていても良い。

【0044】

（学習装置の機能構成）
図３は、実施形態に係る学習装置の機能構成を示すブロック図である。学習装置１００は、弱ラベルデータセット供給部１１１と、認識部１１２と、認識損失算出部１１３と、更新部１１４と、認識部パラメータ記憶部１１５と、交差行列算出部１１６と、交差行列記憶部１１７と、を備える。また、学習装置１００は、記憶装置３００に記憶される学習用データセットである弱ラベルデータセットを用いた学習処理を行う。なお、学習用データセットを記憶する記憶装置３００は学習装置１００に含まれるものであってもよく、図３に示すように学習装置１００とは異なる別の装置構成としてもよい。

【0045】

弱ラベルデータセット供給部１１１は、記憶装置３００に記憶される弱ラベルデータセットの入力データを認識部１１２及び認識損失算出部１１３に供給する。具体的には、弱ラベルデータセット供給部１１１は、データｘ_ｉと、弱ラベルｚ_ｉとの組｛ｘ_ｉ，ｚ_ｉ｝（以下、これを「入力データの組」と呼ぶ）を認識部１１２及び認識損失算出部１１３に供給する。認識部１１２は、内部にニューラルネットワークなどにより構成される認識モデルを有する。認識部１１２は、画像データである入力ｘ_ｉに対する認識モデルを用いた認識処理を行って認識結果ｆ（ｘ_ｉ）を認識損失算出部１１３に出力する。認識結果ｆ（ｘ_ｉ）は、正解候補集合Yの要素数と同じ次元を持つベクトルであり、その各成分は各クラスの相対的な尤もらしさを表す実数値である。一般に、認識結果ｆ（ｘ_ｉ）の各成分は任意の実数値を取ってよいが、必要に応じて非負値で各成分の総和が１となるように正規化されていてもよい。なお、正規化はsoftmax関数を用いる方法が一般的であるが、この方法に限るものではない。

【0046】

一方、交差行列算出部１１６は、弱ラベルデータセットの属性値に基づいて、交差行列Ｈを算出し、交差行列記憶部１１７に供給する。なお、交差行列については後に詳しく説明する。交差行列記憶部１１７は、供給された交差行列Ｈを記憶し、認識損失算出部１１３に供給する。

【0047】

認識損失算出部１１３は、弱ラベルデータセット供給部１１１から供給される入力データの組｛ｘ_ｉ，ｚ_ｉ｝と、認識部１１２から供給される認識結果ｆ（ｘ_ｉ）と、交差行列Ｈとを用いて認識損失Ｌを算出し、更新部１１４へ供給する。認識損失Ｌについては後に詳しく説明する。更新部１１４は、認識損失Ｌに基づいて、認識部１１２の認識モデルを構成するパラメータを更新し、更新後のパラメータを認識部パラメータ記憶部１１５に供給する。認識部パラメータ記憶部１１５は、更新部１１４から供給された更新後のパラメータを記憶する。認識部１１２は、パラメータを更新するタイミングで認識部パラメータ記憶部１１５に記憶されるパラメータを読み出し、認識処理の際のパラメータとして設定する。こうして、弱ラベルデータセットを学習用データとして用いて、認識部１１２の学習が行われる。

【0048】

図４は認識損失算出部１１３の詳細な機能構成を示すブロック図である。認識損失算出部１１３の各構成要素の詳細な処理内容については後に詳しく説明することとし、ここではその概要のみを示す。認識損失算出部１１３は、変換部１１８と、交差行列積算出部１１９と、正規化項算出部１２０と、総和算出部１２１と、を備える。変換部１１８は認識部１１２から供給される認識結果ｆ（ｘ_ｉ）を共役ベクトルｖ_ｉに変換する。交差行列積算出部１１９は、変換部１１８から供給される共役ベクトルｖ_ｉと、交差行列記憶部１１７から供給される交差行列Ｈと、弱ラベルデータセット供給部１１１から供給される入力データ｛ｘ_ｉ，ｚ_ｉ｝とから、積ｌ_i１を算出する。正規化項算出部１２０は、変換部１１８から供給される共役ベクトルｖ_ｉと、交差行列記憶部１１７から供給される交差行列Ｈとから、正規化項ｌ_i２を算出する。総和算出部１２１は、交差行列積算出部１１９から供給される積ｌ_i１と正規化項算出部１２０から供給される正規化項ｌ_i２との総和を算出し、損失関数Lとして更新部１１４へ供給する。

【0049】

（交差行列）
まず、交差行列Hについて詳しく説明する。交差行列Hは、正解候補集合Yの要素数と同じ数の行を持ち、弱ラベル集合Zの要素数と同じ数の列を持つ長方形行列である。この形状を持った行列のうち、式（４）を満たすものを交差行列Hとして採用する。すなわち、行列Mを、弱ラベル集合Zの要素数と同じ数の行を持ち、正解候補集合Yの要素数と同じ数の列を持つ行列であり、その第z行、第y列成分が

【0050】

【数6】

【0051】

であるものとすると、交差行列Hはその左逆行列M⁺である。

【0052】

【数7】

【0053】

交差行列算出部１１６は、式（７）に従い、式（６）で与えられる行列Ｍの左逆行列Ｍ^＋を計算することで交差行列Ｈを算出する。正解候補集合Yの要素数と弱ラベル集合Zの要素数が異なる場合、行列Ｍの左逆行列は無数に存在するが、そのいずれを用いても良い。

【0054】

（認識損失）
次に、認識損失算出部１１３において算出される認識損失について詳しく説明する。

【0055】

弱ラベルデータセットを用いて学習を行う場合、交差行列Hを用いて損失関数が定義される。しかしながら、従来は交差行列を半正定値関数の重み付き和の重みとして使用しており、交差行列の要素が負の値を持つために、結果として得られる損失関数は負の値を取りうる。損失関数が負の値を取りうる時、学習を実行すると負の重みが掛かった項が際限なく増大し、学習の妨げとなる。そこで、本実施形態では、交差行列Hが掛かった損失に正規化項を加えることで、前述の問題を解消する。

【0056】

従来は、入力データｘ_ｉとそれに付与された弱ラベルｚ_ｉの組（ｘ_ｉ, ｚ_ｉ）の集合｛（ｘ_ｉ, ｚ_ｉ）｝に対して、次の２段階によって損失関数Ｌを計算する。第1の段階では、半正定値の関数ｌを用いて、認識結果ｆ（ｘ_ｉ）と、正解候補集合Yの各要素ｙとの損失ｌ（ｆ（ｘ_ｉ），ｙ）を計算する。第2の段階では、第1の段階で計算された損失を交差行列Hにより重みづけして学習データに渡って足し上げる。結果、以下のように損失関数Lが定義される。

【0057】

【数8】

【0058】

これに対し、本実施形態においては、まず、変換部１１８が認識結果ｆ（ｘ_ｉ）を共役ベクトルｖ_ｉに変換する。共役ベクトルは、正解候補集合Ｙの要素数と同じ次元を持つユークリッド空間における、全ての要素が1であるベクトルに対する直行補空間の凸部分集合Ｃの元である。凸集合Ｃの選択は任意であり、全ての要素が1であるベクトルに対する直行補空間全体にとっても良い。変換部１１８の役割は、任意のベクトル値を取りうる認識結果を凸集合Ｃ上の点と対応付けることにあり、凸集合Ｃ上の点を過不足なく表現できれば変換部１１８の具体的な処理内容は任意である。

【0059】

次に、交差行列積算出部１１９は、変換部１１８から供給される共役ベクトルｖ_ｉと、交差行列記憶部１１７から供給される交差行列Ｈと、弱ラベルデータセット供給部１１１から供給される弱ラベルz_iとから、次の式に基づいての積ｌ_ｉ１を計算する。

【0060】

【数9】

【0061】

次に、正規化項算出部１２０は、変換部１１８から供給される共役ベクトルｖ_ｉと、交差行列記憶部１１７から供給される交差行列Hとから、次の式に基づいて正規化項ｌ_ｉ２を算出する。

【0062】

【数10】

【0063】

ここで、関数Ｆは前記凸集合Ｃ上で定義された凸関数であって、ある実数αが存在して、Ｃの元である任意の共役ベクトルｖに対して次の２つの不等式を満たすものである。

【0064】

【数11】

【0065】

この条件を満たす凸関数Ｆの具体例としては、以下のようなものが挙げられるが、この不等式を満たす限りにおいて凸関数Ｆの選択は以下の具体例に限らず任意である。

【0066】

【数12】

【0067】

総和算出部１２１は、前記積ｌ_ｉ１と前記正規化項ｌ_ｉ２の総和を学習データに渡って足し上げる。結果、以下のように損失関数Lが計算される。

【0068】

【数13】

【0069】

このようにして認識損失算出部１１３によって計算された認識損失は、関数Ｆが前記の条件を満たす限り、正定値性を保つ。その結果、弱ラベルデータセットからでも半正定値の損失関数に基づいた学習を実行することが可能となる。

【0070】

（学習装置による学習処理）
図５は、学習装置１００による学習処理のフローチャートである。まず、交差行列算出部１１６は、上述の方法により、弱ラベルデータセットが備える弱観測確率分布を用いて交差行列Ｈを算出する（ステップＳ１１）。交差行列算出部１１６は算出した交差行列Ｈを交差行列記憶部１１７に出力し、交差行列記憶部１１７は、入力された交差行列Ｈを記憶する。

【0071】

次に、学習装置１００は学習を継続するか否かを判定する（ステップＳ１２）。この判定は、予め決められた終了条件が具備されたか否かに基づいて行われる。終了条件としては、例えば、用意した学習用データを全て使用したか、パラメータの更新回数が所定回数に到達したか、などが挙げられる。

【0072】

学習を継続すると判定した場合（ステップＳ１２：Ｙｅｓ）、弱ラベルデータセット供給部１１１は、入力データの組を認識部１１２と認識損失算出部１１３とに入力する（ステップＳ１３）。認識部１１２は、入力されたデータに基づいて認識処理を行い、認識結果を認識損失算出部１１３に出力する（ステップＳ１４）。

【0073】

次に、認識損失算出部１１３は、入力データと、認識結果と、交差行列とを用いて、前述の方法により認識損失Ｌを算出する（ステップＳ１５）。そして、更新部１１４は、算出された認識損失Ｌが小さくなるように、認識部１１２のパラメータを更新する（ステップＳ１６）。即ち、認識部パラメータ記憶部１１５は更新後のパラメータを記憶し、認識部１１２は学習処理のために認識部パラメータ記憶部１１５に記憶される更新後のパラメータを学習するモデルのために設定する。こうして、学習装置１００は、ステップＳ１２～Ｓ１６を繰り返し、ステップＳ１２で学習を継続しないと判定した場合（ステップＳ１２：Ｎｏ）、処理を終了する。

【0074】

図６は、認識損失算出部１１３の動作を示すフローチャートであり、図５のステップＳ１５での処理をより詳細に示したフローチャートである。
変換部１１８は認識部１１２から供給される認識結果ｆ（ｘ_ｉ）を共役ベクトルｖ_ｉに変換する（ステップＳ１５ａ）。

【0075】

交差行列積算出部１１９は、変換部１１８から供給される共役ベクトルｖ_ｉと、交差行列記憶部１１７から供給される交差行列Ｈと、弱ラベルデータセット供給部１１１から供給される入力データ｛ｘ_ｉ，ｚ_ｉ｝とから、積ｌ_i１を算出する（ステップＳ１５ｂ）。

【0076】

正規化項算出部１２０は、変換部１１８から供給される共役ベクトルｖ_ｉと、交差行列記憶部１１７から供給される交差行列Ｈとから、正規化項ｌ_i２を算出する（ステップＳ１５ｃ）。

【0077】

総和算出部１２１は、交差行列積算出部１１９から供給される積ｌ_i１と正規化項算出部１２０から供給される正規化項ｌ_i２との総和を算出し、損失関数L（認識損失L）として更新部１１４へ供給する（ステップＳ１５ｄ）。

【0078】

［推論装置の実施形態］
次に、学習装置１００により学習した認識部１１２を用いた推論装置の実施形態について説明する。

【0079】

（ハードウェア構成）
図７は、実施形態に係る推論装置のハードウェア構成を示すブロック図である。図示のように、推論装置２００は、インタフェース２０２と、プロセッサ２０３と、メモリ２０４と、記録媒体２０５と、を備える。

【0080】

インタフェース２０２は、外部装置との間でデータの入出力を行う。具体的には、推論装置２００で認識したい画像等の入力データがインタフェース２０２を通じて入力される。

【0081】

プロセッサ２０３は、ＣＰＵ（ＣｅｎｔｒａｌＰｒｏｃｅｓｓｉｎｇＵｎｉｔ）、又はＣＰＵとＧＰＵ（ＧｒａｐｈｉｃｓＰｒｏｃｅｓｓｉｎｇＵｉｔ）などのコンピュータであり、予め用意されたプログラムを実行することにより、推論装置２００の全体を制御する。具体的に、プロセッサ２０３は、後述する推論処理を実行する。

【0082】

メモリ２０４は、ＲＯＭ（ＲｅａｄＯｎｌｙＭｅｍｏｒｙ）、ＲＡＭ（ＲａｎｄｏｍＡｃｃｅｓｓＭｅｍｏｒｙ）などにより構成される。メモリ２０４は、学習装置１００により学習済みの推論部のパラメータを記憶する。また、メモリ２０４は、プロセッサ２０３による各種の処理の実行中に作業メモリとしても使用される。

【0083】

記録媒体２０５は、ディスク状記録媒体、半導体メモリなどの不揮発性で非一時的な記録媒体であり、推論装置２００に対して着脱可能に構成される。記録媒体２０５は、プロセッサ２０３が実行する各種のプログラムや、学習装置１００により額数済みの推論部のパラメータを記録している。ここで、「各種のプログラム」とは、図８、図９を用いて説明する推論装置２００の各機能をコンピュータにより実現するためのコンピュータプログラムを含むプログラムである。推論装置２００が各種の処理を実行する際には、記録媒体２０５に記録されているプログラムやパラメータがメモリ２０４にロードされ、プロセッサ２０３により実行される。

【0084】

なお、上記に加えて、推論装置２００は、ユーザが指示や入力を行うためのキーボード、マウスなどの入力機器や表示部を備えていても良い。

【0085】

（推論装置の機能構成）
図８は推論装置２００の機能構成を表すブロック図である。推論装置２００は、学習装置１００により学習済みの認識部１１２と、変換部１１８と、クラス事後確率算出部２１１と、を備える。なお、認識部１１２と変換部１１８の機能は、学習装置１００における認識部１１２及び変換部１１８と同様であるため、ここでは詳細な説明を省略する。
クラス事後確率算出部２１１は、変換部１１８が算出した共役ベクトルｖを、入力したデータが各クラスに属する確率であるクラス事後確率に変換する。クラスｙに属する事後確率ｐ_ｙを成分に持ち、正解候補集合Yの要素数と同じ次元を持つベクトルｐは、入力データｘに対応する共役ベクトルｖと、学習装置１００が有する正規化項算出部１２０が計算する凸関数Fと、を用いて、次の式に基づいて計算される。

【0086】

【数14】

【0087】

ただし、凸関数Fが微分不可能な場合には、∇は劣勾配を表すものとする。∇が劣勾配である時、クラス事後確率算出部の出力は劣勾配全体か、劣勾配の代表元かのいずれかである。

【0088】

（推論装置による推論処理）
図９は、推論装置２００による推論処理のフローチャートである。まず、認識部１１２は、入力されたデータに基づいて認識処理を行い、認識結果を変換部１１８へ供給する（ステップＳ２１）。次に、変換部１１８は、認識結果を共役ベクトルに変換し、クラス事後確率算出部２１１へ供給する（ステップＳ２２）。そして、クラス事後確率算出部２１１は、共役ベクトルからクラス事後確率を算出しその結果を出力、処理を終了する。

【0089】

図１０は、学習装置１００の最小構成図を示す図である。図１１は、図１０に示す最小構成における学習装置１００の処理フロー図を示す図である。

【0090】

学習装置１００は、認識部１１２（認識手段）と、認識損失算出部１１３（認識損失算出手段）とを備える。認識部１１２は、認識対象データと該認識対象データに付与された弱ラベルとの組の集合である学習用データセット中の前記認識対象データに対する認識結果を出力する（ステップＳ１４）。
認識損失算出部１１３は、前記認識結果、前記学習用データセットに基づいて算出された交差行列、及び、前記弱ラベルを用いて認識損失を算出する（ステップＳ１５）。

【0091】

前記学習用データセットは弱観測確率分布を備えたものであり、前記弱観測確率分布は、前記認識対象データが属する真の正解クラスで条件づけた前記弱ラベルが従う確率分布であって、再構成可能なものである。

【0092】

認識損失算出部１１３は、変換部１１８（変換手段）と、交差行列積算出部１１９（交差行列積算出手段）と、正規化項算出部１２０（正規化項算出手段）と、総和算出部１２１（総和算出手段）と、を備える。

【0093】

変換部１１８は、前記認識結果を共役ベクトルに変換する（ステップＳ１５ａ）。
交差行列積算出部１１９は、前記共役ベクトルと前記交差行列との積を算出する（ステップＳ１５ｂ）。
正規化項算出部１２０は、前記共役ベクトルから正規化項を算出する（ステップＳ１５ｃ）。
総和算出部１２１は、前記積と前記正規化項との和を算出し、前記認識損失として出力する（ステップＳ１５ｄ）。
認識部１１２は、前記認識損失を利用した学習を行う（ステップＳ１６’）。
学習装置１００は、予め決められた終了条件まで繰り返すことにより学習を行うと良い。

【0094】

以上、実施形態及び実施例を参照して本開示を説明したが、本開示は上記実施形態及び実施例に限定されるものではない。本開示の構成や詳細には、本開示の範囲内で当業者が理解し得る様々な変更をすることができる。

【符号の説明】

【0095】

１００学習装置
１１１弱ラベルデータセット供給部
１１２認識部
１１３認識損失算出部
１１４更新部
１１５認識部パラメータ記憶部
１１６交差行列算出部
１１７交差行列記憶部
１１８変換部
１１９交差行列積算出部
１２０正規化項算出部
１２１総和算出部
２００推論装置
２１１クラス事後確率算出部

【図1A】