(19)【発行国】日本国特許庁(JP)
(12)【公報種別】特許公報(B2)
(11)【特許番号】
(24)【登録日】2024-09-09
(45)【発行日】2024-09-18
(54)【発明の名称】情報処理システム、情報処理方法、及び記録媒体
(51)【国際特許分類】
G06N 20/00 20190101AFI20240910BHJP
【FI】
G06N20/00 130
(21)【出願番号】P 2023522008
(86)(22)【出願日】2021-05-17
(86)【国際出願番号】 JP2021018619
(87)【国際公開番号】W WO2022244059
(87)【国際公開日】2022-11-24
【審査請求日】2023-11-07
(73)【特許権者】
【識別番号】000004237
【氏名又は名称】日本電気株式会社
(74)【代理人】
【識別番号】100104765
【氏名又は名称】江上 達夫
(74)【代理人】
【識別番号】100107331
【氏名又は名称】中村 聡延
(74)【代理人】
【識別番号】100131015
【氏名又は名称】三輪 浩誉
(72)【発明者】
【氏名】高本 亮
【審査官】多賀 実
(56)【参考文献】
【文献】米国特許出願公開第2016/0253597(US,A1)
【文献】国際公開第2019/155873(WO,A1)
【文献】YALNIZ, I. Zeki et al.,"Billion-scale semi-supervised learning for image classification",arXiv.org [online],arXiv:1905.00546v1,米国,Cornell University,2019年,[検索日 2021.07.19], インターネット:<URL:https://arxiv.org/pdf/1905.00546v1>
【文献】XIE, Qizhe et al.,"Self-training with Noisy Student improves ImageNet classification",arXiv.org [online],arXiv:1911.04252v4,米国,Cornell University,2020年,[検索日 2021.07.19], インターネット:<URL:https://arxiv.org/pdf/1911.04252v4>
(58)【調査した分野】(Int.Cl.,DB名)
G06N 3/00-99/00
G06T 7/00
(57)【特許請求の範囲】
【請求項1】
ラベルありデータ及びラベルなしデータを入力するデータ入力手段と、
前記ラベルありデータを用いて学習された教師モデルを用いて、前記ラベルなしデータに擬ラベルを付与する擬ラベル付与手段と、
前記ラベルありデータ及び前記ラベルなしデータの少なくとも一方を用いて学習された評価モデルを用いて、前記ラベルなしデータに付与された前記擬ラベルを評価し、所定の評価基準に達している前記擬ラベルを評価擬ラベルとして出力する擬ラベル評価手段と、
前記ラベルありデータ及び前記ラベルなしデータに前記評価擬ラベルを付与した擬ラベルデータを用いて、生徒モデルを学習する生徒モデル学習手段と、
学習済みの前記生徒モデルを出力するモデル出力手段と、
を備える情報処理システム。
【請求項2】
前記データ入力手段に入力される前記ラベルありデータと、前記ラベルなしデータと、を互いに共通するドメインに変換するドメイン変換手段を更に備える請求項1に記載の情報処理システム。
【請求項3】
前記評価モデルは、前記ラベルなしデータのみを用いて学習されている請求項1又は2に記載の情報処理システム。
【請求項4】
前記評価モデルは、一部の前記ラベルありデータを用いて学習した後、前記ラベルなしデータを用いて学習されている請求項1又は2に記載の情報処理システム。
【請求項5】
前記評価モデルは、前記ラベルありデータのみを用いて学習されている請求項1又は2に記載の情報処理システム。
【請求項6】
前記
評価モデルは、前記教師モデルの出力と、前記ラベルありデータに付与されているラベルと、の差を用いて学習されている請求項1又は2に記載の情報処理システム。
【請求項7】
前記擬ラベル評価手段は、別々に学習した複数の前記評価モデルを用いて、前記擬ラベルを評価する請求項1から6のいずれか一項に記載の情報処理システム。
【請求項8】
前記ラベルありデータを用いて前記教師モデルを学習する教師モデル学習手段を更に備え、
前記教師モデル学習手段は、前記擬ラベル評価手段の評価結果を用いて、前記教師モデルを再学習する請求項1から7のいずれか一項に記載の情報処理システム。
【請求項9】
ラベルありデータ及びラベルなしデータを入力し、
前記ラベルありデータを用いて学習された教師モデルを用いて、前記ラベルなしデータに擬ラベルを付与し、
前記ラベルありデータ及び前記ラベルなしデータの少なくとも一方を用いて学習された評価モデルを用いて、前記ラベルなしデータに付与された前記擬ラベルを評価し、所定の評価基準に達している前記擬ラベルを評価擬ラベルとして出力し、
前記ラベルありデータ及び前記ラベルなしデータに前記評価擬ラベルを付与した擬ラベルデータを用いて、生徒モデルを学習し、
学習済みの前記生徒モデルを出力する、
情報処理方法。
【請求項10】
コンピュータに、
ラベルありデータ及びラベルなしデータを入力し、
前記ラベルありデータを用いて学習された教師モデルを用いて、前記ラベルなしデータに擬ラベルを付与し、
前記ラベルありデータ及び前記ラベルなしデータの少なくとも一方を用いて学習された評価モデルを用いて、前記ラベルなしデータに付与された前記擬ラベルを評価し、所定の評価基準に達している前記擬ラベルを評価擬ラベルとして出力し、
前記ラベルありデータ及び前記ラベルなしデータに前記評価擬ラベルを付与した擬ラベルデータを用いて、生徒モデルを学習し、
学習済みの前記生徒モデルを出力する、
情報処理方法を実行させるコンピュータプログラ
ム。
【発明の詳細な説明】
【技術分野】
【0001】
この開示は、情報処理システム、情報処理方法、及び記録媒体の技術分野に関する。
【背景技術】
【0002】
この種のシステムとして、ラベルなしデータに擬似的なラベルを付与するものが知られている。例えば特許文献1では、ラベルが付与されていない画素の特徴ベクトルに対して、正例ラベル又は負例ラベルを付与する技術が開示されている。特許文献2では、距離の近いラベルの割合等を用いたスコアを計算してラベルなしデータに設定することで、擬似的なラベルを付加した学習データを生成する技術が開示されている。
【0003】
その他の関連する技術として、特許文献3では、元ドメインのラベルありデータ及び目標ドメインのラベルなしデータを用いて、元ドメインから目標ドメインへの変換則を学習する技術が開示されている。
【先行技術文献】
【特許文献】
【0004】
【文献】特開2020-047055号公報
【文献】特開2019-159576号公報
【文献】特開2019-101789号公報
【発明の概要】
【発明が解決しようとする課題】
【0005】
この開示は、先行技術文献に開示された技術を改善することを目的とする。
【課題を解決するための手段】
【0006】
この開示の情報処理システムの一の態様は、ラベルありデータ及びラベルなしデータを入力するデータ入力手段と、前記ラベルありデータを用いて学習された教師モデルを用いて、前記ラベルなしデータに擬ラベルを付与する擬ラベル付与手段と、前記ラベルありデータ及び前記ラベルなしデータの少なくとも一方を用いて学習された評価モデルを用いて、前記ラベルなしデータに付与された前記擬ラベルを評価し、所定の評価基準に達している前記擬ラベルを評価擬ラベルとして出力する擬ラベル評価手段と、前記ラベルありデータ及び前記ラベルなしデータに前記評価擬ラベルを付与した擬ラベルデータを用いて、生徒モデルを学習する生徒モデル学習手段と、学習済みの前記生徒モデルを出力するモデル出力手段と、を備える。
【0007】
この開示の情報処理方法の一の態様は、ラベルありデータ及びラベルなしデータを入力し、前記ラベルありデータを用いて学習された教師モデルを用いて、前記ラベルなしデータに擬ラベルを付与し、前記ラベルありデータ及び前記ラベルなしデータの少なくとも一方を用いて学習された評価モデルを用いて、前記ラベルなしデータに付与された前記擬ラベルを評価し、所定の評価基準に達している前記擬ラベルを評価擬ラベルとして出力し、前記ラベルありデータ及び前記ラベルなしデータに前記評価擬ラベルを付与した擬ラベルデータを用いて、生徒モデルを学習し、学習済みの前記生徒モデルを出力する。
【0008】
この開示の記録媒体の一の態様は、コンピュータに、ラベルありデータ及びラベルなしデータを入力し、前記ラベルありデータを用いて学習された教師モデルを用いて、前記ラベルなしデータに擬ラベルを付与し、前記ラベルありデータ及び前記ラベルなしデータの少なくとも一方を用いて学習された評価モデルを用いて、前記ラベルなしデータに付与された前記擬ラベルを評価し、所定の評価基準に達している前記擬ラベルを評価擬ラベルとして出力し、前記ラベルありデータ及び前記ラベルなしデータに前記評価擬ラベルを付与した擬ラベルデータを用いて、生徒モデルを学習し、学習済みの前記生徒モデルを出力する情報処理方法を実行させるコンピュータプログラムが記録されている。
【図面の簡単な説明】
【0009】
【
図1】第1実施形態に係る情報処理システムのハードウェア構成を示すブロック図である。
【
図2】第1実施形態に係る情報処理システムの機能的構成を示すブロック図である。
【
図3】第1実施形態に係る情報処理システムの動作の流れを示すフローチャートである。
【
図4】第2実施形態に係る情報処理システムの機能的構成を示すブロック図である。
【
図5】第2実施形態に係る情報処理システムの動作の流れを示すフローチャートである。
【
図6】第3実施形態に係る情報処理システムにおける評価モデルの学習方法を示すブロック図である。
【
図7】第4実施形態に係る情報処理システムにおける評価モデルの学習方法を示すブロック図である。
【
図8】第5実施形態に係る情報処理システムにおける評価モデルの学習方法を示すブロック図である。
【
図9】第6実施形態に係る情報処理システムにおける評価モデルの学習方法を示すブロック図である。
【
図10】第7実施形態に係る情報処理システムにおけるモデル評価部の構成を示すブロック図である。
【
図11】第8実施形態に係る情報処理システムの機能的構成を示すブロック図である。
【
図12】第8実施形態に係る情報処理システムの動作の流れを示すフローチャートである。
【
図13】第9実施形態に係る情報処理システムの機能的構成を示すブロック図である。
【
図14】第9実施形態に係る情報処理システムの動作の流れを示すフローチャートである。
【発明を実施するための形態】
【0010】
以下、図面を参照しながら、情報処理システム、情報処理方法、及び記録媒体の実施形態について説明する。
【0011】
<第1実施形態>
第1実施形態に係る情報処理システムについて、
図1から
図3を参照して説明する。
【0012】
(ハードウェア構成)
まず、
図1を参照しながら、第1実施形態に係る情報処理システム10のハードウェア構成について説明する。
図1は、第1実施形態に係る情報処理システムのハードウェア構成を示すブロック図である。
【0013】
図1に示すように、第1実施形態に係る情報処理システム10は、プロセッサ11と、RAM(Random Access Memory)12と、ROM(Read Only Memory)13と、記憶装置14とを備えている。情報処理システム10は更に、入力装置15と、出力装置16と、を備えていてもよい。プロセッサ11と、RAM12と、ROM13と、記憶装置14と、入力装置15と、出力装置16とは、データバス17を介して接続されている。
【0014】
プロセッサ11は、コンピュータプログラムを読み込む。例えば、プロセッサ11は、RAM12、ROM13及び記憶装置14のうちの少なくとも一つが記憶しているコンピュータプログラムを読み込むように構成されている。或いは、プロセッサ11は、コンピュータで読み取り可能な記録媒体が記憶しているコンピュータプログラムを、図示しない記録媒体読み取り装置を用いて読み込んでもよい。プロセッサ11は、ネットワークインタフェースを介して、情報処理システム10の外部に配置される不図示の装置からコンピュータプログラムを取得してもよい(つまり、読み込んでもよい)。プロセッサ11は、読み込んだコンピュータプログラムを実行することで、RAM12、記憶装置14、入力装置15及び出力装置16を制御する。本実施形態では特に、プロセッサ11が読み込んだコンピュータプログラムを実行すると、プロセッサ11内には、機械学習に関する処理を実行するための機能ブロックが実現される。
【0015】
プロセッサ11は、例えばCPU(Central Processing Unit)、GPU(Graphics Processing Unit)、FPGA(field-programmable gate array)、DSP(Demand-Side Platform)、ASIC(Application Specific Integrated Circuit)として構成されてよい。プロセッサ11は、これらのうち一つで構成されてもよいし、複数を並列で用いるように構成されてもよい。
【0016】
RAM12は、プロセッサ11が実行するコンピュータプログラムを一時的に記憶する。RAM12は、プロセッサ11がコンピュータプログラムを実行している際にプロセッサ11が一時的に使用するデータを一時的に記憶する。RAM12は、例えば、D-RAM(Dynamic RAM)であってもよい。
【0017】
ROM13は、プロセッサ11が実行するコンピュータプログラムを記憶する。ROM13は、その他に固定的なデータを記憶していてもよい。ROM13は、例えば、P-ROM(Programmable ROM)であってもよい。
【0018】
記憶装置14は、情報処理システム10が長期的に保存するデータを記憶する。記憶装置14は、プロセッサ11の一時記憶装置として動作してもよい。記憶装置14は、例えば、ハードディスク装置、光磁気ディスク装置、SSD(Solid State Drive)及びディスクアレイ装置のうちの少なくとも一つを含んでいてもよい。
【0019】
入力装置15は、情報処理システム10のユーザからの入力指示を受け取る装置である。入力装置15は、例えば、キーボード、マウス及びタッチパネルのうちの少なくとも一つを含んでいてもよい。
【0020】
出力装置16は、情報処理システム10に関する情報を外部に対して出力する装置である。例えば、出力装置16は、情報処理システム10に関する情報を表示可能な表示装置(例えば、ディスプレイ)であってもよい。
【0021】
(機能的構成)
次に、
図2を参照しながら、第1実施形態に係る情報処理システム10の機能的構成について説明する。
図2は、第1実施形態に係る情報処理システムの機能的構成を示すブロック図である。
【0022】
図2に示すように、第1実施形態に係る情報処理システム10は、その機能を実現するための処理ブロックとして、ラベルありデータ入力部110と、ラベルなしデータ入力部120と、教師モデル学習部130と、擬ラベル生成部140と、擬ラベル評価部150と、生徒モデル学習部160と、モデル出力部170と、を備えて構成されている。ラベルありデータ入力部110、ラベルなしデータ入力部120、教師モデル学習部130、擬ラベル生成部140、擬ラベル評価部150、生徒モデル学習部160、及びモデル出力部170の各々は、例えば上述したプロセッサ11(
図1参照)によって実現されてよい。
【0023】
ラベルありデータ入力部110は、ラベルありデータを入力可能に構成されている。ラベルなしデータ入力部120は、ラベルなしデータを入力可能に構成されている。ここでの「ラベル」は、データに対して付与される正解を示す情報(所謂、正解ラベル)であり、「ラベルありデータ」は正解ラベルが付与されたデータ、「ラベルなしデータ」は正解ラベルが付与されていないデータである。ラベルありデータ及びラベルなしデータの一例としては、画像データが挙げられる。画像データは、生体の目領域や顔領域が含まれるものであってよい。画像データは、時系列で連続している複数枚の画像を含むデータ(即ち、所定時間で区切った動画データ)であってもよい。なお、ここでは、ラベルありデータ及びラベルなしデータが別々の入力部から入力される構成を挙げているが、ラベルありデータ及びラベルなしデータは、共通する1つの入力部から入力可能とされてもよい。例えば、ラベルありデータ入力部110及びラベルなしデータ入力部120に代えて、ラベルありデータ及びラベルなしデータの両方を入力可能な1つのデータ入力部が設けられてもよい。
【0024】
教師モデル学習部130は、ラベルありデータ入力部110に入力されたラベルありデータを用いて、教師モデルを学習可能に構成されている。なお、ここでの教師モデルは、ラベルなしデータに付与する擬ラベルを生成するためのモデルである。「擬ラベル」は、擬似的な正解ラベルであり、ラベルありデータで学習されたモデルによって生成される。教師モデルの具体的な学習方法については、既存の技術を適宜採用することができるため、ここでの詳細な説明は省略する。教師モデル(及び後述する各モデル)を学習する際には、例えばConsistency Regularizationを用いて精度向上を図ってもよい。なお、第1実施形態に係る情報処理システム10は、教師モデル学習部130を備えずともよい。この場合、ラベルありデータによる教師モデルの学習はシステム外部で実行され、学習された教師モデルが情報処理システム10に入力されればよい。
【0025】
擬ラベル生成部140は、教師モデル学習部130で学習された教師モデルを用いて、ラベルなしデータに付与する擬ラベルを生成可能に構成されている。また、擬ラベル生成部140は、生成した擬ラベルをラベルなしデータに付与することが可能に構成されている。
【0026】
擬ラベル評価部150は、擬ラベル生成部140で生成された擬ラベルを評価可能に構成されている。具体的には、擬ラベル評価部150は、擬ラベルの所定の評価基準に達しているか否かを評価可能に構成されている。なお、ここでの「所定の評価基準」は、擬ラベルの質が十分に高いか否かを判定するための基準であり、予め設定されている。擬ラベル評価部150は、所定の評価基準に達した擬ラベル(評価擬ラベル)を出力する一方で、所定の評価基準に達しない擬ラベルを出力しないように構成されている。擬ラベル評価部150は、例えばラベルありデータのテストセットでの平均誤差の倍以上の誤差が生じる場合には、その擬ラベルを低品質と評価して、出力しないようにしてもよい。また、擬ラベル評価部150は、ラベルありデータのテストセットでの平均誤差の倍以上の誤差が生じない場合には、その擬ラベルを高品質と評価して、出力するようにしてもよい。
【0027】
擬ラベル評価部150は、ラベルありデータ及びラベルなしデータの少なくとも一方を用いて学習された評価モデルを用いて、擬ラベルの評価を行うように構成されている。なお、評価モデルの学習方法ついては、後述する他の実施形態において詳しく説明する。
【0028】
生徒モデル学習部160は、ラベルありデータと、擬ラベル評価部150から出力された評価擬ラベルを付与したラベルなしデータ(以下、適宜「擬ラベルデータ」と称する)と、を用いて生徒モデルを学習可能に構成されている。なお、ここでの生徒モデルは、教師モデルと同様に、ラベルなしデータに付与する擬ラベルを生成するためのモデルである。生徒モデルの具体的な学習方法については、既存の技術を適宜採用することができるため、ここでの詳細な説明は省略する。生徒モデルを学習する際には、例えば既存の蒸留手法を組み合わせて用いてもよい。
【0029】
モデル出力部170は、学習済みの生徒モデルを出力可能に構成されている。また、モデル出力部170は、学習済みの生徒モデルに加えて、教師モデル、評価モデルを出力可能に構成されてよい。
【0030】
(動作の流れ)
次に、
図3を参照しながら、第1実施形態に係る情報処理システム10の動作の流れについて説明する。
図3は、第1実施形態に係る情報処理システムの動作の流れを示すフローチャートである。
【0031】
図3に示すように、第1実施形態に係る情報処理システム10が動作する際には、まず教師モデル学習部130が、ラベルありデータ入力部110から入力されたラベルありデータを用いて、教師モデルを学習する(ステップS101)。そして、擬ラベル生成部140が、学習済みの教師モデルを用いて擬ラベルを生成し、ラベルなしデータ入力部120から入力されたラベルなしデータに付与する(ステップS102)。
【0032】
続いて、擬ラベル評価部150が評価モデルを学習する(ステップS103)。そして、擬ラベル評価部150は、擬ラベル生成部140で生成された擬ラベルのうち低品質なものを除去する(ステップS104)。言い換えれば、擬ラベル評価部150は、高品質な評価擬ラベルのみを出力する。
【0033】
続いて、生徒モデル学習部160は、ラベルありデータと、評価擬ラベルが付与された擬ラベルデータとを用いて、生徒モデルを学習する(ステップS105)。その後、モデル出力部170が、学習済みのモデルを出力する(ステップS106)。
【0034】
(技術的効果)
次に、第1実施形態に係る情報処理システム10によって得られる技術的効果について説明する。
【0035】
図1から
図3で説明したように、第1実施形態に係る情報処理システム10では、生成した擬ラベルを評価することにより、質の高い擬ラベル(即ち、評価の結果として出力された擬ラベル)を用いた学習が行われる。このようにすれば、ラベルなしデータに適切な擬ラベルを付与することが可能となる。より具体的には、回帰問題を扱う場合において、ラベルなしデータに擬ラベルを精度よく付与することができる。従って、例えばラベルなしデータにラベルを付与するコストを削減することが可能である。
【0036】
<第2実施形態>
第2実施形態に係る情報処理システム10について、
図4及び
図5を参照して説明する。なお、第2実施形態は、上述した第1実施形態と一部の構成及び動作が異なるのみであり、その他の部分については第1実施形態と同一であってよい。このため、以下では、すでに説明した第1実施形態と異なる部分について詳細に説明し、その他の重複する部分については適宜説明を省略するものとする。
【0037】
(機能的構成)
まず、
図4を参照しながら、第2実施形態に係る情報処理システム10の機能的構成について説明する。
図4は、第2実施形態に係る情報処理システムの機能的構成を示すブロック図である。なお、
図4では、
図2で示した構成要素と同様の要素に同一の符号を付している。
【0038】
図4に示すように、第2実施形態に係る情報処理システム10は、その機能を実現するための処理ブロックとして、ラベルありデータ入力部110と、ラベルなしデータ入力部120と、教師モデル学習部130と、擬ラベル生成部140と、擬ラベル評価部150と、生徒モデル学習部160と、モデル出力部170と、ドメイン変換部180と、を備えて構成されている。即ち、第2実施形態に係る情報処理システム10は、第1実施形態の構成(
図2参照)に加えて、ドメイン変換部180を更に備えて構成されている。
【0039】
ドメイン変換部180は、ラベルありデータ入力部110に入力される前のラベルありデータと、ラベルなしデータ入力部120に入力される前のラベルなしデータと、を互いに共通するドメインに変換可能に構成されている。即ち、ドメイン変換部180は、ラベルありデータのドメインと、ラベルなしデータのドメインとを揃える処理を実行可能に構成されている。なお、変換後のドメインは、元々のドメインとは全く異なるドメインであってよい。即ち、ラベルデータ及びラベルなしデータは、それらの元々のドメインとは異なる第3のドメインに変換されてよい。
【0040】
ドメイン変換部180が行う処理は、データが画像データである場合には、画像変換処理であってよい。例えば、ドメイン変換部180は、画像にラプラシアンフィルターを適用する処理を実行して、元々のデータを、画像のエッジを検出したデータに変換するようにしてもよい。また、ドメイン変換部180は、Style Transfer(例えば、AdaIN)によって、ドメインを変換してもよい。或いは、ドメイン変換部180は、illuminationやresolutionの変更によってドメインを変換してもよい。ドメイン変換部180は、データの特徴量を抽出し、その特徴量からKullback-Leibler divergenceを用いて、ドメイン間の距離を計算してもよい。
【0041】
(動作の流れ)
次に、
図5を参照しながら、第2実施形態に係る情報処理システム10の動作の流れについて説明する。
図5は、第2実施形態に係る情報処理システムの動作の流れを示すフローチャートである。なお、
図5では、
図3で示した処理と同様の処理に同一の符号を付している。
【0042】
図5に示すように、第2実施形態に係る情報処理システム10が動作する際には、まずドメイン変換部180が、ラベルありデータと、ラベルなしデータとを、互いに共通するドメインに変換する(ステップS201)。ドメイン変換後のラベルありデータ及びラベルなしデータは、それぞれラベルありデータ入力部110及びラベルなしデータ入力部120に入力される。
【0043】
続いて、教師モデル学習部130が、ラベルありデータ入力部110から入力されたラベルありデータを用いて、教師モデルを学習する(ステップS101)。そして、擬ラベル生成部140が、学習済みの教師モデルを用いて擬ラベルを生成し、ラベルなしデータ入力部120から入力されたラベルなしデータに付与する(ステップS102)。
【0044】
続いて、擬ラベル評価部150が評価モデルを学習する(ステップS103)。そして、擬ラベル評価部150は、擬ラベル生成部140で生成された擬ラベルのうち低品質なものを除去する(ステップS104)。
【0045】
続いて、生徒モデル学習部160は、ドメイン変換前のラベルありデータと、ドメイン変換前のラベルなしデータに評価擬ラベルを付与した擬ラベルデータとを用いて、生徒モデルを学習する(ステップS202)。その後、モデル出力部170が、学習済みのモデルを出力する(ステップS106)。
【0046】
(技術的効果)
次に、第2実施形態に係る情報処理システム10によって得られる技術的効果について説明する。
【0047】
図4及び
図5で説明したように、第2実施形態に係る情報処理システム10では、ラベルありデータと、ラベルなしデータとが、互いに共通するドメインに変換される。このようにすれば、ラベルありデータと、ラベルなしデータとでドメインが異なる場合であっても、適切な学習を行うことが可能となる。具体的には、ドメインの違いによる精度ありデータでの精度劣化を抑えることが可能である。また、ドメインが共通するデータのみを用いる必要がなくなり、例えば学習に利用するデータの数を容易に増やすことが可能となる。
【0048】
<第3実施形態>
第3実施形態に係る情報処理システム10について、
図6を参照して説明する。なお、第3実施形態は、評価モデルを学習する方法の一例を示すものであり、システムの構成や動作等については第1及び第2実施形態と同一であってよい。このため、以下では、すでに説明した各実施形態と異なる部分について詳細に説明し、その他の重複する部分については適宜説明を省略するものとする。
【0049】
(評価モデルの学習方法)
図6を参照しながら、第3実施形態に係る情報処理システム10における評価モデルの学習方法について、具体的に説明する。
図6は、第3実施形態に係る情報処理システムにおける評価モデルの学習方法を示すブロック図である。
【0050】
図6に示すように、第3実施形態に係る情報処理システム10では、擬ラベル評価部150に対して、擬ラベルを付与したラベルなしデータ(具体的には、擬ラベル生成部140で生成された擬ラベルが付与されたラベルなしデータ)が入力される。そして、擬ラベル評価部150は、擬ラベルデータが付与されたラベルなしデータを用いて、評価モデル151を学習する。なお、擬ラベル評価部150は、上述した擬ラベルを付与したラベルなしデータに加えて、擬ラベルそのものを用いて学習を行ってもよい。
【0051】
評価モデルを学習する際、そのエポック数は、過学習を防止するために10未満であることが好ましい。エポック数は、例えば学習に用いられるデータセットやバッチサイズの大きさに基づいて設定されてよい。なお、本願発明者の研究するところによれば、エポック数を1とすることで、多くの場合に適切な学習が行えることが判っている。
【0052】
(技術的効果)
次に、第3実施形態に係る情報処理システム10によって得られる技術的効果について説明する。
【0053】
図6で説明したように、第3実施形態に係る情報処理システム10では、擬ラベルが付与されたラベルなしデータを用いて評価モデル151が学習される。このようにすれば、評価モデル151を適切に学習することができるため、擬ラベルの評価が適切に行えるようになる。
【0054】
<第4実施形態>
第4実施形態に係る情報処理システム10について、
図7を参照して説明する。なお、第4実施形態は、上述した第3実施形態と同様に評価モデルを学習する方法の一例を示すものであり、システムの構成や動作等については第1及び第2実施形態と同一であってよい。このため、以下では、すでに説明した各実施形態と異なる部分について詳細に説明し、その他の重複する部分については適宜説明を省略するものとする。
【0055】
(評価モデルの学習方法)
図7を参照しながら、第4実施形態に係る情報処理システム10における評価モデルの学習方法について、具体的に説明する。
図7は、第4実施形態に係る情報処理システムにおける評価モデルの学習方法を示すブロック図である。
【0056】
図7に示すように、第4実施形態に係る情報処理システム10では、擬ラベル評価部150に対して、ラベルありデータと、擬ラベルを付与したラベルなしデータ(具体的には、擬ラベル生成部140で生成された擬ラベルが付与されたラベルなしデータ)とが入力される。そして、擬ラベル評価部150は、ラベルありデータと、擬ラベルデータが付与されたラベルなしデータを用いて、評価モデル151を学習する。より具体的には、擬ラベル評価部150は、まずラベルありデータを用いて評価モデルを学習する。なお、この学習に用いられるラベルありデータは、比較的少ない数であってよい。その後、擬ラベル評価部150は、擬ラベルが付与されたラベルなしデータを用いて、評価モデル151を学習する。この学習に用いられるラベルなしデータは、比較的多い数であってよい。
【0057】
(技術的効果)
次に、第4実施形態に係る情報処理システム10によって得られる技術的効果について説明する。
【0058】
図7で説明したように、第4実施形態に係る情報処理システム10では、評価モデル151が、まずラベルありデータによって学習され、その後、擬ラベルが付与されたラベルなしデータによって学習される。このように、最初にラベルありデータを用いて学習を行うようにすれば、ラベルありデータを用いない場合(即ち、ラベルなしデータだけで学習を行う場合)と比較して、より適切に評価モデル151を学習することができる。よって、擬ラベルの評価が適切に行えるようになる。
【0059】
<第5実施形態>
第5実施形態に係る情報処理システム10について、
図8を参照して説明する。なお、第5実施形態は、上述した第3及び第4実施形態と同様に評価モデルを学習する方法の一例を示すものであり、システムの構成や動作等については第1及び第2実施形態と同一であってよい。このため、以下では、すでに説明した各実施形態と異なる部分について詳細に説明し、その他の重複する部分については適宜説明を省略するものとする。
【0060】
(評価モデルの学習方法)
図8を参照しながら、第5実施形態に係る情報処理システム10における評価モデルの学習方法について、具体的に説明する。
図8は、第5実施形態に係る情報処理システムにおける評価モデルの学習方法を示すブロック図である。
【0061】
図8に示すように、第5実施形態に係る情報処理システム10では、擬ラベル評価部150に対して、ラベルありデータが入力される。そして、擬ラベル評価部150は、ラベルありデータを用いて評価モデル151を学習する。なお、この学習に用いられるラベルありデータは、比較的多い数であることが好ましい。ラベルありデータを用いて学習する場合、評価モデル151は、教師モデル学習部130(
図2参照)における教師モデルと同様に学習されることになる。よって、この場合には、教師モデルが2つ存在するような構成となる。具体的には、1つの教師モデルによって生成した擬ラベルを、もう1つの教師モデルによって評価するような構成となる。
【0062】
(技術的効果)
次に、第5実施形態に係る情報処理システム10によって得られる技術的効果について説明する。
【0063】
図8で説明したように、第5実施形態に係る情報処理システム10では、評価モデル151が、ラベルありデータによって学習される。このようにすれば、評価モデル151を適切に学習することができるため、擬ラベルの評価が適切に行えるようになる。
【0064】
<第6実施形態>
第6実施形態に係る情報処理システム10について、
図9を参照して説明する。なお、第6実施形態は、上述した第3から第5実施形態と同様に評価モデルを学習する方法の一例を示すものであり、システムの構成や動作等については第1及び第2実施形態と同一であってよい。このため、以下では、すでに説明した各実施形態と異なる部分について詳細に説明し、その他の重複する部分については適宜説明を省略するものとする。
【0065】
(評価モデルの学習方法)
図9を参照しながら、第6実施形態に係る情報処理システム10における評価モデルの学習方法について、具体的に説明する。
図9は、第6実施形態に係る情報処理システムにおける評価モデルの学習方法を示すブロック図である。
【0066】
図9に示すように、第9実施形態に係る情報処理システム10では、擬ラベル評価部150に対して、教師モデルの出力(言い換えれば、ラベルなしデータから教師モデルが推定するラベル)と、ラベルありデータのラベルと、が入力される。そして、擬ラベル評価部150は、まずラベルありデータのみを入力とし、教師モデルの出力と、ラベルありデータのラベルと、の差を算出して評価モデル151を学習する。擬ラベル評価部150は、上述した差の値を品質として擬ラベルを評価する。具体的には、擬ラベル評価部150は、学習済み評価モデル151に擬ラベルデータを入力して、推定(擬)ラベルと真のラベルとの差を推定し、算出した差の値が大きいものについては教師モデルの推定精度が悪いと評価し、算出した差の値が小さいものについては教師モデルの推定精度が良いと評価する。
【0067】
(技術的効果)
次に、第6実施形態に係る情報処理システム10によって得られる技術的効果について説明する。
【0068】
図9で説明したように、第6実施形態に係る情報処理システム10では、評価モデル151が、教師モデルの出力と、ラベルありデータのラベルと、の差を用いて学習される。このようにすれば、評価モデル151を適切に学習することができるため、擬ラベルの評価が適切に行えるようになる。
【0069】
<第7実施形態>
第7実施形態に係る情報処理システム10について、
図10を参照して説明する。なお、第7実施形態は、擬ラベル評価部150の構成例を示すものであり、システムの構成や各種動作等については、上述した第1から第6実施形態と同一であってよい。このため、以下では、すでに説明した各実施形態と異なる部分について詳細に説明し、その他の重複する部分については適宜説明を省略するものとする。
【0070】
(擬ラベル評価部の構成)
まず、
図10を参照しながら、第7実施形態に係る情報処理システム10における擬ラベル評価部150の構成について、具体的に説明する。
図10は、第7実施形態に係る情報処理システムにおけるモデル評価部の構成を示すブロック図である。
【0071】
図10に示すように、第7実施形態に係る情報処理システム10では、擬ラベル評価部150が、複数の評価モデル151を備えて構成されている。なお、ここでは、擬ラベル評価部150が3つの評価モデル151a、151b、151cを備える例を挙げているが、その数が特に限定されるものではない。例えば、擬ラベル評価部150は、2つの評価モデル151を備えていてもよいし、4つ以上の評価モデル151を備えていてもよい。
【0072】
複数の評価モデル151は、それぞれ別々に学習されたモデルである。ただし、複数の評価モデル151は、共通するデータセットを用いて学習されたものであってもよいし、互いに異なるデータセットを用いて学習されたものであってもよい。なお、複数の評価モデル151は、それぞれ摂動が付与されたデータを用いて学習を行ってよい。データに摂動を付与する方法は特に限定されないが、例えばピクセルをずらしたり、ぼやかしたり、一部を切り取ったりする方法が挙げられる。
【0073】
また、複数の評価モデル151は、上述した第3から第6実施形態で説明した学習方法によって学習されていてよい。この場合、複数の評価モデル151の各々は、互いに異なる学習方法で学習されてよい。例えば、評価モデル151aが第3実施形態で説明した学習方法(即ち、ラベルなしデータを用いて学習する方法:
図6参照)で学習され、評価モデル151bが第4実施形態で説明した学習方法(即ち、ラベルありデータ及びラベルなしデータを用いて学習する方法:
図7参照)で学習され、評価モデル151cが第5実施形態で説明した学習方法(即ち、ラベルありデータを用いて学習する方法:
図8参照)で学習されてもよい。
【0074】
擬ラベル評価部150は、上述した複数の評価モデル151を用いて、擬ラベルを評価する。具体的には、擬ラベル評価部150は、まず複数の評価モデル151の各々から評価結果を出力させ、それら複数の評価結果に応じて、1つの最終的な評価結果を出力する。より具体的には、複数の評価モデル151の各々の評価結果の多数決をとったり、平均値を算出したりして、総合的な評価結果を出力するようにすればよい。
【0075】
(技術的効果)
次に、第7実施形態に係る情報処理システム10によって得られる技術的効果について説明する。
【0076】
図13で説明したように、第7実施形態に係る情報処理システム10では、複数の評価モデル151を用いて擬ラベルの評価が行われる。このようにすれば、1つの評価モデルだけで評価する場合と比較して、より適切に擬ラベルの評価が行えるようになる。
【0077】
<第8実施形態>
第8実施形態に係る情報処理システム10について、
図11及び
図12を参照して説明する。なお、第8実施形態は、上述した第1から第7実施形態と比べて一部の構成及び動作が異なるのみであり、その他の部分については第1から第7実施形態と同一であってよい。このため、以下では、すでに説明した各実施形態と異なる部分について詳細に説明し、その他の重複する部分については適宜説明を省略するものとする。
【0078】
(機能的構成)
まず、
図11を参照しながら、第8実施形態に係る情報処理システム10の機能的構成について説明する。
図11は、第8実施形態に係る情報処理システムの機能的構成を示すブロック図である。なお、
図11では、
図2で示した構成要素と同様の要素に同一の符号を付している。
【0079】
図11に示すように、第8実施形態に係る情報処理システム10は、その機能を実現するための処理ブロックとして、ラベルありデータ入力部110と、ラベルなしデータ入力部120と、教師モデル学習部130と、擬ラベル生成部140と、擬ラベル評価部150と、生徒モデル学習部160と、モデル出力部170と、を備えて構成されている。そして第8実施形態では特に、上述した構成要素のうち、ラベルありデータ入力部110、ラベルなしデータ入力部120、教師モデル学習部130、擬ラベル生成部140、及び擬ラベル評価部150が、擬ラベル学習部200として構成されている。
【0080】
擬ラベル学習部200は、教師モデル学習部130による教師モデルの学習と、擬ラベル生成部140による擬ラベルの生成と、擬ラベル評価部150による擬ラベル評価と、を繰り返し実行することによって、擬ラベルに関する学習をより適切に実行可能に構成されている。なお、擬ラベル学習部200は、擬ラベル評価部150における評価結果を反映して、教師モデルの学習を実行可能に構成されている。例えば、擬ラベル評価部150で算出した誤差を、教師モデル学習部130に逆伝播させることにより、教師モデルを再学習可能に構成されている。なお、擬ラベル学習部200は、所定の回数に到達するまで一連の処理を繰り返すように設定されている。所定の回数は、事前のシミュレーション等によって求められた値であってよい。
【0081】
(動作の流れ)
次に、
図12を参照しながら、第8実施形態に係る情報処理システム10の動作の流れについて説明する。
図12は、第8実施形態に係る情報処理システムの動作の流れを示すフローチャートである。なお、
図12では、
図3で示した処理と同様の処理に同一の符号を付している。
【0082】
図12に示すように、第8実施形態に係る情報処理システム10が動作する際には、まず教師モデル学習部130が、ラベルありデータ入力部110から入力されたラベルありデータを用いて、教師モデルを学習する(ステップS101)。そして、擬ラベル生成部140が、学習済みの教師モデルを用いて擬ラベルを生成し、ラベルなしデータ入力部120から入力されたラベルなしデータに付与する(ステップS102)。
【0083】
続いて、擬ラベル評価部150が評価モデルを学習する(ステップS103)。そして、擬ラベル評価部150は、擬ラベル生成部140で生成された擬ラベルのうち低品質なものを除去する(ステップS104)。
【0084】
ここで、第8実施形態に係る情報処理システム10は、ここまでの一連の処理が所定回数繰り返されているか否かを判定する(ステップS701)。そして、一連の処理が所定回数繰り返されていないと判定された場合(ステップS701:NO)、擬ラベル評価部150の評価結果を反映して(ステップS702)、再びステップS101から処理が実行される。
【0085】
他方、一連の処理が所定回数繰り返されたと判定された場合(ステップS701:YES)、最終的な評価擬ラベルが出力され、生徒モデル学習部160が、ラベルありデータと、評価擬ラベルが付与された擬ラベルデータとを用いて、生徒モデルを学習する(ステップS105)。その後、モデル出力部170が、学習済みのモデルを出力する(ステップS106)。
【0086】
(技術的効果)
次に、第8実施形態に係る情報処理システム10によって得られる技術的効果について説明する。
【0087】
図11及び
図12で説明したように、第8実施形態に係る情報処理システム10では、擬ラベル学習部200において、擬ラベルに関する学習(具体的には、教師モデルの学習、擬ラベルの生成、及び擬ラベルの評価)が繰り返し実行される。このようにすれば、各モデルがより適切な状態になるよう学習されるため、より適切な擬ラベル(即ち、評価擬ラベル)を出力することが可能となる。
【0088】
<第9実施形態>
第9実施形態に係る情報処理システム10について、
図13及び
図14を参照して説明する。なお、第9実施形態に係る情報処理システム10は、上述した第1から第8実施形態と比べて一部の構成及び動作が異なるのみであり、その他の部分については第1から第8実施形態と同一であってよい。このため、以下では、すでに説明した各実施形態と異なる部分について詳細に説明し、その他の重複する部分については適宜説明を省略するものとする。
【0089】
(機能的構成)
まず、
図13を参照しながら、第9実施形態に係る情報処理システム10の機能的構成について説明する。
図13は、第9実施形態に係る情報処理システムの機能的構成を示すブロック図である。なお、
図13では、
図2で示した構成要素と同様の要素に同一の符号を付している。
【0090】
図13に示すように、第9実施形態に係る情報処理システム10は、その機能を実現するための処理ブロックとして、ラベルありデータ入力部110と、ラベルなしデータ入力部120と、教師モデル学習部130と、擬ラベル生成部140と、擬ラベル評価部150と、生徒モデル学習部160と、モデル出力部170と、モデル調整部190と、を備えて構成されている。即ち、第9実施形態に係る情報処理システム10は、第1実施形態の構成(
図2参照)に加えて、モデル調整部190を更に備えて構成されている。
【0091】
モデル調整部190は、学習済みのモデルの一部の層を、ラベルありデータを用いて調整可能に構成されている。具体的には、モデル調整部190は、学習済みモデルに対してFine Tuningを実行可能に構成されている。
【0092】
(動作の流れ)
次に、
図14を参照しながら、第9実施形態に係る情報処理システム10の動作の流れについて説明する。
図14は、第9実施形態に係る情報処理システムの動作の流れを示すフローチャートである。なお、
図14では、
図3で示した処理と同様の処理に同一の符号を付している。
【0093】
図14に示すように、第9実施形態に係る情報処理システム10が動作する際には、まず教師モデル学習部130が、ラベルありデータ入力部110から入力されたラベルありデータを用いて、教師モデルを学習する(ステップS101)。そして、擬ラベル生成部140が、学習済みの教師モデルを用いて擬ラベルを生成し、ラベルなしデータ入力部120から入力されたラベルなしデータに付与する(ステップS102)。
【0094】
続いて、擬ラベル評価部150が評価モデルを学習する(ステップS103)。そして、擬ラベル評価部150は、擬ラベル生成部140で生成された擬ラベルのうち低品質なものを除去する(ステップS104)。
【0095】
続いて、生徒モデル学習部160は、ラベルありデータと、評価擬ラベルが付与された擬ラベルデータとを用いて、生徒モデルを学習する(ステップS105)。そして第9実施形態では特に、モデル調整部190が、ラベルありデータを用いて学習済みのモデルの調整を行う(ステップS801)。その後、モデル出力部170が、調整された学習済みのモデルを出力する(ステップS106)。
【0096】
(技術的効果)
次に、第9実施形態に係る情報処理システム10によって得られる技術的効果について説明する。
【0097】
図13及び
図14で説明したように、第9実施形態に係る情報処理システム10では、学習済みのモデルを出力する前にモデルの調整が行われる。このようにすれば、出力される学習済みのモデルを、より適切なものにすることが可能である。
【0098】
上述した各実施形態の機能を実現するように該実施形態の構成を動作させるプログラムを記録媒体に記録させ、該記録媒体に記録されたプログラムをコードとして読み出し、コンピュータにおいて実行する処理方法も各実施形態の範疇に含まれる。すなわち、コンピュータ読取可能な記録媒体も各実施形態の範囲に含まれる。また、上述のプログラムが記録された記録媒体はもちろん、そのプログラム自体も各実施形態に含まれる。
【0099】
記録媒体としては例えばフロッピー(登録商標)ディスク、ハードディスク、光ディスク、光磁気ディスク、CD-ROM、磁気テープ、不揮発性メモリカード、ROMを用いることができる。また該記録媒体に記録されたプログラム単体で処理を実行しているものに限らず、他のソフトウェア、拡張ボードの機能と共同して、OS上で動作して処理を実行するものも各実施形態の範疇に含まれる。
【0100】
この開示は、請求の範囲及び明細書全体から読み取ることのできる発明の要旨又は思想に反しない範囲で適宜変更可能であり、そのような変更を伴う情報処理システム、情報処理方法、及び記録媒体もまたこの開示の技術思想に含まれる。
【0101】
<付記>
以上説明した実施形態に関して、更に以下の付記のようにも記載されうるが、以下には限られない。
【0102】
(付記1)
付記1に記載の情報処理システムは、ラベルありデータ及びラベルなしデータを入力するデータ入力手段と、前記ラベルありデータを用いて学習された教師モデルを用いて、前記ラベルなしデータに擬ラベルを付与する擬ラベル付与手段と、前記ラベルありデータ及び前記ラベルなしデータの少なくとも一方を用いて学習された評価モデルを用いて、前記ラベルなしデータに付与された前記擬ラベルを評価し、所定の評価基準に達している前記擬ラベルを評価擬ラベルとして出力する擬ラベル評価手段と、前記ラベルありデータ及び前記ラベルなしデータに前記評価擬ラベルを付与した擬ラベルデータを用いて、生徒モデルを学習する生徒モデル学習手段と、学習済みの前記生徒モデルを出力するモデル出力手段と、を備える情報処理システムである。
【0103】
(付記2)
付記2に記載の情報処理システムは、前記データ入力手段に入力される前記ラベルありデータと、前記ラベルなしデータと、を互いに共通するドメインに変換するドメイン変換手段を更に備える付記1に記載の情報処理システムである。
【0104】
(付記3)
付記3に記載の情報処理システムは、前記評価モデルは、前記ラベルなしデータのみを用いて学習されている付記1又は2に記載の情報処理システムである。
【0105】
(付記4)
付記4に記載の情報処理システムは、前記評価モデルは、一部の前記ラベルありデータを用いて学習した後、前記ラベルなしデータを用いて学習されている付記1又は2に記載の情報処理システムである。
【0106】
(付記5)
付記5に記載の情報処理システムは、前記評価モデルは、前記ラベルありデータのみを用いて学習されている付記1又は2に記載の情報処理システムである。
【0107】
(付記6)
付記6に記載の情報処理システムは、前記擬ラベル評価手段は、前記教師モデルの出力と、前記ラベルありデータに付与されているラベルと、の差を用いて学習されている付記1又は2に記載の情報処理システムである。
【0108】
(付記7)
付記7に記載の情報処理システムは、前記擬ラベル評価手段は、別々に学習した複数の前記評価モデルを用いて、前記擬ラベルを評価する付記1から6のいずれか一項に記載の情報処理システムである。
【0109】
(付記8)
付記8に記載の情報処理システムは、前記ラベルありデータを用いて前記教師モデルを学習する教師モデル学習手段を更に備え、前記教師モデル学習手段は、前記擬ラベル評価手段の評価結果を用いて、前記教師モデルを再学習する付記1から7のいずれか一項に記載の情報処理システムである。
【0110】
(付記9)
付記9に記載の情報処理システムは、学習済みの前記生徒モデルの一部の層を、前記ラベルありデータを用いて学習する調整手段を更に備える付記1から8のいずれか一項に記載の情報処理システムである。
【0111】
(付記10)
付記10に記載の情報処理方法は、ラベルありデータ及びラベルなしデータを入力し、前記ラベルありデータを用いて学習された教師モデルを用いて、前記ラベルなしデータに擬ラベルを付与し、前記ラベルありデータ及び前記ラベルなしデータの少なくとも一方を用いて学習された評価モデルを用いて、前記ラベルなしデータに付与された前記擬ラベルを評価し、所定の評価基準に達している前記擬ラベルを評価擬ラベルとして出力し、前記ラベルありデータ及び前記ラベルなしデータに前記評価擬ラベルを付与した擬ラベルデータを用いて、生徒モデルを学習し、学習済みの前記生徒モデルを出力する、情報処理方法である。
【0112】
(付記11)
付記11に記載の記録媒体は、コンピュータに、ラベルありデータ及びラベルなしデータを入力し、前記ラベルありデータを用いて学習された教師モデルを用いて、前記ラベルなしデータに擬ラベルを付与し、前記ラベルありデータ及び前記ラベルなしデータの少なくとも一方を用いて学習された評価モデルを用いて、前記ラベルなしデータに付与された前記擬ラベルを評価し、所定の評価基準に達している前記擬ラベルを評価擬ラベルとして出力し、前記ラベルありデータ及び前記ラベルなしデータに前記評価擬ラベルを付与した擬ラベルデータを用いて、生徒モデルを学習し、学習済みの前記生徒モデルを出力する、情報処理方法を実行させるコンピュータプログラムが記録された記録媒体である。
【0113】
(付記12)
付記12に記載のコンピュータプログラムは、コンピュータに、ラベルありデータ及びラベルなしデータを入力し、前記ラベルありデータを用いて学習された教師モデルを用いて、前記ラベルなしデータに擬ラベルを付与し、前記ラベルありデータ及び前記ラベルなしデータの少なくとも一方を用いて学習された評価モデルを用いて、前記ラベルなしデータに付与された前記擬ラベルを評価し、所定の評価基準に達している前記擬ラベルを評価擬ラベルとして出力し、前記ラベルありデータ及び前記ラベルなしデータに前記評価擬ラベルを付与した擬ラベルデータを用いて、生徒モデルを学習し、学習済みの前記生徒モデルを出力する、情報処理方法を実行させるコンピュータプログラムである。
【符号の説明】
【0114】
10 情報処理システム
11 プロセッサ
110 ラベルありデータ入力部
120 ラベルなしデータ入力部
130 教師モデル学習部
140 擬ラベル生成部
150 擬ラベル評価部
151 評価モデル
160 生徒モデル学習部
170 モデル出力部
180 ドメイン変換部
190 モデル調整部
200 擬ラベル学習部