(19)【発行国】日本国特許庁(JP)
(12)【公報種別】特許公報(B2)
(11)【特許番号】
(24)【登録日】2023-07-26
(45)【発行日】2023-08-03
(54)【発明の名称】ラベル収集装置、ラベル収集方法及びラベル収集プログラム
(51)【国際特許分類】
G06N 20/00 20190101AFI20230727BHJP
【FI】
G06N20/00 130
(21)【出願番号】P 2020502890
(86)(22)【出願日】2019-02-04
(86)【国際出願番号】 JP2019003818
(87)【国際公開番号】W WO2019167556
(87)【国際公開日】2019-09-06
【審査請求日】2021-12-15
(31)【優先権主張番号】P 2018033655
(32)【優先日】2018-02-27
(33)【優先権主張国・地域又は機関】JP
(73)【特許権者】
【識別番号】504174135
【氏名又は名称】国立大学法人九州工業大学
(74)【代理人】
【識別番号】100149548
【氏名又は名称】松沼 泰史
(74)【代理人】
【識別番号】100188592
【氏名又は名称】山口 洋
(74)【代理人】
【識別番号】100189348
【氏名又は名称】古都 智
(72)【発明者】
【氏名】井上 創造
【審査官】渡辺 順哉
(56)【参考文献】
【文献】特開2018-106662(JP,A)
【文献】特開2018-013857(JP,A)
【文献】特開2015-230570(JP,A)
【文献】井上創造 ほか,介護施設における介護スタッフの行動センシング実験,情報処理学会 研究報告,日本,情報処理学会,2017年05月18日,2017-CDS-19,第13号,pp.1-8,ISSN 2188-8604,特にpp.2-4
(58)【調査した分野】(Int.Cl.,DB名)
G06N 3/00-99/00
(57)【特許請求の範囲】
【請求項1】
機械学習に用いられる第1の教師データの第1の教師ラベルを取得する取得部と、
取得された第1の教師ラベルとサンプルとを含む第1の教師データに基づいて第1のモデルの機械学習を実行する学習処理部と、
前記第1のモデルの精度を検出する精度検出部と、
前記精度を提示する提示処理部と、
前記サンプルに対する行動ラベルとして正しい第2の教師ラベルを含む第2の教師データと第1の教師データとの類似度が所定の類似度閾値以下である場合に警告を出力する警告処理部と
を備え、
前記取得部は、更新された第1の教師データを取得する、
ラベル収集装置。
【請求項2】
前記学習処理部は、前記サンプルに対する行動ラベルとして正しくない第3の教師ラベルを含む第3の教師データと、前記第2の教師ラベルを含む第2の教師データとに基づいて、第2のモデルの機械学習を実行し、
前記警告処理部は、第1の教師データに対する前記第2のモデルの精度が所定の精度閾値以下である場合に警告を出力する、
請求項
1に記載のラベル収集装置。
【請求項3】
前記サンプルは、センサデータであり、
前記第1の教師ラベルは、人の行動を表すラベルである、
請求項
1又は請求項
2に記載のラベル収集装置。
【請求項4】
ラベル収集装置が実行するラベル収集方法であって、
機械学習に用いられる第1の教師データの第1の教師ラベルを取得するステップと、
取得された第1の教師ラベルとサンプルとを含む第1の教師データに基づいて第1のモデルの機械学習を実行するステップと、
前記第1のモデルの精度を検出するステップと、
前記精度を提示するステップと、
前記サンプルとの関連が低くない第2の教師ラベルを含む第2の教師データと第1の教師データとの類似度が所定の類似度閾値以下である場合に警告を出力するステップと
更新された第1の教師データを取得するステップと
を含むラベル収集方法。
【請求項5】
コンピュータに、
機械学習に用いられる第1の教師データの第1の教師ラベルを取得する手順と、
取得された第1の教師ラベルとサンプルとを含む第1の教師データに基づいて第1のモデルの機械学習を実行する手順と、
前記第1のモデルの精度を検出する手順と、
前記精度を提示する手順と、
前記サンプルとの関連が低くない第2の教師ラベルを含む第2の教師データと第1の教師データとの類似度が所定の類似度閾値以下である場合に警告を出力する手順と
更新された第1の教師データを取得する手順と
を実行させるためのラベル収集プログラム。
【発明の詳細な説明】
【技術分野】
【0001】
本発明は、ラベル収集装置、ラベル収集方法及びラベル収集プログラムに関する。
本願は、2018年2月27日に、日本に出願された特願2018-033655号に基づき優先権を主張し、その内容をここに援用する。
【背景技術】
【0002】
機械学習の一分野である教師あり機械学習は、センサデータ等に基づいて人の行動を認識するために実行されることがある(非特許文献1参照)。教師あり機械学習のフェーズには、学習(訓練)フェーズと、判定(評価)フェーズとがある。
【先行技術文献】
【非特許文献】
【0003】
【文献】Nattaya Mairittha (Fah), Sozo Inoue, "Exploring the Challenges of Gamification in Mobile Activity Recognition", SOFT九州支部学術講演会, pp.47-50, 2017-12-02, Kagoshima.
【発明の概要】
【発明が解決しようとする課題】
【0004】
学習フェーズでは、センサデータ等であるサンプルに教師ラベルが付与されること(Annotations)によって、教師データが作成される。教師データを作成する作業は、手間と時間が必要であるため、作成者への負担が大きい。このため、作成者は、ヒューマンエラー、集中力又はインセンティブ等の理由で、サンプルとは関連が低い教師ラベルをサンプルに付与してしまう場合がある。この場合、サンプルに基づいて人の行動を認識する機械学習の精度は、低下してしまう。
【0005】
機械学習の精度を低下させないためには、機械学習の精度を向上させる教師データの教師ラベルを収集する必要がある。しかしながら、従来のラベル収集装置は、機械学習の精度を向上させる教師データの教師ラベルを収集することができない場合があった。
【0006】
上記事情に鑑み、本発明は、機械学習の精度を向上させる教師データの教師ラベルを収集することを可能とするラベル収集装置、ラベル収集方法及びラベル収集プログラムを提供することを目的としている。
【課題を解決するための手段】
【0007】
本発明の一態様は、機械学習に用いられる教師データの教師ラベルを取得する取得部と、取得された前記教師ラベルを含む前記教師データに基づいてモデルの機械学習を実行する学習処理部と、前記モデルの精度を検出する精度検出部と、前記精度を提示する提示処理部とを備え、前記取得部は、更新された前記教師データを取得する、ラベル収集装置である。
【0008】
本発明の一態様は、機械学習に用いられる第1の教師データの第1の教師ラベルを取得する取得部と、取得された第1の教師ラベルとサンプルとを含む第1の教師データに基づいて第1のモデルの機械学習を実行する学習処理部と、前記第1のモデルの精度を検出する精度検出部と、前記精度を提示する提示処理部と、前記サンプルに対する行動ラベルとして正しい第2の教師ラベルを含む第2の教師データと第1の教師データとの類似度が所定の類似度閾値以下である場合に警告を出力する警告処理部とを備え、前記取得部は、更新された第1の教師データを取得する、ラベル収集装置である。
【0009】
本発明の一態様は、上記のラベル収集装置であって、前記学習処理部は、前記サンプルに対する行動ラベルとして正しくない第3の教師ラベルを含む第3の教師データと、前記第2の教師ラベルを含む第2の教師データとに基づいて、第2のモデルの機械学習を実行し、前記警告処理部は、第1の教師データに対する前記第2のモデルの精度が所定の精度閾値以下である場合に警告を出力する。
【0010】
本発明の一態様は、上記のラベル収集装置であって、前記サンプルは、センサデータであり、前記第1の教師ラベルは、人の行動を表すラベルである。
【0011】
本発明の一態様は、機械学習に用いられる第1の教師データの第1の教師ラベルを取得するステップと、取得された第1の教師ラベルとサンプルとを含む第1の教師データに基づいて第1のモデルの機械学習を実行するステップと、前記第1のモデルの精度を検出するステップと、前記精度を提示するステップと、前記サンプルとの関連が低くない第2の教師ラベルを含む第2の教師データと第1の教師データとの類似度が所定の類似度閾値以下である場合に警告を出力するステップと更新された第1の教師データを取得するステップとを含むラベル収集方法である。
【0012】
本発明の一態様は、コンピュータに、機械学習に用いられる第1の教師データの第1の教師ラベルを取得する手順と、取得された第1の教師ラベルとサンプルとを含む第1の教師データに基づいて第1のモデルの機械学習を実行する手順と、前記第1のモデルの精度を検出する手順と、前記精度を提示する手順と、前記サンプルとの関連が低くない第2の教師ラベルを含む第2の教師データと第1の教師データとの類似度が所定の類似度閾値以下である場合に警告を出力する手順と更新された第1の教師データを取得する手順とを実行させるためのラベル収集プログラムである。
【発明の効果】
【0013】
本発明により、機械学習の精度を向上させる教師データの教師ラベルを収集することが可能である。
【図面の簡単な説明】
【0014】
【
図1】第1実施形態における、ラベル収集装置の構成の例を示す図である。
【
図2】第1実施形態における、作成者による教師データの作成処理とラベル収集装置の動作との例を示すフローチャートである。
【
図3】第2実施形態における、ラベル収集装置の構成の例を示す図である。
【
図4】第2実施形態における、ラベル収集装置の動作の例を示すフローチャートである。
【
図5】第3実施形態における、ラベル収集装置の構成の例を示す図である。
【
図6】第3実施形態における、判定モデルの学習例を示すフローチャートである。
【
図7】第3実施形態における、判定モデルの精度の判定例を示すフローチャートである。
【発明を実施するための形態】
【0015】
本発明の実施形態について、図面を参照して詳細に説明する。
【0016】
(第1実施形態)
図1は、ラベル収集装置1aの構成の例を示す図である。ラベル収集装置1aは、機械学習に用いられる教師データの教師ラベルを収集する情報処理装置であり、例えば、パーソナルコンピュータ、スマートフォン端末、タブレット端末等である。教師ラベルは、サンプルに対する行動ラベルであり、例えば人の行動を表すラベルである。
【0017】
ラベル収集装置1aは、サンプルxの集合Xを入力データとして記憶している。以下では、集合のサンプルの数(要素数)は1以上である。サンプルxは、センサデータであり、例えば、画像データ、音声データ、加速度データ、温度データ、照度データである。画像データは、例えば、病室に取り付けられたカメラによって看護師が撮影されている動画像又は静止画像のデータである。画像のデータは、画像に含まれている文字の認識結果を含んでもよい。音声データは、例えば、勤務中の看護師が身につけているマイクによって収音された音声のデータである。加速度データは、例えば、勤務中の看護師が身につけている加速度センサによって検出された加速度のデータである。
【0018】
1人以上の作成者は、サンプルの集合Xを構成するサンプルxiに教師ラベル(分類クラス)を付与することによって、機械学習に用いられる教師データdi(=(サンプルxi,教師ラベルyi))を作成する。diの添字iは、教師データに含まれているサンプルのインデックスを表す。
【0019】
作成者は、ラベル収集装置1aから提示されたサンプルxを確認し、サンプルxに付与する教師ラベルyを決定する。例えば、作成者は、非系列データである静止画像データに、「犬」「猫」のような教師ラベルを付与することができる。例えば、作成者は、患者に投薬している看護師の姿が撮影されている静止画像データであるサンプルxに、教師ラベル「投薬」を付与することができる。作成者は、系列データである音声データに、[開始時刻,終了時刻,分類クラス]等の組形式の教師ラベルを付与することができる。作成者は、ラベル収集装置1aを操作することによって、サンプルxに付与される教師ラベルをラベル収集装置1aに記録する。
【0020】
以下では、サンプルxは、一例として非系列データである。教師ラベルの集合Yは、一例として{y1,…,yn}の形式で表記される。
【0021】
ラベル収集装置1aは、バス2と、入力装置3と、インタフェース4と、表示装置5と、記憶装置6と、メモリ7と、演算処理部8aとを備える。
【0022】
バス2は、ラベル収集装置1aの各機能部の間におけるデータを転送する。
入力装置3は、キーボード、ポインティングデバイス(マウス、タブレット等)、ボタン、タッチパネル等の既存の入力装置を用いて構成される。入力装置3は、教師データの作成者によって操作される。
【0023】
入力装置3は、無線通信装置でもよい。入力装置3は、例えば、センサによって生成された画像データ及び音声データ等のサンプルxを、無線通信によってインタフェース4に入力してもよい。
【0024】
インタフェース4は、例えば、LSI(Large Scale Integration)やASIC(Application Specific Integrated Circuit)等のハードウェアを用いて実現される。インタフェース4は、入力装置3から入力されたサンプルxを、記憶装置6に記録する。インタフェース4は、サンプルxを演算処理部8aに出力してもよい。インタフェース4は、入力装置3から入力された教師ラベルyを、演算処理部8aに出力する。
【0025】
表示装置5は、CRT(Cathode Ray Tube)ディスプレイ、液晶ディスプレイ、有機EL(Electro Luminescence)ディスプレイ等の画像表示装置である。表示装置5は、インタフェース4から取得された画像データを表示する。インタフェース4から取得される画像データは、例えば、サンプルxの画像データ、教師ラベルを表す文字列の画像データ、機械学習の推定モデルの精度を表す数値データである。
【0026】
記憶装置6は、フラッシュメモリ、ハードディスクドライブ等の不揮発性の記録媒体(非一時的な記録媒体)である。記憶装置6は、プログラムを記憶する。プログラムは、例えば、クラウドサービスとしてラベル収集装置1aに提供される。プログラムは、サーバ装置から配信されるアプリケーションとして、ラベル収集装置1aに提供されてもよい。
【0027】
記憶装置6は、入力装置3によってインタフェース4に入力された1以上のサンプルxを記憶する。記憶装置6は、入力装置3によってインタフェース4に入力された1以上の教師ラベルyを、サンプルxに対応付けて記憶する。記憶装置6は、サンプルxと教師ラベルyとが対応付けられたデータである1以上の教師データdを記憶する。
【0028】
メモリ7は、RAM(Random Access Memory)等の揮発性の記録媒体である。メモリ7は、記憶装置6から展開されたプログラムを記憶する。メモリ7は、演算処理部8aによって生成された各種データを一時的に記憶する。
【0029】
演算処理部8aは、CPU(Central Processing Unit)等のプロセッサを用いて構成される。演算処理部8aは、記憶装置6からメモリ7に展開されたプログラムを実行することによって、取得部80と、学習処理部81と、精度検出部82と、提示処理部83として機能する。
【0030】
取得部80は、入力装置3によってインタフェース4に入力された教師ラベルyiを取得する。取得部80は、表示装置5に表示されているサンプルxiに教師ラベルyiを対応付けることによって、教師データdi(=(xi,yi))を生成する。取得部80は、生成された教師データdiを記憶装置6に記録する。
【0031】
取得部80は、教師データdiの集合D(=(サンプルxiの集合X,教師ラベルyiの集合Y))を、教師データのデータセットとして記憶装置6から取得する。なお、取得部80は、他の作成者によって作成された教師データdjの集合Dを、過去の教師データのデータセットとして更に取得してもよい。djの添字jは、教師データのサンプルのインデックスを表す。
【0032】
学習処理部81は、取得部80によって取得された教師データdiの集合Dに基づいて、推定モデルMの機械学習を実行する。学習処理部81は、過去の教師データに基づいて推定モデルMの機械学習を実行してもよい。
【0033】
精度検出部82は、推定モデルMの精度を検出する。推定モデルMの精度は、確率で表現可能な値であり、例えば、推定モデルMの正解率、適合率又は再現率である。精度検出部82は、推定モデルMの精度を検出する代わりに、推定モデルMの出力変数の誤差を検出してもよい。
【0034】
提示処理部83は、推定モデルMの精度を表す数値の画像を生成する。提示処理部83は、教師データに含まれている各サンプルを表す画像を生成してもよい。提示処理部83は、教師データに含まれている各教師ラベルを表す文字列等の画像を生成してもよい。提示処理部83は、生成された画像を表示装置5に出力する。
【0035】
次に、動作例を説明する。
図2は、作成者による教師データの作成処理とラベル収集装置1aの動作との例を示すフローチャートである。
【0036】
作成者は、サンプルxiに教師ラベルyiを付与することによって、教師データdiの集合Dをラベル収集装置1aに入力する(ステップS101)。
【0037】
取得部80は、教師データdiの集合Dを取得する(ステップS201)。学習処理部81は、教師データdiの集合Dに基づいて、推定モデルMの機械学習を実行する(ステップS202)。精度検出部82は、推定モデルMの精度を検出する(ステップS203)。提示処理部83は、推定モデルMの精度を表すを数値の画像等を、表示装置5に表示させる(ステップS204)。
【0038】
提示処理部83は、ステップS204の処理を、例えばセンサが画像データ等を生成中にリアルタイムで実行する。提示処理部83は、ステップS204の処理を、センサが画像データ等を生成した日の後日における所定時刻に実行してもよい。
【0039】
作成者は、追加の教師データの集合を作成する(ステップS102)。作成者は、推定モデルMの精度が第1の精度閾値を超えるように新規に取得された教師データD+を学習処理部に入力するため、ステップS101の処理を再び行う。
【0040】
以上のように、第1実施形態のラベル収集装置1aは、取得部80と、学習処理部81と、精度検出部82と、提示処理部83とを備える。取得部80は、機械学習に用いられる教師データdの教師ラベルyを取得する。学習処理部81は、取得された教師ラベルyとサンプルxiとを含む教師データdiに基づいて推定モデルMの機械学習を実行する。精度検出部82は、推定モデルMの精度を検出する。提示処理部83は、推定モデルMの精度を表示装置5に表示させることによって、推定モデルMの精度を作業者に提示する。取得部80は、更新された教師データdi+を取得する。
【0041】
これによって、ラベル収集装置1aは、機械学習の精度を向上させる教師データの教師ラベルを収集することが可能である。更新された教師データの質は向上しているので、センサデータに基づいて行動を認識する教師あり機械学習の精度は向上する。ラベル収集装置1aは、推定モデルMの精度を表示装置5に表示させ,作成者が教師データの質を向上させる動機づけをするというゲーミフィケーション(Gamification)を実行することが可能である。
【0042】
行動認識結果を業務履歴として記録する装置は、推定モデルMの出力変数をリアルタイムで記録することができる。行動認識結果を可視化する装置は、推定モデルMの出力変数をリアルタイムで可視化することができる。ユーザは、記録された行動認識結果に基づいて業務履歴を確認することができる。ユーザは、業務履歴に基づいて業務改善を行うことができる。
【0043】
(第2実施形態)
第2実施形態では、サンプルに対する行動ラベルとして正しくない(サンプルとの関連が低い)教師ラベルを作成者がサンプルに付与するという不正行為(cheating)の有無をラベル収集装置が判定する点が、第1実施形態と相違する。第2実施形態では第1実施形態との相違点について説明する。
【0044】
作成者は、教師データを作成する際に、サンプルとの関連が低い教師ラベルを作成者がサンプルに付与するという不正行為を行う可能性がある。例えば、作成者は、座って書類を作成している看護師の姿が撮影されている静止画像データであるサンプルに、教師ラベル「書類作成」ではなく、教師ラベル「投薬」を付与することができる。
【0045】
第2実施形態のラベル収集装置は、第1の作成者によって作成された第1教師データと、不正行為を行っていない1人以上の第2の作成者によって作成された第2教師データとの類似度に基づいて、第1の作成者が第1教師データを作成した際の不正行為の有無を判定する。
【0046】
図3は、ラベル収集装置1bの構成の例を示す図である。ラベル収集装置1bは、バス2と、入力装置3と、インタフェース4と、表示装置5と、記憶装置6と、メモリ7と、演算処理部8bとを備える。演算処理部8bは、記憶装置6からメモリ7に展開されたプログラムを実行することによって、取得部80と、学習処理部81と、精度検出部82と、提示処理部83と、特徴量処理部84と、集合データ生成部85と、警告処理部86として機能する。
【0047】
取得部80は、第1サンプルxiの集合Xを、記憶装置6から取得する。取得部80は、第1の作成者によって第1サンプルxiに付与された第1教師ラベルyiの集合Yを、記憶装置6から取得する。
【0048】
取得部80は、第2サンプルの集合X’を、記憶装置6から取得する。取得部80は、不正行為を行っていない1人以上の第2の作成者によって第2サンプルxj’に付与された第2教師ラベルyj’の集合Y’を、記憶装置6から取得する。第2教師ラベルyj’は、サンプルに対する行動ラベルとして正しい教師ラベル(以下「正当ラベル」という。)である。サンプルとの関連が低い教師ラベルであるか否かは、例えば、所定の基準に基づいて予め定められる。
【0049】
特徴量処理部84は、第1サンプルxiの集合Xの統計量に基づく特徴量(以下「第1特徴量」という。)を算出する。第1特徴量は、例えば、第1サンプルxiが画像データである場合、第1サンプルxiの画像特徴量である。
【0050】
特徴量処理部84は、第2サンプルxj’の集合X’の統計量に基づく特徴量(以下「第2特徴量」という。)を算出する。第2特徴量は、例えば、第2サンプルxj’が画像データである場合、第2サンプルxj’の画像特徴量である。
【0051】
集合データ生成部85は、第1サンプルxiの集合Xと第1教師ラベルyiの集合Yとを結合することによって、第1教師データdiの集合D(={(x1,y1),…})を生成する。集合データ生成部85は、第2サンプルxjの集合X’と第2教師ラベルyjの集合Y’とを結合することによって、第2教師データdjの集合D’(={(x1’,y1’),…})を生成する。
【0052】
警告処理部86は、第1教師データの集合Dと第2教師データの集合D’との類似度Gi(i=1,2,…)を、例えば第1特徴量V及び第2特徴量V’に基づいて、閾値法又は異常検出法によって算出する。なお、これらの方法は一例である。
【0053】
(閾値法)
警告処理部86は、例えば第1教師データdiから第2教師データdj(j=1,2,…)までの各距離の平均値hを、類似度Giとして算出する。距離とは、第1特徴量V及び第1教師データを組にしたベクトルと、第2特徴量V’及び第2教師データを組にしたベクトルとの間の距離である。各距離の平均値hが閾値以上である場合、類似度Giは1である。各距離の平均値hが閾値未満である場合、類似度Giは0である。
【0054】
(異常検出法)
警告処理部86は、第2教師データdj(j=1,2,…)に対する第1教師データdiの異常度の逆数(正常度)を、類似度Giとして算出してもよい。異常度は、第1教師データdi及び第2教師データdjの間の距離、すなわち、第1教師データから得られる第1特徴量Vと第2教師データから得られる第2特徴量V’との差分の絶対値でもよい。又は、異常度は、第1データから得られる第1特徴量Vと第2教師データから得られる第2特徴量V’とのユークリッド距離でもよい。異常度には、上限が設けられてもよい。
【0055】
警告処理部86は、類似度Gi(i=1,2,…)の平均値Hを算出する。警告処理部86は、類似度Giの平均値Hが類似度閾値を超えているか否かを判定する。類似度閾値は、類似度Giが1又は0である場合、例えば0.5である。
【0056】
提示処理部83は、類似度Giの平均値Hを表示装置5に出力する。提示処理部83は、類似度Giの平均値Hが類似度閾値以下であると判定された場合、第1教師データdiの作成に関して不正行為が行われた可能性が高い旨の警告を、表示装置5に出力する。
【0057】
次に、ラベル収集装置1bの動作の例を説明する。
図4は、ラベル収集装置1bの動作の例を示すフローチャートである。取得部80は、第1サンプルx
iの集合Xと、第1教師ラベルy
iの集合Yとを取得する(ステップS301)。取得部80は、第2サンプルの集合X’と、第2教師ラベルy
j’の集合Y’とを取得する(ステップS302)。
【0058】
特徴量処理部84は、第1サンプルxiの集合Xに基づいて、第1特徴量Vを算出する(ステップS303)。特徴量処理部84は、第2サンプルxj’の集合X’に基づいて、第2特徴量V’を算出する(ステップS304)。
【0059】
集合データ生成部85は、第1教師データdiの集合Dを生成する(ステップS305)。集合データ生成部85は、第2教師データdjの集合D’を生成する(ステップS306)。
【0060】
警告処理部86は、第1特徴量及び第1教師データを組みにしたベクトルの集合と、第2特徴量及び第2教師データを組みにしたベクトルの集合との類似度Giの平均値Hを算出する(ステップS307)。提示処理部83は、類似度Giの平均値Hを表示装置5に出力する(ステップS308)。
【0061】
警告処理部86は、類似度G
iの平均値Hが類似度閾値を超えているか否かを判定する(ステップS309)。類似度G
iの平均値Hが類似度閾値を超えていると判定された場合(ステップS309:YES)、ラベル収集装置1bは、
図4に示されたフローチャートの処理を終了する。類似度G
iの平均値Hが類似度閾値以下であると判定された場合(ステップS309:NO)、提示処理部83は、警告を表示装置5に出力する(ステップS310)。
【0062】
以上のように、第2実施形態のラベル収集装置1bは、取得部80と、学習処理部81と、精度検出部82と、提示処理部83と、警告処理部86とを備える。取得部80は、機械学習に用いられる第1の教師データdiの第1の教師ラベルyiを取得する。学習処理部81は、取得された第1の教師ラベルyiとサンプルxiとを含む第1の教師データdiに基づいて、推定モデルMの機械学習を実行する。精度検出部82は、推定モデルMの精度を検出する。提示処理部83は、推定モデルMの精度を表示装置5に表示させることによって、推定モデルMの精度を作業者に提示する。警告処理部86は、サンプルとの関連が低くない第2の教師ラベル(正当ラベル)を含む第2の教師データdjと第1の教師データdiとの類似度が所定の類似度閾値以下である場合に警告を出力する。さらに、取得部80は、更新された第1の教師データdiを取得する。
【0063】
これによって、第2実施形態のラベル収集装置1bは、作成者によって作成された教師データの集合と他の作成者によって作成された教師データの集合との類似度を、ユーザに提示することを可能とする。また、ラベル収集装置1bは、第2の教師データdjと第1の教師データdiとの類似度が所定の類似度閾値以下である場合に、警告を出力することが可能である。
【0064】
(第3実施形態)
第3実施形態では、機械学習が実行された判定モデルを用いて不正行為の有無をラベル収集装置が判定する点が、第2実施形態と相違する。第3実施形態では第2実施形態との相違点について説明する。
【0065】
図5は、ラベル収集装置1cの構成の例を示す図である。ラベル収集装置1cは、バス2と、入力装置3と、インタフェース4と、表示装置5と、記憶装置6と、メモリ7と、演算処理部8cとを備える。演算処理部8bは、記憶装置6からメモリ7に展開されたプログラムを実行することによって、取得部80と、学習処理部81と、精度検出部82と、提示処理部83と、特徴量処理部84と、集合データ生成部85と、警告処理部86と、ラベル処理部87と、学習データ生成部88と、不正判定学習処理部89として機能する。
【0066】
取得部80は、第1サンプルxiの集合Xと、第1の作成者によって第1サンプルxiに付与された第1教師ラベルyiの集合Yとを取得する。取得部80は、第2サンプルの集合X’と、不正行為を行っていない1人以上の第2の作成者によって第2サンプルxj’に付与された第2教師ラベルyj’の集合Y’とを取得する。取得部80は、第3サンプルの集合X’’と、意図的に不正行為を行った1人以上の第3の作成者によって第3サンプルxk’’に付与された第3教師ラベルyk’’の集合Y’’とを取得する。xk’’の添字kは、第3サンプルのインデックスを表す。
【0067】
集合データ生成部85は、第1サンプルxiの集合Xと第1教師ラベルyiの集合Yとを結合することによって、第1教師データdiの集合D(={(x1,y1),…})を生成する。集合データ生成部85は、第2サンプルxjの集合X’と第2教師ラベルyjの集合Y’とを結合することによって、第2教師データdjの集合D’(={(x1’,y1’),…})を生成する。集合データ生成部85は、第3サンプルxkの集合X’’と第3教師ラベルykの集合Y’’とを結合することによって、第3教師データdkの集合D’’(={(x1’’,y1’’),…})を生成する。
【0068】
ラベル処理部87は、正当ラベルを第2教師データの集合D’に含める。例えば、ラベル処理部87は、第2教師データdj’の構成(第2サンプルxj’,第2教師ラベルyj’)を、(第2サンプルxj’,第2教師ラベルyj’,正当ラベルrj’)という構成に更新する。
【0069】
ラベル処理部87は、サンプルに対する行動ラベルとして正しくない教師ラベル(以下「不正ラベル」という。)を、第3教師データの集合D’’に含める。例えば、ラベル処理部87は、第3教師データdk’’の構成(第3サンプルxk’’,第3教師ラベルyk’’)を、(第3サンプルxk’’,第3教師ラベルyk’’,不正ラベルrk’’)という構成に更新する。
【0070】
学習データ生成部88は、第2教師データの集合D’と第3教師データの集合D’’とに基づいて、判定モデルFの機械学習に用いられるデータである学習データを生成する。判定モデルFは、機械学習のモデルであり、不正行為の有無を判定するために用いられるモデルである。
【0071】
学習フェーズにおいて、不正判定学習処理部89は、生成された学習データを判定モデルFの入力変数及び出力変数とすることによって、判定モデルFの機械学習を実行する。不正判定学習処理部89は、機械学習が実行された判定モデルFを、記憶装置6に記録する。
【0072】
学習フェーズよりも後の判定フェーズにおいて、不正判定学習処理部89は、第1教師データdiを判定モデルFの入力変数として、判定モデルFの出力Pi(=F(di))を、第1教師データの集合Dについて検出する。正当ラベル及び不正ラベルが2値で表現されている場合、正当ラベルであることを表す出力Piは0であり、不当ラベルであることを表す出力変数Piは1である。なお、出力Piは、0から1までの確率で表現されてもよい。
【0073】
判定フェーズにおいて、警告処理部86は、出力Pi(i=1,2,…)の平均値を、判定モデルFの精度の平均値H’として算出する。警告処理部86は、判定モデルFの精度の平均値H’が第2の精度閾値を超えているか否かを判定する。第2の精度閾値は、出力Piが1又は0である場合、例えば0.5である。判定モデルFの精度は、確率で表現可能な値であり、例えば、判定モデルFの正解率、適合率又は再現率である。
【0074】
提示処理部83は、判定モデルFの精度の平均値H’を表示装置5に出力する。提示処理部83は、判定モデルFの精度の平均値H’が第2の精度閾値以下であると判定された場合、警告を表示装置5に出力する。
【0075】
次に、ラベル収集装置1cの動作の例を説明する。
図6は、判定モデルFの学習例(学習フェーズ)を示すフローチャートである。取得部80は、第1サンプルx
iの集合Xと第1教師ラベルy
iの集合Yとを取得する(ステップS401)。取得部80は、第2サンプルの集合X’と第2教師ラベルy
j’の集合Y’とを取得する(ステップS402)。取得部80は、第3サンプルの集合X’’と第3教師ラベルy
k’’の集合Y’’とを取得する(ステップS403)。
【0076】
集合データ生成部85は、第1教師データdiの集合Dを生成する(ステップS404)。集合データ生成部85は、第2教師データdjの集合D’を生成する(ステップS405)。集合データ生成部85は、第3教師データdkの集合D’’を生成する(ステップS406)。
【0077】
ラベル処理部87は、正当ラベルを第2教師データの集合D’に含める(ステップS407)。ラベル処理部87は、不正ラベルを第3教師データの集合D’’に含める(ステップS408)。
【0078】
学習データ生成部88は、第2教師データの集合D’と第3教師データの集合D’’とに基づいて、学習データを生成する(ステップS409)。不正判定学習処理部89は、判定モデルFの機械学習を実行する(ステップS410)。不正判定学習処理部89は、機械学習が実行された判定モデルFを、記憶装置6に記録する(ステップS411)。
【0079】
図7は、判定モデルFの精度の判定例(判定フェーズ)を示すフローチャートである。不正判定学習処理部89は、第1サンプルの集合Xを、入力変数として判定モデルFに入力する(ステップS501)。警告処理部86は、出力P
iの平均値(判定モデルFの出力)を、判定モデルFの精度の平均値H’として算出する(ステップS502)。提示処理部83は、判定モデルFの精度の平均値H’を表示装置5に出力する(ステップS503)。
【0080】
警告処理部86は、判定モデルFの精度の平均値H’が第2の精度閾値を超えているか否かを判定する(ステップS504)。判定モデルFの精度の平均値H’が第2の精度閾値を超えていると判定された場合(ステップS504:YES)、ラベル収集装置1cは、
図7に示されたフローチャートの処理を終了する。判定モデルFの精度の平均値H’が第2の精度閾値以下であると判定された場合(ステップS504:NO)、提示処理部83は、警告を表示装置5に出力する(ステップS505)。
【0081】
以上のように、第3実施形態のラベル収集装置1cは、学習処理部81と、警告処理部86とを備える。学習処理部81は、サンプルとの関連が低い第3の教師ラベル(不正ラベル)を含む第3の教師データdkと第2の教師データdjとに基づいて、判定モデルFの機械学習を実行する。警告処理部86は、第1の教師データdiに対する判定モデルFの精度が所定の第2の精度閾値以下である場合に警告を出力する。
【0082】
これによって、第3実施形態のラベル収集装置1cは、作成者が教師データを作成した際の不正行為の有無を、判定モデルFを用いて作成者ごとに判定することができる。ラベル収集装置1cは、1個の第1サンプルxiと1個の教師ラベルyiとから第1教師データdiが構成されている場合、1個の第1サンプルxiが不正行為によって作成されたサンプルであるか否かを判定することができる。
【0083】
以上、この発明の実施形態について図面を参照して詳述してきたが、具体的な構成はこの実施形態に限られるものではなく、この発明の要旨を逸脱しない範囲の設計等も含まれる。
【産業上の利用可能性】
【0084】
本発明は、教師データの教師ラベルを収集する情報処理装置に適用可能である。
【符号の説明】
【0085】
1a,1b,1c…ラベル収集装置、2…バス、3…入力装置、4…インタフェース、5…表示装置、6…記憶装置、7…メモリ、8a,8b,8c…演算処理部、80…取得部、81…学習処理部、82…精度検出部、83…提示処理部、84…特徴量処理部、85…集合データ生成部、86…警告処理部、87…ラベル処理部、88…学習データ生成部、89…不正判定学習処理部