IP Force 特許公報掲載プロジェクト 2022.1.31 β版

知財求人 - 知財ポータルサイト「IP Force」

▶ 日立オートモティブシステムズ株式会社の特許一覧

<>
  • 特開-学習データ管理システム 図1
  • 特開-学習データ管理システム 図2
  • 特開-学習データ管理システム 図3
  • 特開-学習データ管理システム 図4
  • 特開-学習データ管理システム 図5
  • 特開-学習データ管理システム 図6
  • 特開-学習データ管理システム 図7
  • 特開-学習データ管理システム 図8
  • 特開-学習データ管理システム 図9
  • 特開-学習データ管理システム 図10
  • 特開-学習データ管理システム 図11
< >
(19)【発行国】日本国特許庁(JP)
(12)【公報種別】公開特許公報(A)
(11)【公開番号】P2024097129
(43)【公開日】2024-07-18
(54)【発明の名称】学習データ管理システム
(51)【国際特許分類】
   G06N 20/00 20190101AFI20240710BHJP
【FI】
G06N20/00 130
【審査請求】未請求
【請求項の数】6
【出願形態】OL
(21)【出願番号】P 2023000382
(22)【出願日】2023-01-05
(71)【出願人】
【識別番号】509186579
【氏名又は名称】日立Astemo株式会社
(74)【代理人】
【識別番号】110002572
【氏名又は名称】弁理士法人平木国際特許事務所
(72)【発明者】
【氏名】露木 雅文
(72)【発明者】
【氏名】銭 智定
(57)【要約】
【課題】既存の学習データに含まれる概念ドリフトによる正解ラベルの誤りを除外したうえで、ラベルノイズによる正解ラベルの誤りのみを選択的に検知し、訂正可能にする。
【解決手段】本発明に係る学習データ管理システムは、ラベルの付与対象であるテストデータを管理するテストデータ管理部と、ラベルを選定するための分類モデルを選択する分類モデル選択部と、分類モデルが選定するラベルを訂正する必要性を示す確信度を算出する分類部と、確信度が所定値を超えるとき、該ラベルの訂正候補を推薦する訂正候補算出部と、を備える。
【選択図】図1
【特許請求の範囲】
【請求項1】
ラベルの付与対象であるテストデータを管理するテストデータ管理部と、
前記ラベルを選定するための分類モデルを選択する分類モデル選択部と、
前記分類モデルが選定する前記ラベルを訂正する必要性を示す確信度を算出する分類部と、
前記確信度が所定値を超えるとき、該ラベルの訂正候補を推薦する訂正候補算出部と、を備える、
ことを特徴とする学習データ管理システム。
【請求項2】
請求項1に記載の学習データ管理システムであって、
前記テストデータを生じさせたイベントに関する情報を管理するイベント情報管理部をさらに備え、
前記分類モデル選択部は、前記イベントの発生日時に基づいて前記分類モデルを選択する、
ことを特徴とする学習データ管理システム。
【請求項3】
請求項2に記載の学習データ管理システムであって、
前記イベント情報管理部は、前記イベントの種類ごとに該イベントに影響する前記ラベルの種類を管理し、
前記分類モデル選択部は、影響のあるイベントの発生後における学習データで再学習した分類モデルを選択する、
ことを特徴とする学習データ管理システム。
【請求項4】
請求項2に記載の学習データ管理システムであって、
あるイベントの発生時刻の前後において複数のテストデータに同一の前記ラベルが付与されているとき、該イベントの種類が該ラベルに影響しないと判定して該イベントをフィードバック対象から除外するイベント選択部をさらに備える、
ことを特徴とする学習データ管理システム。
【請求項5】
請求項4に記載の学習データ管理システムであって、
前記イベント選択部は、特徴量の変化点に基づき前記イベントの発生時刻を推定する、学習データ管理システム。
【請求項6】
請求項1に記載の学習データ管理システムであって、
前記訂正候補算出部は、前記ラベルを付与したラベル付与者とは異なる人物に訂正を推薦する、
ことを特徴とする学習データ管理システム。

【発明の詳細な説明】
【技術分野】
【0001】
本発明は、工業製品等に生じた不具合に対してラベルを付与する際に用いる学習データを管理するシステムに関する。
【背景技術】
【0002】
自然言語で記載された文書を読み取り、その文書に記載されている問い合わせ内容を分類するタスクはコールセンタや顧客サポートの業務において頻出するタスクである。日々、大量の文書の分類が依頼される場合は、この分類タスクを人手で行うと時間がかかってしまう。このような作業を省力化する方法の一つに、機械学習の一種である教師あり学習によって文書分類モデルを構築し、分類タスクを自動的に解く方法が挙げられる。
【0003】
具体的には例えば次のように行う。まず多数の目的変数と説明変数の対からなる学習データを作成する。分類タスクにおいてこの目的変数は正解ラベルとも呼ばれる。前述の文書分類作業においては、学習データの正解ラベルは例えば「要望」や「保証申請」のような文書に記載されている内容を示したカテゴリが挙げられる。また、説明変数は例えば「操作方法をわかりやすくしてほしい」や「開封時に破損していたので交換をお願いします」のような文書に記載されたテキストや、文書の記載時刻や記載者などの補足情報が挙げられる。次に、学習データを機械処理しやすい形式とするため、正解ラベルをスカラー値として符号化し、説明変数を多次元の特徴ベクトルとして符号化した上で、サポートベクトルマシンやランダムフォレストなどの機械学習アルゴリズムに入力し、説明変数から予測したラベルを出力する分類モデルのパラメータを最適化する学習処理を行う。
【0004】
教師あり学習によって得られる分類モデルを、正しく分類を行えるような精度の高い分類モデルとするためには、学習データの正確性が重要である。例えば、「操作方法をわかりやすくしてほしい」という説明変数に対して「要望」という正解ラベルが正しいにもかかわらず、誤って「保証申請」という正解ラベルが設定された学習データがあるとする。このような誤った学習データを用いて学習した分類モデルは、例えば新たに「操作の仕方をわかりやすくしてほしい」という説明変数を入力としたときに「保証申請」という誤った予測ラベルを出力するような分類精度が低いモデルとなってしまう。
【0005】
このような誤った学習データが作成される原因は大別して2つある。
【0006】
1つ目の原因はラベルノイズである。ラベルノイズとは、学習データの説明変数を読みとって正解ラベルを付与するラベル付与者の知識不足や勘違い等によって、誤った正解ラベルが付与される現象を指す。
【0007】
2つ目の原因は概念ドリフト(Concept Drift)である。概念ドリフトとは、説明変数に対して付与されるべき正解ラベルの規則(概念)が変化することによって、学習データの作成時点では正しい正解ラベルであっても一定の時間経過後には誤りとみなされるようになる現象を指す。例えば、「開封時に破損していたので交換をお願いします」の値を持つ説明変数に対して当初は「要望」という正解ラベルを付与することが正しく、そのような学習データが作成されていたとする。その後、「保証申請」という新しいラベルが追加され、「開封時に破損していたので交換をお願いします」のような説明変数に対しては「保証申請」の正解ラベルをつけるとする新しい規則がラベル付与者に周知されたとする。すると、この新しい規則ができる前に「開封時に破損していたので交換をお願いします」の説明変数に対して「要望」という正解ラベルが付与されていた学習データは、当時の規則に基づけば正しい学習データであったが、新しい規則に基づけば誤りとみなされるようになる。
【0008】
ラベルノイズの問題に対して非特許文献1では、ラベル付与者が取り違えやすいラベルの対を推定したうえで、そのようなラベル対のうち分類モデルが高い確信度で正解ラベルとは異なったラベルを予測したデータについては、正解ラベルを予測ラベルで置き換えることで誤りを訂正する方法が開示されている。また、特許文献1では画像データのラベルについて信頼度を管理し、信頼度が低いデータにはラベル見直しを推薦する方法が開示されている。
【先行技術文献】
【特許文献】
【0009】
【特許文献1】特開2019-101560号公報
【非特許文献】
【0010】
【非特許文献1】C.Northcutt,et.al,“Confident Learning:Estimating Uncertainty in Dataset Labels,”J.Artif.Int.Res.,vol.70,pp.1373-1411,May 2021.
【発明の概要】
【発明が解決しようとする課題】
【0011】
しかし、非特許文献1に開示の方法では、過去の学習データから古い規則を学習した分類モデルでラベルノイズの有無を判定するため、概念ドリフトが発生した後の新しい規則にもとづいて付与された正解ラベルを、古い規則による誤った正解ラベルに訂正してしまう課題がある。また、特許文献1に開示の方法では、正解ラベルの信頼度としてラベル付与に要した作業時間や作業中の居眠り有無のようなラベル付与時に計測しなければわからない情報を用いるため、既存の学習データや第三者が作成する学習データについてラベルノイズを検知することができない課題がある。
【0012】
本発明は上記課題を鑑みてなされたものであり、既存の学習データに含まれる概念ドリフトの影響を除外し、ラベルノイズのみを選択的に検知し、ラベルの訂正を可能にする学習データ管理システムを提供することを目的とする。
【課題を解決するための手段】
【0013】
上記課題を解決するために、本発明に係る学習データ管理システムは、ラベルの付与対象であるテストデータを管理するテストデータ管理部と、ラベルを選定するための分類モデルを選択する分類モデル選択部と、分類モデルが選定するラベルを訂正する必要性を示す確信度を算出する分類部と、確信度が所定値を超えるとき、該ラベルの訂正候補を推薦する訂正候補算出部と、を備える。
【発明の効果】
【0014】
本発明によれば、既存の学習データに含まれる概念ドリフトの影響を除外し、ラベルノイズのみを選択的に検知し、ラベルの訂正を可能にすることが可能になる。
本発明に関連する更なる特徴は、本明細書の記述、添付図面から明らかになるものである。また、上記した以外の課題、構成及び効果は、以下の実施例の説明により明らかにされる。
【図面の簡単な説明】
【0015】
図1】本発明の一実施例に係る学習データ管理サーバのハードウェア構成例を示す図。
図2】本発明の一実施例に係る学習データ管理システムの構成例を示す図。
図3】本発明の一実施例に係る学習データ情報の構成例を示す図。
図4】本発明の一実施例に係る分類モデル情報の構成例を示す図。
図5】本発明の一実施例に係るテストデータ情報の構成例を示す図。
図6】本発明の一実施例に係る分類結果情報の構成例を示す図。
図7】本発明の一実施例に係るイベント情報の構成例を示す図。
図8】本発明の一実施例に係る関連イベント情報の構成例を示す図。
図9】本発明の一実施例に係る訂正候補情報の構成例を示す図。
図10】本発明の一実施例に係る学習データ管理サーバが実行する処理を示すフローチャート。
図11】本発明の一実施例に係る訂正推薦画面の構成例を示す図。
【発明を実施するための形態】
【0016】
以下に本発明の具体的な実施例について図面を参照して説明する。
【0017】
(ハードウェア構成)
図1は学習データ管理サーバ100のハードウェア構成の一例を示す構成図である。
【0018】
図1に示すように学習データ管理サーバ100は、記憶装置401、プログラム402、演算装置403及び通信装置405を有し、各部がバスを介して相互に接続されている。
【0019】
記憶装置401は、SSD(Solid State Drive)及びハードディスクドライブのような不揮発性記憶素子で構成される。記憶装置401は、演算装置403の動作を規定するプログラム402と、演算装置403にて使用又は生成される種々の情報111、113、121、124、131、133、142とを記憶する。メモリ404は、RAM(Random Access Memory)のような揮発性記憶素子で構成される。
【0020】
演算装置403は、CPU(Central Processing Unit)のようなプロセッサで構成される。演算装置403は、記憶装置401に記憶されているプログラム402をメモリ404に読み出して実行し、図2に示す各機能部による処理を実現する。通信装置405は、ネットワーク406を介して表示部200のような外部装置と通信する。なお、以下では学習データ管理サーバ100のことを単にサーバ100と呼称する。
【0021】
(システム構成)
図2は本発明の一実施例に係る学習データ管理システムの構成例を示す図である。図2に示す学習データ管理システムは学習データ管理サーバ100と表示部200を有する。学習データ管理サーバ100は学習データ管理システムの利用者によって使用される表示部200と通信可能に接続される。
【0022】
学習データ管理サーバ100はその記憶部内に格納された情報として学習データ情報111と、分類モデル情報113と、テストデータ情報121と、分類結果情報124と、イベント情報131と、関連イベント情報133と、訂正候補情報142と、を備える。また、これらの情報を用いた演算を行う機能部として学習部112と、分類モデル選択部122と、分類部123と、イベント選択部132と、訂正候補算出部141と、を備える。
【0023】
サーバ100は全体として以下に説明するような処理を実行する。まず学習部112は学習データ情報111を読み出し、所定の学習方法にもとづいて分類モデルを学習し、学習結果として得られた分類モデルをファイルに保存する。そのうえで、分類モデル情報113として保存したファイルのパスと学習期間を格納する。このとき、学習方法はランダムフォレストやサポートベクトルマシンなど任意の公知の方法を用いてよい。また、学習期間は、分類モデルの学習に用いた学習データに正解ラベルを付与した日付の範囲か、あるいは前記日付のリストとして計算してよい。
【0024】
一方イベント選択部132はテストデータ情報121から判定対象のテストデータを読み出し、当該テストデータに付与されている正解ラベルに関連するイベントのみを抽出し、当該イベントのIDと発生日を関連イベント情報133として記憶部に格納する。このとき、前記イベントはラベル付与規則を記したマニュアル更新や、説明変数が商品の情報を記載したテキストである場合は商品の部品を製造するベンダ変更や新商品の発売など、当該分野の専門家の知識にもとづいて説明変数と正解ラベルの対応付けに関係する可能性がある任意のイベントを指定して良い。
【0025】
また、イベント情報131に前記イベントに関連する正解ラベルが指定されていない場合は、前記イベントの発生日の前後において説明変数が類似した複数の学習データおよびテストデータに同一の正解ラベルが付与されているとき、当該イベントが前記正解ラベルに関連しないと計算してもよい。このとき、説明変数の類似性は、コサイン類似度やK-meansクラスタリングなど、公知の方法で計算することができる。さらに、イベント情報131に前記イベントの発生時刻の情報が格納されていない場合は、説明変数の変化点検知によって前記発生時刻を推定してもよい。
【0026】
そして分類モデル選択部122は関連イベント情報133を読み出し、関連イベント情報133に含まれる最も新しいイベント発生日を選択し、学習期間として前記イベント発生日よりも新しい日付のみを含む分類モデルを分類モデル情報113から選択する。
【0027】
分類部123は、分類モデル選択部122が選択した前記分類モデルを用いて、前記判定対象のテストデータを分類し、分類結果として得られる予測ラベルと確信度を分類結果情報124として記憶部に格納する。このとき、前記予測ラベルは前記分類モデルが出力したラベルである。また、前記確信度は前記予測ラベルの確からしさを示す指標であり、非特許文献1で開示の方法や2値分類の場合は2つのラベルに関する分類確率の差など、公知の方法で計算できる。この確信度が高ければ高いほど、元々付与されていた正解ラベルから分類モデルが出力した予測ラベルに訂正する必要性が高いことを意味する。
【0028】
訂正候補算出部141は、分類結果情報124を読み出し、確信度が所定の値を上回るテストデータについて説明変数、正解ラベル、訂正候補の予測ラベル、正解ラベルの付与者名を訂正候補情報142として記憶部に格納し、表示部200に訂正候補情報142の表示を指示する。このとき、前記付与者とは異なる付与者に訂正を依頼してよい。
【0029】
(データ構造例)
次に、図3~9を用いて、サーバ100の記憶装置内に格納されている各情報のデータ構造例を説明する。まず図3は学習データ情報111のデータ構造例を示す図である。図3に示す学習データ情報111はフィールド111a~111dを有する。フィールド111aは学習データを識別するための識別情報である学習データIDを格納する。フィールド111bは当該学習データの説明変数を格納する。フィールド111cは当該学習データに付与された目的変数である正解ラベルを格納する。フィールド111dは当該学習データに正解ラベルが付与されたラベル付与日を格納する。
【0030】
図4は分類モデル情報113のデータ構造例を示す図である。図4に示す分類モデル情報113はフィールド113a~113cを有する。フィールド113aは分類モデルを識別するための識別情報である分類モデルIDを格納する。フィールド113bは当該分類モデルが保存されているファイルパスを格納する。フィールド113cは当該分類モデルの学習に用いたデータの期間を示した学習期間を格納する。学習期間は、当該分類モデルの学習に用いた学習データに正解ラベルを付与した日付の範囲か、あるいは日付のリストでもよい。
【0031】
図5はテストデータ情報121のデータ構造例を示す図である。図5に示すテストデータ情報121はフィールド121a~121eを有する。フィールド121aはテストデータを識別するための識別情報であるテストデータIDを格納する。フィールド121bは当該テストデータの説明変数を格納する。フィールド121cは当該テストデータに付与された目的変数である正解ラベルを格納する。フィールド121dは当該テストデータに正解ラベルが付与されたラベル付与日を格納する。フィールド121eは当該テストデータに正解ラベルを付与した担当者を識別するための識別情報であるラベル付与者を格納する。
【0032】
図6は分類結果情報124のデータ構造例を示す図である。図6に示す分類結果情報124はフィールド124a~124cを有する。フィールド124aはテストデータを識別するための識別情報であるテストデータIDを格納する。フィールド124bは当該テストデータについて分類モデルが予測した目的変数の値である予測ラベルを格納する。フィールド124cには当該テストデータについて分類モデルの出力から算出した確信度の値を格納する。
【0033】
図7はイベント情報131のデータ構造例を示す図である。図7に示すイベント情報131はフィールド131a~131dを有する。フィールド131aはイベントを識別するための識別情報であるイベントIDを格納する。フィールド131bは当該イベントの種類を格納する。フィールド131cは当該イベントの発生日を格納する。フィールド131dは当該イベントに関連する目的変数を示した関連ラベルを格納する。
【0034】
図8は関連イベント情報133のデータ構造例を示す図である。図8に示す関連イベント情報133はフィールド133a~133dを有する。フィールド133aはテストデータを識別するための識別情報であるテストデータIDを格納する。フィールド133bは当該テストデータの正解ラベルを格納する。フィールド133cは当該テストデータの正解ラベルに関連するイベントを識別するための識別情報である関連イベントIDを格納する。フィールド133dは当該関連イベントの発生日を格納する。
【0035】
図9は訂正候補情報142のデータ構造例を示す図である。図9に示す訂正候補情報142はフィールド142a~142eを有する。フィールド142aは訂正候補のテストデータを識別するための識別情報であるテストデータIDを格納する。フィールド142bは当該テストデータの説明変数を格納する。フィールド142cは当該テストデータに付与されている正解ラベルを格納する。フィールド142dは当該テストデータの正解ラベルの訂正先となる訂正候補ラベルを格納する。フィールド142eは当該テストデータに正解ラベルを付与したラベル付与者を識別するための識別情報を格納する。
【0036】
(フローチャート)
図10はサーバ100の動作の一例を説明するためのフローチャートである。
【0037】
まずサーバ100のイベント選択部132は、テストデータ情報121から判定対象のテストデータを読み出す(ステップS101)。次に、イベント選択部132は当該テストデータに付与されている正解ラベルに関連するイベントのみを抽出し、当該イベントのIDと発生日を関連イベント情報133として格納する(ステップS102)。このとき、前記イベントがラベル付与規則を記したマニュアル更新や、説明変数が商品の情報を記載したテキストである場合は商品の部品を製造するベンダ変更や新商品の発売など、当該分野の専門家の知識にもとづいて説明変数と正解ラベルの対応付けに関係する可能性がある任意のイベントを指定して良い。また、イベント情報131に前記イベントに関連する正解ラベルが指定されていない場合は、前記イベントの発生日の前後において説明変数が類似した複数の学習データおよびテストデータに同一の正解ラベルが付与されているとき、当該イベントが前記正解ラベルに関連しないと計算してもよい。このとき、説明変数の類似性は、コサイン類似度やK-meansクラスタリングなど、公知の方法で計算することができる。さらに、イベント情報131に前記イベントの発生時刻の情報が格納されていない場合は、説明変数の変化点検知によって前記発生時刻を推定してもよい。
【0038】
続いて分類モデル選択部122は関連イベント情報133を読み出し、関連イベント情報133に含まれる最も新しいイベント発生日を抽出し、学習期間としてそのイベント発生日よりも新しい日付のみを含む分類モデルを分類モデル情報113から選択する(ステップS103)。
【0039】
続いて分類部123は、分類モデル選択部122が選択した分類モデルを用いて、判定対象のテストデータを分類し、分類結果として得られる予測ラベルと確信度を分類結果情報124として格納する(ステップS104)。この予測ラベルは分類モデルが出力したラベルである。また、確信度は予測ラベルの確からしさを示す指標であり、非特許文献1で開示の方法や2値分類の場合は2つのラベルに関する分類確率の差など、公知の方法で計算できる。
【0040】
続いて訂正候補算出部141は、分類結果情報124を読み出し、すでに付与済みの正解ラベルが予測ラベルと一致するか判定し、一致する場合は処理を終了する(ステップS105)。正解ラベルと予測ラベルが一致しない場合は、確信度が所定の値を上回るか判定し、上回らない場合は処理を終了する(ステップS106)。確信度が所定の値を上回る場合は、テストデータについて説明変数、正解ラベル、訂正候補の予測ラベル、正解ラベルの付与者名を訂正候補情報142として格納し、表示部200に訂正候補情報142の表示を指示、つまり訂正を推薦する(ステップS107)。このとき、ラベル付与者名に記載の付与者とは異なる付与者に訂正を推薦してもよい。
【0041】
(画面例)
図11に、図10のステップS107にて表示される訂正推薦画面301の例を示す。これら訂正推薦画面301は、例えばパソコンなどにおいて、表示部200に表示、出力されてよい。
【0042】
図11に示す訂正推薦画面301は、テストデータに付与されている正解ラベルの訂正を推薦する際に、その訂正対象となるテストデータの説明変数とともに現在の正解ラベルと訂正候補のラベルを指定して推薦する場合の例であってよい。図11に示す訂正推薦画面301は、フィールド301a~301hを有してよい。フィールド301aは、訂正対象のテストデータの識別情報を「テストデータID」として表示してよい。フィールド301bは、訂正対象のテストデータに付与されている正解ラベルを「現在のラベル」として表示してよい。フィールド301cは、フィールド301bの「現在のラベル」の訂正先の候補として「訂正候補のラベル」を表示してよい。フィールド301dは、訂正対象のテストデータの説明変数を「説明変数」として表示してよい。フィールド301eは、訂正対象のテストデータに付与されている正解ラベルに関連するイベントを「関連イベント」として表示してよい。フィールド301fは、「訂正候補のラベル」で規定された候補となるラベルを参考に、本発に係る学習データ管理システムの利用者が選択したラベルのテキスト入力を受け付け、「訂正後のラベル」として表示してよい。フィールド301gは、この利用者が「訂正後のラベル」を選択した理由を記載したテキストの入力を受け付け、「訂正理由」として表示してよい。この利用者は、訂正推薦画面301に表示された情報について、訂正対象となるテストデータに付与されているラベルの訂正を選択することができてよい。利用者は、例えば、図11のフィールド301hに「確定」として表示されている操作欄にパソコンのポインタを移動し、そこでパソコンでクリック操作することで「訂正後のラベル」と「訂正理由」に表示された情報について、採用し確定するような操作であってよい。
【0043】
以上で説明した本発明の実施例によれば、以下の作用効果を奏する。
(1)本発明に係る学習データ管理システムは、ラベルの付与対象であるテストデータを管理するテストデータ管理部と、ラベルを選定するための分類モデルを選択する分類モデル選択部と、分類モデルが選定するラベルを訂正する必要性を示す確信度を算出する分類部と、確信度が所定値を超えるとき、該ラベルの訂正候補を推薦する訂正候補算出部と、を備える。
【0044】
上記構成により、既存の学習データに含まれる概念ドリフトの影響を除外し、ラベルノイズのみを選択的に検知し、ラベルの訂正を可能にすることが可能になる。
【0045】
(2)テストデータを生じさせたイベントに関する情報を管理するイベント情報管理部をさらに備え、分類モデル選択部は、イベントの発生日時に基づいて分類モデルを選択する。概念ドリフトは任意のイベントの発生により生じることがほとんどであるため、この構成によってより適切に概念ドリフトの影響を除外することが可能になる。
【0046】
(3)イベント情報管理部は、イベントの種類ごとに該イベントに影響するラベルの種類を管理し、分類モデル選択部は、影響のあるイベントの発生後における学習データで再学習した分類モデルを選択する。これにより、生じたイベントと関連するラベルに関して再学習された分類モデルを用いて判定するため、より高精度な判定が可能になる。
【0047】
(4)あるイベントの発生時刻の前後において複数のテストデータに同一のラベルが付与されているとき、該イベントの種類が該ラベルに影響しないと判定して該イベントをフィードバック対象から除外するイベント選択部をさらに備える。これにより、演算ソースを削減することが可能になる。
【0048】
(5)イベント選択部は、特徴量の変化点に基づきイベントの発生時刻を推定する。これにより、予めイベント情報にイベントの発生時刻が記録されていない場合でも、推定したイベントの発生時刻に基づいて分類手段を選択することが可能になる。
【0049】
(6)訂正候補算出部は、ラベルを付与したラベル付与者とは異なる人物に訂正を推薦する。これにより、当初ラベルを付与した作業者による客観的な評価が可能になり、訂正の正確性向上が期待できる。
【0050】
本発明は、技術的範囲は上記実施の形態に記載の範囲には限定されるものではなく、本発明の主要な特徴から逸脱することなく、様々な変形例が含まれる。そのため、前述の実施例は単なる例示に過ぎず、限定的に解釈してはならない。また、各実施例の構成の一部について、他の構成の追加・削除・置換をすることが可能であって、すべて本発明の範囲内のものである。
【符号の説明】
【0051】
100:学習データ管理サーバ(学習データ管理システム)、112:学習部、122:分類モデル選択部、123:分類部、132:イベント選択部、141:訂正候補算出部


図1
図2
図3
図4
図5
図6
図7
図8
図9
図10
図11