(19)【発行国】日本国特許庁(JP)
(12)【公報種別】公開特許公報(A)
(11)【公開番号】P2024010619
(43)【公開日】2024-01-24
(54)【発明の名称】学習装置、学習方法、及び学習プログラム
(51)【国際特許分類】
G06F 16/35 20190101AFI20240117BHJP
【FI】
G06F16/35
【審査請求】未請求
【請求項の数】18
【出願形態】OL
(21)【出願番号】P 2022112070
(22)【出願日】2022-07-12
(71)【出願人】
【識別番号】306037311
【氏名又は名称】富士フイルム株式会社
(74)【代理人】
【識別番号】110001519
【氏名又は名称】弁理士法人太陽国際特許事務所
(72)【発明者】
【氏名】外池 昌嗣
【テーマコード(参考)】
5B175
【Fターム(参考)】
5B175DA01
5B175FA03
(57)【要約】
【課題】分類モデルの分類精度をより向上させることができる学習装置、学習方法、及び学習プログラムを提供する。
【解決手段】素性抽出テーブルを参照して文書から抽出された素性を入力とし、前記文書が属するカテゴリを分類結果として出力する分類モデルを再学習させる学習装置であって、少なくとも1つのプロセッサを含み、前記プロセッサは、前記分類結果の誤りを修正する修正指示と、前記文書に含まれる情報に基づく修正根拠との入力を受け付ける受付画面を提示し、前記修正指示と前記修正根拠とが受け付けられた場合において、前記修正根拠に基づいて前記素性抽出テーブルを更新し、かつ、修正された正しい分類結果と更新後の前記素性抽出テーブルとを用いて前記分類モデルを再学習させる学習装置。
【選択図】
図9
【特許請求の範囲】
【請求項1】
素性抽出テーブルを参照して文書から抽出された素性を入力とし、前記文書が属するカテゴリを分類結果として出力する分類モデルを再学習させる学習装置であって、
少なくとも1つのプロセッサを含み、
前記プロセッサは、
前記分類結果の誤りを修正する修正指示と、前記文書に含まれる情報に基づく修正根拠との入力を受け付ける受付画面を提示し、
前記修正指示と前記修正根拠とが受け付けられた場合において、
前記修正根拠に基づいて前記素性抽出テーブルを更新し、かつ、修正された正しい分類結果と更新後の前記素性抽出テーブルとを用いて前記分類モデルを再学習させる
学習装置。
【請求項2】
前記素性抽出テーブルの項目には、素性として抽出すべき単語、または素性として抽出すべき単語及び前記単語毎に割り当てられる重みが少なくとも含まれる
請求項1に記載の学習装置。
【請求項3】
前記プロセッサは、
前記修正根拠に基づいて、前記素性抽出テーブルの前記項目のうちの少なくとも1つを更新する、
請求項2に記載の学習装置。
【請求項4】
前記更新は、前記修正根拠に含まれる単語の追加である、
請求項3に記載の学習装置。
【請求項5】
前記更新は、前記修正根拠に含まれる単語に割り当てられる前記重みの更新である、
請求項3に記載の学習装置。
【請求項6】
前記プロセッサは、
前記受付画面に、前記文書から抽出した前記修正根拠の候補を選択可能に表示し、
前記候補を選択させることにより前記修正根拠の入力を受け付ける
請求項1に記載の学習装置。
【請求項7】
前記プロセッサは、
前記修正根拠の候補として、前記文書から少なくとも単語を抽出する、
請求項6に記載の学習装置。
【請求項8】
前記プロセッサは、
前記修正根拠の候補として、前記単語に加えて、文を抽出し、
前記受付画面に、抽出した前記単語と前記文を混在させて表示する
請求項7に記載の学習装置。
【請求項9】
前記受付画面は、ユーザが前記修正根拠を自由文で入力可能な入力欄を有しており、
前記プロセッサは、
入力された前記自由文の中から、前記文書に含まれる情報を識別可能に表示する
請求項1に記載の学習装置。
【請求項10】
前記プロセッサは、
前記文書に含まれる情報を強調することにより識別可能に表示する
請求項9に記載の学習装置。
【請求項11】
前記文書の意味内容が機械の故障の状況を表す場合において、前記カテゴリには、前記故障の原因が含まれる、
請求項1に記載の学習装置。
【請求項12】
前記受付画面は、前記文書と前記分類結果とを表示する表示領域を含む
請求項1に記載の学習装置。
【請求項13】
前記素性抽出テーブルには、前記文書に関連する画像が含まれ、
前記分類モデルには、前記文書から抽出された素性に加えて前記画像が素性として入力される
請求項1に記載の学習装置。
【請求項14】
前記文書には記号が含まれ、前記素性抽出テーブルの項目には、素性として抽出すべき記号が少なくとも含まれる
請求項1に記載の学習装置。
【請求項15】
少なくとも1つのプロセッサを含み、
前記プロセッサは、
素性抽出テーブルを参照して文書から抽出された素性を入力とし、前記文書が属するカテゴリを分類結果として出力する分類モデルに過去に入力された文書を表示し、
前記過去に入力された文書に応じて前記分類モデルから出力された分類結果を表示し、
表示された分類結果の誤りを修正する修正指示を受け付け、
前記修正指示の根拠となる修正根拠を受け付け、
受け付けられた修正指示と修正根拠とを用いて、再学習する、
学習装置。
【請求項16】
素性抽出テーブルを参照して文書から抽出された素性を入力とし、前記文書が属するカテゴリを分類結果として出力する分類モデルを再学習させる学習装置が備えるプロセッサにより、
前記分類結果の誤りを修正する修正指示と、前記文書に含まれる情報に基づく修正根拠との入力を受け付ける受付画面を提示し、
前記修正指示と前記修正根拠とが受け付けられた場合において、
前記修正根拠に基づいて前記素性抽出テーブルを更新し、かつ、修正された正しい分類結果と更新後の前記素性抽出テーブルとを用いて前記分類モデルを再学習させる
処理を実行する学習方法。
【請求項17】
素性抽出テーブルを参照して文書から抽出された素性を入力とし、前記文書が属するカテゴリを分類結果として出力する分類モデルに過去に入力された文書を表示するステップと、
前記過去に入力された文書に応じて前記分類モデルから出力された分類結果を表示するステップと、
表示された分類結果の誤りを修正する修正指示を受け付けるステップと、
前記修正指示の根拠となる修正根拠を受け付けるステップと、
受け付けられた修正指示と修正根拠とを用いて、再学習するステップと、
を含む学習方法。
【請求項18】
素性抽出テーブルを参照して文書から抽出された素性を入力とし、前記文書が属するカテゴリを分類結果として出力する分類モデルを再学習させる学習装置が備えるプロセッサに、
前記分類結果の誤りを修正する修正指示と、前記文書に含まれる情報に基づく修正根拠との入力を受け付ける受付画面を提示し、
前記修正指示と前記修正根拠とが受け付けられた場合において、
前記修正根拠に基づいて前記素性抽出テーブルを更新し、かつ、修正された正しい分類結果と更新後の前記素性抽出テーブルとを用いて前記分類モデルを再学習させる
処理を実行させるための学習プログラム。
【発明の詳細な説明】
【技術分野】
【0001】
本開示は、学習装置、学習方法、及び学習プログラムに関する。
【背景技術】
【0002】
従来、機械学習モデルとして、入力された単語や文等が属するカテゴリを自動的に分類し、分類結果を出力する分類モデルが知られている。例えば、特許文献1には、単語のカテゴリを分類する分類モデルが記載されている。
【先行技術文献】
【特許文献】
【0003】
【発明の概要】
【発明が解決しようとする課題】
【0004】
ところで、分類モデルの分類結果が誤っている場合の再学習の方法として、誤っている分類結果をユーザが修正し、修正後の正しい分類結果を用いて分類モデルの再学習を行う方法がある。例えば、特許文献1に記載の技術では、ユーザによって修正された単語の分類を用いて分類モデルの再学習を行う。しかしながら、特許文献1に記載の技術では、再学習された分類モデルの精度を向上させるのに十分とは言えない場合があり、改善の余地があった。
【0005】
本開示は、以上の事情を鑑みて成されたものであり、分類モデルの分類精度をより向上させることができる学習装置、学習方法、及び学習プログラムを提供することを目的とする。
【課題を解決するための手段】
【0006】
上記目的を達成するために本開示の第1の態様の学習装置は、素性抽出テーブルを参照して文書から抽出された素性を入力とし、文書が属するカテゴリを分類結果として出力する分類モデルを再学習させる学習装置であって、少なくとも1つのプロセッサを含み、プロセッサは、分類結果の誤りを修正する修正指示と、文書に含まれる情報に基づく修正根拠との入力を受け付ける受付画面を提示し、修正指示と修正根拠とが受け付けられた場合において、修正根拠に基づいて素性抽出テーブルを更新し、かつ、修正された正しい分類結果と更新後の素性抽出テーブルとを用いて分類モデルを再学習させる。
【0007】
第2の態様の学習装置は、第1の態様の学習装置において、素性抽出テーブルの項目には、素性として抽出すべき単語、または素性として抽出すべき単語及び単語毎に割り当てられる重みが少なくとも含まれる。
【0008】
第3の態様の学習装置は、第2の態様の学習装置において、プロセッサは、修正根拠に基づいて、素性抽出テーブルの項目のうちの少なくとも1つを更新する。
【0009】
第4の態様の学習装置は、第3の態様の学習装置において、更新は、修正根拠に含まれる単語の追加である。
【0010】
第5の態様の学習装置は、第3の態様の学習装置において、更新は、修正根拠に含まれる単語に割り当てられる重みの更新である。
【0011】
第6の態様の学習装置は、第1の態様の学習装置において、プロセッサは、受付画面に、文書から抽出した修正根拠の候補を選択可能に表示し、候補を選択させることにより修正根拠の入力を受け付ける。
【0012】
第7の態様の学習装置は、第6の態様の学習装置において、プロセッサは、修正根拠の候補として、文書から少なくとも単語を抽出する。
【0013】
第8の態様の学習装置は、第7の態様の学習装置において、プロセッサは、修正根拠の候補として、単語に加えて、文を抽出し、受付画面に、抽出した単語と文を混在させて表示する。
【0014】
第9の態様の学習装置は、第1の態様の学習装置において、受付画面は、ユーザが修正根拠を自由文で入力可能な入力欄を有しており、プロセッサは、入力された自由文の中から、文書に含まれる情報を識別可能に表示する。
【0015】
第10の態様の学習装置は、第9の態様の学習装置において、プロセッサは、文書に含まれる情報を強調することにより識別可能に表示する。
【0016】
第11の態様の学習装置は、第1の態様の学習装置において、文書の意味内容が機械の故障の状況を表す場合において、カテゴリには、故障の原因が含まれる。
【0017】
第12の態様の学習装置は、第1の態様の学習装置において、受付画面は、文書と分類結果とを表示する表示領域を含む。
【0018】
第13の態様の学習装置は、第1の態様の学習装置において、素性抽出テーブルには、文書に関連する画像が含まれ、分類モデルには、文書から抽出された素性に加えて画像が素性として入力される。
【0019】
第14の態様の学習装置は、第1の態様の学習装置において、文書には記号が含まれ、素性抽出テーブルの項目には、素性として抽出すべき記号が少なくとも含まれる。
【0020】
また、上記目的を達成するために本開示の第15の態様の学習装置は、少なくとも1つのプロセッサを含み、プロセッサは、素性抽出テーブルを参照して文書から抽出された素性を入力とし、文書が属するカテゴリを分類結果として出力する分類モデルに過去に入力された文書を表示し、過去に入力された文書に応じて分類モデルから出力された分類結果を表示し、表示された分類結果の誤りを修正する修正指示を受け付け、修正指示の根拠となる修正根拠を受け付け、受け付けられた修正指示と修正根拠とを用いて、再学習する学習装置。
【0021】
また、上記目的を達成するために本開示の第16の態様の学習方法は、素性抽出テーブルを参照して文書から抽出された素性を入力とし、文書が属するカテゴリを分類結果として出力する分類モデルを再学習させる学習装置が備えるプロセッサにより、分類結果の誤りを修正する修正指示と、文書に含まれる情報に基づく修正根拠との入力を受け付ける受付画面を提示し、修正指示と修正根拠とが受け付けられた場合において、修正根拠に基づいて素性抽出テーブルを更新し、かつ、修正された正しい分類結果と更新後の素性抽出テーブルとを用いて分類モデルを再学習させる処理を実行する学習方法である。
【0022】
また、上記目的を達成するために本開示の第17の態様の学習方法は、素性抽出テーブルを参照して文書から抽出された素性を入力とし、文書が属するカテゴリを分類結果として出力する分類モデルに過去に入力された文書を表示するステップと、過去に入力された文書に応じて分類モデルから出力された分類結果を表示するステップと、表示された分類結果の誤りを修正する修正指示を受け付けるステップと、修正指示の根拠となる修正根拠を受け付けるステップと、受け付けられた修正指示と修正根拠とを用いて、再学習するステップと、を含む学習方法である。
【0023】
また、上記目的を達成するために本開示の第18の態様の学習プログラムは、素性抽出テーブルを参照して文書から抽出された素性を入力とし、文書が属するカテゴリを分類結果として出力する分類モデルを再学習させる学習装置が備えるプロセッサに、分類結果の誤りを修正する修正指示と、文書に含まれる情報に基づく修正根拠との入力を受け付ける受付画面を提示し、修正指示と修正根拠とが受け付けられた場合において、修正根拠に基づいて素性抽出テーブルを更新し、かつ、修正された正しい分類結果と更新後の素性抽出テーブルとを用いて分類モデルを再学習させる処理を実行させるためのものである。
【発明の効果】
【0024】
本開示によれば、分類モデルの分類精度をより向上させることができる。
【図面の簡単な説明】
【0025】
【
図1】実施形態の分類モデルによる文書が属するカテゴリの分類について説明するための図である。
【
図2】学習装置の構成の一例を示すブロック図である。
【
図5】学習フェーズにおける学習装置の機能的な構成の一例を示すブロック図である。
【
図6】学習処理の一例を示すフローチャートである。
【
図7】運用フェーズにおける学習装置の機能的な構成の一例を示すブロック図である。
【
図8】分類処理の一例を示すフローチャートである。
【
図9】再学習フェーズにおける学習装置の機能的な構成の一例を示すブロック図である。
【
図10】第1実施形態の受付画面の表示状態の一例を示す図である。
【
図11】第1実施形態の再学習処理の一例を示すフローチャートである。
【
図12】正しい分類結果及び修正根拠が入力された受付画面の表示状態の一例を示す図である。
【
図13】第1実施形態のUI提示部による修正根拠単語の抽出を説明するための図である。
【
図14】第1実施形態の受付画面の表示状態の一例を示す図である。
【
図15】素性抽出テーブルの更新を説明するための図である。
【
図16】第2実施形態の受付画面の表示状態の一例を示す図である。
【
図17】第2実施形態の再学習処理の一例を示すフローチャートである。
【
図18】第2実施形態の受付画面の表示状態の一例を示す図である。
【
図19】第2実施形態のUI提示部による修正根拠単語の抽出を説明するための図である。
【
図20】第2実施形態の受付画面の表示状態の一例を示す図である。
【
図21】第2実施形態の受付画面の表示状態の他の例を示す図である。
【
図22】第3実施形態の受付画面の表示状態の一例を示す図である。
【
図23】第3実施形態の再学習処理の一例を示すフローチャートである。
【
図24】第3実施形態の受付画面の表示状態の一例を示す図である。
【
図25】第3実施形態のUI提示部による修正根拠単語の抽出を説明するための図である。
【
図26】第3実施形態の受付画面の表示状態の他の例を示す図である。
【発明を実施するための形態】
【0026】
以下、図面を参照して本開示の実施形態を詳細に説明する。なお、本実施形態は本開示の技術を限定するものではない。
【0027】
[第1実施形態]
まず、本実施形態の学習装置により学習される分類モデルについて説明する。
図1には、本実施形態で扱う分類モデル37による文書50が属するカテゴリの分類の予測(以下、単に「文書50の分類」という)について説明するための図が示されている。
【0028】
分類モデル37は、素性抽出部40によって素性抽出テーブル34(詳細後述)を参照して文書50から抽出され、重み付けに応じてベクトル化された素性52を入力とし、文書50が属するカテゴリを分類結果54として出力する。なお、本実施形態において、文書50とは、単語及び文の少なくとも一方を構成要素とした情報である。例えば、文書50は、1つの単語のみを含んでいてもよいし、また、複数の文を含んでいてもよい。
「素性」とは、本来の性質のことをいい、機械学習においては、データを分類する手がかりとなる情報、すなわち特徴量のことをいう。本実施形態において素性52とは、文書50の特徴を表すものであり、一例として、文書50に含まれる単語が挙げられる。
【0029】
図2には、上記分類モデル37の学習及び再学習を行う学習装置10のハードウェア構成の一例を表す構成図が示されている。
図2に示すように、本実施形態の学習装置10は、CPU(Central Processing Unit)20、一時記憶領域としてのメモリ21、不揮発性の記憶部22、液晶ディスプレイ等のディスプレイ23、入力部24、及びネットワークI/F(Interface)26を備える。CPU20、メモリ21、記憶部22、ディスプレイ23、入力部24、及びネットワークI/F26は、システムバス及びコントロールバス等のバス29を介して相互に各種情報の授受が可能に接続されている。
【0030】
入力部24は、ユーザの操作を受け付けるためのものであり、例えばタッチパネル、ボタン、キーボード、及びマウス等である。なお、ディスプレイ23及び入力部24を一体化したタッチパネルディスプレイを採用してもよい。ネットワークI/F26は、外部装置(図示省略)との有線又は無線通信を行う。
【0031】
記憶部22は、例えば、HDD(Hard Disk Drive)、SSD(Solid State Drive)、及びフラッシュメモリ等の記憶媒体によって実現される。記憶部22には、学習プログラム30A、分類プログラム30B、及び再学習プログラム30Cが記憶される。分類モデル37の学習を行う場合、CPU20は、記憶部22から学習プログラム30Aを読み出してメモリ21に展開し、展開した学習プログラム30Aを実行する。また、分類モデル37を運用し、文書50の分類を行う場合、CPU20は、記憶部22から分類プログラム30Bを読み出してメモリ21に展開し、展開した分類プログラム30Bを実行する。また、分類モデル37の再学習を行う場合、CPU20は、記憶部22から再学習プログラム30Cを読み出してメモリ21に展開し、展開した再学習プログラム30Cを実行する。CPU20が本開示のプロセッサの一例であり、再学習プログラム30Cが本開示の学習プログラムの一例である。
【0032】
また、記憶部22には、データ管理DB32が記憶される。データ管理DB32は、文書50を管理するためのものである。データ管理DB32には、文書50及び正解の分類結果54を組合せた複数の学習用データが記録される。また、文書50と、実際に分類モデル37によりその文書50を分類した分類結果54との組合せが記録される。
図3には、本実施形態のデータ管理DB32の一例が示されている。
図3に示すように、文書50及び分類結果54は、管理用の「ID(Identification)」に対応付けられて管理されている。一例として、本実施形態の文書50の意味内容が機械の故障の状況を表しており、カテゴリには、機械故障の原因を区分する原因区分が含まれる。
図3に示すように、文書50は、「題名」、「説明」、「対応結果」、「機種」、及び「OS(Operating System)」のフィールドを含む。「題名」は、文書50に付与された題名である。「説明」は、生じた故障の内容の説明である。「対応結果」は、その故障に対してメンテナンス作業者が対応した結果である。「機種名」は故障が生じた装置の機種名である。「OS」は、故障が生じた際に用いていたOSの名称である。また、
図3に示すように、分類結果54は、「原因区分」を含む。「原因区分」は、故障が生じた原因に応じたカテゴリである。
【0033】
また、記憶部22には、素性抽出テーブル34が記憶される。素性抽出テーブル34には、文書50から素性を抽出する際の抽出ルールが記憶されている。素性抽出テーブル34は、素性抽出部40が文書50から素性52を抽出する際に参照されるテーブルである。本実施形態の保持部材40は、文書50から素性52を抽出するためのルールを記録するテーブルである。
図4には、本実施形態の素性抽出テーブル34の一例が示されている。
図4に示すように、素性抽出テーブル34の項目には、素性52を抽出する文書50の「フィールド」、そのフィールドの「タイプ」、具体的な「素性」、及びその素性の「重み」が含まれる。
図4に示した例では、「フィールド」のうち、「説明」、「対応結果」、及び「機種名」が示されている。このうち、「説明」及び「対応結果」は、タイプが「テキスト」とされている。タイプが「テキスト」の場合、例えば、テキストをJUMAN等の公知の形態素解析器で形態素解析して得られる形態素や。n-gram(形態素のn個の並び)を「素性」として採用してもよい。また、「重み」は、例えば、公知のTF-IDF(Term Frequency - Inverse Document Frequency)等の尺度で得られた重み付けを採用してもよい。一方、「機種名」は、タイプが「名義尺度」とされている。タイプが「名義尺度」の場合、取り得る値の有無を素性とする。例えば、
図3に示したデータ管理DB32に「機種名」として挙げられた「Desket」の場合、Desketであるか否かを表す値が素性として、素性抽出テーブル34に記憶される。なお、「名義」とは、「表面上の名前」であり、また、「尺度」とは、物事を評価するときの基準である。すなわち、「名義尺度」とは、数値の大きさや大小関係には意味を持たない尺度である。
【0034】
また、記憶部22には、分類モデルDB(DataBase)36が記憶される。分類モデルDB36は、上述した分類モデル37が格納されたデータベースである。
【0035】
次に、本実施形態の学習装置10の作用について説明する。
【0036】
(学習フェーズ)
まず、本実施形態の分類モデル37の学習を行う学習フェーズについて説明する。
図5には、学習フェーズにおける学習装置10の機能的な構成の一例が示されている。分類モデル37の学習を行う場合、学習装置10のCPU20が学習プログラム30Aを実行することにより、CPU20が素性抽出部40及びモデル学習部42として機能する。なお、本実施形態では、機械学習モデルを学習用データを用いて学習することにより分類モデル37を生成することを「分類モデル37の学習」という。また、本実施形態において分類モデル37の「学習」とは、文書50及び正解の分類結果54を組み合わせた学習用データを用いて、分類モデル37を学習することをいう。
【0037】
素性抽出部40は、データ管理DB32から学習用データである、文書50及び正解の分類結果54の組合せを取得する。なお、一例として本実施形態では、学習用データには、所定のIDが対応付けられている。例えば、学習用データに対応付けられているIDが「00001」~「09999」である場合、素性抽出部40は、データ管理DB32から、「00001」~「09999」の範囲内のIDが対応付けられている文書50及び正解の分類結果54の組合せを学習用データとして取得する。例えば、
図3に示したデータ管理DB32の例では、IDが「01234」である、文書50及び正解の分類結果54の組合せを学習用データとして取得する。素性抽出部40は、取得した文書50から素性抽出テーブル34に指定されている要素を素性52として抽出する。素性抽出部40は、抽出した素性52に割り当てられている重み付けを用い、素性52をベクトル化する。素性抽出部40は、ベクトル化した素性52と、データ管理DB32から取得した正解の分類結果54とをモデル学習部42に出力する。
【0038】
モデル学習部42は、素性抽出部40から入力された学習用データである文書50の素性52と、正解の分類結果54とに基づいて、分類モデル37の学習を行う。本実施形態のモデル学習部42は、ベクトル化された素性52を入力とし、出力が正解の分類結果54となるように、分類モデル37の学習を行う。なお、機械学習手法は、公知のSupport Vector MachineやRandom Forest等、分類が行えるものであれば種類を問わない。モデル学習部42は、学習済みの分類モデル37を分類モデルDB36に格納する。
【0039】
学習装置10が分類モデル37の学習を行う場合、CPU20が学習プログラム30Aを実行することにより、
図6に示す学習処理が実行される。学習処理は、例えば、学習を実施するように予め定められたタイミングや、ユーザにより入力部24を介して実行開始の指示があった場合に実行される。
【0040】
図6のステップS100で、素性抽出部40は、上述したように、データ管理DB32から、学習用データである、文書50及び正解の分類結果54の組合せを取得する。次のステップS102で素性抽出部40は、上述したように、素性抽出テーブル34を参照し、取得した文書50から素性52を抽出し、割り当てられている重みに応じてベクトル化する。素性抽出部40は、ベクトル化した素性52と、取得した正解の分類結果54とをモデル学習部42に出力する。
【0041】
次のステップS104でモデル学習部42は、上述したように、ベクトル化された素性52と、正解の分類結果とに基づいて、分類モデル37の学習を行い、学習済みの分類モデル37を分類モデルDB36に格納する。
【0042】
次のステップS106で素性抽出部40は、学習処理を終了するか否かを判定する。素性抽出部40は、所定の学習処理終了条件を満たす場合、学習処理を終了する。一例として、本実施形態の素性抽出部40は、所定の数の学習用データにより分類モデル37の学習を行った場合、具体的には、ステップS100~S104の処理を所定の回数実施した場合を所定の学習処理終了条件として採用している。所定の学習処理終了条件を満たすまで、ステップS106の判定が否定判定となり、ステップS100に戻り、ステップS100~S104の処理を繰り返す。一方、所定の学習処理終了条件を満たす場合、ステップS106の判定が肯定判定となる。ステップS106の判定が肯定判定となった場合、
図6に示した学習処理が終了する。
【0043】
このように学習フェーズでは、学習装置10が
図6に示した学習処理を実行することにより、学習済みの分類モデル37が分類モデルDB36に格納された状態となる。
【0044】
(運用フェーズ)
次に、本実施形態の分類モデル37により文書50の分類を行う運用フェーズについて説明する。
図7には、運用フェーズにおける学習装置10の機能的な構成の一例が示されている。分類モデル37の運用を行う場合、学習装置10のCPU20が分類プログラム30Bを実行することにより、CPU20が素性抽出部40及び分類予測部44として機能する。
【0045】
素性抽出部40は、データ管理DB32から実際に分類を行う文書50を取得する。一例として本実施形態では、分類モデル37により分類を行う文書50もデータ管理DB32に格納されている。データ管理DB32に格納されている複数の文書50のうち、これから分類モデル37により分類を行う対象となる文書50(以下、「分類対象の文書50」という)は、対応する分類結果54の欄が空欄となっている。そのため、一例として本実施形態の素性抽出部40は、データ管理DB32に格納されている複数の文書50のうち、分類結果54の欄が空欄となっている文書50を取得する。素性抽出部40は、素性抽出テーブル34を参照し、取得した文書50から素性抽出テーブル34に指定されている要素を素性52として抽出する。素性抽出部40は、抽出した素性52に割り当てられている重み付けを用い、素性52をベクトル化する。素性抽出部40は、ベクトル化した素性52を分類予測部44に出力する。
【0046】
分類予測部44は、素性抽出部40から入力されたベクトル化された素性52を、分類モデルDB36に格納されている分類モデル37に入力し、分類モデル37から出力された分類結果54を取得する。上述したように、文書50の意味内容が機械の故障の状況を表している場合、分類モデル37からは、機械故障の原因が分類結果54として出力される。分類予測部44は、取得した分類結果54を、データ管理DB32に記憶されている分類対象の文書50に対応付けて記憶させる。上述したように、データ管理DB32に記憶されている分類対象の文書50に対応する分類結果54の欄が空欄となっているため、その空欄に分類モデル37から出力された分類結果54を記録する。
【0047】
学習装置10が分類モデル37による文書50の分類を行う場合、CPU20が分類プログラム30Bを実行することにより、
図8に示す分類処理が実行される。分類処理は、例えば、ユーザにより入力部24を介して実行開始の指示があった場合や、分類対象となる文書50が所定の数以上データ管理DB32に蓄積された場合等に実行される。
【0048】
図8のステップS200で素性抽出部40は、上述したように、データ管理DB32から分類対象の文書50を1つ取得する。次のステップS202で素性抽出部40は、上述したように、素性抽出テーブル34を参照し、取得した分類対象の文書50から素性52を抽出し、割り当てられている重みに応じてベクトル化する。素性抽出部40は、ベクトル化した素性52を分類予測部44に出力する。
【0049】
次のステップS204で分類予測部44は、上述したように、分類モデル37から出力された分類結果54を取得する。次のステップS206で分類予測部44は、上述したように、取得した分類結果54を分類対象の文書に対応付けてデータ管理DB32に記憶させる。
【0050】
次のステップS208で素性抽出部40は、分類処理を終了するか否かを判定する。素性抽出部40は、所定の分類処理終了条件を満たす場合、分類処理を終了する。一例として、本実施形態の素性抽出部40は、データ管理DB32に分類結果54の欄が空欄となっている文書50が記憶されていない場合、換言すると、データ管理DB32に記憶されている全ての文書50に分類結果54が対応付けて記憶されている場合を分類処理終了条件として採用している。所定の分類処理終了条件を満たすまで、ステップS208の判定が否定判定となり、ステップS200に戻り、ステップS200で次の文書50を取得して、ステップS204及びS206の処理を繰り返す。一方、所定の分類処理終了条件を満たす場合、ステップS208の判定が肯定判定となる。ステップS208の判定が肯定判定となった場合、
図8に示した分類処理が終了する。なお、
図8に示した分類処理では、分類対象の文書50を、データ管理DB32から1つずつ順次取得し、分類結果54を順次取得する形態について説明したが、本形態に限定されない。例えば、分類処理のステップS200で、データ管理DB32に記憶されている、分類対象となる全ての文書50を取得する形態であってもよい。この場合、上述した分類処理におけるステップS208の処理は不要となるため、ステップS206の終了に応じて、分類処理を終了すればよい。
【0051】
このように運用フェーズでは、学習装置10が
図8に示した分類処理を実行することにより、分類モデル37による文書50の分類が行われ分類結果54が分類対象の文書50に対応付けられてデータ管理DB32に記憶された状態となる。
【0052】
(再学習フェーズ)
次に、本実施形態の分類モデル37により文書50の再学習を行う再学習フェーズについて説明する。上述のように運用フェーズにおいて分類モデル37により文書50の分類を行うことで取得された分類結果54が誤っている場合がある。本実施形態の学習装置10は、このように分類結果54が誤っている場合、ユーザが入力した正しい分類結果54、及び正しい分類結果54に修正すべき修正根拠を受け付け、受け付けた修正根拠に基づいて素性抽出テーブル34を更新する。また、学習装置10は、更新した素性抽出テーブル34を参照して、正しい分類結果54を用いて分類モデル37の再学習を行う。
【0053】
図9には、再学習フェーズにおける学習装置10の機能的な構成の一例が示されている。分類モデル37の再学習を行う場合、学習装置10のCPU20が再学習プログラム30Cを実行することにより、CPU20が素性抽出部40、モデル学習部42、UI(User Interface)提示部46、及び素性抽出テーブル更新部48として機能する。
【0054】
UI提示部46は、分類結果54の誤りを修正する正しい分類結果である修正指示と、修正根拠とを受け付ける受付画面60をUIとして提示する。なお、本実施形態のUI提示部46が提示する受付画面60は、分類モデル37から出力された分類結果54の修正を実施すべきか否かの修正実施指示も受け付ける。
【0055】
図10には、UI提示部46が提示する受付画面60の一例が示されている。なお、
図10では、
図3に示したデータ管理DB32に記憶されている「12478」がIDとして付与されている文書50の分類結果54を修正する際に提示される受付画面60の初期状態の一例が示されている。
図10に示した受付画面60は、分類対象となった文書50が表示される領域を有する。IDが「12478」の文書50は、題名のフィールドとして「端末のフリーズ」、説明のフィールドとして「頻繁にWindows(登録商標)がフリーズするようになったとのこと。」、対応結果のフィールドとして「HDDの交換を実施」、機種名のフィールドとして「Desket」、及びOSのフィールドとして「Windows10(登録商標)」が含まれる(
図3参照)。そのため、
図10に示した受付画面60では、これらを含む文書50が表示された状態となっている。
【0056】
また、
図10に示すように、受付画面60は、分類結果欄64、修正後分類結果欄66、修正根拠欄68及び修正根拠単語欄70を含む。分類結果欄64には、文書50を分類モデル37から取得され、データ管理DB32に記憶されていた分類結果54が表示される。
図10に示した例では、IDが「12478」の文書50に対応付けられている分類結果54である原因区分の「S/W(SoftWare)不具合」が受付画面60の分類結果欄64に表示される。また、初期状態では、受付画面60の修正後分類結果欄66、修正根拠欄68、及び修正根拠単語欄70は空欄となっている。
【0057】
さらに、
図10に示すように、受付画面60は、修正実施指示ボタン62を含む。修正実施指示ボタン62は、分類結果欄64に表示された分類結果54の修正を行うことを指示するための実施指示ボタン62Aと、分類結果欄64に表示された分類結果54の修正を行わないことを指示するための非実施指示ボタン62Bとを含む。
【0058】
UI提示部46は、受付画面60の修正後分類結果欄66にユーザによって入力された正しい分類結果を受け付ける。UI提示部46は、データ管理DB32に記憶されている文書50のうち、修正の対象となった文書50に対応付けられている分類結果54を、受付画面60により受け付けた正しい分類結果に書き換える。
【0059】
また、UI提示部46は、受付画面60の修正根拠欄68にユーザによって入力された修正根拠を受け付ける。また、UI提示部46は受付画面60の修正根拠単語欄70にユーザによって入力された修正の根拠となる単語を受け付ける。UI提示部46は、受け付けた修正の根拠となる単語を素性抽出テーブル更新部48に出力する。
【0060】
素性抽出テーブル更新部48は、UI提示部46が受け付けた修正根拠に基づいて素性抽出テーブル34を更新する。素性抽出テーブル更新部48は、単語を素性52として追加、単語の組合せを素性52として追加、及び素性52に割り当てられる重み付けを更新することで、素性抽出テーブル34の更新を行う。
【0061】
素性抽出部40はデータ管理DB32から、再学習用データを取得する。再学習用データは、UI提示部46が提示した受付画面60により分類結果54が修正された文書50と、その文書50に対応付けられている分類結果54との組合せである。この場合、再学習用データに含まれる分類結果54は、ユーザによって修正されたことにより正しい分類結果となっている。素性抽出部40は、素性抽出テーブル更新部48により更新された素性抽出テーブル34を参照して、取得した文書50から素性52を抽出する。素性抽出部40は、抽出した素性52に割り当てられている重み付けを用い、素性52をベクトル化する。素性抽出部40は、ベクトル化した素性52と、データ管理DB32から取得した正しい分類結果54とをモデル学習部42に出力する。
【0062】
モデル学習部42は、素性抽出部40から入力された再学習用データである文書50の素性52と、正しい分類結果54とに基づいて、分類モデル37の再学習を行う。本実施形態のモデル学習部42は、ベクトル化された素性52を入力とし、出力が正しい分類結果54となるように、分類モデル37の再学習を行う。なお、再学習の手法は、上述した学習フェーズにおけるモデル学習部42が分類モデル37の学習を行う手法と同様の手法を態様することができる。モデル学習部42は、再学習を行った分類モデル37を分類モデルDB36に格納する。
【0063】
学習装置10が分類モデル37の学習を行う場合、CPU20が再学習プログラム30Cを実行することにより、
図11に示す再学習処理が実行される。再学習処理は、例えば、ユーザにより入力部24を介して実行開始の指示があった場合に実行される。なお、
図11に示した再学習処理は、文書50毎に行われる。
【0064】
図11のステップS300でUI提示部46は、データ管理DB32から、1つの文書50及びその文書50に対応付けられている分類結果54を取得する。具体的には、データ管理DB32に記憶されている複数の文書50のうち、実際に分類モデル37により分類された文書50であり、再学習用データとして用いられていない文書50と、その文書50に対応付けられている分類結果54との組合せを1つ取得する。ここでは、上記と同様に、
図3に示したデータ管理DB32に記憶されている「12478」がIDとして付与されている文書50と分類結果54との組合せをUI提示部46が取得した場合を例として説明する。
【0065】
次のステップS302でUI提示部46は、受付画面60をディスプレイ23に表示させる。本ステップによりディスプレイ23に表示される受付画面60は、
図10に示した表示状態となる。
【0066】
ユーザは、受付画面60に表示された文書50を参照し、分類結果欄64に表示された分類結果を修正すべきか否か判断する。修正を行わない場合、ユーザは入力部24を用いて、修正実施指示ボタン62の非実施指示ボタン62Bを指定する。非実施指示ボタン62Bが指定されたことをUI提示部46が受け付けた場合、次のステップS304の判定が肯定判定となり、
図11に示した再学習処理を終了する。
【0067】
一方、非実施指示ボタン62Bが指定されたことをUI提示部46が受け付けていない場合、ステップS304の判定が否定判定となり、ステップS306へ移行する。分類結果欄64に表示された分類結果54の修正を行う場合、ユーザは、入力部24を用いて、修正後分類結果欄66に、正しい分類結果を入力する。一例として本実施形態では、ユーザは修正後分類結果欄66のプルダウンメニュー66Pから正しい分類結果を選択する。具体的には、ユーザが入力部24を用いてプルダウンメニュー66Pを操作すると、分類結果の候補が表示される。ユーザは、表示された分類結果の候補のうちから、正しい分類結果を、入力部24を用いて選択する。また、ユーザは、入力部24を用いて修正根拠欄68に、修正根拠となるフィールドを入力する。一例として本実施形態では、ユーザは修正根拠欄68のプルダウンメニュー68Pから修正根拠となるフィールドを選択する。具体的には、ユーザが入力部24を用いてプルダウンメニュー68Pを操作すると、修正根拠の候補となる文書50のフィールドが表示される。ユーザは、表示された修正根拠の候補であるフィールドのうちから、修正根拠とするフィールドを、入力部24を用いて選択する。
【0068】
一例として
図12には、修正後分類結果欄66に正しい分類結果として「H/W(HardWare)障害」が入力され、1つ目の修正根拠欄68に修正根拠のフィールドとして「対応結果」が入力され、また2つ目の修正根拠欄68に修正根拠のフィールドとして「OS」が入力された状態が示されている。なお、本実施形態の受付画面60が、修正根拠欄68を2つ表示することにより、修正根拠のフィールドを2つ受け付けることが可能な形態である場合について説明するが、受付画面60により修正根拠として受け付けるフィールドの数は、本実施形態で例示した数に限定されない。
【0069】
そこでステップS306でUI提示部46は、修正後分類結果欄66に入力された正しい分類結果、及び修正根拠欄68に入力された修正根拠を受け付けたか否か判定する。修正後分類結果欄66に入力された正しい分類結果、及び修正根拠欄68に入力された修正根拠を受け付けていない場合、ステップS306の判定が否定判定となり、ステップS304に戻る。一方、修正後分類結果欄66に入力された正しい分類結果、及び修正根拠欄68に入力された修正根拠を受け付けた場合、ステップS306の判定が肯定判定となり、ステップS308へ移行する。
図12に示した例では、UI提示部46は、正しい分類結果として「H/W障害」を受け付け、修正根拠のフィールドとして「対応結果」及び「OS」を受け付ける。
【0070】
次のステップS308でUI提示部46は、修正根拠の文または単語から修正根拠単語の候補を抽出し、修正根拠単語欄70に表示させる。なお、ステップS308及び後述するステップS310の処理は、受け付けた修正根拠のフィールドのタイプがテキストである場合に実行され、受け付けた修正根拠のフィールドのタイプがテキストではない場合、実行されない。そのため、
図12に示した例では、UI提示部46は、受け付けた修正根拠のフィールドのうち、タイプがテキストである「対応結果」についてのみ本ステップの処理を実行し、修正根拠単語の候補を抽出する。
【0071】
UI提示部46は、
図13に示すように、修正根拠として受け付けたフィールドである「対応結果」のテキストである「HDDの交換を実施」との文に対し、形態素解析を行い、形態素と品詞とをペアにした形態素リストを生成する。
図13に示した例では、UI提示部46は、「HDD:名詞」、「の:助詞」、「交換:名詞」、「を:助詞」、及び「実施:名詞」を含む形態素リストを生成する。また、
図13に示すように、UI提示部46は、生成した形態素リストから、助詞及び一般語等を除外したものを修正根拠単語の候補として抽出する。
図13に示した例では、「HDD」、「交換」、及び「実施」が修正根拠単語の候補として抽出される。
【0072】
UI提示部46は、
図14に示すように、抽出した修正根拠単語の候補の各々をチェックボックスつきで修正根拠単語欄70に表示することで、文書50から抽出した修正根拠の候補を選択可能に表示する。ユーザは、入力部24を用いて修正根拠単語欄70のチェックボックスにチェックを行うことにより、修正の根拠とする修正根拠単語を選択する。
図14に示した例では、ユーザにより、「HDD」及び「交換」が選択された場合が示されている。なお、選択する修正根拠単語の数は、特に限定されず、1つであってもよいし、複数であってもよく、また、修正根拠単語欄70に表示されている全ての修正根拠単語であってもよい。UI提示部46は、修正根拠単語欄70に表示された修正根拠単語の候補のうち、チェックボックスにチェックが入った修正根拠単語の候補を修正根拠単語として受け付ける。
【0073】
そこで次のステップS310でUI提示部46は、修正根拠単語の選択を受け付けたか否かを判定する。UI提示部46が修正根拠単語の選択を受け付けるまで、ステップS310の判定が否定判定となる。一方、UI提示部46が修正根拠単語の選択を受け付けた場合、ステップS310の判定が肯定判定となり、ステップS312へ移行する。
【0074】
ユーザはこのように、正しい分類結果の入力、修正根拠及び修正根拠単語の選択を行うと、入力部24を用いて、実施指示ボタン62Aを指定することで分類結果54の修正の実施を指示する。実施指示ボタン62Aが指定された場合、UI提示部46は、分類結果54の修正の実施を受け付ける。
【0075】
UI提示部46が修正の実施を受け付けるまで、ステップS312の判定が否定判定となり、ステップS306に戻り、ステップS306~S310の処理を繰り返す。一方、UI提示部46が修正の実施を受け付けた場合、ステップS312の判定が肯定判定となり、ステップS314へ移行する。
【0076】
ステップS314でUI提示部46は、素性抽出テーブル34に記憶されている分類結果54を、受け付けた正解の分類結果に修正する。上述の例では、IDが「12478」の文書50に対応付けられている分類結果54を、誤りである「S/W不具合」から、正しい分類結果である「H/W障害」に修正する。本処理により、IDが「12478」とされている文書50及び分類結果54の組合せが再学習用データとなる。
【0077】
次のステップS316で素性抽出テーブル更新部48は、UI提示部46が受け付けた修正根拠に基づいて、素性抽出テーブル34を更新する。
図15には、素性抽出テーブル更新部48によって更新された素性抽出テーブル34の一例が示されている。素性抽出テーブル更新部48は、修正根拠単語を選択したフィールドに関しては、そのフィールドにタイプを「追加素性」として、素性の項目に、各修正根拠単語、及び各修正根拠単語の組合せを追加することで素性抽出テーブル34を更新する。上述のように、修正根拠単語として「HDD」及び「交換」を受け付けた場合、
図15に示すように素性抽出テーブル更新部48は、「HDD」、「交換」、及び「HDD 交換(「HDD」と「交換」との組合せ)」の各々を、フィールドを「対応結果」、タイプを「追加素性」として、素性の項目に追加する。
【0078】
また、UI提示部46は、素性抽出テーブル34に素性を追加した場合、その素性に対して重み「1」を割り当てる。なお、追加しようとする素性が既に素性抽出テーブル34に存在する場合、素性抽出テーブル更新部48は、「追加素性」として素性を追加するのに代えて、その素性に割り当てられている重みの値に「1」を加算することで、重みの値のみを更新する。
【0079】
また、UI提示部46が修正根拠として、タイプが名義尺度のフィールドを受け付けた場合、素性抽出テーブル更新部48は、そのフィールドをタイプが「名義尺度」として、素性抽出テーブル34に追加する。上述のように、修正根拠フィールドとして「OS」を受け付けた場合、素性抽出テーブル更新部48は、タイプを「名義尺度」とした「OS」のフィールドを素性抽出テーブル34に追加し、重みの値として「1」を割り当てる。なお、追加しようとするフィールドが既に素性抽出テーブル34に存在する場合、素性抽出テーブル更新部48は、そのフィールドを追加するのに代えて、そのフィールドに割り当てられている重みの値に「1」を加算することで、重みの値のみを更新する。
【0080】
なお、素性抽出テーブル34の更新方法は、本実施形態で説明した方法に限定されない。集積根拠のタイプがテキストの場合、修正根拠として選択された修正根拠単語が新たに素性52として文書50から抽出されるようになる、または、既存の素性52であれば、その素性52の重要度が高くなる方法であればよい。例えば、割り当てるもしくは加算する重みの値は「1」ではなくてもよい。また、修正根拠のタイプが名義尺度である場合、修正根拠として選択されたフィールドが存在することが素性52として追加されるようになる、または、既存のフィールドであれば、そのフィールドの重要度が高くなる方法であればよい。
【0081】
次のステップS318で素性抽出部40は、データ管理DB32から再学習用データである文書50と正しい分類結果54との組合せを取得し、取得した文書50から、更新した素性抽出テーブル34に指定されている要素を素性52として抽出する。素性抽出部40は、抽出した素性52に割り当てられている重み付けを用い、素性52をベクトル化する。素性抽出部40は、ベクトル化した素性52と、データ管理DB32から取得した正しい分類結果54とをモデル学習部42に出力する。
【0082】
次のステップS320でモデル学習部42は、上述したように、ベクトル化された素性52と、正しい分類結果とに基づいて、分類モデル37の再学習を行い、再学習を行った分類モデル37を分類モデルDB36に格納する。ステップS320が終了すると、
図11に示した再学習処理が終了する。
【0083】
なお、再学習処理は、
図11に示した形態に限定されない。例えば、文書50毎に
図11に示した再学習処理を行う形態について説明したが、本形態に限定されない。例えば、ステップS300~S316の処理と、ステップS318及びS320の処理を別のフローとし、所定数の文書50に対して各々の処理を、順次行うようにしてもよい。
【0084】
なお、学習装置10における再学習フェーズは、本実施形態に限定されず、例えば、下記の第2実施形態及び第3実施形態を採用してもよいし、これらの実施形態等を適宜、組み合わせて採用してもよい。なお、下記の第2実施形態及び第3実施形態は、UI提示部46が提示する受付画面60が第1実施形態のUI提示部46が提示する受付画面60と異なっており、これに伴い、再学習処理が各々異なっている。
【0085】
[第2実施形態]
第2実施形態における再学習フェーズについて説明する。具体的には、本実施形態のUI提示部46が提示する受付画面60及び再学習処理について図面を参照して説明する。
図16には、本実施形態のUI提示部46が提示する受付画面60の一例が示されている。なお、
図16では、第1実施形態と同様に
図3に示したデータ管理DB32に記憶されている「12478」がIDとして付与されている文書50の分類結果54を修正する際に提示される受付画面60の初期状態の一例が示されている。
図16に示した受付画面60は、第1実施形態の受付画面60(
図10参照)において含まれていた修正根拠欄68及び修正根拠単語欄70に代えて、修正根拠欄72が含まれている。初期状態では、受付画面60の修正後分類結果欄66、及び修正根拠欄72は空欄となっている。修正根拠欄72は、ユーザが修正根拠を自由文で入力可能な入力欄である。ユーザは、第1実施形態と同様に、修正後分類結果欄66に、正しい分類結果を入力し、その分類結果に修正する修正根拠を自由文で修正根拠欄72に入力する。UI提示部46は、修正根拠欄72に自由文として入力された修正根拠を受け付ける。
【0086】
また、
図17には、本実施形態の学習装置10により実行される再学習処理の一例のフローチャートが示されている。なお、
図17に示した再学習処理のステップS330、S334、S342、S344、S348、及びS350の各々は、第1実施形態の再学習処理(
図11参照)のステップS300、S304、S312、S314、S318、及びS320の各々と同様の処理であるため、詳細な説明を省略する。
【0087】
図17のステップS330でUI提示部46は、データ管理DB32から、1つの文書50及びその文書50に対応付けられている分類結果54を取得する。ここでも、上記と同様に、
図3に示したデータ管理DB32に記憶されている「12478」がIDとして付与されている文書50と分類結果54との組合せをUI提示部46が取得した場合を例として説明する。
【0088】
次のステップS332で、UI提示部46は、受付画面60をディスプレイ23に表示させる。本ステップによりディスプレイ23に表示される受付画面60は、
図16に示した表示状態となる。
【0089】
ユーザにより非実施指示ボタン62Bが指定されたことをUI提示部46が受け付けた場合、次のステップS334の判定が肯定判定となり、
図17に示した再学習処理を終了する。
【0090】
一方、非実施指示ボタン62Bが指定されたことをUI提示部46が受け付けていない場合、ステップS334の判定が否定判定となり、ステップS336へ移行する。分類結果欄64に表示された分類結果54の修正は、第1実施形態と同様に行われる。一方、修正根拠欄72には、ユーザが入力部24を用いて修正根拠を自由文で入力する。一例として
図18には、修正後分類結果欄66に正しい分類結果として「H/W障害」が入力され、修正根拠欄72に修正根拠として「HDDを交換しているから」との自由文が入力された状態が示されている。
【0091】
そこでステップS336でUI提示部46は、修正後分類結果欄66に入力された正しい分類結果、及び修正根拠欄72に入力された修正根拠を受け付けたか否か判定する。修正後分類結果欄66に入力された正しい分類結果、修正根拠欄72に入力された修正根拠を受け付けていない場合、ステップS336の判定が否定判定となり、ステップS334に戻る。一方、修正後分類結果欄66に入力された正しい分類結果、及び修正根拠欄72に入力された修正根拠を受け付けた場合、ステップS336の判定が肯定判定となり、ステップS338へ移行する。
【0092】
次のステップS338でUI提示部46は、上記ステップS330で取得した文書50から修正根拠単語の候補を抽出する。UI提示部46は、
図19に示すように、分類結果を修正する修正対象の文書50に含まれるテキストである「頻繁にWindowsがフリーズするようになったとのこと。HDDの交換を実施」との文に対し、形態素解析を行い、形態素と品詞とをペアにした形態素リストを生成する。
【0093】
図19に示した例では、UI提示部46は、「頻繁:名詞」、「に:助詞」、「Windows:名詞」、「を:助詞」、及び「実施:名詞」等を含む形態素リストを生成する。また、
図19に示すように、UI提示部46は、生成した形態素リストから、助詞及び一般語等を除外したものを修正根拠単語の候補として抽出する。
図19に示した例では、「頻繁」、「Windows」、「フリーズ」、「HDD」、「交換」、及び「実施」が修正根拠単語の候補として抽出される。
【0094】
次のステップS340でUI提示部46は、修正根拠欄72に入力された修正根拠に含まれる修正単語の候補をハイライト表示する。
図20には、修正根拠欄72に入力された修正根拠に含まれる修正単語の候補をハイライト表示した状態の受付画面60の一例が示されている。UI提示部46は、
図19に示すように、抽出した修正根拠単語の候補と、修正根拠欄72に入力された修正根拠である自由文とを比較し、修正根拠である自由文に含まれる、修正根拠単語の候補をハイライト表示する。これにより、
図20に示した例では、修正根拠欄72に入力された「HDDに交換しているから」との自由文のうち、「HDD」及び「交換」がハイライト表示された状態となる。なお、本実施形態では、修正根拠欄72に入力された修正根拠の自由文の中から、修正根拠単語の候補をハイライト表示する形態について説明したが、自由文の中から文書50に含まれる情報を識別可能に表示することができれば、本形態に限定されない。例えば、ハイライト表示に代えて、他と文字の書体や大きさの少なくとも一方を代える、点滅表示させる等、他の単語に比べて強調することにより、自由文の中から文書50に含まれる情報を識別可能に表示してもよい。なお、ここで「識別可能」とは、再学習の際に用いられる情報である旨が識別可能であることを意味する。
【0095】
また、修正根拠欄72に入力された修正根拠の自由文に含まれる修正根拠単語が、既に素性52として素性抽出テーブル34に登録されている場合、その修正根拠単語については、登録されていない修正根拠単語と表示色を変える等して、識別可能に表示してもよい。また、この場合、割り当てられている重みの値の大きさに応じて、色が濃くなる等、表示色により重みの値の大小について識別を可能としてもよい。このように、修正根拠欄72に入力された修正根拠の自由文に含まれる修正根拠単語の表示を行うことにより、ハイライト表示された単語が、分類モデル37の再学習において、どの程度、重視されるかを確認することができる。
【0096】
ユーザは、修正根拠欄72に入力された修正根拠の自由文に対して施されたハイライト表示を参照することで、素性抽出テーブル34に素性52として追加される、若しくは重みの値が更新される単語を認識することができる。そのため、例えば、修正根拠欄72に入力された修正根拠の自由文に対してハイライト表示が施されない場合、素性抽出テーブル34が更新されることがないため、入力した自由文を変更等することができるようになる。
【0097】
ユーザは、正しい分類結果の入力、修正根拠を自由文で入力すると、入力部24を用いて、実施指示ボタン62Aを指定することで分類結果54の修正の実施を指示する。実施指示ボタン62Aが指定された場合、UI提示部46は、分類結果54の修正の実施を受け付ける。
【0098】
UI提示部46が修正の実施を受け付けるまで、ステップS342の判定が否定判定となり、ステップS336に戻り、ステップS336~S340の処理を繰り返す。一方、UI提示部46が修正の実施を受け付けた場合、ステップS342の判定が肯定判定となり、ステップS344へ移行する。
【0099】
ステップS344でUI提示部46は、素性抽出テーブル34に記憶されている分類結果54を、受け付けた正解の分類結果に修正し、再学習用データとする。
【0100】
次のステップS346で素性抽出テーブル更新部48は、ハイライト表示を行った修正根拠単語に基づいて、素性抽出テーブル34を更新する。なお、素性抽出テーブル更新部48の更新方法は、第1実施形態の素性抽出テーブル更新部48が、タイプを「追加素性」として、素性の項目に素性を追加し、その素性に割り当てられている重みの値を更新する方法と同様としているため、説明を省略する。
【0101】
次のステップS348で素性抽出部40は、データ管理DB32から再学習用データを取得し、取得した文書50から、更新した素性抽出テーブル34に指定されている要素を素性52として抽出し、割り当てられている重み付けを用い、素性52をベクトル化する。
【0102】
次のステップS350でモデル学習部42は、上述したように、ベクトル化された素性52と、正しい分類結果とに基づいて、分類モデル37の再学習を行い、再学習を行った分類モデル37を分類モデルDB36に格納する。ステップS320が終了すると、
図17に示した再学習処理が終了する。
【0103】
なお、
図17に示した再学習処理のステップS338及びS340の処理は、受付画面60の表示中、所定のタイミングが経過する毎に適宜繰り返し行うようにしてもよい。すなわち、ユーザが修正根拠欄72に修正根拠を自由文で入力している間にも、適宜、その自由文に対してハイライト表示を行ってもよい。また、上述した受付画面60に代えて、
図21に示す受付画面60のように、修正根拠欄72に確認ボタン73を設け、確認ボタン73がユーザによって指示された場合に、修正根拠欄72に入力された修正根拠の自由文に対してハイライト表示を行う形態としてもよい。
【0104】
[第3実施形態]
第3実施形態における再学習フェーズについて説明する。具体的には、本実施形態のUI提示部46が提示する受付画面60及び再学習処理について図面を参照して説明する。
図22には、本実施形態のUI提示部46が提示する受付画面60の一例が示されている。なお、
図22では、第1実施形態と同様に
図3に示したデータ管理DB32に記憶されている「12478」がIDとして付与されている文書50の分類結果54を修正する際に提示される受付画面60の初期状態の一例が示されている。
図22に示した受付画面60は、第1実施形態の受付画面60(
図10参照)において含まれていた修正根拠欄68及び修正根拠単語欄70に代えて、修正根拠欄74が含まれている。初期状態では、受付画面60の修正後分類結果欄66は空欄となっている。一方、修正根拠欄74には、文書50から抽出された修正根拠文候補がチェックボックス付きで表示され、ユーザにより修正根拠文の選択が可能とされている。ユーザは、第1実施形態と同様に、修正後分類結果欄66に、正しい分類結果を入力し、その分類結果に修正する修正根拠となる修正根拠文を修正根拠欄72に表示された修正根拠文候補から選択する。UI提示部46は、修正根拠欄72に自由文として入力された修正根拠を受け付ける。
【0105】
また、
図23には、本実施形態の学習装置10により実行される再学習処理の一例のフローチャートが示されている。なお、
図23に示した再学習処理のステップS360、S364、S372、S374、S378、及びS380の各々は、第1実施形態の再学習処理(
図11参照)のステップS300、S304、S312、S314、S318、及びS320の各々と同様の処理であるため、詳細な説明を省略する。
【0106】
図23のステップS360でUI提示部46は、データ管理DB32から、1つの文書50及びその文書50に対応付けられている分類結果54を取得する。ここでも、上記と同様に、
図3に示したデータ管理DB32に記憶されている「12478」がIDとして付与されている文書50と分類結果54との組合せをUI提示部46が取得した場合を例として説明する。
【0107】
次のステップS361でUI提示部46は、上記ステップS360で取得した文書50から、修正根拠文候補を抽出する。一例として本実施形態のUI提示部46は、文書50のうちタイプがテキストであるフィールドについては、そのテキストを、単文に分割し、分割した単文毎に、修正根拠文候補とする。なお、本開示において「文」とは、1つの単語のみを含む、いわゆる単語文も含む。
図22に示した例では、文書50のうち、「題名」のフィールドからは「端末のフリーズ」が修正根拠文候補として抽出される。また、文書50のうち、「説明」のフィールドからは「頻繁にWindowsがフリーズするようになったとのこと。」が修正根拠文候補として抽出される。また、文書50のうち「対応結果」のフィールドからは「HDDの交換を実施。」が修正根拠文候補として抽出される。
【0108】
また、UI提示部46は、文書50のうちタイプが名義尺度であるフィールドについては、文書50に含まれるそのフィールドの記述を修正根拠文候補とする。
図22に示した例では、文書50のうち「機種名」のフィールドからは「Desket」が修正根拠文候補として抽出される。また、文書50のうち「OS」のフィールドからは「Windows10」が修正根拠文候補として抽出される。
【0109】
次のステップS362で、UI提示部46は、受付画面60をディスプレイ23に表示させる。本ステップによりディスプレイ23に表示される受付画面60は、
図22に示した表示状態となる。
【0110】
ユーザにより非実施指示ボタン62Bが指定されたことをUI提示部46が受け付けた場合、次のステップS364の判定が肯定判定となり、
図23に示した再学習処理を終了する。
【0111】
一方、非実施指示ボタン62Bが指定されたことをUI提示部46が受け付けていない場合、ステップS364の判定が否定判定となり、ステップS366へ移行する。分類結果欄64に表示された分類結果54の修正は、第1実施形態と同様に行われる。一方、修正根拠文の選択は、修正根拠欄74に表示された修正根拠文候補のうちから、修正根拠として選択する修正根拠文候補に対応するチェックボックスに、ユーザが入力部24を用いてチェックすることで行われる。一例として
図24には、修正後分類結果欄66に正しい分類結果として「H/W障害」が入力され、修正根拠欄74に表示された修正根拠文候補のうち「HDDを交換しているから」が修正根拠文として選択された状態が示されている。なお、ユーザが選択する修正根拠文の数は、特に限定されず、1つであってもよいし、複数であってもよく、また、修正根拠欄74に表示されている全ての修正根拠文候補を選択してもよい。
【0112】
そこでステップS366でUI提示部46は、修正後分類結果欄66に入力された正しい分類結果、及び修正根拠欄文の選択を受け付けたか否か判定する。修正後分類結果欄66に入力された正しい分類結果、修正根拠文の選択を受け付けていない場合、ステップS366の判定が否定判定となり、ステップS364に戻る。一方、修正後分類結果欄66に入力された正しい分類結果、及び修正根拠文の選択を受け付けた場合、ステップS366の判定が肯定判定となり、ステップS372へ移行する。
【0113】
ユーザは、正しい分類結果の入力、修正根拠文の選択を行うと、入力部24を用いて、実施指示ボタン62Aを指定することで分類結果54の修正の実施を指示する。実施指示ボタン62Aが指定された場合、UI提示部46は、分類結果54の修正の実施を受け付ける。
【0114】
UI提示部46が修正の実施を受け付けるまで、ステップS372の判定が否定判定となり、ステップS366に戻る。一方、UI提示部46が修正の実施を受け付けた場合、ステップS372の判定が肯定判定となり、ステップS374へ移行する。
【0115】
ステップS374でUI提示部46は、素性抽出テーブル34に記憶されている分類結果54を、受け付けた正解の分類結果に修正し、再学習用データとする。
【0116】
次のステップS375でUI提示部46は、受け付けた修正根拠文に基づいて、文書50から修正根拠単語を抽出する。UI提示部46は、受け付けた修正根拠文に対応するフィールドのタイプがテキストである場合、修正根拠文に対し、形態素解析を行い、形態素と品詞とをペアにした形態素リストを生成する。
図25に示した例では、修正根拠文の「HDDの交換を実施」であり、対応するフィールドが「対応結果」であり、そのタイプがテキストであるため、「HDDの交換を実施」との文に対し、形態素解析を行い、形態素と品詞とをペアにした形態素リストを生成する。
【0117】
図25に示した例では、UI提示部46は、「HDD:名詞」、「の:助詞」、「交換:名詞」、「を:助詞」、及び「実施:名詞」を含む形態素リストを生成する。また、
図25に示すように、UI提示部46は、生成した形態素リストから、助詞及び一般語等を除外したものを修正根拠単語として抽出する。
図25に示した例では、「HDD」、「交換」、及び「実施」が修正根拠単語として抽出される。
【0118】
次のステップS376で素性抽出テーブル更新部48は、抽出した修正根拠単語に基づいて、素性抽出テーブル34を更新する。なお、素性抽出テーブル更新部48の更新方法は、第1実施形態の素性抽出テーブル更新部48が、タイプを「追加素性」として、素性の項目に素性を追加し、その素性に割り当てられている重みの値を更新する方法と同様としているため、説明を省略する。
【0119】
なお、修正根拠欄74に表示された修正根拠文の候補から、タイプが名義尺度とされているフィールドを選択した場合、上記ステップS375の処理を実施せず、第1実施形態において上述したように、取り得る値の有無を素性として追加することで素性抽出テーブル34を更新してもよい。
【0120】
次のステップS378で素性抽出部40は、データ管理DB32から再学習用データを取得し、取得した文書50から、更新した素性抽出テーブル34に指定されている要素を素性52として抽出し、割り当てられている重み付けを用い、素性52をベクトル化する。
【0121】
次のステップS380でモデル学習部42は、上述したように、ベクトル化された素性52と、正しい分類結果とに基づいて、分類モデル37の再学習を行い、再学習を行った分類モデル37を分類モデルDB36に格納する。ステップS380が終了すると、
図23に示した再学習処理が終了する。
【0122】
なお、上述した受付画面60に代えて、
図26に示す受付画面60のように、プルダウンメニュー68Pが設けられた修正根拠欄68が含まれていてもよい。この場合、第1実施形態の受付画面60に含まれる修正根拠欄68と同様に、UI提示部46は、ユーザにより選択された修正根拠となるフィールドを受け付ける。そして、受け付けたフィールドに対応するテキスト文を修正根拠文として選択可能に、修正根拠欄74に表示させる。
図26に示した例では、UI提示部46は、修正根拠文として、対応結果のフィールドに対応する「頻繁にWindowsがフリーズする。」との文と、説明のフィールドに対応する「HDDの交換を実施」との文とを修正根拠文として受け付ける。また、タイプが名義尺度である「OS」を修正根拠として受け付ける。
【0123】
以上説明したように、上記形態の学習装置10は、素性抽出テーブル34を参照して文書50から抽出された素性52を入力とし、文書50が属するカテゴリを分類結果54として出力する分類モデル37を再学習させる学習装置である。学習装置10は、CPU20を含み、CPU20は、分類結果54の誤りを修正する修正指示として正しい分類結果と、文書50に含まれる情報に基づく修正根拠として修正根拠単語の入力を受け付ける受付画面60を提示する。CPU20は、正しい分類結果と修正根拠とが受け付けられた場合において、修正根拠に基づいて素性抽出テーブル34を更新し、かつ、修正された正しい分類結果と更新後の素性抽出テーブル34とを用いて分類モデル37を再学習させる。
【0124】
このように、本実施形態の学習装置10では、ユーザが入力した修正根拠に基づいて、素性抽出テーブル34を更新し、更新後の素性抽出テーブル34を用いて再学習を行うため、分類モデル37の分類精度をより向上させることができる。
【0125】
なお、上記各実施形態では、素性52として単語を扱う形態について説明したが、素性52として単語以外を扱う形態としてもよいし、単語に加えてその他のものも扱う形態としてもよい。単語以外としては、例えば、文書50に、例えば、エラーコードのように、それ自体が一般的な意味を有さない文字列が含まれる場合は、そのような文字列を素性52として扱ってもよい。また例えば、文書50に、記号が含まれる場合、その記号を素性52として扱ってもよい。また例えば、素性抽出テーブル34に文書50に関連する画像が含まれる場合、その画像を素性52として扱い、分類モデル37に、文書50から抽出された素性52に加えて素性52として扱う画像を入力する形態としてもよい。
【0126】
また、上記各実施形態では、文書50の意味内容が機械の故障の状況を表し、分類結果のカテゴリに、故障の原因が含まれる形態について説明したが、文書50の意味内容や、分類結果のカテゴリはこれらに限定されない。例えば、文書50が患者のカルテや状態を表し、分類結果のカテゴリを病名としてもよい。
また、上記各実施形態の受付画面60では、文書50及び分類結果欄64が含まれる形態について説明したが、これらを含むことは必須ではない。例えば、文書50、分類結果欄64、及び修正実施指示ボタン62を1つの画面に表示させ、実施指示ボタン62Aがユーザによって指定され、UI提示部46が修正の実施指示を受け付けた場合に、文書50及び分類結果欄64を含まない受付画面60に遷移する形態としてもよい。
また、受付画面60は1つのディスプレイ23に表示させてもよいし、複数のディスプレイ23に表示させてもよい。すなわち、ディスプレイ23として、マルチディスプレイを採用してもよい。
また、上記各実施形態では、学習装置10が分類モデル37の学習、運用、及び再学習を行う形態について説明したが、各々について、別装置が実行する形態であってもよい。
【0127】
また、上記形態において、例えば、素性抽出部40、モデル学習部42、分類予測部44、UI提示部46、及び素性抽出テーブル更新部48といった各種の処理を実行する処理部(processing unit)のハードウェア的な構造としては、次に示す各種のプロセッサ(processor)を用いることができる。上記各種のプロセッサには、前述したように、ソフトウェア(プログラム)を実行して各種の処理部として機能する汎用的なプロセッサであるCPUに加えて、FPGA(Field Programmable Gate Array)等の製造後に回路構成を変更可能なプロセッサであるプログラマブルロジックデバイス(Programmable Logic Device:PLD)、ASIC(Application Specific Integrated Circuit)等の特定の処理を実行させるために専用に設計された回路構成を有するプロセッサである専用電気回路等が含まれる。
【0128】
1つの処理部は、これらの各種のプロセッサのうちの1つで構成されてもよいし、同種又は異種の2つ以上のプロセッサの組み合わせ(例えば、複数のFPGAの組み合わせや、CPUとFPGAとの組み合わせ)で構成されてもよい。また、複数の処理部を1つのプロセッサで構成してもよい。
【0129】
複数の処理部を1つのプロセッサで構成する例としては、第1に、クライアント及びサーバ等のコンピュータに代表されるように、1つ以上のCPUとソフトウェアの組み合わせで1つのプロセッサを構成し、このプロセッサが複数の処理部として機能する形態がある。第2に、システムオンチップ(System On Chip:SoC)等に代表されるように、複数の処理部を含むシステム全体の機能を1つのIC(Integrated Circuit)チップで実現するプロセッサを使用する形態がある。このように、各種の処理部は、ハードウェア的な構造として、上記各種のプロセッサの1つ以上を用いて構成される。
【0130】
更に、これらの各種のプロセッサのハードウェア的な構造としては、より具体的には、半導体素子などの回路素子を組み合わせた電気回路(circuitry)を用いることができる。
【0131】
また、上記各実施形態では、学習プログラム30A、分類プログラム30B、及び再学習プログラム30Cの各々が記憶部22に予め記憶(インストール)されている態様を説明したが、これに限定されない。学習プログラム30A、分類プログラム30B、及び再学習プログラム30Cの各々は、CD-ROM(Compact Disc Read Only Memory)、DVD-ROM(Digital Versatile Disc Read Only Memory)、及びUSB(Universal Serial Bus)メモリ等の記録媒体に記録された形態で提供されてもよい。また、学習プログラム30A、分類プログラム30B、及び再学習プログラム30Cの各々は、ネットワークを介して外部装置からダウンロードされる形態としてもよい。つまり、本実施形態で説明したプログラム(プログラム製品)は、記録媒体で提供するほか、外部のコンピュータから配信する形態であっても良い。
【0132】
以上の上記実施形態に関し、更に以下の付記を開示する。
【0133】
(付記1)
素性抽出テーブルを参照して文書から抽出された素性を入力とし、前記文書が属するカテゴリを分類結果として出力する分類モデルを再学習させる学習装置であって、
少なくとも1つのプロセッサを含み、
前記プロセッサは、
前記分類結果の誤りを修正する修正指示と、前記文書に含まれる情報に基づく修正根拠との入力を受け付ける受付画面を提示し、
前記修正指示と前記修正根拠とが受け付けられた場合において、
前記修正根拠に基づいて前記素性抽出テーブルを更新し、かつ、修正された正しい分類結果と更新後の前記素性抽出テーブルとを用いて前記分類モデルを再学習させる
学習装置。
【0134】
(付記2)
前記素性抽出テーブルの項目には、素性として抽出すべき単語、または素性として抽出すべき単語及び前記単語毎に割り当てられる重みが少なくとも含まれる
付記1に記載の学習装置。
【0135】
(付記3)
前記プロセッサは、
前記修正根拠に基づいて、前記素性抽出テーブルの前記項目のうちの少なくとも1つを更新する、
付記2に記載の学習装置。
【0136】
(付記4)
前記更新は、前記修正根拠に含まれる単語の追加である、
付記1から付記3のいずれか1つに記載の学習装置。
【0137】
(付記5)
前記更新は、前記修正根拠に含まれる単語に割り当てられる前記重みの更新である、
付記1から付記4のいずれか1つに記載の学習装置。
【0138】
(付記6)
前記プロセッサは、
前記受付画面に、前記文書から抽出した前記修正根拠の候補を選択可能に表示し、
前記候補を選択させることにより前記修正根拠の入力を受け付ける
付記1から付記5のいずれか1つに記載の学習装置。
【0139】
(付記7)
前記プロセッサは、
前記修正根拠の候補として、前記文書から少なくとも単語を抽出する、
付記6に記載の学習装置。
【0140】
(付記8)
前記プロセッサは、
前記修正根拠の候補として、前記単語に加えて、文を抽出し、
前記受付画面に、抽出した前記単語と前記文を混在させて表示する
付記7に記載の学習装置。
【0141】
(付記9)
前記受付画面は、ユーザが前記修正根拠を自由文で入力可能な入力欄を有しており、
前記プロセッサは、
入力された前記自由文の中から、前記文書に含まれる情報を識別可能に表示する
付記1から付記5のいずれか1つに記載の学習装置。
【0142】
(付記10)
前記プロセッサは、
前記文書に含まれる情報を強調することにより識別可能に表示する
付記9に記載の学習装置。
【0143】
(付記11)
前記文書の意味内容が機械の故障の状況を表す場合において、前記カテゴリには、前記故障の原因が含まれる、
付記1から付記10のいずれか1つに記載の学習装置。
【0144】
(付記12)
前記受付画面は、前記文書と前記分類結果とを表示する表示領域を含む
付記1から付記11のいずれか1つに記載の学習装置。
【0145】
(付記13)
前記素性抽出テーブルには、前記文書に関連する画像が含まれ、
前記分類モデルには、前記文書から抽出された素性に加えて前記画像が素性として入力される
付記1から付記12のいずれか1つに記載の学習装置。
【0146】
(付記14)
前記文書には記号が含まれ、前記素性抽出テーブルの項目には、素性として抽出すべき記号が少なくとも含まれる
付記1から付記13のいずれか1つに記載の学習装置。
【0147】
(付記15)
少なくとも1つのプロセッサを含み、
前記プロセッサは、
素性抽出テーブルを参照して文書から抽出された素性を入力とし、前記文書が属するカテゴリを分類結果として出力する分類モデルに過去に入力された文書を表示し、
前記過去に入力された文書に応じて前記分類モデルから出力された分類結果を表示し、
表示された分類結果の誤りを修正する修正指示を受け付け、
前記修正指示の根拠となる修正根拠を受け付け、
受け付けられた修正指示と修正根拠とを用いて、再学習する、
学習装置。
【0148】
(付記16)
素性抽出テーブルを参照して文書から抽出された素性を入力とし、前記文書が属するカテゴリを分類結果として出力する分類モデルを再学習させる学習装置が備えるプロセッサにより、
前記分類結果の誤りを修正する修正指示と、前記文書に含まれる情報に基づく修正根拠との入力を受け付ける受付画面を提示し、
前記修正指示と前記修正根拠とが受け付けられた場合において、
前記修正根拠に基づいて前記素性抽出テーブルを更新し、かつ、修正された正しい分類結果と更新後の前記素性抽出テーブルとを用いて前記分類モデルを再学習させる
処理を実行する学習方法。
【0149】
(付記17)
素性抽出テーブルを参照して文書から抽出された素性を入力とし、前記文書が属するカテゴリを分類結果として出力する分類モデルに過去に入力された文書を表示するステップと、
前記過去に入力された文書に応じて前記分類モデルから出力された分類結果を表示するステップと、
表示された分類結果の誤りを修正する修正指示を受け付けるステップと、
前記修正指示の根拠となる修正根拠を受け付けるステップと、
受け付けられた修正指示と修正根拠とを用いて、再学習するステップと、
を含む学習方法。
【0150】
(付記18)
素性抽出テーブルを参照して文書から抽出された素性を入力とし、前記文書が属するカテゴリを分類結果として出力する分類モデルを再学習させる学習装置が備えるプロセッサに、
前記分類結果の誤りを修正する修正指示と、前記文書に含まれる情報に基づく修正根拠との入力を受け付ける受付画面を提示し、
前記修正指示と前記修正根拠とが受け付けられた場合において、
前記修正根拠に基づいて前記素性抽出テーブルを更新し、かつ、修正された正しい分類結果と更新後の前記素性抽出テーブルとを用いて前記分類モデルを再学習させる
処理を実行させるための学習プログラム。
【符号の説明】
【0151】
10 学習装置
20 CPU
21 メモリ
22 記憶部
23 ディスプレイ
24 入力部
26 ネットワークI/F
29 バス
30A 学習プログラム、30B 分類プログラム、30C 再学習プログラム
32 データ管理DB
34 素性抽出テーブル
36 分類モデルDB
37 分類モデル
40 素性抽出部
42 モデル学習部
44 分類予測部
46 UI提示部
48 素性抽出テーブル更新部
50 文書
52 素性
54 分類結果
60 受付画面
62 修正実施指示ボタン、62A 実施指示ボタン、62B 非実施指示ボタン
64 分類結果欄
66 修正後分類結果欄、66P プルダウンメニュー
68 修正根拠欄、68P プルダウンメニュー
70 修正根拠単語欄
72、74 修正根拠欄
73 確認ボタン