(19)【発行国】日本国特許庁(JP)
(12)【公報種別】公開特許公報(A)
(11)【公開番号】P2023130960
(43)【公開日】2023-09-21
(54)【発明の名称】情報処理プログラム、装置、及び方法
(51)【国際特許分類】
G06N 20/10 20190101AFI20230913BHJP
【FI】
G06N20/10
【審査請求】未請求
【請求項の数】9
【出願形態】OL
(21)【出願番号】P 2022035575
(22)【出願日】2022-03-08
(71)【出願人】
【識別番号】000005223
【氏名又は名称】富士通株式会社
(74)【代理人】
【識別番号】110001519
【氏名又は名称】弁理士法人太陽国際特許事務所
(72)【発明者】
【氏名】河東 孝
(72)【発明者】
【氏名】上村 健人
(72)【発明者】
【氏名】安富 優
(57)【要約】 (修正有)
【課題】学習データセットが存在しない場合でも、対象データセットから分類モデルにおける未知クラスのデータを検出する情報処理プログラム、装置及び方法を提供する。
【解決手段】情報処理装置10は、学習データセットを用いて学習済みの分類モデル20であって、入力されたデータを複数のクラスのいずれかに分類する分類モデル20を、学習データセットとは異なる対象データセットに基づき再学習する場合の分類モデルの分類基準の変化に対する寄与度が所定基準以上の1以上のデータを対象データセットから特定する特定部12と、特定された1以上のデータのうち、対象データセットに基づく再学習による分類基準の変化により分類モデル20に対する損失が減少するデータを、複数のクラスに含まれない未知クラスのデータとして検出する検出部14と、を有する。
【選択図】
図1
【特許請求の範囲】
【請求項1】
第1データセットを用いて学習済みの分類モデルであって、入力されたデータを複数のクラスのいずれかに分類する分類モデルを、前記第1データセットとは異なる第2データセットに基づき再学習する場合の前記分類モデルの分類基準の変化に対する寄与度が所定基準以上の1以上のデータを前記第2データセットから特定し、
特定された前記1以上のデータのうち、前記第2データセットに基づく再学習による前記分類基準の変化により前記分類モデルに対する損失が減少するデータを、前記複数のクラスに含まれない未知クラスのデータとして検出する
ことを含む処理をコンピュータに実行させるための情報処理プログラム。
【請求項2】
前記分類基準は、前記分類モデルの各クラスの境界を示す決定平面を特定する重みである請求項1記載の情報処理プログラム。
【請求項3】
前記第2データセットに基づき再学習する場合の前記分類モデルの分類基準の更新量を減少させるように前記第2データセットに含まれるデータの各々を移動させる場合の移動量を前記寄与度として算出する請求項1又は請求項2に記載の情報処理プログラム。
【請求項4】
特定された前記1以上のデータの各々を、前記第2データセットに基づく再学習による前記分類基準の変化を抑制する方向に移動させる場合に、前記損失の増加量がプラスのデータを、前記未知クラスのデータとして検出する請求項1~請求項3のいずれか1項に記載の情報処理プログラム。
【請求項5】
前記分類モデルが微分可能なモデルの場合、前記損失に対する前記分類基準の第1勾配の大きさを前記更新量として算出し、前記第1勾配の大きさに対する前記第2データセットに含まれるデータの各々の第2勾配の大きさを、前記移動量として算出する請求項3に記載の情報処理プログラム。
【請求項6】
前記第2勾配と、前記損失に対する前記1以上のデータの各々の第3勾配との内積がプラスとなるデータを、前記未知クラスのデータとして検出する請求項5に記載の情報処理プログラム。
【請求項7】
前記分類モデルによる、前記第2データセットに含まれる各データの分類結果に基づいて、前記第2データセットに含まれる各データに正解を付与し、前記分類モデルによる、前記第2データセットに含まれる各データの分類結果と前記正解との誤差を前記損失として算出する請求項1~請求項6のいずれか1項に記載の情報処理プログラム。
【請求項8】
第1データセットを用いて学習済みの分類モデルであって、入力されたデータを複数のクラスのいずれかに分類する分類モデルを、前記第1データセットとは異なる第2データセットに基づき再学習する場合の前記分類モデルの分類基準の変化に対する寄与度が所定基準以上の1以上のデータを前記第2データセットから特定する特定部と、
特定された前記1以上のデータのうち、前記第2データセットに基づく再学習による前記分類基準の変化により前記分類モデルに対する損失が減少するデータを、前記複数のクラスに含まれない未知クラスのデータとして検出する検出部と、
を含む情報処理装置。
【請求項9】
第1データセットを用いて学習済みの分類モデルであって、入力されたデータを複数のクラスのいずれかに分類する分類モデルを、前記第1データセットとは異なる第2データセットに基づき再学習する場合の前記分類モデルの分類基準の変化に対する寄与度が所定基準以上の1以上のデータを前記第2データセットから特定し、
特定された前記1以上のデータのうち、前記第2データセットに基づく再学習による前記分類基準の変化により前記分類モデルに対する損失が減少するデータを、前記複数のクラスに含まれない未知クラスのデータとして検出する
ことを含む処理をコンピュータが実行する情報処理方法。
【発明の詳細な説明】
【技術分野】
【0001】
開示の技術は、情報処理プログラム、情報処理装置、及び情報処理方法に関する。
【背景技術】
【0002】
入力されたデータを複数のクラスのいずれかに分類する分類モデルに入力されるデータに含まれる、学習に用いた学習データに含まれないクラスのデータを、未知クラスのデータとして検出するオープンセット認識(open set recognition)という技術が存在する。この技術の応用例としては、例えば、学習データに含まれないクラスのデータが分類モデルに入力された場合にエラーを返すことで、分類モデルの誤検出による深刻な問題が発生する前に処理を中断することが考えられる。また、他の応用例として、学習済みのクラスと未学習のクラスとを分割し、未学習のクラスのデータに対してのみラベル付けを行い、専用の分類モデルを作成することで逐次学習を実現することが考えられる。
【0003】
オープンセット認識に関する技術として、例えば、新たな対象データが未知の分類の対象データであるか否かを判定する情報処理装置が提案されている。この情報処理装置は、新たな対象データから特徴を抽出して特徴データを生成する。また、この情報処理装置は、分類済み対象データ及び新たな対象データからなる対象データの集合を、分類済み対象データ及び新たな対象データの特徴データに基づいて、分類済み対象データが分類されている分類の数+1のクラスタにクラスタリングする。そして、情報処理装置は、クラスタリングの結果、新たな対象データのみを含むクラスタが現れた場合に、新たな対象データの分類を問い合わせるための出力を行う。
【先行技術文献】
【特許文献】
【0004】
【発明の概要】
【発明が解決しようとする課題】
【0005】
機械学習済みの分類モデルの適用時には、その分類モデルの機械学習に利用した学習データが残っていない場合がある。例えば、顧客データを用いたビジネスの場では、ある顧客データを長期に保持したり、その顧客データを用いた機械学習済みの分類モデルを別の顧客のタスクに使い回したりすることは、契約上や情報漏えいのリスクの観点から認められない場合が多い。そして、分類モデルの機械学習後、学習データを返却し、分類モデルのみを保持する場合がある。このような場合、従来技術の方法では、適用時のデータセットから未知クラスのデータを検出することができない。
【0006】
一つの側面として、開示の技術は、学習データセットが存在しない場合でも、対象データセットから分類モデルにおける未知クラスのデータを検出することを目的とする。
【課題を解決するための手段】
【0007】
一つの態様として、開示の技術において、分類モデルは、第1データセットを用いて学習済みの分類モデルであって、入力されたデータを複数のクラスのいずれかに分類する分類モデルである。開示の技術は、分類モデルを、前記第1データセットとは異なる第2データセットに基づき再学習する場合の前記分類モデルの分類基準の変化に対する寄与度が所定基準以上の1以上のデータを前記第2データセットから特定する。そして、開示の技術は、特定された前記1以上のデータのうち、前記第2データセットに基づく再学習による前記分類基準の変化により前記分類モデルに対する損失が減少するデータを、前記複数のクラスに含まれない未知クラスのデータとして検出する。
【発明の効果】
【0008】
一つの側面として、学習データセットが存在しない場合でも、対象データセットから分類モデルにおける未知クラスのデータを検出することができる、という効果を有する。
【図面の簡単な説明】
【0009】
【
図2】オープンセット認識を説明するための図である。
【
図3】再学習前後の分類モデルの変化に基づいて未知クラスのデータを検出する場合を説明するための図である。
【
図4】再学習前後の分類モデルの変化に基づいて未知クラスのデータを検出する場合の問題点を説明するための図である。
【
図5】本実施形態の概要を説明するための図である。
【
図8】重みの更新量の算出を説明するための図である。
【
図10】未知クラスのデータの検出を説明するための図である。
【
図11】情報処理装置として機能するコンピュータの概略構成を示すブロック図である。
【
図12】情報処理の一例を示すフローチャートである。
【
図13】情報処理の具体例を説明するための図である。
【
図14】情報処理の具体例を説明するための図である。
【
図15】情報処理の具体例を説明するための図である。
【
図16】情報処理の具体例を説明するための図である。
【
図17】情報処理の具体例を説明するための図である。
【
図18】情報処理の具体例を説明するための図である。
【
図19】情報処理の具体例を説明するための図である。
【発明を実施するための形態】
【0010】
以下、図面を参照して、開示の技術に係る実施形態の一例を説明する。
【0011】
図1に示すように、本実施形態に係る情報処理装置10には、入力されたデータを複数のクラスのいずれかに分類する機械学習済みの分類モデル20が記憶されている。分類モデル20は、学習データセットを用いて学習されたモデルである。また、情報処理装置10には、学習データセットとは異なる対象データセットが入力される。対象データセットは、例えば、分類モデル20を利用したシステムの適用時に入力されるデータセットとしてよい。そして、情報処理装置10は、対象データセットから、学習データセットに含まれないクラス、いわゆる未知クラスのデータを検出し、検出結果を出力する。なお、学習データセットは、開示の技術の第1データセットの一例であり、対象データセットは、開示の技術の第2データセットの一例である。
【0012】
ここで、一般的なオープンセット認識の手法について説明する。
図2に示すように、オープンセット認識では、学習データを特徴空間に射影し、特徴空間を複数の部分空間に分割する。特徴空間の作成及び分割は、既知のクラスラベル等を用いた2値分類器を複数組み合わせることで実現する場合が多い。
図2の例では、学習データに基づいて、クラス1とクラス2及び3とを分割する境界(
図2中のA)、クラス2とクラス1及び3とを分割する境界(
図2中のB)、及びクラス3とクラス1及び2とを分割する境界(
図2中のC)により特徴空間を分割している。また、
図2では、網掛で示す部分は既知クラスの部分空間であり、白地で示す部分は未知クラスの部分空間である。そして、適用時に、既知クラスの部分空間に属さない対象データが未知クラスのデータとして検出される。
【0013】
上記の一般的なオープンセット認識の手法では、分類モデルの作成時に、適用時において未知クラスが入力されることを想定し、特別な手法で分類モデルを学習する必要がある。また、適用データに未知クラスのデータが含まれる場合には、未知クラスを想定しない通常の学習で作成された分類モデルを流用して、分類モデルを再学習することも考えられる。しかし、分類モデルの適用時には、学習データセットを返却しているなどして、手元に学習データセットが存在しない場合がある。このような場合、適用時の対象データセットに含まれる対象データのうち、いずれが未知クラスのデータであるかを判定することができないため、分類モデルの再学習を実行することができない。
【0014】
手元に学習データセットが存在せず、その学習データセットで学習された分類モデルが存在する場合、分類モデルと、対象データセットとに基づいて、対象データセットから未知クラスのデータを検出することが考えられる。
【0015】
例えば、対象データセットで分類モデルを再学習した場合において、
図3に示すように、再学習前後での分類モデルにおける各クラスの境界を示す決定平面の変化が大きくなる場合には、学習データセットと対象データセットとの差異も大きい可能性が高い。そこで、
図3のAに示すように、再学習した場合にどの程度分類モデルが変化しそうかを見積もる。具体的には、対象データセットに対する損失が現在の分類モデルの重みに与える影響を示す指標を用いて、再学習した場合に分類モデルが変化するか否かを判定する。そして、
図3のBに示すように、個々の対象データを移動させて、再学習する場合の分類モデルの変化を打ち消すことを考えた場合、移動量が大きくなる対象データを、未知クラスのデータとして検出することが考えられる。
【0016】
しかし、分類モデルの変化を打ち消すように対象データを移動させる場合、
図4に示すように、実際の未知クラスのデータ(
図4中の黒丸)だけでなく、分類モデルの変化が大きい部分の近傍の、既知クラスの対象データの移動量も大きくなる場合がある。この場合、未知クラスのデータを精度良く検出することができない。
【0017】
そこで、本実施形態では、対象データセットで再学習する場合の分類モデルの変化に対する対象データの性質の違いに基づいて、未知クラスのデータを検出する。具体的には、
図5に示すように、未知クラスのデータを含む対象データには、以下のような性質(1)を持つデータと、性質(2)を持つデータとが存在する。なお、下記の損失は、対象データと決定平面との距離が近いほど大きくなる値である。
(1)分類モデルの変化により損失が増加するデータ
(分類モデルの変化を抑制する方向に移動させる場合に損失が増加するデータ)
(2)分類モデルの変化により損失が減少するデータ
(分類モデルの変化を抑制する方向に移動させる場合に損失が減少するデータ)
【0018】
未知クラスのデータは、上記の性質(2)を持つデータである。本実施形態では、このことを利用して、未知クラスのデータを精度良く検出する。以下、本実施形態に係る情報処理装置の機能部について詳述する。
【0019】
情報処理装置10は、機能的には、
図1に示すように、特定部12と、検出部14とを含む。
【0020】
特定部12は、対象データセットに基づき再学習する場合の、分類モデル20の決定平面を特定する重みの変化に対する寄与度が所定基準以上の1以上の対象データを、対象データセットから特定する。なお、重みは、開示の技術の分類基準の一例である。具体的には、特定部12は、対象データセットに基づき再学習する場合の分類モデル20の重みの更新量を減少させるように対象データセットに含まれる対象データの各々を移動させる場合の移動量を寄与度として算出する。
【0021】
より具体的には、
図6に示すように、分類モデル20は、学習データセットに含まれる学習データの各々を入力データxとして分類モデル20に入力した場合の損失Lの合計ΣLを最小化するように重みwが最適化されている。損失Lは、分類モデル20の出力y’と、学習データに付与されている正解のラベルyとの分類誤差である。
【0022】
特定部12は、
図7に示すように、対象データセットに含まれる対象データの各々を入力データxとして分類モデル20に入力した場合の、出力y’と正解のラベルyとの分類誤差である損失Lの合計ΣLを算出する。特定部12は、出力y’に基づくラベルを、対象データの正解ラベルyとして用いてよい。具体的には、出力y’が、入力データが分類モデル20で分類可能な各クラスに属する確率であるとする。この場合、特定部12は、対象データ(入力データx)に対する出力y’が示す確率が最大のクラスを示すラベルを、その対象データについての正解ラベルyとしてよい。
【0023】
また、特定部12は、分類モデル20の変化を表す指標として、損失の合計ΣLに対する重みの更新量|Δw|を算出する。また、特定部12は、分類モデル20が、ニューラルネットワークのような微分可能なモデルの場合、対象データセットに対する分類モデル20の損失が重みに与える影響を示す勾配の大きさを更新量として算出してもよい。具体的には、特定部12は、
図8に示すように、分類モデル20の重みwの、損失の合計ΣLに対する勾配∇wLをbackpropagationで求め、勾配の大きさ|∇wL|を算出する。
【0024】
また、特定部12は、個々の対象データ(入力データx)を動かして、重みの更新量|Δw|を減少させる場合の対象データの移動量|Δx|を、対象データセットで再学習した場合の分類モデル20の変化への寄与度とみなす。そして、特定部12は、移動量が予め定めた閾値以上の対象データを特定する。また、特定部12は、分類モデル20が微分可能なモデルの場合、損失に対する重みの勾配の大きさに対する対象データの各々の勾配の大きさを、移動量として算出してもよい。具体的には、特定部12は、
図9に示すように、勾配の大きさ|∇wL|に対する対象データ(入力データx)の勾配∇x|∇wL|及びその大きさ|∇x|∇wL||を個々の対象データについて算出する。算出には、backpropagation(double backpropagation)を適用してよい。
【0025】
検出部14は、特定部12により特定された1以上のデータのうち、対象データセットに基づく再学習による重みの変化により分類モデル20に対する損失が減少する対象データを、未知クラスのデータとして検出する。具体的には、検出部14は、特定された1以上の対象データの各々を、再学習による分類モデル20の変化を抑制する方向に移動させる場合に、損失の増加量がプラスとなる対象データを、未知クラスのデータとして検出する。
【0026】
より具体的には、検出部14は、
図10に示すように、損失の合計ΣLに対する対象データ(入力データx)の勾配∇xLをbackpropagationで求める。そして、検出部14は、特定部12により特定された対象データのうち、勾配∇x|∇wL|及び勾配∇xLが正の対象データを、未知クラスのデータとして検出する。また、特定部12は、勾配∇x|∇wL|と勾配∇xLとの内積がプラスとなる対象データを、未知クラスのデータとして検出してもよい。検出部14は、検出した未知クラスのデータを検出結果として出力する。
【0027】
情報処理装置10は、例えば
図11に示すコンピュータ40で実現されてよい。コンピュータ40は、CPU(Central Processing Unit)41と、一時記憶領域としてのメモリ42と、不揮発性の記憶部43とを備える。また、コンピュータ40は、入力部、表示部等の入出力装置44と、記憶媒体49に対するデータの読み込み及び書き込みを制御するR/W(Read/Write)部45とを備える。また、コンピュータ40は、インターネット等のネットワークに接続される通信I/F(Interface)46を備える。CPU41、メモリ42、記憶部43、入出力装置44、R/W部45、及び通信I/F46は、バス47を介して互いに接続される。
【0028】
記憶部43は、HDD(Hard Disk Drive)、SSD(Solid State Drive)、フラッシュメモリ等によって実現されてよい。記憶媒体としての記憶部43には、コンピュータ40を、情報処理装置10として機能させるための情報処理プログラム50が記憶される。情報処理プログラム50は、特定プロセス52と、検出プロセス54とを有する。また、記憶部43は、分類モデル20を構成する情報が記憶される情報記憶領域60を有する。
【0029】
CPU41は、情報処理プログラム50を記憶部43から読み出してメモリ42に展開し、情報処理プログラム50が有するプロセスを順次実行する。CPU41は、特定プロセス52を実行することで、
図1に示す特定部12として動作する。また、CPU41は、検出プロセス54を実行することで、
図1に示す検出部14として動作する。また、CPU41は、情報記憶領域60から情報を読み出して、分類モデル20をメモリ42に展開する。これにより、情報処理プログラム50を実行したコンピュータ40が、情報処理装置10として機能することになる。なお、プログラムを実行するCPU41はハードウェアである。
【0030】
なお、情報処理プログラム50により実現される機能は、例えば半導体集積回路、より詳しくはASIC(Application Specific Integrated Circuit)等で実現することも可能である。
【0031】
次に、本実施形態に係る情報処理装置10の作用について説明する。学習データセットによる機械学習済みの分類モデル20が情報処理装置10に記憶され、情報処理装置10に対象データセットが入力されると、情報処理装置10において、
図12に示す情報処理が実行される。なお、情報処理は、開示の技術の情報処理方法の一例である。
【0032】
ステップS10で、特定部12が、情報処理装置10に入力された対象データセットを取得する。次に、ステップS12で、特定部12が、対象データセットに含まれる各対象データを分類モデル20に入力して得られる出力に基づいて、対象データにラベル付けする。そして、特定部12が、対象データセットに含まれる対象データの各々を分類モデル20に入力した場合の出力と正解のラベルとの分類誤差である損失の合計を算出し、損失の合計に対する分類モデル20の重みの更新量を算出する。
【0033】
次に、ステップS14で、特定部12が、算出した重みの更新量を減少させるように対象データセットに含まれる対象データの各々を移動させる場合の移動量を算出する。次に、ステップS16で、特定部12が、算出した移動量が所定の閾値以上の対象データを特定する。閾値は、予め定めた値であってもよいし、移動量が大きい順に所定個の対象データを検出するような値を動的に定めてもよい。
【0034】
次に、ステップS18で、検出部14が、特定された対象データの各々について、再学習による分類モデル20の変化を抑制する方向に移動させる場合の損失の増加量を算出する。次に、ステップS20で、検出部14が、算出した損失の増加量がプラスとなる対象データを、未知クラスのデータとして検出する。次に、ステップS22で、検出部14が、検出結果を出力し、情報処理は終了する。
【0035】
次に、簡易な例を用いて上記情報処理をより具体的に説明する。
【0036】
図13に示すように、2次元平面上の点p=(x,y)からの距離が1となる平面を決定平面とし、pからの距離が1未満のデータを正例、1以上のデータを負例と分類するモデルを分類モデル20とする。この分類モデル20の学習では、以下の損失の合計ΣLを最小化する。
ΣL=Σ
iexp((||p-a
i||-1)c
i)/N
ただし、a
iはi番目の学習データの2次元座標、c
iはi番目の学習データのラベル(正例:1、負例:-1)、Nは学習データセットに含まれる学習データの数である。また、
図14に、pからの距離dに応じた学習データ毎の損失を示す。
【0037】
この分類モデル20における重みはpである。
図15に示すように、学習データセットを用いた機械学習により最適化されたpが(-0.5,0.0)であったとする。また、対象データセットに、以下の対象データa1、a2、及びa3が含まれるとする。
a1=(0.0,0.0)
a2=(1.0,0.0)
a3=(0.0,1.0)
【0038】
この場合、
図16に示すように、a1に正例、a2及びa3に負例のラベルが付与される。特定部12が、分類モデル20に対してこれらの対象データを入力した場合の損失Lに対する重みpの更新量として、重みpの勾配の大きさを||(0.13,0.26)||=0.30と算出する。
図17に示すように、重みpの勾配は、対象データにより分類モデル20が再学習される場合、pが変化しようとする向き及び大きさを表すベクトルである。なお、
図17では、勾配の-5倍を図示している。そして、特定部12が、重みpの勾配の大きさに対する各対象データの勾配及びその大きさを、下記に示すように算出する。
a1:||(-0.09,-0.36)||=0.37
a2:||(-0.09,0.12)||=0.15
a3:||(-0.13,-0.26)||=0.30
【0039】
図18に示すように、重みpの勾配の大きさに対する各対象データの勾配は、pの変化を抑制する場合に、対象データが移動しようとする向き及び大きさを表すベクトルである。なお、
図18では、勾配の-3倍を図示している。この場合において、例えば、閾値=0.2とすると、特定部12が、対象データa1及びa3を、未知クラスのデータの候補として特定する。
【0040】
そして、検出部14が、損失Lに対する各対象データの勾配を、下記に示すように算出する。
a1:(0.20,0.00)
a2:(-0.20,0.00)
a3:(-0.13,-0.26)
【0041】
図19に示すように、損失Lに対する各対象データの勾配は、損失を小さくするように対象データが移動しようとする向き及び大きさを表すベクトルである。なお、
図19では、勾配の-3倍を図示している。また、
図19では、未知クラスのデータの候補ではない対象データa2についても合わせて表記している。
【0042】
検出部14は、重みpの勾配の大きさに対する各対象データの勾配と、損失Lに対する各対象データの勾配との内積を、未知クラスのデータの候補毎に算出する。
a1:(-0.09,-0.36)・(0.20,0.00)
=-0.018≦0
a3:(-0.13,-0.26)・(-0.13,-0.26)
=0.085>0
この場合、検出部14が、内積がプラスの対象データa3を、未知クラスのデータとして検出する。これにより、対象データセットで再学習する場合の分類モデル20の変化への寄与度が大きく、かつ分類モデル20の変化により損失が減少するデータ、すなわち、上述の性質(2)を持つデータを、未知クラスのデータとして検出することができる。
【0043】
以上説明したように、本実施形態に係る情報処理装置は、学習データセットを用いて学習済みの分類モデルを対象データセットに基づき再学習する場合の変化に対する寄与度が所定基準以上の1以上のデータを対象データセットから特定する。そして、情報処理装置は、特定された1以上のデータのうち、分類モデルの変化により損失が減少するデータを、未知クラスのデータとして検出する。これにより、学習データセットが存在しない場合でも、対象データセットから分類モデルにおける未知クラスのデータを検出することができる。
【0044】
なお、上記実施形態では、情報処理プログラムが記憶部に予め記憶(インストール)されている態様を説明したが、これに限定されない。開示の技術に係るプログラムは、CD-ROM、DVD-ROM、USBメモリ等の記憶媒体に記憶された形態で提供することも可能である。
【0045】
以上の実施形態に関し、さらに以下の付記を開示する。
【0046】
(付記1)
第1データセットを用いて学習済みの分類モデルであって、入力されたデータを複数のクラスのいずれかに分類する分類モデルを、前記第1データセットとは異なる第2データセットに基づき再学習する場合の前記分類モデルの分類基準の変化に対する寄与度が所定基準以上の1以上のデータを前記第2データセットから特定し、
特定された前記1以上のデータのうち、前記第2データセットに基づく再学習による前記分類基準の変化により前記分類モデルに対する損失が減少するデータを、前記複数のクラスに含まれない未知クラスのデータとして検出する
ことを含む処理をコンピュータに実行させるための情報処理プログラム。
【0047】
(付記2)
前記分類基準は、前記分類モデルの各クラスの境界を示す決定平面を特定する重みである付記1記載の情報処理プログラム。
【0048】
(付記3)
前記第2データセットに基づき再学習する場合の前記分類モデルの分類基準の更新量を減少させるように前記第2データセットに含まれるデータの各々を移動させる場合の移動量を前記寄与度として算出する付記1又は付記2に記載の情報処理プログラム。
【0049】
(付記4)
特定された前記1以上のデータの各々を、前記第2データセットに基づく再学習による前記分類基準の変化を抑制する方向に移動させる場合に、前記損失の増加量がプラスのデータを、前記未知クラスのデータとして検出する付記1~付記3のいずれか1項に記載の情報処理プログラム。
【0050】
(付記5)
前記分類モデルが微分可能なモデルの場合、前記損失に対する前記分類基準の第1勾配の大きさを前記更新量として算出し、前記第1勾配の大きさに対する前記第2データセットに含まれるデータの各々の第2勾配の大きさを、前記移動量として算出する付記3に記載の情報処理プログラム。
【0051】
(付記6)
前記第2勾配と、前記損失に対する前記1以上のデータの各々の第3勾配との内積がプラスとなるデータを、前記未知クラスのデータとして検出する付記5に記載の情報処理プログラム。
【0052】
(付記7)
前記分類モデルによる、前記第2データセットに含まれる各データの分類結果に基づいて、前記第2データセットに含まれる各データに正解を付与し、前記分類モデルによる、前記第2データセットに含まれる各データの分類結果と前記正解との誤差を前記損失として算出する付記1~付記6のいずれか1項に記載の情報処理プログラム。
【0053】
(付記8)
第1データセットを用いて学習済みの分類モデルであって、入力されたデータを複数のクラスのいずれかに分類する分類モデルを、前記第1データセットとは異なる第2データセットに基づき再学習する場合の前記分類モデルの分類基準の変化に対する寄与度が所定基準以上の1以上のデータを前記第2データセットから特定する特定部と、
特定された前記1以上のデータのうち、前記第2データセットに基づく再学習による前記分類基準の変化により前記分類モデルに対する損失が減少するデータを、前記複数のクラスに含まれない未知クラスのデータとして検出する検出部と、
を含む情報処理装置。
【0054】
(付記9)
前記分類基準は、前記分類モデルの各クラスの境界を示す決定平面を特定する重みである付記8記載の情報処理装置。
【0055】
(付記10)
前記特定部は、前記第2データセットに基づき再学習する場合の前記分類モデルの分類基準の更新量を減少させるように前記第2データセットに含まれるデータの各々を移動させる場合の移動量を前記寄与度として算出する付記8又は付記9に記載の情報処理装置。
【0056】
(付記11)
前記検出部は、特定された前記1以上のデータの各々を、前記第2データセットに基づく再学習による前記分類基準の変化を抑制する方向に移動させる場合に、前記損失の増加量がプラスのデータを、前記未知クラスのデータとして検出する付記8~付記10のいずれか1項に記載の情報処理装置。
【0057】
(付記12)
前記特定部は、前記分類モデルが微分可能なモデルの場合、前記損失に対する前記分類基準の第1勾配の大きさを前記更新量として算出し、前記第1勾配の大きさに対する前記第2データセットに含まれるデータの各々の第2勾配の大きさを、前記移動量として算出する付記10に記載の情報処理装置。
【0058】
(付記13)
前記検出部は、前記第2勾配と、前記損失に対する前記1以上のデータの各々の第3勾配との内積がプラスとなるデータを、前記未知クラスのデータとして検出する付記12に記載の情報処理装置。
【0059】
(付記14)
前記特定部は、前記分類モデルによる、前記第2データセットに含まれる各データの分類結果に基づいて、前記第2データセットに含まれる各データに正解を付与し、前記分類モデルによる、前記第2データセットに含まれる各データの分類結果と前記正解との誤差を前記損失として算出する付記8~付記13のいずれか1項に記載の情報処理装置。
【0060】
(付記15)
第1データセットを用いて学習済みの分類モデルであって、入力されたデータを複数のクラスのいずれかに分類する分類モデルを、前記第1データセットとは異なる第2データセットに基づき再学習する場合の前記分類モデルの分類基準の変化に対する寄与度が所定基準以上の1以上のデータを前記第2データセットから特定し、
特定された前記1以上のデータのうち、前記第2データセットに基づく再学習による前記分類基準の変化により前記分類モデルに対する損失が減少するデータを、前記複数のクラスに含まれない未知クラスのデータとして検出する
ことを含む処理をコンピュータが実行する情報処理方法。
【0061】
(付記16)
前記分類基準は、前記分類モデルの各クラスの境界を示す決定平面を特定する重みである付記15記載の情報処理方法。
【0062】
(付記17)
前記第2データセットに基づき再学習する場合の前記分類モデルの分類基準の更新量を減少させるように前記第2データセットに含まれるデータの各々を移動させる場合の移動量を前記寄与度として算出する付記15又は付記16に記載の情報処理方法。
【0063】
(付記18)
特定された前記1以上のデータの各々を、前記第2データセットに基づく再学習による前記分類基準の変化を抑制する方向に移動させる場合に、前記損失の増加量がプラスのデータを、前記未知クラスのデータとして検出する付記15~付記17のいずれか1項に記載の情報処理方法。
【0064】
(付記19)
前記分類モデルが微分可能なモデルの場合、前記損失に対する前記分類基準の第1勾配の大きさを前記更新量として算出し、前記第1勾配の大きさに対する前記第2データセットに含まれるデータの各々の第2勾配の大きさを、前記移動量として算出する付記17に記載の情報処理方法。
【0065】
(付記20)
第1データセットを用いて学習済みの分類モデルであって、入力されたデータを複数のクラスのいずれかに分類する分類モデルを、前記第1データセットとは異なる第2データセットに基づき再学習する場合の前記分類モデルの分類基準の変化に対する寄与度が所定基準以上の1以上のデータを前記第2データセットから特定し、
特定された前記1以上のデータのうち、前記第2データセットに基づく再学習による前記分類基準の変化により前記分類モデルに対する損失が減少するデータを、前記複数のクラスに含まれない未知クラスのデータとして検出する
ことを含む処理をコンピュータに実行させるための情報処理プログラムを記憶した非一時的記憶媒体。
【符号の説明】
【0066】
10 情報処理装置
12 特定部
14 検出部
20 分類モデル
40 コンピュータ
41 CPU
42 メモリ
43 記憶部
44 入出力装置
45 R/W部
46 通信I/F
47 バス
49 記憶媒体
50 情報処理プログラム
52 算出プロセス
54 判定プロセス
56 検出プロセス
60 情報記憶領域