IP Force 特許公報掲載プロジェクト 2022.1.31 β版

知財求人 - 知財ポータルサイト「IP Force」

▶ 日本電気株式会社の特許一覧

特許7593473互換性評価装置、互換性評価方法、及び、プログラム
<>
  • 特許-互換性評価装置、互換性評価方法、及び、プログラム 図1
  • 特許-互換性評価装置、互換性評価方法、及び、プログラム 図2
  • 特許-互換性評価装置、互換性評価方法、及び、プログラム 図3
  • 特許-互換性評価装置、互換性評価方法、及び、プログラム 図4
  • 特許-互換性評価装置、互換性評価方法、及び、プログラム 図5
  • 特許-互換性評価装置、互換性評価方法、及び、プログラム 図6
  • 特許-互換性評価装置、互換性評価方法、及び、プログラム 図7
< >
(19)【発行国】日本国特許庁(JP)
(12)【公報種別】特許公報(B2)
(11)【特許番号】
(24)【登録日】2024-11-25
(45)【発行日】2024-12-03
(54)【発明の名称】互換性評価装置、互換性評価方法、及び、プログラム
(51)【国際特許分類】
   G06N 20/00 20190101AFI20241126BHJP
【FI】
G06N20/00
【請求項の数】 8
(21)【出願番号】P 2023503257
(86)(22)【出願日】2021-03-03
(86)【国際出願番号】 JP2021008149
(87)【国際公開番号】W WO2022185444
(87)【国際公開日】2022-09-09
【審査請求日】2023-08-16
(73)【特許権者】
【識別番号】000004237
【氏名又は名称】日本電気株式会社
(74)【代理人】
【識別番号】100107331
【弁理士】
【氏名又は名称】中村 聡延
(74)【代理人】
【識別番号】100104765
【弁理士】
【氏名又は名称】江上 達夫
(74)【代理人】
【識別番号】100131015
【弁理士】
【氏名又は名称】三輪 浩誉
(72)【発明者】
【氏名】坂井 智哉
【審査官】坂庭 剛史
(56)【参考文献】
【文献】特開2020-004178(JP,A)
【文献】米国特許第8296257(US,B1)
【文献】SRIVASTAVA, Megha et al.,An Empirical Analysis of Backward Compatibility in Machine Learning Systems,arXiv.org [online],米国,Cornell University,2020年08月11日,[検索日: 2021.04.23], pp.1-9,インターネット<URL:https://arxiv.org/pdf/2008.04572.pdf>
(58)【調査した分野】(Int.Cl.,DB名)
G06N 20/00
(57)【特許請求の範囲】
【請求項1】
評価データに対する第1の予測器及び第2の予測器の出力を取得する取得手段と、
前記第1の予測器の出力と前記第2の予測器の出力との関係を示す複数の関係式の組み合わせにより規定される一般化後方互換性指標を決定する指標決定手段と、
前記第1の予測器の出力と、前記第2の予測器の出力と、前記一般化後方互換性指標とを用いて、前記第1の予測器と前記第2の予測器との互換性を示すスコアを算出する演算手段と、
を備える互換性評価装置。
【請求項2】
前記一般化後方互換性指標は、重み付けされた複数の関係式の四則演算により表される請求項1記載の互換性評価装置。
【請求項3】
互換性指標の指定を受け取る指定手段を備え、
前記指標決定手段は、前記指定に基づいて前記複数の関係式の各々に対する重みを設定して、前記一般化後方互換性指標から評価用指標を決定し、
前記演算手段は、前記評価用指標を用いて前記スコアを算出する請求項2に記載の互換性評価装置。
【請求項4】
前記関係式は、
前記第1の予測器の出力と前記第2の予測器の出力が共に正解である割合を示す第1式と、
前記第1の予測器の出力と前記第2の予測器の出力が共に不正解である割合を示す第2式と、
前記第1の予測器の出力が不正解であり、前記第2の予測器の出力が正解である割合を示す第3式と、
前記第1の予測器の出力が正解であり、前記第2の予測器の出力が不正解である割合を示す第4式と、を含む請求項1乃至3のいずれか一項に記載の互換性評価装置。
【請求項5】
前記第1の予測器及び前記第2の予測器は回帰分析を行い、
前記演算手段は、前記第1の予測器及び前記第2の予測器の出力である予測値と、当該予測値に対応する実績値との差が所定の閾値以下である場合、当該出力は正解であるとみなし、前記差が前記閾値より大きい場合、当該出力は不正解であるとみなす請求項4に記載の互換性評価装置。
【請求項6】
前記関係式は、2つの評価データに対する前記第1の予測器の出力の大小関係、及び、前記2つの評価データに対する前記第2の予測器の出力の大小関係を示し、
前記演算手段は、前記第1の予測器の出力の大小関係と、前記第2の予測器の出力の大小関係とが一致する期待値を前記スコアとして算出する請求項1に記載の互換性評価装置。
【請求項7】
コンピュータにより実行される互換性評価方法であって、
評価データに対する第1の予測器及び第2の予測器の出力を取得し、
前記第1の予測器の出力と前記第2の予測器の出力との関係を示す複数の関係式の組み合わせにより規定される一般化後方互換性指標を決定し、
前記第1の予測器の出力と、前記第2の予測器の出力と、前記一般化後方互換性指標とを用いて、前記第1の予測器と前記第2の予測器との互換性を示すスコアを算出する互換性評価方法。
【請求項8】
評価データに対する第1の予測器及び第2の予測器の出力を取得し、
前記第1の予測器の出力と前記第2の予測器の出力との関係を示す複数の関係式の組み合わせにより規定される一般化後方互換性指標を決定し、
前記第1の予測器の出力と、前記第2の予測器の出力と、前記一般化後方互換性指標とを用いて、前記第1の予測器と前記第2の予測器との互換性を示すスコアを算出する処理をコンピュータに実行させるプログラム。
【発明の詳細な説明】
【技術分野】
【0001】
本開示は、予測器を評価する技術に関する。
【背景技術】
【0002】
AI(Artificial Intelligence)の運用においては、環境の変化などに対してAIの性能を適応、向上させるため、新たなデータを用いて再学習を行い、AIを更新することが必須である。AIを更新する際には、更新後のAIの精度が更新前より向上することが求められる。特許文献1は、機械学習により生成したモデルの更新に際し、モデルの改悪を低減する手法を開示している。また、特許文献2は、予測モデルの再学習時に、再学習の前後の予測モデルの構造の近さを、予測モデルの性質の近さとして評価する手法を開示している。
【先行技術文献】
【特許文献】
【0003】
【文献】特開2019-204190号公報
【文献】国際公開WO2016/151618号公報
【発明の概要】
【発明が解決しようとする課題】
【0004】
AIの更新により精度が向上した場合であっても、更新の前後でAIの挙動が違ってくることがある。例えば、運用中のAIが正解できるデータを更新後のAIが正解できないという現象が起こりうる。この場合、更新後のAIの癖を把握するのにAI運用者が労力や時間を費やす必要が生じたり、AIの予測に対する業務運用に変更が必要となったりすることもある。
【0005】
本開示の1つの目的は、予測器の互換性を評価する手法を提供することにある。
【課題を解決するための手段】
【0006】
本開示の一つの観点では、互換性評価装置は、
評価データに対する第1の予測器及び第2の予測器の出力を取得する取得手段と、
前記第1の予測器の出力と前記第2の予測器の出力との関係を示す複数の関係式の組み合わせにより規定される一般化後方互換性指標を決定する指標決定手段と、
前記第1の予測器の出力と、前記第2の予測器の出力と、前記一般化後方互換性指標とを用いて、前記第1の予測器と前記第2の予測器との互換性を示すスコアを算出する演算手段と、を備える。
【0007】
本開示の他の観点では、互換性評価方法は、
評価データに対する第1の予測器及び第2の予測器の出力を取得し、
前記第1の予測器の出力と前記第2の予測器の出力との関係を示す複数の関係式の組み合わせにより規定される一般化後方互換性指標を決定し、
前記第1の予測器の出力と、前記第2の予測器の出力と、前記一般化後方互換性指標とを用いて、前記第1の予測器と前記第2の予測器との互換性を示すスコアを算出する。
【0008】
本開示のさらに他の観点では、プログラムは、
評価データに対する第1の予測器及び第2の予測器の出力を取得し、
前記第1の予測器の出力と前記第2の予測器の出力との関係を示す複数の関係式の組み合わせにより規定される一般化後方互換性指標を決定し、
前記第1の予測器の出力と、前記第2の予測器の出力と、前記一般化後方互換性指標とを用いて、前記第1の予測器と前記第2の予測器との互換性を示すスコアを算出する処理をコンピュータに実行させる。
【発明の効果】
【0009】
本開示によれば、予測器の互換性を評価することができる。
【図面の簡単な説明】
【0010】
図1】更新前AIと更新後AIの評価データに対する予測結果の例を示す。
図2】第1実施形態に係る互換性評価装置の全体構成を示すブロック図である。
図3】第1実施形態に係る互換性評価装置のハードウェア構成を示すブロック図である。
図4】第1実施形態に係る互換性評価装置の機能構成を示すブロック図である。
図5】第1実施形態の互換性評価処理のフローチャートである。
図6】第2実施形態に係る互換性評価装置の機能構成を示すブロック図である。
図7】第2実施形態に係る互換性評価装置による処理のフローチャートである。
【発明を実施するための形態】
【0011】
以下、図面を参照して、本開示の好適な実施形態について説明する。
<互換性評価指標>
(予測器の互換性)
新たなデータを用いてAIの更新(再学習)を行う場合、精度が向上するように更新を行うが、その際にAIの互換性が問題となる。互換性とは、更新前AIの正解/不正解と、更新後AIの正解/不正解との一致度合いを言う。
【0012】
互換性を示す指標の1つとして、後方信頼互換(Backward Trust Compatibility;BTC)スコア(以降、「BTC」と呼ぶ。)がある。BTCは、更新前AIが正解できるデータを、更新後AIも正解できる割合を言い、BTCが高いと、互換性が高いとされる。
【0013】
図1は、更新前AIと、2つの更新後AIの評価データに対する予測結果の例を示す。更新前AIは現在運用中のAIである。2つの更新後AIは、更新前AIを再学習して得たAIであるが、ハイパーパラメータを変えるなどして生成した異なるAIである。図1において、チェックマークは予測結果が正解であることを示す。
【0014】
図示のように、更新前AIは、評価データ1~7のうち4つを正解しており、精度は4/7である。これに対し、第1の更新後AIと第2の更新後AIは共に精度が5/7であり、更新前AIよりも精度が向上している。一方で、第1の更新後AIは、更新前AIが正解していた4つの評価データのうち星印(★)で示す3つの評価データを正解しており、BTCスコアは3/4である。これに対し、第2の更新後AIは、更新前AIが正解していた4つの評価データのうち2つしか正解できておらず、BTCスコアは2/4である。よって、2つの更新後AIは精度が同一であるが、互換性(BTCスコア)が高い第1の更新後AIの方が良いと評価される。
【0015】
互換性を示す別の指標として、後方誤り互換(Backward Error Compatibility;BEC)スコア(以降、「BEC」と呼ぶ。)がある。BECは、更新後AIが間違えるデータを更新前AIも間違える割合であり、BECスコアが高いと、互換性が高いとされる。
【0016】
このように、再学習によりAIを更新する際には、精度のみならず、更新前AIとの互換性を考慮する必要がある。以下では、様々なタスクに適用することができる一般化後方互換性指標を提案する。
【0017】
(一般化後方互換性指標)
一般化後方互換性指標は、前述のBTCやBECなどの互換性指標を一般化した指標である。以下に、一般化後方互換性指標の例を説明する。
【0018】
(第1例)
第1例は、最も基本的な一般化後方互換性指標の例である。予測器h及び入出力の組(X,Y)を、
【数1】
とすると、第1例の一般化後方互換性(Generalized Backward Compatibility;GBC)スコアは、以下のような線形分数指標により定義される。
【0019】
【数2】
上記の式(1)は、評価データに対する予測器hの出力と予測器hの出力との間の関係を示す4つの関係式CC(h,h)、EC(h,h)、IC(h,h)、IC(h,h)を含む。「a」、「a00」、「a01」、「a10」、「a11」、「b」、「b00」、「b01」、「b10」、「b11」はそれぞれ係数(重み)である。
【0020】
4つの関係式は以下の意味を有する。
・CC(Correct Compatibility)(h,h)は、全評価データのうち、予測器hが正解を出力し、予測器hが正解を出力する評価データが占める割合を示す。
・EC(Error Compatibility)(h,h)は、全評価データのうち、予測器hが不正解を出力し、予測器hが不正解を出力する評価データが占める割合を示す。
・IC(Imcompatibility-1)(h,h)は、全評価データのうち、予測器hが正解を出力し、予測器hが不正解を出力する評価データが占める割合を示す。
・IC(Imcompatibility-2)(h,h)は、全評価データのうち、予測器hが不正解を出力し、予測器hが正解を出力する評価データが占める割合を示す。
【0021】
具体的に、上記4つの関係式は以下のように与えられる。
【数3】
【0022】
式(1)において、係数a11、b10、b11を「1」に設定し、他の係数を「0」に設定すると、式(1)のGBCスコアはBTCスコアと一致する。よって、上記のGBCはBTCを包含している。
【0023】
また、式(1)において、係数a00、b00、b10を「1」に設定し、他の係数を「0」に設定すると、式(1)のGBCスコアはBECスコアと一致する。よって、上記のGBCはBECを包含している。
【0024】
このように、上記の一般化後方互換性指標(GBC)を利用すると、式(1)の係数(重み)を変更することにより、予測器のタスクに応じて適切な互換性指標を定義することができる。
【0025】
次に、第1例のGBCを用いたスコアの計算式の例を示す。いま、入力を以下のように設定する。
【数4】
【0026】
GBCスコアの推定値GBCは、以下の式で与えられる。なお、便宜上、文字「X」の上に「」を付した記号を「X」と表記する。
【数5】
【0027】
なお、各関係式CC、EC、IC 、IC は、式(2)~(5)における期待値を標本平均に置き換え、以下の式で与えられる。
【数6】
【0028】
(第2例)
上記の第1例では、式(1)に示すように、4つの関係式CC、EC、IC、ICに対して係数(重み)を設定している。これに対し、第2例では予測器h、hが予測するクラスy毎に係数(重み)を設定する。第2例に係るGBCスコアは以下の式で与えられる。
【0029】
【数7】
また、4つの関係式は以下のように与えられる。
【0030】
【数8】
なお、式(11)において、a11=a11,1=・・・=a11,|y|というように重みを一定にすると、第1例の式(1)と一致する。
【0031】
第2例のGBCでは、線形分数式で表せる既存の様々な二値分類指標を後方互換性の文脈で構成することが可能となる。例えば、式(11)に示すGBCの重みを調整し、不均衡二値分類に有効な互換性指標を構成することができる。互換性を考慮しない場合、二値分類Y∈{0,1}におけるF値(Y=1が正クラス、Y=0が負クラス)は以下のようになる。
【0032】
【数9】
このF値は、不均衡二値分類において、データが少ない正クラスを重視する精度の指標となる。
【0033】
一方、互換性を考慮したF値(「BC-F」と呼ぶ。)は、GBCにおいて、a11,1=b11,1=2、b11,0=b00,1=1とし、残りの係数を「0」とすると、以下のようになる。
【数10】
このBC-F値は、不均衡二値分類において、データが少ない正クラスを重視する互換性の指標となる。このように、GBCの重みを調整することにより、様々な二値分類における互換性指標を生成することができる。
【0034】
(第3例)
第3例は、第1例や第2例のような線形分数式以外の互換性指標の例である。二値分類において、更新前の予測器のスコアランキングが更新後の予測器でも一致して欲しいタスクを考える。予測器が実数を「-1」と「+1」に割り当てるものとすると、以下のような互換性指標が得られる。
【0035】
【数11】
【0036】
この互換性指標は、正解が「+1」の評価データXと、正解が「-1」の評価データX’を入力したときの更新前の予測器の出力の大小関係を示す関係式
【数12】
と、更新後の予測器の出力の大小関係を示す関係式
【数13】
を含み、更新前のX、X’に対する出力の大小関係が更新後にも維持される期待値がGBCスコアとして得られる。即ち、GBCスコアは、入力に対する更新前後の予測器の出力傾向が一致しているか否かを示す値となる。この互換性指標では、AUC(Area under the ROC curve)のような効果が見込まれる。
【0037】
(回帰タスクへの適用)
上記の第1例及び第2例では、予測器が分類タスクを実行するものとしているが、回帰タスクを実行する予測器に対してもGBCを適用することができる。その場合には、評価データに対して予測器が出力する予測値と、その評価データに対応する実績値との差が予め定めた閾値以下であれば予測値は正解であるとみなし、閾値より大きければ予測値は不正解であるとみなして、第1例又は第2例のGBCを適用すればよい。
【0038】
<第1実施形態>
[全体構成]
図2は、第1実施形態に係る互換性評価装置の全体構成を示すブロック図である。互換性評価装置100は、2つの予測器の互換性を評価し、互換性スコアを出力する。図示のように、2つの予測器h、hには同一の評価データが入力される。典型的な例では、予測器hは現在運用中の予測器、即ち、更新前予測器であり、予測器hは更新後予測器である。
【0039】
予測器h及び予測器hは、入力された評価データに対する予測値を互換性評価装置100へ出力する。互換性評価装置100は、上記の一般化後方互換性指標(GBC)を用いて、予測器hの出力と予測器hの出力との互換性を示す互換性スコアを出力する。
【0040】
[ハードウェア構成]
図3は、互換性評価装置100のハードウェア構成を示すブロック図である。互換性評価装置100は、インタフェース101と、プロセッサ102と、メモリ103と、記録媒体104と、入力部105と、表示部106とを備える。
【0041】
インタフェース(IF)101は、予測器h、hから予測値を受け取る。また、IF101は、互換性評価装置100が計算した互換性スコアを外部装置へ出力する。IFは取得手段の一例である。
【0042】
プロセッサ102は、CPUなどのコンピュータであり、予め用意されたプログラムを実行することにより、互換性評価装置100の全体を制御する。なお、プロセッサ102は、GPU又はFPGA(Field-Programmable Gate Array)であってもよい。具体的に、プロセッサ102は、後述する互換性評価処理を実行する。
【0043】
メモリ103は、ROM(Read Only Memory)、RAM(Random Access Memory)などにより構成される。メモリ103には、一般化後方互換性指標の情報、指標番号毎の係数(重み)などが記憶される。また、メモリ103は、プロセッサ102による各種の処理の実行中に作業メモリとしても使用される。
【0044】
記録媒体104は、ディスク状記録媒体、半導体メモリなどの不揮発性で非一時的な記録媒体であり、互換性評価装置100に対して着脱可能に構成される。記録媒体104は、プロセッサ102が実行する各種のプログラムを記録している。互換性評価装置100が処理を実行する際には、記録媒体104に記録されているプログラムがメモリ103にロードされ、プロセッサ102により実行される。
【0045】
入力部105は、例えばキーボード、マウスなどであり、利用者が各種の指示、入力を行う際に使用される。表示部106は、例えば液晶表示装置などであり、利用者に各種の情報を表示する。
【0046】
[機能構成]
図4は、互換性評価装置100の機能構成を示すブロック図である。互換性評価装置100は、機能面では、評価用指標決定部110と、スコア演算部120とを備える。評価用指標決定部110には、指標番号が入力される。指標番号は、互換性の評価に使用する互換性指標を指定する番号である。指標番号は、例えば更新の対象となる予測器のタスクなどに基づいて決定される。評価用指標決定部110は、入力された指標番号に基づいて、式(1)や式(11)などに示す一般化後方互換性指標(GBC)を基にして、実際に評価に使用する互換性指標(以下、「評価用指標」とも呼ぶ。)を決定し、スコア演算部120へ出力する。
【0047】
指標番号は、式(1)に含まれる係数(重み)の組み合わせに対応付けて予め決定されている。例えば、互換性指標番号「1」がBTCに対応する場合、互換性指標番号「1」に対しては、係数の組み合わせ「係数a11=b10=b11=1、他の係数=0」が予め対応付けされている。よって、利用者が互換性指標番号「1」を入力した場合、評価用指標決定部110は、「係数a11=b10=b11=1、他の係数=0」を式(1)に代入し、BTCスコアを示す評価用指標を生成する。
【0048】
スコア演算部120は、決定された評価用指標を用いて、予測器h、hが出力した予測値から互換性スコアを算出し、出力する。例えば、スコア演算部120は、予測器が出力した予測値を式(7)~(10)に代入して4つの関係式CC(h,h)、EC(h,h)、IC(h,h)、IC(h,h)の値を求め、それらを式(6)などの評価用指標に代入してGBCスコアを計算し、出力する。
【0049】
なお、評価用指標決定部110は指標決定手段の一例であり、スコア演算部120は演算手段の一例である。
【0050】
[互換性評価処理]
図5は、互換性評価装置100が実行する互換性評価処理のフローチャートである。この処理は、図3に示すプロセッサ102が予め用意されたプログラムを実行し、図4に示す各要素として動作することにより実現される。
【0051】
まず、互換性評価装置100は、利用者による指標番号の入力を受け取る(ステップS11)。次に、評価用指標決定部110は、入力された指標番号に基づいて、評価用指標を決定する(ステップS12)。例えば、評価用指標として前述した第1例又は第2例のGBCを使用する場合、評価用指標決定部110は、指標番号に対応する各係数(重み)を取得し、式(1)又は式(11)に代入して評価用指標を決定する。
【0052】
次に、スコア演算部120は、評価データに対して予測器h、hが出力した予測値を取得し(ステップS13)、ステップS12で決定された評価用指標に入力して互換性スコア(GBCスコア)を算出し、出力する(ステップS14)。こうして、予測器hと予測器hの互換性を示す互換性スコアが得られる。そして、処理は終了する。
【0053】
[ユースケース]
GBCは、予測器の更新時にハイパーパラメータやシードが異なる複数の更新後予測器を生成した際に、それらの互換性を評価する指標として使用することができる。生成された複数の更新後予測器のうち、更新前予測器と互換性の高い予測器を選択することで、更新後のAIの挙動変化に伴う手続き変更などのコストを削減することができる。
【0054】
また、季節性が原因となるようなデータの変化が発生した場合、GBCを用いて、過去の予測モデルの中に現在の予測モデルと互換性の高い予測モデルが無いかを調べることができる。現在の予測モデルと互換性が高く、かつ、精度の高い過去の予測モデルがある場合には、現在の予測モデルをその予測モデルに切り替えることにより、再学習のコストをかけることなく、その季節に適した予測モデルへの切り替えが可能となる。
【0055】
また、AIの運用時に、ビジネス側のKPI(Key Performance Indicator:重要業績評価指標)が変わった場合には、GBCを用いて、新しいKPIが重視する項目(例えば正解したいクラス)などを重視した互換性指標を構築し、継続的なAI運用に役立てることができる。
【0056】
[GBCを活用した予測器の構築]
上記の例では、GBCを更新時などにおける予測器の互換性評価に使用しているが、その代わりに、GBCを予測器の学習において利用することもできる。この場合、予測モデルの学習時に、通常の学習時に用いる誤差関数にGBCを正則化として加える。具体的には、既存の一般化二値分類指標と同様に、指示関数を損失関数(二乗損失やヒンジ損失)に置き換えることにより、GBCの上界を構成することができる。そして、構成した上界と通常の二値分類の誤差関数を合わせたものを最小化するように予測モデルを学習する。更新前の予測器と追加収集したデータを入力とし、GBCを正則化にすることで、対象タスクに適した後方互換性の高い新たな予測器を構築することができる。
【0057】
<第2実施形態>
次に、本開示の第2実施形態について説明する。図6は、第2実施形態に係る互換性評価装置70の機能構成を示すブロック図である。互換性評価装置70は、取得手段71と、指標決定手段72と、演算手段73とを備える。
【0058】
図7は、互換性評価装置70による処理のフローチャートである。取得手段71は、評価データに対する第1の予測器及び第2の予測器の出力を取得する(ステップS41)。指標決定手段72は、第1の予測器の出力と第2の予測器の出力との関係を示す複数の関係式の組み合わせにより規定される一般化後方互換性指標を決定する(ステップS42)。演算手段73は、第1の予測器の出力と、第2の予測器の出力と、一般化後方互換性指標とを用いて、第1の予測器と第2の予測器との互換性を示すスコアを算出する(ステップS43)。
【0059】
第2実施形態の互換性評価装置70によれば、予測器のタスクに応じた適切な互換性指標を用いて、予測器の互換性を評価することができる。
【0060】
上記の実施形態の一部又は全部は、以下の付記のようにも記載されうるが、以下には限られない。
【0061】
(付記1)
評価データに対する第1の予測器及び第2の予測器の出力を取得する取得手段と、
前記第1の予測器の出力と前記第2の予測器の出力との関係を示す複数の関係式の組み合わせにより規定される一般化後方互換性指標を決定する指標決定手段と、
前記第1の予測器の出力と、前記第2の予測器の出力と、前記一般化後方互換性指標とを用いて、前記第1の予測器と前記第2の予測器との互換性を示すスコアを算出する演算手段と、
を備える互換性評価装置。
【0062】
(付記2)
前記一般化後方互換性指標は、重み付けされた複数の関係式の四則演算により表される付記1記載の互換性評価装置。
【0063】
(付記3)
互換性指標の指定を受け取る指定手段を備え、
前記指標決定手段は、前記指定に基づいて前記複数の関係式の各々に対する重みを設定して、前記一般化後方互換性指標から評価用指標を決定し、
前記演算手段は、前記評価用指標を用いて前記スコアを算出する付記2に記載の互換性評価装置。
【0064】
(付記4)
前記関係式は、
前記第1の予測器の出力と前記第2の予測器の出力が共に正解である割合を示す第1式と、
前記第1の予測器の出力と前記第2の予測器の出力が共に不正解である割合を示す第2式と、
前記第1の予測器の出力が不正解であり、前記第2の予測器の出力が正解である割合を示す第3式と、
前記第1の予測器の出力が正解であり、前記第2の予測器の出力が不正解である割合を示す第4式と、を含む付記1乃至3のいずれか一項に記載の互換性評価装置。
【0065】
(付記5)
前記第1の予測器及び前記第2の予測器は回帰分析を行い、
前記演算手段は、前記第1の予測器及び前記第2の予測器の出力である予測値と、当該予測値に対応する実績値との差が所定の閾値以下である場合、当該出力は正解であるとみなし、前記差が前記閾値より大きい場合、当該出力は不正解であるとみなす付記4に記載の互換性評価装置。
【0066】
(付記6)
前記関係式は、2つの評価データに対する前記第1の予測器の出力の大小関係、及び、前記2つの評価データに対する前記第2の予測器の出力の大小関係を示し、
前記演算手段は、前記第1の予測器の出力の大小関係と、前記第2の予測器の出力の大小関係とが一致する期待値を前記スコアとして算出する付記1に記載の互換性評価装置。
【0067】
(付記7)
評価データに対する第1の予測器及び第2の予測器の出力を取得し、
前記第1の予測器の出力と前記第2の予測器の出力との関係を示す複数の関係式の組み合わせにより規定される一般化後方互換性指標を決定し、
前記第1の予測器の出力と、前記第2の予測器の出力と、前記一般化後方互換性指標とを用いて、前記第1の予測器と前記第2の予測器との互換性を示すスコアを算出する互換性評価方法。
【0068】
(付記8)
評価データに対する第1の予測器及び第2の予測器の出力を取得し、
前記第1の予測器の出力と前記第2の予測器の出力との関係を示す複数の関係式の組み合わせにより規定される一般化後方互換性指標を決定し、
前記第1の予測器の出力と、前記第2の予測器の出力と、前記一般化後方互換性指標とを用いて、前記第1の予測器と前記第2の予測器との互換性を示すスコアを算出する処理をコンピュータに実行させるプログラムを記録した記録媒体。
【0069】
以上、実施形態及び実施例を参照して本開示を説明したが、本開示は上記実施形態及び実施例に限定されるものではない。本開示の構成や詳細には、本開示のスコープ内で当業者が理解し得る様々な変更をすることができる。
【符号の説明】
【0070】
100 互換性評価装置
101 インタフェース
102 プロセッサ
103 メモリ
104 記録媒体
105 入力部
106 表示部
110 評価用指標決定部
120 スコア演算部
図1
図2
図3
図4
図5
図6
図7