(19)【発行国】日本国特許庁(JP)
(12)【公報種別】特許公報(B2)
(11)【特許番号】
(24)【登録日】2023-09-25
(45)【発行日】2023-10-03
(54)【発明の名称】影響判定プログラム、装置、及び方法
(51)【国際特許分類】
G06N 20/00 20190101AFI20230926BHJP
【FI】
G06N20/00 130
(21)【出願番号】P 2020001670
(22)【出願日】2020-01-08
【審査請求日】2022-09-08
(73)【特許権者】
【識別番号】000005223
【氏名又は名称】富士通株式会社
(74)【代理人】
【識別番号】110001519
【氏名又は名称】弁理士法人太陽国際特許事務所
(72)【発明者】
【氏名】松本 大明
(72)【発明者】
【氏名】大木 雄介
【審査官】青木 重徳
(56)【参考文献】
【文献】米国特許出願公開第2019/0303716(US,A1)
【文献】特開2019-211870(JP,A)
【文献】国際公開第2018/096683(WO,A1)
【文献】国際公開第2018/142753(WO,A1)
【文献】万代 悠作 ほか,囲碁ニューラルネットワークの判断根拠の可視化,ゲームプログラミングワークショップ(GPWS)2018論文集 [online],日本,情報処理学会,2018年11月09日,p. 9-15
(58)【調査した分野】(Int.Cl.,DB名)
G06N 20/00
(57)【特許請求の範囲】
【請求項1】
時系列データに基づいて推定結果を出力する機械学習モデルを近似した重回帰モデルの各項に、前記時系列データの各時点のデータを時系列順に対応させ入力する際、前記各時点のデータのそれぞれに対して、前記各時点のデータのそれぞれより後の時点のデータに対応する前記重回帰モデルの項の偏回帰係数を0として、重回帰値を算出し、
前記各時点のデータのそれぞれについて算出された前記重回帰値の変化に応じて、前記時系列データが示す期間のうち、特定の条件を満たす期間を特定し、
特定された前記特定の条件を満たす期間に関する情報を、前記推定結果に影響を与えた要因として出力する、
処理をコンピュータに実行させることを特徴とする影響判定プログラム。
【請求項2】
前記特定の条件を満たす期間を特定する処理は、前記各時点のデータのそれぞれに対して算出された前記重回帰値が、時系列順に継続的に増加する期間を、前記特定の条件を満たす期間として特定する処理である、
ことを特徴とする請求項1に記載の影響判定プログラム。
【請求項3】
前記重回帰値が継続的に増加する期間として特定する処理は、前記各時点のデータのそれぞれに対して算出された前記重回帰値の時系列における変化の度合いを前記各時点のデータのそれぞれに対して算出し、閾値以上の変化の度合いを示すデータが所定数連続する期間を、前記重回帰値が継続的に増加する期間として特定する処理である、
ことを特徴とする請求項2に記載の影響判定プログラム。
【請求項4】
前記特定の条件を満たす期間に関連する情報は、前記特定の条件を満たす期間を示す情報、前記時系列データのうち前記特定の条件を満たす期間に含まれるデータを示す情報、前記時系列データのうち前記特定の条件を満たす期間に含まれるデータの集計結果、前記時系列データのうち前記特定の条件を満たす期間に含まれるデータとそれ以外のデータとの比較結果の少なくとも一つを含む、
ことを特徴とする請求項1~請求項3のいずれか1項に記載の影響判定プログラム。
【請求項5】
前記重回帰モデルは、前記機械学習モデルの学習に利用された学習データであって、前記機械学習モデルに対応する特徴空間において、前記時系列データの周辺に位置する前記学習データを用いた機械学習により生成される、
ことを特徴とする請求項1~請求項4のいずれか1項に記載の影響判定プログラム。
【請求項6】
時系列データに基づいて推定結果を出力する機械学習モデルを近似した重回帰モデルの各項に、前記時系列データの各時点のデータを時系列順に対応させ入力する際、前記各時点のデータのそれぞれに対して、前記各時点のデータのそれぞれより後の時点のデータに対応する前記重回帰モデルの項の偏回帰係数を0として、重回帰値を算出する算出部と、
前記各時点のデータのそれぞれについて算出された前記重回帰値の変化に応じて、前記時系列データが示す期間のうち、特定の条件を満たす期間を特定する特定部と、
特定された前記特定の条件を満たす期間に関する情報を、前記推定結果に影響を与えた要因として出力する出力部と、
を含むことを特徴とする影響判定装置。
【請求項7】
時系列データに基づいて推定結果を出力する機械学習モデルを近似した重回帰モデルの各項に、前記時系列データの各時点のデータを時系列順に対応させ入力する際、前記各時点のデータのそれぞれに対して、前記各時点のデータのそれぞれより後の時点のデータに対応する前記重回帰モデルの項の偏回帰係数を0として、重回帰値を算出し、
前記各時点のデータのそれぞれについて算出された前記重回帰値の変化に応じて、前記時系列データが示す期間のうち、特定の条件を満たす期間を特定し、
特定された前記特定の条件を満たす期間に関する情報を、前記推定結果に影響を与えた要因として出力する、
処理をコンピュータが実行することを特徴とする影響判定方法。
【発明の詳細な説明】
【技術分野】
【0001】
開示の技術は、影響判定技術に関する。
【背景技術】
【0002】
教師あり機械学習により学習されたモデルに時系列データを入力し、入力した時系列データの時点よりも後の時点の状態等を推定(推論と言い換えることもできる)することが行われている。人事や金融領域における推定では、推定結果に対する解釈性が求められる場合がある。例えば、過去の勤怠データを入力し、将来的な休職の可能性を推定するような場合、入力した勤怠データのうち、どのデータの影響を強く受けたか、すなわち、休職の可能性あり又はなしと推定した理由の提示が求められる場合がある。
【0003】
推定結果の解釈に関する技術として、LIME(Local Interpretable Model-agnostic Explanations)という技術が提案されている。LIMEでは、時系列データに関する学習済みモデルにおいて、評価対象のデータ周辺の学習データを用いて学習済みモデルを局所的に近似した重回帰モデルを生成する。そして、重回帰モデルを示す回帰方程式の各説明変数に対応する偏回帰係数の大小に基づいて、より推定に影響を与えた説明変数を特定する。
【先行技術文献】
【非特許文献】
【0004】
【文献】Marco Tulio Ribeiro, Sameer Singh, and Carlos Guestrin, ""Why Should I Trust You?" Explaining the Predictions of Any Classifier", arXiv:1602.04938v3 [cs.LG] 9 Aug 2016.
【発明の概要】
【発明が解決しようとする課題】
【0005】
しかしながら、従来技術では、データの時系列の特徴を捉えることができないため、推定結果の解釈性が低下するという問題がある。
【0006】
一つの側面として、開示の技術は、時系列データを用いた推定において、より推定結果に影響を与えた時系列データの部分を判定することを目的とする。
【課題を解決するための手段】
【0007】
一つの態様として、開示の技術は、時系列データに基づいて推定結果を出力する機械学習モデルを近似した重回帰モデルの各項に、前記時系列データの各時点のデータを時系列順に対応させ入力する。この際、開示の技術は、前記各時点のデータのそれぞれに対して、前記各時点のデータのそれぞれより後の時点のデータに対応する前記重回帰モデルの項の偏回帰係数を0として、重回帰値を算出する。また、開示の技術は、前記各時点のデータのそれぞれについて算出された前記重回帰値の変化に応じて、前記時系列データが示す期間のうち、特定の条件を満たす期間を特定する。そして、開示の技術は、特定された前記特定の条件を満たす期間に関する情報を、前記推定結果に影響を与えた要因として出力する。
【発明の効果】
【0008】
一つの側面として、時系列データを用いた推定において、より推定結果に影響を与えた時系列データの部分を判定することができる、という効果を有する。
【図面の簡単な説明】
【0009】
【
図1】本実施形態に係る推定システムの機能的な概略構成を示すブロック図である。
【
図2】学習用時系列データを説明するための図である。
【
図3】時系列データを用いた推定を説明するための図である。
【
図5】推定結果として出力されるリストの一例を示す図である。
【
図6】重回帰モデルの生成を説明するための図である。
【
図7】既存手法による推定結果の解釈の問題点を説明するための図である。
【
図8】本実施形態における影響度の算出を説明するための図である。
【
図10】重要期間の特定を説明するための図である。
【
図13】本実施形態に係る影響判定装置として機能するコンピュータの概略構成を示すブロック図である。
【
図14】本実施形態における影響判定処理の一例を示すフローチャートである。
【発明を実施するための形態】
【0010】
以下、図面を参照して、開示の技術に係る実施形態の一例を説明する。以下の実施形態では、従業員の勤怠データに基づいて、数か月先のメンタル不調による休職に繋がる療養欠勤の発生を推定する推定システムに開示の技術の影響判定装置を適用した場合について説明する。
【0011】
図1に示すように、本実施形態に係る推定システム100は、影響判定装置10と、学習推定装置30とを含む。
【0012】
学習推定装置30は、機能的には、
図1に示すように、学習部31と、推定部32とを含む。また、学習推定装置30の所定の記憶領域には、学習モデル40が記憶される。
【0013】
学習部31は、学習用時系列データを受け付ける。学習用時系列データは、
図2に示すように、各従業員の勤怠データに基づいて、日付毎に、残業、早退、遅刻等の有無、遅刻か休暇か等の特徴を抽出した所定期間分のデータである。
図2の例では、残業、早退、遅刻、休暇、及び出勤の各項目について、日付毎のブロックで各特徴量を表しており、網掛のブロックが、各項目に該当することを表している。なお、学習データとして用いる特徴は上記の例に限定されず、出張の有無、残業時間の長さ等、他の特徴を用いてもよい。また、学習用時系列データの各々には、推定結果の正解が対応付けられている。
【0014】
例えば、
図3に示すように、参照期間(例えば、180日)の勤怠データに基づいて、参照期間以降の推定期間(例えば、90日)内にメンタルの問題に基づく休職に繋がる療養欠勤が発生するか否かを推定するとする。この場合、学習用時系列データは、参照期間分の時系列データであり、推定結果の正解は、推定期間における療養欠勤の有無である。
【0015】
学習部31は、受け付けた学習用時系列データのうち、療養欠勤ありの正解が対応付けられているデータを正例の学習データ、療養欠勤なしの正解が対応付けられているデータを負例の学習データとして、既存の手法を用いて学習モデル40を学習する。
図4に、学習モデル40を概略的に示す。
図4において、「1」は正例の学習データ、「0」は負例の学習データ、破線は学習モデル40の決定境界を示す。学習モデル40は、推定期間(上記の例では90日)に療養欠勤が発生する確度を出力する。
【0016】
推定部32は、推定用時系列データを受け付ける。推定用時系列データは、
図2に概念的に示す学習用時系列データと同様のデータ構造で、推定結果の正解が未知のデータである。推定部32は、学習部31により学習された学習モデル40に推定用時系列データを入力することにより、推定結果として、療養欠勤が発生する確度を得る。例えば、推定部32は、
図3に示すように、毎月1回(例えば、毎月1日)に、各従業員の直前の180日分の勤怠データを推定用時系列データとして学習モデル40に入力することで、直後の90日以内に療養欠勤が発生する確度を推定する。
【0017】
なお、
図3の例では、推定1の段階では、療養欠勤が発生する確度が低く、推定2~4の段階では、療養欠勤が発生する確度が高く推定できていれば、推定成功である。
【0018】
推定部32は、例えば、
図5に示すように、療養欠勤が発生する確度が高い順に該当の従業員をリストにした推定結果を出力する。
図5の例では、推定結果を示すリストには、該当の従業員の「従業員番号」、推定用時系列データの期間に相当する「参照期間」、「推定期間」、療養欠勤が発生する「確度」、「理由提示」等の項目が含まれている。「理由提示」欄には、各従業員についての推定結果の解釈、すなわち推定の理由の提示を指示するための理由提示ボタンが表示される。
【0019】
影響判定装置10は、機能的には、
図1に示すように、重回帰モデル学習部11と、算出部12と、特定部13と、出力部14とを含む。また、影響判定装置10の所定の記憶領域には、重回帰モデル20が記憶される。
【0020】
重回帰モデル学習部11は、
図6に示すように、学習モデル40に対応する特徴空間において、該当の従業員についての推定用時系列データの周辺の学習データを用いて、学習モデル40の決定境界を局所的に近似した重回帰モデル20を生成する。
図6において、「1」は正例の学習データ、「0」は負例の学習データ、「a」は対象の推定用時系列データ、破線は学習モデル40の決定境界、一点鎖線は重回帰モデル20の決定境界を示す。この重回帰モデル20は、下記(1)式で表される。
y=α
1x
1+α
2x
2+・・・α
nx
n+β ・・・(1)
【0021】
(1)式において、yは療養欠勤が発生する確度、xiはi番目の説明変数であり、時系列データの先頭からi番目の日付に相当し、nは時系列データに含まれるデータ数、すなわち日数である。また、αiは説明変数xiについての偏回帰係数、βは切片である。
【0022】
ここで、上述したLIMEの技術を用いた推定結果の解釈では、
図7に示すように、偏回帰係数α
iを、説明変数x
i、すなわちi番目の日付の勤怠データが推定結果に与えた影響の度合いを示す影響度とする。そして、影響度が閾値以上の日付の勤怠データが、より推定結果に影響を与えた勤怠データとして提示される。この場合、同じ特徴量の日付(説明変数)は同じ影響度が算出され、日付単体の影響度しかわからない。例えば、人事部門や健康管理担当部門等の担当者は、
図5に示すような推定結果でリストアップされた従業員との面談等の対策を行う。この際、担当者は、影響度がどのように時間と共に変化しているか、影響度の大きい期間はどこなのか等、推定結果に影響を与えた時系列データの特徴を把握したい場合がある。
【0023】
そこで、本実施形態に係る影響判定装置10では、時系列データの特徴を捉えた指標に基づいて、推定結果に影響を与えた時系列データの部分を判定する。以下、算出部12、特定部13、及び出力部14の各々について詳述する。
【0024】
算出部12は、重回帰モデル学習部11により生成された重回帰モデル20において、推定用時系列データに含まれる各データに対応する日付より後の日付に対応する項の偏回帰係数を0とした場合の重回帰値を、日付(説明変数)毎の影響度として算出する。
【0025】
具体的には、算出部12は、以下に示すように、i番目の日付(説明変数)についての影響度yiを算出する。
y0=0+0+・・・0+β
y1=α1x1+0+・・・0+β
y2=α1x1+α2x2+0+・・・0+β
・・・
yn=α1x1+α2x2+・・・αnxn+β
【0026】
これにより、
図8に示すように、時系列順に各日付の偏回帰係数が積算された影響度が算出される。このように各日付の偏回帰係数を時系列順に積算して影響度を算出することで、
図9の上段の図に示すように、時系列順の影響度を示す波形の傾きから、影響度が高くなっている期間を理解することができる。
【0027】
算出部12は、算出した日付(説明変数xi)毎の影響度yiを特定部13へ受け渡す。
【0028】
特定部13は、影響度yiの時系列における変化に応じて、推定用時系列データが示す期間のうち、より推定結果への影響が大きい期間である重要期間を特定する。特定部13は、影響度yiが、時系列順に継続的に増加する期間を重要期間として特定することができる。より具体的には、特定部13は、影響度yiの傾きを日付(説明変数xi)毎に算出し、予め定めた閾値以上の傾きの日付(説明変数xi)が所定数連続する期間を重要期間として特定することができる。
【0029】
例えば、特定部13は、説明変数x
iについて、周辺の説明変数、例えば、x
i-2,x
i-1,x
i+1,x
i+2の影響度を用いて、説明変数x
iの影響度の傾きを算出する。特定部13は、例えば、下記(2)式により、説明変数x
iについての傾きb
iを算出することができる。
【数1】
【0030】
(2)式において、x
-(式中では、xの上に「バー」)は、説明変数x
i、及びその周辺の説明変数の平均、y
-(式中では、yの上に「バー」)は、説明変数x
i、及びその周辺の説明変数の各々の影響度の平均である。
図9の中段に、時系列順の傾きb
iの波形を示す。
【0031】
特定部13は、
図9の下段の図及び
図10に示すように、所定の閾値th(例えば、1.5)以上の影響度の傾きb
iが所定数以上連続している期間を重要期間として特定する。推定用時系列データが示す期間内に重要期間に該当する期間が複数存在する場合、特定部13は、それらの全ての期間を重要期間として特定する。この場合、特定部13は、各重要期間内の傾きb
iの平均値が高い順に重要期間をランク付けしてもよい。特定部13は、特定した重要期間を出力部14に通知する。
【0032】
出力部14は、学習推定装置30から出力された、例えば
図5に示すような推定結果において選択された理由提示ボタンに対応する従業員について、特定部13により特定された重要期間を推定理由として出力する。また、出力部14は、推定用時系列データの重要期間に含まれるデータ、及び重要期間に含まれるデータの集計結果の少なくとも一方を、推定結果に影響を与えた要因として、推定理由に含めて出力してもよい。
図11に、推定理由の出力例を示す。
図11の例では、1つの重要期間が特定されており、重要期間に含まれるデータの集計結果を重要期間と共に出力した例を示している。
【0033】
図12に、推定理由の他の出力例を示す。
図12の例では、出力部14は、重要期間と共に、推定用時系列データが示す期間のうち、重要期間のデータと、重要期間以外の期間のデータとを比較した結果を、推定結果に影響を与えた要因として出力している。
【0034】
影響判定装置10は、例えば
図13に示すコンピュータ50で実現することができる。コンピュータ50は、CPU(Central Processing Unit)51と、一時記憶領域としてのメモリ52と、不揮発性の記憶部53とを備える。また、コンピュータ50は、入力部、表示部等の入出力装置54と、記憶媒体59に対するデータの読み込み及び書き込みを制御するR/W(Read/Write)部55とを備える。また、コンピュータ50は、インターネット等のネットワークに接続される通信I/F(Interface)56を備える。CPU51、メモリ52、記憶部53、入出力装置54、R/W部55、及び通信I/F56は、バス57を介して互いに接続される。
【0035】
記憶部53は、HDD(Hard Disk Drive)、SSD(Solid State Drive)、フラッシュメモリ等によって実現できる。記憶媒体としての記憶部53には、コンピュータ50を、影響判定装置10として機能させるための影響判定プログラム60が記憶される。影響判定プログラム60は、重回帰モデル学習プロセス61と、算出プロセス62と、特定プロセス63と、出力プロセス64とを有する。
【0036】
CPU51は、影響判定プログラム60を記憶部53から読み出してメモリ52に展開し、影響判定プログラム60が有するプロセスを順次実行する。CPU51は、重回帰モデル学習プロセス61を実行することで、
図1に示す重回帰モデル学習部11として動作する。また、CPU51は、算出プロセス62を実行することで、
図1に示す算出部12として動作する。また、CPU51は、特定プロセス63を実行することで、
図1に示す特定部13として動作する。また、CPU51は、出力プロセス64を実行することで、
図1に示す出力部14として動作する。また、CPU51は、生成された重回帰モデル20をメモリ52に展開する。これにより、影響判定プログラム60を実行したコンピュータ50が、影響判定装置10として機能することになる。なお、プログラムを実行するCPU51はハードウェアである。
【0037】
なお、影響判定プログラム60により実現される機能は、例えば半導体集積回路、より詳しくはASIC(Application Specific Integrated Circuit)等で実現することも可能である。
【0038】
学習推定装置30も、影響判定装置10と同様に、CPU、メモリ、記憶部、入出力装置、R/W部、通信I/F等を含むコンピュータで実現することができるため、詳細な説明を省略する。
【0039】
次に、本実施形態に係る推定システム100の作用について説明する。まず、学習推定装置30に学習用時系列データが入力されると、学習部31が、入力された学習用時系列データを受け付ける。そして、学習部31が、参照期間分(例えば、180日分)の時系列データに基づいて、それ以降の推定期間(例えば、90日)内に療養欠勤が発生する確度を推定するための学習モデル40を生成する。学習部31は、生成した学習モデル40を所定の記憶領域に記憶する。
【0040】
そして、学習推定装置30に推定用時系列データが入力されると、推定部32が、学習モデル40に推定用時系列データを入力することにより、推定結果として、療養欠勤が発生する確度を得る。推定部32は、例えば、
図5に示すように、療養欠勤が発生する確度が高い順に該当の従業員をリストにした推定結果を出力する。
【0041】
出力された推定結果を示すリストが、例えば、人事部門や健康管理担当部門等の担当者が使用する情報処理装置の表示部に表示されると、影響判定装置10において、
図14に示す影響判定処理が実行される。なお、影響判定処理は、開示の技術の影響判定方法の一例である。
【0042】
ステップS11で、重回帰モデル学習部11が、推定結果を示すリストに含まれるいずれかの理由提示ボタンが選択されたか否かを判定することにより、理由提示が指示されたか否かを判定する。理由提示が指示された場合には、処理はステップS12へ移行し、指示されていない場合には、処理はステップS18へ移行する。
【0043】
ステップS12で、重回帰モデル学習部11が、学習モデル40に対応する特徴空間において、選択された理由提示ボタンに対応する従業員についての推定用時系列データの周辺の学習データを探索する。例えば、重回帰モデル学習部11は、推定用時系列データを示すベクトルと、学習データを示すベクトルとのユークリッド距離が所定値以下の学習データを周辺の学習データとして探索する。
【0044】
次に、ステップS13で、重回帰モデル学習部11が、探索した周辺の学習データを用いて、該当の従業員についての推定用時系列データの周辺で、学習モデル40の決定境界を局所的に近似した重回帰モデル20を生成する。
【0045】
次に、ステップS14で、算出部12が、重回帰モデル20において、推定用時系列データに含まれる各データに対応する日付より後の日付に対応する項の偏回帰係数を0とした場合の重回帰値を、日付(説明変数)毎の影響度として算出する。
【0046】
次に、ステップS15で、特定部13が、例えば(2)式により、影響度の傾きを日付(説明変数)毎に算出する。
【0047】
次に、ステップS16で、特定部13が、所定の閾値th以上の影響度の傾きが所定数以上連続している期間を重要期間として特定する。特定部13は、特定した重要期間を出力部14に通知する。
【0048】
次に、ステップS17で、出力部14が、該当の従業員について、上記ステップS16で特定された重要期間を推定理由として提示する。出力部14は、推定用時系列データの重要期間に含まれるデータ、及び重要期間に含まれるデータの集計結果の少なくとも一方を、推定結果に影響を与えた要因として、推定理由に含めて出力してもよい。そして、処理はステップS11に戻る。
【0049】
ステップS18では、推定結果を示すリストの表示の終了が指示されたか否かを判定する。リストの表示の終了が指示されていない場合には、処理はステップS11に戻り、終了が指示された場合には、影響判定処理は終了する。
【0050】
以上説明したように、本実施形態に係る推定システムによれば、影響判定装置が、過去の時系列データに基づいて、以降の推定期間における状態の推定結果を出力する学習モデルを局所的に近似した重回帰モデルを生成する。そして、影響判定装置は、重回帰モデルを示す回帰方程式の各項に、時系列データの各日付のデータを時系列順に対応させ、各日付に対応する項より後の項の偏回帰係数を0とした場合の重回帰値を、日付毎の影響度として算出する。さらに、影響判定装置は、日付毎の影響度の傾きが所定値以上で所定数連続する期間を重要期間として特定し、推定結果の理由として出力する。これにより、時系列データを用いた推定において、より推定結果に影響を与えた時系列データの部分を判定することができる。
【0051】
なお、上記実施形態では、従業員の勤怠データに基づいて、数か月先のメンタル不調による休職に繋がる療養欠勤の発生を推定する例について説明したが、これに限定されない。例えば、株価等の変動を予測するシステム等、時系列データを用いた推定に適用することができる。
【0052】
また、時系列データの単位も日付単位に限定されず、時間単位、週単位、月単位等でもよい。いずれの場合でも、各時点のデータを、重回帰モデルを示す回帰方程式の各項に時系列順に対応させることにより、開示の技術を適用することができる。
【0053】
また、上記実施形態では、影響度の時系列的な変化を示す指標として、影響度の傾きを用いる場合について説明したが、これに限定されない。例えば、各時点の影響度の移動平均をとる等、周辺の時点における影響度を考慮した指標を用いてもよい。
【0054】
また、上記実施形態では、影響度判定装置と学習推定装置とを別々のコンピュータで実現する場合について説明したが、影響度判定装置と学習推定装置とを1つのコンピュータで実現してもよい。
【0055】
また、上記実施形態では、影響判定プログラムが記憶部に予め記憶(インストール)されている態様を説明したが、これに限定されない。開示の技術に係るプログラムは、CD-ROM、DVD-ROM、USBメモリ等の記憶媒体に記憶された形態で提供することも可能である。
【0056】
以上の実施形態に関し、更に以下の付記を開示する。
【0057】
(付記1)
時系列データに基づいて推定結果を出力する機械学習モデルを近似した重回帰モデルの各項に、前記時系列データの各時点のデータを時系列順に対応させ入力する際、前記各時点のデータのそれぞれに対して、前記各時点のデータのそれぞれより後の時点のデータに対応する前記重回帰モデルの項の偏回帰係数を0として、重回帰値を算出し、
前記各時点のデータのそれぞれについて算出された前記重回帰値の変化に応じて、前記時系列データが示す期間のうち、特定の条件を満たす期間を特定し、
特定された前記特定の条件を満たす期間に関する情報を、前記推定結果に影響を与えた要因として出力する、
処理をコンピュータに実行させることを特徴とする影響判定プログラム。
【0058】
(付記2)
前記特定の条件を満たす期間を特定する処理は、前記各時点のデータのそれぞれに対して算出された前記重回帰値が、時系列順に継続的に増加する期間を、前記特定の条件を満たす期間として特定する処理である、
ことを特徴とする付記1に記載の影響判定プログラム。
【0059】
(付記3)
前記重回帰値が継続的に増加する期間として特定する処理は、前記各時点のデータのそれぞれに対して算出された前記重回帰値の時系列における変化の度合いを前記各時点のデータのそれぞれに対して算出し、閾値以上の変化の度合いを示すデータが所定数連続する期間を、前記重回帰値が継続的に増加する期間として特定する処理である、
ことを特徴とする付記2に記載の影響判定プログラム。
【0060】
(付記4)
前記特定の条件を満たす期間に関連する情報は、前記特定の条件を満たす期間を示す情報、前記時系列データのうち前記特定の条件を満たす期間に含まれるデータを示す情報、前記時系列データのうち前記特定の条件を満たす期間に含まれるデータの集計結果、前記時系列データのうち前記特定の条件を満たす期間に含まれるデータとそれ以外のデータとの比較結果の少なくとも一つを含む、
ことを特徴とする付記1~付記3のいずれか1項に記載の影響判定プログラム。
【0061】
(付記5)
前記重回帰モデルは、前記機械学習モデルの学習に利用された学習データであって、前記機械学習モデルに対応する特徴空間において、前記時系列データの周辺に位置する前記学習データを用いた機械学習により生成される、
ことを特徴とする付記1~付記4のいずれか1項に記載の影響判定プログラム。
【0062】
(付記6)
時系列データに基づいて推定結果を出力する機械学習モデルを近似した重回帰モデルの各項に、前記時系列データの各時点のデータを時系列順に対応させ入力する際、前記各時点のデータのそれぞれに対して、前記各時点のデータのそれぞれより後の時点のデータに対応する前記重回帰モデルの項の偏回帰係数を0として、重回帰値を算出する算出部と、
前記各時点のデータのそれぞれについて算出された前記重回帰値の変化に応じて、前記時系列データが示す期間のうち、特定の条件を満たす期間を特定する特定部と、
特定された前記特定の条件を満たす期間に関する情報を、前記推定結果に影響を与えた要因として出力する出力部と、
を含むことを特徴とする影響判定装置。
【0063】
(付記7)
前記特定部は、前記各時点のデータのそれぞれに対して算出された前記重回帰値が、時系列順に継続的に増加する期間を、前記特定の条件を満たす期間として特定する、
ことを特徴とする付記6に記載の影響判定装置。
【0064】
(付記8)
前記特定部は、前記各時点のデータのそれぞれに対して算出された前記重回帰値の時系列における変化の度合いを前記各時点のデータのそれぞれに対して算出し、閾値以上の変化の度合いを示すデータが所定数連続する期間を、前記重回帰値が継続的に増加する期間として特定する、
ことを特徴とする付記7に記載の影響判定装置。
【0065】
(付記9)
前記特定の条件を満たす期間に関連する情報は、前記特定の条件を満たす期間を示す情報、前記時系列データのうち前記特定の条件を満たす期間に含まれるデータを示す情報、前記時系列データのうち前記特定の条件を満たす期間に含まれるデータの集計結果、前記時系列データのうち前記特定の条件を満たす期間に含まれるデータとそれ以外のデータとの比較結果の少なくとも一つを含む、
ことを特徴とする付記6~付記8のいずれか1項に記載の影響判定装置。
【0066】
(付記10)
前記重回帰モデルは、前記機械学習モデルの学習に利用された学習データであって、前記機械学習モデルに対応する特徴空間において、前記時系列データの周辺に位置する前記学習データを用いた機械学習により生成される、
ことを特徴とする付記6~付記9のいずれか1項に記載の影響判定装置。
【0067】
(付記11)
時系列データに基づいて推定結果を出力する機械学習モデルを近似した重回帰モデルの各項に、前記時系列データの各時点のデータを時系列順に対応させ入力する際、前記各時点のデータのそれぞれに対して、前記各時点のデータのそれぞれより後の時点のデータに対応する前記重回帰モデルの項の偏回帰係数を0として、重回帰値を算出し、
前記各時点のデータのそれぞれについて算出された前記重回帰値の変化に応じて、前記時系列データが示す期間のうち、特定の条件を満たす期間を特定し、
特定された前記特定の条件を満たす期間に関する情報を、前記推定結果に影響を与えた要因として出力する、
処理をコンピュータが実行することを特徴とする影響判定方法。
【0068】
(付記12)
前記特定の条件を満たす期間を特定する処理は、前記各時点のデータのそれぞれに対して算出された前記重回帰値が、時系列順に継続的に増加する期間を、前記特定の条件を満たす期間として特定する処理である、
ことを特徴とする付記11に記載の影響判定方法。
【0069】
(付記13)
前記重回帰値が継続的に増加する期間として特定する処理は、前記各時点のデータのそれぞれに対して算出された前記重回帰値の時系列における変化の度合いを前記各時点のデータのそれぞれに対して算出し、閾値以上の変化の度合いを示すデータが所定数連続する期間を、前記重回帰値が継続的に増加する期間として特定する処理である、
ことを特徴とする付記12に記載の影響判定方法。
【0070】
(付記14)
前記特定の条件を満たす期間に関連する情報は、前記特定の条件を満たす期間を示す情報、前記時系列データのうち前記特定の条件を満たす期間に含まれるデータを示す情報、前記時系列データのうち前記特定の条件を満たす期間に含まれるデータの集計結果、前記時系列データのうち前記特定の条件を満たす期間に含まれるデータとそれ以外のデータとの比較結果の少なくとも一つを含む、
ことを特徴とする付記11~付記13のいずれか1項に記載の影響判定方法。
【0071】
(付記15)
前記重回帰モデルは、前記機械学習モデルの学習に利用された学習データであって、前記機械学習モデルに対応する特徴空間において、前記時系列データの周辺に位置する前記学習データを用いた機械学習により生成される、
ことを特徴とする付記11~付記14のいずれか1項に記載の影響判定方法。
【0072】
(付記16)
時系列データに基づいて推定結果を出力する機械学習モデルを近似した重回帰モデルの各項に、前記時系列データの各時点のデータを時系列順に対応させ入力する際、前記各時点のデータのそれぞれに対して、前記各時点のデータのそれぞれより後の時点のデータに対応する前記重回帰モデルの項の偏回帰係数を0として、重回帰値を算出し、
前記各時点のデータのそれぞれについて算出された前記重回帰値の変化に応じて、前記時系列データが示す期間のうち、特定の条件を満たす期間を特定し、
特定された前記特定の条件を満たす期間に関する情報を、前記推定結果に影響を与えた要因として出力する、
処理をコンピュータに実行させることを特徴とする影響判定プログラムを記憶した記憶媒体。
【符号の説明】
【0073】
10 影響判定装置
11 重回帰モデル学習部
12 算出部
13 特定部
14 出力部
20 重回帰モデル
30 学習推定装置
31 学習部
32 推定部
40 学習モデル
50 コンピュータ
51 CPU
52 メモリ
53 記憶部
59 記憶媒体
60 影響判定プログラム
100 推定システム