特許7354844 | 知財ポータル「IP Force」

知財求人 - 知財ポータルサイト「IP Force」

▶ 富士通株式会社の特許一覧

特許7354844影響判定プログラム、装置、及び方法

書誌要約請求の範囲詳細な説明課題実施例実施するための形態図面の説明

目に優しい文字サイズ小中大 PDF Top

< >

1
2
3
4
5
6
7
8
9
10
11
12
13
14

(19)【発行国】日本国特許庁(JP)

(12)【公報種別】特許公報(B2)

(11)【特許番号】

(24)【登録日】2023-09-25

(45)【発行日】2023-10-03

(54)【発明の名称】影響判定プログラム、装置、及び方法

(51)【国際特許分類】

G06N 20/00 20190101AFI20230926BHJP

【ＦＩ】

G06N20/00 130

【請求項の数】 7

(21)【出願番号】P 2020001670

(22)【出願日】2020-01-08

(65)【公開番号】P2021111060

(43)【公開日】2021-08-02

【審査請求日】2022-09-08

(73)【特許権者】

【識別番号】000005223

【氏名又は名称】富士通株式会社

(74)【代理人】

【識別番号】110001519

【氏名又は名称】弁理士法人太陽国際特許事務所

(72)【発明者】

【氏名】松本大明

(72)【発明者】

【氏名】大木雄介

【審査官】青木重徳

(56)【参考文献】

【文献】米国特許出願公開第２０１９／０３０３７１６（ＵＳ，Ａ１）

【文献】特開２０１９－２１１８７０（ＪＰ，Ａ）

【文献】国際公開第２０１８／０９６６８３（ＷＯ，Ａ１）

【文献】国際公開第２０１８／１４２７５３（ＷＯ，Ａ１）

【文献】万代悠作ほか，囲碁ニューラルネットワークの判断根拠の可視化，ゲームプログラミングワークショップ（ＧＰＷＳ）２０１８論文集［ｏｎｌｉｎｅ］，日本，情報処理学会，2018年11月09日，p. 9-15

(58)【調査した分野】(Int.Cl.，ＤＢ名)

Ｇ０６Ｎ２０／００

(57)【特許請求の範囲】

【請求項1】

時系列データに基づいて推定結果を出力する機械学習モデルを近似した重回帰モデルの各項に、前記時系列データの各時点のデータを時系列順に対応させ入力する際、前記各時点のデータのそれぞれに対して、前記各時点のデータのそれぞれより後の時点のデータに対応する前記重回帰モデルの項の偏回帰係数を０として、重回帰値を算出し、
前記各時点のデータのそれぞれについて算出された前記重回帰値の変化に応じて、前記時系列データが示す期間のうち、特定の条件を満たす期間を特定し、
特定された前記特定の条件を満たす期間に関する情報を、前記推定結果に影響を与えた要因として出力する、
処理をコンピュータに実行させることを特徴とする影響判定プログラム。

【請求項2】

前記特定の条件を満たす期間を特定する処理は、前記各時点のデータのそれぞれに対して算出された前記重回帰値が、時系列順に継続的に増加する期間を、前記特定の条件を満たす期間として特定する処理である、
ことを特徴とする請求項１に記載の影響判定プログラム。

【請求項3】

前記重回帰値が継続的に増加する期間として特定する処理は、前記各時点のデータのそれぞれに対して算出された前記重回帰値の時系列における変化の度合いを前記各時点のデータのそれぞれに対して算出し、閾値以上の変化の度合いを示すデータが所定数連続する期間を、前記重回帰値が継続的に増加する期間として特定する処理である、
ことを特徴とする請求項２に記載の影響判定プログラム。

【請求項4】

前記特定の条件を満たす期間に関連する情報は、前記特定の条件を満たす期間を示す情報、前記時系列データのうち前記特定の条件を満たす期間に含まれるデータを示す情報、前記時系列データのうち前記特定の条件を満たす期間に含まれるデータの集計結果、前記時系列データのうち前記特定の条件を満たす期間に含まれるデータとそれ以外のデータとの比較結果の少なくとも一つを含む、
ことを特徴とする請求項１～請求項３のいずれか１項に記載の影響判定プログラム。

【請求項5】

前記重回帰モデルは、前記機械学習モデルの学習に利用された学習データであって、前記機械学習モデルに対応する特徴空間において、前記時系列データの周辺に位置する前記学習データを用いた機械学習により生成される、
ことを特徴とする請求項１～請求項４のいずれか１項に記載の影響判定プログラム。

【請求項6】

時系列データに基づいて推定結果を出力する機械学習モデルを近似した重回帰モデルの各項に、前記時系列データの各時点のデータを時系列順に対応させ入力する際、前記各時点のデータのそれぞれに対して、前記各時点のデータのそれぞれより後の時点のデータに対応する前記重回帰モデルの項の偏回帰係数を０として、重回帰値を算出する算出部と、
前記各時点のデータのそれぞれについて算出された前記重回帰値の変化に応じて、前記時系列データが示す期間のうち、特定の条件を満たす期間を特定する特定部と、
特定された前記特定の条件を満たす期間に関する情報を、前記推定結果に影響を与えた要因として出力する出力部と、
を含むことを特徴とする影響判定装置。

【請求項7】

時系列データに基づいて推定結果を出力する機械学習モデルを近似した重回帰モデルの各項に、前記時系列データの各時点のデータを時系列順に対応させ入力する際、前記各時点のデータのそれぞれに対して、前記各時点のデータのそれぞれより後の時点のデータに対応する前記重回帰モデルの項の偏回帰係数を０として、重回帰値を算出し、
前記各時点のデータのそれぞれについて算出された前記重回帰値の変化に応じて、前記時系列データが示す期間のうち、特定の条件を満たす期間を特定し、
特定された前記特定の条件を満たす期間に関する情報を、前記推定結果に影響を与えた要因として出力する、
処理をコンピュータが実行することを特徴とする影響判定方法。

【発明の詳細な説明】

【技術分野】

【0001】

開示の技術は、影響判定技術に関する。

【背景技術】

【0002】

教師あり機械学習により学習されたモデルに時系列データを入力し、入力した時系列データの時点よりも後の時点の状態等を推定（推論と言い換えることもできる）することが行われている。人事や金融領域における推定では、推定結果に対する解釈性が求められる場合がある。例えば、過去の勤怠データを入力し、将来的な休職の可能性を推定するような場合、入力した勤怠データのうち、どのデータの影響を強く受けたか、すなわち、休職の可能性あり又はなしと推定した理由の提示が求められる場合がある。

【0003】

推定結果の解釈に関する技術として、ＬＩＭＥ（Local Interpretable Model-agnostic Explanations）という技術が提案されている。ＬＩＭＥでは、時系列データに関する学習済みモデルにおいて、評価対象のデータ周辺の学習データを用いて学習済みモデルを局所的に近似した重回帰モデルを生成する。そして、重回帰モデルを示す回帰方程式の各説明変数に対応する偏回帰係数の大小に基づいて、より推定に影響を与えた説明変数を特定する。

【先行技術文献】

【非特許文献】

【0004】

【文献】Marco Tulio Ribeiro, Sameer Singh, and Carlos Guestrin, ""Why Should I Trust You?" Explaining the Predictions of Any Classifier", arXiv:1602.04938v3 [cs.LG] 9 Aug 2016.

【発明の概要】

【発明が解決しようとする課題】

【0005】

しかしながら、従来技術では、データの時系列の特徴を捉えることができないため、推定結果の解釈性が低下するという問題がある。

【0006】

一つの側面として、開示の技術は、時系列データを用いた推定において、より推定結果に影響を与えた時系列データの部分を判定することを目的とする。

【課題を解決するための手段】

【0007】

一つの態様として、開示の技術は、時系列データに基づいて推定結果を出力する機械学習モデルを近似した重回帰モデルの各項に、前記時系列データの各時点のデータを時系列順に対応させ入力する。この際、開示の技術は、前記各時点のデータのそれぞれに対して、前記各時点のデータのそれぞれより後の時点のデータに対応する前記重回帰モデルの項の偏回帰係数を０として、重回帰値を算出する。また、開示の技術は、前記各時点のデータのそれぞれについて算出された前記重回帰値の変化に応じて、前記時系列データが示す期間のうち、特定の条件を満たす期間を特定する。そして、開示の技術は、特定された前記特定の条件を満たす期間に関する情報を、前記推定結果に影響を与えた要因として出力する。

【発明の効果】

【0008】

一つの側面として、時系列データを用いた推定において、より推定結果に影響を与えた時系列データの部分を判定することができる、という効果を有する。

【図面の簡単な説明】

【0009】

【図1】本実施形態に係る推定システムの機能的な概略構成を示すブロック図である。

【図2】学習用時系列データを説明するための図である。

【図3】時系列データを用いた推定を説明するための図である。

【図4】学習モデルを概略的に示す図である。

【図5】推定結果として出力されるリストの一例を示す図である。

【図6】重回帰モデルの生成を説明するための図である。

【図7】既存手法による推定結果の解釈の問題点を説明するための図である。

【図8】本実施形態における影響度の算出を説明するための図である。

【図9】重要期間の特定を説明するための図である。

【図10】重要期間の特定を説明するための図である。

【図11】推定理由の出力例を示す図である。

【図12】推定理由の他の出力例を示す図である。

【図13】本実施形態に係る影響判定装置として機能するコンピュータの概略構成を示すブロック図である。

【図14】本実施形態における影響判定処理の一例を示すフローチャートである。

【発明を実施するための形態】

【0010】

以下、図面を参照して、開示の技術に係る実施形態の一例を説明する。以下の実施形態では、従業員の勤怠データに基づいて、数か月先のメンタル不調による休職に繋がる療養欠勤の発生を推定する推定システムに開示の技術の影響判定装置を適用した場合について説明する。

【0011】

図１に示すように、本実施形態に係る推定システム１００は、影響判定装置１０と、学習推定装置３０とを含む。

【0012】

学習推定装置３０は、機能的には、図１に示すように、学習部３１と、推定部３２とを含む。また、学習推定装置３０の所定の記憶領域には、学習モデル４０が記憶される。

【0013】

学習部３１は、学習用時系列データを受け付ける。学習用時系列データは、図２に示すように、各従業員の勤怠データに基づいて、日付毎に、残業、早退、遅刻等の有無、遅刻か休暇か等の特徴を抽出した所定期間分のデータである。図２の例では、残業、早退、遅刻、休暇、及び出勤の各項目について、日付毎のブロックで各特徴量を表しており、網掛のブロックが、各項目に該当することを表している。なお、学習データとして用いる特徴は上記の例に限定されず、出張の有無、残業時間の長さ等、他の特徴を用いてもよい。また、学習用時系列データの各々には、推定結果の正解が対応付けられている。

【0014】

例えば、図３に示すように、参照期間（例えば、１８０日）の勤怠データに基づいて、参照期間以降の推定期間（例えば、９０日）内にメンタルの問題に基づく休職に繋がる療養欠勤が発生するか否かを推定するとする。この場合、学習用時系列データは、参照期間分の時系列データであり、推定結果の正解は、推定期間における療養欠勤の有無である。

【0015】

学習部３１は、受け付けた学習用時系列データのうち、療養欠勤ありの正解が対応付けられているデータを正例の学習データ、療養欠勤なしの正解が対応付けられているデータを負例の学習データとして、既存の手法を用いて学習モデル４０を学習する。図４に、学習モデル４０を概略的に示す。図４において、「１」は正例の学習データ、「０」は負例の学習データ、破線は学習モデル４０の決定境界を示す。学習モデル４０は、推定期間（上記の例では９０日）に療養欠勤が発生する確度を出力する。

【0016】

推定部３２は、推定用時系列データを受け付ける。推定用時系列データは、図２に概念的に示す学習用時系列データと同様のデータ構造で、推定結果の正解が未知のデータである。推定部３２は、学習部３１により学習された学習モデル４０に推定用時系列データを入力することにより、推定結果として、療養欠勤が発生する確度を得る。例えば、推定部３２は、図３に示すように、毎月１回（例えば、毎月１日）に、各従業員の直前の１８０日分の勤怠データを推定用時系列データとして学習モデル４０に入力することで、直後の９０日以内に療養欠勤が発生する確度を推定する。

【0017】

なお、図３の例では、推定１の段階では、療養欠勤が発生する確度が低く、推定２～４の段階では、療養欠勤が発生する確度が高く推定できていれば、推定成功である。

【0018】

推定部３２は、例えば、図５に示すように、療養欠勤が発生する確度が高い順に該当の従業員をリストにした推定結果を出力する。図５の例では、推定結果を示すリストには、該当の従業員の「従業員番号」、推定用時系列データの期間に相当する「参照期間」、「推定期間」、療養欠勤が発生する「確度」、「理由提示」等の項目が含まれている。「理由提示」欄には、各従業員についての推定結果の解釈、すなわち推定の理由の提示を指示するための理由提示ボタンが表示される。

【0019】

影響判定装置１０は、機能的には、図１に示すように、重回帰モデル学習部１１と、算出部１２と、特定部１３と、出力部１４とを含む。また、影響判定装置１０の所定の記憶領域には、重回帰モデル２０が記憶される。

【0020】

重回帰モデル学習部１１は、図６に示すように、学習モデル４０に対応する特徴空間において、該当の従業員についての推定用時系列データの周辺の学習データを用いて、学習モデル４０の決定境界を局所的に近似した重回帰モデル２０を生成する。図６において、「１」は正例の学習データ、「０」は負例の学習データ、「ａ」は対象の推定用時系列データ、破線は学習モデル４０の決定境界、一点鎖線は重回帰モデル２０の決定境界を示す。この重回帰モデル２０は、下記（１）式で表される。
ｙ＝α_１ｘ_１＋α_２ｘ_２＋・・・α_ｎｘ_ｎ＋β ・・・（１）

【0021】

（１）式において、ｙは療養欠勤が発生する確度、ｘ_ｉはｉ番目の説明変数であり、時系列データの先頭からｉ番目の日付に相当し、ｎは時系列データに含まれるデータ数、すなわち日数である。また、α_ｉは説明変数ｘ_ｉについての偏回帰係数、βは切片である。

【0022】

ここで、上述したＬＩＭＥの技術を用いた推定結果の解釈では、図７に示すように、偏回帰係数α_ｉを、説明変数ｘ_ｉ、すなわちｉ番目の日付の勤怠データが推定結果に与えた影響の度合いを示す影響度とする。そして、影響度が閾値以上の日付の勤怠データが、より推定結果に影響を与えた勤怠データとして提示される。この場合、同じ特徴量の日付（説明変数）は同じ影響度が算出され、日付単体の影響度しかわからない。例えば、人事部門や健康管理担当部門等の担当者は、図５に示すような推定結果でリストアップされた従業員との面談等の対策を行う。この際、担当者は、影響度がどのように時間と共に変化しているか、影響度の大きい期間はどこなのか等、推定結果に影響を与えた時系列データの特徴を把握したい場合がある。

【0023】

そこで、本実施形態に係る影響判定装置１０では、時系列データの特徴を捉えた指標に基づいて、推定結果に影響を与えた時系列データの部分を判定する。以下、算出部１２、特定部１３、及び出力部１４の各々について詳述する。

【0024】

算出部１２は、重回帰モデル学習部１１により生成された重回帰モデル２０において、推定用時系列データに含まれる各データに対応する日付より後の日付に対応する項の偏回帰係数を０とした場合の重回帰値を、日付（説明変数）毎の影響度として算出する。

【0025】

具体的には、算出部１２は、以下に示すように、ｉ番目の日付（説明変数）についての影響度ｙ_ｉを算出する。
ｙ_０＝０＋０＋・・・０＋β
ｙ_１＝α_１ｘ_１＋０＋・・・０＋β
ｙ_２＝α_１ｘ_１＋α_２ｘ_２＋０＋・・・０＋β
・・・
ｙ_ｎ＝α_１ｘ_１＋α_２ｘ_２＋・・・α_ｎｘ_ｎ＋β

【0026】

これにより、図８に示すように、時系列順に各日付の偏回帰係数が積算された影響度が算出される。このように各日付の偏回帰係数を時系列順に積算して影響度を算出することで、図９の上段の図に示すように、時系列順の影響度を示す波形の傾きから、影響度が高くなっている期間を理解することができる。

【0027】

算出部１２は、算出した日付（説明変数ｘ_ｉ）毎の影響度ｙ_ｉを特定部１３へ受け渡す。

【0028】

特定部１３は、影響度ｙ_ｉの時系列における変化に応じて、推定用時系列データが示す期間のうち、より推定結果への影響が大きい期間である重要期間を特定する。特定部１３は、影響度ｙ_ｉが、時系列順に継続的に増加する期間を重要期間として特定することができる。より具体的には、特定部１３は、影響度ｙ_ｉの傾きを日付（説明変数ｘ_ｉ）毎に算出し、予め定めた閾値以上の傾きの日付（説明変数ｘ_ｉ）が所定数連続する期間を重要期間として特定することができる。

【0029】

例えば、特定部１３は、説明変数ｘ_ｉについて、周辺の説明変数、例えば、ｘ_ｉ－２，ｘ_ｉ－１，ｘ_ｉ＋１，ｘ_ｉ＋２の影響度を用いて、説明変数ｘ_ｉの影響度の傾きを算出する。特定部１３は、例えば、下記（２）式により、説明変数ｘ_ｉについての傾きｂ_ｉを算出することができる。

【数1】

【0030】

（２）式において、ｘ^－（式中では、ｘの上に「バー」）は、説明変数ｘ_ｉ、及びその周辺の説明変数の平均、ｙ^－（式中では、ｙの上に「バー」）は、説明変数ｘ_ｉ、及びその周辺の説明変数の各々の影響度の平均である。図９の中段に、時系列順の傾きｂ_ｉの波形を示す。

【0031】

特定部１３は、図９の下段の図及び図１０に示すように、所定の閾値ｔｈ（例えば、１．５）以上の影響度の傾きｂ_ｉが所定数以上連続している期間を重要期間として特定する。推定用時系列データが示す期間内に重要期間に該当する期間が複数存在する場合、特定部１３は、それらの全ての期間を重要期間として特定する。この場合、特定部１３は、各重要期間内の傾きｂ_ｉの平均値が高い順に重要期間をランク付けしてもよい。特定部１３は、特定した重要期間を出力部１４に通知する。

【0032】

出力部１４は、学習推定装置３０から出力された、例えば図５に示すような推定結果において選択された理由提示ボタンに対応する従業員について、特定部１３により特定された重要期間を推定理由として出力する。また、出力部１４は、推定用時系列データの重要期間に含まれるデータ、及び重要期間に含まれるデータの集計結果の少なくとも一方を、推定結果に影響を与えた要因として、推定理由に含めて出力してもよい。図１１に、推定理由の出力例を示す。図１１の例では、１つの重要期間が特定されており、重要期間に含まれるデータの集計結果を重要期間と共に出力した例を示している。

【0033】

図１２に、推定理由の他の出力例を示す。図１２の例では、出力部１４は、重要期間と共に、推定用時系列データが示す期間のうち、重要期間のデータと、重要期間以外の期間のデータとを比較した結果を、推定結果に影響を与えた要因として出力している。

【0034】

影響判定装置１０は、例えば図１３に示すコンピュータ５０で実現することができる。コンピュータ５０は、ＣＰＵ（Central Processing Unit）５１と、一時記憶領域としてのメモリ５２と、不揮発性の記憶部５３とを備える。また、コンピュータ５０は、入力部、表示部等の入出力装置５４と、記憶媒体５９に対するデータの読み込み及び書き込みを制御するＲ／Ｗ（Read/Write）部５５とを備える。また、コンピュータ５０は、インターネット等のネットワークに接続される通信Ｉ／Ｆ（Interface）５６を備える。ＣＰＵ５１、メモリ５２、記憶部５３、入出力装置５４、Ｒ／Ｗ部５５、及び通信Ｉ／Ｆ５６は、バス５７を介して互いに接続される。

【0035】

記憶部５３は、ＨＤＤ（Hard Disk Drive）、ＳＳＤ（Solid State Drive）、フラッシュメモリ等によって実現できる。記憶媒体としての記憶部５３には、コンピュータ５０を、影響判定装置１０として機能させるための影響判定プログラム６０が記憶される。影響判定プログラム６０は、重回帰モデル学習プロセス６１と、算出プロセス６２と、特定プロセス６３と、出力プロセス６４とを有する。

【0036】

ＣＰＵ５１は、影響判定プログラム６０を記憶部５３から読み出してメモリ５２に展開し、影響判定プログラム６０が有するプロセスを順次実行する。ＣＰＵ５１は、重回帰モデル学習プロセス６１を実行することで、図１に示す重回帰モデル学習部１１として動作する。また、ＣＰＵ５１は、算出プロセス６２を実行することで、図１に示す算出部１２として動作する。また、ＣＰＵ５１は、特定プロセス６３を実行することで、図１に示す特定部１３として動作する。また、ＣＰＵ５１は、出力プロセス６４を実行することで、図１に示す出力部１４として動作する。また、ＣＰＵ５１は、生成された重回帰モデル２０をメモリ５２に展開する。これにより、影響判定プログラム６０を実行したコンピュータ５０が、影響判定装置１０として機能することになる。なお、プログラムを実行するＣＰＵ５１はハードウェアである。

【0037】

なお、影響判定プログラム６０により実現される機能は、例えば半導体集積回路、より詳しくはＡＳＩＣ（Application Specific Integrated Circuit）等で実現することも可能である。

【0038】

学習推定装置３０も、影響判定装置１０と同様に、ＣＰＵ、メモリ、記憶部、入出力装置、Ｒ／Ｗ部、通信Ｉ／Ｆ等を含むコンピュータで実現することができるため、詳細な説明を省略する。

【0039】

次に、本実施形態に係る推定システム１００の作用について説明する。まず、学習推定装置３０に学習用時系列データが入力されると、学習部３１が、入力された学習用時系列データを受け付ける。そして、学習部３１が、参照期間分（例えば、１８０日分）の時系列データに基づいて、それ以降の推定期間（例えば、９０日）内に療養欠勤が発生する確度を推定するための学習モデル４０を生成する。学習部３１は、生成した学習モデル４０を所定の記憶領域に記憶する。

【0040】

そして、学習推定装置３０に推定用時系列データが入力されると、推定部３２が、学習モデル４０に推定用時系列データを入力することにより、推定結果として、療養欠勤が発生する確度を得る。推定部３２は、例えば、図５に示すように、療養欠勤が発生する確度が高い順に該当の従業員をリストにした推定結果を出力する。

【0041】

出力された推定結果を示すリストが、例えば、人事部門や健康管理担当部門等の担当者が使用する情報処理装置の表示部に表示されると、影響判定装置１０において、図１４に示す影響判定処理が実行される。なお、影響判定処理は、開示の技術の影響判定方法の一例である。

【0042】

ステップＳ１１で、重回帰モデル学習部１１が、推定結果を示すリストに含まれるいずれかの理由提示ボタンが選択されたか否かを判定することにより、理由提示が指示されたか否かを判定する。理由提示が指示された場合には、処理はステップＳ１２へ移行し、指示されていない場合には、処理はステップＳ１８へ移行する。

【0043】

ステップＳ１２で、重回帰モデル学習部１１が、学習モデル４０に対応する特徴空間において、選択された理由提示ボタンに対応する従業員についての推定用時系列データの周辺の学習データを探索する。例えば、重回帰モデル学習部１１は、推定用時系列データを示すベクトルと、学習データを示すベクトルとのユークリッド距離が所定値以下の学習データを周辺の学習データとして探索する。

【0044】

次に、ステップＳ１３で、重回帰モデル学習部１１が、探索した周辺の学習データを用いて、該当の従業員についての推定用時系列データの周辺で、学習モデル４０の決定境界を局所的に近似した重回帰モデル２０を生成する。

【0045】

次に、ステップＳ１４で、算出部１２が、重回帰モデル２０において、推定用時系列データに含まれる各データに対応する日付より後の日付に対応する項の偏回帰係数を０とした場合の重回帰値を、日付（説明変数）毎の影響度として算出する。

【0046】

次に、ステップＳ１５で、特定部１３が、例えば（２）式により、影響度の傾きを日付（説明変数）毎に算出する。

【0047】

次に、ステップＳ１６で、特定部１３が、所定の閾値ｔｈ以上の影響度の傾きが所定数以上連続している期間を重要期間として特定する。特定部１３は、特定した重要期間を出力部１４に通知する。

【0048】

次に、ステップＳ１７で、出力部１４が、該当の従業員について、上記ステップＳ１６で特定された重要期間を推定理由として提示する。出力部１４は、推定用時系列データの重要期間に含まれるデータ、及び重要期間に含まれるデータの集計結果の少なくとも一方を、推定結果に影響を与えた要因として、推定理由に含めて出力してもよい。そして、処理はステップＳ１１に戻る。

【0049】

ステップＳ１８では、推定結果を示すリストの表示の終了が指示されたか否かを判定する。リストの表示の終了が指示されていない場合には、処理はステップＳ１１に戻り、終了が指示された場合には、影響判定処理は終了する。

【0050】

以上説明したように、本実施形態に係る推定システムによれば、影響判定装置が、過去の時系列データに基づいて、以降の推定期間における状態の推定結果を出力する学習モデルを局所的に近似した重回帰モデルを生成する。そして、影響判定装置は、重回帰モデルを示す回帰方程式の各項に、時系列データの各日付のデータを時系列順に対応させ、各日付に対応する項より後の項の偏回帰係数を０とした場合の重回帰値を、日付毎の影響度として算出する。さらに、影響判定装置は、日付毎の影響度の傾きが所定値以上で所定数連続する期間を重要期間として特定し、推定結果の理由として出力する。これにより、時系列データを用いた推定において、より推定結果に影響を与えた時系列データの部分を判定することができる。

【0051】

なお、上記実施形態では、従業員の勤怠データに基づいて、数か月先のメンタル不調による休職に繋がる療養欠勤の発生を推定する例について説明したが、これに限定されない。例えば、株価等の変動を予測するシステム等、時系列データを用いた推定に適用することができる。

【0052】

また、時系列データの単位も日付単位に限定されず、時間単位、週単位、月単位等でもよい。いずれの場合でも、各時点のデータを、重回帰モデルを示す回帰方程式の各項に時系列順に対応させることにより、開示の技術を適用することができる。

【0053】

また、上記実施形態では、影響度の時系列的な変化を示す指標として、影響度の傾きを用いる場合について説明したが、これに限定されない。例えば、各時点の影響度の移動平均をとる等、周辺の時点における影響度を考慮した指標を用いてもよい。

【0054】

また、上記実施形態では、影響度判定装置と学習推定装置とを別々のコンピュータで実現する場合について説明したが、影響度判定装置と学習推定装置とを１つのコンピュータで実現してもよい。

【0055】

また、上記実施形態では、影響判定プログラムが記憶部に予め記憶（インストール）されている態様を説明したが、これに限定されない。開示の技術に係るプログラムは、ＣＤ－ＲＯＭ、ＤＶＤ－ＲＯＭ、ＵＳＢメモリ等の記憶媒体に記憶された形態で提供することも可能である。

【0056】

以上の実施形態に関し、更に以下の付記を開示する。

【0057】

（付記１）
時系列データに基づいて推定結果を出力する機械学習モデルを近似した重回帰モデルの各項に、前記時系列データの各時点のデータを時系列順に対応させ入力する際、前記各時点のデータのそれぞれに対して、前記各時点のデータのそれぞれより後の時点のデータに対応する前記重回帰モデルの項の偏回帰係数を０として、重回帰値を算出し、
前記各時点のデータのそれぞれについて算出された前記重回帰値の変化に応じて、前記時系列データが示す期間のうち、特定の条件を満たす期間を特定し、
特定された前記特定の条件を満たす期間に関する情報を、前記推定結果に影響を与えた要因として出力する、
処理をコンピュータに実行させることを特徴とする影響判定プログラム。

【0058】

（付記２）
前記特定の条件を満たす期間を特定する処理は、前記各時点のデータのそれぞれに対して算出された前記重回帰値が、時系列順に継続的に増加する期間を、前記特定の条件を満たす期間として特定する処理である、
ことを特徴とする付記１に記載の影響判定プログラム。

【0059】

（付記３）
前記重回帰値が継続的に増加する期間として特定する処理は、前記各時点のデータのそれぞれに対して算出された前記重回帰値の時系列における変化の度合いを前記各時点のデータのそれぞれに対して算出し、閾値以上の変化の度合いを示すデータが所定数連続する期間を、前記重回帰値が継続的に増加する期間として特定する処理である、
ことを特徴とする付記２に記載の影響判定プログラム。

【0060】

（付記４）
前記特定の条件を満たす期間に関連する情報は、前記特定の条件を満たす期間を示す情報、前記時系列データのうち前記特定の条件を満たす期間に含まれるデータを示す情報、前記時系列データのうち前記特定の条件を満たす期間に含まれるデータの集計結果、前記時系列データのうち前記特定の条件を満たす期間に含まれるデータとそれ以外のデータとの比較結果の少なくとも一つを含む、
ことを特徴とする付記１～付記３のいずれか１項に記載の影響判定プログラム。

【0061】

（付記５）
前記重回帰モデルは、前記機械学習モデルの学習に利用された学習データであって、前記機械学習モデルに対応する特徴空間において、前記時系列データの周辺に位置する前記学習データを用いた機械学習により生成される、
ことを特徴とする付記１～付記４のいずれか１項に記載の影響判定プログラム。

【0062】

（付記６）
時系列データに基づいて推定結果を出力する機械学習モデルを近似した重回帰モデルの各項に、前記時系列データの各時点のデータを時系列順に対応させ入力する際、前記各時点のデータのそれぞれに対して、前記各時点のデータのそれぞれより後の時点のデータに対応する前記重回帰モデルの項の偏回帰係数を０として、重回帰値を算出する算出部と、
前記各時点のデータのそれぞれについて算出された前記重回帰値の変化に応じて、前記時系列データが示す期間のうち、特定の条件を満たす期間を特定する特定部と、
特定された前記特定の条件を満たす期間に関する情報を、前記推定結果に影響を与えた要因として出力する出力部と、
を含むことを特徴とする影響判定装置。

【0063】

（付記７）
前記特定部は、前記各時点のデータのそれぞれに対して算出された前記重回帰値が、時系列順に継続的に増加する期間を、前記特定の条件を満たす期間として特定する、
ことを特徴とする付記６に記載の影響判定装置。

【0064】

（付記８）
前記特定部は、前記各時点のデータのそれぞれに対して算出された前記重回帰値の時系列における変化の度合いを前記各時点のデータのそれぞれに対して算出し、閾値以上の変化の度合いを示すデータが所定数連続する期間を、前記重回帰値が継続的に増加する期間として特定する、
ことを特徴とする付記７に記載の影響判定装置。

【0065】

（付記９）
前記特定の条件を満たす期間に関連する情報は、前記特定の条件を満たす期間を示す情報、前記時系列データのうち前記特定の条件を満たす期間に含まれるデータを示す情報、前記時系列データのうち前記特定の条件を満たす期間に含まれるデータの集計結果、前記時系列データのうち前記特定の条件を満たす期間に含まれるデータとそれ以外のデータとの比較結果の少なくとも一つを含む、
ことを特徴とする付記６～付記８のいずれか１項に記載の影響判定装置。

【0066】

（付記１０）
前記重回帰モデルは、前記機械学習モデルの学習に利用された学習データであって、前記機械学習モデルに対応する特徴空間において、前記時系列データの周辺に位置する前記学習データを用いた機械学習により生成される、
ことを特徴とする付記６～付記９のいずれか１項に記載の影響判定装置。

【0067】

（付記１１）
時系列データに基づいて推定結果を出力する機械学習モデルを近似した重回帰モデルの各項に、前記時系列データの各時点のデータを時系列順に対応させ入力する際、前記各時点のデータのそれぞれに対して、前記各時点のデータのそれぞれより後の時点のデータに対応する前記重回帰モデルの項の偏回帰係数を０として、重回帰値を算出し、
前記各時点のデータのそれぞれについて算出された前記重回帰値の変化に応じて、前記時系列データが示す期間のうち、特定の条件を満たす期間を特定し、
特定された前記特定の条件を満たす期間に関する情報を、前記推定結果に影響を与えた要因として出力する、
処理をコンピュータが実行することを特徴とする影響判定方法。

【0068】

（付記１２）
前記特定の条件を満たす期間を特定する処理は、前記各時点のデータのそれぞれに対して算出された前記重回帰値が、時系列順に継続的に増加する期間を、前記特定の条件を満たす期間として特定する処理である、
ことを特徴とする付記１１に記載の影響判定方法。

【0069】

（付記１３）
前記重回帰値が継続的に増加する期間として特定する処理は、前記各時点のデータのそれぞれに対して算出された前記重回帰値の時系列における変化の度合いを前記各時点のデータのそれぞれに対して算出し、閾値以上の変化の度合いを示すデータが所定数連続する期間を、前記重回帰値が継続的に増加する期間として特定する処理である、
ことを特徴とする付記１２に記載の影響判定方法。

【0070】

（付記１４）
前記特定の条件を満たす期間に関連する情報は、前記特定の条件を満たす期間を示す情報、前記時系列データのうち前記特定の条件を満たす期間に含まれるデータを示す情報、前記時系列データのうち前記特定の条件を満たす期間に含まれるデータの集計結果、前記時系列データのうち前記特定の条件を満たす期間に含まれるデータとそれ以外のデータとの比較結果の少なくとも一つを含む、
ことを特徴とする付記１１～付記１３のいずれか１項に記載の影響判定方法。

【0071】

（付記１５）
前記重回帰モデルは、前記機械学習モデルの学習に利用された学習データであって、前記機械学習モデルに対応する特徴空間において、前記時系列データの周辺に位置する前記学習データを用いた機械学習により生成される、
ことを特徴とする付記１１～付記１４のいずれか１項に記載の影響判定方法。

【0072】

（付記１６）
時系列データに基づいて推定結果を出力する機械学習モデルを近似した重回帰モデルの各項に、前記時系列データの各時点のデータを時系列順に対応させ入力する際、前記各時点のデータのそれぞれに対して、前記各時点のデータのそれぞれより後の時点のデータに対応する前記重回帰モデルの項の偏回帰係数を０として、重回帰値を算出し、
前記各時点のデータのそれぞれについて算出された前記重回帰値の変化に応じて、前記時系列データが示す期間のうち、特定の条件を満たす期間を特定し、
特定された前記特定の条件を満たす期間に関する情報を、前記推定結果に影響を与えた要因として出力する、
処理をコンピュータに実行させることを特徴とする影響判定プログラムを記憶した記憶媒体。

【符号の説明】

【0073】

１０影響判定装置
１１重回帰モデル学習部
１２算出部
１３特定部
１４出力部
２０重回帰モデル
３０学習推定装置
３１学習部
３２推定部
４０学習モデル
５０コンピュータ
５１ＣＰＵ
５２メモリ
５３記憶部
５９記憶媒体
６０影響判定プログラム
１００推定システム

【図1】