(19)【発行国】日本国特許庁(JP)
(12)【公報種別】公開特許公報(A)
(11)【公開番号】P2023132261
(43)【公開日】2023-09-22
(54)【発明の名称】情報処理方法、情報処理プログラム、及び情報処理装置、並びに学習済みモデル
(51)【国際特許分類】
G06F 16/9035 20190101AFI20230914BHJP
G06N 20/00 20190101ALI20230914BHJP
G06Q 10/00 20230101ALI20230914BHJP
【FI】
G06F16/9035
G06N20/00
G06Q10/00
【審査請求】未請求
【請求項の数】9
【出願形態】OL
(21)【出願番号】P 2022037482
(22)【出願日】2022-03-10
(71)【出願人】
【識別番号】302064762
【氏名又は名称】株式会社日本総合研究所
(74)【代理人】
【識別番号】100114557
【弁理士】
【氏名又は名称】河野 英仁
(74)【代理人】
【識別番号】100078868
【弁理士】
【氏名又は名称】河野 登夫
(72)【発明者】
【氏名】打越 元信
(72)【発明者】
【氏名】市川 幸史
【テーマコード(参考)】
5B175
5L049
【Fターム(参考)】
5B175FB04
5L049AA20
(57)【要約】
【課題】未知の異常の検出に迅速に対応可能な情報処理方法等を提供すること。
【解決手段】情報処理方法は、分析対象データを取得し、入力データから複数の特徴量を出力する学習モデルへ、取得した分析対象データを入力し、前記複数の特徴量それぞれに対する重みに基づいて、分析対象データの複数の特徴量から分析結果を算出し、算出した分析結果を出力する処理をコンピュータが実行することを特徴とする。
【選択図】
図7
【特許請求の範囲】
【請求項1】
分析対象データを取得し、
入力データから複数の特徴量を出力する学習モデルへ、取得した分析対象データを入力し、
前記複数の特徴量それぞれに対する重みに基づいて、分析対象データの複数の特徴量から分析結果を算出し、
算出した分析結果を出力する
処理をコンピュータが実行することを特徴とする情報処理方法。
【請求項2】
前記重みは専門家からの指示に基づき設定されたものである
ことを特徴とする請求項1に記載の情報処理方法。
【請求項3】
前記複数の特徴量それぞれに対する重みを一組として、複数組の重みを取得し、
取得した複数組の重みを記憶する
ことを特徴とする請求項1又は請求項2に記載の情報処理方法。
【請求項4】
取得した分析対象データの種類を判別し、
判別結果を出力する
ことを特徴とする請求項1から請求項3の何れか一項に記載の情報処理方法。
【請求項5】
取得した分析対象データの種類の判別し、
既知の種類と判別した場合、判別した種類に対応付けられた一組の前記重みを取得し、
未知の種類と判別した場合、前記複数の特徴量それぞれに対する重みを受け付ける
ことを特徴とする請求項1から請求項4の何れか一項に記載の情報処理方法。
【請求項6】
分析対象データを入力した場合、前記複数の特徴量に対する重みを出力するアテンションモデルへ、取得した分析対象データを入力し、
前記アテンションモデルから重みを取得する
ことを特徴とする請求項1に記載の情報処理方法。
【請求項7】
分析対象データを取得し、
入力データから複数の特徴量を出力する学習モデルへ、取得した分析対象データを入力し、
前記複数の特徴量それぞれに対する重みを受け付け、
受け付けた前記重みに基づいて、分析対象データの複数の特徴量から分析結果を算出し、
算出した分析結果を出力する
処理をコンピュータに実行させることを特徴とする情報処理プログラム。
【請求項8】
分析対象データを取得する取得部と、
入力データから複数の特徴量を出力する学習モデルへ、取得した分析対象データを入力する入力部と、
前記複数の特徴量それぞれに対する重みを受け付ける受付部と、
受け付けた前記重みに基づいて、分析対象データの複数の特徴量から分析結果を算出し、
算出した分析結果を出力する出力部と
を備えることを特徴とする情報処理装置。
【請求項9】
分析対象データが入力される入力層と、
入力された前記分析対象データから複数の特徴量を抽出する抽出層と、
前記複数の特徴量それぞれに対応する重みに基づいて、分析結果を算出するアテンション機構と、
前記分析結果を出力する出力層と
を備え、
前記分析対象データを前記入力層へ入力し、前記抽出層における抽出処理を行い、前記アテンション機構における算出処理を行い、出力層から分析結果を出力するようにコンピュータを機能させるための学習済みモデル。
【発明の詳細な説明】
【技術分野】
【0001】
本発明は、分析対象データについて、複数の特徴量による分析結果を出力する情報処理方法等に関する。
【背景技術】
【0002】
特異な現象を検知するシステムが提案されている。特異な現象を検知する例として、文書の内容の異常を検出するシステムが提案されている。例えば、特許文献1には、複数の企業の財務データを比較することで、粉飾決算等の結果として得られるデータを異常値として把握することができるようにするためデータ分析装置が提案されている。
【先行技術文献】
【特許文献】
【0003】
【発明の概要】
【発明が解決しようとする課題】
【0004】
特許文献1に記載のデータ分析では、複数の企業のデータを比較して、データ異常を検出する。そのため、分析対象企業が正当な理由により、業績を伸ばした場合や業績不振に陥った場合においても、異常と検出されるおそれがある。
【0005】
一方、学習モデルを用いた異常検知においては、学習時に用いた訓練データとは傾向が異なる異常データを検知できない場合がある。それに対して、学習モデルの振る舞いを人の手を介して制御するHITL(Human in the loop)という手法が提案されている。HITLでは、学習モデルの制御を行う際、既存の訓練データ内のラベルを付け替えモデルの再学習を行う。少量のラベル付け替えデータによる再学習では、事態に即応できない場合がある。ラベル付け替えを、工数・迅速さの制約から少量しか行なわない場合、又は、どのラベルを付け替えればいいのか明確でない場合、モデル出力をうまくコントロールできないからである。また、新たなデータに似たものが既にある訓練データ中に含まれていないため、モデル出力をうまくコントロールできないからである。
【0006】
本発明はこのような状況に鑑みてなされたものである。その目的は、未知の異常の検出に迅速に対応可能な情報処理方法等の提供である。
【課題を解決するための手段】
【0007】
本願の一態様に係る情報処理方法は、分析対象データを取得し、入力データから複数の特徴量を出力する学習モデルへ、取得した分析対象データを入力し、前記複数の特徴量それぞれに対する重みに基づいて、分析対象データの複数の特徴量から分析結果を算出し、算出した分析結果を出力する処理をコンピュータが実行することを特徴とする。
【発明の効果】
【0008】
本願の一観点によれば、未知の異常の検出に迅速に対応可能となる。
【図面の簡単な説明】
【0009】
【
図2】検知サーバのハードウェア構成を示すブロック図である。
【
図3】監視端末のハードウェア構成を示すブロック図である。
【
図6】生成処理の手順例を示すフローチャートである。
【
図7】検知処理の手順例を示すフローチャートである。
【
図8】調整処理の手順例を示すフローチャートである。
【
図10】検知処理の他の手順例を示すフローチャートである。
【
図13】再学習処理の手順例を示すフローチャートである。
【発明を実施するための形態】
【0010】
以下実施の形態を、図面を参照して説明する。
図1は検知システムの構成例を示す説明図である。検知システム100は、検知サーバ1と監視端末2とを含む。検知サーバ1及び監視端末2はネットワークNにより、互いに通信可能に接続されている。検知サーバ1はデータの異常を検知する。監視端末2は検知サーバ1の動作をモニタリングする場合や、検知サーバ1の判定が適切であるかを定期的に検証する場合に使用する端末である。
【0011】
検知サーバ1はサーバコンピュータ、ワークステーション、PC(Personal Computer)等で構成する。また、検知サーバ1を複数のコンピュータからなるマルチコンピュータ、ソフトウェアによって仮想的に構築された仮想マシン又は量子コンピュータで構成しても良い。さらに、検知サーバ1の機能をクラウドサービスで実現してもよい。
【0012】
監視端末2はノートパソコン、タブレットコンピュータ、スマートフォン等で構成する。
図1には監視端末2が1台しか表示されていないが、2台以上であってもよい。
【0013】
図2は検知サーバのハードウェア構成を示すブロック図である。検知サーバ1は制御部11、主記憶部12、補助記憶部13、通信部15及び読み取り部16を含む。制御部11、主記憶部12、補助記憶部13、通信部15及び読み取り部16はバスBにより接続されている。
【0014】
制御部11は、一又は複数のCPU(Central Processing Unit)、MPU(Micro-Processing Unit)、GPU(Graphics Processing Unit)等の演算処理装置を有する。制御部11は、補助記憶部13に記憶された制御プログラム1P(プログラム、プログラム製品)を読み出して実行することにより、検知サーバ1に係る種々の情報処理、制御処理等を行い、取得部、入力部、受付部、出力部等の機能部を実現する。
【0015】
主記憶部12は、SRAM(Static Random Access Memory)、DRAM(Dynamic Random Access Memory)、フラッシュメモリ等である。主記憶部12は主として制御部11が演算処理を実行するために必要なデータを一時的に記憶する。
【0016】
補助記憶部13はハードディスク又はSSD(Solid State Drive)等であり、制御部11が処理を実行するために必要な制御プログラム1Pや各種DB(Database)を記憶する。補助記憶部13は分析対象DB131、判定結果DB132、重みDB133等を記憶する。また、補助記憶部13は検知モデル14を記憶する。補助記憶部13は検知サーバ1に接続された外部記憶装置であってもよい。補助記憶部13に記憶する各種DB等を、検知サーバ1とは異なるデータベースサーバやクラウドストレージに記憶してもよい。
【0017】
通信部15はネットワークNを介して、監視端末2と通信を行う。また、制御部11が通信部15を用い、ネットワークN等を介して他のコンピュータから制御プログラム1Pをダウンロードし、補助記憶部13に記憶してもよい。
【0018】
読み取り部16はCD(Compact Disc)-ROM及びDVD(Digital Versatile Disc)-ROMを含む可搬型記憶媒体1aを読み取る。制御部11が読み取り部16を介して、制御プログラム1Pを可搬型記憶媒体1aより読み取り、補助記憶部13に記憶してもよい。また、半導体メモリ1bから、制御部11が制御プログラム1Pを読み込んでもよい。
【0019】
図3は監視端末のハードウェア構成を示すブロック図である。監視端末2は制御部21、主記憶部22、補助記憶部23、通信部24、入力部25及び表示部26を含む。各構成はバスBで接続されている。
【0020】
制御部21は、一又は複数のCPU、MPU、GPU等の演算処理装置を有する。制御部21は、補助記憶部23に記憶された制御プログラム2P(プログラム、プログラム製品)を読み出して実行することにより、種々の機能を提供する。
【0021】
主記憶部22は、SRAM、DRAM、フラッシュメモリ等である。主記憶部22は主として制御部21が演算処理を実行するために必要なデータを一時的に記憶する。
【0022】
補助記憶部23はハードディスク又はSSD等であり、制御部21が処理を実行するために必要な各種データを記憶する。補助記憶部23は監視端末2に接続された外部記憶装置であってもよい。補助記憶部23に記憶する各種DB等を、データベースサーバやクラウドストレージに記憶してもよい。
【0023】
通信部24はネットワークNを介して、検知サーバ1と通信を行う。また、制御部21が通信部24を用い、ネットワークN等を介して他のコンピュータから制御プログラム2Pをダウンロードし、補助記憶部23に記憶してもよい。
【0024】
入力部25はキーボードやマウスである。表示部26は液晶表示パネル等を含む。表示部26は検知サーバ1が出力した判定結果などを表示する。また、入力部25と表示部26とを一体化し、タッチパネルディスプレイを構成してもよい。なお、監視端末2は外部の表示装置に表示を行ってもよい。
【0025】
図4は検知モデルの例を示す説明図である。検知モデル14は複数の数値組を入力として受け付け、数値組における値の組み合わせの正常/異常を判定し、その結果を出力する。以下の説明において、検知モデル14は会社の粉飾決算等を検知するものである。検知モデル14が正常/異常を判定する対象として、医療データ(生体情報モニタにおける異常検知、臨床検査における異常検知等)、保険申請データ(レセプトにおける不正請求の検知等)、工場稼働データ(生産機械のログによる動作異常、故障検知、製品検査データの改ざん検知等)等でもよい。検知モデル14は、入力として売上、粗利率、負債、資産等の財務データを受け付け、これらの数値の組み合わせの正常/異常の判定結果を出力する。異常と判定された場合、数値を人為的に書き換えられた可能性がある。
【0026】
検知モデル14は教師なし学習モデル141、教師あり学習モデル142、Attention機構143(アテンション機構)を含む。教師なし学習モデル141は入力データ(分析対象データ)の既知/未知を判別し、判別結果を出力する。ここで、既知/未知の判別とは、入力データが、教師あり学習モデル142の訓練データとして使用されたか(使用されたデータに類似のデータであるか)否かを判別することに相当する。例えば、教師なし学習モデル141には、例えば、k-NN(k-Nearest Neighbor:k近傍法)、GMM(Gaussian Mixture Model:混合正規分布)、AE(Auto Encoder:オートエンコーダー)などが実装されている。教師なし学習モデル141は、入力データと、訓練データとして使われた過去データとの乖離スコアを導出する。教師なし学習モデル141は、導出した乖離スコアが所定の閾値以上となった場合、入力データを未知のデータと判別し、乖離スコアが閾値より小さくなった場合、入力データを既知のデータと判別する。なお、学習モデル141は教師あり学習モデルでもよい。この場合、入力データに既知・未知のラベルをつけた訓練データを作成し、作成した訓練データを用いて教師あり学習を行い、学習モデル141を生成する。
【0027】
教師あり学習モデル142は財務データを入力として受け付け、特徴量ごとの異常度を出力する。なお、異常度は必ずしも1つの数値である必要はなく、複数の観点それぞれについて異常さを表しているベクトルでもよい。教師あり学習モデル142は財務データの特徴を学習するディープラーニングを行うことで、財務データを入力とし、異常性を示す複数観点それぞれの異常度を出力とする学習モデルを生成する。教師あり学習モデル142は、ロジスティック回帰モデルや勾配ブースティング、多層パーセプトロン等により構成する。なお、入力データはある時点のデータのみではなく、時系列データでもよい。画像データや音声データを入力データとしてもよい。
【0028】
教師あり学習モデル142の中間層(抽出層)から出力された各観点の異常度は、Attention機構143に入力される。観点は入力データと対応していることが望ましい。ここでは入力データに対応する4つの観点、売上、粗利率、負債、資産についての異常度が、Attention機構143に入力される。Attention機構143は各異常度を重み付けして足し込んだ和を算出する。Attention機構143は、算出した和により、正常か異常かを判定し、その結果(分析結果)を出力層から出力する。正常か異常かの判定は、例えば次のように行う。算出した和が所定の閾値以上であれば異常、算出した和が所定の閾値未満であれば正常、と判定する。Attention機構143は各異常度を重み付けして足し込んだ和を算出したが、各異常度を重み付けして乗算した値を算出してもよい。
【0029】
なお、上述したように、観点は入力データと対応していることが望ましいのは、有識者からの助言を、どのように重みに反映するかの見極めが容易となるからである。例えば、他の値に比べて、負債についてより注目すべきとの助言を受けた場合、負債についての重みを相対的に増大させればよい。したがって、有識者の助言に基づく重みの調整が容易に行なえるのであれば、観点は入力データと1対1でなくともよい。例えば、入力データに売上高、及び、総資産が含まれている場合、売上高、及び、総資産の異常度に加え、総資産回転率の異常度が、中間層から出力されてもよい。総資産回転率は、売上高、及び、総資産から算出されるため、入力データとの関係が分かるからである。
【0030】
図5は重みDBの例を示す説明図である。重みDB133はAttention機構143が用いる重みを記憶する。重みDB133はID列、分類列、日時列、運用列、売上列、粗利率列、負債列及び資産列を含む。ID列は一組の重みを特定するIDを記憶する。分類列は重みを使用する入力データの分類を記憶する。日時列は重みが定義された日時を記憶する。運用列は重みが運用において使用されているか否か記憶する。売上列、粗利率列、負債列、及び資産列はそれぞれ、売上、粗利率、負債、及び資産それぞれの重みを記憶する。
【0031】
次に、検知システム100で行われる情報処理について説明する。
図6は生成処理の手順例を示すフローチャートである。生成処理は教師あり学習モデル142及びAttention機構143を生成する処理である。検知サーバ1の制御部11は訓練データを取得する(ステップS1)。訓練データは入力とする財務データと、財務データの正常/異常を示すラベル(正解値)を含む。制御部11は訓練データに含む財務データにより、教師なし学習モデル141の学習を行う(ステップS2)。
【0032】
また、制御部11は訓練データによる教師あり学習モデル142の学習を行う(ステップS3)。制御部11は訓練データである財務データを、教師あり学習モデル142の入力層に入力し、中間層での演算処理、Attention機構143での処理を経て、出力層から判定結果を取得する。なお、出力層から出力される判定結果は離散的な値(例えば「0」又は「1」の値)であってもよく、連続的な確率値(例えば「0」から「1」までの範囲の値)であってもよい。
【0033】
制御部11は出力された判定結果を、訓練データのラベル、すなわち正解値と比較して、Attention機構143が出力する判定結果が正解値に近づくように、中間層での演算処理に用いるニューロン間の結合係数、活性化関数の係数などのパラメータやAttention機構143が用いる重みを最適化する。パラメータや重みの最適化の方法は特に限定されないが、例えば制御部11は誤差逆伝播法を用いて各種パラメータや重みの最適化を行う。
【0034】
制御部11は訓練データのデータ数に応じて、ステップS2及びステップS3を繰り返し実行する。制御部11は学習した結果を記憶し(ステップS4)、処理を終了する。以降、学習済みの検知モデル14を用いて、異常な財務データの検知が行われる。
【0035】
図7は検知処理の手順例を示すフローチャートである。検知処理は学習済みの検知モデル14を用いて、異常な財務データの検知を行う処理である。検知サーバ1の制御部11は、処理対象となる入力データを分析対象DB131から取得する(ステップS11)。制御部11は教師なし学習モデル141を用いて、入力データが既知であるか、未知であるかを判別する(ステップS12)。制御部11は教師あり学習モデル142を用いて、正常/異常の判定を行う(ステップS13)。制御部11は結果を出力し(ステップS14)、処理を終了する。出力する結果は、正常/異常の判定結果とともに、入力データの既知/未知の判定結果を出力することが望ましい。出力された結果は判定結果DB132に記憶される。入力データが未知と判別された場合、正常/異常の判定結果の信頼性は低いと考えられるため、正常/異常の判定は有識者などの人が行うことが望ましい。
【0036】
さらに、未知と判別された入力データの正常/異常の判定結果が、専門家による判定と食い違った場合、その後、同様な財務データが入力された場合に、検知モデル14は正常/異常の判定を誤る可能性があるため、検知モデル14の調整を行う。調整を行うに際して、未知データの検証を有識者に依頼する。未知データの正常/異常を判定する際に注目すべき事項について、有識者から助言を得る。助言に基づき、Attention機構143の重みを変更する。具体的には、有識者が指摘した注目すべき事項に対応する観点に対する重みを変更する。
【0037】
図8は調整処理の手順例を示すフローチャートである。検知サーバ1の制御部11はAttention機構143の重みを修正する(ステップS21)。重みの修正幅は微小値にする。重みの値は0から1の間とした場合、例えば0.001を修正幅とする。制御部11は検証を行う(ステップS22)。制御部11は、Attention機構143の重みを修正した後の検知モデル14に未知データを入力し、判定結果を得る。制御部11は判定結果が正解であるか否かを判定する(ステップS23)。制御部11は判定結果が正解でないと判定した場合(ステップS23でNO)、重みを修正する(ステップS21)。例えば、1回目に重みを0.001増加させていた場合、2回目はさらに、0.001増加させる。制御部11は判定結果が正解であると判定した場合(ステップS23でYES)、修正した重みを記憶し(ステップS24)、処理を終了する。なお、重みを調整したAttention機構143は上書きをせずに、新たに記憶することが望ましい。そして、検知モデル14を変更し、調整前後のAttention機構143を共に利用可能とする。
【0038】
図9は検知モデルの他例を示す説明図である。
図9に示す検知モデル14は、教師なし学習モデル141、教師あり学習モデル142、第1Attention機構1431、第2Attention機構1432、選択機構144を含む。
図9に示す検知モデル14を、
図4に示した検知モデル14と比較すると、Attention機構143が第1Attention機構1431と第2Attention機構1432との2つ構成となり、2つのAttention機構を切り替える選択機構144が追加されている。第1Attention機構1431は学習により生成されたAttention機構であり、第2Attention機構1432は未知データを基に重みが調整されたAttention機構である。
【0039】
図10は検知処理の他の手順例を示すフローチャートである。
図10に示す検知処理は
図9に示した検知モデルを用いた処理である。検知サーバ1の制御部11は入力データを取得する(ステップS31)。制御部11は入力を教師あり学習モデル142へ入力し、入力データが既知か否かを判別する(ステップS32)。制御部11は入力データが既知と判別した場合(ステップS32でYES)、既知用のAttention機構を選択する(ステップS33)。制御部11は、教師あり学習モデル142が出力した複数観点についての異常度を、第1Attention機構1431へ入力されるよう選択機構144を制御する。制御部11は入力データが既知と判別しなかった場合(ステップS32でNO)、未知用のAttention機構を選択する(ステップS34)。制御部11は、教師あり学習モデル142が出力した複数観点についての異常度を、第2Attention機構1432へ入力されるよう選択機構144を制御する。制御部11は判定を行う(ステップS35)。制御部11は、第1Attention機構1431又は第2Attention機構1432が出力した判定結果を取得する。制御部11は判定結果を出力する(ステップS36)。
【0040】
本実施の形態は以下の効果を奏する。従来の技術では、正常/異常の判定が正確に行えない未知データに対応するために、教師あり学習モデル142を再学習させる必要がある。ある程度の量の訓練データを用いた処理が必要となるため、検知システム100の運用をまとまった時間、停止する必要がある。しかし、本実施の形態は未知のデータに対応するため、Attention機構143を調整するので、検知システム100の運用を停止する時間を短くすることが可能となる。
【0041】
なお、上述では、未知のデータに対応するために、Attention機構143の重みを調整するのでなく、再学習を行なってもよい。以下の手順となる。有識者が指摘した注目すべき事項に対応する観点に対する重みを変更する。重みを変更したAttention機構143を訓練データによって再学習を行う。再学習したAttention機構143を用いた検知モデル14を利用して、入力データの正常/異常を判定する。
【0042】
上述では、入力データを未知又は既知に判別し、判別した結果に基づき、2つのAttention機構を切り替えるとしたが、それに限られない。学習時に、教師なし学習モデル141で入力データのクラスタリングを行い、複数の分類を得る。各分類に対応して、Attention機構を用意し、それぞれを学習させる。運用時、教師なし学習モデル141により、入力データの分類を判定し、判定した分類に対応したAttention機構を使用して、異常判定を行う。
【0043】
分類毎にAttention機構を用意した場合において、入力データがいずれの分類に属するか、教師なし学習モデル141により判定できないときは、未知データであると判定する。そして、当該未知データを処理するための新たなAttention機構を追加する。
【0044】
図11は重み調整画面の例を示す説明図である。重み調整画面は現在表示111、入力データ112、判定結果113、スライダー114、保存ボタン115、上書きボックス116、及びキャンセルボタン117を含む。現在表示111には、現在使用されている重みが表示される。現在使用されている重みが複数組ある場合は、編集対象又は参照対象の重みの組が表示される。入力データ112は重みの調整の経緯となった未知のデータが表示される。判定結果113は現在の重みでの判定結果を表示する。スライダー114により重みの変更が可能である。保存ボタン115が選択されるとスライダー114で設定された重みが重みDB133に記憶される。この際、上書きボックス116にチェックが入っていなければ、新規保存される。上書きボックス116にチェック入っていた場合は、重みが上書きされる。キャンセルボタン117が選択されると、前の画面に戻る、又は、重み調整画面は閉じられる。
【0045】
検知モデル14の他の例として、Attention機構143が重みの学習を行う場合について説明する。
図12は検知モデルの他例を示す説明図である。検知モデル14は教師あり学習モデル142、Attention機構143、積和演算部145、及びしきい値判定部146を含む。Attention機構143(アテンションモデル)は教師あり学習を行うモデルである。Attention機構143は教師あり学習モデル142の出力を入力データとして受け付け、教師あり学習モデル142の出力に対応する重み(w1、w2、w3、w4)を出力する。教師あり学習モデル142は上述したものと同様であるから説明を省略する。積和演算部145は教師あり学習モデル142の出力値に、Attention機構143が出力に基づく重み付けを行い、判定値を計算する。しきい値判定部146は判定値と所定のしきい値とを対照し、判定結果を0(正常)又は1(異常)とする二値化を行う。
図12において、教師あり学習モデル142の出力ノード数は、入力データの項目数と同じ4個としているが、それに限られない。出力ノード数を2個、3個、又は5個以上としてもよい。また、専門家が重みを(w1’、w2’、w3’、w4’)のように調整していた場合、Attention機構143の学習において、この重みの値を教師として、異常度と同時に学習してもよい。
【0046】
検知モデル14を生成時においては、訓練データに基づき、教師あり学習モデル142の各種パラメータの最適化を行う共に、Attention機構143の各種パラメータの最適化も行う。
【0047】
検知モデル14の運用時において、検知モデル14による正常/異常の判定結果をランダムに抽出し、専門家による検証を行う。検知モデル14による判定結果が専門家による判定と食い違うものがあった場合、Attention機構143の入力データである、教師あり学習モデル142の出力と、Attention機構143が出力すべき重みとを対応付けた再学習用の訓練データを生成する。
図13は再学習処理の手順例を示すフローチャートである。制御部11は訓練データを選択する(ステップS41)。制御部11は学習を行う(ステップS42)。制御部11は訓練データに含む教師あり学習モデル142の出力を、Attention機構143に入力する。制御部11はAttention機構143が出力した重みを、訓練データに含まれる正解データと比較して、Attention機構143が出力する重みが正解値に近づくように、中間層での演算処理に用いるニューロン間の結合係数、活性化関数の係数などのパラメータを最適化する。制御部11は未処理の訓練データがあるか否かを判定する(ステップS43)。制御部11は未処理の訓練データがあると判定した場合(ステップS43でYES)、処理をステップS41へ戻し、未処理の訓練データを用いた再学習を行う。制御部11は未処理の訓練データがないと判定した場合(ステップS43でNO)、最適化したパラメータを記憶し(ステップS44)、処理を終了する。
【0048】
図12に示した検知モデル14を使用する場合においては、運用中に未知データを発見したときは、Attention機構143を再学習するだけで、未知データの対応が可能となる。
【0049】
各実施の形態で記載されている技術的特徴(構成要件)はお互いに組み合わせ可能であり、組み合わせすることにより、新しい技術的特徴を形成することができる。
今回開示された実施の形態はすべての点で例示であって、制限的なものではないと考えられるべきである。本発明の範囲は、上記した意味ではなく、特許請求の範囲によって示され、特許請求の範囲と均等の意味及び範囲内でのすべての変更が含まれることが意図される。
【符号の説明】
【0050】
100 検知システム
1 検知サーバ
11 制御部
12 主記憶部
13 補助記憶部
131 分析対象DB
132 判定結果DB
133 重みDB
14 検知モデル
141 学習モデル
142 学習モデル
143 Attention機構
1431 第1Attention機構
1432 第2Attention機構
144 選択機構
15 通信部
16 読み取り部
1P 制御プログラム
1a 可搬型記憶媒体
1b 半導体メモリ
2 監視端末
21 制御部
22 主記憶部
23 補助記憶部
24 通信部
25 入力部
26 表示部
2P 制御プログラム
B バス
N ネットワーク