(19)【発行国】日本国特許庁(JP)
(12)【公報種別】特許公報(B2)
(11)【特許番号】
(24)【登録日】2023-07-19
(45)【発行日】2023-07-27
(54)【発明の名称】処理システム、及び処理プログラム
(51)【国際特許分類】
G06N 20/20 20190101AFI20230720BHJP
【FI】
G06N20/20
(21)【出願番号】P 2019130901
(22)【出願日】2019-07-16
【審査請求日】2022-01-17
(73)【特許権者】
【識別番号】501299163
【氏名又は名称】株式会社ベリサーブ
(74)【代理人】
【識別番号】100107364
【氏名又は名称】斉藤 達也
(72)【発明者】
【氏名】須原 秀敏
【審査官】多賀 実
(56)【参考文献】
【文献】国際公開第2019/102911(WO,A1)
【文献】特開2017-126978(JP,A)
【文献】米国特許出願公開第2018/0124080(US,A1)
【文献】辻 亮弥 外5名,「マルチモーダル入力に対応した重み付き多数決による識別器」,FIT2011 第10回情報科学技術フォーラム 講演論文集 第3分冊,一般社団法人 情報処理学会,2011年08月22日,pp.123-124
【文献】Roberto Perdisci et al.,"Using an Ensemble of One-Class SVM Classifiers to Harden Payload-based Anomaly Detection Systems",Sixth International Conference on Data Mining (ICDM'06) [online],IEEE,2007年01月08日,[令和4年11月29日 検索], インターネット:<URL:https://ieeexplore.ieee.org/abstract/document/4053075>,DOI: 10.1109/ICDM.2006.165
(58)【調査した分野】(Int.Cl.,DB名)
G06F 11/07
G06F 11/28-11/36
G06F 21/00-21/88
G06N 3/00-99/00
(57)【特許請求の範囲】
【請求項1】
評価対象データの評価に用いられる複数の評価用モデルを用いて行われる前記評価対象データの評価に関連する処理である評価関連処理を行う処理システムであって、
評価関連データを取得する取得手段と、
前記取得手段が取得した前記評価関連データに基づいて、前記評価関連処理を行う処理手段と、を備え、
前記処理手段は、
所定の基準に基づいて、前記取得手段が取得した複数の前記評価関連データを相互に関連付ける第1処理と、
前記第1処理で関連付けられた複数の前記評価関連データに基づいて、前記評価関連処理を行う第2処理と、を実行し、
複数の前記評価関連データは、所定の規格の通信で用いられる第1属性の複数のデータと、前記所定の規格の通信で用いられる第2属性の複数のデータと、を含み、
前記第1属性の複数のデータ各々及び前記第2属性の複数のデータ各々は、所定の通信順番で通信されるデータであり、
前記処理手段は、
前記第1処理において、前記評価関連データの通信順番に基づいて、前記第1属性の複数のデータ各々及び前記第2属性の複数のデータ各々を相互に関連付け、
前記第2処理において、前記第1処理で関連付けた前記第1属性の複数のデータ各々と前記第2属性の複数のデータ各々とを含む複数の組み合わせに基づいて、前記評価関連処理を行い、
前記複数の組み合わせ各々に含まれるデータは、前記第1属性及び前記第2属性を含む2種類の属性のデータのみである、
処理システム。
【請求項2】
前記取得手段は、前記評価対象データを、前記評価関連データとして取得し、
前記処理手段は、前記取得手段が取得した前記評価対象データと、前記複数の評価用モデルとに基づいて、前記評価対象データを評価する処理を前記評価関連処理として行う、
請求項
1に記載の処理システム。
【請求項3】
前記処理手段は、前記取得手段が取得した前記評価対象データを、前記複数の評価用モデル各々を用いて評価し、前記複数の評価用モデル各々を用いて行われた各評価の結果を示す評価結果情報を生成する処理を前記評価関連処理として行う、
請求項
2に記載の処理システム。
【請求項4】
前記処理手段は、前記評価対象データに含まれているデータ値に関する評価を行う処理、又は、前記評価対象データに含まれている時間に関する評価を行う処理を前記評価関連処理として行う、
請求項
2又は
3に記載の処理システム。
【請求項5】
評価対象データの評価に用いられる複数の評価用モデルを用いて行われる前記評価対象データの評価に関連する処理である評価関連処理を行う処理プログラムであって、
コンピュータを、
評価関連データを取得する取得手段と、
前記取得手段が取得した前記評価関連データに基づいて、前記評価関連処理を行う処理手段と、として機能させ、
前記処理手段は、
所定の基準に基づいて、前記取得手段が取得した複数の前記評価関連データを相互に関連付ける第1処理と、
前記第1処理で関連付けられた複数の前記評価関連データに基づいて、前記評価関連処理を行う第2処理と、を実行し、
複数の前記評価関連データは、所定の規格の通信で用いられる第1属性の複数のデータと、前記所定の規格の通信で用いられる第2属性の複数のデータと、を含み、
前記第1属性の複数のデータ各々及び前記第2属性の複数のデータ各々は、所定の通信順番で通信されるデータであり、
前記処理手段は、
前記第1処理において、前記評価関連データの通信順番に基づいて、前記第1属性の複数のデータ各々及び前記第2属性の複数のデータ各々を相互に関連付け、
前記第2処理において、前記第1処理で関連付けた前記第1属性の複数のデータ各々と前記第2属性の複数のデータ各々とを含む複数の組み合わせに基づいて、前記評価関連処理を行い、
前記複数の組み合わせ各々に含まれるデータは、前記第1属性及び前記第2属性を含む2種類の属性のデータのみである、
処理プログラム。
【発明の詳細な説明】
【技術分野】
【0001】
本発明は、処理システム、及び処理プログラムに関する。
【背景技術】
【0002】
従来、通信ログを解析して異常に関する評価を行う技術が知られていた(例えば、特許文献1参照)。
【先行技術文献】
【特許文献】
【0003】
【発明の概要】
【発明が解決しようとする課題】
【0004】
しかしながら、特許文献1の技術においては、通信ログに対応する1個のモデルを用いて異常を評価していたので、通信ログに対する多面的な解析ができずに、評価精度が低下してしまう可能性があった。
【0005】
本発明は上記事実に鑑みなされたもので、評価対象データの評価の精度を向上させることが可能となる処理システム及び処理プログラムを提供する事を目的とする。
【課題を解決するための手段】
【0006】
上述した課題を解決し、目的を達成するために、請求項1に記載の処理システムは、評価対象データの評価に用いられる複数の評価用モデルを用いて行われる前記評価対象データの評価に関連する処理である評価関連処理を行う処理システムであって、評価関連データを取得する取得手段と、前記取得手段が取得した前記評価関連データに基づいて、前記評価関連処理を行う処理手段と、を備え、前記処理手段は、所定の基準に基づいて、前記取得手段が取得した複数の前記評価関連データを相互に関連付ける第1処理と、前記第1処理で関連付けられた複数の前記評価関連データに基づいて、前記評価関連処理を行う第2処理と、を実行し、複数の前記評価関連データは、所定の規格の通信で用いられる第1属性の複数のデータと、前記所定の規格の通信で用いられる第2属性の複数のデータと、を含み、前記第1属性の複数のデータ各々及び前記第2属性の複数のデータ各々は、所定の通信順番で通信されるデータであり、前記処理手段は、前記第1処理において、前記評価関連データの通信順番に基づいて、前記第1属性の複数のデータ各々及び前記第2属性の複数のデータ各々を相互に関連付け、前記第2処理において、前記第1処理で関連付けた前記第1属性の複数のデータ各々と前記第2属性の複数のデータ各々とを含む複数の組み合わせに基づいて、前記評価関連処理を行い、前記複数の組み合わせ各々に含まれるデータは、前記第1属性及び前記第2属性を含む2種類の属性のデータのみである。
【0011】
請求項2に記載の処理システムは、請求項1に記載の処理システムにおいて、前記取得手段は、前記評価対象データを、前記評価関連データとして取得し、前記処理手段は、前記取得手段が取得した前記評価対象データと、前記複数の評価用モデルとに基づいて、前記評価対象データを評価する処理を前記評価関連処理として行う。
【0012】
請求項3に記載の処理システムは、請求項2に記載の処理システムにおいて、前記処理手段は、前記取得手段が取得した前記評価対象データを、前記複数の評価用モデル各々を用いて評価し、前記複数の評価用モデル各々を用いて行われた各評価の結果を示す評価結果情報を生成する処理を前記評価関連処理として行う。
【0013】
請求項4に記載の処理システムは、請求項2又は3に記載の処理システムにおいて、前記処理手段は、前記評価対象データに含まれているデータ値に関する評価を行う処理、又は、前記評価対象データに含まれている時間に関する評価を行う処理を前記評価関連処理として行う。
【0014】
請求項5に記載の処理プログラムは、評価対象データの評価に用いられる複数の評価用モデルを用いて行われる前記評価対象データの評価に関連する処理である評価関連処理を行う処理プログラムであって、コンピュータを、評価関連データを取得する取得手段と、前記取得手段が取得した前記評価関連データに基づいて、前記評価関連処理を行う処理手段と、として機能させ、前記処理手段は、所定の基準に基づいて、前記取得手段が取得した複数の前記評価関連データを相互に関連付ける第1処理と、前記第1処理で関連付けられた複数の前記評価関連データに基づいて、前記評価関連処理を行う第2処理と、を実行し、複数の前記評価関連データは、所定の規格の通信で用いられる第1属性の複数のデータと、前記所定の規格の通信で用いられる第2属性の複数のデータと、を含み、前記第1属性の複数のデータ各々及び前記第2属性の複数のデータ各々は、所定の通信順番で通信されるデータであり、前記処理手段は、前記第1処理において、前記評価関連データの通信順番に基づいて、前記第1属性の複数のデータ各々及び前記第2属性の複数のデータ各々を相互に関連付け、前記第2処理において、前記第1処理で関連付けた前記第1属性の複数のデータ各々と前記第2属性の複数のデータ各々とを含む複数の組み合わせに基づいて、前記評価関連処理を行い、前記複数の組み合わせ各々に含まれるデータは、前記第1属性及び前記第2属性を含む2種類の属性のデータのみである。
【発明の効果】
【0016】
請求項1に記載の処理システム、及び請求項5に記載の処理プログラムによれば、複数の評価用モデルを用いて行われる評価に関連する評価関連処理を行うことにより、例えば、複数の評価用モデルを用いて行われる評価対象データの評価を行うことができるので、評価対象データの評価の精度を向上させることが可能となる。
また、所定の基準に基づいて複数の評価関連データを相互に関連付け、関連付けられた複数の評価関連データに基づいて、評価関連処理を行うことにより、例えば、所定の基準として評価関連データの通信仕様等の実情に即した基準を採用した場合、当該実情に即して評価関連処理を適切に行うことが可能となる。
【0021】
請求項2に記載の処理システムによれば、評価対象データと複数の評価用モデルとに基づいて、評価対象データを評価する処理を行うことにより、例えば、評価対象データの評価精度を向上させることが可能となる。
【0022】
請求項3に記載の処理システムによれば、評価対象データを複数の評価用モデル各々を用いて評価し、複数の評価用モデル各々を用いて行われた各評価の結果を示す評価結果情報を生成する処理を行うことにより、例えば、複数の評価用モデル各々を用いて行った評価対象データの評価の結果を適切に示すことが可能となる。
【0023】
請求項4に記載の処理システムによれば、評価対象データに含まれているデータ値に関する評価を行う処理、又は、評価対象データに含まれている時間に関する評価を行う処理を行うことにより、例えば、データ値に関する評価、及び時間に関する評価を行うことができるので、評価対象データに対して様々な評価を行うことが可能となる。
【図面の簡単な説明】
【0025】
【
図1】本実施の形態1に係る情報処理装置を機能概念的に示すブロック図である。
【
図2】分析対象データ特定情報を例示した図である。
【
図7】本実施の形態2に係る情報処理装置を機能概念的に示すブロック図である。
【
図10】時間差分データ生成処理のフローチャートである。
【
図12】本実施の形態3に係る情報処理装置を機能概念的に示すブロック図である。
【
図13】分析対象データ特定情報を例示した図である。
【
図14】学習用データ特定情報を例示した図である。
【発明を実施するための形態】
【0026】
以下に添付図面を参照して、この発明に係る処理システムの実施の形態を詳細に説明する。まず、〔I〕実施の形態の基本的概念を説明した後、〔II〕実施の形態の具体的内容について説明し、最後に、〔III〕実施の形態に対する変形例について説明する。ただし、実施の形態によって本発明が限定されるものではない。
【0027】
〔I〕実施の形態の基本的概念
まず、実施の形態の基本的概念について説明する。実施の形態は、処理システム、及び処理プログラムに関する。本発明に係る処理システムは、評価関連処理を行うシステムであり、例えば、評価関連処理を行うための専用システム、あるいは、汎用的に用いられるシステム(例えば、サーバコンピュータ、パーソナルコンピュータ、タブレット端末、車載システム等)に対して評価関連処理を行うための機能を実装することにより実現されるシステム等を含む概念である。「処理システム」とは、例えば、取得手段、及び処理手段を備える。
【0028】
また、「評価関連処理」とは、評価対象データの評価に用いられる複数の評価用モデルを用いて行われる評価対象データの評価に関連する処理であり、例えば、複数の評価用モデルを生成する処理、及び評価対象データを評価する処理等を含む概念である。
【0029】
また、「取得手段」とは、評価関連データを取得する手段であり、例えば、複数の評価用モデルを生成するための教師データを評価関連データとして取得する手段等を含む概念であり、また、評価対象データを評価関連データとして取得する手段等を含む概念である。
【0030】
また、「評価関連データ」とは、評価関連処理を行う基となるデータであり、例えば、評価対象データ、及び教師データ等を含む概念である。
【0031】
また、「評価対象データ」とは、複数の評価用モデルを用いて評価される対象となるデータであり、具体的には、任意の通信規格を想定した通信でのデータ、あるいは、当該通信規格を想定していない通信でのデータ等を含む概念であり、例えば、各データの属性が識別可能なデータ、あるいは、各データの属性が識別不可能なデータ等を含む概念であり、一例としては、CAN(Controller Area Network)、イーサネット(登録商標)、USB(Universal Serial Bus)等の通信規格の通信のデータ等を含む概念であり、また、これらの通信規格の通信を想定した機器での実際の通信のログデータ等を含む概念である。
【0032】
また、「教師データ」とは、複数の評価用モデルを生成するためのデータであり、例えば、複数のモデルを生成するために行われる機械学習で用いられるデータであり、具体的な種類やフォーマットは前述の評価対象データと同様であり、つまり、CAN等の通信規格に準拠した通信のログデータ等を含む概念である。なお、この「教師データ」として用いられるデータについては、例えば、前述の任意の通信規格又は他の所定のルールを基準に判断して、正常であるか異常であるかが予め定められているデータを用いることができる。
【0033】
また、「評価用モデル」とは、評価対象データの評価に用いられるモデルであり、例えば、機械学習によって生成されるモデル、あるいは、機械学習以外の他の任意の手法(例えば、シミュレーション、又は、実験等を行う手法等)で生成されるモデル等を含む概念である。なお、「評価対象データの評価に用いられる複数の評価用モデル」とは、例えば、評価対象データを評価する場合の処理に用いられる複数個の評価用モデル等を含む概念であり、つまり、一例としては、処理システムでは、評価対象データを1個評価するために、評価用モデルが複数個用いられることになる。
【0034】
また、「処理手段」とは、取得手段が取得した評価関連データに基づいて、評価関連処理を行う手段であり、例えば、取得手段が取得した評価関連データの属性単位で評価関連処理を行う手段等を含む概念である。「評価関連データの属性」とは、例えば、評価関連データをグループに分ける基準として用いられる概念であり、一例としては、CAN等の通信規格で定められているデータの任意の事項(例えば、データ内容や送信ノード等)を識別するための識別情報(つまり、「ID」)等を含む概念である。
【0035】
また、「処理手段」とは、例えば、所定の基準に基づいて、取得手段が取得した複数の評価関連データを相互に関連付け、関連付けられた複数の評価関連データに基づいて評価関連処理を行う手段等を含む概念である。「所定の基準」とは、予め定められている基準であり、例えば、通信規格又は通信の仕様等から定められている基準(つまり、通信の実情に即した基準)等を含む概念である。
【0036】
また、「処理手段」とは、例えば、予め定められている判定用モデルに基づいて、取得手段が取得した評価関連データを評価関連処理の対象とするか否かを判定し、評価関連処理の対象とするものと判定した評価関連データに基づいて、評価関連処理を行う手段等を含む概念である。「判定用モデル」とは、取得手段が取得した評価関連データを評価関連処理の対象とするか否かを判定するために用いられるモデルであり、例えば、機械学習によって生成されるモデル、あるいは、機械学習以外の他の任意の手法(例えば、シミュレーション、又は、実験等を行う手法等)で生成されるモデル等を含む概念である。
【0037】
また、「処理手段」とは、例えば、取得手段が取得した教師データと、複数の評価用モデルを生成するための機械学習用の所定のアルゴリズムとに基づいて、機械学習により複数の評価用モデルを生成する処理を評価関連処理として行う手段等を含む概念である。「所定のアルゴリズム」とは、複数の評価用モデルを生成するためのアルゴリズムであり、具体的には、外れ値を検出するためのモデルを生成するためのアルゴリズム、あるいは、その他の任意のアルゴリズム等を含む概念であり、例えば、機械学習における「OneClassSVMのアルゴリズム」等を含む概念である。
【0038】
また、「処理手段」とは、例えば、前述の所定のアルゴリズムにおける複数のパラメータの内の一部のパラメータの値を変更することにより、複数の評価用モデルを生成する手段等を含む概念であり、一例としては、前述の「OneClassSVMのアルゴリズム」が有する調整可能なパラメータである「カーネル」等を含む公知の複数のパラメータのうちの1個のパラメータの値を変更することにより、複数の評価用モデルを生成する手段等を含む概念である。
【0039】
また、「処理手段」とは、例えば、取得手段が取得した評価対象データを、複数の評価用モデル各々を用いて評価し、複数の評価用モデル各々を用いて行われた各評価の結果を示す評価結果情報を生成する処理を評価関連処理として行う手段等を含む概念であり、また、評価対象データに含まれているデータ値に関する評価を行う処理、又は、評価対象データに含まれている時間に関する評価を行う処理を評価関連処理として行う手段等を含む概念である。
【0040】
そして、以下に示す各実施の形態においては、「評価対象データ」及び「教師データ」がCANの通信規格の通信のログデータである場合について説明し、特に、実施の形態1では、評価対象データに含まれているデータ値に関する評価を行う場合について説明し、また、実施の形態2では、評価対象データに含まれている時間に関する評価を行う場合について説明し、また、実施の形態3では、評価対象データに含まれているデータ値に関する評価を行う場合であって、複数の評価関連データを相互に関連付けて評価する場合について説明する。
【0041】
〔II〕各実施の形態の具体的内容
次に、各実施の形態の具体的内容について説明する。
【0042】
(実施の形態1)
最初に、実施の形態1について説明する。この実施の形態は、評価対象データに含まれているデータ値に関する評価を行う形態である。
【0043】
(構成)
まず、本実施の形態に係る情報処理装置について説明する。
図1は、本実施の形態に係る情報処理装置を機能概念的に示すブロック図である。情報処理装置1は、処理システムであり、例えば、パーソナルコンピュータであり、一例としては、入力部11、出力部12、記録部13、及び制御部14を備える。
【0044】
(構成‐入力部)
入力部11は、情報を入力する入力手段である。この入力部11の具体的な構成は任意であるが、例えば、公知のマウスやキーボード等を用いて構成することができる。
【0045】
(構成‐出力部)
出力部12は、情報を出力する出力手段である。この出力部12の具体的な構成は任意であるが、例えば、公知のディスプレイ等を用いて構成することができる。
【0046】
(構成‐記録部)
記録部13は、情報処理装置1の動作に必要なプログラム及び各種のデータを記録する記録手段であり、例えば、外部記録装置としてのハードディスク(図示省略)を用いて構成されている。ただし、ハードディスクに代えてあるいはハードディスクと共に、フラッシュメモリ、磁気ディスクの如き磁気的記録媒体、又はDVDやブルーレイディスクの如き光学的記録媒体を含む、その他の任意の記録媒体を用いることができる。
【0047】
この記録部13には、例えば、分析対象データ特定情報、学習用データ特定情報、及び第1モデル特定情報が格納されている。
【0048】
(構成‐記録部‐分析対象データ特定情報)
記録部13の「分析対象データ特定情報」とは、分析対象データを特定する情報である。「分析対象データ」とは、前述の評価関連データであり、具体的には、前述の評価対象データであり、例えば、CANの通信規格の通信のログデータ(つまり、CAN通信の通信を想定した機器での通信のログデータ)である。
図2は、分析対象データ特定情報を例示した図である。「分析対象データ特定情報」は、例えば、
図2に示すように、項目「行情報」、項目「時間情報」、項目「データID」、及び項目「ペイロード情報」と、各項目に対応する情報とが相互に関連付けられている情報である。項目「行情報」は、各情報(時間情報、データID、及びペイロード情報の組み合わせ)を一意に識別する行情報である(
図2では、一意の数値であり「1」等)。項目「時間情報」に対応する情報は、各情報(データID、及びペイロード情報)に付されているタイムスタンプ(つまり、通信が行われた時間)を特定する時間情報である(
図2では、「t1」等)。なお、ここでの「t1」等について便宜上の表記であり、実際には、任意のタイミングを基準にして、当該タイミングからの経過時間等が用いられ、つまり、CAN通信で各データの送信または受信が行われたタイミングを特定する時間が用いられることとする。項目「データID」に対応する情報は、評価関連データの属性を特定する情報であり、例えば、CAN通信のデータ内容や送信ノード等を識別するIDである(
図2では、CAN通信のデータフレームの中のIDに対応する情報であり、「ID11」等)。なお、この「ID11」等については、説明の便宜上の記載である。項目「ペイロード情報」とは、データ値であり、CAN通信で送受信されるデータ本体を特定するペイロード情報である。なお、ペイロード情報は任意であり、CAN通信のデータフレーム中のデータフィールドに対応する情報であり、8バイトの情報であって16進数表記の「10 20 30 40 50 60 70 80」等の情報であるが、
図2では、説明の便宜上、この情報を「D1」等を表記して説明する。なお、ここので、行情報、時間情報、データID、及びペイロード情報が相互に対応付けられた情報が、「分析対象データ」に対応する。
【0049】
そして、このような分析対象データ特定情報における分析対象データの格納手法は任意であるが、例えば、公知の不図示のログ収集装置が、CAN通信を行う車載システム(開発中又は実装済のシステム)における、CAN通信の通信データ(少なくともデータID及びペイロード情報を含むデータ)を収集し、収集した通信データにタイムスタンプを付してログ収集装置の記録部に記録するように構成されていることとする。そして、このログ収集装置に記録されているタイムスタンプが付された通信データを、任意の手法(例えば、当該ログ収集装置との間で通信を行う手法、あるいは、メモリスティック等の記録媒体を用いる手法等)で情報処理装置1に入力することとし、制御部14が、この入力されたタイムスタンプ付きの通信データに行情報を付して、当該付した行情報、タイムスタンプ、通信データのデータID、及び通信データのペイロード情報を記録することにより、
図2の分析対象データとして格納する。あるいは、前述の公知の不図示のログ収集装置が、CAN通信を行う車載システムにおける、CAN通信の通信データを収集して、
図2の分析対象データを生成して自己の記録部に記録するように構成されていることとし、このログ収集装置に記録されている分析対象データを任意の手法で情報処理装置1に入力することとし、制御部14が、入力された分析対象データを格納することとしてもよい(他の実施の形態も同様とする)。
【0050】
このようにして格納することにより、
図2の分析対象データについては、順次行われたCAN通信の各情報が、図面上側から下側に向かって示されていることとし、つまり、少なくとも、時間情報「t1」~「t9」については、「データID」=「ID11」の通信が順次行われ、この後、少なくとも、時間情報「t101」~「t104」については、「データID」=「ID13」の通信が順次行われていることが示されていることとして、以下説明する。
【0051】
(構成‐記録部‐学習用データ特定情報)
図1に戻って、記録部13の「学習用データ特定情報」とは、学習用データを特定する情報である。「学習用データ」とは、前述の評価関連データであり、具体的には、前述の教師データであり、例えば、前述の分析対象データと同じ種類のデータであり、つまり、CANの通信規格の通信のログデータ(つまり、CAN通信の通信ログのデータ)である。「学習用データ特定情報」は、例えば、不図示であるが、
図2の分析対象データ特定情報と同様に、項目「行情報」、項目「時間情報」、項目「データID」、及び項目「ペイロード情報」と、各項目に対応する情報とが相互に関連付けられている情報である。なお、これらの各項目に対応する情報が、「学習用データ」に対応し、分析対象データの同一名称の情報と同様であるので、詳細の説明を省略する。
【0052】
そして、このような学習用データ特定情報における学習用データの格納手法は任意であるが、例えば、前述のように、公知の不図示のログ収集装置が、CAN通信を行う車載システム(開発中又は実装済のシステム)における、CAN通信の通信データ(少なくともデータID及びペイロード情報を含むデータ)を収集し、収集した通信データにタイムスタンプを付してログ収集装置の記録部に記録するように構成されていることとする。そして、これらの記録されているタイムスタンプが付された通信データについて、例えば、任意の手法で、正常であるか異常であるかを判定し、正常であるものと判定した場合にのみ、当該正常であるものと判定された通信データを、前述の任意の手法で情報処理装置1に入力することとし、制御部14が、入力されたタイムスタンプ付きの通信データに行情報を付して、当該付した行情報、タイムスタンプ、通信データのデータID、及び通信データのペイロード情報を記録することにより、
図1の学習用データ特定情報における学習用データとして格納する(他の実施の形態も同様とする)。
【0053】
なお、ここでの通信データの判定については、例えば、管理者が、通信データのペイロード情報に着目して、車載システムにおけるCAN通信の仕様を基準に目視確認して判定することとしてもよいし、あるいは、CAN通信の仕様を基準に正常であるか異常であるかを判定する判定機能を任意の装置に実装し、当該判定機能を用いて判定することとしてもよい。このようにして格納することにより、正常であるものと定められている通信データ等が学習用データとして格納されることになる。
【0054】
また、この学習用データとしては、CAN通信の仕様に基づく通信の通信データを含む、機械学習を行うために十分な量の正常であるものと定められている通信データ等が格納されていることとして、以下説明する。
【0055】
(構成‐記録部‐第1モデル特定情報)
図1に戻って、記録部13の「第1モデル特定情報」とは、複数の評価用モデルを特定する情報であり、具体的には、分析対象データのデータID単位でペイロード情報(つまり、データ値)について評価するためのモデルを特定する情報である。
図3は、第1モデル特定情報を例示した図である。「第1モデル特定情報」は、例えば、
図3に示すように、項目「データID」、及び項目「モデル情報」と、各項目に対応する情報とが相互に関連付けられている情報である。項目「データID」に対応する情報は、
図2の同一名称の情報と同様である。項目「モデル情報」に対応する情報は、評価用モデルを特定するモデル情報である。なお、モデル情報は任意であり、後述するモデル生成処理で生成されるモデルを特定する情報であって、例えば、説明の便宜上の記載としての
図3の「ML11-1」等である。また、本実施の形態では、「評価用モデル」が、分析対象データが入力され、当該入力された分析対象データにおいて、分析対象データのペイロード情報が、学習用データを基準にして比較的大きく外れた値である、いわゆる外れ値に該当するか否かを検出するモデルであって、当該ペイロード情報が外れ値に該当する分析対象データを示す情報を出力するモデルである場合について説明する。そして、このような第1モデル特定情報の格納手法は任意であるが、例えば、後述するモデル生成処理を実行することにより格納される。
【0056】
(構成‐制御部)
図1に戻って、制御部14は、情報処理装置1を制御する制御手段であり、具体的には、CPU、当該CPU上で解釈実行される各種のプログラム(OSなどの基本制御プログラムや、OS上で起動され特定機能を実現するアプリケーションプログラムを含む)、及びプログラムや各種のデータを格納するためのRAMの如き内部メモリを備えて構成されるコンピュータである。特に、実施の形態に係るプログラムは、任意の記録媒体又はネットワークを介して情報処理装置1にインストールされることで、制御部14の各部を実質的に構成する。
【0057】
この制御部14は、例えば、機能概念的に、取得部141、及び処理部142を備える。取得部141とは、評価関連データを取得する取得手段である。処理部142とは、取得部141が取得した評価関連データに基づいて、評価関連処理を行う処理手段である。なお、この制御部14の各部の処理については、後述する。
【0058】
(処理)
続いて、本実施の形態に係る情報処理装置1によって実行される処理について説明する。具体的には、モデル生成処理、及び分析処理について説明する。
【0059】
(処理‐モデル生成処理)
まず、モデル生成処理について説明する。「モデル生成処理」とは、概略的には、学習用データを用いて評価用モデルを生成する処理であり、例えば、
図3の第1モデル特定情報を生成して格納する処理である。
図4は、モデル生成処理のフローチャートである(以下の各処理の説明ではステップを「S」と略記する)。このモデル生成処理を実行するタイミングは任意であるが、例えば、
図1の記録部13に十分な量の学習用データを特定する学習用データ特定情報が記録された後に、入力部11を介してユーザが所定操作を行った場合に起動を開始することとし、起動を開始したところから説明する(他の実施の形態のモデル生成処理も同様とする)。
【0060】
図4のSA1において取得部141は、学習用データを取得する。具体的には任意であるが、例えば、
図1の記録部13の学習用データ特定情報が特定する学習用データを取得する。ここでは、例えば、正常であるものと定められているCAN通信の通信データ等を取得することになるが、具体的には、
図2の分析対象データと同じ種類のデータであって、行情報、時間情報、データID、及びペイロード情報が相互に関連付けられている学習用データを取得する。
【0061】
図4のSA2において処理部142は、学習用データをデータIDを基準に分類する。具体的には任意であるが、例えば、SA1で取得した学習用データを取得し、当該学習用データのデータIDを基準にして、同じデータIDが同じグループになるように分類する。ここでは、例えば、SA1で取得した学習用データに、
図2の「データID」=「ID11」、「ID13」、不図示の「ID12」に対応する情報等が格納されていることとし、この場合、当該学習用データを、「データID」=「ID11」に対応するグループ、「データID」=「ID12」に対応するグループ、及び「データID」=「ID13」に対応するグループ等に分類する。このように分類することにより、データID単位で以下の処理を行うことが可能となる。
【0062】
図4のSA3において処理部142は、1つの処理単位のデータを取得する。具体的には任意であるが、例えば、SA2で分類した各グループにおけるの内の未だ取得されていない1つのデータIDに対応するグループの学習用データを取得する。ここでは、例えば、「データID」=「ID11」に対応するグループの学習用データ(つまり、行情報、時間情報、データID、及びペイロード情報)を取得する。
【0063】
図4のSA4において処理部142は、評価用モデルを複数生成する。具体的には任意であるが、例えば、不図示のモデル生成用アルゴリズムが記録部13に記録されていることとし、このモデル生成用アルゴリズムを用いて生成することとする。「モデル生成用アルゴリズム」とは、前述の所定のアルゴリズムであり、具体的には、外れ値を検出するためのモデルを生成するためのアルゴリズムであり、例えば、「OneClassSVMのアルゴリズム」である。そして、このモデル生成用アルゴリズムである「OneClassSVMのアルゴリズム」については、ユーザが値を設定可能な複数のパラメータとして「P1」、「P2」、及び「P3」の相互に異なる3個のパラメータを有しており、これらのパラメータに値を設定した上で、学習用データを当該モデル生成用アルゴリズムに適用することにより、モデルが生成されるように構成されており、当該生成されたモデルを評価用モデルとする。なお、ここでの複数のパラメータの名称としての「P1」、「P2」、及び「P3」は説明の便宜上の名称である。
【0064】
SA4の処理についてより具体的には、例えば、記録部13のモデル生成用アルゴリズムを取得し、取得したモデル生成用アルゴリズムの3個のパラメータの内の2個のパラメータについては各々任意の固定値を1個ずつ設定し、また、当該3個のパラメータの内の残りの1個のパラメータについては、10個の値を順次設定し、SA3で取得した学習用データのペイロード情報を当該モデル生成用アルゴリズムに順次適用して機械学習することにより、当該10個の値各々に対応する評価用モデルを1個ずつ生成して、合計10個の評価用モデルを生成する。
【0065】
なお、ここでのモデル生成用アルゴリズムの3個のパラメータの内の何れのパラメータを10個の値を設定するパラメータにするか、及び各パラメータに設定する値(1個ずつの値、及び10個の値)については、モデル生成用アルゴリズムの仕様に基づいてユーザが事前に定めてもよし、又は、実験又はシミュレーション等に基づいてユーザが事前に定めてもよいし、又は、ランダムに定めてもよいし、また、これらを定めるための任意のロジックを実装して、当該ロジックを実行することにより定めてもよく、これらの定められた内容に応じて処理が実行されることとしてもよい。なお、本実施の形態では、前述の「P1」、「P2」、及び「P3」の内の、「P1」を10個の値を設定するパラメータとし「P2」、及び「P3」を1個ずつの値を設定するパラメータとする場合について説明する。
【0066】
ここでは、例えば、記録部13の不図示のモデル生成用アルゴリズムである「OneClassSVMのアルゴリズム」を取得し、取得した「OneClassSVMのアルゴリズム」の3個のパラメータである「P1」、「P2」、及び「P3」の内の2個のパラメータである「P2」、及び「P3」については各々任意の固定値を1個ずつ設定し、また、当該3個のパラメータの内の残りの1個のパラメータである「P1」については、相互に異なる10個の値である「第1の値~第10の値」を順次設定し、SA3で取得した学習用データのペイロード情報を当該モデル生成用アルゴリズムに順次適用することにより、当該10個の値各々に対応する評価用モデルを1個ずつ生成して、合計10個の評価用モデルを生成する。より詳細には、例えば、「P1」に「第1の値」を設定した上で、前述の学習用データのペイロード情報である
図2の「D1」~「D9」等を「OneClassSVMのアルゴリズム」に適用することにより機械学習を行って、「P1」が「第1の値」である場合の評価用モデルである
図3の「ML11-1」が特定する評価用モデルを生成し、また、「P1」に「第2の値」を設定した上で、前述の学習用データのペイロード情報である
図2の「D1」~「D9」等を「OneClassSVMのアルゴリズム」に適用することにより機械学習を行って、「P1」が「第2の値」である場合の評価用モデルである
図3の「ML11-2」が特定する評価用モデルを生成する。そして、この後に、「P1」に「第3の値」~「第10の値」を設定した上で、前述の学習用データのペイロード情報である
図2の「D1」~「D9」等を「OneClassSVMのアルゴリズム」に適用することにより機械学習を行って、「P1」が「第3の値」~「第10の値」である場合の評価用モデルである
図3の「ML11-3」~「ML11-10」が特定する評価用モデルを生成する。
【0067】
なお、ここでは、前述のように、正常であるものと定められている通信データ(つまり、ペイロード情報)が学習用データとして用いられ、また、「P1」に相互に異なる「第1の値」~「第10の値」が設定されることにより、相互に異なる基準で外れ値を検出する評価用モデルである「ML11-1」~「ML11-10」が特定する評価用モデルが生成されることになる。
【0068】
図4のSA5において処理部142は、評価用モデルを格納する。具体的には任意であるが、例えば、SA3で取得した単位であるデータIDを特定し、また、SA4で生成した評価用モデルを取得した上で、この特定したデータID、取得した評価用モデルを特定する情報を相互に対応付けて、
図3のデータID及びモデル情報として格納する。ここでは、例えば、SA3で取得した単位であるデータIDである「ID11」を特定し、また、SA4で生成した評価用モデルであるが特定する評価用モデルを取得した上で、
図3の「データID」=「ID11」、及び「モデル情報」=「ML11-1」~「ML11-10」を格納する。
【0069】
図4のSA6において処理部142は、処理を終了するか否かを判定する。具体的には任意であるが、例えば、SA2で分類した各グループの学習用データについて全て取得して対応する評価用モデルを生成したか否かを任意の手法(例えば、SA2で分類した各グループについて取得して評価用モデルを生成したか否かを示す情報が記録部13に記録されていることとし、この情報に着目して判定する手法等)で判定し、判定結果に基づいて判定する。そして、SA2で分類した各グループの学習用データについて全て取得して対応する評価用モデルを生成したわけではないものと判定した場合(つまり、SA2で分類した各グループにおいて、対応する評価用モデルが生成されていないものが未だ存在する場合)、処理を終了しないものと判定し(SA6のNO)、SA3に移行する。また、SA2で分類した各グループの学習用データについて全て取得して対応する評価用モデルを生成したものと判定した場合(つまり、SA2で分類した各グループにおいて、対応する評価用モデルが全て生成された場合)、処理を終了するものと判定し(SA6のYES)、処理を終了する。ここでは、例えば、前述の各処理を繰り返し行うことにより、SA2で分類した「データID」=「ID11」に対応するグループ、「データID」=「ID12」に対応するグループ、及び「データID」=「ID13」等に対応するグループ全てについて、対応する評価用モデルが生成された場合、処理を終了するものと判定する。そして、このようにして、
図3の第1モデル特定情報が生成されて格納されることになる。これにて、モデル生成処理を終了する。
【0070】
(処理‐分析処理)
次に、分析処理について説明する。「分析処理」とは、概略的には、評価用モデルを用いて分析対象データを評価する処理である。
図5は、分析処理のフローチャートである。この分析処理を実行するタイミングは任意であるが、例えば、記録部13に分析対象データ及び第1モデル特定情報が記録された後に、入力部11を介してユーザが所定操作を行った場合に起動を開始することとし、起動を開始したところから説明する。
【0071】
図5のSB1において取得部141は、分析対象データを取得する。具体的には任意であるが、例えば、
図1の記録部13の分析対象データ特定情報の分析対象データを取得する。ここでは、例えば、
図2に示すように、行情報、時間情報、データID、及びペイロード情報が相互に関連付けられている分析対象データを取得する。
【0072】
図5のSB2において処理部142は、分析対象データをデータIDを基準に分類する。具体的には任意であるが、例えば、
図4のSA2と同様な処理を行う。詳細には、SB1で取得した分析対象データを取得し、当該分析対象データのデータIDを基準にして、同じデータIDが同じグループになるように分類する。ここでは、例えば、SB1で取得した分析対象データを、
図2の「データID」=「ID11」に対応するグループ、不図示の「データID」=「ID12」に対応するグループ、及び
図2の「データID」=「ID13」に対応するグループ等に分類する。このように分類することにより、データID単位で以下の処理を行うことが可能となる。
【0073】
図5のSB3において処理部142は、1つの処理単位のデータを取得する。具体的には任意であるが、例えば、
図4のSA3と同様な処理を行う。詳細には、SB2で分類した各グループにおけるの内の未だ取得されていない1つのデータIDに対応するグループの分析対象データを取得する。ここでは、例えば、
図2の「データID」=「ID11」に対応するグループの分析対象データ(つまり、行情報、時間情報、データID、及びペイロード情報)を取得する。
【0074】
図5のSB4において処理部142は、評価処理を実行する。「評価処理」とは、分析対象データを評価して評価結果を格納する処理である。
図6は、評価処理のフローチャートである。
【0075】
図6のSC1において処理部142は、評価用モデルを選択する。具体的には任意であるが、例えば、
図5のSB3で取得した分析対象データに対応するデータIDを特定し、
図3の第1モデル特定情報を参照して、当該特定したデータIDに対応するモデル情報を取得し、取得したモデル情報が特定する評価用モデルを選択する。ここでは、例えば、
図5のSB3で取得した分析対象データに対応するデータIDである「ID11」を特定し、
図3の第1モデル特定情報を参照して、当該特定したデータIDである「ID11」に対応するモデル情報である「ML11-1」~「ML11-10」を取得し、「ML11-1」~「ML11-10」が特定する評価用モデルを選択する。
【0076】
図6のSC2において処理部142は、分析対象データを評価する。具体的には任意であるが、例えば、前述したように、「評価用モデル」が、分析対象データが入力され、当該入力された分析対象データにおいて、分析対象データのペイロード情報が、学習用データを基準にして比較的大きく外れた値である、いわゆる外れ値に該当するか否かを検出するモデルであって、当該ペイロード情報が外れ値に該当する分析対象データを示す情報を出力するモデルであることに着目して、以下の処理を行う。詳細には、
図5のSB3で取得した分析対象データを、
図6のSC1で選択した評価用モデル全てに入力し、各評価用モデルから出力される情報を取得し、取得した当該情報に基づいて、各分析対象データについて評価スコアを算出して生成する。なお、「評価スコア」とは、評価結果情報であり、例えば、分析対象データが異常である可能性の高低を示す情報であり、一例としては、テストエンジニアが異常である通信ログを見て感じる違和感に関連する指標の情報である。なお、ここでの評価スコアの算出手法は任意であるが、例えば、各分析対象データについて、当該各分析対象データが入力される評価用モデルの個数に対する、当該各分析対象データを外れ値として検出した評価用モデルの個数の割合を算出し、当該算出した割合を評価スコアとすることとする。
【0077】
ここでは、例えば、
図5のSB3で取得した分析対象データである
図2の「データID」=「ID11」に対応するグループの分析対象データ(つまり、行情報、時間情報、データID、及びペイロード情報)を、
図6のSC1で選択した評価用モデルである
図3の「ML11-1」~「ML11-10」が特定する評価用モデル全てに入力し、各評価用モデルから出力される情報を取得し、取得した当該情報に基づいて、各分析対象データについて評価スコアを算出して生成する。ここでは、
図2の「データID」=「ID11」の内の、「行情報」=「1」の分析対象データに着目して詳細に説明する。具体的には、「行情報」=「1」の分析対象データを、
図3の「ML11-1」~「ML11-10」が特定する10個の評価用モデルに入力し、「ML11-1」~「ML11-9」が特定する9個の評価用モデルにおいて、「行情報」=「1」に対応する「ペイロード情報」=「D1」を外れ値と検出し、当該9個の評価用モデルが、「行情報」=「1」の分析対象データが異常値であることを含む情報を出力した場合、当該各分析対象データが入力される評価用モデルの個数である「10個」に対する、当該各分析対象データを外れ値として検出した評価用モデルの個数である「9個」の割合について「9÷10」の演算を行って「90%」を算出し、当該算出した割合である「90%」を、「行情報」=「1」の分析対象データの評価スコアとする。そして、ここで説明した各処理が、「行情報」=「2」~「9」等の分析対象データについても行われるので、「行情報」=「2」~「9」等の分析対象データについても、評価スコアが算出されることになる。
【0078】
図6のSC3において処理部142は、分析対象データの評価結果を格納する。具体的には任意であるが、例えば、各分析対象データについて評価スコアを取得し、取得した評価スコアを当該評価スコアに対応する分析対象データと対応付けた状態で、記録部13に記録する。ここでは、例えば、「行情報」=「1」の分析対象データの評価スコアである「90%」、及び「行情報」=「2」~「9」等の分析対象データの評価スコアを取得し、取得した「90%」と「行情報」=「1」の分析対象データとが対応付けられた情報、及び「行情報」=「2」~「9」等の評価スコアと「行情報」=「2」~「9」等の分析対象データが対応付けられた情報を格納する。これにて、評価処理をリターンする。
【0079】
図5のSB5において処理部142は、処理を終了するか否かを判定する。具体的には任意であるが、例えば、
図4のSA6と同様な処理を行う。詳細には、
図5のSB2で分類した各グループの分析対象データについて全て取得して評価を行ったか否か任意の手法(例えば、SB2で分類した各グループについて取得して評価を行ったか否かを示す情報が記録部13に記録されていることとし、この情報に着目して判定する手法等)で判定し、判定結果に基づいて判定する。そして、SB2で分類した各グループの分析対象データについて全て取得して評価を行ったわけではないものと判定した場合(つまり、SB2で分類した各グループにおいて、評価を行っていないものが未だ存在する場合)、処理を終了しないものと判定し(SB5のNO)、SB3に移行する。また、SB2で分類した各グループの分析対象データについて全て取得して評価を行ったものと判定した場合(つまり、SB2で分類した各グループにおいて、評価を全て行った場合)、処理を終了するものと判定し(SB5のYES)、SB6に移行する。ここでは、例えば、上述の処理を繰り返し行うことにより、SB2で分類した
図2の「データID」=「ID11」に対応するグループ、不図示の「データID」=「ID12」に対応するグループ、及び
図2の「データID」=「ID13」に対応するグループ等に対応するグループ全てについて、評価を行った場合、SB6に移行する。
【0080】
図5のSB6において処理部142は、評価結果を出力する。具体的には任意であるが、例えば、ユーザが入力部11を介して表示閾値スコアを入力することとし、
図6のSC3で記録した評価結果である評価スコアの内の当該表示閾値スコア以上の評価スコアを選択して取得し、取得した評価スコアを当該評価スコアに対応する分析対象データに対応付けた情報を、出力部12のディスプレイに表示して出力する。なお、「表示閾値スコア」とは、表示するべき評価スコアを選択する基準となる情報である。ここでは、例えば、ユーザが入力部11を介して表示閾値スコアとして「80%」を入力した場合、
図6のSC3で記録した評価結果である評価スコアの内の当該表示閾値スコア以上の評価スコアである前述の「90%」等を選択して取得し、取得した評価スコアである「90%」を当該評価スコアに対応する分析対象データである「行情報」=「1」、「時間情報」=「t1」、「データID」=「ID11」、及び「ペイロード情報」=「D1」に対応付けた情報を、出力部12のディスプレイに表示して出力する。なお、実際には、「行情報」=「1」の分析対象データ以外にも、表示閾値スコアとして「80%」以上のデータが存在する場合、当該データに関する情報を表示されることになる。これにて、分析処理を終了する。
【0081】
(本実施の形態の効果)
本実施の形態によれば、複数の評価用モデルを用いて行われる評価に関連する評価関連処理を行うことにより、例えば、複数の評価用モデルを用いて行われる分析対象データ(評価対象データ)の評価を行うことができるので、評価対象データの評価の精度を向上させることが可能となる。
【0082】
また、分析対象データ(評価関連データ)又は学習用データ(評価関連データ)の属性であるデータID単位でモデル生成処理(評価関連処理)及び分析処理(評価関連処理)を行うことにより、例えば、同様な属性を有する評価関連データ単位で評価関連処理を行うことができるので、評価関連処理を効率的且つ適切に行うことが可能となる。
【0083】
また、学習用データ(教師データ)とモデル生成用アルゴリズム(機械学習用の所定のアルゴリズム)とに基づいて、機械学習により複数の評価用モデルを生成する処理を行うことにより、例えば、複数の評価用モデルを適切に生成することが可能となる。
【0084】
また、「OneClassSVMのアルゴリズム」の複数のパラメータの内の一部のパラメータの値を変更することにより、複数の評価用モデルを生成することにより、例えば、複数の評価用モデルをより適切に生成することが可能となる。
【0085】
また、分析対象データ(評価関連データ)と複数の評価用モデルとに基づいて、評価対象データを評価する処理を行うことにより、例えば、評価対象データの評価精度を向上させることが可能となる。
【0086】
また、分析対象データ(評価関連データ)を複数の評価用モデル各々を用いて評価し、複数の評価用モデル各々を用いて行われた各評価の結果を示す評価スコア(評価結果情報)を生成する処理を行うことにより、例えば、複数の評価用モデル各々を用いて行った評価対象データの評価の結果を適切に示すことが可能となる。
【0087】
また、分析対象データ(評価関連データ)に含まれているデータ値に関する評価を行う処理を行うことにより、例えば、データ値に関する評価を行うことが可能となる。
【0088】
(実施の形態2)
次に、実施の形態2について説明する。この実施の形態は、評価対象データに含まれている時間に関する評価を行う形態である。なお、実施の形態1と同様な内容については、説明を適宜省略して、本実施の形態に特徴的な部分についてのみ詳細に説明する。
【0089】
(構成)
まず、本実施の形態に係る情報処理装置について説明する。
図7は、本実施の形態に係る情報処理装置を機能概念的に示すブロック図である。情報処理装置2は、処理システムであり、例えば、パーソナルコンピュータであり、一例としては、入力部21、出力部22、記録部23、及び制御部24を備える。なお、入力部21、出力部22は、実施の形態1の同一名称の構成と同様である。
【0090】
(構成‐記録部)
記録部23は、情報処理装置2の動作に必要なプログラム及び各種のデータを記録する記録手段であり、実施の形態1の記録部13と同様に構成されており、例えば、分析対象データ特定情報、学習用データ特定情報、第2モデル特定情報、及びタイミング判定用モデル特定情報が格納されている。なお、分析対象データ特定情報、及び学習用データ特定情報は、実施の形態1の同一名称の情報と同様である。
【0091】
(構成‐記録部‐第2モデル特定情報)
記録部23の「第2モデル特定情報」とは、複数の評価用モデルを特定する情報であり、具体的には、データID単位で分析対象データの時間情報(つまり、時間)について評価するためのモデルを特定する情報である。
図8は、第2モデル特定情報を例示した図である。「第2モデル特定情報」は、例えば、
図8に示すように、項目「データID」、及び項目「モデル情報」と、各項目に対応する情報とが相互に関連付けられている情報である。なお、これらの各情報は、
図3の同一名称の情報と同様である。なお、本実施の形態では、「評価用モデル」が、分析対象データの時間差分データが入力され、当該入力された時間差分データが、学習用データを基準にして比較的大きく外れた値である、いわゆる外れ値に該当するか否かを検出するモデルであって、当該時間差分データが外れ値に該当する分析対象データを示す情報を出力するモデルである場合について説明する。なお、「時間差分データ」とは、分析対象データの連続する時間情報の相互間の差分に対応する情報であり、例えば、
図2の「t1」と「t2」の相互間の差分、「t2」と「t3」の相互間の差分、及び「t3」と「t4」の相互間の差分等に対応する情報である。そして、このような第2モデル特定情報の格納手法は任意であるが、例えば、後述するモデル生成処理を実行することにより格納される。
【0092】
(構成‐記録部‐タイミング判定用モデル特定情報)
記録部23の「タイミング判定用モデル特定情報」とは、タイミング判定用モデルを特定する情報である。「タイミング判定用モデル」とは、前述の判定用モデルであり、例えば、CAN通信での通信タイミングを基準に任意の単位(例えば、データID単位)の複数の時間差分データの種類を判定するためのモデルである。なお、ここで想定される種類については、CAN通信の通信仕様等に基づいて様々想定されるが、例えば、所定時間間隔(例えば、1.0秒~1.5秒間隔等)で連続して通信を行う「通常通信」、前述の通常通信が一時途切れて一時停止が発生する「ポーズ付き通常通信」、及びランダムなタイミングで通信が行われる「イベント通信」の何れかの種類が想定される通信仕様となっていることとして、以下説明する。そして、ここで用いられる具体的なタイミング判定用モデル、及び当該モデルを特定するタイミング判定用モデル特定情報の格納手法については後述する。
【0093】
(構成‐制御部)
図7に戻って、制御部24は、情報処理装置2を制御する制御手段であり、実施の形態1の制御部14と同様に構成されており、例えば、機能概念的に、取得部241、及び処理部242を備える。取得部241、及び処理部242は、実施の形態1の同一名称の構成要素と同様である。なお、この制御部24の各部の処理については、後述する。
【0094】
(処理)
続いて、本実施の形態に係る情報処理装置2によって実行される処理について説明する。具体的には、モデル生成処理、及び分析処理について説明する。
【0095】
(処理‐モデル生成処理)
まず、モデル生成処理について説明する。「モデル生成処理」とは、概略的には、学習用データを用いて評価用モデルを生成する処理であり、例えば、
図8の第2モデル特定情報を生成して格納する処理である。
図9は、モデル生成処理のフローチャートである。
【0096】
図9のSD1において取得部241は、学習用データを取得する。具体的には任意であるが、例えば、
図4のSA1と同様な処理を行う。詳細には、例えば、
図8の記録部23の学習用データ特定情報が特定する学習用データを取得する。ここでは、例えば、
図2の分析対象データと同じ種類のデータであって、行情報、時間情報、データID、及びペイロード情報が相互に関連付けられている学習用データを取得する。
【0097】
図9のSD2において処理部242は、学習用データをデータIDを基準に分類する。具体的には任意であるが、例えば、
図4のSA2と同様な処理を行う。SD1で取得した学習用データを取得し、当該学習用データのデータIDを基準にして、同じデータIDが同じグループになるように分類する。ここでは、例えば、SD1で取得した学習用データに、
図2の「データID」=「ID11」、「ID13」、不図示の「ID12」に対応する情報等が格納されていることとし、この場合、当該学習用データを、「データID」=「ID11」に対応するグループ、「データID」=「ID12」に対応するグループ、及び「データID」=「ID13」に対応するグループ等に分類する。
【0098】
図9のSD3において処理部242は、1つの処理単位のデータを取得する。具体的には任意であるが、例えば、
図4のSA3と同様な処理を行う。詳細には、例えば、SD2で分類した各グループにおけるの内の未だ取得されていない1つのデータIDに対応するグループの学習用データを取得する。ここでは、例えば、「データID」=「ID11」に対応するグループの学習用データ(つまり、行情報、時間情報、データID、及びペイロード情報)を取得する。
【0099】
図9のSD4において処理部242は、時間差分データ生成処理を実行する。「時間差分データ生成処理」とは、時間差分データを生成して、当該生成した時間差分データを適宜除外等する処理である。
図10は、時間差分データ生成処理のフローチャートである。
【0100】
図10のSE1において処理部242は、時間差分データを複数生成する。具体的には任意であるが、例えば、
図9のSD3で取得した学習用データの連続する時間情報相互間の差分を算出することにより、時間差分データを生成する。ここでは、例えば、学習用データの連続する時間情報として、不図示であるが「tg1」、「tg2」、「tg3」、「tg4」等が格納されている場合、「tg2-tg1」、「tg3-tg2」、及び「tg4-tg3」等の演算結果を、時間差分データとする。
【0101】
なお、ここで生成される複数の時間差分データ(具体的には、相互に同じデータIDにおける複数の時間差分データ)としては、CAN通信の通信仕様等に基づいて様々想定されるが、前述のように「通常通信」、「ポーズ付き通常通信」、及び「イベント通信」が想定されるので、これらのうちの何れかに対応する複数の時間差分データが生成されることになる。
【0102】
図10のSE2において処理部242は、統計値及び個数を取得する。具体的には任意であるが、例えば、SE1で生成した複数の時間差分データを取得し、取得した複数の時間差分データについて公知の統計処理を行って、当該複数の時間差分データの最大値、分散、標準偏差、平均値、及び中央値を統計値として求めて、当該求めた統計値を取得し、また、SE1で生成した時間差分データの個数を計数して、計数した個数を取得する。ここでは、例えば、「tg2-tg1」、「tg3-tg2」、及び「tg4-tg3」等の最大値、分散、標準偏差、平均値、及び中央値として、「Tm」、「Tv」、「Ts」、及び「Tm」を取得し、また、「tg2-tg1」、「tg3-tg2」、及び「tg4-tg3」等の個数として「Tnum」を取得する(これらの「Tm」等の表記は説明の便宜上のものである)。
【0103】
図10のSE3において処理部242は、SE1で生成した時間差分データの種類を特定する。具体的には任意であるが、例えば、
図7の記録部23のタイミング判定用モデル特定情報が特定する「タイミング判定用モデル」が、時間差分データの任意の統計値(例えば、分散)、及び時間差分データの個数が入力され、これらの入力された情報に基づいて、当該入力された情報の時間差分データが「通常通信」、「ポーズ付き通常通信」、又は「イベント通信」に対応するかを出力するモデルである場合について説明する。そして、このようなタイミング判定用モデルについては、事前に行われる任意の機械学習(例えば、公知の教師あり学習等)を行って生成されており、当該生成されたタイミング判定用モデルを特定するタイミング判定用モデルが
図7の記録部23に格納されているものとして以下説明する。
【0104】
図10のSE3においてより具体的には、例えば、
図7の記録部23のタイミング判定用モデル特定情報が特定する「タイミング判定用モデル」を取得し、また、SE2で取得した統計値である分散、及び個数を取得し、当該取得したタイミング判定用モデルに対して、これらの取得した分散及び個数を入力し、タイミング判定用モデルから出力される情報が示す種類を特定する。詳細には、タイミング判定用モデルから「通常通信」が出力された場合、時間差分データの種類を「通常通信」と特定し、また、タイミング判定用モデルから「ポーズ付き通常通信」が出力された場合、時間差分データの種類を「ポーズ付き通常通信」と特定し、また、タイミング判定用モデルから「イベント通信」が出力された場合、時間差分データの種類を「イベント通信」と特定する。
【0105】
ここでは、例えば、
図7の記録部23のタイミング判定用モデル特定情報が特定する「タイミング判定用モデル」を取得し、また、SE2で取得した分散である「Tv」、及び個数である「Tnum」を取得し、当該取得したタイミング判定用モデルに対して、これらの取得した「Tv」及び「Tnum」を入力して、タイミング判定用モデルから出力される情報が示す種類を特定する。
【0106】
具体例について詳細には、例えば、SE1で生成した時間差分データが「通常通信」に対応している場合、当該時間差分データの一例としては、「1.0」、「1.3」、「1.2」、「1.2」、「1.2」、「1.1」・・・(単位である「秒」は省略、以下同様)等が含まれており、これらに対応する分散及び個数をタイミング判定用モデルに入力した場合、当該タイミング判定用モデルから「通常通信」が出力され、「通常通信」を特定することになる。また、例えば、SE1で生成した時間差分データが「ポーズ付き通常通信」に対応している場合、当該時間差分データの一例としては、「1.0」、「1.3」、「1.2」、「6.2」、「1.2」、「1.1」・・・等が含まれており、これらに対応する分散及び個数をタイミング判定用モデルに入力した場合、当該タイミング判定用モデルから「ポーズ付き通常通信」が出力され、「ポーズ付き通常通信」を特定することになる。また、例えば、SE1で生成した時間差分データが「通常通信」に対応している場合、当該時間差分データの一例としては、「5.0」、「1.3」、「1.2」、「4.2」、「1.2」、「20.1」・・・等が含まれており、これらに対応する分散及び個数をタイミング判定用モデルに入力した場合、当該タイミング判定用モデルから「イベント通信」が出力され、「イベント通信」を特定することになる。
【0107】
図10のSE4において処理部242は、SE1で生成した時間差分データ(つまり、1つの処理単位のデータであって、1つのデータIDに対応する時間情報に基づく時間差分データ)を、全て処理の対象とするか否かを判定する。具体的には任意であるが、例えば、SE3で特定した時間差分データの種類に基づいて判定する。そして、特定した時間差分データの種類が「通常通信」である場合、生成した時間差分データを全て処理の対象とするものと判定し(SE4のYES)、リターンする。また、特定した時間差分データの種類が「通常通信」でない場合(「ポーズ付き通常通信」又は「イベント通信」である場合)、生成した時間差分データを全て処理の対象とするわけではないものと判定し(つまり、少なくとも一部の時間差分データについては処理の対象とはしないものと判定し)(SE4のNO)、SE5に移行する。ここでは、例えば、SE3において「通常通信」と特定したので、生成した時間差分データを全て処理の対象とするものと判定する。
【0108】
図10のSE5において処理部242は、SE1で生成した時間差分データ(つまり、1つの処理単位のデータであって、1つのデータIDに対応する時間情報に基づく時間差分データ)を、全て処理の対象から除外するか否かを判定する。具体的には任意であるが、例えば、SE3で特定した時間差分データの種類に基づいて判定する。そして、特定した時間差分データの種類が「イベント通信」である場合、生成した時間差分データを全て処理の対象から除外するものと判定し(SE5のYES)、リターンする。また、特定した時間差分データの種類が「イベント通信」でない場合(「ポーズ付き通常通信」である場合)、生成した時間差分データを全て処理の対象から除外するわけではないものと判定し(つまり、一部のみの時間差分データについては処理の対象とするものと判定し)(SE5のNO)、SE6に移行する。
【0109】
図10のSE6において処理部242は、SE1で生成した時間差分データ(つまり、1つの処理単位のデータであって、1つのデータIDに対応する時間情報に基づく時間差分データ)の内の一部のデータを除外する。具体的には任意であるが、例えば、SE1で生成した時間差分データを取得し、取得した時間差分データにおいて、CAN通信における通常通信が一時途切れる一時停止に対応する時間差分データを特定する任意の手法(例えば、DBSCAN (Density-based spatial clustering of applications with noise)等のクラスタリングの技術を用いる公知の外れ値を特定する手法(なお、前述の「OneClassSVM」を用いる手法とは異なる手法)、あるいは、単に閾値と比較する手法(一例としては、1.5秒を閾値として当該閾値以上の時間差分データを一時停止に対応する時間差分データとして特定する手法等))を用いて、一時停止に対応する時間差分データを特定し、特定した時間差分データを除外する。なお、「時間差分データを除外する」とは、以降の処理において当該除外された時間差分データを用いないことに対応する概念である。ここでは、例えば、前述のように、SE1で生成した時間差分データに「1.0」、「1.3」、「1.2」、「6.2」、「1.2」、「1.1」・・・等が含まれている場合、「6.2」を除外することになる。この後、時間差分データ生成処理をリターンする。
【0110】
図9のSD5において処理部242は、評価用モデルを生成するか否かを判定する。具体的には任意であるが、例えば、
図10の時間差分データ生成処理において、時間差分データを全て処理の対象から除外するものと判定したか否かに基づいて判定する。そして、
図10のSE5において、時間差分データを全て処理の対象から除外するものと判定した場合、処理の対象となる時間差分データが存在しないことになるので、評価用モデルを生成しないものと判定し(SD5のNO)、処理を終了する。また、
図10のSE5において、時間差分データを全て処理の対象から除外するわけではないものと判定した場合、処理の対象となる時間差分データが存在することになるので、評価用モデルを生成するものと判定し(SD5のYES)、SD6に移行する。ここでは、例えば、SE1で生成した時間差分データが「通常通信」又は「ポーズ付き通常通信」に対応している場合、評価用モデルを生成するものと判定し、一方、SE1で生成した時間差分データが「イベント通信」に対応している場合、評価用モデルを生成しないものと判定することになる。
【0111】
図9のSD6において処理部242は、評価用モデルを複数生成する。具体的には任意であるが、例えば、概略的には
図4のSA4の処理と同様にして生成するが、特に、機械学習のために適用するデータとして、SA4では「学習用データのペイロード情報」が用いられていたが、この
図9のSD6では、SA4の場合とは異なり、
図10のSE1で生成した時間差分データを用いる点以外については同様にして生成する。
【0112】
SD6の処理についてより具体的には、例えば、まず、
図10のSE1で生成した時間差分データを取得する。なお、
図10のSE6において一部の時間差分データが除外された場合、SE1で生成した時間差分データの内の、当該除外された時間差分データ以外のデータを取得する。次に、記録部23の不図示のモデル生成用アルゴリズムを取得し、取得したモデル生成用アルゴリズムの3個のパラメータの内の2個のパラメータについては各々任意の固定値を1個ずつ設定し、また、当該3個のパラメータの内の残りの1個のパラメータについては、10個の値を順次設定し、前述の取得した時間差分データ(つまり、
図10のSE1で生成した時間差分データ、あるいは、当該SE1で生成した時間差分データにおいて一部が除外された残りのデータ)を当該モデル生成用アルゴリズムに順次適用することにより、当該10個の値各々に対応する評価用モデルを1個ずつ生成して、合計10個の評価用モデルを生成する。そして、ここでは、前述の時間差分データ生成処理の各判定及びデータの除外等により、例えば、CAN通信の所定時間間隔(例えば、1.0秒~1.5秒間隔等)で連続して行われている通信を正常であるものとして、外れ値に該当するか否かを検出する評価用モデルを生成することが可能となる。
【0113】
ここでは、例えば、SE1で生成した時間差分データが「通常通信」に対応している場合、当該時間差分データの一例としては、「1.0」、「1.3」、「1.2」、「1.2」、「1.2」、「1.1」・・・等を取得し、また、別な例としてSE1で生成した時間差分データが「ポーズ付き通常通信」に対応している場合、当該時間差分データの一例としては、「1.0」、「1.3」、「1.2」、「6.2」、「1.2」、「1.1」・・・等が含まれているが、前述のようにSE6で「6.2」が除外されるので、「1.0」、「1.3」、「1.2」、「1.2」、「1.1」・・・等を取得する。次に、記録部23のモデル生成用アルゴリズムである「OneClassSVMのアルゴリズム」を取得し、取得した「OneClassSVMのアルゴリズム」の3個のパラメータである「P1」、「P2」、及び「P3」の内の2個のパラメータである「P2」、及び「P3」については各々任意の固定値を1個ずつ設定し、また、当該3個のパラメータの内の残りの1個のパラメータである「P1」については、相互に異なる10個の値である「第1の値~第10の値」を順次設定し、前述の取得した時間差分データを当該モデル生成用アルゴリズムに順次適用することにより、当該10個の値各々に対応する評価用モデルを1個ずつ生成して、合計10個の評価用モデルを生成する。より詳細には、例えば、「P1」に「第1の値」を設定した上で、(一例としては「通常通信」に対応する)時間差分データである前述の「1.0」、「1.3」、「1.2」、「1.2」、「1.2」、「1.1」・・・等を「OneClassSVMのアルゴリズム」に適用することにより機械学習を行って、「P1」が「第1の値」である場合の評価用モデルである
図8の「MT11-1」が特定する評価用モデルを生成する。そして、この後、「P1」に「第2の値」~「第10の値」を設定して同様な処理を行うことにより、
図8の「MT11-3」~「MT11-10」が特定する評価用モデルを生成する。
【0114】
図9のSD7において処理部242は、評価用モデルを格納する。具体的には任意であるが、例えば、
図4のSA5と同様な処理を行う。詳細には、
図9のSD3で取得した単位であるデータIDを特定し、また、SD6で生成した評価用モデルを取得した上で、この特定したデータID、取得した評価用モデルを特定する情報を相互に対応付けて、
図8のデータID及びモデル情報として格納する。ここでは、例えば、SD3で取得した単位であるデータIDである「ID11」を特定し、また、SD6で生成した評価用モデルであるが特定する評価用モデルを取得した上で、
図8の「データID」=「ID11」、及び「モデル情報」=「MT11-1」~「MT11-10」を格納する。
【0115】
図9のSD8において処理部242は、処理を終了するか否かを判定する。具体的には任意であるが、例えば、
図4のSA6と同様な処理を行う。詳細には、SD2で分類した各グループの学習用データについて全て取得して対応する評価用モデルを生成したか否かを任意の手法で判定し、判定結果に基づいて判定する。そして、SD2で分類した各グループの学習用データについて全て取得して対応する評価用モデルを生成したわけではないものと判定した場合、処理を終了しないものと判定し(SD8のNO)、SD3に移行する。また、SD2で分類した各グループの学習用データについて全て取得して対応する評価用モデルを生成したものと判定した場合、処理を終了するものと判定し(SD8のYES)、処理を終了する。ここでは、例えば、上述の処理を繰り返し行って、SD2で分類した「データID」=「ID11」に対応するグループ、「データID」=「ID12」に対応するグループ、及び「データID」=「ID13」等に対応するグループ全てについて、対応する評価用モデルが生成された場合、処理を終了するものと判定する。そして、このようにして、
図8の第2モデル特定情報が生成されて格納されることになる。これにて、モデル生成処理を終了する。
【0116】
(処理‐分析処理)
次に、分析処理について説明する。「分析処理」とは、概略的には、評価用モデルを用いて分析対象データを評価する処理である。
図11は、分析処理のフローチャートである。この分析処理を実行するタイミングは任意であるが、例えば、記録部23に分析対象データ及び第2モデル特定情報が記録された後に、入力部21を介してユーザが所定操作を行った場合に起動を開始することとし、起動を開始したところから説明する。
【0117】
図11のSF1において取得部241は、分析対象データを取得する。具体的には任意であるが、例えば、
図5のSB1と同様な処理を行う。詳細には、
図7の記録部23の分析対象データ特定情報の分析対象データを取得する。ここでは、例えば、
図2に示すように、行情報、時間情報、データID、及びペイロード情報が相互に関連付けられている分析対象データを取得する。
【0118】
図11のSF2において処理部242は、分析対象データをデータIDを基準に分類する。具体的には任意であるが、例えば、
図9のSD2と同様な処理を行う。詳細には、SF1で取得した分析対象データを取得し、当該分析対象データのデータIDを基準にして、同じデータIDが同じグループになるように分類する。ここでは、例えば、SD1で取得した分析対象データを、
図2の「データID」=「ID11」に対応するグループ、不図示の「データID」=「ID12」に対応するグループ、及び
図2の「データID」=「ID13」に対応するグループ等に分類する。
【0119】
図11のSF3において処理部242は、1つの処理単位のデータを取得する。具体的には任意であるが、例えば、
図9のSD3と同様な処理を行う。詳細には、SF2で分類した各グループにおけるの内の未だ取得されていない1つのデータIDに対応するグループの分析対象データを取得する。ここでは、例えば、
図2の「データID」=「ID11」に対応するグループの分析対象データ(つまり、行情報、時間情報、データID、及びペイロード情報)を取得する。
【0120】
図11のSF4において処理部242は、時間差分データ生成処理を実行する。ここで実行する時間差分データ生成処理については、取り扱うデータが学習用データではなく分析対象データである点を除いて、前述の
図9のSD4で実行する時間差分データ生成処理と同様であるので、
図10の時間差分データ生成処理の各ステップに「G」という符号を付して、概要のみ説明する。
【0121】
図10のSG1において処理部242は、時間差分データを複数生成する。具体的には任意であるが、例えば、
図11のSF3で取得した分析対象データの連続する時間情報相互間の差分を算出することにより、時間差分データを生成する。特に、ここで生成される時間差分データについては、何れの分析対象データ相互間の時間情報の差分に対応しているかを特定できるように、時間差分データの基となる2個の分析対象データの2個の行情報と対応付けて処理部242によって管理されていることとする。ここでは、例えば、
図2の時間情報において「t2-t1」、「t3-t2」、及び「t4-t3」等の演算結果を、時間差分データとする。そして、これらの「t2-t1」、「t3-t2」、及び「t4-t3」等については「行情報」=「2」及び「1」、「3」及び「2」、「4」及び「3」と対応付けられて管理されていることとする。
【0122】
図10のSG2において処理部242は、統計値及び個数を取得する。具体的には任意であるが、例えば、SG1で生成した複数の時間差分データを取得し、取得した複数の時間差分データについて公知の統計処理を行って、当該複数の時間差分データの最大値、分散、標準偏差、平均値、及び中央値を統計値として求めて、当該求めた統計値を取得し、また、SG1で生成した時間差分データの個数を計数して、計数した個数を取得する。ここでは、例えば、「t2-t1」、「t3-t2」、及び「t4-t3」等の最大値、分散、標準偏差、平均値、及び中央値として、「Tam」、「Tav」、「Tas」、及び「Tam」を取得し、また、「t2-t1」、「t3-t2」、及び「t4-t3」等の個数として「Tanum」を取得する。
【0123】
図10のSG3において処理部242は、SG1で生成した時間差分データの種類を特定する。具体的には任意であるが、例えば、
図7の記録部23のタイミング判定用モデル特定情報が特定する「タイミング判定用モデル」を取得し、また、SG2で取得した統計値である分散、及び個数を取得し、当該取得したタイミング判定用モデルに対して、これらの取得した分散及び個数を入力し、タイミング判定用モデルから出力される情報が示す種類を特定する。
【0124】
ここでは、例えば、
図7の記録部23のタイミング判定用モデル特定情報が特定する「タイミング判定用モデル」を取得し、また、SG2で取得した分散である「Tav」、及び個数である「Tanum」を取得し、当該取得したタイミング判定用モデルに対して、これらの取得した「Tav」及び「Tanum」を入力して、タイミング判定用モデルから出力される情報が示す種類を特定する。
【0125】
図10のSG4において処理部242は、SG1で生成した時間差分データ(つまり、1つの処理単位のデータであって、1つのデータIDに対応する時間情報に基づく時間差分データ)を、全て処理の対象とするか否かを判定する。
【0126】
図10のSG5において処理部242は、SG1で生成した時間差分データ(つまり、1つの処理単位のデータであって、1つのデータIDに対応する時間情報に基づく時間差分データ)を、全て処理の対象から除外するか否かを判定する。
【0127】
図10のSG6において処理部242は、SG1で生成した時間差分データ(つまり、1つの処理単位のデータであって、1つのデータIDに対応する時間情報に基づく時間差分データ)の内の一部のデータを除外する。この後、時間差分データ生成処理をリターンする。
【0128】
図11のSF5において処理部242は、評価処理を実行するか否かを判定する。具体的には任意であるが、例えば、
図9のSD5と同様な処理を行う。詳細には、
図10の時間差分データ生成処理において、時間差分データを全て処理の対象から除外するものと判定したか否かに基づいて判定する。そして、
図10のSG5において、時間差分データを全て処理の対象から除外するものと判定した場合、処理の対象となる時間差分データが存在しないことになるので、評価処理を実行しないものと判定し(SF5のNO)、処理を終了する。また、
図10のSG5において、時間差分データを全て処理の対象から除外するわけではないものと判定した場合、処理の対象となる時間差分データが存在することになるので、評価処理を実行するものと判定し(SF5のYES)、SF6に移行する。ここでは、例えば、SG1で生成した時間差分データが「通常通信」又は「ポーズ付き通常通信」に対応している場合、評価処理を実行するものと判定し、一方、SG1で生成した時間差分データが「イベント通信」に対応している場合、評価処理を実行しないものと判定することになる。
【0129】
図11のSF6において処理部242は、評価処理を実行する。ここで実行する評価処理については、取り扱うデータが分析対象の時間差分データである点を除いて、前述の
図5のSB4で実行する評価処理と同様であるので、
図6の評価処理の各ステップに「H」という符号を付して、概要のみ説明する。
【0130】
図6のSH1において処理部242は、評価用モデルを選択する。具体的には任意であるが、例えば、SC1と同様の処理を行う。詳細には、
図11のSF3で取得した分析対象データに対応するデータIDを特定し、
図8の第2モデル特定情報を参照して、当該特定したデータIDに対応するモデル情報を取得し、取得したモデル情報が特定する評価用モデルを選択する。ここでは、例えば、
図11のSF3で取得した分析対象データに対応するデータIDである「ID11」を特定し、
図8の第2モデル特定情報を参照して、当該特定したデータIDである「ID11」に対応するモデル情報である「MT11-1」~「MT11-10」を取得し、「MT11-1」~「MT11-10」が特定する評価用モデルを選択する。
【0131】
図6のSH2において処理部242は、分析対象データを評価する。具体的には任意であるが、例えば、前述したように、「評価用モデル」が、分析対象データの時間差分データが入力され、当該入力された時間差分データが、学習用データを基準にして比較的大きく外れた値である、いわゆる外れ値に該当するか否かを検出するモデルであって、当該時間差分データが外れ値に該当する分析対象データを示す情報を出力するモデルであることに着目して、以下の処理を行う。詳細には、
図10のSG1で生成した時間差分データ(なお、
図10のSG6において一部の時間差分データが除外された場合、SG1で生成した時間差分データの内の、当該除外された時間差分データ以外のデータ)と、当該時間差分データの基となる各2個の分析対象データの各2個の行情報とを相互に対応付けて、
図6のSH1で選択した評価用モデル全てに入力し、各評価用モデルから出力される情報を取得し、取得した当該情報に基づいて、各分析対象データについて評価スコアを算出して生成する。
【0132】
ここでは、例えば、
図10のSG1で生成した時間差分データである「t2-t1」、「t3-t2」、及び「t4-t3」等と、当該時間差分データの基となる各2個の分析対象データの各2個の行情報との組み合わせの情報である(「t2-t1」に対応する)「行情報」=「2」及び「1」、(「t3-t2」に対応する)「行情報」=「3」及び「2」、(「t4-t3」に対応する)「行情報」=「4」及び「3」とを相互に対応付けて、
図6のSH1で選択した評価用モデルである
図8の「MT11-1」~「MT11-10」が特定する評価用モデル全てに入力し、各評価用モデルから出力される情報を取得し、取得した当該情報に基づいて、各分析対象データについて評価スコアを算出して生成する。ここでは、「t2-t1」(つまり、
図2の「行情報」=「2」及び「1」の差分に対応する時間差分データ)に着目して詳細に説明する。具体的には、「t2-t1」の時間差分データを、
図8の「MT11-1」~「MT11-10」が特定する10個の評価用モデルに入力し、「MT11-1」~「MT11-9」が特定する9個の評価用モデルにおいて、「t2-t1」の時間差分データを外れ値と検出し、当該9個の評価用モデルが、「t2-t1」の時間差分データを示す情報(例えば、「t2-t1」の基となる分析対象データを特定する情報である「行情報」=「2」及び「1」の情報)を含む情報を出力した場合、当該各分析対象データの時間差分データが入力される評価用モデルの個数である「10個」に対する、当該各分析対象データの時間差分データを外れ値として検出した評価用モデルの個数である「9個」の割合について「9÷10」の演算を行って「90%」を算出し、当該算出した割合である「90%」を、「t2-t1」の評価スコアとする(つまり、「行情報」=「2」及び「1」が特定する分析対象データの時間情報の時間差分データの評価スコアとする)。そして、ここで説明した各処理が、「t3-t2」、及び「t4-t3」等の分析対象データの時間差分データについても、評価スコアが算出されることになる。
【0133】
図6のSH3において処理部242は、分析対象データの評価結果を格納する。具体的には任意であるが、例えば、各分析対象データの時間差分データについて評価スコアを取得し、取得した評価スコアを当該評価スコアに対応する分析対象データと対応付けた状態で、記録部13に記録する。なお、ここでは、時間差分データについては、2個の分析対象データの時間情報の差分に相当するので、前述の評価スコアを対応付ける分析対象データの候補としては2個考えられるが、両方に対応付けて記録してもよいし、あるいは、一方に対応付けて格納してもよいが、ここでは、例えば、より時間が早い方(つまり、先に通信が行わた方)の一方の分析対象データに対応付ける場合を例示して説明する。ここでは、例えば、「t2-t1」の評価スコア(つまり、「行情報」=「2」及び「1」が特定する分析対象データの時間情報の時間差分データの評価スコア)である「90%」等を取得し、取得した「90%」と「行情報」=「1」の分析対象データ(つまり、「t2-t1」の基となる分析対象データを特定する情報である「行情報」=「2」及び「1」の内のより時間が早い方の分析データを特定する「行情報」=「1」)とが対応付けられた情報を格納する。これにて、評価処理をリターンする。
【0134】
図11のSF7において処理部242は、処理を終了するか否かを判定する。具体的には任意であるが、例えば、
図5のSB5と同様な処理を行う。そして、上述の処理を繰り返し行って、
図11のSF2で分類した
図2の「データID」=「ID11」に対応するグループ、不図示の「データID」=「ID12」に対応するグループ、及び
図2の「データID」=「ID13」に対応するグループ等に対応するグループ全てについて、評価を行った場合、SF8に移行する。
【0135】
図11のSF8において処理部242は、評価結果を出力する。具体的には任意であるが、例えば、
図5のSB6と同様な処理を行う。詳細には、ここでは、例えば、ユーザが入力部21を介して表示閾値スコアとして「80%」を入力した場合、
図6のSH3で記録した評価結果である評価スコアの内の当該表示閾値スコア以上の評価スコアである前述の「90%」等を選択して取得し、取得した評価スコアである「90%」を当該評価スコアに対応する分析対象データである「行情報」=「1」に対応付けた情報を、出力部12のディスプレイに表示して出力する。なお、ここでは、例えば、時間差分データの基となる2個の分析対象データである「行情報」=「1」及び「2」と対応付けた状態で「90%」を出力するように構成してもよい。また、
図10のSG6にて除外した情報が存在する場合、当該除外した情報を任意の手法(例えば、除外した情報のリストを記録部23に記録しておき、当該リストを参照して特定する手法等)で特定し、特定した除外した情報も出力するように構成してもよい。これにて、分析処理を終了する。
【0136】
(本実施の形態の効果)
本実施の形態によれば、予め定められているタイミング判定用モデル(判定用モデル)に基づいて解析対象データ(評価関連データ)又は学習用データ(評価関連データ)をモデル生成処理(評価関連処理)及び分析処理(評価関連処理)の対象とするか否かを判定し、評価関連処理の対象とするものと判定した評価関連データに基づいて、評価関連処理を行うことにより、例えば、適切な評価関連データを用いて評価関連処理を行うことが可能となる。
【0137】
また、評価対象データに含まれている時間に関する評価を行う処理を行うことにより、例えば、時間に関する評価を行うことが可能となる。
【0138】
(実施の形態3)
次に、実施の形態3について説明する。この実施の形態は、評価対象データに含まれているデータ値に関する評価を行う形態であって、複数の評価関連データを相互に関連付けて形態するである。なお、実施の形態1と同様な内容については、説明を適宜省略して、本実施の形態に特徴的な部分についてのみ詳細に説明する。
【0139】
(構成)
まず、本実施の形態に係る情報処理装置について説明する。
図12は、本実施の形態に係る情報処理装置を機能概念的に示すブロック図である。情報処理装置3は、処理システムであり、例えば、パーソナルコンピュータであり、一例としては、入力部31、出力部32、記録部33、及び制御部34を備える。なお、入力部21、出力部22は、実施の形態1の同一名称の構成と同様である。
【0140】
(構成‐記録部)
記録部33は、情報処理装置3の動作に必要なプログラム及び各種のデータを記録する記録手段であり、実施の形態1の記録部13と同様に構成されており、例えば、分析対象データ特定情報、学習用データ特定情報、及び第3モデル特定情報が格納されている。
【0141】
(構成‐記録部‐分析対象データ特定情報、学習用データ特定情報)
図13は、分析対象データ特定情報を例示した図であり、
図14は、学習用データ特定情報を例示した図である。
図12の記録部33に記録されている分析対象データ特定情報、及び学習用データ特定情報は、基本的には、実施の形態1の同一名称の情報と同様であるが、CAN通信の所定のシーケンス(例えば、2個のデータIDに対応するデータを交互に通信するシーケンス等)に従って送受信されているデータを特定する場合について説明する。具体的には、例えば、
図13及び
図14に示すように、所定のシーケンスに従って、「データID」=「ID11」に対応するデータと「データID」=「ID21」に対応するデータが交互に送受信されている場合を例示して説明する。なお、実際には、この「データID」=「ID11」及び「ID21」以外にも様々なデータIDのデータが送受信されているが、これらについては説明を省略する。
【0142】
(構成‐記録部‐第3モデル特定情報)
記録部33の「第3モデル特定情報」とは、複数の評価用モデルを特定する情報であり、具体的には、複数のデータID単位でペイロード情報(つまり、データ値)について評価するためのモデルを特定する情報である。
図15は、第3モデル特定情報を例示した図である。「第3モデル特定情報」は、例えば、
図15に示すように、項目「データID」、及び項目「モデル情報」と、各項目に対応する情報とが相互に関連付けられている情報である。なお、これらの各情報は、
図3の同一名称の情報と同様である。なお、本実施の形態では、「評価用モデル」が、複数の関連付けられた分析対象データが入力され、当該入力された複数の関連付けられた分析対象データにおいて、分析対象データのペイロード情報が、学習用データを基準にして比較的大きく外れた値である、いわゆる外れ値に該当するか否かを検出するモデルであって、当該ペイロード情報が外れ値に該当する複数の関連付けられた分析対象データを示す情報を出力するモデルである場合について説明する。なお、この
図15では、データIDとしては、1個のデータIDである「ID11」及び1個のデータIDである「ID21」が相互に関連付けられていることを示す「ID11,ID21」等が格納されている。そして、このような第3モデル特定情報の格納手法は任意であるが、例えば、後述するモデル生成処理を実行することにより格納される。
【0143】
(構成‐制御部)
図12に戻って、制御部34は、情報処理装置3を制御する制御手段であり、実施の形態1の制御部14と同様に構成されており、例えば、機能概念的に、取得部341、及び処理部342を備える。取得部341、及び処理部342は、実施の形態1の同一名称の構成要素と同様である。なお、この制御部34の各部の処理については、後述する。
【0144】
(処理)
続いて、本実施の形態に係る情報処理装置3によって実行される処理について説明する。具体的には、モデル生成処理、及び分析処理について説明する。
【0145】
(処理‐モデル生成処理)
まず、モデル生成処理について説明する。「モデル生成処理」とは、概略的には、学習用データを用いて評価用モデルを生成する処理であり、例えば、
図16の第3モデル特定情報を生成して格納する処理である。
図16は、モデル生成処理のフローチャートである。
【0146】
図16のSI1において取得部341は、学習用データを取得する。具体的には任意であるが、例えば、
図4のSA1と同様な処理を行う。ここでは、例えば、
図14の学習用データ特定情報が特定する学習用データ(つまり、行情報、時間情報、データID、及びペイロード情報)を取得する。
【0147】
図16のSI2において処理部342は、学習用データをデータIDを基準に分類する。具体的には任意であるが、例えば、
図4のSA2と同様な処理を行う。
【0148】
図16のSI3において処理部342は、学習用データを関連付ける。具体的には任意であるが、例えば、前述の所定のシーケンス(例えば、「データID」=「ID11」に対応するデータと「データID」=「ID21」に対応するデータが交互に送受信されているシーケンス等)を示す情報が記録部33に記録されていることとし、この情報を参照して所定のシーケンスを特定し、特定した所定のシーケンスに従って、SI2で分類した学習用データを相互に異なるデータID間で関連付ける。なお、学習用データを関連付ける手法は任意であるが、例えば、送受信されるデータが要求及び応答に対応していることとし、相互に対応する要求及び応答のデータを関連付ける手法を用いることとし、具体的には、各データIDの学習用データの時間情報に着目して同じ通信順番(各データID内での順番)の学習用データ同士を関連付ける手法を用いる場合について説明する。ここでは、例えば、
図14の「データID」=「ID11」及び「ID12」について、「ペイロード情報」=「Dg11」及び「Dg21」が通信順番が各々の学習用データにおいて1番であるので、行番号「1」及び「2」の学習用データを相互に関連付け、同様にして、行番号「3」及び「4」の学習用データ、行番号「5」及び「6」の学習用データ、行番号「7」及び「8」の学習用データを相互に関連付ける。なお、
図14では不図示であるが、「データID」=「ID12」、「ID22」等に対応する学習用データも格納されていることとし、所定のシーケンスに従ってこれらのデータも交互に送受信されるものとする。この場合、これらの「データID」=「ID12」及び「ID22」の学習用データについても同様にして相互に関連付ける。
【0149】
図16のSI4において処理部342は、1つの処理単位のデータを取得する。具体的には任意であるが、例えば、SI3で関連付けたデータIDの組み合わせに対応する学習用データの内の未だ取得されていないデータIDの組み合わせに対応する学習用データを取得する。ここでは、例えば、SI3で関連付けた「データID」=「ID11」及び「ID12」に対応する学習用データを取得する。
【0150】
図16のSI5において処理部342は、評価用モデルを複数生成する。具体的には任意であるが、例えば、
図4のSA4の処理と同様な処理を行う。詳細には、例えば、記録部33の不図示のモデル生成用アルゴリズムを取得し、取得したモデル生成用アルゴリズムのパラメータに、
図4のSA4で説明した場合と同様にして値を設定した上で、SI4で取得した学習用データのペイロード情報を当該モデル生成用アルゴリズムに順次適用して機械学習することにより、合計10個の評価用モデルを生成する。なお、ここでモデル生成用アルゴリズムに適用するペイロード情報については、SI4で取得した相互に関連付けられたペイロード情報を任意の手法(例えば、8バイトの16進数表記の各ペイロード情報をつなげる16バイトのペイロード情報にまとめる手法等)で1つにまとめて、1つにまとめたペイロード情報を適用することとする。ここでは、例えば、
図14の「Dg11」及び「Dg21」をまとめたペイロード情報、「Dg12」及び「Dg22」をまとめたペイロード情報、「Dg13」及び「Dg23」をまとめたペイロード情報、「Dg14」及び「Dg24」をまとめたペイロード情報等を、モデル生成用アルゴリズムである「OneClassSVMのアルゴリズム」に適用することにより機械学習を行って、
図15の「MM11-1」~「MM11-10」が特定する評価用モデルを生成する。
【0151】
図16のSI6において処理部342は、評価用モデルを格納する。具体的には任意であるが、例えば、
図4のSA5の処理と同様な処理を行う。ここでは、例えば、
図15の「データID」=「ID11,ID21」、及び「モデル情報」=「MM11-1」~「MM11-10」を格納する。
【0152】
図16のSI7において処理部342は、処理を終了するか否かを判定する。具体的には任意であるが、例えば、
図4のSA6と同様な処理を行う。そして、このようにして、
図15の第3モデル特定情報が生成されて格納されることになる。これにて、モデル生成処理を終了する。
【0153】
(処理‐分析処理)
次に、分析処理について説明する。「分析処理」とは、概略的には、評価用モデルを用いて分析対象データを評価する処理である。
図17は、分析処理のフローチャートである。この分析処理を実行するタイミングは任意であるが、例えば、記録部33に分析対象データ及び第3モデル特定情報が記録された後に、入力部31を介してユーザが所定操作を行った場合に起動を開始することとし、起動を開始したところから説明する。
【0154】
図17のSJ1において取得部341は、分析対象データを取得する。具体的には任意であるが、例えば、
図5のSB1と同様な処理を行う。ここでは、例えば、
図13の分析対象データ特定情報が特定する分析対象データ(つまり、行情報、時間情報、データID、及びペイロード情報)を取得する。
【0155】
図17のSJ2において処理部342は、分析対象データをデータIDを基準に分類する。具体的には任意であるが、例えば、
図9のSD2と同様な処理を行う。
【0156】
図17のSJ3において処理部342は、分析対象データを関連付ける。具体的には任意であるが、例えば、
図16のSI3と同様にして、所定のシーケンスに従って、SJ2で分類した分析対象データを相互に異なるデータID間で関連付ける。ここでは、例えば、
図13の「データID」=「ID11」及び「ID12」について、「ペイロード情報」=「D11」及び「D21」が通信順番が各々の分析対象データにおいて1番であるので、行番号「1」及び「2」の分析対象データを相互に関連付け、同様にして、行番号「3」及び「4」の分析対象データ、行番号「5」及び「6」の分析対象データ、行番号「7」及び「8」の分析対象データを相互に関連付ける。なお、
図13では不図示であるが、「データID」=「ID12」、「ID22」等に対応する分析対象データも格納されていることとし、これらの「データID」=「ID12」及び「ID22」の分析対象データについても同様にして相互に関連付ける。
【0157】
図17のSJ4において処理部342は、1つの処理単位のデータを取得する。具体的には任意であるが、例えば、
図16のSI4と同様にして、SJ3で関連付けたデータIDの組み合わせに対応する分析対象データの内の未だ取得されていないデータIDの組み合わせに対応する分析対象データを取得する。ここでは、例えば、SJ3で関連付けた「データID」=「ID11」及び「ID12」に対応する分析対象データを取得する。
【0158】
図17のSJ5において処理部342は、評価処理を実行する。ここで実行する評価処理については、前述の
図5のSB4で実行する評価処理と同様であるので、
図6の評価処理の各ステップに「K」という符号を付して、概要のみ説明する。
【0159】
図6のSK1において処理部342は、評価用モデルを選択する。具体的には任意であるが、例えば、SC1と同様の処理を行う。詳細には、
図17のSJ4で取得した分析対象データに対応するデータIDを特定し、
図15の第3モデル特定情報を参照して、当該特定したデータIDに対応するモデル情報を取得し、取得したモデル情報が特定する評価用モデルを選択する。ここでは、例えば、
図17のSJ4で取得した分析対象データに対応するデータIDである「ID11」及び「ID12」を特定し、
図15の第3モデル特定情報を参照して、当該特定したデータIDである「ID11」及び「ID12」に対応するモデル情報である「MM11-1」~「MM11-10」を取得し、「MM11-1」~「MM11-10」が特定する評価用モデルを選択する。
【0160】
図6のSK2において処理部342は、分析対象データを評価する。具体的には任意であるが、SC2と同様の処理を行う。例えば、前述したように、「評価用モデル」が、複数の関連付けられた分析対象データが入力され、当該入力された複数の関連付けられた分析対象データにおいて、分析対象データのペイロード情報が、学習用データを基準にして比較的大きく外れた値である、いわゆる外れ値に該当するか否かを検出するモデルであることに着目して、以下の処理を行う。詳細には、
図17のSJ4で取得した分析対象データを、
図6のSK1で選択した評価用モデル全てに入力し、各評価用モデルから出力される情報を取得し、取得した当該情報に基づいて、各分析対象データについて評価スコアを算出して生成する。なお、ここで評価用モデルに入力する対象データのペイロード情報については、
図16のSI5の場合と同様な手法で1つにまとめて、1つにまとめたペイロード情報を入力することとする。
【0161】
ここでは、例えば、
図17のSJ4で取得した分析対象データである
図3の「データID」=「ID11」及び「ID21」に対応する分析対象データを、
図6のSK1で選択した評価用モデルである
図15の「MM11-1」~「MM11-10」が特定する評価用モデル全てに入力し、各評価用モデルから出力される情報を取得し、取得した当該情報に基づいて、各分析対象データについて評価スコアを算出して生成する。
【0162】
図6のSK3において処理部342は、分析対象データの評価結果を格納する。具体的には任意であるが、例えば、SC3と同様の処理を行う。例えば、各分析対象データについて評価スコアを取得し、取得した評価スコアを当該評価スコアに対応する分析対象データと対応付けた状態で、記録部13に記録する。ここでは、例えば、
図13の「行情報」=「1」泳ぎ「2」の分析対象データの評価スコアである「90%」等を取得し、取得した「90%」と「行情報」=「1」及び「2」の分析対象データとが対応付けられた情報等を格納する。なお、この場合のペイロード情報については、前述の1つにまとめた形態で格納してもよいし、あるいは、分離された形態で格納してもよい。これにて、評価処理をリターンする。
【0163】
図17のSJ6において処理部342は、処理を終了するか否かを判定する。具体的には任意であるが、例えば、
図5のSB5と同様な処理を行う。そして、
図17のSJ3で関連付けた分析対象データについて全て取得して評価を行った場合、SJ7に移行する。
【0164】
図17のSJ7において処理部342は、評価結果を出力する。具体的には任意であるが、例えば、
図5のSB6と同様な処理を行う。詳細には、ここでは、例えば、ユーザが入力部31を介して表示閾値スコアとして「80%」を入力した場合、
図6のSK3で記録した評価結果である評価スコアの内の当該表示閾値スコア以上の評価スコアである前述の「90%」等を選択して取得し、取得した評価スコアである「90%」を当該評価スコアに対応する分析対象データである「行情報」=「1」及び「2」に対応付けた情報を、出力部12のディスプレイに表示して出力する。
【0165】
(本実施の形態の効果)
本実施の形態によれば、所定の基準(通信の仕様であり、前述の所定のシーケンス)に基づいて複数の解析対象データ(評価関連データ)又は複数の学習用データ(評価関連データ)を相互に関連付け、関連付けられた複数の評価関連データに基づいて、モデル生成処理(評価関連処理)及び分析処理(評価関連処理)を行うことにより、例えば、所定の基準として評価関連データの通信仕様等の実情に即した基準を採用した場合、当該実情に即して評価関連処理を適切に行うことが可能となる。
【0166】
〔III〕実施の形態に対する変形例
以上、本発明に係る実施の形態について説明したが、本発明の具体的な構成及び手段は、特許請求の範囲に記載した各発明の技術的思想の範囲内において、任意に改変及び改良することができる。以下、このような変形例について説明する。
【0167】
(解決しようとする課題や発明の効果について)
まず、発明が解決しようとする課題や発明の効果は、上述の内容に限定されるものではなく、発明の実施環境や構成の細部に応じて異なる可能性があり、上述した課題の一部のみを解決したり、上述した効果の一部のみを奏したりすることがある。
【0168】
(分散や統合について)
また、上述した各電気的構成要素は機能概念的なものであり、必ずしも物理的に図示の如く構成されていることを要しない。すなわち、各部の分散や統合の具体的形態は図示のものに限られず、その全部または一部を、各種の負荷や使用状況などに応じて、任意の単位で機能的または物理的に分散又は統合して構成できる。
【0169】
(形状、数値、構造、時系列について)
実施の形態や図面において例示した構成要素に関して、形状、数値、又は複数の構成要素の構造若しくは時系列の相互関係については、本発明の技術的思想の範囲内において、任意に改変及び改良することができる。
【0170】
(評価結果の出力について)
また、上記実施の形態の1の
図5のSB6では、評価スコアを当該評価スコアに対応する分析対象データに対応付けた情報を出力する場合について説明したが、これに限らない。例えば、これらの情報に加えてその他の任意の情報を出力するように構成してもよい。例えば、この出力される評価スコア(つまり、表示閾値スコア以上の評価スコア)に対応する分析対象データにおけるペイロード情報に着目し、
図2の分析対象データを参照して、当該ペイロード情報と同じペイロード情報を有する分析対象データの個数を特定し、特定した個数も出力するように構成してもよい。
【0171】
(フィードバックについて)
また、上記各実施の形態の分析処理で評価スコアが「0%」となった分析対象データを表示し、表示された当該対象データをユーザがテストエンジニア等が視認して、「許可」等の命令を入力した場合に、当該分析対象データが学習用データとして記録されるように構成してもよい。
【0172】
(所定のシーケンスについて)
また、上記実施の形態3の
図16のSI3及び
図17のSJ3で説明したデータの関連付けについては、例えば、
図12の記録部33に当該関連付ける基準となる基準情報として、相互に関連付けるべきデータIDの組み合わせを示す情報がユーザからの入力によって記録されていることとし、この基準情報を参照して当該基準情報に沿ってデータの関連付けを行うように構成してもよい。一例としては、「データID」=「ID11」及び「ID21」を関連付け、また、「データID」=「ID11」及び「ID22」を関連付ける等の基準情報が記録されており、この基準情報に基づいてデータの関連付けを行うように構成してもよい。なお、ここで相互に関連付けるデータIDの個数は2個に限らず、通信の使用に基づいて、1個の要求に対して2個機能からの応答が予測される場合等には、3個のデータIDを相互に関連付けるように構成してもよく、通信の実情等を考慮して任意に変更してもよい。
【0173】
(組み合わせについて)
また、各実施の形態及び変形例の技術を任意に組み合わせてもよい。例えば、1つの情報処理システムにおいて、実施の形態1~3の処理を全て、あるいは、ユーザからの命令を受け付けて選択的に実行するように構成してもよい。
【0174】
(付記)
付記1の処理システムは、評価対象データの評価に用いられる複数の評価用モデルを用いて行われる前記評価対象データの評価に関連する処理である評価関連処理を行う処理システムであって、評価関連データを取得する取得手段と、前記取得手段が取得した前記評価関連データに基づいて、前記評価関連処理を行う処理手段と、を備える。
【0175】
付記2の処理システムは、付記1に記載の処理システムにおいて、前記処理手段は、前記取得手段が取得した前記評価関連データの属性単位で、前記評価関連処理を行う。
【0176】
付記3の処理システムは、付記1又は2に記載の処理システムにおいて、前記処理手段は、所定の基準に基づいて、前記取得手段が取得した複数の前記評価関連データを相互に関連付け、関連付けられた複数の前記評価関連データに基づいて、前記評価関連処理を行う。
【0177】
付記4の処理システムは、付記1から3の何れか一項に記載の処理システムにおいて、前記処理手段は、予め定められている判定用モデルに基づいて、前記取得手段が取得した前記評価関連データを前記評価関連処理の対象とするか否かを判定し、前記評価関連処理の対象とするものと判定した前記評価関連データに基づいて、前記評価関連処理を行う。
【0178】
付記5の処理システムは、付記1から4の何れか一項に記載の処理システムにおいて、前記取得手段は、前記複数の評価用モデルを生成するための教師データを、前記評価関連データとして取得し、前記処理手段は、前記取得手段が取得した前記教師データと、前記複数の評価用モデルを生成するための機械学習用の所定のアルゴリズムとに基づいて、機械学習により前記複数の評価用モデルを生成する処理を前記評価関連処理として行う。
【0179】
付記6の処理システムは、付記5に記載の処理システムにおいて、前記所定のアルゴリズムは、複数のパラメータを有しており、前記処理手段は、前記複数のパラメータの内の一部のパラメータの値を変更することにより、前記複数の評価用モデルを生成する。
【0180】
付記7の処理システムは、付記1から4の何れか一項に記載の処理システムにおいて、前記取得手段は、前記評価対象データを、前記評価関連データとして取得し、
前記処理手段は、前記取得手段が取得した前記評価対象データと、前記複数の評価用モデルとに基づいて、前記評価対象データを評価する処理を前記評価関連処理として行う。
【0181】
付記8の処理システムは、付記7に記載の処理システムにおいて、前記処理手段は、前記取得手段が取得した前記評価対象データを、前記複数の評価用モデル各々を用いて評価し、前記複数の評価用モデル各々を用いて行われた各評価の結果を示す評価結果情報を生成する処理を前記評価関連処理として行う。
【0182】
付記9の処理システムは、付記7又は8に記載の処理システムにおいて、前記処理手段は、前記評価対象データに含まれているデータ値に関する評価を行う処理、又は、前記評価対象データに含まれている時間に関する評価を行う処理を前記評価関連処理として行う。
【0183】
付記10の処理プログラムは、評価対象データに対応付けられている複数の評価用モデルを用いて前記評価対象データの評価に関連する処理である評価関連処理を行う処理プログラムであって、コンピュータを、評価関連データを取得する取得手段と、前記取得手段が取得した前記評価関連データに基づいて、前記評価関連処理を行う処理手段と、として機能させる。
【0184】
(付記の効果)
付記1に記載の処理システム、及び付記10に記載の処理プログラムによれば、複数の評価用モデルを用いて行われる評価に関連する評価関連処理を行うことにより、例えば、複数の評価用モデルを用いて行われる評価対象データの評価を行うことができるので、評価対象データの評価の精度を向上させることが可能となる。
【0185】
付記2に記載の処理システムによれば、評価関連データの属性単位で評価関連処理を行うことにより、例えば、同様な属性を有する評価関連データ単位で評価関連処理を行うことができるので、評価関連処理を効率的且つ適切に行うことが可能となる。
【0186】
付記3に記載の処理システムによれば、所定の基準に基づいて複数の評価関連データを相互に関連付け、関連付けられた複数の評価関連データに基づいて、評価関連処理を行うことにより、例えば、所定の基準として評価関連データの通信仕様等の実情に即した基準を採用した場合、当該実情に即して評価関連処理を適切に行うことが可能となる。
【0187】
付記4に記載の処理システムによれば、予め定められている判定用モデルに基づいて評価関連データを評価関連処理の対象とするか否かを判定し、評価関連処理の対象とするものと判定した評価関連データに基づいて、評価関連処理を行うことにより、例えば、適切な評価関連データを用いて評価関連処理を行うことが可能となる。
【0188】
付記5に記載の処理システムによれば、教師データと機械学習用の所定のアルゴリズムとに基づいて、機械学習により複数の評価用モデルを生成する処理を行うことにより、例えば、複数の評価用モデルを適切に生成することが可能となる。
【0189】
付記6に記載の処理システムによれば、複数のパラメータの内の一部のパラメータの値を変更することにより、複数の評価用モデルを生成することにより、例えば、複数の評価用モデルをより適切に生成することが可能となる。
【0190】
付記7に記載の処理システムによれば、評価対象データと複数の評価用モデルとに基づいて、評価対象データを評価する処理を行うことにより、例えば、評価対象データの評価精度を向上させることが可能となる。
【0191】
付記8に記載の処理システムによれば、評価対象データを複数の評価用モデル各々を用いて評価し、複数の評価用モデル各々を用いて行われた各評価の結果を示す評価結果情報を生成する処理を行うことにより、例えば、複数の評価用モデル各々を用いて行った評価対象データの評価の結果を適切に示すことが可能となる。
【0192】
付記9に記載の処理システムによれば、評価対象データに含まれているデータ値に関する評価を行う処理、又は、評価対象データに含まれている時間に関する評価を行う処理を行うことにより、例えば、データ値に関する評価、及び時間に関する評価を行うことができるので、評価対象データに対して様々な評価を行うことが可能となる。
【符号の説明】
【0193】
1 情報処理装置
2 情報処理装置
3 情報処理装置
11 入力部
12 出力部
13 記録部
14 制御部
21 入力部
22 出力部
23 記録部
24 制御部
31 入力部
32 出力部
33 記録部
34 制御部
141 取得部
142 処理部
241 取得部
242 処理部
341 取得部
342 処理部