(19)【発行国】日本国特許庁(JP)
(12)【公報種別】公開特許公報(A)
(11)【公開番号】P2024025706
(43)【公開日】2024-02-26
(54)【発明の名称】データモニタリング方法、コンピュータプログラム及び情報処理システム
(51)【国際特許分類】
G06F 11/30 20060101AFI20240216BHJP
【FI】
G06F11/30 165
【審査請求】未請求
【請求項の数】19
【出願形態】OL
【外国語出願】
(21)【出願番号】P 2023127734
(22)【出願日】2023-08-04
(31)【優先権主張番号】10-2022-0100337
(32)【優先日】2022-08-11
(33)【優先権主張国・地域又は機関】KR
(71)【出願人】
【識別番号】500257300
【氏名又は名称】LINEヤフー株式会社
(74)【代理人】
【識別番号】110003199
【氏名又は名称】弁理士法人高田・高橋国際特許事務所
(72)【発明者】
【氏名】イ ウン ギュ
(72)【発明者】
【氏名】ヨン キョウ ハ
(72)【発明者】
【氏名】キム ユン シク
(72)【発明者】
【氏名】シム ヒョヨン
(72)【発明者】
【氏名】ユン ピョンファ
(72)【発明者】
【氏名】ハン ヨンジュン
(72)【発明者】
【氏名】キム キ フン
【テーマコード(参考)】
5B042
【Fターム(参考)】
5B042GA10
5B042GA18
5B042GB02
5B042JJ01
5B042JJ29
5B042KK13
5B042MC23
5B042MC28
5B042MC36
5B042NN08
5B042NN13
(57)【要約】
【課題】少なくとも一つのプロセッサにより実行される、データモニタリング方法を提供する。
【解決手段】データモニタリング方法は、複数のデータセット内で、少なくとも一つのデータセットをモニタリング対象として選択する第1のユーザ入力を受信するステップと、少なくとも一つのデータセットを分析して、複数のモニタリングタイプのうち、選択された少なくとも一つのデータセットに対する推奨のモニタリングタイプを出力するステップと、複数のモニタリングタイプのうち、選択された少なくとも一つのデータセットに対するモニタリングタイプを決定する第2のユーザ入力を受信するステップと、選択された少なくとも一つのデータセット及び決定されたモニタリングタイプに基づいて算出された、少なくとも一つのデータセットに含まれたデータに対する分析結果を出力するステップと、を含む。
【選択図】
図1
【特許請求の範囲】
【請求項1】
コンピューティング装置に含まれた少なくとも一つのプロセッサにより遂行されるデータモニタリング方法において、
複数のデータセット内で、少なくとも一つのデータセットをモニタリング対象として選択する第1のユーザ入力を受信するステップと、
前記少なくとも一つのデータセットを分析して、複数のモニタリングタイプのうち、前記第1のユーザ入力で選択された少なくとも一つのデータセットに対する推奨のモニタリングタイプを出力するステップと、
前記複数のモニタリングタイプのうち、前記第1のユーザ入力で選択された少なくとも一つのデータセットに対するモニタリングタイプを決定する第2のユーザ入力を受信するステップと、
前記第1のユーザ入力で選択された少なくとも一つのデータセット及び前記第2のユーザ入力で決定されたモニタリングタイプに基づいて算出された、前記少なくとも一つのデータセットに含まれたデータに対する分析結果を出力するステップと、を含む、データモニタリング方法。
【請求項2】
前記複数のモニタリングタイプは、一般型、数値型及びカテゴリ型を含む、請求項1に記載のデータモニタリング方法。
【請求項3】
前記第1のユーザ入力を受信するステップは、前記コンピューティング装置から接続可能である他のコンピューティング装置の複数のデータセット内で、少なくとも一つのデータセットをモニタリング対象として選択する第1のユーザ入力を受信するステップを含む、請求項1に記載のデータモニタリング方法。
【請求項4】
前記推奨のモニタリングタイプを出力するステップは、前記第1のユーザ入力で選択された少なくとも一つのデータセットのメタデータに基づいて推奨のモニタリングタイプを出力するステップを含む、請求項1に記載のデータモニタリング方法。
【請求項5】
前記推奨のモニタリングタイプを出力するステップは、前記少なくとも一つのデータセットに含まれたデータ内の固有項目個数が既定の閾値以下である場合、推奨のモニタリングタイプとしてカテゴリ型を出力するステップを含む、請求項1に記載のデータモニタリング方法。
【請求項6】
前記少なくとも一つのデータセットに含まれた全体項目個数又はNull項目個数の少なくとも一つを出力するステップをさらに含む、請求項1に記載のデータモニタリング方法。
【請求項7】
前記分析結果を出力するステップは、前記第2のユーザ入力で決定されたモニタリングタイプが一般型である場合、前記少なくとも一つのデータセット内の重複項目個数又は固有項目個数の少なくとも一つを出力するステップを含む、請求項1に記載のデータモニタリング方法。
【請求項8】
前記分析結果を出力するステップは、前記第2のユーザ入力で決定されたモニタリングタイプが数値型である場合、前記少なくとも一つのデータセット内に含まれた項目の最小値、最大値、平均値、標準偏差又は四分位数の少なくとも一つを出力するステップを含む、請求項1に記載のデータモニタリング方法。
【請求項9】
前記分析結果を出力するステップは、前記第2のユーザ入力で決定されたモニタリングタイプがカテゴリ型である場合、前記少なくとも一つのデータセット内の全体項目個数に対する各カテゴリ内の項目個数の百分率を出力するステップを含む、請求項1に記載のデータモニタリング方法。
【請求項10】
前記少なくとも一つのデータセット内の異常現象が発生したと探知されることに応じて、異常探知報知が前記少なくとも一つのデータセットと関連したユーザ端末に送信される、請求項1に記載のデータモニタリング方法。
【請求項11】
前記少なくとも一つのデータセット内の全体項目個数が、既定の第1の速度範囲よりも速く増加又は減少する第1の異常現象が発生したと探知されることに応じて、前記異常探知報知がユーザ端末に送信される、請求項10に記載のデータモニタリング方法。
【請求項12】
前記少なくとも一つのデータセット内の全体項目個数が、既定の第2の速度範囲よりも遅く増加したり、既定の時間の間に増加しなかったりする第2の異常現象が発生したと探知されることに応じて、前記異常探知報知がユーザ端末に送信される、請求項10に記載のデータモニタリング方法。
【請求項13】
前記決定されたモニタリングタイプが数値型である場合、前記少なくとも一つのデータセット内に含まれた項目の最小値、最大値、平均値、標準偏差又は四分位数の少なくとも一つが、既定の第3の速度範囲よりも速く増加又は減少する第3の異常現象が発生したと探知されることに応じて、前記異常探知報知がユーザ端末に送信される、請求項10に記載のデータモニタリング方法。
【請求項14】
前記決定されたモニタリングタイプがカテゴリ型である場合、前記少なくとも一つのデータセット内に含まれたカテゴリの個数が増加又は減少する第4の異常現象が発生したと探知されることに応じて、前記異常探知報知がユーザ端末に送信される、請求項10に記載のデータモニタリング方法。
【請求項15】
入力データ及び前記入力データと関連した情報に基づいて、異常現象の発生の有無を探知するように学習された機械学習モデルに、前記第2のユーザ入力及び前記少なくとも一つのデータセットを入力し、異常現象が発生したと探知されることに応じて、前記異常探知報知がユーザ端末に送信される、請求項10に記載のデータモニタリング方法。
【請求項16】
少なくとも一つのプロセッサにより遂行される、データモニタリング方法において、
複数のデータセット内で、少なくとも一つのデータセットをモニタリング対象として選択する第1のユーザ入力を受信するステップと、
複数のモニタリングタイプのうち、前記第1のユーザ入力で選択された少なくとも一つのデータセットに対するモニタリングタイプを決定する第2のユーザ入力を受信するステップと、 前記第1のユーザ入力で選択された少なくとも一つのデータセット及び前記第2のユーザ入力で決定されたモニタリングタイプに基づいて分析ロジックを生成するステップと、
前記少なくとも一つのデータセットに前記分析ロジックを適用して、前記少なくとも一つのデータセットに含まれたデータに対する分析結果を算出するステップと、
を含む、データモニタリング方法。
【請求項17】
前記複数のモニタリングタイプは、一般型、数値型及びカテゴリ型を含む、請求項16に記載のデータモニタリング方法。
【請求項18】
請求項1から請求項17のいずれか一項に係るデータモニタリング方法をコンピュータで実行するためのコンピュータ読取り可能なコンピュータプログラム。
【請求項19】
情報処理システムにおいて、
通信モジュールと、
メモリと、
前記メモリと連結され、前記メモリに含まれたコンピュータ読取り可能な少なくとも一つのプログラムを実行するように構成された少なくとも一つのプロセッサと、を含み、
前記少なくとも一つのプログラムは、
複数のデータセット内で、少なくとも一つのデータセットをモニタリング対象として選択する第1のユーザ入力を受信し、
複数のモニタリングタイプのうち、前記第1のユーザ入力で選択された少なくとも一つのデータセットに対するモニタリングタイプを決定する第2のユーザ入力を受信し、
前記第1のユーザ入力で選択された少なくとも一つのデータセット及び前記第2のユーザ入力で決定されたモニタリングタイプに基づいて分析ロジックを生成し、
前記少なくとも一つのデータセットに前記分析ロジックを代入して、前記少なくとも一つのデータセットに含まれたデータに対する分析結果を算出するための命令語を含む、
情報処理システム。
【発明の詳細な説明】
【技術分野】
【0001】
本開示は、データモニタリング方法及びシステムに関する。具体的には、モニタリング対象として選択されたデータセットに含まれたデータに対し、モニタリングタイプに基づいた分析結果を提供するデータモニタリング方法及びシステムに関する。
【背景技術】
【0002】
最近、ビッグデータなどのデータの重要性が強調され、各企業などにおいて管理するデータの量が幾何級数的に増加している。一部の企業では、一日に数億乃至数十億件以上のデータが積載され、積載されたデータは、2次又は3次加工によりサービスや意思決定に使用されている。しかしながら、データの量が急増し、データの種類が多様化することにより、データをモニタリングして異常現象を探知することが極めて困難な実情にある。
【0003】
また、データの異常の有無を確認するためには、毎回データ別にプログラムを設計するか、或いは、クエリを生成しなければならないため、リソースを重複して使用するという問題点があった。
【先行技術文献】
【特許文献】
【0004】
【特許文献1】韓国登録特許第10-0267727号
【発明の概要】
【発明が解決しようとする課題】
【0005】
本開示は、前記のような問題点を解決するためのデータモニタリング方法及びシステムを提供する。
【課題を解決するための手段】
【0006】
本開示は、方法、システム(装置)又はコンピュータプログラム、このようなコンピュータプログラムを保存する保存媒体を含む多様な方式により具現化できる。
【0007】
本開示の一実施例によれば、コンピューティング装置に含まれた少なくとも一つのプロセッサにより遂行されるデータモニタリング方法は、複数のデータセット内で、少なくとも一つのデータセットをモニタリング対象として選択する第1のユーザ入力を受信するステップと、少なくとも一つのデータセットを分析して、複数のモニタリングタイプのうち、第1のユーザ入力で選択された少なくとも一つのデータセットに対する推奨のモニタリングタイプを出力するステップと、複数のモニタリングタイプのうち、第1のユーザ入力で選択された少なくとも一つのデータセットに対するモニタリングタイプを決定する第2のユーザ入力を受信するステップと、第1のユーザ入力で選択された少なくとも一つのデータセット及び第2のユーザ入力で決定されたモニタリングタイプに基づいて算出された、少なくとも一つのデータセットに含まれたデータに対する分析結果を出力するステップと、を含む。
【0008】
本開示の一実施例によれば、複数のモニタリングタイプは、一般型(basic)、数値型(numeric)及びカテゴリ型(categorical)を含む。
【0009】
本開示の一実施例によれば、第1のユーザ入力を受信するステップは、コンピューティング装置から接続可能である他のコンピューティング装置の複数のデータセット内で、少なくとも一つのデータセットをモニタリング対象として選択する第1のユーザ入力を受信するステップを含む。
【0010】
本開示の一実施例によれば、推奨のモニタリングタイプを出力するステップは、第1のユーザ入力で選択された少なくとも一つのデータセットのメタデータに基づいて、少なくとも一つのデータセットの推奨のモニタリングタイプを出力するステップを含む。
【0011】
本開示の一実施例によれば、推奨のモニタリングタイプを出力するステップは、少なくとも一つのデータセットに含まれたデータ内の固有項目個数(distinct item count)が既定の閾値以下である場合、推奨のモニタリングタイプとしてカテゴリ型を出力するステップを含む。
【0012】
本開示の一実施例によれば、少なくとも一つのデータセットに含まれた全体項目個数又はNull項目個数の少なくとも一つを出力するステップをさらに含む。
【0013】
本開示の一実施例によれば、分析結果を出力するステップは、第2のユーザ入力で決定されたモニタリングタイプが一般型である場合、少なくとも一つのデータセット内の重複項目個数(duplicate item count)又は固有項目個数の少なくとも一つを出力するステップを含む。
【0014】
本開示の一実施例によれば、分析結果を出力するステップは、第2のユーザ入力で決定されたモニタリングタイプが数値型である場合、少なくとも一つのデータセット内に含まれた項目の最小値、最大値、平均値、標準偏差又は四分位数の少なくとも一つを出力するステップを含む。
【0015】
本開示の一実施例によれば、分析結果を出力するステップは、第2のユーザ入力で決定されたモニタリングタイプがカテゴリ型である場合、少なくとも一つのデータセット内の全体項目個数に対する各カテゴリ内の項目個数の百分率を出力するステップを含む。
【0016】
本開示の一実施例によれば、少なくとも一つのデータセット内に異常現象が発生したと探知されることに応じて、異常探知報知が少なくとも一つのデータセットと関連したユーザ端末に送信される。
【0017】
本開示の一実施例によれば、少なくとも一つのデータセット内の全体項目個数が、既定の第1の速度範囲よりも速く増加又は減少する第1の異常現象が発生したと探知されることに応じて、異常探知報知がユーザ端末に送信される。
【0018】
本開示の一実施例によれば、少なくとも一つのデータセット内の全体項目個数が、既定の第2の速度範囲よりも遅く増加したり、既定の時間の間に増加しなかったりする第2の異常現象が発生したと探知されることに応じて、異常探知報知がユーザ端末に送信される。
【0019】
本開示の一実施例によれば、決定されたモニタリングタイプが数値型である場合、少なくとも一つのデータセット内に含まれた項目の最小値、最大値、平均値、標準偏差又は四分位数の少なくとも一つが、既定の第3の速度範囲よりも速く増加又は減少する第3の異常現象が発生したと探知されることに応じて、異常探知報知がユーザ端末に送信される。
【0020】
本開示の一実施例によれば、決定されたモニタリングタイプがカテゴリ型である場合、少なくとも一つのデータセット内に含まれたカテゴリの個数が増加又は減少する第4の異常現象が発生したと探知されることに応じて、異常探知報知がユーザ端末に送信される。
【0021】
本開示の一実施例によれば、入力データ及び入力データと関連した情報に基づいて、異常現象の発生の有無を探知するように学習された機械学習モデルに、第2のユーザ入力及び少なくとも一つのデータセットを入力し、異常現像が発生したと探知されることに応じて、異常探知報知がユーザ端末に送信される。
【0022】
本開示の一実施例によれば、少なくとも一つのプロセッサにより遂行される、データモニタリング方法は、複数のデータセット内で、少なくとも一つのデータセットをモニタリング対象として選択する第1のユーザ入力を受信するステップと、複数のモニタリングタイプのうち、第1のユーザ入力で選択された少なくとも一つのデータセットに対するモニタリングタイプを決定する第2のユーザ入力を受信するステップと、第1のユーザ入力で選択された少なくとも一つのデータセット及び第2のユーザ入力で決定されたモニタリングタイプに基づいて分析ロジックを生成するステップと、少なくとも一つのデータセットに分析ロジックを適用して、少なくとも一つのデータセットに含まれたデータに対する分析結果を算出するステップと、を含む。
【0023】
本開示の一実施例によれば、複数のモニタリングタイプは、一般型、数値型及びカテゴリ型を含む。
【0024】
本開示の一実施例によれば、前述したモニタリング方法に係る各々のステップを遂行する命令語を含むコンピュータプログラムが提供される。
【0025】
本開示の一実施例に係る情報処理システムは、通信モジュールと、メモリと、メモリと連結され、メモリに含まれたコンピュータ読取り可能な少なくとも一つのプログラムを実行するように構成された少なくとも一つのプロセッサと、を含み、少なくとも一つのプログラムは、複数のデータセット内で、少なくとも一つのデータセットをモニタリング対象として選択する第1のユーザ入力を受信し、複数のモニタリングタイプのうち、第1のユーザ入力で選択された少なくとも一つのデータセットに対するモニタリングタイプを決定する第2のユーザ入力を受信し、第1のユーザ入力で選択された少なくとも一つのデータセット及び第2のユーザ入力で決定されたモニタリングタイプに基づいて分析ロジックを生成し、少なくとも一つのデータセットに分析ロジックを代入して、少なくとも一つのデータセットに含まれたデータに対する分析結果を算出するための命令語を含む。
【発明の効果】
【0026】
本開示の一部の実施例によれば、モニタリング対象となるデータセットに関する情報、及びモニタリングタイプに関する情報に基づいて分析ロジックを生成することで、ユーザが直接的にプログラムを設計したりクエリを生成したりする必要なしに、データセットに対するモニタリングを遂行できる。
【0027】
本開示の一部の実施例によれば、データセットの異常を探知し、異常探知報知をデータセットと関連したユーザ端末に送信することで、データの無欠性を保証できる。
【0028】
本開示の一部の実施例によれば、データセットの分析結果を多様な形式で可視化して提供することで、多様なユーザ経験を提供できる。
【0029】
本開示の効果は、これらに制限されず、言及されない他の効果等は、特許請求の範囲の記載から本開示が属する技術分野における通常の知識を有した者(以下、「当業者」という)に明確に理解されるものである。
【図面の簡単な説明】
【0030】
本開示の実施例等は、以下の添付図面に基づいて説明される。ここで、類似の参照符号は類似の要素を示すが、これに限定されるものではない。
【
図1】本開示の一実施例に係るデータモニタリングシステムの細部構成を示す図である。
【
図2】本開示の一実施例に係るデータモニタリングを提供するために、情報処理システムが複数のユーザ端末と通信可能であるように連結された構成を示す概要図である。
【
図3】本開示の一実施例に係るユーザ端末及び情報処理システムの内部構成を示すブロック図である。
【
図4】本開示の一実施例に係るデータモニタリング設定画面の例を示す図である。
【
図5】本開示の一実施例に係るデータセット目録内の各データセットのモニタリングタイプ設定画面の例を示す図である。
【
図6】本開示の一実施例に係るモニタリング総合分析結果を表示する画面の例を示す図である。
【
図7】本開示の一実施例に係る一般型のモニタリング分析結果を表示する画面の例を示す図である。
【
図8】本開示の一実施例に係る数値型のモニタリング分析結果を表示する画面の例を示す図である。
【
図9】本開示の一実施例に係るカテゴリ型のモニタリング分析結果を表示する画面の例を示す図である。
【
図10】本開示の一実施例に係るデータモニタリング方法を示すフローチャートである。
【
図11】本開示の一実施例に係る人工神経網モデルの例を示す図である。
【発明を実施するための形態】
【0031】
以下、本開示の実施のための具体的な内容を添付図面に基づいて詳細に説明する。ただし、以下の説明では、本開示の要旨を不要に不明瞭にする恐れがある場合、公知の機能や構成に関する具体的な説明は省略する。
【0032】
添付図面において、同一又は対応する構成要素には同一の参照符号が付与される。また、以下の実施例の説明において、同一又は対応する構成要素について重複する記述は省略され得る。しかしながら、構成要素に関する記述が省略されても、そのような構成要素がある実施例に含まれないことを意図するものではない。
【0033】
開示された実施例の利点及び特徴、そして、それらを達成する方法は、添付図面に基づいて、後述する実施例を参照すれば明確になる。しかしながら、本開示は、以下で開示される実施例に限定されず、互いに異なる多様な形態で具現化され得る。以下で開示される実施例は、本開示に係る発明の内容を当業者に正確に認識させるために提供されるものにすぎない。
【0034】
本開示で使用される用語について簡略に説明し、開示の実施例について具体的に説明する。本開示で使用される用語は、本開示での機能を考慮しつつ、可能な限り現在広く使用される一般的な用語を選択したが、これは、関連分野に従事する技術者の意図又は判例、新技術の出現などにより変化し得る。また、特定の場合は、出願人が任意で選定した用語もあり得るが、これらの意味は当該発明の説明の部分において詳細に記載する。よって、本開示で使用される用語は、単純な名称を意味するのではなく、その用語が持つ意味は本開示の全般にわたる内容に基づいて定義されるものである。
【0035】
本開示において、文脈上において明確に特定しない限り、単数の表現は複数の表現を意味するものを含み、複数の表現は単数の表現を意味するものを含むことができる。明細書の全般に渡り、ある部分がある構成要素を「含む」とすれば、これは、特に反対の記載がない限り、他の構成要素を排除するものではなく、他の構成要素をさらに含むこともできることを意味する。
【0036】
また、明細書で使用される「モジュール」又は「部」という用語は、ソフトウェアやハードウェア構成要素を意味し、「モジュール」又は「部」はある役割を遂行する。しかしながら、「モジュール」又は「部」の意味はソフトウェアやハードウェアに限定されない。「モジュール」又は「部」は、アドレッシング可能な保存媒体にあるように構成してもよく、一つ又はそれ以上のプロセッサを再生させるように構成してもよい。したがって、一例として、「モジュール」又は「部」は、ソフトウェア構成要素、オブジェクト指向ソフトウェア構成要素、クラス構成要素、タスク構成要素のような構成要素、並びに、プロセス、関数、属性、プロシージャ、サブルーチン、プログラムコードのセグメント、ドライバー、ファームウェア、マイクロコード、回路、データ、データベース、データ構造、テーブル、アレイ、又は変数のうちの少なくとも一つを含むことができる。構成要素と「モジュール」又は「部」は、内部で提供される機能はさらに小さい数の構成要素及び「モジュール」又は「部」で結合され、又は、追加的な構成要素と「モジュール」又は「部」にさらに分離され得る。
【0037】
本開示の一実施例によれば、「モジュール」又は「部」は、プロセッサ及びメモリで具現化され得る。「プロセッサ」は、汎用プロセッサ、中央処理装置(CPU)、マイクロプロセッサ、デジタル信号プロセッサ(DSP)、制御器、マイクロ制御器、状態マシンなどを含むように広く解釈されるべきである。いくつかの環境では、「プロセッサ」は、特定用途向け半導体(ASIC)、プログラム可能なロジックデバイス(PLD)、フィールドプログラム可能なゲートアレイ(FPGA)等を称することもできる。「プロセッサ」は、例えば、DSPとマイクロプロセッサの組合せ、複数のマイクロプロセッサの組合せ、DSPコアと結合した一つ以上のマイクロプロセッサの組合せ、若しくは、任意の他のそのような構成等の組合せといった処理デバイスの組合せを称することもできる。また、「メモリ」は、電子情報を保存可能な任意の電子コンポーネントを含むように、広く解釈されるべきである。「メモリ」は、RAM(Random Access Memory)、ROM(Read Only Memory)、NVRAM(Non-Volatile Random Access Memory)、PROM(Programmable Read-Only Memory)、EPROM(Erasable Programmable Read-Only Memory)、EEPROM(Electrically Erasable Programmable Reda-Only Memory)、フラッシュメモリ、磁気又は光学データストレージ装置、レジスタなどのようなプロセッサで読取り可能な媒体の多様な類型を称することもできる。プロセッサがメモリから情報を読取り/読取ったりメモリに情報を記録できる場合、メモリは、プロセッサと電子通信状態にあると言われる。プロセッサに集積されたメモリは、プロセッサと電子通信状態にある。
【0038】
本開示において、「システム」は、サーバー装置及びクラウド装置の少なくとも一つを含むことができるが、これに限定されるものではない。例えば、システムは、一つ以上のサーバー装置からなることができる。他の例として、システムは、一つ以上のクラウド装置からなることができる。また他の例として、システムは、サーバー装置及びクラウド装置の両方からなって動作することもできる。また他の例として、システムは、データモニタリングを提供する装置を称するものとすることができる。
【0039】
本開示において、データの異常の有無及び/又は正確性を探知する一連の動作を「データモニタリング」と称することができる。又は、「データモニタリング」は、データと関連した情報及び/又はデータに対する統計値を集計するデータプロファイリングを意味することができる。一例として、データベースに含まれたデータセット内のデータの全体項目個数を集計する動作をデータモニタリングと称することができる。
【0040】
本開示において、「項目」は、データセット内の値を指すことができる。又は、「項目」は、一つの単位に取扱われる資料の集合を指すことができる。例えば、項目は、データベース内のレコード、行又はタプルを指したり、レコード、行又はタプル内の単一値を指したりできる。
【0041】
本開示において、「基礎統計量」は、データを示したり特徴化したりする基本的な特徴を表現する値を指すことができる。例えば、「基礎統計量」は、データセット内のデータ値の最小値、最大値、平均値、標準偏差、四分位数などを含むことができる。
【0042】
本開示において、「ユーザ」は、データモニタリングを提供するアプリケーションを利用するユーザ、又は、データモニタリングを提供するアプリケーションのユーザアカウント(user account)を指すことができる。ここで、ユーザアカウントは、データモニタリングを提供するアプリケーションで生成されて利用されるアカウント、又は、これと関連したデータを指すことができる。本開示では、「ユーザ」が「ユーザアカウント」を意味することができ、「ユーザアカウント」が「ユーザ」を意味することができる。
【0043】
本開示において、「機械学習モデル」は、与えられた入力に対する正解(ground truth)を推論するのに使用する任意のモデルを含むことができる。一実施例によれば、機械学習モデルは、入力層(layer)、複数個の隠れ層及び出力層を含む人工神経網モデルを含むことができる。ここで、各層は複数のノードを含むことができる。
【0044】
本開示において、「ディスプレイ装置」は、コンピューティング装置と関連した任意のディスプレイ装置を指すことができる。「ディスプレイ装置」は、例えば、コンピューティング装置により制御されるか、又は、コンピューティング装置から提供される任意の情報/データを表示できる任意のディスプレイ装置を指すことができる。
【0045】
本開示において、「複数のA各々」又は「複数のAの各々」は、複数のAに含まれた全ての構成要素の各々を称したり、複数のAに含まれた一部の構成要素の各々を意味したりできる。例えば、一つ以上のデータセットの各々は、一つ以上のデータセットに含まれた全てのデータセットの各々、又は、一つ以上のデータセットに含まれた一部のデータセットの各々を意味することができる。
【0046】
図1は、本開示の一実施例に係るデータモニタリングシステム100の細部構成を示す図である。データモニタリングシステム100は、管理システム120、集計システム160、可視化システム180及び異常探知システム190を含むことのできるが、これに限定されず、図示のデータモニタリングシステム100の構成の一部が省略されたり、他の構成がさらに含まれたりできる。また、
図1では、管理システム120、集計システム160、可視化システム180及び異常探知システム190などを別々のユニットとして示したが、これに限定されず、管理システム120、集計システム160、可視化システム180及び異常探知システム190などの二つ以上の任意の組合せが一つのユニットとして動作することもできる。付加的又は代替的に、管理システム120、集計システム160、可視化システム180及び異常探知システム190の各々は、二つ以上のサブユニットとして具現化できる。
【0047】
また、データモニタリングシステム100は、データメタ情報DB130及び源泉データDB140を含み、バックエンドDB(Backend database)150及びデータモニタリング指標ストレージ170を含むものであって、各構成を別途に示しているが、これは例示に過ぎず、データモニタリングシステム100が利用する保存媒体は、一つ以上の任意の個数で構成されることができる。また、
図1は、データメタ情報DB130及び源泉データDB140を複数のDB(database)であると示しているが、これは、データメタ情報DB130及び源泉データDB140が、異なる位置にある複数のDBからなることを意味することができるということである。これとは異なり、データメタ情報DB130及び源泉データDB140は、一つのDBで構成されることもできる。
【0048】
ユーザ110は、データモニタリングの対象となるデータを選択できる。一実施例において、ユーザ110は、複数のデータセットの少なくとも一つのデータセットをモニタリング対象として選択できる。例えば、データセットは、データベース、DBテーブル又はデータコラムであり得る。ユーザ110は、選択されたモニタリング対象のデータセットに対するモニタリングタイプを決定できる。他の実施例において、ユーザは、ユーザのコンピューティング装置から接続可能である他のコンピューティング装置の複数のデータセット内で、少なくとも一つのデータセットをモニタリング対象として選択できる。複数のモニタリングタイプは、一般型(basic)、数値型(numeric)及びカテゴリ型(categorical)を含むことのできるが、これらに限定されるものではない。
【0049】
複数のモニタリングタイプのうち、一般型は、データセット内の重複項目個数(duplicate item count)又は固有項目個数(distinct item count)の少なくとも一つを集計する一つのタイプを意味することができる。重複項目個数は、データセット内で同じ値を有する複数の項目があるとき、重複した項目の個数を意味することができる。例えば、データセット内の{2,2,3,3,3,5,6}の値を有する7つの項目が含まれている場合、「2」が2個、「3」が3個含まれているので、重複項目個数は5個と集計できる。他の実施例において、重複項目個数は、データセット内で特定値に対する重複項目個数を示すことができる。例えば、システム100が、「2」値に対する重複項目個数を集計すると設定された場合、重複項目個数は2個と集計できる。固有項目個数は、重複した値が除去された項目の個数を称することができる。前記のデータセットの例示において、重複した値を除去する場合、データセットは{2,3,5,6}の値を含むので、固有項目個数は4個と集計できる。
【0050】
数値型は、データセットの基礎統計量を集計する一つのタイプを意味することができる。例えば、数値型は、データセット内に含まれた項目の最小値、最大値、平均値、標準偏差又は四分位数の少なくとも一つを集計する一つのタイプを意味することができる。
【0051】
カテゴリ型は、データセットの統計指標を算出する一つのタイプを意味することができる。一実施例において、カテゴリ型は、全体項目個数に対する各カテゴリ(category)内の項目個数の百分率を集計する一つのタイプを称することができる。例えば、前記のデータセットの例示において、各カテゴリに対応する値は、各々「2」、「3」、「5」、「6」であり、各カテゴリに該当する項目の個数が各々2個、3個、1個、1個であるので、各カテゴリの百分率は28.57%、42.86%、14.29%、14.29%に算出できる。
【0052】
モニタリングタイプは、前述した例に限定されず、他のタイプをさらに含むことができる。前述したモニタリングタイプの各機能は例示的なものであり、各モニタリングタイプで集計又は監視すると説明された内容は、他のモニタリングタイプで遂行できる。また、モニタリングタイプが一般型、数値型、カテゴリ型のように、複数のタイプに明確に区分されず、単一の統合された構成として前述した機能を遂行するように構成される得る。或いは、前述した機能を他の方式で適切に分配して遂行する異なる種類のモニタリングタイプがあり得る。
【0053】
管理システム120は、ユーザ110がモニタリングするデータセットを選択するように構成されたシステムを指すことができる。一実施例において、管理システム120は、ユーザ110がモニタリング対象として選択可能なデータベース目録をユーザ110に提供できる。ユーザ110が特定のデータベースを選択することに応じて、管理システム120は、該データベース内のDBテーブル目録を提供できる。次に、管理システム120は、ユーザが特定のDBテーブルを選択することに応じて、該DBテーブル内に含まれたデータコラム目録をユーザ110に提供できる。管理システム120は、選択可能なデータベース目録、該データベース内のDBテーブル目録、データコラム目録などをユーザ110に提供するために、源泉データDB140から該目録、これと関連した情報/データなどを受信できる。その後、ユーザ110は、データコラム目録からモニタリングするデータコラムを選択し、モニタリングタイプを決定できる。このために、管理システム120は、データメタ情報DB130から受信されたデータと関連したモニタリングタイプに関する情報を受信できる。
【0054】
管理システム120は、データセットを分析して、複数のモニタリングタイプのうち、データセットの推奨のモニタリングタイプをユーザ110に提供できる。一実施例において、管理システム120は、データセットのメタデータに基づいて、ユーザ110に推奨のモニタリングタイプを提供できる。このために、管理システム120は、データメタ情報DB130からデータセットのメタデータを受信できる。例えば、管理システム120は、データセットのデータタイプが数字型の場合には推奨のモニタリングタイプとして数値型を提供し、文字型の場合には一般型又はカテゴリ型を提供できる。他の実施例において、管理システム120は、データセットに含まれたデータ内の固有項目個数が既定の閾値以下である場合、推奨のモニタリングタイプとしてカテゴリ型を提供できる。また他の実施例において、管理システム120は、入力データ及び入力データと関連した情報に基づいて推奨のモニタリングタイプを導出するように学習された機械学習モデルに、データセット及びデータセットのメタデータを入力することで、ユーザに推奨のモニタリングタイプを提供できる。
【0055】
管理システム120は、ユーザ110が選択できるデータセットと関連した情報を、ユーザ端末を介してユーザ110に提供できる。管理システム120は、ユーザ110が少なくても一つのデータセットをモニタリング対象として選択できるように、データセットと関連した情報を含むデータメタ情報をデータメタ情報DB130から受信し、データメタ情報の少なくとも一部を、ユーザ端末を介してユーザ110に提供できる。具体的に、データメタ情報は、該データに含まれた各データセットと関連した情報、すなわち、データセットを示したり特徴化したりする任意の情報を含むことができる。例えば、データセットの名称、データタイプ、生成時間、保存位置、作成者、修正日、修正者、大きさなどを含むことができるが、これに限定されるものではない。
【0056】
バックエンドDB150には、管理システム120を介して、ユーザ110が選択したモニタリング対象のデータセットと関連した情報、又は、モニタリングタイプと関連した情報が保存され得る。例えば、バックエンドDB150には、ユーザ110がモニタリング対象として選択したデータベース、DBテーブル又はデータコラムの名称、保存位置などの情報が保存され、選択したデータベースなどに対するモニタリングタイプと関連した情報が保存され得る。
【0057】
集計システム160は、ユーザ110が選択したモニタリング対象に対する分析結果を算出できる。分析結果を算出するために、集計システム160は、モニタリング対象として選択されたデータセットと関連した情報、及び該データセットに対するモニタリングタイプと関連した情報を、管理システム120又はバックエンドDB150から受信できる。付加的又は代替的に、集計システム160は、選択されたモニタリング対象と関連したデータセットを源泉データDB140から受信できる。
【0058】
集計システム160は、受信した情報に基づいて分析ロジックを生成できる。例えば、集計システム160は、受信した情報に基づいてデータベースクエリを生成するように構成できる。
【0059】
集計システム160は、生成された分析ロジックをモニタリング対象のデータセットに適用して、分析結果を算出できる。ここで、分析結果は、モニタリング対象のデータセットを示したり特徴化したりする任意の情報を含むことができる。例えば、モニタリング対象のデータセットに対する重複項目個数、固有項目個数、データセット内に含まれた項目の最小値、最大値、平均値、標準偏差又は四分位数、全体項目個数に対する各カテゴリ(category)内の項目個数の百分率などを含むことができるが、これに限定されるものではない。付加的又は代替的に、集計システム160は、全体項目個数又はNull項目個数を分析結果として算出できる。集計システム160は、算出された分析結果をデータモニタリング指標ストレージ170に保存したり、可視化システム180に提供したりできる。
【0060】
一実施例において、集計システム160は、モニタリング対象のデータセットに対して、既定の時間間隔(例えば、1日)ごとに分析結果を算出できる。他の実施例において、集計システム160は、データメタ情報DB130内の少なくとも一つのデータセットに対するメタ情報及び/又は源泉データDB140内の少なくとも一つのデータセットに対する変動発生を感知することに応じて、分析結果を算出できる。
【0061】
可視化システム180は、集計システム160で集計されたデータに基づいて可視化した画面を、ユーザ端末を介してユーザ110に提供できる。可視化システム180がユーザ110に提供する具体的な画面の内容は、
図6乃至
図9で詳細に後述する。
【0062】
異常探知システム190は、集計システム160で集計された分析結果に基づいて、モニタリング対象のデータセットの異常を探知できる。図に示すように、異常探知システム190は、分析結果をデータモニタリング指標ストレージ170から受信できる。付加的又は代替的に、異常探知システム190は、集計システム160から分析結果を直接的に受信するように構成できる。
【0063】
一実施例において、異常探知システム190は、データセットで異常を探知した後、探知された異常と関連した異常探知報知を、該データセットと関連したユーザ端末に送信できる。ここで、データセットと関連したユーザ端末は、該データセットの管理者乃至責任者の端末であり得、各データセットと関連したユーザ端末の情報は、バックエンドDB150に予め保存されているものであり得る。異常探知システム190が送信する異常探知報知は、異常探知と関連した任意の情報を含むことができる。例えば、異常が発生したデータセットの名称、保存位置、データ階層構造上の位置、異常探知時刻、探知内容などに関する情報を含むことができるが、これに限定されるものではない。
【0064】
一実施例において、異常探知システム190は、データセット内の全体項目個数が、既定の第1の速度範囲よりも速く増加又は減少する場合、異常現象が発生したと探知できる。すなわち、データセット内の全体項目個数が急激に変動される場合、異常現象が発生したと探知できる。他の実施例において、異常探知システム190は、少なくとも一つのデータセット内の全体項目個数が、既定の第2の速度範囲よりも遅く増加するか、又は、既定の時間の間に増加しない場合、異常現象が発生したと探知できる。すなわち、該データセットと関連してデータが予想生成速度よりも遅いか、又は、生成されない場合、異常現象が発生したと探知できる。
【0065】
一実施例において、異常探知システム190は、決定されたモニタリングタイプが数値型である場合、少なくとも一つのデータセット内に含まれた項目の最小値、最大値、平均値、標準偏差又は四分位数の少なくとも一つが、既定の第3の速度範囲よりも速く増加又は減少するとき、異常現象が発生したと探知できる。すなわち、データの特徴が急激に変更される場合、異常現象が発生したと探知できる。
【0066】
一実施例において、異常探知システム190は、決定されたモニタリングタイプがカテゴリ型である場合、少なくとも一つのデータセット内に含まれたカテゴリの個数が増加又は減少するとき、異常現象が発生したと探知できる。すなわち、データセット内のカテゴリ、すなわちデータセット内にデータが分類されているグループの個数が変化するとき、異常現象が発生したと探知できる。
【0067】
一実施例において、異常探知システム190は、入力データ及び入力データと関連した情報に基づいて、異常現象の発生の有無を探知するように学習された機械学習モデルに、モニタリング対象として選択された少なくとも一つのデータセット及びモニタリングタイプを入力することで、異常現象が発生したと探知できる。
【0068】
前述した第1の速度範囲、第2の速度範囲及び/又は第3の速度範囲は、データセットと関連した情報に基づいて異なるように設定できる。具体的に、速度範囲又は速度は、データセットのレコード数、単位時間当たり入出力回数、データタイプなどに基づいて設定できる。例えば、速度範囲は、データセット内のレコード数に比例して、レコード数が多いほど、高い速度範囲に設定できる。
【0069】
図1では、図式の単純化のために、ユーザ110と関連したユーザ端末を示していないが、このようなユーザ端末は、管理システム120、集計システム160、可視化システム180、異常探知システム190の少なくとも一部に対し、有線及び/又は無線を介して互いに通信可能であるように構成できる。
【0070】
図2は、本開示の一実施例に係るデータモニタリングを提供するために、情報処理システム230が複数のユーザ端末210_1、201_2、210_3と通信可能であるように連結された構成を示す概要図である。情報処理システム230は、ネットワーク220を介して、複数のユーザ端末210_1、201_2、210_3にデータモニタリングを提供できるシステムを含むことができる。情報処理システム230は、
図1で説明された管理システム120、集計システム160、可視化システム180又は異常探知システム190の少なくとも一つを含むことができる。また、複数のユーザ端末210_1、201_2、210_3のいずれか一つは、
図1で説明されたユーザ110と関連したユーザ端末を意味することができる。
【0071】
一実施例によれば、情報処理システム230は、コンピュータ実行可能なプログラム(例えば、ダウンロード可能なアプリケーション)や、データの保存、提供及び実行できる一つ以上のサーバー装置及び/又はデータベースや、クラウドコンピューティング(cloud computing)サービス基盤の一つ以上の分散コンピューティング装置及び/又は分散データベースを含むことができる。例えば、情報処理システム230は、データモニタリングのための別途のシステム(例えば、サーバー装置やクラウド装置など)を含むことができる。情報処理システム230により提供されるデータモニタリングは、複数のユーザ端末210_1、201_2、210_3の各々に設置されたデータモニタリング提供アプリケーションを介して、ユーザに提供できる。
【0072】
複数のユーザ端末210_1、210_2、210_3は、ネットワーク220を介して情報処理システム230と通信できる。ネットワーク220は、複数のユーザ端末210_1、210_2、210_3及び情報処理システム230間の通信が可能であるように構成できる。ネットワーク220は、設置環境に応じて、例えば、イーサネット(Ethernet)、PLC(Power Line Communication)、電話線通信装置及びRS-serial通信などのような有線ネットワーク、移動通信網、WLAN(Wireless LAN)、Wi-Fi(登録商標)、Bluetooth(登録商標)及びZigBee(登録商標)などのような無線ネットワーク又はその組合せからなることができる。通信方式は制限されず、ネットワーク220を含むことができる通信網(例えば、移動通信網、有線インターネット、無線インターネット、放送網、衛星網等)を活用する通信方式だけでなく、ユーザ端末210_1、210_2、210_3間の近距離無線通信も含まれる。例えば、ネットワーク220は、PAN(personal area network)、LAN(local area network)、CAN(campus area network)、MAN(metropolitan area network)、WAN(wide area network)、BBN(broadband network)、インターネットなどのネットワークのいずれか一つ以上を含むことができる。また、ネットワーク220は、バスネットワーク、スターネットワーク、リングネットワーク、メッシュネットワーク、スター-バスネットワーク、ツリー又は階層ネットワーク(hierarchical network)などを含むネットワークトポロジー(network topology)のいずれか一つ以上を含むことのできるが、これに制限されるものではない。
【0073】
図2では、スマートフォン端末210_1、タブレット端末210_2及びラップトップコンピュータ端末210_3をユーザ端末の例として示したが、これに限定されず、ユーザ端末210_1、210_2、210_3は、有線及び/又は無線通信が可能であり、データモニタリング提供アプリケーションが設置されて実行できる任意のコンピューティング装置であり得る。例えば、ユーザ端末は、スマートフォン、携帯電話、ナビゲーション、デスクトップコンピュータ、ラップトップコンピュータ、デジタル放送用端末、PDA(Personal Digital Assistants)、PMP(Portable Multimedia Player)、タブレットPC、ゲームコンソール(game console)、ウェアラブルデバイス(wearable device)、IoT(internet of things)デバイス、VR(virtual reality)デバイス、AR(augmented reality)デバイスなどを含むことができる。また、
図2では、3つのユーザ端末210_1、210_2、210_3がネットワーク220を介して情報処理システム230と通信するものと示したが、これに限定されず、異なる数のユーザ端末がネットワーク220を介して情報処理システム230と通信するように構成されることもできる。
【0074】
一実施例において、情報処理システム230は、ユーザ端末210_1、210_2、210_3から、データモニタリング要請情報、データモニタリングと関連した一つ以上のデータセットと関連した情報及び/又はモニタリングタイプに関する情報を受信し、モニタリング対象のデータセット及びモニタリングタイプに基づいて集計された分析結果を、ユーザ端末210_1、210_2、210_3に転送できる。このとき、情報処理システム230は、
図1で説明された集計システム160を含むことができる。例えば、ユーザ端末210_1、210_2、210_3は、分析結果をユーザ端末210_1、210_2、210_3に装着/連結したり、接近可能なディスプレイ装置に出力したりできる。
【0075】
一実施例によれば、情報処理システム230は、モニタリング対象のデータセット内の異常探知のために、モニタリング対象のデータセット及びモニタリングタイプと関連した情報を受信できる。他の実施例によれば、情報処理システム230は、モニタリング対象のデータセット内の異常探知のために、データセット及びモニタリングタイプと関連した情報を機械学習モデルに入力できる。情報処理システム230は、機械学習モデルから探知された異常と関連した異常探知結果を、ユーザ端末に提供できる。
【0076】
図3は、本開示の一実施例に係るユーザ端末210及び情報処理システム230の内部構成を示すブロック図である。ユーザ端末210は、データモニタリングを提供するアプリケーションなどが実行可能であり、有/無線通信が可能な任意のコンピューティング装置を称することができ、例えば、
図2のスマートフォン端末210_1、タブレット端末210_2及びラップトップコンピュータ端末210_3などを含むことができる。図に示すように、ユーザ端末210は、メモリ312、プロセッサ314、通信モジュール316及び入出力インタフェース318を含むことができる。これと同様に、情報処理システム230は、メモリ332、プロセッサ334、通信モジュール336及び入出力インタフェース338を含むことができる。
図3に示すように、ユーザ端末210及び情報処理システム230は、各々の通信モジュール316、336を用いて、ネットワーク220を介して情報及び/又はデータが通信できるように構成できる。また、入出力装置320は、入出力インタフェース318を介して、ユーザ端末210に情報及び/又はデータを入力したり、ユーザ端末210から生成された情報及び/又はデータを出力したりするように構成できる。
【0077】
メモリ312、332は、非一時的な任意のコンピュータ読取り可能な記録媒体を含むことができる。一実施例によれば、メモリ312、332は、RAM(random access memory)、ROM(read only memory)、ディスクドライブ、SSD(solid state drive)及びフラッシュメモリ(flash memory)などのような永久的な大容量保存装置(permanent mass storage device)を含むことができる。他の例として、ROM、SSD、フラッシュメモリ及びディスクドライブなどのような永久的な大容量保存装置は、メモリとは区分される別途の永久保存装置としてユーザ端末210及び/又は情報処理システム230に含まれることができる。また、メモリ312、332には、運営体制と少なくとも一つのプログラムコード(例えば、ユーザ端末210に設置されて駆動されるデータモニタリングと関連したアプリケーションなどのためのコード)が保存され得る。
【0078】
このようなソフトウェア構成要素は、メモリ312、332とは別途のコンピュータ読取り可能な記録媒体からローディングできる。このような別途のコンピュータ読取り可能な記録媒体は、このようなユーザ端末210及び情報処理システム230に直接連結可能な記録媒体を含むことのできるが、例えば、フロッピードライブ、ディスク、テープ、DVD/CD-ROMドライブ及びメモリカードなどのようなコンピュータ読取り可能な記録媒体を含むことができる。他の例として、ソフトウェア構成要素等は、コンピュータ読取り可能な記録媒体でなく、通信モジュールを介してメモリ312、332にローディングされることもできる。例えば、少なくとも一つのプログラムは、開発者又はアプリケーションの設置ファイルを配信するファイル配信システムが、ネットワーク220を介して提供するファイルにより設置されるコンピュータプログラム(例えば、データモニタリングと関連したアプリケーションなど)に基づいてメモリ312、332にローディングされることができる。
【0079】
プロセッサ314、334は、基本的な算術、ロジック及び入出力演算を遂行することで、コンピュータプログラムの命令を処理するように構成できる。命令は、メモリ312、332及び/又は通信モジュール316、336により、プロセッサ314、334に提供され得る。例えば、プロセッサ314、334は、メモリ312、332のような記録装置に保存されたプログラムコードによって受信される命令を実行するように構成できる。
【0080】
通信モジュール316、336は、ネットワーク220を介して、ユーザ端末210と情報処理システム230とが互いに通信するための構成や機能を提供でき、ユーザ端末210及び/又は情報処理システム230が他のユーザ端末又は他のシステム(例えば、別途のクラウドシステムなど)と通信するための構成や機能を提供できる。一例として、ユーザ端末210のプロセッサ314がメモリ312などのような記録装置に保存されたプログラムコードによって生成した要請(例えば、データモニタリング提供要請情報)は、通信モジュール316の制御により、ネットワーク220を介して情報処理システム230に伝達され得る。反対に、情報処理システム230のプロセッサ334の制御により提供される制御信号や命令が、通信モジュール336及びネットワーク220を経て、ユーザ端末210の通信モジュール316を介してユーザ端末210に受信され得る。
【0081】
入出力インタフェース318は、入出力装置320とのインタフェースのための手段であり得る。一例として、入力装置はイメージセンサーを含むカメラ、キーボード、マイクロホン、マウスなどのような装置を含み、出力装置はディスプレイ装置、スピーカー、ハプティック(触覚)フィードバックデバイス(haptic feedback device)などのような装置を含むことができる。他の例として、入出力インタフェース318は、タッチスクリーンなどのように入力及び出力を遂行するための構成又は機能が一つで統合された装置とのインタフェースのための手段であり得る。例えば、ユーザ端末210のプロセッサ314がメモリ312にローディングされたコンピュータプログラムの命令を処理する際に、情報処理システム230や他のユーザ端末210が提供する情報及び/又はデータを用いて構成されるサービス画面が、入出力インタフェース318を介してディスプレイ装置に表示され得る。
図3では、入出力装置320がユーザ端末210に含まれないように示したが、これに限定されず、ユーザ端末210と一体に構成することもできる。また、情報処理システム230の入出力インタフェース338は、情報処理システム230と連結するか、又は、情報処理システム230が含むことのできる入力や出力のための装置(図示せず)とのインタフェースのための手段であり得る。
図3では、入出力インタフェース318、338がプロセッサ314、334と別途に構成された要素として示したが、これに限定されず、入出力インタフェース318、338がプロセッサ314、334に含まれるように構成することもできる。
【0082】
ユーザ端末210及び情報処理システム230は、
図3に示す構成要素よりも多くの構成要素を含むことができる。しかしながら、大部分の従来技術的構成要素を明確に示す必要はない。一実施例によれば、ユーザ端末210は、前述した入出力装置320の少なくとも一部を含むように具現化できる。また、ユーザ端末210は、トランシーバー(transceiver)、GPS(Global Positioning system)モジュール、カメラ、各種センサー及びデータベースなどのような他の構成要素をさらに含むことができる。例えば、ユーザ端末210がスマートフォンである場合、一般にスマートフォンが有する構成要素を含むことができ、例えば、加速度センサー、ジャイロセンサー、カメラモジュール、各種物理的なボタン、タッチパネルを用いたボタン、入出力ポート及び振動のための振動器などのような多様な構成要素がユーザ端末210にさらに含まれるように具現化できる。
【0083】
一実施例によれば、ユーザ端末210のプロセッサ314は、データモニタリングアプリケーション(例えば、データモニタリング専用アプリケーション又はデータモニタリングを提供できるウェブブラウザアプリケーション)が動作するように構成できる。このとき、該アプリケーションと関連したプログラムコードがユーザ端末210のメモリ312にローディングできる。アプリケーションが動作する際に、ユーザ端末210のプロセッサ314は、入出力装置320から提供された情報及び/又はデータを、入出力インタフェース318を介して受信したり、通信モジュール316を介して情報処理システム230から情報及び/又はデータを受信したりでき、受信された情報及び/又はデータを処理してメモ312に保存できる。また、このような情報及び/又はデータは、通信モジュール316を介して情報処理システム230に提供できる。
【0084】
データモニタリングを提供するアプリケーションが動作される際に、プロセッサ314は、入出力インタフェース318と連結されたタッチスクリーン、キーボード、オーディオセンサー及び/又はイメージセンサーを含むカメラ、マイクロホンなどのような入力装置により入力又は選択された音声データ、テキスト、イメージ、映像などが受信でき、受信された音声データ、テキスト、イメージ及び/又は映像などをメモリ312に保存したり、通信モジュール316及びネットワーク220を介して情報処理システム230に提供したりできる。ユーザ端末210のプロセッサ314は、情報及び/又はデータを、入出力インタフェース318を介して入出力装置320に転送して出力できる。例えば、ユーザ端末210のプロセッサ314は、ディスプレイ出力可能な装置(例:タッチスクリーンやディスプレイ装置など)、音声出力可能な装置(例:スピーカー)などの入出力装置320を介して処理された情報及び/又はデータを出力できる。
【0085】
ユーザ端末210のプロセッサ314は、入出力装置320、他のユーザ端末、情報処理システム230及び/又は複数の外部システムから受信された情報及び/又はデータを管理、処理及び/又は保存するように構成できる。プロセッサ314により処理された情報及び/又はデータは、通信モジュール316及びネットワーク220を介して情報処理システム230に提供できる。ユーザ端末210のプロセッサ314は、入出力インタフェース318を介して、入出力装置320に情報及び/又はデータを転送して出力できる。例えば、プロセッサ314は、受信した情報及び/又はデータを出力して、出力された情報及び/又はデータがユーザ端末の画面に表示され得る。
【0086】
情報処理システム230のプロセッサ334は、複数のユーザ端末及び/又は複数の外部システムから受信された情報及び/又はデータを管理、処理及び/又は保存するように構成できる。プロセッサ334により処理された情報及び/又はデータは、通信モジュール336及びネットワーク220を介してユーザ端末210に提供できる。
【0087】
図4は、本開示の一実施例に係るデータモニタリング設定画面400の例を示す図である。設定画面400は、ユーザが、データベースを選択できる第1の領域410と、データベース内のDBテーブルを選択できる第2の領域420と、モニタリング進行状態を確認できる第3の領域440とを含むことができる。
【0088】
第1の領域410では、データベース目録を表示できる。データベース目録は、データソースに含まれたデータベース目録を意味することができる。一実施例において、ユーザは、第1の領域410内の検索窓を介して、モニタリングするデータベースの名称を検索するための検索語を入力できる。このとき、該検索語を含むデータベース目録が、第1の領域410にフィルタリングされて表示され得る。
【0089】
ユーザは、第1の領域410に表示されたデータベース目録の一つを選択できる。データベースの一つが選択された場合、選択されたデータベース412内に含まれたDBテーブル目録が、第2の領域420に表示され得る。ユーザは、テーブル検索窓430を介して、テーブルのモニタリング状態を確認するか、或いは、変更するDBテーブルの名称を検索するための検索語を入力できる。このとき、該検索語を含むDBテーブル目録が、第2の領域420にフィルタリングされて表示され得る。
【0090】
ユーザは、第2の領域420に表示されたDBテーブル目録の一つを選択できる。DBテーブルの一つが選択された場合、選択されたDBテーブル内に含まれたデータコラム目録が表示され、ユーザは、各データコラムのモニタリングタイプを確認又は選択できる。これについては、
図5で詳細に後述する。
【0091】
第3の領域440には、各DBテーブルのモニタリング状態を表示できる。一実施例において、モニタリング状態は、各DBテーブルを正常にモニタリング中である(On状態)ことを示す第1のアイコン442、モニタリング進行中でない(Off状態)ことを示す第2のアイコン444、及びモニタリング失敗(Error状態)を示す第3のアイコン446で表示できる。
図4では、モニタリング状態をアイコンにより設定されるように示しているが、これに限定されず、モニタリング状態は多様な方式で表示できる。例えば、モニタリング状態は、トグルボタンで表示されることで、ユーザがモニタリング状態を確認し、これを変更できるように構成することもできる。
【0092】
ユーザは、第3の領域440に表示されたDBテーブルに対するモニタリング状態を変更したり、モニタリングタイプを変更したりできる。例えば、ユーザが、第1のアイコン442が表示されたDBテーブルを選択する場合、既存のモニタリング情報を修正したり、モニタリング状態をOff状態に転換したりできる別途の画面が表示され得る。他の例において、ユーザが、第2のアイコン444が表示されたDBテーブルを選択する場合、モニタリング状態がOn状態に転換され、新規のモニタリング情報を登録できる別途の画面が表示され得る。
【0093】
ユーザは、第3の領域440に表示されたDBテーブルのうち、モニタリングが失敗したDBテーブルのモニタリング失敗理由を受信できる。例えば、ユーザは、第3のアイコン446又は第3のアイコン446が表示されたDBテーブルを選択することで、モニタリング失敗理由を受信できる。モニタリング失敗理由は、例えば、ポップアップ形態で表示され得る。
【0094】
一実施例において、DBテーブル内に含まれたデータセットのデータタイプが数字型でないにも関わらず、該データセットのモニタリングタイプが数値型に設定された場合、モニタリングが失敗したと表示され得る。他の実施例において、データセットに含まれたデータ内の固有項目個数が既定の閾値以上であるにも関わらず、該データセットのモニタリングタイプがカテゴリ型に設定された場合、モニタリングが失敗したと表示され得る。また他の実施例において、モニタリングタイプを設定したデータセットが実際に存在しないか、或いは、ユーザが該データセットに対する読取り権限がない場合にも、モニタリングが失敗したと表示され得る。
【0095】
図4では、ユーザがモニタリング対象データベース及びDBテーブルを選択できる画面が出力され、DBテーブルのモニタリング状態が表示されるものとして説明されたが、これに限定されるものではない。例えば、これとは異なり、第2の領域420にデータベース目録が表示され、第3の領域440に各データベースのモニタリング状態が表示されることもできる。また、各領域410、420、440及び検索窓430などは、
図4に示すものに限定されず、各領域410、420、440又は検索窓430の一部の構成が省略されたり、その位置、大きさ又は構成要素が
図4に示すものと異なるように構成されたりできる。
【0096】
図5は、本開示の一実施例に係るデータセット目録520内の各データセットのモニタリングタイプ設定画面500の例を示す図である。ユーザは、各データセットに対してモニタリングタイプ540を決定し、異常探知報知設定560によりモニタリング対象のデータセットから異常が探知される場合、異常探知報知の送信の可否を選択できる。また、ユーザは、データセット設定510において、データセットのパーテーションの名称を指定したり、パーテーションフォーマットを指定したり、該データセットのデータ生成時間などを設定したりできる。
【0097】
データセット目録520には、モニタリングタイプを決定できるデータセットと関連した情報(例えば、データセットの名称)を表示できる。
図5では、データセットがデータコラムであるものと示したが、これに限定されず、データセットはデータベース、DBテーブル又はデータコラムなどであり得る。
【0098】
設定画面500には、各データセットに含まれたデータのデータタイプ530を表示できる。データタイプ530は、データのタイプを示す任意の情報を含むことができる。
図5に示すように、数字型(例えば、Bigint、Double、Int、Doubleなど)又は文字型(例えば、Stringなど)であり得るが、これに限定されるものではない。
【0099】
設定画面500には、各データセットのモニタリングタイプ540を表示できる。モニタリングタイプは、一般型、数値型及びカテゴリ型を含むことのできるが、これに限定されるものではない。ユーザは、各データセットのモニタリングの可否及び/又はモニタリングタイプ540を決定できる。具体的に、ユーザは、モニタリングしたくないデータセットをモニタリング対象のデータセットから排除したり、各データセットのモニタリングタイプを一般型、数値型及びカテゴリ型のうちで決定したりできる。一実施例において、設定画面500は、ドロップボックス又はラジオボタンなどにより、ユーザが一つのモニタリングタイプを決定できるように構成できる。他の実施例において、設定画面500は、チェックボックスなどにより、ユーザが一つ以上のタイプを決定できるように構成できる。
【0100】
モニタリングタイプ540は、データセットと関連した情報に基づいて設定できる。モニタリングタイプ540は、データセットのメタデータに基づいて設定できる。一実施例において、モニタリングタイプ540は、データセットのデータタイプが、数字型であれば数値型に設定し、文字型であれば一般型又はカテゴリ型に設定できる。他の実施例において、モニタリングタイプ540は、データセットに含まれたデータ内の固有項目個数が、既定の閾値以下であればカテゴリ型に設定できる。また他の実施例において、モニタリングタイプ540は、入力データ及び入力データと関連した情報に基づいて、モニタリングタイプを導出するように学習された機械学習モデルに、データセット及びデータセットのメタデータ(例えば、データセットのデータタイプ)を入力することで、導出された一つのタイプに設定できる。このとき、一つ以上のモニタリングタイプを設定できる。
【0101】
設定画面500には、各データセットに関する説明550を表示できる。説明550は、データセットの異常が探知されたとき、異常探知報知を送信するのに用いられる。
【0102】
設定画面500は、ユーザが異常探知報知を送信するか否かを選択できるように、異常探知報知設定560を含むことができる。
図5において、異常探知報知設定560は、トグルボタンとして示したが、これに限定されるものではない。ユーザは、異常探知報知設定560により、データセット目録520内のデータセットの全てに対する報知を設定したり、一つ以上のデータセットに対する報知を個別的に設定したりできる。
【0103】
ユーザは、異常探知報知設定560において、異常探知報知を送信するユーザ端末の追加、削除又は修正が可能である。異常探知報知設定560において、報知が活性化する場合、データセットの異常を探知すれば、既定のユーザ端末に異常探知報知を送信できる。
【0104】
図6は、本開示の一実施例に係るモニタリング総合分析結果を表示する画面600の例を示す図である。画面600は、ユーザが、モニタリング分析結果を照会するデータセットを選択する第1の領域610と、総合分析結果又は一つのモニタリングタイプに従う分析結果が出力されるように、モニタリングタイプを選択する第2の領域620とを含むことができる。また、画面600は、データセット内に含まれた全体項目個数を算出する期間を設定する第3の領域630と、特定の日及び/又は時間の当時のデータセット内の全体項目個数、及び前日に対する全体項目個数の増減率を表示する第4の領域640と、第3の領域630で設定された期間内の全体項目個数の推移を視覚化する第5の領域650とを含むことができる。また、画面600は、第3の領域630で設定された期間のデータセット内のNull項目個数の推移を視覚化する第6の領域660と、データセット内のNull項目個数を照会する日及び/又は時間を指定するための第7の領域670と、データセットの各々のNull項目個数、及び全体項目個数に対するNull項目の比率を表示する第8の領域680とを含むことができる。
【0105】
画面内に含まれた各領域は、
図6に示すものに限定されず、各領域の一部の領域又は領域内の一部の構成が省略されたり、その位置、大きさ又は構成要素が
図6に示すものと異なるように構成されたりできる。
【0106】
第1の領域610において、ユーザは、モニタリング分析結果を照会する一つ以上のデータセットを選択できる。例えば、ユーザは、データソースを選択し、データソース内のデータベースを選択し、データベース内のDBテーブルを選択し、DBテーブル内でモニタリング分析結果を照会する一つ以上のデータコラムを選択できる。第1の領域610と関連した構成は、
図7乃至
図9に示していないが、
図6と同様に適用できる。
【0107】
第2の領域620において、ユーザは、総合分析結果が出力されるように、Overview項目を選択したり、該モニタリングタイプに従う分析結果が出力されるように、複数のモニタリングタイプ(Basic、Numeric、Categorical項目)の一つを選択したりできる。
図6は、第2の領域620において、総合分析結果が出力されるように選択されることを前提として説明する。一実施例において、ユーザが、特定モニタリングタイプ(Basic、Numeric、Categorical項目の一つ)を選択する場合、
図5において該タイプでモニタリングされるように指定した複数のデータセットと関連した分析結果を提供できる。このような分析結果は、
図7乃至
図9で詳細に説明される。
【0108】
ユーザは、第3の領域630において、データセット内に含まれた全体項目個数を算出する期間を設定できる。期間は、ユーザが一つ以上の日及び/又は時間を指定することにより設定できる。例えば、期間は、特定の日及び/又は時間から他の日及び/又は時間までに設定されたり、特定の日及び/又は時間の以前に設定されたり、特定の日及び/又は時間の以後に設定されたりできる。
【0109】
第4の領域640では、特定の日及び/又は時間の当時のデータセット内の全体項目個数、及び前日に対する全体項目個数の増減率を表示できる。図に示すように、第4の領域640には、分析結果照会日及び照会時間の当時の全体項目個数、前日に対する全体項目個数の増減率を表示できる。全体項目個数は多様な形式で表示できる。例えば、全体項目個数と関連した情報は、数字と数字の大きさを示す単位(例:K、M、Gなど)とを結合した形式で表示できる。付加的又は代替的に、第4の領域640では、前日に対する全体項目個数の増減個数を表示できる。
【0110】
第5の領域650では、第3の領域630で設定された期間内の全体項目個数の推移を視覚化して表示できる。一実施例において、期間内の全体項目個数を各日に応じて折れ線グラフ形態で表示できる。このとき、月別に互いに異なる線でグラフを表示できる。このような実施例に限定されず、多様な方式で全体項目個数の日別の推移を表現できる。
【0111】
第6の領域660では、データセット内のNull項目個数の日別の推移を視覚化して表示できる。一実施例において、第6の領域660には、ユーザが第1の領域610で選択した一つ以上のデータコラムの各々に対応するグラフを表示できる。グラフは、x軸の時間変化によってy軸のNull項目個数が変化するように表示できる。このとき、各グラフにはx軸と平行な基準線が表示され、基準線の高さはユーザが選択した一つ以上のデータコラム内の固有項目の平均個数又は既定の閾個数に対応できる。これに限定されず、固有項目個数の推移は多様な形態で表現できる。他の実施例において、第6の領域660には、第1の領域610で選択したデータコラムの全てに含まれたNull項目の個数がグラフで表示され得る。
【0112】
第7の領域670では、ユーザがデータセット内のNull項目個数を照会する日及び/又は時間を指定できる。第8の領域680では、第7の領域670で指定された日及び/又は時間のデータセット内のNull項目個数、全体項目個数、又は全体項目個数に対するNull項目個数の比率の少なくとも一つを表示できる。
図6では、前記の内容が表の形態で表示されたが、これに限定されず、円グラフなどのような多様な形態で表示できる。
【0113】
図7は、本開示の一実施例に係る一般型のモニタリング分析結果を表示する画面700の例を示す図である。画面700は、ユーザが総合分析結果又はモニタリングタイプの一つに従う分析結果が出力されるように選択する第1の領域710と、ユーザがデータセット内の固有項目個数及び重複項目個数を算出する期間を設定する第2の領域720とを含むことができる。また、画面700は、第2の領域720で設定された期間内の固有項目個数の推移を視覚化する第3の領域730と、第2の領域720で設定された期間内の重複項目個数の推移を視覚化する第4の領域740とを含むことができる。画面700は、ユーザがデータセット内の固有項目個数及び/又は重複項目個数を照会する日及び/又は時間を指定するための第5の領域750と、データセットの各々の固有項目個数、重複項目個数、全体項目個数、全体項目個数に対する固有項目個数又は重複項目個数の比率の少なくとも一つを表示する第6の領域760とを含むことができる。
【0114】
図7は、第1の領域710において、モニタリングタイプが一般型で決定されたデータセットに対する分析結果が出力されるように選択されることを前提として説明する。画面は、
図7に示すものに限定されず、各領域の一部の領域又は領域内の一部の構成が省略されたり、その位置、大きさ又は構成要素が
図7に示すものと異なるように構成されたりできる。
【0115】
ユーザは、第2の領域720において、データセット内に含まれた固有項目個数及び/又は重複項目個数を算出する期間を設定できる。算出する期間は、ユーザが一つ以上の日及び/又は時間を指定することにより設定できる。例えば、算出する期間は、特定の日及び/又は時間から他の日及び/又は時間までに設定されたり、特定の日及び/又は時間の以前に設定されたり、特定の日及び/又は時間の以後に設定されたりできる。
【0116】
第3の領域730には、データセット内の固有項目個数の日別又は時間別の推移を視覚化して表示でき、第4の領域740には、データセット内の重複項目個数の日別又は時間別の推移を視覚化して表示できる。一実施例において、第3の領域730及び/又は第4の領域には、ユーザが選択した一つ以上のデータコラムの各々に対応するグラフを表示できる。第3の領域730及び/又は第4の領域740内のグラフは、x軸の時間変化によってy軸の固有項目個数及び/又は重複項目個数が変化するように表示できる。このとき、各グラフにはx軸と平行な基準線が表示され、基準線の高さはユーザが選択した一つ以上のデータコラム内の固有項目の平均個数及び/又は重複項目の平均個数に対応できる。代替的に、基準線の高さは既定の閾個数に対応できる。これに限定されず、固有項目個数及び重複項目個数の推移は多様な形態で表現できる。
【0117】
第5の領域750では、ユーザがデータセット内の固有項目個数及び/又は重複項目個数を照会する日及び/又は時間を指定できる。第6の領域760では、第5の領域750で指定された日及び/又は時間の当時のデータセット内の固有項目個数、重複項目個数、全体項目個数に対する固有項目個数の比率又は重複項目個数の比率の少なくとも一つを表示できる。
図7では、前記の内容が表の形態で表示されたが、これに限定されず、円グラフなどのような多様な形態で表示され得る。
【0118】
図8は、本開示の一実施例に係る数値型のモニタリング分析結果を表示する画面800の例を示す図である。画面800は、ユーザが総合分析結果又はモニタリングタイプの一つに従う分析結果が出力されるように選択する第1の領域810と、ユーザがデータセット内の基礎統計量を算出する期間を設定する第2の領域820とを含むことができる。また、画面800は、第2の領域820で設定された期間内の基礎統計量の推移を視覚化する第3の領域830と、第2の領域820で設定された期間内の基礎統計量変化率の推移を視覚化する第4の領域840とを含むことができる。また、画面800は、ユーザがデータセット内の基礎統計量を照会する日及び/又は時間を指定するための第5の領域850と、データセットの各々の基礎統計量の少なくとも一つを表示する第6の領域860とを含むことができる。基礎統計量は、データセット内に含まれた項目の最小値、最大値、平均値、標準偏差又は四分位数などを含むことができる。
【0119】
図8は、第1の領域810において、モニタリングタイプが数値型で決定されたデータセットに対する分析結果が出力されるように選択されることを前提として説明する。画面は、
図8に示すものに限定されず、各領域の一部の領域又は領域内の一部の構成が省略されたり、その位置、大きさ又は構成要素が
図8に示すものと異なるように構成されたりできる。
【0120】
ユーザは、第2の領域820において、データセット内に含まれた項目の基礎統計量を算出する期間を設定できる。算出する期間は、ユーザが一つ以上の日及び/又は時間を指定することにより設定できる。例えば、算出する期間は、特定の日及び/又は時間から他の日及び/又は時間までに設定されたり、特定の日及び/又は時間の以前に設定されたり、特定の日及び/又は時間の以後に設定されたりできる。
【0121】
第3の領域830には、データセットの基礎統計量の日別又は時間別の推移を視覚化して表示でき、第4の領域840には、データセット内の基礎統計量変化率の日別又は時間別の推移を視覚化して表示できる。一実施例において、第3の領域830には、ユーザが選択した一つ以上のデータコラムの各々に対応するグラフを含む一つ以上の基礎統計量チャートが表示され、第4の領域840には、データコラムの各々に対応するグラフを含む一つ以上の基礎統計量変化率チャートが表示される。各データセット内の項目の値の差異が大きい場合、基礎統計量を一つのチャートとして確認し難いので、基礎統計量変化率チャートにより、このような問題を解決できる。
【0122】
第3の領域830及び/又は第4の領域840内の一つ以上のチャートは、x軸の時間変化によってy軸の基礎統計量又は基礎統計量変化率が変化するように表示できる。このとき、各チャートにはx軸と平行な基準線が表示され、基準線の高さはユーザが選択した一つ以上のデータコラム内の基礎統計量の平均値又は基礎統計量変化率の平均値に各々対応できる。代替的に、基準線の高さは、既定の閾値又は閾比率に対応できる。これに限定されず、基礎統計量又は基礎統計量変化率の推移は、多様な形態で表現できる。
【0123】
第5の領域850では、ユーザがデータセット内の基礎統計量又は基礎統計量変化率を照会する日及び/又は時間を指定できる。第6の領域860では、第5の領域850で指定された日及び/又は時間の当時のデータセットの基礎統計量又は基礎統計量変化率の少なくとも一つを表示できる。
図8では、前記の内容が表の形態で表示されたが、これに限定されず、円グラフなどのような多様な形態で表示できる。
【0124】
図9は、本開示の一実施例に係るカテゴリ型のモニタリング分析結果を表示する画面900の例を示す図である。画面900は、ユーザが総合分析結果又はモニタリングタイプの一つに従う分析結果が出力されるように選択する第1の領域910と、ユーザがデータセット内の全体項目個数に対する各カテゴリ内の項目個数の百分率及び/又は各カテゴリ内の項目個数を算出する期間を設定する第2の領域920とを含むことができる。画面900は、第2の領域920で設定された期間内の百分率の推移を視覚化する第3の領域930と、第2の領域920で設定された期間内の各カテゴリ内の項目個数の推移を視覚化する第4の領域940とを含むことができる。画面900は、ユーザがデータセットの各カテゴリ内の項目個数又は百分率を照会する日及び/又は時間を指定するための第5の領域950と、第5の領域950で設定された日及び/又は時間の当時のデータセット内の全体項目個数に対する各カテゴリ内の項目個数の百分率を表示する第6の領域960と、第5の領域950で設定された日及び/又は時間の当時の各カテゴリ内の項目個数を表示する第7の領域970とを含むことができる。
【0125】
図9は、第1の領域910において、モニタリングタイプがカテゴリ型で決定されたデータセットに対する分析結果が出力されるように選択されることを前提として説明する。画面は、
図9に示すものに限定されず、各領域の一部の領域又は領域内の一部の構成が省略されたり、その位置、大きさ又は構成要素が
図9に示すものと異なるように構成されたりできる。
【0126】
ユーザは、第2の領域920において、データセット内の全体項目個数に対する各カテゴリ内の項目個数の百分率及び/又は各カテゴリ内の項目個数を算出する期間を設定できる。算出する期間は、ユーザが一つ以上の日及び/又は時間を指定することにより設定できる。例えば、算出する期間は、特定の日及び/又は時間から他の日及び/又は時間までに設定されたり、特定の日及び/又は時間の以前に設定されたり、特定の日及び/又は時間の以後に設定されたりできる。
【0127】
第3の領域930では、データセット内の全体項目個数に対する各カテゴリ内の項目個数の百分率の日別又は時間別の推移を視覚化して表示でき、第4の領域940では、各カテゴリ内の項目個数の日別又は時間別の推移を視覚化して表示できる。百分率の推移は、比率グラフなどのような多様な形態で表現できる。
【0128】
第5の領域950では、ユーザがデータセットの各カテゴリ内の項目個数又は百分率を照会する日及び/又は時間を指定できる。第6の領域960では、第5の領域950で指定された日及び/又は時間の当時のデータセットの各カテゴリ内の項目個数の百分率を表示できる。
図9では、前記の内容が円グラフの形態で表示されたが、これに限定されず、多様な形態で表示できる。第7の領域970では、第5の領域950で設定された日及び/又は時間の当時の各カテゴリ内の項目個数を表示できる。
【0129】
図10は、本開示の一実施例に係るデータモニタリング方法1000を示すフローチャートである。一実施例において、データモニタリング方法1000は、ユーザ端末(例えば、ユーザ端末210の少なくとも一つのプロセッサ)及び/又は情報処理システム(例えば、情報処理システム230の少なくとも一つのプロセッサ)により遂行できる。方法1000は、コンピューティング装置に含まれたプロセッサが複数のデータセット内で、少なくとも一つのデータセットをモニタリング対象として選択する第1のユーザ入力を受信するステップ(S1010)により開始することができる。一実施例において、プロセッサは、コンピューティング装置から接続可能である他のコンピューティング装置の複数のデータセット内で、少なくとも一つのデータセットをモニタリング対象として選択する第1のユーザ入力を受信できる。
【0130】
その後、プロセッサは、少なくとも一つのデータセットを分析して、複数のモニタリングタイプのうち、選択された少なくとも一つのデータセットに対する推奨のモニタリングタイプを出力できる(S1020)。例えば、プロセッサは、選択された少なくとも一つのデータセットのメタデータに基づいて、少なくとも一つのデータセットの推奨のモニタリングタイプを出力できる。他の例において、プロセッサは、少なくとも一つのデータセットに含まれたデータ内の固有項目個数が既定の閾値以下である場合、推奨のモニタリングタイプとしてカテゴリ型を出力できる。
【0131】
その後、プロセッサは、複数のモニタリングタイプのうち、選択された少なくとも一つのデータセットに対するモニタリングタイプを決定する第2のユーザ入力を受信できる(S1030)。ここで、モニタリングタイプは、一般型、数値型及びカテゴリ型を含むことができるが、これに限定されるものではない。
【0132】
プロセッサは、選択された少なくとも一つのデータセット及び決定されたモニタリングタイプに基づいて算出された、少なくとも一つのデータセットに含まれたデータに対する分析結果を出力できる(S1040)。一実施例において、プロセッサは、決定されたモニタリングタイプが一般型である場合、少なくとも一つのデータセット内の重複項目個数又は固有項目個数の少なくとも一つを出力できる。他の実施例において、プロセッサは、決定されたモニタリングタイプが数値型である場合、少なくとも一つのデータセット内に含まれた項目の最小値、最大値、平均値、標準偏差又は四分位数の少なくとも一つを出力できる。また他の実施例において、プロセッサは、決定されたモニタリングタイプがカテゴリ型である場合、少なくとも一つのデータセット内の全体項目個数に対する各カテゴリ内の項目個数の百分率を出力できる。
【0133】
一実施例において、プロセッサは、少なくとも一つのデータセットに含まれた全体項目個数又はNull項目個数の少なくとも一つを出力できる。
【0134】
一実施例において、少なくとも一つのデータセット内に異常現象が発生したと探知されることに応じて、異常探知報知を少なくとも一つのデータセットと関連したユーザ端末に送信できる。例えば、少なくとも一つのデータセット内の全体項目個数が、既定の第1の速度範囲よりも速く増加又は減少する第1の異常現象が発生したと探知されることに応じて、異常探知報知をユーザ端末に送信できる。他の例として、少なくとも一つのデータセット内の全体項目個数が、既定の第2の速度範囲よりも遅く増加したり、既定の時間の間に増加しなかったりする第2の異常現象が発生したと探知されることに応じて、異常探知報知をユーザ端末に送信できる。また他の例として、決定されたモニタリングタイプが数値型である場合、少なくとも一つのデータセット内に含まれた項目の最小値、最大値、平均値、標準偏差又は四分位数の少なくとも一つが、既定の第3の速度範囲よりも速く増加又は減少する第3の異常現象が発生したと探知されることに応じて、異常探知報知をユーザ端末に送信できる。また他の例として、決定されたモニタリングタイプがカテゴリ型である場合、少なくとも一つのデータセット内に含まれたカテゴリの個数が増加又は減少する第4の異常現象が発生したと探知されることに応じて、異常探知報知をユーザ端末に送信できる。また他の例として、入力データ及び入力データと関連した情報に基づいて、異常現象の発生の可否を探知するように学習された機械学習モデルに、第2のユーザ入力及び少なくとも一つのデータセットを入力し、異常現象が発生したと探知されることに応じて、異常探知報知をユーザ端末に送信できる。このような異常現象探知は、
図1の異常探知システム190で実行され、このような異常探知報知は、異常現象の管理又は責任を担当するユーザと関連したユーザ端末に送信できる。
【0135】
一実施例において、情報処理システム(例:
図1の集計システム160)は、ユーザ入力により、選択された少なくとも一つのデータセット及び決定されたモニタリングタイプに基づいて分析ロジックを生成し、少なくとも一つのデータセットに分析ロジックを適用して、少なくとも一つのデータセットに含まれたデータに対する分析結果を算出できる。
【0136】
図11は、本開示の一実施例に係る人工神経網モデル1100の例を示す図である。人工神経網モデル1100は、機械学習モデルの一例として、機械学習(Machine Learning)技術及び認知科学において、生物学的神経網の構造に基づいて具現化した統計学的学習アルゴリズム、又は、そのアルゴリズムを実行する構造であり得る。
【0137】
一実施例によれば、人工神経網モデル1100は、生物学的神経網のように、シナプスの結合によりネットワークを形成した人工ニューロンであるノード(Node)等がシナプスの加重値を繰り返し調整して、特定の入力に対応した正しい出力及び推論された出力間の誤差が減少するように学習することで、問題解決能力を持つ機械学習モデルを示すことができる。例えば、人工神経網モデル1100は、機械学習やディープラーニングなどの人工知能学習法に使用される任意の確率モデル、ニューラルネットワークモデルなどを含むことができる。
【0138】
一実施例によれば、前述した推奨のモニタリングタイプ抽出モデル及び異常現像探知モデルは、人工神経網モデル1100の形態で生成できる。例えば、人工神経網モデル1100は、データセット及びデータセットのメタデータを受信し、推奨のモニタリングタイプを抽出できる。他の例として、人工神経網モデル1100は、モニタリング対象として選択された少なくとも一つのデータセット及びモニタリングタイプを受信し、異常現象の発生の有無を判定できる。
【0139】
人工神経網モデル1100は、多層のノード等及びこれら間の連結により構成された多層パーセプトロン(multilayer perceptron、MLP)で具現化される。本実施例に係る人工神経網モデル1100は、MLPを含む多様な人工神経網モデル構造の一つを用いて具現化できる。
図11に示すように、人工神経網モデル1100は、外部から入力信号又はデータ1110を受信する入力層1120と、入力データに対応する出力信号又はデータ1150を出力する出力層1140と、入力層1120及び出力層1140間に位置し、入力層1120から信号を受信して特性を抽出して、出力層1140に伝達するn個(ここで、nは正の整数)の隠れ層1130_1乃至1130_nとからなる。ここで、出力層1140は、隠れ層1130_1乃至1130_nから信号を受信して外部に出力する。
【0140】
人工神経網モデル1100の学習方法には、教師信号(正解)の入力によって問題の解決に最適化するように学習する教師あり学習(Supervised Learning)方法と、教師信号を必要としない教師なし学習(Unsupervised Learning)方法とがある。一実施例において、情報処理システムは、データセット及びデータセットのモニタリングタイプを利用したり、データセット及びデータセットのメタデータを利用したりして、人工神経網モデル1100を学習させることができる。
【0141】
一実施例によれば、情報処理システムは、人工神経網モデル1100を学習させるための学習データを直接的に生成できる。例えば、情報処理システムは、モニタリング対象のデータセット及びモニタリング対象のデータセットのメタデータを含む学習データセットを生成できる。その後、情報処理システムは、生成された学習データセットに基づいて、モニタリング対象のデータセットに対する推奨のモニタリングタイプを抽出するための人工神経網モデル1100を学習させることができる。他の例において、情報処理システムは、モニタリング対象のデータセット及びモニタリングタイプを含む学習データセットを生成できる。その後、情報処理システムは、生成された学習データセットに基づいて、モニタリング対象のデータセットの異常現像を探知するための人工神経網モデル1100を学習させることができる。
【0142】
一実施例によれば、人工神経網モデル1100の入力変数は、データセット及びデータセットのメタデータを含むことができる。このように、前述した入力変数が入力層1120により入力される場合、人工神経網モデル1100の出力層1140から出力される出力変数は、データセットに対する推奨のモニタリングタイプになり得る。他の実施例によれば、人工神経網モデル1100の入力変数は、モニタリング対象として選択された少なくとも一つのデータセット及びモニタリングタイプを含むことができる。このように、前述した入力変数が入力層1120により入力される場合、人工神経網モデル1100の出力層1140から出力される出力変数は、データセット内の異常現象の発生の有無になり得る。
【0143】
このように、人工神経網モデル1100の入力層1120及び出力層1140に複数の入力変数と対応する複数の出力変数が各々マッチングされ、入力層1120、隠れ層1130_1乃至1130_n及び出力層1140に含まれたノード等間のシナプス値が調整されることで、特定の入力に対応した正しい出力が抽出されるように学習できる。このような学習過程により、人工神経網モデル1100の入力変数の隠れ特性を把握でき、入力変数に基づいて計算された出力変数及び目標出力間の誤差が低減するように、人工神経網モデル1100のノード等間のシナプス値(又は加重値)を調整できる。また、情報処理システムは、一つのデータセットを受信するアルゴリズムを学習し、該データセットの推奨のモニタリングタイプ情報又は異常現像発生情報(すなわち、アノテーション情報)との損失(loss)を最小化する方式で学習できる。
【0144】
このように学習された人工神経網モデル1100を用いて、データセットの推奨のモニタリングタイプを抽出できる。また、学習された人工神経網モデル1100を用いて、データセット内の異常現像の発生の有無を抽出できる。
【0145】
前述した方法は、コンピュータで実行するために、コンピュータ読取り可能な記録媒体に保存されたコンピュータプログラムとして提供され得る。媒体は、コンピュータで実行可能なプログラムを継続的に保存し、又は、実行又はダウンロードのために一時保存するものであり得る。また、媒体は、単一又は多数のハードウェアが結合された形態の多様な記録手段又は保存手段であり得るが、あるコンピュータシステムに直接接続される媒体に限定されず、ネットワーク上に分散して存在するものであり得る。媒体の例としては、ハードディスク、フロッピー(登録商標)ディスクや磁気テープのような磁気媒体、CD-ROMやDVDのような光記録媒体、フロプティカルディスク(floptical disk)のような磁気-光媒体(magneto-optical medium)、ROM、RAM、フラッシュメモリなどを含み、プログラム命令語が保存されるように構成されたものが挙げられる。また、他の媒体の例としては、アプリケーションを流通するアプリストアやその他の多様なソフトウェアを供給乃至流通するサイト、サーバーなどで管理する記録媒体乃至保存媒体も挙げられる。
【0146】
本開示の方法、動作、又は技法は、多様な手段により具現化できる。例えば、このような技法は、ハードウェア、ファームウェア、ソフトウェア、若しくは、これらの組合せで具現化できる。本願の開示により説明された多様な例示的な論理的ブロック、モジュール、回路、及びアルゴリズムステップは、電子ハードウェア、コンピュータソフトウェア、若しくは、両方の組合せで具現化できることを、当業者であれば理解できる。ハードウェア及びソフトウェアのこのような相互の代替を明確に説明するために、多様な例示的な構成要素、ブロック、モジュール、回路、及びステップが、それらの機能的観点から一般的に前述された。そのような機能が、ハードウェアとして具現化されるか、若しくは、ソフトウェアとして具現化されるかは、特定アプリケーション及び全体システムに付加される設計要求事項によって変化する。当業者は、各々の特定アプリケーションのために多様な方式により説明された機能を具現化することもできるが、そのような具現化は、本開示の範囲から逸脱するものではない。
【0147】
ハードウェアの具現化において、技法の遂行に利用されるプロセッシングユニットは、一つ以上のASIC、DSP、デジタル信号処理デバイス(digital signal processing devices DSPD)、プログラム可能な論理デバイス(programmable logic devices PLD)、フィールドプログラム可能なゲートアレイ(field programmable gate arrays FPGA)、プロセッサ、制御器、マイクロ制御器、マイクロプロセッサ、電子デバイス、本開示に説明された機能を遂行するように設計された他の電子ユニット、コンピュータ、若しくは、これらの組合せにおいても具現化され得る。
【0148】
したがって、本開示により説明された多様な例示的な論理ブロック、モジュール、及び回路は、汎用プロセッサ、DSP、ASIC、FPGAや他のプログラム可能な論理デバイス、離散ゲートやトランジスタロジック、離散ハードウェアコンポーネント、若しくは、本願に説明された機能を遂行するように設計されたもの等の任意の組合せにより、具現化又は遂行されることもできる。汎用プロセッサは、マイクロプロセッサであり得るが、代替的に、プロセッサは、任意の従来のプロセッサ、制御器、マイクロ制御器、若しくは、状態マシンであり得る。プロセッサは、また、コンピューティングデバイスの組合せ、例えば、DSPとマイクロプロセッサ、複数のマイクロプロセッサ、DSPコアと関連した一つ以上のマイクロプロセッサ、若しくは、任意の他の構成の組合せにより具現化されることもできる。
【0149】
ファームウェア及び/又はソフトウェアの具現化において、技法は、RAM(random access memory)、ROM(read-only memory)、NVRAM(non-volatile random access memory)、PROM(programmable read-only memory)、EPROM(erasable programmable read-only memory)、EEPROM(electrically erasable PROM)、フラッシュメモリ、CD(compact disc)、磁気又は光学データストレージデバイスなどのようなコンピュータ読取り可能な媒体上に保存された命令で具現化できる。命令は、一つ以上のプロセッサにより実行可能であり、プロセッサ等が、本開示に説明された機能の特定態様を遂行することが可能である。
【0150】
ソフトウェアとして具現化される場合、前記技法は、一つ以上の命令又はコードとしてコンピュータ読取り可能な媒体上に保存されたり、コンピュータ読取り可能な媒体を介して転送されたりできる。コンピュータ読取り可能な媒体は、ある場所から他の場所にコンピュータプログラムの転送を容易にする任意の媒体を含み、コンピュータ保存媒体及び通信媒体の両方を含む。保存媒体は、コンピュータによってアクセスできる任意の利用可能な媒体であり得る。非制限的な例として、このようなコンピュータ読取り可能な媒体は、RAM、ROM、EEPROM、CD-ROMや他の光学ディスクストレージ、磁気ディスクストレージや他の磁気ストレージデバイス、若しくは、所望のプログラムコードを命令又はデータ構造の形態で移送又は保存するために使用されることができ、コンピュータによってアクセスできる任意の他の媒体を含むことができる。また、任意の接続がコンピュータ読取り可能な媒体として適切に称することができる。
【0151】
例えば、ソフトウェアが同軸ケーブル、光ファイバーケーブル、鉛線、デジタル加入者回線(DSL)、又は、赤外線、無線及びマイクロ波のような無線技術を用いて、ウェブサイト、サーバー又は他の遠隔ソースから転送される場合、同軸ケーブル、光ファイバーケーブル、鉛線、デジタル加入者回線、又は、赤外線、無線及びマイクロ波などのような無線技術は、媒体の定義内に含まれる。本願で使用されたディスク(disk)及びディスク(disc)は、CD、レーザーディスク、光ディスク、DVD(digital versatile disc)、フロッピーディスク及びブルーレイディスクを含み、ここで、通常、ディスク(disk)は磁気的にデータを再生するのに対し、ディスク(disc)はレーザーを用いて光学的にデータを再生する。前記組合せ等も、コンピュータ読取り可能な媒体等の範囲内に含まれなければならない。
【0152】
ソフトウェアモジュールは、RAMメモリ、フラッシュメモリ、ROMメモリ、EPROMメモリ、EEPROMメモリ、レジスタ、ハードディスク、移動式ディスク、CD-ROM、又は、公知された任意の異なる形態の保存媒体内に常駐することもできる。例示的な保存媒体は、プロセッサが保存媒体から情報を読取る、或いは、保存媒体に情報を書込むように、プロセッサに連結することができる。代替的に、保存媒体はプロセッサに統合されることもできる。プロセッサ及び保存媒体はASIC内に存在することもできる。ASICはユーザ端末内に存在することもできる。代替的に、プロセッサ及び保存媒体はユーザ端末で個別構成要素として存在することもできる。
【0153】
前述した実施例は、一つ以上の独立型コンピュータシステムによる態様を記述しているが、本開示は、これに限定されず、ネットワークや分散コンピューティング環境のような任意のコンピューティング環境によって具現化できる。さらには、本開示における主題の態様は、複数のプロセッシングチップや装置で具現化することもでき、ストレージは、複数の装置にわたって類似に影響を受けることもできる。このような装置は、PC、ネットワークサーバー及び携帯用装置を含むこともできる。
【0154】
本明細書では、本開示の一部の実施例を説明したが、本開示が属する技術分野における通常の当業者が理解し得る内容から逸脱しない範囲内で、多様な変形や変更が可能である。また、そのような変形や変更は、本明細書に添付された特許請求の範囲内に属するものである。
【符号の説明】
【0155】
110 ユーザ
120 管理システム
130 データメタ情報DB
140 源泉データDB
150 バックエンドDB
160 集計システム
170 データモニタリング指標ストレージ
180 可視化システム
190 異常探知システム
【外国語明細書】