(19)【発行国】日本国特許庁(JP)
(12)【公報種別】特許公報(B2)
(11)【特許番号】
(24)【登録日】2023-07-10
(45)【発行日】2023-07-19
(54)【発明の名称】データ管理システム、データ管理方法、および、データ管理プログラム
(51)【国際特許分類】
G06N 20/00 20190101AFI20230711BHJP
【FI】
G06N20/00
(21)【出願番号】P 2020051054
(22)【出願日】2020-03-23
【審査請求日】2022-03-04
(73)【特許権者】
【識別番号】000006507
【氏名又は名称】横河電機株式会社
(74)【代理人】
【識別番号】110000877
【氏名又は名称】弁理士法人RYUKA国際特許事務所
(72)【発明者】
【氏名】江間 伸明
(72)【発明者】
【氏名】吉田 善貴
【審査官】加藤 優一
(56)【参考文献】
【文献】特開2018-033050(JP,A)
【文献】特表2018-506081(JP,A)
【文献】欧州特許第02668545(EP,B1)
【文献】特開平11-259444(JP,A)
【文献】特開2004-287947(JP,A)
【文献】国際公開第2020/021587(WO,A1)
(58)【調査した分野】(Int.Cl.,DB名)
G06N 3/00 -99/00
G06F 18/00 -18/40
(57)【特許請求の範囲】
【請求項1】
測定対象を測定した測定データを取得するデータ取得部と、
前記測定データを記録するデータ記録部と、
前記測定データ内における、モデルの学習に用いる学習用データを、前記モデルを学習する学習部へ送信するデータ送信部と、
記録した前記測定データの中から、前記学習用データを削除するデータ削除部と
を備え
、
前記データ削除部は、前記学習部から前記学習用データが学習済みであることを示す応答を受信したことに応じて、前記学習用データを削除する、データ管理システム。
【請求項2】
前記データ削除部は、削除を禁止する測定データを指定する禁止リストを有しており、削除対象の学習用データが前記禁止リストにより指定されている場合に、前記学習用データの削除を禁止する、請求項
1に記載のデータ管理システム。
【請求項3】
前記データ削除部は、削除を許可する測定データを指定する許可リストを有しており、削除対象の学習用データが前記許可リストにより指定されている場合に、前記学習用データの削除を許可する、請求項
1に記載のデータ管理システム。
【請求項4】
前記データ削除部は、削除を禁止する測定データを指定する禁止リスト、および、削除を許可する測定データを指定する許可リストを有しており、削除対象の学習用データが前記禁止リストおよび前記許可リストの両者により指定されている場合に、前記学習用データの削除を禁止する、請求項
1に記載のデータ管理システム。
【請求項5】
前記学習部を更に備える、請求項1から
4のいずれか一項に記載のデータ管理システム。
【請求項6】
前記測定データの中から前記学習用データを選択するデータ選択部を更に備える、請求項1から
5のいずれか一項に記載のデータ管理システム。
【請求項7】
コンピュータが、
測定対象を測定した測定データを取得することと、
前記測定データを記録することと、
前記測定データ内における、モデルの学習に用いる学習用データを、前記モデルを学習する学習部へ送信することと、
記録した前記測定データの中から、前記学習用データを削除することと
を備え
、
前記削除することは、前記学習部から前記学習用データが学習済みであることを示す応答を受信したことに応じて、前記学習用データを削除することを含む、データ管理方法。
【請求項8】
コンピュータにより実行されて、前記コンピュータを、
測定対象を測定した測定データを取得するデータ取得部と、
前記測定データを記録するデータ記録部と、
前記測定データ内における、モデルの学習に用いる学習用データを、前記モデルを学習する学習部へ送信するデータ送信部と、
記録した前記測定データの中から、前記学習用データを削除するデータ削除部と
して機能させ
、
前記データ削除部は、前記学習部から前記学習用データが学習済みであることを示す応答を受信したことに応じて、前記学習用データを削除する、データ管理プログラム。
【発明の詳細な説明】
【技術分野】
【0001】
本発明は、データ管理システム、データ管理方法、および、データ管理プログラムに関する。
【背景技術】
【0002】
特許文献1には、「予測・診断モデル構築手段…は、温度、圧力、ガス量のそれぞれについて上下限値を逸脱しているか否かをチェックし、上下限値を逸脱している計測データについてはこれを学習に適さない異常データとして削除する処理…を行う」と記載されている。
[先行技術文献]
[特許文献]
[特許文献1] 特開2011-175540
【発明の概要】
【0003】
本発明の第1の態様においては、データ管理システムを提供する。データ管理システムは、測定対象を測定した測定データを取得するデータ取得部を備えてよい。データ管理システムは、測定データを記録するデータ記録部を備えてよい。データ管理システムは、測定データ内における、モデルの学習に用いる学習用データを、モデルを学習する学習部へ送信するデータ送信部を備えてよい。データ管理システムは、記録した測定データの中から、学習用データを削除するデータ削除部を備えてよい。
【0004】
データ削除部は、学習部からの応答に応じて、学習用データを削除してよい。
【0005】
データ削除部は、学習部から学習用データの肯定応答を受信したことに応じて、学習用データを削除してよい。
【0006】
データ削除部は、学習部から学習用データが学習済みであることを示す応答を受信したことに応じて、学習用データを削除してよい。
【0007】
データ削除部は、学習用データを学習部へムーブさせることによって、学習用データを削除してよい。
【0008】
データ削除部は、削除を禁止する測定データを指定する禁止リストを有しており、削除対象の学習用データが禁止リストにより指定されている場合に、学習用データの削除を禁止してよい。
【0009】
データ削除部は、削除を許可する測定データを指定する許可リストを有しており、削除対象の学習用データが許可リストにより指定されている場合に、学習用データの削除を許可してよい。
【0010】
データ削除部は、削除を禁止する測定データを指定する禁止リスト、および、削除を許可する測定データを指定する許可リストを有しており、削除対象の学習用データが禁止リストおよび許可リストの両者により指定されている場合に、学習用データの削除を禁止してよい。
【0011】
データ管理システムは、学習部を更に備えてよい。
【0012】
データ管理システムは、測定データの中から学習用データを選択するデータ選択部を更に備えてよい。
【0013】
本発明の第2の態様においては、データ管理方法を提供する。データ管理方法は、測定対象を測定した測定データを取得することを備えてよい。データ管理方法は、測定データを記録することを備えてよい。データ管理方法は、測定データ内における、モデルの学習に用いる学習用データを、モデルを学習する学習部へ送信することを備えてよい。データ管理方法は、記録した測定データの中から、学習用データを削除することを備えてよい。
【0014】
本発明の第3の態様においては、データ管理プログラムを提供する。データ管理プログラムは、コンピュータにより実行されてよい。データ管理プログラムは、コンピュータを、測定対象を測定した測定データを取得するデータ取得部として機能させてよい。データ管理プログラムは、コンピュータを、測定データを記録するデータ記録部として機能させてよい。データ管理プログラムは、コンピュータを、測定データ内における、モデルの学習に用いる学習用データを、モデルを学習する学習部へ送信するデータ送信部を備えてよい。データ管理プログラムは、記録した測定データの中から、学習用データを削除するデータ削除部として機能させてよい。
【0015】
なお、上記の発明の概要は、本発明の必要な特徴の全てを列挙したものではない。また、これらの特徴群のサブコンビネーションもまた、発明となりうる。
【図面の簡単な説明】
【0016】
【
図1】本実施形態に係るデータ管理システム100のブロック図の一例を示す。
【
図2】本実施形態に係るデータ管理システム100が管理する測定データの一例を示す。
【
図3】本実施形態に係るデータ管理システム100が学習用データを削除するフローの一例を示す。
【
図4】本実施形態に係るデータ管理システム100が学習用データを削除する前後における測定データの一例を示す。
【
図5】本実施形態に係るデータ管理システム100が禁止リスト500を用いて学習用データを削除した場合における、禁止リスト500および削除後の測定データの一例を示す。
【
図6】本実施形態に係るデータ管理システム100が許可リスト600を用いて学習用データを削除した場合における、許可リスト600および削除後の測定データの一例を示す。
【
図7】本発明の複数の態様が全体的または部分的に具現化されてよいコンピュータ2200の例を示す。
【発明を実施するための形態】
【0017】
以下、発明の実施の形態を通じて本発明を説明するが、以下の実施形態は特許請求の範囲にかかる発明を限定するものではない。また、実施形態の中で説明されている特徴の組み合わせの全てが発明の解決手段に必須であるとは限らない。
【0018】
図1は、本実施形態に係るデータ管理システム100のブロック図の一例を示す。本実施形態に係るデータ管理システム100は、測定データを取得して記録する。そして、データ管理システム100は、学習用データを、学習を実行する機能部へ送信し、記録した測定データの中から当該学習用データを削除する。
【0019】
本実施形態においては、データ管理システム100が、プラントに設けられた複数のセンサから取得した測定データを管理対象とする場合について一例として示す。しかしながら、これに限定されるものではない。データ管理システム100は、プラントとは異なる如何なる場所に設けられた1または複数のフィールド機器等からのデータを管理対象としてもよい。
【0020】
データ管理システム100は、PC(パーソナルコンピュータ)、タブレット型コンピュータ、スマートフォン、ワークステーション、サーバコンピュータ、または汎用コンピュータ等のコンピュータであってよく、複数のコンピュータが接続されたコンピュータシステムであってもよい。このようなコンピュータシステムもまた広義のコンピュータである。また、データ管理システム100は、コンピュータ内で1または複数実行可能な仮想コンピュータ環境によって実装されてもよい。これに代えて、データ管理システム100は、データの管理用に設計された専用コンピュータであってもよく、専用回路によって実現された専用ハードウェアであってもよい。また、データ管理システム100がインターネットに接続可能な場合、データ管理システム100は、クラウドコンピューティングにより実現されてもよい。
【0021】
データ管理システム100は、データ取得部110、データ記録部120、データ選択部130、データ送信部140、学習部150、および、データ削除部160を備える。なお、これらブロックは、それぞれ機能的に分離された機能ブロックであって、実際のデバイスや装置構成とは必ずしも一致していなくてもよい。すなわち、本図において、1つのブロックとして示されているからといって、それが必ずしも1つのデバイスや装置により構成されていなくてもよい。また、本図において、別々のブロックとして示されているからといって、それらが必ずしも別々のデバイスや装置により構成されていなくてもよい。
【0022】
データ取得部110は、測定対象を測定した測定データを取得する。一例として、データ取得部110は、通信部であってよく、例えば、通信ネットワークを介して、複数のセンサのそれぞれから測定データを時系列に取得する。
【0023】
このような通信ネットワークは、複数のコンピュータを接続するネットワークであってよい。例えば、通信ネットワークは、複数のコンピュータネットワークを相互接続したグローバルなネットワークであってよく、一例として、通信ネットワークは、インターネット・プロトコルを使用したインターネット等であってよい。これに代えて、通信ネットワークは、専用回線により実現されていてもよい。
【0024】
なお、上述の説明では、データ取得部110が通信ネットワークを介して複数のセンサのそれぞれから測定データを取得する場合を一例として示したが、これに限定されるものではない。データ取得部110は、例えば、ユーザ入力や各種メモリデバイス等、通信ネットワークとは異なる他の手段を介して複数のセンサのそれぞれから測定データを取得してもよい。
【0025】
ここで、このような複数のセンサは、測定対象を測定した測定データを取得可能である。複数のセンサは、例えば、OT(Operational Technology)領域に設置されているセンサ(例えば、プロセス制御(測定)用センサ)やIoT(Internet of Things)センサであってよく、一例として、プラントに設けられた1または複数のフィールド機器と接続、または、一体に構成された産業用(Industrial)センサであってよい。
【0026】
ここで、このようなプラントは、例えば、化学等の工業プラントの他、ガス田や油田等の井戸元やその周辺を管理制御するプラント、水力・火力・原子力等の発電を管理制御するプラント、太陽光や風力等の環境発電を管理制御するプラント、および、上下水やダム等を管理制御するプラント等であってよい。
【0027】
また、このようなプラントに設けられたフィールド機器は、例えば、圧力計、流量計、温度センサ等のセンサ機器、流量制御弁や開閉弁等のバルブ機器、ファンやモータ等のアクチュエータ機器、プラント内の状況や対象物を撮影するカメラやビデオ等の撮像機器、プラント内の異音等を収集したり警報音等を発したりするマイクやスピーカ等の音響機器、および、各機器の位置情報を出力する位置検出機器等であってよい。
【0028】
したがって、データ取得部110は、測定データとして、例えば、温度、圧力、流量、加速度、磁界、位置、カメラ映像、スイッチのオン/オフデータ、音、および、これらの組み合わせ等を取得してよい。また、データ取得部110は、これらのデータを基に数式を用いて生成された値を測定データとして取得してもよい。データ取得部110は、複数のセンサのそれぞれから取得した測定データを、データ記録部120へ供給する。
【0029】
データ記録部120は、測定データを記録する。一例として、データ記録部120は、データ取得部110から供給された複数のフィールド機器等からの測定データを、センサ毎に時系列に記録してよい。
【0030】
データ選択部130は、測定データの中から、モデルの学習に用いる学習用データを選択する。一例として、データ選択部130は、データ記録部120にアクセス可能であってよく、データ記録部120に記録された複数のフィールド機器等からの測定データを閲覧する。そして、データ選択部130は、複数のフィールド機器等からの測定データの中から、測定対象の状態を判定するためのモデルの学習に適しているデータセットを、学習用データとして選択する。データ選択部130は、選択した学習用データに関する情報をデータ送信部140へ供給する。
【0031】
データ送信部140は、測定データ内における、モデルの学習に用いる学習用データを、モデルを学習する学習部150へ送信する。一例として、データ送信部140は、データ記録部120にアクセス可能であってよく、データ記録部120に記録された複数のフィールド機器等からの測定データの中から、データ選択部130によって学習用データとして選択されたデータセットを読み出す。そして、データ送信部140は、読み出したデータセットを学習用データとして、モデルを学習する学習部150へ送信する。
【0032】
学習部150は、測定対象の状態を判定するためのモデルの学習を実行する機能部である。学習部150は、学習用データを受信したことに応じて、学習用データの肯定応答(ACK:Acknowledgement)を、データ送信部140に加えてデータ削除部160へ送信する。そして、学習部150は、学習用データを用いて、測定対象の状態を判定するためのモデルを学習する。この際、学習部150は、モデルを学習するにあたって、様々なアルゴリズムを用いてよい。学習部150は、例えば、学習アルゴリズムとして、回帰分析、クラスター分析、主成分分析、ベクトル量子化、自己組織化マップ、ニューラルネットワーク、サポートベクターマシン、ID3、および、単純ベイズ分類器等を用いてよい。学習部150は、学習用データを用いたモデルの学習が終了した場合に、学習用データが学習済みであることを示す応答をデータ削除部160へ送信する。なお、このような学習済みであることを示す応答は、学習用データが再学習不要であり、当該学習用データの削除を許可する旨を含むものであってもよい。
【0033】
データ削除部160は、記録した測定データの中から、学習用データを削除する。一例として、データ削除部160は、データ記録部120にアクセス可能であってよく、データ記録部120に記録された複数のフィールド機器等からの測定データの中から、学習用データとして学習部150へ送信されたデータセットを削除する。
【0034】
なお、本図においては、学習部150がデータ管理システム100内に設けられている場合について一例として示している。したがって、データ管理システム100は、データの管理からモデルの学習までの処理を、1つのシステムにより実現することができる。これにより、データ管理システム100によれば、学習用データが外部へ漏洩するリスクを低減するとともに、システムの管理やメンテナンスを単純化することができる。しかしながら、一般に、モデルの学習には大きな負荷がかかる。したがって、学習部150の機能は、データ管理システム100とは異なる他のシステム内に設けられてもよい。これにより、データ管理システム100を小型、低容量化することができる。
【0035】
図2は、本実施形態に係るデータ管理システム100が管理する測定データの一例を示す。本図においては、データ管理システム100が、センサA、センサB、センサC、および、センサDの4つのセンサからの測定データを管理する場合を一例として説明する。しかしながら、これに限定されるものではない。データ管理システム100は、4つよりも多い複数のセンサからの測定データを管理してもよいし、4つよりも少ない1または複数のセンサからの測定データを管理してもよい。
【0036】
ここで、複数のセンサの種別はそれぞれ同じであってもよい。すなわち、センサAからセンサDの全てが同じ種別の測定データ(例えば、温度等)を取得可能であってもよい。これに代えて、複数のセンサの種別は一部または全部が異なっていてもよい。すなわち、センサAからセンサDの一部が異なる種別の測定データ(例えば、温度および圧力等)を取得可能であってもよいし、センサAからセンサDの全てが異なる種別の測定データ(温度、圧力、流量、および、加速度等)を取得可能であってもよい。
【0037】
本図においては、センサA、センサB、センサC、および、センサDからの測定データを、時刻T=1から時刻T=20まで時系列に示している。なお、本図においては、データ管理システム100が、全てのセンサから時刻的に同期して測定データを取得した場合について、一例として示している。しかしながら、これに限定されるものではない。データ管理システム100は、複数のセンサにおける少なくとも一部から、非同期に測定データを取得してもよい。一例として、時刻T=1におけるセンサAからの測定データを、データa1として示している。同様に、時刻T=2におけるセンサBからの測定データを、データb2として示している。同様に、時刻T=19におけるセンサCからの測定データを、データc19として示している。同様に、時刻T=20におけるセンサDからの測定データを、データd20として示している。
【0038】
本実施形態に係るデータ管理システム100は、例えば、本図に示すような測定データを取得して記録する。そして、データ管理システム100は、学習用データを、学習を実行する機能部へ送信し、記録した測定データの中から当該学習用データを削除する。これについて、フローを用いて詳細に説明する。
【0039】
図3は、本実施形態に係るデータ管理システム100が学習用データを削除するフローの一例を示す。
【0040】
ステップ310において、データ管理システム100は、測定データを取得する。一例として、データ取得部110は、通信ネットワークを介して、複数のセンサ(例えば、センサA、センサB、センサC、および、センサD)のそれぞれから測定データを時系列に取得する。データ取得部110は、複数のセンサのそれぞれから取得した測定データを、データ記録部120へ供給する。
【0041】
ステップ320において、データ管理システム100は、測定データを記録する。一例として、データ記録部120は、ステップ310において取得された複数のセンサからの測定データを、センサ毎に時系列に記録する。
【0042】
ステップ330において、データ管理システム100は、測定データの中から、モデルの学習に用いる学習用データを選択する。一例として、データ選択部130は、データ記録部120にアクセスし、ステップ320において記録された複数のセンサからの測定データを閲覧する。そして、データ選択部130は、複数のセンサからの測定データの中から、予め定められた基準に基づいて、測定対象の状態を判定するためのモデルの学習に適しているデータセットを、モデルの学習に用いる学習用データとして自動的に選択する。ここで、学習用データの選択方法それ自体は、どのような方法が用いられてもよい。したがって、ここでは詳細な説明を省略する。なお、上述の説明では、データ選択部130が学習用データを自動的に選択する場合について一例として示した。しかしながら、これに限定されるものではない。データ管理システム100は、ユーザ入力を受け付け、データ選択部130が、当該ユーザ入力に応じて学習用データを選択してもよい。
【0043】
一例として、データ選択部130は、特定の期間(例えば、時刻T=4~時刻T=10)における全てのセンサからの測定データのセット(例えば、データa4~データd10)を学習用データとして選択してよい。また、データ選択部130は、全ての期間における特定のセンサ(例えば、センサD)からの測定データのセット(例えば、データd1~データd20)を学習用データとして選択してよい。また、データ選択部130は、特定の期間(例えば、時刻T=13~時刻T=15)における特定のセンサ(例えば、センサC)からの測定データのセット(例えば、データc13~データc15)を学習用データとして選択してよい。また、データ選択部130は、特定の期間(例えば、時刻T=16~時刻T=18)における複数のセンサ(例えば、センサAおよびセンサB)からの測定データのセット(例えば、データa16~データb18)を学習用データとして選択してよい。データ選択部130は、選択した学習用データに関する情報をデータ送信部140へ供給する。
【0044】
ステップ340において、データ管理システム100は、測定データ内における、モデルの学習に用いる学習用データを、モデルを学習する学習部150へ送信する。一例として、データ送信部140は、データ記録部120にアクセスし、ステップ320において記録された複数のセンサからの測定データの中から、ステップ330において学習用データとして選択されたデータセット(例えば、データa4~データd10、データd1~データd20、データc13~データc15、および、データa16~データb18)を読み出す。そして、データ送信部140は、読み出したデータセットを学習用データとして、モデルを学習する学習部150へ送信する。
【0045】
ステップ350において、データ管理システム100は、応答を受信したか否か判定する。一例として、データ削除部160は、学習用データを受信したことに応じて学習部150が送信する、学習用データの肯定応答を受信したか否か判定する。これに代えて、データ削除部160は、学習用データを用いたモデルの学習が終了したことに応じて学習部150が送信する、学習用データが学習済みであることを示す応答を受信したか否か判定してもよい。なお、このような学習済みであることを示す応答は、上述のとおり、学習用データが再学習不要であり、当該学習用データの削除を許可する旨を含むものであってもよい。
【0046】
ステップ350において応答を受信していないと判定された場合、データ管理システム100は、処理をステップ350に戻してフローを継続する。一方、ステップ350において応答を受信したと判定された場合、データ管理システム100は、処理をステップ360に進める。
【0047】
ステップ360において、データ管理システム100は、記録した測定データの中から、学習用データを削除する。一例として、データ削除部160は、データ記録部120にアクセスして、ステップ320において記録された複数のセンサからの測定データの中から、ステップ330において学習用データとして選択されたデータセット(例えば、データa4~データd10、データd1~データd20、データc13~データc15、および、データa16~データb18)を削除する。例えば、データ削除部160は、学習部150から学習用データの肯定応答を受信したことに応じて、学習用データを削除する。これに代えて、データ削除部160は、学習部150から学習用データが学習済みであることを示す応答を受信したことに応じて、学習用データを削除してもよい。
【0048】
なお、上述の説明では、データ削除部160が、学習部150からの応答に応じて学習用データを削除する場合について一例として示した。しかしながら、これに限定されるものではない。データ削除部160は、学習用データを学習部150へムーブさせることによって、学習用データを削除してもよい。この場合、データ削除部160は、データ送信部140と一体に構成されていてもよい。すなわち、データ送信部140およびデータ削除部160は、ステップ340において、学習用データとして選択されたデータセット(例えば、データa4~データd10、データd1~データd20、データc13~データc15、および、データa16~データb18)をデータ記録部120から学習部150へ送信するにあたって、データをコピーして送信するのではなく、記録されたデータそれ自体をデータ記録部120から学習部150へ移動させてもよい。このように、データ削除部160は、学習部150への送信に応じて、記録した測定データの中から、学習用データを削除してよい。
【0049】
図4は、本実施形態に係るデータ管理システム100が学習用データを削除する前後における測定データの一例を示す。本図左は、学習用データの削除前における測定データの一例を示している。本図左において、斜線部分は、学習用データとして選択されたデータセット、すなわち、データa4~データd10、データd1~データd20、データc13~データc15、および、データa16~データb18である。本実施形態に係るデータ管理システム100は、
図3のフローにより、学習用データ、すなわち、本図左における斜線部分のデータセットを削除する。
【0050】
本図右は、学習用データの削除後における測定データの一例を示している。本図右に示すように、時刻T=4~時刻T=10における測定データは全てのセンサについて削除されている(図中、行ごと削除されている)。また、センサDからの測定データは全ての期間において削除されている(図中、列ごと削除されている)。また、時刻T=13~時刻T=15におけるセンサCからの測定データは削除されている(図中、「N/A」と表記されている)。同様に、時刻T=16~時刻T=18におけるセンサAおよびセンサBからの測定データは削除されている(図中、「N/A」と表記されている)。このように、本実施形態に係るデータ管理システム100は、学習用データを、学習部150へ送信し、データ記録部120に記録されている測定データの中から、当該学習用データを削除する。
【0051】
例えば、OT(Operational Technology)領域にあるプロセス制御システムが、IT(Information Technology)領域のシステムと結合される等、データ量が爆発的に増加することが予想される。このような状況において、全てのデータを記録しておくことは現実的ではなく、データ量の削減もしくは取捨選択が必要である。従来、学習に適さない異常データを削除して学習データを作成するモデル構築装置が知られている。当該モデル構築装置においては、データベースに蓄積された計測データの中から新たなデータセットとして学習データを作成するにあたって、異常データを含めないよう取捨選択している。したがって、当該モデル構築装置は、データベースに蓄積された計測データ自体を削除するものではなく、データベースに蓄積された計測データのデータ量を削減することができない。また、当該モデル構築装置において、データを削除する基準は、学習に適するか否かであって、学習を実行する機能部へ送信したか否かに基づくものではない。
【0052】
これに対して、本実施形態に係るデータ管理システム100は、学習用データを、モデルを学習する機能部、すなわち、学習部150へ送信し、データ記録部120に記録された測定データの中から、当該学習用データを削除する。これにより、本実施形態に係るデータ管理システム100によれば、モデルの学習に用いられる、または、用いられた学習済みのデータを、データ記録部120から選択的に削除して、データ記録部120に記録される測定データのデータ量を削減することができる。
【0053】
また、本実施形態の一態様に係るデータ管理システム100は、一方的に学習用データを削除するのではなく、学習部150からの応答に応じて、学習用データを削除する。これにより、本実施形態に係るデータ管理システム100によれば、例えば、学習部150への送信過程においてエラーが発生した場合等において、学習用データが不用意に削除されてしまうことを防止することができる。
【0054】
また、本実施形態の一態様に係るデータ管理システム100は、学習部150からの学習用データが学習済みであることを示す応答に応じて、学習用データを削除する。これにより、本実施形態に係るデータ管理システム100によれば、実際に学習が終了したことが確認された学習済みデータのみを削除することができる。
【0055】
また、本実施形態の一態様に係るデータ管理システム100は、学習用データをデータ記録部120から学習部150へムーブさせる。これにより、本実施形態に係るデータ管理システム100によれば、学習部150からの応答を不要とし、処理を簡略化することができる。
【0056】
上述の説明では、データ管理システム100が、モデルの学習に用いられる、または、用いられた学習済みのデータを一律に削除する場合について一例として示した。しかしながら、これに限定されるものではない。データ管理システム100は、学習済みのデータであってもデータ記録部120に記録された測定データの中から、削除を禁止するデータセットを指定可能であってもよい。すなわち、データ削除部160は、削除を禁止する測定データを指定する禁止リスト500を有しており、削除対象の学習用データが禁止リスト500により指定されている場合に、学習用データの削除を禁止してもよい。
【0057】
図5は、本実施形態に係るデータ管理システム100が禁止リスト500を用いて学習用データを削除した場合における、禁止リスト500および削除後の測定データの一例を示す。本図左は禁止リスト500を示している。本図左において、例えば、二重線で囲まれる領域が削除を禁止する測定データとして指定されていたものとする。一例として、特定の期間(例えば、時刻T=1~時刻T=5)における全てのセンサからの測定データのデータセット(例えば、データa1~d5)が、削除を禁止する測定データとして指定されてよい。また、全ての期間における特定のセンサ(例えば、センサB)からの測定データのセット(例えば、データb1~b20)が、削除を禁止する測定データとして指定されてよい。また、特定の期間(例えば、時刻T=15~時刻T=20)における特定のセンサ(例えば、センサD)からの測定データのセットが、削除を禁止する測定データとして指定されてよい。このように、禁止リスト500は、削除を禁止する期間を指定する項目、削除を禁止するセンサを指定する項目、および、削除を禁止する期間およびセンサを指定する項目の少なくとも何れかを有していてよい。
【0058】
このような場合には、データ管理システム100は、学習用データのうち禁止リスト500によって指定されている測定データの削除を禁止する。例えば、データ管理システム100は、学習用データのうち、時刻T=4~時刻T=5におけるセンサAからの測定データの削除を禁止する。同様に、データ管理システム100は、学習用データのうち、時刻T=4~時刻T=10、および、時刻T=16~時刻T=18におけるセンサBからの測定データの削除を禁止する。同様に、データ管理システム100は、学習用データのうち、時刻T=4~時刻T=5におけるセンサCからの測定データの削除を禁止する。同様に、データ管理システム100は、学習用データのうち、時刻T=1~時刻T=5、および、時刻T=15~時刻T=20におけるセンサDからの測定データの削除を禁止する。
【0059】
なお、このような禁止リスト500は、ユーザ入力に基づいて設定されてよい。これに代えて、データ管理システム100が禁止リスト500を設定してもよい。この場合、データ管理システム100は、例えば、予め定められた期間においてデータ記録部120に記録された測定データの統計をとり、当該統計に基づいて(例えば、特異的なデータを自動的に抽出する等して)、削除を禁止するデータセットを自動的に指定してもよい。
【0060】
本図右は、禁止リスト500を用いた場合における削除後の測定データの一例を示している。本図において「N/A」と表記されている領域は、測定データが削除された領域、すなわち、学習用データのうち禁止リスト500によって指定されていない領域を示している。一方、本図において斜線で示される領域は、測定データの削除が禁止された領域、すなわち、学習用データのうち禁止リスト500によって指定されていた領域を示している。
【0061】
このように、本実施形態に係るデータ管理システム100は、禁止リスト500を用いて、一部のデータセットの削除を禁止する。これにより、本実施形態に係るデータ管理システム100によれば、後に参照する可能性がある、または、他のユーザが参照する可能性がある測定データが不用意に削除されてしまうことを防止することができる。
【0062】
なお、上述の説明では、データ管理システム100が削除を禁止する禁止リスト500、すなわち、ブラックリストを用いる場合について一例として示した。しかしながら、これに代えて、データ管理システム100は、削除を許可する許可リスト600、すなわち、ホワイトリストを用いて、削除を許可するデータセットを指定可能であってもよい。すなわち、データ削除部160は、削除を許可する測定データを指定する許可リスト600を有しており、削除対象の学習用データが許可リスト600により指定されている場合に、学習用データの削除を許可してもよい。
【0063】
図6は、本実施形態に係るデータ管理システム100が許可リスト600を用いて学習用データを削除した場合における、許可リスト600および削除後の測定データの一例を示す。本図左は許可リスト600を示している。本図左において、例えば、二重線で囲まれる領域が削除を許可する測定データとして指定されていたものとする。一例として、特定の期間(例えば、時刻T=6~時刻T=20)における特定のセンサ(例えば、センサA)からの測定データのデータセット(例えば、データa6~a20)が、削除を許可する測定データとして指定されてよい。また、特定の期間(例えば、時刻T=5~時刻T=8)における複数のセンサ(例えば、センサCおよびセンサD)からの測定データのセット(例えば、データc5~d8)が、削除を許可する測定データとして指定されてよい。このように、許可リスト600は、削除を許可する期間を指定する項目、削除を許可するセンサを指定する項目、および、削除を許可する期間およびセンサを指定する項目の少なくとも何れかを有していてよい。
【0064】
このような場合には、データ管理システム100は、学習用データのうち許可リスト600によって指定されている測定データの削除を許可する。例えば、データ管理システム100は、時刻T=6~時刻T=10、および、時刻T=16~時刻T=18におけるセンサAからの測定データを削除する。また、データ管理システム100は、時刻T=5~時刻T=8におけるセンサCおよびセンサDからの測定データを削除する。
【0065】
なお、このような許可リスト600についても、禁止リスト500と同様、ユーザ入力に基づいて設定されてよい。これに代えて、データ管理システム100が許可リスト600を設定してもよい。この場合、データ管理システム100は、例えば、予め定められた期間においてデータ記録部120に記録された測定データの統計をとり、当該統計に基づいて(例えば、平均値や中央値からの差が比較的小さいデータを自動的に抽出する等して)、削除を許可するデータセットを自動的に指定してもよい。
【0066】
本図右は、許可リスト600を用いた場合における削除後の測定データの一例を示している。本図において「N/A」と表記されている領域は、測定データが削除された領域、すなわち、学習用データのうち許可リスト600によって指定されていた領域を示している。一方、本図において斜線で示される領域は、測定データの削除が許可されなかった領域、すなわち、学習用データのうち許可リスト600によって指定されていない領域を示している。
【0067】
このように、本実施形態に係るデータ管理システム100は、許可リスト600を用いて、一部のデータセットの削除を許可する。これにより、本実施形態に係るデータ管理システム100によれば、後に参照する可能性が低い、または、他のユーザが参照する可能性が低い測定データのみを、削除を許可するデータとして指定することができる。
【0068】
なお、上述の説明では、禁止リスト500および許可リスト600のいずれか1つを用いる場合について一例として示した。しかしながら、これに限定されるものではない。データ管理システム100は、禁止リスト500および許可リスト600の両者を用いて、測定データの削除を制御してもよい。
【0069】
この場合、データ削除部160は、削除を禁止する測定データを指定する禁止リスト500、および、削除を許可する測定データを指定する許可リスト600を有しており、削除対象の学習用データが禁止リスト500および許可リスト600の両者により指定されている場合に、学習用データの削除を禁止してもよい。
【0070】
例えば、上述の説明においては、時刻T=5におけるセンサCおよびセンサDからの測定データは、許可リスト600によって削除が許可されているため、削除する場合について一例として示した。すなわち、
図6において、データc5およびデータd5が「N/A」となる場合について一例として示した。しかしながら、これらのデータc5およびデータd5は、禁止リスト500によって削除が禁止されている。このように禁止リスト500と許可リスト600との間で重複したデータセットが指定されている場合に、データ管理システム100は、禁止リスト500を優先してもよい。すなわち、データ管理システム100は、データc5およびデータd5については、許可リスト600によって削除が許可されているものの、禁止リスト500によって削除が禁止されているため、削除を禁止してもよい。
【0071】
このように、本実施形態に係るデータ管理システム100は、禁止リスト500および許可リスト600の両者を用いる場合に、禁止リスト500を優先する。これにより、本実施形態に係るデータ管理システム100によれば、例えば、異なるユーザによって禁止リスト500および許可リスト600がそれぞれ設定された場合等において、一のユーザが禁止リスト500を用いて削除を禁止したデータセットが、他のユーザが設定した許可リストによって不用意に削除されてしまうことを禁止することができる。
【0072】
本発明の様々な実施形態は、フローチャートおよびブロック図を参照して記載されてよく、ここにおいてブロックは、(1)操作が実行されるプロセスの段階または(2)操作を実行する役割を持つ装置のセクションを表わしてよい。特定の段階およびセクションが、専用回路、コンピュータ可読媒体上に格納されるコンピュータ可読命令と共に供給されるプログラマブル回路、および/またはコンピュータ可読媒体上に格納されるコンピュータ可読命令と共に供給されるプロセッサによって実装されてよい。専用回路は、デジタルおよび/またはアナログハードウェア回路を含んでよく、集積回路(IC)および/またはディスクリート回路を含んでよい。プログラマブル回路は、論理AND、論理OR、論理XOR、論理NAND、論理NOR、および他の論理操作、フリップフロップ、レジスタ、フィールドプログラマブルゲートアレイ(FPGA)、プログラマブルロジックアレイ(PLA)等のようなメモリ要素等を含む、再構成可能なハードウェア回路を含んでよい。
【0073】
コンピュータ可読媒体は、適切なデバイスによって実行される命令を格納可能な任意の有形なデバイスを含んでよく、その結果、そこに格納される命令を有するコンピュータ可読媒体は、フローチャートまたはブロック図で指定された操作を実行するための手段を作成すべく実行され得る命令を含む、製品を備えることになる。コンピュータ可読媒体の例としては、電子記憶媒体、磁気記憶媒体、光記憶媒体、電磁記憶媒体、半導体記憶媒体等が含まれてよい。コンピュータ可読媒体のより具体的な例としては、フロッピー(登録商標)ディスク、ディスケット、ハードディスク、ランダムアクセスメモリ(RAM)、リードオンリメモリ(ROM)、消去可能プログラマブルリードオンリメモリ(EPROMまたはフラッシュメモリ)、電気的消去可能プログラマブルリードオンリメモリ(EEPROM)、静的ランダムアクセスメモリ(SRAM)、コンパクトディスクリードオンリメモリ(CD-ROM)、デジタル多用途ディスク(DVD)、ブルーレイ(RTM)ディスク、メモリスティック、集積回路カード等が含まれてよい。
【0074】
コンピュータ可読命令は、アセンブラ命令、命令セットアーキテクチャ(ISA)命令、マシン命令、マシン依存命令、マイクロコード、ファームウェア命令、状態設定データ、またはSmalltalk、JAVA(登録商標)、C++等のようなオブジェクト指向プログラミング言語、および「C」プログラミング言語または同様のプログラミング言語のような従来の手続型プログラミング言語を含む、1または複数のプログラミング言語の任意の組み合わせで記述されたソースコードまたはオブジェクトコードのいずれかを含んでよい。
【0075】
コンピュータ可読命令は、汎用コンピュータ、特殊目的のコンピュータ、若しくは他のプログラム可能なデータ処理装置のプロセッサまたはプログラマブル回路に対し、ローカルにまたはローカルエリアネットワーク(LAN)、インターネット等のようなワイドエリアネットワーク(WAN)を介して提供され、フローチャートまたはブロック図で指定された操作を実行するための手段を作成すべく、コンピュータ可読命令を実行してよい。プロセッサの例としては、コンピュータプロセッサ、処理ユニット、マイクロプロセッサ、デジタル信号プロセッサ、コントローラ、マイクロコントローラ等を含む。
【0076】
図7は、本発明の複数の態様が全体的または部分的に具現化されてよいコンピュータ2200の例を示す。コンピュータ2200にインストールされたプログラムは、コンピュータ2200に、本発明の実施形態に係る装置に関連付けられる操作または当該装置の1または複数のセクションとして機能させることができ、または当該操作または当該1または複数のセクションを実行させることができ、および/またはコンピュータ2200に、本発明の実施形態に係るプロセスまたは当該プロセスの段階を実行させることができる。そのようなプログラムは、コンピュータ2200に、本明細書に記載のフローチャートおよびブロック図のブロックのうちのいくつかまたはすべてに関連付けられた特定の操作を実行させるべく、CPU2212によって実行されてよい。
【0077】
本実施形態によるコンピュータ2200は、CPU2212、RAM2214、グラフィックコントローラ2216、およびディスプレイデバイス2218を含み、それらはホストコントローラ2210によって相互に接続されている。コンピュータ2200はまた、通信インターフェイス2222、ハードディスクドライブ2224、DVD-ROMドライブ2226、およびICカードドライブのような入/出力ユニットを含み、それらは入/出力コントローラ2220を介してホストコントローラ2210に接続されている。コンピュータはまた、ROM2230およびキーボード2242のようなレガシの入/出力ユニットを含み、それらは入/出力チップ2240を介して入/出力コントローラ2220に接続されている。
【0078】
CPU2212は、ROM2230およびRAM2214内に格納されたプログラムに従い動作し、それにより各ユニットを制御する。グラフィックコントローラ2216は、RAM2214内に提供されるフレームバッファ等またはそれ自体の中にCPU2212によって生成されたイメージデータを取得し、イメージデータがディスプレイデバイス2218上に表示されるようにする。
【0079】
通信インターフェイス2222は、ネットワークを介して他の電子デバイスと通信する。ハードディスクドライブ2224は、コンピュータ2200内のCPU2212によって使用されるプログラムおよびデータを格納する。DVD-ROMドライブ2226は、プログラムまたはデータをDVD-ROM2201から読み取り、ハードディスクドライブ2224にRAM2214を介してプログラムまたはデータを提供する。ICカードドライブは、プログラムおよびデータをICカードから読み取り、および/またはプログラムおよびデータをICカードに書き込む。
【0080】
ROM2230はその中に、アクティブ化時にコンピュータ2200によって実行されるブートプログラム等、および/またはコンピュータ2200のハードウェアに依存するプログラムを格納する。入/出力チップ2240はまた、様々な入/出力ユニットをパラレルポート、シリアルポート、キーボードポート、マウスポート等を介して、入/出力コントローラ2220に接続してよい。
【0081】
プログラムが、DVD-ROM2201またはICカードのようなコンピュータ可読媒体によって提供される。プログラムは、コンピュータ可読媒体から読み取られ、コンピュータ可読媒体の例でもあるハードディスクドライブ2224、RAM2214、またはROM2230にインストールされ、CPU2212によって実行される。これらのプログラム内に記述される情報処理は、コンピュータ2200に読み取られ、プログラムと、上記様々なタイプのハードウェアリソースとの間の連携をもたらす。装置または方法が、コンピュータ2200の使用に従い情報の操作または処理を実現することによって構成されてよい。
【0082】
例えば、通信がコンピュータ2200および外部デバイス間で実行される場合、CPU2212は、RAM2214にロードされた通信プログラムを実行し、通信プログラムに記述された処理に基づいて、通信インターフェイス2222に対し、通信処理を命令してよい。通信インターフェイス2222は、CPU2212の制御下、RAM2214、ハードディスクドライブ2224、DVD-ROM2201、またはICカードのような記録媒体内に提供される送信バッファ処理領域に格納された送信データを読み取り、読み取られた送信データをネットワークに送信し、またはネットワークから受信された受信データを記録媒体上に提供される受信バッファ処理領域等に書き込む。
【0083】
また、CPU2212は、ハードディスクドライブ2224、DVD-ROMドライブ2226(DVD-ROM2201)、ICカード等のような外部記録媒体に格納されたファイルまたはデータベースの全部または必要な部分がRAM2214に読み取られるようにし、RAM2214上のデータに対し様々なタイプの処理を実行してよい。CPU2212は次に、処理されたデータを外部記録媒体にライトバックする。
【0084】
様々なタイプのプログラム、データ、テーブル、およびデータベースのような様々なタイプの情報が記録媒体に格納され、情報処理を受けてよい。CPU2212は、RAM2214から読み取られたデータに対し、本開示の随所に記載され、プログラムの命令シーケンスによって指定される様々なタイプの操作、情報処理、条件判断、条件分岐、無条件分岐、情報の検索/置換等を含む、様々なタイプの処理を実行してよく、結果をRAM2214に対しライトバックする。また、CPU2212は、記録媒体内のファイル、データベース等における情報を検索してよい。例えば、各々が第2の属性の属性値に関連付けられた第1の属性の属性値を有する複数のエントリが記録媒体内に格納される場合、CPU2212は、第1の属性の属性値が指定される、条件に一致するエントリを当該複数のエントリの中から検索し、当該エントリ内に格納された第2の属性の属性値を読み取り、それにより予め定められた条件を満たす第1の属性に関連付けられた第2の属性の属性値を取得してよい。
【0085】
上で説明したプログラムまたはソフトウェアモジュールは、コンピュータ2200上またはコンピュータ2200近傍のコンピュータ可読媒体に格納されてよい。また、専用通信ネットワークまたはインターネットに接続されたサーバーシステム内に提供されるハードディスクまたはRAMのような記録媒体が、コンピュータ可読媒体として使用可能であり、それによりプログラムを、ネットワークを介してコンピュータ2200に提供する。
【0086】
以上、本発明を実施の形態を用いて説明したが、本発明の技術的範囲は上記実施の形態に記載の範囲には限定されない。上記実施の形態に、多様な変更または改良を加えることが可能であることが当業者に明らかである。その様な変更または改良を加えた形態も本発明の技術的範囲に含まれ得ることが、特許請求の範囲の記載から明らかである。
【0087】
特許請求の範囲、明細書、および図面中において示した装置、システム、プログラム、および方法における動作、手順、ステップ、および段階等の各処理の実行順序は、特段「より前に」、「先立って」等と明示しておらず、また、前の処理の出力を後の処理で用いるのでない限り、任意の順序で実現しうることに留意すべきである。特許請求の範囲、明細書、および図面中の動作フローに関して、便宜上「まず、」、「次に、」等を用いて説明したとしても、この順で実施することが必須であることを意味するものではない。
【符号の説明】
【0088】
100 データ管理システム
110 データ取得部
120 データ記録部
130 データ選択部
140 データ送信部
150 学習部
160 データ削除部
500 禁止リスト
600 許可リスト
2200 コンピュータ
2201 DVD-ROM
2210 ホストコントローラ
2212 CPU
2214 RAM
2216 グラフィックコントローラ
2218 ディスプレイデバイス
2220 入/出力コントローラ
2222 通信インターフェイス
2224 ハードディスクドライブ
2226 DVD-ROMドライブ
2230 ROM
2240 入/出力チップ
2242 キーボード