(58)【調査した分野】(Int.Cl.,DB名)
【発明を実施するための形態】
【0013】
以下に本発明の実施形態について図面を用いて詳細に説明する。
図1は、本実施形態の分析ソフトウェア管理システムたるデータ利活用基盤サーバ101を含むネットワーク構成例を示す図である。
図1に示すデータ利活用基盤サーバ101は、データ分析の実施履歴の多寡に係わらずデータ分析部品の提案を可能とし、ひいては、データ分析用ソフトウェア作成の効率化やコスト低減を図るコンピュータシステムである。
【0014】
このデータ利活用基盤サーバ101は、分析対象となるデータすなわち分析対象データに対する分析処理を構成する分析部品の管理及び分析を行い、その分析部品の情報をユーザに提案するサーバ装置となる。
【0015】
こうしたデータ利活用基盤サーバ101は、ネットワーク10を介してユーザ端末20と、また、ネットワーク11を介して業務システム30と、それぞれデータ通信可能に接続されている。ただし、業務システム30からデータ利活用基盤サーバ101へのデータ提供は、ネットワーク11を介した通信により実施する場合に限定しない。例えば、人手を介してのデータ利活用基盤サーバ101へのデータ格納を行う場合も想定出来る。
【0016】
上述のネットワーク構成におけるユーザ端末20は、種々の業務システム30から得られるデータのうち分析対象データとなるものをデータ利活用基盤サーバ101に指定する操作や、データ利活用基盤サーバ101が提示してきた分析部品の組み合わせの確認、選択、及び分析実行と結果確認等の操作を行うための端末となる。
【0017】
また、業務システム30は、分析対象データとなる各種データ(例:鉄道事業における鉄道車両の走行データや機器の温度、振動といった観測データ、メンテナンス履歴、等)の提供元システムである。この業務システム30は、分析による問題解決の対象となる。−−−ハードウェア構成−−−
【0018】
また、上述のデータ利活用基盤サーバ101のハードウェア構成は以下の如くとなる。すなわち、データ利活用基盤サーバ101は、SSD(Solid State Drive)やハードディスクドライブ等の適宜な不揮発性記憶素子や、メモリ等の揮発性記憶素子を含む記憶装置111、記憶装置111に保持されるプログラム等を実行し装置自体の統括制御を行なうとともに各種判定、演算及び制御処理を行なうCPU等の演算装置112、ネットワーク10、11と接続し他装置との通信処理を担う通信装置113、を備える。
【0019】
こうしたハードウェア構成は、ユーザ端末20においても同様である。例えば、ユーザ端末20は、SSD(Solid State Drive)やハードディスクドライブ等の適宜な不揮発性記憶素子や、メモリ等の揮発性記憶素子を含む記憶装置121、記憶装置121に保持されるプログラム等を実行し装置自体の統括制御を行なうとともに各種判定、演算及び制御処理を行なうCPU等の演算装置122、ネットワーク10と接続しデータ利活用基盤サーバ101の通信処理を担う通信装置123、を備える。
−−−ユースケース−−−
【0020】
図2は、本実施形態における分析ソフトウェア管理方法を実施する場合のユースケースを示す図である。
図2で示すユースケースにおける主な構成要素は、分析対象となるデータすなわち分析対象データを蓄積し、当該分析対象データに対する分析処理を構成する分析部品の管理及び分析を行ってユーザへの提案を行うデータ利活用基盤サーバ101、分析対象データの提供元である業務システム30、分析対象データに対する分析を行う分析者201、及び、分析部品等の開発を行う開発者202である。
【0021】
このうち開発者202は、ソフトウェアプログラムである分析部品の開発を行い(221)、該開発した分析部品をデータ利活用基盤サーバ101へと登録する(222)。
【0022】
また、業務システム30からネットワーク11を介した通信により、もしくは人手により、分析対象データがデータ利活用基盤サーバ101へと登録されると(241)、データ利活用基盤サーバ101にて分析関係情報を生成する(231)。
一方、分析者201は、分析を実施するためにユーザ端末20を用い、分析対象データを指定する(211)。
【0023】
この場合、データ利活用基盤サーバ101は、分析者201に指定された分析対象データに対して適切な分析部品を選出し(232)、これを分析者201に提案する(233)。 分析者201は、この提案による分析部品候補及び関連する情報を閲覧する(212)。また分析者201は、閲覧した内容を基に、自身が指定した分析対象データに対して用いるべき分析部品の組合せを決定する(213)。分析者201は、こうして決定した分析部品の組合せによる分析処理を実行し(214、234)、その分析結果を確認する(215)。
−−−モジュール構成−−−
図3は、本実施形態におけるデータ利活用基盤サーバ101のモジュール構成を示す図である。
【0024】
本実施形態のデータ利活用基盤サーバ101においては、分析対象データを蓄積して、この分析対象データに対する分析処理を構成する分析部品の管理及び分析を行い、ユーザへの当該分析部品の提案等の処理を実行するための、データ利活用ミドルウェア300が導入される。
【0025】
このデータ利活用ミドルウェア300の主な構成要素は、分析部品303の組合せによる分析処理302の実行管理を行う分析実行管理部301、複数の業務システム30から
登録された分析対象のデータを格納する分析対象データDB304、分析処理の実行結果を格納する分析結果DB305、分析実行管理部301にて実行された分析処理に関する実績情報を格納する実績情報DB306、分析関係情報を格納する分析関係テーブル307、分析関係テーブル307を管理する分析関係情報管理部308、分析関係テーブル307を参照してユーザに対する分析部品組合せの提案を行う分析提案部309、データ利活用ミドルウェア300にアクセスして分析を行うユーザ及び業務を管理するユーザ・業務管理部310、ユーザ端末20に対してデータ利活用ミドルウェア300が提供する機能のインタフェースを提供するクライアント向けI/F提供部311、実績情報DB306を管理する分析処理実績管理部312、分析実行管理部301にて実行する分析部品303を管理する分析部品管理部313、分析対象データDB304に格納されるデータを管理するデータ管理部314、ネットワーク10、11を介してユーザ端末20や業務システム30との間で通信を行うデータ通信部315となる。
−−−分析関係情報−−−
図4は、本実施形態における分析対象データ、分析部品、分析処理、分析目的、及び業務システムの関係例に対応した分析関係情報401を示す図である。
【0026】
本実施形態の分析関係情報401とは、分析に用いるデータ及び分析部品、それらの組合せによる分析処理、分析目的、該分析目的に対する業務システムにおける業務及び業務の実施先となる設備等の対象、との関係を表現するものである。なお、「関係」とは、関係付けられるもの同士を組合せて利用可能である、もしくは利用の実績が有る、ということを意味する。分析関係情報401は、データ利活用基盤サーバ101が、ユーザ指定の分析対象データに対して適切な分析部品を選出し提案するために参照する。
【0027】
主な構成要素は、分析対象データ411、分析部品412、分析処理413、分析目的414、業務システム415の各情報であり、それぞれの情報ごとに階層に区切って管理される。このうち分析部品412は、データ突合せロジック421とデータ分析ロジック422とに分類される。ここで分析対象データに対する分析の実施に必要となる、データ突合せロジック及びデータ分析ロジックは、分析部品を構成するソフトウェア部品として再利用可能であるものとし、これらの部品の組合せにより分析処理を構成するものとする。
【0028】
まず、分析対象データ411の階層では、分析対象となる複数の業務システム30からのデータ及び該データ間の関係が管理される。なおデータ関係は、例えば、特開2016−209063号公報による方法により作成されるものである。
【0029】
また、分析部品412の階層では、1つ以上の分析対象データの組合せをデータベース等の蓄積媒体から抽出するための処理ロジック(例えばSQL文、等)であるデータ突合せロジック421、及び、上述の1つ以上の分析対象データに対して実施する分析のロジック(例えば系列データのグラフ化、相関分析、等)であるデータ分析ロジック422が管理される。
また、分析処理413の階層では、上述の1つ以上の分析対象データ及び1つ以上の分析部品の組合せにより作成するデータ分析処理を管理する。
【0030】
また、分析目的414の階層では、分析を行う目的であるKPI情報が管理される。また、業務システム415の階層では、上述の分析目的であるKPIを必要とする業務システムにおける業務4151及び設備等の対象4152が管理される。
なお、各々の階層間では各階層の要素で関係のあるもの同士の紐付け(リンク付け)を行っている。
−−−テーブル−−−
【0031】
図5A〜
図6Bは、本実施形態のデータ利活用基盤サーバ101にて管理する、分析関係情報401における要素間の紐付け情報を格納する分析関係テーブル307の構成、及び分析部品のメタ情報のデータ構造を示す図である。
【0032】
本実施形態において、分析関係情報401における要素間の紐付け情報を管理する分析関係テーブル307は、分析対象データ紐付けテーブル501、分析部品紐付けテーブル502、分析部品−分析処理紐付けテーブル503、分析処理−分析目的紐付けテーブル504、及び、分析目的−業務紐付けテーブル505を、含んで構成されている。
【0033】
このうち
図5Aに例示する分析対象データ紐付けテーブル501は、分析関係情報401の分析対象データ411と分析部品412におけるデータ突合せロジック421との間の紐付けに関する情報を格納するテーブルである。主な構成要素は、各紐付けを一意に特定する紐付け識別情報511、分析対象データ識別情報512、データ突合せロジック識別情報513、重み514、及び、更新日時515である。
【0034】
上述の紐付け識別情報511には、該当紐付けを識別するための情報が格納される。また、分析対象データ識別情報512には、紐付けられる一方である分析対象データを識別するための情報が格納される。また、データ突合せロジック識別情報513には、紐付けられる他方であるデータ突合せロジックを識別するための情報が格納される。また、重み514には、当該紐付けの重みを示す情報が格納される。例えば該紐付けによる組合せが分析者等のユーザに多く使用される程、当該重みを表す数値は大きくなる。また、更新日時515には、上述の各項目511〜514のレコードが最後に更新された日時が格納される。なお1つの分析対象データに対して、複数の紐付けがありえるため、分析対象データ紐付けテーブル501にて、当該分析対象データに関して複数のレコードが格納され得る。
【0035】
また、
図5Bに例示する分析部品紐付けテーブル502は、分析関係情報401の分析部品412におけるデータ突合せロジック421とデータ分析ロジック422との間の紐付けに関する情報を格納するテーブルである。その主な構成要素は、紐付け識別情報521、データ突合せロジック識別情報522、データ分析ロジック識別情報523、重み524、及び、更新日時525である。
【0036】
このうち紐付け識別情報521には、当該紐付けを一意に識別するための情報が格納される。また、データ突合せロジック識別情報522には、紐付けられる一方であるデータ突合せロジックを識別するための情報が格納される。また、データ分析ロジック識別情報523には、紐付けられる他方であるデータ分析ロジックを識別するための情報が格納される。また、重み524には、当該紐付けの重みを示す情報が格納される。例えば該紐付けによる組合せが分析者等のユーザに多く使用される程、重みを表す数値は大きくなる。また、更新日時525には、上述のデータ項目521〜524のレコードが最後に更新された日時が格納される。なお1つのデータ突合せロジック及びデータ分析ロジックに対して、複数の紐付けがありえるため、分析部品紐付けテーブル502にて、当該1つのデータ突合せロジック及びデータ分析ロジックに関して複数のレコードが格納され得る。
【0037】
また、
図5Cに例示する分析部品−分析処理紐付けテーブル503は、分析関係情報401の分析部品412におけるデータ分析ロジック422と、分析者等のユーザにより実行された分析処理413との間の紐付けに関する情報を格納するテーブルである。その主な構成要素は、紐付け識別情報531、データ分析ロジック識別情報532、分析処理識別情報533、重み534、及び、更新日時535である。
【0038】
このうち紐付け識別情報531には、当該紐付けを一意に識別するための情報が格納さ
れる。また、データ分析ロジック識別情報532には、紐付けられる一方であるデータ分析ロジック422を識別するための情報が格納される。また、分析処理識別情報533には、紐付けられる他方である分析処理413を識別するための情報が格納される。また、重み534には、当該紐付けの重みを示す情報が格納される。例えば該紐付けによる組合せが分析者等のユーザにより多く使用される程、重みを表す数値は大きくなる。また、更新日時535には、上述の各データ項目531〜534のレコードが最後に更新された日時が格納される。なお1つデータ分析ロジック422に対して、複数の紐付けがありうるため、分析部品−分析処理紐付けテーブル503にて、当該1つのデータ分析ロジック422に関して複数のレコードが格納され得る。
【0039】
また、
図5Dに例示する分析処理−分析目的紐付けテーブル504は、分析処理302における実施された分析処理と分析目的414におけるKPIとの間の紐付けに関する情報を格納するテーブルである。その主な構成要素は、紐付け識別情報541、分析処理識別情報542、分析目的識別情報543、重み544、及び、更新日時545である。
【0040】
このうち紐付け識別情報541には、当該紐付けを一意に識別するための情報が格納される。また、分析処理識別情報542には、紐付けられる一方である分析処理413を識別するための情報が格納される。また、分析目的識別情報543には、紐付けられる他方である分析目的414を識別するための情報が格納される。また、重み544には、当該紐付けの重みを示す情報が格納される。例えば該紐付けによる組合せが分析者等のユーザにより多く使用される程、重みを表す数値は大きくなる。また、更新日時545には、上述の各データ項目541〜544のレコードが最後に更新された日時が格納される。なお1つの分析処理413に対して、複数の紐付けがありえるため、分析処理−分析目的紐付けテーブル504において、当該1つの分析処理413に関して、複数のレコードが格納され得る。
【0041】
また、
図5Eに例示する分析目的−業務紐付けテーブル505は、分析目的414におけるKPIと業務システム415における業務及び設備等の対象との間の紐付けに関する情報を格納するテーブルである。その主な構成要素は、紐付け識別情報551、分析目的識別情報552、業務識別情報553、対象識別情報554、重み555、及び、更新日時556である。
【0042】
このうち紐付け識別情報551には、当該紐付けを一意に識別するための情報が格納される。また、分析目的識別情報552には、紐付けられる一方である分析目的414を識別するための情報が格納される。また、業務識別情報553には、紐付けられる他方である業務4151を識別するための情報が格納される。また、対象識別情報554には、業務4151と合わせて紐付けられる対象4152を識別するための情報が格納される。また、重み555には、当該紐付けの重みを示す情報が格納される。例えば該紐付けによる組合せが分析者等のユーザにより多く使用される程、重みを表す数値は大きくなる。また、更新日時556には、上述の各データ項目551〜555のレコードが最後に更新された日時が格納される。なお1つの分析目的に対して、複数の紐付けがありうるため、分析目的−業務紐付けテーブル505において、上述の1つの分析目的に関して複数のレコードが格納され得る。
【0043】
なお、本実施形態の分析関係テーブル307は、各データ分析ロジック422のメタ情報506、及び、各データ突合せロジック421のメタ情報507も格納している。
【0044】
このうち、
図6Aに例示するデータ分析ロジック422のメタ情報506には、当該データ分析ロジック422の入力となるデータに関する情報が格納される。その主な構成要素は、識別情報561、データ項目562、型563、及び、種別564である。
【0045】
このうち識別情報561には、当該メタ情報506の各レコードを一意に識別するための情報が格納される。また、データ項目562には、当該データ項目に該当するデータの名称が格納される。ただし本項目の指定が無い場合もある。また、型563には、上述のデータ項目562に該当するデータのデータ型が格納される。また、種別564には、上述のデータ項目562に該当するデータの種別が格納される。
【0046】
ここで種別564の値としては、“入力”、“キー”、等が想定され得る。このうち“入力”である場合、該当データ項目はデータ分析ロジックの入力データであることを示す。また、“キー”である場合、該当データ項目は、データ分析ロジックにおいて、複数データの突合せ、範囲指定、整列の軸となる共通インデックスであることを示す。
【0047】
また、
図6Bに例示するデータ突合せロジック421のメタ情報507には、当該データ突合せロジック421により提供されるデータに関する情報が格納される。その主な構成要素は、識別情報571、データ項目572、型573、サイズ574、及び、テーブル575である。
【0048】
このうち識別情報571には、メタ情報507における各レコードを一意に識別するための情報が格納される。また、データ項目572には、当該データ項目572に該当するデータの名称が格納される。また、型573には、当該データ項目572に該当するデータのデータ型が格納される。また、サイズ574には、当該データ項目572に該当するデータのサイズが格納される。また、テーブル575には、当該データ項目572に該当するデータの抽出元のテーブルに関する情報が格納される。
【0049】
図7Aは、本実施形態における分析対象データDB304の構成例を示す図である。本実施形態の分析対象データDB304は、業務システム30からデータ利活用基盤サーバ101にアップロードされた、或いは、適宜なユーザ等により記憶媒体経由で格納されたデータである。より具体的には、業務システム30で管理しているデータであって、例えば該当業務に使用されている車両や機器等のセンシングデータ等を想定出来る(勿論、これに限定せず、種々のデータを想定可能である)。
【0050】
図7Aで例示する分析対象データDB304は、一例として、複数のテーブルから構成されている。これらのテーブルは、
図6Bで示したメタ情報507(データ突合せロジックのもの)のテーブル575にて指定されるデータ抽出元のテーブルに対応する。また、各テーブルは、図示するように、例えば該当データを観測した日時、箇所、結果といった各値を含むレコードの集合体となっている
【0051】
図7Bは、本実施形態における分析結果DB305の構成例を示す図である。本実施形態の分析結果DB305は、データ利活用基盤サーバ101が過去に提案した分析部品、或いはそれとは無関係に分析者201(或いは開発者202)が選定した分析部品、に基づき実際に実行した分析処理の内容を格納したDBである。具体的には、分析結果を一意に特定するIDをキーに、当該分析処理を構成する分析部品の、データ突合せロジック及びデータ分析ロジックの情報と、これらを用いて行った分析処理、その分析目的、業務、対象、結果(この場合、分析処理の実行結果として出力されるデータ値)といった値を含むレコードの集合体となっている。
【0052】
図7Cは、本実施形態における実績情報DB306の構成例を示す図である。本実施形態の実績情報DB306は、実際に実行された分析処理の実績情報を格納するDBである。具体的には、分析処理を一意に特定する分析処理名をキーに、当該分析処理の実行頻度(例:直近一ヶ月での実行回数)、利用者数、定型登録数、及び、修正回数(例:当該分
析処理に関して分析者201や開発者202が修正を行った回数)、といった値を対応付けたレコードの集合体となっている。なお、上述の定型登録数とは、当該分析処理が高頻度で或いは広範に用いられるものと分析者等に認識され、定型の分析処理として設定された回数を示す。
−−−シーケンス例−−−
【0053】
以下、本実施形態における分析ソフトウェア管理方法の実際手順について図に基づき説明する。以下で説明する分析ソフトウェア管理方法に対応する各種動作は、分析ソフトウェア管理システムたるデータ利活用基盤サーバ101が実行するプログラムによって実現される。そして、このプログラムは、以下に説明される各種の動作を行うためのコードから構成されている。
【0054】
図8は、本実施形態における分析ソフトウェア管理方法を実施する場合の処理シーケンスを示す図である。ここでは、既に
図2にて示したユースケースを実行する場合の処理シーケンスについて示すものとする。
【0055】
その主な構成要素は業務システム30、データ利活用基盤サーバ101にて稼働するデータ利活用ミドルウェア300に含まれるデータ管理部314、分析関係情報管理部308、分析処理実績管理部312、分析提案部309及び分析関係テーブル307とユーザ(分析者)201である。
【0056】
このうち業務システム30にて、該業務システム30が有する業務データをデータ利活用基盤サーバ101に対して登録する(611)。この場合、データ利活用基盤サーバ101のデータ管理部314は、上述の業務システム30からの業務データの登録を受け付ける(621)。また、データ管理部314は、分析関係情報管理部308に対して、業務データ登録受付の通知を行う(622)。
一方、分析関係情報管理部308は、上述のデータ管理部314からの通知を受信すると、当該業務データから分析関係テーブル307を作成する(631)。
他方、ユーザ(分析者)201は、業務システムにおける問題を解決するために、分析を実施するとして、分析対象とするデータを指定する(661)。
【0057】
この時、データ利活用基盤サーバ101の分析提案部309は、上述のユーザ(分析者)201からの分析対象データ指定を受け付けると、分析関係テーブル307を参照して(651)、当該分析対象データに対して利用可能な分析部品の組合せ候補を選出する(652)。また、分析提案部309は、選出した分析部品の組合せ候補をユーザ(分析者)201に対して提案する(653)。
【0058】
ユーザ(分析者)201は、上述の分析提案部309から提案された分析部品の組合せ候補を閲覧し(662)、分析に利用する分析部品の組合せを決定する(663)。ユーザ201は、ここで提案された分析部品の組合せのいずれかを選択する、もしくは提案された分析部品の組合せの一部を変更することで、利用する分析部品を決定することとなる。また、ユーザは、上述にて決定した分析部品の組合せによる分析処理を実行する(664)。
【0059】
一方、分析処理実績管理部312は、上述のユーザによる分析処理の実行を確認して、該分析処理実行に係る実績(分析部品の組合せ、処理実行の履歴、分析結果)を記録し(641)、分析関係情報管理部308に対して実績記録の通知を行う(642)。この場合、分析関係情報管理部308は、上述の分析処理実績管理部312からの通知を受信すると、当該実績から分析関係テーブルを更新する(632)。
−−−フロー例−−−
【0060】
図9は、本実施形態における分析ソフトウェア管理方法のフロー例を示す図である。具体的には、データ利活用基盤サーバ101が、業務システム30から登録された所定データに基づき、分析関係テーブル307を生成するフローチャートである。
【0061】
この場合、データ利活用基盤サーバ101は、業務システム30からのデータ登録を受け付ける(701)。ここで登録を受け付けるデータは、それぞれの業務システム30で保持する各種の業務データ、センシングデータ等である。
【0062】
また、データ利活用基盤サーバ101は、上述のステップ701で得た登録データに対してデータ関係を生成する(702)。このデータ関係の生成処理は、既存技術を適宜に採用すればよいが、例えば、業務システム30を跨がって、値の観測箇所や時間帯、対象等の或る属性が1または複数共通するデータを対応付ける処理等を想定出来る
【0063】
続いて、データ利活用基盤サーバ101は、上述のステップ702で生成したデータ関係に基づき、関係付けられた1つ以上のデータを分析対象データDB304より抽出するデータ突合せロジック及びメタ情報507を生成する(703)。
【0064】
データ突合せロジックの生成は、上述のデータ関係が示す各分析対象データを、分析対象データDB304の該当テーブルから呼び出すためのSQL文を生成する処理が該当する。また、このSQL文の生成は、データ利活用基盤サーバ101が予め保持するSQL文の雛形に、呼び出し対象のテーブルとデータの識別情報等をセットするといった手法を採用すればよい。
【0065】
また、メタ情報507の生成は、上述のデータ関係が示す各分析対象データの、文字列や数値といった型、サイズ、及び、格納先のテーブル名といった値を、それぞれの分析対象データから読み取り、これをメタ情報507としてテーブル化する処理となる。
【0066】
また、データ利活用基盤サーバ101は、上述のステップ703で生成したデータ突合せロジックのメタ情報507を参照し(704)、分析対象データとデータ突合せロジックとの紐付けについて、分析対象データ紐付けテーブル501にレコードを追加する(705)。
【0067】
続いて、データ利活用基盤サーバ101は、データ紐付けロジックのメタ情報507に記載される全てのデータに対して処理が終了しているか判定し、終了していないことが判明した場合(706:NO)、ステップ705、ステップ706の処理を繰り返す。
【0068】
他方、ステップ706の判定において、データ紐付けロジックのメタ情報507に記載される全てのデータに対して処理が終了したことが判明した場合(706:YES)、データ利活用基盤サーバ101は、全てのデータ突合せロジックに対して処理が終了しているか判定する(707)。
【0069】
この判定の結果、全てのデータ突合せロジックに対して処理が終了していることが判明した場合(707:NO)、データ利活用基盤サーバ101は、ステップ704〜706の処理を繰り返す。
【0070】
他方、上述の判定の結果、全てのデータ突合せロジックに対して処理が終了していることが判明した場合(707:YES)、かつ、全てのデータ関係に対して処理が終了していないことが判明した場合(708:NO)、データ利活用基盤サーバ101は、ステップ703〜707の処理を繰り返す。
【0071】
一方、上述のステップ708において、全てのデータ関係に対して処理が終了していることが判明した場合(708:YES)、データ利活用基盤サーバ101は、データ分析ロジックのメタ情報506を参照し(709)、また、データ突合せロジックのメタ情報507を参照する(710)。
【0072】
次に、データ利活用基盤サーバ101は、上述のステップ709、710での参照の結果、データ分析ロジックのメタ情報506にデータ項目562の指定が無い場合(711:NO)、データ分析ロジックのメタ情報506とデータ突合せロジックのメタ情報507で型(563、573)の比較を行う(712)。
【0073】
続いて、データ利活用基盤サーバ101は、上述のステップ712での比較の結果、データ突合せロジックのメタ情報507に、データ分析ロジックのメタ情報506におけるデータに合致するものが全て含まれることが判明した場合(713:YES)、データ突合せロジックとデータ分析ロジックの紐付けとして分析部品紐付けテーブル502にレコードを追加する(714)。
【0074】
他方、上述のステップ711において、データ分析ロジックのメタ情報506にデータ項目562の指定が有ることが判明した場合(711:YES)、データ利活用基盤サーバ101は、データ分析ロジックのメタ情報506とデータ突合せロジックのメタ情報507とでデータ項目(562、572)の比較を行う(715)。
【0075】
次に、データ利活用基盤サーバ101は、上述のステップ715での比較の結果、データ突合せロジックのメタ情報507にデータ分析ロジックのメタ情報506におけるデータに合致するものが全て含まれることが判明した場合(716:YES)、データ突合せロジックとデータ分析ロジックとの紐付けとして分析部品紐付けテーブル502にレコードを追加する(717)。
【0076】
また、データ利活用基盤サーバ101は、上述のステップ717で紐付けたデータ突合せロジックのメタ情報507に、データ分析ロジックのメタ情報506にて種別564が“キー”であるデータに対応するデータが含まれるか判定する(718)。
【0077】
この判定の結果、“キー”であるデータに対応するデータが含まれないことが判明した場合(718:NO)、データ利活用基盤サーバ101は、データ分析ロジックのメタ情報506にて種別564が“入力”であるデータからデータ関係を参照して、“キー”に該当するデータを検索する(719)。
【0078】
また、データ利活用基盤サーバ101は、上述のステップ719で検索したデータとの紐付けとして、分析対象データ紐付けテーブル501にレコードを追加する(720)。
次に、データ利活用基盤サーバ101は、全てのデータ突合せロジックに対して処理が終了しているか判定する(721)。この判定の結果、全てのデータ突合せロジックに対して処理が終了していないことが判明した場合(721:NO)、データ利活用基盤サーバ101は、ステップ710〜720の処理を繰り返す。
【0079】
他方、上述のステップ721において、全てのデータ突合せロジックに対して処理が終了していることが判明した場合(721:YES)、データ利活用基盤サーバ101は、全てのデータ分析ロジックに対して処理が終了しているか判定する(722)。
【0080】
この判定の結果、全てのデータ分析ロジックに対して処理が終了していないことが判明した場合(722:NO)、データ利活用基盤サーバ101は、ステップ709〜721
の処理を繰り返す。他方、全てのデータ分析ロジックに対して処理が終了していることが判明した場合(722:YES)、データ利活用基盤サーバ101は、処理を終了する。
【0081】
図10は、本実施形態における分析ソフトウェア管理方法のフロー例2を示す図である。具体的には、分析処理の実行実績に基づき分析関係テーブル307を更新する処理の流れを示すフローチャートである。
【0082】
まず、データ利活用基盤サーバ101は、分析者201により実行された分析処理(分析部品の組合せ)に関する情報の、分析関係テーブル307への登録有無を確認する(801)。なお、分析者201により分析処理が実行されたこと自体は、例えば、分析結果DB305でのレコード登録イベントを通じて検知出来る。
【0083】
続いて、データ利活用基盤サーバ101は、ステップ801の結果、分析関係テーブル307への分析処理の登録が確認された場合(802:YES)、該当分析処理(とこれを構成する分析部品、分析対象データ等)に関して、分析関係テーブル307の各テーブルにおいて互いに紐付いている各レコードの「重み」の情報を更新する(803)。この更新は、例えば、「重み」の値をインクリメントすることとなる。
【0084】
他方、ステップ801の結果、分析関係テーブル307への分析処理の登録が確認出来なかった場合(802:NO)、データ利活用基盤サーバ101は、上述の実行した分析処理を構成する各々の分析部品、分析対象データの間の紐付けを、当該分析処理の情報に基づき確認する(804)。
【0085】
次に、データ利活用基盤サーバ101は、上述の実行した分析処理の情報を、分析関係テーブル307へ新規登録する(805)。また、データ利活用基盤サーバ101は、上述の実行した分析処理に関する情報として、分析処理−分析目的紐付けテーブル504及び分析目的−業務紐付けテーブル505にレコードを追加する(806)。
【0086】
また、データ利活用基盤サーバ101は、分析部品−分析処理紐付けテーブル503に該当する既存の紐付けレコードが有るか判定する(807)。この判定の結果、分析部品−分析処理紐付けテーブル503に該当する既存の紐付けレコードが有ることが判明した場合(807:YES)、データ利活用基盤サーバ101は、分析部品−分析処理紐付けテーブル503における該当レコードの重みの情報を更新する(808)。
【0087】
続いて、データ利活用基盤サーバ101は、上述の807の判定の結果、分析部品−分析処理紐付けテーブル503に該当する既存の紐付けレコードが無いことが判明した場合(807:NO)、分析部品−分析処理紐付けテーブル503に、上述の実行した分析処理における紐付けに関するレコードを追加する(809)。
【0088】
また、データ利活用基盤サーバ101は、分析部品紐付けテーブル502に、該当する既存の紐付けレコードが有るか判定する(810)。この判定の結果、分析部品紐付けテーブル502に、該当する既存の紐付けレコードが有ることが判明した場合(810:YES)、データ利活用基盤サーバ101は、分析部品紐付けテーブル502における該当レコードの重みの情報を更新する(811)。
【0089】
他方、上述のステップ810での判定の結果、分析部品紐付けテーブル502に該当する既存の紐付けレコードが無いことが判明した場合(810:NO)、データ利活用基盤サーバ101は、分析部品紐付けテーブル502に、上述の実行した分析処理における紐付けに関するレコードを追加する(812)。
【0090】
続いて、データ利活用基盤サーバ101は、分析対象データ紐付けテーブル501に、該当する既存の紐付けレコードが有るか判定する(813)。この判定の結果、分析対象データ紐付けテーブル501に、該当する既存の紐付けレコードが有ることが判明した場合(813:YES)、データ利活用基盤サーバ101は、分析対象データ紐付けテーブル501における該当レコードの重みの情報を更新する(814)。
【0091】
他方、上述のステップ813の判定の結果、分析対象データ紐付けテーブル501に該当する既存の紐付けレコードが無いことが判明した場合(813:NO)、データ利活用基盤サーバ101は、分析対象データ紐付けテーブル501に、上述の実行した分析処理における紐付けに関するレコードを追加する(815)。
【0092】
次に、データ利活用基盤サーバ101は上述の実行した分析処理の分析結果(分析処理の実行結果として出力されるデータ値。例えばKPIの値)を、上述の実行した分析処理との紐付けて、分析結果DB305に保存する(816、817)。
【0093】
また、データ利活用基盤サーバ101は、上述の実行した分析処理に関して、実績情報DB06における実績情報を更新する(818)。具体的には、該当分析処理の、実行頻度、利用者数、定型登録数、修正回数といった値を更新することとなる。
【0094】
図11は、本実施形態における分析ソフトウェア管理方法のフロー例3を示す図である。具体的には、データ利活用基盤サーバ101が分析関係テーブル307を参照して、ユーザ指定の分析対象データに対して分析を実行するために適切な分析部品の組合せを選出し提示するための処理の流れを示すフローチャートである。
この場合、データ利活用基盤サーバ101は、ユーザからの分析対象データの指定をユーザ端末20を介して受け付ける(901)。
【0095】
また、データ利活用基盤サーバ101は、分析関係テーブル307を参照し(902)、上述のユーザ指定の分析対象データに紐付く分析部品(データ突合せ突合せロジック、データ分析ロジック)を抽出し(903)、分析部品組合せ候補を作成する(904)。この候補は、ステップ903で抽出できた分析部品のリストである。
【0096】
続いて、データ利活用基盤サーバ101は、上述の分析部品組合せ候補それぞれについて、実績情報DB306での実績情報の蓄積があるか判定する(905)。
【0097】
上述の判定の結果、実績情報の蓄積が無いことが判明した場合(905:NO)、データ利活用基盤サーバ101は、ステップ906から913までの処理を実施せず、ステップ914に処理を遷移させる。
【0098】
他方、上述のステップ905において、実績情報DB306での実績情報の蓄積が有ることが判明した場合(905:YES)、データ利活用基盤サーバ101は、上述で作成した分析部品組合せ候補に類似する、実績情報の蓄積が実績情報DB306にある既存の分析処理を抽出する(906)。なお、本処理の詳細は
図12にて後述する。
【0099】
続いて、データ利活用基盤サーバ101は、ステップ906で抽出した類似処理の分析結果を、分析結果DB305から抽出する(907)。この分析結果は関連する情報としてユーザに提示するためのものである。
【0100】
次に、データ利活用基盤サーバ101は、実績情報DB306を参照して、上述の類似処理の実行頻度を算出する(908)。また、データ利活用基盤サーバ101は、実績情報DB306を参照して、上述の類似処理の利用者数を算出する(909)。
また、データ利活用基盤サーバ101は、実績情報DB306を参照して、上述の類似処理の定型業務としての登録数を算出する(910)。
【0101】
また、データ利活用基盤サーバ101は、実績情報DB306を参照して、上述の類似処理の修正回数を算出する(911)。また、データ利活用基盤サーバ101は、分析関係テーブル307を参照して、上述の類似処理の類似処理数を算出する(912)。
【0102】
続いて、データ利活用基盤サーバ101は、上述のステップ907から912の結果を用いて、当該分析部品組合せの有用度を判定する(913)。ここでは、上述のステップ908〜912の各結果に重み付け加算による点数算出等を行う。
【0103】
また、データ利活用基盤サーバ101は、全ての分析部品組合せ候補に対して処理が終了しているか判定する(914)。この判定の結果、全ての分析部品組合せ候補に対して処理が終了していないことが判明した場合(914:NO)、データ利活用基盤サーバ101は、ステップ906〜913の処理を繰り返す。
【0104】
他方、上述の判定の結果、全ての分析部品組合せ候補に対して処理が終了していることが判明した場合(914:YES)、データ利活用基盤サーバ101は、処理の結果として、分析部品組合せ候補、有用度判定結果及び類似処理の分析結果を、ユーザ端末20に出力し(915)、当該ユーザに対して提示する。
【0105】
図12は、本実施形態における分析ソフトウェア管理方法のフロー例4を示す図である。具体的には、データ利活用基盤サーバ101が、ユーザ指定の分析対象データに対して分析を実行するための、適切な分析部品の組合せを選出する際に、類似の既存分析処理を選出するフローチャートである。
【0106】
この場合、データ利活用基盤サーバ101は、分析関係テーブル307を参照して、
図11のフローにて選出した、指定された分析対象データに対する分析部品の組合せ候補と、分析処理の実績として蓄積されている既存の分析部品組合せとの比較を行う(1001)。 次に、データ利活用基盤サーバ101は、上述の分析部品組合せ候補と既存分析部品組合せとで入力データ項目が一致するか判定する(1002)。
【0107】
この判定の結果、上述の分析部品組合せ候補と既存分析部品組合せとで入力データ項目が一致しないことが判明した場合(1002:NO)、データ利活用基盤サーバ101は、当該組合せ同士は類似しないと判定し(1009)、処理をステップ1010に遷移させる。
【0108】
他方、上述の判定の結果、上述の分析部品組合せ候補と既存分析部品組合せとで入力データ項目が一致することが判明した場合(1002:YES)、データ利活用基盤サーバ101は、分析部品組合せ候補と既存分析部品組合せとで構成する分析部品の種別が一致する数が、指定された閾値以上か判定する(1003)。
【0109】
上述の判定の結果、分析部品の種別が一致する数が、指定された閾値以上ではないことが判明した場合(1003:NO)、データ利活用基盤サーバ101は、当該組合せ同士は類似しないと判定し(1009)、処理をステップ1010に遷移させる。
【0110】
他方、上述の判定の結果、分析部品の種別が一致する数が、指定された閾値以上であることが判明した場合(1003:YES)、データ利活用基盤サーバ101は、当該分析部品組合せ候補と既存分析部品組合せとで構成する分析部品の実行順序が一致するか判定する(1004)。
【0111】
上述の判定の結果、分析部品の実行順序が一致しないことが判明した場合(1004:NO)、データ利活用基盤サーバ101は、当該組合せ同士は類似しないと判定し(1009)、処理をステップ10101に遷移させる。
【0112】
他方、上述の判定の結果、分析部品の実行順序が一致することが判明した場合(1004:YES)、データ利活用基盤サーバ101は、分析関係情報としてKPI、業務、対象の情報が有るか判定する(1005)。
【0113】
この判定の結果、KPI、業務、対象の情報が無いことが判明した場合(1005:NO)、データ利活用基盤サーバ101は、当該組合せ同士は一部分のみが類似する準類似であると判定し(1008)、処理をステップ1010に遷移させる。
【0114】
他方、上述の判定の結果、KPI、業務、対象の情報があることが判明した場合(1005:YES)、データ利活用基盤サーバ101は、当該分析部品組合せ候補と既存分析部品組合せとでKPI、業務、対象が一致する数が、指定された閾値以上か判定する(1006)。
【0115】
上述の判定の結果、KPI、業務、対象が一致する数が、指定された閾値以上ではないことが判明した場合(1006:NO)、データ利活用基盤サーバ101は、当該組合せ同士は一部分のみが類似する準類似であると判定し(1008)、処理をステップ10101に遷移させる。
【0116】
他方、上述の判定の結果、KPI、業務、対象が一致する数が、指定された閾値以上であることが判明した場合(1006:YES)、データ利活用基盤サーバ101は、当該組合せ同士は類似であると判定し(1007)、処理をステップ1010に遷移させる。
【0117】
次に、データ利活用基盤サーバ101は、全ての分析部品組合せ候補及び既存分析部品組合せに対して比較が終了しているか判定する(1010)。この判定の結果、全ての分析部品組合せ候補及び既存分析部品組合せに対して比較が終了していないことが判明した場合(1010:NO)、データ利活用基盤サーバ101は、上述のステップ1001から1009までの処理を繰り返す。
【0118】
他方、上述の判定の結果、全ての分析部品組合せ候補及び既存分析部品組合せに対して比較が終了していることが判明した場合(1010:YES)、データ利活用基盤サーバ101は処理を終了する。
【0119】
図13は、本実施形態における出力画面の例である。具体的には、上述のステップ915でユーザ端末20を介してユーザに対して提供する、分析対象データ(ユーザが選択したもの)に対する分析の実行に適切な分析部品の組合せ候補の確認画面の例である。
【0120】
図13で例示する画面1101には、例えば、ユーザが指定する分析対象データを表示する、分析対象データ欄1111と、候補表示欄1112とを含んでいる。
【0121】
このうち、候補表示欄1112は、ユーザ指定の分析対象データに対して分析処理の候補となる、データ突合せロジック及びデータ分析ロジックの組合せ、及び該組合せに関連付けられる分析処理、分析目的、業務、対象と、該組合せの有用度、関連分析結果(
図7Bの分析結果DB305における該当レコードのID)を一覧表示する。なお該当する情報が無い場合は空白箇所を含めて表示する。
【0122】
以上、本発明を実施するための最良の形態等について具体的に説明したが、本発明はこれに限定されるものではなく、その要旨を逸脱しない範囲で種々変更可能である。
【0123】
こうした本実施形態によれば、データ分析等のデータ利活用を行うアプリケーションに対してデータ提供を行うシステムにて、当該システムの導入時点、運用開始時点からも、分析処理の作成向けに再利用可能な部品の提案が可能となる。これにより、例えば複数業務システムからのデータを分析するための分析アプリケーションの作成や準備の作業高速化を図りことが可能となり、データ分析処理をはじめとするデータ利活用の実施に要するコストを低減できる。
【0124】
すなわち、データ分析の実施履歴の多寡に係わらず分析部品の提案を可能とし、ひいては、データ分析用ソフトウェア作成の効率化やコスト低減を図ることが可能となる。
【0125】
本明細書の記載により、少なくとも次のことが明らかにされる。すなわち、本実施形態の分析ソフトウェア管理システムにおいて、前記演算装置は、前記分析関係情報を生成する処理において、各分析対象データの属性に基づく分析対象データの間における関係性に応じて複数の分析対象データを関係付け、当該複数の分析対象データを分析に際して抽出するデータ突合せロジックを、前記分析部品の1つとして所定アルゴリズムで生成するものである、としてもよい。
これによれば、様々な業務システム等から得られたデータ類について、適宜な属性に基づきグルーピングし、これを効率的に分析に供することが可能となる。
【0126】
また、本実施形態の分析ソフトウェア管理システムにおいて、前記演算装置は、前記分析関係情報を生成する処理において、前記データ突合せロジックと、前記分析部品の1つであって前記データ突合せロジックが抽出する分析対象データに対して分析処理を実行するデータ分析ロジックとを、前記データ突合せロジック及び前記データ分析ロジックの各々の取扱いデータに関するメタ情報を比較することで紐付けするものである、としてもよい。
【0127】
これによれば、分析部品を構成するデータ突合せロジックとデータ分析ロジックとを、それぞれで取り扱うデータ項目等の適合に基づき精度良く紐付け、効率的な分析部品の提案が可能となる。
【0128】
また、本実施形態の分析ソフトウェア管理システムにおいて、前記演算装置は、前記分析部品による分析処理の実績情報に基づき、前記分析関係情報を更新する処理を更に実行するものである、としてもよい。
【0129】
これによれば、ユーザに提示した分析部品のうち、実際にユーザが選択して利用したものに関して、その有用度を認める情報を管理可能となり、ひいては、その後の分析部品の組合せの特定精度をより適宜なものできる。
【0130】
また、本実施形態の分析ソフトウェア管理システムにおいて、前記演算装置は、前記分析関係情報を更新するに際し、前記分析処理と、当該分析処理の目的、当該目的に対応した業務、及び、当該業務の対象、の少なくともいずれかの情報とを紐付けるものである、としてもよい。
【0131】
これによれば、ユーザに提示した分析部品のうち、実際にユーザが選択して利用したものに関して、その目的、業務、業務の対象、といった具体的状況を踏まえた有用度を認める情報を管理可能となり、ひいては、その後の分析部品の組合せの特定精度を更に適宜なものとできる。
【0132】
また、本実施形態の分析ソフトウェア管理システムにおいて、前記演算装置は、前記分析部品の組合せを特定する処理において、分析部品による分析処理の実績情報を有している場合、当該実績情報にも基づいて分析部品の組合せを特定するものである、としてもよい。
これによれば、分析部品の組合せの特定精度をより適宜なものできる。
【0133】
また、本実施形態の分析ソフトウェア管理システムにおいて、前記演算装置は、前記特定した分析部品の組合せに類似する分析処理を、分析部品による分析処理の実績情報に基づいて特定し、当該類似の分析処理に関する所定事象の発生頻度の実績値に基づき、当該特定した分析部品の組み合わせの有用度を判定する処理を更に実行するものである、としてもよい。
【0134】
これによれば、ユーザに提示した分析部品のうち、実際にユーザが選択して利用した事象等、当該分析部品の有用度を認めうる事象の発生頻度に基づき、分析部品の組合せの特定精度を更に適宜なものできる。
【0135】
また、本実施形態の分析ソフトウェア管理システムにおいて、前記演算装置は、前記特定した分析部品の組合せに関する情報を、前記分析対象として指定された所定データの分析に適切な分析部品の組合せ候補の情報として、所定装置に出力する処理を更に実行するものである、としてもよい。
これによれば、ユーザに対して、分析対象データの分析に好適な分析部品の情報を提示することが可能となる。
【0136】
また、本実施形態の分析ソフトウェア管理方法において、前記情報処理システムが、前記分析関係情報を生成する処理において、各分析対象データの属性に基づく分析対象データの間における関係性に応じて複数の分析対象データを関係付け、当該複数の分析対象データを分析に際して抽出するデータ突合せロジックを、前記分析部品の1つとして所定アルゴリズムで生成する、としてもよい。
【0137】
また、本実施形態の分析ソフトウェア管理方法において、前記情報処理システムが、前記分析関係情報を生成する処理において、前記データ突合せロジックと、前記分析部品の1つであって前記データ突合せロジックが抽出する分析対象データに対して分析処理を実行するデータ分析ロジックとを、前記データ突合せロジック及び前記データ分析ロジックの各々の取扱いデータに関するメタ情報を比較することで紐付けする、としてもよい。
【0138】
また、本実施形態の分析ソフトウェア管理方法において、前記情報処理システムが、前記分析部品による分析処理の実績情報に基づき、前記分析関係情報を更新する処理を更に実行する、としてもよい。
【0139】
また、本実施形態の分析ソフトウェア管理方法において、前記情報処理システムが、前記分析関係情報を更新するに際し、前記分析処理と、当該分析処理の目的、当該目的に対応した業務、及び、当該業務の対象、の少なくともいずれかの情報とを紐付ける、としてもよい。
【0140】
また、本実施形態の分析ソフトウェア管理方法において、前記情報処理システムが、前記分析部品の組合せを特定する処理において、分析部品による分析処理の実績情報を有している場合、当該実績情報にも基づいて分析部品の組合せを特定する、としてもよい。
【0141】
また、本実施形態の分析ソフトウェア管理方法において、前記情報処理システムが、前
記特定した分析部品の組合せに類似する分析処理を、分析部品による分析処理の実績情報に基づいて特定し、当該類似の分析処理に関する所定事象の発生頻度の実績値に基づき、当該特定した分析部品の組み合わせの有用度を判定する処理を更に実行する、としてもよい。
【0142】
また、本実施形態の分析ソフトウェア管理方法において、前記情報処理システムが、前記特定した分析部品の組合せに関する情報を、前記分析対象として指定された所定データの分析に適切な分析部品の組合せ候補の情報として、所定装置に出力する処理を更に実行する、としてもよい。