特許7484038 | 知財ポータル「IP Force」

知財求人 - 知財ポータルサイト「IP Force」

▶ 日本電気株式会社の特許一覧

特許7484038データ分割装置、データ分割方法及びプログラム。

書誌要約請求の範囲詳細な説明課題実施例実施するための形態図面の説明

目に優しい文字サイズ小中大 PDF Top

< >

1
2
3
4
5
6
7
8
9
10
11
12
13
14
15
16

(19)【発行国】日本国特許庁(JP)

(12)【公報種別】特許公報(B2)

(11)【特許番号】

(24)【登録日】2024-05-08

(45)【発行日】2024-05-16

(54)【発明の名称】データ分割装置、データ分割方法及びプログラム。

(51)【国際特許分類】

G06F 8/70 20180101AFI20240509BHJP

【ＦＩ】

G06F8/70

【請求項の数】 10

(21)【出願番号】P 2019210670

(22)【出願日】2019-11-21

(65)【公開番号】P2021082143

(43)【公開日】2021-05-27

【審査請求日】2022-10-11

(73)【特許権者】

【識別番号】000004237

【氏名又は名称】日本電気株式会社

(74)【代理人】

【識別番号】100149548

【弁理士】

【氏名又は名称】松沼泰史

(74)【代理人】

【識別番号】100181135

【弁理士】

【氏名又は名称】橋本隆史

(72)【発明者】

【氏名】笹倉秀昭

【審査官】渡辺順哉

(56)【参考文献】

【文献】特開２０２１－０５６５７０（ＪＰ，Ａ）

【文献】特開２０１９－１３３５４１（ＪＰ，Ａ）

【文献】特開２００５－００４４１１（ＪＰ，Ａ）

【文献】特開２０１０－１２２７１６（ＪＰ，Ａ）

【文献】特開２０１９－１４４６５６（ＪＰ，Ａ）

【文献】特開２０１８－０２５８６０（ＪＰ，Ａ）

(58)【調査した分野】(Int.Cl.，ＤＢ名)

Ｇ０６Ｆ８／００－８／７７

Ｇ０６Ｆ９／４４－９／４４５

Ｇ０６Ｆ１８／２３

(57)【特許請求の範囲】

【請求項1】

複数のプログラムと前記プログラムのうちの少なくとも１つからアクセスされるデータを複数含むシステムに対し、前記複数のプログラムと前記複数のデータとを複数のグループに分割するにあたり、前記複数のデータを分割するルールと該ルールの重み付けを設定する重み付け手段と、
前記重み付け手段が設定した前記ルールに基づいて前記複数のデータを前記グループの何れかに割り当てる分割手段と、
を備えるデータ分割装置。

【請求項2】

前記重み付け手段は、
前記データの分割方法を規定した分割ルールを設定する手段と、
前記データを分割する際に担保すべき条件を示す抑止ルールを設定する手段と、
を備える請求項１に記載のデータ分割装置。

【請求項3】

前記抑止ルールを設定する手段は、
同一の業務に関する前記プログラムがアクセスする1つ又は複数の前記データを異なる前記グループへ分割しないルールを設定する、
請求項２に記載のデータ分割装置。

【請求項4】

前記分割ルールを設定する手段は、
２以上の前記プログラムが１つの前記データにアクセスし、それらの前記プログラムが、参照アクセスのみを行う前記プログラムと、更新アクセスを行う前記プログラムに分類できる場合、１つの前記データを、更新アクセスを行う前記プログラムが帰属する前記グループへ割り当てるルールを設定する、
請求項２または請求項３に記載のデータ分割装置。

【請求項5】

前記抑止ルールを設定する手段は、
前記データに複製不可が設定されている場合、前記データを、前記データにアクセスする複数のプログラムの何れか１つに割り当てるルールを設定する、
請求項２から請求項４の何れか１項に記載のデータ分割装置。

【請求項6】

前記抑止ルールを設定する手段は、
前記データに分離不可が設定されている場合、前記データを、前記データにアクセスする前記プログラムが帰属する前記グループの各々に個別に割り当てるとともに、前記グループとは独立して前記データに対応するマスタデータを設け、前記マスタデータと前記グループごとに割り当てた前記データとの間で同期させるよう構成するルールを設定する、請求項２から請求項５の何れか１項に記載のデータ分割装置。

【請求項7】

前記分割ルールを設定する手段は、
２以上の前記プログラムが１つの前記データにアクセスする場合、前記データを、それらの前記プログラムのうち、前記データにアクセスする頻度が最も多い前記プログラムが帰属するグループへ割り当てるルールを設定する、
請求項２から請求項６の何れか１項に記載のデータ分割装置。

【請求項8】

前記分割ルールを設定する手段は、
２以上の前記プログラムが１つの前記データにアクセスする場合であって、それら全ての前記プログラムが前記データにアクセスする頻度の差が所定の範囲内の場合、前記データを、前記データにアクセスする前記プログラムが帰属する前記グループの各々に個別に割り当てるとともに、前記グループとは独立して前記データに対応するマスタデータを設け、前記マスタデータと複数の前記グループごとに割り当てた前記データとの間で同期させるよう構成するルールを設定する、
請求項２から請求項７の何れか１項に記載のデータ分割装置。

【請求項9】

コンピュータによって実行されるデータ分割方法であって、
複数のプログラムと前記プログラムのうちの少なくとも１つからアクセスされるデータを複数含むシステムに対し、前記複数のプログラムと前記複数のデータとを複数のグループに分割するにあたり、前記複数のデータを分割するルールと該ルールの重み付けを設定し、
前記重み付け手段が設定した前記ルールに基づいて前記複数のデータを前記グループの何れかに割り当てる、
データ分割方法。

【請求項10】

コンピュータに、
複数のプログラムと前記プログラムのうちの少なくとも１つからアクセスされるデータを複数含むシステムに対し、前記複数のプログラムと前記複数のデータとを複数のグループに分割するにあたり、前記複数のデータを分割するルールと該ルールの重み付けを設定し、
前記重み付け手段が設定した前記ルールに基づいて前記複数のデータを前記グループの何れかに割り当てる処理を実行させる、
プログラム。

【発明の詳細な説明】

【技術分野】

【0001】

本発明は、データ分割装置、データ分割方法及びプログラムに関する。

【背景技術】

【0002】

モノシリックなアーキテクチャで構築された既存システムをマイクロサービス化する動きが存在する。マイクロサービスとは、ソフトウェア開発における技法・考え方の１つである。マイクロサービスにおいては、既存システムを、業務機能に沿った複数の小さいサービス、つまり、マイクロサービスに分割する。そして、全体のアプリケーションは、複数のマイクロサービスを疎結合して構成することで実現する。疎結合は、例えば、ＡＰＩ呼び出しなどによって実現する。アプリケーションを複数のマイクロサービスに分割することによって、マイクロサービスごとに開発を行うことが可能になる。そのため、複数の開発を並列して行うことが可能になる。また、１つ１つのサービスが小さくなるため、開発者の理解、開発、テストがより容易になる。これらの理由によって、保守性が高く、ビジネス環境の変化に迅速に対応できるシステムを構築することができる。

【0003】

特許文献１には、既存システムのマイクロサービス化に関し、対象のシステムから業務別に対応するデータを分離する方法が開示されている。

【先行技術文献】

【特許文献】

【0004】

【文献】特開２０１９－１３３５４１号公報

【発明の概要】

【発明が解決しようとする課題】

【0005】

既存システムをマイクロサービス化するためには、各サービスが疎結合となるようにデータを分割する必要がある。しかし、保守性を向上させる観点でデータベースを分割する標準的な手法が提供されていない。その為、現実には、既存システムや業務に精通した有識者が手作業でデータの分割を行うことが多い。マイクロサービス化に際し、データを自動的に分割する方法が求められている。

【0006】

そこでこの発明は、上述の課題を解決するデータ分割装置、データ分割方法及びプログラムを提供することを目的としている。

【課題を解決するための手段】

【0007】

本発明の一態様によれば、データ分割装置は、複数のプログラムと前記プログラムのうちの少なくとも１つからアクセスされるデータを複数含むシステムに対し、前記複数のプログラムと前記複数のデータとを複数のグループに分割するにあたり、前記複数のデータを分割するルールと該ルールの重み付けを設定する重み付け手段と、前記重み付け手段が設定した前記ルールに基づいて前記複数のデータを前記グループの何れかに割り当てる分割手段と、を備える。

【0008】

また、本発明の他の一態様は、コンピュータによって実行されるデータ分割方法であって、複数のプログラムと前記プログラムのうちの少なくとも１つからアクセスされるデータを複数含むシステムに対し、前記複数のプログラムと前記複数のデータとを複数のグループに分割するにあたり、前記複数のデータを分割するルールと該ルールの重み付けを設定し、前記重み付け手段が設定した前記ルールに基づいて前記複数のデータを前記グループの何れかに割り当てる、データ分割方法である。

【0009】

また、本発明の他の一態様によれば、プログラムは、コンピュータに、複数のプログラムと前記プログラムのうちの少なくとも１つからアクセスされるデータを複数含むシステムに対し、前記複数のプログラムと前記複数のデータとを複数のグループに分割するにあたり、前記複数のデータを分割するルールと該ルールの重み付けを設定し、前記重み付け手段が設定した前記ルールに基づいて前記複数のデータを前記グループの何れかに割り当てる処理を実行させる。

【発明の効果】

【0010】

本発明によれば、データの分割を自動的に行うことができる。

【図面の簡単な説明】

【0011】

【図1】本発明の一実施形態によるデータ分割装置の一例を示す機能ブロック図である。

【図2】本発明の一実施形態による解析結果の一例を示す第１図である。

【図3】本発明の一実施形態による解析結果の一例を示す第２図である。

【図4】データの分割について説明する第１図である。

【図5】データの分割について説明する第２図である。

【図6】データの分割について説明する第３図である。

【図7】本発明の一実施形態によるデータ分割処理の重み付けの一例を示す図である。

【図8】本発明の一実施形態によるデータ分割方法の一例を示す第１図である。

【図9】本発明の一実施形態によるデータ分割方法の一例を示す第２図である。

【図10】本発明の一実施形態によるデータ分割方法の一例を示す第３図である。

【図11】本発明の一実施形態によるデータ分割方法の一例を示す第４図である。

【図12】本発明の一実施形態によるデータ分割方法の一例を示す第５図である。

【図13】本発明の一実施形態のデータ分割処理の一例を示すフローチャートである。

【図14】本発明の一実施形態のアクセス頻度によるデータ分割処理の一例を示すフローチャートである。

【図15】本発明の一実施形態のデータ分割装置の最小構成を示す図である。

【図16】本発明の一実施形態のデータ分割装置のハードウェア構成の一例を示す図である。

【発明を実施するための形態】

【0012】

（データ分割装置の構成）
以下、一実施形態に係るデータ分割装置について図１～図１６を参照して説明する。
図１は、本発明の一実施形態によるデータ分割装置の一例を示す機能ブロック図である。データ分割装置１００は、既存の業務システム１０（以下、既存システム１０と記載する。）のソースコード１１、データの構成情報１２（テーブルやテーブルのレイアウト情報など）、稼働ログ１３、設定情報１４を取得し、マイクロサービス化のためにどのようにデータの分割・統合を行えば良いかを提案する。ここで、データとは、既存システム１０の業務データが記録されるデータベースのテーブル、各テーブルの項目、ファイルなどである。データの分割とは、テーブルやファイルをマイクロサービスの何れかに帰属させること、１つのテーブルや１つのファイルを項目単位で分割して分割後のテーブルやファイルをマイクロサービスの何れかに帰属させることをいう。

【0013】

図１に示すようにデータ分割装置１００は、データ取得部１０１と、データアクセス解析部１０２と、業務解析部１０３と、記憶部１０４と、重み付け部１０５と、分割部１０８と、出力部１０９と、を備える。
データ取得部１０１は、既存システム１０を構成するプログラムのソースコード１１、データの構成情報１２、既存システム１０の稼働ログ１３、設定情報１４を取得する。データの構成情報１２には、データベースに含まれるテーブルや各テーブルの項目などの情報が含まれる。既存システム１０の稼働ログ１３には、既存システム１０の稼働中に、既存システム１０を構成する各プログラムがデータベースのどのテーブルのどの項目にアクセスしたかを示す履歴が記録されている。設定情報１４には、データベースに含まれるテーブルやテーブルの項目について、複製を許可するか否か、分離可能か否かなどの既存システム１０のユーザが設定した設定情報が含まれている。また、データ取得部１０１は、データ分割処理に用いる閾値の設定などを受け付ける。

【0014】

データアクセス解析部１０２は、既存システム１０のソースコード１１を解析して、どのプログラムが、どのデータへどのようなアクセスを行っているのか、どのプログラムが、他のどのプログラムを呼び出しているかを解析する（プログラム観点の解析）。データとは、例えば、アクセス先のデータベースのテーブルおよび項目である。アクセスには、作成（Ｃｒｅａｔｅ、以下“Ｃ”で表示）、参照（Ｒｅａｄ、以下“Ｒ“で表示）、更新（Ｕｐｄａｔｅ、以下“Ｕ”で表示）、及び、削除（Ｄｅｌｅｔｅ、以下“Ｄ”で表示）の種別が存在する。以下では、作成、参照、更新、及び削除の何れかの処理のことを「アクセス（アクセスする）」とも称する。

【0015】

業務解析部１０３は、既存システム１０のプログラムやデータベースに関し、業務的観点から解析を行い、データアクセス解析部１０２による解析結果に業務的観点からの解析結果を紐づける。例えば、業務解析部１０３は、データの特徴（複製の可否、データ項目間の分離の可否）、プログラムの特徴（同一業務か否か）、プログラムの実行頻度やデータへのアクセス頻度の解析を行う。例えば、業務解析部１０３は、ユーザの設定に基づいて、テーブルや項目の複製可否や分離可否を判断する。また、例えば、業務解析部１０３は、ソースコード１１を参照して、プログラム間の呼び出しやビルド時のリンク関係などから、１つのプロセスとして実行されるプログラム群を同一業務に関するプログラムであると解析する。また、業務解析部１０３は、稼働ログ１３を参照して、プログラムの実行頻度やテーブル毎、テーブルの項目毎のアクセス頻度（動的なアクセス頻度）を集計する。また、業務解析部１０３は、ソースコード１１に基づいて、プログラム別に、テーブル毎、テーブルの項目毎のアクセス頻度（静的なアクセス頻度）を解析する。そして、業務解析部１０３は、データアクセス解析部１０２による解析結果に、業務的観点から行った解析結果を紐づける。例えば、「プログラムＡ」が「テーブルＴ１」の「項目１」へ１００（回/時間）アクセスしていれば、業務解析部１０３は、データアクセス解析部１０２による解析結果、例えば「プログラムＡ」は「テーブルＴ１」の「項目１」を「参照」するという解析結果に対し「１００回/時間」を紐づける。また、例えば、業務解析部１０３は、データ取得部１０１が取得した設定情報に「テーブルＴ１」に対して「複製不可」の設定が含まれていれば、データアクセス解析部１０２による上記例の解析結果（「プログラムＡ」は「テーブルＴ１」の「項目１」を「参照」する）に対し、「テーブル１は複製不可」を紐づける。また、「プログラムＡ１」～「プログラムＡ５」が同一プロセス内で稼働する場合、業務解析部１０３は、「プログラムＡ１」～「プログラムＡ５」を同一業務のプログラムであるとして分類し、同一業務に関するプログラム群のＩＤ等を記憶部１０４に記録する。

【0016】

記憶部１０４は、データ取得部１０１が取得した情報や、データアクセス解析部１０２と業務解析部１０３による解析結果を記憶する。図２～図３に解析結果の一例を示す。

【0017】

図２は、本発明の一実施形態による解析結果の一例を示す第１図である。
図２に示す例では、解析結果の情報は、「Ｎｏ．」と、「種別」と、「テーブル名、ファイル名」と、複数のプログラムの「プログラム名」ごとの「アクセス種別」（ＣＵＲＤ）と、「アクセス頻度（動的、静的）」と、「設定情報」とを対応付けた情報である。
例えば、１行目のデータは、「Ｎｏ．」に“１”が付された「種別」が“テーブル”で名称が“テーブルＴ１”のテーブルが、“プログラムＡ”から参照（“Ｒ”）されていること、稼働ログ１３に基づく動的なアクセス頻度が“Ｘ１１”、ソースコード１１に基づく静的なアクセス回数が“Ｘ１２”であること、テーブルＴ１には「複製不可」が設定されていること、を示している。

【0018】

図３は、本発明の一実施形態による解析結果の一例を示す第２図である。
図３に示す一例では、解析結果の情報は、「Ｎｏ．」と、「種別」と、「テーブル名、ファイル名」と、「項目名」と、複数のプログラムの「プログラム名」ごとの「アクセス種別」および「アクセス頻度（動的、静的）」と、「設定情報」とを対応付けた情報である。
例えば、１行目のデータは、「Ｎｏ．」に“１”が付された「種別」が“テーブル”で名称が“テーブルＴ３”のテーブルの“項目１“が”プログラムＡ“から参照（“Ｒ”）されていること、稼働ログ１３に基づく動的なアクセス頻度が“Ｘ３１“であること、ソースコード１１に基づく静的なアクセス頻度が”Ｘ３２“であることを示している。同様に２行目のデータは、テーブルＴ３の“項目２“が「プログラムＢ」から作成、更新、削除（“ＣＵＤ”）されていること、稼働ログ１３に基づく動的なアクセス頻度が“Ｘ４１“であること、ソースコード１１に基づく静的なアクセス回数が”Ｘ４２“であることを示している。

【0019】

図１に戻る。重み付け部１０５は、既存システム１０のマイクロサービス化にあたって、既存システム１０のデータをどのように分割するかを判断する基準とその重みづけ（優先度）を設定する。データの分割とは、データベースのテーブルや項目を、何れかのマイクロサービスに帰属させることを意味する。
分割部１０８は、重み付け部１０５が設定した基準に則ってデータの分割を行う。

【0020】

ここで、図４～図６を参照して、マイクロサービス化におけるデータの分割の一例について説明する。図４～図６は、それぞれ、データの分割について説明する第１図～第３図である。図４に示す例では、既存システム１０は、プログラム１～８とデータベース１を含んで構成されている。また、プログラム間の矢印や、プログラムからデータベースへの矢印は、呼び出し又はアクセス関係を示す。図４の例では、例えば、プログラム１はプログラム４を呼び出している。また、プログラム４は、プログラム１とプログラム２から呼び出されていて、プログラム６、プログラム７を呼び出し、データベース１にアクセスしている。図４に示すように、既存システム１０は、複数のプログラムが１つ以上のデータベースにアクセスする状態となっている。

【0021】

このようなプログラム群をマイクロサービス化するために、一連の処理フローをマイクロサービスと捉える方法が提案されている。まず、この方法によれば、まず、一連の処理フローの起点となるプログラムを特定する。図４に示す例では、プログラム１、プログラム２、プログラム３は、どこからも呼び出しを受けていないプログラムである。そのため、これらのプログラムは起点となるプログラムである。続いて、全体のプログラムを処理フローごとに分割する。このとき、複数の処理フローで利用されているプログラムが存在する場合には、当該プログラムを利用されている処理フローの分だけ複製する。例えば、図１に示す例の場合、プログラム４は、プログラム１とプログラム２から呼び出されている。プログラム１とプログラム２は別の処理フローであるから、プログラム４は複製され、プログラム１を起点とする処理フローとプログラム２を起点とする処理フローとに分割して割り当てられる。このように割り当てが行われた結果を図５に示す。プログラム４、５、７は、複数の処理フローで呼び出されているので、複製され分割されている。このように処理フローに応じてプログラムを複製、分割することで、プログラムについては、処理フローごとに分割することが可能になる。しかしながら、データベース１は分割されていないため、このままではマイクロサービス化することができない。

【0022】

そこで、図６に示すように、データベースについても処理フローに応じた分割が必要を行う。図６に示す例では、データベース１は、データベース１-１、データベース１-２、データベース１-３、及びデータベース１-４に分割される。このようにデータベースを分割できれば、処理フローごとにマイクロサービス化することが可能になる。図６に示す例では、例えば、プログラム１、プログラム４、プログラム６、及び、データベース１-１からなる処理フローを１つのマイクロサービスとすることができる。同様に、例えば、プログラム２、プログラム４、プログラム７、及び、データベース１-２からなる処理フローを１つのマイクロサービスとすることができる。データベース１-３、１-４についても同様である。

【0023】

図６のようにデータベースを分割するためには、図５におけるデータベース１について、どのデータがどのプログラムに利用されているかを把握しなければならない。本実施形態では、データアクセス解析部１０２がソースコード１１を解析して、この把握を行う。分割部１０８は、データベース１を処理フローごとにデータベース１－１～１－４へ分割する処理を行う。図４～図６に示す例では、抽象的・概念的にデータベース１をデータベース１－１～１－４へ分割するとして説明したが、実際には、同じデータが複数の処理フローからアクセスされていたり、ユーザによって分離不可が設定されたデータが存在したりして、具体的にどのように分割することができるかの判断が難しい。これに対し、本実施形態では、重み付け部１０５が、データベース１をデータベース１－１～１－４へ分割するルールを、分割部１０８へ提供する。分割部１０８は、このルールに則って、自動的にデータベース１をデータベース１－１～１－４へ分割する。重み付け部１０５は、抑止ルール設定部１０６と、分割ルール設定部１０７とを備える。分割ルール設定部１０７は、どのような場合にデータの分割が可能かを示すルールとその優先度を設定する。抑止ルール設定部１０６は、データの分割に際し守るべきルールとその優先度を設定する。重み付け部１０５、抑止ルール設定部１０６、分割ルール設定部１０７については、後に図７～図１２を参照して詳しく説明する。

【0024】

出力部１０９は、分割部１０８による分割結果を出力する。例えば、図６の例では、出力部１０９は、分割後のデータベース１－１に含まれるテーブル及びテーブルの構造をマイクロサービスＡ及びマイクロサービスＡに属するプログラム名と対応付けて出力する。出力部１０９は、データベース１－２～１－４についても同様の出力を行う。

【0025】

（データ分割のルール）
次に図７～図１３を参照してデータの分割ルールについて説明する。
図７は、本発明の一実施形態による分割処理の重み付けの一例を示す図である。図８～図１３は、それぞれ、本発明の一実施形態による分割方法の一例を示す第１図～第５図である。
図７に、分割のルールと、そのカテゴリ及び種別、また、そのルールに基づいて分割を行うことに対する優先度を示す。カテゴリには、業務観点とプログラム観点が存在する。業務観点は、業務解析部１０３による解析結果に基づいてデータベースの分割を検討することを意味し、プログラム観点は、データアクセス解析部１０２による解析結果に基づいてデータベースの分割を検討することを意味する。種別には、抑止ルールと分割ルールが存在する。分割ルールは、データの分割方法を示し、抑止ルールは、データ分割の際に担保すべき条件を示す。優先度は、データを分割するにあたってルール（分割ルール、抑止ルール）を適用する優先度を示す。

【0026】

「Ｎｏ．」に“１”が付された抑止ルールは、同一業務のプログラムからのアクセスは同一とみなし、同一業務に属する異なるプログラムから異なるデータ（テーブルまたはテーブルの項目）にアクセスがある場合でも、それらのプログラムの間でデータの分割を行わないことを意味する。例えば、「プログラムＡ１」が「テーブルＴ１」へアクセスし、「プログラムＡ２」が「テーブルＴ２」へアクセスし、他のプログラムが「テーブルＴ１」、「テーブルＴ２」へアクセスすることが無く、「プログラムＡ１」と「プログラムＡ２」が同一業務のプログラムである場合、「テーブルＴ１」と「テーブルＴ２」を分割すること無く、同じ１つのマイクロサービスへ割り当てる。反対に「プログラムＡ」と「プログラムＢ」が異なる業務のプログラムであって、「プログラムＡ」が「テーブルＸ」へアクセスし、「プログラムＢ」が「テーブルＹ」へアクセスするような場合、「テーブルＸ」と「テーブルＹ」を分割する。例えば、図８に示すように、「プログラムＡ」と「テーブルＸ」を「マイクロサービスＡ」として分類し、「プログラムＢ」と「テーブルＹ」を「マイクロサービスＢ」に分類する。また、図９に示すように「プログラムＡ」が「テーブルＸ」の「項目１」、「項目２」へアクセスし、「プログラムＢ」が「テーブルＸ」の「項目３」、「項目４」、「項目５」へアクセスし、「プログラムＡ」と「プログラムＢ」が異なる業務のプログラムである場合、「テーブルＸ」を、「テーブルＸ」の「項目１」、「項目２」を有する「テーブルＸ－１」と、「テーブルＸ」の「項目３」、「項目４」、「項目５」を有する「テーブルＸ－２」へ分割する。そして、「プログラムＡ」と「テーブルＸ－１」を「マイクロサービスＡ」として分類し、「プログラムＢ」と「テーブルＸ－２」を「マイクロサービスＢ」に分類する。
図７の例では、この抑止ルールに最も高い優先度“１”が設定されている。分割部１０８は、この抑止ルールに基づくデータ分割を、以下に説明する他のルールによる分割よりも重んじて行う。

【0027】

「Ｎｏ．」に“２”が付された分割ルールは、参照アクセス（Ｒ）と更新アクセス（ＣＵＤ）を分離し、更新アクセスがある方のプログラムにデータを分割することを意味する。例えば、図１０に示すように「プログラムＡ」が「テーブルＸ」の「項目３」を参照（Ｒ）し、「プログラムＢ」が「テーブルＸ」の「項目１」、「項目２」を参照（Ｒ）している場合でも、「プログラムＡ」が「テーブルＸ」の「項目１」、「項目２」に対し更新アクセス（ＣＵＤ）を行い、「プログラムＢ」が「テーブルＸ」の「項目３」、「項目４」、「項目５」に対し更新アクセス（ＣＵＤ）を行っていれば、「テーブルＸ」を、更新アクセスがある項目に基づいて、図９の例と同様に分割し、「プログラムＡ」と「テーブルＸ－１」を「マイクロサービスＡ」として分類し、「プログラムＢ」と「テーブルＸ－２」を「マイクロサービスＢ」に分類する。図７の例では、この抑止ルールに２番目に優先度が高い、優先度“２”が設定されている。

【0028】

「Ｎｏ．」に“３”が付された抑止ルールは、複製不可ならば、複製を行わないようにして分割することを定めたルールである。例えば、図１１に示すように「プログラムＡ」が「テーブルＸ」の「項目１」、「項目２」、「項目３」へ参照（Ｒ）し、「プログラムＢ」が「テーブルＸ」の「項目３」、「項目４」、「項目５」へ参照（Ｒ）していて、「テーブルＸ」に複製不可の設定がなされている場合、「項目３」を「プログラムＡ」側へ分離するか、「プログラムＢ」側へ分離するかが不明なため、テーブルＸの分割ができないように思える。複製不可が設定されている場合、同じ項目を複数のテーブルに設けることはできない為、１つのテーブルに格納するようにして分離する。例えば、「テーブルＸ」を、図９の例と同様に分割し、「プログラムＡ」と「テーブルＸ－１」を「マイクロサービスＡ」として分類し、「プログラムＢ」と「テーブルＸ－２」を「マイクロサービスＢ」に分類する。そして、「プログラムＡ」からＡＰＩ（ＲＥＳＴ等）呼び出しを行って「項目３」へアクセスするように構成する。図７の例では、この抑止ルールに対し、３番目に優先度が高い、優先度“３”が設定されている。

【0029】

「Ｎｏ．」に“４”が付された抑止ルールは、分離不可ならば、分離しないテーブルを確保しつつ分割することを定めたルールである。例えば、図１１に示す例の場合、上記のように「項目３」の分離ができないように思える。分離不可が設定されている場合、図１１のように分割することができない。そこで、マスターとなるテーブルを新たに設けることでデータの分離を実現する。具体的には、図１２に示すように「テーブルＸ」を、「テーブルＸ」の「項目１」、「項目２」、「項目３」を有する「テーブルＸ－１」と、「テーブルＸ」の「項目３」、「項目４」、「項目５」を有する「テーブルＸ－２」へ分割し、「プログラムＡ」と「テーブルＸ－１」を「マイクロサービスＡ」として分類し、「プログラムＢ」と「テーブルＸ－２」を「マイクロサービスＢ」に分類する。また、「テーブルＸ」の「項目１」～「項目５」を有する「テーブルＸ－３」を新たに用意し、「テーブルＸ－１」と「テーブルＸ－２」と「テーブルＸ－３」の間で同期をとるように構成する。このような構成であれば、「項目１」～「項目５」が分離されていない「テーブルＸ－３」が存在するため、ユーザによる分離不可の要求が満たされる。図７の例では、この抑止ルールに対し、４番目に優先度が高い、優先度“４”が設定されている。

【0030】

「Ｎｏ．」に“５”が付された分割ルールは、静的な解析に基づいて、アクセス頻度が多い方のプログラムにデータを分割するというルールである。例えば、図１１の例において、業務解析部１０３の解析結果が、プログラムＢのソースコードにおいて「テーブルＸ」の「項目３」へのアクセスを記述している箇所が、プログラムＡのソースコードにおける「テーブルＸ」の「項目３」へのアクセスを記述している箇所よりも多いことを示している場合、図示するように「項目３」をプログラムＢ側へ分割する。図７の例では、この抑止ルールに対し、５番目に優先度が高い、優先度“５”が設定されている。

【0031】

「Ｎｏ．」に“６”が付された分割ルールは、動的な解析に基づいて、アクセス頻度が多い方のプログラムにデータを分割するというルールである。例えば、図１１の例において、業務解析部１０３による稼働ログ１３の解析結果が、プログラムＢによって「テーブルＸ」の「項目３」へアクセスされた回数が、プログラムＡによって「テーブルＸ」の「項目３」へアクセスされた回数よりも多いことを示す場合、図示するように「項目３」をプログラムＢ側へ分離する。

【0032】

抑止ルール設定部１０６は、図７の「Ｎｏ．」が“１”、“３”、“４”のルールと、その優先度を記憶している。分割ルール設定部１０７は、図７の「Ｎｏ．」が“２”、“５”、“６”のルールと、その優先度を記憶している。図７に示す優先度は一例であって、他の優先度が設定できるように構成されていてもよい。重み付け部１０５は、抑止ルール設定部１０６および分割ルール設定部１０７によって設定されたルールとその優先度の情報を、分割部１０８へ出力する。分割部１０８は、重み付け部１０５から提供された優先度に基づいて、データの分割を検討する。

【0033】

（データ分割装置の動作）
次に本実施形態のデータ分割処理の流れについて説明する。
図１３は、本発明の一実施形態のデータ分割処理の一例を示すフローチャートである。

【0034】

まず、データ取得部１０１が、既存システム１０のソースコード１１、データベースの構成情報１２、稼働ログ１３、設定情報１４を取得する（ステップＳ１）。
次にデータアクセス解析部１０２が、ソースコード１１に基づいて、プログラム間の呼び出し、プログラムからデータベースへのアクセスを解析する（ステップＳ２）。例えば、データアクセス解析部１０２は、まず、他のプログラムから呼び出されていない起点プログラムを抽出する。そして、データアクセス解析部１０２は、起点プログラムから呼び出される他のプログラムを再帰的に抽出する。そして、データアクセス解析部１０２は、抽出した各プログラムからアクセスされるデータの情報を抽出する。そして、データアクセス解析部１０２は、抽出した呼び出し先プログラムの呼び出し順及び、抽出したデータへのアクセス順を処理順に整理し、整理した結果を記憶部１０４に記録する。記憶部１０４には、例えば、図５に例示するような処理フローと当該処理フローに含まれるプログラムからアクセスされるテーブルや項目の情報が対応付けて記録される。

【0035】

次に業務解析部１０３は、業務的観点からの解析を行う（ステップＳ３）。例えば、業務解析部１０３は、ソースコード１１に基づいて既存システム１０を構成するプログラムを、同一業務に帰属するプログラム群（同一プロセスで稼働するプログラム群）ごとに分類する。例えば、業務解析部１０３は、ソースコード１１のデータへアクセスするコードが記載された箇所を抽出して、プログラム別、テーブル別、テーブルの項目別に集計し、静的なアクセス頻度（例えば、アクセス命令が記載された箇所の数）を示す情報を算出する。例えば、業務解析部１０３は、稼働ログ１３からデータへのアクセスが実行された履歴が記載された箇所を抽出して、アクセス元のプログラム別、テーブル別、テーブルの項目別に集計し、動的なアクセス頻度を示す情報を算出する。例えば、業務解析部１０３は、設定情報１４を参照して、テーブル別、テーブルの項目別にユーザによる複製不可、分離不可の設定を対応付ける。業務解析部１０３は、業務的な解析結果を、ステップＳ２で記録された情報に紐づけて記憶部１０４に記録する。記憶部１０４には、図２、図３で例示した情報が記録される。

【0036】

以下の処理では、分割部１０８が、重み付け部１０５が設定した分割ルールおよび抑止ルールとその優先度に基づいて、データの分割を行う。前提として、抑止ルール設定部１０６および分割ルール設定部１０７は、図７に例示するルール及び優先度の設定を予め行っている。また、分割部１０８は、図７に例示する設定情報を、重み付け部１０５から取得している。

【0037】

まず、分割部１０８は、優先度“１“が設定された同一業務のプログラムからのアクセスか否かに基づく分割を行う（ステップＳ４）。分割部１０８は、データ取得部１０１が図２、図３で例示した解析結果情報およびプログラムが同一業務に属するかどうかの解析結果に基づいて、同一業務に属するプログラムからのアクセスを分割しないようにしてデータの分割を行う。換言すれば、このルールに基づくと、同一業務に属さないプログラムが、それぞれ異なるデータにアクセスしているような場合については、それらのデータについては分割することができる。例えば、分割部１０８は、このステップＳ４の処理で、図８、図９に例示したような分割を行う。また、図２の例において“プログラムＡ”と”プログラムＢ“が同一業務ではない場合、“テーブルＴ１”と“テーブルＴ３”はそれぞれ、“プログラムＡ”が帰属するマイクロサービスと“プログラムＢ”が帰属するマイクロサービスへ分割することができる。

【0038】

次に分割部１０８は、ステップＳ４の処理で分割できなかったデータに対して、優先度“２”が設定された参照アクセスと更新アクセスに基づく分割ルールによる分割を行う（ステップＳ５）。例えば、分割部１０８は、このステップＳ５の処理で、図１０に例示したような分割を行う。また、図２の例において“テーブルＴ２”を“プログラムＡ“が帰属するマイクロサービスへ分割することができる。

【0039】

次に分割部１０８は、ステップＳ４～Ｓ５の処理で分割できなかったデータに対して、優先度“３”が設定された“複製不可”の設定の有無による分割を行う（ステップＳ６）。例えば、図１１の例で、テーブルＸに“複製不可”が設定されている場合、分割部１０８は、“テーブルＸ”を“テーブルＸ－１”と“テーブルＸ－２”へ分割する。なお、図１１の例で、“項目３”を“テーブルＸ－１”と“テーブルＸ－２”の何れかに振り分けるかは任意であるが、後のステップＳ８、Ｓ９のルールを取り入れてアクセス頻度が多い方へ分割してもよい。どのテーブルにも”複製不可“の設定がなされていなければステップＳ６の処理はスキップする。

【0040】

次に分割部１０８は、ステップＳ４～Ｓ６の処理で分割できなかったデータに対して、優先度“４”が設定された“分離不可”の設定の有無による分割を行う（ステップＳ７）。例えば、図１２の例で、テーブルＸに“分離不可”が設定されている場合、分割部１０８は、“テーブルＸ”を“テーブルＸ－１”と“テーブルＸ－２”へ分割する。また、分割部１０８は、“テーブルＸ－３”を新たに設ける。なお、図１２の例で、“項目３”を“テーブルＸ－１”と“テーブルＸ－２”の何れかに振り分けるかは任意であるが、後のステップＳ８、Ｓ９のルールを取り入れてアクセス頻度が多い方へ分割してもよい。どのテーブルにも“分離不可”の設定がなされていなければステップＳ７の処理はスキップする。

【0041】

次に分割部１０８は、ステップＳ４～Ｓ７の処理で分割できなかったデータに対して、優先度“５”が設定された静的なアクセス頻度の偏りに基づく分割を行う（ステップＳ８）。分割部１０８は、同じテーブルや項目に対して、複数のプログラムからアクセスがある場合、アクセス命令が多く記載されたソースコードを含むプログラム側へそのテーブルや項目を分割する。例えば、図１１の例の場合、“プログラムＡ”のソースコードよりも“プログラムＢ”のソースコードの方が“項目３”へのアクセス命令が多く記述されている場合、分割部１０８は、“項目３”をプログラムＢの“テーブルＸ－２”へ振り分け、“テーブルＸ”を“テーブルＸ－１”と“テーブルＸ－２”へ分割する。

【0042】

次に分割部１０８は、ステップＳ４～Ｓ８の処理で分割できなかったデータに対して、優先度“６”が設定された動的なアクセス頻度の偏りに基づく分割を行う（ステップＳ９）。分割部１０８は、同じテーブルに対して、複数のプログラムからアクセスがある場合、稼働ログ１３にアクセス履歴が多く残されたプログラム側へそのテーブルや項目を分割する。例えば、例えば、図１１の例の場合、稼働ログ１３に“プログラムＡ”よりも“プログラムＢ”の方が“項目３”へのアクセス履歴が多く記述されている場合、分割部１０８は、“項目３”をプログラムＢの“テーブルＸ－２”へ振り分け、“テーブルＸ”を“テーブルＸ－１”と“テーブルＸ－２”へ分割する。

【0043】

次に分割部１０８は、ステップＳ４～Ｓ９の処理で分割できなかったデータに対して、アクセス頻度に偏りが無い場合の分割を行う（ステップＳ１０）。アクセス頻度の観点では、アクセス頻度が単一のデータベースに偏らず、同程度である可能性がある。この場合、項目は各データベースに格納し、同期をとる手法が適切と考えられる。分割部１０８は、同じテーブルに対して、複数のプログラムから大きな偏りが無くアクセスがある場合、図１２に例示するように、共有データを複製して分割後のデータの各々に含めるようにしてデータの分割を行う。

【0044】

分割部１０８は、ステップＳ４～ステップＳ１０の処理で分割した分割後のデータをそのデータが帰属するマイクロサービスと対応付けて記憶部１０４に記録する。出力部１０９は、分割結果を出力する（ステップＳ１１）。例えば、出力部１０９は、図８～図１２に例示するように、マイクロサービスごとに、そのマイクロサービスに分割されたプログラムとテーブル及びテーブルの項目を出力する。

【0045】

図１４は、本発明の一実施形態のアクセス頻度によるデータ分割処理の一例を示すフローチャートである。
図１３のステップＳ９～Ｓ１０では、動的なアクセス頻度に基づく分割を行う。例えば、プログラムＡとプログラムＢが同じデータにアクセスする場合、アクセス頻度にどの程度の差があれば偏りがあると判定するのかが不明である。図１４に、ステップＳ９とステップＳ１０の何れの方法によってデータの分割を行うかを切り替える処理の一例を示す。
まず、担当者が、データ別に閾値をデータ分割装置１００へ入力する。データ取得部１０１は、入力された閾値を取得し、重み付け部１０５へ出力する。重み付け部１０５は、「Ｎｏ．」が“６”の分割ルールにおけるアクセス頻度の多少を判定する閾値に、入力された値を設定する（ステップＳ２１）。次に分割部１０８は、図２、図３に例示する稼働ログ１３の解析結果のうち動的アクセス頻度の値と、入力された閾値とを比較する（ステップＳ２３）。動的なアクセス頻度が閾値を上回る場合（ステップＳ２３；Ｙｅｓ）、分割部１０８は、動的なアクセス頻度が高いプログラムの方へデータを分割する（ステップＳ２４）。つまり、ステップＳ９の処理による分割を行う。動的なアクセス頻度が閾値以下の場合（ステップＳ２３；Ｎｏ）、つまり、アクセス頻度に大きな偏りが無い場合、分割部１０８は、全てのプログラムへデータを分割する（ステップＳ２５）。つまり、ステップＳ１０の処理による分割を行う。

【0046】

なお、同様の処理を図１３のステップＳ８とステップＳ９の処理について行ってもよい。つまり、静的なアクセス頻度の判定する閾値を入力し、その閾値に基づいて、静的なアクセス頻度に偏りがあるか否かの判定を行う（ステップＳ２２）。アクセス頻度が閾値を上回っていれば、ステップＳ８の処理によってデータ分割を行い、アクセス頻度が閾値以下であればステップＳ９の処理によってデータ分割を行う。

【0047】

図１４の処理フローによれば、例えば、閾値を７０％で設定した場合、プログラムＢの“データベースＸ”の“項目３”へのアクセス頻度が７０％を超えるときには、図１１のように、“マイクロサービスＢ”の“データベースＸ－２”に“項目３”を格納する。“項目３”へのアクセス頻度が６０％のときは閾値に達していないので、図１２のように“データベースＸ－１”と“データベースＸ－２”の両方に“項目３”を格納して同期をとる手法を採用する。

【0048】

しかし、閾値が７０％で良いかどうかが不明な場合がある。そこで、閾値の設定を手動ではなく、稼働ログ１３の解析に基づいて自動設定してもよい。既存システム１０の稼働時間が長いほど稼働ログ１３が増えるため、学習のために必要な情報も増える。例えば、既存システム１０のうち、２つのプログラムからアクセスされる項目についての平均的なアクセス頻度の割合が７：３であれば、閾値を７０％に自動設定してもよい。

【0049】

以上説明したように、データ分割装置１００は、既存システム１０を構成するプログラムのソースコード１１と、データの構成情報１２とに基づいて、各プログラムからデータへのアクセス命令を抽出し、各プログラムからアクセスしているテーブルや項目と、そのアクセス種別（“ＣＲＵＤ”）を抽出するデータアクセス解析部１０２（プログラム観点での解析）と、稼働ログ１３等に基づいて、プログラムが構成する業務処理上の特性を考慮した解析を行う業務解析部１０３（業務観点での解析）とを備える。業務処理上の特性には、複製の可否、データ項目間の関連（分離の可否）、同一業務に関するプログラムかどうか、データへのアクセス頻度などが含まれる。また、データ分割装置１００は、プログラム観点と業務観点の両方の観点からデータを分割するルールを設定する重み付け部１０５を備える。これにより、データ分割装置１００は、プログラムと業務の両方の観点から自動的にデータ分割を行い、密結合したデータを強制的に分離し、データベースとマイクロサービスを１対１の関係に対応付け、データを帰属先へ効率的に分割する。また、テーブルの分割・統合を行う際、ソフトウェアの有識者や業務の有識者により手動で重み付けをしている作業を、データ分割装置１００を使うことにより自動化し、作業者の手間を大幅に削減することができる。また、データ分割装置１００は、分割が困難なテーブルについても分割案を提示する。これにより、既存システム１０のマイクロサービス化を効率よく行うことができる。

【0050】

上述した実施形態において、記憶部１０４と他の機能部が同一の処理装置に含まれる例を説明したが、これには限られない。例えば、記憶部１０４を含む記憶装置が、データ分割装置１００の外部に備えられてもよい。

【0051】

また、上述した実施形態において、各機能部（データ取得部１０１、データアクセス解析部１０２、業務解析部１０３、記憶部１０４、重み付け部１０５、抑止ルール設定部１０６、分割ルール設定部１０７、分割部１０８、出力部１０９）が、それぞれ独立の装置として設けられてもよい。

【0052】

図１５は、本発明の一実施形態のデータ分割装置の最小構成を示す図である。
図１５に示すようにデータ分割装置２０は、少なくとも重み付け部２１と、分割部２２とを有している。
重み付け部２１は、複数のプログラムと前記プログラムのうちの少なくとも１つからアクセスされるデータを複数含むシステムに対し、前記複数のプログラムと前記複数のデータとを複数のグループ（マイクロサービス）に分割するにあたり、前記複数のデータを分割するルールと該ルールの重み付け（優先度）を設定する手段である。
分割部２２は、重み付け部２１が設定したルールに基づいて複数のデータを複数のプログラムの何れかに割り当てる手段である。

【0053】

図１６は、本発明の一実施形態のデータ分割装置のハードウェア構成の一例を示す図である。
コンピュータ９００は、ＣＰＵ９０１、主記憶装置９０２、補助記憶装置９０３、入出力インタフェース９０４、通信インタフェース９０５を備える。上述のデータ分割装置１００は、コンピュータ９００に実装される。そして、上述した各機能部（データ取得部１０１、データアクセス解析部１０２、業務解析部１０３、重み付け部１０５、抑止ルール設定部１０６、分割ルール設定部１０７、分割部１０８、出力部１０９）の動作は、プログラムの形式で補助記憶装置９０３に記憶されている。ＣＰＵ９０１は、プログラムを補助記憶装置９０３から読み出して主記憶装置９０２に展開し、当該プログラムに従って上記処理を実行する。また、ＣＰＵ９０１は、プログラムに従って、記憶領域を主記憶装置９０２に確保する。また、ＣＰＵ９０１は、プログラムに従って、処理中のデータを記憶する記憶領域を補助記憶装置９０３に確保する。

【0054】

なお、少なくとも１つの実施形態において、補助記憶装置９０３は、一時的でない有形の媒体の一例である。一時的でない有形の媒体の他の例としては、入出力インタフェース９０４を介して接続される磁気ディスク、光磁気ディスク、ＣＤ－ＲＯＭ、ＤＶＤ－ＲＯＭ、半導体メモリ等が挙げられる。また、このプログラムが通信回線によってコンピュータ９００に配信される場合、配信を受けたコンピュータ９００が当該プログラムを主記憶装置９０２に展開し、上記処理を実行しても良い。また、当該プログラムは、前述した機能の一部を実現するためのものであっても良い。さらに、当該プログラムは、前述した機能を補助記憶装置９０３に既に記憶されている他のプログラムとの組み合わせで実現するもの、いわゆる差分ファイル（差分プログラム）であっても良い。

【0055】

また、上述した実施形態におけるデータ分割装置１００の一部、または全部を、ＬＳＩ（Large Scale integration）等の集積回路として実現してもよい。データ分割装置１００の各機能部は個別にプロセッサ化してもよいし、一部、または全部を集積してプロセッサ化してもよい。また、集積回路化の手法はＬＳＩに限らず専用回路、または汎用プロセッサで実現してもよい。また、半導体技術の進歩によりＬＳＩに代替する集積回路化の技術が出現した場合、当該技術による集積回路を用いてもよい。

【0056】

その他、本発明の趣旨を逸脱しない範囲で、上記した実施の形態における構成要素を周知の構成要素に置き換えることは適宜可能である。また、この発明の技術範囲は上記の実施形態に限られるものではなく、本発明の趣旨を逸脱しない範囲において種々の変更を加えることが可能である。

【符号の説明】

【0057】

１０・・・既存システム
１１・・・ソースコード
１２・・・データの構成情報
１３・・・稼働ログ
１４・・・設定情報
１００・・・データ分割装置
１０１・・・データ取得部
１０２・・・データアクセス解析部
１０３・・・業務解析部
１０４・・・記憶部
１０５・・・重み付け部
１０６・・・抑止ルール設定部
１０７・・・分割ルール設定部
１０８・・・分割部
１０９・・・出力部
９００・・・コンピュータ
９０１・・・ＣＰＵ
９０２・・・主記憶装置
９０３・・・補助記憶装置
９０４・・・入出力インタフェース
９０５・・・通信インタフェース

【図1】