IP Force 特許公報掲載プロジェクト 2022.1.31 β版

ホーム > 特許ランキング > 株式会社日立製作所

知財求人 - 知財ポータルサイト「IP Force」

▶ 株式会社日立製作所の特許一覧

特開2023-9933情報処理システム及び情報処理方法

書誌要約請求の範囲詳細な説明課題実施例実施するための形態図面の説明

目に優しい文字サイズ小中大 PDF Top

< >

1
2
3
4
5
6
7
8
9
10
11
12
13
14
15
16
17
18
19
20
21
22
23
24
25
26

(19)【発行国】日本国特許庁(JP)

(12)【公報種別】公開特許公報(A)

(11)【公開番号】P2023009933

(43)【公開日】2023-01-20

(54)【発明の名称】情報処理システム及び情報処理方法

(51)【国際特許分類】

G06F 9/50 20060101AFI20230113BHJP

【ＦＩ】

G06F9/50 150A

G06F9/50 150E

G06F9/50 150D

【審査請求】未請求

【請求項の数】15

【出願形態】ＯＬ

(21)【出願番号】P 2021113610

(22)【出願日】2021-07-08

(71)【出願人】

【識別番号】000005108

【氏名又は名称】株式会社日立製作所

(74)【代理人】

【識別番号】110002365

【氏名又は名称】特許業務法人サンネクスト国際特許事務所

(72)【発明者】

【氏名】大久保敬子

(72)【発明者】

【氏名】中田侑

(57)【要約】

【課題】
分散環境において、複数の始点から一つ以上の終点までのデータの処理の並列化と、並列処理後のデータの合流を実現すること。
【解決手段】
情報を処理する一つ以上の情報処理装置を備え、前記情報処理装置は、複数の始点から一つ以上の終点までのデータの処理手順を示す処理情報を、前記情報処理装置による並列処理を分割条件として複数に分割する分割機能と、前記分割機能により分割された前記各処理情報の担当を前記情報処理装置のいずれかに一意に決定する決定機能と、前記決定機能により決定された前記情報処理装置における処理を実行する実行機能と、を有する。
【選択図】図１

【特許請求の範囲】

【請求項1】

情報を処理する一つ以上の情報処理装置を備え、
前記情報処理装置は、
複数の始点から一つ以上の終点までのデータの処理手順を示す処理情報を、前記情報処理装置による並列処理を分割条件として複数に分割する分割機能と、
前記分割機能により分割された前記各処理情報の担当を前記情報処理装置のいずれかに一意に決定する決定機能と、
前記決定機能により決定された前記情報処理装置における処理を実行する実行機能と、を有することを特徴とする情報処理システム。

【請求項2】

請求項１に記載の情報処理システムであって、
前記処理情報は、
前記各始点と前記終点との間に配置されて、前記各始点のうち少なくとも一つの始点からのデータを順次処理する複数の処理部と、前記複数の処理部のうちいずれかの処理部間に配置されて、当該処理部間のデータ転送を行う一つ以上の転送部と、を含み、
前記分割機能は、
前記処理情報を分割する場合、前記処理情報を記録した範囲を前記転送部に基づいて複数の領域に分割し、且つ前記転送部を複数の分割転送部に分割し、分割された前記各分割転送部を前記各領域に分けて配分し、前記複数の分割転送部の中の一方の分割転送部を、前記一方の分割転送部と同一の領域に属する転送元の前記処理部に接続し、前記複数の分割転送部の中の他方の分割転送部を、前記他方の分割転送部と同一の領域に属する転送先の前記処理部に接続することを特徴とする情報処理システム。

【請求項3】

請求項２に記載の情報処理システムであって、
前記各領域は、
前記各始点と前記処理部及び前記分割転送部を含み、
前記実行機能は、
前記決定機能により決定された前記各情報処理装置が、前記各領域の処理として、前記各始点と前記処理部の処理を担当する場合、前記始点から前記データを入力すると共に、入力された前記データを処理し、前記決定機能により決定された前記各情報処理装置が、前記各領域の処理として、前記分割転送部の処理を担当する場合、前記決定機能により決定された前記情報処理装置間のデータ転送を実行することを特徴とする情報処理システム。

【請求項4】

請求項２に記載の情報処理システムであって、
前記決定機能は、
前記情報処理装置間の距離の合計を示す距離情報を前記情報処理装置に対応づけて記憶し、記憶した前記距離情報を基に前記情報処理装置間の距離の合計が最小となる一組以上の情報処理装置を特定し、特定した前記各組の情報処理装置を、前記複数の領域のうち前記一方の分割転送部を含む前記領域の担当又は前記他方の分割転送部を含む前記領域の担当として決定することを特徴とする情報処理システム。

【請求項5】

請求項２に記載の情報処理システムであって、
前記情報処理装置に属する前記決定機能のうち一つの決定機能は、
前記情報処理装置の中から一つの情報処理装置を順次選択し、選択した前記一つの情報処理装置を、前記各領域の担当として順次割り当て、前記各領域と前記一つの情報処理装置とを対応づけて領域担当情報に記録し、記録した前記領域担当情報を前記情報処理装置の各々に配布することを特徴とする情報処理システム。

【請求項6】

請求項２に記載の情報処理システムであって、
前記情報処理装置と情報の送受信を行う管理装置を更に備え、
前記管理装置は、
前記各領域を一意に識別する分割識別子と前記各領域を担当する前記各情報処理装置を一意に識別する装置識別子とを対応づけて記録する管理装置用領域担当情報を有し、
前記各情報処理装置に属する前記決定機能は、
前記各領域の中の指定の領域を該決定機能が属する情報処理装置に割り当てる登録要求を前記管理装置に送信し、
前記管理装置は、
前記登録要求を受信した場合、受信した前記登録要求を基に前記管理装置用領域担当情報を参照し、当該参照の結果から前記指定の領域の担当が未登録であることを条件に、前記指定の領域の前記分割識別子と前記要求元の前記装置識別子とを対応づけて前記管理装置用領域担当情報に登録し、前記指定の領域の担当として登録したことを示すレスポンスを前記決定機能に送信し、前記指定の領域の担当が既登録であれば、前記指定の領域の担当として登録不可であることを示すレスポンスを前記決定機能に送信し、
前記レスポンスを受信した前記決定機能は、前記レスポンスが前記指定の領域の担当として登録したことを示すレスポンスであることを条件に、該決定機能が属する情報処理装置の担当領域として前記指定の領域を登録し、
前記指定の領域の担当を一意に決定することを特徴とする情報処理システム。

【請求項7】

請求項２に記載の情報処理システムであって、
前記情報処理装置は異なる複数の拠点にそれぞれ配置され、
前記分割機能は、
前記処理情報の中の前記転送部に、前記情報処理装置の実行拠点を一意に識別する実行拠点識別子が付与されている場合、前記実行拠点識別子を、前記各領域を一意に識別する分割識別子に変換し、変換された前記分割識別子を前記各領域に付与し、
前記決定機能は、
前記各領域に付与された前記分割識別子に基づいて前記各領域の担当となる前記情報処理装置をそれぞれ一意に決定することを特徴とする情報処理システム。

【請求項8】

請求項２に記載の情報処理システムであって、
前記情報処理装置は、
前記決定機能により決定された前記情報処理装置間の通信を制御する通信機能を更に有し、
前記分割機能は、
前記各領域に、前記各領域を一意に識別する分割識別子を付与し、
前記通信機能は、
前記一方の分割転送部が属する前記領域を一意に識別する第１分割識別子を、転送元の領域を示す第１通信情報として前記分割転送部に関連づけて記憶し、前記一方の分割転送部が属する前記領域の処理を担当する前記情報処理装置を一意に識別する第１装置識別子を、前記転送元の前記情報処理装置を示す第２通信情報として前記分割転送部に関連づけて記憶し、前記他方の分割転送部が属する前記領域を一意に識別する第２分割識別子を、転送先の領域を示す第３通信情報として前記分割転送部に関連づけて記憶し、前記他方の分割転送部が属する前記領域の処理を担当する前記情報処理装置を一意に識別する第２装置識別子を、前記転送先の前記情報処理装置を示す第４通信情報として前記分割転送部に関連づけて記憶し、前記情報処理装置間の通信のタイプを、送信又は受信で特定する第５通信情報として前記分割転送部に関連づけて記憶し、
前記実行機能が、前記分割転送部の処理を実行する前の処理として、前記第１通信情報乃至前記第５通信情報を参照して、前記情報処理装置間の通信コネクションを確立することを特徴とする情報処理システム。

【請求項9】

請求項１に記載の情報処理システムであって、
ユーザ端末及び前記情報処理装置と情報の送受信を行う支援装置を更に備え、
前記支援装置は、
前記ユーザ端末から前記処理情報を受信した場合、受信した前記処理情報を記録した範囲であって前記情報処理装置で実行する範囲を、前記情報処理装置による並列処理を分割条件として複数の領域に分割する支援装置用分割機能と、
前記支援装置用分割機能により分割された前記各領域の担当を前記情報処理装置のいずれかに一意に決定する支援装置用決定機能と、
前記支援装置用決定機能により決定された前記情報処理装置の各々に対して前記担当が決定された旨と前記各領域の処理内容を示す情報と前記各領域と該領域を担当する前記情報処理装置の識別子の組み合わせを通知する支援装置用通知機能と、を有することを特徴とする情報処理システム。

【請求項10】

請求項３に記載の情報処理システムであって、
前記情報処理装置は、
前記実行機能の処理として前記始点と前記処理部の処理を分担する実行プロセスと、前記実行機能の処理として前記分割転送部の処理を分担する転送プロセスと、を有することを特徴とする情報処理システム。

【請求項11】

請求項１に記載の情報処理システムであって、
前記処理情報は、
前記各始点と前記終点との間に配置されて、前記各始点のうち少なくとも一つの始点からのデータを順次処理する複数の処理部と、前記複数の処理部のうちいずれかの処理部間に配置された複数の転送候補部と、を含み、
前記情報処理装置は、
前記処理情報に相当するサンプルデータを基に前記複数の処理部のＣＰＵ処理時間、及びデータ出力量の少なくとも一方を算出する分割位置推奨機能を更に有し、
前記分割位置推奨機能は、
前記サンプルデータに属する前記複数の転送候補部の各々を抽出し、抽出した前記各転送候補部から一つ以上の転送候補部の組み合わせを一つ以上作成し、前記転送候補部の組み合わせ毎に、該記転送候補部の組み合わせに属する転送候補部に基づき、前記処理情報を複数の領域に分割し、作成した各組の領域毎に前記ＣＰＵ処理時間の合計値を算出し、前記各転送候補部の組み合わせの中から、算出した前記ＣＰＵ処理時間の合計値、及び転送候補部によるデータ転送量の少なくとも一方に基づき前記転送部の組み合わせを選択し、選択した前記転送部の組み合わせに属する前記各転送候補部を、前記処理部間でデータ転送を行う転送部として前記処理情報を更新し、更新された前記処理情報を前記分割機能に出力し、
前記分割機能は、
前記更新された前記処理情報を記録した範囲を前記転送部に基づいて複数の領域に分割し、且つ前記転送部を複数の分割転送部に分割し、分割された前記複数の分割転送部の各々を前記各領域に配分することを特徴とする情報処理システム。

【請求項12】

情報を処理する一つ以上の情報処理装置を備えた情報処理システムにおける方法であって、
前記情報処理装置が、複数の始点から一つ以上の終点までのデータの処理手順を示す処理情報を、前記情報処理装置による並列処理を分割条件として複数に分割する分割ステップと、
前記情報処理装置が、前記分割ステップにより分割された前記各処理情報の担当を前記情報処理装置のいずれかに一意に決定する決定ステップと、
前記情報処理装置が、前記決定ステップにより決定された前記情報処理装置における処理を実行する実行ステップと、を有することを特徴とする情報処理方法。

【請求項13】

請求項１２に記載の情報処理方法であって、
前記処理情報は、
前記各始点と前記終点との間に配置されて、前記各始点のうち少なくとも一つの始点からのデータを順次処理する複数の処理部と、前記複数の処理部のうちいずれかの処理部間に配置されて、当該処理部間のデータ転送を行う一つ以上の転送部と、を含み、
前記情報処理装置は、
前記分割ステップでは、前記処理情報を分割する場合、前記処理情報を記録した範囲を前記転送部に基づいて複数の領域に分割し、且つ前記転送部を複数の分割転送部に分割し、分割された前記複数の分割転送部の各々を前記各領域に分けて配分し、前記複数の分割転送部の中の一方の分割転送部を、前記一方の分割転送部と同一の領域に属する転送元の前記処理部に接続し、前記複数の分割転送部の中の他方の分割転送部を、前記他方の分割転送部と同一の領域に属する転送先の前記処理部に接続することを特徴とする情報処理方法。

【請求項14】

請求項１３に記載の情報処理方法であって、
前記各領域は、
前記各始点と前記処理部及び前記分割転送部を含み、
前記情報処理装置は、
前記実行ステップでは、前記決定ステップにより決定された前記各情報処理装置が、前記各領域の処理として前記各始点と前記処理部の処理を担当する場合、前記各始点から前記データを入力すると共に、入力された前記データを処理し、前記決定ステップにより決定された前記各情報処理装置が、前記各領域の処理として前記分割転送部の処理を担当する場合、前記決定機能により決定された前記情報処理装置間のデータ転送を実行することを特徴とする情報処理方法。

【請求項15】

請求項１３に記載の情報処理方法であって、
前記情報処理装置は、
前記決定ステップでは、前記情報処理装置間の距離の合計を示す距離情報を前記情報処理装置に対応づけて記憶し、記憶した前記距離情報を基に前記情報処理装置間の距離の合計が最小となる一組以上の情報処理装置を特定し、特定した前記各組の情報処理装置を、前記複数の領域のうち前記一方の分割転送部を含む前記領域の担当又は前記他方の分割転送部を含む前記領域の担当として決定することを特徴とする情報処理方法。

【発明の詳細な説明】

【技術分野】

【0001】

本発明は、分散環境における情報処理システム及び情報処理方法に関する。

【背景技術】

【0002】

データ駆動型の意思決定が重視され、複数のデータを掛け合わせた分析が必要になっている。また、ＩｏＴ（ＩｎｔｅｒｎｅｔｏｆＴｈｉｎｇｓ）の普及により、データは大容量化している。大量データを高速に処理する方法としては、ＭａｐＲｅｄｕｃｅという方法が一般に知られている。ＭａｐＲｅｄｕｃｅでは、非特許文献１に示されるようにデータを分割してｗｏｒｋｅｒと呼ばれる複数の情報処理装置に分配し、各ｗｏｒｋｅｒが割り当てられたデータに対して処理を実行し、実行結果を集約する。ＭａｐＲｅｄｕｃｅでは、同じ処理を並列分散して実行することにより処理を高速化する。また、特許文献１では、リクエストを受け付けた情報処理装置が、フロー内の一連の処理を処理間の依存性に基づき並列処理が可能な単位に分割し、各処理を実行する情報処理装置を指定し、各情報処理装置に処理をコピーして並列に実行する方法が開示されている。

【先行技術文献】

【特許文献】

【0003】

【特許文献1】特開２０１７－１６４９４号公報

【非特許文献】

【0004】

【非特許文献1】J. Dean and S. Ghemawat, "MapReduce: Simplified Data Processingon Large Cluster", OSDI, 2004.

【発明の概要】

【発明が解決しようとする課題】

【0005】

入力処理部分である始点（即ち、入力）から、出力処理部分である終点（即ち、出力）までの一連の処理を実行する処理プログラム（以下、データフローと称する。）のうち、例えば、複数の始点を持つデータフローの場合、複数の始点が一つの情報処理装置上にあると、そこがボトルネックになりうる。非特許文献１、及び特許文献１では、入力データに対する処理を複数の情報処理装置で分割して実行しているが、異なるデータに対する異なる処理の並列化と各処理の合流については考慮していない。各処理を合流するためには、合流先となる情報処理装置、合流箇所、合流処理におけるデータの形式等の情報が必要であり、データフローの実行前に、合流を行う情報処理装置間でこれらの情報を共有する必要がある。しかし、従来技術では、これらの情報共有に必要な手段が提示されておらず、並列処理後のデータの合流を実現することができない。

【0006】

本発明は、このような背景に鑑みてなされたもので、その目的は、分散環境において、複数の始点から一つ以上の終点までのデータの処理の並列化と、並列処理後のデータの合流を実現することにある。

【課題を解決するための手段】

【0007】

前記目的を達成するために、本発明は、情報を処理する一つ以上の情報処理装置を備え、前記情報処理装置は、複数の始点から一つ以上の終点までのデータの処理手順を示す処理情報を、前記情報処理装置による並列処理を分割条件として複数に分割する分割機能と、前記分割機能により分割された前記各処理情報の担当を前記情報処理装置のいずれかに一意に決定する決定機能と、前記決定機能により決定された前記情報処理装置における処理を実行する実行機能と、を有することを特徴とする。

【発明の効果】

【0008】

本発明によれば、分散環境において、複数の始点から一つ以上の終点までのデータの処理の並列化と、並列処理後のデータの合流を実現することができ、結果として、データ処理の高速化が可能になる。

【図面の簡単な説明】

【0009】

【図1】実施例１に係る情報処理システムの概略構成の一例を示す概略構成図である。

【図2】実施例１に係るデータフローの一例を示す構成図である。

【図3】実施例１に係る情報処理装置のハードウェア構成例を示す構成図である。

【図4】実施例１に係る支援装置の機能とデータの構成例を示す構成図である。

【図5】実施例１に係る管理装置の機能とデータの構成例を示す構成図である。

【図6】実施例１に係るデータフロー処理装置の機能とデータの構成例を示す構成図である。

【図7】実施例１に係るデータ記憶装置の機能とデータの構成例を示す構成図である。

【図8】実施例１に係る領域担当情報の構成例を示す構成図である。

【図9】実施例１に係る転送ステップ情報の構成例を示す構成図である。

【図10】実施例１に係るデータフローの分散実行シーケンスの一例を示すシーケンス図である。

【図11】実施例１に係るデータフローの分割例を示す構成図である。

【図12】実施例１に係る担当領域決定処理のシーケンスの一例を示すシーケンス図である。

【図13】実施例１に係る通信コネクション確立処理の一例を示すフローチャートである。

【図14】実施例１に係る通信コネクション設定シーケンスの一例を示すシーケンス図である。

【図15】実施例１に係るデータフロー処理装置間での中間データの転送シーケンスの一例を示すシーケンス図である。

【図16】実施例２に係る情報処理システムの構成の一例を示す構成図である。

【図17】実施例２に係るデータフローの分割例を示す構成図である。

【図18】実施例３に係る情報処理システムの構成の一例を示す構成図である。

【図19】実施例４に係るデータフロー処理装置の構成の一例を示す構成図である。

【図20】実施例４に係る転送ステップ情報の構成の一例を示す構成図である。

【図21】実施例４に係るコネクション情報の構成の一例を示す構成図である。

【図22】実施例４に係る通信コネクション設定シーケンスの一例を示すシーケンス図である。

【図23】実施例４に係る中間データの転送シーケンスの一例を示すシーケンス図である。

【図24】実施例５に係るデータフローに転送ステップ挿入位置の候補が挿入された一例を示す構成図である。

【図25】実施例５に係る分割位置推奨機能の処理の一例を示すフローチャートである。

【図26】実施例５に係るデータフローに転送ステップ挿入位置が提示された一例を示す構成図である。

【発明を実施するための形態】

【0010】

以下、図面に基づいて、本発明の実施の形態を説明する。

【実施例0011】

図１～図１５を用いて実施例１を説明する。本実施例では、複数の情報処理装置を有する情報処理システム１０１において、複数の始点を持つデータフローを実行する例を説明する。

【0012】

図１は、実施例１に係る情報処理システムの概略構成の一例を示す概略構成図である。図１において、情報処理システム１０１は、例えば、支援装置１０３、管理装置１０４、複数のデータフロー処理装置１０５を含み、ネットワーク１０７を介して、ユーザ端末１０２、及び複数のデータ格納装置１０６と接続される。ユーザ端末１０２、支援装置１０３、管理装置１０４、各データフロー処理装置１０５、及び各データ格納装置１０６は、通信ネットワーク１０７を介して相互に接続されている。情報処理システム１０１は、ユーザ端末１０２から受け取ったデータフローの情報を各データフロー処理装置１０５に配布して処理を実行する。

【0013】

通信ネットワーク１０７は、例えば、ＬＡＮ（ＬｏｃａｌＡｒｅａＮｅｔｗｏｒｋ）、ＷＡＮ（ＷｉｄｅＡｒｅａＮｅｔｗｏｒｋ）、インターネット、イントラネット、専用線、携帯電話網、光ファイバ等の、有線又は無線の通信基盤により構成される。

【0014】

ユーザ端末１０２は、ＧＵＩ（ＧｒａｐｈｉｃａｌＵｓｅｒＩｎｔｅｒｆａｃｅ）を備えたデータフローの設計機能を持つ情報処理装置で構成され、ユーザの操作に基づいて、データの入力から出力までの一連の処理を記載したデータフローの情報を生成し、生成したデータフローの情報をネットワーク１０７に送信する。

【0015】

支援装置１０３は、ユーザ端末１０２から送信されたデータフローの情報を、ネットワーク１０７を介して受信した場合、受信した情報の登録を受け付け、受け付けたデータフローの情報を各データフロー処理装置１０５に配布する。

【0016】

管理装置１０４は、各データフロー処理装置１０５によりデータフローが分割された場合、分割された各データフローの処理を実行するデータフロー処理装置１０５を割り当てる際に使用される。本割り当て処理については、後述する。

【0017】

各データフロー処理装置１０５は、支援装置１０３から配布されたデータフローの情報を、ネットワーク１０７を介して受信した場合、データフロー内に記録された転送ステップを基に、複数の領域に分割し、領域毎に該領域の実行を担当するデータフロー処理装置１０５を決定し、各領域と各領域を担当するデータフロー処理装置１０５との組合せを示す情報（即ち、領域担当情報）を、各データフロー処理装置１０５で共有する情報として保存する。その後、各データフロー処理装置１０５は、それぞれが担当する領域に属する処理を実行する。なお、領域とはデータフローの情報を記録した範囲であって、一つのデータフロー処理装置１０５で実行する範囲と定義する。

【0018】

各データ格納装置１０６は、例えば一般的なデータベースであり、各種のデータを記録し、各種情報処理装置からの読み出し要求に応じてデータの読み出しを行う。なお、各データ格納装置１０６は、データの格納機能、及びデータの読み出し機能を備えていればよく、必ずしもデータベースとは限らない。また、情報システム１０１に含まれていても構わない。

【0019】

ユーザ端末１０２、支援装置１０３、管理装置１０４、各データフロー処理装置１０５、及び各データ格納装置１０６は、情報処理装置（例えば、サーバ）であり、例えばクラウドシステムにおけるクラウドサーバやコンテナのように仮想的な情報処理資源を用いて構成されていてもよいし、物理的な情報処理装置であってもよい。また、これらの装置の数は図に示す個数に限定されるものではなく、一つであってもよいし、二つ以上であっても構わない。また、ある装置が、別の装置の機能を兼ね備えていても構わない。

【0020】

図２は、実施例１に係るデータフローの一例を示す構成図である。図２において、ユーザ端末１０２は、ユーザの操作に基づいて、データの入力から出力までの一連のデータの処理を記載したデータフロー２０１の情報を作成する。データフロー２０１は、ユーザの操作を基にユーザ端末１０２で生成される情報であって、データを入力する始点となるデータ入力部として、第１データ入力（即ち、「データ入力１」）２１１と、第２データ入力（即ち、「データ入力２」）２１２、及び第３データ入力（即ち、「データ入力３」）２１３を備え、データの統計処理、データの匿名化処理などのデータ処理を順次実行する処理部として、第１処理（即ち、「処理１」）２２１～第５処理（即ち、「処理５」）２２５を備え、データを出力する終点となるデータ出力部として、データ出力２３１を備え、データフロー処理装置１０５の切り替え箇所であって、いずれかの処理部間に配置されて、処理部間のデータ転送を行う転送部としての第１転送ステップ（即ち、「転送１」）２４１、第２転送ステップ（即ち、「転送２」）２４２を備える。この際、データフロー２０１の情報は、複数の始点から一つの終点までのデータの処理手順を示す処理情報として構成される。

【0021】

第１転送ステップ（即ち、「転送１」）２４１は、第１処理（即ち、「処理１」）２２１と第３処理（即ち、「処理３」）２２３とを結ぶ転送ステップとして、第２転送ステップ（即ち、「転送２」）２４２は、第５処理（即ち、「処理５」）２２５と第４処理（即ち、「処理４」）２２４とを結ぶ転送ステップとして、それぞれユーザの操作により挿入される。

【0022】

データフロー２０１において、第１データ入力（即ち、「データ入力１」）２１１に入力されたデータは、第１処理（即ち、「処理１」）２２１で統計処理等された後、第１転送ステップ（即ち、「転送１」）２４１を介して、第３処理（即ち、「処理３」）２２３に転送される。第２データ入力（即ち、「データ入力２」）２１２に入力されたデータは、第２処理（即ち、「処理２」）２２２で統計処理等された後、第３処理（即ち、「処理３」）２２３に出力される。第３処理（即ち、「処理３」）２２３では、第１転送ステップ（即ち、「転送１」）２４１から転送されたデータと第２処理（即ち、「処理２」）２２２から入力されたデータとを纏めて統計処理等した後、第４処理（即ち、「処理４」）２２４に出力する。第３データ入力（即ち、「データ入力３」）２１３に入力されたデータは、第５処理（即ち、「処理５」）２２５で統計処理等された後、第２転送ステップ（即ち、「転送２」）２４２を介して、第４処理（即ち、「処理４」）２２４に転送される。第４処理（即ち、「処理４」）２２４では、第２転送ステップ（即ち、「転送２」）２４２から転送されたデータと第３処理（即ち、「処理３」）２２３から入力されたデータとを纏めて統計処理等した後、データ出力２３１に出力する。

【0023】

図３は、実施例１に係る情報処理装置のハードウェア構成例を示す構成図である。図３において、情報処理装置３００は、ユーザ端末１０２、支援装置１０３、管理装置１０４、データフロー実行装置１０５、及びデータ格納装置１０６の各装置として用いることができる。この際、情報処理装置３００は、例えばプロセッサ３０１、主記憶装置３０２、補助記憶装置３０３、入力装置３０４、出力装置３０５、及び通信装置３０６を備える。これらは図示しないバス等の通信手段を介して互いに通信可能に接続されている。

【0024】

プロセッサ３０１は、例えば、ＣＰＵ（ＣｅｎｔｒａｌＰｒｏｃｅｓｓｉｎｇＵｎｉｔ）やＭＰＵ（ＭｉｃｒｏＰｒｏｃｅｓｓｉｎｇＵｎｉｔ）を用いて構成される。プロセッサ３０１が、主記憶装置３０２に格納されているコンピュータプログラムを読み出して実行することにより、ユーザ端末１０２、支援装置１０３、管理装置１０４、データフロー処理装置１０５、及びデータ格納装置１０６の様々な機能が実現される。

【0025】

主記憶装置３０２は、コンピュータプログラムやデータを記憶する装置であり、例えば、ＲＯＭ（ＲｅａｄＯｎｌｙＭｅｍｏｒｙ）、ＲＡＭ（ＲａｎｄｏｍＡｃｃｅｓｓＭｅｍｏｒｙ）、及び不揮発性半導体メモリ等である。

【0026】

補助記憶装置３０３は、例えば、ハードディスクドライブ、ＳＳＤ（ＳｏｌｉｄＳｔａｔｅＤｒｉｖｅ）、光学式記憶媒体（即ち、ＣＤ（ＣｏｍｐａｃｔＤｉｓｃ）、及びＤＶＤ（ＤｉｇｉｔａｌＶｅｒｓａｔｉｌｅＤｉｓｃ）等）、ストレージシステム、ＩＣカード（ＩｎｔｅｇｒａｔｅｄＣｉｒｃｕｉｔＣａｒｄ）、ＳＤメモリカード、等の記録媒体の読取／書込装置、及びクラウドサーバの記憶領域等である。補助記憶装置３０３に格納されているコンピュータプログラムやデータは、主記憶装置３０２に随時読み込まれる。

【0027】

入力装置３０４は、例えば、キーボード、マウス、タッチパネル、カードリーダ、音声入力デバイス等である。出力装置３０５は、ユーザに処理経過や処理結果等の各種情報を提供するユーザインタフェースである。出力装置３０５は、例えば、画面表示装置（即ち、液晶モニタ、ＬＣＤ（ＬｉｑｕｉｄＣｒｙｓｔａｌＤｉｓｐｌａｙ）、又はグラフィックカード等）、音声出力装置（即ち、スピーカ等）、又は印字装置等である。なお、例えば、情報処理装置３００が、通信装置３０６を介して他の装置との間で情報を入出力してもよい。

【0028】

通信装置３０６は、ＬＡＮやインターネット等の通信手段を介した他の装置との間の通信を実現する有線方式又は無線方式の通信インタフェースである。通信装置３０６は、例えば、ＮＩＣ（ＮｅｔｗｏｒｋＩｎｔｅｒｆａｃｅＣａｒｄ）、無線通信モジュール、ＵＳＢ（ＵｎｉｖｅｒｓａｌＳｅｒｉａｌＢｕｓ）モジュール、又はシリアル通信モジュール等である。

【0029】

図４は、実施例１に係る支援装置の機能とデータの構成例を示す構成図である。図４において、支援装置１０３は、補助記憶装置３０３に格納されたデータフロー登録機能４０１、及びデータフロー配布機能４０２を備えており、リソース情報４０３、及びデータフロー情報４０４を補助記憶装置３０３に記録する。リソース情報４０３は、情報処理システム１０１を構成する各データフロー処理装置１０５の情報（例えば、ＩＰ（ＩｎｔｅｒｎｅｔＰｒｏｔｏｃｏｌ）アドレスや、位置情報など）を記録する。データフロー登録機能４０１は、ユーザ端末１０２から送信されたデータフローの情報を受信した場合、受信したデータフローの情報をデータフロー情報４０４に登録する。データフロー配布機能４０２は、リソース情報４０３とデータフロー情報４０４に登録された全ての情報、又は一部の情報を各データフロー処理装置１０５に配布する。

【0030】

図５は、実施例１に係る管理装置の機能とデータの構成例を示す構成図である。図５において、管理装置１０４は、補助記憶装置３０３に格納された応答機能５０１を備えており、領域担当情報５０２を補助記憶装置３０３に記録する。応答機能５０１は、各データフロー処理装置１０５から領域ＩＤ（Ｉｄｅｎｔｉｆｉｃａｔｉｏｎ）の情報を含む担当登録要求を受信した場合、受信した担当登録要求に添付された領域ＩＤが、領域担当情報（即ち、管理装置用領域担当情報）５０２に登録済みか否かを確認し、受信した領域ＩＤが未登録であれば、該領域ＩＤと担当登録要求の送付元であるデータフロー処理装置１０５のＩＰアドレスを領域担当情報５０２に記録し、登録ＯＫのレスポンスを担当登録要求の送付元であるデータフロー処理装置１０５に返信する。また、応答機能５０１は、受信した領域ＩＤが登録済みであれば、登録ＮＧのレスポンスを担当登録要求の送付元であるデータフロー処理装置１０５に返信する。また、応答機能５０１は、各データフロー処理装置１０５から領域担当情報の要求を受信した場合、領域担当情報５０２に記録してある領域ＩＤと領域ＩＤを担当するデータフロー処理装置１０５のＩＰアドレスを返信する。

【0031】

図６は、実施例１に係るデータフロー処理装置の機能とデータの構成例を示す構成図である。図６において、データフロー処理装置１０５は、補助記憶装置３０３に格納された機能として、データフロー受信機能６０１、データフロー分割機能６０２、転送ステップ前処理機能６０３、データフロー実行機能６０４、及び担当領域調整機能６０５を備えており、データフロー情報６０６、転送ステップ情報６０７、領域担当情報６０８を補助記憶装置３０３に記録する。データフロー受信機能６０１は、支援装置１０３から送信されたデータフローの情報を受信した場合、受信したデータフローの情報をデータフロー情報６０６に記録する。データフロー分割機能６０２は、データフロー受信機能６０１が受信したデータフローの情報（即ち、処理情報）をデータフロー処理装置１０５による並列処理を分割条件として複数に分割する。この際、データフロー分割機能６０２は、データフローの情報（即ち、処理情報）を複数に分割する場合、例えば、処理情報を記録した範囲を複数の領域に分割し、分割後の各領域にＩＤを付与してデータフロー情報６０６に記録する分割機能又は分割部として構成される。担当領域調整機能６０５は、管理装置１０４と連携して、分割後の各領域を担当するデータフロー処理装置１０５を決定し、決定した内容を領域担当情報６０８に記録する決定機能又は決定部として構成される。転送ステップ前処理機能６０３は、データフロー処理装置間の通信を制御する機能であって、例えば、分割後の各領域を担当するデータフロー処理装置間でデータを転送する前に、通信コネクションを確立し、確立した通信コネクションの情報を転送ステップ情報６０７に記録する通信機能又は通信部として構成される。データフロー実行機能６０４は、担当する領域のデータフローを実行する実行機能又は実行部として構成される。

【0032】

図７は、実施例１に係るデータ記憶装置の機能とデータの構成例を示す構成図である。図７において、データ格納装置１０６は、補助記憶装置３０３に格納された機能として、データ記録機能７０１、及びデータ読み出し機能７０２を備えており、データ格納部或いはデータ格納エリアとしてのデータ７０３に各種のデータを記録する。データ記録機能７０１、及びデータ読み出し機能７０２は、各データフロー処理装置１０５の要求に応じて、データ７０３に対してデータの記録や読み出しを行う。なお、データ格納装置１０６は、ネットワーク１０７、または図示しないネットワークを介して、図示しない情報処理装置からのデータの記録や読み出しの要求を受けて、これを実行してもよい。データ記憶装置１０６は、情報処理システム１０１に含まれていても構わないし、含まれていなくても構わない。

【0033】

図８は、実施例１に係る領域担当情報の構成例を示す構成図である。支援装置１０３、管理装置１０４、及びデータフロー処理装置１０５が記録する各データは、例えばテーブル形式で記録される。この際、領域担当情報５０２は、図８に示すように、領域ＩＤ８０１、及びデータフロー処理装置ＩＰアドレス８０２の各項目を有するレコードを格納する。領域ＩＤ８０１には、分割後の各データフローに付与された領域の識別子（例えば「Ａｒｅａ－１」）が記録される。データフロー処理装置ＩＰアドレス８０２には、領域ＩＤ８０１に格納された領域の処理を担当するデータフロー処理装置１０５のＩＰアドレス（例えば「ａａａ」）が記録される。なお、領域担当情報６０８も同様の構成をとる。

【0034】

図９は、実施例１に係る転送ステップ情報の構成例を示す構成図である。図９において、転送ステップ情報６０７は、転送ステップＩＤ９０１、転送元領域ＩＤ９０２、転送元ＩＰアドレス９０３、転送先領域ＩＤ９０４、転送先ＩＰアドレス９０５、転送ステップのタイプ９０６、接続先とのコネクションＩＤ９０７、及び中間データの形式９０８の各項目を有するレコードを格納する。転送ステップＩＤ９０１は、データフローに含まれる転送ステップの識別情報（例えば「転送１」）を格納する。転送元領域ＩＤ９０２は、転送ステップの前段までの処理が含まれる領域の識別情報（例えば「Ａｒｅａ－１」）を記録する。転送元ＩＰアドレス９０３は、転送元領域ＩＤ９０２に格納された領域を担当するデータフロー処理装置１０５のＩＰアドレス（例えば「ａａａ」）を記録する。転送先領域ＩＤ９０４は、転送ステップの後段からの処理が含まれる領域の識別情報（例えば「Ａｒｅａ－２」）を記録する。転送先ＩＰアドレス９０５は、転送先領域ＩＤ９０４に記録された領域を担当するデータフロー処理装置１０５のＩＰアドレス（例えば「ｂｂｂ」）を記録する。転送ステップのタイプ９０６は、本転送ステップ情報６０７を保持するデータフロー処理装置１０５が担当する領域のデータフローにおける転送ステップの役割が送信であるか、受信であるかを記録する。接続先とのコネクションＩＤ９０７は、接続先のデータフロー処理装置１０５との間に確立した通信コネクションの識別情報（例えば「Ｓ０１」）を記録する。中間データの形式９０８は、データフロー処理装置間で転送されるデータの形式を記録する。

【0035】

図１０は、実施例１に係るデータフローの分散実行シーケンスの一例を示すシーケンス図である。図１０において、ユーザがユーザ端末１０２を操作してデータフローを作成すると、作成されたデータフローの情報がユーザ端末１０２から支援装置１０３に送信される（Ｓ１００１）。支援装置１０３のデータフロー登録機能４０１は、受信したデータフローの情報をデータフロー情報４０４に登録する（Ｓ１００２）。支援装置１０３のデータフロー配布機能４０２は、データフロー情報４０４に登録されたデータフローの情報を、情報処理システム１０１内の各データフロー処理装置１０５に配布する（Ｓ１００３）。なお、データフロー登録機能４０１がデータフローの登録及び実行を指示するためのポータルサイトを有する場合、ユーザは、ユーザ端末１０２を介してポータルサイトにアクセスして、データフローの登録を行い、データフローの実行を指示してもよい。

【0036】

分散して配置されて分散環境にある各データフロー処理装置１０５は、受信したデータフローの情報をデータフロー情報６０６に記録する（Ｓ１００４）。次に、各データフロー処理装置１０５は、受信したデータフローの情報を複数の領域に分割し（Ｓ１００５）、管理装置１０４と連携して、各領域を担当するデータフロー処理装置１０５を決定する（Ｓ１００６）。この後、各領域を担当するデータフロー処理装置１０５は、データ転送先となるデータフロー処理装置１０５との間に通信コネクションを確立する（Ｓ１００７）。その後、各領域を担当するデータフロー処理装置１０５は、担当領域のデータフローの処理を実行する（Ｓ１００８）。

【0037】

図１１は、実施例１に係るデータフローの分割例を示す構成図である。図１１において、データフロー２０１は、図２に示すデータフロー２０１と同様に、複数の始点から一つの終点までのデータの処理手順を示す処理情報として構成される。

【0038】

この際、データフロー処理装置１０５のデータフロー分割機能６０２は、データフロー２０１を、第１転送ステップ（即ち、「転送１」）２４１～第２転送ステップ（即ち、「転送２」）２４２を基に、３つの領域２５１～２５３に分割し、各領域２５１～２５３にシーケンシャルな番号を含む領域ＩＤ（例えば「Ａｒｅａ－１」～「Ａｒｅａ－３」）を付与する。また、データフロー分割機能６０２は、転送部としての第１転送ステップ（即ち、「転送１」）２４１を、第１転送ステップ（即ち、「転送１」）２４１－１、２４１－２に分割し、転送部としての第２転送ステップ（即ち、「転送２」）２４２を、第２転送ステップ２４２－１、２４２－２に分割し、第１転送ステップ（即ち、「転送１」）２４１－１、２４１－２と第２転送ステップ２４２－１、２４２－２をそれぞれ分割転送部として管理する。

【0039】

この際、データフロー分割機能６０２は、第１処理（即ち、「処理１」）２２１と第１転送ステップ（即ち、「転送１」）２４１－１とを接続し、第１転送ステップ（即ち、「転送１」）２４１－２と第３処理（即ち、「処理３」）２２３とを接続し、第４処理（即ち、「処理４」）２２４と第２転送ステップ（即ち、「転送２」）２４２－２とを接続し、第５処理（即ち、「処理５」）２２５と第２転送ステップ（即ち、「転送２」）２４２－１とを接続する。

【0040】

分割後のデータフロー２０２における領域２５１は、第１データ入力（即ち、「データ入力１」）２１１、第１処理（即ち、「処理１」）２２１、及び第１転送ステップ（即ち、「転送１」）２４１－１で構成される。領域２５２は、第１転送ステップ２４１－２、第２データ入力（即ち、「データ入力２」）２１２、第２処理（即ち、「処理２」）２２２～第４処理（即ち、「処理４」）２２４、データ出力２３１、及び第２転送ステップ（即ち、「転送２」）２４２－２で構成される。領域２５３は、第３データ入力（即ち、「データ入力３」）２１３、第５処理（即ち、「処理５」）２２５、及び第２転送ステップ（即ち、「転送２」）２４２－１で構成される。これにより、各領域２５１～２５３には、データフロー２０２の情報が正確に配分される。

【0041】

第１転送ステップ２４１－１、２４２－２は、「転送１」よりも前段となる「処理１」の処理結果（以下、中間データと呼ぶ）を、「転送１」よりも後段となる「処理３」に転送する処理であり、第２転送ステップ２４２－１、２４２－２は、「転送２」よりも前段となる「処理５」の処理結果である中間データを、「転送２」よりも後段となる「処理４」に転送する処理である。このため、領域２５１を担当するデータフロー処理装置１０５と領域２５２を担当するデータフロー処理装置１０５との間に通信コネクションが確立した場合、両者の間で、第１転送ステップ２４１－１、２４２－２の処理として、中間データの転送が実行される。また、領域２５２を担当するデータフロー処理装置１０５と領域２５３を担当するデータフロー処理装置１０５との間に通信コネクションが確立した場合、両者の間で、第２転送ステップ２４２－１、２４２－２の処理として、中間データの転送が実行される。

【0042】

この際、第１転送ステップ（「転送１」）２４１－１は、中間データの転送元の領域２５１（即ち、Ａｒｅａ－１）に属する転送ステップとなり、第１転送ステップ（「転送１」）２４１－２は、中間データの転送先の領域２５２（即ち、Ａｒｅａ－２）に属する転送ステップとなる。また、第１転送ステップ（「転送１」）２４１－１、及び２４１－２には、中間データの転送元を示す領域の情報として「Ｆｒｏｍ：Ａｒｅａ－１」が付与され、中間データの転送先を示す領域の情報として「Ｔｏ：Ａｒｅａ－２」が付与される。

【0043】

第２転送ステップ（「転送２」）２４２－１は、中間データの転送元の領域２５３（即ち、Ａｒｅａ－３）に属する転送ステップとなり、第２転送ステップ（「転送２」）２４２－２は、中間データの転送先の領域２５２（即ち、Ａｒｅａ－２）に属する転送ステップとなる。また、第２転送ステップ（「転送２」）２４２－１、及び２４２－２には、中間データの転送元を示す領域の情報として「Ｆｒｏｍ：Ａｒｅａ－３」が付与され、中間データの転送先の領域を示す情報として「Ｔｏ：Ａｒｅａ－２」が付与される。これらの転送先領域ＩＤと転送ステップとの関係は、データフロー分割機能６０２によって管理される。

【0044】

各データフロー処理装置１０５のデータフロー分割機能６０２は、同じ分割プログラムを用いて、データフローの分割処理（図１０のステップＳ１００５）を行う。これにより、全てのデータフロー処理装置１０５は、同じ分割結果を得る。なお、本実施例において、データフローの分割処理（図１０のステップＳ１００５）は、各データフロー処理装置１０５において実施されるが、支援装置１０３がデータフロー分割機能６０２を有し、支援装置１０３においてデータフローを分割した上で、分割後のデータフローの情報を各データフロー処理装置１０５に配布しても構わない。

【0045】

この際、例えば、ユーザ端末１０２及び各情報処理装置１０５と情報の送受信を行う支援装置１０３は、ユーザ端末１０２から処理情報を受信した場合、受信した処理情報を記録した範囲であってデータフロー処理装置１０５で実行する範囲を、データフロー処理装置１０５による並列処理を分割条件として複数の領域に分割する支援装置用分割機能と、支援装置用分割機能により分割された各領域の処理担当をデータフロー処理装置１０５のいずれかに一意に決定する支援装置用決定機能と、支援装置用決定機能により決定されたデータフロー処理装置１０５の各々に対して、処理担当が決定された旨と各領域の処理内容を示す情報と各領域を担当するデータフロー処理装置１０５の情報を通知（即ち、送信）する支援装置用通知機能と、を備えることができる。これにより、各データフロー処理装置１０５は、支援装置１０３からの通知を基に各領域の処理を実行することができる。

【0046】

図１２は、実施例１に係る担当領域決定処理のシーケンスの一例を示すシーケンス図である。図１２において、データフロー処理装置１０５の担当領域調整機能６０５は、担当領域の調整を行うに際して、リーダ選出アルゴリズムを用いることができる。担当領域調整機能６０５は、担当希望領域として、例えば、３つの領域２５１～２５３の中の一つの領域を担当希望領域として選択し（Ｓ１２０１）、担当希望領域の領域ＩＤと要求送信元（即ち、データフロー処理装置１０５）のＩＰアドレスを含む登録要求（即ち、担当登録要求）を管理装置１０４に送信する（Ｓ１２０２）。

【0047】

登録要求を受信した管理装置１０４の応答機能５０１は、受信した登録要求を基に領域担当情報５０２を参照し、受信した登録要求に添付された領域ＩＤが既に担当領域情報５０２に登録されているか否かを確認し（Ｓ１２０３）、受信した領域ＩＤの担当が未登録であれば（Ｓ１２０３においてＮｏ）、レスポンスをＯＫとして（Ｓ１２０４）、受信した領域ＩＤ、及び要求送信元のデータフロー処理装置１０５のＩＰアドレスを領域担当情報５０２に記録（即ち、登録）する（Ｓ１２０６）。一方、応答機能５０１は、受信したＩＤが登録済みであれば（Ｓ１２０３においてＹｅｓ）、レスポンスをＮＧとする（Ｓ１２０５）。この後、応答機能５０１は、データフロー処理装置１０５にレスポンスの情報を送信する（Ｓ１２０７）。

【0048】

レスポンスを受信した担当領域調整機能６０５は、受信したレスポンスがＯＫであるか否かを判定し（Ｓ１２０８）、受信したレスポンスがＯＫであれば（Ｓ１２０８においてＹｅｓ）、管理装置１０４に担当領域情報要求を送信する（Ｓ１２１２）。担当領域情報要求を受信した管理装置１０４の応答機能５０１は、担当領域情報５０２に登録済みの領域ＩＤと該領域を担当するデータフロー処理装置１０５のＩＰアドレスとの組をデータフロー処理装置１０５に送信する（Ｓ１２１３）。

【0049】

次に、データフロー処理装置１０５の担当領域調整機能６０５は、担当が未決定の領域の有無を判定し（Ｓ１２１４）、未決定の領域があれば（Ｓ１２１４でＹｅｓ）、所定時間待機した後に（Ｓ１２１５）、担当領域情報要求を再度管理装置１０４に送信し（Ｓ１２１２）、未決定の領域がなければ（Ｓ１２１４においてＮｏ）、各領域ＩＤと各領域を担当するデータフロー処理装置１０５のＩＰアドレスとを紐づけて領域担当情報６０８に記録する（Ｓ１２１６）。

【0050】

一方、担当領域調整機能６０５は、ステップＳ１２０８の判定結果がＮｏのときは、管理装置１０４に担当領域情報の問合せを行い（Ｓ１２０９）、担当未決定領域の有無を確認し（Ｓ１２１０）、未決定の領域があれば（Ｓ１２１０においてＹｅｓ）、担当が未決定の領域の中から担当希望領域を一つ選択し、Ｓ１２０１以降の処理を繰り返す。担当領域調整機能６０５は、ステップＳ１２１０において、担当が未決定の領域がなければ（Ｓ１２１０においてＮｏ）、待機状態に入る（Ｓ１２１１）。なお、担当領域調整機能６０５は、ステップＳ１２０９では、ステップＳ１２１２、及びステップＳ１２１３と同様に、管理装置１０４と情報の送受信を行う。

【0051】

本処理シーケンスにより、各領域の担当となるデータフロー処理装置１０５が一意に決定され、各データフロー処理装置１０５は、自身が担当する領域を決定するとともに、各領域と、各領域のデータフローを実行するデータフロー処理装置１０５との組合せの情報を領域担当情報６０８から得ることができる。

【0052】

なお、ステップＳ１２１２からステップＳ１２１５では、処理の実行回数を記録し、実行回数があらかじめ設定した閾値を超えた時にはエラーとして、その後、処理を終了してもよい。また、各データフロー処理装置１０５の中の一つをリーダとして選出し（例えば、ＩＰアドレスが一番小さいデータフロー処理装置１０５をリーダとする）、リーダとなったデータフロー処理装置１０５の担当領域調整機能６０５が各データフロー処理装置１０５の中から一つのデータフロー処理装置１０５を順次選択し、選択した一つのデータフロー処理装置１０５を、各領域の担当として順次割り当て、各領域と一つのデータフロー処理装置１０５とを対応づけて領域担当情報６０８に記録し、記録した領域担当情報６０８を各データフロー処理装置１０５に配布することができる。これにより、リーダとなる担当領域調整機能６０５は、各領域を担当するデータフロー処理装置１０５を一意に決定することができる。また、各データフロー処理装置１０５は、領域担当情報６０８を各装置共有の情報として保持することができる。

【0053】

図１３は、実施例１に係る通信コネクション確立処理の一例を示すフローチャートである。データフローが分割された後のデータフロー処理装置間でのデータの転送は、通信コネクションを介して行うことが可能である。

【0054】

図１３において、データフロー処理装置１０５の転送ステップ前処理機能６０３は、例えば、図１１に示すデータフロー２０２の自身が担当する領域の中から、全ての転送ステップ（即ち、転送ステップ２４１－１～２４２－２）を抽出し（Ｓ１３０１）、抽出した全ての転送ステップ２４１－１～２４２－２について、転送ステップＩＤ９０１、転送元領域ＩＤ９０２、転送元ＩＰアドレス９０３、転送先領域９０４、転送先ＩＰアドレス９０５、及び転送ステップのタイプ９０６を転送ステップ情報６０７に記録する（Ｓ１３０２）。Ａｒｅａ－１を担当するデータフロー処理装置１０５では、転送ステップ２４１－１、Ａｒｅａ－２を担当するデータフロー処理装置１０５では、転送ステップ２４１－２、及び２４２－２、Ａｒｅａ－３を担当するデータフロー処理装置１０５では、転送ステップ２４２－１が抽出され、記録される。

【0055】

この際、転送ステップ前処理機能６０３は、転送ステップ２４１－１を抽出した場合、図８に示す領域担当情報６０８を参照し、図９に示す転送ステップ情報６０７のうち、転送ステップＩＤ９０１に、転送ステップ２４１－１を特定する情報として「転送１」を記録し、転送元領域ＩＤ９０２に、転送ステップ２４１－１が属する領域２５１を一意に識別する第１分割識別子（即ち、転送元の領域を示す第１通信情報）として「Ａｒｅａ－１」を記録し、転送元ＩＰアドレス９０３に、転送ステップ２４１－１が属する領域２５１の処理を担当するデータフロー処理装置１０５を一意に識別する第１装置識別子（即ち、転送元のデータフロー処理装置を示す第２通信情報）として「ａａａ」を記録し、転送先領域９０４に、転送ステップ２４１－２が属する領域２５２を一意に識別する第２分割識別子（即ち、転送先の領域を示す第３通信情報）として「Ａｒｅａ－２」を記録し、転送先ＩＰアドレス９０５に、転送ステップ２４１－２が属する領域２５２の処理を担当するデータフロー処理装置１０５を一意に識別する第２装置識別子（即ち、転送先のデータフロー処理装置を示す第４通信情報）として「ｂｂｂ」を記録し、転送ステップのタイプ９０６に、データフロー処理装置間の通信タイプ（即ち、通信タイプを、送信又は受信で特定する第５通信情報）として「送信」を記録する。転送元ＩＰアドレス９０３、及び転送先ＩＰアドレス９０５は、領域担当情報６０８を基に、それぞれ、転送元領域ＩＤ９０２、及び転送先領域ＩＤ９０４から特定可能である。

【0056】

次に、転送ステップ前処理機能６０３は、転送ステップ情報６０７の中から、転送ステップＩＤ９０１で特定される転送ステップ（例えば「転送１」）を一つ選択し（Ｓ１３０３）、選択した転送ステップについて、後述する通信コネクション設定処理を行う（Ｓ１３０４）。この後、転送ステップ前処理機能６０３は、ステップＳ１３０３からＳ１３０５を繰り返し、全ての転送ステップ２４１－１～２４２－２に対して通信コネクション設定処理（Ｓ１３０４）を実施する。

【0057】

全ての転送ステップ２４１－１～２４２－２に対して通信コネクション設定処理を実施すると、転送ステップ前処理機能６０３は、再処理実行カウンタｉを０に設定し（Ｓ１３０６）、再実行リストに登録されたデータの有無を確認する（Ｓ１３０７）。再実行リストは、通信コネクション設定が失敗した転送ステップの情報が記録されたリストであり、後述の通信コネクション設定処理中に作成され、転送ステップのＩＤが記録される。この際、転送ステップ前処理機能６０３は、再実行リストにデータがなければ（Ｓ１３０７においてＮｏ）、処理を終了し（Ｓ１３０８）、再実行リストにデータが存在する場合（Ｓ１３０７においてＹｅｓ）、再実行リストを一時リストにコピーした後に、再実行リストのデータを消去して、再実行リストをクリアにする（Ｓ１３０９）。

【0058】

その後、転送ステップ前処理機能６０３は、再処理実行カウンタｉを一つ加算して（Ｓ１３１０）、あらかじめ設定した閾値と再処理実行カウンタｉの値とを比較し（Ｓ１３１１）、ｉ＜閾値を満たすときは（Ｓ１３１１においてＹｅｓ）、所定時間待機した後（Ｓ１３１３）、一時リストから転送ステップを一つ選択し（Ｓ１３１４）、選択した転送ステップについて通信コネクション設定処理の再実行を行う（Ｓ１３１５）。この後、転送ステップ前処理機能６０３は、一時リスト内の全転送ステップに対して通信コネクション設定処理を実施したか否かを判定し（Ｓ１３１６）、全て実施していない場合（Ｓ１３１６においてｎｏ）、ステップＳ１３１４からＳ１３１６の処理を繰り返し、全て実施した場合（Ｓ１３１６においてＹｅｓ）、ステップＳ１３０７に戻り、再実行リストのデータの有無を確認する。

【0059】

転送ステップ前処理機能６０３は、ステップＳ１３１１で、再処理実行カウンタｉの値が、ｉ＜閾値の条件を満たさないときは、エラーとして、このルーチンでの処理を終了する（Ｓ１３１２）。

【0060】

図１４は、実施例１に係る通信コネクション設定シーケンスの一例を示すシーケンス図である。この通信コネクション設定シーケンスは、図１３の通信コネクション設定処理（Ｓ１３０４）の具体的内容の一例であり、通信コネクション設定処理（Ｓ１３０４）は、転送ステップ毎に実行される。図１４において、転送ステップ前処理機能６０３は、転送ステップのタイプが、送信であるか受信であるかを確認し（Ｓ１４０１）、転送タイプが受信の時は、処理を終了し（Ｓ１４０９）、転送ステップのタイプが送信であれば、接続先（即ち転送先）のデータフロー処理装置１０５に、転送ステップＩＤと送信元のデータフロー処理装置のＩＰアドレスを含むコネクション接続要求を送信する（Ｓ１４０２）。

【0061】

接続先のデータフロー処理装置１０５では、コネクション接続要求を受信すると、転送ステップ前処理機能６０３が、転送ステップＩＤ、及びコネクション接続要求の送信元のデータフロー処理装置１０５のＩＰアドレスを基に、転送ステップ情報６０７を参照し、転送ステップ情報６０７に対応する情報として、コネクション情報（転送ステップＩＤ、転送元ＩＰアドレス、転送ステップのタイプ）があるか否かを確認する（Ｓ１４０３）。対応する情報とは、即ち、転送ステップＩＤ９０１、及び転送元ＩＰアドレス９０３が、それぞれ受信した転送ステップＩＤ、及び送信元ＩＰアドレスと一致し、転送ステップのタイプが受信である情報である。接続先の転送ステップ前処理機能６０３は、転送ステップ情報６０７に、対応する情報が存在しなければ、転送元のデータフロー処理装置１０５に接続ＮＧの情報を返信し（Ｓ１４０４）、その後、このルーチンでの処理を終了し（Ｓ１４０５）、転送ステップ情報６０７に、対応する情報が存在すれば、転送元のデータフロー処理装置１０５に接続ＯＫの情報を送信する（Ｓ１４０６）。

【0062】

コネクション接続要求送信元の転送ステップ前処理機能６０３は、接続先のデータフロー処理装置１０５から接続ＯＫの情報を受信した場合（Ｓ１４０７でＹｅｓ）、接続先のデータフロー処理装置１０５との間に、通信コネクションを確立し（Ｓ１４１０）、接続先とのコネクションＩＤ９０７を転送ステップ情報６０７に記録する（Ｓ１４１１）。転送ステップ情報６０７の接続先とのコネクションＩＤ９０７への記録は、接続先のデータフロー処理装置１０５においても実行される（Ｓ１４１２）。コネクション接続要求送信元の転送ステップ前処理機能６０３は、接続がＮＧの時は（Ｓ１４０７でＮｏ）、再実行リストに転送ステップＩＤを追加し（Ｓ１４０８）、その後、このルーチンでの処理を終了する（Ｓ１４０９）。

【0063】

ステップＳ１４０８において、再実行リストに追加された転送ステップに対しては、図１３に示すステップＳ１３０７からステップＳ１３１６の処理により、通信コネクション設定処理の再実行が行われる。通信コネクション設定処理の再実行（図１３のＳ１３１５）は、図１４のステップＳ１４０２以降の処理である。

【0064】

図１０のステップＳ１００４からＳ１００７の処理により、データフローの並列処理、及び合流に必要なデータフロー処理装置１０５の情報が各データフロー処理装置１０５間で共有され、中間データの転送に必要な通信コネクションが確立される。これらの処理を行った後、すなわち、各データフロー処理装置間の通信コネクションが確立した後、各データフロー処理装置１０５は、それぞれ担当領域のデータフローの処理を実行する（図１０のステップＳ１００８）。

【0065】

図１５は、実施例１に係るデータフロー処理装置間での中間データの転送シーケンスの一例を示すシーケンス図である。中間データの転送は、データフロー処理装置１０５のデータフロー実行機能６０４がデータフローを実行する際に、転送ステップにおいて実行される。

【0066】

中間データの転送においては、中間データの転送先となるデータフロー処理装置１０５が、中間データの形式を理解する必要がある。そこで、中間データの転送元のデータフロー処理装置１０５は、中間データの初回の転送の前に、中間データの形式を転送先のデータフロー処理装置１０５に通知する。

【0067】

図１５において、データ転送元のデータフロー処理装置１０５のデータフロー実行機能６０４は、例えば、転送ステップ２４１－１において、前段の処理から中間データを受信すると（Ｓ１５０１）、初回の転送か否かを判定し（Ｓ１５０２）、初回の転送の場合は（Ｓ１５０２でＹｅｓ）、中間データのデータ形式を示す情報をデータ転送先のデータフロー処理装置１０５に送信する（Ｓ１５０３）。テータ転送先のデータフロー処理装置１０５のデータフロー実行機能６０４は、中間データのデータ形式を示す情報を転送ステップ情報６０７に記録する（Ｓ１５０４）。

【0068】

データ転送元のデータフロー処理装置１０５は、中間データを送信用の形式に変換（例えば、シリアライズ）し（Ｓ１５０５）、変換された送信用形式のデータをデータ転送先のデータフロー処理装置１０５に送信する（Ｓ１５０６）。データ転送先のデータフロー処理装置１０５は、送信用形式のデータを受信した場合、受信した送信用形式のデータを中間データのデータ形式に変換し（Ｓ１５０７）、変換された中間データを後段の処理へデータを送信する（Ｓ１５０８）。

【0069】

なお、中間データのデータ形式を示す情報の送信、及び中間データの送信は、通信コネクション確立処理によって転送ステップ毎に確立された各通信コネクションを用いて行われる。また、データ転送を行う転送ステップ以外の処理は、一つのデータフロー処理装置１０５内で行われるデータフローの実行と同じである。

【0070】

また、データフローの分割（図１０のステップＳ１００５）、担当領域決定（図１０のステップＳ１００６）、通信コネクション確立（図１０のステップＳ１００７）のいずれかの処理でエラーが発生したときは、各処理を担当する機能が支援装置１０３にエラーを通知し、支援装置１０３がユーザ端末１０２にエラーを通知してもよい。

【0071】

本実施例において、データフロー実行機能６０４は、各データフロー処理装置１０５が、各領域の処理として、データ入力部（即ち、「データ入力１」２１１～「データ入力３」２１３）と処理部（即ち、「処理１」２２１～「処理５」２２５）の処理を担当する場合、始点からデータを入力すると共に、入力されたデータの処理（例えば、統計処理や匿名化処理）を実行し、各データフロー処理装置１０５が、各領域の処理として、分割転送部（即ち、「転送１」２４１－１、２４１－２、「転送２」２４２－１、及び２４２－２）の処理を担当する場合、情報処理装置間のデータ転送を実行する。これにより、各領域における処理を各データフロー処理装置１０５によって確実に実行することができる。

【0072】

また、本実施例において、中間データの初回の転送の前にデータ形式の通知（即ち、データ形式の情報の転送）を行ったが、データ形式の通知は、このタイミングに限定されず、通信コネクション設立時に行ってもよい。また、中間データの形式が中間データ毎に異なるケースにおいては、中間データの転送前に毎回中間データの形式を通知してもよい。また、中間データを転送する場合、必ずしも先にデータ形式を通知する必要はなく、例えば、ＪＳＯＮ形式を使うことにより、事前にデータ形式を通知しなくても、転送先のデータフロー処理装置１０５でデータの型を理解することができる。

【0073】

また、本実施例においては、中間データ転送用の通信コネクションを確立したが、必ずしも通信コネクションを確立する必要はなく、コネクションレス通信によって中間データを転送しても構わない。

【0074】

また、中間データの転送は、例えばデータが複数のレコードを持つデータである場合、１レコードずつ行ってもよいし、数レコードずつまとめて行ってもよいし、全てをまとめて一括で行ってもよい。中間データの転送方法については、例えばデータフロー作成時にユーザが指定できてもよいし、デフォルトの方法が指定してあっても構わない。また、同一データフロー内に含まれる転送ステップで、転送の方法が異なっても構わない。

【0075】

また、本実施では一つのデータフロー処理装置１０５は一つの領域を担当する例を示したが、一つのデータフロー処理装置１０５が複数の領域を担当しても構わない。この場合、データフロー処理装置１０５は、各領域のデータフローを個別に実行してもよいし、複数の担当領域のデータフローを一つのデータフローにまとめて実行しても構わない。

【0076】

また、本実施例では、図１２に示すように、自律分散的に各データフロー処理装置１０５が担当領域を決定したが、例えば、支援装置１０３が、データフローの分割を行い、分割された各領域を担当するデータフロー処理装置１０５を決定しても構わない。この際、支援装置１０３は、例えば、各領域をランダムに各データフロー処理装置１０５に割り当ててもよい。また、各データフロー処理装置１０５又は支援装置１０３は、データフロー処理装置１０５が互いに離れた場所に設置されている時には、各転送ステップについて、送信元のデータフロー処理装置１０５と送信先のデータフロー処理装置１０５との組合せを複数作成し、送信元のデータフロー処理装置１０５と送信先のデータフロー処理装置１０５とのネットワーク的な距離が近くなるように、各領域を担当するデータフロー処理装置１０５を割り当ててもよい。転送ステップが二つ以上存在する場合は、前記のネットワーク的な距離の合計を考え、これが小さくなるように、各領域を担当するデータフロー処理装置１０５を割り当ててもよい。

【0077】

例えば、各データフロー処理装置１０５の担当領域調整機能６０５は、領域数分のデータフロー処理装置１０５を含む、データフロー処理装置１０５の組み合わせを所定数作成する。作成した各組み合わせにおいて、各組み合わせに含まれるデータフロー処理装置１０５をデータフローの各領域に一意に割り当て、データフロー処理装置間の距離の合計を示す距離情報を各組み合わせに対応づけて記憶し、記憶した距離情報を基にデータフロー処理装置間の距離の合計が最小となる組み合わせを特定し、特定した組み合わせに含まれるデータフロー処理装置１０５を、複数の領域のうち転送元の転送ステップ（即ち、分割転送部）２４１－１、又は２４２－１を含む領域２５１、又は２５３の処理担当、又は転送先の転送ステップ（即ち、分割転送部）２４１－２、及び２４２－２を含む領域２５２の処理担当として決定することができる。これにより、距離の合計が最小となるデータフロー処理装置間でデータ転送を行うことができ、データ転送に要する時間を最小にすることが可能になる。例えば、機械学習により、データフロー処理装置１０５の距離の合計が最小となるように、データフロー処理装置１０５の最適な組み合わせを選択することも可能である。

【0078】

また、本実施例において、各データを示す一例としてテーブル表記を用いたが、これは各データの記録方法をテーブル型に制限するものではなく、データの記録は、リスト、又はチェーン等、様々な方法を用いてもよい。また、記録される要素は、例えば数字、記号、又は数式等、様々な形で表現されてもよい。

【0079】

また、支援装置１０３、管理装置１０４、データフロー処理装置１０５、及びデータ格納装置１０６は、それぞれ仮想マシンやコンテナなどであっても構わない。例えば、支援装置１０３が、仮想マシンやコンテナの起動を行う機能を備え、ユーザ端末１０２からデータフローの登録要求を受けたことを契機に、データフロー処理装置１０５として仮想マシンやコンテナを起動しても構わない。例えば、データフロー処理装置１０５は、データフロー実行機能６０４の処理として、データ入力部（即ち、「データ入力１」２１１～「データ入力３」２１３）と処理部（即ち、「処理１」２２１～「処理５」２２５）の処理を分担する実行用コンテナと、分割転送部（即ち、「転送１」２４１－１、２４１－２、「転送２」２４２－１、２４２－２）の処理を分担する転送用コンテナと、を備えることができる。これにより、データフロー処理装置１０５の一部を仮想化することができる。

【0080】

このように構成される本実施例によれば、分散環境において、複数の始点から一つ以上の終点までのデータの処理の並列化と、並列処理後のデータの合流を実現することができ、結果として、データ処理の高速化が可能になる。

【0081】

各領域のデータフローを実行するデータフロー処理装置１０５をユーザが明示的に指定することなく、ユーザの操作によって挿入された転送ステップの情報を基に、データフローの処理の並列化を簡易に実現可能である。

【実施例0082】

本実施例では、国や地域、複数の企業、同一企業内での複数の部署等、二つ以上の拠点を跨って実行されるデータフローの例を示す。管理元の異なるデータを扱うケースにおいては、拠点間でデータを移転するためには、各国や地域の法令や、企業のセキュリティポリシーなどを遵守する必要がある。

【0083】

図１６は、実施例２に係る情報処理システムの構成の一例を示す構成図である。図１６において、情報処理システム１６０１は、支援装置１０３と、二つ以上の拠点１６０２～１６０３を含み、各拠点１６０２～１６０３は、管理装置１０４、複数のデータフロー処理装置１０５、及び複数のデータ格納装置１０６を含む。ユーザ端末１０２、支援装置１０３、及び各拠点１６０２～１６０３は、ネットワーク１０７を介して互いに接続される。この際、拠点１６０２は、拠点名が「拠点Ａ」として管理され、拠点１６０３は、拠点名が、「拠点Ｂ」として管理される。なお、本実施例、及び以降の実施例では、各装置１０２～１０６は実施例１と同様の機能を備えているので、以下、実施例１と異なる点を中心に説明する。

【0084】

図１７は、実施例２に係るデータフローの分割例を示す構成図である。図１７において、データフロー１７０１は、ユーザの操作を基にユーザ端末１０２で生成される情報であって、データを入力する始点として、第１データ入力（即ち、「データ入力１」）２１１と、第２データ入力（即ち、データ入力２）２１２、及び第３データ入力（即ち、「データ入１０５力３」）２１３を備え、データの統計処理、データの匿名化処理などを実行する処理として、第１処理（即ち、「処理１」）２２１～第５処理（即ち、「処理５」）２２５を備え、データフロー処理装置１０５の切り替え箇所となる転送ステップとして、第１転送ステップ（即ち、「転送１」）２６１と第２転送ステップ（即ち、「転送２」）２６２を備え、データを出力する終点として、データ出力２３１を備える。

【0085】

この際、ユーザは、実施例１と同様に並列処理を実行するためのデータフロー処理装置１０５の切り替え箇所に転送ステップを挿入すると共に拠点１６０２、及び１６０３の切り替え箇所に転送ステップを挿入する。更に、各転送ステップに、転送ステップ以前の処理の実行拠点、及び転送ステップ以降の処理の実行拠点を指定する。例えば、ユーザは、データフロー処理装置１０５の切り替え箇所に、転送ステップとして第１転送ステップ（即ち、「転送１」）２６１を挿入する。この第１転送ステップ（即ち、「転送１」）２６１には、転送ステップ以前の処理も、以降の処理も拠点Ａで実行することを指示する情報（即ち、実行拠点識別子）として、「Ｆｒｏｍ：拠点Ａ」、「Ｔｏ：拠点Ａ」が付与される。また、ユーザは、拠点１６０２、及び１６０３の切り替え箇所に、転送ステップとして第２転送ステップ（即ち、「転送２」）２６２を挿入する。この第２転送ステップ（即ち、「転送２」）２６２には、転送ステップ以前の処理は拠点Ｂで、以降の処理は拠点Ａで実行することを指示する情報（即ち、実行拠点識別子）として、「Ｆｒｏｍ：拠点Ｂ」、「Ｔｏ：拠点Ａ」が付与される。実行拠点の指示は、例えば、ユーザがＧＵＩを用いてデータフローを設計する際に、各転送ステップ２６１、又は２６２をダブルクリックすることにより、設定可能なプロパティとして表示される。

【0086】

データフロー１７０１の情報を入力したデータフロー分割機能６０２は、データフロー１７０１を、第１転送ステップ（即ち、「転送１」）２６１と第２転送ステップ（即ち、「転送２」）２６２を基に、３つの領域２７１～２７３に分割し、各領域２７１～２７３にシーケンシャルな番号を含む領域ＩＤ（例えば「Ａ１」、「Ａ２」、「Ｂ１」）を付与する。また、データフロー分割機能６０２は、転送部である第１転送ステップ（「転送１」）２６１を、分割転送部である第１転送ステップ（即ち、「転送１」）２６１－１、２６１－２に分割し、転送部である第２転送ステップ（即ち、「転送２」）２６２を、分割転送部である第２転送ステップ（「即ち、転送２」）２６２－１、２６２－２に分割する。この場合、分割後のデータフロー１７０２の領域２７１は、第１データ入力（即ち、「データ入力１」）２１１、第１処理（即ち、「処理１」）２２１、及び第１転送ステップ（即ち、「転送１」）２６１－１で構成され、領域２７２は、第１転送ステップ（即ち、「転送１」）２６１－２、第２処理（即ち、「処理２」）２２１～第４処理（即ち、「処理４」）２２４、データ出力２３１、及び第２転送ステップ（即ち、「転送２」）２６２－２で構成され、領域２７３は、第３データ入力（即ち、「データ入力３」）２１３、第５処理（即ち、「処理５」）２２５、及び第２転送ステップ（即ち、「転送２」）２６２－１で構成される。

【0087】

データフロー分割機能６０２は、分割後の各領域２７１～２７３に領域ＩＤを付与する。この際、データフロー分割機能６０２は、各転送ステップ２６１、及び２６２に指示された処理実行場所の情報を、拠点名から領域ＩＤに変換する。領域ＩＤは、拠点名と拠点内でのシーケンスな番号の組合せで構成される。例えば、第１転送ステップ（即ち、「転送１」）２６１－１、及び２６１－２には、中間データの転送元を示す領域の情報として、「Ｆｒｏｍ：Ａ１」が付与され、中間データの転送先を示す領域の情報として、「Ｔｏ：Ａ２」が付与される。また、第２転送ステップ（即ち、「転送２」）２６２－１、及び２６２－２には、中間データの転送元を示す領域の情報として、「Ｆｒｏｍ：Ｂ１」が付与され、中間データの転送先を示す領域の情報として、「Ｔｏ：Ａ２」が付与される。

【0088】

各データフロー処理装置１０５は、例えば環境変数として、自身が属する拠点名を保持する。担当領域決定シーケンスは実施例１と同様である。但し、担当領域調整機能６０５は、担当希望領域を選択する際に、自身が属する拠点での実行を指示された領域（即ち、本実施例においては、領域ＩＤが、自身の拠点名を含む領域）を一つ選択する。また、管理装置１０４は、自身が属する拠点内の領域担当情報６０８を他拠点の管理装置１０４に定期的に送信して、互いに情報を共有する。更に管理装置１０４は、データフロー処理装置１０５からの担当領域情報要求（即ち、図１２のステップＳ１２１２）に対して、自身が属する拠点の領域担当情報６０８と共に、他の管理装置１０４から得た領域担当情報５０２をデータフロー処理装置１０５に送信する（即ち、図１２のステップＳ１２１３）。

【0089】

以上により、各データフロー処理装置１０５は、二つ以上の異なる拠点１６０２～１６０３で実行されるデータフローの各領域についても、各領域を担当するデータフロー処理装置１０５の情報を入手可能であり、拠点を跨るデータフローの実行が可能である。この際、各データフロー処理装置１０５が、異なる複数の拠点１６０２～１６０３にそれぞれ配置される場合、各データフロー処理装置１０５のデータフロー分割機能６０２は、データフロー１７０１の転送ステップ２６１、及び２６２に、データフロー処理装置１０５の実行拠点を一意に識別する実行拠点識別子（例えば、Ｆｒｏｍ：拠点Ａ）が付与されている場合、実行拠点識別子を、各領域を一意に識別する分割識別子（例えば、領域ＩＤ＝Ａ１）に変換し、変換された分割識別子を各領域に付与する。各データフロー処理装置１０５の担当領域調整機能６０５は、各領域に付与された分割識別子に基づいて各領域の処理担当となるデータフロー処理装置１０５をそれぞれ一意に決定する。

【0090】

本実施例によれば、各データフロー処理装置１０５が、異なる複数の拠点１６０２～１６０３にそれぞれ配置される場合、拠点を跨るデータフローの実行が可能である。また、本実施例によれば、データフローの各処理の実行拠点の指定が可能であり、一つのデータフローの各入力データに対して、匿名化処理を実行し、各入力データを移転可能なデータに変換すること、例えば、転送できない項目を削除したデータに変換することができ、変換されたデータを集約して処理することが可能になる。また、各拠点のリソース構成を知らなくても、データフローの並列処理を指定することが可能であり、データフローの高速処理が簡易に実現可能である。ユーザが転送ステップを挿入して拠点を指定することにより、データフローの高速処理が可能になる。

【0091】

なお、管理装置１０４は、必ずしも各拠点１６０２～１６０３に存在する必要はなく、情報処理システム１６０１に一つでもよいし、一部の拠点（例えば、拠点１６０２）に存在してもよい。また、異なる複数の拠点１６０２～１６０３は、各拠点が地理的な異なる拠点であってもよいし、各拠点が論理的に異なる拠点、例えば、地理的には同一であっても、企業における部署などを示す拠点であってもよい。また、本実施例では拠点が二つの例を示したが、拠点の数は２より多くても構わない。

【実施例0092】

本実施例では、拠点が階層構造を取るケースにおける、処理の実行拠点の指示方法、及び担当領域の調整方法を示す。

【0093】

図１８は、実施例３に係る情報処理システムの構成の一例を示す構成図である。図１８において、情報処理システム１８０１は、支援装置１０３と、三つ以上の上位階層の拠点１８１０、１８２０、１８３０を含み、拠点１８１０は、複数の下位階層の拠点１８１１、１８１２、・・・を含み、拠点１８２０は、複数の下位階層の拠点１８２１、１８２２、・・・を含み、拠点１８３０は、複数の下位階層の拠点１８３１、１８３２、・・・を含む。下位階層の各拠点１８１１～１８３２は、管理装置１０４、一以上のデータフロー処理装置１０５、及び一以上のデータ格納装置１０６を含む。ユーザ端末１０２、支援装置１０３、上位階層の各拠点１８１０、１８２０、１８３０、及び下位階層の各拠点１８１１～１８３２は、ネットワーク１０７を介して互いに接続される。なお、データ格納装置１０６は、必ずしも各拠点１８１１～１８３２に一つ以上含まれる必要はなく、上位拠点１８１０～１８３０、または情報処理システム１８０１に含まれ、各拠点１８１１～１８３２によりアクセス可能であっても構わない。また、上位拠点１８１０～１８３０の数は、３より多くても少なくても構わない。

【0094】

この際、拠点１８１０は、拠点名が「ｊｐ」として管理され、拠点１８２０は、拠点名が「ｕｓ」として管理され、拠点１８３０は、拠点名が「ｅｕ」として管理される。また、拠点１８１０に属する拠点１８１１、１８１２、・・・は、拠点名が「ｊｐ－ｉ．ｊｐ」として管理され、拠点１８２０に属する拠点１８２１、１８２２、・・・は、拠点名が「ｕｓ－ｉ．ｕｓ」として管理され、拠点１８３０に属する拠点１８３１、１８３２、・・・は、拠点名が「ｅｕ－ｉ．ｅｕ」として管理される。

【0095】

拠点が階層構造を取るケースにおいて、上位階層の拠点１８１０内の拠点１８１１、１８１２、・・・のうちいずれかの拠点で処理を実行する場合、データフロー作成時に、ユーザは、図１７の転送ステップ２６１、及び２６２において、＊.ｊｐのようにワイルドカードを用いて拠点名を指定してもよいし、単にｊｐとして、拠点名を指定してもよい。例えば、＊．ｊｐによって拠点を指定する場合、図１２に示す担当領域決定シーケンスの担当希望領域選択ステップＳ１２０１において、ｊｐ内の各拠点に属するデータフロー処理装置１０５は、自身が属する拠点（ｊｐ－ｘ．ｊｐ）での実行を指定された領域と、上位階層の拠点（＊．ｊｐ）１８１０での実行を指定された領域の中から、担当を希望する領域を選択する。また、担当未決定の領域の有無の判定（図１２のステップＳ１２１０）においても、自身が属する拠点（ｊｐ－ｘ．ｊｐ）１８１１と、上位階層の拠点（＊．ｊｐ）１８１０での実行を指定された領域で、担当未決定の領域の有無を判定する。

【0096】

管理装置１０４は、情報処理システム１８０１内に一つ以上存在していればよく、下位階層の各拠点１８１１～１８３２に存在してもよいし、上位階層の拠点１８１０、１８２０、１８３０毎に存在しても構わない。各管理装置１０４は互いに連携して、各領域の担当となるデータフロー処理装置１０５を一意に決定する。

【0097】

本実施例によれば、拠点１８１１～１８３２毎に処理リソース量が異なるケースにおいても、ユーザが各拠点のリソース構成を考慮することなく、各拠点のデータフロー処理装置１０５は、各領域を担当するデータフロー処理装置１０５を一意に決定してデータフローを実行することが可能になる。これにより、各入力データを移転可能なデータに変換することで、扱うデータの秘匿性に従い、データ移転が可能な範囲内で、効率的にリソースを活用することも可能になる。例えば、拠点１８１１、１８１２、・・・の中に、脆弱なリソース量のものやリソース量が多いものが混在する場合でも、上位階層の拠点１８１０を指定することで、拠点１８１０に属する拠点１８１１、１８１２、・・・の中のいずれかの拠点のデータフロー処理装置１０５で、リソース量にあった処理を実行することが可能になる。

【0098】

本実施例では、階層が２階層の例を示したが、階層の数は２に限らない。また、階層の数は上位階層毎に異なっていても構わない。階層は、地理的な階層であってもよいし、論理的な階層（例えば、企業における部署構成に準じる）であっても構わない。