特許6099712 | 知財ポータル「IP Force」

知財求人 - 知財ポータルサイト「IP Force」

▶ 知意圖股▲分▼有限公司の特許一覧

特許6099712ビッグストリームデータのリアルタイム処理方法、ストリームデータ処理エンジン及びビッグストリームデータのリアルタイム処理システム

書誌要約請求の範囲詳細な説明課題実施例実施するための形態図面の説明

目に優しい文字サイズ小中大 PDF Top

< >

1
2
3
4
5A
5B
6

(19)【発行国】日本国特許庁(JP)

(12)【公報種別】特許公報(B2)

(11)【特許番号】6099712

(24)【登録日】2017年3月3日

(45)【発行日】2017年3月22日

(54)【発明の名称】ビッグストリームデータのリアルタイム処理方法、ストリームデータ処理エンジン及びビッグストリームデータのリアルタイム処理システム

(51)【国際特許分類】

G06F 17/30 20060101AFI20170313BHJP

【ＦＩ】

G06F17/30 220Z

G06F17/30 240C

G06F17/30 180D

【請求項の数】6

【全頁数】14

(21)【出願番号】特願2015-176280(P2015-176280)

(22)【出願日】2015年9月8日

(65)【公開番号】特開2016-110620(P2016-110620A)

(43)【公開日】2016年6月20日

【審査請求日】2015年9月14日

(31)【優先権主張番号】103142344

(32)【優先日】2014年12月5日

(33)【優先権主張国】TW

(73)【特許権者】

【識別番号】515099090

【氏名又は名称】知意圖股▲分▼有限公司

(74)【代理人】

【識別番号】100108833

【弁理士】

【氏名又は名称】早川裕司

(74)【代理人】

【識別番号】100162156

【弁理士】

【氏名又は名称】村雨圭介

(72)【発明者】

【氏名】王耀聰

(72)【発明者】

【氏名】葉宥琳

(72)【発明者】

【氏名】徐瑞興

(72)【発明者】

【氏名】陳韋志

【審査官】川▲崎▼ 博章

(56)【参考文献】

【文献】国際公開第２０１３／０６９０７３（ＷＯ，Ａ１）

【文献】特開平０８−１７９９８０（ＪＰ，Ａ）

(58)【調査した分野】（Int.Cl.，ＤＢ名）

Ｇ０６Ｆ１７／３０

(57)【特許請求の範囲】

【請求項1】

ネットワーク接続により、少なくとも一つのリレーショナルデータベースから複数のストリームデータを受信し、リアルタイムなデータ処理を実行した後に、少なくとも一つの対応するノンリレーショナルデータベースに伝送して格納するビッグストリームデータのリアルタイム処理方法であって、
ネットワークに接続する複数の接続ポートによって、前記リレーショナルデータベースのデータタイプを識別するステップと、
前記リレーショナルデータベースから伝送された前記ストリームデータの通信モードを同期モードまたは非同期モードに設定するステップと、
メインインデックスに基づき、データ毎に逓増する前記ストリームデータを順番に取得するステップと、
ソースとして提供される前記リレーショナルデータベースと、ターゲットとして受け入れる前記ノンリレーショナルデータベースのデータタイプが一致するかを判断し、もし一致する場合は前記ストリームデータを変換する必要がないが、もし不一致の場合は前記ストリームデータを前記ノンリレーショナルデータベースのデータタイプに変換するステップと、
前記通信モードに基づき、変換後のまたは変換の必要のない前記ストリームデータを対応する前記ノンリレーショナルデータベースに書き込むステップと、を含むことを特徴とする、ビッグストリームデータのリアルタイム処理方法。

【請求項2】

前記通信モードに基づき、変換後のまたは変換の必要のない前記ストリームデータを対応する前記ノンリレーショナルデータベースに書き込むステップにおいて、
前記通信モードが非同期モードの場合、変換後のまたは変換の必要のない前記ストリームデータをいったん格納装置に一時格納しておき、前記ストリームデータが所定のデータ状態になったとき、一括して前記ノンリレーショナルデータベースに書き込むことを特徴とする、請求項１記載のビッグストリームデータのリアルタイム処理方法。

【請求項3】

ネットワーク接続により、前記少なくとも一つのリレーショナルデータベースから前記複数のストリームデータを受信し、リアルタイムなデータ処理を実行した後に、前記少なくとも一つのノンリレーショナルデータベースに対応して格納することを特徴とする、請求項１または２記載のビッグストリームデータのリアルタイム処理方法に用いられるストリームデータ処理エンジンであって、
ネットワークに接続する前記複数の接続ポートによって、前記リレーショナルデータベースのデータタイプの識別に備える接続ポート識別モジュールと、
電気通信手段により、前記接続ポート識別モジュールに接続されていて、かつ前記リレーショナルデータベースのデータタイプに基づき、前記リレーショナルデータベースから伝送される前記ストリームデータの通信モードを同期モードまたは非同期モードにそれぞれ設定する通信モード設定モジュールと、
前記通信モード設定モジュールと電気通信手段により接続されていて、かつデータ毎に逓増する前記ストリームデータを順番に取得する受信モジュールと、
前記受信モジュールと電気通信手段により接続され、ソースとして提供する前記リレーショナルデータベースと、ターゲットとして受け入れる前記ノンリレーショナルデータベースのデータタイプが一致するかを判断し、もし一致する場合は前記ストリームデータを変換する必要はないが、もし不一致の場合は前記ストリームデータを前記ノンリレーショナルデータベースのデータタイプに変換する変換モジュールと、
電気通信手段により前記受信モジュールに接続されていて、かつ通信モードに基づき、変換後のまたは変換の必要のない前記ストリームデータを対応する前記ノンリレーショナルデータベースに書き込み、もし通信モードが非同期式のときは、変換後のまたは変換の必要のない前記ストリームデータを記憶装置にいったん格納しておき、前記ストリームデータが前記記憶装置に所定のデータ状態で格納されたときは、一括して前記ノンリレーショナルデータベースに書き込む出力モジュールと、
を含むことを特徴とする、ビッグストリームデータのリアルタイム処理方法に用いられるストリームデータ処理エンジン。

【請求項4】

ビッグストリームデータのリアルタイム処理システムであって、
構造化されたデータベースタイプであり、複数のストリームデータを提供する主リレーショナルデータベースと、
構造化されたデータベースである従属リレーショナルデータベースと、
電気通信手段により前記主リレーショナルデータベース及び前記従属リレーショナルデータベースに接続され、ホットバックアップ機能により、前記主リレーショナルデータベースの内部のデータを前記従属リレーショナルデータベースに同期して更新するバックアップ装置と、
電気通信手段により、前記主リレーショナルデータベースに接続されたＥＴＬツールと、
構造化されたデータベースであり、電気通信手段により前記ＥＴＬツールに接続されており、前記主リレーショナルデータベースより提供された前記ストリームデータを、前記ＥＴＬツールの前処理を経てから格納するデータウェアハウスと、
電気通信手段により、前記従属リレーショナルデータベースに接続され、前記主リレーショナルデータベースから提供された前記ストリームデータを伝送する請求項３記載のストリームデータ処理エンジンと、
非構造化データベースタイプであり、電気通信手段により前記ストリームデータ処理エンジンに接続され、前記ストリームデータ処理エンジンによって変換した前記ストリームデータを書き込むノンリレーショナルデータベースと、
を含むことを特徴とする、ビッグストリームデータのリアルタイム処理システム。

【請求項5】

電気通信手段により前記ノンリレーショナルデータベースに接続され、前記ノンリレーショナルデータベースに格納するデータの変異状態をリアルタイムに報告するリアルタイム報告ユニットをさらに含むことを特徴とする、請求項４記載のリアルタイム処理システム。

【請求項6】

まず前記データウェアハウスに格納された前記ストリームデータをバッチ解析演算ツールによって処理した後、警告レベル値を取得し、前記リアルタイム報告ユニットが前記警告レベル値に基づき、変異状態を比較した上で、リアルタイムに警告することを特徴とする、請求項５記載のリアルタイム処理システム。

【発明の詳細な説明】

【技術分野】

【0001】

本発明はビッグデータのリアルタイム処理とデータウェアハウス分野に関し、特にリアルタイムによるクエリとリアルタイムな警告などの効果を達成できる、ビッグストリームデータのリアルタイム処理方法、ストリームデータ処理エンジン及びビッグストリームデータのリアルタイム処理システムに関する。

【背景技術】

【0002】

企業はこれまでのデータ解析による政策決定プロセスの解決にあたり、ある問題に直面している。例えば、企業内各部門の情報システムは、従来の設計は当該部門の目標達成を主としており、情報システムごとに独立していて、整合性の取れた結果を持っていないがため、データサイロ（ｄａｔａｓｉｌｏｓ）が各場所に散在していた。そのため、企業にて、データをたくさん保管しているが、情報価値のある情報が不足している状況がしばしば見受けられる。データの整合と統合を実現し政策決定者に必要な情報を提供するため、企業は大量に格納できる、しかも高速な解析能力などを持つデータウェアハウス（ｄａｔａｗａｒｅｈｏｕｓｅ）を用いて、いままでの膨大化され各場所に散在していて、かつ整理分析が難しい運営データを整合性が取れた一つのデータベースに構築している。企業はデータウェアハウスを用いて、各種データを解析、運用、探索し、企業に精確な運営政策の決定に役立つことができる。

【発明の概要】

【発明が解決しようとする課題】

【0003】

図１にデータウェアハウスの産業界における運用を示す。複数のデータソース１０からのデータは、従来ではまとめてリレーショナルデータベース１１に格納した後、それらのデータをバッチ方式により、ＥＴＬツール１２を用いて抽出、置き換えとロード等の前処理（ｐｒｅ−ｐｒｏｃｅｓｓｉｎｇ）を経て、データウェアハウス１３に伝送される。その後は必要なときにバッチ解析演算ツール１４を介して、データウェアハウス１３のデータの更なる解析を実行し、クエリ（示されない）に提供するか、または集計リポート１５を形成する。

【0004】

前述したデータウェアハウス運用は、半導体産業の製造プロセス（例えば、エッチング、リソグラフィなど）、またはエンタテインメント産業のオンラインゲームのライフサイクル管理などの分野に応用できる。半導体生産プロセスの例を挙げると、かかるデータソース１０は複数の生産機器から構成され、それらの生産機器から絶えずに形成される情報はリレーショナルデータベース１１に伝送される。すなわち、かかるリレーショナルデータベース１１は半導体生産プロセスにおける例えば、ログ等のデータ格納に用いられている。さらに、いままでの経験によれば、かかるリレーショナルデータベース１１に格納できる容量の上限はせいぜい１４日前後のデータ量である。しかし、半導体産業の製造プロセス期間は１４日を超えている。そこで実務のやり方としては、毎日リレーショナルデータベース１１のデータを、ＥＴＬツール１２を用いて前処理を数時間にわたり実行した後、容量の大きいデータウェアハウス１３に格納される。経験上、かかるデータウェアハウス１３の保管期間は大体２年以上である。必要なときはかかるデータウェアハウス１３に格納したデータをバッチ解析演算ツール１４に送り、例えば製造プロセスの良品率解析など更なる処理が実行される。その解析結果はサードパーティのリアルタイムなクエリに備えるか、さらには集計リポート１５を形成し政策決定に備える。経験上、かかるバッチ解析演算ツール１４の処理頻度は毎月１回実行され、そして１回ごとの処理には数時間かかる。

【0005】

前述した従来のやり方には欠点が残されている。例えば、それらのデータソース１０からリレーショナルデータベース１１までのプロセスフローは、半導体産業にとって極めて重要なため、実務にはかかるフロー設計はどうしても必要でなければ変更されることはまずない。このような背景において、かかるリレーショナルデータベース１１で製造プロセス全部のデータ量を格納する容量が不足となっても、リレーショナルデータベース１１も横方向へ任意に拡張することはできない。さらに、まとめてリレーショナルデータベース１１に格納するデータはＥＴＬツール１２を用いて、バッチ方式により前処理が行われるため、リアルタイムな警告を提供することはできない。このほかに、それらのデータソース１０のデータ量が絶えず増えると、データウェアハウス１３を拡張しなければならず、ソフトウエアのライセンスやハードウエアのアップグレードで膨大な費用負担となりかねない。以上に述べた状況は、すべての半導体産業が唱える合理的なコスト管理のもとで、生産プロセスの状況をリアルタイムに把握する目標において不利な要因を与えている。

【0006】

類似する現象は、オンラインゲームの分野にも起きている。それらのデータソース１０の出所は複数のプレイヤの装置側である。例えば携帯電話、コンピュータまたはゲーム機など、プレイヤそれぞれのゲームログイン及び料金支払いなどの関連情報がリレーショナルデータベース１１にまとめて格納され、ＥＴＬツール１２は毎日バッチ方式により、数時間の前処理を実行した後、データウェアハウス１３に転送して格納される。オンラインゲーム業者は、所定の周期（例えば、毎月）に基づき、バッチ解析演算ツール１４を用いて、データウェアハウス１３に格納されたデータのさらなる演算を実行しクエリに備えるか、または集計リポート１５を出力させるなどして、オンラインゲーム業者による製品のライフサイクル管理に備える。しかし、オンラインゲーム分野の製品ライフサイクルはますます短くなっており、合理的なコスト条件に基づき、迅速、かつ精確なマーケティング戦略制定のため、製品組み合わせの最適化のリアルタイム解析を達成する方法と装置が必要である。

【課題を解決するための手段】

【0007】

本願発明者は公知技術の不備に気づき、鋭意研究するとともに、かかる産業界における長年蓄積した経験に基づき、前述した公知技術の欠点を改善する、斬新なビッグストリームデータのリアルタイム処理方法とその装置を提案する。

【0008】

前述課題に基づき、本発明の目的はビッグストリームデータのリアルタイム処理方法及びそのシステム構成を提供することにある。かか方法によれば、ビッグストリームデータをリアルタイムに処理し、さらにかかる方法とかかるシステム構成を利用することにより、それぞれのリレーショナルデータベースからの各種データに対して、ビッグストリームデータのリアルタイム管理ができる。

【0009】

前述目的を達成するため、本発明は、ネットワーク接続により、少なくとも一つのリレーショナルデータベースから提供される複数のストリームデータのリアルタイム処理を実行した後、少なくとも一つのノンリレーショナルデータベースに格納するビッグストリームデータのリアルタイム処理方法を提供する。かかる方法は、ネットワーク接続の複数の接続ポートによって、リレーショナルデータベースのデータの種類を識別し、リレーショナルデータベースから伝送するストリームデータの通信モードを同期モードまたは非同期モードに設定し、メインインデックスに基づいてデータ毎に逓増するかかるストリームデータを順番に取得し、ソースから提供されたリレーショナルデータベースとターゲットとして受け入れるノンリレーショナルデータベースのデータタイプが一致しているか否かを判断する。もし一致している場合はストリームデータを変換する必要はなく、一致していない場合はストリームデータをかかるノンリレーショナルデータベースのデータタイプに変換する。続いてかかる通信モードに従い、変換後または変換の必要のないストリームデータを対応するノンリレーショナルデータベースに書き込む。

【0010】

より好ましい一実施例においては、ネットワーク応答速度の強化と、システム上のソフトウエアコンポーネント間の依存性を軽減して、独立な発展と配置構成の拡張ができるように、通信モードに基づき、変換後または変換不要なストリームデータをかかるノンリレーショナルデータベースに対応して書き込むステップを有し、もし、かかる通信モードが非同期式である場合、変換後または変換の不要なストリームデータをいったん記憶装置に格納しておき、かかるストリームデータをしばらくかかる記憶装置に所定のデータ容量で格納した後、一括してノンリレーショナルデータベースに書き込む。

【0011】

前述目的を達成するため、本発明は前述したリアルタイム処理方法を実行するためのストリームデータ処理エンジンをさらに提供している。ネットワークに接続された複数の接続ポートによって、リレーショナルデータベースのデータ種類を識別する接続ポート識別モジュールと、かかる接続ポート識別モジュールと電気通信手段により接続され、かかるリレーショナルデータベースのデータ種類によって、かかるリレーショナルデータベースから伝送されるストリームデータの通信モードを同期モードまたは非同期モードに設定する通信モード設定モジュールと、かかる通信モード設定モジュールと電気通信手段により接続され、データ毎に逓増するストリームデータを順番に取得する受信モジュールと、かかる受信モジュールと電気通信手段により接続され、ソースから提供されたリレーショナルデータベースと、ターゲットとして受け入れるノンリレーショナルデータベースのデータタイプが一致するか否かを判断し、もし、一致している場合はストリームデータを変換する必要はなく、もし一致していない場合はストリームデータをかかるノンリレーショナルデータベースのデータタイプに変換するデータタイプ変換モジュールと、かかる受信モジュールと電気通信手段により接続され、かかる通信モードによって、変換後または変換の必要のないストリームデータを対応するノンリレーショナルデータベースに書き込む出力モジュールと、を含む。もしかかる通信モードが非同期式の場合は、変換後または変換の必要のないストリームデータをいったん記憶装置に格納した後、かかるストリームデータをしばらくかかる記憶装置に所定のデータ容量で格納した後、一括してかかるノンリレーショナルデータベースに書き込む。

【0012】

さらに、本発明は前述したリアルタイム処理方法とストリームデータ処理エンジンを利用した、ビッグストリームデータのリアルタイム処理システムを更に提供する。リアルタイム処理システムは、構造化データベースタイプであり、かつ複数のストリームデータを含む主データベースと、構造化データベースである従属データベースと、かかる主データベースと電気通信手段により接続され、ホットバックアップ機能を有しており、かかる主データベースにあるデータを同期によりかかる従属データベースに更新するデータベースバックアップ装置と、かかる主データベースと電気通信手段により接続されるＥＴＬツールと、構造化データベースタイプであり、かかるＥＴＬツールと電気通信手段により接続されており、かかる主データベースより提供されるストリームデータがＥＴＬツールによって前処理をされた後に伝送されて格納されるデータウェアハウスと、かかる従属データベースと電気通信手段により接続され、かかる従属データベースより提供するストリームデータが伝送されるストリームデータ処理エンジンと、非構造化データベースタイプであり、かかるストリームデータ処理エンジンと電気通信手段により接続されていて、かかるストリームデータ処理エンジンによって処理された後のストリームデータが書き込まれる分散型データベースと、を含む。

【0013】

もう一つのより好ましい実施例においては、管理者にリアルタイムに目標の達成具合、業績管理具合、ビジネス解析状況などのリポートを確認させるため、前述したビッグストリームデータのリアルタイム処理システムにおいて、かかる分散型データベースと電気通信手段により接続されていて、かかる分散型データベースに格納されたデータの変異状態をリアルタイムに提供するリアルタイム報告ユニットをさらに含む。一部の分野、例えば半導体産業の製造プロセスにおいてより高速、かつリアルタイムにウェハー製造プロセスの良品率を把握する目的で、例えばまずデータウェアハウスのストリームデータをバッチ解析演算ツールによって処理した後に警告レベル値を取得し、かかるリアルタイム報告ユニットはかかる警告レベル値に基づき、前述した変異状況と比較した後にリアルタイムな警告通知を形成し、その後管理者のリアルタイム処理に提供する。

【発明の効果】

【0014】

本発明が提示するビッグストリームデータのリアルタイム処理方法、装置及びそのシステムは、秒単位のリアルタイムクエリ及びリアルタイムな警告などの管理効果を達成できるとともに、分散型のリアルタイム処理環境が構築されているため、従来のように絶えず高価なソフトウエアライセンスの取得やハードウエアのアップグレードでビッグデータ処理に対応するやり方を回避し、構築コストを大幅に軽減できる。

【図面の簡単な説明】

【0015】

【図1】公知のデータウェアハウス運用を示す図である。

【図2】本発明の好ましい実施例によるストリームデータ処理構造のブロック図である。

【図3】本発明の好ましい実施例によるストリームデータ処理エンジンのブロック図である。

【図4】本発明の好ましい実施例によるビッグストリームデータのリアルタイム処理方法のフローを示す図である（その１）。

【図5A】本発明の好ましい実施例によるビッグストリームデータのリアルタイム処理方法のフローを示す図である（その２−１）。

【図5B】本発明の好ましい実施例によるビッグストリームデータのリアルタイム処理方法のフローを示す図である（その２−２）。

【図6】本発明の好ましい実施例によるビッグストリームデータのリアルタイム処理方法のシステム構成を示す図である。

【発明を実施するための形態】

【0016】

審査官殿の本発明の内容のさらなる理解を図るため、以下に実施例を図面を参照しながら説明する。以下の実施例において同じ部材は同じ符号を用いて示されている。

【0017】

図２ないし４の、本発明の好ましい実施例によるストリームデータ処理構造のブロック図と、ストリームデータ処理エンジンのブロック図と、ビッグストリームデータのリアルタイム処理方法のフロー図（その１）を参照する。図４と図２から分かるように、本発明はビッグストリームデータのリアルタイム処理方法及びその方法を実行するためのストリームデータ処理エンジン２０を提供する。そのうち、ストリームデータ処理エンジン２０はネットワーク接続により、少なくとも一つのリレーショナルデータベース３０から提供される複数のストリームデータ（図示しない）をリアルタイムにデータ変換した後、少なくとも一つの対応するノンリレーショナルデータベース４０に格納される。ストリームデータは絶えず形成されるビッグデータであり、かかるストリームデータの流れる方向が矢印で示されている。これと異なり、従来のリレーショナルデータ処理では、いったんデータをハードウエアのテーブルに書き込んだ上で、アプリケーションプログラムにクエリのリクエストを行うときには、ハードディスク内部すべてのデータを整理してから、クエリ結果を記憶装置に一時格納する。クエリの都度に同じ演算処理を実行しなければならず、よって、データ量の増加につれて演算効率が低下し、しかも読み書き動作のときにはハードディスクへのアクセスが行われる。従って、クエリ作業にタイムラグを発生し、リアルタイム処理を実現できない。一方、本発明が提供するストリームデータのリアルタイム処理方法によれば、データをハードディスクに書き込む必要はないため、秒単位のリアルタイム処理効果を達成できる。かかるリレーショナルデータベース３０を複数に設置している場合でも、同じ方法によりストリームデータを処理することができる。

【0018】

引き続き、図２ないし４を参照する。かかるビッグストリームデータのリアルタイム処理方法は、以下のステップを含む。まずリレーショナルデータベース３０から伝送されるストリームデータのタイプを識別し、その後の変換処理及びノンリレーショナルデータベース４０に格納するための対応設定に備えるため、まずネットワーク接続の複数の接続ポート（図示しない）によって、リレーショナルデータベース３０のデータタイプとフォーマットの識別を実行する。この方法によれば、常用または設定済みの接続ポートを介して、ストリームデータソースの属性を高速に確認できる。例えば、常用のＦＴＰが接続ポート２１位置（ｐｏｒｔ２１）を使用すること、またはＨＴＴＰが接続ポート８０位置（ｐｏｒｔ８０）を使用すること等がその一例である。ここでいう接続ポートの概念は、論理的なものであって、物理的なハードウエア装置ではないため、図３のブロック図に表示されていない。これがステップＳ５０の説明である。

【0019】

さらに、ネットワーク応答速度などの強化を配慮し、本発明は非同期式作業をその次の選択手段として取り入れる。いわゆる非同期作業とは、業務間のメッセージ伝達は一斉呼び出しではなく、一つの業務操作を複数段階に分けて、かつそれぞれの段階はデータ共有の手段により、非同期に共同作業を行うことを指す。さらに、非同期式作業はソフトウエアコンポーネント同士の依存性を軽減できるばかりでなく、システム構成の階層が各自に発展するところにも長所がある。ステップＳ５１では、接続ポートによりリレーショナルデータベース３０のデータ種類を識別した後、続いてリレーショナルデータベース３０から伝送されるストリームデータの通信モードを同期モードまたは非同期モードを設定する。

【0020】

続いてステップＳ５２に進む。メインインデックスに基づき、データ毎に逓増するストリームデータを順番に取得する。ストリームデータはそれらのリレーショナルデータベース３０から提供される構造化データである一方、ノンリレーショナルデータベース４０は非構造化データを格納できる特性と長所を有する。ＮｏＳＱＬデータベースを例示すると、その種のデータベースは一つのキー（Ｋｅｙ）が一つの値（Ｖａｌｕｅ）に対応する組み合わせか、または一組のキー値（Ｋｅｙ−Ｖａｌｕｅ）とカラムファミリ（ＣｏｌｕｍｎＦａｍｉｌｙ）によってデータを記述しており、構造が単純なため、データ間の関連性を定義する必要はなく、しかも最初からデータベース構成を予め定義する必要もない。よって、比較的に扱うデータ量が大きく、拡張性により優れているなどの長所がある。この後に実行されるステップでは、ストリームデータを変換して、非構造化データを主たるノンリレーショナルデータベース４０に格納する。

【0021】

続いてステップＳ５３に進むと、ソースとして提供されるリレーショナルデータベース３０と、ターゲットとして受け入れるノンリレーショナルデータベース４０のデータタイプが一致しているか否かを判断すると共に、もし一致する場合は係るストリームデータ変換必要はなく（ステップＳ５３０）、もし不一致の場合は、かかるストリームデータをノンリレーショナルデータベース４０のデータタイプに変換する（ステップＳ５３２）。ステップＳ５３０及びステップＳ５３２を実行した後、ステップＳ５４に進み、通信モードを変換した後の、または変換必要のないストリームデータをかかる対応するノンリレーショナルデータベース４０に書き込む。

【0022】

引き続き図５Ａ及び５Ｂの、本発明の好ましい実施例によるビッグストリームデータのリアルタイム処理方法のフロー図（その２）を参照する。このフローは図４に示すフロー図と同じような構造であるため、同じステップの内容はここでの詳細説明を省略し、以降ではステップＳ５４についての詳細のみを説明する。まず、企業の組織形態における様々な情報システムへの対応を図るため、リレーショナルデータベースを複数の異なる性質のリレーショナルデータベースに分け、さらにそれぞれの情報セキュリティニーズと、今後全体システム構成に導入するときの拡張性ならびネットワークの応答速度に対応させるため、複数の異なる性質のリレーショナルデータベースでデータを格納し、さらにその通信モードを同期式又は非同期式に設定することができる。

【0023】

経験上、非同期式の通信モードを使用することによって、ネットワークの拡張性とシステム効率は改善される。原則として、メッセージ待ち行列方式によって実現できる。すなわち、同期式を使用する通信モードでは、データベースに直接にデータを書き込まれ、高度な並列処理の環境においては、データベースに大きな負担が掛かってしまい、応答遅延を深刻化させる。これに対して、メッセージ待ち行列方式を採用すると、外部からのリクエストまたは伝送データをメッセージ待ち行列に発送した後ただちに回送し、続いてメッセージ待ち行列の処理プロセス（通常の状況において、かかる処理プロセスは独立した専門のサーバークラスター、メッセージ待ち行列サーバーに配置される。）を経てデータを取得するので、同期してデータベースに書き込まれていない。かかるメッセージ待ち行列サーバーによる処理はデータベースの処理速度より速いため、応答遅延については有効に改善される。それらのストリームデータ処理は、ハードディスクに書き込まれるのではなく、直接に記憶装置にて処理を実行され、さらに、前回処理の結果を中間データとして格納しておき、次回には再び全部を処理することなく、記憶装置に導入する新しいデータと中間データとの差異（Ｄｉｆｆ）に対する処理で済む。よって、このように入力から結果が出力されるまでの遅延は、場合によって百万分の１秒のレベルにまで制御でき、ひいては１秒間に数十万ないし数百万点のデータの超高速処理速度を実現できる。

【0024】

よって、前述したとおり、ステップＳ５４はそもそも通信モードに基づき、変換後の、または変換必要のないストリームデータをノンリレーショナルデータベース４０に対応して書き込む。かかるステップの詳細内容を以下のとおり説明する。ステップＳ５４０とステップＳ５４２における判断のフローとして、まず変換の必要がない（ステップＳ５３０）または変換済み（ステップＳ５３２）のストリームデータについて、通信モードが同期式であるか否かのさらなる判断を行う。ステップＳ５４０において同期式と判断された場合は、ステップＳ５４０１に進み、変換必要のないストリームデータをノンリレーショナルデータベース４０に一括して書き込む。これに対して、もしかかる通信モードが非同期式であれば、変換必要のないストリームデータをいったん記憶装置に格納して置き、かかるストリームデータが記憶装置に所定のデータ様態になったときに、一括してノンリレーショナルデータベース４０に書き込む。これがステップＳ５４０２である。これと同様に、変換後のストリームデータが同期式と非同期式いずれの通信モードであるか認識された後、同じような処理方式が取られる。ステップＳ５４２において同期式と判断された場合は、ステップＳ５４２１に進み、変換後のストリームデータをノンリレーショナルデータベース４０に一括して書き込む。そうでない場合はステップＳ５４２２に進み、変換後のストリームデータをいったん記憶装置に一時格納して置き、かかるストリームデータが記憶装置に所定のデータ様態になったとき、一括してノンリレーショナルデータベース４０に書き込む。

【0025】

続いて図３を参照する。図３に示されたストリームデータ処理エンジンは、図４と図５Ａ、図５Ｂのフローを実行する装置である。そのため、以下には装置モジュールの連結関係についてのみ説明し、実行するフロー及び作業方法は前述した図４と図５Ａ、図５Ｂと同様であるため、ここでの詳細説明を省略する。さらに、装置のそれぞれのモジュールは、コンピュータなどのハードウエア装置と組み合わせて稼働するアプリケーションソフトを併せて指すものである。

【0026】

図３に示すように、ストリームデータ処理エンジン２０は接続ポート識別モジュール２００と、通信モード設定モジュール２０１と、受信モジュール２０２と、変換モジュール２０３と、出力モジュール２０４と、を含む。そのうち、接続ポート識別モジュール２００はネットワーク接続の接続ポートによって、それらのリレーショナルデータベース３０のデータ種類とタイプの識別をする。通信モード設定モジュール２０１は電気通信手段により接続ポート識別モジュール２００に接続されていて、かつそれらのリレーショナルデータベース３０のデータ種類に従い、リレーショナルデータベース３０から伝送するストリームデータの通信モードを同期モードまたは非同期モードにそれぞれ設定する。一方、受信モジュール２０２は電気通信手段により通信モード設定モジュール２０１に接続されていて、かつデータ毎に逓増するそれらのストリームデータを順番に取得して、その後のリアルタイム処理に備える。すなわち、それらのストリームデータを変換モジュール２０２に伝送する。変換モジュール２０２は電気通信手段により受信モジュール２０２に接続され、ソースから提供されるリレーショナルデータベース３０と、ターゲットとして受け入れるノンリレーショナルデータベース４０のデータタイプが一致するか否かを判断し、もし一致の場合はそれらのストリームデータを変換する必要はなく、もし、不一致の場合は、それらのストリームデータをノンリレーショナルデータベース４０のデータタイプに変換する。最後に、出力モジュール２０４を介して、データをノンリレーショナルデータベース４０に伝送する。かかる出力モジュール２０４は電気通信手段により受信モジュール２０２に接続されていて、かつ通信モードに基づき、変換後のまたは変換の必要ないストリームデータをノンリレーショナルデータベース４０に対応して書き込む。さらに、もしかかる通信モードが非同期式のときは、変換後のまたは変換の必要ないストリームデータをいったん記憶装置に格納しておき、それらのストリームデータがかかる記憶装置で所定のデータ状態に格納されたときは、一括してノンリレーショナルデータベース４０に書き込む。

【0027】

合わせて図６の本発明の好ましい実施例によるビッグストリームデータのリアルタイム処理システムの構成を示す図を参照する。この構成は図２と図３に示すストリームデータ処理エンジン２０のように、リアルタイム処理を実現するものであるため、実行方法については、図４ないし図５Ａ、図５Ｂに示すフローを含む。図から分かるように、かかるビッグストリームデータのリアルタイム処理システムは、主データベース６１と、従属データベース６６と、バックアップ装置６７と、ＥＴＬツール６２と、データウェアハウス６３と、を含む。前述したストリームデータ処理エンジン６０と、分散型データベース６８のように、構成の設置目的はストリームデータを２つのコンテンツが同じで、異なる処理パスに分けて、リアルタイム処理の目的を実現すると共に、従来のデータウェアハウス管理機能をも兼ね備えることにある。これにより、既存の構成を損なうことなく、かつリアルタイム処理の拡張効果を有することができる。よって、主データベース６１が構造化されたデータベースタイプであり、かつ、複数のストリームデータを提供している場合は、従属データベース６６も構造化データベースに仕上げる。続いて、バックアップ装置６７を介して、両者のデータを同期してバックアップしておく。バックアップ装置６７は電気通信手段により主データベース６１と、従属データベース６６に接続されている。バックアップ装置６７はホットバックアップ機能を有しており、主データベース６１のデータを随時同期させてかかる従属データベース６６にバックアップすることにより、２つの同じコンテンツに異なる処理を行う効果が実現される。

【0028】

かかる主データベース６１から提供するストリームデータの伝送経路はＥＴＬツール６２に伝送される。ＥＴＬツール６２は電気通信手段により主データベース６１に接続されており、主データベース６１から提供するストリームデータはＥＴＬツール６２における前処理を経て、データウェアハウス６３に伝送されて格納される。データウェアハウス６３も構造化データベースタイプの場合は、一定周期において、データウェアハウスに格納する情報はバッチ解析演算ツール６４によって、さらなる処理を実行し、処理結果は選択的に集計リポート６５に表示することができる。この部分のシステム構成は、従来の構成と許容性を有しているが、しかし、このような構成には、リアルタイムな警告またはリアルタイムにビッグストリームデータを処理するにはなお不足している。そのため、本発明のストリームデータ処理エンジン６０は、従属データベース６６にバックアップして提供するストリームデータに対して、リアルタイム処理を実行した上、分散型データベース６８に伝送して書き込む。ストリームデータ処理エンジン６０も電気通信手段により従属データベース６６に接続され、分散型データベース６８は同じく非構造化データベースタイプであり、かつ電気通信手段によりストリームデータ処理エンジン６０に接続されており、ストリームデータ処理エンジン６０によって変換処理された後のストリームデータの書き込みに備える。

【0029】

さらに、ビッグストリームデータのリアルタイム処理システムはリアルタイム報告ユニット６９を含む。かかるリアルタイム報告ユニット６９は電気通信手段により分散型データベース６８に接続され、リアルタイムに分散型データベース６８に格納されたデータの変異状況を報告する。変異状況の例を挙げると、例えばオンラインゲーム分野におけるビジネス解析のための、形成するプレイヤのライフサイクルに関わるリアルタイムリポートがある。さらに、システムはリアルタイム処理の効果を兼ね備えているため、従来のシステム構成を介して管理制御の基準状況を把握することができる。したがって、より効率な監視制御とリアルタイム処理を達成するには、まずバッチ解析演算ツール６４とデータウェアハウス６３とを電気通信手段により接続しておき、かつデータウェアハウス６３のストリームデータをバッチ解析演算ツール６４によって処理して警告レベル値を獲得しておく。リアルタイム報告ユニット６９がかかる警告レベル値と、前述の変異状態とを相互に比較した後のものがリアルタイムな警告通知として用いられることができる。半導体製造プロセスの例を挙げると、エッチング製造プロセスの測定結果に過度なエッチングなどの異常が発生した場合は、システムからリアルタイムな警告を自主に発信し、その後にリアルタイムな警告を受信した関係者らはただちに応急措置と調整を行うことができる。

【0030】

本発明の効果は、主に先行技術の構成に存在している欠点を改善し、よりよいリアルタイム処理応答を図ることにある。厳密に言うと、ネットワーク構成はねつ造されたものでなく、または無意味に存在しているものではない。正確に述べると、すべてのネットワーク構成の発展は、対応が手に追えない実際に生じている状況に対して、負荷に応えられる全体的な構成を提案するものである。換言すれば、単なるネットワークを構成するそれぞれのソフトウエアやハードウエアを分解すれば新規性を有していないものであるが、実務上の運用においては、それぞれの基礎概念を結合すると共に、ネットワーク配置を構成することが、問題解決のために寄与するものである。よって、本発明の技術手段は任意に分割または組み合わせ不可な完全性を有しており、さもなければ本発明を達成する効果を実現できない。もし、本発明の構成に基づいて拡張すれば、本発明の目的と効果に抵触されない。

【0031】

以上に述べたものは本発明の好ましい実施例に過ぎなく、本発明の特許請求の範囲を制限するものではない。よって、当業者または当該技術を熟知するものによる同等の効果を生じる簡単な変更、例えば分散型アプリケーションサービスや分散型静的リソース、分散型データ保存と分散型演算などを導入して、システム構成を階層に分けるかまたは分割すること、一つまたは複数のサーバークラスターによって構成すること、あるいは操作フローの順序を前後することなど、本発明の請求の範囲の均等な範囲の変化や修飾は、なお本発明の請求の範囲に含まれるものである。

【符号の説明】

【0032】

１０データソース
１１リレーショナルデータベース
１２ＥＴＬツール
１３データウェアハウス
１４バッチ解析演算ツール
１５集計リポート
２０、６０ストリームデータ処理エンジン
２００接続ポート識別モジュール
２０１通信モード設定モジュール
２０２受信モジュール
２０３変換モジュール
２０４出力モジュール
３０リレーショナルデータベース
４０ノンリレーショナルデータベース
６１主データベース
６２ＥＴＬツール
６３データウェアハウス
６４バッチ解析演算ツール
６５集計リポート
６６従属データベース
６７バックアップ装置
６８分散型データベース
６９リアルタイム報告ユニット

【図1】

【図2】

【図3】

【図4】

【図5A】

【図5B】

【図6】

知財求人

知財求人お知らせサービス

知財のニュースを調べる
- 知財ニュース
- 知財周辺ニュース
企業の特許を調べる
知財のセミナーを調べる
知財,特許事務所への求職・転職
特許事務所をさがす
弁理士試験を受ける
- 年の弁理士試験情報
- 弁理士試験の合格率など統計
知財の法律をしらべる
期限日をしらべる
- 今日に対して意見書・補正書の期限
- 今日に対して審査請求期限日
知財の判決をしらべる
コンテンツ・リンク
運営会社
プレスの皆様へ
- お問い合わせ
ユーザーの皆様
- お問い合わせ・フィードバック
広告掲載を希望の皆様へ
- 広告掲載について
- 求人広告の掲載について

特許第6099712号(P6099712)IP Force 特許公報掲載プロジェクト 2022.1.31 β版