IP Force 特許公報掲載プロジェクト 2022.1.31 β版

知財求人 - 知財ポータルサイト「IP Force」

▶ オラクル・インターナショナル・コーポレイションの特許一覧

特許7043512パイプ漏れを予測する新規な自律的人工知能システム
<>
  • 特許-パイプ漏れを予測する新規な自律的人工知能システム 図1
  • 特許-パイプ漏れを予測する新規な自律的人工知能システム 図2
  • 特許-パイプ漏れを予測する新規な自律的人工知能システム 図3
  • 特許-パイプ漏れを予測する新規な自律的人工知能システム 図4
  • 特許-パイプ漏れを予測する新規な自律的人工知能システム 図5
  • 特許-パイプ漏れを予測する新規な自律的人工知能システム 図6
  • 特許-パイプ漏れを予測する新規な自律的人工知能システム 図7
  • 特許-パイプ漏れを予測する新規な自律的人工知能システム 図8
  • 特許-パイプ漏れを予測する新規な自律的人工知能システム 図9
  • 特許-パイプ漏れを予測する新規な自律的人工知能システム 図10
  • 特許-パイプ漏れを予測する新規な自律的人工知能システム 図11
  • 特許-パイプ漏れを予測する新規な自律的人工知能システム 図12
  • 特許-パイプ漏れを予測する新規な自律的人工知能システム 図13
  • 特許-パイプ漏れを予測する新規な自律的人工知能システム 図14
  • 特許-パイプ漏れを予測する新規な自律的人工知能システム 図15
< >
(19)【発行国】日本国特許庁(JP)
(12)【公報種別】特許公報(B2)
(11)【特許番号】
(24)【登録日】2022-03-18
(45)【発行日】2022-03-29
(54)【発明の名称】パイプ漏れを予測する新規な自律的人工知能システム
(51)【国際特許分類】
   G06Q 10/04 20120101AFI20220322BHJP
   G06N 20/00 20190101ALI20220322BHJP
【FI】
G06Q10/04
G06N20/00 130
【請求項の数】 6
(21)【出願番号】P 2019554997
(86)(22)【出願日】2018-04-02
(65)【公表番号】
(43)【公表日】2020-06-11
(86)【国際出願番号】 US2018025661
(87)【国際公開番号】W WO2018191048
(87)【国際公開日】2018-10-18
【審査請求日】2020-11-19
(31)【優先権主張番号】62/485,314
(32)【優先日】2017-04-13
(33)【優先権主張国・地域又は機関】US
(31)【優先権主張番号】15/820,316
(32)【優先日】2017-11-21
(33)【優先権主張国・地域又は機関】US
(73)【特許権者】
【識別番号】502303739
【氏名又は名称】オラクル・インターナショナル・コーポレイション
(74)【代理人】
【識別番号】110001195
【氏名又は名称】特許業務法人深見特許事務所
(72)【発明者】
【氏名】アッバス,フセイン
【審査官】岡 裕之
(56)【参考文献】
【文献】特開2012-014619(JP,A)
【文献】特開2011-198267(JP,A)
【文献】Mohammad Burhan Abdulla et al.,Pipeline leak detection using artificial neuralnetwork: Experimental study,2013 5th InternationalConference on Modelling, Identification and Control (ICMIC),2013年09月02日,pp.328-332
【文献】R.B. Santos et al.,Real-Time Monitoring of Gas Pipeline through Artificial Neural Networks,2013 BRICS Congress on ComputationalIntelligence and 11th Brazilian Congress on Computational Intelligence,2013年,pp.329-334
【文献】Mohammed S. El Abbasy et al.,Artificial neural network models for predicting condition of offshore oil and gas pipelines,Automation in Construction 45,2014年,pp.50-65
【文献】Rui Wang et al.,Pipe Failure Prediction: A Data Mining Method,ICDE Conference 2013,2013年,pp.1208-1218
【文献】Brett Lantz,Rによる機械学習,株式会社翔泳社,2017年03月02日,pp.18-21,284-304,311-313,326-334
【文献】辺 松 外3名,機械学習による経年劣化タイミング解析手法,情報処理学会 シンポジウム DAシンポジウム 2016,2016年09月07日,pp.44-49
【文献】叶賀 卓 外1名,単極脳波信号を用いたトランプゲーム中の子どもの喜怒哀楽予測モデル構築,電気学会研究会資料,2014年09月01日,pp.117-120
【文献】下田 倫大 ,詳解 Apache Spark 初版 ,株式会社技術評論社 ,2016年06月01日,pp.206-211,223
(58)【調査した分野】(Int.Cl.,DB名)
G06Q 10/00 - 99/00
G06N 20/00
(57)【特許請求の範囲】
【請求項1】
パイプ漏れを予測するための、コンピュータによって実施される方法であって、
第1のデータ項目および第1の複数のパイプのそれぞれのパイプに関連付けられる既知の漏れを含む訓練用データセットにアクセスすることを備え、前記第1のデータ項目は前記第1の複数のパイプのそれぞれのパイプの特性を含み、前記パイプの特性は、前記パイプの長さと、前記パイプの土壌抵抗率と、前記パイプの最大圧力定格と、前記パイプの標高とを含み、前記方法はさらに、
教師付き機械学習技術を適用して、パイプの漏れ予測を判断するように構成される予測モデルを、前記第1の複数のパイプのそれぞれのパイプに関連付けられる前記第1のデータ項目に基づいて訓練することにより生成することを備え前記予測モデルは、ランダムフォレストモデルを含み、前記方法はさらに、
第2のデータ項目および第2の複数のパイプのそれぞれのパイプに関連付けられる既知の漏れを含む検証データセットにアクセスすることを備え、前記第2のデータ項目は前記第2の複数のパイプのそれぞれの前記パイプの特性を含み、前記方法はさらに、
前記予測モデルを検証することを備え、前記予測モデルを検証することは、少なくとも、
前記予測モデルを前記第2のデータ項目に適用することにより、前記第2の複数のパイプのそれぞれのパイプの漏れ予測のセットを判断することと、
前記第2の複数のパイプのそれぞれのパイプの漏れ予測を前記第2の複数のパイプのそれぞれのパイプの既知の漏れと比較して、前記第2の複数のパイプのそれぞれのパイプの漏れ予測の正答率を判断することと、
前記第2の複数のパイプのそれぞれのパイプの漏れ予測の正答率に基づいて混同行列を生成することと、
前記混同行列に基づいて、前記第2の複数のパイプのそれぞれのパイプの漏れ予測の正答率に関連付けられる真陽性率、偽陽性率、真陰性率、および偽陰性率を判断することと、
前記真陽性率が第1のしきい値を超えていると判断することと、
前記真陰性率が第2のしきい値を超えていると判断することとによって行われ、前記方法はさらに、
第3の複数のパイプに関連付けられる第3のデータ項目を含むパイプラインデータセットにアクセスすることを備え、前記第3のデータ項目は前記第3の複数のパイプのそれぞれの前記パイプの特性を含み、前記方法はさらに、
前記予測モデルを前記パイプラインデータセットに適用して、前記第3の複数のパイプのそれぞれのパイプの漏れ予測を判断することを備える、方法。
【請求項2】
前記第1のしきい値は、前記予測モデルの適用からの前記第2の複数のパイプのそれぞれのパイプの漏れ予測のセットの統計分布に基づいて自動的に判断される、請求項1に記載の方法。
【請求項3】
前記第2のしきい値は、前記予測モデルの適用からの前記第2の複数のパイプのそれぞれのパイプの漏れ予測のセットの統計分布に基づいて自動的に判断される、請求項1または2に記載の方法。
【請求項4】
前記第3の複数のパイプのそれぞれのパイプの判断された漏れ予測に基づいて、前記第3の複数のパイプのそれぞれのパイプをオーダーすることをさらに備える、請求項1~のいずれか1項に記載の方法。
【請求項5】
コンピューティングシステムであって、
1つ以上のデータストアを備え、前記1つ以上のデータストアは、
第1のデータ項目および第1の複数のパイプのそれぞれのパイプに関連付けられる既知の漏れを含む訓練用データセットを格納し、前記第1のデータ項目は前記第1の複数のパイプのそれぞれのパイプの特性を含み、前記パイプの特性は、前記パイプの長さと、前記パイプの土壌抵抗率と、前記パイプの最大圧力定格と、前記パイプの標高とを含み、前記1つ以上のデータストアはさらに、
第2のデータ項目および第2の複数のパイプのそれぞれのパイプに関連付けられる既知の漏れを含む検証データセットを格納し、前記第2のデータ項目は前記第2の複数のパイプのそれぞれの前記パイプの特性を含み、前記コンピューティングシステムはさらに、
コンピュータプロセッサと、
コンピュータ読取可能記憶媒体とを備え、前記コンピュータ読取可能記憶媒体は命令を格納し、前記命令は、前記コンピュータプロセッサによって実行されると、前記コンピュータプロセッサに、
前記訓練用データセットにアクセスさせ、
教師付き機械学習技術を適用させて、パイプの漏れ予測を判断するように構成される予測モデルを、前記第1の複数のパイプのそれぞれのパイプに関連付けられる前記第1のデータ項目に基づいて訓練することにより生成させ、
前記検証データセットにアクセスさせ、
前記予測モデルを検証させるよう構成され、前記予測モデルは、ランダムフォレストモデルを含み、前記予測モデルを検証することは、少なくとも、
前記予測モデルを前記第2のデータ項目に適用することにより、前記第2の複数のパイプのそれぞれのパイプの漏れ予測のセットを判断することと、
前記第2の複数のパイプのそれぞれのパイプの漏れ予測を前記第2の複数のパイプのそれぞれのパイプの既知の漏れと比較して、前記第2の複数のパイプのそれぞれのパイプの漏れ予測の正答率を判断することと、
前記第2の複数のパイプのそれぞれのパイプの漏れ予測の正答率に基づいて混同行列を生成することと、
前記混同行列に基づいて、前記第2の複数のパイプのそれぞれのパイプの漏れ予測の正答率に関連付けられる真陽性率、偽陽性率、真陰性率、および偽陰性率を判断することと、
前記真陽性率が第1のしきい値を超えていると判断することと、
前記真陰性率が第2のしきい値を超えていると判断することとによって行われ、前記命令は、さらに、前記コンピュータプロセッサによって実行されると、前記コンピュータプロセッサに、
第3の複数のパイプに関連付けられる第3のデータ項目を含むパイプラインデータセットにアクセスさせ、
前記予測モデルを前記パイプラインデータセットに適用させて、前記第3の複数のパイプのそれぞれのパイプの漏れ予測を判断させるよう構成され
前記第3のデータ項目は前記第3の複数のパイプのそれぞれの前記パイプの特性を含む、コンピューティングシステム。
【請求項6】
コンピュータプロセッサに請求項1~のいずれか1項に記載の方法を実行させるためのコンピュータ読取可能プログラム。
【発明の詳細な説明】
【技術分野】
【0001】
関連出願への相互参照
この出願は、「A NOVEL AUTONOMOUS ARTIFICIALLY INTELLIGENT SYSTEM TO PREDICT PIPE LEAKS(パイプ漏れを予測する新規な自律的人工知能システム)」と題される2017年11月21日に出願された米国非仮出願第15/820,316号および2017年4月13日に出願された米国仮出願第62/485,314号の利益ならびに優先権を主張し、その全体をすべての目的のためにここに引用により援用する。
【背景技術】
【0002】
背景
公益企業は、多くの場合、パイプを使用して公益を伝達および配送する(例:水を配送するパイプ)。しかしながら、時間の経過とともに、これらのパイプはさまざまな理由で故障し、漏れが発生し始める可能性がある。これらの漏れは、多くの理由で公益企業にとって非常にコストがかかる。公益企業は、漏れの損失(例えば、パイプから漏れる水のコスト)または漏れに関連する損害(例えば、水に起因する洪水)を負担しなければならないかもしれない。また、一部のパイプは簡単にアクセスできず(たとえば、地下に埋められている)、場合によっては漏れがすぐには分からないかもしれないため、漏れの識別および修理に関連するコストもかかる。パイプの漏れは、水道本管の破損や陥没穴を引き起こし、それは、環境や公衆衛生への危険に加えて、周囲の事業への経済的損害、税金の浪費、交通遅延、機会費用を引き起こす。漏れているパイプを修理するには、公益企業は水を他のパイプに経路付けし直す必要がある。これにより、これらのパイプに大量の追加のストレスがかかり、非常に広い地理的領域および元のパイプ漏れから遠く離れた場所でパイプ漏れの連鎖反応を引き起こす可能性がある。さらに、特定のパイプが漏れるかどうかを予測する機能により、公益企業は、漏れの可能性を減らす将来のパイプの建設入札契約の新たな製造業者購入基準を設計および実施できる。
【0003】
これらの公益企業は、どのパイプが漏れるのかを事前に予測できることから多大な利益を得、なぜならば、それにより、企業はそれらの資源を、これらの漏れが発生する前に止めることに充てることができるであろうからである。しかしながら、実際には、これを行うのは非常に困難であり得る。さまざまな例において、パイプはさまざまな寸法および材質のものであり、さまざまな場所および方法で設置されている。言い換えれば、特定のパイプが漏れるかどうかは、多くの因子によって決定され得る。
【0004】
したがって、パイプ漏れに影響を与える多数の因子を考慮に入れることができる、信頼性が高く正確なパイプ漏れ予測システムが必要とされている。本開示の実施形態は、少なくともこれらのニーズに対処することに向けられている。
【発明の概要】
【課題を解決するための手段】
【0005】
簡単な要約
本開示に記載される実施形態は、パイプ(例えば、水などの何らかの物質を運ぶ公益事業設備パイプ)が漏れそうであるかどうかを予測するように構成されたパイプ漏れ予測システムに向けられる。パイプ漏れ予測システムは、1つ以上の機械学習技術に基づいた予測モデルを含み得る。たとえば、予測モデルは、出力をランダムフォレストモデルなどのカテゴリ(たとえば、漏れありまたは漏れなし)に分類するための教師付き機械学習法を用いて生成できる。予測モデルは、訓練用データセットに含まれるパイプについてのデータを用いて訓練でき、訓練用データセットは、さまざまなパイプの特性に関する情報(例えば、それらのパイプの寸法、それらのパイプの材料、それらのパイプの年齢、それらのパイプの位置など)、およびそれらのパイプが漏れているかどうかについての知識を含むことができる。予測モデルは、訓練用データセットのデータを用いて、漏れのないパイプに関連付けられるパターンおよび漏れのあるパイプに関連付けられるパターンを判断することができる。これらのパターンを任意のパイプの特性に適用して、そのパイプが漏れるかどうかを予測できる。
【0006】
いくつかの実施形態においては、予測モデルが生成されると、パイプ漏れ予測をそれらのパイプのうちどれが実際に漏れたかの知識と比較することにより、予測モデルを検証データセットに対して検証することができる。その後、これらの結果に基づいて混同行列を生成し、それを解釈して、予測モデルに関する貴重な洞察を得ることができる。予測モデルが検証されると、予測モデルを任意のパイプに適用して、そのパイプが漏れるかどうかを予測し得る。漏れそうであると識別されたパイプは、潜在的な修理または予防保守のためにさらなる調査に割り当てることができる。
【0007】
いくつかの実施形態では、パイプ漏れを予測するためのコンピューティングシステムおよび/またはコンピュータによって実施される方法が開示される。たとえば、この方法は、第1のデータ項目および第1の複数のパイプのそれぞれのパイプに関連付けられる既知の漏れを含む訓練用データセットにアクセスすることを備え得、第1のデータ項目はそれぞれのパイプの特性を含む。教師付き機械学習技術をこの訓練用データセットに適用して予測モデルを生成し、この予測モデルは、第1の複数のパイプのそれぞれのパイプに関連付けられる第1のデータ項目に基づいて訓練されることによりパイプの漏れ予測を判断するように構成される。予測モデルが生成されると、この方法は、さらに、第2のデータ項目および第2の複数のパイプのそれぞれのパイプに関連付けられる既知の漏れを含む検証データセットにアクセスすることを備え、第2のデータ項目はそれぞれのパイプの特性を含む。検証データセットを用いて、予測モデルを第2のデータ項目に適用することにより第2の複数のパイプのそれぞれのパイプの漏れ予測のセットを判断することによって予測モデルを検証することができる。第2の複数のパイプのそれぞれのパイプの漏れ予測を第2の複数のパイプのそれぞれのパイプの既知の漏れと比較して、第2の複数のパイプのそれぞれのパイプの漏れ予測の正答率を判断することができる。その後、第2の複数のパイプのそれぞれのパイプの漏れ予測の正答率に基づいて混同行列を生成することができる。混同行列から、第2の複数のパイプのそれぞれのパイプの漏れ予測の正答率に関連付けられる真陽性率および真陰性率を判断することができる。予測モデルが有効であると判断される(たとえば、真陽性率が第1のしきい値を超えると判断され、真陰性率が第2のしきい値を超えると判断される)と、この方法は、さらに、第3の複数のパイプに関連付けられる第3のデータ項目を含むパイプラインデータセットにアクセスすることを備える。検証された予測モデルをこのパイプラインデータセットに適用して、第3の複数のパイプのそれぞれのパイプの漏れ予測を判断することができる。
【図面の簡単な説明】
【0008】
図1】本開示の実施形態によるパイプ漏れ予測のシステム図を示す。
図2】本開示の実施形態によるパイプ漏れ予測のフローチャートを示す。
図3】本開示の実施形態によるさまざまなパイプに関連付けられた例示的なデータを示す。
図4】本開示の実施形態によるパイプデータベース内のパイプレコードの例示的な数字を示す。
図5】本開示の実施形態によるランダムフォレストモデルの混同行列を示す。
図6】本開示の実施形態によるランダムフォレストモデルの変数重要度プロットを示す。
図7】本開示の実施形態によるロジスティック回帰の確率の統計的分布を示す。
図8】本開示の実施形態によるロジスティック回帰の混同行列を示す。
図9】本開示の実施形態によるロジスティック回帰の係数のリストを示す。
図10】本開示の実施形態による単純ベイズモデルの混同行列を示す。
図11】本開示の実施形態によるパイプ漏れ予測を実施するためのブロック図を示す。
図12】本開示の実施形態によるパイプ漏れ予測のためのハイブリッドシステム図を示す。
図13】実施形態の1つを実施するための分散型システムの簡略図を示す。
図14】本開示の実施形態に従って、実施形態システムのコンポーネントによって提供されるサービスをクラウドサービスとして提供することができるシステム環境のコンポーネントの簡略ブロック図である。
図15】本発明のさまざまな実施形態を実施することができる例示的なコンピュータシステムを示す。
【発明を実施するための形態】
【0009】
詳細な記載
以下の記載では、説明の目的で、本発明の実施形態の完全な理解のために、特定の詳細が述べられる。しかしながら、これらの特定の詳細なしでさまざまな実施形態を実施できることは明らかであろう。図および記載は、限定することを意図したものではない。
【0010】
いくつかの図に描かれているシステムは、さまざまな構成で提供され得る。特定の実施形態では、システムは、システムの1つ以上のコンポーネントがクラウドコンピューティングシステムの1つ以上のネットワークにわたって分散される分散型システムとして構成されてもよい。特定の実施形態では、システムは、仮想環境または非仮想環境で動作するように構成されてもよい。
【0011】
導入
パイプ漏れ予測システムは、パイプが故障する可能性があるかどうかを事前に予測するために、公共企業(例:水、ガス、下水などを輸送する企業)またはエネルギー探査/生産企業(例:パイプを介して石油、ガス、燃料を輸送する企業)など、パイプを用いる任意の実体によって用いられ得る。この予測は、パイプのメンテナンスを実行するなどの予防策を講じるために使用できる。
【0012】
パイプ漏れを予測するいくつかの従来の方法は理論に基づいており、経験的データではなく仮定に依存し得る。例えば、パイプ漏れ予測システムの一実施形態は、過去のパイプ漏れの履歴などの因子が最も重要な因子であると想定している。言い換えれば、パイプが過去にすでに漏れているかどうかは、パイプが将来再び漏れるかどうかの最も重要な決定因子である。しかしながら、このようなシステムは、他の重要な因子を見落とす可能性があり、経験的に検証または完全に理解されていない仮定に依存する可能性もある。たとえば、あるシステムは、以前に漏れたパイプは再び漏れる可能性が高いと正しく仮定するかもしれないが、そのようなシステムは、そもそもそのパイプが漏れた理由についての説明を提供しない。したがって、そのようなシステムは、その予測が、パイプが以前に漏れたことに非常に依存しているため、パイプにおける最初の漏れの発生を予測するのにはあまり役に立たない。
【0013】
代わりに、本開示のさまざまな実施形態は、パイプ漏れを予測するように設計された、データに基づくパイプ漏れ予測システムに向けられる。このようなシステムは、パイプ漏れに関する任意の利用可能なデータをして語らしめ、このシステムは、重要な因子または重要でない因子を自身で判断できる。いくつかの実施形態では、このパイプ漏れ予測システムは、異なる因子の相対的な重要度およびそれらの因子間の任意の関係(たとえば、相関/原因)を判断することもできる場合がある。この判断を用いて、パイプの初回漏れを正確に予測し、パイプ漏れの根本的な原因をより深く理解することができる。
【0014】
いくつかの実施形態では、パイプ漏れ予測システムは、大量のデータを利用するように設計されてもよい。いくつかの実施形態では、パイプ漏れ予測システムは、パイプ(たとえば、多数のパイプのデータを考慮する)および因子(たとえば、パイプ漏れに影響を与える可能性のある多種多様な因子のデータを考慮する)に関してできるだけ多くのデータを考慮し得る。したがって、システムは数千または数百万のパイプのデータを考慮し、各パイプの多数の属性または因子に関するデータがある場合がある。より多くのパイプおよび因子が追跡されるにつれて、システムによって考慮されるデータのサイズは大幅に増加する。場合によっては、データの合計サイズがギガバイトまたはテラバイトを超えることがあり、人間がすべてのデータを利用して暗算やペンと紙の計算を行うことは不可能であろう。本開示の実施形態は、他の方法を免れるであろうパイプ漏れの多数のケースを正確に予測するために、膨大な量のデータのデータ駆動型分析を可能にする。
【0015】
いくつかの実施形態では、パイプ漏れ予測システムは、さまざまな機械学習アルゴリズムを利用してもよい。特に、パイプ漏れ予測システムは、既知のパイプ漏れに関する既存のデータを用いて予測モデルを訓練するように、教師付き機械学習技術を用い得る。このような教師付き機械学習技術には、限定ではなく、例として、分析学習、人工ニューラルネットワーク、逆伝播、ブースティング(メタアルゴリズム)、ベイジアン統計、事例ベース推論、決定木学習、帰納論理プログラミング、ガウス過程回帰、データ処理のグループ法、カーネル推定器、学習オートマトン、学習分類器システム、最小メッセージ長(決定木、決定グラフなど)、多重線形部分空間学習、単純ベイズ分類器、最大エントロピー分類器、条件付きランダムフィールド、最近傍アルゴリズム、確率的で近似的に正しい学習(PAC)学習、リップルダウンルール、サポートベクターマシン、最小複雑度マシン(MCM)、ランダムフォレスト、分類器のアンサンブル、順序分類、データの前処理、および統計的関係学習が含まれる。
【0016】
いくつかの実施形態では、パイプ漏れ予測システムは、パイプについての入力データを用いて各パイプを1つ以上のカテゴリ(たとえば、漏れそうである、または漏れそうでない)に分類する分類ベースの教師付き機械学習技術を利用し得る。分類タイプの教師付き機械学習技術の例には、サポートベクターマシン(SVM)、ニューラルネットワーク、単純ベイズ分類器、決定木、適応的ブースティング(Adaboost)、エクストリーム勾配ブースティング(XGBoost)、判別分析、最近傍法(kNN)が含まれる。
【0017】
いくつかの実施形態では、パイプ漏れ予測システムは、パイプについての入力データを用いてさまざまなパイプの連続応答値(たとえば、パイプが漏れそうになる前の漏れの確率または時間の量)を計算するために、回帰ベースの教師付き機械学習技術を利用することがある。回帰タイプの教師付き機械学習技術の例には、線形回帰、投げ縄回帰、リッジ回帰、エラスティックネット回帰、部分最小二乗回帰、多項式回帰、ランダムフォレスト、SVM、XGBoost、Adaboost、非線形回帰、一般化線形モデル、決定木、ニューラルネットワークなどが含まれる。いくつかの実施形態では、パイプ漏れ予測システムは、時間を考慮した予測を行うように構成されてもよい。言い換えれば、システムは、パイプがいつ故障するかだけでなく、故障する時間を予測し得る。たとえば、システムは、パイプが100日以内に故障すると予測し得る。
【0018】
いくつかの実施形態では、パイプ漏れ予測システムは、異なる予測モデルまたは機械学習技術の組み合わせを利用してもよい。さまざまな機械学習技術にはさまざまな利点および欠点があるため、異なる目的に利用され得る。たとえば、ある機械学習技術を用いて、ある結果または情報のセットを取得でき、別の機械学習技術を用いて、他方の技術では取得できない別の結果または情報のセットを取得できる。場合によっては、ある機械学習技術を用いて、別の機械学習技術の結果を検証できる。場合によっては、複数の機械学習技術をアンサンブルで組み合わせて、コンポーネント手法を超えて予測正答率を高めることができる。
【0019】
本開示では、機械学習技術の組み合わせとして、ランダムフォレスト、一般化線形モデル(例えば、ロジスティック回帰モデル)、および単純ベイズを用いるパイプ漏れ予測システムの実施形態が開示される。しかしながら、この組み合わせは例示のみを目的としており、本願においては、理解を容易にする目的で、継続的に参照される。機械学習アルゴリズムの他の好適な組み合わせが使用されてもよい。
【0020】
例示的な実施の形態
図1は、本開示の実施形態によるパイプ漏れ予測のシステム図を示す。
【0021】
いくつかの実施形態では、パイプ設置業者102は、公益企業などの実体に代わってパイプ(図示せず)を設置する業務を課され得る。パイプ設置業者102は、パイプを設置し、次いで、設置されたパイプに関する詳細をコンピューティングデバイス104を介してパイプ統合システム106に提供することができる。例えば、パイプ設置業者102は、山腹にパイプを設置し、次いでコンピューティングデバイス104を用いて、パイプの位置、パイプの寸法および材料、パイプの目的およびそれが輸送する内容物などに関する情報など、パイプに関連する詳細または属性をパイプ統合システム106に提供することができる。この情報は、特定のパイプが漏れるかどうかを判断する際にパイプ漏れ予測システムによって考慮され得る多数の因子についてのデータを含み得、パイプの詳細/属性の他の例を図3に示す。パイプ統合システム106は、パイプに関するこのデータをパイプデータベース108に格納することができ、パイプデータベース108は、公益企業によって設置されたさまざまなパイプ(例えば、パイプ120-1から120-N)のデータを含むことができる。
【0022】
いくつかの実施形態では、パイプの特定の詳細がすでに既知である場合があるため、パイプ設置業者102はこの情報をパイプ統合システム106に供給する必要がない場合がある。例えば、パイプ設置業者102は、パイプ製造業者に設置すべきパイプをオーダーする業務を課されることもあり得る。したがって、パイプに関する特定の詳細をオーダーから取得して、パイプ統合システム106に提供することができ、そのパイプに関する情報がパイプデータベース108ですでに利用可能になる。しかし、パイプ設置業者102は、コンピューティングデバイス104を用いてパイプに関連付けられる情報の一部を更新しなければならない場合がある(例えば、パイプの設置中に、設置場所の条件が予想とは異なることになった、など)。各パイプに関連付けられた情報は、状況が変化するにつれて時間とともに更新する必要がある場合もある。例えば、パイプデータベース108は、各パイプが漏れたかどうかに関する情報を含み得る。漏れのないパイプが漏れを発生させた場合、その情報はパイプデータベース108内で更新する必要があるであろう。この更新は、コンピューティングデバイス104を用いるパイプ設置業者102などによって、パイプ統合システム106を介して、または現場で、行なわれ得る。
【0023】
したがって、パイプデータベース108は、パイプ設置業者102によって設置されたパイプを含む、公益企業によって設置されたさまざまなパイプの、時間とともに変化し更新される、膨大な量のデータを含み得る。これは、図において、パイプ120-1から120-Nに関する情報を含むように示されるパイプデータベース108のコンテンツによって表されている。この情報には、各パイプの仕様、各パイプの目的およびそれによって輸送される内容物などが含まれ得る。パイプデータベース108のデータは、パイプ漏れ予測システム110のための訓練用セットとして用いられ得、それは、漏れを発生させたすべてのパイプ間のパターンを判断するために、さまざまなパイプに関連付けられる情報のすべてを使用し得る。これらのパターンに加えて、パイプ漏れ予測システム110は、パイプが漏れを発生させるかどうかを決定するさまざまな因子間の関係を識別し、その情報を用いて予測モデルを開発することもできる。
【0024】
いくつかの実施形態では、パイプ漏れ予測システム110は、パイプの故障または漏れの発生を予測するために用いることができる。これは、(例えば、パイプ120-1~120-Nの関連情報が時間とともに更新されるにつれ)パイプデータベース108内のパイプ120-1~120-Nに関する予測を行うことを含み得る。パイプ漏れ予測システム110は、パイプデータベース108にまだ導入されていない新たに設置されたパイプなど、パイプデータベース108の外部のパイプについて予測することもできる。例えば、パイプ設置業者102がパイプを設置し(または設置直前でも)、パイプに関連付けられる入力情報をパイプ漏れ予測システム110に提供した後、システムは、そのパイプが故障しそうかどうか、そのパイプがいつ故障しそうか、パイプが故障しそうな確率など、を予測または推定し得る。いくつかの実施形態では、パイプ漏れ予測システム110は、コンピューティングデバイス112を介して、調査員114に、漏れそうであると識別されたパイプのリストを提供することができる場合がある。調査員114は、その情報を用いて、漏れそうであると判断されたパイプを調べて、予防保守を実行する必要があるかどうかを確認でき、または場合によってはすでに漏れ始めているパイプを置換する。
【0025】
図2は、本開示の実施形態によるパイプ漏れ予測のフローチャートを示す。
ブロック202で、訓練用データセット220内に含まれるパイプについてのデータを用いて予測モデルを生成することができる。訓練用データセット220は、パイプデータベース108などの、さまざまなパイプについてのデータを含む、より大きなデータセットのサブセットであってもよい。より大きなデータセットは、予測モデルを訓練するために用いられる訓練用データセット220、および訓練された予測モデルの結果を検証するために用いられる検証データセットに、ランダムに分割され得る。訓練用データセット220は、さまざまなパイプの特性に関する情報(例えば、それらのパイプの寸法、それらのパイプの材料、それらのパイプの年齢、それらのパイプの位置など)を含むことができる。さらに、訓練用データセット220は、それらのパイプのどれが漏れを有していると知られているかに関する情報も含み得る。したがって、予測モデルは、漏れのないパイプに関連付けられたパターンおよび漏れのあるパイプに関連付けられたパターンを判断するために、訓練用データセット220のデータを用いることができる。モデルは、これらのパイプの特性が提供されている場合、これらのパターンを学習および使用して、パイプの漏れを予測し得る。予測モデルは、前述のようなさまざまな機械学習アルゴリズムを用いて生成でき;たとえば、予測モデルは、ランダムフォレストモデル、ロジスティック回帰モデル、単純ベイズモデルなどであり得る。
【0026】
ブロック204で、予測モデルが生成されると、モデルを検証することができる。予測モデルの検証には、サブブロック206、208、および210などの1つ以上のサブブロックを含めることができる。ブロック206で、予測モデルを用いて、検証データセットからのパイプデータを用いてパイプ漏れを予測することができる。たとえば、予測モデルは入力として検証データセット内のさまざまなパイプの特性を取得し、それらを用いてそれらのパイプのいずれが漏れそうかを識別する。同時に、検証データセットには、これらのパイプのどれが実際に漏れたかに関するデータが含まれることになる。したがって、漏れがあると予測されたパイプのセットを実際に漏れのあるパイプのセットと比較して、モデルの正答率を判断することができる。ブロック208において、パイプの既知のステータス(例えば、漏れありまたは漏れなし)に対する予測モデルの結果の比較に基づいて混同行列を生成することができる。この混同行列は、予測モデルによって識別された真陽性、真陰性、偽陽性、および偽陰性の量を示すことができ、それをさらに用いて、予測モデルに関連付けられる正答率を計算することができる。ブロック210では、混同行列を解釈して、予測モデルに関する貴重な洞察を得ることができる。たとえば、混同行列によって、モデルが高い正答率を有していると示される場合、モデルに関連付けられる基礎となる仮定が正しい可能性がある。いくつかの実施形態では、機械学習モデルから人間が読み取れる形式への推論の自動翻訳があり得る(例えば、レポートを、現場の調査員に送信できるPDF形式またはテキストメッセージで生成できる)。これにより、人間は、機械学習アルゴリズムから生じる洞察に集中することができ、かなりの統計/数学の専門知識が必要になる場合があるそれらの数値出力を理解する必要がない。いくつかの実施形態では、ユーザは、モデルの詳細に飛び込んで自分で推論を引き出すか、またはパイプ漏れ予測システムによって直接提供されるモデルからの詳細/推論を得るオプションを有してもよい。
【0027】
ブロック212で、予測モデルが検証されると、予測モデルは、次いで、新たなコホート(例えば、訓練用データセットまたは検証データセットにないパイプ)に適用され得る。例えば、予測モデルは、さまざまなパイプの特性についてのデータを含むパイプラインデータセット222のパイプデータに適用できる。予測モデルは、パイプラインデータセット222内のどのパイプが漏れそうかを識別するために用いられるであろう。
【0028】
ブロック214で、パイプラインデータセット222に適用された予測モデルの結果を解釈することができる。例えば、予測モデルは、パイプラインデータセット222内の漏れそうなパイプのサブセットを特定したかもしれない。これらのパイプは、潜在的な修理または予防保守のためにさらに調査され得る。いくつかの実施形態では、漏れそうなこれらのパイプの識別は、調査員114など、パイプの調査および予測結果の検証を任された調査員に与えられ得る。パイプ漏れ予測システムは、コンピューティングデバイス112を介してパイプラインデータセット222内の漏れそうなパイプを調査員114に通知し得、調査員114は彼/彼女のリソースを用いてそれらの識別されたパイプを調査することができる。
【0029】
図3は、本開示の実施形態によるさまざまなパイプに関連付けられた例示的なデータを示す。
【0030】
より具体的には、図3は、列302に示される「fid」(例えば、パイプID)および列304に示される「wsm_nbr」(例えば、追跡番号)に基づいて識別される6つのパイプに関連する生データを示す。たとえば、第1のパイプのfidは「9277583」で、wsm_nbrは「172-147」である。パイプごとにさまざまな種類の情報を利用できる。しかしながら、このリストは網羅的であることを意味するものではなく、図1のパイプデータベース108にデータをどのように格納できるかを示すなどの例示目的のためのものであり;パイプに関連付けられる他のデータを含めて、予測モデルの生成時にパイプ漏れ予測システムで考慮することができる。
【0031】
いくつかの実施形態において、データは、パイプがどのように使用され得るかを示すカテゴリ変数を示す列306(ヘッダ「use_type(使用タイプ)」で示される)を含み得る。パイプについてのさまざまな使用タイプについての変数の例には、DIST(例:配給)、TRUNK(例、供給幹線)、IRRIG(例、灌漑)、DECOM(例、分解管)、WELL(例、井戸)、CHLOR(例、塩素)、DRAIN(例、排水管)、AMMONIA(例、アンモニア)、RECL(例、再生水管)、MANIFOLD(例、マニホールド管)、LSLATERAL(例、個人所有の下水道)、および#NULL#(パイプの使用が不明であるか、または使用タイプに関する他のカテゴリの1つに準拠していないことを示す場合がある)が含まれる。たとえば、列306は、6つのパイプすべてについてDISTを示し、6つのパイプの各々が配給に用いられることを示す。さまざまなパイプの使用タイプを追加することで、パイプ漏れ予測システムは、特定の使用タイプがパイプで漏れを引き起こす可能性がより高いかどうかを判断でき得る。
【0032】
いくつかの実施形態では、データは、パイプの幅を示す数値変数を示す列308(ヘッダ「pipe_diam(パイプ直径)」で示される)を含むことができる。任意の測定単位を事前に指定して用いることができる。図において、列308の数字は、各パイプの幅をインチで表してもよい。例えば、列308は、第1のパイプに関連付けられた値「12」を有し、これは、第1のパイプが12インチの直径を有することを示し得る。各パイプの直径を知ることにより、パイプ漏れ予測システムは、パイプの直径がパイプ漏れの可能性をどのように増加または減少させ得るかを判断し得る。
【0033】
いくつかの実施形態では、データは、パイプがどれくらいの長さであるかを示す数値変数を意味する列310(ヘッダ「len_ft」で示される)を含むことができる。任意の測定単位を事前に指定して用いることができる。図において、列310の数字は、各パイプの長さをフィートで表してもよい。たとえば、列310の第1のパイプに関連付けられる値は329.76であり、これは、第1のパイプの長さがほぼ330フィートであることを示し得る。各パイプの長さを知ることにより、パイプ漏れ予測システムは、パイプの長さがパイプ漏れの可能性をどのように増加または減少させ得るかを判断し得る。
【0034】
いくつかの実施形態では、データは、パイプの壁がどのくらいの厚みであるかを示す数値変数を示す列312(ヘッダ「thickness(厚み)」で示される)を含んでもよい。任意の測定単位を事前に指定して用いることができる。図において、列312の数字は、各パイプの壁の厚みをインチで表してもよい。例えば、列312は、第1のパイプに関連付けられる0.71の値を有し、これは、第1のパイプが4分の3インチの厚みを有することを示し得る。各パイプの壁の厚みを知ることにより、パイプ漏れ予測システムは、パイプの壁厚がパイプ漏れの可能性をどのように増加または減少させ得るかを判断し得る。常識では、より厚い壁はパイプ漏れの可能性を減じることを示唆するが、常識では、他の因子と比較して壁の厚みの相対的な重要度を識別することはできない。たとえば、パイプの直径が半分になり、壁の厚みが3分の1に減じられた場合、常識では、漏れの可能性が増加したか減少したかを知らせるのには役立たないであろう。
【0035】
いくつかの実施形態では、データは、パイプの材料を示すカテゴリ変数を示す列314(ヘッダ「material(材料)」で示される)を含むことができる。パイプのさまざまな材料の変数の例には、CI(例、鋳鉄)、STL(例、鋼)、AC(例、アスベストセメント)、DI(例、ダクタイル鋳鉄)、COP(例、銅)、HDPE(例、高密度ポリエチレン)、CONC(例、コンクリート)、PVC(例、ポリ塩化ビニル)、CM(例、波形金属)、BRS(例、真鍮)、PP(例、ポリプロピレン)が含まれる。例えば、列314は、第1のパイプに対してCIを示し、これは第1のパイプが鋳鉄で作られていることを示すことができる。さまざまなパイプについてさまざまな材料を追加することで、パイプ漏れ予測システムは、特定の材料の使用がパイプの漏れを引き起こす可能性がより高いかどうかを判断し得る。
【0036】
いくつかの実施形態では、データは、パイプのライニングが取り替えられているかどうかを示すカテゴリ変数を示す列316(ヘッダ「relined(ライニングが取り替えられた)」で示される)を含むことができる。変数の例には、CLおよび#NULL#(パイプのライニングが取り替えられていないことを示し得る)が含まれる。例えば、列316は、第1のパイプに対して#NULL#を示し、それは第1のパイプのライニングが取り替えられていないことを示し得る。各パイプのライニングが取り替えられているかどうかを知ることで、パイプ漏れ予測システムは、パイプ漏れの可能性に対するパイプのライニングに取り替えの影響を判断し得る。
【0037】
いくつかの実施形態において、データは、列318(ヘッダ「plr_num」で示される)および列320(ヘッダ「plr_year」で示される)を含むことができ、後者は、パイプが設置される年の数値変数を意味し得る。例えば、列320は、第1のパイプに対して1934を示し、それは第1のパイプが1934年に設置されたことを示し得る。各パイプが設置された年を知ることにより、パイプ漏れ予測システムは、パイプ漏れの可能性に対する設置年の影響(例:おそらく数年間パイプが不適切に設置され、漏れる可能性がより高い)を判断し得る。
【0038】
いくつかの実施形態では、データは、パイプが設置される土壌の抵抗率についての数値変数を示す列322(ヘッダ「soil_res」で示される)を含んでもよい。つまり、この列は、パイプが設置されている土壌の腐食性を示す。腐食によりパイプが腐食するため、腐食性土壌にある新品のパイプの方が、非腐食性土壌にある古いパイプよりも早く漏れることが予想され得る。より高い値の土壌抵抗率ほど、より低い腐食性に関連付けられ得る。例えば、列322は、第1のパイプの土壌抵抗率について1138を示し、第2のパイプの土壌抵抗率について3601を示し、これは第2のパイプがより腐食性の低い土壌に位置することを示し得る。各パイプが位置する土壌の相対的な腐食性を知ることにより、パイプ漏れ予測システムは、パイプの漏れの可能性に対する土壌腐食性の影響を判断し得る。
【0039】
一部の実施形態では、データは、パイプが漏れた回数についての数値変数を示す列324(ヘッダ「leak_freq」で示される)を含むことができる。つまり、値0は、パイプがまだ漏れしていないことを示す。図に示されるように、列324は、第1のパイプの漏れ頻度について0を示し、これは、第1のパイプがまだ漏れていないことを示し得る。これは、パイプが漏れたかどうかのカテゴリ変数(たとえば、「N」または「Y」の値)を示す列326(ヘッダ「leak_yn」で示される)に適切に対応する。列326は、第1のパイプについて、列324の0の値に適切に対応するNの値を有し、第1のパイプがまだ漏れていないことを示す。場合によっては、以前に漏れたパイプが再び漏れる可能性が高くなったかもしれない。パイプが以前に漏れたかどうかを知ることにより、パイプ漏れ予測システムは、パイプ漏れの可能性に対する以前の漏れの影響を判断し得る。
【0040】
いくつかの実施形態では、データは、パイプが地理的にどこに位置するかを示すカテゴリ変数を示す列328(ヘッダ「district(地区)」で示される)を含むことができる。変数の例には、East Valley(東谷地区)、Western(西部地区)、West Valley(西谷地区)、Harbor(港湾地区)、およびCentral(中央地区)が含まれる。地理的位置の、他の変数または概念が用いられてもよい。図では、列328は、第1のパイプがどこにあるかを示すために、第1のパイプについて、East Valleyの値を有する。パイプの位置は、(たとえば、その地理的位置の土壌の構成により)パイプの漏れの可能性に何らかの影響を与える可能性があり、したがって、この情報により、パイプ漏れ予測システムはその影響を判断できる。
【0041】
いくつかの実施形態では、データは、パイプの年齢についての数値変数を意味する列330(ヘッダ「pipe_age(パイプ年齢)」で示される)を含むことができる。例えば、列330は、第1のパイプについて、それが82年の年齢であることを示し得る値「82」を有する。
【0042】
いくつかの実施形態において、データは、パイプの材料の寿命に関する数値変数を示す列332(ヘッダ「material_life(材料寿命)」で示される)を含み得る。例えば、列330は第1のパイプについて値「100」を有し、これは、鋼で形成される第4のパイプの120年の材料寿命と比較して、第1のパイプを構成する鉄が100年の寿命を有することを示し得る。
【0043】
いくつかの実施形態では、データは、パイプが製造業者の仕様に対してどれだけ古いかを示す数値変数を示す列334(ヘッダ「pct_life」で示される)を含むことができる。いくつかの実施形態では、パイプの百分率寿命は、パイプが材料寿命(たとえば、列332)に対してどれくらい古いか(たとえば、列330)を判定することによって計算され得る。たとえば、第1のパイプの年齢は82年で、材料寿命は100年であり、その結果、列334に示される値は82%である。パイプのその寿命に対する古さの、この正規化されたメトリックは、パイプ漏れ予測システムによって使用されて、パイプの相対年齢がそのパイプ漏れの可能性にどのように影響し得るかを判断し得る。
【0044】
いくつかの実施形態では、データは、パイプが耐えることができる最大圧力についての数値変数を示す列336(ヘッダ「max_pressure(最大圧力)」で示される)を含むことができる。任意の測定単位を事前に指定して用いることができる。図においては、列336の数字は、パイプが1平方インチあたりポンド(psi)で耐えることができる圧力を表してもよい。たとえば、列336は、第1のパイプについて333を示し、それは第1のパイプが333psiの最大圧力を定格とされていることを示し得る。パイプ漏れ予測システムは、この情報を用いて、パイプ漏れの可能性に対する最大圧力定格の影響を判断し得る。
【0045】
いくつかの実施形態では、データは、パイプの標高についての数値変数を示す列338(ヘッダ「pipe_elevation(パイプ標高)」で示される)を含んでもよい。任意の測定単位を事前に指定して用いることができる。図において、列338の数字は、パイプの標高をフィート単位で表してもよい。例えば、列338は、第1のパイプに対して666を示し、それは、第1のパイプが海抜666フィートに位置することを示し得る。パイプ漏れ予測システムは、この情報を用いて、パイプの標高がパイプ漏れの可能性に及ぼす影響を判断し得る。
【0046】
いくつかの実施形態では、データは、パイプが丘陵地にあるかどうかを示すカテゴリ変数(例えば、「N」または「Y」の値)を示す列340(ヘッダ「within_hill(丘陵地内)」で示される)を含み得る。例えば、列340は、第1のパイプに対してNを示し、それは、第1のパイプが丘陵地に位置していないことを示し得る。直感的には、丘陵地にあるパイプは、丘陵地からパイプにかかる追加の圧力のため、漏れる可能性がより高くなり得る。パイプ漏れ予測システムは、この確認を用いて、その直感を確認し、パイプが丘陵地にあるかどうかがパイプ漏れの可能性に与える影響を判断し得る。
【0047】
図4は、本開示の実施形態によるパイプデータベース内のパイプレコードの例示的な数字を示す。
【0048】
より具体的には、図4は、265,293本のパイプに関連する情報を含むパイプデータベース402を示す。これらのパイプのうち、256,803本には漏れがなく、8,490本のパイプには漏れがある。パイプデータベース402内のこのデータは、パイプ漏れ予測システムを訓練して漏れを検出するために使用でき、本明細書で開示される例示的な実施形態は、これら265,293本のパイプの場合において説明されるさまざまな機械学習モデルを利用し得る。
【0049】
図5は、本開示の実施形態によるランダムフォレストモデルの混同行列を示す。
いくつかの実施形態では、さまざまなパイプに関連付けられる利用可能なデータのすべて(例えば、図3に示されるものと同様のデータ)を用いて、予測モデルを訓練および構築することができる。そのような実施形態のいくつかでは、構築される第1のモデルは、非線形モデルであるランダムフォレストモデルであり得る。一般に、非線形モデルは、線形モデルよりも訓練に時間がかかり得る。
【0050】
いくつかの実施形態では、ランダムフォレストモデルを用いて、図3に示される因子またはパイプ属性などの11個の因子の組み合わせに基づいてパイプが漏れるかどうかを予測し得る。これらの11の因子から除外されるのは、漏れ頻度に関連付けられる入力変数(例えば、図3の「leak_freq」変数)であり得る。これは意図的であり、なぜならば、既存の専門家ベースのモデルは、パイプが漏れたかどうかの過去の知識が、パイプが将来漏れるかどうかを予測する上で最も重要な因子である、という仮定に基づき得るからである。しかしながら、この仮定は、予測された漏れが、パイプが以前に漏れたかどうかに大きく依存することを意味し、過去に漏れたことがないパイプが漏れるかどうかを予測することを困難なものにする(たとえば、問題をパイプ予報問題に変換する)。対照的に、漏れ頻度の入力を除外することにより、ランダムフォレストモデルは、パイプが実際に漏れたという事前の知識なしに、パイプが漏れるかどうかを予測するように構成され得る。
【0051】
ランダムフォレストモデルは、二値結果の予測をもたらす分類ベースのモデルであり得る。言い換えれば、ランダムフォレストモデルは、ラベル付けされたカテゴリカルな予測(例:パイプが漏れるかどうかについての「はい」または「いいえ」)を生成するように訓練できる。ランダムフォレスト分類の出力は、フォレスト内の個々のツリーの多数決であるため、これらのカテゴリカルな予測は、出力がカットオフまたはしきい値が特定されることをさらに必要とする確率である回帰手法(ロジスティック回帰など)の結果とは異なる。ランダムフォレストモデルは、パイプデータベースからの訓練用セットを用いて訓練できる。たとえば、さまざまなパイプについての情報を含むパイプデータベースは、訓練用セットとテスト/検証セットとにランダムに分割でき、70/30または80/20分割が頻繁に用いられる。ランダムフォレストモデルは、訓練用セットを用いて訓練できる。
【0052】
その後、ランダムフォレストモデルは、パイプラインデータベースからの検証セットを用いて検証およびテストできる。ランダムフォレストモデルを、検証セット内のパイプについてのさまざまな入力とともに用いて、それらのパイプが漏れるかどうかを予測できる。ランダムフォレストモデルからの予測結果は、それらのパイプが漏れたかどうかの検証セットからの実際の知識と比較され得る。その後、混同行列を作成して、パイプについての予測の正答率を、それらのパイプの真のステータスに対して評価し得る。
【0053】
図に関して、図4に示されたデータ(例:265,293本のパイプを含むデータセット)に基づいて生成されたランダムフォレストモデルについて、例示的な混同行列502が図5に示される。混同行列502は、予測を実際の参照値と比較するために4つの象限:256,803の値を有する左上のN-N象限、107の値を有する右上のN-Y象限;0の値を有する左下のY-N象限;8383の値を有する右下のY-Y象限を有する。混同行列502のこれらの象限は、4つの結果:真陰性、偽陰性、真陽性、および偽陽性の数を反映している。
【0054】
256,803の値を有する左上のN-N象限は、真陰性、つまり、モデルが故障しないと予測し、実際に故障しなかったパイプの数を表す。107の値を有する右上のN-Y象限は、偽陰性、つまり、モデルが故障しないと予測したが、実際には故障したパイプの数を表す。0の値を有する左下のY-N象限は、偽陽性、つまり、モデルが故障するであろうと予測したが、実際には故障しなかったパイプの数を表す。8383の値を有する右下のY-Y象限は、真陽性、つまり、モデルが故障するであろうと予測し、実際に故障したパイプの数を表す。
【0055】
モデルの全体的な正答率504は高く、約99.6%である。感度506とも呼ばれるモデルの真陽性率は98.7%であり、モデルが8,490のパイプ漏れのうち8,383(または98.7%)を検出したことに対応する。したがって、「パイプが漏れるか」という質問でプロンプトが表示されると、モデルは98.7%の正確な回答を返すことになる。特異性508とも呼ばれるモデルの真陰性率は100%であり、これは、モデルが256,803本のパイプのうち故障しなかったすべてを正しく判断したことに対応する。したがって、「パイプは漏れないか」という質問でプロンプトが表示されると、モデルは100%正確な回答を返すことになる。したがって、混同行列に示されたこれらの検証結果に基づくと、偽陽性率および偽陰性率は非常に低く、構築されたランダムフォレストモデルは、漏れるパイプおよび漏れないパイプを正確に識別する能力が高いことがわかる。
【0056】
図6は、本開示の実施形態によるランダムフォレストモデルの変数重要度プロットを示す。
【0057】
図5に記載されたランダムフォレストモデルは、パイプ漏れの判定に用いられるさまざまな変数および因子の重要度を判定するためにも用いることができる。さまざまな変数の相対的な重要度を変数重要度プロットでプロットし視覚化できる。
【0058】
図に関して、ランダムフォレストモデルの生成に用いられる11の因子の重要度を示す変数重要度プロット600が図6に示される。変数重要度プロット600は、これらの因子の中で最も重要なものがパイプの長さ、土壌抵抗率、パイプの最大圧力定格、およびパイプの標高であることを示す。特に、パイプの長さおよび土壌の特性は、パイプが丘陵地にあるか、またはパイプがどのように使用されているかよりも、パイプの漏れを判断する上で有意により重要である。実際、これらの4つの変数は非常に重要であるため、ランダムフォレストモデルは、これら4つの変数についてのデータを用いるだけで、パイプが漏れるかどうかについて非常に正確な予測を生成し得る。この情報は非常に有用であり、なぜならば、それは、データ収集に関連して多大なコストがかかる(たとえば、さまざまな因子についての値を各パイプごとに取得するのは困難であるかまたはコストがかかる)場合に、これら4つの変数の値だけを収集することができるので、満足のゆく予測モデルを安価に実現できることを意味するからである。実際、パイプの長さを知るだけで、パイプの漏れに関する比較的正確な予測ができる場合がある。
【0059】
さらに、パイプ漏れの背後にある最も重要な因子に関するこの知識を用いて、パイプの将来の設置を管理し、将来の漏れを防ぐことができる。この知識を用いて、漏れの可能性がより低いパイプを製造業者または供給業者から取得できる。さらに、この情報を用いて、建設入札を勝ち取りたい製造業者が従わなければならないような新たな製造業者要件/基準を設計できる。たとえば、ランダムフォレストモデルでは、パイプが漏れるかどうかに影響することについて、パイプの長さが最も重要な因子であるため、将来のパイプの設置では、長いパイプを避けることができる。これらの長いパイプは、各々漏れが発生する可能性がより低い一連の短いパイプに置き換えることができる。また、変数重要度プロット600によって特定された因子の重要度に関するこの知識は、基礎となるデータに根ざしている。たとえば、腐食性土壌における新品のパイプは、非腐食性土壌における古いパイプよりも寿命がはるかに短くなることが経験的に検証されているため、可能であれば腐食性土壌のない場所でパイプを設置するべきである。
【0060】
変数重要度プロット600は、ランダムフォレストモデルの各因子がどれほど重要であるかを示すが、各因子が具体的に重要である理由を説明していない。それを理解するために、これらの推論を可能にする別のモデルが用いられ得る。場合によっては、機械学習技術となると、予測と推論との間にトレードオフが存在する場合がある。ランダムフォレストモデルは、パイプ漏れの正確な予測を作成するのに優れているが、モデルで用いられる因子の関係に関して推論を行うことは可能にしない。したがって、異なるモデルを用いてこれらの推論を生成し得る。用いることができるさまざまなモデルの例には、ロジスティック回帰モデルまたは単純ベイズモデルが含まれる。
【0061】
図7は、本開示の実施形態によるロジスティック回帰の確率の統計的分布を示す。
いくつかの実施形態では、ランダムフォレストモデルで用いられる因子をよりよく理解するために、ロジスティック回帰モデルを用いることができる。ロジスティック回帰モデルは、一般化線形モデルの一種である。ロジスティック回帰モデルは線形モデルであるため、ランダムフォレストモデルよりも速く訓練できる。
【0062】
しかしながら、ロジスティック回帰モデルは、各パイプをカテゴリ(例:漏れありまたは漏れなし)に分類するのではなく、連続応答値(パイプ漏れの確率など)を生成する点で、ランダムフォレストモデルとは異なる。したがって、ロジスティック回帰モデルを用いて各パイプごとに同様の分類を行うには、カットオフまたはしきい値を指定する必要がある。ロジスティック回帰モデルによって予測されるパイプ漏れの確率がそのしきい値を上回る場合、パイプが漏れそうであると考えることができる。パイプ漏れの確率がそのしきい値を下回ると予測される場合、パイプは漏れそうでないと考えることができる。このように、そのしきい値を超える確率はyesになり、そのしきい値を下回る確率はnoになるため、適切なしきい値を選択する必要がある。
【0063】
適切なカットオフを選択するために、ロジスティック回帰モデルの結果を統計分布にプロットし得る。この統計分布は、ロジスティック回帰モデルによって予測される確率を2つのグループに分割するための自然なカットオフを判断するために用いることができる。
【0064】
図に関して、ロジスティック回帰モデルから生成された確率の統計分布700が図7に示される。たとえば、統計分布700では、yes変数の第3四分位数は0.03レベルの水平の黒いバーである。これがカットオフとして選択された場合、それは、この第3四分位数(0.03)以上で予測される故障の確率はすべて「yes」と見なされ、パイプは漏れることになることを意味するであろう。このカットオフより下で予測される故障の確率は、「no」と考えられるであろう。
図8は、本開示の実施形態によるロジスティック回帰の混同行列を示す。
【0065】
ロジスティック回帰モデルのカットオフが計算されると、ロジスティック回帰モデルの混同行列を構築するために、ロジスティック回帰モデルの予測結果を(たとえば、以前どおりの検証セットを用いて)検証し得る。
【0066】
図に関して、図8に、図4に示されたデータ(例:265,293本のパイプを含むデータセット)に基づいて生成されたロジスティック回帰モデルについて、例示的な混同行列802が示される。混同行列802は、予測を実際の参照値と比較するために4つの象限:196,583の値を有する左上のN-N象限、2123の値を有する右上のN-Y象限;60220の値を有する左下のY-N象限;6367の値を有する右下のY-Y象限を有する。図5の混同行列と同様に、混同行列802のこれらの象限は、4つの結果:真陰性、偽陰性、真陽性、および偽陽性の数を反映する。
【0067】
196,583の値を有する左上のN-N象限は、真陰性、つまり、モデルが故障しないと予測し、実際に故障しなかったパイプの数を表す。2123の値を有する右上のN-Y象限は、偽陰性、つまり、モデルが故障しないと予測したが、実際には故障したパイプの数を表す。60220の値を有する左下のY-N象限は、偽陽性、つまり、モデルが故障するであろうと予測したが、実際には故障しなかったパイプの数を表す。6367の値を有する右下のY-Y象限は、真陽性、つまり、モデルが故障するであろうと予測し、実際に故障したパイプの数を表す。
【0068】
ロジスティック回帰モデルは、ランダムフォレストモデルに比べて正確ではないことがわかる。ロジスティック回帰モデルの全体的な正答率804は約76.5%である。ロジスティック回帰モデルの偽陽性率および偽陰性率もそれほど大きくなく、ランダムフォレストモデルと比較して、多くの偽陽性および偽陰性がある。これは、ロジスティック回帰モデルが線形モデルであるため、パイプ漏れが線形プロセスではないことを示唆している可能性がある。さらに、感度806とも呼ばれるモデルの真陽性率は74.9%であり、これはモデルが8,490のパイプ漏れのうち6,367(または74.9%)を検出したことに対応する。したがって、「パイプが漏れるか」という質問でプロンプトが表示されると、モデルは74.9%の正確な回答を返すことになる。特異度808とも呼ばれるモデルの真陰性率は76.5%であり、これは、モデルが漏れなかった256,803本のパイプのうち196,583本を正確に判断したことに対応する。したがって、「パイプは漏れないか」という質問でプロンプトが表示されると、モデルは76.5%の正確な回答を返すことになる。
【0069】
したがって、混同行列で示されたこれらの検証結果に基づいて、ロジスティック回帰モデルは、パイプ漏れを予測することについて、ランダムフォレストモデルほど正確ではないことがわかる。特に、これは、パイプ漏れデータに非線形性があることを示している可能性があり、なぜならば、基礎データが線形である場合、線形モデルは非線形モデルよりも優れているためである。しかしながら、これで問題ない場合があり;なぜならば、ロジスティック回帰モデルは、推論を可能にし、入力変数間の関係を判断するのに役立ち得、それは、ランダムフォレストモデルからは得られない視点を提供できるからである。たとえば、ロジスティック回帰モデルを用いて、ロジスティック回帰モデルにおける各因子ごとの回帰係数および各因子の統計的有意性を取得できる。
【0070】
図9は、本開示の実施形態によるロジスティック回帰の係数のリストを示す。
より具体的には、ロジスティック回帰モデルに対する係数のリスト902を用いて、ロジスティック回帰モデルで用いられるさまざまな因子について推論を行うことができる。横に星印の付いた係数は統計的に有意なものであり、偶然に発生した可能性は低いことを意味する。たとえば、パイプの直径、パイプの長さ、パイプの厚み、最大圧力定格、パイプがHDPE製かPVC製か、パイプのパーセント寿命などの、パイプに基づく因子は、統計的に有意であるとして示される。土壌の抵抗率、パイプの地理的領域、パイプの標高、パイプが丘陵地にあるかどうかなどの、場所に基づく因子も、統計的に有意であるとして示される。
【0071】
パイプの長さについては、標準誤差は、関連するp値がゼロに近い非常に小さな数値であることを通知する。より具体的には、パイプ長は99パーセンタイルレベルで因子として統計的に有意である。さらに、係数は正であり、これは、パイプの長さが長くなると、パイプが故障する可能性が高くなることに関連付けられることを意味する。ランダムフォレストモデルはパイプの長さが非常に重要であると通知したが、理由を特定しなかったため、これは有用な情報である。ランダムフォレストモデルとロジスティック回帰モデルとの両方が同じポイントで一致する場合、より具体的な枠組みが取得される。パイプの長さに関するこの情報は、複数のパイプを購入する必要があることを意味する場合でも、より短いパイプを購入すべきであることを意味する。これにより初期コストが増大する可能性があるが、パイプの故障の可能性が大幅に減少するであろう。
【0072】
パイプの直径については、係数は、パイプの直径がパイプの故障と負の関連があることを示す。これは、パイプの直径が大きくなると、パイプが故障する可能性がより低くなることを意味する。つまり、幅の広いパイプは故障する可能性がより低く、細いパイプは故障する可能性がより高くなる。これは有用な情報であり、なぜならば、幅の広いパイプは初期費用がより高くなる可能性があるが、パイプが故障する可能性がより低い場合、長期的にはより安価になる可能性があるからである。パイプの厚みについては、係数は負であり、これは、より厚い壁部のパイプは、より薄いパイプよりも故障しにくいことを意味する。この情報は有用な場合があり、なぜならば、より厚い壁部のパイプはより高価だが、故障する可能性はより低いため、より厚い壁部のパイプを使用するよう、より多くの先行投資を行う方が合理的であり得るからである。
【0073】
パイプの寿命の割合も重要である。パイプが製造業者の推奨する寿命を超えると、故障する可能性がより高くなる。これは常識であり、直感を裏付ける。しかしながら、驚くべきことに、パイプがどのように用いられるかは統計的に重要ではない。これは、ランダムフォレスト変数重要度プロットと一致するようであり、この一致は両方のモデルから得られる洞察を裏付ける。これらの説明された推論は、引き出され得る推論の網羅的なリストではなく、むしろそれらのほんの一部である。2つのモデルから多数の推論を直接引き出すことができ、具体的かつ数学的に厳密な態様で以前の仮定を確認または検証するために用いることができる貴重な情報を提供する。
【0074】
追加の洞察を得るために、追加の機械学習技術またはモデルを用いることができる。たとえば、機械学習モデルの組み合わせには、推論の生成にも用いることができる単純ベイズモデルが含まれ得る。
【0075】
図10は、本開示の実施形態による単純ベイズモデルの混同行列を示す。
図に関して、図4に示されたデータ(例:265,293本のパイプを含むデータセット)に基づいて生成された単純ベイズモデルについて、例示的な混同行列1002が示される。混同行列1002は、予測を実際の参照値と比較するために4つの象限:244,995の値を有する左上のN-N象限、5731の値を有する右上のN-Y象限;11808の値を有する左下のY-N象限;2759の値を有する右下のY-Y象限を有する。図5の混同行列と同様に、混同行列1002のこれらの象限は、4つの結果:真陰性、偽陰性、真陽性、および偽陽性の数を反映する。
【0076】
244,995の値を有する左上のN-N象限は、真陰性、つまり、モデルが故障しないと予測し、実際に故障しなかったパイプの数を表す。5731の値を有する右上のN-Y象限は、偽陰性、つまり、モデルが故障しないと予測したが、実際には故障したパイプの数を表す。11,808の値を有する左下のY-N象限は、偽陽性、つまり、モデルが故障するであろうと予測したが、実際には故障しなかったパイプの数を表す。2759の値を有する右下のY-Y象限は、真陽性、つまり、モデルが故障するであろうと予測し、実際に故障したパイプの数を表す。
【0077】
単純ベイズモデルは、ランダムフォレストモデルに比べて正確ではないことがわかる。単純ベイズモデルの全体的な正答率1004は約93.4%である。単純ベイズモデルの偽陽性率および偽陰性率もそれほど大きくなく、ランダムフォレストモデルと比較して、多くの偽陽性および偽陰性がある。これは、単純ベイズモデルが線形モデルであるため、パイプ漏れが線形プロセスではないことを示唆している可能性がある。さらに、感度1006とも呼ばれるモデルの真陽性率は32.5%であり、これは、モデルが8,490のパイプ漏れのうちわずか2759(または32.5%)を検出したことに対応する。したがって、「パイプが漏れるか」という質問でプロンプトが表示されると、モデルは32.5%の正確な回答を返すことになる。特異度1008とも呼ばれるモデルの真陰性率は95.4%であり、これは、モデルが漏れのない256,803本のパイプのうち244,995本のパイプを正しく判断したことに対応する。したがって、「パイプは漏れないか」という質問でプロンプトが表示されると、モデルは95.4%の正確な回答を返すことになる。したがって、単純ベイズモデルを用いて、パイプが漏れない場合を妥当な正答率で判断できるが、パイプが漏れるかどうかを判断するのには用いるべきではない。
【0078】
典型的には、単純ベイズモデルは、通常非常に高速に訓練されるため、最適なモデルではなく、ベースラインとして用いられ得る。これは、11の入力(ロジスティック回帰およびランダムフォレストで用いられる同じ入力)の各々が互いに独立しているという、単純ベイズモデルで用いられる仮定のためである。これが当てはまる場合、単純ベイズモデルの結果は非常に正確であることになる。この仮定が当てはまらない場合、モデルの結果は正確ではないことになる。したがって、単純ベイズモデルの正確さまたは不正確さを確認することで、入力が相互にどの程度依存しているかについての推論を引き出すことができ、これは、ランダムフォレストモデルおよびロジスティック回帰モデルからの洞察と組み合わせた場合、有用な情報である。これらの結果は、ロジスティック回帰モデルとランダムフォレストモデルとの両方を下回っており、これは、因子変数の独立性(単純ベイズモデルの仮定)が有効ではなさそうであること、およびこれらの予測変数自体の間に、モデルの予測正答率に影響を与えるのに十分重要な複雑な相互関係があることを示唆している。この洞察は、各因子に個別に重みを割り当てるモデルは不正確でありそうであることを意味する。
【0079】
図11は、本開示の実施形態に従った、パイプ漏れ予測を実現するためのブロック図である。
【0080】
いくつかの実施形態においては、パイプ漏れ予測システムについての解決実現例はビッグデータクラウドプラットフォーム1110を含み得る。いくつかの実施形態においては、ビッグデータクラウドプラットフォーム1110は、パイプデータ(例えばパイプ特性および既知の漏れ)をすべて、標準フォーマット1122でオブジェクトストア1120に格納し得る。
【0081】
いくつかの実施形態においては、オブジェクトストア1120が維持されて、ビッグデータクラウドサービス1140を介して提供されてもよく、それはアマゾンシンプルストレージサービス(S3)のようなクラウドコンピューティングサービスであることができる。いくつかの実施形態においては、ビッグデータクラウドサービス1140は、分散型ストレージおよび大型のデータセットの処理のために用いられるオープンソースソフトウェアフレームワークであるApache Hadoopを用いて実現されてもよい。ビッグデータクラウドサービス1140は、オブジェクトストア1120におけるデータのすべてを格納するよう用いられてもよい。したがって、オブジェクトストア1120に含まれるデータは分割されて、ビッグデータクラウドサービス1140のコンピューティングクラスタにおけるノードにわたって分散された大型のブロックに格納され得る。いくつかの実施形態においては、ビッグデータクラウドサービス1140は、スケーラブルで信頼性の高いデータストレージを提供するために使用されるJava(登録商標)ベースのファイルシステムであるHDFS(Hadoop分散型ファイルシステム)1146を使用して実装できる。
【0082】
いくつかの実施形態では、ビッグデータクラウドサービス1140は、データのストリーミングおよび機械学習のために組み込みモジュールを介してビッグデータ処理用の高速かつ一般的なエンジンとして機能するクラスタコンピューティングフレームワークを提供し得るSpark1144(例えば、Apache Spark)を利用し得る。言い換えると、Spark1144は、コンピュータのクラスタにわたる大規模なデータセットの分散型処理を用いてビッグデータ分析を実行するための機能を提供し得、大量のデータの分散型処理のための基本hadoopmap/reduce技法上で改善し得る。Spark1144はメモリに永続化することでネイティブのHadoopMap/Reduce機能を大幅に強化し得、一方Map/Reduceはディスクに永続化される。その結果、Spark1144は、メモリ動作の点でMap/Reduceの100倍以上、ディスク動作の点でMap/Reduceの10倍以上高速であることができる。
【0083】
図に示されるように、ビッグデータクラウドプラットフォーム1110は、バルクソースデータ1150およびストリーミングソースデータ1152を受信し得る。一般に、バルクソースデータ1150は、現場に出ているパイプの特性、およびそれらのうちのどれが漏れたか、ならびに、もはや現場にないパイプの特性、およびそれらのうちのどれが漏れたかなどの履歴データを含み得る。いくつかの実施形態においては、バルクソースデータ1150は、「データレイク(data lake)」と称され得るオブジェクトストア1120に格納されてもよい。オブジェクトストア1120に格納されたデータはすべて、一様に、標準フォーマット1122で格納されてもよい。いくつかの実施形態においては、標準フォーマット112は、スケーラブルで信頼性の高いデータストレージを提供するために用いられるJavaベースのファイルシステムであるHadoop分散型ファイルシステム(Hadoop Distributed File System:HDFS)であってもよい。
【0084】
ストリーミングソースデータ1152は、現場に配置された新たなパイプについてのデータ(たとえば、それらのパイプの特性)、およびどのパイプが漏れたかの更新を含むことができる。このデータは、(たとえば、新たなパイプを設置したり、既存のパイプの漏れをチェックしている現場スタッフから)リアルタイムで受信され得る。いくつかの実施形態では、現場スタッフは、このデータを現場でコンピューティングデバイスまたはモバイルデバイス上で入力することができ、そのデータはビッグデータクラウドプラットフォーム1110によって受信され、オブジェクトストア1120に統合されることになる。いくつかの実施形態においては、ストリーミングソースデータ1152は、Kafka1130などの通信インターフェイスにおいて受信されてもよい。通信インターフェイスとして、Kafka1130はストリーミングソースデータ1152を受信し、そのデータ内の個々のメッセージを解析してもよい。それらのメッセージは、オブジェクトストア1120に(たとえば、標準フォーマット1122で)格納することができるデータに変換することができる。したがって、オブジェクトストア1120は、バルクソースデータ1150(例えば、既存のパイプの履歴特性)およびストリーミングソースデータ1152(例えば、新たなパイプの特性または既存のパイプの履歴特性への更新)からのデータを同じ一様なフォーマットに含むことができる。
【0085】
いくつかの実施形態においては、Spark1134および/またはHive LLAP1136はさらに、オブジェクトストア1120内に含まれているデータをすべて(たとえば不正な挙動を検出するために)分析して処理するために用いられる。Spark1134(たとえば、Apache Spark)は、データのストリーミングおよび機械学習のために内蔵モジュールを介してビッグデータ処理のための高速かつ汎用のエンジンとして機能するクラスタコンピューティングフレームワークを提供し得る。言いかえれば、Spark1134は、コンピュータのクラスタにわたる大規模なデータセットの分散処理を用いてビッグデータ分析を実行するための特徴を提供し得るとともに、大量のデータを分散処理するためのベースとなるHadoop Map/Reduce技術を改善させ得る。Spark1134は、メモリに存続することによって固有のHadoop Map/Reduce機能を過剰にチャージし得る一方で、Map/Reduceはディスクに残存している。結果として、Spark1134は、メモリ動作の点でMap/Reduceよりも100倍高速であり得るとともに、ディスク動作の点でMap/Reduceよりも10倍高速であり得る。
【0086】
いくつかの実施形態においては、Spark1134は、Oracle R Advanced Analytics for Hadoop(ORAAH)を含み得る。Oracle R Advanced Analytics for Hadoopは、コンピュータのクラスタにわたる大型のデータセットの分散処理を用いて、ビッグデータ分析を実行するための特徴を提供する「スーパーチャージされた(supercharged)」バージョンのSparkとしての役割を果たし得る。ORAAHは、従来のSparkパッケージに勝る多数の利点を提供し得る。たとえば、ORAAHは、スパークより32倍高速の機械学習モデル(たとえば、分類、クラスタ化、回帰、特徴抽出などのための機械学習アルゴリズム)を提供し得る。ORAAHはまた、研究開発において開発された機械学習モデルを製造に向けて展開する能力を提供してもよい。ORAAHはまた、データレイクにおいてRスクリプトを直接実行する能力を提供してもよい。ORAAHはまた、HDFSおよび/またはHIVEを含む複数のデータフォーマットからのデータの読取り/書込みを可能にする単一のパッケージとしての役割を果たし得る。ORAAHはまた、R内に存在する任意の式を処理可能であり得るのに対して、Sparkは、制限された変換のサブセットで単純な属性を処理することができるだけであり得る。
【0087】
いくつかの実施形態においては、Hive LLAP1136は、Apache Hiveを含んでいてもよく、データ要約、クエリおよび分析のためにSQL様のインターフェイスを提供するためのApache Hadoopプラットフォーム上に構築されたデータウェアハウスソフトウェアプロジェクトであり得る。Hive LLAP(低レイテンシ分析処理)1136は、より高速のSQL分析を提供することによってHiveアーキテクチャ上に構築されてもよい。これにより、Kafka1130を用いて、ストリーミングデータからのメッセージを解析して取得する。これらメッセージは次いで、オブジェクトストア1120における履歴データに追加される。オブジェクトストア1120に含まれるこの「データレイク」は、この明細書中に上述されてきた電力不正を検出するためのステップを実行するために、Spark1134およびHive LLAP1136を用いて処理される。
【0088】
いくつかの実施形態においては、オブジェクトストア1120は、コンピューティング効率の向上および必要なコンピューティングリソースの減少に関連付けられた特徴を、分離されたストレージに提供する態様で実現されてもよい。Hadoopは、典型的には、HDFSとMapReduceとの組合せから成る。しかしながら、HDFSに関する問題は、計算が各ノード(たとえば、分散型コンピューティングシステムのクラスタ)上にあって、付加的な計算を得るためにより多くのノードを追加する必要がある点である。各々のノードは計算および格納を行なうものであって、これは、より多くのノードを追加することによって、使用されていないストレージが有効に補償されていることを意味している。代替例として、HDFS以外のストレージ機構、たとえばAmazon S3またはオラクルオブジェクトストレージなどを用いることができる。たとえば、システムがオブジェクトストレージとMapReduceとの組合せで実現されるように、HDFSを交換することができる。この実現例の下では、ストレージは分離されており、ノードには最小限のストレージを追加することができ、そのストレージに関連付けられ得る追加コストを低減することができる。言いかえればオラクルのビッグデータクラウドサービスなどのサービス(計算エディション)は、追加のHadoopクラスタまたはSparkクラスタを要求に応じてプロビジョニングするために用いることができるが、データ自体は、Amazon S3またはオラクルオブジェクトストレージ内に保持されており、必要に応じてクラスタによって検索される。
【0089】
図12は、本開示の実施形態に従った、パイプ漏れ予測のためのハイブリッドシステム図を示す。
【0090】
図に示すように、パイプ漏れ予測システム1220はパイプデータベース1234のデータにアクセスできる。このデータベースには、現場に存在するパイプのパイプ特性データ、および過去にどのパイプが漏れたかの知識(既知の漏れなど)が含まれる。このデータは、パイプの漏れを予測できるモデルの構築に役立つ。加えて、パイプ漏れ予測システム1220は、パイプラインデータ1230にアクセスし得、これには、現場のパイプの新規または更新されたパイプ特性データが含まれ得る。パイプ特性データは、新たに設置されたパイプの場合は新たであり得、場合によっては、(たとえば、現場スタッフ1210またはパイプを設置している人によって)新たなパイプ特性データが手動でパイプ漏れ予測システム1220に入力され得る。パイプラインデータ1230には、現場のパイプとともに、またはその周りに設置されたセンサから取得した環境データも含まれる場合がある。たとえば、パイプラインデータ1230には、土壌または標高センサから取得できる土壌データ、標高データ、気象データなどを含めることができる。パイプ漏れ予測システム1220は、予測モデルをパイプラインデータ1230のデータに適用して、パイプラインデータ1230のパイプに関する漏れ予測を出力し得る。
【0091】
パイプ漏れ予測システム1220は、ブロック1242においてこのデータをすべて取込んでもよい。これは、現場において任意の環境センサと通信するとともにそれらからデータを受信するように構成された特化された通信インターフェイス(たとえば、プログラミングインターフェイスまたはAPI)を含んでいてもよい。パイプデータベース1234を格納するいずれかのコンピュータシステムまたはデバイスと通信するとともにパイプデータベース1234を格納するいずれかのコンピュータシステムまたはデバイスからデータを受信するように構成された通信インターフェイスがあってもよい。たとえば、パイプデータベース1234がクラウドコンピューティングネットワーク上で分散された態様で実際に格納される場合、パイプ漏れ予測システム1220は、クラウドコンピューティングネットワークからそのデータをすべて検索するための通信インターフェイスを有していてもよい。
【0092】
データのすべてがパイプ漏れ予測システム1220内で統合されると、ブロック1244において、パイプ漏れ予測システム1220は、データをすべて単数の一様なフォーマットに(たとえば、日付/時間がすべて同じフォーマットに従うことを確実にして)変換し得る。これにより、(たとえば、パイプのデータを入力するさまざまな現場スタッフがさまざまなデータ形式または規約を使用した場合でも)予測モデルを簡単に生成および適用できる。
【0093】
ブロック1246において、パイプ漏れ予測システム1220は、データ(たとえば、存在するすべてのパイプについてのパイプ特性)をすべて図11に示されるオブジェクトストア1120などのストレージに格納し得る。ブロック1248において、パイプ漏れ予測システム1220は、ストレージ内のデータのすべてに対してR分析を実行し得る。たとえば、パイプ漏れ予測システム1220は、既知のパイプ漏れのデータを用いて、任意のパイプが漏れる可能性に対する、各変数、またはデータが既知のパイプ特性の、相対的な影響を計算し得る。ブロック1250で、パイプ漏れ予測システム1220は、(例えば、一定期間内で)現場内の各パイプが漏れる可能性を予測し、もっとも漏れそうなパイプまたはすでに漏れていそうなパイプを特定し得る。
【0094】
パイプ漏れ予測システム1220がもっとも漏れそうなパイプまたはすでに漏れていそうなパイプを識別すると、エグゼクティブチーム1290のメンバーは、デバイス1280上のインターフェイス1282を介して、それらの識別されたパイプに関するレポートを閲覧することができるようになり得る。デバイス1280は、パイプ漏れ予測システム1220から生成されたこれらのレポートを受信してもよい。さらに、エグゼクティブチーム1290のメンバーは、(たとえば、パイプに関連付けられたIDに基づく)所与のパイプについてのパイプ漏れ予測、およびそれらの漏れ予測を生成するために使用される計算の内訳を引き出して閲覧することができてもよい。したがって、エグゼクティブチーム1290のメンバーは、漏れ予測をさらに検証および確認し得る。たとえば、メンバーは、非常に古いパイプが漏れそうであると予測されていることに気付き得、それは直感的に理解され得る。そのメンバーは、インターフェイス1282内で直接指示して、現場スタッフ1210にパイプの場所に物理的に行って漏れがないかパイプを検査するよう指示することができる。
【0095】
次いで、デバイス1280は、パイプ漏れ予測システム1220に命令を送信することとなり、さらに、パイプ漏れ予測システム1220は、パイプの場所に(たとえば地理的に)最も近くにいる現場スタッフ1210を判断することになる。調査が必要なパイプが複数ある場合、これらのパイプは、近くに位置するか否かに基づいて現場スタッフ間で振り分けられることもあり得る(たとえば、現場スタッフ1210は、彼らの地理的位置にある、調査のためのパイプのプールを受取ってもよい)。次いで、パイプ漏れ予測システム1220は現場スタッフ1210に関連付けられたデバイス1212に命令を転送し得る。現場スタッフ1210は、デバイス1212上のインターフェイス1214を介して命令およびパイプの場所を閲覧することができてもよい。その後、現場スタッフ1210は、パイプの場所を物理的に訪れて、漏れがあるか調査し得る。現場スタッフ1210は、デバイス1212上のインターフェイス1214を介して、パイプがすでに漏れているかどうかを示すことができてもよい。この情報は、エグゼクティブチーム1290に報告し返すことができるか、または、パイプ漏れを識別するための任意の既存の予測モデルを更新するかもしくは向上させるために(たとえば、パイプ漏れ予測システム1220に格納されている)既存のデータに追加されてもよい。
【0096】
付加的な実現例の詳細
図13は、この明細書中に開示された実施形態のうちの1つを実現するための分散型システムを示す簡略図である。分散型システム1300は、上述したように、パイプ漏れ予測システムの実施形態を実現することができる。例示された実施形態においては、分散型システム1300は、1つ以上のネットワーク1310を介して、ウェブブラウザ、プロプライエタリクライアント(たとえばオラクルフォーム)などのクライアントアプリケーションを実行して動作させるように構成される1つ以上のクライアントコンピューティングデバイス1302、1304、1306および1308を含む。サーバ1312は、ネットワーク1310を介してリモートクライアントコンピューティングデバイス1302、1304、1306および1308と通信可能に結合されてもよい。
【0097】
さまざまな実施形態においては、サーバ1312は、システムの構成要素のうち1つ以上によって提供される1つ以上のサービスまたはソフトウェアアプリケーションを実行するように適合されてもよい。サービスまたはソフトウェアアプリケーションは非仮想環境および仮想環境を含み得る。仮想環境は、2次元または3次元(three-dimensional:3
D)表現、ページベースの論理的環境などであろうとなかろうと、仮想イベント、トレードショー、シミュレータ、クラスルーム、購買商品取引および企業活動のために用いられるものを含み得る。いくつかの実施形態においては、これらのサービスは、ウェブベースのサービスもしくはクラウドサービスとして、またはソフトウェア・アズ・ア・サービス(Software as a Service:SaaS)モデルのもとで、クライアントコンピューティン
グデバイス1302,1304,1306および/または1308のユーザに供給されてもよい。そして、クライアントコンピューティングデバイス1302,1304,1306および/または1308を動作させるユーザは、1つ以上のクライアントアプリケーションを利用して、サーバ1312と相互作用して、これらの構成要素によって提供されるサービスを利用し得る。
【0098】
図13に示されている構成では、システム1300のソフトウェアコンポーネント1318,1320および1322は、サーバ1312上に実装されるように示されている。また、他の実施形態においては、システム1300の構成要素のうちの1つ以上および/またはこれらの構成要素によって提供されるサービスは、クライアントコンピューティングデバイス1302,1304,1306および/または1308のうちの1つ以上によって実現されてもよい。その場合、クライアントコンピューティングデバイスを動作させるユーザは、1つ以上のクライアントアプリケーションを利用して、これらの構成要素によって提供されるサービスを使用し得る。これらの構成要素は、ハードウェア、ファームウェア、ソフトウェア、またはそれらの組合せで実現されてもよい。分散型システム1300とは異なり得るさまざまな異なるシステム構成が可能であることが理解されるべきである。したがって、図13に示されている実施形態は、実施形態のシステムを実現するための分散型システムの一例であり、限定的であるよう意図されたものではない。
【0099】
クライアントコンピューティングデバイス1302,1304,1306および/または1308は、手持ち式携帯機器(たとえばiPhone(登録商標)、携帯電話、iPad(登録商標)、計算タブレット、パーソナルデジタルアシスタント(personal digital assistant:PDA))またはウェアラブル装置(たとえばグーグルグラス(登録商標)ヘッドマウントディスプレイ)であってもよく、当該装置は、マイクロソフトウィンドウズ(登録商標)・モバイル(登録商標)などのソフトウェアを実行し、および/または、iOS、ウィンドウズ・フォン、アンドロイド、ブラックベリー10、パームOSなどのさまざまなモバイルオペレーティングシステムを実行し、インターネット、eメール、ショート・メッセージ・サービス(short message service:SMS)、ブラックベリー(登録商標)、または使用可能な他の通信プロトコルである。クライアントコンピューティングデバイスは、汎用パーソナルコンピュータであってもよく、当該汎用パーソナルコンピュータは、一例として、マイクロソフトウィンドウズ(登録商標)、アップルマッキントッシュ(登録商標)および/またはリナックス(登録商標)オペレーティングシステムのさまざまなバージョンを実行するパーソナルコンピュータおよび/またはラップトップコンピュータを含む。クライアントコンピューティングデバイスは、ワークステーションコンピュータであってもよく、当該ワークステーションコンピュータは、たとえばGoogle Chrome OSなどのさまざまなGNU/リナックスオペレーティングシステムを含むがこれらに限定されるものではないさまざまな市販のUNIX(登録商標)またはUNIXライクオペレーティングシステムのうちのいずれかを実行する。代替的には、または付加的には、クライアントコンピューティングデバイス1302,1304,1306および1308は、シン・クライアントコンピュータ、インターネットにより可能なゲームシステム(たとえばキネクト(登録商標)ジェスチャ入力装置を備えるかまたは備えないマイクロソフトXボックスゲーム機)、および/または、ネットワーク1310を介して通信が可能なパーソナルメッセージング装置などのその他の電子装置であってもよい。
【0100】
例示的な分散型システム1300は、4個のクライアントコンピューティングデバイスを有するように示されているが、任意の数のクライアントコンピューティングデバイスがサポートされてもよい。センサを有する装置などの他の装置が、サーバ1312と相互作用してもよい。
【0101】
分散型システム1300におけるネットワーク1310は、さまざまな市販のプロトコルのうちのいずれかを用いてデータ通信をサポートすることができる、当業者になじみのある任意のタイプのネットワークであってもよく、当該プロトコルは、TCP/IP(伝送制御プロトコル/インターネットプロトコル)、SNA(システムネットワークアーキテクチャ)、IPX(インターネットパケット交換)、アップルトークなどを含むが、これらに限定されるものではない。単に一例として、ネットワーク1310は、イーサネット(登録商標)、トークンリングなどに基づくものなどのローカルエリアネットワーク(LAN)であってもよい。ネットワーク1310は、広域ネットワークおよびインターネットであってもよい。ネットワーク1310は、仮想ネットワークを含んでいてもよく、当該仮想ネットワークは、仮想プライベートネットワーク(virtual private network:
VPN)、イントラネット、エクストラネット、公衆交換電話網(public switched telephone network:PSTN)、赤外線ネットワーク、無線ネットワーク(たとえば米国電
気電子学会(Institute of Electrical and Electronics:IEEE)802.11の一
連のプロトコル、ブルートゥース(登録商標)および/またはその他の無線プロトコルのうちのいずれかのもとで動作するネットワーク)、および/またはこれらの任意の組合せ、および/または他のネットワークを含むが、これらに限定されるものではない。
【0102】
サーバ1312は、1つ以上の汎用コンピュータ、専用サーバコンピュータ(一例として、PC(パーソナルコンピュータ)サーバ、UNIX(登録商標)サーバ、ミッドレンジサーバ、メインフレームコンピュータ、ラックマウント式サーバなどを含む)、サーバファーム、サーバクラスタ、またはその他の適切な構成および/または組合せで構成され得る。サーバ1312は、仮想オペレーティングシステムを実行する1つ以上の仮想マシン、または仮想化を含む他のコンピューティングアーキテクチャを含み得る。論理記憶装置の1つ以上のフレキシブルプールは、サーバのための仮想記憶デバイスを維持するように仮想化することができる。仮想ネットワークは、ソフトウェア定義型ネットワーキングを用いて、サーバ1312によって制御することができる。さまざまな実施形態においては、サーバ1312は、上記の開示に記載されている1つ以上のサービスまたはソフトウェアアプリケーションを実行するように適合され得る。たとえば、サーバ1312は、本開示の実施形態に係る上記の処理を実行するためのサーバに対応してもよい。
【0103】
サーバ1312は、上記のもののうちのいずれか、および、任意の市販のサーバオペレーティングシステムを含むオペレーティングシステムを実行し得る。また、サーバ1312は、HTTP(ハイパーテキスト転送プロトコル)サーバ、FTP(ファイル転送プロトコル)サーバ、CGI(共通ゲートウェイインターフェース)サーバ、JAVA(登録商標)サーバ、データベースサーバなどを含むさまざまな付加的サーバアプリケーションおよび/または中間層アプリケーションのうちのいずれかを実行し得る。例示的なデータベースサーバは、オラクル社(Oracle)、マイクロソフト社(Microsoft)、サイベース
社(Sybase)、IBM社(International Business Machines)などから市販されている
ものを含むが、これらに限定されるものではない。
【0104】
いくつかの実現例では、サーバ1312は、クライアントコンピューティングデバイス1302,1304,1306および1308のユーザから受信されたデータフィードおよび/またはイベント更新を分析および統合するための1つ以上のアプリケーションを含み得る。一例として、データフィードおよび/またはイベント更新は、1つ以上の第三者情報源および連続的なデータストリームから受信されるツイッター(登録商標)フィード、フェースブック(登録商標)更新またはリアルタイム更新を含み得るが、これらに限定されるものではなく、センサデータアプリケーション、金融ティッカ、ネットワーク性能測定ツール(たとえばネットワークモニタリングおよびトラフィック管理アプリケーション)、クリックストリーム分析ツール、自動車交通モニタリングなどに関連するリアルタイムイベントを含み得る。また、サーバ1312は、クライアントコンピューティングデバイス1302,1304,1306および1308の1つ以上の表示装置を介してデータフィードおよび/またはリアルタイムイベントを表示するための1つ以上のアプリケーションを含み得る。
【0105】
また、分散型システム1300は、1つ以上のデータベース1314および1316を含み得る。データベース1314および1316は、さまざまな場所に存在し得る。一例として、データベース1314および1316の1つ以上は、サーバ1312にローカルな(および/または存在する)非一時的な記憶媒体に存在していてもよい。代替的に、データベース1314および1316は、サーバ1312から遠く離れていて、ネットワークベースまたは専用の接続を介してサーバ1312と通信してもよい。一組の実施形態においては、データベース1314および1316は、記憶領域ネットワーク(storage-area network:SAN)に存在していてもよい。同様に、サーバ1312に起因する機能を実行するための任意の必要なファイルが、サーバ1312上にローカルに、および/または、リモートで適宜格納されていてもよい。一組の実施形態においては、データベース1314および1316は、SQLフォーマットコマンドに応答してデータを格納、更新および検索するように適合された、オラクル社によって提供されるデータベースなどのリレーショナルデータベースを含み得る。
【0106】
図14は、本開示の実施形態に係る、実施形態のシステムの1つ以上の構成要素によって提供されるサービスをクラウドサービスとして供給することができるシステム環境1400の1つ以上の構成要素の簡略化されたブロック図である。システム環境1400は、上述したように、パイプ漏れ予測システムの実施形態を含み得るかまたは実現し得る。示されている実施形態においては、システム環境1400は、クラウドサービスを提供するクラウドインフラストラクチャシステム1402と相互作用するようにユーザによって使用され得る1つ以上のクライアントコンピューティングデバイス1404,1406および1408を含む。クライアントコンピューティングデバイスは、クラウドインフラストラクチャシステム1402によって提供されるサービスを使用するためにクラウドインフラストラクチャシステム1402と相互作用するようにクライアントコンピューティングデバイスのユーザによって使用され得る、ウェブブラウザ、専有のクライアントアプリケーション(たとえばオラクルフォームズ)または他のアプリケーションなどのクライアントアプリケーションを動作させるように構成され得る。
【0107】
図14に示されているクラウドインフラストラクチャシステム1402が図示されている構成要素とは他の構成要素を有し得ることが理解されるべきである。さらに、図14に示されている実施形態は、本発明の実施形態を組込むことができるクラウドインフラストラクチャシステムの一例に過ぎない。たとえば、クラウドインフラストラクチャシステム1402は、上述のように、パイプ漏れ予測システムのうちの1つ以上の要素を含み得るかまたは実現し得る。いくつかの他の実施形態においては、クラウドインフラストラクチャシステム1402は、図14に示されているものよりも多いまたは少ない数の構成要素を有していてもよく、2つ以上の構成要素を組合せてもよく、または構成要素の異なる構成または配置を有していてもよい。
【0108】
クライアントコンピューティングデバイス1404,1406および1408は、1302,1304,1306および1308について上記したものと類似のデバイスであってもよい。
【0109】
例示的なシステム環境1400は3個のクライアントコンピューティングデバイスを有するように示されているが、任意の数のクライアントコンピューティングデバイスがサポートされてもよい。センサなどを有する装置などの他の装置が、クラウドインフラストラクチャシステム1402と相互作用してもよい。
【0110】
ネットワーク1410は、クライアント1404,1406および1408とクラウドインフラストラクチャシステム1402との間のデータの通信およびやりとりを容易にし得る。各々のネットワークは、ネットワーク1310について上記したものを含むさまざまな市販のプロトコルのうちのいずれかを用いてデータ通信をサポートすることができる、当業者になじみのある任意のタイプのネットワークであってもよい。
【0111】
クラウドインフラストラクチャシステム1402は、サーバ1312について上記したものを含み得る1つ以上のコンピュータおよび/またはサーバを備え得る。
【0112】
特定の実施形態においては、クラウドインフラストラクチャシステムによって提供されるサービスは、オンラインデータ記憶およびバックアップソリューション、ウェブベースのeメールサービス、ホスト型オフィススイートおよびドキュメントコラボレーションサービス、データベース処理、管理技術サポートサービスなどの、クラウドインフラストラクチャシステムのユーザがオンデマンドで利用可能な多数のサービスを含み得る。クラウドインフラストラクチャシステムによって提供されるサービスは、そのユーザのニーズを満たすように動的にスケーリング可能である。クラウドインフラストラクチャシステムによって提供されるサービスの具体的なインスタンス化は、本明細書では「サービスインスタンス」と称される。一般に、インターネットなどの通信ネットワークを介してクラウドサービスプロバイダのシステムからユーザが利用可能な任意のサービスは、「クラウドサービス」と称される。通常、パブリッククラウド環境では、クラウドサービスプロバイダのシステムを構成するサーバおよびシステムは、顧客自身のオンプレミスサーバおよびシステムとは異なっている。たとえば、クラウドサービスプロバイダのシステムがアプリケーションをホストしてもよく、ユーザは、インターネットなどの通信ネットワークを介してオンデマンドで当該アプリケーションを注文および使用してもよい。
【0113】
いくつかの例では、コンピュータネットワーククラウドインフラストラクチャにおけるサービスは、ストレージ、ホスト型データベース、ホスト型ウェブサーバ、ソフトウェアアプリケーションへの保護されたコンピュータネットワークアクセス、またはクラウドベンダによってユーザに提供されるかもしくはそうでなければ当該技術分野において公知の他のサービスを含み得る。たとえば、サービスは、インターネットを介したクラウド上のリモートストレージへのパスワードによって保護されたアクセスを含み得る。別の例として、サービスは、ネットワーク化された開発者による私的使用のためのウェブサービスベースのホスト型リレーショナルデータベースおよびスクリプト言語ミドルウェアエンジンを含み得る。別の例として、サービスは、クラウドベンダのウェブサイト上でホストされるeメールソフトウェアアプリケーションへのアクセスを含み得る。
【0114】
特定の実施形態においては、クラウドインフラストラクチャシステム1402は、セルフサービスの、サブスクリプションベースの、弾性的にスケーラブルな、信頼性のある、高可用性の、安全な態様で顧客に配信される一連のアプリケーション、ミドルウェアおよびデータベースサービス提供品を含み得る。このようなクラウドインフラストラクチャシステムの一例は、本譲受人によって提供されるオラクルパブリッククラウドである。
【0115】
時としてビッグデータとも称される大量のデータは、インフラストラクチャシステムによって、多数のレベルにおいて、および異なるスケールでホストおよび/または操作され得る。このようなデータが含み得るデータセットは、非常に大型で複雑であるので、典型的なデータベース管理ツールまたは従来のデータ処理アプリケーションを用いて処理するのが困難になる可能性がある。たとえば、テラバイトのデータはパーソナルコンピュータまたはそれらのラックベースの対応物を用いて格納、検索取得および処理することが難しいかもしれない。このようなサイズのデータは、最新のリレーショナルデータベース管理システムおよびデスクトップ統計ならびに視覚化パッケージを用いて機能させるのが困難である可能性がある。それらは、データを許容可能な経過時間内に捕捉しキュレーションし管理し処理するよう、一般的に用いられるソフトウェアツールの構造を超えて、何千ものサーバコンピュータを動作させる大規模並列処理ソフトウェアを必要とし得る。
【0116】
大量のデータを視覚化し、トレンドを検出し、および/または、データと相互作用させるために、分析者および研究者は極めて大きいデータセットを格納し処理することができる。平行にリンクされた何十、何百または何千ものプロセッサがこのようなデータに対して作用可能であり、これにより、このようなデータを表示し得るか、または、データに対する外力をシミュレートし得るかもしくはそれが表しているものをシミュレートし得る。これらのデータセットは、データベースにおいて編制されたデータ、もしくは構造化モデルに従ったデータ、および/または、非体系的なデータ(たとえば電子メール、画像、データブロブ(バイナリ大型オブジェクト)、ウェブページ、複雑なイベント処理)などの構造化されたデータを必要とする可能性がある。目標物に対してより多くの(またはより少数の)コンピューティングリソースを比較的迅速に集中させるために実施形態の能力を強化することにより、ビジネス、政府関係機関、研究組織、私人、同じ目的をもった個々人もしくは組織のグループ、または他のエンティティからの要求に基づいて大量のデータセット上でタスクを実行するために、クラウドインフラストラクチャシステムがより良好に利用可能となる。
【0117】
さまざまな実施形態においては、クラウドインフラストラクチャシステム1402は、クラウドインフラストラクチャシステム1402によって供給されるサービスへの顧客のサブスクリプションを自動的にプロビジョニング、管理および追跡するように適合され得る。クラウドインフラストラクチャシステム1402は、さまざまなデプロイメントモデルを介してクラウドサービスを提供し得る。たとえば、クラウドインフラストラクチャシステム1402が、(たとえばオラクル社によって所有される)クラウドサービスを販売する組織によって所有され、一般大衆またはさまざまな産業企業がサービスを利用できるパブリッククラウドモデルのもとでサービスが提供されてもよい。別の例として、クラウドインフラストラクチャシステム1402が単一の組織のためだけに運営され、当該組織内の1つ以上のエンティティにサービスを提供し得るプライベートクラウドモデルのもとでサービスが提供されてもよい。また、クラウドインフラストラクチャシステム1402およびクラウドインフラストラクチャシステム1402によって提供されるサービスが、関連のコミュニティ内のいくつかの組織によって共有されるコミュニティクラウドモデルのもとでクラウドサービスが提供されてもよい。また、2つ以上の異なるモデルの組合せであるハイブリッドクラウドモデルのもとでクラウドサービスが提供されてもよい。
【0118】
いくつかの実施形態においては、クラウドインフラストラクチャシステム1402によって提供されるサービスは、ソフトウェア・アズ・ア・サービス(Software as a Service:SaaS)カテゴリ、プラットフォーム・アズ・ア・サービス(Platform as a Service:PaaS)カテゴリ、インフラストラクチャ・アズ・ア・サービス(Infrastructure
as a Service:IaaS)カテゴリ、またはハイブリッドサービスを含むサービスの他
のカテゴリのもとで提供される1つ以上のサービスを含み得る。顧客は、サブスクリプションオーダーによって、クラウドインフラストラクチャシステム1402によって提供される1つ以上のサービスを注文し得る。次いで、クラウドインフラストラクチャシステム1402は、顧客のサブスクリプションオーダーでサービスを提供するために処理を実行する。
【0119】
いくつかの実施形態においては、クラウドインフラストラクチャシステム1402によって提供されるサービスは、アプリケーションサービス、プラットフォームサービスおよびインフラストラクチャサービスを含み得るが、これらに限定されるものではない。いくつかの例では、アプリケーションサービスは、SaaSプラットフォームを介してクラウドインフラストラクチャシステムによって提供されてもよい。SaaSプラットフォームは、SaaSカテゴリに分類されるクラウドサービスを提供するように構成され得る。たとえば、SaaSプラットフォームは、一体化された開発およびデプロイメントプラットフォーム上で一連のオンデマンドアプリケーションを構築および配信するための機能を提供し得る。SaaSプラットフォームは、SaaSサービスを提供するための基本的なソフトウェアおよびインフラストラクチャを管理および制御し得る。SaaSプラットフォームによって提供されるサービスを利用することによって、顧客は、クラウドインフラストラクチャシステムで実行されるアプリケーションを利用することができる。顧客は、顧客が別々のライセンスおよびサポートを購入する必要なく、アプリケーションサービスを取得することができる。さまざまな異なるSaaSサービスが提供されてもよい。例としては、大規模組織のための販売実績管理、企業統合およびビジネスの柔軟性のためのソリューションを提供するサービスが挙げられるが、これらに限定されるものではない。
【0120】
いくつかの実施形態においては、プラットフォームサービスは、PaaSプラットフォームを介してクラウドインフラストラクチャシステムによって提供されてもよい。PaaSプラットフォームは、PaaSカテゴリに分類されるクラウドサービスを提供するように構成され得る。プラットフォームサービスの例としては、組織(オラクル社など)が既存のアプリケーションを共有の共通アーキテクチャ上で統合することを可能にするサービス、および、プラットフォームによって提供される共有のサービスを活用する新たなアプリケーションを構築する機能を挙げることができるが、これらに限定されるものではない。PaaSプラットフォームは、PaaSサービスを提供するための基本的なソフトウェアおよびインフラストラクチャを管理および制御し得る。顧客は、顧客が別々のライセンスおよびサポートを購入する必要なく、クラウドインフラストラクチャシステムによって提供されるPaaSサービスを取得することができる。プラットフォームサービスの例としては、オラクルJavaクラウドサービス(Java Cloud Service:JCS)、オラクルデータベースクラウドサービス(Database Cloud Service:DBCS)などが挙げられるが、これらに限定されるものではない。
【0121】
PaaSプラットフォームによって提供されるサービスを利用することによって、顧客は、クラウドインフラストラクチャシステムによってサポートされるプログラミング言語およびツールを利用することができ、デプロイされたサービスを制御することもできる。いくつかの実施形態においては、クラウドインフラストラクチャシステムによって提供されるプラットフォームサービスは、データベースクラウドサービス、ミドルウェアクラウドサービル(たとえばオラクルフージョンミドルウェアサービス)およびJavaクラウドサービスを含み得る。一実施形態においては、データベースクラウドサービスは、組織がデータベースリソースをプールしてデータベースクラウドの形態でデータベース・アズ・ア・サービスを顧客に供給することを可能にする共有のサービスデプロイメントモデルをサポートし得る。ミドルウェアクラウドサービスは、クラウドインフラストラクチャシステムにおいてさまざまなビジネスアプリケーションを開発およびデプロイするために顧客にプラットフォームを提供し得るともに、Javaクラウドサービスは、クラウドインフラストラクチャシステムにおいてJavaアプリケーションをデプロイするために顧客にプラットフォームを提供し得る。
【0122】
さまざまな異なるインフラストラクチャサービスは、クラウドインフラストラクチャシステムにおけるIaaSプラットフォームによって提供されてもよい。インフラストラクチャサービスは、ストレージ、ネットワークなどの基本的な計算リソース、ならびに、SaaSプラットフォームおよびPaaSプラットフォームによって提供されるサービスを利用する顧客のための他の基礎的な計算リソースの管理および制御を容易にする。
【0123】
また、特定の実施形態においては、クラウドインフラストラクチャシステム1402は、クラウドインフラストラクチャシステムの顧客にさまざまなサービスを提供するために使用されるリソースを提供するためのインフラストラクチャリソース1430を含み得る。一実施形態においては、インフラストラクチャリソース1430は、PaaSプラットフォームおよびSaaSプラットフォームによって提供されるサービスを実行するための、サーバ、ストレージおよびネットワーキングリソースなどのハードウェアの予め一体化された最適な組合せを含み得る。
【0124】
いくつかの実施形態においては、クラウドインフラストラクチャシステム1402におけるリソースは、複数のユーザによって共有され、デマンドごとに動的に再割り振りされてもよい。また、リソースは、異なる時間帯にユーザに割り振られてもよい。たとえば、クラウドインフラストラクチャシステム1430は、第1の時間帯におけるユーザの第1の組が規定の時間にわたってクラウドインフラストラクチャシステムのリソースを利用することを可能にし得るとともに、異なる時間帯に位置するユーザの別の組への同一のリソースの再割り振りを可能にし得ることによって、リソースの利用を最大化することができる。
【0125】
特定の実施形態においては、クラウドインフラストラクチャシステム1402のさまざまな構成要素またはモジュール、および、クラウドインフラストラクチャシステム1402によって提供されるサービス、によって共有されるいくつかの内部共有サービス1432が提供され得る。これらの内部共有サービスは、セキュリティおよびアイデンティティサービス、インテグレーションサービス、企業リポジトリサービス、企業マネージャサービス、ウイルススキャンおよびホワイトリストサービス、高可用性・バックアップおよび回復サービス、クラウドサポートを可能にするためのサービス、eメールサービス、通知サービス、ファイル転送サービスなどを含み得るが、これらに限定されるものではない。
【0126】
特定の実施形態においては、クラウドインフラストラクチャシステム1402は、クラウドインフラストラクチャシステムにおけるクラウドサービス(たとえばSaaSサービス、PaaSサービスおよびIaaSサービス)の包括的管理を提供し得る。一実施形態においては、クラウド管理機能は、クラウドインフラストラクチャシステム1402によって受信された顧客のサブスクリプションをプロビジョニング、管理および追跡などするための機能を含み得る。
【0127】
一実施形態においては、図14に示されるように、クラウド管理機能は、オーダー管理モジュール1420、オーダーオーケストレーションモジュール1422、オーダープロビジョニングモジュール1424、オーダー管理および監視モジュール1426、ならびにアイデンティティ管理モジュール1428などの1つ以上のモジュールによって提供され得る。これらのモジュールは、汎用コンピュータ、専用サーバコンピュータ、サーバファーム、サーバクラスタ、またはその他の適切な構成および/もしくは組み合わせであり得る1つ以上のコンピュータおよび/またはサーバを含み得るか、またはそれらを用いて提供され得る。
【0128】
例示的な動作1434において、クライアントデバイス1404,1406または1408などのクライアントデバイスを用いる顧客は、クラウドインフラストラクチャシステム1402によって提供される1つ以上のサービスを要求し、クラウドインフラストラクチャシステム1402によって供給される1つ以上のサービスのサブスクリプションについてオーダーを行うことによって、クラウドインフラストラクチャシステム1402と対話し得る。特定の実施形態においては、顧客は、クラウドユーザインターフェース(User
Interface:UI)、すなわちクラウドUI1412、クラウドUI1414および/またはクラウドUI1416にアクセスして、これらのUIを介してサブスクリプションオーダーを行い得る。顧客がオーダーを行ったことに応答してクラウドインフラストラクチャシステム1402によって受信されたオーダー情報は、顧客と、顧客がサブスクライブする予定のクラウドインフラストラクチャシステム1402によって提供される1つ以上のサービスとを特定する情報を含み得る。
【0129】
オーダーが顧客によって行われた後、オーダー情報は、クラウドUI1412,1414および/または1416を介して受信される。
【0130】
動作1436において、オーダーは、オーダーデータベース1418に格納される。オーダーデータベース1418は、クラウドインフラストラクチャシステム1418によって動作されるとともに他のシステム要素と連携して動作されるいくつかのデータベースのうちの1つであってもよい。
【0131】
動作1438において、オーダー情報は、オーダー管理モジュール1420に転送される。いくつかの例では、オーダー管理モジュール1420は、オーダーの確認および確認時のオーダーの予約などのオーダーに関連する請求書発行機能および会計経理機能を実行するように構成され得る。
【0132】
動作1440において、オーダーに関する情報は、オーダーオーケストレーションモジュール1422に通信される。オーダーオーケストレーションモジュール1422は、顧客によって行われたオーダーについてのサービスおよびリソースのプロビジョニングをオーケストレートするためにオーダー情報を利用し得る。いくつかの例では、オーダーオーケストレーションモジュール1422は、オーダープロビジョニングモジュール1424のサービスを用いてサブスクライブされたサービスをサポートするためにリソースのプロビジョニングをオーケストレートし得る。
【0133】
特定の実施形態においては、オーダーオーケストレーションモジュール1422は、各々のオーダーに関連付けられるビジネスプロセスの管理を可能にし、ビジネス論理を適用してオーダーがプロビジョニングに進むべきか否かを判断する。動作1442において、新たなサブスクリプションについてのオーダーを受信すると、オーダーオーケストレーションモジュール1422は、リソースを割り振って当該サブスクリプションオーダーを満たすのに必要とされるそれらのリソースを構成するための要求をオーダープロビジョニングモジュール1424に送る。オーダープロビジョニングモジュール1424は、顧客によってオーダーされたサービスについてのリソースの割り振りを可能にする。オーダープロビジョニングモジュール1424は、クラウドインフラストラクチャシステム1400によって提供されるクラウドサービスと、要求されたサービスを提供するためのリソースをプロビジョニングするために使用される物理的実装層との間にあるレベルの抽象化を提供する。したがって、オーダーオーケストレーションモジュール1422は、サービスおよびリソースが実際に実行中にプロビジョニングされるか、事前にプロビジョニングされて要求があったときに割振られる/割当てられるのみであるかなどの実装の詳細から切り離すことができる。
【0134】
動作1444において、サービスおよびリソースがプロビジョニングされると、提供されたサービスの通知が、クラウドインフラストラクチャシステム1402のオーダープロビジョニングモジュール1424によってクライアントデバイス1404,1406および/または1408上の顧客に送られ得る。
【0135】
動作1446において、顧客のサブスクリプションオーダーが、オーダー管理および監視モジュール1426によって管理および追跡され得る。いくつかの例では、オーダー管理および監視モジュール1426は、使用される記憶量、転送されるデータ量、ユーザの数、ならびにシステムアップ時間およびシステムダウン時間などのサブスクリプションオーダーにおけるサービスについての使用統計を収集するように構成され得る。
【0136】
特定の実施形態においては、クラウドインフラストラクチャシステム1400は、アイデンティティ管理モジュール1428を含み得る。アイデンティティ管理モジュール1428は、クラウドインフラストラクチャシステム1400におけるアクセス管理および認可サービスなどのアイデンティティサービスを提供するように構成され得る。いくつかの実施形態においては、アイデンティティ管理モジュール1428は、クラウドインフラストラクチャシステム1402によって提供されるサービスを利用したい顧客についての情報を制御し得る。このような情報は、このような顧客のアイデンティティを認証する情報と、それらの顧客がさまざまなシステムリソース(たとえばファイル、ディレクトリ、アプリケーション、通信ポート、メモリセグメントなど)に対してどのアクションを実行することを認可されるかを記載する情報とを含み得る。また、アイデンティティ管理モジュール1428は、各々の顧客についての説明的情報、ならびに、どのようにしておよび誰によってこの説明的情報がアクセスおよび変更され得るかについての情報の管理を含み得る。
【0137】
図15は、本発明のさまざまな実施形態を実現することができる例示的なコンピュータシステム1500を示す。システム1500は、上記のコンピュータシステムのうちのいずれかを実現するために使用され得る。たとえば、図1に示されるパイプ漏れ予測システムの要素のすべてまたはいくつかは、システム1500に含まれ得るかまたは実現され得る。図15に示されているように、コンピュータシステム1500は、バスサブシステム1502を介していくつかの周辺サブシステムと通信する処理ユニット1504を含む。これらの周辺サブシステムは、処理加速ユニット1506と、I/Oサブシステム1508と、記憶サブシステム1518と、通信サブシステム1524とを含み得る。記憶サブシステム1518は、有形のコンピュータ読取可能な記憶媒体1522と、システムメモリ1510とを含む。
【0138】
バスサブシステム1502は、コンピュータシステム1500のさまざまな構成要素およびサブシステムに、意図されたように互いに通信させるための機構を提供する。バスサブシステム1502は、単一のバスとして概略的に示されているが、バスサブシステムの代替的な実施形態は、複数のバスを利用してもよい。バスサブシステム1502は、メモリバスまたはメモリコントローラ、周辺バス、およびさまざまなバスアーキテクチャのうちのいずれかを使用するローカルバスを含むいくつかのタイプのバス構造のうちのいずれかであってもよい。たとえば、このようなアーキテクチャは、IEEE P1386.1標準に合わせて製造されたメザニンバスとして実現可能な、業界標準アーキテクチャ(Industry Standard Architecture:ISA)バス、マイクロチャネルアーキテクチャ(Micro Channel Architecture:MCA)バス、拡張ISA(Enhanced ISA:EISA)バス、ビデオ・エレクトロニクス・スタンダーズ・アソシエーション(Video Electronics Standards Association:VESA)ローカルバスおよび周辺機器相互接続(Peripheral Component Interconnect:PCI)バスを含み得る。
【0139】
1つ以上の集積回路(たとえば従来のマイクロプロセッサまたはマイクロコントローラ)として実現可能な処理ユニット1504は、コンピュータシステム1500の動作を制御する。処理ユニット1504には、1つ以上のプロセッサが含まれ得る。これらのプロセッサは、単一コアまたはマルチコアのプロセッサを含み得る。特定の実施形態においては、処理ユニット1504は、各々の処理ユニットに含まれる単一コアまたはマルチコアのプロセッサを有する1つ以上の独立した処理ユニット1532および/または1534として実現されてもよい。また、他の実施形態においては、処理ユニット1504は、2つのデュアルコアプロセッサを単一のチップに組み入れることによって形成されるクアッドコア処理ユニットとして実現されてもよい。
【0140】
さまざまな実施形態においては、処理ユニット1504は、プログラムコードに応答してさまざまなプログラムを実行し得るとともに、同時に実行される複数のプログラムまたはプロセスを維持し得る。任意の所与の時点において、実行されるべきプログラムコードのうちのいくつかまたは全ては、プロセッサ1504および/または記憶サブシステム1518に存在し得る。好適なプログラミングを通じて、プロセッサ1504は、上記のさまざまな機能を提供し得る。また、コンピュータシステム1500は、加えて、デジタル信号プロセッサ(digital signal processor:DSP)、特殊用途プロセッサなどを含み得る処理加速ユニット1506を含み得る。
【0141】
I/Oサブシステム1508は、ユーザインターフェイス入力装置と、ユーザインターフェイス出力装置とを含み得る。ユーザインターフェイス入力装置は、キーボード、マウスまたはトラックボールなどのポインティング装置、タッチパッドまたはタッチスクリーンを含んでいてもよく、これらは、音声コマンド認識システム、マイクロホンおよび他のタイプの入力装置とともに、ディスプレイ、スクロールホイール、クリックホイール、ダイアル、ボタン、スイッチ、キーパッド、オーディオ入力装置に組込まれている。ユーザインターフェイス入力装置は、たとえば、ジェスチャおよび話されたコマンドを用いてナチュラルユーザインターフェースを介してユーザがマイクロソフトXbox(登録商標)360ゲームコントローラなどの入力装置を制御して入力装置と対話することを可能にするマイクロソフトキネクト(登録商標)モーションセンサなどのモーション検知および/またはジェスチャ認識装置を含み得る。また、ユーザインターフェイス入力装置は、ユーザから眼球運動(たとえば撮影および/またはメニュー選択を行っている間の「まばたき」)を検出して、当該眼球ジェスチャを入力装置への入力として変換するグーグルグラス(登録商標)まばたき検出器などの眼球ジェスチャ認識装置を含み得る。また、ユーザインターフェイス入力装置は、ユーザが音声コマンドを介して音声認識システム(たとえばSiri(登録商標)ナビゲータ)と対話することを可能にする音声認識検知装置を含み得る。
【0142】
また、ユーザインターフェイス入力装置は、三次元(3D)マウス、ジョイスティックまたはポインティングスティック、ゲームパッドおよびグラフィックタブレット、およびスピーカなどのオーディオ/ビジュアル装置、デジタルカメラ、デジタルカムコーダ、携帯型メディアプレーヤ、ウェブカム、画像スキャナ、指紋スキャナ、バーコードリーダ3Dスキャナ、3Dプリンタ、レーザレンジファインダ、および視線検出装置を含み得るが、これらに限定されるものではない。また、ユーザインターフェイス入力装置は、たとえば、コンピュータ断層撮影、磁気共鳴画像化、位置発光断層撮影、医療用超音波検査装置などの医療用画像化入力装置を含み得る。また、ユーザインターフェイス入力装置は、たとえばMIDIキーボード、デジタル楽器などのオーディオ入力装置を含み得る。
【0143】
ユーザインターフェイス出力装置は、ディスプレイサブシステム、表示灯、またはオーディオ出力装置などの非視覚的ディスプレイなどを含み得る。ディスプレイサブシステムは、陰極線管(cathode ray tube:CRT)、液晶ディスプレイ(liquid crystal display:LCD)またはプラズマディスプレイを使用するものなどのフラットパネルディスプレイ、投影装置、タッチスクリーンなどであってもよい。一般に、「出力装置」という用語の使用は、コンピュータシステム1500からの情報をユーザまたは他のコンピュータに出力するための全ての実現可能なタイプの装置および機構を含むよう意図されている。たとえば、ユーザインターフェイス出力装置は、モニタ、プリンタ、スピーカ、ヘッドホン、自動車のナビゲーションシステム、プロッタ、音声出力装置およびモデムなどの、テキスト、グラフィックスおよびオーディオ/ビデオ情報を視覚的に伝えるさまざまな表示装置を含み得るが、これらに限定されるものではない。
【0144】
コンピュータシステム1500は、現在のところシステムメモリ1510内に位置しているように示されているソフトウェア要素を備える記憶サブシステム1518を備え得る。システムメモリ1510は、処理ユニット1504上でロード可能および実行可能なプログラム命令と、これらのプログラムの実行中に生成されるデータとを格納し得る。
【0145】
コンピュータシステム1500の構成およびタイプに応じて、システムメモリ1510は、揮発性(ランダムアクセスメモリ(random access memory:RAM)など)であってもよく、および/または、不揮発性(リードオンリメモリ(read-only memory:ROM)、フラッシュメモリなど)であってもよい。RAMは、典型的には、処理ユニット1504が直ちにアクセス可能なデータおよび/またはプログラムモジュール、および/または、処理ユニット1504によって現在動作および実行されているデータおよび/またはプログラムモジュールを収容する。いくつかの実現例では、システムメモリ1510は、スタティックランダムアクセスメモリ(static random access memory:SRAM)または
ダイナミックランダムアクセスメモリ(dynamic random access memory:DRAM)などの複数の異なるタイプのメモリを含み得る。いくつかの実現例では、始動中などにコンピュータシステム1500内の要素間で情報を転送することを助ける基本ルーチンを含む基本入力/出力システム(basic input/output system:BIOS)が、典型的にはROM
に格納され得る。一例としておよび非限定的に、システムメモリ1510は、クライアントアプリケーション、ウェブブラウザ、中間層アプリケーション、リレーショナルデータベース管理システム(relational database management system:RDBMS)などを含
み得るアプリケーションプログラム1512、プログラムデータ1514およびオペレーティングシステム1516も示す。一例として、オペレーティングシステム1516は、マイクロソフトウィンドウズ(登録商標)、アップルマッキントッシュ(登録商標)および/もしくはリナックスオペレーティングシステムのさまざまなバージョン、さまざまな市販のUNIX(登録商標)もしくはUNIXライクオペレーティングシステム(さまざまなGNU/リナックスオペレーティングシステム、Google Chrome(登録商標)OSなどを含むが、これらに限定されるものではない)、ならびに/または、iOS、ウィンドウズ(登録商標)フォン、アンドロイド(登録商標)OS、ブラックベリー(登録商標)10OSおよびパーム(登録商標)OSオペレーティングシステムなどのモバイルオペレーティングシステムを含み得る。
【0146】
また、記憶サブシステム1518は、いくつかの実施形態の機能を提供する基本的なプログラミングおよびデータ構造を格納するための有形のコンピュータ読取可能な記憶媒体を提供し得る。プロセッサによって実行されたときに上記の機能を提供するソフトウェア(プログラム、コードモジュール、命令)が記憶サブシステム1518に格納され得る。これらのソフトウェアモジュールまたは命令は、処理ユニット1504によって実行され得る。また、記憶サブシステム1518は、本発明に従って使用されるデータを格納するためのリポジトリを提供し得る。
【0147】
また、記憶サブシステム1500は、コンピュータ読取可能な記憶媒体1522にさらに接続可能なコンピュータ読取可能な記憶媒体リーダ1520を含み得る。ともにおよび任意には、システムメモリ1510と組合せて、コンピュータ読取可能な記憶媒体1522は、コンピュータ読取可能な情報を一時的および/または永久に収容、格納、送信および検索するための記憶媒体に加えて、リモートの、ローカルの、固定されたおよび/または取外し可能な記憶装置を包括的に表わし得る。
【0148】
コードまたはコードの一部を含むコンピュータ読取可能な記憶媒体1522は、当該技術分野において公知のまたは使用される任意の適切な媒体を含み得る。当該媒体は、情報の格納および/または送信のための任意の方法または技術において実現される揮発性および不揮発性の、取外し可能および取外し不可能な媒体などであるが、これらに限定されるものではない記憶媒体および通信媒体を含む。これは、RAM、ROM、電子的消去・プログラム可能ROM(electronically erasable programmable ROM:EEPROM)、フラッシュメモリもしくは他のメモリ技術、CD-ROM、デジタル多用途ディスク(digital versatile disk:DVD)、または他の光学式記憶装置、磁気カセット、磁気テープ、磁気ディスク記憶装置もしくは他の磁気記憶装置、または他の有形のコンピュータ読取可能な媒体などの有形の一時的なコンピュータ読取可能な記憶媒体を含み得る。また、これは、データ信号、データ送信などの無形の一時的なコンピュータ読取可能な媒体、または、所望の情報を送信するために使用可能であるとともに計算システム1500によってアクセス可能である他の任意の媒体を含み得る。
【0149】
一例として、コンピュータ読取可能な記憶媒体1522は、取外し不可能な不揮発性磁気媒体から読取るまたは当該媒体に書込むハードディスクドライブ、取外し可能な不揮発性磁気ディスクから読取るまたは当該ディスクに書込む磁気ディスクドライブ、ならびに、CD ROM、DVDおよびブルーレイ(登録商標)ディスクまたは他の光学式媒体などの取外し可能な不揮発性光学ディスクから読取るまたは当該ディスクに書込む光学式ディスクドライブを含み得る。コンピュータ読取可能な記憶媒体1522は、ジップ(登録商標)ドライブ、フラッシュメモリカード、ユニバーサルシリアルバス(universal serial bus:USB)フラッシュドライブ、セキュアデジタル(secure digital:SD)カード、DVDディスク、デジタルビデオテープなどを含み得るが、これらに限定されるものではない。また、コンピュータ読取可能な記憶媒体1522は、フラッシュメモリベースのSSD、企業向けフラッシュドライブ、ソリッドステートROMなどの不揮発性メモリに基づくソリッドステートドライブ(solid-state drive:SSD)、ソリッドステート
RAM、ダイナミックRAM、スタティックRAMなどの揮発性メモリに基づくSSD、DRAMベースのSSD、磁気抵抗RAM(magnetoresistive RAM:MRAM)SSD、およびDRAMとフラッシュメモリベースのSSDとの組合せを使用するハイブリッドSSDを含み得る。ディスクドライブおよびそれらの関連のコンピュータ読取可能な媒体は、コンピュータ読取可能な命令、データ構造、プログラムモジュールおよび他のデータをコンピュータシステム1500に提供し得る。
【0150】
通信サブシステム1524は、他のコンピュータシステムおよびネットワークとのインターフェイスを提供する。通信サブシステム1524は、他のシステムからデータを受信したり、コンピュータシステム1500から他のシステムにデータを送信するためのインターフェイスの役割を果たす。たとえば、通信サブシステム1524は、コンピュータシステム1500がインターネットを介して1つ以上の装置に接続することを可能にし得る。いくつかの実施形態においては、通信サブシステム1524は、(たとえば3G、4GまたはEDGE(enhanced data rates for global evolution)などの携帯電話技術、高度データネットワーク技術を用いて)無線音声および/またはデータネットワークにアクセスするための無線周波数(radio frequency:RF)トランシーバコンポーネント、W
iFi(IEEE1902.11ファミリ標準または他のモバイル通信技術またはそれらの任意の組合せ)、全地球測位システム(global positioning system:GPS)レシー
バコンポーネント、および/または、他のコンポーネントを含み得る。いくつかの実施形態においては、通信サブシステム1524は、無線インターフェイスに加えて、または無線インターフェイスの代わりに、有線ネットワーク接続(例えばイーサネット)を提供し得る。
【0151】
また、いくつかの実施形態においては、通信サブシステム1524は、コンピュータシステム1500を使用し得る1人以上のユーザを代表して、構造化されたおよび/または構造化されていないデータフィード1526、イベントストリーム1528、イベント更新1530などの形態で入力通信を受信し得る。
【0152】
一例として、通信サブシステム1524は、ツイッター(登録商標)フィード、フェースブック(登録商標)更新、リッチ・サイト・サマリ(Rich Site Summary:RSS)フ
ィードなどのウェブフィードなどのデータフィード1526をリアルタイムでソーシャルメディアネットワークおよび/または他の通信サービスのユーザから受信し、および/または、1つ以上の第三者情報源からリアルタイム更新を受信するように構成され得る。
【0153】
加えて、通信サブシステム1524は、連続的なデータストリームの形態でデータを受信するように構成され得る。当該データは、連続的である場合もあれば本質的に明確な端部をもたない状態で境界がない場合もあるリアルタイムイベントのイベントストリーム1528および/またはイベント更新1530を含み得る。連続的なデータを生成するアプリケーションの例としては、たとえばセンサデータアプリケーション、金融ティッカ、ネットワーク性能測定ツール(たとえばネットワークモニタリングおよびトラフィック管理アプリケーション)、クリックストリーム分析ツール、自動車交通モニタリングなどを含み得る。
【0154】
また、通信サブシステム1524は、構造化されたおよび/または構造化されていないデータフィード1526、イベントストリーム1528、イベント更新1530などを、コンピュータシステム1500に結合された1つ以上のストリーミングデータソースコンピュータと通信し得る1つ以上のデータベースに出力するように構成され得る。
【0155】
コンピュータシステム1500は、手持ち式携帯機器(たとえばiPhone(登録商標)携帯電話、iPad(登録商標)計算タブレット、PDA)、ウェアラブル装置(たとえばグーグルグラス(登録商標)ヘッドマウントディスプレイ)、PC、ワークステーション、メインフレーム、キオスク、サーバラックまたはその他のデータ処理システムを含むさまざまなタイプのうちの1つであってもよい。
【0156】
コンピュータおよびネットワークの絶え間なく変化し続ける性質のために、図15に示されているコンピュータシステム1500の説明は、特定の例として意図されているに過ぎない。図15に示されているシステムよりも多くのまたは少ない数の構成要素を有する多くの他の構成が可能である。たとえば、ハードウェア、ファームウェア、(アプレットを含む)ソフトウェア、または組合せにおいて、カスタマイズされたハードウェアが使用されてもよく、および/または、特定の要素が実装されてもよい。さらに、ネットワーク入力/出力装置などの他のコンピューティングデバイスへの接続が利用されてもよい。本明細書中に提供される開示および教示に基づいて、当業者は、さまざまな実施形態を実現するための他の手段および/または方法を理解するであろう。
【0157】
上述の明細書では、本発明の局面は、その具体的な実施形態を参照して記載されているが、本発明はこれに限定されるものではないことを当業者は認識するであろう。上述の発明のさまざまな特徴および局面は、個々にまたは一緒に使用されてもよい。さらに、実施形態は、明細書のより広い精神および範囲から逸脱することなく、本明細書に記載されているものを越えたいくつもの環境およびアプリケーションでも利用可能である。したがって、明細書および図面は、限定的ではなく例示的なものとみなされるべきである。
図1
図2
図3
図4
図5
図6
図7
図8
図9
図10
図11
図12
図13
図14
図15