(19)【発行国】日本国特許庁(JP)
(12)【公報種別】特許公報(B2)
(11)【特許番号】
(24)【登録日】2024-11-08
(45)【発行日】2024-11-18
(54)【発明の名称】配管損傷予測
(51)【国際特許分類】
G01M 3/00 20060101AFI20241111BHJP
G06Q 50/06 20240101ALI20241111BHJP
【FI】
G01M3/00 H
G06Q50/06
G01M3/00 Z
(21)【出願番号】P 2020552819
(86)(22)【出願日】2019-03-26
(86)【国際出願番号】 US2019024139
(87)【国際公開番号】W WO2019191138
(87)【国際公開日】2019-10-03
【審査請求日】2022-03-25
(32)【優先日】2018-03-28
(33)【優先権主張国・地域又は機関】US
(32)【優先日】2018-04-16
(33)【優先権主張国・地域又は機関】US
(32)【優先日】2018-05-15
(33)【優先権主張国・地域又は機関】US
(32)【優先日】2018-10-09
(33)【優先権主張国・地域又は機関】US
(32)【優先日】2018-10-09
(33)【優先権主張国・地域又は機関】US
(32)【優先日】2018-10-09
(33)【優先権主張国・地域又は機関】US
(73)【特許権者】
【識別番号】520370094
【氏名又は名称】フラクタ
【氏名又は名称原語表記】Fracta
(74)【代理人】
【識別番号】100108453
【氏名又は名称】村山 靖彦
(74)【代理人】
【識別番号】100110364
【氏名又は名称】実広 信哉
(74)【代理人】
【識別番号】100133400
【氏名又は名称】阿部 達彦
(72)【発明者】
【氏名】ヨシカワ, ダイチ
(72)【発明者】
【氏名】カトウ, タカシ
【審査官】前田 敏行
(56)【参考文献】
【文献】特開2015-094665(JP,A)
【文献】特開2014-182609(JP,A)
【文献】特開2012-108836(JP,A)
【文献】中国特許出願公開第107480705(CN,A)
【文献】国際公開第2017/154761(WO,A1)
【文献】米国特許出願公開第2013/0211797(US,A1)
【文献】特開2014-145603(JP,A)
【文献】国際公開第2015/129031(WO,A1)
【文献】米国特許第09395262(US,B1)
(58)【調査した分野】(Int.Cl.,DB名)
G01M 3/00-3/40
G06Q 50/00-50/20
G06Q 50/26-99/00
G06T 3/08
G06T 7/00
(57)【特許請求の範囲】
【請求項1】
消費者へ流体を運ぶための、漏洩したことのない配管を含む地中配管のネットワークにおける配管漏洩を予測することを取り入れた、漏洩したことのない配管を含む優先付けされた
、コンピュータシステムによって実施される配管交換方法において、
該配管の漏洩に潜在的に影響を与える
少なくとも60個の変数である第1組の変数であって
、ユーティリティデータと公共データとを自動的に結合することによって得られた第1組の変数をコンピュータシステムによって受け取り、
該第1組の変数のサブセットである第2組の変数を、該コンピュータシステムによって
該第1組の変数に関してランダムフォレストプロセスを複数回稼働させることにより自動的に選択し、
該第2組の変数に基づいて機械学習を使用して数学的モデルを構築し、
該モデルに基づいて、漏洩したことのない配管を含む配管セグメントの漏洩の尤度を予測し、
配管の図形的描写および、配管交換ジョブの優先付けの、選択された将来の時間期間にわたっての配管の破損の尤度を形成し、
該図形的描写と一貫するように、且つ該図形的描写に案内されて、漏洩したことのない配管を含む配管交換ジョブを実行する
ことを包含している方法であって、
該第1組の変数の内の少なくとも幾つかは漏洩したことのない配管に関するデータを包含している、方法。
【請求項2】
該選択することが、該第1組の変数に基づいて初期モデルを構築し、且つ前記初期モデルに基づいて該第1組内の各変数と関連する重要性を評価する、ことを包含している請求項1記載の方法。
【請求項3】
該重要性を評価することが、ジニ係数又は情報利得係数を評価することに基づいている請求項2記載の方法。
【請求項4】
該第1組の変数の内の少なくとも幾つかは所定のカテゴリーへ割り当てられ、且つ該選択することが該第2組に含まれるべき各カテゴリーにおいて所定数を超えることのない変数を選択することを包含している請求項1記載の方法。
【請求項5】
該第1組における変数の数が少なくとも100である請求項1記載の方法。
【請求項6】
該第1組における変数の数が少なくとも500である請求項5記載の方法。
【請求項7】
該第2組における変数の数が60未満である請求項1記載の方法。
【請求項8】
該第1組における変数の数が少なくとも300であり且つ該第2組における変数の数が50未満である請求項7記載の方法。
【請求項9】
該第1組の変数の一部が地理空間分析によって発生される請求項1記載の方法。
【請求項10】
配管の前記ネットワークは第1顧客ユーティリティ会社に対するものであり且つ該モデルを前記構築することが第2顧客ユーティリティ会社からのデータを使用することを包含している請求項1記載の方法。
【請求項11】
該モデルを前記構築することが統合型全国ユーティリティデータベースからのデータを使用することを包含している請求項1記載の方法。
【請求項12】
該モデルを前記構築することが、各々が異なる時間期間からのデータに基づいている複数個のモデルに少なくとも部分的に基づいている請求項1記載の方法。
【請求項13】
前記流体が真水である請求項1記載の方法。
【請求項14】
前記流体が、排水、リサイクル水、汽水、暴風水、海水、飲料水、油、天然ガス、蒸気、及び圧縮空気からなるグループから選択される請求項1記載の方法。
【請求項15】
前記予測することが、将来の時間期間にわたり配管セグメントの漏洩の尤度を予測することを包含しており、その予測結果が同様の長さの以前の時間期間にわたり発生したことが知られている損傷数に部分的に基づいてキャリブレーションされる請求項1記載の方法。
【請求項16】
該第1組の変数の内の少なくとも幾つかは所定のカテゴリーへ割り当てられ、且つ本方法が、更に、該所定のカテゴリーの各々と関連する正規化された重要性を評価することを包含している請求項1記載の方法。
【請求項17】
該配管セグメントの漏洩を予測することが、該ネットワークにおける配管の漏洩履歴が使用可能な年数よりも一層大きな将来の年数に対してなされる請求項1記載の方法。
【請求項18】
消費者へ流体を運ぶための、漏洩したことのない配管を含む地中配管のネットワークにおける配管漏洩を予測することを取り入れた、漏洩したことのない配管を含む優先付けされた配管交換のためのシステムにおいて、
該配管の漏洩に関する
少なくとも60個の変数である第1組の変数であって
、ユーティリティデータと公共データとを自動的に結合することによって得られた第1組の変数を格納するデータベース、
処理システムであって、
該第1組の変数のサブセットである第2組の変数を
、該第1組の変数に関してランダムフォレストプロセスを複数回稼働させることにより自動的に選択し、
該第2組の変数に基づく機械学習を使用してモデルを構築し、
該モデルに基づいて配管セグメントの漏洩の尤度を予測し、
該ネットワークにおける配管の図形的描写および、配管交換ジョブの優先付けの、選択された将来の時間期間にわたっての配管の破損の尤度を形成し、
該ネットワークにおける配管の該図形的描写、選択された将来の時間期間にわたっての配管の破損の尤度、および配管交換を実行するための配管交換ジョブの優先付けを表示し、
該図形的描写と一貫するように、且つ該図形的描写に案内されて、漏洩したことのない配管を含む配管交換の優先付けをすべく構成されている、処理システム、
を有しているシステムであって、
該第1組の変数の内の少なくとも幾つかは漏洩したことのない配管に関するデータを包含している、システム。
【請求項19】
該処理システムが、該第1組の変数に基づいて初期モデルを構築し且つ前記初期モデルに基づいて該第1組における各変数と関連する重要性を評価することによって該第2組を選択する請求項18記載のシステム。
【請求項20】
該第1組の変数の内の少なくとも幾つかは所定のカテゴリーへ割り当てられ且つ該第2組に含まれるべく各カテゴリーにおいて所定数を超えることのない変数が選択される請求項18記載のシステム。
【請求項21】
該第1組における変数の数が少なくとも500である請求項18記載のシステム。
【請求項22】
該第2組における変数の数が50未満である請求項18記載のシステム。
【請求項23】
前記流体が、真水、排水、海水、リサイクルした水、汽水、暴風水、飲料水、蒸気、圧縮空気、油、及び天然ガスからなるグループから選択される請求項18記載のシステム。
【発明の詳細な説明】
【技術分野】
【0001】
本願は、以下の仮出願の各々の優先権を主張すると共に引用により本書に取り込むこととする。
【0002】
米国仮特許出願第62/649,058号、2018年3月28日出願;
米国仮特許出願第62/658,189号、2018年4月16日出願;
米国仮特許出願第62/671,601号、2018年5月15日出願;
米国仮特許出願第62/743,477号、2018年10月9日出願;
米国仮特許出願第62/743,483号、2018年10月9日出願;及び
米国仮特許出願第62/743,485号、2018年10月9日出願。
【0003】
本願は、本願と同日に出願しており、集約的に「同時係属中の特許出願」として言及する次の米国及びPCT出願;即ち、米国特許出願第16/365,466号(代理人ドケット番号:Fracta-002-US)、米国特許出願第16/365,522号(代理人ドケット番号:Fracta-006-US)、及び国際特許出願番号第___(代理人とケット番号:Fracta-006-PCT)に関連しており且つそれらを引用により本書に取り込むこととする。
【0004】
本特許出願は、大略、配管損傷を予測する改良したシステム及び方法に関するものである。更に詳細には、幾つかの実施例は水道本管等の配管の将来の破損を予測する改良したシステム及び方法に関するものである。
【背景技術】
【0005】
米国一国における百万マイルを超える水道管が耐用寿命の終わりに近づいており、交換する必要性がある。次の25年にわたって、成長する人口に対して現在のレベルのサービスを維持するためには、少なくとも1兆ドルの投資が必要となる。この問題を無視することは一層高い修理費となり且つサービス途絶の増大を招くこととなる。
【0006】
米国においては、約50,000社の給水会社は、制限された予算に起因して、それら全てを交換するための資源を有するものではない。期限切れの配管全てを交換することは不可能であるから、戦略的に、期限切れであるが健全な配管を将来に交換することとして、最悪の状態にある配管の交換を優先させることが重要である。
【0007】
水道事業会社が作成した交換計画はかなり不正確であり、且つ、多くの場合に、有用なものではない。水道事業会社が作成した安易なモデルは、未だに更なる寿命年数を有するであろう配管を無駄に交換してしまうこととなる。次の25年にわたって、このことは数百万ドルの無駄な浪費となることであろう。
【発明の概要】
【発明が解決しようとする課題】
【0008】
幾つかの実施例によれば、真水又は天然ガス等の流体を消費者へ供給するための地中配管のネットワーク内における配管漏れを予測するための方法を記載する。本方法は、配管の漏れに関する第1組の変数であって少なくとも60個の変数である該第1組の変数をコンピュータシステムによって受け取り、該第1組の変数のサブセットである第2組の変数を該コンピュータシステムによって自動的に選択し、該第2組の変数に基づいて機械学習を使用して数学モデルを構築し、及び該モデルに基づいて漏れている蓋然性のある配管セグメントを予測する、ことを包含している。幾つかの実施例によれば、該配管は、排水、リサイクルされた水、汽水、暴風水、海水、飲料水、水蒸気、圧縮空気、油、及び天然ガス等のその他のタイプの流体を供給するために使用することが可能である。
【課題を解決するための手段】
【0009】
幾つかの実施例によれば、該選択することが、該第1組の変数に基づいてモデルを構築すること、及び前記初期モデルに基づいて該第1組内の各変数と関連する重要性を評価すること、を包含している。該重要性の評価は、ジニ係数(Gini coefficients)又は情報利得係数(Information gain coefficients)等の係数に基づくものとすることが可能である。幾つかの実施例によれば、該第1組の変数の内の少なくとも幾つかは所定のカテゴリーに割り当てられ且つ各カテゴリーにおける所定数の変数を超えて該第2組内に包含されることは無い。
【0010】
幾つかの実施例によれば、該第1組内の変数の数は、少なくとも、100、300、800又は1000個である。幾つかの実施例によれば、該第2組における変数の数は100、60、40、20又は12個未満である。幾つかの実施例によれば、該第2組の変数の数は該第1組の50%未満である。幾つかの実施例によれば、該第2組の変数の数は該第1組の25%未満である。
【0011】
幾つかの実施例によれば、該第1組の変数の一部は地理空間分析によって発生される。幾つかの実施例によれば、該第1組の変数の内の少なくとも幾つかは、漏れたことの無い配管に関するデータを包含しており、且つ該選択は該非漏れデータに少なくとも部分的に基づくものである。
【0012】
幾つかの実施例によれば、該配管のネットワークは第1顧客水道事業会社用であり、且つ前記モデルを構築することは、第2顧客水道事業会社からのデータを使用することを包含している。幾つかの実施例によれば、該モデルを構築することは、統合された国家水道事業データベースからのデータを使用することを包含している。幾つかの実施例によれば、該モデルを構築することは、各々が異なる時間間隔からのデータに基づくものである複数個のモデルに少なくとも部分的に基づいている。
【0013】
幾つかの実施例によれば、顧客へ流体を供給する地中配管のネットワークにおける配管漏れ予測するシステムが記載される。本システムは、該配管の漏れに関する第1組の変数であって少なくとも60個の変数である該第1組の変数を格納するデータベース、及び該第1組の変数のサブセットである第2組の変数を自動的に選択し且つ該第2組の変数に基づいて機械学習を使用してモデルを構築し且つ該モデルに基づいて漏れている蓋然性のある配管セグメントを予測する形態とされている処理システム、を包含している。
【0014】
本書において使用されているように、「及び」、「又は」、「及び/又は」という文法上の接続詞は全て、それらが接続する事例、物体、又は実体の一つ又はそれ以上が発生するか又は存在する場合があることを表すことを意図している。この様に、本書において使用されているように、すべての事例における「又は」という用語は、「排他的又は」の意味ではなく「包括的又は」の意味を表している。
【0015】
本特許明細書の要旨の上記及びその他の利点及び特徴を更に明らかにさせるために、その実施例の特定例が添付図面に例示されている。理解すべきことであるが、一つの図に例示されている要素又は部品は別の図面に例示されている同等又は同様の要素又は部品の代わりに使用することが可能であり、且つこれらの図面は例示的な実施例を図示するに過ぎないものであるから、本特許明細書及び添付の請求の範囲の範囲を制限するものとして考えるべきではない。その要旨について、添付の図面を使用して、付加的な特定性及び詳細を伴って記載し且つ説明する。
【図面の簡単な説明】
【0016】
【
図1】幾つかの実施例に基づく、配管損傷を予測するために使用される処理モデルの側面を例示した概略図。
【
図2】幾つかの実施例に基づく、配管損傷を予測するために使用されるモデルに基づくジョブプラニングの側面を例示した概略図。
【
図3A】幾つかの実施例に基づく、異なる水道事業会社顧客カテゴリーの側面を例示した概略図。
【
図3B】幾つかの実施例に基づく、異なる水道事業会社顧客カテゴリーの側面を例示した概略図。
【
図3C】幾つかの実施例に基づく、異なる水道事業会社顧客カテゴリーの側面を例示した概略図。
【
図4】幾つかの実施例に基づく、配管損傷を予測するアーキテクチャの側面を例示した概略図。
【
図5】単位長さ当たりの損傷(LOF/長さ)が異なるものである場合があることを例示した概略図。
【
図6】幾つかの実施例に基づく、次の5年間に対する破損の蓋然性を計算するために時間に関してのアンサンブルの使用を例示した概略図。
【
図7A】従来技術(
図7A)と幾つかの実施例に基づく技術(
図7B)との間の性能差を例示した概略図。
【
図7B】従来技術(
図7A)と幾つかの実施例に基づく技術(
図7B)との間の性能差を例示した概略図。
【
図8A】幾つかの実施例に基づく、地理空間分析を介して発生した変数を例示している概略図。
【
図8B】幾つかの実施例に基づく、地理空間分析を介して発生した変数を例示している概略図。
【
図9】幾つかの実施例に基づく、配管破損を予測するための統合したユーティリティデータベースを構築する状態を例示した概略図。
【
図10】幾つかの実施例に基づく、モデルに基づく配管漏れ予測のための自動化した変数選択の側面を例示した概略図。
【
図11A】幾つかの実施例に基づく、配管交換最適化の側面を例示した概略図。
【
図11B】幾つかの実施例に基づく、配管交換最適化の側面を例示した概略図。
【
図13A】幾つかの実施例に基づく、検討中の3つの異なる可能性のある配管交換ジョブの内の一つを示している。
【
図13B】幾つかの実施例に基づく、検討中の3つの異なる可能性のある配管交換ジョブの内の一つを示している。
【
図13C】幾つかの実施例に基づく、検討中の3つの異なる可能性のある配管交換ジョブの内の一つを示している。
【
図14A】幾つかの実施例に基づく、欠落している配管データ値を予測する側面を例示した概略図。
【
図14B】幾つかの実施例に基づく、欠落している配管データ値を予測する側面を例示した概略図。
【
図15A】幾つかの実施例に基づく、道路と配管との間の相関を例示した概略図。
【
図15B】幾つかの実施例に基づく、道路と配管との間の相関を例示した概略図。
【
図16】幾つかの実施例に基づく、仮想配管データの作成を例示するブロック図。
【
図17】幾つかの実施例に基づく、例示的な配管データのクリーニングを例示した概略図。
【
図18】幾つかの実施例に基づく、例示的な配管データの更なる処理を例示した概略図。
【
図19】幾つかの実施例に基づく、機械学習用に使用する特徴の分割及び抽出を例示した概略図。
【
図20】幾つかの実施例に基づく、漏洩及び汎用モデルの組み合わせを介してのLOFモデルの作成を例示している概略図。
【
図21】幾つかの実施例に基づく、ジョブプラニングの側面を例示した概略図。
【
図22】幾つかの実施例に基づく、配管破損を予測するシステムを例示している概略図。
【
図23】幾つかの実施例に基づく、LOFからの破損の数を予測することを例示している概略図。
【
図24】過去5年間と次の5年間に対する破損における予測される類似性を例示している概略図。
【
図25】幾つかの実施例に基づく、次のN年間の予測される破損数を破損履歴に基づいて計算することが可能であることを例示している概略図。
【
図26】幾つかの実施例に基づく、LOF確率キャリブレーションを例示している概略図。
【
図27】幾つかの実施例に基づく、変数カテゴリーの例示的なランク付けを示しているプロット。
【
図28】幾つかの実施例に基づく、土壌の代表的な特徴の重要性を計算する例を例示している概略図。
【
図29】該カテゴリーの代表的な特徴の重要性の正規化を例示している概略図。
【
図30】幾つかの実施例に基づく、多数の代表的な特徴を1乃至10の重要性でランク付けすることを例示している概略図。
【発明を実施するための形態】
【0017】
好適実施例の幾つかの例を以下に詳細に説明する。幾つかの実施例について記載するが、本特許明細書に記載される新規な要旨は、いずれか一つの実施例又はここに記載する実施例の組み合わせに制限されるものではなく、多数の代替例、修正例、及び均等物を包含するものであることを理解すべきである。更に、完全なる理解を与えるために以下の記載においては多くの特定の詳細について説明するが、幾つかの実施例はこれらの詳細の幾つか又は全てを有すること無しに実施することが可能なものである。更に、説明の便宜上、ここに記載する新規な要旨を不必要にぼかすことを回避するために、関連技術において既知である或る技術事項については詳細に記載するものではない。ここに記載する特定の実施例の内の一つ又は幾つかの個々の特徴は、その他の記載される実施例の特徴又はその他の特徴と組み合わせて使用することが可能であることは明らかである。更に、種々の図面における同様の参照番号及び記号は同様の要素を表すものである。
【0018】
幾つかの実施例によれば、配管の状態の正確な予測のための改良された解決策が記載される。ここに記載する方法は、情報採取、分類、回帰、及び/又は機械学習の組み合わせを使用するデータドリブンアプローチを適用する。本書に記載する種々のシステム及び方法は、従来技術と比較して多くの利点を提供するものである。本書に記載する種々のシステム及び方法は、漏洩予測性能において実質的な改良となることが判明している。特に、本書に記載する実施例の内の幾つかは、従来技術と比較して、次のような改良点の一つ又はそれ以上となる場合があり、即ち、状態を評価するために配管を掘り出すことの必要性の減少又は除去とそれによる著しいコストの減少;土壌特性と、気候と、海岸近接性と、鉄道線とを含む数百個の変数に基づいての損傷の危険性の識別;人間にとって識別することが困難であるか又は不可能である相関関係の識別;将来の配管状態を予測する上での正確さの増加;漏洩予測問題の複雑性における増加の許容;及び/又は多くの水道施設会社に対しての配管交換に対するスケーリングにおいて使用されるコストの減少と時間の減少等の改良点である。
【0019】
本開示の側面によれば、地中配管の交換を優先付けするシステムが、配管データと、配管損傷データと、地理的に特定的なデータを含む外部データとを含む情報を格納しているデータベース、プログラム命令を有している少なくとも1個のプログラムを格納しているメモリ、少なくとも1個のコンピュータへ結合されているネットワークインターフェース、及び該データベース、該ネットワークインターフェース、及び該メモリへ結合されているプロセッサ、を包含している。該プロセッサは、該プロセッサをして、(a)配管のネットワークに対してクリーンなデータを作成するために該データベースから配管データ、配管損傷データ、外部データを入力及び処理させ、(b)損傷予測モデルの配管寿命において使用するために該クリーンなデータ内に潜在的な特徴を発生させ、(c)該潜在的な特徴の重要性を計算させ、(d)最も重要な特徴を抽出させ、(e)履歴データ及び機械学習に基づいて作成された損傷モデルの尤度、即ち蓋然性、に対して該抽出された特徴を適用させ、(f)該配管のネットワークにおける各配管に対して破損の将来の尤度を予測させ、及び(g)各配管に対しての損傷の該尤度を該配管のネットワークの顧客と関連するコンピュータへ送信させるための該少なくとも1個のプログラムの該プログラム命令を実行することが可能である。
【0020】
本開示の更なる側面においては、該機械学習モデルは、配管損傷データが無い配管及び外部データに基づくモデル部品ビルドと、配管データ、配管損傷データ、及び外部データに基づくモデル部品とを有する混合モデルであり、その場合に、該予測は両方のモデル部品に基づいて行われる。
【0021】
本開示の別の側面においては、該メモリ内に格納されている該少なくとも1個のプログラムの内の一つがウエブインターフェースであり、それは、顧客の配管のネットワーク用の該データベース配管データ、及び配管損傷データへ該顧客がアップロードすることを可能とさせる。
【0022】
更なる側面においては、該プログラムは、更に、プレゼンテーションプログラムを包含しており、それは、該顧客のネットワークにおける配管の図形的表示と特定の将来の時間期間にわたっての各配管の破損の尤度とをユーザに対して提示することを可能とさせる。
【0023】
別の側面においては、将来の複数年期間に対する該モデルは、少なくとも一つの前の複数年期間にわたっての該ネットワークにおける配管に対するモデルに部分的に基づいている。更に、該外部データは、土壌データ、天気データ、及び標高データを含む該配管の状態に関するデータを包含している。
【0024】
本開示の側面によれば、地中配管の交換の優先付けを行う方法が、配管のネットワークに対するクリーンなデータを作成するためにデータベースから配管データ、配管損傷データ、及び外部データを入力し且つ処理すること、損傷予測モデルの配管寿命において使用するために該クリーンなデータ内に潜在的な特徴を発生させること、該潜在的な特徴の重要性を計算すること、最も重要な特徴を抽出すること、履歴データ及び機械学習に基づいて形成した破損モデルの尤度に該抽出した特徴を適用すること、該配管のネットワークにおける各配管に対しての破損の将来の尤度を予測すること、及び各配管に対する破損の尤度を該配管のネットワークの顧客と関連するコンピュータへ送信すること、を包含している。
【0025】
別の側面によれば、該方法は、機械学習モデルを使用し、それは、配管破損データ無しでの配管及び外部データに基づくモデル部品ビルドと、配管データ、配管破損データ、及び外部データに基づくモデル部品とを有しており、且つ該予測は両方のモデル部品に基づいて行われる。
【0026】
更に別の側面によれば、該方法は、顧客が顧客の配管のネットワークに対する配管破損データ及びデータベース配管データへアップロードすることを可能とさせるウエブインターフェースであるメモリ内に格納されている少なくとも一つのプログラムを使用する。更に、該プログラムは、更に、プレゼンテーションプログラムを包含しており、それは、顧客のネットワークにおける配管の図形的描写及び特定の将来の時間期間にわたっての各配管の破損の尤度を提示することを可能とする。
【0027】
更に別の側面によれば、将来の複数年期間に対する該モデルは、部分的に、少なくとも一つの前の複数年期間にわたる該ネットワークにおける配管に対する複数のモデルに基づいている。更に、該外部データは、土壌データ、天候データ、及び標高データを含む該配管の状態に関するデータを包含している。
【0028】
本開示の側面によれば、コンピュータプログラムプロダクトが、サーバーをして配管のネットワークの破損の尤度を決定させるコンピュータプログラムロジックをその中に格納して有しており、該コンピュータプログラムロジックは、配管のネットワークに対するクリーンなデータを作成するために該サーバーをしてデータベースから配管データ、配管損傷データ、及び外部データを入力させ且つ処理させる入力及び処理ロジック;破損予測モデルの配管寿命において使用するために該クリーンなデータ内に該サーバーをして潜在的な特徴を発生させる発生ロジック;該潜在的な特徴の重要性を該サーバーをして計算させる計算ロジック;最も重要な特徴を該サーバーをして抽出させる抽出ロジック;履歴データ及び機械学習に基づいて作成される破損モデルの尤度に対して該サーバーをして該抽出された特徴を適用させる適用ロジック:該配管のネットワークにおける各配管に対しては破損の将来の尤度を該サーバーをして予測させる予測ロジック;及び各配管に対しての破損の該尤度を該サーバーをして該配管のネットワークの顧客と関連するコンピュータへ送信させる送信ロジックを有している。
【0029】
別の側面によれば、該コンピュータプログラムプロダクトは機械学習モデルを包含しており、それは混合モデルであって、配管損傷データ無しで配管及び外部データに基づいているモデル部品ビルドと、配管データ、配管損傷データ、及び外部データに基づいているモデル部品とを有しており、且つその予測は両方のモデル部品に基づいて行われる。
【0030】
更に別の則面によれば、該コンピュータプログラムプロダクトは、該サーバーをして、顧客がその顧客の配管のネットワークに対する配管データ及び配管損傷データをデータベースへアップロードすることを可能とさせるウエブインターフェースロジックを包含している。加えて、該ウエブインターフェースロジックは、更に、プレゼンテーションプログラムを包含しており、それは、該サーバーをして、顧客に対して、該顧客のネットワークにおける配管の図形的描写と特定の将来の時間期間にわたっての各配管の破損の尤度とを提示させることを可能とさせる。
【0031】
更に別の側面によれば、将来の複数年期間に対する該モデルは、少なくとも一つの前の複数年期間にわたっての該ネットワークにおけるパイプ即ち配管に対するモデルに部分的に基づいている。
【0032】
本明細書において使用されるように、以下の用語は次のような意味を包含している。即ち、「リーカー(Leaker)」とはN回損傷した配管であり(尚、Nは0より大きな整数);「ノンリーカー(Nonleaker)」とは損傷したことが無い配管であり;「公共データ(Public Data)」とは、例えば、土壌データや天候データ等の公的に入手可能であるか及び/又は政府筋を介して入手可能なデータのことであり;「ユーティリティデータ(Utility Data)」とは水道事業会社によって提供されているデータのことであり(それは、更に、「配管データ(Pipe Data)」と「損傷データ(Break Data)」とに分割可能);「配管データ(Pipe Data)」とは設置年、材質、直径、圧力等に関する情報を含む地理的配管データのことであり;「損傷データ(Break Data)」/「損傷履歴(Break History)」とは場所、関連する配管ID、及び日付を含む配管の損傷記録のことであり;「xxxx(例えば2017)に対する予測モデル(Prediction Model for xxxx(Eg.2017))とはxxxx年の最初の日から次のN(>0)年において発生する将来の配管損傷を予測するための予測モデルのことであり、該モデルはその日直後に発生する損傷データを使用すること無しに構築され;「モデル(Model)」とは、f(x)等の数学的方程式のことであり;「モデリング(Modeling)」とはf(x)等のモデルを構築することであり;「アンサンブル(Ensemble)」とは複数のモデルの結果に基づいて結果を予測する機械学習用語であり;「特徴(Features)」とはy=f(x)におけるxに対応するものであって、その場合に機械学習が特徴からターゲット特徴を予測するものであり;「ターゲット特徴(Target features)」とはy=f(x)におけるyに対応するものであって、その場合に機械学習は特徴からターゲット特徴を予測するものである。注意すべきことであるが、「公共データ」において使用される場合の「パブリック(public)」という用語の使用は、そのデータが無料で公的に一般的に入手可能であることを必ずしも意味するものではない。そうではなく、むしろ、そのデータが政府機関などのプールされた資源(例えば、USGSの土壌データ)から入手可能であることを意味している。
【0033】
水道産業における機械学習の重要な使用場面は、破損尤度(「LOF」)解析で状態評価としても知られている場面である。多くのユーティリティ会社(即ち、ユーティリティーズ(utilities))は、より新しい配管よりもより古い配管の方が一層悪い状態にあると推測する。しかしながら、しばしば、より古い配管、特により古い鋳鉄配管は80年乃至100年前の設置であるにもかかわらずに顕著な堅牢性を示しており、一方、より新しい配管で一層最近の数十年の間に設置されただけのものでも著しい劣化を示しており、しばしば破損に近いものとなっている。従って、複数の異なる変数を考慮に入れること無しに特定年の配管を単純に交換することは浪費となる場合がある。
【0034】
将来の配管損傷の予測と関連して、本開示は機械学習技術を実現することが可能である。機械学習はターゲットを表すためのモデルを構築するため、即ちxとyとが夫々特徴及びターゲット特徴である場合にy=f(x)の形式で機能する関数「f」を構築するため、に使用することが可能である。本開示においては、次のモデルを派生させるために機械学習を使用することが可能である。
【0035】
将来の配管損傷の確率=f(配管データ+損傷データ+公共データ)、又は
将来の配管損傷の確率=f(配管データ+公共データ)
入手可能なデータに基づいてモデルを派生させることは「トレーニング(training)」として参照される場合がある。このトレーニングフェーズにおいて、特徴がターゲット特徴とどのように異なる相関をするかのモデルを繰り返し且つ構築するためにラベル付きデータを使用することが可能である。モデルが一度構築されると、次いでそれは相互検証と呼ばれる処理において該モデルの正確度を評価するために検証データに対してテストされる。
【0036】
本開示の側面によれば、ランダムフォレスト(Random Forest)プロセスの形式を使用することが可能であり、それは、多数の個別的決定木から構成される回帰方法を構成することが可能である。特に、決定木を使用することが可能であり、その場合に、一連の真/偽質問が系統的に一片のデータを特定のカテゴリー内に配置させ、それによりその入力がどのカテゴリーに属するかについての「決定」を行う。例えば、或る簡単な決定木は、一連の真/偽質問に基づいて、(天候や場所等にまつわる質問等)、或る配管が破損する蓋然性があるか否かを決定することが可能である。ランダムフォレストはこれについて拡張し且つ或る回答を導くために多数の付加的な決定木を使用する。
【0037】
一つの木は配管の物質、配管の直径、温度等についての多数の真/偽の質問をする場合がある。別の木は配管の場所及び勾配を考慮する場合があり、且つ別のものは天候や交通データを考慮する場合がある。次いで、ランダムフォレストが多数の異なる木を計算し、そのことが別の結果に対して一つの結果を決定し、即ちその配管が破損するかどうかということを決定し、且つ最終的な回答乃至は勧告は、どの結果が複数の木の内の過半数又はその他の何らかの閾値によって識別されたかに基づいて決定することが可能である。
【0038】
図1は、幾つかの実施例に基づいて、配管破損を予測するために使用される処理モデルの側面を例示している概略図である。ブロック110において、ユーティリティデータ及び公共データをクリーニングし且つ空間情報処理(geo-process)する。機械学習分析を実施する前に、データを収集する。例えば、本開示では、ウエブインターフェースを提供し、それを介して水道ユーティリティーズは、配管データ及び損傷データを含むユーティリティデータをアップロードすることが可能である。該ウエブインターフェースは、これらに限定するわけではないが、シェイプファイル(shapefiles)、CSV、及びGeoJASON等を含むユーティリティデータの種々のフォーマットを受け付けるべく構成することが可能である。このデータは、ユーティリティデータベースへ転送させることが可能である。ここで、種々の場所からのユーティリティデータを格納させることが可能である。例えば、全国からのユーティリティデータを標準化したフォーマットで格納させることが可能である。該データは又空間情報処理させることが可能であり、従ってそれは地理的データに関連してアクセス又は識別することが可能である。該データは公共データ(天候、土壌、輸送データ等)と結合される。例えば、一つ又はそれ以上の国家的な即ち全国的なデータベースへアクセスし且つ関連する公共データを収集するために或るサーバーをプログラムするか又はその他の態様で構成することが可能である。更に、該サーバーは、該収集した公共データを該ユーティリティデータの内の特定の部分と自動的に関連付けをするように構成させることが可能である。例えば、特定の場所に対する天候及び土壌データは、該ユーティリティデータにおいて識別された特定の配管と関連付けさせることが可能である。一貫性のあるフォーマットを維持しながら、該収集したデータと関連して新たな変数を発生させることが可能である。
【0039】
次いで、該収集したユーティリティデータ及び公共データに関してランダムフォレストプロセスを複数回稼働させることが可能である。ブロック112において、特徴及びターゲット特徴を分離する。ブロック114において、特徴重要性を計算する。ブロック116において、重要な特徴を抽出する。ブロック118において、過去のデータに基づいてモデルを構築する。ランダムフォレストプロセスを適用する場合に、重要な変数を自動的に選択することが可能であり、それにより全体的な変数のサイズを減少させ且つデータのオーバーフィッティング即ち過学習を防止する。ブロック120において、該混合したモデルを稼働させることが可能であり、そのことは、多数回漏洩した配管と漏洩していない配管の両方に対する破損結果の正確な尤度を発生する。これらの結果から、破損の最悪の尤度(「LOF」)を有するエリアに焦点を当てた配管交換計画を作成することが可能である。特に、該混合モデル結果は、LOFランキングを発生するために使用することが可能であり、その場合に、配管はそれらの予測されたLOFに基づいた複数のランキングで識別される。更に、その決定されたLOF結果に基づいてジョブを実行することから得られる節約にハイライトを当てるファイナンシャルシミュレーションを稼働させることが可能である。
【0040】
図2は、幾つかの実施例に基づく、配管破損を予測するために使用されるモデルに基づいたジョブプラニングの側面を例示している概略図である。殆どの水道ユーティリティーズは配管データと破損データとを保有している。しかしながら、時折、それらのデータはデジタル化されていなかったり又は或るデータが喪失していたりする。本開示の側面によれば、ユーティリティ顧客は、その顧客に対してアクセス可能な配管データ及び破損データの量及びタイプに部分的に基づいてカテゴリーに分類することが可能である。そして、ユーティリティ顧客の異なるカテゴリーと関連して異なるモデルを使用することが可能である。例えば、顧客カテゴリーを以下の5つの場合に分割することが可能であり、即ち、再使用型モデルは、ユーティリティが小さ過ぎるか又はデジタル化した破損データが無い場合であり、次の1年におけるLOFを予測するための汎用モデルのアンサンブルは、配管/仮想配管データは十分であるが1-2年の破損データしかない場合であり、次の3年におけるLOFを予測するための汎用モデルのアンサンブルは、配管/仮想配管データは十分であるが3-5年の破損データしかない場合であり、次の3年におけるLOFを予測するための漏洩及び汎用モデルのアンサンブルは、配管/仮想配管データは十分であるが6-9年の破損データしかない場合であり、及び次の5年におけるLOFを予測するための漏洩及び汎用モデルのアンサンブルは、配管/仮想配管データは十分であるがプラス10年の破損データしかない場合である。
【0041】
図3A乃至3Cは、幾つかの実施例に基づく、異なる水道ユーティリティ会社顧客カテゴリーの側面を例示している概略図である。
図3Aは、再使用型モデルの場合である。或るユーティリティーズは、配管及び損傷データの保有が不十分であり、そのような事態が発生するには幾つかの理由がある。一つの例は、本開示のプロセスを効果的に稼働させるには小さすぎるユーティリティである。別の例は、その配管及び損傷データがデジタル化されていないか又は記録がされていないユーティリティである。デジタル化したデータを有しているが配管及び損傷データが不十分であるユーティリティの場合には、別のユーティリティのデータから構築したモデルをターゲットのユーティリティに関して使用することが可能である場合がある。この場合におけるユーティリティは、入手可能な配管及び損傷データの量が特定のスレッシュホールド未満であるか否かに基づいて識別することが可能な場合がある。
【0042】
図3Bは、汎用モデルのアンサンブルの場合を図示している。或るユーティリティは十分な配管データを有しているが損傷データが不十分である。多くの場合に、このことは過去数年間のデータを有しているに過ぎないことに起因しており、そのことは包括的なモデルを構築するには十分ではない場合がある。この問題を解決するために、そのユーティリティの損傷履歴を使用して汎用モデルを構築する。該モデルが予測することが可能な年数はそのモデルがどれだけの損傷データを有しているかに基づくものである。
【0043】
図3Cは、汎用及び漏洩モデルのアンサンブルの場合を図示している。十分な配管及び損傷データを有しているユーティリティの場合、そのユーティリティの配管及び損傷データを使用してそのユーティリティに対して独特のモデルを構築することが可能な場合がある。このモデルは汎用及び漏洩モデルの両方を包含することが可能である。このユーティリティのデータは統合型ユーティリティデータベースへアップロードさせることが可能である。該ユーティリティのサイズに依存して、より一層包括的なモデルを構築するために該モデルをその他のユーティリティデータと結合させることが可能である。
【0044】
図4は、幾つかの実施例に基づく、配管破損を予測するアーキテクチャの側面を例示している概略図である。該アーキテクチャは、フロントエンドインターフェースと、管理システムと、機械学習システムとを包含している。該フロントエンドインターフェースは、配管データ、損傷データ、及び何らかの補助データをアップロードするためのページと、マップビュー及び補助統計の両方で機械学習分析の結果を見るためのページと、クリーニングしたデータ及び機械学習結果のマップをダウンロードすると共に統計をダウンロードするためのページと、例え正しいデータ又はソフトウエアが無くとも小さなユーティリティがフラクタ(Fracta)のソリューションへアクセスすることを許容するインターフェースとを包含している。該管理システムは、インスタンス及びプロセスを作成するための管理サーバーと、顧客情報を包含しているデータベースと、ファイルを収容するためのファイルサーバーとを包含している。該機械学習システム(インスタンス)は、空間結合、ジオプロセシング、及び機械学習用のスクリプトと、ファイルを収容するための一時的データベースとを包含している。
【0045】
図4を参照すると、ステップ401において、顧客がログインし且つデータをアップロードする。ステップ402において、その顧客のデータがアップロードされ、且つステップ403において、該管理サーバーのプロセスマネージャーに対して要求がなされる。ステップ404において、オペレータ(即ち、配管破損予測会社のオペレータ)がログインし且つ該管理サーバーのインスタンスマネージャに対してリクエストを発行する。ステップ405において、該インスタンスマネージャは該機械学習システムの機械学習インスタンスに対してリクエストを発行する。ステップ406において、該ファイルサーバーからの生のファイルが該機械学習インスタンスのデータプロセスへロードされる。ステップ407において、データプロセスがGISデータベース内に配管及び損傷データをインサートする。ジオプロセスが該GIS及び国のデータベースから情報を受け取る。ステップ408において、そのジオプロセスされた情報は予測器へ供給される。ステップ409において、予測された結果が該ファイルサーバー上の破損の尤度(LOF)結果へ転送される。ステップ410において、該LOF結果は該フロントエンドビュアーへアップロードされる。ステップ411において、顧客がログインし且つそのLOFデータを見る/ダウンロードする。
【0046】
次の5年内に一度の配管損傷の確率を予測する場合に、本開示の側面は特定のデータのポアソン分布を使用する場合がある。例えば、損傷の確率は以下の如くに計算することが可能である。
【0047】
Prob=1-e(-損傷数/配管長さ)
二進分類(配管が損傷するか否か?)の代わりに、該ポアソン分布は確率計算を可能とする。最終的な結果に到達するために、該分布の以下のオリジナルの形式を使用することが可能である。
【0048】
【0049】
尚、「k」は或る時間期間内に発生するイベント(例えば、損傷)の回数を表しており、且つ「m」は時間期間あたりのイベントの決定された平均数に対応している。
図5は、単位長さ当たりの損傷(LOF/長さ)は異なるものである場合があることを例示している。一層長い配管510は、一層短い配管512とは異なるLOF/長さを有している場合がある。従って、配管の長さ(L)は該方程式に付加することが可能である。
【0050】
【0051】
次の5年間(1年の代わりに)における損傷の確率を計算するために、該方程式は、以下の如くに、5つのエントリを有するように修正することが可能である。
【0052】
【0053】
従って、この確率は以下の如くに修正される。
【0054】
【0055】
図6は、幾つかの実施例に基づく、次の5年に対しての破損の尤度を計算するための時間に関してのアンサンブルの使用を例示した概略図である。該次の5年に対応する各配管セグメントに対して破損尤度ランキングを作成するために、長さ当たりの破損尤度を、そのデータが入手可能な各前年に対して計算することが可能な場合がある。各年に対して、配管状態に影響を与えるトップ変数に注目することが可能である。しかしながら、特定の年に対して、或る条件は必ずしも同じではない。例えば、或る変数の重要性に影響を与えた旱魃が或る年に発生している場合がある。時間的に推移する変化の影響を減少させるために、異なるタイムスライスに対する平均結果を計算することが可能である。この様にして、イベント(嵐、旱魃等のような)の内の一つの影響を最小とさせることが可能である。更に、時間に関してゆっくりと変化する相関もキャプチャすることが可能である。
【0056】
図7A及び7Bは、従来技術(
図7A)と幾つかの実施例に基づく技術(
図7B)との間の性能上の差異を例示している概略図である。
図7Bに図示した如くに、幾つかの実施例に基づく機械学習分析は、以前に損傷したことのない配管の状態を正確に評価することが可能であるという利点を有している。対照的に、
図7Aに例示した如く、配管の状態を評価するために水道ユーティリティが使用する従来の方法は、典型的に、多数回漏洩した配管又は漏洩の可能性が低い新しい配管をハイライトさせるに過ぎない。ユーティリティは損傷履歴にかなりひどく焦点をあてるので、その分析方法は、しばしば、漏洩したことのない弱い配管の状態を正確に評価するものではない。しかしながら、周囲の配管状態を表す変数の使用を介して、本開示のシステム及び方法は、破損の一層高い可能性のある配管を識別し且つそれらに一層高い破損尤度の値を割り当てることが可能である。特定の損傷データに依存することのない汎用モデルを使用することは、以前に損傷したことのない配管の状態を一層正確に評価することを可能とさせる。
【0057】
図8A及び8Bは、幾つかの実施例に基づく、地理空間的分析を介して発生した変数を例示している概略図である。各配管が存在している状態を表す変数を作成するために、各カテゴリを表すために単一の特徴を超えるものが必要とされる場合がある。例えば、最も近い土壌領域(例えば、地理空間的ポリゴン)のpH値はその配管周りのpHの複雑な変化を十分に表すものではない場合がある。
図8Aは、興味のある配管の周りのポリゴンデータの描写を示しており、且つ
図8Bは、興味のある配管の周りの一層細かなラスターデータの描写を示している。より一層細かなデータを得るために、幾つかのステップを採用する場合がある。第1に、各配管セグメントの重心(800)を抽出することが可能である。次いで、該配管セグメントの重心を中心にした異なる寸法のN個の円(例えば、円810及び812)を作成することが可能である。次いで、該N個の円内の地理的変数に基づいて統計的な値(例えば、最大、最小、標準偏差、中間、平均、最大と最小との差、ユニークな値の数)を計算することが可能である。これらの値は、次いで、各配管セグメントに割り当てることが可能である。該配管セグメントの周りの複数の半径のN個の円内の値を取ることにより、その周囲の状態に関してより一層の情報を決定することが可能である。使用することが可能な潜在的な変数を表1にリストしてある。
【0058】
【0059】
【0060】
【0061】
図9は、幾つかの実施例に基づく、配管破損を予測するための統合型ユーティリティデータベースを構築することを例示している概略図である。ユーティリティデータベース910,912及び914から選択したデータがデータベース920内に統合される。統合型データベース920は、次いで、全国的にスケール可能な予測モデル930を構築するために使用される。全国の異なるユーティリティの全ての配管及び損傷履歴をコンパイルすることにより、本開示の機械学習モデルを、小さすぎるか又は多数の欠損値を有するデータセットを具備しているユーティリティに対して適用させることが可能である。正確で且つ局所化した結果を与えるためには各ユーティリティに対して特定の機械学習モデルがしばしば望ましいものであるが、この様なモデルを構築するためにデータが十分ではない場合がある。例えば、多くの小さい田舎のユーティリティは、しばしば、それらの全ての配管及び損傷データをデジタル化しているか又はその他の態様で記録されたデータとするための資源を有するものではない。更に、この様なデータを有するユーティリティが、どのような分析も信用できないものとさせるような多数の欠落値を有している場合がある。しかしながら、配管及び損傷データの統合型ユーティリティデータベースへアクセスすることにより、これらのユーティリティに対して汎用機械学習モデルを適用することが可能である。例えば、小さな北カリフォルニアのユーティリティが一層大きな北カリフォルニア市のデータから構築したモデルを使用することが可能である。更に、この情報は、後述するように、仮想配管ネットワークに対する値を計算する場合に使用すべくてこ入れさせることが可能である。
【0062】
全ての配管セグメントに対して破損尤度を計算することは、そのデータが時間と共にどのように変化したかに関する情報へのアクセスをしばしば必要とする問題である。しかしながら、多くの変数(損傷履歴、気候、人口等)に対して、一層古いデータは未だにデジタル化されていないとかその他の態様で記録されていないとかの理由で、最も最近のデータのみが使用可能である場合がある。更に、特定の変数の時間との関係は、線形的なものではない場合がある。これらの変数の時間に関しての変化をより良く表すために、時間に関連する変数(配管年齢等)を操作することが可能な場合がある。例えば、時間に関する変数は、対数、常用対数、自然対数、二乗、三乗、平方根、立方根、指数、負の指数、アークサイン、アークコサイン、アークタンジェント、及びシグモイド等の関数を使用して変化される。
【0063】
配管セグメントの状態を正確に評価するために、損傷データ及び対応するサブ変数(例えば、損傷密度、マイル当たりの損傷、等)を機械学習分析内に包含させることが可能である。しかしながら、損傷データに過剰に依存することは漏洩問題に通じることとなる場合があり、その場合には、損傷データが他の変数を凌ぐこととなる。例えば、該モデルは、多数回損傷した配管を不良配管として識別するには非常に良い場合があるかもしれないが、それは損傷が2,3回か又は無い場合の配管を正確に評価することに失敗する場合がある。損傷データを完全に除去することを提案する人がいるかもしれないが、そうすることによって、多数回の損傷がある配管が不良配管として正確に分類されない場合がある。これらの問題点に対処するために、本開示は混合モデルと呼称されるものを提供している。例えば、2つの予測モデルを構築することが可能であり、その内の一つは損傷を高度に強調したモデル(漏洩モデル)であり、且つ他方は損傷履歴を包含することのないモデル(汎用モデル)である。次に、各配管セグメントを漏洩体か非漏洩体かに分類することが可能である。その配管が漏洩体である場合には、漏洩モデルからの結果が割り当てられる。その配管が非漏洩体である場合には、該汎用モデルからの結果が使用される。両方のモデルの平均を取ることによって、長さ当たりの最終的な破損尤度を計算することが可能である。代替的に、各モデルの加重平均を取ることが可能である。
【0064】
図10は、幾つかの実施例に基づく、モデルを基礎とした配管損傷予測のための自動化した変数選択の側面を例示しているブロック図である。本開示は、使用可能な特徴組へ付加することが可能な1,000を超える変数の収集及び作成を可能とさせる。しかしながら、これらの変数の全てが特定の機械学習分析において使用されるものではない場合がある。大きな特徴組の場合、過学習(overfitting)の危険性がある。過学習の場合、該機械学習モデルは、根本の関係ではなく、該モデルを取り巻くノイズを記述することとなる。該モデルはトレーニングデータを正確に記述する場合があるが、付加的なデータが該モデルを混乱させる場合がある。過学習を防止するために、該変数組を減少させるためにアンサンブル方法を稼働させる場合がある。最初に、ブロック1010において、該モデルを全変数組で稼働させる。ブロック1012において、変数重要性が得られる。各変数の重要性は、例えば、一層高い係数が一層高い重要性に対応するジニ係数又は情報利得のような技術を使用して、得ることが可能である。ブロック1014において、ブロック1010及び1012を異なる年スライスに対して繰り返す。ブロック1016において、該モデルは、最も重要な変数のリストから選択したN個の変数で再度稼働することが可能である。幾つかの実施例においては、該変数はカテゴリー化させることが可能であり、従って、同様の変数は同一のカテゴリーが与えられる。変数を選択する場合に、同一のカテゴリー内において或る数の変数のみを選択することが有益的である場合がある。例えば、土壌pHカテゴリーからN個の変数が既に選択されている場合には、より重要性の低い土壌pH変数は削除することが可能である。「年齢」及び「物質」変数カテゴリーの場合、これらの規則を適用する必要がなく全ての変数を使用することが可能である。
【0065】
幾つかの実施例によれば、配管破損予測結果に基づいて、配管交換作業を最適化させることが可能である。本開示の機会学習分析の結果は、ユーティリティに対してそれらのネットワークにおける全ての配管の状態についてより良い洞察を提供することが可能である。しかしながら、該情報は効果的なジョブプラニング(例えば、どの配管を交換するかを決定すること)にとって十分なものではない場合がある。例えば、「5」が最も高いLOFを表しており且つ「1」が最も低いLOFを表しているように、配管は1乃至5の数値でランク付けさせる場合がある。高い損傷の確率を有している単一のランク5のセグメントが、低い損傷の確率を有しているランク1の配管によって取り囲まれている場合がある。殆どの水道ユーティリティは、単一のセグメントを交換することはなく、むしろ全エリア又はブロックの配管を交換する。
図11A及び11Bは、幾つかの実施例に基づく、配管交換最適化の側面を例示している概略図である。
図11Aにおいて、ジョブプラニングフローチャートが示されており、その場合には、配管セグメントの可能な組み合わせがスキャンされて所要の長さを有するジョブを得る。
図11Bは、
図11Aのチャートでスキャンされた配管セグメントを示している。注意すべきことであるが、セグメント「4」はこの場合には選択されていない。というのは、図示した3つの配管セグメントで全長に到達しているからである。
図12は可能性のある配管交換ジョブの例示である。ユーティリティをジョブプラニングで援助するために、本開示もジョブプラニング手順の実現を提供する。例えば、この手順は、接続されている配管をグループ化し且つ連続した値として長さ当たりの最も高い破損の結合尤度(LOF/長さ)を有するものを見つけ出す。ユーティリティは、又、異なる寸法のグループ化を作成するためにそれらの好適なジョブ寸法を編集する場合がある。
図13A乃至13Cは、幾つかの実施例に基づく、検討中の3つの異なる可能な配管交換ジョブを示している。1-Π(1-P
si)は1本の配管が損傷する確率であり;Π(1-P
si)=(1-P
si)(1-P
si)...(1-P
si)はどの配管も損傷しない確率であり;且つP
si=1-(1-P
Li)
liはi番目の配管のLOF/セグメントであり、P
Liはi番目の配管セグメントのLOF/長さであり;且つliはi番目の配管セグメントの長さである。
図13Aにおいて、LOF/コンストラクションは0.87であり;
図13Bにおいて、LOF/コンストラクションは0.92であり;且つ
図13Cにおいて、LOF/コンストラクションは0.95である。この例においては、
図13Cのジョブがこれら3つの内で最も優先度の高いジョブである。
【0066】
このジョブプラニング手順は、自動化したスクリプトとして又はその他のソフトウエアと関連して実行することが可能である。例えば、予測された配管条件を分析し且つ複数個の配管の全体的な状態に基づいて顧客にジョブプラン提案を自動的に提供するようにサーバーを構成することが可能である。このツールを使用することにより、ユーティリティは最も高い損傷尤度を有するエリアに焦点をあてるためにかれらのジョブプラニングプロセスを最適化させることが可能である。
【0067】
図14A及び14Bは、幾つかの実施例に基づく、欠落している配管データ値を予測する側面を例示している概略図である。幾つかのユーティリティでは、配管物質又は設置年などのかれらの配管ネットワークに関する情報が欠落している場合がある。この問題に対処するために、建物、人口、ストリートデータ、及びそれ以上等の周囲の属性に基づいてその欠落している値に割り当てを行うことが可能である。これらの値は、又、使用可能な情報が十分である場合には、ユーティリティ自身のデータに基づいて割り当てを行うことが可能である。例えば、現在未知の変数の蓋然性のある値を予測するために、公共データとユーティリティデータとの間の相関を見出すことが可能である。
図14Aは、変数予測モデル1420を構築するために公共データベース1410とユーティリティデータベース1412との間の相関を抽出することを例示している。
図14Bは、より一層完全なデータベース1432を作成するためにデータベース1430において欠落している配管属性を予測するために変数予測モデル1420を使用することを示している。
【0068】
図15A及び15Bは、幾つかの実施例に基づく、ストリート即ち街路と配管との間の相関を例示した概略図である。配管データ1510は、同じ地理的エリアに対するストリートデータ1520と密接に相関する。多くのより小さなユーティリティ会社は、かれらの配管について信頼性のある情報を有しておらず且つ何らの地理的情報システム(GIS)データを有するものではない。これらのユーティリティについて動作させるために、本開示は仮想配管ネットワークの作成を行う。所望の地理空間的情報を作成するために、道路データに基づいて仮想配管ネットワークを構築する。物質、直径、及び設置年に関する情報を、該ユーティリティによって提供される情報、及び他のユーティリティとの作業から得られたデータに基づいて、補充する。
図16は、幾つかの実施例に基づく、仮想配管データの作成を例示しているブロック図である。ブロック1610は、ストリートデータを有しているが配管データが無いエリア即ち区域を示している。ブロック1620は、該ストリートデータを使用して作成した仮想配管ジオメトリーを示している。ブロック1630は、欠落している配管属性を予測するための公共データの使用を例示している。
【0069】
以下は、本開示システム及び方法が顧客ユーティリティ会社によってどのように使用することが可能であるかの例示的なケースである。この例においては、ACME Waterは、本書に開示する幾つかの実施例に基づいて動作すべく構成されているソフトウエアを使用することに興味があるユーティリティ会社である。第1に、ACME Waterはウエブポータルへアクセスし且つACME Waterの配管及び損傷データをアップロードすることが可能である。この例においては、ACME Waterは多くの損傷データと比較的完全な配管データとを有している。
図17は、幾つかの実施例に基づく、配管データ例のクリーニングを例示している概略図である。アップロードされた生の配管及び損傷データ1710を、該データを標準化させ(例えば、特定のデータ欄下に現れるデータを標準化)、且つすべての不良データを識別し且つ補正することなどによって、クリーニングしてその結果、クリーニングされた配管データ1712とさせる。
【0070】
図18は、幾つかの実施例に基づく、配管データ例の更なる処理を例示している概略図である。データ1712は、機械学習の処理のために用意させることが可能である。例えば、公共データ1810(土壌pH、標高等)は、ACME Waterが位置している地域に対してアクセスすることが可能であり、且つそのアクセスされた公共データ1810は該配管データ(
図8A、8B及びそれと関連するテキストに示したような)と合体させることが可能である。更に、前述した如く時間に関しての変数特性における変化を考慮して処理済みの配管データ1820を得るために、時間に基づく変数(例えば、年及び平方根等の年に対する修正)を付け加えることが可能である。
【0071】
幾つかの実施例に基づいて、次のステップは、ACMEのクリーニングしたデータに関して機械学習プロセスを稼働させることである。
図19は、幾つかの実施例に基づき、機械学習のために使用される特徴を分割し且つ抽出することを例示している概略図である。特徴データ1910は、特徴1912とターゲット特徴1914とに分割され、且つ各特徴の重要性を計算するために、該特徴は該ターゲット特徴と相関させる(
図10及び前述した関連記載部分に示した如くに)。計算された重要性を有する該特徴は、1916として
図19に示されている。次いで、重要な特徴を1918として該データセットから抽出することが可能であり、一方、より低い重要性を有する特徴は捨てることが可能である。
【0072】
時間と共に変化する相関を考慮するために、該データに対して幾つかのモデルを構築させることが可能である(
図6及び前述した関連テキストに示されている如く)。
図20は、幾つかの実施例に基づく、漏洩モデルと汎用モデルの結合を介してLOFモデルの作成を例示している概略図である。2018-2022の年を予測するモデルを構築するために、過去の既知のデータに基づくモデルを構築し、一方、2009-2017の年を予測するモデルを構築する(2004乃至2017からのデータを使用して)。複数の年の全ての「スライス」に対して、2つのモデルを構築することが可能であり、即ち、汎用モデルと漏洩モデルである(
図3A-3C及び前述した関連テキストに記載される如く)。
図20において、漏洩モデル2020は漏洩モデルデータ2022を使用して構築し、且つ汎用モデル2030は汎用モデルデータ2032を使用して構築する。該汎用モデルデータ2032は、損傷を除いて、入力として全ての特徴を包含することが可能である。漏洩モデルデータ2022は損傷及び全てのその他の特徴を包含している。それらの構築されたモデルの平均を使用して、2018-2022に対しての2つの予測モデルを構築することが可能であり、即ち、汎用モデル2024と漏洩モデル2034とである。これらのモデルは、最終的な混合モデルLOF/長さ(連続的な値として)結果2040を作成するために結合させることが可能である。
【0073】
該汎用モデルと漏洩モデルとから作成された該LOF/長さモデル2040は、全ての配管にLOF/長さレーティング即ちランクを割り当てることが可能である。幾つかの実施例によれば、これらの結果はランク付けさせることが可能であり、且つ顧客(ACME Water)はウエブインターフェース上でそのネットワークのLOF/長さ結果を見ることが可能である。幾つかの実施例によれば、該顧客インターフェースは、該LOF結果に基づいて、又はその他の割り当てられた変数に基づいて、配管のフィルタリング及びソーティングを行うことを可能とさせる。これらのLOF/長さ予測(連続的な値として)でもって、ACME Waterに対して配管交換プランを作成することが可能である。
図21は、幾つかの実施例に基づく、ジョブプランニングの側面を例示している概略図である。ジョブプランナーソフトウエアを実行するサーバーは、或るエリア内の最も高いLOF/長さに基づいて、幾つかのジョブプランを作成することが可能である。前述した如く、このジョブプランナーは配管を最も高いグループ化したLOF/長さと連携させることが可能である。
【0074】
図22は、幾つかの実施例に基づく、配管破損を予測するシステムを例示している概略図である。サーバーは、メモリ214、データベース2216、入力/出力装置2218、及び一つ又はそれ以上のネットワーク2220へ結合されているプロセッサ2212を包含することが可能である。更に、本記載方法は、上に示した実施例システムと関連して実施することが可能である。
【0075】
メモリ2214は、本書に記載するシステム、インターフェース、方法、及びコンピュータにより実行されるプロセスを実現するために使用される
図4に関連して図示し且つ記載したフロントエンドウエブインターフェースサーバー及びバックエンドサーバーを包含する本願において記載される種々のサーバーによって稼働される異なるプログラムのためのプログラム命令を格納することが可能である。プロセッサ2212は該プログラム命令を実行して該プロセッサ、プラットフォーム、サーバー、コンピュータ、又はその他の装置をして、直接的に又はネットワーク又はバスを介して間接的に結合されているその他の要素と相互作用させる。
【0076】
プロセッサ2212は、直接的に又はインターネット、ローカルエリアネットワーク、ワイドエリアネットワーク、ワイヤレスネットワーク、又はその他のネットワークを介して、種々のデータベース、顧客装置、管理者装置、及びその他の装置へ結合させることが可能である。データベース2216及び2226は、本書に記載するように、一つ又はそれ以上の配管又は配管セクションの破損の尤度に影響を有している配管、公的及び私的情報を包含しているサードパーティデータベースとすることが可能である。データベース2216及び2226は、サードパーティによって又は本書に記載するシステム及び方法を実施する同一の実体によって維持することが可能である。
【0077】
一つ又はそれ以上の顧客又は加入者は、ネットワークを介して、
図22に示したシステムと結合させることが可能である。例えば、ユーザは、3G、4G,又は5Gワイヤレスネットワーク等のワイヤレスネットワークを介して、WiFiネットワークを介して、又は何らかのその他のネットワーク接続を介して、本書に記載するプロセッサ2212及びフロント及びバックエンドシステムと結合させることが可能である。顧客又は加入者情報は該システムによってデータベース(データベース2216及び/又は2226等)内に格納させることが可能であり、且つ各顧客は、例えば、局所的又は地域的な水道ユーティリティである場合があるその顧客に対して特定的である配管ネットワークに関する情報へのアクセスを与えることが可能である。同一のプラットフォームを使用し且つ各顧客にデータへのアクセスを与え且つ顧客がそれらの配管ネットワークに対して特定的なプロジェクトを作成することを可能とさせるウエブインターフェースを介して該プラットフォームとインターフェースする複数の顧客及び水道ユーティリティが存在する場合がある。代替的に、各顧客は、該顧客の配管ネットワーク及びプロジェクトに関するデータを取り交わすために本システムと相互作用するアプリケーションを有している場合がある。本システムの機械学習側面は、時間に関してのより正確な破損尤度予測を容易化させるために、本システムにおける全ての配管ネットワークにわたって配管及び配管損傷データをてこ入れすることが可能である。
【0078】
幾つかの実施例によれば、LOF/セグメント、LOF/長さ、及び次のN年における損傷数の予測が行われる。注意すべきことであるが、次のN年に対しての予測されたLOF/セグメント(ここでは、単に「LOF」として言及することもある)が正しい場合には、損傷の予測数の計算は簡単である。LOFの和は、配管の内のどれもが次のN年において複数の損傷を有するものではないと仮定すると、次のN年における損傷の予測数と一致する。
【0079】
しかしながら、LOFは、通常、或る量のエラーを包含しており、それは予測モデルの自信過剰又は自信不足からくる。このことは、LOFの和によって計算される、N年における損傷の予測数と通じる場合があり予測結果から逸れることとなる。例えば、最も最近の5年間における損傷数が120である場合に、損傷の予測数は180(>>120)である場合がある。このことは正しいかもしれないが、それはこのように大きな増大を表しているのでこれは不合理に高い数である蓋然性が幾分ある。更に、ソーティングしたLOFの順番が非常に良好である場合にもこのことが発生する場合がある(「ソーティングしたLOFの順番が良好」とは「良好な配管と不良な配管の優先順位付けが良好」であることを意味している。優先順位付けは重要である。何故ならば、それは配管交換をプランニング即ち計画する場合に高度に依存されるからである。)。上述した問題は、LOFのスケールの不正確性によって発生されることが判明している。
【0080】
図23は、幾つかの実施例に基づく、LOFから損傷数を予測することを例示している概略図である。N年における損傷の予測数は、
図23に示した如く、次のN年LOFの和である場合がある。損傷の予測数と期待した結果との間には通常ギャップがある。N年が短い期間又は中間の期間である場合には、最も最近のN年における損傷と次のN年における損傷との間には大きな差異はないと仮定することが可能である。
【0081】
図24は、過去5年及び次の5年に対して損傷における期待される類似性を例示している概略図である。図示した如くに、過去5年における損傷数と次の5年において予測される損傷数は類似している。
図25は、幾つかの実施例に基づく、次のN年の損傷の予測数は損傷履歴から計算することが可能であることを例示している概略図である。この場合には、次の5年における予測される損傷数はN
BHはトータルで120である。
【0082】
図26は、幾つかの実施例に基づく、LOF確率キャリブレーションを例示している概略図である。LOFは、損傷履歴からの損傷の予測数(予測N
BH)、LOFからの損傷の予測数(予測N
LOF)でキャリブレーションすることが可能である。幾つかの実施例によれば、リーカー及びノンリーカーのLOFは夫々同じ態様でキャリブレーションすることが可能である。幾つかの実施例によれば、配管が壊れた場合のダメージの推定量であるBRE(ビジネスリスクエクスポージャ)を計算するためにLOFを使用することが可能である。BREは、LOFとCOF(破損の結果)の積である。例えCOFが完全に正しいとしても、BREは過剰に推定されるのでLOFは良好にキャリブレーションされることとなる。
【0083】
幾つかの実施例によれば、該キャリブレーションのために以下のアルゴリズムを使用することが可能である。
【0084】
i)ユーティリティの損傷履歴に基づいて損傷の予測数を計算
(1)以下のプロセスにより損傷履歴から外れ値を除去:
(a)Nbnが次式を充足する場合には最新の年の損傷数(Nbn)がその年の
全ての損傷を有していると仮定されない場合がある:
Nbn<ciNbn-1
n:最新の年
0<ci<1.0
(b)外れ値を除去するために四方位範囲方法を使用。その数が範囲外である
場合には、その数を除去することが可能である:
[qI-c2(IQR),qJ+c2(IQR)]
qI:I番目四分位数、qJ:J番目四分位数、I<<J
IQR=qj-qI、1.0≦c2≦1.5
(c)数がc3×Mよりも小さい場合に数を除去。
【0085】
M:最近N年における損傷数の平均、中央、最大又は最小
0<c3<1
(2)平均、加重平均、直線回帰、指数、対数、又は機械学習を使用することに
より損傷履歴から損傷の予測数を得るために残存する数を使用。
【0086】
ii)それ自身及び損傷履歴からの損傷の予測数とLOFとの間の比からLOF/
セグメントをキャリブレーション。キャリブレーション済みLOF/セグメ
ント=LOF/セグメント×x
x=予測されたNBH/予測されたNLOF
予測されたNBH:損傷履歴からの損傷の予測数
予測されたNLOF:LOFからの損傷の予測数
キャリブレーション済みLOF/セグメント≧1.0である場合、キャリブ
レーション済みLOF/セグメントは1-cにセット、尚cは>0であり且
つ0に非常に近い(従って、例えば、LOF/セグメントは0.99999...
である)。
【0087】
iii)LOF/長さのキャリブレーション:
キャリブレーション済みLOF/長さ=1-(1-キャリブレーシ
ョン済みLOF/セグメント)1/L
L:配管長さ
上述した如く、これまで説明してきた機械学習モデルは、ジニ係数又は情報利得等の技術に基づいて各変数の重要性を計算するために1,000個を超える変数を使用することが可能である。幾つかの実施例によれば、該変数は次の14種類のようなカテゴリーにグループ化させることが可能であり、即ち、該カテゴリーとは、土壌特性、地勢、気候、人口、建物、輸送、水エリア、地割、海岸線、年齢、損傷履歴、直径、物質、及び圧力である。「土壌特性」の例としては、pH、CaCO3、かさ密度、及び含水量等がある。該モデルは、LOFを計算するために同一のカテゴリーから或る数の変数を使用することが可能である。
【0088】
該モデルは、その特徴の重要性が不知である場合には「ブラックボックス」と考えることが可能である。ユーティリティ会社は、配管劣化に影響を与えるのはどの属性であるかを理解することを望む場合がある。何故ならば、該会社はその配管を維持し且つ管理するために知識を使用することが可能な場合があるからである。該カテゴリーは、重要性に依存して1乃至10のランクにランク付けすることが可能であり、又は、該カテゴリーを重要性によってソーティングし且つソーティングした順番に従って割り当てを行うことが可能である。「10」は最も重要な特徴を表しており、「1」は最も低い重要性を表している。
図27は、幾つかの実施例に基づく、変数カテゴリーのランキング例を示しているプロットである。
【0089】
幾つかの実施例によれば、特徴の重要性は自動的に計算し且つ
図10に示してあり且つそれに関連するテキストで上述した技術に従うことによってカテゴリーに類別させることが可能である。
【0090】
図28は、幾つかの実施例に基づく、土壌の代表的な特徴重要性を計算する1例を示している概略図である。各カテゴリーの代表的な重要性は、各カテゴリー内における重要性の最大、平均、加重平均、又はメジアンとすることが可能である。
【0091】
図29は、該カテゴリーの代表的な特徴重要性の正規化を例示している概略図である。該カテゴリー(例えば、上にリストした14個のカテゴリー)の各々に対する代表的重要性は、例えば次式を使用して正規化させることが可能である。
【0092】
X
normalized=(X-X
min)/(X
max-X
min)
X
normalized=(X-μ)/σ
X=[x
土壌,x
地勢,...]
x
カテゴリー:各カテゴリーの代表的重要性
図30は、1乃至10の重要性によって複数の代表的特徴のランク付けを例示している概略図である。説明した例においては、14個の代表的特徴カテゴリーが存在している。次いで、各々の代表的重要性を1乃至10のスケール上でその正規化した値に基づいてランク付けする。幾つかの実施例によれば、該重要性を正規化した後に、その正規化した重要性を10個のレベルに均等に分割する。1例においては、最大の正規化した重要性が0.8で且つ最小の正規化した重要性が0.0である場合には、以下の正規化した重要性の範囲に対して次のように1乃至10の値を割り当てることが可能である。即ち、0.72乃至0.8に対して「10」;0.64乃至0.72に対して「9」;0.56乃至0.64に対して「8」;0.48乃至0.56に対して「7」;0.40乃至0.48に対して「6」;...;0.08乃至0.16に対して「2」;及び0.0乃至0.08に対して「1」である。しかしながら、この様に均等分割技術を使用した場合には、幾つかの割り当てられた重要性の値がスキップされる場合がある。このことを回避するために、上述したようなソーティングした値に基づく割り当てを使用することが可能である。
【0093】
幾つかの実施例によれば、該モデルによって与えられる予測年の範囲はそのユーティリティの使用可能な損傷履歴に依存する。例えば、該機械学習モデルは、ユーティリティが十分に長い損傷履歴を有している場合には、5年LOFを提供することが可能である。しかしながら、使用可能な損傷履歴が十分ではない場合には、該モデルは3年LOFを提供可能であるに過ぎない。幾つかのユーティリティは5年を予測するために十分に長い損傷履歴を有するものではない場合であっても、殆どのユーティリティは5年LOFを知ることを希望する。更に、多くのユーティリティは、現在のオペレーションを最適化させるために1年LOF等の短期のLOFを希望し、一方、交換計画のために3年及び5年のLOF等の長期のLOFを使用することを計画する。ユーティリティに対して現在のオペレーションについての手助けをするために、損傷挙動が変化しないと仮定する場合にはM年のLOFからN年のLOFを近似的に計算することが可能である。
【0094】
例えば、以下の方法を使用して、5年のLOFをユーティリティのデータから予測し且つ1年及び3年のLOFを近似的に計算するために使用することが可能である。最初に、M年のLOF(P)を予測する。次いで、M年の間に配管が損傷しない確率は1-Pである。N年において配管が損傷しない確率は(1-P)N/Mである。従って、N年のLOFは1-(1-P)N/Mである。以下のものは1例である。
【0095】
5年のLOF=P(ユーティリティデータから予測)
1年のLOF=1-(1-P)1/5
3年のLOF=1-(1-P)3/5
前述した実施例は主に地中配管のネットワークに関するものであるが、幾つかの実施例によれば、上述した技術の多くはその他のタイプのネットワークに適用することが可能である。幾つかの実施例によれば、本書に記載するシステム及び方法は、地上のユーティリティポール及び/又は地中ノード間等の消費者へ電力を供給するために使用される電線のネットワークへ適用される。幾つかの更なる実施例によれば、電線に代わって又はそれに加えて、ユーティリティポール自身もターゲット資産として取り扱うことも可能である。本書に記載する技術を他のタイプのネットワーク及び/又は資産へ適用する場合に、異なる組の環境変数を使用することが可能である。例えば、地上の電線の場合には、地中配管(パイプ)のために使用した全ての環境変数ではなく、サブセットの環境変数を使用することが可能である。この場合には、その電線が空中に或る場合には、土壌を変数の組から除去することが可能な場合がある。破損イベントの意味も再定義すべきである。例えば、電線の場合、破損は、線の切断、状態又は強度の劣化等を意味する場合がある。ユーティリティポール即ち電信柱の場合には、破損は、損傷、状態又は強度の劣化を意味する場合がある。
【0096】
以上明確性の目的のために幾分詳細に記載してきたが、その原理から逸脱すること無しに或る変更及び修正を行うことが可能であることは明らかである。本書に記載したプロセス及び装置の両方を実現する多くの代替的な態様が存在していることに注意すべきである。従って、これらの実施例は例示的なものであって制限的なものではないとして考慮されるべきであり、且つ本書に記載した発明は本書に挙げられている詳細に制限されるべきものではなく、それは特許請求の範囲内において且つその均等物の範囲内において修正することが可能なものである。