【解決手段】ハードウェア・プロセッサを介して、画像処理および深層学習技法を実装することによって配管および計装図から複数の構成要素を検出することと、関連付けモジュールを介して、ユークリッド距離技法を実装することによって検出された複数の構成要素の各々を関連付けることと、関連付けられた複数の構成要素の各々に基づいて、構造化技法を実装することによって複数のツリー状のデータ構造を生成することとによって、配管および計装図からのエンドツーエンド情報の自動生成を与える。ここで、複数のツリー状のデータ構造の各々は、配管および計装図に対応するパイプライン概略図のプロセス・フローをキャプチャする。
前記パイプライン・コードを検出する前記ステップの前に、前記1つまたは複数の配管および計装図から、コネクショニスト・テキスト提案ネットワーク(CTPN)技法を実装することによって、複数のフォールス・ポジティブ・パイプライン・コードを含む1つまたは複数のパイプライン・コードをフィルタ処理するステップが行われる、請求項1に記載の方法。
前記記号を検出する前記ステップが、完全畳み込みニューラル・ネットワーク(FCN)技法を実装することによって、前記記号からコンテキスト情報のセットを抽出するステップと、前記記号中の1つまたは複数の物体の空間ロケーションを学習するステップとを含む、請求項1に記載の方法。
前記複数のツリー状のデータ構造中の各ツリーが、パイプライン概略図の前記プロセス・フローをキャプチャするためのルート・ノードとリーフ・ノードと中間ノードとを備え、前記検出された出口が前記ルート・ノードとして扱われ、前記検出された入口が前記リーフ・ノードとして扱われ、前記検出されたパイプラインが前記中間ノードに対応する、請求項1に記載の方法。
パイプライン概略図の前記プロセス・フローをキャプチャする前記ステップの前に、フィルタ処理技法を介して、前記1つまたは複数の配管および計装図からフォールス・ポジティブ・パイプラインのセットをフィルタ処理するために前記複数のツリー状のデータ構造の各々をプルーニングするステップが行われる、請求項1に記載の方法。
フォールス・ポジティブ・パイプラインの前記セットをフィルタ処理する前記ステップが、前記フィルタ処理技法を介して、前記1つまたは複数の配管および計装図から1つまたは複数のパイプラインを削除するステップを含み、前記1つまたは複数のパイプラインが、リーフ・ノードとして前記複数のツリー状のデータ構造の各々において表される、請求項8に記載の方法。
前記フィルタ処理技法が、ルート・ノードから開始する前記複数のツリー状のデータ構造の各々を横断することと、入口につながらないすべてのノードを削除することとを含む、請求項8に記載の方法。
前記1つまたは複数のハードウェア・プロセッサ(104)が、前記1つまたは複数の配管および計装図から、コネクショニスト・テキスト提案ネットワーク(CTPN)技法を実装することによって、複数のフォールス・ポジティブ・パイプライン・コードを含む1つまたは複数のパイプライン・コードをフィルタ処理することによって、前記パイプライン・コードを検出するように構成された、請求項11に記載のシステム(100)。
前記1つまたは複数のハードウェア・プロセッサ(104)が、完全畳み込みニューラル・ネットワーク(FCN)技法を実装することによって、前記記号からコンテキスト情報のセットを抽出することと、前記記号中の1つまたは複数の物体の空間ロケーションを学習することとによって、前記記号を検出するように構成された、請求項11に記載のシステム(100)。
前記1つまたは複数のハードウェア・プロセッサ(104)が、前記ユークリッド距離技法を介して前記1つまたは複数の配管および計装図から前記適切なパイプラインを決定するように構成された、請求項11に記載のシステム(100)。
前記複数のツリー状のデータ構造中の各ツリーが、パイプライン概略図の前記プロセス・フローをキャプチャするためのルート・ノードとリーフ・ノードと中間ノードとを備え、前記検出された出口が前記ルート・ノードとして扱われ、前記検出された入口が前記リーフ・ノードとして扱われ、前記検出されたパイプラインが前記中間ノードに対応する、請求項11に記載のシステム(100)。
前記1つまたは複数のハードウェア・プロセッサ(104)が、フィルタ処理技法を介して、前記1つまたは複数の配管および計装図からフォールス・ポジティブ・パイプラインのセットをフィルタ処理するために前記複数のツリー状のデータ構造の各々をプルーニングすることによって、パイプライン概略図の前記プロセス・フローをキャプチャするように構成された、請求項11に記載のシステム(100)。
前記1つまたは複数のハードウェア・プロセッサ(104)が、前記フィルタ処理技法を介して、前記1つまたは複数の配管および計装図から1つまたは複数のパイプラインを削除することによってフォールス・ポジティブ・パイプラインの前記セットをフィルタ処理するように構成され、前記1つまたは複数のパイプラインが、リーフ・ノードとして前記複数のツリー状のデータ構造の各々において表される、請求項18に記載のシステム(100)。
前記フィルタ処理技法が、ルート・ノードから開始する前記複数のツリー状のデータ構造の各々を横断することと、入口につながらないすべてのノードを削除することとを含む、請求項19に記載のシステム(100)。
【発明を実施するための形態】
【0011】
添付の図面を参照しながら、例示的な実施形態が説明される。図では、参照番号の(1つまたは複数の)左端の桁は、参照番号が最初に現れる図を識別する。好都合な場合はいつでも、同じまたは類似の部分を指すために図面全体にわたって同じ参照番号が使用される。開示される原理の例および特徴が本明細書で説明されるが、開示される実施形態の趣旨および範囲から逸脱することなく、変更形態、適応形態、および他の実装形態が可能である。以下の詳細な説明は例示にすぎないと見なされ、真の範囲および趣旨は以下の特許請求の範囲によって示されることが意図される。
【0012】
本開示の実施形態は、配管および計装図からの情報抽出を自動化するためのシステムおよび方法を提供する。配管および計装図のデジタル化プロセスは、パイプライン・コードと、パイプラインと、入口と、出口と、記号との識別および位置特定を含み、その後、パイプラインとの個々の構成要素のマッピングが続く。 配管および計装図は、パイプライン、容器、アクチュエータおよび制御弁を通るプロセス・フローの概略図を示す複雑なエンジニアリング・ワークフローを表す。
【0013】
旧来のシステムおよび技法のうちのいくつかは、テキスト要素とグラフィカル要素の両方からなる複雑なエンジニアリング・ドキュメント、たとえば、複雑な受取りシート、検査シート、およびエンジニアリング図のデジタル化に言及している。たとえば、旧来の技法のうちの1つは、図面交換フォーマット(DXF:Drawing Exchange Format)ファイルをスケーラブル・ベクトル・グラフィックス(SVG:Scalable Vector Graphics)フォーマットに変換し、生成されたSVGファイルのマーキング・アルゴリズムを開発することによって自動コンピュータ支援設計(CAD:Auto-Computer-Aided-Designing)DXFのアセスメントを自動化することに言及している。
【0014】
同様に、別の旧来の技法は、事例ベース手法を使用したエンジニアリング図面認識のためのフレームワークを提供し、ユーザは、エンジニアリング図面中のあるタイプのグラフィック・オブジェクトの一例を対話式に与え、次いで、システムは、その例からこのタイプのグラフィック・オブジェクトのグラフィカル知識を学習し、後でこの学習された知識を使用してエンジニアリング図面中の類似のグラフィック・オブジェクトを認識または探索することを試みる。しかしながら、旧来のシステムおよび方法のいずれも、配管および計装図からの自動エンドツーエンド・データ抽出を提供しない。
【0015】
開示される方法は、旧来のシステムおよび技法が直面する限界を克服することを試みる。たとえば、開示される方法は、深層学習技法を介して配管および計装図シートからの各構成要素のロバストな検出を提供し、検出された構成要素の各々を関連付け、それにより、エンドツーエンド・データ抽出、ならびに配管および計装図からの情報抽出の自動化を容易にする。
【0016】
次に、類似の参照符号が図全体にわたって一貫して対応する特徴を示す図面、より詳細には、
図1から
図14を参照すると、好ましい実施形態が示されており、これらの実施形態は、以下の例示的なシステムおよび/または方法のコンテキストにおいて説明される。
【0017】
図1は、本開示の一実施形態による、配管および計装図からの情報抽出を自動化するためのシステム100の例示的なブロック図を示す。一実施形態では、システム100は、1つまたは複数のプロセッサ104と、(1つまたは複数の)通信インターフェース・デバイスまたは(1つまたは複数の)入出力(I/O)インターフェース106と、1つまたは複数のプロセッサ104に動作可能に結合された1つまたは複数のデータ記憶デバイスまたはメモリ102とを含む。ハードウェア・プロセッサである1つまたは複数のプロセッサ104は、1つまたは複数のマイクロプロセッサ、マイクロコンピュータ、マイクロコントローラ、デジタル信号プロセッサ、中央処理ユニット、状態機械、論理回路、および/または動作命令に基づいて信号を操作する任意のデバイスとして実装され得る。能力の中でも、(1つまたは複数の)プロセッサは、メモリ102に記憶されたコンピュータ可読命令をフェッチし、実行するように構成される。一実施形態では、システム100は、ラップトップ・コンピュータ、ノートブック、ハンドヘルド・デバイス、ワークステーション、メインフレーム・コンピュータ、サーバ、ネットワーク・クラウドなど、様々なコンピューティング・システムにおいて実装され得る。
【0018】
(1つまたは複数の)I/Oインターフェース・デバイス106は、様々なソフトウェアおよびハードウェア・インターフェース、たとえば、ウェブ・インターフェース、グラフィカル・ユーザ・インターフェースなどを含むことができ、ワイヤード・ネットワーク、たとえば、LAN、ケーブルなどと、WLAN、セルラー、または衛星など、ワイヤレス・ネットワークとを含む、多種多様なネットワークN/Wおよびプロトコル・タイプ内での複数の通信を容易にすることができる。一実施形態では、(1つまたは複数の)I/Oインターフェース・デバイスは、いくつかのデバイスを互いにまたは別のサーバに結合するための1つまたは複数のポートを含むことができる。
【0019】
メモリ102は、たとえば、スタティック・ランダム・アクセス・メモリ(SRAM)およびダイナミック・ランダム・アクセス・メモリ(DRAM)などの揮発性メモリ、ならびに/または、読取り専用メモリ(ROM)、消去可能プログラマブルROM、フラッシュ・メモリ、ハードディスク、光ディスク、および磁気テープなどの不揮発性メモリを含む、当技術分野で知られている任意のコンピュータ可読媒体を含み得る。一実施形態では、メモリ102は、配管および計装図からの情報抽出を自動化することに関連付けられたデータを記憶するように構成され得る。一実施形態では、配管および計装図からの構成要素の検出、関連付け、ツリーの生成などに関係する情報は、メモリ102に記憶される。さらに、配管および計装図からの情報抽出の自動化に関係するすべての情報(入力、出力など)はまた、参照目的のために、履歴データとしてデータベースに記憶され得る。
【0020】
本開示の一実施形態によれば、配管および計装図からの情報抽出を自動化するためのシステム100のアーキテクチャおよびフローが、詳細に考慮され得る。
図2を参照することによって、アーキテクチャは、配管および計装図シート201と、検出および認識エンジン202と、関連付けモジュール203とを備えることがわかり得る。配管および計装図シート201は、エンジニアリング概略図または配管および計装図を備え、そこから、提案された方法を実装することによってデータまたは情報が抽出されることになる。
【0021】
最初に、配管および計装図シート201は検出および認識エンジン202に供給され、検出および認識エンジン202は、画像処理モデルと深層学習モデルとの組合せを使用してパイプライン、パイプライン・コード、入口、出口および記号のような、プロセス・フローの異なる構成要素を識別および分離する。その後、抽出された構成要素は、適切なパイプラインとのマッピングのために関連付けモジュール203に送られる。最終的に、入口から出口までのフローを決定するために、ツリー様のデータ構造が作成される。
【0022】
図3は、
図1および
図2を参照しながら、本開示のいくつかの実施形態による、配管および計装図からの情報抽出を自動化するための方法の例示的な流れ図を示す。一実施形態では、システム100は、1つまたは複数のハードウェア・プロセッサ104に動作可能に結合されたメモリ102の1つまたは複数のデータ記憶デバイスを備え、1つまたは複数のプロセッサ104による方法のステップの実行のための命令を記憶するように構成される。次に、
図1に示されているシステム100の構成要素、および流れ図を参照しながら、本開示の方法のステップが説明される。本開示の実施形態では、ハードウェア・プロセッサ104は、命令で構成されたとき、本明細書で説明される1つまたは複数の方法を実施する。
【0023】
本開示の一実施形態によれば、ステップ301において、1つまたは複数のハードウェア・プロセッサ104は、1つまたは複数の画像処理および深層学習技法を実装することによって1つまたは複数の配管および計装図から複数の構成要素を検出するように構成される。
図4を参照することによって、テキスト・セグメントと非テキスト・セグメントとを備える配管および計装図シートのサンプル(または一例)が参照され得る。再び
図4を参照することによって、配管および計装図シートが概してテキストからなり、テキストが、パイプライン・コード、1つまたは複数の追記などを表すことがわかり得る。このようにして、テキスト・セグメントは、概して複数のパイプライン・コードからなる。
【0024】
1つまたは複数の配管および計装図中の非テキスト・セグメントは、概して複数のパイプライン、複数の記号、複数の入口および出口などを備える。非テキスト・セグメントは、このようにして、概してグラフィック・オブジェクトである。1つまたは複数の配管および計装図中のテキスト・セグメント構成要素および非テキスト・セグメント構成要素の各々は、複数の構成要素と総称され得る。次に、1つまたは複数の配管および計装図から複数の構成要素の各々を検出するプロセスが詳細に考慮され得る。
【0025】
パイプライン・コードの検出− 一実施形態では、パイプライン・コードが各パイプラインを明確に特徴づけるので、最初に、複数の構成要素からパイプライン・コードが検出される。開示される方法は、パイプライン・コード検出のためにコネクショニスト・テキスト提案ネットワーク(CTPN)技法を実装する。(1つまたは複数の)パイプライン・コードを抽出するために、概して、接続された構成要素が従うしきい値処理が実装される、旧来のシステムおよび方法と比較して、CTPN技法は、1つまたは複数の配管および計装図からパイプライン・コードを検出するためのシーンテスト・データセットに対して事前トレーニングされたCTPNネットワークを利用する。CTPNは、1つまたは複数の配管および計装図中のノイズおよび色に対してよりロバストである。
【0026】
一実施形態では、CTPN技法は、最初に任意のサイズの画像を受け付け、畳み込み特徴マップ中でウィンドウを密にスライドすることによって画像中のテキスト・ラインを検出し、テキスト提案のシーケンスを作り出す畳み込みネットワークを実装する。次いで、このシーケンスは、リカレント・ニューラル・ネットワークに通され、リカレント・ニューラル・ネットワークは、検出器がテキスト・ラインの有意味なコンテキスト情報を探査することを可能にし、したがって、極めて難しいテキストを確実に検出することを強力に行う。このようにして、CTPN技法は、100パーセントの再現率(100 percent recall)をもつ潜在的パイプライン・コード構成要素のセットを生成するが、複数のフォールス・ポジティブ・パイプライン・コードをさらに備える。
【0027】
潜在的パイプライン・コード構成要素のセットを生成すると、前のステップにおいて検出された各パイプライン・コード構成要素を読み取るためにTesseract(登録商標)技法が実装され得る。パイプライン・コードが固定の長さおよび構造を有するので、正規表現を使用して複数のフォールス・ポジティブ・パイプライン・コードの各々を削除またはフィルタ処理するために、フィルタ処理が、配管および計装図中のパイプライン・コードの各々に対して実施され得る。
【0028】
例示的なシナリオを考慮して、パイプライン・コードは、フォーマットN”−AANNNNNNN−NNNNNA−AAのものであり、ここで、Nは数字を示し、Aはアルファベットを示す。このようにして、CTPN技法は、1つまたは複数の配管および計装図を備えるシート中に存在するパイプライン・コードを最終的に生成し、それにより、旧来のシステムおよび方法と比較してパイプライン・コードのロバストな検出を提供する。
【0029】
入口および出口の検出− 当技術分野で知られているように、入口または出口は、パイプラインの開始点または終了点をマークする。概して、ある形状特性、すなわち、5つの頂点を有する多角形を備える入口または出口を表す標準記号があり、バウンディング・ボックス(bounding box)の幅がそれの高さの少なくとも3倍である。旧来のシステムおよび方法と比較して、開示される方法は、ヒューリスティックス(heuristics)を介して入口および出口をロバストに検出するために形状特性を使用する。
【0030】
一実施形態では、入口および出口を検出するために、1つまたは複数のハードウェア・プロセッサ104は、最初に、さらなる処理のために2値化された入力画像から、パイプライン・コードとして検出されるテキスト・ブロブ(text blob)を減算する。1つまたは複数のハードウェア・プロセッサ104は、1つまたは複数の多角形を識別するために知られている相対エッジ長と組み合わせてRamer−Douglasアルゴリズムを実装する。当技術分野で知られているように、(「Ramer−Douglas−Peuckerアルゴリズム」とも呼ばれる)Ramer−Douglasアルゴリズムは、一連の点によって近似される曲線中の点の数を低減するためのアルゴリズムである。
【0031】
1つまたは複数の多角形の識別時に、1つまたは複数の多角形は、入口または出口のいずれかとして識別される。また再び
図4を参照することによって、2つのタイプのタグ、すなわち、左向きおよび右向きのタグが1つまたは複数の配管および計装図中に存在するとき、多角形の可能な4つの事例があることがわかり得る。右向きタグまたは左向きタグの各々は、入口または出口のいずれかであり得る。
【0032】
1つまたは複数のハードウェア・プロセッサ104は、次いで、Ramer−Douglasによって与えられる点からタグの配向を識別し、
図5に示されているように、右向きタグまたは左向きタグにおいて一方の側に3つの点があり、もう一方の側に2つの点があるという事実を知り得る。候補が入口であるのか出口であるのかをさらに分類するために、1つまたは複数のハードウェア・プロセッサ104は、構成要素画像のいずれかの側の小さいカーネルKを取得し、どちらのエッジが単一のラインによって横断される(crossed)かを見つけ出す。
【0033】
パイプラインの検出− 一実施形態では、最初に、検出されたテキストならびに入口および出口タグは、パイプラインを検出するために画像から削除され得る。1つまたは複数の配管および計装図中の各画像からのパイプラインは、次いで、画像の各々のスケルトン・バージョンに対して確率的ハフ変換技法(Probabilistic Hough Transform technique)を実装することによって、検出され、それにより、1つまたは複数の配管および計装図中のパイプラインに対応しないラインを含むすべてのラインのセットを生成する。当技術分野で知られているように、ハフ変換は、形状が数学的形式で表され得る場合、どんな形状でも検出する普及している技法である。ハフ変換は、形状がわずかに破壊されたかまたはひずませられた場合でも、形状を検出することができる。確率的ハフ変換技法が、すべての点を考慮するというわけではなく、代わりに、点のランダム・サブセットのみを考慮し、それがライン検出のために十分であるので、確率的ハフ変換技法は、旧来のハフ変換技法に対する最適化である。
【0034】
パイプライン交差の検出−
図6を参照することによって、確率的ハフ変換技法の実装形態からの出力は、(パイプラインを検出する一方)交差における(1つまたは複数の)間隙(gap)を考慮しないラインのセットを生じることがわかり得る。交差は、有効な交差または無効な交差であり得る。開示される方法は、連立一次方程式を解くことによって任意の2つのライン・セグメント間の交差の各々を決定することによって、有効な交差の各々を識別する。その式に対する解は、両方の有限パイプライン上にあるべき点である。この仮定は、解がフォアグラウンド(foreground)の一部であることを保証する。
【0035】
再び
図6を参照することによって、交差に関与するラインのうちの1つ中の間隙は、それを無効な交差として示す。無効な交差は、ラインについての2つの一次方程式の解が交差を示すが画像中にそのような交差が存在しない交差である。無効な交差を廃棄するために、1つまたは複数のハードウェア・プロセッサ104は、交差に中心をもつサイズ21の正方形カーネルを描画し、正方形のエッジと交差するラインについて検査する。
【0036】
パイプライン交差を検出することについて、2つの可能性があり得る。第1の可能性は、交差が正方形の対向するエッジ上にあり、正方形の他の2つのエッジ上に交差がない場合であり得る。第2の可能性は、正方形の3つのエッジの交差および/または正方形のすべての4つのエッジ上の交差の可能性であり得る。第2の可能性は有効な交差の場合であり、それにより、パイプライン交差の検出を生じる。
【0037】
記号の検出− 概して、配管および計装図シートは複数の記号からなり、複数の記号の各々は、パイプラインを通る石油の流れを制御することと、様々なタスクを実施することとを担当するいくつかの計器を表す。開示される方法は、10個のクラスの記号、すなわち、ボール弁(ball_valve)、逆止め弁(check_valve)、化学シール(chemical_seal)、円形弁(circle_valve)、コンセントリック(concentric)、出水接続(flood_connection)、グローブ弁(globe_valve)、ゲート弁nc(gate_valve_nc)、絶縁(insulation)、およびグローブ弁nc(globe_valve_nc)を検出し、それらの検出を自動化することを容易にする。
【0038】
図7を参照することによって、記号が視覚的外観において極めて低いクラス間差(inter-class difference)を有するので、分類のための旧来の深層学習技法は、そのような記号のロバストな検出を提供しないことがわかり得る。開示される方法は、複数の記号の各々を検出するために完全畳み込みネットワーク(FCN)技法を実装する。(1つまたは複数の)FCNは、最後の全結合層(fully connected layer)が大きい受容野(receptive field)をもつ畳み込み層に置き換えられる畳み込みネットワークである。
【0039】
FCN技法の実装形態は、FCNが2つの経路からなるので、複数の記号のロバストな検出を容易にする。第1の経路は、畳み込み、最大プーリング操作から構成され、画像からコンテキスト情報のセットを抽出する、ダウンサンプリング経路を備え、第2の経路は、転置畳み込み、アンプーリング操作からなり、入力画像サイズと類似のサイズをもつ出力を作り出し、画像中の1つまたは複数の物体の正確な空間ロケーションを学習する、アップサンプリング経路である。
図8を参照することによって、検出された記号、コンテキスト情報の抽出されたセット、および1つまたは複数の物体の学習された空間ロケーションの一例が参照され得る。
【0040】
一実施形態では、FCN技法を使用して記号を検出するために、開示される方法は、石油会社からの現実世界の配管および計装図のデータセットにアノテーションを付けた(annotated)。元の配管および計装図シートが概して、最初に、非常に大きいサイズであるので、配管および計装図シートは、記号にアノテーションを付けるために、サイズ400×400の複数の小さいパッチに各々分割され得る。複数の小さいパッチの各々は、異なるクラスの記号を備え、異なるクラスの記号は、さらに、単一のパッチ中に存在する(複数の記号のうちの)1つまたは複数の記号からなり得る。
【0041】
一実施形態では、複数の記号の各々は、それらのピクセル値を完全にマスキングすること(それにより、各記号のための複数のマスクを生成すること)と、その後、FCN技法を介して複数のマスクの各々の1つまたは複数の輪郭(または境界)を取得することとによってアノテーションを付けられ得る。1つまたは複数の輪郭から、次いで、記号を検出するために記号の形状が表され得る。開示される方法は、マスク形状を含んでいる領域に対してフィルタを適用すること、すなわち、ビット単位AND演算(bitwise AND operation)が使用されたことによって、(1つまたは複数の)記号マスクの1つまたは複数の輪郭を取得するプロセスを自動化することをさらに容易にする。
【0042】
さらに、1つまたは複数のハードウェア・プロセッサ104は、境界/輪郭を取得するために複数の小さいパッチの各々のしきい値処理と、次いで、サイズ3×3のフィルタを用いて拡張することとを実施する。トレーニング・データセットが制限されたので、開示される方法は、各画像に対して何らかの変換、たとえば、変換および/または回転を実施することによって、画像を増大させた。VGG−19(登録商標)ベースのFCNが、記号検出器をトレーニングするために使用および実装され、サイズ400×400の入力画像がネットワークに供給され、それは、0.0004の学習レートと8のバッチ・サイズとを伴うAdamオプティマイザを使用してトレーニングされる。
【0043】
本開示の一実施形態によれば、ステップ302において、1つまたは複数のハードウェア・プロセッサ104は、関連付けモジュール203を介して、ユークリッド距離技法を実装することによって、検出された複数の構成要素の各々を関連付けるように構成される。検出された複数の構成要素の各々の関連付けは、とりわけ、パイプライン概略図の構造を形成するために実施され得る。次に、複数の構成要素を(本明細書では最も近接したパイプラインとも呼ばれる)適切なパイプラインと関連付けることと、適切なパイプラインの決定とのプロセスが、詳細に考慮され得る。
【0044】
一実施形態では、関連付けは、検出された複数の構成要素の各々を関連付けモジュール203に通信し、受け渡すことによって、1つまたは複数のハードウェア・プロセッサ104によって実施され得る。次いで、関連付けモジュール203は、適切なパイプラインまたは最も近接したパイプラインとの複数の構成要素のマッピングを実施する。関連付けは、以下のように実装される。
(i) タグ対パイプライン関連付け(Tags to Pipeline Association)− 1つまたは複数のハードウェア・プロセッサ104は、検出された入口および出口の配向から出現するラインを識別し、次いで、関連付けモジュール203を介して、パイプラインの方向におけるライン出現点からの最も近接したパイプラインをタグに関連付ける。最も近接したパイプラインは、ユークリッド距離技法を実装することによって決定され得る。当技術分野で知られているように、ユークリッド距離技法は、物体のペアの座標間の平方根差分(root of square differences)を測定または検査する。例示的なシナリオを考慮して、
図9を参照することによって、タグ対パイプライン関連付けの一例が参照され得、ユークリッド距離技法に基づいて、「タグ1」は「パイプライン6」に関連付けられ、「タグ2」は「パイプライン7」に関連付けられる。
(ii) パイプライン・コード対パイプライン関連付け− 1つまたは複数のハードウェア・プロセッサ104は、最も近いもののバウンディング・ボックスの頂点からライン上の最も近い点までの最小ユークリッド距離技法に基づいて、検出されたパイプライン・コードの各々を、最も近いまたは最も近接したパイプラインに割り当てる。例示的なシナリオを考慮して、
図10を参照することによって、パイプライン・コード対パイプライン関連付けの一例が参照され得、検出されたパイプライン・コード「2”BH6209108−11500X−EP」は、それらの間の最小距離のために「パイプライン2」に関連付けられる。
(i) 記号対パイプライン関連付け− 各検出された記号は、それが最も近接したパイプラインから分離されないという条件で、最小ユークリッド距離技法を使用して最も近接したパイプラインに関連付けられる。例示的なシナリオを考慮して、
図11を参照することによって、記号対パイプライン関連付けの一例が参照され得、破線矩形を用いてマークされる検出された記号「絶縁体」は、それらの間の最小距離に基づいて「パイプライン4」に関連付けられ、最小距離は、最小ユークリッド距離技法を使用して決定される。
【0045】
本開示の一実施形態によれば、ステップ303において、1つまたは複数のハードウェア・プロセッサ104は、関連付けられた複数の構成要素の各々に基づいて、構造化技法を実装することによって複数のツリー状のデータ構造を生成するように構成され、複数のツリー状のデータ構造の各々が、1つまたは複数の配管および計装図に対応するパイプライン概略図のプロセス・フローをキャプチャする。このようにして、複数のツリー状のデータ構造からなるフォレストは、複数の検出された構成要素の各々を(1つまたは複数の)適切なパイプラインに関連付けることによって生成される。例示的なシナリオを考慮して、
図12を参照することによって、検出された複数の構成要素を関連付けることから生成されるツリー状のデータ構造の一例が参照され得る。
【0046】
再び
図12を参照することによって、複数のツリー状のデータ構造中の各ツリーは、パイプライン概略図のプロセス・フローをキャプチャするためにルート・ノードと、リーフ・ノードと、中間ノードとを備えることがわかり得る。さらに、検出された出口はルート・ノードとして扱われ、検出された入口はリーフ・ノードとして扱われ、検出されたパイプラインは中間ノードに対応する。また再び
図12を参照することによって、複数のツリー状のデータ構造中の各ツリーが、入口と出口との間の1対多関係を表すことがわかり得る。
【0047】
一実施形態では、各ツリーは、最小高さ2を有し、ルート・ノードは単一の子を有する。ツリーは共通ノードを有することができ、すなわち、それは共通パイプラインと入口タグとを有することができるが、ルート・ノードはフォレスト中で唯一である。いつでも、単一のフロー経路が、入口と出口との間の唯一の経路によって表される。このようにして、パイプライン概略図のプロセス・フローは、石油の流れが、複数のツリー状のデータ構造の各々からキャプチャされ得るように、生成されたツリー状のデータ構造の各々からキャプチャされ得る。このようにして、ステップ301〜303を実行することによって、配管および計装図からの情報抽出のプロセス全体が自動化され得る。
【0048】
一実施形態では、パイプライン概略図のプロセス・フローをキャプチャするステップの前に、フィルタ処理技法を介して、1つまたは複数の配管および計装図からフォールス・ポジティブ・パイプラインのセットをフィルタ処理するために複数のツリー状のデータ構造の各々をプルーニングするステップが行われる。フォールス・ポジティブ・パイプラインは、ツリー中でリーフ・ノードとして表され、入口のいずれにもリンクしないパイプラインである。フィルタ処理技法は、ルート・ノードから開始する(複数のツリー状のデータ構造のうちの)各ツリーをプルーニングまたは横断することと、入口につながらないすべてのノードを削除することとを含む。
【0049】
本開示の一実施形態によれば、開示される方法の性能が、詳細に、評価および説明され得る。開示される方法を実装するために、現実世界の配管および計装図シートのデータセットが定量評価のために使用され、データセットは4つのシートを備え、それはさらに672個の流れ図からなる。以下の表1を参照することによって、検出の精度(accuracy)と、複数の構成要素を関連付けることとが参照され得る。表1の行1を参照することによって、CTPN技法によるパイプライン・コード検出の精度の後に、標準コード形式のドメイン知識を使用するフォールス・ポジティブのフィルタ処理が続く。
【表1】
【0050】
再び表1を参照することによって、開示される方法を実装することによって、71個のコードのうちの64個のコードが、成功裡に検出され、検出プロセスにおいて90.1%の精度を与えることがわかり得る。さらに、
図13を参照することによって、例示的な配管および計装図シート上のテキスト検出に関するCTPN技法の視覚的な出力が参照され得る。また再び表1を参照することによって、パイプラインとともに、ライン・マーキングおよび重ねられた図など、何らかのランダム・ノイズの存在のために、パイプラインが65.2%の精度で検出されることがわかり得る。
【0051】
表1の行3および行4を参照することによって、入口および出口の検出のための開示される方法を実装することによって、100%の精度を生じたことがわかり得る。パイプライン・コードおよび出口を適切なパイプに関連付ける間、開示される方法は、(表1の行2に示されているように)時々少数のパイプラインが適切に検出されないか、またはパイプラインが出口と交差しないので、64個のパイプライン・コードのうちの41個と、21個の出口のうちの14個とのみを成功裡に関連付けることが可能であった。しかしながら、開示される方法を実装することによって、入口は、適切なパイプラインにかなり成功裡に関連付けられ、それにより、96.8%の関連付け精度を生じ得る。
【0052】
本開示の一実施形態によれば、以下の表2(すなわち、混同行列)を参照することによって、開示される方法を実装することによって実施される、混同行列(confusion matrix)の形態の記号検出の結果が詳細に説明され得る。FCNは、約7400回の反復にわたって訓練され、ネットワークは、7000回の反復において、ネットワークが過剰適合する(overfitting)のを防ぐために訓練および検証セットのクロスエントロピー損失(cross-entropy loss)を観測することによってセーブされた。上記で述べられたように、10個の異なるクラスの記号が、FCN技法を使用して検出された。しかしながら、本明細書で「他」と呼ばれる、1つの余分のクラスの記号も、開示される方法の性能を評価するために使用された。
図14を参照することによって、記号の検出のためのFCNの訓練中の訓練および検証セットについてのクロスエントロピー損失を表示するプロットが参照され得る。
【表2】
【0053】
再び表2を参照することによって、開示される方法は、FCN技法を実装することによって、旧来のシステムおよび方法と比較してロバストな記号検出を生じることがわかり得る。再び
図7を参照することによって、(検出されるべき)記号、ボール弁(ball_value)、グローブ弁nc、ゲート弁ncなどの記号は、外観において極めて低いクラス間変動(inter-class variation)を有する。たとえば、79個のボール弁のうちの5つはグローブ弁として認識されており、68個のグローブ弁のうちの4つはボール弁として検出され、57個のグローブ弁ncのうちの3つはゲート弁ncとして認識される。ゲート弁ncおよびコンセントリックなどの記号は、開示される方法を実装することによって成功裡に検出される。
【0054】
上記で述べられたように、また再び
図8を参照することによって、開示される方法を実装することによって検出された記号が参照され得る。最終的に、以下の表3で与えられるように、記号の各クラスについて、正確さ(precision)と再現率(recall)とF1スコアとを算出することによって、開示される方法は、外観において極めて低い視覚差の場合でも、クラスごとに0.86超の値の目覚ましいF1スコアで記号を検出することが観測される。化学シール、円形バルブ、コンセントリック、絶縁およびグローブ弁ncのような記号について、正確さは100%である。
【表3】
【0055】
本開示の一実施形態によれば、開示される方法の技術的利点のうちのいくつかが詳細に考慮され得る。開示される方法は、配管および計装図からの自動およびエンドツーエンド・データ抽出を可能にする。旧来のシステムおよび方法のいずれも、配管および計装図からの完全な自動およびエンドツーエンド・データ抽出に言及しない。このようにして、開示される方法は、プラント構成要素の接続性と、(1つまたは複数の)プロセス機器間の相互接続のタイプと、冗長経路の存在とに関係する重要な問合せに対する回答の自動生成を提供する。最終的に、上記で説明されたように、複数の構成要素を検出するための開示される方法の実装によって達成される精度は、旧来のシステムおよび方法に対してはるかに高い。
【0056】
本明細書は、当業者が実施形態を製作および使用することを可能にするために、本明細書の主題について説明する。主題の実施形態の範囲は、特許請求の範囲によって定義され、当業者が思い付く他の変更形態を含み得る。そのような他の変更形態は、それらが特許請求の範囲の文字通りの文言と異ならない類似の要素を有する場合、または、それらが特許請求の範囲の文字通りの文言とのわずかな差をもつ等価要素を含む場合、特許請求の範囲内に入ることが意図される。
【0057】
本明細書の本開示の実施形態は、配管および計装図からの情報抽出を自動化することの未解決の問題に対処する。このようにして、実施形態は、1つまたは複数の画像処理および深層学習技法を実装することによって1つまたは複数の配管および計装図から複数の構成要素を検出することと、検出された複数の構成要素の各々を関連付けることと、関連付けられた複数の構成要素の各々に基づいて、構造化技法を実装することによって複数のツリー状のデータ構造を生成することとを提供する。その上、本明細書の実施形態は、配管および計装図からのエンドツーエンド・データ抽出をさらに提供する。
【0058】
保護の範囲は、そのようなプログラムに、および追加として、その中にメッセージを有するコンピュータ可読手段に拡張されることを理解されたい。そのようなコンピュータ可読記憶手段は、プログラムがサーバまたはモバイル・デバイスあるいは任意の好適なプログラマブル・デバイス上で動作するとき、方法の1つまたは複数のステップの実装のためのプログラムコード手段を含んでいる。ハードウェア・デバイスは、たとえば、サーバまたはパーソナル・コンピュータなど、あるいはそれらの任意の組合せのような任意の種類のコンピュータを含む、プログラムされ得る任意の種類のデバイスであり得る。デバイスは、たとえば、たとえば特定用途向け集積回路(ASIC)、フィールドプログラマブル・ゲート・アレイ(FPGA)のようなハードウェア手段、あるいは、ハードウェア手段とソフトウェア手段の組合せ、たとえばASICおよびFPGA、またはソフトウェア・モジュールがその中にある少なくとも1つのマイクロプロセッサおよび少なくとも1つのメモリであり得る、手段をも含み得る。したがって、手段は、ハードウェア手段とソフトウェア手段の両方を含むことができる。本明細書で説明された方法実施形態は、ハードウェアおよびソフトウェアにおいて実装され得る。デバイスはソフトウェア手段をも含み得る。代替的に、実施形態は、たとえば複数のCPUを使用して、異なるハードウェア・デバイス上で実装され得る。
【0059】
本明細書の実施形態は、ハードウェア要素とソフトウェア要素とを含み得る。ソフトウェアで実装される実施形態は、限定はしないが、ファームウェア、常駐ソフトウェア、マイクロコードなどを含む。本明細書で説明された様々なモジュールによって実施される機能は、他のモジュールまたは他のモジュールの組合せにおいて実装され得る。この説明では、コンピュータ使用可能またはコンピュータ可読媒体は、命令実行システム、装置、またはデバイスによる使用のための、あるいはそれらに関するプログラムを含むか、記憶するか、通信するか、伝搬するか、トランスポートすることができる任意の装置であり得る。
【0060】
示されたステップは図示の例示的な実施形態について説明するために提示され、進行中の技術発展が、特定の機能が実施される様式を変更することが予期されるべきである。これらの例は、限定ではなく例示の目的で本明細書で提示される。さらに、機能的ビルディング・ブロックの境界は、説明の便宜のために、任意に、本明細書で定義された。指定された機能およびその関係が適宜に実施される限り、代替境界が定義され得る。(本明細書で説明されたものの等価物、拡張、変形、逸脱などを含む)代替は、本明細書に含まれている教示に基づいて当業者に明らかになろう。そのような代替は、開示された実施形態の範囲および趣旨内に入る。また、「備える、含む(comprising)」、「有する(having)」、「含んでいる(containing)」、および「含む(including)」という単語、ならびに他の類似の形式は、意味において等価であり、これらの単語のいずれか1つの後にくる1つまたは複数の項目が、そのような1つまたは複数の項目の網羅的なリスティングであるように意図されていないか、または、1つまたは複数のリストされた項目のみに限定されるように意図されていないという点で、オープンエンドであることが意図される。本明細書でおよび添付の特許請求の範囲において使用される単数形「a」、「an」、および「the」が、文脈が別段に明確に規定するのでなければ、複数形の言及を含むことにも留意されたい。
【0061】
さらに、1つまたは複数のコンピュータ可読記憶媒体が、本開示に従う実施形態を実装する際に利用され得る。コンピュータ可読記憶媒体は、プロセッサによって可読な情報またはデータが記憶され得る任意のタイプの物理的メモリを指す。したがって、コンピュータ可読記憶媒体は、(1つまたは複数の)プロセッサに本明細書で説明された実施形態に従うステップまたは段階を実施させるための命令を含む、1つまたは複数のプロセッサが実行するための命令を記憶し得る。「コンピュータ可読媒体」という用語は、有形の品物を含み、搬送波および過渡信号を除外し、すなわち、非一時的であることを理解されよう。例は、ランダム・アクセス・メモリ(RAM)、読取り専用メモリ(ROM)、揮発性メモリ、不揮発性メモリ、ハード・ドライブ、CD ROM、DVD、フラッシュ・ドライブ、ディスク、および任意の他の知られている物理的記憶媒体を含む。
【0062】
本開示および例は例示にすぎないと見なされ、開示された実施形態の真の範囲および趣旨は以下の特許請求の範囲によって示されることが意図される。