IP Force 特許公報掲載プロジェクト 2022.1.31 β版

知財求人 - 知財ポータルサイト「IP Force」

▶ 成都理工大学の特許一覧

特許7618127二畳系海泡石含有層系についての検層識別方法
<>
< >
(19)【発行国】日本国特許庁(JP)
(12)【公報種別】特許公報(B1)
(11)【特許番号】
(24)【登録日】2025-01-10
(45)【発行日】2025-01-21
(54)【発明の名称】二畳系海泡石含有層系についての検層識別方法
(51)【国際特許分類】
   G01V 9/00 20060101AFI20250114BHJP
   E21B 43/00 20060101ALI20250114BHJP
   E21B 47/00 20120101ALI20250114BHJP
   G06N 20/00 20190101ALI20250114BHJP
【FI】
G01V9/00 J
E21B43/00 A
E21B47/00
G06N20/00 130
【請求項の数】 2
(21)【出願番号】P 2024009825
(22)【出願日】2024-01-25
【審査請求日】2024-02-13
(31)【優先権主張番号】202311162217.8
(32)【優先日】2023-09-11
(33)【優先権主張国・地域又は機関】CN
【早期審査対象出願】
(73)【特許権者】
【識別番号】518398497
【氏名又は名称】成都理工大学
(74)【代理人】
【識別番号】100088063
【弁理士】
【氏名又は名称】坪内 康治
(72)【発明者】
【氏名】宋金民
(72)【発明者】
【氏名】任杉
(72)【発明者】
【氏名】李柯然
(72)【発明者】
【氏名】劉樹根
(72)【発明者】
【氏名】王佳蕊
(72)【発明者】
【氏名】李智武
(72)【発明者】
【氏名】楊廸
(72)【発明者】
【氏名】葉▲エツ▼豪
(72)【発明者】
【氏名】郭嘉欣
【審査官】鴨志田 健太
(56)【参考文献】
【文献】米国特許出願公開第2016/0195638(US,A1)
【文献】中国特許出願公開第101551471(CN,A)
【文献】中国特許出願公開第112523749(CN,A)
【文献】Guo Dali et al.,A new methology for identification of potential pay zones from well logs: Intelligent system establishment and application in the Eastern Junggar Basin, China,Petroleum Science,2014年05月07日,volume 11,pages 258-264,DOI 10.1007/s12182-014-0338-1
【文献】坂本尚史、安藤徹、大塚良平,中国江西省楽平市産セピオライトについて,粘度科学,28巻3号,1988年,p.134-142,DOI https://doi.org/10.11362/jcssjnendokagaku1961.28.3_134
【文献】柴田正三,中国およびトルコ粘土鉱物の調査研究(III):中国湖南省・永和郊外の海泡石,名古屋造形芸術大学名古屋造形芸術短期大学紀要,1996年03月25日,巻2,p.55-58
【文献】湧田雄基ほか,インフラ維持管理業務での機械学習活用に向けたモデリング試行と結果の解釈に関する一考察,AI・データサイエンス論文集,2巻J2号,2021年,p.437-446,DOI https://doi.org/10.11532/jsceiii.2.J2_437
(58)【調査した分野】(Int.Cl.,DB名)
G01V 9/00
G06N 20/00
E21B 43/00
E21B 47/00
(57)【特許請求の範囲】
【請求項1】
二畳系海泡石含有層系についての検層識別方法であって、
予測待ちの検層データを収集し、その中からCNL、DEN、GR、RT、RXO、AC曲線の6種類の検層データを選択し、選び出されたデータに対してMinMaxScaler正規化処理を行うデータ前処理であるステップS1と、
検層データを7:1:2の割合で訓練セットと、検証セットと、テストセットとに設定するステップS2と、
検層識別モデルを構築するステップS3であって、検層データX及びそれに対応する滑石タグYを集合D:D={X,Y}として構成し、k=1,2,...,n、nは検層データの総数であり、ここで、Xはk番目の検層曲線データを表し、検層データXから構成される特徴データセットXは、
として表され、mは縦方向のサンプリング数を表し、

はk番目の検層曲線データのm番目のサンプリング点を表し、
滑石タグYは、地層に滑石が存在するか否か、滑石産状の種類及び滑石の含有量を含み、
は地層に滑石が存在するか否かを表し、
、0は地層に滑石が存在しないことを表し、1は地層に滑石が存在することを表し、
は地層の滑石含有量を表し、
は地層の滑石産状を表し、
、0は斑状を表し、1はレンズ状を表し、2は層状を表し、
機械学習アルゴリズムを用いて滑石の各種タグを予測し、
として表され、
は滑石の存在の有無、滑石含有量予測、滑石産状予測に用いられるアルゴリズムを表し、
は滑石の存在の有無、滑石含有量予測、滑石産状予測に用いられるアルゴリズムの損失関数を表すステップS3と、
訓練セットをCatBoostモデルに入力し、CatBoostアルゴリズムを用いて海泡石含有層系に滑石が存在するか否かについて二値分類判別を行うステップS4と、
S4で滑石が存在すると判定された訓練セットデータを別のCatBoostモデルに入力し、CatBoostアルゴリズムを用いて滑石産状の多値分類判別を行うステップS5と、
S4で滑石が存在すると判定された訓練セットデータをXGBoostモデルに入力し、XGBoostアルゴリズムを用いて地層の滑石含有量について回帰予測を行うステップS6と、
検証セットデータをS4で訓練されたモデルに入力し、滑石が存在するか否かの二値分類判別、滑石産状の多値分類判別、滑石含有量予測を順次行い、S4、S5、S6で訓練されたモデルが収束しているか否かをそれぞれ判断し、モデルが収束せず且つ過剰適合が発生しなかった場合、モデルのハイパーパラメータを調整して訓練を続け、モデルが収束しているか、又は過剰適合が発生した場合、訓練を終了し、そして、テストセットデータをモデルに入力して、モデルが正常に動作するか否かを判断し、そうであれば、当該モデルを残し、そうでない場合、当該モデルを除外し、各モデルの訓練が完了するたびに、モデルの損失関数を計算し、残されたモデルの中から損失関数が最小となるモデルを最終モデルとして選択するステップS7と、
最終モデルを用いて、識別待ちの二畳系海泡石含有層系について滑石が存在するか否かの二値分類判別、滑石産状の多値分類判別、滑石含有量予測を行い、滑石含有量を利用して異なる産状の海泡石含有層系の有効厚さを計算し、
nは海泡石層系の層数を表すステップS8と、
を含むことを特徴とする二畳系海泡石含有層系についての検層識別方法。
【請求項2】
前記ステップS4及びS5のCatBoostモデルの損失関数として、クロスエントロピー関数を用い、クロスエントロピー計算方法は、
であり、ここで、nはサンプルの総数を表し、classは種類数を表し、yijはi番目のサンプルが種類jを含むタグを表し、pijはi番目のサンプルの、種類jについての予測値を表し、
ステップS6のXGBoostアルゴリズムの損失関数として二乗平均平方根誤差RMSEを用い、その計算式は、
であり、f(x)はi番目のサンプルxの予測値を表し、Yはi番目のサンプルの真の値を表す
ことを特徴とする請求項1に記載の二畳系海泡石含有層系についての検層識別方法。
【発明の詳細な説明】
【技術分野】
【0001】
本発明は、二畳系海泡石含有層系についての検層識別方法に関する。
【背景技術】
【0002】
炭酸塩岩は自生自蔵、源内蓄積の特徴を有し、またその有機物質、孔隙生長は海泡石含有層系と密接に関係している。非通常油ガス探査において、海泡石含有層系は海泡石-滑石移行過程において極めて強い有機物質吸着効果を有し、重要な炭化水素源である。
【0003】
検層予測は分類問題と回帰問題にまとめられてもよく、機械学習アルゴリズムは検層予測において広く応用されており、岩質予測、貯蔵層物性評価などの分野で良い効果が得られた。海泡石含有層系の予測は粘土鉱物の予測に属し、その検層予測方法は比較的に多く、低抵抗率曲線特徴による頁岩粘土鉱物含有量の計算、ニューラルネットワークモデルによる粘土鉱物含有量の分布規則の分析、自然ガンマエネルギースペクトルによる有機物質を大量に含む頁岩中の粘土鉱物分布の計算、風化指数に基づく粘土鉱物含有量の逆解析、音波時差-抵抗率による地層粘土鉱物の種類及び含有量の総合計算、検層鉱物感度分析、X線回折の併用、重回帰分析を結合させて泥頁岩粘土鉱物分析モデルを構築することが含まれる。現在では、海泡石、滑石などの粘土鉱物の検層応答特徴に対する研究が不足しており、また、現在の粘土鉱物の検層分析方法では、エネルギースペクトル検層、XRDなどの様々な手段を組み合わせる必要がある。実際の応用では、検層資料は通常の検層を主とし、エネルギースペクトル検層の資料が不足している。通常の資料は粘土鉱物の含有量の解釈に重点を置き、具体的な粘土鉱物の種類を区別することは難しい。そのため、海泡石含有層系の検層予測に適したワークフローパターンを確立することは、非通常油ガス探査に対して重要な意味を持っている。地質レベルでは、滑石が海泡石から変化したので、滑石が生長している場所にはかつて海泡石が必ず存在していたので、滑石を調査することで海泡石の存在を判断することができる。
【発明の概要】
【発明が解決しようとする課題】
【0004】
本発明の目的は、従来技術の欠点を克服し、既存の掘削データに基づいて海泡石含有層系の分析予測フローを確立し、予測結果を従来の茅口層1部層TOC分布と一致させることができ、海泡石含有層系についての正確な予測と二畳系海泡石含有層系についての検層識別方法を提供することにある。
【課題を解決するための手段】
【0005】
本発明の目的は、以下の技術的手段により達成される。二畳系海泡石含有層系についての検層識別方法は、
予測待ちの検層データを収集し、その中からCNL、DEN、GR、RT、RXO、AC曲線の6種類の検層データを選択し、選び出されたデータに対してMinMaxScaler正規化処理を行うデータ前処理であるステップS1と、
検層データを7:1:2の割合で訓練セットと、検証セットと、テストセットとに設定するステップS2と、
検層識別モデルを構築するステップS3であって、検層データX及びそれに対応する滑石タグYを集合D:D={X,Y}として構成し、k=1,2,...,n、nは検層データの総数であり、ここで、Xはk番目の検層曲線データを表し、検層データXから構成される特徴データセットXは、
として表され、mは縦方向のサンプリング数を表し、

はk番目の検層曲線データのm番目のサンプリング点を表し、滑石タグYは、地層に滑石が存在するか否か、滑石産状の種類及び滑石の含有量を含み、
は地層に滑石が存在するか否かを表し、
、0は地層に滑石が存在しないことを表し、1は地層に滑石が存在することを表し、
は地層の滑石含有量を表し、
は地層の滑石産状を表し、
、0は斑状を表し、1はレンズ状を表し、2は層状を表し、
機械学習アルゴリズムを用いて滑石の各種タグを予測し、
として表され、
は滑石の存在の有無、滑石含有量予測、滑石産状予測に用いられるアルゴリズムを表し、
は滑石の存在の有無、滑石含有量予測、滑石産状予測に用いられるアルゴリズムの損失関数を表すステップS3と、
訓練セットをCatBoostモデルに入力し、CatBoostアルゴリズムを用いて海泡石含有層系に滑石が存在するか否かについて二値分類判別を行うステップS4と、
S4で滑石が存在すると判定された訓練セットデータを別のCatBoostモデルに入力し、CatBoostアルゴリズムを用いて滑石産状の多値分類判別を行うステップS5と、
S4で滑石が存在すると判定された訓練セットデータをXGBoostモデルに入力し、XGBoostアルゴリズムを用いて地層の滑石含有量について回帰予測を行うステップS6と、
検証セットデータをS4で訓練されたモデルに入力し、滑石が存在するか否かの二値分類判別、滑石産状の多値分類判別、滑石含有量予測を順次行い、S4、S5、S6で訓練されたモデルが収束しているか否かをそれぞれ判断し、モデルが収束せず且つ過剰適合が発生しなかった場合、モデルのハイパーパラメータを調整して訓練を続け、モデルが収束しているか、又は過剰適合が発生した場合、訓練を終了し、そして、テストセットデータをモデルに入力して、モデルが正常に動作するか否かを判断し、そうであれば、当該モデルを残し、そうでない場合、当該モデルを除外し、各モデルの訓練が完了するたびに、モデルの損失関数を計算し、残されたモデルの中から損失関数が最小となるモデルを最終モデルとして選択するステップS7と、
最終モデルを用いて、識別待ちの二畳系海泡石含有層系について滑石が存在するか否かの二値分類判別、滑石産状の多値分類判別、滑石含有量予測を行い、滑石含有量を利用して異なる産状の海泡石含有層系の有効厚さを計算し、
nは海泡石層系の層数を表すステップS8と、を含む。
【0006】
前記ステップS4及びS5のCatBoostモデルの損失関数として、クロスエントロピー関数を用い、クロスエントロピー計算方法は、
であり、ここで、nはサンプルの総数を表し、classは種類数を表し、yijはi番目のサンプルが種類jを含むタグを表し、pijはi番目のサンプルの、種類jについての予測値を表し、
ステップS6のXGBoostアルゴリズムの損失関数として二乗平均平方根誤差RMSEを用い、その計算式は、
であり、f(x)はi番目のサンプルxの予測値を表し、Yはi番目のサンプルの真の値を表す。
【0007】
本発明の有益な効果は以下の通りである。本発明は、既存の掘削データに基づいて海泡石含有層系の分析予測フローを確立し、予測結果を従来の茅口層1部層TOC分布と一致させることができる。海泡石含有層系についての正確な予測を実現でき、非通常探査の実際の応用に重要な意味を持つ。
【発明を実施するための形態】
【0008】
中国の海泡石粘土鉱は独自の鉱床を持ち、しかも海泡石粘土鉱物資源の将来性は非常に高く、熱水型や堆積型は全て一定の鉱化の将来性がある。そのため、本研究はよく使われる機械学習アルゴリズムを十分に比較した上で、海泡石含有層系の存在性(二値分類問題)、滑石産状(多値分類問題)と滑石含有量(回帰問題)を総合的に比較し、海泡石含有層系の検層予測に適用可能なワークフローモデルを確立した。以下では、本願の技術案についてさらに説明する。
【0009】
略語と重要な用語の定義:海泡石はSiOとMg2+を大量に含み、Al3+を少量に含む粘土鉱物であり、現代の海泡石は主に大西洋、インド洋の大洋中央海嶺と深海平原、高塩湖の低陸成湖盆中心に分布している。海泡石鉱床は重要な産業価値を持ち、その多くは新第三系の陸相堆積地層に産出される。しかしながら、現在、海泡石-滑石の成因、産状と油ガス地質の意義に対する検討はまだ深く掘り下げられていない。海泡石含有層系の検層予測問題に対して、岩石コア、薄片、XRD、測録井などの地質資料に基づいて、感度分析に基づいてCNL、DEN、GR、RT、RXO、AC検層曲線を特徴として選択し、SMOTEアルゴリズムを用いて特徴の平衡性の差異を処理した後に、海泡石含有層系の判定、分類及び含有量予測におけるCatBoost、XGBoost、LightGBM、ランダムフォレスト、ANN、SVM、KNN及びベイズモデルのパフォーマンスの差異を比較し、海泡石含有層系の予測フローを提案した。
【0010】
本発明にかかる二畳系海泡石含有層系についての検層識別方法は、
予測待ちの検層データを収集し、その中からCNL、DEN、GR、RT、RXO、AC曲線の6種類の検層データを選択し、選び出されたデータに対してMinMaxScaler正規化処理を行うデータ前処理であるステップS1と、
検層データを7:1:2の割合で訓練セットと、検証セットと、テストセットとに設定するステップS2と、
検層識別モデルを構築するステップS3であって、検層データX及びそれに対応する滑石タグYを集合D:D={X,Y}として構成し、k=1,2,...,n、nは検層データの総数であり、ここで、Xはk番目の検層曲線データを表し、検層データXから構成される特徴データセットXは、
として表され、mは縦方向のサンプリング数を表し、

はk番目の検層曲線データのm番目のサンプリング点を表し、
滑石タグYは、地層に滑石が存在するか否か、滑石産状の種類及び滑石の含有量を含み、
は地層に滑石が存在するか否かを表し、
、0は地層に滑石が存在しないことを表し、1は地層に滑石が存在することを表し、
は地層の滑石含有量を表し、
は地層の滑石産状を表し、
、0は斑状を表し、1はレンズ状を表し、2は層状を表し、
機械学習アルゴリズムを用いて滑石の各種タグを予測し、
その中で、
は、滑石の存在の有無、滑石含有量予測、滑石産状予測に用いられるアルゴリズムを表し、
は、
が、入力がm次元実数、出力が1次元実数の関数であることを表し、
は、滑石の存在の有無、滑石含有量予測、滑石産状予測に使用されるアルゴリズムの損失関数、すなわち、以下のクロスエントロピー損失関数または二乗平均平方根誤差RMSEを表し、上式は滑石の存在の有無、滑石含有量予測、滑石産状判定の3つのモデルにおいて、いずれも損失関数が最小となるモデルを選択することを表す。
【0011】
訓練セットをCatBoostモデルに入力し、CatBoostアルゴリズムを用いて海泡石含有層系に滑石が存在するか否かについて二値分類判別を行うステップS4と、
S4で滑石が存在すると判定された訓練セットデータを別のCatBoostモデルに入力し、CatBoostアルゴリズムを用いて滑石産状の多値分類判別を行うステップS5と、
ステップS4及びS5のCatBoostモデルの損失関数として、クロスエントロピー関数を用い、クロスエントロピー計算方法は、
であり、ここで、nはサンプルの総数を表し、classは種類数を表し、yijはi番目のサンプルが種類jを含むタグを表し、pijはi番目のサンプルの、種類jについての予測値を表し、
S4で滑石が存在すると判定された訓練セットデータをXGBoostモデルに入力し、XGBoostアルゴリズムを用いて地層の滑石含有量について回帰予測を行うステップS6であって、XGBoostアルゴリズムの損失関数として二乗平均平方根誤差RMSEを用い、その計算式は、
であり、f(x)はi番目のサンプルxの予測値を表し、Yはi番目のサンプルの真の値を表すステップS6と、
検証セットデータをS4で訓練されたモデルに入力し、滑石が存在するか否かの二値分類判別、滑石産状の多値分類判別、滑石含有量予測を順次行い、S4、S5、S6で訓練されたモデルが収束しているか否かをそれぞれ判断し、モデルが収束せず且つ過剰適合が発生しなかった場合、モデルのハイパーパラメータを調整して訓練を続け、モデルが収束しているか、又は過剰適合が発生した場合、訓練を終了し、そして、テストセットデータをモデルに入力して、モデルが正常に動作するか否かを判断し、そうであれば、当該モデルを残し、そうでない場合、当該モデルを除外し、各モデルの訓練が完了するたびに、モデルの損失関数を計算し、残されたモデルの中から損失関数が最小となるモデルを最終モデルとして選択するステップS7と、
最終モデルを用いて、識別待ちの二畳系海泡石含有層系について滑石が存在するか否かの二値分類判別、滑石産状の多値分類判別、滑石含有量予測を行い、滑石含有量を利用して異なる産状の海泡石含有層系の有効厚さを計算し、
nは海泡石層系の層数を表すステップS8と、を含む。
【0012】
当業者であれば、本明細書に記載された実施例は、読み手が本発明の原理を理解するのを助けるためのものであり、本発明の保護の範囲がそのような特別な記載及び実施例に限定されるものではないと理解すべきであると理解するはずである。当業者であれば、本発明に開示されたこれら技術的示唆に従って、本発明の本質から逸脱しない他の様々な具体的な変形及び組み合わせを作り出すことができ、これらの変形及び組み合わせは、本発明の保護の範囲内にある。
【要約】      (修正有)
【課題】海泡石含有層系についての正確な予測と二畳系海泡石含有層系についての検層識別方法を提供する。
【解決手段】データ前処理であるステップS1と、訓練セットと、検証セットと、テストセットとに設定するステップS2と、検層識別モデルを構築するステップS3と、CatBoostアルゴリズムを用いて海泡石含有層系に滑石が存在するか否かについて二値分類判別を行うステップS4と、CatBoostアルゴリズムを用いて滑石産状の多値分類判別を行うステップS5と、XGBoostアルゴリズムを用いて地層の滑石含有量について回帰予測を行うステップS6と、検証セットとテストセットとを用いてモデルをテストし、残されたモデルの中から損失関数が最小となるモデルを最終モデルとして選択するステップS7と、最終モデルを用いて、識別待ちの二畳系海泡石含有層系について予測を行うステップS8と、を含む。
【選択図】なし