(19)【発行国】日本国特許庁(JP)
(12)【公報種別】特許公報(B2)
(11)【特許番号】
(24)【登録日】2024-11-11
(45)【発行日】2024-11-19
(54)【発明の名称】予測装置、予測方法、及び、プログラム
(51)【国際特許分類】
G06F 18/27 20230101AFI20241112BHJP
G06N 5/045 20230101ALI20241112BHJP
G06N 20/00 20190101ALI20241112BHJP
G06Q 50/02 20240101ALI20241112BHJP
E21B 47/06 20120101ALI20241112BHJP
E21B 49/02 20060101ALI20241112BHJP
【FI】
G06F18/27
G06N5/045
G06N20/00
G06Q50/02
E21B47/06
E21B49/02
(21)【出願番号】P 2023503851
(86)(22)【出願日】2022-03-01
(86)【国際出願番号】 JP2022008533
(87)【国際公開番号】W WO2022186182
(87)【国際公開日】2022-09-09
【審査請求日】2023-08-28
(31)【優先権主張番号】P 2021034393
(32)【優先日】2021-03-04
(33)【優先権主張国・地域又は機関】JP
(73)【特許権者】
【識別番号】000004237
【氏名又は名称】日本電気株式会社
(74)【代理人】
【識別番号】100107331
【氏名又は名称】中村 聡延
(74)【代理人】
【識別番号】100104765
【氏名又は名称】江上 達夫
(74)【代理人】
【識別番号】100131015
【氏名又は名称】三輪 浩誉
(72)【発明者】
【氏名】緒方 綾
【審査官】多賀 実
(56)【参考文献】
【文献】国際公開第2019/130974(WO,A1)
【文献】米国特許出願公開第2018/0335538(US,A1)
【文献】XUE, Liang et al.,"A data-driven shale gas production forecasting method based on the multi-objective random forest regression",Journal of Petroleum Science and Engineering [online],Elsevier B.V.,2020年08月20日,Volume 196 (2021) 107801,pp. 1-13,[検索日 2022.05.09], インターネット: <URL: https://www.sciencedirect.com/science/article/pii/S0920410520308627>,<DOI: https://doi.org/10.1016/j.petrol.2020.107801>
【文献】梅津 圭介 ほか,「分析成果の業務活用とモデルの解釈性についての一考察」,一般社団法人 人工知能学会 第30回全国大会論文集CD-ROM [CD-ROM],社団法人 人工知能学会,2016年06月,3K3-4, pp. 1-4
【文献】浅川 直輝,「説明可能AIの理想と現実」,日経コンピュータ,日経BP,2020年02月06日,第1009号,pp. 38-44
(58)【調査した分野】(Int.Cl.,DB名)
G06F 18/00-18/40
G06N 3/00-99/00
G06Q 50/02
E21B 47/00-49/10
(57)【特許請求の範囲】
【請求項1】
シェールガス又はシェールオイルの井戸に関する特徴量を取得する取得手段と、
前記特徴量に基づき、機械学習モデルを用いて前記井戸の生産量又は前記井戸の砂戻り量の予測値を算出する予測手段と、
前記予測値と、前記予測値に対する前記特徴量の寄与度とを出力する出力手段と、
を備え
、
前記機械学習モデルは、前記予測値を算出するための複数の線形予測式と、前記特徴量に基づいて前記予測値の算出に使用する線形予測式を選択するための条件とを含み、
前記出力手段は、前記予測値の算出に使用した線形予測式における前記特徴量の重み係数を寄与度として出力する予測装置。
【請求項2】
前記特徴量は、前記井戸に使用するプロパントに関する情報を含む請求項1に記載の予測装置。
【請求項3】
前記特徴量は、前記井戸に使用する流体に関する情報を含む請求項1
又は2に記載の予測装置。
【請求項4】
前記機械学習モデルは、地域毎に分割した訓練データを用いて訓練済みである請求項1乃至
3のいずれか一項に記載の予測装置。
【請求項5】
コンピュータにより実行される予測方法であって、
シェールガス又はシェールオイルの井戸に関する特徴量を取得し、
前記特徴量に基づき、機械学習モデルを用いて前記井戸の生産量又は前記井戸の砂戻り量の予測値を算出し、
前記予測値と、前記予測値に対する前記特徴量の寄与度とを出力
し、
前記機械学習モデルは、前記予測値を算出するための複数の線形予測式と、前記特徴量に基づいて前記予測値の算出に使用する線形予測式を選択するための条件とを含み、
前記予測値の算出に使用した線形予測式における前記特徴量の重み係数が前記寄与度として出力される予測方法。
【請求項6】
シェールガス又はシェールオイルの井戸に関する特徴量を取得し、
前記特徴量に基づき、機械学習モデルを用いて前記井戸の生産量又は前記井戸の砂戻り量の予測値を算出し、
前記予測値と、前記予測値に対する前記特徴量の寄与度とを出力する処理をコンピュータに実行させ
、
前記機械学習モデルは、前記予測値を算出するための複数の線形予測式と、前記特徴量に基づいて前記予測値の算出に使用する線形予測式を選択するための条件とを含み、
前記予測値の算出に使用した線形予測式における前記特徴量の重み係数が前記寄与度として出力されるプログラム。
【発明の詳細な説明】
【技術分野】
【0001】
本開示は、AI(Artificial Intelligence)を用いて資源開発に関連する予測を行う手法に関する。
【背景技術】
【0002】
AIを利用して資源開発に関連する予測を行う方法が知られている。例えば、特許文献1は、ニューラルネットワーク(NN)を用いる炭化水素貯留層の石油物理的特性の推測方法を開示している。
【先行技術文献】
【特許文献】
【0003】
【発明の概要】
【発明が解決しようとする課題】
【0004】
特許文献1は、シェールガスやシェールオイルの採掘への利用は想定されておらず、シェールガスやシェールオイルの採掘には適用できない。また、特許文献1の手法は、ニューラルネットワークを利用するため、得られた予測結果の解釈性が低いという課題がある。
【0005】
本開示の目的は、シェールガスやシェールオイルの開発に関連する予測を、解釈性の高い方法で提示することにある。
【課題を解決するための手段】
【0006】
本開示の1つの観点は、予測装置であって、
シェールガス又はシェールオイルの井戸に関する特徴量を取得する取得手段と、
前記特徴量に基づき、機械学習モデルを用いて前記井戸の生産量又は前記井戸の砂戻り量の予測値を算出する予測手段と、
前記予測値と、前記予測値に対する前記特徴量の寄与度とを出力する出力手段と、
を備え、
前記機械学習モデルは、前記予測値を算出するための複数の線形予測式と、前記特徴量に基づいて前記予測値の算出に使用する線形予測式を選択するための条件とを含み、
前記出力手段は、前記予測値の算出に使用した線形予測式における前記特徴量の重み係数を寄与度として出力する。
【0007】
本開示の他の観点は、コンピュータにより実行される予測方法であって、
シェールガス又はシェールオイルの井戸に関する特徴量を取得し、
前記特徴量に基づき、機械学習モデルを用いて前記井戸の生産量又は前記井戸の砂戻り量の予測値を算出し、
前記予測値と、前記予測値に対する前記特徴量の寄与度とを出力し、
前記機械学習モデルは、前記予測値を算出するための複数の線形予測式と、前記特徴量に基づいて前記予測値の算出に使用する線形予測式を選択するための条件とを含み、
前記予測値の算出に使用した線形予測式における前記特徴量の重み係数が前記寄与度として出力される。
【0008】
本発明のさらに他の観点では、プログラムは、
シェールガス又はシェールオイルの井戸に関する特徴量を取得し、
前記特徴量に基づき、機械学習モデルを用いて前記井戸の生産量又は前記井戸の砂戻り量の予測値を算出し、
前記予測値と、前記予測値に対する前記特徴量の寄与度とを出力する処理をコンピュータに実行させ、
前記機械学習モデルは、前記予測値を算出するための複数の線形予測式と、前記特徴量に基づいて前記予測値の算出に使用する線形予測式を選択するための条件とを含み、
前記予測値の算出に使用した線形予測式における前記特徴量の重み係数が前記寄与度として出力される。
【発明の効果】
【0009】
本開示によれば、シェールガスやシェールオイルの開発に関連する予測を、解釈性の高い方法で提示することが可能となる。
【図面の簡単な説明】
【0010】
【
図1】シェールガス・オイルの採掘方法の基本的な工程を説明する図である。
【
図3】第1実施形態に係る予測装置のハードウェア構成を示す。
【
図4】第1実施形態の予測装置のモデル生成時の機能構成を示す。
【
図5】異種混合学習を用いた予測モデルの構造の一例を模式的に示す。
【
図6】シェールガス・オイルの生産量を予測する予測モデルの例を示す。
【
図7】
図6の予測モデルにおける予測式を説明する図である。
【
図8】シェールガス・オイル開発における砂戻り量を予測する予測モデルの例を示す。
【
図9】
図8の予測モデルにおける予測式を説明する図である。
【
図10】第1実施形態に係る予測装置の機能構成を示す。
【
図11】第1実施形態に係る予測装置による予測処理のフローチャートである。
【
図12】第2実施形態に係る予測装置の機能構成を示す。
【
図13】第2実施形態に係る予測装置による予測処理のフローチャートである。
【
図14】第3実施形態に係る予測装置の機能構成を示す。
【
図15】第3実施形態に係る予測装置による処理のフローチャートである。
【発明を実施するための形態】
【0011】
以下、図面を参照しながら、本開示の好適な実施形態について説明する。
<シェール開発>
まず、前提として、シェールオイルやシェールガスの開発(「シェール開発」とも呼ぶ。)の基本的な流れを説明する。
図1は、シェールガス・オイルの採掘方法の基本的な工程を説明する図である。なお、シェールオイルの採掘方法も基本的に同様である。
【0012】
シェールガスやシェールオイルは、頁岩と呼ばれる堆積岩の層であるシェール層から採取される天然ガスや原油である。図示のように、シェールガスの採掘は、基本的に掘削、水圧破砕、水の回収、ガスの生産という順序で行われる。具体的に、掘削工程では、先端にドリルがついた鋼管を使って、地中深くのシェール層内に水平に抗井を掘削する。次に、水圧破砕工程では、砂(プロパント)を含んだ高圧の水を送り、シェール層に人工的な亀裂を作る。続いて、水の回収工程では、水圧破砕に使用した水を回収し、ガスの流路を確保する。その後、ガスの生産が開始される。
【0013】
シェール開発は、未だ歴史が浅く、開発因子が膨大にあるため、最適な開発方法論が未確立な面がある。このため、トライアンドエラーの手法での開発が行われることが多く、生産性の低い井戸を開発したり、仕上コストを過剰に投入したりした結果、事業としての採算性が悪化するという課題がある。このため、過去に得られた膨大なデータを用いて、機械学習により生産性を予測することが期待されている。予測の際、ニューラルネットワークを用いた深層学習などの手法を用いると、生産性の予測は可能であるが、得られた予測結果の解釈性が低いため、どのような因子がどの程度寄与してその予測結果が得られているかがわからない。以下の実施形態では、機械学習を用いてシェールガスやシェールオイルの生産性などを予測する際に、予測結果を解釈性の高い方法で提示することを可能とする。
【0014】
<第1実施形態>
[基本構成]
図2は、第1実施形態に係る予測装置100を示す。予測装置100は、シェール開発に関連する予測を行う。具体的に、予測装置100には、シェール開発に関連する各種の特徴量を示す特徴量データが入力される。予測装置100は、特徴量データから、機械学習を用いて、シェールガスやシェールオイルの開発計画に影響を与える要素、具体的には井戸の生産量や井戸の砂戻り量などを予測し、予測結果を出力する。
【0015】
特徴量データは、井戸の位置、地質、採掘、仕上、生産などに関する特徴量を示す。井戸の位置に関する特徴量は、例えば国、地域、緯度・経度などを含む。地質に関する特徴量は、例えば鉱区、地層、孔隙率、浸透率、水飽和率、塩分濃度などを含む。採掘に関する特徴量は、例えば採掘深度、水平長、井戸間隔、水平起伏、掘削期間、掘削業者などを含む。仕上に関する特徴量は、例えばステージ数、クラスタ数、砂の種類/粒度(大きさ)、流体(水)の種類/量/粘性、圧入圧力、ケーシング種類などを含む。生産に関する特徴量は、水回収量、砂回収量、ガス・オイルの回収量/比率などを含む。
【0016】
[ハードウェア構成]
図3は、予測装置100のハードウェア構成を示すブロック図である。予測装置100は、インタフェース(IF)101と、プロセッサ102と、メモリ103と、記録媒体104と、表示部105と、入力部106とを備える。
【0017】
IF101は、予測装置100に対するデータの入出力を行う。具体的に、IF101は、シェール開発に関する各種の特徴量データの入力、及び、予測結果の外部への出力に使用される。
【0018】
プロセッサ102は、CPUなどのコンピュータであり、予め用意されたプログラムを実行することにより、予測装置100の全体を制御する。なお、プロセッサ102は、GPU(Graphics Processing Unit)又はFPGA(Field-Programmable Gate Array)などであってもよい。具体的に、プロセッサ102は、後述する予測処理を実行する。
【0019】
メモリ103は、ROM(Read Only Memory)、RAM(Random Access Memory)などにより構成される。メモリ103には、予測装置100が使用する予測モデルに関する情報が記憶される。また、メモリ103は、プロセッサ102による各種の処理の実行中に作業メモリとしても使用される。
【0020】
記録媒体104は、ディスク状記録媒体、半導体メモリなどの不揮発性で非一時的な記録媒体であり、予測装置100に対して着脱可能に構成される。記録媒体104は、プロセッサ102が実行する各種のプログラムを記録している。予測装置100が処理を実行する際には、記録媒体104に記録されているプログラムがメモリ103にロードされ、プロセッサ102により実行される。
【0021】
表示部105は、例えば液晶表示装置などであり、利用者に各種の情報を表示する。入力部106は、例えばキーボード、マウスなどであり、利用者が各種の指示、入力を行う際に使用される。
【0022】
[モデル生成時の機能構成]
図4は、予測装置100のモデル生成時の機能構成を示すブロック図である。モデルの生成時、即ちモデルの訓練時には、予測装置100は、データ取得部111と、予測モデル生成部112とを備える。データ取得部111は、シェール開発に関連する各種の過去の特徴量データを訓練データとして予測モデル生成部112へ出力する。予測モデル生成部112は、訓練データを用いて予測モデルを訓練し、訓練後の予測モデルを出力する。得られた予測モデルは、メモリ103などに保存される。なお、予測モデルの生成時には、シェール開発を行う地域毎、具体的には、国や緯度・経度毎に訓練データを分割して予測モデルを訓練してもよい。
【0023】
本実施形態では、予測モデル生成部112は、異種混合学習により予測モデルを生成する。異種混合学習は、多種多様なデータから特定の規則性を自動的に発見してデータをグループ分けし、グループ毎に適切な規則性を用いて予測を行う手法である。異種混合学習により生成された予測モデルは、予測式の選択のための条件を示す木構造と、線形予測式とを組み合わせたものである。
【0024】
具体的に、予測モデル生成部112は、シェール開発に関する過去の特徴量データが入力されると、まず、それらのパターンや傾向を分析してデータをグループ分け(場合分け)し、各グループに属するデータの規則性に適合した予測式を生成する。例えば、予測装置100がシェールガスの生産量を予測する場合、予測モデル生成部112は、過去の特徴量データ及び過去の実際の生産量を用いて、各グループについてシェールガスの生産量を予測する予測式を生成する。なお、異種混合学習の手法は、例えば米国公開特許US2014/0222741A1号公報等に開示されている。
【0025】
図5は、異種混合学習を用いた予測モデルの構造の一例を模式的に示す。この例では、全データは、条件1~4により4つのグループG1~G4に分割され、各グループのデータについて対応する予測式を用いて予測が行われる。例えば、条件1がNoとなるグループG1に属するデータは、予測式1を用いて予測が行われる。また、条件1がYes、条件2がNoとなるグループG2に属するデータは、予測式2を用いて予測が行われる。こうして、データのグループ毎に適切な予測式を用いて予測が行われる。これにより、シェール開発に関する多種多様なデータが混在している場合でも、それらのデータの規則性を自動で発見し、それぞれに対して適切な予測を行うことができる。
【0026】
[予測モデルの例]
次に、異種混合学習を用いて生成した予測モデルの例を説明する。なお、以下の実施例で使用するデータ項目は単なる例示であり、実際に使用するデータ項目とは異なる場合がある。
(第1例)
図6は、シェールガス・オイルの生産量を予測する予測モデルの例を示す。この例では、条件1(孔隙率<3.5%)、条件2(有機炭素量>2.2%)、条件3(岩石種別=Carbonate)により、入力される特徴量データが4つのグループG1~G4に分割されている。各グループG1~G4について、そのグループに対応する予測式が生成される。
【0027】
図7は、予測式を説明する図である。入力される特徴量データとしては、地層圧力、砂粒度、粘土量、比抵抗、クラスター間隔、流体投入量、ステージ数、砂投入量、水平長の9個のパラメータを用いている。なお、上記のパラメータは単なる例示であり、実際にはより多数のパラメータを使用することがある。各予測式A~Dに対応するグラフは、各予測式における生産量に対する各パラメータの寄与度を示している。例えば、予測式Aについては、上記の9個のパラメータのうち、砂投入量と水平長が生産量の予測に寄与し、グラフに示すように、砂投入量の寄与度は約0.5、水平長の寄与度は約1.4となっている。予測式Aでは、他の7個のパラメータは生産量に寄与していない。なお、各パラメータは、生産量に対して正の相関を有するパラメータと、負の相関を有するパラメータとに分けられる。正の相関を有するパラメータは、生産量が増加する方向に寄与し、負の相関を有するパラメータは生産量が減少する方向に寄与する。
【0028】
予測式Aの場合、砂投入量の寄与度は約0.5、水平長の寄与度は約1.4であり、それ以外のパラメータは寄与度が0であるので、予測式Aは、
生産量X=0.5×(砂投入量)+1.4×(水平長)
と得られる。同様に、予測式B~Dも、各グラフに基づいて
図7に示すように導出される。
【0029】
(第2例)
図8は、シェールガス・オイル開発における砂戻り量を予測する予測モデルの例を示す。砂戻り量とは、
図1に示す水圧破砕工程において投入した砂(プロパント)が、水の回収工程において逆戻りする量をいう。砂戻り量が多いと、シェール層にできた亀裂を維持するために砂の再投入する必要が生じ、コストの増大などにつながるため、開発計画において考慮すべき事項となっている。
【0030】
この例では、条件1(地質系要因F1<0.2)、条件2(地質系要因F2<64)、条件3(地質系要因F3<0.9)により、入力された特徴量データが4つのグループG1~G4に分割されている。各グループG1~G4について、そのグループに対応する予測式が生成される。
【0031】
図9は、予測式を説明する図である。入力される特徴量データとしては、仕上系要因A~D、採掘系要因A~B、採掘系要因A~Bの8個の要因を用いている。なお、上記の各要因は単なる例示であり、実際にはより多数の特徴量データを使用することがある。各予測式A~Dに対応するグラフは、各予測式における砂戻り量に対する各要因の寄与度を示している。例えば、予測式Aについては、上記の8個の要因のうち、生産系要因Aと仕上系要因Bが砂戻り量の予測に寄与し、グラフに示すように、生産系要因Aの寄与度は約0.1、仕上系要因Bの寄与度は約0.5となっている。予測式Aでは、他の6個の要因は、砂戻り量に寄与しない。なお、正の相関を有する要因と負の相関を有する要因があるのは、第1例と同様である。
【0032】
予測式Aの場合、生産系要因Aの寄与度は約0.1、仕上系要因Bの寄与度は約0.5であり、それ以外の要因は寄与度が0であるので、予測式Aは、
砂戻り量Y=0.1×(生産系要因A)+0.5×(仕上系要因B)
と得られる。同様に、予測式B~Dも、各グラフに基づいて
図9に示すように導出される。
【0033】
以上、第1例及び第2例を用いて説明したように、異種混合学習を用いた予測モデルでは、入力データをいくつかの条件によってグループ分けし、各グループに対して適切な予測式を用いて予測を行う。よって、利用者は、予測結果と、木構造の内容(どのような条件で分割しているか)と、その予測結果を算出するために使用した予測式とを見ることにより、どの条件のときに、どの特徴量がどの程度寄与して生産量や砂戻り量が予測されているかを理解することができる。よって、予測結果を開発計画などに効果的に利用することが可能となる。
【0034】
[予測時の機能構成]
図10は、予測装置100の予測時の機能構成を示すブロック図である。予測時の予測装置100は、データ取得部121と、予測部122とを備える。なお、データ取得部121は取得手段の一例であり、予測部122は予測手段の一例である。
【0035】
データ取得部121は、シェール開発に関連する現在の特徴量データを取得し、予測モデル生成部112へ出力する。
【0036】
予測部122は、前述の異種混合学習により生成された予測モデルを用いて予測を行う。具体的には、予測部122は、入力された現在の特徴量データに基づき、
図6~
図9に例示したグループ分け及び予測式に従って、シェールガスの生産量や砂戻り量などを予測する。具体的に、予測部122は、入力された特徴量データに基づいて1つのグループを決定し、そのグループに対応する予測式を用いてシェールガスの生産量や砂戻り量などの予測値を予測結果として算出する。
【0037】
そして、予測部122は、予測結果と、その予測に使用した予測式とを出力する。例えば、
図6に示すシェールガスの生成量の予測において、現在の特徴量データが条件1に該当し、予測部122が予測式Aを用いて生産量の予測値を算出した場合、予測部122は、算出した予測結果と予測式Aとを出力する。なお、予測部122は、予測式とともに、その予測式に対応するグループ分けの条件も出力してもよい。即ち、上記の例では、予測部122は、予測結果と、予測式Aと、その予測式Aに対応する条件1とを出力してもよい。出力された予測結果及び予測式は、例えば表示部105に表示される。
【0038】
[予測処理]
図11は、予測装置100による予測処理のフローチャートである。この処理は、
図2に示すプロセッサ102が、予め用意されたプログラムを実行し、
図10に示す要素として動作することにより実現される。
【0039】
まず、データ取得部121は、現在の特徴量データを取得する(ステップS11)。次に、予測部122は、予め生成された予測モデルを用いて予測を行う(ステップS12)。例えば前述の第1例や第2例では、予測部122はシェールオイルの生産量や砂戻り量を予測する。次に、予測部122は、予測結果と、予測に使用した予測式を出力する(ステップS13)。そして、処理は終了する。
【0040】
<第2実施形態>
上記の第1実施形態では、異種混合学習により生成した解釈性の高い予測モデルを用いて予測を行っている。その代わりに、第2実施形態では、予測モデル自体を解釈性の高いモデルとする代わりに、予測モデルによる予測の解釈性を補助する補助情報を出力することにより、予測結果に対する解釈性を担保する。
【0041】
[機能構成]
図12は、第2実施形態の予測装置200の機能構成を示すブロック図である。なお、予測装置200のハードウェア構成は、第2実施形態の予測装置100と同様である。予測装置200は、データ取得部221と、予測部222と、補助情報生成部223とを備える。なお、データ取得部221は取得手段の一例であり、予測部222は予測手段の一例であり、補助情報生成部223は補助情報生成手段の一例である。
【0042】
データ取得部221は、シェール開発に関連する特徴量データを取得し、予測部222へ出力する。
【0043】
予測部222は、特に解釈性の高い機械学習モデルを用いる必要はなく、例えばニューラルネットワークを使用した深層学習のモデルなどを用いることができる。予測部222は、シェール開発に関連する過去の特徴量データを用いて訓練された予測モデルを用いて予測を行い、予測結果を出力する。
【0044】
補助情報生成部223は、予測部222が使用した機械学習モデルの解釈性を補う補助情報を生成する。補助情報は、予測部222が使用した機械学習モデルによる予測の根拠などを示す情報であり、一般的に説明可能AI(XAI:Explainable AI)と呼ばれる手法を用いて生成される。具体的に、補助情報としては、以下のものが挙げられる。
【0045】
(1)大局的説明を提示する補助情報
大局的説明を提示する補助情報とは、予測部222が使用する予測モデルを可読性の高いモデルで近似的に表現する情報である。具体的に、補助情報は、対象の予測モデルを単一の決定木やルールモデルで近似して表現する。この場合、補助情報は、例えばBATREE(Born Again Tree)、defragTreeなどの手法を用いて生成することができる。例えばBATREEでは、学習されたモデルを使って疑似的に訓練データを生成し、生成された疑似的な訓練データを使って決定木を学習して提示する。
【0046】
(2)局所的説明を提示する補助情報
局所的説明を提示する補助情報とは、予測部222が使用する予測モデルによる予測の根拠を示すものであり、以下のものが挙げられる。
【0047】
(1-1)予測の根拠となった特徴量を提示する情報
補助情報は、予測の根拠となった特徴量を示す情報とすることができる。即ち、補助情報は、どの特徴量が予測に重要であったかを示す。この場合、補助情報は、例えばLIME、SHAP、ANCHOR、Grad-CAMなどの手法を用いて生成することができる。
【0048】
(1-2)予測の根拠となった訓練データを提示する情報
補助情報は、予測の根拠となった訓練データを提示する情報とすることができる。この場合、補助情報は、例えばinfluenceなどの手法を用いて生成することができる。influenceは、ある特定の訓練データが欠けていたとしたら、予測結果がどれくらい変わるかを示す情報を提示する。
【0049】
[予測処理]
図13は、予測装置200による予測処理のフローチャートである。この処理は、
図2に示すプロセッサ102が、予め用意されたプログラムを実行し、
図12に示す要素として動作することにより実現される。
【0050】
まず、データ取得部221は、現在の特徴量データを取得する(ステップS21)。次に、予測部222は、予め生成された予測モデルを用いて予測を行う(ステップS22)。次に、補助情報生成部223は、予測モデルによる予測の根拠を提示する補助情報を生成する(ステップS23)。次に、予測部222及び補助情報生成部223は、それぞれ予測結果と補助情報とを出力する(ステップS24)。そして、処理は終了する。
【0051】
このように、第2実施形態によれば、予測モデルとして解釈性が低い、いわゆるブラックボックスモデルと呼ばれるモデルを使用しても、そのモデルに対する補助情報を提示することにより、予測モデルの解釈性の欠如を補うことができる。
【0052】
<第3実施形態>
図14は、第3実施形態に係る予測装置300の機能構成を示すブロック図である。予測装置300は、取得手段301と、予測手段302と、出力手段303とを備える。
【0053】
図15は、第3実施形態に係る予測装置300による処理のフローチャートである。まず、取得手段301は、シェールガス又はシェールオイルの井戸に関する特徴量を取得する(ステップS31)。予測手段302は、特徴量に基づき、機械学習モデルを用いて井戸の生産量又は井戸の砂戻り量の予測値を算出する(ステップS32)。出力手段303は、予測値と、予測値に対する特徴量の重み係数を寄与度として出力する(ステップS33)。そして、処理は終了する。即ち、寄与度とは、予測値に対して各特徴量がどれだけ寄与したかを示す値である。
【0054】
第3実施形態の予測装置300によれば、予測値に加えて、予測値に対する特徴量の重み係数が寄与度として出力されるので、利用者は予測値が得られた根拠などを容易に理解することができる。
【0055】
その他、上記の各実施形態(変形例を含む、以下同じ)の一部又は全部は、以下の付記のようにも記載され得るが以下には限られない。
【0056】
(付記1)
シェールガス又はシェールオイルの井戸に関する特徴量を取得する取得手段と、
前記特徴量に基づき、機械学習モデルを用いて前記井戸の生産量又は前記井戸の砂戻り量の予測値を算出する予測手段と、
前記予測値と、前記予測値に対する前記特徴量の寄与度とを出力する出力手段と、
を備える予測装置。
【0057】
(付記2)
前記機械学習モデルは、前記予測値を算出するための複数の線形予測式と、前記特徴量に基づいて前記予測値の算出に使用する線形予測式を選択するための条件とを含み、
前記出力手段は、前記予測値の算出に使用した線形予測式における前記特徴量の重み係数を寄与度として出力する付記1に記載の予測装置。
【0058】
(付記3)
前記機械学習モデルを用いた予測の根拠を示す補助情報を生成する補助情報生成手段を備え、
前記出力手段は、前記補助情報を前記特徴量の寄与度として出力する付記1に記載の予測装置。
【0059】
(付記4)
前記補助情報は、前記機械学習モデルを用いた予測の根拠となった特徴量、又は、前記予測の根拠となった当該機械学習モデルの訓練データである付記3に記載の予測装置。
【0060】
(付記5)
前記補助情報は、前記機械学習モデルを決定木又はルールモデルで表現した情報である付記3に記載の予測装置。
【0061】
(付記6)
前記特徴量は、前記井戸に使用するプロパントに関する情報を含む付記1乃至5のいずれか一項に記載の予測装置。
【0062】
(付記7)
前記特徴量は、前記井戸に使用する流体に関する情報を含む付記1乃至6のいずれか一項に記載の予測装置。
【0063】
(付記8)
前記機械学習モデルは、地域毎に分割した訓練データを用いて訓練済みである付記1乃至7のいずれか一項に記載の予測装置。
【0064】
(付記9)
シェールガス又はシェールオイルの井戸に関する特徴量を取得し、
前記特徴量に基づき、機械学習モデルを用いて前記井戸の生産量又は前記井戸の砂戻り量の予測値を算出し、
前記予測値と、前記予測値に対する前記特徴量の寄与度とを出力する予測方法。
【0065】
(付記10)
シェールガス又はシェールオイルの井戸に関する特徴量を取得し、
前記特徴量に基づき、機械学習モデルを用いて前記井戸の生産量又は前記井戸の砂戻り量の予測値を算出し、
前記予測値と、前記予測値に対する前記特徴量の寄与度とを出力する処理をコンピュータに実行させるプログラムを記録した記録媒体。
【0066】
以上、実施形態を参照して本願発明を説明したが、本願発明は上記実施形態に限定されるものではない。本願発明の構成や詳細には、本願発明のスコープ内で当業者が理解し得る様々な変更をすることができる。すなわち、本願発明は、請求の範囲を含む全開示、技術的思想にしたがって当業者であればなし得るであろう各種変形、修正を含むことは勿論である。また、引用した上記の特許文献等の各開示は、本書に引用をもって繰り込むものとする。
【符号の説明】
【0067】
100、200 予測装置
102 プロセッサ
111、121、221 データ取得部
112 予測モデル生成部
122,222 予測部
223 補助情報生成部