(19)【発行国】日本国特許庁(JP)
(12)【公報種別】特許公報(B2)
(11)【特許番号】
(24)【登録日】2025-02-12
(45)【発行日】2025-02-20
(54)【発明の名称】モデル構築装置、モデル構築方法、及びプログラム
(51)【国際特許分類】
G06N 20/00 20190101AFI20250213BHJP
G06F 18/211 20230101ALI20250213BHJP
【FI】
G06N20/00
G06F18/211
(21)【出願番号】P 2021182174
(22)【出願日】2021-11-08
【審査請求日】2024-03-01
(73)【特許権者】
【識別番号】000004226
【氏名又は名称】日本電信電話株式会社
(73)【特許権者】
【識別番号】504132272
【氏名又は名称】国立大学法人京都大学
(74)【代理人】
【識別番号】100147485
【氏名又は名称】杉村 憲司
(74)【代理人】
【識別番号】100164471
【氏名又は名称】岡野 大和
(74)【代理人】
【識別番号】100176728
【氏名又は名称】北村 慎吾
(72)【発明者】
【氏名】伊藤 陽
(72)【発明者】
【氏名】奥津 大
(72)【発明者】
【氏名】古川 愛子
【審査官】福西 章人
(56)【参考文献】
【文献】特開2019-121162(JP,A)
【文献】特開2021-012649(JP,A)
【文献】特開2017-150193(JP,A)
【文献】田中 謙次 ほか,EEGを利用したブレインコンピュータインタフェースのためのデータクレンジング,電子情報通信学会技術研究報告 Vol.105 No.615,日本,社団法人電子情報通信学会,第105巻
(58)【調査した分野】(Int.Cl.,DB名)
G06N 3/00-99/00
G06F 18/00-18/40
(57)【特許請求の範囲】
【請求項1】
地下設備の地震被害の予測モデルを構築するモデル構築装置であって、
過去の被害データを入力し、入力した前記過去の被害データを学習用データと評価用データとに分割するデータ取得部と、
前記学習用データを機械学習してモデル候補を構築し、
前記モデル候補に、前記評価用データを入力して、前記モデル候補の予測精度の評価値を算出し、
前記学習用データの不特定の変数を無作為に入れ替えて前記モデル候補に入力することによる、前記評価値の変化を確認し、
前記学習用データから最も評価値の変化が小さい変数を削除した変数選択データを生成する学習部と、を備え、
前記データ取得部は、前記学習部により前記変数が削除されるたびに、前記変数選択データを新たに学習用データと評価用データとに分割し、
前記学習部は、学習用データ内の変数が最後の一つになるまで、前記変数の削除を繰り返し、前記モデル候補のうち、前記評価値が最大となったモデル候補を、最終的な予測モデルとして出力する、モデル構築装置。
【請求項2】
前記学習部は、XGboost又はRandom forestを利用した機械学習により前記モデル候補を構築する、請求項1に記載のモデル構築装置。
【請求項3】
前記学習部は、ROC-AUC又はF scoreを利用して前記評価値を算出する、請求項1又は2に記載のモデル構築装置。
【請求項4】
前記学習部は、Permutation Importance又はfeature importanceを利用して前記評価値の変化による各変数の重要度の比較を行う、請求項1から3のいずれか一項に記載のモデル構築装置。
【請求項5】
地下設備の地震被害の予測モデルを構築するモデル構築方法であって、
モデル構築装置により、
過去の被害データを入力し、入力した前記過去の被害データを学習用データと評価用データとに分割するデータ取得ステップと、
前記学習用データを機械学習してモデル候補を構築し、
前記モデル候補に、前記評価用データを入力して、前記モデル候補の予測精度の評価値を算出し、
前記学習用データの不特定の変数を無作為に入れ替えて前記モデル候補に入力することによる、前記評価値の変化を確認し、
前記学習用データから最も評価値の変化が小さい変数を削除した変数選択データを生成する学習ステップと、を含み、
前記データ取得ステップは、前記変数が削除されるたびに、前記変数選択データを新たに学習用データと評価用データとに分割し、
前記学習ステップは、学習用データ内の変数が最後の一つになるまで、前記変数の削除を繰り返し、前記モデル候補のうち、前記評価値が最大となったモデル候補を、最終的な予測モデルとして出力する、モデル構築方法。
【請求項6】
コンピュータを、請求項1から4のいずれか一項に記載のモデル構築装置として機能させるためのプログラム。
【発明の詳細な説明】
【技術分野】
【0001】
本開示は、地下設備の地震被害を予測するモデルを構築するモデル構築装置、モデル構築方法、及びプログラムに関する。
【背景技術】
【0002】
従来、地下設備の点検データから被害予測モデルを構築する手法は存在しており、地震の被害予測についても複数適用されている事例がある。しかし、一部の変数で意図しない挙動が生じる可能性があるため、単純にすべての変数を利用すると、ある地震から取得した被害予測モデルに基づいて、別の地震の被害を予測することが難しい。ここにいう変数には、震度、ピーク地盤速度(PGV)、ピーク地盤加速度(PGA)、スペクトル強度、PGV/PGAから換算した変位、等価支配周期、地盤ひずみ、30mまでの平均せん断波速度、平均地盤高、平均傾斜、推定人工平地、埋設年数、導管長、等がある。
【0003】
非特許文献1には、機械学習アルゴリズムを用いて、電気通信の地下管路の損傷を高い精度で予測する地震被害の予測モデルを構築した成果が記載されている。また、この予測モデルでは、上述した各変数の寄与を確認した。
【0004】
非特許文献2には、機械学習によって構築された予測モデルの地震時の地下管路の被害予測の有効性を検証した成果が記載されている。
【0005】
さらに、統計分野では変数を除外するアルゴリズムが複数提唱されている。非特許文献3には、有意な変数を1つずつ取り込んだり取り除いたりしながら、有意なモデルを作成する変数増減法(ステップワイズ法)が記載されている。変数増減法によると、変数が自動的に選択される。このため、変数増減法は客観的かつ便利な方法である。しかし、変数増減法を用いた被害予測モデルは現状存在しない。
【先行技術文献】
【非特許文献】
【0006】
【文献】伊藤 陽 他4名、「Earthquake Damage Prediction of Underground Steel Pipe with Screw Joint Using Machine Learning」、ASCE lifelines予稿集284頁、2021年3月22日公開済
【文献】伊藤 陽 他4名、「通信用地下管路の震災時点検結果を基にした機械学習による被害予測モデル検討」、第40回地震工学研究発表会 C13-1657、 2020 年9 月24 日公開済
【文献】EBPT用語集 変数増減法、[online]、[2021年9月13日検索]、インターネット<URL:http://jspt.japanpt.or.jp/ebpt_glossary/forward-backward-stepwise-selection-method.html>
【発明の概要】
【発明が解決しようとする課題】
【0007】
しかし、過去の地震による地下設備の被害データ(以下、「過去の被害データ」という。)に基づいて、ロバストな地震被害の予測モデルを構築するためには、合理的な方法により、有意な変数を絞りこむことが重要となるが、それがなされていないという課題があった。
【0008】
かかる事情に鑑みてなされた本発明の目的は、有意な変数を絞りこむことにより、推定困難な地震被害を予測するモデルを構築することにある。
【課題を解決するための手段】
【0009】
上記課題を解決するため、一実施形態に係るモデル構築装置は、地下設備の地震被害の予測モデルを構築するモデル構築装置であって、過去の被害データを入力し、入力した前記過去の被害データを学習用データと評価用データとに分割するデータ取得部と、前記学習用データを機械学習してモデル候補を構築し、前記モデル候補に、前記評価用データを入力して、前記モデル候補の予測精度の評価値を算出し、前記学習用データの不特定の変数を無作為に入れ替えて前記モデル候補に入力することによる、前記評価値の変化を確認し、前記学習用データから最も評価値の変化が小さい変数を削除した変数選択データを生成する学習部と、を備え、前記データ取得部は、前記学習部により前記変数が削除されるたびに、前記変数選択データを新たに学習用データと評価用データとに分割し、前記学習部は、学習用データ内の変数が最後の一つになるまで、前記変数の削除を繰り返し、前記モデル候補のうち、前記評価値が最大となったモデル候補を、最終的な予測モデルとして出力する。
【0010】
上記課題を解決するため、一実施形態に係るモデル構築方法は、地下設備の地震被害の予測モデルを構築するモデル構築方法であって、モデル構築装置により、過去の被害データを入力し、入力した前記過去の被害データを学習用データと評価用データとに分割するデータ取得ステップと、前記学習用データを機械学習してモデル候補を構築し、前記モデル候補に、前記評価用データを入力して、前記モデル候補の予測精度の評価値を算出し、前記学習用データの不特定の変数を無作為に入れ替えて前記モデル候補に入力することによる、前記評価値の変化を確認し、前記学習用データから最も評価値の変化が小さい変数を削除した変数選択データを生成する学習ステップと、を含み、前記データ取得ステップは、前記変数が削除されるたびに、前記変数選択データを新たに学習用データと評価用データとに分割し、前記学習ステップは、学習用データ内の変数が最後の一つになるまで、前記変数の削除を繰り返し、前記モデル候補のうち、前記評価値が最大となったモデル候補を、最終的な予測モデルとして出力する。
【0011】
上記課題を解決するため、一実施形態に係るプログラムは、コンピュータを、上記モデル構築装置として機能させる。
【発明の効果】
【0012】
本開示によれば、有意な変数を絞りこむことにより、自動的にロバストな地震被害の予測モデルを構築し、精度の良い予測をすることが可能になる。
【図面の簡単な説明】
【0013】
【
図1】一実施形態に係るモデル構築装置の構成例を示すブロック図である。
【
図2】一実施形態に係るモデル構築装置が実行するモデル構築方法の一例を示すフローチャートである。
【
図4A】通信管を対象とした予測モデルの構築例を示す表である。
【
図4B】通信管を対象とした予測モデルの構築例を示すグラフである。
【
図5】モデル構築装置として機能するコンピュータの概略構成を示すブロック図である。
【発明を実施するための形態】
【0014】
以下、本発明を実施するための形態について、図面を参照しながら詳細に説明する。
【0015】
図1は、一実施形態に係るモデル構築装置の構成例を示すブロック図である。
図1に示すモデル構築装置1は、データ取得部11と、学習部12と、予測部13と、を備える。モデル構築装置1は、地下設備の地震被害の予測モデルを構築する。データ取得部11、学習部12、及び予測部13により制御演算回路(コントローラ)が構成される。該制御演算回路は、ASIC(Application Specific Integrated Circuit)、FPGA(Field-Programmable Gate Array)等の専用のハードウェアによって構成されてもよいし、プロセッサによって構成されてもよいし、双方を含んで構成されてもよい。
【0016】
データ取得部11は、過去の被害データ21を入力する。データ取得部11は、入力した過去の被害データ21を学習用データaと評価用データbとに分割する。また、データ取得部11は、後述するように、学習部12が作成したモデル候補F(x)の評価値の変化が最も小さい変数を学習用データaより削除したデータを、全データcとして学習部12より入力する。
【0017】
学習部12は、学習用データaと評価用データbとを入力して、予測モデルF*(x)を構築する。学習部12は、予測モデルF*(x)を予測部13に出力する。学習部12は、予測モデルF*(x)を記憶部に記憶し、該記憶部を介して予測モデルF*(x)を予測部13に出力してもよい。
【0018】
予測部13は、予測対象データ22を、学習部12より構築された予測モデルF*(x)に入力して、予測結果(予測値)23を出力することにより、地震被害の予測を行う。この時、予測対象データ22には予測モデルF*(x)の構築に使用された変数と同じ変数が存在しなければならない。
【0019】
図2は、一実施形態に係るモデル構築装置が実行するモデル構築方法の一例を示すフローチャートである。
図2に示すように、予測モデルを構築する手順をステップS01からS09に分けて詳細に説明する。
<ステップS01>
【0020】
図3は、過去の被害データの構造を示す表である。
図3に示すように、過去の被害データ21は、地下設備の単位ごとに、レコードで分けられており、各レコードは被害有無、地震、設備、地盤の特徴等を表す複数個(以下、説明の便宜上、m個とする。)の変数を有する。変数はどのようなものでもよいが、地震の被害との関係が考えられる変数を全て導入することが望ましい。このm個の変数を有する複数個(以下、説明の便宜上、n個とする。)のレコードに基づいて、最終的な予測モデルF
*(x)の候補(以下、「モデル候補F(x)」という。)が複数構築される。
【0021】
ステップS01では、データ取得部11が、過去の被害データ21を入力し、過去の被害データ21を学習用データaと評価用データbとに分割する。データ取得部11は、m個の変数を有するn個のレコードに分けられている過去の被害データ21を、学習用データaと評価用データbとに分割する。学習用データaとは、後述する機械学習に用いるデータであり、評価用データbとは、機械学習により構築したモデル候補F(x)の精度評価に用いるデータである。
<ステップS02>
【0022】
ステップS02では、学習部12が、機械学習によりモデル候補F(x)を構築する。学習部12は、データ取得部11より学習用データaを入力する。学習部12は、学習用データaを機械学習して、最終的な予測モデルF*(x)の候補となるモデル候補F(x)を複数構築する。学習部12は、学習用データaを教師としてフィットさせるようにモデルを構築する。機械学習とは、コンピュータにデータを読み込ませ、命令などを与えることにより、コンピュータの知能を向上させていく技術をいう。学習部12は、機械学習を行うコンピュータに含まれる。コンピュータが知能を向上させていく過程には、複雑な計算が必要であるため、学習部12には、機械学習用のアルゴリズムが組み込まれている。たとえば、学習部12は、XGboost又はRandom forestを利用した機械学習によりモデル候補F(x)を構築してもよい。XGboost及びRandom forestは、機械学習アルゴリズムである。学習部12は、機械学習アルゴリズムを利用して、学習用データaから反復的に「学習」を行い、最終的な予測モデルF*(x)の候補となるモデル候補F(x)を構築する。
【0023】
XGBoostは、複数の決定木の組み合わせにより、勾配ブースティングと呼ばれる集団学習(アンサンブル学習)を行うモデル構築手法の一種である。決定木とは、条件分岐を木構造で表したモデルであり、根ノードから条件をたどって末端まで到達すると答えが得られるように構成される。集団学習とは、複数の決定木(学習器)を組み合わせて総合的に有用なモデルを構築する学習手法をいう。ブースティングとは、複数の決定木(学習器)を用意して、学習を直列に進めていく方法であり、前のモデルの結果を参考にしながら、次のモデルを構築する。まず、学習用データをもとに1本目の決定木が作成される。1本目の決定木は、すべての学習データを精度よく説明できるものにはならないため、ある程度の誤差が生じる。2本目の決定木は、この誤差を打ち消すように作成される。すなわち、1本目と2本目との決定木の結果を足し合わせれば、精度が上がるように、2本目の決定木が作成される。以降同様に、それまでに作成した決定木全体が生む誤差を打ち消すように新しい決定木が作成される。XGBoostは、木の大きさ等にペナルティを付けた上でモデルを作成するアルゴリズムであり、直列に結合された決定木を用いて集団学習を行うことにより、複雑なモデルを構築することができる。
【0024】
Random forestは、複数の決定木によりバギングと呼ばれる集団学習(アンサンブル学習)を行うモデル構築手法である。バギングとは、複数の決定木(学習器)を並列的に学習させていく方法であり、多数決又は平均による予測結果を出力する。
<ステップS03>
【0025】
ステップS03では、学習部12が、モデル候補F(x)の評価値を算出する。学習部12は、構築したモデル候補F(x)に、評価用データbを入力することにより、モデル候補F(x)の予測精度を評価する評価値を算出する。評価値は、予測結果の評価指標である。この時、評価用データbには、モデル候補F(x)の構築に使用された学習用データaと同じ変数が存在しなければならない。学習部12は、ROC-AUC又はF score(F値)を利用して評価値を算出してもよい。
【0026】
ROC(Receiver Operating Characteristic Curve)は推測曲線と呼ばれ、縦軸にTPR(True Positive Rate)、横軸にFPR(False Positive Rate)の割合をプロットしたものであり、AUC(Area Under the Curve) はその曲線の下部分の面積のことである。AUCは0から1までの値をとり、値が1に近いほど、すなわち、AUCの面積が大きいほど、一般的に機械学習の性能が良い事を意味する。
【0027】
F score(F値)とは、適合率と再現率の調和平均をいう。機械学習の評価指標である適合率は、正と予測したデータのうち、実際に正であるものの割合である。同じく評価指標である、再現率は、実際に正であるもののうち、正であると予測されたものの割合である。しかし、機械学習の評価指標である適合率と再現率とはトレードオフの関係にある。このため、F socoreは、以下の式(1)により、適合率(Precision)と、再現率(Recall)との調和平均として求められ、0~1の間の数値で出力される。F score(F値)が0の場合は最も悪い評価を、1の場合は最も良い評価を下す。
F score = 2 * (precision * recall) / (precision + recall) (1)
<ステップS04>
【0028】
ステップS04では、学習部12が、モデル候補F(x)及び評価値を紐づけて一時記憶する。学習部12は、モデル候補F(x)が構築されてその評価値が算出される度に、モデル候補F(x)と、そのモデル候補F(x)の評価値とを、紐づけて一時記憶する。後述するように、学習部12は、一時記憶されている、モデル候補F(x)と評価値が紐づけられた複数のデータの中から、最終的な予測モデルF*(x)を選択する。
<ステップS05>
【0029】
次に、学習部12は、元の学習用データaに対して各変数の重要度を比較する。ステップS05では、学習部12が、学習用データaの不特定の変数を無作為に入れ替えてモデル候補F(x)に入力することによる、モデル候補F(x)の評価値の変化を確認する。学習部12は、Permutation Importance又はfeature importanceを利用して評価値の変化による各変数の重要度の比較を行ってもよい。Permutation Importance及びfeature importanceは、特徴量(変数)の重要度を計算する解釈手法である。
【0030】
feature importanceは、決定木を作成する際に分岐によってモデルがどの程度改善したかを評価した値を用いて特徴量の重要度を数値化したものである。Permutation Importanceは、学習済みのモデルを用いて、ある特徴量(変数)をシャッフルして予測を行なった場合に、どれだけ性能が悪化するかにより、特徴量(変数)の重要度を計算する解釈手法である。Permutation Importanceは、すべての変数を利用して計算されたスコアと、ある変数だけをランダムにシャッフルして計算されたスコアとから、スコアの減少率を計算し、スコアの減少率が大きい変数ほど重要な変数であり、減少率が小さい変数ほど重要な変数ではない、と判断する。
<ステップS06>
【0031】
ステップS06では、学習部12が、学習用データaから最も評価値の変化が小さい変数を削除した変数選択データcを生成する。同率で最小の変数が複数ある場合は、同時に該複数の変数すべてが削除されたデータを変数選択データcとする。
<ステップS07>
【0032】
ステップS07では、学習部12が、学習用データa内の変数が最後の一つになるまで、変数の削除を繰り返し、変数選択データcを、データ取得部11に入力する。データ取得部11は、学習部12により変数が削除されるたびに、変数選択データcを学習用データaと評価用データbとに分割し(ステップS01)、学習部12は、モデル候補F(x)を構築し(ステップS02)、そのモデル候補F(x)の評価値を算出し(ステップS03)、構築したモデル候補F(x)と、そのモデル候補F(x)の評価値とを紐づけて一時記憶する(ステップS04)、一連の動作を繰り返し行う。
<ステップS08>
【0033】
ステップS08では、学習部12が、学習用データ内の変数がなくなると、一時記憶されている複数のモデル候補のうち、評価値が最大となったモデル候補F(x)を最終的な予測モデルF*(x)と認定する。
<ステップS09>
【0034】
ステップS09では、学習部12が、上記の最終的な予測モデルF*(x)を予測部13に出力する。
(地震被害の予測)
【0035】
以降、上述したように、予測部13は、予測対象データ22を、学習部12より取得した予測モデルF*(x)に入力して、予測結果(予測値)23を出力することにより、地震被害の予測を行う。この時、予測対象データ22には予測モデルF*(x)の構築に使用された変数と同じ変数が存在しなければならない。
【0036】
図4Aは、通信管を対象とした予測モデルF
*(x)の構築例を示す表である。
図4Bは、通信管を対象とした予測モデルF
*(x)の構築例を示すグラフである。
図4Bは、
図4Aの結果をグラフで表したものである。
図4Aで、「no」は、変数を削除した回数を示す番号であり、「no.0」は、変数削除前のモデル候補F(x)の評価値及び利用した変数を、「no.1」は、変数を1回削除したモデル候補F(x)の評価値及び利用した変数を示している。たとえば、「no.0」は、平均傾斜角度、平均標高、基本固有周期、平均S波速度、設備建設からの経過年数、設備(管路)亘長、等価卓越周期、計測震度、最大速度、最大加速度、SI(Spectral Intensity)値、換算変位、及び地盤ひずみの合計13個の変数を有するが、「no.1」では、平均傾斜角度、平均標高、基本固有周期、及び地盤ひずみの合計4個の変数が「no.0」から削除されている。
図4A及び
図4Bは、学習用データa内の変数が最後の一つになるまで、評価値の変化が最も小さい変数を繰り返し学習用データaより削除して評価値の算出を行った結果、変数を8回削除した「no.8」の評価指標であるFscoreが0.197と最も高いことを示している。このことから、13個の変数のうち、有意な変数は平均S波速度、及び換算変位であることが分かる。したがって、評価値が最も高い「no.8」のモデル候補F(x)は、最終的な予測モデルF
*(x)と認定される。
【0037】
本実施形態に係るモデル構築装置1によれば、上述したように、学習用データ内の変数が最後の一つになるまで、最も評価値の変化が小さい変数の削除を繰り返すことにより、すなわち有意な変数を絞りこむことにより、自動的にロバストな地震被害の予測モデルを構築し、精度の良い予測をすることが可能になる。
【0038】
上記のモデル構築装置1を機能させるために、プログラム命令を実行可能なコンピュータを用いることも可能である。
図5は、モデル構築装置として機能するコンピュータの概略構成を示すブロック図である。ここで、モデル構築装置1として機能するコンピュータは、汎用コンピュータ、専用コンピュータ、ワークステーション、PC(Personal Computer)、電子ノートパッド等であってもよい。プログラム命令は、必要なタスクを実行するためのプログラムコード、コードセグメント等であってもよい。
【0039】
図5に示すように、コンピュータ100は、プロセッサ110と、記憶部としてROM(Read Only Memory)120、RAM(Random Access Memory)130、及びストレージ140と、入力部150と、出力部160と、通信インターフェース(I/F)170と、を備える。各構成は、バス180を介して相互に通信可能に接続されている。
【0040】
ROM120は、各種プログラム及び各種データを保存する。RAM130は、作業領域として一時的にプログラム又はデータを記憶する。ストレージ140は、HDD(Hard Disk Drive)又はSSD(Solid State Drive)により構成され、オペレーティングシステムを含む各種プログラム及び各種データを保存する。本開示では、ROM120又はストレージ140に、本開示に係るプログラムが保存されている。
【0041】
プロセッサ110は、具体的にはCPU(Central Processing Unit)、MPU(Micro Processing Unit)、GPU(Graphics Processing Unit)、DSP(Digital Signal Processor)、SoC(System on a Chip)等であり、同種又は異種の複数のプロセッサにより構成されてもよい。プロセッサ110は、ROM120又はストレージ140からプログラムを読み出し、RAM130を作業領域としてプログラムを実行することで、上記各構成の制御及び各種の演算処理を行う。なお、これらの処理内容の少なくとも一部をハードウェアで実現することとしてもよい。
【0042】
プログラムは、モデル構築装置1が読み取り可能な記録媒体に記録されていてもよい。このような記録媒体を用いれば、モデル構築装置1にインストールすることが可能である。ここで、プログラムが記録された記録媒体は、非一過性(non-transitory)の記録媒体であってもよい。非一過性の記録媒体は、特に限定されるものではないが、例えば、CD-ROM、DVD-ROM、USB(Universal Serial Bus)メモリ等であってもよい。また、このプログラムは、ネットワークを介して外部装置からダウンロードされる形態としてもよい。
【0043】
上述の実施形態は代表的な例として説明したが、本開示の趣旨及び範囲内で、多くの変更及び置換ができることは当業者に明らかである。したがって、本発明は、上述の実施形態によって制限するものと解するべきではなく、特許請求の範囲から逸脱することなく、種々の変形又は変更が可能である。
【符号の説明】
【0044】
1 モデル構築装置
11 データ取得部
12 学習部
13 予測部
21 過去の被害データ
22 予測対象データ
23 予測結果(予測値)