IP Force 特許公報掲載プロジェクト 2022.1.31 β版

知財求人 - 知財ポータルサイト「IP Force」

▶ 西松建設株式会社の特許一覧 ▶ 大裕株式会社の特許一覧 ▶ 国立大学法人大阪大学の特許一覧

<>
  • 特開-情報処理システムおよびプログラム 図1
  • 特開-情報処理システムおよびプログラム 図2
  • 特開-情報処理システムおよびプログラム 図3
  • 特開-情報処理システムおよびプログラム 図4
  • 特開-情報処理システムおよびプログラム 図5
  • 特開-情報処理システムおよびプログラム 図6
  • 特開-情報処理システムおよびプログラム 図7
  • 特開-情報処理システムおよびプログラム 図8
  • 特開-情報処理システムおよびプログラム 図9
< >
(19)【発行国】日本国特許庁(JP)
(12)【公報種別】公開特許公報(A)
(11)【公開番号】P2024070098
(43)【公開日】2024-05-22
(54)【発明の名称】情報処理システムおよびプログラム
(51)【国際特許分類】
   E21D 9/093 20060101AFI20240515BHJP
【FI】
E21D9/093 C
E21D9/093 G
E21D9/093 D
【審査請求】未請求
【請求項の数】8
【出願形態】OL
(21)【出願番号】P 2022180483
(22)【出願日】2022-11-10
(71)【出願人】
【識別番号】000195971
【氏名又は名称】西松建設株式会社
(71)【出願人】
【識別番号】391015236
【氏名又は名称】大裕株式会社
(71)【出願人】
【識別番号】504176911
【氏名又は名称】国立大学法人大阪大学
(74)【代理人】
【識別番号】110000420
【氏名又は名称】弁理士法人MIP
(72)【発明者】
【氏名】平野 享
(72)【発明者】
【氏名】片山 雄介
(72)【発明者】
【氏名】鷲尾 隆
【テーマコード(参考)】
2D054
【Fターム(参考)】
2D054AA01
2D054AA02
2D054AC01
2D054AD02
2D054BA03
2D054GA02
2D054GA04
2D054GA17
2D054GA25
2D054GA62
(57)【要約】
【課題】 掘削機械の挙動のシミュレーションが実用上で可能となるシステム、方法およびプログラムを提供すること。
【解決手段】 情報処理システム30は、掘削機械の挙動を再現するシステムであり、掘削機械の制御に使用する学習済みモデルから出力された制御情報と、調整可能なパラメータとを用いて、制御情報により制御した場合の掘削機械の動作結果を予測する予測部40と、実際に制御情報により制御した場合の掘削機械の動作結果を取得する取得部41と、取得された動作情報に基づき、予測された動作結果を検証する検証部42と、検証結果に応じて、パラメータを調整する調整部43とを含む。
【選択図】 図5
【特許請求の範囲】
【請求項1】
掘削機械の挙動を再現する情報処理システムであって、
前記掘削機械の制御に使用する学習済みモデルから出力された制御情報と、調整可能なパラメータとを用いて、前記制御情報により制御した場合の前記掘削機械の動作結果を予測する予測手段と、
実際に前記制御情報により制御した場合の前記掘削機械の動作結果を取得する取得手段と、
取得された前記動作結果に基づき、予測された前記動作結果を検証する検証手段と、
検証結果に応じて、前記パラメータを調整する調整手段と
を含む、情報処理システム。
【請求項2】
前記検証手段は、取得された前記動作結果である観測値と、予測された前記動作結果である予測値との差分が、閾値以上であるか否かにより、前記予測手段の妥当性を判定する、請求項1に記載の情報処理システム。
【請求項3】
前記予測手段は、時間変化する前記制御情報を変数とし、時間変化する前記パラメータを係数とした数式を用い、前記予測値を算出する、請求項2に記載の情報処理システム。
【請求項4】
前記調整手段は、前記検証結果として前記予測手段が妥当でないと判定された場合に、前記パラメータを調整する、請求項2または3に記載の情報処理システム。
【請求項5】
前記調整手段は、前記パラメータをサンプリングする確率分布を修正し、修正した前記確率分布から再度サンプリングすることにより前記パラメータを調整する、請求項4に記載の情報処理システム。
【請求項6】
前記検証手段により前記予測手段が妥当であると判定されるまで、前記調整手段による前記パラメータの調整、前記予測手段による前記予測値の算出、前記取得手段による前記掘削機械の動作結果の取得を繰り返す、請求項5に記載の情報処理システム。
【請求項7】
教師情報を用いて前記掘削機械の制御に使用する学習モデルを学習する学習手段と、
学習された学習モデルである前記学習済みモデルにテストデータを適用して、前記学習済みモデルが所定の汎化性能を有するか否かを判定する判定手段と、
前記所定の汎化性能を有すると判定された場合に、前記学習済みモデルを使用して前記制御情報の予測を実行する予測実行手段と、
前記学習済みモデルから出力された前記制御情報による制御の結果が許容範囲内か否かを判定することにより、前記結果を評価する評価手段と
をさらに含む、請求項1に記載の情報処理システム。
【請求項8】
掘削機械の挙動を再現する処理をコンピュータに実行させるためのプログラムであって、
前記掘削機械の制御に使用する学習済みモデルから出力された制御情報と、調整可能なパラメータとを用いて、前記制御情報により制御した場合の前記掘削機械の動作結果を予測するステップと、
実際に前記制御情報により制御した場合の前記掘削機械の動作結果を取得するステップと、
取得された前記動作結果に基づき、予測された前記動作結果を検証するステップと、
検証結果に応じて、前記パラメータを調整するステップと、
前記学習済みモデルから出力された制御情報と、調整された前記パラメータとを用いて、前記掘削機械の動作結果を再度予測するステップと
を実行させる、プログラム。
【発明の詳細な説明】
【技術分野】
【0001】
本発明は、掘削機械の挙動を再現する情報処理システムおよびその再現する処理をコンピュータに実行させるためのプログラムに関する。
【背景技術】
【0002】
シールドマシン(以下、単にシールドと呼ぶ。)等の掘削機械の制御を機械学習で学習した学習済みモデルを使用して自動化する技術が知られている(例えば、特許文献1参照)シールドの掘削制御を学習済みモデルで実行する場合、学習済みモデルに入力するデータに異常値や欠損値があると、工事の安全性や品質が低下する。そこで、上記の技術では、予測失敗リスク評価の基準として、各計測値の全てが、学習モデルを学習する際に用いた教師データにおける計測値の学習データ範囲内にあるか(内挿状態であるか)を判定し、評価が合格の場合のみ、シールドの操作の制御データの設定値を、学習済みモデルを使用して推定している。
【0003】
学習モデルを学習させる際、計測値が指示された値から乖離するデータを教師データとして使用すると、正しい推定を行わせるための学習が行えず、学習モデルが計測値に対応した適切な操作の設定値を推定しない場合がある。
【0004】
そこで、掘削状況を測定した状況測定データと掘削の目標である指示値との乖離度合に基づき、操作実績データと状況測定データとを含む判定対象データを、掘削機械の操作の設定値を推定する学習モデルの学習データとするか否かを判定する技術が提案されている(例えば、特許文献2参照)。
【先行技術文献】
【特許文献】
【0005】
【特許文献1】特開2019-143388号公報
【特許文献2】特開2019-143389号公報
【発明の概要】
【発明が解決しようとする課題】
【0006】
上記の従来の2つの技術を組み合わせることにより、シールドの掘削制御を、学習済みモデルを使用して自動化する場合の妥当性と精度を向上させることができる。
【0007】
現実の掘削工事では、線形や地質等の条件が工事途中で大きく変わることが事例として多く、工事毎に掘削機械の仕様も異なる。このため、一企業で収集できる教師データは、多様な背景を持ったデータとなる。このような教師データでは、学習モデルの汎化性能を高める目途が立たず、予測失敗リスク評価において不合格が多い状態となってしまう。
【0008】
予測失敗リスクを管理するためには、学習済みモデルの出力を実機入力したケースでのシミュレーションが必要である。しかしながら、これまでの理論的にシールド挙動を再現するシミュレータは、複雑で多数の未知のパラメータを包含するモデルになることから、複雑すぎて現実的ではなく、実用化には至っていない。
【課題を解決するための手段】
【0009】
本発明は、上記課題に鑑みてなされたものであり、掘削機械の挙動を再現する情報処理システムであって、
掘削機械の制御に使用する学習済みモデルから出力された制御情報と、調整可能なパラメータとを用いて、制御情報により制御した場合の掘削機械の動作結果を予測する予測手段と、
実際に制御情報により制御した場合の掘削機械の動作結果を取得する取得手段と、
取得された動作情報に基づき、予測された動作結果を検証する検証手段と、
検証結果に応じて、パラメータを調整する調整手段と
を含む、情報処理システムが提供される。
【発明の効果】
【0010】
本発明によれば、掘削機械の挙動のシミュレーションが実用上で可能となる。
【図面の簡単な説明】
【0011】
図1】掘削機械の一例としてシールドの構成例を示した図。
図2】シールドが急曲線を曲がる様子を例示した図。
図3】データ同化について説明する図。
図4】情報処理システムのハードウェア構成の一例を示した図。
図5】情報処理システムの機能構成の一例を示した機能ブロック図。
図6】シールドの掘削制御の一例を示したフローチャート。
図7】シールドの動作結果を推定する処理の一例を示したフローチャート。
図8】シミュレーションに関わる変数をまとめた表。
図9】確率分布の一例を示した図。
【発明を実施するための形態】
【0012】
図1は、掘削機械の一例としてシールドの構成例を示した図である。掘削機械は、土砂や岩石、地山等を掘削する機械であり、トンネル全断面を掘削対象とするものでは、シールド、トンネルボーリングマシン、自由断面掘削機等がある。掘削機械は、トンネル全断面を掘削できる機械であればいかなる機械であってもよいが、以下、掘削機械をシールドとして説明する。
【0013】
シールド10は、前方の土砂を削り、崩壊しようとする掘削面を押さえながら、削り取った量とバランスする量の掘削土砂を坑外へ排出して前進するトンネル掘削機械である。シールド後方では、セグメントと呼ばれるトンネル覆工ブロックをリング状に組立て、トンネル構造を完成させる。
【0014】
シールド10は、前方の土砂を削るため、その先端には、回転可能な略円形の面板に円筒状または放射状に配列する複数の切削用のビットを備えたカッターヘッド11を有する。また、シールド10は、シールドジャッキ12を備え、組み立てられたセグメント13にシールドジャッキ12を押し当て、シールドジャッキ12を伸ばすことにより前進する。シールドジャッキ12は、シールド10を構成する鋼製の外筒であるスキンプレート14の内周に沿って所定の間隔で複数配置されている。
【0015】
錯綜した都市地下空間の開発では、三次元的な急曲線を掘削することが要求される。このため、シールド10は、急曲線に対応可能なように、スキンプレート14が前胴14aと後胴14bとの2つに分割され、前胴14aと後胴14bとをヒンジで連結した中間折れ曲がりを可能とする中折れジャッキ15等の中折れ機構を備えている。中折れジャッキ15も、シールドジャッキ12と同様、スキンプレート14の前胴14aの内周に沿って所定の間隔で複数配置されている。
【0016】
シールド10は、カッターヘッド11の直ぐ後部に、掘削面を押さえる土圧や水圧をかけながら掘削土砂を排出可能に塑性流動化させるための撹拌室として、チャンバー16を備える。チャンバー16内の掘削土砂は、スクリューコンベア17で取り出され、ベルトコンベア18で坑外に搬出し、排出土として処分される。
【0017】
シールド10は、後胴14b内でセグメント13を組み立てるためのエレクター19を備える。エレクター19は、セグメント13を把持し、所定の位置まで搬送して設置する。また、シールド10は、セグメント13の背部(セグメント13と掘削したトンネル壁面との間)に注入材を注入する裏込め注入装置20を備える。
【0018】
シールド10は、シールドジャッキ12を伸ばすことにより前進する。また、シールド10、スキンプレート14の内周に沿って複数配置される各シールドジャッキ12を伸ばす長さ(ストローク)を変え、また、必要に応じて、スキンプレート14の内周に沿って複数配置される各中折れジャッキ15のストロークを変えることにより、所定の方角へ向けて曲がるように前進する。前進する方角は、水平方向の方位、水平方向に対する鉛直方向の角度(ピッチング)に向けた方向である。
【0019】
図2は、中折れ機構を有するシールドが急曲線を曲がる様子を例示した図である。中折れジャッキ15により中折れした場合の、前胴14aの断面の中心を通る中心線と、後胴14bの断面の中心を通る中心線とにより成す角を、中折れ角αとする。中折れジャッキ15によりシールド10が急曲線を曲がる場合、後胴14bの面向きと、中折れ角αとを操作し、シールド10と計画線との偏差が小さくなる掘進方向に沿って進むように、シールド10の姿勢を調整しながら曲がっていく。
【0020】
急曲線を曲がる場合、例えば、バスやトラックでは内輪差や回転中心からのオーバーハングを許容する車幅以上の空間が必要である。シールド10も、カーブするために直線部の掘削径から拡大した同様の空間が必要になるが、その空間を自ら余分に掘削して生み出さない限り、カーブすることができない。
【0021】
そこで、シールド10の前胴14aに設けられたカッターヘッド11の側方に、トンネルの径方向へ突出可能な突出部として、コピーカッタ21が設けられる。コピーカッタ21は、シールド10がカーブできる空間を作成するための装置である。
【0022】
シールド10が急曲線で曲がる場合、急曲線の内側の中折れジャッキ15を縮め、外側の中折れジャッキ15を伸ばすジャッキ操作を行い、略への字形の屈曲姿勢でカーブする。そのためには、シールド10の姿勢が取り得る空間を先読みし、コピーカッタ21がその位置にあるタイミングで掘削(余掘り)しておく必要がある。
【0023】
余掘りした空間は、空洞とはせず、適度な塑性流動性をもつ改良剤で掘削直後から充填する。空洞のままでは掘削壁の崩壊の危険性があり、シールド10が掘削壁からの反力と摩擦を適度に受けることが難しくなり、シールド10の運転が困難になるからである。
【0024】
コピーカッタ21の出入りの制御は、カッターヘッド11の回転角に対応して連続的に行われる。この制御は、例えば、予め設定しておいた円周角に対するコピーカッタ21の突出長の関係を示す式等を用いて実施することができる。
【0025】
このようなシールド10の掘削制御は、手動で行うこともできるが、近年では、機械学習の学習済みモデルを使用して自動で行うことができる。機械学習におけるモデルは、シールド10の挙動を監視する監視項目の計測値(観測値)を入力データとし、シールド10の掘削制御に用いる制御情報を出力する。モデルは、このような入力データから制御情報を予測するために、人為制御にて取得した入力データと制御情報との対である教師データが与えられ、学習される。
【0026】
機械学習の本質は、教師データにより学習した範囲内で予測(内挿予測)することである。したがって、学習されたモデル(学習済みモデル)は、学習した範囲外で利用(外挿利用)してはならない。意図せぬ外挿は、予測失敗リスクとなるからである。
【0027】
一企業で収集される教師データは、シールド10の仕様が掘削する対象の地盤によって異なり、工事途中でも線形や地質等の条件が大きく変わることが事例として多いことから、多様な背景をもつデータとなる。例えば、同じ山を掘削する場合でも、途中に大きな岩があったり、地下水が通っていたりするため、地質等の条件が大きく変動する。
【0028】
学習済みモデルは、入力データからパターンや傾向を見つけ出し、未知のデータに対して予測を行うものである。シールド10を人為制御して収集される教師データは、地質等の条件が大きく変動するデータであるから、その教師データを使用して学習モデルを学習させたとしても網羅すべきパターンや傾向の例示が不十分で、十分な学習結果に収束せず、未知のデータに対応することができない。このため、未知のデータに対応する能力である汎化能力を高める目途が立たない事態に直面する。
【0029】
このため、常に教師データが不足しがちで、予測失敗リスク評価において不合格が多い状態になり、せっかくの学習モデルが掘削制御に生かされない。学習モデルを生かそうとすると、修正のための追加学習を繰り返さなければならず、生産性が悪い状況になる。
【0030】
予測失敗リスクを管理するには、学習済みモデルの出力を実際にシールド10に入力し、操作した場合にどうなるかを試すためのシミュレーションが必要である。シミュレーションには、既往の知見に基づく自然法則や経験則を数式で記述し、仮想操作に対して実機を模倣した応答を返すように構築した装置やプログラムとして、シミュレータが使用される。
【0031】
なお、利用可能な知見には限りがあるので、実現象すべてを再現するシミュレータを作ることはできない。そこで、従来においては、着目現象がリアルに再現できていれば、そのシミュレータは、実用的なシミュレータとしている。例えば、操縦桿の操作により、機首上げまたは機首下げし、機体の傾きを変化させることができるフライトシミュレータが実用的なシミュレータとして知られている。
【0032】
シールド10では、未知の急曲線を掘削する場合の事前評価としてシミュレータの需要がある。シールド10の挙動をシミュレーションするには、その挙動に似た状況を数学的なモデル等を使用して作り出す必要があるが、そのモデルは、周囲の地盤との摩擦や圧力等の相互作用による寄与が支配的で、未知要素の多い地盤を構成物とすることから、複雑で多数の未知パラメータを包含するモデルとなる。複雑で多数の未知パラメータを包含するモデルは、扱いにくく、再現することが困難であることから、現在においても実用化には至っていない。
【0033】
そこで、多数の未知パラメータを包含するモデルを再現することはあきらめて、その代替として、調整可能なパラメータを導入し、シミュレーションして再現できない場合、パラメータを調整して実際の観測結果に合わせていく、同化シミュレーションと呼ばれる手法を採用する。
【0034】
ここで、図3を参照して、同化の概念について説明する。横軸に経過時間をとり、縦軸にシミュレーションにより予測した予測値や実機を動作させて得られる観測値等の値をとり、未知の真の状態を点線で示す。真の状態を概略で再現したシミュレータを用意し、二重丸で示される初期値(a)からシミュレーションを行うと、実線で示すような予測が得られ、経過時間tのときの白丸で示される予測値(b)は、黒丸で示される観測値(c)から大きく乖離する結果になったとする。なお、観測値(c)も、破線で示される真の状態からずれているが、これは観測誤差によるものである。
【0035】
経過時間tのときの予測における予測値(b)を基に、シミュレーションを続けると、観測値からさらに大きく乖離する結果になると予測される。そこで、経過時間tにおける観測値(c)を踏まえたパラメータ調整を行い、経過時間tにおける乖離を軽減するようにシミュレータのモデルを修正し、修正したモデルを取得、すなわちデータ同化を実施する。データ同化を実施すると、予測値(b)が、二重丸で示される解析値(d)に修正され、解析値(d)から白丸で示す予測値(e)への実線で示す結果となり、破線で示す真の状態に近くなる。
【0036】
シールド10の掘削制御に使用する学習モデルは、汎化性能を高める目途が立たないことから、ある程度の汎化性能が得られたところで、その学習済みモデルを掘削制御に投入し、その投入した結果を、上記のデータ同化を取り入れたシミュレーションで検証し、シミュレーション結果が、許容できる結果か否かにより、学習済みモデルを使用した自動掘削制御とするか、人手による人為制御とするかを判定することができる。これにより、学習モデルによる自動掘削制御下での予測失敗リスクを管理することが可能となる。
【0037】
そこで、本発明では、上記のデータ同化を取り入れたシミュレーションを行うことが可能な情報処理システムを提供する。なお、情報処理システムは、シールド10の掘削制御に使用する学習モデルの学習や、学習済みモデルを使用した予測等を実行するものと同じであってもよい。
【0038】
図4は、情報処理システム30のハードウェア構成の一例を示した図である。情報処理システム30は、一般的なコンピュータにより構成することができる。このため、情報処理システム30は、一般的なコンピュータと同様のハードウェア構成を採用することができる。情報処理システム30は、ハードウェアとして、CPU(Central Processing Unit)31、ROM(Read Only Memory)32、RAM(Random Access Memory)33、HDD(Hard Disk Drive)34、外部機器I/F35、入出力I/F36、表示装置37、入力装置38を備える。
【0039】
CPU31は、システム全体を制御し、各種のアプリケーションを実行する。アプリケーションは、上記のシミュレーションを行うシミュレータを含むことができる。ROM32は、システムの起動時のOS(Operating System)の読み込みや周辺機器に対する入出力制御を行うBIOS(Basic Input/Output System)や、HDD34等のシステム内部の回路等の制御を行うファームウェアを格納する。RAM33は、メインメモリとして用いられ、CPU31に対して作業領域を提供する。HDD34は、CPU31が実行する各種のアプリケーションやOS、各種の設定情報、各種のデータ等を記憶する。ここでは、HDD34を使用しているが、これに限定されるものではなく、SSD(Solid State Drive)等の記憶装置であってもよい。
【0040】
外部機器I/F35は、操作盤や各種環境計測装置(センサ)等の外部機器と本システムとを接続し、外部機器との通信を制御する。表示装置37は、液晶ディスプレイや有機EL(Electro Luminescence)ディスプレイ等の情報を表示するための装置である。入力装置38は、キーボードやマウス等の情報の入力、アプリケーション等の選択、アプリケーション実行の指示等を行う装置である。入出力I/F36は、表示装置37への情報の出力および入力装置38からの情報の入力を制御する。この例では、表示装置37と入力装置38が別個の装置として説明したが、これに限られるものではなく、表示装置37と入力装置38の両方の機能を備えたタッチパネルを採用してもよい。
【0041】
情報処理システム30は、その他の回路等を備えていてもよく、例えばインターネット等のネットワークと接続し、ネットワーク上の通信機器との通信を制御する通信I/Fや、Bluetooth(登録商標)等により近距離無線通信を可能にする近距離無線通信回路等を備えていてもよい。
【0042】
情報処理システム30は、1つの装置やプログラムから構成されていてもよいし、2以上の装置やプログラムから構成されていてもよい。
【0043】
図5は、情報処理システム30の機能構成の一例を示した機能ブロック図である。情報処理システム30の各機能は、情報処理システム30が備えるアプリケーション等のプログラムをCPU31が実行することにより実現される。なお、情報処理システム30の各機能の一部または全部は、回路等のハードウェアで構成されていてもよい。
【0044】
情報処理システム30は、機能部として、予測部40と、取得部41と、検証部42と、調整部43とを含む。予測部40は、シールド10の掘削制御に使用する学習済みモデルから出力された制御情報と、調整可能なパラメータとを用いて、制御情報により掘削制御した場合のシールド10の動作結果を予測する。シールド10の動作結果を予測するためにシミュレータが使用される。シミュレータは、調整可能なパラメータを含む数式等の数学的なモデルとして作成される。
【0045】
学習済みモデルは、教師データを用いて学習されたモデルである。教師データは、人が実際に操作したシールド10の操作量等と、その操作の結果を計測した観測値とを対応付けたデータである。操作量等としては、中折れ角α、シールドジャッキ12の推進力、カッターヘッド11の回転トルク、コピーカッタ21のストローク等が挙げられる。観測値としては、シールド10の方位や上下方向の回転角を示すピッチング等が挙げられる。したがって、シールド10の方位やピッチング等を、センサ等を使用して計測し、それを学習済みモデルに入力することで、トンネルの計画線等を考慮し、操作量等を制御情報として出力し、シールド10にその制御情報を設定することにより、シールド10の掘削制御を自動化することができる。
【0046】
学習モデルは、学習により教師データを最良に再現できるように構築されるが、教師データにのみマッチする過学習に陥る可能性がある。過学習は、教師データが少ない場合やモデルが複雑すぎる場合等に生じる。そこで、教師データとは別のテストデータを用意し、学習済みモデルが用意した別のテストデータを再現できているか(モデルの汎化性能)が確認される。
【0047】
取得部41は、実際に制御情報により掘削制御した場合のシールド10の動作結果を取得する。シールド10の動作結果は、上記のセンサ等を使用して計測される観測値である。
【0048】
検証部42は、取得部41により取得された情報、すなわち観測値に基づき、予測部40により予測した動作結果を検証する。予測部40は、学習済みモデルが出力した制御情報を入力とし、シミュレーションを行い、上記のセンサ等で計測される方位等を予測する。検証部42は、予測した動作結果と、観測値とを比較し、その差が閾値以上であるか否かにより、予測した動作結果の妥当性を検証する。
【0049】
調整部43は、検証結果に応じて、パラメータを調整する。検証部42が、予測した動作結果と観測値との差が閾値以上で、予測した結果が妥当でないと判定した場合に、調整部43が、パラメータを調整する。調整されたパラメータは、予測部40がシミュレーションに使用する数学的モデルに設定され、数学的モデルが修正される。
【0050】
上記の取得部41、検証部42、調整部43を含む情報処理システム30は、データ同化の手法を取り入れたシステムであり、同化の特徴である、環境変化や不連続な状況への追従も原理的に可能となる特徴を有している。なお、全く既往の知見が組み込まない極端な場合、同化の特徴の一部が損なわれることになる。しかしながら、着目すべきパラメータを単純に線形結合しただけの数式を用い、シミュレーションを行うことができるので、既往のモデルに比較して扱いやすいという特徴を有している。
【0051】
情報処理システム30は、予測部40、取得部41、検証部42、調整部43のみに限らず、その他の機能部を備えることができる。情報処理システム30は、その他の機能部として、例えば、教師データを用いて学習モデルを学習する学習部、汎化性能を確認する判定部、学習済みモデルを使用して予測を実行する予測実行部等を備えていてもよい。
【0052】
また、情報処理システム30は、その他の機能部として、学習済みモデルから出力された制御情報による制御の結果が許容範囲内か否かを判定することにより、当該結果を評価する評価部をさらに含んでいてもよい。
【0053】
図6は、シールド10の掘削制御の流れを示したフローチャートである。掘削制御を実施する前に、学習モデル、シミュレーションに設定するパラメータ等を準備しておく。シールド10の掘削制御は、ステップ100から開始し、ステップ101では、教師データを取得するために、人為で制御を行う。ステップ102では、教師データを取得し、ステップ103で、取得した教師データを使用し、学習モデルの学習を行う。
【0054】
ステップ104では、教師データとは別に用意したテストデータを使用し、学習モデルの汎化性能を確認する。すなわち、所定の精度で制御情報を予測でき、所定の汎化性能が得られているかを確認する。予測の精度は、いかなる精度であってもよく、任意に決定することができる。汎化性能を確認し、所定の精度で予測できている場合、ステップ105へ進み、予測できていない場合は、再びステップ102へ戻り、学習を繰り返す。
【0055】
ステップ105では、人為で制御し、シールド10に取り付けられたセンサ等により計測した観測値を入力とし、学習済みモデルを使用して制御情報の予測を実行する。ステップ106では、学習済みモデルによる予測を入力としてシミュレーションを行い、必要に応じて予測を補正し、予測または補正した予測を出力する。
【0056】
ステップ107では、出力された予測に基づき、学習済みモデルによる自動掘削制御(予測制御)を行う。ここで予測制御を行い、あり得ない方向に進んだとしても、シールド10の挙動は緩慢であり、修正できる時間が十分にある。このため、ここでは一旦、予測制御を行うようにしている。
【0057】
ステップ108では、予測制御の制御結果を評価する。予測制御の制御結果が、シールド10が計画線に対して許容できる角度で前進していることを示す許容範囲内である場合、ステップ109へ進む。一方、許容範囲外である場合は、ステップ101へ戻り、人為で制御を行い、シールド10が前進する方向の修正等を行う。そして、ステップ102で教師データを取得し、ステップ103で学習モデルを学習し直す。
【0058】
ステップ109では、掘削が終了か否かを判定し、終了する場合、ステップ110へ進み、掘削制御を終了し、終了しない場合、ステップ105へ戻り、次の時間ステップにおける制御情報の予測を行う。
【0059】
図7は、図6に示すステップ106のシミュレーションの一例を示したフローチャートである。ステップ200から開始し、ステップ201で、学習済みモデルの予測を入力とし、シミュレーションを行う。シミュレーションは、調整可能なパラメータを含む数学的モデルに上記の予測を入力して行う。シミュレーションにより、予測した制御情報によりシールド10を仮想的に制御し、動作させた結果が出力される。ステップ202では、実際にシールド10に学習済みモデルが予測した制御情報を設定し、掘削制御した結果を観測値として取得し、取得した観測値と、シミュレーションの結果とを比較する。比較した結果、観測値とシミュレーションの結果との差が、閾値以上であるか否かにより、予測が妥当か否かを判定する。
【0060】
上記の差が閾値以上で、予測が妥当でないと判定された場合、ステップ203へ進み、予測を補正する。すなわち、シミュレーションの結果が観測値に近くなるように、シミュレーションに使用するパラメータを調整して予測を補正する。
【0061】
ステップ202で、予測が妥当と判定した場合、その妥当と判定した予測を出力し、予測が妥当でないと判定した場合は、ステップ203で補正した予測を出力し、ステップ204でシミュレーションを終了する。
【0062】
次に、データ同化について実施例をもって、より詳細に説明する。手順(1)として、シミュレーションに関わる変数として、図8に示す変数を用意する。なお、図8に示した変数は一例であるので、これらの変数の一部のみを用意してもよいし、これら以外の変数を用意してもよいし、これらの変数に加えて、その他の変数も用意してもよい。
【0063】
図8に示す変数は、大きく分けて、シールド10の操作量を示す変数と、操作環境を示す変数と、操作影響を示す変数とに分けられる。制御情報として利用される変数は、操作量を示す変数、操作環境を示す変数であり、センサ等により計測される観測値は、操作影響を示す変数である。
【0064】
シミュレーションに関わる変数を用意した後、手順(2)として、用意した変数間に成立すると仮定する数式を用意する。シールド10のシミュレータでは、理論構築が困難であることから、例えば、下記式1のような架空の数式を用いることができる。なお、下記式1は、ある操作量をある操作環境で加えたときの操作影響を出力する数式である。
【0065】
【数1】
【0066】
数式を用意した後、手順(3)として、シミュレータが、現実の観測結果に追従できるように、自由度を与えるものとして、操作量と操作環境を示す変数に時間変化するパラメータθ、すなわちθX1H~θX10H、θF1H~θF6H、θX1V~θX10V、θF1V~θF6Vの計32個のパラメータを係数として導入する。すると、上記式1は、下記式2のように書き直すことができる。
【0067】
【数2】
【0068】
パラメータを導入した後、手順(4)として、シミュレーションを行う。ある時刻tで、操作影響ΔH(t)、ΔV(t)を与えるとき、以前の時刻t-1、t-2、・・・、2、1において同様にして求めたΔH、ΔVと、操作後の状態の初期値S(0)、S(0)とを用いると、時刻tにおける操作後の状態は、下記式3のように表すことができる。
【0069】
【数3】
【0070】
ここで、シミュレータの出力S(t)を、下記式4のように記述する。
【0071】
【数4】
【0072】
パラメータ調整においてシミュレータの出力と現実に得られる観測値との対比により、シミュレータの現実追従性を評価し、修正していくため、予め現実の観測値に予想される観測誤差wを加えておく。
【0073】
【数5】
【0074】
上記式5中、Y(t)(Yの頂部に^が付く。)が、シミュレータの与える予測観測値である。wには、例えば、平均0で分散νの正規分布からサンプルしたものを与える。
【0075】
シミュレーションの結果、時刻tにおいてパラメータθの調整が必要である場合、手順(5)として、θ調整(シミュレータの現実追従性の評価修正)を行う。シミュレータの与える予測観測値Y(t)(Yの頂部に^が付く。)と、実観測値Y(t)と、これらの原因と考えられる操作量F(t)、操作環境X(t)とをデータセットとして用意する。ここで、まだ一度もθ調整を行っていないときの最初にY(t)を算出するときに用いるθの初期値には、適当な確率分布からサンプリングした値を与える。
【0076】
適当な確率分布p(x)としては、図9に示すような、例えばxの区間が-1~1で同じ1/2の確率に分布する一様分布を与えることができる。なお、これは一例であるので、これに限定されるものではない。
【0077】
データセットを用意した後、θの調整を行う。調整には、同化と呼ばれるシミュレータの最適化技法を用いる。同化については、公知のアルゴリズムが数多くあり、各アルゴリズムの詳細については、ここでは説明を省略する。シールド10のシミュレータにおいては、例えばガウシアンカーネルを用いる手法を適用することができる。
【0078】
同化では、初期状態で満足いかない数式に含まれるθを、満足いく方向に逐次修正する。ここで、θは、確定した特定の数値ではなく、ある確率分布π(θ)からサンプリングされた実現値である。このため、同化における実際に修正すべき対象は、確率分布π(θ)となる。修正前の確率分布を「事前分布」とすると、修正後の確率分布は「事後分布」となる。
【0079】
パラメータ調整では、事後分布からθを再度サンプリングし、上記の手順(3)へ戻り、次の時間ステップt=t+1の計算を行う。これを、満足いくシミュレータになるまで繰り返す。
【0080】
このようにしてパラメータθを調整して予測を補正することができるが、実際の修正すべき対象である確率分布π(θ)の修正状況が、上記の手順(3)~(5)の繰り返しではうまく収束せず、不満な場合があり得る。このような場合、修正過程をトレースして問題を抽出し、同化手順に含まれる経験的なチューニング要素であるハイパーパラメータを調整することで対応することができる。
【0081】
以上に説明してきたように、シールドの掘削制御のような、十分な教師データを用意し難いケースでも、ある程度学習した学習モデルを使用することで、シミュレーションにより予測の妥当性を検証することができ、予測失敗リスクの管理が可能となって、学習済みモデルによる掘削制御の適用範囲を広げることができる。また、同化手法の適用により、こまで複雑で多数の未知パラメータを包含することから困難とされてきたシールドのシミュレーションが実用上で可能となる。
【0082】
本システムは、学習済みモデルのテスト用のシミュレータとしてだけではなく、例えばシールドを人為的に操作する場合の最適操作の探索や、操作した結果の事前評価ツールとして利用することも可能である。
【0083】
これまで本発明のシミュレーション・システム、方法およびプログラムについて図面に示した実施形態を参照しながら詳細に説明してきたが、本発明は、上述した実施形態に限定されるものではなく、他の実施形態や、追加、変更、削除など、当業者が想到することができる範囲内で変更することができ、いずれの態様においても本発明の作用・効果を奏する限り、本発明の範囲に含まれるものである。
【符号の説明】
【0084】
10…シールド
11…カッターヘッド
12…シールドジャッキ
13…セグメント
14…スキンプレート
14a…前胴
14b…後胴
15…中折れジャッキ
16…チャンバー
17…スクリューコンベア
18…ベルトコンベア
19…エレクター
20…裏込め注入装置
21…コピーカッタ
30…情報処理システム
31…CPU
32…ROM
33…RAM
34…HDD
35…外部機器I/F
36…入出力I/F
37…表示装置
38…入力装置
40…予測部
41…取得部
42…検証部
43…調整部
図1
図2
図3
図4
図5
図6
図7
図8
図9