(19)【発行国】日本国特許庁(JP)
(12)【公報種別】特許公報(B2)
(11)【特許番号】
(24)【登録日】2025-04-07
(45)【発行日】2025-04-15
(54)【発明の名称】学習データ作成システム、学習データ作成方法及び学習データ作成プログラム
(51)【国際特許分類】
G06N 20/00 20190101AFI20250408BHJP
【FI】
G06N20/00 130
(21)【出願番号】P 2021071322
(22)【出願日】2021-04-20
【審査請求日】2024-03-07
(73)【特許権者】
【識別番号】000000549
【氏名又は名称】株式会社大林組
(74)【代理人】
【識別番号】100105957
【氏名又は名称】恩田 誠
(74)【代理人】
【識別番号】100068755
【氏名又は名称】恩田 博宣
(72)【発明者】
【氏名】相賀 洋
【審査官】真木 健彦
(56)【参考文献】
【文献】特開2021-022275(JP,A)
【文献】特開2019-159864(JP,A)
【文献】特開2019-160016(JP,A)
【文献】特開2021-039534(JP,A)
【文献】特開2019-168796(JP,A)
(58)【調査した分野】(Int.Cl.,DB名)
G06N 20/00
(57)【特許請求の範囲】
【請求項1】
各因子の水準を設定したシミュレーション実験に用いる因子と水準とからなる実験条件を記録する実験情報記憶部と、
機械学習に用いる学習データを記録する学習情報記憶部と、学習データを作成する制御部と、を備えた学習データ作成システムであって、
前記制御部が、
実験計画法を用いて、前記因子と前記水準とからなる複数の実験条件で構成された直交表を作成し、
前記直交表において、連続する先行実験条件及び後続実験条件の水準
を比較して、水準が異なる相違因子を特定し、前記相違因子について、前記先行実験条件の水準を順次変更して、前記後続実験条件に近づけた新たな実験条件を生成して前記実験情報記憶部に記録し、
前記実験情報記憶部に記録された各実験条件を用いた
シミュレーション実験
の実験結果を含めた学習データを生成して前記学習情報記憶部に記録することを特徴とする学習データ作成システム。
【請求項2】
前記制御部が、
前記学習情報記憶部に記録された学習データを用いた機械学習により生成された予測モデルの精度を評価した評価指標を取得し、
前記評価指標に基づいて、前記新たな実験条件の生成の要否を判定することを特徴とする請求項
1に記載の学習データ作成システム。
【請求項3】
各因子の水準を設定したシミュレーション実験に用いる因子と水準とからなる実験条件を記録する実験情報記憶部と、
機械学習に用いる学習データを記録する学習情報記憶部と、制御部と、を備えた学習データ作成システムを用いて、学習データを作成する方法であって、
前記制御部が、
実験計画法を用いて、前記因子と前記水準とからなる複数の実験条件で構成された直交表を作成し、
前記直交表において、連続する先行実験条件及び後続実験条件の水準
を比較して、水準が異なる相違因子を特定し、前記相違因子について、前記先行実験条件の水準を順次変更して、前記後続実験条件に近づけた新たな実験条件を生成して前記実験情報記憶部に記録し、
前記実験情報記憶部に記録された各実験条件を用いた
シミュレーション実験
の実験結果を含めた学習データを生成して前記学習情報記憶部に記録することを特徴とする学習データ作成方法。
【請求項4】
各因子の水準を設定したシミュレーション実験に用いる因子と水準とからなる実験条件を記録する実験情報記憶部と、
機械学習に用いる学習データを記録する学習情報記憶部と、制御部と、を備えた学習データ作成システムを用いて、学習データを作成するプログラムであって、
前記制御部を、
実験計画法を用いて、前記因子と前記水準とからなる複数の実験条件で構成された直交表を作成し、
前記直交表において、連続する先行実験条件及び後続実験条件の水準
を比較して、水準が異なる相違因子を特定し、前記相違因子について、前記先行実験条件の水準を順次変更して、前記後続実験条件に近づけた新たな実験条件を生成して前記実験情報記憶部に記録し、
前記実験情報記憶部に記録された各実験条件を用いた
シミュレーション実験
の実験結果を含めた学習データを生成して前記学習情報記憶部に記録する手段として機能させることを特徴とする学習データ作成プログラム。
【発明の詳細な説明】
【技術分野】
【0001】
本発明は、解析に用いる学習データを生成するための学習データ作成システム、学習データ作成方法及び学習データ作成プログラムに関する。
【背景技術】
【0002】
コンピュータを用いて各種解析手法が検討されている(例えば、特許文献1参照。)。特許文献1に記載された技術では、空間を仕切る区画材を通過する熱量を計算する熱負荷計算装置が検討されている。この熱負荷計算装置では、設計データを用いて要素モデルの面積を算出し、面積を利用して区画材要素モデルごとに貫流熱量を算出する。
【0003】
また、解析手法において機械学習を用いる場合、機械学習に用いる教師データの生成を効率化するための技術も検討されている(例えば、特許文献2参照。)。特許文献2に記載された教師データ生成システムは、複数の分類対象のクラスタリングを行ない、解析者に対して、クラスタに属する一部の分類対象の内容を提示する。そして、クラスタについて、解析者により指定されたラベルに基づいて、学習モデルに学習させる教師データを生成する。
【0004】
また、寄与度が大きい説明変数を算出するための解析処理において、実験計画法の直交表を用いた学習データを利用する場合もある(例えば、特許文献3参照。)。この直交表は、どの2列をとっても、その水準のすべての組み合わせが同数回現れる配列表である。この性質を使って、実験計画法において因子と水準の割り付けに用いられる。
【先行技術文献】
【特許文献】
【0005】
【文献】特開2021-43074号公報
【文献】特開2021-56591号公報
【文献】特開2016-031629号公報
【発明の概要】
【発明が解決しようとする課題】
【0006】
実験計画法を用いた解析では、まず、実験のための因子と水準を決定する。そして、直交表による実験の割付けを行なう。次に、直交表により実験を行ない、実験結果から学習データを作成する。そして、学習データを用いた機械学習により、予測モデルを作成する。
【0007】
しかしながら、実験計画法は、元来、実験の回数を少なくして、効率的な実験を行なうことが目的である。このため、実験計画法による学習データだけでは、逆に十分な機械学習に必要な学習データが得られない場合がある。
【課題を解決するための手段】
【0008】
上記課題を解決する学習データ作成システムは、実験に用いる因子と水準とからなる実験条件を記録する実験情報記憶部と、機械学習に用いる学習データを記録する学習情報記憶部と、学習データを生成する制御部と、を備える。そして、前記制御部が、実験計画法を用いて、前記因子と前記水準とからなる複数の実験条件で構成された直交表を作成し、前記直交表において、連続する先行実験条件及び後続実験条件の水準を用いて、新たな実験条件を生成して前記実験情報記憶部に記録し、前記実験情報記憶部に記録された各実験条件を用いた実験により学習データを生成して前記学習情報記憶部に記録する。
【発明の効果】
【0009】
本発明によれば、機械学習に必要な学習データを、的確かつ効率的に作成することができる。
【図面の簡単な説明】
【0010】
【
図1】実施形態における学習データ作成システムとしての計算装置の説明図。
【
図2】実施形態におけるハードウェア構成の説明図。
【
図7】実施形態における実験条件の追加の説明図であって、(a)は第1の実験条件の追加、(b)は第2の実験条件の追加、(c)は第3の実験条件の追加の説明図。
【発明を実施するための形態】
【0011】
以下、
図1~
図7を用いて、学習データ作成システム、学習データ作成方法及び学習データ作成プログラムを具体化した一実施形態を説明する。本実施形態では、実験計画法による実験の割付けに使用する直交表を分解して実験を追加し、実験の回数すなわち学習データの数を増やす。この直交表では、複数の因子に対して複数の水準を割り振った実験条件が設定される。そして、この実験条件を用いて行なった実験の結果(シミュレーション結果)を学習用データとして用いて、機械学習等の解析処理により予測モデルを生成する。本実施形態では、BIM(Building Information Modeling)を用いて生成した建物の熱負荷のシミュレーションを行なう場合を想定する。
【0012】
図1に示すように、学習データ作成システムとしての計算装置20を用いる。
(ハードウェア構成例)
図2は、計算装置20として機能する情報処理装置H10のハードウェア構成例である。
【0013】
情報処理装置H10は、通信装置H11、入力装置H12、表示装置H13、記憶装置H14、プロセッサH15を有する。なお、このハードウェア構成は一例であり、他のハードウェアを有していてもよい。
【0014】
通信装置H11は、他の装置との間で通信経路を確立して、データの送受信を実行するインタフェースであり、例えばネットワークインタフェースや無線インタフェース等である。
【0015】
入力装置H12は、ユーザからの入力を受け付ける装置であり、例えばマウスやキーボード等である。表示装置H13は、各種情報を表示するディスプレイやタッチパネル等である。
【0016】
記憶装置H14は、計算装置20の各種機能を実行するためのデータや各種プログラムを格納する記憶装置である。記憶装置H14の一例としては、ROM、RAM、ハードディスク等がある。
【0017】
プロセッサH15は、記憶装置H14に記憶されるプログラムやデータを用いて、計算装置20における各処理(例えば、後述する制御部21における処理)を制御する。プロセッサH15の一例としては、例えばCPUやMPU等がある。このプロセッサH15は、ROM等に記憶されるプログラムをRAMに展開して、各種処理に対応する各種プロセスを実行する。例えば、プロセッサH15は、計算装置20のアプリケーションプログラムが起動された場合、各処理を実行するプロセスを動作させる。
【0018】
プロセッサH15は、自身が実行するすべての処理についてソフトウェア処理を行なうものに限られない。例えば、プロセッサH15は、自身が実行する処理の少なくとも一部についてハードウェア処理を行なう専用のハードウェア回路(例えば、特定用途向け集積回路:ASIC)を備えてもよい。プロセッサH15は、以下で構成し得る。
【0019】
(1)コンピュータプログラム(ソフトウェア)に従って動作する1つ以上のプロセッサ
(2)各種処理のうち少なくとも一部の処理を実行する1つ以上の専用のハードウェア回路、或いは
(3)それらの組み合わせ、を含む回路(circuitry)
プロセッサは、CPU並びに、RAM及びROM等のメモリを含み、メモリは、処理をCPUに実行させるように構成されたプログラムコード又は指令を格納している。メモリすなわちコンピュータ可読媒体は、汎用又は専用のコンピュータでアクセスできるあらゆる利用可能な媒体を含む。
【0020】
(学習データ作成システムの機能)
計算装置20は、制御部21、設計情報記憶部22、実験情報記憶部23、学習情報記憶部24を備える。
【0021】
制御部21は、学習データ作成プログラムを実行することにより、直交表作成部211、調整部212として機能する。更に、制御部21は、シミュレータ213、学習部214として機能する。
【0022】
直交表作成部211は、実験計画法に基づいて、各因子の水準を用いた複数の実験条件からなる直交表を作成する処理を実行する。
調整部212は、直交表に含まれる実験条件を増やす処理を実行する。この実験条件の追加により、後述する学習データを増やすことができる。
【0023】
シミュレータ213は、実験条件に含まれる水準を用いて、構造物における熱負荷を計算するシミュレーションを実行する実験装置である。このシミュレータ213は、任意の一つの因子を操作した場合、他の因子の水準を維持した状態で新たなシミュレーションを実行する。
【0024】
学習部214は、シミュレーション結果を用いて、熱負荷に影響を与える因子を予測する予測モデルを生成する解析処理を実行する。解析処理としては、離散的な情報から網羅的な情報を予測するモデルを生成する機械学習であれば、回帰分析、深層学習等を用いることができる。この学習部214は、学習データの不足を判定するための精度基準値に関する情報を保持する。
【0025】
設計情報記憶部22には、BIMにより設計された構造物の設計データが記録される。この設計データは、計算対象の構造物が登録された場合に記録される。
実験情報記憶部23には、シミュレーションに用いる実験データが記録される。この実験データは、因子に対して水準が割り振られた場合に記録される。実験データには、実験番号に対して、各因子の水準が記録される。各因子の水準からなる実験条件を用いて、熱負荷を計算するシミュレーションを実行する。
【0026】
実験番号は、各実験条件を特定するための識別子である。
因子は、構造物の熱負荷に影響を与える変数(例えば、窓面積比)である。
水準は、この因子の変数値である。例えば、窓面積比として、「水準1:80%」、「水準2:60%」を設定する。
【0027】
学習情報記憶部24には、シミュレーションによって生成された学習データが記録される。この学習データは、シミュレーション(実験)を行なった場合に記録される。学習データは、熱負荷の予測モデルを生成する解析処理(機械学習)に用いられる。学習データには、実験番号に対して、各因子の水準でシミュレーションを行なった計算結果が記録される。
【0028】
(分析処理)
次に、
図3を用いて、分析処理を説明する。
まず、計算装置20の制御部21は、実験条件の作成処理を実行する(ステップS101)。具体的には、制御部21の直交表作成部211及び調整部212は、シミュレーションに用いる複数の実験条件を生成する。詳細は、
図4を用いて説明する。
【0029】
次に、計算装置20の制御部21は、処理対象の実験番号を、順次特定して、すべての実験条件について以下の処理を繰り返す。
まず、計算装置20の制御部21は、シミュレーション処理を実行する(ステップS102)。具体的には、制御部21のシミュレータ213は、処理対象の実験条件(各因子の水準)を、実験情報記憶部23から呼び出し、設計情報記憶部22に記録された構造物の設計データに適用して、熱負荷計算シミュレーションを行なう。
【0030】
次に、計算装置20の制御部21は、学習データの記録処理を実行する(ステップS103)。具体的には、制御部21のシミュレータ213は、実験番号に関連付けて、シミュレーションの計算結果を記録した学習データを生成し、学習情報記憶部24に記録する。
以上の処理を、計算装置20の制御部21は、すべての実験番号について終了するまで繰り返す。
【0031】
次に、計算装置20の制御部21は、学習処理を実行する(ステップS104)。具体的には、制御部21の学習部214は、学習情報記憶部24に記録された学習データを用いて、熱負荷に影響を与える因子の予測モデルを生成する。この予測モデルより、熱負荷に影響を与える各因子の寄与度を算出することができる。更に、学習部214は、予測モデルの精度の評価指標を取得する。この評価指標は、予測モデルの出力値と実験結果との差(精度)を評価した情報である。例えば、回帰分析においては、二乗平均平方根誤差、平均絶対誤差や決定係数を用いることができる。
【0032】
次に、計算装置20の制御部21は、学習データが不足かどうかについての判定処理を実行する(ステップS105)。具体的には、制御部21の学習部214は、取得した評価指標と精度基準値とを比較し、学習データの追加の要否を判定する。そして、評価指標が精度基準値未満の場合には、学習データが不足と判定する。
【0033】
学習データが不足と判定した場合(ステップS105において「YES」の場合)、計算装置20の制御部21は、因子数又は水準数の追加処理を実行する(ステップS106)。具体的には、制御部21の学習部214は、直交表作成部211に対して、因子数又は水準数の追加を指示する。この場合、直交表作成部211は、例えば、ダミーの因子や、新たな水準を追加して、実験条件の作成処理(ステップS101)以降を実行する。
【0034】
(実験条件の作成処理)
次に、
図4を用いて、実験条件の作成処理を説明する。ここでは、実験計画法による実験の割付けに使用した直交表を以下の手順で分解追加し、実験の回数すなわち学習データの数を増やす。
【0035】
まず、計算装置20の制御部21は、直交表の作成処理を実行する(ステップS201)。具体的には、制御部21の直交表作成部211は、実験計画を用いて、実験番号に関連付けて、各因子の水準を割り振った直交表を生成する。
【0036】
図5は、7個の因子について、それぞれ2水準を想定した直交表500である。この場合、実験番号1~8の実験条件が設定される。
次に、計算装置20の制御部21は、処理対象の実験番号を順次特定して、以下の処理を繰り返す。ここでは、n個の実験番号が設定されている場合、「1」~「n-1」番を処理対象とする。
【0037】
まず、計算装置20の制御部21は、先行実験と後続実験とで水準が異なる因子の特定処理を実行する(ステップS202)。具体的には、制御部21の調整部212は、先行実験条件の因子の水準と後続実験条件の因子の水準とを比較して、水準が異なる因子(相違因子)を特定する。なお、相違因子が一つの場合には、この実験番号についての処理を終了する。
【0038】
以下では、
図6に示すように、先行実験(実験番号4)と後続実験(実験番号5)とを例にして説明する。ここでは、先行実験の実験条件540と、後続実験の実験条件550とを比較している。この場合、水準が異なる相違因子1,2,4,7が特定される。
【0039】
次に、計算装置20の制御部21は、1つの因子の水準の変更処理を実行する(ステップS203)。具体的には、制御部21の調整部212は、1つの相違因子の水準を変更する。本実施形態では、因子の順番(昇順)で、相違因子の水準を変更する。
【0040】
図7(a)では、実験条件540の相違因子1の「1」を、実験条件550と同じ「2」に変更した実験条件541(第1の実験条件)を作成する。
次に、計算装置20の制御部21は、実験条件の追加処理を実行する(ステップS204)。具体的には、制御部21の調整部212は、新たに作成した実験条件541を実験情報記憶部23に記録する。
【0041】
次に、計算装置20の制御部21は、後続実験の水準に一致かどうかについての判定処理を実行する(ステップS205)。具体的には、制御部21の調整部212は、残っている相違因子の水準を変更した場合、後続実験条件に一致するかどうかを判定する。
【0042】
図7(a)の実験条件541では、まだ、相違因子2の水準を変更した場合、相違因子4,7が残っているため、後続実験の実験条件550に一致しない。
後続実験の水準に一致しないと判定した場合(ステップS205において「NO」の場合)、計算装置20の制御部21は、ステップS203以降を繰り返す。
【0043】
この場合、
図7(b)に示すように、ステップS203において、実験条件541の相違因子2の「2」を、実験条件550と同じ「1」に変更した実験条件542(第2の実験条件)を作成する。そして、ステップS204において、実験条件を実験情報記憶部23に記録する。
【0044】
次に、ステップS205において、実験条件542の相違因子4の水準を変更した場合、相違因子7が残っているため、後続実験の実験条件550に一致しない。そこで、ステップS203以降を繰り返す。
【0045】
この場合、
図7(c)に示すように、ステップS203において、実験条件542の相違因子4の「2」を、実験条件550と同じ「1」に変更した実験条件543(第3の実験条件)を作成する。そして、ステップS204において、実験条件を実験情報記憶部23に記録する。
このように、新たに追加された実験条件541~543についても、シミュレーション処理(ステップS102)に用いられる。
【0046】
次に、ステップS205において、実験条件543の相違因子7の水準を変更した場合、後続実験の実験条件550に一致する。
後続実験の水準に一致すると判定した場合(ステップS205において「YES」の場合)、この実験番号についての処理を終了する。
【0047】
そして、計算装置20の制御部21は、実験番号「1」~「n-1」について終了するまで繰り返す。
【0048】
本実施形態によれば、以下のような効果を得ることができる。
(1)本実施形態では、計算装置20の制御部21は、実験条件の作成処理(ステップS101)、シミュレーション処理(ステップS102)、学習データの記録処理(ステップS103)を実行する。これにより、所定数の実験条件での実験結果を用いて、汎用的な予測モデルを生成することができる。特に、実験条件は直交表を用いるので、バランスがよい学習データを用いて解析処理を行なうことができる。
【0049】
(2)本実施形態では、計算装置20の制御部21は、直交表の作成処理を実行する(ステップS201)。これにより、直交表の因子と水準のバランスを維持した実験条件を設定できる。
【0050】
(3)本実施形態では、計算装置20の制御部21は、先行実験と後続実験とで水準が異なる因子の特定処理(ステップS202)、1つの因子の水準の変更処理(ステップS203)、実験条件の追加処理(ステップS204)を実行する。これにより、直交表の因子と水準とのバランスを維持しながら、実験の数を増やすことができる。そして、解析処理に用いる学習データを生成できる。
【0051】
例えば、
図7(c)の実験条件541~543は、直交表で連続する実験条件540及び実験条件550で共通する水準を維持している中間的な条件である。従って、実験計画法で作成した実験条件540及び実験条件550の性質を維持しながら、実験の数を増やすことができる。
【0052】
(4)本実施形態では、計算装置20の制御部21は、1つの因子の水準の変更処理を実行する(ステップS203)。一つずつ因子を変更してシミュレーションを行なう場合、他の因子の水準を維持して、効率的に実験を行なうことができる。
【0053】
(5)本実施形態では、学習データが不足と判定した場合(ステップS105において「YES」の場合)、計算装置20の制御部21は、因子数又は水準数の追加処理を実行する(ステップS106)。これにより、予測モデルの精度を高めるために必要な実験数や学習データを用いて機械学習を行なうことができる。
【0054】
本実施形態は、以下のように変更して実施することができる。本実施形態及び以下の変更例は、技術的に矛盾しない範囲で互いに組み合わせて実施することができる。
・上記実施形態においては、実験として、建物の熱負荷のシミュレーションを行なったが、実験はこれに限定されるものではない。また、実験もシミュレーションに限定されるものではなく、実験結果を取得できるものであればよい。
【0055】
・上記実施形態においては、学習データ作成システムとしての計算装置20を用いる。ハードウェア構成は、これに限定されるものではない。例えば、実験装置としてのシミュレータ213や、機械学習を行なう学習部214は、他の装置(サーバ)を用いてもよい。また、ユーザ端末でアクセス可能なサーバで計算装置20を実現してもよい。
【0056】
・上記実施形態においては、計算装置20の制御部21は、1つの因子の水準の変更処理を実行する(ステップS203)。水準を変更する因子の数は、一つに限定されず、複数の因子の水準を同時に変更してもよい。
【0057】
・上記実施形態においては、実験条件の作成処理において、計算装置20の制御部21は、処理対象の実験番号を順次特定して、処理を繰り返す。ここで、実験の目標数を決めておき、実験数が目標数に到達した場合に、繰り返しを終了するようにしてもよい。
【0058】
・上記実施形態においては、因子の順番で、相違因子の水準を変更するが、変更の順番は因子の順番に限定されるものではない。
例えば、
図6において、1→7→2→4のように、昇順、降順を入れ替えてもよい。また、水準「1」を「2」に変更した場合には、水準「2」から「1」への変更を優先するようにしてもよい。これにより、異なる水準の数をバランスよく、実験条件や学習データを増やすことができる。
【符号の説明】
【0059】
20…計算装置、21…制御部、210…充填管理部、211…直交表作成部、212…調整部、213…シミュレータ、214…学習部、22…設計情報記憶部、23…実験情報記憶部、24…学習情報記憶部。