IP Force 特許公報掲載プロジェクト 2022.1.31 β版

知財求人 - 知財ポータルサイト「IP Force」

▶ 株式会社明電舎の特許一覧

<>
  • 特開-機械コスト予測装置 図1
  • 特開-機械コスト予測装置 図2
  • 特開-機械コスト予測装置 図3
  • 特開-機械コスト予測装置 図4
  • 特開-機械コスト予測装置 図5
  • 特開-機械コスト予測装置 図6
  • 特開-機械コスト予測装置 図7
< >
(19)【発行国】日本国特許庁(JP)
(12)【公報種別】公開特許公報(A)
(11)【公開番号】P2022096060
(43)【公開日】2022-06-29
(54)【発明の名称】機械コスト予測装置
(51)【国際特許分類】
   G06N 20/00 20190101AFI20220622BHJP
   G06F 30/10 20200101ALI20220622BHJP
   G06F 30/27 20200101ALI20220622BHJP
【FI】
G06N20/00
G06F17/50 680Z
G06F17/50 604D
G06F17/50 608G
【審査請求】未請求
【請求項の数】8
【出願形態】OL
(21)【出願番号】P 2020208951
(22)【出願日】2020-12-17
(71)【出願人】
【識別番号】000006105
【氏名又は名称】株式会社明電舎
(74)【代理人】
【識別番号】110002077
【氏名又は名称】園田・小林特許業務法人
(72)【発明者】
【氏名】深井 寛修
(72)【発明者】
【氏名】大塩 佳祐
【テーマコード(参考)】
5B046
5B146
【Fターム(参考)】
5B046AA07
5B046JA01
5B046KA05
5B146AA21
5B146DC03
5B146DE16
5B146DL08
(57)【要約】
【課題】見積もりの作業効率を改善し、見積もりの妥当性が判断しやすい機械コスト予測装置を提供する。
【解決手段】過去に製造された機械の仕様、設計値、コストを含む過去データベースを学習データとして中間変数予測モデル61を生成するモデル学習部2と、前記中間変数予測モデル61に機械の仕様、設計値を含むデータを入力し中間変数を予測し、該中間変数を用いて機械のコストを予測する予測部3と、を備え、前記モデル学習部2と前記予測部3は、それぞれ、入力データを編集する、データクレンジング部21、31と、フィーチャーエンジニアリング部22、32と、を備え、前記データクレンジング部21、31は、パラメータの欠損値の補填を含むデータ整備を行い、前記フィーチャーエンジニアリング部22、32は、各パラメータの演算値付与を含む特徴量の付与を行う。
【選択図】図1

【特許請求の範囲】
【請求項1】
過去に製造された機械の仕様、設計値、コストを含む過去データベースを学習データとして中間変数予測モデルを生成するモデル学習部と、
前記中間変数予測モデルに機械の仕様、設計値を含むデータを入力し中間変数を予測し、該中間変数を用いて機械のコストを予測する予測部と、を備え、
前記モデル学習部と前記予測部は、それぞれ、入力データを編集する、
データクレンジング部と、
フィーチャーエンジニアリング部と、を備え、
前記データクレンジング部は、パラメータの欠損値の補填を含むデータ整備を行い、
前記フィーチャーエンジニアリング部は、各パラメータの演算値付与を含む特徴量の付与を行う、機械コスト予測装置。
【請求項2】
前記モデル学習部は、過去に製造された機械の仕様、設計値、コストを含む過去データベースを学習データとして基礎変数予測モデルを生成し、
前記予測部は、前記基礎変数予測モデルに機械の仕様、設計値を含むデータを入力し基礎変数を予測し、該基礎変数を前記中間変数予測モデルの入力として含み前記中間変数を予測する、請求項1に記載の機械コスト予測装置。
【請求項3】
前記予測部は、編集後の前記入力データを判定する入力値判定部を備え、該入力値判定結果に基づいて前記中間変数の予測に生成した前記中間変数予測モデルを使用するか、代替予測をするかを決定し、
前記予測部は、前記中間変数予測モデルと前記代替予測の出力を判定する出力値判定部を備え、該出力値判定結果に基づいて、前記予測値を出力する、請求項1に記載の機械コスト予測装置。
【請求項4】
前記予測部は、編集後の前記入力データを判定する入力値判定部を備え、該入力値判定結果に基づいて前記中間変数と前記基礎変数の予測にそれぞれ生成した前記中間変数予測モデルと前記基礎変数予測モデルを使用するか、代替予測をするかを決定し、
前記予測部は、前記中間変数予測モデルと前記基礎変数予測モデルによる予測と前記代替予測の出力を判定する出力値判定部を備え、該出力値判定結果に基づいて、前記予測値を出力する、請求項2に記載の機械コスト予測装置。
【請求項5】
前記モデル学習部は、
回帰モデル選択部と、
主モデル学習部と、を備え、
前記回帰モデル選択部は、過去データベースから交差検証により、設定された複数の回帰モデルを評価し、該評価結果に基づいて主モデルを選択し、
前記主モデル学習部は、選択された前記主モデルを過去データベースを学習データとして機械学習し前記中間変数予測モデルと前記基礎変数予測モデルとを含む予測モデルを生成する、請求項1から4のいずれか1項に記載の機械コスト予測装置。
【請求項6】
前記学習データのパラメータは、機械コストとの相関分析に基づいて選択される、請求項1から5のいずれか1項に記載の機械コスト予測装置。
【請求項7】
前記学習データのパラメータを選択する入力部を備える、請求項1から5のいずれか1項に記載の機械コスト予測装置。
【請求項8】
前記データクレンジング部は、さらに、パラメータに設定されたデータ欠損率以上のパラメータの削除、設定されたデータ類似率以上の事例の統合、若しくは事例に設定されたデータ欠損率以上を有する事例の削除を含むデータ整備を行い、
前記フィーチャーエンジニアリング部は、さらに、パラメータの欠損値補填フラグ、質的データのone-hotベクトル変換、パラメータの関数変換値、を含む特徴量の付与を行う、請求項1から7のいずれか1項に記載の機械コスト予測装置。

【発明の詳細な説明】
【技術分野】
【0001】
本発明は、機械コスト予測装置に関する。
【背景技術】
【0002】
水車発電機などの大型の回転機は使用環境や性能要求によってカスタマイズして製造する事が多い。そのためカタログ化された製品と違い、その都度製造費の見積りを実施する。しかしながら見積りを実施するには仕様情報から仕様を満たす設計を行い、その設計に合わせた部品・材料をもとに積み上げで見積りを行う必要があり、見積もり回答に多大な時間および費用を要する事が課題であった。
【0003】
特許文献1には、機械学習アルゴリズムによる予測モデルの構築と、構築した予測モデルによるコスト予測を行う装置が開示されている。
【先行技術文献】
【特許文献】
【0004】
【特許文献1】特開2020-154364号公報
【発明の概要】
【発明が解決しようとする課題】
【0005】
特許文献1に記載の装置では、仕様情報および一部設計情報を入力とし、コスト情報をアウトプットするものであり、直接的にコストが予測可能なことが特徴だが、その分なぜそのコストとなるのか中身がブラックボックス化してしまうことで見積もり値の妥当性が判断しづらいという課題があった。
【0006】
本発明は、上述した実情に鑑みてなされたものであり、本発明が解決しようとする課題は、見積もりの作業効率を改善し、見積もりの妥当性が判断しやすい機械コスト予測装置を提供することを課題とする。
【課題を解決するための手段】
【0007】
本発明は、上記課題を解決するため、以下の手段を採用する。
すなわち、本発明の機械コスト予測装置は、過去に製造された機械の仕様、設計値、コストを含む過去データベースを学習データとして中間変数予測モデルを生成するモデル学習部と、前記中間変数予測モデルに機械の仕様、設計値を含むデータを入力し中間変数を予測し、該中間変数を用いて機械のコストを予測する予測部と、を備え、前記モデル学習部と前記予測部は、それぞれ、入力データを編集する、データクレンジング部と、フィーチャーエンジニアリング部と、を備え、前記データクレンジング部は、パラメータの欠損値の補填を含むデータ整備を行い、前記フィーチャーエンジニアリング部は、各パラメータの演算値付与を含む特徴量の付与を行う。
このような構成によれば、中間変数を用いて機械コストを予測するので、見積もりの妥当性が判断しやすい機械コスト予測装置を提供することができる。
【0008】
本発明の一態様においては、前記モデル学習部は、過去に製造された機械の仕様、設計値、コストを含む過去データベースを学習データとして基礎変数予測モデルを生成し、前記予測部は、前記基礎変数予測モデルに機械の仕様、設計値を含むデータを入力し基礎変数を予測し、該基礎変数を前記中間変数予測モデルの入力として含み前記中間変数を予測する。
このような構成によれば、基礎変数を用いて機械コストを予測するので、見積もりの妥当性がさらに判断しやすく精度のよい機械コスト予測が可能となる。
【0009】
本発明の一態様においては、前記予測部は、編集後の前記入力データを判定する入力値判定部を備え、該入力値判定結果に基づいて前記中間変数の予測に生成した前記中間変数予測モデルを使用するか、代替予測をするかを決定し、前記予測部は、前記中間変数予測モデルと前記代替予測の出力を判定する出力値判定部を備え、該出力値判定結果に基づいて、前記予測値を出力する。
このような構成によれば、入力値判定部と出力値判定部を備え、これらの判定によって予測手法を選択するので、機械予測と人間の知見を組み合わせた機械コストの予測が可能になる。
【0010】
本発明の一態様においては、前記予測部は、編集後の前記入力データを判定する入力値判定部を備え、該入力値判定結果に基づいて前記中間変数と前記基礎変数の予測にそれぞれ生成した前記中間変数予測モデルと前記基礎変数予測モデルを使用するか、代替予測をするかを決定し、前記予測部は、前記中間変数予測モデルと前記基礎変数予測モデルによる予測と前記代替予測の出力を判定する出力値判定部を備え、該出力値判定結果に基づいて、前記予測値を出力する。
このような構成によれば、中間変数と基礎変数を用いて機械コストを予測し、入力値判定部と出力値判定部を備え、これらの判定によって予測手法を選択するので、さらに精度のよい機械予測と人間の知見を組み合わせた機械コストの予測が可能になる。
【0011】
本発明の一態様においては、前記モデル学習部は、回帰モデル選択部と、主モデル学習部と、を備え、前記回帰モデル選択部は、過去データベースから交差検証により、設定された複数の回帰モデルを評価し、該評価結果に基づいて主モデルを選択し、前記主モデル学習部は、選択された前記主モデルを過去データベースを学習データとして機械学習し前記中間変数予測モデルと前記基礎変数予測モデルとを含む予測モデルを生成する。
このような構成によれば、過去のデータベースを効率良く利用して、回帰モデルの選定と主モデルの学習が可能となる。
【0012】
本発明の一態様においては、前記学習データのパラメータは、機械コストとの相関分析に基づいて選択される。
このような構成によれば、機械コストと関係性が高いパラメータを自動的に選択することができ、予測精度を担保しながら計算に用いられるパラメータ数を減じて計算スピードを向上させることができる。
【0013】
本発明の一態様においては、前記学習データのパラメータを選択する入力部を備える。
このような構成によれば、学習データのパラメータ選択に自由度をもたせることができる。
【0014】
本発明の一態様においては、前記データクレンジング部は、さらに、パラメータに設定されたデータ欠損率以上のパラメータの削除、設定されたデータ類似率以上の事例の統合、若しくは事例に設定されたデータ欠損率以上を有する事例の削除を含むデータ整備を行い、前記フィーチャーエンジニアリング部は、さらに、パラメータの欠損値補填フラグ、質的データのone-hotベクトル変換、パラメータの関数変換値、を含む特徴量の付与を行う。
このような構成によれば、学習モデルの生成、及び、機械コストの予測に使用される入力データを適切に編集することができる。
【発明の効果】
【0015】
本発明によれば、見積もりの作業効率を改善し、見積もりの妥当性が判断しやすい機械コスト予測装置を提供することができる。
【図面の簡単な説明】
【0016】
図1】本発明の実施形態に係る機械コスト予測装置の構成を示す機能ブロック図である。
図2】本発明の実施形態に係るモデル学習部の構成を示す機能ブロック図の一部である。
図3】本発明の過去データベースのデータを説明するための表である。
図4】本発明の回帰モデルを選択するための方法を説明するためのグラフであって、横軸に回帰モデルの種類、縦軸に各回帰モデルの評価値が示されている。
図5】本発明の実施形態において、学習パラメータを選択するための方法を説明するためのグラフである。
図6】本発明の実施形態に係る機械コスト予測装置の構成を示す機能ブロック図である。
図7】本発明の実施形態に係る機械コスト予測装置の構成を示す機能ブロック図である。
【発明を実施するための形態】
【0017】
以下、添付図面を参照して、本発明の実施の形態について説明する。
(第1実施形態)
図1に、本発明の第1実施形態に係る機械コスト予測装置の構成を示す機能ブロック図を示す。
本実施形態に係る機械コスト予測装置1は、モデル学習部2、予測部3、過去データベース4、データベース5を備えている。モデル学習部2は、データクレンジング部21、フィーチャーエンジニアリング部22、中間変数予測モデル生成部26を備えている。図1には、中間変数予測モデル生成部26として、便宜的に3つ(Aおよび背後に隠れたB、C)示されているが、後述するように機械コスト予測の要素として必要な数だけの複数の中間変数予測モデル生成部26が存在している。図2は、モデル学習部2の機能ブロック図の一部である。図2に一個だけ示された中間変数予測モデル生成部26(後述する基礎変数予測モデル生成部27も同様)は、回帰モデル選択部23、主モデル学習部24を備えている。
【0018】
予測部3は、データクレンジング部31、フィーチャーエンジニアリング部32、中間変数予測部33、コスト予測結果出力部34を備えている。図1には、中間変数予測部33として、便宜的に3つ(Aおよび背後に隠れたB、C)示されているが、機械コスト予測の要素として必要な数だけの複数の中間変数予測部33が存在している。
【0019】
機械コスト予測装置1は、例えばパーソナルコンピュータ等の情報処理装置である。過去データベース4及びデータベース5は、上記情報処理装置内外に設けられた半導体メモリや磁気ディスクなどの記憶装置によって実現される。また、モデル学習部2と予測部3は、上記情報処理装置内のCPUやGPUによって実行されるソフトウェア、プログラムであってよい。
【0020】
過去データベース4には、過去に製造された機械のコスト、仕様、設計値等が事例毎に紐付けられて記録されている。例えば、図3に示すような表のイメージで記録されている。図3に示すごとく、1行目には、パラメータ名である事例、コスト、容量、電圧、無負荷損失、鉄心材料、等が示されている。2行目以降の各行が過去に実施された1事例に相当し、その事例における、パラメータの値が入力されている。表中YYY、aaa、bbb、や・・・の記載は空ではない値の存在を表現している。
【0021】
最初に、モデル学習部2における、モデル学習について説明する。モデル学習が開始されると、過去データベース4に記録されたすべてのデータは、モデル学習部2のデータクレンジング部21に送信される。データクレンジング部では、入力された過去データベース4の値を検査し、パラメータの欠損値の補填、パラメータに設定されたデータ欠損率以上のパラメータの削除、設定されたデータ類似率以上の事例の統合、若しくは事例に設定されたデータ欠損率以上を有する事例の削除を含むデータの整備を行う。
【0022】
ここで、パラメータの欠損値の補填とは、事例のパラメータでデータが存在していない部分(いわゆるブランク、あるいはヌルデータの部分)に、値を設定することをいう。設定される値は、0、1、中央値、平均値など予め定められた値を補填する。
パラメータに設定されたデータ欠損率以上のパラメータの削除とは、各パラメータ毎(図2の表における列データに相当する。)に欠損データ(ヌルデータ)と値を持つデータ(有効データ)の数を調べ、その比率を計算し、例えばあるパラメータの欠損データが90%以上(10%未満の有効データ)の場合はそのパラメータを削除し、後述するモデル生成の学習データとして使用しないことをいう。
【0023】
設定されたデータ類似率以上の事例の統合とは、例えば、事例1と2(図3の表における行データに相当し、事例1と2は、図3の表における2行目と3行目のことをいう。)の各パラメータの値を比較し、各パラメータの差が、設定された近似範囲値以内に入っているかどうかを検証し、近似範囲値以内に入っているパラメータの比率が例えば95%以上(5%未満のパラメータ数が近似範囲内にない)ある場合は、いずれかの事例を消去することをいう。
事例に設定されたデータ欠損率以上を有する事例の削除とは、事例の欠損データの比率を調べ、例えば、ある事例の欠損データ率が97%以上(有効データが3%未満)である場合、その事例を削除することをいう。
【0024】
上記したように、データクレンジング部21で過去データベース4からのデータを整備したあとの出力は、フィーチャーエンジニアリング部22に送信される。
フィーチャーエンジニアリング部22では、各パラメータの演算値、パラメータの欠損値補填フラグ、質的データのone-hotベクトル変換、パラメータの関数変換値、を含む特徴量の付与を行う。
【0025】
ここで、各パラメータの演算値の付与とは、各パラメータ同士の四則演算を含む計算値を付与することである。例えばA、B等でパラメータを表した場合、演算値とは、A+B、A*B、3*A+2*B等のことをいう。演算値の付与とは、この値を事例データに追加することをいう。
パラメータの欠損値補填フラグの付与とは、上述したデータクレンジング部21で、パラメータの補填が行われたパラメータを表すパラメータ(この場合1ビットデータ)を新たに事例データに追加し、補填が行われた場合1を行われなかった場合は0を設定することをいう。
【0026】
質的データのone-hotベクトル変換の付与とは、例えば鉄心材質等、単に材質や材料製品の品番で代表される数字では扱えないパラメータに0または1のフラグによって表現されるベクトルを付与することである。例えば、以下の表1に示すように、鉄心材質に35G165、30ZH105、35PN300、30P105の記号で表されるものがある場合、適合するところに1のフラグを立て、適合しないところに0のフラグをたて、鉄心材質を0と1のベクトルで表現したものを付与することをいう。この場合、同じ鉄心材質は、同じベクトル値を示す。
パラメータの関数変換値の付与とは、パラメータを例えば多項式関数やガウス関数で変換してその値を付与することをいう。
【0027】
【表1】
【0028】
上記のように、フィーチャーエンジニアリング部22で、新たな特徴量を付与されたデータは、中間変数予測モデル生成部26に送信される。ここで中間変数とは、機械学習モデリング機能を用いて予測したい値(たとえば水車発電機であればローター重量、ステーター重量、総重量)のことであり、この予測した中間変数を用いてルールベースコスト予測(例えばローター重量×鉄単価+ステーター重量×鉄単価+総重量×定数など)を行う。直接コストを予測するのではなく、コスト算出の根拠となる値を中間的に求める点が従来との違いである。
【0029】
ここでは、ひとつの中間変数についてその予測動作について説明する。上述のように中間変数予測モデル生成部26に送信されたデータは、回帰モデル選択部23に送信される。
回帰モデル選択部23では、入力されたデータを複数のグループに分けて、交差検証により、回帰モデルの評価、選択が行われる。ここにおいて、交差検証とは、例えば、入力されたデータを10のグループに分ける。説明のため、今そのグループに1~10の番号が振られているとする。回帰モデル選択部23では、まず1~9のグループのデータを用いて一つの回帰モデルについて中間変数を算出するための機械学習を行い、回帰モデルのパラメータを導出する。この導出されたパラメータを有するモデルを用いて、グループ10のデータを使って評価を行い評価値を算出する。評価値は、例えば回帰モデルによって算出された中間変数によって導出された機械コストと実際のコストとの差を採用して良い。
【0030】
次に、回帰モデル選択部23は、2~10のグループのデータを用いて一つの回帰モデルについて中間変数を算出するための機械学習を行い、回帰モデルのパラメータを導出する。この導出されたパラメータを有するモデルを用いて、グループ1のデータを使って評価を行い評価値を算出する。このように、学習に使用するデータと評価に使用するデータを入れ替えて評価値を算出する。この場合は、10種類の評価値グループが得られる。
【0031】
評価される機械学習アルゴリズムの回帰モデルとしては、線形のものとして、重回帰分析、Ridge・Lasso・Elastic Netのような正則化法、PLS等がある。非線形のものとして、CART、k-NN、SVR、NN等がある。アンサンブル手法としては、Adaboost、GBM、RF、ET等があるが、これに限定されず、Pythonの機械学習ライブラリであるScikit-learnのユーザーガイド(https://scikit-learn.org/stable/user_guide.html)に掲載されているどのアルゴリズムを採用して良い。
【0032】
回帰モデル選択部23は、候補として採用された回帰モデルのそれぞれについて、上述した交差検証を用いて評価を行い評価値を算出する。図4は、回帰モデルの評価結果を表すグラフである。横軸には、回帰モデルの種類が並べられ、縦軸はその回帰モデルに対応する上記の交差検証の評価値が示されている。評価値は、平均値41、最大値42、最小値43、25%分布ライン44、75%分布ライン45で表されている。評価値0は、中間変数の予測値と実際の値に差がないことを表す。
【0033】
回帰モデルの選択は、この図4に示されたデータから自動的に選択することができる。例えば、平均値の絶対値が一番小さいものを選択して良い。又は、最大値と最小値の差と平均値を掛け合わせ、その絶対値の一番小さいものを選択して良い。この場合は、最大値と最小値の差が少なく、平均値も小さいものが選択される。又は、この値にさらに回帰モデル毎の説明性を表した指標値を掛け合わせ、その最小値を示すものを選択して良い。回帰モデル毎の説明性を表した指標値とは、例えば線形性のものを0.2に、非線形のものを0.5にアンサンブル手法を0.7に設定することができる。この値で選択を決定することにより、精度がよく、説明性の良い回帰モデルを選択する。回帰モデルの選択は、あるいは、図3に示す表をコンピューターのディスプレイに表示させ、マニュアルにて選択しても良い。
【0034】
回帰モデル選択部23は、上記の評価結果に基づいて主モデルを選択し、そのモデルの選択結果と設定されたハイパーパラメータを主モデル学習部24に送信する。主モデル学習部では、主モデルとして選択された回帰モデルとハイパーパラメータを用い、上記交差検証で使用されたデータすべてを利用して、主モデルについて機械学習をおこない中間変数予測モデル61(予測モデル6)を生成する。生成された中間変数予測モデル61は、予測部3の中間変数予測部33に送信される。
【0035】
次に、予測部3における機械コストの予測について説明する。データベース5には、これから予測に用いられる機械の仕様と設計値が記録されている。予測部3は、データベース5から、機械の仕様と設計値を読み出し、モデル学習部2において説明した、データクレンジング部21とフィーチャーエンジニアリング部22と同様の入力データの編集を予測部3のデータクレンジング部31とフィーチャーエンジニアリング部32で行う。このとき、予測部3のデータクレンジング部31とフィーチャーエンジニアリング部32の設定は、図1で点線で示されているように、モデル学習部2のデータクレンジング部21とフィーチャーエンジニアリング部22で設定されたものと同じものが予測部3のデータクレンジング部31とフィーチャーエンジニアリング部32に送信されて使用される。モデル学習部2のデータクレンジング部21とフィーチャーエンジニアリング部22における設定とは、例えば、欠損データの補填値や付与するパラメータ同士の演算の種類や、質的データのone-hotベクトル変換値、パラメータの変換に使用される関数の種類等をいう。
【0036】
予測部3のデータクレンジング部31とフィーチャーエンジニアリング部32によって編集されたデータベース5からのデータは、中間変数予測部33に送信される。中間変数測部33では、中間変数予測モデル61を使って中間変数の算出が行われる。算出された中間変数は、コスト予測結果出力部34に送信される。コスト予測結果出力部34では、受信した複数の中間変数を用いて、前述したルールベースコスト予測により機械コストを算出し、その結果をディスプレイやプリンター等に出力する。
【0037】
以上述べたように、本実施形態によれば、過去の機械製造の事例を記録した過去データベース4を学習データとして用いて、ルールベースコスト予測における中間変数予測のモデルを生成し、中間変数を予測するので、見積もる人および方法による差を含むことなく、精度の良い中間変数を用いた機械コストの予測ができる。また、予測はパーソナルコンピュータ等のソフトウェア等によって自動で実行されるので、見積もりに工数がかからない。
【0038】
データクレンジング部21においては、中間変数予測モデル61の学習に用いられる過去データベース4に、欠損データが補填されるので、予測モデル生成のための情報量を増やすことができる。また、データ欠損率の高いパラメータや、事例は消去されるので、中間変数予測モデル61生成のためのノイズデータを除去することができる。また、類似の事例データは統合されるので、入力データを効率良く減らすことができる。
【0039】
フィーチャーエンジニアリング部22においては、各パラメータの演算値、データクレンジング部21において補填したパラメータを示すフラグ、質的データのone-hotベクトル変換、パラメータの関数変換値、等が中間変数予測モデル61生成のための学習データに付与されるので、中間変数予測モデル61生成のために有用な情報を増やすことができる。ここにおいて、パラメータに関数を適用し変換する意味は、そのパラメータの平均値と分散によって正規化されたガウス関数を利用した場合においては、パラメータの値の差に重み付けすることができる。例えば、平均値から離れた値付近のパラメータ差を平均値付近の値の差に比較して強調することによって、特徴量の情報を増やすことができる。
【0040】
回帰モデル選択部23においては、複数の回帰モデルが交差検証によって評価され、主モデルが選択されるので、過去データベース4を効率良く利用して回帰モデルの選択が可能である。
主モデル学習部24では、回帰モデル選択部23によって選択された主モデルを、過去データベース4をすべて使ってモデル学習を行うので、中間変数予測モデル61の生成を効果的に行うことができる。このようにして生成された中間変数予測モデル61を使用して、中間変数予測部33で中間変数の予測をおこなうので、人為的な差を含むことのない精度のよい中間変数の予測ができる。また、この中間変数を用いてルールベースコスト予測により機械コストの予測が行われるので、見積もりの作業効率を改善し、見積もりの妥当性が判断しやすい機械コストの予測が可能となる。
【0041】
(第2実施形態)
次に、本発明の第2実施形態について説明する。この実施形態が第1実施形態と異なるのは、モデル学習に用いられるパラメータが機械コストとの相関分析の結果に基づいて選択される点である。図5は、各パラメータ51(A~S)の相関分析の結果である相関係数52が示されているグラフである。横軸パラメータの1番目に示されているのは、機械コスト53である。機械コスト53の自分自身の相関係数1が示されている。本実施形態では、モデル学習に用いられるパラメータは、この相関係数に基づいて選択される。選択する方法は、例えば、パラメータを相関係数の値の大きい順に並べて、上位の15番目までのパラメータを選択して良い。また、相関係数0.5以上のパラメータを選択しても良い。
本実施形態においては、このように、機械コストと相関の強いパラメータを選択することによって、機械コスト予測の精度を向上させることができる。また、選択によってパラメータの数を減らすことができるので、計算スピードを高速にすることができる。本実施形態においては、パラメータの選択以外は上記第1実施形態と同様の動作によって機械コストの予測が行われ、第1実施形態と同様の作用、効果が得られる。
【0042】
(第3実施形態)
次に、本発明の第3実施形態について説明する。この実施形態が第1実施形態と異なるのは、モデル学習に用いられるパラメータを選択する入力部を備える点である。本実施形態においては、入力パラメータを選択するために、図1に2点鎖線で示される、モデル学習部2に入力部25を備えている。この入力部25において、モデル学習に用いられるパラメータを任意に選択可能となっている。したがって、パラメータ選択の自由度が向上し、また、選択によってパラメータの数を減らすことができるので、計算スピードを高速にすることができる。本実施形態においては、パラメータの選択以外は上記第1実施形態と同様の動作によって機械コストの予測が行われ、第1の実施形態と同様の作用、効果が得られる。
【0043】
(第4実施形態)
図6は、本発明の第4実施形態に係る機械コスト予測装置10の機能ブロック図である。本実施形態が第1実施形態と異なるのは、基礎変数を予測するための、基礎変数予測モデル生成部27と、生成された基礎変数モデル62を用いて基礎変数を予測する基礎変数予測部35を備える点である。ここで、基礎変数とは、上述の中間変数の予測において、入力に用いられる変数であり、例えば寸法を機械学習モデルによって推定し、その推定した寸法値および特徴抽出値を活用して重量を推定する流れとなっている。その他の第1実施形態と同様の動作をする機能ブロックには、同じ符号を付しその説明を省略する。
【0044】
モデル学習部2は、過去に製造された機械の仕様、設計値、コストを含む過去データベース4を学習データとして、基礎変数予測モデル生成部27で基礎変数予測モデル62を生成し、予測部3は、基礎変数予測モデル62に機械の仕様、設計値を含むデータを入力し基礎変数を予測し、この基礎変数を中間変数予測モデル61の入力として含み中間変数を予測する。中間変数の予測のときと同様に、基礎変数予測モデル生成部27、基礎変数予測モデル62、および基礎変数予測部35は、図6には、便宜的に3つ(Aおよび背後に隠れたB、C)示されているが、中間変数予測の要素として必要な数だけの複数の基礎変数予測モデル生成部27、基礎変数予測モデル62、および基礎変数予測部35が存在している。ここで基礎変数予測モデル生成部27の図2示す回帰モデル選択部23、主モデル学習部24の動作は、第1実施形態における中間変数予測モデル生成部26と同じであるので個々では説明を省略する。
【0045】
このように、中間変数の予測にさらに上流の基礎変数を予測し用いることによって、見積もりの妥当性がさらに判断しやすくなり、かつ精度が向上して緻密なルールベースコスト予測が可能となる。なお、本実施形態においては、基礎変数の予測をする以外は上記第1実施形態と同様の動作によって機械コストの予測が行われ、第1実施形態と同様の作用、効果が得られる。
【0046】
(第5実施形態)
図7は、本発明の第5実施形態に係る機械コスト予測装置100の機能ブロック図である。本実施形態が第4実施形態と異なるのは、予測部3に、入力値判定部73、代替予測部75、出力値判定部77、例外判定部79を備える点である。その他の第4実施形態と同様の動作をする機能ブロックには、同じ符号を付しその説明を省略する。図7では、基礎変数と中間変数予測の為の基礎変数予測モデル生成部27、中間変数予測モデル生成部26、基礎変数予測モデル62、中間変数予測モデル61、基礎変数予測部35、中間変数予測部33を含む一連の値の予測に係る動作は、モデル学習部2の予測モデル生成サブルーチン70と予測部3のモデル予測値発生サブルーチン71として、まとめて表現されている。
【0047】
本実施形態では、予測部3は、編集後の入力データを判定する入力値判定部73を備え、この入力値判定結果に基づいて中間変数と基礎変数の予測にそれぞれ生成した中間変数予測モデル61と前記基礎変数予測モデル62を使用するか、代替予測部75を使用するかを決定する。例えば、予め定められた範囲内に編集後の入力データが収まっている場合は、モデル予測発生サブルーチン71を利用して、基礎変数と中間変数を予測し出力する。予め定められた範囲内に編集後の入力データが収まっていない場合は、代替予測部75で代替予測を行う。
【0048】
予測部3はさらに、中間変数予測モデル61と基礎変数予測モデル62による予測と代替予測部75の出力を判定する出力値判定部77を備え、この出力値判定結果に基づいて、機械コストの予測値を出力する。例えば、予め定められた範囲内に中間変数予測モデル61と基礎変数予測モデル62による予測と代替予測部の出力が収まっている場合は、前述の実施形態と同様にコスト予測結果出力部34による機械コストの予測値の出力を行う。予め定められた範囲内に中間変数予測モデル61と基礎変数予測モデル62による予測と代替予測部の出力が収まっていない場合は、例外判定部79において例外処理を行う。
【0049】
このように、本実施形態の機械コスト予測装置100は、データドリブン的なアプローチをとる機械学習部分と、人間の知見を直接組み込むルールベース部分の両方を採用できる装置となっている。したがって、機械学習予測と人間の知見の両方を組み合わせた予測装置が実現可能となる。なお、本実施形態においては、上述した動作以外は上記第4実施形態と同様の動作によって機械コストの予測が行われ、第4の実施形態と同様の作用、効果が得られる。
【0050】
以上の明細書の記載に関して、特許請求の範囲は、本願発明の技術的思想から逸脱することのない範囲で、実施の形態に対する多数の変形形態を包括するものである。したがって、本明細書に開示された実施形態は、例示のために示されたものであり、本願発明の範囲を限定するものと考えるべきではない。
【符号の説明】
【0051】
1、10、100 機械コスト予測装置
2 モデル学習部
3 予測部
21、31 データクレンジング部
22、32 フィーチャーエンジニアリング部
23 回帰モデル選択部
24 主モデル学習部
61 中間変数予測モデル
62 基礎変数予測モデル
73 入力値判定部
77 出力値判定部

図1
図2
図3
図4
図5
図6
図7