IP Force 特許公報掲載プロジェクト 2022.1.31 β版

知財求人 - 知財ポータルサイト「IP Force」

▶ 株式会社神戸製鋼所の特許一覧

特開2022-83595学習装置、予測モデルの生成方法、特性予測装置、特性予測方法、及びプログラム
<>
  • 特開-学習装置、予測モデルの生成方法、特性予測装置、特性予測方法、及びプログラム 図1
  • 特開-学習装置、予測モデルの生成方法、特性予測装置、特性予測方法、及びプログラム 図2
  • 特開-学習装置、予測モデルの生成方法、特性予測装置、特性予測方法、及びプログラム 図3
  • 特開-学習装置、予測モデルの生成方法、特性予測装置、特性予測方法、及びプログラム 図4
  • 特開-学習装置、予測モデルの生成方法、特性予測装置、特性予測方法、及びプログラム 図5
  • 特開-学習装置、予測モデルの生成方法、特性予測装置、特性予測方法、及びプログラム 図6
  • 特開-学習装置、予測モデルの生成方法、特性予測装置、特性予測方法、及びプログラム 図7
  • 特開-学習装置、予測モデルの生成方法、特性予測装置、特性予測方法、及びプログラム 図8A
  • 特開-学習装置、予測モデルの生成方法、特性予測装置、特性予測方法、及びプログラム 図8B
  • 特開-学習装置、予測モデルの生成方法、特性予測装置、特性予測方法、及びプログラム 図9A
  • 特開-学習装置、予測モデルの生成方法、特性予測装置、特性予測方法、及びプログラム 図9B
  • 特開-学習装置、予測モデルの生成方法、特性予測装置、特性予測方法、及びプログラム 図9C
< >
(19)【発行国】日本国特許庁(JP)
(12)【公報種別】公開特許公報(A)
(11)【公開番号】P2022083595
(43)【公開日】2022-06-06
(54)【発明の名称】学習装置、予測モデルの生成方法、特性予測装置、特性予測方法、及びプログラム
(51)【国際特許分類】
   G06N 20/00 20190101AFI20220530BHJP
   G16Z 99/00 20190101ALI20220530BHJP
   G05B 19/418 20060101ALI20220530BHJP
【FI】
G06N20/00
G16Z99/00
G05B19/418 Z
【審査請求】未請求
【請求項の数】14
【出願形態】OL
(21)【出願番号】P 2020195008
(22)【出願日】2020-11-25
(71)【出願人】
【識別番号】000001199
【氏名又は名称】株式会社神戸製鋼所
(74)【代理人】
【識別番号】100125645
【弁理士】
【氏名又は名称】是枝 洋介
(74)【代理人】
【識別番号】100145609
【弁理士】
【氏名又は名称】楠屋 宏行
(74)【代理人】
【識別番号】100149490
【弁理士】
【氏名又は名称】羽柴 拓司
(72)【発明者】
【氏名】四方田 真美
(72)【発明者】
【氏名】和田 尭
(72)【発明者】
【氏名】日野 英逸
【テーマコード(参考)】
3C100
5L049
【Fターム(参考)】
3C100AA57
3C100AA58
3C100AA70
3C100BB13
3C100BB15
3C100BB27
3C100BB33
5L049DD01
(57)【要約】
【課題】評価基準が異なる場合であっても十分な訓練データ確保して予測モデルを生成することが容易な学習装置を提供する。
【解決手段】学習装置は、特性の評価基準が互いに異なる複数のグループのうちの同じグループに属する複数の製品から選択される第1製品及び第2製品の特徴量の差と、第1製品及び第2製品の特性をランク付けした特性ランクの差を取得する取得部と、特徴量の差を説明変数、特性ランクの差を目的変数として、対象製品及び基準製品の特徴量の差に基づき対象製品及び基準製品の特性の優劣を予測するための予測モデルを生成する学習部とを備える。
【選択図】図4
【特許請求の範囲】
【請求項1】
特性の評価基準が互いに異なる複数のグループのうちの同じグループに属する複数の製品から選択される第1製品及び第2製品の特徴量の差と、前記第1製品及び前記第2製品の特性をランク付けした特性ランクの差を取得する取得部と、
前記特徴量の差を説明変数、前記特性ランクの差を目的変数として、対象製品及び基準製品の特徴量の差に基づき前記対象製品及び前記基準製品の特性の優劣を予測するための予測モデルを生成する学習部と、
を備える、学習装置。
【請求項2】
前記第1製品及び前記第1製品の特性ランクの差は、前記第1製品の特性が前記第1製品の特性よりも優れている場合、前記第1製品の特性が前記第1製品の特性と同程度である場合、及び前記第1製品の特性が前記第1製品の特性よりも劣っている場合の3つにラベル分けされ、
前記学習部は、順序回帰により、前記対象製品の特性が前記基準製品の特性よりも優れている場合、前記対象製品の特性が前記基準製品の特性と同程度である場合、及び前記対象製品の特性が前記基準製品の特性よりも劣っている場合の3つのラベルを予測するように、前記予測モデルを生成する、
請求項1に記載の学習装置。
【請求項3】
前記学習部は、回帰係数及び前記3つのラベル間の閾値を前記予測モデルのパラメータとして算出する、
請求項2に記載の学習装置。
【請求項4】
前記複数のグループのうちの同じグループに属する複数の製品から前記第1製品及び前記第2製品を選択する選択部をさらに備える、
請求項1ないし3の何れかに記載の学習装置。
【請求項5】
前記選択部は、前記複数のグループのそれぞれにおいて前記第1製品及び前記第2製品の組を生成する、
請求項4に記載の学習装置。
【請求項6】
前記選択部は、前記複数の製品から組み合わせを変えて前記第1製品及び前記第2製品の組を複数生成する、
請求項4または5に記載の学習装置。
【請求項7】
前記選択部は、前記複数の製品から組み合わせを変えて複数生成された前記第1製品及び前記第2製品の組から、特性ランクの差が0である組の一部または全部を除外する、
請求項4ないし6の何れかに記載の学習装置。
【請求項8】
前記第1製品及び前記第2製品の特徴量の差と、前記第1製品及び前記第2製品の特性ランクの差を算出する算出部をさらに備える、
請求項1ないし7の何れかに記載の学習装置。
【請求項9】
特性の評価基準が互いに異なる複数のグループのうちの同じグループに属する複数の製品から選択される第1製品及び第2製品の特徴量の差と、前記第1製品及び前記第2製品の特性をランク付けした特性ランクの差を取得し、
前記特徴量の差を説明変数、前記特性ランクの差を目的変数として、対象製品及び基準製品の特徴量の差に基づき前記対象製品及び前記基準製品の特性の優劣を予測するための予測モデルを生成する、
予測モデルの生成方法。
【請求項10】
特性の評価基準が互いに異なる複数のグループのうちの同じグループに属する複数の製品から選択される第1製品及び第2製品の特徴量の差と、前記第1製品及び前記第2製品の特性をランク付けした特性ランクの差を取得すること、及び、
前記特徴量の差を説明変数、前記特性ランクの差を目的変数として、対象製品及び基準製品の特徴量の差に基づき前記対象製品及び前記基準製品の特性の優劣を予測するための予測モデルを生成すること、
をコンピュータに実行させるプログラム。
【請求項11】
対象製品及び基準製品の特徴量の差を取得する取得部と、
特性の評価基準が互いに異なる複数のグループのうちの同じグループに属する複数の製品から選択される第1製品及び第2製品の特徴量の差を説明変数、前記第1製品及び前記第2製品の特性をランク付けした特性ランクの差を目的変数として予め生成された予測モデルを用い、前記対象製品及び前記基準製品の特徴量の差に基づき前記対象製品及び前記基準製品の特性の優劣を予測する予測部と、
を備える、特性予測装置。
【請求項12】
前記予測部は、順序回帰により、前記対象製品の特性が前記基準製品の特性よりも優れている場合、前記対象製品の特性が前記基準製品の特性と同程度である場合、及び前記対象製品の特性が前記基準製品の特性よりも劣っている場合の3つのラベルを予測する、
請求項11に記載の特性予測装置。
【請求項13】
対象製品及び基準製品の特徴量の差を取得し、
特性の評価基準が互いに異なる複数のグループのうちの同じグループに属する複数の製品から選択される第1製品及び第2製品の特徴量の差を説明変数、前記第1製品及び前記第2製品の特性をランク付けした特性ランクの差を目的変数として予め生成された予測モデルを用い、前記対象製品及び前記基準製品の特徴量の差に基づき前記対象製品及び前記基準製品の特性の優劣を予測する、
特性予測方法。
【請求項14】
対象製品及び基準製品の特徴量の差を取得すること、及び、
特性の評価基準が互いに異なる複数のグループのうちの同じグループに属する複数の製品から選択される第1製品及び第2製品の特徴量の差を説明変数、前記第1製品及び前記第2製品の特性をランク付けした特性ランクの差を目的変数として予め生成された予測モデルを用い、前記対象製品及び前記基準製品の特徴量の差に基づき前記対象製品及び前記基準製品の特性の優劣を予測すること、
をコンピュータに実行させるプログラム。

【発明の詳細な説明】
【技術分野】
【0001】
本発明は、学習装置、予測モデルの生成方法、特性予測装置、特性予測方法、及びプログラムに関する。
【背景技術】
【0002】
特許文献1には、予測系を構築するためのデータとして呈味成分と香気成分からなる成分分析値と官能検査データを用い、予測手法としてバックブロバゲーションモデルからなるニューラルネットワークによる非線形解析手法を用いて、ヨーグルトのおいしさを予測する技術が開示されている。
【先行技術文献】
【特許文献】
【0003】
【特許文献1】特開平9-218192号公報
【発明の概要】
【発明が解決しようとする課題】
【0004】
ところで、製品開発においては、製品の特性を官能試験等によりランク付けすることがあるが、評価者や基準製品が異なる等、評価基準が異なる場合には、個別に予測モデルを作成する必要が生じる。しかしながら、個別に予測モデルを作成しようとすると、訓練データが不足するおそれがある。
【0005】
本発明は、上記課題に鑑みてなされたものであり、その主な目的は、評価基準が異なる場合であっても十分な訓練データを確保して予測モデルを生成することが容易な学習装置、予測モデルの生成方法、特性予測装置、特性予測方法、及びプログラムを提供することにある。
【課題を解決するための手段】
【0006】
上記課題を解決するため、本発明の一の態様の学習装置は、特性の評価基準が互いに異なる複数のグループのうちの同じグループに属する複数の製品から選択される第1製品及び第2製品の特徴量の差と、前記第1製品及び前記第2製品の特性をランク付けした特性ランクの差を取得する取得部と、前記特徴量の差を説明変数、前記特性ランクの差を目的変数として、対象製品及び基準製品の特徴量の差に基づき前記対象製品及び前記基準製品の特性の優劣を予測するための予測モデルを生成する学習部と、を備える。
【0007】
また、本発明の他の態様の予測モデルの生成方法は、特性の評価基準が互いに異なる複数のグループのうちの同じグループに属する複数の製品から選択される第1製品及び第2製品の特徴量の差と、前記第1製品及び前記第2製品の特性をランク付けした特性ランクの差を取得し、前記特徴量の差を説明変数、前記特性ランクの差を目的変数として、対象製品及び基準製品の特徴量の差に基づき前記対象製品及び前記基準製品の特性の優劣を予測するための予測モデルを生成する。
【0008】
また、本発明の他の態様のプログラムは、特性の評価基準が互いに異なる複数のグループのうちの同じグループに属する複数の製品から選択される第1製品及び第2製品の特徴量の差と、前記第1製品及び前記第2製品の特性をランク付けした特性ランクの差を取得すること、及び、前記特徴量の差を説明変数、前記特性ランクの差を目的変数として、対象製品及び基準製品の特徴量の差に基づき前記対象製品及び前記基準製品の特性の優劣を予測するための予測モデルを生成すること、をコンピュータに実行させる。
【0009】
また、本発明の他の態様の特性予測装置は、対象製品及び基準製品の特徴量の差を取得する取得部と、特性の評価基準が互いに異なる複数のグループのうちの同じグループに属する複数の製品から選択される第1製品及び第2製品の特徴量の差を説明変数、前記第1製品及び前記第2製品の特性をランク付けした特性ランクの差を目的変数として予め生成された予測モデルを用い、前記対象製品及び前記基準製品の特徴量の差に基づき前記対象製品及び前記基準製品の特性の優劣を予測する予測部と、を備える。
【0010】
また、本発明の他の態様の特性予測方法は、対象製品及び基準製品の特徴量の差を取得し、特性の評価基準が互いに異なる複数のグループのうちの同じグループに属する複数の製品から選択される第1製品及び第2製品の特徴量の差を説明変数、前記第1製品及び前記第2製品の特性をランク付けした特性ランクの差を目的変数として予め生成された予測モデルを用い、前記対象製品及び前記基準製品の特徴量の差に基づき前記対象製品及び前記基準製品の特性の優劣を予測する。
【0011】
また、本発明の他の態様のプログラムは、対象製品及び基準製品の特徴量の差を取得すること、及び、特性の評価基準が互いに異なる複数のグループのうちの同じグループに属する複数の製品から選択される第1製品及び第2製品の特徴量の差を説明変数、前記第1製品及び前記第2製品の特性をランク付けした特性ランクの差を目的変数として予め生成された予測モデルを用い、前記対象製品及び前記基準製品の特徴量の差に基づき前記対象製品及び前記基準製品の特性の優劣を予測すること、をコンピュータに実行させる。
【発明の効果】
【0012】
本発明によれば、評価基準が異なる場合であっても十分な訓練データ確保して予測モデルを生成することが容易となる。
【図面の簡単な説明】
【0013】
図1】評価基準が異なる複数の製品グループを説明する図である。
図2】評価基準が異なる複数の製品グループを説明する図である。
図3】特性ランクの差を3つのラベルに分類する例を説明する図である。
図4】特性予測システムの構成例を示す図である。
図5】製品データの例を示す図である。
図6】学習フェーズの手順例を示す図である。
図7】推論フェーズの手順例を示す図である。
図8A】比較例を説明するための図である。
図8B】実施例を説明するための図である。
図9A】比較例を説明するための図である。
図9B】実施例を説明するための図である。
図9C】実施例を説明するための図である。
【発明を実施するための形態】
【0014】
以下、本発明の実施形態について、図面を参照しながら説明する。
【0015】
[導入]
まず、製品の特性を官能試験等によりランク付けする際に、評価基準が異なる場合の問題点について説明する。
【0016】
例えば、n個の製品について製品データがあるとする。あるi番目の製品(i=1,2,…,n)の、設計パラメータ等の製品の特徴を表すm個の特徴量 xi1,xi2,…,xim を並べたベクトルを Xi=[xi1,xi2,…,xim]T 、特性値を yi∈R とする。また、n個の製品データをまとめて、y=[y1,y2,…,yn]T 、X=[X1,X2,…, Xn]T と表す。特性値yは特徴量Xに対して線形な関係を持ち、下記式(1)で表せるとする。
【0017】
ここで、aは定数、α=[a1,a2,…,am]T であり、a1,a2,…,am は特徴量と特性値の関係をあらわす真モデルの係数である。特性値yは直接計測することが困難であり、官能試験などによってk段階評価のランク指標(特性ランク)により評価されているとする。
【0018】
図1に示すように、評価基準が異なるL個の製品グループが存在する場合を考える。評価基準が異なるとは、例えば製品の開発案件ごとにランク評価の基準となる基準製品Sが異なる場合や評価者によって評価の仕方に差異がある場合など、評価のされ方が異なる場合である。g=1,2,…,L を製品グループの番号とし、g番目の製品グループにはn個の製品が含まれるとする。
【0019】
特性値yから製品グループ毎の評価基準で評価されたk段階のランク評価値(特性ランク)を、ig=1,2,…,ng として Yig g と表し、n個の製品データをまとめて Yg=[Y1 g,Y2 g,…,Yng g]T と表す。また、Xから製品グループgに含まれる製品を取り出したものをXと表す。ランク評価値 Yig g はそれぞれ離散値 r1,r2,r3,…,rk の何れかの値をとり、r1<r2<r3<…<rk のように順序が存在する。
【0020】
製品グループ毎に異なる基準材料S(例えば、図1の黒縁無しの丸)の特性値を YS g とする。j=1,2,…,k とし、Xig gα-YS g がランク評価の閾値θj-1j の間の値をとるとき、ランク評価値 Yig g が rj となるとする。すなわち、下記式(2)である。
【0021】
ここでは、閾値θj が全ての製品グループで共通である場合を仮定している。また、特性値がいかなる値をとってもランク評価値 Yi が r1,r2,r3,…,rk の何れかの値をとることから、θ0=-∞,θk=∞ である。
【0022】
さらに、製品グループ毎に閾値が異なる場合を考えると、上記式(2)は、下記式(3)となる。
【0023】
ここで、θj-1 gj g は製品グループ毎に異なる閾値であり、何れのgにおいてもθ0 g=-∞,θk g=∞ である。
【0024】
上記式(2)や上記式(3)の設定において、特徴量がXであるときのランク評価値Yを予測できるようなモデルを、既存の製品データから学習したいとする。
【0025】
目的変数がランク指標であるような問題において、予測モデルを学習するための方法としては、順序回帰手法などが知られているが、一般的な順序回帰手法ではデータを生成する真モデルや、目的変数がランク指標に変換されるときの関係性は、全データで共通であると仮定されていることが多い。
【0026】
製品データ中に評価基準が異なるL個の製品グループが含まれる場合において、一般的な順序回帰手法を用いてモデル学習を行うには、(i)基準材料Sやθj-1 gj g の製品グループによる違いを無視して全ての製品データから学習する、(ii)製品グループそれぞれで予測モデルを学習する(L個の予測モデルができる)、という2つの方法が考えられる。
【0027】
しかし、上記式(2)や上記式(3)のように製品グループ毎にXからYへの関係が異なるため、図2に示すように、Yが同じであっても製品グループが違えばXの値が大きく異なるということも考えられる。
【0028】
このため、(i)の方法では、正確な予測モデルを学習することは困難である。また、(ii)の方法では、製品グループ数Lが多い場合や、データ数nが極端に少ない製品グループが存在する場合などにおいて、訓練データの少なさから予測モデルの学習が困難となる場合がある。
【0029】
本実施形態によれば、以下に説明するように、製品グループによって基準材料Sやθj-1 gj g が異なる場合など、評価基準が異なる場合であっても、全データを用いて予測モデルを学習できるようになる。
【0030】
(ア)まず、上記式(2)の場合を考える。同じ製品グループgから2つの製品A,Bの特徴量 XA g ,XB g を取り出して差をとると、下記式(4)となり、製品グループによって変わる基準材料Sの影響を除去することができる。すなわち、上記式(1)のaを消すことができる。上記式(2)の場合は、閾値θj が全ての製品グループで共通であるため、2つの製品A,Bの特徴量 XA g ,XB g の差をとることで、全製品データに対する予測モデルを求めることができるようになる。
【0031】
(イ)次に、上記式(3)の場合を考える。一般的には上記式(2)のように製品グループによってランク評価の閾値が共通であることは稀であり、上記式(3)のような評価方法となっていることが多いと考えられる。同じ製品グループgから、2つの製品A,Bの特徴量 XA g ,XB g を取り出して差をとると、下記式(5)となる。
【0032】
しかしながら、閾値θj g は製品グループ毎に異なるため、このままでは全製品データに対する予測モデルは求められないおそれがある。
【0033】
そこで、製品A,Bのランク指標 YA g ,YB g を比較し、YA g の方が高い場合、YB gの方が高い場合、YA g YB g が同じランクの場合の3つのラベルへと変換する。すなわち、応答変数zが離散値z,z,zをとるとしたとき、下記のように分類する。ここでは、z<z<zである。
【0034】
ランク指標の大小関係は製品グループによって変化することはないと考えられるため、図3に示すように、この操作によってランク指標の大小関係の情報を維持しつつ、ランク指標の閾値θj-1 gj g が製品グループ毎に異なるという課題を解決し、全製品データに対する予測モデルを求めることができるようになる。
【0035】
以下、本実施形態の具体的な構成例及び手順例について説明する。
【0036】
[システム概要]
図4は、特性予測システム100の構成例を示す図である。特性予測システム100は、特性予測装置1、記憶部5、及び学習装置6を備えている。これらの機器は、例えばインターネット又はLAN等の通信ネットワークを介して相互に通信可能である。
【0037】
特性予測装置1は、制御部10を備えている。制御部10は、CPU、RAM、ROM、不揮発性メモリ、及び入出力インターフェース等を含むコンピュータである。制御部10のCPUは、ROM又は不揮発性メモリからRAMにロードされたプログラムに従って情報処理を実行する。
【0038】
制御部10は、算出部11、取得部12、及び予測部13を備えている。これらの機能部は、制御部10のCPUがROM又は不揮発性メモリからRAMにロードされたプログラムに従って情報処理を実行することによって実現される。
【0039】
プログラムは、例えば光ディスク又はメモリカード等の情報記憶媒体を介して供給されてもよいし、例えばインターネット又はLAN等の通信ネットワークを介して供給されてもよい。
【0040】
学習装置6も、特性予測装置1と同様、制御部60を備えている。制御部60は、選択部61、算出部62、取得部63、及び学習部64を備えている。なお、学習装置6は、1又は複数のサーバコンピュータで構成されてもよい。
【0041】
特性予測装置1及び学習装置6は、記憶部5にアクセス可能である。記憶部5には、学習装置6により生成された予測モデル200が、特性予測装置1により読出し可能に保存されている。
【0042】
[学習フェーズ]
図5は、学習フェーズに用いられる製品データの例を示す図である。製品データは、同図に示すようなデータベースによって製品グループ毎に管理される。データベースでは、「製品」の識別子に「特性ランク」及び複数の「特徴量」が関連付けられている。
【0043】
「特性ランク」は、製品の特性を例えば官能試験等によってランク付けした特性ランクを表す。例えば、特性に本来何らかの絶対指標があるが、それを直接測定できないために、特性のランク付けが行われる。特性は、例えば材料特性等である。
【0044】
「特徴量」は、製品の特徴量を表す。例えば特性が材料特性である場合には、特徴量には、成分値や熱処理条件などの材料特性に影響を及ぼす種々の特徴量が用いられる。
【0045】
製品データは、特性の評価基準が互いに異なる複数の製品グループに分かれている。評価基準が異なるとは、例えば、比較対象となる基準材料が異なる場合や、評価者が異なる場合など、評価のされ方が異なる場合である。
【0046】
図6は、学習装置6において実現される、実施形態に係る予測モデルの生成方法としての学習フェーズの手順例を示す図である。学習装置6の制御部60は、同図に示す処理をプログラムに従って実行することにより、選択部61、算出部62、取得部63、及び学習部64として機能する。
【0047】
まず、制御部60は、複数の製品グループのうちの同じ製品グループgに属する複数の製品から2つの製品A,Bを選択する(S11:選択部61としての処理)。
【0048】
次に、制御部60は、製品Aの特徴量X と製品Bの特徴量X との差X -X を算出する(S12:算出部62としての処理)。算出された差X -X は、予測モデルを生成するための説明変数となる。
【0049】
次に、制御部60は、製品Aの特性ランクY と製品Bの特性ランクY を比較し、特性ランクY ,Y の大小関係に応じたラベルzを分類する(S13,S14:算出部62としての処理)。ラベルzは、特性ランクの差の例であり、予測モデルを生成するための目的変数となる。
【0050】
ラベルzは、製品Aの特性ランクY よりも製品Bの特性ランクY が高い場合を表すラベルz、製品Aの特性ランクY と製品Bの特性ランクY が同じである場合を表すラベルz、及び製品Aの特性ランクY が製品Bの特性ランクY よりも高い場合を表すラベルzの3種類がある。すなわち、ラベルzは、製品A,Bの特性の優劣を表している。
【0051】
このようにして、製品A,Bの特徴量の差X -X を説明変数、特性ランクの大小関係に応じたラベルzを目的変数とした訓練データが生成される。
【0052】
詳しくは、制御部60は、同じ製品グループgに属する複数の製品から、組み合わせを変えて製品A,Bの組を複数生成し、それぞれについて訓練データを生成する。例えば、製品グループgに属する製品の数をnとするとき、最大 個の訓練データを生成することができる。さらに、制御部60は、複数の製品グループのそれぞれにおいて、同様に製品A,Bの組を複数生成し、それぞれについて訓練データを生成する。このようにして、多数の訓練データを生成することが可能となる。
【0053】
なお、制御部60は、同じ製品グループgに属するn個の製品から組み合わせを変えて生成された全 個の製品A,Bの組のうち、特性ランクの差が0の組(z=zの組)の一部または全部を除外してもよい。これにより、特性ランクに差がある製品A,Bの組の割合を増やすことができるので、特性ランクの大小関係を効率的に学習することが可能となる。
【0054】
次に、制御部60は、製品A,Bの特徴量の差X -X を説明変数、特性ランクの大小関係に応じたラベルzを目的変数とした訓練データを用いて順序回帰により予測モデルを生成し、予測モデルのパラメータβ,Θ,Θを算出する(S15,S16:取得部63及び学習部64としての処理)。
【0055】
予測モデルは、対象製品及び基準製品の特徴量の差に基づき対象製品及び基準製品の特性の優劣を予測するためのものである。予測モデルのパラメータのうち、βは回帰係数であり、Θはラベルzとzの閾値であり、Θはラベルzとzの閾値である。
【0056】
このように、特徴量の差を説明変数、特性ランクの差を目的変数とすることで、製品グループ毎に異なる基準に対応する項a(上記式(1)参照)を消すことができるので、評価基準が異なる複数の製品グループがあっても、十分な訓練データを確保することが可能となる。すなわち、複数の製品グループのそれぞれで生成された訓練データをまとめて予測モデルの生成に利用することが可能となる。
【0057】
また、目的変数を特性ランクの優劣を表す3つのラベルz,z,zとすることで、製品グループによってランクの閾値が異なる場合や、同じ製品グループで各ランクの幅が異なる場合であっても、特性の優劣に関しては製品グループ等によらず共通であるため、複数の製品グループのそれぞれで生成された訓練データをまとめて予測モデルの生成に利用することが可能となる。
【0058】
[推論フェーズ]
図7は、特性予測装置1において実現される、実施形態に係る特性予測方法としての推論フェーズの手順例を示す図である。特性予測装置1の制御部10は、同図に示す処理をプログラムに従って実行することにより、算出部11、取得部12、及び予測部13として機能する。
【0059】
まず、制御部10は、特性を予測したい製品P(以下、対象製品Pという)の特徴量Xを取得する(S21)。
【0060】
次に、制御部10は、対象製品Pと同じ製品グループから選択される、対象製品Pと比較したい製品Q(以下、基準製品Qという)の特徴量Xも取得する(S22)。
【0061】
次に、制御部10は、対象製品Pの特徴量Xと基準製品Qの特徴量Xとの差X-Xを算出する(S23:算出部11としての処理)。
【0062】
次に、制御部10は、上記学習フェーズで算出した予測モデルのパラメータを用いて、対象製品Pと基準製品Qの特性の優劣を予測する(S24,S25:取得部12及び予測部13としての処理)。
【0063】
具体的には、制御部10は、対象製品Pと基準製品Qの特徴量の差X-Xに回帰係数βを乗じた(X-X)βの値を閾値Θ,Θと比較して、3つのラベルz,z,zの何れに分類されるか予測する。
【0064】
ラベルzであれば、対象製品Pの特性は基準製品Qよりも劣っていることを表し、ラベルzであれば、対象製品Pの特性は基準製品Qと同程度であることを表し、ラベルzであれば、対象製品Pの特性は基準製品Qよりも優れていることを表す。
【0065】
このようにして、対象製品Pと基準製品Qの特性の優劣が予測される。このような予測手法は、新しい製品を開発する際など、その製品の特性がどの程度になるかを予測したい場合において有用である。
【0066】
さらに、基準製品Qを様々に変えることで、それぞれの基準製品Qに対する対象製品Pの特性の優劣を求めることができる。この結果を総合することで、対象製品Pの特性ランクYを予測することも可能である。例えば、基準製品Q1の特性ランクYQ1がr、基準製品Q2の特性ランクYQ2がrであり、対象製品Pの特性ランクYとの優劣がY>YQ1、Y<YQ2である場合には、対象製品Pの特性ランクYはrであると予測できる。
【0067】
[変形例]
以下、訓練データの生成に係る変形例について説明する。
【0068】
(A)同じ製品グループgに属するn個の製品から2つの製品A,Bを選択する際、グループ内でとり得る 通りの全ての組み合わせを訓練データに用いてもよい。この場合、製品グループ内の製品データを最大限に利用することができるため、データ数が少ない製品グループがある場合や特徴量の次元数が大きい場合など、訓練データ数を多く確保したい場合に有用である。
【0069】
(B)同じ製品グループgに属する複数の製品から2つの製品A,Bを選択する際、2つの製品A,Bの片方をランク評価の基準となる基準製品Sに固定してもよい。この場合、製品Aの特性ランクY は基準製品Sの特性ランクY を基準に評価されているため、Y とY の大小関係は正確であると考えられ、zの分類がより正確な訓練データを生成することが可能となる。
【0070】
(C)同じ製品グループgに属する複数の製品から2つの製品A,Bを選択する際、特性ランクY ,Y の差が大きい製品A,Bの組を優先してもよい。すなわち、特性ランクY ,Y の差が0である製品A,Bの組の一部または全部を除外してもよい。この場合、予測モデルがzに分類する傾向を強く学習してしまうことを抑制することが可能となる。
【0071】
(D)同じ製品グループgに属する複数の製品から2つの製品A,Bを選択して特徴量の差を算出する際、X -X だけでなく、X -X を使用してもよい。この場合、X -X がzに分類されるときはX -X はzに分類されるため、X -X だけではz,zの一方の数が十分でない場合も、z,zの両方への分類をうまく学習させることが可能となる。
【0072】
(E)特徴量Xについて、製品データに含まれる全ての特徴量を必ずしも使用する必要はなく、特性yへの関係が強いと考えられる特徴量を選択してXを構成してもよい。使用する特徴量が必要以上に多い場合、求める回帰係数βのパラメータ数が多くなり、予測モデルの学習に多くの訓練データが必要となってしまう。そこで、製品データが潤沢でない場合には、特性への関係が弱い特徴量を除外することで、予測モデルを学習しやすくすることが可能となる。
【0073】
(F)特徴量Xには、例えば成分量や製造工程条件といった特徴量を2乗したものや、特徴量同士を掛け合わせたもの等を追加してもよい。例えば、(xi1を特徴量Xに追加した場合、上記式(1)の右辺にai1+am+1(xi1が含まれるようになるため、xi1と特性yの2次関数的な関係を表現できるような予測モデルを得ることが可能となる。
【0074】
[実施例1]
上記(B)の効果について説明する。特徴量が1種類(m=1、X=x)、5段階評価(k=5)、製品グループ数L=4、特性の真値の生成モデルが線形であるようなデータを人工的に作成した。このデータでは、製品グループ毎に特徴量の範囲が異なる設定とした。
【0075】
図8Aは、縦軸を製品グループ毎に求めた特性ランクY、横軸をxとしてプロットしたグラフである。同図では、見やすくするため、実際のデータ数よりも点数を減らしてプロットしている(以降の図も同じ)。このようなデータに対し、xを説明変数、Yを目的変数として作成した訓練データに一般的な順序回帰手法を適用して学習した予測モデルにより、同じ生成モデルから作成した検証用データのランク評価値を予測したときの結果が正答である割合は28.2%であった。
【0076】
一方、図8Bは、上記(B)に基づき、xの差をとったx-xを横軸、ラベルzを縦軸としてプロットしたグラフである。この図から分かるとおり、製品グループ毎のランク評価基準の違いが取り払われ、zへ線形に分類する予測モデルを全てのデータから学習できるようになる。x-xを説明変数、zを目的変数として作成した訓練データに一般的な順序回帰手法を適用して予測モデルを学習した。さらに、検証用データの各点に対し訓練データ中の複数の点と大小を比較してランク評価値を求めた結果が正答である割合は96.0%であった。
【0077】
[実施例2]
上記(F)の効果について説明する。実施例1と同様にデータを人工的に作成した。但し、特性の真値の生成モデルがy=Axと表されるようなデータとし、その他の設定は実施例1と同じとした。
【0078】
図9Aは、縦軸を製品グループ毎に求めた特性ランクY、横軸をxとしてプロットしたグラフである。このようなデータに対し、xを説明変数、Yを目的変数として作成した訓練データに一般的な順序回帰手法を適用して学習した予測モデルにより、検証用データのランク評価値を予測したときの結果が正答である割合は33.1%であった。
【0079】
また、上記(B)に基づき、x-xを説明変数、zを目的変数として作成した訓練データに一般的な順序回帰手法を適用して予測モデルを学習し、検証用データの各点に対し訓練データ中の複数の点と大小を比較してランク評価値を求めた結果が正答である割合は33.1%であった。
【0080】
一方、上記(F)に基づき、特徴量にxを追加してX=[x,xとした。図9Bは、ラベルzを縦軸として、Xの差をとったx-xのうち、xの項を横軸としたグラフである。図9Cは、xの項を横軸としたグラフである。これらの図から分かるとおり、X=xのみではzへの線形な分類は困難であるが、xを追加することでzへ線形に分類する予測モデルを構築できるようになる。
【0081】
さらに、上記(B)に基づきx-xを説明変数、zを目的変数として作成した訓練データに一般的な順序回帰手法を適用して予測モデルを学習し、検証用データの各点に対し訓練データ中の複数の点と大小を比較してランク評価値を求めた結果が正答である割合は87.1%となった。
【0082】
以上、本発明の実施形態について説明したが、本発明は以上に説明した実施形態に限定されるものではなく、種々の変更が当業者にとって可能であることはもちろんである。
【符号の説明】
【0083】
1 特性予測装置、10 制御部、11 算出部、12 取得部、13 予測部、5 記憶部、6 学習装置、60 制御部、61 選択部、62 算出部、63 取得部、64 学習部、100 特性予測システム、200 予測モデル

図1
図2
図3
図4
図5
図6
図7
図8A
図8B
図9A
図9B
図9C