特開2024-37024 | 知財ポータル「IP Force」

知財求人 - 知財ポータルサイト「IP Force」

▶ 日新電機株式会社の特許一覧 ▶ 国立大学法人京都工芸繊維大学の特許一覧

特開2024-37024モデル生成装置およびモデル生成方法

書誌要約請求の範囲詳細な説明課題実施例実施するための形態図面の説明

目に優しい文字サイズ小中大 PDF Top

< >

1
2
3
4
5
6
7
8
9
10
11
12
13
14
15
16
17
18
19

(19)【発行国】日本国特許庁(JP)

(12)【公報種別】公開特許公報(A)

(11)【公開番号】P2024037024

(43)【公開日】2024-03-18

(54)【発明の名称】モデル生成装置およびモデル生成方法

(51)【国際特許分類】

G06N 20/00 20190101AFI20240311BHJP

G06F 30/10 20200101ALI20240311BHJP

G06F 30/27 20200101ALI20240311BHJP

G06F 16/9035 20190101ALI20240311BHJP

【ＦＩ】

G06N20/00

G06F30/10

G06F30/27

G06F16/9035

【審査請求】未請求

【請求項の数】6

【出願形態】ＯＬ

(21)【出願番号】P 2022141643

(22)【出願日】2022-09-06

(71)【出願人】

【識別番号】000003942

【氏名又は名称】日新電機株式会社

(71)【出願人】

【識別番号】504255685

【氏名又は名称】国立大学法人京都工芸繊維大学

(74)【代理人】

【識別番号】110000338

【氏名又は名称】弁理士法人ＨＡＲＡＫＥＮＺＯＷＯＲＬＤＰＡＴＥＮＴ＆ＴＲＡＤＥＭＡＲＫ

(72)【発明者】

【氏名】森本充

(72)【発明者】

【氏名】竹原輝巳

(72)【発明者】

【氏名】寶珍輝尚

【テーマコード（参考）】

5B146

5B175

【Ｆターム（参考）】

5B146DC03

5B146DC04

5B146DL04

5B146DL08

5B175DA10

5B175HA01

(57)【要約】

【課題】図面検索を行うために適正な学習モデルを見出すまでに要する学習時間の延伸を抑制することができる。
【解決手段】学習装置（１１）において、学習モデル生成部（１１３）は、（ｉ）複数の前処理後内容パラメータセットのそれぞれを用いて、複数の学習モデルを生成し、（ｉｉ）上記複数の学習モデルのそれぞれの品質を示す複数の指標値を取得する。学習モデル生成部（１１３）は、所定の最適化手法に従って、上記複数の指標値に基づいてよりよい指標値を有する学習モデルを探索することにより、複数種類の前処理手法の内、よりよい指標値を有する当該学習モデルに対応する前処理手法を、適正前処理手法として選択する。
【選択図】図１６

【特許請求の範囲】

【請求項1】

複数の検索対象図面の内からターゲット図面に対応する少なくとも１つの図面を検索するための学習モデルを生成するモデル生成装置であって、
上記複数の検索対象図面を解析することにより、上記複数の検索対象図面のそれぞれの記載内容に関連した複数の内容パラメータを含む内容パラメータセットを取得する取得部と、
所定の複数種類の前処理手法の組み合わせに従って、上記内容パラメータセットに含まれる上記複数の内容パラメータのそれぞれを前処理することにより、複数の前処理後内容パラメータをそれぞれ含む複数の前処理後内容パラメータセットを生成する前処理部と、
（ｉ）機械学習アルゴリズムを適用することにより、上記複数の前処理後内容パラメータセットのそれぞれを用いて、複数の学習モデルを生成し、（ｉｉ）上記複数の前処理後内容パラメータセットのそれぞれを用いて上記複数の学習モデルのそれぞれを検証することにより上記複数の学習モデルのそれぞれの品質を示す複数の指標値を取得する学習部と、を備えており、
上記学習部は、所定の最適化手法に従って、上記複数の指標値に基づいてよりよい指標値を有する学習モデルを探索することにより、上記複数種類の前処理手法の内、よりよい指標値を有する当該学習モデルに対応する前処理手法を、適正前処理手法として選択する、モデル生成装置。

【請求項2】

上記学習部は、上記複数の前処理後内容パラメータセットおよび複数種類の機械学習アルゴリズムごとに、
上記複数種類の機械学習アルゴリズムのそれぞれにおいて設定される複数のハイパーパラメータ設定のそれぞれを用いて、上記複数の学習モデルを生成し、
上記所定の最適化手法に従って、上記複数の指標値に基づいてよりよい指標値を有する上記学習モデルを探索することにより、上記複数種類の前処理手法の内、よりよい指標値を有する上記学習モデルに対応する前処理手法を、上記適正前処理手法として選択する、請求項１に記載のモデル生成装置。

【請求項3】

上記学習部は、複数のハイパーパラメータ設定をそれぞれ設定した複数種類の機械学習アルゴリズムのそれぞれを、上記複数の前処理後内容パラメータセットのそれぞれに適用することにより、上記複数の学習モデルを生成する、請求項１に記載のモデル生成装置。

【請求項4】

上記最適化手法は、離散的な上記複数の前処理後内容パラメータに対して適用可能な最適化手法である、請求項１～３のいずれか１項に記載のモデル生成装置。

【請求項5】

上記最適化手法は、ネルダー・ミード法またはパウエル法である、請求項４に記載のモデル生成装置。

【請求項6】

複数の検索対象図面の内からターゲット図面に対応する少なくとも１つの図面を検索するための学習モデルを生成するモデル生成方法であって、
上記複数の検索対象図面を解析することにより、上記複数の検索対象図面のそれぞれの記載内容に関連した複数の内容パラメータを含む内容パラメータセットを取得する取得工程と、
所定の複数種類の前処理手法の組み合わせに従って、上記内容パラメータセットに含まれる上記複数の内容パラメータのそれぞれを前処理することにより、複数の前処理後内容パラメータをそれぞれ含む複数の前処理後内容パラメータセットを生成する前処理工程と、
（ｉ）機械学習アルゴリズムを適用することにより、上記複数の前処理後内容パラメータセットのそれぞれを用いて、複数の学習モデルを生成し、（ｉｉ）上記複数の前処理後内容パラメータセットのそれぞれを用いて上記複数の学習モデルのそれぞれを検証することにより上記複数の学習モデルのそれぞれの品質を示す複数の指標値を取得する学習工程と、を含んでおり、
上記学習工程において、所定の最適化手法に従って、上記複数の指標値に基づいてよりよい指標値を有する学習モデルを探索することにより、上記複数種類の前処理手法の内、よりよい指標値を有する学習モデルに対応する前処理手法を、適正前処理手法として選択する、モデル生成方法。

【発明の詳細な説明】

【技術分野】

【0001】

本発明の一態様は、図面検索を行うための学習モデルを生成するモデル生成装置に関する。

【背景技術】

【0002】

例えば、プラントエンジニアリング分野では、大量の図面（例：過去図面）の取り扱いが必要となる。このため、大量の図面の内から、所望の図面を効率的に検索するための技術が提案されている。

【0003】

一例として、特許文献１には、図面検索におけるユーザの利便性を高めることを目的とした技術が開示されている。具体的には、特許文献１の技術では、機械学習を利用して、図面検索を行うための学習モデルが生成される。

【先行技術文献】

【特許文献】

【0004】

【特許文献1】特開２０２１－１２４１３号公報

【発明の概要】

【発明が解決しようとする課題】

【0005】

本発明の一態様は、図面検索を行うために適正な学習モデルを見出すまでに要する学習時間の延伸を抑制することを目的とする。

【課題を解決するための手段】

【0006】

上記の課題を解決するために、本発明の一態様に係るモデル生成装置は、複数の検索対象図面の内からターゲット図面に対応する少なくとも１つの図面を検索するための学習モデルを生成するモデル生成装置であって、上記複数の検索対象図面を解析することにより、上記複数の検索対象図面のそれぞれの記載内容に関連した複数の内容パラメータを含む内容パラメータセットを取得する取得部と、所定の複数種類の前処理手法の組み合わせに従って、上記内容パラメータセットに含まれる上記複数の内容パラメータのそれぞれを前処理することにより、複数の前処理後内容パラメータをそれぞれ含む複数の前処理後内容パラメータセットを生成する前処理部と、（ｉ）機械学習アルゴリズムを適用することにより、上記複数の前処理後内容パラメータセットのそれぞれを用いて、複数の学習モデルを生成し、（ｉｉ）上記複数の前処理後内容パラメータセットのそれぞれを用いて上記複数の学習モデルのそれぞれを検証することにより上記複数の学習モデルのそれぞれの品質を示す複数の指標値を取得する学習部と、を備えており、上記学習部は、所定の最適化手法に従って、上記複数の指標値に基づいてよりよい指標値を有する学習モデルを探索することにより、上記複数種類の前処理手法の内、よりよい指標値を有する当該学習モデルに対応する前処理手法を、適正前処理手法として選択する。

【0007】

また、本発明の一態様に係るモデル生成方法は、複数の検索対象図面の内からターゲット図面に対応する少なくとも１つの図面を検索するための学習モデルを生成するモデル生成方法であって、上記複数の検索対象図面を解析することにより、上記複数の検索対象図面のそれぞれの記載内容に関連した複数の内容パラメータを含む内容パラメータセットを取得する取得工程と、所定の複数種類の前処理手法の組み合わせに従って、上記内容パラメータセットに含まれる上記複数の内容パラメータのそれぞれを前処理することにより、複数の前処理後内容パラメータをそれぞれ含む複数の前処理後内容パラメータセットを生成する前処理工程と、（ｉ）機械学習アルゴリズムを適用することにより、上記複数の前処理後内容パラメータセットのそれぞれを用いて、複数の学習モデルを生成し、（ｉｉ）上記複数の前処理後内容パラメータセットのそれぞれを用いて上記複数の学習モデルのそれぞれを検証することにより上記複数の学習モデルのそれぞれの品質を示す複数の指標値を取得する学習工程と、を含んでおり、上記学習工程において、所定の最適化手法に従って、上記複数の指標値に基づいてよりよい指標値を有する学習モデルを探索することにより、上記複数種類の前処理手法の内、よりよい指標値を有する学習モデルに対応する前処理手法を、適正前処理手法として選択する、

【発明の効果】

【0008】

本発明の一態様によれば、図面検索を行うために適正な学習モデルを見出すまでに要する学習時間の延伸を抑制することができる。

【図面の簡単な説明】

【0009】

【図1】参考形態における情報処理システムの要部の構成を示すブロック図である。

【図2】参考形態における過去物件・図面対応テーブルの一例を示す図である。

【図3】参考形態における過去図面内容パラメータテーブルの一例を示す図である。

【図4】参考形態における、初期状態における内容パラメータ設定テーブルの一例を示す図である。

【図5】参考形態における、各データセットにおける前処理後内容パラメータ数の一例を示す図である。

【図6】参考形態における、データセット１のデータ構造を模式的に例示する図である。

【図7】参考形態における、正規化用データ表および標準化用データ表の一例を示す図である。

【図8】参考形態における、データセット・前処理手法対応テーブルの一例を示す図である。

【図9】参考形態において、学習用前処理部によって生成された複数のデータセットの内の一部を例示する図である。

【図10】参考形態における、評価結果テーブルの一例を示す図である。

【図11】参考形態における、更新後の内容パラメータ設定テーブルの一例を示す図である。

【図12】参考形態における、新規図面内容パラメータテーブルの一例を示す図である。

【図13】参考形態における、前処理後新規図面内容パラメータテーブルの一例を示す図である。

【図14】参考形態における、複数の生値・ラベル値変換テーブルの内の一部を例示する図である。

【図15】参考形態における、生値・ラベル値変換統合テーブルの一例を表す。

【図16】実施形態１における情報処理システムの要部の構成を示すブロック図である。

【図17】学習モデル生成部の主要な処理の流れを概略的に示すフローチャートである。

【図18】ネルダー・ミード法の概念を概略的に説明するための図である。

【図19】最適化を実行する処理の流れを示すフローチャートである。

【発明を実施するための形態】

【0010】

〔参考形態〕
実施形態１の情報処理システム１００の説明に先立ち、参考形態としての情報処理システム１００ｓについて述べる。説明の便宜上、参考形態にて説明した構成要素（コンポーネント）と同じ機能を有する構成要素については、以降の各実施形態では、同じ符号を付記し、その説明を繰り返さない。また、簡潔化のため、公知技術と同様の事項についても、説明を適宜省略する。

【0011】

本明細書において以下に述べる各数値は、単なる一例であることに留意されたい。本明細書では、２つの数ＡおよびＢについての「Ａ～Ｂ」という記載は、特に明示されない限り、「Ａ以上かつＢ以下」を意味するものとする。

【0012】

（情報処理システム１００ｓの概要）
図１は、情報処理システム１００ｓの要部の構成を示すブロック図である。情報処理システム１００ｓは、情報処理装置１ｓ、過去物件図面ＤＢ（Database）９１、および新規物件図面ＤＢ９２を備える。

【0013】

情報処理装置１ｓは、制御装置１０ｓ、入力部７１、表示部７２、および記憶部８０を備える。制御装置１０ｓは、学習装置１１ｓおよび図面検索装置１２を備える。本明細書の「物件」とは、例えば、プラントエンジニアリングにおける「サイト」を意味する。

【0014】

情報処理装置１ｓは、過去物件図面ＤＢ９１および新規物件図面ＤＢ９２と通信可能に接続されていればよい。このため、図１の例とは異なり、情報処理装置１ｓの内部に、過去物件図面ＤＢ９１および新規物件図面ＤＢ９２の少なくとも一方が設けられていてもよい。

【0015】

情報処理装置１ｓ（より具体的には、制御装置１０ｓ）による検索対象となる図面（検索対象図面）には、例えば、仕様図面、設計図面、および製作図面が含まれる。また、検索対象図面には、仕様書、設計書、および、見積書が含まれていてもよい。このように、検索対象図面は、「図面」という名称が含まれている書面に限定されない。一例として、検索対象図面には、プラントエンジニアリング分野におけるプロジェクトの計画に関する任意の種類の書面が含まれる。

【0016】

但し、当業者であれば明らかである通り、本発明の一態様に係る情報処理装置は、プラントエンジニアリング以外の分野における図面の検索についても適用可能である。本発明の一態様に係る図面は、上記情報処理装置によって内容パラメータを取得することが可能な図面であればよい。

【0017】

制御装置１０ｓは、情報処理装置１ｓの各部を統括的に制御する。記憶部８０は、制御装置１０ｓの処理に用いられる各種のデータおよびプログラムを格納する。以下に述べるように、制御装置１０ｓは、機械学習を利用して、複数の検索対象図面（例：過去図面ａ１～ＭＮ）から、ターゲット図面（例：図面ＮＤ）に対応する少なくとも１つの図面を検索する。

【0018】

入力部７１は、ユーザの操作（ユーザ操作）を受け付ける。表示部７２は、各種のデータを表示する。一例として、表示部７２には、制御装置１０ｓによる検索結果を示すデータが表示されてよい。なお、入力部７１と表示部７２とは、一体として設けられてもよい。例えば、タッチパネルを用いることにより、入力部７１と表示部７２とを一体化できる。

【0019】

（過去物件図面ＤＢ９１）
過去物件図面ＤＢ９１には、過去の各物件（既設の各物件）に関する各図面（厳密には、図面データ）が格納されている。以下の説明では、「図面Ａ（ある図面）の図面データ」を、単に「図面Ａ」と適宜略称する。また、「図面Ａの図面番号」を、単に「図面Ａ」と適宜略称する。

【0020】

参考形態では、過去物件図面ＤＢ９１には、複数のＭ個の異なる物件のそれぞれについての各図面が格納されている。Ｍは、１以上の整数である。以下、ｊ番目の物件を、「物件ｊ」とも称する。ｊは、１以上かつＭ以下の整数である。

【0021】

また、過去物件図面ＤＢ９１には、物件１～Ｍのそれぞれについて、Ｎ個（Ｎ種類）の異なる図面が格納されている。Ｎは、１以上の整数である。以下、物件ｊにおけるｉ番目の図面を、「図面（ｉ，ｊ）」とも称する。また、各物件におけるｉ番目（ｉ種類目）の図面を、総称的に図面ｉとも称する。ｉは、１以上かつＮ以下の整数である。

【0022】

以上のように、過去物件図面ＤＢ９１には、合計でＴ個の図面が格納されている。参考形態の例では、Ｔ＝Ｍ×Ｎである。Ｔは、２以上の整数であるものとする。つまり、ＭおよびＮの少なくとも１つは、１以上であるものとする。

【0023】

具体的には、過去物件図面ＤＢ９１では、特許文献１と同様に、図２に示す過去物件・図面対応テーブルＴＢ１の形態で、各種類の図面番号が物件番号毎にリスト化されている。以下、過去物件・図面対応テーブルＴＢ１を、「ＴＢ１」とも略記する。その他の要素についても、適宜同様に略記する。ＴＢ１のｉ行ｊ列目のセルは、図面（ｉ，ｊ）の図面番号を示す。

【0024】

図２の例では、便宜上、物件１～３をそれぞれ、物件Ａ～Ｃとも表記する。図２の例では、１種類目の図面（図面１）は外形図であり、２種類目の図面（図面２）は組立図であり、３種類目の図面（図面３）は基礎図である。また、Ｎ種類目の図面（図面Ｎ）は構成図である。

【0025】

以下では、簡単のため、図２の例における図面（１，１）～（Ｎ，１）（すなわち、物件ＡにおけるＮ種類のそれぞれの図面）を、図面ａ１～ａＮとも表記する。例えば、図２の例における図面ａ１～ａＮはそれぞれ、物件Ａの外形図～構成図を指す。その他の物件における各図面についても、同様に表記する。

【0026】

以上のように、過去物件図面ＤＢ９１には、図面ａ１から図面ＭＮまでの、合計Ｔ個の図面が格納されている。以下、図面ａ１～ＭＮを総称的に、過去図面とも称する。過去図面は、検索対象図面の一例である。このため、図面ａ１～ＭＮは、検索対象図面群とも称される。

【0027】

また、本明細書では、複数の過去図面（検索対象図面）のうちの任意の１つの図面を、候補図面とも称する。一例として、図面ａ１（物件Ａの外形図）を候補図面とした場合の、各処理について主に例示する。その他の図面に対する処理については、適宜説明を省略するが、図面ａ１の場合と同様である。

【0028】

（新規物件図面ＤＢ９２）
新規物件図面ＤＢ９２には、新規物件（例：これから建設が行われる予定である、少なくとも１つの物件）に関する各図面（以下、総称的に新規図面とも称する）が、新規物件データセットとして格納されている。本明細書では、新規物件データセットに含まれる１つの新規物件（物件Ｔ）について述べる。

【0029】

一例として、新規物件図面ＤＢ９２には、物件Ｔについて、過去物件と同種類のＮ個の異なる図面（外形図～構成図）が格納されている。本明細書では、物件Ｔの外形図を、新規図面の一例として例示する。以下、物件Ｔの外形図を、図面ＮＤと称する。参考形態における図面ＮＤは、特許文献１と同様であるものとする。

【0030】

（学習装置１１ｓ）
学習装置１１ｓは、過去図面データ取得部１１１、過去図面内容パラメータ取得部１１２（候補図面内容パラメータ取得部，検索対象図面内容パラメータ取得部，取得部）、学習用前処理部１１４（前処理部）、および学習モデル生成部１１３ｓを備える。学習装置１１ｓは、図面ａ１～ＭＮに基づき、図面検索装置１２ｓによる図面検索のための学習モデルを生成する。このことから、学習装置１１ｓは、モデル生成装置と称されてもよい。以下、学習装置１１ｓの処理の流れの一例について述べる。

【0031】

（候補図面の取得）
過去物件図面ＤＢ９１では、ＴＢ１に従って、図面ａ１～ＭＮが、図面種類別に予めソートされている。従って、例えば、過去図面データ取得部１１１は、「図面ａ１→ｂ１→…→Ｍ１」の順に、各外形図を過去物件図面ＤＢ９１から取得する。続いて、過去図面データ取得部１１１は、「図面ａ２→ｂ２→…→Ｍ２」の順に、各組立図を過去物件図面ＤＢ９１から取得する。そして、最終的には、過去図面データ取得部１１１は、「図面ａＮ→ｂＮ→…→ＭＮ」の順に、各構成図を過去物件図面ＤＢ９１から取得する。参考形態におけるこれらの図面ａ１～ＭＮは、特許文献１と同様であるものとする。

【0032】

上記の例の場合、過去図面データ取得部１１１は、はじめにＴＢ１の１行１列目のセルを参照する。そして、過去図面データ取得部１１１は、上記セルに対応する図面（１，１）、すなわち図面ａ１を、過去物件図面ＤＢ９１から取得する。過去図面データ取得部１１１は、取得した図面ａ１を、過去図面内容パラメータ取得部１１２に供給する。

【0033】

（候補図面に対応する内容パラメータセットの取得）
過去図面内容パラメータ取得部１１２は、特許文献１と同様にして、図面ａ１を解析することにより（より詳細には、ＯＣＲ処理後の図面ａ１に対して、以下に述べる第ｋ特定文字列に着目した構文解析を行うことにより）、当該図面ａ１に対応する内容パラメータセットを取得する。内容パラメータセットは、第ｋ特定文字列に対応付けられた第ｋ内容パラメータ（以下、Ａｋ）を示すデータセットである。また、第１～第Ｌ内容パラメータを総称的に、内容パラメータとも称する。

【0034】

本明細書では、各図面について予め設定された特定の文字列（ストリング）を、特定文字列と称する。参考形態では、Ｌ個（Ｌは２以上の整数）の異なる第ｋ特定文字列が、予め設定されているものとする。以下では、ｋ番目の特定文字列を、第ｋ特定文字列と称する。ｋは、１以上かつＬ以下の整数である。以下の説明では、第１特定文字列が「電圧値」、第２特定文字列が「電流値」、第３特定文字列が「ＯＲ」、第Ｌ特定文字列が「開」として設定されている場合について、例示する。

【0035】

内容パラメータは、図面の記載内容（具体的には、特定文字列に係る記載内容）に関連付けられた量である。従って、内容パラメータは、当該記載内容を数値化（定量化）したデータの１つであると言える。このため、内容パラメータは、図面の記載内容を示す指標として用いられる。

【0036】

なお、後述するターゲット図面内容パラメータとの区別のため、検索対象図面（過去図面）の内容パラメータを、検索対象図面内容パラメータとも称する。また、検索対象図面の第ｋ内容パラメータを、検索対象図面第ｋ内容パラメータとも称する。但し、以下の説明では、特に明示されない限り、内容パラメータは、過去図面内容パラメータを指すものとする。同様に、特に明示されない限り、内容パラメータセットは、過去図面内容パラメータセットを指すものとする。

【0037】

本明細書では、図面（ｉ，ｊ）のＡｋを、Ａｋ（ｉ，ｊ）とも表記する。上述の通り、過去図面内容パラメータ取得部１１２は、図面（ｉ，ｊ）に対する解析結果（より具体的には、図面（ｉ，ｊ）における特定文字列の検出結果）に基づき、Ａｋ（ｉ，ｊ）を設定する。

【0038】

以上のように、過去図面内容パラメータ取得部１１２は、図面ａ１について、Ａ１～ＡＬを設定する。以上のように、過去図面内容パラメータ取得部１１２は、候補図面を解析することにより、当該候補図面の内容パラメータを取得する。このことから、過去図面内容パラメータ取得部１１２は、候補図面内容パラメータ取得部とも呼称される。

【0039】

また、過去図面内容パラメータ取得部１１２は、その他の過去図面についても、同様の処理を行う。すなわち、過去図面内容パラメータ取得部１１２は、図面ａ１～ＭＮのそれぞれに対し、Ａ１～ＡＬを設定する。

【0040】

その後、過去図面内容パラメータ取得部１１２は、図面ａ１～ＭＮのそれぞれのＡ１～ＡＬ、すなわち、Ａ１（１，１）～ＡＬ（Ｍ，Ｎ）、を示す過去図面内容パラメータテーブルＴＢ２を生成する。

【0041】

ＴＢ２には、過去図面内容パラメータテーブル内第ｉサブテーブルＴＢ２－ｉが含まれている。図３には、一例として、ＴＢ２－１が示されている。ＴＢ２－ｉは、図面ｉのそれぞれのＡ１～ＡＬを示すテーブルである。ＴＢ２－１には、図面ａ１～Ｍ１（物件Ａ～Ｍの外形図）のそれぞれのＡ１～ＡＬが示されている。ＴＢ２は、ＴＢ２－１～ＴＢ２－Ｎという、Ｎ個のサブテーブルのセットによって構成されている。このように、参考形態では、図面種別ごとにサブテーブルが作成される。参考形態におけるこれらのサブテーブルは、特許文献１と同様であるものとする。

【0042】

ＴＢ２には、複数の過去図面のそれぞれ（例：図面ａ１）の番号（識別子の一例）と、当該複数の過去図面のそれぞれのＡ１～ＡＬとの対応関係が示されている。そこで、学習モデル生成部１１３ｓは、ＴＢ２を教師データとして取得する。一例として、学習モデル生成部１１３ｓは、当該教師データを用いた多項ロジスティック回帰を行うことにより、学習モデルを生成してよい。但し、後述の説明からも明らかである通り、本発明の一態様に係る機械学習アルゴリズムは、この例に限定されず、公知のその他のアルゴリズムが適用されてよい。なお、機械学習における正解データとしては、ＴＢ２において示されている各過去図面の番号（識別子）が用いられる。

【0043】

参考形態では、過去図面内容パラメータ取得部１１２は、第ｋ内容パラメータを取得するとともに、当該第ｋ内容パラメータの変数種類を示す情報（第ｋ内容パラメータ変数種類情報）をさらに取得する。第ｋ内容パラメータ変数種類情報とは、第ｋ内容パラメータの変数種類（データ種類）を示す情報である。具体的には、第ｋ内容パラメータ変数種類情報とは、第ｋ内容パラメータが質的変数（以下、ＶＬと表記）または量的変数（以下、ＶＮと表記）のいずれであるかを示す情報である。以下、第１～第ｋ内容パラメータ変数種類情報を総称的に、内容パラメータ変数種類情報と称する。

【0044】

一例として、過去図面内容パラメータ取得部１１２は、上述の構文解析の結果に基づいて、内容パラメータ変数種類情報を取得してよい。例えば、上述の通り、過去図面内容パラメータ取得部１１２は、構文解析の結果、第１特定文字列「電圧値」に後続する文字列「９０Ｖ」に含まれる数値「９０」が、電圧値の大きさであると判定する。この場合、過去図面内容パラメータ取得部１１２は、第１内容パラメータはＶＮであると判定する。同様に、過去図面内容パラメータ取得部１１２は、第２内容パラメータはＶＮであると判定する。

【0045】

また、過去図面内容パラメータ取得部１１２は、構文解析の結果、第３特定文字列「ＯＲ」は、量的変数に対応する文字が後続していない旨を判定する。この場合、過去図面内容パラメータ取得部１１２は、第３内容パラメータはＶＬであると判定する。同様に、過去図面内容パラメータ取得部１１２は、第Ｌ内容パラメータはＶＬであると判定する。

【0046】

（学習用前処理部１１４における処理の一例）
学習用前処理部１１４は、過去図面内容パラメータ取得部１１２から、図面ａ１～ＭＮに対応する内容パラメータセット（図面ａ１～ＭＮのそれぞれの第１～第Ｌ内容パラメータ）、および、内容パラメータ変数種類情報を取得する。そして、学習用前処理部１１４は、取得した内容パラメータ変数種類情報に応じて、内容パラメータ設定テーブルＴＢ３を生成する。

【0047】

以下の説明では、図面ａ１～Ｍ１（外形図）の内容パラメータセット（図面ａ１～Ｍ１のそれぞれの第１～第Ｌ内容パラメータ）に基づく各処理について主に述べる。従って、以下に述べる各図におけるテーブルおよびデータは、外形図の内容パラメータセットに基づいて生成されている。これらのテーブルおよびデータは、図２に示されるその他の種類の図面（例：組立図、基礎図、および構成図）についても、外形図に関する以下の説明と同様の処理の流れによって生成されることに留意されたい。このように、参考形態では、これらのテーブルおよびデータは、図２に示されている図面の種類毎に生成される。

【0048】

図４には、初期状態におけるＴＢ３の一例が示されている。図４に示す通り、ＴＢ３は、（ｉ）第１～第Ｌ内容パラメータのそれぞれの変数種類（データ種類）と、（ｉｉ）当該第１～第Ｌ内容パラメータのそれぞれに適用すべき前処理手法と、の対応関係を示す表である。学習用前処理部１１４は、取得した内容パラメータ変数種類情報を、ＴＢ３の「変数」の項目に記録する。なお、第１～第Ｌ内容パラメータのそれぞれに適用すべき前処理手法は、現段階では未決定である。このため、初期状態のＴＢ３では、「前処理手法」の項目は全てブランク項目として設定されている。本明細書では、初期状態のＴＢ３を、ＴＢ３ｉｎｉｔと称する。

【0049】

続いて、学習用前処理部１１４は、第ｋ内容パラメータ変数種類情報に応じて、第ｋ内容パラメータに複数種類の前処理手法を適用する。具体的には、参考形態では、学習用前処理部１１４は、第ｋ内容パラメータがＶＬである場合には、第ｋパラメータに対し、以下の（ｉ）～（ｉｖ）、
（ｉ）生値（Raw値）をそのまま用いる処理（恒等処理）（以下、［Ｒ］と表記）；
（ｉｉ）ワンホットエンコーディング（One hot Encoding）（以下、［Ｏ］と表記）；
（ｉｉｉ）正規化（Normalization）（以下、［Ｎ］と表記）；
（ｉｉｉｉ）標準化（Standardization）（以下、［Ｓ］と表記）；
という４種類の前処理手法を適用する。

【0050】

なお、第ｋ内容パラメータがＶＬである場合には、当該第ｋ内容パラメータは、第ｋ特定文字列が過去図面内容パラメータ取得部１１２によってラベルエンコーディング（Label Encoding）（以下、［Ｌ］と表記）されることによって導出された値であると理解することもできる。このため、第ｋ内容パラメータがＶＬである場合には、［Ｒ］は［Ｌ］に読み替えることができる。このように、第ｋ内容パラメータがＶＬである場合には、［Ｒ］と［Ｌ］とは、等価な前処理手法である。なお、前処理手法［Ｌ］の一例については、後述する。

【0051】

他方、学習用前処理部１１４は、第ｋ内容パラメータがＶＮである場合には、第ｋパラメータに対し、以下の（ｉ）～（ｖ）、
（ｉ）［Ｒ］；
（ｉｉ）［Ｌ］；
（ｉｉｉ）［Ｏ］；
（ｉｖ）［Ｎ］；
（ｖ）［Ｓ］；
という５種類の前処理手法を適用する。但し、当業者であれば明らかである通り、本発明の一態様に係る前処理手法は、これらの例に限定されない。本発明の一態様に係る前処理手法は、ＶＬまたはＶＮに適用可能な任意の前処理手法であってよい。

【0052】

以上の通り、学習用前処理部１１４は、内容パラメータセットに含まれる各内容パラメータに対し、第ｋ内容パラメータ変数種類情報に応じた複数種類の前処理手法を適用することにより、当該内容パラメータセットを拡張（水増し）（data augmentation）する。以下、内容パラメータセットに含まれているＶＬおよびＶＮの個数を、ＦＬおよびＦＮとそれぞれ表記する。

【0053】

上記の説明から明らかである通り、参考形態の例では、内容パラメータセットに対する前処理のパターンの組み合わせの総数は、４^ＦＬ×５^ＦＮ通りである。従って、学習用前処理部１１４は、１つの内容パラメータセットを、４^ＦＬ×５^ＦＮ個の内容パラメータセットへと拡張する。以下、当該４^ＦＬ×５^ＦＮ個の内容パラメータセットを、総称的に拡張後内容パラメータセットと称する。そして、当該４^ＦＬ×５^ＦＮ個の内容パラメータセットのそれぞれを、データセット１、データセット２、…、データセット４^ＦＬ×５^ＦＮと称する。拡張後内容パラメータセットは、前処理後内容パラメータセットと称されてもよい。なお、例えば、データセット１は、データセットＮｏ．１と称されてもよい。

【0054】

なお、過去図面内容パラメータセットは、検索対象図面内容パラメータセットと称されてもよい。従って、拡張後内容パラメータセットは、過去図面拡張後内容パラメータセット（あるいは、検索対象図面拡張後内容パラメータセット）と称されてもよい。同様に、前処理後内容パラメータセットは、前処理後過去図面内容パラメータセット（あるいは、前処理後検索対象図面内容パラメータセット）と称されてもよい。なお、前処理後内容パラメータセットに含まれる各データは、前処理後内容パラメータ（より詳細には、前処理後検索対象図面内容パラメータ）と称されてもよい。

【0055】

図５には、各データセットにおける前処理後内容パラメータの数（以下、前処理後内容パラメータ数と称する）の一例が示されている。１つのデータセット（例：データセット１）における前処理後内容パラメータ数は、同データセットに含まれるデータの数とも表現できる。従って、例えば、データセット１における前処理後内容パラメータ数は、データセット１の次元数（要素数）と称されてもよい。以下では、前処理後の第ｋ内容パラメータを、前処理後第ｋ内容パラメータと称する。

【0056】

以下に述べる図６からも明らかである通り、前処理後内容パラメータ数は、内容パラメータセットに含まれる各内容パラメータに対して適用される前処理手法に応じて変化しうる。例えば、より多くの内容パラメータに対して［Ｏ］が適用されるほど、前処理後内容パラメータ数が増加する傾向がある（後述の図８も参照）。

【0057】

図６は、データセット１のデータ構造を模式的に例示する図である。図６の例におけるデータセット１は、（ｉ）第１内容パラメータに対して［Ｓ］が、（ｉｉ）第２内容パラメータに対して［Ｓ］が、（ｉｉｉ）第３内容パラメータに対して［Ｏ］が、（ｉｖ）第Ｌ内容パラメータに対して［Ｌ］が、それぞれ施されることにより、生成されたデータ構造（例：データフレーム）である（後述の図８も参照）。

【0058】

図６の例では、第３内容パラメータ（第３特定文字列「ＯＲ」に対応する内容パラメータ）がワンホットエンコーディングされることにより、「ＯＲ＿０」、「ＯＲ＿１」、「ＯＲ＿２」、および「ＯＲ＿３」という、当該第３内容パラメータに対応する４つの前処理後内容パラメータが生成されている。

【0059】

説明の便宜上の一例として、内容パラメータセットに含まれる第３内容パラメータ（Ａ３）の最小値が０であり、最大値が３である場合を考える。すなわち、内容パラメータセットにおいて、Ａ３が０から３までの４通りの離散値をとっている場合を考える。この場合、Ａ３のそれぞれの値は、４次元のワンホットベクトル（より具体的には、４ビットのワンホットベクトル）によって表現可能である。

【0060】

例えば、Ａ３＝０である場合、
ＯＲ＿０＝（１，０，０，０）；
ＯＲ＿１＝（０，０，０，０）；
ＯＲ＿２＝（０，０，０，０）；
ＯＲ＿３＝（０，０，０，０）；
である。

【0061】

また、Ａ３＝１である場合、
ＯＲ＿０＝（０，０，０，０）；
ＯＲ＿１＝（０，１，０，０）；
ＯＲ＿２＝（０，０，０，０）；
ＯＲ＿３＝（０，０，０，０）；
である。

【0062】

また、Ａ３＝２である場合、
ＯＲ＿０＝（０，０，０，０）；
ＯＲ＿１＝（０，０，０，０）；
ＯＲ＿２＝（０，０，１，０）；
ＯＲ＿３＝（０，０，０，０）；
である。

【0063】

また、Ａ３＝３である場合、
ＯＲ＿０＝（０，０，０，０）；
ＯＲ＿１＝（０，０，０，０）；
ＯＲ＿２＝（０，０，０，０）；
ＯＲ＿３＝（０，０，０，１）；
である。以上の通り、Ａ３＝ｉ（この説明におけるｉは、０から３までの任意の自然数）であることは、ｉ番目の要素のみに成分「１」を有するワンホットベクトルＯＲ＿ｉによって表現される。

【0064】

続いて、前処理手法［Ｎ］の一例について説明する。以下では、学習用前処理部１１４が、第ｋ内容パラメータ（Ａｋ）を正規化する場合を例示する。まず、学習用前処理部１１４は、内容パラメータセットから、Ａｋの最大値（Ａｋｍａｘ）および最小値（Ａｋｍｉｎ）を取得する。

【0065】

そして、学習用前処理部１１４は、
Ａｋ＿Ｎｏｒｍａｌｉｚｅｄ＝（Ａｋ－Ａｋｍｉｎ）／（Ａｋｍａｘ－Ａｋｍｉｎ）
…（１）
の通り、Ａｋ＿Ｎｏｒｍａｌｉｚｅｄを算出する。Ａｋ＿Ｎｏｒｍａｌｉｚｅｄは、正規化後第ｋ内容パラメータ（より詳細には、正規化後過去図面第ｋ内容パラメータ）と称される。また、正規化後第１～第Ｌ内容パラメータを総称的に、正規化後内容パラメータ（より詳細には、正規化後過去図面内容パラメータ）と称する。正規化後内容パラメータは、前処理後内容パラメータの一例である。

【0066】

以上の通り、学習用前処理部１１４は、式（１）に従って、ＡｋをＡｋ＿Ｎｏｒｍａｌｉｚｅｄへと正規化する。正規化は、Ｍｉｎ－Ｍａｘスケーリングとも称される。式（１）から理解される通り、［Ｎ］によって生成されたデータセットでは、正規化後内容パラメータの最小値は０であり、最大値は１である。

【0067】

さらに、前処理手法［Ｓ］の一例について説明する。以下では、学習用前処理部１１４が、Ａｋを標準化する場合を例示する。まず、学習用前処理部１１４は、内容パラメータセットから、Ａｋの平均値（Ａｋｍｅａｎ）および標準偏差（Ａｋｓｄ）を導出する。

【0068】

続いて、学習用前処理部１１４は、
Ａｋ＿Ｓｔａｎｄａｒｄｉｚｅｄ＝（Ａｋ－Ａｋｍｅａｎ）／Ａｋｓｄ …（２）の通り、Ａｋ＿Ｓｔａｎｄａｒｄｉｚｅｄを算出する。Ａｋ＿Ｓｔａｎｄａｒｄｉｚｅｄは、標準化後第ｋ内容パラメータ（より詳細には、標準化後過去図面第ｋ内容パラメータ）と称される。また、標準化後第１～第Ｌ内容パラメータを総称的に、標準化後内容パラメータ（より詳細には、標準化後過去図面内容パラメータ）と称する。標準化後内容パラメータは、前処理後内容パラメータの一例である。

【0069】

以上の通り、学習用前処理部１１４は、式（２）に従って、ＡｋをＡｋ＿Ｓｔａｎｄａｒｄｉｚｅｄへと標準化する。式（２）から理解される通り、［Ｓ］によって生成されたデータセットでは、標準化後内容パラメータの平均値は０であり、標準偏差は１である。

【0070】

学習用前処理部１１４は、［Ｓ］の過程にて取得したＡｋｍａｘおよびＡｋｍｉｎを記録した表（標準化用データ表）を生成してもよい。同様に、学習用前処理部１１４は、［Ｎ］の過程にて取得したＡｋｍｅａｎおよびＡｋｓｄを記録した表（正規化用データ表）を生成してもよい。

【0071】

図７の正規化用データ表７００Ａおよび標準化用データ表７００Ｂはそれぞれ、参考形態における正規化用データ表および標準化用データ表の一例である。具体的には、正規化用データ表７００Ａおよび標準化用データ表７００Ｂはそれぞれ、データセット１の生成に伴って生成された表である。

【0072】

上述の説明から理解される通り、［Ｎ］が施されない第ｋ内容パラメータについては、ＡｋｍａｘおよびＡｋｍｉｎがそもそも取得されない。このため、正規化用データ表７００Ａでは、［Ｎ］が施されない第ｋ内容パラメータについては、ＡｋｍａｘおよびＡｋｍｉｎに、ダミー値（例：０）が割り当てられる。

【0073】

上述の例では、データセット１における前処理後第１～第３内容パラメータおよび前処理後第Ｌ内容パラメータはいずれも、［Ｎ］以外の前処理手法によって導出されている。このため、図７に示される通り、正規化用データ表７００Ａでは、前処理後第１～第３内容パラメータおよび前処理後第Ｎ内容パラメータについては、ＡｋｍａｘおよびＡｋｍｉｎとして、ダミー値である０が記録される。

【0074】

参考形態では、学習用前処理部１１４によって、Ａ１ｍｅａｎ＝７１．９、Ａ１ｓｄ＝１０．５、Ａ２ｍｅａｎ＝２．４、Ａ２ｓｄ＝０．６が取得された場合を例示する。この場合、学習用前処理部１１４は、標準化用データ表７００Ｂの第１内容パラメータおよび第２内容パラメータのそれぞれの項目に、これらの値を記録する。

【0075】

なお、［Ｓ］が施されない第ｋ内容パラメータについては、ＡｋｍｅａｎおよびＡｋｓｄがそもそも取得されない。このため、標準化用データ表７００Ｂでは、［Ｓ］が施されない第ｋ内容パラメータについては、ＡｋｍｅａｎおよびＡｋｓｄに、ダミー値（例：０）が割り当てられる。図７の例では、前処理後第３内容パラメータおよび前処理第Ｌ内容パラメータはいずれも、［Ｓ］以外の前処理手法によって導出されている。このため、標準化用データ表７００Ｂでは、前処理後第３内容パラメータおよび前処理第Ｌ内容パラメータについては、ＡｋｍａｘおよびＡｋｍｉｎとして、ダミー値である０が記録される。

【0076】

学習用前処理部１１４は、各データセットと各前処理手法との対応関係を示すテーブル（データセット・前処理手法対応テーブル）を生成してよい。図８のテーブルＴＢ４は、データセット・前処理手法対応テーブルの一例である。なお、図８の例において、データセット１に対応する前処理手法にハッチングが付されている趣旨については後述する。

【0077】

図９には、学習用前処理部１１４によって生成された複数のデータセットの内の一部が例示されている。図９において、符号９００Ａはデータセット１を、符号９００Ｂはデータセット２を、符号９００Ｃはデータセット４^ＦＬ×５^ＦＮを、それぞれ表す。上述の説明から理解される通り、データセット１における前処理後第１～第２内容パラメータはそれぞれ、標準化後第１～第２内容パラメータである。標準化後第１内容パラメータおよび標準化後第２内容パラメータはそれぞれ、上述の式（２）に従って第１内容パラメータおよび第２内容パラメータが標準化された値である。

【0078】

上述の図８から理解される通り、図９の例におけるデータセット２は、データセット１とは異なり、第３内容パラメータに対して［Ｌ］が適用されることにより生成されている。その他の内容パラメータに対する前処理手法については、データセット１の例と同様である。

【0079】

以上の通り、データセット２では、データセット１とは異なり、第３内容パラメータに対して［Ｏ］が適用されていない。それゆえ、データセット２の次元数は、データセット１の次元数よりも小さい。具体的には、上述の図５に示す通り、データセット１の次元数は５０であり、データセット２の次元数は２８である。

【0080】

また、上述の図８から理解される通り、図９の例におけるデータセット４^ＦＬ×５^ＦＮは、データセット１・２とは異なり、全ての内容パラメータに対して［Ｏ］が適用されることにより生成されている。このため、データセット４^ＦＬ×５^ＦＮの次元数は、データセット１・２の次元数に比べて大きい。具体的には、図５に示す通り、データセット４^ＦＬ×５^ＦＮの次元数は１５１である。

【0081】

（学習モデル生成部１１３ｓにおける学習フェーズ）
学習モデル生成部１１３ｓにおける処理は、学習フェーズと検証フェーズとに大別できる。まず、学習フェーズについて述べる。学習モデル生成部１１３ｓは、学習用前処理部１１４から拡張後内容パラメータセット（データセット１～データセット４^ＦＬ×５^ＦＮ）を取得する。そして、学習モデル生成部１１３ｓは、データセット１～データセット４^ＦＬ×５^ＦＮのそれぞれを、訓練データと検証データとに分割する。

【0082】

学習モデル生成部１１３ｓは、データセット１～４^ＦＬ×５^ＦＮの内の任意の１つのデータセット（便宜上、注目データセットと称する）に対し、所定の複数種類の機械学習アルゴリズムのそれぞれを適用することによって、複数の学習モデルを生成する。具体的には、学習モデル生成部１１３ｓは、所定の複数種類の機械学習アルゴリズムのそれぞれを適用することによって、注目データセットの訓練データを用いて、複数の学習モデルを生成する。

【0083】

一例として、学習モデル生成部１１３ｓは、所定の複数種類の機械学習アルゴリズムのそれぞれを適用することによって、データセット１の訓練データを用いて、データセット１に対応する複数の学習モデルを生成する。このように、学習モデル生成部１１３ｓは、注目データセットに対応する複数の学習モデルを生成する。

【0084】

参考形態の例では、複数種類の機械学習アルゴリズムには、勾配ベースの機械学習アルゴリズムと距離ベースの機械学習アルゴリズムとが含まれる。勾配ベースの機械学習アルゴリズムとは、勾配降下法を利用した機械学習アルゴリズムである。勾配ベースの機械学習アルゴリズムの具体例としては、ＤＴ（Decision Tree，決定木）、ＬＲ（Logistic Regression，ロジスティック回帰）、およびＮＮ（Neural Network，ニューラルネットワーク）を挙げることができる。上述の多項ロジスティック回帰は、ＲＳの一例である。

【0085】

本発明の一態様に係るＤＴとは、より厳密には、ＧＢＤＴ（Gradient Boosting DT，勾配ブースティング決定木）を意味する。従って、本発明の一態様に係るＤＴの例としては、ＸＧＢｏｏｓｔ（eXtreme Gradient Boosting）およびＬｉｇｈｔＧＢＭ（Light Gradient Boosting Machine）を挙げることができる。

【0086】

距離ベースの機械学習アルゴリズムとは、各入力データに含まれる１つ以上のパラメータの分布を示す距離空間における各入力データ間の距離に基づいて、各入力データを評価（例：分類）する機械学習アルゴリズムである。距離ベースの機械学習アルゴリズムの具体例としては、ＳＶＭ（Support Vector Machine，サポートベクターマシン）および重回帰を挙げることができる。

【0087】

以上の通り、学習モデル生成部１１３ｓは、データセット１～４^ＦＬ×５^ＦＮのそれぞれに対して各機械学習アルゴリズムを網羅的に（総当たりで）適用することにより、複数の学習モデルを生成してよい。これにより、以下に述べる検証フェーズにおいて評価（検証）の対象となる学習モデルを、十分な数だけ生成できる。

【0088】

加えて、学習モデル生成部１１３ｓは、ある機械学習アルゴリズムの各ハイパーパラメータセットを変更してもよい。この場合、学習モデル生成部１１３ｓは、変更後のハイパーパラメータセットを用いて、同機械学習アルゴリズムを適用して学習モデルをさらに生成する。このように、学習モデル生成部１１３ｓは、ハイパーパラメータセットをも網羅的に適用することにより、複数の学習モデルを生成してもよい。これにより、さらに多くの学習モデルを生成できる（後述の図１０を参照）。

【0089】

（学習モデル生成部１１３ｓにおける検証フェーズ）
続いて、検証フェーズについて述べる。学習モデル生成部１１３ｓは、学習フェーズにおいて生成された複数の学習モデルのそれぞれの品質を、データセット１～４^ＦＬ×５^ＦＮのそれぞれを用いて（より具体的には、データセット１～４^ＦＬ×５^ＦＮのそれぞれの検証データを用いて）評価する。

【0090】

一例として、注目データセットとしてデータセットｊを考える。ｊは、後述するＴＢ５（図１０を参照）の列番号を示す添字である。学習モデル生成部１１３ｓは、データセットｊに対応する複数の学習モデルのそれぞれについて、データセットｊの検証データを用いて、当該複数の学習モデルのそれぞれの予測精度（判定精度）を示す指標値を取得する。例えば、学習モデル生成部１１３ｓは、後述するモデル（ｉ，ｊ）にデータセットｊの検証データを入力することにより、上記指標値をモデル（ｉ，ｊ）に出力（導出）させる。上記指標値は、モデル（ｉ，ｊ）の品質を示す指標値とも表現できる。

【0091】

参考形態では、学習モデル生成部１１３ｓは、上記指標値として、Accuracy（正解率）を取得する。このことから、参考形態における予測精度は、検索精度（より詳細には、過去図面の検索精度）と称されてもよい（図１０を参照）。但し、当業者であれば明らかである通り、本発明の一態様に係る指標値は上記の例に限定されず、機械学習分野における公知のその他の指標値が用いられてもよい。従って、例えば、学習モデル生成部１１３ｓは、指標値として、Precision（適合率）またはRecall（再現率）を取得してもよい。あるいは、学習モデル生成部１１３ｓは、指標値として、Ｆスコア（F-score）を取得してもよい。周知の通り、Ｆスコアは、PrecisionとRecallとの調和平均である。

【0092】

学習モデル生成部１１３ｓは、取得した複数の指標値に応じて、ベスト学習モデルを選択する。参考形態の例では、学習モデル生成部１１３ｓは、複数の指標値の内の最大値（最大指標値）を特定する。そして、学習モデル生成部１１３ｓは、最大指標値を有する学習モデルを、ベスト学習モデルとして選択する。

【0093】

学習モデル生成部１１３ｓは、評価フェーズにおける評価結果を示すテーブル（評価結果テーブル）を生成してよい。図１０のテーブルＴＢ５は、評価結果テーブルの一例である。ＴＢ５では、１つのデータセットと１つの機械学習アルゴリズムと１つのハイパーパラメータセット（例：Ｐａｒａ１）と１対１に対応するように、１つの指標値が記録されている。

【0094】

図１０の例におけるＰａｒａ１およびＰａｒａ２はそれぞれ、ある１つの機械学習アルゴリズム（例：ＤＴ）に適用されるハイパーパラメータセット（一連のハイパーパラメータ）を示す。図１０の例では、
・ＤＴのＰａｒａ１：データ分割方法＝"gni"、最大深度＝３、…
・ＤＴのＰａｒａ２：データ分割方法＝"entropy"、最大深度＝３、…
・ＬＲのＰａｒａ１：正則化の種類＝"l2"、正則化項の係数＝１．０、…
・ＬＲのＰａｒａ２：正則化の種類＝"l2"、正則化項の係数＝０．５、…
・ＮＮのＰａｒａ１：バッチサイズ＝２５６、最大学習回数＝１０００、…
・ＮＮのＰａｒａ２：バッチサイズ＝１２８、最大学習回数＝１０００、…
・ＳＶＭのＰａｒａ１：カーネルの種類＝"rbf"、正則化項の係数＝１．０、…
・ＳＶＭのＰａｒａ２：カーネルの種類＝"rbf"、正則化項の係数＝０．５、…
の通りである。なお、当業者であれば明らかである通り、ハイパーパラメータセットの数は２つに限定されない。例えば、Ｐａｒａ１～Ｐａｒａ５までの５つのハイパーパラメータセットが、各機械学習アルゴリズムに対して割り当てられてもよい。

【0095】

以下では、ＴＢ５のｉ行ｊ列目の成分を、ＴＢ５（ｉ，ｊ）と表記する。また、ＴＢ５（ｉ，ｊ）に対応する学習モデルを、モデル（ｉ，ｊ）と称する。ＴＢ８では、行方向（ｉ方向）に、機械学習アルゴリズムおよび当該機械学習アルゴリズムのハイパーパラメータセットが配列されている。そして、列方向（ｊ方向）に、データセットが配列されている。従って、一例として、図１０におけるＴＢ８（１，１）は、ＤＴにおいてＰａｒａ１が適用された場合に得られた検索精度である。図１０の例では、ＴＢ５（１，１）＝４２．１％である。上述の通り、ＴＢ５（１，１）は、Ｐａｒａ１が適用されたＤＴによって生成された学習モデル、すなわちモデル（１，１）の品質を示す指標値とも言える。

【0096】

説明の便宜上、図１０の例において、ＮＮのＰａｒａ１に対応する行番号を、ｉｍと表記する。図１０の例では、ＴＢ５（ｉｍ，１）＝８１．６％が、各ＴＢ５（ｉ，ｊ）の内の最大値である（ＴＢ５においてハッチングが付されているセルを参照）。

【0097】

以上の通り、学習装置１１ｓは、図面ａ１～Ｍ１（外形図）の内容パラメータセット（便宜上、第１図面種類内容パラメータセットと称する）に基づいて、複数の学習モデルを生成する。そして、学習装置１１は、第１図面種類内容パラメータセットに基づいて生成した当該複数の学習モデルのそれぞれの品質を評価する（より具体的には、生成した複数の学習モデルのそれぞれの指標値を導出する）。

【0098】

外形図についての上記の例と同様に、学習装置１１ｓは、図面の種類毎に、当該図面の内容パラメータセットに基づいて、複数の学習モデルを生成する。そして、学習装置１１ｓは、当該内容パラメータセットに基づいて生成した複数の学習モデルのそれぞれの品質を評価する。

【0099】

一例として、学習装置１１ｓは、図面ａ２～Ｍ２（組立図）の内容パラメータセット（便宜上、第２内容図面種類パラメータセットと称する）に基づいて、複数の学習モデルを生成する。そして、学習装置１１は、第２図面種類内容パラメータセットに基づいて生成した複数の学習モデルのそれぞれの品質を評価する。別の例として、学習装置１１ｓは、図面ａＮ～ＭＮ（構成図）の内容パラメータセット（便宜上、第Ｎ図面種類内容パラメータセットと称する）に基づいて、複数の学習モデルを生成する。そして、学習装置１１ｓは、第Ｎ図面種類内容パラメータセットに基づいて生成した複数の学習モデルのそれぞれの品質を評価する。

【0100】

参考形態では、以上の通り第１図面種類内容パラメータセット～第Ｎ図面種類内容パラメータセットに基づいて導出された全ての指標値の内、ＴＢ５（ｉｍ，１）が、最大値であるものとする。従って、参考形態では、学習モデル生成部１１３ｓは、ＴＢ５（ｉｍ，１）を最大指標値として特定する。そして、学習モデル生成部１１３ｓは、最大指標値を有する学習モデル、すなわちモデル（ｉｍ，１）を、ベスト学習モデルとして選択する。以上の通り、参考形態の例では、学習モデル生成部１１３ｓは、学習フェーズにおいて生成された複数の学習モデルの内、最も高品質な学習モデルを、ベスト学習モデルとして選択する。なお、本明細書では、ベスト学習モデルに対応する機械学習アルゴリズムを、ベスト機械学習アルゴリズムと称する。図１０の例におけるベスト機械学習アルゴリズムは、ＮＮである。

【0101】

なお、当業者であれば明らかである通り、ベスト学習モデルの選択手法は上記の例に限定されない。学習モデル生成部１１３ｓは、複数の指標値に基づいて、複数の学習モデルの内から、ベスト学習モデルを選択できればよい。例えば、学習モデル生成部１１３ｓは、複数の指標値に基づいて統計値を導出し、当該統計値に基づいてベスト学習モデルを選択してよい。参考形態における最大指標値は、統計値の一例である。

【0102】

（学習フェーズについての補足）
ところで、距離ベースの機械学習アルゴリズムは、勾配ベースの機械学習アルゴリズムとは異なり、いわゆる「次元の呪い」の影響を受けることが知られている。このため、注目データセットの次元数が多い場合、距離ベースの機械学習アルゴリズムによって生成された学習モデル（以下、距離ベース学習モデルと称する）は、勾配ベースの機械学習アルゴリズムによって生成された学習モデル（以下、勾配ベース学習モデルと称する）に比べて、低品質な学習モデルとなる傾向にある。このことから、注目データセットの次元数が多い場合、当該注目データセットを用いて生成された距離ベース学習モデルがベスト学習モデルとして選択される可能性はそもそも低いと考えられる。

【0103】

そこで、参考形態では、学習モデル生成部１１３ｓは、注目データセットの次元数が所定の次元数閾値Ｄｔｈ以上である場合には、当該注目データセットを用いて距離ベースの機械学習アルゴリズムによって学習モデルを生成することを停止することが好ましい。これにより、品質が低いと予期される学習モデルが生成されることを未然に防止することができるので、学習フェーズにおける演算コストを低減できる。加えて、後続する評価フェーズにおける演算コストを低減することもできる。

【0104】

機械学習分野では、データセットの次元数が３０以上の場合、距離ベース学習モデルの品質が低下する傾向が高くなることが経験的に知られている。そこで、例えば、Ｄｔｈは３０以上の所定の値として設定されてよい。参考形態では、Ｄｔｈ＝３０に設定されている場合を例示する。

【0105】

上述の通り、参考形態の例では、データセット１の次元数は５０であり、データセット４^ＦＬ×５^ＦＮの次元数は１５１である。このため、図１０の例では、学習モデル生成部１１３ｓは、データセット１およびデータセット４^ＦＬ×５^ＦＮに対しては、距離ベースの機械学習アルゴリズム（例：ＳＶＭ）による学習モデルの生成を行わない（ＴＢ５において「×」マークが付されているセルを参照）。

【0106】

以上のことから、図１０の例では、学習モデル生成部１１３ｓは、データセット１およびデータセット４^ＦＬ×５^ＦＮに対しては、勾配ベースの機械学習アルゴリズム（例：ＤＴ、ＬＲ、およびＮＮ）のみを適用して、学習モデルを生成する。このように、学習モデル生成部１１３ｓは、データセット１およびデータセット４^ＦＬ×５^ＦＮに対しては、距離ベース学習モデルを生成することなく、勾配ベース学習モデルのみを生成する。

【0107】

他方、学習モデル生成部１１３ｓは、注目データセットの次元数がＤｔｈ未満である場合には、距離ベースの機械学習アルゴリズムを適用して、当該データセットを用いて学習モデルを生成してもよい。参考形態の例では、データセット２の次元数は２８である。このため、図１０の例では、学習モデル生成部１１３ｓは、データセット２に対しては、勾配ベース学習モデルを生成するとともに、距離ベース学習モデルをさらに生成する。

【0108】

（学習モデル生成部１１３ｓにおける検証フェーズ後の処理）
学習モデル生成部１１３ｓは、ＴＢ５に含まれている各データセットのうち、ベスト学習モデルに対応する１つのデータセットを、ベストデータセットとして選択する。図１０の例では、学習モデル生成部１１３ｓは、データセット１をベストデータセットとして選択する。

【0109】

続いて、学習モデル生成部１１３ｓは、ベストデータセットに対応する前処理手法を、ベスト前処理手法として選択する。参考形態の例では、学習モデル生成部１１３ｓは、上述のＴＢ４を参照し、データセット１に対応する前処理手法を、ベスト前処理手法として読み出す（図８のハッチング箇所を参照）。以上の説明から理解される通り、学習モデル生成部１１３ｓは、ベスト学習モデルに対応する前処理手法を、ベスト前処理手法として選択する。

【0110】

続いて、学習モデル生成部１１３ｓは、上述のＴＢ３ｉｎｉｔにおける「前処理手法」の項目に、ベスト前処理手法を記録することにより、ＴＢ３ｉｎｉｔを更新する。本明細書では、更新後の内容パラメータ設定初期テーブルを、ＴＢ３ｎｅｗと称する。図１１には、ＴＢ３ｎｅｗの一例が示されている。図１１の例では、データセット１に対応する前処理手法（換言すれば、ベスト学習モデルに対応する前処理手法）が、ベスト前処理手法として、「前処理手法」の項目に記録されている。

【0111】

（図面検索装置１２）
続いて、図面検索装置１２について述べる。図面検索装置１２は、新規図面データ取得部１２１、新規図面内容パラメータ取得部１２２（ターゲット図面内容パラメータ取得部）、検索用前処理部１２５、および検索部１２６を備える。

【0112】

図面検索装置１２は、学習装置１１ｓによって生成された学習モデル（参考形態の例では、ベスト学習モデル）を用いて、ターゲット図面を複数の検索対象図面のそれぞれと照合することにより、少なくとも１つの図面を検索する。参考形態の図面ＮＤは、ターゲット図面の一例である。以下に述べるように、図面検索装置１２では、上記学習モデルを用いて、図面ＮＤに対し、図面ａ１～ＭＮのそれぞれとの照合が行われる。

【0113】

（新規図面の取得）
新規図面データ取得部１２１は、過去図面データ取得部１１１と対になる機能部である。一例として、新規図面データ取得部１２１は、入力部７１が所定のユーザ操作を受け付けたことを契機として、新規物件図面ＤＢ９２の新規物件データセットに含まれている、所定の新規図面（例：図面ＮＤ）を取得する。新規図面データ取得部１２１は、取得した図面ＮＤを、新規図面内容パラメータ取得部１２２に供給する。

【0114】

（新規図面に対応する内容パラメータセットの取得）
新規図面内容パラメータ取得部１２２は、過去図面内容パラメータ取得部１１２と対になる機能部である。新規図面内容パラメータ取得部１２２は、過去図面内容パラメータ取得部１１２と同様の処理により、図面ＮＤに対応する内容パラメータセットを取得する。すなわち、新規図面内容パラメータ取得部１２２は、過去図面内容パラメータ取得部１１２と同じ解析手法によって図面ＮＤを解析することにより、当該図面ＮＤの内容パラメータを取得する。

【0115】

以下、図面ＮＤの第ｋ内容パラメータを、Ｃｋとも称する。なお、上述の検索対象図面内容パラメータとの区別のため、ターゲット図面（図面ＮＤ）の内容パラメータを、ターゲット図面内容パラメータとも称する。また、ターゲット図面の第ｋ内容パラメータを、ターゲット図面第ｋ内容パラメータとも称する。ターゲット図面内容パラメータは、新規図面内容パラメータと称されてもよい。このため、ターゲット図面第ｋ内容パラメータは、新規図面第ｋ内容パラメータと称されてもよい。

【0116】

以上のように、新規図面内容パラメータ取得部１２２は、図面ＮＤに対し過去図面内容パラメータ取得部１１２と同様の処理を行うことにより、Ｃ１～ＣＬを設定する。その後、新規図面内容パラメータ取得部１２２は、Ｃ１～ＣＬを示す新規図面内容パラメータテーブルＴＢ－ＮＤを生成してよい。図１２には、ＴＢ－ＮＤの一例が示されている。

【0117】

（検索用前処理部１２５における処理の一例）
検索用前処理部１２５は、新規図面内容パラメータ取得部１２２から、図面ＮＤに対応する内容パラメータセット（便宜上、新規図面内容パラメータセットと称する）を取得する。具体的には、新規図面内容パラメータセットとは、図面ＮＤの第１～第Ｌ内容パラメータ（Ｃ１～ＣＬ）を含むデータセットを意味する。一例として、検索用前処理部１２５は、新規図面内容パラメータ取得部１２２から、上述のＴＢ－ＮＤを取得する。

【0118】

また、検索用前処理部１２５は、学習モデル生成部１１３ｓから、ベスト前処理手法を取得する。一例として、検索用前処理部１２５は、学習モデル生成部１１３ｓからＴＢ３を取得し、ＴＢ３からベスト前処理手法を読み出す。

【0119】

続いて、検索用前処理部１２５は、ベスト前処理手法に従って、新規図面内容パラメータセットに対して前処理を施すことにより、前処理後新規図面内容パラメータセットを生成する。すなわち、検索用前処理部１２５は、ベスト前処理手法と同じ前処理手法をＣ１～ＣＬのそれぞれに施すことにより、前処理後新規図面内容パラメータセットを生成する。参考形態の例では、検索用前処理部１２５は、（ｉ）Ｃ１に［Ｓ］を施し、（ｉｉ）Ｃ２に［Ｓ］を施し、（ｉｉｉ）Ｃ３に［Ｏ］を施し、かつ、（ｉｖ）ＣＬに［Ｌ］を施
す。

【0120】

なお、新規図面内容パラメータセットは、ターゲット図面内容パラメータセットと称されてもよい。従って、前処理後新規図面内容パラメータセットは、前処理後ターゲット図面内容パラメータセットと称されてもよい。

【0121】

検索用前処理部１２５は、前処理後新規図面内容パラメータセットを示すテーブル（前処理後新規図面内容パラメータテーブル）を生成してよい。図１３に示されているＴＢ－ＮＤＰは、参考形態における前処理後新規図面内容パラメータテーブルの一例である。上述の説明から明らかである通り、前処理後新規図面内容パラメータセットは、データセット１と同じデータ構造を有している（上述の図６も参照）。

【0122】

なお、検索用前処理部１２５における前処理手法［Ｓ］の一例について説明すれば、次の通りである。以下では、検索用前処理部１２５によって、Ｃｋ（図面ＮＤの第ｋ内容パラメータ）を標準化する場合について述べる。

【0123】

まず、検索用前処理部１２５は、上述の標準化用データ表７００Ｂを参照し、ＡｋｍｅａｎおよびＡｋｓｄを取得する。続いて、検索用前処理部１２５は、
Ｃｋ＿Ｓｔａｎｄａｒｄｉｚｅｄ＝（Ｃｋ－Ａｋｍｅａｎ）／Ａｋｓｄ …（３）の通り、Ｃｋ＿Ｓｔａｎｄａｒｄｉｚｅｄを算出する。Ｃｋ＿Ｓｔａｎｄａｒｄｉｚｅｄは、図面ＮＤにおける標準化後の第ｋ内容パラメータである。Ｃｋ＿Ｓｔａｎｄａｒｄｉｚｅｄは、標準化後新規図面第ｋ内容パラメータとも称される。標準化後新規図面第ｋ内容パラメータは、前処理後新規図面第ｋ内容パラメータの一例である。

【0124】

また、検索用前処理部１２５における前処理手法［Ｎ］の一例について説明すれば、次の通りである。まず、検索用前処理部１２５は、上述の正規化用データ表７００Ａを参照し、ＡｋｍａｘおよびＡｋｍｉｎを取得する。続いて、検索用前処理部１２５は、
Ｃｋ＿Ｎｏｒｍａｌｉｚｅｄ＝（Ｃｋ－Ａｋｍｉｎ）／（Ａｋｍａｘ－Ａｋｍｉｎ）
…（４）
の通り、Ｃｋ＿Ｎｏｒｍａｌｉｚｅｄを算出する。Ｃｋ＿Ｎｏｒｍａｌｉｚｅｄは、図面ＮＤにおける正規化後の第ｋ内容パラメータである。Ｃｋ＿Ｎｏｒｍａｌｉｚｅｄは、正規化後新規図面第ｋ内容パラメータとも称される。正規化後新規図面第ｋ内容パラメータは、前処理後新規図面第ｋ内容パラメータの別の例である。

【0125】

（検索部１２６における検索フェーズ）
検索部１２６は、検索用前処理部１２５から、前処理後新規図面内容パラメータセットを取得する。また、検索部１２６は、学習モデル生成部１１３ｓから、ベスト学習モデルを取得する。検索部１２６は、前処理後新規図面内容パラメータセットをベスト学習モデルに入力する。そして、検索部１２６は、前処理後新規図面内容パラメータセットに応じたベスト学習モデルの出力を、ベスト学習モデルから取得する。

【0126】

一例として、参考形態における各学習モデルが、図面ＮＤに対する各過去図面（図面ａ１～ＭＮ）の関連性の高さを示すスコア（指標）である関連性スコアを出力（導出）するように訓練された学習モデルである場合を考える。関連性スコアの導出方法の例については、特許文献１を参照されたい。

【0127】

この場合、検索部１２６は、ベスト学習モデルに前処理後新規図面内容パラメータセットを入力することにより、当該前処理後新規図面内容パラメータセットに応じた関連性スコアを、ベスト学習モデルに出力させる。そして、検索部１２６は、ベスト学習モデルの出力（例：関連性スコア）に基づいて、図面ＮＤに対応する少なくとも１つの過去図面を検索する。関連性スコアに基づく当該過去図面の検索手法の例については、特許文献１を参照されたい。検索部１２６は、特許文献１と同様に、検索結果を示すデータを、表示部７２に表示させてよい。

【0128】

（参考形態の効果）
参考形態における情報処理システム１００ｓ（情報処理装置１ｓ）によれば、上記先行技術（特許文献１の技術）と同様に、図面検索におけるユーザの利便性を従来よりも高めることが可能となる。加えて、学習装置１１ｓによれば、上記先行技術とは異なり、検索対象図面内容パラメータセット（過去図面内容パラメータセット）に対して複数種類の前処理手法が網羅的に施されることにより、当該検索対象図面内容パラメータセットが拡張される。すなわち、複数の前処理後検索対象図面内容パラメータセットが生成される。

【0129】

続いて、複数の機械学習アルゴリズムを適用することにより、複数の前処理後検索対象図面内容パラメータセット（例：データセット１～４^ＦＬ×５^ＦＮ）を用いて、複数の学習モデルが生成される。そして、複数の学習モデルのそれぞれの品質を示す指標値（例：過去図面の検索精度）に基づいて、当該複数の学習モデルの内から、ベスト学習モデルが選択される。言い換えれば、上記指標値に基づいて、複数の機械学習アルゴリズムの内から、ベスト機械学習アルゴリズムが選択される。続いて、ベスト学習モデルに対応するベスト前処理手法が選択される。

【0130】

一般的に、機械学習アルゴリズムによって生成される学習モデルの品質は、学習用データ（例：検索対象図面内容パラメータセット）に適用される前処理手法に応じて変化しうる。加えて、学習モデルの品質は、前処理後の学習用データに適用される機械学習アルゴリズムの種類に応じても変化しうる。

【0131】

適切な前処理手法および機械学習アルゴリズムが選択された場合には、高品質な学習モデルを生成することが可能である。但し、機械学習分野において適用可能な前処理手法および機械学習アルゴリズムの種類は、多岐に亘っている。このため、学習モデルの品質向上に好適な（理想的には最適な）前処理手法および機械学習アルゴリズムの組み合わせを、ユーザが人為的に選択することは必ずしも容易ではない。

【0132】

そこで、学習装置１１ｓでは、上述の通り、生成された複数の学習モデルのそれぞれを、上記指標値に基づいて網羅的に評価することにより、ベスト学習モデルおよびベスト前処理手法が選択される。すなわち、生成された複数の学習モデルに対してグリッドサーチを行うことにより、ベスト学習モデルおよびベスト前処理手法が選択される。

【0133】

上記の構成によれば、ユーザの人為的な選択を経ることなく、ベスト学習モデルおよびベスト前処理手法を特定することができる。すなわち、学習モデルの品質向上に最適である（少なくとも好適である）と期待される前処理手法および機械学習アルゴリズムの組み合わせを、学習装置１１によって自動的に選択できる。

【0134】

その後、図面検索装置１２では、学習装置１１ｓによって選択されたベスト前処理手法に従って、ターゲット図面内容パラメータセット（新規図面内容パラメータセット）に対して前処理が施される。すなわち、ベスト前処理手法に従って、前処理後ターゲット図面内容パラメータセット（前処理後新規図面内容パラメータセット）が生成される。

【0135】

上記の構成によれば、ベスト学習モデルに適したデータ構造を有する入力データセットとして、前処理後ターゲット図面内容パラメータセットが生成される。このため、当該前処理後ターゲット図面内容パラメータセットをベスト学習モデルに入力することにより、上記先行技術に比べてさらに高精度な学習モデルの出力（例：ベスト学習モデルによって導出された関連性スコア）を得ることができる。

【0136】

以上の通り、情報処理システム１００ｓでは、（ｉ）学習装置１１ｓによって予め選択されたベスト前処理手法、および、（ｉｉ）学習装置１１ｓによって予め生成されたベスト学習モデルを用いて、図面検索装置１２に検索を行わせることができる。その結果、情報処理システム１００ｓによれば、上記先行技術に比べてさらに高い検索精度を実現できる。

【0137】

（参考形態における補足）
前処理手法［Ｌ］の一例について、以下に説明する。参考形態では、学習用前処理部１１４は、生値・ラベル値変換テーブルに従って、生値（過去図面内容パラメータ取得部１１２によって取得された内容パラメータ）をラベルエンコーディングしてよい。具体的には、学習用前処理部１１４は、ある生値と当該生値に対応するラベル値の対応関係を示すテーブル（以下、生値・ラベル値変換テーブルと称する）に従って、生値をラベル値へと変換してよい。

【0138】

一例として、情報処理システム１００ｓでは、第１～第Ｌ内容パラメータのそれぞれについて、個別の生値・ラベル値変換テーブルが予め設定されている。以下、第ｋ内容パラメータに対応する生値・ラベル値変換テーブルを、第ｋ生値・ラベル値変換テーブルと称する。

【0139】

図１４には、複数の生値・ラベル値変換テーブルの内の一部が例示されている。図１４において、（ｉ）符号１４００－１は第１生値・ラベル値変換テーブルを、（ｉｉ）符号１４００－２は第２生値・ラベル値変換テーブルを、（ｉｉｉ）符号１４００－３は第３生値・ラベル値変換テーブルを、（ｉｖ）符号１４００－Ｌは第Ｌ生値・ラベル値変換テーブルを、それぞれ表す。

【0140】

図１４の例では、学習用前処理部１１４は、第ｋ生値・ラベル値変換テーブルに従って、第ｋ内容パラメータをラベルエンコーディングしてよい。例えば、学習用前処理部１１４は、第１生値・ラベル値変換テーブルに従って、第１内容パラメータをラベルエンコーディングする。また、学習用前処理部１１４は、第Ｌ生値・ラベル値変換テーブルに従って、第Ｌ内容パラメータをラベルエンコーディングする。

【0141】

以上の通り、第ｋ内容パラメータの変数種類によらず（すなわち、第ｋ内容パラメータがＶＬまたはＶＮのいずれであっても）、当該第ｋ内容パラメータに対し、前処理手法［Ｌ］が施されてよい。なお、上述の通り、第ｋ内容パラメータがＶＬである場合には、［Ｌ］は、［Ｒ］と等価な前処理手法であると言える。

【0142】

別の例として、情報処理システム１００ｓでは、第１～第Ｌ生値・ラベル値変換テーブルを統合したテーブル（以下、生値・ラベル値変換統合テーブルと称する）が予め作成されていてもよい。図１５における符号１５００は、生値・ラベル値変換統合テーブルの一例を表す。

【0143】

図１５の例において、生値・ラベル値変換統合テーブルのｋ行目は、第ｋ生値・ラベル値変換テーブルに対応する。従って、学習用前処理部１１４は、生値・ラベル値変換統合テーブルのｋ行目を参照し、第ｋ内容パラメータをラベルエンコーディングしてもよい。例えば、学習用前処理部１１４は、生値・ラベル値変換統合テーブルの２行目を参照し、第２内容パラメータをラベルエンコーディングする。

【0144】

〔実施形態１〕
図１６は、実施形態１の情報処理システム１００の要部の構成を示すブロック図である。情報処理システム１００の情報処理装置を、情報処理装置１と称する。情報処理装置１の制御装置を、制御装置１０と称する。制御装置１０の学習装置を、学習装置１１（モデル生成装置）と称する。

【0145】

学習装置１１は、学習装置１１ｓとは異なり、学習モデル生成部１１３ｓに替えて、学習モデル生成部１１３（学習部）を備える。学習装置１１の各部の動作の説明に先立ち、参考形態において改善可能な点について以下に述べる。

【0146】

上述の通り、参考形態では、データセット１～４^ＦＬ×５^ＦＮのそれぞれに対して各機械学習アルゴリズムを網羅的に（総当たりで）適用することにより、複数の学習モデルが生成される。次いで、生成された複数の学習モデルのそれぞれを、指標値に基づいて網羅的に評価することにより、ベスト学習モデルおよびベスト前処理手法が選択される。すなわち、生成された複数の学習モデルに対してグリッドサーチを行うことにより、ベスト学習モデルおよびベスト前処理手法が選択される。

【0147】

しかしながら、参考形態では、全パターンのデータセット１～４^ＦＬ×５^ＦＮに全パターンのハイパーパラメータ設定（ハイパーパラメータセット）を適用して複数の学習モデルを生成しているため、学習フェーズに要する計算時間（学習時間）の延伸が生じる可能性がある。このような学習時間の延伸を抑制するためには、全パターンのデータセット１～４^ＦＬ×５^ＦＮおよび全パターンのハイパーパラメータ設定を探索することなく、効率よく適正学習モデルを見出すことが好ましい。なお、適正学習モデルとは、例えば、所定の閾値より大きい指標値を有する学習モデルのことである。実施形態１の学習装置１１は、この考え方に基づき、本願の発明者らによって新たに創作された。

【0148】

（学習モデル生成部１１３の処理の一例）
参考形態と同様にして、学習モデル生成部１１３は、（少なくとも１種類以上の）機械学習アルゴリズムを適用することにより、複数の前処理後内容パラメータセットのそれぞれを用いて、複数の学習モデルを生成する。そして、学習モデル生成部１１３は、複数の前処理後内容パラメータセットのそれぞれを用いて上記複数の学習モデルのそれぞれを検証することにより、上記複数の学習モデルのそれぞれの品質を示す複数の指標値を取得する。

【0149】

ここで、学習モデル生成部１１３は、所定の最適化手法に従って、上記複数の指標値に基づいてよりよい指標値を有する学習モデル（適正学習モデル）を探索する。これにより、学習モデル生成部１１３は、学習用前処理部１１４において用いられた複数種類の前処理手法の内、適正学習モデルに対応する前処理手法を、適正前処理手法として選択する。

【0150】

実施形態１では、一例として、学習モデル生成部１１３が、複数の前処理後内容パラメータセット（データセット１～データセット４^ＦＬ×５^ＦＮ）および複数種類の機械学習アルゴリズム（ＤＴ、ＬＲ、ＮＮ、ＳＶＭ、・・・）ごとに、よりよい指標値を有する学習モデル（ベター学習モデルと称する）を探索する場合について説明する。具体的には、学習モデル生成部１１３は、ある１つの前処理後内容パラメータセット（注目データセットと称する）に、ある１つの機械学習アルゴリズム（注目機械学習アルゴリズムと称する）において設定される複数のハイパーパラメータ設定をそれぞれ適用することによって生成された複数の学習モデルのうち、ベター学習モデルを探索する。以下、ある１つの前処理後内容パラメータセットに、ある１つの機械学習アルゴリズムを適用したときの、学習モデル生成部１１３の一連の処理について説明する。

【0151】

参考形態における学習モデル生成部１１３ｓと同様に、まず、学習モデル生成部１１３は、学習用前処理部１１４から前処理後第１図面種類内容パラメータセット（第１図面種類内容パラメータセットに複数パターンの前処理のそれぞれが施されることによって得られたデータセット）（便宜上、前処理後内容パラメータセットと称する）を取得する。そして、学習モデル生成部１１３は、前処理後内容パラメータセットに含まれる各データセットを、訓練データと検証データとに分割する。

【0152】

次いで、学習モデル生成部１１３は、複数の前処理後内容パラメータセットおよび複数種類の機械学習アルゴリズムごとに、所定の最適化手法に従って、学習モデルを探索する。具体的には、学習モデル生成部１１３は、所定の最適化手法に従って学習フェーズと検証フェーズとを繰り返すことで、学習モデルを探索する。

【0153】

上記学習フェーズでは、学習モデル生成部１１３は、注目データセットの訓練データを基に、注目機械学習アルゴリズムの複数のハイパーパラメータ設定をそれぞれ適用することにより、複数の学習モデルを生成する。上記注目データセットは、データセット１～データセット４^ＦＬ×５^ＦＮのうちの１つである。上記注目機械学習アルゴリズムは、参考形態において述べた所定の複数種類の機械学習アルゴリズムのうちの１つである。

【0154】

上記検証フェーズでは、学習フェーズにおいて生成された複数の学習モデルのそれぞれの指標値を、注目データセットの検証データを用いて取得する。上記指標値は、参考形態において述べた通り、過去図面の検索精度（以下、図面検索精度と称する）としてAccuracy（正解率）が用いられてもよいし、機械学習分野における公知のその他の指標値が用いられてもよい。

【0155】

学習モデル生成部１１３は、複数の前処理後内容パラメータセットおよび複数種類の機械学習アルゴリズムごとに複数のハイパーパラメータ設定を適用することによって得られた複数の学習モデルから、所定の最適化手法に従って、上記指標値に基づいてベター学習モデルを見出す。なお、参考形態における学習モデル生成部１１３ｓと同様に、次元数が３０以上であるデータセットに対しては、「次元の呪い」の影響を受け得る距離ベースの機械学習アルゴリズム（例：ＳＶＭ）による学習モデルの探索は行わなくてもよい。所定の最適化手法による具体的な処理の流れについては、図１７～図１９を参照し後述する。

【0156】

同様に、学習モデル生成部１１３は、学習用前処理部１１４から前処理後第２図面種類内容パラメータセット（第２図面種類内容パラメータセットに複数パターンの前処理のそれぞれが施されることによって得られたデータセット）を取得する。学習モデル生成部１１３は、前処理後第２図面種類内容パラメータセットに基づいて、複数の前処理後内容パラメータセットおよび複数種類の機械学習アルゴリズムごとのベター学習モデルを見出す。また、学習モデル生成部１１３は、学習用前処理部１１４から前処理後第Ｎ図面種類内容パラメータセット（第Ｎ図面種類内容パラメータセットに複数パターンの前処理のそれぞれが施されることによって得られたデータセット）を取得する。学習モデル生成部１１３は、前処理後第Ｎ図面種類内容パラメータセットに基づいて、当該前処理後第２図面種類内容パラメータセットに対応するベター学習モデルを見出す。

【0157】

次いで、学習モデル生成部１１３は、第１図面種類内容パラメータセット～第Ｎ図面種類内容パラメータセットにおける、複数の前処理後内容パラメータセットおよび複数種類の機械学習アルゴリズムごとに見出したベター学習モデルのうち、適正学習モデルを選択する。例えば、学習モデル生成部１１３は、全てのベター学習モデルのうち、（統計値の一例としての）最大指標値を有する学習モデルを適正学習モデルとして選択する。

【0158】

次いで、学習モデル生成部１１３は、適正学習モデルに対応する前処理手法を、適正前処理手法として選択する。実施形態１における以降の処理については、参考形態における「ベスト学習モデル」および「ベスト前処理手法」との用語がそれぞれ「適正学習モデル」および「適正前処理手法」に置き換わる点を除き、参考形態と同様である。

【0159】

（所定の最適化手法の一例）
以下、図１７～図１９を参照し、所定の最適化手法による具体的な処理の流れについて説明する。図１７は、学習モデル生成部１１３の主要な処理の流れを概略的に示すフローチャートである。以下では、上述の図９における符号９００Ａに示されているデータセット１（注目データセット）に、機械学習アルゴリズムとしてＤＴ（注目機械学習アルゴリズム）を適用した場合について説明する。

【0160】

まず、学習モデル生成部１１３は、探索パラメータリストの項目数Ｎ（リスト総数Ｎ）を取得する（Ｓ１）。探索パラメータリストとは、学習モデルを探索するために用いられるパラメータ（以下、探索パラメータと称する）のリストのことである。実施形態１では、学習モデル生成部１１３は、複数の前処理後内容パラメータセットおよび複数の機械学習アルゴリズムごとに、複数のハイパーパラメータ設定を用いて学習モデルを探索するため、探索パラメータリストは、ハイパーパラメータのみを含む。すなわち、探索パラメータリストの項目数Ｎは、ハイパーパラメータ設定の項目数に等しい。以下、簡単のため、Ｎ＝２である場合を例示する。言い換えれば、ハイパーパラメータ設定の項目数が２である場合を例示する。

【0161】

次いで、学習モデル生成部１１３は、探索パラメータリストの項目内からランダムな数値の組み合わせをＮ＋１通り設定する。そして、学習モデル生成部１１３は、当該組合せに対応するＮ次元空間上のＮ＋１個の格子点Ｐ_１～Ｐ_Ｎ＋１を、初期点として生成する（Ｓ２）。本明細書における格子点とは、空間格子を形成する点を意味する。実施形態１では、Ｎ＋１＝３であるので、学習モデル生成部１１３は、
・Ｐ_１＝（ＨＡ_１，ＨＢ_１）
・Ｐ_２＝（ＨＡ_２，ＨＢ_２）
・Ｐ_３＝（ＨＡ_３，ＨＢ_３）
という３つの格子点Ｐ_１～Ｐ_３を、初期点として生成する。ここで、ＨＡ_ｊ（ｊ＝１，２，３）はＤＴの第１ハイパーパラメータ（例えば、データ分割方法）を示すインデックスであり、ＨＢ_ｊ（ｊ＝１，２，３）はＤＴの第２ハイパーパラメータ（例えば、最大深度）を示すインデックスである。

【0162】

次いで、学習モデル生成部１１３は、データセット１の訓練データを基に、Ｓ２において設定した（各格子点Ｐ_１～Ｐ_Ｎ＋１に対応する）複数の探索パラメータ（複数のハイパーパラメータ設定）をそれぞれ用いて複数の学習モデルを生成する（Ｓ３）。これにより、学習モデル生成部１１３は、各格子点Ｐ_１～Ｐ_Ｎ＋１に対応する学習モデルを生成する。

【0163】

次いで、学習モデル生成部１１３は、Ｓ３において生成された複数の学習モデルのそれぞれの指標値を、データセット１の検証データを用いて取得する（Ｓ４）。これにより、学習モデル生成部１１３は、各格子点Ｐ_１～Ｐ_Ｎ＋１に対応する関数ｆ（Ｐ_１）～ｆ（Ｐ_Ｎ＋１）を取得（導出）する。

【0164】

関数ｆは、指標値（例：図面検索精度）を評価するための関数（いわゆる目的関数）として設定されていればよい。例えば、関数ｆは、図面検索精度に対する単調減少関数として設定されていればよい。この場合、図面検索精度が大きくなるにつれて、関数ｆの値は小さくなる。実施形態１の例では、関数ｆは、
ｆ＝１００－図面検索精度［％］…（５）
として設定されている。

【0165】

以下、（ｉ）データセット１の訓練データを基に、格子点Ｐ_ｊの各インデックスに対応する探索パラメータを用いて学習モデルを生成し、（ｉｉ）データセット１の検証データを用いて、当該学習モデルの指標値を取得し、（ｉｉｉ）上述の関数ｆからｆ（Ｐ_ｊ）を求めることを単に「ｆ（Ｐ_ｊ）を導出する」と表記する。

【0166】

次いで、学習モデル生成部１１３は、Ｓ４において取得された指標値（言い換えれば、関数ｆ（Ｐ_１）～ｆ（Ｐ_Ｎ＋１））に基づいて、各格子点Ｐ_１～Ｐ_Ｎ＋１を序列化する（Ｓ５）。実施形態１では、学習モデル生成部１１３は、３つの初期点の内、最良の図面検索精度（最も高い図面検索精度）が割り当てられた点を、最良点Ｂ^（ｍ）として決定する。ｍは、以下に述べるＳ６における最適化繰り返し回数（最適化反復回数）である。ｍは、１≦ｍ≦ｑを満たす整数である。ｑは、最適化繰り返し回数の上限値である。ｑは、予め設定されている。そして、学習モデル生成部１１３は、３つの初期点の内、最悪の図面検索精度（最も低い図面検索精度）が割り当てられた点を、最悪点Ｗ^（ｍ）として決定する。次いで、学習モデル生成部１１３は、３つの初期点の内、最悪点に次いで悪い図面検索精度（２番目に低い図面検索精度）が割り当てられた点を、第２最悪点ＢＷ^（ｍ）として決定する。例えば、ｆ（Ｐ_１）≦ｆ（Ｐ_２）≦ｆ（Ｐ_３）であった場合、格子点Ｐ_１は最良点Ｂ^（ｍ）、格子点Ｐ_２は第２最悪点ＢＷ^（ｍ）、格子点Ｐ_３は最悪点Ｗ^（ｍ）である。

【0167】

次いで、学習モデル生成部１１３は、序列化した各格子点Ｐ_１～Ｐ_Ｎ＋１に基づいて、所定の最適化手法による最適化を実行する（Ｓ６）。Ｓ６の処理内容については後述する。

【0168】

実施形態１では、所定の最適化手法としてネルダー・ミード法（Nelder-Mead method）が用いられる場合を例示する。ネルダー・ミード法は、滑降シンプレックス法、超多面体法、またはアメーバ法とも称される。ネルダー・ミード法は、微分法に依らずに多次元の非線形最適化問題を解くことができる。例えば、ネルダー・ミード法によれば、微分法に依らずに、目的関数の局所的最適解を導出できる。従って、ネルダー・ミード法によれば、微分法に依らずに、目的関数の極値（極大値または極小値）を得ることができる。実施形態１において、目的関数は、ｆ（Ｐ_ｊ）を導出する式（５）として表される。このため、実施形態１において、ネルダー・ミード法を用いることにより、目的関数の極小値（理想的には最小値）を得ることができる。言い換えれば、ネルダー・ミード法を用いることにより、図面検索精度の極大値（理想的には最大値）を得ることができる。すなわち、ネルダー・ミード法を用いることにより、ベター学習モデルを見出すことができる。

【0169】

図１８は、ネルダー・ミード法の概念を概略的に説明するための図である。図１８では、簡単のため、Ｎ＝２の場合（２次元の場合）が例示されている。図１８では、ｍ＝１、２、ｑ－１、およびｑのそれぞれの場合における、Ｂ^（ｍ）、Ｗ^（ｍ）、およびＢＷ^（ｍ）が示されている。図１８の例における点線は、図面検索精度の等高線を示す。図面検索精度の等高線は、目的関数の等高線と読み換えることもできる。

【0170】

図１８に示される通り、ネルダー・ミード法によれば、最適化繰り返し処理の進展（ｍの増加）に伴い、より高い図面検索精度を実現しうる各ハイパーパラメータの組み合わせ（Ｂ^（ｍ）、Ｗ^（ｍ）、およびＢＷ^（ｍ）のそれぞれの座標）が導出される。すなわち、ネルダー・ミード法によれば、図面検索精度の局所的最適解（図面検索精度の極大値）に至るように、各ハイパーパラメータを最適化できる。

【0171】

図１９は、最適化を実行する処理の流れを示すフローチャートである。図１９は、図１７におけるＳ６の処理内容をより具体的に示す。図１９では、ネルダー・ミード法による最適化が例示されている。

【0172】

まず、Ｓ１１において、学習モデル生成部１１３は、最悪点Ｗ^（ｍ）以外の各点（総称的に、各点Ｐ_ｊ ^（ｍ）と表す）を用いて、各点Ｐ_ｊ ^（ｍ）によって構成される超多面体の重心Ｇ^（ｍ）を求める。具体的には、学習モデル生成部１１３は、

【数1】

…（６）
の通り、重心Ｇ^（ｍ）を求める。実施形態１の例では、式（６）にＮ＝２を代入して、重心Ｇ^（ｍ）を求める。

【0173】

次いで、Ｓ１２において、学習モデル生成部１１３は、線分Ｗ^（ｍ）Ｇ^（ｍ）を２：１に外分する外分点Ｒ^（ｍ）を求める。具体的には、学習モデル生成部１１３は、
Ｒ^（ｍ）＝２Ｇ^（ｍ）－Ｗ^（ｍ） …（７）
の通り、外分点Ｒ^（ｍ）を求める。

【0174】

次いで、Ｓ１３において、学習モデル生成部１１３は、上述の関数ｆを用いて、ｆ（Ｒ^（ｍ））を導出する。そして、学習モデル生成部１１３は、
ｆ（Ｒ^（ｍ））≦ｆ（Ｂ^（ｍ）） …（８）
という条件（便宜上、第１判定条件と称する）が満たされているか否かを判定する。第１判定条件が満たされている場合、Ｓ１４に進む。第１判定条件が満たされていない場合、Ｓ１７に進む。

【0175】

第１判定条件が満たされている場合、Ｓ１４において、学習モデル生成部１１３は、線分Ｗ^（ｍ）Ｒ^（ｍ）を３：２に外分する外分点Ｅ^（ｍ）を求める。具体的には、学習モデル生成部１１３は、
Ｅ^（ｍ）＝３Ｇ^（ｍ）－２Ｗ^（ｍ） …（９）
の通り、外分点Ｅ^（ｍ）を求める。

【0176】

次いで、Ｓ１５において、学習モデル生成部１１３は、関数ｆを用いて、ｆ（Ｅ^（ｍ））を導出する。そして、学習モデル生成部１１３は、
ｆ（Ｅ^（ｍ））≦ｆ（Ｒ^（ｍ）） …（１０）
という条件（便宜上、第２判定条件と称する）が満たされているか否かを判定する。第２判定条件が満たされている場合、Ｓ１６に進む。第２判定条件が満たされていない場合、Ｓ１８に進む。

【0177】

第２判定条件が満たされている場合、Ｓ１６において、学習モデル生成部１１３は、最悪点Ｗ^（ｍ）を最適化対象から削除するとともに、点Ｅ^（ｍ）を最適化対象に加える。そして、後述するＳ２３に進む。

【0178】

第１判定条件が満たされていない場合、Ｓ１７において、学習モデル生成部１１３は、
ｆ（Ｒ^（ｍ））≦ｆ（ＢＷ^（ｍ）） …（１１）
という条件（便宜上、第３判定条件と称する）が満たされているか否かを判定する。第３判定条件が満たされている場合、Ｓ１８に進む。第３判定条件が満たされていない場合、Ｓ１９に進む。

【0179】

第３判定条件が満たされている場合、Ｓ１８において、学習モデル生成部１１３は、最悪点Ｗ^（ｍ）を最適化対象から削除するとともに、点Ｒ^（ｍ）を最適化対象に加える。そして、Ｓ２３に進む。

【0180】

第３判定条件が満たされていない場合、Ｓ１９において、学習モデル生成部１１３は、線分Ｗ^（ｍ）Ｇ^（ｍ）の中点Ｓ^（ｍ）を求める。具体的には、学習モデル生成部１１３は、
Ｓ^（ｍ）＝（１／２）×（Ｇ^（ｍ）＋Ｗ^（ｍ）） …（１２）
の通り、中点Ｓ^（ｍ）を求める。

【0181】

次いで、Ｓ２０において、学習モデル生成部１１３は、関数ｆを用いて、ｆ（Ｓ^（ｍ））を導出する。そして、学習モデル生成部１１３は、
ｆ（Ｓ^（ｍ））≦ｆ（Ｗ^（ｍ）） …（１３）
という条件（便宜上、第４判定条件と称する）が満たされているか否かを判定する。第４判定条件が満たされている場合、Ｓ２１に進む。第４判定条件が満たされていない場合、Ｓ２２に進む。

【0182】

第４判定条件が満たされている場合、Ｓ２１において、学習モデル生成部１１３は、最悪点Ｗ^（ｍ）を最適化対象から削除するとともに、点Ｓ^（ｍ）を最適化対象に加える。そして、Ｓ２３に進む。

【0183】

第４判定条件が満たされていない場合、Ｓ２２において、学習モデル生成部１１３は、各ｊについて、線分Ｂ^（ｍ）Ｐ_ｊ ^（ｍ）の中点Ｐ_ｊ ^（ｍ）’を求める。具体的には、学習モデル生成部１１３は、具体的には、学習モデル生成部１１３は、
Ｐ_ｊ ^（ｍ）’＝（１／２）×（Ｐ_ｊ ^（ｍ）＋Ｂ^（ｍ）） …（１４）
の通り、中点Ｐ_ｊ ^（ｍ）’を求める。そして、学習モデル生成部１１３は、各点Ｐ_ｊ ^（ｍ）を各点Ｐ_ｊ ^（ｍ）’に更新する。そして、Ｓ２３に進む。

【0184】

Ｓ２３において、学習モデル生成部１１３は、上述のＳ５と同様にして、関数ｆに基づいて各点Ｐ_ｊ ^（ｍ）を序列化する。

【0185】

次いで、Ｓ２４において、学習モデル生成部１１３は、所定の設定判定条件が満たされているかを判定する。設定判定条件が満たされている場合、Ｓ２５に進む。設定判定条件が満たされていない場合、Ｓ１１に戻り、上述の各処理が繰り返される。このように、学習モデル生成部１１３は、設定判定条件が満たされるまで、上述の各処理を繰り返す。

【0186】

実施形態１における設定判定条件は、例えば、以下の条件１～７の少なくとも１つを含んでいてよい。ここで、Ｖｍは各点Ｐ_ｊ ^（ｍ）によって構成される超多面体の体積であり、Ｖ０は各初期点によって構成される超多面体の体積である。また、αは、

【数2】

を表す。αは、点（最良点）Ｂ^（ｍ）における、関数ｆのｍに関する勾配である。

【0187】

（条件１）Ｖｍ／Ｖ０（Ｖ０に対するＶｍの比率）が、所定の閾値（体積比率閾値）以下となった；
（条件２）ｍが、上限値ｑに達した；
（条件３）最適化処理の計算時間が、所定の時間に達した；
（条件４）点Ｂ^（ｍ）が、所定の繰り返し回数以上に亘って変更されなかった；
（条件５）点Ｂ^（ｍ）の図面検索精度が、所定の閾値（図面検索精度閾値）以上となった；
（条件６）αが、所定の閾値（勾配閾値）以下となった；
但し、当業者であれば明らかである通り、設定判定条件は上記の例に限定されない。本発明の一態様に係る設定判定条件は、「関数ｆ（すなわち、実施形態１の例における図面検索精度）の局所的最適解が見出された状態」および「当該局所的最適解のさらなる探索を打ち切るべき条件」の少なくとも一方を表すように設定されていればよい。

【0188】

設定判定条件が満たされている場合、Ｓ２５において、学習モデル生成部１１３は、最良点Ｂ^（ｍ）のハイパーパラメータの組み合わせを採用する。一例として、Ｓ２５における最良点Ｂ^（ｍ）の座標を、
Ｂ^（ｍ）＝（ＨＡ_{ｂｅｔｔｅｒ}，ＨＢ_{ｂｅｔｔｅｒ}）
と表す。この場合、学習モデル生成部１１３は、ＨＡ_{ｂｅｔｔｅｒ}，ＨＢ_{ｂｅｔｔｅｒ}に対応するハイパーパラメータ設定の項目をベターハイパーパラメータ設定として選択する。そして、学習モデル生成部１１３は、データセット１の訓練データを基に、ＤＴの上記ベターハイパーパラメータ設定を適用することによって得られた学習モデルをベター学習モデルとして見出す。

【0189】

学習モデル生成部１１３は、複数の前処理後内容パラメータセットおよび複数種類の機械学習アルゴリズムごとに、上述の最適化手法を実行し、ベター学習モデルを見出す。そして、学習モデル生成部１１３は、複数の前処理後内容パラメータセットおよび複数種類の機械学習アルゴリズムごとに見出したベター学習モデルのうち、（例えば、最も高い指標値を有するベター学習モデルである）適正学習モデルを選択する。

【0190】

（ネルダー・ミード法の補足）
上述のネルダー・ミード法において、式（７）に従って求められた外分点Ｒ^（ｍ）の各座標は整数とは限らない。そのため、整数でなければならないハイパーパラメータ（例：学習回数、ネットワークの層数、またはノード数など）が探索パラメータリストに含まれる場合、外分点Ｒ^（ｍ）の各座標に対応するハイパーパラメータセットが存在せず、学習モデルを生成できない（すなわち関数ｆが導出できない）可能性がある。

【0191】

そこで、学習モデル生成部１１３は、外分点Ｒ^（ｍ）を求めた後、外分点Ｒ^（ｍ）の座標を全て整数化した（各座標の値の小数第一位を四捨五入した、切り捨てた、または切り上げた）、外分点Ｒ^（ｍ）に対応する格子点Ｒ^（ｍ）’を求める。以降、学習モデル生成部１１３は、このような格子点Ｒ^（ｍ）’を外分点Ｒ^（ｍ）の代わりに用いる。これにより、学習モデル生成部１１３は、整数でなければならないハイパーパラメータが探索パラメータリストに含まれる場合においても、外分点Ｒ^（ｍ）に対応する格子点Ｒ^（ｍ）’を用いて、関数ｆを導出することができる。外分点Ｒ^（ｍ）の座標を全て整数化する上述の形態により、学習装置１１の構成を簡略化できる。

【0192】

学習モデル生成部１１３は、外分点Ｒ^（ｍ）の各座標のうち、整数でなければならないハイパーパラメータに対応する座標のみについて整数化してもよい。具体的には、学習モデル生成部１１３は、探索パラメータリストに含まれるハイパーパラメータのうち、整数でなくても問題ないハイパーパラメータ（例：学習率、正則化項の係数など）に対応する座標については整数化しない。一方、学習モデル生成部１１３は、探索パラメータリストに含まれるハイパーパラメータのうち、整数でなければならないハイパーパラメータに対応する座標については整数化する。

【0193】

なお、外分点Ｅ^（ｍ）、中点Ｓ^（ｍ）、中点Ｐ_ｊ ^（ｍ）’についても、外分点Ｒ^（ｍ）と同様に、各座標の整数化が行われる。

【0194】

（実施形態１の効果）
実施形態１における学習装置１１によれば、所定の最適化手法（例：ネルダー・ミード法）を実行することによって、適正学習モデルを見出すことができる。そのため、参考形態とは異なり、全パターンのデータセット１～４^ＦＬ×５^ＦＮおよび全パターンのハイパーパラメータ設定を探索することなく、効率よく適正学習モデルを見出すことができる。したがって、適正学習モデルを見出すまでに要する学習時間の延伸を抑制することができる。

【0195】

また、複数の前処理後内容パラメータセットおよび複数種類の機械学習アルゴリズムごとに所定の最適化手法を実行することによって、所定の最適化手法における探索パラメータを機械学習アルゴリズムのハイパーパラメータのみとすることができる。そのため、所定の最適化手法において学習モデルを探索するまでの処理時間を短縮することができる。また、次元数が所定の閾値（例えば３０）以上であるデータセットに対して距離ベースの機械学習アルゴリズムによる学習モデルの探索を行わないことにより、学習時間の延伸をさらに抑制することができる。

【0196】

〔変形例１〕
実施形態１では、学習モデル生成部１１３が、複数の前処理後内容パラメータセットおよび複数種類の機械学習アルゴリズムごとに、所定の最適化手法に従って、複数のハイパーパラメータ設定を用いて学習モデルを探索する場合を例示した。しかしながら、学習モデル生成部１１３は、複数種類の機械学習アルゴリズムごとに、所定の最適化手法に従って、複数のデータセット（複数の前処理後内容パラメータセット）および複数のハイパーパラメータ設定を用いて学習モデルを探索してもよい。すなわち、複数のハイパーパラメータ設定に加えて複数のデータセットを所定の最適化手法に従って最適化してもよい。

【0197】

具体的には、学習モデル生成部１１３は、所定の最適化手法に従って学習フェーズと検証フェーズとを繰り返すことで、学習モデルを探索する。上記学習フェーズでは、学習モデル生成部１１３は、複数の前処理後内容パラメータセットのそれぞれに対し、注目機械学習アルゴリズムの複数のハイパーパラメータ設定をそれぞれ適用することにより、複数の学習モデルを生成する。上記検証フェーズでは、学習フェーズにおいて生成された複数の学習モデルのそれぞれの指標値を、複数のデータセットのそれぞれの検証データを用いて取得する。

【0198】

この場合、所定の最適化手法において、探索パラメータリストは、ハイパーパラメータとデータセットの順位とを含む。すなわち、実施形態１と比較し、探索パラメータとしてデータセットの順位が追加される。ここで、データセットの順位は、所定の順位付けに従って４^ＦＬ×５^ＦＮ個のデータセットに付与される。例えば、データセットの順位は、図１０における列番号である。

【0199】

学習モデル生成部１１３は、このような探索パラメータを上述した所定の最適化手法に従って最適化する。これにより、学習モデル生成部１１３は、複数の前処理後内容パラメータセットのそれぞれに対し、注目機械学習アルゴリズムの複数のハイパーパラメータ設定をそれぞれ適用することによって得られる複数の学習モデルのうち、ベター学習モデルを見出す。そして、学習モデル生成部１１３は、第１図面種類内容パラメータセット～第Ｎ図面種類内容パラメータセットにおける、複数種類の機械学習アルゴリズムごとに見出したベター学習モデルのうち、適正学習モデルを選択する。

【0200】

変形例１では、複数のハイパーパラメータ設定に加えて複数のデータセットを所定の最適化手法に従って最適化することにより、学習モデルを探索している。そのため、全パターンのデータセット１～４^ＦＬ×５^ＦＮごとに学習モデルを探索する必要がないため、適正学習モデルを見出すまでに要する学習時間の延伸をさらに抑制することができる。

【0201】

〔変形例２〕
なお、学習モデル生成部１１３は、所定の最適化手法に従って、複数のデータセットおよび複数種類の機械学習アルゴリズムの複数のハイパーパラメータ設定を用いて学習モデルを探索してもよい。すなわち、複数種類の機械学習アルゴリズムについても所定の最適化手法に従って最適化してもよい。

【0202】

具体的には、学習モデル生成部１１３は、所定の最適化手法に従って学習フェーズと検証フェーズとを繰り返すことで、学習モデルを探索する。上記学習フェーズでは、学習モデル生成部１１３は、複数のハイパーパラメータ設定をそれぞれ設定した複数種類の機械学習アルゴリズムのそれぞれを、複数の前処理後内容パラメータセットのそれぞれに適用することにより、複数の学習モデルを生成する。上記検証フェーズでは、学習フェーズにおいて生成された複数の学習モデルのそれぞれの指標値を、複数のデータセットのそれぞれの検証データを用いて取得する。

【0203】

この場合、所定の最適化手法において、探索パラメータリストは、機械学習アルゴリズムの順位とハイパーパラメータとデータセットの順位とを含む。すなわち、変形例１と比較し、探索パラメータとして機械学習アルゴリズムの順位が追加される。ここで、機械学習アルゴリズムの順位は、所定の順位付けに従って複数種類の機械学習アルゴリズムに付与される。例えば、１．重回帰分析、２．決定木分析、３．ランダムフォレスト、・・・のように、複数種類の機械学習アルゴリズムに対して順位付けされる。なお、この場合、各機械学習アルゴリズムに固有のハイパーパラメータ（例えば、ＤＴにおける木の深さ、ＮＮにおける層数など）については固定されることが好ましい。

【0204】

学習モデル生成部１１３は、このような探索パラメータを上述した所定の最適化手法に従って最適化する。これにより、学習モデル生成部１１３は、複数のハイパーパラメータ設定をそれぞれ設定した複数種類の機械学習アルゴリズムのそれぞれを、複数の前処理後内容パラメータセットのそれぞれに適用することにより得られる複数の学習モデルのうち、ベター学習モデルを見出す。そして、学習モデル生成部１１３は、第１図面種類内容パラメータセット～第Ｎ図面種類内容パラメータセットにおけるベター学習モデルのうち、適正学習モデルを選択する。

【0205】

変形例２では、複数種類の機械学習アルゴリズムについても所定の最適化手法に従って最適化することにより、学習モデルを探索している。そのため、複数種類の機械学習アルゴリズムごとに学習モデルを探索する必要がないため、適正学習モデルを見出すまでに要する学習時間の延伸をさらに抑制することができる。

【0206】

〔変形例３〕
実施形態１では、最適化手法としてネルダー・ミード法が使用されている場合を例示した。但し、当業者であれば明らかである通り、本発明の一態様に係る最適化手法として、その他の手法が採用されてもよい。

【0207】

最適化手法の別の例としては、パウエル法（Powell method）を挙げることができる。パウエル法も、ネルダー・ミード法と同様に、微分法に依らずに、多次元の非線形最適化問題を解くことができる。従って、ネルダー・ミード法に替えてパウエル法を用いて、図面検索精度の極大値を導出することもできる。

【0208】

また、１次元の非線形最適化問題を解く場合には、最適化手法として黄金分割法を使用することもできる。黄金分割法は、微分法に依らずに、１次元の非線形最適化問題を解くことができる。黄金分割法によれば、微分法に依らずに、１次元の非線形関数として表される図面検索精度の極大値を導出できる。

【0209】

当業者であれば明らかである通り、本発明の一態様に係る最適化手法は、特に限定されない。但し、アルゴリズムの実装の容易化の観点からは、本発明の一態様に係る最適化手法は、微分法に依らない最適化手法、すなわちＤＦＯ（Derivative-Free Optimization）であることが好ましい。ネルダー・ミード法、パウエル法、および黄金分割法はいずれも、ＤＦＯの例である。

【0210】

また、複数の前処理後内容パラメータセットは離散的な複数の前処理後内容パラメータ（例えば、前処理［Ｏ］が施された後の内容パラメータ）を含むことから、本発明の一態様に係る最適化手法は、離散的な複数の前処理後内容パラメータに対して適用可能な最適化手法であることが好ましい。ネルダー・ミード法、パウエル法、および黄金分割法はいずれも、離散的な変数に対して適用可能な最適化手法の例である。

【0211】

〔ソフトウェアによる実現例〕
情報処理システム１００ｓ・１００（以下、「装置」と呼ぶ）の機能は、当該装置としてコンピュータを機能させるためのプログラムであって、当該装置の各制御ブロック（特に制御装置１０ｓ・１０に含まれる各部）としてコンピュータを機能させるためのプログラムにより実現することができる。

【0212】

この場合、上記装置は、上記プログラムを実行するためのハードウェアとして、少なくとも１つの制御装置（例えばプロセッサ）と少なくとも１つの記憶装置（例えばメモリ）を有するコンピュータを備えている。この制御装置と記憶装置により上記プログラムを実行することにより、上記各実施形態で説明した各機能が実現される。

【0213】

上記プログラムは、一時的ではなく、コンピュータ読み取り可能な、１または複数の記録媒体に記録されていてもよい。この記録媒体は、上記装置が備えていてもよいし、備えていなくてもよい。後者の場合、上記プログラムは、有線または無線の任意の伝送媒体を介して上記装置に供給されてもよい。

【0214】

また、上記各制御ブロックの機能の一部または全部は、論理回路により実現することも可能である。例えば、上記各制御ブロックとして機能する論理回路が形成された集積回路も本発明の範疇に含まれる。この他にも、例えば量子コンピュータにより上記各制御ブロックの機能を実現することも可能である。

【0215】

上述の各説明から明らかである通り、上記各実施形態で説明した各処理は、ＡＩ（Artificial Intelligence：人工知能）に実行させることができる。この場合、ＡＩは上記制御装置で動作するものであってもよいし、他の装置（例えばエッジコンピュータまたはクラウドサーバ等）で動作するものであってもよい。

【0216】

〔付記事項〕
本発明は上述した各実施形態に限定されるものではなく、請求項に示した範囲で種々の変更が可能であり、異なる実施形態にそれぞれ開示された技術的手段を適宜組み合わせて得られる実施形態についても本発明の技術的範囲に含まれる。

【符号の説明】

【0217】

１情報処理装置
１０制御装置
１１学習装置（モデル生成装置）
１００情報処理システム
１１１過去図面データ取得部
１１２過去図面内容パラメータ取得部（取得部）
１１３学習モデル生成部（学習部）
１１４学習用前処理部（前処理部）

【図1】