特開2022-47915 | 知財ポータル「IP Force」

知財求人 - 知財ポータルサイト「IP Force」

青山学院大学 (神奈川県相模原市中央区淵野辺)

▶ 日新電機株式会社の特許一覧

特開2022-47915モデル生成装置およびモデル生成方法

書誌要約請求の範囲詳細な説明課題実施例実施するための形態図面の説明

目に優しい文字サイズ小中大 PDF Top

< >

1
2
3
4
5
6
7
8
9
10
11
12
13
14
15

(19)【発行国】日本国特許庁(JP)

(12)【公報種別】公開特許公報(A)

(11)【公開番号】P2022047915

(43)【公開日】2022-03-25

(54)【発明の名称】モデル生成装置およびモデル生成方法

(51)【国際特許分類】

G06N 20/00 20190101AFI20220317BHJP

G06F 30/10 20200101ALI20220317BHJP

G06F 16/58 20190101ALI20220317BHJP

【ＦＩ】

G06N20/00 160

G06F17/50 614B

G06F16/58

【審査請求】未請求

【請求項の数】5

【出願形態】ＯＬ

(21)【出願番号】P 2020153966

(22)【出願日】2020-09-14

(71)【出願人】

【識別番号】000003942

【氏名又は名称】日新電機株式会社

(74)【代理人】

【識別番号】110000338

【氏名又は名称】特許業務法人ＨＡＲＡＫＥＮＺＯＷＯＲＬＤＰＡＴＥＮＴ＆ＴＲＡＤＥＭＡＲＫ

(72)【発明者】

【氏名】森本充

(72)【発明者】

【氏名】竹原輝巳

【テーマコード（参考）】

5B046

5B146

5B175

【Ｆターム（参考）】

5B046AA03

5B046DA07

5B046KA05

5B146AA04

5B146DL04

5B146DL08

5B175DA02

5B175HB03

(57)【要約】

【課題】図面検索におけるユーザの利便性を従来よりも高める。
【解決手段】学習装置（１１）は、複数の検索対象図面のそれぞれの検索対象図面内容パラメータに基づき、上記複数の検索対象図面に含まれる任意の２つの異なる検索対象図面間の記載内容の相違度を算出する。学習装置（１１）は、上記相違度に応じて、上記複数の検索対象図面の内から、学習対象外図面を決定する。学習装置（１１）は、上記学習対象外図面を除いた上記複数の検索対象図面のそれぞれの上記検索対象図面内容パラメータに基づき、上記複数の検索対象図面からターゲット図面に対応する少なくとも１つの図面を検索するための学習モデルを生成する。
【選択図】図９

【特許請求の範囲】

【請求項1】

複数の検索対象図面からターゲット図面に対応する少なくとも１つの図面を検索するための学習モデルを生成するモデル生成装置であって、
上記複数の検索対象図面を解析することにより、当該複数の検索対象図面のそれぞれの記載内容に関連した検索対象図面内容パラメータを取得する、検索対象図面内容パラメータ取得部と、
上記複数の検索対象図面のそれぞれの上記検索対象図面内容パラメータに基づき、上記複数の検索対象図面に含まれる任意の２つの異なる検索対象図面間の記載内容の相違度を算出する相違度算出部と、
上記相違度に応じて、上記複数の検索対象図面の内から、学習対象外図面を決定する決定部と、
上記学習対象外図面を除いた上記複数の検索対象図面のそれぞれの上記検索対象図面内容パラメータに基づき、上記学習モデルを生成する学習部と、を備えている、モデル生成装置。

【請求項2】

上記決定部は、
上記相違度が閾値以下である上記複数の検索対象図面の組によって構成される集合を決定し、
上記集合に属する上記複数の検索対象図面の内から、上記学習対象外図面を決定する、請求項１に記載のモデル生成装置。

【請求項3】

上記決定部は、（ｉ）上記集合に属する上記複数の検索対象図面のそれぞれと、（ｉｉ）上記集合に属しないある１つの検索対象図面と、の相違度の最大値を、上記集合と上記ある１つの検索対象図面との相違度として設定する、請求項２に記載のモデル生成装置。

【請求項4】

上記検索対象図面内容パラメータには、検索対象図面第１内容パラメータから検索対象図面第Ｌ内容パラメータまでのＬ個のパラメータが含まれており、
上記２つの異なる検索対象図面の一方を図面Ｉ、他方を図面Ｊと称し、
上記相違度算出部は、上記検索対象図面内容パラメータの分布を示すＬ次元データ空間における、図面Ｉに対応する点と図面Ｊに対応する点との距離を、図面Ｉと図面Ｊとの相違度として算出する、請求項１から３のいずれか１項に記載のモデル生成装置。

【請求項5】

複数の検索対象図面からターゲット図面に対応する少なくとも１つの図面を検索するための学習モデルを生成するモデル生成方法であって、
上記複数の検索対象図面を解析することにより、当該複数の検索対象図面のそれぞれの記載内容に関連した検索対象図面内容パラメータを取得する、検索対象図面内容パラメータ取得工程と、
上記複数の検索対象図面のそれぞれの上記検索対象図面内容パラメータに基づき、上記複数の検索対象図面に含まれる任意の２つの異なる検索対象図面間の記載内容の相違度を算出する相違度算出工程と、
上記相違度に応じて、上記複数の検索対象図面の内から、学習対象外図面を決定する決定工程と、
上記学習対象外図面を除いた上記複数の検索対象図面のそれぞれの上記検索対象図面内容パラメータに基づき、上記学習モデルを生成する学習工程と、を含んでいる、モデル生成方法。

【発明の詳細な説明】

【技術分野】

【0001】

本発明の一態様は、モデル生成装置に関する。

【背景技術】

【0002】

例えば、プラントエンジニアリング分野では、大量の図面（例：過去図面）の取り扱いが必要となる。このため、大量の図面から、所望の図面を効率的に検索するための技術が要求されている。

【0003】

一例として、特許文献１には、図面検索システム（図面管理システム）のユーザインターフェースに関する技術が開示されている。特許文献１の図面検索システムは、ユーザによる機器名および図面の種別名のそれぞれの選択操作を受け付け、当該選択操作に応じた図面群を検索する。

【先行技術文献】

【特許文献】

【0004】

【特許文献1】特開２００３－９９４８４号公報

【発明の概要】

【発明が解決しようとする課題】

【0005】

特許文献１の図面検索システムによれば、ユーザに検索ワードの入力を行わせることなく、上記選択操作に応じた検索結果（図面群）を提示できる。しかしながら、後述するように、特許文献１の図面検索システムでは、ターゲット図面に対応する所望の図面（例：ターゲット図面との関連性が高いと考えられる特定の図面）を、検索結果から迅速に発見することは、ユーザにとって必ずしも容易ではない。

【0006】

このように、従来の図面検索技術では、ユーザの利便性を高めるための工夫について、なお改善の余地がある。本発明の一態様は、図面検索におけるユーザの利便性を従来よりも高めることを目的とする。

【課題を解決するための手段】

【0007】

上記の課題を解決するために、本発明の一態様に係るモデル生成装置は、複数の検索対象図面からターゲット図面に対応する少なくとも１つの図面を検索するための学習モデルを生成するモデル生成装置であって、上記複数の検索対象図面を解析することにより、当該複数の検索対象図面のそれぞれの記載内容に関連した検索対象図面内容パラメータを取得する、検索対象図面内容パラメータ取得部と、上記複数の検索対象図面のそれぞれの上記検索対象図面内容パラメータに基づき、上記複数の検索対象図面に含まれる任意の２つの異なる検索対象図面間の記載内容の相違度を算出する相違度算出部と、上記相違度に応じて、上記複数の検索対象図面の内から、学習対象外図面を決定する決定部と、上記学習対象外図面を除いた上記複数の検索対象図面のそれぞれの上記検索対象図面内容パラメータに基づき、上記学習モデルを生成する学習部と、を備えている。

【0008】

また、上記の課題を解決するために、本発明の一態様に係るモデル生成方法は、複数の検索対象図面からターゲット図面に対応する少なくとも１つの図面を検索するための学習モデルを生成するモデル生成方法であって、上記複数の検索対象図面を解析することにより、当該複数の検索対象図面のそれぞれの記載内容に関連した検索対象図面内容パラメータを取得する、検索対象図面内容パラメータ取得工程と、上記複数の検索対象図面のそれぞれの上記検索対象図面内容パラメータに基づき、上記複数の検索対象図面に含まれる任意の２つの異なる検索対象図面間の記載内容の相違度を算出する相違度算出工程と、上記相違度に応じて、上記複数の検索対象図面の内から、学習対象外図面を決定する決定工程と、上記学習対象外図面を除いた上記複数の検索対象図面のそれぞれの上記検索対象図面内容パラメータに基づき、上記学習モデルを生成する学習工程と、を含んでいる。

【発明の効果】

【0009】

本発明の一態様によれば、図面検索におけるユーザの利便性を従来よりも高めることができる。

【図面の簡単な説明】

【0010】

【図1】参考形態の情報処理システムの要部の構成を示すブロック図である。

【図2】参考形態における第１テーブルの一例を示す図である。

【図3】過去図面に対する特定文字列抽出処理の一例を示す図である。

【図4】参考形態における第２テーブルの一例を示す図である。

【図5】参考形態における第３テーブルの一例を示す図である。

【図6】新規図面に対する特定文字列抽出処理の一例を示す図である。

【図7】参考形態における関連性スコアの導出例について説明する図である。

【図8】参考形態における図面検索結果の一例を示す図である。

【図9】実施形態１における情報処理システムの要部の構成を示すブロック図である。

【図10】実施形態１における相違度について説明する図である。

【図11】実施形態１における相違度テーブルの一例を示す図である。

【図12】実施形態１における類似集合決定部の処理の一例を示す図である。

【図13】実施形態１において得られた集合の階層構造を表すデンドログラムの一例を示す図である。

【図14】実施形態１における学習対象外図面決定部の処理の一例を示す図である。

【図15】実施形態１における編集後第２テーブルの一例を示す図である。

【発明を実施するための形態】

【0011】

〔参考形態〕
実施形態１の情報処理システム１００の説明に先立ち、参考形態としての情報処理システム１００ｓについて述べる。説明の便宜上、参考形態にて説明した部材と同じ機能を有する部材については、以降の各実施形態では、同じ符号を付記し、その説明を繰り返さない。また、簡潔化のため、公知技術と同様の事項についても、説明を適宜省略する。

【0012】

本明細書において以下に述べる各数値は、単なる一例であることに留意されたい。本明細書では、２つの数ＡおよびＢについての「Ａ～Ｂ」という記載は、特に明示されない限り、「Ａ以上かつＢ以下」を意味するものとする。

【0013】

（情報処理システム１００ｓの概要）
図１は、情報処理システム１００ｓの要部の構成を示すブロック図である。情報処理システム１００ｓは、情報処理装置１ｓ、過去物件図面ＤＢ（Database）９１、および新規物件図面ＤＢ９２を備える。

【0014】

情報処理装置１ｓは、制御装置１０ｓ、入力部７１、表示部７２、および記憶部８０を備える。制御装置１０ｓは、学習装置１１ｓおよび図面検索装置１２を備える。本明細書の「物件」とは、例えば、プラントエンジニアリングにおける「サイト」を意味する。

【0015】

情報処理装置１ｓは、過去物件図面ＤＢ９１および新規物件図面ＤＢ９２と通信可能に接続されていればよい。このため、図１の例とは異なり、情報処理装置１ｓの内部に、過去物件図面ＤＢ９１および新規物件図面ＤＢ９２の少なくとも一方が設けられていてもよい。

【0016】

情報処理装置１ｓ（より具体的には、制御装置１０ｓ）による検索対象となる図面（検索対象図面）には、例えば、仕様図面、設計図面、および製作図面が含まれる。また、検索対象図面には、仕様書、設計書、および、見積書が含まれていてもよい。このように、検索対象図面は、「図面」という名称が含まれている書面に限定されない。一例として、検索対象図面には、プラントエンジニアリング分野におけるプロジェクトの計画に関する任意の種類の書面が含まれる。

【0017】

制御装置１０ｓは、情報処理装置１ｓの各部を統括的に制御する。記憶部８０は、制御装置１０ｓの処理に用いられる各種のデータおよびプログラムを格納する。以下に述べるように、制御装置１０ｓは、機械学習を利用して、複数の検索対象図面（例：過去図面ａ１～ＭＮ）から、ターゲット図面（例：図面ＮＤ）に対応する少なくとも１つの図面を検索する。

【0018】

入力部７１は、ユーザの操作（ユーザ操作）を受け付ける。表示部７２は、各種のデータを表示する。一例として、表示部７２には、制御装置１０ｓによる検索結果を示すデータが表示されてよい。なお、入力部７１と表示部７２とは、一体として設けられてもよい。例えば、タッチパネルを用いることにより、入力部７１と表示部７２とを一体化できる。

【0019】

（過去物件図面ＤＢ９１）
過去物件図面ＤＢ９１には、過去の各物件（既設の各物件）に関する各図面（厳密には、図面データ）が格納されている。以下の説明では、「図面Ａ（ある図面）の図面データ」を、単に「図面Ａ」と適宜略称する。また、「図面Ａの図面番号」を、単に「図面Ａ」と適宜略称する。

【0020】

参考形態では、過去物件図面ＤＢ９１には、複数のＭ個の異なる物件のそれぞれについての各図面が格納されている。Ｍは、１以上の整数である。以下、ｊ番目の物件を、「物件ｊ」とも称する。ｊは、１以上かつＭ以下の整数である。

【0021】

また、過去物件図面ＤＢ９１には、物件１～Ｍのそれぞれについて、Ｎ個（Ｎ種類）の異なる図面が格納されている。Ｎは、１以上の整数である。以下、物件ｊにおけるｉ番目の図面を、「図面（ｉ，ｊ）」とも称する。また、各物件におけるｉ番目（ｉ種類目）の図面を、総称的に図面ｉとも称する。ｉは、１以上かつＮ以下の整数である。

【0022】

以上のように、過去物件図面ＤＢ９１には、合計でＴ個の図面が格納されている。参考形態の例では、Ｔ＝Ｍ×Ｎである。Ｔは、２以上の整数であるものとする。つまり、ＭおよびＮの少なくとも１つは、１以上であるものとする。

【0023】

具体的には、過去物件図面ＤＢ９１では、図２に示す第１テーブルＴＢ１の形態で、各種類の図面番号が物件番号毎にリスト化されている。以下、第１テーブルＴＢ１を、「ＴＢ１」とも略記する。その他の要素についても、適宜同様に略記する。ＴＢ１は、「物件別ソート済の過去物件・図面対応テーブル」とも称される。ＴＢ１のｉ行ｊ列目のセルは、図面（ｉ，ｊ）の図面番号を示す。

【0024】

図２の例では、便宜上、物件１～３をそれぞれ、物件Ａ～Ｃとも表記する。図２の例では、１種類目の図面（図面１）は外形図であり、２種類目の図面（図面２）は組立図であり、３種類目の図面（図面３）は基礎図である。また、Ｎ種類目の図面（図面Ｎ）は構成図である。

【0025】

以下では、簡単のため、図２の例における図面（１，１）～（Ｎ，１）（すなわち、物件ＡにおけるＮ種類のそれぞれの図面）を、図面ａ１～ａＮとも表記する。例えば、図２の例における図面ａ１～ａＮはそれぞれ、物件Ａの外形図～構成図を指す。その他の物件における各図面についても、同様に表記する。

【0026】

以上のように、過去物件図面ＤＢ９１には、図面ａ１から図面ＭＮまでの、合計Ｔ個の図面が格納されている。以下、図面ａ１～ＭＮを総称的に、過去図面とも称する。過去図面は、検索対象図面の一例である。このため、図面ａ１～ＭＮは、検索対象図面群とも称される。

【0027】

また、本明細書では、複数の過去図面（検索対象図面）のうちの任意の１つの図面を、候補図面とも称する。一例として、図面ａ１（物件Ａの外形図）を候補図面とした場合の、各処理について主に例示する。その他の図面に対する処理については、適宜説明を省略するが、図面ａ１の場合と同様である。

【0028】

（学習装置１１ｓ）
学習装置１１ｓは、過去図面データ取得部１１１、過去図面データ前処理部１１２（候補図面内容パラメータ取得部，検索対象図面内容パラメータ取得部）、および学習モデル生成部１１３ｓを備える。学習装置１１ｓは、図面ａ１～ＭＮに基づき、図面検索装置１２による図面検索のための学習モデルを生成する。このことから、学習装置１１ｓは、モデル生成装置と称されてもよい。以下、学習装置１１ｓの処理の流れの一例について述べる。

【0029】

（候補図面の取得）
過去物件図面ＤＢ９１では、ＴＢ１ｓに従って、図面ａ１～ＭＮが、図面種類別に予めソートされている。従って、例えば、過去図面データ取得部１１１は、「図面ａ１→ｂ１→…→Ｍ１」の順に、各外形図を過去物件図面ＤＢ９１から取得する。続いて、過去図面データ取得部１１１は、「図面ａ２→ｂ２→…→Ｍ２」の順に、各組立図を過去物件図面ＤＢ９１から取得する。そして、最終的には、過去図面データ取得部１１１は、「図面ａＮ→ｂＮ→…→ＭＮ」の順に、各構成図を過去物件図面ＤＢ９１から取得する。

【0030】

上記の例の場合、過去図面データ取得部１１１は、はじめにＴＢ１ｓの１行１列目のセルを参照する。そして、過去図面データ取得部１１１は、上記セルに対応する図面（１，１）、すなわち図面ａ１を、過去物件図面ＤＢ９１から取得する。過去図面データ取得部１１１は、取得した図面ａ１を、過去図面データ前処理部１１２に供給する。

【0031】

（候補図面に対応する前処理データの生成）
過去図面データ前処理部１１２は、図面ａ１を解析することにより、当該図面ａ１に対応する前処理データを生成する。一例として、過去図面データ前処理部１１２は、図面ａ１にＯＣＲ処理を施し、ＯＣＲ処理後データを生成する。ＯＣＲ処理後データでは、図面ａ１において画像データとして表現されていた各文字が、文字コードへと変換されている。

【0032】

そして、過去図面データ前処理部１１２は、ＯＣＲ処理後データから、各図面について予め設定された特定の文字列（ストリング）を抽出（検出）する。以下、当該特定の文字列を、特定文字列と称する。実施形態１では、Ｌ個（Ｌは２以上の整数）の異なる第ｋ特定文字列が、予め設定されているものとする。

【0033】

以下では、ｋ番目の特定文字列を、第ｋ特定文字列と称する。ｋは、１以上かつＬ以下の整数である。以下の説明では、第１特定文字列が「電圧値」、第２特定文字列が「電流値」、第３特定文字列が「ＯＲ」、第Ｌ特定文字列が「開」として設定されている場合について、例示する。

【0034】

但し、特定文字列は、上記の例に限定されない。特定文字列は、例えばエンジニアリング分野の図面中において、製品の仕様情報（技術情報）を説明するために、一般的に用いられている単語であればよい。

【0035】

図３は、図面ａ１に対する特定文字列抽出処理の一例を示す図である。図３の例では、図面ａ１の領域Ｌ１に、「電圧値９０Ｖ」という文字列が記載されている。この場合、過去図面データ前処理部１１２は、ＯＣＲ処理後データから、Ｌ１の「電圧値９０Ｖ」という一連の文字列を抽出する。過去図面データ前処理部１１２は、抽出した当該一連の文字列から、第１特定文字列「電圧値」をさらに抽出する。

【0036】

続いて、過去図面データ前処理部１１２は、上記一連の文字列に対し、公知の構文解析技術を適用することにより、第１特定文字列「電圧値」に後続する文字列「９０Ｖ」は、「電圧値」の属性を示していると判定する。この場合、過去図面データ前処理部１１２は、「９０Ｖ」という文字列中に含まれる数字「９０」を、「電圧値」の大きさを示す値として取得する。このように、過去図面データ前処理部１１２は、構文解析により、『Ｌ１に記載されている一連の文字列は、「電圧値が９０Ｖである」という仕様情報を示している』旨を判定する。

【0037】

また、図面ａ１の領域Ｌ２には、「電流値１．０Ａ」という一連の文字列が記載されている。過去図面データ前処理部１１２は、Ｌ１の例と同様にして、上記一連の文字列から、第２特定文字列「電流値」を抽出する。そして、過去図面データ前処理部１１２は、第２特定文字列「電流値」に後続する文字列「１．０Ａ」は、「電流値」の属性を示していると判定する。そこで、過去図面データ前処理部１１２は、「１．０Ａ」という文字列中に含まれる数字「１．０」を、「電流値」の大きさを示す値として取得する。このように、過去図面データ前処理部１１２は、『Ｌ２に記載されている一連の文字列は、「電流値が２．０Ａである」という仕様情報を示している』旨を判定する。

【0038】

ところで、図面ａ１には、第３特定文字列「ＯＲ」が記載されているが、当該第３特定文字列「ＯＲ」には、何ら文字列が後続していない。この場合、過去図面データ前処理部１１２は、ＯＣＲ処理後データに含まれる第３特定文字列「ＯＲ」の登場回数を検出する。当該検出処理の結果、過去図面データ前処理部１１２は、図面ａ１に含まれている第３特定文字列「ＯＲ」の個数が、３つである旨を判定する（領域Ｌ３を参照）。

【0039】

同様に、図面ａ１には、第Ｌ特定文字列「開」が記載されているが、当該第Ｌ特定文字列「開」に、何ら文字が後続していない。そこで、過去図面データ前処理部１１２は、Ｌ３の例と同様に、図面ａ１に含まれている第Ｌ特定文字列「開」の個数が、１つである旨を判定する（領域Ｌ４を参照）。

【0040】

そして、過去図面データ前処理部１１２は、ＯＣＲ処理後データに対する上述の解析結果に基づき、図面ａ１に対応する前処理データを生成する。当該前処理データは、第ｋ特定文字列に対応付けられた第ｋ内容パラメータ（以下、Ａｋ）を示すデータセットである。また、第１～第Ｌ内容パラメータを総称的に、内容パラメータとも称する。

【0041】

内容パラメータは、図面の記載内容（具体的には、特定文字列に係る記載内容）を数値化（定量化）したデータの１つであると言える。このため、内容パラメータは、図面の記載内容を示す指標として用いられる。なお、後述するターゲット図面内容パラメータとの区別のため、検索対象図面（過去図面）の内容パラメータを、検索対象図面内容パラメータとも称する。また、検索対象図面の第ｋ内容パラメータを、検索対象図面第ｋ内容パラメータとも称する。

【0042】

以下では、図面（ｉ，ｊ）のＡｋを、Ａｋ（ｉ，ｊ）とも表記する。上述の通り、過去図面データ前処理部１１２は、図面（ｉ，ｊ）に対する解析結果（より具体的には、図面（ｉ，ｊ）における特定文字列の検出結果）に基づき、Ａｋ（ｉ，ｊ）を設定する。

【0043】

一例として、過去図面データ前処理部１１２は、図面ａ１について、Ａ１＝９０と設定する（後述の図４のハッチング箇所も参照）。すなわち、過去図面データ前処理部１１２は、図面ａ１に記載されている第１特定文字列「電圧値」の大きさを示す値「９０」を、第１内容パラメータとして設定する。

【0044】

同様に、過去図面データ前処理部１１２は、Ａ２＝１．０と設定する。すなわち、過去図面データ前処理部１１２は、図面ａ１に記載されている第２特定文字列「電流値」の大きさを示す値「１．０」を、第２内容パラメータとして設定する。

【0045】

これに対し、過去図面データ前処理部１１２は、Ａ３＝３と設定する。すなわち、過去図面データ前処理部１１２は、図面ａ１における第３特定文字列「ＯＲ」の記載回数（登場回数）を示す値「３」を、第３内容パラメータとして設定する。

【0046】

同様に、過去図面データ前処理部１１２は、ＡＬ＝１と設定する。すなわち、過去図面データ前処理部１１２は、図面ａ１における第Ｌ特定文字列「開」の記載回数を示す値「１」を、第Ｌ内容パラメータとして設定する。

【0047】

以上のように、過去図面データ前処理部１１２は、図面ａ１について、Ａ１～ＡＬを設定する。以上のように、過去図面データ前処理部１１２は、候補図面を解析することにより、当該候補図面の内容パラメータを取得する。このことから、過去図面データ前処理部１１２は、候補図面内容パラメータ取得部とも呼称される。

【0048】

また、過去図面データ前処理部１１２は、その他の過去図面についても、同様の処理を行う。すなわち、過去図面データ前処理部１１２は、図面ａ１～ＭＮのそれぞれに対し、Ａ１～ＡＬを設定する。

【0049】

その後、過去図面データ前処理部１１２は、図面ａ１～ＭＮのそれぞれのＡ１～ＡＬ、すなわち、Ａ１（１，１）～ＡＬ（Ｍ，Ｎ）、を示す第２テーブルＴＢ２を生成する。以下に述べるように、ＴＢ２は、参考形態における教師データの一例である。すなわち、過去図面データ前処理部１１２は、教師データを生成する機能部（教師データ生成部）としても動作する。

【0050】

ＴＢ２には、第２テーブル内第ｉサブテーブルＴＢ２－ｉが含まれている。ＴＢ２－ｉは、図面ｉのそれぞれのＡ１～ＡＬを示すテーブルである。図４には、一例として、ＴＢ２－１が示されている。ＴＢ２－１には、図面ａ１～Ｍ１（物件Ａ～Ｍの外形図）のそれぞれのＡ１～ＡＬが示されている。ＴＢ２ｓは、ＴＢ２－１～ＴＢ２－Ｎという、Ｎ個のサブテーブルのセットによって構成されている。このように、参考形態では、図面種別ごとにサブテーブルが作成される。

【0051】

（参考形態における学習モデルの生成）
学習モデル生成部１１３ｓは、図面ａ１～Ｍ１に対応する前処理データ（すなわち、図面ａ１～Ｍ１におけるＡ１～ＡＬ）に基づき、当該図面ａ１～Ｍ１に応じた学習モデルを生成する。学習モデルの生成には、公知の機械学習アルゴリズムが使用されてよい。一例として、参考形態１では、学習モデル生成部１１３ｓは、多項ロジスティック回帰分析によって、学習モデルを生成する。

【0052】

上述の通り、ＴＢ２には、複数の過去図面のそれぞれ（例：図面ａ１）の番号（識別子の一例）と、当該複数の過去図面のそれぞれのＡ１～ＡＬとの対応関係が示されている。そこで、学習モデル生成部１１３ｓは、ＴＢ２を教師データとして取得する。そして、学習モデル生成部１１３ｓは、当該教師データを用いた多項ロジスティック回帰分析を行うことにより、参考形態における学習モデルを生成する。

【0053】

一例として、学習モデル生成部１１３ｓは、ＴＢ２－１の各Ａ１～ＡＬに基づき、図面ａ１における第ｋ特定文字列に対応付けられた第ｋ重み係数（以下、Ｂｋ）を算出する。第１～第Ｌ重み係数を総称的に、重み係数とも称する。また、図面（ｉ，ｊ）のＢｋを、Ｂｋ（ｉ，ｊ）とも表記する。Ｂｋ（ｉ，ｊ）は、Ａｋ（ｉ，ｊ）に対応する重み係数である。重み係数は、後述する関連性スコアの算出に用いられる。

【0054】

例えば、学習モデル生成部１１３ｓは、上述の多項ロジスティック回帰分析によって、図面ａ１におけるＢ１～ＢＬを算出する。参考形態では、図面ａ１について、Ｂ１＝－０．５、Ｂ２＝－１．２、Ｂ３＝０．６、…、ＢＬ＝０．７として、それぞれの重み係数が算出されている（後述の図５のハッチング箇所を参照）。

【0055】

学習モデル生成部１１３ｓは、その他の過去図面についても、同様の処理を行う。すなわち、学習モデル生成部１１３ｓは、図面ａ１～ＭＮのそれぞれに対し、Ｂ１～ＢＬを設定する。このように、学習モデル生成部１１３ｓは、図面ａ１～ＭＮのそれぞれのＢ１～ＢＬ、すなわち、Ｂ１（１，１）～ＢＬ（Ｍ，Ｎ）、を含む学習モデルを生成する。

【0056】

そして、学習モデル生成部１１３ｓは、Ｂ１（１，１）～ＢＬ（Ｍ，Ｎ）を示す第３テーブルＴＢ３を生成する。ＴＢ３には、第３テーブル内第ｉサブテーブルＴＢ３－ｉが含まれている。ＴＢ３－ｉは、図面ｉのそれぞれのＢ１～ＢＬを示すテーブルである。図５には、一例として、ＴＢ３－１が示されている。ＴＢ３－１には、図面ａ１～Ｍ１のそれぞれのＢ１～ＢＬが示されている。このように、ＴＢ３－１は、ＴＢ２－１の内容パラメータに対応する重み係数を示す。ＴＢ３は、ＴＢ３－１～ＴＢ３－Ｎという、Ｎ個のサブテーブルのセットによって構成されている。

【0057】

（新規物件図面ＤＢ９２）
新規物件図面ＤＢ９２には、新規物件（例：これから建設が行われる予定である、少なくとも１つの物件）に関する各図面（以下、総称的に新規図面とも称する）が、新規物件データセットとして格納されている。以下では、新規物件データセットに含まれる１つの新規物件（物件Ｔ）について述べる。

【0058】

一例として、新規物件図面ＤＢ９２には、物件Ｔについて、過去物件と同種類のＮ個の異なる図面（外形図～構成図）が格納されている。以下では、物件Ｔの外形図を、新規図面の一例として例示する。また、物件Ｔの外形図を、図面ＮＤと称する（後述の図６も参照）。

【0059】

（図面検索装置１２）
図面検索装置１２は、新規図面データ取得部１２１、新規図面データ前処理部１２２（ターゲット図面内容パラメータ取得部）、スコア演算部１２３、および検索結果データ生成部１２４を備える。スコア演算部１２３および検索結果データ生成部１２４は、総称的に検索部と称されてもよい。

【0060】

参考形態では、図面検索装置１２は、学習装置１１ｓによって生成された学習モデルを用いて、ターゲット図面を複数の検索対象図面のそれぞれと照合することにより、少なくとも１つの図面を検索する。参考形態の図面ＮＤは、ターゲット図面の一例である。以下に述べるように、図面検索装置１２では、上記学習モデル用いて、図面ＮＤに対し、図面ａ１～ＭＮのそれぞれとの照合が行われる。

【0061】

（新規図面の取得）
新規図面データ取得部１２１は、過去図面データ取得部１１１と対になる機能部である。一例として、新規図面データ取得部１２１は、入力部７１が所定のユーザ操作を受け付けたことを契機として、新規物件図面ＤＢ９２の新規物件データセットに含まれている、所定の新規図面（例：図面ＮＤ）を取得する。新規図面データ取得部１２１は、取得した図面ＮＤを、新規図面データ前処理部１２２に供給する。

【0062】

（新規図面に対応する前処理データの生成）
新規図面データ前処理部１２２は、過去図面データ前処理部１１２と対になる機能部である。新規図面データ前処理部１２２は、過去図面データ前処理部１１２と同様の処理により、図面ＮＤに対応する前処理データを生成する。すなわち、新規図面データ前処理部１２２は、図面ＮＤにＯＣＲ処理を施し、当該図面ＮＤから特定文字列を抽出する。そして、新規図面データ前処理部１２２は、特定文字列の抽出結果に基づき、当該図面ＮＤの内容パラメータを設定する。以下、図面ＮＤの第ｋ内容パラメータを、Ｃｋとも称する。

【0063】

すなわち、新規図面データ前処理部１２２は、過去図面データ前処理部１１２と同じ解析手法によって図面ＮＤを解析することにより、当該図面ＮＤの内容パラメータを取得する。なお、上述の検索対象図面内容パラメータとの区別のため、ターゲット図面（図面ＮＤ）の内容パラメータを、ターゲット図面内容パラメータとも称する。また、ターゲット図面の第ｋ内容パラメータを、ターゲット図面第ｋ内容パラメータとも称する。

【0064】

図６は、図面ＮＤに対する特定文字列抽出処理の一例を示す図である。図６は、図３と対になる図である。図６の例では、図面ＮＤの領域Ｒ１に、「電圧値５０Ｖ」という文字列が記載されている。従って、新規図面データ前処理部１２２は、第１特定文字列の抽出結果に基づき、Ｃ１＝５０と設定する（後述の図７も参照）。

【0065】

ところで、図面ＮＤの領域Ｒ１の位置は、図面ａ１の領域Ｌ１の位置とは異なっている（図３・図６を参照）。但し、図面ＮＤでは、図面ａ１とは記載位置が異なるものの、当該図面ａ１と同じ種類の仕様情報（電圧値）が記載されている。新規図面データ前処理部１２２による第１内容パラメータの設定手法によれば、図面ＮＤと図面ａ１との見かけ上の違い（例：第１特定文字列の記載位置の違い）によらず、図面ＮＤと図面ａ１と間の記載内容（第１特定文字列に係る仕様情報）自体の一致性を、定量的に評価できる。この点に関しては、以下に述べるＣ２～ＣＬ（換言すれば、領域Ｒ２～Ｒ４）についても同様である。

【0066】

また、図６の例では、図面ＮＤの領域Ｒ２に、「電流値２．５Ａ」という文字列が記載されている。従って、新規図面データ前処理部１２２は、第２特定文字列の抽出結果に基づき、Ｃ２＝２．５と設定する（図６を参照）。

【0067】

さらに、新規図面データ前処理部１２２は、図面ＮＤに含まれている第３特定文字列「ＯＲ」の個数が、３つである旨を判定する（図６の領域Ｒ３を参照）。従って、新規図面データ前処理部１２２は、Ｃ３＝３と設定する。

【0068】

同様に、新規図面データ前処理部１２２は、図面ＮＤに含まれている第Ｌ特定文字列「開」の個数が、２つである旨を判定する（図６の領域Ｒ４を参照）。従って、新規図面データ前処理部１２２は、ＣＬ＝２と設定する。

【0069】

以上のように、新規図面データ前処理部１２２は、図面ＮＤに対し過去図面データ前処理部１１２と同様の処理を行うことにより、Ｃ１～ＣＬを設定する。その後、新規図面データ前処理部１２２は、Ｃ１～ＣＬを示す新規図面内容パラメータテーブルＴＢ－ＮＤを生成する（図７を参照）。

【0070】

（関連性スコアの算出）
スコア演算部１２３は、学習モデル生成部１１３ｓによって生成された学習モデル（より具体的には、Ｂ１（１，１）～ＢＬ（Ｍ，Ｎ））に基づき、関連性スコアを算出する。関連性スコアとは、図面ＮＤに対する各過去図面（図面ａ１～ＭＮ）の関連性の高さを示すスコア（指標）である。以下、図面（ｉ，ｊ）の関連性スコアを、ＳＣＯＲＥ（ｉ，ｊ）とも表記する。また、ＳＣＯＲＥ（ｉ，ｊ）を、ＳＣＯＲＥとも略記する。

【0071】

以下では、図７（特に、図７のハッチング箇所）を参照し、関連性スコアを算出する場合を例示する。以下の例では、説明の便宜上、図面ＮＤと同種類の過去図面（すなわち、外形図である図面ａ１～Ｍ１）のそれぞれについて、関連性スコアを算出する場合を説明する。但し、図面ＮＤと異なる種類の過去図面についても、図７の例と同様に関連性スコアが導出されることに留意されたい。

【0072】

図７は、関連性スコアの導出例について説明する図である。図７では、図面ａ１のＳＣＯＲＥを算出する例について主に述べる。スコア演算部１２３は、（ｉ）新規図面データ前処理部１２２によって導出されたＣ１～ＣＬと、（ｉｉ）学習モデル生成部１１３ｓによって導出された、図面ａ１のＢ１～ＢＬと、を用いて、当該図面ａ１の第１素点～第Ｌ素点を算出する。

【0073】

以下、第ｋ素点を、ＳＳｋとも表記する。なお、図面（ｉ，ｊ）の第ｋ素点を、ＳＳｋ（ｉ，ｊ）とも表記する。また、第１素点～第Ｌ素点を総称的に、素点とも称する。ＳＳｋは、Ｂｋ（第ｋ重み係数）に対応している。

【0074】

具体的には、スコア演算部１２３は、図面ＮＤの第ｋ内容パラメータ（Ｃｋ）と図面ａ１の第ｋ重み係数（Ｂｋ）との積を、ＳＳｋとして算出する。つまり、スコア演算部１２３は、
ＳＳｋ＝Ｃｋ×Ｂｋ …（１）
を算出する。

【0075】

図７の例では、Ｃ１＝５０、Ｂ１＝－０．５である。このため、スコア演算部１２３は、ＳＳ１＝５０×－０．５＝－２５として、ＳＳ１を導出する。同様にして、スコア演算部１２３は、以降の各素点を算出する。例えば、スコア演算部１２３は、ＳＳ２＝－３、ＳＳ３＝１．８、…、ＳＳＬ＝１．４として、各素点を算出する。

【0076】

続いて、スコア演算部１２３は、図面ａ１の第１素点～第Ｌ素点に基づき、当該図面ａ１の関連性スコア（ＳＣＯＲＥ）を算出する。具体的には、スコア演算部１２３は、第１素点から第Ｌ素点までの各素点の和を、ＳＣＯＲＥとして算出する。すなわち、スコア演算部１２３は、
ＳＣＯＲＥ＝ΣＳＳｋ …（２）
を算出する。式（２）の右辺におけるｋの範囲は、１からＬまでである。この点は、後述する式（２Ａ）等についても同様である。

【0077】

以上のように、スコア演算部１２３は、各Ｃｋと各Ｂｋとを用いて、ＳＣＯＲＥを算出する。以下、図面ａ１の関連性スコアを、ＳＣＯＲＥ（ａ１）とも表記する。その他の過去図面の関連性スコアについても、同様に表記する。図７の例では、スコア演算部１２３による計算の結果、ＳＣＯＲＥ（ａ１）＝－３０．４が得られた。

【0078】

続いて、スコア演算部１２３は、同様の手法によって、残りの各過去図面（図７の例では、図面ｂ１～Ｍ１）のＳＣＯＲＥを算出する。図７の例では、スコア演算部１２３による計算の結果、ＳＣＯＲＥ（ｂ１）＝４１．１、ＳＣＯＲＥ（ｃ１）＝３６．５、…、ＳＣＯＲＥ（Ｍ１）＝４．２が得られた。

【0079】

また、図７の例では、ＳＣＯＲＥ（ａ１）～ＳＣＯＲＥ（Ｍ１）というＭ個のＳＣＯＲＥのうち、最大の関連性スコアはＳＣＯＲＥ（ｂ１）であることが確認された。また、上記Ｍ個のＳＣＯＲＥのうち、ＳＣＯＲＥ（ｃ１）が２番目に大きいことが確認された。さらに、上記Ｍ個のＳＣＯＲＥのうち、最小の関連性スコアはＳＣＯＲＥ（ａ１）であることが確認された。

【0080】

スコア演算部１２３は、自身の計算結果を示す第４テーブルＴＢ４を生成する。ＴＢ４には、第４テーブル内第ｉサブテーブルＴＢ４－ｉが含まれている。ＴＢ４－ｉは、図面ｉのそれぞれのＳＳ１～ＳＳＬおよびＳＣＯＲＥを示すテーブルである。図７には、一例として、ＴＢ４－１が示されている。ＴＢ４－１には、図面ａ１～Ｍ１のそれぞれのＳＳ１～ＳＳＬおよびＳＣＯＲＥが示されている。このように、ＴＢ４－１は、ＴＢ－ＮＤおよびＴＢ３－１に基づいて生成される。ＴＢ４は、ＴＢ４－１～ＴＢ４－Ｎという、Ｎ個のサブテーブルのセットによって構成されている。

【0081】

なお、上述の式（１）は、
ＳＳｋ（ｉ，ｊ）＝Ｃｋ×Ｂｋ（ｉ，ｊ） …（１Ａ）
とも表記できる。このように、スコア演算部１２３は、Ｂｋ（ｉ，ｊ）に基づきＳＳｋ（ｉ，ｊ）を算出する。

【0082】

また、上述の式（２）は、
ＳＣＯＲＥ（ｉ，ｊ）＝ΣＳＳｋ（ｉ，ｊ）
＝Σ｛Ｃｋ×Ｂｋ（ｉ，ｊ）｝…（２Ａ）
とも表記できる。このように、スコア演算部１２３は、各ＳＳｋ（ｉ，ｊ）（すなわち、各Ｃｋおよび各Ｂｋ（ｉ，ｊ））に基づき、ＳＣＯＲＥ（ｉ，ｊ）を算出する。

【0083】

また、上述の式（２Ａ）は、
ＳＣＯＲＥ（ｉ，ｊ）＝Σ｛Ａｋ（ｉ，ｊ）×Ｂｋ（ｉ，ｊ）｝…（３）
において、Ａｋ（ｉ，ｊ）にＣｋを代入した式と理解することもできる。このように、スコア演算部１２３は、学習モデル内の独立変数（説明変数）として、Ｃ１～ＣＬを適用することにより、従属変数（目的変数）であるＳＣＯＲＥを算出できる。
なお、式（３）の右辺は、多項ロジスティック回帰分析における線形モデル（多項ロジスティック回帰分析モデル）の一例である。

【0084】

なお、ＳＳｋは、Ｃｋに応じた学習モデルの出力と表現することもできる。このことから、スコア演算部１２３は、学習モデルの出力（ＳＳ１～ＳＳｋ）に基づき、ＳＣＯＲＥを算出すると表現することもできる。

【0085】

あるいは、学習モデルは、ＳＣＯＲＥを出力するように構成されてもよい。この場合、スコア演算部１２３は、学習モデルの出力としてのＳＣＯＲＥを取得し、当該ＳＣＯＲＥを検索結果データ生成部１２４に供給する。

【0086】

（候補順位の決定）
検索結果データ生成部１２４は、スコア演算部１２３によって算出されたＳＣＯＲＥ（ａ１）～ＳＣＯＲＥ（Ｍ１）に基づき、図面ＮＤに対応する候補順位（候補ランキング）を決定する。具体的には、検索結果データ生成部１２４は、ＳＣＯＲＥ（ａ１）～ＳＣＯＲＥ（Ｍ１）に基づき、図面ａ１～Ｍ１（外形図）のそれぞれの候補順位（第１候補～第Ｍ候補）を決定する。

【0087】

検索結果データ生成部１２４は、ＳＣＯＲＥ（ａ１）～ＳＣＯＲＥ（Ｍ１）を、各ＳＣＯＲＥの値に応じてソートする。一例として、検索結果データ生成部１２４は、ＳＣＯＲＥ（ａ１）～ＳＣＯＲＥ（Ｍ１）を、値が大きい順にソートする。そして、検索結果データ生成部１２４は、ｇ番目に大きいＳＣＯＲＥに対応する過去図面を、第ｇ候補（以下、候補ｇとも称する）として決定する。ｇは、１以上かつＭ以下の整数である。

【0088】

このようにＳＣＯＲＥに応じて候補番号を設定すれば、候補番号が小さくなるほど（より上位の候補であるほど）、過去図面と図面ＮＤとの関連性が高いことが期待される。例えば、候補１は、図面ａ１～Ｍ１のうち、図面ＮＤとの関連性が最も高いことがＳＣＯＲＥによって示されている過去図面を指す。

【0089】

上述の通り、ＳＣＯＲＥ（ｂ１）は、ＳＣＯＲＥ（ａ１）～ＳＣＯＲＥ（Ｍ１）のうち、最大の関連性スコア（１番目に大きい関連性スコア）である。そこで、検索結果データ生成部１２４は、図面ｂ１を候補１として決定する（図８のハッチング箇所を参照）。このように、検索結果データ生成部１２４は、図面ＮＤとの関連性が最も高い過去図面として、図面ｂ１を選択する。

【0090】

また、ＳＣＯＲＥ（ｃ２）は、ＳＣＯＲＥ（ａ１）～ＳＣＯＲＥ（Ｍ１）のうち、２番目に大きい関連性スコアである。そこで、検索結果データ生成部１２４は、図面ｃ２を候補２として決定する。このように、検索結果データ生成部１２４は、図面ＮＤとの関連性が２番目に高い過去図面として、図面ｃ２を選択する。

【0091】

さらに、ＳＣＯＲＥ（ａ１）は、ＳＣＯＲＥ（ａ１）～ＳＣＯＲＥ（Ｍ１）のうち、最小の関連性スコア（Ｍ番目に大きい関連性スコア）である。そこで、検索結果データ生成部１２４は、図面ａ１を候補Ｍとして決定する。このように、検索結果データ生成部１２４は、図面ＮＤとの関連性が最も低い（Ｍ番目に高い）過去図面として、図面ａ１を選択する。

【0092】

検索結果データ生成部１２４は、図面ＮＤに対する図面ａ１～Ｍ１の候補番号を示すデータを生成する。当該データでは、図面ａ１～Ｍ１の図面番号（識別子）が、ＳＣＯＲＥに応じてソートされている。より具体的には、当該データでは図面ａ１～Ｍ１の図面番号が、ＳＣＯＲＥが高い順にソートされている。

【0093】

なお、検索結果データ生成部１２４は、新規図面の種類が外形図とは異なる場合にも、当該新規図面と同種類の過去図面について、同様の処理を行う。例えば、新規図面の種類が組立図である場合を考える。この場合、検索結果データ生成部１２４は、ＳＣＯＲＥ（ａ２）～ＳＣＯＲＥ（Ｍ２）に基づき、新規図面に対する図面ａ２～Ｍ２（組立図）のそれぞれの候補番号を決定する。その他の種類の図面についても同様である。

【0094】

以上のように、検索結果データ生成部１２４は、種類ｉに属する図面ＮＤに対し、ＳＣＯＲＥ（ｉ，１）～ＳＣＯＲＥ（ｉ，Ｎ）に基づき、図面（ｉ，１）～図面（ｉ，Ｍ）の候補番号を設定する。具体的には、検索結果データ生成部１２４は、ＳＣＯＲＥ（ｉ，１）～ＳＣＯＲＥ（ｉ，Ｍ）のうち、ｇ番目に大きいＳＣＯＲＥであるＳＣＯＲＥ（ｉ，ｇ）を特定する。そして、検索結果データ生成部１２４は、ＳＣＯＲＥ（ｉ，ｇ）に対応する過去図面、すなわち図面（ｉ，ｇ）を、候補ｇとして決定する。

【0095】

一例として、検索結果データ生成部１２４は、検索結果データとして第５テーブルＴＢ５を生成する。ＴＢ５では、図面ＮＤの種類ごとに、候補番号が高い順に（ＳＣＯＲＥが大きい順に）、過去図面がソートされている。図８には、ＴＢ５の一例が示されている。検索結果データ生成部１２４は、ＴＢ５を表示部７２に供給し、当該ＴＢ５を表示部７２に表示させる。

【0096】

表示部７２にＴＢ５を表示させることにより、ユーザに、図面検索装置１２（より具体的には、検索結果データ生成部１２４）の検索結果を、一覧性が高い態様で提示することができる。

【0097】

但し、検索結果データ生成部１２４は、ＴＢ５の全体を、必ずしも検索結果データとしてユーザに提示しなくともよい。過去図面数があまりに多い場合、ＴＢ５の全体をユーザに提示すると、かえってユーザの利便性が低下しうることも考えられるためである。

【0098】

従って、検索結果データは、ＴＢ５の少なくとも一部であればよい。検索結果データは、ターゲット図面（図面ＮＤ）に対応する少なくとも１つの図面（少なくとも１つの過去図面）を示すデータであればよい。

【0099】

ところで、上述の通り、候補１の図面は、複数の過去図面のうち、ＳＣＯＲＥが最も高い図面である。そこで、検索結果データのデータ量低減の観点からは、検索結果データを、候補１の図面のみを示すデータとして生成することも考えられる。

【0100】

しかしながら、プラントエンジニアリング分野における機器の設計を行う場合、設計者は各種の技術情報を総合的に判断する必要がある。このため、過去図面を参考として図面ＮＤに記載された機器を新たに設計する場合、ＳＣＯＲＥが最も高い過去図面（候補１の図面）が、設計の参考に最も適しているとは限らない。例えば、候補２の図面（ＳＣＯＲＥがより低い図面）が、候補１の図面に比べて、実際には設計の参考により適している場合もありうる。

【0101】

そこで、検索結果データは、上位の複数の候補（例：γ番目までの候補）を示すデータであることが好ましい。すなわち、検索結果データは、候補１～候補γの図面を示すデータであってよい。γは、１以上かつｇ以下の整数である。

【0102】

（参考形態の効果）
プラントエンジニアリングでは、物件Ｔに関するプロジェクトの進捗に伴い、図面ＮＤ（ターゲット図面）との関連性が高い過去図面を検索することが必要とされる場合がある（特許文献１も参照）。上記プロジェクトでは、過去物件における特定の種類の機器の設計・製作実績を参考に、物件Ｔにおける同種類の機器についての各種の計画（例：製作期間の予想、製作コストの試算）がなされる場合が多いためである。

【0103】

ここで、図面ＮＤと同様の仕様情報が記載されている過去図面であれば、図面ＮＤとの関連性が高いことが期待される。しかしながら、プラントエンジニアリングでは、過去物件の図面数が膨大であることが一般的である。このため、特許文献１の図面検索システムを用いたとしても、所望の図面（図面ＮＤとの関連性が高い過去図面）を検索結果から迅速に見つけ出すことは、ユーザにとって必ずしも容易ではない。特許文献１の図面検索システムにおいて、キーワードレス検索を行った場合には、検索結果としてかなり多数の過去図面がヒットすることが考えられるためである。

【0104】

そこで、キーワード検索機能を有する公知の図面検索システムを用いて、図面ＮＤとの関連性が高い所望の図面を検索することも一案である。例えば、図面ＮＤ中に記載されている特定文字列をキーワード（検索ワード）として、過去図面を検索することが考えられる。しかしながら、このようなキーワード検索を行った場合にも、所望の図面を検索結果から迅速に見つけ出すことは、ユーザにとって必ずしも容易ではない。キーワード検索を行った場合にも、検索結果としてかなり多数の過去図面がヒットすることが考えられるためである。また、適切な検索ワードをユーザが決定できない場合には、そもそもキーワード検索を利用することが困難である。

【0105】

以上の通り、従来の図面検索システムを用いて所望の図面を迅速に検索することは、プラントエンジニアリングについて十分な知識を有していないユーザ（例：新人設計者）にとって、困難を伴う。プラントエンジニアリングに精通したユーザ（例：ベテラン設計者）でなければ、従来の図面検索システムを用いて所望の図面を効率的に検索することは必ずしも容易ではないと考えられる。

【0106】

本願の発明者ら（以下、発明者ら）は、従来技術のこのような問題点に鑑み、情報処理システム１００ｓ（より具体的には、情報処理装置１ｓ）を新たに創作した。情報処理装置１ｓによれば、各過去図面に対する機械学習によって得られた学習モデルを用いて、図面ＮＤに対応する所望の図面を検索できる。

【0107】

まず、情報処理装置１ｓの学習装置１１ｓでは、各過去図面について、特定文字列に関連した内容パラメータ（検索対象図面内容パラメータ）が設定される。そして、当該検索対象図面内容パラメータに基づき、各過去図面の重み係数が設定される。

【0108】

その後、情報処理装置１ｓの図面検索装置１２では、図面ＮＤの内容パラメータ（ターゲット図面内容パラメータ）と各過去図面の重み係数とを用いて、当該図面ＮＤと当該各過去図面との関連性の高さを示す指標である関連性スコアが、過去図面ごとに算出される。そして、各過去図面が、関連性スコアの高い順にソートされる。つまり、関連性スコアに基づき、所望の図面の候補としての少なくとも１つの過去図面が、ユーザに提示される。

【0109】

このように、図面検索装置１２によれば、キーワード検索機能を有する公知の図面検索システムとは異なり、キーワードレス検索によって、ユーザに所望の図面を効率的に検索させることができる。特に、図面検索装置１２によれば、適切な検索ワードをユーザが決定できない場合であっても、ユーザに効率的な図面検索を行わせることができる。このため、図面検索装置１２は、例えば上述の新人設計者の業務効率向上に特に好適と言える。

【0110】

なお、特許文献１の図面検索システムは、キーワードレス検索を前提としている点において、情報処理装置１ｓ（より具体的には、図面検索装置１２）と共通している。但し、特許文献１の図面検索システムでは、情報処理装置１ｓとは異なり、検索結果に対する順序付けがなされていない。このため、特許文献１の図面検索システムでは、検索結果の上位に挙げられる過去図面が、必ずしも図面ＮＤに対し高い関連性を有しているとは限らない。

【0111】

これに対し、情報処理装置１ｓでは、各過去図面が関連性スコアの高い順にソートされたデータが、検索結果としてユーザに提示される。このため、ユーザに、関連性スコアの高い順に、検索結果として提示された各過去図面を確認させることができる。つまり、ユーザに、より上位の候補に挙げられた過去図面を、優先的に確認させることができる。

【0112】

このように、情報処理装置１ｓでは、特許文献１の図面検索システムとは異なり、検索結果として提示された各過去図面を、ユーザにしらみつぶしに（総当たり方式で）確認させることが不要となる。それゆえ、情報処理装置１ｓによれば、特許文献１の図面検索システムに比べても、図面ＮＤに対応する所望の図面を、従来よりも簡便にユーザに発見させることが可能となる。すなわち、情報処理装置１ｓによれば、特許文献１の図面検索システムに比べて、ユーザの利便性をさらに向上させることができる。

【0113】

ところで、近年では、機械学習を利用した画像照合技術（例：顔認証技術）が広く用いられている。当該画像照合技術を用いて、所望の図面を検索することも考えられる。しかしながら、上記画像照合技術では、あくまで画像としての「見た目」（例：レイアウト）に基づいて、図面ＮＤと各過去図面との関連性が判定される。それゆえ、画像照合技術をベースとした図面検索手法（以下、画像照合ベース図面検索）は、情報処理装置１ｓに比べ、図面検索には適していない場合がある。以下、この点について述べる。

【0114】

例えば、図面の記載フォーマットが標準化（統一）されていない場合には、各図面の作成者ごとに、図面の記載方式が異なることも考えられる。それゆえ、２つの図面において同様の内容（例：仕様情報）が記載されている場合であっても、各図面において当該内容が異なる位置に表記される場合がある。例えば、「図３の領域Ｌ１」（以下、領域Ａとも称する）と「図６の領域Ｒ１」（以下、領域Ｂとも称する）とを参照されたい。

【0115】

このような場合、画像照合ベース図面検索では、領域Ａと領域Ｂとの位置が異なるため、図面ＮＤに対する図面ａ１の関連性が低いと評価されうる。しかしながら、上述の通り、領域Ａおよび領域Ｂには、同一の種類の仕様情報（電圧値に関する仕様情報）が記載されている。このため、実際には、図面ａ１は、図面ＮＤに対してある程度の関連性を有しているとも考えられる。

【0116】

以上の通り、画像照合ベース図面検索では、各図面に記載されている仕様情報の内容自体を考慮して、図面ＮＤと図面ａ１との関連性を評価することはできない。それゆえ、図面ＮＤとは見た目が異なっているものの、類似した内容自体が記載されている過去図面（図８の例では、図面ｂ１）を、適切に検索することはできない。

【0117】

これに対し、情報処理装置１ｓでは、画像照合ベース図面検索とは異なり、各図面に記載されている特定文字列に着目し、内容パラメータ（検索対象図面内容パラメータおよびターゲット図面内容パラメータ）が設定される。すなわち、情報処理装置１ｓでは、各図面に記載されている仕様情報の内容自体を考慮できる。そして、当該内容パラメータに基づき、図面ＮＤと各過去図面との関連性が評価（例：スコアリング）される。

【0118】

それゆえ、情報処理装置１ｓによれば、画像照合ベース図面検索とは異なり、図面ＮＤとは見た目が異なっているものの、類似した内容自体が記載されている過去図面（例：図面ｂ１）を、適切に検索できる。このように情報処理装置１ｓは、画像照合ベース図面検索に比べ、図面検索に適している。

【0119】

また、過去図面の数が多くなるほど、従来の図面検索システム（または、画像照合ベース図面検索）によって、所定の新規図面と関連性が高い過去図面を適切に検索することがより困難となる。それゆえ、情報処理装置１ｓは、過去図面の数が多くなるほど、ユーザの利便性向上により有益である。

【0120】

〔変形例〕
（１）本発明の一態様に係る情報処理装置は、プラントエンジニアリング以外の分野における図面の検索についても適用可能である。本発明の一態様に係る図面は、上記図面検索装置によって内容パラメータを取得することが可能な図面であればよい。

【0121】

（２）参考形態では、学習モデル生成部１１３ｓにおいて、多項ロジスティック回帰分析を用いて学習モデルを生成する場合を例示した。但し、学習モデルの生成手法は、これに限定されない。

【0122】

学習モデル生成部１１３ｓは、上述の教師データを用いた機械学習により、学習モデルを生成できればよい（各重み係数を算出できればよい）。例えば、学習モデル生成部１１３ｓは、公知のニューラルネットワーク技術（例：公知のディープラーニング技術）を用いて、学習モデルを生成することもできる。

【0123】

（３）検索結果データ生成部１２４は、候補ｇとして選択した図面に対応する所定のデータを、さらに取得してもよい。図８の例の場合、検索結果データ生成部１２４は、図面ｂ１（候補１）に対応する、所定の機器の仕様データを取得してもよい。プラントエンジニアリングの各種の計画では、過去図面とともに、当該過去図面に記載された所定の機器の仕様がともに参照される場合が多いためである。

【0124】

この場合、検索結果データ生成部１２４は、検索結果データとともに、仕様データをユーザに提示できる。それゆえ、ユーザの利便性をさらに向上させることができる。一例として、情報処理装置１ｓでは、図面ａ１～ＭＮと仕様データとの対応関係を示すテーブルが予め準備されていてよい。検索結果データ生成部１２４は、当該テーブルを参照し、候補ｇに対応する仕様データを取得すればよい。

【0125】

〔実施形態１〕
図９は、実施形態１の情報処理システム１００の要部の構成を示すブロック図である。情報処理システム１００の情報処理装置を、情報処理装置１と称する。情報処理装置１の制御装置を、制御装置１０と称する。制御装置１０の学習装置を、学習装置１１と称する。はじめに、情報処理システム１００の処理についての具体的な説明に先立ち、参考形態の情報処理システム１００ｓについて改善可能な点について述べる。

【0126】

上述の通り、参考形態の情報処理装置１ｓでは、全ての過去図面（図面ａ１～ＭＮ）が、学習に用いられている。このため、報処理装置１ｓでは、過去物件図面ＤＢ９１に格納されている過去図面群（図面ａ１～ＭＮ）の内容によって、学習モデルの質にばらつきが生じることも考えられる。以下に述べる通り、過去図面群の内容が偏っている場合には、偏った図面内容に基づく学習モデル（偏った学習モデル）が生成されるためである。

【0127】

（参考形態における学習モデルの質に関するパターン分類）
発明者らは、参考形態における学習モデルの質について検討を行った。具体的には、発明者らは、過去図面群と学習モデルの質との関係について、以下の４通りのパターン分類を行った。

【0128】

なお、過去図面（例：製作図面）に関する以下の説明における「図面番号に紐づく内容」とは、典型的には「過去図面を作成するための仕様図面（仕様が記載された図面）の内容」を意味する。製作図面の例としては、外形図および組立図等を挙示できる。但し、上述の通り、過去図面は製作図面に限定されないことに留意されたい。

【0129】

以下の例では、簡単のために、１つの物件における仕様図面に、当該１つの物件における全ての製作図面を作成するための全ての仕様が記載されているものとする。そして、上記１つの物件における全ての製作図面は、当該１つの物件における仕様図面に基づいて作成されるものとする。

【0130】

また、以下の例では、ある１つの図面種類（例：外形図）に属するある１つの製作図面と別の１つの製作図面との間において、当該ある１つの図面種類に関する仕様（例：外形図の作成に関する仕様）が同一（共通）である場合、当該１つの製作図面と当該別の１つの製作図面には、同一の図面番号が付与されるものとする。但し、当然ながら、上記１つの製作図面と上記別の１つの製作図面との間において、上記ある１つの図面種類に関する仕様が異なっている場合には、当該１つの製作図面と当該別の１つの製作図面には、異なる図面番号が付与される。

【0131】

（パターン１：過去図面群が、図面番号に紐づく内容が異なり、かつ、図面番号も異なる過去図面のみで構成されている場合）
異なる図面内容を、複数の相違なる図面番号の過去図面によって学習できる。このため、特に質の高い学習モデル（十分な汎化性を有する学習モデル）を生成できる。その結果、高い検索精度が実現される。

【0132】

（パターン２：過去図面群に、図面番号に紐づく内容が異なるが、図面番号が同一の過去図面が混在している場合）
相違なる図面内容が、同一の図面番号の図面によって学習される。すなわち、曖昧なデータによる学習が行われる。但し、一般的には、機械学習は、そのような曖昧なデータによる学習であっても、質の高い学習モデルを生成できる。そのため、パターン２においても、パターン１と同様に、高い検索精度が実現される。

【0133】

（パターン３：過去図面群に、図面番号に紐づく内容が同一または類似であるが、図面番号が異なる過去図面が混在している場合）
同一または類似の図面内容が、複数の相違した図面番号の過去図面によって学習される。すなわち、偏った学習が行われる。このため、パターン３では、偏った学習モデルが生成される。その結果、検索精度の低下が生じうる。例えば、同一または類似の図面内容を有する複数の異なる図面が、候補１～候補ｇとしてヒットする可能性が高くなる。

【0134】

（パターン４：過去図面群に、図面番号に紐づく内容が同一または類似であり、かつ、図面番号も同一である過去図面が混在している場合）
同一または類似の図面内容が、同一の図面番号の過去図面によって複数回学習される。この場合にも、偏った学習が行われる。このため、パターン４においても、偏った学習モデルが生成される。その結果、検索精度の低下が生じうる。

【0135】

上述のパターン３・４から理解できる通り、偏った学習モデルは、検索精度の低下を招きうる。このため、偏った学習モデルは、質の低い学習モデルとも言える。このような偏った学習モデルを用いて図面検索を行った場合、適切な検索結果が得られる可能性が低下しうる。

【0136】

そこで、発明者らは、情報処理システム１００ｓをさらに改善すべく、実施形態１の情報処理システム１００を創作した。以下に述べるように、情報処理システム１００（より詳細には、学習装置１１）によれば、学習モデルの質の低下を防止できる。それゆえ、情報処理システム１００ｓに比べてさらに高い検索精度を実現できる。

【0137】

（学習装置１１）
学習装置１１は、学習装置１１ｓとは異なり、相違度算出部１１４と類似集合決定部１１５と学習対象外図面決定部１１６とをさらに備える。類似集合決定部１１５および学習対象外図面決定部１１６は、総称的に決定部と称されてもよい。また、学習装置１１は、学習装置１１ｓの学習モデル生成部１１３ｓに替えて、学習モデル生成部１１３（学習部）を備える。

【0138】

（相違度算出部１１４）
相違度算出部１１４は、過去図面データ前処理部１１２によって導出された任意の２つの過去図面の内容パラメータ（第１～第Ｌ内容パラメータ）に基づき、当該２つの過去図面間の相違度を算出する。

【0139】

以下の説明では、任意の２つの過去図面を、図面Ｉおよび図面Ｊと称する。ＩおよびＪは、１以上かつＴ以下の整数である。以下の説明では、便宜上、図面Ｉの第ｋ内容パラメータを、Ｉｋと称する。同様に、図面Ｊの第ｋ内容パラメータを、Ｊｋと称する。また、図面Ｉと図面Ｊとの相違度を、Ｄ（Ｉ，Ｊ）と称する。Ｄ（Ｉ，Ｊ）は、図面Ｉと図面Ｊとの内容（記載内容）の相違の程度を示す指標値である。

【0140】

図１０は、実施形態１における相違度について説明する図である。なお、図１０では、例えば「図面ａ１」が、「ａ１」と略記されている。本明細書においても、同様の略記を適宜行う。図１０には、各図面の内容パラメータの分布を示すＬ次元のデータ空間（Ｌ次元空間）が示されている。図１０のＬ次元空間において、図面Ｉに対応する点（図面Ｉの内容パラメータを示す点）Ｉを、Ｐ（Ｉ）と称する。Ｐ（Ｉ）の座標は、
Ｐ（Ｉ）＝［Ｉ１，Ｉ２，…，Ｉｋ，…，ＩＬ］
として表される。相違度算出部１１４は、過去図面データ前処理部１１２からＩ１～ＩＬを取得することにより、Ｌ次元空間内におけるＰ（Ｉ）の座標を決定する。

【0141】

同様に、図１０のＬ次元空間において、図面Ｊに対応する点Ｊを、Ｐ（Ｊ）と称する。Ｐ（Ｊ）の座標は、
Ｐ（Ｊ）＝［Ｊ１，Ｊ２，…，Ｊｋ，…，ＪＬ］
として表される。相違度算出部１１４は、過去図面データ前処理部１１２からＪ１～ＪＬを取得することにより、Ｌ次元空間内におけるＰ（Ｊ）の座標を決定する。

【0142】

一例として、相違度算出部１１４は、Ｌ次元空間における点Ｉと点Ｊとの距離を、Ｄ（Ｉ，Ｊ）として算出する。実施形態１では、相違度算出部１１４は、点Ｉと点Ｊとのユークリッド距離を、Ｄ（Ｉ，Ｊ）として算出する。すなわち、相違度算出部１１４は、
Ｄ（Ｉ，Ｊ）＝｛（Ｉ１－Ｊ１）^２＋…＋（ＩＬ－ＪＬ）^２｝^１／２
＝｛Σ（Ｉｋ－Ｊｋ）^２｝^１／２ …（４）
の通り、Ｄ（Ｉ，Ｊ）を算出する。

【0143】

上記式（４）から明らかである通り、Ｄ（Ｉ，Ｊ）は０以上の値をとる。Ｄ（Ｉ，Ｊ）が大きいほど、図面Ｉと図面Ｊとの内容の類似性は低い。逆に言えば、Ｄ（Ｉ，Ｊ）が小さいほど、図面Ｉと図面Ｊとの内容の類似性は高い。Ｄ（Ｉ，Ｊ）＝０の場合、図面Ｉと図面Ｊとの類似性は最大である。具体的には、Ｄ（Ｉ，Ｊ）＝０の場合、図面Ｉと図面Ｊとは同一内容の図面である。

【0144】

相違度算出部１１４は、全てのＩおよびＪの組み合わせについて、Ｄ（Ｉ，Ｊ）を算出する。そして、相違度算出部１１４は、図面ａ１～ＭＮのそれぞれの間の相違度を示すテーブルを、相違度テーブルＴＢ１１として生成する。ＴＢ１１には、相違度テーブル内第ｉサブテーブルＴＢ１１－ｉが含まれている。ＴＢ１１－ｉは、図面ｉに属する各過去図面間の相違度を示すテーブルである。図１１には、一例として、ＴＢ１１－１が示されている。ＴＢ１１－１には、図面１（外形図）に属する各過去図面（図面ａ１～Ｍ１）間のそれぞれの相違度が示されている。ＴＢ１１－１は、Ｍ行Ｍ列の正方行列である。ＴＢ１１は、ＴＢ１１－１～ＴＢ１１－Ｎという、Ｎ個のサブテーブルのセットによって構成されている。このように、実施形態１では、図面種別ごとに相違度についてのサブテーブルが作成される。

【0145】

以下、ＴＢ１１－１を参照して、相違度算出部１１４、類似集合決定部１１５、および学習対象外図面決定部１１６の動作について説明する。但し、ＴＢ１１－１に関する各事項についての以下の説明は、ＴＢ１１－２～ＴＢ１１－Ｎについても同様に当てはまる。

【0146】

なお、上述の式（４）から明らかである通り、ＴＢ１１－１（Ｉ，Ｊ）＝ＴＢ１１－１（Ｊ，Ｉ）である。また、ＴＢ１１－１（Ｉ，Ｉ）＝０である。このため、図１１に示される通り、ＴＢ１１－１は、対角成分が０の対称行列として生成される。そこで、以下の説明では、Ｉ＜Ｊの場合について主に述べる。

【0147】

相違度算出部１１４は、ＴＢ１１－１（Ｉ，Ｊ）＝Ｄ（Ｉ，Ｊ）として、ＴＢ１１－１（Ｉ，Ｊ）の値を設定する。一例として、Ｄ（ａ１，ｂ１）＝８．１であったとする。この場合、相違度算出部１１４は、ＴＢ１１－１（ａ１，ｂ１）＝８．１として、ＴＢ１１－１（１，２）の値を設定する。

【0148】

（類似集合決定部１１５）
類似集合決定部１１５は、ＴＢ１１－１に示されている各相違度に基づき、図面ａ１～Ｍ１の内、類似性が高いと考えられる過去図面の集合（類似集合）を決定する。具体的には、類似集合決定部１１５は、相違度の閾値（便宜上、Ｄｔｈと称する）に基づき、類似集合を決定する。実施形態１では、Ｄｔｈ＝６．０として設定されている場合を例示する。但し、Ｄｔｈは、情報処理システム１００のユーザによって任意に設定されてよい。

【0149】

図１２は、類似集合決定部１１５の処理の一例を示す図である。図１２の例では、説明の便宜上、図１１のＴＢ１１－１を、テーブル１２００Ａとも称する。テーブル１２００Ａは、第１世代相違度テーブルと称されてもよい。

【0150】

類似集合決定部１１５は、テーブル１２００Ａから、Ｉ＜Ｊの条件の下で、最小の相違度を有する成分を探索する。続いて、類似集合決定部１１５は、発見した最小の相違度（便宜上、Ｄｍｉｎと称する）がＤｔｈ以下であるか判定する。類似集合決定部１１５は、ＤｍｉｎがＤｔｈ以下である場合、Ｄｍｉｎに対応する過去図面の組（過去図面の集合）を、類似集合として決定する。換言すれば、類似集合決定部１１５は、ＤｍｉｎがＤｔｈ以下である場合、Ｄｍｉｎに対応する過去図面の組が同一の集合に属するように、図面ａ１～Ｍ１を分類（グルーピング）する。

【0151】

図１２の例では、類似集合決定部１１５は、テーブル１２００Ａに対する探索の結果、Ｄ（ｃ１，ｅ１）＝２．５を、最小の成分として特定する（テーブル１２００Ａのハッチング部を参照）。従って、類似集合決定部１１５は、Ｄｍｉｎ＝２．５として、Ｄｍｉｎを設定する。テーブル１２００Ａでは、Ｄｍｉｎ＜Ｄｔｈである。このため、類似集合決定部１１５は、集合｛ｃ１，ｅ１｝を、集合Ａとして決定する（後述の図１３も参照）。集合Ａは、第１類似集合と称されてもよい。

【0152】

続いて、類似集合決定部１１５は、テーブル１２００Ａにおける要素ｃ１およびｅ１（集合Ａの構成要素）を、集合Ａに統合することにより、テーブル１２００Ｂを生成する。テーブル１２００Ｂは、第２世代相違度テーブルと称されてもよい。テーブル１２００Ｂの生成時には、類似集合決定部１１５は、集合Ａと当該集合Ａ外の各要素（各過去図面）との相違度、すなわちＤ（Ａ，ａ１）、Ｄ（Ａ，ｂ１）、…、Ｄ（Ａ，Ｍ１）を、所定の手法によって設定する。

【0153】

実施形態１では、類似集合決定部１１５は、集合Ａに属する各要素（すなわち、図面ｃ１およびｅ１）と集合Ａに属しないある１つの要素（便宜上、図面Ｘと称する）との相違度の最大値を、Ｄ（Ａ，Ｘ）として設定する。すなわち、類似集合決定部１１５は、
Ｄ（Ａ，Ｘ）＝Ｍａｘ｛Ｄ（ｃ１，Ｘ），Ｄ（ｅ１，Ｘ）｝ …（５）
として、Ｄ（Ａ，Ｘ）を設定する。このように、実施形態１では、分割的階層型クラスタリングの最長距離法によってＤ（Ａ，Ｘ）が設定されている。この点については、後述する集合Ｂについても同様である。

【0154】

一例として、Ｘ＝ａ１である場合を考える。図１２のテーブル１２００Ｂに示される通り、類似集合決定部１１５は、上記式（５）を用いて、
Ｄ（Ａ，ａ１）＝Ｍａｘ｛Ｄ（ｃ１，ａ１），Ｄ（ｅ１，ａ１）｝
＝Ｍａｘ（３．３，１０．３）
＝１０．３
として、Ｄ（Ａ，ａ１）を設定する。同様にして、類似集合決定部１１５は、Ｄ（Ａ，ｂ１）、…、Ｄ（Ａ，Ｍ１）を設定する。

【0155】

続いて、類似集合決定部１１５は、テーブル１２００Ｂから、Ｉ＜Ｊの条件の下で、最小の相違度を有する成分を探索する。類似集合決定部１１５は、テーブル１２００Ｂに対する探索の結果、Ｄ（ｂ１，ｄ１）＝５．８を、最小の成分として特定する（テーブル１２００Ｂのハッチング部を参照）。従って、類似集合決定部１１５は、Ｄｍｉｎ＝５．８として、Ｄｍｉｎを設定する。テーブル１２００Ｂでは、Ｄｍｉｎ＜Ｄｔｈである。このため、類似集合決定部１１５は、集合｛ｂ１，ｄ１｝を、集合Ｂとして決定する（図１３も参照）。集合Ｂは、第２類似集合と称されてもよい。

【0156】

続いて、類似集合決定部１１５は、テーブル１２００Ｂにおける要素ｂ１およびｄ１（集合Ｂの構成要素）を、集合Ｂに統合することにより、テーブル１２００Ｃを生成する。テーブル１２００Ｃは、第３世代相違度テーブルと称されてもよい。類似集合決定部１１５は、上述の式（５）を用いて、集合Ｂと当該集合Ｂ外の各要素との相違度、すなわちＤ（Ｂ，Ａ）、Ｄ（Ｂ，ａ１）、…、Ｄ（Ｂ，Ｍ１）を設定する。但し、（Ｂ，Ａ）、Ｄ（Ｂ，ａ１）、…、Ｄ（Ｂ，Ｍ１）の算出においては、式（５）の左辺の集合Ａは、集合Ｂに置き換えられることに留意されたい。

【0157】

一例として、類似集合決定部１１５は、
Ｄ（Ｂ，Ａ）＝Ｍａｘ｛Ｄ（ｂ１，Ａ），Ｌ（ｄ１，Ａ）｝
＝Ｍａｘ（１２．８，１１．４）
＝１２．９
として、Ｄ（Ｂ，Ａ）を設定する。Ｄ（Ｂ，Ａ）についての計算例から理解できる通り、類似集合決定部１１５における計算では、ある１つの集合（例：集合Ａ）が、複数の過去図面（図面ｃ１およびｅ１）を代表する仮想的な１つの過去図面と見なされている。

【0158】

続いて、類似集合決定部１１５は、テーブル１２００Ｃから、Ｉ＜Ｊの条件の下で、最小の相違度を有する成分を探索する。類似集合決定部１１５は、テーブル１２００Ｃに対する探索の結果、Ｄ（Ｂ，ａ１）＝８．１を、最小の成分として特定する（テーブル１２００Ｃのハッチング部を参照）。従って、類似集合決定部１１５は、Ｄｍｉ＝８．１として、Ｄｍｉｎを設定する。テーブル１２００Ｃでは、Ｄｍｉｎ＞Ｄｔｈである。類似集合決定部１１５は、ＤｍｉｎがＤｔｈよりも大きい場合、集合のグルーピング処理を完了する。

【0159】

図１３は、実施形態１において得られた集合の階層構造を表すデンドログラムＤＧの一例である。ＤＧを用いることで、ユーザに視覚的に集合の階層構造を認識させることができる。ＤＧは、ユーザにＤｔｈを調整させるための補助情報として使用されてよい。

【0160】

なお、図１３からも理解される通り、Ｄｔｈを８．１以上に設定した場合、類似集合決定部１１５によって、図面ａ１と集合Ｂとが同一の集合（便宜上、集合Ｂ’と称する）に分類される。上述の通り、Ｂ＝｛ｂ１，ｄ１｝である。このため、
Ｂ’＝｛ａ１，ｂ１，ｄ１｝＝｛ａ１，｛ｂ１，ｄ１｝｝＝｛ａ１，Ｂ｝
とも表現できる。このように、実施形態１では、既存の集合（例：集合Ｂ）をネストした新たな集合（例：集合Ｂ’）を取り扱うこともできる。

【0161】

ここで、図１０を再び参照し、Ｄ（Ｂ’，ｅ１）を算出する場合を考える。実施形態１では、類似集合決定部１１５は、以下の式（６）、
Ｄ（Ｂ’，ｅ１）
＝Ｍａｘ｛Ｄ（ａ１，ｅ１），Ｄ（ｂ１，ｅ１），Ｄ（ｄ１，ｅ１）｝…（６）
を用いて、Ｌ（Ｂ’，ｅ１）を算出してもよい。すなわち、類似集合決定部１１５は、集合Ｂ’に属する各図面と図面ｅ１との距離の最大値を算出することにより、Ｌ（Ｂ’，ｅ１）
を決定してもよい。

【0162】

但し、上記式（６）は、
Ｄ（Ｂ’，ｅ１）
＝Ｍａｘ｛Ｄ（ａ１，ｅ１），Ｍａｘ｛Ｄ（ｂ１，ｅ１），Ｄ（ｄ１，ｅ１）｝｝
＝Ｍａｘ｛Ｄ（ａ１，ｅ１），Ｄ（Ｂ，ｅ１）｝…（６’）
とも変形できる。従って、類似集合決定部１１５は、式（６）に替えて式（６’）を用いて、Ｄ（Ｂ’，ｅ１）を算出することもできる。

【0163】

式（６’）では、Ｍａｘ関数の引数の数が、式（６）よりも少ない。このため、式（６）に替えて式（６’）を用いることにより、類似集合決定部１１５におけるＤ（Ｂ’，ｅ１）の演算を高速化できる。すなわち、式（６’）を用いることにより、式（６）を用いた場合に比べ、Ｄ（Ｂ’，ｅ１）をより短時間で算出できる。このように、実施形態１では、ネストされた集合構造を取り扱うことにより、各種の演算をより高速に（より効率的に）行うことができる。

【0164】

（学習対象外図面決定部１１６）
学習対象外図面決定部１１６は、図面ａ１～Ｍ１間の相違度に応じて、当該図面ａ１～Ｍ１の内から、学習対象外図面（学習モデル生成部１１３における学習に使用されない過去図面）を決定する。実施形態１では、学習対象外図面決定部１１６は、類似集合決定部１１５において決定された各集合（例：集合Ａおよび集合Ｂ）に属する各過去図面の内から、学習対象外図面を決定する。

【0165】

図１４は、学習対象外図面決定部１１６の処理の一例を示す図である。実施形態１では、学習対象外図面決定部１１６は、ある１つの集合（便宜上、集合Ｘと称する）に属する複数の図面の内から、１つの代表図面（集合内代表図面）を決定する。そして、学習対象外図面決定部１１６は、集合Ｘに属する複数の図面の内、代表図面を除いた各図面を学習対象外図面として決定する。代表図面の決定は、任意の手法によって行われてよい。一例として、学習対象外図面決定部１１６は、集合Ｘに属する複数の図面の内、タイムスタンプが最新の図面を、代表図面として決定してよい。

【0166】

図１４では、学習対象外図面決定部１１６によって、（ｉ）集合Ａに属する２つの図面ｃ１およびｅ１の内から、集合Ａ内の代表図面として図面ｃ１が決定され、かつ、（ｉｉ）集合Ｂに属する２つの図面ｂ１およびｄ１の内から、集合Ｂ内の代表図面として図面ｂ１が決定された場合が例示されている。この場合、学習対象外図面決定部１１６は、（ｉ）図面ｅ１を集合Ａ内の学習対象外図面として決定するとともに、（ｉｉ）図面ｄ１を集合Ｂ内の学習対象外図面として決定する。このように、図１４の例では図面ａ１～Ｍ１の内から、図面ｄ１およびｅ１が学習対象外図面として決定されている。

【0167】

なお、相違度算出部１１４、類似集合決定部１１５、および学習対象外図面決定部１１６は、図面１（図面ａ１～Ｍ１）に対する上述の処理を終了した後、図面２（図面ａ２～Ｍ２）に対して同様の処理を行う。すなわち、相違度算出部１１４、類似集合決定部１１５、および学習対象外図面決定部１１６は、図面１→図面２→…→…図面Ｎの順に、上述の処理を行う。このように、学習対象外図面決定部１１６は、図面ａ１～ＭＮ間の相違度に応じて、当該図面ａ１～ＭＮの内から、学習対象外図面を決定する。

【0168】

そして、学習対象外図面決定部１１６は、自身が決定した学習対象外図面に応じて、上述のＴＢ２を編集する。具体的には、学習対象外図面決定部１１６は、図面ｉにおいて決定した学習対象外図面に応じて、ＴＢ２－ｉを編集する。図１４では、学習対象外図面決定部１１６によるＴＢ２－１の編集の一例が示されている。図１４の例では、学習対象外図面決定部１１６は、ＴＢ２－１から、図面１における学習対象外図面（すなわち図面ｄ１およびｅ１）に対応する内容パラメータを削除する。また、学習対象外図面決定部１１６は、集合Ａに図面ｃ１（集合Ａの代表図面）の図面番号を付与するとともに、集合Ｂに図面ｂ１（集合Ｂの代表図面）の図面番号を付与する。

【0169】

学習対象外図面決定部１１６は、上述の通りＴＢ２を編集することにより、編集後第２テーブルＴＢ１２を生成する。具体的には、学習対象外図面決定部１１６は、上述の通りＴＢ２－ｉを編集することにより、編集後第２テーブル内第ｉサブテーブルＴＢ１２－ｉを生成する。図１５には、ＴＢ１２－１が例示されている。ＴＢ１２は、ＴＢ１２－１～ＴＢ１２－Ｎという、Ｎ個のサブテーブルのセットによって構成されている。

【0170】

（学習モデル生成部１１３）
学習モデル生成部１１３は、学習対象外図面決定部１１６によって生成されたＴＢ１２を教師データとして取得する。そして、学習モデル生成部１１３は、参考形態と同様の学習処理（例：多項ロジスティック回帰分析）を行うことにより、学習モデルを生成する。学習モデル生成後の各処理については、参考形態と同様である。

【0171】

（実施形態１の効果）
情報処理システム１００（情報処理装置１）によっても、参考形態と同様に、図面検索におけるユーザの利便性を従来よりも高めることが可能となる。加えて、学習装置１１によれば、参考形態とは異なり、ＴＢ１２を用いて学習モデルを生成できる。すなわち、学習装置１１によれば、参考形態とは異なり、学習対象外図面を除いた各過去図面の内容パラメータに基づき、学習モデルを生成できる。

【0172】

上述のように、学習装置１１では、他の過去図面との類似性が高い図面が、学習対象外図面として決定される。そして、学習対象外図面を排除して、過去図面に基づく学習を行うことができる。すなわち、互いに内容の類似性が低い一群の過去図面に基づく学習を行うことができる。従って、上述のパターン３・４の学習が行われる可能性を低減できる。その結果、偏った学習モデルが得られる可能性を低減できる。

【0173】

このように、学習装置１１によれば、学習対象外図面を排除して学習を行うことにより、学習モデルの質の低下を防止できる（学習モデルの品質を担保できる）。それゆえ、情報処理システム１００では、学習装置１１によって生成された質の高い学習モデルを用いて、図面検索装置１２による検索を行うことできる。その結果、情報処理システム１００によれば、参考形態に比べてさらに高い検索精度を実現できる。

【0174】

〔変形例〕
（１）実施形態１では、本発明の一態様に係る相違度の一例として、Ｌ次元空間における距離を例示した。特に、実施形態１では、距離の一例として、ユークリッド距離を例示した。但し、当該距離は、ユークリッド距離に限定されない。当該距離の別の例としては、マンハッタン距離またはチェビシェフ距離を挙げることができる。当該距離は、Ｌ次元空間において定義可能な公知の種類の距離（ノルム）であればよい。

【0175】

加えて、本発明の一態様に係る相違度は、必ずしも距離に限定されないことに留意されたい。Ｄ（Ｉ，Ｊ）は、図面Ｉと図面Ｊとの記載内容の違いを表現しうる限り、Ｉ１～ＩＬおよびＪ１～ＪＬに基づいて算出される任意の指標値であってよい。

【0176】

（２）実施形態１では、最長距離法によってＤ（Ａ，Ｘ）を設定する場合を例示した。但し、Ｄ（Ａ，Ｘ）の設定手法は、最長距離法に限定されない。例えば、最短距離法、重心法、または群平均法などの他の手法によって、Ｄ（Ａ，Ｘ）が設定されてもよい。

【0177】

なお、最長距離法を用いた場合には、上記他の手法を用いた場合に比べ、Ｄ（Ａ，Ｘ）を大きい値に設定できる。このため、最長距離法を用いることにより、類似集合決定部１１５において、より少ない演算回数によって、類似集合の分類処理を完了させることができると期待される。このため、最長距離法は、学習装置１１の計算コストの低減から好適な手法であると言える。

【0178】

〔ソフトウェアによる実現例〕
情報処理システム１００の制御ブロック（特に制御装置１０）は、集積回路（ＩＣチップ）等に形成された論理回路（ハードウェア）によって実現してもよいし、ソフトウェアによって実現してもよい。

【0179】

後者の場合、情報処理システム１００は、各機能を実現するソフトウェアであるプログラムの命令を実行するコンピュータを備えている。このコンピュータは、例えば１つ以上のプロセッサを備えていると共に、上記プログラムを記憶したコンピュータ読み取り可能な記録媒体を備えている。そして、上記コンピュータにおいて、上記プロセッサが上記プログラムを上記記録媒体から読み取って実行することにより、本発明の目的が達成される。上記プロセッサとしては、例えばＣＰＵ（Central Processing Unit）を用いることができる。上記記録媒体としては、「一時的でない有形の媒体」、例えば、ＲＯＭ（Read Only Memory）等の他、テープ、ディスク、カード、半導体メモリ、プログラマブルな論理回路などを用いることができる。また、上記プログラムを展開するＲＡＭ（Random Access Memory）などをさらに備えていてもよい。また、上記プログラムは、該プログラムを伝送可能な任意の伝送媒体（通信ネットワークや放送波等）を介して上記コンピュータに供給されてもよい。なお、本発明の一態様は、上記プログラムが電子的な伝送によって具現化された、搬送波に埋め込まれたデータ信号の形態でも実現され得る。

【0180】

〔付記事項〕
本発明は上述した各実施形態に限定されるものではなく、請求項に示した範囲で種々の変更が可能であり、異なる実施形態にそれぞれ開示された技術的手段を適宜組み合わせて得られる実施形態についても本発明の技術的範囲に含まれる。

【符号の説明】

【0181】

１情報処理装置
１０制御装置
１１学習装置（モデル生成装置）
１００情報処理システム
１１１過去図面データ取得部
１１２過去図面データ前処理部（検索対象図面内容パラメータ取得部）
１１３学習モデル生成部（学習部）
１１４相違度算出部
１１５類似集合決定部（決定部）
１１６学習対象外図面決定部（決定部）
ａ１～ＭＮ図面（過去図面，検索対象図面）
ＮＤ図面（新規図面，ターゲット図面）
Ａ，Ｂ集合
ｄ１，ｅ１図面（学習対象外図面）

【図1】