IP Force 特許公報掲載プロジェクト 2022.1.31 β版

知財求人 - 知財ポータルサイト「IP Force」

▶ キャディ株式会社の特許一覧

特開2023-100170図面検索装置、図面データベース構築装置、図面検索システム、図面検索方法、及びプログラム
<>
  • 特開-図面検索装置、図面データベース構築装置、図面検索システム、図面検索方法、及びプログラム 図1
  • 特開-図面検索装置、図面データベース構築装置、図面検索システム、図面検索方法、及びプログラム 図2
  • 特開-図面検索装置、図面データベース構築装置、図面検索システム、図面検索方法、及びプログラム 図3
  • 特開-図面検索装置、図面データベース構築装置、図面検索システム、図面検索方法、及びプログラム 図4
  • 特開-図面検索装置、図面データベース構築装置、図面検索システム、図面検索方法、及びプログラム 図5
  • 特開-図面検索装置、図面データベース構築装置、図面検索システム、図面検索方法、及びプログラム 図6
  • 特開-図面検索装置、図面データベース構築装置、図面検索システム、図面検索方法、及びプログラム 図7
  • 特開-図面検索装置、図面データベース構築装置、図面検索システム、図面検索方法、及びプログラム 図8A
  • 特開-図面検索装置、図面データベース構築装置、図面検索システム、図面検索方法、及びプログラム 図8B
  • 特開-図面検索装置、図面データベース構築装置、図面検索システム、図面検索方法、及びプログラム 図8C
  • 特開-図面検索装置、図面データベース構築装置、図面検索システム、図面検索方法、及びプログラム 図8D
  • 特開-図面検索装置、図面データベース構築装置、図面検索システム、図面検索方法、及びプログラム 図9
  • 特開-図面検索装置、図面データベース構築装置、図面検索システム、図面検索方法、及びプログラム 図10
  • 特開-図面検索装置、図面データベース構築装置、図面検索システム、図面検索方法、及びプログラム 図11
  • 特開-図面検索装置、図面データベース構築装置、図面検索システム、図面検索方法、及びプログラム 図12
< >
(19)【発行国】日本国特許庁(JP)
(12)【公報種別】公開特許公報(A)
(11)【公開番号】P2023100170
(43)【公開日】2023-07-18
(54)【発明の名称】図面検索装置、図面データベース構築装置、図面検索システム、図面検索方法、及びプログラム
(51)【国際特許分類】
   G06F 16/907 20190101AFI20230710BHJP
【FI】
G06F16/907
【審査請求】未請求
【請求項の数】11
【出願形態】OL
(21)【出願番号】P 2022000659
(22)【出願日】2022-01-05
(71)【出願人】
【識別番号】517404991
【氏名又は名称】キャディ株式会社
(74)【代理人】
【識別番号】110001519
【氏名又は名称】弁理士法人太陽国際特許事務所
(72)【発明者】
【氏名】加藤 勇志郎
【テーマコード(参考)】
5B175
【Fターム(参考)】
5B175FB03
5B175GA03
5B175HB03
(57)【要約】
【課題】対象図面データと類似する図面データを精度良く検索する。図面データに付与される複数の属性値に基づいて目的とする図面データを検索する。
【解決手段】図面検索サーバ16は、対象図面データ内に存在する表題欄表題欄内に存在する複数のボックスの配置を特定する。図面検索サーバ16は、対象図面データ内に存在する表題欄内の各箇所に存在する文字列の各々に対して、文字認識処理を実行する。図面検索サーバ16は、文字認識結果と複数のボックスの配置とに基づいて、対象図面データの属性値を表す対象属性値を特定すると共に、ボックスに予め対応付けられた属性である対象属性を特定する。図面検索サーバ16は、対象属性値と対象属性との組み合わせに基づいて、図面データベース34から、対象図面データの属性値と類似する属性値を有する図面データを検索し、検索結果を出力する。
【選択図】図1
【特許請求の範囲】
【請求項1】
対象図面データ内に存在する表題欄の種類を特定する表題欄特定部と、
前記表題欄特定部により特定された前記表題欄の種類に基づいて、前記表題欄内に存在する複数のボックスの配置を特定する配置特定部と、
前記対象図面データ内に存在する表題欄内の各箇所に存在する文字列の各々に対して、文字認識処理を実行する認識部と、
前記認識部による文字認識結果と、前記配置特定部により特定された前記複数のボックスの配置とに基づいて、前記ボックス内の文字列が表す前記対象図面データの属性値を表す対象属性値を特定すると共に、前記ボックスに予め対応付けられた属性である対象属性を特定する属性特定部と、
前記属性特定部により特定された前記対象属性値と前記対象属性との組み合わせに基づいて、図面データと図面データの属性値と前記属性値に対応する属性とが対応付けられたデータベースから、前記対象図面データの属性値と類似する属性値を有する図面データを検索し、検索結果を出力する検索部と、
を含む図面検索装置。
【請求項2】
前記属性特定部は、予め設定された修正ルールに基づいて、前記認識部による文字認識結果を修正することにより、前記文字認識結果が修正された修正文字認識結果を生成し、前記修正文字認識結果に基づいて、前記対象属性値を特定する、
請求項1に記載の図面検索装置。
【請求項3】
前記修正ルールは、ユーザ毎に予め設定されている、
請求項2に記載の図面検索装置。
【請求項4】
前記表題欄内に存在する複数のボックスの各々に対し、異なる前記修正ルールが予め設定されており、
前記属性特定部は、前記複数のボックスの各々について、前記ボックスに存在する文字列の前記文字認識結果に対して、前記ボックスに対して予め設定された前記修正ルールに基づいて、前記認識部による文字認識結果を修正する、
請求項2又は請求項3に記載の図面検索装置。
【請求項5】
前記属性特定部は、前記修正ルールとして、誤った文字認識結果を表す文字列と、図面データの属性値を表す正解の文字列とが対応付けられた辞書データに基づいて、前記認識部による文字認識結果を修正することにより、前記文字認識結果が修正された修正文字認識結果を生成する、
請求項2~請求項4の何れか1項に記載の図面検索装置。
【請求項6】
前記認識部は、前記対象図面データの前記表題欄内とは異なる箇所に存在する文字列の各々に対して文字認識処理を更に実行し、
前記表題欄内とは異なる箇所に存在する文字列の文字認識結果に基づいて、前記対象属性値を特定する、
請求項1~請求項5の何れか1項に記載の図面検索装置。
【請求項7】
前記認識部は、前記表題欄内の文字認識結果に基づき前記対象属性値が特定されなかった場合に、前記対象図面データの前記表題欄内とは異なる箇所に存在する文字列の各々に対して文字認識処理を実行し、
前記属性特定部は、前記表題欄内とは異なる箇所に存在する文字列の文字認識結果に基づいて、前記対象属性値を特定する、
請求項1~請求項6の何れか1項に記載の図面検索装置。
【請求項8】
データベース構築用の図面データ内に存在する表題欄の種類を特定する構築用表題欄特定部と、
前記構築用表題欄特定部により特定された前記表題欄の種類に基づいて、前記表題欄内に存在する複数のボックスの配置を特定する構築用配置特定部と、
前記図面データ内に存在する表題欄内の各箇所に存在する文字列の各々に対して、文字認識処理を実行する構築用認識部と、
前記構築用認識部による文字認識結果と、前記構築用配置特定部により特定された前記複数のボックスの配置とに基づいて、前記ボックス内の文字列が表す前記図面データの属性値を特定すると共に、前記ボックスに予め対応付けられた属性を特定する構築用属性特定部と、
前記構築用属性特定部により特定された前記属性値と前記属性と前記図面データとの組み合わせをデータベースへ格納することにより、データベースを構築する構築部と、
を含む図面データベース構築装置。
【請求項9】
対象図面データ内に存在する表題欄の種類を特定し、
特定された前記表題欄の種類に基づいて、前記表題欄内に存在する複数のボックスの配置を特定し、
前記対象図面データ内に存在する表題欄内の各箇所に存在する文字列の各々に対して、文字認識処理を実行し、
文字認識結果と、特定された前記複数のボックスの配置とに基づいて、前記ボックス内の文字列が表す前記対象図面データの属性値を表す対象属性値を特定すると共に、前記ボックスに予め対応付けられた属性である対象属性を特定し、
特定された前記対象属性値と前記対象属性との組み合わせに基づいて、図面データと図面データの属性値と前記属性値に対応する属性とが対応付けられたデータベースから、前記対象図面データの属性値と類似する属性値を有する図面データを検索し、検索結果を出力する、
処理をコンピュータが実行する図面検索方法。
【請求項10】
対象図面データ内に存在する表題欄の種類を特定し、
特定された前記表題欄の種類に基づいて、前記表題欄内に存在する複数のボックスの配置を特定し、
前記対象図面データ内に存在する表題欄内の各箇所に存在する文字列の各々に対して、文字認識処理を実行し、
文字認識結果と、特定された前記複数のボックスの配置とに基づいて、前記ボックス内の文字列が表す前記対象図面データの属性値を表す対象属性値を特定すると共に、前記ボックスに予め対応付けられた属性である対象属性を特定し、
特定された前記対象属性値と前記対象属性との組み合わせに基づいて、図面データと図面データの属性値と前記属性値に対応する属性とが対応付けられたデータベースから、前記対象図面データの属性値と類似する属性値を有する図面データを検索し、検索結果を出力する、
処理をコンピュータに実行させるためのプログラム。
【請求項11】
複数のユーザ端末と請求項1~請求項7の何れか1項に記載の図面検索装置とを含む図面検索システムであって、
複数のユーザ端末の何れか1つのユーザ端末は、前記対象図面データが選択されたことを表す指示データを前記図面検索装置へ送信し、
前記図面検索装置は、前記ユーザ端末から送信された前記指示データを受信し、前記指示データに対応する前記対象図面データの属性値と類似する属性値を有する図面データを検索し、検索結果を前記ユーザ端末へ送信し、
前記ユーザ端末は、前記検索結果を表示部へ表示させる、
図面検索システム。
【発明の詳細な説明】
【技術分野】
【0001】
本発明は、図面検索装置、図面データベース構築装置、図面検索システム、図面検索方法、及びプログラムに関する。
【背景技術】
【0002】
従来、表題エリアだけを対象に図面の全文検索を可能とする図面管理サーバが知られている(例えば、特許文献1)。この図面管理サーバは、図面の登録時に、図面検索インデックスに登録された文字列のうち、予め決められた文字列からなる表題項目の位置座標を取得し、表題エリアを決定する。そして、図面管理サーバは、表題項目の位置座標を表題データとして登録しておき、利用者端末からの図面検索要求に応じて、表題データから表題エリアの位置座標を取得する。図面管理サーバは、図面検索要求に含まれる検索キーワードを用いて、図面検索インデックスを検索し、該当する検索キーワード及びその位置座標を取得し、これら検索結果を用いて、表題エリア内に検索キーワードが含まれる図面を検索する。
【0003】
また、図面データから表題情報を電子的に取り込み、これをデータベース化することにより、総合版数リストの自動生成を可能とし、以てリアルタイム性の確保と信頼性の向上を共に達成するコンピュータ・エイデット・デザイン装置が知られている(例えば、特許文献2)。このコンピュータ・エイデット・デザイン装置は、画面上の特定領域に表示される少なくとも図面名称、図番及び版数の各情報を取り込む。そして、コンピュータ・エイデット・デザイン装置は、取り込まれた各情報を製品毎に分類して蓄積する。コンピュータ・エイデット・デザイン装置は、蓄積された情報から一つの製品に関連する情報を読み出し、所定のフォーマットで画面またはハードコピーに出力する。
【0004】
また、CAD図面データから属性情報を自動的に抽出し、その属性情報を部品表へ自動的に登録処理する図面設計システムが知られている(例えば、特許文献3)。この図面設計システムは、機器の部品のCAD図面中に存在するCADシステムの特定要素の検索を行い、その特定要素で構成されたその部品の情報を、属性情報としてCAD図面から抽出する。部品表システムは、部品表に対する属性情報の整合性の検査を行う。そして、属性情報が整合性を有する場合、部品表に属性情報を登録する。
【0005】
また、キーワード抽出・登録を含む事前のセットアップ作業を簡略化して、短期間でのマルチ・ドキュメント・システムの立ち上げを可能にするデータ処理装置が知られている(例えば、特許文献4)。このデータ処理装置は、ドキュメントファイルから読み出したファイルの拡張子からファイルの種類を判定し、ファイルの種類が図面の場合は、表題欄を含む範囲からキーワードを抽出し、帳票の場合は、帳票の項目行、項目列からキーワードを抽出し、文書の場合は、文書の先頭から所定文字数の文字列からキーワードを抽出する。
【0006】
また、図面管理のための、図面の表題欄に記述される複数の管理項目を表示装置上に表示された画像データより、直接文字コード形式に変換して文字コードの属性ファイル管理データを作成する図形処理方法が知られている(例えば、特許文献5)。この図形処理方法は、画像データとして入力された画面の表題欄に記述される複数の管理項目を持つ図面を、表示した図面上の座標で前記管理項目の欄をマウス装置で指定して、その欄に記載されている画像データを、文字に変換して文字コードの属性のファイル管理データを作成する。
【0007】
また、デジタル形式の製図図面を管理する効率的で、高速な方法を提供し、データベースに手動で入力する必要性なしに図面を自動的に識別し索引付けし容易かつ高速検索用に記憶するシステムが知られている(例えば、特許文献6)。このシステムは、デジタル形式のデータを一連のアルゴリズムに従って中央処理装置により解析して各製図図面を識別する。システムは、図面を識別すると、図面フレームの各々のテキストボックス中の情報が一連の所定のアルゴリズムに従って処理され、テキストボックス中の情報を識別し分類する。この情報は、指定の基準およびその分類に従ってデータベースで照合され、ユーザが特定の図面を発見し検索可能とする。
【先行技術文献】
【特許文献】
【0008】
【特許文献1】特開2014-92836号公報
【特許文献2】特開平8-161373号公報
【特許文献3】特開2003-296377号公報
【特許文献4】特開2000-194712号公報
【特許文献5】特開平5-174080号公報
【特許文献6】特開2001-282810号公報
【発明の概要】
【発明が解決しようとする課題】
【0009】
上記特許文献1~6に開示されているように、図面データ中には表題欄が設けられていることが多い。この表題欄には、図面の属性を表す属性値が存在することが多い。例えば、図面データ内の表題欄内には、「材質」の属性を表す属性値である「ベークライト」という表記が存在する場合がある。
【0010】
しかし、図面データの表題欄は様々であり、属性とその属性に対応する属性値とを精度良く特定することができない場合がある。一般に表題欄の構造や記載情報は図面の作成業者によってさまざまであり、業界の統一標準が存在しない。そのため、図面には多種多様な表題欄のものが存在する。
【0011】
上記特許文献1~6に開示されている技術では、様々な種類の表題欄が存在している点については考慮されていない。
【0012】
例えば、特許文献6の段落[0011]には「ボックスの内容をさらに解析してボックスがボックスの題名と内容の説明のような2つの異なる型式の内容を含んでいるかどうかを調べる。このようなボックスを見出して、これが適切な図面ボックスであることが決定されると、ボックスの内容が構造化データベースに分類され記憶されて図面を検索可能とする。」との開示がある。しかし、表題欄の図面ボックスの種類は様々であるため、特許文献6の技術では、全てのボックスに関して「ボックスの題名と内容の説明のような2つの異なる型式の内容」を特定するのは難しい。
【0013】
本発明は上記事実を考慮して、対象図面データの表題欄の種類を特定しない場合に比べ、対象図面データの属性と属性値との組み合わせを精度良く特定し、対象図面データと類似する図面データを精度良く検索することを目的とする。
【課題を解決するための手段】
【0014】
上記の目的を達成するために本発明の第1態様は、対象図面データ内に存在する表題欄の種類を特定し、特定された前記表題欄の種類に基づいて、前記表題欄内に存在する複数のボックスの配置を特定し、前記対象図面データ内に存在する表題欄内の各箇所に存在する文字列の各々に対して、文字認識処理を実行し、文字認識結果と、特定された前記複数のボックスの配置とに基づいて、前記ボックス内の文字列が表す前記対象図面データの属性値を表す対象属性値を特定すると共に、前記ボックスに予め対応付けられた属性である対象属性を特定し、特定された前記対象属性値と前記対象属性との組み合わせに基づいて、図面データと図面データの属性値と前記属性値に対応する属性とが対応付けられたデータベースから、前記対象図面データの属性値と類似する属性値を有する図面データを検索し、検索結果を出力する。
【0015】
また、本発明の第2態様は、データベース構築用の図面データ内に存在する表題欄の種類を特定し、特定された前記表題欄の種類に基づいて、前記表題欄内に存在する複数のボックスの配置を特定し、前記図面データ内に存在する表題欄内の各箇所に存在する文字列の各々に対して、文字認識処理を実行し、文字認識結果と、特定された前記複数のボックスの配置とに基づいて、前記ボックス内の文字列が表す前記図面データの属性値を特定すると共に、前記ボックスに予め対応付けられた属性を特定し、特定された前記属性値と前記属性と前記図面データとの組み合わせをデータベースへ格納することにより、データベースを構築する。
【発明の効果】
【0016】
本発明によれば、対象図面データの表題欄の種類を特定しない場合に比べ、対象図面データの属性と属性値との組み合わせを精度良く特定し、対象図面データと類似する図面データを精度良く検索することができる、という効果が得られる。
【図面の簡単な説明】
【0017】
図1】本実施形態の図面検索システムの概略構成の一例を示す図である。
図2】図面データの一例を示す図である。
図3】図面検索システムの各装置として機能するコンピュータの概略ブロック図である。
図4】本実施形態の図面検索システムによって実行される図面データベース構築処理を説明するための図である。
図5】表題欄の構造を説明するための図である。
図6】表題欄データベースに格納されるデータの一例を示す図である。
図7】表題欄を構成している罫線の構造情報の一例を示す図である。
図8A】ボックス属性対応付け情報の一例を示す図である。
図8B】ボックス属性対応付け情報の一例を示す図である。
図8C】ボックス属性対応付け情報の一例を示す図である。
図8D】図面データベースには格納しない情報の一例を示す図である。
図9】図面データベースに格納されるデータの一例を示す図である。
図10】ユーザ端末に表示される画面の一例を示す図である。
図11】本実施形態の図面検索システムによって実行される処理を説明するための図である。
図12】修正ルール及び辞書データの一例を示す図である。
【発明を実施するための形態】
【0018】
以下、図面を参照して実施形態を詳細に説明する。
【0019】
<図面検索システムのシステム構成>
【0020】
図1は、本実施形態の図面検索システム10を示すブロック図である。図1に示されるように、本実施形態の図面検索システム10は、管理者端末12と、図面データベース構築サーバ14と、図面検索サーバ16と、複数のユーザ端末18A,18B,18Cとを備えている。なお、以下では、特定の端末を指し示す場合以外は、1つのユーザ端末をユーザ端末18と称する。管理者端末12と、図面データベース構築サーバ14と、図面検索サーバ16と、ユーザ端末18とは、例えばインターネット等のネットワーク19によって通信可能に接続されている。
【0021】
本実施形態の図面検索システム10は、図面データ内に存在する表題欄の種類に基づいて表題欄内に存在するボックス内の文字列が表す図面データの属性値を特定し、特定された属性値と類似する属性値を有する図面データを検索する。
【0022】
図2に、図面データの一例を示す。なお、本実施形態が対象とする図面データは、例えば、紙の図面をスキャンすることにより生成されたPDF(Portable Document Format)形式のデータである。図2の図面データには、金属加工品が図示されている。図2の図面データのうちの表題欄Tには、様々な情報が記載されている。例えば、図2に示される例では、金属加工対象の部品の材質を表す情報T1、金属加工品の表面仕様に関する情報T2、及び図面番号T3等が記載されている。これらの情報は、図面データを検索する際に有用な情報となる。
【0023】
そこで、本実施形態の図面検索システム10は、図面データ内に存在する表題欄の種類を特定し、その表題欄の種類に基づいて表題欄内に存在する図面データの属性値を特定し、特定された属性値と類似する属性値を有する図面データを検索する。これにより、ある図面データと類似する図面データを精度良く検索することができる。
【0024】
以下、具体的に説明する。
【0025】
(管理者端末12)
管理者端末12は、図面検索サーバ16及び図面データベース構築サーバ14を管理する管理ユーザが操作する端末である。具体的には、管理ユーザは、管理者端末12を操作することにより、図面検索サーバ16及び図面データベース構築サーバ14との間において情報のやり取りをする。
【0026】
(図面データベース構築サーバ14)
図面データベース構築サーバ14は、複数の図面データが格納されたデータベースを構築するためのサーバである。図面データベース構築サーバ14は、図1に示されるように、構築用受付部20と、表題欄データベース22と、構築用表題欄特定部24と、構築用配置特定部26と、構築用認識部28と、構築用属性特定部30と、構築部32と、表題欄データベース22と、図面データベース34とを備えている。
【0027】
表題欄データベース22には、複数種類の表題欄のデータが格納されている。表題欄データベース22は、表題欄ライブラリとして機能する。表題欄データベース22の詳細については後述する。
【0028】
図面データベース34には、図面データと当該図面データの属性と当該図面データの属性値とが対応付けられて格納されている。図面データベース34の詳細については後述する。
【0029】
(図面検索サーバ16)
図面検索サーバ16は、複数の図面データが格納されたデータベースから対象図面データと類似する図面データを検索するためのサーバである。図1に示されるように、受付部40と、表題欄データベース42と、表題欄特定部44と、配置特定部46と、認識部48と、修正ルール記憶部49と、属性特定部50と、検索部52と、図面データベース54とを備えている。
【0030】
表題欄データベース42には、表題欄データベース22と同様のデータが格納されている。また、図面データベース54には、図面データベース34と同様のデータが格納されている。
【0031】
(ユーザ端末18)
ユーザ端末18は、ユーザが操作する端末である。具体的には、ユーザは、ユーザ端末18を操作することにより、図面検索サーバ16との間において情報のやり取りをする。
【0032】
図面検索システム10の管理者端末12、図面データベース構築サーバ14、図面検索サーバ16、及びユーザ端末18の各々は、例えば、図3に示すコンピュータ70で実現することができる。コンピュータ70はCPU71、一時記憶領域としてのメモリ72、及び不揮発性の記憶部73を備える。また、コンピュータ70は、入出力装置等(図示省略)が接続される入出力interface(I/F)74、及び記録媒体に対するデータの読み込み及び書き込みを制御するread/write(R/W)部75を備える。また、コンピュータ70は、インターネット等のネットワークに接続されるネットワークI/F76を備える。CPU71、メモリ72、記憶部73、入出力I/F74、R/W部75、及びネットワークI/F76は、バス77を介して互いに接続される。
【0033】
記憶部73は、Hard Disk Drive(HDD)、solid state drive(SSD)、フラッシュメモリ等によって実現できる。記憶媒体としての記憶部73には、コンピュータ70を機能させるためのプログラムが記憶されている。CPU71は、プログラムを記憶部73から読み出してメモリ72に展開し、プログラムが有するプロセスを順次実行する。
【0034】
<図面検索システム10の作用>
【0035】
次に、本実施形態の図面検索システム10の作用について説明する。まず、管理ユーザが管理者端末12を操作して、複数の図面データが格納されたデータベースを構築する場面について説明する。
【0036】
管理ユーザは、管理者端末12を操作して、データベース構築用の複数の図面データを図面データベース構築サーバ14へ入力する。すると、図面データベース構築サーバ14は、図4に示す処理ルーチンを実行する。
【0037】
ステップS100において、構築用受付部20は、データベース構築用の複数の図面データを受け付ける。
【0038】
ステップS102において、構築用表題欄特定部24は、ステップS100で受け付けた複数の図面データのうち1つの図面データを設定する。
【0039】
ステップS104において、構築用表題欄特定部24は、ステップS102で設定された図面データ内に存在する表題欄の種類を特定する。
【0040】
図5に、表題欄の一例を示す。図5に示されている表題欄Tの構造と表題欄Tの構造とは異なるものとなっている。ここで、図面データの表題欄から有用な情報を取り出すためには、その表題欄の種類を特定すると共に、その種類の表題欄内に存在する複数のボックスの各々にはどのような情報が格納されているのかを特定する必要がある。
【0041】
そこで、本実施形態の図面データベース構築サーバ14は、複数種類の表題欄に関する情報が格納されている表題欄データベース22を用いて、表題欄の種類を特定すると共に、その種類の表題欄の各ボックスにどのような情報が格納されているのかを特定した上で、表題欄の各ボックスに格納されている文字列の情報を取得する。
【0042】
表題欄データベース22には、例えば、図6に示されるようなテーブルが格納されている。図6に示される例では、表題欄IDと、会社名と、当該会社が利用している表題欄を構成している罫線の構造情報と、表題欄の各ボックスにどのような属性と属性値とが格納されているのか表すボックス属性対応付け情報とが対応付けられている。
【0043】
表題欄を構成している罫線の構造情報は、例えば、図7に示されるような表題欄の構造Tを表すデータである。また、表題欄の各ボックスにどのような属性と属性値とが格納されているのか表すボックス属性対応付け情報としては、例えば、図8A図8Cに示されるような情報である。図8A図8Cに示されるように、ボックス属性対応付け情報は、表題欄の各ボックスにどのような属性と属性値とが格納されているのかが予め特定されている。例えば、ボックス属性対応付け情報は、表題欄の1Aのボックスには図面番号の属性が格納されており、1Bのボックスには実際の図面番号の属性値が格納されているといった情報である。なお、罫線の構造情報と、表題欄の各ボックスにどのような属性と属性値とが格納されているのか表すボックス属性対応付け情報とについては、その相対的な位置関係が予め紐付けられていれば良い。このため、例えば、ボックス属性対応付け情報は、図8Bに示されるように、表題欄の2Aのボックスには品名の属性が格納されており、表題欄の2Aの下のボックスには、品名の属性値として2B-1と2B-2の2つの属性値が格納されているといった情報であっても良い。この場合には、例えば、2B-1の箇所には機種名の属性値が格納され、2B-2の箇所には機種名のバリエーション種の属性値が格納されるようなこともある。また、例えば、1つの図面に複数の部品が描かれている場合、表題欄が拡張される場合がある。この場合には、ボックス属性対応付け情報は、例えば図8Cに示されるように、表題欄の3Aのボックスの上に位置する3Xの箇所には図面に描かれているある部品名の属性値が記載され、表題欄の4Aの上に位置する4Xの箇所には図面に描かれている別の部品名の属性値が記載されているといった情報となる。なお、図8Cに示されるように、本実施形態では、テキストを読み取るエリアは表題欄の内部に束縛されずに設定することができる。このため、例えば、表題欄との間の相対的な位置関係が所定関係である表題欄外のエリアに存在するテキストを読み取ることも可能である。
【0044】
このため、ステップS104において、構築用表題欄特定部24は、ステップS102で設定された図面データの表題欄が、表題欄データベース22に格納されている複数種類の表題欄のうち何れの種類に該当するのかを特定する。
【0045】
例えば、構築用表題欄特定部24は、ステップS102で設定された図面データの表題欄の罫線と、表題欄データベース22に格納されている複数種類の表題欄の各々についての罫線とを重ね合わせることにより、罫線の一致度合いを計算する。そして、構築用表題欄特定部24は、一致度の計算結果に基づいて、ステップS102で設定された図面データの表題欄の種類は、一致度が最も高い表題欄の種類であると特定する。
【0046】
ステップS106において、構築用配置特定部26は、ステップS104で特定された表題欄の種類に基づいて、表題欄内に存在する複数のボックスの配置を特定する。
【0047】
ステップS108において、構築用認識部28は、ステップS102で設定された図面データ内に存在する表題欄内の各箇所に存在する文字列の各々に対して、文字認識処理を実行する。例えば、構築用認識部28は、既知のOCR(Optical Character Reader)を用いて、文字認識処理を実行する。
【0048】
ステップS110において、構築用属性特定部30は、ステップS108で得られた文字認識結果と、ステップS106で特定された複数のボックスの配置とに基づいて、ボックス内の文字列が表す図面データの属性値を特定すると共に、ボックスに予め対応付けられた属性を特定する。
【0049】
上述したように、ボックス属性対応付け情報が、図6に示されるようなテーブルに格納されている。このため、構築用属性特定部30は、ステップS110において、図6に示されるようなテーブルのボックス属性対応付け情報を参照し、ステップS102で設定された図面データの属性値と属性とを特定する。例えば、構築用属性特定部30は、図6に示されるような情報を参照し、ステップS102で設定された図面データの表題欄の属性「品名」とその属性値「寄せガイド」とを特定する。
【0050】
ステップS112において、構築用属性特定部30は、ステップS102で設定された図面データと、ステップS110で特定された属性値との組み合わせを、図面データベース34へ格納する。なお、例えば、図8Dに示されているような、一般公差の欄Vに格納されているような情報は、図面データベース34へは格納しない。一般公差の欄Vに格納されているような情報は、どのような表題欄にも付加されているため、後述する図面データの検索には役立たない可能性が高いためである。
【0051】
図面データベース34には、例えば、図9に示されるようなテーブルが格納されている。図9に示される例では、図面IDと、図面データと、その属性とが対応付けられている。例えば、属性「品名」にはその属性値である「寄せガイド」が対応付けられて格納される。なお、実際に認識された文字列「部品名」と属性「品名」とを対応付けるテーブルが別途予め用意されていてもよい。
【0052】
ステップS114において、構築用属性特定部30は、ステップS100で受け付けた全ての図面データについて、ステップS102~ステップS112の処理が実行されたか否かを判定する。ステップS100で受け付けた全ての図面データについて、ステップS102~ステップS112の処理が実行された場合には、本処理ルーチンが終了する。一方、ステップS102~ステップS112の処理が実行されていない図面データが存在する場合には、ステップS102へ戻る。
【0053】
図4のデータベース構築処理ルーチンが実行されることにより、複数の図面データの各々についての属性と属性値との組み合わせが図面データベース34に格納されたことになる。
【0054】
なお、図面データベース構築サーバ14の図面データベース34に格納されたデータは、図面検索サーバ16の図面データベース54へも格納される。また、図面データベース構築サーバ14の表題欄データベース22に格納されたデータは、図面検索サーバ16の表題欄データベース42へも格納される。
【0055】
次に、ユーザが自身のユーザ端末18を操作して、対象図面データと類似する図面データを検索する場面について説明する。
【0056】
ユーザは、自らのユーザ端末18を操作して、対象図面データを図面検索サーバ16へ入力する。例えば、ユーザ端末18のディスプレイ(図示省略)には、図10に示されるような画面が表示され、ユーザの操作に応じて対象図面データがドラッグアンドドロップされると、ユーザ端末18は、対象図面データが選択されたことを表す指示データを図面検索サーバ16へ送信する。図面検索サーバ16は、その対象図面データの受信に応答して、図11に示す図面検索ルーチンを実行する。
【0057】
ステップS200において、受付部40は、対象図面データを受け付ける。
【0058】
ステップS202において、表題欄特定部44は、表題欄データベース42に格納されたデータを参照し、ステップS200で受け付けた対象図面データ内に存在する表題欄の種類を特定する。具体的には、表題欄特定部44は、構築用表題欄特定部24と同様の手法によって、対象図面データ内に存在する表題欄の種類を特定する。
【0059】
ステップS204において、配置特定部46は、表題欄データベース42に格納されたデータを参照し、上記ステップS202で特定された表題欄の種類に基づいて、表題欄内に存在する複数のボックスの配置を特定する。具体的には、配置特定部46は、構築用配置特定部26と同様の手法によって、表題欄内に存在する複数のボックスの配置を特定する。
【0060】
ステップS206において、認識部48は、対象図面データ内に存在する表題欄内の各箇所に存在する文字列の各々に対して、文字認識処理を実行する。
【0061】
ステップS208において、属性特定部50は、修正ルール記憶部49に格納された修正ルール又は辞書データに基づいて、ステップS206で得られた文字認識結果を修正することにより、文字認識結果が修正された修正文字認識結果を生成する。
【0062】
図12に、修正ルール記憶部49に格納されている修正ルール及び辞書データの一例を示す。図12に示されるように、複数の修正ルールRが修正ルール記憶部49に格納されている。
【0063】
例えば、表題欄内に存在する複数のボックスの各々に対し、異なる修正ルールが予め設定されている。例えば、文字認識結果において「属性「図面番号」に対応する属性値のボックスにおいて「O(オー)」が検出された場合には「0(ゼロ)」へと置換する」といった修正ルールが予め設定されている。なお、この修正ルールは、ユーザ毎に予め設定されていてもよい。例えば、ある会社が利用している表題欄の「図面番号」の欄には、アルファベットが出現することがないため、仮に「O(オー)」が検出された場合には「0(ゼロ)」へと置換するといった修正ルールが設定される。
【0064】
また、図12に示されるように、辞書データDは、誤った文字認識結果を表す文字列と、図面データの属性値を表す正解の文字列とが対応付けられたデータである。例えば、図12に示されるように、「SOS304」「SuS304」といった誤った文字認識結果に対して、図面データの属性値を表す正解の文字列「SUS304」が対応付けられている。
【0065】
このため、属性特定部50は、表題欄の複数のボックスの各々について、当該ボックスに存在する文字列の文字認識結果に対して、ボックスに対して予め設定された修正ルールに基づいて、文字認識結果を修正する。
【0066】
また、属性特定部50は、修正ルールとして、誤った文字認識結果を表す文字列と、図面データの属性値を表す正解の文字列とが対応付けられた辞書データに基づいて、文字認識結果を修正することにより、文字認識結果が修正された修正文字認識結果を生成する。
【0067】
ステップS210において、属性特定部50は、ステップS208で得られた修正文字認識結果と、ステップS204で特定された複数のボックスの配置とに基づいて、ボックス内の文字列が表す対象図面データの属性値を表す対象属性値を特定すると共に、ボックスに予め対応付けられた属性である対象属性を特定する。具体的には、属性特定部50は、構築用属性特定部30と同様の手法によって、対象属性値と対象属性とを特定する。
【0068】
ステップS212において、検索部52は、ステップS210により特定された対象属性値と対象属性との組み合わせに基づいて、図面データベース34から、対象図面データの属性値と類似する属性値を有する図面データを検索する。
【0069】
ステップS214において、検索部52は、対象図面データの属性値と類似する属性値を有する図面データの検索結果を出力することにより、本処理ルーチンが終了する。
【0070】
なお、検索部52から出力された検索結果は、ユーザ端末18へ送信される。ユーザは、自身のユーザ端末18の表示部(図示省略)へ表示された検索結果を確認する。
【0071】
以上説明したように、本実施形態に係る図面検索サーバは、対象図面データ内に存在する表題欄の種類を特定し、特定された表題欄の種類に基づいて、表題欄内に存在する複数のボックスの配置を特定する。そして、図面検索サーバは、対象図面データ内に存在する表題欄内の各箇所に存在する文字列の各々に対して、文字認識処理を実行する。図面検索サーバは、文字認識結果と、特定された複数のボックスの配置とに基づいて、ボックス内の文字列が表す対象図面データの属性値を表す対象属性値を特定すると共に、ボックスに予め対応付けられた属性である対象属性を特定する。図面検索サーバは、特定された対象属性値と対象属性との組み合わせに基づいて、図面データと図面データの属性値と属性値に対応する属性とが対応付けられた図面データベースから、対象図面データの属性値と類似する属性値を有する図面データを検索し、検索結果を出力する。これにより、表題欄の種類を特定しない場合に比べ、対象図面データの属性と属性値との組み合わせを精度良く特定し、対象図面データと類似する図面データを精度良く検索することができる。
【0072】
さらに、本実施形態の図面検索サーバは、予め設定された修正ルールに基づいて、文字認識結果を修正することにより、対象図面データの対象属性値を特定する。例えば、修正ルールは、ユーザ毎に予め設定されている。また、例えば、表題欄内に存在する複数のボックスの各々に対し、異なる修正ルールが予め設定されており、図面検索サーバは、複数のボックスの各々について予め設定された修正ルールに基づいて、文字認識結果を修正する。また、例えば、図面検索サーバは、修正ルールとして、誤った文字認識結果を表す文字列と、図面データの属性値を表す正解の文字列とが対応付けられた辞書データに基づいて、文字認識結果を修正する。これにより、OCRによる文字認識結果が修正されるため、対象図面データの属性値を精度良く特定することができる。その結果、対象図面データと類似する図面データを精度良く検索することができる。また、図面データに付与される複数の属性値に基づいて目的とする図面データを検索することができる。
【0073】
また、本実施形態に係る図面データベース構築サーバは、データベース構築用の図面データ内に存在する表題欄の種類を特定し、特定された表題欄の種類に基づいて、表題欄内に存在する複数のボックスの配置を特定する。図面データベース構築サーバは、図面データ内に存在する表題欄内の各箇所に存在する文字列の各々に対して、文字認識処理を実行する。そして、図面データベース構築サーバは、文字認識結果と、特定された複数のボックスの配置とに基づいて、ボックス内の文字列が表す前記図面データの属性値を特定すると共に、ボックスに予め対応付けられた属性を特定し、特定された属性値と属性と図面データとの組み合わせを図面データベースへ格納することにより、データベースを構築する。これにより、対象図面データと類似する図面データを精度良く検索するためのデータベースを自動的に構築することができる。
【0074】
なお、本発明は、上述した実施形態に限定されるものではなく、この発明の要旨を逸脱しない範囲内で様々な変形や応用が可能である。
【0075】
例えば、上記実施形態では、図面データベース構築サーバ14は、図面検索サーバ16のように修正文字認識結果を生成することなく、属性値と属性とを特定する場合を例に説明したが、これに限定されるものではない。図面データベース構築サーバ14も、図面検索サーバ16と同様に、修正ルール及び辞書データを利用して、修正文字認識結果を生成して属性値と属性とを特定するようにしてもよい。
【0076】
また、上記実施形態では、表題欄の各ボックスに対して文字認識処理を実行する場合を例に説明したが、これに限定されるものではない。例えば、図面データベース構築サーバ14の構築用認識部28及び図面検索サーバ16の認識部48は、表題欄内とは異なる箇所に存在する文字列の各々に対して文字認識処理を更に実行し、表題欄内とは異なる箇所に存在する文字列の文字認識結果に基づいて、属性値又は対象属性値を特定するようにしてもよい。図2に示される例では、表題欄Tとは異なる箇所にも図面データの属性値S1,S2,S3,S4が記載されている。このため、図面データベース構築サーバ14の構築用認識部28及び図面検索サーバ16の認識部48は、表題欄Tとは異なる箇所に存在している文字列に対して文字認識処理を実行することにより、その属性値と属性とを特定するようにしてもよい。なお、この際には、修正ルール及び辞書データを利用するようにしても良い。
【0077】
さらに、図面データベース構築サーバ14の構築用認識部28及び図面検索サーバ16の認識部48は、表題欄内の文字認識結果に基づき属性値又は対象属性値が特定されなかった場合に、図面データ又は対象図面データの表題欄内とは異なる箇所に存在する文字列の各々に対して文字認識処理を実行し、構築用属性特定部30又は属性特定部50は、表題欄内とは異なる箇所に存在する文字列の文字認識結果に基づいて、属性値又は対象属性値と属性とを特定するようにしてもよい。なお、この際には、修正ルール及び辞書データを利用するようにしても良い。
【0078】
また、上記実施形態では、表題欄データベース22に格納されている各種の表題欄の罫線と、図面データ又は対象図面データの表題欄の罫線との一致度合いに基づいて、表題欄の種類を特定する場合を例に説明したが、これに限定されるものではない。例えば、表題欄における特定箇所における文字列(例えば、会社名の欄の下欄に存在する会社名)に基づいて、表題欄の種類を特定するようにしてもよい。
【0079】
また、文字認識結果からノイズと思われる文字を削除するようにする処理を修正ルールに加えてもよい。例えば、文字認識結果に「.」及び「|」等、ノイズである文字又は記号が含まれている場合には、それらを除去するようにしてもよい。
【0080】
また、本願明細書中において、プログラムが予めインストールされている実施形態として説明したが、当該プログラムを、コンピュータ読み取り可能な記録媒体に格納して提供することも可能である。
【符号の説明】
【0081】
10 図面検索システム
12 管理者端末
14 図面データベース構築サーバ
16 図面検索サーバ
18 ユーザ端末
20 構築用受付部
22 表題欄データベース
24 構築用表題欄特定部
26 構築用配置特定部
28 構築用認識部
30 構築用属性特定部
32 構築部
34 図面データベース
40 受付部
42 表題欄データベース
44 表題欄特定部
46 配置特定部
48 認識部
49 修正ルール記憶部
50 属性特定部
52 検索部
54 図面データベース
70 コンピュータ
73 記憶部
図1
図2
図3
図4
図5
図6
図7
図8A
図8B
図8C
図8D
図9
図10
図11
図12