IP Force 特許公報掲載プロジェクト 2022.1.31 β版

知財求人 - 知財ポータルサイト「IP Force」

▶ 株式会社四電工の特許一覧

特許7574489学習用データ作成方法および学習データ作成装置
<>
  • 特許-学習用データ作成方法および学習データ作成装置 図1
  • 特許-学習用データ作成方法および学習データ作成装置 図2
  • 特許-学習用データ作成方法および学習データ作成装置 図3
  • 特許-学習用データ作成方法および学習データ作成装置 図4
  • 特許-学習用データ作成方法および学習データ作成装置 図5
  • 特許-学習用データ作成方法および学習データ作成装置 図6
< >
(19)【発行国】日本国特許庁(JP)
(12)【公報種別】特許公報(B1)
(11)【特許番号】
(24)【登録日】2024-10-18
(45)【発行日】2024-10-28
(54)【発明の名称】学習用データ作成方法および学習データ作成装置
(51)【国際特許分類】
   G06F 30/27 20200101AFI20241021BHJP
   G06T 7/00 20170101ALI20241021BHJP
   G06V 10/774 20220101ALI20241021BHJP
【FI】
G06F30/27
G06T7/00 350B
G06V10/774
【請求項の数】 4
(21)【出願番号】P 2024078349
(22)【出願日】2024-05-14
【審査請求日】2024-05-14
【早期審査対象出願】
(73)【特許権者】
【識別番号】000180357
【氏名又は名称】株式会社四電工
(74)【代理人】
【識別番号】100134979
【弁理士】
【氏名又は名称】中井 博
(74)【代理人】
【識別番号】100167427
【弁理士】
【氏名又は名称】岡本 茂樹
(72)【発明者】
【氏名】木原 誠二
(72)【発明者】
【氏名】木原 誠二
【審査官】松浦 功
(56)【参考文献】
【文献】特開2019-101514(JP,A)
【文献】特開2020-140675(JP,A)
【文献】特開2020-170388(JP,A)
【文献】特表2022-521816(JP,A)
(58)【調査した分野】(Int.Cl.,DB名)
G06F 30/00 -30/398
G06T 7/00
G06V 10/774
G06Q 50/04
G06Q 50/08
(57)【特許請求の範囲】
【請求項1】
学習用データ作成装置が、図面から記号を抽出する人工知能(AI)に抽出させる各種記号を学習させる学習データを作成する学習データ作成方法であって、
前記学習用データ作成装置が、
記号に関する情報が含まれる元図面データから記号に関する記号情報を取得する記号情報取得工程と、
前記元図面データからラスター画像である抽出用画像を形成する抽出画像形成工程と、
前記記号情報取得工程において取得した記号情報に基づいて、前記抽出用画像に前記記号を含む記号領域を設定する記号領域設定工程と、
該記号領域設定工程が設定した前記記号領域に基づいて、前記抽出用画像から前記記号領域に対応する記号画像を抽出し記号画像情報を形成する記号画像情報形成工程と、
該記号画像情報形成工程で形成された前記記号画像情報と該記号画像情報の記号画像に含まれる記号の前記記号情報とを関連づけたアノテーションデータを形成するアノテーションデータ形成工程と、を実行し、
前記記号領域設定工程では、
各記号全体を含むができる限り各記号周辺の図形を含まないように前記記号領域を設定し、
前記元図面データに含まれる記号に関する情報には該記号の大きさに関する情報が含まれており、
前記記号情報取得工程では、
前記記号情報として前記元図面データから記号の大きさに関する情報を取得する
ことを特徴とする学習用データ作成方法。
【請求項2】
前記記号が、
シンボルと、該シンボルに関連する傍記と、を含んでおり、
前記記号情報取得工程では、
前記シンボルに関するシンボル情報と、前記傍記に関する傍記情報と、をそれぞれ取得し、
前記記号領域設定工程では、
前記記号情報取得工程で取得された前記シンボル情報と前記傍記情報とに基づいて、前記抽出用画像に前記シンボルを含むシンボル領域と前記抽出用画像に前記傍記を含む傍記領域とをそれぞれ設定し、
前記記号画像情報形成工程では、
前記記号領域設定工程で設定された前記抽出用画像から、前記シンボル領域に対応するシンボル画像と前記傍記領域に対応する傍記画像を抽出してシンボル画像情報と傍記画像情報とをそれぞれを形成し、
前記アノテーションデータ形成工程では、
前記記号画像情報形成工程で形成された前記シンボル画像情報に含まれるシンボルの前記シンボル情報と前記シンボル画像情報とを関連づけたシンボルアノテーションデータと、前記記号画像情報形成工程で形成された前記傍記画像情報に含まれる傍記の前記傍記情報と前記傍記画像情報とを関連づけた傍記アノテーションデータと、をそれぞれ形成する
ことを特徴とする請求項1記載の学習用データ作成方法。
【請求項3】
図面から記号を抽出する人工知能(AI)に抽出させる各種記号を学習させる学習データを作成する学習データ作成装置であって、
記号に関する情報が含まれる元図面データから記号に関する記号情報を取得する記号情報取得部と、
前記元図面データからラスター画像である抽出用画像を形成する抽出画像形成部と、
該記号情報取得部が取得した記号情報に基づいて前記抽出用画像に前記記号を含む記号領域を設定する記号領域設定部と、
該記号領域設定部が設定した前記記号領域に基づいて、前記抽出用画像から前記記号領域に対応する記号画像を抽出し記号画像情報を形成する記号画像情報形成部と、
該記号画像情報形成部で形成された前記記号画像情報と該記号画像情報の記号画像に含まれる記号の前記記号情報とを関連づけたアノテーションデータを形成するアノテーションデータ形成部と、を備えており、
前記記号領域設定部は、
各記号全体を含むができる限り各記号周辺の図形を含まないように前記記号領域を設定する機能を有しており、
前記元図面データに含まれる記号に関する情報には該記号の大きさに関する情報が含まれており、
前記記号情報取得部は、
前記記号情報として前記元図面データから記号の大きさに関する情報を取得する機能を有している
ことを特徴とする学習用データ作成装置。
【請求項4】
前記記号が、
シンボルと、該シンボルに関連する傍記と、を含んでおり、
前記記号情報取得部は、
前記シンボルに関するシンボル情報と、前記傍記に関する傍記情報と、をそれぞれ取得する機能を有しており、
前記記号領域設定部は、
前記記号領域設定部で取得された前記シンボル情報と前記傍記情報とに基づいて、前記抽出用画像に前記シンボルを含むシンボル領域と前記抽出用画像に前記傍記を含む傍記領域とをそれぞれ設定する機能を有しており、
前記記号画像情報形成部は、
前記記号領域設定部で設定された前記抽出用画像から前記シンボル領域に対応するシンボル画像と前記傍記領域に対応する傍記画像を抽出してシンボル画像情報と傍記画像情報とをそれぞれを形成する機能を有しており、
前記アノテーションデータ形成部では、
前記記号画像情報形成部で形成された前記シンボル画像情報に含まれるシンボルの前記シンボル情報と前記シンボル画像情報とを関連づけたシンボルアノテーションデータと、前記記号画像情報形成部で形成された前記傍記画像情報に含まれる傍記の前記傍記情報と前記傍記画像情報とを関連づけた傍記アノテーションデータと、をそれぞれ形成する機能を有している
ことを特徴とする請求項3記載の学習用データ作成装置。
【発明の詳細な説明】
【技術分野】
【0001】
本発明は、学習用データ作成方法および学習データ作成装置に関する。さらに詳しくは、各種図面から各種記号や記号の近傍に記載され記号が表す設備や機器等の仕様を補足する文字等を抽出する人工知能(AI)に抽出する各種記号等を学習させるため、学習に使用される学習用データを作成する学習用データ作成方法および学習データ作成装置に関する。
【背景技術】
【0002】
現在、様々な図面の作成において、CADソフトを使用した図面の作成が一般的になっている。CADソフトを使用して作成された図面が提供される場合には、CADデータではなく、PDF形式に変換されたデータや紙ベースの図面(以下、単に、「紙ベース図面等」という場合がある)が提供されることがあり、これらの図面に記載されている種々の情報を取得する必要が生じる場合がある。例えば、建築用の設計図面であれば、設備の記号(以下、単に、「シンボル」という場合がある)や記号に関連した傍記(以下、単に、「傍記」という場合がある)、配線などの情報が多数含まれており、シンボルや傍記を抽出することが必要になる場合がある。また、シンボルと傍記とは関連付けて記載されているため、両者を関連付けた状態で精度よく抽出すること、または、別々に抽出したシンボルと傍記とを精度よく関連付けることが必要になる。
【0003】
例えば、特許文献1,2には、手書き図面からシンボルを抽出して、データベースに記憶されているシンボルにアノテーションする情報に基づいて、抽出したシンボル画像にシンボルの情報をアノテーションする技術が開示されている。
また、近年では、シンボルや傍記の抽出を効率化するために、人工知能(AI)を利用してシンボルや傍記を抽出する技術も開発されている。
【先行技術文献】
【特許文献】
【0004】
【文献】特開平08‐083333号公報
【文献】特開平08‐083334号公報
【発明の概要】
【発明が解決しようとする課題】
【0005】
ところで、人工知能(AI)を利用してシンボルや傍記を抽出する場合、その精度を向上させるには、人工知能(AI)に多数のシンボルや傍記を学習させることが必要になり、学習させるシンボルや傍記が多くなるほどその精度の向上が見込まれる。
【0006】
しかし、シンボルや傍記を学習させるための学習データは、現状では、既存のツールを利用して作業者が元となる図面からシンボルや傍記を抽出し、抽出したシンボルや傍記に情報を追加することによって作成されている。かかる方法の場合、シンボルや傍記の数が多くなるほど有効な学習データとなる一方、作業者の負担が膨大になる。元となる図面から自動で学習データを作成できれば、作業者の負担を軽減しつつ人工知能(AI)を利用したシンボルや傍記の抽出精度を向上させることができる学習データを作成することが可能となる。
【0007】
本発明は、上記事情に鑑み、図面から各種記号等の抽出を行う人工知能(AI)に各種記号を学習させるための学習用データを適切かつ効率よく作成することができる学習用データ作成方法および学習データ作成装置を提供することを目的とする。
【課題を解決するための手段】
【0008】
第1発明の学習用データ作成方法は、学習用データ作成装置が、図面から記号を抽出する人工知能(AI)に抽出させる各種記号を学習させる学習データを作成する学習データ作成方法であって、前記学習用データ作成装置が、記号に関する情報が含まれる元図面データから記号に関する記号情報を取得する記号情報取得工程と、前記元図面データからラスター画像である抽出用画像を形成する抽出画像形成工程と、前記記号情報取得工程において取得した記号情報に基づいて、前記抽出用画像に前記記号を含む記号領域を設定する記号領域設定工程と、該記号領域設定工程が設定した前記記号領域に基づいて、前記抽出用画像から前記記号領域に対応する記号画像を抽出し記号画像情報を形成する記号画像情報形成工程と、該記号画像情報形成工程で形成された前記記号画像情報と該記号画像情報の記号画像に含まれる記号の前記記号情報とを関連づけたアノテーションデータを形成するアノテーションデータ形成工程と、を実行し、前記記号領域設定工程では、各記号全体を含むができる限り各記号周辺の図形を含まないように前記記号領域を設定し、前記元図面データに含まれる記号に関する情報には該記号の大きさに関する情報が含まれており、前記記号情報取得工程では、前記記号情報として前記元図面データから記号の大きさに関する情報を取得することを特徴とする。
第2発明の学習用データ作成方法は、第1発明において、前記記号が、シンボルと、該シンボルに関連する傍記と、を含んでおり、前記記号情報取得工程では、前記シンボルに関するシンボル情報と、前記傍記に関する傍記情報と、をそれぞれ取得し、前記記号領域設定工程では、前記記号情報取得工程で取得された前記シンボル情報と前記傍記情報とに基づいて、前記抽出用画像に前記シンボルを含むシンボル領域と前記抽出用画像に前記傍記を含む傍記領域とをそれぞれ設定し、前記記号画像情報形成工程では、前記記号領域設定工程で設定された前記抽出用画像から、前記シンボル領域に対応するシンボル画像と前記傍記領域に対応する傍記画像を抽出してシンボル画像情報と傍記画像情報とをそれぞれを形成し、前記アノテーションデータ形成工程では、前記記号画像情報形成工程で形成された前記シンボル画像情報に含まれるシンボルの前記シンボル情報と前記シンボル画像情報とを関連づけたシンボルアノテーションデータと、前記記号画像情報形成工程で形成された前記傍記画像情報に含まれる傍記の前記傍記情報と前記傍記画像情報とを関連づけた傍記アノテーションデータと、をそれぞれ形成することを特徴とする。
<学習用データ作成装置>
第3発明の学習用データ作成装置は、図面から記号を抽出する人工知能(AI)に抽出させる各種記号を学習させる学習データを作成する学習データ作成装置であって、記号に関する情報が含まれる元図面データから記号に関する記号情報を取得する記号情報取得部と、前記元図面データからラスター画像である抽出用画像を形成する抽出画像形成部と、該記号情報取得部が取得した記号情報に基づいて前記抽出用画像に前記記号を含む記号領域を設定する記号領域設定部と、該記号領域設定部が設定した前記記号領域に基づいて、前記抽出用画像から前記記号領域に対応する記号画像を抽出し記号画像情報を形成する記号画像情報形成部と、該記号画像情報形成部で形成された前記記号画像情報と該記号画像情報の記号画像に含まれる記号の前記記号情報とを関連づけたアノテーションデータを形成するアノテーションデータ形成部と、を備えており、前記記号領域設定部は、各記号全体を含むができる限り各記号周辺の図形を含まないように前記記号領域を設定する機能を有しており、前記元図面データに含まれる記号に関する情報には該記号の大きさに関する情報が含まれており、前記記号情報取得部は、前記記号情報として前記元図面データから記号の大きさに関する情報を取得する機能を有していることを特徴とする。
第4発明の学習用データ作成装置は、第3発明において、前記記号が、シンボルと、該シンボルに関連する傍記と、を含んでおり、前記記号情報取得部は、前記シンボルに関するシンボル情報と、前記傍記に関する傍記情報と、をそれぞれ取得する機能を有しており、前記記号領域設定部は、前記記号領域設定部で取得された前記シンボル情報と前記傍記情報とに基づいて、前記抽出用画像に前記シンボルを含むシンボル領域と前記抽出用画像に前記傍記を含む傍記領域とをそれぞれ設定する機能を有しており、前記記号画像情報形成部は、前記記号領域設定部で設定された前記抽出用画像から前記シンボル領域に対応するシンボル画像と前記傍記領域に対応する傍記画像を抽出してシンボル画像情報と傍記画像情報とをそれぞれを形成する機能を有しており、前記アノテーションデータ形成部では、前記記号画像情報形成部で形成された前記シンボル画像情報に含まれるシンボルの前記シンボル情報と前記シンボル画像情報とを関連づけたシンボルアノテーションデータと、前記記号画像情報形成工程で形成された前記傍記画像情報に含まれる傍記の前記傍記情報と前記傍記画像情報とを関連づけた傍記アノテーションデータと、をそれぞれ形成する機能を有していることを特徴とする。
【発明の効果】
【0009】
<学習用データ作成方法>
第1発明によれば、図面に含まれる記号から人工知能(AI)に抽出させる各種記号を学習させる学習データとなるアノテーションデータを自動で作成することができるので、多数の記号画像情報と記号情報とを有する学習データを容易に形成することができる。また、アノテーションデータの作成に使用した元図面データの縮尺と対象抽出図面の縮尺とが異なっていても、アノテーションデータを縮尺の異なる対象抽出図面からの記号抽出に使用することができる。
第2発明によれば、記号を抽出する対象図面データにおいて、シンボルと傍記とのレイアウト(傍記の記載位置)やサイズ(両者の相対的な大きさ)が異なる場合でも適切にシンボルと傍記を抽出できるように人工知能(AI)に記号を学習させることができる。
<学習用データ作成装置>
第3発明によれば、図面に含まれる記号から人工知能(AI)に抽出させる各種記号を学習させる学習データとなるアノテーションデータを自動で作成することができるので、多数の記号画像情報と記号情報とを有する学習データを容易に形成することができる。また、アノテーションデータの作成に使用した元図面データの縮尺と対象抽出図面の縮尺とが異なっていても、アノテーションデータを縮尺の異なる対象抽出図面からの記号抽出に使用することができる。
第4発明によれば、記号を抽出する対象図面データにおいて、シンボルと傍記とのレイアウト(傍記の記載位置)やサイズ(両者の相対的な大きさ)が異なる場合でも適切にシンボルと傍記を抽出できるように人工知能(AI)に記号を学習させることができる。
【図面の簡単な説明】
【0010】
図1】本実施形態の学習用データ作成方法のフロー図である。
図2】本実施形態の学習用データ作成装置1の概略ブロック図である。
図3】(A)は元図面ファイルS1の一例を示した図であり、(B)は抽出用画像ファイルS2にシンボル領域SAおよび傍記領域AAを含む記号領域CAを設定した一例を示した図であり、(C)は図3(B)で設定されたシンボル領域SAおよび傍記領域AAを拡大した説明図である。
図4】(A)は記号情報リストのシンボル情報リストの一例であり、(B)は記号情報リストの傍記情報リストの一例である。
図5】(A)は記号画像情報リストのシンボル画像情報リストの一例であり、(B)は記号画像情報リストの傍記画像情報リストの一例であり、(C)は記号領域情報リストのシンボル領域情報リストの一例であり、(D)は記号領域情報リストの傍記領域情報リストの一例である。
図6】(A)はアノテーションデータリストのシンボルアノテーションデータリストの一例であり、(B)はアノテーションデータリストの傍記アノテーションデータリストの一例である。
【発明を実施するための形態】
【0011】
本実施形態の学習用データ作成方法は、建設用図面などの図面データからシンボルや傍記等の記号抽出を行う人工知能(AI)が学習する学習データを作成する方法である。
【0012】
本実施形態の学習用データ作成方法によって学習データを作成する元となる図面ファイルは、図面に記載されている記号などの形状や属性情報のデータを有するファイルである。例えば、設備CADデータ、IFCデータ、BE-Bridgeデータ等、いわゆるBIMデータで形成された図面ファイル(ベクター形式の図面ファイル)を学習データの作成元となる図面とすることができる。なお、以下では学習データを作成する元となる図面ファイルを単に元図面ファイルという。
【0013】
以下の説明では、シンボルなどが抽出される元となる図面が建設用図面である場合を代表として説明するが、人工知能(AI)がシンボルなどの抽出を行う図面は建設用図面に限られない。言い換えれば、本実施形態の学習用データ作成方法によって学習データを作成する元となる図面は、建設用図面以外の種々の図面であって、種々の記号が記載されている図面であればよく、抽出される記号もとくに限定されない。以下の説明では、シンボルなどが抽出される元となる図面が建設用図面であるので、記号には「シンボル」と「傍記」とが含まれる。この「シンボル」とは、建造物の設備などに使用される電気・機械部品機器を図式的に表す記号を意味する。また、「傍記」とは、前述したシンボルで表される電気・機械部品機器の仕様を補足する文字や記号であってシンボルに隣接して記載されるものを意味する。
【0014】
<本実施形態の学習用データ作成装置1>
まず、本実施形態の学習用データ作成方法を実施する学習用データ作成装置1を説明する。
なお、図2に示すように、学習用データ作成装置1は図面やデータなどをディスプレイDSに表示する機能や、キーボードやマウスなどの入力機器によって必要な情報を入力したり必要な操作を指示する情報を入力したりする機能ISを有していてもよい。
【0015】
<データ入力部2>
図2に示すように、本実施形態の学習用データ作成方法を実施する装置1(以下、単に、「学習用データ作成装置1」という)は、学習用データを作成する元になる元図面ファイルS1(図3(A)参照)を入力するデータ入力部2を有している。このデータ入力部2は、ベクターPDFファイルなどのベクター形式の図面ファイルのデータをUSBなどの記憶媒体から受け入れたりインターネットなどの回線を通じて受信したりする機能(データ受信機能)を有している。データ入力部2で受信した図面ファイルは元図面ファイルS1としてデータ入力部2から記憶部10に送信され記憶される。なお、元図面ファイルS1は、複数の記号、つまり、複数のシンボルと各シンボルに隣接して記載される傍記が記載されている。
【0016】
<記号情報取得部3>
図2に示すように、学習用データ作成装置1は、記号情報取得部3を有している。記号情報取得部3は、データ入力部2で受信した元図面ファイルS1に含まれる情報を取得する機能を有している。元図面ファイルS1に含まれる情報とは、元図面ファイルS1に記載されているシンボルや傍記に関する情報(以下、シンボル情報、傍記情報という)を意味している。例えば、シンボル情報には、それぞれのシンボルに関する、シンボルの形状情報(シンボルの大きさやシンボルの姿勢(向きや傾き)等)や、シンボルの位置情報(図面上の座標)、シンボルの属性情報(名称、仕様等)が含まれている(図4(A)の各行参照)。また、傍記情報には、それぞれの傍記に関する、傍記の形状情報(傍記の大きさや傍記の姿勢(向きや傾き)等)や、傍記の位置情報(図面上の座標)、傍記の属性情報(名称、仕様等)が含まれている(図4(B)の各行参照)。取得したシンボル情報および傍記情報は記号情報取得部3から記憶部10に送信され記憶される。
【0017】
なお、以下では、シンボル情報と傍記情報の両方を合わせて記号情報という場合がある。
また、記号情報取得部3で取得された記号情報(シンボル情報や傍記情報)は、各記号について各記号情報をリスト化した記号情報リスト(図4(A)、(B)参照)として記憶部10に送信され記憶されてもよいし、各記号情報が記号情報取得部3から記憶部10に送信されると記憶部10において各記号情報を各記号と関連づけた記号情報リストを作成するようにしてもよい。
【0018】
<抽出画像形成部4>
図2に示すように、学習用データ作成装置1は、抽出画像形成部4を有している。抽出画像形成部4は、データ入力部2で受信した元図面ファイルS1から抽出用画像を含む抽出用画像ファイルS2を形成する機能を有するものである。具体的には、抽出画像形成部4は、ベクター形式のファイルである元図面ファイルS1からラスター形式のファイル(画像がピクセルデータで構成された図面ファイル)である抽出用画像を含む抽出用画像ファイルS2を形成する機能を有するものである。
なお、抽出画像形成部4で形成された抽出用画像ファイルS2は記憶部10に送信され記憶される。
【0019】
<記号領域設定部5>
図2に示すように、学習用データ作成装置1は、記号領域設定部5を有している。記号領域設定部5は、記号情報取得部3で作成された記号情報に基づいて、抽出用画像ファイルS2に含まれる抽出用画像に記載されている全ての記号について、各記号を含む記号領域CAをそれぞれ設定する機能を有している(図3(B)、(C)参照)。具体的には、全ての記号(シンボルや傍記)について、各記号の記号情報に含まれる記号の位置情報と記号の大きさに基づいて、各記号全体が含まれるように記号領域CAを設定する機能を有している。そして、設定された記号領域CAの情報が記号領域設定部5から記憶部10に送信され記憶される。
【0020】
例えば、記号の位置情報として記号の中心位置が記憶されている場合には、記号領域設定部5は、記号の中心位置と記号情報に含まれる記号の大きさに基づいて、記号領域CAとして記号全体を含むような矩形の領域を設定する。矩形の領域を記号領域CAとする場合には、矩形の記号領域CAの対角に位置する角のX軸、Y軸の座標(位置情報)が含まれる(図5(C)、(D)の各行参照)。なお、記号領域CAのうち、シンボルと対応する領域はシンボル領域SAといい(図5(C)の各行参照)、傍記と対応する領域は傍記領域AAといい(図5(D)の各行参照)、両方を合わせて表現する場合には単に記号領域CAという。
【0021】
なお、記号領域設定部5が設定した記号領域CAの情報は、各記号について各記号領域CAの情報をリスト化した記号領域情報リスト(図5(C)、(D)参照)として記憶部10に送信され記憶されてもよいし、各記号情報が記号領域設定部5から記憶部10に送信されると記憶部10において各記号領域CAの情報を各記号と関連づけた記号領域情報リストを形成するようにしてもよい。
また、図4に示すように、記号の位置情報として矩形の領域の座標(図4では対角となる角の位置座標)が含まれている場合にはその矩形領域を記号領域CAとして設定し、記号の位置情報の矩形の領域の座標が矩形の記号領域CAの対角に位置する角のX軸、Y軸の座標(位置情報)になる。
【0022】
<記号画像情報形成部6>
図2に示すように、学習用データ作成装置1は、記号画像情報形成部6を有している。記号画像情報形成部6は、抽出画像形成部4で作成された抽出用画像ファイルS2から、記号領域設定部5で設定された記号領域CAと対応する領域の画像を抽出する機能を有している。具体的には、抽出用画像ファイルS2に含まれる抽出用画像において、記号領域CAと対応する領域に含まれる画像(記号画像)を抽出し、この記号画像を含む記号画像情報を形成する機能を有している。記号画像情報は、記号画像情報形成部6から記憶部10に送信され記憶される。なお、記号領域CAは各記号が含まれるように設定されるので、記号画像情報に含まれる記号画像は各記号を含む画像になる(図5(A)、(B)の各行参照)。また、記号画像情報のうち、シンボルを含む記号画像情報はシンボル画像情報といい(図5(A)の各行参照)、傍記を含む記号画像情報は傍記画像情報という(図5(B)の各行参照)。
【0023】
なお、記号画像情報は、記号画像情報形成部6から各記号について各記号画像情報をリスト化した記号画像情報リスト(図5(A)、(B)参照)として記憶部10に送信され記憶されてもよいし、各記号画像情報が記号画像情報形成部6から記憶部10に送信されると記憶部10において各記号画像情報を各記号と関連づけた記号画像情報リストを形成するようにしてもよい。
【0024】
<アノテーションデータ形成部7>
図2に示すように、学習用データ作成装置1は、アノテーションデータ形成部7を有している。アノテーションデータ形成部7は、記号画像情報形成部6で形成された記号画像情報と、記号情報と、を関連づけたアノテーションデータを形成する機能を有している。具体的には、各記号画像情報について、各記号画像情報の画像に含まれる記号に関する記号情報と、記号画像情報に含まれる記号画像とを関連づけたアノテーションデータを形成する機能を有している。アノテーションデータは、アノテーションデータ形成部7から記憶部10に送信され記憶される。また、アノテーションデータのうち、シンボルを含むアノテーションデータ情報はシンボルアノテーションデータ情報といい(図6(A)の各行参照)、傍記を含むアノテーションデータ情報は傍記アノテーションデータ情報という(図6(B)の各行参照)。
【0025】
なお、アノテーションデータ形成部7は、各記号に関するアノテーションデータをリスト化したアノテーションデータリスト(図6(A)、(B)参照)として記憶部10に送信され記憶されてもよいし、各記号に関するアノテーションデータ形成部7から記憶部10に送信されると記憶部10において各アノテーションデータを各記号と関連づけたアノテーションデータリストを形成するようにしてもよい。
アノテーションデータ(およびアノテーションデータリスト)が、人工知能(AI)が抽出する記号を学習する学習データに相当するものになる。
【0026】
<学習データ作成作業>
前述した学習用データ作成装置1による学習データ作成作業(つまり本実施形態の学習データ作成方法)を説明する(図1および図2参照)。
【0027】
<記号情報取得工程>
図1および図2に示すように、学習データを作成する場合には、データ入力部2で受信され記憶部10に記憶されている元図面ファイルS1を記号情報取得部3が受信する。元図面ファイルS1を受信すると、記号情報取得部3によって元図面ファイルS1から記号情報が取得され、取得された記号情報(図4(A)、(B)参照)は記憶部10に送信され記憶される。
【0028】
なお、元図面ファイルS1は、データ入力部2で受信されたのち、直接、記号情報取得部3に送信されてもよい。
また、記号情報は記憶部10だけでなく記号画像情報形成部6やアノテーションデータ形成部7に直接送信されてもよい。
また、記号情報は、全ての記号の情報が取得された段階で全ての記号情報(例えば記号情報リスト等)を記憶部10や記号画像情報形成部6、アノテーションデータ形成部7に送信してもよいし、各記号について記号情報が取得されるたびに記号情報を記憶部10や記号画像情報形成部6、アノテーションデータ形成部7に送信してもよい。また、一定数の記号について記号情報が取得されると一定数の記号情報をまとめて(例えば記号情報リスト等として)記憶部10や記号画像情報形成部6、アノテーションデータ形成部7に送信するようにしてもよい。
また、記号情報としてシンボル情報と傍記情報とを取得する場合には、シンボル情報と傍記情報がそれぞれ取得され記憶部10に記憶されたり、記号画像情報形成部6やアノテーションデータ形成部7に送信されたりする。
【0029】
<抽出画像形成工程>
図1および図2に示すように、学習データを作成する場合には、データ入力部2で受信され記憶部10に記憶されている元図面ファイルS1を抽出画像形成部4が受信する。元図面ファイルS1を受信すると、抽出画像形成部4によって元図面ファイルS1からラスター形式のデータである抽出用画像が形成される。抽出用画像が形成されると、抽出用画像を含む抽出用画像ファイルS2(図3(B)参照)が記憶部10に送信され記憶される。
【0030】
なお、元図面ファイルS1は、データ入力部2で受信されたのち、直接、抽出画像形成部4に送信されてもよい。
また、抽出用画像ファイルS2は記憶部10だけでなく記号画像情報形成部6やアノテーションデータ形成部7に直接送信されてもよい。
【0031】
<記号領域設定工程>
図1および図2に示すように、記号領域設定部5が記憶部10から記号情報および抽出用画像ファイルS2を受信すると(または記号情報取得部3から記号情報が送信され抽出画像形成部4から抽出用画像ファイルS2が送信されると)、記号領域設定部5は、各記号について記号領域CAを設定する。つまり、記号領域設定部5は、記号情報に基づいて、各記号を含む一定の領域を記号領域CAとして設定する(図3(B)、(C)参照)。そして、設定した記号領域CAの情報(図5(C)、(D)参照)は、記号領域設定部5から記憶部10に送信されて記憶される。
【0032】
なお、記号領域CAの情報は、記憶部10だけでなく記号画像情報形成部6やアノテーションデータ形成部7に直接送信されてもよい。
また、記号情報としてシンボル情報と傍記情報とを取得する場合には、記号領域CAとして、シンボル領域SAおよび傍記領域AAがそれぞれ設定され、設定されたシンボル領域SAの情報および傍記領域AAの情報がそれぞれ記憶部10に送信されて記憶されたり、記号画像情報形成部6やアノテーションデータ形成部7に送信されたりする。
また、記号領域CAの情報は、全ての記号の記号領域CAが設定された段階で全ての記号領域CAの情報(例えば記号領域情報リスト等)を記憶部10や記号画像情報形成部6、アノテーションデータ形成部7に送信してもよいし、各記号について記号領域CAが設定されるたびに記号領域CAの情報を記憶部10や記号画像情報形成部6、アノテーションデータ形成部7に送信してもよい。また、一定数の記号について記号領域CAが設定されると一定数の記号領域CAの情報をまとめて(例えば記号領域情報リスト等として)記憶部10や記号画像情報形成部6、アノテーションデータ形成部7に送信するようにしてもよい。
【0033】
<記号画像情報形成工程>
図1および図2に示すように、記号画像情報形成部6は記憶部10から抽出用画像ファイルS2および記号領域CAの情報を受信すると(または抽出画像形成部4から抽出用画像ファイルS2が送信され記号領域設定部5から記号領域CAの情報が送信されると)、記号画像情報形成部6は、抽出用画像ファイルS2から記号領域設定部5で設定された記号領域CAと対応する領域の画像を記号画像として抽出し、この記号画像を含む記号画像情報を形成する。そして、形成された記号画像情報(図5(A)、(B)参照)は、記号画像情報形成部6から記憶部10に送信されて記憶される。
【0034】
なお、記号画像情報は、記憶部10だけでなくアノテーションデータ形成部7に直接送信されてもよい。
また、記号領域CAとしてシンボル領域SAおよび傍記領域AAとが設定された場合には、記号画像情報として、シンボル画像情報および傍記画像情報がそれぞれ設定され、設定されたシンボル画像情報および傍記画像情報がそれぞれ記憶部10に送信されて記憶されたり、アノテーションデータ形成部7に送信されたりする。
また、記号画像情報は、全ての記号の記号画像情報が形成された段階で全ての記号画像情報(例えば記号画像情報リスト等)を記憶部10やアノテーションデータ形成部7に送信してもよいし、各記号について記号画像情報が形成されるたびに記号画像情報を記憶部10やアノテーションデータ形成部7に送信してもよい。また、一定数の記号について記号画像情報が設定されると一定数の記号画像情報をまとめて(例えば記号画像情報リスト等として)記憶部10やアノテーションデータ形成部7に送信するようにしてもよい。
【0035】
<アノテーションデータ形成工程>
図1および図2に示すように、記憶部10から記号情報および記号画像情報を取得すると(記号情報取得部3から記号情報が送信され記号画像情報形成部6から記号画像情報が送信されると)、アノテーションデータ形成部7は、対応する記号について、記号画像情報に含まれる記号画像と記号情報に含まれる各情報とを関連づけたアノテーションデータを作成する。作成されたアノテーションデータ(またはアノテーションデータリスト)がアノテーションデータ形成部7から記憶部10に送信されて記憶される。つまり、各記号について記号画像を含むアノテーションデータがリスト化された学習データ(図6(A)、(B)参照)が形成される。
【0036】
なお、アノテーションデータとして、シンボルアノテーションデータおよび傍記アノテーションデータがそれぞれ作成され、作成されたシンボルアノテーションデータおよび傍記アノテーションデータがそれぞれ記憶部10に送信されて記憶される。
また、アノテーションデータは、全ての記号のアノテーションデータが形成された段階で全てのアノテーションデータ(例えばアノテーションデータリスト等)を記憶部10に送信してもよいし、各記号についてアノテーションデータが形成されるたびにアノテーションデータを記憶部10に送信してもよい。また、一定数の記号についてアノテーションデータが設定されると一定数のアノテーションデータをまとめて(例えばアノテーションデータリスト等として)記憶部10に送信するようにしてもよい。
【0037】
以上のように、本実施形態の学習データ作成方法では、元図面ファイルS1に記号の大きさおよび位置情報を含む記号に関する情報が含まれているので、この元図面ファイルS1に基づいて、記号画像(つまり、学習用画像データ)の作成からアノテーションデータの作成までを自動化できる。すると、元図面ファイルS1の画像に複数の記号(シンボルや傍記)が記載されていても、元図面ファイルS1に基づくアノテーションデータ(つまり学習データ)の作成が容易になるし、アノテーションデータを作成する作業を実施する作業者の作業負担を軽減できる。しかも、多数の記号画像情報と記号情報とを有する学習データを容易に形成することができるので、学習データによって学習された人工知能(AI)による記号抽出の精度を向上させることが可能になる。そして、多数の記号画像情報があれば、記号と関係のない配線や文字など(ノイズ図形)が重なって記載されている様々な記号画像を学習させることができる。すると、記号を抽出する対象となる図面において、記載されている記号がノイズ図形を含む記号となっていても、記号を適切に抽出することができる。
【0038】
また、一般的に、CADで設計された設計図面データでは、縮尺が設定されれば縮尺ごとに設けられたテンプレートでシンボルや傍記等の記号の大きさが決定され、記号の大きさに関する情報は設計図面データには含まれない。このため、縮尺が設定された設計図面データから抽出したアノテーションデータは、人工知能(AI)による縮尺の異なる抽出対象図面からの記号抽出には使用できない。つまり、アノテーションデータを抽出する図面と人工知能(AI)が記号を抽出する図面(対象抽出図面)との縮尺が異なる場合には、アノテーションデータを対象抽出図面から記号を抽出するデータとして利用することはできない。
しかし、本実施形態の学習データ作成方法のように、記号の大きさに関する情報が含まれている元図面ファイルS1からアノテーションデータを作成すれば、作成に使用したCAD設計図面データの縮尺と人工知能(AI)が記号を抽出する図面(対象抽出図面)の縮尺とが異なっていても、アノテーションデータを縮尺の異なる対象抽出図面からの記号抽出に使用することができる。つまり、アノテーションデータに含まれる記号の大きさを対象抽出図面の記号の大きさに合わせれば、アノテーションデータを縮尺の異なる対象抽出図面からの記号抽出に使用することができる。
【0039】
さらに、シンボルと傍記とを別々に抽出してそれぞれのシンボルアノテーションデータや傍記アノテーションデータとして記録されるので(図6(A)、(B)参照)、抽出対象図面データにおいて、シンボルと傍記とのレイアウト(傍記の記載位置)やサイズ(両者の相対的な大きさ)が異なる場合でも適切にシンボルと傍記を抽出できるように学習させることができる。
【0040】
なお、前述した本実施形態の学習データ作成方法では、元図面ファイルS1に記号の大きさおよび位置情報を含む記号に関する情報が含まれている場合を説明したが、元図面ファイルS1に記号の大きさが含まれていない場合でも、本実施形態の学習データ作成方法により学習データを作成することもできる。この場合には、記号の大きさの情報が無いので、対象抽出図面は、アノテーションデータを作成した元図面ファイルS1の縮尺と同じ縮尺の図面に限定される。
【0041】
<記号領域CAについて>
記号領域設定部5は、記号領域CAとして、抽出用画像ファイルS2に含まれる抽出用画像が、各記号全体を含むが、できる限り各記号周辺の図形を含まないように設定することが望ましい。例えば、図3(B)、(C)に示すように、記号領域CAとしてシンボルを含むシンボル領域SAを設定する場合にはシンボル全体を含むが、できる限りシンボル周辺の図形を含まないように設定することが望ましい。さらに、図3(B)、(C)に示すように、記号領域CAとして傍記を含む傍記領域AAを設定する場合には傍記全体を含むが、できる限り傍記周辺の図形を含まないように設定することが望ましい。
【産業上の利用可能性】
【0042】
本発明の学習用データ作成方法は、建設用図面など多数の記号や文字、線が記載されている図面から記号や文字を抽出する人工知能(AI)に抽出させる各種記号を学習させる学習データを作成する方法として適している。
【符号の説明】
【0043】
1 学習用データ作成装置
2 データ入力部
3 記号情報取得部
4 抽出画像形成部
5 記号領域設定部
6 記号画像情報形成部
7 アノテーションデータ形成部
10 記憶部
S1 元図面ファイル
S2 抽出用画像ファイル
CA 記号領域
SA シンボル領域
AA 傍記領域
【要約】
【課題】図面から各種記号等の抽出を行う人工知能(AI)に各種記号を学習させるための学習用データを効率よく作成することができる学習用データ作成方法および学習用データ作成装置を提供する。
【解決手段】図面から記号を抽出する人工知能(AI)に抽出させる各種記号を学習させる学習データを作成する学習データ作成方法であって、記号情報取得工程と、抽出画像形成工程と、記号領域設定工程と、記号画像情報形成工程と、記号画像情報と記号画像情報の記号画像に含まれる記号の記号情報とを関連づけたアノテーションデータを形成するアノテーションデータ形成工程と、を実施する。図面に含まれる記号から人工知能(AI)に抽出させる各種記号を学習させる学習データとなるアノテーションデータを自動で作成することができるので、多数の記号画像情報と記号情報とを有する学習データを容易に形成することができる。
【選択図】図1
図1
図2
図3
図4
図5
図6