(19)【発行国】日本国特許庁(JP)
(12)【公報種別】公開特許公報(A)
(11)【公開番号】P2024177917
(43)【公開日】2024-12-24
(54)【発明の名称】記号識別方法
(51)【国際特許分類】
G06T 7/60 20170101AFI20241217BHJP
G06T 7/62 20170101ALI20241217BHJP
【FI】
G06T7/60 300A
G06T7/60 200H
G06T7/62
【審査請求】未請求
【請求項の数】1
【出願形態】OL
(21)【出願番号】P 2023096322
(22)【出願日】2023-06-12
(71)【出願人】
【識別番号】000003207
【氏名又は名称】トヨタ自動車株式会社
(74)【代理人】
【識別番号】100087480
【弁理士】
【氏名又は名称】片山 修平
(72)【発明者】
【氏名】竹内 伸一
(72)【発明者】
【氏名】川上 崇穂
(72)【発明者】
【氏名】則竹 真吾
(72)【発明者】
【氏名】村上 亮
(72)【発明者】
【氏名】柳川 涼
(72)【発明者】
【氏名】桑島 豊
【テーマコード(参考)】
5L096
【Fターム(参考)】
5L096AA03
5L096AA07
5L096BA18
5L096DA02
5L096EA02
5L096FA03
5L096FA06
5L096FA10
5L096FA24
5L096FA59
5L096FA67
5L096GA51
5L096HA11
5L096KA04
(57)【要約】
【課題】記号の識別精度を向上させることができる記号識別方法を提供する。
【解決手段】コンピュータが、画像データ内の線で囲まれている領域を塗りつぶす第1処理と、塗りつぶされた領域に膨張処理を施す第2処理と、当該塗りつぶされた領域の輪郭を抽出する第3処理と、当該抽出された輪郭と所定の記号の輪郭との比較の結果が、当該抽出された輪郭と当該所定の記号の輪郭が近似し、当該抽出された輪郭を構成する複数の輪郭点を直線変換することにより互いに交差する2本の直線が検出され、且つ当該抽出された輪郭で囲まれた領域面積と前記所定の記号の面積との差が所定値以下である又は当該抽出された輪郭で囲まれた領域面積の2倍が矩形の記号の面積と略同一である場合に、当該塗りつぶされた領域を前記所定の記号として識別する第4処理とを実行する。
【選択図】
図2
【特許請求の範囲】
【請求項1】
コンピュータが、
画像データ内の線で囲まれている領域を塗りつぶす第1処理と、
前記第1処理で塗りつぶされた領域に膨張処理を施す第2処理と、
前記第1処理で塗りつぶされた領域の輪郭を抽出する第3処理と、
前記第3処理によって抽出された輪郭と所定の記号の輪郭との比較の結果が、前記第3処理によって抽出された輪郭と前記所定の記号の輪郭が近似し、前記第3処理によって抽出された輪郭を構成する複数の輪郭点を直線変換することにより互いに交差する2本の直線が検出され、且つ前記第3処理によって抽出された輪郭で囲まれた領域面積と前記所定の記号の面積との面積差が所定値以下である又は前記第3処理によって抽出された輪郭で囲まれた領域面積の2倍が矩形の記号の面積と略同一である場合に、前記第1処理で塗りつぶされた領域を前記所定の記号として識別する第4処理と
を実行することを特徴とする記号識別方法。
【発明の詳細な説明】
【技術分野】
【0001】
本発明は、記号識別方法に関する。
【背景技術】
【0002】
従来より、三角形の記号を抽出する記号抽出処理方法が知られている(例えば特許文献1参照)。また、従来より、三角形の仕上げ記号を認識し、立体モデルの表面の質感を表示する技術(例えば特許文献2参照)、図中の記号をテンプレートパターンで照合する技術(例えば特許文献3参照)、パターンマッチングにより記号を抽出する技術(例えば特許文献4参照)、及び記号の図形的構成要素を決定するために予め用意されたメニューから三角形を選択する技術(例えば特許文献5参照)が知られている。
【先行技術文献】
【特許文献】
【0003】
【特許文献1】特開昭61-109375号公報
【特許文献2】特開平5-165923号公報
【特許文献3】特開2004-234424号公報
【特許文献4】特開2022-21031号公報
【特許文献5】特開平4-51366号公報
【発明の概要】
【発明が解決しようとする課題】
【0004】
たとえば、記号が他の線や文字とつながっている場合、記号を他の線や文字から分離する方法が不明であり、記号を認識するのが困難であった。
【0005】
そこで、本発明では、記号の識別精度を向上させることができる記号識別方法を提供することを目的とする。
【課題を解決するための手段】
【0006】
本発明に係る記号識別方法は、コンピュータが、画像データ内の線で囲まれている領域を塗りつぶす第1処理と、前記第1処理で塗りつぶされた領域に膨張処理を施す第2処理と、前記第1処理で塗りつぶされた領域の輪郭を抽出する第3処理と、前記第3処理によって抽出された輪郭と所定の記号の輪郭との比較の結果が、前記第3処理によって抽出された輪郭と前記所定の記号の輪郭が近似し、前記第3処理によって抽出された輪郭を構成する複数の輪郭点を直線変換することにより互いに交差する2本の直線が検出され、且つ前記第3処理によって抽出された輪郭で囲まれた領域面積と前記所定の記号の面積との面積差が所定値以下である又は前記第3処理によって抽出された輪郭で囲まれた領域面積の2倍が矩形の記号の面積と略同一である場合に、前記第1処理で塗りつぶされた領域を前記所定の記号として識別する第4処理とを実行することを特徴とする。
【0007】
本発明を実行するコンピュータは、画像データを入力として、記号の識別の結果を出力する学習モデルを用いて、記号の識別の結果を取得してもよい。学習モデルは、ニューラルネットワークなどの公知の機械学習アルゴリズムを利用して生成する。
【発明の効果】
【0008】
本発明によれば、記号の識別精度を向上させることができる。
【図面の簡単な説明】
【0009】
【
図1】
図1は、情報処理装置の構成を示すブロック図である。
【
図2】
図2は、情報処理装置で実行される記号識別処理を示すフローチャートである。
【
図3】
図3(A)は
図2のステップS2に対応する塗りつぶし処理の一例を示す図である。
図3(B)は
図2のステップS3に対応する膨張処理の一例を示す図である。
図3(C)は
図2のステップS4に対応する輪郭抽出処理の一例を示す図である。
図3(D)は
図2のステップS6に対応する直線処理の一例を示す図である。
図3(E)及び
図3(F)は
図2のステップS7に対応する面積比較処理の例を示す図である。
【発明を実施するための形態】
【0010】
以下、本発明を実施するための形態について図面を参照して説明する。
【0011】
図1は、情報処理装置の構成を示すブロック図である。
図1の情報処理装置100は、プロセッサとしてのCPU(Central Processing Unit)101と、メモリとしてのRAM(Random Access Memory)102及びROM(Read Only Memory)103と、HDD(Hard Disk Drive)104と、インタフェース(IF)105と、ネットワークインタフェース(IF)106と、表示装置107とを備えている。情報処理装置100は、例えば、コンピュータ、サーバまたはスマートフォンによって実現することができる。CPU101は、バス108を介してRAM102、ROM103、HDD104、IF105、ネットワークIF106及び表示装置107に接続されている。
【0012】
IF105は、例えばUSB(Universal Serial Bus)であり、撮像装置としてのカメラ110に接続されている。本実施の形態では、カメラ110は、情報処理装置100の外部に接続されているが、情報処理装置100に内蔵されていてもよい。ネットワークIF106は、情報処理装置100を外部のネットワークに接続するためのインタフェースである。カメラ110は、ネットワークIF106を介して情報処理装置100に接続されていてもよい。表示装置107は、記号識別処理を実行するアプリケーションを表示する。記号識別処理は、文字、数字及び記号を識別する文字認識処理の中に含まれていてもよい。また、表示装置107は、画像データ内の記号に対応する位置に、記号識別処理を実行するためのアプリケーションで編集可能な記号を表示したり、又は画像データ内の記号に対応する、記号識別処理を実行するためアプリケーションで編集可能な記号がない場合には、その旨を表示する。
【0013】
HDD104は、各種の画像処理、記号識別処理を実行するためのアプリケーションまたはプログラムを記憶する。さらに、HDD104は、情報処理装置100内の図面作成アプリケーションで作成された図面、カメラ110で撮影された図面、およびネットワークIF106を介して外部装置や外部メモリから入力された図面を記憶する。なお、上記プログラムは後述するフローチャートに応じたものである。さらに、HDD104は、各種の画像処理の結果や記号識別処理の結果を記憶する。HDD104に代えて、SSD(Solid State Drive)を採用してもよい。
【0014】
図2は、情報処理装置100で実行される記号識別処理を示すフローチャートである。
図2の記号識別処理は、HDD104に格納されたプログラムに基づいてCPU101によって実現される。
図3(A)は
図2のステップS2に対応する塗りつぶし処理の一例を示し、
図3(B)は
図2のステップS3に対応する膨張処理の一例を示し、
図3(C)は
図2のステップS4に対応する輪郭抽出処理の一例を示し、
図3(D)は
図2のステップS6に対応する直線処理の一例を示し、
図3(E)及び
図3(F)は
図2のステップS7に対応する面積比較処理の例を示す。
【0015】
まず、CPU101は、HDD104に格納された図面を画像データに変換する(ステップS1)。具体的には、図面のフォーマット(pdfやアプリケーション特有のフォーマットなど)を画像データのフォーマット(bmp、gif、jpeg、tiffなど)に変換する。この際、カラーのデータは二値化された白黒の画像データに変換される。変換された画像データはRAM102又はHDD104に保存される。
【0016】
次に、CPU101は、画像データ内の線で囲まれている領域を塗りつぶす(ステップS2)。例えば、
図3(A)に示すように、三角形の記号が線とつながっている場合には、CPU101は三角形の領域を塗りつぶす。なお、
図3(A)~
図3(F)では、塗りつぶした領域をハッチングで示す。
【0017】
次いで、CPU101は、塗りつぶされた領域に膨張処理を施す(ステップS3)。膨張処理は、変換対象画素と当該変換対象画素を囲む周辺画素に白があれば、変換対象画素を白に変換し、変換対象画素と周辺画素に白が無い場合は、変換対象画素を黒として維持する処理である。この塗りつぶされた領域に膨張処理を施すと、
図3(B)に示すように、三角形の領域は小さくなるが、塗りつぶされた領域の大部分は残る。塗りつぶされた領域は、
図3(A)の線から離れた黒の塊となる。このように、塗りつぶされた領域を、線から離れた黒の塊にすることができるため、記号の識別精度を向上させることができる。
【0018】
次いで、CPU101は、膨張処理が施された領域の輪郭を抽出する(ステップS4)。ここでは、CPU101は、
図3(C)に示すように、膨張処理が施された領域(黒)と塗りつぶされていない領域(白)との境目の輪郭点群を選択し、膨張処理が施された領域の輪郭とする。
図3(C)に示すように、膨張処理が施された領域の水平部分の直線は2点で表現されるので、膨張処理が施された領域の輪郭はV字型になる。また、膨張処理が施された領域の輪郭を示す輪郭点の個数は、3個以上であり、
図3(C)~
図3(E)の例に限定されるものではない。
【0019】
次いで、CPU101は、ステップS4で抽出された、膨張処理が施された輪郭と所定の記号(ここでは正三角形)の輪郭が近似するか否かを判定する(ステップS5)。ここでは、
図3(C)に示す左上、右上、最底辺部の3か所の輪郭点で構成される三角形が正三角形に近似する場合、すなわち3つの内角が60度±5度以内に収まる場合に、CPU101は、ステップS4で抽出された輪郭と所定の記号の輪郭が近似する(ステップS5でYES)と判定する。
【0020】
ステップS4で抽出された輪郭と所定の記号の輪郭が近似しない場合には(ステップS5でNO)、CPU101は、ステップS2で塗りつぶされた領域に対応する記号がないと判断し、塗りつぶされた領域に対応する記号がない旨を表示装置107に表示し(ステップS9)、本処理を終了する。
【0021】
ステップS4で抽出された輪郭と所定の記号の輪郭が近似する場合には(ステップS5でYES)、CPU101は、ステップS4で抽出された輪郭を構成する複数の輪郭点を直線変換することにより、互いに交差する2本の直線が検出されるか否かを判定する(ステップS6)。ここでは、
図3(D)に示すように、直線変換(ハフ変換)により互いに交差する2本の直線を検出できるか否かを判定している。この処理では、抽出された輪郭が三角形であるか否かを多面的に判断している。
【0022】
互いに交差する2本の直線が検出されない場合には(ステップS6でNO)、上記ステップS9に進む。
【0023】
互いに交差する2本の直線が検出された場合には(ステップS6でYES)、CPU101は、ステップS4で抽出された輪郭で囲まれた領域面積と所定の記号の面積との面積差が所定値以下であるか又はステップS4で抽出された輪郭で囲まれた領域面積の2倍が矩形の記号の面積と略同一であるかを判定する(ステップS7)。なお、ステップS4で抽出された輪郭で囲まれた領域面積の2倍が矩形の記号の面積の90~110%の範囲に含まれる場合に、略同一であると判断される。
【0024】
ステップS7では、
図3(E)に示すように、ステップS4で抽出された輪郭で囲まれた領域面積と所定の記号の面積との面積比較処理が行われている。または、
図3(F)に示すように、ステップS4で抽出された輪郭で囲まれた領域面積を2倍した形状と矩形の記号との面積比較処理が行われている。
図3(F)の面積比較処理では、記号の識別結果として、Tの文字を排除できる。
【0025】
ステップS4で抽出された輪郭で囲まれた領域面積と所定の記号の面積との面積差が所定値以下でない場合又はステップS4で抽出された輪郭で囲まれた領域面積の2倍が矩形の記号の面積と略同一でない場合(ステップS7でNO)、上記ステップS9に進む。
【0026】
ステップS4で抽出された輪郭で囲まれた領域面積と所定の記号の面積との面積差が所定値以下である場合又はステップS4で抽出された輪郭で囲まれた領域面積の2倍が矩形の記号の面積と略同一である場合には(ステップS7でYES)、CPU101は、ステップS2で塗りつぶされた領域を所定の記号として識別し、画像データ内の塗りつぶされた領域に対応する位置に所定の記号を表示し(ステップS8)、本処理を終了する。
【0027】
ステップS8では、記号識別処理を実行するためのアプリケーション内で記号が表示されるため、所定の記号は、画像データ内の塗りつぶされた領域に重なるように、白黒以外の色(例えば赤色)で表示される。
【0028】
図2のステップS1~ステップS9の処理は、機械学習により実行してもよい。この場合、情報処理装置100は、例えば、図面から変換された画像データを入力として、記号識別処理の結果を出力する学習モデルを用いて、記号識別の結果を取得する。学習モデルは、ニューラルネットワークなどの公知の機械学習アルゴリズムを利用して生成する。機械学習アルゴリズムに入力する教師データは、例えば、様々な画像データをHDD104に予め用意し、画像データに記号識別処理の結果を紐づけることで作成することができる。
【0029】
以上説明したように、本実施形態によれば、情報処理装置100が実行する記号識別方法は、画像データ内の線で囲まれている領域を塗りつぶす第1処理(ステップS2)と、第1処理で塗りつぶされた領域に膨張処理を施す第2処理(ステップS3)と、第1処理で塗りつぶされた領域の輪郭を抽出する第3処理(ステップS4)と、第3処理によって抽出された輪郭と所定の記号の輪郭との比較の結果が、第3処理によって抽出された輪郭と所定の記号の輪郭が近似し、第3処理によって抽出された輪郭を構成する複数の輪郭点を直線変換することにより互いに交差する2本の直線が検出され、且つ第3処理によって抽出された輪郭で囲まれた領域面積と所定の記号の面積との面積差が所定値以下である又は第3処理によって抽出された輪郭で囲まれた領域面積の2倍が矩形の記号の面積と略同一である場合に(ステップS5~7でYES)、第1処理で塗りつぶされた領域を所定の記号として識別する第4処理(ステップS8)とを含む。
【0030】
情報処理装置100が上記の第1処理から第4処理を実行することで、塗りつぶされた領域を、塗りつぶされた領域につながっていた直線や文字などから分離でき、直線や文字との区別を容易にできるので、記号の識別精度を向上させることができる。
【0031】
以上本発明の好ましい実施形態について詳述したが、本発明は係る特定の実施形態に限定されるものではなく、特許請求の範囲に記載された本発明の要旨の範囲内において、種々の変形・変更が可能である。
【符号の説明】
【0032】
100 情報処理装置
101 CPU
102 RAM
103 ROM
104 HDD
105 インタフェース
106 ネットワークインタフェース
107 表示装置
108 バス
110 カメラ