(19)【発行国】日本国特許庁(JP)
(12)【公報種別】特許公報(B2)
(11)【特許番号】
(24)【登録日】2024-04-19
(45)【発行日】2024-04-30
(54)【発明の名称】テキスト生成方法およびテキスト生成システム
(51)【国際特許分類】
G06T 7/60 20170101AFI20240422BHJP
G06T 7/00 20170101ALI20240422BHJP
【FI】
G06T7/60 180A
G06T7/00 U
(21)【出願番号】P 2021534838
(86)(22)【出願日】2020-07-09
(86)【国際出願番号】 IB2020056441
(87)【国際公開番号】W WO2021014256
(87)【国際公開日】2021-01-28
【審査請求日】2023-06-22
(31)【優先権主張番号】P 2019133273
(32)【優先日】2019-07-19
(33)【優先権主張国・地域又は機関】JP
(73)【特許権者】
【識別番号】000153878
【氏名又は名称】株式会社半導体エネルギー研究所
(72)【発明者】
【氏名】秋元 健吾
(72)【発明者】
【氏名】桃 純平
(72)【発明者】
【氏名】福留 貴浩
【審査官】小太刀 慶明
(56)【参考文献】
【文献】特開平07-028827(JP,A)
【文献】米国特許出願公開第2017/0185835(US,A1)
【文献】石原 辰也,プレゼンテーション文書の構造化のためのメタ情報の自動付加手法,電子情報通信学会技術研究報告,日本,社団法人電子情報通信学会,2005年10月21日,Vol. 105, No. 373,pp. 1-6
(58)【調査した分野】(Int.Cl.,DB名)
G06T 7/00
11/80
G06F 40/166
40/56
16/90
(57)【特許請求の範囲】
【請求項1】
第1のオブジェクトからテキストを生成するテキスト生成方法であって、
前記テキスト生成方法は、コンピュータ装置が有するプロセッサを用いて行われ、
前記第1のオブジェクトは、第2のオブジェクトと第3のオブジェクトとを有し、
前記第2のオブジェクトの座標情報を抽出するステップを有し、
前記第3のオブジェクトの座標情報を抽出するステップを有し、
前記第2のオブジェクトと前記第3のオブジェクトの座標情報から位置関係を抽出するステップを有し、
前記第2のオブジェクトと前記第3のオブジェクトの位置関係をグラフ情報に変換するステップを有し、
前記グラフ情報から前記第2のオブジェクトと前記第3のオブジェクトとの位置関係をテキストとして生成するステップを有するテキスト生成方法。
【請求項2】
画像処理部、特徴抽出部、グラフ生成部、テキスト生成部、およびGUIを有するテキスト生成システムであって、
前記画像処理部が、
前記GUIを介して入力する情報によって形成する第2のオブジェクトと第3のオブジェクトとを用いて第1のオブジェクトを生成する
機能を有し、
前記第2のオブジェクトの座標情報を抽出する
機能を有し、
前記第3のオブジェクトの座標情報を抽出する
機能を有し、
前記特徴抽出部が、
前記第2のオブジェクトと前記第3のオブジェクトの座標情報から位置関係を抽出する
機能を有し、
前記グラフ生成部が、
前記特徴抽出部によって抽出された前記第2のオブジェクトと前記第3のオブジェクトの位置関係をグラフ情報に変換する
機能を有し、
前記グラフ情報を前記GUIに表示する
機能を有し、
前記テキスト生成部が、
前記グラフ情報から前記第2のオブジェクトと前記第3のオブジェクトとの位置関係をテキストとして生成する
機能を有し、
前記テキストを前記GUIに表示する
機能を有するテキスト生成システム。
【請求項3】
画像処理部、特徴抽出部、グラフ生成部、テキスト生成部、およびGUIを有するテキスト生成システムであって、
前記画像処理部が、
前記GUIを介して入力する情報によって形成する第2のオブジェクトと第3のオブジェクトとを用いて第1のオブジェクトを生成する
機能を有し、
前記GUIが表示する前記第1のオブジェクトの指定した範囲を抽出する
機能を有し、
前記指定した範囲内の前記第2のオブジェクトの座標情報を抽出する
機能を有し、
前記指定した範囲内の前記第3のオブジェクトの座標情報を抽出する
機能を有し、
前記特徴抽出部が、
前記第2のオブジェクトと前記第3のオブジェクトの座標情報から位置関係を抽出する
機能を有し、
前記グラフ生成部が、
前記特徴抽出部によって抽出された前記第2のオブジェクトと前記第3のオブジェクトの位置関係をグラフ情報に変換する
機能を有し、
前記グラフ情報を前記GUIに表示する
機能を有し、
前記テキスト生成部が、
前記グラフ情報から前記第2のオブジェクトと前記第3のオブジェクトとの位置関係をテキストとして生成する
機能を有し、
前記テキストを前記GUIに表示する
機能を有するテキスト生成システム。
【請求項4】
請求項2または請求項3において、
さらに、複数のオブジェクトが登録されたデータベースを有し、
前記GUIを介し、前記データベースに登録された前記複数のオブジェクトからいずれかーを選択する
機能を有し、
前記選択されたオブジェクトを、前記第1のオブジェクトとして前記GUIに表示し、且つ前記画像処理部に与える
機能を有するテキスト生成システム。
【請求項5】
請求項2または請求項3において、
前記特徴抽出部が、
前記第2のオブジェクトの座標情報から垂直方向の最小の第1の座標を検出する
機能を有し、
前記第3のオブジェクトの座標情報から垂直方向の最小の第2の座標を検出する
機能を有し、
前記第1の座標を前記第2の座標と比較することで前記第2のオブジェクトが前記第3のオブジェクトに対する位置関係を抽出する
機能を有するテキスト生成システム。
【請求項6】
請求項2乃至請求項4において、
前記第1のオブジェクトがラスタ画像の場合、ベクタ画像に変換する
機能を有し、
前記第1のオブジェクトがベクタ画像の場合、前記第1のオブジェクトをラスタ画像に変換した後、ベクタ画像に変換する
機能を有するテキスト生成システム。
【発明の詳細な説明】
【技術分野】
【0001】
本発明の一態様は、オブジェクトをテキストに変換させるテキスト生成方法に関する。また、本発明の一態様は、オブジェクトをグラフ情報に変換し、当該グラフ情報をテキストに変換するテキスト生成方法に関する。また、本発明の一態様は、コンピュータ装置を利用したオブジェクトをテキストに変換させるテキスト生成システムに関する。また、本発明の一態様は、オブジェクトで構成される図面などの内容をテキスト化するためのテキスト生成システムに関する。
【背景技術】
【0002】
近年、人工知能(AI:Artificial Intelligence)を用いた画像認識の開発が進められている。例えば、画像に被写体として何が写っているかの認識率は向上し続けている。ただし、AIは、学習済の内容については対応できるが学習したことのない画像から画像に含まれる構成要素などを認識するまたは説明するのが難しい。例えば、製品仕様書、組図、または特許の公報などの書類には、複数の図面が含まれる。それぞれの図面には、複数の構成要素が含まれる。当該書類に用いられる図面をわかりやすく説明するには、熟練した技術者の知識、ノウハウ、または経験などが必要である。
【0003】
例えば、情報処理の分野では、複数の構成要素をグラフと呼ばれるデータ構造によって説明する方法が提案されている。グラフは頂点(ノード)と辺(エッジ)の集合からなり、例えば、物の構成要素間の関係だけでなく、コミュニティにおける人と人との繋がりや、交通網など、多様な関係の表現手段に用いられる(特許文献1)。
【先行技術文献】
【特許文献】
【0004】
【発明の概要】
【発明が解決しようとする課題】
【0005】
ここでは、製品模式図、組図、または特許出願に含まれる図面などは、ぞれぞれの図面の特徴を捉えて文書(テキスト)化する必要がある。例えば特許の明細書に含まれる図面の説明は、図面に含まれる複数のオブジェクトの位置関係などが重要な意味を有する。ただし、オブジェクト間の位置関係を定義(説明)する範囲については、ばらつきが生じやすい課題がある。また、図形作成プログラムを使用して描画もしくは作図する場合、人間の目には表示された二つのオブジェクトが重なっているように見えても、図形作成プログラム上では、二つのオブジェクトが重なっている場合、または二つのオブジェクトが接していない場合、などの状態が発生する課題がある。
【0006】
上記課題に鑑み、本発明の一態様は、オブジェクトをテキストに変換させるテキスト生成方法を提供することを課題の一とする。また、本発明の一態様は、オブジェクトをグラフ情報に変換し、当該グラフ情報をテキストに変換するテキスト生成方法を提供することを課題の一とする。また、本発明の一態様は、コンピュータ装置を利用したオブジェクトをテキストに変換させるテキスト生成システムを提供することを課題の一とする。また、本発明の一態様は、複数のオブジェクトで構成される図面などの内容をテキスト化するためのテキスト生成システムを提供することを課題の一とする。
【0007】
なお、これらの課題の記載は、他の課題の存在を妨げるものではない。なお、本発明の一態様は、これらの課題の全てを解決する必要はないものとする。なお、これら以外の課題は、明細書、図面、請求項などの記載から、自ずと明らかとなるものであり、明細書、図面、請求項などの記載から、これら以外の課題を抽出することが可能である。
【課題を解決するための手段】
【0008】
本発明の一態様は、第1のオブジェクトからテキストを生成するテキスト生成方法である。第1のオブジェクトは、第2のオブジェクトと第3のオブジェクトとを有する。第2のオブジェクトの座標情報を抽出するステップを有する。第3のオブジェクトの座標情報を抽出するステップを有する。第2のオブジェクトと第3のオブジェクトの座標情報から位置関係を抽出するステップを有する。第2のオブジェクトと第3のオブジェクトの位置関係をグラフ情報に変換するステップを有する。グラフ情報から第2のオブジェクトと第3のオブジェクトとの位置関係をテキストとして生成するステップを有するテキスト生成方法である。
【0009】
本発明の一態様は、画像処理部、特徴抽出部、グラフ生成部、テキスト生成部、およびGUIを有するテキスト生成システムである。画像処理部が、GUIを介して入力する情報によって形成する第2のオブジェクトと第3のオブジェクトとを用いて第1のオブジェクトを生成するステップを有し、第2のオブジェクトの座標情報を抽出するステップを有し、第3のオブジェクトの座標情報を抽出するステップを有する。特徴抽出部が、第2のオブジェクトと第3のオブジェクトの座標情報から位置関係を抽出するステップを有する。グラフ生成部が、特徴抽出部によって抽出された第2のオブジェクトと第3のオブジェクトとの位置関係をグラフ情報に変換するステップを有し、グラフ情報をGUIに表示するステップを有する。テキスト生成部が、グラフから第2のオブジェクトと第3のオブジェクトとの位置関係をテキストとして生成するステップを有する。テキストをGUIに表示するステップを有するテキスト生成システムである。
【0010】
本発明の一態様は、画像処理部、特徴抽出部、グラフ生成部、テキスト生成部、およびGUIを有するテキスト生成システムである。画像処理部が、GUIを介して入力する情報によって形成する第2のオブジェクトと第3のオブジェクトとを用いて第1のオブジェクトを生成するステップを有し、GUIが表示する第1のオブジェクトの指定した範囲を抽出するステップを有し、指定した範囲内の第2のオブジェクトの座標情報を抽出するステップを有し、指定した範囲内の第3のオブジェクトの座標情報を抽出するステップを有する。特徴抽出部が、第2のオブジェクトと第3のオブジェクトの座標情報から位置関係を抽出するステップを有する。グラフ生成部が、特徴抽出部によって抽出された第2のオブジェクトと第3のオブジェクトの位置関係をグラフ情報に変換するステップを有し、グラフ情報をGUIに表示するステップを有する。テキスト生成部が、グラフ情報から第2のオブジェクトと第3のオブジェクトとの位置関係をテキストとして生成するステップを有し、テキストをGUIに表示するステップを有するテキスト生成システムである。
【0011】
上記各構成において、テキスト生成システムは、さらに、複数のオブジェクトが登録されたデータベースを有する。また、GUIを介し、データベースに登録された複数のオブジェクトからいずれか一を選択するステップを有する。また、選択されたオブジェクトを、第1のオブジェクトとしてGUIに表示し、且つ画像処理部に与えるステップを有することが好ましい。
【0012】
上記各構成において、特徴抽出部が、第2のオブジェクトの座標情報から垂直方向の最小の第1の座標を検出するステップを有し、第3のオブジェクトの座標情報から垂直方向の最小の第2の座標を検出するステップを有し、第1の座標を第2の座標と比較することで第2のオブジェクトが第3のオブジェクトに対する位置関係を抽出するステップを有することが好ましい。
【0013】
上記各構成において、第1のオブジェクトがラスタ画像の場合、ベクタ画像に変換するステップを有する。第1のオブジェクトがベクタ画像の場合、第1のオブジェクトをラスタ画像に変換した後、ベクタ画像に変換するステップを有することが好ましい。
【発明の効果】
【0014】
上記問題に鑑み、本発明の一態様は、オブジェクトをテキストに変換させるテキスト生成方法を提供することができる。また、本発明の一態様は、オブジェクトをグラフ情報に変換し、当該グラフ情報をテキストに変換するテキスト生成方法を提供することができる。また、本発明の一態様は、コンピュータ装置を利用したオブジェクトをテキストに変換させるテキスト生成システムを提供することができる。また、本発明の一態様は、複数のオブジェクトで構成される図面などの内容をテキスト化するためのテキスト生成システムを提供することができる。
【0015】
なお本発明の一態様の効果は、上記列挙した効果に限定されない。上記列挙した効果は、他の効果の存在を妨げるものではない。なお他の効果は、以下の記載で述べる、本項目で言及していない効果である。本項目で言及していない効果は、当業者であれば明細書又は図面などの記載から導き出せるものであり、これらの記載から適宜抽出することができる。なお、本発明の一態様は、上記列挙した効果、及び/又は他の効果のうち、少なくとも一つの効果を有するものである。したがって本発明の一態様は、場合によっては、上記列挙した効果を有さない場合もある。
【図面の簡単な説明】
【0016】
図1は、テキスト生成システムを説明する図である。
図2は、テキスト生成方法を説明するフローチャートである。
図3は、テキスト生成方法を説明するフローチャートである。
図4は、イメージ図に含まれるオブジェクトを説明する図である。
図5は、オブジェクトを展開して説明する図である。
図6Aは、オブジェクトの位置情報を抽出する方法を説明する図である。
図6Bは、オブジェクトの位置情報を抽出する方法を説明する図である。
図7は、グラフ情報を説明する図である。
図8は、テキスト情報を説明する図である。
図9は、テキスト生成システムを説明する図である。
図10は、テキスト生成方法を説明するフローチャートである。
図11Aは、オブジェクトを説明する図である。
図11Bは、テキスト情報を説明する図である。
図12は、テキスト生成システムを説明する図である。
【発明を実施するための形態】
【0017】
実施の形態について、図面を用いて詳細に説明する。但し、本発明は以下の説明に限定されず、本発明の趣旨及びその範囲から逸脱することなくその形態及び詳細を様々に変更し得ることは当業者であれば容易に理解される。したがって、本発明は以下に示す実施の形態の記載内容に限定して解釈されるものではない。
【0018】
なお、以下に説明する発明の構成において、同一部分又は同様な機能を有する部分には同一の符号を異なる図面間で共通して用い、その繰り返しの説明は省略する。また、同様の機能を指す場合には、ハッチパターンを同じくし、特に符号を付さない場合がある。
【0019】
また、図面において示す各構成の、位置、大きさ、範囲などは、理解の簡単のため、実際の位置、大きさ、範囲などを表していない場合がある。このため、開示する発明は、必ずしも、図面に開示された位置、大きさ、範囲などに限定されない。
【0020】
また、本明細書にて用いる「第1」、「第2」、「第3」という序数詞は、構成要素の混同を避けるために付したものであり、数的に限定するものではないことを付記する。
【0021】
なお、本明細書では、製品模式図、組図、または特許出願に含まれる図面などに着目して説明する。ただし、当該図面だけに限定されない。複数の構成要素を有する建築物、複数の部品、材料、製品などを収納する倉庫などの在庫管理システムにも適用することができる。
【0022】
(実施の形態)
本発明の一態様は、オブジェクトからテキストを生成する方法である。まず、本発明の一態様で扱うオブジェクトについて説明する。当該オブジェクトは、コンピュータシステムが有する表示装置に表示される画像の一部を構成する図形、線、テキストなどである。
【0023】
オブジェクトは、図形作成プログラムなどを用いて作成したデータを用いることができる。また、オブジェクトは、PDF(Portable Document Format)、またはJPEG(Joint Photographic Experts Group)などのフォーマットを用いてデータを圧縮して保存されるデータを用いることができる。
【0024】
オブジェクトは、ベクタ画像と、ラスタ画像とに分類することができる。例えば、ベクタ画像はパスで記述されていることを特徴としている。当該パスは、直線、方形、ベジエ曲線などで構成される。よって、ベクタ画像は、オブジェクトの詳細な座標情報を有すると言い換えてもよい。なお、当該パスには、図形を記述するだけでなく、ハッチング(もしくは、塗りつぶし)などのプロパティを含むことができる。よって、当該パスを用いて記述されるオブジェクトは、ユーザがオブジェクトに対してハッチングなどの情報を付与することで様々な状態、組成、材質などの情報をオブジェクトに対して付与することができる。
【0025】
ラスタ画像は、画像データが格子状(グリッド)に並んだピクセル(画素)の集合体であらわされる。なお、JPEGなどを用いてオブジェクトを保存する場合、オブジェクトなどが重なっている状態でラスタ画像として保存すると表示されている情報のみが保存される。言い換えると、複数のオブジェクトが重ね合わさって配置された場合、表示面に表示されているオブジェクトの情報は記憶され、重ね合わさることで非表示になっている部分のオブジェクトのデータは失われる。本発明の一態様では、最初に、オブジェクトがベクタ画像の場合について説明する。なお、ラスタ画像を用いる例については、
図3を用いて詳細に説明する。
【0026】
本実施の形態では、図形作成プログラムなどを用いて作成した第1のオブジェクトの位置関係の情報を説明するテキストを生成する方法について説明する。なお、図形作成プログラムは、コンピュータシステムが有するコンピュータ装置、表示装置、入力装置を用いてユーザが図形を描画し、ベクタ画像を作成することができる。したがって、第1のオブジェクトから、第1のオブジェクトの位置関係の情報を説明するテキストを生成する方法を、テキスト生成システムと言い換えてもよい。
【0027】
なお、図形作成プログラムは、コンピュータ装置が有する記憶装置に記憶される。図形作成プログラムは、コンピュータ装置が有するプロセッサを利用して、第1のオブジェクトの位置関係の情報を説明するテキストの生成およびユーザが入力装置を介して指示したオブジェクトの描画または記憶を実施することができる。なお、以降において、説明を簡便にするためにコンピュータ装置または図形作成プログラムについての説明は省略する場合がある。
【0028】
本発明の一態様の処理手順について説明する。第1のオブジェクトは、図形作成プログラムなどによって生成される。したがって、第1のオブジェクトはベクタ画像であることが好ましい。また、第1のオブジェクトは、第2のオブジェクトと第3のオブジェクトとによって構成される。
【0029】
次に、第2のオブジェクトと第3のオブジェクトの座標位置の情報を抽出するステップを有する。第2のオブジェクトと第3のオブジェクトの座標位置の情報から位置関係を抽出するステップを有する。第2のオブジェクトと第3のオブジェクトの位置関係は、上下左右、内包する、内包しない、接する、または接しないなど、詳細に区別できることが好ましい。
【0030】
次に、第2のオブジェクトと第3のオブジェクトの位置関係をグラフ情報に変換するステップを有する。グラフ情報には、第2のオブジェクトと第3のオブジェクトの位置関係を詳細に区別する情報が含まれる。当該グラフ情報から第2のオブジェクトと第3のオブジェクトとの位置関係をテキストとして生成するステップを有する。図形作成プログラムは、上述する手順を備えることで第1のオブジェクトから第1のオブジェクトを説明するテキストを生成することができる。なお、第1のオブジェクトから第1のオブジェクトを説明するテキストを生成するプログラムは、図形作成プログラムとは異なるプログラムによって処理されてもよい。または第1のオブジェクトから第1のオブジェクトを説明するテキストを生成するプログラムは、図形作成プログラムに含まれてもよい。
【0031】
続いて、第1のオブジェクトから第1のオブジェクトを説明するテキストを生成する方法およびシステムについて
図1乃至
図12を用いて説明する。
【0032】
図1で説明するオブジェクトからテキストを生成するテキスト生成システム100は、GUI(Graphical User Interface)110、画像処理部120、特徴抽出部130、グラフ生成部140、テキスト生成部150、およびデータベース160を有する。なお、GUI110は、表示装置にオブジェクトを表示する機能、図形作成のための描画ツール、オブジェクトの保存または読み出しなどの機能などを提供するプログラムである。GUI110は、図形作成プログラムに含まれることが好ましい。
【0033】
ユーザは、GUI110を介して第1のオブジェクトを生成することができる。もしくは、ユーザは、データベース160に記憶されている複数のオブジェクトからいずれか一のオブジェクトを選択し、第1のオブジェクトとすることができる。
【0034】
画像処理部120には、GUI110を介して第1のオブジェクトのオブジェクト情報が与えられる。なお、第1のオブジェクトは、複数のオブジェクトによって構成される。画像処理部120は、当該オブジェクト情報から座標情報の抽出、ラスタ画像からベクタ画像への変換、ベクタ画像からラスタ画像への変換、ノイズ除去、または第1のオブジェクトの選択範囲の指定などの機能を有する。当該ノイズ除去は、複数のオブジェクトが重なる領域を除去する。なお、当該選択範囲が指定された場合、当該選択範囲内に含まれるオブジェクトのみをテキスト情報に変換する機能を有する。なお、画像処理部120は、ベクタ画像のオブジェクト情報を出力する。
【0035】
特徴抽出部130には、画像処理部120から当該オブジェクト情報が与えられる。当該特徴抽出部130は、各オブジェクトの位置関係を抽出する。各オブジェクトが有するオブジェクト情報には座標位置の情報が含まれるため、各座標位置の情報を比較することでオブジェクトの位置関係を抽出する。なお、位置関係の情報には、上下左右、内包する、内包しない、接する、または接しないなどのいずれか一もしくは複数が選択される。なお、各オブジェクトの位置関係を抽出する方法は、
図6で詳細に説明する。
【0036】
グラフ生成部140には、それぞれのオブジェクト情報と、位置関係の情報とが与えられる。グラフ生成部140は、それぞれ各オブジェクトの位置関係の情報をもとに第1のオブジェクトを説明するためのグラフ情報141を生成する。なお、グラフ生成部140は、GUI110にグラフ情報141を表示することができる。なお、グラフ情報141の生成例については、
図7で詳細に説明する。
【0037】
テキスト生成部150は、グラフ情報141からテキスト情報151を生成する。テキスト生成部150は、GUI110にテキスト情報151を表示することができる。よって、ユーザが生成した第1のオブジェクトが意図した関係で構成されているかを、グラフ情報141、またはテキスト情報151を用いて確認することができる。また、それぞれのオブジェクトが接しているか確認することができる。さらに、複数のオブジェクトが重なる領域を有していないかを確認することができる。なお、グラフ情報141から生成したテキスト情報151については、
図8で詳細に説明する。
【0038】
図2は、
図1で説明したオブジェクトからテキストを生成するテキスト生成システム100の動作を説明するフローチャートである。なお、画像は、第1のオブジェクトとして扱うことが出来る。以降では、当該第1のオブジェクトが第2のオブジェクトおよび第3のオブジェクトによって構成される場合について説明する。または、第2のオブジェクトと第3のオブジェクトとを用いて第1のオブジェクトを生成すると言い換えてもよい。
【0039】
ステップS01は、GUI110を介してユーザが画像を第1のオブジェクトとして入力するステップである。または、GUI110を介してデータベース160に記憶されている複数の画像のいずれか一を選択し、選択された画像を第1のオブジェクトとすることができる。
【0040】
ステップS02は、第1のオブジェクトに含まれる第2および第3のオブジェクトを抽出するステップである。抽出される第2および第3のオブジェクトには、それぞれ異なるオブジェクト情報が含まれる。
【0041】
ステップS03は、当該オブジェクト情報に含まれる座標情報を抽出するステップである。なお、各オブジェクトはベクタ画像であることが好ましい。ベクタ画像を用いることで容易に座標情報を抽出することができる。
【0042】
ステップS04は、各オブジェクト間の位置関係の情報を取得するステップである。各オブジェクト情報には座標情報が含まれるため、例えば、第2のオブジェクトの最小y座標と、第3のオブジェクトの最小y座標を比較することで第2のオブジェクトに対する第3のオブジェクトの位置関係の情報を抽出する。また、第2のオブジェクトの最小y座標と、第3のオブジェクトの最大y座標を比較することで第2のオブジェクトに対する第3のオブジェクトの位置関係の情報を抽出する。位置関係の情報は、上述したようにオブジェクトが有する様々な座標を比較することで、上下左右、内包する、内包しない、接する、または接しないなどを抽出することができる。なお、位置関係の情報は、上下左右、内包する、内包しない、接する、または接しないなどのいずれか一もしくは複数を抽出結果として与えることができる。
【0043】
ステップS05は、ステップS04で抽出した第2のオブジェクトに対する第3のオブジェクトの位置関係をグラフ構造に変換し、グラフ情報141を生成する。なお、生成したグラフ情報141は、GUI110に表示することができる。
【0044】
ステップS06は、ステップS05で生成したグラフ情報141からテキスト情報151を生成する。なお、生成したテキスト情報151は、GUI110に表示することができる。
【0045】
図3は、
図2とは異なるオブジェクトからテキストを生成するテキスト生成システム100の動作を説明するフローチャートである。なお、以下に説明する発明の構成において、同一部分又は同様な機能を有する部分には同一の符号を異なる図面間で共通して用い、その繰り返しの説明は省略する。
【0046】
図3は、第2のオブジェクトと第3のオブジェクトとが重なる領域を有する第1のオブジェクトについて説明する。例えば表示装置に当該第1のオブジェクトを表示させた場合、第2のオブジェクトと第3のオブジェクトとに与えられるそれぞれの表示のプロパティ(例えばオブジェクトの重ね合わせの順番)にしたがって表示装置に表示される。しかし、オブジェクトの位置関係をテキスト情報に変換して出力する場合、コンピュータ装置は第2のオブジェクトまたは第3のオブジェクトのいずれが有効な状態なのか判断がつきにくい。
【0047】
よって、ステップS01は、第2のオブジェクトと第3のオブジェクトとが重なる領域を有する場合の対策として、さらに複数のステップを有する。
【0048】
ステップSF01は、GUI110を介して画像が入力されるステップである。または、GUI110を介してデータベース160に記憶されている複数の画像のいずれか一を選択し、選択された画像を第1のオブジェクトとすることができる。よって、
図2のステップS01と同じ機能を有する。
【0049】
ステップSF02は、第1のオブジェクトがラスタ画像であるかを判断するステップである。第1のオブジェクトがラスタ画像の場合は、第2のオブジェクトと第3のオブジェクトとが重なる領域は有さない。したがって、ステップSF03に移行する。
【0050】
ただし、第1のオブジェクトがベクタ画像の場合は、第2のオブジェクトと第3のオブジェクトとが重なる領域を有する場合がある。したがって、ステップSF04に移行し、当該第1のオブジェクトをベクタ画像からラスタ画像に変換する。当該第1のオブジェクトをラスタ画像に変換することで表示のプロパティに従って重なり合う領域の下層に位置するオブジェクト情報は除去される。次にステップSF03に移行する。
【0051】
ステップSF03は、ラスタ画像である第1のオブジェクトをベクタ画像に変換するステップである。第1のオブジェクト画像の中で重なり合う領域の情報は、ベクタ画像からラスタ画像へ変換する過程で除去される。次にステップS02に移行する。以降は、
図2のフローチャートと処理が同じなため説明を省略する。
【0052】
図3に示すようにラスタ画像およびベクタ画像が有する特徴を有効に用いることで、異なる複数のオブジェクトが重なり合う領域の情報を除去することができる。したがって、
図3で示すようなステップを追加することで、第1のオブジェクトが有するオブジェクトの重なる領域(ノイズ成分)を除去することができる。
【0053】
図4は、一例として用いるイメージ
図10である。イメージ
図10は、第1のオブジェクトを含む。当該第1のオブジェクトは、複数のオブジェクトによって構成されるトランジスタの断面模式図である。トランジスタは、複数の絶縁層、複数の導電層、及び複数の半導体層を有する。なお、絶縁層は複数の異なる組成を有し、導電層は異なる組成または積層構造を有し、半導体層は異なる組成または異なる添加物を有する場合がある。
【0054】
図4で示すオブジェクト400、オブジェクト401、オブジェクト301a、オブジェクト301b、オブジェクト302、オブジェクト303、オブジェクト402、オブジェクト410a、オブジェクト410b、オブジェクト408、およびオブジェクト412は絶縁層である。
【0055】
また、オブジェクト310、オブジェクト416a1、オブジェクト416a2、オブジェクト404、オブジェクト429、オブジェクト430、オブジェクト431、およびオブジェクト432は、導電層である。
【0056】
また、オブジェクト406a、オブジェクト406b、およびオブジェクト406cは、半導体層である。
【0057】
なお、絶縁層、導電層、及び半導体層をコンピュータ装置が識別するために、それぞれのオブジェクトには、ハッチング情報を与えることができる。なお、
図4では、一例として、同じ組成を有する絶縁層、導電層、及び半導体層は、同じハッチング情報を与えている。
【0058】
図5は、
図4で説明した第1のオブジェクトを、複数のオブジェクトに展開した図である。オブジェクト410aおよびオブジェクト408は、オブジェクト431と重なる領域を有するが、ラスタ画像に変換するステップSF04を実行することで重なり合う領域の下層に位置するオブジェクト情報は除去される。オブジェクト410bおよびオブジェクト408は、オブジェクト429と重なる領域を有するが、ラスタ画像に変換するステップSF04を実行することで重なり合う領域の下層に位置するオブジェクト情報は除去される。なお、オブジェクト410aおよびオブジェクト410bは、同じ工程で形成される絶縁層であるが、イメージ
図10に示すように、ユーザが異なる名称をオブジェクトに与える場合がある。なお、オブジェクトから、当該オブジェクトを説明するためのテキストを生成する場合は、それぞれのオブジェクトに名称を付与することが好ましい。
【0059】
図6A、
図6Bは、オブジェクトの位置情報を抽出する方法を説明する図である。
図6Aは、オブジェクトOAおよびオブジェクトOBが接する形で配置された例である。オブジェクトOAおよびオブジェクトOBは、ベクタ画像である。ベクタ画像のオブジェクトは、多角形であれば各頂点を、円であれば円の中心と半径を、座標情報として有する。例えば、オブジェクトOAは、頂点座標A0乃至頂点座標A4を有し、オブジェクトOBは、頂点座標B0乃至頂点座標B5を有する。
【0060】
まず、
図6Aを用いて、多角形のオブジェクトOAおよび多角形のオブジェクトOBの位置関係を判断する方法について説明する。例えば、オブジェクトOAが有する頂点座標A0乃至頂点座標A4の中からy座標が最も小さな頂点を抽出する。次に、オブジェクトOBが有する頂点座標B0乃至頂点座標B5の中からy座標が最も小さな頂点を抽出する。頂点座標A0乃至頂点座標A4の中からy座標が最も小さな頂点のy座標が、頂点座標B0乃至頂点座標B5の中からy座標が最も小さな頂点のy座標よりも小さければ、少なくともオブジェクトOAは、オブジェクトOBよりも下に位置する領域を有すると判断することができる。同様に、それぞれのオブジェクトの頂点を比較することで、オブジェクトOAおよびオブジェクトOBの位置関係を判断することができる。
【0061】
次に、オブジェクトOAおよびオブジェクトOBが接しているかを判断する方法について説明する。例えば、オブジェクトOAが有する頂点座標A0乃至頂点座標A4の隣り合う頂点を通る直線の一次式f(x)を決定する。当該一次式f(x)に対してオブジェクトOBが有する頂点座標B0乃至頂点座標B5のいずれか一の頂点との距離が“0”であり、当該いずれか一の頂点と隣り合う頂点が、当該一次式f(x)との距離が“0”であれば、オブジェクトOAは、オブジェクトOBと接していると判断することができる。
【0062】
上述したように、それぞれのオブジェクトが有する頂点に対してすべての条件を用いて判断することで、より正確な位置関係に関する情報を得ることができる。なお、すべての頂点に関する比較をする場合、ニューラルネットワークを用いてもよい。
【0063】
図6Bで示す多角形のオブジェクトOA、オブジェクトOB、およびオブジェクトOCの位置関係を判断する方法について説明する。例えば、オブジェクトOA、オブジェクトOB、およびオブジェクトOCのそれぞれの頂点から、y座標が最大、且つx座標が最大または最小な頂点と、y座標が最小、且つx座標が最大または最小な頂点を抽出する。
【0064】
例えば、オブジェクトOAから抽出した頂点座標は、頂点座標A0乃至頂点座標A3である。頂点座標A3は、y座標が最大、且つx座標が最小な頂点であり、頂点座標A2は、y座標が最大、且つx座標が最大な頂点である。また、頂点座標A0は、y座標が最小、且つx座標が最小な頂点であり、頂点座標A1は、y座標が最小、且つx座標が最大な頂点である。
【0065】
また、オブジェクトOBから抽出した頂点座標は、頂点座標B0乃至頂点座標B3であり、オブジェクトOAと同様に特徴のある頂点を抽出することが出来る。また、オブジェクトOCから抽出した頂点座標は、頂点座標C0乃至頂点座標C3であり、オブジェクトOAと同様に特徴のある頂点を抽出することが出来る。
【0066】
例えば、頂点座標A2および頂点座標A3のy座標が、頂点座標B2および頂点座標B3のy座標よりも小さい場合は、少なくともオブジェクトOBはオブジェクトOAよりも上に位置する領域を有する。また、頂点座標A0および頂点座標A1のy座標が、頂点座標B0および頂点座標B1のy座標よりも大きい場合は、少なくともオブジェクトOBはオブジェクトOAよりも下に位置する領域を有する。
【0067】
ここで
図6Aで説明したように、オブジェクトOA、オブジェクトOB、およびオブジェクトOCの各頂点座標に対してそれぞれのオブジェクトが接するかの判断を行う。詳細は省略するが、オブジェクトOAの頂点座標A2及び頂点座標A3を直線で結ぶ一次式とオブジェクトOBが有する頂点座標Bのいずれかとの距離が“0”であることがわかる。したがって、オブジェクトOBは、オブジェクトOAの上方に位置し接していると判断することができる。
【0068】
また、オブジェクトOAの頂点座標A0及び頂点座標A3を直線で結ぶ一次式とオブジェクトOBが有する頂点座標Bとの距離が“0”であることがわかる。したがって、オブジェクトOBは、オブジェクトOAの左側面に位置し接していると判断することができる。同様に、オブジェクトOAの頂点座標A1及び頂点座標A2を直線で結ぶ一次式とオブジェクトOBが有する頂点座標Bのいずれかとの距離が“0”であることがわかる。したがって、オブジェクトOBは、オブジェクトOAの右側面に位置し接していると判断することができる。したがって、オブジェクトOBは、オブジェクトOAを覆うように接していると判断することができる。
【0069】
なお、位置関係を表す表現は、複数登録されていることが好ましい。それぞれ判断の条件が異なる。
【0070】
例えば、「オブジェクトOBがオブジェクトOAの上に位置する。」と判断することができる。
【0071】
例えば、「オブジェクトOBがオブジェクトOAの上方に位置する。」と判断することができる。
【0072】
例えば、「オブジェクトOBがオブジェクトOAの上に接する。」と判断することができる。
【0073】
例えば、「オブジェクトOBがオブジェクトOAの上に覆うように接する。」と判断することができる。
【0074】
図7は、グラフ情報を説明する図である。
図7は、
図4で説明したそれぞれのオブジェクトの位置関係の情報をグラフ構造に変換し、グラフ情報10Aとして出力した結果である。例えば、オブジェクト400は、“1st_insulating_Layer”として表示している。なお、
図7では、説明を簡便にするために、一例として、対象のオブジェクトと比較対象のオブジェクトのどちらが上(overと表記)なのかについて位置関係の情報を抽出している。
【0075】
図8は、テキスト情報10Bを説明する図である。
図8は、
図7でグラフ情報10Aとして抽出したそれぞれのオブジェクトの位置関係の情報をテキスト情報10Bとして表示した場合の一例である。なお、オブジェクトの位置関係の情報をテキスト情報として出力するための記述のルールを以下に示す。
【0076】
対象のオブジェクト->比較対象のオブジェクト[label=検出位置]
【0077】
左辺には対象のオブジェクトを記述し、右辺には比較対象のオブジェクトと、比較対象のオブジェクトに対する検出位置を位置関係labelとして示している。
【0078】
一例として、1行目について説明する。“2nd_insulator[401]”->“1st_insulator[400]”[label=“over”]とは、“絶縁層[400]上に絶縁層[401]を有する。”と言い換えることができる。
【0079】
図9は、コンピュータシステム200を説明する図である。コンピュータシステム200は、表示装置201、コンピュータ装置202、入力装置203を有する。表示装置201は、表示領域201Aを有する。表示領域201Aには、GUI210が表示される。GUI210は、入力装置203を用いて、オブジェクトの描画、データベースからのオブジェクトの検索などができる。なお、
図9では表示していないが、GUI210は、
図7で示したグラフ情報10A、
図8で示したテキスト情報10Bなどを表示することができる。
【0080】
なお、本発明の一態様では、GUI210に表示されているイメージ
図10が含むオブジェクトの一部の範囲20に着目してテキスト化することができる。なお、範囲20は、入力装置203によって操作されるカーソル203aを用いると容易に選択することができる。当該選択範囲が指定されたオブジェクトは、選択範囲内に含まれるオブジェクトの領域のみがテキスト情報へ変換する対象範囲になる。したがって、オブジェクト情報に含まれる座標情報は、当該選択範囲内に収まるように更新される。
【0081】
図10は、
図3とは異なるオブジェクトからテキストを生成するテキスト生成システム100の動作を説明するフローチャートである。
図10は、
図9で範囲20によって選択されたオブジェクトの位置関係の情報からテキストを生成する。なお、以下に説明する発明の構成において、同一部分又は同様な機能を有する部分には同一の符号を異なる図面間で共通して用い、その繰り返しの説明は省略する。
【0082】
図10は、ステップSF05と、ステップSF06を有する点が、
図3とは異なっている。ステップSF05は、GUI210に表示されたオブジェクトから、選択範囲として範囲20を指定するステップである。
【0083】
ユーザが設定する範囲20に含まれるオブジェクトは、範囲20の外側にはみ出ている領域のオブジェクト情報を除去し、当該オブジェクト情報の座標情報を更新する。したがって、ユーザは、範囲20に含まれるオブジェクトの位置関係の情報をテキストとして確認することができる。例えば、オブジェクトの構成要素が多い場合、当該オブジェクトから範囲20によって設定された範囲内にあるオブジェクトをテキスト情報に変換することでオブジェクトの内容を確認することができる。異なる例として、特許の請求項を作成する場合、特許図面の一部の範囲に着目することでオブジェクトの位置関係を漏れなく定義するための支援情報として活用することができる。
【0084】
ステップSF06は、グラフ情報またはテキスト情報を生成するときの基準位置として基準オブジェクトを指定することができる。
【0085】
一例として、特許の請求項を作成する場合、オブジェクトの一部を基準オブジェクトとして指定することで、当該基準オブジェクトを中心に位置関係の情報からグラフ構造を有するグラフ情報またはテキスト情報を生成することができる。
【0086】
次にステップS02に移行する。以降は、
図2のフローチャートと処理が同じなため説明を省略する。
【0087】
図10のフローチャートに示すように範囲20を指定することで、ユーザが着目する範囲についての詳細な位置関係の情報を容易に得ることができる。また基準オブジェクトを指定することで、基準オブジェクトを中心とした上下左右、接する、または接しないなどの位置関係の情報を容易に得ることができる。
【0088】
図11Aは、一例として、
図10で範囲20によって選択されたオブジェクトを説明する図である。例えば、オブジェクト400は、範囲20で選択されることで、座標位置の情報が更新される。オブジェクト401、オブジェクト301b、オブジェクト302、オブジェクト303、オブジェクト402、オブジェクト406a、オブジェクト406b、オブジェクト416a2、オブジェクト410b、オブジェクト408、オブジェクト429、オブジェクト430も同様に座標位置の情報が更新される。
【0089】
図11Bは、
図11Aで範囲20によって選択されたオブジェクトを説明するテキスト情報20Aである。範囲20によって選択される範囲のみがブラフ構造を有するグラフ情報(非表示)およびテキスト情報20Aとして生成される。
【0090】
図12は、オブジェクトからテキストを生成するシステムを説明する図である。オブジェクトからテキストを生成するシステムは、コンピュータ装置を利用する。コンピュータ装置202は、ネットワークを介してデータベース221、リモートコンピュータ222、またはリモートコンピュータ223に接続される。コンピュータ装置202は、演算装置211、メモリ212、入出力インターフェース213、通信デバイス214、およびストレージ215を有する。コンピュータ装置202は、入出力インターフェース213を介して、表示装置201、およびキーボード216と電気的に接続される。また、コンピュータ装置202は、通信デバイス214を介してネットワークインターフェース217と電気的に接続され、ネットワークインターフェース217はネットワークを介してデータベース221、リモートコンピュータ222、リモートコンピュータ223と電気的に接続される。
【0091】
ここで、ネットワークには、ローカルエリアネットワーク(LAN)や、インターネットが含まれる。また、上記ネットワークは、有線、および無線のいずれか一方、または両方による通信を用いることができる。また、上記ネットワークにおいて無線通信を用いる場合、Wi-Fi(登録商標)、Bluetooth(登録商標)などの近距離通信手段の他に、第3世代移動通信システム(3G)に準拠した通信手段、LTE(3.9Gと呼ぶ場合もある)に準拠した通信手段、第4世代移動通信システム(4G)に準拠した通信手段、または第5世代移動通信システム(5G)に準拠した通信手段などの様々な通信手段を用いることができる。
【0092】
本発明の一態様であるオブジェクトからテキストを生成するにはプログラムによって実行される。当該プログラムは、コンピュータ装置202が有するメモリ212またはストレージ215に保存されている。プログラムは、演算装置211を用いて、オブジェクトからテキストを生成する。プログラムは、入出力インターフェース213を介して表示装置に表示することができる。ユーザは、表示装置201に表示されたGUIに対して、キーボードまたはマウスなどによる指示をすることで、製品仕様書、組図、または特許の公報などに記載の図面の画像(オブジェクト)をプログラムに与えることができる。表示装置201は、オブジェクトから生成したグラフ情報またはテキスト情報を表示することができる。
【0093】
なお、オブジェクトからテキストを生成する方法を実行するプログラムは、ネットワークを介してリモートコンピュータ222、またはリモートコンピュータ223でも利用することができる。または、データベース221、リモートコンピュータ222、またはリモートコンピュータ223が有するメモリまたはストレージに保存された当該プログラムを利用して、コンピュータ装置202で動作させることができる。リモートコンピュータ222は、スマートフォン、タブレットコンピュータ、ノート型コンピュータなどの携帯情報端末でもよい。携帯情報端末などの場合は、無線通信を用いて通信することができる。
【0094】
よって、本発明の一態様は、オブジェクトをテキストに変換させるテキスト生成方法を提供することができる。また、本発明の一態様は、オブジェクトをグラフ情報に変換し、当該グラフ情報をテキストに変換するテキスト生成方法を提供することができる。また、本発明の一態様は、コンピュータ装置を利用したオブジェクトをテキストに変換させるテキスト生成システムの提供することができる。また、本発明の一態様は、複数のオブジェクトで構成される図面などの内容をテキスト化するためのテキスト生成システムの提供することができる。
【0095】
本実施の形態は、その一部を適宜組み合わせて実施することができる。
【符号の説明】
【0096】
A0:頂点座標、A1:頂点座標、A2:頂点座標、A3:頂点座標、A4:頂点座標、B0:頂点座標、B1:頂点座標、B2:頂点座標、B3:頂点座標、B4:頂点座標、B5:頂点座標、C0:頂点座標、C1:頂点座標、C2:頂点座標、C3:頂点座標、10:イメージ図、10A:グラフ情報、10B:テキスト情報、20:範囲、20A:テキスト情報、100:テキスト生成システム、110:GUI、120:画像処理部、130:特徴抽出部、140:グラフ生成部、141:グラフ情報、150:テキスト生成部、151:テキスト情報、160:データベース、200:コンピュータシステム、201:表示装置、201A:表示領域、202:コンピュータ装置、203:入力装置、203a:カーソル、210:GUI、211:演算装置、212:メモリ、213:入出力インターフェース、214:通信デバイス、215:ストレージ、216:キーボード、217:ネットワークインターフェース、221:データベース、222:リモートコンピュータ、223:リモートコンピュータ、301a:オブジェクト、301b:オブジェクト、302:オブジェクト、303:オブジェクト、310:オブジェクト、400:オブジェクト、401:オブジェクト、402:オブジェクト、404:オブジェクト、406a:オブジェクト、406b:オブジェクト、406c:オブジェクト、408:オブジェクト、410a:オブジェクト、410b:オブジェクト、412:オブジェクト、416a1:オブジェクト、416a2:オブジェクト、429:オブジェクト、430:オブジェクト、431:オブジェクト、432:オブジェクト