IP Force 特許公報掲載プロジェクト 2022.1.31 β版

知財求人 - 知財ポータルサイト「IP Force」

▶ ネイバー コーポレーションの特許一覧 ▶ ワークスモバイルジャパン株式会社の特許一覧

<>
  • 特許-テーブル生成方法及びシステム 図1
  • 特許-テーブル生成方法及びシステム 図2
  • 特許-テーブル生成方法及びシステム 図3A
  • 特許-テーブル生成方法及びシステム 図3B
  • 特許-テーブル生成方法及びシステム 図4
  • 特許-テーブル生成方法及びシステム 図5
  • 特許-テーブル生成方法及びシステム 図6
  • 特許-テーブル生成方法及びシステム 図7
  • 特許-テーブル生成方法及びシステム 図8
  • 特許-テーブル生成方法及びシステム 図9
  • 特許-テーブル生成方法及びシステム 図10
  • 特許-テーブル生成方法及びシステム 図11
  • 特許-テーブル生成方法及びシステム 図12
  • 特許-テーブル生成方法及びシステム 図13
  • 特許-テーブル生成方法及びシステム 図14
  • 特許-テーブル生成方法及びシステム 図15
< >
(19)【発行国】日本国特許庁(JP)
(12)【公報種別】特許公報(B2)
(11)【特許番号】
(24)【登録日】2024-08-05
(45)【発行日】2024-08-14
(54)【発明の名称】テーブル生成方法及びシステム
(51)【国際特許分類】
   G06F 40/177 20200101AFI20240806BHJP
   G06F 3/0481 20220101ALI20240806BHJP
   G06F 3/04842 20220101ALI20240806BHJP
【FI】
G06F40/177
G06F3/0481
G06F3/04842
【請求項の数】 15
(21)【出願番号】P 2022023364
(22)【出願日】2022-02-18
(65)【公開番号】P2022128427
(43)【公開日】2022-09-01
【審査請求日】2022-02-18
(31)【優先権主張番号】10-2021-0023275
(32)【優先日】2021-02-22
(33)【優先権主張国・地域又は機関】KR
(73)【特許権者】
【識別番号】505205812
【氏名又は名称】ネイバー コーポレーション
【氏名又は名称原語表記】NAVER Corporation
(73)【特許権者】
【識別番号】523303688
【氏名又は名称】LINE WORKS株式会社
(74)【代理人】
【識別番号】100107766
【弁理士】
【氏名又は名称】伊東 忠重
(74)【代理人】
【識別番号】100070150
【弁理士】
【氏名又は名称】伊東 忠彦
(74)【代理人】
【識別番号】100135079
【弁理士】
【氏名又は名称】宮崎 修
(72)【発明者】
【氏名】シム フンウン
(72)【発明者】
【氏名】ナム デヒョン
(72)【発明者】
【氏名】ソ ジェフン
(72)【発明者】
【氏名】ペク ヨンミン
(72)【発明者】
【氏名】ワン ヒョソン
(72)【発明者】
【氏名】チェー スンボム
(72)【発明者】
【氏名】キム ユンファン
(72)【発明者】
【氏名】キム ヨンハン
(72)【発明者】
【氏名】イム ムンビン
【審査官】成瀬 博之
(56)【参考文献】
【文献】特開平08-329187(JP,A)
【文献】特開2016-027444(JP,A)
【文献】特開平11-003433(JP,A)
【文献】「読取革命Ver.15」 取扱説明書(基本編)[online],第1版,2012年09月,10-15頁,インターネット<URL:http://dl.it-sol.jpn.panasonic.com/data/yomikaku15/yomiv15_manual_basic.pdf?__CAMCID=QWeVLLXTsa-497&__CAMI=3.3.0.1.FDPGIIgHIdh.cfpgIigHIdH86-03&__CAMSID=cfpgIigHIdH86-03&__CAMVID=FDPGIIgHIdh&_c_d=1&_ct=1679907932398>,[2023年03月27日検索]
(58)【調査した分野】(Int.Cl.,DB名)
G06F 40/00-40/197
G06F 3/048-3/0489
G06K 9/00-9/82
G06T 7/00-7/90
G06Q 10/00-99/00
(57)【特許請求の範囲】
【請求項1】
テーブル生成アプリケーションのテーブル生成方法であって、
前記アプリケーションで提供されるタスク領域にテーブルを含むイメージを出力するステップと、
前記タスク領域の一領域に含まれる複数の機能アイコンのうちのいずれか1つの機能アイコンの選択を受け付けるステップと、
前記いずれか1つの機能アイコンが選択された後、前記イメージに対してドラッグ入力及びクリックのうち少なくとも一方を含む予め設定された方式の入力が加えられると、前記予め設定された方式の入力を、前記選択された機能アイコンに対応するテーブル構成要素を認識又は特定する入力として処理し、前記予め設定された方式の入力に基づいて、前記認識又は特定されたテーブル構成要素に該当するガイド情報を出力するステップと、
前記認識又は特定されたテーブル構成要素を用いて、前記イメージに含まれるテーブルに対応する構造を有するテーブルを生成するステップと、を含み、
前記テーブル構成要素は、
外枠要素、行要素、及び列要素の少なくとも1つを含み、
前記ガイド情報は、
前記イメージに含まれるテーブルの外枠要素を示すボックスイメージ、前記イメージに含まれるテーブルの行要素を構成する横ライン、及び前記イメージに含まれるテーブルの列要素を構成する縦ラインの少なくとも1つを含む、
ことを特徴とする、方法。
【請求項2】
前記ガイド情報を出力するステップにおいては、
前記予め設定された方式の入力に基づいて、前記イメージに含まれるテーブルから前記機能アイコンにマッチングされたテーブル構成要素に該当する単位要素を特定し、前記特定された単位要素に対応するように前記ガイド情報を出力する、
ことを特徴とする、請求項1に記載の方法。
【請求項3】
前記ガイド情報を出力するステップにおいては、
前記イメージに含まれるテーブルを構成する単位要素のうち、前記予め設定された方式の入力が加えられた領域に含まれる少なくとも1つの単位要素を認識する、
ことを特徴とする、請求項2に記載の方法。
【請求項4】
前記複数の機能アイコンのうちの第1機能アイコンは、前記テーブル構成要素のうち前記イメージに含まれるテーブルの外枠要素を特定する機能にマッチングされ、
前記複数の機能アイコンのうちの第2機能アイコンは、前記テーブル構成要素のうち前記イメージに含まれるテーブルの行要素を特定する機能にマッチングされ、
前記複数の機能アイコンのうちの第3機能アイコンは、前記テーブル構成要素のうち前記イメージに含まれるテーブルの列要素に対応するガイド情報を出力する機能にマッチングされる、
ことを特徴とする、請求項1に記載の方法。
【請求項5】
前記ガイド情報を出力するステップにおいては、
前記第1機能アイコンが選択された後、前記予め設定された方式の入力により前記イメージに含まれるテーブルが配置されたテーブル領域が特定された場合、
前記テーブル領域に、前記イメージに含まれるテーブルの外枠を示す前記ボックスイメージをガイド情報として出力する、
ことを特徴とする、請求項4に記載の方法。
【請求項6】
前記ガイド情報を出力するステップにおいては、
前記第2機能アイコンが選択された後、前記予め設定された方式の入力により前記イメージに含まれるテーブルの行要素が特定された場合、
前記イメージに含まれるテーブルの行要素を構成する少なくとも1本の前記横ラインに対応するガイド情報を前記ボックスイメージ内に出力し、
前記第3機能アイコンが選択された後、前記予め設定された方式の入力により前記イメージに含まれるテーブルの列要素が特定された場合、
前記イメージに含まれるテーブルの列要素を構成する少なくとも1本の前記縦ラインに対応するガイド情報を前記ボックスイメージ内に出力する、
ことを特徴とする、請求項5に記載の方法。
【請求項7】
前記横ライン及び前記縦ラインは、それぞれに、前記ボックスイメージの一方側から前記一方側に対向する反対側まで延びるように出力される、
ことを特徴とする、請求項6に記載の方法。
【請求項8】
前記ボックスイメージは、
前記横ライン及び前記縦ラインにより、複数のセルを含むように区画される、
ことを特徴とする、請求項7に記載の方法。
【請求項9】
前記複数の機能アイコンは、さらに、
前記横ライン及び前記縦ラインの少なくとも一部を削除する機能がマッチングされた第4機能アイコンを含み、
前記テーブルを生成するステップにおいては、
前記第4機能アイコンが選択された後、前記イメージに加えられるユーザ入力に基づいて、前記横ライン及び前記縦ラインの少なくとも一部を削除することにより、前記複数のセルの少なくとも2つを結合する、
ことを特徴とする、請求項8に記載の方法。
【請求項10】
前記方法は、さらに、
前記複数のセル間の関係を特定するために、前記複数のセルのうち、前記イメージに含まれるテーブルのカテゴリー名が含まれるカテゴリーセルを特定するステップ、を含み、
前記カテゴリーセルを特定するステップにおいては、
前記複数のセルのうち、クリック又はドラッグ入力により少なくとも1つのセルが選択されると、前記選択されたセルを前記カテゴリーセルとして特定する、
ことを特徴とする、請求項8に記載の方法。
【請求項11】
前記タスク領域の他の一領域には、
前記カテゴリーセルが特定されることに基づいて、前記カテゴリーセルに含まれるカテゴリー名が前記カテゴリーセルの識別情報と共に出力される、
ことを特徴とする、請求項10に記載の方法。
【請求項12】
前記方法は、さらに、
前記複数のセル間の関係を特定するために、前記複数のセルのうち、前記カテゴリーセルに関連するデータセルを特定するステップ、を含み、
前記カテゴリーセルに関連するデータセルの特定は、
前記カテゴリーセルから開始する予め設定された方式の入力に基づいて行われ、前記特定されたデータセルは、前記カテゴリーセルに属するデータセルとして指定される、
ことを特徴とする、請求項10に記載の方法。
【請求項13】
前記複数のセルから、複数のカテゴリーセルが特定され、前記複数のカテゴリーセルのうち、第1カテゴリーセルから開始する予め設定された方式の入力により前記第1カテゴリーセルとは異なる第2カテゴリーセルが選択された場合、
前記第2カテゴリーセルが選択されるまで選択されたデータセルを前記第1カテゴリーセルに関連するデータセルとして特定する、
ことを特徴とする、請求項12に記載の方法。
【請求項14】
電子機器のディスプレイ部に出力されるタスク領域でテーブルを生成するシステムであって、
前記システムの制御部は、
前記タスク領域にテーブルを含むイメージを出力し、
ユーザから、前記タスク領域の一領域に含まれる複数の機能アイコンのうちのいずれか1つの機能アイコンの選択を受け付け、
前記いずれか1つの機能アイコンが選択された後、前記イメージに対してドラッグ入力及びクリックのうち少なくとも一方を含む予め設定された方式の入力が加えられると、前記予め設定された方式の入力を、前記選択された機能アイコンに対応するテーブル構成要素を認識又は特定する入力として処理し、前記予め設定された方式の入力に基づいて、前記認識又は特定されたテーブル構成要素に該当するガイド情報を出力し、
前記認識又は特定されたテーブル構成要素を用いて、前記イメージに含まれるテーブルに対応する構造を有するテーブルを生成し、
前記テーブル構成要素は、
外枠要素、行要素、及び列要素の少なくとも1つを含み、
前記ガイド情報は、
前記イメージに含まれるテーブルの外枠要素を示すボックスイメージ、前記イメージに含まれるテーブルの行要素を構成する横ライン、及び前記イメージに含まれるテーブルの列要素を構成する縦ラインを視覚的に示す情報である、
ことを特徴とする、システム。
【請求項15】
複数の命令を含むコンピュータプログラムであって、命令が実行されると、
アプリケーションで提供されるタスク領域にテーブルを含むイメージを出力するステップと、
前記タスク領域の一領域に含まれる複数の機能アイコンのうちのいずれか1つの機能アイコンの選択を受け付けるステップと、
前記いずれか1つの機能アイコンが選択された後、前記イメージに対してドラッグ入力及びクリックのうち少なくとも一方を含む予め設定された方式の入力が加えられると、前記予め設定された方式の入力を、前記選択された機能アイコンに対応するテーブル構成要素を認識又は特定する入力として処理し、前記予め設定された方式の入力に基づいて、前記認識又は特定されたテーブル構成要素に該当するガイド情報を出力するステップと、
前記認識又は特定されたテーブル構成要素を用いて、前記イメージに含まれるテーブルに対応する構造を有するテーブルを生成するステップと、
をコンピュータに実施させ、
前記テーブル構成要素は、
外枠要素、行要素、及び列要素の少なくとも1つを含み、
前記ガイド情報は、
前記イメージに含まれるテーブルの外枠要素を示すボックスイメージ、前記イメージに含まれるテーブルの行要素を構成する横ライン、及び前記イメージに含まれるテーブルの列要素を構成する縦ラインの少なくとも1つを含む、
ことを特徴とする、コンピュータプログラム。
【発明の詳細な説明】
【技術分野】
【0001】
本発明は、テーブル生成アプリケーションを用いてテーブルを生成する方法及びシステムに関する。
【背景技術】
【0002】
人工知能の辞書的意味は、人間の学習能力、推論能力、知覚能力、自然言語理解能力などをコンピュータプログラムで実現した技術である。このような人工知能は、マシンラーニングに人間の脳を模倣したニューラルネットワークを加えたディープラーニングにより飛躍的に発展してきた。
【0003】
ディープラーニング(deep learning)とは、コンピュータが人間のように判断して学習することができるようにし、それにより物事やデータを群集化又は分類する技術をいい、近年、テキストデータだけでなく画像データまで分析できるようになり、非常に多様な産業分野に積極的に活用されている。
【0004】
このような人工知能の発達により、オフィス・オートメーション(office automation)分野においても様々な自動化が進んでいる。特に、オフィス・オートメーション分野においては、人工知能を活用した画像データ分析技術に基づいて、紙(ペーパ)に印刷されたコンテンツをデータ化するために多くの努力をしている。その一環として、オフィス・オートメーション分野においては、紙文書をイメージ化し、イメージに含まれるコンテンツを分析するイメージ分析技術(又は、画像データ分析技術)により、文書に含まれるコンテンツをデータ化しており、その場合、文書に含まれるコンテンツの特性によってイメージを分析する技術が必要である。
【0005】
例えば、テーブル(表)を含む文書をデータ化する場合、テーブルの形式、テーブルに含まれるテキストの内容、及びテーブルに含まれるテキストの位置、などのように、テーブルに関連する様々な要素についての正確な分析が必要である。
【0006】
よって、イメージに含まれるテーブルを再現するために、イメージに含まれるデータを分析する様々なアプリケーションが開発されている。例えば、「ROSSUM(https://rossum.ai/)」アプリケーションでは、イメージに含まれるテーブルのテキストデータを抽出及びラベル付けする機能を提供している。
【0007】
しかし、これまで開発されたアプリケーションは、イメージに含まれるテーブルの構造及びテキストデータを抽出するレベルなので、イメージに含まれるテーブルの構造及びテキストデータ間の関係性まで正確に再現できるアプリケーションの開発が求められ続けている。
【発明の概要】
【発明が解決しようとする課題】
【0008】
本発明は、イメージに含まれるテーブルと同一の構成を有するテーブルを生成できるテーブル生成方法及びシステムを提供するためのものである。
【0009】
また、本発明は、イメージに現れない非視覚的特性まで考慮して、イメージに含まれるテーブルと同一の構成を有するテーブルをより容易かつ直観的に生成できるユーザ環境を提供するためのものである。
【0010】
さらに、本発明は、テーブルに含まれるデータ間の関係性を提供できるテーブル生成方法及びシステムを提供するためのものである。
【課題を解決するための手段】
【0011】
上記課題を解決するために、本発明によるテーブル生成アプリケーションのテーブル生成方法は、前記アプリケーションで提供されるタスク領域にテーブルを含むイメージを出力するステップと、前記タスク領域の一領域に含まれる複数の機能アイコンのうちのいずれか1つの機能アイコンの選択を受け付けるステップと、前記いずれか1つの機能アイコンが選択された後、前記イメージに加えられる予め設定された方式の入力に基づいて、前記機能アイコンにマッチングされたテーブル構成要素に該当するガイド情報を出力するステップと、前記ガイド情報を用いて、前記イメージに含まれるテーブルに対応する構造を有するテーブルを生成するステップと、を含むようにしてもよい。
【0012】
また、本発明による電子機器のディスプレイ部に出力されるタスク領域でテーブルを生成するシステムの制御部は、前記タスク領域にテーブルを含むイメージを出力し、ユーザから、前記タスク領域の一領域に含まれる複数の機能アイコンのうちのいずれか1つの機能アイコンの選択を受け付け、前記いずれか1つの機能アイコンが選択された後、前記イメージに加えられる予め設定された方式の入力に基づいて、前記機能アイコンにマッチングされたテーブル構成要素に該当するガイド情報を出力し、前記ガイド情報を用いて、前記イメージに含まれるテーブルに対応する構造を有するテーブルを生成する、ようにしてもよい。
【0013】
さらに、本発明による電子機器で1つ以上のプロセスにより実施され、コンピュータ可読記録媒体に格納可能なコンピュータプログラムは、前記アプリケーションで提供されるタスク領域にテーブルを含むイメージを出力するステップと、前記タスク領域の一領域に含まれる複数の機能アイコンのうちのいずれか1つの機能アイコンの選択を受け付けるステップと、前記いずれか1つの機能アイコンが選択された後、前記イメージに加えられる予め設定された方式の入力に基づいて、前記機能アイコンにマッチングされたテーブル構成要素に該当するガイド情報を出力するステップと、前記ガイド情報を用いて、前記イメージに含まれるテーブルに対応する構造を有するテーブルを生成するステップと、を実行させるコマンドを含むようにしてもよい。
【発明の効果】
【0014】
前述したように、本発明によるテーブル生成方法及びシステムは、ユーザ入力に基づいてイメージに含まれるテーブルの構成要素を抽出できるユーザ環境を提供することができる。よって、本発明によるテーブル生成方法及びシステムは、テーブルに含まれるテキストデータだけでなく、テーブルの構造を構成する構成要素まで抽出することができ、その結果、イメージに含まれるテーブルと同一の構造及び同一のデータを有するテーブルを生成することができる。
【0015】
また、本発明によるテーブル生成方法及びシステムは、イメージに含まれるテーブルの構成要素により定義されるセルを特定し、ユーザ入力に基づいて、セル間の関係性を付与することにより、各セルに含まれるデータを有機的に分析できるユーザ環境を提供することもできる。
【0016】
よって、本発明によるテーブル生成アプリケーションによるテーブル生成方法は、イメージに含まれるテーブルの構成要素を抽出する機能及びテーブルに含まれるデータ間の関係性を付与する機能を提供することにより、イメージに含まれるテーブルの視覚的な特性を再現すると共に、データ間の関係的な特性まで再現することができる。
【図面の簡単な説明】
【0017】
図1】本発明によるテーブル生成システムを説明するための概念図である。
図2】テーブルの構成要素を説明するための概念図である。
図3A】本発明によるテーブル生成アプリケーションを説明するための概念図である。
図3B】本発明によるテーブル生成アプリケーションを説明するための概念図である。
図4】本発明によるテーブル生成方法を説明するためのフローチャートである。
図5】前記アプリケーションで提供されるユーザ環境でテーブルを生成する方法を説明するための概念図である。
図6】前記アプリケーションで提供されるユーザ環境でテーブルを生成する方法を説明するための概念図である。
図7】前記アプリケーションで提供されるユーザ環境でテーブルを生成する方法を説明するための概念図である。
図8】前記アプリケーションで提供されるユーザ環境でテーブルを生成する方法を説明するための概念図である。
図9】前記アプリケーションで提供されるユーザ環境でテーブルを生成する方法を説明するための概念図である。
図10】前記アプリケーションで提供されるユーザ環境でテーブルを生成する方法を説明するための概念図である。
図11】前記アプリケーションで提供されるユーザ環境でテーブルを生成する方法を説明するための概念図である。
図12】前記アプリケーションで提供されるユーザ環境でテーブルを生成する方法を説明するための概念図である。
図13】前記アプリケーションで提供されるユーザ環境でテーブルを生成する方法を説明するための概念図である。
図14】前記アプリケーションで提供されるユーザ環境でテーブルを生成する方法を説明するための概念図である。
図15】前記アプリケーションで提供されるユーザ環境でテーブルを生成する方法を説明するための概念図である。
【発明を実施するための形態】
【0018】
以下、添付図面を参照して本発明の実施形態について詳細に説明するが、図面番号に関係なく、同一又は類似の構成要素には同一の符号を付し、それについての重複する説明は省略する。以下の説明で用いられる構成要素の接尾辞である「モジュール」や「部」は、明細書の作成を容易にするために付与又は混用されるものであり、それ自体が有意性や有用性を有するものではない。また、本発明の実施形態について説明するにあたり、関連する公知技術についての具体的な説明が本発明の実施形態の要旨を不明確にすると判断される場合は、その詳細な説明を省略する。さらに、添付図面は本発明の実施形態の理解を助けるためのものにすぎず、添付図面により本発明の技術的思想が限定されるものではなく、本発明の思想及び技術範囲に含まれるあらゆる変更、均等物乃至代替物を含むものと理解すべきである。
【0019】
「第1」、「第2」などのように序数を含む用語は、様々な構成要素を説明するために用いられるが、上記構成要素は、上記用語により限定されるものではない。上記用語は、1つの構成要素を他の構成要素と区別する目的でのみ用いられる。
【0020】
ある構成要素が他の構成要素に「連結」又は「接続」されていると言及された場合は、他の構成要素に直接連結又は接続されていてもよく、中間にさらに他の構成要素が存在してもよいものと解すべきである。それに対して、ある構成要素が他の構成要素に「直接連結」又は「直接接続」されていると言及された場合は、中間にさらに他の構成要素が存在しないものと解すべきである。
【0021】
単数の表現には、特に断らない限り複数の表現が含まれる。
【0022】
本明細書において、「含む」や「有する」などの用語は、本明細書に記載された特徴、数字、段階、動作、構成要素、部品、又はそれらの組み合わせが存在することを指定しようとするものであり、1つ又はそれ以上の他の特徴、数字、段階、動作、構成要素、部品、又はそれらの組み合わせの存在や付加可能性を予め排除するものではないと理解すべきである。
【0023】
前述したように、人工知能が発達するにつれて様々な形態でオフィス・オートメーションが行われており、業務効率のために、紙文書に含まれるテーブル(表)を、紙文書に含まれるテーブルの形式のままデジタル化(データ化)するニーズがますます高まっている。
【0024】
例えば、様々な種類の領収証(レシート)などの文書はテーブルを含み、保険会社や病院などでは、大量の紙文書に含まれるテーブルをデジタル化されたデータとして処理して電算化する必要がある。
【0025】
よって、本発明は、イメージに含まれるテーブルと同一の構成を有するテーブルを生成できるテーブル生成アプリケーションを提供するものであり、特に、そのテーブル生成アプリケーションによるテーブル生成方法及びテーブル生成アプリケーションを構成するテーブル生成システムを提供するものである。
【0026】
本発明に従った、テーブル生成アプリケーションによるテーブル生成方法及びシステムは、イメージに含まれるテーブルの構成要素を抽出する機能及びテーブルに含まれるデータ間の関係性を付与する機能を提供することにより、イメージに含まれるテーブルの視覚的な特性を再現すると共に、データ間の関係的な特性まで再現することができる。
【0027】
以下、添付図面を参照して、テーブル生成アプリケーションを用いて紙文書に含まれるテーブルと同一の構成を有するテーブルを生成する方法及びシステムについて具体的に説明する。
【0028】
図1は、本発明によるテーブル生成システムを説明するための概念図であり、図2は、テーブルの構成要素を説明するための概念図である。また、図3A及び図3Bは、本発明によるテーブル生成アプリケーションを説明するための概念図であり、図4は、本発明によるテーブル生成方法を説明するためのフローチャートである。さらに、図5図15は、前記アプリケーションで提供されるユーザ環境でテーブルを生成する方法を説明するための概念図である。
【0029】
本発明によるテーブル生成アプリケーションは、図1に示すイメージ1000に含まれるテーブル1100、1200と同一又は対応する構造を有するテーブルを生成できるユーザ環境を提供することができる。
【0030】
つまり、本発明によるテーブル生成システム100は、アプリケーション又はソフトウェアの形で実現することができる。本発明によるテーブル生成システム100のソフトウェア的な実現によれば、本明細書で説明されるプロシージャや機能などの実施形態は、別途のソフトウェアモジュールで実現することができる。ソフトウェアモジュールのそれぞれは、本明細書で説明される1つ以上の機能及び動作を実行することができる。
【0031】
このようなテーブル生成アプリケーションは、図1に示すテーブル生成システム100により実現される。以下、テーブル生成システム100の構成について、より具体的に説明する。
【0032】
本発明によるテーブル生成システム100は、イメージ1000からテーブル1100、1200を構成するテーブル構成要素(又は、構成成分)を認識し、認識された構成要素に基づいて、イメージ1000に含まれるテーブル1100、1200と同一のテーブルを生成することができる。
【0033】
このようなテーブル生成システム100は、イメージ1000に含まれるテーブル1100、1200の数に関係なく、イメージ1000に含まれるテーブル1100、1200と同一又は対応する構成要素を有するテーブルを生成することができる。
【0034】
ここで、イメージ1000は、紙文書のスキャンにより取得されたイメージ、又はその他の様々な方法により取得されたイメージである。
【0035】
なお、本発明によるテーブル生成システム100により生成されたテーブルは、様々な名称で呼ぶことができ、例えば、再現テーブルや復元テーブルなどという。
【0036】
本発明における「テーブル(table)」は、表ともいい、ある内容を所定の形式又は手順で示すものを意味する。図2を参照してテーブルの構成要素について説明すると、テーブル200は、少なくとも1つのセル(又は、空間、領域)210を含んでよい。すなわち、テーブル200は、少なくとも1つのセル210を含み、セル210内に情報を含むように構成される。
【0037】
ここで、セル210とは、テーブル200の構成要素により区画される空間を意味する。テーブル200の構成要素は、外枠要素201、行(row)要素202及び列(column)要素203のうち少なくとも1つを含む。
【0038】
外枠要素201は、テーブル200の大きさ及び形状を決定する要素であり、必ずしも視覚的に示す必要はない。
【0039】
行要素202は、外枠要素201内に含まれる横ライン(又は、横線分、水平ライン)であり、テーブル200の構成に応じて、テーブル200内には1本又はそれ以上の横ラインが備えられる。行要素202は、外枠要素201の少なくとも一部(横ラインに該当する枠)を含んでもよい。
【0040】
列要素203は、外枠要素201内に含まれる縦ライン(又は、縦線分、垂直ライン)であり、テーブル200の構成に応じて、テーブル200内には1本又はそれ以上の縦ラインが備えられる。列要素203は、外枠要素201の少なくとも一部(縦ラインに該当する枠)を含んでもよい。
【0041】
テーブル200に含まれるセルの数、大きさ、位置などは、横ライン及び縦ラインの数や配置関係などに基づいて、様々に変形することができ、セルの結合によっても様々に変形することができる。
【0042】
テーブル200及びテーブル200に含まれるセル210は、四角形(square)の形状を有する。
【0043】
テーブル200に含まれるセル210は、少なくとも4本のラインにより規定されるようにしてよい。すなわち、テーブル200に含まれるセル210は、4本のライン(a,b,c,d)で囲まれた四角形からなるようにしてよい。このように、1つの四角形状のセル210を形成するためには、少なくとも4本のラインが必要であり、2本の横ライン(b,d)及び2本の縦ライン(a,c)からなるようにしてもよい。
【0044】
なお、「ライン」という用語は、「線分」又は「辺(エッジ)」ともいう。
【0045】
このように、四角形状のセル210は、2本の横ライン(b,d)及び2本の縦ライン(a,c)の少なくとも一部が交差して形成されてもよい。
【0046】
よって、テーブルは、少なくとも4本のラインを含み、横ラインの数、縦ラインの数、ラインの間隔、ラインの配列位置に応じて、セルの数、セルの大きさ、セルの位置などが規定される。
【0047】
また、本発明におけるテーブルを構成する構成要素は、テーブルを構成するライン(横ライン及び縦ライン)と、テーブルを構成するラインが交差して形成されるコーナー(又は、角、頂点)(e,f,g,h)とを含んでもよい。
【0048】
全てのテーブルが、少なくとも4つのコーナーを有し、それはテーブルの最外枠に含まれるコーナーであり得る。また、テーブルに含まれるコーナーの数は、テーブルに含まれるセルの数に応じて異なる。
【0049】
一方、本発明によるテーブル生成システム100は、図1に示すように、受信部110、保存部120、OCR(Optical Character Reader)部130、及び制御部140の少なくとも1つを含む。
【0050】
まず、受信部110は、テーブル1100が含まれるイメージ1000を受信する手段であって、通信部、スキャン部、及び入力部のうち少なくとも1つを含むようにしてもよく、その他のイメージ1000を受信する手段からなるようにしてもよい。
【0051】
テーブル生成システム100は、受信部110を介して受信したイメージ1000に含まれるテーブル1100、1200に基づいて、分析し、イメージ1000に含まれるテーブル1100、1200と同一のテーブルを生成することができる。
【0052】
次に、保存部120は、本発明による様々な情報を保存するようにしてもよい。保存部120は、その種類が非常に多様であり、少なくとも一部は、外部サーバ150(クラウドサバー151及びデータベース(DB)152の少なくとも一方)であってもよい。すなわち、保存部120は、本発明に関連する情報が保存される空間であればよく、物理的な空間の制約はない。
【0053】
保存部120には、i)テーブル1100、1200を含むイメージ1000及びそれに関連するデータ、ii)テーブル1100、1200を再構成するために特定された構成要素(外枠、ライン、コーナーなど)及びそれに関連するデータ、iii)テーブル1100、1200に含まれるコンテンツ(例えば、テキスト、イメージなど)データの少なくとも1つが保存される。
【0054】
次に、OCR部130は、イメージ1000に含まれるコンテンツを認識する手段であって、様々なコンテンツ認識アルゴリズムの少なくとも1つによりイメージ1000に含まれるコンテンツを認識することができる。OCR部130は、人工知能に基づくアルゴリズムを用いて、コンテンツを認識することができる。ここで、コンテンツには、テキスト(文字)が含まれてもよい。
【0055】
OCR部130は、イメージに含まれるテキスト及びテキストの位置情報を抽出することができる。ここで、テキストの位置情報には、受信部110を介して入力されたイメージ1000内でのテキストの位置、又は、テーブル1100、1200内でのテキストの位置に関する情報が含まれてもよい。
【0056】
次に、制御部140は、本発明に関連するテーブル生成システム100の全般的な動作を制御する。制御部140は、人工知能アルゴリズムを処理するプロセッサ(又は、人工知能プロセッサ)を含んでもよい。制御部140は、ディープラーニングアルゴリズムに基づいて、イメージ1000からテーブル1100、1200を認識し、イメージ1000に含まれるテーブル1100、1200と同一のセル構成を有するテーブルを生成することができる。
【0057】
また、制御部140は、図3A及び図3Bに示すように、テーブルを生成するためのタスク領域300を提供し、タスク領域300は、テーブルを生成するための「ユーザ環境」又は「ユーザインタフェース」ともいう。
【0058】
このようなタスク領域300は、電子機器のディスプレイ部に出力(又は、提供)することができる。さらに、制御部140は、電子機器に備えられるか、又は、電子機器と連動するユーザ入力部(例えば、タッチスクリーン、マウスなど)を介して受信したユーザ入力に基づいて、テーブルを生成することができる。
【0059】
なお、本発明において、タスク領域300が出力される電子機器の種類には、特に制限がなく、本発明によるテーブル生成アプリケーションを起動できればよい。例えば、電子機器には、スマートフォン、携帯電話、タブレットPC、コンピュータ、ノートブックコンピュータ、デジタル放送用端末、PDA(Personal Digital Assistants)、PMP(Portable Multimedia Player)、スマートミラー(smart mirror)、及びスマートテレビ(smart TV)、の少なくとも1つが含まれる。
【0060】
本発明において、電子機器又は電子機器に備えられるディスプレイ部、ユーザ入力部に対しては符号を付さない。しかし、本発明において、タスク領域300が電子機器のディスプレイ部に出力され、ユーザ入力が電子機器に備えられるか、又は、電子機器と連動するユーザ入力部を介して受信されることは、当業者にとって自明である。
【0061】
一方、本発明によるテーブル生成方法及びシステムは、テーブル生成アプリケーションで提供されるユーザ環境(又は、ユーザインタフェース)に基づいて、テーブルを生成することができる。すなわち、テーブル生成アプリケーションは、イメージ1000に含まれるテーブル1100、1200と同一又は対応する構造を有するテーブルを生成できるユーザインタフェースを提供することができる。このようなユーザインタフェースは、「テーブル生成ツール」ともいう。
【0062】
テーブル生成アプリケーションは、図3A及び図3Bに示すように、電子機器を介してユーザから入力されるユーザ入力に基づいて、テーブル生成タスクを実行できるタスク領域300を提供することができる。
【0063】
タスク領域300は、複数の領域に分けられ、テーブルを生成するための様々な情報が出力されるようにしてもよい。
【0064】
タスク領域300に含まれる領域及び情報は、ユーザの選択や現在のタスクの状態によって消えるか、又は、変更される。
【0065】
まず、タスク領域300には、ヘッダ領域(header)310が含まれてもよい。ヘッダ領域310は、メニュー領域などともいい、少なくとも1つの機能アイコンが含まれる。ヘッダ領域310には、ユーザアカウントにログインするためのログイン機能が割り当てられた機能アイコン、及び、複数のテーブル生成タスク過程(又は、タスク)にそれぞれマッチングされた機能アイコンの少なくとも1つが含まれてもよい。
【0066】
ここで、複数のテーブル生成タスク過程(又は、タスク)は、i)イメージ1000に含まれるテーブル1100、1200の構成要素を特定するタスク過程、ii)イメージ1000に含まれるテーブル1100、1200の構成要素の特定を検証する過程、及び、iii)イメージ1000に含まれるテーブル1100、1200に含まれるセル間の関係を特定する過程、を含んでもよい。
【0067】
ヘッダ領域310には、i)イメージ1000に含まれるテーブル1100、1200の構成要素を特定するタスク過程に対応する機能アイコン(図3Aのヘッダ領域310における「Table」アイコン)、ii)イメージ1000に含まれるテーブル1100、1200の構成要素の特定を検証する過程に対応する機能アイコン(図3Aのヘッダ領域310における「Table Inspection」アイコン)、及びiii)イメージ1000に含まれるテーブル1100、1200に含まれるセル間の関係を特定する過程に対応する機能アイコン(図3Aのヘッダ領域310における「Labeling」アイコン)の少なくとも1つが含まれてもよい。
【0068】
ユーザは、ヘッダ領域310で異なるタスク過程に対応する機能アイコンのいずれか1つを選択し、選択された機能アイコンに対応するタスク過程を実行することができる。
【0069】
次に、タスク領域300には、テーブルの構成要素を特定するか、又は、テーブルに含まれるデータ間の関係を特定する機能が割り当てられた機能アイコンが含まれるツールバー領域(toolbar)320、370が含まれてもよい。
【0070】
ツールバー領域320、370に含まれる機能アイコンの種類は、現在のタスク過程が前述した複数のテーブル生成タスク過程のうちのどの過程であるかによって異なる。
【0071】
一例として、図3Aに示すように、現在のタスク過程が、イメージ1000に含まれるテーブル1100、1200の構成要素を特定するタスク過程である場合、ツールバー領域320には、テーブル1100、1200の構成要素(例えば、外枠要素、行要素、列要素など)を特定する機能がマッチングされた少なくとも1つの機能アイコン321、322、323、324、325、326が含まれてもよい。
【0072】
他の例として、図3Bに示すように、現在のタスク過程が、イメージ1000に含まれるテーブル1100、1200に含まれるセル間の関係を特定するタスク過程である場合、ツールバー領域370には、テーブル1100、1200に含まれるセル間の関係を特定する機能がマッチングされた少なくとも1つの機能アイコン371、372、373が含まれてもよい。
【0073】
本発明における「セル間の関係を特定する」ことは、テーブルに含まれる複数のセルのうち、互いに関連するデータが含まれる複数のセルを特定(又は、グルーピング)する過程であるといえる。
【0074】
ここで、互いに関連するデータが含まれる複数のセルは、少なくとも1つがカテゴリーセルであり、他の少なくとも1つがデータセルであってもよい。
【0075】
ここで、カテゴリーは、同一又は類似の性質や意味を基準に分けられるものであり、範疇ともいう。同じカテゴリーに属するデータは、同じ意味、同じ種類、又は、同じ所属のデータであってもよい。すなわち、データセルに含まれるデータは、カテゴリーセルに対応するカテゴリーに該当するデータであってもよい。
【0076】
この場合、データセルに含まれるテキストの意味は、カテゴリーセルに含まれるテキストの意味の下位概念であってもよい。
【0077】
カテゴリーセルには、カテゴリー名又はカテゴリー名に関連するデータが含まれ、データセルには、カテゴリーセルに含まれるカテゴリー名に属するデータが含まれてもよい。ここで、カテゴリー名は、範疇名ともいえる。
【0078】
一方、ツールバー領域320に含まれる機能アイコンの変更は、前述したヘッダ領域310で、タスク過程に対応する機能アイコンのうちどの機能アイコンが選択されるかに基づいて、行われるようにしてもよい。
【0079】
例えば、ヘッダ領域310で、イメージ1000に含まれるテーブル1100、1200の構成要素を特定するタスク過程に対応する機能アイコン(図3Aのヘッダ領域310における「Table」アイコン)が選択されると、ツールバー領域320には、テーブル1100、1200の構成要素(例えば、外枠要素、行要素、列要素など)を特定する機能がマッチングされた少なくとも1つの機能アイコン321、322、323、324、325、326が出力されるようにしてもよい。
【0080】
また、ヘッダ領域310で、イメージ1000に含まれるテーブル1100、1200に含まれるセル間の関係を特定する過程に対応する機能アイコン(図3Bのヘッダ領域310における「Labeling」アイコン)が選択されると、ツールバー領域370には、テーブル1100、1200に含まれるセル間の関係を特定する機能がマッチングされた少なくとも1つの機能アイコン371、372、373が出力されるようにしてもよい。
【0081】
次に、タスク領域300には、図3A及び図3Bに示すように、イメージ1000の大きさ、方向などを制御するための少なくとも1つの機能アイコンが含まれる機能アイコン領域330が、さらに含まれてもよい。
【0082】
次に、タスク領域300には、図3A及び図3Bに示すように、イメージ1000が含まれ、タスク過程の結果物(又は、作業物)が視覚的に提供されるエディタ領域(editor pane)340が、さらに含まれてもよい。
【0083】
次に、タスク領域300には、図3A及び図3Bに示すように、タスク過程中に特定されるテーブル1100、1200に関する情報、又は、テーブル1100、1200から抽出されたコンテンツ(又はテキスト)に関する情報が出力される属性領域(property pane)350が、さらに含まれてもよい。
【0084】
以上で、タスク領域300に含まれる領域をヘッダ領域310、ツールバー領域320、370、エディタ領域340、属性領域350などの名称を用いて、便宜上、説明したが、それらは一例にすぎず、タスク領域300に含まれる領域の名称は、様々に変更することができ、「第1領域」、「第2領域」などのように一般的な名称にしてもよいことは言うまでもない。
【0085】
以下に、前述したタスク領域300の説明を参照して、テーブル生成アプリケーションでテーブルを生成する方法について、より具体的に説明する。まず、フローチャートを参照して、テーブルの構成要素を特定する方法について説明する。
【0086】
本発明によるテーブル生成方法においては、テーブル1100、1200を含むイメージ1000(図1参照)を出力する過程が行われる(S410)。
【0087】
前述したように、テーブル1100、1200を含むイメージ1000は、様々なルートで受信することができる。
【0088】
より具体的には、イメージ1000は、図3A及び図3Bに示すように、テーブル生成アプリケーションで提供されるタスク領域300に出力することができる。
【0089】
特に、イメージ1000は、タスク領域300のエディタ領域340に出力することができる。以下では、それについて明確に区分せず、イメージ1000がタスク領域300に出力される(又は、含まれる)と表現する。
【0090】
一方、図5に示すように、制御部140は、イメージ1000がタスク領域300に出力された状態で、特定の機能アイコン321が選択された後、イメージ1000に加えられるユーザ入力に基づいて、イメージ1000を回転させることができる。ここで、特定の機能アイコン321は、イメージ1000を回転させる機能がマッチングされたアイコンであってもよい。また、前記ユーザ入力は、イメージ1000の一領域を選択するクリック入力であってもよく、クリック入力が維持された状態で加えられるドラッグ入力であってもよい。
【0091】
制御部140は、前記ドラッグ入力の程度に応じて、イメージ1000を回転させることができる。また、制御部140は、前記ドラッグ入力が加えられると、テーブル1100、1200が正方向に表示されるように、イメージ1000を適宜回転させることができる。
【0092】
この場合、制御部140は、イメージ1000に含まれるテーブル1100、1200を認識し、認識されたテーブルに該当する四角形が傾いて表示されないように、イメージ1000を回転させることができる。
【0093】
このようなイメージ1000の回転過程は、必須の過程ではなく、必要に応じて行われる過程である。
【0094】
次に、本発明においては、前述したようにテーブル1100、1200を含むイメージ1000がタスク領域300に出力されると、タスク領域300の一領域に含まれる複数の機能アイコンのうちのいずれか1つの機能アイコンの選択を受け付ける過程が行われる(S420)。
【0095】
図6に示すように、複数の機能アイコン321~326は、テーブル1100、1200の構成要素(又は、テーブル構成要素)を特定するか、又は、特定された構成要素に基づいて区画されたセルを結合する機能にそれぞれマッチングされた機能アイコンである。
【0096】
例えば、複数の機能アイコン321~326のうち、第1機能アイコン322は、テーブル構成要素のうち、イメージ1000に含まれるテーブル1100、1200の外枠要素を特定する機能にマッチングされたアイコンであってもよい。
【0097】
また、複数の機能アイコン321~326のうち、第2機能アイコン323は、テーブル構成要素のうち、イメージ1000に含まれるテーブル1100、1200の行要素を特定する機能にマッチングされたアイコンであってもよい。
【0098】
さらに、複数の機能アイコン321~326のうち、第3機能アイコン324は、テーブル構成要素のうち、イメージ1000に含まれるテーブル1100、1200の列要素を特定する機能にマッチングされたアイコンであってもよい。
【0099】
さらに、複数の機能アイコン321~326のうち、第4~第6機能アイコン324、325、326は、前記特定されたテーブル構成要素により区画されたセルを横方向及び縦方向の少なくとも一方向に結合する結合機能にマッチングされたアイコンであってもよい。
【0100】
本発明において、制御部140は、ユーザ入力に基づいて、いずれか1つの機能アイコンが選択されると、イメージ1000に含まれるテーブル1100、1200から前記選択された機能アイコンに対応する構成要素を特定する過程を実行することができる。
【0101】
一例として、複数の機能アイコン321~326のうち、第1機能アイコン322が選択されると、制御部140は、テーブル構成要素のうち、イメージ1000に含まれるテーブル1100、1200の外枠要素を特定するようにしてもよい。
【0102】
他の例として、複数の機能アイコン321~326のうち、第2機能アイコン323が選択されると、制御部140は、テーブル構成要素のうち、イメージ1000に含まれるテーブル1100、1200の行要素を特定するようにしてもよい。
【0103】
さらに他の例として、複数の機能アイコン321~326のうち、第3機能アイコン324が選択されると、制御部140は、テーブル構成要素のうち、イメージ1000に含まれるテーブル1100、1200の列要素を特定するようにしてもよい。
【0104】
次に、本発明においては、前述した機能アイコンのうちのいずれか1つの機能アイコンが選択されると、イメージ1000に加えられる予め設定された方式の入力に基づいて、その選択された機能アイコンにマッチングされたテーブル構成要素に該当するガイド情報を出力する過程が行われる(S430)。
【0105】
ここで、予め設定された方式の入力は、様々であり、イメージ1000に加えられるドラッグ入力及びクリックの少なくとも一方を含む。例えば、予め設定された方式の入力は、クリックしたまま引きずるドラッグ入力であってもよい。
【0106】
制御部140は、いずれか1つの機能アイコンが選択された後、イメージ1000に対して前記予め設定された方式の入力(又は、ユーザ入力)が加えられると、加えられたユーザ入力を、選択された機能アイコンに対応する構成要素を特定又は認識する入力として処理することができる。
【0107】
このとき、制御部140は、イメージ認識アルゴリズムに基づいて、選択された機能アイコンに対応する構成要素を認識することができる。
【0108】
保存部120には、構成要素毎にそれぞれ対応する形状情報が保存されて存在するようにしてもよい。制御部140は、その形状情報に基づいて、テーブル1100、1200から、選択された機能アイコンに対応する構成要素を認識することができる。
【0109】
例えば、制御部140は、外枠要素に該当する構成要素を特定する第1機能アイコンが選択されると、イメージ1000において前記ユーザ入力が加えられた領域に含まれる外枠要素を認識又は特定するようにしてもよい。また、制御部140は、外枠要素に該当する構成要素が特定されたことを示すために、特定された構成要素に該当するガイド情報(例えば、ボックス(box)イメージ)を出力するようにしてもよい。
【0110】
それとは異なり、制御部140は、外枠要素に該当する構成要素を特定する第1機能アイコンが選択されると、イメージ1000において前記ユーザ入力が加えられた領域に対応するように、外枠要素を示すガイド情報を出力するようにしてもよい。
【0111】
なお、ガイド情報は、視覚的な情報であり、各構成要素によって異なる。一例として、構成要素がテーブルの外枠要素に該当する場合、ガイド情報は、ボックスイメージにしてもよい。ボックスイメージが出力される領域は、イメージ1000においてテーブル1100、1200が配置されるテーブル領域に対応する領域であってもよい。
【0112】
他の例として、構成要素が行要素に該当する場合、ガイド情報は、横方向に延びる横ライン(又は、横線分)イメージにしてもよい。
【0113】
さらに他の例として、構成要素が列要素に該当する場合、ガイド情報は、縦方向に延びる縦ライン(又は、縦線分)イメージにしてもよい。
【0114】
以下に、構成要素をそれぞれ特定し、ガイド情報を出力する方法について、より具体的に説明する。
【0115】
本発明においては、構成要素(外枠要素、行要素、列要素)を特定する過程の結果として、イメージ1000に含まれるテーブル1100、1200と同一のテーブル構造を有するテーブルを描き出すことができる。イメージ1000に含まれるテーブル1100、1200と同一の構造を有するテーブルを「再現テーブル」という。以下に説明する図6図8の過程は、イメージ1000に含まれるテーブル1100、1200と同一の構造を有する再現テーブルを生成するための過程であり、当該過程で描かれるテーブルも「再現テーブル」という。
【0116】
すなわち、イメージ1000に含まれるテーブル1100、1200と同一の構造を有する再現テーブルが完成する前でも、上記過程で描かれているテーブルは全て「再現テーブル」という。
【0117】
まず、図6を参照して、外枠要素を特定し、ガイド情報を出力する方法について説明する。
【0118】
例えば、図6に示すように、複数の機能アイコン321~326のうち、第1機能アイコン322が選択されると、制御部140は、テーブル構成要素のうち、イメージ1000に含まれるテーブル1100、1200の外枠要素を特定ことができる。
【0119】
制御部140は、第1機能アイコン322が選択されると、予め設定された方式の入力401、402、403、404により、イメージ1000に含まれるテーブル1100、1200が配置されるテーブル領域の特定を受けることができる。
【0120】
前記予め設定された方式の入力には、それぞれのテーブル1100、1200の一領域から他の領域へと引きずるドラッグ入力が含まれる。
【0121】
ユーザは、ドラッグ入力により、イメージ1000においてテーブル1100、1200が含まれるテーブル領域を選択することができる。
【0122】
制御部140は、そのドラッグ入力に基づいて、イメージ1000においてテーブル1100、1200が含まれるテーブル領域を特定し、特定されたテーブル領域にガイド情報を出力することができる。
【0123】
このようなテーブル領域は、テーブル1100、1200の外枠に該当する領域であり、制御部140は、イメージ1000に含まれるテーブル1100、1200の外枠を示すボックスイメージ610、620をガイド情報として出力することができる。ボックスイメージ610、620は、イメージ1000に含まれるテーブル1100、1200をユーザに認識させるように、内部は空き領域からなり、境界は実線又は点線からなる、外観を有するようにしてもよい。
【0124】
制御部140は、このようなガイド情報をイメージ1000と重ねて表示することができる。すなわち、ガイド情報は、イメージ1000とオーバーラップ(overlap)して出力することができる。
【0125】
一方、本発明において、制御部140は、外枠要素を特定するためのユーザ入力が、イメージ1000に含まれるテーブル1100、1200の大きさに完全に一致して加えられなくても、イメージ1000に含まれるテーブル1100、1200の大きさに対応する大きさでボックスイメージ610、620を出力することができる。
【0126】
これは、前述したように、制御部140は、イメージ認識アルゴリズムに基づいて、選択された機能アイコンに対応する構成要素を認識することができるからである。
【0127】
保存部120には、構成要素毎にそれぞれ対応する形状情報が保存されて存在するようにしてもよい。制御部140は、その形状情報に基づいて、テーブル1100、1200から、選択された機能アイコンに対応する構成要素(例えば、外枠)を認識することができる。制御部140は、イメージ認識アルゴリズムにより、イメージ1000において前記ユーザ入力が加えられた領域に含まれる外枠要素を認識又は特定することができる。
【0128】
同図に示すように、イメージ1000に複数のテーブル1100、1200が含まれる場合、制御部140は、第1テーブル1100が含まれるテーブル領域への予め設定された方式の入力に基づいて、第1テーブル1100の外枠要素を特定ことができる。
【0129】
同様に、制御部140は、第2テーブル1200が含まれるテーブル領域への予め設定された方式の入力に基づいて、第2テーブル1200の外枠要素を特定ことができる。
【0130】
このように、本発明においては、イメージ1000に複数のテーブル1100、1200が含まれる場合でも、各テーブル1100、1200の構成要素を特定することができる。
【0131】
一方、制御部140は、イメージ1000において複数の外枠要素が特定された場合、イメージ1000に複数のテーブル1100、1200が含まれていると判断することができる。
【0132】
一方、このようにテーブル1100、1200の外枠要素が特定されると、制御部140は、生成対象テーブルを認識したと判断することができる。
【0133】
この場合、制御部140は、現在まで再現されたテーブルの情報をタスク領域300の一領域(例えば、属性領域350)に出力することができる。
【0134】
属性領域350には、異なるテーブル単位で区分されて情報が出力されるようにしてもよい。制御部140は、外枠要素毎に異なるテーブルとして認識することができ、認識された外枠要素にそれぞれ対応するテーブルの属性情報351、352を属性領域350に提供することができる。
【0135】
同図に示すように、属性情報351、352は、認識されたテーブル(又は、再現テーブル(外枠要素に対応するテーブル))のそれぞれの属性に関する情報を含み、その属性は、行の数(Rows)、列の数(Cols)、及び結合されたセルの数(Merges)の少なくとも1つに関する情報を含んでもよい。ここで、認識されたテーブル(又は、再現テーブル)とは、イメージ1000に含まれるテーブル1100、1200とは区分されるものであって、ボックスイメージ610、620に対応するテーブルを意味する。
【0136】
一方、属性領域350に出力される属性情報351、352は、テーブル1100、1200に含まれる構成要素を特定する過程を実行することによりアップデートすることができる。
【0137】
例えば、前述したように、第1及び第2テーブル1100、1200のそれぞれに対してテーブルの外枠要素のみが特定された場合、第1及び第2テーブル1100、1200に基づいて、再現テーブルは、それぞれ行及び列を1つ含み、結合されたセルは存在しない。
【0138】
次に、図7を参照して、行要素を特定し、ガイド情報を出力する方法について説明する。
【0139】
例えば、図7に示すように、複数の機能アイコン321~326のうち、第2機能アイコン323が選択されると、制御部140は、テーブル構成要素のうち、イメージ1000に含まれるテーブル1100、1200の行要素を特定ことができる。
【0140】
行要素とは、横方向(又は、水平方向)に延びるライン(又は、線分)を意味する。このような行要素は、テーブルの構成によって1つ又は複数存在する。
【0141】
制御部140は、第2機能アイコン323が選択されると、予め設定された方式の入力601により、イメージ1000に含まれるテーブル1100、1200を構成する横ラインの特定を受けることができる。前記予め設定された方式の入力は、クリック入力であってもよい。
【0142】
すなわち、制御部140は、第2機能アイコン323が選択された後、前記予め設定された方式の入力によりイメージ1000に含まれるテーブルの行要素が特定された場合、イメージ1000に含まれるテーブルの行要素を構成する少なくとも1本の横ラインに対応するガイド情報1101、1102、1103、1104、1201、1202、1203、1204、1205、1206、1207、1208をボックスイメージ610、620内に出力することができる。
【0143】
ガイド情報1101、1102、1103、1104、1201、1202、1203、1204、1205、1206、1207、1208は、同図に示すように、実線又は点線で視覚的に示してもよく、ボックスイメージ610、620の一方側から当該一方側に対向する反対側まで延びるようにしてもよい。ここで、延びる方向は、横方向(又は、水平方向)であり得る。このようなガイド情報1101、1102、1103、1104、1201、1202、1203、1204、1205、1206、1207、1208により、ボックスイメージ610、620は、行方向に少なくとも2つのセルに区画される。
【0144】
例えば、第1テーブル1100に対応する第1ボックスイメージ610は、第1テーブル1100から抽出された横ライン及びそれに対応するガイド情報1101、1102、1103、1104に基づいて、5つの行に区画される。
【0145】
このような区画に基づいて、属性領域350に出力される属性情報がアップデートされる。アップデートの結果、第1テーブル1100に対応する属性情報351は、再現された第1テーブル(第1ボックスイメージ610に対応するテーブル)が5つの行を含むものであり、行に関する情報(「Rows:5」)がアップデートされる。
【0146】
同様に、第2テーブル1200に対応する第2ボックスイメージ620は、第2テーブル1200から抽出された横ライン、及び、それに対応するガイド情報1201、1202、1203、1204、1205、1206、1207、1208に基づいて、9つの行に区画される。
【0147】
このような区画に基づいて、属性領域350に出力される属性情報がアップデートされる。アップデートの結果、第2テーブル1200に対応する属性情報352は、再現された第2テーブル(第2ボックスイメージ620に対応するテーブル)が9つの行を含むものであり、行に関する情報(「Rows:9」)がアップデートされる。
【0148】
一方、制御部140は、イメージ認識アルゴリズムに基づいて、前記予め設定された方式のユーザ入力が加えられた領域に含まれる横ラインを抽出することができる。テーブル1100、1200から「横ラインを抽出する」ことは、テーブル1100、1200から横ラインに該当する構成要素を認識し、当該構成要素を横ラインとして判断することを意味する。
【0149】
次に、図8を参照して、列要素を特定し、ガイド情報を出力する方法について説明する。
【0150】
例えば、図8に示すように、複数の機能アイコン321~326のうち、第3機能アイコン324が選択されると、制御部140は、テーブル構成要素のうち、イメージ1000に含まれるテーブル1100、1200の列要素を特定ことができる。
【0151】
列要素とは、縦方向(又は、垂直方向)に延びるライン(又は、線分)を意味する。このような列要素は、テーブルの構成によって1つ又は複数存在する。
【0152】
制御部140は、第3機能アイコン324が選択されると、予め設定された方式の入力701により、イメージ1000に含まれるテーブル1100、1200を構成する縦ラインの特定を受けることができる。前記予め設定された方式の入力は、クリック入力であってもよい。
【0153】
すなわち、制御部140は、第3機能アイコン324が選択された後、前記予め設定された方式の入力によりイメージ1000に含まれるテーブルの列要素が特定された場合、イメージ1000に含まれるテーブルの列要素を構成する少なくとも1本の縦ラインに対応するガイド情報1111、1112、1113、1211、1221、1222、1223、1224、1225をボックスイメージ610、620内に出力することができる。
【0154】
ガイド情報1111、1112、1113、1211、1221、1222、1223、1224、1225は、同図に示すように、実線又は点線で視覚的に示してもよく、ボックスイメージ610、620の一方側から当該一方側に対向する反対側まで延びるようにしてもよい。ここで、延びる方向は、縦方向(又は、垂直方向)であり得る。このようなガイド情報1111、1112、1113、1211、1221、1222、1223、1224、1225により、ボックスイメージ610、620は、列方向において少なくとも2つのセルに区画される。
【0155】
例えば、第1テーブル1100に対応する第1ボックスイメージ610は、第1テーブル1100から抽出された縦ライン、及び、それに対応するガイド情報1111、1112、1113に基づいて、4つの列に区画される。
【0156】
このような区画に基づいて、属性領域350に出力される属性情報がアップデートされる。アップデートの結果、第1テーブル1100に対応する属性情報351は、再現された第1テーブル(第1ボックスイメージ610に対応するテーブル)が4つの列を含むものであり、列に関する情報(「Cols:4」)がアップデートされる。
【0157】
同様に、第2テーブル1200に対応する第2ボックスイメージ620は、第2テーブル1200から抽出された縦ライン、及び、それに対応するガイド情報1211、1221、1222、1223、1224、1225に基づいて、7つの列に区画される。
【0158】
このような区画に基づいて、属性領域350に出力される属性情報がアップデートされる。アップデートの結果、第2テーブル1200に対応する属性情報352は、再現された第2テーブル(第2ボックスイメージ620に対応するテーブル)が7つの列を含むものであり、列に関する情報(「Cols:7」)がアップデートされる。
【0159】
一方、制御部140は、イメージ認識アルゴリズムに基づいて、前記予め設定された方式のユーザ入力が加えられた領域に含まれる縦ラインを抽出することができる。テーブル1100、1200から「縦ラインを抽出する」ことは、テーブル1100、1200から縦ラインに該当する構成要素を認識し、当該構成要素を縦ラインとして判断することを意味する。
【0160】
なお、テーブル1100、1200から構成要素を特定する順序は自由に変更することができる。
【0161】
前述したように、本発明においては、機能アイコンの選択及びユーザ入力に基づいて、イメージ1000に含まれるテーブル1100、1200の構成要素(外枠要素、行要素、列要素)を特定する。このような特定により、各構成要素に該当するガイド情報が出力され、よって、ガイド情報は、イメージ1000に含まれるテーブル1100、1200を再現したテーブルに該当する。
【0162】
一方、図8に示すように、テーブル1100、1200の外枠要素を特定したボックスイメージ610、620は、行要素及び列要素の特定により出力された横ライン及び縦ラインに該当するガイド情報1101、1102、1103、1104、1201、1202、1203、1204、1205、1206、1207、1208、1111、1112、1113、1211、1221、1222、1223、1224、1225により、複数のセルを含むように区画される。
【0163】
すなわち、ボックスイメージ610、620は、機能アイコンにより特定された横ライン及び縦ラインにより、複数のセルを含むように区画される。
【0164】
このような複数のセルは、イメージ1000に含まれるテーブル1100、1200に存在する実際のセルに関係なく、テーブルに存在する全てのラインに基づいて区分されるサブセル単位で分割されたセルであってもよい。
【0165】
一例として、第1テーブル1100の場合、4本の横ライン1101、1102、1103、1104(図7参照)と3本の縦ライン1111、1112、1113(図8参照)により、20個のサブセルで区画される。サブセルの数は、(横ラインの数+1)×(縦ラインの数+1)により求められる。
【0166】
他の例として、第2テーブル1200の場合、8本の横ライン1201、1202、1203、1204、1205、1206、1207、1208(図7参照)と6本の縦ライン1211、1221、1222、1223、1224、1225(図8参照)により、63個のサブセルで区画される。
【0167】
このように、イメージ1000に含まれるテーブル1100、1200の構成要素に基づいてセルを区画する場合、ボックスイメージ610、620の構造は、イメージ1000に含まれるテーブル1100、1200の構造とは異なることもある。
【0168】
これは、ボックスイメージ610、620は、各テーブル1100、1200に含まれる全てのライン(横ライン及び縦ライン)に基づいて最小単位で分割されたセルを有するからである。
【0169】
よって、本発明においては、イメージ1000に含まれるテーブル1100、1200と同一の構造を有するテーブル(又は、再現テーブル)を生成するために、セルを結合する過程を行うことができる。
【0170】
すなわち、本発明によるテーブル生成方法においては、ガイド情報を用いて、イメージに含まれるテーブルに対応する構造を有するテーブルを生成する過程が行われるようにしてもよい(S440)。
【0171】
当該過程は、横ライン及び縦ラインの少なくとも一部を除去する過程であり、必要な場合に限って行われる。
【0172】
すなわち、前述したステップS410~S430により、イメージ1000に含まれるテーブル1100、1200と同一の構造を有する再現テーブルが生成された場合、ステップS440を行わなくてもよい。なお、再現テーブルは、前述した構成要素を特定する過程で描かれたボックスイメージ、横ライン、及び縦ラインに該当するガイド情報からなるテーブルであり得る。
【0173】
一方、横ライン及び縦ラインの少なくとも一部を除去する過程とは、隣接する少なくとも2つのセル間に含まれる横ライン及び縦ラインの少なくとも一部を除去することにより、隣接する少なくとも2つのセルを結合する過程を意味する。
【0174】
このような結合過程は、ツールバー領域320に含まれる複数の機能アイコンのうち、前記横ライン及び前記縦ラインの少なくとも一部を削除する機能(又は、結合機能)がマッチングされた機能アイコンが選択された後、ガイド情報に加えられるユーザ入力に基づいて行われるようにしてもよい。
【0175】
結合機能がマッチングされた機能アイコンは、複数であってもよい。結合機能がマッチングされた機能アイコンは、i)横方向及び縦方向に関係なく、ユーザ入力により特定された少なくとも2つのセル間に存在する横ライン及び縦ラインを全て除去する機能が割り当てられた第4機能アイコン325、ii)図10に示すように、ユーザ入力により特定された領域(符号921、922、923、924、925、926、927、928、929、930、931、932のセルが含まれる領域)に含まれる複数のセル921、922、923、924、925、926、927、928、929、930、931、932間に存在する縦ライン911を除去し、複数のセル921、922、923、924、925、926、927、928、929、930、931、932を横方向に結合する機能が割り当てられた第5機能アイコン326、iii)図11に示すように、ユーザ入力により特定された領域(符号951、952、953、954のセルが含まれる領域)に含まれる複数のセル951、952、953、954間に存在する横ライン941、942、943を除去し、隣接するセルを縦方向に結合する機能が割り当てられた第6機能アイコン327、の少なくとも1つを含んでもよい。
【0176】
より具体的には、図9を参照すると、第4機能アイコン325が選択された後、イメージ1000に加えられるユーザ入力に基づいて、制御部140は、ユーザ入力が加えられた領域に含まれる複数のセル間の横ライン及び縦ラインを全て除去(削除)し、1つのセルを生成することができる。例えば、第1テーブル1100から、「患者番号」、「患者氏名」、「12345678」、「ホン・ギルドン」の情報がそれぞれ含まれる4つのセルが予め設定された方式のユーザ入力により選択されると、制御部140は、前記4つのセル間に存在する横ライン及び縦ラインを全て除去し、前記4つのセルを1つのセルにすることができる。
【0177】
また、図10を参照すると、i)図10の(a)に示すように、第5機能アイコン326が選択された後、ii)図10の(b)に示すように、予め設定されたユーザ方式のユーザ入力が複数のセル921、922、923、924、925、926、927、928、929、930、931、932に対して加えられると、iii)図10の(b)及び(c)に示すように、制御部140は、複数のセル921、922、923、924、925、926、927、928、929、930、931、932間に存在する縦ライン911を除去し、複数のセル921、922、923、924、925、926、927、928、929、930、931、932が横方向に結合された結合セル921’、923’、925’、927’、929’、931’を生成することができる。
【0178】
さらに、図11を参照すると、i)図11の(a)に示すように、第6機能アイコン327が選択された後、ii)図11の(b)に示すように、予め設定されたユーザ方式のユーザ入力が複数のセル951、952、953、954に対して加えられると、iii)図11の(b)及び(c)に示すように、制御部140は、複数のセル951、952、953、954間に存在する横ライン941、942、943を除去し、複数のセル951、952、953、954が縦方向に結合された結合セル950を生成することができる。
【0179】
このように、制御部140は、ユーザ入力に基づいて、少なくとも2つのセルを結合することができ、その結果、図9に示すように、ボックスイメージ610、620は、イメージ1000に含まれるテーブル1100、1200と同一のセル構造を有するようになる。
【0180】
一方、このような結合過程に基づいて、属性領域350に出力される属性情報がアップデートされる。アップデートの結果、第1テーブル1100に対応する属性情報351は、再現された第1テーブル(第1ボックスイメージ610に対応するテーブル)が1つの結合されたセル1121を含むものであり、結合されたセルに関する情報(「Merges:1」)がアップデートされる。
【0181】
また、アップデートの結果、第2テーブル1200に対応する属性情報352は、再現された第2テーブル(第2ボックスイメージ620に対応するテーブル)が8つの結合されたセル1221、1222、1223、1224、1225、1226、1227、1228を含むものであり、結合されたセルに関する情報(「Merges:8」)がアップデートされる。
【0182】
このような結合が完了すると、図12に示すように、ボックスイメージ610、620は、イメージ1000に含まれるテーブル1100、1200と同一のセル構造を有する再現テーブルとなる。つまり、制御部140は、再現テーブルを生成することができる。
【0183】
上記過程では、セル間の関連性については考慮せず、イメージ1000に含まれるテーブル1100、1200の構造に該当する構成要素を抽出する機能について説明した。以下では、イメージ1000に含まれるテーブル1100、1200のセル間の関連性、すなわちデータ間の関係性を付与する方法についてより具体的に説明する。
【0184】
図3Bを参照して説明したように、「セル間の関係を特定する」ことは、テーブルに含まれる複数のセルのうち、互いに関連するデータが含まれる複数のセルを特定(又は、グルーピング)する過程であり、当該過程のためにツールバー領域370の機能アイコン371、372、373が備えられてもよい。
【0185】
また、前記セル間の関係を特定する過程は、意味的に上位概念のテキストと下位概念のテキストを区分してセルを特定する過程であってもよい。例えば、前記セル間の関係を特定する過程は、該当するテキストが上位概念と下位概念のどちらに属するかを指定し、上位概念として指定されたテキストを関連する下位概念のテキストと連結してグルーピングする過程であってもよい。
【0186】
より具体的には、前記上位概念のテキストが配置されるセルはカテゴリーセルであり、前記下位概念のテキストが配置されるセルは当該カテゴリーセルに属するデータセルであってもよい。図3Bを参照して説明したように、カテゴリーは、同一又は類似の性質や意味を基準に分けられるものであり、範疇ともいう。同じカテゴリーに属するデータは、同じ意味、同じ種類、又は同じ所属のデータであってもよい。
【0187】
カテゴリーセルには、カテゴリー名又はカテゴリー名に関連するデータが含まれ、データセルには、カテゴリーセルに含まれるカテゴリー名に属するデータが含まれてもよい。ここで、カテゴリー名は、範疇名ともいえる。
【0188】
図13を参照すると、まず、前記複数のセルのうち、前記イメージに含まれるテーブルのカテゴリー名が含まれるカテゴリーセルを特定するステップが行われる。
【0189】
ツールバー領域370の機能アイコン371、372、373のうち、カテゴリーを指定する第1機能アイコン371が選択されると、前記カテゴリーセルを特定するステップが開始されるようにしてもよい。この場合、前記タスク領域の他の一領域には、前記カテゴリーセルが特定されることに基づいて、前記カテゴリーセルに含まれるカテゴリー名が前記カテゴリーセルの識別情報と共に出力されるようにしてもよい。
【0190】
例えば、第1機能アイコン371の選択により第1機能アイコン371が選択されると、タスク領域300の属性領域350には、キー(Keys)項目がアクティブになり、選択されたカテゴリーデータのリストが出力されるようにしてもよい。前記カテゴリーデータのリストには、前記カテゴリーセルに含まれるカテゴリー名が前記カテゴリーセルの識別情報(例えば、シリアル番号)と共に出力されるようにしてもよい。
【0191】
このとき、タスク領域300に出力されたテーブル1100、1200においてクリック入力やドラッグ入力によりセルが選択され、前記選択されたセルがカテゴリーセルとして指定されるようにしてもよい。例えば、テーブル1100、1200においてセル1301、1302、1303、1304、1305がクリック・アンド・ドラッグ方式で選択されると、それらがカテゴリーセルとして指定されるようにしてもよい。
【0192】
前記カテゴリーデータのリストにおいて、前記カテゴリー名及び前記識別情報は、前記カテゴリーセルが選択される手順によって順次出力されるようにしてもよい。この場合、前記選択されたセルは、ハイライトなどにより、選択されたことが表示されるようにしてもよい。
【0193】
一方、属性領域350には、タスク領域300に出力されたテーブル1100、1200のそれぞれに対応するカテゴリー名のリスト領域が形成されてもよい。例えば、第1テーブル1100に対応する第1リスト領域1330と第2テーブル1200に対応する第2リスト領域1340が前記キー(Keys)項目の出力領域1320に表示されるようにしてもよい。ここで、第1リスト領域1330で前記カテゴリー名が出力される順序は、第2テーブル1200と独立して、第1テーブル1100においてセル1301、1302、1303、1304、1305が選択される手順による、ようにしてもよい。また、第2リスト領域1340で前記カテゴリー名が出力される順序は、第1テーブル1100と独立して、第2テーブル1200においてセル1311が選択される手順による、ようにしてもよい。
【0194】
次に、本発明によるテーブル生成方法においては、前記複数のセルのうち、前記カテゴリーセルに関連するデータセルを特定するステップが行われる。例えば、タスク領域300に出力されたテーブル1100、1200において、カテゴリーセルがキー(Keys)項目として選択されると、データセルを行と列に従って選択するステップが行われるようにしてもよい。
【0195】
前記カテゴリーセルに関連するデータセルの特定は、前記カテゴリーセルから開始する予め設定された方式の入力に基づいて行われるようにしてもよい。以下に、その入力方式について、より詳細に説明する。
【0196】
例えば、第2機能アイコン372が選択されると、図14に示すように、行に従ってデータセルを選択する機能がアクティブになり、第3機能アイコン373が選択されると、図15に示すように、列に従ってデータセルを選択する機能がアクティブになる、ようにしてもよい。
【0197】
まず、図14に示すように、第2機能アイコン372が選択されると、属性領域350には、行(Rows)項目がアクティブになり、行方向にグルーピングされたセルグループリストが出力されるようにしてもよい。
【0198】
タスク領域300に出力されたテーブル1100、1200において、いずれか1つのカテゴリーセル1402が選択され、カテゴリーセル1402に続いて選択されるデータセル1403、1404が、カテゴリーセル1402に属するデータセルとして指定される。前記セルの選択は、クリック入力、ドラッグ入力、又はクリック・アンド・ドラッグ入力により行われるようにしてもよい。その例として、カテゴリーセル1402がタッチされてから行方向に隣接するデータセル1403、1404を通るドラッグが入力されると、カテゴリーセル1402のカテゴリー名を上位概念とし、データセル1403、1404の内容を下位概念とするセルグループが形成される。
【0199】
属性領域350には、タスク領域300で選択されたセルによりグルーピングされたセルグループデータのリスト1420が出力されるようにしてもよい。リスト1420は、最上端にカテゴリー名が出力され、当該カテゴリー名の下方に選択されたデータセルの内容が順次出力されるようにしてもよい。
【0200】
一方、前記行方向にセル間の関係を特定する過程において、1つのセルグループは、異なるカテゴリーセルの選択を基準にして、グルーピングの開始及び終了が指定されるようにしてもよい。
【0201】
例えば、前記複数のセルから、複数のカテゴリーセルが特定され、前記複数のカテゴリーセルのうち、第1カテゴリーセルから開始する予め設定された方式の入力により、前記第1カテゴリーセルとは異なる第2カテゴリーセルが選択された場合、制御部140は、前記第2カテゴリーセルが選択されるまで、選択されたデータセルを前記第1カテゴリーセルに関連するデータセルとして特定するようにしてもよい。
【0202】
図14を参照すると、このような特定は、「診察料」に該当する第1カテゴリーセル1402がタッチされ、行方向に隣接するデータセル1403、1404を経て最後のデータである「38,040」に該当するデータセルが選択され、その後「入院料」に該当する第2カテゴリーセル1405が選択された場合に行われる。前記第1カテゴリーセルと前記第2カテゴリーセル間で選択されたセルが前記第1カテゴリーセルに関連するデータセルとして特定される。また、前記第2カテゴリーセルが選択された後に選択されるデータセルは、前記第2カテゴリーセルに関連するデータセルとして特定される。
【0203】
さらに、前記テーブルのセルの一部は、前記カテゴリーセルの属性と前記データセルの属性の両方を有するセルであってもよい。例えば、「診察料」は、データセル1403、1404である「7,608」と「30,432」に対してはカテゴリーセルであるが、カテゴリーセル1401である「基本項目」に対してはデータセルである。この場合、前記「診察料」に該当するセルは、中間カテゴリーセルとして定義される。
【0204】
本例示においては、行方向にカテゴリーセル1401、中間カテゴリーセル1402、データセル1403、1404の順に選択され、この場合、リスト1420には、上位概念(カテゴリー名)、中位概念(中間カテゴリー名)、下位概念(データ)の順に出力され、1つのセルグループを形成する。
【0205】
次に、図15に示すように、第3機能アイコン373が選択されると、属性領域350には、列(Clos)項目がアクティブになり、列方向にグルーピングされたセルグループリストが出力されるようにしてもよい。
【0206】
タスク領域300に出力されたテーブル1100、1200において、いずれか1つのカテゴリーセル1501が選択され、カテゴリーセル1501に続いて選択される中間カテゴリーセル1502が1つのセルグループを形成するようにしてもよい。この場合、前述の行方向にセル間の関係を特定する過程において、ある属性に指定されたセルが、本例示の列方向にセル間の関係を特定する過程において、他の属性に指定される。その例として、「基本項目」は、行方向にはカテゴリーセルとして特定されるが、列方向にはカテゴリーセル1501である「項目」の下位概念である、中間カテゴリーセル1502として特定される。
【0207】
一方、本例示の列方向にセル間の関係を特定する過程においても、データセルが前記カテゴリーセル又は前記中間カテゴリーセルに属するデータセルとして指定されるようにしてもよい。なお、前記セルの選択は、クリック入力、ドラッグ入力、又はクリック・アンド・ドラッグ入力により行われるようにしてもよい。
【0208】
また、図14を参照して説明した行方向にセル間の関係を特定する過程、及び、図15を参照して説明した列方向にセル間の関係を特定する過程で選択されたセルは、ハイライトなどにより、選択されたことが表示されるようにしてもよい。さらに、重複して選択されるセルは、選択の回数に応じてハイライトの形を変化させてもよい。その例として、選択の回数が増加するにつれて、ハイライトの色がより濃くなるように処理してもよい。
【0209】
以上で説明したように、本発明によるテーブル生成方法及びシステムにおいては、イメージ1000に含まれるテーブル1100、1200を視覚的に同一に再現するだけでなく、テーブル1100、1200を構成するセル間の関係まで同一に再現することによって、より活用度の高い再現テーブルを生成することができる。
【0210】
一方、再現テーブル2100、2200は、エクセル(xlsx)構造のデータだけでなく、様々な形式のデータとして提供することができる。再現テーブルがエクセル構造のデータとして提供される場合、制御部140は、複数のセル間の関係性をエクセルデータに反映することができ、その場合、セル間の演算関係をエクセルデータに含めることもできる。制御部140は、セルに含まれるテキスト間の相互演算関係を推定し、推定された演算関係をエクセルデータに対応するセルに関数として適用することができる。
【0211】
前述したように、本発明によるテーブル生成方法及びシステムは、ユーザ入力に基づいて、イメージに含まれるテーブルの構成要素を抽出できるユーザ環境を提供することができる。よって、本発明によるテーブル生成方法及びシステムは、テーブルに含まれるテキストデータだけでなく、テーブルの構造を構成する構成要素まで抽出することができ、その結果、イメージに含まれるテーブルと同一の構造及び同一のデータを有するテーブルを生成することができる。
【0212】
また、本発明によるテーブル生成方法及びシステムは、イメージに含まれるテーブルの構成要素により定義されるセルを特定し、ユーザ入力に基づいてセル間の関係性を付与することにより、各セルに含まれるデータを有機的に分析できるユーザ環境を提供することができる。
【0213】
よって、本発明によるテーブル生成アプリケーションによるテーブル生成方法は、イメージに含まれるテーブルの構成要素を抽出する機能及びテーブルに含まれるデータ間の関係性を付与する機能を提供することにより、イメージに含まれるテーブルの視覚的な特性を再現すると共に、データ間の関係的な特性まで再現することができる。
【0214】
一方、前述した本発明は、コンピュータで1つ以上のプロセスにより実行され、コンピュータ可読媒体(又は、記録媒体)に格納可能なプログラムとして実現することができる。
【0215】
また、前述した本発明は、プログラム記録媒体にコンピュータ可読コード又はコマンドとして実現することができる。すなわち、本発明は、コンピュータプログラムの形態で提供することができる。
【0216】
一方、コンピュータ可読媒体は、コンピュータシステムにより読み取り可能なデータが記録されるあらゆる種類の記録装置を含む。コンピュータ可読媒体の例としては、HDD(Hard Disk Drive)、SSD(Solid State Disk)、SDD(Silicon Disk Drive)、ROM、RAM、CD-ROM、磁気テープ、フロッピーディスク、光データ記憶装置などが挙げられる。
【0217】
また、コンピュータ可読媒体は、ストレージを含み、電子機器が通信によりアクセスできるサーバ又はクラウドストレージであり得る。この場合、コンピュータは、有線又は無線通信により、サーバ又はクラウドストレージから本発明によるプログラムをダウンロードすることができる。
【0218】
さらに、本発明において、前述したコンピュータは、プロセッサ、すなわち中央処理装置(Central Processing Unit, CPU)が搭載された電子機器であり、その種類は特に限定されない。
【0219】
一方、本発明の詳細な説明は例示的なものであり、あらゆる面で制限的に解釈されてはならない。本発明の範囲は添付の特許請求の範囲の合理的解釈により定められるべきであり、本発明の等価的範囲内でのあらゆる変更が本発明の範囲に含まれる。
【符号の説明】
【0220】
100 テーブル生成システム
110 受信部
120 保存部
130 OCR部
140 制御部
150 外部サーバ
151 クラウドサバー
152 データベース(DB)
200 テーブル
201 外枠要素
202 行要素
203 列要素
210 セル
300 タスク領域
310 ヘッダ領域
320、370 ツールバー領域
330 機能アイコン領域
340 エディタ領域
350 属性領域
1000 イメージ
1100、1200 テーブル
図1
図2
図3A
図3B
図4
図5
図6
図7
図8
図9
図10
図11
図12
図13
図14
図15