(19)【発行国】日本国特許庁(JP)
(12)【公報種別】公開特許公報(A)
(11)【公開番号】P2022175285
(43)【公開日】2022-11-25
(54)【発明の名称】表データ生成システム、表データ生成プログラムおよびオブジェクト検出器生成方法
(51)【国際特許分類】
G06T 7/00 20170101AFI20221117BHJP
G06T 7/60 20170101ALI20221117BHJP
G06V 30/412 20220101ALI20221117BHJP
【FI】
G06T7/00 350B
G06T7/60 200K
G06K9/20 340C
【審査請求】未請求
【請求項の数】7
【出願形態】OL
(21)【出願番号】P 2021081551
(22)【出願日】2021-05-13
(71)【出願人】
【識別番号】000006150
【氏名又は名称】京セラドキュメントソリューションズ株式会社
(74)【代理人】
【識別番号】100140796
【弁理士】
【氏名又は名称】原口 貴志
(72)【発明者】
【氏名】原 博幸
【テーマコード(参考)】
5B029
5L096
【Fターム(参考)】
5B029AA01
5B029BB02
5B029CC26
5B029CC27
5B029CC28
5B029CC30
5L096BA07
5L096BA17
5L096EA06
5L096FA16
5L096FA59
5L096FA64
5L096FA69
5L096HA11
5L096KA04
5L096KA15
(57)【要約】
【課題】 利用者の負担を低減することができる表データ生成システム、表データ生成プログラムおよびオブジェクト検出器生成方法を提供する。
【解決手段】 情報処理システムは、画像データによって示される画像から、罫線が無い表としての仮想罫線表の領域としての仮想罫線表領域を、学習済みのオブジェクト検出器によって検出し(S102)、検出した仮想罫線表領域の画像から表データを生成する(S103~S105)ことを特徴とする。
【選択図】
図2
【特許請求の範囲】
【請求項1】
画像データによって示される画像から、罫線が無い表としての仮想罫線表の領域としての仮想罫線表領域を、学習済みのオブジェクト検出器によって検出する仮想罫線表領域検出部と、
前記仮想罫線表領域検出部によって検出された前記仮想罫線表領域の画像から表データを生成する表データ生成部と
を備えることを特徴とする表データ生成システム。
【請求項2】
複数のページに跨って存在する、連続する複数の前記仮想罫線表の前記表データを統合して1つの表の前記表データを生成する表統合部を備えることを特徴とする請求項1に記載の表データ生成システム。
【請求項3】
前記表データ生成部は、前記仮想罫線表領域の画像に罫線を、学習済みの画像生成モデルによって付加し、罫線が付加された画像に基づいて、前記仮想罫線表の各セルの位置およびサイズを算出することを特徴とする請求項1または請求項2に記載の表データ生成システム。
【請求項4】
前記表データ生成部は、前記仮想罫線表の1行目の画像と、前記仮想罫線表の1列目の画像とのみに前記画像生成モデルによって罫線を付加し、罫線が付加された1行目の画像と、罫線が付加された1列目の画像とに基づいて、前記仮想罫線表の各セルの位置およびサイズを算出することを特徴とする請求項3に記載の表データ生成システム。
【請求項5】
前記仮想罫線表領域は、文字列を含む矩形領域としてのボックスが特定されることが可能であり、
前記表データ生成部は、前記仮想罫線表の1行目に所属する前記ボックスと、前記仮想罫線表の1列目に所属する前記ボックスとを、学習済みの機械分類器によって検出し、1行目に所属する前記ボックスの位置およびサイズに基づいて1行目の画像を抽出し、1列目に所属する前記ボックスの位置およびサイズに基づいて1列目の画像を抽出することを特徴とする請求項4に記載の表データ生成システム。
【請求項6】
画像データによって示される画像から、罫線が無い表としての仮想罫線表の領域としての仮想罫線表領域を、学習済みのオブジェクト検出器によって検出する仮想罫線表領域検出部と、
前記仮想罫線表領域検出部によって検出された前記仮想罫線表領域の画像から表データを生成する表データ生成部と
をコンピューターに実現させることを特徴とする表データ生成プログラム。
【請求項7】
画像データによって示される画像から、罫線が無い表としての仮想罫線表の領域としての仮想罫線表領域を検出するためのオブジェクト検出器を、転移学習によって生成することを特徴とするオブジェクト検出器生成方法。
【発明の詳細な説明】
【技術分野】
【0001】
本発明は、画像データから表データを生成する表データ生成システム、表データ生成プログラムおよびオブジェクト検出器生成方法に関する。
【背景技術】
【0002】
従来の表データ生成システムとして、罫線が無い表(以下「仮想罫線表」という。)の領域(以下「仮想罫線表領域」という。)を帳票の画像から検出するものが知られている(例えば、特許文献1参照。)。この表データ生成システムにおいては、文字列を含む矩形領域(以下「ボックス」という。)の配置が特定の規則を満たす領域を仮想罫線表領域として検出する。
【先行技術文献】
【特許文献】
【0003】
【発明の概要】
【発明が解決しようとする課題】
【0004】
しかしながら、従来の表データ生成システムにおいては、帳票の種類に応じて適切な規則が利用者によって生成される必要があるので、利用者の負担が大きいという問題がある。
【0005】
そこで、本発明は、利用者の負担を低減することができる表データ生成システム、表データ生成プログラムおよびオブジェクト検出器生成方法を提供することを目的とする。
【課題を解決するための手段】
【0006】
本発明の表データ生成システムは、画像データによって示される画像から、罫線が無い表としての仮想罫線表の領域としての仮想罫線表領域を、学習済みのオブジェクト検出器によって検出する仮想罫線表領域検出部と、前記仮想罫線表領域検出部によって検出された前記仮想罫線表領域の画像から表データを生成する表データ生成部とを備えることを特徴とする。
【0007】
この構成により、本発明の表データ生成システムは、画像データによって示される画像から仮想罫線表領域を、学習済みのオブジェクト検出器によって自動で検出するので、利用者の負担を低減することができる。
【0008】
本発明の表データ生成システムは、複数のページに跨って存在する、連続する複数の前記仮想罫線表の前記表データを統合して1つの表の前記表データを生成する表統合部を備えても良い。
【0009】
この構成により、本発明の表データ生成システムは、複数のページに跨って存在する、連続する複数の仮想罫線表の表データを統合して1つの表の表データを生成するので、利便性を向上することができる。
【0010】
本発明の表データ生成システムにおいて、前記表データ生成部は、前記仮想罫線表領域の画像に罫線を、学習済みの画像生成モデルによって付加し、罫線が付加された画像に基づいて、前記仮想罫線表の各セルの位置およびサイズを算出しても良い。
【0011】
この構成により、本発明の表データ生成システムは、仮想罫線表領域の画像に罫線を、学習済みの画像生成モデルによって自動で付加し、罫線が付加された画像に基づいて、仮想罫線表の各セルの位置およびサイズを算出するので、利便性を向上することができる。
【0012】
本発明の表データ生成システムにおいて、前記表データ生成部は、前記仮想罫線表の1行目の画像と、前記仮想罫線表の1列目の画像とのみに前記画像生成モデルによって罫線を付加し、罫線が付加された1行目の画像と、罫線が付加された1列目の画像とに基づいて、前記仮想罫線表の各セルの位置およびサイズを算出しても良い。
【0013】
この構成により、本発明の表データ生成システムは、仮想罫線表の1行目の画像と、仮想罫線表の1列目の画像とのみに画像生成モデルによって罫線を付加し、罫線が付加された1行目の画像と、罫線が付加された1列目の画像とに基づいて、仮想罫線表の各セルの位置およびサイズを算出するので、画像生成モデルによる罫線の付加の精度を特定の精度以上にするために必要な学習データの数量を低減することができる。
【0014】
本発明の表データ生成システムにおいて、前記仮想罫線表領域は、文字列を含む矩形領域としてのボックスが特定されることが可能であり、前記表データ生成部は、前記仮想罫線表の1行目に所属する前記ボックスと、前記仮想罫線表の1列目に所属する前記ボックスとを、学習済みの機械分類器によって検出し、1行目に所属する前記ボックスの位置およびサイズに基づいて1行目の画像を抽出し、1列目に所属する前記ボックスの位置およびサイズに基づいて1列目の画像を抽出しても良い。
【0015】
この構成により、本発明の表データ生成システムは、仮想罫線表の1行目に所属するボックスと、仮想罫線表の1列目に所属するボックスとを、学習済みの機械分類器によって自動で検出し、1行目に所属するボックスの位置およびサイズに基づいて1行目の画像を抽出し、1列目に所属するボックスの位置およびサイズに基づいて1列目の画像を抽出するので、利便性を向上することができる。
【0016】
本発明の表データ生成プログラムは、画像データによって示される画像から、罫線が無い表としての仮想罫線表の領域としての仮想罫線表領域を、学習済みのオブジェクト検出器によって検出する仮想罫線表領域検出部と、前記仮想罫線表領域検出部によって検出された前記仮想罫線表領域の画像から表データを生成する表データ生成部とをコンピューターに実現させることを特徴とする。
【0017】
この構成により、本発明の表データ生成プログラムを実行するコンピューターは、画像データによって示される画像から仮想罫線表領域を、学習済みのオブジェクト検出器によって自動で検出するので、利用者の負担を低減することができる。
【0018】
本発明のオブジェクト検出器生成方法は、画像データによって示される画像から、罫線が無い表としての仮想罫線表の領域としての仮想罫線表領域を検出するためのオブジェクト検出器を、転移学習によって生成することを特徴とする。
【0019】
この構成により、本発明のオブジェクト検出器生成方法は、画像データによって示される画像から仮想罫線表領域を検出するためのオブジェクト検出器を、転移学習によって生成するので、オブジェクト検出器による検出の精度を特定の精度以上にするために必要な学習データの数量を低減することができる。
【発明の効果】
【0020】
本発明の表データ生成システム、表データ生成プログラムおよびオブジェクト検出器生成方法は、利用者の負担を低減することができる。
【図面の簡単な説明】
【0021】
【
図1】1台のコンピューターによって構成される場合の本発明の一実施の形態に係る情報処理システムのブロック図である。
【
図2】画像データから表データを生成する場合の
図1に示す情報処理システムの動作のフローチャートである。
【
図3】(a)
図1に示すオブジェクト検出器によって仮想罫線表領域を検出する対象のページの画像の一例を示す図である。 (b)
図3(a)に示す画像からオブジェクト検出器によって検出された仮想罫線表領域の一例を示す図である。
【
図4】
図2に示す表データ生成処理のフローチャートである。
【
図5】
図4に示す表データ生成処理の対象の仮想罫線表領域の画像から生成された文字列の画像の一例を示す図である。
【
図6】
図4に示す表データ生成処理において特定されたボックスの一例を示す図である。
【
図7】(a)
図4に示す表データ生成処理において特定されたボックスの、
図6に示す例とは異なる一例を示す図である。 (b)
図7(a)に示すボックスのうち、1行目に所属するボックスの一例を示す図である。 (c)
図7(a)に示すボックスのうち、1列目に所属するボックスの一例を示す図である。
【
図8】(a)
図4に示す表データ生成処理において抽出された、1行目の画像の一例を示す図である。 (b)
図8(a)に示す画像に対して罫線が付加された画像の一例を示す図である。
【
図9】(a)
図4に示す表データ生成処理において抽出された、1列目の画像の一例を示す図である。 (b)
図9(a)に示す画像に対して罫線が付加された画像の一例を示す図である。
【
図10】
図4に示す表データ生成処理において生成された表データによって示される表の一例を示す図である。
【
図11】(a)2回の、
図4に示す表データ生成処理によって生成された2つの表の一例を示す図である。 (b)
図11(a)に示す2つの表が1つに統合された表を示す図である。
【
図12】本発明の一実施の形態に係るオブジェクト検出器生成方法のフローチャートである。
【
図13】(a)~(d)
図12に示すオブジェクト検出器生成方法によって使用される、それぞれ「表1」というラベル名でラベル付けされた画像データの例を示す図である。
図14
【
図14】(a)~(e)
図12に示すオブジェクト検出器生成方法によって使用される、それぞれ「表2」というラベル名でラベル付けされた画像データの例を示す図である。
【発明を実施するための形態】
【0022】
以下、本発明の実施の形態について、図面を用いて説明する。
【0023】
まず、本発明の一実施の形態に係る情報処理システムの構成について説明する。
【0024】
本実施の形態に係る情報処理システムは、例えばMFP(Multifunction Peripheral)などの画像形成装置、PC(Personal Computer)などのような1台のコンピューターによって構成されても良いし、複数台のコンピューターによって構成されても良い。
【0025】
図1は、1台のコンピューターによって構成される場合の本実施の形態に係る情報処理システム10のブロック図である。
【0026】
図1に示すように、情報処理システム10は、種々の操作が入力される例えばキーボード、マウスなどの操作デバイスである操作部11と、種々の情報を表示する例えばLCD(Liquid Crystal Display)などの表示デバイスである表示部12と、LAN(Local Area Network)、インターネットなどのネットワーク経由で、または、ネットワークを介さずに有線または無線によって直接に、外部の装置と通信を行う通信デバイスである通信部13と、各種の情報を記憶する例えば半導体メモリー、HDD(Hard Disk Drive)などの不揮発性の記憶デバイスである記憶部14と、情報処理システム10全体を制御する制御部15とを備えている。
【0027】
記憶部14は、画像データから表データを生成するための表データ生成プログラム14aを記憶している。表データ生成プログラム14aは、例えば、情報処理システム10の製造段階で情報処理システム10にインストールされていても良いし、USB(Universal Serial Bus)メモリーなどの外部の記憶媒体から情報処理システム10に追加でインストールされても良いし、ネットワーク上から情報処理システム10に追加でインストールされても良い。
【0028】
記憶部14は、画像データによって示される画像から仮想罫線表領域を検出するためのオブジェクト検出器14bを記憶している。オブジェクト検出器14bは、例えば、YOLO(You Only Look Once) v2などによって構成される。オブジェクト検出器14bは、多数の学習データを使用して学習済みである。
【0029】
仮想罫線表領域は、後述するように、文字列を含む矩形領域(以下「ボックス」という。)が複数特定されることが可能である。記憶部14は、仮想罫線表領域における全てのボックスのうち、仮想罫線表領域に含まれる仮想罫線表の1行目に所属するボックスと、この仮想罫線表の1列目に所属するボックスとを検出するための機械分類器14cを記憶している。機械分類器14cは、仮想罫線表領域における全てのボックスの位置およびサイズが入力されることによって、この仮想罫線表領域に含まれる仮想罫線表の1行目に所属するボックスと、この仮想罫線表の1列目に所属するボックスとを検出することができる。ここで、ボックスの位置とは、例えば、このボックスの左上端の点の左右方向における位置と、この点の上下方向における位置との組み合わせである。また、ボックスのサイズとは、このボックスの左右方向における長さ、すなわち、幅と、このボックスの上下方向における長さ、すなわち、高さとの組み合わせである。機械分類器14cは、例えば、SVM(Support Vector Machine)などによって構成される。機械分類器14cは、多数の学習データを使用して学習済みである。
【0030】
記憶部14は、画像に罫線を付加するための画像生成モデルとしての罫線付加モデル14dを記憶している。罫線付加モデル14dは、例えば、pix2pix(GAN(Generative Adversarial Networks))などによって構成される。罫線付加モデル14dは、多数の学習データを使用して学習済みである。
【0031】
制御部15は、例えば、CPU(Central Processing Unit)と、プログラムおよび各種のデータを記憶しているROM(Read Only Memory)と、制御部15のCPUの作業領域として用いられるメモリーとしてのRAM(Random Access Memory)とを備えている。制御部15のCPUは、記憶部14または制御部15のROMに記憶されているプログラムを実行する。
【0032】
制御部15は、表データ生成プログラム14aを実行することによって、仮想罫線表領域を検出する仮想罫線表領域検出部15aと、表データを生成する表データ生成部15bと、複数の仮想罫線表の表データを統合して1つの表の表データを生成する表統合部15cとを実現する。すなわち、情報処理システム10は、本発明の表データ生成システムを構成している。
【0033】
次に、画像データから表データを生成する場合の情報処理システム10の動作について説明する。
【0034】
図2は、画像データから表データを生成する場合の情報処理システム10の動作のフローチャートである。
【0035】
情報処理システム10は、画像データからの表データの生成の指示(以下「表データ生成指示」という。)が入力されると、
図2に示す動作を実行する。ここで、表データ生成指示には、対象の画像データ(以下「対象画像データ」という。)が含まれている。対象画像データは、例えば、紙帳票がスキャナーによって読み取られて生成された画像データでも良い。
【0036】
図2に示すように、仮想罫線表領域検出部15aは、対象画像データによって示される画像の最初のページを対象にする(S101)。
【0037】
仮想罫線表領域検出部15aは、現在の対象のページの画像から仮想罫線表領域をオブジェクト検出器14bによって検出する(S102)。
【0038】
図3(a)は、オブジェクト検出器14bによって仮想罫線表領域を検出する対象のページの画像の一例を示す図である。
図3(b)は、
図3(a)に示す画像からオブジェクト検出器14bによって検出された仮想罫線表領域の一例を示す図である。
【0039】
仮想罫線表領域検出部15aは、S101において対象にしたページの画像が
図3(a)に示す画像である場合、
図3(b)に示す仮想罫線表領域をS102において検出する。
【0040】
図2に示すように、表データ生成部15bは、S102の処理の後、現在の対象のページの画像からS102において検出した仮想罫線表領域のうち、未だ対象にしていない1つの仮想罫線表領域を対象にする(S103)。
【0041】
次いで、表データ生成部15bは、現在の対象の仮想罫線表領域の画像から表データを生成する表データ生成処理を実行する(S104)。
【0042】
図4は、
図2に示す表データ生成処理のフローチャートである。
【0043】
図4に示すように、表データ生成部15bは、現在の対象の仮想罫線表領域の画像に例えばガウス平滑化フィルターなどのフィルターを掛けて文字列の画像を生成する(S121)。すなわち、表データ生成部15bは、現在の対象の仮想罫線表領域の画像のうち、文字列以外のノイズを除去する。
【0044】
図5は、
図4に示す表データ生成処理の対象の仮想罫線表領域の画像から生成された文字列の画像の一例を示す図である。
【0045】
表データ生成部15bは、現在の対象の仮想罫線表領域の画像が
図3(b)に示す画像である場合、
図5に示す画像をS121において生成する。
【0046】
図4に示すように、表データ生成部15bは、S121の処理の後、S121において生成した画像において、文字列を含む最小の矩形領域を、特定の規則に基づいてボックスとして特定する(S122)。
【0047】
図6は、S122において特定されたボックスの一例を示す図である。
【0048】
表データ生成部15bは、S121において生成した画像が
図5に示す画像である場合、
図6に示すボックスをS122において特定する。
【0049】
図4に示すように、表データ生成部15bは、S122の処理の後、S122において特定したボックス毎に、ボックスの位置およびサイズを取得する(S123)。
【0050】
表データ生成部15bは、S123の処理の後、S122において特定したボックス毎に、OCR(Optical Character Recognition)を掛けて文字列を取得する(S124)。
【0051】
表データ生成部15bは、S124の処理の後、S123において取得した、全てのボックスの位置およびサイズを機械分類器14cに入力することによって、仮想罫線表の1行目に所属するボックスと、仮想罫線表の1列目に所属するボックスとを検出する(S125)。
【0052】
図7(a)は、S122において特定されたボックスの、
図6に示す例とは異なる一例を示す図である。
図7(b)は、
図7(a)に示すボックスのうち、1行目に所属するボックスの一例を示す図である。
図7(c)は、
図7(a)に示すボックスのうち、1列目に所属するボックスの一例を示す図である。
【0053】
表データ生成部15bは、S122において特定されたボックスが
図7(a)に示すボックスである場合、1行目に所属するボックスとして
図7(b)に示すボックスをS125において検出するとともに、1列目に所属するボックスとして
図7(c)に示すボックスをS125において検出する。
【0054】
図4に示すように、表データ生成部15bは、S125の処理の後、現在の対象の仮想罫線表領域の画像から、S125において検出した、1行目に所属するボックスの位置およびサイズに基づいて、1行目の高さで画像を抽出する(S126)。すなわち、表データ生成部15bは、1行目の画像を抽出する。
【0055】
表データ生成部15bは、S126の処理の後、S126において抽出した、1行目の画像に対して、罫線付加モデル14dを使用して、罫線を付加する(S127)。
【0056】
図8(a)は、S126において抽出された、1行目の画像の一例を示す図である。
図8(b)は、
図8(a)に示す画像に対して罫線が付加された画像の一例を示す図である。
【0057】
表データ生成部15bは、S125において検出した、1行目に所属するボックスが
図7(b)に示すボックスである場合、
図8(a)に示す画像をS126において抽出し、
図8(b)に示す罫線をS127において付加する。
【0058】
図4に示すように、表データ生成部15bは、S127の処理の後、現在の対象の仮想罫線表領域の画像から、S125において検出した、1列目に所属するボックスの位置およびサイズに基づいて、1列目の幅で画像を抽出する(S128)。すなわち、表データ生成部15bは、1列目の画像を抽出する。
【0059】
表データ生成部15bは、S128の処理の後、S128において抽出した、1列目の画像に対して、罫線付加モデル14dを使用して、罫線を付加する(S129)。
【0060】
図9(a)は、S128において抽出された、1列目の画像の一例を示す図である。
図9(b)は、
図9(a)に示す画像に対して罫線が付加された画像の一例を示す図である。
【0061】
表データ生成部15bは、S125において検出した、1列目に所属するボックスが
図7(c)に示すボックスである場合、
図9(a)に示す画像をS128において抽出し、
図9(b)に示す罫線をS129において付加する。
【0062】
図4に示すように、表データ生成部15bは、S129の処理の後、S127において罫線が付加された1行目の画像から、仮想罫線表の1行目の各セルの位置およびサイズを算出する(S130)。ここで、セルの位置とは、例えば、このセルの左上端の点の左右方向における位置と、この点の上下方向における位置との組み合わせである。また、セルのサイズとは、このセルの幅および高さの組み合わせである。
【0063】
表データ生成部15bは、S130の処理の後、S129において罫線が付加された1列目の画像から、仮想罫線表の1列目の各セルの位置およびサイズを算出する(S131)。
【0064】
表データ生成部15bは、S131の処理の後、S130において算出した、1行目の各セルの位置およびサイズと、S131において算出した、1列目の各セルの位置およびサイズとに基づいて、仮想罫線表の全てのセルの位置およびサイズを算出する(S132)。すなわち、表データ生成部15bは、1行目の各列の幅を仮想罫線表の各列の幅とし、1列目の各行の高さを仮想罫線表の各行の高さとすることによって、仮想罫線表の全てのセルの位置およびサイズを算出する。
【0065】
表データ生成部15bは、S132の処理の後、S123において取得した、各ボックスの位置およびサイズと、S132において算出した、各セルの位置およびサイズとに基づいて、S124において取得した、各ボックスの文字列を、仮想罫線表において該当するセルに振り分けることによって、表データを生成する(S133)。ここで、表データのフォーマットは、例えばCSV(Comma-Separated Values)、XML(Extensible Markup Language)、Excel(登録商標)など、後続の処理フローにおいて必要なフォーマットでも良い。ここで、後続の処理フローは、例えば、ERP(Enterprise Resource Planning)、ECM(Enterprise Content Management)などでも良い。
【0066】
図10は、S133において生成された表データによって示される表の一例を示す図である。
【0067】
表データ生成部15bは、S122において特定されたボックスが
図7(a)に示すものである場合、
図10に示す表をS133において生成する。
【0068】
図4に示すように、表データ生成部15bは、S133の処理の後、
図4に示す表データ生成処理を終了する。
【0069】
図2に示すように、表データ生成部15bは、S104の表データ生成処理の後、現在の対象のページの画像からS102において検出した仮想罫線表領域のうち、未だ対象にしていない仮想罫線表領域が存在するか否かを判断する(S105)。
【0070】
表データ生成部15bは、現在の対象のページの画像からS102において検出した仮想罫線表領域のうち、未だ対象にしていない仮想罫線表領域が存在するとS105において判断すると、S103の処理を実行する。
【0071】
仮想罫線表領域検出部15aは、現在の対象のページの画像からS102において検出した仮想罫線表領域のうち、未だ対象にしていない仮想罫線表領域が存在しないとS105において判断されると、現在の対象のページが、対象画像データによって示される画像の最後のページであるか否かを判断する(S106)。
【0072】
仮想罫線表領域検出部15aは、現在の対象のページが、対象画像データによって示される画像の最後のページではないとS106において判断すると、対象画像データによって示される画像のページのうち、現在の対象のページの次のページを新たな対象にして(S107)、S102の処理を実行する。
【0073】
表統合部15cは、現在の対象のページが、対象画像データによって示される画像の最後のページであるとS106において判断されると、連続する複数の仮想罫線表が複数のページに跨って存在するか否かを判断する(S108)。ここで、表データ生成部15bは、互いの間に他の表が存在せず、互いの列数が同一である仮想罫線表の組を、互いに連続する仮想罫線表の組として判断する。
【0074】
表統合部15cは、連続する複数の仮想罫線表が複数のページに跨って存在するとS108において判断すると、複数のページに跨って存在する、連続する複数の仮想罫線表の表データを統合して1つの表の表データを生成する(S109)。ここで、表データ生成部15bは、連続する複数の仮想罫線表のそれぞれにおいて対応する列同士を連結することによって、連続する複数の仮想罫線表の表データを統合して1つの表の表データを生成する。
【0075】
図11(a)は、2回の表データ生成処理によって生成された2つの表の一例を示す図である。
図11(b)は、
図11(a)に示す2つの表が1つに統合された表を示す図である。
【0076】
図11(a)に示す2つの表が、2枚のページに跨って存在した、連続する2つの仮想罫線表からそれぞれ生成されたものである場合、表データ生成部15bは、S109において、
図11(a)に示す2つの表を1つに統合することによって、
図11(b)に示す表を生成する。
【0077】
図2に示すように、表データ生成部15bは、連続する複数の仮想罫線表が複数のページに跨って存在しないとS108において判断されるか、S109の処理が実行すると、今回の
図2に示す動作において生成した表データを後続の処理フローに出力して(S110)、
図2に示す動作を終了する。
【0078】
次に、オブジェクト検出器生成方法について説明する。
【0079】
図12は、本実施の形態に係るオブジェクト検出器生成方法のフローチャートである。
【0080】
図12に示すように、オブジェクト検出器14bの生成の作業者は、まず、画像データに対して、ラベル付けするとともに、仮想罫線表領域を指定することによって、学習データを作成する(S141)。
【0081】
図13(a)~(d)は、それぞれ「表1」というラベル名でラベル付けされた画像データの例を示す図である。
図14(a)~(e)は、それぞれ「表2」というラベル名でラベル付けされた画像データの例を示す図である。
【0082】
作業者は、S141において、
図13(a)~(d)および
図14(a)~(e)に示すように画像データに対して仮想罫線表領域20を指定する。なお、
図13(d)に示す画像データは、連続する複数の仮想罫線表が複数のページに跨って存在するものである。また、
図14(a)に示す画像データは、1つのページに複数の仮想罫線表が存在するものである。
【0083】
図12に示すように、作業者は、S141の工程の後、事前学習済みのオブジェクト検出器を用意する(S142)。S142において用意されるオブジェクト検出器は、仮想罫線表領域を画像から検出するためのものでなくて良い。S142において用意されるオブジェクト検出器は、例えば、100万個の学習データによって学習された、1000種類のオブジェクトを画像から検出するためのものである。
【0084】
作業者は、S142の工程の後、S142において用意したオブジェクト検出器における最終層を、10種類程度の少ない種類のオブジェクトを検出可能なものに交換する(S143)。
【0085】
作業者は、S143の工程の後、S143において生成したオブジェクト検出器に、S141において作成した学習データを学習させることによって、オブジェクト検出器14bを生成する(S144)。
【0086】
作業者は、テスト用の画像データを使用して、S144において生成したオブジェクト検出器14bをテストしても良い。作業者は、オブジェクト検出器14bのテストにおいて自動で予測された精度が好ましくない場合や、オブジェクト検出器14bのテストの結果の人間による評価が好ましくない場合、使用する学習データの数量を増やしたり、学習時のパラメーターを変更したりして再度学習させることができる。また、作業者は、オブジェクト検出器14bの学習時に、過学習気味であることが判明した場合に、使用する学習データの数量を減らすこともできる。
【0087】
なお、S141の工程は、S144の工程より前であれば、いつ実行されても良い。
【0088】
以上に説明したように、情報処理システム10は、画像データによって示される画像から仮想罫線表領域を、学習済みのオブジェクト検出器によって自動で検出する(S102)ので、利用者の負担を低減することができる。
【0089】
情報処理システム10は、複数のページに跨って存在する、連続する複数の仮想罫線表の表データを統合して1つの表の表データを生成する(S109)ので、利便性を向上することができる。
【0090】
情報処理システム10は、仮想罫線表領域の画像に罫線を、学習済みの罫線付加モデル14dによって自動で付加し(S127およびS129)、罫線が付加された画像に基づいて、仮想罫線表の各セルの位置およびサイズを算出する(S130~S132)ので、利便性を向上することができる。
【0091】
情報処理システム10は、仮想罫線表の1行目の画像と、仮想罫線表の1列目の画像とのみに罫線付加モデル14dによって罫線を付加し(S127およびS129)、罫線が付加された1行目の画像と、罫線が付加された1列目の画像とに基づいて、仮想罫線表の各セルの位置およびサイズを算出する(S130~S132)ので、罫線付加モデル14dによる罫線の付加の精度を特定の精度以上にするために必要な学習データの数量を低減することができる。したがって、情報処理システム10は、例えば、コストを大幅に削減することができる。
【0092】
情報処理システム10は、仮想罫線表の1行目に所属するボックスと、仮想罫線表の1列目に所属するボックスとを、学習済みの機械分類器14cによって自動で検出し(S125)、1行目に所属するボックスの位置およびサイズに基づいて1行目の画像を抽出し(S126)、1列目に所属するボックスの位置およびサイズに基づいて1列目の画像を抽出する(S128)ので、利便性を向上することができる。
【0093】
本実施の形態に係るオブジェクト検出器生成方法は、画像データによって示される画像から仮想罫線表領域を検出するためのオブジェクト検出器14bを、転移学習によって生成する(S142~S144)ので、オブジェクト検出器14bによる検出の精度を特定の精度以上にするために必要な学習データの数量を低減することができる。例えば、S144における学習に必要な学習データの数量は、100個程度でも良い。したがって、情報処理システム10は、例えば、コストを大幅に削減することができる。
【符号の説明】
【0094】
10 情報処理システム(表データ生成システム、コンピューター)
14a 表データ生成プログラム
14b オブジェクト検出器
14c 機械分類器
14d 罫線付加モデル(画像生成モデル)
15a 仮想罫線表領域検出部
15b 表データ生成部
15c 表統合部
20 仮想罫線表領域