特許7419668 | 知財ポータル「IP Force」

知財求人 - 知財ポータルサイト「IP Force」

▶ 京セラドキュメントソリューションズ株式会社の特許一覧

特許7419668画像処理装置および画像処理方法

書誌要約請求の範囲詳細な説明課題実施例実施するための形態図面の説明

目に優しい文字サイズ小中大 PDF Top

< >

1
2
3
4
5
6

(19)【発行国】日本国特許庁(JP)

(12)【公報種別】特許公報(B2)

(11)【特許番号】

(24)【登録日】2024-01-15

(45)【発行日】2024-01-23

(54)【発明の名称】画像処理装置および画像処理方法

(51)【国際特許分類】

G06T 7/00 20170101AFI20240116BHJP

【ＦＩ】

G06T7/00 350B

【請求項の数】 3

(21)【出願番号】P 2019090044

(22)【出願日】2019-05-10

(65)【公開番号】P2020187426

(43)【公開日】2020-11-19

【審査請求日】2022-05-10

(73)【特許権者】

【識別番号】000006150

【氏名又は名称】京セラドキュメントソリューションズ株式会社

(74)【代理人】

【識別番号】100168583

【弁理士】

【氏名又は名称】前井宏之

(72)【発明者】

【氏名】田中邦彦

【審査官】高野美帆子

(56)【参考文献】

【文献】特開２０１７－１０７４５５（ＪＰ，Ａ）

【文献】国際公開第２０１９／０１２５７０（ＷＯ，Ａ１）

【文献】中国特許出願公開第１０８５９４３２１（ＣＮ，Ａ）

(58)【調査した分野】(Int.Cl.，ＤＢ名)

Ｇ０６Ｔ７／００

(57)【特許請求の範囲】

【請求項1】

帳票を示す複数の第１画像を取得する取得部と、
前記複数の第１画像に基づいて、前記帳票の種類を分類する分類器を生成する学習部と、
生成された前記分類器に基づいて、前記複数の第１画像について注目領域を特定する特定部と、
前記複数の第１画像と、前記注目領域とに基づいて、複数の第２画像を生成する生成部と
を備え、
前記生成部は、
前記複数の第１画像について、それぞれｎ個の部分画像に分割する分割部と、
前記それぞれｎ個に分割された部分画像の中から、一の前記第１画像に近似する画像を構成するように、ｎ個の部分画像を選択する選択部と、
選択された前記ｎ個の部分画像によって構成される前記一の第１画像に近似する画像の前記注目領域に対応する部分を、前記一の第１画像の前記注目領域に対応する部分の画像に置換して前記第２画像を生成する置換部と
を備える、画像処理装置。

【請求項2】

前記特定部は、Ｇｒａｄ－ＣＡＭ技術を前記分類器に適用して生成された、ヒートマップによって強調された領域を前記注目領域として特定する、
請求項１に記載の画像処理装置。

【請求項3】

帳票を示す複数の第１画像を取得するステップと、
前記複数の第１画像に基づいて、前記帳票を分類する分類器を生成するステップと、
生成された前記分類器に基づいて、前記複数の第１画像について注目領域を特定するステップと、
前記複数の第１画像と、前記注目領域とに基づいて、複数の第２画像を生成するステップと
を包含し、
前記複数の第２画像を生成する前記ステップは、
前記複数の第１画像について、それぞれｎ個の部分画像に分割するステップと、
前記それぞれｎ個に分割された部分画像の中から、一の前記第１画像に近似する画像を構成するように、ｎ個の部分画像を選択するステップと、
選択された前記ｎ個の部分画像によって構成される前記一の第１画像に近似する画像の前記注目領域に対応する部分を、前記一の第１画像の前記注目領域に対応する部分の画像に置換して前記第２画像を生成するステップと
を包含する、画像処理方法。

【発明の詳細な説明】

【技術分野】

【0001】

本発明は、画像処理装置および画像処理方法に関する。

【背景技術】

【0002】

近年、画像認識又は画像解析の分野に深層学習（ディープラーニング）が利用されている。ところが、深層学習を利用して高精度の画像認識等を実現するためには、大量の学習用の画像データが必要になる。そこで、サンプル画像に対して左右反転処理又は回転処理を施すことにより、大量の画像データを生成する技術が提案されている（例えば、特許文献１参照）。

【先行技術文献】

【特許文献】

【0003】

【文献】特開２００６－３５０７０４号公報

【発明の概要】

【発明が解決しようとする課題】

【0004】

しかしながら、特許文献１の技術は、帳票を識別又は分類する分類器の学習に適用することは困難である。というのは、特許文献１で生成される画像は、サンプル画像に対して左右反転処理等の幾何変換を行ったものに過ぎず、実質的には同一の画像が繰り返し学習に使用されることとなる。つまり、膨大な種類のフォーマットがあり、記入される文字も印字文字および手書き文字等、多岐にわたる帳票の分類器を生成するための学習用データとしてはデータの範囲が狭いため、改善が望まれる。

【0005】

本発明は上記課題に鑑みてなされたものであり、その目的は、帳票を識別又は分類する分類器のための学習用データを大量に準備することが可能な画像処理装置および画像処理方法を提供することにある。

【課題を解決するための手段】

【0006】

本発明に係る画像処理装置は、取得部と、学習部と、特定部と、生成部とを備える。前記取得部は、帳票を示す複数の第１画像を取得する。前記学習部は、前記複数の第１画像に基づいて、前記帳票の種類を分類する分類器を生成する。前記特定部は、生成された前記分類器に基づいて、前記複数の第１画像について注目領域を特定する。前記生成部は、前記複数の第１画像と、前記注目領域とに基づいて、前記注目領域を含む複数の第２画像を生成する。

【0007】

本発明に係る画像処理方法は、帳票を示す複数の第１画像を取得するステップと、前記複数の第１画像に基づいて、前記帳票を分類する分類器を生成するステップと、生成された前記分類器に基づいて、前記複数の第１画像について注目領域を特定するステップと、前記複数の第１画像と、前記注目領域とに基づいて、前記注目領域を含む複数の第２画像を生成するステップとを包含する。

【発明の効果】

【0008】

本発明によれば、帳票を識別又は分類する分類器のための学習用データを大量に準備することが可能になる。

【図面の簡単な説明】

【0009】

【図1】本発明の実施形態に係る画像処理装置の構成を示す概略図である。

【図2】（ａ）は、画像処理装置の構成を示すブロック図である。（ｂ）は、生成部の構成を示すブロック図である。

【図3】（ａ）は、取得画像の一例を示す図である。（ｂ）は、ヒートマップ画像の一例を示す模式図である。（ｃ）は、取得画像とヒートマップ画像とを重ね合わせた画像の一例を示す模式図である。

【図4】取得画像の分割方法の一例を示す図である。

【図5】学習用データ生成処理の概略を示す模式図である。

【図6】学習用データ生成処理と分類器学習処理とを示すフローチャートである。

【発明を実施するための形態】

【0010】

以下、本発明の実施形態について、図面（図１～図６）を参照しながら説明する。なお、図中、同一又は相当部分については同一の参照符号を付して説明を繰り返さない。

【0011】

まず、図１および図２を参照して、本発明の実施形態に係る画像処理装置１００の構成について説明する。図１は、画像処理装置１００の構成を示す概略図である。

【0012】

図１に示すように、画像処理装置１００は、画像形成ユニット１と、画像読取ユニット２と、原稿搬送ユニット３と、入出力部４と、通信部５と、装置制御部６とを備える。本実施形態では、画像処理装置１００は、カラー方式の複合機である。

【0013】

画像形成ユニット１は、用紙Ｐに画像を形成する。

【0014】

画像読取ユニット２は、原稿Ｒの画像を読み取り、原稿Ｒを示す画像データを生成する。本実施形態では、原稿Ｒは帳票である。帳票は、例えば振込依頼書又は領収書である。

【0015】

原稿搬送ユニット３は、原稿Ｒを画像読取ユニット２に搬送する。入出力部４は、ユーザーに各種の情報を報知する。更に、入出力部４は、ユーザーから指示を受け付ける。

【0016】

通信部５は、他の電子機器から帳票を示す画像データを取得する。具体的には、通信部５は、ネットワーク網を介して接続する他の複合機から帳票を示す画像データを受信する。なお、通信部５は、「取得部」の一例である。

【0017】

装置制御部６は、画像処理装置１００の各構成部分の動作を制御する。

【0018】

画像形成ユニット１は、給紙部１２、搬送部Ｌ、トナー供給部１３、画像形成部１４、定着部１６および排出部１７を備える。画像形成部１４は、転写部１５を含む。

【0019】

給紙部１２は、用紙Ｐを搬送部Ｌへ供給する。搬送部Ｌは、用紙Ｐを転写部１５および定着部１６を経由して排出部１７まで搬送する。

【0020】

トナー供給部１３は、画像形成部１４にトナーを供給する。画像形成部１４は、用紙Ｐに画像を形成する。

【0021】

転写部１５は、中間転写ベルト１５４を備える。画像形成部１４が、中間転写ベルト１５４上にシアン色、マゼンタ色、イエロー色、および黒色のトナー像を転写する。複数色のトナー像が中間転写ベルト１５４上で重畳され、中間転写ベルト１５４上に画像が形成される。転写部１５は、中間転写ベルト１５４上に形成された画像を、用紙Ｐ上に転写する。その結果、用紙Ｐに画像が形成される。

【0022】

定着部１６は、用紙Ｐを加熱および加圧し、用紙Ｐに形成された画像を用紙Ｐに定着させる。排出部１７は、画像処理装置１００の外部に用紙Ｐを排出する。

【0023】

画像読取ユニット２は、画像読取部２１を備える。画像読取部２１は、原稿Ｒの画像を読み取り、画像データを生成する。具体的には、画像読取部２１は、帳票の画像を読み取り、帳票を示す画像データを生成する。画像読取部２１は、ＬＥＤ（ＬｉｇｈｔＥｍｉｔｔｉｎｇＤｉｏｄｅ）、コンタクトガラス、結像レンズ、およびイメージセンサーを備え、これらの各部材が一体化されたＣＩＳ（ＣｏｎｔａｃｔＩｍａｇｅＳｅｎｓｏｒ）ユニットである。なお、画像読取部２１は、「取得部」の一例である。以下、画像読取部２１を介して取得した帳票を示す画像、又は通信部５を介して取得した帳票を示す画像を「取得画像」という。取得画像は、「第１画像」の一例である。

【0024】

入出力部４は、表示部４１および受付部４２を有する。表示部４１は、画面上に各種の情報を表示する。受付部４２は、ユーザーから指示を受け付ける。入出力部４は、テンキーを含む。入出力部４は、文字入力キーを含んでもよい。入出力部４は、例えばタッチパネルを有する液晶ディスプレーである。

【0025】

通信部５は、同じ通信方式（プロトコル）を利用する電子機器との間で通信が可能である。本実施形態において、通信部５は、装置制御部６の指示に応じて、インターネットおよびＬＡＮ（ＬｏｃａｌＡｒｅａＮｅｔｗｏｒｋ）などのネットワーク網と接続する。通信部５は、例えば、ＬＡＮボードのような通信モジュールである。

【0026】

装置制御部６は、制御プログラムに基づいて、画像処理装置１００の各構成部分の動作を制御する。

【0027】

図２（ａ）は、画像処理装置１００の構成を示すブロック図である。図２（ｂ）は、生成部６１３の構成を示すブロック図である。図１を参照して説明したように、画像処理装置１００は、画像形成ユニット１と、画像読取ユニット２と、原稿搬送ユニット３と、入出力部４と、通信部５と、装置制御部６とを備える。以下では、装置制御部６について、更に詳細に説明する。

【0028】

装置制御部６は、図２（ａ）に示すように、処理部６１と、記憶部６２とを備える。処理部６１は、例えば、プロセッサーである。プロセッサーは、例えばＣＰＵ（ＣｅｎｔｒａｌＰｒｏｃｅｓｓｉｎｇＵｎｉｔ）である。プロセッサーは、特定用途集積回路（ＡｐｐｌｉｃａｔｉｏｎＳｐｅｃｉｆｉｃＩｎｔｅｇｒａｔｅｄＣｉｒｃｕｉｔ：ＡＳＩＣ）を含んでもよい。処理部６１は、記憶部６２に記憶された制御プログラムを実行することによって、画像処理装置１００の各構成部分の動作を制御する。

【0029】

記憶部６２は、画像処理装置１００の制御に関する各種のデータ、および制御プログラムを記憶する。記憶部６２は、例えば、ＲＯＭ（ＲｅａｄＯｎｌｙＭｅｍｏｒｙ）、ＲＡＭ（ＲａｎｄｏｍＡｃｃｅｓｓＭｅｍｏｒｙ）、および／又はソリッドステートドライブ（ＳｏｌｉｄＳｔａｔｅＤｒｉｖｅ：ＳＳＤ）によって構成される。記憶部６２は、外部メモリーを含んでいてもよい。外部メモリーは、リムーバブルメディアである。記憶部６２は、外部メモリーとして、例えば、ＵＳＢ（ＵｎｉｖｅｒｓａｌＳｅｒｉａｌＢｕｓ）メモリー、および／又はＳＤ（ＳｅｃｕｒｅＤｉｇｉｔａｌ）カードを含んでもよい。

【0030】

更に、記憶部６２は、通信部５を介して受信した画像データ、又は画像読取部２１で生成された画像データを記憶する。また、記憶部６２は、生成部６１３で生成された画像の画像データを記憶する。以下、生成部６１３で生成された画像を「生成画像」という。生成画像は、「第２画像」の一例である。

【0031】

処理部６１は、学習部６１１と、特定部６１２と、生成部６１３と、制御部６１４とを含む。本実施形態において、処理部６１が記憶部６２に格納された制御プログラムを実行することによって、制御プログラムが、学習部６１１と、特定部６１２と、生成部６１３と、制御部６１４との機能を実現する。

【0032】

学習部６１１は、複数の取得画像に基づいて、帳票の種類を分類する分類器を生成する。具体的には、学習部６１１は、複数の取得画像を入力して機械学習を実行して、分類器を生成する。例えば、分類器は、特定の「振込依頼書」と、特定の「領収書」とを分類する。なお、取得画像は、正解の教師データと、不正解の教師データとを含む。

【0033】

特定部６１２は、複数の取得画像について、注目部位を示す注目領域を特定する。なお、特定部６１２は、分類器にＧｒａｄ－ＣＡＭ技術を適用して生成されたヒートマップによって強調された領域を注目領域として特定してもよい。

【0034】

更に、特定部６１２は、注目領域に含まれている記載内容と、第１画像の中に占める注目領域の位置とを特定してもよい。これにより、特定の帳票毎に異なる注目領域と、注目領域に含まれている記載内容とを特定することができるので、個々の帳票に則した学習用データを準備することが可能となる。

【0035】

生成部６１３は、複数の取得画像に基づいて、注目領域を含む複数の第２画像を生成する。具体的には、生成部６１３は、図２（ｂ）を参照して後述するように、複数の取得画像について、それぞれｎ個の部分画像に分割する。更に生成部６１３は、それぞれｎ個に分割された部分画像の中から、一つの取得画像に近似する画像を構成するように、ｎ個の部分画像を選択する。そして、生成部６１３は、選択されたｎ個の部分画像によって構成される一つの取得画像に近似する画像の一部と、注目領域とを置換する。

【0036】

制御部６１４は、記憶部６２に記憶された制御プログラムを実行することによって、画像処理装置１００の各構成部分の動作を制御する。

【0037】

図２（ｂ）は、生成部６１３の構成を示すブロック図である。図２（ｂ）に示すように、生成部６１３は、分割部６１３１と、選択部６１３２と、置換部６１３３とを備える。

【0038】

分割部６１３１は、複数の第１画像について、それぞれｎ個の部分画像に分割する。

【0039】

選択部６１３２は、それぞれｎ個に分割された部分画像の中から、一の第１画像に近似する画像を構成するように、ｎ個の部分画像を選択する。

【0040】

置換部６１３３は、選択されたｎ個の部分画像によって構成される一の第１画像に近似する画像の一部と、注目領域とを置換する。

【0041】

次に、図３～図５を参照して、学習用データ生成処理について説明する。図３（ａ）は、取得画像３００の一例を示す図である。取得画像３００は、実際の帳票をスキャナー等で読み取った画像である。図３（ａ）に示すように、取得画像３００は、帳票タイトル３０１と、帳票内容３０２とを含む。帳票タイトル３０１は、帳票の名称を示す。本実施形態では、帳票タイトル３０１は、「○○振込依頼書」である。帳票内容３０２は、帳票の具体的な内容を示す。なお、取得画像３００は、「第１画像」の一例である。

【0042】

図３（ｂ）は、ヒートマップ画像３１０の一例を示す模式図である。本実施形態では、ヒートマップ画像３１０は、特定部６１２が分類器にＧｒａｄ－ＣＡＭ技術を適用した場合に生成される画像である。ヒートマップ画像３１０は、注目領域３１１と、非注目領域３１２とを含む。注目領域３１１は、機械学習の実行過程で注目された領域である。更に、注目領域３１１は、第１領域３１１ａと、第２領域３１１ｂとを含む。第１領域３１１ａの注目度は、第２領域３１１ｂの注目度より高い。Ｇｒａｄ－ＣＡＭ技術を適用した場合に、第１領域３１１ａは、例えば「赤色」のヒートマップとして示され、第２領域３１１ｂは「黄色」のヒートマップとして示される。

【0043】

非注目領域３１２は、ヒートマップ画像３１０から注目領域３１１を除いた領域であり、図３（ｂ）ではドットパターンで示されている。なお、非注目領域３１２は、Ｇｒａｄ－ＣＡＭ技術を適用した場合は、例えば「青色」で示される。

【0044】

図３（ｃ）は、取得画像３００とヒートマップ画像３１０とを重ね合わせた重畳画像３２０の一例を示す模式図である。図３（ｃ）に示すように、重畳画像３２０は、取得画像３００に、注目領域３１１および非注目領域３１２が重畳されている。

【0045】

図４は、分割部６１３１による取得画像４００の分割方法の一例を示す図である。本実施形態では、分割部６１３１は、取得画像４００を４分割する。したがって、例えば、「２０枚」の取得画像４００を用意した場合は、最多で「１６００００枚」の生成画像を生成することができる。

【0046】

次に、図５を参照して、学習用データ生成処理について説明する。図５は、学習用データ生成処理の概略を示す模式図である。図５において、取得画像５１０～取得画像５４０は、生成画像を生成するために用意された複数枚（例えば、２０枚）取得画像のうちの一部を示す。画像５５０は、生成画像５６０を生成する途中の画像である。生成画像５６０は、生成部６１３で生成される生成画像を示す。

【0047】

図５に示すように、学習用データ生成処理を実行することによって、複数の取得画像に基づいて、生成画像が生成される。具体的には、取得画像５１０～取得画像５４０から１枚の生成画像５６０が生成される。

【0048】

本実施形態では、まず、分割部６１３１が、取得画像５１０～取得画像５４０のそれぞれをｎ分割（ｎ＝４）する。例えば、分割部６１３１は、取得画像５１０を部分画像ａ１１と、部分画像ａ１２と、部分画像ａ２１と、部分画像ａ２２とに４分割する。

【0049】

次に、選択部６１３２が、取得画像５１０から部分画像ａ１１を選択し、取得画像５２０から部分画像ｂ１２を選択し、取得画像５３０から部分画像ｃ２１を選択し、取得画像５４０からｄ２２を選択して、画像５５０を生成する。

【0050】

最後に、置換部６１３３が、画像５５０の一部と注目領域３１１とを置換する。

【0051】

次に、図６を参照して、学習用データ生成処理と分類器学習処理とについて説明する。学習用データ生成処理６０１は、ステップＳ２～ステップＳ１２によって実行される。分類器学習処理６０２は、ステップＳ１４によって実行される。

【0052】

ステップＳ２：学習部６１１は、帳票を示す複数の画像を取得し、複数の画像に基づいて学習を行い、帳票の分類器を生成する。処理は、ステップＳ４に進む。

【0053】

ステップＳ４：特定部６１２は、複数の画像に基づいて、ヒートマップを生成する。処理は、ステップＳ６に進む。

【0054】

ステップＳ６：特定部６１２は、ヒートマップに基づいて、注目領域３１１を検出し、記憶部６２に記憶する。処理は、ステップＳ８に進む。処理は、ステップＳ８に進む。

【0055】

ステップＳ８：生成部６１３は、置換用画像を生成する。処理は、ステップＳ１０に進む。

【0056】

ステップＳ１０：生成部６１３は、置換用画像に対して、非注目領域３１２の画像を置き換える。処理は、ステップＳ１２に進む。

【0057】

ステップＳ１２：制御部６１４は、所定数の学習用データを生成したか否かを判定する。所定数の学習用データを生成したと制御部６１４が判定した場合（ステップＳ１２でＹｅｓ）、処理は終了する。所定数の学習用データを生成していないと制御部６１４が判定した場合（ステップＳ１２でＮｏ）、処理はステップＳ８に戻る。所定数は、例えば「２０」である。

【0058】

ステップＳ１４：学習部６１１は、所定数の学習用データを用いて、分類器を学習する。処理は終了する。

【0059】

以上のように、本実施形態の画像処理装置１００によれば、生成部６１３は、複数の取得画像５１０～取得画像５４０と、注目領域３１１とに基づいて、注目領域３１１を含む複数の生成画像５６０を生成する。したがって、機械学習で生成した分類器に基づいて特定された注目領域３１１の画像を含む生成画像５６０を大量に生成することができる。その結果、分類器の学習に適度に貢献し得る学習用データを大量に準備することが可能になる。

【0060】

以上、図面（図１～図６）を参照しながら本発明の実施形態を説明した。但し、本発明は、上記の実施形態に限られるものではなく、その要旨を逸脱しない範囲で種々の態様において実施することが可能である（例えば、下記に示す（１）、（２））。図面は、理解しやすくするために、それぞれの構成要素を主体に模式的に示しており、図示された各構成要素の厚み、長さ、個数等は、図面作成の都合上から実際とは異なる。また、上記の実施形態で示す各構成要素の材質や形状、寸法等は一例であって、特に限定されるものではなく、本発明の効果から実質的に逸脱しない範囲で種々の変更が可能である。

【0061】

（１）本発明の実施形態では、画像処理装置１００として複合機を挙げて説明したが、画像処理装置１００は複合機に限定されない。画像処理装置１００は、例えば、スキャナーと接続可能なパーソナルコンピューターであってもよい。

【0062】

（２）また、本発明は、本発明に係る画像処理装置の特徴的な構成手段をステップとする画像処理方法として実現したり、それらのステップを含む制御プログラムとして実現したりすることもできる。また、そのプログラムは、ＣＤ－ＲＯＭ等の非一時的に記録した記録媒体、又は通信ネットワーク等の伝送媒体を介して流通させることもできる。

【産業上の利用可能性】

【0063】

本発明は、画像処理装置の分野に利用可能である。

【符号の説明】

【0064】

２１画像読取部（取得部）
５通信部（取得部）
６装置制御部
６１処理部
６１１学習部
６１２特定部
６１３生成部
６１３１分割部
６１３２選択部
６１３３置換部
６１４制御部
６２記憶部
１００画像処理装置
３００，４００，５１０，５２０，５３０，５４０取得画像（第１画像）
５６０生成画像（第２画像）

【図1】

【図2】

【図3】

【図4】

【図5】

【図6】

知財求人

知財求人お知らせサービス

知財のニュースを調べる
- 知財ニュース
- 知財周辺ニュース
企業の特許を調べる
知財のセミナーを調べる
知財,特許事務所への求職・転職
特許事務所をさがす
弁理士試験を受ける
- 年の弁理士試験情報
- 弁理士試験の合格率など統計
知財の法律をしらべる
期限日をしらべる
- 今日に対して意見書・補正書の期限
- 今日に対して審査請求期限日
知財の判決をしらべる
コンテンツ・リンク
運営会社
プレスの皆様へ
- お問い合わせ
ユーザーの皆様
- お問い合わせ・フィードバック
広告掲載を希望の皆様へ
- 広告掲載について
- 求人広告の掲載について

IP Force 特許公報掲載プロジェクト 2022.1.31 β版