(19)【発行国】日本国特許庁(JP)
(12)【公報種別】公開特許公報(A)
(11)【公開番号】P2024178745
(43)【公開日】2024-12-25
(54)【発明の名称】画像処理装置および画像処理方法
(51)【国際特許分類】
G06V 30/12 20220101AFI20241218BHJP
【FI】
G06V30/12 B
【審査請求】未請求
【請求項の数】7
【出願形態】OL
(21)【出願番号】P 2023097120
(22)【出願日】2023-06-13
(71)【出願人】
【識別番号】000005049
【氏名又は名称】シャープ株式会社
(74)【代理人】
【識別番号】100103034
【弁理士】
【氏名又は名称】野河 信久
(74)【代理人】
【識別番号】100159385
【弁理士】
【氏名又は名称】甲斐 伸二
(74)【代理人】
【識別番号】100163407
【弁理士】
【氏名又は名称】金子 裕輔
(74)【代理人】
【識別番号】100166936
【弁理士】
【氏名又は名称】稲本 潔
(74)【代理人】
【識別番号】100174883
【弁理士】
【氏名又は名称】冨田 雅己
(74)【代理人】
【識別番号】100189429
【弁理士】
【氏名又は名称】保田 英樹
(74)【代理人】
【識別番号】100213849
【弁理士】
【氏名又は名称】澄川 広司
(72)【発明者】
【氏名】水口 幸則
【テーマコード(参考)】
5B064
【Fターム(参考)】
5B064EA04
5B064EA12
5B064EA13
5B064FA04
5B064FA05
(57)【要約】 (修正有)
【課題】領収書や名刺のような誤認識が生じやすい原稿の確認を人が容易に行えるようにする画像処理装置および画像処理方法を提供する。
【解決手段】画像処理装置としての複合機は、原稿を読み取る原稿読取部13と、読み取られた原稿に対する文字認識処理を行う文字認識部12C、文字認識処理によって得られた語句の中から、原稿の種類に応じて設定された1以上の項目に属する語句を抽出して抽出された語句を原稿に紐付けて表示させる語句抽出部12X及び何れかの項目につきその項目に属する語句をソートしてソートされた順にその語句に紐付いた原稿およびその原稿に紐ついた各項目の語句を操作部に表示させ、操作部を介して語句の修正を受け付ける読取制御部12Rを備える画像処理部12と、を含む。
【選択図】
図1
【特許請求の範囲】
【請求項1】
原稿を読み取る原稿読取部と、
読み取られた原稿に対する文字認識処理を行う文字認識部と、
前記文字認識処理によって得られた語句の中から、原稿の種類に応じて設定された1以上の項目に属する語句を抽出して抽出された語句を原稿に紐付けて表示させる語句抽出部と、
何れかの項目につきその項目に属する語句をソートしてソートされた順にその語句に紐付いた原稿およびその原稿に紐ついた各項目の語句を操作部に表示させ、前記操作部を介して前記語句の修正を受け付ける読取制御部と、
を備える画像処理装置。
【請求項2】
前記読取制御部は、前記ソートを行う項目のユーザによる選択を受け付ける請求項1に記載の画像処理装置。
【請求項3】
前記読取制御部は、原稿の種類に応じて設定された前記項目のうち語句を抽出する項目のユーザによる選択を受け付ける請求項1に記載の画像処理装置。
【請求項4】
前記読取制御部は、前記操作部に表示された語句の修正を受け付ける場合に、ソート順で一つ前の原稿に係る同一項目の語句に揃えるワンタッチ操作を受け付ける請求項1に記載の画像処理装置。
【請求項5】
前記読取制御部は、ソート順に各原稿に係る各項目の語句を表示させる際に、ソート順で一つ前の原稿に係る同一項目の語句との異同を判断し、異なる部分を同じ部分と異なる表示態様で表示させる請求項1に記載の画像処理装置。
【請求項6】
前記語句抽出部は、ユーザが指定した特定の種類の原稿に対してその種類に応じた項目に属する語句を抽出して抽出された語句を原稿に紐付けて表示させる請求項1に記載の画像処理装置。
【請求項7】
画像処理装置の制御部が、
原稿読取部を用いて、原稿を読み取るステップと、
読み取られた原稿の文字認識処理を行うステップと、
前記文字認識処理によって得られた語句の中から、原稿の種類に応じて設定された1以上の項目に属する語句を抽出して抽出された語句を原稿に紐付けて表示させるステップと、
何れかの項目につきその項目に属する語句をソートしてソートされた順にその語句に紐付いた原稿およびその原稿に係る各項目の語句を操作部に表示させるステップと、
表示された語句の修正を受け付けるステップと、
を備える画像処理方法。
【発明の詳細な説明】
【技術分野】
【0001】
本開示は、原稿を読み取って読み取られた原稿に対する文字認識処理を行う画像処理装置および画像処理方法に関する。
【背景技術】
【0002】
原稿を画像として読み取るだけでなく、原稿の画像から文字の認識を行う画像形成装置が知られている。文字認識の結果を原稿と紐付けることによって、例えば文字列検索が可能になったり文字に関する属性に基づく分類が可能なったりして活用がし易くなる。しかし、文字認識の結果が必ずしも正しいとは限らないため、特に重要なものは認識結果を人の目で確認して誤りを修正する必要があるのが現状である。しかし、人手による確認作業は時間を要し確認する者の負担が大きい。そこで、確認作業の負担を軽減するために以下のものが提案されている。
【0003】
1つの誤認識文字を修正する際に、その誤認識文字と一致した画像情報を探し出し、一度に複数の箇所を修正できるようにし、そのような一括修正を可能としながらも文字修正の精度を向上させるものである(例えば、特許文献1参照)。文字修正の精度を向上させるために、特許文献1のものは作業者の操作指令に基づいて、文字列の中から任意の文字を選択するステップと、選択された任意の文字を作業者の操作指令に従う所定の文字に置換するステップを備える。そして、文字認識された文字列の中から、選択された任意の文字と略一致する文字が自動修正対象文字として順に選択され、その自動修正対象文字前記所定の文字に一旦置換する。さらに、置換された文字の前後についての構文を解析し、その解析の結果に基づいて、一旦置換された結果を正当なものと確定する。そのようにして、自動的に行なった文字の修正が正しい構文となる場合に限り、その修正が正当なものと確定される。このために、文字修正の精度を向上することができる。
【先行技術文献】
【特許文献】
【0004】
【発明の概要】
【発明が解決しようとする課題】
【0005】
画像処理装置が読み取る原稿の中には、領収書や名刺といったものも含まれる。それらは一般的なA4サイズよりも小さなサイズであることが多く、例えば、マルチクロップ機能を適用するによって複数の原稿を効率よく読み取ることができる。しかし、領収書は手書き文字を含んでいたり、文字に重なって捺印されていたりする場合が多い。名刺は小さい文字や飾り文字が多い。そのため、文字認識を行っても同じ文字の特徴が類似してないと判定されたり、別の文字を特徴が類似しているとされたりする可能性が高い。通常のフォントの書体で印刷された一般的なオフィス文書に比べると誤認識される可能性が高い。また、たとえ自動修正がなされる画像処理装置で読み取られたとしても、誤った自動修正が行われる可能性が否定できない。
【0006】
本開示は、以上のような事情を考慮してなされたものであって、領収書や名刺のような誤認識が生じやすい原稿の確認を人が容易に行える手法を提供するものである。
【課題を解決するための手段】
【0007】
本開示は、原稿を読み取る原稿読取部と、読み取られた原稿に対する文字認識処理を行う文字認識部と、前記文字認識処理によって得られた語句の中から、原稿の種類に応じて設定された1以上の項目に属する語句を抽出して抽出された語句を原稿に紐付けて表示させる語句抽出部と、何れかの項目につきその項目に属する語句をソートしてソートされた順にその語句に紐付いた原稿およびその原稿に紐ついた各項目の語句を操作部に表示させ、前記操作部を介して前記語句の修正を受け付ける読取制御部と、を備える画像処理装置を提供する。
【0008】
また、異なる観点から本開示は、画像処理装置の制御部が、原稿読取部を用いて、原稿を読み取るステップと、読み取られた原稿の文字認識処理を行うステップと、前記文字認識処理によって得られた語句の中から、原稿の種類に応じて設定された1以上の項目に属する語句を抽出して抽出された語句を原稿に紐付けて表示させるステップと、何れかの項目につきその項目に属する語句をソートしてソートされた順にその語句に紐付いた原稿およびその原稿に係る各項目の語句を操作部に表示させるステップと、表示された語句の修正を受け付けるステップと、を備える画像処理方法を提供する。
【発明の効果】
【0009】
本開示による画像処理装置は、原稿の種類に応じて設定された1以上の項目に属する語句を抽出して抽出された語句を原稿に紐付けて表示させる語句抽出部と、何れかの項目につきその項目に属する語句をソートしてソートされた順にその語句に紐付いた原稿およびその原稿に紐ついた各項目の語句を操作部に表示させ、前記操作部を介して前記語句の修正を受け付ける読取制御部を備えるので、原稿とそれに紐ついたある項目の語句とをソート順に確認することで、領収書や名刺のような誤認識が生じやすい原稿の確認を人が容易に行える。
本開示による画像処理方法も同様の作用効果を奏する。
【図面の簡単な説明】
【0010】
【
図1】本開示において、画像形成装置の一例として示す複合機の構成を示すブロック図である。
【
図2】
図1に示す複合機における原稿読取部に対応する部分の外観斜視図である。
【
図3】原稿の種類が領収書の場合に抽出する項目およびソートする項目についての設定を受け付ける画面の一例を示す説明図である。
【
図4】原稿の種類が名刺の場合に抽出する項目およびソートする項目についての設定を受け付ける画面の一例を示す説明図である。
【
図5】実施の形態1において制御部が実行する原稿種類の選択および抽出語句の確認に係る処理の例を示す第1のフローチャートである。
【
図6】実施の形態1において制御部が実行する原稿種類の選択および抽出語句の確認に係る処理の例を示す第2のフローチャートである。
【
図7】実施の形態1において制御部が操作部に表示させる原稿種別選択画面の一例を示す説明図である。
【
図8】実施の形態1において、制御部が操作部に表示させる確認修正画面の一例を示す説明図である。
【
図9】実施の形態2において、
図8に示す例の領収書の次に確認修正画面に表示された原稿の一例を示す説明図である。
【発明を実施するための形態】
【0011】
以下、図面を用いて本開示をさらに詳述する。なお、以下の説明は、すべての点で例示であって、本開示を限定するものと解されるべきではない。
(実施の形態1)
まず、本開示における画像形成装置について述べる。
図1は、本開示において、画像形成装置の一例として示す複合機の構成を示すブロック図である。
図2は、
図1に示す複合機の原稿読取部に対応する部分の外観斜視図である。
【0012】
図1に示すように、複合機10は、制御部11、原稿読取部13、印刷部14、操作部15および記憶部16を備える。制御部11は、ハードウェア資源として、プロセッサおよびメモリを中心に構成される。プロセッサに加えて、入出力インターフェース回路、タイマ回路、通信回路等のハードウェア資源で構成される回路である。プロセッサがメモリに格納された制御プログラムを実行することによって操作の認識、表示の制御に係る処理が実現される。また、原稿の読取りや画像の印刷等に係るジョブ、即ち一連の画像処理に係る処理が実現される。即ち、ソフトウェア資源とハードウェア資源とが協働することによって、複合機10の制御を行う制御部11としての機能が実現される。
【0013】
本開示による制御部11は、操作制御部17、ファイル制御部18、ジョブ制御部19および画像処理部12を備える。画像処理部12は、読取制御部12R、印刷制御部12P、文字認識部12Cおよび語句抽出部12Xを備える。操作部15は、表示部15Dおよび操作検出部15Sを備える。
【0014】
制御部11が備える操作制御部17は、操作部15と接続されており、操作部15の操作検出部15Sが受け付けたユーザの操作を認識し、また、操作部15の表示部15Dに表示させる表示データを生成する。
図2に示すように、操作部15は、複合機10の手前側に設けられる。操作部15は、操作制御部17が生成した操作画面を表示する表示デバイス(表示部15D)を有する。さらに、その操作画面に対するユーザからの指示を受け付ける操作検出デバイス(操作検出部15S)を有する。表示デバイスとしては、例えば液晶表示デバイスやOLED(Organic Light Emitting Display)が適用可能であり、操作検出デバイスとしてはタッチパネルが適用可能である。操作制御部17は、上述の操作検出デバイスと通信して操作検出デバイスによって検出されたユーザの操作、即ちユーザからの指示を認識する。また、上述の表示デバイスに表示データを送信して操作画面として表示させる。制御部11が備えるファイル制御部18は、記憶部16に格納されたデータを管理し、読み書きを制御する。
【0015】
制御部11が備える画像処理部12は、原稿読取部13から出力される読取画像の信号に基づいて原稿の画像データを生成する。生成された原稿の画像データは、スキャンジョブの場合、記憶部16に格納され、あるいは不図示の通信回路を介して外部の機器へ送信される。読取制御部12Rは、それらの原稿の読み取りに係る処理を制御する。コピージョブの場合、原稿の画像データは、印刷部14へ送られて印刷される。プリントジョブの場合は、前記通信回路を介して外部の機器から受信したジョブデータに基づいて印刷用の画像データを生成し、印刷部14で印刷する。印刷制御部12Pは、それらの印刷に係る処理を制御する。文字認識部12Cは、原稿の画像データに含まれる文字を認識する。語句抽出部12Xは、原稿の種類に応じて設定され項目に属する語句を抽出する。そして、抽出された語句を原稿に紐付けて、少なくとも一時的に記憶部16に格納する。文字認識部12Cおよび語句抽出部12Xについては後述する。
【0016】
制御部11が備えるジョブ制御部19は、操作制御部17が認識したユーザからの指示に応じてジョブの設定あるいは実行に係る制御を行う。また、前記通信回路を介して印刷ホストとしての外部機器からの指示に応じてジョブの設定あるいは実行に係る制御を行う。例えば、ジョブの設定に係る指示の場合は対象の設定を更新する。操作画面の更新を伴う場合は、操作制御部17が更新された操作画面の表示データを生成して操作部15の表示デバイスに送る。それによって、操作画面が更新される。ジョブの実行に係る指示を受領した場合、ジョブ制御部19は受領したジョブの種類(例えば、スキャンジョブ、コピージョブ、印刷ジョブ)に応じて原稿読取部13、印刷部14および画像処理部12を制御し、画像データの流れを制御して指示されたジョブを実行する。さらに述べると、ジョブ制御部19は原稿読取部13および印刷部14の各所に配置されたセンサー(
図1に不図示)が検出する状態を認識する。そして、原稿読取部13および印刷部14に配置されたモータ、アクチュエータ、デバイス等(
図1に不図示)の動作を制御する。また、ジョブ制御部19は、画像処理部12の画像に係る処理を制御する。
【0017】
記憶部16は、HDD(Hard Disk Drive)やSDD(Solid State Drive)といった書き換え可能な不揮発性メモリと画像データを格納するDRAM(Dynamic Random Access Memory)といった揮発性メモリの何れかまたは両方を備える。
図1において記憶部16が、制御部11と別のブロックとして示しているが、制御部11に含まれる態様もあり得る。即ち、記憶部16が、制御部11と同じ回路基板上に実装される態様もあり得る。記憶部16は、原稿の種類に応じた1以上の項目を記憶し、語句抽出部12Xは記憶部16に格納されている、原稿の種類に応じた項目を参照して各項目に属する語句を抽出する。さらに、記憶部16は文字認識部12Cが文字認識を行う際に用いる辞書を格納していてもよい。
【0018】
原稿読取部13は、ジョブ制御部19の制御下で原稿の画像を読取って、RGB(レッド、グリーンおよびブルー)のカラー画像信号(RGBアナログ信号)に変換する。即ち、コピージョブおよびスキャンジョブにおける画像読取の処理を実行する。読み取られる原稿は、原稿送り装置13Fまたは原稿台13Pにユーザがセットする。原稿送り装置13Fは、原稿を所定の読取位置へ1枚ずつ搬送する。原稿台13Pは、平坦で透明なガラス部材からなる。原稿読取部13は、イメージセンサ(
図1および
図2に不図示)を備える。原稿台13Pに置かれた原稿を走査するための走査機構(
図1および
図2に不図示)を備える。画像処理部12は、イメージセンサで読み取られた読取画像の信号に基づいて原稿の画像データを生成する。また、前記通信回路を介して外部の機器から受信する印刷データに基づいて印刷用の画像データを生成する。生成された画像データは、印刷部14へ送られて印刷され、あるいは前記通信回路を介して外部の機器へ送信される。
【0019】
印刷部14は、印刷シートを収容する給紙トレイ14A、14Bおよび14Cの何れかから印刷シートを一枚ずつ給送してその印刷シートに画像を印刷し、排出トレイに出力する。
図1および
図2に示すように、複合機10は3つの排出トレイ14D、14Eおよび14Fの何れかに印刷済みの印刷シートを出力する。
【0020】
≪特定種類の原稿からの語句抽出と確認≫
続いて、本開示による画像処理装置が特定の種類の原稿から項目に属する語句を抽出して、抽出された語句の確認をユーザに行わせる処理について述べる。
図3および
図4は、原稿の種類に応じて抽出する項目およびソートする項目につきユーザの設定を受け付ける抽出/ソート項目選択画面の一例を示す説明図である。
図3に示す抽出/ソート項目選択画面30は原稿の種類が領収書の場合に対応するものである。
図4に示す抽出/ソート項目選択画面40は原稿の種類が名刺の場合に対応するものである。語句を抽出する項目をユーザ選択可能とすれば、ユーザの意図に応じた項目の選択を受け付けてその項目に属する語句を抽出させることができるので、不要な項目に係る語句抽出部や読取制御部の処理を省略することで処理負荷を軽減できる。また、ソートを行う項目をユーザ選択可能とすれば、ユーザの意図に応じた項目についてその項目に属する語句のソート順に語句に紐ついた原稿および紐ついた語句を表示させることができるので、抽出された語句の確認をユーザが容易に行える。
【0021】
図3に示す抽出/ソート項目選択画面30は、領収書に記載される項目として、取引先、年月日、金額および宛名等が用意されていることを示している。設定領域31は予め用意された項目のうち、何れの項目を抽出するかのユーザによる選択を受け付ける。さらに、読み取った原稿を確認のために表示させる際、何れの項目についてソートしてソート順に表示させるかの選択を受け付ける。選択する欄をユーザがタッチすると、操作制御部は、その項目が選択されたことを示す〇印を表示させる。設定領域31は、用意された項目のうち、取引先、年月日および金額が選択されたことを示している。また、設定領域31は、取引先の項目についてソートすることを示している。[登録]キー32の操作を認識すると、読取制御部12Rとして制御部11は設定領域31の設定内容を記憶部16に記憶する。一方、[キャンセル]キー33の操作を認識すると、読取制御部12Rとして制御部11は設定領域の設定内容を破棄して以前の設定内容を保持する。
【0022】
また、
図4に示す抽出/ソート項目選択画面40は、名刺に記載される項目として、会社名、名前、電話番号、メールアドレス等が用意されていることを示している。設定領域41は予め用意された項目のうち、何れの項目を抽出するかのユーザによる選択を受け付ける。さらに、読み取った原稿を確認のために表示させる際、何れの項目についてソートしてソート順に表示させるかの選択を受け付ける。選択する欄をユーザがタッチすると、操作制御部は、その項目が選択されたことを示す〇印を表示させる。設定領域41は、用意された項目のうち、会社名、名前および電話番号が選択されたことを示している。また、設定領域41は、会社名の項目についてソートすることを示している。[登録]キー42の操作を認識すると、読取制御部12Rとして制御部11は設定領域41の設定内容を記憶部16に記憶する。一方、[キャンセル]キー43の操作を認識すると、読取制御部12Rとして制御部11は設定領域の設定内容を破棄して以前の設定内容を保持する。
【0023】
領収書および名刺は、原稿の種類の一例であるが、本開示ではそれらの例のように記載されている項目が予め想定される種類の原稿を対象としている。原稿種別に応じた語句抽出に係る項目の選択画面は、原稿を読み取る際に後述する原稿種別選択画面70で領収書または名刺が選択されたことに応答して表示されてもよい。
図3示す抽出/ソート項目選択画面30および
図4に示す抽出/ソート項目選択画面40のことである。しかし、原稿種別が選択される都度、抽出/ソート項目選択画面を表示するのでなく、操作部15に対する特定の操作(初期設定を変更するために用意されたもの)を受け付けた際に表示されるようにしてもよい。
【0024】
図5および
図6は、この実施形態において制御部11が実行する原稿種類の選択および抽出語句の確認に係る処理の例を示すフローチャートである。フローチャートを参照しながら処理の流れを説明する。原稿読取に係るジョブ(一例としてスキャンジョブ)が選択されたものとする(
図5に示すステップS11のYes)。読取制御部12Rとして制御部11は、原稿読取に係るジョブが選択されると、続いてジョブの設定およびジョブ開始の指示を受け付ける。この実施形態において、読取制御部12Rとして制御部11は、通常のジョブに係る設定と共に、原稿種別の設定を受け付けるものとする。便宜上、
図5のフローチャートでは、原稿種別以外の設定およびジョブの開始指示(ステップS12)と原稿種別に係る設定(ステップS13)を分けて示しているが、その順に設定および開始指示を受け付けることを示すものではない。ジョブに係る設定の一つとして操作部15に原稿種別選択画面を表示させて原稿の種類(原稿種別)の選択を受け付けるものとする。ユーザから原稿種別の選択を受け付ける態様においては、ユーザが指定した特定の種類の原稿に応じた項目に係る語句を認識させることができる。
【0025】
図7は、この実施形態において制御部11が操作部15に表示させる原稿種別選択画面の一例を示す説明図である。
図7に示す原稿種別選択画面70では、2つの特定種類の原稿として領収書の選択を受け付ける[領収書]キー71および名刺の選択を受け付ける[名刺]キー72を表示させている。また、それ以外の種類の原稿の選択を受け付けるための[領収書/名刺以外]キー73も表示させている。なお、何れかのキーの操作を受け付けると、制御部11は原稿種別選択画面70の表示をやめる。原稿種別選択画面70で、[領収書]キー71が操作され、他の設定が行われてジョブの実行を指示する操作がなされたことを検出すると(ステップS15のYes)、読取制御部12Rとして制御部11は、原稿読取部13に1枚ずつ原稿を読み取らせる(ステップS21)。読取制御部12Rとして制御部11は、読み取られた原稿に対する文字認識処理を文字認識部12Cに行わせる。認識された語句のうちで領収書について選択された各項目(
図3参照)に関連する語句を語句抽出部12Xに抽出させる。そして、各項目について抽出された語句を原稿に紐付けて記憶部16に格納する(ステップS23)。
【0026】
1枚の原稿につき、読み取り、語句の抽出および紐付けを終えたら、読取制御部12Rとして制御部11は、すべての原稿を読み取り終えたか否かを判定する(ステップS25)。次に読み取るべき原稿が残っている場合(ステップS25のNo)、制御部11は処理を前述のステップS21へ戻して次の1枚の原稿を読み取る。すべての原稿を読み取り終えたら(ステップS25のYes)、読み取られた原稿を定められた項目に係る語句の順にソートして、ソート順で各原稿を抽出された語句と共に操作部15に表示させる。そして、ユーザの確認および修正を受け付ける(ステップS27)。この実施形態において、読み取られた領収書に係るソート項目は「取引先」としている(
図3参照)。
【0027】
図8は、この実施形態において、制御部11が操作部15に表示させる確認修正画面の一例を示す説明図である。
図8に示すように、読取制御部12Rとして制御部11は読み取られた原稿(領収書)の画像を確認修正画面80の画像表示域81に表示させ、項目表示85として選択された原稿の種別に応じた項目を表示させる。さらに、各項目について抽出された語句を表示させる。
図8に示す例では、取引先の項目につき抽出された語句である「ABCDE株式会社」を確認修正欄86に表示させ、年月日の項目につき抽出された語句である「2022年10月1日」を確認修正欄87に表示させている。さらに、金額の項目につき抽出された語句である「10,000」を確認修正欄88に表示させている。確認修正欄86、87および88のユーザによる選択および修正入力を受け付ける(
図6に示すステップS41)。制御部11は、ソート項目である取引先の確認修正欄86の右側に[前原稿同様]キー84を表示させている。制御部11は、確認修正画面をソート順に表示させるので、ソート項目は他の項目に比べて一つ前の原稿と同じ語句である可能性が高い。よって、文字認識の誤りを見つけやすいといえる。ソート項目について[前原稿同様]キー84を操作することでソート項目について文字認識の誤りを容易に修正できる場合が多いと考えられる。
【0028】
一方、前述の原稿種別選択画面70で、[名刺]キー72が操作され、他の設定が行われてジョブの実行を指示する操作がなされたことを検出すると(ステップS15のNoを経てステップS17のYes)、読取制御部12Rとして制御部11は、次の処理を行う。即ち、原稿読取部13に1枚ずつ原稿を読み取らせる(ステップS31)。読取制御部12Rとして制御部11は、読み取られた原稿に対する文字認識処理を文字認識部12Cに行わせる。認識された語句のうちで領収書について選択された各項目(
図4参照)に関連する語句を語句抽出部12Xに抽出させる。そして、各項目について抽出された語句を原稿に紐付けて記憶部16に格納する(ステップS33)。
【0029】
1枚の原稿につき、読み取り、語句の抽出および紐付けを終えたら、制御部11は、すべての原稿を読み取り終えたか否かを判定する(ステップS35)。次に読み取るべき原稿が残っている場合(ステップS35のNo)、制御部11は処理を前述のステップS31へ戻して次の1枚の原稿を読み取る。すべての原稿を読み取り終えたら(ステップS35のYes)、読み取られた原稿を定められた項目に係る語句の順にソートして、ソート順で各原稿を抽出された語句と共に操作部15に表示させる。そして、ユーザの確認および修正を受け付ける(ステップS27)。
【0030】
また、前述の原稿種別選択画面70で、[領収書/名刺以外]キー73が操作され、他の設定が行われてジョブの実行を指示する操作がなされたことを検出すると(ステップS17のNoを経てステップS19のYes)、読取制御部12Rとして制御部11は、以下の処理を行う。即ち、原稿読取部13に1枚ずつ原稿を読み取らせ、記憶部16に格納する(ステップS37)。原稿種別が領収書や名刺の場合のように、読み取られた原稿に対する文字認識処理を行ってもよいが、各項目に関連する語句を語句抽出部12Xに抽出させて原稿に紐付ける処理は行わないものとする。1枚ずつ原稿を読み取って(ステップS39のNoのループ)、すべての原稿を読み取り終えたら(ステップS39のYes)、後述する
図6のステップS65へ処理を進めて読み取られた原稿の出力に係る処理を行う。詳細は後述する。
【0031】
前述したユーザの確認および修正を受け付ける処理の続きを以下に述べる。例えば、
図8に示す確認修正画面80の確認修正欄86、87および88に対するユーザによる選択および修正入力を受け付けると(
図6のステップS41のYes)、読取制御部12Rとして制御部11は、修正入力された欄の項目に係る語句を入力されたものに置換する(ステップS43)。なお、修正入力がなされた原稿だけでなく、それ以外の原稿の同じ項目の同じ語句についても、その修正入力を反映させることができるようにしてもよい。そして、制御部11は、処理をステップS41へ戻して更なる修正あるいは次の操作を待つ。何れかの確認修正欄に対して更に修正入力がされたら、同様の処理を繰り返す(ステップS41のYes、S43を経てステップS41へ戻るループ)。
【0032】
図8に示す確認修正画面80において読取制御部12Rとして制御部11は、確認修正欄86、87および88に対する修正入力の他に、[次を確認]キー82および[前原稿同様]キー84に対する操作を受付ける。
【0033】
[前原稿同様]キー84の操作を受付けると(ステップS41のNoを経てS45のYes)、読取制御部12Rとして制御部11は以下の処理を行う。即ち、ソート順の1つ前に表示され確認/修正がされた原稿がある場合その確認/修正がされた原稿に紐ついたソート項目の語句に、現在表示されている原稿に係るソート項目の語句を更新する(ステップS47)。そして、処理を前述のステップS41へ戻す。[前原稿同様]キー84を設ける態様によれば、同一項目の語句が誤認識によって揺らいでいる場合、正しく認識されあるいは修正された一つ前の原稿の語句に揃えることが簡単な操作で実現できる。
【0034】
また、確認修正画面80において[次を確認]キー82の操作を受付けると(ステップS45のNoを経てS49のYes)、読取制御部12Rとして制御部11は、修正入力された欄の項目があればその項目に係る語句を入力されたものに置換してその原稿に係るデータを更新する(ステップS51)。そして、確認/修正すべき次の原稿があるか判定する(ステップS61)。まだ確認/修正されていない原稿があれば(ステップS61のYes)、確認修正画面80の表示を次の原稿とその原稿に紐付いた抽出語句に更新する(ステップS63)。そして、処理を前述のステップS41へ戻し次の原稿について確認及び修正に係る操作を受け付ける。
【0035】
以上のように確認修正画面80において読取制御部12Rとして制御部11は、確認修正欄86、87および88、[次を確認]キー82および[前原稿同様]キー84の何れかの操作がなされるのを待つ。フローチャートでは、ステップS41のNo、S45のNo、S49のNoを経てS41へ戻るループに対応する。
【0036】
以上のようにして、すべての原稿について確認/修正がなされたら(ステップS61のNo)、読取制御部12Rとして制御部11は、読み取られた原稿の出力に係る処理を行う。出力先は、選択されたジョブの種類あるいはジョブに係る設定の一つとして決定されるものとする。読取制御部12Rとして制御部11は、出力先が複合機10の外部か、あるいは内部かを判定する(ステップS65)。出力先が外部である場合(ステップS65のYes)、通信を介して出力先の機器へ読み取られた原稿に係るデータを送信して(ステップS67)、ジョブに係る処理を終了する。一方、出力先が内部である場合は、読み取られた原稿に係るデータを記憶部16の不揮発性メモリに格納して(ステップS69)、ジョブに係る処理を終了する。以上が、この実施形態において制御部11が実行する処理の流れである。
【0037】
(実施の形態2)
実施の形態1において、読取制御部12Rとして制御部11は、確認修正画面80を操作部15に表示させソート順に各原稿に係る各項目の語句を表示させると述べた。その際に、読取制御部12Rとして制御部11は、ソート順で一つ前の原稿に係るソート項目の語句との異同を判断して、異なる部分を同じ部分と異なる表示態様で表示させるようにしてもよい。この態様によれば、一つ前の原稿に係る同一項目の語句と異なる部分があればその部分をユーザに容易に認識させることができる。
図9は、
図8に示す例の領収書の次に確認修正画面に表示された原稿の一例を示す説明図である。
図9の確認修正画面90の画像表示域91に示された領収書を、
図8の画像表示域81に示された領収書と比べると、取引先の確認修正欄96には誤認識された「ABCOE株式会社」が表示されている。つまり、1つ前の原稿の取引先の確認修正欄86と同じ「ABCDE株式会社」と表示されるべきところ、「D」の文字が誤って「O」と認識されている。
【0038】
この実施形態によれば、読取制御部12Rとして制御部11は一つ前の原稿に係る同一項目の語句との異同を判断するので、「O」と認識された文字の箇所のみ、グレーの背景で表示させており他の箇所の白地背景とは異なる表示態様である。このように、ソート項目について一つ前の原稿と異なる部分を同一の部分と異なる表示態様とすることで、その差異をユーザに容易に認識させることができる。誤認識がある場合に、それにユーザが気付きやすくなり、ひいてはより確実に修正入力がされるようにできる。修正は、確認修正欄96に正しい文字が入力されてもよいし、[前原稿同様]キー94が操作されることにより修正されてもよい。ただし、[前原稿同様]キー94による修正は各項目が一つ前の原稿と同じ場合に適用されるべきである。
確認修正欄97の年月日の内容も一つ前の原稿である
図8の確認修正欄87と異なる。しかし、年月日はソート項目でないことから制御部11は確認修正欄97については異なる部分があっても表示態様を異ならせていない。確認修正欄98も
図8の確認修正欄88と異なるが、表示態様を異ならせていない。
以上は、ソート項目についてのみ一つ前の原稿との異同を判断して表示態様を異ならせることについて述べた。しかし、ソート項目以外の項目についても一つ前の原稿に係る語句と異なる部分があれば異なる表示態様で表示させるようにしてもよい。ただし、確認修正画面はソート順に表示されるので、ソート項目以外の項目は、ソート項目に比べると一つ前の原稿と同じ語句である可能性は高くない。
【0039】
(実施の形態3)
実施の形態1において、原稿の種類、その種類に応じた項目は予め用意されており、それらの項目のうち語句を抽出する項目をユーザが選択できるものとしている。しかし、原稿の種類およびそれに応じた項目をユーザが定義し編集できるようにしてもよい。その定義および編集を行うに際して、いくつかのサンプルの原稿を読み込ませて各原稿に共通する記載位置や類似する語句のパターンを記憶あるいは機械学習させるようにしてもよい。定義および編集を行うためにPC等の情報処理装置上で使用するアプリが提供されてもよい。
【0040】
本開示には、上述した複数の態様のうちの何れかを組み合わせたものも含まれると解されるべきである。
前述した実施の形態の他にも、本開示についての種々の変形例があり得る。それらの変形例は、本開示の範囲に属さないと解されるべきものではない。本開示に係る発明には、請求の範囲と均等の意味および本開示の範囲に属するすべての変形が含まれるべきである。
【符号の説明】
【0041】
10:複合機、 11:制御部、 12:画像処理部、 12C:文字認識部、 12P:印刷制御部、 12R:読取制御部、 12X:語句抽出部、 13:原稿読取部、 13F:原稿送り装置、 13P:原稿台、 14:印刷部、 14A,14B,14C:給紙トレイ、 14D,14E,14F:排出トレイ、 15:操作部、 15D:表示部、 15S:操作検出部、 16:記憶部、 17:操作制御部、 18:ファイル制御部、 19:ジョブ制御部
30,40:抽出/ソート項目選択画面、 31,41:設定領域、 32,42:[登録]キー、 33,43:[キャンセル]キー、 70:原稿種別選択画面、 71:[領収書]キー、 72:[名刺]キー、 73:[領収書/名刺以外]キー、 80,90:確認修正画面、 81,91:画像表示域、 82:[次を確認]キー、 84,94:[前原稿同様]キー、 85:項目表示、 86,87,88,96,97,98:確認修正欄