(19)【発行国】日本国特許庁(JP)
(12)【公報種別】特許公報(B2)
(11)【特許番号】
(24)【登録日】2024-07-01
(45)【発行日】2024-07-09
(54)【発明の名称】画像読取装置および情報処理装置
(51)【国際特許分類】
G06V 30/26 20220101AFI20240702BHJP
【FI】
G06V30/266
G06V30/268
(21)【出願番号】P 2019213576
(22)【出願日】2019-11-26
【審査請求日】2022-10-28
(73)【特許権者】
【識別番号】000006150
【氏名又は名称】京セラドキュメントソリューションズ株式会社
(74)【代理人】
【識別番号】110003443
【氏名又は名称】弁理士法人TNKアジア国際特許事務所
(74)【代理人】
【識別番号】100129997
【氏名又は名称】田中 米藏
(72)【発明者】
【氏名】アイダ・ヨゴン
(72)【発明者】
【氏名】ロナルド・レイエス
(72)【発明者】
【氏名】チャールズ エイドリアン・アリェーラ
【審査官】▲柳▼谷 侑
(56)【参考文献】
【文献】米国特許出願公開第2004/0037470(US,A1)
(58)【調査した分野】(Int.Cl.,DB名)
G06V 30/26
(57)【特許請求の範囲】
【請求項1】
原稿の画像を読み取る画像読取部と、
前記画像読取部が読み取った前記原稿の画像を記憶する原稿画像記憶部と、
前記原稿画像記憶部に記憶された前記原稿の画像に対して、OCR処理を行うことにより、前記原稿におけるテキストを抽出するテキスト抽出部と、
前記テキスト抽出部にて抽出された前記原稿におけるテキストを構成する複数語のうち、単語でないとされる非単語を検出する非単語検出部と、
前記非単語検出部が検出した前記非単語と、当該非単語の直前の語及び直後の語の少なくとも一方とをその並び順に結合させた結合語が単語となるか否かを判定する判定部と、
前記判定部において単語になると判定された場合に、前記原稿におけるテキストのうちで前記結合語に対応するテキスト部分を文字認識不良部分として特定し、当該文字認識不良部分のテキストを当該結合語のテキストに修正する文字修正部と、を備え、
前記判定部は、前記非単語検出部において1個の非単語が検出され、かつ、当該1個の非単語の前後に単語が存在する場合に、当該1個の非単語とその直前の単語とをその並び順に結合させた第1結合語が単語となるか否かを判定し、当該1個の非単語とその直後の単語とをその並び順に結合させた第2結合語が単語となるか否かを判定し、更に、前記第1結合語および前記第2結合語が共に単語になると判定した場合に、当該非単語の直前の単語と当該非単語と当該非単語の直後の単語とをその並び順に結合させた全結合語が単語となるか否かを判定し、当該非単語の直前の単語が全て大文字であるか否かを判定し、
前記文字修正部は、(i)前記判定部において前記全結合語が単語であると判定された場合に、前記原稿におけるテキストのうちで前記全結合語に対応するテキスト部分を文字認識不良部分として特定し、当該文字認識不良部分のテキストを当該全結合語のテキストに修正し、(ii)前記判定部において前記全結合語が単語でないと判定された場合に、前記原稿におけるテキストのうちで前記第1結合語に対応するテキスト部分を文字認識不良部分として特定し、当該文字認識不良部分のテキストを当該第1結合語のテキストに修正し、(iii)前記判定部において前記全結合語が単語でないと判定され、かつ、当該非単語の直前の単語が全て大文字であると判定された場合に、前記原稿におけるテキストのうちで前記第2結合語に対応するテキスト部分を文字認識不良部分として特定し、当該文字認識不良部分のテキストを当該第2結合語のテキストに修正する画像読取装置。
【請求項2】
原稿の画像を読み取る画像読取部と、
前記画像読取部が読み取った前記原稿の画像を記憶する原稿画像記憶部と、
前記原稿画像記憶部に記憶された前記原稿の画像に対して、OCR処理を行うことにより、前記原稿におけるテキストを抽出するテキスト抽出部と、
前記テキスト抽出部にて抽出された前記原稿におけるテキストを構成する複数語のうち、単語でないとされる非単語を検出する非単語検出部と、
前記非単語検出部が検出した前記非単語と、当該非単語の直前の語及び直後の語の少なくとも一方とをその並び順に結合させた結合語が単語となるか否かを判定する判定部と、
前記判定部において単語になると判定された場合に、前記原稿におけるテキストのうちで前記結合語に対応するテキスト部分を文字認識不良部分として特定し、当該文字認識不良部分のテキストを当該結合語のテキストに修正する文字修正部と、を備え、
前記判定部は、前記非単語検出部において1個の非単語が検出され、当該1個の非単語の最後の文字に句読点が含まれ、かつ、当該1個の非単語の前に単語が存在する場合に、当該1個の非単語とその直前の単語とをその並び順に結合させた結合語が単語となるか否かを判定し、
前記文字修正部は、前記判定部において前記結合語が単語であると判定され、かつ、当該1個の非単語の最後の文字に句読点が含まれると判定された場合に、前記原稿におけるテキストのうちで前記結合語に対応するテキスト部分を文字認識不良部分として特定し、当該文字認識不良部分のテキストを当該結合語のテキストに修正する画像読取装置。
【請求項3】
原稿の画像を読み取る画像読取部と、
前記画像読取部が読み取った前記原稿の画像を記憶する原稿画像記憶部と、
前記原稿画像記憶部に記憶された前記原稿の画像に対して、OCR処理を行うことにより、前記原稿におけるテキストを抽出するテキスト抽出部と、
前記テキスト抽出部にて抽出された前記原稿におけるテキストを構成する複数語のうち、単語でないとされる非単語を検出する非単語検出部と、
前記非単語検出部が検出した前記非単語と、当該非単語の直前の語及び直後の語の少なくとも一方とをその並び順に結合させた結合語が単語となるか否かを判定する判定部と、
前記判定部において単語になると判定された場合に、前記原稿におけるテキストのうちで前記結合語に対応するテキスト部分を文字認識不良部分として特定し、当該文字認識不良部分のテキストを当該結合語のテキストに修正する文字修正部と、を備え、
前記判定部は、前記非単語検出部において検出された非単語が2個連続し、かつ、当該連続する2個の非単語のうち先頭側の非単語の直前に単語が存在しない場合に、当該連続する2個の非単語をその並び順に結合させた結合語が単語となるか否かを判定し、
前記文字修正部は、前記判定部において単語になると判定された場合に、前記原稿におけるテキストのうちで前記結合語に対応するテキスト部分を文字認識不良部分として特定し、当該文字認識不良部分のテキストを当該結合語のテキストに修正する画像読取装置。
【請求項4】
原稿の画像を読み取る画像読取部と、
前記画像読取部が読み取った前記原稿の画像を記憶する原稿画像記憶部と、
前記原稿画像記憶部に記憶された前記原稿の画像に対して、OCR処理を行うことにより、前記原稿におけるテキストを抽出するテキスト抽出部と、
前記テキスト抽出部にて抽出された前記原稿におけるテキストを構成する複数語のうち、単語でないとされる非単語を検出する非単語検出部と、
前記非単語検出部が検出した前記非単語と、当該非単語の直前の語及び直後の語の少なくとも一方とをその並び順に結合させた結合語が単語となるか否かを判定する判定部と、
前記判定部において単語になると判定された場合に、前記原稿におけるテキストのうちで前記結合語に対応するテキスト部分を文字認識不良部分として特定し、当該文字認識不良部分のテキストを当該結合語のテキストに修正する文字修正部と、を備え、
前記判定部は、前記非単語検出部において検出された非単語が2個連続し、かつ、当該連続する2個の非単語のうち先頭側の非単語の直前に単語が存在する場合に、(iv)当該先頭側の非単語の直前の単語と当該先頭側の非単語とをその並び順に結合させた第1結合語が単語となるか否かを判定し、当該連続する2個の非単語をその並び順に結合させた第2結合語が単語となるか否かを判定し、(v)前記第1結合語および前記第2結合語が共に単語にならないと判定した場合に、当該先頭側の非単語の直前の単語と当該連続する2個の非単語をその並び順に結合させた全結合語が単語となるか否かを判定し、
前記文字修正部は、(iv)前記判定部において前記第1結合語が単語とならないと判定され、かつ、前記第2結合語が単語となると判定された場合に、前記原稿におけるテキストのうちで当該連続する2個の非単語に対応するテキスト部分を文字認識不良部分として特定し、当該文字認識不良部分のテキストを当該第2結合語のテキストに修正し、(v)前記判定部において前記全結合語が単語であると判定された場合に、前記原稿におけるテキストのうちで前記全結合語に対応するテキスト部分を文字認識不良部分として特定し、当該文字認識不良部分のテキストを当該全結合語のテキストに修正する画像読取装置。
【請求項5】
原稿の画像を読み取る画像読取部と、
前記画像読取部が読み取った前記原稿の画像を記憶する原稿画像記憶部と、
前記原稿画像記憶部に記憶された前記原稿の画像に対して、OCR処理を行うことにより、前記原稿におけるテキストを抽出するテキスト抽出部と、
前記テキスト抽出部にて抽出された前記原稿におけるテキストを構成する複数語のうち、単語でないとされる非単語を検出する非単語検出部と、
前記非単語検出部が検出した前記非単語と、当該非単語の直前の語及び直後の語の少なくとも一方とをその並び順に結合させた結合語が単語となるか否かを判定する判定部と、
前記判定部において単語になると判定された場合に、前記原稿におけるテキストのうちで前記結合語に対応するテキスト部分を文字認識不良部分として特定し、当該文字認識不良部分のテキストを当該結合語のテキストに修正する文字修正部と、を備え、
前記判定部は、前記非単語検出部において検出された非単語が3個連続し、かつ、当該連続する3個の非単語のうち最先頭の非単語の直前に単語が存在する場合に、(vi)当該最先頭の非単語の直前の単語と当該最先頭の非単語とをその並び順に結合させた第1結合語が単語となるか否かを判定し、当該最先頭の非単語とその次の非単語とをその並び順に結合させた第2結合語が単語となるか否かを判定し、(vii)前記第1結合語が単語になると判定し、かつ、前記第2結合語が単語にならないと判定した場合に、当該最先頭の非単語の次の非単語とその次の非単語とをその並び順に結合させた第3結合語が単語となるか否かを判定し、
前記文字修正部は、(vi)前記第1結合語が単語になると判定し、かつ、前記第2結合語が単語にならないと判定した場合に、前記原稿におけるテキストのうちで前記第1結合語に対応するテキスト部分を文字認識不良部分として特定し、当該文字認識不良部分のテキストを当該第1結合語のテキストに修正し、(vii)前記判定部において前記第3結合語が単語であると判定された場合に、前記原稿におけるテキストのうちで前記第3結合語に対応するテキスト部分を文字認識不良部分として特定し、当該文字認識不良部分のテキストを当該第3結合語のテキストに修正する画像読取装置。
【請求項6】
記憶部と、
前記判定部において前記第1結合語および前記第2結合語が共に単語にならないと判定され、かつ、前記全結合語が単語とならないと判定された場合に、前記非単語を未確認語として前記記憶部に登録する制御部と、を更に備え、
前記制御部は、前記記憶部に登録された未確認語の登録回数が予め定められた閾値回数以上になると、当該未確認語を単語として前記記憶部に登録する請求項1に記載の画像読取装置
。
【発明の詳細な説明】
【技術分野】
【0001】
本発明は、画像読取装置および情報処理装置に関し、原稿を読取って画像データを生成する技術に関する。
【背景技術】
【0002】
特許文献1に記載されたプリンタシステムでは、原稿をスキャンし、OCR処理した出力結果のレイアウトを、元原稿のレイアウトに準ずるようにして出力させる「手書き原稿修正モード」を有し、OCRで認識できなかった文字の部分を空白に置き換え出力し、ユーザーが当該空白箇所を埋める操作を行う構成となっている。
【先行技術文献】
【特許文献】
【0003】
【発明の概要】
【発明が解決しようとする課題】
【0004】
上記の特許文献1に記載されているプリンタシステムでは、OCRで認識できなかった文字の部分を空白に置き換え出力し、ユーザーが当該空白箇所を埋める操作を行う必要があるため、当該操作が煩わしいという問題がある。OCRで認識できなかった文字の部分が増えるに従って、ユーザーの操作負担も増大するという問題がある。
【0005】
本発明は、上記の事情に鑑みてなされたものであり、OCRで認識できなかった文字の部分をユーザーが修正する作業を不必要とすることができ、ユーザーの操作負担を改善することを目的とする。
【課題を解決するための手段】
【0006】
本発明の一局面に係る画像読取装置は、原稿の画像を読み取る画像読取部と、前記画像読取部が読み取った前記原稿の画像を記憶する原稿画像記憶部と、前記原稿画像記憶部に記憶された前記原稿の画像に対して、OCR処理を行うことにより、前記原稿におけるテキストを抽出するテキスト抽出部と、前記テキスト抽出部にて抽出された前記原稿におけるテキストを構成する複数語のうち、単語でないとされる非単語を検出する非単語検出部と、前記非単語検出部が検出した前記非単語と、当該非単語の直前の語及び直後の語の少なくとも一方とをその並び順に結合させた結合語が単語となるか否かを判定する判定部と、前記判定部において単語になると判定された場合に、前記原稿におけるテキストのうちで前記結合語に対応するテキスト部分を文字認識不良部分として特定し、当該文字認識不良部分のテキストを当該結合語のテキストに修正する文字修正部と、を備えるものである。
【0007】
本発明の一局面に係る情報処理装置は、原稿の画像を記憶する原稿画像記憶部と、前記原稿画像記憶部に記憶された前記原稿の画像に対して、OCR処理を行うことにより、前記原稿におけるテキストを抽出するテキスト抽出部と、前記テキスト抽出部にて抽出された前記原稿におけるテキストを構成する複数語のうち、単語でないとされる非単語を検出する非単語検出部と、前記非単語検出部が検出した前記非単語と、当該非単語の直前の語及び直後の語の少なくとも一方とをその並び順に結合させた結合語が単語となるか否かを判定する判定部と、前記判定部において単語になると判定された場合に、前記原稿におけるテキストのうちで前記結合語に対応するテキスト部分を文字認識不良部分として特定し、当該文字認識不良部分のテキストを当該結合語のテキストに修正する文字修正部と、を備えるものである。
【発明の効果】
【0008】
本発明によれば、OCRで認識できなかった文字の部分をユーザーが修正する作業を不必要とすることができ、ユーザーの操作負担を改善することができる。
【図面の簡単な説明】
【0009】
【
図1】本発明の第1実施形態に係る画像形成装置の斜視図である。
【
図2】第1実施形態の画像形成装置の構成を示すブロック図である。
【
図3】第1実施形態に係る画像形成装置における原稿スキャン後OCR処理を概念的に示す図である。
【
図4】(A)は単語辞書記憶テーブルの一例を示す図、(B)は未確認語登録テーブルの一例を示す図、(C)は画像形成装置の表示部の表示画面の一例を示す図である。
【
図5】第1実施形態に係る原稿スキャン後OCR処理の一例を示すフローチャートである。
【
図6】
図5に示す判定処理の一例を示すフローチャートである。
【
図7】
図5に示す修正処理の一例を示すフローチャートである。
【
図8】(A)はテキスト修正の一例を示す図、(B)は、テキスト修正無しの一例を示す図である。
【
図16】未確認語登録テーブルと単語辞書記憶テーブルの一例を示す図である。
【
図17】第2実施形態の情報処理装置及び画像形成装置の構成を示すブロック図である。
【発明を実施するための形態】
【0010】
以下、本発明に係る画像読取装置の一例である画像形成装置の一実施形態について図面を参照して説明する。
図1は、本発明の第1実施形態に係る画像形成装置の斜視図である。
図2は、第1実施形態の画像形成装置の構成を示すブロック図である。本発明に係る画像読取装置は、画像形成装置10において画像形成部18を除いた構成に対応する。
【0011】
第1実施形態の画像形成装置10は、制御ユニット11と、表示部12と、操作部14と、タッチパネル15と、通信部16と、画像読取部17と、画像形成部18と、データ記憶部19とを備える。これらの構成要素は、互いにバスを通じてデータ又は信号の送受信が可能とされている。
【0012】
画像読取部17は、例えば、自動原稿送り装置により搬送される原稿G1又はフラットベッド上に載置された原稿G1を光学的に読み取るスキャナーとしてのCCD(Charge Coupled Device)を有し、原稿G1の画像を示す画像データを生成する。
【0013】
画像形成部18は、感光体ドラムの表面を均一帯電させ、感光体ドラムの表面を露光して、感光体ドラムの表面に静電潜像を形成し、感光体ドラムの表面の静電潜像をトナー像に現像して、感光体ドラムの表面のトナー像(画像)を記録紙に転写して定着させる。例えば、画像読取部17による原稿G1の読取で得られた原稿画像を記録紙に印刷することが可能である。
【0014】
表示部12は、例えば、液晶ディスプレイ(Liquid Crystal Display)、有機EL(Organic Light-Emitting Diode)ディスプレイなどの表示装置である。
【0015】
操作部14は、ユーザーからの操作指示の入力を受け付けるものであり、メニューを呼び出すメニューキー、メニューを構成するGUI(Graphical User Interface)におけるフォーカスを移動させる矢印キー、メニューを構成するGUIに対して確定操作を行う決定キー、スタートキーなどのハードキーを備える。
【0016】
タッチパネル15は、所謂抵抗膜方式や静電容量方式等のタッチパネルである。タッチパネル15は、表示部12の画面に配置され、表示部12の画面に対する指などの接触をその接触位置と共に検知する。タッチパネル15は、指などの接触を検知すると、その接触位置の座標を示す検知信号を制御ユニット11の制御部21などに出力する。従って、タッチパネル15は、表示部12の画面に対するユーザー操作が入力される操作部としての役割を果たす。
【0017】
通信部16は、通信モジュールを備える通信インターフェイスであり、LAN(Local Area Network)や公衆回線などからなるネットワークを通じて、情報処理装置(例えば、パーソナルコンピューター、サーバー、携帯情報端末など)との間でデータ送受信を行う。
【0018】
データ記憶部19は、HDD(Hard Disk Drive)などの大容量の記憶装置である。データ記憶部19は、画像読取部17による原稿読取で得られた原稿G1の画像を示す画像データを記憶する原稿画像記憶部19aを備える。また、データ記憶部19は、後述する各種のフラグの状態(オン、オフ、未設定)を記憶するフラグ記憶エリアを備えている。
【0019】
図3は、第1実施形態に係る画像形成装置にて行われる原稿スキャン後OCR処理を概念的に示す図である。画像形成装置10は、
図3に示すように、原稿G1を読み取り、原稿G1の画像データについてOCR処理することにより、原稿G1の画像データについてのテキスト(文字データ)D1を生成し、当該テキストD1中の非単語を適切なテキストに修正した修正後のテキストD2を生成するための構成を備える。当該構成について以下に説明する。
【0020】
データ記憶部19は、
図4(A)に示す単語辞書記憶テーブルTB1を有する。
図4(A)は、単語辞書記憶テーブルの一例を示す図である。単語辞書記憶テーブルTB1は、単語とその意味とを対応付けて予め記憶された記憶テーブルである。単語辞書記憶テーブルTB1には、例えば、単語である「ever」とその意味である「かつて、いつか、…」とが対応付けられ、単語である「how」とその意味である「どんなふうに、…」とが対応付けられるというように、辞書に登録されている各種の単語が記憶されている。言うまでもないが、単語辞書記憶テーブルTB1には、意味のない又は意味不明な単語は登録されていない。
【0021】
制御ユニット11は、プロセッサー、RAM(Random Access Memory)、及びROM(Read Only Memory)などから構成される。プロセッサーは、例えば、CPU(Central Processing Unit)、MPU、ASICである。この制御ユニット11は、データ記憶部19に記憶された制御プログラムが上記のプロセッサーで実行されることにより、制御部21、テキスト抽出部22、非単語検出部23、判定部24、及び文字修正部25として機能する。なお、制御ユニット11の上記制御部21、テキスト抽出部22、非単語検出部23、判定部24、及び文字修正部25は、上記制御プログラムに基づく動作によらず、それぞれハード回路により構成されてもよい。
【0022】
制御部21は、画像形成装置10の全体的な動作制御を司る。
【0023】
テキスト抽出部22は、原稿画像記憶部19aに記憶された原稿G1の画像に対して、OCR(optical character recognition)処理を行うことにより、原稿G1におけるテキストを抽出する。
図3に示すように、テキスト抽出部22は、原稿G1の画像データについてOCR処理することにより、原稿G1の画像データについてのテキストD1を抽出する。テキスト抽出部22は、原稿G1におけるテキストD1を原稿画像記憶部19aに記憶させる。
【0024】
非単語検出部23は、テキスト抽出部22にて抽出された原稿G1におけるテキストD1を構成する複数語のうち、単語でないとされる非単語を検出する。例えば、非単語検出部23は、原稿画像記憶部19aに記憶された
図3に示すテキストD1から非単語を検出する。
図3に示す原稿G1には、英語で「The combined action … Yes …」などと記載されている。非単語検出部23は、例えば、
図3に示すようにテキストD1の「The」「combined」「action」は単語であると検出し、テキストD1の箇所P1の「Howev」「er」などは非単語であると検出する。
【0025】
判定部24は、非単語検出部23が検出した非単語と、当該非単語の直前の語及び直後の語の少なくとも一方とをその並び順に結合させた結合語が単語となるか否かを判定する。例えば、
図3に示すテキストD1の箇所P1について言えば、判定部24は、非単語である「Howev」と、当該非単語の直後の非単語である「er」とをその並び順に結合させた結合語である「However」が単語となるか否かを判定する。ここでは、「However」が単語であるため、判定部24は、「However」が単語になると判定する。また、判定部24は、他の非単語についても結合語が単語となるか否かを判定する。
図3で言えば、判定部24は、テキストD1の箇所P2の非単語である「se」、箇所P3の非単語である「m」及び「ay」、箇所P4の非単語である「m?」についても結合語が単語となるか否かを判定する。
【0026】
文字修正部25は、判定部24において単語になると判定された場合に、原稿G1におけるテキストD1のうちで結合語に対応するテキスト部分を文字認識不良部分として特定し、当該文字認識不良部分のテキストを当該結合語のテキストに修正する。例えば、
図3に示すテキストD1の箇所P1について言えば、文字修正部25は、判定部24において「However」が単語となると判定された場合に、原稿G1におけるテキストD1のうちで結合語である「However」に対応するテキスト部分、つまり、箇所P1のテキスト部分を、文字認識不良部分として特定する。つまり、文字修正部25は、箇所P1のテキスト部分(「Howev」+空白+「er」からなる部分)を、文字認識不良部分として特定する。そして、文字修正部25は、当該文字認識不良部分のテキスト(箇所P1のテキストである「Howev」+空白+「er」)を当該結合語のテキストである「However」に修正する。文字修正部25により、修正後のテキストD2の箇所P11のテキストが「However」に修正されている。
【0027】
判定部24は、非単語検出部23において1個の非単語が検出され、かつ、当該1個の非単語の前後に単語が存在する場合に、当該1個の非単語とその直前の単語とをその並び順に結合させた第1結合語が単語となるか否かを判定し、当該1個の非単語とその直後の単語とをその並び順に結合させた第2結合語が単語となるか否かを判定し、更に、第1結合語および第2結合語が共に単語になると判定した場合に、当該非単語の直前の単語と当該非単語と当該非単語の直後の単語とをその並び順に結合させた全結合語が単語となるか否かを判定し、当該非単語の直前の単語が全て大文字であるか否かを判定する。
【0028】
文字修正部25は、(i)判定部24において全結合語が単語であると判定された場合に、原稿G1におけるテキストD1のうちで全結合語に対応するテキスト部分を文字認識不良部分として特定し、当該文字認識不良部分のテキストを当該全結合語のテキストに修正し、(ii)判定部24において全結合語が単語でないと判定された場合に、原稿G1におけるテキストD1のうちで第1結合語に対応するテキスト部分を文字認識不良部分として特定し、当該文字認識不良部分のテキストを当該第1結合語のテキストに修正し、(iii)判定部24において全結合語が単語でないと判定され、かつ、当該非単語の直前の単語が全て大文字であると判定された場合に、原稿G1におけるテキストD1のうちで第2結合語に対応するテキスト部分を文字認識不良部分として特定し、当該文字認識不良部分のテキストを当該第2結合語のテキストに修正する。
【0029】
制御部21は、判定部24において第1結合語および第2結合語が共に単語にならないと判定され、かつ、全結合語が単語とならないと判定された場合に、非単語を未確認語としてデータ記憶部19の未確認語登録部19bに登録する。
【0030】
データ記憶部19は、制御部21の制御により、非単語を未確認語として登録する未確認語登録部19bを備える。
図4(B)は、未確認語登録テーブルの一例を示す図である。
図4(B)に示すように、未確認語登録部19bは、非単語を未確認語として登録し、当該未確認語とその登録回数とを対応付けて記憶する未確認語登録テーブルTB2を備えている。例えば、未確認語登録テーブルTB2には、未確認語としての「lysu」とその登録回数を示す「2回」とを対応付けて記憶している。なお、データ記憶部19は、特許請求の範囲における記憶部の一例である。
【0031】
また、制御部21は、未確認語登録部19bに登録された未確認語の登録回数が予め定められた閾値回数以上になると、当該未確認語を単語としてデータ記憶部19の単語辞書記憶テーブルTB1に登録する。
【0032】
続いて、画像形成装置10による原稿スキャン後OCR処理について説明する。
図4(C)は、画像形成装置の表示部の表示画面の一例を示す図である。
図5は、第1実施形態に係る原稿スキャン後OCR処理の一例を示すフローチャートである。
【0033】
制御部21は、表示部12に
図4(C)に示す表示画面が表示された状態において、ユーザーが「スキャン後OCR」を示すキーKBを押下すると、
図5に示す原稿スキャン後OCR処理を開始する。具体的には、ユーザーがキーKBを押下すると、タッチパネル15がキーKBの押下を受け付け、原稿スキャン後OCR処理の開始信号を制御部21に出力する。制御部21は、タッチパネル15からの原稿スキャン後OCR処理の開始信号に基づいて原稿スキャン後OCR処理を開始させる。
【0034】
制御部21は、ユーザーが画像読取部17に原稿G1をセットした状態において、表示部12に表示された図示しない「スタートボタン」を示すキーが押下されると(S1でYES)、画像読取部17に原稿G1を読み取らせる(S2)。制御部21は、画像読取部17が読み取った原稿G1の画像を示す原稿画像データを原稿画像記憶部19aに記憶させる。なお、制御部21は、ユーザーが表示部12に表示された「スタートボタン」を示すキーが予め定められた期間内に押下されなかった場合(S1でNO)、S1に戻り、「スタートボタン」を示すキーが押下されるまで待機する。
【0035】
テキスト抽出部22は、原稿画像記憶部19aに記憶された原稿G1の画像に対して、OCR処理を行うことにより、
図3に示すように原稿G1におけるテキストD1を抽出する(S3)。テキスト抽出部22は、原稿G1におけるテキストD1を原稿画像記憶部19aに記憶させる。
【0036】
非単語検出部23は、原稿画像記憶部19aに記憶された
図3に示すテキストD1を構成する複数語について、先頭の語から1語ずつ順番に非単語を検出していく(S4)。
図3に示す原稿G1には、英語で「The combined action … Yes …」などと記載されており、非単語検出部23は、テキストD1の先頭の語である「The」から順番に、「combined」「action」の順に各語が非単語であるか否かを検出していく。制御部21は、非単語検出部23において非単語でないことが検出されると(S4でNO)、次の語があるか否かを判定し(S7)、次の語があれば(S7でYES)、S4に戻る。一方、制御部21は、非単語検出部23において次の語が無ければ(S7でNO)、本処理を終了させる。
【0037】
制御部21は、非単語検出部23において非単語であることが検出されると(S4でYES)、
図6に示す判定処理(S5)に進む。
図6は、
図5に示す判定処理の一例を示すフローチャートである。例えば、制御部21は、非単語検出部23が、
図3に示すテキストD1の箇所P1の「Howev」が非単語であると検出すると(S4でYES)、判定処理(S5)を行う。
【0038】
制御部21は、非単語検出部23が検出した非単語(適宜に、非単語Mと呼ぶ)の直前の語L(但し、語Lは、非単語の左側の語であって、句読点、空白ではない。以下同じ。)があるか否かを判定する(S501)。制御部21は、直前の語Lがあると判定した場合(S501でYES)、非単語Mの直前の語Lと当該非単語Mとをその並び順に結合させた結合語、つまり、(L+M)の結合語(第1結合語)を生成する(S502)。判定部24は、生成された(L+M)の第1結合語が単語となるか否かを判定する(S504)。制御部21は、判定部24において(L+M)の第1結合語が単語になると判定された場合(S504でYES)、データ記憶部19のフラグ記憶エリア内の(L+M)フラグの状態を「オン」に記憶させ(S505)、単語にならないと判定された場合(S504でNO)、データ記憶部19のフラグ記憶エリア内の(L+M)フラグの状態を「オフ」に記憶させ(S506)。一方、制御部21は、直前の語Lがないと判定した場合(S501でNO)、データ記憶部19のフラグ記憶エリア内の(L+M)フラグの状態を未設定に記憶させる(S503)。
【0039】
制御部21は、S503のあと、S505のあと、又はS506のあと、非単語検出部23が検出した非単語Mの直後の語R(但し、語Rは、非単語の右側の語であって、句読点、空白ではない。以下同じ。)があるか否かを判定する(S507)。制御部21は、直後の語Rがあると判定した場合(S507でYES)、非単語Mと直後の語Rとをその並び順に結合させた結合語、つまり、(M+R)の結合語(第2結合語)を生成する(S508)。判定部24は、生成された(M+R)の第2結合語が単語となるか否かを判定する(S510)。制御部21は、判定部24において(M+R)の第2結合語が単語になると判定された場合(S510でYES)、データ記憶部19のフラグ記憶エリア内の(M+R)フラグの状態を「オン」に記憶させ(S511)、単語にならないと判定された場合(S510でNO)、データ記憶部19のフラグ記憶エリア内の(M+R)フラグの状態を「オフ」に記憶させ(S512)。一方、制御部21は、直後の語Rがないと判定した場合(S507でNO)、データ記憶部19のフラグ記憶エリア内の(M+R)フラグの状態を未設定に記憶させる(S509)。
【0040】
制御部21は、S509のあと、S511のあと、又はS512のあと、直前の語Lが文字修正部25により修正された修正語であるか否かを判定する(S513)。文字修正部25により修正された修正語である場合(S513でYES)、データ記憶部19のフラグ記憶エリア内の(L+M+R)フラグの状態を未設定に記憶させる(S516)。制御部21は、文字修正部25により修正された修正語でない場合(S513でNO)、非単語検出部23が検出した非単語Mの直前の語L及び直後の語Rがあるか否かを判定する(S514)。制御部21は、直前の語L及び直後の語Rがあると判定した場合(S514でYES)、直前の語Lと非単語Mと直後の語Rとをその並び順に結合させた結合語、つまり、(L+M+R)の結合語(全結合語)を生成する(S515)。判定部24は、生成された(L+M+R)の全結合語が単語となるか否かを判定する(S517)。制御部21は、判定部24において(L+M+R)の全結合語が単語になると判定された場合(S517でYES)、データ記憶部19のフラグ記憶エリア内の(L+M+R)フラグの状態を「オン」に記憶させ(S518)、単語にならないと判定された場合(S517でNO)、データ記憶部19のフラグ記憶エリア内の(L+M+R)フラグの状態を「オフ」に記憶させ(S519)。一方、制御部21は、直前の語L及び直後の語Rがないと判定した場合(S514でNO)、データ記憶部19のフラグ記憶エリア内の(L+M+R)フラグの状態を未設定に記憶させる(S516)。そして、制御部21は、S516のあと、S518のあと、又はS519のあと、本処理を終了させる。
【0041】
図5に戻って、文字修正部25は、
図7に示すテキスト修正処理を行う(S6)。
図7は、
図5に示す修正処理の一例を示すフローチャートである。
【0042】
文字修正部25は、(L+M)フラグのみがオンであるか否かを判定し(S601)、(L+M)フラグのみがオンであれば(S601でYES)、テキストD1における(L+M)を文字認識不良部分に特定し、(L+M)のテキストに修正する(S602)。
【0043】
文字修正部25は、(L+M)フラグのみがオンでない場合(S601でNO)、(M+R)フラグのみがオンであるか否かを判定する(S603)。文字修正部25は、(M+R)フラグのみがオンであれば(S603でYES)、テキストD1における(M+R)を文字認識不良部分に特定し、(M+R)のテキストに修正する(S604)。
【0044】
文字修正部25は、(M+R)フラグのみがオンでない場合(S603でNO)、(L+M+R)フラグのみがオンであるか否かを判定する(S605)。文字修正部25は、(L+M+R)フラグのみがオンであれば(S605でYES)、テキストD1における(L+M+R)を文字認識不良部分に特定し、(L+M+R)のテキストに修正する(S606)。
【0045】
文字修正部25は、(L+M+R)フラグのみがオンでない場合(S605でNO)、全フラグ(つまり、(L+M)フラグ、(M+R)フラグ、(L+M+R)フラグの3つ全て)がオンであるか否かを判定する(S607)。文字修正部25は、全フラグがオンであれば(S607でYES)、テキストD1における(L+M+R)を文字認識不良部分に特定し、(L+M+R)のテキストに修正する(S606)。
【0046】
文字修正部25は、全フラグがオンでない場合(S607でNO)、(L+M+R)フラグのみがオフ(つまり、(L+M)フラグがオン、(M+R)フラグがオン、(L+M+R)フラグがオフ)であるか否かを判定する(S608)。文字修正部25は、(L+M+R)フラグのみがオフであれば(S608でYES)、直前の語Lが複数文字で形成された語であって当該複数文字の全てが大文字であるか否かを判定する(S609)。文字修正部25は、直前の語Lが複数文字で形成された語であって当該複数文字の全てが大文字である場合(S609でYES)、テキストD1における(M+R)を文字認識不良部分に特定し、(M+R)のテキストに修正する(S604)。
【0047】
一方、文字修正部25は、直前の語Lが複数文字でない場合、又は、直前の語Lが複数文字で形成された語であるが当該複数文字の全てが大文字となっていない場合(S609でNO)、テキストD1における(L+M)を文字認識不良部分に特定し、(L+M)のテキストに修正する(S602)。
【0048】
制御部21は、(L+M+R)フラグのみがオフであることを満たさない場合、つまり、全てのフラグがオフの場合(S608でNO)、非単語Mを未確認語として未確認語登録部19bに登録する(S610)とともに、未確認語ごとの登録回数の値Nに「1」を加算する。制御部21は、未確認語ごとの登録回数の値Nが予め定められた閾値回数TH(例えば、TH=5、つまり5回)以上であるか否かを判定し(S611)、未確認語ごとの登録回数の値Nが予め定められた閾値回数TH以上になると(S611でYES)、当該未確認語を単語としてデータ記憶部19の単語辞書記憶テーブルTB1に登録する(S612)。
【0049】
制御部21は、S602のあと、S604のあと、又はS606のあと、全フラグを未設定にリセットする(S613)。制御部21は、S612のあと、又はS613のあと、本処理を終了させる。
【0050】
ここで、
図8~
図15に示す各例のテキスト修正について説明する。
【0051】
図8(A)はテキスト修正の一例を示す図である。
図8(B)は、テキスト修正無しの一例を示す図である。
【0052】
判定部24は、
図3に示すテキストD1の箇所P1において、非単語検出部23において検出された非単語が2個連続し(
図8(A)に示すように、非単語NWである「Howev」と非単語NWである「er」とが空白SPを介して連続)、かつ、当該連続する2個の非単語のうち先頭側の非単語NWである「Howev」の直前に単語が存在しない場合(S501でNO)、当該連続する2個の非単語をその並び順に結合させた結合語(S508)、つまり、
図8(A)に示す結合語である「However」が単語となるか否かを判定する(S510)。「However」が単語であるため、判定部24は、結合語である「However」が単語となると判定する(S510でYES)。文字修正部25は、判定部24において単語になると判定された場合(S510でYES)、原稿G1におけるテキストD1のうちで結合語に対応するテキスト部分、つまり、箇所P1のテキスト部分(「Howev」+空白+「er」からなる部分)を、文字認識不良部分として特定し、当該文字認識不良部分のテキストを当該結合語のテキストに修正する(
図7のS604)。
図3に示すように、文字修正部25が、修正後のテキストD2の箇所P11のテキストを、(「Howev」+空白+「er」)の部分から「However」に修正する。
【0053】
これにより、OCRで認識できなかった文字の部分、すなわち、
図8(A)に示すように文字認識不良部分が連続した2個の非単語からなる部分であることを特定でき、文字認識不良部分を適切な単語に修正することができる。このため、OCRで認識できなかった文字の部分をユーザーが修正する作業を不必要とすることができる。
【0054】
ところで、判定部24は、
図3に示すテキストD1の箇所P1が
図8(B)に示すように単語Wである「How」と単語Wである「ever」とが空白SPを介して連続している場合には、「How」及び「ever」が単語Wであり、非単語として検出しない。このため、文字修正部25が箇所P1についてテキスト修正を行わない。
【0055】
次に、
図9を用いて説明する。
図9はテキスト修正の一例を示す図である。
【0056】
判定部24は、
図3に示すテキストD1の箇所P1が
図9に示すように(「H」+空白+「owev」+空白+「er」)であった場合、非単語検出部23において検出された非単語NWが2個連続し(
図9に示すように、非単語NWである「owev」と非単語NWである「er」とが空白SPを介して連続)、かつ、当該連続する2個の非単語NWのうち先頭側の非単語NWである「owev」の直前に単語Wである「H」が存在する場合(S501でYES)、(iv)当該先頭側の非単語NWである「owev」の直前の単語Wである「H」と当該先頭側の非単語NWである「owev」とをその並び順に結合させた第1結合語(S502)、つまり、
図9に示す第1結合語である「Howev」が単語となるか否かを判定し、当該連続する2個の非単語NWである「owev」及び「er」をその並び順に結合させた第2結合語(S508)、つまり、
図9に示す第2結合語である「owever」が単語となるか否かを判定し、(v)第1結合語である「Howev」および第2結合語である「owever」が共に単語にならないと判定した場合(S504でNO、かつ、S510でNO)、当該先頭側の非単語NWである「owev」の直前の単語Wである「H」と当該連続する2個の非単語NWである「owev」及び「er」をその並び順に結合させた全結合語(S515)、つまり、
図9に示す全結合語である「However」が単語となるか否かを判定する(S517)。
【0057】
文字修正部25は、(v)判定部24において全結合語である「However」が単語であると判定された場合(S517でYES)、原稿G1におけるテキストD1のうちで全結合語に対応するテキスト部分、つまり、箇所P1のテキスト部分(「H」+空白+「owev」+空白+「er」からなる部分)を、文字認識不良部分として特定し、当該文字認識不良部分のテキストを当該全結合語のテキストに修正する(
図7のS606)。
図3に示すように、文字修正部25が、修正後のテキストD2の箇所P11のテキストを、(「H」+空白+「owev」+空白+「er」)の部分から「However」に修正する。
【0058】
なお、文字修正部25は、
図3に示すテキストD1の箇所P1が
図10の下段側に示すように(「How」+空白+「ev」+空白+「er」)であった場合、(iv)判定部24において第1結合語である「Howev」が単語とならないと判定され(S504でNO)、かつ、第2結合語である「ever」が単語となると判定された場合(S510でYES)、原稿G1におけるテキストD1のうちで当該連続する2個の非単語に対応するテキスト部分、つまり、箇所P1のテキスト部分(「ev」+空白+「er」からなる部分)を文字認識不良部分として特定し、当該文字認識不良部分のテキスト(「ev」+空白+「er」からなる部分)を、当該第2結合語のテキスト(つまり「ever」)に修正する(
図7のS604)。
【0059】
これにより、OCRで認識できなかった文字の部分、すなわち
図9に示すように文字認識不良部分が全結合語、又は第2結合語の何れであるかを特定でき、文字認識不良部分を適切な単語に修正することができる。このため、OCRで認識できなかった文字の部分をユーザーが修正する作業を不必要とすることができる。
【0060】
次に、
図10を用いて説明する。
図10はテキスト修正の一例を示す図である。
【0061】
判定部24は、
図3に示すテキストD1の箇所P1が
図10に示すように(「H」+空白+「ow」+空白+「ev」+空白+「er」)であった場合、非単語検出部23において検出された非単語NWが3個連続し(
図10に示すように、非単語NWである「ow」と非単語NWである「ev」と非単語NWである「er」とが空白SPを介して連続)、かつ、当該連続する3個の非単語NWのうち最先頭の非単語NWである「ow」の直前に単語Wである「H」が存在する場合(S501でYES)、(vi)当該最先頭の非単語NWである「ow」の直前の単語Wである「H」と当該最先頭の非単語NWである「ow」とをその並び順に結合させた第1結合語(S502)、つまり、
図10に示す第1結合語である「How」が単語となるか否かを判定し(S504)、当該最先頭の非単語NWである「ow」とその次の非単語NWである「ev」とをその並び順に結合させた第2結合語(S508)、つまり、
図10に示す第2結合語である「owev」が単語となるか否かを判定する(S510)。
【0062】
文字修正部25は、(vi)第1結合語である「How」が単語になると判定し(S504でYES)、かつ、第2結合語である「owev」が単語にならないと判定した場合(S510でNO)、原稿G1におけるテキストD1のうちで第1結合語に対応するテキスト部分、つまり、箇所P1のテキスト部分(「H」+空白+「ow」からなる部分)を文字認識不良部分として特定し、当該文字認識不良部分のテキスト(「H」+空白+「ow」からなる部分)を、当該第1結合語のテキスト(つまり「How」)に修正する(
図7のS602)。
【0063】
判定部24は、(vii)第1結合語である「How」が単語になると判定し、かつ、第2結合語である「owev」が単語にならないと判定した場合(S504でYES、かつ、S510でNO)、当該最先頭の非単語NWである「ow」の次の非単語NWである「ev」とその次の非単語NWである「er」とをその並び順に結合させた第3結合語である「ever」が単語となるか否かを判定する(S510)。
【0064】
文字修正部25は、(vii)判定部24において第3結合語である「ever」が単語であると判定された場合(S510でYES)、原稿G1におけるテキストD1のうちで第3結合語に対応するテキスト部分を文字認識不良部分として特定し、当該文字認識不良部分のテキストを当該第3結合語のテキスト(つまり「ever」)に修正する(
図7のS604)。
【0065】
これにより、OCRで認識できなかった文字の部分、すなわち
図10に示すように文字認識不良部分が第1結合語と第3結合語の両方であることを特定でき、文字認識不良部分を適切な単語に修正することができる。このため、OCRで認識できなかった文字の部分をユーザーが修正する作業を不必要とすることができる。
【0066】
【0067】
判定部24は、
図3に示すテキストD1の箇所P2が
図11に示すように(「Pl」+空白+「ea」+空白+「se」)であった場合、非単語検出部23において1個の非単語NWが検出され(
図11に示すように、非単語NWである「ea」)、かつ、当該1個の非単語NWの前後に単語Wである「Pl」及び「se」が存在する場合(S501でYES、かつ、S507でYES)、当該1個の非単語NWである「ea」とその直前の単語Wである「Pl」とをその並び順に結合させた第1結合語(S502)である「Plea」が単語となるか否かを判定し(S504)、当該1個の非単語NWである「ea」とその直後の単語である「se」とをその並び順に結合させた第2結合語である「ease」が単語となるか否かを判定し(S510)、更に、第1結合語である「Plea」および第2結合語である「ease」が共に単語になると判定した場合(S504でYES、かつ、S510でYES)、当該非単語NWである「ea」の直前の単語Wである「Pl」と当該非単語NWである「ea」と当該非単語NWである「ea」の直後の単語Wである「se」とをその並び順に結合させた全結合語(S515)である「Please」が単語となるか否かを判定し(S517)、当該非単語NWである「ea」の直前の単語Wである「Pl」が全て大文字であるか否かを判定する(
図7のS609)。
【0068】
文字修正部25は、(i)判定部24において全結合語である「Please」が単語であると判定された場合(S517でYES)、原稿G1におけるテキストD1のうちで全結合語に対応するテキスト部分、つまり、箇所P2のテキスト部分(「Pl」+空白+「ea」+空白+「se」からなる部分)を文字認識不良部分として特定し、当該文字認識不良部分のテキストを、「Pl」+空白+「ea」+空白+「se」からなるテキストから、全結合語のテキスト(つまり「Please」)に修正する(
図7のS606)。
図3に示すように、文字修正部25が、修正後のテキストD2の箇所P21のテキストを、(「Pl」+空白+「ea」+空白+「se」)の部分から「Please」に修正する。
【0069】
ところで、文字修正部25は、
図3に示すテキストD1の箇所P2が
図12に示すように(「Pl」+空白+「ea」+空白+「ger」)であった場合、(ii)判定部24において全結合語である「Pleager」が単語でないと判定された場合(S517でNO)、原稿G1におけるテキストD1のうちで第1結合語である「Plea」に対応するテキスト部分を文字認識不良部分として特定し、当該文字認識不良部分のテキストを、(「Pl」+空白+「ea」)の部分から、第1結合語のテキスト(つまり「Plea」)に修正する(
図7のS602)。
【0070】
ところで、文字修正部25は、
図3に示すテキストD1の箇所P3が
図13に示すように(「WHO」+空白+「m」+空白+「ay」)であった場合、(iii)判定部24において全結合語である「WHOmay」が単語でないと判定され(S517でNO)、かつ、当該非単語NWである「m」の直前の単語Wである「WHO」が全て大文字であると判定された場合(
図7のS609でYES)、原稿G1におけるテキストD1のうちで第2結合語である「may」に対応するテキスト部分(「m」+空白+「ay」の部分)を文字認識不良部分として特定し、当該文字認識不良部分のテキストを、(「m」+空白+「ay」)の部分から、第2結合語のテキスト(つまり「may」)に修正する(
図7のS604)。
図3に示すように、文字修正部25が、修正後のテキストD2の箇所P31のテキストを、(「m」+空白+「ay」)の部分から「may」に修正する。
【0071】
これにより、OCRで認識できなかった文字の部分、すなわち、文字認識不良部分が、
図11に示す全結合語である「Please」、
図12に示す第1結合語である「Plea」、又は
図13に示す第2結合語である「may」の何れであるかを特定でき、文字認識不良部分を適切な単語に修正することができる。このため、OCRで認識できなかった文字の部分をユーザーが修正する作業を不必要とすることができる。
【0072】
次に、
図14を用いて説明する。
図14はテキスト修正の一例を示す図である。
【0073】
判定部24は、
図3に示すテキストD1の箇所P4が
図14に示すように(「Ha」+空白+「m?」+空白+「Yes」)であった場合、非単語検出部23において1個の非単語NWである「m?」が検出され、当該1個の非単語NWである「m?」の最後の文字に句読点である「?」が含まれ、かつ、当該1個の非単語NWである「m?」の前に単語Wである「Ha」が存在する場合に、当該1個の非単語NWである「m?」とその直前の単語Wである「Ha」とをその並び順に結合させた結合語である「Ham?」が単語となるか否かを判定する。そして、文字修正部25は、判定部24において結合語である「Ham?」が単語であると判定され、かつ、当該1個の非単語NWである「m?」の最後の文字に句読点「?」が含まれると判定された場合に、原稿G1におけるテキストD1のうちで結合語である「Ham?」に対応するテキスト部分、つまり、箇所P4のテキスト部分(「Ha」+空白+「m?」からなる部分)を、を文字認識不良部分として特定し、修正後のテキストD2の箇所P41のテキストを、(「Ha」+空白+「m?」)の部分から「Ham?」に修正する。
【0074】
これにより、OCRで認識できなかった文字の部分、すなわち
図14に示す文字認識不良部分が結合語であることを特定でき、文字認識不良部分を適切な単語に修正することができる。このため、OCRで認識できなかった文字の部分をユーザーが修正する作業を不必要とすることができる。
【0075】
次に、
図15、
図16を用いて説明する。
図15はテキスト修正の一例を示す図である。
図16は、未確認語登録テーブルと単語辞書記憶テーブルの一例を示す図である。
【0076】
判定部24は、
図3に示すテキストD1の箇所が、
図15に示すような文字データ(「Faint」+空白+「lysu」+空白+「re」)であった場合、非単語検出部23において1個の非単語NWが検出され(
図15に示すように、非単語NWである「lysu」)、かつ、当該1個の非単語NWの前後に単語Wである「Faint」及び「re」が存在する場合(S501でYES、かつ、S507でYES)、当該1個の非単語NWである「lysu」とその直前の単語Wである「Faint」とをその並び順に結合させた第1結合語(S502)である「Faintlysu」が単語となるか否かを判定し(S504)、当該1個の非単語NWである「lysu」とその直後の単語である「re」とをその並び順に結合させた第2結合語である「lysure」が単語となるか否かを判定し(S510)、更に、第1結合語である「Faintlysu」および第2結合語である「lysure」が共に単語になならないと判定した場合(S504でNO、かつ、S510でNO)、当該非単語NWである「lysu」の直前の単語Wである「Faint」と当該非単語NWである「lysu」と当該非単語NWである「lysu」の直後の単語Wである「re」とをその並び順に結合させた全結合語(S515)である「Faintlysure」が単語となるか否かを判定し(S517)、全結合語である「Faintlysure」が単語にならないと判定する(S517でNO)。
【0077】
制御部21は、判定部24において第1結合語である「Faintlysu」および第2結合語である「lysure」が共に単語にならないと判定され(S504でNO、かつ、S510でNO)、かつ、全結合語である「Faintlysure」が単語とならないと判定された場合(S517でNO)、
図7のテキスト修正処理においてS601、S603、S605、S607、S608、及びS609の全てでNOであると判定し、非単語を未確認語としてデータ記憶部19の未確認語登録部19bに登録する(S610)。
図15及び
図16に示すように、非単語NWである「lysu」が未確認語として未確認語登録テーブルTB2に登録すると共に、その登録回数を示す「2回」も登録される。ここでは、
図3に示すテキストD1において、既に「lysu」が未確認語として1回登録されており、今回が2回目であったため、未確認語である「lysu」ごとの登録回数の値Nに「1」を加算し、その登録回数が「2回」に更新される。
【0078】
制御部21は、未確認語である「lysu」ごとの登録回数の値Nが予め定められた閾値回数TH以上であるか否かを判定し(S611)、未確認語である「lysu」ごとの登録回数の値Nが予め定められた閾値回数TH以上になると(S611でYES)、「lysu」を単語としてデータ記憶部19の単語辞書記憶テーブルTB1に登録する(S612)。制御部21は、
図16に示すように、「lysu」を単語として単語辞書記憶テーブルTB1に登録すると共に、「lysu」に対応付けて「追加された単語」であることを示す情報が記憶される。また、制御部21は、未確認語登録テーブルTB2から未確認語である「lysu」を削除する。
【0079】
これにより、OCRで認識できなかった文字の部分である非単語について、当該非単語の登場回数が、予め定められた閾値回数以上になると、単語として新たに登録することができる。このため、OCRで認識できなかった文字の部分が新用語である場合に、ユーザーが修正する作業を不必要とすることができる。
【0080】
上記第1実施形態によれば、非単語検出部23は、テキスト抽出部22にて抽出された原稿におけるテキストを構成する複数語のうち、単語でないとされる非単語を検出する。判定部24は、非単語検出部23が検出した非単語と当該非単語の直前の語及び直後の語の少なくとも一方とをその並び順に結合させた結合語が単語となるか否かを判定する。文字修正部25は、判定部24において単語になると判定された場合に、原稿におけるテキストのうちで当該結合語に対応するテキスト部分を文字認識不良部分として特定し、当該文字認識不良部分のテキストを当該結合語のテキストに修正する。これにより、OCRで認識できなかった文字の部分、すなわち文字認識不良部分を適切な単語に修正することができる。このため、OCRで認識できなかった文字の部分をユーザーが修正する作業を不必要とすることができ、ユーザーの操作負担を改善することができる。
【0081】
次に、第1実施形態では、画像読取装置の一例である画像形成装置10について説明しているが、第2実施形態に係る情報処理装置40としてもよい。
図17は、第2実施形態の情報処理装置及び画像形成装置の構成を示すブロック図である。
【0082】
情報処理装置40は、上記第1実施形態の画像形成装置10が備える制御ユニット11の制御部21、テキスト抽出部22、非単語検出部23、判定部24、及び文字修正部25に対応する構成(後述する制御部411、テキスト抽出部412、非単語検出部413、判定部414、及び文字修正部415)を備える。すなわち、情報処理装置40は、画像形成装置10から受信した原稿の画像データをOCR処理して当該原稿のテキストを抽出し、当該抽出したテキストを修正する機能を備える。
【0083】
第2実施形態に係る情報処理装置40は、制御ユニット410と、表示部402と、タッチパネル403と、通信部404と、記憶部405とを備えている。これらの構成要素は、互いにバスを通じてデータ又は信号の送受信が可能とされている。情報処理装置40は、例えば、パーソナルコンピューター、サーバー、携帯情報端末などである。
【0084】
表示部402は、液晶ディスプレイ(LCD:Liquid Crystal Display)や有機EL(OLED:Organic Light-Emitting Diode)などの表示装置である。
【0085】
タッチパネル403は、所謂抵抗膜方式や静電容量方式等のタッチパネルである。タッチパネル403は、表示部402の画面に配置され、表示部402の画面に対する指などの接触をその接触位置と共に検知する。タッチパネル403は、指などの接触を検知すると、その接触位置の座標を示す検知信号を制御ユニット410の制御部411などに出力する。従って、タッチパネル403は、表示部402の画面に対するユーザー操作が入力される操作部としての役割を果たす。
【0086】
通信部404は、不図示のLANチップなどの通信モジュールを備える通信インターフェイスである。通信部404は、LAN又はインターネットを介して画像形成装置10との通信機能を有する。
【0087】
記憶部405は、例えば、SSD(Solid State Drive)、HDD(Hard Disk Drive)などの記憶装置であり、各種のデータやプログラムを記憶している。記憶部405は、原稿画像記憶部405Aと、未確認語登録部405Bとを備える。原稿画像記憶部405A及び未確認語登録部405Bは、上記の第1実施形態の原稿画像記憶部19a及び未確認語登録部19bに相当する。また、記憶部405は、
図4(A)に示す単語辞書記憶テーブルTB1と同等の単語辞書記憶テーブルを備え、各種のフラグの状態(オン、オフ、未設定)を記憶するフラグ記憶エリアを備えている。
【0088】
制御ユニット410は、プロセッサー、RAM(Random Access Memory)、及びROM(Read Only Memory)などから構成される。プロセッサーは、CPU(Central Processing Unit)、MPU、又はASIC等である。この制御ユニット11は、上記のROM又は記憶部405に記憶された制御プログラム(例えばテキスト修正プログラム)が上記プロセッサーで実行されることにより、制御部411、テキスト抽出部412、非単語検出部413、判定部414、及び文字修正部415として機能する。なお、制御ユニット410の上記の各構成要素は、前述の制御プログラムに基づく動作によらず、それぞれハード回路により構成されてもよい。
【0089】
制御部411は、情報処理装置40の全体的な動作制御を司る。また、制御部411は、表示部402、タッチパネル403、通信部404、記憶部405などと接続されており、上記各構成要素の動作制御や、各構成要素との間での信号またはデータの送受信を行う。
【0090】
情報処理装置40は、
図17に示すように、例えば画像形成装置10から受信した原稿の画像を記憶する原稿画像記憶部405Aと、原稿画像記憶部405Aに記憶された前記原稿の画像に対して、OCR処理を行うことにより、原稿におけるテキストを抽出するテキスト抽出部412と、テキスト抽出部412にて抽出された原稿におけるテキストを構成する複数語のうち、単語でないとされる非単語を検出する非単語検出部413と、非単語検出部413が検出した非単語と、当該非単語の直前の語及び直後の語の少なくとも一方とをその並び順に結合させた結合語が単語となるか否かを判定する判定部414と、判定部414において単語になると判定された場合に、原稿におけるテキストのうちで結合語に対応するテキスト部分を文字認識不良部分として特定し、当該文字認識不良部分のテキストを当該結合語のテキストに修正する文字修正部415と、を備える。
【0091】
上記の第2実施形態に係る情報処理装置40によれば、第1実施形態の場合と同様の効果を奏する。すなわち、OCRで認識できなかった文字の部分、すなわち文字認識不良部分を適切な単語に修正することができる。このため、OCRで認識できなかった文字の部分をユーザーが修正する作業を不必要とすることができ、ユーザーの操作負担を改善することができる。
【0092】
なお、本発明は上記実施の形態の構成に限られず種々の変形が可能である。
【0093】
また、上記実施形態では、アルファベットを用いる英語によるテキストを修正しているが、スペイン語、イタリア語、ロシア語などのテキストを修正することも可能である。このように、英語以外の言語についてテキスト修正する場合には、
図4(A)に示す単語辞書記憶テーブルTB1は、英語以外の言語(スペイン語、イタリア語、ロシア語など)の単語辞書記憶テーブルとすればよい。
【0094】
なお、
図1乃至
図17を用いて説明した上記実施形態の構成及び処理は、本発明の一例に過ぎず、本発明を当該構成及び処理に限定する趣旨ではない。
【符号の説明】
【0095】
10 画像形成装置
17 画像読取部
19 データ記憶部
19a 原稿画像記憶部
19b 未確認語登録部
21 制御部
22 テキスト抽出部
23 非単語検出部
24 判定部
25 文字修正部
40 情報処理装置
405A 原稿画像記憶部
405B 未確認語登録部
411 制御部
412 テキスト抽出部
413 非単語検出部
414 判定部
415 文字修正部