特許6575132 | 知財ポータル「IP Force」

知財求人 - 知財ポータルサイト「IP Force」

▶ 富士ゼロックス株式会社の特許一覧

特許6575132情報処理装置及び情報処理プログラム

書誌要約請求の範囲詳細な説明課題実施例実施するための形態図面の説明

目に優しい文字サイズ小中大 PDF Top

< >

1
2
3
4
5
6
7
8
9
10
11
12
13

(19)【発行国】日本国特許庁(JP)

(12)【公報種別】特許公報(B2)

(11)【特許番号】6575132

(24)【登録日】2019年8月30日

(45)【発行日】2019年9月18日

(54)【発明の名称】情報処理装置及び情報処理プログラム

(51)【国際特許分類】

G06K 9/03 20060101AFI20190909BHJP

【ＦＩ】

G06K9/03 B

G06K9/03 C

【請求項の数】4

【全頁数】21

(21)【出願番号】特願2015-98655(P2015-98655)

(22)【出願日】2015年5月14日

(65)【公開番号】特開2016-212812(P2016-212812A)

(43)【公開日】2016年12月15日

【審査請求日】2018年2月28日

(73)【特許権者】

【識別番号】000005496

【氏名又は名称】富士ゼロックス株式会社

(74)【代理人】

【識別番号】100115129

【弁理士】

【氏名又は名称】清水昇

(74)【代理人】

【識別番号】100102716

【弁理士】

【氏名又は名称】在原元司

(74)【代理人】

【識別番号】100122275

【弁理士】

【氏名又は名称】竹居信利

(72)【発明者】

【氏名】木村俊一

(72)【発明者】

【氏名】久保田聡

(72)【発明者】

【氏名】田中瑛一

(72)【発明者】

【氏名】越裕

(72)【発明者】

【氏名】岡秀宣

(72)【発明者】

【氏名】武藤晋

(72)【発明者】

【氏名】田中公隆

【審査官】岡本俊威

(56)【参考文献】

【文献】特表２００８−５０２９６１（ＪＰ，Ａ）

(58)【調査した分野】（Int.Cl.，ＤＢ名）

Ｇ０６Ｋ９／００−９／０３

(57)【特許請求の範囲】

【請求項1】

文字認識対象を３種類のいずれかに分類する分類手段と、
前記分類手段によって第１の種類に分類された場合に、前記文字認識対象の文字認識結果を抽出する抽出手段と、
前記分類手段によって第２の種類に分類された場合に、前記文字認識対象の文字認識結果を抽出し、該文字認識対象を人手で入力させるように制御する第１の制御手段と、
前記分類手段によって第３の種類に分類された場合に、前記文字認識対象を複数人の人手で入力させるように制御する第２の制御手段
を具備し、
前記分類手段は、前記文字認識対象の文字認識結果の認識確度を予め定められた複数の閾値と比較することによって分類を行う
ことを特徴とする情報処理装置。

【請求項2】

前記第１の制御手段の制御によって抽出された文字認識結果と人手で入力された入力結果、又は、前記第２の制御手段の制御によって入力された複数の入力結果を統合する統合手段
をさらに具備することを特徴とする請求項１に記載の情報処理装置。

【請求項3】

前記統合手段は、文字認識結果と入力結果が異なる場合、又は、複数の入力結果が異なる場合は、人手による選択又は入力をさせるように制御する
ことを特徴とする請求項２に記載の情報処理装置。

【請求項4】

コンピュータを、
文字認識対象を３種類のいずれかに分類する分類手段と、
前記分類手段によって第１の種類に分類された場合に、前記文字認識対象の文字認識結果を抽出する抽出手段と、
前記分類手段によって第２の種類に分類された場合に、前記文字認識対象の文字認識結果を抽出し、該文字認識対象を人手で入力させるように制御する第１の制御手段と、
前記分類手段によって第３の種類に分類された場合に、前記文字認識対象を複数人の人手で入力させるように制御する第２の制御手段
として機能させ、
前記分類手段は、前記文字認識対象の文字認識結果の認識確度を予め定められた複数の閾値と比較することによって分類を行う
情報処理プログラム。

【発明の詳細な説明】

【技術分野】

【0001】

本発明は、情報処理装置及び情報処理プログラムに関する。

【背景技術】

【0002】

特許文献１には、クレジットカード入会申込書のイメージデータを自動的に文字認識するに際し、この文字認識を補完するオペレーターによる入力処理時間の短縮とコスト削減を可能とすることを課題とし、イメージ認識部は多数の記入済みクレジットカード入会申込書のイメージをスキャナによりコンピュータに取り込み、文字認識部は、所定の読み取りフォーマットにしたがいクレジットカード入会申込書の文字を認識し当該クレジットカード入会申込書に対応するデータファイルの所定の欄に認識データを入力し、データ入力部は、データファイルの、文字認識にエラーが発生して文字が入力されていない不完全入力欄にキーボードと音声のいずれか一方の入力に基づいて補完データを入力することが開示されている。

【0003】

特許文献２には、誤認識文字を修正して編集するキー入力編集方法及び編集装置に関し、誤認識文字の修正操作の効率化を図ることを課題とし、スキャナ又はファクシミリ装置を介したイメージデータのイメージデータ・ファイルに格納し、帳票定義情報ファイル等による定義情報にしたがってイメージデータ・ファイルから行／フィールド／カラム単位でイメージデータを読出して文字認識部により文字認識し、認識文字をデータベースにイメージデータと対応して格納し、編集処理部により同一文字種又は同一文字コードの認識文字とそのイメージデータとを対応させて行／フィールド／カラム単位で表示部に表示し、誤認識文字をキーボードから修正入力し、データベースに格納された認識文字を修正することが開示されている。

【0004】

特許文献３には、文字データの入力エラーを検出することを目的とし、画像入力部により文字情報を光学的に読取り、その文字情報をキー入力部からキー入力し、画像入力部により読取られ文字認識部で文字認識されたデータとキー入力されたデータとを文字照合部で比較し、この比較結果が一致を示したとき、そのデータを正しいデータとして出力し、不一致を示したときには、そのデータの修正が必要である旨を表示部で告知し、この告知後にキー入力されたデータを正しいデータとして出力し、画像入力結果とキー入力結果とを比較してエラーを検出しているため、チェックディジット等による論理的な判定が不可能な場合でもエラーを検出でき、またキーパンチャが２度キー入力するよりも速く処理できるので、データ入力処理工数を削減できることが開示されている。

【先行技術文献】

【特許文献】

【0005】

【特許文献1】特開２００５−０５６０９９号公報

【特許文献2】特開平１１−００７４９２号公報

【特許文献3】特開平０６−２７４６７９号公報

【発明の概要】

【発明が解決しようとする課題】

【0006】

本発明は、文字認識対象に対して文字認識、人手で入力する場合に比べて、データ入力の誤り率を増大させることなく、人手で入力する場合の工数を削減するようにした情報処理装置及び情報処理プログラムを提供することを目的としている。

【課題を解決するための手段】

【0007】

かかる目的を達成するための本発明の要旨とするところは、次の各項の発明に存する。
請求項１の発明は、文字認識対象を３種類のいずれかに分類する分類手段と、前記分類手段によって第１の種類に分類された場合に、前記文字認識対象の文字認識結果を抽出する抽出手段と、前記分類手段によって第２の種類に分類された場合に、前記文字認識対象の文字認識結果を抽出し、該文字認識対象を人手で入力させるように制御する第１の制御手段と、前記分類手段によって第３の種類に分類された場合に、前記文字認識対象を複数人の人手で入力させるように制御する第２の制御手段を具備し、前記分類手段は、前記文字認識対象の文字認識結果の認識確度を予め定められた複数の閾値と比較することによって分類を行うことを特徴とする情報処理装置である。

【0008】

請求項２の発明は、前記第１の制御手段の制御によって抽出された文字認識結果と人手で入力された入力結果、又は、前記第２の制御手段の制御によって入力された複数の入力結果を統合する統合手段をさらに具備することを特徴とする請求項１に記載の情報処理装置である。

【0009】

請求項３の発明は、前記統合手段は、文字認識結果と入力結果が異なる場合、又は、複数の入力結果が異なる場合は、人手による選択又は入力をさせるように制御することを特徴とする請求項２に記載の情報処理装置である。

【0011】

請求項４の発明は、コンピュータを、文字認識対象を３種類のいずれかに分類する分類手段と、前記分類手段によって第１の種類に分類された場合に、前記文字認識対象の文字認識結果を抽出する抽出手段と、前記分類手段によって第２の種類に分類された場合に、前記文字認識対象の文字認識結果を抽出し、該文字認識対象を人手で入力させるように制御する第１の制御手段と、前記分類手段によって第３の種類に分類された場合に、前記文字認識対象を複数人の人手で入力させるように制御する第２の制御手段として機能させ、前記分類手段は、前記文字認識対象の文字認識結果の認識確度を予め定められた複数の閾値と比較することによって分類を行う情報処理プログラムである。

【発明の効果】

【0012】

請求項１の情報処理装置によれば、文字認識対象に対して文字認識、人手で入力する場合に比べて、データ入力の誤り率を増大させることなく、人手で入力する場合の工数を削減することができる。また、文字認識対象の文字認識結果の認識確度を予め定められた複数の閾値と比較することによって分類を行うことができる。

【0013】

請求項２の情報処理装置によれば、２つの結果データを統合することができる。

【0014】

請求項３の情報処理装置によれば、文字認識結果と入力結果が異なる場合、又は、複数の入力結果が異なる場合は、人手による選択又は入力をさせるように制御することができる。

【0016】

請求項４の情報処理プログラムによれば、文字認識対象に対して文字認識、人手で入力する場合に比べて、データ入力の誤り率を増大させることなく、人手で入力する場合の工数を削減することができる。また、文字認識対象の文字認識結果の認識確度を予め定められた複数の閾値と比較することによって分類を行うことができる。

【図面の簡単な説明】

【0017】

【図1】第１の実施の形態の構成例についての概念的なモジュール構成図である。

【図2】本実施の形態を利用したシステム構成例を示す説明図である。

【図3】第１の実施の形態による処理例を示すフローチャートである。

【図4】本実施の形態による処理例を示す説明図である。

【図5】本実施の形態による処理例を示す説明図である。

【図6】第２の実施の形態の構成例についての概念的なモジュール構成図である。

【図7】第２の実施の形態による処理例を示すフローチャートである。

【図8】本実施の形態が利用される処理例を示す説明図である。

【図9】突き合わせ処理の一例を示す説明図である。

【図10】突き合わせ処理の一例を示す説明図である。

【図11】突き合わせ処理の一例を示す説明図である。

【図12】突き合わせ処理の一例を示す説明図である。

【図13】本実施の形態を実現するコンピュータのハードウェア構成例を示すブロック図である。

【発明を実施するための形態】

【0018】

まず、本実施の形態を説明する前に、その前提又は本実施の形態を利用する情報処理装置について、図８〜１２を用いて説明する。なお、この説明は、本実施の形態の理解を容易にすることを目的とするものである。
図８は、本実施の形態が利用される処理例を示す説明図である。「住所」、「氏名」、「商品番号」等の各種番号が記入された帳票内のデータを入力する業務がある。例えば、図８の例に示すように、氏名欄８１２、住所欄８１４、商品番号欄８１６を有している帳票画像８１０があり、その氏名欄８１２、住所欄８１４、商品番号欄８１６内に、手書きで文字が記載される。
一般に、この帳票画像８１０を見て、情報処理装置８００を用いて、オペレーター（ユーザー）によって人手（キー入力）による入力が行われているため、データ入力費用が課題となっている。
誤りの入力を排除するために、図９の例に示されるように、従来の人手入力の場合には、複数の人（Ａさん、Ｂさん）が同じ帳票画像８１０を見て、人手入力装置（Ａさん）９２０Ａ、人手入力装置（Ｂさん）９２０Ｂで並行にキー入力（ダブル入力）を行う。突き合わせ処理モジュール９４０では、人手入力装置（Ａさん）９２０Ａ、人手入力装置（Ｂさん）９２０Ｂのそれぞれで入力を行った結果を突き合わせる。２つの結果が同じであれば（「結果が同じ場合」９４６）、そのまま入力結果のデータを採用する（「キー入力結果が合っていると判断する」９４８）。２つの結果が異なる場合は（「結果が異なる場合」９４２）、キー入力結果が間違っていると判断する（「キー入力結果が間違っていると判断する」９４４）。間違っている場合には、別の処理（再入力等）を行うことになる。
背景技術に挙げた特許文献３等においては、図１０の例に示すように、人手入力装置（Ｂさん）９２０Ｂを文字認識器１０３０で代替する技術が開示されている。Ａさんが見てキー入力を行っている帳票画像８１０と同じものを文字認識器１０３０に入力する。文字認識器１０３０は、入力された帳票画像８１０内の文字（具体的には、氏名欄８１２、住所欄８１４、商品番号欄８１６内に記載されている文字）を認識し、認識結果を出力する。突き合わせ処理モジュール１０４０は、人手入力装置（Ａさん）１０２０でのＡさんの入力結果と、文字認識器１０３０の認識結果を突き合わせて、２つの結果が同じであれば（「結果が同じ場合」１０４６）、そのまま入力結果（認識結果）のデータを採用する（「キー入力結果及び認識結果が合っていると判断する」１０４８）。２つの結果が異なる場合は（「結果が異なる場合」１０４２）、キー入力結果又は文字認識結果が間違っていると判断する（「キー入力結果又は認識結果が間違っていると判断する」１０４４）。この場合には、別の処理（再入力等）を行うことになる。
上記に示したように、文字認識器１０３０と人手による入力（人手入力装置（Ａさん）１０２０）のダブル入力を行うのが従来技術である。

【0019】

図１０の例に示した従来技術では、文字認識器１０３０の認識率が悪い場合には、その文字認識器１０３０の悪い認識率に引きずられて、最終的なデータ入力の品質が悪くなってしまう場合がある。
図１１、図１２に示す例を用いて説明する。なお、図１１に示す例は図９に示す例に対応し、図１２に示す例は図１０の示す例に対応している。
図１１、図１２では、２つの結果が異なる場合には（「結果が異なる場合」１１４２、１２４２）、統合処理モジュール１１６０、１２６０は、「Ｃさん」（人手入力装置（Ｃさん）１１５０、１２５０）の入力結果を利用する場合を示す。
ここで、人の誤り率をｒとする。
図１１に示す例のように、人が２人で入力する場合には、どちらも誤る確率は、１−（１−ｒ）^２である。最終的なデータが誤っている確率Ｅは、さらに、Ｃさんも誤る場合であるため、Ｅ＝ｒ［１−（１−ｒ）^２］となる。人の誤り率をｒ＝０．０１とすると、図１１の場合のデータ誤り率は、１．９９×１０^−４となる。
次に、文字認識器１０３０の誤り率をＲとする。最終的な誤り率は、Ｅ＝ｒ［１−（１−ｒ）（１−Ｒ）］となる。
Ｒ＝０．０１であれば、図１１と図１２に示す例の結果は同じとなる。しかしながら、文字認識器１０３０の誤り率が大きな場合、例えば、Ｒ＝０．１の場合は、最終的な誤り率は、Ｅ＝１．０９×１０^−３となり、約１桁誤り率が大きくなってしまう。

【0020】

データ入力を行う場合に、文字認識器を利用するとデータ誤り率が増加する問題がある。
この問題を避けるためには、文字認識器を利用せず、人手でダブル入力を行えばよい。
ただし、この場合には、２人分の工数を常に必要としてしまうことになる。

【0021】

以下、図面に基づき本発明を実現するにあたっての好適な各種の実施の形態の例を説明する。
図１は、第１の実施の形態の構成例についての概念的なモジュール構成図を示している。
なお、モジュールとは、一般的に論理的に分離可能なソフトウェア（コンピュータ・プログラム）、ハードウェア等の部品を指す。したがって、本実施の形態におけるモジュールはコンピュータ・プログラムにおけるモジュールのことだけでなく、ハードウェア構成におけるモジュールも指す。それゆえ、本実施の形態は、それらのモジュールとして機能させるためのコンピュータ・プログラム（コンピュータにそれぞれの手順を実行させるためのプログラム、コンピュータをそれぞれの手段として機能させるためのプログラム、コンピュータにそれぞれの機能を実現させるためのプログラム）、システム及び方法の説明をも兼ねている。ただし、説明の都合上、「記憶する」、「記憶させる」、これらと同等の文言を用いるが、これらの文言は、実施の形態がコンピュータ・プログラムの場合は、記憶装置に記憶させる、又は記憶装置に記憶させるように制御するという意味である。また、モジュールは機能に一対一に対応していてもよいが、実装においては、１モジュールを１プログラムで構成してもよいし、複数モジュールを１プログラムで構成してもよく、逆に１モジュールを複数プログラムで構成してもよい。また、複数モジュールは１コンピュータによって実行されてもよいし、分散又は並列環境におけるコンピュータによって１モジュールが複数コンピュータで実行されてもよい。なお、１つのモジュールに他のモジュールが含まれていてもよい。また、以下、「接続」とは物理的な接続の他、論理的な接続（データの授受、指示、データ間の参照関係等）の場合にも用いる。「予め定められた」とは、対象としている処理の前に定まっていることをいい、本実施の形態による処理が始まる前はもちろんのこと、本実施の形態による処理が始まった後であっても、対象としている処理の前であれば、そのときの状況・状態に応じて、又はそれまでの状況・状態に応じて定まることの意を含めて用いる。「予め定められた値」が複数ある場合は、それぞれ異なった値であってもよいし、２以上の値（もちろんのことながら、全ての値も含む）が同じであってもよい。また、「Ａである場合、Ｂをする」という意味を有する記載は、「Ａであるか否かを判断し、Ａであると判断した場合はＢをする」の意味で用いる。ただし、Ａであるか否かの判断が不要である場合を除く。
また、システム又は装置とは、複数のコンピュータ、ハードウェア、装置等がネットワーク（一対一対応の通信接続を含む）等の通信手段で接続されて構成されるほか、１つのコンピュータ、ハードウェア、装置等によって実現される場合も含まれる。「装置」と「システム」とは、互いに同義の用語として用いる。もちろんのことながら、「システム」には、人為的な取り決めである社会的な「仕組み」（社会システム）にすぎないものは含まない。
また、各モジュールによる処理毎に又はモジュール内で複数の処理を行う場合はその処理毎に、対象となる情報を記憶装置から読み込み、その処理を行った後に、処理結果を記憶装置に書き出すものである。したがって、処理前の記憶装置からの読み込み、処理後の記憶装置への書き出しについては、説明を省略する場合がある。なお、ここでの記憶装置としては、ハードディスク、ＲＡＭ（ＲａｎｄｏｍＡｃｃｅｓｓＭｅｍｏｒｙ）、外部記憶媒体、通信回線を介した記憶装置、ＣＰＵ（ＣｅｎｔｒａｌＰｒｏｃｅｓｓｉｎｇＵｎｉｔ）内のレジスタ等を含んでいてもよい。

【0022】

以下、文字認識対象として、文字画像を主に例示して説明する。ただし、文字画像に限定する必要はない。例えば、ストローク情報によって構成されているオンライン文字であってもよい。また、手書き文字に限らず、印刷文字等であってもよい。
本実施の形態である情報処理装置１００は、文字画像１０８内に含まれている文字を示すテキストデータを出力データ１５２とするものであって、図１の例に示すように、文字認識モジュール１１０、文字列分類モジュール１２０、認識結果選択モジュール１３０、人手入力モジュール１４０、結果統合モジュール１５０を有している。

【0023】

文字認識モジュール１１０は、文字列分類モジュール１２０、認識結果選択モジュール１３０と接続されており、文字画像１０８（具体例として、文字画像（Ａ山Ｂ雄）１０８Ａ、文字画像（Ｃ川Ｄ介）１０８Ｂ等）を受け付け、文字列分類モジュール１２０に認識確度１１２を、認識結果選択モジュール１３０に認識結果１１６を渡す。文字認識モジュール１１０は、文字画像１０８を文字認識する。テキストデータである認識結果１１６と、その認識結果１１６の認識確度１１２を出力する既存の文字認識技術を用いればよい。ここで、認識確度１１２の値が高いほど、その認識結果１１６である確率が高いことを示しているものとする。
文字列分類モジュール１２０は、文字認識モジュール１１０、認識結果選択モジュール１３０、人手入力モジュール１４０、結果統合モジュール１５０と接続されており、閾値１１８を受け付け、文字認識モジュール１１０から認識確度１１２を受け取り、認識結果選択モジュール１３０、人手入力モジュール１４０、結果統合モジュール１５０に分類結果１２２を渡す。文字列分類モジュール１２０は、文字認識対象である文字画像１０８を３種類のいずれかに分類する。
また、文字列分類モジュール１２０は、文字認識対象の文字画像１０８の文字認識結果の認識確度１１２を予め定められた複数の閾値１１８と比較することによって分類を行うようにしてもよい。具体的には、閾値１１８として、Ｔｈ１、Ｔｈ２（Ｔｈ１はＴｈ２より高い閾値）を用いて、分類結果１２２として第１の種類、第２の種類、第３の種類のいずれかを出力するようにしてもよい。認識確度１１２がＴｈ１より高い場合（つまり、文字認識モジュール１１０による認識結果１１６を採用してもよい場合）は、第１の種類に分類し、認識確度１１２がＴｈ１以下であって、Ｔｈ２より高い場合（つまり、「文字認識モジュール１１０による認識結果１１６を採用してもよい場合」ではなく、かつ「文字認識モジュール１１０による認識結果１１６を採用してはならない場合」ではない場合）は、第２の種類に分類し、認識確度１１２がＴｈ２以下の場合（つまり、文字認識モジュール１１０による認識結果１１６を採用してはならない場合）、第３の種類に分類する。

【0024】

認識結果選択モジュール１３０は、文字認識モジュール１１０、文字列分類モジュール１２０、結果統合モジュール１５０と接続されており、文字認識モジュール１１０から認識結果１１６を、文字列分類モジュール１２０から分類結果１２２を受け取り、結果統合モジュール１５０に認識結果１３２を渡す。認識結果選択モジュール１３０は、文字列分類モジュール１２０によって第１の種類に分類された場合に、文字認識対象の文字画像１０８に対する文字認識モジュール１１０による認識結果１１６を抽出する。また、認識結果選択モジュール１３０は、文字列分類モジュール１２０によって第２の種類に分類された場合に、文字認識対象の文字画像１０８に対する文字認識モジュール１１０による認識結果１１６を抽出する。つまり、分類結果１２２が第１の種類又は第２の種類である場合は、認識結果１１６を認識結果１３２として結果統合モジュール１５０に渡す。
人手入力モジュール１４０は、文字列分類モジュール１２０、結果統合モジュール１５０と接続されており、文字画像１０８を受け付け、文字列分類モジュール１２０から分類結果１２２を受け取り、結果統合モジュール１５０に人手入力結果１４２を渡す。人手入力モジュール１４０は、文字列分類モジュール１２０によって第２の種類に分類された場合に、文字認識対象の文字画像１０８を対象として人手で入力させるように制御する。また、人手入力モジュール１４０は、文字列分類モジュール１２０によって第３の種類に分類された場合に、文字認識対象の文字画像１０８を対象として複数人の人手で入力させるように制御する。つまり、分類結果１２２が第２の種類又は第３の種類である場合は、人手入力結果１４２（第２の種類の場合は１つの入力結果、第３の種類の場合は複数の入力結果）を結果統合モジュール１５０に渡す。以下、複数人の例として、２人の場合を示すが、３人以上であってもよい。

【0025】

結果統合モジュール１５０は、文字列分類モジュール１２０、認識結果選択モジュール１３０、人手入力モジュール１４０と接続されており、文字列分類モジュール１２０から分類結果１２２を、認識結果選択モジュール１３０から認識結果１３２を、人手入力モジュール１４０から人手入力結果１４２を受け取り、出力データ１５２を出力する。結果統合モジュール１５０は、文字列分類モジュール１２０によって第２の種類に分類された場合は、認識結果選択モジュール１３０によって抽出された文字認識結果を出力データ１５２として出力する。結果統合モジュール１５０は、文字列分類モジュール１２０によって第２の種類に分類された場合は、認識結果選択モジュール１３０によって抽出された文字認識結果と人手入力モジュール１４０によって人手で入力された入力結果を統合する。又は、結果統合モジュール１５０は、文字列分類モジュール１２０によって第３の種類に分類された場合は、人手入力モジュール１４０の制御によって入力された複数の入力結果を統合する。
結果統合モジュール１５０は、認識結果１３２と人手入力結果１４２が異なる場合、又は、複数の人手入力結果１４２が異なる場合は、人手による選択（認識結果１３２、人手入力結果１４２のいずれかの選択、複数の人手入力結果１４２のうちの１つの選択）又は人手による入力をさせるように制御するようにしてもよい。ここでの人手は、人手入力モジュール１４０によって入力を行ったユーザーであってもよいが、好ましくは、人手入力モジュール１４０によって入力を行ったユーザー以外のユーザーがよい。

【0026】

図１に示す例を用いて、動作例を説明する。
帳票画像が文字画像１０８として入力される。例えば、帳票の中の氏名欄の画像が入力される。特に切り取られている必要はないが、本例では、氏名欄が切り取られて、文字画像（Ａ山Ｂ雄）１０８Ａ、文字画像（Ｃ川Ｄ介）１０８Ｂ等のように入力される例を示している。
文字画像１０８は、文字認識モジュール１１０において、認識が行われ、認識確度１１２と認識結果１１６を出力する。
認識確度１１２は、文字列分類モジュール１２０に入力され、図４の例で後述するように、（１）〜（３）の３種の文字列に分類する。文字列分類モジュール１２０では２つの閾値１１８を用いる。
認識結果選択モジュール１３０では、（１）又は（２）の場合に、認識結果１１６を選択する。
人手入力モジュール１４０では、（２）の場合には、１人分の人手データ入力を行うように、データ表示及び、データ受け取りを行う。（３）の場合には、２人分の人手データ入力を行うように、データ表示及び、データ受け取りを行う。
結果統合モジュール１５０では、分類結果１２２にしたがって、認識結果１３２と人手入力モジュール１４０の結果（人手入力結果１４２）を統合して最終的な処理を行う。最終的な処理の例として、図１１、図１２の例で後述するように、２つの結果を突き合わせて、結果が異なるようであれば、人手入力を行う等の処理を行う。結果統合モジュール１５０による処理結果が出力データ１５２となる。本出力データ１５２は、データ入力の内容（文字画像１０８に対応するテキストデータ）となる。
なお、文字列は、１文字以上の文字の連なりをいう。したがって、１文字も文字列と称する。

【0027】

閾値はＴｈ１、Ｔｈ２の２つではなくてもよい。どちらか１つでもよい。
Ｔｈ１のみであれば、
（１）文字認識モジュール１１０のみでデータ入力を行う。
（２）文字認識モジュール１１０と人でダブル入力を行う。
の選択を行うことができる。この場合は、認識結果選択モジュール１３０は不要である。
Ｔｈ２のみであれば、
（２）文字認識モジュール１１０と人でダブル入力を行う。
（３）人でダブル入力を行う。
の選択を行うことができる。
あるいは、Ｔｈ１とＴｈ２を同じ値に設定することにより、
（１）文字認識モジュール１１０のみでデータ入力を行う。
（３）人でダブル入力を行う。
の選択を行うことができる。

【0028】

図２は、本実施の形態を利用したシステム構成例を示す説明図である。
情報処理装置１００、画像読取装置２１０、入力用端末２２０Ａ、入力用端末２２０Ｂ、入力用端末２２０Ｃは、通信回線２９０を介してそれぞれ接続されている。通信回線２９０は、無線、有線、これらの組み合わせであってもよく、例えば、通信インフラとしてのインターネット、イントラネット等であってもよい。
入力用端末２２０は、ユーザー２２２によって操作される。例えば、画像読取装置２１０は帳票画像８１０を読み取り、情報処理装置１００に送信する。情報処理装置１００による制御によって、第２の種類の場合は入力用端末２２０Ａに画像読取装置２１０で読み取られた文字画像が送信され、ユーザー２２２Ａによる入力結果を入力用端末２２０Ａが情報処理装置１００に送信する。また、情報処理装置１００による制御によって、第３の種類の場合は入力用端末２２０Ａ、入力用端末２２０Ｂに画像読取装置２１０で読み取られた文字画像が送信され、ユーザー２２２Ａによる入力結果を入力用端末２２０Ａが情報処理装置１００に送信し、ユーザー２２２Ｂによる入力結果を入力用端末２２０Ｂが情報処理装置１００に送信する。そして、文字認識モジュール１１０による認識結果１１６とユーザー２２２Ａによる入力結果が異なる場合、又は、ユーザー２２２Ａによる入力結果とユーザー２２２Ｂによる入力結果が異なる場合は、入力用端末２２０Ｃに画像読取装置２１０で読み取られた文字画像が送信され、ユーザー２２２Ｃによる入力結果を入力用端末２２０Ｃが情報処理装置１００に送信する。
そして、情報処理装置１００は、第１の種類の場合は、文字認識モジュール１１０による認識結果１１６を出力し、第２の種類の場合は、文字認識モジュール１１０による認識結果１１６とユーザー２２２Ａによる入力結果を統合した結果を出力し、第３の種類の場合は、ユーザー２２２Ａによる入力結果とユーザー２２２Ｂによる入力結果を統合した結果を出力する。ここでの統合結果は、両者が同じである場合はその値（入力結果又は認識結果）、異なる場合はユーザー２２２Ｃによる入力結果である。

【0029】

図３は、第１の実施の形態による処理例を示すフローチャートである。
ステップＳ３０２では、文字認識モジュール１１０は、文字画像１０８を受け付ける。
ステップＳ３０４では、文字認識モジュール１１０は、文字画像１０８を認識する。
ステップＳ３０６では、文字列分類モジュール１２０は、認識確度（Ｋ）１１２を判断し、「Ｋ＞Ｔｈ１」の場合はステップＳ３０８へ進み、「Ｔｈ２＜Ｋ≦Ｔｈ１」の場合はステップＳ３１２へ進み、「Ｋ≦Ｔｈ２」の場合はステップＳ３１８へ進む。
ステップＳ３０８では、認識結果選択モジュール１３０は、認識結果１１６を選択する。
ステップＳ３１０では、結果統合モジュール１５０は、認識結果１３２を出力データ１５２とする。

【0030】

ステップＳ３１２では、認識結果選択モジュール１３０は、認識結果１１６を選択する。
ステップＳ３１４では、人手入力モジュール１４０は、１人分の人手データ入力を促す。
ステップＳ３１６では、人手入力モジュール１４０は、人手入力結果を受け付ける。
ステップＳ３１８では、人手入力モジュール１４０は、２人分の人手データ入力を促す。
ステップＳ３２０では、人手入力モジュール１４０は、２人分の人手入力結果を受け付ける。
ステップＳ３２２では、突き合わせ処理を行い、「同じ」場合はステップＳ３２４へ進み、「異なる」場合はステップＳ３２６へ進む。
ステップＳ３２４では、結果統合モジュール１５０は、人手入力結果１４２を出力データ１５２とする。
ステップＳ３２６では、結果統合モジュール１５０は、統合処理を行う。

【0031】

図４は、本実施の形態による処理例を示す説明図である。図４、５は、本実施の形態による処理例の概要を示すものである。
情報処理装置１００は、文字認識器４１０（文字認識モジュール１１０に相当）、文字認識器４２０（文字認識モジュール１１０に相当）、人手入力装置（Ａさん）４３０、人手入力装置（Ｂさん）４４０、人手入力装置（Ｃさん）４５０と接続されており、文字画像１０８を受け付ける。
データ入力を行う対象である文字画像１０８を情報処理装置１００で下記３種類に分類する。
（１）文字認識器のみでデータ入力を行う。
（２）文字認識器と人でダブル入力を行う。
（３）人でダブル入力を行う。
従来技術では上記（２）のみであったために、全体の誤り率が高くなってしまっていたことが課題であった。本実施の形態では、文字認識器４２０の認識率が悪い文字画像１０８の場合には、上記（３）とすることにより、誤り率の劣化を防ぐ。
さらに、（３）とした場合、人手が２人必要となるため、全体の工数が増大する。これを避けるため、文字認識率の認識率が高い入力画像の場合には、人手入力を行わず、文字認識器４１０のみで処理を行う。
上記で示したように、３種の処理に分類することにより、データ入力の精度と工数削減を同時に実現することとなる。
図４に示す例では、人手入力装置（Ａさん）４３０、人手入力装置（Ｂさん）４４０、人手入力装置（Ｃさん）４５０の操作者はそれぞれ異なっているが、人手入力装置（Ａさん）４３０と人手入力装置（Ｂさん）４４０の操作者は同じ人でもよい。又は、人手入力装置（Ａさん）４３０と人手入力装置（Ｃさん）４５０の操作者は同じ人でもよい。

【0032】

図５は、本実施の形態による処理例の概要を示す説明図である。
文字画像１０８として、文字画像（Ａ山Ｂ雄）１０８Ａ、文字画像（Ｃ川Ｄ介）１０８Ｂ、文字画像（Ｅ田Ｆ子）１０８Ｃ、文字画像（Ｇ谷Ｈ郎）１０８Ｄを対象とする。
文字認識器５１０は、文字画像（Ａ山Ｂ雄）１０８Ａ、文字画像（Ｃ川Ｄ介）１０８Ｂ、文字画像（Ｅ田Ｆ子）１０８Ｃを受け付ける。
人手入力装置５２０は、文字画像（Ｃ川Ｄ介）１０８Ｂ、文字画像（Ｅ田Ｆ子）１０８Ｃ、文字画像（Ｇ谷Ｈ郎）１０８Ｄを受け付ける。
人手入力装置５３０は、文字画像（Ｇ谷Ｈ郎）１０８Ｄを受け付ける。
つまり、情報処理装置１００は、入力した文字列を、次の３種類に分類する。
（１）文字認識器のみでデータ入力を行う場合。
（２）文字認識器と人でダブル入力を行う場合。
（３）複数人でダブル入力を行う場合。
上記（１）の場合と、（２）の場合は、文字認識器５１０に文字画像１０８を送る。
上記（２）の場合と（３）の場合は、人が入力できるように文字画像１０８を送る。また、（３）の場合は、複数人によるデータ入力ができるように文字画像１０８を送る。
例えば、文字画像（Ａ山Ｂ雄）１０８Ａは「（１）文字認識器のみでデータ入力を行う」に該当した場合、文字認識器５１０によって認識処理を行う。
例えば、文字画像（Ｃ川Ｄ介）１０８Ｂ、文字画像（Ｅ田Ｆ子）１０８Ｃは「（２）文字認識器と人でダブル入力を行う」に該当した場合、文字認識器５１０によって認識処理を行い、人手入力装置５２０によって人手入力が行われる。
例えば、文字画像（Ｇ谷Ｈ郎）１０８Ｄは「（３）人でダブル入力を行う」に該当した場合、人手入力装置５２０と人手入力装置５３０によって人手入力が行われる。

【0033】

文字列分類モジュール１２０による分類は、認識確度１１２を用いて行う。認識確度１１２は文字認識モジュール１１０による処理結果である認識結果１１６に対する確信度である。
ここで認識確度をＫとする。また、２つの閾値Ｔｈ１、Ｔｈ２を用意する。
このとき、下記のように分類する。
（１）Ｋ＞Ｔｈ１の場合：文字認識器のみでデータ入力を行う。
（２）Ｔｈ２＜Ｋ≦Ｔｈ１の場合：文字認識器と人でダブル入力を行う。
（３）Ｋ≦Ｔｈ２の場合：複数人でダブル入力を行う。
なお、上記式での等号の位置はどこでもよい。例えば、以下のようにしてもよい。
（１）Ｋ≧Ｔｈ１の場合：文字認識器のみでデータ入力を行う。
（２）Ｔｈ２≦Ｋ＜Ｔｈ１の場合：文字認識器と人でダブル入力を行う。
（３）Ｋ＜Ｔｈ２の場合：人でダブル入力を行う。

【0034】

認識確度の算出方法としては、下記のように様々な従来例を用いればよい。例えば、特開平５−０４０８５３、特開平５−０２０５００、特開平５−２９０１６９、特開平８−１０１８８０、特開２０１１−１１３１２５（出力値を認識確度として用いる）、特開２０１３−０６９１３２（出力値を認識確度として用いる）等がある。
これらの中で、各文字に対する認識確度を用いるものがある。文字毎の認識確度を文字列の認識確度に変換する方式としては、下記のように様々な方式の中から適切なものを選択すればよい。
・文字列内の最大文字認識確度を文字列の認識確度とする。
・文字列内の最小文字認識確度を文字列の認識確度とする。
・文字列内の平均（最頻値、中央値等）文字認識確度を文字列の認識確度とする。

【0035】

図６は、第２の実施の形態の構成例についての概念的なモジュール構成図である。
情報処理装置６００は、文字列分類モジュール６１０、文字認識選択モジュール６２０、文字認識モジュール６３０、人手入力モジュール６４０、結果統合モジュール６５０を有している。
文字列分類モジュール６１０は、文字認識選択モジュール６２０、人手入力モジュール６４０、結果統合モジュール６５０と接続されており、文字画像６０８を受け付け、文字認識選択モジュール６２０、人手入力モジュール６４０、結果統合モジュール６５０に分類結果６１２を渡す。文字列分類モジュール６１０は、文字列分類モジュール１２０と同等の機能を有している。ただし、文字認識による認識確度を用いて分類を行ってもよいし、認識確度以外の情報を用いて分類を行うようにしてもよい。例えば、文字認識モジュール６３０による文字認識処理を行って、その認識確度を用いるようにしてもよいし、文字認識モジュール６３０以外の文字認識処理を行って、その認識確度を用いるようにしてもよい。また、文字画像６０８が文字認識に適している画像であるか否かを判断（「適している」、「適していない」、「「適している」、「適していない」のいずれでもない」の３つに分類）するようにしてもよい。
文字認識選択モジュール６２０は、文字列分類モジュール６１０、文字認識モジュール６３０と接続されており、文字列分類モジュール６１０から分類結果６１２を受け取り、文字認識モジュール６３０に文字認識選択結果６２２を渡す。文字認識選択モジュール６２０は、第１の種類、第２の種類に分類された場合に、文字認識モジュール６３０に処理を行わせる。
文字認識モジュール６３０は、文字認識選択モジュール６２０、結果統合モジュール６５０と接続されており、文字画像６０８を受け付け、文字認識選択モジュール６２０から文字認識選択結果６２２を受け取り、結果統合モジュール６５０に認識結果６３２を渡す。文字認識モジュール６３０は、文字認識モジュール１１０と同等の処理を行う。ただし、ここでの文字認識処理は、必ずしも認識確度を出力する必要はない。
人手入力モジュール６４０は、文字列分類モジュール６１０、結果統合モジュール６５０と接続されており、文字画像６０８を受け付け、文字列分類モジュール６１０から分類結果６１２を受け取り、結果統合モジュール６５０に人手入力結果６４２を渡す。人手入力モジュール６４０は、人手入力モジュール１４０と同等の処理を行う。
結果統合モジュール６５０は、文字列分類モジュール６１０、文字認識モジュール６３０、人手入力モジュール６４０と接続されており、文字列分類モジュール６１０から分類結果６１２を、文字認識モジュール６３０から認識結果６３２を、人手入力モジュール６４０から人手入力結果６４２を受け取り、出力データ６５２を出力する。結果統合モジュール６５０は、結果統合モジュール１５０と同等の処理を行う。

【0036】

図６に示す例を用いて、動作例を説明する。
第１の実施の形態では、文字認識結果の認識確度を用いて、文字列分類を行ったが、必ずしもその手法を採る必要はない。別手法で文字列分類を行ってもよい。
帳票画像が文字画像６０８として入力される（第１の実施の形態と同じ）。
文字列分類モジュール６１０では、図４の例に示された（１）〜（３）の３種の文字列に分類する。例えば、文字列分類モジュール６１０の中に文字認識器が入っており、認識確度を用いて分類を行う等の手法でもよいし、あるいは、文字認識は行わない手法でもよい。例えば、文字認識用の特徴抽出を行い、その特徴が特徴空間において予め定められた第１の部分空間（文字と認識するのに適している空間）にある場合は、第１の種類に分類し、予め定められた第３の部分空間（文字と認識できない空間）にある場合は、第３の種類に分類し、それ以外の場合（「文字と認識するのに適している空間」、「文字と認識できない空間」のいずれでもない場合）は第２の種類に分類するようにしてもよい。
文字認識選択モジュール６２０では、（１）又は（２）の場合に、文字認識を行うように選択する。文字認識モジュール６３０では、文字認識選択モジュール６２０による文字認識選択結果６２２を用いて文字認識処理を行う。
人手入力モジュール６４０では、（２）の場合には、１人分の人手データ入力を行うように、データ表示及び、データ受け取りを行う。（３）の場合には、２人分の人手データ入力を行うように、データ表示及び、データ受け取りを行う。
結果統合モジュール６５０では、分類結果６１２にしたがって、認識結果６３２と人手入力モジュール６４０による人手入力結果６４２を統合して最終的な処理を行う。最終的な処理の例として、図１１、図１２の例に示したように、２つの結果を突き合わせて、結果が異なるようであれば、人手入力を行う等の処理を行う。結果統合モジュール６５０による処理結果が出力データ６５２となる。本出力データ６５２は、データ入力の内容（文字画像６０８に対応するテキストデータ）となる。

【0037】

図７は、第２の実施の形態による処理例を示すフローチャートである。
ステップＳ７０２では、文字列分類モジュール６１０は、文字画像６０８を受け付ける。
ステップＳ７０４では、文字列分類モジュール６１０は、文字画像６０８を分類する。
ステップＳ７０６では、文字列分類モジュール６１０は、分類結果６１２を判断し、「パターンＡ」の場合はステップＳ７０８へ進み、「パターンＢ」の場合はステップＳ７１２へ進み、「パターンＣ」の場合はステップＳ７２０へ進む。
ステップＳ７０８では、文字認識選択モジュール６２０は、文字認識を行うよう選択する。
ステップＳ７１０では、文字認識モジュール６３０は、文字認識を行う。
ステップＳ７１２では、文字認識選択モジュール６２０は、文字認識を行うよう選択する。
ステップＳ７１４では、文字認識モジュール６３０は、文字認識を行う。
ステップＳ７１６では、人手入力モジュール６４０は、１人分の人手データ入力を促す。
ステップＳ７１８では、人手入力モジュール６４０は、人手入力結果を受け付ける。
ステップＳ７２０では、人手入力モジュール６４０は、２人分の人手データ入力を促す。
ステップＳ７２２では、人手入力モジュール６４０は、２人分の人手入力結果を受け付ける。
ステップＳ７２４では、突き合わせ処理を行い、「同じ」場合はステップＳ７２６へ進み、「異なる」場合はステップＳ７２８へ進む。
ステップＳ７２６では、結果統合モジュール６５０は、人手入力結果６４２を出力データ６５２とする。
ステップＳ７２８では、結果統合モジュール６５０は、統合処理を行う。

【0038】

次に、本実施の形態による効果例を示す。
Ｅ＝ｒ［１−（１−ｒ）^２］と人の誤り率をｒ＝０．０１とした場合、図１１の場合のデータ誤り率は、１．９９×１０^−４となる。この場合を例に採り、効果を示す。
例えば、文字認識器の誤り率を１．９９×１０^−４となるように、閾値Ｔｈ１と閾値Ｔｈ２を設定することにより、文字認識器を用いた場合であっても、２人のダブル入力時と同じ誤り率でデータ入力が可能となる。
さらに、文字認識器の誤り率を１．９９×１０^−４となるように、閾値Ｔｈ１を制御すると、閾値Ｔｈ１以上の認識確度の場合では、人の工数が全く不要となるため、工数の削減も可能となる。
さらに、下記の場合を例にとり、具体的な効果を説明する。
・閾値Ｔｈ１以上の文字列の割合：４０％（この場合の文字認識器の誤り率：０．０００１）
・閾値Ｔｈ２以上、Th1未満の文字列の割合：２０%（この場合の文字認識器の誤り率：０．０１）
・閾値Ｔｈ２未満の文字列の割合：４０%（この場合の文字認識器の誤り率：０．１）
の場合を考える。
（１）従来技術（特開平６−２７４６７９）の場合、
文字列あたり、常に１人は入力するため、この場合の工数を１とする。
また全体の誤り率は、Ｅ＝４．９６×１０^−４となる(下記参照)。
文字認識器の平均の誤り率は、
Ｒ＝０．０００１×０．４＋０．０１×０．２＋０．１×０．４≒０．０４
となるため、Ｅ＝ｒ［１−（１−ｒ）（１−Ｒ）］より、全体の誤り率Ｅは、Ｅ＝４．９６×１０^−４となる。
（２）本実施の形態の場合、
文字列あたりの工数は、１×０．２＋２×０．４＝１．０となり、従来技術と同じである。
本実施の形態では、
・閾値Ｔｈ１以上の場合の誤り率：０．０００１
・閾値Ｔｈ２以上、Ｔｈ１未満の場合の誤り率：１．９９×１０^−４
・閾寝Ｔｈ２未満の場合の誤り率（人ダブル入力の誤り率と同じ）：１．９９×１０^−４
それぞれの割合を考慮すると、全体の誤り率は、
０．０００１×０．４＋１．９９×１０−４×０．６＝１．６×１０−４
上記で示したように、本実施の形態を用いることによって、工数は同じであるにも関わらず、誤り率は、約１／３に減少させることができる。

【0039】

図１３を参照して、本実施の形態の情報処理装置のハードウェア構成例について説明する。図１３に示す構成は、例えばパーソナルコンピュータ（ＰＣ）等によって構成されるものであり、スキャナ等のデータ読み取り部１３１７と、プリンタ等のデータ出力部１３１８を備えたハードウェア構成例を示している。

【0040】

ＣＰＵ（ＣｅｎｔｒａｌＰｒｏｃｅｓｓｉｎｇＵｎｉｔ）１３０１は、前述の実施の形態において説明した各種のモジュール、すなわち、文字認識モジュール１１０、文字列分類モジュール１２０、認識結果選択モジュール１３０、人手入力モジュール１４０、結果統合モジュール１５０、文字列分類モジュール６１０、文字認識選択モジュール６２０、文字認識モジュール６３０、人手入力モジュール６４０、結果統合モジュール６５０等の各モジュールの実行シーケンスを記述したコンピュータ・プログラムにしたがった処理を実行する制御部である。

【0041】

ＲＯＭ（ＲｅａｄＯｎｌｙＭｅｍｏｒｙ）１３０２は、ＣＰＵ１３０１が使用するプログラムや演算パラメータ等を格納する。ＲＡＭ（ＲａｎｄｏｍＡｃｃｅｓｓＭｅｍｏｒｙ）１３０３は、ＣＰＵ１３０１の実行において使用するプログラムや、その実行において適宜変化するパラメータ等を格納する。これらはＣＰＵバス等から構成されるホストバス１３０４により相互に接続されている。

【0042】

ホストバス１３０４は、ブリッジ１３０５を介して、ＰＣＩ（ＰｅｒｉｐｈｅｒａｌＣｏｍｐｏｎｅｎｔＩｎｔｅｒｃｏｎｎｅｃｔ／Ｉｎｔｅｒｆａｃｅ）バス等の外部バス１３０６に接続されている。

【0043】

キーボード１３０８、マウス等のポインティングデバイス１３０９は、操作者により操作される入力デバイスである。ディスプレイ１３１０は、液晶表示装置又はＣＲＴ（ＣａｔｈｏｄｅＲａｙＴｕｂｅ）等があり、各種情報をテキストやイメージ情報として表示する。

【0044】

ＨＤＤ（ＨａｒｄＤｉｓｋＤｒｉｖｅ）１３１１は、ハードディスク（フラッシュメモリ等であってもよい）を内蔵し、ハードディスクを駆動し、ＣＰＵ１３０１によって実行するプログラムや情報を記録又は再生させる。ハードディスクには、文字画像１０８、認識確度１１２、認識結果１１６、分類結果１２２、認識結果１３２、人手入力結果１４２、出力データ１５２等が格納される。さらに、その他の各種データ、各種コンピュータ・プログラム等が格納される。

【0045】

ドライブ１３１２は、装着されている磁気ディスク、光ディスク、光磁気ディスク、又は半導体メモリ等のリムーバブル記録媒体１３１３に記録されているデータ又はプログラムを読み出して、そのデータ又はプログラムを、インタフェース１３０７、外部バス１３０６、ブリッジ１３０５、及びホストバス１３０４を介して接続されているＲＡＭ１３０３に供給する。リムーバブル記録媒体１３１３も、ハードディスクと同様のデータ記録領域として利用可能である。

【0046】

接続ポート１３１４は、外部接続機器１３１５を接続するポートであり、ＵＳＢ、ＩＥＥＥ１３９４等の接続部を持つ。接続ポート１３１４は、インタフェース１３０７、及び外部バス１３０６、ブリッジ１３０５、ホストバス１３０４等を介してＣＰＵ１３０１等に接続されている。通信部１３１６は、通信回線に接続され、外部とのデータ通信処理を実行する。データ読み取り部１３１７は、例えばスキャナであり、ドキュメントの読み取り処理を実行する。データ出力部１３１８は、例えばプリンタであり、ドキュメントデータの出力処理を実行する。

【0047】

なお、図１３に示す情報処理装置のハードウェア構成は、１つの構成例を示すものであり、本実施の形態は、図１３に示す構成に限らず、本実施の形態において説明したモジュールを実行可能な構成であればよい。例えば、一部のモジュールを専用のハードウェア（例えば特定用途向け集積回路（ＡｐｐｌｉｃａｔｉｏｎＳｐｅｃｉｆｉｃＩｎｔｅｇｒａｔｅｄＣｉｒｃｕｉｔ：ＡＳＩＣ）等）で構成してもよく、一部のモジュールは外部のシステム内にあり通信回線で接続しているような形態でもよく、さらに図１３に示すシステムが複数互いに通信回線によって接続されていて互いに協調動作するようにしてもよい。また、特に、パーソナルコンピュータの他、携帯情報通信機器（携帯電話、スマートフォン、モバイル機器、ウェアラブルコンピュータ等を含む）、情報家電、ロボット、複写機、ファクシミリ、スキャナ、プリンタ、複合機（スキャナ、プリンタ、複写機、ファクシミリ等のいずれか２つ以上の機能を有している画像処理装置）などに組み込まれていてもよい。

【0048】

なお、前述の各種の実施の形態を組み合わせてもよく（例えば、ある実施の形態内のモジュールを他の実施の形態内に追加する、入れ替えをする等も含む）、また、各モジュールの処理内容として背景技術で説明した技術を採用してもよい。
また、前述の実施の形態の説明において、予め定められた値との比較において、「以上」、「以下」、「より高い」、「より低い（未満）」としたものは、その組み合わせに矛盾が生じない限り、それぞれ「より高い」、「より低い（未満）」、「以上」、「以下」としてもよい。

【0049】

前述の実施の形態では、「画像」を入力して、画像に対して文字認識を行う例を示していたが、文字認識は必ずしも「画像」に対するものに限定する必要はない。筆順情報（ストローク情報）等を用いて文字認識を行ってもよい。その場合、人手入力する際には、筆順データを人間が読めるように画像化すればよい。
前述の実施の形態では、人のダブル入力としていたが、ダブル（２人）ではなく、複数であれば何人でもよい。
また、人（１人）と文字認識器のダブル入力としていたが、人（１人以上）と、文字認識器の入力としてもよい。例えば、人が２人と文字認識器の入力としてもよい。
人は文字認識結果を見て、入力（あるいは、文字認識器の結果を修正）してもよい。
本実施の形態では、文字認識器は、論理的に１個の文字認識器として外部から見えていればよい。つまり、複数の文字認識器の出力を統合して１つの認識結果を出すような認識器であることを妨げるものではない。

【0050】

なお、説明したプログラムについては、記録媒体に格納して提供してもよく、また、そのプログラムを通信手段によって提供してもよい。その場合、例えば、前記説明したプログラムについて、「プログラムを記録したコンピュータ読み取り可能な記録媒体」の発明として捉えてもよい。
「プログラムを記録したコンピュータ読み取り可能な記録媒体」とは、プログラムのインストール、実行、プログラムの流通等のために用いられる、プログラムが記録されたコンピュータで読み取り可能な記録媒体をいう。
なお、記録媒体としては、例えば、デジタル・バーサタイル・ディスク（ＤＶＤ）であって、ＤＶＤフォーラムで策定された規格である「ＤＶＤ−Ｒ、ＤＶＤ−ＲＷ、ＤＶＤ−ＲＡＭ等」、ＤＶＤ＋ＲＷで策定された規格である「ＤＶＤ＋Ｒ、ＤＶＤ＋ＲＷ等」、コンパクトディスク（ＣＤ）であって、読出し専用メモリ（ＣＤ−ＲＯＭ）、ＣＤレコーダブル（ＣＤ−Ｒ）、ＣＤリライタブル（ＣＤ−ＲＷ）等、ブルーレイ・ディスク（Ｂｌｕ−ｒａｙ（登録商標）Ｄｉｓｃ）、光磁気ディスク（ＭＯ）、フレキシブルディスク（ＦＤ）、磁気テープ、ハードディスク、読出し専用メモリ（ＲＯＭ）、電気的消去及び書換可能な読出し専用メモリ（ＥＥＰＲＯＭ（登録商標））、フラッシュ・メモリ、ランダム・アクセス・メモリ（ＲＡＭ）、ＳＤ（ＳｅｃｕｒｅＤｉｇｉｔａｌ）メモリーカード等が含まれる。
そして、前記のプログラム又はその一部は、前記記録媒体に記録して保存や流通等させてもよい。また、通信によって、例えば、ローカル・エリア・ネットワーク（ＬＡＮ）、メトロポリタン・エリア・ネットワーク（ＭＡＮ）、ワイド・エリア・ネットワーク（ＷＡＮ）、インターネット、イントラネット、エクストラネット等に用いられる有線ネットワーク、又は無線通信ネットワーク、さらにこれらの組み合わせ等の伝送媒体を用いて伝送させてもよく、また、搬送波に乗せて搬送させてもよい。
さらに、前記のプログラムは、他のプログラムの一部分であってもよく、又は別個のプログラムと共に記録媒体に記録されていてもよい。また、複数の記録媒体に分割して記録されていてもよい。また、圧縮や暗号化等、復元可能であればどのような態様で記録されていてもよい。

【符号の説明】

【0051】

１００…情報処理装置
１０８…文字画像
１１０…文字認識モジュール
１１２…認識確度
１１６…認識結果
１１８…閾値
１２０…文字列分類モジュール
１２２…分類結果
１３０…認識結果選択モジュール
１３２…認識結果
１４０…人手入力モジュール
１４２…人手入力結果
１５０…結果統合モジュール
１５２…出力データ
２１０…画像読取装置
２２０…入力用端末
２２２…ユーザー
２９０…通信回線
６００…情報処理装置
６０８…文字画像
６１０…文字列分類モジュール
６１２…分類結果
６２０…文字認識選択モジュール
６２２…文字認識選択結果
６３０…文字認識モジュール
６３２…認識結果
６４０…人手入力モジュール
６４２…人手入力結果
６５０…結果統合モジュール
６５２…出力データ

【図1】