IP Force 特許公報掲載プロジェクト 2022.1.31 β版

知財求人 - 知財ポータルサイト「IP Force」

▶ 富士ゼロックス株式会社の特許一覧

特許7095345情報処理装置、情報処理システム及びプログラム
<>
  • 特許-情報処理装置、情報処理システム及びプログラム 図1
  • 特許-情報処理装置、情報処理システム及びプログラム 図2
  • 特許-情報処理装置、情報処理システム及びプログラム 図3
  • 特許-情報処理装置、情報処理システム及びプログラム 図4
  • 特許-情報処理装置、情報処理システム及びプログラム 図5
  • 特許-情報処理装置、情報処理システム及びプログラム 図6
  • 特許-情報処理装置、情報処理システム及びプログラム 図7
  • 特許-情報処理装置、情報処理システム及びプログラム 図8
  • 特許-情報処理装置、情報処理システム及びプログラム 図9
  • 特許-情報処理装置、情報処理システム及びプログラム 図10
  • 特許-情報処理装置、情報処理システム及びプログラム 図11
  • 特許-情報処理装置、情報処理システム及びプログラム 図12
  • 特許-情報処理装置、情報処理システム及びプログラム 図13
  • 特許-情報処理装置、情報処理システム及びプログラム 図14
  • 特許-情報処理装置、情報処理システム及びプログラム 図15
  • 特許-情報処理装置、情報処理システム及びプログラム 図16
  • 特許-情報処理装置、情報処理システム及びプログラム 図17
  • 特許-情報処理装置、情報処理システム及びプログラム 図18
  • 特許-情報処理装置、情報処理システム及びプログラム 図19
  • 特許-情報処理装置、情報処理システム及びプログラム 図20
< >
(19)【発行国】日本国特許庁(JP)
(12)【公報種別】特許公報(B2)
(11)【特許番号】
(24)【登録日】2022-06-27
(45)【発行日】2022-07-05
(54)【発明の名称】情報処理装置、情報処理システム及びプログラム
(51)【国際特許分類】
   G06Q 10/10 20120101AFI20220628BHJP
【FI】
G06Q10/10
【請求項の数】 14
(21)【出願番号】P 2018055172
(22)【出願日】2018-03-22
(65)【公開番号】P2019168854
(43)【公開日】2019-10-03
【審査請求日】2021-02-26
(73)【特許権者】
【識別番号】000005496
【氏名又は名称】富士フイルムビジネスイノベーション株式会社
(74)【代理人】
【識別番号】100104880
【弁理士】
【氏名又は名称】古部 次郎
(74)【代理人】
【識別番号】100125346
【弁理士】
【氏名又は名称】尾形 文雄
(74)【代理人】
【識別番号】100166981
【弁理士】
【氏名又は名称】砂田 岳彦
(72)【発明者】
【氏名】木村 俊一
(72)【発明者】
【氏名】関野 雅則
(72)【発明者】
【氏名】久保田 聡
(72)【発明者】
【氏名】桜井 拓也
【審査官】新里 太郎
(56)【参考文献】
【文献】特開2006-236003(JP,A)
【文献】中国特許出願公開第107688585(CN,A)
【文献】特開2002-056344(JP,A)
(58)【調査した分野】(Int.Cl.,DB名)
G06Q 10/00-99/00
(57)【特許請求の範囲】
【請求項1】
参照画像が対応付けられ、当該参照画像が参照されて行われた入力処理についての情報である処理情報を取得する取得手段と、
前記取得手段により取得された前記処理情報における前記入力処理が行われた回数に関する情報に基づき、前記参照画像が参照されて行われる、次の入力処理の内容を決定する処理決定手段と、を備え
前記取得手段が取得する前記処理情報は、対応付けられた前記参照画像と切り離されることなく移動可能であることを特徴とする
情報処理装置。
【請求項2】
前記処理決定手段は、前記処理情報における入力処理が行われた回数が、予め定められた複数回数より少ない場合には、新たな入力処理を行うことを決定することを特徴とする請求項に記載の情報処理装置。
【請求項3】
前記処理決定手段は、前記処理情報における入力処理が行われた回数が、予め定められた複数回数である場合には、それまでに行われた入力処理の結果を突合し、非合致の場合に新たな入力処理を行うことを決定することを特徴とする請求項に記載の情報処理装置。
【請求項4】
前記処理決定手段は、前記処理情報における入力処理が行われた回数が、予め定められた複数回数である場合には、それまでに行われた入力処理の結果を突合し、合致の場合に終了することを決定することを特徴とする請求項に記載の情報処理装置。
【請求項5】
前記入力処理の結果についての情報である処理情報を出力する処理情報出力手段を備えることを特徴とする請求項1に記載の情報処理装置。
【請求項6】
前記処理情報は、前記入力処理の結果と当該入力処理を行った入力者の情報とを含むことを特徴とする請求項に記載の情報処理装置。
【請求項7】
前記処理決定手段は、次に入力処理を行う場合、前記処理情報に基づき、以前に入力処理を行った入力者と異なる入力者により新たな入力処理をさせることを決定することを特徴とする請求項に記載の情報処理装置。
【請求項8】
前記処理決定手段によって決定された次の入力処理を、入力手段に依頼する処理依頼手段を備えることを特徴とする請求項1に記載の情報処理装置。
【請求項9】
前記入力手段から前記入力処理の結果を取得する結果取得手段を備えることを特徴とする請求項に記載の情報処理装置。
【請求項10】
処理情報における入力処理が行われた回数に関する情報に基づき、参照画像が参照されて行われる、次の入力処理の内容が決定される情報処理装置であって、
前記参照画像が参照されて行われた前記入力処理の結果を取得する結果取得手段と、
前記結果取得手段により取得された前記入力処理の結果を含む前記処理情報を、前記参照画像に対応付けるとともに、新たな入力処理の結果が当該結果取得手段により取得される度に、当該新たな入力処理の結果を含む処理情報を当該参照画像に対応付ける処理手段と、を備え
前記処理情報は、対応付けられた前記参照画像と切り離されることなく移動可能であることを特徴とする
情報処理装置。
【請求項11】
参照画像が参照されて行われた入力処理についての情報である処理情報と、当該参照画像とを対応付けて保持する保持手段と、
前記保持手段から、入力処理を行う参照画像に対応する前記処理情報を取得する取得手段と、
前記取得手段により取得された前記処理情報における前記入力処理が行われた回数に関する情報に基づき、前記参照画像が参照されて行われる、次の入力処理の内容を決定する処理決定手段と、を備え
前記処理情報は、対応付けられた前記参照画像と切り離されることなく移動可能であることを特徴とする
情報処理システム。
【請求項12】
前記参照画像が参照されて、次の入力処理が可能な入力者を登録する入力者登録手段を、備え、
前記処理決定手段は、前記処理情報に基づき、次に行われる入力処理を行う入力者を、前記入力者登録手段に登録された入力者から決定することを特徴とする請求項11に記載の情報処理システム。
【請求項13】
新たな入力処理の結果を取得する結果取得手段と、
新たな入力処理の結果が前記結果取得手段により取得される度に、当該新たな入力処理の結果を含む処理情報を前記参照画像に対応付ける処理手段を、
備えることを特徴とする請求項11又は12に記載の情報処理システム。
【請求項14】
コンピュータを、
参照画像が対応付けられ、参照画像が参照されて行われた入力処理についての情報である処理情報を取得する取得手段と、
前記取得手段により取得された前記処理情報における前記入力処理が行われた回数に関する情報に基づき、前記参照画像が参照されて行われる、次の入力処理の内容を決定する処理決定手段として
機能させるプログラムであって、
前記取得手段が取得する前記処理情報は、対応付けられ前記参照画像と切り離されることなく移動可能であることを特徴とする
プログラム
【発明の詳細な説明】
【技術分野】
【0001】
本発明は、情報処理装置、情報処理システム及びプログラムに関する。
【背景技術】
【0002】
特許文献1には、顧客から着信した呼を、複数から選択されたオペレータに接続するための通信制御装置において、着信時に接続可能なオペレータがいない場合、接続可能なオペレータができるまでの時間を予測する時刻予測装置と、該予測時間を自動的に伝達しながら、対応できるオペレータができるまで通信を保持したまま待つか、あるいは一旦通信を切断してオペレータ側からコールバックするかの選択を顧客に回答させる自動音声応答装置と、を備える通信制御装置が記載されている。
【0003】
特許文献2には、通信種別に応じて着信拒否を設定する端末と、前記通信種別毎に着信呼を格納するサーバと、前記サーバを管理するサーバ管理装置と、前記通信種別毎に優先順位を設定するとともに待ち行列に着信呼を登録する待ち行列部とを備えた着信呼分配システムであって、前記サーバ管理装置は、前記着信拒否が設定された種別の呼を待機させ、その待機させた呼の優先順位に次ぐ優先順位の呼を分配する着信呼分配システムが記載されている。
【0004】
特許文献3には、管理サーバが、取引管理データベースに記憶されたタスク実行可否情報で示されるタスク実行可能なオペレータIDの数とタスクキューに記憶されたタスクの数とを比較した結果、前記オペレータIDの数が前記タスクの数より少ないと判定した場合、前記取引管理データベースに記憶された実行可能なタスクに基づいて前記タスクキューを検索し、該タスクの処理を待つ顧客端末識別情報を抽出するとともに前記取引管理データベースから該タスクを実行可能なセンタ端末識別情報を抽出し、該顧客端末と該センタ端末とを通信させて該タスクの処理を行なうようにした無人契約システムが記載されている。
【0005】
特許文献4には、文字認識対象を3種類のいずれかに分類する分類手段と、前記分類手段によって第1の種類に分類された場合に、前記文字認識対象の文字認識結果を抽出する抽出手段と、前記分類手段によって第2の種類に分類された場合に、前記文字認識対象の文字認識結果を抽出し、該文字認識対象を人手で入力させるように制御する第1の制御手段と、前記分類手段によって第3の種類に分類された場合に、前記文字認識対象を複数人の人手で入力させるように制御する第2の制御手段を具備する情報処理装置が記載されている。
【先行技術文献】
【特許文献】
【0006】
【文献】特開2000-341414号公報
【文献】特開2001-016336号公報
【文献】特開2008-077337号公報
【文献】特開2016-212812号公報
【発明の概要】
【発明が解決しようとする課題】
【0007】
帳票上に記載された文字列を文字認識処理や人が参照して入力することによりデータとして出力したりデータベースへ登録したりするデータの入力処理では、正確性が要請される。このため、同様のデータの入力処理を複数回行い、データを突合させたり、複数人で確認したりする等によって正確性が担保される。このとき、帳票上に記載された文字を参照するための参照画像と、参照画像を参照して行われた個々のデータの入力処理についての情報とを対応付けずに個別に管理したり、分散して管理すると、参照画像が参照されて行われるデータの入力処理が複数回行われる場合において、データの入力処理の進捗状況が管理しにくくなったりする。
本発明の目的は、参照画像とデータの入力処理の結果とを対応付けない場合に比べて、データの入力処理の進捗状況の管理を容易にすることにある。
【課題を解決するための手段】
【0008】
請求項1に記載の発明は、参照画像が対応付けられ、当該参照画像が参照されて行われた入力処理についての情報である処理情報を取得する取得手段と、前記取得手段により取得された前記処理情報における前記入力処理が行われた回数に関する情報に基づき、前記参照画像が参照されて行われる、次の入力処理の内容を決定する処理決定手段と、を備え、前記取得手段が取得する前記処理情報は、対応付けられた前記参照画像と切り離されることなく移動可能であることを特徴とする情報処理装置である。
請求項に記載の発明は、前記処理決定手段は、前記処理情報における入力処理が行われた回数が、予め定められた複数回数より少ない場合には、新たな入力処理を行うことを決定することを特徴とする請求項に記載の情報処理装置である。
請求項に記載の発明は、前記処理決定手段は、前記処理情報における入力処理が行われた回数が、予め定められた複数回数である場合には、それまでに行われた入力処理の結果を突合し、非合致の場合に新たな入力処理を行うことを決定することを特徴とする請求項に記載の情報処理装置である。
請求項に記載の発明は、前記処理決定手段は、前記処理情報における入力処理が行われた回数が、予め定められた複数回数である場合には、それまでに行われた入力処理の結果を突合し、合致の場合に終了することを決定することを特徴とする請求項に記載の情報処理装置である。
請求項に記載の発明は、前記入力処理の結果についての情報である処理情報を出力する処理情報出力手段を備えることを特徴とする請求項1に記載の情報処理装置である。
請求項に記載の発明は、前記処理情報は、前記入力処理の結果と当該入力処理を行った入力者の情報とを含むことを特徴とする請求項に記載の情報処理装置である。
請求項に記載の発明は、前記処理決定手段は、次に入力処理を行う場合、前記処理情報に基づき、以前に入力処理を行った入力者と異なる入力者により新たな入力処理をさせることを決定することを特徴とする請求項に記載の情報処理装置である。
請求項に記載の発明は、前記処理決定手段によって決定された次の入力処理を、入力手段に依頼する処理依頼手段を備えることを特徴とする請求項1に記載の情報処理装置である。
請求項に記載の発明は、前記入力手段から前記入力処理の結果を取得する結果取得手段を備えることを特徴とする請求項に記載の情報処理装置である。
請求項10に記載の発明は、処理情報における入力処理が行われた回数に関する情報に基づき、参照画像が参照されて行われる、次の入力処理の内容が決定される情報処理装置であって、前記参照画像が参照されて行われた前記入力処理の結果を取得する結果取得手段と、前記結果取得手段により取得された前記入力処理の結果を含む前記処理情報を、前記参照画像に対応付けるとともに、新たな入力処理の結果が当該結果取得手段により取得される度に、当該新たな入力処理の結果を含む処理情報を当該参照画像に対応付ける処理手段と、を備え、前記処理情報は、対応付けられた前記参照画像と切り離されることなく移動可能であることを特徴とする情報処理装置である。
請求項11に記載の発明は、参照画像が参照されて行われた入力処理についての情報である処理情報と、当該参照画像とを対応付けて保持する保持手段と、前記保持手段から、入力処理を行う参照画像に対応する前記処理情報を取得する取得手段と、前記取得手段により取得された前記処理情報における前記入力処理が行われた回数に関する情報に基づき、前記参照画像が参照されて行われる、次の入力処理の内容を決定する処理決定手段と、を備え、前記処理情報は、対応付けられた前記参照画像と切り離されることなく移動可能であることを特徴とする情報処理システムである。
請求項12に記載の発明は、前記参照画像が参照されて、次の入力処理が可能な入力者を登録する入力者登録手段を、備え、前記処理決定手段は、前記処理情報に基づき、次に行われる入力処理を行う入力者を、前記入力者登録手段に登録された入力者から決定することを特徴とする請求項11に記載の情報処理システムである。
請求項13に記載の発明は、新たな入力処理の結果を取得する結果取得手段と、新たな入力処理の結果が前記結果取得手段により取得される度に、当該新たな入力処理の結果を含む処理情報を前記参照画像に対応付ける処理手段を、備えることを特徴とする請求項11又は12に記載の情報処理システムである。
請求項14に記載の発明は、コンピュータを、参照画像が対応付けられ、参照画像が参照されて行われた入力処理についての情報である処理情報を取得する取得手段と、前記取得手段により取得された前記処理情報における前記入力処理が行われた回数に関する情報に基づき、前記参照画像が参照されて行われる、次の入力処理の内容を決定する処理決定手段として機能させるプログラムであって、前記取得手段が取得する前記処理情報は、対応付けられ前記参照画像と切り離されることなく移動可能であることを特徴とするプログラムである。
【発明の効果】
【0009】
請求項1、101114に記載の発明によれば、参照画像とデータの入力処理の結果とを対応付けない場合に比べ、データの入力処理の進捗状況の管理が容易になる。
請求項に記載の発明によれば、回数で決定しない場合に比べ、必要な回数の入力処理が確実に実行される。
請求項に記載の発明によれば、入力処理の結果を突合しない場合に比べ、誤認の発生が抑制される。
請求項に記載の発明によれば、入力処理の結果を突合しない場合に比べ、不要な入力処理の実行が抑制される。
請求項に記載の発明によれば、処理情報を出力しない場合に比べ、次の入力処理の決定が容易になる。
請求項に記載の発明によれば、入力者の情報を含まない場合に比べ、入力者の識別が容易になる。
請求項に記載の発明によれば、異なる入力者に入力処理をさせない場合に比べ、誤認の重複が抑制される。
請求項に記載の発明によれば、処理依頼手段を備えない場合に比べ、遠隔地の入力者に依頼ができる。
請求項12に記載の発明によれば、入力者登録手段を備えない場合に比べ、入力処理が待ちになることが抑制される。
請求項13に記載の発明によれば、取得される度に対応付けない場合に比べ、処理情報と参照画像との対応付けが容易に行える。
【図面の簡単な説明】
【0010】
図1】データ入力タスクの概要を説明する図である。
図2】第1の実施の形態におけるデータエントリの一例を説明するフロー図である。
図3】第1の実施の形態が適用される分配器の概要を説明する図である。
図4】第1の実施の形態が適用される分配器の機能構成の一例を説明する図である。
図5】第1の実施の形態におけるタスク情報の一例を説明する図である。(a)は、初期状態、(b)は、1回目の分配結果、(c)は、2回目の分配結果、(d)は、3回目の分配結果(突合の結果が非合致であった場合)、(e)は、突合の結果が合致であった場合(突合合致の場合)を示す。
図6】分配器のハードウエア構成を説明する図である。
図7】第1の実施の形態が適用されるデータエントリの変形例1-1を説明する図である。
図8】第2の実施の形態におけるデータエントリの一例を説明するフロー図である。
図9】第2の実施の形態が適用される分配器の機能構成の一例を説明する図である。
図10】第2の実施の形態におけるタスク情報の一例を説明する図である。(a)は、初期状態、(b)は、1回目の分配結果、(c)は、2回目の分配結果、(d)は、3回目の分配結果(突合の結果が非合致であった場合)、(e)は、突合の結果が合致であった場合(突合合致の場合)を示す。
図11】第3の実施の形態が適用されるデータエントリの一例を説明するフロー図である。
図12】第3の実施の形態が適用される分配器の機能構成の一例を説明する図である。
図13】変形例3-1におけるデータエントリのフロー図である。
図14】変形例3-1が適用される分配器の機能構成の一例を説明する図である。
図15】変形例2におけるデータエントリのフロー図である。
図16】変形例3-2が適用される分配器の機能構成の一例を説明する図である。
図17】変形例3-3におけるデータエントリのフロー図である。
図18】変形例3-3の分配器の機能構成の一例を説明する図である。
図19】第4の実施の形態が適用される分配サーバシステムの概要を説明する図である。(a)は、複数の分配サーバを含み、それぞれの分配サーバがタスクバッファとオペレータバッファとを備える場合、(b)は、複数の分配サーバを含み、タスクバッファとオペレータバッファとが共通である場合である。
図20】比較のために示す第4の実施の形態が適用されない分配サーバシステムの概要を説明する図である。(a)は、複数の分配サーバを含み、それぞれの分配サーバがタスクバッファとオペレータバッファとを備える場合、(b)は、複数の分配サーバを含み、タスクバッファとオペレータバッファとが共通である場合である。
【発明を実施するための形態】
【0011】
ここでは、本発明の実施の形態におけるデータの入力処理を、データエントリを例にして説明する。データエントリとは、紙(帳票)等に記載された典型的には手書きされた文字列(紙情報)をテキストデータとして出力したりデータベースへ登録したりすることをいう。つまり、データエントリとは、記載された文字列(紙情報)を入力として、最終的にテキストデータを結果として得る一連のデータ入力処理の業務をいう。データの入力処理は、文字認識(OCR:Optical Character Recognition)装置による文字認識処理や、データの入力者である人(以下では、オペレータと表記する。)による紙に記載された文字列を参照しながらのキーボードを用いた入力やマイクを用いた音声による入力等により行なわれる。データエントリに用いられる紙に記載された文字列は、手書き文字だけでなく、活字で記載された文字列や○や×などの符号のような情報であってもよい。
【0012】
データエントリでは、正確性を担保するために、手書き文字列に対して複数回数のデータ入力タスクによるデータ入力が行われ、データ入力の結果(データ入力結果)が突合されたり、複数人で確認しつつデータ入力がされたりする。以下で説明するデータエントリでは、複数回数のデータ入力タスクによるデータ入力を行い、データ入力結果を突合する。つまり、複数回数のデータ入力タスクによるデータ入力結果、例えば2回のデータ入力タスクによるデータ入力結果が、合致すれば手書き文字列に対応した正しいテキストデータが得られたとする。なお、非合致であれば、データ入力により得られたテキストデータが誤っていると推定する。
【0013】
ここでは、OCR装置、オペレータ等が手書き文字列をテキストデータ化するそれぞれのデータ入力をデータ入力タスクと表記する。
以下では、添付図面を参照して本発明の実施の形態を詳細に説明する。
【0014】
[第1の実施の形態]
まず、データ入力タスクを説明する。
図1は、データ入力タスクの概要を説明する図である。
図1に示すように、紙(帳票)に記載された手書き文字列「ABC」から、テキストデータ(テキスト文字列)「ABC」を得ることをデータ入力タスクとする。ここで対象とする手書き文字列には、一例として、氏名、住所、勤務先、電話番号などがある。
【0015】
データ入力タスクがオペレータによってなされる場合、オペレータは、紙情報を参照しながら行える。なお、紙情報は、紙(帳票)などに記載された手書き文字列であって、画像データ10であると見做せる。一方、データ入力タスクがOCRによる文字認識処理によってなされる場合、スキャナ、カメラ等で紙情報から画像化された画像データ10を対象に行われる。つまり、データ入力タスクにおいては、画像データ10がデータ入力タスクの対象であると考えればよい。なお、画像データ10は、紙(帳票)などに記載された手書き文字でなくともよい。例えば、タブレット等の電子機器上に書かれた文字列を含む画像であってもよく、さらに手書き文字の筆順や座標情報であるストローク情報を含んでいてもよい。この画像データ10は、参照画像の一例である。
【0016】
(第1の実施の形態におけるデータエントリ)
図2は、第1の実施の形態におけるデータエントリの一例を説明するフロー図である。ここで、画像データ10(図2の説明では、画像データと表記する。)が入力、テキストデータが出力である。
データエントリは、複数回数(ここでは、3回)のデータ入力タスクと、データ入力結果の突合とを含んで行われる。この処理における処理論理としては、2つのデータ入力タスクによる文字列の入力結果を突合し、2つの結果が合致すればその結果の文字列を出力データとし、非合致の場合は次の処理として新たなデータ入力タスクを行い入力結果の文字列を出力データとするというものである。
【0017】
データエントリのフローを説明する。
入力(画像データ)に対して、データ入力タスク(データ入力タスク1)によりデータ入力(テキスト化)が行われる(ステップ101。図1では、S101と表記する。他の場合も同様とする。)。同じ入力(画像データ)に対して、データ入力タスク(データ入力タスク2)によりデータ入力(テキスト化)が行われる(ステップ102)。
【0018】
そして、ステップ101のデータ入力タスク1によるデータ入力結果(テキストデータ)とステップ102のデータ入力タスク2によるデータ入力結果(テキストデータ)とが、突合される(ステップ103)。そして、ステップ103の突合の結果、2つのデータ入力結果(テキストデータ)が合致する場合には、そのデータ入力結果(テキストデータ)が出力されて、データエントリが終了する。
一方、2つのデータ入力結果(テキストデータ)が非合致の場合には、同じ入力(画像データ)に対してデータ入力タスク(データ入力タスク3)が実行される(ステップ104)。そして、ステップ104のデータ入力タスク3で行われたデータ入力結果(テキストデータ)が出力されて、データエントリが終了する。
【0019】
以上説明したように、ステップ101、102、104で行なわれるデータ入力タスクは、同じ入力(画像データ)に対して行われる。しかし、ステップ104のデータ入力タスクは、ステップ103の突合の結果が非合致である場合にのみ行われる。つまり、ステップ104のデータ入力タスクは、データエントリの進捗状況に応じて設定される。このため、データエントリにおいては、進捗状況を管理して、データ入力タスクを実行することが求められる。
【0020】
なお、図2では、ステップ104のデータ入力タスク3によるデータ入力結果(テキストデータ)を出力したが、ステップ104のデータ入力タスク3によるデータ入力結果(テキストデータ)を、ステップ101のデータ入力タスク1によるデータ入力結果(テキストデータ)及び/又はステップ102のデータ入力タスク2によるデータ入力結果(テキストデータ)と突合して、合致するデータ入力結果(テキストデータ)を出力してもよい。また、合致するデータ入力結果が得られない(非合致の)場合には、さらにデータ入力タスクを行うようにしてもよい。この場合、データエントリにおけるデータ入力タスクの設定がより複雑化する。
【0021】
そして、データ入力タスクが、オペレータによって行われる場合、同じオペレータがデータ入力タスク1~3の何れかについて重複して行うと、手書き文字列の誤読等による誤認(エラー)が重複するおそれがある。すると、複数回数のデータ入力タスクを行う意義が失われてしまう。そこで、ステップ101のデータ入力タスク1がオペレータAさん、ステップ102のデータ入力タスク2がオペレータBさん、ステップ104のデータ入力タスク3がオペレータCさんのように、異なるオペレータで行われるようにデータ入力タスクが分配されるとよい。この場合、データエントリにおける進捗状況の管理がさらに複雑化する。
【0022】
以上説明したように、一つの入力(画像データ)に対して一つの出力(テキストデータ)を得るデータエントリに対して、複数のデータ入力タスクが行われるため、進捗状況の管理が複雑である。特に、このようなデータエントリを多数並行して処理するデータエントリセンタのような場合には、個々のデータエントリの進捗状況の管理が重要になる。
【0023】
そこで、第1の実施の形態では、何れのデータ入力タスク(例えば、図2におけるデータ入力タスク1~3)であっても、オペレータを指定してデータ入力タスクを分配する分配器(後述する図3の分配器100)を設けている。つまり、分配器100は、図2に示すように、データエントリの進捗状況に応じて、ステップ101、102、104に示したデータ入力タスク1~3をオペレータAさん~Cさんに分配する。ここで、ステップ101のデータ入力タスク1は1回目の分配、ステップ102のデータ入力タスク2は2回目の分配、データ入力タスク3は3回目の分配である。つまり、分配器100は、データ入力タスクをオペレータに分配することから、分配器と表記する。そして、後述するように、分配器100は、データ入力タスク1~3を順に分配する。なお、分配器100は、情報処理装置の一例である。
【0024】
(第1の実施の形態が適用される分配器100)
図3は、第1の実施の形態が適用される分配器100の概要を説明する図である。
第1の実施の形態では、分配器100は、データエントリが行われる対象である画像データ10と、画像データ10に対応し(紐づけられ)、データ入力タスクについての情報であるタスク情報20とを取得する。後述する第4の実施の形態で説明するように、画像データ10と、画像データ10に対応するタスク情報20とは、対(ペア)にして、タスクバッファ(図19(a)、(b)におけるタスクバッファ700)などに保持(記憶)されているとする。なお、タスク情報20は、処理情報の一例である。
【0025】
分配器100は、画像データ10とタスク情報20とを取得すると、タスク情報20に基づいて、データ入力タスクをオペレータに分配し、オペレータにデータ入力を実行させる。分配器100は、何れの段階におけるデータ入力タスク(例えば、図2に示したデータ入力タスク1~3)であっても、タスク情報20に基づいて、データ入力タスクをオペレータに分配するように構成されている。なお、タスク情報20については、後述する。
【0026】
そして、分配器100は、オペレータによってデータ入力が実行されると、データ入力結果を画像データ10と対応付けたタスク情報20を作成する(図3の「継続」)。そして、分配器100は、再び画像データ10とタスク情報20とを取得する。そして、分配器100は、再びタスク情報20に基づいて、データ入力タスクをオペレータに分配し、データ入力を実行させる。
【0027】
なお、分配器100は、データエントリが終了する場合、つまり次のデータ入力タスクを行わない場合には、終了とする(図3の「終了」)。なお、データエントリの終了とは、得られた手書き文字列に対するテキスト化が終了したことである。終了時点のテキストデータが採用されて、予め定められたデータベースに保存される。そして、データ入力タスクに関する画像データ10及びタスク情報20は、終了バッファなどに保存されてもよく、廃棄されてもよい。
【0028】
このように、分配器100は、データエントリにおける何れのデータ入力タスク(図2のデータ入力タスク1~3)であってもオペレータに分配するように構成されている。しかも、分配器100は、どのデータ入力タスクであるかを管理しない。つまり、分配器100は、画像データ10とともに取得するタスク情報20に基づいて、データ入力タスクをオペレータに分配する。したがって、分配器100には、一つのデータエントリに対するデータ入力タスクを連続して分配しなくともよい。つまり、一つのデータエントリに対するデータ入力タスクを分配したのち、他のデータエントリに対するデータ入力タスクを分配してもよい。
【0029】
次に、分配器100をより詳細に説明する。
図4は、第1の実施の形態が適用される(図2に示したデータエントリに適用される)分配器100の機能構成の一例を説明する図である。
分配器100は、タスク情報20を取得するタスク情報取得部110と、タスク情報20に基づいて次に行うデータ入力タスクの内容を決定するタスク決定部120と、オペレータの操作端末200にデータ入力タスクを依頼するタスク依頼部130と、オペレータによるデータ入力の結果(データ入力結果)を取得するタスク結果取得部140と、データ入力結果を画像データ10に対応付けたタスク情報20を作成して出力するタスク情報出力部150とを備える。
ここで、タスク情報取得部110が取得手段の一例、タスク決定部120が処理決定手段の一例、タスク依頼部130が処理依頼手段の一例、タスク結果取得部140が結果取得手段の一例、タスク情報出力部150が処理情報出力手段及び処理手段の一例、オペレータの操作端末200が入力手段の一例である。
【0030】
第1の実施の形態では、一例として、タスク決定部120は、タスク情報20に基づいて次に行うデータ入力タスク(入力処理)の内容を決定する処理論理(ロジック)を備えている。タスク決定部120は、これまでに行われたデータ入力タスクの処理内容と処理結果とによって、次に行うデータ入力タスクの内容を決定するように構成されている。ここでは、データ入力タスクの内容を決定する処理論理の一例として、データ入力タスクの回数による制御を行うこととする。このため、タスク決定部120は、既データ入力タスク回数を判定する回数判定部121と、データ入力タスクを実行するオペレータを選択するオペレータ選択部122と、データ入力結果を突合する突合部123とを備える。
【0031】
次に、分配器100が備える各部の接続関係を説明する。
分配器100は、上記の各部を移行しながら、データ入力タスクの分配を行う。
タスク情報取得部110は、タスク決定部120に含まれる回数判定部121に接続されている。回数判定部121は、オペレータ選択部122と、突合部123とに接続されている。回数判定部121が判定する既データ入力タスク回数に応じて、オペレータ選択部122又は突合部123に分岐する。
突合部123は、オペレータ選択部122と、タスク情報出力部150とに接続されている。突合部123の突合の結果に応じて、オペレータ選択部122又はタスク情報出力部150に分岐する。
【0032】
タスク依頼部130は、分配器100が取得する画像データ10及びタスク情報20の内、画像データ10を取得する。そして、タスク依頼部130は、オペレータ選択部122と、分配器100の外部に設けられたオペレータが操作する操作端末200とに接続されている。ここでは、操作端末200を1つ記載しているが、タスク依頼部130は、複数の操作端末200に接続されているとする。そして、タスク依頼部130は、オペレータ選択部122が選択したオペレータの操作端末200に、データ入力タスクを依頼する。
【0033】
タスク結果取得部140は、分配器100の外部に設けられたオペレータが操作する操作端末200と、タスク情報出力部150とに接続されている。ここでも、操作端末200を1つ記載しているが、タスク結果取得部140は、複数の操作端末200に接続されているとする。タスク結果取得部140は、タスク依頼部130がデータ入力タスクを依頼したオペレータの操作端末200からデータ入力の結果(データ入力結果)を取得する。
【0034】
次に、分配器100の動作を説明する。
タスク情報取得部110は、分配器100が取得する画像データ10とタスク情報20の内、タスク情報20を取得する。一方、タスク依頼部130は、分配器100が取得する画像データ10とタスク情報20の内、画像データ10を取得する。
【0035】
タスク情報取得部110に接続された回数判定部121は、タスク情報取得部110が取得したタスク情報20に基づいて、既データ入力タスク回数を判定する。回数判定部121は、既データ入力タスク回数が予め定められた複数回数未満であると判定する場合(ここでは、予め定められた複数回数が2回であり、0回又は1回の場合)、オペレータ選択部122に分岐する。
すると、オペレータ選択部122は、次に行うデータ入力タスク(図2のステップ101、102のデータ入力タスク1、2に対応)を依頼するオペレータを選択する。なお、オペレータ選択部122は、データ入力タスクを実行していないオペレータを選択する。なお、依頼されたデータ入力タスクの数が少ないオペレータを選択してもよい。また、前述したように、既データ入力タスクを依頼されたオペレータと異なるオペレータを選択してもよい。これらは、予めタスク決定部120の処理論理(ロジック)に決められていればよい。
【0036】
一方、回数判定部121は、既データ入力タスク回数が予め定められた複数回数であると判定する場合(ここでは、2回の場合)には、突合部123に分岐する。
突合部123が2つの既データ入力結果を突合(図2のステップ103の突合に対応)し、非合致であると判断する場合には、オペレータ選択部122は、次に行うデータ入力タスク(図2のステップ104のデータ入力タスク3に該当)を実行するオペレータを選択する。
【0037】
突合部123は、2つの既データ入力結果を突合(図2のステップ103の突合に該当)し、合致であると判断する場合には、タスク情報出力部150は、画像データ10に対応付けたタスク情報20に合致した旨を含むタスク情報20を出力する。2つの既データ入力結果が合致すれば、そのデータ入力結果を採用して、そのデータエントリは終了する。つまり、図3における「終了」に対応する。よって、タスク情報出力部150は、タスク情報20にデータエントリが終了した旨をさらに含んでもよい。
【0038】
オペレータ選択部122が次のデータ入力タスクを実行するオペレータを選択すると、タスク依頼部130は、取得した画像データ10を選択されたオペレータの操作端末200に送信して、データ入力タスクを依頼する。
なお、タスク依頼部130は、一例として、画像データ10と、画像データ10においてテキスト化する部分に対応して入力欄が設けられた入力画像とを並置した画像を形成し、オペレータ選択部122で選択されたオペレータが操作する操作端末200の表示部に送信する。オペレータは、操作端末200の表示部の画像の画像データ10を参照して、入力画像の入力欄にキーボード等によりテキストデータを入力する。
【0039】
タスク結果取得部140は、選択されたオペレータの操作端末200からタスク依頼部130が依頼したデータ入力タスクに対するデータ入力結果(テキストデータ)を取得する。すると、タスク情報出力部150は、データ入力結果を画像データ10に対応付けたタスク情報20を更新して出力する。タスク情報出力部150は、データ入力タスクを行ったオペレータ(名)を、データ入力結果とともに、タスク情報20に含んでもよい。このようにすることで、オペレータ選択部122は、以前にデータ入力タスクが依頼されたオペレータと異なるオペレータを、次に行うデータ入力タスクのオペレータとして選択する。
【0040】
このとき、突合部123により、非合致の判定がされていた場合には、データエントリは終了する。つまり、突合が行われた後にデータ入力タスク(図2のデータ入力タスク3)が実行された場合は、終了する(突合後は終了)。そして、突合が行われた後にデータ入力タスクで得られたテキストデータが採用される。つまり、図3における「終了」に対応する。このとき、タスク情報出力部150は、タスク情報20にデータエントリが終了した旨をさらに含むようにしてもよい。
一方、回数判定部121で0回、1回と判定され、突合が行われていない場合には、データエントリは終了せず継続する。つまり、図3における「継続」に対応する。
【0041】
ここでは、タスク情報出力部150は、タスク情報20を後述する第4の実施の形態で説明する分配器100の外部に設けられたタスクバッファに出力してもよく、分配器100が画像データ10とタスク情報20とを対応づけて保持してもよい。
【0042】
なお、タスク結果取得部140が取得するデータ入力結果をタスク情報20と見なしてもよい。つまり、タスク情報出力部150は、タスク情報20を画像データ10と対応付ける。そして、タスク情報出力部150は、タスク結果取得部140から新たにタスク情報20(データ入力結果)が取得される度に、新たなタスク情報20(データ入力結果)を画像データ10に対応付ける。
また、タスク情報出力部150がタスク結果取得部140から取得したタスク情報20(データ入力結果)を、タスクバッファにおいて画像データ10と対応付けてもよい。
【0043】
以上説明したように、図4に示した分配器100により、図2に示したデータエントリが行える。そして、図4に示した分配器100は、図3に示したように、入力として画像データ10とタスク情報20とを取得すると、タスク情報20に基づいて、次のデータ入力タスク(入力処理)の内容が決定されるようになっている。そして、分配器100によるデータ入力タスクが分配され実行することが繰り返されることにより、データエントリが終了する。
なお、次のデータ入力タスク(入力処理)の内容とは、データ入力タスクを行うか否かであって、データ入力タスクを実行するオペレータの選択を含んでもよい。
【0044】
(第1の実施の形態におけるタスク情報20)
次に、第1の実施の形態におけるタスク情報20を説明する。
図5は、第1の実施の形態におけるタスク情報20の一例を説明する図である。図5(a)は、初期状態、図5(b)は、1回目の分配結果、図5(c)は、2回目の分配結果、図5(d)は、3回目の分配結果(突合の結果が非合致であった場合)、図5(e)は、突合の結果が合致であった場合(突合合致の場合)を示す。
【0045】
図5(a)に示すように、初期状態、つまり1回もデータ入力タスクが分配されていない初期状態におけるタスク情報20には、データエントリを識別する識別記号(データエントリID)xxと、タスク情報20にリンクする(紐付けられた)画像データ10のファイル名(画像ファイル名)yyとが情報として含まれる。これにより、タスク情報20が画像データ10に対応付けられる。
【0046】
図5(b)に示すように、1回目の分配結果のタスク情報20には、上記の情報に加えて、1回目のデータ入力結果“ABC”及び1回目のデータ入力方法(ここではデータ入力を実行したオペレータ(名))Aさんが情報として含まれる。
【0047】
図5(c)に示すように、2回目の分配結果のタスク情報20には、上記の情報にさらに加えて、2回目のデータ入力結果“BCD”及び2回目のデータ入力方法(ここではデータ入力を実行したオペレータ(名))Bさんが情報として含まれる。
【0048】
図5(d)に示すように、突合の結果が非合致であった場合には、3回目の分配結果がタスク情報20となる。そして、上記の情報にさらに加えて、突合結果(ここでは、「非合致」)、3回目のデータ入力結果“CDF”及び3回目のデータ入力方法(ここではデータ入力を実行したオペレータ(名))Cさんが情報として含まれる。そして、データエントリが終了した旨を示す表記(ここでは、「終了」)が情報として含まれる。なお、データエントリが終了した旨を示す表記(ここでは、「終了」)は含まれなくともよい。他の場合も同様である。
【0049】
なお、図5(e)に示すように、図5(c)におけるBさんによるデータ入力結果が“ABC”であった場合には、突合の結果が合致になる。この場合のタスク情報20には、突合結果(ここでは、「合致」)及びデータエントリが終了した旨を示す表記(ここでは、「終了」)が情報として含まれる。
【0050】
つまり、画像データ10と対応付けられたタスク情報20に、データ入力タスクが分配されて実行された結果(データ入力結果及びデータ入力方法(オペレータ名))が追加されていく。つまり、タスク情報20は、実行されたデータ入力タスクに関する履歴を保持する。そして、一つのデータエントリについては、一つのタスク情報20で処理する。よって、図4に示した分配器100における回数判定部121は、タスク情報20に基づいて、既データ入力タスク回数を判定する。そして、これにより次に行うデータ入力タスクの内容を決定する。つまり、既データ入力タスク回数が予め定められた複数回数(図4では、2回)未満である(0回又は1回)場合には、オペレータを選択してデータ入力タスクを分配する。一方、既データ入力タスク回数が予め定められた複数回数(図4では、2回)である場合には、突合部123により、既データ入力タスクによるデータ入力結果を突合し、合致する場合には、終了とし、非合致の場合には、オペレータを選択してデータ入力タスクを分配する。
【0051】
上述したように、タスク情報20がこれまでにデータ入力タスクが分配されたオペレータに関する情報(オペレータ名)を保持すれば、オペレータ選択部122は、タスク情報20に基づいて、次のデータ入力タスクを分配するオペレータを、これまでにデータ入力タスクを分配されたオペレータと異なるように選択しうる。
【0052】
そして、分配器100は、個々のデータエントリの進捗状況に関する情報を保持しない。分配器100は、データエントリに関する画像データ10と画像データ10に対応するタスク情報20とを取得して、初めてそのデータエントリに対する進捗が分かる。つまり、分配器100は、分配器100が保持する分配に関する処理論理(ロジック)に基づいて、画像データ10とタスク情報20とを取得し、タスク情報20に基づいて、次のデータ入力タスクを分配する。
よって、第1の実施の形態が適用される分配器100であれば、あるデータエントリに関する複数回数のデータ入力タスクの分配と、他のデータエントリに関する少なくとも複数回数のデータ入力タスクの分配とを混合して受け付けても処理しうる。
このように、第1の実施の形態が適用される分配器100では、データエントリにおけるデータ入力タスクの分配に関する進捗状況の管理が容易になる。
【0053】
(分配器100のハードウエア構成)
図6は、分配器100のハードウエア構成を説明する図である。
分配器100は、CPU301、ROM302、RAM303、HDD304、通信用入出力インターフェイス(通信IF)305、入出力インターフェイス(入出力IF)306、入出力IF306に接続されたディスプレイ307、入出力IF306に接続された入力デバイス308、及びバス309を備える。
【0054】
ROM302は、電源の供給がない場合でも記憶した(書き込まれた)データを保持する不揮発メモリである。ROM302は、例えば、EPROM、EEPROM、フラッシュメモリなどである。ROM302は、分配器100として動作させるためのアプリケーションソフトウエア(プログラム)やプログラムが用いる定数や変数の初期値などのデータを記憶する。
【0055】
RAM303は、電源の供給が絶たれると記憶したデータが失われる揮発メモリである。RAM303は、ROM302より、データの読み書きが高速である。RAM303は、例えばDRAMである。RAM303は、ROM302に記憶されたプログラムやデータが読み出され、実行可能な状態に展開されるとともに、分配器100を動作させるためのデータを記憶するワークエリアとして使用される。
【0056】
HDD304は、電源の供給がない場合でも記憶した(書き込まれた)データを保持する書き換え可能な不揮発メモリであって、大容量のデータを記憶する。ROM302と同様に、分配器100として動作させるためのアプリケーションソフトウエア(プログラム)やプログラムが用いる定数や変数の初期値などのデータを記憶してもよい。
【0057】
バス309は、CPU301、ROM302、RAM303、HDD304、通信IF305、及び入出力IF306に接続され、CPU301の制御によって、プロラムやデータの入出力を可能にする。
通信IF305は、画像データ10及びタスク情報20を取得するインターフェイスであり、操作端末200とのインターフェイスである。なお、図4では、画像データ10及びタスク情報20は、分配器100の外部から取得されるとして説明したが、分配器100を構成するRAM303、HDD304などに保持されてもよい。
【0058】
入出力IF306は、ディスプレイ307及び入力デバイス308に接続されている。ディスプレイ307は、画像を視認することが可能なLCDなどである。入力デバイス308は、CPU301に指示を与えるためのデバイスであって、キーボード、タッチパネル、スイッチなどである。分配器100では、ディスプレイ307及び/又は入力デバイス308を備えなくともよい。
【0059】
CPU301は、電源が投入されると、ROM302(又は、HDD304)に記憶されたプログラムやデータを読み出して、RAM303上に実行可能な状態に展開する。そして、プログラムを実行する。プログラムの実行にともない、HDD304、通信IF305、入出力IF306とデータのやり取りを行う。
【0060】
上記では、ROM302、RAM303及びHDD304を設けたが、ROM302、RAM303及びHDD304のいくつかを、書き換え可能な不揮発メモリによって構成してもよい。書き換え可能な不揮発メモリとしては、フラッシュメモリなどを用いればよい。また、ROM302、RAM303をCPU301と一体に構成してもよい。この場合、ROM302、RAM303を書き換え可能な不揮発メモリによって構成してもよい。書き換え可能な不揮発メモリとしては、フラッシュメモリなどを用いればよい。
【0061】
以上においては、分配器100は、ROM302又はHDD304に保持されたアプリケーションソフトウエア(プログラム)によって、分配器として動作するとして説明した。この場合、RAM303上に実行可能な形態で展開されたアプリケーションソフトウエア(プログラム)によって、上記した分配器100の各部が構成され、分配器100の動作が実行される。
【0062】
一方、ROM302又はHDD304上に保持され、RAM上に実行可能な形態で展開されたプログラムが、入力されたコマンド列を実行するプログラムであってもよい。コマンド列を実行するプログラムとは、例えば、インタプリタである。この場合、分配器100として機能するコマンド列は、タスク情報20に保持されている。コマンド列を実行するプログラムは、タスク情報20を読み込んで実行することで、上記のハードウエアを分配器100として機能させる。このとき、タスク情報出力部150は、データ入力結果を画像データ10に対応付けたタスク情報20を作成する際に、分配器100として機能するコマンド列を書き換え(変更す)ればよい。例えば、回数判定部121や突合部123において、データ入力結果に基づいて、次に行うコマンドを設定すればよい。
【0063】
なお、オペレータの操作する操作端末200も、図6に示したハード構成と同様なハード構成を有している。操作端末200では、ディスプレイ307にオペレータがデータ入力を行うための画面が表示され、入力デバイス308であるキーボードなどによって、データ入力が実行される。
【0064】
そして、分配器100の通信IF305と操作端末200の通信IF305とは、ローカルエリアネットワーク(LAN)などによって接続されてもよく、公衆回線を用いたWANやインターネットで接続されていてもよい。
【0065】
(変形例1-1)
図3に示したデータエントリでは、「継続」の場合、一つの分配器100が画像データ10とタスク情報20とを繰り返し取得して、データ入力タスクを実行した。
図7は、第1の実施の形態が適用されるデータエントリの変形例1-1を説明する図である。
ここでは、3個の分配器100A、100B、100Cが直列に接続されている。そして、「継続」の場合に、前段の分配器におけるタスク情報出力部150によって作成されたタスク情報20が、画像データ10とともに次段の分配器に出力されるようになっている。
【0066】
このようにすることで、一つのデータエントリの1回目の分配、2回目の分配及び3回目の分配が連続して(シーケンシャルに)実行される。つまり、図4に示す分配器100で説明すると、分配器100Aは、データ入力タスクの分配が0回である場合の分配器100に相当する。この場合、分配器100Aにより1回のデータ入力タスクが分配された状態(1回目の分配)になるので、「継続」になる。
次に、分配器100Bは、データ入力タスクの分配が1回である場合の分配器100に相当する。この場合、分配器100Bにより2回のデータ入力タスクが分配された状態(2回目の分配)となるので、「継続」になる。
そして、分配器100Cは、上記の2回のデータ入力タスクの分配による既データ入力結果を突合する場合の分配器100に相当する。この場合、合致の場合に終了になり、非合致の場合に3回目のデータ入力タスクが分配された状態(3回目の分配)になって終了する。
【0067】
なお、分配器100A、100B、100Cは、図4に示した分配器100と同様の構成を有していてもよい。また、分配器100A、100B、100Cは、互いに異なる構成を有していてもよい。例えば、分配器100A、100Bは、分配器100の回数判定部121、突合部123を備えなくともよい。また、分配器100Cは、分配器100の回数判定部121を備えなくともよい。
【0068】
このように、分配器100A、100B、100Cの順にタスク情報20が受け渡されていくことにより、一つのデータエントリが実行される。なお、分配器100A、100B、100Cは、各々がタスク情報20に基づいて動作するので、非同期で動作する。
【0069】
上記では、図4で説明したデータエントリを例として説明したが、3回を超えるデータ入力タスクを用いる場合には、3を超える分配器を直列に配列すればよい。
【0070】
[第2の実施の形態]
第1の実施の形態におけるデータエントリでは、図2に示したように、3回のデータ入力タスク(データ入力タスク1、2、3)が、オペレータ(Aさん、Bさん、Cさん)に分配された。
第2の実施の形態におけるデータエントリでは、データ入力タスクの1つであるデータ入力タスク1が、OCR(OCR処理)により行われる。
【0071】
(第2の実施の形態におけるデータエントリ)
図8は、第2の実施の形態におけるデータエントリの一例を説明するフロー図である。ここでも、画像データ10(図8の説明では画像データと表記する。)が入力、テキストデータが出力である。
データエントリは、複数回数(3回)のデータ入力タスクと、1つの突合とを含んで行われる。
【0072】
データエントリのフローを説明する。
入力(画像データ)に対して、OCRにデータ入力タスク(データ入力タスク1)が分配されて文字認識処理される(ステップ201)。同じ入力(画像データ)に対して、オペレータAさんにデータ入力タスク(データ入力タスク2)が分配されて実行される(ステップ202)。
【0073】
そして、ステップ201のデータ入力タスク1によるデータ入力結果(テキストデータ)とステップ202のデータ入力タスク2によるデータ入力結果(テキストデータ)とが、突合される(ステップ203)。そして、ステップ203における突合の結果、2つのデータ入力結果(テキストデータ)が合致する場合には、そのデータ入力結果(テキストデータ)が出力されて、データエントリが終了する。
一方、ステップ203における突合の結果、2つのデータ入力結果(テキストデータ)が非合致の場合には、同じ入力(画像データ)に対して、オペレータBにデータ入力タスク(データ入力タスク3)が分配されて実行される(ステップ204)。そして、ステップ204で得られたデータ入力結果(テキストデータ)が出力されて、データエントリが終了する。
【0074】
なお、第1の実施の形態で説明したように、ステップ204のデータ入力タスク3によるデータ入力結果(テキストデータ)を、ステップ201のデータ入力タスク1によるデータ入力結果(テキストデータ)及び/又はステップ202のデータ入力タスク2によるデータ入力結果(テキストデータ)と突合して、合致するデータ入力結果(テキストデータ)を出力してもよい。また、非合致の場合には、さらにデータ入力タスクを分配して実行してもよい。
【0075】
(第2の実施の形態が適用される分配器400)
次に、第2の実施の形態が適用される分配器400について説明する。
図9は、第2の実施の形態が適用される分配器400の機能構成の一例を説明する図である。
なお、分配器400におけるデータエントリの概要は、図3に示した分配器100と同じである。つまり、図3の分配器100を分配器400に置き換えればよい。よって、説明を省略する。
【0076】
第2の実施の形態では、一例として、タスク決定部120は、タスク情報20に基づいて次に行うデータ入力タスク(入力処理)の内容を決定する処理論理(ロジック)を備えている。ここでは、タスク決定部120は、これまでにデータ入力タスクの分配が行われていない(データ入力タスクの分配が0回)場合、OCR処理による文字認識を行うように構成されている。
以下では、分配器400を、分配器100と対比して説明する。よって、分配器100と同じ部分には、同じ符号を付して説明を省略する。
分配器400は、タスク決定部120に、OCR処理部124を備える。分配器400の他の構成は、分配器100と同じである。
OCR処理部124は、画像データ10に含まれる文字列を認識(文字認識)してテキストデータ化する。
【0077】
次に、分配器400における接続関係を説明する。
OCR処理部124は、回数判定部121及びタスク情報出力部150と接続されている。回数判定部121が判定する既データ入力タスク回数に応じて、OCR処理部124に分岐する。OCR処理部124は、分配器400が取得した画像データ10とタスク情報20との内、画像データ10を取得する。
【0078】
次に、分配器400の動作を、分配器100と異なる部分を中心に説明する。
タスク情報取得部110は、分配器400が取得した画像データ10とタスク情報20との内、タスク情報20を取得する。回数判定部121は、タスク情報取得部110が取得したタスク情報20に基づいて、既データ入力タスク回数を判定する。
そして、回数判定部121は、既データ入力タスク回数が0回であると判定する場合に、OCR処理部124に分岐する。OCR処理部124は、画像データ10に含まれる手書き文字列を文字認識処理してデータテキスト化した結果(データ入力結果)を、タスク情報出力部150に送る。すると、タスク情報出力部150は、タスク情報20に、OCR処理部124によって行われたデータ入力結果を画像データ10に対応付けたタスク情報20を作成して、出力する。このとき、タスク情報20は、データ入力方法(ここでは、OCR)を含んでもよい。なお、OCR処理(文字認識処理)によるデータ入力タスクも、1回としてカウントする。
【0079】
回数判定部121が判定したデータ入力タスクの回数が予め定められた複数回数(図9では、2回)未満である(図9における1回の)場合、オペレータ選択部122が、次に行うデータ入力タスクを分配するオペレータを選択する。そして、回数判定部121が判定したデータ入力タスクの回数が予め定められた複数回数(図9では、2回)である(図9における2回の)場合、突合部123によるOCR処理によるデータ入力結果と、オペレータによるデータ入力結果とが突合される。この後は、第1の実施の形態と同様であるので説明を省略する。
【0080】
第1の実施の形態では、タスク情報20によりデータ入力タスクの分配がされていない(既データ入力タスク回数が0回)と判定された場合にも、オペレータにデータ入力タスクが分配されたが、第2の実施の形態では、OCR処理部124による文字認識処理が実行される。
【0081】
(第2の実施の形態におけるタスク情報20)
次に、第2の実施の形態におけるタスク情報20を説明する。
図10は、第2の実施の形態におけるタスク情報20の一例を説明する図である。図10(a)は、初期状態、図10(b)は、1回目の分配結果、図10(c)は、2回目の分配結果、図10(d)は、3回目の分配結果(突合の結果が非合致であった場合)、図10(e)は、突合の結果が合致であった場合(突合合致の場合)を示す。
【0082】
図10(a)に示すように、初期状態、つまり1回もデータ入力タスクが分配されていない初期状態のタスク情報20には、データエントリを識別する識別記号(データエントリID)xxと、タスク情報20に対応する(紐付けられた)画像データ10のファイル名(画像ファイル名)yyとが情報として含まれる。
【0083】
図10(b)に示すように、OCR処理による1回目の分配結果のタスク情報20には、上記の情報に加えて、OCR処理による1回目のデータ入力結果“ABC”及び1回目のデータ入力方法(ここではデータ入力を実行したOCR)が情報として含まれる。なお、図10(b)に示すタスク情報20には、OCR処理による認識の確度及び認識した文字の位置情報が含まれている。また、OCR処理により得られた第2位以降の認識候補などを含んでもよい。
ここで、確度とは、OCR処理による文字認識の確かさ(正確性)を示す指標である。確度は、例えば、読み込んだ文字に対する候補文字の数などによって設定される。ここでは、確度は、0.9である。また、位置情報は、文字位置(横方向の文字の位置)XYHW及び文字列位置(縦方向の文字の位置)XYHWである。なお、位置情報を含まなくてもよい。
【0084】
図10(c)に示すように、2回目の分配結果のタスク情報20には、上記の情報にさらに加えて、2回目のデータ入力結果“BCD”及び2回目のデータ入力方法(ここではデータ入力を実行したオペレータAさん)が情報として含まれる。
【0085】
図10(d)に示すように、突合の結果が非合致であった場合には、3回目の分配結果がタスク情報20となる。そして、上記の情報にさらに加えて、突合結果(ここでは、「非合致」)、3回目のデータ入力結果“CDF”及び3回目のデータ入力方法(ここではデータ入力を実行したオペレータBさん)が情報として含まれる。さらに、データエントリが終了した旨を示す表記(ここでは、「終了」)が情報として含まれる。
【0086】
なお、図10(e)に示すように、図10(c)におけるAさんによるデータ入力結果が“ABC”であった場合には、突合の結果が合致になる。この場合のタスク情報20には、突合結果(ここでは、「合致」)及びデータエントリが終了した旨を示す表記(ここでは、「終了」)が情報として含まれる。
【0087】
つまり、タスク情報20には、データ入力タスクが分配されて実行された結果(データ入力結果及びデータ入力方法)が時系列で追加されていく。つまり、タスク情報20は、実行されたデータ入力タスクに関する履歴を保持する。よって、図9に示した分配器400がOCR処理部124を含む場合であっても、タスク決定部120は、タスク情報20に基づいて、既データ入力タスク回数を判定し、次に行うデータ入力タスク(入力処理)の内容を決定する。
【0088】
なお、図9では、OCR処理部124は、分配器400の内部に設けられているとするが、OCR処理装置として分配器400の外部に設けられていてもよい。この場合、分配器400が外部に設けられたOCR処理装置に画像データ10を送信し、OCR処理装置から認識結果(データ入力結果)を取得するように構成すればよい。なお、分配器400は、画像データ10を取得して、OCR処理装置に送信するので、OCR処理装置は、スキャナやカメラを備えることを要しない。
【0089】
[第3の実施の形態]
第3の実施の形態におけるデータエントリでは、OCR処理による確度に基づいて、データ入力タスクが分配される。ここでは、確度が予め定められた閾値Tを超える(T<確度)場合、確度は高いとする。また、確度が閾値T以下且つ予め定められた閾値Sを超える(S<確度≦T)場合、確度は中程度とする。そして、確度が閾値S以下(確度≦S)の場合、確度が低いとする。なお、T<確度をT≦確度、S<確度≦TをS≦確度<T、及び、確度≦Sを確度<Sとしてもよい。他の場合も同様である。
【0090】
図11は、第3の実施の形態が適用されるデータエントリの一例を説明するフロー図である。ここでも、画像データ10(図11の説明では、画像データと表記する。)が入力、テキストデータが出力である。
データエントリは、5つのデータ入力タスクと、2つの突合とを含む。
【0091】
入力された画像データは、OCR処理により文字認識(データ入力)される(ステップ301)。そして、OCR処理による文字認識の確度が判断される(ステップ302)。
ステップ302において、確度が高い(T<確度)と判断された場合、OCR処理によるデータ入力で得られた文字認識(データ入力)結果(テキストデータ)がそのまま出力される。
【0092】
ステップ302において、確度が中程度(S<確度≦T)と判断された場合、オペレータAさんにデータ入力タスクが分配されて実行される(ステップ303)。そして、ステップ301で得られたOCR処理による文字認識(データ入力)結果(テキストデータ)と、ステップ303で得られたデータ入力結果(テキストデータ)とが突合される(ステップ304)。
【0093】
そして、ステップ304における突合の結果、2つのデータ入力結果(テキストデータ)が合致する場合には、合致したテキストデータが出力されて、データエントリが終了する。
一方、ステップ304における突合の結果、2つのデータ入力結果(テキストデータ)が非合致である場合には、オペレータBさんにデータ入力タスクが分配されて実行される(ステップ305)。そして、ステップ305で得られたデータ入力結果(テキストデータ)が出力されて、データエントリが終了する。なお、文字の誤読による誤認(エラー)が重複して発生しないように、オペレータAさんとオペレータBさんとは別人であることがよい。
【0094】
ステップ302において、確度が低い(確度≦S)と判断された場合、オペレータCさんにデータ入力タスクが分配されて実行される(ステップ306)。次いで、オペレータDさんにデータ入力タスクが分配されて実行される(ステップ307)。そして、ステップ306で得られたデータ入力結果(テキストデータ)と、ステップ307で得られたデータ入力結果(テキストデータ)とが突合される(ステップ308)。
【0095】
そして、ステップ308における突合の結果、2つのデータ入力結果(テキストデータ)が合致する場合には、合致したテキストデータが出力されて、データエントリが終了する。
一方、ステップ308における突合の結果、2つのデータ入力結果(テキストデータ)が非合致である場合には、オペレータEさんにデータ入力タスクが分配されて実行される(ステップ309)。そして、ステップ309で得られたデータ入力結果(テキストデータ)が出力されて、データエントリが終了する。
なお、文字の誤読による誤認(エラー)が重複して発生しないように、オペレータCさん、Dさん及びEさんは別人であることがよい。
確度が低い(確度≦S)と判断された場合には、ステップ301のOCR処理で得られた文字認識(データ入力)結果(テキストデータ)が無視される。
【0096】
以上説明したように、第3の実施の形態では、OCR処理による文字認識の確度により、次に行うデータ入力タスク(入力処理)の内容が決定される。そして、確度が高い場合には、オペレータによるデータ入力タスクを行わないので、オペレータによるデータ入力タスクの工数が削減される。逆に、確度が低い場合には、OCR処理による文字認識(データ入力)結果(テキストデータ)を使用せず、2人のオペレータにデータ入力タスクを分配して実行させて、データ入力の正確性を確保(担保)している。そして、確度が中程度である場合には、OCR処理による文字認識(データ入力)結果(テキストデータ)と、オペレータによるデータ入力結果とを突合するようにして、データ入力の正確性が確保(担保)されるとともに、オペレータによるデータ入力タスクの工数が削減される。
【0097】
(第3の実施の形態が適用される分配器500)
次に、第3の実施の形態が適用される分配器500について説明する。
図12は、第3の実施の形態が適用される分配器500の機能構成の一例を説明する図である。
なお、分配器500におけるデータエントリの概要は、図3に示した分配器100と同じである。つまり、図3の分配器100を分配器500に置き換えればよい。よって、説明を省略する。
【0098】
以下では、分配器500を、分配器100と対比して説明する。よって、分配器100と同じ部分には、同じ又は同様な符号を付して説明を省略する。
分配器500は、タスク決定部120に、OCR処理有無判定部125と、OCR処理部124と、第1確度判断部126Aと、第2確度判断部126Bと、第1回数判定部121Aと、第2回数判定部121Bと、第1オペレータ選択部122Aと、第2オペレータ選択部122Bと、第1突合部123Aと、第2突合部123Bとを備える。他の構成は、分配器100と同様である。
なお、分配器500は、画像データ10とタスク情報20とを取得する。そして、OCR処理部124及びタスク依頼部130は、分配器500が取得した画像データ10を取得し、タスク情報取得部110は、分配器500が取得したタスク情報20を取得する。
【0099】
OCR処理有無判定部125は、タスク情報20に基づいて、OCR処理の有無を判定する。OCR処理部124は、第2の実施の形態と同様にOCR処理による文字認識によるテキストデータ化を行う(図9参照)。第1確度判断部126Aは、OCR処理部124で行われたOCR処理による文字認識の確度を判断する。第2確度判断部126Bは、タスク情報20に基づいて、OCR処理による文字認識の確度を判断する。第1回数判定部121A、第2回数判定部121Bは、第1の実施の形態及び第2の実施の形態における回数判定部121と同様に、タスク情報20に基づいて既データ入力タスク回数を判定する(図4図9参照)。第1オペレータ選択部122A、第2オペレータ選択部122Bは、第1の実施の形態及び第2の実施の形態におけるオペレータ選択部122と同様に、次に行うデータ入力タスクを依頼するオペレータを選択する(図4図9参照)。第1突合部123A、第2突合部123Bは、第1の実施の形態及び第2の実施の形態における突合部123と同様に、既データ入力タスクによるデータ入力結果を突合する(図4図9参照)。分配器500の他の構成は、分配器100と同じである。
【0100】
次に、分配器500における接続関係を説明する。
タスク情報取得部110は、OCR処理有無判定部125に接続されている。OCR処理有無判定部125は、OCR処理部124及び第2確度判断部126Bに接続されている。OCR処理有無判定部125によるOCR処理の有無により、OCR処理部124又は第2確度判断部126Bに分岐する。OCR処理部124は、第1確度判断部126Aに接続されている。第1確度判断部126Aは、タスク情報出力部150に接続されている。
【0101】
第2確度判断部126Bは、第1回数判定部121A及び第2回数判定部121Bに接続されている。第1回数判定部121Aは、第1オペレータ選択部122A及び第1突合部123Aに接続されている。第2回数判定部121Bは、第2オペレータ選択部122B及び第2突合部123Bに接続されている。第1オペレータ選択部122A及び第2オペレータ選択部122Bは、タスク依頼部130に接続されている。
【0102】
次に、分配器500の動作を、分配器100と異なる部分を中心に説明する。
タスク情報取得部110は、分配器500が取得した画像データ10とタスク情報20との内、タスク情報20を取得する。OCR処理有無判定部125は、タスク情報取得部110が取得したタスク情報20に基づいて、OCR処理の有無を判定する。
そして、OCR処理有無判定部125が、OCR処理が行われていない(無)と判定すると、OCR処理部124に分岐する。OCR処理部124は、画像データ10をOCR処理(文字認識)してテキストデータ化を行う。ここでは、OCR処理は、1回のデータ入力タスクの実行であるとする。
【0103】
そして、第1確度判断部126Aが、OCR処理による文字認識の確度を判断する。ここでは、第1確度判断部126Aは、OCR処理による文字認識の程度を閾値T、Sに対応づけて「高い(T<確度)」、「中程度(S<確度≦T」及び「低い(確度≦S)」の3段階に分類する。なお、閾値Tが閾値Sより大きいとする(S<T)。
OCR処理有無判定部125が、OCR処理が行われていない(無)と判定する場合とは、1つのデータエントリを開始するタイミング、つまり初期状態である。
【0104】
ここで、第1確度判断部126Aが確度が閾値Tを超える(「高い(T<確度)」)と判断する場合には、タスク情報出力部150は、タスク情報20にOCR処理による文字認識(データ入力)結果を画像データ10に対応付けたタスク情報20を作成する。なお、文字認識の確度が高い(「高い(T<確度)」)ので、データエントリを終了する。よって、タスク情報出力部150は、データエントリが終了した旨をタスク情報20に書き込んでもよい。
【0105】
一方、第1確度判断部126Aが確度が閾値T以下(確度≦T)であると判断する場合には、タスク情報出力部150は、データ入力結果、データ入力方法及び確度を画像データ10に対応付けたタスク情報20を作成する。ここで、データ入力結果とは、OCR処理によって文字認識されたデータ入力結果(テキストデータ)、データ入力方法は、OCR、確度は、「中程度(S<確度≦T)」又は「低い(確度≦S)」である。なお、図10(b)のタスク情報20に示したように、文字位置、文字列位置など他の情報を含んでいてもよい。この場合、「継続」となる。
【0106】
OCR処理有無判定部125が、タスク情報20に基づいて、OCR処理が行われた(有)と判断する場合は、第2確度判断部126Bに分岐する。すると、第2確度判断部126Bは、タスク情報20に基づいて、OCR処理による確度を判断する。OCR処理有無判定部125がOCR処理が行われた(有)と判断する場合には、タスク情報20には、第1確度判断部126Aによって判断された確度が含まれている。
【0107】
第2確度判断部126Bが判断した確度が「中程度(S<確度≦T)」である場合には、第1回数判定部121Aが、タスク情報20に基づいて、既データ入力タスク回数を判定する。
第1回数判定部121Aが既データ入力タスク回数が1回(OCR処理に対応)であると判定した場合に、第1オペレータ選択部122Aに分岐する。第1オペレータ選択部122Aは、次のデータ入力タスクを依頼するオペレータを選択する。すると、タスク依頼部130は、選択されたオペレータの操作端末200にデータ入力タスクを依頼する。タスク結果取得部140が選択されたオペレータによるデータ入力結果を取得する。すると、タスク情報出力部150は、データ入力結果及びデータ入力方法(オペレータ(名))を含んだタスク情報20を出力する。
【0108】
第1回数判定部121Aが、既データ入力タスク回数が2回(OCR処理によるデータ入力タスクとオペレータによるデータ入力タスク)であると判定した場合、第1突合部123Aは、OCR処理によるデータ入力結果と、オペレータによるデータ入力結果とを突合する。そして、第1突合部123Aが合致すると判定する場合には、タスク情報出力部150は、突合の結果(「合致」)を含むタスク情報20を画像データ10に対応付けて作成する。このとき、タスク情報出力部150は、データエントリが終了した旨(「終了」)を含んだタスク情報20を作成してもよい。
一方、第1突合部123Aが非合致であると判定する場合には、第1オペレータ選択部122Aは、次にデータ入力タスクを依頼するオペレータを選択する。そして、タスク依頼部130は、選択されたオペレータにデータ入力タスクを依頼する。タスク結果取得部140が選択されたオペレータによるデータ入力結果を取得する。すると、タスク情報出力部150は、データ入力結果及びデータ入力方法(オペレータ(名))を含むタスク情報20を画像データ10に対応付けて作成して出力する。
【0109】
一方、第2確度判断部126Bが確度が「低い(確度≦S)」と判定した場合には、第2回数判定部121Bが、タスク情報20に基づいて、既データ入力タスク回数を判定する。第2回数判定部121Bが既データ入力タスク回数が1回又は2回であると判定する場合には、第2オペレータ選択部122Bは、次に行うデータ入力タスクを依頼するオペレータを選択する。なお、前述したように、OCR処理部124によるOCR処理もデータ入力タスクであるとカウントするので、既データ入力タスク回数が1回であるとは、OCR処理によるデータ入力タスクが行われた場合である。また、既データ入力タスク回数が2回であるとは、OCR処理によるデータ入力タスクとオペレータによるデータ入力タスクとが行われた場合である。
【0110】
そして、タスク依頼部130は、選択されたオペレータの操作端末200にデータ入力タスクを依頼して実行させる。タスク結果取得部140が選択されたオペレータによるデータ入力結果を取得する。すると、タスク情報出力部150は、データ入力結果及びデータ入力方法(オペレータ(名))を含むタスク情報20を画像データ10に対応付けて作成して出力する。
【0111】
一方、第2回数判定部121Bが既データ入力タスク回数が3回であると判定する場合には、第2突合部123Bが、オペレータによって行われた2回のデータ入力結果を突合する。ここでは、OCR処理によるデータ入力結果は、確度が低いため、突合の対象としない。そして、第2突合部123Bが合致すると判定する場合には、タスク情報出力部150は、突合の結果(「合致」)を含むタスク情報20を画像データ10に対応付けて作成して出力し、データエントリを終了する。このとき、タスク情報出力部150は、データエントリが終了した旨(「終了」)を含むタスク情報20を作成してもよい。
【0112】
なお、第2突合部123Bが非合致であると判定する場合には、第2オペレータ選択部122Bが、次にデータ入力タスクを依頼するオペレータを選択する。そして、タスク依頼部130は、選択されたオペレータの操作端末200にデータ入力タスクを依頼して実行させる。タスク結果取得部140が選択されたオペレータによるデータ入力結果を取得する。すると、タスク情報出力部150は、タスク情報20にデータ入力結果及びデータ入力方法(オペレータ(名))を含むタスク情報20を画像データ10に対応付けて作成して出力し、データエントリを終了する。このとき、タスク情報出力部150は、タスク情報20にデータエントリが終了した旨(「終了」)を含むタスク情報20を作成してもよい。
以上説明したように、分配器500は、図11に示したデータエントリを実行する。
【0113】
以上説明したように、データエントリタスクをOCR処理から初めて、OCR処理による文字認識の確度によって、次に行うデータ入力タスク(入力処理)の内容を決定している。このとき、OCR処理の確度が高い(T<確度)場合には、OCR処理によるデータ入力結果(テキストデータ)をそのまま採用する。このようにすることで、オペレータが実行するデータ入力タスクの工数が削減される。
また、OCR処理による文字認識の確度が中程度(S<確度≦T)の場合には、OCR処理によるデータ入力結果とオペレータによるデータ入力結果とを突合する。そして、合致すれば、データ入力結果を採用し、非合致であれば、再度オペレータにデータ入力タスクを分配し実行させて、このデータ入力結果を採用する。
そして、OCR処理による文字認識の確度が低い(確度≦S)場合には、OCR処理によるデータ入力結果を用いず、2人のオペレータによるデータ入力結果を突合する。そして、合致すれば、データ入力結果を採用し、非合致であれば、再度オペレータにデータ入力タスクを分配し実行させて、このデータ入力結果を採用する。
【0114】
このようにすることで、OCR処理による確度が高い場合及び中程度である場合には、OCR処理によるデータ入力結果を用い、OCR処理による確度が低い場合には、OCR処理によるデータ入力結果を用いない。このようにすることで、オペレータによるデータ入力タスクの工数を削減しつつ、データ入力の正確性が確保される。
【0115】
なお、図12において、分配器500のタスク決定部120における第1回数判定部121A、第1オペレータ選択部122A及び第1突合部123Aの部分は、第2の実施の形態が適用される分配器400におけるタスク決定部120に対応する。
また、分配器500のタスク決定部120における第2回数判定部121B、第2オペレータ選択部122B及び第2突合部123Bの部分は、第1の実施の形態が適用される分配器100におけるタスク決定部120に対応する。なお、ここでは、OCR処理によるデータ入力タスクを1回とカウントしたため、第2回数判定部121Bでは、既データ入力タスク回数が+1されている。
【0116】
次に、第3の実施の形態の変形例を説明する。
(第3の実施の形態の変形例3-1)
以上においては、OCR処理の確度が「高い(T<確度)」場合には、OCR処理によるデータ入力結果(テキストデータ)を採用した。
変形例3-1では、OCR処理によるデータ入力結果(テキストデータ)を採用しない。
図13は、変形例3-1におけるデータエントリのフロー図である。
図11のステップ302の代わりのステップ302Aでは、OCR処理による文字認識の確度を、「中程度超(S<確度)」と「低い(確度≦S)」との2段階で判断する。なお、変形例3-1の閾値Sと、図11に示した閾値Sとは、異なってもよい。
【0117】
図14は、変形例3-1が適用される分配器510の機能構成の一例を説明する図である。ここでは、図12に示した分配器500と同じ部分には、同じ符号を付している。
分配器510において、第1確度判断部126Aは、後述するように、確度を「中程度超(S<確度)」と「低い(確度≦S)」との2段階で判断している。
【0118】
そして、第2確度判断部126Bにより、確度が「中程度超(S<確度)」と「低い(確度≦S)」との2つの段階で判断する。
分配器510は、分配器500における、確度が「高い(T<確度)」の場合が「中程度超(S<確度))」に含まれることを除けば、図12に示した分配器500の動作と同じであるので、動作の説明を省略する。
【0119】
(第3の実施の形態の変形例3-2)
変形例3-2では、図11に示した第3の実施の形態におけるデータエントリにおいて、OCR処理による文字認識の確度が「中程度(S<確度≦T)」の場合を除いている。つまり、OCR処理によるデータ入力結果とオペレータによるデータ入力結果との突合を行わない。
【0120】
図15は、変形例2におけるデータエントリのフロー図である。
図11のステップ302の代わりのステップ302Bでは、OCR処理による文字認識の確度を、「高い(T<確度)」と「高くない(確度≦T)」との2段階で判断する。なお、変形例3-2の閾値Tと、図11に示した閾値Tとは、異なってもよい。
【0121】
図16は、変形例3-2が適用される分配器520の機能構成の一例を説明する図である。ここでは、図12に示した分配器500と同じ部分には、同じ符号を付している。
分配器520において、第1確度判断部126Aは、確度を「高い(T<確度)」と「高くない(確度≦T)」との2段階で判断する。
【0122】
すると、第1確度判断部126Aが確度が「高い(T<確度)」と判断する場合には、タスク情報出力部150により、OCR処理によるデータ入力結果(テキストデータ)及びデータ入力方法(この場合、OCR)が含むタスク情報20が画像データ10に対応付けて作成されて、出力される。そして、このデータ入力結果(テキストデータ)が採用されて、データエントリが終了する。
【0123】
ここでは、OCR処理によるデータ入力結果とオペレータによるデータ入力結果との突合を行わない。よって、分配器520は、図12に示した分配器500における、第2確度判断部126B、第1回数判定部121A、第1オペレータ選択部122A及び第1突合部123Aを削除した構成となっている。そして、OCR処理有無判定部125の「有」の場合が第2回数判定部121Bに接続されている。
【0124】
分配器520は、図12における確度が「中程度(S<確度≦T)」と「低い(確度≦S)」が「高くない(確度≦T)」に含まれることを除けば、図12に示した分配器500の動作と同じであるので、動作の説明を省略する。
【0125】
(第3の実施の形態の変形例3-3)
変形例3-3では、図11に示した第3の実施におけるデータエントリにおいて、OCR処理による確度が「低い(確度<S)」の場合を除いている。つまり、2人のオペレータによるデータ入力結果を突合することを行わない。
【0126】
図17は、変形例3-3におけるデータエントリのフロー図である。
図11ステップ302の代わりのステップ302Cでは、OCR処理による文字認識の確度を、「高い(T<確度)」と「高くない(確度≦T)」との2段階で判断する。なお、変形例3-3の閾値Tと、図11に示した閾値Tとは、異なってもよい。
【0127】
図18は、変形例3-3の分配器530の機能構成の一例を説明する図である。ここでは、図12に示した分配器500と同じ構成の部分には、同じ符号を付している。
分配器530において、第1確度判断部126Aは、確度を「高い(T<確度)」と「高くない(確度≦T)」との2段階で判断する。
【0128】
すると、第1確度判断部126Aが確度が「高い(T<確度)」と判断する場合には、タスク情報出力部150により、OCR処理によるデータ入力結果(テキストデータ)及びデータ入力方法(この場合、OCR)を含むタスク情報20が画像データ10に対応付けて作成されて、出力される。そして、このデータ入力結果(テキストデータ)が採用されて、データエントリが終了する。
【0129】
ここでは、2人のオペレータによるデータ入力結果を突合することを行わない。よって、分配器530は、図12に示した分配器500における、第2確度判断部126B、第2回数判定部121B、第2オペレータ選択部122B及び第1突合部123Aを削除した構成となっている。そして、OCR処理有無判定部125の「有」の場合が第1回数判定部121Aに接続されている。
【0130】
分配器530は、図12における確度が「中程度(S<確度≦T)」と「低い(確度≦S)」が「高くない(確度≦T)」に含まれることを除けば、図12に示した分配器500の動作と同じであるので、動作の説明を省略する。
【0131】
[第4の実施の形態]
第1の実施の形態から第3の実施の形態においては、1つのデータエントリを対象とし、このデータエントリを、分配器(分配器100、400、500、510、520、530)によって分配される複数のデータ入力タスクの実行により行なわせることを説明した。特に、分配器がタスク情報20に基づいて、次に行う処理を決定することにより、データエントリの進捗状況の管理が容易になることを説明した。
【0132】
第4の実施の形態では、複数のデータエントリを処理する場合について説明する。ここでは、第1の実施の形態から第3の実施の形態で説明した分配器の機能を備える分配サーバが複数設けられ、複数の分配サーバを並列に動作させて、複数のデータエントリに関するデータ入力タスクを実行させる。つまり、複数の分配サーバは、並列して複数のデータエントリに関する複数のデータ入力タスクを、複数のオペレータに分配して、実行させる。複数の分配サーバによりデータ入力タスクを分配しつつ、複数のデータエントリを処理するシステムを、分配サーバシステムと表記する。なお、分配サーバシステムが情報処理システムの一例である。
このように、複数の分配サーバを設けて並列して実行させるのは、分配の時間や場所に制限されないようにするためである。また、並列化によりデータエントリの高速化やスループットの増大を実現するためである。
【0133】
分散サーバは、図6に示した分配器100と同様なハードウエア構成を有している。
なお、複数の分配サーバは、物理的に分離したものでなくてもよい。例えば、一つのCPU(図6のCPU301)で動作する複数のプロセスであってもよい。また、複数の分配サーバは、同一のプロセス内において時系列でそれぞれの処理が行なわれるものであってもよい。つまり、複数の分配サーバは、個々のデータ入力タスクを分配する処理が論理的に別々に動けばよい。
【0134】
図19は、第4の実施の形態が適用される分配サーバシステムの概要を説明する図である。図19(a)は、複数の分配サーバ600を含み、それぞれの分配サーバ600がタスクバッファ700とオペレータバッファ800とを備える場合、図19(b)は、複数の分配サーバ600を含み、タスクバッファ700とオペレータバッファ800とが共通である場合である。タスクバッファ700が保持手段の一例、オペレータバッファが入力者登録手段の一例である。
【0135】
まず、図19(a)を説明する。図19(a)では、分配サーバ600が2つである場合を示す。そして、分配サーバ600は、それぞれがタスクバッファ700とオペレータバッファ800とを備える。タスクバッファ700は、次に行われるデータ入力タスク(データ入力を要求されたデータ入力タスク)を保持する。つまり、第1の実施の形態から第3の実施の形態において「終了」となっていないデータ入力タスクを保持する。一方、オペレータバッファ800には、データ入力タスクを実行可能なオペレータ(名)30を保持する。例えば、オペレータバッファ800は、その時点において、データ入力タスクを実行していないオペレータ(名)30であってもよいし、オペレータ(名)30とともにその時点において実行及び分配されているデータ入力タスクの数を登録してもよい。ここでは、オペレータバッファ800は、その時点においてデータ入力タスクを実行していないオペレータ(名)30であるとして説明する。
【0136】
なお、オペレータバッファ800がオペレータ30を保持するとは、オペレータ30が登録され、データ入力タスクを依頼するオペレータ30が選択されると、分配サーバ600からそのオペレータ30が操作する操作端末200(図4参照)にデータ入力タスクが送信されるようになっていることをいう。つまり、複数のオペレータ30は、分配サーバ600の近くの一つの場所にまとまっている場合の他、分配サーバ600から離れた遠隔地にいてもよい。つまり、分配サーバ600とオペレータ30(操作端末200)とは、LAN、メトロポリタン・エリア・ネットワーク(MAN)、ワイド・エリア・ネットワーク(WAN)、インターネット、イントラネット、などに用いられる有線ネットワーク、無線ネットワーク、これらが複合されたネットワークなどを介して接続されていてもよい。なお、分配サーバ600とタスクバッファ700とも、同様に接続されていてもよい。
【0137】
また、タスクバッファ700及び/又はオペレータバッファ800は、分配サーバ600内に設けられていてもよい。
【0138】
つまり、分配サーバ600は、タスクバッファ700から1つのデータ入力タスクを取得し、オペレータバッファ800からデータ入力タスクを依頼して実行させるオペレータ30を選択する。そして、選択したオペレータ30の操作端末200(図4など参照)にデータ入力タスクを送信して、データ入力タスクを依頼して実行させる。
【0139】
ここで、分配サーバ600をそれぞれ区別する場合には、分配サーバ610、620と表記する。そして、タスクバッファ700及びオペレータバッファ800を、分配サーバ610、620に対応して区別する場合には、分配サーバ610側をタスクバッファ710、オペレータバッファ810と表記し、分配サーバ620側をタスクバッファ720、オペレータバッファ820と表記する。
【0140】
ここで、タスクバッファ700には、データ入力タスクに関する画像データ10とタスク情報20とが対応づけられるとともに、一体(ペア)として保持されている。そして、分配サーバ600は、タスク情報20を保持しない。ここで、一体として保持するとは、画像データ10とタスク情報20とが紐づけられて保持されることに加え、切り離されることなく移動可能なことをいう。例えば、複数のタスクバッファ700があって、データ入力タスクをタスクバッファ700間で移動させた場合、画像データ10に加えタスク情報20も移動する。一体として保持することの一例は、画像データ10とタスク情報20とを一つのフォルダに保持し、タスクバッファ700間において、フォルダごと移動させるような場合である。
【0141】
個々の分配サーバ600において、タスクバッファ700に保持されたデータ入力タスクの数と、オペレータバッファ800に登録されたデータ入力タスクを実行していないオペレータの数とがバランスが取れていて、データ入力タスクの待ちが発生していなければよい。しかし、データ入力タスクの数とオペレータの数とがアンバランスであれば、データ入力タスクに待ちが発生したり、オペレータに待ちが発生したりする。
【0142】
図19(a)では、分配サーバ610側において、タスクバッファ710には、3つのデータ入力タスクがあるが、オペレータバッファ810には、データ入力タスクを実行していないオペレータがいない(0人である)。このため、分配サーバ610は、タスクバッファ710にあるデータ入力タスクを、オペレータに分配しえない。つまり、データ入力タスクに待ちが発生している。
一方、分配サーバ620側において、タスクバッファ720には、データ入力タスクがない(0個である)。しかし、オペレータバッファ820には、データ入力タスクを実行していないオペレータが3人ある。つまり、オペレータに待ちが発生している。
【0143】
以上説明した場合では、分配サーバ610は、データ入力タスクに待ちが発生し、分配サーバ620は、オペレータに待ちが発生している。よって、分配サーバ610側から分配サーバ620側にデータ入力タスクを移動させれば、分配サーバ610のデータ入力タスクの待ちと分配サーバ620のオペレータの待ちが解消される。これにより、データ入力タスクを実行する効率が向上する。
【0144】
このとき、タスクバッファ710には、データ入力タスクに関する画像データ10とタスク情報20とが一体として保持されている。そこで、画像データ10とタスク情報20とを一体として、タスクバッファ710からタスクバッファ720に移動する(矢印で示す移動)。そして、分配サーバ620が、このデータ入力タスクを、オペレータバッファ820に登録されたオペレータに分配すれば、データ入力タスクが実行される。
【0145】
次に、図19(b)を説明する。図19(b)では、2つの分配サーバ600(分配サーバ610、620)がある。しかし、タスクバッファ700及びオペレータバッファ800は、それぞれ1つであって、2つの分配サーバ600(分配サーバ610、620)で共有されている。そして、タスクバッファ700は、3つのデータ入力タスクを保持し、オペレータバッファ800には、データ入力タスクを実行していない3人のオペレータが登録されている。なお、各データ入力タスクは、画像データ10とタスク情報20とを一体として保持している。そして、分配サーバ610、620は、タスク情報20を保持しない。
【0146】
この場合、分配サーバ610がタスクバッファ700にあるデータ入力タスクをオペレータバッファ800のオペレータへ分配して実行させてもよく、分配サーバ620がタスクバッファ700にあるデータ入力タスクをオペレータバッファ800に登録されたオペレータへ分配して実行させてもよい。タスクバッファ700において、タスク情報20が画像データ10とともに保持されているので、分配サーバ610及び分配サーバ620のいずれであっても、取得したタスク情報20に基づいて、オペレータにデータ入力タスクを分配して実行させられる。
【0147】
なお、分配サーバ600とタスクバッファ700及び/又はオペレータバッファ800とは、一体で構成されていてもよい。つまり、分配サーバ600がタスクバッファ700及び/又はオペレータバッファ800を含んでいてもよい。
【0148】
図20は、比較のために示す第4の実施の形態が適用されない分配サーバシステムの概要を説明する図である。図20(a)は、複数の分配サーバ600を含み、それぞれの分配サーバ600がタスクバッファ700とオペレータバッファ800とを備える場合、図20(b)は、複数の分配サーバ600を含み、タスクバッファ700とオペレータバッファ800とが共通である場合である。
【0149】
図20(a)を説明する。図20(a)では、分配サーバ600が2つである場合を示す。そして、分配サーバ600は、それぞれがタスクバッファ700とオペレータバッファ800とを備える。さらに、分配サーバ600は、それぞれタスク情報20を保持するタスク情報データベース900を備える。なお、図19(a)に示した場合と同様に、分配サーバ600をそれぞれ区別する場合には、分配サーバ610、620と表記する。そして、タスクバッファ700、オペレータバッファ800及びタスク情報データベース900を、分配サーバ610、620に対応して区別する場合には、分配サーバ610側をタスクバッファ710、オペレータバッファ810及びタスク情報データベース910と表記し、分配サーバ620側をタスクバッファ720、オペレータバッファ820及びタスク情報データベース920と表記する。
【0150】
タスク情報データベース900は、分配サーバ600が備えるタスクバッファ700が保持するデータ入力タスクに関するタスク情報20を保持する。つまり、タスク情報データベース910は、分配サーバ610が備えるタスクバッファ710が保持するデータ入力タスクに関するタスク情報20を保持し、タスク情報データベース920は、分配サーバ620が備えるタスクバッファ720が保持するデータ入力タスクに関するタスク情報20を保持する。このとき、タスクバッファ710、720は、データ入力タスクに関する画像データ10を保持する。
【0151】
ここでは、タスクバッファ710には、データ入力タスクに関する3つの画像データ10が保持されている。つまり、データ入力タスクが3つある。タスクバッファ720には、データ入力タスクに関する画像データ10が保持されていない。つまり、データ入力タスクが0である。つまり、分配サーバ610側は、データ入力タスクに待ちが発生している。
一方、オペレータバッファ810には、データ入力タスクを実行していない(登録された)オペレータ30がいない(0人である)。オペレータバッファ820には、データ入力タスクを実行していない(登録された)オペレータ30が3人ある。つまり、分配サーバ620側は、オペレータ30に待ちが生じている。
【0152】
仮に、オペレータバッファ810に、登録されたオペレータ30が複数人あるとする。この場合、分配サーバ610は、タスクバッファ710の保持するデータ入力タスクをオペレータバッファ810のデータ入力タスクを実行していない(登録された)オペレータに分配して実行させられる。つまり、分配サーバ610は、タスクバッファ710からデータ入力タスクに関する画像データ10を取得するとともに、タスク情報データベース910からデータ入力タスクに関するタスク情報20を取得して、タスク情報20に基づいて、オペレータバッファ810に登録されたオペレータ30からデータ入力タスクを依頼して実行させるオペレータ30を選択して実行させればよい。
【0153】
しかし、上記したように、分配サーバ610側はデータ入力タスクに待ちが発生し、分配サーバ620側はオペレータに待ちが発生している。
そこで、分配サーバ610側のタスクバッファ710から分配サーバ620側のタスクバッファ720にデータ入力タスク(画像データ10)を移動させ、分配サーバ620によってデータ入力タスクを分配させることを考える。しかし、移動させたデータ入力タスク(画像データ10)に関するタスク情報20は、タスク情報データベース910に保持されている。よって、分配サーバ620側のタスク情報データベース920には、移動させたデータ入力タスク(画像データ10)に関するタスク情報20が保持されていない。
【0154】
つまり、分配サーバ620がタスクバッファ720に移動させたデータ入力タスク(画像データ10)を分配するためには、移動させたデータ入力タスク(画像データ10)に関するタスク情報20をタスク情報データベース920に保持させることが必要になる。これには、例えば、タスク情報データベース910とタスク情報データベース920とを同期させればよい。同期とは、タスク情報データベース900間において、保持するタスク情報20をコピーし合うことをいう。同期させると、タスク情報データベース920は、タスク情報データベース910の保持するタスク情報20を保持するようになる。
【0155】
しかし、タスク情報データベース910とタスク情報データベース920とを同期させる処理を行うには、他の処理を待たせることになる。つまり、待ち時間分だけ、分配サーバシステムにおけるスループットの低下やレスポンスの遅延などが発生して処理時間が長くなる。
これは、データ入力タスクに関する画像データ10とタスク情報20とがタスクバッファ700とタスク情報データベース900とに分かれて保持されているためである。
【0156】
一方、図19(a)に示した第4の実施の形態が適用される分配サーバシステムでは、データ入力タスクに関する画像データ10と対応するタスク情報20とが一体として保持されているので、複数のタスクバッファ700間でデータ入力タスクを移動すれば、画像データ10に加えてタスク情報20も一緒に移動する。よって、タスク情報データベースを設けることも、複数のタスク情報データベース間で同期をとることも要しない。これにより、タスク分配システムにおける処理時間が長くなることが抑制される。そして、図19(a)に示した構成で、分配サーバ600が複数ある場合であっても、データ入力タスクが効率よく、且つ、正しく分配されるとともに、データ入力タスク(入力処理)の進捗状況の管理が容易になる。
【0157】
次に、図20(b)を説明する。図20(b)では、2つの分配サーバ600(分配サーバ610、620)がある。さらに、分配サーバ600(分配サーバ610、620)は、それぞれタスク情報20を保持するタスク情報データベース900(タスク情報データベース910、920)を備える。しかし、タスクバッファ700及びオペレータバッファ800は、それぞれ1つであって、2つの分配サーバ600(分配サーバ610、620)で共有されている。
【0158】
ただし、タスク情報データベース910は、分配サーバ610に接続され、分配サーバ610が分配を担当するデータ入力タスクに関するタスク情報20を保持する。同様に、タスク情報データベース920は、分配サーバ620に接続され、分配サーバ620が分配を担当するデータ入力タスクに関するタスク情報20を保持する。このとき、タスクバッファ700は、データ入力タスクに関する画像データ10を保持する。
【0159】
タスクバッファ700は、3つのデータ入力タスク(画像データ10)を保持し、オペレータバッファ800には、3人のオペレータが登録されている。そして、分配サーバ610に接続されたタスク情報データベース910に3つのデータ入力タスク(画像データ10)に関するタスク情報20を保持しているとする。
【0160】
このとき、分配サーバ620が、タスクバッファ700が保持するデータ入力タスクをオペレータバッファ800に登録されたオペレータ30に分配して実行させようとしても、分配サーバ620がアクセス可能なタスク情報データベース920には、このデータ入力タスク(画像データ10)に関するタスク情報20が保持されていない。よって、データ入力タスクを分配しえない。この場合、分配サーバ620がデータ入力タスクを分配するためには、タスク情報データベース920がこのデータ入力タスク(画像データ10)に関するタスク情報20を保持することが必要となる。これには、前述したように、タスク情報データベース910とタスク情報データベース920とを同期させればよい。しかし、同期させる処理を行うには、他の処理を待たせることになり、分配サーバシステムにおけるスループットの低下やレスポンスの遅延などが発生して処理時間が長くなってしまう。
【0161】
一方、図19(b)に示した第4の実施の形態が適用される分配サーバシステムでは、データ入力タスクに関する画像データ10と対応するタスク情報20とが一体として保持されているので、タスク情報データベースを設けることも、複数のタスク情報データベース間で同期をとることも要しない。これにより、タスク分配システムにおける処理時間が長くなることが抑制される。そして、図19(b)に示した構成で、分配サーバ600が複数ある場合であっても、データ入力タスクが効率よく、且つ、正しく分配されるとともに、データ入力タスク(入力処理)の進捗状況の管理が容易になる。
【0162】
以上説明したように、分配サーバシステムでは、複数のデータエントリに関する複数のデータ入力タスクが並行して取り扱われる。この場合、第1の実施の形態から第3の実施の形態で説明した分配器(分配器100、400、500、510、520、530)を分配サーバ600として用いれば、データ入力タスクに関するタスク情報20を取得し、取得したタスク情報20に基づいて次に行うデータ入力タスクが決定される。つまり、分配サーバ600は、データ入力タスクに関する進捗情報の管理をすることを要しない。すなわち、タスク情報20に基づいて次のデータ入力タスクを決定することで、データ入力タスクに関する進捗情報の管理が容易になる。
【0163】
分配器(分配器100、400、500、510、520、530)のタスク決定部120を、タスク情報20に基づいて、次に行うデータ入力タスクが決定されるように構成すればよい。第1の実施の形態から第3の実施の形態で説明したように、タスク決定部120は、次に行うデータ入力タスク(入力処理)の決定を種々の処理論理(ロジック)で構成されうる。つまり、タスク決定部120は、第1の実施の形態から第3の実施の形態で説明した以外の処理論理(ロジック)で構成されてもよい。
【0164】
以上においては、オペレータを人として説明したが、必ずしも人であることを要しない。例えば、通常文字認識に用いられるOCR装置よりも精度が高く、運用コストが高いものであってもよい。例えば、長時間をかけて高い精度を出すOCR装置であってもよい。このような装置は、運用コストが高い。しかし、上記において説明した分配器を用いてデータ入力タスクを分配すれば、高い精度のOCR装置を使用して行うデータ入力タスクの数(工数)が削減される。よって、高い精度のOCR装置を使用しても運用コストが抑制される。
また、データエントリを例として説明したが、データ化するための他の処理に適用してもよい。
【0165】
なお、参照画像が対応付けられ、当該参照画像が参照されて行われた入力処理についての情報である処理情報を取得する取得手段と、取得手段により取得された処理情報に基づき、参照画像が参照されて行われる、次の入力処理の内容を決定する処理決定手段を、プログラムによってコンピュータに機能させることができる。このとき、プログラムは、記憶媒体に格納して提供してもよく、また、通信手段によって提供してもよい。その場合、「プログラムを記録したコンピュータ読み取り可能な記録媒体」の発明として捉えてもよい。
【0166】
「プログラムを記録したコンピュータ読み取り可能な記録媒体」とは、プログラムのインストール、実行、プログラムの流通などのために用いられる、プログラムが記録されたコンピュータで読み取り可能な記録媒体をいう。
なお、記録媒体には、デジタル・バーサタイル・ディスク(DVD)フォーラムによって策定された規格に基づくDVD、コンパクトディスク(CD)、ブルーレイ・ディスク(Blue-ray(登録商標) Disk)、光磁気ディスク(MO)、フレキシブルディスク(FD)、磁気テープ、HDD、ROM、フラッシュメモリなどが含まれる。
【0167】
以上、本発明の実施形態について説明した。本発明の技術的思想の範囲から逸脱しない様々な変更や構成の代替は、本発明に含まれる。
【符号の説明】
【0168】
10…画像データ、20…タスク情報、30…オペレータ、100、400、500、510、520、530…分配器、110…タスク情報取得部、120…タスク決定部、121…回数判定部、121A…第1回数判定部、121B…第2回数判定部、122…オペレータ選択部、122A…第1オペレータ選択部、122B…第2オペレータ選択部、123…突合部、123A…第1突合部、123B…第2突合部、124…OCR処理部、125…OCR処理有無判定部、126A…第1確度判断部、126B…第2確度判断部、130…タスク依頼部、140…タスク結果取得部、150…タスク情報出力部、200…操作端末、600、610、620…分配サーバ、700、710、720…タスクバッファ、900、910、920…タスク情報データベース
図1
図2
図3
図4
図5
図6
図7
図8
図9
図10
図11
図12
図13
図14
図15
図16
図17
図18
図19
図20