IP Force 特許公報掲載プロジェクト 2022.1.31 β版

知財求人 - 知財ポータルサイト「IP Force」

▶ 富士ゼロックス株式会社の特許一覧

<>
  • 特開-情報処理システムおよびプログラム 図1
  • 特開-情報処理システムおよびプログラム 図2
  • 特開-情報処理システムおよびプログラム 図3
  • 特開-情報処理システムおよびプログラム 図4
  • 特開-情報処理システムおよびプログラム 図5
  • 特開-情報処理システムおよびプログラム 図6
  • 特開-情報処理システムおよびプログラム 図7
  • 特開-情報処理システムおよびプログラム 図8
  • 特開-情報処理システムおよびプログラム 図9
  • 特開-情報処理システムおよびプログラム 図10
  • 特開-情報処理システムおよびプログラム 図11
  • 特開-情報処理システムおよびプログラム 図12
  • 特開-情報処理システムおよびプログラム 図13
  • 特開-情報処理システムおよびプログラム 図14
  • 特開-情報処理システムおよびプログラム 図15
  • 特開-情報処理システムおよびプログラム 図16
  • 特開-情報処理システムおよびプログラム 図17
  • 特開-情報処理システムおよびプログラム 図18
  • 特開-情報処理システムおよびプログラム 図19
  • 特開-情報処理システムおよびプログラム 図20
  • 特開-情報処理システムおよびプログラム 図21
< >
(19)【発行国】日本国特許庁(JP)
(12)【公報種別】公開特許公報(A)
(11)【公開番号】P2024033878
(43)【公開日】2024-03-13
(54)【発明の名称】情報処理システムおよびプログラム
(51)【国際特許分類】
   G06Q 99/00 20060101AFI20240306BHJP
   G06V 30/14 20220101ALI20240306BHJP
【FI】
G06Q99/00
G06V30/14 340A
【審査請求】未請求
【請求項の数】16
【出願形態】OL
(21)【出願番号】P 2022137774
(22)【出願日】2022-08-31
(71)【出願人】
【識別番号】000005496
【氏名又は名称】富士フイルムビジネスイノベーション株式会社
(74)【代理人】
【識別番号】100104880
【弁理士】
【氏名又は名称】古部 次郎
(74)【代理人】
【識別番号】100125346
【弁理士】
【氏名又は名称】尾形 文雄
(72)【発明者】
【氏名】松尾 良恵
【テーマコード(参考)】
5B029
5L049
【Fターム(参考)】
5B029CC25
5B029CC27
5L049EE04
5L049EE06
5L049EE07
(57)【要約】
【課題】非定型帳票に記載された記載情報を抽出する場合において、抽出する候補が記載された記載箇所を表示しない構成に比べ、抽出の結果を訂正する際のユーザの作業性を向上させる。
【解決手段】1または複数のプロセッサを備える情報処理システムにて、1または複数のプロセッサは、非定型帳票に記載された情報である記載情報から、非定型帳票の項目に対応する記載情報として抽出する候補である抽出候補を取得し、非定型帳票のうちの抽出候補が記載された記載箇所を表示部に表示する。
【選択図】図8
【特許請求の範囲】
【請求項1】
1または複数のプロセッサを備える情報処理システムであり、
前記1または複数のプロセッサは、
非定型帳票に記載された情報である記載情報から、当該非定型帳票の項目に対応する当該記載情報として抽出する候補である抽出候補を取得し、
前記非定型帳票のうちの前記抽出候補が記載された記載箇所を表示部に表示する、
情報処理システム。
【請求項2】
前記1または複数のプロセッサは、
前記非定型帳票の前記記載情報から、抽出したい当該記載情報に対する前記項目の記載内容に基づき、前記抽出候補を取得する、
請求項1に記載の情報処理システム。
【請求項3】
前記1または複数のプロセッサは、
前記非定型帳票の前記記載情報から、前記項目と、当該項目に設定された抽出の条件とに基づき、前記抽出候補を取得し、
前記抽出の条件の達成状況に基づき、前記抽出候補の前記記載箇所を前記表示部に表示する、
請求項1に記載の情報処理システム。
【請求項4】
前記1または複数のプロセッサは、
前記抽出候補の前記記載箇所とともに、前記達成状況に基づき、当該抽出候補に対して割り当てられた優先度を前記表示部に表示する、
請求項3に記載の情報処理システム。
【請求項5】
前記1または複数のプロセッサは、
前記抽出候補の前記記載箇所とともに、前記達成状況に基づき、当該抽出候補に割り当てられた優先度の理由を前記表示部に表示する、
請求項3に記載の情報処理システム。
【請求項6】
前記1または複数のプロセッサは、
前記非定型帳票の前記記載情報から、前記項目と、当該項目に設定された前記抽出の条件とに基づき、複数の前記抽出候補を取得し、
複数の前記抽出候補のうちの、前記抽出の条件を最も達成している候補と他の候補との間で、当該抽出候補の前記記載箇所の表示態様を異ならせる、
請求項3に記載の情報処理システム。
【請求項7】
前記1または複数のプロセッサは、
前記非定型帳票の画像に、前記抽出候補の前記記載箇所を表示する、
請求項1に記載の情報処理システム。
【請求項8】
前記1または複数のプロセッサは、
前記非定型帳票の前記記載情報から、複数の前記抽出候補を取得し、
複数の前記抽出候補のうちの、ユーザが指定した当該抽出候補の前記記載箇所を、前記非定型帳票の画像に表示する、
請求項7に記載の情報処理システム。
【請求項9】
前記1または複数のプロセッサは、
ユーザによる前記抽出候補の選択を受け付けた場合、選択された当該抽出候補を、前記項目に対応する前記記載情報を抽出した結果とする、
請求項1に記載の情報処理システム。
【請求項10】
前記1または複数のプロセッサは、
選択された前記抽出候補の前記記載箇所を、前記項目に対応する前記記載情報の当該記載箇所として学習する、
請求項9に記載の情報処理システム。
【請求項11】
前記1または複数のプロセッサは、
ユーザによる前記項目に対応する前記記載情報の入力を受け付けた場合、入力された当該記載情報を、当該項目に対応する当該記載情報を抽出した結果とし、
前記非定型帳票の画像のうちの、入力された前記記載情報が記載された前記記載箇所を検出する、
請求項1に記載の情報処理システム。
【請求項12】
前記1または複数のプロセッサは、
検出された前記記載箇所を、前記項目に対応する前記記載情報の当該記載箇所として学習する、
請求項11記載の情報処理システム。
【請求項13】
前記1または複数のプロセッサは、
前記項目と、当該項目に設定された抽出の条件とに基づき、前記抽出候補を取得し、
ユーザによる訂正の指示に基づき、前記抽出候補を訂正し、
訂正された前記抽出候補が前記抽出の条件の全ては満たしていない場合であっても、訂正された当該抽出候補を、前記項目に対応する前記記載情報を抽出した結果とする、
請求項1に記載の情報処理システム。
【請求項14】
前記1または複数のプロセッサは、
訂正された前記抽出候補が前記抽出の条件の全ては満たしていないことをユーザに知らせるための表示を前記表示部に行う、
請求項13に記載の情報処理システム。
【請求項15】
前記1または複数のプロセッサは、
前記抽出の条件のうちの、訂正された前記抽出候補に一致する当該抽出の条件に対して重みを加算し、
前記項目と、前記抽出の条件と、当該抽出の条件の重みとに基づき、新たな非定型帳票から新たな抽出候補を取得する、
請求項13に記載の情報処理システム。
【請求項16】
コンピュータに、
非定型帳票に記載された情報である記載情報から、当該非定型帳票の項目に対応する当該記載情報として抽出する候補である抽出候補を取得する機能と、
前記非定型帳票のうちの前記抽出候補が記載された記載箇所を表示部に表示させる機能と、
を実現させるためのプログラム。
【発明の詳細な説明】
【技術分野】
【0001】
本発明は、情報処理システムおよびプログラムに関する。
【背景技術】
【0002】
特許文献1には文字列を含む複数の画像を用いた学習の結果に基づいて、認識対象の画像における特定項目の文字列を認識する文字列認識部と、認識対象の画像と、文字列認識部による文字列認識結果とにおいて同じ特定項目を示す対応関係が把握可能な態様で、認識対象の画像と文字列認識結果とを出力する出力部と、を備える画像処理装置について記載されている。
【先行技術文献】
【特許文献】
【0003】
【特許文献1】特開2021-12741号報
【発明の概要】
【発明が解決しようとする課題】
【0004】
非定型帳票に記載された記載情報を抽出した場合に、抽出された記載情報とともに、この記載情報を抽出した非定型帳票の箇所とを表示部に表示すれば、この非定型帳票のどの箇所から抽出されたかを把握することができる。
ここで、例えば、ユーザの意図しない箇所から記載情報が抽出されることがある。この場合、ユーザは、抽出の結果を訂正するために、非定型帳票上の意図する箇所を探したり、意図する記載情報を入力したりする必要がある。
本発明の目的は、非定型帳票に記載された記載情報を抽出する場合において、抽出する候補が記載された記載箇所を表示しない構成に比べ、抽出の結果を訂正する際のユーザの作業性を向上させることにある。
【課題を解決するための手段】
【0005】
請求項1に記載の発明は、1または複数のプロセッサを備える情報処理システムであり、前記1または複数のプロセッサは、非定型帳票に記載された情報である記載情報から、当該非定型帳票の項目に対応する当該記載情報として抽出する候補である抽出候補を取得し、前記非定型帳票のうちの前記抽出候補が記載された記載箇所を表示部に表示する、情報処理システムである。
請求項2に記載の発明は、前記1または複数のプロセッサは、前記非定型帳票の前記記載情報から、抽出したい当該記載情報に対する前記項目の記載内容に基づき、前記抽出候補を取得する、請求項1に記載の情報処理システムである。
請求項3に記載の発明は、前記1または複数のプロセッサは、前記非定型帳票の前記記載情報から、前記項目と、当該項目に設定された抽出の条件とに基づき、前記抽出候補を取得し、前記抽出の条件の達成状況に基づき、前記抽出候補の前記記載箇所を前記表示部に表示する、請求項1に記載の情報処理システムである。
請求項4に記載の発明は、前記1または複数のプロセッサは、前記抽出候補の前記記載箇所とともに、前記達成状況に基づき、当該抽出候補に対して割り当てられた優先度を前記表示部に表示する、請求項3に記載の情報処理システムである。
請求項5に記載の発明は、前記1または複数のプロセッサは、前記抽出候補の前記記載箇所とともに、前記達成状況に基づき、当該抽出候補に割り当てられた優先度の理由を前記表示部に表示する、請求項3に記載の情報処理システムである。
請求項6に記載の発明は、前記1または複数のプロセッサは、前記非定型帳票の前記記載情報から、前記項目と、当該項目に設定された前記抽出の条件とに基づき、複数の前記抽出候補を取得し、複数の前記抽出候補のうちの、前記抽出の条件を最も達成している候補と他の候補との間で、当該抽出候補の前記記載箇所の表示態様を異ならせる、請求項3に記載の情報処理システムである。
請求項7に記載の発明は、前記1または複数のプロセッサは、前記非定型帳票の画像に、前記抽出候補の前記記載箇所を表示する、請求項1に記載の情報処理システムである。
請求項8に記載の発明は、前記1または複数のプロセッサは、前記非定型帳票の前記記載情報から、複数の前記抽出候補を取得し、複数の前記抽出候補のうちの、ユーザが指定した当該抽出候補の前記記載箇所を、前記非定型帳票の画像に表示する、請求項7に記載の情報処理システムである。
請求項9に記載の発明は、前記1または複数のプロセッサは、ユーザによる前記抽出候補の選択を受け付けた場合、選択された当該抽出候補を、前記項目に対応する前記記載情報を抽出した結果とする、請求項1に記載の情報処理システムである。
請求項10に記載の発明は、前記1または複数のプロセッサは、選択された前記抽出候補の前記記載箇所を、前記項目に対応する前記記載情報の当該記載箇所として学習する、請求項9に記載の情報処理システムである。
請求項11に記載の発明は、前記1または複数のプロセッサは、ユーザによる前記項目に対応する前記記載情報の入力を受け付けた場合、入力された当該記載情報を、当該項目に対応する当該記載情報を抽出した結果とし、前記非定型帳票の画像のうちの、入力された前記記載情報が記載された前記記載箇所を検出する、請求項1に記載の情報処理システムである。
請求項12に記載の発明は、前記1または複数のプロセッサは、検出された前記記載箇所を、前記項目に対応する前記記載情報の当該記載箇所として学習する、請求項11記載の情報処理システムである。
請求項13に記載の発明は、前記1または複数のプロセッサは、前記項目と、当該項目に設定された抽出の条件とに基づき、前記抽出候補を取得し、ユーザによる訂正の指示に基づき、前記抽出候補を訂正し、訂正された前記抽出候補が前記抽出の条件の全ては満たしていない場合であっても、訂正された当該抽出候補を、前記項目に対応する前記記載情報を抽出した結果とする、請求項1に記載の情報処理システムである。
請求項14に記載の発明は、前記1または複数のプロセッサは、訂正された前記抽出候補が前記抽出の条件の全ては満たしていないことをユーザに知らせるための表示を前記表示部に行う、請求項13に記載の情報処理システムである。
請求項15に記載の発明は、前記1または複数のプロセッサは、前記抽出の条件のうちの、訂正された前記抽出候補に一致する当該抽出の条件に対して重みを加算し、前記項目と、前記抽出の条件と、当該抽出の条件の重みとに基づき、新たな非定型帳票から新たな抽出候補を取得する、請求項13に記載の情報処理システムである。
請求項16に記載の発明は、コンピュータに、非定型帳票に記載された情報である記載情報から、当該非定型帳票の項目に対応する当該記載情報として抽出する候補である抽出候補を取得する機能と、前記非定型帳票のうちの前記抽出候補が記載された記載箇所を表示部に表示させる機能と、を実現させるためのプログラムである。
【発明の効果】
【0006】
請求項1,16の発明によれば、非定型帳票に記載された記載情報を抽出する場合において、抽出する候補が記載された記載箇所を表示しない構成に比べ、抽出の結果を訂正する際のユーザの作業性を向上させることができる。
請求項2の発明によれば、非定型帳票の項目の記載内容に基づき、抽出候補を取得することができる。
請求項3の発明によれば、抽出の条件の達成状況を考慮しない構成に比べ、抽出候補を選択する際のユーザの作業性を向上させることができる。
請求項4の発明によれば、ユーザが抽出候補の優先度を比較することができる。
請求項5の発明によれば、ユーザが抽出候補の優先度の理由を参照することができる。
請求項6の発明によれば、抽出の条件に最も合致した抽出候補を、他の抽出候補と異ならせて表示することができる。
請求項7の発明によれば、抽出候補を選択する際に、記載情報を抽出した箇所をユーザが参照することができる。
請求項8の発明によれば、非定型帳票の画像上に抽出候補候補の記載箇所を全て表示する構成に比べ、表示部が煩雑になることを抑制する。
請求項9の発明によれば、項目に対応する記載情報を、ユーザによる手入力で訂正する構成に比べ、ユーザの作業性を向上させることができる。
請求項10の発明によれば、選択した抽出候補の記載箇所を学習しない構成に比べ、項目に対応する記載情報を抽出する精度を向上させることができる。
請求項11の発明によれば、ユーザが入力した記載情報の記載箇所をユーザが指定する構成に比べ、項目に対応する記載情報を変更する際のユーザの作業性を向上させることができる。
請求項12の発明によれば、変更した記載情報として検出した記載箇所を学習しない構成に比べ、項目に対応する記載情報を抽出する精度を向上させることができる。
請求項13の発明によれば、訂正された抽出候補が抽出の条件の全ては満たしていない場合であっても、訂正された抽出候補を、項目に対応する記載情報として保持することができる。
請求項14の発明によれば、訂正した抽出候補が抽出の条件を満たさないことをユーザに知らせることができる。
請求項15の発明によれば、単に抽出の条件の何れかと一致する記載情報を抽出する構成に比べ、重要な条件に一致する記載情報を抽出することができる。
【図面の簡単な説明】
【0007】
図1】本実施形態が適用される情報処理システムの全体構成例を示した図である。
図2】本実施形態に係るOCR処理サーバ、ユーザ端末の構成例を示す図である。
図3】本実施形態に係るOCR処理サーバの機能構成の一例を示す図である。
図4】本実施形態に係るユーザ端末の機能構成の一例を示す図である。
図5】本実施形態に係るOCR処理サーバが抽出候補をユーザに確認させる処理の流れを示したフロー図である。
図6】本実施形態に係るユーザ端末の表示部の表示の一例を示す図である。
図7】抽出候補に対する優先度の割り当ての一例を示した図である。
図8】本実施形態に係る抽出候補の表示の一例を示す図である。
図9】本実施形態に係る抽出候補の表示の他の例を示す図である。
図10】本実施形態に係る抽出候補の表示の他の例を示す図である。
図11】本実施形態に係る抽出候補の表示の他の例を示す図である。
図12】本実施形態に係る抽出候補の表示の他の例を示す図である。
図13】本実施形態に係る抽出候補の表示の他の例を示す図であり、(A)は抽出候補が特定の条件を満たす状態、(B)は抽出候補が特定の条件を解消した状態を示している。
図14】本実施形態に係る抽出候補の表示の他の例を示す図である。
図15】本実施形態に係る抽出候補の表示の他の例を示す図である。
図16】本実施形態に係るユーザ端末が抽出候補の訂正を要求する処理の流れを示したフロー図である。
図17】本実施形態に係るOCR処理サーバが抽出結果を学習する処理の流れを示したフロー図である。
図18】実施形態に係るユーザ端末が抽出結果を入力する処理の流れを示したフロー図である。
図19】本実施形態に係るユーザ端末の表示部の表示の他の例を示す図である。
図20】本実施形態に係る確認画面の一例を示す図である。
図21】本実施形態に係る抽出候補の表示の他の例を示す図である。
【発明を実施するための形態】
【0008】
以下、添付図面を参照して、本発明を実施するための形態について説明する。
<実施の形態>
[情報処理システム1]
図1は、本実施形態が適用される情報処理システム1の全体構成例を示した図である。
本実施形態に係る情報処理システム1は、非定型帳票の画像データをOCR(Optical Character Recognition)処理するOCR処理サーバ10と、ユーザが操作するユーザ端末30とが、通信回線80を介して接続されることにより構成されている。この通信回線80は、例えば、インターネット等の回線であり、OCR処理サーバ10とユーザ端末30との間の情報通信に用いられる。
また、情報処理システム1は、ユーザの文書を管理する文書管理サーバ20や、原稿を読み取る機能を有する画像形成装置40、非定型帳票の画像データをOCR処理の結果の出力先である業務サーバ50を備えてもよい。
【0009】
本実施形態における「非定型帳票」は、帳票中に記載された情報を抽出する箇所や、抽出される情報の意味などが予め設定されていない帳票のことである。非定型帳票として、例えば申込書、請求書、納品書、伝票等の帳票の記入欄の位置が一様ではない帳票が挙げられる。非定型帳票の記入欄は、手書きで文字が記入されていてもよいし、印刷で文字が記入されていてもよい。
また、非定型帳票は、例えばオフィスソフトその他のアプリケーションプログラムで作成されたオフィス文書、電子メール、原稿から光学的に読み取ったイメージデータ、ファクシミリ文書、写真、会計データ、医療データ、データベースその他である。非定型帳票には、静止画像に限らず、動画像も含まれる。静止画像には、図や絵も含まれる。
【0010】
本実施形態におけるOCR処理サーバ10は、非定型帳票の画像データをOCR処理し、非定型帳票に記載されている文字を認識するサーバである。OCR処理サーバ10は、非定型帳票の画像データから、非定型帳票の特定の項目に対応するテキストデータの候補を抽出する。換言すると、OCR処理サーバ10は、非定型帳票に記載された情報である記載情報から、この非定型帳票の項目に対応する記載情報として抽出する候補(以下「抽出候補」という。)を取得する。
図1に示す情報処理システム1には、OCR処理サーバ10は1台のサーバで構成されているが、複数台のサーバで構成されてもよい。OCR処理サーバ10は、いわゆるクラウドサーバとして構成されてもよいし、オンプレミス型のサーバとして構成されてもよい。
【0011】
本実施形態におけるユーザ端末30は、OCR処理サーバ10によるOCR処理の結果を確認するためにユーザが使用する情報端末装置である。ユーザ端末30は、OCR処理サーバ10により取得された抽出候補を提示し、OCR処理の結果の確定や訂正を指示する操作をユーザから受け付ける。また、ユーザ端末30は、非定型帳票のうちの抽出候補が記載された箇所(以下「記載箇所」という。)を表示する。
ユーザ端末30には、ユーザに対して画像やテキスト情報などを表示する液晶ディスプレイパネルや有機EL(Electro Luminescence)ディスプレイパネルなどからなる表示部30Aが設けられている。
ユーザ端末30としては、例えば、コンピュータ装置、タブレット型情報端末、スマートフォン、その他の情報処理装置が挙げられる。
【0012】
本実施形態における文書管理サーバ20は、OCR処理の対象となる文書の画像データを管理している。文書管理サーバ20は、管理している画像データを、OCR処理サーバ10に入力する。
本実施形態における画像形成装置40は、少なくとも原稿を読み取るスキャン機能を有し、紙媒体の原稿の画像データを取得する。画像形成装置40は、取得した画像データを、OCR処理サーバ10に入力する。また、画像形成装置40は、プリンタ機能、コピー機能、及びファクシミリ機能等を有していてもよい。
本実施形態において、文書管理サーバ20および画像形成装置40は、OCR処理の対象となる画像データをOCR処理サーバ10に入力する入力装置の一例である。
【0013】
業務サーバ50は、OCR処理サーバ10がOCR処理の結果を利用して、特定の業務の遂行を担当する。業務サーバ50は、OCR処理の結果に基づいて、顧客の情報の管理や、経費の計算などを行う。
本実施形態において、業務サーバ50は、OCR処理サーバ10が非定型帳票の画像データをOCR処理の結果を出力する出力先の一例である。
【0014】
ここで、本実施形態の情報処理システム1の概要を説明する。
OCR処理サーバ10が、文書管理サーバ20、ユーザ端末30、画像形成装置40などから入力された非定型帳票の画像データに対してOCR処理を行い、OCR処理の結果を業務サーバ50などの予め定められた出力先に出力する。
また、OCR処理サーバ10では、読取り定義設定や、出力設定、業務チェック設定が行われたり、抽出候補を基に非定型帳票の画像データを分割したり、抽出候補の確認・訂正を受け付けたりする。
読取り定義設定では、例えば項目の右付近から項目値を読取るといった、OCR処理において画像データの情報を読取る範囲である読取り範囲が設定される。出力設定では、出力する出力データのファイル形式、及び出力先が設定される。業務チェック設定では、出力データに入力可能な文字数等の書式等が設定される。
【0015】
ユーザ端末30にて、非定型帳票の画像データから特定の項目に対応する記載情報を抽出する指示をユーザから受けた場合、OCR処理サーバ10による抽出が要求され、この抽出の結果に関する表示が行われる。ユーザ端末30は、非定型帳票のうちの特定の項目に対応する記載情報の候補を、表示部30Aに表示する。具体的には、ユーザ端末30は、特定の項目に対応する記載情報の候補について、抽出された記載情報そのものであるテキストデータの記載箇所を、表示部30Aに表示する。
【0016】
これにより、ユーザが、ユーザ端末30にてOCR処理サーバ10による抽出の結果を訂正する場合に、提示された抽出候補の記載箇所を参照する。
本実施形態は、OCR処理サーバ10による抽出の結果が確定される前に、記載情報と記載箇所と対応付けて抽出候補を表示することで、抽出の結果を訂正する際のユーザの作業性を向上させることを図る。
【0017】
〔ハードウェア構成〕
図2は、本実施形態に係るOCR処理サーバ10、ユーザ端末30の構成例を示す図である。
本実施形態に係るOCR処理サーバ10、ユーザ端末30の各装置は、装置全体の動作を制御する制御部11と、非定型帳票に関する情報等が記録される2次記憶部12と、通信回線80(図1参照)を介して情報の送受信を行う通信部13とを有している。
なお、制御部11と、2次記憶部12と、通信部13とは、バスや信号線を通じて接続される。
【0018】
制御部11は、プロセッサの一例として装置全体を制御するCPU11a、CPU11aの作業用メモリ等として用いられるRAM11b、CPU11aにより実行されるプログラム等が格納されるROM11cを備えている。また、制御部11は、書き換え可能で電源供給が途絶えた場合にもデータを保持できる不揮発性メモリ11d、制御部11に接続される通信部13等の各部を制御するインターフェース部11eを備えている。
不揮発性メモリ11dは、例えば、電池によりバックアップされたSRAMやフラッシュメモリ等によって構成される。また、制御部11が2次記憶部12に記憶されたプログラムを読み込むことによって、本実施形態の各装置にて各処理が実行される。
【0019】
2次記憶部12は、例えばハードディスク装置(HDD)や半導体メモリ等によって構成される。2次記憶部12は、各装置の商品形態によって異なる。2次記憶部12には、例えば非定型帳票についての情報等が保存される。その他、2次記憶部12には、制御部11により実行されるプログラムや、OCR処理の抽出条件についての情報等が記憶されている。
【0020】
この他、ユーザ端末30は、キーボードやマウス等の入力デバイス、液晶ディスプレイ等により構成される表示部30A(図2では不図示)を備える。ユーザ端末30にて、入力デバイスがタッチパネルの場合、表示部30Aと一体となって設けられてもよい。
【0021】
〔OCR処理サーバ10の機能構成〕
図3は、本実施形態に係るOCR処理サーバ10の機能構成の一例を示す図である。図3に示すOCR処理サーバ10の各機能は、主に制御部11のCPU11aによって実現される。
図3に示すように、OCR処理サーバ10は、非定型帳票取得部101と、要求情報取得部102と、OCR処理部103と、優先度付与部104と、抽出候補出力部105と、抽出結果訂正部106と、抽出結果出力部107とを備えている。また、OCR処理サーバ10は、非定型帳票データベース(DB)108と、抽出候補DB109と、学習DB110とを備えている。
【0022】
非定型帳票取得部101は、非定型帳票の画像データを取得する。非定型帳票取得部101は、自装置の2次記憶部12や、他の装置から非定型帳票の画像データを受信した通信部13から、非定型帳票の画像データを取得する。他の装置としては、例えば、文書管理サーバ20、ユーザ端末30、画像形成装置40が挙げられる。
非定型帳票取得部101は、取得した非定型帳票の画像データを、非定型帳票DB108に格納する。
【0023】
要求情報取得部102は、ユーザが使用するユーザ端末30を介してユーザの要求を示す要求情報を取得する。具体的には、要求情報取得部102は、ユーザにユーザ端末30を介して要求を入力させ、ユーザが入力した要求情報を、通信回線80を介して取得する。
なお、要求情報取得部102が要求情報を取得する方法は、上記方法に限定されるものではない。
【0024】
OCR処理部103は、非定型帳票の画像データに対して文字認識処理を実行して、非定型帳票に含まれる記載情報を抽出する。
OCR処理部103は、抽出候補として、ユーザが要求する記載情報に対する項目の記載内容に基づき、要求された記載情報を抽出する。
本実施形態では、非定型帳票に記載されている項目自体を「キー」と称し、項目に対応する記載情報を「バリュー」と称する場合がある。付言すると、キーは項目名であり、バリューは項目値である。
【0025】
OCR処理部103は、上述したように、非定型帳票の画像データに対して文字認識処理を実行して、キーとバリューとを抽出するキーバリュー抽出を行う。
例えば、非定型帳票において、「氏名」というキーの周辺には、バリューに相当する氏名を表す文字が記載されていることが多い。OCR処理部103は、項目「氏名」が選択された場合に、非定型帳票の画像データから、キーに相当する「氏名」の文字を特定し、この「氏名」が特定された箇所の周辺から、バリューに相当する記載情報を抽出する。また、OCR処理部103は、項目「氏名」が選択された場合に、「氏名」と同様の意味をもつ「名前」や「なまえ」、「Name」などが特定される箇所の周辺からも、バリューに相当する記載情報を抽出してもよい。
【0026】
また、OCR処理部103は、キーが特定された箇所に対応する記載情報の中から、項目に設定された抽出の条件に基づき、抽出候補のバリューを抽出してもよい。
項目に設定される抽出の条件は、キーに対応するバリューの種別やフォーマットを限定する情報であり、抽出候補のバリューを特定するにあたってヒントになる情報である。
具体的には、抽出の条件として、バリューの内容が、例えば日付、電話番号、郵便番号、生年月日、数値、氏名、氏名のふりがな等であると設定される。
その他、抽出の条件として、バリューの表記が、例えば西暦、和暦、月日、数字がn以上/n以下、漢字、ひらがな、カタカナ、アルファベット等であると設定される。
【0027】
優先度付与部104は、抽出候補の各々に対し、OCR処理の確からしさに基づいて優先度を付与する。
具体的には、優先度付与部104は、項目に設定された抽出の条件の達成状況に基づき、抽出候補に対して優先度を割り当てる。また、優先度付与部104は、キーが特定された箇所に基づき、抽出候補に対して優先度を割り当ててもよい。
【0028】
抽出候補出力部105は、OCR処理部103が抽出した抽出候補に関する情報を、ユーザ端末30へ出力する。
具体的には、抽出候補出力部105は、記載情報、記載箇所、および優先度を含む抽出候補のバリューに係る情報を、通信部13を介してユーザ端末30へ出力する。
【0029】
抽出結果訂正部106は、要求情報取得部102が取得した要求情報に基づいて、抽出結果に相当する抽出候補を訂正する。換言すると、抽出結果訂正部106は、要求情報取得部102が取得した要求情報に基づいて、OCR処理部103が抽出した優先度1の抽出候補に関する情報を変更する。
具体的には、抽出結果訂正部106は、抽出候補に対し、優先度、記載情報、および記載箇所の少なくとも1つの変更を実施する。これにより、OCR処理部103による抽出結果に、訂正された内容が反映される。
【0030】
抽出結果出力部107は、OCR処理部103による抽出結果を管理する。
抽出結果出力部107は、OCR処理部103による抽出結果を、自装置の2次記憶部12やユーザ端末30、その他の装置へ出力する。抽出結果出力部107は、抽出候補出力部105が優先度1として出力した抽出候補、または抽出結果訂正部106が訂正した抽出候補を、OCR処理部103による抽出結果として出力する。
抽出結果出力部107は、OCR処理部103による抽出結果として出力した内容を、学習DB110に格納する。また、抽出結果出力部107は、OCR処理部103による抽出結果として出力した内容が、抽出候補出力部105により優先度1として出力された抽出候補の内容から変更されている場合に、この変更の内容を学習DB110に格納する。
【0031】
非定型帳票DB108は、非定型帳票取得部101が取得した非定型帳票の画像データを記憶し蓄積する。
抽出候補DB109は、OCR処理部103により抽出された抽出候補を記憶している。具体的には、抽出候補DB109は、OCR処理により抽出されたキーとバリューとを対応付けて記憶し蓄積する。
学習DB110は、抽出結果出力部107が出力したOCR処理部103による抽出結果を記憶し蓄積する。具体的には、学習DB110は、抽出結果に対し訂正が行われた場合に、抽出結果として、バリューだけでなく、キーが特定された箇所、キーとバリューとの位置関係、項目に設定された抽出の条件のうちのバリューが該当する抽出の条件などの情報を記憶し蓄積する。
【0032】
〔ユーザ端末30の機能構成〕
図4は、本実施形態に係るユーザ端末30の機能構成の一例を示す図である。図4に示すユーザ端末30の各機能は、主に制御部11のCPU11aによって実現される。
図4に示すように、ユーザ端末30は、操作判定部301と、表示制御部302と、抽出候補管理部303と、通信制御部304とを備えている。
【0033】
操作判定部301は、ユーザ端末30に対し、入力デバイス等を介したユーザ操作が行われたか否かを判定する。このユーザ操作とは、例えば、非定型帳票の画像データから記載情報を抽出する項目の選択を指示する操作、項目毎に抽出の条件の設定を指示する操作、抽出結果の選択を指示する操作等である。
【0034】
表示制御部302は、表示部30Aにおける表示の態様等を制御する。
具体的には、表示制御部302は、表示部30Aに表示される抽出候補を提示する操作画面の表示態様を制御する。表示制御部302は、例えば、非定型帳票のうちの抽出候補の記載箇所を示すように、操作画面の表示態様を制御する。
【0035】
抽出候補管理部303は、抽出候補の提示に関する情報を管理する。換言すると、抽出候補管理部303は、表示制御部302が使用する情報を管理する。
抽出候補管理部303が管理する情報としては、例えば、抽出候補の記載情報と記載箇所とを対応付けた情報、抽出候補の各々に割り当てられた優先度を示す情報、抽出候補の各々の抽出の条件の達成状況の詳細などが挙げられる。
【0036】
通信制御部304は、通信部13が送信する情報を処理したり、受信した情報を処理したりする。
通信制御部304は、通信部13を介し、OCR処理サーバ10に対して項目に対応する記載情報の抽出を要求したり、抽出結果の訂正を要求したりする。
また、通信制御部304は、通信部13を介し、OCR処理サーバ10から送信された情報から、操作画面に抽出候補を提示するための情報を抽出したり、抽出結果の情報を抽出したりする。換言すると、通信制御部304は、取得した情報を処理して判断する。
【0037】
〔抽出候補を確認させる処理〕
ユーザに抽出候補を確認させたうえで抽出結果を出力する場合の処理例を説明する。
図5は、本実施形態に係るOCR処理サーバ10が抽出候補をユーザに確認させる処理の流れを示したフロー図である。
図5では、OCR処理サーバ10にて非定型帳票の画像データから抽出された抽出候補を、ユーザ端末30を介してユーザに確認させる場合を例としている。
【0038】
まず、OCR処理サーバ10の非定型帳票取得部101が、非定型帳票の画像データを取得する(S1)。
なお、非定型帳票取得部101が画像データを取得した非定型帳票は、ユーザ端末30の表示部30Aにて、プレビュー画像が表示される。また、ユーザ端末30にて、非定型帳票取得部101が取得した非定型帳票の画像データのOCR処理について、抽出対象の項目および抽出の条件を設定する指示をユーザから受け付ける。
【0039】
ここで、非定型帳票の画像データのOCR処理について、抽出対象の項目および抽出の条件の設定をユーザから受け付ける画面について説明する。
図6は、本実施形態に係るユーザ端末30の表示部30Aの表示の一例を示す図であり、OCR処理に係る抽出対象の項目および抽出の条件の設定を受け付ける設定画面の一例を示している。
【0040】
ユーザ端末30の表示部30Aは、OCR処理サーバ10のOCR処理について指示するユーザの操作を受け付ける操作画面300を表示する。
操作画面300には、非定型帳票のプレビュー画像311を表示するプレビュー画面310と、OCR処理の抽出対象の項目の設定を受け付ける設定画面320とが含まれる。
図6に示す表示例では、設定画面320に、項目設定画像321と、条件設定画像322とが表示されている。
【0041】
項目設定画像321は、抽出対象の項目名の設定をユーザから受け付ける画像である。
図6に示す表示例では、項目設定画像321にて、項目名「申請日」、「氏名:ふりがな」、「氏名」、「生年月日」、「電話番号」、「受付日」が、抽出対象に設定されている。
なお、抽出対象の項目名は、予め設定された項目名の候補の中から選択されてもよいし、テキスト情報が入力されてもよい。また、項目名に対して、上述したように、同様の意味をもつが表示が異なるキーも抽出するように設定を受け付けてもよい。
【0042】
条件設定画像322は、項目に対する抽出の条件の設定をユーザから受け付ける画像である。例えば、条件設定画像322がユーザにより選択された場合、項目に対する抽出の条件の詳細を受け付ける画面を表示し、キーに対応するバリューの種別やフォーマットを限定する設定を受け付けるようにする。
【0043】
次に、OCR処理サーバ10の要求情報取得部102が、ユーザ端末30から、非定型帳票取得部101が取得した非定型帳票の画像データのOCR処理について、抽出対象の項目および抽出の条件を取得する(S2)。換言すると、要求情報取得部102は、ユーザ端末30から、OCR処理の抽出対象の項目および抽出の条件を示す要求情報を取得する。
そして、OCR処理サーバ10のOCR処理部103が、要求情報取得部102が取得した要求情報に基づいて、非定型帳票の画像データに対してキーバリュー抽出を実行する(S3)。
【0044】
具体的には、例えば、ユーザ端末30から、項目名「申請日」をキーとし、毎月15日以降の日付または西暦表記のテキストデータをバリューとして抽出することを要求される。この場合、OCR処理部103は、項目名「申請日」の文字が特定された箇所の周辺の記載情報や、15日以降の日付を示す記載情報、西暦表記の記載情報などをバリューとし、抽出候補を抽出する。
【0045】
次に、OCR処理サーバ10の優先度付与部104が、OCR処理部103のキーバリュー抽出の結果である抽出候補に対し、優先度を付与する(S4)。
具体的には、優先度付与部104は、ユーザ端末30から送信された要求情報の達成状況に基づき、抽出候補に対して優先度を割り当てる。
【0046】
ここで、優先度付与部104が抽出候補に対して付与する優先度について説明する。
図7は、抽出候補に対する優先度の割り当ての一例を示した図である。
図7では、項目名「申請日」をキーとし、項目に設定された抽出の条件として、毎月15日以降の日付または西暦表記の記載情報をバリューとすることを要求されている場合を例としている。
【0047】
図7に示す例では、抽出候補の各々について、「優先度」と、バリューとして抽出された「文字列」と、非定型帳票での記載箇所を示す「座標」と、要求情報を満たすか否かを示す「条件達成状況」とが対応付けられている。
「条件達成状況」の「キー」には、バリューの記載箇所がキーの文字が特定された箇所の周辺である場合には「○」、バリューの記載箇所がキーの文字が特定された箇所の周辺ではない場合には「×」が反映される。また、「表記形式」にて西暦表記であるか否かが反映され、「日付期間」にて毎月15日以降の日付であるか否かが反映される。
この処理例の場合、要求情報に含まれる条件をより多く達成している抽出候補に対して、達成している条件の少ない抽出候補よりも優先されるように優先度を割り当てている。また、バリューの記載箇所がキーの文字が特定された箇所の周辺である抽出候補に対して、バリューの記載箇所がキーの文字が特定された箇所の周辺ではない抽出候補よりも優先されるように優先度を割り当てている。
【0048】
例えば、文字列「2021年11月8日」は、要求情報に含まれる条件を最も多く達成しており、キーの文字が特定された箇所の周辺に記載されているため、他の抽出候補よりも優先されるように、「優先度 1」が割り当てられている。
その他、例えば、文字列「1987年7月19日」は、文字列「2021年11月8日」と同じ数の条件を達成しているが、キーの文字が特定された箇所の周辺に記載されていない。このため、文字列「1987年7月19日」は、文字列「2021年11月8日」の次に優先されるように、「優先度 2」が割り当てられている。
【0049】
また、その他、例えば、文字列「7-31」、「04992-1-6232 2021/5/15」は、要求情報に含まれる条件を達成していないため、文字列「2021年11月8日」、「1987年7月19日」よりも達成している条件の数が少ない。そのため、文字列「7-31」、「04992-1-6232 2021/5/15」には、ユーザが要求情報として設定していない情報から、それぞれ「優先度 3」、「優先度 4」が割り当てられている。
【0050】
次に、OCR処理サーバ10の抽出候補出力部105が、ユーザ端末30に対し、抽出候補に関する情報を出力する(S5)。
なお、抽出候補出力部105が出力した抽出候補に関する情報は、ユーザ端末30の表示部30Aにて、ユーザに確認させるために表示される。また、ユーザ端末30にて、抽出候補を提示したうえで、抽出結果を確定する指示をユーザから受け付ける。
【0051】
ここで、抽出候補に関する情報をユーザに確認させるための表示について説明する。
図8は、本実施形態に係る抽出候補の表示の一例を示す図であり、抽出候補に関する情報の詳細をユーザに提示するための詳細画面の一例を示している。
図8では、図7に示す抽出候補が抽出された場合を例としている。
【0052】
図8に示す表示例では、操作画面300には、非定型帳票のプレビュー画像311を表示するプレビュー画面310に加え、抽出候補に関する情報の詳細をユーザに提示するための詳細画面330が含まれる。プレビュー画像311には、強調画像312が表示されている。また、詳細画面330には、部分画像331と、出力欄332と、確定ボタン画像333とが表示されている。
【0053】
強調画像312は、抽出候補の記載箇所を強調する画像である。図8に示す表示例では、非定型帳票のプレビュー画像311のうちの、一の抽出候補を抽出した領域を囲むように、強調画像312が付されている。
なお、強調画像312は、抽出候補の記載箇所を囲む画像に限らず、矢印等の画像や、ポップアップ等のテキストメッセージを含む画像であってもよい。
【0054】
図8に示す表示例では、詳細画面330に、抽出候補のうちのユーザが要求した条件を最も多く達成している抽出候補であって、「優先度 1」が割り当てられた抽出候補に関する情報が表示されている。
詳細画面330は、抽出候補に関する情報の詳細をユーザに提示し、OCR処理部103による抽出結果を確定する指示をユーザから受け付ける画面である。
なお、プレビュー画像311上の強調画像312を選択する操作などに基づいて、詳細画面330に情報が表示される抽出候補を変更する指示をユーザから受け付けてもよい。
【0055】
部分画像331は、非定型帳票の画像のうちの抽出候補の記載箇所の部分の画像である。
出力欄332には、バリューとして出力されるテキストデータが表示される。出力欄332は、ユーザから入力を受け付け、テキストデータを訂正してもよい。
確定ボタン画像333は、詳細画面330に表示されている抽出候補を、OCR処理部103による抽出結果として確定する指示をユーザから受け付けるボタン画像である。確定ボタン画像333がユーザにより選択された場合、ユーザ端末30は、OCR処理サーバ10に対し、抽出結果の確定を要求する。
【0056】
この処理例では、「優先度 1」が割り当てられた抽出候補が詳細画面330に表示されている状態にて、確定ボタン画像333がユーザにより選択された場合を想定する。
OCR処理サーバ10の要求情報取得部102が、ユーザ端末30から、優先度1の抽出候補を抽出結果とする要求を取得する(S6)。換言すると、要求情報取得部102が、ユーザ端末30から、優先度1の抽出候補を抽出結果とする要求を示す要求情報を取得する。
そして、OCR処理サーバ10の抽出結果出力部107が、要求情報取得部102が取得した要求情報に基づいて、抽出結果として優先度1の抽出候補を出力し(S7)、処理を終了する。
【0057】
ところで、本実施形態における抽出候補の表示は、図8に示した、優先度に基づいて抽出候補に関する情報を表示したり、抽出候補の記載箇所を一律に表示したりする構成に限られない。以下では、抽出候補の表示の他の例について説明する。
【0058】
図9は、本実施形態に係る抽出候補の表示の他の例を示す図であり、抽出候補毎に割り当てられた優先度を表示した場合の一例を示している。
図9では、抽出候補毎に割り当てられた優先度そのものを、非定型帳票のプレビュー画像311上に反映する場合を例としている。
【0059】
図9に示す表示例では、抽出候補の記載箇所を強調する強調画像312に加えて、抽出候補に割り当てられた優先度をバッジ形式の小型のマークでユーザに通知するバッジ画像313が表示されている。
バッジ画像313は、抽出候補の記載箇所に関連付けて表示されている。これにより、プレビュー画像311上の記載箇所から抽出候補を選択するユーザの作業性を向上させることを図る。
なお、バッジ画像313は、プレビュー画像311上に表示する構成に限られない。バッジ画像313を、詳細画面330にも表示させてもよい。これにより、詳細画面330にて、優先度を参照したうえで抽出候補に関する情報をユーザに確認させることを図る。
【0060】
バッジ画像313は、抽出候補毎に割り当てられた優先度を、ユーザに知らせるための画像である。換言すると、バッジ画像313は、優先度そのものをユーザに知らせるための画像である。
また、バッジ画像313は、図9に示した数字を用いた表示に限られず、絵記号を用いて表示されてもよい。
【0061】
次に、抽出候補毎に割り当てられた優先度の理由を、非定型帳票のプレビュー画像311上に反映した抽出候補の表示について説明する。
図10は、本実施形態に係る抽出候補の表示の他の例を示す図であり、優先度の理由を表示した場合の一例を示している。
【0062】
図10に示す表示例では、抽出候補の記載箇所を強調する強調画像312に加えて、抽出候補に割り当てられた優先度の理由について、ユーザが参照する参照画像314が表示される。
参照画像314は、抽出候補の記載箇所に関連付けて表示されている。また、参照画像314を、詳細画面330にも表示させてもよい。
【0063】
参照画像314は、抽出候補毎に割り当てられた優先度の理由を、ユーザに知らせるための画像である。換言すると、参照画像314は、優先度の詳細をユーザに知らせるための画像である。
参照画像314は、図10に示した抽出候補が達成していない条件の提示に限られず、抽出候補が達成している条件が提示されてもよい。また、参照画像314は、「優先度1:日付期間が異なります」のように条件の達成状況の詳細を提示する態様に限られず、「優先度1:条件のうち1つが未達成です」のように条件の達成状況の概要を提示してもよい。
なお、参照画像314は、テキストメッセージを含むポップアップ等の画像に限られず、絵記号を用いて表示されてもよい。
【0064】
また、抽出候補の記載箇所を強調する強調画像312の表示態様を、抽出候補毎に割り当てられた優先度に応じて異ならせてもよい。
図11は、本実施形態に係る抽出候補の表示の他の例を示す図であり、優先度に応じて強調画像312の表示態様を異ならせた場合の一例を示している。
【0065】
図11に示す表示例では、強調画像312が示す記載箇所に対応する抽出候補の優先度に応じて、強調画像312を表示している。
強調画像312の表示態様を、優先度1の抽出候補と他の抽出候補との間で異ならせる。具体的には、複数の抽出候補のうちの、抽出の条件を最も達成している候補と他の候補との間で、抽出候補の記載箇所を示す強調画像312の表示態様を異ならせる。
【0066】
図11に示す表示例では、優先度1の抽出候補に対応する強調画像312は実線で表示され、他の抽出候補に対応する強調画像312は破線で表示されている。これに限られず、例えば、強調画像312を、優先度1の抽出候補と他の抽出候補との間で、点滅と点灯、赤色と青色のように表示態様を異ならせてもよいし、画像の形状を異ならせてもよい。
また、強調画像312の表示態様を、優先度1の抽出候補と他の抽出候補とで分けるのではなく、各優先度に合わせて異ならせてもよい。
【0067】
その他、特定の条件を満たす抽出候補に対して、警告を表示してもよい。
図12は、本実施形態に係る抽出候補の表示の他の例を示す図であり、抽出の条件の達成状況に応じて警告を表示した場合の一例を示している。
【0068】
図12に示す表示例では、抽出候補の記載箇所を強調する強調画像312に加えて、特定の条件を満たす抽出候補についてユーザに警告する警告画像315が表示されている。
警告画像315は、抽出候補の記載箇所に関連付けて表示されている。また、警告画像315を、詳細画面330にも表示させてもよい。
【0069】
警告画像315は、特定の条件を満たす抽出候補を、ユーザに知らせるため画像である。具体的には、警告画像315は、達成している条件の数が閾値よりも少ない抽出候補や、必須の条件を達成していない抽出候補を、ユーザに知らせるため画像である。
なお、警告画像315は、絵記号に限らず、ポップアップ等のテキストメッセージを含む画像であってもよい。
【0070】
上述した例では、本実施形態に係る抽出候補の表示にあたって、強調画像312に加えて、バッジ画像313、参照画像314、警告画像315のうちの何れかが表示される構成だが、これに限られない。強調画像312に加えて、バッジ画像313、参照画像314、警告画像315のうちの何れか、または全てを組み合わせて表示されるようにしてもよい。
【0071】
図13は、本実施形態に係る抽出候補の表示の他の例を示す図であり、(A)は抽出候補が特定の条件を満たす状態、(B)は抽出候補が特定の条件を解消した状態を示している。
図13では、詳細画面330に優先度4の抽出候補に関する情報が表示される場合を例としている。
【0072】
図13(A)の表示例では、抽出の条件の全てを満たしていない抽出候補に関する情報を表示する詳細画面330に、参照画像314と、警告画像315とが表示されている。
詳細画面330に表示されている項目「申請日」に対応する抽出候補は、数字ではあるが、項目に設定されている抽出の条件の「西暦表記の記載情報をバリューとすること」を満たしていない。
【0073】
図13(A)に示す抽出候補のテキストデータを、ユーザが出力欄332にて、図13(B)のように訂正した場合を想定する。
図13(B)の表示例では、詳細画面330に表示されている項目「申請日」に対応する抽出候補は、項目に設定されている抽出の条件の「西暦表記の記載情報をバリューとすること」を満たしている。この場合、達成していない条件を示す参照画像314と、特定の条件を満たす場合に表示される警告画像315とが非表示となる。
【0074】
また、抽出候補の表示にあたって、詳細画面330にて一の抽出候補のみを示したが、これに限られず、詳細画面330にて複数の抽出候補について示してもよい。
図14は、本実施形態に係る抽出候補の表示の他の例を示す図であり、複数の抽出候補に関する情報をユーザに提示するための詳細画面330を表示した場合の一例を示している。
図14に示す表示例では、操作画面300上に、画面上の位置や画像等を指し示すカーソル200が表示されている。カーソル200は、入力部を介して入力されるユーザの操作により移動し、ユーザが指定する画面上の位置や画像等を指し示すように表示されている。
【0075】
図14に示す表示例では、詳細画面330には、部分画像331と、出力欄332と、確定ボタン画像333とが、抽出候補毎に表示されている。
例えば、詳細画面330において、複数の抽出候補は、割り当てられた優先度に応じた順序で表示されるようにする。
その他、例えば、詳細画面330において、複数の抽出候補は、プレビュー画像311上の記載箇所に応じた順序で表示されてもよい。
【0076】
また、図14に示す表示例では、詳細画面330のうちの一の抽出候補に関する情報を表示する領域に、カーソル200が位置する状態となると、一の抽出候補を抽出した領域を示す強調画像312が表示される。換言すると、一の抽出候補に関する情報を表示する領域がユーザにより指定されると、一の抽出候補を抽出した領域を示す強調画像312が表示される。
これにより、抽出候補に関する表示が全て表示されている場合に比べ、抽出候補に関する表示によってプレビュー画像311の表示が煩雑になることを抑制することを図る。
【0077】
さらに、抽出候補の表示にあたって、詳細画面330に、一の抽出候補のみを示すか、複数の抽出候補を示すかをユーザが指示するようにしてもよい。
図15は、本実施形態に係る抽出候補の表示の他の例を示す図であり、複数の抽出候補に関する情報を詳細画面330に表示させる指示をユーザから受け付ける場合の一例を示している。
【0078】
図15に示す表示例では、詳細画面330には、部分画像331と、出力欄332と、確定ボタン画像333とに加え、候補ボタン画像334が表示されている。
候補ボタン画像334は、複数の抽出候補を詳細画面330に表示させる指示をユーザから受け付ける画像である。候補ボタン画像334がユーザにより選択された場合、図14に示すように、複数の抽出候補を詳細画面330に表示する。
具体的には、例えば、優先度1の抽出候補に関する情報が表示されている詳細画面330において、候補ボタン画像334がユーザにより選択された場合、優先度2以降の抽出候補に関する情報も詳細画面330に表示されるようにする。
【0079】
〔抽出候補を訂正する処理〕
ユーザが抽出候補の訂正を要求する場合の処理例を説明する。
図16は、本実施形態に係るユーザ端末30が抽出候補の訂正を要求する処理の流れを示したフロー図である。
図16では、ユーザ端末30にて非定型帳票の画像データから抽出された優先度1の抽出候補をそのまま抽出結果とはせず、ユーザが訂正を指示する場合を例としている。
【0080】
まず、ユーザ端末30の表示制御部302が、優先度1の抽出候補を表示部30Aに表示する(S11)。
具体的には、表示制御部302が、優先度1の抽出候補について、抽出候補のバリューに係るテキストデータと記載箇所とを、表示部30Aに表示する。
【0081】
そして、ユーザ端末30の操作判定部301が、優先度1の抽出候補のテキストデータが訂正されたか否かを判定する(S12)。換言すると、優先度1の抽出候補のテキストデータが訂正を指示するユーザ操作が行われたか否かを判定する。
具体的には、操作判定部301は、図8に示す詳細画面330の出力欄332にてユーザから入力を受け付けた場合、優先度1の抽出候補のテキストデータが訂正を指示するユーザ操作が行われたと判定する。
【0082】
優先度1の抽出候補のテキストデータが訂正された場合(S12でYES)、ユーザ端末30の操作判定部301が、訂正した優先度1の抽出候補を、抽出結果として確定を指示するユーザ操作を受け付けたと判定する(S13)。
具体的には、操作判定部301は、図8に示す詳細画面330の確定ボタン画像333がユーザに選択された場合、抽出結果として、訂正した優先度1の抽出候補とすることを確定させると判定する。
【0083】
ユーザ端末30の通信制御部304が、OCR処理サーバ10に対し、優先度1の抽出候補のテキストデータを、訂正されたテキストデータに置き換えることを要求し(S14)、処理を終了する。換言すると、通信制御部304は、OCR処理サーバ10に対し、テキストデータが訂正された優先度1の抽出候補を、抽出結果とすることを要求する。
【0084】
S12にて、優先度1の抽出候補のテキストデータが訂正されていない場合(S12でNO)、ユーザ端末30の操作判定部301が、優先度1の抽出候補とは異なる他の抽出候補の記載箇所の選択を指示するユーザ操作を受け付けたと判定する(S15)。
具体的には、操作判定部301は、図8に示す非定型帳票のプレビュー画像311上で他の抽出候補の記載箇所がユーザに選択された場合、優先度1の抽出候補として、この他の抽出候補が選択されたと判定する。
【0085】
次に、ユーザ端末30の操作判定部301が、選択された他の抽出候補を、抽出結果として確定を指示するユーザ操作を受け付けたと判定する(S16)。
ユーザ端末30の通信制御部304が、OCR処理サーバ10に対し、優先度1の抽出候補を、選択された他の抽出候補に置き換えることを要求し(S17)、処理を終了する。換言すると、通信制御部304は、OCR処理サーバ10に対し、選択された他の抽出候補を、優先度1に変更し、かつ、抽出結果とすることを要求する。
【0086】
〔抽出結果を学習する処理〕
抽出候補を提示して確定された抽出結果を学習する場合の処理例を説明する。
図17は、本実施形態に係るOCR処理サーバ10が抽出結果を学習する処理の流れを示したフロー図である。
図17では、優先度1の抽出候補に対して訂正が行われたうえで抽出結果が確定した場合を例としている。
【0087】
まず、OCR処理サーバ10の要求情報取得部102が、ユーザ端末30から、非定型帳票取得部101が取得した非定型帳票の画像データのOCR処理について、抽出結果を確定させる要求情報を取得する(S21)。
抽出候補出力部105が優先度1として出力した抽出候補により抽出結果を確定させる要求情報を取得した場合には、抽出結果出力部107が、優先度1の抽出候補をOCR処理部103による抽出結果として出力する。一方で、抽出結果訂正部106が訂正した抽出候補により抽出結果を確定させる要求情報を取得した場合には、抽出結果出力部107が、訂正された抽出候補をOCR処理部103による抽出結果として出力する。
【0088】
そして、OCR処理サーバ10の抽出結果出力部107が、OCR処理部103による抽出結果として出力した内容について、優先度1の抽出候補の記載箇所から変更があるか否かを特定する(S22)。
優先度1の抽出候補の記載箇所から変更がある場合としては、例えば、優先度1の抽出候補の記載情報はそのままの状態にて抽出候補をキーバリュー抽出する領域が変更された場合が挙げられる。その他、優先度1の抽出候補の記載箇所から変更がある場合としては、例えば、優先度1の抽出候補とは異なる他の抽出候補が選択された場合や、抽出候補以外を抽出結果とした場合などが挙げられる。
【0089】
OCR処理部103による抽出結果として出力した内容について、優先度1の抽出候補の記載箇所から変更がある場合(S22でYES)、OCR処理サーバ10の抽出結果出力部107が、この変更の内容を、非定型帳票の読取位置の学習データとして登録する(S23)。換言すると、抽出結果出力部107が、変更後の記載箇所を、項目に対応する抽出候補をキーバリュー抽出する領域の学習データとして学習DB110に格納する。
一方、OCR処理部103による抽出結果として出力した内容について、優先度1の抽出候補の記載箇所から変更がない場合(S22でNO)、抽出候補をキーバリュー抽出する領域の学習データは登録されない。
【0090】
次に、OCR処理サーバ10の抽出結果出力部107が、OCR処理部103による抽出結果として出力した内容について、抽出候補の記載情報から変更があるか否かを特定する(S24)。
抽出候補の記載情報から変更がある場合としては、例えば、出力欄332(図8参照)にて、ユーザから入力を受け付け、テキストデータが修正された場合などが挙げられる。
【0091】
OCR処理部103による抽出結果として出力した内容について、抽出候補の記載情報から変更がある場合(S24でYES)、OCR処理サーバ10の抽出結果出力部107が、この変更の内容を、文字認識の学習データとして登録し(S25)、処理を終了する。換言すると、抽出結果出力部107が、変更後の記載情報を、非定型帳票の文字認識の学習データとして学習DB110に格納して、処理を終了する。
一方、OCR処理部103による抽出結果として出力した内容について、抽出候補の記載情報から変更がない場合(S24でNO)、文字認識の学習データは登録されず、処理を終了する。
【0092】
これにより、優先度1の抽出候補に対して訂正が行われた場合に、キーバリュー抽出の精度を向上させることを図る。また、優先度1の抽出候補に対して訂正が行われた場合に、文字認識処理の精度を向上させることを図る。
【0093】
また、上記では説明を省略したが、本実施形態では、訂正されたテキストデータや選択された他の抽出候補が、抽出の条件の全ては満たしていない場合であっても、訂正された抽出候補をOCR処理部103による抽出結果として出力してもよい。
例えば、項目に設定された抽出の条件のうちの、訂正された抽出候補に一致する抽出の条件に対して重みを加算するように、学習データを登録する。これにより、項目と、抽出の条件と、抽出の条件の重みとに基づき、新たな非定型帳票から新たな抽出候補が取得されるようにしてもよい。
【0094】
〔抽出候補が存在しない場合の処理〕
次に、ユーザ端末30にて抽出候補が提示されない場合の処理例を説明する。
図18は、実施形態に係るユーザ端末30が抽出結果を入力する処理の流れを示したフロー図である。
図18では、非定型帳票の画像データから項目に対する抽出候補が抽出されなかった場合を例としている。
【0095】
まず、ユーザ端末30の表示制御部302が、表示部30Aを介して、項目に対応する抽出候補が存在しない旨をユーザに通知する(S31)。
具体的には、表示制御部302が、例えば、抽出候補が存在しない旨のテキストメッセージを表示部30Aに表示する。なお、項目に対応する抽出候補が存在しない旨の通知は、画像などの表示に限られず、音や光などを用いてもよい。
【0096】
ここで、項目に対応する抽出候補が存在しない旨をユーザに通知するための表示について説明する。
図19は、本実施形態に係るユーザ端末30の表示部30Aの表示の他の例を示す図であり、項目に対応する抽出候補が存在しない旨をユーザに通知する通知画像の一例を示している。
図19では、項目「受付日」についてキーバリュー抽出を実行したが、抽出候補が取得されなかった場合を例としている。
【0097】
図19に示す表示例では、抽出候補の記載箇所を強調する強調画像312(図8参照)などは表示されず、項目に対応する抽出候補が存在しない旨をユーザに通知する通知画像350が表示されている。
通知画像350は、ユーザが選択した項目に対応する抽出候補が存在しない旨を、ユーザに知らせるための画像である。具体的には、通知画像350は、ユーザが選択した項目に対応する抽出候補が存在しない旨やその理由を、テキストメッセージを用いて通知する画像である。
また、通知画像350は、図19に示すように、ユーザの操作を促すテキストメッセージを含んでいてもよい。
【0098】
図19に示す表示例では、ユーザが選択した項目に対応する抽出候補が存在しないため、部分画像331の領域に、テキストメッセージ「帳票上から見つかりませんでした」が表示されている。また、バリューに相当するテキストデータが存在しないため、出力欄332は空欄となっている。
通知画像350は、詳細画面330に関連付けて表示されている。また、通知画像350は、図19に示すように、絵記号を組み合わせて表示されている。
なお、通知画像350は、例えば、操作画面300の中央寄りに表示されてもよいし、絵記号のみで表示されてもよい。
【0099】
そして、ユーザ端末30の操作判定部301が、抽出結果の確定を指示するユーザ操作を受け付けたと判定する(S32)。
具体的には、操作判定部301は、図19に示す詳細画面330の確定ボタン画像333がユーザに選択された場合、抽出結果の確定を指示するユーザ操作を受け付けたと判定する。
ユーザ端末30の表示制御部302が、抽出結果の確定を指示するユーザ操作に基づき、抽出結果をユーザに確認させるための確認画面370(後述)を表示部30Aに表示する(S33)。
【0100】
ここで、抽出結果をユーザに確認させるための表示について説明する。
図20は、本実施形態に係る確認画面370の一例を示す図である。
図20では、キーバリュー抽出の対象項目が「受付日」であり、抽出の条件として「日付であること」と「西暦表記であること」とが設定されている場合を例としている。
【0101】
図19に示す表示例にて、ユーザが、通知画像350のテキストメッセージに従って、確定ボタン画像333を選択した場合、図20に示すように、抽出結果をユーザに確認させるための確認画面370が表示される。
確認画面370は、項目に対応するバリューを空欄で抽出結果を確定させる指示や、バリューを補充して抽出結果を確定する指示を、ユーザから受け付ける。
確認画面370には、入力欄371と、キャンセルボタン画像372と、検証ボタン画像373と、保存ボタン画像374とが表示されている。
【0102】
入力欄371には、ユーザに対してバリューの入力を促すテキストメッセージが表示されている。また、入力欄371には、キーバリュー抽出の対象項目に設定されている抽出の条件が表示されている。入力欄371は、ユーザから入力を受け付け、バリューのテキストデータを補充してもよい。
キャンセルボタン画像372は、抽出結果の確定のキャンセルを指示するユーザ操作を受け付けるボタン画像である。キャンセルボタン画像372がユーザにより選択された場合、確認画面370は非表示となる。
【0103】
検証ボタン画像373は、非定型帳票の画像データに対し、入力欄371に入力されたテキストデータの記載箇所の検証を指示するユーザ操作を受け付けるボタン画像である。換言すると、検証ボタン画像373は、バリューの記載情報に基づいて、キーが特定され得る箇所の周辺である記載箇所を検出する指示をユーザから受け付けるボタン画像である。
保存ボタン画像374は、項目に対応するバリューを空欄のまま保存させる指示をユーザから受け付けるボタン画像である。
【0104】
そして、ユーザ端末30の操作判定部301が、記載箇所を検証するか否かを判定する(S34)。換言すると、操作判定部301は、記載箇所の検証を指示するユーザ操作が行われたか否かを判定する。
具体的には、操作判定部301は、図20に示す確認画面370にて、入力欄371にテキストデータが入力された状態にて検証ボタン画像373がユーザに選択された場合、記載箇所を検証すると判定する。
【0105】
記載箇所を検証する場合(S34でYES)、ユーザ端末30の表示制御部302が、記載箇所を検証した結果を表示部30Aに表示する(S35)。
具体的には、表示制御部302が、図19に示した部分画像331の領域に、非定型帳票の画像のうちの入力欄371に入力されたテキストデータの記載箇所として検出された部分の画像を表示する。また、出力欄332(図19参照)には、入力欄371に入力されたテキストデータが表示される。
なお、入力欄371に入力されたテキストデータの記載箇所を発見できなかった場合には、部分画像331の領域をグレーアウトしてもよいし、部分画像331の領域にテキストメッセージ「該当なし」などを表示してもよい。
【0106】
次に、ユーザ端末30の操作判定部301が、記載箇所を設定するか否かを判定する(S36)。換言すると、操作判定部301は、記載箇所の設定を指示するユーザ操作が行われたか否かを判定する。
具体的には、操作判定部301は、図19に示した部分画像331の領域に、非定型帳票の画像のうちの一部の画像が表示された状態にて確定ボタン画像333がユーザに選択された場合、記載箇所を設定すると判定する。一方で、操作判定部301は、部分画像331の領域に、非定型帳票の画像のうちの一部の画像が表示されていない状態にて確定ボタン画像333がユーザに選択された場合、記載箇所を設定しないと判定する。
図20に示す確認画面370にて、入力欄371にテキストデータが入力された状態にて検証ボタン画像373が選択された場合、記載箇所の検証を指示するユーザ操作が行われたと判定する。
【0107】
記載箇所を設定する場合(S36でYES)、ユーザ端末30の通信制御部304が、OCR処理サーバ10に対し、入力した記載情報と記載箇所とを、項目に対応する抽出結果とすることを要求し(S37)、処理を終了する。なお、検出された記載箇所が設定された場合、この記載箇所は、項目に対応する抽出候補をキーバリュー抽出する領域の学習データとして登録される。
一方で、記載箇所を設定しない場合(S36でNO)、ユーザ端末30の通信制御部304が、OCR処理サーバ10に対し、入力した記載情報のみを、項目に対応する抽出結果とすることを要求し(S38)、処理を終了する。
【0108】
また、この処理例では、記載箇所を検証しない場合において、項目に対応するバリューを空欄のまま保存させる指示をユーザから受け付ける場合を想定している。
S34にて、記載箇所を検証しない場合(S34でNO)、ユーザ端末30の操作判定部301が、保存を指示するユーザ操作を受け付けたと判定する(S39)。
具体的には、操作判定部301は、図20に示す確認画面370にて、入力欄371が空欄の状態にて保存ボタン画像374がユーザに選択された場合、項目に対応するバリューが空欄の状態で保存する指示をユーザから受け付けたと判定する。
そして、ユーザ端末30の通信制御部304が、OCR処理サーバ10に対し、記載情報と記載箇所とが存在しない抽出結果とすることを要求し(S40)、処理を終了する。
【0109】
<変形例>
上述した例では、操作画面300に、ユーザが選択した項目のうちの一の項目に対応する抽出候補が表示されているが、この限りではない。例えば、ユーザが一の項目に対応する抽出候補を訂正した場合に、一の項目に関連する関連項目に対応する抽出候補が表示されてもよい。
図21は、本実施形態に係る抽出候補の表示の他の例を示す図であり、訂正された抽出候補の項目の関連項目に対応する抽出候補を表示した場合の一例を示している。
【0110】
図21の表示例では、項目「申請日」の抽出候補に対して訂正が行われた状態にて、項目「申請日」の関連項目として、項目「生年月日」が特定されている場合を示している。
この「関連項目」とは、例えば、項目毎に設定される抽出の条件が共通する項目や、項目の分類が共通する項目である。具体的には、訂正した項目「申請日」と、関連項目「生年月日」とは、日付を示すものであり、キーに対応するバリューの種別が共通している。
また、図21の表示例では、項目「申請日」の記載箇所を示す強調画像312と、項目「生年月日」の記載箇所を示す強調画像312との間で、表示態様を異ならせている。
【0111】
各実施形態にてプロセッサの一例としてのCPU11aによって実行されるプログラムは、磁気記録媒体(磁気テープ、磁気ディスクなど)、光記録媒体(光ディスクなど)、光磁気記録媒体、半導体メモリなどのコンピュータが読取可能な記録媒体に記憶した状態で、制御部11へ提供される。また、CPU11aによって実行されるプログラムは、インターネットなどの通信手段を用いてOCR処理サーバ10、ユーザ端末30の各装置にダウンロードしてもよい。
【0112】
なお、本実施形態において、プロセッサとは、広義的なプロセッサを指し、汎用的なプロセッサ(例えばCPU等)や、専用のプロセッサ(例えばGPU: Graphics Processing Unit、ASIC: Application Specific Integrated Circuit、FPGA: Field Programmable Gate Array、プログラマブル論理デバイス、等)を含むものである。
また、プロセッサの動作は、1つのプロセッサによって成すのみでなく、物理的に離れた位置に存在する複数のプロセッサが協働して成すものであってもよい。また、プロセッサの各動作の順序は、本実施形態において記載した順序のみに限定されるものではなく、変更してもよい。
【0113】
各実施形態における情報処理システムが行う処理は、例えば、アプリケーションソフトウェア等のプログラムとして用意される。このプログラムは、通信手段により提供することはもちろん、CD-ROM等の記録媒体に格納して提供することも可能である。
【0114】
(付記)
(((1)))
1または複数のプロセッサを備える情報処理システムであり、
前記1または複数のプロセッサは、
非定型帳票に記載された情報である記載情報から、当該非定型帳票の項目に対応する当該記載情報として抽出する候補である抽出候補を取得し、
前記非定型帳票のうちの前記抽出候補が記載された記載箇所を表示部に表示する、
情報処理システム。
(((2)))
前記1または複数のプロセッサは、
前記非定型帳票の前記記載情報から、抽出したい当該記載情報に対する前記項目の記載内容に基づき、前記抽出候補を取得する、
(((1)))に記載の情報処理システム。
(((3)))
前記1または複数のプロセッサは、
前記非定型帳票の前記記載情報から、前記項目と、当該項目に設定された抽出の条件とに基づき、前記抽出候補を取得し、
前記抽出の条件の達成状況に基づき、前記抽出候補の前記記載箇所を前記表示部に表示する、
(((1)))又は(((2)))に記載の情報処理システム。
(((4)))
前記1または複数のプロセッサは、
前記抽出候補の前記記載箇所とともに、前記達成状況に基づき、当該抽出候補に対して割り当てられた優先度を前記表示部に表示する、
(((3)))に記載の情報処理システム。
(((5)))
前記1または複数のプロセッサは、
前記抽出候補の前記記載箇所とともに、前記達成状況に基づき、当該抽出候補に割り当てられた優先度の理由を前記表示部に表示する、
(((3)))に記載の情報処理システム。
(((6)))
前記1または複数のプロセッサは、
前記非定型帳票の前記記載情報から、前記項目と、当該項目に設定された前記抽出の条件とに基づき、複数の前記抽出候補を取得し、
複数の前記抽出候補のうちの、前記抽出の条件を最も達成している候補と他の候補との間で、当該抽出候補の前記記載箇所の表示態様を異ならせる、
(((3)))に記載の情報処理システム。
(((7)))
前記1または複数のプロセッサは、
前記非定型帳票の画像に、前記抽出候補の前記記載箇所を表示する、
(((1)))乃至(((6)))の何れかに記載の情報処理システム。
(((8)))
前記1または複数のプロセッサは、
前記非定型帳票の前記記載情報から、複数の前記抽出候補を取得し、
複数の前記抽出候補のうちの、ユーザが指定した当該抽出候補の前記記載箇所を、前記非定型帳票の画像に表示する、
(((7)))に記載の情報処理システム。
(((9)))
前記1または複数のプロセッサは、
ユーザによる前記抽出候補の選択を受け付けた場合、選択された当該抽出候補を、前記項目に対応する前記記載情報を抽出した結果とする、
(((1)))乃至(((8)))の何れかに記載の情報処理システム。
(((10)))
前記1または複数のプロセッサは、
選択された前記抽出候補の前記記載箇所を、前記項目に対応する前記記載情報の当該記載箇所として学習する、
(((9)))に記載の情報処理システム。
(((11)))
前記1または複数のプロセッサは、
ユーザによる前記項目に対応する前記記載情報の入力を受け付けた場合、入力された当該記載情報を、当該項目に対応する当該記載情報を抽出した結果とし、
前記非定型帳票の画像のうちの、入力された前記記載情報が記載された前記記載箇所を検出する、
(((1)))乃至(((8)))の何れかに記載の情報処理システム。
(((12)))
前記1または複数のプロセッサは、
検出された前記記載箇所を、前記項目に対応する前記記載情報の当該記載箇所として学習する、
(((11)))記載の情報処理システム。
(((13)))
前記1または複数のプロセッサは、
前記項目と、当該項目に設定された抽出の条件とに基づき、前記抽出候補を取得し、
ユーザによる訂正の指示に基づき、前記抽出候補を訂正し、
訂正された前記抽出候補が前記抽出の条件の全ては満たしていない場合であっても、訂正された当該抽出候補を、前記項目に対応する前記記載情報を抽出した結果とする、
(((1)))乃至(((8)))の何れかに記載の情報処理システム。
(((14)))
前記1または複数のプロセッサは、
訂正された前記抽出候補が前記抽出の条件の全ては満たしていないことをユーザに知らせるための表示を前記表示部に行う、
(((13)))に記載の情報処理システム。
(((15)))
前記1または複数のプロセッサは、
前記抽出の条件のうちの、訂正された前記抽出候補に一致する当該抽出の条件に対して重みを加算し、
前記項目と、前記抽出の条件と、当該抽出の条件の重みとに基づき、新たな非定型帳票から新たな抽出候補を取得する、
(((13)))に記載の情報処理システム。
(((16)))
コンピュータに、
非定型帳票に記載された情報である記載情報から、当該非定型帳票の項目に対応する当該記載情報として抽出する候補である抽出候補を取得する機能と、
前記非定型帳票のうちの前記抽出候補が記載された記載箇所を表示部に表示させる機能と、
を実現させるためのプログラム。
【符号の説明】
【0115】
1…情報処理システム、10…OCR処理サーバ、11…制御部、12…2次記憶部、13…通信部、30…ユーザ端末、300…操作画面、311…プレビュー画像、312…強調画像、313…バッジ画像、314…参照画像、315…警告画像、320…設定画面、330…詳細画面、331…部分画像、332…出力欄、333…確定ボタン画像、350…通知画像、370…確認画面
図1
図2
図3
図4
図5
図6
図7
図8
図9
図10
図11
図12
図13
図14
図15
図16
図17
図18
図19
図20
図21