IP Force 特許公報掲載プロジェクト 2022.1.31 β版

知財求人 - 知財ポータルサイト「IP Force」

▶ 富士ゼロックス株式会社の特許一覧

特開2024-120340情報処理装置及び情報処理プログラム
<>
  • 特開-情報処理装置及び情報処理プログラム 図1
  • 特開-情報処理装置及び情報処理プログラム 図2
  • 特開-情報処理装置及び情報処理プログラム 図3
  • 特開-情報処理装置及び情報処理プログラム 図4
  • 特開-情報処理装置及び情報処理プログラム 図5
  • 特開-情報処理装置及び情報処理プログラム 図6
  • 特開-情報処理装置及び情報処理プログラム 図7
  • 特開-情報処理装置及び情報処理プログラム 図8
  • 特開-情報処理装置及び情報処理プログラム 図9
  • 特開-情報処理装置及び情報処理プログラム 図10
  • 特開-情報処理装置及び情報処理プログラム 図11
< >
(19)【発行国】日本国特許庁(JP)
(12)【公報種別】公開特許公報(A)
(11)【公開番号】P2024120340
(43)【公開日】2024-09-05
(54)【発明の名称】情報処理装置及び情報処理プログラム
(51)【国際特許分類】
   G06V 30/12 20220101AFI20240829BHJP
   G06F 16/583 20190101ALI20240829BHJP
【FI】
G06V30/12 Z
G06F16/583
【審査請求】未請求
【請求項の数】8
【出願形態】OL
(21)【出願番号】P 2023027074
(22)【出願日】2023-02-24
(71)【出願人】
【識別番号】000005496
【氏名又は名称】富士フイルムビジネスイノベーション株式会社
(74)【代理人】
【識別番号】110001210
【氏名又は名称】弁理士法人YKI国際特許事務所
(72)【発明者】
【氏名】米田 祐司
【テーマコード(参考)】
5B064
5B175
【Fターム(参考)】
5B064AA01
5B064EA29
5B064FA04
5B175DA02
5B175GA03
5B175HA01
(57)【要約】
【課題】送付状データ及び本文データを含む文書データに対して光学文字認識処理を行う場合において、送付状データのみに対して光学文字認識を行った場合、又は、本文データのみに対して光学文字認識を行った場合に比して、光学文字認識処理の精度を向上させる。
【解決手段】光学文字認識処理部26は、送付状データTDから所定の項目に対する第1文字データ列を抽出し、本文データBDから同項目に対する第2文字データ列を抽出する。また、光学文字認識処理部26は、第1文字データ列及び第2文字データ列を構成する各文字の確信度を演算する。文字データ列修正部30は、第1文字データ列と第2文字データ列とが互いに異なる場合に、第1文字データ列と第2文字データ列のうちの確信度が低い方の文字データ列を、第1文字データ列と第2文字データ列のうちの確信度が高い方の文字データ列と同じになるように修正する。
【選択図】図1
【特許請求の範囲】
【請求項1】
プロセッサを備え、
前記プロセッサは、
送付状を光学的に読み取って得られた送付状データに対して光学文字認識処理を行うことにより、前記送付状データから所定の項目に対する値である第1文字データ列を抽出し、
前記送付状に対応する本文を光学的に読み取って得られた本文データに対して光学文字認識処理を行うことにより、前記本文データから前記項目に対する値である第2文字データ列を抽出し、
前記第1文字データ列に関する、前記光学文字認識処理の確からしさを表す確信度、及び、前記第2文字データ列に関する前記確信度を演算し、
前記第1文字データ列と前記第2文字データ列とが互いに異なる場合に、前記第1文字データ列と前記第2文字データ列のうちの前記確信度が低い方の文字データ列を、前記第1文字データ列と前記第2文字データ列のうちの前記確信度が高い方の文字データ列である高確信度文字データ列と同じになるように修正する、
ことを特徴とする情報処理装置。
【請求項2】
前記プロセッサは、
前記第1文字データ列に関する前記確信度、及び、前記第2文字データ列に関する前記確信度が確信度閾値未満である場合は、前記修正を行わない、
ことを特徴とする請求項1に記載の情報処理装置。
【請求項3】
前記プロセッサは、
ユーザからの指示に応じて、前記項目毎に互いに異なる前記確信度閾値を設定する、
ことを特徴とする請求項2に記載の情報処理装置。
【請求項4】
前記プロセッサは、
前記修正前の前記第1文字データ列、前記第1文字データ列に関する前記確信度、前記修正前の前記第2文字データ列、及び、前記第2文字データ列に関する前記確信度をユーザに通知する、
ことを特徴とする請求項1に記載の情報処理装置。
【請求項5】
前記プロセッサは、
それぞれが前記送付状データと前記本文データの組み合わせから成る複数の文書データを、各前記文書データについての前記高確信度文字データ列に基づいて分類する、
ことを特徴とする請求項1に記載の情報処理装置。
【請求項6】
前記項目に対する複数の値それぞれに対応する複数の格納部が定義され、
前記プロセッサは、
前記文書データについての、前記第1文字データ列に関する前記確信度、又は、前記第2文字データ列に関する前記確信度の少なくとも一方が確信度閾値以上である場合は、当該文書データの前記高確信度文字データ列が示す値に対応する前記格納部に当該文書データを格納し、
前記文書データについての、前記第1文字データ列に関する前記確信度、及び、前記第2文字データ列に関する前記確信度が確信度閾値未満である場合は、未分類の前記文書データが格納される所定の格納部に当該文書データを格納する、
ことを特徴とする請求項5に記載の情報処理装置。
【請求項7】
前記本文データは、複数種類の文書を含み、
前記プロセッサは、
前記本文データを、文書の種類毎に分割する分割処理を実行し、
前記送付状データに対して光学文字認識処理を行うことにより、前記送付状データから前記本文データに含まれる文書の複数の種類と、各種類の文書のページ数を示す内訳を抽出し、
前記分割処理の結果得られた各種類の文書のページ数と、前記内訳が示す各種類の文書のページ数とが合致していない場合に、ユーザに通知する、
ことを特徴とする請求項1に記載の情報処理装置。
【請求項8】
コンピュータに、
送付状を光学的に読み取って得られた送付状データに対して光学文字認識処理を行うことにより、前記送付状データから所定の項目に対する値である第1文字データ列を抽出させ、
前記送付状に対応する本文を光学的に読み取って得られた本文データに対して光学文字認識処理を行うことにより、前記本文データから前記項目に対する値である第2文字データ列を抽出させ、
前記第1文字データ列に関する、前記光学文字認識処理の確からしさを表す確信度、及び、前記第2文字データ列に関する前記確信度を演算させ、
前記第1文字データ列と前記第2文字データ列とが互いに異なる場合に、前記第1文字データ列と前記第2文字データ列のうちの前記確信度が低い方の文字データ列を、前記第1文字データ列と前記第2文字データ列のうちの前記確信度が高い方の文字データ列である高確信度文字データ列と同じになるように修正させる、
ことを特徴とする情報処理プログラム。
【発明の詳細な説明】
【技術分野】
【0001】
本発明は、情報処理装置及び情報処理プログラムに関する。
【背景技術】
【0002】
特許文献1には、FAX文書ファイルを管理する管理装置であって、FAX文書ファイルに二次元バーコードがある場合は、当該二次元バーコードを読み取って得られた情報に基づいて発注IDと担当者名を取得し、FAX文書ファイルに二次元バーコードが無い場合は、当該FAX文書ファイルに対してOCR処理を行うことで、発注IDと担当者名を取得し、取得した発注ID及び担当者名に基づいて、当該FAX文書をフォルダに振り分ける処理を行う管理装置が開示されている。
【先行技術文献】
【特許文献】
【0003】
【特許文献1】特開2015-211528号公報
【発明の概要】
【発明が解決しようとする課題】
【0004】
ところで、送付状及び本文から成る文書を光学的に読み取って得られた、送付状データ及び本文データを含む文書データに対して光学文字認識処理(OCR(Optical character recognition)処理)が行われる場合がある。これに限られるものではないが、送付状とは、例えばFAXや郵便によって帳票を送信する場合に本文(ここでは帳票)に付されるものである。このような文書データに対する光学文字認識処理の精度を向上させることが望まれている。例えば、FAXにて受信した文書は、文字が潰れている場合があり、そのような場合に高精度に光学文字認識処理が行えるとよい。
【0005】
本発明の目的は、送付状データ及び本文データを含む文書データに対して光学文字認識処理を行う場合において、送付状データのみに対して光学文字認識を行った場合、又は、本文データのみに対して光学文字認識を行った場合に比して、光学文字認識処理の精度を向上させることにある。
【課題を解決するための手段】
【0006】
請求項1に係る発明は、プロセッサを備え、前記プロセッサは、送付状を光学的に読み取って得られた送付状データに対して光学文字認識処理を行うことにより、前記送付状データから所定の項目に対する値である第1文字データ列を抽出し、前記送付状に対応する本文を光学的に読み取って得られた本文データに対して光学文字認識処理を行うことにより、前記本文データから前記項目に対する値である第2文字データ列を抽出し、前記第1文字データ列に関する、前記光学文字認識処理の確からしさを表す確信度、及び、前記第2文字データ列に関する前記確信度を演算し、前記第1文字データ列と前記第2文字データ列とが互いに異なる場合に、前記第1文字データ列と前記第2文字データ列のうちの前記確信度が低い方の文字データ列を、前記第1文字データ列と前記第2文字データ列のうちの前記確信度が高い方の文字データ列である高確信度文字データ列と同じになるように修正する、ことを特徴とする情報処理装置である。
請求項2に係る発明は、前記プロセッサは、前記第1文字データ列に関する前記確信度、及び、前記第2文字データ列に関する前記確信度が確信度閾値未満である場合は、前記修正を行わない、ことを特徴とする請求項1に記載の情報処理装置である。
請求項3に係る発明は、前記プロセッサは、ユーザからの指示に応じて、前記項目毎に互いに異なる前記確信度閾値を設定する、ことを特徴とする請求項2に記載の情報処理装置である。
請求項4に係る発明は、前記プロセッサは、前記修正前の前記第1文字データ列、前記第1文字データ列に関する前記確信度、前記修正前の前記第2文字データ列、及び、前記第2文字データ列に関する前記確信度をユーザに通知する、ことを特徴とする請求項1に記載の情報処理装置である。
請求項5に係る発明は、前記プロセッサは、それぞれが前記送付状データと前記本文データの組み合わせから成る複数の文書データを、各前記文書データについての前記高確信度文字データ列に基づいて分類する、ことを特徴とする請求項1に記載の情報処理装置である。
請求項6に係る発明は、前記項目に対する複数の値それぞれに対応する複数の格納部が定義され、前記プロセッサは、前記文書データについての、前記第1文字データ列に関する前記確信度、又は、前記第2文字データ列に関する前記確信度の少なくとも一方が確信度閾値以上である場合は、当該文書データの前記高確信度文字データ列が示す値に対応する前記格納部に当該文書データを格納し、前記文書データについての、前記第1文字データ列に関する前記確信度、及び、前記第2文字データ列に関する前記確信度が確信度閾値未満である場合は、未分類の前記文書データが格納される所定の格納部に当該文書データを格納する、ことを特徴とする請求項5に記載の情報処理装置である。
請求項7に係る発明は、前記本文データは、複数種類の文書を含み、前記プロセッサは、前記本文データを、文書の種類毎に分割する分割処理を実行し、前記送付状データに対して光学文字認識処理を行うことにより、前記送付状データから前記本文データに含まれる文書の複数の種類と、各種類の文書のページ数を示す内訳を抽出し、前記分割処理の結果得られた各種類の文書のページ数と、前記内訳が示す各種類の文書のページ数とが合致していない場合に、ユーザに通知する、ことを特徴とする請求項1に記載の情報処理装置である。
請求項8に係る発明は、コンピュータに、送付状を光学的に読み取って得られた送付状データに対して光学文字認識処理を行うことにより、前記送付状データから所定の項目に対する値である第1文字データ列を抽出させ、前記送付状に対応する本文を光学的に読み取って得られた本文データに対して光学文字認識処理を行うことにより、前記本文データから前記項目に対する値である第2文字データ列を抽出させ、前記第1文字データ列に関する、前記光学文字認識処理の確からしさを表す確信度、及び、前記第2文字データ列に関する前記確信度を演算させ、前記第1文字データ列と前記第2文字データ列とが互いに異なる場合に、前記第1文字データ列と前記第2文字データ列のうちの前記確信度が低い方の文字データ列を、前記第1文字データ列と前記第2文字データ列のうちの前記確信度が高い方の文字データ列である高確信度文字データ列と同じになるように修正させる、ことを特徴とする情報処理プログラムである。
【発明の効果】
【0007】
請求項1又は8に係る発明によれば、送付状データ及び本文データを含む文書データに対して光学文字認識処理を行う場合において、送付状データのみに対して光学文字認識を行った場合、又は、本文データのみに対して光学文字認識を行った場合に比して、光学文字認識処理の精度を向上させることができる。
請求項2に係る発明によれば、第1文字データ列又は第2文字データ列が、確信度が確信度閾値未満の文字データ列に修正されることを防止することができる。
請求項3に係る発明によれば、ユーザは、項目に応じた確信度閾値に基づいて、第1文字データ列又は第2文字データ列が修正されるか否かを設定することができる。
請求項4に係る発明によれば、第1文字データ列の確信度、及び、第2文字データ列の確信度をユーザが把握することができる。
請求項5に係る発明によれば、精度が向上された光学文字認識処理の結果に基づいて、文書データを分類することができる。
請求項6に係る発明によれば、第1文字データ列の確信度、及び、第2文字データ列の確信度が確信度閾値以上であるか否かに基づいて、当該文書データの格納先を変更することができる。
請求項7に係る発明によれば、送付状に記載された文書の各種類のページ数と、文書の種類毎に分割する分割処理の実行結果とが合致していないことをユーザが把握することができる。
【図面の簡単な説明】
【0008】
図1】本実施形態に係る情報処理装置の構成概略図である。
図2】送付状データの例を示す図である。
図3】本文データの例を示す図である。
図4】送付状データから抽出された第1文字データ列の例を示す図である。
図5】本文データから抽出された第2文字データ列の例を示す図である。
図6】認識結果通知画面の例を示す図である。
図7】照合設定画面の例を示す図である。
図8】照合設定の例を示す図である。
図9】分類条件設定画面の例を示す図である。
図10】ページ分割結果通知画面の例を示す図である。
図11】本実施形態に係る情報処理装置の処理の流れを示すフローチャートである。
【発明を実施するための形態】
【0009】
図1は、本実施形態に係る情報処理装置10の構成概略図である。情報処理装置10は、送付状データと当該送付状データに対応する本文データと、を含む文書データを処理する装置である。送付状データとは、例えば、文書データの宛先や文書の種類などの、本文に含まれる情報の一部が記載された紙媒体である送付状を光学的に読み取って得られたデータである。本文データとは、送付状に対応する紙媒体である本文を光学的に読み取って得られたデータである。
【0010】
文書データは、他の装置から情報処理装置10に送られてきてもよいし、情報処理装置10が送付状及び本文を光学的に読み取ることで取得してもよい。送付状及び本文を含む文書の例としては、FAXにより送信される文書や、郵送により送信される文書などが挙げられる。
【0011】
本実施形態では、情報処理装置10はFAX機能を有する複合機であるが、情報処理装置10としては、後述のプロセッサ22が有する機能を発揮可能な限りにおいて、例えばサーバやパーソナルコンピュータなどのその他の装置であってもよい。
【0012】
通信インターフェース12は、例えばネットワークカードなどから構成される。通信インターフェース12は、例えばユーザが使用するユーザ端末などの他の装置と通信する機能を発揮する。また、通信インターフェース12は、FAX機能などによって、他の装置から文書データ(送付状データ及び本文データ)を受信することができる。また、通信インターフェース12は、FAX機能などによって、情報処理装置10が送付状及び本文を光学的に読み取って取得した文書データを他の装置に送信することができる。
【0013】
入力インターフェース14は、例えば各種ボタンやタッチパネルなどから構成される。情報処理装置10がサーバやパーソナルコンピュータなどである場合は、入力インターフェース14には、キーボードやマウスが含まれていてもよい。入力インターフェース14は、情報処理装置10に対してユーザの指示を入力するために用いられる。
【0014】
ディスプレイ16は、例えば液晶ディスプレイや有機EL(Electro Luminescence)ディスプレイなどから構成される。ディスプレイ16には、後述のプロセッサ22からの指示に応じて、種々の画面が表示される。
【0015】
メモリ18は、HDD(Hard Disk Drive)、SSD(Solid State Drive)、eMMC(embedded Multi Media Card)、ROM(Read Only Memory)又はRAM(Random Access Memory)などを含んで構成される。メモリ18には、情報処理装置10の各部を動作させるための情報処理プログラムが記憶される。なお、情報処理プログラムは、例えば、USB(Universal Serial Bus)メモリ又はCD-ROMなどのコンピュータ読み取り可能な非一時的な記憶媒体に格納することもできる。情報処理装置10は、そのような記憶媒体から情報処理プログラムを読み取って実行することができる。
【0016】
スキャナ20は、光源、及びCCD(Charge-Coupled Device)などの画像センサなどから構成される。スキャナ20は、紙媒体を光学的に読み取って画像データを取得するための機構である。特に、スキャナ20は、送付状を光学的に読み取って送付状データを取得し、本文を光学的に読み取って本文データを取得することができる。
【0017】
プロセッサ22は、例えばCPU(Central Processing Unit)などから構成される。プロセッサ22は、メモリ18に記憶された情報処理プログラムによって、ページ識別処理部24、光学文字認識処理部26、通知部28、文字データ列修正部30、分類処理部32、及び、分割処理部34としての機能を発揮する。プロセッサ22は、これらの機能を発揮しつつ、送付状データ及び本文データを含む文書データに対して処理を実行する。プロセッサ22の処理の対象となる文書データは、情報処理装置10が他の装置から受信したものであってもよいし、スキャナ20によって取得されたものであってもよい。
【0018】
ページ識別処理部24は、文書データが有するページ毎に、当該ページが送付状データに含まれるものであるか、本文データに含まれるものであるかを識別する。ページの識別方法としては、既知の種々の方法が用いられてよい。本実施形態では、ページ識別処理部24は、処理対象のページを正立させた上で、当該ページに対して光学文字認識処理を行う。光学文字認識処理の結果、「送付状」又は、それに類似する文字データ列が文書タイトルとして(例えば所定の位置に所定の大きさ以上で)抽出された場合に、ページ識別処理部24は、当該ページは送付状データに含まれると判定する。光学文字認識処理の結果、「送付状」又は、それに類似する文字データ列が文書タイトルとして抽出されなかった場合は、ページ識別処理部24は、当該ページは本文データに含まれると判定する。
【0019】
また、1つの文書データに複数の送付状データが含まれている場合もあることから、ページ識別処理部24は、最初に送付状データであると識別されたページと同様のレイアウトのページを有するページを送付状データに含まれるページであると識別するようにしてもよい。
【0020】
ページ識別処理部24の処理により、文書データが送付状データと本文データとに識別される。図2に送付状データTDの例が、図3に本文データBDの例がそれぞれ示されている。
【0021】
光学文字認識処理部26は、ページ識別処理部24が識別した送付状データTDに対して光学文字認識処理を行う。これにより、光学文字認識処理部26は、送付状データTDから、所定の項目(換言すればキー)に対する値(換言すればバリュー)としての第1文字データ列を抽出する。光学文字認識処理部26が送付状データTDから所定の項目と第1文字データ列との組み合わせを抽出する方法としてはいくつかの方法がある。
【0022】
第1の方法としては、キーバリュー抽出と呼ばれる技術を利用する方法である。キーバリュー抽出とは、予めキーとしての文字データ列を定めておき、光学文字認識処理によってキーが抽出された場合に、当該キーの周囲から抽出された、特定の特徴を有する文字データ列を当該キーに対応するバリューとして検出する技術である。例えば、キーが「住所」である場合、光学文字認識処理部26は、送付状データTDの「住所」と記載された位置の周囲から抽出された、「都」「道」「府」、又は「県」が含まれている文字データ列を、当該キーに対応するバリュー(すなわち第1文字データ列)として抽出する。この場合、情報処理装置10の管理者又はユーザなどは、処理対象となる文書データの種類などに応じて、予めキーとしての1又は複数の文字データ列と、上記特定の特徴と、の組み合わせをメモリ18に登録しておく。
【0023】
第2の方法としては、送付状データTDから抽出された第1文字データ列の送付状データTDにおける位置(換言すれば座標)、又は、大きさの少なくとも一方に基づいて、当該第1文字データ列のキーを特定する方法である。例えば、送付状のフォーマットが既知の場合において、差出人が記載されている位置が特定可能であるならば、差出人が記載されている位置から抽出された第1文字データ列のキーを「差出人」と特定することができる。また、送付状のフォーマットが既知の場合において、宛先の記載の大きさが特定可能であるならば、抽出された当該サイズの第1文字データ列のキーを「宛先」と特定することができる。なお、第2の方法を用いる場合であっても、情報処理装置10の管理者又はユーザなどは、送付状データTDから抽出すべきキーをあらかじめ特定しておく。
【0024】
また、光学文字認識処理部26は、第1文字データ列に関する、光学文字認識処理の確からしさを表す確信度を演算する。第1文字データ列に関する確信度は、光学文字認識処理の過程において演算することができる。
【0025】
例えば、送付状データTDから切り出した抽出文字画像、及び、当該画像が表わす文字が何であるかが既知である基準文字画像から、それぞれ特徴量を抽出し、抽出した両特徴量を比較(換言すればマッチング)し、マッチング度合が所定以上の場合に、抽出文字画像が表わす文字は、当該基準文字画像が表わす文字である、と識別することで光学文字認識処理を行う場合がある。この場合、光学文字認識処理部26は、第1文字データ列に含まれる文字の特徴量と、基準文字画像の特徴量とのマッチング度合を、当該文字の確信度とすることができる。
【0026】
また、入力された画像が表わす文字を予測して出力するための、畳み込みニューラルネットワークなどの学習器を用いて光学文字認識処理を行う場合がある。この場合は、ニューラルネットワークの出力層における活性化関数(例えばソフトマックス関数)により、入力された画像が表わすと予測された複数の文字それぞれについて、入力された画像が当該文字を表す確率が出力される場合がある。一般的には、ニューラルネットワークが出力した複数の文字のうち、最も確率が高い文字が、入力された画像が表わす文字である、と識別される。この場合、光学文字認識処理部26は、入力された画像が表わす文字であると識別された文字についての確率を、当該文字の確信度とすることができる。
【0027】
例えば、光学文字認識処理部26は、第1文字データ列である「山田花子」を構成する「山」、「田」、「花」、及び「子」について、それぞれ確信度を演算する。また、光学文字認識処理部26は、第1文字データ列全体としての確信度を演算してもよい。例えば、第1文字データ列を構成する各文字の確信度の代表値(例えば平均値、中央値、最大値、最小値など)を当該第1文字データ列全体の確信度とすることができる。このように、第1文字データ列に関する確信度、とは、第1文字データ列に含まれる文字の確信度、及び、第1文字データ列全体としての確信度の両方を含む概念である。
【0028】
光学文字認識処理部26は、図4に示すように、送付状データTDから抽出した所定の項目と第1文字データ列との組み合わせ、及び、当該第1文字データ列を構成する各文字の確信度を関連付けて、メモリ18に記憶させる。図4の例のように、所定の項目と第1文字データ列との組み合わせは、複数抽出されるとよい。
【0029】
また、光学文字認識処理部26は、所定の項目、第1文字データ列、及び第1文字データ列を構成する各文字の確信度に対して、当該送付状データTDを含む文書データを一意に識別する文書データIDを関連付けてメモリ18に記憶させるとよい。これにより、プロセッサ22(例えば後述の文字データ列修正部30など)は、光学文字認識処理部26が、複数の文書データに含まれる複数の送付状データTDから第1文字データ列を抽出した場合に、抽出した第1文字データ列がどの文書データ(つまり送付状データTD)から抽出されたものであるのかを把握することができる。
【0030】
また、光学文字認識処理部26は、ページ識別処理部24が識別した本文データBDに対しても、光学文字認識処理を行う。これにより、光学文字認識処理部26は、本文データBDから、所定の項目に対する値としての第2文字データ列を抽出する。光学文字認識処理部26が本文データBDから項目と第2文字データ列との組み合わせを抽出する方法は、送付状データTDから項目と第1文字データ列との組み合わせを抽出する方法と同じ方法を用いることができる。
【0031】
また、光学文字認識処理部26は、第2文字データ列に関する、光学文字認識処理の確からしさを表す確信度を演算する。第2文字データ列に関する確信度の演算方法も、第1文字データ列に関する確信度の演算方法と同じ方法を用いることができる。第1文字データ列に関する確信度と同様、第2文字データ列に関する確信度、とは、第2文字データ列に含まれる文字の確信度、及び、第2文字データ列全体としての確信度の両方を含む概念である。
【0032】
光学文字認識処理部26は、図5に示すように、本文データBDから抽出した所定の項目と第2文字データ列との組み合わせ、及び、当該第2文字データ列を構成する各文字の確信度を関連付けて、メモリ18に記憶させる。図5の例のように、所定の項目と第2文字データ列との組み合わせは、複数抽出されるとよい。
【0033】
なお、図5の例では、本文データBDに記載された宛先は「山田花子」であるが、本文データBDに対する光学文字認識処理によって、項目「宛先」に対する第2文字データ列「山口花子」が抽出されている。これは、光学文字認識において誤認識があった結果である。
【0034】
また、光学文字認識処理部26は、所定の項目、第2文字データ列、及び第2文字データ列を構成する各文字の確信度に対して、当該第2文字データ列が抽出されたページは、本文データBDの何ページ目であるかを示すページ情報を関連付けてメモリ18に記憶させるとよい。後述するように、ページ情報は、本文データBDを文書の種類毎に分割する分割処理を実行した際に、当該分割処理の適否を判定する際に用いられる。
【0035】
さらに、光学文字認識処理部26は、所定の項目、第2文字データ列、及び第2文字データ列を構成する各文字の確信度に対して、当該本文データBDを含む文書データを一意に識別する文書データIDを関連付けてメモリ18に記憶させるとよい。これにより、プロセッサ22(例えば後述の文字データ列修正部30など)は、光学文字認識処理部26が、複数の文書データに含まれる複数の本文データBDから第2文字データ列を抽出した場合に、抽出した第2文字データ列がどの文書データ(つまり本文データBD)から抽出されたものであるのかを把握することができる。
【0036】
通知部28は、光学文字認識処理部26が抽出した第1文字データ列、当該第1文字データ列に関する確信度、光学文字認識処理部26が抽出した第2文字データ列、当該第2文字データ列に関する確信度をユーザに通知する。通知部28がユーザに通知する第1文字データ列及び第2文字データ列は、後述の文字データ列修正部30により修正される前の文字データ列である。
【0037】
本実施形態では、通知部28は、ユーザが使用するユーザ端末のディスプレイ、又は、情報処理装置10のディスプレイ16に、図6に示すような認識結果通知画面を表示させることで、第1文字データ列、第1文字データ列の確信度、第2文字データ列、及び、第2文字データ列の確信度をユーザに通知する。認識結果通知画面においては、送付状データTDのサムネイル40、本文データBDのサムネイル42と共に、光学文字認識処理部26の抽出結果44が示される。通知部28は、抽出結果44において、第1文字データ列、当該第1文字データ列の確信度、当該第1データ列と同項目に対応する第2文字データ列、及び、当該第2文字データ列の確信度のセットを、これらの関連性が分かる態様で表示させる。
【0038】
認識結果通知画面をユーザに通知することで、ユーザは、光学文字認識処理部26が抽出した第1文字データ列及び第2文字データ列と共に、第1文字データ列及び第2文字データ列の確信度を確認することができる。これにより、ユーザは、後述の確信度閾値を設定する際の参考にすることができる。
【0039】
文字データ列修正部30は、光学文字認識処理部26による送付状データTD及び本文データBDに対する光学文字認識処理の結果(図4及び図5参照)に基づいて、同じ項目に対応する第1文字データ列と第2文字データ列を選択する。図4及び図5の例では、文字データ列修正部30は、項目「宛先」に対応する第1文字データ列「山田花子」及び第2文字データ列「山口花子」を選択する。
【0040】
文字データ列修正部30は、同じ項目に対応する第1文字データ列と第2文字データ列とが互いに異なる場合に、当該第1文字データ列と当該第2文字データ列のうちの確信度が低い方の文字データ列を、当該第1文字データ列と当該第2文字データ列のうちの確信度が高い方の文字データ列である高確信度文字データ列と同じになるように修正する。
【0041】
まず、文字データ列修正部30は、選択した第1文字データ列と第2文字データ列との間の合致度を演算して、当該合致度が合致度閾値未満である場合に、同じ項目に対応する第1文字データ列と第2文字データ列とが互いに異なる、と判定する。なお、合致度閾値は、情報処理装置10の管理者又はユーザによって適宜設定されてよい。
【0042】
合致度は、例えば、第1文字データ列(又は第2文字データ列)の文字数に対する、第1文字データ列と第2文字データ列との間で合致している文字数の割合で演算することができる。例えば、第1文字データ列「山田花子」と第2文字データ列「山口花子」とでは、4文字中3文字が合致しているため、その合致度は75%となる。ここでは、第1文字データ列「山田花子」と第2文字データ列「山口花子」との間の合致度「75%」が合致度閾値未満であり、当該第1文字データ列と当該第2文字データ列とが互いに異なる、と判定されたとする。
【0043】
第1文字データ列「山田花子」に含まれる各文字の確信度が図4に示される通りであり、第2文字データ列「山口花子」に含まれる各文字の確信度が図5に示される通りであるとする。この場合、文字データ列修正部30は、まず、第1文字データ列と第2文字データ列との間で相違する相違文字の確信度を特定する。本例では、第1文字データ列の相違文字「田」の確信度「95%」と、第2文字データ列の相違文字「口」の確信度「65%」が特定される。次に、文字データ列修正部30は、確信度が低い方の相違文字(本例では第2文字データ列の相違文字「口」)を確信度が高い方の相違文字(本例では第1文字データ列の相違文字「田」)に修正する。これにより、確信度が低い方の第2文字データ列「山口花子」が、高確信度文字データ列である第1文字データ列「山田花子」と同じになるように修正される。
【0044】
また、光学文字認識処理部26により、第1文字データ列「山田花子」全体としての確信度、及び、第2文字データ列「山口花子」全体としての確信度が演算されている場合は、文字データ列修正部30は、第1文字データ列全体の確信度と、第2文字データ列全体の確信度とに基づいて、確信度が低い方の文字データ列(ここでは第2文字データ列とする)を確信度が高い方の文字データ列(ここでは第1文字データ列とする)に修正するようにしてもよい。これにより、確信度が低い方の第2文字データ列「山口花子」が、高確信度文字データ列である第1文字データ列「山田花子」と同じになるように修正される。
【0045】
このように、第1文字データ列と第2文字データ列のうちの確信度が低い方の文字データ列を、第1文字データ列と第2文字データ列のうちの確信度が高い方の文字データ列である高確信度文字データ列と同じになるように修正することには、第1文字データ列の相違文字と第2文字データ列の相違文字の確信度に基づいて、確信度が低い方の相違文字を確信度が高い方の相違文字に修正すること、及び、第1文字データ列全体の確信度と、第2文字データ列全体の確信度とに基づいて、確信度が低い方の文字データ列を確信度が高い方の文字データ列に修正することの両方が含まれる。
【0046】
本実施形態では、本文データBDに含まれる情報の一部は、送付状データTDにも含まれることから、送付状データTDから抽出された所定の項目に対応する第1文字データ列と、本文データBDから抽出された同項目に対応する第2文字データ列とは、同じ文字データ列となることを前提とするものである。その上で、同じ項目に対応する、第1文字データ列と第2文字データ列とを比較して、これらが互いに異なるのであれば、光学文字認識処理において、いずれかの文字データ列に誤認識があったと判定することができる。さらに、本実施形態では、第1文字データ列に関する確信度と第2文字データ列に関する確信度に基づいて、確信度が低い文字データ列が、確信度が高い文字データ列に修正される。結果として、本実施形態によれば、送付状データTDのみに対して光学文字認識を行った場合、又は、本文データBDのみに対して光学文字認識を行った場合に比して(さらに言えば、送付状データTDに対する光学文字認識の結果と、本文データBDに対する光学文字認識の結果の比較を行わない場合に比して)、送付状データTD及び本文データBDに対する光学文字認識の精度を向上させることができる。
【0047】
通知部28は、一方が修正された第1文字データ列及び第2文字データ列のセットをユーザに通知するとよい。特に、修正前の第1文字データ列及び第2文字データ列のセットと共に、一方が修正された第1文字データ列及び第2文字データ列のセットをユーザに通知するとよい。これにより、ユーザは、第1文字データ列又は第2文字データ列がどのように修正されたのかを容易に把握することができる。
【0048】
文字データ列修正部30は、第1文字データ列に関する確信度、及び、第2文字データ列に関する確信度の両方が確信度閾値未満である場合は、第1文字データ列又は第2文字データ列のいずれかの修正を行わないようにするとよい。第1文字データ列「山田花子」と、第2文字データ列「山口花子」との比較において、仮に、第1文字データ列の相違文字「田」の確信度、及び、第2文字データ列の相違文字「口」の確信度がいずれもかなり低い場合(例えば20%など)、第1文字データ列の相違文字「田」と、第2文字データ列の相違文字「口」の両方が誤認識により得られた文字データである可能性が高いことになる。このような場合は、修正後の文字データ列が、なお正確でない可能性が高いため、文字データ列修正部30は、修正を行わないようにしてもよい。第1文字データ列全体としての確信度と、第2文字データ列全体としての確信度が確信度閾値未満である場合も同様に、文字データ列修正部30は、修正を行わないようにしてもよい。
【0049】
上述の確信度閾値は、予め定められていてもよいが、文字データ列修正部30は、情報処理装置10のユーザからの指示に応じて、確信度閾値を設定してもよい。例えば、プロセッサ22は、ユーザが使用するユーザ端末のディスプレイ、又は、情報処理装置10のディスプレイ16に、図7に示すような照合設定画面を表示させる。
【0050】
照合設定画面には、確信度閾値の設定項目が含まれ、確信度閾値の設定項目において、ユーザは、簡易設定又は詳細設定のいずれかを選択可能となっている。ユーザが簡易設定を選択し、確信度閾値入力欄50に所望の確信度を入力してアップロードボタンを押下すると、文字データ列修正部30は、全ての項目に対する確信度閾値を、確信度閾値入力欄50に入力された確信度に設定する。一方、ユーザが詳細設定を選択し、項目入力欄52に所望の項目を入力し、確信度閾値入力欄54に所望の確信度を入力してアップロードボタンを押下すると、文字データ列修正部30は、項目入力欄52に入力された項目に対する確信度閾値を、確信度閾値入力欄54に入力された確信度に設定する。同様の操作で、ユーザは、複数の項目に対する確信度閾値を個別に設定することができる。このように、文字データ列修正部30は、ユーザからの指示に応じて、項目毎に互いに異なる確信度閾値を設定する。
【0051】
図7に示すように、照合設定画面には、照合先の設定項目が含まれていてもよい。照合先の設定項目において、ユーザが送付状と本文を選択すると、文字データ列修正部30は、上述のように、送付状データTDから抽出された第1文字データ列と本文データBDから抽出された第2文字データ列とが互いに異なる場合に、第1文字データ列及び第2文字データ列に関する確信度に基づいて、第1文字データ列又は第2文字データ列のいずれかの修正を行う。照合先の設定項目において、ユーザが送付状のみ選択すると、文字データ列修正部30は文字データ列の修正は行わず、送付状データTDから抽出された第1文字データ列に関する確信度が確信度閾値未満である場合に、通知部28がユーザに通知を行う。照合先の設定項目において、ユーザが本文のみ選択すると、文字データ列修正部30は文字データ列の修正は行わず、本文データBDから抽出された第2文字データ列に関する確信度が確信度閾値未満である場合に、通知部28がユーザに通知を行う。
【0052】
照合設定画面には、さらに、確信度の設定項目が含まれていてもよい。確信度の設定項目において、ユーザが文字列を選択すると、文字データ列修正部30は、第1文字データ列全体の確信度と、第2文字データ列全体の確信度とに基づいて、確信度が低い方の文字データ列を確信度が高い方の文字データ列に修正する。確信度の設定項目において、ユーザが文字を選択すると、文字データ列修正部30は、第1文字データ列の相違文字の確信度と、第2文字データ列の相違文字の確信度のうち、確信度が低い方の相違文字を確信度が高い方の相違文字に修正する。
【0053】
照合設定画面においてユーザが照合設定を行うと、文字データ列修正部30は、図8に示すような、ユーザからの指示に応じた照合設定をメモリ18に記憶させる。照合設定は、照合先、確信度、及び確信度閾値の各設定項目に対するユーザ指定の設定値が互いに関連付けられた情報である。特に、照合設定には、文字データ列修正部30がユーザからの指示に応じて設定した、項目毎に互いに異なる確信度閾値が含まれる。
【0054】
項目毎に互いに異なる確信度閾値が設定された場合には、文字データ列修正部30は、第1文字データ列に関する確信度、及び、第2文字データ列に関する確信度の両方が、当該第1文字データ列及び当該第2文字データ列に対応する項目についての確信度閾値未満である場合に、第1文字データ列又は第2文字データ列のいずれかの修正を行わないようにする。
【0055】
分類処理部32は、各文書データから抽出された第1文字データ列又は第2文字データ列に基づいて、複数の文書データを分類する。文字データ列修正部30によって、第1文字データ列又は第2文字データ列のいずれかが修正されている場合は、分類処理部32は、修正後の第1文字データ列又は第2文字データ列(修正された場合、第1文字データ列と第2文字データ列は同じになるため、以下の説明では、修正後の第1文字データ列又は第2文字データ列を「高確信度文字データ列」と記載する)に基づいて、複数の文書データを分類する。
【0056】
本実施形態では、メモリ18内に、文書データを格納する格納部としてのボックスと呼ばれる記憶領域が複数定義されている。具体的には、メモリ18内には、文書データから抽出され得る所定の項目に対して取り得る複数の値それぞれに対応する複数のボックスが定義されている。各ボックスに定義された項目と値との組み合わせは、当該ボックスに格納される文書データの条件を示す分類条件である。例えば、項目「文書の種類」に対する値「請求書」に対応するボックス、項目「文書の種類」に対する値「納品書」に対応するボックスなどが、メモリ18内に定義されている。
【0057】
分類処理部32は、各文書データから抽出された、当該項目に対する値(すなわち高確信度文字データ列)に基づいて決定されたボックスに各文書データを格納する。例えば、分類処理部32は、項目「文書の種類」に対する値として高確信度文字データ列「請求書」が抽出された文書データを、「請求書」に対応するボックスに格納し、項目「文書の種類」に対する値として高確信度文字データ列「納品書」が抽出された文書データを、「納品書」に対応するボックスに格納する。
【0058】
また、メモリ18には、未分類の文書データを格納するボックスである未分類ボックスが定義されていてもよい。分類処理部32は、未分類ボックスには、高確信度文字データ列に基づいて分類できない文書データを格納する。分類できない文書データとは、例えば、定義された複数のボックスの分類条件のいずれにも該当しない文書データである。あるいは、分類できない文書データとは、当該文書データについての、第1文字データ列の確信度及び第2文字データ列の確信度の両方が確信度閾値未満である文書データであってもよい。このような文書データは、第1文字データ列及び第2文字データ列の両方が誤認識である可能性が高いため、第1文字データ列又は第2文字データ列に基づいて分類すると、当該文書データが正しくないボックスに格納される可能性が高いためである。
【0059】
具体的には、分類処理部32は、文書データについての、第1文字データ列に関する確信度、及び、第2文字データ列に関する確信度の少なくとも一方が確信度閾値以上である場合は、高確信度文字データ列が示す値に対応するボックスに当該文書データを格納し、文書データについての、第1文字データ列に関する前記確信度、及び、第2文字データ列に関する確信度が確信度閾値未満である場合は、未分類ボックスに当該文書データを格納するとよい。
【0060】
分類処理部32は、ユーザからの指示に応じて、文書データの分類条件を設定するようにしてもよい。本実施形態では、分類処理部32は、ユーザからの指示に応じて、メモリ18内に定義された各ボックスについての分類条件を定義する。例えば、プロセッサ22は、ユーザが使用するユーザ端末のディスプレイ、又は、情報処理装置10のディスプレイ16に、図9に示すような分類条件設定画面を表示させる。
【0061】
分類条件設定画面において、ユーザは、ボックス番号入力欄60に、定義するボックスの識別番号を入力する。また、分類条件設定画面において、ユーザは、当該ボックスに格納される文書データの分類条件を設定することができる。具体的には、ユーザは、分類条件として、文書データから抽出される項目と、当該項目に対する値と、の組み合わせを設定することができる。ユーザは、条件設定ボタン62を押下すると、分類条件としての項目を選択することができる。例えば、項目として「宛先」を選択することができる。次いで、ユーザは、分類条件設定画面に表示された値入力欄64に、分類条件としての、当該項目「宛先」に対する値を入力する。図9の例では、値入力欄64には「山田花子」が入力されている。ユーザがOKボタンを押下すると、ボックス番号入力欄60に入力された識別番号が示すボックスであって、項目「宛先」に対する高確信度文字データ列「山田花子」が抽出された文書データが格納される、という分類条件が設定されたボックスがメモリ18内に定義される。
【0062】
また、分類条件設定画面において、ユーザは、未分類ボックスを定義することができる。具体的には、ユーザは、処理選択欄66において、分類できない文書データの処理方法を選択する。処理選択欄66においては、分類できない文書データを未分類ボックスに格納すること、ユーザにメール通知すること、あるいは、何も処理しないこと、などが選択可能となっている。ユーザは、処理選択欄66において未分類ボックスに格納することを選択した後、ボックス番号入力欄68に、未分類ボックスの識別番号を入力する。これにより、メモリ18内に未分類ボックスが定義される。
【0063】
1つの文書データの本文データBDが、複数種類の文書を含む場合がある。例えば、1つの本文データBDの中に、請求書と納品書が含まれる場合がある。このような場合に、分割処理部34は、本文データBDを文書の種類毎に分割する分割処理を実行する。
【0064】
具体的には、分割処理部34は、本文データBDの各ページから抽出された、項目「文書の種類」に対する値(すなわち第2文字データ列)(図5参照)に基づいて、本文データBDを文書の種類毎に分割する。
【0065】
例えば、本文データBDが全3ページから成り、図5に示すように、本文データBDの1ページ目から項目「文書の種類」に対する第2文字データ列「請求書」が抽出され、本文データBDの2ページ目から項目「文書の種類」に対する第2文字データ列は抽出されず、本文データBDの3ページ目から項目「文書の種類」に対する第2文字データ列「請求書」が抽出された場合、本文データBDの1及び2ページ目が注文書であり、本文データBDの3ページ目が請求書であると考えられることから、分割処理部34は、2ページ目と3ページ目の間で当該文書データを分割する。
【0066】
分割処理部34による分割処理は、正確性に欠ける場合がある。ここで、図2に示すように、送付状データTDには、本文データBDの内訳が含まれている場合がある。内訳とは、本文データBDに含まれる文書の複数の種類と、各種類の文書のページ数を示すものである。図2の例では、内訳として、請求書が2ページであり、納品書が1ページであることが示されている。したがって、分割処理部34は、送付状データTDに記載された内訳に基づいて、分割処理の適否を判断する。
【0067】
具体的には、分割処理部34は、送付状データTDに対する光学文字認識処理の結果(図4参照)から、内訳に相当する項目及び値(第1文字データ列)を抽出する。具体的には、分割処理部34は、文書の種類を示す項目と、当該項目に対する第1文字データ列と、の組み合わせを内訳として抽出することができる。図4の例では、分割処理部34は、項目「請求書」に対する第1文字データ列「1部2ページ」、及び、項目「納品書」に対する第1文字データ列「1部1ページ」を内訳として抽出する。
【0068】
そして、分割処理部34は、分割処理の結果得られた各種類の文書のページ数と、抽出した内訳が示す各種類の文書のページ数とが合致しているか否かを判定する。分割処理の結果と内訳の内容とが合致している場合は、分割処理部34は、分割処理が適切であったと判定することができる。一方、分割処理の結果と内訳の内容とが合致していない場合は、分割処理部34は、分割処理が不適切であったと判定することができる。
【0069】
分割処理が不適切であった場合、通知部28は、ユーザに通知をするとよい。例えば、通知部28は、ユーザが使用するユーザ端末のディスプレイ、又は、情報処理装置10のディスプレイ16に、図10に示すようなページ分割結果画面を表示させる。
【0070】
ページ分割結果画面においては、送付状データTDのサムネイル70、送付状データTDから抽出された内訳72、本文データBDの各ページのサムネイル74、及び、分割処理の結果である、本文データBDに含まれる各種類の文書のページ数76が示される。文書のページ数76においては、内訳72の内容と異なる箇所を強調表示するとよい。図10の例では、内訳においては納品書は1ページであることが示されているものの、分割処理の結果として納品書が2ページとなっているため、納品書のページ数76が強調表示されている。
【0071】
また、ページ分割結果画面には、本文データBDの各ページのサムネイル74それぞれに対応して、種類選択ボタン78が表示されているとよい。ユーザは、種類選択ボタン78を操作することで、本文データBDの各ページの文書の種類を指定することができる。これにより、ユーザは、分割処理部34による分割処理の結果を修正することができる。
【0072】
本実施形態に係る情報処理装置10の概要は以上の通りである。以下、図11に示すフローチャートに従って、情報処理装置10の処理の流れを説明する。
【0073】
ステップS10において、ページ識別処理部24は、文書データを送付状データTDと本文データBDとに識別する。
【0074】
ステップS12において、光学文字認識処理部26は、送付状データTDに対して光学文字認識処理を行い、送付状データTDから、所定の項目に対する第1文字データ列を抽出する。また、光学文字認識処理部26は、抽出した第1文字データ列を構成する各文字の確信度を演算する。
【0075】
ステップS14において、光学文字認識処理部26は、本文データBDに対して光学文字認識処理を行い、本文データBDから、所定の項目に対する第2文字データ列を抽出する。また、光学文字認識処理部26は、抽出した第2文字データ列を構成する各文字の確信度を演算する。
【0076】
ステップS16において、文字データ列修正部30は、ステップS12で抽出された第1文字データ列と、ステップS14で抽出された第2文字データ列の中から、同じ項目に対応する第1文字データ列と第2文字データ列を選択する。そして、文字データ列修正部30は、選択した第1文字データ列と第2文字データ列との間の合致度を演算して、当該合致度が合致度閾値未満であるか否かを判定する。合致度が合致度閾値以上である場合、選択した第1文字データ列と第2文字データ列は同じであるとみなされるため、これらを修正する必要が無いため、ステップS18及びS20をバイパスしてステップS22に進む。合致度が合致度閾値未満である場合、選択した第1文字データ列と第2文字データ列のいずれかが誤認識により得られたものであるとみなされるため、これらを修正すべく、ステップS18に進む。
【0077】
ステップS18において、文字データ列修正部30は、第1文字データ列と第2文字データ列との間で相違する相違文字の確信度を特定する。そして、文字データ列修正部30は、第1文字データ列に関する確信度、及び、第2文字データ列に関する確信度のいずれもが確信度閾値未満であるか否かを判定する。第1文字データ列に関する確信度、及び、第2文字データ列に関する確信度のいずれもが確信度閾値未満である場合、両文字データ列が誤認識である可能性が高いため、文字データ列修正部30は修正を行わない。よって、ステップS20をバイパスしてステップS22に進む。第1文字データ列に関する確信度、及び、第2文字データ列に関する確信度の少なくとも一方が確信度閾値以上である場合、ステップS20に進む。
【0078】
ステップS20において、文字データ列修正部30は、第1文字データ列の相違文字と、第2文字データ列の相違文字のうち、確信度が低い方の相違文字を確信度が高い方の相違文字に修正する。
【0079】
ステップS22において、分類処理部32は、ステップS12で抽出された第1文字データ列、又は、ステップS14で抽出された第2文字データ列に基づいて、文書データを選択したボックスに格納する。分類処理部32は、第1文字データ列に関する確信度、及び、第2文字データ列に関する確信度の少なくとも一方が確信度閾値以上である場合は、高確信度文字データ列が示す値に対応するボックスに当該文書データを格納し、文書データについての、第1文字データ列に関する前記確信度、及び、第2文字データ列に関する確信度がいずれも確信度閾値未満である場合は、未分類ボックスに当該文書データを格納する。
【0080】
以上、本発明に係る実施形態を説明したが、本発明は上記実施形態に限られるものではなく、本発明の趣旨を逸脱しない限りにおいて種々の変更が可能である。
【0081】
上記実施形態において、プロセッサとは、広義的な処理装置を指し、汎用的な処理装置(例えばCPU(Central Processing Unit)など)、及び、専用の処理装置(例えばGPU(Graphics Processing Unit)、ASIC(Application Specific Integrated Circuit)、FPGA(Field Programmable Gate Array)、あるいは、プログラマブル論理デバイスなど)の少なくとも1つを含んで構成される。プロセッサとしては、1つの処理装置によるものではなく、物理的に離れた位置に存在する複数の処理装置の協働により構成されるものであってもよい。
【0082】
(付記)
(((1)))
プロセッサを備え、
前記プロセッサは、
送付状を光学的に読み取って得られた送付状データに対して光学文字認識処理を行うことにより、前記送付状データから所定の項目に対する値である第1文字データ列を抽出し、
前記送付状に対応する本文を光学的に読み取って得られた本文データに対して光学文字認識処理を行うことにより、前記本文データから前記項目に対する値である第2文字データ列を抽出し、
前記第1文字データ列に関する、前記光学文字認識処理の確からしさを表す確信度、及び、前記第2文字データ列に関する前記確信度を演算し、
前記第1文字データ列と前記第2文字データ列とが互いに異なる場合に、前記第1文字データ列と前記第2文字データ列のうちの前記確信度が低い方の文字データ列を、前記第1文字データ列と前記第2文字データ列のうちの前記確信度が高い方の文字データ列である高確信度文字データ列と同じになるように修正する、
ことを特徴とする情報処理装置。
(((2)))
前記プロセッサは、
前記第1文字データ列に関する前記確信度、及び、前記第2文字データ列に関する前記確信度が確信度閾値未満である場合は、前記修正を行わない、
ことを特徴とする(((1)))に記載の情報処理装置。
(((3)))
前記プロセッサは、
ユーザからの指示に応じて、前記項目毎に互いに異なる前記確信度閾値を設定する、
ことを特徴とする(((2)))に記載の情報処理装置。
(((4)))
前記プロセッサは、
前記修正前の前記第1文字データ列、前記第1文字データ列に関する前記確信度、前記修正前の前記第2文字データ列、及び、前記第2文字データ列に関する前記確信度をユーザに通知する、
ことを特徴とする(((1)))に記載の情報処理装置。
(((5)))
前記プロセッサは、
それぞれが前記送付状データと前記本文データの組み合わせから成る複数の文書データを、各前記文書データについての前記高確信度文字データ列に基づいて分類する、
ことを特徴とする(((1)))に記載の情報処理装置。
(((6)))
前記項目に対する複数の値それぞれに対応する複数の格納部が定義され、
前記プロセッサは、
前記文書データについての、前記第1文字データ列に関する前記確信度、又は、前記第2文字データ列に関する前記確信度の少なくとも一方が確信度閾値以上である場合は、当該文書データの前記高確信度文字データ列が示す値に対応する前記格納部に当該文書データを格納し、
前記文書データについての、前記第1文字データ列に関する前記確信度、及び、前記第2文字データ列に関する前記確信度が確信度閾値未満である場合は、未分類の前記文書データが格納される所定の格納部に当該文書データを格納する、
ことを特徴とする(((5)))に記載の情報処理装置。
(((7)))
前記本文データは、複数種類の文書を含み、
前記プロセッサは、
前記本文データを、文書の種類毎に分割する分割処理を実行し、
前記送付状データに対して光学文字認識処理を行うことにより、前記送付状データから前記本文データに含まれる文書の複数の種類と、各種類の文書のページ数を示す内訳を抽出し、
前記分割処理の結果得られた各種類の文書のページ数と、前記内訳が示す各種類の文書のページ数とが合致していない場合に、ユーザに通知する、
ことを特徴とする(((1)))に記載の情報処理装置。
(((8)))
コンピュータに、
送付状を光学的に読み取って得られた送付状データに対して光学文字認識処理を行うことにより、前記送付状データから所定の項目に対する値である第1文字データ列を抽出させ、
前記送付状に対応する本文を光学的に読み取って得られた本文データに対して光学文字認識処理を行うことにより、前記本文データから前記項目に対する値である第2文字データ列を抽出させ、
前記第1文字データ列に関する、前記光学文字認識処理の確からしさを表す確信度、及び、前記第2文字データ列に関する前記確信度を演算させ、
前記第1文字データ列と前記第2文字データ列とが互いに異なる場合に、前記第1文字データ列と前記第2文字データ列のうちの前記確信度が低い方の文字データ列を、前記第1文字データ列と前記第2文字データ列のうちの前記確信度が高い方の文字データ列である高確信度文字データ列と同じになるように修正させる、
ことを特徴とする情報処理プログラム。
【0083】
(((1)))又は(((8)))に係る発明によれば、送付状データ及び本文データを含む文書データに対して光学文字認識処理を行う場合において、送付状データのみに対して光学文字認識を行った場合、又は、本文データのみに対して光学文字認識を行った場合に比して、光学文字認識処理の精度を向上させることができる。
(((2)))に係る発明によれば、第1文字データ列又は第2文字データ列が、確信度が確信度閾値未満の文字データ列に修正されることを防止することができる。
(((3)))に係る発明によれば、ユーザは、項目に応じた確信度閾値に基づいて、第1文字データ列又は第2文字データ列が修正されるか否かを設定することができる。
(((4)))に係る発明によれば、第1文字データ列の確信度、及び、第2文字データ列の確信度をユーザが把握することができる。
(((5)))に係る発明によれば、精度が向上された光学文字認識処理の結果に基づいて、文書データを分類することができる。
(((6)))に係る発明によれば、第1文字データ列の確信度、及び、第2文字データ列の確信度が確信度閾値以上であるか否かに基づいて、当該文書データの格納先を変更することができる。
(((7)))に係る発明によれば、送付状に記載された文書の各種類のページ数と、文書の種類毎に分割する分割処理の実行結果とが合致していないことをユーザが把握することができる。
【符号の説明】
【0084】
10 情報処理装置、12 通信インターフェース、14 入力インターフェース、16 ディスプレイ、18 メモリ、20 スキャナ、22 プロセッサ、24 ページ識別処理部、26 光学文字認識処理部、28 通知部、30 文字データ列修正部、32 分類処理部、34 分割処理部。
図1
図2
図3
図4
図5
図6
図7
図8
図9
図10
図11