特許第6702629号(P6702629)IP Force 特許公報掲載プロジェクト 2022.1.31 β版

知財求人 - 知財ポータルサイト「IP Force」

▶ 株式会社 ハンモックの特許一覧

<>
  • 特許6702629-活字OCRシステム 図000002
  • 特許6702629-活字OCRシステム 図000003
  • 特許6702629-活字OCRシステム 図000004
  • 特許6702629-活字OCRシステム 図000005
  • 特許6702629-活字OCRシステム 図000006
  • 特許6702629-活字OCRシステム 図000007
  • 特許6702629-活字OCRシステム 図000008
  • 特許6702629-活字OCRシステム 図000009
  • 特許6702629-活字OCRシステム 図000010
  • 特許6702629-活字OCRシステム 図000011
  • 特許6702629-活字OCRシステム 図000012
< >
(19)【発行国】日本国特許庁(JP)
(12)【公報種別】特許公報(B2)
(11)【特許番号】6702629
(24)【登録日】2020年5月11日
(45)【発行日】2020年6月3日
(54)【発明の名称】活字OCRシステム
(51)【国際特許分類】
   G06K 9/20 20060101AFI20200525BHJP
   G06K 9/03 20060101ALI20200525BHJP
   H04N 1/00 20060101ALI20200525BHJP
   H04N 1/21 20060101ALI20200525BHJP
【FI】
   G06K9/20 340C
   G06K9/03 B
   H04N1/00 C
   H04N1/21
【請求項の数】3
【全頁数】14
(21)【出願番号】特願2015-255533(P2015-255533)
(22)【出願日】2015年12月27日
(65)【公開番号】特開2016-126796(P2016-126796A)
(43)【公開日】2016年7月11日
【審査請求日】2018年12月27日
(31)【優先権主張番号】特願2014-266871(P2014-266871)
(32)【優先日】2014年12月27日
(33)【優先権主張国】JP
(73)【特許権者】
【識別番号】596177043
【氏名又は名称】株式会社 ハンモック
(74)【代理人】
【識別番号】100113804
【弁理士】
【氏名又は名称】岩田 敏
(72)【発明者】
【氏名】若山 正美
(72)【発明者】
【氏名】佐藤 夏菜子
(72)【発明者】
【氏名】松尾 有祐
【審査官】 佐藤 実
(56)【参考文献】
【文献】 特開平06−309489(JP,A)
【文献】 特開2006−134106(JP,A)
【文献】 松橋誠 外2名,パーソナルコンピュータとファクシミリによるネットワークシステムの構築 −FAXコネクション−,日立評論,日立評論社,1994年 8月 1日,第76巻 第8号,第21−24頁
(58)【調査した分野】(Int.Cl.,DB名)
G06K 9/00 − 9/82
H04N 1/00
H04N 1/21
(57)【特許請求の範囲】
【請求項1】
全体を活字、又は一部に手書き部分がある以外は活字で作成されたFAXの受信書面をOCR処理する活字OCRシステムであって、
発信元からFAXにより受信した発信元属性データの付随した受信書面をOCR処理し、分類用データベースを用いて、当該受信書面を目的書面と非目的書面に分類する分類機能と、
目的書面に分類された受信書面をOCR処理し、標準的に適用されるグローバルルールと特定の属性データを有する発信元からの受信書面にのみ適用されるローカルルールとを備えた抽出用データベース及びOCR処理を補完する補完用データベースを用いて、当該受信書面から「項目名」「値」「座標」を抽出する抽出機能と、
モニター画面に受信書面の画像と抽出機能によって抽出された当該受信書面の抽出表示とを並列して表示し、「項目名」に対する「値」を確認し、不適切であればオペレータによって正しい「値」に修正し、また、抽出機能によるOCR領域を確認し、不適切であればオペレータによって正しい「項目名」又は「値」のOCR領域を指定し、指定されたOCR領域で再度OCR処理し、改めて「項目名」に対する「値」を確認する確認・修正機能と、
確認・修正機能によって確定された抽出結果を所定の出力フォーマットで出力し、これを目的書面のデータベースへエクスポートするデータ出力機能と、
確認・修正機能によって指定されたOCR領域の情報については当該目的書面に付与された属性データと紐付けされて、ローカルルールに蓄積され、修正された値の情報については補完用データベースに蓄積されて、抽出用データベース及び補完用データベースに反映させる学習機能と、
を備えたことを特徴とする活字OCRシステム。
【請求項2】
全体を活字、又は一部に手書き部分がある以外は活字で作成されたFAXの受信書面をOCR処理する活字OCRシステムであって、
当該活字OCRシステムは、標準的に適用されるグローバルルールと特定の属性データを有する発信元からの受信書面にのみ適用されるローカルルールとをそれぞれ備えた構造辞書・項目辞書・補完用辞書を有し、
構造辞書は、文書の種類、文書の領域情報であるゾーン情報、項目と値の位置関係と値の数に関する情報を含み、
項目辞書は、同義語、値の形式に関する情報を含み、
補完用辞書は、項目ごとに、誤認識しやすい文字とその場所の情報を含み、
発信元からFAXにより受信した発信元属性データの付随した受信書面をOCR処理し、構造辞書・項目辞書・補完用辞書を用いて、当該受信書面を目的書面と非目的書面に分類する分類機能と、
目的書面に分類された受信書面のOCR処理に対して、構造辞書・項目辞書・補完用辞書を用いて、当該受信書面からゾーン情報を基にしてゾーンと項目との関係から項目と値の関係を抽出し、「項目名」「値」「信頼性」「座標」を抽出する抽出機能と、
モニター画面に受信書面の画像と抽出機能によって抽出された当該受信書面の抽出表示とを並列して表示し、「項目名」に対する「値」を確認し、不適切であればオペレータによって正しい「値」に修正する確認・修正機能と、
確認・修正機能によって確定された抽出結果を所定の出力フォーマットで出力し、これを目的書面のデータベースへエクスポートするデータ出力機能と、
確認・修正機能によって修正された値を、構造辞書・項目辞書・補完用辞書に反映させる学習機能と、
を備え、目的書面のレイアウト座標のみに依存せずにデータ化に必要な項目の値の抽出を可能とすることを特徴とした活字OCRシステム。
【請求項3】
請求項2記載の活字OCRシステムによって様々なレイアウトを持つ目的書面を個々の目的書面のレイアウト座標のみに依存せずにデータ化に必要な項目の値を抽出するために文書の目的ごとに論理的に定義されたひとつの仮想帳票に集約すべく仮想帳票の定義内容を設定することで抽出機能と確認・修正機能とデータ出力機能とを一括して設定可能とすることを特徴とした設計機能を備えた活字OCRシステム。
【発明の詳細な説明】
【技術分野】
【0001】
本願発明は、全体を活字、又は一部に手書き部分がある以外は活字(例えば、日付、数量だけ手書き等)で作成されたFAXの受信書面をOCR処理する活字OCRシステムに関するものである。
【背景技術】
【0002】
これまで、FAXにより受信された注文書や連絡書、その他のFAX文書を、相手先毎に自動仕分けする技術として特許文献1に開示されたものがある。
詳しくは、受信したFAXの相手先を自動認識する相手先認識手段2と、自動認識された相手先の情報と関連付けして受信したFAXのイメージデータを格納するイメージデータベース3と、受信したFAXのイメージデータからOCR機能により読み取られた文字情報を格納する文字情報データベース4と、相手先を指定してイメージデータベース3または文字情報データベース4を検索する検索手段5とで受信FAX管理システムを構成するものである。
【先行技術文献】
【特許文献】
【0003】
【特許文献1】特開2002−165076号公報
【発明の概要】
【発明が解決しようとする課題】
【0004】
このような受信FAX管理システムは、受信したFAX文書の送信元である相手先毎に専任のオペレーターが存在することを前提とした上で、当該専任のオペレーターに仕分けるために開発されたシステムである。
【0005】
これに対して、本願出願人は、受信したFAX文書を相手先毎に自動仕分けすることを目的とするものでなく、FAXの受信書面に標準的に適用される「グローバルルール」と特定の受信書面にのみ適用される「ローカルルール」とを用いてシステム自体に学習機能を持たせることを可能とし、OCR処理の精度を高めることのできるこれまでにない新規な活字OCRシステムを提供すべく、本願発明を完成させるに至った。
【課題を解決するための手段】
【0006】
上記目的を達成するために、本願発明の第1の発明は、全体を活字、又は一部に手書き部分がある以外は活字で作成されたFAXの受信書面をOCR処理する活字OCRシステムであって、発信元からFAXにより受信した発信元属性データ(TSIコード又はFAX番号等)の付随した受信書面をOCR処理し、分類用データベースを用いて、当該受信書面を目的書面と非目的書面に分類する分類機能と、目的書面に分類された受信書面をOCR処理し、標準的に適用されるグローバルルールと特定の属性データを有する発信元からの受信書面にのみ適用されるローカルルールとを備えた抽出用データベース及びOCR処理を補完する補完用データベースを用いて、当該受信書面から「項目名」「値」「座標」を抽出する抽出機能と、モニター画面に受信書面の画像と抽出機能によって抽出された当該受信書面の抽出表示とを並列して表示し、「項目名」に対する「値」を確認し、不適切であれば正しい「値」に修正し、また、抽出機能によるOCR領域を確認し、不適切であれば正しいOCR領域を指定し、指定されたOCR領域で再度OCR処理し、改めて「項目名」に対する「値」を確認する確認・修正機能と、確認・修正機能によって確定された抽出結果を所定の出力フォーマットで出力し、これを目的書面のデータベースへエクスポートするデータ出力機能と、確認・修正機能によって指定されたOCR領域及び修正された値を、抽出用データベース及び補完用データベースに反映させる学習機能と、を備えたことを特徴とする活字OCRシステムである。
【0007】
第2の発明は、全体を活字、又は一部に手書き部分がある以外は活字で作成されたFAXの受信書面をOCR処理する活字OCRシステムであって、当該活字OCRシステムは、標準的に適用されるグローバルルールと特定の属性データを有する発信元からの受信書面にのみ適用されるローカルルールとをそれぞれ備えた構造辞書・項目辞書・補完用辞書を有し、構造辞書は、文書の種類、文書のレイアウト情報(ゾーン情報)、項目と値の位置関係と値の数に関する情報を含み、項目辞書は、同義語、値の形式に関する情報を含み、補完用辞書は、項目ごとに、誤認識しやすい文字とその場所の情報を含み、発信元からFAXにより受信した発信元属性データの付随した受信書面をOCR処理し、構造辞書・項目辞書・補完用辞書を用いて、当該受信書面を目的書面と非目的書面に分類する分類機能と、目的書面に分類された受信書面のOCR処理に対して、構造辞書・項目辞書・補完用辞書を用いて、当該受信書面から「項目名」「値」「信頼性」「座標」を抽出する抽出機能と、モニター画面に受信書面の画像と抽出機能によって抽出された当該受信書面の抽出表示とを並列して表示し、「項目名」に対する「値」を確認し、不適切であれば正しい「値」に修正する確認・修正機能と、確認・修正機能によって確定された抽出結果を所定の出力フォーマットで出力し、これを目的書面のデータベースへエクスポートするデータ出力機能と、確認・修正機能によって修正された値を、構造辞書・項目辞書・補完用辞書に反映させる学習機能と、を備え、目的書面のレイアウトに依存せずにデータ化に必要な項目の値の抽出を可能とすることを特徴とした活字OCRシステムである。
また、第2の発明は、請求項2記載の活字OCRシステムによって様々なレイアウトを持つ目的書面を個々の目的書面のレイアウトに依存せずにデータ化に必要な項目の値を抽出するためにひとつの仮想帳票として論理的に定義し、この仮想帳票に基づいて抽出機能と確認・修正機能とデータ出力機能とを一括して設定可能とすることを特徴とした設計機能をを備えてもよい。
【発明の効果】
【0008】
本願発明の第1の発明によれば、以下のような効果を有する。
(1)多く(例えば、70〜80%)のFAX受信書面は、標準的に適用される「グローバルルール」によってOCR処理できる。
(2)それ以外(例えば、20〜30%)のFAX受信書面は、「グローバルルール」によってOCR処理できないものであるが、特定の受信書面にのみ適用される「ローカルルール」によってOCR処理できる。
(3)従って、結果的に全てのFAX受信書面を効率良く且つ確実にOCR処理できる。
(4)しかも、本願発明は、形式の異なるFAX受信書面ごとにそのフォーマットを登録するものではないので、処理するFAX受信書面が増えてもシステムに負荷がかからず、むしろ、学習機能を備えているので、OCR処理をすればするほどその精度が高くなるという効果を有する。
【0009】
本願発明の第2の発明によれば、以下のような効果を有する。
(1)FAX受信書面のレイアウトが変わってもその都度設計し直す必要がなく(再設計することなく)、様々なレイアウトのFAX受信書面であっても、データ化に必要な項目の値を確実に取り出す(抽出する)ことができる。
(2)すなわち、従来の帳票OCRでは、次のような場合には、そのままでは目的とする値を抽出できず、設計し直す必要があるが、本願発明では、FAX受信書面のレイアウト座標に依存しないので、データ化に必要な項目の値を確実に取り出せる(抽出できる)。
・異なる取引先で似たレイアウトだが、微妙に配置やフォントが違う。
・登録した通りのレイアウトでFAX受信できない。
・取引先の拠点毎に、微妙に配置・フォント・印刷設定が異なる。
・枠数・枠幅が増減する。
・NO行の中の行が増減する。
・行が増減する。
(3)また、本願発明の活字OCRシステムによって様々なレイアウトを持つ目的書面を個々の目的書面のレイアウトに依存せずにデータ化に必要な項目の値を抽出するためにひとつの仮想帳票として論理的に定義することで、抽出機能と確認・修正機能とデータ出力機能とを一括して設定することが可能となる(設計機能)。
(4)すなわち、特別なプログラム知識を持たなくても、この設計機能を使用することで、抽出機能と確認・修正機能とデータ出力機能における設定を簡単に行うことができる。そして、それによって、活字OCRシステムの活用の場が広がる。
【図面の簡単な説明】
【0010】
図1】本願発明の第1の発明に関するシステム概念図。
図2】本願発明の第1の発明に関する「確認・修正画面」
図3】本願発明の第2の発明に関する説明図(1)。
図4】本願発明の第2の発明に関する説明図(2)。
図5】本願発明の第2の発明に関する説明図(3)。
図6】本願発明の第2の発明に関する説明図(4)。
図7】本願発明の第2の発明に関する説明図(5)。
図8】本願発明の第2の発明に関する説明図(6)。
図9】本願発明の第2の発明に関するシステム概念図。
図10】本願発明の第2の発明の「仮想帳票」に関する概念図(1)。
図11】本願発明の第2の発明の「仮想帳票」に関する概念図(2)。
【発明を実施するための形態】
【0011】
まず、本願発明で使用する用語について説明する。
[構造辞書」
構造辞書には、以下のような情報が含まれている。
□文書のレイアウト情報(ゾーン情報)
・座標(左上の座標、幅、高さ)
・含まれる項目の項目ID一覧
□項目と値の位置関係と値の数
・右、下、右下、表示なし
・別カラム/同一カラム/カラムなし
・単一/複数(最大数)
[項目辞書]
項目辞書には、以下のような情報が含まれている。
□項目情報
・項目ID
・項目の属性
・同義語グループID
□値の形式
・文字種指定
・テンプレート
・正規表現
□同義語情報
・同義語グループID
・項目1,項目2,項目3…
例)同義語グループID 氏名
項目1 氏名
項目2 ご氏名
項目3 御氏名
項目4 おなまえ
項目5 お名前
項目6 御名前
項目7 ご芳名
[補完用辞書]
補完用辞書には、以下のような情報が含まれている。
□項目ごとに、誤認識しやすい文字とその場所の情報が保存されている。
・項目名
・文字位置
・御認識文字
例)項目名 日付
文字位置 1
正しい文字 日
御認識文字 口

口付→日付
【0012】
[分類用データベース]
FAXの受信書面を分類するために使用する情報が含まれているデータベースである。実際には、抽出用データベースと同じに、構造辞書・項目辞書・補完用辞書を使用することになるので、分類用データベースというものが抽出用データベースと別に存在するわけではない。分類機能の具体的な処理を説明する場合において、分類しようする情報を蓄えてある場所という程度の意味である。
[抽出用データベース]
目的書面内にある項目を抽出するために使用する情報が含まれているデータベースである。実際には、分類用データベースと同じに、構造辞書・項目辞書・補完用辞書を使用することになるので、抽出用データベースというものが分類用データベースと別に存在するわけではない。抽出機能の具体的な処理を説明する場合において、抽出しようする項目と値の情報を蓄えてある場所という程度の意味である。
[補完用データベース]
補完用辞書とほぼ同じ意味で使われている。データベースという言葉が器を指すニュアンスが強く、辞書は器の中に入る内容を指すニュアンスが強い。
【0013】
[得意先別翻訳マスタ]
得意先の品番と自社の品番が異なるとき、得意先の品番を自社の品番に置き換える必要があり、製品名についても同様である。得意先の品番や商品名と自社の品番や製品名の対応付けを行っているのが得意先翻訳マスタである。
[得意先別いつものマスタ]
得意先が発注時に指定する際に、製品名ではなく得意先で使用されている通称などが使用される場合がある。また、色や形状などの細かい仕様については記述されていない場合もある。その際に過去の購入情報をもとにいつも購入している製品の製品名、品番、枝版、仕様を特定して置き換える必要がある。そのような情報を保持しているのかが得意先別いつものマスタである。
【0014】
[グローバルルール]
構造辞書、項目辞書、補完用辞書の中で、特定の得意先に依存しない情報の属性を「グローバル」としている。このグローバルの属性をもった辞書の内容を総称してグローバルルールと称する。
[ローカルルール]
構造辞書、項目辞書、補完用辞書の中で、特定の得意先のための情報の属性を「ローカル」としている。このローカルの属性をもった辞書の内容を総称しローカルルールと称する。
【0015】
次に、本願発明の実施形態を図面に基づいて説明する。
図1は、本願発明の第1の発明に関するシステム概念図を図示したものである。本願発明の活字OCRシステムは、大きく「分類機能」「抽出機能」「確認・修正機能」「データ出力機能」「学習機能」から構成される。以下、各機能ごとに説明する。
【0016】
まず、「分類機能」は、FAXで受信した書面(受信書面)をOCR処理する目的の「書面(目的書面)」か「目的外の書面(非目的書面)」かに分類する機能である。
分類の作業としては、発信元からFAXにより受信した発信元属性データ(TSIコード又はFAX番号等)の付随した受信書面を全体的にOCR処理する。
そして、分類用データベースを用いて、「目的書面」と「非目的書面」に分類する。
ここで、「分類用データベース」は、受信書面を目的書面又は非目的書面に分類できる「用語の定義」や「分類のルール」等を備えたものである。例えば、目的書面が「注文書」の場合に、注文書を定義し、注文書と同義語の書面(「発注書」「依頼書」等)を目的書面として分類できるようにする。
【0017】
次に、「抽出機能」は、目的書面から必要な「項目名」「値」「座標」を抽出する機能である。
抽出の作業としては、目的書面をOCR処理する。そして、抽出用データベースおよび補完用データベースを用いて、「項目名」「値」「座標」を抽出する。
ここで、抽出用データベースは、受信書面から「項目名」「値」を抽出できる「同義語辞書」や「項目名と値の配置」「項目別の値パターン」等を備えたものである。すなわち、目的書面から「項目名」を抽出する場合、項目名の表現にバラツキがあるので、「同義語辞書」で吸収して正規化を行う。例えば、「氏名」「なまえ」「名前」「お名前」「ご芳名」といったものを「氏名」という項目で代表する。また、「項目名」に対応した「値(数量・品名)」を抽出する場合、その抽出方法は「項目名」をテキストアンカーという目印として使い、その周辺(上下左右と斜め方向:項目名と値の配置で定義・設定)で「項目名」に対応する「値」のパターン(項目別の値パターン)から検索して抽出する。なお、「項目名」と「値」が同じ矩形領域の箱に含まれている場合にも対応する。
また、この抽出用データベースは、標準的に適用される「グローバルルール」と特定の属性データを有する発信元からの受信書面にのみ適用される「ローカルルール」とに分けられる。グローバルルールは、FAX受信書面の7割〜8割方で適用され得るルールで、このグローバルルールを適用できない残りの2割〜3割のFAX受信書面に適用されるのがローカルルールである。ローカルルールは、FAXを受信する際に画像とともに受信する発信元属性データ(TSIコード又はFAX番号等)ごとに蓄積される。すなわち、同じ発信元からの受信書面であれば、同じフォーマットの書面であり、同じルールが適用できるからである。
【0018】
次に、補完用データベースを用いた「補完機能」及び「標準化・正規化機能」について説明する。まず「補完機能」はOCR結果が誤って認識した文字を含む場合に、N-gram法などに代表されるような、あいまいな文字列から正しい文字列を見つけ出す手法を使って、あらかじめ正しい文字列が登録された補完用データベースからもっとも近い文字列を取り出して抽出結果の文字列を置き換える機能である。たとえば、アルファベットと数字が混在した製品コードをOCRが認識する場合、大文字のI(アイ)と小文字l(エル)と数字の1(イチ)、大文字のO(オー)と数字の0(ゼロ)、M/m(エム)とN/n(エヌ)、V/v(ブイ)とY/y(ワイ)などを明確に識別することは非常に困難となるが、この「補完機能」によってOCRの認識結果を正しい製品コードに補完できる可能性の大幅な向上を期待できる。
【0019】
また「標準化・正規化機能」は、送信元ごとに存在する独自に定められたコード体系や慣用的な通称や略称を、受信側で定められた標準化されたコードや正式な名称に変換することを目的とする。変換にあたっては、OCRによる誤った文字の認識を考慮し、「補完機能」と同様なN-gram法などに代表される「あいまい検索」を使って慣用データベースの検索を行い、一致した文字列に対応する標準化されたコードや正式な名称の取得をおこない抽出結果を置き換える機能である。この「標準化・正規化機能」によって、送信元ごとに異なる暗黙のルールを標準的なルールに則したコードや名称に変換することができる。
【0020】
次に、「確認・修正機能」は、抽出機能で抽出した「値」「OCR領域」を確認・修正する機能である。
その確認・修正機能は、「確認・修正画面」で行われる(図2)。「確認・修正画面」は、目的書面の受信画像と、抽出機能によって当該受信画像から抽出した「項目名」と「値」のデータを表示する抽出表示とを並記したものである。
確認機能は、抽出表示の抽出された「項目名」や「値」の欄を指定すると、これに対応する受信画像の該当部分が識別できるようになり(色枠で表示、背景や文字・数字を別 色で表示など)、確認が極めて容易になる。
修正機能は、抽出した「値」と抽出した「エリア(領域)」で異なる処理を行う。抽出対象の「エリア(領域)」は間違っていないが、そこから抽出された「値」が間違えていた場合(例えば、「3」と読み取るところを「8」と読み取っていた場合)は、正しい「値」を抽出表示に入力し直す(オペレータの手作業)。
一方、抽出対象の「エリア(領域)」を間違えた場合は、正しい「エリア(領域)」を受信画像上で指定(選択)し、その指定領域をOCR処理させて正しい「項目名」又は「値」を抽出し、抽出表示に自動的に入力させるようにする。
【0021】
また、「データ出力機能」は、データ出力機能は、確認・修正したデータを所定の出力フォーマットの形で出力し、エクスポート(目的書面のデータベースへ保存等)するものである。
【0022】
最後に、「学習機能」は、前記確認・修正機能において、抽出対象の「エリア(領域)」を間違えた場合は、正しい「エリア(領域)」を受信画像上で指定(選択)するが、このとき、この指定領域の情報は当該目的書面に付与された属性データ(発信元情報)と紐付けされて、「ローカル(個別)ルール」に蓄積される。以後、当該属性データ(発信元情報)を付与された目的書面については、抽出機能において「グローバル(標準)ルール」に優先されてこの「ローカル(個別)ルール」が適用されて処理されることになる。
また、抽出する「値」を間違えた場合は、正しい「値」に修正するが、このとき、この修正された「値」の情報は補完用データベースに蓄積される。以後、抽出機能において、この補完用データベースが用いられて「値」が自動的に補完され抽出される。
【0023】
図3図8は、本願発明の第2の発明に関する説明図である。
本願発明の第2の発明は、全体を活字、又は一部に手書き部分がある以外は活字で作成されたFAXの受信書面(FAX受信書面)を、構造辞書・項目辞書・補完用辞書を用いて分析・抽出する。例えば、図の文書を例に説明すると、図示するようにFAX受信書面を「表題ゾーン」「発注先ゾーン」「発注元ゾーン」「メイン明細ゾーン」「共通ゾーン1」「共通ゾーン2」「共通ゾーン3」「共通ゾーン4」「共通ゾーン5」と分析する。分析の方法としては、「表題ゾーン」を例に挙げると、表題は一般的に書面の上段中央部に配置されて、文書名が記載されることが多い(これらの情報は、構造辞書・項目辞書等に蓄積されている)。図3のFAX受信書面では、書面の上段中央部に「注文書」と記載されていることから、構造辞書及び項目辞書等を用いることで、この「注文書」と記載されている領域が「表題ゾーン」であると分析する。同様に、「発注先ゾーン」〜「共通ゾーン5」について分析する。
【0024】
(分類機能)
そして、「表題ゾーン」に記載されている表題(値)によって、目的書面と非目的書面に分類する。目的書面を「注文書」とするならば、「表題ゾーン」に「注文書」又は注文書と同義語で記載されているもの(これは項目辞書を用いることで、「発注書」「御注文書」などを同義語と認識できる)を目的書面と判断する。
【0025】
(抽出機能)
次に、目的書面から「項目名」「値」「信頼性」「座標」を抽出する。「注文書」であれば、例えば「項目名」は商品番号、「値」は数量となる。商品番号や数量は、メイン明細ゾーンに記載されているので(その情報は構造辞書に蓄積)、メイン明細ゾーンに記載されている記載内容から(「座標」と構造辞書で認識できる)、文字種(商品番号であれば数字や英字による表記、数量であれば数字のみ又は数字と単位による表記)、テンプレート(A会社の商品番号であれば、XXXNNNN−XNなど)、「項目名」と「値」の位置関係(数量は商品番号の右側又は下側:構造辞書に蓄積)などの情報を用いて、抽出される。
なお、数量などは、一般的に(各社共通で)算用数字で表記されるので、標準的に適用されるグローバルルールとして「数量は算用数字で表記されたもの」と構造辞書・項目辞書・補完用辞書に備えることになる。
一方、注文書番号などは、取引各社による共通ルールとして表記が一致することは期待できないが、会社・部署ごとに共通する場合もあるので、特定の属性データを有する発信元からの受信書面にのみ適用されるローカルルールとして「A会社の注文書番号はANNNN−N」などと構造辞書・項目辞書・補完用辞書に備えることになる。
なお、図8に図示するように、「項目名」の背景に着色や網掛けがされている場合に、一般的なOCR技術であれば、そこから項目名を認識し、値を抽出することは極めて困難であるが、本願発明では補完用辞書やローカルルール等を適用して値の抽出を可能にしている。
また、補完用辞書や得意先別翻訳マスタ・得意先別いつものマスタなどを用いて、OCR認識を自動的に補完・置き換えなどをして、その結果を抽出結果とすることで、OCR認識を支援する。万一、OCRの結果、「信頼性」の低いものがあれば、次の確認・修正機能でそれが分かるように表示する。
【0026】
(確認・修正機能)
確認・修正機能については、モニター画面に受信書面の画像(左)と抽出機能によって抽出された当該受信書面の抽出表示(右)とを並列して表示し、「項目名」に対する「値」を確認し、不適切であれば正しい「値」に修正する(図2参照)。
【0027】
図9は、本願発明の第2の発明に関するシステム概念図を図示したものである。
ここでは、目的書面の種類を「注文書」として説明する。なお、「分類機能」については、図1に示す第1の発明と同じであるので、その説明を省略するが、目的書面が「注文書」であるため、注文書、発注書、オーダーフォームとよばれる文書のみを抽出する必要がある。
【0028】
次の「抽出機能」では、入力された文書から、抽出用データベース(構造辞書・項目辞書・補完用辞書)を使って、必要な項目の値を取り出す。「注文書」においては、得意先名、注文日時、品番、商品名、単価、数量、合計金額、希望納期などが抽出されるべき項目となる。
抽出機能では、OCR結果を、「項目名、値、信頼性、座標」のセットして取り扱う。例としては、「得意先名、○×商事、85%、(972, 246)-(1331,308)」などである。OCRエンジンによって信頼性の解釈が異なり、画像の解像度によって座標の返す値の範囲が異なることを考慮する必要はあるものの、これらの4つの情報は何らかの方法で取得できるはずのものとして取り扱う。
図示するように、分類機能で行った1回目のOCR処理或いは1回目のOCR処理では不十分であれば2回目のOCR処理に対して、ゾーン情報を基にして、ゾーンと項目との関係から項目と値の関係を抽出する。例えば、ゾーンAは、注文書の中段より上側の右端に配置されており、項目として「会社名」「TEL」「FAX」があるので、これを発注元として抽出し、項目と値の関係を抽出する。また、ゾーンBは、注文書の下半分に位置しており、これを注文数量として抽出する。
【0029】
なお、この抽出機能については、補完用データベース(補完用辞書)を使用して、OCRで誤認識となった文字を正しい文字に置き換える補完機能を備えても良い。文字を正しい文字に置き換える際に、文字単位ではなく単語ごとに誤認識のパターンを保持して、単語を正しいものに修正するような動作を前提にしている。
例えば、「発 シ 主 日 目 寺」→「発注日時」などである。
また、得意先別翻訳マスタを使用して、得意先の品番や製品名を自社の品番や製品名に置き換える機能(標準化・正規化機能)を備えても良い。
【0030】
続く「確認・修正機能」は、OCR結果で信頼性が低い文字を人が目で見て確認を行い、正しい文字に修正する機能である。一般的に、画面の片側に認識対象の画像、もう片側に認識結果の文字が表示され、認識結果の文字は修正可能になっている。
また「データ出力機能」は、OCR認識、確認修正作業などを経た後、最終的に出力される形式を指定して、リレーショナルデータベースやCSVファイルなどに出力する。
更に「学習機能」は、確認・修正機能において、修正した内容を補完用データベース(補完用辞書)に蓄積し、以降のOCR認識結果を補完する際に有効活用する。
【0031】
また、第2の発明には「仮想帳票」という特徴を有する。
図10及び図11において、「仮想帳票」について説明する。
図10に図示するように、従来は、各文書(同一レイアウトの文書)ごとに設定された処理内容で作業が進められていた。
これに対して、本願発明(第2の発明)は、各文書を論理的に定義された「仮想帳票」に集約することを技術思想としており、この仮想帳票に落とし込むために上記した構造辞書・項目辞書・補完用辞書を或いはグローバルルール・ローカルルールを用いて各文書のレイアウトに依存せずにデータ化に必要な項目の値を抽出している(図11:仮想帳票と各種辞書の連関図)。
従って、従来は、各文書(同一レイアウトの文書)ごとそして各作業(例えば、抽出、確認・修正、出力)ごとに設定が必要であったが、本願発明では、理論的に定義された仮想帳票の定義内容を設定するだけで、各文書(各レイアウト)ごと及び各作業ごとの設定が当然に不要となる。換言すれば、本願発明では、仮想帳票を中心にして仮想帳票を作成するために各作業が進められているので、仮想帳票の定義(設定)が決まれば、その他の設定は基本的にいらないのである。
【0032】
仮想帳票は、特定のレイアウトに依存しない帳票で、「注文書」「見積依頼書」「作業依頼書」など文書の目的ごとに作成される帳票で、以下のような情報を含んでいる。
□文書の種類(注文書、見積依頼書、連絡票など)
・文書種別ID
・文書種別名
・文書種別の説明
□使用する項目の一覧
仮想帳票を定義する場合に中心となるのが項目の情報である。「注文書」であれば、文書名、注文書番号、注文書日付、発注元、発注元電話番号、発注元FAX番号、品番、品名、単価、数量、合計金額、消費税などの項目が必要となり、これらの項目の情報を項目辞書への参照方法(項目ID)として保持する。
□対応する構造辞書
仮想帳票には、書面のレイアウトについての情報や、項目の値の配置に関する情報がない。これらの情報は構造辞書にあるため、対応する構造辞書への参照情報(文書種別IDEA)を保持する。
□確認修正用画面レイアウト
具体的な個々の帳票の項目の物理的な配置に依存しない、一般的な帳票の項目の配置をして、目視で内容をチェックする効率があがるようなレイアウト
□出力フォーマット
具体的な個々の帳票に記載されている項目の形式に依存しない、日付や金額の形式が統一された形でリレーショナルデータベースやCSVファイルに出力される設定
□ロジカルチェック
明細に書かれた金額の合計と合計金額欄に書かれた金額が一致するか、希望納期が注文日時よりも充分な日数分後になっているかなど論理的なチェックロジックの設定
□DBルックアップ
入力する項目がいくつかの選択肢に限られる場合に、選択可能な項目を設定。支払い方法が「現金、クレジットカード、代引、納品後振込み」から選択できるなどの設定
【産業上の利用可能性】
【0033】
一般的に活字OCRといった場合、カラー画像や高解像度の画像を前提としているため、対象画像が理想的な品質でなければ期待どおりのOCR結果を抽出することはできない。しかしながら、本願発明は、FAXや複写による白黒画像や解像度の低い画像で現実的には画像品質の悪い書面からOCR結果を取り出すことが可能となるため、FAXの注文書や請求書、ドットプリンタによる伝票などからのデータ抽出、原本が添付できない本人確認書(パスポート・運転免許書)の白黒コピー・グレイスケールコピーから必要なデータを抽出することが可能となる。また、設計機能(デザイン機能)を備えているので、ニーズにあわせて設定を行えば、目的のデータを効率よく抽出し活用できる。
図1
図2
図3
図4
図5
図6
図7
図8
図9
図10
図11