IP Force 特許公報掲載プロジェクト 2022.1.31 β版

知財求人 - 知財ポータルサイト「IP Force」

▶ Sansan株式会社の特許一覧

特許7421866学習情報製造装置、情報処理装置、学習情報の製造方法、情報処理方法、およびプログラム
<>
  • 特許-学習情報製造装置、情報処理装置、学習情報の製造方法、情報処理方法、およびプログラム 図1
  • 特許-学習情報製造装置、情報処理装置、学習情報の製造方法、情報処理方法、およびプログラム 図2
  • 特許-学習情報製造装置、情報処理装置、学習情報の製造方法、情報処理方法、およびプログラム 図3
  • 特許-学習情報製造装置、情報処理装置、学習情報の製造方法、情報処理方法、およびプログラム 図4
  • 特許-学習情報製造装置、情報処理装置、学習情報の製造方法、情報処理方法、およびプログラム 図5
  • 特許-学習情報製造装置、情報処理装置、学習情報の製造方法、情報処理方法、およびプログラム 図6
  • 特許-学習情報製造装置、情報処理装置、学習情報の製造方法、情報処理方法、およびプログラム 図7
  • 特許-学習情報製造装置、情報処理装置、学習情報の製造方法、情報処理方法、およびプログラム 図8
  • 特許-学習情報製造装置、情報処理装置、学習情報の製造方法、情報処理方法、およびプログラム 図9
  • 特許-学習情報製造装置、情報処理装置、学習情報の製造方法、情報処理方法、およびプログラム 図10
  • 特許-学習情報製造装置、情報処理装置、学習情報の製造方法、情報処理方法、およびプログラム 図11
  • 特許-学習情報製造装置、情報処理装置、学習情報の製造方法、情報処理方法、およびプログラム 図12
  • 特許-学習情報製造装置、情報処理装置、学習情報の製造方法、情報処理方法、およびプログラム 図13
  • 特許-学習情報製造装置、情報処理装置、学習情報の製造方法、情報処理方法、およびプログラム 図14
  • 特許-学習情報製造装置、情報処理装置、学習情報の製造方法、情報処理方法、およびプログラム 図15
  • 特許-学習情報製造装置、情報処理装置、学習情報の製造方法、情報処理方法、およびプログラム 図16
  • 特許-学習情報製造装置、情報処理装置、学習情報の製造方法、情報処理方法、およびプログラム 図17
  • 特許-学習情報製造装置、情報処理装置、学習情報の製造方法、情報処理方法、およびプログラム 図18
  • 特許-学習情報製造装置、情報処理装置、学習情報の製造方法、情報処理方法、およびプログラム 図19
  • 特許-学習情報製造装置、情報処理装置、学習情報の製造方法、情報処理方法、およびプログラム 図20
  • 特許-学習情報製造装置、情報処理装置、学習情報の製造方法、情報処理方法、およびプログラム 図21
  • 特許-学習情報製造装置、情報処理装置、学習情報の製造方法、情報処理方法、およびプログラム 図22
< >
(19)【発行国】日本国特許庁(JP)
(12)【公報種別】特許公報(B2)
(11)【特許番号】
(24)【登録日】2024-01-17
(45)【発行日】2024-01-25
(54)【発明の名称】学習情報製造装置、情報処理装置、学習情報の製造方法、情報処理方法、およびプログラム
(51)【国際特許分類】
   G06F 16/583 20190101AFI20240118BHJP
   G06Q 40/12 20230101ALI20240118BHJP
【FI】
G06F16/583
G06Q40/12
【請求項の数】 14
(21)【出願番号】P 2019043848
(22)【出願日】2019-03-11
(65)【公開番号】P2020149113
(43)【公開日】2020-09-17
【審査請求日】2022-03-03
(73)【特許権者】
【識別番号】507384939
【氏名又は名称】Sansan株式会社
(74)【代理人】
【識別番号】100115749
【弁理士】
【氏名又は名称】谷川 英和
(72)【発明者】
【氏名】寺田 親弘
(72)【発明者】
【氏名】柴野 亮
【審査官】齊藤 貴孝
(56)【参考文献】
【文献】特開2008-204457(JP,A)
【文献】特開2006-127499(JP,A)
【文献】特開2018-067180(JP,A)
【文献】特開2017-134502(JP,A)
【文献】特開平07-152856(JP,A)
【文献】特開2003-115028(JP,A)
(58)【調査した分野】(Int.Cl.,DB名)
G06F 16/00-16/958
G06Q 10/00-99/00
(57)【特許請求の範囲】
【請求項1】
請求書画像を受け付ける請求書画像受付部と、
前記請求書画像受付部が受け付けた請求書画像を出力する請求書画像出力部と、
前記請求書画像出力部が出力した請求書画像に対して、請求に関連する2種類以上の請求関連情報の領域を特定する領域特定情報を、請求関連情報の種類を特定する種類識別子に対応付けて、請求関連情報ごとに受け付ける領域特定情報受付部と、
前記領域特定情報により特定される2以上の各領域に記載された文字列である請求関連情報を、種類識別子に対応付けて取得する請求関連情報取得部と、
前記領域特定情報と前記種類識別子と、当該領域特定情報に対応する請求関連情報との組である2以上の組情報を用いて、学習情報を構成する学習情報構成部と、
前記学習情報を蓄積する学習情報蓄積部とを具備し、
前記請求関連情報取得部は、
前記請求書画像受付部が受け付けた請求書画像に対して文字認識処理を行い、第一の請求関連情報を取得する文字認識手段と、
手入力された第二の請求関連情報を受け付ける請求関連情報受付手段と、
前記第一の請求関連情報と前記第二の請求関連情報とが一致する場合に、前記第一の請求関連情報または前記第二の請求関連情報を蓄積される請求関連情報として決定する決定手段とを具備し、
前記学習情報構成部は、
前記領域特定情報と、前記決定手段が決定した前記請求関連情報との組、1組以上を用いて、前記学習情報を構成す学習情報製造装置。
【請求項2】
請求書画像を受け付ける請求書画像受付部と、
前記請求書画像受付部が受け付けた請求書画像を出力する請求書画像出力部と、
前記請求書画像出力部が出力した請求書画像に対して、請求に関連する2種類以上の請求関連情報の領域を特定する領域特定情報を、請求関連情報の種類を特定する種類識別子に対応付けて、請求関連情報ごとに受け付ける領域特定情報受付部と、
前記領域特定情報により特定される2以上の各領域に記載された文字列である請求関連情報を、種類識別子に対応付けて取得する請求関連情報取得部と、
前記領域特定情報と前記種類識別子と、当該領域特定情報に対応する請求関連情報との組である2以上の組情報を用いて、学習情報を構成する学習情報構成部と、
前記学習情報を蓄積する学習情報蓄積部とを具備し、
前記請求関連情報取得部は、
2以上の各ユーザにより手入力された2以上の第二の請求関連情報を受け付ける請求関連情報受付手段と、
前記2以上の第二の請求関連情報の一致度が条件を満たす場合に、当該第二の請求関連情報を蓄積される請求関連情報として決定する決定手段とを具備し、
前記学習情報構成部は、
前記領域特定情報と、前記決定手段が決定した請求関連情報との組を、1組以上を用いて、学習情報を構成す学習情報製造装置。
【請求項3】
前記学習情報構成部は、
前記領域特定情報と、当該領域特定情報に対応する請求関連情報との組である2以上の組情報を有する請求書元情報を構成する請求書元情報構成手段を具備し、
前記学習情報は、前記請求書元情報を含む、請求項記載の学習情報製造装置。
【請求項4】
前記学習情報構成部は、
前記領域特定情報と、当該領域特定情報に対応する請求関連情報との組である2以上の組情報を用いて、機械学習のアルゴリズムにより、学習器を生成する学習手段を具備し、
前記学習情報は、前記学習器を含む、請求項1から請求項いずれか一項に記載の学習情報製造装置。
【請求項5】
前記2種類以上の請求関連情報は、請求元の組織名を含む請求元の組織に関する請求元組織情報、支払先に関する1以上の支払先情報、請求額に関する請求額情報、支払期日に関する支払期日情報を含む、請求項1から請求項いずれか一項に記載の学習情報製造装置。
【請求項6】
請求に関連する請求関連情報と当該請求関連情報の種類を特定する種類識別子と、当該請求関連情報の領域を特定する領域特定情報との組である2以上の組情報を用いて構成された学習情報が格納される学習情報格納部と、
請求書画像を受け付ける請求書画像受付部と、
前記請求書画像受付部が受け付けた請求書画像に関する情報である受付情報と、前記学習情報格納部の学習情報とを用いて、2種類以上の請求関連情報を有する請求書情報を取得する請求書情報取得部と、
前記請求書情報を出力する請求書情報出力部とを具備し、
前記学習情報は、請求書元情報を含み、
前記請求書情報取得部は、
前記請求書画像受付部が受け付けた前記請求書画像を用いて、前記学習情報格納部を検索し、当該受付情報に対応する請求書元情報の一部であり、固定的な情報である1以上の固定請求関連情報を取得し、当該1以上の固定請求関連情報を含む請求書情報を取得する情報処理装置。
【請求項7】
前記請求書情報取得部は、
前記請求書画像に対応する請求書元情報が存在するか否かを判断する判断手段と、
前記判断手段が前記請求書画像に対応する請求書元情報が存在すると判断した場合に、前記1以上の固定請求関連情報を取得し、当該1以上の固定請求関連情報を含む請求書情報を取得する請求書情報取得手段とを具備し、
前記請求書画像受付部が受け付けた請求書画像を出力する請求書画像出力部と、
前記判断手段が前記請求書画像に対応する請求書元情報が存在しないと判断した場合に、前記請求書画像出力部が出力した請求書画像に対して、請求に関連する2種類以上の請求関連情報の領域を特定する領域特定情報を、請求関連情報ごとに受け付ける領域特定情報受付部と、
前記領域特定情報により特定される2以上の各領域に記載された文字列である請求関連情報を取得する請求関連情報取得部と、
前記領域特定情報と、当該領域特定情報に対応する請求関連情報との組である2以上の組情報を用いて、学習情報を構成する学習情報構成部と、
前記学習情報を蓄積する学習情報蓄積部とをさらに具備し、
前記請求書情報取得部は、
前記請求関連情報取得部が取得した2種類以上の請求関連情報を有する請求書情報を取得する請求項記載の情報処理装置。
【請求項8】
前記請求書情報出力部が出力した前記請求書情報に対する修正を受け付ける修正受付部と、
前記修正受付部が受け付けた修正により、修正された請求書情報を蓄積する請求書情報蓄積部とを具備する請求項6または請求項記載の情報処理装置。
【請求項9】
請求書画像受付部と、請求書画像出力部と、領域特定情報受付部と、請求関連情報取得部と、学習情報構成部と、学習情報蓄積部とにより実現される学習情報の製造方法であって、
前記請求書画像受付部が、請求書画像を受け付ける請求書画像受付ステップと、
前記請求書画像出力部が、前記請求書画像受付ステップで受け付けられた請求書画像を出力する請求書画像出力ステップと、
前記領域特定情報受付部が、前記請求書画像出力ステップで出力された請求書画像に対して、請求に関連する2種類以上の請求関連情報の領域を特定する領域特定情報を、請求関連情報の種類を特定する種類識別子に対応付けて、請求関連情報ごとに受け付ける領域特定情報受付ステップと、
前記請求関連情報取得部が、前記領域特定情報により特定される2以上の各領域に記載された文字列である請求関連情報を、種類識別子に対応付けて取得する請求関連情報取得ステップと、
前記学習情報構成部が、前記領域特定情報と前記種類識別子と、当該領域特定情報に対応する請求関連情報との組である2以上の組情報を用いて、学習情報を構成する学習情報構成ステップと、
前記学習情報蓄積部が、前記学習情報を蓄積する学習情報蓄積ステップとを具備し、
前記請求関連情報取得ステップにおいて、
前記請求書画像受付部が受け付けた請求書画像に対して文字認識処理を行い、第一の請求関連情報を取得する文字認識サブステップと、
手入力された第二の請求関連情報を受け付ける請求関連情報受付サブステップと、
前記第一の請求関連情報と前記第二の請求関連情報とが一致する場合に、前記第一の請求関連情報または前記第二の請求関連情報を蓄積される請求関連情報として決定する決定サブステップとを具備し、
前記学習情報構成ステップにおいて、
前記領域特定情報と、前記決定サブステップにおいて決定された前記請求関連情報との組、1組以上を用いて、前記学習情報を構成する、学習情報の製造方法。
【請求項10】
請求書画像受付部と、請求書画像出力部と、領域特定情報受付部と、請求関連情報取得部と、学習情報構成部と、学習情報蓄積部とにより実現される学習情報の製造方法であって、
前記請求書画像受付部が、請求書画像を受け付ける請求書画像受付ステップと、
前記請求書画像出力部が、前記請求書画像受付ステップで受け付けられた請求書画像を出力する請求書画像出力ステップと、
前記領域特定情報受付部が、前記請求書画像出力ステップで出力された請求書画像に対して、請求に関連する2種類以上の請求関連情報の領域を特定する領域特定情報を、請求関連情報の種類を特定する種類識別子に対応付けて、請求関連情報ごとに受け付ける領域特定情報受付ステップと、
前記請求関連情報取得部が、前記領域特定情報により特定される2以上の各領域に記載された文字列である請求関連情報を、種類識別子に対応付けて取得する請求関連情報取得ステップと、
前記学習情報構成部が、前記領域特定情報と前記種類識別子と、当該領域特定情報に対応する請求関連情報との組である2以上の組情報を用いて、学習情報を構成する学習情報構成ステップと、
前記学習情報蓄積部が、前記学習情報を蓄積する学習情報蓄積ステップとを具備し、
前記請求関連情報取得ステップは、
2以上の各ユーザにより手入力された2以上の第二の請求関連情報を受け付ける請求関連情報受付サブステップと、
前記2以上の第二の請求関連情報の一致度が条件を満たす場合に、当該第二の請求関連情報を蓄積される請求関連情報として決定する決定サブステップとを具備し、
前記学習情報構成ステップにおいて、
前記領域特定情報と、前記決定サブステップで決定された前記請求関連情報との組を、1組以上を用いて、前記学習情報を構成する、学習情報の製造方法。
【請求項11】
請求に関連する請求関連情報と当該請求関連情報の種類を特定する種類識別子と、当該請求関連情報の領域を特定する領域特定情報との組である2以上の組情報を用いて構成された学習情報が格納される学習情報格納部と、請求書画像受付部と、請求書情報取得部と、請求書情報出力部とにより実現される情報処理方法であって、
前記請求書画像受付部が、請求書画像を受け付ける請求書画像受付ステップと、
前記請求書情報取得部が、前記請求書画像受付ステップで受け付けられた請求書画像に関する情報である受付情報と、前記学習情報格納部の学習情報とを用いて、2種類以上の請求関連情報を有する請求書情報を取得する請求書情報取得ステップと、
前記請求書情報出力部が、前記請求書情報を出力する請求書情報出力ステップとを具備し、
前記学習情報は、請求書元情報を含み、
前記請求書情報取得ステップにおいて、
前記請求書画像受付部が受け付けた前記請求書画像を用いて、前記学習情報格納部を検索し、当該受付情報に対応する請求書元情報の一部であり、固定的な情報である1以上の固定請求関連情報を取得し、当該1以上の固定請求関連情報を含む請求書情報を取得する、情報処理方法。
【請求項12】
コンピュータを、
請求書画像を受け付ける請求書画像受付部と、
前記請求書画像受付部が受け付けた請求書画像を出力する請求書画像出力部と、
前記請求書画像出力部が出力した請求書画像に対して、請求に関連する2種類以上の請求関連情報の領域を特定する領域特定情報を、請求関連情報の種類を特定する種類識別子に対応付けて、請求関連情報ごとに受け付ける領域特定情報受付部と、
前記領域特定情報により特定される2以上の各領域に記載された文字列である請求関連情報を、種類識別子に対応付けて取得する請求関連情報取得部と、
前記領域特定情報と前記種類識別子と、当該領域特定情報に対応する請求関連情報との組である2以上の組情報を用いて、学習情報を構成する学習情報構成部と、
前記学習情報を蓄積する学習情報蓄積部として機能させるためのプログラムであって、
前記請求関連情報取得部は、
前記請求書画像受付部が受け付けた請求書画像に対して文字認識処理を行い、第一の請求関連情報を取得する文字認識手段と、
手入力された第二の請求関連情報を受け付ける請求関連情報受付手段と、
前記第一の請求関連情報と前記第二の請求関連情報とが一致する場合に、前記第一の請求関連情報または前記第二の請求関連情報を蓄積される請求関連情報として決定する決定手段とを具備し、
前記学習情報構成部は、
前記領域特定情報と、前記決定手段が決定した前記請求関連情報との組を、1組以上を用いて、前記学習情報を構成するものとして、前記コンピュータを機能させるためのプログラム
【請求項13】
コンピュータを、
請求書画像を受け付ける請求書画像受付部と、
前記請求書画像受付部が受け付けた請求書画像を出力する請求書画像出力部と、
前記請求書画像出力部が出力した請求書画像に対して、請求に関連する2種類以上の請求関連情報の領域を特定する領域特定情報を、請求関連情報の種類を特定する種類識別子に対応付けて、請求関連情報ごとに受け付ける領域特定情報受付部と、
前記領域特定情報により特定される2以上の各領域に記載された文字列である請求関連情報を、種類識別子に対応付けて取得する請求関連情報取得部と、
前記領域特定情報と前記種類識別子と、当該領域特定情報に対応する請求関連情報との組である2以上の組情報を用いて、学習情報を構成する学習情報構成部と、
前記学習情報を蓄積する学習情報蓄積部として機能させるためのプログラムであって、
前記請求関連情報取得部は、
2以上の各ユーザにより手入力された2以上の第二の請求関連情報を受け付ける請求関連情報受付手段と、
前記2以上の第二の請求関連情報の一致度が条件を満たす場合に、当該第二の請求関連情報を蓄積される請求関連情報として決定する決定手段とを具備し、
前記学習情報構成部は、
前記領域特定情報と、前記決定手段が決定した請求関連情報との組を、1組以上を用いて、学習情報を構成するものとして、前記コンピュータを機能させるためのプログラム。
【請求項14】
請求に関連する請求関連情報と当該請求関連情報の種類を特定する種類識別子と、当該請求関連情報の領域を特定する領域特定情報との組である2以上の組情報を用いて構成された学習情報が格納される学習情報格納部にアクセス可能なコンピュータを、
請求書画像を受け付ける請求書画像受付部と、
前記請求書画像受付部が受け付けた請求書画像に関する情報である受付情報と、前記学習情報格納部の学習情報とを用いて、2種類以上の請求関連情報を有する請求書情報を取得する請求書情報取得部と、
前記請求書情報を出力する請求書情報出力部として機能させるためのプログラムであって、
前記学習情報は、請求書元情報を含み、
前記請求書情報取得部は、
前記請求書画像受付部が受け付けた前記請求書画像を用いて、前記学習情報格納部を検索し、当該受付情報に対応する請求書元情報の一部であり、固定的な情報である1以上の固定請求関連情報を取得し、当該1以上の固定請求関連情報を含む請求書情報を取得するものとして、前記コンピュータを機能させるためのプログラム
【発明の詳細な説明】
【技術分野】
【0001】
本発明は、請求書画像を用いて、請求書に関する情報を処理する情報処理装置等に関するものである。
【背景技術】
【0002】
従来、コンピュータシステムのサーバとクライエント間に設定され、請求書等の書面を画像として読み取り、会計処理はもちろん、抽出、分類、集計などの業務において必要な、様々な処理を、マンパワーを必要とすることなく、行うことを可能とする業務処理システムの技術が存在した(特許文献1参照)。
【0003】
かかる業務処理システムは、コンピュータシステムのサーバとクライエントにそれぞれ設定されるものであり、それぞれ画像読み取り手段とメモリが備えられる。このシステムは業務の処理の過程で順次発生する書面をその都度連続業務コード番号を付与し、画像読み取り手段において画像データとして読み取られたデータについて各処理を実行するアイテムコード記憶手段、標準アイテム用語コードデータ記憶手段、ランダムコードデータ記憶手段,抽出,分類,または集計処理手段のそれぞれを備えている。
【先行技術文献】
【特許文献】
【0004】
【文献】特開2014-228914号公報
【発明の概要】
【発明が解決しようとする課題】
【0005】
しかしながら、従来技術においては、単にOCRソフトウェアを用いて、請求書の画像(以下、請求書画像という)から文字列を取得するだけであるので、様々なフォーマットの請求書画像から管理すべき情報を容易に、かつ精度高く取得し、蓄積することができなかった。なお、請求書画像における管理すべき情報とは、例えば、会社名、会社の住所、口座の情報等である。
【課題を解決するための手段】
【0006】
本第一の発明の学習情報製造装置は、請求書画像を受け付ける請求書画像受付部と、請求書画像受付部が受け付けた請求書画像を出力する請求書画像出力部と、請求書画像出力部が出力した請求書画像に対して、請求に関連する2種類以上の請求関連情報の領域を特定する領域特定情報を、請求関連情報ごとに受け付ける領域特定情報受付部と、領域特定情報により特定される2以上の各領域に記載された文字列である請求関連情報を取得する請求関連情報取得部と、領域特定情報と、領域特定情報に対応する請求関連情報との組である2以上の組情報を用いて、学習情報を構成する学習情報構成部と、学習情報を蓄積する学習情報蓄積部とを具備する学習情報製造装置である。
【0007】
かかる構成により、請求書画像から管理すべき情報を容易に精度高く取得し、蓄積することができる学習情報を容易に取得できる。
【0008】
また、本第二の発明の学習情報製造装置は、第一の発明に対して、請求関連情報取得部は、手入力された請求関連情報を受け付ける学習情報製造装置である。
【0009】
かかる構成により、請求書画像から管理すべき情報を容易に精度高く取得し、蓄積することができる学習情報を容易に精度高く取得できる。
【0010】
また、本第三の発明の学習情報製造装置は、第一の発明に対して、請求関連情報取得部は、請求書画像受付部が受け付けた請求書画像に対して文字認識処理を行い、第一の請求関連情報を取得する文字認識手段と、手入力された第二の請求関連情報を受け付ける請求関連情報受付手段と、第一の請求関連情報と第二の請求関連情報とを用いて、蓄積される請求関連情報を決定する決定手段とを具備し、学習情報構成部は、領域特定情報と、決定手段が決定した請求関連情報との組、1組以上を用いて、学習情報を構成する学習情報製造装置である。
【0011】
かかる構成により、請求書画像から管理すべき情報を容易に精度高く取得し、蓄積することができる学習情報を容易に、より精度高く取得できる。
【0012】
また、本第四の発明の学習情報製造装置は、第一の発明に対して、請求関連情報取得部は、2以上の各ユーザにより手入力された2以上の第二の請求関連情報を受け付ける請求関連情報受付手段と、2以上の第二の請求関連情報を用いて、蓄積される請求関連情報を決定する決定手段とを具備し、学習情報構成部は、領域特定情報と、決定手段が決定した請求関連情報との組、1組以上を用いて、学習情報を構成する学習情報製造装置である。
【0013】
かかる構成により、請求書画像から管理すべき情報を容易に精度高く取得し、蓄積することができる学習情報を容易に、極めて精度高く取得できる。
【0014】
また、本第五の発明の学習情報製造装置は、第四の発明に対して、学習情報構成部は、領域特定情報と、領域特定情報に対応する請求関連情報との組である2以上の組情報を有する請求書元情報を構成する請求書元情報構成手段を具備し、学習情報は、請求書元情報を含む、学習情報製造装置である。
【0015】
かかる構成により、請求書画像から管理すべき情報を容易に精度高く取得し、蓄積することができる学習情報を容易に取得できる。
【0016】
また、本第六の発明の学習情報製造装置は、第一から第五いずれか1つの発明に対して、学習情報構成部は、領域特定情報と、領域特定情報に対応する請求関連情報との組である2以上の組情報を用いて、機械学習のアルゴリズムにより、学習器を生成する学習手段を具備し、学習情報は、学習器を含む、学習情報製造装置である。
【0017】
かかる構成により、請求書画像から管理すべき情報を容易に精度高く取得し、蓄積することができる学習情報を容易に取得できる。
【0018】
また、本第七の発明の学習情報製造装置は、第一から第六いずれか1つの発明に対して、2種類以上の請求関連情報は、請求元の組織名を含む請求元の組織に関する請求元組織情報、支払先に関する1以上の支払先情報、請求額に関する請求額情報、支払期日に関する支払期日情報を含む、学習情報製造装置である。
【0019】
かかる構成により、請求書画像から管理すべき情報を容易に精度高く取得し、蓄積することができる学習情報を容易に取得できる。
【0020】
また、本第八の発明の情報処理装置は、学習情報製造装置が蓄積した学習情報が格納される学習情報格納部と、請求書画像を受け付ける請求書画像受付部と、請求書画像受付部が受け付けた請求書画像に関する情報である受付情報と、学習情報格納部の学習情報とを用いて、2種類以上の請求関連情報を有する請求書情報を取得する請求書情報取得部と、請求書情報を出力する請求書情報出力部とを具備する情報処理装置である。
【0021】
かかる構成により、請求書画像から管理すべき情報を容易に精度高く取得し、蓄積することができる。
【0022】
また、本第九の発明の情報処理装置は、第八の発明に対して、学習情報は、請求書元情報を含み、請求書画像受付部が受け付けた請求書画像に関する情報であり、口座番号を含む受付情報を受け付ける受付情報受付部をさらに具備し、請求書情報取得部は、受付情報受付部が受け付けた受付情報をキーとして請求書元情報を検索し、受付情報に対応する請求書元情報の全部または一部である請求書情報を取得する情報処理装置である。
【0023】
かかる構成により、学習情報を用いて、請求書画像から管理すべき情報を容易に精度高く取得し、蓄積することができる。
【0024】
また、本第十の発明の情報処理装置は、第九の発明に対して、請求書情報取得部は、受付情報受付部が受け付けた受付情報をキーとして請求書元情報を検索し、受付情報に対応する請求書元情報が存在するか否かを判断する判断手段と、判断手段が受付情報に対応する請求書元情報が存在すると判断した場合に、請求書元情報の全部または一部である請求書情報を取得する請求書情報取得手段とを具備し、請求書画像受付部が受け付けた請求書画像を出力する請求書画像出力部と、判断手段が受付情報に対応する請求書元情報が存在しないと判断した場合に、請求書画像出力部が出力した請求書画像に対して、請求に関連する2種類以上の請求関連情報の領域を特定する領域特定情報を、請求関連情報ごとに受け付ける領域特定情報受付部と、領域特定情報により特定される2以上の各領域に記載された文字列である請求関連情報を取得する請求関連情報取得部と、領域特定情報と、領域特定情報に対応する請求関連情報との組である2以上の組情報を用いて、学習情報を構成する学習情報構成部と、学習情報を蓄積する学習情報蓄積部とをさらに具備し、請求書情報取得部は、請求関連情報取得部が取得した2種類以上の請求関連情報を有する請求書情報を取得する情報処理装置である。
【0025】
かかる構成により、学習情報を用いて、請求書画像から管理すべき情報を容易に精度高く取得し、蓄積することができるとともに、学習情報を進化させることができる。
【0026】
また、本第十一の発明の情報処理装置は、第八の発明に対して、学習情報は、学習器を含み、受付情報は、請求書画像受付部が受け付けた請求書画像そのものであり、請求書情報取得部は、請求書画像受付部が受け付けた請求書画像を、機械学習のアルゴリズムにより、学習器に適用し、2種類以上の請求関連情報を有する請求書情報を取得する情報処理装置である。
【0027】
かかる構成により、学習情報を用いて、請求書画像から管理すべき情報を容易に精度高く取得し、蓄積することができる。
【0028】
また、本第十二の発明の情報処理装置は、第八から第十一いずれか1つの発明に対して、請求書情報出力部が出力した請求書情報に対する修正を受け付ける修正受付部と、修正受付部が受け付けた修正により、修正された請求書情報を蓄積する請求書情報蓄積部とを具備する情報処理装置である。
【0029】
かかる構成により、学習情報を用いて、請求書画像から管理すべき情報を容易に精度高く取得し、蓄積することができる。
【発明の効果】
【0030】
本発明による学習情報製造装置によれば、請求書画像から管理すべき情報を容易に、かつ精度高く取得し、蓄積することができる。
【図面の簡単な説明】
【0031】
図1】実施の形態1における情報システムAの概念図
図2】同情報システムAのブロック図
図3】同情報システムAを構成する学習情報製造装置1のブロック図
図4】同まず、学習情報製造装置1の動作例について説明するフローチャート
図5】同組情報等取得処理の例について説明するフローチャート
図6】同なお、学習情報構成処理の例について説明するフローチャート
図7】同次に、第二端末3の動作例について説明するフローチャート
図8】同請求書画像の例を示す図
図9】同切取指示画面の例を示す図
図10】同領域の切り出し箇所の例を示す図
図11】同画面例を示す図
図12】同画面例を示す図
図13】同画面例を示す図
図14】同請求書元情報管理表を示す図
図15】実施の形態2における情報システムBのブロック図
図16】同情報システムBを構成する情報処理装置4のブロック図
図17】同情報処理装置4の動作例について説明するフローチャート
図18】同画面例を示す図
図19】同画面例を示す図
図20】同入力画面の例を示す図
図21】上記実施の形態におけるコンピュータシステムの概観図
図22】同コンピュータシステムのブロック図
【発明を実施するための形態】
【0032】
以下、学習情報製造装置、情報処理装置等の実施形態について図面を参照して説明する。なお、実施の形態において同じ符号を付した構成要素は同様の動作を行うので、再度の説明を省略する場合がある。
【0033】
(実施の形態1)
【0034】
本実施の形態において、受け付けた請求書画像から効率的に請求関連情報を取得するために使用する学習情報を取得し、蓄積する学習情報製造装置を具備する情報システムについて説明する。さらに具体的には、本実施の形態において、請求書画像の中の請求関連情報の領域を示す情報を受け付け、各領域を特定する領域特定情報と各領域内の文字列の情報とを対応付けた2以上の組情報を用いて、学習情報を取得し、蓄積する学習情報製造装置を具備する情報システムについて説明する。
【0035】
なお、本実施の形態において、領域内の文字列である請求関連情報は、1または2以上のユーザから手入力により受け付けられても良いし、文字認識技術により取得されても良いし、1以上のユーザから手入力による受け付けと文字認識技術による取得とを併用して取得されても良い。また、2以上のユーザから手入力により受け付ける場合、ユーザから手入力による受け付けと文字認識技術による取得とを併用する場合は、適切な処理により、使用する請求関連情報を決定することは好適である。
【0036】
また、本実施の形態において、学習情報は、後述する請求書元情報、後述する学習器のうちの1以上を含む情報である。
【0037】
図1は、本実施の形態における情報システムAの概念図である。情報システムAは、学習情報製造装置1、1または2以上の第一端末2、および1または2以上の第二端末3を備える。学習情報製造装置1は、例えば、いわゆるサーバである。サーバは、例えば、いわゆるクラウドサーバ、ASPサーバ等、その種類や設置場所等は問わない。第一端末2および第二端末3は、例えば、いわゆるパソコン、スマートフォン、タブレット端末等であり、その種類は問わない。
【0038】
図2は、本実施の形態における情報システムAのブロック図である。図3は、情報システムAを構成する学習情報製造装置1のブロック図である。
【0039】
学習情報製造装置1は、格納部11、受付部12、処理部13、および出力部14を備える。格納部11は、学習情報格納部111を備える。受付部12は、例えば、請求書画像受付部112、および領域特定情報受付部113を備える。処理部13は、例えば、請求関連情報取得部131、学習情報構成部132、および学習情報蓄積部133を備える。請求関連情報取得部131は、例えば、文字認識手段1311、請求関連情報受付手段1312、および決定手段1313を備える。学習情報構成部132は、例えば、請求書元情報構成手段1321、学習手段1322を備える。出力部14は、例えば、請求書画像出力部141を備える。
【0040】
第一端末2は、第一格納部21、第一受付部22、第一処理部23、第一送信部24、第一受信部25、および第一出力部26を備える。
【0041】
第二端末3は、第二格納部31、第二受付部32、第二処理部33、第二送信部34、第二受信部35、および第二出力部36を備える。
【0042】
学習情報製造装置1を構成する格納部11には、各種の情報が格納される。各種の情報とは、例えば、後述する学習情報である。
【0043】
学習情報格納部111には、学習情報が格納される。学習情報は、例えば、後述する請求書元情報、後述する学習器のうちの1種類以上の情報である。
【0044】
受付部12は、情報や指示等を受け付ける。情報や指示等とは、例えば、後述する請求書画像、後述する領域特定情報である。受付部12は、通常、情報や指示等を、第一端末2または第二端末3から受信する。ただし、受付部12は、ユーザからの情報や指示等を受け付けても良い。かかる場合の情報や指示等の入力手段は、タッチパネルやキーボードやマウスやメニュー画面によるもの等、何でも良い。かかる場合、受付部12は、タッチパネルやキーボード等の入力手段のデバイスドライバーや、メニュー画面の制御ソフトウェア等で実現され得る。
【0045】
請求書画像受付部112は、請求書画像を受け付ける。請求書画像とは、請求書の画像データである。請求書画像は、例えば、PDFファイル、gifファイル、jpegファイルであるが、その形式やデータ構造等は問わない。ここでの受け付けとは、通常、第一端末2からの受信である。なお、第一端末2は、請求書の管理を希望する第一ユーザが使用する端末である。また、請求書画像の受け付けは、キーボードやマウス、タッチパネルなどの入力デバイスから入力された情報の受け付け、光ディスクや磁気ディスク、半導体メモリなどの記録媒体から読み出された情報の受け付けなどでも良い。また、請求書画像受付部112は、受け付けた請求書画像に対して変換処理を行い、変換後の請求書画像を取得しても良い。かかる変換後の請求書画像も、請求書画像受付部112が受け付けた請求書画像である、と言っても良い。例えば、請求書画像受付部112は、受け付けたPDFの請求書画像を、jpegまたはgif等の形式の請求書画像に変換しても良い。
【0046】
領域特定情報受付部113は、1または2以上の領域特定情報を受け付ける。請求書画像出力部141が出力した請求書画像に対して、2種類以上の請求関連情報の各領域を特定する領域特定情報を、請求関連情報ごとに受け付けることは好適である。
【0047】
領域特定情報受付部113が受け付ける領域特定情報は、種類識別子に対応付いていることは好適である。領域特定情報受付部113は、例えば、領域特定情報と種類識別子との組を、1組以上取得する。種類識別子は、請求関連情報の種類を特定する情報である。種類識別子は、例えば、「会社名」「住所」「請求額」「支払先」「支払期日」である。
【0048】
ここで、領域特定情報は、請求書画像の中の部分の領域を特定する情報である。領域特定情報は、例えば、請求書画像の中の領域の左上座標値と右下座標値、請求書画像の中の領域の左上座標値と幅と高さ、請求書画像の中の矩形領域の重心点などである。領域特定情報のデータ構造は問わない。
【0049】
また、請求関連情報は、請求に関連する情報である。請求関連情報は、請求書画像の中に表出した情報である。請求関連情報は、例えば、請求元の組織名を特定する組織名情報、組織の住所を特定する住所情報、請求額を特定する請求額情報、支払先を特定する支払先情報、支払期日を特定する支払期日情報のうちの1または2種類以上の情報である。2種類以上の請求関連情報は、組織名情報、住所情報、請求額情報、支払先情報、支払期日情報であることは好適である。また、2種類以上の請求関連情報は、請求元の組織名を含む請求元の組織に関する請求元組織情報、1または2以上の支払先情報、請求額情報、支払期日情報を含むことは好適である。請求元組織情報は、例えば、組織名情報、住所情報を含む。なお、支払先情報は、例えば、振込先の口座の情報である。支払先情報は、例えば、銀行名、支店名、口座種類、口座番号、および口座名名義である。支払先情報は、例えば、クレジットカード番号、名義、および有効期限でも良い。
【0050】
請求関連情報は、例えば、固定的な情報である固定請求関連情報、または変動的な情報である変動請求関連情報である。固定請求関連情報は、動的には変化しない情報であり、例えば、種類識別子「会社名」または「住所」と対になる請求関連情報である。変動請求関連情報は、通常、請求書画像によって異なる情報であり、例えば、種類識別子「請求額」「支払先」「支払期日」と対になる請求関連情報である。
【0051】
領域特定情報受付部113における受け付けとは、通常、第二端末3からの受信である。なお、第二端末3は、学習情報製造装置1を管理する組織の第二ユーザの端末である。第二ユーザは、例えば、請求書の管理サービスを提供する側のユーザである。
【0052】
領域特定情報受付部113における受け付けは、キーボードやマウス、タッチパネルなどの入力デバイスから入力された情報の受け付け、光ディスクや磁気ディスク、半導体メモリなどの記録媒体から読み出された情報の受け付けなどでも良い。
【0053】
処理部13は、各種の処理を行う。各種の処理とは、例えば、請求関連情報取得部131、学習情報構成部132、学習情報蓄積部133等が行う処理である。各種の処理とは、例えば、切取指示画面を構成する処理である。切取指示画面は、領収書画像を含む画面である。切取指示画面は、領収書画像に対して、2以上の領域特定情報を入力させる指示の画面である。切取指示画面は、領収書画像に対して、2以上の各請求関連情報を切り取らせるための画面と言っても良い。また、切取指示画面は、領収書画像に対して、2以上の各請求関連情報の領域を特定させるための画面と言っても良い。
【0054】
請求関連情報取得部131は、領域特定情報により特定される2以上の各領域に記載された文字列である請求関連情報を取得する。ここで、取得とは、ユーザが手入力した情報の取得、または自動取得である。ここでのユーザは、第二端末3の第二ユーザである。
【0055】
請求関連情報の取得とは、通常、請求関連情報と種類識別子との組を、1組以上取得することである。
【0056】
請求関連情報取得部131は、例えば、手入力された1または2以上の請求関連情報を受け付ける。ここでの受け付けは、例えば、第二端末3からの受信である。ただし、受け付けは、例えば、ユーザの手入力の受け付けでも良い。
【0057】
請求関連情報取得部131は、例えば、請求書画像に対して、文字認識処理を行い、1または2以上の請求関連情報を取得する。なお、文字認識処理について、後述する文字認識手段1311が行う。
【0058】
請求関連情報取得部131は、例えば、1または2以上の各領域特定情報の各領域に対して文字認識処理を行い、1以上の第一の請求関連情報を取得する。なお、文字認識処理について、公知技術であるので、詳細な説明を省略する。また、請求関連情報取得部131は、通常、領域特定情報ごとに第一の請求関連情報を取得する。つまり、請求関連情報取得部131は、通常、2以上の第一の請求関連情報を取得する。なお、第一の請求関連情報は、文字認識処理により自動的に取得された請求関連情報である。そして、ユーザにより入力された請求関連情報は、第一の請求関連情報と区別するために、適宜、第二の請求関連情報と言う。
【0059】
請求関連情報取得部131は、種類識別子に対応付けて、1以上の第一の請求関連情報を取得することは好適である。
【0060】
文字認識手段1311は、請求書画像受付部112が受け付けた請求書画像に対して文字認識処理を行い、第一の請求関連情報を取得する。
【0061】
文字認識手段1311は、1または2以上の各領域特定情報の各領域に対して文字認識処理を行い、1以上の第一の請求関連情報を取得することは好適である。
【0062】
請求関連情報受付手段1312は、手入力された第二の請求関連情報を受け付ける。手入力された第二の請求関連情報は、第一の請求関連情報を修正した請求関連情報でも良い。請求関連情報受付手段1312は、種類識別子に対応付いた、1以上の第一の請求関連情報を受け付けることは好適である。ここで、手入力とは、通常、第二端末3のユーザによる入力である。また、ここでの受け付けとは、通常、第二端末3からの受信である。
【0063】
請求関連情報受付手段1312は、2以上の各ユーザにより手入力された2以上の第二の請求関連情報を受け付けることは好適である。2以上の各ユーザにより手入力された2以上の第二の請求関連情報は、2以上の各第二端末3から受信された情報である。
【0064】
決定手段1313は、蓄積される請求関連情報を決定する。
【0065】
決定手段1313は、例えば、第一の請求関連情報と第二の請求関連情報とを用いて、蓄積される請求関連情報を決定する。決定手段1313は、例えば、第一の請求関連情報と第二の請求関連情報とを比較し、一方の情報を、蓄積される請求関連情報を決定する。
【0066】
決定手段1313は、例えば、予め決められた種類の請求関連情報について、第一の請求関連情報と第二の請求関連情報とが一致すれば、蓄積される請求関連情報として決定する。ここで、予め決められた種類の請求関連情報は、例えば、組織名情報、住所情報、支払先情報のうちの1種類以上の情報である。
【0067】
決定手段1313は、例えば、第一の請求関連情報と1以上の第二の請求関連情報とが同一の場合に、第一の請求関連情報または第二の請求関連情報を、蓄積される請求関連情報として取得する。第一の請求関連情報と第二の請求関連情報とが異なる場合、決定手段1313は、例えば、ユーザに確認するための確認情報を出力する。確認情報は、例えば、「入力された情報が正しいか否か確認してください。」である。ここで、出力とは、通常、第二端末3への送信である。
【0068】
決定手段1313は、例えば、2以上の第二の請求関連情報を用いて、蓄積される請求関連情報を決定する。決定手段1313は、例えば、予め決められた種類の請求関連情報について、2以上の第二の請求関連情報が一致すれば、第二の請求関連情報を蓄積される請求関連情報として決定する。決定手段1313は、例えば、3以上の第二の請求関連情報のうち一致する割合が高い第二の請求関連情報を蓄積される請求関連情報として決定する。例えば、予め決められた条件に合致するほど、一致度が低い場合には、ユーザに確認するための確認情報を出力する。なお、予め決められた種類の請求関連情報は、例えば、組織名情報、住所情報、支払先情報のうちの1種類以上の情報である。2以上のすべての第二の請求関連情報が同一でない場合、決定手段1313は、例えば、ユーザに確認するための確認情報を出力する。ここで、出力とは、通常、第二端末3への送信である。
【0069】
なお、請求関連情報の決定とは、請求関連情報の取得でも良いし、請求関連情報へのリンクの取得でも良いし、請求関連情報のIDの取得等でも良い。
【0070】
学習情報構成部132は、1または2以上の組情報を用いて、学習情報を構成する。組情報とは、領域特定情報と、当該領域特定情報に対応する請求関連情報との組の情報である。領域特定情報に対応する請求関連情報とは、領域特定情報で特定される領域に記載された文字列である請求関連情報である。組情報は、通常、種類識別子をも有する。学習情報とは、後述する請求書情報の入力を支援する際に使用する情報である。学習情報は、例えば、後述する請求書元情報、後述する学習器のうちの1種類以上の情報である。
【0071】
学習情報構成部132は、通常、2以上の組情報を用いて、学習情報を構成する。
【0072】
学習情報構成部132は、領域特定情報と、決定手段1313が決定した請求関連情報との組の情報である1以上の組情報を用いて、学習情報を構成する。
【0073】
請求書元情報構成手段1321は、領域特定情報と、当該領域特定情報に対応する請求関連情報との組である2以上の組情報を有する請求書元情報を構成する。請求書元情報は、例えば、請求書画像をも含むことは好適である。請求書元情報は、例えば、各請求関連情報に対応する部分画像を有しても良い。組情報や請求書元情報等のデータ構造は問わないことは言うまでもない。
【0074】
学習手段1322は、領域特定情報と、当該領域特定情報に対応する請求関連情報との組である2以上の組情報を用いて、機械学習のアルゴリズムにより、学習器を生成する。なお、学習器は、分類器と言っても良い。
【0075】
学習手段1322は、通常、請求書画像と2以上の組情報とを用いて、機械学習のアルゴリズムにより、学習器を生成する。
【0076】
ここで、機械学習において、使用するアルゴリズムは問わないことは言うまでもない。機械学習は、例えば、深層学習、SVM、SVR、ランダムフォレスト、決定木等が使用可能である。また、機械学習において、学習器を構成するためには、例えば、機械学習のモジュール(例えば、fasttext、tiny_svm、各種のrandomForest関数等)に、入力となる情報群と出力させたい情報とを引数として与えると学習器が得られる。また、機械学習において、予測する場合、機械学習のモジュールに学習器と入力となる情報群とを引数として与えると、予測された情報が得られる。なお、予測された情報は、分類の結果の情報である、と言っても良い。
【0077】
なお、入力となる情報群は、ここでは、例えば、「請求書画像、2以上の領域特定情報」、または「2以上の部分画像、2以上の領域特定情報」、または「請求書画像、種類識別子と領域特定情報の組を2組以上」、または「2以上の部分画像、種類識別子と領域特定情報の組を2組以上」である。部分画像とは、請求書画像の一部の領域の画像であり、領域特定情報により特定される領域の画像である。また、出力させたい情報は、「請求関連情報」または「種類識別子と請求関連情報」である。
【0078】
学習情報蓄積部133は、学習情報を蓄積する。学習情報蓄積部133は、学習情報構成部132が構成した学習情報を蓄積する。学習情報の蓄積先は、例えば、学習情報格納部111であるが、外部の装置でも良い。
【0079】
出力部14は、各種の情報を出力する。各種の情報とは、例えば、請求書画像、切取指示画面である。また、ここでの出力とは、通常、第二端末3への送信である。ただし、出力とは、例えば、ディスプレイへの表示、プロジェクターを用いた投影、プリンタでの印字、音出力、記録媒体への蓄積、他の処理装置や他のプログラムなどへの処理結果の引渡しなどを含む概念である場合もあり得る。
【0080】
請求書画像出力部141は、請求書画像受付部112が受け付けた請求書画像を出力する。ここでの出力とは、通常、第二端末3への送信である。
【0081】
第一端末2を構成する第一格納部21には、各種の情報が格納される。各種の情報とは、例えば、第一ユーザを識別する第一ユーザ識別子、第一端末2を識別する第一端末識別子等である。なお、第一ユーザ識別子は、第一端末識別子と同一でも良い。
【0082】
第一受付部22は、各種の情報や指示等を受け付ける。各種の情報や指示等とは、例えば、請求書画像、確認情報である。
【0083】
第一処理部23は、各種の処理を行う。各種の処理とは、例えば、第一受付部22が受け付けた情報を送信するデータ構造にすること、第一受信部25が受信した情報を表示するデータ構造にすることである。
【0084】
第一送信部24は、各種の情報や指示等を外部の装置に送信する。各種の情報とは、例えば、請求書画像である。外部の装置とは、例えば、学習情報製造装置1、後述する情報処理装置4である。
【0085】
第一受信部25は、各種の情報を外部の装置から受信する。外部の装置とは、例えば、学習情報製造装置1、後述する情報処理装置4である。
【0086】
第一出力部26は、第一受信部25が受信した情報、第一処理部23が取得した情報、第一受付部22が受け付けた情報等を出力する。ここで、出力とは、ディスプレイへの表示、プロジェクターを用いた投影、プリンタでの印字、音出力、外部装置への送信、記録媒体への蓄積、他の処理装置や他のプログラムなどへの処理結果の引渡しなどを含む概念である。
【0087】
第二端末3を構成する第二格納部31には、各種の情報が格納される。各種の情報とは、例えば、第二ユーザを識別する第二ユーザ識別子、第二端末3を識別する第二端末識別子等である。なお、第二ユーザ識別子は、第二端末識別子と同一でも良い。
【0088】
第二受付部32は、各種の情報や指示等を受け付ける。各種の情報や指示等とは、例えば、領域特定情報、請求関連情報である。各種の情報や指示等の入力手段は、タッチパネルやキーボードやマウスやメニュー画面によるもの等、何でも良い。第二受付部32は、タッチパネルやキーボード等の入力手段のデバイスドライバーや、メニュー画面の制御ソフトウェア等で実現され得る。
【0089】
第二処理部33は、各種の処理を行う。各種の処理とは、例えば、第二受付部32が受け付けた情報を送信するデータ構造にすること、第二受信部35が受信した情報を表示するデータ構造にすることである。
【0090】
第二送信部34は、各種の情報や指示等を外部の装置に送信する。各種の情報とは、例えば、領域特定情報、請求関連情報である。外部の装置とは、例えば、学習情報製造装置1、後述する情報処理装置4である。
【0091】
第二受信部35は、各種の情報を外部の装置から受信する。各種の情報とは、例えば、切取指示画面、確認情報である。外部の装置とは、例えば、学習情報製造装置1、後述する情報処理装置4である。
【0092】
第二出力部36は、第二受信部35が受信した情報、第二処理部33が取得した情報、第二受付部32が受け付けた情報等を出力する。ここで、出力とは、ディスプレイへの表示、プロジェクターを用いた投影、プリンタでの印字、音出力、外部装置への送信、記録媒体への蓄積、他の処理装置や他のプログラムなどへの処理結果の引渡しなどを含む概念である。
【0093】
格納部11、学習情報格納部111、第一格納部21、および第二格納部31は、不揮発性の記録媒体が好適であるが、揮発性の記録媒体でも実現可能である。
【0094】
格納部11等に情報が記憶される過程は問わない。例えば、記録媒体を介して情報が格納部11等で記憶されるようになってもよく、通信回線等を介して送信された情報が格納部11等で記憶されるようになってもよく、あるいは、入力デバイスを介して入力された情報が格納部11等で記憶されるようになってもよい。
【0095】
受付部12、請求書画像受付部112、領域特定情報受付部113、第一受信部25、および第二受信部35は、通常、無線または有線の通信手段で実現されるが、放送を受信する手段で実現されても良い。
【0096】
処理部13、請求関連情報取得部131、学習情報構成部132、学習情報蓄積部133、文字認識手段1311、請求関連情報受付手段1312、決定手段1313、請求書元情報構成手段1321、学習手段1322、第一処理部23、および第二処理部33は、通常、MPUやメモリ等から実現され得る。処理部13等の処理手順は、通常、ソフトウェアで実現され、当該ソフトウェアはROM等の記録媒体に記録されている。但し、ハードウェア(専用回路)で実現しても良い。
【0097】
出力部14、請求書画像出力部141、第一送信部24、および第二送信部34は、通常、無線または有線の通信手段で実現されるが、放送手段で実現されても良い。
【0098】
第一受付部22、および第二受付部32は、タッチパネルやキーボード等の入力手段のデバイスドライバーや、メニュー画面の制御ソフトウェア等で実現され得る。
【0099】
第一出力部26、および第二出力部36は、ディスプレイやスピーカー等の出力デバイスを含むと考えても含まないと考えても良い。第一出力部26、および第二出力部36は、出力デバイスのドライバーソフトまたは、出力デバイスのドライバーソフトと出力デバイス等で実現され得る。
【0100】
次に、情報システムAの動作例について説明する。まず、学習情報製造装置1の動作例について、図4のフローチャートを用いて説明する。
【0101】
(ステップS401)請求書画像受付部112は、請求書画像を受信したか否かを判断する。請求書画像を受信した場合はステップS402に行き、請求書画像を受信しなかった場合はステップS410に行く。
【0102】
(ステップS402)処理部13は、ステップS401で受信された請求書画像を格納部11に蓄積する。処理部13は、例えば、請求書画像と対に受け付けられた第一ユーザ識別子と対にして、ステップS401で受信された請求書画像を格納部11に蓄積する。
【0103】
(ステップS403)処理部13は、ステップS401で受信された請求書画像等を含む切取指示画面を構成する。
【0104】
(ステップS404)請求書画像出力部141は、ステップS403で構成された切取指示画面を、1または2以上の第二端末3に送信する。
【0105】
(ステップS405)領域特定情報受付部113は、領域特定情報等を1または2以上の第二端末3から受信したか否かを判断する。切取指示画面を送信した1以上のすべての第二端末3から領域特定情報等を受信した場合はステップS406に行き、切取指示画面を送信した1以上のすべての第二端末3から領域特定情報等を受信していない場合はステップS405に戻る。なお、受信される領域特定情報等とは、例えば、領域特定情報と種類識別子との組の情報の集合である。また、受信される領域特定情報等とは、例えば、領域特定情報と種類識別子と請求関連情報とを有する複数の組の情報である。
【0106】
(ステップS406)請求関連情報取得部131は、組情報等取得処理を行う。組情報等取得処理とは、蓄積する組情報の集合を取得する処理である。組情報等取得処理について、図5のフローチャートを用いて説明する。なお、組情報とは、領域特定情報と請求関連情報との組の情報である。
【0107】
(ステップS407)請求関連情報取得部131は、ステップS406で取得した組情報の集合を格納部11に蓄積する。
【0108】
(ステップS408)処理部13は、ステップS406で取得した組情報の集合を用いて、蓄積する請求書情報を取得する。請求書情報は、2種類以上の請求関連情報を有する。請求書情報は、例えば、種類識別子に対応付いた2以上の各請求関連情報の集合である。
【0109】
(ステップS409)処理部13は、ステップS408で取得した請求書情報を、請求書画像と対に受け付けられた第一ユーザ識別子または/およびステップS401で受信された請求書画像と対にして、格納部11に蓄積する。ステップS401に戻る。
【0110】
(ステップS410)学習情報構成部132は、学習情報を構成する処理を行うか否かを判断する。学習情報を構成する処理を行う場合はステップS411に行き、学習情報を構成する処理を行わない場合はステップS401に戻る。なお、学習情報構成部132は、例えば、ステップS407における組情報の集合の蓄積数が予め決められた条件を満たすほど多いと判断した場合(例えば、組情報の集合の蓄積数が閾値以上)、予め決められた時刻になった場合、ユーザからの指示を受け付けた場合等に、学習情報を構成する処理を行うと判断する。
【0111】
(ステップS411)学習情報構成部132は、格納部11に格納されている組情報の集合を用いて、学習情報を構成する処理を行う。ステップS401に戻る。なお、学習情報構成処理について、図6のフローチャートを用いて説明する。
【0112】
なお、図4のフローチャートにおいて、学習器を構成しない場合、ステップS410、ステップS411は存在しない。
【0113】
また、図4のフローチャートにおいて、電源オフや処理終了の割り込みにより処理は終了する。
【0114】
次に、ステップS406の組情報等取得処理の例について、図5のフローチャートを用いて説明する。
【0115】
(ステップS501)請求関連情報取得部131は、カウンタiに1を代入する。
【0116】
(ステップS502)請求関連情報取得部131は、領域特定情報受付部113が受け付けた領域特定情報等の中に、i番目の種類識別子またはi番目の領域特定情報が存在するか否かを判断する。i番目の種類識別子等が存在すればステップS503に行き、存在しなければステップS509に行く。
【0117】
(ステップS503)請求関連情報取得部131は、i番目の領域特定情報により特定される領域に対して、文字認識処理を行うか否かを判断する。文字認識処理を行う場合はステップS504に行き、文字認識処理を行わない場合はステップS506に行く。なお、例えば、請求関連情報取得部131は、i番目の種類識別子が予め決められた種類識別子(例えば、変動請求関連情報に対応する種類識別子)である場合に、文字認識処理を行うと決定し、i番目の種類識別子が他の種類識別子(例えば、固定請求関連情報に対応する種類識別子)である場合に、文字認識処理を行わないと決定する。
【0118】
(ステップS504)文字認識手段1311は、i番目の領域特定情報を取得する。
【0119】
(ステップS505)文字認識手段1311は、i番目の領域特定情報により特定される領域の部分画像に対して、文字認識処理を行い、文字列を取得する。
【0120】
(ステップS506)決定手段1313は、1または2以上の請求関連情報の候補から採用する請求関連情報を決定する。なお、1または2以上の請求関連情報の候補は、例えば、ステップS405で領域特定情報受付部113が受け付けた1または2以上のi番目の領域特定情報またはi番目の種類識別子と対になる請求関連情報、またはステップS505で取得された文字列のうちの1以上の文字列である。また、決定手段1313が採用する請求関連情報を決定する方法について、上述したので、ここでの説明は省略する。
【0121】
(ステップS507)請求関連情報取得部131は、i番目の組情報を取得する。i番目の組情報は、i番目の領域特定情報とi番目の請求関連情報とを対応付ける情報である。i番目の組情報は、i番目の種類識別子とi番目の領域特定情報とi番目の請求関連情報とを対応付ける情報であることは好適である。i番目の組情報は、例えば、i番目の種類識別子とi番目の領域特定情報とi番目の請求関連情報とを含む情報である。i番目の組情報は、例えば、i番目の種類識別子とi番目の領域特定情報とi番目の請求関連情報とi番目の部分画像とを含む情報である。
【0122】
ここで、複数の情報を対応付ける情報とは、複数の情報を含む情報でも良いし、複数の情報を取得するための各情報のリンク情報を含む情報等でも良い。複数の情報を対応付ける情報は、複数の情報を取得するための情報であれば良く、そのデータ構造は問わない。
【0123】
(ステップS508)請求関連情報取得部131は、カウンタiを1、インクリメントする。ステップS502に戻る。
【0124】
(ステップS509)請求関連情報取得部131は、ステップS507で取得された2以上の組情報を用いて、蓄積する組情報等を構成し、格納部11に蓄積する。上位処理にリターンする。なお、蓄積する組情報等は、通常、請求書画像と2以上の組情報である。ただし、蓄積する組情報等は、例えば、請求書画像を有さず、2以上の組情報でも良い。
【0125】
次に、ステップS411の学習情報構成処理の例について、図6のフローチャートを用いて説明する。
【0126】
(ステップS601)学習情報構成部132は、カウンタiに1を代入する。
【0127】
(ステップS602)学習情報構成部132は、格納部11に、学習対象のi番目の請求書画像が存在するか否かを判断する。i番目の請求書画像が存在する場合はステップS603に行き、i番目の請求書画像が存在しない場合はステップS612に行く。なお、格納部11に請求書画像が蓄積されていない場合、i番目の請求書画像に対応するi番目の組情報の集合が存在するか否かを判断する。
【0128】
(ステップS603)請求書元情報構成手段1321は、格納部11にi番目の組情報の集合を取得する。i番目の組情報の集合は、2以上の組情報であり、学習対象のi番目の請求書画像に対応する情報である。
【0129】
(ステップS604)学習情報構成部132は、カウンタjに1を代入する。
【0130】
(ステップS605)学習情報構成部132は、ステップS603で取得したi番目の組情報の集合の中に、j番目の組情報が存在するか否かを判断する。j番目の組情報が存在する場合はステップS606に行き、j番目の組情報が存在しない場合はステップS608に行く。
【0131】
(ステップS606)請求書元情報構成手段1321は、j番目の組情報に対応するj番目の部分画像を取得する。学習情報構成部132は、例えば、j番目の組情報が有する部分画像を取得する。また、学習情報構成部132は、例えば、j番目の組情報が有する領域特定情報が特定する領域の画像を、j番目の組情報と対になる請求書画像から切り出して、部分画像を取得する。
【0132】
(ステップS607)学習情報構成部132は、カウンタjを1、インクリメントする。ステップS605に戻る。
【0133】
(ステップS608)請求書元情報構成手段1321は、ステップS603で取得した組情報、またはステップS603で取得した組情報とステップS606で取得した部分画像を用いて、機械学習の関数に渡すベクトルを構成する。なお、ベクトルは、特徴量ベクトルと言っても良い。
【0134】
(ステップS609)請求書元情報構成手段1321は、ステップS608で構成したベクトルを用いて、請求書元情報を構成する。
【0135】
(ステップS610)請求書元情報構成手段1321は、ステップS609で構成した請求書元情報を一時蓄積する。なお、一時蓄積先は、例えば、格納部11であるが、問わない。
【0136】
(ステップS611)学習情報構成部132は、カウンタiを1、インクリメントする。ステップS602に戻る。
【0137】
(ステップS612)学習手段1322は、ステップS608で構成したベクトルの集合を機械学習のアルゴリズムを実現するモジュールに引数として与え、モジュールを実行し、学習器を取得する。
【0138】
(ステップS613)学習手段1322は、ステップS612で取得した学習器を学習情報格納部111に蓄積する。上位処理にリターンする。
【0139】
なお、図6のフローチャートにおいて、一つの学習器を蓄積した。しかし、図6のフローチャートにおいて、種類識別子ごとに学習器を生成し、蓄積しても良い。かかる場合、学習手段1322は、種類識別子ごとにステップS608で構成したベクトルの集合を機械学習のアルゴリズムを実現するモジュールに引数として与え、モジュールを実行し、学習器を取得する。また、かかる場合、学習手段1322は、例えば、種類識別子ごとに、正例の請求書元情報と負例の請求書元情報とを用いて、機械学習のアルゴリズムにより、学習器を生成することは好適である。
【0140】
次に、第一端末2の動作について説明する。第一端末2の第一受付部22は請求書画像を受け付ける。次に、第一処理部23は、第一受付部22が受け付けた請求書画像を送信するデータ構造の請求書画像にする。次に、第一送信部24は、第一処理部23が構成した請求書画像を学習情報製造装置1に送信する。次に、第一受信部25は、請求書画像等が登録された旨の情報を受信する。次に、第一処理部23は、請求書画像等が登録された旨の情報を出力するデータ構造にする。第一出力部26は、第一処理部23が取得した請求書画像等が登録された旨の情報を出力する。なお、請求書画像等とは、例えば、請求書画像と請求書情報である。また、第一受信部25は、請求書情報が正しいか否かを確認する問合せを受信し、第一出力部26が問合せを出力し、第一受付部22が確認情報を受け付け、第一送信部24が確認情報を学習情報製造装置1に送信する等しても良い。
【0141】
次に、第二端末3の動作例について、図7のフローチャートを用いて説明する。
【0142】
(ステップS701)第二受信部35は、学習情報製造装置1から切取指示画面を受信したか否かを判断する。切取指示画面を受信した場合はステップS702に行き、切取指示画面を受信しなかった場合はステップS701に戻る。
【0143】
(ステップS702)第二処理部33は、ステップS701で受信された切取指示画面から、出力する切取指示画面を構成する。次に、第二出力部36は、切取指示画面を出力する。
【0144】
(ステップS703)第二処理部33は、カウンタiに1を代入する。
【0145】
(ステップS704)第二処理部33は、i番目の種類識別子が存在するか否かを判断する。i番目の種類識別子が存在する場合はステップS705に行き、i番目の種類識別子が存在しない場合はステップS708に行く。なお、i番目の種類識別子は、切取指示画面に対するi番目の領域特定情報である。
【0146】
(ステップS705)第二受付部32は、i番目の種類識別子に対応する、i番目の領域特定情報等を受け付けたか否かを判断する。i番目の領域特定情報等を受け付けた場合はステップS706に行き、i番目の領域特定情報等を受け付けなかった場合はステップS705に戻る。i番目の領域特定情報等とは、例えば、i番目の領域特定情報とi番目の請求関連情報、またはi番目の領域特定情報のみである。また、i番目の領域特定情報等とは、第二処理部33がi番目の領域特定情報により特定される部分画像に対して文字認識処理を行い取得した請求関連情報を含んでも良い。また、i番目の領域特定情報等とは、第二ユーザにより入力された請求関連情報を含んでも良い。また、領域特定情報等を構成する請求関連情報の中には、文字認識処理を行い取得された請求関連情報と第二ユーザにより入力された請求関連情報とが混在しても良い。さらに、領域特定情報等を構成する請求関連情報の中には、文字認識処理を行い取得された文字列に対して、第二ユーザが修正し、受け付けられた請求関連情報を含んでも良い。
【0147】
(ステップS706)第二処理部33は、ステップS705で受け付けられたi番目の領域特定情報等を一時蓄積する。
【0148】
(ステップS707)第二処理部33は、カウンタiを1、インクリメントする。ステップS704に戻る。
【0149】
(ステップS708)第二送信部34は、ステップS706で蓄積された領域特定情報等の集合を学習情報製造装置1に送信する。ステップS701に戻る。
【0150】
以下、本実施の形態における情報システムAの具体的な動作例について説明する。情報システムAの概念図は図1である。
【0151】
今、第一ユーザは、第一端末2に対して、図8の請求書画像を入力した、とする。すると、第一端末2の第一受付部22は請求書画像を受け付ける。次に、第一処理部23は、第一受付部22が受け付けた請求書画像を送信するデータ構造の請求書画像にする。次に、第一送信部24は、第一処理部23が構成した請求書画像を学習情報製造装置1に送信する。
【0152】
次に、学習情報製造装置1の請求書画像受付部112は、図8の請求書画像を受信する。そして、処理部13は、受信された請求書画像を格納部11に蓄積する。なお、処理部13は、ユニークなID「ID892.pdf」というファイル名で、受信された請求書画像を蓄積した、とする。
【0153】
次に、処理部13は、ステップS401で受信された請求書画像等を含む切取指示画面を構成する。
【0154】
次に、請求書画像出力部141は、構成された切取指示画面を、予め管理された1以上の第二端末3に送信する。
【0155】
次に、1以上の各第二端末3の第二受信部35は、学習情報製造装置1から切取指示画面を受信する。次に、第二処理部33は、受信された切取指示画面から、出力する切取指示画面を構成する。次に、第二出力部36は、切取指示画面を出力する。かかる切取指示画面の例は、図9である。図9において、「会社名」のみを切り取る指示である。
【0156】
なお、第二受信部35が図9の切取指示画面を受信する前に、後述する図18の請求書の種別選択の画面を受信し、第二出力部36が当該切取指示画面を出力しても良い。そして、第二端末3のユーザが種別を選択した後(種別選択の複数のボタンのうちの一のボタンを指示した後)、図9の切取指示画面が第二端末3に出力されても良い。また、第二端末3のユーザが種別を選択した後、当該種別が予め決められた1以上の種別(例えば、「請求書(国内)」または「その他」以外)である場合のみ、図9の切取指示画面が第二端末3に出力されても良い。かかる場合、例えば、第二端末3から学習情報製造装置1に種別を特定する種別情報が送信され、学習情報製造装置1が種別情報を受信し、当該種別情報に応じて、切取指示画面を第二端末3に送信したり、しなかったりする送信制御を行っても良い。なお、切取指示画面を第二端末3に送信しない場合、例えば、第二端末3のユーザが手入力で、第二端末3に必要な情報を入力し、当該必要な情報が第二端末3から学習情報製造装置1に送信され、学習情報製造装置1が受信し、蓄積しても良い。 第二ユーザは、図9の指示に従って、マウス等の入力手段を用いて、「会社名」の領域を指示する。ここで、切取指示画面は、5つの画面からなり、第二出力部36は、請求元の「会社名」以外にも、会社の「住所」、「請求額」「支払先」「支払期日」の各領域を指定させる(切り取らせる)指示の画面を、順次、出力する、とする。そして、第二ユーザは、5種類の種類識別子「会社名」「住所」、「請求額」「支払先」「支払期日」に対応する領域を特定する領域特定情報を入力した、とする。つまり、第二ユーザは、図10で示すように、「会社名」「住所」、「請求額」「支払先」「支払期日」の領域を示す領域特定情報、第二端末3の画面上に入力した、とする。
【0157】
すると、第二受付部32は、各種類識別子(「会社名」「住所」、「請求額」「支払先」「支払期日」)に対応する、領域特定情報を受け付ける。
【0158】
次に、第二端末3は、「会社名」「住所」、「請求額」「支払先」「支払期日」の各情報である、5つの請求関連情報を入力する画面を出力する。かかる画面は、例えば、図11図12図13の画面である。また、かかる画面は、例えば、切取指示画面と一緒に学習情報製造装置1から送信された画面である。
【0159】
次に、第二ユーザは、図11図12図13の各画面に対して、請求書画像を見ながら、「会社名」「請求金額」「支払期日」等を入力する。なお、ここで、請求書画像に対する文字認識処理により、「会社名」「請求金額」「支払期日」等に対応するフィールドに文字列が入力されても良い。
【0160】
すると、第二受付部32は、各種類識別子(「会社名」「住所」、「請求額」「支払先」「支払期日」)に対応する、請求関連情報を受け付ける。なお、第二受付部32は、種別情報をも受け付けても良い。
【0161】
次に、第二処理部33は、種類識別子と領域特定情報と請求関連情報との組の集合(5組の情報)を構成する。なお、第二処理部33は、種別情報をも有する情報を構成しても良い。
【0162】
そして、第二送信部34は、構成された種類識別子と領域特定情報と請求関連情報との組の集合(領域特定情報等の集合)を学習情報製造装置1に送信する。なお、第二送信部34は、種別情報をも有する情報を学習情報製造装置1に送信しても良い。
【0163】
次に、学習情報製造装置1は、領域特定情報受付部113は、領域特定情報等を1以上の第二端末3から受信する。ここで、領域特定情報等は、上述した種類識別子と領域特定情報と請求関連情報との組の集合(5組の情報)である。なお、2以上の第二端末3から領域特定情報等を受信する場合、受信された請求関連情報は、蓄積される請求関連情報の候補である。
【0164】
次に、請求関連情報取得部131の決定手段1313は、種類識別子ごとに、1以上の請求関連情報の候補から採用する請求関連情報を決定する。なお、採用する請求関連情報を決定するアルゴリズム例については、上述したので、ここでの詳細な説明は省略する。
【0165】
次に、請求関連情報取得部131は、種類識別子ごとの請求関連情報と領域特定情報とを用いて、請求書元情報を構成する。なお、請求書元情報は、例えば、「会社名:Sansan株式会社|住所:〒150-0001 東京都渋谷区宮前町・・・|請求額:1|支払先:りそな銀行・・・,みずほ銀行・・・,三井住友銀行・・・|支払期日:2017年10月31日|領域特定情報:(1)(x11,y11)(x12,y12)(2)(x21,y21)(x22,y22)(3)(x31,y31)(x32,y32)(4)(x41,y41)(x42,y42)(5)(x51,y51)(x52,y52)|請求書画像:ID892.pdf」である。
【0166】
次に、請求関連情報取得部131は、構成した請求書元情報を学習情報格納部111に蓄積する。なお、かかる蓄積された請求書元情報の例は、図14の「ID=892」のレコードである。なお、図14は、請求書元情報管理表である。請求書元情報管理表は、学習情報に含まれる請求書元情報を管理する表であり、学習情報格納部111に格納されている。また、請求関連情報取得部131は、請求書元情報を、受信された種別情報に対応付けて蓄積しても良い。また、請求書元情報は、種別情報を有する、と考えても良い。
【0167】
以上の処理が繰り返され、請求書元情報管理表には、多数の請求書元情報が格納された、とする。
【0168】
そして、閾値以上の数の請求書元情報が請求書元情報管理表に蓄積されたことをトリガーとして、学習情報製造装置1は、以下のように学習処理を行う。
【0169】
つまり、学習情報構成部132は、図14の請求書元情報管理表の多数の組情報(ここでは、「(1)会社名」「(2)住所」「(3)請求額」「(4)支払先」「(5)支払期日」「領域特定情報」「請求書画像」の実体の画像データ)を用いて、機械学習のアルゴリズム(例えば、深層学習)により、学習器を生成する。なお、この学習器は、画像データ(請求書画像)を入力として、「(1)会社名」「(2)住所」「(4)支払先」を出力するための学習器である。なお、学習情報構成部132は、図14の請求書元情報管理表の多数の組情報の中の「(1)会社名」「(2)住所」「(4)支払先」「領域特定情報」「請求書画像」の実体の画像データを用いて、機械学習のアルゴリズムにより、学習器を生成しても良い。
【0170】
次に、学習手段1322は、生成された学習器を学習情報格納部111に蓄積する。
【0171】
以上の処理により、学習情報製造装置1は、学習情報格納部111に、請求書元情報、および学習器を蓄積できた。なお、学習情報製造装置1は、学習情報格納部111に、請求書元情報、学習器のうちの一方のみを蓄積しても良い。
【0172】
以上、本実施の形態によれば、請求書画像から学習情報を容易に取得できる。なお、学習情報は、請求書画像から管理すべき情報を容易に精度高く取得し、蓄積するための元になる情報である。
【0173】
なお、本実施の形態における処理は、ソフトウェアで実現しても良い。そして、このソフトウェアをソフトウェアダウンロード等により配布しても良い。また、このソフトウェアをCD-ROMなどの記録媒体に記録して流布しても良い。なお、このことは、本明細書における他の実施の形態においても該当する。なお、本実施の形態における学習情報製造装置1を実現するソフトウェアは、以下のようなプログラムである。つまり、このプログラムは、コンピュータを、請求書画像を受け付ける請求書画像受付部と、前記請求書画像受付部が受け付けた請求書画像を出力する請求書画像出力部と、前記請求書画像出力部が出力した請求書画像に対して、請求に関連する2種類以上の請求関連情報の領域を特定する領域特定情報を、請求関連情報ごとに受け付ける領域特定情報受付部と、前記領域特定情報により特定される2以上の各領域に記載された文字列である請求関連情報を取得する請求関連情報取得部と、前記領域特定情報と、当該領域特定情報に対応する請求関連情報との組である2以上の組情報を用いて、学習情報を構成する学習情報構成部と、前記学習情報を蓄積する学習情報蓄積部として機能させるためのプログラムである。
【0174】
(実施の形態2)
【0175】
本実施の形態において、実施の形態1で説明した学習情報製造装置1で製造した学習情報を用いて、受け付けた請求書画像に関する受付情報に対応する請求書元情報を有する請求書情報を取得し、出力する情報処理装置を含む情報システムについて説明する。なお、受付情報は、例えば、請求関連情報(例えば、口座番号)である。
【0176】
また、本実施の形態において、口座番号を含む受付情報に対応する請求書元情報が存在しない場合に、実施の形態1で説明した学習のための処理を行う情報処理装置を含む情報システムについて説明する。
【0177】
また、本実施の形態において、受付情報が請求書画像であり、当該請求書画像を画像認識し、類似する請求書画像を取得し、当該請求書画像に対応する請求書情報を取得し、出力する情報処理装置を含む情報システムについて説明する。
【0178】
さらに、本実施の形態において、出力された請求書情報に対して、第二ユーザによる修正の入力を受け付け、蓄積する請求書情報を取得する情報処理装置を含む情報システムについて説明する。
【0179】
情報システムBの概念図は、符号を除いて、図1と同じである。情報システムBは、情報処理装置4、1または2以上の第一端末2、および1または2以上の第二端末3を備える。情報処理装置4は、例えば、いわゆるサーバである。サーバは、例えば、いわゆるクラウドサーバ、ASPサーバ等、その種類や設置場所等は問わない。
【0180】
図15は、本実施の形態における情報システムBのブロック図である。図16は、情報システムBを構成する情報処理装置4のブロック図である。
【0181】
情報処理装置4は、格納部41、受付部42、処理部43、および出力部44を備える。格納部41は、学習情報格納部111を備える。受付部42は、請求書画像受付部112、領域特定情報受付部113、受付情報受付部421、および修正受付部422を備える。処理部43は、請求書情報取得部431、請求書情報蓄積部432、請求関連情報取得部131、学習情報構成部132、および学習情報蓄積部133を備える。請求書情報取得部431は、判断手段4311、および請求書情報取得手段4312を備える。出力部44は、請求書画像出力部141、および請求書情報出力部441を備える。
【0182】
情報処理装置4を構成する格納部41には、各種の情報が格納される。各種の情報とは、例えば、学習情報である。学習情報は、上述した通り、例えば、1または2以上の請求書元情報、学習器のうちの1種類以上の情報である。
【0183】
受付部42は、情報や指示等を受け付ける。情報や指示等とは、例えば、請求書画像、領域特定情報、受付情報、修正指示である。修正指示は、請求書情報に対する修正の指示である。修正指示は、単に修正、と言っても良い。
【0184】
受付部42は、通常、情報や指示等を、第一端末2または第二端末3から受信する。ただし、受付部42は、ユーザからの情報や指示等を受け付けても良い。かかる場合の情報や指示等の入力手段は、タッチパネルやキーボードやマウスやメニュー画面によるもの等、何でも良い。かかる場合、受付部42は、タッチパネルやキーボード等の入力手段のデバイスドライバーや、メニュー画面の制御ソフトウェア等で実現され得る。
【0185】
受付情報受付部421は、受付情報を受け付ける。
受付情報とは、請求書画像受付部112が受け付けた請求書画像に関する情報であり、例えば、口座番号を含む情報である。なお、ここでの受け付けは、通常、第二端末3からの受信である。ただし、受付情報の受け付けは、キーボードやマウス、タッチパネルなどの入力デバイスから入力された情報の受け付け、光ディスクや磁気ディスク、半導体メモリなどの記録媒体から読み出された情報の受け付けなどでも良い。
【0186】
修正受付部422は、請求書情報出力部441が出力した請求書情報に対する修正を受け付ける。ここでの受け付けも、通常、第二端末3からの受信である。ただし修正の受け付けは、キーボードやマウス、タッチパネルなどの入力デバイスから入力された情報の受け付け、光ディスクや磁気ディスク、半導体メモリなどの記録媒体から読み出された情報の受け付けなどでも良い。
【0187】
処理部43は、各種の処理を行う。各種の処理とは、例えば、請求書情報取得部431、請求書情報蓄積部432、請求関連情報取得部131、学習情報構成部132、学習情報蓄積部133等が行う処理である。各種の処理とは、例えば、入力画面を構成する処理である。入力画面とは、第二ユーザが請求書画像を見ながら、請求書情報を構成する請求関連情報を入力したり、修正したりするための画面である。入力画面は、請求書画像を含む。また、各種の処理とは、例えば、切取指示画面を構成する処理である。
【0188】
請求書情報取得部431は、1または2種類以上の請求関連情報を有する。請求書情報取得部431は、請求書情報を取得する。請求書情報取得部431が請求関連情報または請求書情報を取得する方法は、種々、あり得る。なお、請求書情報は、2種類以上の請求関連情報を有する。請求書情報は、例えば、組織名情報(例えば、請求元の会社名)、住所情報(例えば、請求元の会社の住所)、請求額情報、支払先情報、支払期日情報である。
【0189】
請求書情報取得部431は、例えば、受付情報受付部421が受け付けた受付情報を用いて、請求書情報を取得する。請求書情報取得部431は、例えば、受付情報受付部421が受け付けた受付情報をキーとして請求書元情報を検索し、受付情報に対応する請求書元情報の全部または一部を有する請求書情報を取得する。
【0190】
請求書情報取得部431は、請求関連情報取得部131が取得した2種類以上の請求関連情報を有する請求書情報を取得する。
【0191】
請求書情報取得部431は、例えば、請求書画像受付部112が受け付けた請求書画像に関する情報である受付情報と、学習情報格納部111の学習情報とを用いて、2種類以上の請求関連情報を有する請求書情報を取得する。
【0192】
請求書情報取得部431は、例えば、請求書画像受付部112が受け付けた請求書画像に類似する請求書画像を格納部41から検索する。そして、請求書情報取得部431は、例えば、当該類似する請求書画像と対になる2種類以上の請求関連情報を取得し、当該2種類以上の請求関連情報を有する請求書情報を構成する。
【0193】
なお、請求書画像受付部112が受け付けた請求書画像に類似する請求書画像を検索する方法は種々あり得る。請求書情報取得部431は、例えば、請求書画像と類似度が最も高く、類似度が閾値以上の格納部41から検索する。請求書情報取得部431は、例えば、請求書画像受付部112が受け付けた請求書画像をベクトル化し、当該ベクトルと格納部41の請求書画像から取得されたベクトルとの距離を算出し、距離をパラメータとする類似度を算出する。
【0194】
また、請求書情報取得部431は、例えば、請求書画像受付部112が受け付けた請求書画像を、機械学習のアルゴリズムにより、学習器に適用し、2種類以上の請求関連情報を有する請求書情報を取得しても良い。かかる場合も、請求書情報取得部431は、請求書画像受付部112が受け付けた請求書画像に類似する請求書画像を検索した、と言える。
【0195】
ここで、機械学習において、使用するアルゴリズムは問わないことは言うまでもない。機械学習は、例えば、深層学習、SVM、SVR、ランダムフォレスト、決定木等が使用可能である。また、機械学習において、予測する場合(ここでは、請求書情報を取得する場合)、機械学習のモジュールに学習器と入力となる情報群とを引数として与えると、予測された情報(ここでは、請求書情報)が得られる。なお、予測された情報は、分類の結果の情報である、と言っても良い。
【0196】
請求書情報取得部431は、請求書画像受付部112が受け付けた請求書画像を文字認識し、文字が閾値以内の間隔で連続して出現する矩形領域の1または2以上の領域情報(例えば、左上座標(x,y)と右下座標(x,y))を取得し、かかる1以上の領域情報と、1以上の各領域情報が示す領域の画像である1以上の部分画像と、請求書画像のうちの2種類以上の情報を入力として、機械学習のモジュールに与え、学習情報格納部111の学習器を用いて、機械学習のアルゴリズムにより、予測処理を行い、2種類以上の請求関連情報を有する請求書情報を取得しても良い。
【0197】
請求書情報取得部431は、上述した決定手段1313と同様の処理により、蓄積される請求関連情報を決定することは好適である。2以上の各第二端末3から送信された請求関連情報が存在する際に、請求書情報取得部431は、例えば、すべての請求関連情報が一致した場合に、蓄積される請求関連情報を決定しても良い(全員一致方式)。また、3以上の各第二端末3から送信された請求関連情報が存在する際に、請求書情報取得部431は、例えば、多くの一致する請求関連情報を、蓄積される請求関連情報を決定しても良い(多数決方式)。また、全員一致方式または多数決方式を採用するのは、変動請求関連情報に対してのみでも良い。
【0198】
判断手段4311は、受付情報受付部421が受け付けた受付情報をキーとして、学習情報格納部111に格納されている請求書元情報を検索し、当該受付情報に対応する請求書元情報が存在するか否かを判断する。なお、受付情報に対応する請求書元情報とは、例えば、受付情報と一致する情報を有する請求書元情報、または受付情報と一致する情報と対になる請求書元情報である。受付情報に対応する請求書元情報とは、例えば、受付情報である口座番号と一致する口座番号を有する請求書元情報である。
【0199】
請求書情報取得手段4312は、判断手段4311が受付情報に対応する請求書元情報が存在すると判断した場合に、当該請求書元情報の全部または一部を含む請求書情報を取得する。
【0200】
請求書情報蓄積部432は、修正受付部422が受け付けた修正により、修正された請求書情報を蓄積する。請求書情報蓄積部432は、請求書情報取得手段4312が取得した請求書情報を蓄積しても良い。
【0201】
請求書情報蓄積部432は、請求書画像受付部112が受け付けた請求書画像に対して画像認識処理を行い、取得した請求書情報(例えば、会社名、住所、請求額情報、支払先情報、支払期日情報を有する情報)に対して、修正受付部422が受け付けた一部または全部の修正により、請求書情報を構成し、当該構成した請求書情報を蓄積しても良い。
【0202】
なお、請求書情報蓄積部432が請求書情報を蓄積する前に、第一端末2の承認が必要であっても良い。つまり、請求書情報蓄積部432は、第一端末2からの承認の受信があった場合に、蓄積しても良い。なお、承認は、確認情報と言っても良い。
【0203】
出力部44は、各種の情報を出力する。各種の情報とは、例えば、請求書画像、請求書情報、入力画面、切取指示画面である。また、ここでの出力とは、通常、第二端末3への送信である。ただし、出力とは、例えば、ディスプレイへの表示、プロジェクターを用いた投影、プリンタでの印字、音出力、記録媒体への蓄積、他の処理装置や他のプログラムなどへの処理結果の引渡しなどを含む概念である場合もあり得る。
【0204】
請求書情報出力部441は、請求書情報取得部431が取得した請求書情報を出力する。ここで、出力とは、例えば、格納部41への蓄積である。また、出力とは、例えば、第二端末3への送信である。
【0205】
次に、情報システムBを構成する情報処理装置4の動作例について、図17のフローチャートを用いて説明する。なお、図17のフローチャートにおいて、図4のフローチャートと同一のステップについて、説明を省略する。
【0206】
(ステップS1701)請求書画像受付部112は、請求書画像を受信したか否かを判断する。請求書画像を受信した場合はステップS1702に行き、請求書画像を受信しなかった場合はステップS410に行く。
【0207】
(ステップS1702)処理部43は、ステップS1701で受信された請求書画像を格納部11に蓄積する。処理部43は、例えば、請求書画像と対に受信された第一ユーザ識別子と対にして、ステップS1701で受信された請求書画像を格納部11に蓄積する。
【0208】
(ステップS1703)請求書情報取得部431は、ステップS1701で受信された請求書画像に類似する請求書画像を格納部41から検索する。
【0209】
(ステップS1704)請求書情報取得部431は、ステップS1703で類似する請求書画像を検索できたか否かを判断する。検索できた場合はステップS1705に行き、検索できなかった場合はステップS1706に行く。
【0210】
(ステップS1705)請求書情報取得部431は、検索した請求書画像と対になる1種類以上の請求関連情報を学習情報格納部111から取得する。なお、ここで取得される1種類以上の請求関連情報は、固定請求関連情報であることは好適である。固定請求関連情報は、例えば、組織名情報、住所情報、支払先情報である。
【0211】
(ステップS1706)処理部43は、ステップS1701で受信した請求書画像を含む画面である入力画面を構成する。なお、入力画面は、1種類以上の請求関連情報を含むことは好適である。また、1種類以上の請求関連情報は、例えば、ステップS1705で請求書情報取得部431が取得した情報である。また、1種類以上の請求関連情報は、例えば、請求関連情報取得部131が請求書画像に対する文字認識処理により取得した情報である。なお、文字認識処理について、図17のフローチャートにおいて省略している。
【0212】
(ステップS1707)出力部44は、ステップS1706で構成された入力画面を、1または2以上の第二端末3に送信する。
【0213】
(ステップS1708)受付部42は、1以上のすべての第二端末3から、1以上の変動請求関連情報を受信したか否かを判断する。1以上のすべての第二端末3から、1以上の変動請求関連情報を受信した場合はステップS1709に行き、1以上の変動請求関連情報を受信しなかった場合はステップS1711に行く。なお、変動請求関連情報は、例えば、請求額情報、支払期日情報である。また、ここで、受付部42は、固定請求関連情報をも受信しても良い。
【0214】
(ステップS1709)請求書情報取得部431は、2以上の請求関連情報を有する請求書情報を構成する。なお、請求書情報取得部431は、上述した決定手段1313と同様の処理により、蓄積される請求関連情報を決定し、当該請求関連情報を用いて、請求書情報を構成することは好適である。
【0215】
(ステップS1710)請求書情報蓄積部432は、ステップS1709で構成された請求書情報を、ステップS1701で受信された請求書画像と対にして、格納部41に蓄積する。ステップS1701に戻る。
【0216】
(ステップS1711)受付部42は、第二端末3から受付情報(例えば、口座番号)を受信したか否かを判断する。受付情報を受信した場合はステップS1712に行き、受付情報を受信しなかった場合はステップS1711に戻る。
【0217】
(ステップS1712)請求書情報取得部431は、ステップS1711で受信された受付情報をキーとして請求書元情報を検索する。
【0218】
(ステップS1713)請求書情報取得部431は、ステップS1712で請求書元情報を検索できたか否かを判断する。検索できた場合はステップS1714に行き、検索できなかった場合はステップS403に行く。
【0219】
(ステップS1714)請求書情報取得部431は、ステップS1711で受信された受付情報に対応する1または2以上の固定請求関連情報を取得する。なお、ここで、請求書情報取得部431は、変動請求関連情報をも取得しても良い。また、請求書情報取得部431は、ステップS1711で受信された受付情報に対応する学習情報の中で、最も新しい(最近に蓄積された)学習情報が有する固定請求関連情報、または変動請求関連情報を取得することは好適である。
【0220】
(ステップS1715)請求書情報取得部431は、ステップS1701で受信された請求書画像に対して文字認識処理を行い、変動請求関連情報を取得する。なお、請求書情報取得部431は、文字認識処理の代わりに、ステップS1714において記載した処理により変動請求関連情報を取得しても良い。
【0221】
(ステップS1716)処理部43は、入力画面を構成する。かかる処理は、ステップS1706と同様の処理である。
【0222】
(ステップS1717)出力部44は、ステップS1716で構成された入力画面を、1または2以上の第二端末3に送信する。かかる処理は、ステップS1707と同様の処理である。
【0223】
(ステップS1718)受付部42は、1以上のすべての第二端末3から、1以上の変動請求関連情報を受信したか否かを判断する。1以上のすべての第二端末3から、1以上の変動請求関連情報を受信した場合はステップS1719に行き、1以上の変動請求関連情報を受信しなかった場合はステップS1718に戻る。なお、変動請求関連情報は、例えば、請求額情報、支払期日情報である。また、ここで、受付部42は、固定請求関連情報をも受信しても良い。
【0224】
(ステップS1719)請求書情報取得部431は、2以上の請求関連情報を有する請求書情報を構成する。なお、請求書情報取得部431は、上述した決定手段1313と同様の処理により、蓄積される請求関連情報を決定し、当該請求関連情報を用いて、請求書情報を構成することは好適である。また、請求書情報を構成する2以上の請求関連情報は、例えば、ステップS1718で受信された請求関連情報をそのまま含んでも良い。
【0225】
(ステップS1720)請求書情報蓄積部432は、ステップS1719で構成された請求書情報を、ステップS1701で受信された請求書画像と対にして、格納部41に蓄積する。ステップS1701に戻る。
【0226】
なお、図17のフローチャートにおいて、請求書情報を取得し、蓄積するまでの処理として、ステップS1703からステップS1710までの第一の処理と、ステップS1711からステップS1720までの第二の処理が存在するが、情報処理装置4は、第一の処理と第二の処理のいずれか一方のみを行っても良い。
【0227】
また、図17のフローチャートにおいて、電源オフや処理終了の割り込みにより処理は終了する。
【0228】
以下、本実施の形態における情報システムBの具体的な動作例について説明する。情報システムBの概念図は図1である。
【0229】
今、学習情報格納部111には、図14に示す構造を有する請求書元情報管理表が格納されている。また、学習情報格納部111には、機械学習により取得された学習器も格納されている。
【0230】
ここで、第一ユーザは、第一端末2に対して、図8の請求書画像を入力した、とする。すると、第一端末2の第一受付部22は請求書画像を受け付ける。次に、第一処理部23は、第一受付部22が受け付けた請求書画像を送信するデータ構造の請求書画像にする。次に、第一送信部24は、第一処理部23が構成した請求書画像を情報処理装置4に送信する。
【0231】
次に、情報処理装置4の請求書画像受付部112は、図8の請求書画像を受信する。そして、処理部43は、受信された請求書画像を格納部11に蓄積する。
【0232】
次に、請求書情報取得部431は、図8の請求書画像に受信された請求書画像に類似する請求書画像を格納部41から検索する。しかし、ここで、類似度が閾値以内の請求書画像が格納部41に存在しなかった、とする。
【0233】
次に、処理部13は、1以上の第二端末3に送信する画面を構成する。そして、出力部44は、当該画面を1以上の第二端末3に送信する。
【0234】
次に、第二端末3の第二受信部35は、当該画面を受信する。次に、第二処理部33は、受信された画面から出力される画面を構成する。そして、第二出力部36は、構成された画面を出力する。かかる画面例は、図18である。
【0235】
次に、第二ユーザは、請求書画像を見て、「請求書(国内)」1801を選択し、「確定」ボタンを押下した、とする。すると、第二受付部32は、「請求書(国内)」1801を識別する情報を受け付け、第二送信部34は、かかる情報を情報処理装置4に送信する。
【0236】
次に、情報処理装置4の受付部42は、「請求書(国内)」1801を識別する情報を受信する。そして、処理部43は、かかる情報に対応する画面であり、受付情報を入力するための画面を構成する。次に、出力部44は、かかる画面を第二端末3に送信する。
【0237】
なお、図18の請求書の種別選択において、「請求書(国内)」「請求書(国外)」「口座引落」「その他」のうち、例えば、「請求書(国内)」の場合のみ、受付情報を入力するための画面が構成さる。また、図18の請求書の種別選択において、「請求書(国内)」「請求書(国外)」「口座引落」「その他」のうち、例えば、「その他」の場合のみ、受付情報を入力するための画面が構成されないような処理としても良い。つまり、処理部43は、予め決められた請求書の種別か否かを判断し、予め決められた請求書の種別の場合のみ、受付情報を入力するための画面を構成しても良い。また、処理部43は、予め決められた請求書の種別か否かを判断し、予め決められた請求書の種別の場合のみ、受付情報を入力するための画面を構成しないようにしても良い。
【0238】
次に、第二端末3の第二受信部35は、受付情報を入力するための画面を受信する。そして、第二処理部33は、出力するための画面を構成する。次に、第二出力部36は、受付情報を入力するための画面を出力する。なお、かかる画面は、請求書画像と受付情報を入力するためのフィールドとを有する。
【0239】
次に、第二端末3の第二ユーザは、出力された画面に対して、会社名「Sansan株式会社」と口座番号「1407848」を入力した、とする。なお、ここで、会社名と口座番号とは受付情報の例である。ただし、受付情報は口座番号だけでも良い。
【0240】
次に、第二端末3の第二受付部32は、受付情報を受け付ける。次に、第二処理部33は、受け付けられた受付情報を送信するデータ構造にする。次に、第二送信部34は、受付情報を情報処理装置4に送信する。
【0241】
次に、情報処理装置4の受付部42は、第二端末3から受付情報を受信する。
【0242】
次に、請求書情報取得部431は、受信された受付情報をキーとして、格納部41の請求書元情報を検索する。ここで、請求書情報取得部431は、請求書元情報が検索できなかった、とする。つまり、格納部41には、口座番号「1407848」等が存在しなかった、とする。
【0243】
次に、処理部43は、受付情報に対応する請求書元情報が存在しなかった場合の画面を構成する。そして、出力部44は、当該画面を第二端末3に送信する。
【0244】
次に、第二端末3の第二受信部35は、当該画面を受信する。そして、第二処理部33は、受信された画面から出力する画面を構成する。次に、第二出力部36は、当該画面を出力する。なお、かかる画面例は、図19である。また、図19において、対象の振込口座(口座番号)が存在しなかった場合、振込口座の表示フィールド1901に「該当なし」と表示される。
【0245】
次に、実施の形態1で説明した処理であり、図17のフローチャートのステップS403からステップS409の処理が実行される。
【0246】
一方、例えば、学習情報格納部111には、図14に示す請求書元情報管理表が格納されている、とした場合、請求書情報取得部431が受信された受付情報をキーとして、格納部41の請求書元情報を検索した結果、図14の「ID=892」の請求書元情報が検索できた、とする。
【0247】
そして、請求書情報取得部431は、図14の「ID=892」のレコードの属性値のうち、3つの固定請求関連情報を取得する。なお、3つの固定請求関連情報は、(1)会社名「Sansan株式会社」、(2)住所「〒150-0001 東京都渋谷区神宮前・・・」、(4)支払先「りそな銀行・・・,みずほ銀行・・・,三井住友銀行・・・」を取得する。
【0248】
次に、請求書情報取得部431は、受信された請求書画像に対して文字認識処理を行い、変動請求関連情報を取得する。ここで変動請求関連情報は、請求額「1」、支払期日「2017年10月31日」である。
【0249】
次に、処理部43は、請求書情報を取得するために、第二ユーザが請求関連情報を修正する入力画面を構成する。
【0250】
次に、出力部44は、構成された入力画面を、1または2以上の第二端末3に送信する。
【0251】
次に、1以上の第二端末3の第二受信部35は、入力画面を受信する。そして、第二処理部33は、受信された入力画面を用いて、表示する入力画面を構成する。次に、第二出力部36は、構成された入力画面を表示する。かかる入力画面の例は、図20である。図20において、会社名が2001のフィールドに表示され、住所を構成する郵便番号が2002のフィールドに表示され、支払先が2003のフィールドに表示されている。
【0252】
そして、第二ユーザは、図20の画面、図11から図13の画面等を用いて、第二端末3に表示された請求書情報を確認したり、修正したり、請求額等の変動請求関連情報を入力したりする。次に、第二端末3の第二受付部32は、変動請求関連情報を含む請求書情報を受け付ける。次に、第二処理部33は、送信するデータ構造の請求書情報を構成する。そして、第二送信部34は、請求書情報を情報処理装置4に送信する。
【0253】
次に、情報処理装置4の受付部42は、1以上のすべての第二端末3から、1以上の変動請求関連情報を含む請求書情報を受信する。
【0254】
次に、請求書情報取得部431は、1以上の第二端末3から受信された請求書情報を用いて、蓄積する請求書情報を構成する。
【0255】
次に、請求書情報蓄積部432は、構成された請求書情報を受信された請求書画像と対にして、格納部41に蓄積する。
【0256】
以上の処理により、情報処理装置4は、学習情報を効率的に精度高く蓄積できた。
【0257】
以上、本実施の形態によれば、請求書画像から、管理すべき情報を容易に精度高く取得し、蓄積することができる。
【0258】
また、本実施の形態によれば、学習情報を用いて、請求書画像から、管理すべき情報を容易に精度高く取得し、蓄積することができるとともに、学習情報を進化させることができる。
【0259】
なお、本実施の形態における処理は、ソフトウェアで実現しても良い。そして、このソフトウェアをソフトウェアダウンロード等により配布しても良い。また、このソフトウェアをCD-ROMなどの記録媒体に記録して流布しても良い。なお、このことは、本明細書における他の実施の形態においても該当する。なお、本実施の形態における情報処理装置4を実現するソフトウェアは、以下のようなプログラムである。つまり、このプログラムは、学習情報製造装置1が蓄積した学習情報が格納される学習情報格納部にアクセス可能なコンピュータを、請求書画像を受け付ける請求書画像受付部と、前記請求書画像受付部が受け付けた請求書画像に関する情報である受付情報と、前記学習情報格納部の学習情報とを用いて、2種類以上の請求関連情報を有する請求書情報を取得する請求書情報取得部と、前記請求書情報を出力する請求書情報出力部として機能させるためのプログラムである。
【0260】
また、図21は、本明細書で述べたプログラムを実行して、上述した種々の実施の形態の情報処理装置4等を実現するコンピュータの外観を示す。上述の実施の形態は、コンピュータハードウェア及びその上で実行されるコンピュータプログラムで実現され得る。図21は、このコンピュータシステム300の概観図であり、図22は、システム300のブロック図である。
【0261】
図21において、コンピュータシステム300は、CD-ROMドライブを含むコンピュータ301と、キーボード302と、マウス303と、モニタ304とを含む。
【0262】
図22において、コンピュータ301は、CD-ROMドライブ3012に加えて、MPU3013と、CD-ROMドライブ3012等に接続されたバス3014と、ブートアッププログラム等のプログラムを記憶するためのROM3015と、MPU3013に接続され、アプリケーションプログラムの命令を一時的に記憶するとともに一時記憶空間を提供するためのRAM3016と、アプリケーションプログラム、システムプログラム、及びデータを記憶するためのハードディスク3017とを含む。ここでは、図示しないが、コンピュータ301は、さらに、LANへの接続を提供するネットワークカードを含んでも良い。
【0263】
コンピュータシステム300に、上述した実施の形態の情報処理装置4等の機能を実行させるプログラムは、CD-ROM3101に記憶されて、CD-ROMドライブ3012に挿入され、さらにハードディスク3017に転送されても良い。これに代えて、プログラムは、図示しないネットワークを介してコンピュータ301に送信され、ハードディスク3017に記憶されても良い。プログラムは実行の際にRAM3016にロードされる。プログラムは、CD-ROM3101またはネットワークから直接、ロードされても良い。
【0264】
プログラムは、コンピュータ301に、上述した実施の形態の情報処理装置4等の機能を実行させるオペレーティングシステム(OS)、またはサードパーティープログラム等は、必ずしも含まなくても良い。プログラムは、制御された態様で適切な機能(モジュール)を呼び出し、所望の結果が得られるようにする命令の部分のみを含んでいれば良い。コンピュータシステム300がどのように動作するかは周知であり、詳細な説明は省略する。
【0265】
また、上記プログラムを実行するコンピュータは、単数であってもよく、複数であってもよい。すなわち、集中処理を行ってもよく、あるいは分散処理を行ってもよい。
【0266】
また、上記各実施の形態において、一の装置に存在する2以上の通信手段は、物理的に一の媒体で実現されても良いことは言うまでもない。
【0267】
また、上記各実施の形態において、各処理は、単一の装置によって集中処理されることによって実現されてもよく、あるいは、複数の装置によって分散処理されることによって実現されてもよい。
【0268】
本発明は、以上の実施の形態に限定されることなく、種々の変更が可能であり、それらも本発明の範囲内に包含されるものであることは言うまでもない。
【産業上の利用可能性】
【0269】
以上のように、本発明にかかる学習情報製造装置は、請求書画像から管理すべき情報を容易に、かつ精度高く取得し、蓄積することができるという効果を有し、学習情報製造装置等として有用である。
【符号の説明】
【0270】
1 学習情報製造装置
2 第一端末
3 第二端末
4 情報処理装置
11、41 格納部
12、42 受付部
13、43 処理部
14、44 出力部
21 第一格納部
22 第一受付部
23 第一処理部
24 第一送信部
25 第一受信部
26 第一出力部
31 第二格納部
32 第二受付部
33 第二処理部
34 第二送信部
35 第二受信部
36 第二出力部
111 学習情報格納部
112 請求書画像受付部
113 領域特定情報受付部
131 請求関連情報取得部
132 学習情報構成部
133 学習情報蓄積部
141 請求書画像出力部
421 受付情報受付部
422 修正受付部
431 請求書情報取得部
432 請求書情報蓄積部
441 請求書情報出力部
1311 文字認識手段
1312 請求関連情報受付手段
1313 決定手段
1321 請求書元情報構成手段
1322 学習手段
4311 判断手段
4312 請求書情報取得手段
図1
図2
図3
図4
図5
図6
図7
図8
図9
図10
図11
図12
図13
図14
図15
図16
図17
図18
図19
図20
図21
図22