IP Force 特許公報掲載プロジェクト 2022.1.31 β版

知財求人 - 知財ポータルサイト「IP Force」

▶ 株式会社リコーの特許一覧

特開2023-6434情報処理システム、情報処理装置、情報処理方法、情報処理プログラム
<>
  • 特開-情報処理システム、情報処理装置、情報処理方法、情報処理プログラム 図1
  • 特開-情報処理システム、情報処理装置、情報処理方法、情報処理プログラム 図2A
  • 特開-情報処理システム、情報処理装置、情報処理方法、情報処理プログラム 図2B
  • 特開-情報処理システム、情報処理装置、情報処理方法、情報処理プログラム 図3
  • 特開-情報処理システム、情報処理装置、情報処理方法、情報処理プログラム 図4
  • 特開-情報処理システム、情報処理装置、情報処理方法、情報処理プログラム 図5
  • 特開-情報処理システム、情報処理装置、情報処理方法、情報処理プログラム 図6
  • 特開-情報処理システム、情報処理装置、情報処理方法、情報処理プログラム 図7A
  • 特開-情報処理システム、情報処理装置、情報処理方法、情報処理プログラム 図7B
  • 特開-情報処理システム、情報処理装置、情報処理方法、情報処理プログラム 図8
  • 特開-情報処理システム、情報処理装置、情報処理方法、情報処理プログラム 図9
  • 特開-情報処理システム、情報処理装置、情報処理方法、情報処理プログラム 図10
  • 特開-情報処理システム、情報処理装置、情報処理方法、情報処理プログラム 図11
  • 特開-情報処理システム、情報処理装置、情報処理方法、情報処理プログラム 図12
  • 特開-情報処理システム、情報処理装置、情報処理方法、情報処理プログラム 図13
  • 特開-情報処理システム、情報処理装置、情報処理方法、情報処理プログラム 図14
  • 特開-情報処理システム、情報処理装置、情報処理方法、情報処理プログラム 図15
< >
(19)【発行国】日本国特許庁(JP)
(12)【公報種別】公開特許公報(A)
(11)【公開番号】P2023006434
(43)【公開日】2023-01-18
(54)【発明の名称】情報処理システム、情報処理装置、情報処理方法、情報処理プログラム
(51)【国際特許分類】
   G06Q 40/12 20230101AFI20230111BHJP
【FI】
G06Q40/00 400
【審査請求】未請求
【請求項の数】16
【出願形態】OL
(21)【出願番号】P 2021109029
(22)【出願日】2021-06-30
(71)【出願人】
【識別番号】000006747
【氏名又は名称】株式会社リコー
(74)【代理人】
【識別番号】100107766
【弁理士】
【氏名又は名称】伊東 忠重
(74)【代理人】
【識別番号】100070150
【弁理士】
【氏名又は名称】伊東 忠彦
(72)【発明者】
【氏名】渡邊 貴弘
【テーマコード(参考)】
5L055
【Fターム(参考)】
5L055BB63
(57)【要約】
【課題】仕訳作業の負担を軽減することを目的としている。
【解決手段】端末装置と、情報処理装置とを含む情報処理システムであって、前記情報処理装置は、前記端末装置から、帳票の認識結果の確認画面の表示要求を受け付ける入力受付部と、前記帳票の発行元の属性を示す文字列と、前記帳票の明細の内容を示す文字列に対応した仕訳情報と、を含む前記確認画面の画面データを生成して前記端末装置に表示させる表示制御部と、を有し、前記端末装置は、前記画面データに基づき、前記発行元の属性を示す文字列と、前記明細の内容を示す文字列に対応した仕訳情報と、を含む前記確認画面を表示させる表示部を有する。
【選択図】図13
【特許請求の範囲】
【請求項1】
端末装置と、情報処理装置とを含む情報処理システムであって、
前記情報処理装置は、
前記端末装置から、帳票の認識結果の確認画面の表示要求を受け付ける入力受付部と、
前記帳票の発行元の属性を示す文字列と、前記帳票の明細の内容を示す文字列に対応した仕訳情報と、を含む前記確認画面の画面データを生成して前記端末装置に表示させる表示制御部と、を有し、
前記端末装置は、
前記画面データに基づき、前記発行元の属性を示す文字列と、前記明細の内容を示す文字列に対応した仕訳情報と、を含む前記確認画面を表示させる表示部を有する、情報処理システム。
【請求項2】
前記情報処理装置は、
前記帳票を示す画像データに対する文字認識処理により取得した読取結果情報から、前記発行元の属性を示す文字列と、前記明細の内容を示す文字列とを抽出する抽出結果管理部と、
前記発行元の属性を示す文字列と、前記明細の内容を示す文字列と、前記明細の内容を示す文字列と対応する仕訳情報と、を含む仕訳判別情報が格納された記憶部を参照し、前記明細の内容を示す文字列に対応した仕訳情報を取得する仕訳情報取得部と、を有し、
前記表示制御部は、
前記仕訳情報取得部により取得した仕訳情報を前記画面データに含める、請求項1記載の情報処理システム。
【請求項3】
前記確認画面は、
前記明細の内容を示す文字列と、前記明細の内容を示す文字列に対応した仕訳情報とのそれぞれが入力される入力欄と、
前記入力欄に入力された、前記明細の内容を示す文字列と、前記明細の内容を示す文字列に対応した仕訳情報との対応付けを指示するための操作部品と、を含み、
前記情報処理装置は、
前記端末装置から、前記対応付けの指示を受け付けると、前記入力欄に入力された前記明細の内容を示す文字列と、前記明細の内容を示す文字列に対応した仕訳情報と、を前記発行元の属性を示す文字列とを対応付けた仕訳判別情報とし、前記記憶部に格納する情報更新部を有する、請求項2記載の情報処理システム。
【請求項4】
前記確認画面は、
前記記憶部に格納された仕訳判別情報に含まれる前記発行元の属性を示す文字列の一覧の表示要求を行うための操作部品を有し、
前記表示制御部は、
前記端末装置から、前記一覧の表示要求を受け付けると、前記発行元の属性を示す文字列の一覧を前記確認画面に表示させる、請求項2又は3記載の情報処理システム。
【請求項5】
前記仕訳情報取得部は、
前記記憶部から、前記発行元の属性を示す文字列の一覧から選択された文字列と対応付けられた仕訳情報を取得し、
前記表示制御部は、
取得した前記仕訳情報を前記確認画面に表示させる、請求項4記載の情報処理システム。
【請求項6】
帳票の認識結果の確認画面の表示要求を受け付ける入力受付部と、
前記帳票の発行元の属性を示す文字列と、前記帳票の明細の内容を示す文字列に対応した仕訳情報と、を含む前記確認画面の画面データを生成して端末装置に表示させる表示制御部と、を有する、情報処理装置。
【請求項7】
前記帳票を示す画像データに対する文字認識処理により取得した読取結果情報から、前記発行元の属性を示す文字列と、前記明細の内容を示す文字列とを抽出する抽出結果管理部と、
前記発行元の属性を示す文字列と、前記明細の内容を示す文字列と、前記明細の内容を示す文字列と対応する仕訳情報と、を含む仕訳判別情報が格納された記憶部を参照し、前記明細の内容を示す文字列に対応した仕訳情報を取得する仕訳情報取得部と、を有し、
前記表示制御部は、
前記仕訳情報取得部により取得した仕訳情報を前記画面データに含める、請求項6記載の情報処理装置。
【請求項8】
前記確認画面は、
前記明細の内容を示す文字列と、前記明細の内容を示す文字列に対応した仕訳情報とのそれぞれが入力される入力欄と、
前記入力欄に入力された、前記明細の内容を示す文字列と、前記明細の内容を示す文字列に対応した仕訳情報との対応付けを指示するための操作部品と、を含み、
前記端末装置から、前記対応付けの指示を受け付けると、前記入力欄に入力された前記明細の内容を示す文字列と、前記明細の内容を示す文字列に対応した仕訳情報と、を前記発行元の属性を示す文字列とを対応付けた仕訳判別情報とし、前記記憶部に格納する情報更新部を有する、請求項7記載の情報処理装置。
【請求項9】
前記確認画面は、
前記記憶部に格納された仕訳判別情報に含まれる前記発行元の属性を示す文字列の一覧の表示要求を行うための操作部品を有し、
前記表示制御部は、
前記端末装置から、前記一覧の表示要求を受け付けると、前記発行元の属性を示す文字列の一覧を前記確認画面に表示させる、請求項7又は8記載の情報処理装置。
【請求項10】
前記仕訳情報取得部は、
前記記憶部から、前記発行元の属性を示す文字列の一覧から選択された文字列と対応付けられた仕訳情報を取得し、
前記表示制御部は、
取得した前記仕訳情報を前記確認画面に表示させる、請求項9記載の情報処理装置。
【請求項11】
端末装置と、情報処理装置とを含む情報処理システムによる情報処理方法であって、
前記情報処理装置が、
前記端末装置から、帳票の認識結果の確認画面の表示要求を受け付け、
前記帳票の発行元の属性を示す文字列と、前記帳票の明細の内容を示す文字列に対応した仕訳情報と、を含む前記確認画面の画面データを生成して前記端末装置に表示させ、
前記端末装置が、
前記画面データに基づき、前記発行元の属性を示す文字列と、前記明細の内容を示す文字列に対応した仕訳情報と、を含む前記確認画面を表示させる、情報処理方法。
【請求項12】
前記情報処理装置が、
前記帳票を示す画像データに対する文字認識処理により取得した読取結果情報から、前記発行元の属性を示す文字列と、前記明細の内容を示す文字列とを抽出し、
前記発行元の属性を示す文字列と、前記明細の内容を示す文字列と、前記明細の内容を示す文字列と対応する仕訳情報と、を含む仕訳判別情報が格納された記憶部を参照し、前記明細の内容を示す文字列に対応した仕訳情報を取得し、
取得した前記仕訳情報を前記画面データに含める、請求項11記載の情報処理方法。
【請求項13】
前記確認画面は、
前記明細の内容を示す文字列と、前記明細の内容を示す文字列に対応した仕訳情報とのそれぞれが入力される入力欄と、
前記入力欄に入力された、前記明細の内容を示す文字列と、前記明細の内容を示す文字列に対応した仕訳情報との対応付けを指示するための操作部品と、を含み、
前記情報処理装置が、
前記端末装置から、前記対応付けの指示を受け付けると、前記入力欄に入力された前記明細の内容を示す文字列と、前記明細の内容を示す文字列に対応した仕訳情報と、を前記発行元の属性を示す文字列とを対応付けた仕訳判別情報とし、前記記憶部に格納する情報更新する、請求項12記載の情報処理方法。
【請求項14】
前記確認画面は、
前記記憶部に格納された仕訳判別情報に含まれる前記発行元の属性を示す文字列の一覧の表示要求を行うための操作部品を有し、
前記端末装置から、前記一覧の表示要求を受け付けると、前記発行元の属性を示す文字列の一覧を前記確認画面に表示させる、請求項12又は13記載の情報処理方法。
【請求項15】
前記情報処理装置が、
前記記憶部から、前記発行元の属性を示す文字列の一覧から選択された文字列と対応付けられた仕訳情報を取得し、
取得した前記仕訳情報を前記確認画面に表示させる、請求項14記載の情報処理方法。
【請求項16】
帳票の認識結果の確認画面の表示要求を受け付け、
前記帳票の発行元の属性を示す文字列と、前記帳票の明細の内容を示す文字列に対応した仕訳情報と、を含む前記確認画面の画面データを生成して端末装置に表示させる、処理を情報処理装置に実行させる、情報処理プログラム。
【発明の詳細な説明】
【技術分野】
【0001】
本発明は、帳票の認識を行う情報処理システム、情報処理装置、情報処理方法、情報処理プログラムに関する。
【背景技術】
【0002】
近年では、帳票画像データに対する帳票認識を行うシステムが知られている。具体的には、例えば、従来では、帳票認識によって取得した帳票情報と、帳票の発行元が一致する過去の仕訳情報と、に基づき生成されたテキストデータを含む仕訳情報の入力欄を表示させるシステムが知られている。
【発明の概要】
【発明が解決しようとする課題】
【0003】
上述した従来の技術では、帳票の発行元が一致する過去の仕訳情報を参照しているが、同じ発行元から発行された帳票であっても、帳票を発行する支店や部門等に応じて(帳票を発行する側の支店等に依る場合と帳票を受け取る側の支店等に依る場合双方を含む)、仕訳の内容が異なる場合がある。この場合、仕訳を行う作業者が、仕訳を変更しなければならず、作業者の負荷となる。
【0004】
本発明は、上記事情に鑑みて成されたものであり、仕訳作業の負担を軽減することを目的としている。
【課題を解決するための手段】
【0005】
開示の技術は、端末装置と、情報処理装置とを含む情報処理システムであって、前記情報処理装置は、前記端末装置から、帳票の認識結果の確認画面の表示要求を受け付ける入力受付部と、前記帳票の発行元の属性を示す文字列と、前記帳票の明細の内容を示す文字列に対応した仕訳情報と、を含む前記確認画面の画面データを生成して前記端末装置に表示させる表示制御部と、を有し、前記端末装置は、前記画面データに基づき、前記発行元の属性を示す文字列と、前記明細の内容を示す文字列に対応した仕訳情報と、を含む前記確認画面を表示させる表示部を有する。
【発明の効果】
【0006】
仕訳作業の負担を軽減することができる。
【図面の簡単な説明】
【0007】
図1】帳票認識システムのシステム構成の一例を示す図である。
図2A】サーバ装置のハードウェア構成の一例を示す図である。
図2B】端末装置のハードウェア構成の一例を示す図である。
図3】テナントデータベースの一例を示す図である。
図4】抽出定義データベースの一例を示す図である。
図5】抽出結果データベースの一例を示す図である。
図6】仕訳判別データベースの一例を示す図である。
図7A】サーバ装置の機能を説明する図である。
図7B】端末装置の機能を説明する図である。
図8】帳票認識システムの動作を説明する第一のシーケンス図である。
図9】ジョブリストの一例を示す図である。
図10】帳票認識処理部の処理を説明する第一のフローチャートである。
図11】読取結果情報の一例を示す図である。
図12】帳票認識システムの動作を説明する第二のシーケンス図である。
図13】確認画面を表示する処理を説明するフローチャートである。
図14】仕訳判別情報を更新する処理を説明するフローチャートである。
図15】表示例を示す図である。
【発明を実施するための形態】
【0008】
以下に図面を参照して、実施形態について説明する。図1は、帳票認識システムのシステム構成の一例を示す図である。
【0009】
本実施形態の帳票認識システム100は、サーバ装置200、画像形成装置300、端末装置400を有する。本実施形態の帳票認識システム100において、サーバ装置200と、画像形成装置300と、端末装置400とは、ネットワークを介して接続される。
【0010】
本実施形態の端末装置400は、例えば、ネットワークを介して基幹システム500と接続される。基幹システム500とは、例えば、本実施形態の帳票認識システム100において帳票を認識した結果を用いて、特定の処理を行うシステムである。
【0011】
本実施形態では、請求書を帳票の一例として説明する。また、以下の説明では、帳票認識システム100は、請求書を読み取った帳票画像から、請求書を発行した請求元や、請求金額に関する請求書情報と、請求書の明細の内容に関する明細情報とを含む情報を抽出するものとして説明する。
【0012】
また、帳票が請求書である場合、基幹システム500は、金融機関に対する請求額の振込等を行う会計システムであってもよい。
【0013】
本実施形態の帳票認識システム100において、サーバ装置200は、画像形成装置300のスキャナ機能によって読み取られた帳票の画像を示す画像データを取得する。また、サーバ装置200は、端末装置400から、帳票の画像を示す画像データを受信してもよい。
【0014】
サーバ装置200は、帳票の画像を示す帳票画像データを取得すると、帳票に含まれる項目と項目の値とを抽出し、項目と項目の値とを対応付けたテキストデータとする。
【0015】
以下の説明では、帳票の画像を帳票画像と呼び、帳票画像を示す画像データを帳票画像データと呼ぶ。
【0016】
また、以下の説明では、帳票画像に含まれる項目の名称(項目名)と、この項目の項目情報としての値(項目値)とを抽出し、項目名と項目値とをテキストデータに変換して対応付けることを、帳票認識と呼ぶ。
【0017】
本実施形態のサーバ装置200は、記憶部220と、帳票認識処理部230とを有する。記憶部220には、画像データベース240、テナントデータベース245、抽出定義データベース250、抽出結果データベース255、仕訳判別データベース260、認識結果データベース265が設けられている。
【0018】
画像データベース240は、帳票画像データが格納される。テナントデータベース245は、テナントに関するテナント情報が格納される。
【0019】
尚、本実施形態におけるテナントとは、例えば、企業等である。より具体的には、例えば、テナントとは、帳票認識システム100が提供するサービスを利用するための契約を締結している事業者や企業、団体等である。
【0020】
抽出定義データベース250は、抽出定義情報が格納される。抽出定義情報は、帳票画像から請求書情報に含まれる文字列を抽出する際に、帳票認識処理部230に参照される。
【0021】
抽出結果データベース255は、帳票認識処理部230による帳票認識処理により、帳票から抽出された文字列が格納される。
【0022】
仕訳判別データベース260は、請求書と対応する仕訳を判別する際に参照させる仕訳判別情報が格納される。認識結果データベース265は、帳票認識処理部230による帳票認識の結果を示す認識結果データが格納される。尚、認識結果データベース265は、テナント毎に設けられてよい。
【0023】
本実施形態の帳票認識処理部230は、画像データベース240に格納された帳票画像データを取得し、文字認識を行って、帳票画像に含まれる文字列群を抽出する。そして、帳票認識処理部230は、抽出定義データベース250に格納された抽出定義情報を参照して、文字列群から、請求書情報に含まれる文字列と明細情報に含まれる文字列群とを抽出し、抽出結果を抽出結果データベース255に格納する。
【0024】
さらに、本実施形態の帳票認識処理部230は、仕訳判別データベース260を参照し、請求書情報に含まれる特定の文字列と、明細情報に含まれる明細の内容を示す文字列とを含む仕訳判別情報が存在するか否かを判定する。
【0025】
請求書情報に含まれる特定の文字列とは、例えば、請求元となるテナントの支店名や部署名等である。以下の説明では、請求書情報に含まれる特定の文字列を、仕訳判別ワードと表現する場合がある。
【0026】
また、明細情報に含まれる明細の内容を示す文字列とは、例えば、商品名等である。
【0027】
つまり、本実施形態では、テナントの支店や部署(仕訳判別ワード)と、請求書の明細に含まれる商品名と、とを含む仕訳判別情報が存在するか否かを判別する。そして、帳票認識処理部230は、該当する仕訳判別情報が存在する場合に、該当する仕訳判別情報に基づく仕訳情報を、請求書情報と明細情報と共に、帳票の認識結果の確認画面に表示させる。
【0028】
本実施形態の請求書情報に含まれる特定の文字列(仕訳判別ワード)は、言い換えれば、帳票の発行元と対応付けられた情報であり、帳票の発行元の属性を示す文字列である。また、明細情報に含まれる明細の内容を示す文字列とは、言い換えれば、仕訳の対象を示す文字列である。
【0029】
また、本実施形態の帳票認識処理部230は、抽出結果データベース255に格納された抽出結果情報を、帳票認識処理部230による帳票認識の結果を示す認識結果データの一部として認識結果データベース265に格納する。また、本実施形態では、仕訳情報は、認識結果データと対応付けられて、認識結果データベース265に格納されてよい。
【0030】
本実施形態では、このように、帳票認識において、帳票の確認画面において、帳票に含まれる仕訳の対象について、帳票の発行元の属性に基づく仕訳情報が入力された状態で表示させる。
【0031】
したがって、本実施形態によれば、請求元が同じであっても、支店や部署が示す請求元の属性に対応する仕訳情報を入力した状態で確認画面を表示させることができ、仕訳情報の入力作業の負荷を軽減することができる。つまり、本実施形態によれば、仕訳作業の負荷を軽減することができる。尚、ここでは、支店や部署等は、請求元(帳票を発行する側)としたが、これに限定されない、支店や部署等は、帳票を受け取る側の支店や部署であってもよい。
【0032】
本実施形態の帳票認識システム100において、画像形成装置300は、スキャナ機能を有する複合機である。画像形成装置300は、コピー機能、FAX機能、スキャナ機能等を実現するためのアプリケーションが搭載されており、各機能と対応するアプリケーションを選択することで、これらの機能が実現される。
【0033】
本実施形態の端末装置400は、帳票認識システム100を利用する利用者(テナント)によって使用される。また、端末装置400は、サーバ装置200による帳票認識の結果が表示される。本実施形態の端末装置400は、例えば、タブレット型の端末であってもよいし、スマートフォン等であってもよい。
【0034】
また、図1の例では、サーバ装置200は、記憶部220内に6つのデータベースを有する構成としたが、これに限定されない。各データベースは、一部がサーバ装置200の外部装置に設けられていてもよいし、各データベース全てが外部装置に設けられていてもよい。
【0035】
また、図1の例では、サーバ装置200が帳票認識処理部230を実現するものとしたが、これに限定されない。帳票認識処理部230は、複数の情報処理装置によって実現されてもよい。
【0036】
また、図1の例では、帳票認識システム100に含まれる画像形成装置300と端末装置400とは、それぞれ1台としているが、帳票認識システム100に含まれる画像形成装置300と端末装置400の台数は、任意の数であって良い。
【0037】
次に、図2Aを参照して、本実施形態のサーバ装置200のハードウェア構成について説明する。図2Aは、サーバ装置のハードウェア構成の一例を示す図である。
【0038】
図2Aに示されているように、サーバ装置200は、コンピュータによって構築されており、図2Aに示されているように、CPU201、ROM202、RAM203、HD204、HDD(Hard Disk Drive)コントローラ205、ディスプレイ206、外部機器接続I/F(Interface)208、ネットワークI/F209、バスライン210、キーボード211、ポインティングデバイス212、DVD-RW(Digital Versatile Disk Rewritable)ドライブ214、メディアI/F216を備えている。
【0039】
これらのうち、CPU201は、サーバ装置200全体の動作を制御する。ROM202は、IPL等のCPU201の駆動に用いられるプログラムを記憶する。RAM203は、CPU201のワークエリアとして使用される。HD204は、プログラム等の各種データを記憶する。HDDコントローラ205は、CPU201の制御にしたがってHD204に対する各種データの読み出し又は書き込みを制御する。
【0040】
ディスプレイ206は、カーソル、メニュー、ウィンドウ、文字、又は画像などの各種情報を表示する。外部機器接続I/F208は、各種の外部機器を接続するためのインターフェースである。この場合の外部機器は、例えば、USB(Universal Serial Bus)メモリやプリンタ等である。ネットワークI/F209は、通信ネットワークを利用してデータ通信をするためのインターフェースである。バスライン210は、図2Aに示されているCPU201等の各構成要素を電気的に接続するためのアドレスバスやデータバス等である。
【0041】
また、キーボード211は、文字、数値、各種指示などの入力のための複数のキーを備えた入力手段の一種である。ポインティングデバイス212は、各種指示の選択や実行、処理対象の選択、カーソルの移動などを行う入力手段の一種である。DVD-RWドライブ214は、着脱可能な記録媒体の一例としてのDVD-RW213に対する各種データの読み出し又は書き込みを制御する。尚、DVD-RWに限らず、DVD-R等であってもよい。メディアI/F216は、フラッシュメモリ等の記録メディア215に対するデータの読み出し又は書き込み(記憶)を制御する。
【0042】
次に、図2Bを参照して、本実施形態の端末装置400のハードウェア構成について説明する。図2Bは、端末装置のハードウェア構成の一例を示す図である。本実施形態の端末装置400は、CPU401、ROM402、RAM403、EEPROM404、CMOSセンサ405、撮像素子I/F406、加速度・方位センサ407、メディアI/F409、GPS受信部411を備える。
【0043】
これらのうち、CPU401は、端末装置400全体の動作を制御する演算処理装置である。ROM402は、CPU401やIPL等のCPU401の駆動に用いられるプログラムを記憶する。RAM403は、CPU401のワークエリアとして使用される。EEPROM404は、CPU401の制御にしたがって、スマートフォン用プログラム等の各種データの読み出し又は書き込みを行う。ROM402、RAM403、EEPROM404は、端末装置400の記憶装置の一例である。
【0044】
CMOS(Complementary Metal Oxide Semiconductor)センサ405は、CPU401の制御に従って被写体(主に自画像)を撮像して画像データを得る内蔵型の撮像手段の一種である。尚、CMOSセンサではなく、CCD(Charge Coupled Device)センサ等の撮像手段であってもよい。
【0045】
撮像素子I/F406は、CMOSセンサ405の駆動を制御する回路である。加速度・方位センサ407は、地磁気を検知する電子磁気コンパスやジャイロコンパス、加速度センサ等の各種センサである。メディアI/F409は、フラッシュメモリ等の記録メディア408に対するデータの読み出し又は書き込み(記憶)を制御する。GPS受信部411は、GPS衛星からGPS信号を受信する。
【0046】
また、端末装置400は、遠距離通信回路412、遠距離通信回路412のアンテナ412a、CMOSセンサ413、撮像素子I/F414、マイク415、スピーカ416、音入出力I/F417、ディスプレイ418、外部機器接続I/F(Interface)419、近距離通信回路420、近距離通信回路420のアンテナ420a、及びタッチパネル421を備えている。
【0047】
これらのうち、遠距離通信回路412は、通信ネットワークを介して、他の機器と通信する回路である。CMOSセンサ413は、CPU401の制御に従って被写体を撮像して画像データを得る内蔵型の撮像手段の一種である。撮像素子I/F414は、CMOSセンサ413の駆動を制御する回路である。マイク415は、音を電気信号に変える内蔵型の回路である。スピーカ316は、電気信号を物理振動に変えて音楽や音声などの音を生み出す内蔵型の回路である。音入出力I/F417は、CPU401の制御に従ってマイク415及びスピーカ416との間で音信号の入出力を処理する回路である。
【0048】
ディスプレイ418は、被写体の画像や各種アイコン等を表示する液晶や有機EL(Electro Luminescence)などの表示手段の一種である。外部機器接続I/F419は、各種の外部機器を接続するためのインターフェースである。近距離通信回路420は、NFC(Near Field Communication)やBluetooth(登録商標)等の通信回路である。タッチパネル421は、利用者がディスプレイ418を押下することで、端末装置400を操作する入力手段の一種である。ディスプレイ418は、端末装置400の有する表示部の一例である。
【0049】
尚、端末装置400は、図2Aに示すようなハードウェア構成を有する一般的なコンピュータであってもよい。
【0050】
次に、図3を参照して、本実施形態のサーバ装置200の有するテナントデータベース245について説明する。図3は、テナントデータベースの一例を示す図である。本実施形態のテナントデータベース245は、予めサーバ装置200に格納されていてよい。
【0051】
テナントデータベース245に格納されたテナント情報は、情報の項目として、テナントID、会社名、支店名、電話番号、住所等を含み、項目「テナントID」と、その他の項目とが対応付けられている。
【0052】
項目「テナントID」の値は、テナントを特定するための識別情報である。言い換えれば、テナントIDは、帳票認識システム100の利用者を特定するための識別情報である。項目「会社名」の値は、テナントの名称を示す。言い換えれば、項目「会社名」は、利用者の名称を示す。項目「支店名」の値は、テナントの支店の名称を示す。
【0053】
項目「電話番号」の値と、項目「住所」の値は、テナントIDで特定されるテナントの電話番号と住所を示す。
【0054】
尚、テナント情報には、図3に示す項目以外の項目が含まれてもよい。具体的には、例えば、テナント情報には、テナントにおける部署名や、部署に関する情報等が含まれてもよい。
【0055】
図4は、抽出定義データベースの一例を示す図である。図4では、抽出定義データベース250に格納された抽出定義情報の一例を示す。図4は、例えば、テナント毎に予め設けられていてもよい。
【0056】
抽出定義情報は、情報の項目として、項目名、抽出基点キーワード、抽出方向、抽出範囲・抽出条件を有する。抽出定義データベース250において、項目「項目名」とその他の項目とは対応付けられており、項目「項目名」の値と、その他の項目の値とを含む情報が抽出定義情報となる。
【0057】
項目「項目名」の値は、項目値と対応付けられる項目名を示す。項目「項目名」の値は、項目名と対応する項目「抽出基点キーワード」の値が示す文字列との位置関係に基づき抽出される。
【0058】
また、項目「項目名」の値は、請求書情報に含まれる情報の項目でもある。図3の例では、項目「項目名」の値として、請求金額、請求日、請求元、支店名、部署名等が含まれる。これらの値は、請求書情報の項目となる。
【0059】
項目「抽出基点キーワード」の値は、項目「項目名」の値が示す項目名の項目値となる文字列を抽出する際に、基点となる文字列を示す。
【0060】
項目「抽出方向」の値は、基点になる文字列と、項目「項目名」の値が示す項目名の項目値となる文字列との位置関係を示す。項目「抽出範囲・抽出条件」の値は、抽出する文字列の範囲と条件を示す。
【0061】
図4では、例えば、項目名「請求金額」の項目値となる文字列は、帳票画像から抽出された文字列群のうち、「請求金額」、「請求金額合計」等の特定の文字列の右方向の隣にある文字列である。尚、項目名「請求金額」の抽出基点となる文字列は、「請求金額」、「請求金額合計」等の特定の文字列と部分一致する文字列であってもよい。
【0062】
また、例えば、項目名「請求日」の項目値となる文字列は、帳票画像から抽出された文字列群のうち、「請求日」等の特定の文字列の右方向の隣にある文字列である。
【0063】
また、例えば、項目名「請求元」の項目値となる文字列は、帳票画像から抽出された文字列群のうち、「請求元」、「弊社名」等の特定の文字列の右方向の隣にある文字列である。
【0064】
また、例えば、項目名「支店名」の項目値となる文字列は、帳票画像から抽出された文字列群のうち、「請求元」、「弊社名」等の特定の文字列の右方向又は下方向の隣にある文字列である。
【0065】
次に、図5を参照して、抽出結果データベース255について説明する。図5は、抽出結果データベースの一例を示す図である。
【0066】
本実施形態の抽出結果データベース255に格納される抽出結果情報は、テナントID,毎に設けられる。また、本実施形態の抽出結果データベース255は、帳票の登録日を示す登録情報が格納された登録テーブル255-1と、帳票から抽出された明細情報に含まれる項目名と項目値とを対応付けた対応付け情報が格納された対応付けテーブル255-2とを含む。
【0067】
登録テーブル255-1は、情報の項目として、テナントIDと、帳票IDと、登録日と、属性とを有し、それぞれが対応付けられている。項目「帳票ID」の値は、帳票(請求書)を特定するための識別情報であり、項目「登録日」の値は、帳票(請求書)の画像データに対する文字認識を行った日を示す。項目「属性」の値は、請求書を発行した支店や部署等を示す。
【0068】
対応付けテーブル255-2は、情報の項目として、テナントID、明細ID、商品名、金額、単価等を含む。項目「明細ID」の値は、明細の内容を特定するための識別情報である。本実施形態の項目「明細ID」の値は、帳票IDを含む。具体的には、例えば、明細ID「1111-M1」では、「1111」が帳票IDを示している。したがって、本実施形態の明細IDは、帳票と、帳票に含まれる明細とを特定する識別情報とも言える。
【0069】
尚、対応付け情報では、明細IDは明細の内容を特定する識別情報のみを含むものとし、明細IDと対応する帳票IDを情報の項目に含めてもよい。
項目「商品名」の値は、明細情報に含まれる商品の名称を示す。項目「金額」の値は、商品名と対応する支払い金額を示し、項目「単位」の値は、商品名と対応する単価を示す。
【0070】
尚、対応付けテーブル255-2に含まれる情報の項目は、図5に示す例に限定されない。例えば、項目「商品名」の代わりに「品名」等であってもよい。対応付けテーブル255-2に格納される項目「商品名」、「金額」、「単価」等は、帳票認識処理部230による文字認識によって抽出された文字列となる。
【0071】
次に、図6を参照して、本実施形態の仕訳判別データベース260について説明する。図6は、仕訳判別データベースの一例を示す図である。
【0072】
本実施形態の仕訳判別データベース260は、テナントID毎に設けられている。仕訳判別データベース260に格納された仕訳判別情報は、情報の項目として、テナントID、仕訳ID、借方科目、貸方科目、借方金額、貸方金額、仕訳判別ワード、明細ID等を含む。
【0073】
項目「仕訳ID」の値は、仕訳判別情報を特定するための識別情報である。本実施形態の項目「仕訳ID」の値は、帳票IDを含む。具体的には、例えば、仕訳ID「1111-S1」では、「1111」が帳票IDを示している。したがって、本実施形態の仕訳IDは、帳票と、帳票に含まれる明細の仕訳とを特定する識別情報とも言える。
【0074】
尚、仕訳判別情報では、仕訳IDは仕訳判別情報を特定する識別情報のみを含むものとし、仕訳IDと対応する帳票IDを情報の項目に含めてもよい。
【0075】
項目「借方科目」、「貸方科目」、「借方金額」、「貸方金額」の値は、仕訳の勘定科目と金額を示す。本実施形態では、項目「借方科目」、「貸方科目」、「借方金額」、「貸方金額」の値を含む情報を仕訳情報と表現する場合がある。したがって、本実施形態の仕訳判別情報は、仕訳情報を含む。
【0076】
項目「仕訳判別ワード」の値は、請求書情報に含まれる特定の文字列を示す。言い換えれば、項目「仕訳判別ワード」の値は、帳票の発行元と対応付けられた情報であり、帳票の発行元の属性を示す文字列を示す。
【0077】
図6では、テナントID「101」で特定されるテナントが発行した帳票のうち、明細ID「1111-M1」で特定される明細の内容が、仕訳ID「1111-S1」と対応付けられている。
【0078】
明細ID「1111-M1」で特定される明細の内容とは、商品名「ネジ」、金額「1000」、単価「100」である。したがって、この明細の内容は、借方科目「口座A」、借方金額「1000」・・・・という仕訳と対応付けられている。言い換えれば、明細ID「1111-M1」で特定される明細の内容は、仕訳ID「1111-S1」で特定される仕訳判別情報に組まれる仕訳情報と対応付けられていることがわかる。
【0079】
次に、図7A図7Bを参照して、本実施形態の帳票認識システム100の有する各装置の機能について説明する。
【0080】
図7Aは、サーバ装置の機能を説明する図である。
【0081】
本実施形態のサーバ装置200では、例えば、HD504等に格納された情報処理プログラムをCPU201が読み出して実行することで、後述する各部の機能が実現される。
【0082】
本実施形態のサーバ装置200は、帳票認識処理部230を有する。帳票認識処理部230は、入力受付部221、認証処理部222、帳票認識部290を有する。
【0083】
入力受付部221は、サーバ装置200に対する各種の入力を受け付ける。具体的には、入力受付部221は、帳票認識システム100にログインするためのログイン情報の入力を受け付ける。ログイン情報とは、例えば、テナントIDとパスワード等である。また、入力受付部221は、例えば、画像形成装置300から送信された帳票画像データの入力を受け付ける。
【0084】
認証処理部222は、入力受付部221が入力を受け付けたログイン情報に基づき、認証を行う。尚、認証処理部222は、例えば、サーバ装置200の外部に設けられた認証サーバに対して、入力されたログイン情報を送信し、認証サーバによる認証の結果を取得してもよい。認証処理部222は、利用者が認証されると、入力受付部221が受け付けた帳票画像データを帳票認識部290に渡してもよい。
【0085】
本実施形態の帳票認識部290は、画像データ格納部281、ジョブリスト生成部282、画像データ取得部283、文字認識部284、抽出結果管理部285、検索部286、仕訳情報取得部287、表示制御部288、認識結果生成部291、情報更新部292、出力部293を有する。
【0086】
画像データ格納部281は、画像形成装置300から帳票画像データを受信すると、画像データベース240に格納する。また、画像データ格納部281は、端末装置400から帳票画像データを受信すると、画像データベース240に格納する。
【0087】
ジョブリスト生成部282は、入力受付部221が画像形成装置300から帳票画像データの入力を受け付けて、ジョブリストにジョブを登録し、ジョブリストを管理する。ジョブリストの詳細は後述する。
【0088】
画像データ取得部283は、画像データベース240に格納された帳票画像データを取得する。
【0089】
文字認識部284は、帳票画像データから、文字列と、文字列が配置された位置を示す情報とを抽出し、読取結果情報として保持する。したがって、読取結果情報には、帳票画像データから抽出された複数の文字列が含まれる。以下の説明では、読取結果情報に含まれる、帳票画像データから抽出された複数の文字列を、文字列群と表現する場合がある。読取結果情報の詳細は後述する。
【0090】
抽出結果管理部285は、帳票画像データから抽出された複数の文字列を、項目名と項目値として対応付けた抽出結果情報として、抽出結果データベース255に格納する。
【0091】
検索部286は、抽出結果情報に含まれる仕訳判別ワードを検索キーとして、仕訳判別データベース260を検索する。具体的には、検索部286は、抽出結果情報に組まれる請求元の属性である支店名等で仕訳判別データベース260を検索する。
【0092】
仕訳情報取得部287は、検索部286の検索結果である仕訳情報を取得する。表示制御部288は、端末装置400等における画面の表示を制御する。具体的には、表示制御部288は、端末装置400に表示される認識結果確認画面を示す画面データを生成してもよい。
【0093】
認識結果生成部291は、抽出結果情報に含まれる請求書情報を含む認識結果データを生成する。情報更新部292は、端末装置400からの入力に応じて、仕訳判別データベース260を更新する。出力部293は、表示制御部288が生成した認識結果確認画面を示す画面データを端末装置400へ出力する。言い換えれば、出力部293は、表示制御部288が生成した認識結果確認画面を端末装置400のウェブブラウザ(表示部)上で表示させる。また、出力部293は、認識結果データを、基幹システム500と対応する形式のデータに変換し、出力する。
【0094】
次に、図7Bを参照して、端末装置400の機能について説明する。図7Bは、端末装置の機能構成を説明する図である。
【0095】
本実施形態の端末装置400は、入力受付部430と、表示部440と、通信部450とを有する。入力受付部430は、端末装置400に対する各種の入力を受け付ける。表示部440は、端末装置400のディスプレイ418の表示を制御する。表示部440は、例えば、ブラウザ等により実現されてもよいし、帳票認識システム100を利用するためのアプリケーション等により実現されてもよい。通信部450は、端末装置400と他の各装置との間で情報の送受信を行う。
【0096】
次に、図8を参照して、本実施形態の帳票認識システム100における帳票認識の動作について説明する。図8は、帳票認識システムの動作を説明する第一のシーケンス図である。
【0097】
帳票認識システム100において、画像形成装置300は、利用者から帳票認識を行うためのアプリケーションの起動要求を受け付けると(ステップS801)、このアプリケーションを起動させる(ステップS802)。利用者とは、例えば、テナントの管理者等である。
【0098】
続いて、画像形成装置300は、利用者から、テナントIDを含むログイン情報の入力を受け付けると(ステップS803)、このログイン情報をサーバ装置200へ送信し、認証要求を行う(ステップS804)。
【0099】
サーバ装置200は、認証要求を受けて、認証処理部222により認証を行い、その結果を画像形成装置300へ通知する(ステップS805)。尚、ここでは、利用者が認証された場合の動作を示している。
【0100】
続いて、画像形成装置300は、帳票のスキャン指示を受け付け(ステップS806)、帳票のスキャンを行い、帳票画像データを取得する(ステップS807)。続いて、画像形成装置300は、帳票画像データをサーバ装置200へ送信する(ステップS808)。
【0101】
サーバ装置200は、入力受付部221が帳票画像データの入力を受け付けると、認証処理部222がこの帳票画像データを帳票認識部290へ渡す(ステップS809)。尚、図8の例では、認証処理部222を介して帳票画像データが帳票認識部290へ渡されるものとしたが、これに限定されない。帳票画像データは、認証処理部222を介さずに帳票認識部290に渡されてもよい。
【0102】
サーバ装置200の帳票認識部290は、帳票画像データを受け取ると、ジョブリスト生成部282により、ジョブリストにジョブを登録する(ステップS810)。続いて、帳票認識部290は、画像データ格納部281により、帳票画像データを画像データベース240へ格納する(ステップS811)。
【0103】
続いて、帳票認識部290は、画像データ取得部283により、画像データベース240から認識する対象となる帳票画像データを取得し(ステップS812)、帳票画像を認識する処理を実行する(ステップS813)。
【0104】
具体的には、本実施形態の帳票認識部290は、文字認識部284により取得された読取結果情報に含まれる文字列群から請求書情報を抽出し、認識結果生成部291により、請求書情報を含む認識結果データを生成する。ステップS813の処理の詳細は後述する。
【0105】
続いて、帳票認識部290は、認識結果生成部291が生成した認識結果データを認識結果データベース265に格納し(ステップS814)、帳票認識の処理を終了する。
【0106】
ここで、図9を参照して、本実施形態のジョブリスト生成部282により生成されるジョブリストについて説明する。図9は、ジョブリストの一例を示す図である。
【0107】
本実施形態のサーバ装置200は、画像形成装置300から帳票画像データが入力されると、ジョブリスト生成部282により、帳票画像データとジョブIDとを対応付けたジョブリストとして保持する。
【0108】
本実施形態のジョブリスト91は、情報の項目として、ジョブID、テナントID、帳票画像ファイルパス、認識結果ファイルパス、ステータスを有する。
【0109】
項目「ジョブID」の値は、ジョブを特定する識別子である。言い換えれば、項目「ジョブID」の値は、画像形成装置300から受信した帳票画像データを特定するための識別子である。項目「画像ファイルパス」の値は、帳票画像データが格納されている場所を示す情報である。項目「認識結果ファイルパス」の値は、帳票画像を認識した結果の認識結果データが格納されている場所を示す情報である。
【0110】
項目「ステータス」の値は、利用者(テナント)による帳票画像の認識の進捗を示す。言い換えれば、項目「ステータス」の値は、ジョブの状態を示す。
【0111】
本実施形態では、項目「ステータス」の値として、未処理状態、下書き保存状態、確定済み状態、外部出力済み状態の4つがある。各状態は、以下の通りである。尚、項目「ステータス」の値は、認識結果データに含まれてもよい。また、「ステータス」はジョブの各状態を示すものであればよく、以下に示した4つの状態や名称に限定されるものではない。
【0112】
・未処理状態(状態1) 帳票認識によって認識結果データが取得された直後であり、認識結果の確認等が行われていない状態。
【0113】
・下書き保存状態(状態2) 認識結果データの確認等の作業の途中等であり、認識結果データが確定される前の状態。
【0114】
・確定済み状態(状態3) 認識結果データの確認等の作業が完了し、確定された情報として認識結果データベース265へ格納された状態。
【0115】
・外部出力済み状態(状態4) 帳票認識システム100と連携する会計システム等への認識結果データの出力が完了した状態。
【0116】
本実施形態のサーバ装置200は、画像形成装置300から帳票画像データを受信すると、ジョブリスト生成部282により、ジョブIDを付与し、ログイン情報として取得しテナントIDを対応付けて、ジョブリスト91にレコードを追加する。そして、ジョブリスト生成部282は、帳票画像データが画像データベース240に格納されると、この格納先を示す情報を項目「画像ファイルパス」の値として、追加する。
【0117】
さらに、ジョブリスト生成部282は、帳票画像の認識において、参照する帳票定義情報が特定されると、その識別情報としての定義IDを項目「定義ID」の値として追加する。そして、ジョブリスト生成部282は、ジョブリスト91が完了して、認識結果データが認識結果データベース265に格納されると、この格納先を示す情報を項目「認識結果ファイルパス」の値として追加し、項目「ステータス」の値を完了とする。
【0118】
本実施形態では、例えば、ジョブリスト生成部282によって生成されたジョブリストを表示してもよい。この場合、利用者は、ジョブリストに基づいて表示されたジョブリスト画面を介して、帳票画像の認識の進捗を確認することができる。
【0119】
次に、図10を参照して、帳票認識処理部230による帳票認識処理について説明する。
【0120】
図10は、帳票認識処理部の処理を説明する第一のフローチャートである。図12は、図8のステップS813における帳票認識処理部230の処理の詳細を示す。
【0121】
本実施形態の帳票認識部290は、画像データ取得部283により、画像データベース240から帳票画像データを取得する(ステップS1001)。
【0122】
続いて、帳票認識部290は、文字認識部284により、帳票画像から、文字が形成されている領域(以下、文字フィールド)を切り取り、切り取られた文字フィールドの中の文字を切り出して認識し、切り出した文字の位置を示す座標を取得する(ステップS1002)。
【0123】
続いて、帳票認識部290は、文字認識部284により認識された各文字の位置関係に基づいて読取結果情報を生成し、文字列と文字列の座標を特定する(ステップS1003)。読取結果情報の詳細は後述する。
【0124】
続いて、帳票認識部290は、抽出結果管理部285により、抽出定義データベース250を参照し、抽出定義情報に基づき、項目名と対応する項目値を抽出する(ステップS1004)。
【0125】
続いて、帳票認識処理部230は、抽出結果管理部285により、抽出結果を抽出結果データベース255に格納し(ステップS1005)、処理を終了する。
【0126】
次に、図11を参照して文字認識についてさらに説明する。図11は、読取結果情報の一例を示す図である。
【0127】
図11に示す情報111は、帳票画像データに対し、文字認識部284による文字認識を行った結果である。
【0128】
情報111は、文字フィールドを切り取り、文字フィールドの中の文字を認識した結果と、文字の位置を示す座標とから抽出した例を示す。
【0129】
本実施形態の文字認識部284は、この情報111から、隣り合う位置にある文字同士をつなげて文字列(文字列)を認識する。具体的には、文字認識部284は、文字と文字との間の距離が、所定ピクセル以内である文字の組み合わせを、1つ単語として認識しても良い。
【0130】
図11に示す情報112は、文字認識部284により認識された文字列と、文字列の領域とを示す情報であり、文字認識部284による帳票画像の読取結果情報である。
【0131】
また、文字認識部284は、帳票画像データから、縦線と横線で区切られた領域を1つのセルとして認識し、セル毎にセルを識別する識別情報(セルID)を付与する。
【0132】
図11に示す情報112は、帳票画像から認識されたセル毎の領域とセルIDとの対応付けを示す情報である。
【0133】
図11では、例えば、文字列「A支店」が認識された領域は、情報111において、X座標とY座標によって示される位置を基準として、高さと幅とから特定される。
【0134】
また、情報111において、文字列「A支店」が認識された領域は、セルID「17」に含まれることがわかる。したがって、文字列「A支店」は、読取結果情報に含まれる文字列として、セルID「17」と対応付けられる。
【0135】
本実施形態の帳票認識部290は、このようにして、帳票画像データから、文字列とセルとを対応付ける。
【0136】
次に、図12を参照して、帳票認識システム100における認識結果データを表示する際の動作について説明する。図12は、帳票認識システムの動作を説明する第二のシーケンス図である。
【0137】
帳票認識システム100において、端末装置400は、利用者から帳票の一覧の表示指示を受け付けると(ステップS1201)、サーバ装置200に対し、帳票の一覧画面の取得要求を送信する(ステップS1202)。
【0138】
サーバ装置200は、一覧画面の取得要求を受け付けると、表示制御部288により、端末装置400に対して、ログイン画面の表示指示を送信する(ステップS1203)。端末装置400は、この表示指示を受け付けて、ログイン画面を表示させる(ステップS1204)。
【0139】
端末装置400は、利用者から、テナントIDを含むログイン情報の入力を受け付けると(ステップS1205)、ログイン情報と共にログイン要求をサーバ装置200へ送信する(ステップS1206)。尚、以下では、ログイン情報からテナントが認証された場合について説明する。
【0140】
サーバ装置200は、ログイン要求を受け付けると、認証処理部222によって認証処理を実行させ(ステップS1207)、ログイン結果として、認証されたテナントIDを表示制御部288に返す(ステップS1208)。
【0141】
表示制御部288は、このテナントIDを保持し(ステップS1209)、記憶部220から、このテナントIDと対応する請求書(帳票)の一覧を示す情報を取得する(ステップS1210)。具体的には、表示制御部288は、テナントIDと対応する認識結果データベース265を参照し、請求書の一覧を示す情報を取得する。
【0142】
続いて、サーバ装置200は、表示制御部288により、請求書の一覧を示す情報の表示指示を端末装置400に送信する(ステップS1211)。
【0143】
端末装置400は、この表示指示を受け付けて、請求書の一覧を示す一覧画面を表示させる(ステップS1212)。
【0144】
また、端末装置400は、一覧画面において、請求書の選択を受け付けると(ステップS1213)、サーバ装置200に対し、認識結果データの確認画面の表示要求を送信する(ステップS1214)。尚、この表示要求には、一覧画面において選択された請求書を特定するための請求書ID(帳票ID)が含まれる。
【0145】
サーバ装置200は、入力受付部221により、確認画面の表示要求を受け付けると、表示制御部288は、記憶部220から、表示要求と共に受け付けた請求書IDと対応する認識結果データと共に、請求書IDと対応する請求書におる仕訳の対象について、請求元の属性が示す仕訳情報を取得する(ステップS1215)。
【0146】
続いて、帳票認識部290は、仕訳情報を取得すると、確認画面を表示させるための画面データに、取得した仕訳情報を入力する(ステップS1217)。ステップS1217の処理の詳細は後述する。
【0147】
続いて、帳票認識部290は、表示制御部288に対し、仕訳情報が入力された認識結果データの確認画面の画面データを渡す(ステップS1218)。表示制御部288は、この表示指示を端末装置400に送信する(ステップS1219)。
【0148】
端末装置400は、この表示指示を受け付けると、認識結果データの確認画面を表示させる(ステップS1220)。
【0149】
ここで、図12では、例えば、確認画面において、仕訳判別ワードが変更された場合について説明する。
【0150】
端末装置400は、利用者による仕訳判別ワードの変更と、仕訳判別ワードと対応する仕訳情報の入力とを受け付ける(ステップS1221)。続いて、端末装置400は、確定の操作を受け付けると(ステップS1222)、サーバ装置200に、帳票画像の認識の進捗を確定とすることを指示する確定指示を送信する(ステップS1223)。また、このとき、変更された仕訳情報もサーバ装置200に送信される。
【0151】
サーバ装置200は、帳票認識部290において、確定指示を受け付けると最初に入力された仕訳情報を変更後の仕訳情報に更新して(ステップS1224)、認識結果データベース265に認識結果データと対応付けて格納する(ステップS1225)。ステップS1224の処理の詳細は後述する。
【0152】
また、本実施形態では、帳票認識部290は、ステップS1220で端末装置400に表示された確認画面において、新たな仕訳判別ワードと仕訳情報とが追加されると、仕訳判別データベース260を更新する(ステップS1226)。ステップS1226の処理の詳細は後述する。
【0153】
次に、図13を参照して、図12のステップS1217における帳票認識処理部230の処理について説明する。図13は、確認画面を表示する処理を説明するフローチャートである。
【0154】
本実施形態の帳票認識処理部230は、図12のステップS1212で端末装置400に表示された帳票の一覧から、ステータスが「未処理」の帳票(請求書)の選択を受け付ける(ステップS1301)。
【0155】
続いて、帳票認識処理部230は、仕訳情報取得部287により、仕訳判別ワードとなる文字列が抽出されているか否かを判定する(ステップS1302)。具体的には、仕訳情報取得部287は、選択された帳票の帳票IDと対応する請求元の属性が抽出されているか否かを判定する。
【0156】
ステップS1302において、仕訳判別ワードが抽出されていない場合、表示制御部288は、仕訳情報が入力されていない確認画面の画面データを生成し(ステップS1303)、処理を終了する。
【0157】
ステップS1303において、仕訳判別ワードが抽出されている場合、帳票認識処理部230は、仕訳情報取得部287により、仕訳判別データベース260を参照し、選択された帳票の明細情報に含まれる商品名を含む仕訳情報が存在するか否かを判定する(ステップS1304)。
【0158】
ステップS1304において、該当する仕訳情報が存在しない場合、帳票認識処理部230は、ステップS1303に進む。
【0159】
ステップS1304において、該当する仕訳情報が存在する場合、帳票認識処理部230は、仕訳情報取得部287により、該当する仕訳情報を取得する(ステップS1305)。続いて、帳票認識処理部230は、表示制御部288により、取得した仕訳情報が入力された確認画面の画面データを生成し(ステップS1306)、処理を終了する。
【0160】
尚、本実施形態では、図13に示す処理は、帳票の一覧において、未処理状態の帳票が選択された場合に、実行されるものとしたが、図13に示す処理を実行するタイミングは、これに限定されない。
【0161】
図13に示す処理は、例えば、図9のステップS913における帳票認識処理の一部として実行されてもよい。
【0162】
次に、図14を参照して、仕訳情報の更新について説明する。図14は、仕訳判別情報を更新する処理を説明するフローチャートである。図14の処理は、図12のステップS1225、ステップS1226の処理の詳細を示している。
【0163】
尚、図14のステップS1401からステップS1404の処理は、確認画面に表示された仕訳判別ワードの変更を受け付けた場合の処理を示し、ステップS1405からステップS1407の処理は、新たに仕訳判別ワードが追加された場合の処理を示す。
【0164】
本実施形態の帳票認識処理部230は、端末装置400において、過去の仕訳判別ワードの表示指示を受け付けたか否かを判定する(ステップS1401)。ステップS1401において、該当する表示指示を受け付けない場合、帳票認識処理部230は、後述するステップS1405へ進む。
【0165】
ステップS1401において、該当する表示指示を受け付けた場合、帳票認識処理部230は、表示制御部288により、仕訳判別データベース260に格納された仕訳判別ワードの一覧を表示させる(ステップS1402)。ここで表示される一覧は、ステップS1213で選択された請求書の発行元を示すテナントIDと対応付けられた仕訳判別ワードの一覧である。
【0166】
続いて、帳票認識処理部230は、一覧から仕訳判別ワードの選択を受け付けたか否かを判定する(ステップS1403)。ステップS1403において、選択を受け付けない場合、帳票認識処理部230は、選択を受け付けるまで待機する。
【0167】
ステップS1403において、仕訳判別ワードの選択を受け付けると、帳票認識処理部230は、仕訳情報取得部287により、選択された仕訳判別ワードと対応する仕訳情報を取得し、確認画面に表示されている仕訳情報を、取得した仕訳情報に変更し(ステップS1404)、処理を終了する。
【0168】
ステップS1401において、該当する表示指示を受け付けない場合、帳票認識処理部230は、端末装置400より、仕訳判別ワードと仕訳情報の入力を受け付ける(ステップS1405)。
【0169】
続いて、帳票認識処理部230は、仕訳判別ワードと仕訳情報とを対応付ける操作を受け付けたか否かを判定する(ステップS1406)。ステップS1406において、該当する操作を受け付けない場合、帳票認識処理部230は、操作を受け付けるまで待機する。
【0170】
ステップS1406において、該当する操作を受け付けた場合、帳票認識処理部230は、情報更新部292により、仕訳判別ワードと仕訳情報とを対応付けた仕訳判別情報とし、仕訳判別データベース260に格納し(ステップS1407)、処理を終了する。
【0171】
次に、図15を参照して、本実施形態の表示例について説明する。図15は、端末装置の表示例を示す図である。
【0172】
図15に示す画面151は、図12のステップS1220において、端末装置400に表示される確認画面の一例である。
【0173】
画面151は、表示欄152、153、入力欄154、表示欄157、操作部品155、156、を含む。
【0174】
表示欄152には、帳票画像データが示す帳票画像が表示される。図15の例では、帳票が請求書であり、帳票画像に請求元の会社名と支店名を示す領域152aと明細の内容を示す領域152bと、が含まれる。
【0175】
表示欄153は、表示欄152に表示された帳票画像を示す帳票画像データに対して帳票認識部290による帳票認識を行った結果の認識結果データが表示される。具体的には、表示欄153には、表示欄152に表示された帳票画像を示す帳票画像データから抽出された請求書情報と明細情報とが表示される。
【0176】
入力欄154は、表示欄152に表示された帳票画像(請求書画像)に対する仕訳を入力するための入力欄が表示される。
【0177】
表示欄157は、ジョブリスト91の項目「ステータス」の値が表示される。
【0178】
操作部品155は、ジョブリスト91のステータスの値を、未処理状態から下書き保存状態とするための操作部品である。表示欄175に「未処理」と表示された状態において、操作部品155が操作されると、表示欄157の表示は、「未処理」から「下書き保存」に変化する。
【0179】
操作部品156は、ジョブリスト91のステータスの値を、確定済み状態とするための操作部品である。本実施形態では、操作部品156が操作されると、ジョブリスト91のステータスの値を、確定済み状態とする。尚、本実施形態において、ステータスが確定済み状態とされた認識結果データは、出力部293により、基幹システム500と対応する形式のデータに変換することができる。
【0180】
以下に、表示欄153について説明する。表示欄153は、入力欄153a、操作部品153b、入力欄153c、操作部品153d、153e、153fを含む。
【0181】
入力欄153aは、領域152aから抽出された仕訳判別ワードが入力される。言い換えれば、入力欄153aには、請求元の属性を示す文字列が入力された状態で表示される。
【0182】
図15の例では、領域152aから請求元「○○××家具センター株式会社」と支店名「A支店」が抽出されて、抽出結果データベース255に格納されているものとして説明する。また、図15の例では、領域152bから、商品名と単価と金額とが抽出されて、抽出結果データベース255に格納されている。
【0183】
この場合、帳票認識処理部230は、画面151を表示させる際に、領域152aから抽出された請求元のテナントIDを特定し、テナントIDと対応する仕訳判別データベース260を参照する。そして、仕訳情報取得部287は、表示欄152に画像データが表示されている帳票を特定するための帳票IDと、仕訳判別ワードが「A支店」と、商品名「ネジ」とを含む仕訳判別情報が、参照した仕訳判別データベース260に存在するか否かを判定する。
【0184】
ここでは、テナントIDを「101」とし、帳票IDを「1111」とした。したがって、仕訳情報取得部287は、テナントID「101」の仕訳判別データベース260を参照し、仕訳判別ワード「A支店」と、商品名「ネジ」を含む明細内容を特定する明細ID「1111-M1」とを含む仕訳判別情報を特定する(図5参照)。
【0185】
この場合、テナントID「101」の仕訳判別データベース260には、仕訳判別ワード「A支店」と、明細ID「1111-M1」と含む仕訳判別情報が存在する(図6参照)。したがって、仕訳情報取得部287は、この仕訳判別情報に含まれる仕訳情報を取得し、入力欄154に入力した状態で、画面151を表示させる。
本実施形態では、このように、認識結果データの確認画面を表示する際に、帳票の発行元の属性を示す文字列と対応付けられた仕訳情報が入力された状態で、表示させることができる。
【0186】
また、本実施形態では、例えば、操作部品153bが選択されると、入力欄153aに、テナントID「101」の仕訳判別データベース260に格納されている仕訳判別情報に含まれる全ての仕訳判別ワードの一覧を表示させてもよい。そして、本実施形態では、一覧から仕訳判別ワードが選択されると、選択された仕訳判別ワードを入力欄153aに入力してもよい。
【0187】
そして、その後に、操作部品153fが操作されると、帳票認識処理部230は、一覧から選択された仕訳判別ワードと対応する仕訳情報を取得し、入力欄154に入力されていた仕訳情報を、選択された仕訳判別ワードと対応する仕訳情報に変更してもよい。
【0188】
このようにすれば、例えば、仕訳判別ワードが正しく抽出されなかった場合であっても、過去の仕訳判別ワードを選択することで、過去の仕訳情報を自動で入力することができ、仕訳情報の修正の手間を軽減できる。
【0189】
また、本実施形態では、例えば、仕訳判別データベース260に、仕訳判別ワード「A支店」と、明細ID「1111-M1」と含む仕訳判別情報が存在しなかった場合に、端末装置400に入力された明細の内容と仕訳情報とを対応付けることができる。
【0190】
具体的には、例えば、画面151において、表示欄152の領域152bにおいて、商品名「ネジ」が選択されたとする。
【0191】
この場合、表示制御部288は、抽出結果データベース255を参照して、商品名「ネジ」と対応する明細の内容を特定し、入力欄153cに入力してもよい。そして、入力欄154に、商品名「ネジ」と対応する仕訳情報が入力されて、操作部品153dが選択されると、入力欄153cに入力された明細の内容と、入力欄154に入力された仕訳情報とを対応付ける。このとき、本実施形態では、入力欄153cに入力された明細の内容と、入力欄154に入力された仕訳情報とに、仕訳IDを付与し、明細の内容を特定する明細IDと、テナントIDと、仕訳判別ワードとをさらに対応付けた仕訳判別情報として、仕訳判別データベース260に格納する。
【0192】
このように、本実施形態では、新たに明細の内容に対して仕訳が行われた場合には、明細の内容と仕訳情報とを対応付けて、仕訳判別データベース260を更新することができる。
【0193】
また、本実施形態では、操作部品153eを操作することで、新たな入力欄153cと操作部品153dと、入力欄154とを表示させることができる。新たな入力欄153cとは、空欄の入力欄153cである。したがって、本実施形態では、新たに明細の内容と仕訳情報とを対応付けた仕訳判別情報を作成することができる。
【0194】
このように、本実施形態では、帳票認識の結果を確認するための確認画面を、帳票の発行元の属性を示す文字列と対応付けられた仕訳情報が入力された状態で表示させることができる。
【0195】
また、本実施形態では、発行元が同一の帳票であっても、例えば、実際に帳票を発行した部署や支店といった発行元の属性毎に、過去の仕訳情報を管理し、発行元の属性と対応する仕訳情報を確認画面に入力する。
【0196】
したがって、本実施形態では、発行元であっても、支店によって仕訳が異なる場合等に、仕訳が適切であるか否かの確認を容易にさせることがでる。
【0197】
以上のように、本実施形態では、仕訳情報の入力作業や確認作業を軽減することができる。
【0198】
上記で説明した実施形態の各機能は、一又は複数の処理回路によって実現することが可能である。ここで、本明細書における「処理回路」とは、電子回路により実装されるプロセッサのようにソフトウェアによって各機能を実行するようプログラミングされたプロセッサや、上記で説明した各機能を実行するよう設計されたASIC(Application Specific Integrated Circuit)、DSP(digital signal processor)、FPGA(field programmable gate array)や従来の回路モジュール等のデバイスを含むものとする。
【0199】
また、実施形態に記載された装置群は、本明細書に開示された実施形態を実施するための複数のコンピューティング環境のうちの1つを示すものにすぎない。
【0200】
ある実施形態では、サーバ装置200は、サーバクラスタといった複数のコンピューティングデバイスを含む。複数のコンピューティングデバイスは、ネットワークや共有メモリなどを含む任意のタイプの通信リンクを介して互いに通信するように構成されており、本明細書に開示された処理を実施する。同様に、サーバ装置200は、互いに通信するように構成された複数のコンピューティングデバイスを含むことができる。
【0201】
さらに、サーバ装置200は、開示された処理ステップを様々な組み合わせで共有するように構成できる。例えば、サーバ装置200によって実行されるプロセスは、他のサーバ装置によって実行され得る。同様に、サーバ装置200の機能は、他のサーバ装置によって実行することができる。また、サーバ装置と他のサーバ装置の各要素は、1つのサーバ装置にまとめられていても良いし、複数の装置に分けられていても良い。
【0202】
また、明細書中の対応テーブルは、機械学習の学習効果によって生成されたものでもよい。また、取引内容の記載に含まれうる文字列と勘定科目とを機械学習にて分類付けすることで、対応テーブルを使用しなくてもよい。
【0203】
ここで、機械学習とは、コンピュータに人のような学習能力を獲得させるための技術であり、コンピュータが、データ識別等の判断に必要なアルゴリズムを、事前に取り込まれる学習データから自律的に生成し,新たなデータについてこれを適用して予測を行う技術のことをいう。機械学習のための学習方法は、教師あり学習、教師なし学習、半教師学習、強化学習、深層学習のいずれかの方法でもよく、さらに、これらの学習方法を組み合わせた学習方法でもよく、機械学習のための学習方法は問わない。
【0204】
以上、各実施形態に基づき本発明の説明を行ってきたが、上記実施形態に示した要件に本発明が限定されるものではない。これらの点に関しては、本発明の主旨をそこなわない範囲で変更することができ、その応用形態に応じて適切に定めることができる。
【符号の説明】
【0205】
100 帳票認識システム
200 サーバ装置
220 記憶部
230 帳票認識処理部
240 画像データベース
245 テナントデータベース
250 抽出定義データベース
255 抽出結果データベース
260 仕訳判別データベース
265 認識結果データベース
281 画像データ格納部
282 ジョブリスト生成部
283 画像データ取得部
284 文字認識部
285 抽出結果管理部
286 検索部
287 仕訳情報取得部
288 表示制御部
290 認識処理部
291 認識結果生成部
292 情報更新部
293 出力部
300 画像形成装置
400 端末装置
【先行技術文献】
【特許文献】
【0206】
【特許文献1】特開2021-60801号公報
図1
図2A
図2B
図3
図4
図5
図6
図7A
図7B
図8
図9
図10
図11
図12
図13
図14
図15