(19)【発行国】日本国特許庁(JP)
(12)【公報種別】公開特許公報(A)
(11)【公開番号】P2024121162
(43)【公開日】2024-09-06
(54)【発明の名称】情報処理装置、情報処理方法及びプログラム
(51)【国際特許分類】
G06V 30/418 20220101AFI20240830BHJP
G06V 30/412 20220101ALI20240830BHJP
G06V 30/262 20220101ALI20240830BHJP
【FI】
G06V30/418
G06V30/412
G06V30/262
【審査請求】未請求
【請求項の数】9
【出願形態】OL
(21)【出願番号】P 2023028114
(22)【出願日】2023-02-27
(71)【出願人】
【識別番号】000116079
【氏名又は名称】ローレルバンクマシン株式会社
(71)【出願人】
【識別番号】500267170
【氏名又は名称】ローレル機械株式会社
(71)【出願人】
【識別番号】500265501
【氏名又は名称】ローレル精機株式会社
(74)【代理人】
【識別番号】110003177
【氏名又は名称】弁理士法人旺知国際特許事務所
(72)【発明者】
【氏名】三村 完
(72)【発明者】
【氏名】大原 和彦
(72)【発明者】
【氏名】寺田 俊行
(72)【発明者】
【氏名】千葉 宏樹
【テーマコード(参考)】
5B029
5B064
5L096
【Fターム(参考)】
5B029AA01
5B029BB02
5B029BB17
5B064AA01
5B064AB02
5B064BA01
5B064DA27
5B064DA32
5B064EA18
5B064EA27
5L096BA08
5L096BA18
5L096CA02
5L096DA02
5L096EA12
5L096EA37
5L096JA04
5L096JA16
(57)【要約】
【課題】複数の媒体の比較精度を高める。
【解決手段】情報処理装置10は、レシートRECの画像を示す画像情報PINFを取得する画像情報取得部122と、画像情報PINFにより示される画像に含まれる複数の文字を示す文字情報CINFを生成する文字認識部123と、画像情報PINFと文字情報CINFとを互いに対応付けて記憶装置140に記憶する記憶制御部124と、文字情報CINFにより示される複数の文字を、記憶装置140に記憶された他の文字情報CINFにより示される複数の文字と比較する文字比較を実行する文字比較部126と、他の文字情報CINFの少なくとも1つが文字比較の結果に関する所定条件を満たす特定の文字情報CINFである場合に、画像情報PINFにより示される画像を、特定の文字情報CINFに対応付けられた特定の画像情報PINFにより示される画像と比較する画像比較を実行する画像比較部127とを備える。
【選択図】
図1
【特許請求の範囲】
【請求項1】
媒体に記載された複数の文字を含む画像を示す画像情報を取得する取得部と、
前記画像情報により示される画像に含まれる複数の文字を認識し、認識した複数の文字を示す文字情報を生成する認識部と、
前記画像情報と前記文字情報とを互いに対応付けて記憶装置に記憶する記憶制御部と、
前記文字情報により示される複数の文字を、前記記憶装置に記憶された他の文字情報により示される複数の文字と比較する文字比較を実行する文字比較部と、
前記他の文字情報の少なくとも1つが、前記文字比較の結果に関する所定条件を満たす特定文字情報である場合に、前記画像情報により示される画像を、前記記憶装置に記憶された他の画像情報のうち、前記特定文字情報に対応付けられた特定画像情報により示される画像と比較する画像比較を実行する画像比較部と、
を備えている情報処理装置。
【請求項2】
前記所定条件は、
前記文字情報により示される複数の文字と前記他の文字情報により示される複数の文字との類似度である文字類似度が第1類似度以上であることであり、
前記画像比較部は、
前記画像比較として、前記画像情報により示される画像と前記特定画像情報により示される画像との類似度である画像類似度が、第2類似度以上であるか否かを判定する処理を実行する、
請求項1に記載の情報処理装置。
【請求項3】
前記特定画像情報の少なくとも1つが、前記画像情報により示される画像との前記画像類似度が前記第2類似度以上である画像を示す類似画像情報である場合に、前記類似画像情報が前記記憶装置に記憶されていることを示す比較結果情報を出力する出力制御部をさらに備える、
請求項2に記載の情報処理装置。
【請求項4】
前記比較結果情報は、
前記文字情報により示される複数の文字と前記類似画像情報に対応付けられた特定文字情報により示される複数の文字との前記文字類似度を示す文字類似度情報、及び、前記画像情報により示される画像と前記類似画像情報により示される画像との前記画像類似度を示す画像類似度情報を含む、
請求項3に記載の情報処理装置。
【請求項5】
前記記憶制御部は、
前記画像情報を識別する画像識別情報を前記画像情報に対応付けて前記記憶装置に記憶し、
前記比較結果情報は、
前記画像情報を示す前記画像識別情報、及び、前記類似画像情報を示す他の画像識別情報をさらに含む、
請求項4に記載の情報処理装置。
【請求項6】
前記文字情報により示される複数の文字を単語毎に区分けし、区分けした単語を複数の項目のいずれかに対応付けることにより、前記文字情報により示される複数の文字を構造化する構造化部をさらに備え、
前記文字比較部により比較される前記文字情報及び前記他の文字情報の各々により示される複数の文字は、前記構造化部により構造化されている、
請求項1から5のいずれか1項に記載の情報処理装置。
【請求項7】
前記構造化部は、
前記媒体における文字の記載位置に基づいて、前記文字情報により示される複数の文字を複数の文字列に区分けすることにより、前記文字情報により示される複数の文字を単語毎に区分けする、
請求項6に記載の情報処理装置。
【請求項8】
媒体に記載された複数の文字を含む画像を示す画像情報を取得し、
前記画像情報により示される画像に含まれる複数の文字を認識し、認識した複数の文字を示す文字情報を生成し、
前記画像情報と前記文字情報とを互いに対応付けて記憶装置に記憶し、
前記文字情報により示される複数の文字を、前記記憶装置に記憶された他の文字情報により示される複数の文字と比較する文字比較を実行し、
前記他の文字情報の少なくとも1つが、前記文字比較の結果に関する所定条件を満たす特定文字情報である場合に、前記画像情報により示される画像を、前記記憶装置に記憶された他の画像情報のうち、前記特定文字情報に対応付けられた特定画像情報により示される画像と比較する画像比較を実行する、
情報処理方法。
【請求項9】
プロセッサを、
媒体に記載された複数の文字を含む画像を示す画像情報を取得する取得部と、
前記画像情報により示される画像に含まれる複数の文字を認識し、認識した複数の文字を示す文字情報を生成する認識部と、
前記画像情報と前記文字情報とを互いに対応付けて記憶装置に記憶する記憶制御部と、
前記文字情報により示される複数の文字を、前記記憶装置に記憶された他の文字情報により示される複数の文字と比較する文字比較を実行する文字比較部と、
前記他の文字情報の少なくとも1つが、前記文字比較の結果に関する所定条件を満たす特定文字情報である場合に、前記画像情報により示される画像を、前記記憶装置に記憶された他の画像情報のうち、前記特定文字情報に対応付けられた特定画像情報により示される画像と比較する画像比較を実行する画像比較部と、
として機能させる、
プログラム。
【発明の詳細な説明】
【技術分野】
【0001】
本発明は、情報処理装置、情報処理方法及びプログラムに関する。
【背景技術】
【0002】
画像に含まれる文字を認識する文字認識処理に関する技術は、様々な分野で利用されている。例えば、キャッシュレジスターから発行されたレシートを利用してキャンペーンの応募を受け付けるキャンペーン応募システムにおいて、同一のレシートによる二重応募を防ぐために、文字認識処理に関する技術が利用される(例えば、特許文献1参照)。この種のキャンペーン応募システムでは、例えば、新たに応募するために撮影されたレシートのレシート画像データに含まれるレシート表示項目と既に応募されたレシート画像データに含まれるレシート表示項目とを比較することで、二重応募のチェックを行う。
【先行技術文献】
【特許文献】
【0003】
【発明の概要】
【発明が解決しようとする課題】
【0004】
ところで、文字認識処理において、誤認識の発生を完全に防止することは難しい。このため、例えば、従来のキャンペーン応募システムでは、レシート画像データからレシート表示項目を抽出する際に、レシート表示項目が誤認識される場合がある。この場合、新たに応募されるレシート画像データに含まれるレシート表示項目と既に応募されたレシート画像データに含まれるレシート表示項目との比較精度が低下する。このため、複数のレシートの比較結果を利用するシステムでは、複数のレシートの比較精度を高めることが求められている。なお、上述の説明では、キャンペーン応募システムを例示したが、キャンペーン応募システム以外のシステム(例えば、撮影されたレシートの画像を利用して家計簿を作成するシステム)に文字認識処理が利用される場合においても、上述の課題と同様の課題がある。さらに、レシートを用いるシステムに限定されず、例えば、書類を電子データ化して登録するシステムにおいても、重複登録等を防止する必要があるため、上述の課題と同様の課題がある。すなわち、複数の文字が記載された複数の媒体の比較精度を高めることが求められている。
【課題を解決するための手段】
【0005】
本発明の好適な態様に係る情報処理装置は、媒体に記載された複数の文字を含む画像を示す画像情報を取得する取得部と、前記画像情報により示される画像に含まれる複数の文字を認識し、認識した複数の文字を示す文字情報を生成する認識部と、前記画像情報と前記文字情報とを互いに対応付けて記憶装置に記憶する記憶制御部と、前記文字情報により示される複数の文字を、前記記憶装置に記憶された他の文字情報により示される複数の文字と比較する文字比較を実行する文字比較部と、前記他の文字情報の少なくとも1つが、前記文字比較の結果に関する所定条件を満たす特定文字情報である場合に、前記画像情報により示される画像を、前記記憶装置に記憶された他の画像情報のうち、前記特定文字情報に対応付けられた特定画像情報により示される画像と比較する画像比較を実行する画像比較部と、を備えている。
【0006】
また、本発明の好適な態様に係る情報処理方法は、媒体に記載された複数の文字を含む画像を示す画像情報を取得し、前記画像情報により示される画像に含まれる複数の文字を認識し、認識した複数の文字を示す文字情報を生成し、前記画像情報と前記文字情報とを互いに対応付けて記憶装置に記憶し、前記文字情報により示される複数の文字を、前記記憶装置に記憶された他の文字情報により示される複数の文字と比較する文字比較を実行し、前記他の文字情報の少なくとも1つが、前記文字比較の結果に関する所定条件を満たす特定文字情報である場合に、前記画像情報により示される画像を、前記記憶装置に記憶された他の画像情報のうち、前記特定文字情報に対応付けられた特定画像情報により示される画像と比較する画像比較を実行する。
【0007】
また、本発明の好適な態様に係るプログラムは、プロセッサを、媒体に記載された複数の文字を含む画像を示す画像情報を取得する取得部と、前記画像情報により示される画像に含まれる複数の文字を認識し、認識した複数の文字を示す文字情報を生成する認識部と、前記画像情報と前記文字情報とを互いに対応付けて記憶装置に記憶する記憶制御部と、前記文字情報により示される複数の文字を、前記記憶装置に記憶された他の文字情報により示される複数の文字と比較する文字比較を実行する文字比較部と、前記他の文字情報の少なくとも1つが、前記文字比較の結果に関する所定条件を満たす特定文字情報である場合に、前記画像情報により示される画像を、前記記憶装置に記憶された他の画像情報のうち、前記特定文字情報に対応付けられた特定画像情報により示される画像と比較する画像比較を実行する画像比較部と、として機能させる。
【発明の効果】
【0008】
本発明によれば、複数の文字が記載された複数の媒体の比較精度を高めることが可能となる。
【図面の簡単な説明】
【0009】
【
図1】第1実施形態に係る情報処理システムの概要を説明するための説明図である。
【
図2】第1実施形態に係るレシート比較処理の一例を説明するための説明図である。
【
図3】対比例に係るレシート比較処理の一例を説明するための説明図である。
【
図4】
図1に示した情報処理装置の動作の一例を示すフローチャートである。
【
図5】第2実施形態に係る情報処理システムの概要を説明するための説明図である。
【
図6】返却情報の一例を説明するための説明図である。
【
図7】
図5に示した情報処理装置の動作の一例を示すフローチャートである。
【発明を実施するための形態】
【0010】
以下、本発明を実施するための形態について図面を参照して説明する。なお、各図において、各部の寸法及び縮尺は、実際のものと適宜に異ならせてある。また、以下に述べる実施の形態は、本発明の好適な具体例であるから、技術的に好ましい種々の限定が付されているが、本発明の範囲は、以下の説明において特に本発明を限定する旨の記載がない限り、これらの形態に限られるものではない。
【0011】
[1.第1実施形態]
先ず、
図1を参照しながら、第1実施形態に係る情報処理システム1の概要の一例について説明する。
【0012】
図1は、第1実施形態に係る情報処理システム1の概要を説明するための説明図である。
【0013】
本実施形態では、情報処理システム1が、キャッシュレジスターから発行されたレシートRECを利用してキャンペーンの応募を受け付けるキャンペーン応募システムである場合を想定する。レシートRECは、「媒体」の一例である。情報処理システム1は、例えば、情報処理装置10、サービスサーバ20及び端末装置30を有する。
図1に示す例では、情報処理装置10、サービスサーバ20及び端末装置30の各々は、ネットワークNWに接続されている。ネットワークNWは、インターネット及びローカルエリアネットワークを含み得る。例えば、ネットワークNWは、有線ネットワーク及び無線ネットワークの一方又は両方を含む。また、情報処理装置10等を含む複数の要素とネットワークNWとの接続は、例えば、複数の要素間を互いに通信可能にする接続であればよく、有線及び無線の一方を用いた接続であってもよいし、有線及び無線の両方を用いた接続であってもよい。
【0014】
例えば、情報処理装置10及びサービスサーバ20は、ネットワークNWを介して、互いに通信可能に接続されている。同様に、サービスサーバ20及び端末装置30は、ネットワークNWを介して、互いに通信可能に接続されている。なお、情報処理装置10は、ネットワークNWの代わりに専用回線を介して、サービスサーバ20と通信可能に接続されてもよい。また、本実施形態では、端末装置30は、情報処理装置10との接続が許可されていない場合を想定するが、端末装置30は、ネットワークNWを介して、情報処理装置10と通信可能に接続されてもよい。
【0015】
以下では、特に断りがない限り、ネットワークNWに接続された複数の要素間の通信(情報の送信及び受信等)は、複数の要素間のネットワークNWを介する通信を意味する。例えば、端末装置30がサービスサーバ20に情報を送信することは、特に断りがない限り、端末装置30がネットワークNWを介してサービスサーバ20に情報を送信することを意味する。
【0016】
端末装置30としては、ネットワークNWに接続可能な任意の情報処理装置を採用することができる。具体的には、端末装置30は、例えば、パーソナルコンピュータ等の据置型の情報機器であってもよいし、ノート型のパーソナルコンピュータ、タブレット端末及びスマートフォン等の可搬型の情報端末であってもよい。本実施形態では、端末装置30がスマートフォンである場合を想定する。
【0017】
端末装置30は、例えば、キャンペーンの応募に必要なレシートRECに記載された複数の文字を含む画像を示す画像情報PINFをサービスサーバ20に送信する。レシートRECに記載された複数の文字を含む画像は、例えば、カメラがレシートRECを撮影することにより得られるレシートRECの画像である。なお、レシートRECに記載された複数の文字を含む画像は、カメラにより撮影されたレシートRECの画像に限定されない。例えば、レシートRECに記載された複数の文字を含む画像は、イメージスキャナがレシートRECを読み取ることにより得られるレシートRECの画像であってもよい。以下では、レシートRECに記載された複数の文字を含む画像は、単に、レシートRECの画像とも称される。
【0018】
例えば、端末装置30は、端末装置30が有するカメラにより撮影されたレシートRECの画像を示す画像情報PINFをサービスサーバ20に送信する。なお、端末装置30からサービスサーバ20に送信される画像情報PINFは、端末装置30の外部の装置(例えば、カメラ及びイメージスキャナ等の光学的な装置)により生成された画像情報であってもよい。この場合、端末装置30は、外部の装置により生成された画像情報PINFを取得し、取得した画像情報PINFをサービスサーバ20に送信する。以下では、キャンペーンの応募に使用されたレシートRECを、画像情報PINFにより示されるレシートRECと称する場合がある。
【0019】
サービスサーバ20としては、ネットワークNWに接続可能な任意の情報処理装置を採用することができる。サービスサーバ20は、例えば、端末装置30から受信した画像情報PINFにより示されるレシートRECでのキャンペーンの応募を受け付ける。なお、本実施形態では、サービスサーバ20は、既に受け付けたレシートRECと同一のレシートRECによる二重応募を防ぐために、二重応募チェックを実行する。
【0020】
例えば、二重応募チェックでは、サービスサーバ20は、端末装置30から受信した画像情報PINF(今回受け付けたレシートRECの画像を示す画像情報PINF)を情報処理装置10に送信する。詳細は後述するが、画像情報PINFを受信した情報処理装置10は、サービスサーバ20により今回受け付けされたレシートRECと、既に受け付けされた他のレシートRECとを比較するレシート比較処理を実行する。そして、レシート比較処理の結果を示す返却情報RINFが情報処理装置10からサービスサーバ20に送信される。
【0021】
サービスサーバ20は、例えば、今回受け付けたレシートRECでのキャンペーンの応募(以下、今回の応募とも称する)が二重応募であるか否かを返却情報RINFに基づいて判定する。例えば、サービスサーバ20は、既に受け付けたレシートRECの少なくとも1つの画像が今回受け付けたレシートRECの画像と類似することを返却情報RINFが示す場合、今回の応募が二重応募であると判定する。そして、例えば、サービスサーバ20は、今回の応募が二重応募であると判定した場合、今回の応募が二重応募であることを示す応答情報AINFを端末装置30に送信する。また、例えば、サービスサーバ20は、今回の応募が二重応募でないと判定した場合、キャンペーンの応募を正常に受け付けたことを示す応答情報AINFを端末装置30に送信する。
【0022】
情報処理装置10としては、ネットワークNWに接続可能な任意の情報処理装置を採用することができる。例えば、情報処理装置10は、光学文字認識(OCR:Optical character recognition)技術を用いて、画像に含まれる文字を認識する文字認識処理を実行する。本実施形態では、文字認識処理の対象となる画像がレシートRECの画像である場合を想定する。例えば、本実施形態では、情報処理装置10は、光学文字認識技術を用いて、レシートRECに記載された情報を電子データに変換する。
【0023】
情報処理装置10は、例えば、情報処理装置10の各部を制御する処理装置120と、各種情報を記憶する記憶装置140と、通信装置160とを有する。
【0024】
通信装置160は、有線ネットワーク及び無線ネットワークの一方又は両方を介して、情報処理装置10の外部に存在する外部装置との通信を行うためのハードウェアである。
【0025】
記憶装置140は、例えば、処理装置120の作業領域として機能するRAM(Random Access Memory)等の揮発性メモリと、制御プログラムPG1等の各種情報を記憶するEEPROM(Electrically Erasable Programmable Read-Only Memory)等の不揮発性メモリとの、一方又は両方を含む。なお、記憶装置140は、情報処理装置10に着脱可能であってもよい。具体的には、記憶装置140は、情報処理装置10に着脱されるメモリカード等の記憶媒体であってもよい。また、記憶装置140は、例えば、情報処理装置10とネットワークNW等を介して通信可能に接続された記憶装置(例えば、オンラインストレージ)であってもよい。
【0026】
処理装置120は、情報処理装置10の全体を制御するプロセッサであり、例えば、1又は複数のCPU(Central Processing Unit)を含んで構成される。例えば、処理装置120は、記憶装置140に記憶された制御プログラムPG1を実行することにより、画像情報取得部122、文字認識部123、記憶制御部124、文字比較部126、画像比較部127及び出力制御部128として機能する。なお、制御プログラムPG1は、ネットワークNWを介して他の装置から送信されてもよい。
【0027】
また、例えば、処理装置120が複数のCPUを含んで構成される場合、処理装置120の機能の一部又は全部は、これら複数のCPUが制御プログラムPG1等のプログラムに従って協働して動作することで実現されてもよい。また、処理装置120は、1又は複数のCPUに加え、又は、1又は複数のCPUのうち一部又は全部に代えて、GPU(Graphics Processing Unit)、DSP(Digital Signal Processor)、又は、FPGA(Field Programmable Gate Array)等のハードウェアを含んで構成されるものであってもよい。この場合、処理装置120の機能の一部又は全部は、DSP等のハードウェアにより実現されてもよい。
【0028】
このように、本実施形態では、制御プログラムPG1は、処理装置120を画像情報取得部122、文字認識部123、記憶制御部124、文字比較部126、画像比較部127及び出力制御部128として機能させるためのアプリケーションプログラムを含む。なお、制御プログラムPG1は、例えば、処理装置120が情報処理装置10の各部を制御するためのオペレーティングシステムプログラムを含んでもよい。制御プログラムPG1は、「プログラム」の一例である。また、画像情報取得部122は、「取得部」の一例であり、文字認識部123は、「認識部」の一例である。
【0029】
画像情報取得部122は、例えば、レシートRECの画像(レシートRECに記載された複数の文字を含む画像)を示す画像情報PINFを、通信装置160を介してサービスサーバ20から取得する。文字認識部123は、画像情報取得部122により取得された画像情報PINFにより示される画像に対して文字認識処理を実行することにより、画像情報PINFにより示される画像に含まれる複数の文字を認識する。そして、文字認識部123は、画像情報PINFにより示される画像に対する文字認識処理により認識した複数の文字を示す文字情報CINFを生成する。例えば、文字認識部123は、画像情報PINFにより示される画像を文字認識処理により文字コードに変換することにより、文字情報CINFを生成してもよい。記憶制御部124は、画像情報取得部122により取得された画像情報PINFと、文字認識部123により生成された文字情報CINFとを互いに対応付けて記憶装置140に記憶する。
【0030】
文字比較部126は、文字認識部123により生成された文字情報CINFにより示される複数の文字を、記憶装置140に記憶された他の文字情報CINFにより示される複数の文字と比較する文字比較を実行する。なお、他の文字情報CINFは、記憶制御部124により、他の画像情報PINFに関連付けて記憶装置140に記憶されている。すなわち、他の文字情報CINFと他の画像情報PINFとが互いに関連付けて記憶装置140に記憶されている。
【0031】
例えば、文字比較部126は、文字比較として、確認対象の文字情報CINFにより示される複数の文字と他の文字情報CINFにより示される複数の文字との類似度である文字類似度を算出する処理を実行する。確認対象の文字情報CINFと比較される他の文字情報CINFは、例えば、確認対象の文字情報CINFよりも先に記憶装置140に記憶された文字情報CINFである。本実施形態では、確認対象の文字情報CINFが、画像情報取得部122により取得された最新の画像情報PINFにより示される画像に対する文字認識処理により認識された複数の文字を示す最新の文字情報CINFである場合を想定する。
【0032】
以下では、確認対象の文字情報CINF(最新の文字情報CINF)と比較される他の文字情報CINFは、比較対象の文字情報CINFとも称される。また、以下では、一の文字情報CINF(例えば、確認対象の文字情報CINF)により示される複数の文字と他の文字情報CINFにより示される複数の文字との文字類似度は、一の文字情報CINFと他の文字情報CINFとの文字類似度とも称される。
【0033】
画像比較部127は、比較対象の文字情報CINFの少なくとも1つが文字比較の結果に関する所定条件を満たす特定の文字情報CINFである場合に、最新の画像情報PINFにより示される画像を特定の画像と比較する画像比較を実行する。画像比較に用いられる特定の画像は、比較対象の文字情報CINFに対応付けられた画像情報PINFのうち、特定の文字情報CINFに対応付けられた特定の画像情報PINFにより示される画像である。なお、比較対象の文字情報CINFに対応付けられた画像情報PINFは、「記憶装置に記憶された他の画像情報」の一例である。また、特定の文字情報CINFは、「特定文字情報」の一例であり、特定の画像情報PINFは、「特定画像情報」の一例である。
【0034】
本実施形態では、所定条件が、最新の文字情報CINFにより示される複数の文字と他の文字情報CINFにより示される複数の文字との文字類似度が第1類似度以上であることである場合を想定する。この場合、特定の文字情報CINFは、比較対象の文字情報CINFのうち、最新の文字情報CINFとの文字類似度が第1類似度以上である文字情報CINFである。
【0035】
また、本実施形態では、画像比較部127が、画像比較として、最新の画像情報PINFにより示される画像と特定の画像情報PINFにより示される画像との類似度である画像類似度が、第2類似度以上であるか否かを判定する処理を実行する場合を想定する。以下では、一の画像情報PINF(例えば、最新の画像情報PINF)により示される画像と他の画像情報PINF(例えば、特定の画像情報PINF)により示される画像との画像類似度は、一の画像情報PINFと他の画像情報PINFとの画像類似度とも称される。
【0036】
ここで、最新の画像情報PINFにより示されるレシートRECは、サービスサーバ20により今回受け付けされたレシートRECであり、記憶装置140に記憶された他の画像情報PINFにより示されるレシートRECは、既に受け付けされた他のレシートRECである。また、最新の文字情報CINFにより示される複数の文字は、サービスサーバ20により今回受け付けされたレシートRECの画像に対する文字認識処理により認識された複数の文字である。
【0037】
このように、サービスサーバ20により今回受け付けされたレシートRECと、既に受け付けされた他のレシートRECとを比較するレシート比較処理は、文字比較及び画像比較を含む。但し、本実施形態では、記憶装置140に記憶された全ての文字情報CINFが文字比較の結果に関する所定条件を満たさない場合、画像比較は、実行されない。
【0038】
また、本実施形態では、上述したように、文字比較の結果に関する所定条件を満たさない文字情報CINFに対応付けられた画像情報PINFに対しては、画像比較は実行されない。このため、本実施形態では、記憶装置140に記憶された全ての画像情報PINFに対して画像比較が実行される態様に比べて、レシート比較処理にかかる負荷を低減することができる。
【0039】
出力制御部128は、レシート比較処理の結果を示す返却情報RINFを、通信装置160を介してサービスサーバ20に出力する。返却情報RINFは、例えば、最新の画像情報PINFにより示される画像との画像類似度が第2類似度以上である画像を示す画像情報PINFが検出されたか否かを示す情報である。以下では、最新の画像情報PINFにより示される画像との画像類似度が第2類似度以上である画像を示す画像情報PINFは、重複候補の画像情報PINFとも称される。
【0040】
例えば、特定の画像情報PINFの少なくとも1つが重複候補の画像情報PINFである場合、画像比較により、重複候補の画像情報PINFが検出される。従って、出力制御部128は、例えば、特定の画像情報PINFの少なくとも1つが重複候補の画像情報PINFである場合に、重複候補の画像情報PINFが検出されたことを示す返却情報RINFを、通信装置160を介してサービスサーバ20に出力する。なお、重複候補の画像情報PINFが検出されることは、重複候補の画像情報PINFが記憶装置140に記憶されていることに該当する。従って、返却情報RINFが、重複候補の画像情報PINFが検出されたことを示す場合、当該返却情報RINFは、「比較結果情報」に該当する。また、重複候補の画像情報PINFは、「類似画像情報」の一例である。
【0041】
このように、返却情報RINFは、サービスサーバ20により既に受け付けされたレシートRECの少なくとも1つの画像が今回受け付けされたレシートRECの画像と類似するか否かを示す。なお、返却情報RINFは、サービスサーバ20により今回受け付けされたレシートRECの画像に対する文字認識処理により認識された複数の文字を示す文字情報CINFを含んでもよい。
【0042】
また、返却情報RINFは、文字類似度情報、及び、画像類似度情報の一方又は両方を含んでもよい。文字類似度情報は、例えば、最新の文字情報CINFにより示される複数の文字と重複候補の画像情報PINFに対応付けられた特定の文字情報CINFにより示される複数の文字との文字類似度を示す。画像類似度情報は、例えば、最新の画像情報PINFにより示される画像と重複候補の画像情報PINFにより示される画像との画像類似度を示す。
【0043】
なお、情報処理装置10の構成は、
図1に示した例に限定されない。例えば、情報処理装置10は、情報処理装置10の管理者等による操作を受け付ける操作装置を有してもよい。また、記憶制御部124は、画像情報PINFを識別する画像識別情報を画像情報PINFに対応付けて記憶装置140に記憶してもよい。この場合、返却情報RINFは、最新の画像情報PINFを示す画像識別情報、及び、重複候補の画像情報PINFを示す画像識別情報を含んでもよい。
【0044】
次に、
図2を参照しながら、レシート比較処理の概要について説明する。
【0045】
図2は、第1実施形態に係るレシート比較処理の一例を説明するための説明図である。
図2では、キャンペーンが開始されてから現時点までに、“m+1”個(mは、3以上の自然数)の画像情報PINFが画像情報取得部122により取得された場合を想定する。なお、
図2では、mが3以上の自然数である場合を想定しているが、mは、1以上の自然数であればよい。
【0046】
また、
図2では、“m+1”個の画像情報PINFを互いに区別するために、“m+1”個の画像情報PINFの各々の符号の末尾には、英数字(0、1、2、・・・、mのいずれか)が付されている。また、
図2では、“m+1”個の文字情報CINFを互いに区別するために、“m+1”個の文字情報CINFの各々の符号の末尾には、“m+1”個の画像情報PINFのうちの対応する画像情報PINFの符号の末尾に付された英数字と同じ英数字が付されている。
【0047】
なお、
図2では、画像情報取得部122が取得した“m+1”個の画像情報PINFのうちの最新の画像情報PINFが画像情報PINF0である場合を想定する。すなわち、画像情報PINF0により示されるレシートRECが、サービスサーバ20により今回受け付けされたレシートRECである。そして、画像情報PINF0以外のm個の画像情報PINF(PINF1、PINF2、・・・、PINFm)により示されるレシートRECが、既に受け付けされた他のレシートRECである。従って、
図2では、文字情報CINF0が確認対象の文字情報CINFに該当し、文字情報CINF0以外のm個の文字情報CINF(CINF1、CINF2、・・・、CINFm)が比較対象の文字情報CINFに該当する。また、
図2では、第1類似度TH1及び第2類似度TH2の各々が0.8である場合を想定する。
【0048】
先ず、文字比較部126は、文字比較として、文字情報CINF0により示される複数の文字と他のm個の文字情報CINF(CINF1、CINF2、・・・、CINFm)の各々により示される複数の文字との文字類似度を算出する処理を実行する。文字類似度の算出方法は、特に限定されない。例えば、文字類似度の算出方法として、2つの文章を比較する既知の類似度算出方法が採用され得る。2つの文章を比較する既知の類似度算出方法としては、例えば、N-gramを用いた類似度の算出、レーベンシュタイン距離に基づく類似度の算出、及び、コサイン類似度の算出等の類似度算出方法が挙げられる。なお、N-gramは、任意の文字列を、連続するN個(Nは、1以上の自然数)の表記単位(文字又は単語等)で分割する分割方法である。N-gramでは、分割対象の文字列は、最初の分割後、1表記単位ずつ移動して順次分割される。
【0049】
図2では、文字比較部126が、文字情報CINF1及びCINF2以外の“m-2”個の比較対象の文字情報CINFの各々と文字情報CINF0との文字類似度を、第1類似度TH1(0.8)未満の類似度と算出した場合を想定する。
図2に示す例では、文字情報CINF0と文字情報CINF1との文字類似度が0.95と算出され、文字情報CINF0と文字情報CINF2との文字類似度が0.8と算出され、文字情報CINF0と文字情報CINFmとの文字類似度が0.75と算出される。
【0050】
例えば、文字比較部126は、m個の比較対象の文字情報CINF(CINF1、CINF2、・・・、CINFm)のうち、文字情報CINF0との文字類似度が第1類似度TH1以上である文字情報CINF1及びCINF2を、特定の文字情報CINFとして特定する。図の白色の星印は、特定の文字情報CINFを示す。なお、特定の文字情報CINFの特定は、文字比較部126により算出された文字類似度に基づいて、画像比較部127により実行されてもよい。
【0051】
画像比較部127は、m個の比較対象の文字情報CINFのうちの少なくとも1つが特定の文字情報CINF(文字情報CINF1及びCINF2)であるため、最新の画像情報PINF0により示される画像を特定の画像と比較する画像比較を実行する。特定の画像は、特定の文字情報CINF1及びCINF2にそれぞれ対応付けられた特定の画像情報PINF1及びPINF2の各々により示される画像である。
【0052】
例えば、画像比較部127は、画像比較として、特定の画像情報PINF1及びPINF2によりそれぞれ示される2つの画像の各々について、最新の画像情報PINF0により示される画像との画像類似度が第2類似度TH2(0.8)以上であるか否かを判定する処理を実行する。
図2では、画像比較により、画像情報PINF0と画像情報PINF1との画像類似度が0.98と算出され、画像情報PINF0と画像情報PINF2との画像類似度が0.7と算出される場合を想定する。
【0053】
従って、
図2に示す例では、画像比較部127は、画像情報PINF0と画像情報PINF1との画像類似度が第2類似度TH2以上であると判定し、画像情報PINF0と画像情報PINF2との画像類似度が第2類似度TH2以上でないと判定する。そして、画像比較部127は、特定の画像情報PINF1及びPINF2のうち、画像情報PINF0との画像類似度が第2類似度TH2以上である画像情報PINF1を、重複候補の画像情報PINFとして特定する。図の黒色の星印は、重複候補の画像情報PINFを示す。なお、重複候補の画像情報PINFの特定は、画像比較部127により算出された画像類似度に基づいて、出力制御部128により実行されてもよい。
【0054】
このように、本実施形態では、文字比較の後に、画像比較が実行されることにより、最新の画像情報PINF0との画像類似度が第2類似度TH2以上である重複候補の画像情報PINFが検出される。なお、本実施形態では、最新の画像情報PINF0以外のm個の画像情報PINF(PINF1、PINF2、・・・、PINFm)のうち、特定の画像情報PINF(PINF1及びPINF2)に対してのみ画像比較が実行される。このため、本実施形態では、最新の画像情報PINF0以外のm個の画像情報PINFに対して画像比較が実行される態様に比べて、画像比較にかかる負荷を低減することができる。
【0055】
次に、
図3を参照しながら、本実施形態と対比される対比例に係るレシート比較処理の概要について説明する。
【0056】
図3は、対比例に係るレシート比較処理の一例を説明するための説明図である。第1対比例は、レシート比較処理として、文字比較及び画像比較のうちの文字比較のみが実行される態様である。また、第2対比例は、レシート比較処理として、文字比較及び画像比較のうちの画像比較のみが実行される態様である。
【0057】
第1対比例では、上述したように、画像比較が実行されない。従って、第1対比例では、今回受け付けされたレシートRECと類似するレシートRECの文字情報CINFの誤検出を抑制するために、第1類似度THz1を
図2に示した第1類似度TH1よりも高い値に設定することが考えられる。
図2に示す第1対比例では、第1類似度THz1は、0.9である。以下では、今回受け付けされたレシートRECと類似するレシートRECの文字情報CINFは、重複候補の文字情報CINFとも称される。
【0058】
例えば、第1対比例では、最新の文字情報CINF0との文字類似度(0.95)が第1類似度THz1(0.9)以上である文字情報CINF1が重複候補の文字情報CINFとして検出される。なお、文字情報CINF2は、最新の文字情報CINF0との文字類似度(0.8)が第1類似度THz1未満であるため、重複候補の文字情報CINFとして検出されない。このように、第1対比例では、第1類似度THz1を第1類似度TH1よりも高い値に設定することにより、文字情報CINF2が重複候補の文字情報CINFと誤検出されることを抑制している。
【0059】
但し、第1対比例では、レシートRECの画像に対する文字認識処理により認識された複数の文字に誤認識された文字が含まれる場合、レシートRECの比較精度が低下する。例えば、文字情報CINF0により示される複数の文字に誤認識された文字が含まれる場合、文字情報CINF0と文字情報CINF1との文字類似度として、第1類似度THz1未満の文字類似度が算出されるおそれがある。この場合、重複候補の文字情報CINFとして本来検出されるべき文字情報CINF1が、重複候補の文字情報CINFとして検出されない。あるいは、文字情報CINF0により示される複数の文字に誤認識された文字が含まれる場合、文字情報CINF0と文字情報CINF2との文字類似度として、第1類似度THz1以上の文字類似度が算出されるおそれがある。この場合、文字情報CINF2が重複候補の文字情報CINFとして誤検出される。
【0060】
これに対し、本実施形態では、
図2等において説明したように、文字比較の後に、文字比較により特定された特定の文字情報CINFに対応付けられた特定の画像情報PINFに対して画像比較が実行される。このため、本実施形態では、第1類似度TH1を第1類似度THz1よりも低い値に設定しても、今回受け付けされたレシートRECと類似するレシートRECが誤検出されることを抑制することができる。
【0061】
例えば、本実施形態では、文字情報CINFにより示される複数の文字に誤認識された文字が含まれる場合においても、特定の文字情報CINFとして本来特定されるべき文字情報CINFが特定されなくなることを抑制することができる。一例として、文字情報CINF0により示される複数の文字に誤認識された文字が含まれているために、文字情報CINF0と文字情報CINF1との文字類似度が0.8と算出された場合を想定する。この場合においても、本実施形態では、文字情報CINF0と文字情報CINF1との文字類似度が第1類似度TH1(0.8)以上であるため、文字情報CINF1は、特定の文字情報CINFとして特定される。なお、第1対比例では、上述の例の場合、文字情報CINF0と文字情報CINF1との文字類似度が第1類似度THz1(0.9)未満であるため、文字情報CINF1は、重複候補の文字情報CINFとして検出されない。
【0062】
また、別の例として、文字情報CINF0により示される複数の文字に誤認識された文字が含まれているために、文字情報CINF0と文字情報CINF2との文字類似度が0.96と算出された場合を想定する。この場合においても、本実施形態では、特定の文字情報CINF1及びCINF2にそれぞれ対応付けられた特定の画像情報PINF1及びPINF2に対して、画像比較が実行される。このため、本実施形態では、
図2において説明したように、重複候補の画像情報PINFとして画像情報PINF1が検出される。なお、第1対比例では、上述の例の場合、文字情報CINF0と文字情報CINF2との文字類似度が第1類似度THz1(0.9)以上であるため、文字情報CINF2が重複候補の文字情報CINFとして誤検出される。
【0063】
次に、第2対比例について説明する。
【0064】
図2に示す第2対比例では、第2類似度THz2は、0.8であり、
図2に示した第2類似度TH2と同じ値である。例えば、第2対比例では、最新の画像情報PINF0との画像類似度(0.98)が第2類似度THz2(0.8)以上である画像情報PINF1が重複候補の画像情報PINFとして検出される。このように、第2対比例では、
図2に示した例と同様に、画像情報PINF1が重複候補の画像情報PINFとして検出される。但し、第2対比例では、文字比較が行われないため、複数の画像情報PINFのうち、最新の画像情報PINF0以外の全ての画像情報PINFが、最新の画像情報PINF0と比較される。このため、第2対比例では、複数の画像情報PINFによりそれぞれ示される複数の画像の全てに対して、画像比較のための画像処理が実行される。従って、第2対比例では、本実施形態に比べて、画像比較にかかる負荷及び時間が増加する。一般的に、画像比較では、文字比較に比べて、処理の負荷等が大きくなる。このため、第2対比例では、本実施形態に比べて、レシート比較処理にかかる負荷及び時間が増加する。
【0065】
また、画像比較では、例えば、同一のレシートRECの撮影により得られた2つの画像を比較した場合においても、屋外での撮影及び屋内での撮影等の撮影条件の違い等により、2つの画像の画像類似度が第2類似度THz2未満と算出されるおそれがある。すなわち、画像比較では、撮影条件の違い等により、同一のレシートRECの2つの画像が互いに異なるレシートRECの画像と誤判定される場合がある。このため、画像比較では、撮影条件の違い等による誤判定を抑制するために、露出を補正する処理及び画像内の背景を除去する処理等の画像補正処理を、画像情報PINFにより示される画像に対して実行することが考えられる。画像比較において画像補正処理が実行される場合、画像補正処理が実行されない場合に比べて、画像比較にかかる負荷及び時間が増加する。
【0066】
なお、本実施形態では、
図2において説明したように、複数の画像情報PINFのうちの特定の画像情報PINF0のみが最新の画像情報PINF0と比較される。このため、本実施形態では、画像比較において画像補正処理が実行される場合においても、画像比較にかかる負荷及び時間が増加することを第2対比例に比べて抑制することができる。
【0067】
このように、本実施形態では、レシートRECの比較精度が低下することを抑制しつつ、レシート比較処理にかかる負荷及び時間が増加することを抑制することができる。
【0068】
次に、
図4を参照しながら、情報処理装置10の動作の概要について説明する。
【0069】
図4は、
図1に示した情報処理装置10の動作の一例を示すフローチャートである。
図4に示す動作は、レシート比較処理に該当する。例えば、
図4に示すレシート比較処理は、サービスサーバ20が情報処理装置10に画像情報PINFを送信する度に実行される。
【0070】
先ず、ステップS100において、処理装置120は、画像情報取得部122として機能し、レシートRECの画像を示す画像情報PINFをサービスサーバ20から取得する。以下では、ステップS100で取得された画像情報PINFは、最新の画像情報PINFとも称される。
【0071】
次に、ステップS200において、処理装置120は、文字認識部123として機能し、最新の画像情報PINFにより示される画像に含まれる複数の文字を認識する。例えば、文字認識部123は、最新の画像情報PINFにより示される画像に対して文字認識処理を実行することより、画像情報PINFにより示される画像に含まれる複数の文字を認識し、認識した複数の文字を示す文字情報CINFを生成する。以下では、ステップS200で認識された複数の文字を示す文字情報CINFは、最新の文字情報CINFとも称される。
【0072】
次に、ステップS220において、処理装置120は、記憶制御部124として機能し、ステップS200で認識された複数の文字を示す文字情報CINFとステップS100で取得された画像情報PINFとを互いに対応付けて記憶装置140に記憶する。
【0073】
そして、ステップS300において、処理装置120は、文字比較部126として機能し、比較対象の文字情報CINFが記憶装置140に記憶されているか否かを判定する。比較対象の文字情報CINFは、例えば、最新の文字情報CINFと比較される他の文字情報CINFである。
【0074】
ステップS300における判定の結果が肯定の場合、処理装置120は、処理をステップS400に進める。一方、ステップS300における判定の結果が否定の場合、処理装置120は、ステップS620において、重複候補の画像情報PINFが検出されなかったことを示す返却情報RINFをサービスサーバ20に出力し、レシート比較処理を終了する。なお、ステップS620では、処理装置120は、出力制御部128として機能する。
【0075】
ステップS400において、処理装置120は、文字比較部126として機能し、最新の文字情報CINFと比較対象の文字情報CINFとを比較する。例えば、文字比較部126は、最新の文字情報CINFにより示される複数の文字と比較対象の文字情報CINFにより示される複数の文字との文字類似度を算出する。
【0076】
次に、ステップS420において、処理装置120は、文字比較部126として機能し、最新の文字情報CINFと比較対象の文字情報CINFとの文字類似度が第1類似度TH1以上であるか否かを判定する。なお、比較対象の文字情報CINFが複数存在する場合、複数の比較対象の文字情報CINFの各々について、ステップS420の判定が行われる。
【0077】
ステップS420における判定の結果が肯定の場合、処理装置120は、処理をステップS500に進める。一方、ステップS420における判定の結果が否定の場合、処理装置120は、ステップS620の処理を実行し、レシート比較処理を終了する。なお、比較対象の文字情報CINFが複数存在する場合は、ステップS420における判定の結果は、以下に示すようになる。例えば、複数の比較対象の文字情報CINFのうちの少なくとも1つが、最新の文字情報CINFとの文字類似度が第1類似度TH1以上である場合、ステップS420における判定の結果は、肯定となる。すなわち、複数の比較対象の文字情報CINFのうちの全てが、最新の文字情報CINFとの文字類似度が第1類似度TH1未満である場合、ステップS420における判定の結果は、否定となる。
【0078】
ステップS500において、処理装置120は、画像比較部127として機能し、最新の画像情報PINFと特定の画像情報PINFとを比較する。なお、特定の画像情報PINFは、
図2等において説明したように、最新の文字情報CINFとの文字類似度が第1類似度TH1以上である特定の文字情報CINFに対応付けられた画像情報PINFである。例えば、画像比較部127は、最新の画像情報PINFにより示される画像と特定の画像情報PINFにより示される画像との画像類似度を算出する。
【0079】
そして、ステップS520において、処理装置120は、画像比較部127として機能し、最新の画像情報PINFと特定の画像情報PINFとの画像類似度が第2類似度TH2以上であるか否かを判定する。なお、特定の画像情報PINFが複数存在する場合、複数の特定の画像情報PINFの各々について、ステップS520の判定が行われる。
【0080】
ステップS520における判定の結果が肯定の場合、処理装置120は、処理をステップS600に進める。一方、ステップS520における判定の結果が否定の場合、処理装置120は、ステップS620の処理を実行し、レシート比較処理を終了する。なお、特定の画像情報PINFが複数存在する場合は、ステップS520における判定の結果は、以下に示すようになる。例えば、複数の特定の画像情報PINFのうちの少なくとも1つが、最新の画像情報PINFとの画像類似度が第2類似度TH2以上である場合、ステップS520における判定の結果は、肯定となる。すなわち、複数の特定の画像情報PINFのうちの全てが、最新の画像情報PINFとの画像類似度が第2類似度TH2未満である場合、ステップS520における判定の結果は、否定となる。
【0081】
ステップS600において、処理装置120は、出力制御部128として機能し、重複候補の画像情報PINFが検出されたことを示す返却情報RINFをサービスサーバ20に出力する。そして、処理装置120は、レシート比較処理を終了する。
【0082】
なお、情報処理装置10の動作は、
図4に示した例に限定されない。例えば、ステップS300の処理は、文字比較部126とは別の機能ブロック(例えば、記憶制御部124等)により実行されてもよい。また、例えば、ステップS420の処理は、文字比較部126とは別の機能ブロック(例えば、画像比較部127等)により実行されてもよい。また、例えば、ステップS520の処理は、画像比較部127とは別の機能ブロック(例えば、出力制御部128等)により実行されてもよい。
【0083】
以上、本実施形態では、情報処理装置10は、画像情報取得部122、文字認識部123、記憶制御部124、文字比較部126、及び、画像比較部127を有する。画像情報取得部122は、レシートRECに記載された複数の文字を含む画像を示す画像情報PINFを取得する。文字認識部123は、画像情報PINFにより示される画像に含まれる複数の文字を認識し、認識した複数の文字を示す文字情報CINFを生成する。記憶制御部124は、画像情報PINFと文字情報CINFとを互いに対応付けて記憶装置140に記憶する。文字比較部126は、文字情報CINFにより示される複数の文字を、記憶装置140に記憶された他の文字情報CINFにより示される複数の文字と比較する文字比較を実行する。画像比較部127は、上述の他の文字情報CINFの少なくとも1つが、文字比較の結果に関する所定条件を満たす特定の文字情報CINFである場合に、画像情報PINFにより示される画像を、記憶装置140に記憶された他の画像情報PINFのうち、特定の文字情報CINFに対応付けられた特定の画像情報PINFにより示される画像と比較する画像比較を実行する。
【0084】
このように、本実施形態では、複数のレシートRECを比較するレシート比較処理として、文字比較に加えて画像比較が実行されるため、複数のレシートの比較精度を高めることができる。すなわち、本実施形態では、複数の文字が記載された複数の媒体の比較精度を高めることができる。なお、本実施形態では、画像比較は、文字比較により特定の文字情報CINFが検出された場合に、特定の文字情報CINFに対応付けられた特定の画像情報PINFに対して実行される。特定の文字情報CINFは、例えば、画像情報取得部122により取得された画像情報PINFにより示される画像に含まれる複数の文字との類似度が高い複数の文字を示す文字情報CINFである。この場合、本実施形態では、画像情報取得部122により取得された画像情報PINFと比較される対象は、当該画像情報PINFとの類似度が高い特定の画像情報PINFに限定される。これにより、本実施形態では、画像情報取得部122により取得された画像情報PINFにより示されるレシートRECの画像と、記憶装置140に既に記憶されている画像情報PINFにより示されるレシートRECの画像との比較を、高速に実行することができる。
【0085】
また、本実施形態では、所定条件は、文字情報CINFにより示される複数の文字と他の文字情報CINFにより示される複数の文字との類似度である文字類似度が第1類似度TH1以上であることである。そして、画像比較部127は、画像比較として、画像情報PINFにより示される画像と特定の画像情報PINFにより示される画像との類似度である画像類似度が、第2類似度TH2以上であるか否かを判定する処理を実行する。
【0086】
このように、本実施形態では、画像情報取得部122により取得された画像情報PINFと比較される対象は、当該画像情報PINFに対応付けられた文字情報CINFとの文字類似度が高い特定の文字情報CINFに対応付けられた特定の画像情報PINFに限定される。これにより、本実施形態では、画像情報取得部122により取得された画像情報PINFにより示されるレシートRECの画像と類似するレシートRECの画像を示す重複候補の画像情報PINFが記憶装置140に記憶されているか否かの判定を高速に実行することができる。
【0087】
また、本実施形態では、情報処理装置10は、特定の画像情報PINFの少なくとも1つが重複候補の画像情報PINFである場合に、重複候補の画像情報PINFが記憶装置140に記憶されていることを示す返却情報RINFを出力する出力制御部128をさらに有する。重複候補の画像情報PINFは、画像情報PINFにより示される画像との画像類似度が第2類似度TH2以上である画像を示す画像情報PINFである。
【0088】
このように、本実施形態では、出力制御部128は、重複候補の画像情報PINFが記憶装置140に記憶されている場合に、重複候補の画像情報PINFが記憶装置140に記憶されていることを示す返却情報RINFを出力する。例えば、出力制御部128は、画像情報PINFを情報処理装置10に送信した装置(例えば、サービスサーバ20)に、重複候補の画像情報PINFが記憶装置140に記憶されていることを示す返却情報RINFを出力する。これにより、本実施形態では、画像情報PINFを送信した装置に、当該画像情報PINFにより示されるレシートRECの画像と類似するレシートRECの画像を示す重複候補の画像情報PINFが記憶装置140に記憶されていることを認識させることができる。
【0089】
また、本実施形態では、返却情報RINFは、文字類似度情報、及び、画像類似度情報を含んでもよい。文字類似度情報は、文字情報CINFにより示される複数の文字と重複候補の画像情報PINFに対応付けられた特定の文字情報CINFにより示される複数の文字との文字類似度を示す。画像類似度情報は、画像情報PINFにより示される画像と重複候補の画像情報PINFにより示される画像との画像類似度を示す。返却情報RINFが文字類似度情報及び画像類似度情報を含む場合、返却情報RINFを受信した装置は、画像情報PINFにより示されるレシートRECと重複候補の画像情報PINFにより示されるレシートRECとが、どの程度類似しているかを容易に認識できる。
【0090】
また、本実施形態では、記憶制御部124は、画像情報PINFを識別する画像識別情報を画像情報PINFに対応付けて記憶装置140に記憶してもよい。この場合、返却情報RINFは、画像情報PINFを示す画像識別情報、及び、重複候補の画像情報PINFを示す画像識別情報を含んでもよい。返却情報RINFが画像識別情報を含む場合、返却情報RINFを受信した装置は、重複候補の画像情報PINFを容易に識別することができる。
【0091】
[2.第2実施形態]
次に、
図5を参照しながら、第2実施形態に係る情報処理システム1の概要の一例について説明する。
【0092】
図5は、第2実施形態に係る情報処理システム1の概要を説明するための説明図である。
図1から
図4において説明した要素と同様の要素については、同様の符号を付し、詳細な説明を省略する。
【0093】
図5に示す情報処理システム1は、
図1に示した情報処理システム1と同一の構成である。例えば、情報処理システム1は、処理装置120、記憶装置140及び通信装置160を含む情報処理装置10と、サービスサーバ20と、端末装置30とを有する。但し、情報処理装置10が有する記憶装置140に記憶される制御プログラムPG2は、
図1に示した制御プログラムPG1と相違する。なお、制御プログラムPG2は、「プログラム」の一例である。本実施形態では、制御プログラムPG2は、処理装置120を画像情報取得部122、文字認識部123、記憶制御部124、構造化部125、文字比較部126、画像比較部127及び出力制御部128として機能させるためのアプリケーションプログラムを含む。なお、制御プログラムPG2は、例えば、処理装置120が情報処理装置10の各部を制御するためのオペレーティングシステムプログラムを含んでもよい。また、制御プログラムPG2は、ネットワークNWを介して他の装置から送信されてもよい。
【0094】
図5に示す処理装置120は、
図1に示した制御プログラムPG1の代わりに制御プログラムPG2を実行することを除いて、
図1に示した処理装置120と同様である。例えば、処理装置120は、記憶装置140に記憶された制御プログラムPG2を実行することにより、画像情報取得部122、文字認識部123、記憶制御部124、構造化部125、文字比較部126、画像比較部127及び出力制御部128として機能する。すなわち、本実施形態では、処理装置120が構造化部125として機能する点が、上述した第1実施形態と相違する。
【0095】
画像情報取得部122、文字認識部123、記憶制御部124、文字比較部126、画像比較部127及び出力制御部128は、上述した第1実施形態と同様である。以下では、上述した第1実施形態と相違する構造化部125を中心に説明する。
【0096】
構造化部125は、例えば、文字情報CINFにより示される複数の文字を単語毎に区分けし、区分けした単語を複数の項目のいずれかに対応付けることにより、文字情報CINFにより示される複数の文字を構造化する。複数の項目は、例えば、レシートRECに記載される店舗名等の記載項目である。
【0097】
例えば、構造化部125は、レシートRECにおける文字の記載位置に基づいて、文字情報CINFにより示される複数の文字を複数の文字列に区分けすることにより、当該複数の文字を単語毎に区分けする。そして、構造化部125は、例えば、区分けした単語を、文字の記載位置と項目との対応関係に基づいて、複数の項目のいずれかに対応付ける。文字の記載位置と項目との対応関係は、例えば、機械学習等により学習済みである。
【0098】
なお、レシートRECにおける文字の記載位置は、例えば、レシートRECにおいて、当該文字が属する行が何行目であるかを示す行番号であってもよい。さらに、レシートRECにおける文字の記載位置は、当該文字が属する行の行番号、及び、当該文字が属する行における文字の位置であってもよい。なお、レシートRECにおける文字の記載位置は、上述の例に限定されない。例えば、レシートRECにおける文字の記載位置は、レシートREC内の所定の位置に対する相対的な位置であってもよい。
【0099】
このように、本実施形態では、文字情報CINFにより示される複数の文字は、構造化部125により構造化される。すなわち、文字比較部126により比較される最新の文字情報CINF及び比較対象の文字情報CINFの各々により示される複数の文字は、構造化部125により構造化されている。例えば、文字比較部126は、最新の文字情報CINFにより示される複数の文字と比較対象の文字情報CINFにより示される複数の文字との比較を、構造化された項目毎に実行する。これにより、本実施形態では、例えば、最新の文字情報CINFと比較対象の文字情報CINFとの文字類似度の算出を精度よく高速に実行することができる。
【0100】
次に、
図6を参照しながら、返却情報RINFの一例について説明する。
【0101】
図6は、返却情報RINFの一例を説明するための説明図である。
図6には、最新の画像情報PINFにより示される画像に類似する画像を示す重複候補の画像情報PINFが検出された場合の返却情報RINFの一例が示されている。
【0102】
返却情報RINFは、最新の画像情報PINFにより示される画像に対する文字認識処理により認識された複数の文字を示す文字情報CINFと、重複候補の画像情報PINFに関する類似度情報SINFとを含む。なお、本実施形態では、文字情報CINFにより示される複数の文字は、
図5において説明したように、構造化されている。
【0103】
文字情報CINFは、複数の項目を示す情報と、複数の項目に対応する文字列を示す情報とを含む。
図6の“結果”における文字情報CINFに対応する部分には、構造化により各項目に対応付けられた文字列の例が示されている。
図6では、複数の項目の一例として、店舗名、購入日時、電話番号、商品、単価、商品数、商品合計額、JANコード、合計額及び支払方法が挙げられているが、複数の項目は、
図6に示す例に限定されない。なお、JANコードは、どこの事業者の何の商品かを識別するための商品識別コードである。
【0104】
また、類似度情報SINFは、識別情報IINF0、重複候補の識別情報IINF1、文字類似度情報CSINF、及び、画像類似度情報PSINFを含む。
図6の“結果”における類似度情報SINFに対応する部分には、レシート比較処理の対象及び結果の例が示されている。なお、類似度情報SINFは、「比較結果情報」の一例である。
【0105】
識別情報IINF0は、返却情報RINFに含まれる文字情報CINFに対応付けられた画像情報PINF(最新の画像情報PINF)を識別する画像識別情報である。また、重複候補の識別情報IINF1は、レシート比較処理により検出された重複候補の画像情報PINFを識別する画像識別情報であり、「他の画像識別情報」の一例である。以下では、識別情報IINF0及びIINF1を、識別情報IINFと総称する場合がある。
【0106】
また、文字類似度情報CSINFは、返却情報RINFに含まれる文字情報CINFにより示される複数の文字と重複候補の画像情報PINFに対応付けられた特定の文字情報CINFにより示される複数の文字との文字類似度を示す。画像類似度情報PSINFは、返却情報RINFに含まれる文字情報CINFに対応付けられた画像情報PINFにより示される画像と重複候補の画像情報PINFにより示される画像との画像類似度を示す。
【0107】
ここで、重複候補の画像情報PINFが検出されない場合には、類似度情報SINFは、重複候補の識別情報IINF1、文字類似度情報CSINF、及び、画像類似度情報PSINFを含まない。すなわち、重複候補の識別情報IINF1、文字類似度情報CSINF、及び、画像類似度情報PSINFを含まない返却情報RINFは、重複候補の画像情報PINFが検出されなかったことを示す返却情報RINFである。一方、重複候補の識別情報IINF1、文字類似度情報CSINF、及び、画像類似度情報PSINFの少なくとも1つを含む返却情報RINFは、重複候補の画像情報PINFが検出されたことを示す返却情報RINFである。
【0108】
なお、返却情報RINFの構成は、
図6に示す例に限定されない。例えば、複数の重複候補の画像情報PINFが検出された場合、返却情報RINFは、複数の重複候補の画像情報PINFの各々に対応する重複候補の識別情報IINF1、文字類似度情報CSINF、及び、画像類似度情報PSINFを含んでもよい。あるいは、出力制御部128は、複数の重複候補の画像情報PINFのうち、画像類似度又は文字類似度の高い順に所定数の画像情報PINFを、返却情報RINFに反映させる画像情報PINFとして選択してもよい。この場合、返却情報RINFは、複数の重複候補の画像情報PINFの中から出力制御部128により選択された所定数の画像情報PINFの各々に対応する重複候補の識別情報IINF1、文字類似度情報CSINF、及び、画像類似度情報PSINFを含む。
【0109】
また、例えば、文字類似度情報CSINF及び画像類似度情報PSINFの一方は、類似度情報SINFから省かれてもよい。また、識別情報IINF0及びIINF1は、類似度情報SINFから省かれてもよい。この場合、識別情報IINFは、記憶装置140に記憶されなくてもよい。
【0110】
次に、
図7を参照しながら、本実施形態に係る情報処理装置10の動作の概要について説明する。
【0111】
図7は、
図5に示した情報処理装置10の動作の一例を示すフローチャートである。
図7に示す動作は、レシート比較処理に該当する。例えば、
図7に示すレシート比較処理は、
図4に示したレシート比較処理と同様に、サービスサーバ20が情報処理装置10に画像情報PINFを送信する度に実行される。
図7に示す動作は、ステップS200の処理が実行された後にステップS210の処理が実行されることを除いて、
図4に示した動作と同様である。
図4において説明され処理と同様の処理については、詳細な説明を省略する。
【0112】
ステップS100及びS200の一連の処理は、
図4に示したステップS100及びS200の一連の処理と同様である。処理装置120は、ステップS200の処理を実行した後、処理をステップS210に進める。
【0113】
ステップS210において、処理装置120は、構造化部125として機能し、ステップS200で認識された複数の文字を構造化する。これにより、構造化された複数の文字を示す文字情報CINFが生成される。処理装置120は、ステップS210の処理を実行した後、処理をステップS220に進める。
【0114】
ステップS220において、処理装置120は、記憶制御部124として機能し、ステップS210で構造化された複数の文字を示す文字情報CINFとステップS100で取得された画像情報PINFとを互いに対応付けて記憶装置140に記憶する。また、
図7では図示を省略しているが、本実施形態では、ステップS220において、記憶制御部124は、画像情報PINFを識別する識別情報IINFを当該画像情報PINFに対応付けて記憶装置140に記憶する。
【0115】
そして、処理装置120は、ステップS220の処理を実行した後、処理をステップS300に進める。ステップS300以降の一連の処理は、
図4に示したステップS300以降の一連の処理と同様である。なお、情報処理装置10の動作は、
図7に示した例に限定されない。
【0116】
以上、本実施形態においても、上述した第1実施形態と同様の効果を得ることができる。また、本実施形態では、情報処理装置10は、文字情報CINFにより示される複数の文字を単語毎に区分けし、区分けした単語を複数の項目のいずれかに対応付けることにより、文字情報CINFにより示される複数の文字を構造化する構造化部125をさらに有する。例えば、構造化部125は、レシートRECにおける文字の記載位置に基づいて、文字情報CINFにより示される複数の文字を複数の文字列に区分けすることにより、当該複数の文字を単語毎に区分けする。従って、本実施形態では、文字比較部126により比較される文字情報CINF及び他の文字情報CINFの各々により示される複数の文字は、構造化部により構造化されている。
【0117】
例えば、本実施形態では、文字比較部126は、最新の文字情報CINFにより示される複数の文字と比較対象の文字情報CINFにより示される複数の文字との比較を、構造化された項目毎に実行する。これにより、本実施形態では、最新の文字情報CINFと比較対象の文字情報CINFとの文字類似度の算出を精度よく高速に実行することができる。
【0118】
[3.変形例]
本発明は、以上に例示した実施形態に限定されない。具体的な変形の態様を以下に例示する。以下の例示から任意に選択された2以上の態様を併合してもよい。
【0119】
[第1変形例]
上述した第2実施形態において、文字比較により比較される文字列は、複数の項目のうちの所定の項目に対応付けられた文字列に限定されてもよい。所定の項目は、例えば、複数のレシートRECが同一のレシートRECであるか否かを判定するのに必要な項目である。この場合、比較される項目の数が限定されるため、最新の文字情報CINFと比較対象の文字情報CINFとの比較を高速に実行することができる。
【0120】
あるいは、上述した第2実施形態において、複数の項目の各々に重み値が対応付けられてもよい。例えば、複数のレシートRECが同一のレシートRECであるか否かの判定に与える影響の大きい項目には、影響の小さい項目よりも、大きな重み値が対応付けられてもよい。そして、文字比較部126は、各項目に対応付けられた重み値を用いて文字類似度を算出してもよい。この場合、画像比較が実行されるべき特定の画像情報PINFに対応付けられた特定の文字情報CINFを精度よく検出することができる。
【0121】
以上、本変形例においても、上述した第2実施形態と同様の効果を得ることができる。
【0122】
[第2変形例]
上述した実施形態及び変形例では、情報処理システム1がキャンペーン応募システムである場合を例示したが、本発明はこのような態様に限定されるものではない。例えば、情報処理システム1は、レシートRECの画像を利用して家計簿を作成するシステムであってもよい。また、情報処理システム1は、レシートRECを用いるシステムに限定されず、例えば、書類を電子データ化して登録するシステムであってもよい。すなわち、複数の文字が記載された媒体は、レシートRECに限定されない。例えば、複数の文字が記載された媒体としては、請求書、決算書、振込用紙、見積書等の経理書類、実験や観測における測定値を記録した記録用紙、名刺、及び、応募シール等の多岐にわたる分野の文書が該当する。以上、本変形例においても、上述した実施形態及び変形例と同様の効果を得ることができる。
【符号の説明】
【0123】
1…情報処理システム、10…情報処理装置、20…サービスサーバ、30…端末装置、120…処理装置、122…画像情報取得部、123…文字認識部、124…記憶制御部、125…構造化部、126…文字比較部、127…画像比較部、128…出力制御部、140…記憶装置、160…通信装置、AINF…応答情報、CINF…文字情報、PINF…画像情報、RINF…返却情報。