(19)【発行国】日本国特許庁(JP)
(12)【公報種別】公開特許公報(A)
(11)【公開番号】P2023119842
(43)【公開日】2023-08-29
(54)【発明の名称】フォーマット作成装置、フォーマット作成方法およびフォーマット作成プログラム
(51)【国際特許分類】
G06Q 10/10 20230101AFI20230822BHJP
G06F 16/583 20190101ALI20230822BHJP
G06Q 50/06 20120101ALI20230822BHJP
【FI】
G06Q10/10
G06F16/583
G06Q50/06
【審査請求】有
【請求項の数】8
【出願形態】OL
(21)【出願番号】P 2022022934
(22)【出願日】2022-02-17
(71)【出願人】
【識別番号】516140214
【氏名又は名称】booost technologies株式会社
(74)【代理人】
【識別番号】110001427
【氏名又は名称】弁理士法人前田特許事務所
(72)【発明者】
【氏名】永野 雄三
【テーマコード(参考)】
5B175
5L049
【Fターム(参考)】
5B175GA03
5L049AA11
5L049AA20
5L049CC06
(57)【要約】 (修正有)
【課題】ファイルなどの形式に応じて、ユーザが独自に対象データの位置を設定することができるフォーマット作成装置、フォーマット作成方法およびフォーマット作成プログラムを提供する。
【解決手段】フォーマット作成システムは、読み取られた第2ファイルの画像データを表示する表示部21と、第2ファイルにおける対象データの位置を特定するための位置情報の入力を受け付ける操作端末2と、第2ファイルの画像データ及び位置情報に基づいて、読み取られた第1ファイルから対象データを抽出するためのフォーマットを作成するフォーマット生成部131を有するサーバ装置1と、を備える。
【選択図】
図1
【特許請求の範囲】
【請求項1】
読み取られた第1ファイルから対象データを抽出するためのフォーマットを作成するフォーマット作成装置であって、
読み取られた第2ファイルを表示する表示部と、
前記第2ファイルにおける前記対象データの位置を特定するための位置情報の入力を受け付ける受付部と、
前記第2ファイルおよび前記位置情報に基づいて、を作成するフォーマット作成部とを備える、フォーマット作成装置。
【請求項2】
請求項1記載のフォーマット作成装置において、
前記位置情報は、前記対象データの周辺の第1文字列に関する情報を含む、フォーマット作成装置。
【請求項3】
請求項2記載のフォーマット作成装置において、
前記第1文字列は、前記対象データの上側、下側、左側および右側の少なくともいずれか1つに配置されている文字列である、フォーマット作成装置。
【請求項4】
請求項2または3記載のフォーマット作成装置において、
前記位置情報は、前記対象データから前記第1文字列までの距離に関する情報を含む、フォーマット作成装置。
【請求項5】
請求項2~4のいずれか1項記載のフォーマット作成装置において、
前記位置情報は、前記第1文字列の付近に配置された第2文字列に関する情報をさらに含む、フォーマット作成装置。
【請求項6】
請求項1~5のいずれか1項記載のフォーマット作成装置において、
前記フォーマットに基づき、前記第1ファイルから前記対象データを抽出する抽出部をさらに備える、フォーマット作成装置。
【請求項7】
読み取られた第1ファイルから対象データを抽出するためのフォーマットを作成するフォーマット作成方法であって、
サーバ装置が、
読み取られた第2ファイルを表示部に表示させるステップと、
前記第2ファイルにおける前記対象データの位置を特定するための位置情報の入力を受け付けるステップと、
前記第2ファイルおよび前記位置情報に基づいて、前記フォーマットを生成するステップとを備える、フォーマット作成方法。
【請求項8】
コンピュータに、
請求項7に記載のフォーマット作成方法を実行させるためのフォーマット作成プログラム。
【発明の詳細な説明】
【技術分野】
【0001】
本開示は、フォーマット作成装置、フォーマット作成方法およびフォーマット作成プログラムに関する。
【背景技術】
【0002】
従来より、書類等の紙媒体やPDF(Portable Document Format)などの電子文書(以下、「ファイルなど」という)から、数値などの特定のデータを抽出する技術が知られている。例えば、特許文献1では、一または複数の電子文書ファイルを取得し、生成するデータベースのデータベース項目およびデータ抽出規則を特定する。そして、特定したデータベース項目およびデータ抽出規則にて、電子文書ファイルからデータベース項目および対応するデータを抽出する。
【0003】
このような技術では、一般的に、あらかじめ定められたフォーマット(規則)に従って、ファイルなどから特定のデータが読み取られる。
【先行技術文献】
【特許文献】
【0004】
【発明の概要】
【0005】
本開示の一実施形態に係るフォーマット作成装置は、読み取られた第1ファイルから対象データを抽出するためのフォーマットを作成するフォーマット作成装置であって、読み取られた第2ファイルを表示する表示部と、前記第2ファイルにおける前記対象データの位置を特定するための位置情報の入力を受け付ける受付部と、前記第2ファイルおよび前記位置情報に基づいて、前記フォーマットを作成するフォーマット作成部とを備える、フォーマット作成装置。
【0006】
また、前記位置情報は、前記対象データの周辺の第1文字列に関する情報を含む、としてもよい。
【0007】
また、前記第1文字列は、前記対象データの上側、下側、左側および右側の少なくともいずれか1つに配置されている文字列である、としてもよい。
【0008】
また、前記位置情報は、前記対象データから前記第1文字列までの距離に関する情報を含む、としてもよい。
【0009】
また、前記位置情報は、前記第1文字列の付近に配置された第2文字列に関する情報をさらに含む、としてもよい。
【0010】
また、前記フォーマットに基づき、前記第1ファイルから前記対象データを抽出する抽出部をさらに備える、としてもよい。
【0011】
また、本開示の他の実施形態に係るフォーマット作成方法は、読み取られた第1ファイルから対象データを抽出するためのフォーマットを作成するフォーマット作成方法であって、サーバ装置が、読み取られた第2ファイルを表示部に表示させるステップと、前記第2ファイルにおける前記対象データの位置を特定するための位置情報の入力を受け付けるステップと、前記第2ファイルおよび前記位置情報に基づいて、前記第1ファイルにおける前記対象データの位置を特定し、特定した前記対象データの位置に関する情報を含む前記フォーマットを記憶するステップとを備える。
【0012】
また、本開示の他の実施形態に係るフォーマット作成プログラムは、コンピュータに、前記フォーマット作成方法を実行させる。
【図面の簡単な説明】
【0013】
【
図1】本実施形態に係るフォーマット作成システムの構成を示すブロック図。
【
図2】本実施形態に係るフォーマット作成システムの動作を示すフローチャート。
【
図3】本実施形態に係るフォーマット作成システムの動作を示すフローチャート。
【
図4】本実施形態に係る操作端末に表示される第1画面の例を示す図。
【
図5】本実施形態に係る操作端末に表示される第1画面の例を示す図。
【発明を実施するための形態】
【0014】
以下、本開示の実施形態を図面に基づいて詳細に説明する。以下の好ましい実施形態の説明は、本質的に例示に過ぎず、本発明、その適用物或いはその用途を制限することを意図するものではない。
【0015】
本開示に係るフォーマット作成装置、フォーマット作成方法およびフォーマット作成プログラムは、本実施形態に係るフォーマット作成システムの一部または全部として実現されている。
【0016】
また、本実施形態においてフォーマット作成システムは、小売電気事業者が、電気利用者(ユーザ)に対する電気料金請求書などから、所定の対象データ(例えば、請求年月、請求金額、電気使用量、住所、供給地点特定番号など)を抽出するために用いられる。
【0017】
(第1実施形態)
図1は、第1実施形態に係るフォーマット作成システムの構成を示すブロック図である。
図1に示すように、フォーマット作成システムは、サーバ装置1を備える。サーバ装置1は、通信ネットワークNを介して、操作端末2と通信可能に構成されている。
【0018】
操作端末2(受付部)は、PCやスマートフォンなど、小売電気事業者(ユーザ)によって操作される端末である。操作端末2は、表示部21と、操作部22とを備える。表示部21は、モニタなどで構成されており、操作端末2の制御部からの指示に応じて、小売電気事業者に対して画像を表示する。操作部22は、キーボードやマウスなどの入力装置で構成されており、小売電気事業者からの操作を受け付ける。また、操作端末2の記憶部には、予め、フォーマット作成プログラムがインストールされている。操作端末2の制御部は、フォーマット作成プログラムに応じて操作端末2の各部を動作させる。
【0019】
また、操作端末2には、スキャナ3が接続されている。スキャナ3は、セットされた書類などの紙媒体を読み取り、当該紙媒体の文字など(文字、記号、図柄など)を含む画像データを生成するものである。スキャナ3は、生成した画像データを操作端末2に送信する。
【0020】
詳しくは後述するが、操作端末2は、操作部22の操作によって、小売電気事業者からフォーマット作成指示を受け付けると、
図4および
図5に示す第1画面Sc1を表示部21に表示させる。この第1画面Sc1には、スキャナ3から受信した第2ファイルを示す画像データ(ここでは、電気料金に関する情報が記載された料金シートA1)が左側に、対象データの位置情報を入力するための入力画面A2が右側に表示されている。この第2ファイルは、対象データの読み取り位置を設定するために用いられる書類等の紙媒体である。小売電気事業者は、入力画面A2に対して、対象データの位置を特定するための位置情報を入力することにより、読み取り対象である第1ファイル(書類等の紙媒体)から対象データを抽出するためのフォーマットを作成することができる。すなわち、本実施形態では、操作端末2は、第2ファイルにおける対象データの位置を特定するための位置情報の入力を受け付ける受付部として機能する。
【0021】
なお、操作端末2は、スキャナ3から受信した、第1および第2ファイルの画像データならびに位置情報をサーバ装置1に送信する。
【0022】
(サーバ装置1の構成について)
図1に示すように、サーバ装置1は、通信部11、記憶部12および制御部13を備える。
【0023】
通信部11は、例えば、電気回路などで構成され、通信ネットワークNを介して、操作端末2と通信を行う。
【0024】
記憶部12は、ROM(Read Only Memory)、RAM(Random Access Memory)、HDD(Hard Disk Drive)およびSSD(Solid State Drive)等によって構成される記憶媒体である。記憶部12には、制御部13によって実行される各種プログラムが記憶されている。
【0025】
制御部13は、例えば、CPU(Central Processing Unit)および半導体メモリ等を含むマイクロコンピュータで構成される。制御部13は、記憶部12に記憶されたプログラムなどを実行することにより、サーバ装置1の各部を制御する。
【0026】
また、制御部13は、フォーマット作成部131および抽出部132を備える。
【0027】
フォーマット作成部131は、操作端末2から受信した、第2ファイルに関する情報に基づき、フォーマットを作成(生成)する。具体的には、フォーマット作成部131は、操作端末2から第2ファイルの画像データおよび位置情報を受信した場合、当該画像データに対してOCRなどの文字読取技術によって、当該画像データから文字列を抽出する。また、フォーマット作成部131は、位置情報から、対象データの位置を特定する。フォーマット作成部131は、特定された位置情報を含むフォーマットを作成し、当該フォーマットを記憶部12に記憶させる。
【0028】
抽出部132は、操作端末2から受信した、第1ファイルに関する情報に基づき、第1ファイルから対象データを抽出する。具体的には、抽出部132は、操作端末2から第2ファイルを示す画像データを受信した場合、当該画像データに対してOCR処理などを行い、当該画像データに含まれる文字列を抽出する。そして、抽出部132は、記憶部12からフォーマットを読み出して、当該文字列から対象データを抽出する。具体的には、抽出部132は、当該文字列から、フォーマットに含まれる位置情報に対応する位置にある文字列を、対象データとして抽出する。
【0029】
ここで、抽出部132は、第1ファイルから対象データを抽出する場合、第1ファイルに関連する第2ファイルによって作成されたフォーマットを記憶部12から読み出す。第1ファイルと第2ファイルとの関連付けは、第1ファイルに対し第2ファイルのフォーマットを小売電気事業者(ユーザ)が選択して紐付けることにより行われてよい。また、第1ファイルと第2ファイルとの関連付けは、第1および第2ファイルのファイル種別(例えば、ファイル名やファイル形式、ファイルに記載された内容などに応じたファイルの分類)を比較することにより行われてもよい。この場合、例えば、フォーマット作成部131は、第2ファイルのフォーマットを作成する際に、第2ファイルのフォーマットにファイル種別を設定する。そして、抽出部132は、第1ファイルの画像データを受信した場合、記憶部12に記憶された各フォーマットと第1ファイルの画像データとを比較することにより、第1ファイルのファイル種別を判定する。なお、ファイル種別は、小売電気事業者が任意に設定できるものであってもよいし、他のフォーマットと比較することによって自動的に設定されてるものであってもよい。
【0030】
なお、上記OCR処理では、所定の規則に従って、文字列を複数の文字列に区切って認識している。例えば、文字間にスペースが所定数(ここでは3文字)以上存在する場合、異なる文字列に区切られることとなる。この文字列を区切るための規則は、小売電気事業者によって設定されてもよいし、小売電気事業者によって設定された過去のデータに基づいて設定されてもよいし、日付や特定の番号を自動的に認識して設定されてもよい。
【0031】
(フォーマット作成システムの動作について)
図2および
図3は第1実施形態に係るフォーマット作成システムの動作を示すフローチャートである。具体的には、
図2はフォーマットを作成する際のフォーマット作成システムの動作を示し、
図3は第1ファイルから対象データを抽出する際のフォーマット作成システムの動作を示す。
【0032】
【0033】
操作端末2が、操作部22を介して、小売電気事業者からフォーマットの作成指示を受けると、スキャナ3はセットされた第2ファイルを読み取る(ステップS1)。そして、スキャナ3は、第2ファイルの画像データを操作端末2に送信する。
【0034】
操作端末2は、スキャナ3から第2ファイルの画像データを受信すると、第1画面Sc1(
図4および
図5参照)を表示する(ステップS2)。
図4および
図5に示すように、第1画面Sc1には、左側に読み取られた第2ファイル(ここでは、料金シートA1)が表示され、右側には、対象データの位置情報を入力するための入力画面A2が表示される。
【0035】
料金シートA1には、例えば、請求年月、請求金額、電気使用量、電気利用者の住所、供給地点特定番号などが記載されていてよい。
【0036】
また、入力画面A2には、フォーマット名を入力するためのテキストボックスT1および対象データの位置情報を入力するためのテキストボックスT2~T8が表示されている。
【0037】
テキストボックスT2~T5は、対象データの周辺の文字列(第1文字列)を入力するためのものである。具体的には、テキストボックスT2~T5には、対象データの上側、下側、右側および左側に配置される文字をそれぞれ入力する。例えば、料金シートA1における左側上部の破線で囲まれた文字列(「2021/07」の文字列の位置)を対象データの位置と設定する場合、テキストボックスT2には、「年月」、テキストボックスT3には、「契約者名義」の文字を入力する。
【0038】
テキストボックスT6,T7には、対象データと周辺の文字列との距離を入力するものである。具体的には、テキストボックスT6,T7には、対象データと、対象データの上側および下側に配置される文字列との距離(ここでは、文字数)を入力する。例えば、料金シートA1における左側中央部の破線で囲まれた文字列(「2021/07」の文字列の位置)を対象データの位置と設定する場合、テキストボックスT6には、「1」、テキストボックスT7には、「1」を入力する。
【0039】
テキストボックスT8には、対象データの周辺の文字列に近接する文字列(第2文字列)を入力するものである。例えば、料金シートA1内に周辺の文字列が複数含まれている場合、対象データを誤検出するおそれがある。そこで、テキストボックスT8に、対象データに近接する文字列を入力することにより、対象データをより確実に抽出することができる。
図5において、テキストボックスT8は検索開始文字列を入力するものである。当該テキストボックスT8に文字列が入力された場合、対象データの抽出は、料金シートA1内の当該文字列のうち最初のものの後について行われる。例えば、料金シートA1における左側中央部の破線で囲まれた文字列(「2021/07」の文字列の位置)を対象データの位置と設定し、テキストボックスT2に「請求年月」と入力した場合、テキストボックスT8には、「料金シート」を入力する。
【0040】
操作端末2は、操作部22を介して、テキストボックスT2~T8により、対象データの位置情報の入力を受け付ける(ステップS3)と、受け付けた対象データの位置情報および第2ファイルの画像データをサーバ装置1に送信する(ステップS4)。
【0041】
サーバ装置1のフォーマット作成部131は、操作端末2から第2ファイルの画像データおよび位置情報を受信した場合、当該画像データに対してOCRなどの文字読取技術によって、当該画像データから文字列を抽出する。また、フォーマット作成部131は、位置情報から、対象データの位置を特定する。フォーマット作成部131は、特定された位置情報を含むフォーマットを作成し、当該フォーマットを記憶部12に記憶する(ステップS5)。
【0042】
【0043】
操作端末2が、操作部22を介して、小売電気事業者から対象データの読み取り指示を受けると、スキャナ3は、セットされた第1ファイルを読み取る(ステップS11)。そして、スキャナ3は、第1ファイルの画像データを操作端末2に送信する。
【0044】
操作端末2は、スキャナ3から第1ファイルの画像データを受信すると、当該画像データをサーバ装置1に送信する(ステップS12)。
【0045】
サーバ装置1の抽出部132は、第1ファイルの画像データを受信すると、記憶部12からフォーマットを読み出す(ステップS13)。そして、抽出部132は、当該画像データに対してOCR処理などを行い、当該画像データから文字列を抽出する。抽出部132は、フォーマットにおいて特定された対象データの位置情報に基づいて、第1ファイルにおける対象データを抽出する(ステップS14)。例えば、
図5では、入力画面A2の下部の「取得結果」には、料金シートA1中の「請求年月」の下側に記載されている「2021/07」(破線部参照)という対象データが抽出されている。当該対象データは、ステップS3において、テキストボックスT2に「請求年月」が入力されることにより、抽出されたものである。このように、ステップS14では、第2ファイルによって生成されたフォーマットに基づいて、当該フォーマットに含まれる位置情報(対象データを特定するたから第1ファイルにおける対象データが抽出される。
【0046】
以上の構成により、本実施形態に係るフォーマット作成システムは、読み取られた第2ファイルの画像データを表示する表示部21と、第2ファイルにおける対象データの位置を特定するための位置情報の入力を受け付ける操作端末2(受付部)と、第2ファイルの画像データおよび位置情報に基づいて、読み取られた第1ファイルから対象データを抽出するためのフォーマットを生成するフォーマット作成部131とを備える。
【0047】
従来より、ファイルなどから特定のデータを抽出する場合、あらかじめ定められたフォーマットに従って、ファイルなどから特定のデータ(対象データ)が抽出されていた。しかし、ファイルなどの形式が複数ある場合、対象データの位置が異なることがあり、ファイルなどの形式に応じて、ユーザ(ここでは、小売電気事業者)が独自に対象データの位置を設定したいということがある。本実施形態では、操作部22を操作することにより、対象データの位置を特定するための位置情報の入力が行われ、位置情報に応じて、第1ファイルにおける対象データの位置を特定するためのフォーマットが作成(生成)されるため、ファイルなどの形式に応じて、ユーザが独自に対象データの位置を設定することができる。これにより、ユーザは特定のファイルから自在に対象データの位置を設定することができる。また、ユーザは多様なファイルのそれぞれに対して適宜対象データの位置を設定することができる。したがって、ユーザの利便性を向上させることができる。
【0048】
また、近年、脱炭素に向けた活動が企業や団体等において活発に行われている。脱炭素を進めるにあたって企業や団体等はまず自らの温室効果ガス(GHG)の排出量を把握する。GHG排出量は一般的に、企業や団体等が自ら直接排出したGHG排出量(Scope1)、企業や団体等が購入した電気、熱、蒸気等のエネルギーの使用により間接的に排出されたGHG排出量(Scope2)、および関連する他の企業や団体等により排出されたGHG排出量(Scope3)を含むサプライチェーン全体でのGHG排出量である。これらのGHG排出量を把握するために、企業や団体等はあらゆるファイルなどからGHG排出量算出の根拠となる活動量等のデータを収集する。そして、企業や団体等は、当該活動量等のデータにそれぞれ対応する排出原単位を乗じることによってGHG排出量を算出する。
【0049】
ここで、企業や団体等の活動量等のデータを抽出するために用いられるファイルなどは、多岐多様に渡る。例えば、企業や団体等に務める従業員の出張により生じたGHG排出量を算出する場合、根拠となる活動量には燃料ベース手法、距離ベース手法、および消費ベース手法がある。燃料ベース手法で用いられるファイルなどは、各輸送方法別(航空機、電車、バス、自動車など)の燃料使用量等が記載されたものである。距離ベース手法で用いられるファイルなどは、各輸送方法別の総移動距離等が記載されたものである。消費ベース手法で用いられるファイルなどは、各輸送方法別の支出金額等が記載されたものである。また、かかる多岐多様な活動量等のデータを示すファイルなどは企業や団体等の活動において頻繁に生じている。さらに、上記例における企業や団体等に務める従業員の出張により生じたGHG排出量は、簡易的に従業員の人数により概算されてもよい。
【0050】
本実施形態に係るフォーマット作成システムによれば、企業や団体等は、上述のとおり多岐多様な活動量や概算のために用いられる数値等を含むデータを示すファイルなどから柔軟にデータ抽出のためのフォーマットを作成することができる。また、企業や団体等は、一度作成したフォーマットを利用することにより、頻繁に生じる大量のファイルなどから簡単にGHG排出量算出の根拠となる活動量等のデータを抽出することができる。
【0051】
また、表示部21が読み取られた第2ファイルの画像データを表示する。これにより、ユーザは、表示部21に表示された第2ファイルの画像データを見ながら、対象データの位置情報を設定することができるため、ユーザの利便性がさらに向上する。
【0052】
また、位置情報は、対象データの周辺の文字列に関する情報を含む。これにより、対象データの周辺の文字列によって視覚的に容易に第1ファイルにおける対象データの位置を特定することができる。
【0053】
また、対象データの周辺の文字列は、対象データの上側、下側、左側および右側の少なくともいずれか1つに配置されている文字列である。これにより、対象データの上側、下側、左側および右側の少なくともいずれか1つに配置されている文字列によって視覚的に容易に第1ファイルにおける対象データの位置を特定することができる。
【0054】
また、位置情報は、対象データから、対象データの周辺の文字列までの距離に関する情報を含む。これにより、第1ファイルにおける対象データの位置をより正確に特定することができる。
【0055】
また、操作端末2は、対象データの周辺の文字列の付近に配置された文字列の入力を受け付ける。これにより、第1ファイル内に周辺の文字列が複数含まれている場合、対象データをより正確に抽出することができる。
【0056】
また、抽出部132は、記憶部12に記憶されたフォーマットに基づき、第1ファイルから対象データを抽出する。これにより、フォーマット作成部131によって作成されたフォーマットに基づいて、第1ファイルから対象データを容易に抽出することができる。
【0057】
(その他の実施形態)
以上のように、本出願において開示する技術の例示として、実施形態について説明した。しかしながら、本開示における技術は、これに限定されず、適宜、変更、置き換え、付加、省略などを行った実施形態にも適用可能である。
【0058】
上記実施形態では、操作端末2を操作する者が小売電気事業者(ユーザ)であり、第1および第2ファイルが電気料金請求書である場合を例にして説明したが、これに限られない。例えば、操作端末2を操作する者は他のサービスを行う事業者であってもよい。また、第1および第2ファイルは、サービスの利用者に対する料金・決済などに関する書類であってもよいし、どのような書類であってもよい。例えば、サービスの事業者としては、電力、ガス、水道、通信回線、保険、銀行業務、ウェブショッピング、教育などの知識の教授、広告業務、物流、リースなど種々のサービス、小売、物販等の商品販売、家計簿アプリなどのサービスの一部を提供する事業者であってもよい。また、第1および第2ファイルにおける対象データは、どのようなデータであってもよい。
【0059】
また、操作端末2を操作する者が小売業であり、第1および第2ファイルが活動量等のデータを含むファイルである場合、第1および第2ファイルに、小売業の仕入れにかかる伝票、フランチャイズチェーンにおける各店舗からの連絡事項、商品販売履歴などを含んでもよい。この場合、本フォーマット作成システムは、第1および第2ファイルから例えば仕入れ金額、店舗ごとの施設点検状況、販売した商品の種類と金額等の所定の対象データを抽出するために用いてられよい。
【0060】
また、操作端末2を操作する者が建設業である場合、第1および第2ファイルに、建物のオーナーによるテナント(入居者)の管理項目、新規に建設等した建物等の設備に関する項目等のデータを含んでもよい。また、操作端末2を操作する者が金融業である場合、第1および第2ファイルに、投融資の種別や金額および投融資先の企業や団体等の活動内容等にかかるデータを含んでもよい。また、操作端末2を操作する者が製造業である場合、第1および第2ファイルに、サプライチェーン・リサイクルチェーンや販売管理等における金額、物理量、および種別等にかかるデータなどを含んでもよい。また、本フォーマット作成システムは、前記データを対象データとしてもよい。
【0061】
また、上記実施形態では、第1および第2ファイルをスキャナ3で読み取って画像データを生成していたが、これに限られず、第1および第2ファイルをカメラなどによって撮像することにより画像データを生成してもよいし、予め、生成されている第1および第2ファイルを示す電子データを用いてもよいし、API等により他のシステムから取得された電子データを用いてもよい。また、上記実施形態では、ファイルなどは紙媒体の文書や電子媒体の電子文書からなるものとしたが、これに限られず、センサ等により取得された物理量データの集合体を1つのファイルとみなしてもよい。この場合、スキャナ3は、センサ等により取得された物理量データの配列を示す電子データを生成してもよい。
【0062】
また、サーバ装置1の抽出部132は、ステップS4の後に、第1ファイルの画像データから抽出した文字列および位置情報に基づいて、第1ファイルから対象データを抽出し、対象データの抽出結果を操作端末2の表示部21に表示させてもよい。これにより、ユーザは、対象データを読み取るための位置情報を正しく入力できているかを確認することができる。
【0063】
また、上記実施形態では、ステップS3において、対象データと周辺の文字列との距離を入力するテキストボックスとして、対象データの上側および下側に配置される文字列との距離を入力するためのテキストボックスT6,T7を例にして説明したが、これに限られず、対象データと周辺の文字列との位置関係はどのようなものであってもよい。また、ステップS3において、対象データと周辺の文字列との距離は、文字数やピクセル数などであってもよいし、対象データと周辺の文字列との距離を示すものであればどのようなものであってもよい。
【0064】
また、サーバ装置1、操作端末2およびスキャナ3には、それぞれ、上記実施形態に係る機能を実現するためのフォーマット作成プログラムがインストールされている。サーバ装置1、操作端末2およびスキャナ3は、フォーマット作成プログラムを実行することにより、上記実施形態に係る各種機能を実現する。
【産業上の利用可能性】
【0065】
本実施形態に係るフォーマット作成システムは、ファイルなどの形式に応じて、ユーザが独自に対象データの位置を設定することができるため、有用である。
【符号の説明】
【0066】
1 サーバ装置
12 記憶部
13 制御部
131 フォーマット作成部
132 抽出部
2 操作端末(受付部)
21 表示部
22 操作部
3 スキャナ
【手続補正書】
【提出日】2022-07-12
【手続補正1】
【補正対象書類名】特許請求の範囲
【補正対象項目名】全文
【補正方法】変更
【補正の内容】
【特許請求の範囲】
【請求項1】
読み取られた第1ファイルから対象データを抽出するためのフォーマットを作成するフォーマット作成装置であって、
前記対象データの読み取り位置を設定するために読み取られた第2ファイルを表示する表示部と、
前記第2ファイルにおける前記対象データの位置を特定するための位置情報の入力を受け付ける受付部と、
前記第2ファイルおよび前記位置情報に基づいて、前記フォーマットを作成するフォーマット作成部とを備える、フォーマット作成装置。
【請求項2】
請求項1記載のフォーマット作成装置において、
前記位置情報は、前記第2ファイルにおける前記対象データの周辺の第1文字列に関する情報を含む、フォーマット作成装置。
【請求項3】
請求項2記載のフォーマット作成装置において、
前記第1文字列は、前記対象データの上側、下側、左側および右側の少なくともいずれか1つに配置されている文字列である、フォーマット作成装置。
【請求項4】
請求項2または3記載のフォーマット作成装置において、
前記位置情報は、前記対象データから前記第1文字列までの距離に関する情報を含む、フォーマット作成装置。
【請求項5】
請求項2~4のいずれか1項記載のフォーマット作成装置において、
前記位置情報は、前記第1文字列の付近に配置された第2文字列に関する情報をさらに含む、フォーマット作成装置。
【請求項6】
請求項1~5のいずれか1項記載のフォーマット作成装置において、
前記フォーマットに基づき、前記第1ファイルから前記対象データを抽出する抽出部をさらに備える、フォーマット作成装置。
【請求項7】
読み取られた第1ファイルから対象データを抽出するためのフォーマットを作成するフォーマット作成方法であって、
サーバ装置が、
読み取られた第2ファイルを表示部に表示させるステップと、
前記第2ファイルにおける前記対象データの位置を特定するための位置情報の入力を受け付けるステップと、
前記第2ファイルおよび前記位置情報に基づいて、前記フォーマットを生成するステップとを備える、フォーマット作成方法。
【請求項8】
コンピュータに、
請求項7に記載のフォーマット作成方法を実行させるためのフォーマット作成プログラム。
【手続補正書】
【提出日】2022-12-21
【手続補正1】
【補正対象書類名】明細書
【補正対象項目名】0028
【補正方法】変更
【補正の内容】
【0028】
抽出部132は、操作端末2から受信した、第1ファイルに関する情報に基づき、第1ファイルから対象データを抽出する。具体的には、抽出部132は、操作端末2から第1ファイルを示す画像データを受信した場合、当該画像データに対してOCR処理などを行い、当該画像データに含まれる文字列を抽出する。そして、抽出部132は、記憶部12からフォーマットを読み出して、当該文字列から対象データを抽出する。具体的には、抽出部132は、当該文字列から、フォーマットに含まれる位置情報に対応する位置にある文字列を、対象データとして抽出する。
【手続補正2】
【補正対象書類名】特許請求の範囲
【補正対象項目名】全文
【補正方法】変更
【補正の内容】
【特許請求の範囲】
【請求項1】
読み取られた第1ファイルから対象データを抽出するためのフォーマットを作成するフォーマット作成装置であって、
前記対象データの読み取り位置を設定するために読み取られた第2ファイルを表示する表示部と、
前記第2ファイルにおける前記対象データの位置を特定するための位置情報の入力を受け付ける受付部と、
前記第2ファイルおよび前記位置情報に基づいて、前記フォーマットを、作成するフォーマット作成部とを備える、フォーマット作成装置。
【請求項2】
請求項1記載のフォーマット作成装置において、
前記位置情報は、前記第2ファイルにおける前記対象データの周辺の第1文字列に関する情報を含む、フォーマット作成装置。
【請求項3】
請求項2記載のフォーマット作成装置において、
前記第1文字列は、前記対象データの上側、下側、左側および右側の少なくともいずれか1つに配置されている文字列である、フォーマット作成装置。
【請求項4】
請求項2または3記載のフォーマット作成装置において、
前記位置情報は、前記対象データから前記第1文字列までの距離に関する情報を含む、フォーマット作成装置。
【請求項5】
請求項2~4のいずれか1項記載のフォーマット作成装置において、
前記位置情報は、前記第1文字列の付近に配置された第2文字列に関する情報をさらに含む、フォーマット作成装置。
【請求項6】
請求項1~5のいずれか1項記載のフォーマット作成装置において、
前記フォーマットに基づき、前記第1ファイルから前記対象データを抽出する抽出部をさらに備える、フォーマット作成装置。
【請求項7】
読み取られた第1ファイルから対象データを抽出するためのフォーマットを作成するフォーマット作成方法であって、
サーバ装置が、
読み取られた第2ファイルを表示部に表示させるステップと、
前記第2ファイルにおける前記対象データの位置を特定するための位置情報の入力を受け付けるステップと、
前記第2ファイルおよび前記位置情報に基づいて、前記フォーマットを、生成するステップとを備える、フォーマット作成方法。
【請求項8】
コンピュータに、
請求項7に記載のフォーマット作成方法を実行させるためのフォーマット作成プログラム。