(19)【発行国】日本国特許庁(JP)
(12)【公報種別】特許公報(B1)
(11)【特許番号】
(24)【登録日】2024-03-11
(45)【発行日】2024-03-19
(54)【発明の名称】情報処理装置、情報処理方法及びプログラム
(51)【国際特許分類】
G06F 16/38 20190101AFI20240312BHJP
【FI】
G06F16/38
(21)【出願番号】P 2023548329
(86)(22)【出願日】2023-08-09
(86)【国際出願番号】 JP2023029107
【審査請求日】2023-08-09
【早期審査対象出願】
(73)【特許権者】
【識別番号】516380407
【氏名又は名称】ファーストアカウンティング株式会社
(74)【代理人】
【識別番号】110004222
【氏名又は名称】弁理士法人創光国際特許事務所
(74)【代理人】
【識別番号】100166006
【氏名又は名称】泉 通博
(74)【代理人】
【識別番号】100154070
【氏名又は名称】久恒 京範
(74)【代理人】
【識別番号】100153280
【氏名又は名称】寺川 賢祐
(72)【発明者】
【氏名】葛 鴻鵬
(72)【発明者】
【氏名】松田 顕
(72)【発明者】
【氏名】小俣 智
(72)【発明者】
【氏名】森 啓太郎
(72)【発明者】
【氏名】早川 将和
(72)【発明者】
【氏名】藤武 将人
【審査官】松尾 真人
(56)【参考文献】
【文献】特許第6856916(JP,B1)
【文献】特開2021-196686(JP,A)
【文献】特開2005-165978(JP,A)
【文献】特開2022-101136(JP,A)
【文献】国際公開第2020/071558(WO,A1)
【文献】eFLOWソリューションのご紹介,金融国際情報技術展 FIT2018,株式会社 Top Image Systems Japan,2018年10月25日
(58)【調査した分野】(Int.Cl.,DB名)
G06F 16/00-16/958
G06Q 10/00-99/00
(57)【特許請求の範囲】
【請求項1】
複数の定義済みの項目である定義済項目を含むフォーマット情報を記憶する記憶部と、
複数の項目が含まれる処理対象データを取得する取得部と、
前記処理対象データに含まれる複数の項目それぞれの名称に基づいて、前記複数の項目それぞれが前記フォーマット情報に含まれる定義済項目のいずれに対応するかを特定する項目特定部と、
前記処理対象データに含まれる項目のうち前記項目特定部が対応する定義済項目を特定できない項目である未特定項目が有る場合、前記未特定項目について、前記フォーマット情報において前記未特定項目が対応する候補となる定義済項目である
1以上の候補項目を特定する候補特定部と、
前記未特定項目と、前記候補特定部が特定した
1以上の候補項目と、を対応付けて出力する出力部と、
を有
し、
前記処理対象データにおいては、前記複数の項目のうちの少なくともいずれかに金額が関連付けられており、
前記候補特定部は、前記金額を演算した結果に基づいて、前記未特定項目に対応する1以上の候補項目を特定し、
前記出力部は、前記候補特定部が複数の候補項目を特定した場合、特定した複数の候補項目から未特定項目に対応する定義済み項目を選択させるための画面を表示させるよう制御する、
情報処理装置。
【請求項2】
前記候補特定部は、前記処理対象データに含まれる項目のうち前記項目特定部が対応する定義済項目を特定できない項目である前記未特定項目が有る場合、前記未特定項目について、前記処理対象データに含まれる項目同士の関係に基づいて、前記フォーマット情報において前記未特定項目が対応する候補となる定義済項目である
1以上の候補項目を特定する、
請求項1に記載の情報処理装置。
【請求項3】
前記項目特定部は、前記複数の項目の名称それぞれが示す意味に基づいて、前記複数の項目それぞれが対応する定義済項目を特定する、
請求項1に記載の情報処理装置。
【請求項4】
前記処理対象データに含まれる項目それぞれが前記処理対象データにおいて配置された位置を特定する位置特定部をさらに有し、
前記候補特定部は、前記未特定項目が前記処理対象データにおいて配置された位置に基づいて、前記未特定項目に対応する
1以上の候補項目を特定する、
請求項1に記載の情報処理装置。
【請求項5】
前記出力部は、前記未特定項目と、前記候補特定部が特定した候補項目と、が対応する蓋然性の高さを示すスコアをさらに出力する、
請求項1に記載の情報処理装置。
【請求項6】
前記出力部は、前記候補特定部が、前記未特定項目に対応する候補項目を特定できない場合、前記未特定項目に設定すべき名称を表示させる、
請求項1に記載の情報処理装置。
【請求項7】
コンピュータが実行する、
複数の項目が含まれる処理対象データを取得するステップと、
複数の定義済みの項目である定義済項目を含むフォーマット情報を記憶する記憶部を参照し、前記処理対象データに含まれる複数の項目それぞれの名称に基づいて、前記複数の項目それぞれが前記フォーマット情報に含まれる定義済項目のいずれに対応するかを特定する項目特定ステップと、
前記処理対象データに含まれる項目のうち前記項目特定ステップにおいて対応する定義済項目を特定できない項目である未特定項目が有る場合、前記未特定項目について、前記処理対象データに含まれる項目同士の関係に基づいて、前記フォーマット情報において前記未特定項目が対応する候補となる定義済項目である
1以上の候補項目を特定する候補特定ステップと、
前記未特定項目と、前記候補特定ステップにおいてが特定された
1以上の候補項目と、を対応付けて出力するステップと、
を有し、
前記処理対象データにおいては、前記複数の項目のうちの少なくともいずれかに金額が関連付けられており、
前記候補特定ステップにおいては、前記金額を演算した結果に基づいて、前記未特定項目に対応する1以上の候補項目を特定し、
前記出力するステップにおいては、前記候補特定ステップにおいて複数の候補項目を特定した場合、特定した複数の候補項目から未特定項目に対応する定義済み項目を選択させるための画面を表示させるよう制御する、
情報処理方法。
【請求項8】
コンピュータに、
複数の項目が含まれる処理対象データを取得するステップと、
複数の定義済みの項目である定義済項目を含むフォーマット情報を記憶する記憶部を参照し、前記処理対象データに含まれる複数の項目それぞれの名称に基づいて、前記複数の項目それぞれが前記フォーマット情報に含まれる定義済項目のいずれに対応するかを特定する項目特定ステップと、
前記処理対象データに含まれる項目のうち前記項目特定ステップにおいて対応する定義済項目を特定できない項目である未特定項目が有る場合、前記未特定項目について、前記処理対象データに含まれる項目同士の関係に基づいて、前記フォーマット情報において前記未特定項目が対応する候補となる定義済項目である
1以上の候補項目を特定する候補特定ステップと、
前記未特定項目と、前記候補特定ステップにおいてが特定された
1以上の候補項目と、を対応付けて出力するステップと、
を実行させ
、
前記処理対象データにおいては、前記複数の項目のうちの少なくともいずれかに金額が関連付けられており、
前記候補特定ステップにおいては、前記金額を演算した結果に基づいて、前記未特定項目に対応する1以上の候補項目を特定し、
前記出力するステップにおいては、前記候補特定ステップにおいて複数の候補項目を特定した場合、特定した複数の候補項目から未特定項目に対応する定義済み項目を選択させるための画面を表示させるよう制御する、
プログラム。
【発明の詳細な説明】
【技術分野】
【0001】
本発明は、情報処理装置、情報処理方法及びプログラムに関する。
【背景技術】
【0002】
事前にデータ変換プロファイルを定義しておき、ユーザ企業固有のデータフォーマットで取得したデータを標準フォーマットに変換して取得する技術が知られている(例えば特許文献1)。
【先行技術文献】
【特許文献】
【0003】
【発明の概要】
【発明が解決しようとする課題】
【0004】
先行技術においては、予め変換プロファイルが定められていない項目を含むデータを取得した場合に、ユーザがデータの内容を確認して予め定められていない項目が事前定義された項目のうちどの項目に対応するかを決定する必要があり、当該データの処理が煩雑となるという問題が生じていた。
【0005】
そこで、本発明はこれらの点に鑑みてなされたものであり、事前に変換プロファイルが定義されていない項目を含む事務処理対象のデータを処理するための手間を低減することを目的とする。
【課題を解決するための手段】
【0006】
本発明の第1の態様の情報処理装置においては、複数の定義済みの項目である定義済項目を含むフォーマット情報を記憶する記憶部と、複数の項目が含まれる処理対象データを取得する取得部と、前記処理対象データに含まれる複数の項目それぞれの名称に基づいて、前記複数の項目それぞれが前記フォーマット情報に含まれる定義済項目のいずれに対応するかを特定する項目特定部と、前記処理対象データに含まれる項目のうち前記項目特定部が対応する定義済項目を特定できない項目である未特定項目が有る場合、前記未特定項目について、前記フォーマット情報において前記未特定項目が対応する候補となる定義済項目である候補項目を特定する候補特定部と、前記未特定項目と、前記候補特定部が特定した候補項目と、を対応付けて出力する出力部と、を有する。
【0007】
前記候補特定部は、前記処理対象データに含まれる項目のうち前記項目特定部が対応する定義済項目を特定できない項目である前記未特定項目が有る場合、前記未特定項目について、前記処理対象データに含まれる項目同士の関係に基づいて、前記フォーマット情報において前記未特定項目が対応する候補となる定義済項目である候補項目を特定してもよい。
【0008】
前記項目特定部は、前記複数の項目の名称それぞれが示す意味に基づいて、前記複数の項目それぞれが対応する定義済項目を特定してもよい。
【0009】
前記取得部は、前記複数の項目のうちの少なくともいずれかに関連付けられた金額をさらに含む前記処理対象データを取得し、前記候補特定部は、前記金額を演算した結果に基づいて、前記未特定項目に対応する候補項目を特定してもよい。
【0010】
前記処理対象データに含まれる項目それぞれが前記処理対象データにおいて配置された位置を特定する位置特定部をさらに有し、前記候補特定部は、前記未特定項目が前記処理対象データにおいて配置された位置に基づいて、前記未特定項目に対応する候補項目を特定してもよい。
【0011】
前記出力部は、前記未特定項目と、前記候補特定部が特定した候補項目と、が対応する蓋然性の高さを示すスコアをさらに出力してもよい。
【0012】
前記出力部は、前記候補特定部が、前記未特定項目に対応する候補項目を特定できない場合、前記未特定項目に設定すべき名称を表示させてもよい。
【0013】
本発明の第2の態様の情報処理方法においては、コンピュータが実行する、複数の項目が含まれる処理対象データを取得するステップと、複数の定義済みの項目である定義済項目を含むフォーマット情報を記憶する記憶部を参照し、前記処理対象データに含まれる複数の項目それぞれの名称に基づいて、前記複数の項目それぞれが前記フォーマット情報に含まれる定義済項目のいずれに対応するかを特定する項目特定ステップと、前記処理対象データに含まれる項目のうち前記項目特定ステップにおいて対応する定義済項目を特定できない項目である未特定項目が有る場合、前記未特定項目について、前記処理対象データに含まれる項目同士の関係に基づいて、前記フォーマット情報において前記未特定項目が対応する候補となる定義済項目である候補項目を特定する候補特定ステップと、前記未特定項目と、前記候補特定ステップにおいてが特定された候補項目と、を対応付けて出力するステップと、を有する。
【0014】
本発明の第3の態様のプログラムにおいては、コンピュータに、複数の項目が含まれる処理対象データを取得するステップと、複数の定義済みの項目である定義済項目を含むフォーマット情報を記憶する記憶部を参照し、前記処理対象データに含まれる複数の項目それぞれの名称に基づいて、前記複数の項目それぞれが前記フォーマット情報に含まれる定義済項目のいずれに対応するかを特定する項目特定ステップと、前記処理対象データに含まれる項目のうち前記項目特定ステップにおいて対応する定義済項目を特定できない項目である未特定項目が有る場合、前記未特定項目について、前記処理対象データに含まれる項目同士の関係に基づいて、前記フォーマット情報において前記未特定項目が対応する候補となる定義済項目である候補項目を特定する候補特定ステップと、前記未特定項目と、前記候補特定ステップにおいてが特定された候補項目と、を対応付けて出力するステップと、を実行させる。
【発明の効果】
【0015】
本発明によれば、事前に変換プロファイルが定義されていない項目を含む事務処理対象のデータを処理するためのコストを低減するという効果を奏する。
【図面の簡単な説明】
【0016】
【
図1】実施形態にかかる情報処理システムSの概要を説明するための図である。
【
図2】情報処理装置1の構成を示すブロック図である。
【
図3】記憶部12が記憶するフォーマット情報のデータ構造の一例を示す図である。
【
図4】取得部131が取得する処理対象データの一例を示す図である。
【
図5】出力部134が出力する画面の一例を示す図である。
【
図6】情報処理装置1における処理の流れを示すフローチャートである。
【発明を実施するための形態】
【0017】
[情報処理システムSの概要]
図1は、情報処理システムSの概要を説明するための図である。情報処理システムSは、事務処理を支援するためのシステムである。情報処理システムSは、情報処理装置1及び情報端末2を有する。情報処理装置1及び情報端末2は、ネットワークを介して通信可能に接続されている。情報処理システムSにおいては、さらに取得したデータに対する後続の処理を実行する装置がさらに含まれていてもよい。
【0018】
情報処理装置1は、処理対象のデータ(以下、「処理対象データ」と言う)を取得し、取得した処理対象データに含まれるそれぞれの項目をネットワーク上で交換可能なデータにマッピングするための装置である。より具体的には、情報処理装置1は、フォーマット情報を記憶している。フォーマット情報については後述するが、情報処理システムSにおいて処理可能なデータを示す。処理対象データは、事務処理の対象の書類の電子データである。処理対象データは一例として、発注書、納品書、請求書等の証憑や、契約書等であるがこれに限られない。
【0019】
情報端末2は、ユーザが使用する端末装置である。情報端末2は、処理対象データを情報処理装置1に送信する。情報端末2は、情報処理装置1から取得した情報に基づいて、処理対象データの項目と、フォーマット情報に含まれる項目と、のマッピングの候補をユーザが確認するための画面を表示する。なお、情報処理システムSのユーザは、処理対象データを使用した事務処理をする事業者における担当者である。
【0020】
情報処理システムSにおける処理について説明する。情報処理装置1は、処理対象データを取得する(
図1における(1))。情報処理装置1は、処理対象データに含まれる複数の項目それぞれについて、対応する定義済み項目を特定する(
図1における(2))。一例として、情報処理装置1は、処理対象データに含まれる項目の名称に基づいて、対応する定義済み項目を特定する。
【0021】
情報処理装置1は、処理対象データに含まれる項目のうち、対応する定義済み項目を特定できない項目を未特定項目として特定する(
図1における(3))。情報処理装置1は、未特定項目に対応する候補項目として特定する(
図1における(4))。候補項目は、フォーマット情報において未特定項目が対応する候補となる定義済項目である。一例として、情報処理装置1は、フォーマット情報に含まれる定義済み項目が示す内容と、未特定項目と、定義済み項目を特定済みの項目との関係に基づいて、候補項目を特定する。情報処理装置1は、候補項目を出力する(
図1における(5))。一例として、情報処理装置1は、未特定項目と、候補項目と、を対応付けて情報端末2に表示させる。
【0022】
情報処理装置1は、情報端末2を介して候補項目を未特定項目に対応する項目として確定させる操作を受付けた場合、情報処理装置1は、当該項目の名称を当該候補項目の名称で置換した処理対象データを生成する。情報処理装置1は、一例として、置換した処理対象データを、後続処理を実行する装置に出力してもよい。
【0023】
情報処理システムSがこのように構成されることで、事前に変換プロファイルが定義されていない項目を含む事務処理対象のデータを処理するための手間を低減するという効果を奏する。
【0024】
[情報処理装置1の構成]
図2は、情報処理装置1の構成を示すブロック図である。情報処理装置1は、通信部11、記憶部12及び制御部13を有する。制御部13は、取得部131、項目特定部132、候補特定部133、出力部134及び位置特定部135を有する。
【0025】
通信部11は、ネットワークを介して他の装置とデータの送受信をするための通信インターフェースである。記憶部12は、ROM(Read Only Memory)、RAM(Random Access Memory)、SSD(Solid State Drive)、ハードディスクドライブ等を含む記憶媒体である。記憶部12は、制御部13が実行するプログラムを予め記憶している。
【0026】
記憶部12は、複数の定義済みの項目である定義済項目を含むフォーマット情報を記憶する。
図3は、記憶部12が記憶するフォーマット情報のデータ構造の一例を示す図である。フォーマット情報においては、「項目ID」、「項目名」、「データ型」、「定義」及び「関連項目」を含む。「項目ID」は、定義済み項目を識別するID(Identificatoin)である。「項目名」は、定義済み項目の項目名を示す。「データ型」は、当該定義済み項目において許容されるデータ型を示す。「定義」は、当該定義済み項目が示す内容、他の項目との関係を示す。定義においては、一例として、当該項目が他の定義済み項目との間で満たすべき計算式を含む。「関連項目」は、当該定義済み項目の値を算出するために参照される項目の項目IDを示す。定義においては、当該定義済み項目が取り得る値が含まれていてもよい。
【0027】
制御部13は、例えばCPU(Central Processing Unit)等のプロセッサである。制御部13は、記憶部12に記憶されたプログラムを実行することにより、取得部131、項目特定部132、候補特定部133、出力部134及び位置特定部135として機能する。
【0028】
取得部131は、複数の項目が含まれる処理対象データを取得する。
図4は、取得部131が取得する処理対象データの一例を示す図である。処理対象データにおいては、複数の項目を含み、それぞれの項目について項目名と、当該項目についての値と、を含む。一例として、取得部131は、情報端末2から処理対象データを取得する。取得部131は、不図示の外部装置から処理対象データを取得してもよい。なお、取得部131は、書類の画像データを取得し、取得した画像データをOCR処理することにより処理対象データを取得してもよい。
【0029】
項目特定部132は、処理対象データに含まれる複数の項目それぞれの名称に基づいて、複数の項目それぞれがフォーマット情報に含まれる定義済項目のいずれに対応するかを特定する。項目特定部132は、処理対象データに含まれる項目それぞれの名称と、フォーマット情報に含まれる「項目名」において一致する名称を有する項目を、それぞれの項目に対応する定義済み項目として特定する。項目特定部132は、処理対象データに含まれる項目のうち、名称に基づいて定義済み項目を特定できない項目を未特定項目として特定する。一例として、
図4に示す処理対象データにおいては、「合計額」が定義済み項目のいずれにも一致しないため、未特定項目として特定する。なお、後述するように項目特定部132は、処理対象データに含まれる項目の意味に基づいて処理対象データに含まれる項目に対応する定義済み項目を特定してもよい。
【0030】
候補特定部133は、処理対象データに含まれる項目のうち項目特定部132が対応する定義済項目を特定できない項目である未特定項目が有る場合、未特定項目について、候補項目を特定する。一例として、候補特定部133は未特定項目について、処理対象データに含まれる項目同士の関係に基づいて、フォーマット情報において未特定項目が対応する候補となる定義済項目である候補項目を特定する。すなわち、候補特定部133は、未特定項目と、対応する定義済み項目が特定された他の項目(以下、特定済み項目と言う)との関係が、いずれかの定義済み項目についての「定義」が示す関係と合致するか否かを判定する。候補特定部133は、未特定項目と、特定済み項目と、の関係が「定義」が示す関係に合致する定義済み項目を、未特定項目に対応する候補項目として特定する。また、候補特定部133は、後述するように項目同士の距離に基づいて候補項目を特定してもよい。
【0031】
出力部134は、未特定項目と、候補特定部133が特定した候補項目と、を対応付けて出力する。出力部134は、未特定項目に対応する候補項目を確定させるための画面を情報端末2に表示させる。
図5は、出力部134が表示させる画面の一例を示す図である。
図5に示す画面においては、未特定項目と、候補特定部133が特定した候補項目と、が表示されている。ユーザが情報端末2において、未特定項目と、候補項目を対応付ける操作をすると(例えば、
図5に示す画面における「OK」と表示されたボタンが押された場合)、出力部134は、処理対象データにおける未特定項目と、特定された候補項目とをマッピングさせる。一例として、出力部134は、処理対象データにおける未特定項目の項目名を、特定された候補項目の項目名で置換した処理対象データを生成する。出力部134は、生成した置換後の処理対象データを記憶部12に記憶させてもよいし、処理対象データの後続処理を行う外部装置に出力してもよい。
【0032】
なお、候補特定部133は、1の未特定項目について、複数の候補項目を特定してもよい。候補特定部133が複数の候補項目を特定した場合、出力部134は、特定した複数の候補項目から未特定項目に対応する定義済み項目を選択させるための画面を表示してもよい。この場合、出力部134は、処理対象データにおける未特定項目の項目名を、表示された画面においてユーザが選択した候補項目で置換した処理対象データを生成する。
【0033】
また、候補特定部133が未特定項目に対応する候補項目を特定できない場合、出力部134は、未特定項目に対応する候補項目を特定できないことを警告するアラートを情報端末2に表示させる。
【0034】
情報処理装置1がこのように構成されることで、事前に変換プロファイルが定義されていない項目を含む事務処理対象のデータを処理するための手間を低減するという効果を奏する。
【0035】
情報処理装置1は、項目の名称が有する意味に基づいて処理対象データに含まれる項目に対応する定義済み項目を特定してもよい。
【0036】
項目特定部132は、複数の項目の名称それぞれが示す意味に基づいて、複数の項目それぞれが対応する定義済項目を特定する。一例として、項目特定部132は、処理対象データに含まれる項目の名称を既知の自然言語処理技術を用いて、処理対象データに含まれる項目の項目名それぞれが有する意味と類似する項目名を有する項目を特定する。より具体的には、項目特定部132は、処理対象データに含まれる項目の項目名それぞれについて、フォーマット情報に含まれる定義済み項目それぞれとの類似度を算出し、類似度が所定の閾値以上である定義済み項目を、処理対象データに含まれる項目に対応する定義済み項目として特定する。
【0037】
情報処理装置1がこのように構成されることで、項目の名称が完全に一致していない場合であっても対応する定義済み項目を特定することができる。その結果、情報処理装置1においては、事前に変換プロファイルが定義されていない項目を含む事務処理対象のデータを定義済みのデータとマッピングさせやすくない、データを処理するための手間を低減することができる。
【0038】
フォーマット情報において定義済み項目の算出方法が定義されている場合には、当該算出方法と一致する場合に、未特定項目に対応する定義済み項目として特定するよう情報処理装置1が構成されてもよい。
【0039】
取得部131は、複数の項目のうちの少なくともいずれかに関連付けられた金額をさらに含む処理対象データを取得する。
図4に示す処理対象データにおいては、「商品1」の「小計」、「商品2」の「小計」、「合計額(税抜き)」、「合計額(10%対象)」、「合計額(8%対象)」、「消費税額合計」、「消費税額合計(10%)、「消費税額合計(8%)」及び「合計額」において金額が関連付けられている。
【0040】
図4に示す処理対象データにおいては、「合計額」の項目がフォーマット情報に含まれる項目名と対応していないため、項目特定部132の処理の結果、「合計額」の項目が未特定項目として特定される。そして、候補特定部133は、金額を演算した結果に基づいて、未特定項目に対応する候補項目を特定する。すなわち、候補特定部133は、未特定項目に関連付けられた金額が、処理対象データに含まれる他の1以上の項目に関連付けられた金額を、フォーマット情報に含まれる特定の定義済み項目に関連付けられた関連項目を特定し、関連項目同士の演算方法に基づいて演算した結果と一致するか否かを判定する。候補特定部133は、判定した結果が一致する場合、当該定義済み項目を未特定項目の候補項目として特定する。
【0041】
具体的には、候補特定部133は、「合計額」の項目に関連付けられた金額と、他の特定済みの項目と、がフォーマット情報に含まれるいずれかの定義済み項目の「定義」が示す計算式を満たす場合に、当該定義済み項目を「合計額」の候補項目として特定する。具体的には、「請求額合計」の関連項目は、「合計額(税抜き)」と「消費税額合計」であり、「合計額(税抜き)」の金額は「150,000円」であり、「消費税額合計」の金額は、「13,000円」である。そして、処理対象データにおける「合計額」の金額「163,000円」と、「合計額(税抜き)」の金額「150,000円」と、「消費税額合計」の金額「13,000円」と、は、フォーマット情報における「請求額合計」に関連付けられた「定義」における「合計額(税抜き)+消費税額合計」との関係を満たすため、候補特定部133は、処理対象データにおける定義済み項目のうち「請求額合計」を未特定項目である「合計額」の候補項目として特定する。
【0042】
情報処理装置1がこのように構成されることで、事前に定義されていない項目を含む事務処理対象のデータを定義済みの項目にマッピングさせることができる。
【0043】
未特定項目が含まれる位置に基づいて候補項目を特定するよう情報処理装置1が構成されることで、事前に変換プロファイルを定めておかなくてもデータをマッピングできる場合がある。
【0044】
位置特定部135は、処理対象データに含まれる項目それぞれが処理対象データにおいて配置された位置を特定する。項目それぞれが処理対象データにおいて配置された位置は、一例として、処理対象データにおける項目の順序であってもよい。また、処理対象データが入力された画像データをOCR処理して取得した場合においては、当該画像データに当該項目が配置された座標であってもよい。
【0045】
候補特定部133は、未特定項目が処理対象データにおいて配置された位置に基づいて、未特定項目に対応する候補項目を特定する。例えば、処理対象データに日付を示す項目が含まれていて、対応する定義済み項目を項目特定部132が特定できない場合、当該日付が含まれる位置と、「書類番号」が含まれる位置と、が予め定められた閾値以上近い場合に「発行日」を当該日付の候補項目として特定する。また、同様の場合であって、日付が含まれる位置と、「振込先情報」が含まれる位置と、が予め定められた閾値以上近い場合に「支払期日」を当該日付の候補項目として特定する。
【0046】
候補項目としての確からしさを示すスコアが表示するよう情報処理装置1が構成されてもよい。
【0047】
出力部134は、未特定項目と、候補特定部133が特定した候補項目と、が対応する蓋然性の高さを示すスコアをさらに出力する。すなわち、候補特定部133は、当該候補項目についてのスコアを算出する。スコアは一例として、未特定項目の項目名と、候補項目の項目名の類似度に基づいて算出される。候補特定部133はさらに、当該未特定項目と、当該候補項目に関連する他の項目と、の位置関係に基づいてスコアを算出してもよい。出力部134は、候補項目を表示する画面において、当該候補項目について算出したスコアをさらに表示させてもよい。
【0048】
情報処理装置1がこのように構成されることで、ユーザは特定された候補項目が未特定項目に対応するか否かを判断しやすくなるという効果を奏する。
【0049】
未特定項目に対応する候補項目が特定できない場合、当該未特定項目に設定すべき名称を表示するよう情報処理装置1が構成されてもよい。
【0050】
出力部134は、候補特定部133が、未特定項目に対応する候補項目を特定できない場合、未特定項目に設定すべき名称を表示させる。一例として、記憶部12においては、処理対象データと、処理対象データにおいて名称を設定すべき項目と、を入力すると、当該項目に設定すべき名称を出力するよう学習された学習済みモデルが記憶されており、出力部134は、処理対象データと、未特定項目と、を記憶部12が記憶する学習済みモデルに入力し、出力された名称を情報端末2に表示させる。ユーザが、情報端末2を操作し、当該名称を確定させる操作をした場合、未特定項目の名称を学習済みモデルが出力した名称で置換した処理対象データを生成する。
【0051】
情報処理装置1がこのように構成されることで、未特定項目に対応するユーザの負担を軽減することができる。
【0052】
[情報処理装置1における処理の流れ]
図6は、情報処理装置1における処理の流れを示すフローチャートである。
図6におけるフローチャートは、処理対象データを取得した時点から開始している。
【0053】
取得部131は、処理対象データを取得する(S01)。項目特定部132は、取得した処理対象データに含まれる項目それぞれについて、フォーマット情報において対応する定義済み項目を特定する(S02)。項目特定部132は、処理対象データに含まれる項目のうち、対応する定義済み項目を特定できない項目を、未特定項目として特定する(S03)。
【0054】
候補特定部133は、未特定項目に対応する候補項目を特定する(S04)。出力部134は、未特定項目に対応する候補項目が特定されたか否かを判定する(S05)。候補項目が特定された場合(S05におけるYES)、出力部134は、未特定項目に対応する定義済み項目を確定するための画面を情報端末2に出力する(S06)。出力部134は、情報端末2に表示された画面において、候補特定部133が特定した候補項目と、を対応付けて出力する。出力部134は、出力部134は、未特定項目に対応する定義済み項目を確定する操作がされた場合、未特定項目の名称を候補項目の名称で置換した処理対象データを記憶部12に記憶させてもよいし、後続処理を実行する装置に置換後の処理対象データを出力してもよい。そして、情報処理装置1は、処理を終了する。
【0055】
候補項目が特定されない場合(S05におけるNO)、出力部134は、処理対象データがフォーマット情報に含まれる項目とマッピングできない項目を含むことを示すアラートを出力する(S07)。そして、情報処理装置1は、処理を終了する。
【0056】
[本実施の形態における効果]
以上説明したとおり、情報処理装置1においては、事前に変換プロファイルが定義されていない項目を含む事務処理対象のデータを処理するための手間を低減するという効果を奏する。
【0057】
以上、実施の形態を用いて本発明を説明したが、本発明の技術的範囲は上記実施の形態に記載の範囲には限定されず、その要旨の範囲内で種々の変形及び変更が可能である。例えば、装置の全部又は一部は、任意の単位で機能的又は物理的に分散・統合して構成することができる。また、複数の実施の形態の任意の組み合わせによって生じる新たな実施の形態も、本発明の実施の形態に含まれる。組み合わせによって生じる新たな実施の形態の効果は、もとの実施の形態の効果を併せ持つ。
【符号の説明】
【0058】
1 情報処理装置
11 通信部
12 記憶部
13 制御部
131 取得部
132 項目特定部
133 候補特定部
134 出力部
135 位置特定部
【要約】
複数の定義済みの項目である定義済項目を含むフォーマット情報を記憶する記憶部12と、複数の項目が含まれる処理対象データを取得する取得部131と、処理対象データに含まれる複数の項目それぞれの名称に基づいて、複数の項目それぞれがフォーマット情報に含まれる定義済項目のいずれに対応するかを特定する項目特定部132と、処理対象データに含まれる項目のうち項目特定部132が対応する定義済項目を特定できない項目である未特定項目が有る場合、未特定項目について、フォーマット情報において未特定項目が対応する候補となる定義済項目である候補項目を特定する候補特定部133と、未特定項目と、候補特定部133が特定した候補項目と、を対応付けて出力する出力部134と、を有する情報処理装置1である。