IP Force 特許公報掲載プロジェクト 2022.1.31 β版

知財求人 - 知財ポータルサイト「IP Force」

▶ シャープ株式会社の特許一覧

特開2024-153992情報処理装置、出力装置、情報処理方法、及び情報処理プログラム
<>
  • 特開-情報処理装置、出力装置、情報処理方法、及び情報処理プログラム 図1
  • 特開-情報処理装置、出力装置、情報処理方法、及び情報処理プログラム 図2
  • 特開-情報処理装置、出力装置、情報処理方法、及び情報処理プログラム 図3
  • 特開-情報処理装置、出力装置、情報処理方法、及び情報処理プログラム 図4
  • 特開-情報処理装置、出力装置、情報処理方法、及び情報処理プログラム 図5
  • 特開-情報処理装置、出力装置、情報処理方法、及び情報処理プログラム 図6
  • 特開-情報処理装置、出力装置、情報処理方法、及び情報処理プログラム 図7
  • 特開-情報処理装置、出力装置、情報処理方法、及び情報処理プログラム 図8
  • 特開-情報処理装置、出力装置、情報処理方法、及び情報処理プログラム 図9
  • 特開-情報処理装置、出力装置、情報処理方法、及び情報処理プログラム 図10
  • 特開-情報処理装置、出力装置、情報処理方法、及び情報処理プログラム 図11
< >
(19)【発行国】日本国特許庁(JP)
(12)【公報種別】公開特許公報(A)
(11)【公開番号】P2024153992
(43)【公開日】2024-10-30
(54)【発明の名称】情報処理装置、出力装置、情報処理方法、及び情報処理プログラム
(51)【国際特許分類】
   G06V 30/194 20220101AFI20241023BHJP
   G06V 30/412 20220101ALI20241023BHJP
【FI】
G06V30/194
G06V30/412
【審査請求】未請求
【請求項の数】12
【出願形態】OL
(21)【出願番号】P 2023067556
(22)【出願日】2023-04-18
(71)【出願人】
【識別番号】000005049
【氏名又は名称】シャープ株式会社
(74)【代理人】
【識別番号】100167302
【弁理士】
【氏名又は名称】種村 一幸
(74)【代理人】
【識別番号】100135817
【弁理士】
【氏名又は名称】華山 浩伸
(74)【代理人】
【識別番号】100181869
【弁理士】
【氏名又は名称】大久保 雄一
(72)【発明者】
【氏名】小西 陽介
【テーマコード(参考)】
5B029
5B064
【Fターム(参考)】
5B029CC26
5B064DA27
5B064EA11
(57)【要約】
【課題】書類の入力データから書類の入力項目を認識する認識精度を向上させることが可能な情報処理装置、出力装置、情報処理方法、及び情報処理プログラムを提供する。
【解決手段】情報処理装置は、書類の入力データから学習済みモデルを利用して前記書類の所定項目を特定する特定処理部と、前記特定処理部により特定される前記所定項目を修正するユーザー操作が受け付けられた場合に、修正された前記所定項目の修正項目情報と、前記書類に含まれる複数の項目のうち前記所定項目に関連する関連項目の入力情報とを互いに関連付けた学習用データを生成する生成処理部と、前記生成処理部により生成される前記学習用データを用いて前記学習済みモデルを更新する学習処理部と、を備える。
【選択図】図1
【特許請求の範囲】
【請求項1】
書類の入力データから学習済みモデルを利用して前記書類の所定項目を特定する特定処理部と、
前記特定処理部により特定される前記所定項目を修正するユーザー操作が受け付けられた場合に、修正された前記所定項目の修正項目情報と、前記書類に含まれる複数の項目のうち前記所定項目に関連する関連項目の入力情報とを互いに関連付けた学習用データを生成する生成処理部と、
前記生成処理部により生成される前記学習用データを用いて前記学習済みモデルを更新する学習処理部と、
を備える情報処理装置。
【請求項2】
前記所定項目は、前記書類に含まれる複数の項目のうち前記書類の種別を表す項目である、
請求項1に記載の情報処理装置。
【請求項3】
前記特定処理部により特定される前記所定項目を修正する場合に、予め登録された複数の項目候補を選択可能に表示させて、いずれかの項目候補を選択する前記ユーザー操作を受け付ける、
請求項1に記載の情報処理装置。
【請求項4】
前記項目候補を選択する前記ユーザー操作を受け付けた場合に、前記関連項目を、ユーザーにより選択された前記項目候補に関連する関連項目に変更する、
請求項3に記載の情報処理装置。
【請求項5】
前記関連項目に対するユーザーの入力操作に基づいて前記入力情報を取得する、
請求項1に記載の情報処理装置。
【請求項6】
前記生成処理部は、前記入力情報のテキストデータをベクトル化したベクトルデータと、前記修正項目情報とを互いに関連付けて前記学習用データを生成する、
請求項1に記載の情報処理装置。
【請求項7】
前記生成処理部は、前記所定項目に入力されたテキスト情報に合致する箇所の周辺を優先的に前記入力データのテキスト情報から抽出し、抽出したテキスト情報を所定の学習済みモデルを利用してベクトル化し、ベクトル化したベクトルデータと、前記所定項目に入力された前記テキスト情報とを関連付けて、前記学習用データを生成する、
請求項1に記載の情報処理装置。
【請求項8】
前記入力データを取得すると前記入力データに対応するファイルを第1フォルダに記憶し、前記入力情報を取得すると前記ファイルを前記第1フォルダから第2フォルダに移動する、
請求項1に記載の情報処理装置。
【請求項9】
前記学習処理部は、前記学習用データのデータ数が所定数以上になった場合、又は、予め設定された実行タイミングが到来した場合に、前記学習用データを用いて機械学習を行うことにより前記学習済みモデルを更新する、
請求項1に記載の情報処理装置。
【請求項10】
請求項1~9のいずれかに記載の情報処理装置により生成される前記学習済みモデルを用いて、前記書類の入力データに対して、前記書類の所定項目の項目情報と、前記所定項目に関連する関連項目の入力情報とを抽出する処理を実行し、抽出した前記項目情報及び前記入力情報を出力する出力装置。
【請求項11】
書類の入力データから学習済みモデルを利用して前記書類の所定項目を特定することと、
特定される前記所定項目を修正するユーザー操作を受け付けた場合に、修正された前記所定項目の修正項目情報と、前記書類に含まれる複数の項目のうち前記所定項目に関連する関連項目の入力情報とを互いに関連付けた学習用データを生成することと、
生成される前記学習用データを用いて前記学習済みモデルを更新することと、
を一又は複数のプロセッサーが実行する情報処理方法。
【請求項12】
書類の入力データから学習済みモデルを利用して前記書類の所定項目を特定することと、
特定される前記所定項目を修正するユーザー操作を受け付けた場合に、修正された前記所定項目の修正項目情報と、前記書類に含まれる複数の項目のうち前記所定項目に関連する関連項目の入力情報とを互いに関連付けた学習用データを生成することと、
生成される前記学習用データを用いて前記学習済みモデルを更新することと、
を一又は複数のプロセッサーに実行させるための情報処理プログラム。
【発明の詳細な説明】
【技術分野】
【0001】
本開示は、書類の入力データに対して文字認識等の処理を実行する技術に関する。
【背景技術】
【0002】
従来、文書、帳票等の書類の画像から文字列を抽出する技術が知られている。例えば、帳票の記載事項と項目名との組を教師データとして機械学習した学習済みモデルを保持し、学習済みモデルに基づいて、帳票ファイルに含まれる記載事項のそれぞれが所定の項目名のいずれに対応するかを判定して表示し、記載事項と項目名との組が修正された場合に修正された情報を元に学習済みモデルを更新する技術が知られている(例えば特許文献1参照)。
【先行技術文献】
【特許文献】
【0003】
【特許文献1】特開2022-32831号公報
【発明の概要】
【発明が解決しようとする課題】
【0004】
しかし、従来の技術では、記載事項と項目名との組に対して修正された場合に修正された組を利用して学習済みモデルを更新しているため、更新された学習済みモデルを利用したとしても、帳票ファイルの種別を認識する認識精度を十分に向上させることができない。
【0005】
本開示の目的は、書類の入力データから書類の入力項目を認識する認識精度を向上させることが可能な情報処理装置、出力装置、情報処理方法、及び情報処理プログラムを提供することにある。
【課題を解決するための手段】
【0006】
本開示の一の態様に係る情報処理装置は、特定処理部と生成処理部と学習処理部とを備える。前記特定処理部は、書類の入力データから学習済みモデルを利用して前記書類の所定項目を特定する。前記生成処理部は、前記特定処理部により特定される前記所定項目を修正するユーザー操作が受け付けられた場合に、修正された前記所定項目の修正項目情報と、前記書類に含まれる複数の項目のうち前記所定項目に関連する関連項目の入力情報とを互いに関連付けた学習用データを生成する。前記学習処理部は、前記生成処理部により生成される前記学習用データを用いて前記学習済みモデルを更新する。
【0007】
本開示の他の態様に係る出力装置は、前記情報処理装置により生成される前記学習済みモデルを用いて、書類の入力データに対して、前記書類の所定項目の項目情報と、前記所定項目に関連する関連項目の入力情報とを抽出する処理を実行し、抽出した前記項目情報及び前記入力情報を出力する。
【0008】
本開示の他の態様に係る情報処理方法は、書類の入力データから学習済みモデルを利用して前記書類の所定項目を特定することと、特定される前記所定項目を修正するユーザー操作を受け付けた場合に、修正された前記所定項目の修正項目情報と、前記書類に含まれる複数の項目のうち前記所定項目に関連する関連項目の入力情報とを互いに関連付けた学習用データを生成することと、生成される前記学習用データを用いて前記学習済みモデルを更新することと、を一又は複数のプロセッサーが実行する方法である。
【0009】
本開示の他の態様に係る情報処理プログラムは、書類の入力データから学習済みモデルを利用して前記書類の所定項目を特定することと、特定される前記所定項目を修正するユーザー操作を受け付けた場合に、修正された前記所定項目の修正項目情報と、前記書類に含まれる複数の項目のうち前記所定項目に関連する関連項目の入力情報とを互いに関連付けた学習用データを生成することと、生成される前記学習用データを用いて前記学習済みモデルを更新することと、を一又は複数のプロセッサーに実行させるためのプログラムである。
【発明の効果】
【0010】
本開示によれば、書類の入力データから書類の入力項目を認識する認識精度を向上させることが可能な情報処理装置、出力装置、情報処理方法、及び情報処理プログラムを提供することができる。
【図面の簡単な説明】
【0011】
図1図1は、本開示の実施形態に係る情報処理装置の構成を示す機能ブロック図である。
図2図2は、本開示の実施形態に係る文書の一例(見積書)を示す図である。
図3図3は、本開示の実施形態に係るファイル情報データベースの一例を示す図である。
図4図4は、本開示の実施形態に係る未登録ファイルリストページの一例を示す図である。
図5図5は、本開示の実施形態に係る詳細ページの一例を示す図である。
図6図6は、本開示の実施形態に係る詳細ページの一例を示す図である。
図7図7は、本開示の実施形態に係る登録ファイルリストページの一例を示す図である。
図8図8は、本開示の実施形態に係る詳細ページの一例を示す図である。
図9図9は、本開示の実施形態に係る詳細ページの一例を示す図である。
図10図10は、本開示の実施形態に係る情報処理装置において実行される情報処理(ファイル情報登録処理)の手順の一例を示すフローチャートである。
図11図11は、本開示の実施形態に係る情報処理装置において実行される情報処理(学習用データ生成処理)の手順の一例を示すフローチャートである。
【発明を実施するための形態】
【0012】
以下、添付図面を参照しながら、本開示の実施形態について説明する。なお、以下の実施形態は、本開示を具体化した一例であって、本開示の技術的範囲を限定する性格を有さない。
【0013】
[情報処理装置1]
図1は、本開示の実施形態に係る情報処理装置1の構成を示すブロック図である。情報処理装置1は、帳票などの書類(図2参照)の入力データから書類の入力項目を認識する学習済みモデル(以下、分類用学習済みモデルという。)を利用して入力データから入力項目を認識し、認識結果を利用して、再学習に利用される学習用データ(教師データ)を生成する処理を実行する。また、情報処理装置1は、前記学習用データを利用して機械学習(再学習)を行って前記分類用学習済みモデルを更新する。
【0014】
図1に示すように、情報処理装置1は、制御部11、記憶部12、操作表示部13、通信部14などを備える。情報処理装置1は、1台又は複数台のクラウドサーバーであってもよいし、1台又は複数台の物理サーバーであってもよい。情報処理装置1は、例えばパーソナルコンピュータ、NAS(Network Attached Storage)などで構成されてもよい。
【0015】
通信部14は、情報処理装置1を有線又は無線でネットワークN1に接続し、ネットワークN1を介してユーザー端末2等の外部機器との間で所定の通信プロトコルに従ったデータ通信を実行するための通信インターフェースである。ネットワークN1は、例えばインターネット、LANなどで構成される。
【0016】
操作表示部13は、各種の情報を表示する液晶ディスプレイ又は有機ELディスプレイのような表示部と、操作を受け付けるマウス、キーボード、又はタッチパネルなどの操作部とを備えるユーザーインターフェースである。
【0017】
記憶部12は、各種の情報を記憶するHDD(Hard Disk Drive)、SSD(Solid State Drive)、又はフラッシュメモリーなどの不揮発性の記憶部である。記憶部12には、制御部11に後述の情報処理(図10及び図11参照)を実行させるための情報処理プログラム(本開示の情報処理プログラムの一例)などの制御プログラムが記憶されている。例えば、前記情報処理プログラムは、CD又はDVDなどのコンピュータ読取可能な記録媒体に非一時的に記録され、情報処理装置1が備えるCDドライブ又はDVDドライブなどの読取装置(不図示)で読み取られて記憶部12に記憶される。なお、前記情報処理プログラムは、クラウドサーバーから配信されて記憶部12に記憶されてもよい。
【0018】
また、記憶部12には、ユーザー端末2等から取得する書類(図2参照)等の入力データ(ファイル121)が記憶される。前記入力データは、例えば書類をスキャンした画像データである。ファイル121は、記憶部12において、階層構造を有するフォルダに振り分けて格納される(図4参照)。
【0019】
また、記憶部12には、ファイル情報データベース122が含まれる。ファイル情報データベース122には、ファイル121に関する情報が登録される。図3は、ファイル情報データベース122の一例である。ファイル情報データベース122には、ファイル名、予測区分、格納場所、登録区分、入力情報などが関連付けられて登録される。前記ファイル名は、ファイル121の名称、IDなどの識別情報である。前記予測区分は、ファイル121の種別を表す「区分」を制御部11が予測した情報である。ここで、「区分」は、例えばファイル121の種別を表す一つの項目であり、図2の書類の場合、区分は「見積書」である。他の例として、書類が請求書の場合、区分は「請求書」であり、書類が納品書の場合、区分は「納品書」であり、書類が注文書の場合、区分は「注文書」である。
【0020】
制御部11は、記憶部12に記憶されているベクトル化用学習済みモデル123及び分類用学習済みモデル124を利用して書類の区分を予測する(詳細は後述する)。制御部11は、予測した区分の情報をファイル情報データベース122の「予測区分」に登録する。
【0021】
前記格納場所は、ファイル121の格納先を示す情報である。例えば、制御部11は、ファイル121を取得すると取込フォルダ(図4参照)に格納する。また、制御部11は、取込フォルダに格納されているファイル121の区分を予測するとファイル121を未登録フォルダ(図4参照)に移動する。また、制御部11は、未登録フォルダに格納されているファイル121の学習用データを生成するとファイル121を所定の登録フォルダ(図4参照)に移動する。制御部11は、各ファイル121について、格納場所を示すフォルダ名をファイル情報データベース122の「格納場所」に登録する。なお、制御部11は、「格納場所」に、ネットワークN1を介してファイル121にアクセス可能なアクセス情報(URLなど)を登録してもよい。
【0022】
前記登録区分は、ファイル121について確定された「区分」の情報である。例えば、制御部11は、予測した区分が正しい場合に予測した区分と同じ情報を「登録区分」に登録する。制御部11は、予測区分に対してユーザーが所定の確認操作を行った場合に、予測区分が正しいと判断して予測区分と同じ情報を「登録区分」に登録する。また例えば、予測した区分に対してユーザーが修正した場合には、制御部11は、ユーザーにより修正された区分の情報を「登録区分」に登録する。図3に示す「ファイルF3」は、予測区分「見積書」に対してユーザーが「請求書」に修正した例を示している。
【0023】
前記入力情報は、ファイル121に含まれる複数の入力項目のそれぞれに対応する情報(テキスト情報)である。前記入力情報には、必須の入力項目に関する情報、ファイル121の種別に応じた入力項目(関連項目)に関する情報などが含まれる。例えば、必須入力項目には、取引年月日、取引先、取引金額などが含まれる。また、「見積書」の関連項目には、有効期限、納期などが含まれ、「請求書」の関連項目には支払期限、振込先などが含まれ、「納品書」の関連項目には担当者名などが含まれる。
【0024】
制御部11は、入力項目に対するユーザーの入力操作に基づいて入力情報を取得すると、取得した入力情報をファイル情報データベース122の「入力情報」に登録する。また、制御部11は、学習済みモデルを利用して入力データ(ファイル121)から入力項目に対応する入力情報(テキスト情報)を抽出し、抽出した入力情報を「入力情報」に登録する。制御部11は、前記入力情報を文字認識結果として出力したり、帳票データベース(不図示)に登録したりする。
【0025】
ファイル情報データベース122には、上述の情報に加えて、ファイル121の属性に関する属性情報(作成日時、更新日時、登録日時、サイズ、アプリケーションの種類、作成者など)が含まれてもよい。
【0026】
また、記憶部12には、ベクトル化用学習済みモデル123と分類用学習済みモデル124とが記憶されている。ベクトル化用学習済みモデル123は、文字列、文章などに対する固定長の特徴を表すベクトルデータを取得するために利用される学習済みモデルである。ベクトル化用学習済みモデル123には、周知の学習済みモデルを適用することができる。分類用学習済みモデル124は、ベクトルデータに対する「区分」を正解データとして教師あり学習により構築される区分分類用の学習済みモデルである。本実施形態では、制御部11は、分類用学習済みモデル124を再学習して更新する構成を備えている。
【0027】
記憶部12は、NASなどのデータサーバーで構成され、情報処理装置1にネットワークN1を介して接続されてもよい。
【0028】
図2には、書類の一例として見積書を示している。図2に示すように、見積書には、書類の区分(「見積書」)、発行日、宛先、見積者の連絡先、見積額、商品名、数量、標準価格、値引き額、小計、消費税、合計金額など、複数の文字列が含まれる。また、見積書には、見積書の作成者などが押印した印章が含まれる。ユーザーは、ユーザー端末2(外部機器)において、前記見積書をスキャンして画像データを情報処理装置1にアップロードする。制御部11は、見積書の画像データ(入力データ)を取得すると記憶部12の取込フォルダに記憶する。他の実施形態として、制御部11は、ユーザー端末2において作成された見積書の文書ファイルを取得し、当該文書ファイルを記憶部12に記憶してもよい。
【0029】
制御部11は、CPU、ROM、及びRAMなどの制御機器を有する。前記CPUは、各種の演算処理を実行するプロセッサーである。前記ROMは、前記CPUに各種の処理を実行させるためのBIOS及びOSなどの制御プログラムを予め記憶する。前記RAMは、各種の情報を記憶し、前記CPUが実行する各種の処理の一時記憶メモリー(作業領域)として使用される。そして、制御部11は、前記ROM又は記憶部12に予め記憶された各種の制御プログラムを前記CPUで実行することにより情報処理装置1を制御する。
【0030】
具体的には、制御部11は、図1に示すように、特定処理部111、表示処理部112、受付処理部113、登録処理部114、生成処理部115、学習処理部116などの各種の処理部を含む。なお、制御部11は、前記情報処理プログラムに従った各種の処理を実行することによって前記各種の処理部として機能する。また、制御部11に含まれる一部又は全部の処理部が電子回路で構成されていてもよい。なお、前記情報処理プログラムは、複数のプロセッサーを前記各種の処理部として機能させるためのプログラムであってもよい。
【0031】
制御部11は、入力データを取得する。具体的には、制御部11は、ユーザー端末2からアップロードされた書類の入力データ(画像データ)を取得する。制御部11は、入力データを取得すると、入力データに対応するファイル121を記憶部12の取込フォルダに記憶する。また、制御部11は、ファイル121の属性情報(ファイル名など)を取得し、当該属性情報をファイル情報データベース122に登録する(図3参照)。また、制御部11は、ファイル121の格納場所として「取込フォルダ」を、ファイル情報データベース122の「格納場所」に登録する(図3参照)。
【0032】
制御部11は、入力データ(ファイル121)を取得するごとに、ファイル121を取込フォルダに格納するとともに、ファイル121の属性情報をファイル情報データベース122に登録する。
【0033】
特定処理部111は、書類の入力データについて、学習済みモデルを利用して書類の区分(本開示の所定項目の一例)を特定する。なお、本開示の所定項目は、書類に含まれる複数の項目のうち書類の種別を表す項目である。本実施形態では、所定項目は、例えば書類の区分である。本開示の所定項目は、書類の種別を表す項目に限定されず、他の項目であってもよい。
【0034】
具体的には、特定処理部111は、取込フォルダに格納されているファイル121を取得すると、ファイル121からテキスト情報を抽出してベクトル化用学習済みモデル123を利用してテキスト情報をベクトル化し、分類用学習済みモデル124を利用してベクトルデータに対する区分を予測する。特定処理部111は、予測した区分の情報をファイル情報データベース122の「予測区分」に登録する(図3参照)。また、制御部11は、ファイル121から抽出したテキスト情報をファイル情報データベース122の「入力情報」に登録する(図3参照)。
【0035】
また、特定処理部111は、取込フォルダに格納されているファイル121の区分を予測するとファイル121を未登録フォルダに移動し、ファイル情報データベース122の「格納場所」を更新する(図3参照)。特定処理部111は、取込フォルダに格納されているファイル121について、順次、区分を予測する処理を実行して未登録フォルダに移動する。なお、特定処理部111は、取込フォルダに格納されているファイル121について、ユーザーの指示(区分の予測指示)に応じて、区分を予測する処理を実行して未登録フォルダに移動してもよい。
【0036】
これにより、入力データが入力されると、当該入力データは区分(予測区分)が登録された後に、未登録フォルダに振り分けられる。
【0037】
表示処理部112は、各種情報を操作表示部13に表示させる。例えば、表示処理部112は、記憶部12に記憶された複数のファイル121を一覧にした画面(ファイルリストページ)を表示させる。図4には、未登録フォルダに格納されている複数のファイル121を一覧にした未登録ファイルリストページP1を示している。表示処理部112は、未登録ファイルリストページP1において、複数のファイル121を選択可能に表示させる。
【0038】
受付処理部113は、ユーザーから各種操作を受け付ける。例えば、ユーザーが未登録ファイルリストページP1において登録対象のファイル121を選択すると、受付処理部113は、ユーザーによるファイル121の選択操作を受け付ける。例えば図4に示す未登録ファイルリストページP1においてユーザーがファイルF3を選択すると、受付処理部113は、ユーザーによるファイルF3の選択操作を受け付けて、表示処理部112は、ファイルF3の詳細情報を含む詳細ページP2(図5参照)を表示させる。
【0039】
表示処理部112は、詳細ページP2の左側にファイルF3の画像を表示させ、詳細ページP2の右側にファイルF3に関する入力項目の情報を表示させる。例えば、表示処理部112は、詳細ページP2において、ファイルF3の登録日、サイズなどの属性情報と、取引年月日、取引先、及び取引金額を含む必須入力項目K0と、ファイルF3の種別を表す区分の入力項目K1と、区分に関連する項目(関連項目)である有効期限及び納期のそれぞれの入力項目K2、K3とを表示させる。
【0040】
ここで、表示処理部112は、ファイル121の種別に関わらず、予め設定された一又は複数の必須入力項目K0を表示させる。必須入力項目K0の内容は図5に示す例に限定されず、制御部11が適宜設定することが可能である。
【0041】
また、表示処理部112は、ファイル情報データベース122の「予測区分」に登録された区分の情報を入力項目K1に表示させる。図5に示す例では、表示処理部112は、ファイルF3に関連付けて「予測区分」として登録された「見積書」(図3参照)を、区分の入力項目K1に表示させる。
【0042】
また、表示処理部112は、詳細ページP2において、前記予測区分に関連する一又は複数の入力項目(関連項目)を表示させる。図5に示す例では、表示処理部112は、区分「見積書」に関連する関連項目である「有効期限」の入力項目K2と、「納期」の入力項目K3とを表示させる。
【0043】
なお、制御部11は、区分に関連する関連項目を、区分に対応付けて記憶部12に予め登録する。また、制御部11は、ユーザーの操作に応じて、区分に対する関連項目を設定及び更新してもよい。例えば、区分「見積書」に対して「有効期限」及び「納期」が関連項目として設定され、区分「請求書」に対して「支払期限」及び「振込先」が関連項目として設定され、区分「納品書」に対して「担当者名」が関連項目として設定される。
【0044】
表示処理部112は、詳細ページP2において、区分の入力項目K1に表示される区分情報に応じて、関連項目(入力項目K2、K3)の内容を切り替える。
【0045】
受付処理部113は、詳細ページP2において、ユーザーの入力操作を受け付ける。例えばユーザーは、詳細ページP2において、ファイル121の画像を確認しながら、必須入力項目K0に入力項目に関する情報を入力する。例えば図5に示す詳細ページP2において、ユーザーは、取引年月日、取引先、及び取引金額を入力する。また例えばユーザーは、詳細ページP2において、区分に関連する関連項目に関する情報を入力する。例えば図5に示す詳細ページP2において、ユーザーは、区分「見積書」の関連項目K2の有効期限と、区分「見積書」の関連項目K3の納期とを入力する(図6参照)。
【0046】
ユーザーは、詳細ページP2において、各入力項目の入力操作を終えると、「更新」ボタンを押下(更新操作)する。受付処理部113がユーザーから更新操作を受け付けると、登録処理部114は、入力情報を登録する処理を実行する。
【0047】
具体的には、登録処理部114は、詳細ページP2においてユーザーが入力した必須入力項目K0及び関連項目K2、K3の入力情報(図6参照)を、ファイル情報データベース122の「入力情報」に登録する(図3参照)。また、登録処理部114は、区分情報をファイル情報データベース122の「登録区分」に登録する(図3参照)。図6に示す例では、「予測区分」と「登録区分」とが「見積書」で一致する。
【0048】
また、登録処理部114は、受付処理部113がユーザーから更新操作を受け付けると、登録対象のファイル121を未登録フォルダから登録フォルダに移動する。ここでは、登録処理部114は、ユーザーが選択したファイルF3を、未登録フォルダから登録フォルダに移動する。ここで、登録フォルダは、複数のフォルダで構成されてもよい。例えば、制御部11は、取引先、取引年月日などに応じて、複数のフォルダを作成してもよい。この場合、登録処理部114は、複数のフォルダのうち、ファイル121の種別、属性、その他の入力情報(作成者、宛先、取引先、取引年月日など)に応じたフォルダに、対象ファイルを移動する。ここでは、登録処理部114は、ファイルF3を「フォルダA」に移動する(図7参照)。図7には、登録フォルダ(フォルダA)に格納されている複数のファイル121を一覧にした登録ファイルリストページP3を示している。また、登録処理部114は、移動先のフォルダ名(又はURL)をファイル情報データベース122の「格納場所」に登録する(図3参照)。
【0049】
生成処理部115は、各入力項目(K0、K1、K2、K3)に入力された入力情報に基づいて学習用データ(再学習用データ)を生成する。例えば、生成処理部115は、入力データ(画像データ)と、区分情報と、区分に関連する関連項目の入力情報と、必須入力項目の入力情報とを互いに関連付けた学習用データを生成する。具体的には、生成処理部115は、「区分」の入力項目K1に入力されたテキスト情報(区分情報)に合致する箇所の周辺を優先的にファイル121のテキスト情報から抽出し、抽出したテキスト情報をベクトル化用学習済みモデル123を利用してベクトル化し、ベクトル化したベクトルデータと、入力された区分情報とを関連付けて、分類用学習済みモデル124の学習用データ(再学習用データ)を生成する。生成処理部115は、生成した学習用データを記憶部12に記憶する。また例えば、生成処理部115は、ファイル121から抽出されたテキスト情報のベクトルデータと区分情報とを関連付けて分類用学習済みモデル124の学習用データ(再学習用データ)として記憶部12に記憶する。
【0050】
ここで、ユーザーが、詳細ページP2の区分の入力項目K1に表示された区分情報が誤っていると判断した場合、すなわち特定処理部111が特定した予測区分(図3参照)が誤っている場合、ユーザーは、区分情報を修正する操作を行うことが可能である。例えば図8に示すように、ユーザーが詳細ページP2の入力項目K1を押下すると、表示処理部112は、プルダウンメニューを表示させて、予め登録された区分情報の候補(本開示の項目候補の一例)を選択可能に表示させる。
【0051】
受付処理部113は、ユーザーから区分情報を修正する修正操作を受け付ける。例えば図8に示す詳細ページP2においてユーザーが区分情報の候補の中から「請求書」を選択すると、受付処理部113は、区分情報の修正操作を受け付ける。
【0052】
また受付処理部113がユーザーから区分情報の修正操作を受け付けた場合、表示処理部112は、関連項目を変更する。例えばユーザーが「請求書」を選択した場合、表示処理部112は、図9に示すように、入力項目K2、K3を「請求書」の関連項目である「支払条件」及び「支払先」に変更する。このように、表示処理部112は、詳細ページP2において、区分の入力項目K1に表示される区分情報が修正された場合に、関連項目(入力項目K2、K3)の内容を、修正後の区分情報に応じた内容に変更する。
【0053】
図9に示す詳細ページP2において、ユーザーは、区分「請求書」の関連項目K2の支払条件と、区分「請求書」の関連項目K3の支払先とを入力する。ユーザーは、詳細ページP2において、各入力項目の入力操作を終えると、「更新」ボタンを押下(更新操作)する。受付処理部113がユーザーの更新操作を受け付けると、登録処理部114は、関連項目に対するユーザーの入力操作に基づいて前記入力情報を取得して前記入力情報を登録する処理を実行する。
【0054】
具体的には、登録処理部114は、詳細ページP2においてユーザーが入力した必須入力項目K0及び関連項目K2、K3の入力情報をファイル情報データベース122の「入力情報」に登録する(図3参照)。また、登録処理部114は、区分情報をファイル情報データベース122の「登録区分」に登録する(図3参照)。図9に示す例では、「予測区分」に「見積書」が登録され、「登録区分」に「請求書」が登録される(図3参照)。
【0055】
区分情報が修正された場合、生成処理部115は、修正後の各入力項目(K0、K1、K2、K3)に入力された入力情報に基づいて学習用データを生成する。例えば、生成処理部115は、入力データ(画像データ)と、修正後の区分情報と、修正後の区分に関連する関連項目の入力情報と、必須入力項目の入力情報とを互いに関連付けた学習用データを生成する。具体的には、生成処理部115は、修正後の「区分」の入力項目K1に入力されたテキスト情報(区分情報)に合致する箇所の周辺を優先的にファイル121のテキスト情報から抽出し、抽出したテキスト情報をベクトル化用学習済みモデル123を利用してベクトル化し、ベクトル化したベクトルデータと、修正された区分情報とを関連付けて、分類用学習済みモデル124の学習用データ(再学習用データ)を生成する。生成処理部115は、生成した学習用データを記憶部12に記憶する。例えば、生成処理部115は、ファイル121から抽出されたテキスト情報のベクトルデータと、修正後の区分情報とを関連付けて分類用学習済みモデル124の学習用データ(再学習用データ)として記憶部12に記憶する。
【0056】
学習処理部116は、生成処理部115により生成される学習用データを用いて学習済みモデル(分類用学習済みモデル124)を更新する。具体的には、学習処理部116は、ファイル121から抽出されたテキスト情報のベクトルデータと、区分情報(修正された場合は修正後の区分情報)とを関連付けた複数の学習用データを用いて再学習を行って、分類用学習済みモデル124を更新する。
【0057】
例えば、学習処理部116は、学習用データのデータ数が所定数以上になった場合、又は、予め設定された実行タイミングが到来した場合に、前記学習用データを用いて機械学習を行うことにより分類用学習済みモデル124を更新する。
【0058】
なお、機械学習には、教師ありデータを用いる教師あり学習(Supervised Learning)、教師なしデータを用いる教師なし学習(Unsupervised Learning)、強化学習(Reinforcement Learning)などのアルゴリズムがあり、さらに、これらの手法を実現するうえで、特徴量そのものの抽出を学習する、「深層学習(ディープラーニング:Deep Learning)」と呼ばれる手法が用いられる。本実施形態では、制御部11は、上述した各種のアルゴリズムに基づく学習モデルを有している。なお、本実施形態では、区分情報が付加されたデータは教師ありデータに相当し、区分情報が付加されていないデータなどは教師なしデータに相当する。制御部11は、これら教師ありデータ及び教師なしデータを入力データ(学習用データ)として機械学習を行って学習済みモデル(分類用学習済みモデル124)を生成することが可能である。また、本実施形態では、制御部11は、区分情報が付加された教師ありデータを入力データ(再学習用データ)として機械学習(再学習)を行って学習済みモデル(分類用学習済みモデル124)を更新する。すなわち、情報処理装置1は、学習済みモデルを生成及び更新する学習装置として機能する。
【0059】
また、前記学習済みモデル(分類用学習済みモデル124)は、操作端末(ユーザー端末2など)にダウンロードされて利用されてもよいし、サーバー(クラウドサーバー、情報処理装置1など)に記憶されて、操作端末からインターネットなどを介してアクセスして利用されてもよい。前記学習済みモデルは、前記操作端末において任意の入力データが入力されると、最適な文字認識結果(区分情報など)を出力する。前記学習済みモデルを利用する機器(前記操作端末、前記サーバーなど)は、本開示の出力装置の一例である。
【0060】
[情報処理]
以下、情報処理装置1において実行される情報処理の手順について説明する。前記情報処理には、入力データに相当するファイル情報をファイル情報データベース122に登録するファイル情報登録処理と、学習用データを生成する学習用データ生成処理とが含まれる。
【0061】
本開示は、前記情報処理に含まれる一又は複数のステップを実行する情報処理方法(本開示の情報処理方法)として捉えることができる。また、ここで説明する前記情報処理に含まれる一又は複数のステップが適宜省略されてもよい。また、前記情報処理における各ステップは、同様の作用効果を生じる範囲で実行順序が異なってもよい。さらに、ここでは情報処理装置1の制御部11が前記情報処理における各ステップを実行する場合を例に挙げて説明するが、他の実施形態では、一又は複数のプロセッサーが前記情報処理における各ステップを分散して実行してもよい。
【0062】
[1.ファイル情報登録処理]
図10は、情報処理装置1において実行されるファイル情報登録処理の手順の一例を示すフローチャートである。
【0063】
ステップS1において、制御部11は、ユーザー端末2等から入力される入力データ(ファイル121)を取得する。制御部11は、ファイル121を取得すると記憶部12の取込フォルダに記憶する。また、制御部11は、ファイル121の属性情報(ファイル名など)を取得し、当該属性情報と、格納場所(「取込フォルダ」)の情報とを、ファイル情報データベース122に登録する(図3参照)。
【0064】
次にステップS2において、制御部11は、取得したファイル121からテキスト情報を抽出する。
【0065】
次にステップS3において、制御部11は、抽出したテキスト情報を、ベクトル化用学習済みモデル123を利用してベクトル化して、ベクトルデータを取得する。
【0066】
次にステップS4において、制御部11は、ファイル121の区分を予測する。具体的には、制御部11は、分類用学習済みモデル124を利用してベクトルデータに対する区分を予測する。例えば、制御部11は、予め設定された複数の区分の中から、前記ベクトルデータに基づいていずれかの区分を特定する。
【0067】
次にステップS5において、制御部11は、ファイル情報をファイル情報データベース122に登録する(図3参照)。具体的には、制御部11は、予測した区分の区分情報をファイル情報データベース122の「予測区分」に登録し、抽出したテキスト情報をファイル情報データベース122の「入力情報」に登録する。制御部11は、ファイル121のファイル情報を登録すると、ファイル121を取込フォルダから未登録フォルダに移動する。
【0068】
制御部11は、入力データ(ファイル121)を取得するごとに、ファイル121のファイル情報をファイル情報データベース122に登録して、ファイル121を未登録フォルダに格納する。
【0069】
[2.学習用データ生成処理]
図11は、情報処理装置1において実行される学習用データ生成処理の手順の一例を示すフローチャートである。
【0070】
ステップS11において、制御部11は、未登録フォルダに格納されている複数のファイル121を一覧にした未登録ファイルリストページP1を表示させる。例えば図4に示すように、制御部11は、未登録ファイルリストページP1において、複数のファイル121を選択可能に表示させる。
【0071】
次にステップS12において、制御部11は、ユーザーからファイル121の選択操作を受け付ける。また、制御部11は、ユーザーからファイル121の選択操作を受け付けると、選択されたファイル121の詳細情報を含む詳細ページP2を表示させる。例えば図4に示す未登録ファイルリストページP1においてユーザーがファイルF3を選択すると、制御部11は、ユーザーによるファイルF3の選択操作を受け付けて、図5に示すファイルF3の詳細情報を含む詳細ページP2を表示させる。
【0072】
次にステップS13において、制御部11は、ファイル121に対応する予測区分がファイル情報データベース122(図3参照)に登録されているか否かを判定する。制御部11は、予測区分がファイル情報データベース122に登録されていると判定すると(S13:Yes)、処理をステップS14に移行させる。一方、制御部11は、予測区分がファイル情報データベース122に登録されていないと判定すると(S13:No)、処理をステップS31に移行させる。
【0073】
ステップS31では、制御部11は、初期設定(デフォルト)の区分情報を詳細ページP2の入力項目K1に表示させる。このように、制御部11は、ファイル121から区分を予測できた場合には、予測した区分情報を入力項目K1に表示させ、ファイル121から区分を予測できなかった場合には、予め設定された区分情報(例えば、「その他」、「(空白)」など)を入力項目K1に表示させる。ステップS31の後、制御部11は、処理をステップS14に移行する。他の実施形態として、制御部11は、ファイル121から区分を予測できなかった場合に、予め設定された区分情報を予測区分に登録してもよい。この場合、ステップS31の処理は省略されてもよい。
【0074】
ステップS14において、制御部11は、区分の関連項目を表示させる。例えば図5に示すように、制御部11は、区分(予測区分又は初期設定の区分)が「見積書」の場合、区分の入力項目K1に「見積書」を表示させるとともに、「見積書」に予め設定された関連項目である「有効期限」及び「納期」を入力項目K2、K3にそれぞれ表示させる。なお、制御部11は、ファイル121から区分を予測できなかった場合は、区分の入力項目K1に「その他」又は「(空白)」を表示させるとともに、関連項目として暫定的に「項目1」及び「項目2」を入力項目K2、K3にそれぞれ表示させる。
【0075】
次にステップS15において、制御部11は、入力項目K1に表示させた「区分」(区分情報)に対してユーザーから修正操作を受け付けたか否かを判定する。制御部11は、ユーザーから区分情報を修正する修正操作を受け付けると(S15:Yes)、処理をステップS16に移行させる。一方、制御部11は、ユーザーから区分情報を修正する修正操作を受け付けない場合(S15:No)、処理をステップS17に移行させる。
【0076】
例えば図8に示すように、ユーザーが詳細ページP2の入力項目K1を押下すると、制御部11は、プルダウンメニューにおいて予め登録された区分情報の候補を選択可能に表示させて、区分情報の候補の中からいずれかを選択する操作(修正操作)を受け付ける。
【0077】
ステップS16において、制御部11は、区分情報を修正する。例えば、制御部11は、図8に示す詳細ページP2において、入力項目K1に表示された区分情報を、ユーザーが選択した候補の区分情報に修正する。図8に示す例では、制御部11は、「見積書」を「請求書」に修正する。ステップS16の後、制御部11は、処理をステップS14に戻す。
【0078】
ステップS14に戻ると、制御部11は、修正された区分に関連する関連項目を表示させる。例えば図9に示すように、制御部11は、入力項目K2、K3を「請求書」の関連項目である「支払条件」及び「支払先」に変更する。このように、制御部11は、詳細ページP2において、区分の入力項目K1に表示された区分情報が修正された場合に、関連項目(入力項目K2、K3)の内容を、修正後の区分情報に応じた内容に変更する。その後、制御部11は、ユーザーから区分情報を修正する修正操作を受け付けない場合(S15:No)、処理をステップS17に移行させる。
【0079】
ステップS17において、制御部11は、詳細ページP2に表示される必須入力項目K0の入力情報を取得する。例えば図6に示すように、ユーザーが詳細ページP2の必須入力項目K0に情報を入力すると、制御部11は、必須入力項目K0に入力された入力情報を取得する。また、制御部11は、ファイル121から抽出したテキスト情報のうち必須入力項目K0に対応する情報を前記入力情報として取得してもよい。
【0080】
次にステップS18において、制御部11は、詳細ページP2に表示される関連項目の入力情報を取得する。例えば図6に示すように、ユーザーが詳細ページP2の入力項目K2、K3に情報を入力すると、制御部11は、入力項目K2、K3に入力された入力情報を取得する。また、制御部11は、ファイル121から抽出したテキスト情報のうち入力項目K2、K3に対応する情報を前記入力情報として取得してもよい。
【0081】
次にステップS19において、制御部11は、ユーザーから更新操作を受け付けたか否かを判定する。例えばユーザーが、詳細ページP2において、各入力項目の入力操作を終えて「更新」ボタンを押下(更新操作)すると、制御部11は、ユーザーの更新操作を受け付ける。制御部11は、ユーザーから更新操作を受け付けると(S19:Yes)、処理をステップS20に移行させる。制御部11は、ユーザーから更新操作を受け付けるまで待機する(S19:No)。
【0082】
次にステップS20において、制御部11は、登録対象のファイル121を未登録フォルダから登録フォルダに移動する。例えば制御部11は、ユーザーが選択したファイルF3(ステップS12参照)を未登録フォルダから登録フォルダのフォルダAに移動する(図7参照)。制御部11は、移動先のフォルダ名(又はURL)をファイル情報データベース122の「格納場所」に登録する(図3参照)。
【0083】
また、制御部11は、詳細ページP2においてユーザーが入力した入力情報をファイル情報データベース122の「入力情報」に登録する(図3参照)。具体的には、制御部11は、詳細ページP2においてユーザーが入力した必須入力項目K0及び関連項目K2、K3の入力情報をファイル情報データベース122の「入力情報」に登録する(図3参照)。
【0084】
また、制御部11は、区分情報をファイル情報データベース122の「登録区分」に登録する(図3参照)。制御部11は、ユーザーが区分情報を修正した場合には(ステップS16参照)、修正後の区分情報をファイル情報データベース122の「登録区分」に登録する。
【0085】
次にステップS21において、制御部11は、各入力項目に入力された入力情報に基づいて学習用データ(再学習用データ)を生成する。例えば、制御部11は、ファイル121から抽出されたテキスト情報のベクトルデータと区分情報とを関連付けて分類用学習済みモデル124の学習用データ(再学習用データ)を生成する。また、制御部11は、ユーザーが区分情報を修正した場合には(ステップS16参照)、ファイル121から抽出されたテキスト情報のベクトルデータと、修正後の区分情報とを関連付けて分類用学習済みモデル124の学習用データ(再学習用データ)を生成する。
【0086】
また例えば、制御部11は、「区分」の入力項目K1に入力されたテキスト情報(区分情報)に合致する箇所の周辺を優先的にファイル121のテキスト情報から抽出し、抽出したテキスト情報をベクトル化用学習済みモデル123を利用してベクトル化し、ベクトル化したベクトルデータと、入力された区分情報とを関連付けて、分類用学習済みモデル124の学習用データ(再学習用データ)を生成する。
【0087】
制御部11は、生成した学習用データを記憶部12に記憶して、前記学習用データ生成処理を終了する。制御部11は、未登録ファイルリストページP1においてユーザーからファイル121の選択操作を受け付けるごとに、上述した各処理を実行して学習用データを生成して蓄積していく。
【0088】
ここで、制御部11は、蓄積された学習用データのデータ数が所定数以上になった場合に、前記学習用データを用いて機械学習を行うことにより分類用学習済みモデル124を更新する。他の実施形態として、制御部11は、予め設定された実行タイミングが到来した場合に、前記学習用データを用いて機械学習を行うことにより分類用学習済みモデル124を更新してもよい。このように、制御部11は、所定の条件を満たすごとに、分類用学習済みモデル124を繰り返し更新する。
【0089】
更新された分類用学習済みモデル124が出力装置(操作端末、クラウドサーバーなど)にインストールされた場合には、出力装置は、分類用学習済みモデル124を用いて、書類の入力データに対して、前記書類の区分の項目情報と、区分に関連する関連項目の入力情報とを抽出する処理を実行し、抽出した前記項目情報及び前記入力情報を出力する。また、出力装置は、抽出した前記項目情報及び前記入力情報をデータベース(例えば帳票データベース)に登録してもよい。
【0090】
以上説明したように、本実施形態に係る情報処理装置1は、書類の入力データから学習済みモデルを利用して前記書類の所定項目(例えば書類の種別を表す「区分」)を特定し、特定される前記所定項目を修正するユーザー操作が受け付けられた場合に、修正された前記所定項目の修正項目情報と、前記書類に含まれる複数の項目のうち前記所定項目に関連する関連項目の入力情報とを互いに関連付けた学習用データを生成し、生成される前記学習用データを用いて前記学習済みモデルを更新する。
【0091】
上記構成によれば、書類の区分と区分に関連する関連項目とを関連付けた学習用データを利用して再学習を実行して学習済みモデルを更新することができるため、学習済みモデルの認識精度を向上させることができる。
【0092】
例えば、取引書類管理において、予め用意されている区分(請求書、見積書、納品書、注文書、領収書、契約書等)のうち分類用の学習済みモデルによる区分情報(予測区分)の自動付与結果に対して登録処理時にユーザーが修正した場合に、修正された区分情報と、区分に関連する個別項目の入力情報とを、該当する入力データ(ファイル)に対する教師データとして蓄積しておき、蓄積された教師データを既存の学習済みモデルに対する再学習に用いることにより、ユーザーによる修正結果が、区分情報の自動付与へ反映されることにより、ユーザー環境により適した区分情報の自動付与が可能になる。
【0093】
[開示の付記]
以下、上述の実施形態から抽出される開示の概要について付記する。なお、以下の付記で説明する各構成及び各処理機能は取捨選択して任意に組み合わせることが可能である。
【0094】
<付記1>
書類の入力データから学習済みモデルを利用して前記書類の所定項目を特定する特定処理部と、
前記特定処理部により特定される前記所定項目を修正するユーザー操作が受け付けられた場合に、修正された前記所定項目の修正項目情報と、前記書類に含まれる複数の項目のうち前記所定項目に関連する関連項目の入力情報とを互いに関連付けた学習用データを生成する生成処理部と、
前記生成処理部により生成される前記学習用データを用いて前記学習済みモデルを更新する学習処理部と、
を備える情報処理装置。
【0095】
<付記2>
前記所定項目は、前記書類に含まれる複数の項目のうち前記書類の種別を表す項目である、
付記1に記載の情報処理装置。
【0096】
<付記3>
前記特定処理部により特定される前記所定項目を修正する場合に、予め登録された複数の項目候補を選択可能に表示させて、いずれかの項目候補を選択する前記ユーザー操作を受け付ける、
付記1又は2に記載の情報処理装置。
【0097】
<付記4>
前記項目候補を選択する前記ユーザー操作を受け付けた場合に、前記関連項目を、ユーザーにより選択された前記項目候補に関連する関連項目に変更する、
付記3に記載の情報処理装置。
【0098】
<付記5>
前記関連項目に対するユーザーの入力操作に基づいて前記入力情報を取得する、
付記1~4のいずれかに記載の情報処理装置。
【0099】
<付記6>
前記生成処理部は、前記入力情報のテキストデータをベクトル化したベクトルデータと、前記修正項目情報とを互いに関連付けて前記学習用データを生成する、
付記1~5のいずれかに記載の情報処理装置。
<付記7>
前記生成処理部は、前記所定項目に入力されたテキスト情報に合致する箇所の周辺を優先的に前記入力データのテキスト情報から抽出し、抽出したテキスト情報を所定の学習済みモデルを利用してベクトル化し、ベクトル化したベクトルデータと、前記所定項目に入力された前記テキスト情報とを関連付けて、前記学習用データを生成する、
付記1に記載の情報処理装置。
【0100】
<付記8>
前記入力データを取得すると前記入力データに対応するファイルを第1フォルダに記憶し、前記入力情報を取得すると前記ファイルを前記第1フォルダから第2フォルダに移動する、
付記1~7のいずれかに記載の情報処理装置。
【0101】
<付記9>
前記学習処理部は、前記学習用データのデータ数が所定数以上になった場合、又は、予め設定された実行タイミングが到来した場合に、前記学習用データを用いて機械学習を行うことにより前記学習済みモデルを更新する、
付記1~8のいずれかに記載の情報処理装置。
【0102】
<付記10>
付記1~9のいずれかに記載の情報処理装置により生成される前記学習済みモデルを用いて、前記書類の入力データに対して、前記書類の所定項目の項目情報と、前記所定項目に関連する関連項目の入力情報とを抽出する処理を実行し、抽出した前記項目情報及び前記入力情報を出力する出力装置。
【符号の説明】
【0103】
1 :情報処理装置
2 :ユーザー端末
11 :制御部
12 :記憶部
13 :操作表示部
14 :通信部
111 :特定処理部
112 :表示処理部
113 :受付処理部
114 :登録処理部
115 :生成処理部
116 :学習処理部
121 :ファイル
122 :ファイル情報データベース
123 :ベクトル化用学習済みモデル
124 :分類用学習済みモデル
P1 :未登録ファイルリストページ
P2 :詳細ページ
P3 :登録ファイルリストページ
図1
図2
図3
図4
図5
図6
図7
図8
図9
図10
図11