(19)【発行国】日本国特許庁(JP)
(12)【公報種別】特許公報(B2)
(11)【特許番号】
(24)【登録日】2024-04-02
(45)【発行日】2024-04-10
(54)【発明の名称】学習用データセット生成システム、学習用データセット生成サーバーおよび学習用データセット生成プログラム
(51)【国際特許分類】
G06N 20/00 20190101AFI20240403BHJP
G06T 7/00 20170101ALI20240403BHJP
【FI】
G06N20/00 130
G06T7/00 350B
(21)【出願番号】P 2020026223
(22)【出願日】2020-02-19
【審査請求日】2023-01-30
(73)【特許権者】
【識別番号】000006150
【氏名又は名称】京セラドキュメントソリューションズ株式会社
(74)【代理人】
【識別番号】100140796
【氏名又は名称】原口 貴志
(72)【発明者】
【氏名】堤 匡史
【審査官】坂庭 剛史
(56)【参考文献】
【文献】特開2019-109562(JP,A)
【文献】特開2016-071412(JP,A)
【文献】特開2019-159576(JP,A)
(58)【調査した分野】(Int.Cl.,DB名)
G06N 20/00
G06T 7/00
(57)【特許請求の範囲】
【請求項1】
文書の画像としての文書画像を分類してラベルを付与するための推論モデルとしての文書分類用推論モデルの学習用データセットを生成する学習用データセット生成システムであって、
前記学習用データセットは、前記ラベルが付与された前記文書画像を含み、
前記学習用データセット生成システムは、複数の前記文書画像を、前記文書画像の特徴量に基づいてクラスタリングすることによって、複数のクラスターに分け、前記クラスターに所属する前記文書画像の中から前記クラスター毎にトレーニングデータを選定し、全ての前記クラスターの前記トレーニングデータで学習することによって、前記文書画像をフォーム毎に分類するための推論モデルとしての画像分類用推論モデルを生成し、
前記学習用データセット生成システムは、前記文書画像を前記画像分類用推論モデルで推論して確信度を出し、前記文書画像に対する前記確信度が特定の値以上であるフォームを、この文書画像の前記フォームとして確定し、
前記学習用データセット生成システムは、前記フォームが同一である前記文書画像同士に同一の前記ラベルを付与させるUIを提供することを特徴とする学習用データセット生成システム。
【請求項2】
前記UIは、前記フォームは同一であるが前記ラベルは互いに異なる複数の前記文書画像の前記ラベルを修正させるものであることを特徴とする請求項1に記載の学習用データセット生成システム。
【請求項3】
前記UIは、前記フォームが同一である複数の前記文書画像に一括で同一の前記ラベルを付与させるものであることを特徴とする請求項1に記載の学習用データセット生成システム。
【請求項4】
文書の画像としての文書画像を分類してラベルを付与するための推論モデルとしての文書分類用推論モデルの学習用データセットを生成する学習用データセット生成サーバーであって、
前記学習用データセットは、前記ラベルが付与された前記文書画像を含み、
前記学習用データセット生成サーバーは、複数の前記文書画像を、前記文書画像の特徴量に基づいてクラスタリングすることによって、複数のクラスターに分け、前記クラスターに所属する前記文書画像の中から前記クラスター毎にトレーニングデータを選定し、全ての前記クラスターの前記トレーニングデータで学習することによって、前記文書画像をフォーム毎に分類するための推論モデルとしての画像分類用推論モデルを生成し、
前記学習用データセット生成サーバーは、前記文書画像を前記画像分類用推論モデルで推論して確信度を出し、前記文書画像に対する前記確信度が特定の値以上であるフォームを、この文書画像の前記フォームとして確定し、
前記学習用データセット生成サーバーは、前記フォームが同一である前記文書画像同士に同一の前記ラベルを付与させるUIを提供することを特徴とする学習用データセット生成サーバー。
【請求項5】
文書の画像としての文書画像を分類してラベルを付与するための推論モデルとしての文書分類用推論モデルの学習用データセットを生成するための学習用データセット生成プログラムであって、
前記学習用データセットは、前記ラベルが付与された前記文書画像を含み、
コンピューターは、前記学習用データセット生成プログラムを実行することによって、複数の前記文書画像を、前記文書画像の特徴量に基づいてクラスタリングすることによって、複数のクラスターに分け、前記クラスターに所属する前記文書画像の中から前記クラスター毎にトレーニングデータを選定し、全ての前記クラスターの前記トレーニングデータで学習することによって、前記文書画像をフォーム毎に分類するための推論モデルとしての画像分類用推論モデルを生成し、
前記コンピューターは、前記学習用データセット生成プログラムを実行することによって、前記文書画像を前記画像分類用推論モデルで推論して確信度を出し、前記文書画像に対する前記確信度が特定の値以上であるフォームを、この文書画像の前記フォームとして確定し、
前記コンピューターは、前記学習用データセット生成プログラムを実行することによって、前記フォームが同一である前記文書画像同士に同一の前記ラベルを付与させるUIを提供することを特徴とする学習用データセット生成プログラム。
【発明の詳細な説明】
【技術分野】
【0001】
本発明は、文書を分類するための推論モデルの学習用のデータセット(以下「学習用データセット」という。)を生成する学習用データセット生成システム、学習用データセット生成サーバーおよび学習用データセット生成プログラムに関する。
【背景技術】
【0002】
従来、文書の画像(以下「文書画像」という。)の特徴量を使用してクラスタリング処理を実行することによって、文書を分類する技術が知られている(特許文献1参照。)。
【先行技術文献】
【特許文献】
【0003】
【発明の概要】
【発明が解決しようとする課題】
【0004】
しかしながら、従来の技術においては、学習用データセットに含まれている文書画像に付与されているラベルが適切ではない可能性があるという問題がある。
【0005】
以下、詳細に説明する。
【0006】
一般に、学習用データセットは、フォームが同一の文書画像に対して同一のラベルが付与されているものである。ここで、1つのラベルに対して複数のフォームが対応付けられていることもある。例えば、学習用データセットに、30種類のラベルが含まれ、ラベル毎に10種類のフォームが対応付けられている場合、学習用データセットの作成者は、300種類のフォームから対象の文書画像に適切なフォームを特定し、特定したフォームに対応付けられているラベルを、対象の文書画像に付与するという作業を、学習用データセットに含める多数の文書画像に対して実行する必要がある。
【0007】
しかしながら、互いに異なるラベルに対応付けられているフォーム同士が類似している場合、学習用データセットの作成者は、誤って不適切なラベルを文書画像に付与してしまう可能性がある。また、学習用データセットの作成者は、長時間にわたる作業による疲労による集中力の低下によって、誤って不適切なラベルを文書画像に付与してしまう可能性がある。
【0008】
そこで、本発明は、学習用データセットに含まれている文書画像に付与されているラベルが適切である可能性を向上することができる学習用データセット生成システムおよび学習用データセット生成プログラムを提供することを目的とする。
【課題を解決するための手段】
【0009】
本発明の学習用データセット生成システムは、文書の画像としての文書画像を分類してラベルを付与するための推論モデルとしての文書分類用推論モデルの学習用データセットを生成する学習用データセット生成システムであって、前記学習用データセットは、前記ラベルが付与された前記文書画像を含み、前記学習用データセット生成システムは、複数の前記文書画像を、前記文書画像の特徴量に基づいてクラスタリングすることによって、複数のクラスターに分け、前記クラスターに所属する前記文書画像の中から前記クラスター毎にトレーニングデータを選定し、全ての前記クラスターの前記トレーニングデータで学習することによって、前記文書画像をフォーム毎に分類するための推論モデルとしての画像分類用推論モデルを生成し、前記学習用データセット生成システムは、前記文書画像を前記画像分類用推論モデルで推論して確信度を出し、前記文書画像に対する前記確信度が特定の値以上であるフォームを、この文書画像の前記フォームとして確定し、前記学習用データセット生成システムは、前記フォームが同一である前記文書画像同士に同一の前記ラベルを付与させるUIを提供することを特徴とする。
【0010】
この構成により、本発明の学習用データセット生成システムは、複数の文書画像を、文書画像の特徴量に基づいてクラスタリングすることによって、複数のクラスターに分け、クラスターに所属する文書画像の中からクラスター毎にトレーニングデータを選定し、全てのクラスターのトレーニングデータで学習することによって、文書画像をフォーム毎に分類するための推論モデルとしての画像分類用推論モデルを生成し、文書画像を画像分類用推論モデルで推論して確信度を出し、文書画像に対する確信度が特定の値以上であるフォームを、この文書画像のフォームとして確定し、フォームが同一である文書画像同士に同一のラベルを付与させるUIを提供するので、学習用データセットに含まれている文書画像に付与されているラベルが適切である可能性を向上することができる。
【0011】
本発明の学習用データセット生成システムにおいて、前記UIは、前記フォームは同一であるが前記ラベルは互いに異なる複数の前記文書画像の前記ラベルを修正させるものであっても良い。
【0012】
この構成により、本発明の学習用データセット生成システムは、フォームは同一であるがラベルは互いに異なる複数の文書画像のラベルを修正させるUIを提供するので、学習用データセットに含まれている文書画像に適切なラベルを付与する修正の作業の負担を軽減することができ、その結果、学習用データセットの修正の作業の負担を軽減することができる。
【0013】
本発明の学習用データセット生成システムにおいて、前記UIは、前記フォームが同一である複数の前記文書画像に一括で同一の前記ラベルを付与させるものであっても良い。
【0014】
この構成により、本発明の学習用データセット生成システムは、フォームが同一である複数の文書画像に一括で同一のラベルを付与させるUIを提供するので、文書画像に適切なラベルを付与する作業の負担を軽減することができ、その結果、学習用データセットの生成の作業の負担を軽減することができる。
【0015】
本発明の学習用データセット生成サーバーは、文書の画像としての文書画像を分類してラベルを付与するための推論モデルとしての文書分類用推論モデルの学習用データセットを生成する学習用データセット生成サーバーであって、前記学習用データセットは、前記ラベルが付与された前記文書画像を含み、前記学習用データセット生成サーバーは、複数の前記文書画像を、前記文書画像の特徴量に基づいてクラスタリングすることによって、複数のクラスターに分け、前記クラスターに所属する前記文書画像の中から前記クラスター毎にトレーニングデータを選定し、全ての前記クラスターの前記トレーニングデータで学習することによって、前記文書画像をフォーム毎に分類するための推論モデルとしての画像分類用推論モデルを生成し、前記学習用データセット生成サーバーは、前記文書画像を前記画像分類用推論モデルで推論して確信度を出し、前記文書画像に対する前記確信度が特定の値以上であるフォームを、この文書画像の前記フォームとして確定し、前記学習用データセット生成サーバーは、前記フォームが同一である前記文書画像同士に同一の前記ラベルを付与させるUIを提供することを特徴とする。
【0016】
この構成により、本発明の学習用データセット生成サーバーは、複数の文書画像を、文書画像の特徴量に基づいてクラスタリングすることによって、複数のクラスターに分け、クラスターに所属する文書画像の中からクラスター毎にトレーニングデータを選定し、全てのクラスターのトレーニングデータで学習することによって、文書画像をフォーム毎に分類するための推論モデルとしての画像分類用推論モデルを生成し、文書画像を画像分類用推論モデルで推論して確信度を出し、文書画像に対する確信度が特定の値以上であるフォームを、この文書画像のフォームとして確定し、フォームが同一である文書画像同士に同一のラベルを付与させるUIを提供するので、学習用データセットに含まれている文書画像に付与されているラベルが適切である可能性を向上することができる。
【0017】
本発明の学習用データセット生成プログラムは、文書の画像としての文書画像を分類してラベルを付与するための推論モデルとしての文書分類用推論モデルの学習用データセットを生成するための学習用データセット生成プログラムであって、前記学習用データセットは、前記ラベルが付与された前記文書画像を含み、コンピューターは、前記学習用データセット生成プログラムを実行することによって、複数の前記文書画像を、前記文書画像の特徴量に基づいてクラスタリングすることによって、複数のクラスターに分け、前記クラスターに所属する前記文書画像の中から前記クラスター毎にトレーニングデータを選定し、全ての前記クラスターの前記トレーニングデータで学習することによって、前記文書画像をフォーム毎に分類するための推論モデルとしての画像分類用推論モデルを生成し、前記コンピューターは、前記学習用データセット生成プログラムを実行することによって、前記文書画像を前記画像分類用推論モデルで推論して確信度を出し、前記文書画像に対する前記確信度が特定の値以上であるフォームを、この文書画像の前記フォームとして確定し、前記コンピューターは、前記学習用データセット生成プログラムを実行することによって、前記フォームが同一である前記文書画像同士に同一の前記ラベルを付与させるUIを提供することを特徴とする。
【0018】
この構成により、本発明の学習用データセット生成プログラムを実行するコンピューターは、複数の文書画像を、文書画像の特徴量に基づいてクラスタリングすることによって、複数のクラスターに分け、クラスターに所属する文書画像の中からクラスター毎にトレーニングデータを選定し、全てのクラスターのトレーニングデータで学習することによって、文書画像をフォーム毎に分類するための推論モデルとしての画像分類用推論モデルを生成し、文書画像を画像分類用推論モデルで推論して確信度を出し、文書画像に対する確信度が特定の値以上であるフォームを、この文書画像のフォームとして確定し、フォームが同一である文書画像同士に同一のラベルを付与させるUIを提供するので、学習用データセットに含まれている文書画像に付与されているラベルが適切である可能性を向上することができる。
【発明の効果】
【0019】
本発明の学習用データセット生成システム、学習用データセット生成サーバーおよび学習用データセット生成プログラムは、学習用データセットに含まれている文書画像に付与されているラベルが適切である可能性を向上することができる。
【図面の簡単な説明】
【0020】
【
図1】本発明の第1の実施の形態に係る文書分類システムのブロック図である。
【
図2】1台のコンピューターによって構成される場合の
図1に示す文書分類サーバーのブロック図である。
【
図3】MFPである場合の
図1に示す画像形成装置のブロック図である。
【
図4】
図1に示すコンピューターのブロック図である。
【
図5】文書分類用推論モデルが存在しない場合に文書分類サーバーに文書画像が蓄積されるときの
図1に示す文書分類システムの動作のシーケンス図である。
【
図6】文書分類用推論モデルが存在する場合に文書分類サーバーに文書画像が蓄積されるときの
図1に示す文書分類システムの動作のシーケンス図である。
【
図7】
図5に示す動作において表示部に表示されたラベル無画像に付与するラベルをデータセット作成者が指定する場合に使用されるラベルフォーム一覧表の一例を示す図である。
【
図8】
図5に示す動作において表示部に表示されたラベル無画像に付与するラベルをデータセット作成者が指定する方法のフローチャートである。
【
図9】ラベル修正処理を実行する場合の
図2に示す文書分類サーバーのフローチャートである。
【
図10】
図9に示すフォーム判定処理の一部のフローチャートである。
【
図11】
図10に示すフローチャートの続きのフローチャートである。
【
図12】
図10に示すデータ選定処理の一部のフローチャートである。
【
図13】
図12に示すフローチャートの続きのフローチャートである。
【
図14】本発明の第2の実施の形態に係る文書分類システムのブロック図である。
【
図16】ラベル付与処理を実行する場合の
図15に示す文書分類サーバーのフローチャートである。
【発明を実施するための形態】
【0021】
以下、本発明の実施の形態について、図面を用いて説明する。
【0022】
(第1の実施の形態)
まず、本発明の第1の実施の形態に係る学習用データセット生成システムとしての文書分類システムの構成について説明する。
【0023】
図1は、本実施の形態に係る文書分類システム10のブロック図である。
【0024】
図1に示すように、文書分類システム10は、文書を分類する文書分類サーバー20と、分類の対象の文書から画像を読み取る画像形成装置30と、例えば、PC(Personal Computer)などのコンピューター40を備えている。
【0025】
文書分類サーバー20は、1台のコンピューターによって構成されても良いし、複数台のコンピューターによって構成されても良い。
【0026】
文書分類サーバー20と、画像形成装置30とは、LAN(Local Area Network)、インターネットなどのネットワーク経由で、または、ネットワークを介さずに有線または無線によって直接に通信可能である。同様に、文書分類サーバー20と、コンピューター40とは、LAN、インターネットなどのネットワーク経由で、または、ネットワークを介さずに有線または無線によって直接に通信可能である。
【0027】
図2は、1台のコンピューターによって構成される場合の文書分類サーバー20のブロック図である。
【0028】
図2に示すように、文書分類サーバー20は、種々の操作が入力される例えばキーボード、マウスなどの操作デバイスである操作部21と、種々の情報を表示する例えばLCD(Liquid Crystal Display)などの表示デバイスである表示部22と、LAN、インターネットなどのネットワーク経由で、または、ネットワークを介さずに有線または無線によって直接に、外部の装置と通信を行う通信デバイスである通信部23と、各種の情報を記憶する例えば半導体メモリー、HDD(Hard Disk Drive)などの不揮発性の記憶デバイスである記憶部24と、文書分類サーバー20全体を制御する制御部25とを備えている。
【0029】
記憶部24は、文書を分類するための文書分類プログラム24aを記憶している。文書分類プログラム24aは、例えば、文書分類サーバー20の製造段階で文書分類サーバー20にインストールされていても良いし、USB(Universal Serial Bus)メモリーなどの外部の記憶媒体から文書分類サーバー20に追加でインストールされても良いし、ネットワーク上から文書分類サーバー20に追加でインストールされても良い。
【0030】
記憶部24は、文書を分類するための推論モデルとしての文書分類用推論モデル24bを記憶可能である。
【0031】
記憶部24は、ラベルが付与されていない文書画像(以下「ラベル無画像」という。)24cを記憶可能である。記憶部24は、ラベル無画像24c以外にも、ラベル無画像を少なくとも1つ記憶可能である。
【0032】
記憶部24は、文書分類用推論モデルの学習用データセット24dを記憶可能である。学習用データセット24dは、ラベルが付与された文書画像(以下「ラベル有画像」という。)24eを含むことが可能である。学習用データセット24dは、ラベル有画像24e以外にも、ラベル有画像を少なくとも1つ含むことが可能である。
【0033】
記憶部24は、ラベル有画像をフォーム毎に分類するための推論モデルである画像分類用推論モデルとしてのラベル有画像分類用推論モデル24fを記憶可能である。
【0034】
制御部25は、例えば、CPU(Central Processing Unit)と、プログラムおよび各種のデータを記憶しているROM(Read Only Memory)と、制御部25のCPUの作業領域として用いられるメモリーとしてのRAM(Random Access Memory)とを備えている。制御部25のCPUは、記憶部24または制御部25のROMに記憶されているプログラムを実行する。
【0035】
制御部25は、文書分類プログラム24aを実行することによって、文書分類用推論モデル24bを生成する推論モデル生成部25aと、文書分類用推論モデル24bを使用して文書を分類する文書分類部25bと、ラベル有画像に付与されているラベルを修正するラベル修正部25cとを実現する。ラベル修正部25cは、学習用データセット24dを修正するものである。したがって、文書分類プログラム24aは、本発明の学習用データセット生成プログラムを構成しており、文書分類サーバー20は、本発明の学習用データセット生成サーバーを構成している。
【0036】
図3は、MFPである場合の画像形成装置30のブロック図である。
【0037】
図3に示す画像形成装置30は、種々の操作が入力される例えばボタンなどの操作デバイスである操作部31と、種々の情報を表示する例えばLCDなどの表示デバイスである表示部32と、用紙などの記録媒体に画像を印刷する印刷デバイスであるプリンター33と、原稿から画像を読み取る読取デバイスであるスキャナー34と、図示していない外部のファクシミリ装置と公衆電話回線などの通信回線経由でファックス通信を行うファックスデバイスであるファックス通信部35と、LAN、インターネットなどのネットワーク経由で、または、ネットワークを介さずに有線または無線によって直接に、外部の装置と通信を行う通信デバイスである通信部36と、各種の情報を記憶する例えば半導体メモリー、HDDなどの不揮発性の記憶デバイスである記憶部37と、画像形成装置30全体を制御する制御部38とを備えている。
【0038】
制御部38は、例えば、CPUと、プログラムおよび各種のデータを記憶しているROMと、制御部38のCPUの作業領域として用いられるメモリーとしてのRAMとを備えている。制御部38のCPUは、記憶部37または制御部38のROMに記憶されているプログラムを実行する。
【0039】
【0040】
図4に示すコンピューター40は、種々の操作が入力される例えばキーボード、マウスなどの操作デバイスである操作部41と、種々の情報を表示する例えばLCDなどの表示デバイスである表示部42と、LAN、インターネットなどのネットワーク経由で、または、ネットワークを介さずに有線または無線によって直接に、外部の装置と通信を行う通信デバイスである通信部43と、各種の情報を記憶する例えば半導体メモリー、HDDなどの不揮発性の記憶デバイスである記憶部44と、コンピューター40全体を制御する制御部45とを備えている。
【0041】
制御部45は、例えば、CPUと、プログラムおよび各種のデータを記憶しているROMと、制御部45のCPUの作業領域として用いられるメモリーとしてのRAMとを備えている。制御部45のCPUは、記憶部44または制御部45のROMに記憶されているプログラムを実行する。
【0042】
次に、文書分類システム10の動作について説明する。
【0043】
まず、文書分類用推論モデル24bが存在しない場合に文書分類サーバー20に文書画像が蓄積されるときの文書分類システム10の動作について説明する。
【0044】
図5は、文書分類用推論モデル24bが存在しない場合に文書分類サーバー20に文書画像が蓄積されるときの文書分類システム10の動作のシーケンス図である。
【0045】
学習用データセット24dの作成者(以下「データセット作成者」という。)などの利用者は、分類の対象の文書を画像形成装置30のスキャナー34にセットした上で、文書分類サーバー20への文書画像の蓄積を画像形成装置30の操作部31を介して指示することができる。
【0046】
画像形成装置30の制御部38は、文書分類サーバー20への文書画像の蓄積が指示されると、
図5に示すように、スキャナー34にセットされている、分類の対象の文書からスキャナー34によって文書画像を取得し(S101)、S101において取得した文書画像を文書分類サーバー20に送信する(S102)。
【0047】
文書分類サーバー20の推論モデル生成部25aは、画像形成装置30によってS102において送信された文書画像を受信すると、受信した文書画像をラベル無画像として記憶部24に蓄積する(S103)。
【0048】
データセット作成者は、ラベル無画像が文書分類サーバー20に蓄積された後、学習用データセットの生成の処理の開始をコンピューター40の操作部41を介して指示することができる。
【0049】
コンピューター40の制御部45は、学習用データセットの生成の処理の開始が指示されると、文書分類サーバー20に蓄積されたラベル無画像を文書分類サーバー20に要求する(S104)。
【0050】
文書分類サーバー20の推論モデル生成部25aは、S104における要求を受けると、文書分類サーバー20に蓄積されたラベル無画像をコンピューター40に送信する(S105)。
【0051】
コンピューター40の制御部45は、S105において文書分類サーバー20から送信されたラベル無画像を受信すると、受信したラベル無画像を表示部42に表示する(S106)。したがって、データセット作成者は、表示部42に表示されたラベル無画像に付与するラベルをラベル無画像毎に操作部41経由でコンピューター40に指定することができる。
【0052】
制御部45は、ラベル無画像に対するラベルが指定されると、ラベル無画像に付与される、ラベル無画像毎のラベルを文書分類サーバー20に送信する(S107)。
【0053】
文書分類サーバー20の推論モデル生成部25aは、S107においてコンピューター40から送信された、ラベル無画像毎のラベルを受信すると、受信したラベルを、このラベルに対応付けられたラベル無画像に付与した文書画像をラベル有画像として学習用データセット24dに蓄積する(S108)。
【0054】
推論モデル生成部25aは、学習用データセット24dに含まれているラベル有画像の個数が特定の個数を超えた場合、学習用データセット24dに含まれている全てのラベル有画像をAI(Artificial Intelligence)で学習することによって、文書分類用推論モデル24bを生成し(S109)、S109において生成した文書分類用推論モデル24bを記憶部24に記憶する(S110)。
【0055】
次に、文書分類用推論モデル24bが存在する場合に文書分類サーバー20に文書画像が蓄積されるときの文書分類システム10の動作について説明する。
【0056】
図6は、文書分類用推論モデル24bが存在する場合に文書分類サーバー20に文書画像が蓄積されるときの文書分類システム10の動作のシーケンス図である。
【0057】
利用者は、分類の対象の文書を画像形成装置30のスキャナー34にセットした上で、文書分類サーバー20への文書画像の蓄積を画像形成装置30の操作部31を介して指示することができる。
【0058】
画像形成装置30の制御部38は、文書分類サーバー20への文書画像の蓄積が指示されると、
図6に示すように、スキャナー34にセットされている、分類の対象の文書からスキャナー34によって文書画像を取得し(S121)、S121において取得した文書画像を文書分類サーバー20に送信する(S122)。
【0059】
文書分類サーバー20の文書分類部25bは、画像形成装置30によってS122において送信された文書画像を受信すると、受信した文書画像をラベル無画像として記憶部24に蓄積する(S123)。
【0060】
次いで、文書分類部25bは、S123において記憶部24に蓄積したラベル無画像を、記憶部24に記憶されている文書分類用推論モデル24bで分類してラベルを付与することによって、ラベル有画像を生成し(S124)、S124において生成したラベル有画像を記憶部24に蓄積する(S125)。
【0061】
次に、S106において表示部42に表示されたラベル無画像に付与するラベルをデータセット作成者が指定する方法について説明する。
【0062】
データセット作成者は、文書のラベルおよびフォームの一覧表(以下「ラベルフォーム一覧表」という。)を持っている。
【0063】
図7は、ラベルフォーム一覧表の一例を示す図である。
【0064】
図7に示すラベルフォーム一覧表は、文書のラベルとして、「Docment_type_00」から「Docment_type_29」までの30種類のラベルが含まれている。そして、各ラベルには、互いに外観が異なる10種類のフォームが対応付けられている。例えば、ラベル「Docment_type_00」は、「Form_00_00」から、「Form_00_09」までの10種類のフォームが対応付けられている。したがって、ラベルフォーム一覧表には、互いに外観が異なる300種類のフォームが含まれている。
【0065】
図8は、ラベル無画像に付与するラベルをデータセット作成者が指定する方法のフローチャートである。
【0066】
データセット作成者は、S106において表示部42に表示されたラベル無画像に付与するラベルを指定する場合、
図8に示すように、ラベルフォーム一覧表に含まれている全てのフォームから、ラベル無画像のフォームを特定する(S141)。例えば、データセット作成者は、ラベルフォーム一覧表が
図7に示すものである場合、ラベル無画像のフォームが、ラベルフォーム一覧表に含まれている300種類のフォームのいずれであるかを判断する。
【0067】
データセット作成者は、S141の処理の後、S141において特定したフォームにラベルフォーム一覧表において対応付けられているラベルを、このラベル無画像に付与するラベルとして特定する(S142)。
【0068】
次いで、データセット作成者は、ラベル無画像に付与するラベルとしてS142において特定したラベルを、このラベル無画像に付与するラベルとして操作部41経由でコンピューター40に指定する(S143)。
【0069】
ここで、互いに異なるラベルに対応付けられているフォーム同士が類似している場合、データセット作成者は、誤って不適切なラベルをラベル無画像に付与してしまう可能性がある。
【0070】
また、データセット作成者は、300種類のフォームから対象のラベル無画像に適切なフォームを特定し(S141)、S141において特定したフォームに対応付けられているラベルを、対象のラベル無画像に付与する(S142~S143)という作業を、学習用データセットに含める多数の文書画像に対して実行する必要があるので、長時間にわたる作業による疲労による集中力の低下によって、誤って不適切なラベルをラベル無画像に付与してしまう可能性がある。
【0071】
次に、ラベル有画像に付与されているラベルの修正の処理(以下「ラベル修正処理」という。)を実行する場合の文書分類システム10の動作について説明する。
【0072】
データセット作成者は、S109における文書分類用推論モデル24bの生成の処理が開始される前に、ラベル修正処理の開始をコンピューター40の操作部41を介して指示することができる。なお、文書分類サーバー20の推論モデル生成部25aは、ラベル修正処理の実行後の学習用データセット24dを使用して、S109における文書分類用推論モデル24bの生成の処理を実行する。
【0073】
コンピューター40の制御部45は、ラベル修正処理の開始が指示されると、ラベル修正処理の開始を文書分類サーバー20に指示する。
【0074】
図9は、ラベル修正処理を実行する場合の文書分類サーバー20のフローチャートである。
【0075】
文書分類サーバー20のラベル修正部25cは、ラベル修正処理の開始が指示されると、
図9に示す動作を実行する。
【0076】
図9に示すように、ラベル修正部25cは、学習用データセット24dに含まれるラベル有画像のフォームを判定するフォーム判定処理を実行する(S161)。
【0077】
図10は、
図9に示すフォーム判定処理の一部のフローチャートである。
図11は、
図10に示すフローチャートの続きのフローチャートである。
【0078】
図10および
図11に示すように、ラベル修正部25cは、ラベル修正処理の対象のラベル有画像の群を示す第1の対象画像群を初期化する(S181)。すなわち、ラベル修正部25cは、第1の対象画像群にいずれのラベル有画像も所属していない状態にする。
【0079】
ラベル修正部25cは、S181の処理の後、学習用データセット24dに含まれる全てのラベル有画像を第1の対象画像群に所属させる(S182)。
【0080】
次いで、ラベル修正部25cは、第1の対象画像群に所属するラベル有画像を、各ラベル有画像の特徴量に基づいて、第1の閾値で粗くクラスタリングすることによって、複数のクラスターに分ける(S183)。ここで、第1の閾値は、同一のフォームのラベル有画像が異なるクラスターに所属することを防止する程度に高い閾値である。
【0081】
ラベル修正部25cは、S183の処理の後、S183の処理で生成されたクラスターのうち、未だ対象にしていない1つのクラスターを対象にする(S184)。
【0082】
ラベル修正部25cは、S184の処理の後、現在の対象のクラスターに所属するラベル有画像の個数が特定の個数以上であるか否かを判断する(S185)。
【0083】
ラベル修正部25cは、現在の対象のクラスターに所属するラベル有画像の個数が特定の個数以上であるとS185において判断すると、現在の対象のクラスターに所属するラベル有画像を、各ラベル有画像の特徴量に基づいて、第1の閾値より低い第2の閾値で細かくクラスタリングすることによって、複数のサブクラスターに分ける(S186)。ここで、S186の処理を実行する理由は、後述のデータ選定処理の対象のラベル有画像の個数を減らすことによって、データ選定処理における計算時間を短縮するためである。したがって、第2の閾値は、同一のフォームのラベル有画像が、異なるサブクラスターに所属することを防止する程度に高い閾値である必要はない。
【0084】
ラベル修正部25cは、現在の対象のクラスターに所属するラベル有画像の個数が特定の個数以上ではないとS185において判断すると、現在の対象のクラスターに所属する全てのラベル有画像を、1つのサブクラスターに所属させる(S187)。
【0085】
ラベル修正部25cは、S186またはS187の処理の後、ラベル有画像分類用推論モデル24fの学習用データセットのトレーニングデータおよびバリデーションデータを選定するデータ選定処理を実行する(S188)。
【0086】
図12は、
図10に示すデータ選定処理の一部のフローチャートである。
図13は、
図12に示すフローチャートの続きのフローチャートである。
【0087】
図12および
図13に示すように、ラベル修正部25cは、S186またはS187の処理で生成されたサブクラスターのうち、未だ対象にしていない1つのサブクラスターを対象にする(S201)。
【0088】
ラベル修正部25cは、S201の処理の後、現在の対象のサブクラスターに所属する全てのラベル有画像同士の特徴量のユークリッド距離(以下、「特徴量のユークリッド距離」を単に「距離」という。)を算出する(S202)。
【0089】
次いで、ラベル修正部25cは、現在の対象のサブクラスターに対する処理の対象のラベル有画像の群を示す第2の対象画像群を初期化する(S203)。すなわち、ラベル修正部25cは、第2の対象画像群にいずれのラベル有画像も所属していない状態にする。
【0090】
ラベル修正部25cは、S203の処理の後、現在の対象のサブクラスターに所属する全てのラベル有画像を第2の対象画像群に所属させる(S204)。
【0091】
次いで、ラベル修正部25cは、第2の対象画像群に所属するラベル有画像のうち、S202において算出した、第2の対象画像群に所属する他のラベル有画像との距離の平均値が最小のラベル有画像を特定する(S205)。すなわち、ラベル修正部25cは、第2の対象画像群に所属するラベル有画像において、特徴量が中心付近にあると考えられるラベル有画像を特定する。
【0092】
ラベル修正部25cは、S205の処理の後、S205において特定したラベル有画像からの距離が特定の距離以内であるラベル有画像が第2の対象画像群において存在するか否かを判断する(S206)。ここで、S205において特定したラベル有画像からの距離が特定の距離以内ではないラベル有画像は、S205において特定したラベル有画像とはフォームが異なる可能性がある。
【0093】
ラベル修正部25cは、S205において特定したラベル有画像からの距離が特定の距離以内であるラベル有画像が第2の対象画像群において存在しないとS206において判断すると、S205において特定したラベル有画像を第2の対象画像群から除外して(S207)、S205の処理を実行する。
【0094】
ラベル修正部25cは、S205において特定したラベル有画像からの距離が特定の距離以内であるラベル有画像が第2の対象画像群において存在するとS206において判断すると、トレーニングデータおよびバリデーションデータの候補の群を示すデータ候補群を初期化する(S208)。すなわち、ラベル修正部25cは、データ候補群にいずれのラベル有画像も所属していない状態にする。
【0095】
ラベル修正部25cは、S208の処理の後、S205において特定したラベル有画像と、S205において特定したラベル有画像からの距離が第2の対象画像群において最小のラベル有画像とを、トレーニングデータおよびバリデーションデータの候補の群を示すデータ候補群に所属させる(S209)。
【0096】
ラベル修正部25cは、S209の処理の後、データ候補群に所属するラベル有画像の個数が特定の個数に達したか否かを判断する(S210)。
【0097】
ラベル修正部25cは、データ候補群に所属するラベル有画像の個数が特定の個数に達していないとS210において判断すると、S205において特定したラベル有画像からの距離が特定の距離以内であるラベル有画像が、データ候補群に所属するラベル有画像以外に第2の対象画像群において存在するか否かを判断する(S211)。
【0098】
ラベル修正部25cは、S205において特定したラベル有画像からの距離が特定の距離以内であるラベル有画像が、データ候補群に所属するラベル有画像以外に第2の対象画像群において存在するとS211において判断すると、S205において特定したラベル有画像からの距離が、データ候補群に所属するラベル有画像以外で第2の対象画像群において最小のラベル有画像をデータ候補群に所属させて(S212)、S210の処理を実行する。
【0099】
ラベル修正部25cは、データ候補群に所属するラベル有画像の個数が特定の個数に達したとS210において判断するか、S205において特定したラベル有画像からの距離が特定の距離以内であるラベル有画像が、データ候補群に所属するラベル有画像以外に第2の対象画像群において存在しないとS211において判断すると、データ候補群に所属するラベル有画像をトレーニングデータまたはバリデーションデータとして選定する(S213)。ここで、ラベル修正部25cは、Nが自然数である場合に、データ候補群に所属するラベル有画像の個数が2N個であるとき、S205において特定したラベル有画像と、データ候補群に所属するラベル有画像のうち、S205において特定したラベル有画像からの距離が短い上位の(N-1)個のラベル有画像とをトレーニングデータとして選定し、データ候補群に所属するラベル有画像のうち、S205において特定したラベル有画像からの距離が長い上位のN個のラベル有画像をバリデーションデータとして選定する。また、ラベル修正部25cは、Nが自然数である場合に、データ候補群に所属するラベル有画像の個数が(2N+1)個であるとき、S205において特定したラベル有画像と、データ候補群に所属するラベル有画像のうち、S205において特定したラベル有画像からの距離が短い上位のN個のラベル有画像をトレーニングデータとして選定し、データ候補群に所属するラベル有画像のうち、S205において特定したラベル有画像からの距離が長い上位のN個のラベル有画像をバリデーションデータとして選定する。
【0100】
ラベル修正部25cは、S186またはS187の処理で生成されたサブクラスターのうち、未だ対象にしていないサブクラスターが存在するか否かを判断する(S214)。
【0101】
ラベル修正部25cは、S186またはS187の処理で生成されたサブクラスターのうち、未だ対象にしていないサブクラスターが存在するとS214において判断すると、S201の処理を実行する。
【0102】
ラベル修正部25cは、S186またはS187の処理で生成されたサブクラスターのうち、未だ対象にしていないサブクラスターが存在しないとS214において判断すると、
図12および
図13に示すデータ選定処理を終了する。
【0103】
図10および
図11に示すように、ラベル修正部25cは、S188におけるデータ選定処理が終了すると、S183の処理で生成されたクラスターのうち、未だ対象にしていないクラスターが存在するか否かを判断する(S189)。
【0104】
ラベル修正部25cは、S183の処理で生成されたクラスターのうち、未だ対象にしていないクラスターが存在するとS189において判断すると、S184の処理を実行する。
【0105】
ラベル修正部25cは、S183の処理で生成されたクラスターのうち、未だ対象にしていないクラスターが存在しないとS189において判断すると、全てのクラスターの全てのサブクラスターのトレーニングデータおよびバリデーションデータで学習することによって、ラベル有画像分類用推論モデル24fを生成する(S190)。すなわち、ラベル修正部25cは、トレーニングデータでラベル有画像分類用推論モデル24fを生成し、生成したラベル有画像分類用推論モデル24fでバリデーションデータを推論して確信度を出して、確信度が特定の値以上である場合に、ラベル有画像分類用推論モデル24fが適切であると判定する。
【0106】
次いで、ラベル修正部25cは、第1の対象画像群に所属するラベル有画像のうち、トレーニングデータおよびバリデーションデータ以外のラベル有画像を、S190において生成したラベル有画像分類用推論モデル24fで推論して確信度を出す(S191)。
【0107】
ラベル修正部25cは、S191の処理の後、S191において出した、ラベル有画像に対する確信度が特定の値以上であるフォームを、このラベル有画像のフォームとして確定する(S192)。S192における特定の値は、例えば、対象のフォームのバリデーションデータの、S190における学習における、このフォームに対する最低の確信度以上の値でも良い。
【0108】
次いで、ラベル修正部25cは、S192においてフォームを確定したラベル有画像を第1の対象画像群から削除する(S193)。
【0109】
次いで、ラベル修正部25cは、第1の対象画像群にラベル有画像が所属するか否かを判断する(S194)。
【0110】
ラベル修正部25cは、第1の対象画像群にラベル有画像が所属するとS194において判断すると、S183の処理を実行する。
【0111】
ラベル修正部25cは、第1の対象画像群にラベル有画像が所属しないとS194において判断すると、
図10および
図11に示すフォーム判定処理を終了する。
【0112】
なお、以上においては、第1の対象画像群にラベル有画像が所属しない場合にフォーム判定処理を終了するようになっている。しかしながら、ラベル修正部25cは、第1の対象画像群にラベル有画像が所属しない場合以外の場合にも、フォーム判定処理を終了する。例えば、ラベル修正部25cは、
図12および
図13に示すデータ選定処理においてトレーニングデータを選定することができない場合にフォーム判定処理を終了しても良いし、
図12および
図13に示すデータ選定処理においてバリデーションデータを選定することができない場合にフォーム判定処理を終了しても良い。また、ラベル修正部25cは、S183~S194の処理の繰り返しの回数が特定の回数に達した場合にフォーム判定処理を終了しても良い。また、ラベル修正部25cは、フォーム判定処理において自動でフォームを確定していないラベル有画像の個数がフォーム判定処理の実行当初の例えば1割などの特定の個数に達した場合にフォーム判定処理を終了しても良い。
【0113】
図9に示すように、文書分類サーバー20のラベル修正部25cは、S161のフォーム判定処理の終了後、学習用データセット24dに含まれる全てのラベル有画像のうち、フォーム判定処理において自動でフォームを確定することができなかったラベル有画像が存在するか否かを判断する(S162)。
【0114】
ラベル修正部25cは、フォーム判定処理において自動でフォームを確定することができなかったラベル有画像が存在するとS162において判断すると、フォーム判定処理において自動でフォームを確定することができなかったラベル有画像のフォームを利用者に確定させるUI(User Interface)をコンピューター40に提供する(S163)。したがって、コンピューター40の制御部45は、S163において文書分類サーバー20から提供されたUIを表示部42に表示し、このUIに対する操作を操作部41を介して受け付けることができる。S163において提供されるUIには、フォーム判定処理において自動でフォームを確定することができなかったラベル有画像だけでなく、フォーム判定処理において自動で確定したフォームの識別情報と、このフォームに所属しているラベル有画像とが含まれている。したがって、データセット作成者は、フォーム判定処理において自動で確定したフォームの識別情報と、このフォームに所属しているラベル有画像とを参考にして、フォーム判定処理において自動でフォームを確定することができなかったラベル有画像のフォームを確定することができる。
【0115】
なお、ラベル修正部25cは、フォーム判定処理において自動で確定したフォームの識別情報を自動で設定しても良い。例えば、ラベル修正部25cは、フォーム判定処理において自動で確定したフォームに所属している複数のラベル有画像のそれぞれからOCR(Optical Character Recognition)によってテキストを抽出し、複数のラベル有画像のそれぞれから抽出したテキストに共通する文字列を抽出し、抽出した文字列に基づいて、このフォームの識別情報を自動で設定しても良い。
【0116】
ラベル修正部25cは、S163の処理の後、フォーム判定処理において自動でフォームを確定することができなかった全てのラベル有画像のフォームがUIを介して確定されたと判断するまで、フォーム判定処理において自動でフォームを確定することができなかった全てのラベル有画像のフォームがUIを介して確定されたか否かを判断する(S164)。
【0117】
ラベル修正部25cは、フォーム判定処理において自動でフォームを確定することができなかったラベル有画像が存在しないとS162において判断するか、フォーム判定処理において自動でフォームを確定することができなかった全てのラベル有画像のフォームがUIを介して確定されたとS164において判断すると、フォーム判定処理において自動で確定したフォームまたはUIを介して確定されたフォームは同一であるがラベルは互いに異なる複数のラベル有画像が存在するか否かを判断する(S165)。
【0118】
ラベル修正部25cは、フォームは同一であるがラベルは互いに異なる複数のラベル有画像が存在するとS165において判断すると、フォームは同一であるがラベルは互いに異なる複数のラベル有画像のラベルを利用者に修正させるUIをコンピューター40に提供する(S166)。したがって、コンピューター40の制御部45は、S166において文書分類サーバー20から提供されたUIを表示部42に表示し、このUIに対する操作を操作部41を介して受け付けることができる。S166において提供されるUIには、フォームは同一であるがラベルは互いに異なる複数のラベル有画像だけでなく、これらのラベルも含まれている。したがって、データセット作成者は、フォームは同一であるがラベルは互いに異なる複数のラベル有画像の現在のラベルを参考にして、フォームは同一であるがラベルは互いに異なる複数のラベル有画像のラベルを変更することができる。なお、S166において提供されるUIには、フォームが同一である複数のラベル有画像において、いずれのラベルが多いかを示す情報が含まれても良い。
【0119】
ラベル修正部25cは、S166の処理の後、フォームは同一であるがラベルは互いに異なる複数のラベル有画像のラベルの修正がUIを介して指示されたと判断するまで、フォームは同一であるがラベルは互いに異なる複数のラベル有画像のラベルの修正がUIを介して指示されたか否かを判断する(S167)。
【0120】
ラベル修正部25cは、フォームは同一であるがラベルは互いに異なる複数のラベル有画像のラベルの修正がUIを介して指示されたとS167において判断すると、指示された通りにラベルを修正して(S168)、
図9に示す動作を終了する。
【0121】
以上に説明したように、文書分類システム10は、複数のラベル有画像を、ラベル有画像の特徴量に基づいてクラスタリングすることによって、複数のクラスターに分け(S183)、クラスターに所属するラベル有画像の中からクラスター毎にトレーニングデータを選定し(S213)、全てのクラスターのトレーニングデータで学習することによって、ラベル有画像をフォーム毎に分類するための推論モデルとしてのラベル有画像分類用推論モデル24fを生成し(S190)、ラベル有画像をラベル有画像分類用推論モデル24fで推論して確信度を出し(S191)、ラベル有画像に対する確信度が特定の値以上であるフォームを、このラベル有画像のフォームとして確定し(S192)、フォームが同一であるラベル有画像同士に同一のラベルを付与させるUIを提供する(S166)ので、学習用データセット24dに含まれているラベル有画像に付与されているラベルが適切である可能性を向上することができ、その結果、文書分類用推論モデル24bの精度を向上することができる。
【0122】
文書分類システム10は、フォームは同一であるがラベルは互いに異なる複数のラベル有画像のラベルを修正させるUIを提供する(S166)ので、学習用データセット24dに含まれているラベル有画像に適切なラベルを付与する修正の作業の負担を軽減することができ、その結果、学習用データセット24dの修正の作業の負担を軽減することができる。
【0123】
なお、ラベル修正部25cは、本実施の形態において、フォームは同一であるがラベルは互いに異なる複数のラベル有画像のラベルを利用者に修正させるUIをコンピューター40に提供する(S166)。しかしながら、ラベル修正部25cは、フォームは同一であるがラベルは互いに異なる複数のラベル有画像のラベルを自動で修正しても良い。例えば、ラベル修正部25cは、フォームは同一であるがラベルは互いに異なる複数のラベル有画像のラベルを、このフォームの複数のラベル有画像の中で、最も多いラベルに統一させても良い。
【0124】
(第2の実施の形態)
まず、本発明の第2の実施の形態に係る学習用データセット生成システムとしての文書分類システムの構成について説明する。
【0125】
なお、本実施の形態に係る文書分類システムの構成のうち、第1の実施の形態に係る文書分類システム10(
図1参照。)の構成と同様の構成については、詳細な説明を省略する。
【0126】
図14は、本実施の形態に係る文書分類システム310のブロック図である。
【0127】
図14に示すように、文書分類システム310の構成は、第1の実施の形態に係る文書分類システム10(
図1参照。)が文書分類サーバー20(
図1参照。)に代えて文書分類サーバー320を備えた構成と同様である。
【0128】
図15は、文書分類サーバー320のブロック図である。
【0129】
図15に示すように、文書分類サーバー320の構成は、文書を分類するための文書分類プログラム324aと、ラベル無画像をフォーム毎に分類するための推論モデルである画像分類用推論モデルとしてのラベル無画像分類用推論モデル324bとを、文書分類プログラム24a(
図2参照。)およびラベル有画像分類用推論モデル24f(
図2参照。)に代えて文書分類サーバー20(
図2参照。)が備えた構成と同様である。
【0130】
制御部25は、文書分類プログラム324aを実行することによって、推論モデル生成部25aと、文書分類部25bと、ラベル無画像にラベルを付与するラベル付与部325aとを実現する。ラベル付与部325aは、学習用データセット24dを生成するものである。したがって、文書分類プログラム324aは、本発明の学習用データセット生成プログラムを構成しており、文書分類サーバー320は、本発明の学習用データセット生成サーバーを構成している。
【0131】
次に、文書分類システム310の動作について説明する。
【0132】
文書分類システム310の動作は、以下に説明する内容を除いて、文書分類システム10の動作と同様である。
【0133】
ラベル無画像へのラベルの付与の処理(以下「ラベル付与処理」という。)を実行する場合の文書分類システム310の動作について説明する。
【0134】
文書分類サーバー320のラベル付与部325aは、S104(
図5参照。)における要求を受けると、
図16に示すラベル付与処理を実行する。
【0135】
図16は、ラベル付与処理を実行する場合の文書分類サーバー320のフローチャートである。
【0136】
図16に示すように、文書分類サーバー320のラベル付与部325aは、S161におけるフォーム判定処理(
図9参照。)と同様なフォーム判定処理を実行する(S401)。なお、S161におけるフォーム判定処理は、ラベル有画像に対して実行される処理であるが、S401におけるフォーム判定処理は、ラベル無画像に対して実行される処理である。
【0137】
ラベル付与部325aは、S401におけるフォーム判定処理の終了後、記憶部24に蓄積している全てのラベル無画像のうち、フォーム判定処理において自動でフォームを確定することができなかったラベル有画像が存在するか否かを判断する(S402)。
【0138】
ラベル付与部325aは、フォーム判定処理において自動でフォームを確定することができなかったラベル無画像が存在するとS402において判断すると、S163の処理と同様に、フォーム判定処理において自動でフォームを確定することができなかったラベル無画像のフォームを利用者に確定させるUIをコンピューター40に提供する(S403)。なお、データセット作成者は、フォームが未確定であるラベル無画像が存在する場合であっても、ラベル無画像のフォームの確定の作業を完了することができる。
【0139】
ラベル付与部325aは、S403の処理の後、ラベル無画像のフォームの確定の作業が完了したと判断するまで、ラベル無画像のフォームの確定の作業が完了したか否かを判断する(S404)。
【0140】
ラベル付与部325aは、フォーム判定処理において自動でフォームを確定することができなかったラベル無画像が存在しないとS402において判断するか、ラベル無画像のフォームの確定の作業が完了したとS404において判断すると、ラベル無画像のラベルを利用者に付与させるUIをコンピューター40に提供する(S405)。したがって、コンピューター40の制御部45は、S405において文書分類サーバー320から提供されたUIを表示部42に表示し、このUIに対する操作を操作部41を介して受け付けることができる。S405において提供されるUIにおいては、フォームが同一である複数のラベル無画像に一括で同一のラベルを付与することができ、フォームが未確定であるラベル無画像に1つずつラベルを付与することができる。フォームが同一である複数のラベル無画像が存在する場合には、S405において提供されるUIには、フォームが同一である複数のラベル無画像が含まれるが、これらのラベル無画像はサムネイルでも良い。フォームが未確定であるラベル無画像が存在する場合には、S405において提供されるUIには、フォームが未確定であるラベル無画像が含まれる。なお、S405の処理は、S105(
図5参照。)の処理に相当する。
【0141】
ラベル付与部325aは、S405の処理の後、ラベル無画像に対するラベルの付与がUIを介して指示されたと判断するまで、ラベル無画像に対するラベルの付与がUIを介して指示されたか否かを判断する(S406)。
【0142】
ラベル付与部325aは、ラベル無画像に対するラベルの付与がUIを介して指示されたとS406において判断すると、指示された通りにラベルを付与して(S407)、
図16に示す動作を終了する。
【0143】
以上に説明したように、文書分類システム310は、複数のラベル無画像を、ラベル無画像の特徴量に基づいてクラスタリングすることによって、複数のクラスターに分け、クラスターに所属するラベル無画像の中からクラスター毎にトレーニングデータを選定し、全てのクラスターのトレーニングデータで学習することによって、ラベル無画像をフォーム毎に分類するための推論モデルとしてのラベル無画像分類用推論モデル324bを生成し、ラベル無画像をラベル無画像分類用推論モデル324bで推論して確信度を出し、ラベル無画像に対する確信度が特定の値以上であるフォームを、このラベル無画像のフォームとして確定し(S401)、フォームが同一であるラベル無画像同士に同一のラベルを付与させるUIを提供する(S405)ので、学習用データセット24dに含まれているラベル有画像に付与されているラベルが適切である可能性を向上することができ、その結果、文書分類用推論モデル24bの精度を向上することができる。
【0144】
文書分類システム310は、フォームが同一である複数のラベル無画像に一括で同一のラベルを付与させるUIを提供する(S405)ので、文書画像に適切なラベルを付与する作業の負担を軽減することができ、その結果、学習用データセット24dの生成の作業の負担を軽減することができる。
【0145】
なお、文書分類サーバー320の制御部25は、
図9に示すラベル修正処理を実行しなくても良い。
【符号の説明】
【0146】
10 文書分類システム(学習用データセット生成システム)
20 文書分類サーバー(学習用データセット生成サーバー、コンピューター)
24a 文書分類プログラム(学習用データセット生成プログラム)
24b 文書分類用推論モデル
24c ラベル無画像(文書画像)
24d 学習用データセット
24e ラベル有画像(ラベルが付与された文書画像)
24f ラベル有画像分類用推論モデル(画像分類用推論モデル)
310 文書分類システム(学習用データセット生成システム)
320 文書分類サーバー(学習用データセット生成サーバー、コンピューター)
324a 文書分類プログラム(学習用データセット生成プログラム)
324b ラベル無画像分類用推論モデル(画像分類用推論モデル)