(19)【発行国】日本国特許庁(JP)
(12)【公報種別】公開特許公報(A)
(11)【公開番号】P2022187945
(43)【公開日】2022-12-20
(54)【発明の名称】画像処理システム、画像処理方法及びプログラム
(51)【国際特許分類】
H04N 1/00 20060101AFI20221213BHJP
H04N 1/21 20060101ALI20221213BHJP
G06V 30/194 20220101ALI20221213BHJP
G06T 7/00 20170101ALI20221213BHJP
【FI】
H04N1/00 Z
H04N1/21
G06K9/66
G06T7/00 350C
【審査請求】未請求
【請求項の数】8
【出願形態】OL
(21)【出願番号】P 2021096222
(22)【出願日】2021-06-08
(71)【出願人】
【識別番号】000001007
【氏名又は名称】キヤノン株式会社
(74)【代理人】
【識別番号】100126240
【弁理士】
【氏名又は名称】阿部 琢磨
(74)【代理人】
【識別番号】100124442
【弁理士】
【氏名又は名称】黒岩 創吾
(72)【発明者】
【氏名】八木 優一
(72)【発明者】
【氏名】若林 美月
【テーマコード(参考)】
5B064
5C062
5C073
5L096
【Fターム(参考)】
5B064AA01
5B064BA01
5B064CA08
5B064CA09
5B064DA27
5B064EA18
5B064EA19
5B064EA20
5C062AA05
5C062AB02
5C062AB17
5C062AC58
5C062AF02
5C062AF14
5C073AB12
5C073AB17
5L096BA17
5L096EA37
5L096EA39
5L096HA11
5L096JA03
5L096MA07
(57)【要約】
【課題】 ユーザによって、文書を分類するためのキーワードが入力されることなく、スキャンした原稿の画像データを振り分け、ユーザの手間を減らすことを目的とする。
【解決手段】 本発明の画像処理システムは、原稿の画像を読みとって画像データを生成する読取手段と、生成した画像データの文字を認識し、文字情報を取得する文字認識手段と、前記文字情報から特徴情報を抽出する抽出手段と、前記特徴情報を用いて前記画像データをクラスタリングするクラスタリング手段とクラスタリングよって生成されたクラスタごとに特定の名称を決定する名称決定手段と、前記クラスタリング手段によるクラスタリング結果と、前記名称決定手段によって決定された前記特定の名称に基づいて、前記画像データの送信先を決定する送信先決定手段と、前記送信先決定手段が決定した送信先に前記画像データを送信する送信手段とを有することを特徴とする。
【選択図】
図5
【特許請求の範囲】
【請求項1】
原稿の画像を読みとって画像データを生成する読取手段と、
前記読取手段が生成した画像データの文字を認識し、文字情報を取得する文字認識手段と、
前記文字情報から特徴情報を抽出する抽出手段と、
前記特徴情報を用いて前記画像データをクラスタリングするクラスタリング手段と
前記クラスタリング手段によるクラスタリングよって生成されたクラスタごとに特定の名称を決定する名称決定手段と、
前記クラスタリング手段によるクラスタリング結果と、前記名称決定手段によって決定された前記特定の名称に基づいて、前記画像データの送信先を決定する送信先決定手段と、
前記送信先決定手段が決定した送信先に前記画像データを送信する送信手段とを有することを特徴とする画像処理システム。
【請求項2】
前記送信手段が送信する画像データのファイル名を決定するファイル名決定手段をさらに有し、
前記ファイル名決定手段は、前記クラスタリング手段によるクラスタリング結果と、前記名称決定手段によって決定された前記特定の名称に基づいて、前記画像データのファイル名を決定することを特徴とする請求項1に記載の画像処理システム。
【請求項3】
前記クラスタリング手段は、前記特徴情報に基づいて分類先のクラスタを決定し、
前記送信先決定手段は、前記決定されたクラスタに対応づけて決定された特定の名称に基づいて、前記画像データの送信先を決定することを特徴とする請求項1または2に記載の画像処理システム。
【請求項4】
前記名称決定手段は、前記クラスタごとにユーザから入力された名称を特定の名称として決定することを特徴とする請求項1乃至3の何れか1項に記載の画像処理システム。
【請求項5】
前記クラスタリング手段は、機械学習処理を実行することによって、前記特徴情報を用いて前記画像データをクラスタリングすることを特徴とする請求項1乃至4の何れか1項に記載の画像処理システム。
【請求項6】
前記送信先決定手段は、前記クラスタリング手段によるクラスタリング結果と、前記名称決定手段によって決定された前記特定の名称に基づいて、前記画像データの送信先であるフォルダを決定することを特徴とする請求項1乃至5の何れか1項に記載の画像処理システム。
【請求項7】
原稿の画像を読みとって画像データを生成する読取工程と、
前記読取工程で生成した画像データの文字を認識し、文字情報を取得する文字認識工程と、
前記文字情報から特徴情報を抽出する抽出工程と、
前記特徴情報を用いて前記画像データをクラスタリングするクラスタリング工程と
前記クラスタリング工程によるクラスタリングよって生成されたクラスタごとに特定の名称を決定する名称決定工程と、
前記クラスタリング工程によるクラスタリング結果と、前記名称決定工程によって決定された前記特定の名称に基づいて、前記画像データの送信先を決定する送信先決定工程と、
前記送信先決定工程で決定された送信先に前記画像データを送信する送信工程とを有することを特徴とする画像処理方法。
【請求項8】
請求項1乃至6の何れか1項に記載の画像処理システムの各手段をコンピュータが実行するためのプログラム。
【発明の詳細な説明】
【技術分野】
【0001】
本発明は、画像処理システム、画像処理方法及びプログラムに関する。
【背景技術】
【0002】
特許文献1には、文書から読み取られた文字列が予め設定されたキーワードに該当する時に、そのキーワードに対応した文書種類を判別し、該当する文書種類に関する特定名称を電子データのファイル名として自動で付与することが記載されている。
【先行技術文献】
【特許文献】
【0003】
【発明の概要】
【発明が解決しようとする課題】
【0004】
しかしながら、特許文献1では、予めキーワードを設定しておく必要があり、大変な労力が必要になっていた。また、ユーザに設定されたキーワードが含まれない文書の文書種類を判別することができないといった問題も生じていた。
【0005】
本発明は上記課題を鑑みてなされたものであり、ユーザによって、文書を分類するためのキーワードが入力されることなく、スキャンした原稿の画像データを振り分け、ユーザの手間を減らすことを目的とする。
【課題を解決するための手段】
【0006】
本発明の画像処理システムは、原稿の画像を読みとって画像データを生成する読取手段と、前記読取手段が生成した画像データの文字を認識し、文字情報を取得する文字認識手段と、前記文字情報から特徴情報を抽出する抽出手段と、前記特徴情報を用いて前記画像データをクラスタリングするクラスタリング手段と前記クラスタリング手段によるクラスタリングよって生成されたクラスタごとに特定の名称を決定する名称決定手段と、前記クラスタリング手段によるクラスタリング結果と、前記名称決定手段によって決定された前記特定の名称に基づいて、前記画像データの送信先を決定する送信先決定手段と、前記送信先決定手段が決定した送信先に前記画像データを送信する送信手段とを有することを特徴とする。
【発明の効果】
【0007】
ユーザによって、文書を分類するためのキーワードが入力されることなく、スキャンした原稿の画像データを振り分け、ユーザの手間を減らすことができる。
【図面の簡単な説明】
【0008】
【
図2】画像処理装置101のハードウェア構成の一例を示す図
【
図3】機械学習サーバ102のハードウェア構成の一例を示す図
【
図4】画像処理装置101、機械学習サーバ102とデータサーバ105のソフトウェア構成の一例を示す図
【
図10】文書分類送信の処理の一例を示すフローチャート
【
図12】準備動作の処理の一例を示すフローチャート
【
図15】画像処理装置101、機械学習サーバ102とデータサーバ105のソフトウェア構成の一例を示す図
【
図16】機械学習部1514における学習モデルを用いた入出力の構造の一例を示す図
【
図19】学習フェーズと推定フェーズの処理の一例を示すフローチャート
【
図21】UI表示の処理の一例を示すフローチャート
【
図23】スキャンジョブを実行する際の処理の一例を示すフローチャート
【発明を実施するための形態】
【0009】
以下、本発明を実施するための形態について図面を用いて説明する。
【実施例0010】
<システム構成図>
図1は、システム構成の一例を示す図である。
図1の画像処理システムはプリンタ、複合機、FAXなどの画像処理装置101、機械学習サーバ102、データサーバ105、画像処理装置101に対するプリントデータの送信等を行う汎用コンピュータ103で構成されている。これらの機器は、有線LAN等のネットワーク104によって接続されている。データサーバ105は、機械学習サーバにおいて機械学習を行うために使用される学習データを外部機器から収集して機械学習サーバ102へ提供する役割を持っている。
【0011】
画像処理装置101は随時、生成された学習済みモデルを機械学習サーバから受信して特定のAI機能を実現可能になっている。また、機械学習サーバ102は、特定のAI機能実現するための学習済みモデルの学習に必要な学習データをデータサーバ105や画像処理装置101、汎用コンピュータ103等外部機器から受信する。そして、その一部または全部を用いて学習処理を行うことが可能である。
【0012】
図2は、画像処理装置101のハードウェア構成の一例を示す図である。画像処理装置101は、使用するユーザが各種の操作を行うための操作部140と、操作部140からの指示に従って画像情報を読み取るスキャナ部10と、画像データを用紙に印刷するプリンタ部20とを有する。
【0013】
スキャナ部10は、スキャナ部10を制御するCPUや原稿読取を行うための図示しない照明ランプや走査ミラーなどを有する。プリンタ部20は、プリンタ部の制御を行うCPUや画像形成や定着を行うための図示しない感光体ドラムや定着器を有する。
【0014】
また、画像処理装置101は、スキャナ部10や、プリンタ部20、LAN104や、公衆回線(WAN)3001、無線LAN106と接続されている画像処理装置の動作を統括的に制御するコントローラ1200とを備える。
【0015】
<画像処理装置-コントローラ構成>
図2を用いてコントローラ1200の内部について詳細に説明する。コントローラ1200は、LAN104を介してLAN上の汎用コンピュータ103から受信した印刷ジョブに含まれるPDLコードをビットマップイメージに展開するラスタイメージプロセッサ(RIP)1260を有する。また、コントローラ1200は、スキャナ部10から入力された画像データに対し補正、加工、編集を行うスキャナ画像処理部1280を有する。また、コントローラ1200は、プリンタ部20で出力(印刷)される画像データに対して補正、解像度変換等を行うプリンタ画像処理部1290と、画像データの回転を行う画像回転部1230とを有する。
【0016】
また、コントローラ1200は、多値画像データはJPEG、2値画像データはJBIG、MMR、又はMHの圧縮伸張処理を行う画像圧縮部1240を有する。また、コントローラ1200は、スキャナ部10及びプリンタ部20とコントローラ1200を接続して画像データの同期系/非同期系の変換を行うデバイスI/F1220を有する。更に、これらを互いに接続して画像データを高速で転送する画像バス1212を備えている。
【0017】
また、コントローラ1200は画像処理装置101を統括的に制御する制御部としてのCPU1201を有する。また、コントローラ1200は、CPU1201が動作するためのシステムワークメモリであり、画像データを一時記憶するための画像メモリでもあるRAM1202を有する。また、コントローラ1200は、操作部140とのインターフェース部1206を介して、操作部140に表示する画像データを操作部140に対して出力する。また操作部I/F1206は操作部140から本画像処理装置を使用するユーザが入力した情報をCPU1201に伝える役割を有する。また、コントローラ1200は、LAN104に接続され、汎用コンピュータ103やLAN104上の図示しないその他のコンピュータ端末との通信(送受信)を行うネットワーク部1210を有する。また、公衆回線3001に接続され、図示しない外部のファクシミリ装置とのデータの通信(送受信)を行うモデム部1211を有する。また、無線LAN106により外部の端末と接続する為の無線通信IF1270を備える。また、コントローラ1200は、CPU1201が実行するブートプログラムが格納されているROM1203と、システムソフトウェア、画像データ、ソフトウェアカウンタ値などを格納するハードディスクドライブ(HDD)1204を備える。また、スキャナ部10及びプリンタ部20と夫々通信を行う内部通信I/F1208と、これらを互いに接続するシステムバス1207とを備える。
【0018】
コントローラ1200は、システムバス1207及び画像バス1212を接続しデータ構造を変換するバスブリッジとして機能するImageBusI/F1205とを備える。
【0019】
コントローラ1200は、印刷やコピージョブ実行時の、ユーザ名や印刷部数、カラー印刷等、出力属性情報等をジョブ実行時の履歴をジョブログ情報としてHDD1204あるいはRAM1202に記録管理している。
【0020】
GPU1291はデータをより多く並列処理することで効率的な演算を行うことができるので、ディープラーニングのような学習モデルを用いて複数回に渡り学習を行う場合にはGPU1291で処理を行うことが有効である。
【0021】
<機械学習サーバ>
図3は、機械学習サーバ102のハードウェア構成の一例を示す図である。
【0022】
それぞれシステムバス1207で相互に接続されているCPU1301、RAM1302、ROM1303、HDD1304、ネットワーク部1310、IO部1305、GPU1306を有するように構成される。
【0023】
CPU1301は、OS(Operating System)やアプリケーションソフトなどのプログラムをHDD1304から読み出して実行することで種々の機能を提供する。RAM1302はCPU1301がプログラムを実行する際のシステムワークメモリである。ROM1303はBIOS(Basic Input Output System)やOSを起動するためのプログラム、設定ファイルを記憶している。HDD1304はハードディスクドライブであって、システムソフトウェアなどが記憶されている。ネットワーク部1310はLAN104に接続され、画像処理装置101などの外部機器と通信(送受信)を行う。IO部1305はマルチタッチセンサ等を備えた液晶ディスプレイ入出力デバイスとから構成する図示しない操作部との情報を入出力するインターフェースである。操作部にはプログラムが指示する画面情報に基づき所定の解像度や色数等で所定の情報が描画される。例えば、GUI(Graphical User Interface)画面を形成し、操作に必要な各種ウィンドウやデータ等が表示される。
【0024】
GPU1306はGPU1291と同様である。機械学習サーバ102による処理にはCPU1301に加えてGPU1306を用いる。機械学習サーバ102の処理はCPU1301またはGPU1306のみにより演算が行われても良い。
【0025】
画像処理装置101のGPU1291との使い分けについて記載する。ネットワークの通信やGPUの処理に要する負荷、画像処理装置101の省電力モード等に応じてGPUの計算資源を有効活用がされるようになっている。例えば、画像処理装置101が省電力モードに移行する場合、積極的に機械学習サーバ102側のGPUを活用できるようになっている。
【0026】
<本発明のシステムにおけるソフトウェア構成>
図4は、画像処理装置101、機械学習サーバ102とデータサーバ105のソフトウェア構成の一例を示す図である。図に示したソフトウェア構成を実現するためのプログラムは、その構成要素ごとにストレージに格納されており、RAMによみだされてCPUにて実行されるものである。例えば、画像処理装置101では、HDD1204に格納されていてRAM1202に読みだされてCPU1201にて実行されるものである。機械学習サーバ102や、データサーバ105も同様である。
【0027】
図示のソフトウェア構成は、以下の機能を実現するものである。例えば、画像処理装置101が原稿を読み取って生成した電子データから特徴を抽出し、クラスタリングする。そして、文書分類を行う準備動作と、新たに読み取った電子データのクラスタリング結果を用いて準備動作で分類したカテゴリに分類し特定名称を設定する機能である。
【0028】
画像処理装置101のソフトウェアは、データ記憶部402、JOB制御部403、UI表示部401、画像読み取り部404、特定名称付与部405、文書分類特定部406から構成される。
【0029】
機械学習サーバ102のソフトウェアは、特徴量抽出部413、機械学習部414、クラスタリング解析部415、サーバデータ記憶部416から構成される。データサーバ105においては、データ収集・提供部410とデータ記憶部412とから構成される。
【0030】
UI表示部401は、
図2に示す操作部I/F1206を介して操作部140に備える画面に対してユーザからの操作設定を受け付けやその操作受付画面の提供をする。特定名称付与部405が用いる名称をユーザに入力させる機能的役割を有している。
【0031】
データ記憶部402は、
図2に示したハードウェア構成におけるRAM1202やHDD1204に対して、電子データなど、画像処理装置101が入出力を行うデータの記録を行う機能的役割を有する。
【0032】
JOB制御部403は、ユーザの指示に基づきコピーやファックス、プリント、スキャン画像送信等の画像処理装置101の基本機能の実行や基本機能の実行に伴い他のソフト構成要素間の指示やデータの送受信を中心的に行う機能的役割を有する。画像読み取り部404から受け取った画像データをOCRで文字データを含む電子データに変換する機能を有する。なお、画像データのOCRによる変換は、機械学習サーバ102、データサーバ105で行ってもよい。
【0033】
画像読み取り部404は、JOB制御部403の指示に基づきコピーやスキャン機能を実行する制御を行う場合に
図2示したスキャナ10により原稿を光学的に読み取る動作を行う機能的役割を有している。
【0034】
特定名称付与部405は、JOB制御部403から受け取った電子データに付与する特定名称を決定する機能的役割を有する。特定名称付与部405は文書分類特定部406に電子データを渡し電子データの文書分類結果としてクラスタ識別IDを受け取る。受けったクラスタ識別IDに対応する文字列をJOB制御部に渡す。また、UI表示部401からクラスタリング解析部415で作成済みの文書分類情報に含まれる各カテゴリに対応する特定名称の入力を受け付け、データ記憶部402に記憶する役割を有する。
【0035】
文書分類特定部406は、クラスタリング解析部415で作成済みの文書識別情報を用いて電子データの文書を分類しカテゴリを返す機能的役割を有する。
【0036】
データサーバ105は、データ収集・提供部410とデータ記憶部412とから構成される。
【0037】
データ収集・提供部410は、機械学習サーバ102において学習するための学習データの収集と提供を行う機能的役割を有している。本発明のシステムにおいては画像処理装置101から電子データの受信を行って、機械学習サーバ102へ提供する機能的役割を有している。また、収集先は、画像処理装置101の他の画像処理装置、汎用コンピュータ103や他のデータサーバから収集してもよく、目的の機械学習をさせるために必要なデータの収集が可能になっている。データ記憶部412は、収集した学習データの記録管理を行う機能的役割を有している。
【0038】
機械学習サーバ102は、特徴量抽出部413、機械学習部414、クラスタリング解析部415、データ記憶部412から構成される。機械学習サーバ102は、
図2に示したハードウェアリソースであるGPU1306やCPU1301を使用して各処理を実行する。
【0039】
特徴量抽出部413は、学習用データである複数の電子データのそれぞれから特徴情報を抽出し、抽出した特徴情報を用いて各学習用データをベクトル化する。特徴量抽出部は、形態素情報、品詞情報、構文・意味情報、文字・単語N-gram、任意の単語、句読点の数、および、過去形の単語の数などのうちの1つまたは複数を特徴情報として抽出する。これらの情報はベクトルの素性となる。各素性のスコアは二値でもよいし、出現数やTf-idf(Term Frequency-Inverse Document Frequency)値等でもよい。また、特徴量抽出部413は、辞書等を利用することで同類語を同一素性として扱ってもよいし、Tf-idf値にしきい値を設けてノイズとなり得る素性を除去し、ベクトルの次元を圧縮してもよい。
【0040】
機械学習部414は、特徴量抽出部413によって抽出された特徴量情報に基づき、類似した特徴情報を有する学習用データを同一のクラスタに分類する。具体的には、機械学習部414は、Repeated Bisection法、K-means法またはLDA(Latent Dirichlet Allocation)法などの手法を用いることで、ベクトル表現された電子データをクラス分けする。例えば、機械学習部414は特徴情報の出現頻度が類似する学習用データを同一のクラスタに分類する。機械学習部414は、クラスタを識別するためのクラスタ識別IDを各クラスタに付与し、クラスタリング結果を作成する。
【0041】
クラスタリング解析部415は、特徴量抽出部413によって抽出された特徴量情報と機械学習部414によって作成されたクラスタリング結果に基づき、文書分類情報を作成する。文書分類情報は、電子データに対応する特徴量情報の素性からキーワードとなる単語を抽出し、クラスタごとにまとめられている。なお、抽出するキーワードは素性のスコアによる一定のしきい値を設けて数を絞ってもよい。
【0042】
サーバデータ記憶部416は、データサーバ105から受信したデータや生成された学習データを
図3に示すRAM1302やHDD1304へ一時記録を行う。
【0043】
<第1の実施例>
以下、本発明を実施するための第1の実施例について図面を用いて説明する。
【0044】
図5に示すフローチャートを参照して、画像処理装置の文書分類を行うための準備処理についての動作を説明する。
図5は、準備動作の処理の一例を示すフローチャートである。
【0045】
まず、S501でJOB制御部403は、ユーザからUI表示部401を経由して文書分類準備処理実行の指示を受け、学習用の電子データを作成する。電子データを作成する単位は、画像読み取り部404が読み取る原稿1ページごとでもよいし、ユーザが指定したページ単位でもよい。学習用の電子データ作成完了後、データ収集・提供部410に送信する。
【0046】
S502で特徴量抽出部413は、データサーバ105のデータ記憶部412から複数の学習用の電子データを取得し、電子データから特徴情報を抽出する。特徴情報の抽出は、前述した方法を用いて、例えば、
図6(a)、(b)に示すような電子データごとに単語と出現数を表したデータを生成する。
図6は単語出現数のデータの一例を示す図である。
【0047】
S503で機械学習部414は、機械学習処理を実行し、特徴量抽出部413が生成した特徴情報を用いてクラスタリングする。クラスタリングは、前述した方法を用いて、例えば、
図7に示すようなクラスタ識別IDと分類した電子データを対応付けたクラスタリング結果を生成する。
【0048】
【0049】
S504でクラスタリング解析部415は、機械学習部414が生成したクラスタリング結果を用いてクラスタリング解析を実行する。クラスタリング解析によって、例えば、
図8に示すようなクラスタ識別IDに対応した1つ、または複数のキーワードを対応付けた文書分類情報が生成される。
図8は、文書分類情報の一例を示す図である。
【0050】
文書分類情報に載せるキーワードの選定は、予め決められた数分を同じクラスタ識別IDに属する文書群から出現数が高いキーワードで選定する方法がある。さらに、辞書等を利用することで同類語を同一キーワードとして扱ってもよいし、Tf-idf値にしきい値を設けてノイズとなり得るキーワードを除去した上で選定を行ってもよい。文書分類情報には後述する特定名称を付与するための領域が用意されている。文書分類情報の生成完了後、データ収集・提供部410に送信する。
【0051】
図8のテーブルは上述したようにクラスタリング解析部415がクラスタリング解析を行うことで、複数のキーワードが一つのクラスタとして作成されて、それぞれのクラスタに識別IDが対応づけられる。さらに、そのクラスタ識別IDごとに、ユーザが特定名称を指定することができる。
【0052】
図8のテーブルの作り方は、上記のようであってもいいが、ユーザが複数キーワードをクラスタに分けて入力し、そのクラスタごとに特定名称を指定するようにしてもよい。
【0053】
S505で特定名称付与部405は、データサーバ105のデータ記憶部412から文書分類情報を取得し、操作部140に特定名称設定画面を表示し、ユーザから特定名称の入力を受け付け、文書分類情報を更新する。ユーザからの入力受付画面では、例えば、
図9に示すような画面からクラスタ識別IDを選択して、図示しない特定名称画面でユーザが入力した名称を文書分類情報に登録する。更新した文書分類情報はデータ記憶部402に記憶する。
図9は、特定名称設定画面の一例を示す図である。
【0054】
次に、
図10に示すフローチャートを参照して、画像処理装置の文書分類送信実行についての動作を説明する。
図10は、文書分類送信の処理の一例を示す図である。
【0055】
まず、S1001でJOB制御部403は、ユーザからUI表示部401を経由して文書送信ジョブの指示を受け、ジョブ実行を開始する。送信ジョブは、例えば、指定されたメールアドレスに電子データを送信するEメール送信や指定されたファイルサーバのフォルダに電子データを送信するファイル送信である。
【0056】
S1002でJOB制御部403は、スキャナに原稿を読み取らせ、画像データを生成する。
【0057】
S1003でJOB制御部403は、特定名称付与部405に画像データを渡し、さらに、特定名称付与部405は、文書分類特定部406に電子データを渡す。文書分類特定部406は、データ記憶部402に記憶されている文書分類情報のクラスタ識別IDごとのキーワードが画像データに含まれるか否かを判定する。なお、画像データに文字が含まれるか否かの判定は、画像データに文字認識処理を実行し、画像データの文字を認識し、文字情報を取得することによって行われる。画像データにキーワードが含まれる場合はS1004に進み、含まれない場合はS1006に進む。つまり、ここではあらかじめ生成された各クラスタのうちのどのクラスタに分類されうるかを判定している。
【0058】
図11は文書の一例を示す図である。例えば、
図8の文書分類情報を使用して、
図11の文書(a)に含まれる文字は、クラスタ識別ID1のキーワード「問診」「症状」「病院」と、クラスタ識別ID2のキーワード「病院」に一致する。
図11の文書(b)に含まれる文字は、クラスタ識別ID1のキーワード「病院」と、クラスタ識別ID2のキーワード「見積」「病院」「御中」「金額」に一致する。
【0059】
S1004で文書分類特定部406は最もキーワードに一致するスコアの高かったクラスタ識別IDを特定名称付与部405に通知し、特定名称付与部405はクラスタ識別IDに対応する特定名称をJOB制御部403に通知する。つまり。一番スコアの高かったクラスタを分類先のクラスタとして扱う。
【0060】
例えば、クラスタ識別ID1と2のキーワードに一致する
図11の文書(a)の場合、それぞれのキーワードに一致する数をスコアとして扱い、一致する数の多いクラスタ識別ID1の特定名称が通知される。スコアは、単純な一致数ではなく、図示しないキーワードの出現数に基づきキーワード毎に重みづけをして算出してもよい。なお、特定名称が未登録の場合は操作部140に特定名称設定画面を表示し、ユーザから特定名称の入力を受け付け、文書分類情報を更新する。ユーザからの入力受付画面では、例えば、
図9に示すような画面からクラスタ識別IDを選択して、図示しない特定名称画面でユーザが入力した名称を文書分類情報に登録する。更新した文書分類情報はデータ記憶部402に記憶する。
【0061】
S1005でJOB制御部403は通知された特定名称を用いて送信ジョブを実行し、フローチャートを終了する。例えば、Eメール送信を実行する場合は、送信するファイル名に特定名称を付与し、
図11の文書(a)の場合は、「受付業務_20201126_0001.pdf」といったファイル名に決定する。ファイルサーバへの送信を実行する場合は、送信先のフォルダに特定名称をフォルダ名にしたフォルダを作成し、そのフォルダにファイルを送信する。このように、ファイルサーバにファイルを送信するときは、特定名称とクラスタリング結果に基づいて送信先が決定される。この時に送信されるファイルのファイル名においても、特定名称が使用されてよい。
【0062】
S1006で文書分類特定部406は特定名称付与部405を経由してJOB制御部403に結果を通知する。JOB制御部403は通知を受け、操作部140に図示しないジョブ継続確認画面を表示し、ユーザからの指示を受ける。ユーザからジョブ継続の指示を受けた場合はS1008に進み、ジョブ中止の指示を受けた場合はジョブ実行を中止しフローチャートを終了する。
【0063】
S1008でJOB制御部403は特定名称を用いずに送信ジョブを実行し、フローチャートを終了する。
【0064】
以上の実施例により、ユーザの手を介さず、クラスタリング手法を用いて読み取った原稿から文書の分類に用いる文書分類情報を生成することが可能となった。
第1の実施例は機械学習サーバ102の特徴量抽出部413、機械学習部414、クラスタリング解析部415を用いて文書分類情報を生成したが、第2の実施例ではそれら機械学習の手法は用いず、予め決められたルールに基づいて文書分類情報を生成する。
S1202でJOB制御部403は、ユーザからUI表示部401を経由して原稿読み取り開始指示を受け、学習用の電子データを作成する。電子データを作成する単位は、画像読み取り部404が読み取る原稿1ページごとでもよいし、ユーザが指定したページ単位でもよい。
S1205でJOB制御部403は文書分類情報の中のユーザが指定したクラスタ識別IDにキーワードを登録する。更新した文書分類情報はデータ記憶部402に記憶する。
以上の実施例により、読み取った原稿からキーワードを抽出し、ユーザに分類先の指示を受ける分類学習処理を実行することで、ユーザが予めキーワードを全て把握しておく必要がなく、文書分類情報を生成することが可能となった。