(19)【発行国】日本国特許庁(JP)
(12)【公報種別】特許公報(B2)
(11)【特許番号】
(24)【登録日】2024-07-08
(45)【発行日】2024-07-17
(54)【発明の名称】ワークフロー支援装置、ワークフロー支援システム及びプログラム
(51)【国際特許分類】
G06Q 10/0633 20230101AFI20240709BHJP
【FI】
G06Q10/0633
(21)【出願番号】P 2019155624
(22)【出願日】2019-08-28
【審査請求日】2022-07-21
【前置審査】
(73)【特許権者】
【識別番号】000005496
【氏名又は名称】富士フイルムビジネスイノベーション株式会社
(74)【代理人】
【識別番号】110001519
【氏名又は名称】弁理士法人太陽国際特許事務所
(72)【発明者】
【氏名】岩瀬 和寿
【審査官】円子 英紀
(56)【参考文献】
【文献】特開2006-126941(JP,A)
【文献】特開2002-109468(JP,A)
【文献】米国特許出願公開第2014/0164914(US,A1)
【文献】特開平09-069130(JP,A)
【文献】特開2009-212613(JP,A)
(58)【調査した分野】(Int.Cl.,DB名)
G06Q 10/00-99/00
(57)【特許請求の範囲】
【請求項1】
原稿を読み込んで取得した画像データから原稿に含まれる文書を分類する分類手段と、
前記分類手段により分類された文書から、該文書を添付すべきワークフローを検索するワークフロー検索手段と、
前記分類手段により分類された文書のうち、関連性がある文書を文書群としてまとめるように分割する分割手段と、を有し、
前記ワークフロー検索手段は、抽出文字列、前記分類手段により分類された文書分類、及びワークフロー検索結果から学習して得られた検索条件によりワークフローを検索する、
ワークフロー支援装置。
【請求項2】
前記分類手段は、ページ毎に主文書と付属文書とに分けて分類する請求項1記載のワークフロー支援装置。
【請求項3】
前記分類手段は、前記画像データから抽出した抽出文字列から主文書と付属文書とに分ける請求項2記載のワークフロー支援装置。
【請求項4】
前記分類手段は、前記画像データから抽出した抽出文字列が予め定められた分類用キーワードを含むか否かを判定して文書を分類する請求項3記載のワークフロー支援装置。
【請求項5】
前記分類手段は、前記抽出文字列のうち、予め定められた分類用キーワードを含み、且つ予め定められた選定条件を満たす特徴語を含むか否かを判定して文書を分類する請求項4記載のワークフロー支援装置。
【請求項6】
前記分類手段は、前記抽出文字列のうち、文字列のサイズ及び色について予め定められた選定条件を満たす特徴語を含むか否かを判定して文書を分類する請求項5記載のワークフロー支援装置。
【請求項7】
前記分類手段は、抽出文字列及び文書分類結果から学習して得られた分類条件により文書を分類する請求項1から3いずれか
1項に記載のワークフロー支援装置。
【請求項8】
原稿を読み取る画像読取手段と、
前記画像読取手段により読み取った画像データから原稿に含まれる文書を分類する分類手段と、
前記分類手段により分類された文書から、該文書を添付すべきワークフローを検索するワークフロー検索手段と、
前記分類手段により分類された文書のうち、関連性がある文書を文書群としてまとめるように分割する分割手段と、を有し、
前記ワークフロー検索手段は、抽出文字列、前記分類手段により分類された文書分類、及びワークフロー検索結果から学習して得られた検索条件によりワークフローを検索する、
ワークフロー支援システム。
【請求項9】
原稿を読み込んで取得した画像データから原稿に含まれる文書を分類する
分類ステップと、
前記分類ステップにおいて分類された文書から、該文書を添付すべきワークフローを検索する
検索ステップと、
前記分類ステップにおいて分類された文書のうち、関連性がある文書を文書群としてまとめるように分割する分割ステップと、をコンピュータに実行させるためのプログラムであって、
前記検索ステップでは、抽出文字列、前記分類ステップおいて分類された文書分類、及びワークフロー検索結果から学習して得られた検索条件によりワークフローを検索する、
プログラム。
【発明の詳細な説明】
【技術分野】
【0001】
本発明は、ワークフロー支援装置、ワークフロー支援システム及びプログラムに関する。
【背景技術】
【0002】
特許文献1は、タスク構成が動的に変化する動的なワークフローの支援システムに、画像機器を利用したワークフロー支援システムであって、画像透かし技術を用いて紙面に印刷された情報を読み取りデジタルデータ化する手段と、紙面に印刷された情報を文字認識技術を用いてデジタルデータ化する手段と、のうち少なくとも何れか1 つを有し、該デジタルデータを利用して、ワークフローの構成もしくは状態を変化させるための手段を有することを特徴とする画像機器を利用したワークフロー支援システムを開示する。
【0003】
特許文献2は、予め登録された複数のワークフローの中から選択されたワークフローを処理するワークフロー処理装置において、表示部に、少なくともログイン画面とワークフローの一覧画面と当該一覧画面から遷移するワークフローの検索画面とを表示させる制御部を備え、前記制御部は、前記一覧画面には、前記複数のワークフローの中から、ログインユーザを特定する情報を含む第1の情報に基づいて検索した1以上のワークフローをデフォルトとして表示させ、前記検索画面には、前記複数のワークフローの中から、前記ログインユーザを特定する情報を含まない第2の情報に基づいて検索した1以上のワークフローをデフォルトとして表示させる、ことを特徴とするワークフロー処理装置を開示する。
【先行技術文献】
【特許文献】
【0004】
【文献】特開2006-243830号公報
【文献】特開2010-198430号公報
【発明の概要】
【発明が解決しようとする課題】
【0005】
ところで、従来、ワークフローの選択情報をQRコード(登録商標)にして記録媒体に印刷し、それをカバーシートとして証憑に挟み込み、このカバーシートを読み取ることにより、証憑の自動仕分けとワークフロー選択の自動化を行うことが知られている。
なお、ワークフローとは、組織における業務の一連の流れをいう。また、証憑とは、取引の成立を立証する書類をいい、経理関係においては、請求書、納品書、領収書等をいう。
【0006】
本発明は、原稿に文書の特徴を示す記録媒体を挟むことなく原稿の文書を分類して、文書を添付するワークフローを起動することができるワークフロー支援装置、ワークフロー支援システム及びプログラムを提供することを目的としている。
【課題を解決するための手段】
【0007】
請求項1に係る本発明は、原稿を読み込んで取得した画像データから原稿に含まれる文書を分類する分類手段と、前記分類手段により分類された文書から、該文書を添付すべきワークフローを検索するワークフロー検索手段と、前記分類手段により分類された文書のうち、関連性がある文書を文書群としてまとめるように分割する分割手段と、を有し、
前記ワークフロー検索手段は、抽出文字列、前記分類手段により分類された文書分類、及びワークフロー検索結果から学習して得られた検索条件によりワークフローを検索するワークフロー支援装置である。
【0008】
請求項2に係る本発明は、前記分類手段は、ページ毎に主文書と付属文書とに分けて分類する請求項1記載のワークフロー支援装置である。
【0009】
請求項3に係る本発明は、前記分類手段は、前記画像データから抽出した抽出文字列から主文書と付属文書とに分ける請求項2記載のワークフロー支援装置である。
【0010】
請求項4に係る本発明は、前記分類手段は、前記画像データから抽出した抽出文字列が予め定められた分類用キーワードを含むか否かを判定して文書を分類する請求項3記載のワークフロー支援装置である。
【0011】
請求項5に係る本発明は、前記分類手段は、前記抽出文字列のうち、予め定められた分類用キーワードを含み、且つ予め定められた選定条件を満たす特徴語を含むか否かを判定して文書を分類する請求項4記載のワークフロー支援装置である。
【0012】
請求項6に係る本発明は、前記分類手段は、前記抽出文字列のうち、文字列のサイズ及び色について予め定められた選定条件を満たす特徴語を含むか否かを判定して文書を分類する請求項5記載のワークフロー支援装置である。
【0013】
請求項7に係る本発明は、前記分類手段は、抽出文字列及び文書分類結果から学習して得られた分類条件により文書を分類する請求項1から3いずれか1項に記載のワークフロー支援装置である。
【0018】
請求項8に係る本発明は、原稿を読み取る画像読取手段と、前記画像読取手段により読み取った画像データから原稿に含まれる文書を分類する分類手段と、前記分類手段により分類された文書から、該文書を添付すべきワークフローを検索するワークフロー検索手段と、前記分類手段により分類された文書のうち、関連性がある文書を文書群としてまとめるように分割する分割手段と、を有し、
前記ワークフロー検索手段は、抽出文字列、前記分類手段により分類された文書分類、及びワークフロー検索結果から学習して得られた検索条件によりワークフローを検索するワークフロー支援システムである。
【0019】
請求項9に係る本発明は原稿を読み込んで取得した画像データから原稿に含まれる文書を分類する分類ステップと、前記分類ステップにおいて分類された文書から、該文書を添付すべきワークフローを検索する検索ステップと、前記分類ステップにおいて分類された文書のうち、関連性がある文書を文書群としてまとめるように分割する分割ステップと、をコンピュータに実行させるためのプログラムであって、前記検索ステップでは、抽出文字列、前記分類手段により分類された文書分類、及びワークフロー検索結果から学習して得られた検索条件によりワークフローを検索するプログラムである。
【発明の効果】
【0020】
請求項1、8又は9に係る本発明によれば、原稿に文書の特徴を示す記録媒体を挟むことなく原稿の文書を分類して、文書を添付するワークフローを起動することができる。
また、請求項1、8又は9に係る本発明によれば、分類された文書を文書群としてまとめることができる。
さらに、1、8又は9に係る本発明によれば、ワークフロー検索条件を機械学習により求めることができる。
【0021】
請求項2に係る本発明によれば、請求項1に係る本発明の効果に加えて、主文書と付属文書とを分けて分類することができる。
【0022】
請求項3に係る本発明によれば、請求項2に係る本発明の効果に加えて、画像データそのものから文書を分類するものと比較して、正確に文書を分類することができる。
【0023】
請求項4に係る本発明によれば、請求項3に係る発明の効果に加えて、文書全体の単語から分類するものと比較して、簡単に文書を分類することができる。
【0024】
請求項5に係る本発明によれば、請求項4に係る本発明の効果に加えて、選定条件を絞り込むことができる。
【0025】
請求項6に係る本発明によれば、請求項6に係る本発明の効果に加えて、文字列のサイズ及び色により選定条件を絞り込むことができる。
【0026】
請求項7に係る本発明によれば、請求項1から3いずれかに係る本発明の効果に加えて、分類条件を機械学習により求めることができる。
【図面の簡単な説明】
【0031】
【
図1】本発明の実施形態に係るワークフロー支援システム全体を示すブロック図である。
【
図2】本発明の実施形態に係るワークフロー支援装置のハードウエアを示すブロック図である。
【
図3】本発明の実施形態に係るワークフロー支援装置の機能を示すブロック図である。
【
図4】本発明の実施形態に係るワークフロー支援システムに使用する証憑の一例を示し、
図4(a)は納品書、
図4(b)は明細書を示す平面図である。
【
図5】本発明の実施形態に係るワークフロー支援装置における画像解析結果を示し、
図5(a)は、送付状の解析結果を示す図表であり、
図5(b)は、送付状の解析結果を示す平面図である。
【
図6】本発明の実施形態に係るワークフロー支援装置の文書分類部で用いられた特徴語パラメータを示す図表である。
【
図7】本発明の実施形態に係るワークフロー支援装置による抽出文字列と特徴語を示す図表である。
【
図8】本発明の実施形態に係るワークフロー支援装置の文書分類部で用いられた分類辞書を示す図表である。
【
図9】本発明の実施形態に係るワークフロー支援装置の文書分類部により分類された文書の一例を示す説明図である。
【
図10】本発明の実施形態に係るワークフロー支援装置の文書分割部により分割する流れを示す説明図である。
【
図11】本発明の実施形態に係るワークフロー支援装置の文書分割部により分割した結果を示す説明図である。
【
図12】本発明の実施形態に係るワークフロー支援装置により出力されるワークフロー登録画面を示す画面図である。
【
図13】本発明の実施形態に係るワークフロー支援装置のワークフロー記憶部に登録されるワークフローリストを示す図表である。
【
図14】本発明の実施形態に係るワークフロー支援装置のワークフロー検索部で用いたワークフロー起動点数テーブルを示す図表である。
【
図15】本発明の実施形態に係るワークフロー支援装置のワークフロー検索部で用いたワークフロー起動点数テーブルを用いてワークフローを点数化した結果を示す図表である。
【
図16】本発明の実施形態に係るワークフロー支援装置のワークフロー検索部で用いたワークフロー起動点数テーブルを用いてワークフローを点数化した結果からワークフロー制御部でワークフローを起動する流れを示す説明図である。
【
図17】本発明の実施形態に係るワークフロー支援装置の全体の流れを示すフローチャートである。
【
図18】本発明の実施形態に係るワークフロー支援装置のワークフロー検索からワークフローを起動するまでの制御フローを示すフローチャートである。
【
図19】本発明の実施形態に係るワーク府r-支援装置において、保留状態となったときに出力される画面を示す画面図である。
【発明を実施するための形態】
【0032】
次に、本発明の実施の形態について図面を参照して詳細に説明する。
図1は、本発明の実施形態に係るワークフロー支援システム10の全体を示す。
【0033】
ワークフロー支援システム10は、ワークフロー支援装置を構成するサーバ12、パーソナルコンピュータ14,14及び画像形成装置16がネットワーク18を介して接続されている。画像形成装置16は、プリント機能、ファクシミリ機能、スキャン機能等を有する、いわゆる複合機であり、自動原稿送り装置付きの画像読取装置20が設けられている。ネットワーク18は、ローカルエリアネットワークでもよいし、インターネットでもよい。
【0034】
図2は、サーバ12のハードウエアを示すブロック図である。
サーバ12は、CPU22、メモリ24、記憶装置26、入出力インターフェイス28及び通信インターフェイス30を有し、これらCPU22、メモリ24、記憶装置26、入出力インターフェイス24及び通信インターフェイス30がバス32を介して接続されている。
【0035】
CPU22は、メモリ24に格納された制御プログラムに基づいて予め定められた処理を実行する。記憶装置26は、例えばハードディスクから構成され、必要とされるソフトウエアやデータが記憶されている。入出力インターフェイス28は、図示しないディスプレイやキーボードに接続され、これらとのデータの入出力を行う。通信インターフェイス30は、前述したネットワーク18を介してデータが入出力される。
【0036】
図3は、この実施形態に係るワークフロー支援装置の機能を示すブロック図である。
【0037】
画像データ受付部34は、例えば前述した画像形成装置16の画像読取装置20により読み取られた画像を受け付ける。
以下、証憑を受け付けた例について説明する。
【0038】
画像解析部36は、画像データ受付部34により受け付けた画像データに対してページ毎に画像を解析する。画像解析は、OCR(optical character readerの略であり、光学式文字読み取り装置を意味するが、ここでは、画像データをテキストデータに変換することをいう。)処理により行われる。
【0039】
図4(a),(b)には、画像データ受付部34により受け付けた文書の例として納品書37及びこの納品書36に付属する明細書38が示されている。納品書37では、「納品書」という文字列が最初の位置行目に記載され、2行目以降に宛先、担当者、納品番号、納品日、件名、送付者の名称及び住所等、合計金額並びに個別番号の摘要、数量及び単価等が記載されている。これらの記載は、文字列として画像解析部36により抽出される。また、明細書38では、「明細書」の記載の他に、納品書の納品番号と同じ納品番号が記載され、画像解析部36により文字列として抽出される。
【0040】
画像解析部36は、ページ毎に画像解析を行い、その画像中の座標位置と文字を読み込む。隣り合った文字は一つの文字列として認識する。抽出された文字列(以下、抽出文字列という。)、この抽出文字列の矩形座標位置(左上、左下、右上、右下)を抽出する。さらに、文字列の文字のサイズ及び文字の色を抽出してもよい。文字のサイズは、例えば抽出文字列の文字数、矩形座標の幅及び高さから計算することができる。
【0041】
図5には、画像解析した結果の例を示されている。
図5(b)に示すように、送付状40には、例えば「送付状」及び「2019年1月1日」なる文字列が含まれている。文字認識結果は、
図5(a)に示すようにリストにして解析結果記憶部42に記憶される。即ち、「送付状」及び「2019年1月1日」のそれぞれの抽出文字列、矩形座標位置、文字サイズ及び文字色が解析結果として解析結果記憶部42に記憶される。
なお、画像解析部36により抽出するのは、上記したページ番号、抽出文字列、矩形座標位置、文字サイズ、文字色以外に、例えば矩形座標位置から計算した矩形座標位置面積等を含めることができる。
【0042】
文書分類部44は、画像解析部36により解析された文字列から各ページがどのような文書であるかを分類する。まず、文書分類部44は、特徴語パラメータ分類表記憶部45に記憶された特徴語パラメータにより特徴語を抽出する。特徴語とは、ページを特徴付ける文字列である。特徴語パラメータとは、特徴語を抽出するための尺度をいう。
【0043】
特徴語パラメータは、
図6に示すように、例えば文字サイズがそのページ内で2番目以内である、文字色が黒以外である、等を選定条件とするように設定されている。
【0044】
特徴語を抽出する具体例について説明する。
図7には、1ページ目が送付状で、2ページ目が領収書である画像解析結果が示されている。
図6に示した特徴語パラメータにより特徴語を抽出すると、
図7に示した結果となる。即ち、1ページ目においては、文字サイズが上位2番目までという特徴語パラメータにより「送付状」及び「富士太郎様」が抽出され、文字色が黒以外という特徴語は無いので、それ以外の文字列は抽出されない。2ページ目においては、文字サイズが上位2番目までという特徴語パラメータにより「領収書」及び「××株式会社」が抽出され、文字が黒以外という特徴語パラメータにより「領収書番号」が抽出される。
【0045】
次に、文書分類部44は、特徴語の抽出結果を用いてページ区切りを決定する。文書分類部44は、分類辞書記憶部46に記憶された分類辞書を用いて、主文書、付属文書お及び続き文書に分類する。分類辞書は、予め定められた分類用キーワードに対応して分類種別候補が規定されている。例えば
図8に示すように、分類用キーワードとして、領収書、請求書、invoice、納品書、受領書は、主文書候補であり、明細書、送付状、仕様書は、付属文書候補であり、分類用キーワードがない場合は、続き文書である。
なお、主文書とは、主体となる文書であり、付属文書とは、主文書に付属する文書であり、続き文書とは、前の頁に続く文書である。ここでは、主文書候補、付属文書候補、としているのは、後の処理により変更される場合があるからである。
【0046】
文書分類部44は、前述した特徴語が分類用キーワードに存在するか否か、存在する場合にはそれが主文書候補又は付属文書候補かを決定する。分類用キーワードが特徴語に存在しない場合は、続き文書とする。
【0047】
図9には、ページ区切りを行った例が示されている。
この例においては、1ページ目は、特徴語に分類用キーワード「送付状」が含まれているので、「付属文書」に分類され、2ページ目は、特徴語に分類用キーワード「請求書」が含まれているので、「主文書」に分類され、3ページ目は、特徴語に分類用キーワード「明細書」が含まれているので、「付属文書」に分類され、4ページ目は、特徴語に分類用キーワードが含まれていないので、「続き文書」に分類され、5ページ目は、特徴語に分類用キーワード「領収書」が含まれているので、「主文書」に分類され、6ページ目は、特徴語に分類用キーワードが含まれないので、「続き文書」に分類され、7ページ目は、同じく特徴語に分類キーワードが含まれていないので、「続き文書」に分類される。
【0048】
なお、上記実施形態にあっては、分類辞書は、予め定められた分類用キーワードを用いて文書を分類するようにしたが、機械学習により文書の分類を行うようにしてもよい。即ち、前述した分類部44には学習部48が接続され、この学習部48は、特徴語を入力し、文書分類の結果を教師データとして特徴語に対する文書の種類を機械学習データ記憶部49に蓄積し、この蓄積されたデータから特徴語による文書の種類を決定するようにしてもよい。
【0049】
文書分割部50は、文書分類部44により分類された文書を文書群としてまとめるようにして分割する。まずステップ1として、まず続き文書は、そのページの前までに出る主文書又は続き文書と同じ文書とし、文書くぐりページを作成する。
図10に示す例においては、4ページ目の「続き文書」は、3ページ目の「付属文書」と同じ「付属文書」としてページ区切りを作成し、6ページ目及び7ページ目の「続き文書」は、5ページ目の「付属文書」と同じ「付属文書」としてページ区切りを作成する。以上により、このステップ1においては、1ページ目、2ページ目、3ページ目及び4ページ目、5ページ目から7ページ目、としてページ分割する。
【0050】
次にステップ2として、主文書に続く付属文書は一つの文書群とする。
図10に示す例においては、2ページ目の「主文書」及びこれに続く3ページ目及び4ページ目の「付属文書」は第1の文書群として、5ページ目の「主文書」及びこれに続く6ページ目及び7ページ目の「付属文書」は第2の文書群としてそれぞれ分割する。
【0051】
次にステップ3として、ステップ2により分割した文書群に属さない付属文書は、該付属文書の直後の文書群に含める。
図10に示す例においては、1ページ目の「付属文書」は、第1の文書群に含めることになる。
【0052】
以上の処理により、
図11に示すように、1ページ目から7ページ目までの文書は、1ページ目から4ページ目までの第1の文書群と、5ページ目から7ページ目までの第2の文書群にまとめて分割される。
【0053】
なお、上記実施形態においては、主文書と付属文書とに分けてから文書群を分割するようにしているが、
図4に示すように、納品書37と明細書38とには、共通する納品番号が付されている場合は、この納品番号から納品書37と明細書38とは、1つの文書群であると判断するようにしてもよい。
【0054】
ワークフロー登録部52は、予め作成されているワークフローを選択してワークフロー記憶部54にワークフローを記憶させる。ワークフロー登録部52には、表示データ生成部56が接続され、この表示データ生成部56によって生成されたワークフロー登録画面がパーソナルコンピュータ14,14に送られ、このワークフロー登録画面からワークフローを登録する。
【0055】
図12には、ワークフロー登録画面58の一例が示されている。ワークフロー登録画面58には、ワークフロー登録入力部60、ワークフロー検索用キーワード入力部62及び起動条件入力部64が設けられている。ワークフロー登録入力部60は、予め作成してあるワークフローから登録するワークフローを選択する。予め作成してあるワークフローには、ワークフロー名及び識別子(IDのことをいう。)が付されている。
図12に示す例においては、請求書ワークフロー(ID:1)となっている。また、ワークフロー検索用キーワード入力部62は、後述するワークフローを検索する上でのキーワードを入力する。
図12に示す例では、請求書、Invoice、領収書である。起動条件入力部64は、キーワードで選択したワークフローを自動で起動させる場合の条件を入力する。
図12に示した例では、「主文書必須」又は「主文書又は付属文書」を選択するようになっている。「主文書必須」を選択した場合は、前述した文書分割部50において分割した文書群に主文書が含まれている場合は、ワークフローを自動的に起動し、主文書が含まれていない場合は、自動的に起動するのを禁止する。「主文書又は付属文書」を選択した場合は、文書群に主文書又は付属文書があれば自動的に起動し、主文書又は付属文書のいずれも含まれていない場合は、自動的に起動するのを禁止する。
【0056】
なお、起動条件は、他に「主文書及び付属文書必須」として主文書及び付属文書が文書群に含まれている場合のみ自動的に起動するようにしてもよい。また、「その他」という選択肢を設け、画像解析部36で解析した文字列のうち、金額と認識できる数字の存在の有無、納品物と想定することができる部品名の有無等が含まれているか否かを起動条件としてもよい。さらに「主文書に会社名が含まれていない」あるいは「主文書が領収書で且つ社員名が含まれていない」等の場合に自動的に起動するのを禁止するようにしてもよい。
【0057】
ワークフロー登録部52で登録されるワークフローは、ワークフロー記憶部54に記憶されて管理される。
図13にワークフロー記憶部54で管理されるワークフローリストの例が示されている。例えばワークフロー識別子が1のワークフローは、ワークフロー名が請求処理ワークフロー、ワークフロー検索用キーワードが「請求書」、「Invoice」であり、承認者が上長であり、起動条件が「主文書」必須であり、その他の起動条件として金額があることである。
【0058】
なお、ワークフロー識別子が4のワークフローは、ワークフロー名等が未だ入力されていないワークフローである。
【0059】
ワークフロー検索部66は、ワークフロー記憶部54に記憶されて管理されているワークフローを検索する。ワークフロー検索部66は、例えばワークフロー記憶部54に記憶された全てのワークフローに対し、一つの文書群を構成する全てのページの特徴語の集合と、ワークフロー検索用キーワードとの合致性を予め設定しておいたワークフロー起動点数テーブル68に従って点数化し、一番点数の高いものを選択する。ワークフロー起動点数テーブル68は、例えば
図14に示すように、文字サイズ、文字色、文書分類についてそれぞれ設定されている。文字サイズは、20ポイント以上であれば10点、20ポイント未満であれば5点とする。文字色は、黒以外であれば7点、黒であれば5点とする。文書分類は、主文書に特徴語があれば10点、付属文書に特徴語があれば3点とする。
【0060】
図15及び
図16には、点数集積結果が示されている。第1の文書群に特徴語「請求書」が主文書に20ポイントで黒に設定されていれば、第1の識別子1の請求書ワークフローにおいては、ワークフロー検索キーワード「請求書」と特徴語「請求書」とが合致し、第1の識別子1の請求書ワークフローにおいては、10(文字サイズ:20ポイント以上)+5(文字色:黒)+10(主文書に存在)となり、25点となり、識別子1の請求書ワークフローが一番高い点数となる。したがって、第1の文書群は、識別子1の請求書ワークフローに添付すべきものとなる。また、識別子2の領収書ワークフローにおいては、第2の文書群に含まれている特徴語「領収書」とワークフロー検索用キーワード「領収書」が一致すれば同様に一番点数が高くなり、第2の文書群は識別子2の領収書ワークフローに添付すべきものとなる。
【0061】
なお、上記実施形態にあっては、ワークフロー起動点数テーブル68は、予め定められた文字サイズ、文字色及び文書分類より点数化するようにしているが、機械学習により行うようにしてもよい。即ち、前述したワークフロー起動点数テーブル68には学習部48が接続され、この学習部48は、文字サイズ、文字色及び文書分類を入力し、ワークフロー検索結果を教師データとして機械学習データ記憶部49に蓄積し、この蓄積されたデータからワークフローを決定するようにしてもよい。
【0062】
ワークフロー制御部70は、ワークフロー検索部66の検索結果からワークフローを決定し、対応する文書群を付してワークフローを起動する。即ち、第1の文書群には第1の識別子1の請求書ワークフローを起動し、第2の文書群には識別子2の領収書ワークフローを起動する。ただし、ワークフロー制御部70は、起動条件に合致しない場合は、ワークフローを保留状態とし、読取動作を行った使用者(登録者でもある)の介入により手動でワークフローを起動できるようにしておく。
【0063】
図17は、ワークフロー支援装置の全体の処理フローを示すフローチャートである。
まず、ステップS10において、画像形成装置16の画像読取装置20により読み取られた文書の画像を受け付ける。次のステップS12において、受け付けた文書の画像を解析して文字列を抽出する。次のステップS14において、文書をページ毎に分類する。次のステップS16において、分類された各ページをまとめるようにして文書群として分割する。次のステップS18において、文書群を添付すべきワークフローを検索する。そして、ステップS20において、検索された文書を起動する。
【0064】
図18は、ワークフローが起動させるまでの処理の流れを示すフローチャートである。
まずステップS30において、ワークフロー起動点数テーブル68を読み込む。次のステップS32において、文書群を読み込む。
【0065】
次のステップS34においては、文書群リストにある最初の一つの文書群の全ページの特徴語を読み込む。次のステップS36においては、ワークフロー検索用キーワードを読み込む。そして、次のステップS38においては、登録ワークフローリストにある最初の一つのワークフローについて点数計算を実行する。ステップS38の処理を終了すると、ステップS36に戻り、ワークフロー検索用キーワードを読み込み、ステップS38において、次のワークフローについて点数計算を実行する。ステップS36とステップS38との処理は全てのワークフローについて検索が終わるまで実行される。
【0066】
全てのワークフローの検索が終了すると、ステップS40に進み、このステップS40において、最大点数のワークフローを決定し、次のステップS42において、ステップS40で決定したワークフローを起動する。ステップS42において、一つのワークフローを起動すると、ステップS34に戻り、次の文書群の全頁の特徴語を読み込み、同様にワークフローを検索し、検索結果によりワークフローを起動する。
【0067】
なお、ワークフローを起動するには、
図13に示した起動条件を満たす必要がある。起動条件を満たす場合は、登録者の確認ステップは飛ばしてワークフローを起動する。ただし、例えば画像解析部36のOCRの誤認等により起動条件を満たさない場合がある。この場合は、登録者の確認ステップを行う。
【0068】
図19には、確認ステップのために表示データ生成部56で生成され、パーソナルコンピュータ14,14に表示されるワークフロー添付文書待ち画面72が示されている。
図17の例では、主文書が添付されていないと判断された場合である。主文書は添付されていないが、2つの文書が添付されている。いずれか一方の文書を選択すると、該文書の名称(タイトルが付けられる部分の文字列)、ファイル名、OCR全文等が表示される。登録者は、こられのデータを確認し、さらに文書を追加したり、文字列を補正することにより添付すべきワークフローを選択し、「完了」ボタンを指示することによりワークフローを起動することができる。
【0069】
なお、上記実施形態においては、1つの文書群の種類により一つのワークフローを起動するようにしているが、1つの文書群の内容によってワークフローを選択するようにしてもよい。例えば請求書であれば、請求金額が予め定められた金額以上であれば別のワークフローを起動するようにしてもよいし、インスタンス(特定のワークフローテンプレートに従って実際に発生する一連の業務タスクやイベントのこと)によりワークフローを区別するようにしてもよい。
【符号の説明】
【0070】
10 ワークフロー支援システム
12 サーバ
14 パーソナルコンピュータ
16 画像形成装置
18 ネットワーク
20 画像読取装置
22 CPU
24 メモリ
26 記憶装置
28 入出力インターフェイス
30 通信インターフェイス
34 画像データ受付部
36 画像解析部
37 納品書
38 明細書
40 送付状
42 画像解析結果記憶部
44 文書分類部
45 特徴語パラメータ分類表記憶部
46 分類辞書記憶部
48 学習部
49 機械学習データ記憶部
50 文書分類部
52 ワークフロー登録部
54 ワークフロー記憶部
56 表示データ生成部
58 ワークフロー登録画面
60 ワークフロー名登録入力部
62 ワークフローキーワード入力部
64 起動条件入力部
66 ワークフロー検索部
68 起動点数テーブル
70 ワークフロー制御部