(19)【発行国】日本国特許庁(JP)
(12)【公報種別】特許公報(B2)
(11)【特許番号】
(24)【登録日】2024-09-09
(45)【発行日】2024-09-18
(54)【発明の名称】機械学習を用いた自動原稿分類
(51)【国際特許分類】
G06F 16/35 20190101AFI20240910BHJP
G06V 30/413 20220101ALI20240910BHJP
【FI】
G06F16/35
G06V30/413
(21)【出願番号】P 2022514181
(86)(22)【出願日】2020-09-02
(86)【国際出願番号】 JP2020033215
(87)【国際公開番号】W WO2021045081
(87)【国際公開日】2021-03-11
【審査請求日】2022-11-02
(32)【優先日】2019-09-03
(33)【優先権主張国・地域又は機関】US
(73)【特許権者】
【識別番号】000006150
【氏名又は名称】京セラドキュメントソリューションズ株式会社
(74)【代理人】
【識別番号】100167302
【氏名又は名称】種村 一幸
(74)【代理人】
【識別番号】100135817
【氏名又は名称】華山 浩伸
(72)【発明者】
【氏名】真鍋 宏
(72)【発明者】
【氏名】小熊 嵩志
(72)【発明者】
【氏名】フーマン マジザデ レズヴァニ
(72)【発明者】
【氏名】アンドリイ マティウホフ
(72)【発明者】
【氏名】サン リー
(72)【発明者】
【氏名】チャールズ ヘンゼ
(72)【発明者】
【氏名】クリスチャン オルムステッド ホームズ
【審査官】原 秀人
(56)【参考文献】
【文献】特表2013-509663(JP,A)
【文献】特開2000-259669(JP,A)
【文献】特開2007-324883(JP,A)
(58)【調査した分野】(Int.Cl.,DB名)
G06F 16/00-16/958
G06V 30/40-30/424
(57)【特許請求の範囲】
【請求項1】
計算装置において
、ユーザー・インターフェースから1組の入力を受信し、各入力は、第1の組の原稿の中の1つの原稿を1組の分類装置の中の1つの分類装置に割り当て、それにより前記1組の分類装置は分類モデル用の原稿分類ルールを定義することと、
前記計算装置によって機械学習技術を用いて原稿を分類するために使用される分類モデルを訓練し、前記機械学習技術は、前記原稿分類ルールに基づいて、複数の宛先の中の特定の宛先に第2の組の原稿の各原稿を割り当てることと、
前記計算装置において
、前記複数の宛先の各宛先ごとにテンプレート・デザインを受信し、各テンプレート・デザインは、宛先に割り当てられた原稿に対応する原稿タイプに関して抽出すべきメタデータを指定することと、
前記計算装置において、その後前記分類モデルを用いて特定の原稿を分類し、前記特定の原稿の分類は、(i)前記原稿分類ルールに基づいて前記特定の原稿を前記複数の宛先の中の任意の宛先に割り当てること、(ii)前記任意の宛先に対応付けられた前記テンプレート・デザインを用いて前記特定の原稿から少なくともいくつかのメタデータを
抽出すること、及び(iii)
前記特定の原稿から抽出された
前記メタデータとして、前記特定の原稿の提供元であるベンダーの識別情報を用いて、データベースから前記ベンダーに関するアドレス情報を、前記メタデータを補充する追加情報
として取得することを含むことと、
前記計算装置において、前記特定の原稿から前記メタデータの抽出が成功したことを示す精度を設定し、当該精度が閾値を下回る状況になったときにユーザーに通知することと、を備える方法。
【請求項2】
前記第1の組の原稿を1つ以上の電子メッセージ及び1つ以上のアップロードを介して受信すること、をさらに備える請求項1に記載の方法。
【請求項3】
前記計算装置は、印刷装置であり、
前記第1の組の原稿を受信することは、さらにスキャン処理を用いて前記第1の組の原稿の少なくとも1つの原稿を受信することを含む、請求項2に記載の方法。
【請求項4】
前記機械学習技術を用いた前記分類モデルの訓練は、
前記第2の組の原稿の中の任意の原稿の構造を判定することと、
特定の分類装置によって定義された宛先が、前記任意の原稿の構造と類似した構造をそれぞれ有する原稿を含むように前記宛先を識別することと、
前記任意の原稿を、前記識別された宛先に割り当てることと、を有する、請求項1~3のいずれか1項に記載の方法。
【請求項5】
前記機械学習技術を用いた前記分類モデルの訓練は、
前記第2の組の原稿の中の任意の原稿のメタデータを判定することと、
特定の分類装置によって定義された宛先が、前記任意の原稿のメタデータと類似したメタデータをそれぞれ有する原稿を含むように前記宛先を識別することと、
前記任意の原稿を、前記識別された宛先に割り当てることと、を有する、請求項1~3のいずれか1項に記載の方法。
【請求項6】
その後の前記分類モデルを用いた特定の原稿の分類は、
前記特定の原稿を未分類のフォルダーに割り当てることと、
前記特定の原稿が前記未分類のフォルダーに割り当てられたことを示す通知を提供することと、を有する、請求項1~5のいずれか1項に記載の方法。
【請求項7】
前記特定の原稿が前記未分類のフォルダーに送付されたことを示す前記通知を提供することは、
前記特定の原稿を手動で分類することを可能にする前記通知とのリンクを提供することを有する、請求項6に記載の方法。
【請求項8】
前記特定の原稿の手動での分類を受信することと、
その後前記分類モデルが前記手動での分類に基づいて前記特定の原稿に類似する原稿を分類するように、前記特定の原稿の前記手動での分類を用いて前記分類モデルを訓練することと、をさらに備える、請求項7に記載の方法。
【請求項9】
その後の前記分類モデルを用いた前記特定の原稿の分類に応じて、前記任意の宛先に対応付けられた前記テンプレート・デザインを用いて前記特定の原稿から抽出されたメタデータに基づいて、データベースから前記特定の原稿の供給元に対応付けられた情報を入手すること、をさらに備える、請求項1~8のいずれか1項に記載の方法。
【請求項10】
ユーザー・インターフェースと、
計算装置と、を備えるシステムであって、
前記計算装置は、
ユーザー・インターフェースから1組の入力を受信し、各入力は、第1の組の原稿の中の1つの原稿を、1組の分類装置の中の1つの分類装置に割り当て、それにより、前記1組の分類装置は、分類モデル用の原稿分類ルールを定義し、
機械学習技術を用いて原稿を分類するために使用される分類モデルを訓練し、前記機械学習技術は、前記原稿分類ルールに基づいて、複数の宛先の中の特定の宛先に第2の組の原稿の各原稿を割り当て、
前記複数の宛先の各宛先ごとにテンプレート・デザインを受信し、各テンプレート・デザインは、宛先に割り当てられた原稿に対応する原稿タイプに関して抽出すべきメタデータを指定し、
その後前記分類モデルを用いて特定の原稿を分類し、前記特定の原稿の分類は、(i)前記原稿分類ルールに基づいて前記特定の原稿を前記複数の宛先の中の任意の宛先に割り当てることと、(ii)前記任意の宛先に対応付けられた前記テンプレート・デザインを用いて前記特定の原稿から少なくともいくつかのメタデータを
抽出することと、(iii)
前記特定の原稿から抽出された
前記メタデータとして、前記特定の原稿の提供元であるベンダーの識別情報を用いて、データベースから前記ベンダーに関するアドレス情報を、前記メタデータを補充する追加情報
として取得することとを含み、
前記計算装置において、前記特定の原稿から前記メタデータの抽出が成功したことを示す精度を設定し、当該精度が閾値を下回る状況になったときにユーザーに通知する、ように構成されている、システム。
【請求項11】
前記計算装置はさらに、前記機械学習技術を用いた前記分類モデルの訓練に応じて前記分類モデルを第2の計算装置に提供するように構成されており、前記第2の計算装置は、前記分類モデルを実行するように構成されている、請求項10に記載のシステム。
【請求項12】
前記複数の宛先の各宛先は、原稿を格納するフォルダーに対応している、請求項10に記載のシステム。
【請求項13】
前記計算装置は、原稿をスキャンするスキャナーを有する印刷装置である、請求項10に記載のシステム。
【請求項14】
コンピューター読み取り可能な命令を記憶する非一時的データ・ストレー
ジであって、前記命令は、計算装置の1つ以上のプロセッサーによって実行されたときに前記計算装置に、
ユーザー・インターフェースから1組の入力を受信し、各入力は、第1の組の原稿の中の1つの原稿を1組の分類装置の中の1つの分類装置に割り当て、それにより前記1組の分類装置は分類モデル用の原稿分類ルールを定義することと、
機械学習技術を用いて原稿を分類するために使用される分類モデルを訓練し、前記機械学習技術は、前記原稿分類ルールに基づいて、複数の宛先の中の特定の宛先に第2の組の原稿の各原稿を割り当てることと、
前記複数の宛先の各宛先ごとにテンプレート・デザインを受信し、各テンプレート・デザインは、宛先に割り当てられた原稿に対応する原稿タイプに関して抽出すべきメタデータを指定することと、
その後前記分類モデルを用いて特定の原稿を分類し、前記特定の原稿の分類は、(i)前記原稿分類ルールに基づいて前記特定の原稿を前記複数の宛先の中の任意の宛先に割り当てることと、(ii)前記任意の宛先に対応付けられた前記テンプレート・デザインを用いて前記特定の原稿から少なくともいくつかのメタデータをエクスポートすることと、(iii)前記特定の原稿から抽出された前記メタデータとして、前記特定の原稿の提供元であるベンダーの識別情報を用いて、データベースから前記ベンダーに関するアドレス情報を、前記メタデータを補充する追加情報として取得することとを含むことと、
前記計算装置において、前記特定の原稿から前記メタデータの抽出が成功したことを示す精度を設定し、当該精度が閾値を下回る状況になったときにユーザーに通知することと、を含むタスクを実行させる、
非一時的データ・ストレージ。
【発明の詳細な説明】
【技術分野】
【0001】
本発明は、機械学習を用いた自動原稿分類に関する。
【背景技術】
【0002】
自動化は、多くの産業において変化を推進する大きなきっかけとなり得る。特に、組織は、ルーチン化されたタスクを自動化するスマート・システムを開発することがあり得る。最近まで、主として大組織のみが、ルーチンを自動化する技術の開発に利用できる資産を有していた。しかし、ソフトウェア・ソリューションズの新世代は、費用のかかる開発のプロセスを変え、様々な産業における全ての規模の組織に、所望にタスクを実行するようにカスタマイズすることのできるスマート・システムの実施を可能にしているように見える。そのようなソリューションズは、組織に反復的タスクを自動化することを可能にし、それにより、従業員は、資産を非反復的タスクに集中させることが可能になる。
【発明の概要】
【0003】
第1の態様においては、方法が提供される。前記方法は、計算装置においてユーザー・インターフェースから1組の入力を受信し、各入力は、第1の組の原稿の中の1つの原稿を1組の分類装置の中の1つの分類装置に割り当て、それにより前記1組の分類装置は分類モデル用の原稿分類ルールを定義することを含む。前記方法はさらに、前記計算装置によって機械学習技術を用いて前記分類モデルを訓練し、前記機械学習技術は、前記原稿分類ルールに基づいて、複数の宛先の中の特定の宛先に第2の組の原稿の各原稿を割り当てることを含む。前記方法はまた、前記計算装置において前記複数の宛先の各宛先ごとにテンプレート・デザインを受信し、各テンプレート・デザインは、宛先に割り当てられた原稿に対応する原稿タイプに関して抽出すべきメタデータを指定することを含む。前記方法はまた、その後前記分類モデルを用いて特定の原稿を分類することを含む。特定の原稿の分類は、(i)前記原稿分類ルールに基づいて前記特定の原稿を前記複数の宛先の中の任意の宛先に割り当てること、及び(ii)前記任意の宛先に対応付けられた前記テンプレート・デザインを用いて前記特定の原稿から少なくともいくつかのメタデータをエクスポートすることを含む。
【0004】
別の態様では、システムが提供される。前記システムは、ユーザー・インターフェースと計算装置とを備える。前記計算装置は、ユーザー・インターフェースから1組の入力を受信し、各入力は、第1の組の原稿の中の1つの原稿を、1組の分類装置の中の1つの分類装置に割り当て、それにより、前記1組の分類装置は、分類モデル用の原稿分類ルールを定義するように構成されている。前記計算装置はまた、機械学習技術を用いて前記分類モデルを訓練し、前記機械学習技術は、前記原稿分類ルールに基づいて、複数の宛先の中の特定の宛先に第2の組の原稿の各原稿を割り当てるように構成されている。前記計算装置はまた、前記複数の宛先の各宛先ごとにテンプレート・デザインを受信し、各テンプレート・デザインは、宛先に割り当てられた原稿に対応する原稿タイプに関して抽出すべきメタデータを指定するように構成されている。前記計算装置はまた、その後前記分類モデルを用いて特定の原稿を分類し、前記特定の原稿の分類は、(i)前記原稿分類ルールに基づいて前記特定の原稿を前記複数の宛先の中の任意の宛先に割り当てることと、(ii)前記任意の宛先に対応付けられた前記テンプレート・デザインを用いて前記特定の原稿から少なくともいくつかのメタデータをエクスポートすることとを含む、ように構成されている。
【0005】
別の態様では、製品が提供される。前記製品は、少なくともコンピューター読み取り可能な命令を記憶する非一時的データ・ストレージを備え、前記命令は、計算装置の1つ以上のプロセッサーによって実行されたときに前記計算装置にタスクを実行させる。前記タスクは、ユーザー・インターフェースから1組の入力を受信し、各入力は、第1の組の原稿の中の1つの原稿を1組の分類装置の中の1つの分類装置に割り当て、それにより前記1組の分類装置は分類モデル用の原稿分類ルールを定義することと、機械学習技術を用いて前記分類モデルを訓練し、前記機械学習技術は、前記原稿分類ルールに基づいて、複数の宛先の中の特定の宛先に第2の組の原稿の各原稿を割り当てることと、前記複数の宛先の各宛先ごとにテンプレート・デザインを受信し、各テンプレート・デザインは、宛先に割り当てられた原稿に対応する原稿タイプに関して抽出すべきメタデータを指定することと、その後前記分類モデルを用いて特定の原稿を分類し、前記特定の原稿の分類は、(i)前記原稿分類ルールに基づいて前記特定の原稿を前記複数の宛先の中の任意の宛先に割り当てることと、(ii)前記任意の宛先に対応付けられた前記テンプレート・デザインを用いて前記特定の原稿から少なくともいくつかのメタデータをエクスポートすることとを含むことと、を含む。
【0006】
他の態様、実施形態、及び実装例は、必要に応じて添付の図面を参照しながら以下の詳細な説明を読むことによって当業者にとって明らかになるであろう。
【図面の簡単な説明】
【0007】
【
図1】
図1は、少なくともいくつかの例示の実施形態に係る計算装置を示す概略ブロック図である。
【
図2】
図2は、少なくともいくつかの例示の実施形態に係るネットワークを示す図である。
【
図3】
図3は、少なくともいくつかの例示の実施形態に係る原稿分類ワークフローを示す。
【
図4】
図4は、少なくともいくつかの例示の実施形態に係る自動原稿分類方法を示すフローチャートである。
【
図5A】
図5Aは、少なくともいくつかの例示の実施形態に係る、分類サービスの訓練用のユーザー・インターフェースを示す。
【
図5B】
図5Bは、少なくともいくつかの例示の実施形態に係る、分類装置の追加用のユーザー・インターフェースを示す。
【
図6】
図6は、少なくともいくつかの例示の実施形態に係る、分類モデルの訓練用のユーザー・インターフェースを示す。
【
図7】
図7は、少なくともいくつかの例示の実施形態に係る方法のフローチャートである。
【
図8】
図8は、少なくともいくつかの例示の実施形態に係る方法の別のフローチャートである。
【
図9】
図9は、少なくともいくつかの例示の実施形態に係る方法のさらに別のフローチャートである。
【発明を実施するための形態】
【0008】
以下に、説明を構成する一部となる添付図面を参照して、詳細な説明をする。図において、同じ符号は、一般的に、他に異なる記載がない限り同じ構成要素とする。詳細な説明に記載された例示の実施の形態、図面、及び請求項は限定することを意図するものではない。他の実施形態も利用可能であり、また開示された主題の範囲を逸脱することなく変更をすることは可能である。全般的に記載され、また図面に示されている本開示の諸態様は、広範囲にわたる様々な構成に再構成し、置換え、連結し、分割し、及びデザインすることができ、そして、それらのすべてが本記載の中で明らかに考慮されていることは容易に理解される。
I. 概要
【0009】
一般に、原稿の分類は、原稿タイプに基づいて1つ以上の種類の原稿を分類することを含む。例えば、人は、1グループの原稿を、前記原稿の提供元、前記原稿の特定の構造、及び/又は前記原稿の対象受信先等に従って、各原稿に含まれる情報などの1つ以上のファクターを用いて1つ以上のサブグループに再構成することにより、前記原稿を分類することができる。したがって、テキスト・ベースの原稿(例えば、送り状)、画像、音楽、及び他の種類の原稿を含む様々な原稿を分類することができる。組織が成長するにつれ、当該組織で分類を必要とする原稿の量も増え、管理しにくくなる可能性がある。
【0010】
以下に説明されるのは、機械学習を用いた原稿自動分類に関する技術である。機械学習は、データを進行的に分析することにより、1つ以上のタスクを実行するための明確なプログラミングなしにこれらのタスクの性能を向上させることができる技術である。機械学習は、原稿分類及び情報抽出を含むタスクを如何に効果的及び効率的に実行するかを、反復を通じて、計算システムに「学習」させることができる。したがって、以下に説明される例示の実施形態には、送り状、電子メール、識別情報、契約書、及び他の形式の広範な原稿タイプを分類する及び/又はそれらから情報を抽出するために機械学習を用いる印刷装置及び/又は他の種類の計算装置が含まれる。機械学習は、装置に、大量の原稿からの情報を効率的に管理し、体系化し、抽出することを可能にするものであり、それにはユーザーが全くかほとんど介入することがない。例えば、機械学習を利用することで、各入力原稿に1つ以上のクラス又はカテゴリーを割り当てることによって入力原稿を分類することが可能になる。それは、原稿の管理及び仕分けをより簡単にすることができる。
【0011】
例示の実施形態は、(i)分類デザイナー、(ii)分類タスクという2つの態様を含む分類サービスの開発及び使用を含むことができる。開発された分類サービスは、計算装置、サーバー、印刷装置などの様々な種類の装置における使用が可能となる。例えば、第1の装置によって分類サービスを開発することにより、その後その分類サービスを他の装置が共有し、実行することが可能となる。
【0012】
前記分類サービスの分類デザイナーの態様に対して、装置は、インターフェース(例えば、グラフィカル・ユーザー・インターフェース)を提供することができる。当該インターフェースは、原稿を分類するために使用される分類モデルを、ユーザーが作成できるようにすることができる。特に、前記分類モデルは、ユーザーが1つ以上の分類装置を選択及びデザインできるようにすることができる。これらの分類装置は、原稿を分類するときに前記分類モデルが用いるものである。分類装置は、同じように構成された一組の原稿の分類を実施する(例えば、入力データをカテゴリーにマッピングする)アルゴリズムに対応することができる。例えば、ユーザーは、ベンダーAに由来する送り状を分類する第1分類装置及びベンダーBに由来する送り状を分類する第2分類装置を選択及び構成することができる。したがって、前記装置は、ユーザーが1つ以上のサンプル原稿をアップロードできるようにしてもよい。当該サンプル原稿は、当該サンプル原稿から情報を識別及び抽出する方法を分類モデルが学習するように訓練するために用いられる。例えば、ユーザーは、分類モデルの訓練に用いられるサンプル原稿を、電子メール及び/又はウェブ・ブラウザー又はモバイル・アプリケーションに入れて提供してもよい、及び/又はサンプル原稿をアップロードしてもよい。
【0013】
訓練は、機械学習とユーザー入力を用いて、異なる種類の原稿の分析方法を学習する分類モデルを含んでもよい。より詳細には、サンプル原稿ごとに(同じタイプについては倍数のサンプル原稿が用いられる場合は、サンプル原稿のタイプごとに)、ユーザーは、分類において前記分類モデルが識別し、抽出し、使用すべき特定の情報を指定する入力を提供してもよい。ユーザー入力を介して強調される情報(ここではメタデータとも呼ばれる)は、前記原稿の提供元を示す情報(例えば、ベンダー識別情報(VAT ID))や、アカウント情報等の固定データを含むことができる。また、分類モデルは、機械学習及び/又はユーザー入力を用いて、原稿内の様々なメタデータ(例えば、総額、期日、送り状識別番号)の識別方法を学習してもよい。抽出されるメタデータの種類は、原稿の種類によって変わる。したがって、前記装置は、所望の情報が確実に抽出されるようにユーザーがメタデータの抽出をカストマイズできるようにしてもよい。したがって、示されるように、分類モデルを、機械学習及び/又はユーザー入力を用いて様々な種類の原稿の分類方法を学習するように訓練してもよい。当該様々な種類の原稿は、半構造化原稿を含む。
【0014】
機械学習は、分類モデルが、原稿の構造的類似点に基づいて原稿を分類する仕方を学ぶようにしてもよい。いくつかの例においては、機械学習が、メタデータ、構造、及び/又は前もってのユーザー入力の組み合わせを用いて、分類モデルに様々な種類の原稿の分類の仕方を教えることを含んでもよい。
【0015】
分類モデルが訓練されると、分類サービスの分類タスクの態様を実行することができる。特に、分類タスクの実行は、一組の原稿を分類するためのワークフローの作成を含んでもよい。例えば、装置は、ユーザーから1つ以上の種類の原稿(例えば、送り状、契約書)を複数取得することができる。前記装置は、原稿の物理的な版を読み取ることを介して及び/又は前記原稿を含むファイルをアップロードすることを介してなどの様々な方法で原稿を受け取ることができる。1つ以上の原稿とユーザーからの分類タスク実行要求とを受け取ると、前記装置は、前記訓練された分類モデルを用いて前記原稿を分類する。それにより、前記原稿が体系化され、訓練された分類モデルが用いる分類装置に定義されている特定の宛先に送られる。特に、前記装置は、前記分類モデルが用いる前記分類装置が提供するマッピングに従って、異なる複数のフォルダー及び/又は他の複数の宛先(例えば、電子メールアドレス又は印刷用の印刷装置)に前記原稿を送ることができる。
【0016】
前記分類タスクにおける原稿の分類においては、前記分類モデルが、特定の種類の原稿から情報を識別して抽出するようにデザインされた1つ以上の光学式文字読み取り(OCR)テンプレートを用いることができる。より詳細には、1つ以上のOCRテンプレートは、文字認識及び原稿からのメタデータの抽出のために前記分類モデルが用いる1つの分類装置に対応付けられる。この抽出処理は、さらに目標宛先(例えば、1組のフォルダー)への原稿の送付や、原稿に含まれる情報の体系化及び提示を可能にしてもよい。
【0017】
例えば、OCRテンプレートは、組織に送り状を提供するベンダーごとにデザインされ、使用されるようにしてもよい(例えば、ベンダーAに対する第1OCRテンプレート、ベンダーBに対する第2OCRテンプレート)。例えば、前記装置はメタデータ(例えば、ベンダーID)を用いて、原稿から抽出されたメタデータを補充する追加情報を取得してもよい。例えば、前記装置は、提供元の識別情報を用いて前記提供元に関するアドレスなどの情報をデータベースから取得してもよい。前記追加情報は、ユーザーへのさらなる報知のために、前記抽出情報を含むことができる。
【0018】
いくつかの例では、分類モデルは、分類タスクの実行中に原稿の分類に失敗する可能性がある。そのような場合、前記装置は、電子メールなどの通知方式(例えば、メッセージ)を介してユーザーに通知してもよい。前記通知は、ユーザーに手動で原稿を分類することを可能にするリンクを含んでもよい。手動の分類を用いることにより、分類モデルがその後、類似の原稿の分類方法を学習してもよい。例えば、前記装置は、ユーザーが後で内容確認できるように、特定のフォルダーに未分類の原稿を送ってもよい。また、分類サービスは、訓練及び分類の際に、ユーザーによる動作の内容確認を可能にするログを提供してもよい。特に、ユーザーは、前記ログに従って訓練及び分類の精度について点検し、訓練モデルの再訓練を要する可能性のある原稿を識別し、及び/又は、所望通りに動作が行われていることを確認するために他のアクションを実行してもよい。
【0019】
例えば、分類サービスは、それぞれが複数の分類装置を含む、1つ以上の分類モデルを用いてもよい。これらの1つ以上の分類モデルは、訓練の際に各サンプル原稿に含まれるワードの数と、サンプル原稿の数との比率によって決定されてもよい。例えば、サンプルごとのワード数に対するサンプルの比率が所定のしきい値(例えば、1,000ワード対1サンプル)未満であるとき、最上部にk個の特徴を持つ特徴抽出法としての"n-gram if-idf"とともに1つ以上のドロップアウトのような正規化技術を用いた、多層パーセプトロン(例えば、2~3層を用いる技術)を用いてもよい。他には、例えば、単語埋め込み及び分離可能な畳み込みを用いてもよい。
【0020】
また、様々な種類の機械学習技術を用いて1つ以上の分類モデルを訓練してもよい。例えば、人工ニューラル・ネットワーク、決定木、サポート・ベクトル・マシン、及びベイジアン・ネットワークの全てが、分類モデルを訓練するために用いることのできる技術の例としてあげられる。
【0021】
他の例としては、印刷装置は、組織の電話代請求書の送り状を分類するようにデザインされた分類サービスにアクセスし、それを使用してもよい。例えば、前記印刷装置は、ユーザーに、前記印刷装置のインターフェースを介して前記分類サービスを作成し、訓練させるようにしてもよい、及び/又は、前記印刷装置は、他の計算装置から前記分類サービスを入手してもよい。したがって、前記サービスの前記分類モデルは、ネットワーク・ベンダーごとに異なる分類装置を用い、ネットワーク・ベンダーに従って電話代請求書の送り状を分類することができる(例えば、ベンダーAからの送り状はフォルダーAに送られ、ベンダーBからの送り状はフォルダーBに送られる)。各分類装置は、各原稿からベンダーに関するメタデータ、支払うべき総額、期日、送り状番号などの特定の情報を抽出するようにデザインされたOCRテンプレートを含んでもよい。前記装置は、ユーザーが確認できるように、抽出された情報を体系的なフォーマット(例えば、CSVファイル)に分類した上で提供してもよいし、送り状を、ベンダーに従って再構成されたフォルダー(例えば、ベンダーA用の第1フォルダー、ベンダーB用の第2フォルダー)に格納してもよい。
II. 計算装置及び印刷システムの例
【0022】
図1は、少なくともいくつかの例示の実施形態に係る計算装置100を示す概略ブロック図である。いくつかの実施形態において、計算装置100は、以下に説明される機械学習を用いて原稿を分類する手順及び技術の少なくとも一部を実行するように構成されてもよい。計算装置100は、1つ以上の入力装置102と、1つ以上の出力装置104と、1つ以上のプロセッサー106と、メモリー108と、を備えることができる。他の例では、計算装置100は、より多い又はより少ない構成要素を、別の構成で備えることができる。
【0023】
入力装置102は、入力装置と、ネットワーク入力装置と、センサーと、及び/又は他の種類の入力装置と、を備えることができる。例えば、入力装置102は、タッチスクリーンと、キーボードと、キーパッドと、コンピューター・マウスと、トラックボールと、ジョイスティックと、カメラと、音声認識モジュールと、及び/又は他の類似の装置と、を備えることができる。ネットワーク入力装置は、イーサネット(登録商標)トランシーバー、ユニバーサル・シリアル・バス(USB)トランシーバー、又はツイストペア線や同軸ケーブル、光ファイバー・リンクなどの類似の物理的接続を介して有線ネットワークに通信可能に構成された類似のトランシーバー、ネットワーク140の有線部分、などの有線ネットワーク・レシーバー及び/又はトランシーバー、及び/又はブルートゥース(登録商標)トランシーバー、ジグビー(登録商標)トランシーバー、Wi-Fi(登録商標)トランシーバー、WiMAXトランシーバー、無線広域ネットワーク(WWAN)トランシーバー、及び/又は無線ネットワークを介して通信可能に構成された類似の種類の無線トランシーバー、ネットワーク140の無線部分などの、無線ネットワーク・レシーバー及び/又はトランシーバーを備えることができる。
【0024】
センサーは、計算装置100の環境下の条件を測定し、その環境に関するデータを提供するように構成された装置を備えることができる。そのようなデータは、位置データ、速度(速さ、方向)データ、加速度データ、及び計算装置100の環境に関する他のデータを含むものの、それに限定されるものではない。センサーの例は、GPSセンサー、位置センサー、ジャイロスコープ、加速度計、磁力計、カメラ、光センサー、赤外線センサー、及びマイクを含むものの、それに限定されるものではない。他の入力装置102も可能である。
【0025】
出力装置104は、ユーザー表示装置と、可聴音出力装置と、ネットワーク出力装置と、及び/又は他の種類の出力装置と、を備えることができる。ユーザー表示装置は、1つ以上の印刷部と、液晶表示装置(LCD)と、発光ダイオード(LED)と、レーザーと、デジタル光学(DLP)技術を用いた表示装置と、陰極線管(CRT)と、電球と、及び/又は類似の装置と、を備えることができる。
【0026】
可聴音出力装置は、スピーカーと、スピーカー・ジャックと、音声出力ポートと、音声出力装置と、ヘッドホンと、イヤホンと、及び/又は類似の装置と、を備えることができる。ネットワーク出力装置は、イーサネット・トランシーバー、ユニバーサル・シリアル・バス(USB)トランシーバー、又はツイストペア線や同軸ケーブル、光ファイバー・リンクなどの類似の物理的接続を介して有線ネットワークに通信可能に構成された類似のトランシーバー、ネットワーク140の有線部分、などの有線ネットワーク・レシーバー及び/又はトランシーバー、及び/又はブルートゥース(登録商標)トランシーバー、ジグビー(登録商標)トランシーバー、Wi-Fi(登録商標)トランシーバー、WiMAXトランシーバー、無線広域ネットワーク(WWAN)トランシーバー、及び/又は無線ネットワークを介して通信可能に構成された類似の種類の無線トランシーバー、ネットワーク140の無線部分などの、無線ネットワーク・レシーバー及び/又はトランシーバーを備えることができる。他の種類の出力装置は、振動装置、触覚フィードバック装置、及び赤外線又は紫外線を発光する装置などの非可視光発光装置を含むものの、それに限定されるものではない。他の出力装置104も可能である。
【0027】
プロセッサー106は、1つ以上の汎用プロセッサーと、中央演算処理装置(CPU)と、CPUコアと、及び/又は1つ以上の特殊用途向けプロセッサー(例えば、グラフィック処理ユニット(GPU)、デジタル信号プロセッサー(GSP)、フィールド・プログラマブル・ゲート・アレイ(FPGA)、特定用途向け集積回路(ASIC))と、を備えることができる。プロセッサー106は、メモリー108に格納されたコンピューター読み取り可能な命令110及び/又はここに説明される他の命令を実行可能に構成することができる。
【0028】
メモリー108は、少なくとも1つのプロセッサー106によって読み取り及び/又はアクセス可能なデータ及び/又は命令を格納することのできる1つ以上のコンピューター読み取り可能な記憶媒体を備えることができる。前記1つ以上のコンピューター読み取り可能な記憶媒体は、少なくとも1つのプロセッサー106の全体又は一部と一体とすることのできる、光、磁気、有機などのメモリー又はディスク記憶装置などの、1つ以上の揮発性及び/又は不揮発性記憶部を備えることができる。前記コンピューター読み取り可能な記憶媒体は、レジスター・メモリー、プロセッサー・キャッシュ、及び/又はランダム・アクセス・メモリーのような、短期間だけデータを記憶する1つ以上の構成要素を備えることができる。前記コンピューター読み取り可能な記憶媒体は、二次記憶装置又は持続的長期記憶装置(例えば、読み出し専用メモリー(ROM)、光又は磁気ディスク、コンパクト・ディスク読み出し専用メモリー(CD-ROM))などの、プログラム・コード及び/又はデータを長期間記憶する非一時的コンピューター読み取り可能な媒体を備えることができる。いくつかの実施形態においては、メモリー108を単一の物理デバイス(例えば、1つの光、磁気、有機などのメモリー又はディスク記憶装置)を用いて実施することができる。他の実施形態においては、メモリー108を2つ以上の物理デバイスを用いて実施することができる。
【0029】
特に、メモリー108は、コンピューター読み取り可能な命令110を格納することができる。これらの命令110は、1つ以上のプロセッサー106によって実行されたときに計算装置に機能を実行させることができる。前記機能は、ここに説明される手順、装置、ネットワーク、方法、特徴、及び/又はシナリオに関する機能を含むものの、それに限定されるものではない。いくつかの実施形態では、コンピューター読み取り可能な命令110は、すくなくとも原稿分類ソフトウェア112用の命令を含むことができる。原稿分類ソフトウェア112は、計算装置100のプロセッサー106によって実行されたときに、ここに説明される方法の一部又は全てを実行させる命令を計算装置100に提供する、及び/又はシナリオ例に関して説明される機能のいくつか又は全てを提供する。いくつかの実施形態では、コンピューター読み取り可能な命令110及び/又は原稿分類ソフトウェア112は、少なくともここに説明されるノード、スキャン/印刷装置、及び/又は計算装置の機能の少なくとも一部を実行させる命令を含むことができる。いくつかの例では、原稿分類ソフトウェア112は、原稿を分類し原稿から情報を抽出するように分類モデルを訓練し、その分類モデルを使用することのできる1つ以上の分類サービスを備えることができる。原稿分類ソフトウェア112は、1つ以上の機械学習アルゴリズムを含むことができる。
【0030】
図1に示すように、計算装置100は、ネットワーク140を介して1つ以上の他の計算装置に接続されることができる。したがって、計算装置100は、ネットワーク140を介して他の計算装置にファイル及び/又は他の情報を転送することができる。例えば、計算装置100は、1つ以上の訓練された分類モデルをネットワーク140を介して1つ以上の装置に使用のために転送してもよい、及び/又は1つ以上の装置からネットワーク140を介して1つ以上の訓練された分類モデルを受信してもよい。このように、分類モデルを異なる装置間で共有することにより、分類モデルを1つの装置で訓練し、他の複数の装置で用いられるようにしてもよい。
【0031】
図2は、少なくともいくつかの例示の実施形態に係るネットワーク200を示す図である。ネットワーク200は、計算装置202と、移動装置203と、印刷装置204、206、208、210と、目標宛先212、214、216と、を備える。いくつかの例において、ネットワーク200は、
図2で示すより多い装置、より少ない装置、及び/又は
図2で示す装置とは異なる種類の装置を備えることができる。
【0032】
計算装置202は、
図1に示す計算装置100として実施されてもよい。したがって、計算装置202は、ネットワーク200を構成するデータ(及びおそらくは関連ソフトウェア)を作成、入手、アップデート、表示、及び/又は削除することのできる1つ以上の計算装置とすることができる。ネットワーク200を構成するデータは、以下に示すものを含むものの、それに限定されるものではない:ネットワーク200内の装置を構成するデータ;例えば、スキャン/印刷装置210、212、214、216用のデータ、ネットワーク・プロトコル(例えば、ファイル転送プロトコル(FTP)、ハイパーテキスト転送プロトコル(HTTP)、Javaメッセージ・サービス(JMS)、京セラ・ページ記述言語(KPDL)、Private Communications Technology(PCT)、Adobe(登録商標) Page Description Format(PDF)、シンプル・オブジェクト・アクセス・プロトコル(SOAP)、ショート・メッセージ・サービス(SMS)、Simple Message Transfer Protocol(SMTP)、SNMP、転送制御プロトコル/インターネット・プロトコル(TCP/IP)、ユーザー・データグラム・プロトコル(UDP)、軽量ディレクトリ・アクセス・プロトコル(LDAP)、MQ、及び/又は他のプロトコル)を構成するデータ、クライアント及び/又はサーバーに対するアクセス管理に関連するデータ;(例えば、ネットワーク200及び/又はクラウドベース・サービス、ソフトウェア、及び/又はソリューションの機能の一部又は全てへのアクセスに関するパスワード、署名、認証情報、保証書、記名、許可証、及び/又はトークン)、及びネットワーク200の装置/サーバーに対するアプリケーションをカストマイズし、構成し、管理するためのデータ。
【0033】
いくつかの例において、ユーザーは、計算装置202を用いてここに説明される1つ以上の動作を実行することができる。例えば、ユーザーは、計算装置202を用いて1つ以上の種類の半構造化原稿用の単一スキャン・ワークフローを作成してもよい。前記ワークフローは、ネットワーク200に接続された1つ以上の装置(例えば、印刷装置204~210)によって操作することができる。前記計算装置202は、ユーザーに、半構造化原稿タイプ及び他の種類の原稿に関して、ゾーンOCRテンプレートを作成できるようにしてもよい。前記ワークフローは、機械学習を用いた自動原稿分類を可能にすることができる。
【0034】
移動装置203は、移動電話や装着型計算装置をはじめとする様々な種類の移動装置とすることができる。したがって、移動装置203は、ここに説明される、計算装置202及び印刷装置204、206、208、210に関する動作などの動作を実行することができる。
【0035】
印刷装置204、206、208、210は、紙から又は電子的のいずれかで入手された原稿及び/又はファイルをスキャン、印刷、複写、電子メール送信、報告、通信及び/又は処理などの、1つ以上の動作を実行することができる構成要素を含み得る。例えば、印刷装置204、206、208、210のいくつか又は全ては、紙の原稿の電子コピーを作成する、及び/又は紙の原稿からOCRなどの技術を介して電子データを生成することができるスキャン部を備えることができる。1つ以上の印刷装置204、206、208、210によって処理された後、原稿及び/又はファイルは、続いて、要求に応じて、紙又は電子的のいずれかで利用可能となる。
【0036】
ドキュメント・ボックスは、印刷装置、印刷サーバー、スキャン/印刷装置、又は他の装置上のエンティティ(例えば、ユーザー、管理者、企業、他のタイプのエンティティ)に割り付けられるストレージであることができ、それにより、エンティティは原稿、ファイル、及び/又は他のデータを保持及び維持することができる。実施形態によっては、ドキュメント・ボックスは、アドレス帳及び/又は装置アカウント処理ストレージ等の個人データ用のストレージを付随及び/又は含むことができる。ドキュメント・ボックス、アドレス帳、及び装置アカウント処理ストレージには、1つ以上の原稿、ファイル、個人データ、及び/又は、コンタクト、使用状況、及び使用制限等の他のデータを記憶できる。
【0037】
いくつかの実施形態では、印刷装置204~210は他のタスク及び/又は他の処理もまた実行できる。したがって、印刷装置204~210は、色、速度、演算能力、機能性、ネットワーク接続性、及び/又は他の特徴のバリエーションを持つ様々な製造者による製品を含み得る。
【0038】
いくつかの例では、印刷装置204~210のいくつか又はすべては、1つ以上のおそらく異なるネットワーク・プロトコルを通して、ネットワーク200に接続することができる。データは、印刷装置204~210、計算装置202、目標宛先212、214、216、及び/又は、コンピューターや、計算装置、ノード、印刷装置、スキャン/印刷装置、サーバー、ネットワーク200間の無線リンク、の相互間で伝送される。ネットワーク200の装置間の各データ伝送の形式は、次に挙げる1つ以上の様々な異なる形式を含み得る。テキスト形式、画像フォーマット、拡張マークアップ言語(XML)、シンプル・ネットワーク・メインテナンス・プロトコル(SNMP)形式、データベース・テーブル、OCRされたテキストを含むテキスト、フラットファイル形式、又は他の形式。
【0039】
いくつかの実施形態では、1つ以上の追加の計算装置(例えば、1つ以上のサーバー、ノード、及び/又は計算装置)をネットワーク200内で用いることにより、1つ以上の原稿ソリューションと管理される印刷サービスとのための機能、予測関連機能、データベースとしてのアクション、機械学習機能性の提供、及び他の機能、などの追加の機能を実行することができる。
【0040】
目標宛先212、214、216は、分類後の原稿を送ることのできる宛先である。特に、装置(例えば、計算装置202、移動装置203、印刷装置204~210)は、分類装置を用いて原稿を分類し、目標宛先212、214、216に送ることが可能である。例えば、前記装置は、自動的に1組の送り状を、ベンダーに従って目標宛先212、214、216に分類することが可能である。いくつかの例では、目標宛先212、214、216は、分類モデルを介して分類された1つ以上の原稿から抽出されたデータに対応する、1つ以上のファイルを含んでもよい。
III. 原稿分類ワークフローの例
【0041】
図3は、少なくともいくつかの例示の実施形態に係る原稿分類ワークフローを示す。原稿分類ワークフロー300は、入力302と、一般的分類304と、送り状分類306と、データ抽出308と、データ検証310と、出力312と、を含む。計算装置(例えば、計算装置100、計算装置202、移動装置203、印刷装置2040~210)は、原稿分類ワークフロー300の1つ以上の態様の実行を可能にしてもよい。
【0042】
入力302は、分類のために分析される異なる種類の原稿を含む。図示されるように、入力例は、1つ以上の送り状と、配達受領証と、契約書と、識別情報と、を含んでいる。他の種類の原稿が例示の範囲内で分類されてもよい。例えば、ある組織が組織固有の原稿を受信し、分類してもよい。
【0043】
一般的分類304は、入力302を一般的なグループに分類することを含む処理を表す。
図3に示されるように、送り状(例えば、送り状A及び送り状B)は、送り状グループ330にグループ分けされ、配達受領証(例えば、配達受領証A及び配達受領証B)は、配達グループ332にグループ分けされ、契約書(例えば、契約書A及び契約書B)は、契約書グループ334にグループ分けされ、識別情報(例えば、ID A、ID B、及びID C)は、識別情報グループ336にグループ分けされる。
【0044】
原稿分類ワークフロー300は、送り状分類306をさらに示す。前記送り状分類306は、送り状グループ330をベンダーの違いに基づいてサブグループ340、342、344に再構成する。サブグループ340は、ベンダーAに対応するX個の送り状を含み、サブグループ342は、ベンダーBに対応するY個の送り状を含み、サブグループ344は、ベンダーCに対応するZ個の送り状を含む。また、
図3には示されないが、原稿分類ワークフロー300はさらに、配達受領証や、契約書、識別情報など、他の種類の原稿を分類してもよい。
【0045】
データ抽出308は、前記送り状からデータを抽出する1つ以上の装置を備える。特に、データ抽出308は、後で特定の宛先への送付が可能となるように、各送り状から情報を抽出してもよい。データ抽出308は、抽出用の各送り状内の情報を識別可能なOCRテンプレート・スキャン及び/又は他の技術に基づいて行うことができる。
【0046】
データ検証310は、データ抽出308によって抽出された前記データの検証を行うことができる。いくつかの例では、手動検証360を用いることができる。これは、1つ以上の原稿に対するユーザーの手動での承認を、装置がインターフェースを介して要求することを含んでもよい。1つ以上の計算装置によって、所定のルールに基づく自動検証362が行われてもよい。
【0047】
出力312は、宛先A、宛先B、宛先Cなどの異なる宛先を含む。これらの宛先は、原稿分類ワークフロー300を実行する前記装置に、及び/又は1つ以上の遠隔位置の装置(例えば、サーバー)に位置してもよい。
【0048】
図4は、少なくともいくつかの例示の実施形態に係る方法を示すフローチャートである。方法400は、
図1に示す計算装置100、又は、
図2に示す計算装置202及び/又は印刷装置204~210などの計算装置によって実行可能な分類タスクを表す。方法400は、サーバーなどの遠隔位置の装置によって実行可能とされてもよい。例えば、印刷装置は、方法400の1つ以上のブロックを実行する前記サーバーと通信してもよい。
【0049】
方法400のブロック402は、原稿402の入手を含む。特に、装置は、アップロード又は転送(例えば、電子メール)を介してユーザーから原稿を入手することができる。例えば、ユーザーは、電子メール、フォルダーへのリンク、移動アプリケーション・アップロード、及び/又はウェブ・ブラウザー上のドラッグ&ドロップを介して、前記装置に原稿を提供することができる。
【0050】
いくつかの例では、装置は、例えば事前にユーザーの了解を得たうえで電子メール・メッセージに含まれている送り状などの原稿にアクセスするなど、機械学習を用いて提供元から原稿を抽出することができる。同様に、前記装置は、機械学習を用いてフォルダーや、移動アプリケーション、ウェブ・ブラウザーに含まれる原稿を識別し、アクセスすることができる。
【0051】
方法400のブロック404は、原稿の分類を含む。訓練された分類モデルは、分類装置を識別し、用いることができる。前記分類装置は、原稿に含まれるメタデータに基づいて原稿を分類する。原稿に含まれるメタデータは、ベンダー識別情報(例えば、VAT ID)又は原稿の種類などの他のデータについて説明し、情報を提供するデータ、を含むことができる。前記分類モデルは、機械学習及び1つ以上のOCRテンプレートを用いて情報を抽出し、原稿を分類することができる。
【0052】
図示されるように、原稿の分類後、ブロック406,408、410によって表される1つ以上のオプションが提供されてもよい。方法400のブロック406は、メタデータ406をエクスポートすることを含む。ブロック406において、前記装置は、OCRテンプレートを用いて原稿のOCRスキャンを実行し、メタデータを抽出することができる。特に、ユーザーは、OCRテンプレートを事前にデザインすることができ、前記メタデータは、前記OCRテンプレートが抽出した情報を含むことができる。
【0053】
方法400のブロック408は、フォルダーへの複写を含む。前記装置は、原稿全体を、前記原稿及び類似の原稿に関して指定されたフォルダーに複写する。特に、前記フォルダーは、同じ供給元(例えば、同じベンダー)からの原稿、同じプロジェクトに関係する原稿、期日が同じ原稿、及び/又は他のパラメーターに基づく原稿を格納するために選択されることができる。いくつかの例では、前記フォルダーは、ユーザーによる定義が可能である。他の例では、前記装置は、分類後の原稿を格納するための1つ以上のフォルダーを自動的に生成してもよい。
【0054】
方法400のブロック410は、通知の提供を含む。前記通知は、例示の範囲内で異なる情報を提供し得る。いくつかの例では、前記通知は、原稿が装置によって分類されなかったことを、1以上のユーザーに示すものであってもよい。例えば、前記分類モデルは、原稿の分類が失敗したときに前記装置に前記通知を提供させてもよい。したがって、前記通知は、メッセージ、電子メール、及び/又は分類の失敗を通知可能な他のフォーマットの形をとることができる。いくつかの例では、前記通知は、ユーザーに手動で原稿を分類することを可能にするリンクを含んでもよい。手動での分類が行われると、前記分類モデルは、前記手動での分類に基づいて自動的に類似の原稿を分類することを学ぶようにしてもよい。例えば、前記分類モデルは、新たな分類装置を生成し、当該分類装置を、手動で分類された原稿に類似する原稿に対応付けることができる。類似の原稿は、類似のメタデータ(例えば、同じベンダー及びタイプ)及び/又は類似の構造(例えば、原稿上の同じ汎用フォーマットに位置する類似の情報)を有していてもよい。
【0055】
さらに他の例では、装置は、電子メールを介して受信した送り状を処理してもよい。特に、前記装置は、前記電子メールに含まれる前記送り状にアクセスし、前記送り状に含まれるメタデータに基づいて送り状を分類することができる。いくつかの例では、前記分類モデルは、前記原稿の構造に基づいて前記原稿を分類することができる。例えば、分類装置は、テキスト認識を行うことなく、原稿上のメタデータの配置を分析し、もし特定のベンダーが、他のベンダーから区別される独特な構造を一貫して用いている場合には、送り状を当該特定のベンダーに関連付けて分類することができる。また、前記分類は、画像分析を用いて送り状を分類してもよい。
【0056】
他の例では、前記分類モデルは、原稿からのメタデータを分析することにより原稿を分類することができる。例えば、前記分類モデルは、原稿を提供したベンダーをテキスト認識に基づいて判定することができる。また、前記分類モデルは、原稿を分類するために、原稿の複数の態様の組み合わせを用いることもできる。
【0057】
送り状の分類後、原稿を類似の送り状(又は原稿)とともに格納する、送り状からメタデータを抽出しエクスポートする、及び/又は当該送り状に関する通知を提供する、など1つ以上のタスクを実行してもよい。送り状を格納するときには、当該送り状を、指定フォルダーに対応付けてもよい。当該指定フォルダーは、当該送り状と他の原稿とを共有態様に基づいて保持することができる。前記共有態様は、全ての原稿に共通するプロバイダー、共通の期日(例えば、全ての原稿は、同じ日を期日とする送り状である)、又は他の態様(例えば、各原稿は、組織の特定の部署に対応付けられている)、などである。
【0058】
いくつかの例では、前記装置は、ファイルとしてのフォルダーに前記メタデータの一部を格納することができる。したがって、前記装置は、機械学習を用いてメタデータをエクスポートすることで、ユーザーによる内容確認のために、CSVファイルとしてのメタデータを提供することができる。いくつかの例では、前記装置は、抽出された情報を、前記送り状を送ったベンダーに関する情報(例えば、ベンダーのアドレス及び説明)などの、データベースから得られる追加情報に対応付けることができる。例えば、前記装置は、データベースからベンダーに関する情報を得るために、送り状の固定値(例えば、VAT ID)を用いることができる。
【0059】
エクスポート用に選択されるメタデータは、それ以前のユーザーによる選択に基づいて決定してもよい。特に、前記メタデータは、その送り状の種類に対してユーザーが指定したテンプレートに基づいて選択することができる。同様に、前記装置は、他のベンダーからの送り状などの他の原稿から抽出されたメタデータを分析する機械学習を用いて、メタデータのいくつかを識別することができる。いくつかの例では、前記装置は、機械学習及びそれ以前のユーザー入力の組み合わせを用いてエクスポート用の送り状からメタデータを識別し、抽出することができる。
【0060】
前記装置は、さらに送り状に関する通知を提供することもできる。前記通知は、送り状からのメタデータの分類と抽出が成功したことを示すものであってよい。他の例では、前記通知は、分類が失敗したことを知らせ、ユーザーの手動での送り状の検証を要求するものであってもよい。例えば、スマートフォンのタッチスクリーン・インターフェースを介してユーザーが検証を実施する(例えば、抽出するためにメタデータを分類及び/又は選択する)ことができるように、リンクを電子メール内に提供することができる。いくつかの例では、前記装置は、精度を設定し、当該精度が閾値を下回る状況になったときにユーザーに通知するようにしてもよい。
IV. ユーザー・インターフェースの例
【0061】
図5Aは、少なくともいくつかの例示の実施形態に係る、分類サービスの訓練用のユーザー・インターフェースを示す。ユーザー・インターフェース500は、ユーザーが分類モデルの訓練を行うことができるように、装置によって提供されてもよい。図示されるように、ユーザー・インターフェース500は、モデル追加・オプション502と、未分類原稿部504と、分類装置部506と、原稿プレビュー508と、を備える。ユーザー・インターフェース500は、他の構成要素を備え、他の例による他の配置を含んでもよい。また、ユーザー・インターフェース500は、ユーザー・インターフェース500に含まれる配置及び構成要素をユーザーがカストマイズできるようにしてもよい。
【0062】
モデル追加オプション502は、ユーザーが分類モデルを作成及び/又は修正することを可能にする1つ以上の特徴を備えることができる。作成された分類モデルは、ユーザーによって、機械学習を介して提供される機能強化が設定され、1つ以上の装置によって原稿を分類するために用いられることが可能になる。
図5Aに示されるように、モデル追加オプション502は、ネーミング・オプションと、言語オプションと、精度オプションと、を備えることができる。前記ネーミング・オプションは、ユーザーが新たに作成された分類モデルに命名する、及び/又は既存の分類モデルを修正することができるようにする。いくつかの例では、ユーザー・インターフェース500は、ユーザーが任意に変更可能なデフォルト名(例えば、モデルE)を提供することができる。前記言語オプションは、ユーザーが分類装置の言語を調整できるようにする。例えば、言語の調整は、分類装置が分析する言語の種類の変更であってよい。いくつかの例では、言語の調整は、ユーザー・インターフェース500のために使用される言語の調整も可能にすることができる。
【0063】
未分類原稿部504は、アップロード領域、即ち、ユーザーが、作成及び/又は修正された分類モデルの訓練のために原稿をアップロードする際に用いることのできる領域に対応してもよい。例に示されるように、未分類原稿部504は、未分類原稿部504を介してアップロードされた原稿のタイトルを示してもよい。ユーザー・インターフェース500は、一旦未分類原稿部504にアップロードされたこれらの原稿を内容確認し削除するオプションを含む。このオプションは、未分類原稿部504の近傍に位置する目の記号及びゴミ箱によって表される。
【0064】
分類装置部506は、分類装置部506に対応する追加オプションを介してユーザーによって追加された分類装置を備えることができる。分類装置は、原稿を特定のフォルダーなどの目標宛先にマッピングすることを可能にしてもよい。
図5Aに示されるように、「分類装置1」は、ユーザーが、サンプル原稿を「分類装置1」に割り当て、分類モデルを訓練して、その後類似の原稿を「分類装置1」に置かれたサンプル原稿に送ることを学習させるフォルダーとして示されている。また、「分類装置2」などの他の分類装置を追加し、各分類装置に置かれたサンプル原稿に基づいて特定の原稿を送ることを学習させてもよい。分類装置部506は、アンドゥー・オプション(例えば、直前の割り当てをアンドゥーするオプション)や、原稿又は分類装置に割り当てられた1組の原稿をプレビューするオプション、分類装置を削除するオプション、1つ以上の原稿を削除するオプション、などの他のオプションも含む。
【0065】
原稿プレビュー508は、ユーザーによってプレビュー用に任意に選択された原稿が示される領域に対応してもよい。これにより、ユーザーは、各未分類原稿上でクリックすることにより、未分類原稿の内容を確認することができる。それにより、前記ユーザーは、さらに各未分類原稿をどの分類装置に割り当てるかを決定することができる。また、原稿プレビュー508は、各分類装置に置かれた原稿の内容を確認するために用いることができる。
【0066】
図5Bは、少なくともいくつかの例示の実施形態に係る、分類装置の追加用のユーザー・インターフェースを示す。ユーザー・インターフェース510は、ユーザーが分類モデルの訓練を行うことができるように、装置によって提供されてもよい。また、
図5Aに示されるユーザー・インターフェース500に関連するオプションとして提供されてもよい。図示されるように、ユーザー・インターフェース510は、分類装置追加部512を備える。ユーザー・インターフェース510は、他の構成要素を備え、他の例による他の配置を含んでもよい。また、ユーザー・インターフェース510は、ユーザー・インターフェース510に含まれる配置及び構成要素をユーザーがカストマイズできるようにしてもよい。
【0067】
分類装置追加部512は、名前オプションと、IDと、OCRテンプレートと、を備える。ユーザーは、分類モデル(例えば、
図5Aに示される分類モデル)に対応して新たな分類装置を作成するために分類装置追加部512を用いることができる。名前オプションは、ユーザーが前記分類装置に命名できるようにしてもよい。ユーザー・インターフェース512は、ユーザーが変更可能なデフォルト名称(例えば、分類装置D)を提供することができる。IDは、前記分類装置が使用する文字セットを示すものであってよい。又は、IDは、前記分類装置の探索のために使用することのできる前記分類装置の固有な識別情報を提供してもよい。OCRテンプレートは、ユーザーに、前記分類装置に割り当てるOCRテンプレートの選択を可能にする。例えば、OCRテンプレートは、特定の原稿提供元(例えば、サプライヤーA)に対応付けられ、入手可能なOCRテンプレートを表示させるためにドロップ・ダウン機能を用いることができる。ユーザーは、ユーザー・インターフェース500、512に対応付けられた他のユーザー・インターフェースを介し、原稿を用いてこれらのテンプレートをデザインしてもよい。
【0068】
図6は、少なくともいくつかの例示の実施形態に係る、分類モデルの訓練用のユーザー・インターフェースを示す。ユーザー・インターフェース600は、モデル名称602と、オペレーション・オプション604と、原稿部606と、追加又は削除オプション608と、目標宛先部610と、を備える。モデル名称602は、ユーザー・インターフェース600を介して訓練される分類モデルの名称を示す。
【0069】
オペレーション・オプション604は、分類モデルの訓練用の原稿をアップロードするなどの、ユーザーが異なるタスクを実行するために選択することのできる、選択可能なアイコンを表す。ユーザーは、原稿を原稿部606の中にドラッグすることにより、訓練用の原稿をアップロードすることができる。オペレーション・オプションは、ユーザーが原稿部606の中の原稿を用いた分類モデルの訓練を開始することのできる訓練開始オプションを含む。また、テストは、ユーザーが1つ以上の原稿を用いて訓練モデルをテストすることを可能にするとともに、その結果を示すことができる。
【0070】
追加又は削除オプション608は、原稿部に対する原稿の削除又は追加を可能にする。また、追加又は削除オプション608は、目標宛先部610に対する目標宛先の追加又は削除を可能にしてもよい。
【0071】
ユーザー・インターフェース600を介して訓練が実行されるとき、分類モデルは、ユーザーによって分類モデルに追加された分類装置に従って、原稿部606の中の原稿を、機械学習を用いて分析及び分類することができる。機械学習は、1つの原稿からいくつかのメタデータを抽出し、分類モデルが有する異なる分類装置の複数の原稿のメタデータと比較することを含むことができる。分類装置に対応付けられたOCRテンプレートを介して、テキストを抽出してもよい。
【0072】
分類モデルは、いくつかの原稿を分類することができない場合がある。そのような場合、分類モデルは、ユーザーによる確認のために、これらの未分類の原稿を別のフォルダーに割り当ててもよい。ユーザーは、これらの原稿を手動で分類することができる。それにより機械学習が用いる追加データが提供され、前記モデルによる自動分類が強化される。したがって、分類モデルの訓練に用いられるサンプル原稿の量を増やすことにより、分類モデルの精度を高める及び/又は分類モデルが分類することのできる原稿タイプのバリエーションを増やすことができる。
V. 動作方法の例
【0073】
図7は、少なくともいくつかの例示の実施形態に係る方法700のフローチャートである。方法700は、
図1に示される計算装置100又は
図2に示される計算装置202及び/又は印刷装置204~210などの計算装置によって実行されることができる。方法700は、サーバーなどの遠隔位置の装置によっても実行されることができる。例えば、印刷装置は、方法700の1つ以上のブロックを実行するサーバーと通信してもよい。
【0074】
方法700は、管理者又は他の種類のユーザーが上記装置などの装置を用いて実行する方法の1例であり得る。特に、前記管理者は、原稿の分類を自立的に行う分類モデルを準備するために方法700を実行してもよい。いくつかの例では、方法700に示されるブロックのサブセットを実行するために装置が用いられる。
【0075】
方法700のブロック702は、サンプル原稿のアップロードを含むことができる。前記計算装置は、複数のサンプル原稿を受信し、アップロードすることができる。前記サンプル原稿の量は、例示の範囲内で変化し得る。例えば、前記装置は、2つ以上のサンプル原稿(例えば、10個、30個、又は50個の原稿)を1組として入手することができる。
【0076】
いくつかの例では、管理者は、ファイル転送(例えば、電子メール)及び/又はスキャンにより1組のサンプル原稿を印刷装置に提供することができる。いくつかの例では、前記印刷装置は、前記サンプル原稿をサーバーに送信して分析させることができる。
【0077】
方法700のブロック704は、サンプル原稿の分類を含むことができる。前記装置(又は遠隔位置の計算装置(例えば、サーバー))は、各サンプル原稿の分類を可能にするインターフェースを提供してもよい。前記インターフェースは、前記管理者にサンプル原稿を選択させ、当該原稿に用いる分類装置を指定させてもよい。例えば、前記管理者は、1つ以上のサンプル原稿からなる第1組サンプル原稿に用いる第1分類装置を選択し、1つ以上の他のサンプル原稿からなる第2組サンプル原稿に用いる第2分類装置を選択してもよい。
【0078】
前記装置は、分類結果のログを生成することができる。前記装置は、前記ログを表示インターフェース(例えば、ユーザー・インターフェース)に表示してもよい。いくつかの例では、前記ログは、分類に関する様々な情報を含むことができる。例えば、前記情報は、分類の日時と、分類の実行の経過時間と、モデル名(例えば、モデルA又はモデル1)と、分類結果及び対応精度と、前記装置が効果的に分類できなかった原稿へのリンクと、を含むことができる。また、前記ログは、管理者が分類モデルを再訓練するために使用できる他の情報を含むことができる。
【0079】
方法700のブロック706は、サンプル原稿の訓練を含むことができる。前記装置は、各サンプル原稿を表示し、ユーザー(例えば、管理者)にサンプル原稿に対応する分類装置を訓練させることができる。訓練では、分類装置が情報を抽出することを「学ぶ」必要があるサンプル原稿の要素を、ユーザーが選択してもよい。特に、分類装置は、情報を抽出するサンプル原稿の要素に関する管理者の入力に基づいて訓練されることができる。
【0080】
いくつかの例では、装置は、対応する訓練ログを生成して表示することができる。当該訓練ログは、訓練中に行われたアクションを示すことができる。特に、前記訓練ログは、表示インターフェース(例えば、ユーザー・インターフェース)に表示してもよい。前記訓練ログは、訓練に関する様々な情報を含むことができる。例えば、前記情報は、訓練のステータス(例えば、完了、一部完了、訓練中)と、訓練が開始された日時と、訓練の経過時間(訓練が完了した時)と、修正可能なモデル名と、分類装置の数と、訓練に用いられるサンプル原稿の数と、管理者に特定の原稿タイプについて再訓練を行うことを可能にする他の情報と、を含むことができる。
【0081】
また、方法800は、さらに訓練のスケジューリングを含むことができる。特に、前記装置は、管理者に、前記装置(又は別の計算装置)が訓練を実行し、1つ以上の組のサンプル原稿を用いて1つ以上の分類装置を訓練すべき時期を指定させてもよい。前記装置は、前記装置が使用されていそうにない時間(例えば、夜中)などの特定の期間中にスケジューリングを可能にしてもよい。
【0082】
方法700のブロック708は、各原稿タイプに関して光学式文字読み取り(OCR)用のテンプレートを作成することができる。訓練に基づいて、装置は各原稿タイプに関してOCR用テンプレートを作成することができる。OCRは、活字、手書き、又は印刷テキストを機械符号化テキストに電子的に変換することを含んでもよい。例えば、各OCR用テンプレートは、その後、分類装置の訓練に用いられるサンプル原稿に類似する原稿から情報を抽出するために適用されることができる。したがって、分類装置は、その後のテンプレートOCRを用いた情報の抽出に向けた原稿の体系化を助ける。
【0083】
方法700のブロック710は、装置が生成した出力ログの内容の確認を含んでもよい。特に、装置は、管理者が内容確認、退避、格納、及び/又は他のアクションを実行することができるように、ログを表示インターフェースに表示してもよい。前記ログは、どの分類装置が適切に訓練されたか及びどの分類装置がさらなる内容確認及び/又は再訓練を必要とするか、を判定するために用いられてもよい。
【0084】
いくつかの例では、管理者が送り状を分類するためのワークフローを作成するために、装置が用いられてもよい。前記管理者は、方法600の1つ以上のステップを用いて送り状をスキャンし、OCRスキャンに前記送り状からデータを抽出し、前記データを特定の送り先に任意の形式(例えば、Comma-separated value(CSV)ファイル)でエクスポートすることができるように、前記装置(又は他の装置)を準備することができる。
【0085】
いくつかの例では、ユーザーが1組の送り状を分類するためのワークフローを作成するために、装置が用いられてもよい。したがって、前記装置は、その後のユーザーに、前記装置で原稿をスキャンするか又は前記装置に原稿を送り、前記装置が自動的に原稿を分類して適切な宛先に送る(例えば、タイプAの原稿はフォルダーAに送り、タイプBの原稿はフォルダーBに送る)ようにしてもよい。
【0086】
いくつかの例では、クライアントからの複数の送り状をスキャンするために、装置を用いることができる。前記装置は、送り状を分類し、テンプレートOCRスキャンを用いて送り状からデータを抽出するように構成されてもよい。前記装置は、その後1つ以上の種類のファイルでデータをエクスポートしてもよい。また、1つ以上の送り状が未分類の原稿タイプに対応するときには、前記装置は、手動の分類が必要であるかも知れないことを示す通知(例えば、電子メール、警告)を1以上のユーザーに提供してもよい。前記ユーザーは、通知を開いて未分類の原稿を点検することができる。例えば、前記ユーザーは、原稿の分類の仕方に関して装置を遠隔訓練してもよい。この遠隔訓練は、その後類似の形式の原稿からどの情報を抽出すべきかに関して装置を訓練することを含んでもよい。
【0087】
図8は、少なくともいくつかの例示の実施形態に係る方法800のフローチャートである。
図8に示される方法800と同様に、方法800は、
図1に示される計算装置100又は
図2に示される計算装置202及び/又は印刷装置204~210などの計算装置によって実行されることができる。方法800は、サーバーなどの遠隔位置の装置によっても実行されることができる。例えば、印刷装置は、方法800の1つ以上のブロックを実行するサーバーと通信してもよい。
【0088】
方法800は、ユーザーが上記1以上の装置などの装置を用いて実行する方法の1例であり得る。特に、前記ユーザーは、装置(例えば、印刷装置)に原稿の分類を自立的に行わせるために方法800を実行してもよい。いくつかの例では、方法800に示されるブロックのサブセットを実行するために装置が用いられる。
【0089】
方法800のブロック802は、分類モデルの実行を含むことができる。特に、ユーザーは、分類モデルに1つ以上の原稿を提供し、当該分類モデルは1つ以上の装置において実行されてもよい。例えば、ユーザーは、契約書、送り状、識別情報などの原稿をアップロードすることができる。いくつかの例では、ユーザーは、原稿を分類するための特定のモデルを選択してもよい。
【0090】
方法800のブロック804は、1つ以上の未分類原稿の分類を含むことができる。ユーザーは、装置のインターフェースを用いてこれらの1つ以上の未分類原稿を手動で分類し、さらにその後類似の文書を分類できるように分類モデルを訓練してもよい。
【0091】
図9は、少なくともいくつかの例示の実施形態に係る方法900のフローチャートである。
図9に示される方法900と同様に、方法900は、
図1に示される計算装置100又は
図2に示される計算装置202及び/又は印刷装置204~210などの計算装置によって実行されることができる。方法900は、サーバーなどの遠隔位置の装置によっても実行されることができる。例えば、印刷装置は、方法900の1つ以上のブロックを実行するサーバーと通信してもよい。
【0092】
方法900は、ユーザーが上記1以上の装置などの装置を用いて実行する方法の1例であり得る。特に、前記ユーザーは、装置(例えば、印刷装置)に原稿の分類を自立的に行わせるために方法900を実行してもよい。いくつかの例では、方法900に示されるブロックのサブセットを実行するために装置が用いられる。
【0093】
方法900のブロック902は、1組の入力の受信を含むことができる。例えば、計算装置(例えば、印刷装置)は、ユーザーから一連の入力をユーザー・インターフェースを介して受信してもよい。各入力は、第1の組の原稿の中の1つの原稿を、1組の分類装置の中の1つの分類装置に割り当てることができ、それにより、前記1組の分類装置は、分類モデル用の原稿分類ルールを定義することができる。前記計算装置は、電子メールやメッセージ、アップロード、及び/又はファイル転送などの様々なやり方で前記第1の組の原稿を受信することができる。いくつかの例では、前記計算装置は、1つ以上の原稿を受信するのにスキャン処理を用いることができる。
【0094】
方法900のブロック904は、機械学習技術を用いた分類モデルの訓練を含むことができる。特に、前記機械学習技術は、分類装置によって定義された原稿分類ルールに基づいて、1グループの宛先(例えば、フォルダー)の中の特定の宛先に第2の組の原稿の各原稿を割り当ててもよい。
【0095】
いくつかの例では、機械学習技術を用いた分類モデルの訓練は、前記第2の組の原稿の中の任意の原稿の構造を判定することと、特定の分類装置によって定義された宛先が、前記任意の原稿の構造と類似した構造をそれぞれ有する原稿を含むように前記宛先を識別することと、前記任意の原稿を、前記識別された宛先に割り当てることと、を含むことができる。他の例では、機械学習技術を用いた分類モデルの訓練は、前記第2の組の原稿の中の任意の原稿のメタデータを判定することと、特定の分類装置によって定義された宛先が、前記任意の原稿のメタデータと類似したメタデータをそれぞれ有する原稿を含むように前記宛先を識別することと、前記任意の原稿を、前記識別された宛先に割り当てることと、を含むことができる。さらに別の例では、計算装置は、機械学習を用いて分類モデルを訓練する際に、原稿のメタデータと構造の組み合わせを用いることができる。
【0096】
方法900のブロック906は、前記1グループの宛先の各宛先ごとにテンプレート・デザインを受信することができる。各テンプレート・デザイン(例えば、OCRテンプレート)は、宛先に割り当てられた原稿に対応する原稿タイプに関して抽出すべきメタデータを指定することができる。
【0097】
方法900のブロック908は、その後前記分類モデルを用いて特定の原稿を分類することを含むことができる。前記特定の原稿の分類は、前記原稿分類ルールに基づいて前記特定の原稿を任意の宛先に割り当てることと、前記任意の宛先に対応付けられたテンプレート・デザインを用いて前記特定の原稿から少なくともいくつかのメタデータをエクスポートすることと、のいずれか1つ又は両方を含んでもよい。
【0098】
いくつかの例では、前記計算装置は、前記特定の原稿を未分類のフォルダーに割り当て、前記特定の原稿が前記未分類のフォルダーに割り当てられたことを示す通知を提供することができる。前記通知は、ユーザーが前記特定の原稿を手動で分類することを可能にするリンクを含んでもよい。したがって、前記計算装置は、前記特定の原稿の手動での分類を受信し、その後、前記分類モデルが前記手動での分類に基づいて前記特定の原稿に類似する原稿を分類することができるように、前記特定の原稿の手動での分類を用いて前記分類モデルを訓練してもよい。
【0099】
いくつかの例では、前記計算装置は、前記任意の宛先に対応付けられた前記テンプレート・デザインを用いて前記特定の原稿から抽出されたメタデータに基づいて、データベースから前記特定の原稿の供給元に対応付けられた情報を入手することができる。例えば、前記計算装置は、前記分類モデルを用いた前記特定の原稿の分類に応じて、ベンダーに対応付けられた情報を入手することができる。
【0100】
実施の形態、図面、及び請求項に記載の例示の実施形態に限定する意図はない。本明細書において提示されている主題の主旨又は適用範囲から逸脱することがなければ、他の実施形態を利用したり、他の変更を加えたりすることができる。全般的に記載され、また図面に示されている本開示の諸態様は、広範囲にわたる様々な構成に再構成し、置換え、連結し、分割し、及びデザインすることができ、そして、それらのすべてが本記載の中で明らかに考慮されていることは容易に理解される。
【0101】
図面における任意の又はすべてのラダー図、シナリオ、及びフローチャートに対して及び本明細書中に説明されたように、各ブロック及び/又は通信は、例示の実施形態に従って情報の処理及び/又は情報の送信を表してもよい。別の実施形態もこれら例示の実施形態の範囲内に含まれる。これら別の実施形態において、例えば、ブロックとして記載された機能、送信、通信、要求、応答及び/又はメッセージは、ほぼ同時又は逆の順序も含めて、関係する機能性に応じて、示された又は説明された順序から外れた順序で実行してもよい。さらに、本明細書中に説明された任意のラダー図、シナリオ、及びフローチャートを用いて、より多い又はより少ないブロック及び/又は機能を使用してもよく、またこれらラダー図、シナリオ、及びフローチャートは、部分的又は全体的に互いに結合してもよい。
【0102】
情報の処理を表すブロックは、方法又は技術の特定の論理機能を実行するように構成することができる回路に対応してもよい。それに代えて又はさらに、情報の処理を表すブロックは、モジュール、セグメント、又はプログラム・コードの一部(関連するデータを含めて)に対応してもよい。プログラム・コードは、方法又は技術において特定の論理機能又はアクションを実行するために、プロセッサーにより実行可能な1つ以上の指示を含んでよい。プログラム・コード及び/又は関連データは、ディスク若しくはハード・ドライブ又はその他の記憶媒体を含む記憶装置等、任意の種類のコンピューター読み取り可能な媒体に記憶してもよい。
【0103】
前記コンピューター読み取り可能な媒体は、また、レジスター・メモリー、プロセッサー・キャッシュ、及びランダム・アクセス・メモリー(RAM)のような、短期間データを記憶するコンピューター読み取り可能な媒体等の、非一時的コンピューター読み取り可能な媒体は、また、例えば、リード・オンリー・メモリー(ROM)、光学又は磁気ディスク、コンパクト・ディスク・リード・オンリー・メモリー(CD‐ROM)のような、二次又は持続的長期記憶装置等の、より長期間プログラム・コード及び/又はデータを記憶する非一時的でコンピューター読み取り可能な媒体を含んでもよい。コンピューター読み取り可能な媒体は、また、その他の揮発性又は非揮発性の記憶システムであってもよい。コンピューター読み取り可能な媒体は、コンピューター読み取り可能な記憶媒体、例えば、有形の記憶装置と見なしてもよい。
【0104】
本明細書中において様々な態様及び実施形態が開示されてきたが、他の態様及び実施形態も当業者にとって明白であろう。本明細書中において開示された様々な態様及び実施形態は、例示目的であって限定することを意図するものではなく、真の範囲は以下の請求項により示されている。