(19)【発行国】日本国特許庁(JP)
(12)【公報種別】公開特許公報(A)
(11)【公開番号】P2024079500
(43)【公開日】2024-06-11
(54)【発明の名称】情報処理装置、情報処理システム、情報処理方法およびプログラム
(51)【国際特許分類】
G06F 16/583 20190101AFI20240604BHJP
【FI】
G06F16/583
【審査請求】未請求
【請求項の数】6
【出願形態】OL
(21)【出願番号】P 2022192480
(22)【出願日】2022-11-30
(71)【出願人】
【識別番号】000006747
【氏名又は名称】株式会社リコー
(74)【代理人】
【識別番号】110002147
【氏名又は名称】弁理士法人酒井国際特許事務所
(72)【発明者】
【氏名】小林 紘士
【テーマコード(参考)】
5B175
【Fターム(参考)】
5B175DA02
5B175FB02
(57)【要約】
【課題】ファイルに関連付けるメタデータの設定を容易にする。
【解決手段】情報処理装置は、1以上の文字列情報を含む文書ファイルを取得する第1取得部と、1以上の文字列情報に基づいて1以上の文字列情報それぞれに対応するカテゴリを特定する第1特定部と、文書管理サーバからメタデータ項目を取得する第2取得部と、メタデータ項目とカテゴリとを関連付けたマッピング情報を記憶するマッピング情報記憶部と、マッピング情報において第2取得部が取得したメタデータ項目のうち第1特定部が特定したカテゴリと関連付かない未登録メタデータ項目を特定する第2特定部と、未登録メタデータ項目と第1特定部が特定したカテゴリとを関連付ける設定部と、文書ファイルと文字列情報を文書管理サーバに送信する送信部と、を有し、送信部は、文字列情報を、文字列情報が対応するカテゴリに関連付くメタデータ項目の情報として送信する。
【選択図】
図3
【特許請求の範囲】
【請求項1】
1以上の文字列情報を含む文書ファイルを取得する第1取得部と、
前記1以上の文字列情報に基づいて前記1以上の文字列情報それぞれに対応するカテゴリを特定する第1特定部と、
文書管理サーバからメタデータ項目を取得する第2取得部と、
前記メタデータ項目と前記カテゴリとを関連付けたマッピング情報を記憶するマッピング情報記憶部と、
前記マッピング情報において前記第2取得部が取得したメタデータ項目のうち前記第1特定部が特定したカテゴリと関連付かない未登録メタデータ項目を特定する第2特定部と、
前記未登録メタデータ項目と前記第1特定部が特定したカテゴリとを関連付ける設定部と、
前記文書ファイルと前記文字列情報を前記文書管理サーバに送信する送信部と、
を有し、
前記送信部は、前記文字列情報を、前記文字列情報が対応するカテゴリに関連付くメタデータ項目の情報として送信する、
ことを特徴とする情報処理装置。
【請求項2】
前記文書管理サーバが有する記憶領域のうち、前記文書ファイルの送信先となる記憶領域の指定を受け付ける受付部を更に有し、
前記第2取得部は、指定された記憶領域に対応するメタデータ項目を取得する、
請求項1に記載の情報処理装置。
【請求項3】
前記文書ファイルを前記文書管理サーバに送信する前において、前記設定部は、
前記1または複数のメタデータ項目のうちの前記マッピング情報に対応関係が登録されていない未登録メタデータ項目を端末装置に表示させる
請求項1に記載の情報処理装置。
【請求項4】
ユーザにより操作される端末装置と、
前記端末装置とネットワークを介して接続される情報処理装置と、
を備え、
前記情報処理装置は、
1以上の文字列情報を含む文書ファイルを取得する第1取得部と、
前記1以上の文字列情報に基づいて前記1以上の文字列情報それぞれに対応するカテゴリを特定する第1特定部と、
文書管理サーバからメタデータ項目を取得する第2取得部と、
前記メタデータ項目と前記カテゴリとを関連付けたマッピング情報を記憶するマッピング情報記憶部と、
前記マッピング情報において前記第2取得部が取得したメタデータ項目のうち前記第1特定部が特定したカテゴリと関連付かない未登録メタデータ項目を特定する第2特定部と、
前記未登録メタデータ項目と前記第1特定部が特定したカテゴリとを関連付ける設定部と、
前記文書ファイルと前記文字列情報を前記文書管理サーバに送信する送信部と、
を有し、
前記送信部は、前記文字列情報を、前記文字列情報が対応するカテゴリに関連付くメタデータ項目の情報として送信する、
情報処理システム。
【請求項5】
情報処理装置により実行される情報処理方法であって、
前記情報処理装置が、1以上の文字列情報を含む文書ファイルを取得する第1取得ステップと、
前記情報処理装置が、前記1以上の文字列情報に基づいて前記1以上の文字列情報それぞれに対応するカテゴリを特定する第1特定ステップと、
前記情報処理装置が、文書管理サーバからメタデータ項目を取得する第2取得ステップと、
前記情報処理装置が、マッピング情報記憶部に、前記メタデータ項目と前記カテゴリとを関連付けたマッピング情報を記憶させるマッピング情報記憶ステップと、
前記情報処理装置が、前記マッピング情報において前記第2取得ステップにおいて取得したメタデータ項目のうち前記第1特定ステップにおいて特定したカテゴリと関連付かない未登録メタデータ項目を特定する第2特定ステップと、
前記情報処理装置が、前記未登録メタデータ項目と前記第1特定ステップにおいて特定したカテゴリとを関連付ける設定ステップと、
前記情報処理装置が、前記文書ファイルと前記文字列情報を前記文書管理サーバに送信する送信ステップと、
を実行し、
前記情報処理装置が、前記送信ステップにおいて、前記文字列情報を、前記文字列情報が対応するカテゴリに関連付くメタデータ項目の情報として送信する、
情報処理方法。
【請求項6】
情報処理装置を文字認識装置として機能させるためのプログラムであって、
前記情報処理装置を、
1以上の文字列情報を含む文書ファイルを取得する第1取得部と、
前記1以上の文字列情報に基づいて前記1以上の文字列情報それぞれに対応するカテゴリを特定する第1特定部と、
文書管理サーバからメタデータ項目を取得する第2取得部と、
前記メタデータ項目と前記カテゴリとを関連付けたマッピング情報を記憶するマッピング情報記憶部と、
前記マッピング情報において前記第2取得部が取得したメタデータ項目のうち前記第1特定部が特定したカテゴリと関連付かない未登録メタデータ項目を特定する第2特定部と、
前記未登録メタデータ項目と前記第1特定部が特定したカテゴリとを関連付ける設定部と、
前記文書ファイルと前記文字列情報を前記文書管理サーバに送信する送信部と、
して機構させ、
前記送信部は、前記文字列情報を、前記文字列情報が対応するカテゴリに関連付くメタデータ項目の情報として送信する、
プログラム。
【発明の詳細な説明】
【技術分野】
【0001】
本発明は、情報処理装置、情報処理システム、情報処理方法およびプログラムに関する。
【背景技術】
【0002】
テキストデータから、メタデータに含める文字列を選択し、テキストデータを含む文書ファイルおよびメタデータに含める文字列を、クラウドストレージへアップロードするクラウドサービスが知られている。
【0003】
特許文献1には、文書ファイルにメタデータとして付与することでストレージ上での文書管理をする技術が記載されている。しかし、クラウドストレージは、固有のメタデータ項目が設定されている。このため、文字認識処理をするアプリケーションは、文字認識処理をして生成したテキストデータから、クラウドストレージに設定されたメタデータ項目に対応する文字列を選択して、クラウドストレージにアップロードしなければならない。
【0004】
また、このようなクラウドストレージに設定されたメタデータ項目と、文字認識処理をするアプリケーションにより文字列に付与されるカテゴリとの紐づけをする場合、ユーザが、アプリケーションの設定サイトにアクセスして、メタデータ項目ごとに1つ1つ手入力で設定する必要があった。しかし、このような設定作業は、メタデータの項目が多く、入力に時間がかかってしまう場合があった。
【発明の概要】
【発明が解決しようとする課題】
【0005】
本発明は、上記に鑑みてなされたものであって、ファイルに関連付けるメタデータの設定を容易にすることを目的とする。
【課題を解決するための手段】
【0006】
上述した課題を解決し、目的を達成するために、本発明に係る情報処理装置は、1以上の文字列情報を含む文書ファイルを取得する第1取得部と、前記1以上の文字列情報に基づいて前記1以上の文字列情報それぞれに対応するカテゴリを特定する第1特定部と、文書管理サーバからメタデータ項目を取得する第2取得部と、前記メタデータ項目と前記カテゴリとを関連付けたマッピング情報を記憶するマッピング情報記憶部と、前記マッピング情報において前記第2取得部が取得したメタデータ項目のうち前記第1特定部が特定したカテゴリと関連付かない未登録メタデータ項目を特定する第2特定部と、前記未登録メタデータ項目と前記第1特定部が特定したカテゴリとを関連付ける設定部と、前記文書ファイルと前記文字列情報を前記文書管理サーバに送信する送信部と、を有し、前記送信部は、前記文字列情報を、前記文字列情報が対応するカテゴリに関連付くメタデータ項目の情報として送信する、ことを特徴とする。
【発明の効果】
【0007】
本発明によれば、メタデータの設定を容易にするという効果を奏する。
【図面の簡単な説明】
【0008】
【
図1】
図1は、実施形態に係る情報処理システムを示す図である。
【
図2】
図2は、実施形態に係るPCのハードウェア構成を示す図である。
【
図3】
図3は、実施形態に係る情報処理システムの機能構成を示す図である。
【
図4】
図4は、実施形態に係るクラウドサービスサーバの処理の流れを示すフローチャートである。
【
図5】
図5は、実施形態に係る情報処理システムのマッピング情報の設定処理の流れを示すシーケンス図である。
【
図6】
図6は、マッピング情報を更新するか否かの判断処理を示すフローチャートである。
【
図7】
図7は、文書管理サーバから取得するメタデータ項目一覧を示す情報の一例を示す図である。
【
図8】
図8は、マッピング情報の一例を示す図である。
【
図9】
図9は、ブラウザに表示される設定画面の一例を示す図である。
【
図10】
図10は、フロー型のワークフローを利用して文書ファイルに対して処理を実行する場合のクラウドサービスサーバの機能構成を示す図である。
【発明を実施するための形態】
【0009】
以下に添付図面を参照して、実施形態に係る情報処理システム10を詳細に説明する。
【0010】
図1は、実施形態に係る情報処理システム10を示す図である。
【0011】
情報処理システム10は、文書管理サーバ20と、PC22と、MFP24と、クラウドサービスサーバ30とを備える。文書管理サーバ20、PC22、MFP24およびクラウドサービスサーバ30のそれぞれは、インターネット等のネットワークに接続される。
【0012】
文書管理サーバ20は、1または複数のコンピュータにより構成され、アプリケーション等のプログラムを実行する。文書管理サーバ20は、1または複数のコンピュータがネットワークを介して連携して動作するクラウドであってもよい。
【0013】
PC22は、ユーザにより操作を受け付け、ユーザに情報を表示し、情報処理を実行する端末装置26の一例である。PC22は、ユーザにより使用されるパーソナルコンピュータ、スマートフォンまたはタブレット端末等のコンピュータである。
【0014】
MFP24は、端末装置26の一例である。MFP24は、コンピュータと同様の情報処理機能を有するとともに、用紙をスキャンしたり、電話回線により画像データを受信したり、用紙に画像を印刷したりすることができる。
【0015】
情報処理システム10は、PC22またはMFP24の何れか一方のみを備えてもよい。また、情報処理システム10は、PC22またはMFP24に代えてまたはこれらに加えて、電子黒板装置、デジタルカメラ、ゲーム機またはその他のデジタル家電等の、ユーザにより操作がされ、ユーザに情報を表示することが可能な他の端末装置26を備えてもよい。
【0016】
クラウドサービスサーバ30は、情報処理装置の一例である。1または複数のコンピュータにより構成され、アプリケーション等のプログラムを実行する。文書管理サーバ20は、1または複数のコンピュータがネットワークを介して連携して動作するクラウドであってもよい。
【0017】
このような情報処理システム10は、PC22またはMFP24により生成された文字列を含む画像データが、ネットワークを介してクラウドサービスサーバ30に送信される。クラウドサービスサーバ30は、受信した画像データに対して文字認識処理を実行して、画像データに描画されたテキストを表すテキストデータを生成する。クラウドサービスサーバ30は、生成したテキストデータを含む文書ファイルをネットワークを介して文書管理サーバ20に送信する。文書管理サーバ20は、クラウドサービスサーバ30から受信した文書ファイルを、クラウドサービスサーバ30に指定されたフォルダに記憶する。
【0018】
さらに、クラウドサービスサーバ30は、生成したテキストデータから、文書ファイルに紐づけて文書管理サーバ20に記憶させるメタデータに含める1または複数の文字列を抽出する。クラウドサービスサーバ30は、抽出した1または複数の文字列を文書ファイルとともに送信する。文書管理サーバ20は、文書ファイルとともに受信した1または複数の文字列を含むメタデータを生成し、生成したメタデータを文書ファイルに紐づけて指定されたフォルダに記憶する。
【0019】
図2は、PC22のハードウェア構成の一例を示す図である。PC22は、
図2に示されているように、コンピュータによって構築されており、CPU501、ROM502、RAM503、HD504、HDD(Hard Disk Drive)コントローラ505、ディスプレイ506、外部機器接続I/F(Interface)508、ネットワークI/F509、データバス510、キーボード511、ポインティングデバイス512、DVD-RW(Digital Versatile Disk Rewritable)ドライブ514、メディアI/F516を備えている。
【0020】
これらのうち、CPU501は、PC22全体の動作を制御する。ROM502は、CPU501の駆動に用いられるプログラムを記憶する。RAM503は、CPU501のワークエリアとして使用される。HD504は、プログラム等の各種データを記憶する。HDDコントローラ505は、CPU501の制御にしたがってHD504に対する各種データの読み出しまたは書き込みを制御する。ディスプレイ506は、カーソル、メニュー、ウィンドウ、文字、または画像等の各種情報を表示する。外部機器接続I/F508は、各種の外部機器を接続するためのインターフェースである。この場合の外部機器は、例えば、USB(Universal Serial Bus)メモリやプリンタ等である。ネットワークI/F509は、通信ネットワーク100を利用してデータ通信をするためのインターフェースである。データバス510は、
図2に示されているCPU501等の各構成要素を電気的に接続するためのアドレスバスまたはデータバス等である。
【0021】
また、キーボード511は、文字、数値、各種指示等の入力のための複数のキーを備えた入力手段の一種である。ポインティングデバイス512は、各種指示の選択または実行、処理対象の選択、カーソルの移動等を行う入力手段の一種である。DVD-RWドライブ514は、着脱可能な記録媒体の一例としてのDVD-RW513に対する各種データの読み出しまたは書き込みを制御する。なお、DVD-RWに限らず、DVD-R等であってもよい。メディアI/F516は、フラッシュメモリ等の記録メディア515に対するデータの読み出しまたは書き込み(記憶)を制御する。
【0022】
文書管理サーバ20およびクラウドサービスサーバ30は、
図2に示すPC22と同様の構成であってもよい。ただし、文書管理サーバ20およびクラウドサービスサーバ30は、ネットワークを介して他の機器からアクセスして操作可能であればよいので、ディスプレイ506、キーボード511、ポインティングデバイス512等のユーザインタフェースに関する装置は備えない構成であってもよい。また、MFP24は、
図2に示すPC22と同様の構成に加えて、スキャン機能を実現するハードウェア装置、プリント機能を実現するハードウェア装置およびこれらを管理および制御する情報処理機能を備える。
【0023】
図3は、実施形態に係る情報処理システム10の機能構成を示す図である。
【0024】
文書管理サーバ20は、文書管理アプリケーション42を実行することにより、クラウドサービスサーバ30および端末装置26に対して、文書管理サーバ20において文書ファイルを保存および管理する文書管理サービスを提供する。文書管理アプリケーション42は、クラウドサービスサーバ30からネットワークを介して受信した文書ファイルを、クラウドサービスサーバ30に指定されたフォルダに記憶する。また、文書管理アプリケーション42は、受信した文書ファイルに対するメタデータを生成し、文書ファイルに紐づけて記憶する。そして、文書管理アプリケーション42は、適切なユーザ名およびパスワードを用いてネットワークを介してアクセスしてきた装置に対して、記憶している文書ファイルをネットワークを介して送信することができる。
【0025】
なお、メタデータは、紐づけられた文書ファイルを特徴づける情報であり、例えば1または複数の文字列を含むデータである。なお、文字列とは、文字や数字、記号を含む情報である。メタデータに含まれる1または複数の文字列のそれぞれは、文書管理サーバ20に予め設定されている1または複数のメタデータ項目の何れかに対応付けてメタデータに含まれる。1または複数のメタデータ項目のそれぞれは、メタデータに含まれる文字列を分類する情報である。本実施形態において、文書管理サーバ20は、フォルダ毎に、1または複数のメタデータ項目が設定されている。
【0026】
端末装置26は、ブラウザ44を実行することにより、ユーザにネットワークを介したクラウドサービスサーバ30のアクセス処理サービスを提供する。ブラウザ44は、ネットワークを介してクラウドサービスサーバ30にアクセスするとともに、クラウドサービスサーバ30により生成された画面データをディスプレイ506に表示させる。また、ブラウザ44は、ユーザの操作に応じて画像データをクラウドサービスサーバ30に送信する。また、ブラウザ44は、ユーザの操作に応じて、ユーザにより入力された各種の情報をクラウドサービスサーバ30に送信する。
【0027】
クラウドサービスサーバ30は、文字認識アプリケーション46を実行することにより、端末装置26に対して文字認識処理サービスを提供する。クラウドサービスサーバ30は、ブラウザ44から文字認識アプリケーション46が呼び出されることにより、文字認識アプリケーション46を実行する。
【0028】
文字認識アプリケーション46は、クラウドサービスサーバ30により実行されることにより、画面生成部52および文字認識処理部54として機能する。
【0029】
画面生成部52は、端末装置26のブラウザ44上で表示させる画面を表す画面データを生成する。画面生成部52は、生成した画面データを端末装置26に送信して、ブラウザ44上に表示させる。
【0030】
文字認識処理部54は、端末装置26のブラウザ44を介して送信された画像データを受信する。ここで、文字認識処理部54は第1取得部の一例である。文字認識処理部54は、端末装置26から取得した画像データに対して文字認識処理をすることにより、画像データからテキストデータを生成する。そして、文字認識処理部54は、生成したテキストデータを含む文書ファイルを、文書管理サーバ20に送信して、指定したフォルダに記憶させる。なお、以下では文書管理サーバに記憶させるファイルとして文書ファイルを例にして説明するがファイルはこれに限定されない。例えば、ファイルは画像データなどであっても良い。また、以下では文字認識処理部54によって文字認証処理を行う場合について説明するが、文字認証処理は端末装置26で行っても良い。この場合、クラウドサービスサーバ30は、端末装置26から画像データに代えて文書データを受信して、文書データに含まれる文字列を読み出すことができる。
【0031】
このような処理とともに、文字認識処理部54は、生成したテキストデータに含まれる1または複数の文字列のそれぞれに対して、1または複数のカテゴリのうちの何れかのカテゴリを付与する。つまり、文字認識処理部54は、文字列のそれぞれに対応するカテゴリを特定する。ここで、文字認識処理部54は第1特定部の一例である。1または複数のカテゴリのそれぞれは、文字列の内容や種類などの属性を分類するための情報であり、文字認識アプリケーション46において独自に予め設定されている。文字認識処理部54は、文字列を解析することで、または文書ファイルにおける文字列が記載された位置に基づいて、文字列のカテゴリを特定することができる。
【0032】
続いて、文字認識処理部54は、マッピング情報に基づいて、1または複数の文字列の中から、1または複数のメタデータ項目の何れかが関連付けられたカテゴリに対応する文字列を、メタデータに含める対象文字列として選択する。マッピング情報は、1または複数のメタデータ項目のそれぞれと、1または複数のカテゴリの何れのカテゴリとを関連付けた情報である。そして、文字認識処理部54は、選択した対象文字列を、該文字列に対応するカテゴリに関連付けられたメタデータ項目に関する文字列としてメタデータに含めるように文書管理サーバ20に指示を与えることにより、送信した文書ファイルに紐づけたメタデータを文書管理サーバ20に記憶させる。ここで、文字認識処理部54は、送信部の一例である。なお、文字認識処理部54は、文字列情報と、該文字列情報に対応するメタデータ項目を識別する情報とを文書管理サーバ20に送信することができる。これにより、文書管理サーバ20では、文字列をメタデータ項目に対応するメタデータとして記憶することができる。なお、文字列を示す情報を文字列情報と表現する場合がある。
【0033】
さらに、クラウドサービスサーバ30は、マッピング情報記憶部62および設定部64として機能する。マッピング情報記憶部62は、マッピング情報を記憶する。なお、設定部64の機能の一部は文字認識処理部54が行っても良く、文字認識処理部54の処理の一部は設定部64が行っても良い。
【0034】
設定部64は、クラウドサービスサーバ30において実行されるアプリケーションを管理するためのプログラムを実行することにより機能する。設定部64は、例えば、文書管理サーバ20へアクセスするためのユーザIDおよびパスワードのアクセス設定等を管理する。
【0035】
さらに、設定部64は、ブラウザ44に対するユーザの設定操作に応じて、マッピング情報を更新する。例えば、設定部64は、文字認識処理部54による文字認識処理が開始された後、文書ファイルを文書管理サーバ20に送信する前において、指定されたフォルダに設定されている1または複数のメタデータ項目のうちの何れかのメタデータ項目を端末装置26のブラウザ44に表示させる。この場合、設定部64は、例えば、指定されたフォルダに設定されている1または複数のメタデータ項目のうちの、マッピング情報においてカテゴリとの対応関係が登録されていない未登録メタデータ項目を端末装置26のブラウザ44に表示させてもよい。
【0036】
そして、文字認識処理部54による文字認識処理が開始された後、文書ファイルを文書管理サーバ20に送信する前において、設定部64は、ユーザによるマッピング情報の設定操作を端末装置26のブラウザ44から受け付け、受け付けた設定操作に応じてマッピング情報を更新する。つまり、設定部64は、未登録メタデータ項目と文字認識処理部が特定したカテゴリとを関連付けることができる。この場合、文字認識処理部54は、文字認識処理において、更新されたマッピング情報に基づいて、文字認識して生成した1または複数の文字列の中から、1または複数のメタデータ項目の何れかが対応付けられたカテゴリが付与された文字列を、メタデータに含める対象文字列として選択する。
【0037】
なお、設定部64は、文字認識処理部54による文字認識処理に先立って、予め、文書管理サーバ20にアクセスして、指定されたフォルダに設定されている1または複数のメタデータ項目を取得して端末装置26のブラウザ44に表示させてもよい。ここで、設定部64は第2取得部の一例である。そして、この場合、設定部64は、取得した1または複数のメタデータ項目のそれぞれに対応するカテゴリの設定操作をユーザから受け付け、受け付けた設定操作に応じてマッピング情報を更新する。
【0038】
図4は、クラウドサービスサーバ30の処理の流れを示すフローチャートである。クラウドサービスサーバ30は、
図4に示す流れで処理を実行する。
【0039】
まず、S11において、クラウドサービスサーバ30は、端末装置26から、ブラウザ44を介して送信された画像データを受信する。
【0040】
続いて、S12において、クラウドサービスサーバ30は、端末装置26から取得した画像データに対して文字認識処理をすることにより、画像データからテキストデータを生成する。
【0041】
続いて、S13において、クラウドサービスサーバ30は、生成したテキストデータに含まれる1または複数の文字列のそれぞれに対して、1または複数のカテゴリのうちの何れかのカテゴリを付与する。
【0042】
続いて、S14において、クラウドサービスサーバ30は、マッピング情報を更新するか否かを判断する。例えば、クラウドサービスサーバ30は、マッピング情報が、文書ファイルを記憶させるフォルダに設定されている1または複数のメタデータ項目のうちの、カテゴリとの対応関係が登録されていない未登録メタデータ項目を含む場合、マッピング情報を更新すると判断する。また、S14において、クラウドサービスサーバ30は、ユーザにマッピング情報を更新するか否かを問い合わせ、ユーザによりマッピング情報を更新するとの操作がされた場合、マッピング情報を更新すると判断してもよい。
【0043】
クラウドサービスサーバ30は、マッピング情報を更新する場合(S14のYes)、処理をS15に進める。クラウドサービスサーバ30は、マッピング情報を更新しない場合(S14のNo)、処理をS16に進める。
【0044】
S15において、クラウドサービスサーバ30は、ユーザによるマッピング情報の設定操作に応じて、マッピング情報を更新する。例えば、クラウドサービスサーバ30は、文書ファイルを記憶させるフォルダに設定されている1または複数のメタデータ項目のうちの、マッピング情報においてカテゴリとの対応関係が登録されていない未登録メタデータ項目を端末装置26に表示させる。そして、クラウドサービスサーバ30は、端末装置26への、ユーザによるマッピング情報のうち未登録メタデータ項目に対応付けるカテゴリを入力する設定操作に応じて、マッピング情報において未登録メタデータ項目と入力されたカテゴリとを対応付ける更新処理を実行する。クラウドサービスサーバ30は、S15の処理を終えると、処理をS16に進める。
【0045】
S16において、クラウドサービスサーバ30は、文字認識して生成したテキストデータに含まれる1または複数の文字列の中から、マッピング情報により1または複数のメタデータ項目の何れかが対応付けられたカテゴリが付与された文字列を抽出する。そして、クラウドサービスサーバ30は、抽出した文字列を、メタデータに含める対象文字列として選択する。
【0046】
続いて、S17において、クラウドサービスサーバ30は、生成したテキストデータを含む文書ファイルを文書管理サーバ20における指定されたフォルダにアップロードする。すなわち、クラウドサービスサーバ30は、文書ファイルを、文書管理サーバ20に送信して、指定したフォルダに記憶させる。これとともに、クラウドサービスサーバ30は、メタデータの生成指示を文書管理サーバ20に与える。この場合において、クラウドサービスサーバ30は、選択した対象文字列を対応するメタデータ項目に関する文字列としてメタデータに含めるように、文書管理サーバ20に指示を与える。ここで、クラウドサービスサーバ30は、保存先のフォルダ情報と文書ファイルと文字列の情報とを含む要求を文書管理サーバ20に対して送信するだけでも良い。これにより、クラウドサービスサーバ30は、送信した文書ファイルに紐づけたメタデータを文書管理サーバ20に記憶させることができる。クラウドサービスサーバ30は、S17の処理を終えると、本フローの処理を終了する。
【0047】
図5は、実施形態に係る情報処理システム10のマッピング情報の設定処理の流れを示すシーケンス図である。
【0048】
情報処理システム10は、マッピング情報の設定時において、
図5に示す流れで処理を実行する。なお、本例においては、
図5のマッピング情報の設定処理は、文字認識処理部54による文字認識処理が開始された後、文書ファイルを文書管理サーバ20に送信する前において、実行される。ただし、マッピング情報の設定処理を実行するタイミングはこれに限定されない。例えば、
図5のマッピング情報の設定処理は、文字認識アプリケーション46の起動前に、文字認識アプリケーション46とは別個のアプリケーションにより実行されてもよい。また、
図5のマッピング情報の設定処理は、文字認識アプリケーション46の起動時において、実行されてもよい。
【0049】
まず、ユーザは、ブラウザ44に、設定の開始指示を入力する(S31)。設定の開始指示は、アプリケーションの起動に伴い自動で入力されてもよい。ブラウザ44に入力された開始指示は、ブラウザ44から画面生成部52に与えられ(S32)、続いて、画面生成部52から設定部64に与えられる(S33)。設定部64は、開始指示が与えられると、文書管理サーバ20の文書管理アプリケーション42に対して、フォルダおよびファイル一覧の取得指示を与える(S34)。
【0050】
文書管理アプリケーション42は、フォルダおよびファイル一覧の取得指示を受けると、ユーザが利用可能なフォルダおよびフォルダ内のファイルの一覧情報を、設定部64に返信する(S35)。ここで、文書管理アプリケーション42はユーザの認証を行っても良い。この場合、設定部64は、認証情報を文書管理アプリケーション42に送信することができる。これにより、文書管理アプリケーション42はユーザの認証を行い、認証されたユーザに対応するフォルダおよびファイルの一覧を返信することができる。続いて、設定部64は、フォルダおよびフォルダ内のファイルの一覧情報を画面生成部52に返信する(S36)。続いて、画面生成部52は、フォルダおよびフォルダ内のファイルの一覧情報をユーザに表示させるための画面データを生成する(S37)。そして、画面生成部52は、生成した画面データをブラウザ44に送信し(S38)、ブラウザ44を介してユーザに表示させる(S39)。
【0051】
ユーザは、フォルダおよびファイルの一覧情報を参照して、文字認識処理をして生成されたテキストデータを含む文書ファイルの格納先となるフォルダを決定する。そして、ユーザは、ブラウザ44に、文書ファイルの格納先となるフォルダの指定指示を入力する(S41)。
【0052】
ブラウザ44に入力された指定指示は、ブラウザ44から画面生成部52に与えられ(S42)、続いて、画面生成部52から設定部64に与えられる(S43)。設定部64は、フォルダの指定指示が与えられると、文書管理サーバ20の文書管理アプリケーション42に対して、指定されたフォルダについてのメタデータ項目一覧の取得指示を送信する(S44)。なお、文書ファイルの格納先となるフォルダは設定部64において予め設定されていても良い。この場合、設定部64は予め設定されていたフォルダについてのメタデータ項目一覧の取得指示を送信する。
【0053】
文書管理アプリケーション42は、フォルダの指定および指定されたフォルダのメタデータ項目一覧を示す情報の取得指示を受けると、指定されたフォルダに予め設定されているメタデータ項目一覧を示す情報を、設定部64に返信する(S45)。続いて、設定部64は、メタデータ項目一覧を示す情報を受け取ると、マッピング情報記憶部62からマッピング情報を取得する(S46)。続いて、設定部64は、マッピング情報を更新するか否かを判断する(S47)。例えば、設定部64は、マッピング情報に未登録メタデータ項目が存在する場合、マッピング情報を更新すると判断する。マッピング情報を更新すると判断した場合、設定部64は、メタデータ項目の一覧を示す情報の中から、未登録メタデータ項目を選択する(S48)。そして、設定部64は、選択した未登録メタデータ項目を画面生成部52に返信する(S49)。
【0054】
続いて、画面生成部52は、未登録メタデータ項目に対応付けるカテゴリを設定させるための設定画面を生成する(S50)。そして、画面生成部52は、生成した設定画面を表す画面データをブラウザ44に送信し(S51)、ブラウザ44を介してユーザに表示させる(S52)。
【0055】
ユーザは、設定画面を参照して、未登録メタデータ項目に何れかのカテゴリを設定するための設定操作を行う(S61)。ブラウザ44に対して行われた設定操作に応じて、ブラウザ44は、未登録メタデータ項目とカテゴリとの対応を示す情報を画面生成部52に与える(S62)。続いて、画面生成部52は、受け取った未登録メタデータ項目とカテゴリとの対応を示す情報を、設定部64に与える(S63)。続いて、設定部64は、受け取った未登録メタデータ項目とカテゴリとの対応を示す情報に基づき、マッピング情報を更新する(S64)。設定部64は、マッピング情報の更新が完了すると、完了を示す情報を画面生成部52に与える(S65)。そして、画面生成部52は、完了を示す情報をブラウザ44に送信し(S66)、ブラウザ44を介してユーザに表示させる(S67)。
【0056】
図6は、マッピング情報を更新するか否かの判断処理を示すフローチャートである。設定部64は、マッピング情報を更新するか否かを判断する場合、例えば、
図6に示す処理を実行する。
【0057】
まず、S81において、設定部64は、取得した1または複数のメタデータ項目のそれぞれについて、マッピング情報に対応するカテゴリが登録されているか否かを判断する。
【0058】
対応するカテゴリが未登録のメタデータ項目が存在しない場合(S81のNo)、設定部64は、マッピング情報を更新しないとして、本フローを終了する。対応するカテゴリが未登録のメタデータ項目が存在する場合(S81のYes)、設定部64は、処理をS82に進める。
【0059】
S82において、設定部64は、取得した1または複数のメタデータ項目のうちの、対応するカテゴリが未登録であるメタデータ項目を、設定対象のメタデータ項目として選択する。そして、設定部64は、選択したメタデータ項目を、ユーザからのカテゴリの設定操作を受け付ける設定画面に含める選択肢として、画面生成部52に与える。設定部64は、S82の処理を終えると、本フローを終了する。
【0060】
図7は、文書管理サーバ20から取得するメタデータ項目一覧を示す情報の一例を示す図である。
【0061】
メタデータ項目一覧を示す情報は、一例として、配列形式により表される。配列に含まれる1または複数の要素は、メタデータ項目を表す。
図7の例において、メタデータ項目は、“id”、“name”、“required”および“type”により識別される情報が含まれている。
【0062】
設定部64は、文書管理サーバ20から、
図7に示すようなメタデータ項目一覧を示す情報を取得した場合、一例として、配列に含まれる1または複数の要素のそれぞれの“name”により識別される情報を取得する。例えば、設定部64は、
図7の例においては、“CustomerID”、“CustmerName”、“InvoiceID”、“SubTotal”を取得する。なお、
図7に示すメタデータ項目一覧を示す情報に含まれる要素は一例であり、他の情報が含まれてもよい。
【0063】
【0064】
マッピング情報は、一例として、配列形式により表される。配列に含まれる1または複数の要素は、カテゴリを表す情報と、メタデータ項目を表す情報との組を含む。マッピング情報において、同一の要素に含まれているカテゴリとメタデータ項目とは、互いに対応付けされていることを意味する。
【0065】
図8に示すマッピング情報は、“userDefined”により識別される情報が、メタデータ項目を表す。
図8に示すメタデータ項目は、文書管理サーバ20における指定されたフォルダに予め設定されている。
図8に示すマッピング情報は、“defaultValue”により識別される情報が、カテゴリを表す。
図8に示すカテゴリは、文字認識処理部54が文字認識処理を実行することにより、文字列に付与される。
【0066】
設定部64は、文字認識処理部54により生成されたテキストデータに、マッピング情報に含まれる何れかのカテゴリに対応する文字列が含まれる場合、そのテキストデータを含む文書ファイルに対して紐づけるメタデータに、対応するカテゴリに関連付けられたメタデータ項目により識別される文字列として含めるように、文書管理サーバ20に指示する。
【0067】
図9は、マッピング情報を更新するために端末装置26により実行されるブラウザ44に表示される設定画面の一例を示す図である。
【0068】
設定部64は、文字認識処理をしてテキストデータを生成した後、テキストデータを含む文書ファイルを文書管理サーバ20に送信する前において、マッピング情報を更新する場合、メタデータ項目一覧を示す情報に含まれる1または複数のメタデータ項目と、マッピング情報に含まれる1または複数のメタデータ項目とを比較する。例えば、設定部64は、
図7に示す“name”により識別される1または複数の情報と、
図8に示す“userDefined”に識別される1または複数の情報とを比較する。
【0069】
設定部64は、メタデータ項目一覧を示す情報に含まれる1または複数のメタデータ項目の中から、マッピング情報に含まれる1または複数のメタデータ項目に含まれていないメタデータ項目を、未設定メタデータ項目として選択する。例えば、設定部64は、
図7に示す“name”により識別される1または複数の情報の中から、
図8に示す“userDefined”に識別される1または複数の情報に含まれていない情報を、未設定メタデータ項目として選択する。
【0070】
そして、設定部64は、ブラウザ44に表示される設定画面の中に、未設定メタデータ項目を表示させる。また、設定部64は、未設定メタデータ項目が複数個存在する場合には、複数の未設定メタデータ項目を設定画面に表示させる。
図9の例においては、設定部64は、設定画面に、未設定メタデータ項目である“sippingAddress”を表す未設定項目テキストデータ72-1と、未設定メタデータ項目である“subTotal”を表す未設定項目テキストデータ72-2とを表示させている。
【0071】
さらに、設定部64は、設定画面の中に、未設定メタデータ項目に対応するカテゴリを入力させるための入力ボックスを表示させる。
図9の例においては、設定部64は、設定画面の中に、“sippingAddress”に対応するカテゴリを入力させるためのカテゴリ入力ボックス74-1と、“subTotal”に対応するカテゴリを入力させるためのカテゴリ入力ボックス74-2とを表示させる。なお、入力ボックスは、プルダウンメニューを選択する形式にして、文字認識処理部54により付与される複数のカテゴリの中から、未だ何れのメタデータ項目にも対応付けられていない何れか1つのカテゴリを選択できてもよい。
【0072】
ユーザは、ブラウザ44に表示された設定画面に含まれる入力ボックスに対してカテゴリを入力し、入力したカテゴリを確定することにより、未登録メタデータ項目とカテゴリとの対応付けの設定操作をすることができる。これにより、ユーザは、文字認識処理をしてテキストデータを生成した後、テキストデータを含む文書ファイルを文書管理サーバ20に送信する前において、文字認識処理をキャンセルさせることなく、容易に、マッピング情報を更新させることができる。
【0073】
なお、
図9の例においては、設定部64は、初期状態においていずれのカテゴリも選択されていない初期状態(空欄状態)の入力ボックスを表示している。しかし、設定部64は、設定画面を表示する場合に、候補となる何れかのカテゴリが選択された状態の画面を表示してもよい。ユーザは、候補とされたカテゴリを選択する場合、選択操作を省略することができる。例えば、設定部64は、選択肢とされたメタデータ項目の中に、名称が一致または類似するカテゴリがある場合、一致または類似するカテゴリを候補となるカテゴリとして優先的に表示してもよい。設定部64は、優先するカテゴリが選択された状態でプルダウンメニューを表示してもよいし、優先するカテゴリをプルダウンメニューの一番上に表示してもよい。
【0074】
ただし、文書管理サーバ20における文書管理アプリケーション42によっては、メタデータ項目の名称と、カテゴリの名称とが異なる場合がある。例えば、メタデータ項目の名称が“CustomerName”であり、カテゴリの名称が“顧客名”であるような、同じ種別の情報であっても項目の名称が異なる場合がある。この場合であっても、設定部64は、未登録メタデータ項目と名称が類似しているので、優先するカテゴリとして、選択された状態でプルダウンメニューを表示したり、プルダウンメニューの一番上に表示したりしてもよい。また、設定部64は、カテゴリが1つしかない場合、そのカテゴリを優先的にプルダウンメニューに表示してもよい。
【0075】
なお、以上では、未登録メタデータ項目に対応するカテゴリを、1または複数のカテゴリの中から選択させる例を示した。これに代えて、設定部64は、未登録のカテゴリに対応するメタデータ項目を、マッピング情報にまだ登録されていない1または複数のメタデータ項目の中から選択させてもよい。この場合、設定部64は、未登録のカテゴリの名称に対応して入力ボックスを表示し、入力ボックスに対して、メタデータ項目一覧に示される1または複数のメタデータ項目のうちの、まだマッピング情報に登録されていないメタデータ項目をプルダウンメニューに選択可能に表示させる。また、設定部64は、以上のような方法に限らず、例えば直接テキストを入力する等の他の方法により、未登録メタデータ項目とカテゴリとを対応付ける設定操作をさせてもよい。
【0076】
図10は、フロー型のワークフローを利用して文書ファイルに対して処理を実行する場合のクラウドサービスサーバ30の機能構成を示す図である。
【0077】
クラウドサービスサーバ30により実行される文字認識アプリケーション46は、フロー型のワークフローを利用して文書ファイルに対して処理を実行する複数のコンポーネントの組み合わせにより実現することができる。上述した実施形態においては、文字認識アプリケーション46におけるOUTコンポーネントとして、文書管理アプリケーション42に文書ファイルをアップロードする場合について説明した。文字認識アプリケーション46が有するINコンポーネント、PROSESSコンポーネントは、
図10に示すような種々のコンポーネントを適用することができる。
【0078】
各処理を実行するコンポーネントを組み合わせワークフローとしてその一連の処理を実行するアプリ(アプリケーション)を作成することができる。このアプリのことをワークフローアプリと呼ぶ場合がある。ここで、コンポーネントとしては一例として、データの入力や生成および取得にかかる処理を実行するINコンポーネント、データの加工や変換など所定の処理を実行するPROSESSコンポーネント、データの出力や送信にかかる処理を実行するOUTコンポーネントが含まれる。アプリは、複数のINコンポーネント、複数のPROSESSコンポーネント、複数のOUTコンポーネントによって構成することができ、複数のアプリによって1つのアプリを構成することもできる。
【0079】
INコンポーネントは、デバイスからデータを取得する処理が含まれる。例えば、デバイスがMFP24やカメラである場合は原稿や被写体をスキャン又は撮影することで電子データを取得する処理が含まれ、デバイスがプロジェクタやディスプレイである場合は表示中の画像データを取得する処理が含まれ、デバイスがセンサである場合はセンサの検出値を取得する処理が含まれ、デバイスがストレージサーバや記憶媒体の場合はデータを受信又は読み取る処理が含まれる。また、INコンポーネントは、ワークフローアプリを実現する情報処理システム10内のデータを取得できるが、別のアプリ又はサーバなどの記憶装置からデータを取得してもよい。例えば、INコンポーネントは、ワークフローアプリとは別のアプリ又は、ワークフローアプリを実現する情報処理システム10とは別のシステムに対して、該別のアプリ又は別のシステムで管理しているデータを要求することができる。別のアプリは、要求に応じて該別のアプリで管理しているデータや、該別のアプリに対応するサーバからデータを取得して要求元のINコンポーネントに対して送信することができる。なお、INコンポーネントは、画像データからテキストデータを生成するなどデータ形式を変換することでデータを生成する処理も含まれる。
【0080】
OUTコンポーネントは、デバイスからデータを出力する処理が含まれる。例えば、デバイスがMFP24である場合は電子データを媒体に印刷する処理が含まれ、デバイスがプロジェクタやディスプレイである場合は画像データを表示又は音声出力する処理が含まれ、デバイスがストレージサーバや記憶媒体の場合はデータを送信又は記憶させる処理が含まれる。その他、所定の宛先にデータや処理の結果を通知する処理が含まれる。また、OUTコンポーネントは、ワークフローアプリを実現する情報処理システム10内にデータを出力できるが、ワークフローアプリとは別のアプリ又はワークフローアプリを実現する情報処理システム10とは別のシステムにデータを出力してもよい。例えば、OUTコンポーネントは、該別のアプリ又は該別のシステムに対して、該別のアプリ又は別のシステムでデータ又は処理の結果を管理するよう要求することができる。別のアプリは、要求に応じて、受信したデータ又は処理の結果を管理し、又は該別のアプリに対応するサーバで記憶するためにデータ又は処理の結果を送信することができる。
【0081】
例えば、複数のコンポーネントを組み合わせることで、アプリは以下のような機能を実現することができる。
【0082】
INコンポーネントではMFP24によって原稿をスキャンすることで画像データを生成する。PROSESSコンポーネントでは画像データに対して文字認識処理を実行することで数値又はテキストなどのデータに変換する。OUTコンポーネントでは、変換したデータを他のシステムの一例である業務管理システムに送信する。業務管理システムでは、ワークフローアプリから受信したデータを分類、又は予め設定された入力様式に基づいて整理すること管理データを生成できる。なお、PROSESSコンポーネントにおいてデータの分類及び管理データの生成を実行してもよい。この場合、OUTコンポーネントでは分類結果及び管理データを業務管理システムへ送信し、業務管理システムはワークフローアプリから受信した分類結果及び管理データを所定の領域に記憶するだけでよい。
【0083】
また、INコンポーネントでは業務管理システムが管理するデータを取得する。例えば、INコンポーネントは、設定情報や、数値又はテキストなどを含むデータを取得する。ここで、INコンポーネントは設定に応じて所定のデータを業務管理システムに要求してもよいし、業務管理システムからの要求に応じて業務管理システムが管理する所定のデータを受信してもよい。PROSESSコンポーネントは、設定情報に基づいて数値又はテキストを整理又は加工することで管理データを生成する。例えば、PROSESSコンポーネントは、データとひな型ファイルに基づいて、データに格納されたテキストや数値をひな型ファイルで設定された様式や順番に沿って整理することで、管理データとして帳票を作成することができる。PROSESSコンポーネントは、INプロセスで取得したデータを処理することができるが、データ及びひな型ファイルの指定をユーザから受け付けてもよいし、予め定められた設定に基づいて自動的にデータ及びひな型ファイルを選択してもよい。OUTコンポーネントでは、管理データなどのデータを業務管理システムに送信する。業務管理システムでは、ワークフローアプリから受信した管理データを所定の領域に記憶する。ただし、OUTコンポーネントでは、ワークフローの実行を要求した端末又はユーザ宛に管理データを返信してもよい。
【0084】
ここで、業務管理システムとワークフローアプリとは、それぞれ異なる事業者によって提供される場合があり、それぞれ異なるサーバによって構成される場合がある。このため、ワークフローアプリは、業務管理システムへデータ送信又は受信する場合、業務管理システムを構成するサーバと通信することでデータを送信又は受信することができる。
【0085】
なお、本実施形態に係るクラウドサービスサーバ30で実行されるプログラムは、インストール可能な形式又は実行可能な形式のファイルでCD-ROM、フレキシブルディスク(FD)、CD-R、DVD(Digital Versatile Disk)等のコンピュータで読み取り可能な記録媒体に記録されて提供される。
【0086】
また、実施形態に係るクラウドサービスサーバ30で実行されるプログラムを、インターネット等のネットワークに接続されたコンピュータ上に格納し、ネットワーク経由でダウンロードさせることにより提供するように構成してもよい。また、実施形態に係るクラウドサービスサーバ30で実行されるプログラムをインターネット等のネットワーク経由で提供または配布するように構成してもよい。
【0087】
また、実施形態に係るクラウドサービスサーバ30で実行されるプログラムを、ROM等に予め組み込んで提供するように構成してもよい。
【0088】
実施形態に係るクラウドサービスサーバ30で実行されるプログラムは、上述した各部(画面生成部52、文字認識処理部54、設定部64)を含むモジュール構成となっており、実際のハードウェアとしてはCPU(プロセッサ)が上記記憶媒体からプログラムを読み出して実行することにより上記各部が主記憶装置上にロードされ、画面生成部52、文字認識処理部54、設定部64が主記憶装置上に生成されるようになっている。
【0089】
従来において、ユーザは、メタデータの設定作業を、文字認識処理を提供するクラウドサービスのアプリケーションを実行する前に実行しなければならなかった。例えば、ユーザは、画像データをクラウドサービスに送信した後、設定作業が必要であることを気づいた場合、一旦、アプリケーションの実行をキャンセルしてから、アプリケーションの設定サイトで設定作業をしたのちに、再度、アプリケーションを実行しなければならなかった。一方、本実施形態に係るクラウドサービスサーバ30によれば、アプリケーションの実行をキャンセルせずにメタデータの設定作業を行うことができるため、メタデータの設定を容易にするという効果を奏する。
【符号の説明】
【0090】
10 情報処理システム、20 文書管理サーバ、26 端末装置、30 クラウドサービスサーバ、42 文書管理アプリケーション、44 ブラウザ、46 文字認識アプリケーション、52 画面生成部、54 文字認識処理部、62 マッピング情報記憶部、64 設定部
【先行技術文献】
【特許文献】
【0091】