IP Force 特許公報掲載プロジェクト 2022.1.31 β版

知財求人 - 知財ポータルサイト「IP Force」

▶ RPAホールディングス株式会社の特許一覧

<>
  • 特開-情報処理装置 図1
  • 特開-情報処理装置 図2
  • 特開-情報処理装置 図3
  • 特開-情報処理装置 図4
  • 特開-情報処理装置 図5
  • 特開-情報処理装置 図6
  • 特開-情報処理装置 図7
  • 特開-情報処理装置 図8
  • 特開-情報処理装置 図9
< >
(19)【発行国】日本国特許庁(JP)
(12)【公報種別】公開特許公報(A)
(11)【公開番号】P2022012252
(43)【公開日】2022-01-17
(54)【発明の名称】情報処理装置
(51)【国際特許分類】
   G06F 8/00 20180101AFI20220107BHJP
   G06F 3/0486 20130101ALI20220107BHJP
   G06F 3/04817 20220101ALI20220107BHJP
【FI】
G06F8/00
G06F3/0486
G06F3/0481 170
【審査請求】未請求
【請求項の数】2
【出願形態】OL
(21)【出願番号】P 2020113949
(22)【出願日】2020-07-01
(71)【出願人】
【識別番号】518446765
【氏名又は名称】RPAホールディングス株式会社
(74)【代理人】
【識別番号】100205659
【弁理士】
【氏名又は名称】齋藤 拓也
(74)【代理人】
【識別番号】100154748
【弁理士】
【氏名又は名称】菅沼 和弘
(72)【発明者】
【氏名】荒井 大輔
(72)【発明者】
【氏名】鈴木 雄一郎
(72)【発明者】
【氏名】藤山 洋平
(72)【発明者】
【氏名】山岸 泰大
【テーマコード(参考)】
5B376
5E555
【Fターム(参考)】
5B376AA25
5B376AA28
5B376AE20
5B376FA13
5E555AA09
5E555AA12
5E555AA54
5E555BA02
5E555BB02
5E555BC19
5E555BD01
5E555CB08
5E555CB34
5E555CC01
5E555CC03
5E555DB18
5E555EA14
5E555FA00
(57)【要約】
【課題】入力データに所定処理を施して所定場所に所定形式の出力データを出力する操作を行うユーザの利便性を向上させること。
【解決手段】OCRアプリBによるOCRの実行を制御するサーバ1において、データ管理部101は、OCRアプリBに入力される入力データFaと、OCRアプリBから出力される出力データFbとを管理する。対象指定受付部102は、OCRアプリBの指定と、OCRアプリBに入力される入力データFaの指定とを受け付ける。開始指示受付部103は、OCRの処理の開始の指示として、入力データFaを示すアイコンI2を、OCRアプリBを示すアイコンI1上にドラッグ・アンド・ドロップする操作を受け付ける。条件設定支援部104は、受付けられた指定内容と指示内容とに基づいて、OCRアプリBの処理条件の設定の支援を行う。これにより、上記の課題を解決する。
【選択図】図4
【特許請求の範囲】
【請求項1】
1以上のシステムによる所定処理の実行を支援する情報処理装置において、
前記1以上のシステムの夫々に入力される第1データと、前記1以上のシステムのうちいずれかから出力される第2データとを管理するデータ管理手段と、
前記1以上のシステムのうち、前記所定処理を行うシステムの指定と、当該システムに入力される前記第1データの指定とを受け付ける第1受付手段と、
前記所定処理の開始の指示を受け付ける第2受付手段と、
前記第1受付手段により指定が受け付けられた、前記システム及び前記第1データの内容と、前記第2受付手段により受け付けられた、前記開始の指示の内容とに基づいて、前記システムの処理条件の設定の支援を行う条件設定支援手段と、
を備える情報処理装置。
【請求項2】
前記条件設定支援手段は、
前記設定の支援として、前記1以上の条件のうち1以上の条件が未設定状態になるようにして、当該条件を設定するために必要となる操作の支援を行う、
請求項1に記載の情報処理装置。
【発明の詳細な説明】
【技術分野】
【0001】
本発明は、情報処理装置に関する。
【背景技術】
【0002】
従来より、入力されたデータ(以下、「入力データ」と呼ぶ)に所定処理を施したデータ(以下、「出力データ」と呼ぶ)を出力可能とするシステムは存在する(例えば特許文献1)。
このようなシステムでは、多くの場合ユーザ側の操作の単純化が図られている。例えばユーザ端末に表示されたアイコン上に入力データをドラッグ・アンド・ドロップする操作が行われると、出力データが所定フォルダに出力されるものが多い。
【先行技術文献】
【特許文献】
【0003】
【特許文献1】特開2019-176434号公報
【発明の概要】
【発明が解決しようとする課題】
【0004】
しかしながら、上述のような「操作の単純化」を実現させるためには、その前提として、出力データの出力先となる場所や、出力される形式等を予め設定しておく必要がある。
これに対して、出力データの出力先となる場所や、出力される形式等を予め設定することなく操作を進めてしまうユーザが多い。このようなユーザの中には、順次表示されるダイアログボックスのボタン(例えば「はい」や「YES」と表記されたボタン)を淡々とクリックして設定作業を終わらせてしまう者も多い。
このようなことから、出力データが出力されたものの、ユーザの意図に反した場所や形式で出力されてしまい、困惑するユーザも多い。
【0005】
本発明は、このような状況を鑑みてなされたものであり、入力データに所定処理を施して所定場所に所定形式の出力データを出力する操作を行うユーザの利便性を向上させることを目的とする。
【課題を解決するための手段】
【0006】
上記目的を達成するため、本発明の一態様の情報処理装置は、
1以上のシステムによる所定処理の実行を支援する情報処理装置において、
前記1以上のシステムの夫々に入力される第1データと、前記1以上のシステムのうちいずれかから出力される第2データとを管理するデータ管理手段と、
前記1以上のシステムのうち、前記所定処理を行うシステムの指定と、当該システムに入力される前記第1データの指定とを受け付ける第1受付手段と、
前記所定処理の開始の指示を受け付ける第2受付手段と、
前記第1受付手段により指定が受け付けられた、前記システム及び前記第1データの内容と、前記第2受付手段により受け付けられた、前記開始の指示の内容とに基づいて、前記システムの処理条件の設定の支援を行う条件設定支援手段と、
を備える。
【発明の効果】
【0007】
本発明によれば、入力データに所定処理を施して所定場所に所定形式の出力データを出力する操作を行うユーザの利便性を向上させることができる。
【図面の簡単な説明】
【0008】
図1】本発明の情報処理装置の一実施形態に係るサーバが適用される情報処理システムにより実現可能となる本サービスの一例を示す図である。
図2】本発明の情報処理装置の一実施形態に係るサーバを含む、情報処理システムの構成の一例を示す図である。
図3図2に示す情報処理システムのうちサーバのハードウェア構成の一例を示すブロック図である。
図4図3のサーバの機能的構成のうち、自動設定支援処理を実行するための機能的構成の一例を示す機能ブロック図である。
図5】本サービスとチャットボットとの連携の具体例を示す図である。
図6】撮像画像のデータのクラウドへの自動保存、及びOCRアプリの自動起動の具体例を示す図である。
図7】OCRアプリの機能のうち、色や模様を用いてOCRの処理の精度を区別する機能の具体例を示す図である。
図8】クラウドに保存されている入力データを、登録済みの帳票の定義であるか否かという観点で仕分ける作業の具体例を示す図である。
図9】OCRの処理の対象として設定された帳票の定義に応じて出力データの解像度が自動設定される具体例を示す図である。
【発明を実施するための形態】
【0009】
以下、本発明の実施形態について、図面を用いて説明する。
【0010】
まず、本発明の情報処理装置の一実施形態に係るサーバが適用される情報処理システム(後述する図2参照)により実現可能となるサービス(以下、「本サービス」と呼ぶ)の概要について説明する。
【0011】
図1は、本発明の情報処理装置の一実施形態に係るサーバが適用される情報処理システムにより実現可能となる本サービスの一例を示す図である。
【0012】
本サービスは、入力データに所定処理を施して所定場所に所定形式の出力データを出力するシステムにおける、各種設定操作を容易化させるサービスである。なお、ここでいう「システム」には、各種のアプリケーションソフトウェア(以下、「アプリ」と呼ぶ)自体、若しくは当該アプリの実行環境が整った複数の装置や複数の手段等より構成される全体的な装置を含む。
【0013】
図1には、本サービスの対象となるアプリの一例として、OCR(Optical Character Recognition/光学的文字認識)の処理を行うアプリB(以下、「OCRアプリB」と呼ぶ)が示されている。ORアプリBは、AI(人工知能)によってOCRの処理が制御される。
ユーザは、OCRアプリBを利用する場合、ユーザ端末2にOCRアプリBをインストールする。すると、ユーザ端末2のデスクトップに、「B」と表記されたアイコンI1が表示される。
【0014】
このような状態で、ユーザは、入力データFaを示すアイコンI2をアイコンI上にドラッグ・アンド・ドロップする操作を行う(ステップSS1)。すると、OCRアプリBの処理の実行に必要となる条件(以下、「処理条件」と呼ぶ)が自動設定される(ステップSS2)。具体的には例えば、出力データFbとして出力されるOCR読取データの出力場所(例えばデスクトップ、所定のフォルダなど)や、出力形式(例えばPDF形式など)等が自動設定される。処理条件が自動設定されると、その内容でOCRアプリBによる処理が実行される。そして、出力先として自動設定された場所に、出力データFb(OCR読取データ)が出力される(ステップSS3)。
【0015】
ここで、図1の例では、「デスクトップ」に置かれた入力データFaにOCRの処理が施されると、出力データFbが「デスクトップ」に出力される。つまり、入力データFaが置かれている場所と同じ場所に出力データFbが出力されるように処理条件が自動設定される。
このように、図1の例では、処理条件のうち出力データFbの出力先として「入力データが存在する場所」が自動設定されている。このため、例えば入力データFaが特定のフォルダ(例えば撮像画像のデータを保存するための専用のフォルダ)に置かれている場合には、そのフォルダが出力先として自動設定される。
また、図1には、入力データFaを示すアイコンI2をアイコンI1上にドラッグ・アンド・ドロップする操作を行う例が示されているが、これに限定されず、OCRアプリBを立ち上げる操作が行われた後に入力データFaが指定されてもよい。なお、OCRアプリBを立ち上げる操作としては、例えばアイコンI1をダブルクリックする操作等がある。
【0016】
本サービスでは、出力データFbが出力される場所を予め指定することもできる。この場合、出力データFbが出力される場所が予め指定されていない場合には、入力データFaが置かれた場所と同じ場所に出力データFbが出力されるように自動指定されない。ユーザの操作で出力先を指定できるダイアログボックスが表示される。即ち、敢えて出力フォルダが自動指定されないようにしている。このように、出力フォルダが自動指定されないようにすることで、ユーザが意図しない場所が出力先として自動指定されてしまうことを防ぐことができる。
【0017】
また、本サービスでは、入力データFaの入力処理(読み取り)を開始するための操作(例えば上述のドラッグ・アンド・ドロップの操作等)が行われると、入力データFaの属性に応じて、種々の設定を促すダイアログボックスが表示される。ここで、入力データFaの「属性」としては、データの容量、過去の入力処理に要した時間の履歴等が挙げられる。
具体的には例えば、入力データFaの入力処理(読み込み)の際、出力データFbの解像度を指定するためのダイアログボックスが表示される。これにより、ユーザは、任意の解像度を指定して出力データFbを出力することができる。ただし、ユーザにより指定された解像度が予め定められた閾値を超えている場合には、出力データFbを複数のデータファイルに分割することを促すメッセージがポップアップ表示される。また、それとともに、分割後のデータファイルの数を指定するためのダイアログボックスが表示される。
【0018】
また、本サービスでは、出力データFbが出力される際、API(Application Programming Interface)を呼び出した回数や時間についての実績が、入力データFaに対応付けられて管理される。
【0019】
また、本サービスでは、処理条件の設定状況が他のユーザに報知される。なお、処理条件の設定状況がどのような態様で他のユーザに報知されるかは特に限定されず、様々な態様で報知することができる。具体的には例えば、処理条件の設定状況が一覧視可能なデータファイル(CSV形式等)を他のユーザが任意に出力できるようにしてもよい。
【0020】
このように、本サービスは、システムの処理条件の設定についてユーザ側に広範囲な自由度が認められる。即ち、本サービスは、様々な業種に属する様々な企業等で利用される様々な態様のアプリに適用可能とする汎用性の高いサービスであるといえる。
【0021】
さらに、本サービスは、いわゆるITリテラシーが低いユーザでも、マニュアルを必要とすることなく快適に利用することができる。
具体的には例えば、チュートリアル形式、及びウィザード形式による処理条件の設定を可能とすることで、ユーザの利便性を高めている。
また例えば、チャットボットとの連携が図られている。これにより、ユーザ端末にOCRアプリBをインストールした後に必要となる初期設定に要する時間を大幅に削減することができる。さらに、OCRの処理の対象となる入力データFaの設定に要する時間を大幅に削減することもできる。
また例えば、ユーザは、処理条件の設定を変更しようとするタイミングでチャットボットにヘルプを投げると、設定ウィザードが自動的に起動する。
なお、本サービスとチャットボットとの連携については、図5を参照して後述する。
【0022】
また、本サービスでは、スマートフォン等のカメラ機能で撮像する操作が行われると、これをトリガとして、OCRアプリBが起動するようにすることもできる。
具体的には、ユーザがスマートフォンのカメラ機能で所定の文書を撮像すると、撮像画像のデータが、所定のクラウド(例えば本サービスにより提供される専用のクラウドコンピューティングサービス)に自動保存される。また、それとともに、撮像画像のデータがユーザ端末にダウンロードされる。そして、ユーザ端末にインストールされているOCRアプリBが自動的に起動する。
なお、ユーザは、ユーザ端末2のカメラ機能で所定の文書を撮像してもよい。この場合、ユーザ端末2により撮像された文書の画像データは、ユーザ端末2に保存されるとともに所定のクラウドに保存される。
なお、スマートフォン等による撮像に連動したOCRアプリBの自動起動については、図6を参照して後述する。
【0023】
また、スマートフォン等に既に記憶されている撮像画像のデータを、自動的に所定のクラウドに保存されるようにすることもできる。
なお、スマートフォン等に既に保存されている撮像画像のデータがクラウドに自動保存される具体例については、図6を参照して後述する。
【0024】
また、本サービスにロボットを連携させることもできる。具体的には、OCRアプリBの各種処理とロボットとを連携させる。これにより、ユーザは、OCRアプリBを意識することなく、入力データFaにOCRの処理が施された出力データFb(OCR読取データ)を取得することができる。
本サービスとロボットとを連携させた場合、ロボットは、例えば以下のように機能する。即ち、ロボットは、OCRの処理の間違い(入力データFaの読み取り間違い)を修正する。具体的には例えば、入力データFaに記載された「8」という数字が、OCRの処理の結果「0」という数字として読み取られた場合には、ロボットが修正画面と確認画面とを表示させることでコミットする。
このように、ロボットは、OCRの処理の間違い(入力データFaの読み取り間違い)を特定して修正する機能を有するが、OCRアプリBの独自の機能として、読み取りの精度を色や模様を用いて区別することができる。このため、ロボットは、OCRアプリBにより表現された色や模様をキャプチャすることで、読み取り結果の妥当性の検証(バリデーション)を省略することもできる。
つまり、ロボットは、OCRアプリBによる読み取りの結果をすべてについてバリデーションすることもできるが、ユーザが求める精度に応じて適宜バリデーションを省略することもできる。その結果、OCRの処理の精度とスピードとをコントロールすることができる。
なお、OCRアプリBの機能により、色や模様を用いて区別された入力データFaの具体例については、図7を参照して後述する。
【0025】
本サービスでは、OCRアプリBの適用対象がコントロールされる。具体的には例えば、OCRアプリBの適用対象を、提携先として指定された帳票の定義に限定することもできる。これにより、帳票の定義の数が増え過ぎて管理負担が増大することを防ぐことができる。その結果、ロボットが大量にある帳票の定義の中からどの帳票の定義を使用すればよいのかを迷うようなことがなくなる。
【0026】
また、本サービスにはソータ機能が含まれる。このため、例えば登録済みの帳票の定義と、未登録の帳票の定義とを仕分けることができる。具体的には、所定のクラウドに保存されている1以上の入力データFaを、登録済みの帳票の定義であるか否かという観点で仕分けることができる。このとき、OCRアプリBは、クラウドに保存されている入力データFaを総当たりすることになるが、この作業をロボットに行わせることもできる。
なお、クラウドに保存されている入力データFaを、登録済みの帳票の定義であるか否かという観点で仕分ける作業の具体例については、図8を参照して後述する。
【0027】
また、OCRアプリBによるOCRの処理の結果として出力される出力データFbは、解像度を低くすると処理のスピードは速くなり、また、データ容量も小さくなるが、処理の精度が悪くなる。これに対して、出力データFbの解像度を高くすると、処理の精度は良くなるが、処理のスピードが遅くなり、また、データ容量も大きくなる。
本サービスでは、OCRの処理の対象として設定された帳票(即ち入力データFa)の定義の属性に応じて出力データFbの解像度が自動設定される。ここで、帳票の定義の属性としては、フォントの種類、文字の大きさ、用紙のサイズ等が挙げられる。
なお、OCRの処理の対象として設定された帳票の定義に応じて出力データFbの解像度が自動設定される具体例については、図9を参照して後述する。
【0028】
次に、図2を参照して、上述した本サービスの提供を実現化させる情報処理システム、即ち本発明の情報処理装置の一実施形態に係るサーバ1を含む、情報処理システムの構成について説明する。
図2は、本発明の情報処理装置の一実施形態に係るサーバを含む、情報処理システムの構成の一例を示す図である。
【0029】
図2に示す情報処理システムは、サーバ1と、ユーザ端末2とを含むように構成されている。
サーバ1及びユーザ端末2は、インターネット等の所定のネットワークNを介して相互に接続されている。
【0030】
また、本サービスの提供対象となるユーザの一例として自治体が挙げられる。自治体がユーザとして本サービスを利用する場合には、総合行政ネットワーク(LGWAN/Local Government Wide Area Network)を介してサーバ1とユーザ端末2とが相互に接続される。
【0031】
サーバ1は、サービス提供者(図示せず)により管理される情報処理装置である。サーバ1は、ユーザ端末2と適宜通信をしながら、本サービスを実現するための各種処理を実行する。
【0032】
ユーザ端末2は、ユーザ(図示せず)により操作される情報処理装置である。ユーザ端末2は、例えば業務用又は個人用の、パーソナルコンピュータ、スマートフォン、タブレット等で構成される。
【0033】
図3は、図2に示す情報処理システムのうちサーバのハードウェア構成の一例を示すブロック図である。
【0034】
サーバ1は、CPU(Central Processing Unit)11と、ROM(Read Only Memory)12と、RAM(Random Access Memory)13と、バス14と、入出力インターフェース15と、入力部16と、出力部17と、記憶部18と、通信部19と、ドライブ20とを備えている。
【0035】
CPU11は、ROM12に記録されているプログラム、又は、記憶部18からRAM13にロードされたプログラムに従って各種の処理を実行する。
RAM13には、CPU11が各種の処理を実行する上において必要なデータ等も適宜記憶される。
【0036】
CPU11、ROM12及びRAM13は、バス14を介して相互に接続されている。このバス14にはまた、入出力インターフェース15も接続されている。入出力インターフェース15には、入力部16、出力部17、記憶部18、通信部19及びドライブ20が接続されている。
【0037】
入力部16は、例えばキーボード等により構成され、各種情報を入力する。
出力部17は、液晶等のディスプレイやスピーカ等により構成され、各種情報を画像や音声として出力する。
記憶部18は、DRAM(Dynamic Random Access Memory)等で構成され、各種データを記憶する。
通信部19は、インターネットを含むネットワークNを介して他の装置(例えば図2のユーザ端末2)との間で通信を行う。
【0038】
ドライブ20には、磁気ディスク、光ディスク、光磁気ディスク、或いは半導体メモリ等よりなる、リムーバブルメディア40が適宜装着される。ドライブ20によってリムーバブルメディア40から読み出されたプログラムは、必要に応じて記憶部18にインストールされる。
また、リムーバブルメディア40は、記憶部18に記憶されている各種データも、記憶部18と同様に記憶することができる。
【0039】
なお、図示はしないが、図2のユーザ端末2も、図3に示すハードウェア構成と基本的に同様の構成を有することができる。したがって、ユーザ端末2のハードウェア構成についての説明は省略する。
【0040】
このような図3のサーバ1を含む図2の情報処理システムを構成する各種ハードウェアと各種ソフトウェアとの協働により、サーバ1における自動設定支援処理を含む各種処理の実行が可能になる。その結果、サービス提供者は、ユーザに対して上述の本サービスを提供することができる。
「自動設定支援処理」とは、システムによる所定処理の実行に必要となる各種条件の設定を自動で行う処理のことをいう。
以下、情報処理システムにおいて実行される、自動設定支援処理を実行するための機能的構成について説明する。
【0041】
図4は、図3のサーバの機能的構成のうち、自動設定支援処理を実行するための機能的構成の一例を示す機能ブロック図である。
【0042】
図4に示すように、図3のサーバ1が自動設定支援処理を実行する場合、CPU11においては、データ管理部101と、対象指定受付部102と、開始指示受付部103と、条件設定支援部104とが機能する。また、サーバ1の記憶部18の一領域には、アプリDB181と、入力DB182と、出力DB183とが設けられている。
【0043】
データ管理部101は、OCRアプリBに入力される入力データFaと、OCRアプリBから出力される出力データFbとを管理する。具体的には、データ管理部101は、OCRアプリBをアプリDB181に記憶させて管理する。また、データ管理部101は、入力データFaと出力データFbとの夫々を、入力DB182と出力DB183との夫々に記憶させて管理する。
【0044】
対象指定受付部102は、OCRアプリBの指定と、OCRアプリBに入力される入力データFaの指定とを受け付ける。
【0045】
開始指示受付部103は、OCRの処理の開始の指示を受け付ける。具体的には例えば、開始指示受付部103は、入力データFaを示すアイコンI2を、OCRアプリBを示すアイコンI1上にドラッグ・アンド・ドロップする操作を、OCRの処理の開始の指示として受け付ける。
【0046】
条件設定支援部104は、対象指定受付部102により指定が受け付けられた、OCRアプリB及び入力データFaの内容と、開始指示受付部103により受け付けられた、OCRの処理の開始の指示の内容とに基づいて、OCRアプリBの処理条件の設定の支援を行う。具体的には例えば、条件設定支援部104は、出力データFbの出力先となる場所、処理回数、タイムアウトになるまでの時間、帳票の定義、解像度等に関する自動設定の支援を行う。
【0047】
また、図4に示すように、図3のサーバ1が自動設定支援処理を実行する場合、ユーザ端末2の図示せぬCPUにおいては、条件設定部201が機能する。条件設定部201は、OCRアプリBの処理条件の自動設定を行う。
【0048】
次に、図5乃至図9を参照して、図1の本サービスの具体例について説明する。
【0049】
図5は、本サービスとチャットボットとの連携の具体例を示す図である。
【0050】
図5には、ユーザ端末2に表示されるチャット画面の具体例が示されている。例えば、ユーザが処理条件の設定を変更するための申請を行う際、申請理由に記載する内容についてチャットボットに質問したとする。すると、図5に示すように、BOT(チャットボット)からの自動応答として、「下記のとおり申請してください」というメッセージがチャット画面に表示される。当該メッセージには「サンプル」と表記されたリンクボタンB1が含まれている。ユーザがリンクボタンB1をクリックする操作を行うと、申請理由のサンプルが記載されたファイルが開かれる。その後、ユーザが申請理由を入力することなく処理条件の設定の変更の申請を行うと、BOT(チャットボット)からの自動応答として、「申請理由は必須です。」というメッセージがチャット画面に表示される。
また、ユーザが処理条件の設定を変更するための申請を行う際、申請方法ついてチャットボットに質問すると、処理条件の設定の変更の申請を行うためのウィザード(図示せず)が自動的に起動するようにすることもできる。
【0051】
図6は、撮像画像のデータのクラウドへの自動保存、及びOCRアプリの自動起動の具体例を示す図である。
【0052】
ユーザ端末2により撮像された文書の画像データ、又はユーザ端末2に既に記憶されていた撮像画像のデータは、入力データFaとして、必要に応じて手動配置された後、所定のクラウドに保存される(ステップSS11)。その後、入力データFaが所定のクラウドに保存されたことが自動検知されると(ステップSS12)、ユーザ端末2によるOCRの処理が開始される(ステップSS13)。そして、所定のフォルダに出力データFb(OCR読取データ)が出力される(ステップSS14)。
このように、スマートフォン等による撮像に、OCRアプリBの起動を連動させることにより、ユーザ側で行わなければならない種々の操作がスキップされる。その結果、ユーザの利便性を向上させることができる。また、いわゆるITリテラシーが低いユーザであってもOCRアプリBを容易に使用することができる。
【0053】
図7は、OCRアプリの機能のうち、色や模様を用いてOCRの処理の精度を区別する機能の具体例を示す図である。
【0054】
上述したように、OCRアプリBの機能には、色や模様を用いてOCRの処理の精度を区別する機能が含まれる。具体的には例えば、OCRの処理の対象となる入力データFaが、図7に示すような複数のセルの夫々に手書きの文字が配置された帳票であったとする。この場合、OCRアプリBは、OCRの処理をセル毎に行い、模様を用いてその精度(自信度)を区別する。
図7の(A)乃至(C)の夫々には、OCRの処理の精度(自信度)が低い例と、OCRの処理の精度(自信度)が標準である例と、OCRの処理の精度(自信度)が高い例との夫々が、破線の四角内に示されている。
このように、OCRアプリBの独自の機能として、処理の精度(自信度)に応じた模様(又は色など)で区分することができるので、ロボットは、ユーザが求める精度に応じて適宜バリデーションを省略することができる。その結果、OCRの処理の精度とスピードとをコントロールすることが可能となる。
【0055】
図8は、クラウドに保存されている入力データを、登録済みの帳票の定義であるか否かという観点で仕分ける作業の具体例を示す図である。
【0056】
所定のクラウドには複数種類の入力データFaが保存されている。このため、OCR処理の対象とすべき入力データFaを手作業で探した場合、時間的コストが発生する。そこで、本サービスでは、ソータ機能によって、クラウドに保存されている入力データFaを登録済みの帳票の定義と未登録の帳票の定義とに仕分けることができる。具体的には、ユーザは、図8に示すUI(User Interface)を用いて、クラウドに保存されている入力データFaを登録済みの帳票の定義と未登録の帳票の定義とに仕分ける。
【0057】
図8のUIのうち、表示領域H1には、「仕分け開始」と表記されたボタンB2と、「ドキュメントを確認」と表記されたボタンB3とが設けられている。また、表示領域H1には、「仕分け前」の状態である入力データFa(ドキュメント)がクラウドに「2枚」保存されていることが示されている。
ユーザは、ボタンB3をクリックすることで、クラウドに保存されている2枚の入力データFa(ドキュメント)の内容を表示させることができる。
ここで、ユーザがボタンB2をクリックすると、クラウドに保存されている2枚の入力データFa(ドキュメント)の仕分け作業が開始される。
【0058】
図8のUIのうち、表示領域H2には、入力データFaの仕分け作業の結果が表示される。図8の例では、登録済みの帳票の定義としての2種類の発注書と、仕分け不可(未登録の帳票)とに仕分けられる。なお、図8の例では、仕分け不可(未登録の帳票)は「0枚」(該当なし)となっている。
登録済みの帳票の定義である「発注書_〇〇堂本舗」及び「発注書_XXトレーディング」の夫々に仕分けられた入力データFaは、「ドキュメントを確認」と表記されたボタンB5をクリックすることで内容が表示される。また、「ダウンロード」と表記されたボタンB6をクリックすることでダウンロードが開始される。
また、仕分け作業が完了すると、「OCRアプリに送信」と表記されたボタンB4がアクティブになる。そして、ユーザがボタンB4をクリックすると、クラウドに保存されていた入力データFaがユーザ端末2に移動する。具体的には例えば、図8の例では、「発注書_〇〇堂本舗」及び「発注書_XXトレーディング」の夫々に仕分けられた入力データFaがユーザ端末2に移動する。
【0059】
図9は、OCRの処理の対象として設定された帳票の定義に応じて出力データの解像度が自動設定される具体例を示す図である。
【0060】
図9の(A)には、OCRアプリBによるOCRの処理の対象となる入力データFaを設定する際にユーザ端末2に表示されるUIの具体例が示されている。具体的には例えば、図9の(A)の例では、「発注書_〇〇堂本舗」、「発注書_△△トータルオフィス」、及び「発注書_XXトレーディング」の夫々に仕分けられた入力データFaが、OCRの処理の候補として表示されている。このうち、例えば「発注書_〇〇堂本舗」を選択する操作(クリックする操作)が行われると、図9の(A)に示すように、「発注書_〇〇堂本舗」をOCRの処理の対象にするためのボタンB7が表示される。
ここで、OCRの処理を開始する操作が行われると、OCRの処理の対象とされている帳票の定義の属性に応じて、出力データFb(OCR読取データ)が出力される際の解像度が自動設定される。
【0061】
図9の(B)には、図9の(A)に示すUIの具体例とは異なる具体例が示されている。図9の(B)には、「ドキュメントを読み取る」という表記の表題と、「読み取りたいドキュメント画像ファイルを選択してください。(複数選択可)」という表記のメッセージとが表示される。また、「ファイルを選択」と表記されたボタンB8が表示される。ここで、ボタンB8がクリックされると、OCRの処理の対象となる1以上の入力データFa(ドキュメント)を選択する画面(図示せず)が表示される。その後、OCRの処理の対象となる1以上の入力データFa(ドキュメント)が選択されて、OCRの処理を開始する操作が行われる。すると、OCRの処理の対象とされている帳票の定義の属性に応じて、出力データFb(OCR読取データ)が出力される際の解像度が自動設定される。
【0062】
以上、本発明の一実施形態について説明したが、本発明は、上述の実施形態に限定されるものではなく、本発明の目的を達成できる範囲での変形、改良等は本発明に含まれるものとみなす。
【0063】
例えば、図1の説明では、本サービスにより自動設定される処理条件として、出力データFb(OCR読取データ)の出力場所、出力形式、及び出力時のデータファイル分割の態様が挙げられているが、これらは例示に過ぎない。即ち、「処理条件」には、システム(例えばOCRアプリB)による処理を実行するために予め設定が必要となるあらゆる事項を「処理条件」に含めることができる。
【0064】
また例えば、上述の実施形態では、本サービスの適用対象となるアプリとして、OCRアプリBが採用されているが、これに限定されない。本サービスの対象となるアプリは同時に複数存在してもよい。
【0065】
また、図2に示すシステム構成、及び図3に示すサーバ1のハードウェア構成は、本発明の目的を達成するための例示に過ぎず、特に限定されない。
【0066】
また、図4に示す機能ブロック図は、例示に過ぎず、特に限定されない。即ち、上述した自動設定支援処理を全体として実行できる機能が図4の情報処理システムに備えられていれば足り、この機能を実現するためにどのような機能ブロックを用いるのかは、特に図4の例に限定されない。
【0067】
また、機能ブロックの存在場所も、図4に限定されず、任意でよい。
図4の例において、自動設定支援処理は、上述の情報処理システムを構成するサーバ1のCPU11の制御により行われる構成となっているが、これに限定されない。例えばサーバ1側に配置された機能ブロックの少なくとも一部を、ユーザ端末2側、又は図示せぬ情報処理装置が備える構成としてもよい。
【0068】
また、上述した一連の処理は、ハードウェアにより実行させることもできるし、ソフトウェアにより実行させることもできる。
また、1つの機能ブロックは、ハードウェア単体で構成してもよいし、ソフトウェア単体で構成してもよいし、それらの組み合わせで構成してもよい。
【0069】
一連の処理をソフトウェアにより実行させる場合には、そのソフトウェアを構成するプログラムが、コンピュータ等にネットワークや記録媒体からインストールされる。
コンピュータは、専用のハードウェアに組み込まれているコンピュータであってもよい。
また、コンピュータは、各種のプログラムをインストールすることで、各種の機能を実行することが可能なコンピュータ、例えばサーバの他汎用のスマートフォンやパーソナルコンピュータであってもよい。
【0070】
このようなプログラムを含む記録媒体は、ユーザにプログラムを提供するために装置本体とは別に配布される図示せぬリムーバブルメディアにより構成されるだけでなく、装置本体に予め組み込まれた状態でユーザに提供される記録媒体等で構成される。
【0071】
なお、本明細書において、記録媒体に記録されるプログラムを記述するステップは、その順序に沿って時系列的に行われる処理はもちろん、必ずしも時系列的に処理されなくとも、並列的あるいは個別に実行される処理をも含むものである。
【0072】
以上をまとめると、本発明が適用される情報処理装置は、次のような構成を有していれば足り、各種各様な実施の形態を取ることができる。
即ち、本発明が適用される情報処理装置は、
1以上のシステム(例えば上述のOCRアプリB)による所定処理(例えばOCRの処理)の実行を支援する情報処理装置(例えば図2のサーバ1)において、
前記1以上のシステムの夫々に入力される第1データ(例えば図1の入力データFa)と、前記1以上のシステムのうちいずれかから出力される第2データ(例えば図1の出力データFb(OCR読取データ))とを管理するデータ管理手段(例えば図4のデータ管理部101)と、
前記1以上のシステムのうち、前記所定処理を行うシステムの指定と、当該システムに入力される前記第1データの指定とを受け付ける第1受付手段(例えば図4の対象指定受付部102)と、
前記所定処理の開始の指示(例えば、図1のOCRアプリBを示すアイコンI1上に、入力データFaを示すアイコンI2をドラッグ・アンド・ドロップする操作)を受け付ける第2受付手段(例えば図4の開始指示受付部103)と、
前記第1受付手段により指定が受け付けられた、前記システム及び前記第1データの内容と、前記第2受付手段により受け付けられた、前記開始の指示の内容とに基づいて、前記システムの処理条件(例えば出力データFbの出力先となる場所、処理回数、タイムアウトになるまでの時間、帳票の定義、解像度等)の設定の支援を行う条件設定支援手段(例えば図4の条件設定支援部104)と、
を備える。
【0073】
これにより、1以上のシステムの夫々に入力される第1データと、1以上のシステムのうちいずれかから出力される第2データとが管理される。そして、1以上のシステムのうち、所定処理を行うシステムの指定と、指定されたシステムに入力される第1データの指定とが受け付けられる。また、所定処理の開始の指示が受け付けられる。その後、指定が受け付けられたシステム及び第1データの内容と、第2受付手段により受け付けられた開始の指示の内容とに基づいて、システムの処理条件の設定の支援が行われる。
その結果、第1データに所定処理を施して所定場所に所定形式の第2データを出力する操作を行うユーザの利便性を向上させることができる。
【0074】
また、前記条件設定支援手段は、
前記設定の支援として、前記1以上の条件のうち1以上の条件が未設定状態になるようにして、当該条件を設定するために必要となる操作の支援(例えば上述したダイアログボックスの表示)を行うことができる。
【0075】
これにより、設定の支援として、1以上の条件のうち1以上の条件が未設定状態になるようにして、当該条件を設定するために必要となる操作の支援が行われる。
その結果、ユーザの利便性をさらに向上させることができる。
【符号の説明】
【0076】
1・・・サーバ、2・・・ユーザ端末、11・・・CPU、12・・・ROM、13・・・RAM、14・・・バス、15・・・入出力インターフェース、16・・・入力部、17・・・出力部、18・・・記憶部、19・・・通信部、20・・・ドライブ、40・・・リムーバルメディア、101・・・データ管理部、102・・・対象指定受付部、103・・・開始指示受付部、104・・・条件設定支援部、181・・・アプリDB、182・・・入力DB、183・・・出力DB、201・・・条件設定部、Fa・・・入力データ、Fb・・・出力データ、I・・・アイコン、N・・・ネットワーク
図1
図2
図3
図4
図5
図6
図7
図8
図9