IP Force 特許公報掲載プロジェクト 2022.1.31 β版

知財求人 - 知財ポータルサイト「IP Force」

▶ 株式会社リコーの特許一覧

<>
  • 特許-情報処理システムおよび情報処理方法 図1
  • 特許-情報処理システムおよび情報処理方法 図2
  • 特許-情報処理システムおよび情報処理方法 図3
  • 特許-情報処理システムおよび情報処理方法 図4
  • 特許-情報処理システムおよび情報処理方法 図5
  • 特許-情報処理システムおよび情報処理方法 図6
  • 特許-情報処理システムおよび情報処理方法 図7
  • 特許-情報処理システムおよび情報処理方法 図8
  • 特許-情報処理システムおよび情報処理方法 図9
  • 特許-情報処理システムおよび情報処理方法 図10
  • 特許-情報処理システムおよび情報処理方法 図11
  • 特許-情報処理システムおよび情報処理方法 図12
  • 特許-情報処理システムおよび情報処理方法 図13
< >
(19)【発行国】日本国特許庁(JP)
(12)【公報種別】特許公報(B2)
(11)【特許番号】
(24)【登録日】2022-03-22
(45)【発行日】2022-03-30
(54)【発明の名称】情報処理システムおよび情報処理方法
(51)【国際特許分類】
   H04N 1/00 20060101AFI20220323BHJP
【FI】
H04N1/00 C
【請求項の数】 7
(21)【出願番号】P 2018065896
(22)【出願日】2018-03-29
(65)【公開番号】P2019176434
(43)【公開日】2019-10-10
【審査請求日】2020-12-11
(73)【特許権者】
【識別番号】000006747
【氏名又は名称】株式会社リコー
(72)【発明者】
【氏名】蚊爪 聖子
【審査官】豊田 好一
(56)【参考文献】
【文献】特開2017-129926(JP,A)
【文献】特開2015-211428(JP,A)
【文献】特開2017-073591(JP,A)
【文献】特開2018-030330(JP,A)
【文献】特開2016-165059(JP,A)
【文献】特開2019-115011(JP,A)
(58)【調査した分野】(Int.Cl.,DB名)
H04N 1/00
(57)【特許請求の範囲】
【請求項1】
画像データのOCR結果を取得するOCR取得部と、
前記OCR結果からあらかじめ特定された、前記画像データに応じた期限を表す単語である第一の文字列を抽出する第一の抽出部と、
前記OCR結果からあらかじめ特定された、前記画像データに応じた期限自体を表す第二の文字列を抽出する第二の抽出部と、
前記第一の抽出部によって前記第一の文字列が含まれていると判断され、前記第二の抽出部によって前記第二の文字列が含まれていると判断された場合であって、前記第一の文字列の後ろに前記第二の文字列が出現していると判断された場合に、前記第一の文字列と前記第二の文字列とを含むファイル名を生成するファイル名生成部と、
前記第一の抽出部によって前記第一の文字列が含まれていると判断され、前記第二の抽出部によって前記第二の文字列が含まれていないと判断された場合に、前記ファイル名生成部によって生成される期限文書とは異なる通常文書として、予め定められたフォルダを指定して転送する期限設定制御部とを備えた情報処理システム。
【請求項2】
前記情報処理システムはさらに期限判断部を有し、
前記期限判断部は、前記第一の文字列の後ろに前記第二の文字列が出現しているかを判断し、
出現している場合に、前記ファイル名生成部は、前記第一の文字列と前記第二の文字列とを含むファイル名を生成し、
出現していない場合に、前記期限設定制御部は、前記通常文書として、前記予め定められたフォルダを指定して転送する請求項1の情報処理システム。
【請求項3】
前記OCR取得部は、前記画像データが複数ページからなる場合に、前記第一の文字列が抽出された時点で残りのページについては前記OCR結果を取得しない請求項1または2の情報処理システム。
【請求項4】
前記情報処理システムはさらにフォルダ名指定部を有し、
前記フォルダ名指定部は、前記ファイルの保存フォルダ名として、前記画像データに付与された前記ファイル名から抽出された文字列を用いたフォルダ名を指定する請求項1または2の情報処理システム。
【請求項5】
前記情報処理システムは、
記憶部を有する端末装置と、
前記端末装置に前記画像データを転送する情報処理装置とを有し、
前記情報処理装置は、前記フォルダ名指定部を有し、
前記フォルダ名指定部は、前記画像データが前記端末装置に転送されて前記記憶部に記憶される際のフォルダ名を指定する請求項の情報処理システム。
【請求項6】
前記情報処理システムは、ファクシミリを受信可能な情報処理装置を有し、
記憶部を有する端末装置と、
前記端末装置に前記画像データを転送する情報処理装置とを有し、
前記画像データは前記情報処理装置が受信したファクシミリの画像データである請求項1ないしいずれかの情報処理システム。
【請求項7】
画像データのOCR結果を取得するOCR取得工程と、
前記OCR結果からあらかじめ特定された、前記画像データに応じた期限を表す単語である第一の文字列を抽出する第一の抽出工程と、
前記OCR結果からあらかじめ特定された、前記画像データに応じた期限自体を表す第二の文字列を抽出する第二の抽出工程と、
前記第一の抽出工程によって前記第一の文字列が含まれていると判断され、前記第二の抽出工程によって前記第二の文字列が含まれていると判断された場合であって、前記第一の文字列の後ろに前記第二の文字列が出現していると判断された場合に、前記第一の文字列と前記第二の文字列とを含むファイル名を生成するファイル名生成工程と、
前記第一の抽出工程によって前記第一の文字列が含まれていると判断され、前記第二の抽出工程によって前記第二の文字列が含まれていないと判断された場合に、前記ファイル名生成工程によって生成される期限文書とは異なる通常文書として、予め定められたフォルダを指定して転送する期限設定制御工程とからなる情報処理方法。
【発明の詳細な説明】
【技術分野】
【0001】
本発明は、情報処理システムおよび情報処理方法に関する。
【背景技術】
【0002】
MFP(Multifunction Peripheral/Printer/Product)などの画像処理装置において、光学文字認識(OCR:Optical Character Recognition)処理を行う機能が実装されている。
【0003】
OCR処理とは手書きの文字や印刷された文字をスキャナなどで光学的に読み取った原稿の画像データ、またファクシミリなどで受信した原稿の画像データから、文字を抽出し文字(テキスト)データへと変換する処理として知られている。
【0004】
特許文献1には画像読取り装置が記載されており、その画像読取り装置は、原稿画像を読み込み、文字認識して抽出した文字列(語句)からさらに、出現頻度の高い文字列を抽出している。その後、画像読取り装置は、抽出された出現頻度の高い文字列の中に、あらかじめ設定された禁則文字が含まれているかを判断する。そして禁則文字が含まれていなければ、ユーザに対して抽出した文字列を表示し、その中からユーザが選択した文字列をファイル名と決定している。
【発明の概要】
【発明が解決しようとする課題】
【0005】
しかし、特許文献1に記載の画像読取り装置では、画像データ中の出現頻度の高い文字列が抽出されるため、出現頻度は低いが管理上重要な文字列をファイル名として登録できない。
【課題を解決するための手段】
【0006】
上記課題を解決するために、請求項1にかかる発明は、画像データのOCR結果を取得するOCR取得部と、前記OCR結果からあらかじめ特定された、前記画像データに応じた期限を表す単語である第一の文字列を抽出する第一の抽出部と、前記OCR結果からあらかじめ特定された、前記画像データに応じた期限自体を表す第二の文字列を抽出する第二の抽出部と、前記第一の抽出部によって前記第一の文字列が含まれていると判断され、前記第二の抽出部によって前記第二の文字列が含まれていると判断された場合であって、前記第一の文字列の後ろに前記第二の文字列が出現していると判断された場合に、前記第一の文字列と前記第二の文字列とを含むファイル名を生成するファイル名生成部と、前記第一の抽出部によって前記第一の文字列が含まれていると判断され、前記第二の抽出部によって前記第二の文字列が含まれていないと判断された場合に、前記ファイル名生成部によって生成される期限文書とは異なる通常文書として、予め定められたフォルダを指定して転送する期限設定制御部とを備えた情報処理システムである。
【発明の効果】
【0007】
本発明によれば、画像データ中の出現頻度に関わらず、特定の文字列をファイル名に使用して画像データを管理できる。
【図面の簡単な説明】
【0008】
図1】一実施形態に係る情報処理システムの全体構成図である。
図2】一実施形態に係る端末装置のハードウェア構成図である
図3】一実施形態に係る情報処置装置のハードウェア構成図である
図4】一実施形態に係るサーバ装置のハードウェア構成図である
図5】一実施形態に係る情報処理システムの機能ブロック図である。
図6】画像データに応じて期限を判断する処理の一例を示すフロー図である。
図7】画像データの一例である。
図8】画像データのOCR結果の一例である。
図9】OCR結果からの文字列抽出の一例である。
図10】OCR結果からの抽出文字列の出力の一例である。
図11】画像データを保存するフォルダの一例である。
図12】画像データ転送処理の一例を示すフロー図である。
図13】OCR取得工程の一例を示すシーケンス図である。
【発明を実施するための形態】
【0009】
以下、添付の図面に基づき、本発明の実施の形態について説明する。なお、本発明の実施の形態を説明するための各図面において、同一の機能もしくは形状を有する部材や構成部品等の構成要素については、判別が可能な限り同一符号を付すことにより一度説明した後ではその説明を省略する。
【0010】
図1は、一実施形態に係る情報処理システムの全体構成図である。この情報処理システムは、画像データに含まれる特定の文字列を画像データのファイル名として使用可能な情報処理システムである。図1に示されているように、情報処理システム1は、PC(Personal Computer)などの端末装置10、画像形成装置20A,20B、およびサーバ装置50A,50Bによって構築されている。以下の説明では、画像形成装置20A,20Bのうち任意のものを画像形成装置20と表す。サーバ装置50A,50Bのうち任意のものをサーバ装置50と表す。
【0011】
情報処理システム1において、端末装置10の数は1台に限定されない。また、画像形成装置20およびサーバ装置50の数は、それぞれ2台に限定されない。以下、原稿が文書である場合について説明する。ただし、原稿は、文字を含む画像であれば特に限定されず、例えば、図面であってもよい。文字には、OCR処理により認識可能な数字、記号、符号、アイコンなども含まれる。また、文字列は一文字以上であればよい。
【0012】
端末装置10は、例として、汎用PCや汎用携帯情報端末などの端末装置である。
【0013】
画像形成装置20は、一例として、MFP(Multifunction Peripheral/Printer/Product)と称される複合機であり、ファクシミリ、スキャナ、コピー、OCR処理、あるいはプリンタなどの画像処理機能、さらに通信機能を有する情報処理装置である。なお、画像形成装置20で処理される「画像」は、画像データだけでなく、画像データが含まれていないデータ、つまり文字情報のみのデータも含む。
【0014】
画像形成装置20は、OCR処理の結果(以下、OCR結果と表す)を表示画像として出力してもよいし、データとして出力してもよい。上記のスキャナは、サーバ(クラウドサーバを含む)との通信、または通信端末との通信、もしくは、外部ストレージへの書き込みにより、OCR結果をデータとして出力するハンディスキャナであってもよい。OCR結果をデータとして出力する場合、データの形式は特に限定されない。画像形成装置20は、OCR結果を、例えば、テキストデータとして出力してもよいし、PDFファイルに埋め込んで出力してもよい。以下、画像形成装置20がMFPである場合について説明する。
【0015】
画像形成装置20は、文書の画像を文字コードに変換するOCRモジュールを搭載している。ただし、OCRモジュールがオプションの機能である場合、画像形成装置20のうちいずれかは、OCRモジュールを搭載していなくてもよい。また画像形成装置20は、指定された文書の画像に対し、OCR処理を要求するアプリケーションを実装している。以後、「アプリケーション」を、「アプリ」と表す。
【0016】
サーバ装置50は、画像処理機能および通信機能を有する情報処理装置である。サーバ装置50は、文書の画像を文字コードに変換するOCRモジュールを搭載している。そしてサーバ装置50は、アプリからの要求に基づいて、OCR処理を実行するサーバ機能を有する。
【0017】
端末装置10、画像形成装置20およびサーバ装置50Aは、LAN2L(Local Area Network)に接続している。画像形成装置20は、LAN2Lからインターネット2Iに接続し、インターネット2I上のクラウドサーバとしてのサーバ装置50Bに接続する。以下では、LAN2Lおよびインターネット2Iのうち任意のものを通信ネットワーク2と表す。通信ネットワーク2の全部又は一部には、Wi-Fi(Wireless Fidelity)などの無線による通信が行われる箇所があってもよい。
【0018】
図2は、一実施形態に係る端末装置のハードウェア構成図である。図2を用いて、図1の情報処理システムにおける端末装置10のハードウェア構成について説明する。
【0019】
端末装置10は、CPU(Central Processing Unit)11と、ROM(Read Only Memory)12と、RAM(Random Access Memory)13と、HDD(Hard Disk Drive)14と、メディアI/F(Interface)15と、ネットワークI/F17と、操作部18と、バスライン19と、を有する。
【0020】
CPU11は、サーバ装置10全体の動作を制御する。ROM12は、サーバ装置10上で動作するOS(Operating System)、アプリ、SDK(Software evelopment Kit)、あるいはAPI(Application Programming Interface)などの各種プログラムを記憶する。
【0021】
RAM13は、CPU11のワークエリアとして使用される。HDD14は、各種プログラムで利用されるデータを記憶する。HDD14は、SSD(Solid state Drive)などの不揮発性のストレージに置き換え可能である。メディアI/F15は、外部メモリなどの記録メディア16に記憶されている情報を読み出したり、記録メディア16に情報を書き込んだりするためのインタフェースである。
【0022】
ネットワークI/F17は、例えば、Ethernet(登録商標)またはWi-Fiにより通信ネットワーク2を介して他の装置と通信するための通信手段である。操作部18は、ユーザによる操作入力を受け付けるためのインタフェースである。操作部18は、例えば、タッチパネル機能を搭載した液晶表示装置または有機EL(Electro Luminescence)表示装置、もしくはキーボードおよびマウスである。バスライン19は、上記各構成要素を図2に示されているように電気的に接続するためのアドレスバスまたはデータバスである。
【0023】
図3は、一実施形態に係る画像形成装置20のハードウェア構成図である。図3を用いて、図1の情報処理システムにおける画像形成装置20のハードウェア構成について説明する。
【0024】
画像形成装置20のコントローラ200は、CPU21と、ROM22と、RAM23と、NVRAM24(Non-volatile RAM)と、HDD25と、ネットワークI/F26と、エンジンI/F27と、パネルI/F28と、スキャナI/F29と、FCU(Fax Cotroller Unit)30と、メディアI/F35と、バスライン31と、を有する。また、画像形成装置20は、プロッタエンジン32と、操作部33と、スキャナエンジン34と、を有する。
【0025】
CPU21は、画像形成装置20全体の動作を制御する。ROM22は、画像形成装置20上で動作するOS、アプリ、SDK、APIなどの各種プログラムを記憶する。RAM23は、CPU21のワークエリアとして使用される。NVRAM24およびHDD25は、各種プログラムで利用されるデータを記憶する。データには、OCR処理中のデータ、OCR結果のデータも含まれる。
【0026】
ネットワークI/F26は、例えば、Ethernet(登録商標)またはWi-Fiにより通信ネットワーク2を介して他の装置と通信するための通信手段である。エンジンI/F27は、プロッタエンジン32と接続するためのインタフェースである。パネルI/F28は、操作部33と接続するためのインタフェースである。スキャナI/F29は、スキャナエンジン34と接続するためのインタフェースである。FCU30は、他のファクシミリ端末との間で画像データであるファクシミリデータを送受信するファクシミリ通信を行う。
【0027】
メディアI/F35は、外部メモリなどの記録メディア36に記憶されている情報を読み出したり、記録メディア36に情報を書き込んだりするためのインタフェースである。バスライン31は、上記各構成要素を図3に示されているように電気的に接続するためのアドレスバスまたはデータバスである。
【0028】
プロッタエンジン32は、印刷処理において、画像形成装置20におけるプロッタの動作を制御する。プロッタは、インクジェット方式の場合、例えば、インクジェットヘッドであり、レーザープリンタ方式の場合、例えば、感光体、レーザー照射装置、あるいは転写装置である。操作部33は、タッチパネル機能を搭載した液晶表示装置または有機EL表示装置であり、ユーザから設定、条件、指示などの入力を受け付ける。
【0029】
スキャナエンジン34は、画像形成装置20におけるスキャナの動作を制御する。なお、スキャナは、特に限定されないが、例えば、圧板、ADF(Auto Document Feeder)、および撮像素子を有し、原稿から画像を読み取る任意の装置である。
【0030】
図4は、一実施形態に係るサーバ装置のハードウェア構成図である。図4を用いて、図1の情報処理システムにおけるサーバ装置50のハードウェア構成について説明する。
【0031】
サーバ装置50は、CPU51と、ROM52と、RAM53と、HDD54(Hard Disk Drive)と、メディアI/F55と、ネットワークI/F57と、操作
部58と、バスライン59と、を有する。
【0032】
CPU51は、サーバ装置50全体の動作を制御する。ROM52は、サーバ装置50上で動作するOS、アプリ、SDK、あるいはAPIなどの各種プログラムを記憶する。RAM53は、CPU51のワークエリアとして使用される。HDD54は、各種プログラムで利用されるデータを記憶する。データには、OCR処理中のデータ、OCR結果のデータも含まれる。HDD54は、SSDなどの不揮発性のストレージに置き換え可能である。メディアI/F55は、外部メモリなどの記録メディア56に記憶されている情報を読み出したり、記録メディア56に情報を書き込んだりするためのインタフェースである。
【0033】
ネットワークI/F57は、例えば、Ethernet(登録商標)またはWi-Fiにより通信ネットワーク2を介して他の装置と通信するための通信手段である。操作部58は、ユーザによる操作入力を受け付けるためのインタフェースである。操作部58は、例えば、タッチパネル機能を搭載した液晶表示装置または有機EL(Electro Luminescence)表示装置、もしくはキーボードおよびマウスである。バスライン59は、上記各構成要素を図4に示されているように電気的に接続するためのアドレスバスまたはデータバスである。
【0034】
次に、端末装置10、画像形成装置20およびサーバ装置50の機能構成について説明する。図5は、図1の情報処理システムにおける端末装置10、画像形成装置20およびサーバ装置50の機能ブロック図である。図5において、端末装置10、画像形成装置20およびサーバ装置50は、通信ネットワーク2を介して通信可能に接続されている。
【0035】
端末装置10は、通信部120と、読出・書込処理部130と、記憶部140とを有する。これら各部は、図2に示されている各構成要素のいずれかが、ROM12からRAM13上に展開された端末装置10用のプログラムに従ったCPU11からの命令によって動作することで実現される機能である。
【0036】
通信部120は、CPU11からの命令およびネットワークI/F17の処理により実現され、ネットワーク2で接続された他の装置との通信を制御する。
【0037】
読出・書込処理部130は、CPU11がRAM13を作業領域としてROM12またはHDD14を実行することによって実現され、記憶部140に各種データを記憶したり、記憶された各種データを読み出したりする機能を実行する。
【0038】
記憶部140は、ROM12またはHDD14の処理によって実行され、各種プログラムやデータ、動作に必要な各種設定情報等を格納する機能を実行する。RAM13の一時的な記憶機能により実行してもよい。
【0039】
画像形成装置20は、入力受付部210と、通信部220と、読出・書込処理部230と、記憶部240とを有する。これら各部は、図3に示されている各構成要素のいずれかが、ROM22からRAM23上に展開された画像形成装置20用のプログラムに従ったCPU21からの命令によって動作することで実現される機能である。
【0040】
入力受付部210は、CPU21がRAM23を作業領域としてROM22またはHDD25を実行することによって実現され、外部機器からの指示入力や、ユーザからの入力を受け付ける。
【0041】
通信部220は、CPU21からの命令およびネットワークI/F26の処理により実現され、ネットワーク2で接続された他の装置との通信を制御する。
【0042】
読出・書込処理部230は、CPU21がRAM23を作業領域としてROM22またはHDD25に記憶されたプログラムを実行することによって実現され、記憶部240に各種データを記憶したり、記憶された各種データを読み出したりする機能を実行する。
【0043】
記憶部240は、ROM22またはHDD25の処理によって実行され、各種プログラムやデータ、動作に必要な各種設定情報等を格納する機能を実行する。RAM23の一時的な記憶機能により実行してもよい。
【0044】
記憶部240は、表1で示される文字列1リスト、および表2で示される文字列2リストを記憶する。第一の文字列である文字列1、第二の文字列である文字列2はそれぞれ、ユーザによってファクシミリ文書の管理に使用する文字列としてあらかじめ設定された特定の文字列である。そいて文字列1リストはユーザが文字列1として複数設定した場合の複数の文字列1からなるリストである。また文字列2リストはユーザが文字列2として複数設定した場合の複数の文字列2からなるリストである。これら文字列リストのユーザからの入力を入力受付部210が受け付け、受け付けられた文字列リストは、読出・書込処理部230の機能により記憶部240に記憶される。














































【0045】
【表1】
【0046】
【表2】
【0047】
ここで第一の文字列としての文字列1、第二の文字列としての文字列2について説明すると、文字列1と文字列2は、互いに異なる種類の文字列である。
【0048】
文字列1は一例として、期限を表す単語を示す文字列である。期限を表す単語として具体的には、表1に示されるように『納期』『回答納期』『期限』の3つの文字列1が記憶部240にあらかじめ記憶されている。
【0049】
文字列2は一例として、期限自体を表す単語を示す文字列である。期限自体を表す単語として具体的には、表2に示されるような、年月日を示す『平成YY年MM月DD日』『YYYY年MM月DD日』『YYYY/MM/DD』の3つの文字列2が記憶部240にあらかじめ記憶されている。なお、Y,M,Dは特定の文字列ではなくそれぞれ任意の数字を表している。
【0050】
表1、表2それぞれ3つの文字列からなる文字列リストであるが、記憶される文字列の数はこれに限られず、記憶される順番も任意である。また表2には年月日を記憶しているが、期限を表すものであればこれに限られず、他に曜日や時間、これらを組み合わせたものでもよい。また特定の文字列とはすべて特定された文字からなるものだけでなく、文字列2のように、特定の文字列と任意の文字列との組み合わせであってもよい。
【0051】
画像形成装置20は、さらに、画像データ処理部250と、要求先判断部260と、OCR処理部270とを有する。これら各部は、図3に示されている各構成要素のいずれかが、ROM22からRAM23上に展開された画像形成装置20A用のプログラムに従ったCPU21からの命令によって動作することで実現される機能である。
【0052】
画像データ処理部250は、期限設定制御部251と、転送制御部252を有し、画像データを期限が設定された文書として端末装置10に転送する機能を実行する。詳細には、まず期限設定制御部251は、画像データに応じて期限を設定する機能を実行する。そして転送制御部252は、期限が設定された文書としての画像データを端末装置10に転送する機能を実行する。
【0053】
期限設定制御部251は、OCR取得部2511と、文字列1抽出部2512と、文字列2抽出部2513と、期限判断部2514と、ファイル名生成部2515とを有する。
【0054】
OCR取得部2511は、OCRモジュールに対するOCR要求を行い、画像データのOCRを取得する機能を実行する。文字列1抽出部2512と、文字列2抽出部2513は、OCR結果から、それぞれ文字列1、文字列2を抽出する機能を実行する。期限判断部2514は、抽出された文字列から期限が設定された文書であるかどうかを判断する。ファイル名生成部2515は、抽出された文字列に基づき、期限が設定された文書として画像データに新たに付与するファイル名を生成する機能を実行する。
【0055】
転送制御部252は、フォルダ名指定部2521と、転送処理部2522とを有する。フォルダ名指定部2521は、期限が設定された文書としての画像データを保存するフォルダ名(ディレクトリ名)を指定する。転送処理部2522は、端末装置10に期限が設定された文書としての画像データを転送する機能を実行する。
【0056】
要求先判断部260は、OCR要求先としてOCR処理可能なOCRモジュールを判断する機能を実行する。
【0057】
OCR処理部270は、OCR要求に応じて画像データにOCR処理を行い、OCR結果を出力する機能を実行する。
【0058】
サーバ装置50は、通信部520と、OCRモジュールであるOCR処理部570とを有する。これら各部は、図4に示されている各構成要素のいずれかが、ROM52からRAM53上に展開されたサーバ装置50用のプログラムに従ったCPU51からの命令によって動作することで実現される機能である。
【0059】
通信部520は、CPU51からの命令およびネットワークI/F57の処理により実現され、ネットワーク2で接続された他の装置との通信を制御する。
【0060】
OCR処理部570は、OCR要求に応じて画像データにOCR処理を行い、OCR結果を出力する機能を実行する。
【0061】
続いて、情報処理システム1における処理について説明する。図6は画像データに対して期限を設定する処理を説明するフロー図である。ファクシミリでk頁分の画像データを受信したり、入力受付部210からユーザにより所定のk頁分の画像データに対する本処理フロー実行の命令が入力されたりすることで開始される。
【0062】
まず、期限設定制御部251はkを初期化、ここではk=0とし(S1)、次にkを1加算する(S2)。OCR取得部2511はOCR取得工程として、ファクシミリで受信した、またはスキャナで読み取られた画像データのk頁目に対するOCR結果を取得する(S3)。一例として、ファクシミリとして受信した図7に示す画像データについて、ステップS3で取得したOCR結果であるテキストデータを図8に示す。
【0063】
文字列1抽出部2512は第一の抽出工程として、取得したOCR結果から記憶部240の表1を参照して、期限を表す単語である文字列1が含まれているかを判断する(S4)。図9は、一例として、図8に示すOCR結果から抽出される文字列1を説明する図である。図9中に示される文字列T2『納期』が、表1の文字列1リストに含まれる文字列として判断される。
【0064】
図9のように文字列1リストに含まれる文字列があれば、文字列1抽出部2512は、該当する文字列を抽出して抽出結果として出力し(S5)、ない場合は、期限設定制御部251が、k頁が最終頁であるかを判断する(S6)。
【0065】
期限設定制御部 251は、最終頁であった場合は、期限文書ではなく、通常文書としての処理を実行して(S12)終了する。通常文書としての処理の例としては、期限文書ではなく通常文書に該当する旨のユーザへのメッセージ作成し、メッセージを操作部33に表示したり、メッセージを端末装置10にメール送信したりすることなどが挙げられる。また、通常文書としての処理の他の例として、前述のメッセージ作成と合わせて、もしくは前述のメッセージ作成の代わりに、端末装置10において通常文書として保存するためにあらかじめ定められたフォルダを指定して、端末装置10に転送する等、ユーザや本情報処理システムの管理者等が適宜設定すればよい。
【0066】
さらに、文字列2抽出部2513は第二の抽出工程として、取得したOCR結果から記憶部240の表2を参照して、期限自体(年月日、曜日、時間やその組み合わせ)を表す文字列2が含まれているかを判断する(S7)。図9で説明すると、図9中に示される文字列T1『2017年2月13日』、文字列T3『2017年03月06日』が、表2の文字列2リストに含まれる文字列として判断される。
【0067】
図9のように文字列2リストに含まれる文字列があれば、文字列2抽出部2513は、該当する文字列を抽出して抽出結果として出力し(S8)、ない場合は期限設定制御部251が、通常文書としての処理を行い(S12)、終了する。
【0068】
図10は、ステップS5およびS8で抽出された抽出結果である。図10に示されるように、図7の画像データ中に出現した順に、文字列1としての「2017年2月13日」、文字列2としての「納期」、文字列1としての「2017年03月06日」というテキストデータが抽出されている。
【0069】
次に、期限判断部2514は期限判断工程として、前述の抽出結果を参照して、抽出した文字列1の後ろに、抽出した文字列2が出現しているかどうかを判断し(S9)、出現している場合は、画像データを期限管理する文書と判断する(S10)。
【0070】
図10を参照すると、文字列1である『納期』が含まれており、文字列1である『納期』の後に文字列2である『2017年03月06日』が出現している為、文字列が抽出された画像データは、2017年03月06日を期限として管理する文書と判断される。
【0071】
そしてファイル名生成部2515は、ファイル名生成工程として、前述の抽出結果に基づき、期限管理する文書のファイル名(以降、期限ファイル名と呼ぶことがある。)を生成する(S11)。期限ファイル名は、一例として、画像データの元のファイル名の前に、文字列1、そして当該文字列1の後に出現した文字列2、の順に付加したファイル名とする。
【0072】
一例として図10の抽出結果を用いた場合、ファイル名生成部2515は、元の画像データのファイル名の先頭に『納期20170306_』を付加する。図7に示される元の画像データのファイル名が『Oomori_office-20170217.tif』の場合は、期限文書として新たに付与するファイル名は『納期20170306_Oomori_office-20170217.tif』となる。これに限られず、文字列1のみ、つまり『納期』だけを付加するなどしてもよい。
【0073】
このように、画像データのOCR結果にユーザによってファクシミリ文書の管理に使用するようあらかじめ設定された文字列である特定の文字列が含まれていれば、その特定の文字列を用いて画像データのファイル名を生成する。したがって特定の文字列でファクシミリなどの画像データを管理することが可能となる。
【0074】
なお、文字列1および文字列2を互いに独立して管理に使用することも可能であるが、本実施形態では、組み合わせて利用することにより、具体的にはステップS9のように文書中での文字列1と文字列2の出現順を利用することにより、精度の良い管理を行っている。その他、ステップS11のファイル名生成においても、文字列1と文字列2の使用の順番を決めておくことで、よりユーザが使用しやすい管理システムとなっている。
【0075】
また図6のフロー図では、ステップS4において、文字列1を含んでいれば以降の頁についてはOCR結果の取得ステップS3を行っていない。こうすることにより、複数ページからなる画像データの全ての頁についてOCR処理を行った場合に比べて時間とシステムの負荷が低減できる。特に抽出する文字列が期限に関するものであれば、一般的に一つの文書の中の出現頻度は高くないため、最初に取得した文字列で期限ファイル名を作成することが可能である。このような負荷低減を考えなければ、OCR処理を全ての頁について行ってもよく、その場合は期限ファイル名を、作成する度に上書きしたり、全てを保存してその中から使用する期限ファイル名をユーザが選択したりするなどしてもよい。
【0076】
また、図6のフロー図ではステップ10の期限判断工程の後にステップ11のファイル名生成工程を実行しているが、ファイル名生成工程においては抽出結果が出力されていればファイル名を生成することが出来るため、ファイル名生成工程を実行するにあたり、期限判断工程は必ずしも必要なく、期限設定工程とは独立して実行することも可能である。
【0077】
図11を用いて、画像データの転送処理について説明する。図6のフロー図で画像データの期限ファイル名が決定した後、端末装置10に画像データを転送する処理を説明するフロー図である。
【0078】
まずフォルダ名指定部2521は、フォルダ名指定工程として、期限ファイル名を構成する文字列のうち、先頭から文字列を取得し(S13)、取得した文字列をフォルダ名として指定する(S14)。転送処理部2522は転送処理工程として、期限ファイル名が付与された画像データを、フォルダ名の指定とともに端末装置10に転送する(S15)。
【0079】
すると端末装置10の記憶部140に、指定されたフォルダ名のフォルダが作成され、期限ファイル名が付与された画像データが記憶される。この際、指定されたフォルダ名が無い場合は前述のように新たに作成し、指定されたフォルダ名と同じフォルダ名がすでにある場合は、そのフォルダに記憶する。なおフォルダ指定工程で取得される文字列は、文字列1だけでもよいし文字列1と文字列2を合わせた文字列など適宜設定すればよい。
【0080】
このように、特定の文字列を用いたフォルダ名を画像データの転送先における保存フォルダ名に指定することで、フォルダを開く工程を少なくフォルダ内のデータを把握することができる。なお、フォルダ名はユーザが使用しているOSなどによりディレクトリ名と呼ぶこともある。
【0081】
図12は、画像データの転送先である端末装置10内のフォルダの階層構造を説明する図である。比較として図12(a)は、期限管理を行っていない時点でのフォルダを示す。例えばファクシミリを自動転送するフォルダである『フォルダ』に自動的に蓄積されている。ファイル名は『ABCD Company-20170217.tif』『XYZ_Station-20170220.tif』等、任意に付与されている。
【0082】
それに対し図12(b)は、図11で説明した転送処理を実施して転送されたフォルダを示す。『納期20170306_Oomori_office-20170217.tif』の先頭から、文字列1および文字列2を取得し、フォルダ名(ディレクトリ名)としている。なおフォルダ名もファイル名と同様、必ずしも文字列1、文字列2を両方使用する必要はない。
【0083】
次に図13のシーケンス図を用いて、図6のステップS1であるOCR取得工程の詳細を説明する。なお、画像形成装置20とサーバ50間のやり取りは、それぞれの通信部220、通信部520を通じて、ネットワーク2を介して行われる。
【0084】
画像データ処理部250はOCR取得部2511の処理により、ファクシミリで画像データを受信したり、入力受付部210からユーザにより所定の画像データに対する本処理フロー実行の命令が入力されたりすると、要求先判断部260にOCR要求を送信する(S1-1)。要求先判断部260はまず、自身が搭載されている画像形成装置20内でOCR要求に対してOCR処理が行えるかどうか、つまりOCR処理部であるOCRモジュールを有するかを判断する(S1-2)。以下の説明では、要求先判断部260自身が搭載されている画像形成装置20を「自機」と呼ぶ。
【0085】
自機内でOCR処理が可能な場合は、OCR処理部270にOCR処理要求を送信し(S1-3)、OCR処理部270がOCR処理を実行して(S1-4)、OCR結果を要求先判断部260に送信し(S1-5)、要求先判断部260はOCR取得部2511にOCR結果を送信する(S1-11)。
【0086】
自機内でOCR処理が不可能な場合、つまり画像形成装置20内にOCRモジュールであるOCR処理部270が搭載されていない場合や、搭載されていても使用できる状態ではない場合は、要求先判断部260は、自機外でOCR処理可能かどうかを判断する(S1-6)。使用できる状態でない場合とは、例えば搭載しているOCRモジュールがその時点で他データに対するOCR処理を実行中である場合や、自機内の処理に負荷がかかっている場合なども含む。
【0087】
利用可能なOCRモジュールを搭載しているサーバは、画像形成装置20の出荷前にあらかじめ記憶部240に記憶しておいてもよいし、ユーザが記憶部240に記憶してもよい。ユーザが記憶部240に記憶するために、要求先判断部260は操作部33に利用可能なサーバを登録するために必要な画面を表示させる機能を有していてもよい。
【0088】
ここで、画像形成装置20内に、OCR処理部270が搭載されていない場合は、図5の画像形成装置20からOCR処理部270のみ削除した構成として説明できる。この時、図5の画像形成装置20を図1の画像形成装置20A、図5の画像形成装置20からOCR処理部270のみ削除した構成を図1の画像形成装置20Bとして区別できる。
【0089】
自機外にOCR処理可能なサーバとしてサーバ50があれば、要求先判断部260は、サーバ装置50のOCR処理部570にCOR処理要求を送信し(S1-7)、OCR処理部570がOCR処理を実行して(S1-8)、OCR結果を要求先判断部260に送信し(S1-9)、要求先判断部260はOCR取得部2511にOCR結果を送信する(S1-11)。
【0090】
自機外にもOCR処理可能OCR処理部が存在しない場合は、要求先判断部260は、必要なエラー処理を行う(S1-10)。エラー処理としては、一例としてOCR取得部2511に対するエラーメッセージの生成であり、OCR取得部2511に対しエラーメッセージを送信する(S1-11)。
【0091】
このように、アプリケーションではOCR要求を行うだけで、実際のOCR処理がどこで行われるかを意識しなくてよい。なお、OCR処理部270、OCR処理部570は、S1-5,S1-9のようにOCR結果を、要求先判断部260を介してではなく直接OCR取得部2511へ送信してもよい。
【0092】
以上で説明した画像形成装置20用のプログラムは、インストール可能な形式又は実行可能な形式のファイルによって、コンピュータで読み取り可能な記録媒体に記録されて流通されるようにしてもよい。また、上記記録媒体の他の例として、CD-R(Compact Disc Recordable)、DVD(Digital Versatile Disk)、ブルーレイディスク等が挙げられる。また、上記記録媒体、あるいは、これらプログラムが記憶されたHD(Hard Disk)は、プログラム製品(Program Product)として、国内又は国外へ提供できる。
【0093】
また、上記で説明した各実施形態における画像形成装置20は、単一の装置によって構築されてもよいし、各部(機能又は手段)を分割して任意に割り当てられた複数の装置によって構築されていてもよい。
【0094】
上記で説明した実施形態の各機能は、一又は複数の処理回路によって実現することが可能である。ここで、本明細書における「処理回路」とは、電子回路を含むプロセッサのようにソフトウェアによって各機能を実行するようプログラミングされたプロセッサや、上記で説明した各機能を実行するよう設計されたASIC(Application Specific Integrated Circuit)や従来の回路モジュール等のデバイスを含むものとする。
【符号の説明】
【0095】
10 端末装置
20 画像形成装置
50 サーバ装置
250 画像データ処理部
260 要求先判断部
270 OCR処理部
570 OCR処理部
【先行技術文献】
【特許文献】
【0096】
【文献】特開2006-211261号公報
図1
図2
図3
図4
図5
図6
図7
図8
図9
図10
図11
図12
図13