特許7235966 | 知財ポータル「IP Force」

知財求人 - 知財ポータルサイト「IP Force」

▶ 富士通株式会社の特許一覧

特許7235966ファイル分類装置、ファイル分類プログラム及びファイル分類方法

書誌要約請求の範囲詳細な説明課題実施例実施するための形態図面の説明

目に優しい文字サイズ小中大 PDF Top

< >

1
2
3
4
5
6
7
8
9
10
11
12
13
14
15
16
17
18
19
20
21
22

(19)【発行国】日本国特許庁(JP)

(12)【公報種別】特許公報(B2)

(11)【特許番号】

(24)【登録日】2023-03-01

(45)【発行日】2023-03-09

(54)【発明の名称】ファイル分類装置、ファイル分類プログラム及びファイル分類方法

(51)【国際特許分類】

G06F 16/14 20190101AFI20230302BHJP

G06F 16/33 20190101ALI20230302BHJP

G06F 21/62 20130101ALI20230302BHJP

【ＦＩ】

G06F16/14 100

G06F16/33

G06F21/62 318

【請求項の数】 10

(21)【出願番号】P 2019090074

(22)【出願日】2019-05-10

(65)【公開番号】P2020187429

(43)【公開日】2020-11-19

【審査請求日】2022-02-08

(73)【特許権者】

【識別番号】000005223

【氏名又は名称】富士通株式会社

(74)【代理人】

【識別番号】100094525

【弁理士】

【氏名又は名称】土井健二

(74)【代理人】

【識別番号】100094514

【弁理士】

【氏名又は名称】林恒徳

(72)【発明者】

【氏名】角田忠信

(72)【発明者】

【氏名】矢崎孝一

(72)【発明者】

【氏名】二村和明

【審査官】三橋竜太郎

(56)【参考文献】

【文献】特開２０１４－２３５５００（ＪＰ，Ａ）

【文献】特開２０１９－２８７８８（ＪＰ，Ａ）

【文献】特開２０１７－１０２９６６（ＪＰ，Ａ）

【文献】特開２０１７－２０７８７６（ＪＰ，Ａ）

(58)【調査した分野】(Int.Cl.，ＤＢ名)

Ｇ０６Ｆ１６／００－１６／９５８

Ｇ０６Ｆ２１／６２

(57)【特許請求の範囲】

【請求項1】

文字列を記憶した第１記憶部を参照し、複数のファイルのファイル名のそれぞれが前記文字列を含むか否かを判定する第１判定部と、
前記複数のファイルのファイル名のそれぞれが前記文字列を含まないと判定した場合、正規表現を記憶した第２記憶部を参照し、前記複数のファイルのファイル名のそれぞれが前記正規表現に適合するか否かを判定する第２判定部と、
前記複数のファイルのファイル名のそれぞれが前記正規表現に適合する場合、前記複数のファイルのファイル名における文字列の共通部分を特定する共通特定部と、
特定した前記共通部分が前記正規表現に適合する場合、特定した前記共通部分に対応する文字列を前記第１記憶部にさらに記憶する情報管理部と、を有する、
ことを特徴とするファイル分類装置。

【請求項2】

請求項１において、
前記第１記憶部に記憶された文字列は、正規表現が用いられていない文字列である、
ことを特徴とするファイル分類装置。

【請求項3】

請求項１において、
前記第１判定部は、前記第１記憶部を参照し、前記複数のファイルに含まれる第１ファイルが前記文字列を含むか否かを判定し、
前記第２判定部は、前記第１ファイルが前記文字列を含まないと判定した場合、前記第２記憶部を参照し、前記第１ファイルのファイル名が前記正規表現に適合するか否かを判定し、
前記情報管理部は、前記第１ファイルのファイル名が前記正規表現に適合する場合、前記第１ファイルのファイル名を第３記憶部に記憶し、さらに、
前記第１判定部は、前記情報管理部が前記第１ファイルのファイル名を記憶した後、前記第１記憶部を参照し、前記複数のファイルに含まれる第２ファイルが前記文字列を含むか否かを判定し、
前記第２判定部は、前記正規表現に適合するか否かを判定する処理では、前記第２ファイルが前記文字列を含まないと判定した場合、前記第２記憶部を参照し、前記第２ファイルのファイル名が前記正規表現に適合するか否かを判定し、
前記共通特定部は、前記第２ファイルのファイル名が前記正規表現に適合する場合、前記第３記憶部を参照し、前記第３記憶部に記憶されたファイル名のいずれかと前記第２ファイルのファイル名とにおける文字列の共通部分を特定する、
ことを特徴とするファイル分類装置。

【請求項4】

請求項３において、
前記情報管理部は、前記第２ファイルのファイル名が前記正規表現に適合する場合、前記第２ファイルのファイル名を前記第３記憶部に記憶する、
ことを特徴とするファイル分類装置。

【請求項5】

請求項３において、
前記共通特定部は、前記第３記憶部に記憶されたファイル名のいずれかと前記第２ファイルのファイル名との間において、前方一致する文字列を前記共通部分として特定する、
ことを特徴とするファイル分類装置。

【請求項6】

請求項３において、
前記共通特定部は、前記第３記憶部に記憶されたファイル名のいずれかと前記第２ファイルのファイル名との間において、後方一致する文字列を前記共通部分として特定する、
ことを特徴とするファイル分類装置。

【請求項7】

請求項３において、さらに、
前記第１ファイルのファイル名が前記文字列を含むと判定した場合、前記第１ファイルが前記正規表現に適合することを示す情報を出力し、前記第２ファイルのファイル名が前記文字列を含むと判定した場合、前記第２ファイルが前記正規表現に適合することを示す情報を出力する情報出力部を有する、
ことを特徴とするファイル分類装置。

【請求項8】

請求項７において、
前記情報出力部は、前記第１ファイルのファイル名が前記正規表現に適合しない場合、前記第１ファイルが前記正規表現に適合しないことを示す情報を出力し、前記第２ファイルのファイル名が前記正規表現に適合しない場合、前記第２ファイルが前記正規表現に適合しないことを示す情報を出力する、
ことを特徴とするファイル分類装置。

【請求項9】

文字列を記憶した第１記憶部を参照し、複数のファイルのファイル名のそれぞれが前記文字列を含むか否かを判定し、
前記複数のファイルのファイル名のそれぞれが前記文字列を含まないと判定した場合、正規表現を記憶した第２記憶部を参照し、前記複数のファイルのファイル名のそれぞれが前記正規表現に適合するか否かを判定し、
前記複数のファイルのファイル名のそれぞれが前記正規表現に適合する場合、前記複数のファイルのファイル名における文字列の共通部分を特定し、
特定した前記共通部分が前記正規表現に適合する場合、特定した前記共通部分に対応する文字列を前記第１記憶部にさらに記憶する、
処理をコンピュータに実行させることを特徴とするファイル分類プログラム。

【請求項10】

【発明の詳細な説明】

【技術分野】

【0001】

本発明は、ファイル分類装置、ファイル分類プログラム及びファイル分類方法に関する。

【背景技術】

【0002】

近年、ＰＣ（ＰｅｒｓｏｎａｌＣｏｍｐｕｔｅｒ）に記憶された情報の漏洩対策として、例えば、ファイル存在確認ツールが用いられている。このファイル存在確認ツールは、例えば、情報漏洩を引き起こす可能性があるファイルがＰＣ内に記憶されている場合に、そのファイルの削除や移動等を促す通知をユーザに行うものである。

【0003】

一般的に、ユーザが有するＰＣには、ユーザによって作成されたデータファイルだけでなく、ＯＳ（ＯｐｅｒａｔｉｎｇＳｙｓｔｅｍ）やアプリケーションについてのファイルが多数存在する。そのため、上記のようなファイル存在確認ツールは、例えば、チェック対象のファイル（以下、対象ファイルとも呼ぶ）のファイル名やファイルパス（以下、ファイル名等とも呼ぶ）と、事前に作成されたパターン（ホワイトリストやブラックリスト）とのマッチングを行うことにより、対象ファイルのそれぞれが秘密情報を含むか否かを判定する。そして、ファイル存在確認ツールは、秘密情報を含む可能性があると判定したファイルについての情報をユーザに通知する。これにより、ユーザは、例えば、各ＰＣが社外等に持ち出し可能な状態になっているか否かの判定を行うことが可能になる。

【0004】

具体的に、ファイル存在確認ツールは、秘密情報を含む可能性が高いファイルとして、例えば、ＭｉｃｒｏｓｏｆｔＯｆｆｉｃｅ（登録商標）ドキュメントファイル、メールファイル及びプログラムのソースコード等を特定する。また、ファイル存在確認ツールは、秘密情報を含む可能性が低いファイルとして、例えば、プログラムの実行ファイル、一時ファイル、ショートカットファイル及び設定ファイル等を特定する（例えば、特許文献１及び２参照）。

【先行技術文献】

【特許文献】

【0005】

【文献】特開２００８－１４０１０２号公報

【文献】特開２０１１－１２９０２３号公報

【発明の概要】

【発明が解決しようとする課題】

【0006】

ここで、例えば、記述の自由度が高い正規表現によって記述されたパターンが用いられる場合、ファイル存在確認ツールでは、対象ファイルのファイル名等とパターンとのマッチングに長時間を要する。

【0007】

そのため、ファイル存在確認ツールでは、例えば、正規表現によって記述されていないパターンを用いた前方一致や後方一致を行うことによって、対象ファイルのファイル名等とパターンとのマッチングを行う。これにより、ファイル存在確認ツールでは、秘密情報を含む可能性が高いファイルと、秘密情報を含む可能性が低いファイルとの分類（以下、単にファイルの分類とも呼ぶ）を短時間に行うことが可能になる。

【0008】

しかしながら、正規表現によって記述されていないパターンは、記述の自由度が低いパターンである。そのため、正規表現によって記述されていないパターンを用いる場合、ファイルの分類を行うために必要となるパターンの数が膨大になる。したがって、この場合、パターンの用意に膨大な時間を要することになり、ファイルの分類を効率的に行うことが困難になる場合がある。

【0009】

そこで、一つの側面では、本発明は、ファイルの分類を効率的に行うことを可能とするファイル分類装置、ファイル分類プログラム及びファイル分類方法を提供することを目的とする。

【課題を解決するための手段】

【0010】

実施の形態の一態様では、文字列を記憶した第１記憶部を参照し、複数のファイルのファイル名のそれぞれが前記文字列を含むか否かを判定する第１判定部と、前記複数のファイルのファイル名のそれぞれが前記文字列を含まないと判定した場合、正規表現を記憶した第２記憶部を参照し、前記複数のファイルのファイル名のそれぞれが前記正規表現に適合するか否かを判定する第２判定部と、前記複数のファイルのファイル名のそれぞれが前記正規表現に適合する場合、前記複数のファイルのファイル名における文字列の共通部分を特定する共通特定部と、特定した前記共通部分が前記正規表現に適合する場合、特定した前記共通部分に対応する文字列を前記第１記憶部にさらに記憶する情報管理部と、を有する。

【発明の効果】

【0011】

一つの側面によれば、ファイルの分類を効率的に行うことを可能とする。

【図面の簡単な説明】

【0012】

【図1】図１は、情報処理システム１０の構成について説明する図である。

【図2】図２は、情報処理装置１のハードウエア構成を説明する図である。

【図3】図３は、情報処理装置１の機能のブロック図である。

【図4】図４は、第１の実施の形態におけるファイル分類処理の概略を説明するフローチャート図である。

【図5】図５は、第１の実施の形態におけるファイル分類処理の概略を説明するフローチャート図である。

【図6】図６は、第１の実施の形態におけるファイル分類処理の詳細を説明するフローチャート図である。

【図7】図７は、第１の実施の形態におけるファイル分類処理の詳細を説明するフローチャート図である。

【図8】図８は、第１の実施の形態におけるファイル分類処理の詳細を説明するフローチャート図である。

【図9】図９は、前方一致情報１３３の具体例について説明する図である。

【図10】図１０は、正規表現情報１３２の具体例について説明する図である。

【図11】図１１は、一時格納情報１３５の具体例について説明する図である。

【図12】図１２は、第１の実施の形態におけるファイル分類処理を説明する図である。

【図13】図１３は、前方一致情報１３３の具体例について説明する図である。

【図14】図１４は、前方一致情報１３３の具体例について説明する図である。

【図15】図１５は、一時格納情報１３５の具体例について説明する図である。

【図16】図１６は、一時格納情報１３５の具体例について説明する図である。

【図17】図１７は、第２の実施の形態におけるファイル分類処理を説明するフローチャート図である。

【図18】図１８は、第２の実施の形態におけるファイル分類処理を説明するフローチャート図である。

【図19】図１９は、第２の実施の形態におけるファイル分類処理を説明するフローチャート図である。

【図20】図２０は、第２の実施の形態におけるファイル分類処理を説明するフローチャート図である。

【図21】図２１は、第２の実施の形態におけるファイル分類処理を説明するフローチャート図である。

【図22】図２２は、後方一致情報１３４の具体例について説明する図である。

【発明を実施するための形態】

【0013】

［情報処理システムの構成］
初めに、情報処理システム１０の構成について説明を行う。図１は、情報処理システム１０の構成について説明する図である。

【0014】

図１に示すように、情報処理システム１０は、例えば、ユーザが各種作業を行うＰＣである情報処理装置１と、情報処理装置１とネットワークＮＷ（例えば、インターネット）を介して接続する管理装置２と、管理装置２によってアクセスされる記憶装置３とを有する。

【0015】

情報処理装置１は、対象ファイルが秘密情報を含むか否かを判定する処理（以下、ファイル分類処理とも呼ぶ）が行われる場合、例えば、管理装置２にアクセスし、記憶装置３に記憶されたパターン（以下、第１文字列とも呼ぶ）を取得して記憶領域（以下、第１記憶部とも呼ぶ）に記憶する。第１文字列は、例えば、正規表現によって記述された文字列である。

【0016】

そして、情報処理装置１は、正規表現が用いられていない文字列（以下、第２文字列とも呼ぶ）を記憶した記憶領域（以下、第２記憶部とも呼ぶ）を参照し、複数の対象ファイルのそれぞれが第２文字列を含むか否かを判定する。第２文字列は、例えば、正規表現が用いられていない文字列である。

【0017】

その結果、複数のファイルのそれぞれが第２文字列を含まないと判定した場合、情報処理装置１は、第１記憶部を参照し、複数の対象ファイルのそれぞれが第１文字列に対応する正規表現に適合するか否かを判定する。

【0018】

そして、複数のファイルのそれぞれが正規表現に適合しないと判定した場合、情報処理装置１は、例えば、複数のファイルのそれぞれが秘密情報を含む可能性が高いファイルであると判定し、その旨をユーザに通知する。

【0019】

一方、複数のファイルのそれぞれが正規表現に適合すると判定した場合、情報処理装置１は、複数の対象ファイルのファイル名における文字列の共通部分を特定する。そして、情報処理装置１は、特定した共通部分が第１文字列に対応する正規表現に適合すると判定した場合、特定した共通部分に対応する文字列を第２文字列の少なくとも１つとして第２記憶部にさらに記憶する。

【0020】

すなわち、本実施の形態における情報処理装置１は、複数の対象ファイルのそれぞれが秘密情報を含む可能性が高いファイルであるか否かを判定するとともに、複数のファイルのファイル名等から新たに特定された第２文字列の蓄積を行う。ここで、第２文字列は、秘密情報を含む可能性が低いと判定された複数の対象ファイルのファイル名等の共通部分である。そのため、情報処理装置１は、ファイル名等に第２文字列が含まれる対象ファイルが新たに発生した場合、その新たに発生した対象ファイルが秘密情報を含む可能性が低いファイルであると判定することが可能である。したがって、情報処理装置１は、複数の対象ファイルのそれぞれが第１文字列に対応する正規表現に適合するか否かについての判定を行う前に、複数の対象ファイルのそれぞれが第２文字列を含むか否かの判定を行う。

【0021】

これにより、情報処理装置１は、対象ファイルのファイル名等と正規表現によって記述された第１文字列とのマッチング回数を抑制することが可能になる。そのため、情報処理装置１は、正規表現によって記述されていないパターンを用いることなく、対象ファイルの分類に要する時間を短縮させることが可能になる。したがって、情報処理装置１は、パターンの作成に要する負担を抑制しつつ、対象ファイルの分類の効率化を行うことが可能になる。

【0022】

［情報処理システムのハードウエア構成］
次に、情報処理システム１０のハードウエア構成について説明する。図２は、情報処理装置１のハードウエア構成を説明する図である。

【0023】

情報処理装置１は、図２に示すように、プロセッサであるＣＰＵ１０１と、メモリ１０２と、外部インターフェース（Ｉ／Ｏユニット）１０３と、記憶媒体１０４とを有する。各部は、バス１０５を介して互いに接続される。

【0024】

記憶媒体１０４は、例えば、ファイル分類処理を行うためのプログラム１１０を記憶するプログラム格納領域（図示しない）を有する。また、記憶媒体１０４は、例えば、ファイル分類処理を行う際に用いられる情報を記憶する記憶部１３０（以下、情報格納領域１３０とも呼ぶ）を有する。なお、記憶媒体１０４は、例えば、ＨＤＤ（ＨａｒｄＤｉｓｋＤｒｉｖｅ）やＳＳＤ（ＳｏｌｉｄＳｔａｔｅＤｒｉｖｅ）であってよい。なお、上記の第１記憶部、第２記憶部及び第３記憶部のそれぞれは、例えば、記憶部１３０の少なくとも一部に対応するものであってよい。

【0025】

ＣＰＵ１０１は、記憶媒体１０４からメモリ１０２にロードされたプログラム１１０を実行してファイル分類処理を行う。

【0026】

また、外部インターフェース１０３は、例えば、ネットワークＮＷを介して管理装置２と通信を行う。

【0027】

［情報処理システムの機能］
次に、情報処理システム１０の機能について説明を行う。図３は、情報処理装置１の機能のブロック図である。

【0028】

情報処理装置１は、図３に示すように、例えば、ＣＰＵ１０１やメモリ１０２等のハードウエアとプログラム１１０とが有機的に協働することにより、情報受付部１１１と、情報管理部１１２と、ファイル名抽出部１１３と、第１判定部１１４と、第２判定部１１５と、共通特定部１１６と、第３判定部１１７と、情報出力部１１８とを含む各種機能を実現する。

【0029】

また、情報処理装置１は、例えば、図３に示すように、ファイル情報１３１と、正規表現情報１３２と、前方一致情報１３３と、後方一致情報１３４と、一時格納情報１３５とを情報格納領域１３０に記憶する。なお、上記の第１文字列は、例えば、正規表現情報１３２に対応するものであってよい。また、上記の第２文字列は、例えば、前方一致情報１３３または後方一致情報１３４に対応するものであってよい。

【0030】

情報受付部１１１は、例えば、管理装置２から送信された正規表現情報１３２を受け付ける。そして、情報管理部１１２は、例えば、情報受付部１１１が受け付けた正規表現情報１３２を情報格納領域１３０に記憶する。なお、正規表現情報１３２は、ユーザ等によって予め情報格納領域１３０に記憶されるものであってもよい。

【0031】

ファイル名抽出部１１３は、例えば、情報処理装置１で動作するＯＳ（図示しない）からファイル情報１３１を取得する。ファイル情報１３１は、例えば、ファイルに対するｒｅａｄ情報やｗｒｉｔｅ情報を含むものであってよい。そして、ファイル名抽出部１１３は、ＯＳから取得したファイル情報１３１から各ファイルのファイル名等を抽出する。

【0032】

第１判定部１１４は、情報格納領域１３０に記憶された前方一致情報１３３を参照し、ファイル名抽出部１１３が抽出したファイル名のそれぞれが前方一致情報１３３に含まれる文字列を含むか否かを判定する。前方一致情報１３３は、ファイル名抽出部１１３が抽出したファイル名のそれぞれと前方一致する関係にあるか否かの判定が行われる文字列を含む情報である。

【0033】

第２判定部１１５は、ファイル名抽出部１１３が抽出したファイル名のそれぞれが前方一致情報１３３に含まれる文字列を含まないと判定した場合、情報格納領域１３０に記憶された正規表現情報１３２を参照し、ファイル名抽出部１１３が抽出したファイル名のそれぞれが正規表現情報１３２に含まれる正規表現に適合するか否かを判定する。

【0034】

共通特定部１１６は、ファイル名抽出部１１３が抽出したファイル名のそれぞれが正規表現情報１３２に含まれる正規表現に適合する場合、ファイル名抽出部１１３が抽出したファイル名における文字列の共通部分を特定する。

【0035】

第３判定部１１７は、共通特定部１１６が特定した共通部分が正規表現情報１３２に含まれる正規表現に適合するか否かを判定する。

【0036】

そして、情報管理部１１２は、共通特定部１１６が特定した共通部分が正規表現情報１３２に含まれる場合、共通特定部１１６が特定した共通部分に対応する文字列を前方一致情報１３３の少なくとも一部として情報格納領域１３０に記憶する。

【0037】

情報出力部１１８は、ファイル名抽出部１１３が抽出したファイル名のそれぞれが正規表現情報１３２に含まれる正規表現に適合しないと第２判定部１１５が判定した場合、ファイル名抽出部１１３が抽出したファイル名に対応するファイルが秘密情報を含む可能性が高いことを示す情報をユーザに通知する。具体的に、情報出力部１１８は、この場合、ファイル名抽出部１１３が抽出したファイル名に対応するファイルが秘密情報を含む可能性が高いことを示す情報を、情報処理装置１の出力装置（図示しない）に出力する。後方一致情報１３４についての説明は後述する。

【0038】

［第１の実施の形態の概略］
次に、第１の実施の形態の概略について説明する。図４及び図５は、第１の実施の形態におけるファイル分類処理の概略を説明するフローチャート図である。

【0039】

情報処理装置１は、図４に示すように、ファイル分類タイミングになるまで待機する（Ｓ１のＮＯ）。ファイル分類タイミングは、例えば、ユーザが情報処理装置１に対してファイル分類処理を行う旨の情報を入力したタイミングであってよい。

【0040】

そして、ファイル分類タイミングになった場合（Ｓ１のＹＥＳ）、情報処理装置１は、第２文字列を記憶した第２記憶部を参照し、複数のファイルのファイル名等のそれぞれが第２文字列を含むか否かを判定する（Ｓ２）。

【0041】

その結果、複数のファイルのファイル名等のそれぞれが第２文字列を含まないと判定した場合（Ｓ３のＮＯ）、情報処理装置１は、第１文字列を記憶した第１記憶部を参照し、複数のファイルのファイル名等のそれぞれが第１文字列に対応する正規表現に適合するか否かを判定する（Ｓ４）。

【0042】

そして、複数のファイルのファイル名等のそれぞれが第１文字列に対応する正規表現に適合すると判定した場合（Ｓ５のＹＥＳ）、情報処理装置１は、図５に示すように、複数のファイルのファイル名等における文字列の共通部分を特定する（Ｓ１１）。

【0043】

続いて、情報処理装置１は、Ｓ１１の処理で特定した共通部分が第１文字列に対応する正規表現に適合するが否かを判定する（Ｓ１２）。

【0044】

その結果、Ｓ１１の処理で特定した共通部分が第１文字列に対応する正規表現に適合すると判定した場合（Ｓ１３のＹＥＳ）、情報処理装置１は、Ｓ１２の処理で特定した共通部分に対応する文字列を第２文字列として第２記憶部にさらに記憶する（Ｓ１４）。

【0045】

一方、複数のファイルのファイル名等のそれぞれが第２文字列を含むと判定した場合（Ｓ３のＹＥＳ）、または、複数のファイルのファイル名等のそれぞれが第１文字列に対応する正規表現に適合しないと判定した場合（Ｓ５のＮＯ）、情報処理装置１は、ファイル分類処理を終了する。また、Ｓ１１の処理で特定した共通部分が第１文字列に対応する正規表現に適合しないと判定した場合についても同様に（Ｓ１３のＮＯ）、情報処理装置１は、ファイル分類処理を終了する。

【0046】

【0047】

［第１の実施の形態の詳細］
次に、第１の実施の形態の詳細について説明する。図６から図８は、第１の実施の形態におけるファイル分類処理の詳細を説明するフローチャート図である。また、図９から図１６は、第１の実施の形態におけるファイル分類処理の詳細を説明する図である。なお、以下、正規表現情報１３２、前方一致情報１３３及び後方一致情報１３４のそれぞれがホワイトリストである場合について説明を行う。

【0048】

情報受付部１１１は、図６に示すように、ファイル情報１３１を受け付けるまで待機する（Ｓ２１のＮＯ）。具体的に、情報受付部１１１は、例えば、ＯＳから送信されたファイル情報１３１を受け付けるまで待機する。

【0049】

そして、ファイル情報１３１を受け付けた場合（Ｓ２１のＹＥＳ）、ファイル名抽出部１１３は、Ｓ２１の処理で受け付けたファイル情報１３１から対象ファイルのファイル名等を抽出する（Ｓ２２）。

【0050】

続いて、第１判定部１１４は、Ｓ２２の処理で抽出したファイル名等に対応する文字列が、情報格納領域１３０に記憶された前方一致情報１３３に含まれる文字列と前方一致する関係にあるか否かを判定する（Ｓ２３）。以下、前方一致情報１３３の具体例について説明を行う。

【0051】

［前方一致情報の具体例］
図９、図１３及び図１４は、前方一致情報１３３の具体例について説明する図である。

【0052】

図９等に示す前方一致情報１３３は、前方一致の判定に用いられる文字列が記憶される「文字列」と、各情報が生成（更新）されたエポック秒が記憶される「タイムスタンプ」とを項目として有する。

【0053】

具体的に、図９に示す前方一致情報１３３において、１行目の情報には、「文字列」として「ｃ：￥ｕｓｅｒ￥ａｐｐｄａｔａ￥ｔｅｓｔ￥」が記憶され、「タイムスタンプ」として「１５５１１２８９２８」が記憶されている。

【0054】

また、図９に示す前方一致情報１３３において、２行目の情報には、「文字列」として「ｃ：￥ｔｍｐ￥」が記憶され、「タイムスタンプ」として「１５５１１２９４７５」が記憶されている。

【0055】

そのため、例えば、Ｓ２２の処理で抽出したファイル名等に対応する文字列が「ｃ：￥ｄｏｃｕｍｅｎｔｓ￥ｔｅｓｔ￥.ｇｉｔ￥ｏｂｊｅｃｔｓ￥ａ１￥３４５６７」であった場合、第１判定部１１４は、Ｓ２２の処理で抽出したファイル名等に対応する文字列と、前方一致情報１３３に情報が含まれる各文字列とが前方一致する関係にないと判定する。

【0056】

図６に戻り、Ｓ２２の処理で抽出したファイル名等に対応する文字列が、情報格納領域１３０に記憶された前方一致情報１３３に含まれる文字列と前方一致する関係にないと判定した場合（Ｓ２４のＮＯ）、第２判定部１１５は、Ｓ２２の処理で抽出したファイル名等に対応する文字列が、情報格納領域１３０に記憶された正規表現情報１３２に含まれる正規表現に適合するか否かを判定する（Ｓ２５）。以下、正規表現情報１３２の具体例について説明を行う。

【0057】

［正規表現情報の具体例］
図１０は、正規表現情報１３２の具体例について説明する図である。

【0058】

図１０に示す正規表現情報１３２は、正規表現情報１３２に含まれる各情報を識別する「ＩＤ」と、正規表現によって記述された文字列が記憶される「文字列」とを項目として有する。

【0059】

具体的に、図１０に示す正規表現情報１３２において、１行目の情報には、「ＩＤ」として「ＲＥＧＥＸＰ１」が記憶されている。また、図１０に示す正規表現情報１３２において、１行目の情報には、「文字列」として、￥または／で区切られたフォルダ以下のコンマから始まるフォルダ名またはファイル名等を示す「（．＊［／￥￥］）＋￥．．＋」が記憶されている。図１０に含まれる他の情報についての説明は省略する。

【0060】

そのため、例えば、Ｓ２２の処理で抽出したファイル名等に対応する文字列が「ｃ：￥ｄｏｃｕｍｅｎｔｓ￥ｔｅｓｔ￥.ｇｉｔ￥ｏｂｊｅｃｔｓ￥ａ１￥３４５６７」であった場合、第２判定部１１５は、１行目の情報の「文字列」に記憶された正規表現に、Ｓ２２の処理で抽出したファイル名等に対応する文字列が適合すると判定する。

【0061】

図６に戻り、Ｓ２２の処理で抽出したファイル名等に対応する文字列が、情報格納領域１３０に記憶された正規表現情報１３２に含まれる正規表現に適合すると判定した場合（Ｓ２６のＹＥＳ）、共通特定部１１６は、図７に示すように、Ｓ２２の処理で抽出したファイル名等における文字列と、情報格納領域１３０に記憶された一時格納情報１３５に含まれる文字列のそれぞれとが前方一致する関係にあるか否かを判定する（Ｓ３１）。以下、一時格納情報１３５の具体例について説明を行う。

【0062】

［一時格納情報の具体例］
図１１及び図１５は、一時格納情報１３５の具体例について説明する図である。

【0063】

図１１等に示す一時格納情報１３５は、一時格納情報１３５に含まれる各情報と適合する正規表現情報１３２（例えば、図１０で説明した正規表現情報１３２に含まれるいずれかの情報）を識別する「ＩＤ」と、Ｓ２２の処理で抽出したファイル名等の文字列が記憶される「文字列」と、各情報が生成（更新）されたエポック秒が記憶される「タイムスタンプ」とを項目として有する。

【0064】

具体的に、図１１に示す一時格納情報１３５において、１行目の情報には、「ＩＤ」として「ＲＥＧＥＸＰ１」が記憶され、「文字列」として「ｃ：￥ｄｏｃｕｍｅｎｔｓ￥ｔｅｓｔ￥.ｇｉｔ￥ｏｂｊｅｃｔｓ￥００￥１２３４５」が記憶され、「タイムスタンプ」として「１５５１１２８８７１」が記憶されている。

【0065】

また、図１１に示す一時格納情報１３５において、２行目の情報には、「ＩＤ」として「ＲＥＧＥＸＰ２」が記憶され、「文字列」として「ｃ：￥ｕｓｅｒ￥ａｐｐｄａｔａ￥ｔｅｓｔ￥ａｂｃｄｅｆ.ｐｄｆ」が記憶され、「タイムスタンプ」として「１５５１１２８９２８」が記憶されている。図１１に含まれる他の情報についての説明は省略する。

【0066】

そのため、例えば、Ｓ２２の処理で抽出したファイル名等に対応する文字列が「ｃ：￥ｄｏｃｕｍｅｎｔｓ￥ｔｅｓｔ￥.ｇｉｔ￥ｏｂｊｅｃｔｓ￥ａ１￥３４５６７」であった場合、共通特定部１１６は、Ｓ２２の処理で抽出したファイル名等に対応する文字列と、１行目の情報の「文字列」に記憶された文字列とが前方一致する関係にあると判定する。

【0067】

図７に戻り、Ｓ２２の処理で抽出したファイル名等における文字列と、情報格納領域１３０に記憶された一時格納情報１３５に含まれる文字列のそれぞれとが前方一致する関係にあると判定した場合（Ｓ３２のＹＥＳ）、共通特定部１１６は、Ｓ２２の処理で抽出したファイル名等における文字列のうち、Ｓ３１の処理で前方一致する関係にあると判定した文字列を特定する（Ｓ３３）。

【0068】

具体的に、図１１で説明した一時格納情報１３５における１行目の情報には、「文字列」として「ｃ：￥ｄｏｃｕｍｅｎｔｓ￥ｔｅｓｔ￥.ｇｉｔ￥ｏｂｊｅｃｔｓ￥００￥１２３４５」が記憶されている。そのため、例えば、Ｓ２２の処理で抽出したファイル名等に対応する文字列が「ｃ：￥ｄｏｃｕｍｅｎｔｓ￥ｔｅｓｔ￥.ｇｉｔ￥ｏｂｊｅｃｔｓ￥ａ１￥３４５６７」である場合、共通特定部１１６は、図１２に示すように、これらの文字列の共通部分である「ｃ：￥ｄｏｃｕｍｅｎｔｓ￥ｔｅｓｔ￥.ｇｉｔ￥ｏｂｊｅｃｔｓ￥」と特定する。

【0069】

そして、第３判定部１１７は、Ｓ３３の処理で特定した文字列が、Ｓ３１の処理で前方一致する関係にあると判断した一時格納情報１３５に含まれる文字列に対応するＩＤに対応する情報格納領域１３０に記憶された正規表現情報１３２に含まれる正規表現に適合するか否かを判定する（Ｓ３４）。

【0070】

具体的に、例えば、Ｓ３３の処理で特定した文字列が「ｃ：￥ｄｏｃｕｍｅｎｔｓ￥ｔｅｓｔ￥.ｇｉｔ￥ｏｂｊｅｃｔｓ￥」である場合、第３判定部１１７は、Ｓ３３の処理で特定した文字列が、Ｓ３１の処理で前方一致する関係にあると判断した一時格納情報１３５に含まれる文字列「ｃ：￥ｄｏｃｕｍｅｎｔｓ￥ｔｅｓｔ￥.ｇｉｔ￥ｏｂｊｅｃｔｓ￥００￥１２３４５」に対応するＩＤ「ＲＥＧＥＸＰ１」に対応する図１０で説明した正規表現情報１３２における１行目の情報の「文字列」に記憶された正規表現である「（．＊［／￥￥］）＋￥．．＋」に適合すると判定する。

【0071】

その結果、Ｓ３３の処理で特定した文字列が、情報格納領域１３０に記憶された正規表現情報１３２に含まれる正規表現に適合すると判定した場合（Ｓ３５のＹＥＳ）、情報管理部１１２は、Ｓ３３の処理で特定した文字列を前方一致情報１３３の少なくとも一部として情報格納領域１３０に記憶する（Ｓ３６）。

【0072】

具体的に、例えば、Ｓ３５の処理において正規表現に適合すると判定した文字列が「ｃ：￥ｄｏｃｕｍｅｎｔｓ￥ｔｅｓｔ￥.ｇｉｔ￥ｏｂｊｅｃｔｓ￥」である場合、情報管理部１１２は、図１２に示すように、「ｃ：￥ｄｏｃｕｍｅｎｔｓ￥ｔｅｓｔ￥.ｇｉｔ￥ｏｂｊｅｃｔｓ￥」を前方一致情報１３３として情報格納領域１３０に記憶することを決定する。そして、情報管理部１１２は、例えば、図１３の下線部分に示すように、「文字列」に「ｃ：￥ｄｏｃｕｍｅｎｔｓ￥ｔｅｓｔ￥.ｇｉｔ￥ｏｂｊｅｃｔｓ￥」を記憶した情報（３行目の情報）を、前方一致情報１３３として情報格納領域１３０に追加する。

【0073】

続いて、情報出力部１１８は、図８に示すように、例えば、Ｓ２２の処理で抽出したファイル名等に対応するファイルが秘密情報を含むファイルでないことを示す情報を生成する（Ｓ４２）。

【0074】

その後、情報出力部１１８は、Ｓ４２の処理で生成した情報を出力する（Ｓ４４）。具体的に、情報出力部１１８は、例えば、Ｓ４２の処理で生成した情報を情報処理装置１の出力装置（図示しない）に出力する。

【0075】

また、Ｓ２２の処理で抽出したファイル名等に対応する文字列が、情報格納領域１３０に記憶された前方一致情報１３３に含まれる文字列と前方一致する関係にあると判定した場合も同様に（Ｓ２４のＹＥＳ）、情報出力部１１８は、Ｓ４２以降の処理を行う。

【0076】

なお、情報管理部１１２は、この場合、図１４の下線部分に示すように、情報格納領域１３０に記憶された前方一致情報１３３に含まれるタイムスタンプのうち、Ｓ２２の処理で抽出したファイル名等に対応する文字列と前方一致する関係にあると判定された文字列のタイムスタンプを、現在の日時に更新するものであってよい。

【0077】

一方、Ｓ２２の処理で抽出したファイル名等における文字列と、情報格納領域１３０に記憶された一時格納情報１３５に含まれる文字列のそれぞれとが前方一致する関係にないと判定した場合（Ｓ３２のＮＯ）、情報管理部１１２は、図８に示すように、Ｓ２２の処理で抽出したファイル名等における文字列を一時格納情報１３５として情報格納領域１３０に記憶する（Ｓ４１）。

【0078】

具体的に、例えば、Ｓ３５の処理において正規表現に適合すると判定した文字列が「ｃ：￥ｄｏｃｕｍｅｎｔｓ￥ａｂｃｄ￥.ｇｉｔ￥ｏｂｊｅｃｔｓ￥２０￥３４５６７」である場合、情報管理部１１２は、例えば、図１５の下線部分に示すように、「文字列」に「ｃ：￥ｄｏｃｕｍｅｎｔｓ￥ａｂｃｄ￥.ｇｉｔ￥ｏｂｊｅｃｔｓ￥２０￥３４５６７」を記憶した情報（４行目の情報）を追加する。

【0079】

なお、Ｓ３５の処理において正規表現に適合すると判定した文字列が一時格納情報１３５として既に記憶されている場合、情報管理部１１２は、Ｓ３５の処理において正規表現に適合すると判定した文字列に対応するタイムスタンプのみを更新するものであってよい。

【0080】

そして、情報出力部１１８は、Ｓ４２以降の処理を行う。また、Ｓ３３の処理で特定した文字列が、情報格納領域１３０に記憶された正規表現情報１３２に含まれる正規表現に適合しないと判定した場合についても同様に（Ｓ３５のＮＯ）、情報管理部１１２等は、Ｓ４１以降の処理を行う。

【0081】

さらに、Ｓ２２の処理で抽出したファイル名等に対応する文字列が、情報格納領域１３０に記憶された正規表現情報１３２に含まれる正規表現に適合しないと判定した場合（Ｓ２６のＮＯ）、情報出力部１１８は、図８に示すように、Ｓ２２の処理で抽出したファイル名等に対応するファイルが秘密情報を含むファイルであることを示す情報を生成する（Ｓ４３）。そして、情報出力部１１８は、Ｓ４３の処理で生成した情報を出力する（Ｓ４４）。

【0082】

すなわち、本実施の形態における情報処理装置１は、複数の対象ファイルのそれぞれが秘密情報を含む可能性が高いファイルであるか否かを判定するとともに、複数のファイルのファイル名等から新たに特定された前方一致情報１３３の蓄積を行う。ここで、前方一致情報１３３は、秘密情報を含む可能性が低いと判定された複数の対象ファイルのファイル名等の共通部分である。そのため、情報処理装置１は、ファイル名等に前方一致情報１３３が含まれる対象ファイルが新たに発生した場合、その新たに発生した対象ファイルが秘密情報を含む可能性が低いファイルであると判定することが可能である。したがって、情報処理装置１は、複数の対象ファイルのそれぞれが正規表現情報１３２に含まれる正規表現に適合するか否かについての判定を行う前に、複数の対象ファイルのそれぞれが前方一致情報１３３を含むか否かの判定を行う。

【0083】

これにより、情報処理装置１は、対象ファイルのファイル名等と正規表現によって記述された正規表現情報１３２とのマッチング回数を抑制することが可能になる。そのため、情報処理装置１は、正規表現によって記述されていないパターンを用いることなく、対象ファイルの分類に要する時間を短縮させることが可能になる。したがって、情報処理装置１は、パターンの作成に要する負担を抑制しつつ、対象ファイルの分類の効率化を行うことが可能になる。

【0084】

なお、Ｓ３６の処理において、一時格納情報１３５として既に記憶されている文字列を、Ｓ３３の処理で特定した文字列に置き換えるものであってもよい。

【0085】

具体的に、例えば、一時格納情報１３５として既に記憶されている文字列が「ｃ：￥ｄｏｃｕｍｅｎｔｓ￥ｔｅｓｔ￥.ｇｉｔ￥ｏｂｊｅｃｔｓ￥００￥１２３４５」であって、Ｓ３５の処理において正規表現に適合すると判定した文字列が「ｃ：￥ｄｏｃｕｍｅｎｔｓ￥ｔｅｓｔ￥.ｇｉｔ￥ｏｂｊｅｃｔｓ￥」である場合、情報管理部１１２は、図１６の下線部分に示すように、一時格納情報１３５に含まれる文字列である「ｃ：￥ｄｏｃｕｍｅｎｔｓ￥ｔｅｓｔ￥.ｇｉｔ￥ｏｂｊｅｃｔｓ￥００￥１２３４５」を「ｃ：￥ｄｏｃｕｍｅｎｔｓ￥ｔｅｓｔ￥.ｇｉｔ￥ｏｂｊｅｃｔｓ￥」に更新するものであってよい。

【0086】

これにより、情報管理部１１２は、一時格納情報１３５の記憶に要する記憶領域を削減することが可能になる。

【0087】

また、情報管理部１１２は、Ｓ４１の処理においてだけでなく、Ｓ３３の処理で特定した文字列を前方一致情報１３３として情報格納領域１３０に記憶するタイミング（Ｓ３６の処理が行われるタイミング）においても、一時格納情報１３５の更新を行うものであってよい。

【0088】

この場合、情報管理部１１２は、図１６の下線部分に示すように、対応するタイムスタンプ（１行目の情報のタイムスタンプ）として、Ｓ３６の処理において前方一致情報１３３に記憶された情報のタイムスタンプ（例えば、図１３で説明した前方一致情報１３３における３行目の情報のタイムスタンプ）と同じ日時を記憶する。

【0089】

これにより、情報管理部１１２は、一時格納情報１３５の記憶に要する記憶領域をより削減することが可能になる。

【0090】

さらに、情報管理部１１２は、例えば、前方一致情報１３３及び一時格納情報１３５のそれぞれに含まれる情報のうち、タイムスタンプとして記憶された日時が現在日時よりも所定時間以上前になった情報を随時削除するものであってもよい。

【0091】

［第２の実施の形態］
次に、第２の実施の形態について説明する。図１７から図２１は、第２の実施の形態におけるファイル分類処理を説明するフローチャート図である。また、図２２は、第２の実施の形態におけるファイル分類処理を説明する図である。

【0092】

第２の実施の形態におけるファイル分類処理は、前方一致情報１３３のみでなく、後方一致情報１３４の参照及び更新についても行う。後方一致情報１３４は、ファイル名抽出部１１３が抽出したファイル名等のそれぞれと後方一致する関係にあるか否かの判定を行う文字列を含む情報である。以下、第１の実施の形態におけるファイル分類処理を異なる点についてのみ説明を行う。

【0093】

情報受付部１１１は、図１７に示すように、ファイル情報１３１を受け付けるまで待機する（Ｓ５１のＮＯ）。

【0094】

そして、ファイル情報１３１を受け付けた場合（Ｓ５１のＹＥＳ）、ファイル名抽出部１１３は、Ｓ５１の処理で受け付けたファイル情報１３１から対象ファイルのファイル名等を抽出する（Ｓ５２）。

【0095】

続いて、第１判定部１１４は、Ｓ５２の処理で抽出したファイル名等に対応する文字列が、情報格納領域１３０に記憶された前方一致情報１３３に含まれる文字列と前方一致する関係にあるか否かを判定する（Ｓ５３）。

【0096】

その結果、Ｓ５２の処理で抽出したファイル名等に対応する文字列が、情報格納領域１３０に記憶された前方一致情報１３３に含まれる文字列と前方一致する関係にないと判定した場合（Ｓ５４のＮＯ）、第１判定部１１４は、Ｓ５２の処理で抽出したファイル名等に対応する文字列が、情報格納領域１３０に記憶された後方一致情報１３４に含まれる文字列と後方一致する関係にあるか否かを判定する（Ｓ５５）。以下、後方一致情報１３４の具体例について説明を行う。

【0097】

［前方一致情報の具体例］
図２２は、後方一致情報１３４の具体例について説明する図である。

【0098】

図２２に示す後方一致情報１３４は、後方一致の判定に用いられる文字列が記憶される「文字列」と、各情報が生成（更新）されたエポック秒が記憶される「タイムスタンプ」とを項目として有する。

【0099】

具体的に、図２２に示す後方一致情報１３４において、１行目の情報には、「文字列」として「．ｅｘｅ」が記憶され、「タイムスタンプ」として「１５５１１２８９４２」が記憶されている。

【0100】

また、図２２に示す後方一致情報１３４において、２行目の情報には、「文字列」として「．ｄｌｌ」が記憶され、「タイムスタンプ」として「１５５１１２９６２１」が記憶されている。

【0101】

そのため、例えば、Ｓ５２の処理で抽出したファイル名等に対応する文字列が「ｃ：￥ｄｏｃｕｍｅｎｔｓ￥ｔｅｓｔ￥.ｇｉｔ￥ｏｂｊｅｃｔｓ￥ａ１￥９８７６５．ｅｘｅ」であった場合、第１判定部１１４は、Ｓ５２の処理で抽出したファイル名等に対応する文字列と、１行目の情報の「文字列」に記憶された文字列とが後方一致する関係にあると判定する。

【0102】

図１７に戻り、Ｓ５２の処理で抽出したファイル名等に対応する文字列が、情報格納領域１３０に記憶された後方一致情報１３４に含まれる文字列と後方一致する関係にないと判定した場合（Ｓ５６のＮＯ）、第２判定部１１５は、図１８に示すように、Ｓ５２の処理で抽出したファイル名等に対応する文字列が、情報格納領域１３０に記憶された正規表現情報１３２に含まれる正規表現に適合するか否かを判定する（Ｓ６１）。

【0103】

その結果、Ｓ５２の処理で抽出したファイル名等に対応する文字列が、情報格納領域１３０に記憶された正規表現情報１３２に含まれる正規表現に適合すると判定した場合（Ｓ６２のＹＥＳ）、共通特定部１１６は、Ｓ５２の処理で抽出したファイル名等における文字列と、情報格納領域１３０に記憶された一時格納情報１３５に含まれる文字列のそれぞれとが前方一致する関係にあるか否かを判定する（Ｓ６３）。

【0104】

そして、Ｓ５２の処理で抽出したファイル名等における文字列と、情報格納領域１３０に記憶された一時格納情報１３５に含まれる文字列のそれぞれとが前方一致する関係にあると判定した場合（Ｓ６４のＹＥＳ）、共通特定部１１６は、Ｓ５２の処理で抽出したファイル名等における文字列のうち、Ｓ６３の処理で前方一致する関係にあると判定した文字列を特定する（Ｓ６５）。

【0105】

続いて、第３判定部１１７は、図１９に示すように、Ｓ６５の処理で特定した文字列が、情報格納領域１３０に記憶された正規表現情報１３２に含まれる正規表現に適合するか否かを判定する（Ｓ７１）。

【0106】

その結果、Ｓ６５の処理で特定した文字列が、情報格納領域１３０に記憶された正規表現情報１３２に含まれる正規表現に適合すると判定した場合（Ｓ７２のＹＥＳ）、情報管理部１１２は、Ｓ６５の処理で特定した文字列を前方一致情報１３３の少なくとも一部として情報格納領域１３０に記憶する（Ｓ７３）。

【0107】

一方、Ｓ６５の処理で特定した文字列が、情報格納領域１３０に記憶された正規表現情報１３２に含まれる正規表現に適合しないと判定した場合（Ｓ７２のＮＯ）、情報管理部１１２は、Ｓ７３の処理を行わない。

【0108】

また、Ｓ５２の処理で抽出したファイル名等における文字列と、情報格納領域１３０に記憶された一時格納情報１３５に含まれる文字列のそれぞれとが前方一致する関係にないと判定した場合（Ｓ６４のＮＯ）、共通特定部１１６は、Ｓ６５からＳ７３の処理を行わない。

【0109】

続いて、共通特定部１１６は、Ｓ５２の処理で抽出したファイル名等における文字列と、情報格納領域１３０に記憶された一時格納情報１３５に含まれる文字列のそれぞれとが後方一致する関係にあるか否かを判定する（Ｓ７４）。

【0110】

その結果、Ｓ５２の処理で抽出したファイル名等における文字列と、情報格納領域１３０に記憶された一時格納情報１３５に含まれる文字列のそれぞれとが後方一致する関係にあると判定した場合（Ｓ７５のＹＥＳ）、共通特定部１１６は、Ｓ５２の処理で抽出したファイル名等における文字列のうち、Ｓ７４の処理で後方一致する関係にあると判定した文字列を特定する（Ｓ７６）。

【0111】

具体的に、例えば、Ｓ５２の処理で抽出したファイル名等に対応する文字列が「ｃ：￥ｄｏｃｕｍｅｎｔｓ￥ｔｅｓｔ￥.ｇｉｔ￥ｏｂｊｅｃｔｓ￥ａ１￥９８７６５．ｅｘｅ」であり、一時格納情報１３５に含まれる文字列が「ｃ：￥ｄｏｃｕｍｅｎｔｓ￥ｔｅｓｔ￥.ｇｉｔ￥ｏｂｊｅｃｔｓ￥ａ１￥７６５４３．ｅｘｅ」であった場合、共通特定部１１６は、Ｓ５２の処理で抽出したファイル名等に対応する文字列と、一時格納情報１３５に含まれる文字列とが後方一致する関係にあると判定する。そして、共通特定部１１６は、この場合、Ｓ５２の処理で抽出したファイル名等に対応する文字列と、一時格納情報１３５に含まれる文字列とにおける共通部分である「．ｅｘｅ」を特定する。

【0112】

さらに、第３判定部１１７は、図２０に示すように、Ｓ７６の処理で特定した文字列が、情報格納領域１３０に記憶された正規表現情報１３２に含まれる正規表現に適合するか否かを判定する（Ｓ８１）。

【0113】

その結果、Ｓ７３の処理で特定した文字列が、情報格納領域１３０に記憶された正規表現情報１３２に含まれる正規表現に適合すると判定した場合（Ｓ８２のＹＥＳ）、情報管理部１１２は、Ｓ７３の処理で特定した文字列を後方一致情報１３４の少なくとも一部として情報格納領域１３０に記憶する（Ｓ８３）。

【0114】

一方、Ｓ７３の処理で特定した文字列が、情報格納領域１３０に記憶された正規表現情報１３２に含まれる正規表現に適合しないと判定した場合（Ｓ８２のＮＯ）、情報管理部１１２は、Ｓ８３の処理を行わない。

【0115】

また、Ｓ５２の処理で抽出したファイル名等における文字列と、情報格納領域１３０に記憶された一時格納情報１３５に含まれる文字列のそれぞれとが後方一致する関係にないと判定した場合（Ｓ７５のＮＯ）、共通特定部１１６は、Ｓ７６からＳ８３の処理を行わない。

【0116】

その後、情報管理部１１２は、Ｓ６５またはＳ７６の処理において文字列を前方一致情報１３３または後方一致情報１３４として記憶したか否かを判定する（Ｓ８４）。

【0117】

そして、Ｓ６５またはＳ７６の処理において文字列を記憶していないと判定した場合（Ｓ８５のＹＥＳ）、情報出力部１１８は、図２１に示すように、例えば、Ｓ５２の処理で抽出したファイル名等に対応するファイルが秘密情報を含むファイルでないことを示す情報を生成する（Ｓ９２）。

【0118】

その後、情報出力部１１８は、Ｓ９２の処理で生成した情報を出力する（Ｓ９４）。具体的に、情報出力部１１８は、例えば、Ｓ９２の処理で生成した情報を情報処理装置１の出力装置（図示しない）に出力する。

【0119】

また、Ｓ５２の処理で抽出したファイル名等に対応する文字列が、情報格納領域１３０に記憶された前方一致情報１３３に含まれる文字列と前方一致する関係にあると判定した場合（Ｓ５４のＹＥＳ）、または、Ｓ５２の処理で抽出したファイル名等に対応する文字列が、情報格納領域１３０に記憶された後方一致情報１３４に含まれる文字列と後方一致する関係にあると判定した場合も同様に（Ｓ５６のＹＥＳ）、情報出力部１１８は、Ｓ９２以降の処理を行う。

【0120】

一方、Ｓ６５またはＳ７６の処理において文字列を記憶していると判定した場合（Ｓ８５のＹＥＳ）、情報管理部１１２は、図２１に示すように、Ｓ５２の処理で抽出したファイル名等における文字列を一時格納情報１３５として情報格納領域１３０に記憶する（Ｓ９１）。そして、情報出力部１１８は、Ｓ４２以降の処理を行う。

【0121】

さらに、Ｓ５２の処理で抽出したファイル名等に対応する文字列が、情報格納領域１３０に記憶された正規表現情報１３２に含まれる正規表現に適合しないと判定した場合（Ｓ６２のＮＯ）、情報出力部１１８は、図２１に示すように、Ｓ５２の処理で抽出したファイル名等に対応するファイルが秘密情報を含むファイルであることを示す情報を生成する（Ｓ９３）。そして、情報出力部１１８は、Ｓ９４の処理を行う。

【0122】

これにより、情報処理装置１は、対象ファイルのファイル名等と正規表現によって記述された正規表現情報１３２とのマッチング回数をより抑制することが可能になる。そのため、情報処理装置１は、対象ファイルの分類をより効率的に行うことが可能になる。

【0123】

なお、情報管理部１１２は、例えば、後方一致情報１３４に含まれる情報のうち、タイムスタンプとして記憶された日時が現在日時よりも所定時間以上前になった情報を随時削除するものであってもよい。

【0124】

以上の実施の形態をまとめると、以下の付記のとおりである。

【0125】

（付記１）
文字列を記憶した第１記憶部を参照し、複数のファイルのファイル名のそれぞれが前記文字列を含むか否かを判定する第１判定部と、
前記複数のファイルのファイル名のそれぞれが前記文字列を含まないと判定した場合、正規表現を記憶した第２記憶部を参照し、前記複数のファイルのファイル名のそれぞれが前記正規表現に適合するか否かを判定する第２判定部と、
前記複数のファイルのファイル名のそれぞれが前記正規表現に適合する場合、前記複数のファイルのファイル名における文字列の共通部分を特定する共通特定部と、
特定した前記共通部分が前記正規表現に適合する場合、特定した前記共通部分に対応する文字列を前記第１記憶部にさらに記憶する情報管理部と、を有する、
ことを特徴とするファイル分類装置。

【0126】

（付記２）
付記１において、
前記第１記憶部に記憶された文字列は、正規表現が用いられていない文字列である、
ことを特徴とするファイル分類装置。

【0127】

（付記３）
付記１において、
前記第１判定部は、前記第１記憶部を参照し、前記複数のファイルに含まれる第１ファイルが前記文字列を含むか否かを判定し、
前記第２判定部は、前記第１ファイルが前記文字列を含まないと判定した場合、前記第２記憶部を参照し、前記第１ファイルのファイル名が前記正規表現に適合するか否かを判定し、
前記情報管理部は、前記第１ファイルのファイル名が前記正規表現に適合する場合、前記第１ファイルのファイル名を第３記憶部に記憶し、さらに、
前記第１判定部は、前記情報管理部が前記第１ファイルのファイル名を記憶した後、前記第１記憶部を参照し、前記複数のファイルに含まれる第２ファイルが前記文字列を含むか否かを判定し、
前記第２判定部は、前記正規表現に適合するか否かを判定する処理では、前記第２ファイルが前記文字列を含まないと判定した場合、前記第２記憶部を参照し、前記第２ファイルのファイル名が前記正規表現に適合するか否かを判定し、
前記共通特定部は、前記第２ファイルのファイル名が前記正規表現に適合する場合、前記第３記憶部を参照し、前記第３記憶部に記憶されたファイル名のいずれかと前記第２ファイルのファイル名とにおける文字列の共通部分を特定する、
ことを特徴とするファイル分類装置。

【0128】

（付記４）
付記３において、
前記情報管理部は、前記第２ファイルのファイル名が前記正規表現に適合する場合、前記第２ファイルのファイル名を前記第３記憶部に記憶する、
ことを特徴とするファイル分類装置。

【0129】

（付記５）
付記３において、
前記共通特定部は、前記第３記憶部に記憶されたファイル名のいずれかと前記第２ファイルのファイル名との間において、前方一致する文字列を前記共通部分として特定する、
ことを特徴とするファイル分類装置。

【0130】

（付記６）
付記３において、
前記共通特定部は、前記第３記憶部に記憶されたファイル名のいずれかと前記第２ファイルのファイル名との間において、後方一致する文字列を前記共通部分として特定する、
ことを特徴とするファイル分類装置。

【0131】

（付記７）
付記３において、さらに、
前記第１ファイルのファイル名が前記文字列を含むと判定した場合、前記第１ファイルが前記正規表現に適合することを示す情報を出力し、前記第２ファイルのファイル名が前記文字列を含むと判定した場合、前記第２ファイルが前記正規表現に適合することを示す情報を出力する情報出力部を有する、
ことを特徴とするファイル分類装置。

【0132】

（付記８）
付記７において、
前記情報出力部は、前記第１ファイルのファイル名が前記正規表現に適合しない場合、前記第１ファイルが前記正規表現に適合しないことを示す情報を出力し、前記第２ファイルのファイル名が前記正規表現に適合しない場合、前記第２ファイルが前記正規表現に適合しないことを示す情報を出力する、
ことを特徴とするファイル分類装置。

【0133】

（付記９）
文字列を記憶した第１記憶部を参照し、複数のファイルのファイル名のそれぞれが前記文字列を含むか否かを判定し、
前記複数のファイルのファイル名のそれぞれが前記文字列を含まないと判定した場合、正規表現を記憶した第２記憶部を参照し、前記複数のファイルのファイル名のそれぞれが前記正規表現に適合するか否かを判定し、
前記複数のファイルのファイル名のそれぞれが前記正規表現に適合する場合、前記複数のファイルのファイル名における文字列の共通部分を特定し、
特定した前記共通部分が前記正規表現に適合する場合、特定した前記共通部分に対応する文字列を前記第１記憶部にさらに記憶する、
処理をコンピュータに実行させることを特徴とするファイル分類プログラム。

【0134】

（付記１０）
付記９において、
前記文字列を含むか否かを判定する処理では、前記第１記憶部を参照し、前記複数のファイルに含まれる第１ファイルが前記文字列を含むか否かを判定し、
前記正規表現に適合するか否かを判定する処理では、前記第１ファイルが前記文字列を含まないと判定した場合、前記第２記憶部を参照し、前記第１ファイルのファイル名が前記正規表現に適合するか否かを判定し、さらに、
前記第１ファイルのファイル名が前記正規表現に適合する場合、前記第１ファイルのファイル名を第３記憶部に記憶する、
処理をコンピュータに実行させ、
前記文字列を含むか否かを判定する処理では、前記第１ファイルのファイル名を前記第３記憶部に記憶する処理の後、前記第１記憶部を参照し、前記複数のファイルに含まれる第２ファイルが前記文字列を含むか否かを判定し、
前記正規表現に適合するか否かを判定する処理では、前記第２ファイルが前記文字列を含まないと判定した場合、前記第２記憶部を参照し、前記第２ファイルのファイル名が前記正規表現に適合するか否かを判定し、
前記特定する処理では、前記第２ファイルのファイル名が前記正規表現に適合する場合、前記第３記憶部を参照し、前記第３記憶部に記憶されたファイル名のいずれかと前記第２ファイルのファイル名とにおける文字列の共通部分を特定する、
ことを特徴とするファイル分類プログラム。

【0135】

（付記１１）
文字列を記憶した第１記憶部を参照し、複数のファイルのファイル名のそれぞれが前記文字列を含むか否かを判定し、
前記複数のファイルのファイル名のそれぞれが前記文字列を含まないと判定した場合、正規表現を記憶した第２記憶部を参照し、前記複数のファイルのファイル名のそれぞれが前記正規表現に適合するか否かを判定し、
前記複数のファイルのファイル名のそれぞれが前記正規表現に適合する場合、前記複数のファイルのファイル名における文字列の共通部分を特定し、
特定した前記共通部分が前記正規表現に適合する場合、特定した前記共通部分に対応する文字列を前記第１記憶部にさらに記憶する、
処理をコンピュータに実行させることを特徴とするファイル分類方法。

【0136】

（付記１２）
付記１１において、
前記文字列を含むか否かを判定する処理では、前記第１記憶部を参照し、前記複数のファイルに含まれる第１ファイルが前記文字列を含むか否かを判定し、
前記正規表現に適合するか否かを判定する処理では、前記第１ファイルが前記文字列を含まないと判定した場合、前記第２記憶部を参照し、前記第１ファイルのファイル名が前記正規表現に適合するか否かを判定し、さらに、
前記第１ファイルのファイル名が前記正規表現に適合する場合、前記第１ファイルのファイル名を第３記憶部に記憶する、
処理をコンピュータに実行させ、
前記文字列を含むか否かを判定する処理では、前記第１ファイルのファイル名を前記第３記憶部に記憶する処理の後、前記第１記憶部を参照し、前記複数のファイルに含まれる第２ファイルが前記文字列を含むか否かを判定し、
前記正規表現に適合するか否かを判定する処理では、前記第２ファイルが前記文字列を含まないと判定した場合、前記第２記憶部を参照し、前記第２ファイルのファイル名が前記正規表現に適合するか否かを判定し、
前記特定する処理では、前記第２ファイルのファイル名が前記正規表現に適合する場合、前記第３記憶部を参照し、前記第３記憶部に記憶されたファイル名のいずれかと前記第２ファイルのファイル名とにおける文字列の共通部分を特定する、
ことを特徴とするファイル分類方法。

【符号の説明】

【0137】

１：情報処理装置２：管理装置
３：記憶装置１０：情報処理システム
ＮＷ：ネットワーク

【図1】