(19)【発行国】日本国特許庁(JP)
(12)【公報種別】特許公報(B2)
(11)【特許番号】
(24)【登録日】2025-05-19
(45)【発行日】2025-05-27
(54)【発明の名称】転送先決定装置、転送システム、転送先決定方法、転送方法、及び、プログラム
(51)【国際特許分類】
G06F 16/906 20190101AFI20250520BHJP
G06F 16/16 20190101ALI20250520BHJP
【FI】
G06F16/906
G06F16/16
(21)【出願番号】P 2023547947
(86)(22)【出願日】2021-09-14
(86)【国際出願番号】 JP2021033626
(87)【国際公開番号】W WO2023042239
(87)【国際公開日】2023-03-23
【審査請求日】2024-01-22
(73)【特許権者】
【識別番号】000004237
【氏名又は名称】日本電気株式会社
(74)【代理人】
【識別番号】100178216
【氏名又は名称】浜野 絢子
(74)【代理人】
【識別番号】100149618
【氏名又は名称】北嶋 啓至
(72)【発明者】
【氏名】中垣 遼太郎
【審査官】早川 学
(56)【参考文献】
【文献】特開2021-096515(JP,A)
【文献】特開2000-259669(JP,A)
【文献】特開2004-304585(JP,A)
【文献】ファイルサーバを改善させるポイントはコレだ!,月刊ウィンドウズ・サーバ・ワールド,(株)IDGジャパン,2009年03月01日,Vol.14,No.3,pp.56-62
(58)【調査した分野】(Int.Cl.,DB名)
G06F 16/00-16/958
(57)【特許請求の範囲】
【請求項1】
学習用ファイル
に含まれるファイルのプロパティにおける所有者とアクセス権とを用いて判定された転送先となる正しいフォルダを示す情報である正解ラベルを含む教師データを作成する教師データ作成手段と、
前記教師データを使用する教師あり機械学習により、転送元ファイルサーバの転送元フォルダのファイルのプロパティの入力に応じて、転送先となる転送先ファイルサーバの転送先フォルダに関する情報を出力する転送先決定モデルを生成する学習手段と、
前記転送先決定モデルを用いて、前記転送元ファイルサーバの前記転送元フォルダのファイルの転送先となる前記転送先ファイルサーバの前記転送先フォルダを決定する転送先決定手段と
を含み、
前記転送先決定モデルが複数の前記転送先フォルダを選択する場合、前記転送先決定手段は、前記転送先決定モデルが選択した前記転送先フォルダそれぞれに対する、前記転送元フォルダにおける
複数のファイルそれぞれの前記転送先フォルダに対する確信度の調和平均に基づいて、前記転送元フォルダのファイルを転送する前記転送先フォルダを決定する
転送先決定装置。
【請求項2】
前記転送先決定手段は、
前記転送先フォルダごとにおける複数のファイルの前記確信度の分散を用いて前記転送先フォルダを決定する
請求項1に記載の転送先決定装置。
【請求項3】
請求項1又は2に記載の前記転送先決定装置と、
前記学習用ファイルを生成するファイル情報取得装置と、
前記転送先決定装置が決定した前記転送先ファイルサーバの前記転送先フォルダに、前記転送元ファイルサーバの前記転送元フォルダのファイルを転送するファイル転送装置と
を含む転送システム。
【請求項4】
転送先決定装置が、
学習用ファイル
に含まれるファイルのプロパティにおける所有者とアクセス権とを用いて判定された転送先となる正しいフォルダを示す情報である正解ラベルを含む教師データを作成し、
前記教師データを使用する教師あり機械学習により、転送元ファイルサーバの転送元フォルダのファイルのプロパティの入力に応じて、転送先となる転送先ファイルサーバの転送先フォルダに関する情報を出力する転送先決定モデルを生成し、
前記転送先決定モデルを用いて、前記転送元ファイルサーバの前記転送元フォルダのファイルの転送先となる前記転送先ファイルサーバの前記転送先フォルダを決定し、
前記転送先決定モデルが複数の前記転送先フォルダを選択する場合、前記転送先フォルダの決定は、前記転送先決定モデルが選択した前記転送先フォルダそれぞれに対する、前記転送元フォルダにおける
複数のファイルそれぞれの前記転送先フォルダに対する確信度の調和平均に基づいて、前記転送元フォルダのファイルを転送する前記転送先フォルダを決定する
転送先決定方法。
【請求項5】
転送先決定装置が、請求項4に記載の転送先決定方法を実行し、
ファイル情報取得装置が、前記学習用ファイルを生成し、
ファイル転送装置が、前記転送先決定装置が決定した前記転送先ファイルサーバの前記転送先フォルダに、前記転送元ファイルサーバの前記転送元フォルダのファイルを転送する
転送方法。
【請求項6】
学習用ファイル
に含まれるファイルのプロパティにおける所有者とアクセス権とを用いて判定された転送先となる正しいフォルダを示す情報である正解ラベルを含む教師データを作成する処理と、
前記教師データを使用する教師あり機械学習により、転送元ファイルサーバの転送元フォルダのファイルのプロパティの入力に応じて、転送先となる転送先ファイルサーバの転送先フォルダに関する情報を出力する転送先決定モデルを生成する処理と、
前記転送先決定モデルを用いて、前記転送元ファイルサーバの前記転送元フォルダのファイルの転送先となる前記転送先ファイルサーバの前記転送先フォルダを決定する処理と
をコンピュータに実行させ、
前記転送先決定モデルが複数の前記転送先フォルダを選択する場合、前記転送先フォルダを決定する処理は、前記転送先決定モデルが選択した前記転送先フォルダそれぞれに対する、前記転送元フォルダにおける
複数のファイルそれぞれの前記転送先フォルダに対する確信度の調和平均に基づいて、前記転送元フォルダのファイルを転送する前記転送先フォルダを決定する処理
を実行させるプログラム。
【発明の詳細な説明】
【技術分野】
【0001】
本発明は、ファイルを転送する技術に関する。
【背景技術】
【0002】
特許文献1には、属性が異なるファイルを保存するファイル共有システムが記載されている。
【先行技術文献】
【特許文献】
【0003】
【発明の概要】
【発明が解決しようとする課題】
【0004】
複数のファイルサーバ間において、フォルダの属性の体系が異なる場合、ファイルの転送において、ファイルを転送するフォルダを決定する必要がある。特許文献1に記載の技術は、移行後のファイルのアクセス情報を設定する技術であり、ファイルを転送するフォルダを決定する技術ではない。
【0005】
本発明の目的は、フォルダの属性の体系が異なるファイルサーバ間において、ファイルを転送するフォルダを決定する転送先決定装置などを提供することにある。
【課題を解決するための手段】
【0006】
本発明の一形態における学習装置は、
学習用ファイルを用いて教師データを作成する教師データ作成手段と、
教師データを使用する教師あり機械学習により、転送元ファイルサーバの転送元フォルダのファイルのプロパティの入力に応じて、転送先となる転送先ファイルサーバの転送先フォルダに関する情報を出力する転送先決定モデルを生成する学習手段と
を含む。
【0007】
本発明の一形態における転送先決定装置は、
転送元ファイルサーバの転送元フォルダのファイルの転送先となる転送先ファイルサーバの転送先フォルダに関する情報を出力する転送先決定モデルを用いて、転送元ファイルサーバの転送元フォルダのファイルの転送先となる転送先ファイルサーバの転送先フォルダを決定する転送先決定手段
を含む。
【0008】
本発明の一形態における転送先決定装置は、
学習用ファイルを用いて教師データを作成する教師データ作成手段と、
教師データを使用する教師あり機械学習により、転送元ファイルサーバの転送元フォルダのファイルのプロパティの入力に応じて、転送先となる転送先ファイルサーバの転送先フォルダに関する情報を出力する転送先決定モデルを生成する学習手段と、
転送先決定モデルを用いて、転送元ファイルサーバの転送元フォルダのファイルの転送先となる転送先ファイルサーバの転送先フォルダを決定する転送先決定手段と
を含む。
【0009】
本発明の一形態における転送システムは、
上記の転送先決定装置と、
学習用ファイルを生成するファイル情報取得装置と、
転送先決定装置が決定した転送先ファイルサーバの転送先フォルダに、転送元ファイルサーバの転送元フォルダのファイルを転送するファイル転送装置と
を含む。
【0010】
本発明の一形態における転送先決定方法は、
学習用ファイルを用いて教師データを作成し、
教師データを使用する教師あり機械学習により、転送元ファイルサーバの転送元フォルダのファイルのプロパティの入力に応じて、転送先となる転送先ファイルサーバの転送先フォルダに関する情報を出力する転送先決定モデルを生成し、
転送先決定モデルを用いて、転送元ファイルサーバの転送元フォルダのファイルの転送先となる転送先ファイルサーバの転送先フォルダを決定する。
【0011】
本発明の一形態における転送方法は、
転送先決定装置が、上記の転送先決定方法を実行し、
ファイル情報取得装置が、学習用ファイルを生成し、
ファイル転送装置が、転送先決定装置が決定した転送先ファイルサーバの転送先フォルダに、転送元ファイルサーバの転送元フォルダのファイルを転送する。
【0012】
本発明の一形態における記録媒体は、
学習用ファイルを用いて教師データを作成する処理と、
教師データを使用する教師あり機械学習により、転送元ファイルサーバの転送元フォルダのファイルのプロパティの入力に応じて、転送先となる転送先ファイルサーバの転送先フォルダに関する情報を出力する転送先決定モデルを生成する処理と、
転送先決定モデルを用いて、転送元ファイルサーバの転送元フォルダのファイルの転送先となる転送先ファイルサーバの転送先フォルダを決定する処理と
をコンピュータに実行させるプログラムを記録する。
【発明の効果】
【0013】
本発明に基づけば、フォルダの属性の体系が異なるファイルサーバ間において、ファイルを転送するフォルダを決定する負荷を低減することができる。
【図面の簡単な説明】
【0014】
【
図1】本発明における第1実施形態にかかる転送先決定装置の構成の一例を示す図である。
【
図2】第2実施形態にかかる転送システムの構成の一例を示すブロック図である。
【
図3】教師データ作成部の動作の一例を示すフロー図である。
【
図4】学習用ファイルに含まれるファイルのプロパティの一例を示す図である。
【
図6】教師データ作成部が、ファイルのプロパティに基づいて抽出したファイルの特徴の一例を示す図である。
【
図8】動作の説明に用いる転送元ファイルサーバにおけるフォルダ構成を示す図である。
【
図9】転送先決定部の動作の一例を示すフロー図である。
【
図10】確信度及びその調和平均の一例を示す図である。
【
図11】転送先ファイルサーバにおけるファイルの転送後の状態の一例を示す図である。
【
図12】転送システムの別の構成の一例を示すブロック図である。
【
図13】転送先決定装置のハードウェア構成の一例を示すブロック図である。
【
図14】転送先決定モデルを生成する転送先決定装置の構成の一例を示すブロック図である。
【
図15】転送先決定モデルを用いる転送先決定装置の構成の一例を示すブロック図である。
【発明を実施するための形態】
【0015】
<関連技術>
クラウド型のオンラインのファイルサーバは、オンプレミス型のファイルサーバの環境に比べ、追加投資及び運用負担を軽減できる場合が多い。そのため、オンプレミス型のファイルサーバの環境からクラウド型のオンラインのファイルサーバの環境へのファイルの転送の要求が増加している。以下、クラウド型のオンラインのファイルサーバの環境を「クラウド」と呼ぶ。また、オンプレミス型のファイルサーバの環境を「オンプレミス」と呼ぶ。
【0016】
しかし、一般的に、オンプレミスのファイル及びフォルダの属性の体系は、クラウドのファイル及びフォルダの属性の体系と異なる場合が多い。このように、転送元ファイルサーバのフォルダの属性の体系が、転送先ファイルサーバのフォルダの属性の体系と異なる場合、フォルダ構成を維持したままファイルを転送することはできない。フォルダ構成を維持できない場合、転送先ファイルサーバのフォルダの中から、ファイルを転送するフォルダを決定する必要がある。
【0017】
ファイルを転送するフォルダを決定する方法としては、例えば、非階層クラスター分析が用いられている。しかし、非階層クラスター分析を用いる場合、パラメータを適切に設定することが必要である。そして、一般的に、利用者などが、実際のフォルダを分析して、パラメータを調整している。このように、現状のファイルを転送するフォルダの決定は、利用者などでのパラメータの調整作業が必要であり、多くの工数を必要としている。また、人の判断に基づくパラメータの決定は、客観性の確保が難しい。
【0018】
本発明における各実施形態は、以下で説明するように、パラメータの調整作業を自動化して、適切なパラメータを決定して、利用者などの工数を低減する。以下、本発明における実施形態について図面を参照して説明する。ただし、本発明の各実施形態は、各図面の記載に限定されるものではない。また、各実施形態は、適宜組み合わせることができる。なお、以下の説明において、フォルダの区別を明確とするため、転送元ファイルサーバのフォルダを「転送元フォルダ」と、転送先ファイルサーバのフォルダを「転送先フォルダ」と呼ぶ場合もある。
【0019】
<第1実施形態>
図1は、本発明における第1実施形態にかかる転送先決定装置4の構成の一例を示す図である。転送先決定装置4は、教師データ作成部5と、学習部6と、転送先決定部7とを含む。教師データ作成部5は、学習用ファイルを用いて教師データを作成する。学習部6は、教師データを使用する教師あり機械学習により、転送先ファイルサーバの転送元フォルダのファイルのプロパティの入力に応じて、転送先となる転送先ファイルサーバの転送先フォルダに関する情報を出力する転送先決定モデルを生成する。転送先決定部7は、転送先決定モデルを用いて、転送元ファイルサーバの転送元フォルダのファイルの転送先となる転送先ファイルサーバの転送先フォルダを決定する。なお、フォルダとは、ファイルシステムにおけるファイルの保存場所であり、システムによってはディレクトリと呼ばれる場合もある。
【0020】
つまり、転送先決定装置4は、学習用ファイルを用いて生成した教師データを利用した機械学習を実行して転送先決定モデルを生成する。そして、転送先決定装置4は、生成した転送先決定モデルを用いて転送元ファイルサーバの転送元フォルダのファイルの転送先となる転送先ファイルサーバの転送先フォルダを決定する。このように、転送先決定装置4は、ファイルの転送先となるフォルダの決定に、教師あり機械学習により生成した転送先決定モデルを用いる。そのため、転送先決定装置4は、利用者などでのパラメータの調整作業を必要とせずに、フォルダの属性の体系が異なるファイルサーバ間において、ファイルを転送するフォルダを決定できる。言い換えると、転送先決定装置4は、パラメータの調整作業を自動化し、適切なパラメータを決定し、フォルダの属性の体系が異なるファイルサーバ間において、ファイルを転送するフォルダを決定できる。その結果、転送先決定装置4は、フォルダの決定における利用者の負荷を低減する。さらに、転送先決定装置4は、教師あり機械学習により生成した転送先決定モデルを用いるため、人手による調整に対して、より客観的に、転送先を決定できる。
【0021】
なお、転送対象となるファイルは、転送元ファイルサーバにおける全てのファイルではなく、一部のファイルとなる場合がある。この場合、転送先決定装置4は、「転送対象となるファイル」について転送先のフォルダを決定すればよく、「転送対象ではないファイル」については動作する必要はない。そこで、以下の説明では、説明の便宜のため、転送元ファイルサーバの転送元フォルダにおける「転送対象のファイル」を、単に「ファイル」と呼ぶ。つまり、以下の説明において、転送元ファイルサーバのファイルは、特に断らない限り、転送対象のファイルである。
【0022】
転送先決定モデルは、転送先ファイルサーバの転送先フォルダとして、各ファイルに対して一つではなく、複数のフォルダを選択してもよい。転送先決定モデルが複数の転送先フォルダを選択する場合、転送先決定部7は、複数の転送先フォルダの中から所定の規則に基づいて、転送先として用いる転送先フォルダを決定する。次に、転送先決定部7が用いる規則の一例を説明する。
【0023】
転送先決定モデルが複数の転送先フォルダを選択する場合、転送先決定部7は、次のように動作する。転送先決定部7は、転送元ファイルサーバの転送元フォルダにおけるファイルごとに、転送先決定モデルを用いて決定した転送先ファイルサーバの転送先フォルダそれぞれに対する確信度を取得する。例えば、転送先決定部7は、転送先決定モデルから、決定したフォルダの確信度を取得する。そして、転送先決定部7は、確信度に基づいて、転送元ファイルサーバの転送元フォルダのファイルを転送する転送先ファイルサーバの転送先フォルダを決定する。
【0024】
例えば、転送先決定部7は、次のように動作して、確信度に基づいて、転送先フォルダを決定する。転送先決定部7は、転送先ファイルサーバの転送先フォルダそれぞれに対するファイルの確信度の調和平均を算出する。そして、転送先決定部7は、確信度の調和平均に基づいて、転送元ファイルサーバの転送元フォルダのファイルを転送する転送先ファイルサーバの転送先フォルダを決定する。例えば、転送先決定部7は、最も調和平均が大きい転送先フォルダを転送先フォルダと決定する。
【0025】
確信度とは、ファイルそれぞれに対して転送先決定モデルが決定したフォルダがどの程度正しいフォルダであるかを示す確率である。また、転送先決定部7が調和平均を用いるのは、次のような理由のためである。調和平均は、一般的に、「率」又は「比」に対する平均を考える場合に適切な平均である。そして、確信度は、「率」の一例である確率である。そこで、転送先決定部7は、平均として、調和平均を用いる。
【0026】
このように、転送先決定装置4は、フォルダそれぞれに対するファイルの確信度の調和平均を用いて、ファイルを転送するフォルダを決定してもよい。ただし、転送先決定部7は、調和平均とは異なる平均を用いてもよい。例えば、転送先決定部7は、算出平均又は幾何平均を用いてもよい。あるいは、転送先決定部7は、フォルダの決定において、確信度とは異なる値を用いてもよい。
【0027】
なお、転送先決定装置4は、生成した転送先決定モデルを他の装置に提供してもよい。あるいは、転送先決定装置4は、他の装置が生成した転送先決定モデルを用いて転送先フォルダを決定してもよい。次に、これらの場合における転送先決定装置4を説明する。
【0028】
図14は、転送先決定モデルを生成する学習装置41の構成の一例を示すブロック図である。学習装置41は、教師データ作成部5と、学習部6とを含む。教師データ作成部5は、転送先決定部学習用ファイルを用いて教師データを作成する。学習部6は、教師データを使用する教師あり機械学習により、転送元ファイルサーバの転送元フォルダのファイルのプロパティの入力に応じて、転送先となる転送先ファイルサーバの転送先フォルダに関する情報を出力する転送先決定モデルを生成する。そして、学習部6は、転送先決定モデルを出力する。
【0029】
図15は、転送先決定モデルを用いる転送先決定装置42の構成の一例を示すブロック図である。転送先決定装置42は、転送元ファイルサーバの転送元フォルダのファイルの転送先となる転送先ファイルサーバの転送先フォルダに関する情報を出力する転送先決定モデルを取得する。そして、転送先決定装置42は、転送先決定モデルを用いて、転送元ファイルサーバの転送元フォルダのファイルの転送先となる転送先ファイルサーバの転送先フォルダを決定する転送先決定部7を含む。
【0030】
<第2実施形態>
次に、図面を参照して、第2実施形態を説明する。
図2は、第2実施形態にかかる転送システム10の構成の一例を示すブロック図である。転送システム10は、転送元ファイルサーバ1と、ファイル情報取得装置2と、記憶装置3と、転送先決定装置4と、ファイル転送装置8と、転送先ファイルサーバ9とを含む。
【0031】
転送元ファイルサーバ1は、ファイルの転送元となるファイルサーバである。転送先ファイルサーバ9は、ファイルの転送先となるファイルサーバである。そして、転送元ファイルサーバ1におけるフォルダの属性の体系の少なくとも一部は、転送先ファイルサーバ9におけるフォルダの属性の体系と異なる。例えば、転送元ファイルサーバ1は、オンプレミスのファイルサーバである。そして、転送先ファイルサーバ9は、クラウドのファイルサーバである。ただし、転送元ファイルサーバ1及び転送先ファイルサーバ9のそれぞれは、上記構成に限られない。例えば、転送元ファイルサーバ1及び転送先ファイルサーバ9は、どちらもオンプレミスのファイルサーバであるが、相互のオペレーティングシステムが異なるファイルサーバでもよい。あるいは、転送元ファイルサーバ1及び転送先ファイルサーバ9は、互いにクラウドシステムが異なるクラウドのファイルサーバであってもよい。
【0032】
なお、フォルダの属性は、フォルダに対するアクセス権である。ただし、フォルダの属性は、アクセス権に限定されない。フォルダの属性は、保存属性(アーカイブ属性)、圧縮属性、及び、暗号化属性の少なくとも一つでもよいし、これらとアクセス権との組合せでもよい。ただし、フォルダの属性は、上記に限定されず、上記とは異なる属性でもよい。
【0033】
ファイル情報取得装置2は、転送先決定装置4が用いる学習用ファイルを生成する。ファイル情報取得装置2は、生成した学習用ファイルを記憶装置3に保存する。学習用ファイルは、機械学習に用いられるデータとして、正しく転送されたファイルのプロパティと、そのファイルの転送先のフォルダとを少なくとも含む。例えば、ファイル情報取得装置2は、正しく転送されたファイルのプロパティと、そのファイルの転送先のフォルダとを含む学習用ファイルを生成する。例えば、ファイル情報取得装置2は、次のように、学習用ファイルを生成する。なお、ファイル情報取得装置2は、以下の説明とは異なる方法を用いて学習用ファイルを生成してもよい。
【0034】
例えば、ファイル情報取得装置2は、転送元ファイルサーバ1の転送元フォルダの属性及び構成と、転送元フォルダのファイルのプロパティと、転送先ファイルサーバ9の転送先フォルダの属性及び構成とを取得する。そして、ファイル情報取得装置2は、図示しない記憶装置に保存されている過去において正しく転送されたファイルの情報の中から、ファイルのプロパティが転送元ファイルサーバ1における転送元フォルダのファイルのプロパティと同様のファイルを抽出する。ファイルのプロパティが複数の場合、ファイル情報取得装置2は、プロパティそれぞれに対応するファイルを抽出する。
【0035】
そして、ファイル情報取得装置2は、抽出したファイルの中から、転送元のフォルダが転送元ファイルサーバ1のフォルダと同様の属性及び構成となっているファイルを抽出する。さらに、ファイル情報取得装置2は、上記のように抽出したファイルの中から、転送先のフォルダが転送先ファイルサーバ9のフォルダと同様の属性及び構成となっているファイルを抽出する。そして、ファイル情報取得装置2は、上記のように抽出したファイルのプロパティと転送先のフォルダとを組み合わせて学習用ファイルを生成する。
【0036】
なお、ファイル情報取得装置2は、過去において、転送元ファイルサーバ1から転送先ファイルサーバ9に転送されたファイルのプロパティ及び転送された転送先フォルダを取得して、学習用ファイルを作成してもよい。あるいは、ファイル情報取得装置2は、利用者などから必要な情報を取得し、取得した情報に基づいて学習用ファイルを生成してもよい。あるいは、ファイル情報取得装置2は、利用者などから学習用ファイルを取得してもよい。
【0037】
プロパティとは、フォルダ及びファイルの特性を示す情報である。例えば、フォルダのプロパティは、フォルダ名、フォルダの種類、そのフォルダが保存されているフォルダ、フォルダのサイズ、フォルダの所有者、フォルダの内容、作成日時、更新日時、及び、アクセス日時の少なくとも一つを含んでもよい。なお、フォルダの内容は、フォルダに含まれるファイル数とフォルダ数とである。フォルダの内容は、フォルダに含まれるファイルのサイズ及びフォルダに含まれるフォルダのサイズの合計を含んでもよい。ファイルのプロパティは、ファイル名、ファイルの種類、ファイルを作成したプログラム、ファイルが保存されているフォルダ、サイズ、所有者、作成日時、更新日時、及び、アクセス日時の少なくとも一つを含んでもよい。プロパティは、上記に限定されず、上記とは異なる情報を含んでもよい。例えば、プロパティは、属性を含んでもよい。例えば、ファイルのプロパティは、ファイルのアクセス権を含んでもよい。
【0038】
記憶装置3は、転送システム10に含まれる装置が用いる情報を保存する。例えば、記憶装置3は、ファイル情報取得装置2、転送先決定装置4、及び、ファイル転送装置8の少なくとも一つの動作に関連する情報を保存する。例えば、記憶装置3は、ファイル転送装置8が転送元ファイルサーバ1の転送元フォルダのファイルを、転送先ファイルサーバ9の転送先フォルダに転送するときに用いるファイルの転送に関連する情報を保存する。
【0039】
ファイル転送装置8は、転送先決定装置4が決定して記憶装置3に保存したファイルの転送に関連する情報に基づいて、転送元ファイルサーバ1の転送元フォルダのファイルを、転送先ファイルサーバ9の転送先フォルダに転送する。そのため、ファイルの転送に関連する情報は、少なくともファイルの転送先となる転送先フォルダを示す情報を含む。また、ファイルの転送に関連する情報は、他の情報を含んでもよい。例えば、ファイルの転送に関連する情報は、転送対象となるファイルを示す情報のように、他の情報を含んでもよい。
【0040】
転送先決定装置4は、転送元ファイルサーバ1の転送元フォルダのファイルを転送する転送先ファイルサーバ9の転送先フォルダを決定し、ファイルの転送に関連する情報として記憶装置3に保存する。転送先決定装置4は、第1実施形態と同様に、教師データ作成部5と、学習部6と、転送先決定部7とを含む。
【0041】
教師データ作成部5は、記憶装置3に保存された学習用ファイルに含まれるファイルのプロパティを用いて教師データを作成する。教師データ作成部5は、作成した教師データを記憶装置3に保存する。なお、教師データ作成部5は、学習用ファイルに含まれる全てのプロパティを用いてもよいし、一部のプロパティを用いてもよい。例えば、教師データ作成部5は、後ほど説明する学習部6における機械学習に用いられないプロパティの特徴を抽出しなくてもよい。
【0042】
教師データは、正解を示す情報である正解ラベルを含む。本開示においては、教師データは、正解ラベルとして、少なくともファイルのプロパティに基づいて決定される正しいフォルダのプロパティに関連する情報を含む。さらに、教師データは、フォルダの決定に用いられるファイルのプロパティに関連する情報を含む。例えば、所有者とアクセス権とに関連するプロパティに基づいてフォルダを決定する場合、教師データは、所有者とアクセス権とに関連する情報と、フォルダに関連する情報とを含む。教師データが含む情報は、ファイルの所有者及びアクセス権に関連する情報と、フォルダに関連する情報とに限定されず、他の情報でもよい。
【0043】
学習部6は、記憶装置3に保存された教師データを入力として教師あり機械学習を実行することで、機械学習の結果として転送先決定モデルを生成する。より詳細には、学習部6は、教師データに含まれるファイルのプロパティとフォルダとに基づいて、ファイルのプロパティからフォルダに関する情報を出力する転送先決定モデルを生成する。そして、学習部6は、生成した転送先決定モデルを記憶装置3に保存する。転送先決定部7は、記憶装置3に保存されている転送先決定モデルを用いて、転送元ファイルサーバの転送元フォルダのファイルの転送先となる転送先ファイルサーバの転送先フォルダを決定する。より詳細には、転送先決定部7、転送元フォルダのファイルのプロパティを転送先決定モデルに入力し、転送先決定モデルが出力するフォルダをそのファイルの転送先フォルダとして決定する。そして、転送先決定部7は、ファイルの転送に関連する情報として、決定した転送先フォルダを記憶装置3に保存する。
【0044】
既に説明したように、転送先決定モデルが一つのファイルに対して複数の転送先フォルダを選択する場合があるが、その場合でも、転送先決定部7は、各ファイルに対して転送先決定モデルが決定した複数の転送先フォルダから一つの転送先フォルダを決定する。しかし、転送元フォルダが複数の場合、転送元フォルダごとに、ファイルを転送する転送先フォルダが異なるフォルダとなる場合がある。つまり、ファイルを転送する転送先フォルダが複数となる場合がある。この場合、転送先フォルダそれぞれに転送されるファイルの情報が必要である。そこで、この場合、転送先決定部7は、ファイルの転送に関連する情報として、複数の転送先フォルダの情報と、各転送先フォルダに転送するファイルの情報とを関連付けて、記憶装置3に保存する。
【0045】
次に、図面を参照して、転送先決定装置4の各部の動作を説明する。なお、以下の説明では、フォルダの属性の一例として、ファイルシステムにおけるフォルダの「アクセス権」を用いる。つまり、転送元ファイルサーバ1におけるフォルダのアクセス権の体系は、転送先ファイルサーバ9におけるフォルダのアクセス権の体系と異なる。具体的には、転送元ファイルサーバ1において、最上位のフォルダのアクセス権と異なるアクセス権となるフォルダは、フォルダ構成を維持できないフォルダとなる。ただし、これは、第2実施形態における属性をアクセス権に限定するものではない。
【0046】
フォルダ構成を維持するとは、転送先ファイルサーバ9におけるフォルダ構成が、少なくとも転送元ファイルサーバ1における転送の対象となるファイルを保存するフォルダ構成と同じフォルダ構成を含む構成となっていることである。なお、この場合、転送先ファイルサーバ9は、転送元ファイルサーバ1のフォルダ構成と同じフォルダ構成に加え、転送元ファイルサーバ1のフォルダ構成には含まれないフォルダを含んでいてもよい。
【0047】
まず、図面を参照して、教師データ作成部5の動作を説明する。
図3は、教師データ作成部5の動作の一例を示すフロー図である。なお、以下で説明する動作の前に、ファイル情報取得装置2は、過去において正しく転送されたファイルの情報に基づいて、学習用ファイルを生成して記憶装置3に保存しているとする。つまり、記憶装置3は、教師データを作成するための学習用ファイルを保存している。
【0048】
教師データ作成部5は、記憶装置3に保存されている学習用ファイルに含まれるファイルのプロパティを取得する(ステップS101)。なお、教師データ作成部5は、ファイル情報取得装置2から学習用ファイルを取得し、取得した学習用ファイルからプロパティを取得してもよい。そして、教師データ作成部5は、ファイルのプロパティに基づいて、ファイルの特徴を抽出する(ステップS102)。そして、教師データ作成部5は、抽出したファイルの特徴を用いて教師データを作成する(ステップS103)。そして、教師データ作成部5は、作成した教師データを記憶装置3に保存する。なお、教師データ作成部5は、作成した教師データを学習部6に出力してもよい。
【0049】
具体的なデータを用いて、教師データ作成部5の動作を説明する。
図4は、学習用ファイルに含まれるファイルのプロパティの一例を示す図である。なお、
図4は、正しく転送されたファイルの転送先ファイルサーバ9におけるフォルダ及びファイルを示す。つまり、「
図4に示されているファイルと同じプロパティを備えるファイル」の転送先のフォルダは、
図4の示されているフォルダとなる。なお、本実施形態は、転送先フォルダの決定に用いるファイルのプロパティとして、ファイルの所有者とアクセス権とを用いる。そのため、上記の「
図4の示されているファイルと同じプロパティを備えるファイル」とは、所有者とアクセス権とが同じファイルである。
【0050】
図4に示されているプロパティは、ファイルのフォルダ、ファイル名、ファイルの所有者、及び、各部のアクセス権を含む。例えば、
図4の上から3つ目のファイルは、フォルダ「¥¥fileServer¥営業部¥照会資料」に保存されているファイル名「c.xlsx」であるファイルである。以下、ファイルを、「ファイル名」又は「フォルダ+ファイル名」を用いて呼ぶ。例えば、3つ目のファイルを、ファイル「c.xlsx」、又は、ファイル「¥¥fileServer¥営業部¥照会資料¥c.xlsx」と呼ぶ。そして、ファイル「c.xlsx」の所有者は、営業部である。さらに、ファイル「c.xlsx」のアクセス権として、営業部に「フルコントロール」が、開発部に「読み取り」が、設定されている。人事部には、アクセス権が設定されていない。
【0051】
教師データ作成部5は、記憶装置3から、
図4に示されている学習用ファイルに含まれるファイルのプロパティを取得する。そして、教師データ作成部5は、ファイルのプロパティからファイルの特徴を抽出する。教師データ作成部5が抽出する特徴は、利用者などが、予め、フォルダを含めたファイルシステムの仕様、及び、転送先フォルダの決定に用いる転送先決定モデルの仕様に対応して決定して、転送先決定装置4に設定しておけばよい。例えば、教師データ作成部5は、次のような特徴を抽出してもよい。ただし、教師データ作成部5が抽出する特徴は、以下の説明の特徴に限定されない。
【0052】
教師データ作成部5は、特徴として、プロパティの中で、フォルダ、所有者、及び、アクセス権を所定の尺度又は数値に変換する。尺度は、これらに限定されないが、例えば、名義尺度、順序尺度、間隔尺度、又は、比例尺度である。名義尺度とは、単に区別するために用いられている尺度である。順序尺度とは、大小関係に意味がある尺度である。間隔尺度とは、数値の差に意味がある尺度である。比例尺度とは、数値の差と共に数値の比に意味がある尺度である。以下の説明では、教師データ作成部5は、次の(1)から(3)に示す尺度を用いる。なお、本実施形態では、ファイルの「所有者」、「アクセス権」、及び、「フォルダ」を用いる。ただし、これは、本実施形態を限定するものではない。本実施形態は、例えば、「ファイル名」の一部又は全部を用いる機械学習を実行してもよい。
【0053】
(1)所有者
教師データ作成部5は、プロパティにおける「所有者」を、「営業部」「開発部」及び「人事部」それぞれに対応した3つの名義尺度に分ける。3つ名義尺度は、それぞれ、各部が所有者の場合に「1」、所有者でない場合に「0」となる名義尺度である。例えば、教師データ作成部5は、
図4の3つ目のファイル「c.xlsx」の特徴として、「営業部」に「1」、並びに、「開発部」及び「人事部」に「0」を設定する。
【0054】
(2)アクセス権
教師データ作成部5は、プロパティにおける各部の「アクセス権」を数値又は順序尺度に変換する。例えば、教師データ作成部5は、変換表を用いて、「アクセス権」を数値又は順序尺度に変換する。
図5は、変換表の一例を示す図である。例えば、教師データ作成部5は、
図5の変換表に基づいて、
図4の3つ目のファイル「c.xlsx」の営業部のアクセス権を「1.0」に、開発部のアクセス権を「0.4」に、人事部のアクセス権を「0.0」に変換する。
【0055】
(3)「フォルダ」
教師データ作成部5は、各フォルダに、名義尺度として、0以上の整数を割り当てる。具体的には、教師データ作成部5は、所定の順にファイルのフォルダを確認し、最初に現れるフォルダに「0」を割り当て、以下、新たに表れるフォルダに、1以降の整数を連番に割り当てる。例えば、教師データ作成部5は、
図4の上から順に、最初のフォルダ「¥¥fileServer¥営業部」に「0」を割り当て、次のフォルダ「¥¥fileServer¥営業部¥照会資料」に「1」を割り当る。さらに、教師データ作成部5は、次のフォルダ「¥¥fileServer¥開発部」に「2」を割り当てる。なお、転送先決定装置4は、転送先のフォルダを決定する。そのため、フォルダは、教師データにおける正解ラベルとなる。つまり、後ほど説明する機械学習において、所有者とアクセス権とを用いて判定したフォルダが、
図4の示されているフォルダとなるように、転送先決定モデルの機械学習が実行される。
【0056】
教師データ作成部5は、プロパティに基づいて、上記のような学習用ファイルに含まれるファイルの特徴を抽出する。
図6は、教師データ作成部5が、
図4のファイルのプロパティに基づいて抽出したファイルの特徴の一例を示す図である。例えば、教師データ作成部5は、
図4の3つ目のファイル「c.xlsx」の特徴として、
図6の3行目のフォルダ「1」、所有者「1、0、0」、及び、アクセス権「1.0、0.4、0.0」を抽出する。そして、教師データ作成部5は、教師データとして、抽出したファイルの特徴を記憶装置3に保存する。例えば、教師データ作成部5は、教師データとして、
図6の特徴を保存する。
【0057】
次に、図面を参照して、学習部6の動作を説明する。
図7は、学習部6の動作の一例を示すフロー図である。学習部6は、記憶装置3から教師データ、つまり、教師データ作成部5が抽出した特徴を取得する(ステップS201)。なお、学習部6は、教師データ作成部5から教師データを取得してもよい。そして、学習部6は、取得した教師データを用いた教師あり機械学習を実行して、ファイルを転送するフォルダに関連する情報を出力する転送先決定モデルを生成する(ステップS202)。学習部6は、一般的な機械学習により、転送先決定モデルを生成する。一般的な機械学習とは、サポートベクターマシーン、ナイーブベイズ、又は、ニューラルネットワークなどである。ただし、学習部6は、他の機械学習により転送先決定モデルを生成してもよい。このように、機械学習を用いるため、学習部6は、利用者などにおけるパラメータの調整作業を必要とせずに、パラメータが調整された転送先決定モデルを生成できる。そして、学習部6は、生成した転送先決定モデルを、記憶装置3に保存する(ステップS203)。なお、学習部6は、生成した転送先決定モデルを転送先決定部7に出力してもよい。
【0058】
次に、図面を参照して、転送先決定部7の動作を説明する。ただし、以下の説明は、転送先決定モデルが複数の転送先フォルダを選択する場合における転送先決定部7の動作の説明である。転送先決定モデルが一つの転送先フォルダを選択する場合、転送先決定部7は、転送先決定モデルが選択した転送先フォルダを、ファイルの転送に関連する情報として保存すればよい。
【0059】
図8は、動作の説明に用いる転送元ファイルサーバ1におけるフォルダ構成を示す図である。
図8において、「フォルダA」は、最上位のフォルダである。以下、「フォルダA」のアクセス権をアクセス権Aと呼ぶ。なお、最上位のフォルダは、「ルートフォルダ」と呼ばれる場合もある。さらに、「フォルダA」は、「フォルダB」及び「フォルダC」を保存するフォルダである。フォルダを保存するフォルダは、保存されているフォルダの「親フォルダ」と呼ばれる場合もある。つまり、「フォルダA」は、「フォルダB」及び「フォルダC」の親フォルダである。反対に、「フォルダB」及び「フォルダC」は、「フォルダA」に直接的に保存されている下位のフォルダである。直接的に保存されている下位のフォルダは、「子フォルダ」と呼ばれる場合もある。つまり、「フォルダB」及び「フォルダC」は、「フォルダA」の子フォルダある。同様に、「フォルダC」は、「フォルダD」及び「フォルダE」の親フォルダである。また、「フォルダD」及び「フォルダE」は、「フォルダC」の子フォルダである。
【0060】
そして、「フォルダB」は、継承のフォルダである。つまり、「フォルダB」のアクセス権は、親フォルダである「フォルダA」のアクセス権Aと同じアクセス権Aである。「フォルダC」は、非継承のフォルダである。つまり、「フォルダC」のアクセス権は、親フォルダである「フォルダA」のアクセス権Aとは異なるアクセス権である。以下、「フォルダC」のアクセス権をアクセス権Bと呼ぶ。「フォルダD」は、継承のフォルダである。つまり、「フォルダD」のアクセス権は、親フォルダである「フォルダC」のアクセス権Bと同じアクセス権Bである。「フォルダE」は、非継承のフォルダである。つまり、「フォルダE」のアクセス権は、親フォルダである「フォルダC」のアクセス権Bとは異なるアクセス権である。以下、「フォルダE」のアクセス権をアクセス権Cと呼ぶ。
【0061】
なお、
図8において、継承のフォルダ及び非継承のフォルダは、一つであるが、これは一例である。継承のフォルダ及び非継承のフォルダの少なくとも一方は、複数でもよい。また、
図8において、子フォルダの数は一例である。図示していないが、フォルダAないしフォルダEの少なくとも一つは、さらに、子フォルダを含んでもよい。この場合、図示しない子フォルダは、さらに子フォルダを含んでもよい。このようにフォルダの階層の数は、適宜設定可能であり、制限されない。そこで、以下の説明では、フォルダの下位となるフォルダをまとまて、「配下のフォルダ」と呼ぶ場合もある。
【0062】
転送先決定部7は、
図8に示されている転送元ファイルサーバ1のフォルダの中で、フォルダ構成を維持できないフォルダのファイルを転送する転送先フォルダとして、転送先ファイルサーバ9におけるいずれかのフォルダを決定する。ここで、「フォルダC」は、非継承のフォルダである。そのため、「フォルダC」及び「フォルダCの配下のフォルダ」は、「フォルダA」に対して非継承のフォルダであり、転送元ファイルサーバ1におけるフォルダ構成を維持して転送先ファイルサーバ9にファイルを転送できないフォルダである。そのため、ファイル転送装置8は、「フォルダC」及び「フォルダCの配下のフォルダ」のファイルを、転送元ファイルサーバ1におけるフォルダ構成を維持しながら転送先ファイルサーバ9に転送できない。転送先ファイルサーバ9及び転送元ファイルサーバ1において、同じ構成を維持するフォルダは、ルートフォルダの「フォルダA」、及び、その継承のフォルダである「フォルダB」である。そこで、ファイル転送装置8は、転送先ファイルサーバ9における「フォルダA」及び「フォルダB」のいずれかに、転送元ファイルサーバ1の「フォルダC」及び「フォルダCの配下のフォルダ」に保存されているファイルを転送する。
【0063】
つまり、転送先決定装置4の転送先決定部7は、転送元ファイルサーバ1の「フォルダC」及び「フォルダCの配下のフォルダ」における転送対象のファイルの転送先として、転送先ファイルサーバ9の「フォルダA」及び「フォルダB」のどちらかを決定する。以下、一例として、転送先決定部7は、転送元ファイルサーバ1の非継承である「フォルダC」に含まれるファイルXの転送先として、転送先ファイルサーバ9の「フォルダA」及び「フォルダB」のどちらかを決定する。さらに、転送先決定部7は、「フォルダCの配下のフォルダ」である「フォルダD」に含まれるファイルYの転送先として、転送先ファイルサーバ9の「フォルダA」及び「フォルダB」のどちらかを決定する。
【0064】
図9は、転送先決定部7の動作の一例を示すフロー図である。転送先決定部7は、記憶装置3から転送先決定モデルを取得する(ステップS301)。なお、転送先決定部7は、学習部6から転送先決定モデルを取得してもよい。そして、転送先決定部7は、転送対象となるファイルを含む非継承のフォルダごとにループL1を繰り返す(ステップS302)。
【0065】
「非継承のフォルダごとにループL1を繰り返す」とは、具体的には、互いにフォルダが重ならない「非継承のフォルダ及びその配下のフォルダ」ごとにループL1を繰り返すことである。転送対象となるファイルを含む非継承のフォルダが一つの場合、転送先決定部7は、その非継承フォルダに対してループL1を実行する。転送対象となるファイルを含む非継承のフォルダが複数の場合、転送先決定部7は、上位のフォルダとして非継承フォルダを含まない非継承フォルダを抽出する。つまり、転送先決定部7は、非継承として最上位となるフォルダを抽出する。そして、転送先決定部7は、抽出した「非継承のフォルダ及びその配下のフォルダ」を一つの単位として、ループL1を繰り返す。このように、転送先決定部7は、「非継承のフォルダ及びその配下のフォルダ」をまとめて処理する。そのため、以下の説明では、「非継承のフォルダ及びその配下のフォルダ」をまとめて「非継承のフォルダ」と呼ぶ場合もある。このように、転送先決定部7は、転送対象となるファイルを含み、互いにフォルダが重ならない非継承のフォルダごとにループL1を繰り返す。
【0066】
ループL1において、転送先決定部7は、非継承のフォルダに含まれる転送対象のファイルに対してループL2を繰り返す(ステップS303)。ループL2において、転送先決定部7は、各ファイルについて、転送先決定モデルを適用して転送先フォルダを決定する。ただし、上記の通り、転送先決定モデルは、複数のフォルダを選択する。具体的には、転送先決定モデルは、ファイルX及びファイルYそれぞれに対して、フォルダA及びフォルダBを選択する。そこで、転送先決定部7は、転送先決定モデルから、ファイルそれぞれに対して決定した各フォルダの確信度を取得する。
【0067】
具体的には、転送先決定部7は、転送先決定モデルから、ファイルX及びファイルYそれぞれに対して、決定したフォルダA及びフォルダBに対する確信度を取得する。つまり、転送先決定部7は、フォルダに含まれる転送対象の全てのファイルに対して、転送先のフォルダと、フォルダに対するファイルの確信度とを取得する(ステップS304)。そして、転送先決定部7は、取得した転送先のフォルダと、フォルダに対するファイルの確信度とを記憶装置3に保存する。
【0068】
ループL2が終了、つまり、非継承のフォルダに含まれる転送対象となる全てのファイルの転送先及び確信度を記憶装置3に保存すると、転送先決定部7は、ファイルの確信度に基づいて、ファイルの転送先のフォルダを決定する(ステップS305)。具体的には、転送先決定部7は、転送先のフォルダごとに、ファイルの確信度の調和平均を算出する。そして、転送先決定部7は、調和平均が最大であるフォルダをファイルの転送先のフォルダとして決定する。そして、転送先決定部7は、決定したフォルダを、ファイルの転送に関連する情報として記憶装置3に保存する。
【0069】
図10は、確信度及びその調和平均の一例を示す図である。
図10において、フォルダAの確信度は、ファイルXに対して10%であり、ファイルYに対して40%である。その結果、フォルダAの確信度の調和平均は、16%となる。同様に、フォルダBの確信度の調和平均は、24%である。その結果、転送先決定部7は、ファイルX及びファイルYの転送先として、フォルダBを決定する。そして、転送先決定部7は、ファイルX及びファイルYの転送に関連する情報としてフォルダBを記憶装置3に保存する。転送先決定部7は、ループL1の処理単位となる非継承のフォルダそれぞれに対して、上記の動作を繰り返す。そして、転送先決定部7は、ループL1が終了、つまり、転送対象となるファイルを含む全ての非継承のフォルダに対する処理が終了すると、動作を終了する。
【0070】
ファイル転送装置8は、記憶装置3に保存されたファイルの転送に関連する情報を用いて、ファイルを転送する。ここでは、ファイル転送装置8は、転送元ファイルサーバ1のファイルX及びファイルYを、転送先ファイルサーバ9のフォルダBに転送する。
図11は、転送先ファイルサーバ9におけるファイルの転送後の状態の一例を示す図である。
【0071】
ここまでの説明では、フォルダの継承及び非継承として、アクセス権を用いてきた。例えば、一般的に、クラウドは、オンプレミスと比較して、フォルダのアクセス権の継承及び非継承、並びに、アクセス権の適用先の範囲の設定の自由度が低い場合が多い。そして、オンプレミスからクラウドへのファイルの転送が望まれる場合が多い。そこで、フォルダの継承及び非継承として、アクセス権を用いた。なお、アクセス権の継承とは、具体的には、フォルダにおけるアクセス権が親フォルダと同じであることである。また、アクセス権の非継承とは、フォルダにおけるアクセス権が親フォルダとは異なることである。
【0072】
ただし、フォルダにおける継承及び非継承は、アクセス権に限定されない。フォルダにおける継承及び非継承は、フォルダの任意の属性の継承及び非継承でもよい。例えば、継承及び非継承の対象となる属性は、保存属性(アーカイブ属性)、圧縮属性、及び、暗号化属性の少なくとも一つでもよいし、これらとアクセス権との組合せでもよい。ただし、継承及び非継承の対象となる属性は、上記に限定されず、上記とは異なる属性でもよい。
【0073】
このように構成された転送システム10は、第1実施形態と同様に、パラメータの調整作業を自動化し、適切なパラメータを決定し、フォルダの決定における利用者の負荷を低減する。その理由は、転送システム10の転送先決定装置4が、
図1の転送先決定装置4と同様に動作するためである。つまり、転送システム10の転送先決定装置4が、利用者などでのパラメータの調整作業を必要とせずに、フォルダの属性の体系が異なるファイルサーバ間において、ファイルを転送するフォルダを決定するためである。その結果、転送システム10は、パラメータの調整作業を自動化し、適切な判定基準に基づいてパラメータを決定し、フォルダの属性の体系が異なるファイルサーバ間において、ファイルを転送するフォルダを決定できる。その結果として、転送先決定装置4は、フォルダの決定における利用者の負荷を低減する。さらに、転送システム10のファイル情報取得装置2は、転送先決定モデルを作成するための学習用ファイルを生成する。その結果、転送システム10は、利用者などの工数を削減して、学習用ファイルを作成できる。さらに、転送システム10のファイル転送装置8は、決定されたフォルダに、ファイルを転送する。その結果、転送システム10は、フォルダの属性の体系が異なるファイルサーバ間において、適切なフォルダにファイルを転送できる。
【0074】
ファイルを転送するフォルダを決定する方法としては、例えば、非階層クラスター分析が用いられている。非階層クラスター分析とは、異なる性質のものが混ざり合った集団から、互いに似た性質を持つものを集め、クラスターを作る方法の1つである。なお、非階層クラスター分析は、階層クラスター分析と異なり、階層的な構造を持たないクラスターにデータを分類する方法である。ファイルサーバ間においてファイルを転送するフォルダを決定する場合、非階層クラスター分析は、例えば、性質としてファイルのプロパティを用いて、クラスターとしてファイルを転送するフォルダを分析する。非階層クラスター分析の方法としては、複数の方法がある。例えば、非階層クラスター分析として、k-means法がある。ただし、ファイルを転送するフォルダを決定する方法は、非階層クラスター分析に限定されない。
【0075】
非階層クラスター分析などにおける分析精度を向上するためには、分析におけるパラメータを適切に設定することが必要である。パラメータは、例えば、フォルダの数、又は、分析に用いるファイルのプロパティに対する重みであるが、これに限定されない。そして、一般的に、利用者などが、パラメータを設定している場合が多い。例えば、利用者が、実際のフォルダの分析結果に基づいて、パラメータを調整している。このように、現状のファイルを転送するフォルダの決定は、利用者などでのパラメータの調整作業が必要であり、多くの工数を必要としている。また、人の判断に基づくパラメータの決定は、客観性の確保が難しい。
【0076】
転送先決定装置4は、パラメータの調整作業を自動化し、適切なパラメータを決定する。その結果、転送先決定装置4は、フォルダの決定における利用者の負荷を低減する。さらに、転送先決定装置4は、教師あり機械学習により生成した転送先決定モデルを用いるため、人手による調整に対して、より客観的に、転送先を決定できる。
【0077】
転送先決定部7は、確信度の調和平均に加えて、他の値を用いて転送先フォルダを決定してもよい。例えば、転送先決定部7は、確信度の分散を用いて転送先フォルダを決定してもよい。例えば、転送先決定部7は、次のように動作してもよい。転送先決定部7は、ここまでの説明と同様に、転送先フォルダそれぞれの確信度の調和平均を算出する。そして、転送先決定部7は、調和平均が所定の閾値以上の転送先フォルダを抽出する。あるいは、転送先決定部7は、調和平均が大きい方から所定数の転送先フォルダを抽出する。あるいは、転送先決定部7は、最大の調和平均から所定範囲の調和平均となっている転送先フォルダを抽出する。抽出された転送先フォルダが一つの場合、転送先決定部7は、その転送先フォルダを転送先と決定する。複数の転送先フォルダが抽出された場合、転送先決定部7は、転送先フォルダごとに、ファイルの確信度の分散を算出する。そして、転送先決定部7は、分散が最小の転送先フォルダを転送先として決定する。
【0078】
なお、転送先決定装置4は、ファイルではなくフォルダ単位に動作してもよい。例えば、教師データ作成部5は、フォルダのプロパティを用いて教師データを作成してもよい。そして、学習部6は、フォルダに対する転送先決定モデルを生成してもよい。そして、転送先決定部7は、転送先決定モデルを用いて、フォルダごとに転送先を決定してもよい。なお、転送先決定モデルが複数のフォルダを選択する場合、転送先決定部7は、決定されたフォルダに対して、そのフォルダに転送されるフォルダごとの確信度を取得し、確信度の調和平均が最大となるフォルダを転送先のフォルダと決定してもよい。さらに、転送先決定部7は、フォルダの確信度の分散を用いてもよい。そして、転送先決定装置4がフォルダ単位で動作する場合、ファイル転送装置8は、フォルダ単位にファイルを転送してもよい。
【0079】
なお、フォルダは、一部のファイルシステムにおいて、特別なファイルとして実装されている場合がある。例えば、フォルダは、ファイルを管理する情報保存するファイルとして実装されている場合がある。この場合、「フォルダを転送するフォルダの決定」は、「ファイルを転送するフォルダの決定」と同様の動作となる。つまり、各実施形態における転送先決定装置4の動作は、「ファイルを転送するフォルダの決定する動作」として、「フォルダを転送するフォルダの決定する動作」を含んでもよい。
【0080】
転送システム10は、記憶装置3を含まなくてもよい。つまり、転送システム10に含まれる各装置は、直接的に情報を送信及び受信してもよい。また、転送システム10は、固定した転送元ファイルサーバ1及び転送先ファイルサーバ9ではなく、利用者の要求などに対応して、要求されたファイルサーバ間においてファイルを転送してもよい。つまり、転送システム10は、転送元ファイルサーバ1及び転送先ファイルサーバ9の少なくとも一方を変更してもよい。また、ファイル情報取得装置2は、図示しない記憶装置に保存されて情報を用いてもよい。
【0081】
図12は、転送システム10の別の構成である転送システム11の構成の一例を示すブロック図である。転送システム11は、ファイル情報取得装置2と、転送先決定装置4と、ファイル転送装置8とを含む。転送システム11は、利用者などの要求に対応して、要求された転送元となるファイルサーバ及び転送先となるファイルサーバに接続される。そして、ファイル情報取得装置2、転送先決定装置4、及び、ファイル転送装置8は、直接的に情報を送信及び受信する以外は、
図2の転送システム10と同様に動作する。具体的には、各装置は、次のように動作する。
【0082】
ファイル情報取得装置2は、学習用ファイルを生成し、転送先決定装置4に出力する。例えば、ファイル情報取得装置2は、図示しない記憶装置に保存されている情報を用いて、学習用ファイルを作成し、作成した学習用ファイルを転送先決定装置4に出力する。転送先決定装置4は、ファイル情報取得装置2から学習用ファイルを取得する。転送先決定装置4の教師データ作成部5は、学習用ファイルを用いて教師データを作成する。学習部6は、教師データを用いて転送先決定モデルを生成する。転送先決定部7は、生成した転送先決定モデルを用いて、転送元ファイルサーバの転送元フォルダのファイルの転送先となる転送先ファイルサーバの転送先フォルダを決定する。そして、転送先決定装置4は、決定した転送先フォルダをファイル転送装置8に出力する。ファイル転送装置8は、転送先決定装置4が決定した転送先ファイルサーバの転送先フォルダに、転送元ファイルサーバの転送元フォルダのファイルを転送する。
【0083】
このように構成された転送システム11は、転送システム10と同様の効果を実現できる。つまり、転送システム11は、転送先決定モデルを作成するための学習用ファイルを生成できる。さらに、転送システム11は、学習用ファイルを用いて、転送先決定モデルのパラメータの調整作業を自動化し、適切なパラメータを決定し、フォルダの属性の体系が異なるファイルサーバ間において、ファイルを転送するフォルダを決定できる。さらに、転送システム11は、決定されたフォルダに、ファイルを転送できる。
【0084】
<ハードウェア構成>
次に、転送先決定装置4のハードウェア構成について説明する。転送先決定装置4の各構成部は、ハードウェア回路で構成されてもよい。あるいは、転送先決定装置4において、各構成部は、ネットワークを介して接続した複数の装置を用いて、構成されてもよい。例えば、転送先決定装置4は、クラウドコンピューティングを利用して構成されてもよい。あるいは、転送先決定装置4において、複数の構成部は、1つのハードウェアで構成されてもよい。
【0085】
あるいは、転送先決定装置4は、CPU(Central Processing Unit)と、ROM(Read Only Memory)と、RAM(Random Access Memory)とを含むコンピュータ装置として実現されてもよい。転送先決定装置4は、上記構成に加え、さらに、ネットワークインターフェース回路(NIC:Network Interface Circuit)を含むコンピュータ装置として実現されてもよい。
【0086】
図13は、転送先決定装置4のハードウェア構成の一例を示すブロック図である。転送先決定装置4は、CPU610と、ROM620と、RAM630と、記憶装置640と、NIC650とを含み、コンピュータ装置を構成している。CPU610は、ROM620及び記憶装置640の少なくとも一方からプログラムを読み込む。そして、CPU610は、読み込んだプログラムに基づいて、RAM630と、記憶装置640と、NIC650とを制御する。そして、CPU610を含むコンピュータは、これらの構成を制御し、
図1、2、及び、12に示されている、教師データ作成部5と、学習部6と、転送先決定部7としての各機能を実現する。
【0087】
CPU610は、各機能を実現する際に、RAM630及び記憶装置640の少なくとも一方を、プログラム及びデータの一時的な記憶媒体として使用してもよい。また、CPU610は、コンピュータで読み取り可能にプログラムを記憶した記録媒体690が含むプログラムを、図示しない記録媒体読み取り装置を用いて読み込んでもよい。あるいは、CPU610は、NIC650を介して、図示しない外部の装置からプログラムを受け取り、RAM630及び記憶装置640の少なくとも一方に保存し、保存したプログラムに基づいて動作してもよい。
【0088】
ROM620は、CPU610が実行するプログラム及び固定的なデータを記憶する。ROM620は、例えば、P-ROM(Programmable-ROM)又はフラッシュROMである。RAM630は、CPU610が実行するプログラム及びデータの少なくとも一方を一時的に記憶する。RAM630は、例えば、D-RAM(Dynamic-RAM)である。記憶装置640は、転送先決定装置4が長期的に保存するデータ及びプログラムを記憶する。また、記憶装置640は、CPU610の一時記憶装置として動作してもよい。記憶装置640は、例えば、ハードディスク装置、光磁気ディスク装置、SSD(Solid State Drive)、又は、ディスクアレイ装置である。
【0089】
ROM620と記憶装置640とは、不揮発性(non-transitory)の記録媒体である。一方、RAM630は、揮発性(transitory)の記録媒体である。そして、CPU610は、ROM620、記憶装置640、及び、RAM630の少なくとも一つに記憶されているプログラムに基づいて動作可能である。つまり、CPU610は、不揮発性記録媒体及び揮発性記録媒体の少なくとも一方を用いて動作可能である。
【0090】
NIC650は、ネットワークを介した図示しない外部の装置とのデータのやり取りを中継する。NIC650は、例えば、LAN(Local Area Network)カードである。さらに、NIC650は、有線に限らず、無線を用いてもよい。このように構成された
図13の転送先決定装置4は、
図1、2、及び、12の転送先決定装置4と同様の効果を得ることができる。その理由は、
図13の転送先決定装置4のCPU610が、プログラムに基づいて、
図1などの転送先決定装置4と同様の機能を実現できるためである。
【0091】
なお、ファイル情報取得装置2、及び、ファイル転送装置8の少なくとも一方は、
図13に示されているハードウェアで構成されたコンピュータ装置を用いて実現されてもよい。あるいは、ファイル情報取得装置2、転送先決定装置4、及び、ファイル転送装置8の少なくとも2つ又は全ては、同じハードウェアで構成されたコンピュータ装置を用いて実現されてもよい。あるいは、ファイル情報取得装置2、転送先決定装置4、又は、ファイル転送装置8のいずれかが、記憶装置3を含んでいてもよい。あるいは、学習装置41、又は、転送先決定装置42は、
図13に示されているハードウェアで構成されたコンピュータ装置を用いて実現されてもよい。
【0092】
上記の実施形態の一部又は全部は、以下の付記のようにも記載されうるが、以下には限られない。
【0093】
(付記1)
学習用ファイルを用いて教師データを作成する教師データ作成手段と、
教師データを使用する教師あり機械学習により、転送元ファイルサーバの転送元フォルダのファイルのプロパティの入力に応じて、転送先となる転送先ファイルサーバの転送先フォルダに関する情報を出力する転送先決定モデルを生成する学習手段と
を含む学習装置。
【0094】
(付記2)
転送元ファイルサーバの転送元フォルダのファイルの転送先となる転送先ファイルサーバの転送先フォルダに関する情報を出力する転送先決定モデルを用いて、転送元ファイルサーバの転送元フォルダのファイルの転送先となる転送先ファイルサーバの転送先フォルダを決定する転送先決定手段
を含む転送先決定装置。
【0095】
(付記3)
学習用ファイルを用いて教師データを作成する教師データ作成手段と、
教師データを使用する教師あり機械学習により、転送元ファイルサーバの転送元フォルダのファイルのプロパティの入力に応じて、転送先となる転送先ファイルサーバの転送先フォルダに関する情報を出力する転送先決定モデルを生成する学習手段と、
転送先決定モデルを用いて、転送元ファイルサーバの転送元フォルダのファイルの転送先となる転送先ファイルサーバの転送先フォルダを決定する転送先決定手段と
を含む転送先決定装置。
【0096】
(付記4)
転送先決定モデルが複数の転送先フォルダを選択する場合、転送先決定手段は、転送先決定モデルが選択した転送元フォルダそれぞれに対する、転送元フォルダにおけるファイルの確信度に基づいて、転送元フォルダのファイルを転送する転送先フォルダを決定する
付記3に記載の転送先決定装置。
【0097】
(付記5)
転送先決定手段は、確信度の調和平均に基づいて転送先フォルダを決定する
付記4に記載の転送先決定装置。
【0098】
(付記6)
転送先決定手段は、確信度の分散を用いて転送先フォルダを決定する
付記5に記載の転送先決定装置。
【0099】
(付記7)
教師データ作成手段は、学習用ファイルに含まれるファイルのプロパティを用いて教師データを作成する
付記3ないし6のいずれか1項に記載の転送先決定装置。
【0100】
(付記8)
教師データ作成手段は、学習用ファイルに含まれるファイルのプロパティに基づいてファイルの特徴を抽出し、抽出した特徴を用いて教師データを作成する
付記7に記載の転送先決定装置。
【0101】
(付記9)
付記3ないし8のいずれか1項に記載の転送先決定装置と、
学習用ファイルを生成するファイル情報取得装置と、
転送先決定装置が決定した転送先ファイルサーバの転送先フォルダに、転送元ファイルサーバの転送元フォルダのファイルを転送するファイル転送装置と
含む転送システム。
【0102】
(付記10)
学習用ファイルを用いて教師データを作成し、
教師データを使用する教師あり機械学習により、転送元ファイルサーバの転送元フォルダのファイルのプロパティの入力に応じて、転送先となる転送先ファイルサーバの転送先フォルダに関する情報を出力する転送先決定モデルを生成し、
転送先決定モデルを用いて、転送元ファイルサーバの転送元フォルダのファイルの転送先となる転送先ファイルサーバの転送先フォルダを決定する
転送先決定方法。
【0103】
(付記11)
転送先決定装置が、付記10に記載の転送先決定方法を実行し、
ファイル情報取得装置が、学習用ファイルを生成し、
ファイル転送装置が、転送先決定装置が決定した転送先ファイルサーバの転送先フォルダに、転送元ファイルサーバの転送元フォルダのファイルを転送する
転送方法。
【0104】
(付記12)
学習用ファイルを用いて教師データを作成する処理と、
教師データを使用する教師あり機械学習により、転送元ファイルサーバの転送元フォルダのファイルのプロパティの入力に応じて、転送先となる転送先ファイルサーバの転送先フォルダに関する情報を出力する転送先決定モデルを生成する処理と、
転送先決定モデルを用いて、転送元ファイルサーバの転送元フォルダのファイルの転送先となる転送先ファイルサーバの転送先フォルダを決定する処理と
をコンピュータに実行させるプログラムを記録する記録媒体。
【0105】
以上、実施形態を参照して本願発明を説明したが、本願発明は上記実施形態に限定されるものではない。本願発明の構成や詳細には、本願発明のスコープ内で当業者が理解し得る様々な変更をすることができる。
【産業上の利用可能性】
【0106】
本発明は、計算機間の情報転送分野、データ通信分野、及び、オンプレミス-クラウド間でのファイル転送分野などで利用する装置に利用可能である。あるいは、本発明は、共有ストレージなどの機器における、ファイル及びフォルダなどのコンテンツを管理する装置に利用可能である。
【符号の説明】
【0107】
1 転送元ファイルサーバ
2 ファイル情報取得装置
3 記憶装置
4 転送先決定装置
5 教師データ作成部
6 学習部
7 転送先決定部
8 ファイル転送装置
9 転送先ファイルサーバ
10 転送システム
41 学習装置
42 転送先決定装置
610 CPU
620 ROM
630 RAM
640 記憶装置
650 NIC
690 記録媒体