(19)【発行国】日本国特許庁(JP)
(12)【公報種別】公表特許公報(A)
(11)【公表番号】
(43)【公表日】2024-03-07
(54)【発明の名称】デジタルコンテンツ保持期間の動的判定
(51)【国際特許分類】
G06F 16/907 20190101AFI20240229BHJP
【FI】
G06F16/907
【審査請求】未請求
【予備審査請求】未請求
(21)【出願番号】P 2023556774
(86)(22)【出願日】2022-03-07
(85)【翻訳文提出日】2023-09-14
(86)【国際出願番号】 CN2022079544
(87)【国際公開番号】W WO2022193977
(87)【国際公開日】2022-09-22
(32)【優先日】2021-03-16
(33)【優先権主張国・地域又は機関】US
(81)【指定国・地域】
【公序良俗違反の表示】
(特許庁注:以下のものは登録商標)
(71)【出願人】
【識別番号】390009531
【氏名又は名称】インターナショナル・ビジネス・マシーンズ・コーポレーション
【氏名又は名称原語表記】INTERNATIONAL BUSINESS MACHINES CORPORATION
【住所又は居所原語表記】New Orchard Road, Armonk, New York 10504, United States of America
(74)【代理人】
【識別番号】100112690
【氏名又は名称】太佐 種一
(74)【代理人】
【識別番号】100120710
【氏名又は名称】片岡 忠彦
(74)【復代理人】
【識別番号】100104880
【氏名又は名称】古部 次郎
(74)【復代理人】
【識別番号】100118108
【氏名又は名称】久保 洋之
(72)【発明者】
【氏名】ゴーシュ、パルト
(72)【発明者】
【氏名】ペルマラ、サラスワティ、サイラジャ
(72)【発明者】
【氏名】マンタ、ディヴィア
(72)【発明者】
【氏名】ナヤック、スニタ、ラニ
【テーマコード(参考)】
5B175
【Fターム(参考)】
5B175DA10
5B175FB03
(57)【要約】
提供されるのは、デジタルコンテンツの保持期間を動的に判定するためのコンピュータプログラム製品、システム、および方法である。メタデータは、コンピューティング装置のユーザによるデジタルコンテンツのアクセスパターン、デジタルコンテンツの属性、および記憶されたデジタルコンテンツがストレージに保持される保持期間を含むデジタルコンテンツのインスタンスのために生成される。機械学習モジュールは、デジタルコンテンツの保持期間を生成するために、デジタルコンテンツのインスタンスのメタデータを含む入力を用いて訓練される。機械学習モジュールの訓練後に受信した、デジタルコンテンツから判定されたメタデータを含む入力は、訓練後に受信したデジタルコンテンツの出力保持期間を生成するために、機械学習モジュールに提供される。出力保持期間は、訓練後に受信したデジタルコンテンツをストレージから削除するタイミングを判定するために使用される。
【特許請求の範囲】
【請求項1】
コンピューティング装置によって使用されるストレージ内のデジタルコンテンツを管理するためのコンピュータプログラム製品であって、前記コンピュータプログラム製品は、実行されると動作を引き起こすプログラム命令をその中に実装したコンピュータ可読記憶媒体を含み、前記動作は、
デジタルコンテンツのインスタンスのメタデータを生成することであって、前記メタデータは、前記コンピューティング装置のユーザによる前記デジタルコンテンツのアクセスパターン、前記デジタルコンテンツの属性、および記憶された前記デジタルコンテンツが前記ストレージに保持される保持期間を含む、生成することと、
前記デジタルコンテンツの前記保持期間を生成するために、前記デジタルコンテンツのインスタンスの前記メタデータを含む入力を用いて機械学習モジュールを訓練することと、
前記機械学習モジュールの訓練後に受信した、デジタルコンテンツから判定されたメタデータを含む入力を、前記訓練後に受信した前記デジタルコンテンツの出力保持期間を生成するために、前記機械学習モジュールに提供することと、
前記訓練後に受信した前記デジタルコンテンツを前記ストレージから削除するタイミングを判定するために、前記出力保持期間を使用することと、
を含む、コンピュータプログラム製品。
【請求項2】
前記デジタルコンテンツの前記属性は、前記デジタルコンテンツの発信者、前記デジタルコンテンツをメッセージで前記コンピューティング装置に送信した送信者、前記コンピューティング装置に送信されたときに前記デジタルコンテンツに埋め込まれたメタデータ、分類プログラムによって判定された前記デジタルコンテンツの分類、前記送信者が属するグループ、前記デジタルコンテンツの以前に受信したデジタルコンテンツに対する関係、および関連するカレンダーイベントの少なくとも1つを含む、請求項1に記載のコンピュータプログラム製品。
【請求項3】
前記動作は、
デジタルコンテンツを受信したことに応答して、
前記受信したデジタルコンテンツが、デジタルコンテンツの別個のインスタンスを構成するデジタルコンテンツのセグメントを含むかどうかを判定することを実行することと、
前記受信したデジタルコンテンツが前記セグメントを含むと判定することに応答して、前記受信したデジタルコンテンツをデジタルコンテンツの前記セグメントに解析することであって、前記メタデータが前記セグメントに対して生成され、前記セグメントに対する出力保持期間を生成するために、前記機械学習モジュールが、前記セグメントに対して生成された前記メタデータを含む入力で前記デジタルコンテンツの前記セグメントに対して別々に訓練される、解析することと、
をさらに含む、請求項1に記載のコンピュータプログラム製品。
【請求項4】
前記デジタルコンテンツの少なくとも1つのインスタンスは、添付ファイルを有するメッセージを含み、前記セグメントは前記メッセージおよび前記添付ファイルを含み、前記機械学習モジュールは前記セグメントに対して異なる保持期間を生成する、請求項3に記載のコンピュータプログラム製品。
【請求項5】
前記動作は、
前記メッセージの内容の自然言語処理(NLP)に基づいてメッセージ分類を判定するために、前記メッセージの前記内容の前記NLPを実行することであって、前記メッセージ分類は、前記メッセージを含む前記セグメントの前記出力保持期間を生成するために前記機械学習モジュールを訓練する入力として提供される、実行することをさらに含む、
請求項4に記載のコンピュータプログラム製品。
【請求項6】
前記動作は、
前記デジタルコンテンツのセグメントについて、前記セグメントのコンテンツのセグメント分類を、前記セグメント内のコンテンツのメディアフォーマットに基づいて生成するために、機械学習解析ツールを判定することであって、前記セグメントに対して生成されて前記機械学習モジュールに入力される前記メタデータは、前記セグメントに対して判定された前記機械学習解析ツールによって判定されたセグメント分類を含む、判定することをさらに含む、
請求項3に記載のコンピュータプログラム製品。
【請求項7】
前記出力保持期間は、前記デジタルコンテンツの前記保持期間に対する隔離期間および削除期間を含み、前記隔離期間の満了後に前記デジタルコンテンツが隔離して示され、前記デジタルコンテンツが前記隔離して示されたときに開始された前記削除期間の満了に応答して前記隔離中の前記デジタルコンテンツが前記ストレージから削除され、前記機械学習モジュールを前記訓練することは、前記デジタルコンテンツに対する前記入力に基づいて前記隔離期間および前記削除期間を出力として生成するように前記機械学習モジュールを訓練することを含む、請求項1に記載のコンピュータプログラム製品。
【請求項8】
前記動作は、
ストレージに保持するためにデジタルコンテンツを前記隔離から削除するユーザ選択を受信することと、
前記隔離から削除する前記デジタルコンテンツが前記隔離中でないことを示すことと、
前記隔離から削除するために前記デジタルコンテンツに対して判定された前記保持期間よりも長い新たな保持期間を判定することと、
前記新たな保持期間を出力として生成する前記機械学習モジュールを再学習させるために、前記隔離から削除する前記デジタルコンテンツから判定されたメタデータを含む入力を前記機械学習モジュールに提供することと、
をさらに含む、請求項7に記載のコンピュータプログラム製品。
【請求項9】
前記動作は、
前記機械学習モジュールによって保持期間が判定されたデジタルコンテンツを削除するための選択を受信することと、
前記デジタルコンテンツが削除された時期に基づく前記削除されたデジタルコンテンツの実際の保持期間が、前記出力保持期間と異なるか否かを判定することと、
前記実際の保持期間を出力として生成するために、前記削除されたデジタルコンテンツの前記メタデータを入力として用いて前記機械学習モジュールを再学習することと、
をさらに含む、請求項1に記載のコンピュータプログラム製品。
【請求項10】
ストレージ内のデジタルコンテンツを管理するためにストレージに結合されたシステムであって、前記システムは、
プロセッサと、
前記プロセッサによって実行されると動作を引き起こすプログラム命令を有するコンピュータ可読記憶媒体であって、前記動作は、
コンピューティング装置に記憶されたデジタルコンテンツのインスタンスのメタデータを生成することであって、前記メタデータは、前記コンピューティング装置のユーザによる前記デジタルコンテンツのアクセスパターン、前記デジタルコンテンツの属性、および記憶された前記デジタルコンテンツが前記ストレージに保持される保持期間を含む、生成することと、
前記デジタルコンテンツの前記保持期間を生成するために、前記デジタルコンテンツのインスタンスの前記メタデータを含む入力を用いて機械学習モジュールを訓練することと、
前記機械学習モジュールの訓練後に受信した、デジタルコンテンツから判定されたメタデータを含む入力を、前記訓練後に受信した前記デジタルコンテンツの出力保持期間を生成するために、前記機械学習モジュールに提供することと、
前記訓練コンテンツ後に受信した前記デジタルを前記ストレージから削除するタイミングを判定するために、前記出力保持期間を使用することと、
を含む、システム。
【請求項11】
前記動作は、
デジタルコンテンツを受信したことに応答して、
前記受信したデジタルコンテンツが、デジタルコンテンツの別個のインスタンスを構成するデジタルコンテンツのセグメントを含むかどうかを判定することを実行することと、
前記受信したデジタルコンテンツが前記セグメントを含むと判定することに応答して、前記受信したデジタルコンテンツをデジタルコンテンツの前記セグメントに解析することであって、前記メタデータが前記セグメントに対して生成され、前記セグメントに対する出力保持期間を生成するために、前記機械学習モジュールが、前記セグメントに対して生成された前記メタデータを含む入力で前記デジタルコンテンツの前記セグメントに対して別々に訓練される、解析することと、
をさらに含む、請求項10に記載のシステム。
【請求項12】
前記デジタルコンテンツの少なくとも1つのインスタンスは、添付ファイルを有するメッセージを含み、前記セグメントは前記メッセージおよび前記添付ファイルを含み、前記機械学習モジュールは前記セグメントに対して異なる保持期間を生成する、請求項11に記載のシステム。
【請求項13】
前記動作は、
前記デジタルコンテンツのセグメントについて、前記セグメントのコンテンツのセグメント分類を、前記セグメント内のコンテンツのメディアフォーマットに基づいて生成するために、機械学習解析ツールを判定することであって、前記セグメントに対して生成されて前記機械学習モジュールに入力される前記メタデータは、前記セグメントに対して判定された前記機械学習解析ツールによって判定されたセグメント分類を含む、判定することをさらに含む、
請求項11に記載のシステム。
【請求項14】
前記出力保持期間は、前記デジタルコンテンツの前記保持期間に対する隔離期間および削除期間を含み、前記隔離期間の満了後に前記デジタルコンテンツが隔離して示され、前記デジタルコンテンツが前記隔離して示されたときに開始された前記削除期間の満了に応答して前記隔離中の前記デジタルコンテンツが前記ストレージから削除され、前記機械学習モジュールを前記訓練することは、前記デジタルコンテンツに対する前記入力に基づいて前記隔離期間および前記削除期間を出力として生成するように前記機械学習モジュールを訓練することを含む、請求項10に記載のシステム。
【請求項15】
前記動作は、
前記機械学習モジュールによって保持期間が判定されたデジタルコンテンツを削除するための選択を受信することと、
前記デジタルコンテンツが削除された時期に基づく前記削除されたデジタルコンテンツの実際の保持期間が、前記出力保持期間と異なるか否かを判定することと、
前記実際の保持期間を出力として生成するために、前記削除されたデジタルコンテンツの前記メタデータを入力として用いて前記機械学習モジュールを再学習することと、
をさらに含む、請求項10に記載のシステム。
【請求項16】
コンピューティング装置によって使用されるストレージ内のデジタルコンテンツを管理するためのコンピュータ実装方法であって、
デジタルコンテンツのインスタンスのメタデータを生成することであって、前記メタデータは、前記コンピューティング装置のユーザによる前記デジタルコンテンツのアクセスパターン、前記デジタルコンテンツの属性、および記憶された前記デジタルコンテンツが前記ストレージに保持される保持期間を含む、生成することと、
前記デジタルコンテンツの前記保持期間を生成するために、前記デジタルコンテンツのインスタンスの前記メタデータを含む入力を用いて機械学習モジュールを訓練することと、
前記機械学習モジュールの訓練後に受信した、デジタルコンテンツから判定されたメタデータを含む入力を、前記訓練後に受信した前記デジタルコンテンツの出力保持期間を生成するために、前記機械学習モジュールに提供することと、
前記訓練後に受信した前記デジタルコンテンツを前記ストレージから削除するタイミングを判定するために、前記出力保持期間を使用することと、
を含む、方法。
【請求項17】
デジタルコンテンツを受信したことに応答して、
前記受信したデジタルコンテンツが、デジタルコンテンツの別個のインスタンスを構成するデジタルコンテンツのセグメントを含むかどうかを判定することを実行することと、
前記受信したデジタルコンテンツが前記セグメントを含むと判定することに応答して、前記受信したデジタルコンテンツをデジタルコンテンツの前記セグメントに解析することであって、前記メタデータが前記セグメントに対して生成され、前記セグメントに対する出力保持期間を生成するために、前記機械学習モジュールが、前記セグメントに対して生成された前記メタデータを含む入力で前記デジタルコンテンツの前記セグメントに対して別々に訓練される、解析することと、
をさらに含む、請求項16に記載の方法。
【請求項18】
前記デジタルコンテンツの少なくとも1つのインスタンスは、添付ファイルを有するメッセージを含み、前記セグメントは前記メッセージおよび前記添付ファイルを含み、前記機械学習モジュールは前記セグメントに対して異なる保持期間を生成する、請求項17に記載の方法。
【請求項19】
前記デジタルコンテンツのセグメントについて、前記セグメントのコンテンツのセグメント分類を、前記セグメント内のコンテンツのメディアフォーマットに基づいて生成するために、機械学習解析ツールを判定することであって、前記セグメントに対して生成されて前記機械学習モジュールに入力される前記メタデータは、前記セグメントに対して判定された前記機械学習解析ツールによって判定されたセグメント分類を含む、判定することをさらに含む、
請求項17に記載の方法。
【請求項20】
前記出力保持期間は、前記デジタルコンテンツの前記保持期間に対する隔離期間および削除期間を含み、前記隔離期間の満了後に前記デジタルコンテンツが隔離して示され、前記デジタルコンテンツが前記隔離して示されたときに開始された前記削除期間の満了に応答して前記隔離中の前記デジタルコンテンツが前記ストレージから削除され、前記機械学習モジュールを前記訓練することは、前記デジタルコンテンツに対する前記入力に基づいて前記隔離期間および前記削除期間を出力として生成するように前記機械学習モジュールを訓練することを含む、請求項16に記載の方法。
【発明の詳細な説明】
【技術分野】
【0001】
本発明は、デジタルコンテンツの保持期間を動的に判定するためのコンピュータプログラム製品、システム、および方法に関するものである。
【背景技術】
【0002】
スマートフォンやタブレットなどのポータブルコンピューティング装置は、ストレージ容量が限られている。ポータブルコンピューティング装置には、ファイル共有アプリケーション、チャットアプリケーション、ソーシャルメディアアプリケーションなどがインストールされていることが多く、写真、ビデオ、ウェブページなどのデジタルコンテンツが添付されたメッセージを受信および送信する。メッセージと共に受信される添付ファイルが急増すると、ポータブルコンピューティング装置のストレージが最大限に使用されるようになる可能性がある。さらに、デジタルメディアファイルが追加されると、付属のクラウドストレージの容量も限界に達することがある。ストレージが限界レベルに達していることに気づいたユーザは、空き容量を確保するためにファイルを手動で削除する必要があるかもしれないが、これには非常に時間がかかり、全体的に不快なユーザ体験となる可能性がある。
【0003】
メッセージやファイル共有アプリケーションを通じて受信したデジタルメディアファイルなど、ストレージ内のファイルの保持を管理するための改善された技術が当技術分野で必要とされている。
【発明の概要】
【0004】
提供されるのは、デジタルコンテンツの保持期間を動的に判定するためのコンピュータプログラム製品、システム、および方法である。メタデータは、コンピューティング装置のユーザによるデジタルコンテンツのアクセスパターン、デジタルコンテンツの属性、および記憶されたデジタルコンテンツがストレージに保持される保持期間を含む、コンピューティング装置に記憶されるデジタルコンテンツのインスタンスのために生成される。機械学習モジュールは、デジタルコンテンツの保持期間を生成するために、デジタルコンテンツのインスタンスのメタデータを含む入力を用いて訓練される。機械学習モジュールの訓練後に受信した、デジタルコンテンツから判定されたメタデータを含む入力は、訓練後に受信したデジタルコンテンツの出力保持期間を生成するために、機械学習モジュールに提供される。出力保持期間は、訓練後に受信したデジタルコンテンツをストレージから削除するタイミングを判定するために使用される。
【図面の簡単な説明】
【0005】
【
図1】デジタルコンテンツが管理されるコンピューティング装置の一実施形態を示す図である。
【
図2】データコンテンツメタデータの一実施形態を示す図である。
【
図3】デジタルコンテンツの保持期間のインスタンスの一実施形態を示す図である。
【
図4】受信したデジタルコンテンツの保持期間を判定する動作の一実施形態を示す図である。
【
図5】隔離期間および削除期間に関してデジタルコンテンツを管理するための動作の一実施形態を示す図である。
【
図6】デジタルコンテンツのレビューおよびデジタルコンテンツを隔離から削除する要求を含む、デジタルコンテンツへのユーザアクセスを処理する操作の一実施形態を示す図である。
【
図7】保持機械学習モジュール(MLM)を訓練させる動作の一実施形態を示す図である。
【
図8】デジタルメディアコンテンツのユーザ削除を処理するための動作の一実施形態を示す図である。
【
図9】
図1の構成要素が実装され得るコンピューティング環境を示す図である。
【発明を実施するための形態】
【0006】
記述された実施形態は、ポータブルコンピューティング装置などのコンピューティング装置で受信したデジタルコンテンツの、コンピューティング装置のストレージへの保持を管理するためのコンピュータ技術の改善を提供する。メッセージアプリケーションおよびファイル共有アプリケーションを通じてファイル共有が普及するにつれて、通信を受信するポータブルコンピューティング装置によって使用されるローカルおよびクラウドストレージは、ストレージ容量の限界に達することがある。記載された実施形態は、デジタルコンテンツのアクセスパターンおよび属性に基づいて、メッセージに添付されたデジタルコンテンツの複数のインスタンスを含むデジタルコンテンツに保持期間を割り当てるための改善された技術を提供する。記載された実施形態では、保持機械学習モジュールは、デジタルコンテンツの訓練セットにおけるデジタルコンテンツのメタデータを含む入力で訓練され、デジタルコンテンツの保持期間を出力として生成する。その後、メッセージやファイル共有などを通じてデジタルコンテンツを受信すると、保持機械学習モジュールは、デジタルコンテンツのメタデータおよびデジタルコンテンツの分類に基づいてデジタルコンテンツの保持期間を判定するために使用されることがある。判定された保持期間は、次に、デジタルコンテンツを期限切れにして削除するタイミングを判定するために使用され得る。このように、デジタルコンテンツのメタデータおよび分類に基づく保持機械学習モジュールを用いて、受信したデジタルコンテンツに保持期間を割り当てることができるため、ユーザは、通信で受信したファイルを定期的に手動で削除する必要がない。
【0007】
図1は、実施形態が実装されるコンピューティング装置100を示す。コンピューティング装置100は、プロセッサ102とメインメモリ104を含む。メインメモリ104は、システム100の動作およびコンポーネント間の動作の流れを管理するオペレーティングシステム108と、受信したデジタルコンテンツ112をデジタルコンテンツストレージ114に保持し記憶するための保持期間を判定するための動作の全体的な流れを管理する保持マネージャ110とを含む種々のプログラムコンポーネントおよびデータ構造体を含む。保持マネージャ110は、受信したデジタルコンテンツ112をコンテンツパーサ116に提供し、デジタルコンテンツが解析されたセグメント118
iを有する場合、デジタルコンテンツ112の異なるファイルまたは部分を含む解析されたセグメント118
1、118
2...118
nにコンテンツを解析する。例えば、デジタルコンテンツ112がメッセージを含む場合、メッセージは、異なるメディアフォーマットの異なるファイルの1つまたは複数の添付ファイルを有することができる。メッセージおよび添付ファイルは、解析されたセグメント118
1、118
2...118
nを含む。さらに、デジタルコンテンツ112は、複数のセグメント118または異なるファイルを有する圧縮ファイルを含む場合がある。
【0008】
解析されたセグメント118または単一のデジタルコンテンツ112のファイルは、提供されたデジタルコンテンツ112または解析されたセグメント118のコンテンツを注釈付けし分類することができるML解析ツール1201、1202...120mを選択する機械学習(ML)解析ツール選択モジュール120に提供される。例えば、セグメント118iまたはデジタルコンテンツ112がテキストで構成されている場合、ML解析ツール1201は、入力セグメント118iまたはデジタルコンテンツ112の分類を判定する、例えば、Watson(商標) Natural Language Processorプログラムなどの自然言語プロセッサ(NLP)を含んでよい。他のタイプのメディアフォーマットの場合、異なるML解析ツール1202...120および分類プログラムを使用して、デジタルコンテンツ112またはセグメント118iを異なるメディアフォーマット(例えば静止画像、ビデオ、オーディオなど)から、画像およびビデオ解析、深層学習などの1または複数の分類器に分類することができる。ML解析ツール選択120の結果は、解析されたセグメント1181、1182...118nまたはデジタルコンテンツ112のコンテンツの機械学習分類を提供する1または複数のセグメント分類1221、1222...122nを含むセグメント分類122である。分類1221、1222...122nは、ハッシュタグ、テキストまたは他の分類コードを含む場合がある。(WatsonはInternational Business Machines Corporationの全世界における商標である)。
【0009】
デジタルコンテンツ112は、さらにメタデータマネージャ124に提供され、解析されたセグメント118
iの各々について、単一のデジタルコンテンツ112またはメタデータインスタンス200
iのデジタルコンテンツメタデータ200(
図2)を生成する。セグメント分類122
1、122
2...122
n、および各セグメント118
iについて1つのデジタルコンテンツメタデータ200は、デジタルコンテンツ112の保持期間300、または各セグメント118
iについて1つの保持期間を出力として生成する保持機械学習モジュール(MLM)126に入力として提供される。
【0010】
保持期間300(
図3)は、隔離期間304と削除期間306の構成要素で構成され得る。隔離期間304は、デジタルコンテンツ112を受信したときからの期間を指し、隔離期間304の満了後、デジタルコンテンツ112/セグメント118
iが隔離して示されるようにする。削除期間306は、デジタルコンテンツ112が隔離されたときからの期間のことを指し、削除期間306の満了後、隔離されたデジタルコンテンツ112/セグメント118
iが削除され、ストレージ114から削除される。隔離されたデジタルコンテンツ112/セグメント118
iは、グラフィカルユーザインターフェース(GUI)を含む隔離ビュー117でコンピューティング装置100のユーザに提示され、ユーザは、デジタルコンテンツ112/セグメント118
iをストレージ114から削除するか、ストレージ114に保持するために隔離から削除するかを選択できる場合がある。
【0011】
デジタルコンテンツマネージャ128は、メタデータ200を更新するタイミングを判定するために、およびデジタルコンテンツのメタデータ200の訓練セットに基づいて保持MLM126を再学習するために、デジタルコンテンツ112/セグメント118iへのアクセスを管理する。
【0012】
メモリ104は、フラッシュメモリ(フラッシュメモリセルのNANDダイ)、不揮発性デュアルインラインメモリモジュール(NVDIMM)、DIMM、静的ランダムアクセスメモリ(SRAM)、強誘電体ランダムアクセスメモリ(FeTRAM)、ランダムアクセスメモリ(RAM)ドライブ、ダイナミックRAM(DRAM)、ストレージクラスメモリ(SCM)、相変化メモリ(PCM)、抵抗性ランダムアクセスメモリ(RRAM)、スピン転移トルクメモリ(STM-RAM)、導電性ブリッジングRAM(CBRAM)、ナノワイヤ型不揮発性メモリ、磁気抵抗ランダムアクセスメモリ(MRAM)などの不揮発性メモリタイプもしくは揮発性メモリタイプまたはその両方、および他の電気的消去可能プログラム可能読み取り専用メモリ(EEPROM)型デバイス、ハードディスクドライブ、取り外し可能メモリ/ストレージデバイスなどを含んでよい。ストレージ114は、上述のそれらの不揮発性メモリデバイスを含む、適切な不揮発性ストレージまたはメモリデバイスを含み得る。
【0013】
代替実施形態では、ストレージ114は、クラウドストレージアカウントがその最大ストレージ容量に達するのを避けるためにユーザがデジタルコンテンツの保持を制限したいように、最大容量を有するクラウドストレージを備える場合がある。
【0014】
ユーザコンピューティング装置100は、ラップトップ、デスクトップコンピュータ、タブレット、スマートフォン、ウェアラブルコンピュータなどのパーソナルコンピューティング装置、またはサーバなどの他のタイプのコンピューティング装置を備える場合がある。
【0015】
一般に、プログラム構成要素108、110、116、120、1201、1202...120m、124、126、128などのプログラムモジュールは、特定のタスクを実行したり特定の抽象データ型を実装するルーチン、プログラム、オブジェクト、コンポーネント、論理、データ構造などを含んでよい。コンピューティング装置のプログラムコンポーネントおよびハードウェアデバイスは、1または複数のコンピュータシステムで実装されてもよく、複数のコンピュータシステムで実装される場合、コンピュータシステムはネットワークを介して通信してもよい。
【0016】
プログラム構成要素108、110、116、120、1201、1202...120m、124、126、および128は、メモリ104からプロセッサ102によってアクセスされて実行され得る。あるいは、プログラム構成要素108、110、116、120、1201、1202、120m、124、126、128の一部または全部は、特定用途向け集積回路(ASIC)ハードウェアデバイスなどの別のハードウェアデバイスに実装されてもよい。
【0017】
プログラム構成要素108、110、116、120、1201、1202...120m、124、126、および128によって実行されるとして説明した機能は、図示よりも少ないプログラムモジュールにプログラムコードとして実装してもよいし、図示よりも多いプログラムモジュール全体にプログラムコードとして実装してもよい。
【0018】
機械学習モジュール126、1202...120mおよび自然言語プロセッサ1201などの構成要素のうちの特定のものは、決定木学習、アソシエーションルールラーニング、ニューラルネットワーク、誘導プログラミング論理、サポートベクターマシン、ベイズネットワークなどの機械学習および深層学習アルゴリズムを用いてよい。人工ニューラルネットワークプログラムの実装の場合、各ニューラルネットワークは、計算された出力を生成するために隠れ層のノードにおける重みおよびバイアスを調整するために後方伝播を使用して訓練され得る。ニューラルネットワーク機械学習モジュールを訓練するために使用される後方伝播では、隠れ層のノードにおけるバイアスは、指定された信頼レベルに基づいて所望の出力保持期間300を生成するように適宜調整される。後方伝播は、勾配降下を使用する人工ニューラルネットワークの教師あり学習のアルゴリズムを含むことができる。人工ニューラルネットワークと誤差関数が与えられると、本方法は、ニューラルネットワークの重みとバイアスに関して誤差関数の勾配を計算してもよい。
【0019】
保持機械学習モジュール126などのニューラルネットワーク機械学習モジュールを訓練するために使用される後方伝播では、計算された保持期間300またはデジタルコンテンツ112がユーザによって削除される前にストレージ114に残っていた実際の時間の差に基づいて、誤差の範囲が判定され、調整された保持期間を生成する。隠れ層のノードにおけるバイアスは、出力された保持期間300における誤差の範囲を減少させるために適宜調整される。
【0020】
図1に示す構成要素とメモリ104内のオブジェクトとの間の矢印は、構成要素間のデータフローを表している。
【0021】
「ユーザ」という用語は、人またはボットのようなコンピュータプロセスを指す場合がある。
【0022】
図2は、デジタルコンテンツ112/セグメント118
iに対して維持されるデータセンターメタデータ200
iの実施形態を示し、データコンテンツ/セグメントID202、コンテンツのメディアフォーマット204(例えば、テキスト、オーディオ、ビデオ、静止画像など)、セグメント202が含まれた含有データコンテンツ206(例えば、セグメント202が添付されたメッセージ、圧縮コンテナなど)、コンテンツを作成する発信者・コンテンツ202を含む送信の送信者・分類122、122
1、122
2...122
nなどの1または複数のデータコンテンツ分類210を含む、コンテンツ202の属性208・122
1、122
2...122
n・コンテンツ202に対してML解析ツール選択120によって生成されたもの、ユーザがデジタルコンテンツ/セグメント202にアクセスした回数を示すアクセス回数212および閲覧パターンを提供するもの、デジタルコンテンツ/セグメント202が受信された受信時間214、デジタルコンテンツ/セグメント202がユーザによってまたは自動的に削除された削除時間216、デジタルコンテンツ/セグメント202に対する隔離期間304が満了した後に発生する、デジタルコンテンツ/セグメント202が隔離中かどうかを示す隔離フラグ218、を含む。
【0023】
メタデータ属性208は、デジタルコンテンツに提供されるユーザ優先度評価、コンテンツの再訪問および閲覧パターンを判定する追加の識別要因、およびユーザコンテンツの削除パターンを判定する識別要因を含むことができる。属性208は、初期メッセージに基づくメッセージのスレッドを形成するメッセージ群の一部など、特定のデジタルコンテンツが一部である関連メッセージおよびデジタルコンテンツを示すことができる。
【0024】
図3は、デジタルコンテンツ112/セグメント118
iに対して保持MLM126が生成する保持期間300
iの実施形態を示す図であり、保持期間300
iが生成されたデジタルコンテンツ112/セグメント118
iのデジタルコンテンツ/セグメント識別子302、生成された隔離期間304、および生成された削除期間306を含む。デジタルコンテンツ112/セグメント118
iの全保持期間は、隔離期間304と削除期間306の合計を含む場合がある。
【0025】
同じ含有データコンテンツ206内のセグメント1181...118nは、異なる時間にアクセスおよび削除され、異なる保持期間300iを有することができる。さらに、保持期間300iは、特定のデジタルコンテンツを決して削除されないようにアーカイブすることを示す場合がある。さらなる実施形態では、保持期間300iは、デジタルコンテンツが保持期間の間保持された後、いつ削除されるかを示す単一の期間を含む場合がある。
【0026】
図4は、受信したデジタルコンテンツ112の保持期間300
iを判定するために、デジタルコンテンツマネージャ128、保持マネージャ、コンテンツパーサ116、メタデータマネージャ124、および保持MLM126によって実行される動作の実施形態を示す図である。インターネットまたはネットワークを介して送信されるメッセージなどのデジタルコンテンツ112を受信すると(ブロック400)、メタデータマネージャ124は、デジタルコンテンツの属性208(例えば、発信者、送信者、コンテンツ内の埋め込みメタデータ、送信者グループ、他のデジタルコンテンツとの関係、関連するカレンダーイベント(例えば、祝日、誕生日などの個人カレンダーイベント、社会イベントなど))を判定し(ブロック402)、受信したデジタルコンテンツ112に対するメタデータ200
iに属性208の一部として追加する。コンテンツパーサ116は、デジタルコンテンツ112が異なるまたは同じメディアフォーマットの複数のセグメントを有するかどうかを判定する(ブロック404)。そうでない場合、ML解析ツール選択120は、受信したデジタルコンテンツ112のメディアフォーマット204に関連するML解析ツール120
iを判定する(ブロック406)。判定されたML解析ツール120
iは、デジタルコンテンツ112を処理し(ブロック408)、デジタルコンテンツ112のコンテンツの1または複数の分類を判定し、判定した分類210をメタデータ200
iに保存する(ブロック410)。
【0027】
(ブロック404で)デジタルコンテンツ112が複数のセグメント1181...118nを有する場合、コンテンツパーサ116は受信したデジタルコンテンツ112をセグメント1181...118nに解析する(ブロック412)。各セグメント118iについて、メタデータマネージャ124は、セグメント118iを含む含有デジタルコンテンツ206(例えば、メッセージ)を示すことを含むセグメントメタデータ200iを生成する(ブロック414)。各セグメント118iについて、ブロック416~418の動作は、セグメント118iのセグメント分類122iを判定するために実行される(ブロック416)。
【0028】
ブロック410または416から、(ブロック418で)デジタルコンテンツ112が、保持MLM126を訓練するための訓練セットを形成するためにデータが収集されている訓練期間中に受信されなかった場合、保持マネージャ110は、受信したデジタルコンテンツ112/セグメント118iに対する生成されたメタデータ200iと分類210を保持MLM126に入力として提供して(ブロック420)、計算保持期限300iを出力する。保持マネージャ110は、メタデータ210の入力に対して保持MLM126が出力した出力された保持期間300iを保存し(ブロック422)、隔離期間304および削除期間306を含むことができる。隔離期間タイマー302は、有効期限切れ後にデジタルコンテンツを隔離に移動するために開始される(ブロック424)。(ブロック418で)訓練期間中にデジタルコンテンツが受信された場合、制御は終了する。
【0029】
図4の実施形態では、機械学習モジュールおよび人工知能を使用して、デジタルコンテンツおよびデジタルコンテンツ内の任意のセグメントを分類し、デジタルコンテンツ/セグメントに関するメタデータを保持MLM126に提供して、デジタルコンテンツを保持するための保持期間を判定している。保持MLM126は、ファイルが保持される期間とそのMLM分類およびメタデータに関するデータセットで訓練されるので、MLM126は、観察されたユーザアクセスおよび削除パターンに基づいてデジタルコンテンツが保持される時間を最適化する保持期間を出力するように構成される。
【0030】
図5は、ストレージ114に保持されたデジタルコンテンツ112およびセグメント118
iを管理するためにデジタルコンテンツマネージャ128によって実行される操作の一実施形態を示す図である。(ブロック502で)デジタルコンテンツ112/セグメント118
iの隔離期間304が満了した場合、(ブロック504で)隔離フラグ218が設定され、デジタルコンテンツ112/セグメント118
iが削除まで隔離されていることが示される。削除期間タイマー504は(ブロック506で)開始され、削除期間タイマー504が満了した後にデジタルコンテンツ112/セグメント118
iがストレージ114から削除されるようにする。(ブロック508で)削除期間306が満了した場合、デジタルコンテンツ112/セグメント118
iのメタデータ200
iは、削除時間216を示すように更新され、コンテンツはその後ストレージ114から削除される。
【0031】
図5の実施形態では、デジタルコンテンツは、ファイルが受信されてから隔離期間が満了した後に隔離に追加される。隔離から、ファイルは、削除期間306の満了後に削除される。ファイルが隔離にある間、ユーザは、ユーザがより長く保持したいデジタルコンテンツの削除を防ぐことができるように、削除を避けるためにファイルにアクセスすることができる。
【0032】
図6は、デジタルコンテンツ112/セグメント118
iにアクセスするユーザ要求を処理するために、デジタルコンテンツマネージャ128および保持MLM126によって実行される動作の一実施形態を示す図である。読み取り要求または隔離からデジタルコンテンツを削除する要求など、デジタルコンテンツ112/セグメント118
iのユーザアクセスを受信すると(ブロック600)、アクセスされたデジタルコンテンツ112/セグメント118
iのメタデータ200
iにおいて、隔離内または隔離外でアクセスされる可能性のあるアクセス回数212がインクリメントされる(ブロック602)。(ブロック604で)アクセスされたデジタルコンテンツ112/セグメント118
iが、隔離フラグ218によって示されるように隔離中である場合、隔離フラグ218は、隔離中ではないことを示すように設定される。ユーザがより長い期間保持するためにデジタルコンテンツを隔離から削除することを選択したため、デジタルコンテンツマネージャ128は、次に、以前に判定された保持期間300
iより長い、隔離期間304および削除期間306を含むデジタルコンテンツ112/セグメント118
iの新しい保持期間300
iを判定することができる(ブロック608)。例えば、隔離期間と削除期間を有する所定数の保持期間レベルが存在してもよく、新しい保持期間は、所定の保持期間レベルのセットにおいて、以前に判定された保持期間に続くことができる。アクセスされたデジタルコンテンツ112/セグメント118
iのメタデータ200
iおよび分類210は、判定された新しい保持期間300
iを出力として生成するために、保持MLM126に提供される(ブロック610)。(ブロック604で)デジタルコンテンツ112/セグメント118
iが隔離されていない場合、制御は終了する。
【0033】
図6の実施形態では、デジタルコンテンツにアクセスすると、アクセス回数212がインクリメントされ、デジタルコンテンツが隔離されている場合、新しい長い保持期間が判定され、隔離されているアクセスされたデジタルコンテンツの属性208および分類210を有するデジタルコンテンツに対して長い保持期間を出力するように保持MLM126を再学習して調整する。その後、アクセスされたデジタルコンテンツは、新しい、より長い、保持期間の間、保持されてよい。
【0034】
図7は、ある期間にわたって収集された訓練データセットに基づいて保持MLM126の訓練を開始するために、保持マネージャ110および保持MLM126マネージャによって実行される動作の一実施形態を示している。訓練データセットの構築中に、受信したデジタルコンテンツに対してデジタルコンテンツメタデータ200が生成され、訓練セットを構築するために削除時間が示される。(ブロック700で)訓練を開始すると、訓練セットのためのデータを収集する期間中に削除されたデジタルコンテンツ112/セグメント118
iの各インスタンスについて、保持マネージャ110は、削除時間216から受信時間214を引いたものに基づいて実際の保持期間を判定する(ブロック702)。訓練期間中に削除されたデジタルコンテンツ112/セグメント118
iの各インスタンスについて、保持マネージャ110は、実際の保持期間、または隔離期間および削除期間を出力として生成するように訓練するために、保持MLM126に入力としてデジタルコンテンツ112/セグメント118
iのメタデータ200
iおよび分類210を提供する(ブロック704)。
【0035】
図7の実施形態では、削除されたデジタルコンテンツ/セグメントに関する収集された情報の訓練セットが、実際の保持期間を出力するために使用するために保持MLM126に提供される。このようにして、保持MLM126は、デジタルコンテンツ112/セグメント118
iの属性208、受信したデジタルコンテンツの実際のユーザアクセスおよび削除パターンの判定された分類210に基づいて、保持期間を出力するように訓練される。これにより、保持MLM126は、コンテンツがアクセスされる可能性が高い期間、最適化されて保持される。もはやアクセスされる可能性がないコンテンツは、スペースが限られている可能性のあるストレージ114のスペースを節約するために、ストレージ114から削除されることがある。
【0036】
図8は、デジタルコンテンツ112/セグメント118
iを削除するユーザ要求を処理するために、デジタルコンテンツマネージャ128および保持MLM126によって実行される動作の一実施形態を示す。デジタルコンテンツ112/セグメント118
iを削除する要求(ブロック800)に応答して、デジタルコンテンツマネージャ128は、削除されたデジタルコンテンツ112/セグメント118
iのメタデータ200
iの削除時間216を示し(ブロック802)、削除時間216から受信時間214を引いた実際の保持期間を計算する。(ブロック804で)実際の保持期間が、隔離期間304および削除期間306のような、機械が判定した保持期間300
iと異なる場合、出力として実際の保持期間を生成するために、メタデータ200
iおよび分類210は、保持MLM126を再学習する入力として提供される(ブロック806)。機械が判定した保持期間300
iと実際の保持期間の実質的な差がない場合、正確な保持期間を生成したため、保持MLM126を再学習することなく制御を終了する。
【0037】
代替実施形態では、
図8の動作は、保持MLM126の再学習を定期的に実行するために、最近削除されたデジタルコンテンツの再学習データセットを構築するために定期的に実行され得る。
【0038】
図8の実施形態では、ファイルが削除されたときに決定された実際の保持期間の情報は、削除されたデジタルコンテンツのメタデータおよび分類に基づいて、保持MLM126を再学習して出力保持期間を実際の保持期間に調整するかどうかを決定するために使用され得る。
図8の実施形態は、デジタルコンテンツメタデータを有するデジタルコンテンツに対する実際のユーザの削除およびアクセスパターンを反映するために、通常のデジタルコンテンツ管理操作中に保持MLM126を自己調整することを可能にする。
【0039】
本発明は、システム、方法もしくはコンピュータプログラム製品またはそれらの組み合せとすることができる。コンピュータプログラム製品は、プロセッサに本発明の態様を実行させるためのコンピュータ可読プログラム命令を記憶したコンピュータ可読記憶媒体を含んでよい。
【0040】
コンピュータ可読記憶媒体は、命令実行装置によって使用される命令を保持し、記憶することができる有形の装置とすることができる。コンピュータ可読記憶媒体は、一例として、電子記憶装置、磁気記憶装置、光学記憶装置、電磁記憶装置、半導体記憶装置またはこれらの適切な組み合わせであってよいが、これらに限定されない。コンピュータ可読記憶媒体のより具体的な一例としては、ポータブルコンピュータディスケット、ハードディスク、RAM、ROM、EPROM(またはフラッシュメモリ)、SRAM、CD-ROM、DVD、メモリスティック、フロッピーディスク、パンチカードまたは溝内の隆起構造などに命令を記録した機械的に符号化された装置、およびこれらの適切な組み合せが挙げられる。本明細書で使用されるコンピュータ可読記憶媒体は、電波もしくは他の自由に伝播する電磁波、導波管もしくは他の伝送媒体を介して伝播する電磁波(例えば、光ファイバケーブルを通過する光パルス)、またはワイヤを介して送信される電気信号のような、一過性の信号それ自体として解釈されるべきではない。
【0041】
本明細書に記載のコンピュータ可読プログラム命令は、コンピュータ可読記憶媒体からそれぞれのコンピューティング/処理装置に、または、ネットワーク(例えば、インターネット、ローカルエリアネットワーク、ワイドエリアネットワーク、もしくはワイヤレスネットワークまたはその組み合わせ)を介して外部コンピュータまたは外部記憶装置にダウンロードすることができる。ネットワークは、銅線伝送ケーブル、光伝送ファイバー、無線伝送、ルーター、ファイアウォール、スイッチ、ゲートウェイコンピュータ、もしくはエッジサーバーまたはその組み合わせで構成される。各コンピューティング/処理装置のネットワークアダプタカードまたはネットワークインターフェースは、ネットワークからコンピュータ可読プログラム命令を受信し、それぞれのコンピューティング/処理装置内のコンピュータ可読記憶媒体に格納するためにコンピュータ可読プログラム命令を転送する。
【0042】
本発明の動作を実行するためのコンピュータ可読プログラム命令は、アセンブラ命令、命令セットアーキテクチャ(ISA)命令、機械命令、機械依存命令、マイクロコード、ファームウェア命令、状態設定データ、またはJava、Smalltalk、C++などのオブジェクト指向プログラミング言語と「C」プログラミング言語や類似のプログラミング言語などの手続き型プログラミング言語を含む、1つ以上のプログラミング言語の任意の組み合わせで記述されたソースコードまたはオブジェクトコードのいずれかであってよい。コンピュータ可読プログラム命令は、スタンドアロンソフトウェアパッケージとして、完全にユーザのコンピュータ上で、または部分的にユーザのコンピュータ上で実行可能である。あるいは、部分的にユーザのコンピュータ上でかつ部分的にリモートコンピュータ上で、または完全にリモートコンピュータまたはサーバ上で実行可能である。後者のシナリオでは、リモートコンピュータは、ローカルエリアネットワーク(LAN)またはワイドエリアネットワーク(WAN)を含む任意のタイプのネットワークを介してユーザのコンピュータに接続され、または(例えば、インターネットサービスプロバイダーを使用したインターネット経由で)外部コンピュータに接続されてよい。いくつかの実施形態では、例えば、プログラマブルロジック回路、フィールドプログラマブルゲートアレイ(FPGA)、またはプログラマブルロジックアレイ(PLA)を含む電子回路は、本発明の態様を実行するために、コンピュータ可読プログラム命令の状態情報を利用してパーソナライズすることにより、コンピュータ可読プログラム命令を実行することができる。
【0043】
本発明の態様は、本発明の実施形態による方法、装置(システム)、およびコンピュータプログラム製品のフローチャート図もしくはブロック図またはその両方を参照して本明細書に記載されている。フローチャート図もしくはブロック図またはその両方の各ブロック、およびフローチャート図もしくはブロック図またはその両方のブロックの組み合わせは、コンピュータ可読プログラム命令によって実装できることが理解されよう。
【0044】
これらのコンピュータ可読プログラム命令は、コンピュータまたは他のプログラム可能なデータ処理装置のプロセッサを介して実行される命令がフローチャートもしくはブロック図またはその両方の1つまたは複数のブロックで指定された機能/動作を実装するための手段を生成するように、機械を生成するために汎用コンピュータ、専用コンピュータのプロセッサまたは他のプログラム可能なデータ処理装置に提供されることができる。これらのコンピュータ可読プログラム命令はまた、フローチャートもしくはブロック図またはその両方の1つまたは複数のブロックで指定された機能/行為の態様を実装する命令を含む生成品の1つを命令が記憶されたコンピュータ可読記憶媒体が構成するように、コンピュータ、プログラム可能なデータ処理装置、もしくは特定の方法で機能する他のデバイスまたはその組み合わせに接続可能なコンピュータ可読記憶媒体の中に記憶されることができる。
【0045】
コンピュータ、他のプログラム可能な装置、または他のデバイス上でフローチャートもしくはブロック図またはその両方の1つまたは複数のブロックで指定された機能/行為を実行する命令のように、コンピュータ可読プログラム命令はまた、コンピュータ、他のプログラム可能なデータ処理装置、または他のデバイスにロードされ、コンピュータ、他のプログラム可能な装置、または他のデバイス上で一連の操作ステップを実行し、コンピュータ実装された過程を生成することができる。
【0046】
図中のフローチャートおよびブロック図は、本発明の様々な実施形態によるシステム、方法、およびコンピュータプログラム製品が実行可能な実装の構成、機能、および動作を示している。これに関して、フローチャートまたはブロック図の各ブロックは、モジュール、セグメント、または命令の一部を表してよく、これは、指定された論理機能を実装するための1つまたは複数の実行可能命令を構成する。いくつかの代替の実施形態では、ブロックに示されている機能は、図に示されている順序とは異なる場合がある。例えば、連続して示される2つのブロックは、実際には、実質的に同時に実行されるか、またはブロックは、関係する機能に応じて逆の順序で実行される場合がある。ブロック図もしくはフローチャート図またはその両方の各ブロック、およびブロック図もしくはフローチャート図またはその両方のブロックの組み合わせは、指定された機能または動作を実行する、または特別な目的のハードウェアとコンピュータ命令の組み合わせを実行する特別な目的のハードウェアベースのシステムによって実装できることにも留意されたい。
【0047】
コンピューティング装置100の
図1の計算コンポーネントは、
図9に示すコンピュータシステム902のような1または複数のコンピュータシステムで実装され得る。コンピュータシステム/サーバ902は、プログラムモジュールなどのコンピュータシステム実行可能命令がコンピュータシステムによって実行されるという一般的な文脈で説明されることがある。一般に、プログラムモジュールは、特定のタスクを実行する、または特定の抽象データ型を実装するルーチン、プログラム、オブジェクト、コンポーネント、論理、データ構造などを含むことができる。コンピュータシステム/サーバ902は、通信ネットワークを介してリンクされるリモート処理デバイスによってタスクが実行される分散型クラウドコンピューティング環境において実施され得る。分散型クラウドコンピューティング環境では、プログラムモジュールは、メモリ記憶装置を含むローカルおよびリモートコンピュータシステム記憶媒体の両方に配置されることがある。
【0048】
図9に示すように、コンピュータシステム/サーバ902は、汎用コンピューティング装置の形態で示されている。コンピュータシステム/サーバ902の構成要素は、1または複数のプロセッサまたは処理ユニット904、システムメモリ906、およびシステムメモリ906を含む様々なシステム構成要素をプロセッサ904に結合するバス908を含むことができるが、これらに限定されるものではない。バス908は、種々のバスアーキテクチャのいずれかを使用するメモリバスまたはメモリコントローラ、周辺バス、アクセラレーテッドグラフィックスポート、およびプロセッサまたはローカルバスを含む複数種類のバス構造のうち1つ以上の任意のものを表す。一例として、かかるアーキテクチャは、インダストリスタンダードアーキテクチャ(ISA)バス、マイクロチャネルアーキテクチャ(MCA)バス、拡張ISA(EISA)バス、ビデオエレクトロニクススタンダーズアソシエーション(VESA)ローカルバス、ペリフェラルコンポーネントインターコネクト(PCI)バスがあるが、これらに限定しない。
【0049】
コンピュータシステム/サーバ902は、一般的に、種々のコンピュータシステム可読媒体を含む。かかる媒体は、コンピュータシステム/サーバ902によってアクセス可能な任意の利用可能な媒体でよく、揮発性媒体および不揮発性媒体の両方と、取り外し可能媒体および取り外し不能媒体の両方とを含むことができる。
【0050】
システムメモリ906は、ランダムアクセスメモリ(RAM)910もしくはキャッシュメモリ912またはその両方などの揮発性メモリの形態のコンピュータシステム可読媒体を含むことができる。コンピュータシステム/サーバ902は、他の取り外し可能/取り外し不能コンピュータシステム可読媒体および揮発性/不揮発性コンピュータシステム可読媒体を含んでもよい。一例として、ストレージシステム913は、取り外し不能な不揮発性磁気媒体(不図示。一般に「ハードドライブ」と呼ばれる)への読み書きのために設けることができる。また、図示は省略するが、取り外し可能な不揮発性磁気ディスク(例えば、フロッピーディスク)への読み書きのための磁気ディスクドライブ、および取り外し可能な不揮発性光学ディスク(CD-ROM、DVD-ROMや他の光学媒体など)への読み書きのための光学ディスクドライブを設けることができる。これらの例において、それぞれを、1つ以上のデータ媒体インタフェースによってバス908に接続することができる。以下でさらに図示および説明するように、メモリ906は、本発明の実施形態の機能を実行するように構成されたプログラムモジュールのセット(例えば、少なくとも1つ)を有する少なくとも1つのプログラム製品を含むことができる。
【0051】
プログラムモジュール916のセット(少なくとも1つ)を有するプログラム/ユーティリティ914は、オペレーティングシステム、1つ以上のアプリケーションプログラム、他のプログラムモジュール、およびプログラムデータと同様に、例示であって限定ではない方法でメモリ906に記憶することができる。オペレーティングシステム、1つ以上のアプリケーションプログラム、他のプログラムモジュール、およびプログラムデータ、またはそれらのいくつかの組み合わせの各々は、ネットワーク環境の実装形態を含むことができる。コンピュータ902の構成要素は、本明細書に記載された本発明の実施形態の機能もしくは方法論またはその両方を一般的に実行するプログラムモジュール916として実装されてもよい。
図1のシステムは、1または複数のコンピュータシステム902で実装されてもよく、複数のコンピュータシステム902で実装される場合、コンピュータシステムは、ネットワークを介して通信してもよい。
【0052】
コンピュータシステム/サーバ902は、キーボード、ポインティングデバイス、ディスプレイ920などの1つ以上の外部装置918、ユーザとコンピュータシステム/サーバ902との対話を可能にする1つ以上の装置、もしくはコンピュータシステム/サーバ902と1つ以上の他のコンピュータ装置との通信を可能にする任意の装置(例えば、ネットワークカードやモデムなど)またはこれらの組み合わせと通信することができる。かかる通信は、入力/出力(I/O)インタフェース922を介して行うことができる。さらに、コンピュータシステム/サーバ902は、ネットワークアダプタ924を介して1つ以上のネットワーク(ローカルエリアネットワーク(LAN)、汎用広域ネットワーク(WAN)、もしくはパブリックネットワーク(例えばインターネット)またはこれらの組み合わせなど)と通信することができる。図示するように、ネットワークアダプタ924は、バス908を介してコンピュータシステム/サーバ902の他のコンポーネントと通信することができる。なお、図示は省略するが、他のハードウェアコンポーネントもしくはソフトウェアコンポーネントまたはその両方を、コンピュータシステム/サーバ902と組み合わせて使用することができる。それらの一例としては、マイクロコード、デバイスドライバ、冗長化処理ユニット、外付けディスクドライブアレイ、RAIDシステム、テープドライブ、データアーカイブストレージシステムなどがある。
【0053】
i、m、nなどの文字表記は、ある要素のインスタンス数を指定するために使用されるが、同じ要素または異なる要素で使用された場合、その要素のインスタンス数の可変を示すことがある。
【0054】
本明細書において、「一実施形態(an embodiment)」、「実施形態(embodiment)」、「実施形態(embodiments)」、「実施形態(the embodiment)」、「実施形態(the embodiments)」、「1または複数の実施形態(in one or more embodiments)」、「いくつかの実施形態(some embodiments)」および「ある実施形態(one embodiment)」は、明示的に指定されない限り、「本発明の1または複数(しかしすべてではない)の実施形態」を意味する。
【0055】
用語「含む(inducing)」、「備える(comprising)」、「有する(having)」およびその変形は、明示的に別段の定めがない限り、「含むがこれに限定されない」ことを意味する。
【0056】
なお、列挙された項目は、明示的に別段の定めがない限り、いずれかまたはすべての項目が相互に排他的であることを意味するものではない。
【0057】
用語「ある/1つの/一の(a)」、「ある/1つの/一の(an)」および「その/当該(the)」は、明示的に別段の定めがない限り、「1または複数」を意味する。
【0058】
互いに通信する装置は、明示的に別段の定めがない限り、互いに連続的に通信する必要はない。さらに、互いに通信している装置は、1または複数の仲介者を介して直接または間接的に通信することができる。
【0059】
互いに通信する複数の構成要素を有する実施形態の説明は、そのような構成要素のすべてが必要であることを意味するものではない。それどころか、本発明の多様な可能な実施形態を説明するために、様々なオプションの構成要素が説明されている。
【0060】
単一の装置または物品が本明細書に記載されている場合、複数の装置/物品(それらが協働するか否かにかかわらず)が、単一の装置/物品の代わりに使用され得ることは、容易に明らかであろう。同様に、本明細書において、2つ以上の装置または物品(それらが協働するか否かを問わない)が記載されている場合、2つ以上の装置または物品の代わりに単一の装置/物品が使用されてもよいこと、または示された数の装置またはプログラムの代わりに異なる数の装置/物品が使用されてもよいことは、容易に明らかであるだろう。装置の機能性もしくは特徴またはその両方は、そのような機能性/特徴を有するものとして明示的に説明されていない1または複数の他の装置によって代替的に実装されることがある。したがって、本発明の他の実施形態は、装置そのものを含む必要はない。
【0061】
本発明の様々な実施形態に関する前述の説明は、例示および説明の目的で提示されたものである。それは、網羅的であること、または開示された正確な形態に本発明を限定することを意図していない。多くの修正および変形が、上記の教示に照らして可能である。本発明の範囲は、この詳細な説明によってではなく、むしろここに添付された特許請求の範囲によって限定されることが意図される。上記の明細書、実施例およびデータは、本発明の組成物の製造および使用に関する完全な説明を提供するものである。本発明の範囲から逸脱することなく、本発明の多くの実施形態を作ることができるので、本発明は、ここに添付された後の特許請求の範囲に存在する。
【手続補正書】
【提出日】2023-10-27
【手続補正1】
【補正対象書類名】特許請求の範囲
【補正対象項目名】全文
【補正方法】変更
【補正の内容】
【特許請求の範囲】
【請求項1】
コンピューティング装置によって使用されるストレージ内のデジタルコンテンツを管理するためのコンピュータプログラム製品であって、前記コンピュータプログラム製品は、実行されると動作を引き起こすプログラム命令をその中に実装したコンピュータ可読記憶媒体を含み、前記動作は、
デジタルコンテンツのインスタンスのメタデータを生成することであって、前記メタデータは、前記コンピューティング装置のユーザによる前記デジタルコンテンツのアクセスパターン、前記デジタルコンテンツの属性、および記憶された前記デジタルコンテンツが前記ストレージに保持される保持期間を含む、生成することと、
前記デジタルコンテンツの前記保持期間を生成するために、前記デジタルコンテンツのインスタンスの前記メタデータを含む入力を用いて機械学習モジュールを訓練することと、
前記機械学習モジュールの訓練後に受信した、デジタルコンテンツから判定されたメタデータを含む入力を、前記訓練後に受信した前記デジタルコンテンツの出力保持期間を生成するために、前記機械学習モジュールに提供することと、
前記訓練後に受信した前記デジタルコンテンツを前記ストレージから削除するタイミングを判定するために、前記出力保持期間を使用することと、
を含む、コンピュータプログラム製品。
【請求項2】
前記デジタルコンテンツの前記属性は、前記デジタルコンテンツの発信者、前記デジタルコンテンツをメッセージで前記コンピューティング装置に送信した送信者、前記コンピューティング装置に送信されたときに前記デジタルコンテンツに埋め込まれたメタデータ、分類プログラムによって判定された前記デジタルコンテンツの分類、前記送信者が属するグループ、前記デジタルコンテンツの以前に受信したデジタルコンテンツに対する関係、および関連するカレンダーイベントの少なくとも1つを含む、請求項1に記載のコンピュータプログラム製品。
【請求項3】
前記動作は、
デジタルコンテンツを受信したことに応答して、
前記受信したデジタルコンテンツが、デジタルコンテンツの別個のインスタンスを構成するデジタルコンテンツのセグメントを含むかどうかを判定することを実行することと、
前記受信したデジタルコンテンツが前記セグメントを含むと判定することに応答して、前記受信したデジタルコンテンツをデジタルコンテンツの前記セグメントに解析することであって、前記メタデータが前記セグメントに対して生成され、前記セグメントに対する出力保持期間を生成するために、前記機械学習モジュールが、前記セグメントに対して生成された前記メタデータを含む入力で前記デジタルコンテンツの前記セグメントに対して別々に訓練される、解析することと、
をさらに含む、請求項1に記載のコンピュータプログラム製品。
【請求項4】
前記デジタルコンテンツの少なくとも1つのインスタンスは、添付ファイルを有するメッセージを含み、前記セグメントは前記メッセージおよび前記添付ファイルを含み、前記機械学習モジュールは前記セグメントに対して異なる保持期間を生成する、請求項3に記載のコンピュータプログラム製品。
【請求項5】
前記動作は、
前記メッセージの内容の自然言語処理(NLP)に基づいてメッセージ分類を判定するために、前記メッセージの前記内容の前記NLPを実行することであって、前記メッセージ分類は、前記メッセージを含む前記セグメントの前記出力保持期間を生成するために前記機械学習モジュールを訓練する入力として提供される、実行することをさらに含む、
請求項4に記載のコンピュータプログラム製品。
【請求項6】
前記動作は、
前記デジタルコンテンツのセグメントについて、前記セグメントのコンテンツのセグメント分類を、前記セグメント内のコンテンツのメディアフォーマットに基づいて生成するために、機械学習解析ツールを判定することであって、前記セグメントに対して生成されて前記機械学習モジュールに入力される前記メタデータは、前記セグメントに対して判定された前記機械学習解析ツールによって判定されたセグメント分類を含む、判定することをさらに含む、
請求項3に記載のコンピュータプログラム製品。
【請求項7】
前記出力保持期間は、前記デジタルコンテンツの前記保持期間に対する隔離期間および削除期間を含み、前記隔離期間の満了後に前記デジタルコンテンツが隔離して示され、前記デジタルコンテンツが前記隔離して示されたときに開始された前記削除期間の満了に応答して前記隔離中の前記デジタルコンテンツが前記ストレージから削除され、前記機械学習モジュールを前記訓練することは、前記デジタルコンテンツに対する前記入力に基づいて前記隔離期間および前記削除期間を出力として生成するように前記機械学習モジュールを訓練することを含む、請求項1に記載のコンピュータプログラム製品。
【請求項8】
前記動作は、
ストレージに保持するためにデジタルコンテンツを前記隔離から削除するユーザ選択を受信することと、
前記隔離から削除する前記デジタルコンテンツが前記隔離中でないことを示すことと、
前記隔離から削除するために前記デジタルコンテンツに対して判定された前記保持期間よりも長い新たな保持期間を判定することと、
前記新たな保持期間を出力として生成する前記機械学習モジュールを再学習させるために、前記隔離から削除する前記デジタルコンテンツから判定されたメタデータを含む入力を前記機械学習モジュールに提供することと、
をさらに含む、請求項7に記載のコンピュータプログラム製品。
【請求項9】
前記動作は、
前記機械学習モジュールによって保持期間が判定されたデジタルコンテンツを削除するための選択を受信することと、
前記デジタルコンテンツが削除された時期に基づく前記削除されたデジタルコンテンツの実際の保持期間が、前記出力保持期間と異なるか否かを判定することと、
前記実際の保持期間を出力として生成するために、前記削除されたデジタルコンテンツの前記メタデータを入力として用いて前記機械学習モジュールを再学習することと、
をさらに含む、請求項1に記載のコンピュータプログラム製品。
【請求項10】
ストレージ内のデジタルコンテンツを管理するためにストレージに結合されたシステムであって、前記システムは、
プロセッサと、
前記プロセッサによって実行されると動作を引き起こすプログラム命令を有するコンピュータ可読記憶媒体であって、前記動作は、
コンピューティング装置に記憶されたデジタルコンテンツのインスタンスのメタデータを生成することであって、前記メタデータは、前記コンピューティング装置のユーザによる前記デジタルコンテンツのアクセスパターン、前記デジタルコンテンツの属性、および記憶された前記デジタルコンテンツが前記ストレージに保持される保持期間を含む、生成することと、
前記デジタルコンテンツの前記保持期間を生成するために、前記デジタルコンテンツのインスタンスの前記メタデータを含む入力を用いて機械学習モジュールを訓練することと、
前記機械学習モジュールの訓練後に受信した、デジタルコンテンツから判定されたメタデータを含む入力を、前記訓練後に受信した前記デジタルコンテンツの出力保持期間を生成するために、前記機械学習モジュールに提供することと、
前記訓
練後に受信した前記デジタル
コンテンツを前記ストレージから削除するタイミングを判定するために、前記出力保持期間を使用することと、
を含む、システム。
【請求項11】
前記動作は、
デジタルコンテンツを受信したことに応答して、
前記受信したデジタルコンテンツが、デジタルコンテンツの別個のインスタンスを構成するデジタルコンテンツのセグメントを含むかどうかを判定することを実行することと、
前記受信したデジタルコンテンツが前記セグメントを含むと判定することに応答して、前記受信したデジタルコンテンツをデジタルコンテンツの前記セグメントに解析することであって、前記メタデータが前記セグメントに対して生成され、前記セグメントに対する出力保持期間を生成するために、前記機械学習モジュールが、前記セグメントに対して生成された前記メタデータを含む入力で前記デジタルコンテンツの前記セグメントに対して別々に訓練される、解析することと、
をさらに含む、請求項10に記載のシステム。
【請求項12】
前記デジタルコンテンツの少なくとも1つのインスタンスは、添付ファイルを有するメッセージを含み、前記セグメントは前記メッセージおよび前記添付ファイルを含み、前記機械学習モジュールは前記セグメントに対して異なる保持期間を生成する、請求項11に記載のシステム。
【請求項13】
前記動作は、
前記デジタルコンテンツのセグメントについて、前記セグメントのコンテンツのセグメント分類を、前記セグメント内のコンテンツのメディアフォーマットに基づいて生成するために、機械学習解析ツールを判定することであって、前記セグメントに対して生成されて前記機械学習モジュールに入力される前記メタデータは、前記セグメントに対して判定された前記機械学習解析ツールによって判定されたセグメント分類を含む、判定することをさらに含む、
請求項11に記載のシステム。
【請求項14】
前記出力保持期間は、前記デジタルコンテンツの前記保持期間に対する隔離期間および削除期間を含み、前記隔離期間の満了後に前記デジタルコンテンツが隔離して示され、前記デジタルコンテンツが前記隔離して示されたときに開始された前記削除期間の満了に応答して前記隔離中の前記デジタルコンテンツが前記ストレージから削除され、前記機械学習モジュールを前記訓練することは、前記デジタルコンテンツに対する前記入力に基づいて前記隔離期間および前記削除期間を出力として生成するように前記機械学習モジュールを訓練することを含む、請求項10に記載のシステム。
【請求項15】
前記動作は、
前記機械学習モジュールによって保持期間が判定されたデジタルコンテンツを削除するための選択を受信することと、
前記デジタルコンテンツが削除された時期に基づく前記削除されたデジタルコンテンツの実際の保持期間が、前記出力保持期間と異なるか否かを判定することと、
前記実際の保持期間を出力として生成するために、前記削除されたデジタルコンテンツの前記メタデータを入力として用いて前記機械学習モジュールを再学習することと、
をさらに含む、請求項10に記載のシステム。
【請求項16】
コンピューティング装置によって使用されるストレージ内のデジタルコンテンツを管理するためのコンピュータ実装方法であって、
デジタルコンテンツのインスタンスのメタデータを生成することであって、前記メタデータは、前記コンピューティング装置のユーザによる前記デジタルコンテンツのアクセスパターン、前記デジタルコンテンツの属性、および記憶された前記デジタルコンテンツが前記ストレージに保持される保持期間を含む、生成することと、
前記デジタルコンテンツの前記保持期間を生成するために、前記デジタルコンテンツのインスタンスの前記メタデータを含む入力を用いて機械学習モジュールを訓練することと、
前記機械学習モジュールの訓練後に受信した、デジタルコンテンツから判定されたメタデータを含む入力を、前記訓練後に受信した前記デジタルコンテンツの出力保持期間を生成するために、前記機械学習モジュールに提供することと、
前記訓練後に受信した前記デジタルコンテンツを前記ストレージから削除するタイミングを判定するために、前記出力保持期間を使用することと、
を含む、方法。
【請求項17】
デジタルコンテンツを受信したことに応答して、
前記受信したデジタルコンテンツが、デジタルコンテンツの別個のインスタンスを構成するデジタルコンテンツのセグメントを含むかどうかを判定することを実行することと、
前記受信したデジタルコンテンツが前記セグメントを含むと判定することに応答して、前記受信したデジタルコンテンツをデジタルコンテンツの前記セグメントに解析することであって、前記メタデータが前記セグメントに対して生成され、前記セグメントに対する出力保持期間を生成するために、前記機械学習モジュールが、前記セグメントに対して生成された前記メタデータを含む入力で前記デジタルコンテンツの前記セグメントに対して別々に訓練される、解析することと、
をさらに含む、請求項16に記載の方法。
【請求項18】
前記デジタルコンテンツの少なくとも1つのインスタンスは、添付ファイルを有するメッセージを含み、前記セグメントは前記メッセージおよび前記添付ファイルを含み、前記機械学習モジュールは前記セグメントに対して異なる保持期間を生成する、請求項17に記載の方法。
【請求項19】
前記デジタルコンテンツのセグメントについて、前記セグメントのコンテンツのセグメント分類を、前記セグメント内のコンテンツのメディアフォーマットに基づいて生成するために、機械学習解析ツールを判定することであって、前記セグメントに対して生成されて前記機械学習モジュールに入力される前記メタデータは、前記セグメントに対して判定された前記機械学習解析ツールによって判定されたセグメント分類を含む、判定することをさらに含む、
請求項17に記載の方法。
【請求項20】
前記出力保持期間は、前記デジタルコンテンツの前記保持期間に対する隔離期間および削除期間を含み、前記隔離期間の満了後に前記デジタルコンテンツが隔離して示され、前記デジタルコンテンツが前記隔離して示されたときに開始された前記削除期間の満了に応答して前記隔離中の前記デジタルコンテンツが前記ストレージから削除され、前記機械学習モジュールを前記訓練することは、前記デジタルコンテンツに対する前記入力に基づいて前記隔離期間および前記削除期間を出力として生成するように前記機械学習モジュールを訓練することを含む、請求項16に記載の方法。
【手続補正2】
【補正対象書類名】明細書
【補正対象項目名】0030
【補正方法】変更
【補正の内容】
【0030】
図5は、ストレージ114に保持されたデジタルコンテンツ112およびセグメント118
iを管理する
(ブロック500)ためにデジタルコンテンツマネージャ128によって実行される操作の一実施形態を示す図である。(ブロック502で)デジタルコンテンツ112/セグメント118
iの隔離期間304が満了した場合、(ブロック504で)隔離フラグ218が設定され、デジタルコンテンツ112/セグメント118
iが削除まで隔離されていることが示される。削除期間タイマー504は(ブロック506で)開始され、削除期間タイマー504が満了した後にデジタルコンテンツ112/セグメント118
iがストレージ114から削除されるようにする。(ブロック508で)削除期間306が満了した場合、デジタルコンテンツ112/セグメント118
iのメタデータ200
iは、削除時間216を示すように更新され、コンテンツはその後ストレージ114から削除される
(ブロック510)。
【手続補正3】
【補正対象書類名】明細書
【補正対象項目名】0032
【補正方法】変更
【補正の内容】
【0032】
図6は、デジタルコンテンツ112/セグメント118
iにアクセスするユーザ要求を処理するために、デジタルコンテンツマネージャ128および保持MLM126によって実行される動作の一実施形態を示す図である。読み取り要求または隔離からデジタルコンテンツを削除する要求など、デジタルコンテンツ112/セグメント118
iのユーザアクセスを受信すると(ブロック600)、アクセスされたデジタルコンテンツ112/セグメント118
iのメタデータ200
iにおいて、隔離内または隔離外でアクセスされる可能性のあるアクセス回数212がインクリメントされる(ブロック602)。(ブロック604で)アクセスされたデジタルコンテンツ112/セグメント118
iが、隔離フラグ218によって示されるように隔離中である場合、隔離フラグ218は、隔離中ではないことを示すように設定される
(ブロック606)。ユーザがより長い期間保持するためにデジタルコンテンツを隔離から削除することを選択したため、デジタルコンテンツマネージャ128は、次に、以前に判定された保持期間300
iより長い、隔離期間304および削除期間306を含むデジタルコンテンツ112/セグメント118
iの新しい保持期間300
iを判定することができる(ブロック608)。例えば、隔離期間と削除期間を有する所定数の保持期間レベルが存在してもよく、新しい保持期間は、所定の保持期間レベルのセットにおいて、以前に判定された保持期間に続くことができる。アクセスされたデジタルコンテンツ112/セグメント118
iのメタデータ200
iおよび分類210は、判定された新しい保持期間300
iを出力として生成するために、保持MLM126に提供される(ブロック610)。(ブロック604で)デジタルコンテンツ112/セグメント118
iが隔離されていない場合、制御は終了する。
【国際調査報告】