(19)【発行国】日本国特許庁(JP)
(12)【公報種別】公表特許公報(A)
(11)【公表番号】
(43)【公表日】2024-03-13
(54)【発明の名称】プライバシ主導型ユーザ・データ共有のための認知フレームワーク
(51)【国際特許分類】
G06F 16/25 20190101AFI20240306BHJP
G06F 16/17 20190101ALI20240306BHJP
【FI】
G06F16/25
G06F16/17 100
【審査請求】未請求
【予備審査請求】未請求
(21)【出願番号】P 2023553677
(86)(22)【出願日】2022-03-22
(85)【翻訳文提出日】2023-09-04
(86)【国際出願番号】 CN2022082251
(87)【国際公開番号】W WO2022199575
(87)【国際公開日】2022-09-29
(32)【優先日】2021-03-22
(33)【優先権主張国・地域又は機関】US
(81)【指定国・地域】
(71)【出願人】
【識別番号】390009531
【氏名又は名称】インターナショナル・ビジネス・マシーンズ・コーポレーション
【氏名又は名称原語表記】INTERNATIONAL BUSINESS MACHINES CORPORATION
【住所又は居所原語表記】New Orchard Road, Armonk, New York 10504, United States of America
(74)【代理人】
【識別番号】100112690
【氏名又は名称】太佐 種一
(74)【代理人】
【識別番号】100120710
【氏名又は名称】片岡 忠彦
(72)【発明者】
【氏名】エカラバラム、ヴィジャイ
(72)【発明者】
【氏名】バーティ、ハリシュ
(72)【発明者】
【氏名】シンデ、ラケシュ
(72)【発明者】
【氏名】パトラ、アパイ クマール
(72)【発明者】
【氏名】スキジャ、サンディープ
【テーマコード(参考)】
5B175
【Fターム(参考)】
5B175CA11
5B175HA01
(57)【要約】
プロセッサは、データセットの利益対リソース・スコアを計算することと、利益対リソース・スコアに基づいてオートエンコーダ・アーキテクチャを選択することとを含む動作を実行するように構成されてもよい。オートエンコーダ・アーキテクチャは、利益対リソース・スコアに基づいて、再構築損失の最小化と必要な記憶空間の最小化とのバランスをとってもよい。プロセッサによって実行される動作は、オートエンコーダ・アーキテクチャに基づいた変換関数を用いて、データセットを変換済みデータに変換することと、変換済みデータをユーザ空間に記憶することとをさらに含んでもよい。
【特許請求の範囲】
【請求項1】
プライバシ主導型データ共有のためのシステムであって、前記システムが、
メモリと、
前記メモリと通信するプロセッサと
を含み、前記プロセッサが、
データセットの利益対リソース・スコアを計算することと、
前記利益対リソース・スコアに基づいてオートエンコーダ・アーキテクチャを選択することであって、前記オートエンコーダ・アーキテクチャが、前記利益対リソース・スコアに基づいて再構築損失の最小化と必要な記憶空間の最小化とのバランスをとる、前記選択することと、
前記オートエンコーダ・アーキテクチャに基づいた変換関数を用いて、前記データセットを変換済みデータに変換することと、
前記変換済みデータをユーザ空間に記憶することと
を含む動作を実行するように構成される、システム。
【請求項2】
前記動作が、
前記データセットをデータ・セグメントにセグメント化することと、
前記データ・セグメントのそれぞれについてセグメント利益対リソース・スコアを計算することと、
前記データ・セグメントを変換済みデータ・セグメントに変換することと、
前記変換済みデータ・セグメントのうちの1つまたは複数をコンテンツ・パーソナライザにストリーミングすることと
をさらに含む、請求項1に記載のシステム。
【請求項3】
前記動作が、
前記データセットをデータ・セグメントにセグメント化することと、
前記データ・セグメントのそれぞれについて重み付けを決定することであって、前記重み付けが分析サービスの意味論的目的に基づく、前記決定することと、
前記重み付けに従って、前記オートエンコーダ・アーキテクチャにおける変換強度の低減を可能にすることと
をさらに含む、請求項1に記載のシステム。
【請求項4】
前記動作が、
前記データセットをデータ・セグメントにセグメント化することと、
前記データ・セグメントのそれぞれについてセグメント利益対リソース・スコアを計算することと、
前記セグメント利益対リソース・スコアに基づいて前記データ・セグメントのそれぞれについてセグメント・オートエンコーダ・アーキテクチャを選択することと、
前記セグメント・オートエンコーダ・アーキテクチャのうちの少なくとも1つを活用して、前記データ・セグメントのうちの少なくとも1つを少なくとも1つの変換済みデータ・セグメントに変換することと、
前記データ・セグメントのうちの前記少なくとも1つを変換することと
をさらに含む、請求項1に記載のシステム。
【請求項5】
少なくとも1つの変換済みデータ・セグメントが機械学習サービスにストリーミングされる、請求項4に記載のシステム。
【請求項6】
前記動作が、
説明可能な機械学習に基づいて次元削減を可能にすることをさらに含む、請求項1に記載のシステム。
【請求項7】
前記オートエンコーダ・アーキテクチャが、Shapley加法的説明分析から抽出された主要な特徴にさらに基づく、請求項1に記載のシステム。
【請求項8】
前記利益対リソース・スコアが閾値を超えており、再構築損失を最小限に抑えるように前記オートエンコーダ・アーキテクチャが選択される、請求項1に記載のシステム。
【請求項9】
プライバシ主導型データ共有のための方法であって、
プロセッサによって、データセットの利益対リソース・スコアを計算することと、
前記利益対リソース・スコアに基づいてオートエンコーダ・アーキテクチャを選択することであって、前記オートエンコーダ・アーキテクチャが、前記利益対リソース・スコアに基づいて再構築損失の最小化と必要な記憶空間の最小化とのバランスをとる、前記選択することと、
前記オートエンコーダ・アーキテクチャに基づいた変換関数を用いて、前記データセットを変換済みデータに変換することと、
前記変換済みデータをユーザ空間に記憶することと
を含む、方法。
【請求項10】
前記データセットをデータ・セグメントにセグメント化することと、
前記データ・セグメントのそれぞれについてセグメント利益対リソース・スコアを計算することと、
前記データ・セグメントを変換済みデータ・セグメントに変換することと、
前記変換済みデータ・セグメントのうちの1つまたは複数をコンテンツ・パーソナライザにストリーミングすることと
をさらに含む、請求項9に記載の方法。
【請求項11】
前記データセットをデータ・セグメントにセグメント化することと、
前記データ・セグメントのそれぞれについて重み付けを決定することであって、前記重み付けが分析サービスの意味論的目的に基づく、前記決定することと、
前記重み付けに従って、前記オートエンコーダ・アーキテクチャにおける変換強度の低減を可能にすることと
をさらに含む、請求項9に記載の方法。
【請求項12】
前記データセットをデータ・セグメントにセグメント化することと、
前記データ・セグメントのそれぞれについてセグメント利益対リソース・スコアを計算することと、
前記セグメント利益対リソース・スコアに基づいて、前記データ・セグメントのそれぞれについてセグメント・オートエンコーダ・アーキテクチャを選択することと、
前記セグメント・オートエンコーダ・アーキテクチャのうちの少なくとも1つを活用して、前記データ・セグメントのうちの少なくとも1つを少なくとも1つの変換済みデータ・セグメントに変換することと、
前記データ・セグメントのうちの少なくとも1つを変換することと
をさらに含む、請求項9に記載の方法。
【請求項13】
少なくとも1つの変換済みデータ・セグメントが機械学習サービスにストリーミングされる、請求項12に記載の方法。
【請求項14】
説明可能な機械学習に基づいて次元削減を可能にすることをさらに含む、請求項9に記載の方法。
【請求項15】
前記オートエンコーダ・アーキテクチャが、Shapley加法的説明分析から抽出された主要な特徴にさらに基づく、請求項9に記載の方法。
【請求項16】
前記利益対リソース・スコアが閾値を超えており、再構築損失を最小限に抑えるように前記オートエンコーダ・アーキテクチャが選択される、請求項9に記載の方法。
【請求項17】
プライバシ主導型データ共有のためのコンピュータ・プログラム製品であって、前記コンピュータ・プログラム製品が、プログラム命令が組み込まれたコンピュータ可読記憶媒体を備え、前記プログラム命令が、プロセッサに機能を実行させるために前記プロセッサによって実行可能であり、前記機能が、
前記プロセッサによって、データセットの利益対リソース・スコアを計算することと、
前記利益対リソース・スコアに基づいてオートエンコーダ・アーキテクチャを選択することであって、前記オートエンコーダ・アーキテクチャが、前記利益対リソース・スコアに基づいて再構築損失の最小化と必要な記憶空間の最小化とのバランスをとる、前記選択することと、
前記オートエンコーダ・アーキテクチャに基づいた変換関数を用いて、前記データセットを変換済みデータに変換することと、
前記変換済みデータをユーザ空間に記憶することと
を含む、コンピュータ・プログラム製品。
【請求項18】
前記利益対リソース・スコアが閾値を超えており、再構築損失を最小限に抑えるように前記オートエンコーダ・アーキテクチャが選択される、請求項17に記載のコンピュータ・プログラム製品。
【請求項19】
前記機能が、
前記データセットをデータ・セグメントにセグメント化することと、
前記データ・セグメントのそれぞれについてセグメント利益対リソース・スコアを計算することと、
前記セグメント利益対リソース・スコアに基づいて、前記データ・セグメントのそれぞれについてセグメント・オートエンコーダ・アーキテクチャを選択することと、
前記セグメント・オートエンコーダ・アーキテクチャのうちの少なくとも1つを活用して、前記データ・セグメントのうちの少なくとも1つを少なくとも1つの変換済みデータ・セグメントに変換することと、
前記データ・セグメントのうちの前記少なくとも1つを変換することと
をさらに含む、請求項17に記載のコンピュータ・プログラム製品。
【請求項20】
前記機能が、
前記データセットをデータ・セグメントにセグメント化することと、
前記データ・セグメントのそれぞれについてセグメント利益対リソース・スコアを計算することと、
前記データ・セグメントを変換済みデータ・セグメントに変換することと、
前記変換済みデータ・セグメントのうちの1つまたは複数をコンテンツ・パーソナライザにストリーミングすることと
をさらに含む、請求項17に記載のコンピュータ・プログラム製品。
【発明の詳細な説明】
【技術分野】
【0001】
本開示は、データ・プライバシに関し、より詳細には、ユーザに合わせて調整されたユーザ間の対話を生成しながらデータを保護することに関する。
【背景技術】
【0002】
オンライン・サービスがますます普及している。多くのユーザは、プライバシに対する懸念から、オンラインで情報を提供することを躊躇している。したがって、オンライン・プロバイダは、ユーザ・データを保護する方法を常に模索している。
【発明の概要】
【0003】
本開示の実施形態は、プライバシ主導型データ共有(privacy-driven data sharing)のための方法、システム、およびコンピュータ・プログラム製品を含む。実施形態は、プロセッサによって、データセットの利益対リソース・スコア(benefit-to-resource score)を計算することを含んでもよい。利益対リソース・スコアに基づいてオートエンコーダ・アーキテクチャが選択されてもよく、オートエンコーダ・アーキテクチャは、利益対リソース・スコアに基づいて再構築損失の最小化と必要な記憶空間の最小化とのバランスをとる。データセットは、前記オートエンコーダ・アーキテクチャに基づいた変換関数を用いて、変換済みデータに変換されてもよい。変換済みデータは、ユーザ空間に記憶されてもよい。
【0004】
上記の概要は、例示された各実施形態または本開示のすべての実装形態を説明することを意図したものではない。
【0005】
本出願に含まれる図面は、本明細書に組み込まれ、本明細書の一部を形成する。これらは、本開示の実施形態を例示しており、説明とともに本開示の原理を解説する役割を果たす。図面は、特定の実施形態を例示しているにすぎず、本開示を限定するものではない。
【図面の簡単な説明】
【0006】
【
図1】本開示のいくつかの実施形態による、システムの代表的な構成要素の通信フローを示す図である。
【
図2】本開示のいくつかの実施形態による、プライバシ主導型データ共有のためのオーケストレーション・フローを示す図である。
【
図3】本開示のいくつかの実施形態による、プライバシ主導型データ共有システムを示す図である。
【
図4】本開示のいくつかの実施形態による、次元削減を使用したデータ共有方法を示す図である。
【
図5】本発明の一実施形態による、クラウド・コンピューティング環境を示す図である。
【
図6】本発明の一実施形態による、抽象化モデル層を示す図である。
【
図7】本開示の実施形態による、本明細書に記載の方法、ツール、およびモジュール、ならびに任意の関連機能のうちの1つまたは複数を実装する際に使用され得る例示的なコンピュータ・システムの高レベル・ブロック図である。
【発明を実施するための形態】
【0007】
本発明は様々な修正形態および代替形態に従うことができるが、その具体的内容は、例として図面に示されており、詳細に説明される。しかしながら、本発明を記載されている特定の実施形態に限定することは意図されていないことが理解されるべきである。それとは反対に、本発明の範囲内に含まれるすべての修正形態、均等物、および代替形態を網羅することを意図している。
【0008】
本開示の態様は、データ・プライバシに関連し、より詳細な態様は、ユーザ間(例えば、ユーザ(製品購入者)と様々な製品プロバイダとの間)の、ユーザに合わせて調整された対話を生成しながら、ユーザ情報およびその他のデータを保護することに関する。
【0009】
オンライン製品プロバイダには、オンライン市場(例えば、インターネット)において製品を提供する組織が含まれることがある。オンライン製品プロバイダ(あるいは、製品プロバイダまたはプロバイダ)には、商品プロバイダ、サービス・プロバイダ、または他の様々な製品が含まれることがある。製品プロバイダは、電子機器、衣類、繊維、および自動車部品などの商品を提供することがある。例えば、プロバイダは、ユーザに商品を販売するオンライン小売店を運営する商品プロバイダであってもよい。製品プロバイダは、ソーシャル・メディア・サービスおよびウェブ・ホスティング・サービスなどのオンライン・サービスを提供することがある。製品プロバイダは、芝刈り、ハウス・クリーニング、および自動車修理などの現実世界のサービスを提供することがある。例えば、プロバイダは、ウェブ・ホスティング・サービスを提供するオンライン・ポータルを運営するサービス・プロバイダであってもよい。
【0010】
プロバイダは、スマートフォンまたはラップトップ・コンピュータなどのユーザ・デバイスを介してユーザから要求を受信することによって動作してもよい。プロバイダは、要求の履行の一部として要求を解析してもよい。例えば、オンライン小売業者は、ユーザのユーザ・デバイスから1つまたは複数のパラメータを含む要求を受け取ってもよく、ユーザは、シャツの購入に興味がある場合があり、オンライン小売業者は、シャツに関するサイズ、色、ブランド、所属チームなどに関連するユーザ・デバイスからのパラメータを解析してもよい。ユーザは、ビーチに着ていくための小さい緑色のシャツを探している場合があり、ユーザ・デバイスは、サイズが小さいこと、色が緑色であること、季節が夏であることを示すパラメータを送信する場合がある。それに対応して、プロバイダは、パラメータに一致するシャツのリストを返してもよい。
【0011】
プロバイダによって受信されたデータには利点がある可能性がある。第1に、プロバイダは、データを直接使用して、ユーザとの将来の対話に利益をもたらすことができる。例えば、プロバイダは、ユーザの許可を得て、ユーザの名前、住所、および購入履歴などのユーザ情報を保存してもよい。プロバイダは、ユーザ情報に対して1つまたは複数のアルゴリズムを実行して、データに関する洞察(insight)を生成してもよい。洞察は、ユーザによって提供された受信データには存在しなかった情報、またはユーザからのさらなる入力なしに受信データの分析のみに基づいて作成されたデータを含む、1つまたは複数の新しいデータ要素であってもよい。例えば、ユーザが、第1のブランドの特定のサイズの衣類(例えば、ジャケット)である第1の物品と、第2のブランドの第2のサイズの衣類(例えば、第2のジャケット)である第2の物品とを購入する場合、洞察は新しいデータとすることができ、この例では、新しいデータは、ユーザが好む可能性のある衣類サイズの範囲、ユーザが特定の物品を購入することを好む時間帯、ユーザが衣類を購入することを好む領域内の位置(例えば、自宅に対する相対的な位置、例えばリビング・ルームなど)であってもよい。アルゴリズムは、ユーザ情報のデータを分析し、データに関する結論を引き出すために使用される方法、プロセスなどであってもよい。例えば、プロバイダは、ユーザが暦年の秋の月にピンクのシャツを購入することを好むことを示す洞察を生成してもよい。
【0012】
第2に、プロバイダは、データを直接使用して、他のユーザとの対話に利益をもたらすことができる。例えば、プロバイダは、自分のユーザ・デバイスから要求を送信した複数のユーザに関するデータを収集してもよく、プロバイダは、アルゴリズムを使用して分析を実行し、多くのユーザが毎年11月の第2週にコートを購入することを好むという洞察を生成してもよい。
【0013】
さらに、製品プロバイダは、要求からさらなる利益を得ることができる。プロバイダは、ユーザ情報、その情報によって生成された洞察、または1人もしくは複数人のユーザの他のデータもしくはそのユーザに関連する他のデータ、あるいはその組合せから(例えば、お金を稼ぐことによって)間接的に利益を得ることができる。プロバイダが間接的に利益を得ることができる第1の方法は、データを他のプロバイダに販売することによるものである。例えば、第1のオンライン小売業者は、第1のオンライン小売業者がユーザのためにデータを収集または生成した場合に第1のオンライン小売業者がそのデータを第2のオンライン小売業者と共有するという契約を第2のオンライン小売業者と結んでいる場合がある。このような実施形態では、ユーザは、契約について通知を受けることができ、第2のオンライン小売業者にデータを提供しないことを選択することができる。
【0014】
ユーザの情報の共有および洞察の生成またはユーザに関連する任意の他のデータに関して、ユーザにとって多くの欠点が生じる可能性がある。例えば、情報は、ユーザにとって機密性の高いものである可能性がある(例えば、生年月日、SSNなど)。別の例では、ユーザは、情報が共有されること自体を望ましくないと感じる可能性がある。具体的には、ユーザは、任意の特定の情報自体を機密性が高いまたは個人的な情報であると識別しない場合があるが、ユーザは、プロバイダおよび広告主などの他のエンティティがユーザに関連する情報にアクセスし、その情報を収集および使用していることを望ましくないと感じる可能性がある。
【0015】
ユーザは、プロバイダとのデータの共有を回避しようと試みた結果として、オンライン・サービスの使用を中止する場合がある。ユーザは、データ収集に参加すること、または特定のオンライン・プロバイダを使用することを望まない場合がある。その結果、オンライン・プロバイダは、顧客を獲得することがさらに困難になる可能性がある。場合によっては、ユーザは、データの収集を阻止するまたは阻止しようと試みるサード・パーティ・ユーティリティをインストールすることがある。これらのサード・パーティ・ユーティリティは、精査されていないかまたは安全ではない可能性がある。例えば、サード・パーティ・ユーティリティは、ユーザ・デバイス上で過剰な処理能力を使用すること、またはユーザ・デバイス上で大量のランダム・アクセス・メモリ(RAM)を消費することがあり、その結果、サード・パーティ・ユーティリティは、ユーザ・デバイス上の速度低下またはデータ損失あるいはその両方を引き起こす可能性がある。
【0016】
加えて、政府および他の規則制定当局などの様々な規制機関が、様々な状況においてユーザ情報を収集も共有もしないこと、またはそれ以外の方法で使用しないことを求める法律および規制を定めている。例えば、欧州連合で制定された一般データ保護規則(GDPR:General Data Protection Regulation)は、プロバイダおよび広告主に対し、特定のユーザ情報または生成された洞察あるいはその両方を収集も表示もしないよう求める場合がある。したがって、場合によっては、GDPRに準拠するために、広告主および製品プロバイダは、規制に準拠するための効率の低い方法でオンライン事業を運営する場合がある。例えば、プロバイダは、ユーザが開始した要求の結果をパーソナライズすることなくオンライン・ストアを運営する。これにより、ユーザ・デバイスがより多くの結果を受信すること、ユーザ・デバイスの処理が遅くなること、または製品プロバイダから結果を提供するために必要なネットワーク帯域幅が増加すること、あるいはその組合せにつながる恐れがある。同様に、ユーザ向けに調整されていない広告を広告主から受信することにより、ユーザ・デバイスからの応答が遅くなる、またはメモリ使用量が増加する、あるいはその両方の可能性がある。
【0017】
プライベート・クラウド環境における洞察生成(IGPCE:Insight generation in private cloud environments)は、性能の向上を実現しながら規制への準拠を可能にすることができる。IGPCEは、ユーザのプライバシを損なうことなく、様々なオンライン製品プロバイダにわたってユーザ体験のパーソナライズを提供し、ユーザに提供される広告または他の提供品のカスタマイズを強化するように動作することができる。IGPCEは、高度にパーソナライズされたサービスの運用を容易にすると同時に、ユーザの消費習慣および他の個人情報を共有することに対してユーザが抱く信頼感を高めることができる。IGPCEは、GDPRへの準拠などのより厳格なデータ取扱要件に準拠しながら動作することができる。
【0018】
さらに、IGPCEは、ユーザが、ユーザ・データのアクセスおよび記憶と、ユーザ・データについて生成される洞察との両方を容易に制御できるようにすることができ、これにより、ユーザ情報を共有すること、そのデータをパーソナライズすること、または、ユーザ情報に基づいてデータに基づく洞察を生成できるようにすること、あるいはその組合せに対してユーザが同意する可能性が高まる場合がある。IGPCEを使用することにより、ユーザの生活機能の質を向上させることができる。例えば、ユーザは、様々なオンライン・プロバイダを見てまわるときに、ユーザに合わせた提供品、広告、および絞り込まれた検索結果を受け取ることができる。このユーザに合わせて調整されたオンライン体験を常に伴うことより、実際のユーザ情報がプロバイダと共有される方法を制限することができる。さらに、いくつかの実施形態では、製品(例えば、商品およびサービス)を消費するために、IGPCEをユーザ・デバイスとオンライン製品プロバイダとの間の仲介役として利用することにより、一部またはすべてのユーザ・データをプロバイダのいずれとも共有しなくても済む。
【0019】
IGPCEは、ユーザによって所有および制御されるユーザ・デバイスからのユーザが開始した要求を検出することによって動作することができる。IGPCEは、ユーザが開始した要求およびIGPCEに提供される他のユーザ情報に対する分析を実行することができる。例えば、ユーザは、IGPCEを通じて提供されるサービスにログインまたはサインアップし、これにより、アカウントを受け取り、プライベート・クラウドを割り当てられてもよい。ユーザは、ユーザの名前、年齢、個人のメールアドレスなどのユーザ情報をIGPCEに提供することができる。ユーザに割り当てられたIGPCEのプライベート・クラウドは、ユーザ情報(例えば、ユーザに関連するデータ)を記憶するように構成されてもよい。
【0020】
いくつかの実施形態では、プライベート・クラウドは、ユーザについて生成された洞察を記憶するように構成されてもよい。例えば、IGPCEを使用するユーザは、プライベート・クラウドに製品プロバイダからの商品を間接的にブラウズさせてもよく、プライベート・クラウドは、製品プロバイダに向けてユーザが開始した要求の1つまたは複数のパラメータを収集してもよい。プライベート・クラウドはまた、製品プロバイダによって提供された商品またはサービスあるいはその両方に関連する(例えば、ユーザが何かを購入したという)購入決定を収集してもよい。プライベート・クラウドは、購入の情報に関連する分析を実行するとともに、ユーザが開始した要求を分析して1つまたは複数の洞察(例えば、ユーザはロング・ジャケットを好む)を生成してもよい。生成された洞察はプライベート・クラウドに記憶され、さらなるオンライン対話に使用されてもよい。例えば、製品プロバイダに対して商品またはサービスを求める後続の要求が検出された場合、プライベート・クラウドは、ユーザが開始した要求の1つまたは複数のパラメータと以前に生成された洞察との両方に基づいて、プロバイダ応答を変更してもよい(例えば、プロバイダ応答の結果を並べ替える、またはフィルタリングする、あるいはその両方)。例えば、ユーザが以前に青い靴下を探していた場合、ショーツについての新たな検索は、青色に基づいてフィルタリングされてもよい。
【0021】
IGPCEのプライベート・クラウドは、スマート・オーケストレーションを実行して、ユーザおよびユーザ検索に関連する情報を分析してもよい。具体的には、IGPCEは、ユーザに属するデバイスが、ユーザが開始した要求を製品プロバイダに送信していることを検出してもよい。プライベート・クラウドは、ユーザが開始した要求をインターセプトし、要求に対する分析を実行して、ユーザの特定のユーザ情報を決定してもよい。IGPCEのプライベート・クラウドは、ユーザが開始した要求から特定のパラメータを削除して、匿名化された要求を作成し、その匿名化された要求を製品プロバイダに送信してもよい。プライベート・クラウドは、製品プロバイダからプロバイダ応答を受け取り、ユーザが開始した要求のパラメータとプロバイダ応答内の結果とに基づいて、対象を絞った応答を生成し、その対象を絞った応答を、ユーザが元の要求を送信するために使用したデバイスに送信してもよい。
【0022】
一例では、ユーザは、小売ウェブサイトで一足の靴を探している場合があり、ユーザは、「サイズ9のテニス・シューズ」を求める要求を小売ウェブサイトに送信する場合がある。プライベート・クラウドは、デバイスからの要求をインターセプトし、その要求をユーザ情報(例えば、ユーザ・デバイスからの要求の1つまたは複数のパラメータで指定された靴のサイズ)について分析し、要求を匿名化してもよい。プライベート・クラウドは、「サイズ7からサイズ10の靴」を唯一のパラメータとして使用するなど特定のパラメータを削除することによって、要求を匿名化してもよい。匿名化された要求は、ユーザに代わってプライベート・クラウドを介して送信されてもよく、プライベート・クラウドは、オンライン靴小売業者に「靴」を求める要求を送信し、「サイズ7からサイズ10」の匿名化された要求に一致する靴のリストを受け取ってもよい。プライベート・クラウドは、サイズ「9」の靴ではない、または「テニス・シューズ」以外のタイプのすべての結果をフィルタリングして除外することによって、対象を絞った応答を生成してもよい。プライベート・クラウドは、ユーザ・デバイスを介してユーザに「サイズ9のテニス・シューズ」の応答を送信し、ユーザ・データのプライバシを維持するとともにデータ・プライバシ規制を遵守しながら、パーソナライズされた要求を完了する。
【0023】
いくつかの実施形態では、IGPCEのポータブル構成要素がユーザ・デバイス上で実行されてもよい。ポータブル構成要素は、プラグイン(例えば、ブラウザ・プラグイン)、デバイスのソフトウェア環境の一部として実行されるバックグラウンド・プログラム(例えば、デーモンまたはジョブ)、または製品プロバイダで検索を実行しユーザが開始した要求に基づいて洞察を生成するように設計されたアルゴリズムであってもよい。ポータブル構成要素は、ユーザが開始した要求の検出を実行してもよい。
【0024】
ポータブル構成要素は、ユーザが開始した要求を製品プロバイダが受け取れないようにすることによって動作してもよい。例えば、ポータブル構成要素は、ユーザが開始した要求を、アウトバウンド要求キュー、ネットワーク・スタック、またはユーザ・デバイスの他の送信構成要素から、インターセプトしてもよい。ポータブル構成要素は、要求をIGPCEのプライベート・クラウドに送信し、対象を絞った応答をプライベート・クラウドから受信してもよい。
【0025】
ポータブル構成要素は、例えば、製品プロバイダのウェブサイトまたはオンライン・ポータルに基づいてもよい。ポータブル構成要素は、IGPCEによる洞察の向上を可能にする様々なデータ特徴を自動的に取り出してもよい。このようなデータは、製品プロバイダによって別の方法で生成されていてもよい。具体的には、プライベート・クラウド(例えば、プライベート・クラウド上で実行されるオーケストレーション・エンジン)は、製品プロバイダ、またはユーザの洞察に基づいて、(ユーザが開始したクエリの1つまたは複数のパラメータにおいて)要求された製品のタイプを識別してもよい。プライベート・クラウドは、ポータブル構成要素によって使用される特定の洞察生成エンジン(例えば、アルゴリズム)をさらに識別してもよい。例えば、ユーザが最初のオンライン小売業者でシャツを閲覧している場合、IGPCEのプライベート・クラウドのオーケストレーション・エンジンは、最初のオンライン小売業者に対して特定のタイプの検索を実行すること、およびその小売業者に基づいて洞察を生成することが可能な、特定の洞察生成エンジンを識別してもよい。
【0026】
洞察生成をプライベート・クラウドからユーザ・デバイス上で実行されるIGPCEのポータブル構成要素へオフロードすることは、ユーザにとっての技術的な利点を含む可能性がある。例えば、洞察生成のための処理能力は、スマートフォン上で実行されるプラグインに分散されてもよく、IGPCEをホストするサーバからその処理能力をオフロードしてもよい(例えば、スマートフォンの構成要素が、サーバによって実行される処理を軽減する)。集合体でのオフロードは、コンピューティング・リソース(例えば、処理サイクルおよびメモリ空間)を節約する可能性がある。
【0027】
いくつかの実施形態では、IGPCEは、ユーザのデバイス上にポータブル構成要素がインストールされることなく動作してもよい。例えば、プライベート・クラウドは、ユーザが製品プロバイダに接続して閲覧するためのオンライン・ポータル、ウェブサイト、または他のネットワーク宛先をホストしてもよい。ネットワーク宛先が含まれる場合もあれば、すべてのネットワーク・トラフィックがネットワーク宛先を経由して流れる場合もある。プライベート・クラウドは、トラフィックを監視して、ユーザが開始した要求を検出し、プライベート・クラウドから要求が離れないように要求をインターセプトしてもよい。
【0028】
IGPCEはまた、ユーザに自分のユーザ情報の完全な制御を提供してもよい。例えば、ユーザは、特定の製品プロバイダから、データを共有するよう、またはユーザのデータに基づいて洞察を生成することを許可するよう求める要求を受け取ってもよい。ユーザは、その要求に対して拒否応答で応答してもよい。拒否応答は、情報を製品プロバイダと共有しないよう求める要求であってもよい。拒否応答の結果として、IGPCEは、ユーザ情報の共有を辞退し、プライベート・クラウドを介した動作を開始してもよい。例えば、ユーザがスマートフォン・アプリを介して拒否応答を提供した場合、IGPCEのポータブル構成要素は、プライベート・クラウドを介して動作を開始してもよい。別の例では、プライベート・クラウド上でユーザが拒否応答を提供した場合、IGPCEは、製品プロバイダへのユーザ情報の提供を阻止してもよい。
【0029】
IGPCEは、透明性を持って動作するように構成されてもよい。例えば、ユーザが、オンライン製品プロバイダに移動して特定の商品またはサービスの検索を開始した場合、製品プロバイダは、データの共有、または製品プロバイダがユーザ・デバイスによって提供されるユーザ情報に基づいて洞察を生成することに対する許可を要求してもよい。ユーザは、許可を与えることによって要求に応答してもよい。許可を与えることにより、ユーザ・デバイスは製品プロバイダと直接通信して、商品およびサービスの閲覧ならびに検索を容易にすることができる。その後、ユーザは、製品プロバイダと情報を共有しないことを決定し、ユーザ・デバイスを介して関連する設定に移動し、情報を提供せずに特定の製品プロバイダを使用することを選択してもよい。これに応じて、ユーザ・デバイス上のポータブル構成要素は、製品プロバイダにユーザ情報を提供せずに動作を開始し、代わりにIGPCEのプライベート・クラウドを介して通信してもよい。
【0030】
本開示の実施形態は、プライバシ主導型データ共有のための方法を含む。方法は、データセットの利益対リソース・スコアを計算することと、利益対リソース・スコアに基づいてオートエンコーダ・アーキテクチャを選択することとを含んでもよい。オートエンコーダ・アーキテクチャは、利益対リソース・スコアに基づいて、再構築損失の最小化と必要な記憶空間の最小化とのバランスをとってもよい。方法は、オートエンコーダ・アーキテクチャに基づいた変換関数を用いて、データセットを変換済みデータに変換することと、変換済みデータをユーザ空間に記憶することとをさらに含んでもよい。
【0031】
図1は、本開示の実施形態による、システムの代表的な構成要素のオーケストレーション・フロー100を示す。
【0032】
1つまたは複数のデータ・ソース110は、ユーザ・アプリケーション120に情報を提供する。データ・ソース110は、例えば、ユーザによるデータの手動エントリ、プログラムによるデータの自動プル、別のアプリケーションに送出されたデータの複製、または他のデータ・ソースなど、データの任意のソースであってもよい。データは、ユーザの様々な面からの情報またはユーザの様々な面に関する情報を含んでもよい。データは、例えば、嗜好122、購入履歴124、ソーシャル・アダプタ126、モノのインターネット(IoT)情報128、決定モデル130、評価モデル132、ビッグデータ分析134、処方的分析136、機械学習138を介して集められたデータ、または同様のものを含んでもよい。
【0033】
ユーザ・アプリケーション120は、オーケストレーション・エンジン140にデータを提供してもよい。オーケストレーション・エンジン140は、ユーザ・プロファイル・データベース112などの他の情報源と通信してもよい。他のデータ・ソースとの通信は、ユーザ・アプリケーション120との通信に加えて、またはその代わりとして行われてもよい。情報は、プロファイル・プロセッサ142においてコンパイルされてもよく、洞察生成器144によって分析されてもよい。洞察生成器144からの分析結果は、プロファイル・プロセッサ142に送出されるか、または記憶されるか、あるいはその両方であってもよい。プロファイル・プロセッサ142は、分析データベース146と通信してもよい。分析データベース146は、アプリケーション・プログラミング・インターフェース148と通信してもよい。
【0034】
オーケストレーション・エンジン140は、ユーザ・デバイス、ユーザ・プライベート・クラウド、サーバ上でユーザのために予約された空間、または同様のものなどのユーザ空間150と通信してもよい。オーケストレーション・エンジン140またはユーザ・アプリケーション120あるいはその両方は、ユーザ空間150(例えば、ユーザ・デバイス上のプログラム、もしくはユーザ・クラウド空間内のアプリケーション)内に、もしくはユーザ空間150の一部として、または独立して存在してもよい(例えば、独立したコンピュータ端末上に配置されるか、もしくはインターネット上で通信するブラウザ経由でアクセス可能なウェブベースのアプリケーション上に配置されてもよい)。
【0035】
ユーザ空間150は、洞察エンジン152、スコア算出器154、セグメンタ156、または変換器158、あるいはその組合せを有してもよい。洞察エンジン152は、ユーザ空間150に記憶された情報、オーケストレーション・エンジン140によって提供された情報、または別の情報源、あるいはその組合せを含み得る情報から、洞察を集めてもよい。洞察エンジン152は、例えば、分析データベース146からの情報をユーザ空間150に記憶された情報と組み合わせて洞察を実現してもよい。洞察エンジン152は、データ・ソース110からのデータ、洞察生成器144からの洞察、ユーザ・プロファイル・データベース112からの情報、ユーザ空間150内に記憶されたデータ、またはその何らかの組合せを含むがこれらに限定されない様々な情報および情報タイプを使用して、1つまたは複数の洞察を導出してもよい。
【0036】
スコア算出器154は、パーソナライゼーションのためにデータを使用する利点またはそれに関連するリソース・コストあるいはその両方に基づいて、1つまたは複数のスコアを算出してもよい。スコア算出器154は、データセット全体、その構成要素、データセットの集計、データセットの構成要素の集計、またはそれの何らかの組合せについてのスコアを算出してもよい。
【0037】
スコア算出器154は、利益対リソース・スコアを算出してもよい。利益対リソース・スコアは、ユーザ利益およびリソース・コストを算出し、次いでユーザ利益をリソース・コストで除算して利益対リソース・スコアを取得することによって計算されてもよい。利益対リソース・スコアは、ユーザ利益対リソース・コスト比、利益対リソース効用比、利益対コスト・スコア、利益対コスト比、利益コスト・スコア、利益コスト・スコア、または利益とその利益を得るために必要なリソースとを比較する同様の用語と呼ばれることもある。典型的には、分数で記述されることが多い比率よりも小数の方が直感的であるので、本開示では主に、容易さを高めるために利益対リソースの比較をスコアとして説明しているが、本開示に従って、定量化可能な利益対コストの任意の表現が使用されてもよい。
【0038】
ユーザ利益およびリソース・コストの算出は、現在知られているまたは後に開発され得る任意の方式で行われてもよい。本開示では、ユーザ利益およびリソース・コストの正規化された値について説明しているが、必要な場合には、正規化されていない値が使用されてもよい。いくつかの実施形態では、各値の正規化は、ゼロ(0)から1の間の数値のスケール上で行われる。例えば、ユーザ利益値およびリソース・コスト値を1から10の間で正規化するなど、利益値およびコスト値の他の正規化も使用されてもよい。いくつかの実施形態では、正規化された利益値およびコスト値は、再正規化されてもよい。例えば、いくつかの実施形態では、ユーザは、第1の正規化スケール(例えば、1~5)でフィードバックを提供してもよく、フィードバックは、利益値または利益対コスト・スコアあるいはその両方への実装のために第2の正規化スケール(例えば、0~1)に再正規化される。
【0039】
利益値は、一般に、アクションまたはプロジェクトから期待される利益の値である。利益値は、あるデータが特定のアプリケーションにとってどれだけ重要であるかに関する測定値であってもよい。利益値は、自動化された手法、手動による手法、または半自動化された手法を使用して算出されてもよい。自動化された手法は、例えば、あるデータを要求する特定のタイプのサービスの数を特定してもよく、あるデータ・セグメントに対する要求が多いほど、利益値は高くなる。代替として、個人が特定のデータ・セグメントの利益値を手動で入力してもよい。半自動化された手法は、データの利益値が自動的に算出されて、ユーザが利益評価を変更するためのフィードバックを提供できるように、自動化された手法と手動による手法とを組み合わせてもよい。フィードバックは、明示的であるか(例えば、調査を介して入力されるか)、または暗黙的であってもよい(例えば、ユーザのアクションまたはアクションをしないことあるいはその両方に基づいて収集されてもよい)。
【0040】
いくつかの実施形態では、半自動化された利益値の算出は、次のように表されてもよい。
【0041】
【0042】
式中、BUserはユーザの利益値であり、MUserはユーザの手動入力であり、kMは手動入力データの正規化定数であり、Aは自動的に収集されたデータであり、kAは自動的に収集されたデータの正規化定数であり、fは補正係数である。
【0043】
補正係数fは、ユーザによって提供されるフィードバックに基づいてもよい。補正係数は、(上記の式で示されているように)データセット全体に影響を与える場合があるか、またはデータセットの一部(1つのデータ点など)にのみ影響を与える場合がある。データセット全体は、(例えば、データセットが有用ではないと判断された場合)最小化されるか、または(例えば、データセットが非常に有用である場合)最大化されてもよい。例えば、引っ越し中に収集された費用データを表す引っ越し費用は、標準的な月次予算を計画するためには有用ではないなど、データセットは、異例であるため有用ではない場合がある。単一のデータ点も同様に、最小化または最大化することによって補正されてもよい。例えば、ユーザは、ある購入が他の人への贈り物であったため、その購入が今後の推奨に影響を与えるべきではないと指示してもよい。
【0044】
いくつかの実施形態では、ユーザは、利益値を算出するための方法を選択してもよい。例えば、ユーザは、利益値の算出が自動、手動、または半自動のいずれであるかを選択してもよい。いくつかの実施形態では、ユーザは、フィードバックを収集および実装するかどうか、およびその方法を選択してもよい。例えば、ユーザは、自動化された利益評価プロセスに明示的なフィードバックのみが統合され得るように指示してもよい。別の例では、ユーザは、暗黙的なフィードバックのみが収集され得るように指示してもよい。いくつかの実施形態では、ユーザは、収集されるフィードバックのタイプと量との両方を選択してもよい(例えば、明示的なフィードバックは週1回の調査に限定され、暗黙的なフィードバックは、指定された時間内の特定の日にのみ収集されてもよい)。
【0045】
リソース・コスト値は、一般に、アクションまたはプロジェクトの実施に関する予想されるコストの値である。リソース・コストは、データの収集、維持、または送信、あるいはその組合せに必要なリソースを決定することによって算出されてもよい。いくつかの実施形態では、収集のリソース・コストは、データを収集するのに必要なリソース(例えば、収集プログラムを記憶するのに必要な記憶空間、およびプログラムを実行するのに必要なメモリ)を含んでもよい。いくつかの実施形態では、リソース・コスト値は、データが記憶のためにどれだけの空間を必要とするかを決定することによって算出されてもよい。したがって、例えば、3メガバイトの記憶空間を必要とするデータは、5ギガバイトの記憶空間を必要とするデータよりもリソース・コストが低くなる。いくつかの実施形態では、リソース・コストは、データを送信するために必要な帯域幅を決定することによって算出されてもよい。
【0046】
いくつかの実施形態では、リソース・コスト値の算出は、次のように表されてもよい。
【0047】
【0048】
式中、RCostはリソース・コストであり、MCはデータ収集に必要とされるメモリであり、MSはデータを記憶するために必要とされるメモリであり、MEはデータを使用するために必要とされるメモリであり、Tは送信コストであり、kRはリソース・コストの正規化定数である。
【0049】
利益対コスト・スコアは、利益の値とコストの値と組み合わせて数値にしたものであり、この数値は、アクションまたはプロジェクトを進めることの望ましさを表現するために使用されてもよい。利益対コスト比が高いほど、次元削減中のデータ損失が最小限に抑えられるようにデータ次元削減中に維持することが好ましいデータであることを示す。例えば、利益値が高く(例えば、正規化された0~1スケールで0.9)、リソース・コストが低い(例えば、正規化された0~1スケールで0.1)場合、利益対コスト・スコアは比較的高くなり(前述の数値を考慮すると、9であり)、したがって、次元削減中に優先的にデータが維持されてもよい。利益対コスト比が低いほど、リソースを維持するために、データの次元削減中に削減することが望ましいデータであることを示す。例えば、利益値が低く(例えば、正規化された0~1スケールで0.1)、リソース・コストが高い(例えば、正規化された0~1スケールで0.9)場合、利益対コスト・スコアは比較的低くなり(前述の数値を考慮すると、約0.111であり)、したがって、リソース消費を削減するために、次元削減中に優先的に削減されてもよい。
【0050】
高い(または低い、または中程度の)利益対コスト・スコアを構成する閾値は、アプリケーションによって異なる場合がある。例えば、記憶空間が限られているシステムは、データ削減よりもデータ維持を優先するために、より高い利益対コスト・スコア閾値(例えば、最小スコア8)を必要とする場合があり、一方、製品のユーザ向け調整を広範に行うシステムは、次元削減中にデータ維持を優先するために、より低い利益対コスト・スコア閾値(例えば、最小スコア2)を必要とする場合がある。複数の閾値が使用されてもよい。例えば、システムは、データを3つの階層(例えば、利益対コスト・スコアが3未満の場合は圧縮階層(compression tier)、利益対コスト・スコアが3から9の間の場合はコンパクション(compaction)のみの階層、利益対コスト・スコアが9を超える場合は非圧縮階層)に分割してもよく、その結果、リソースを維持するためにアプリケーションにとって最も重要でないデータは縮小され、ある程度重要なデータは、リソース・コストのバランスを保ちながら維持され、アプリケーションにとって最も重要なデータは維持される。
【0051】
利益対リソース・スコアの算出は、次のように表されてもよい。
【0052】
【0053】
式中、Sは利益対リソース・スコアであり、BUserはユーザにとっての利益であり、RCostはリソース・コストである。
【0054】
実際問題としても数値的にも、リソース・コストは、無視できる程度である可能性があるが、ゼロ(0)に等しくすることはできない。実際問題として、データの入力、使用、または保存はいずれも、少なくとも何らかのリソースの使用を必要とし、したがって、リソース・コストがかかる。数値的には、リソース・コストがゼロ(0)に等しい場合、利益対コスト・スコアは未定義となる。
【0055】
データ、利益値、リソース値、利益対リソース・スコア、および閾値は、ユーザ空間150に記憶されてもよい。ユーザ空間150は、ユーザが所有する、制御する、またはアクセスできる、あるいはその組合せである、任意のプライベートなまたはその他の指定された空間であってもよい。例えば、ユーザ空間150は、ユーザ・デバイス(例えば、個々のユーザのコンピュータもしくはスマートフォン)、ユーザが所有するプライベート・クラウド(例えば、ユーザが会社である場合の、会社が所有するプライベート・クラウド)、またはクラウド内の指定された空間(例えば、個々のユーザに属するアカウントに割り当てられたクラウド記憶空間)であってもよい。
【0056】
いくつかの実施形態では、ユーザの個人データの利益対リソース・スコアを特定し、その利益対リソース・スコアに比例するデータ損失を考慮してデータの次元を削減することによってリソース制約(例えば、メモリまたはディスク空間の制限)に対処するために、ユーザ・データはユーザ空間150(例えば、プライベート・クラウドまたはユーザ・デバイス)に選択的に記憶される。
【0057】
スコア算出器154は、データセットのセグメントに対するスコアを算出してもよい。データセットは、セグメンタ156を使用してセグメント化されてもよい。セグメンタ156は、1つまたは複数のソースからデータまたはデータセットあるいはその両方を受け取り、データをコンパイルし、データをセグメントに分割してもよい。セグメントはそれぞれ、特定のタイプのデータを含んでもよい。例えば、セグメンタ156は、あるセグメントがユーザの連絡先情報を含み、別のセグメントがユーザの嗜好を含み、別のセグメントがソーシャル・メディア上のユーザ対話を含むように、データをセグメント化してもよい。セグメントは、広範なカテゴリ、細かい詳細を集めたもの、または任意の他のレベルのグループ化であってもよい。例えば、セグメンタ156は、あるセグメントがユーザの連絡先情報を含み、別のセグメントがユーザの衣類購入履歴を含み、別のセグメントがユーザによって明示的に指示された衣類スタイルの嗜好を含み、別のセグメントが、ソーシャル・メディアに投稿された服装に対するユーザの反応に関連する情報を含むように、データをセグメント化してもよい。
【0058】
いくつかの実施形態では、方法は、データセットをデータ・セグメントにセグメント化することと、データ・セグメントのそれぞれについて重み付けを決定することとを含んでもよい。重み付けは、分析サービスの意味論的目的に基づいてもよい。いくつかの実施形態は、重み付けに従って、オートエンコーダ・アーキテクチャにおける変換強度の低減(reduce-transformation intensities)を可能にすることも含んでもよい。
【0059】
ユーザ空間150内のデータは、変換器158によって変換されてもよい。変換器158は、データ、データ・セグメント、またはそれらの何らかの組合せを変換してもよい。ユーザ空間150は、変換済みデータ162および関連付けられた変換キー164をプロバイダ170に配信してもよい。プロバイダ170は、情報を要求していてもよく、代替として、プロバイダ170は、情報を要求せずに、ユーザ空間150から情報を受け入れてもよい。プロバイダ170は、サービスまたは製品あるいはその両方を提供してもよい。プロバイダ170は、例えば、サービス・プロバイダ172および製品プロバイダ174などの複数のセグメントを有してもよい。変換済みデータ162および変換キー164の複数のセットが、同じまたは異なる目的のためにプロバイダ170に送出されてもよい。
【0060】
いくつかの実施形態では、利益対リソース・スコアが閾値を超えており、再構築損失を最小限に抑えるようにオートエンコーダ・アーキテクチャが選択される。
【0061】
いくつかの実施形態では、方法は、データセットをデータ・セグメントにセグメント化することと、データ・セグメントのそれぞれについてセグメント利益対リソース・スコアを計算することとを含んでもよい。いくつかの実施形態は、データ・セグメントを変換済みデータ・セグメントに変換することと、変換済みデータ・セグメントのうちの1つまたは複数をプロバイダ170などのコンテンツ・パーソナライザにストリーミングすることとを含んでもよい。
【0062】
いくつかの実施形態では、方法は、データセットをデータ・セグメントにセグメント化することと、データ・セグメントのそれぞれについてセグメント利益対リソース・スコアを計算することと、セグメント利益対リソース・スコアに基づいてデータ・セグメントのそれぞれについてセグメント・オートエンコーダ・アーキテクチャを選択することと、セグメント・オートエンコーダ・アーキテクチャのうちの少なくとも1つを活用して、データ・セグメントのうちの少なくとも1つを少なくとも1つの変換済みデータ・セグメントに変換することと、データ・セグメントのうちの少なくとも1つを変換することとを含んでもよい。いくつかの実施形態では、少なくとも1つの変換済みデータ・セグメントはプロバイダ170であってもよい機械学習サービスにストリーミングされる。
【0063】
図2は、本開示のいくつかの実施形態による、プライバシ主導型データ共有方法200を示す。プロバイダ202は、情報を求める要求を処理エンジン210に送出してもよい。処理エンジン210は、プロバイダ202によって要求された情報について、ユーザ利益値を定量化し(212)、リソース消費値を定量化してもよい(214)。処理エンジン210は、要求された情報についての利益対リソース・スコアを算出し(216)、その情報について算出された利益対リソース・スコアに基づいて、その情報に対する変換関数を決定してもよい(218)。
【0064】
処理エンジン210は、変換済みデータおよびその変換関数(1つまたは複数)をストレージ220に送信してもよい。ストレージ220は、変換済みデータをセグメント化してもよい(222)。代替として、変換済みデータは、事前にセグメント化されている場合があるか、または変換済みデータは、セグメント化を必要としない場合がある。変換済みデータおよびその変換関数は、要求に応じてプロバイダ202に送信されてもよい(230)。
【0065】
データをエンコードおよびデコードするために、オートエンコーダが使用されてもよい。本開示によるデータの識別、セグメント化、または変換、あるいはその組合せのために、任意の機械学習モデルが使用されてもよい。十分に訓練された機械学習モデルは、次元入力を使用して再構築損失を最小限に抑えることができる。オートエンコーダは、深層学習モデルのハイパーパラメータに基づいたオートエンコーダ・アーキテクチャを有することになる。ハイパーパラメータには、例えば、学習率、ミニバッチ・サイズ、隠れ層の数、隠れユニットの数、エポックの数、および活性化関数、ならびに、知られているまたは今後発見され得る他のハイパーパラメータが含まれることがある。
【0066】
オートエンコーダ・アーキテクチャは、効用スコア(utility score)に基づいて、変換関数の選択を決定またはガイドしてもよい。オートエンコーダ・アーキテクチャは、効用スコアに基づいたデータ損失許容量を含んでもよい。例えば、利益対コスト・スコアは、特定のデータ・セグメント上のデータの最大10%の損失が許容されることを示してもよい。その場合、変換関数は、圧縮されたデータ・セグメントの最大10%の損失を伴うデータ圧縮を可能にすることができる。オートエンコーダ・アーキテクチャは、あるデータ・セグメント(例えば、利益対リソース・スコアが低いセグメント)上の一部のデータの損失を許可すると同時に、他のデータ・セグメント(例えば、利益対リソース・スコアが高いセグメント)上のデータを維持することができる。
【0067】
図3は、本開示のいくつかの実施形態による、プライバシ主導型データ共有システム300を示す。プライバシ主導型データ共有システム300は、セグメンテーション・エンジン322と、要求プロセッサ330と、セグメント・セレクタ340とを包含するストレージ310を含んでもよい。ストレージ310は、セグメンテーション・エンジン322によってセグメント化され得るデータ312を包含してもよい。セグメンテーション・エンジン322は、データの使用状況を識別し(324)、使用状況に基づいてデータをセグメント化してもよい(326)。したがって、データ312は、セグメント化されたデータ314に区分化されてもよい。
【0068】
プロバイダ352は、データ要求354を要求プロセッサ330に送出してもよい。要求プロセッサ330は、要求についてセグメント・セレクタ340と通信してもよい。セグメント・セレクタ340は、データ要求354に応答するために、セグメント化されたデータ314からセグメントを選択してもよい。セグメント・セレクタ340は、セグメント化されたデータ314からデータの1つまたは複数のセグメント332を選択し、そのセグメントをプロバイダ352に送出して、データ要求354に応答してもよい。
【0069】
セグメント・セレクタ340は、ユーザによって与えられた許可342およびデータ・セグメントについて算出された効用スコア344などの様々な因子に基づいて、セグメントをプロバイダ352に送出すべきかどうかを評価してもよい。許可342は、例えば、あるデータ・セグメントを任意のプロバイダまたは情報を要求している特定のプロバイダ352に公開することをユーザが許可していることを確認するためのチェックを含んでもよい。効用スコア344は、例えば、利益対コスト・スコアであってもよい。効用スコア344は、データ・セグメントとデータ要求との整合性(例えば、データ・セグメントが特定のデータ要求354にどの程度関連しているか)を示してもよい。
【0070】
図4は、本開示のいくつかの実施形態による、削減を使用したデータ共有方法400を示す。データ共有方法400は、ユーザ空間402内に維持されるユーザ・データ410を含む。効用スコアが抽出されてもよい(420)。効用スコアは、様々なツールを使用して抽出されてもよい(420)。例えば、サービスとしての消費者洞察(CIAAS:consumer insight as a service)が、効用スコアを抽出してもよい(420)。効用スコアは、例えば、利益対リソース・スコア、特定のクエリに対するデータの関連性を定量化する適切性算出、または同様のものであってもよい。
【0071】
次元削減が行われてもよい(430)。次元削減(430)は、抽出された(420)効用スコアに依存してもよい。抽出された(420)効用スコアまたは所望の次元削減(430)あるいはその両方に基づいて、変換関数が決定されてもよい(440)。決定された(440)変換関数を使用して、ユーザ・データ410が変換されてもよい(452)。変換済みデータは、プロバイダ406に送出されてもよい(454)。
【0072】
プロバイダ406は、データから洞察を集めるためにデータを再変換してもよい(456)。プロバイダ406は、ユーザ空間402を介してプロバイダ・データ460をユーザに提供してもよい。プロバイダ・データ460は、変換されて(462)送出されるか(464)、または変換(462)なしで送出されてもよい(464)。プロバイダ406は、ユーザと同じ動作を使用してもよい(例えば、プロバイダ406は、効用スコアを抽出し、好ましい次元削減を決定し、変換関数を決定してもよい)。プロバイダ406は、未変換のデータをユーザ空間402に送出してもよい。次いで、ユーザ空間402に送出された変換済みデータは、再変換されてもよい(466)。データ再変換456および466は、ユーザ空間402、プロバイダ空間、または両方の空間の外側で行われてもよい。
【0073】
いくつかの実施形態では、方法は、説明可能な機械学習に基づいて次元削減を可能にすることを含んでもよい。いくつかの実施形態では、オートエンコーダ・アーキテクチャは、Shapley加法的説明分析(Sharpley additive explanations)から抽出された主要な特徴にさらに基づいている。
【0074】
本開示はクラウド・コンピューティングに関する詳細な説明を含むが、本明細書に記載された教示の実装はクラウド・コンピューティング環境に限定されないことを理解されたい。むしろ、本開示の実施形態は、現在知られているまたは後に開発される他の任意のタイプのコンピューティング環境と併せて実装されることが可能である。
【0075】
クラウド・コンピューティングは、最小限の管理労力またはサービスのプロバイダとの最小限の対話で迅速にプロビジョニングおよびリリースされ得る構成可能なコンピューティング・リソース(例えば、ネットワーク、ネットワーク帯域幅、サーバ、処理、メモリ、ストレージ、アプリケーション、仮想マシン、およびサービス)の共用プールへの簡便なオンデマンドによるネットワーク・アクセスを可能にするためのサービス提供のモデルである。このクラウド・モデルは、少なくとも5つの特徴、少なくとも3つのサービス・モデル、および少なくとも4つの展開モデルを含み得る。
【0076】
特徴は、次の通りである。
【0077】
オンデマンド・セルフサービス:クラウド消費者は、サービス・プロバイダと人間との対話を必要とすることなく、必要に応じて自動的に、サーバ時間およびネットワーク・ストレージなどのコンピューティング機能を一方的にプロビジョニングすることができる。
【0078】
広範なネットワーク・アクセス:機能は、ネットワーク上で利用可能であり、異種のシン・クライアント・プラットフォームまたはシック・クライアント・プラットフォーム(例えば、携帯電話、ラップトップ、およびPDA)による使用を促進する標準的なメカニズムを介してアクセスされる。
【0079】
リソースのプール化:プロバイダのコンピューティング・リソースは、マルチテナント・モデルを使用して複数の消費者にサービス提供するようにプール化され、要求に応じて、異なる物理リソースおよび仮想リソースが動的に割当ておよび再割当てされる。消費者は一般に、提供されたリソースの正確な部分について制御も知識も有していないが、より高い抽象化レベル(例えば、国、州、またはデータセンタ)で部分を特定することが可能であり得るという点で、部分の独立性があるといえる。
【0080】
迅速な柔軟性:機能を迅速かつ柔軟に、場合によっては自動的にプロビジョニングして、急速にスケール・アウトし、迅速に解放して急速にスケール・インすることができる。消費者にとっては、プロビジョニングに利用可能な機能は、しばしば無制限であるように見え、いつでも任意の数量で購入することができる。
【0081】
サービスの測定:クラウド・システムは、サービスのタイプ(例えば、ストレージ、処理、帯域幅、およびアクティブなユーザ・アカウント)に適した一定の抽象化レベルでの計量機能を活用することによって、リソースの使用を自動的に制御および最適化する。リソースの使用量を監視、制御、および報告することができ、利用するサービスのプロバイダと消費者との両方に透明性がもたらされる。
【0082】
サービス・モデルは、次の通りである。
【0083】
ソフトウェア・アズ・ア・サービス(SaaS):クラウド・インフラストラクチャ上で動作しているプロバイダのアプリケーションを使用するために、消費者に提供される機能である。アプリケーションは、ウェブ・ブラウザ(例えば、ウェブ・ベースの電子メール)などのシン・クライアント・インターフェースを介して様々なクライアント・デバイスからアクセス可能である。限定されたユーザ固有のアプリケーション構成設定の想定される例外として、消費者は、ネットワーク、サーバ、オペレーティング・システム、ストレージ、または個々のアプリケーション機能をも含む基礎となるクラウド・インフラストラクチャを管理も制御もしない。
【0084】
プラットフォーム・アズ・ア・サービス(PaaS):プロバイダによってサポートされるプログラミング言語およびツールを使用して作成された、消費者が作成または取得したアプリケーションをクラウド・インフラストラクチャ上に展開するために、消費者に提供される機能である。消費者は、ネットワーク、サーバ、オペレーティング・システム、またはストレージなどの基礎となるクラウド・インフラストラクチャを管理も制御もしないが、消費者は、展開されたアプリケーション、および場合によっては環境構成をホストするアプリケーションを制御する。
【0085】
インフラストラクチャ・アズ・ア・サービス(IaaS):オペレーティング・システムおよびアプリケーションを含み得る任意のソフトウェアを消費者が展開および実行することができる、処理、ストレージ、ネットワーク、および他の基本的なコンピューティング・リソースをプロビジョニングするために消費者に提供される機能である。消費者は、基礎となるクラウド・インフラストラクチャを管理も制御もしないが、オペレーティング・システム、ストレージ、および展開されたアプリケーションを制御し、消費者は、場合によっては選択されたネットワーク構成要素(例えば、ホスト・ファイアウォール)を限定的に制御する。
【0086】
展開モデルは、次の通りである。
【0087】
プライベート・クラウド:クラウド・インフラストラクチャは、ある組織のためだけに運用される。このクラウド・インフラストラクチャは、組織またはサード・パーティによって管理される場合があり、オンプレミスまたはオフプレミスに存在する場合がある。
【0088】
コミュニティ・クラウド:クラウド・インフラストラクチャは、複数の組織によって共有され、関心事項(例えば、任務、セキュリティ要件、ポリシー、またはコンプライアンス上の考慮事項、あるいはその組合せ)を共有している特定のコミュニティをサポートする。このクラウド・インフラストラクチャは、組織またはサード・パーティによって管理される場合があり、オンプレミスまたはオフプレミスに存在する場合がある。
【0089】
パブリック・クラウド:クラウド・インフラストラクチャは、一般公衆または大規模な業界グループにとって利用可能であり、クラウド・サービスを販売する組織によって所有される。
【0090】
ハイブリッド・クラウド:クラウド・インフラストラクチャは、2つ以上のクラウド(プライベート、コミュニティ、またはパブリック)の合成であり、これらのクラウドは、固有のエンティティのままであるが、データおよびアプリケーションの移植性(例えば、クラウド間の負荷分散のためのクラウド・バースティング)を可能にする標準化された技術または専用の技術によって結び付けられる。
【0091】
クラウド・コンピューティング環境は、ステートレス性、低結合性、モジュール性、および意味的相互運用性に重点を置いたサービス指向型である。クラウド・コンピューティングの中心は、相互接続されたノードのネットワークを含むインフラストラクチャである。
【0092】
図5は、本開示の実施形態によるクラウド・コンピューティング環境510を示す。図示のように、クラウド・コンピューティング環境510は、例えば、携帯情報端末(PDA:personal digital assistant)もしくは携帯電話500A、デスクトップ・コンピュータ500B、ラップトップ・コンピュータ500C、または自動車コンピュータ・システム500Nあるいはその組合せなどのクラウド消費者によって使用されるローカル・コンピューティング・デバイスの通信相手となり得る1つまたは複数のクラウド・コンピューティング・ノード500を含む。ノード500は、互いに通信してもよい。これらは、本明細書で上述したようなプライベート・クラウド、コミュニティ・クラウド、パブリック・クラウド、もしくはハイブリッド・クラウド、またはその組合せなどの1つまたは複数のネットワーク内で物理的にまたは仮想的にグループ化されてもよい(図示せず)。
【0093】
これにより、クラウド・コンピューティング環境510は、インフラストラクチャ、プラットフォーム、またはソフトウェア、あるいはその組合せを、クラウド消費者がローカル・コンピューティング・デバイス上にリソースを保持する必要のないサービスとして提供することが可能になる。
図5に示すコンピューティング・デバイス500A~500Nのタイプが例示のみを意図していること、およびコンピューティング・ノード500およびクラウド・コンピューティング環境510が、任意のタイプのネットワークまたはネットワーク・アドレス指定可能な接続あるいはその両方を介して(例えば、ウェブ・ブラウザを使用して)、任意のタイプのコンピュータ化されたデバイスと通信できることを理解されたい。
【0094】
図6は、本開示の実施形態による(
図5の)クラウド・コンピューティング環境510によって提供される抽象化モデル層600を示す。
図6に示す構成要素、層、および機能は、例示のみを意図しており、本開示の実施形態はそれらに限定されないことを予め理解されたい。以下に示すように、次の層および対応する機能が提供される。
【0095】
ハードウェアおよびソフトウェア層615は、ハードウェア構成要素およびソフトウェア構成要素を含む。ハードウェア構成要素の例には、メインフレーム602、RISC(縮小命令セット・コンピュータ)アーキテクチャ・ベースのサーバ604、サーバ606、ブレード・サーバ608、ストレージ・デバイス611、ならびにネットワークおよびネットワーキング構成要素612が含まれる。いくつかの実施形態では、ソフトウェア構成要素には、ネットワーク・アプリケーション・サーバ・ソフトウェア614およびデータベース・ソフトウェア616が含まれる。
【0096】
仮想化層620は、抽象化層を提供し、この層から仮想エンティティの以下の例、すなわち、仮想サーバ622、仮想ストレージ624、仮想プライベート・ネットワークを含む仮想ネットワーク626、仮想アプリケーションおよびオペレーティング・システム628、ならびに仮想クライアント630が提供されてもよい。
【0097】
一例では、管理層640は、以下に記載の機能を提供してもよい。リソース・プロビジョニング642は、クラウド・コンピューティング環境内でタスクを実行するために利用されるコンピューティング・リソースおよび他のリソースの動的な調達を提供する。計量および価格決定644は、クラウド・コンピューティング環境内でリソースが利用されるときのコスト追跡、およびこれらのリソースの消費に対する課金または請求を提供する。一例では、これらのリソースは、アプリケーション・ソフトウェア・ライセンスを含むことがある。セキュリティは、クラウド消費者およびタスクのための本人確認、ならびにデータおよび他のリソースのための保護を提供する。ユーザ・ポータル646は、消費者およびシステム管理者にクラウド・コンピューティング環境へのアクセスを提供する。サービス・レベル管理648は、要求されるサービス・レベルが満たされるようなクラウド・コンピューティング・リソースの割当ておよび管理を提供する。サービス・レベル・アグリーメント(SLA)の計画および履行650は、SLAに従って将来要求されることが予想されるクラウド・コンピューティング・リソースの事前配置および調達を提供する。
【0098】
ワークロード層660は、クラウド・コンピューティング環境が利用され得る機能の例を提供する。この層から提供され得るワークロードおよび機能の例には、マッピングおよびナビゲーション662、ソフトウェア開発およびライフサイクル管理664、仮想教室教育配信666、データ分析処理668、トランザクション処理670、ならびにプライバシ主導型ユーザ・データ共有のための1つまたは複数の認知フレームワーク672が含まれる。
【0099】
本開示はクラウド・コンピューティングに関する詳細な説明を含むが、本明細書に記載された教示の実装はクラウド・コンピューティング環境に限定されないことを理解されたい。むしろ、本開示の実施形態は、現在知られているまたは後に開発され得る他の任意のタイプのコンピューティング環境と併せて実装されることが可能である。
【0100】
図7は、本開示の実施形態による(例えば、コンピュータの1つもしくは複数のプロセッサ回路またはコンピュータ・プロセッサを使用した)本明細書に記載の方法、ツール、およびモジュール、ならびに任意の関連機能のうちの1つまたは複数を実装する際に使用され得る例示的なコンピュータ・システム701の高レベル・ブロック図を示す。いくつかの実施形態では、コンピュータ・システム701の主要構成要素には、1つまたは複数の中央処理装置(CPU)702A、702B、702C、および702Dを有するプロセッサ702、メモリ・サブシステム704、端末インターフェース712、ストレージ・インターフェース716、I/O(入力/出力)デバイス・インターフェース714、ならびにネットワーク・インターフェース718が含まれてもよく、これらはすべて、メモリ・バス703、I/Oバス708、およびI/Oバス・インターフェース・ユニット710を介した構成要素間通信のために、直接的または間接的に通信可能に結合されてもよい。
【0101】
コンピュータ・システム701は、本明細書ではCPU702と総称される1つまたは複数の汎用プログラマブルCPU702A、702B、702C、および702Dを含んでもよい。いくつかの実施形態では、コンピュータ・システム701は、比較的大規模なシステムに典型的な複数のプロセッサを含んでもよい。しかしながら、他の実施形態では、コンピュータ・システム701は、代替として、単一のCPUシステムであってもよい。各CPU702は、メモリ・サブシステム704に記憶された命令を実行してもよく、1つまたは複数のレベルのオンボード・キャッシュを含んでもよい。
【0102】
システム・メモリ704は、ランダム・アクセス・メモリ(RAM)722またはキャッシュ・メモリ724などの揮発性メモリの形式のコンピュータ・システム可読媒体を含んでもよい。コンピュータ・システム701は、他の取外し可能/取外し不可能な揮発性/不揮発性コンピュータ・システム記憶媒体をさらに含んでもよい。単なる一例として、「ハード・ドライブ」などの取外し不可能な不揮発性磁気媒体に対する読出しおよび書込みのために、ストレージ・システム726を設けることができる。図示されていないが、取外し可能な不揮発性磁気ディスク(例えば、「フロッピ(R)・ディスク」)に対する読出しおよび書込みのための磁気ディスク・ドライブ、またはCD-ROM、DVD-ROM、もしくは他の光学媒体などの取外し可能な不揮発性光ディスクに対する読出しおよび書込みのための光ディスク・ドライブを設けることができる。加えて、メモリ704は、フラッシュ・メモリ、例えばフラッシュ・メモリ・スティック・ドライブまたはフラッシュ・ドライブを含むことができる。メモリ・デバイスは、1つまたは複数のデータ媒体インターフェースによってメモリ・バス703に接続されることが可能である。メモリ704は、様々な実施形態の機能を実行するように構成されたプログラム・モジュールのセット(例えば、少なくとも1つ)を有する少なくとも1つのプログラム製品を含んでもよい。
【0103】
メモリ704には、それぞれが少なくとも一組のプログラム・モジュール730を有する1つまたは複数のプログラム/ユーティリティ728が記憶されてもよい。プログラム/ユーティリティ728は、ハイパーバイザ(仮想マシン・モニタとも呼ばれる)、1つまたは複数のオペレーティング・システム、1つまたは複数のアプリケーション・プログラム、他のプログラム・モジュール、およびプログラム・データを含んでもよい。オペレーティング・システム、1つまたは複数のアプリケーション・プログラム、他のプログラム・モジュール、およびプログラム・データのそれぞれ、またはそれらの何らかの組合せは、ネットワーキング環境の実装を含んでもよい。プログラム728またはプログラム・モジュール730あるいはその両方は、一般に、様々な実施形態の機能または方法論を実行する。
【0104】
図7においてメモリ・バス703は、CPU702と、メモリ・サブシステム704と、I/Oバス・インターフェース710との間の直接通信経路を提供する単一のバス構造として示されているが、いくつかの実施形態では、メモリ・バス703は、複数の異なるバスまたは通信経路を含んでもよく、これらは、階層型構成、スター型構成、もしくはウェブ型構成のポイント・ツー・ポイント・リンク、複数の階層バス、並列経路および冗長経路、または任意の他の適切なタイプの構成など、様々な形式のいずれかで配置されてもよい。さらに、I/Oバス・インターフェース710およびI/Oバス708はそれぞれ単一のユニットとして示されているが、いくつかの実施形態では、コンピュータ・システム701は、複数のI/Oバス・インターフェース・ユニット710、複数のI/Oバス708、またはその両方を含んでもよい。さらに、様々なI/Oデバイスにつながる様々な通信経路からI/Oバス708を分離する複数のI/Oインターフェース・ユニット710が示されているが、他の実施形態では、I/Oデバイスの一部またはすべてが、1つまたは複数のシステムI/Oバス708に直接接続されてもよい。
【0105】
いくつかの実施形態では、コンピュータ・システム701は、マルチユーザ・メイン・フレーム・コンピュータ・システム、シングルユーザ・システム、サーバ・コンピュータ、または直接的なユーザ・インターフェースをほとんどもしくは全く有してないが他のコンピュータ・システム(クライアント)から要求を受け取る同様のデバイスであってもよい。さらに、いくつかの実施形態では、コンピュータ・システム701は、デスクトップ・コンピュータ、ポータブル・コンピュータ、ラップトップもしくはノートブック・コンピュータ、タブレット・コンピュータ、ポケット・コンピュータ、電話、スマートフォン、ネットワーク・スイッチもしくはネットワーク・ルータ、または任意の他の適切なタイプの電子デバイスとして実装されてもよい。
【0106】
図7は、例示的なコンピュータ・システム701の代表的な主要構成要素を示すことを意図していることに留意されたい。しかしながら、いくつかの実施形態では、個々の構成要素は、
図7に示されるものよりも複雑であっても複雑でなくてもよく、
図7に示された構成要素以外の構成要素、または
図7に示された構成要素に加えられた構成要素が存在してもよく、このような構成要素の数、タイプ、および構成は、多様であってもよい。
【0107】
本開示は、任意の可能な技術的詳細の統合レベルでのシステム、方法、またはコンピュータ・プログラム製品あるいはその組合せであってもよい。コンピュータ・プログラム製品は、プロセッサに本開示の態様を実施させるためのコンピュータ可読プログラム命令を有するコンピュータ可読記憶媒体(または複数のコンピュータ可読記憶媒体)を含んでもよい。
【0108】
コンピュータ可読記憶媒体は、命令実行デバイスが使用するための命令を保持および記憶することができる有形デバイスとすることができる。コンピュータ可読記憶媒体は、例えば、電子記憶デバイス、磁気記憶デバイス、光学記憶デバイス、電磁気記憶デバイス、半導体記憶デバイス、または上記の任意の好適な組合せとすることができるが、これらに限定されない。コンピュータ可読記憶媒体のより具体的な例の非網羅的なリストには以下のもの、すなわち、ポータブル・コンピュータ・ディスケット、ハード・ディスク、ランダム・アクセス・メモリ(RAM)、読出し専用メモリ(ROM)、消去可能プログラマブル読出し専用メモリ(EPROMまたはフラッシュ・メモリ)、スタティック・ランダム・アクセス・メモリ(SRAM)、ポータブル・コンパクト・ディスク読出し専用メモリ(CD-ROM)、デジタル・バーサタイル・ディスク(DVD)、メモリ・スティック、フロッピ(R)・ディスク、パンチカードまたは命令が記録された溝内の隆起構造体などの機械的に符号化されたデバイス、および上記の任意の好適な組合せが含まれる。本明細書で使用されるコンピュータ可読記憶媒体は、電波もしくは他の自由に伝播する電磁波、導波路もしくは他の伝送媒体を介して伝播する電磁波(例えば、光ファイバ・ケーブルを通る光パルス)、または電線を介して送信される電気信号などの一過性の信号自体であると解釈されるべきではない。
【0109】
本明細書に記載のコンピュータ可読プログラム命令は、コンピュータ可読記憶媒体からそれぞれのコンピューティング/処理デバイスに、または、ネットワーク、例えばインターネット、ローカル・エリア・ネットワーク、ワイド・エリア・ネットワーク、またはワイヤレス・ネットワークあるいはその組合せを介して外部コンピュータまたは外部記憶デバイスにダウンロードされ得る。ネットワークは、銅伝送ケーブル、光伝送ファイバ、ワイヤレス伝送、ルータ、ファイアウォール、スイッチ、ゲートウェイ・コンピュータ、またはエッジ・サーバあるいはその組合せを含んでもよい。各コンピューティング/処理デバイスにおけるネットワーク・アダプタ・カードまたはネットワーク・インターフェースは、ネットワークからコンピュータ可読プログラム命令を受信し、そのコンピュータ可読プログラム命令を、それぞれのコンピューティング/処理デバイス内のコンピュータ可読記憶媒体における記憶のために転送する。
【0110】
本開示の動作を実行するためのコンピュータ可読プログラム命令は、アセンブラ命令、インストラクション・セット・アーキテクチャ(ISA)命令、機械命令、機械依存命令、マイクロコード、ファームウェア命令、状態設定データ、集積回路用の構成データ、または、Smalltalk(R)、C++などのオブジェクト指向プログラミング言語および「C」プログラミング言語もしくは同様のプログラミング言語などの手続き型プログラミング言語を含む1つまたは複数のプログラミング言語の任意の組合せで記述されたソース・コードもしくはオブジェクト・コードであってもよい。コンピュータ可読プログラム命令は、スタンドアロン・ソフトウェア・パッケージとして全体がユーザのコンピュータ上で、一部がユーザのコンピュータ上で、一部がユーザのコンピュータ上かつ一部がリモート・コンピュータ上で、または全体がリモート・コンピュータ上もしくはサーバ上で実行されてもよい。後者のシナリオでは、リモート・コンピュータは、ローカル・エリア・ネットワーク(LAN)もしくはワイド・エリア・ネットワーク(WAN)を含む任意のタイプのネットワークを介してユーザのコンピュータに接続されてもよく、または(例えば、インターネット・サービス・プロバイダを使用してインターネットを介して)外部コンピュータに対して接続されてもよい。いくつかの実施形態では、本開示の態様を実行するために、例えば、プログラマブル・ロジック回路、フィールド・プログラマブル・ゲート・アレイ(FPGA)、またはプログラマブル・ロジック・アレイ(PLA)を含む電子回路が、コンピュータ可読プログラム命令の状態情報を利用して電子回路をパーソナライズすることによって、コンピュータ可読プログラム命令を実行してもよい。
【0111】
本明細書では、本開示の実施形態による方法、装置(システム)、およびコンピュータ・プログラム製品のフローチャート図またはブロック図あるいはその両方を参照しながら、本開示の態様について説明している。フローチャート図またはブロック図あるいはその両方の各ブロック、およびフローチャート図またはブロック図あるいはその両方におけるブロックの組合せがコンピュータ可読プログラム命令によって実施され得ることが理解されよう。
【0112】
これらのコンピュータ可読プログラム命令は、コンピュータまたは他のプログラマブル・データ処理装置のプロセッサを介して実行される命令が、フローチャートまたはブロック図あるいはその両方の1つまたは複数のブロックで指定された機能/作用を実施するための手段を作り出すように、コンピュータのプロセッサまたは他のプログラマブル・データ処理装置のプロセッサに提供されて、マシンを作り出すものであってもよい。これらのコンピュータ可読プログラム命令はまた、命令が記憶されたコンピュータ可読記憶媒体が、フローチャートまたはブロック図あるいはその両方の1つまたは複数のブロックで指定された機能/作用の態様を実施する命令を含む製造品を含むように、コンピュータ可読媒体に記憶され、コンピュータ、プログラマブル・データ処理装置、または他のデバイスあるいはその組合せに対して特定の方式で機能するように指示できるものであってもよい。
【0113】
コンピュータ可読プログラム命令はまた、コンピュータ、他のプログラマブル装置、または他のデバイスで実行される命令が、フローチャートまたはブロック図あるいはその両方の1つまたは複数のブロックで指定された機能/作用を実施するように、コンピュータ実施プロセスを作り出すべくコンピュータ、他のプログラマブル・データ処理装置、または他のデバイスにロードされて、コンピュータ、他のプログラマブル装置、または他のデバイス上で一連の動作ステップを実行させるものであってもよい。
【0114】
図中のフローチャートおよびブロック図は、本開示の様々な実施形態によるシステム、方法およびコンピュータ・プログラム製品の可能な実装形態のアーキテクチャ、機能性、ならびに動作を示す。これに関して、フローチャートまたはブロック図における各ブロックは、指定された論理機能を実装するための1つまたは複数の実行可能命令を含む、命令のモジュール、セグメント、または一部を表すことがある。いくつかの代替の実装形態では、ブロックに記載された機能は、図に記載された順序とは異なる順序で行われてもよい。例えば、連続して示されている2つのブロックは、実際には、関与する機能性に応じて、1つのステップとして達成されるか、同時に、実質的に同時に、部分的にもしくは全体的に、時間的に重複する様式で実行されてもよく、または場合によっては、それらのブロックが逆の順序で実行されてもよい。ブロック図またはフローチャート図あるいはその両方の各ブロック、およびブロック図またはフローチャート図あるいはその両方におけるブロックの組合せは、指定された機能または作用を実行するか、あるいは専用ハードウェアとコンピュータ命令との組合せを遂行する専用ハードウェア・ベースのシステムによって実装され得ることにも留意されたい。
【0115】
本開示について特定の実施形態の観点から説明してきたが、当業者にはその変更形態および修正形態が明らかとなることが予想される。本開示の様々な実施形態の説明を例示の目的で提示してきたが、この説明は、網羅的であることも、開示された実施形態に限定されることも意図していない。当業者には、説明した実施形態の範囲および思想から逸脱することなく多くの修正形態および変形形態が明らかであろう。本明細書で使用される用語は、実施形態の原理、実際の適用例、もしくは市場で見られる技術を超える技術的な改良を最もよく説明するように、または本明細書で開示された実施形態を当業者が理解することが可能になるように選択されたものである。したがって、以下の特許請求の範囲は、本開示の真の思想および範囲内にあるようなすべての変更形態および修正形態を包含するものとして解釈されることが意図されている。
【手続補正書】
【提出日】2023-12-27
【手続補正1】
【補正対象書類名】特許請求の範囲
【補正対象項目名】全文
【補正方法】変更
【補正の内容】
【特許請求の範囲】
【請求項1】
プライバシ主導型データ共有のためのシステムであって、前記システムが、
メモリと、
前記メモリと通信するプロセッサと
を含み、前記プロセッサが、
データセットの利益対リソース・スコアを計算することと、
前記利益対リソース・スコアに基づいてオートエンコーダ・アーキテクチャを選択することであって、前記オートエンコーダ・アーキテクチャが、前記利益対リソース・スコアに基づいて再構築損失の最小化と必要な記憶空間の最小化とのバランスをとる、前記選択することと、
前記オートエンコーダ・アーキテクチャに基づいた変換関数を用いて、前記データセットを変換済みデータに変換することと、
前記変換済みデータをユーザ空間に記憶することと
を含む動作を実行するように構成される、システム。
【請求項2】
前記動作が、
前記データセットをデータ・セグメントにセグメント化することと、
前記データ・セグメントのそれぞれについてセグメント利益対リソース・スコアを計算することと、
前記データ・セグメントを変換済みデータ・セグメントに変換することと、
前記変換済みデータ・セグメントのうちの1つまたは複数をコンテンツ・パーソナライザにストリーミングすることと
をさらに含む、請求項1に記載のシステム。
【請求項3】
前記動作が、
前記データセットをデータ・セグメントにセグメント化することと、
前記データ・セグメントのそれぞれについて重み付けを決定することであって、前記重み付けが分析サービスの意味論的目的に基づく、前記決定することと、
前記重み付けに従って、前記オートエンコーダ・アーキテクチャにおける変換強度の低減を可能にすることと
をさらに含む、請求項1
または請求項2に記載のシステム。
【請求項4】
前記動作が、
前記データセットをデータ・セグメントにセグメント化することと、
前記データ・セグメントのそれぞれについてセグメント利益対リソース・スコアを計算することと、
前記セグメント利益対リソース・スコアに基づいて前記データ・セグメントのそれぞれについてセグメント・オートエンコーダ・アーキテクチャを選択することと、
前記セグメント・オートエンコーダ・アーキテクチャのうちの少なくとも1つを活用して、前記データ・セグメントのうちの少なくとも1つを少なくとも1つの変換済みデータ・セグメントに変換することと、
前記データ・セグメントのうちの前記少なくとも1つを変換することと
をさらに含む、請求項1
から請求項3のいずれか一項に記載のシステム。
【請求項5】
少なくとも1つの変換済みデータ・セグメントが機械学習サービスにストリーミングされる、請求項4に記載のシステム。
【請求項6】
前記動作が、
説明可能な機械学習に基づいて次元削減を可能にすることをさらに含む、請求項1
から請求項5のいずれか一項に記載のシステム。
【請求項7】
前記オートエンコーダ・アーキテクチャが、Shapley加法的説明分析から抽出された主要な特徴にさらに基づく、請求項1
から請求項6のいずれか一項に記載のシステム。
【請求項8】
前記利益対リソース・スコアが閾値を超えており、再構築損失を最小限に抑えるように前記オートエンコーダ・アーキテクチャが選択される、請求項1
から請求項7のいずれか一項に記載のシステム。
【請求項9】
プロセッサが実行する、プライバシ主導型データ共有のための方法であって、
データセットの利益対リソース・スコアを計算することと、
前記利益対リソース・スコアに基づいてオートエンコーダ・アーキテクチャを選択することであって、前記オートエンコーダ・アーキテクチャが、前記利益対リソース・スコアに基づいて再構築損失の最小化と必要な記憶空間の最小化とのバランスをとる、前記選択することと、
前記オートエンコーダ・アーキテクチャに基づいた変換関数を用いて、前記データセットを変換済みデータに変換することと、
前記変換済みデータをユーザ空間に記憶することと
を含む、方法。
【請求項10】
前記データセットをデータ・セグメントにセグメント化することと、
前記データ・セグメントのそれぞれについてセグメント利益対リソース・スコアを計算することと、
前記データ・セグメントを変換済みデータ・セグメントに変換することと、
前記変換済みデータ・セグメントのうちの1つまたは複数をコンテンツ・パーソナライザにストリーミングすることと
をさらに含む、請求項9に記載の方法。
【請求項11】
前記データセットをデータ・セグメントにセグメント化することと、
前記データ・セグメントのそれぞれについて重み付けを決定することであって、前記重み付けが分析サービスの意味論的目的に基づく、前記決定することと、
前記重み付けに従って、前記オートエンコーダ・アーキテクチャにおける変換強度の低減を可能にすることと
をさらに含む、請求項9
または請求項10に記載の方法。
【請求項12】
前記データセットをデータ・セグメントにセグメント化することと、
前記データ・セグメントのそれぞれについてセグメント利益対リソース・スコアを計算することと、
前記セグメント利益対リソース・スコアに基づいて、前記データ・セグメントのそれぞれについてセグメント・オートエンコーダ・アーキテクチャを選択することと、
前記セグメント・オートエンコーダ・アーキテクチャのうちの少なくとも1つを活用して、前記データ・セグメントのうちの少なくとも1つを少なくとも1つの変換済みデータ・セグメントに変換することと、
前記データ・セグメントのうちの少なくとも1つを変換することと
をさらに含む、請求項9
から請求項11のいずれか一項に記載の方法。
【請求項13】
少なくとも1つの変換済みデータ・セグメントが機械学習サービスにストリーミングされる、請求項12に記載の方法。
【請求項14】
説明可能な機械学習に基づいて次元削減を可能にすることをさらに含む、請求項9
から請求項13のいずれか一項に記載の方法。
【請求項15】
前記オートエンコーダ・アーキテクチャが、Shapley加法的説明分析から抽出された主要な特徴にさらに基づく、請求項9
から請求項14のいずれか一項に記載の方法。
【請求項16】
前記利益対リソース・スコアが閾値を超えており、再構築損失を最小限に抑えるように前記オートエンコーダ・アーキテクチャが選択される、請求項9
から請求項15のいずれか一項に記載の方法。
【請求項17】
プライバシ主導型データ共有のためのコンピュータ・プログラムであって、プロセッサに請求項9から請求項16に記載の方法を実行させる、コンピュータ・プログラム。
【請求項18】
請求項17に記載のコンピュータ・プログラムを記憶した、コンピュータ可読記憶媒体。
【国際調査報告】