特許7196132 | 知財ポータル「IP Force」

知財求人 - 知財ポータルサイト「IP Force」

青山学院大学 (神奈川県相模原市中央区淵野辺)

▶ バイドゥ　ユーエスエイ　エルエルシーの特許一覧 ▶ クンルンシンテクノロジー（ベイジン）カンパニーリミテッドの特許一覧

特許7196132データプロセッシング（ＤＰ）アクセラレータのための難読化を用いたデータ伝送

書誌要約請求の範囲詳細な説明課題実施例実施するための形態図面の説明

目に優しい文字サイズ小中大 PDF Top

< >

1
2
3
4
5
6
7
8
9
10
11

(19)【発行国】日本国特許庁(JP)

(12)【公報種別】特許公報(B2)

(11)【特許番号】

(24)【登録日】2022-12-16

(45)【発行日】2022-12-26

(54)【発明の名称】データプロセッシング（ＤＰ）アクセラレータのための難読化を用いたデータ伝送

(51)【国際特許分類】

G06N 20/00 20190101AFI20221219BHJP

G06F 21/60 20130101ALI20221219BHJP

G06F 21/55 20130101ALN20221219BHJP

【ＦＩ】

G06N20/00

G06F21/60 360

G06F21/55 360

【請求項の数】 22

【外国語出願】

(21)【出願番号】P 2020065882

(22)【出願日】2020-04-01

(65)【公開番号】P2021043942

(43)【公開日】2021-03-18

【審査請求日】2020-06-19

【審判番号】

【審判請求日】2022-03-29

(31)【優先権主張番号】16/568,127

(32)【優先日】2019-09-11

(33)【優先権主張国・地域又は機関】US

(73)【特許権者】

【識別番号】516357421

【氏名又は名称】バイドゥユーエスエイエルエルシー

【氏名又は名称原語表記】ＢａｉｄｕＵＳＡＬＬＣ

(73)【特許権者】

【識別番号】521457387

【氏名又は名称】クンルンシンテクノロジー（ベイジン）カンパニーリミテッド

【氏名又は名称原語表記】ＫｕｎｌｕｎｘｉｎＴｅｃｈｎｏｌｏｇｙ（Ｂｅｉｊｉｎｇ）ＣｏｍｐａｎｙＬｉｍｉｔｅｄ

【住所又は居所原語表記】ＣＷＳｅｃｔｉｏｎ，Ｆ／４，Ｂｕｉｌｄｉｎｇ１，Ｎｏ．１０，Ｓｈａｎｇｄｉ１０ｔｈＳｔｒｅｅｔ，ＨａｉｄｉａｎＤｉｓｔｒｉｃｔ，１００１０１，Ｂｅｉｊｉｎｇ，Ｃｈｉｎａ

(74)【代理人】

【識別番号】110001508

【氏名又は名称】弁理士法人津国

(72)【発明者】

【氏名】ユエチャン・チェン

(72)【発明者】

【氏名】ハーフェイ・ジュ

【合議体】

【審判長】林毅

【審判官】田中寛人

【審判官】篠原功一

(56)【参考文献】

【文献】米国特許第１０２７５８５１号明細書（ＵＳ，Ｂ１）

【文献】米国特許出願公開第２０１８／０２４１７６０号明細書（ＵＳ，Ａ１）

【文献】米国特許出願公開第２０１９／０２２０６１７号明細書（ＵＳ，Ａ１）

【文献】特開２０１８－１９００４５号公報（ＪＰ，Ａ）

【文献】米国特許出願公開第２０１９／００４４９１８号明細書（ＵＳ，Ａ１）

【文献】高野了成、アクセラレータクラウドを実現するシステムソフトウェアＦｌｏｗＯＳの提案、情報処理学会研究報告ハイパフォーマンスコンピューティング（ＨＰＣ）、２０１８－ＨＰＣ－１６３［ｏｎｌｉｎｅ］、発行日２０１８年０２月２１日、ｐｐ．１－７、インターネット＜ＵＲＬ：ｈｔｔｐｓ：／／ｉｐｓｊ．ｉｘｓｑ．ｎｉｉ．ａｃ．ｊｐ／ｅｊ／？ａｃｔｉｏｎ＝ｒｅｐｏｓｉｔｏｒｙ＿ｕｒｉ＆ｉｔｅｍ＿ｉｄ＝１８６０４８＆ｆｉｌｅ＿ｉｄ＝１＆ｆｉｌｅ＿ｎｏ＝１＞

(58)【調査した分野】(Int.Cl.，ＤＢ名)

G06N 3/00- 3/12, 7/08-99/00

G06F12/14,21/10-21/16,21/50-21/88

(57)【特許請求の範囲】

【請求項1】

データを難読化解除する方法であって、前記方法は、
データプロセシング（ＤＰ）アクセラレータによって、ホストから難読化カーネルアルゴリズムを受信するステップであって、前記難読化カーネルアルゴリズムは、リンクを介した前記ホストとの通信データを難読化及び難読化解除するために使用されるステップと、
前記難読化カーネルアルゴリズムを使用して、前記ホストから受信した、予測リクエストのための難読化されたデータを難読化解除して、１つ又は複数の人工知能（ＡＩ）モデルを取得するステップであって、前記難読化されたデータは、前記ホストが１つ又は複数の人工知能（ＡＩ）モデルを難読化したデータである、ステップと、
前記１つ又は複数のＡＩモデルを予測入力に適用することにより、予測結果を生成するステップと、
前記難読化カーネルアルゴリズムを使用して、前記予測結果を難読化するステップと、
難読化された予測結果を、前記リンクを介して前記ホストに送信するステップであって、前記ホストは前記難読化された予測結果を難読化解除することにより前記予測結果を復元するように構成される、ステップと、を含み、
前記ホストと前記データプロセシングアクセラレータとの間の通信は、ペリフェラル・コンポーネント・インターコネクト（ＰＣＩ）・チャネル又はペリフェラル・コンポーネント・インターコネクト・エクスプレス（ＰＣＩＥ）・チャネルを介して行われる、
データを難読化解除する方法。

【請求項2】

前記難読化カーネルアルゴリズムは、前記ホストによって生成される請求項１に記載の方法。

【請求項3】

前記難読化されたデータを伝送するためのデータチャネルと異なる専用の通信チャネルにおいて前記難読化カーネルアルゴリズムを受信する請求項１に記載の方法。

【請求項4】

前記難読化されたデータは、トレーニング入力データを含み、前記トレーニング入力データを使用して前記１つ又は複数のＡＩモデルをトレーニングする請求項１に記載の方法。

【請求項5】

前記難読化カーネルアルゴリズムが対称アルゴリズムであるため、前記難読化解除と前記難読化の両方に同じアルゴリズムが使用される請求項１に記載の方法。

【請求項6】

前記難読化カーネルアルゴリズムは、名称ベースの難読化アルゴリズムである請求項１に記載の方法。

【請求項7】

１つ又は複数のＡＩモデルに対するリクエストを前記ホストから受信するステップと、
リクエストされた前記１つ又は複数のＡＩモデルに対して難読化を行うステップと、
難読化されたＡＩモデルを前記ホストに送信するステップであって、前記ホストは前記難読化されたＡＩモデルに対して難読化解除を行うことにより前記ＡＩモデルを復元するステップと、をさらに含む請求項１に記載の方法。

【請求項8】

データを難読化する方法であって、前記方法は、
ホストにおいてデータプロセッシング（ＤＰ）アクセラレータにより１つ又は複数の人工知能（ＡＩ）モデルを使用してＡＩ予測を実行する予測リクエストを生成するステップであって、ここで、前記予測リクエストは、難読化カーネルアルゴリズムに基づいて前記１つ又は複数のＡＩモデルを難読化する難読化されたデータを含むステップと、
前記難読化カーネルアルゴリズムと前記予測リクエストを、リンクを介して前記ＤＰアクセラレータに送信するステップであって、前記難読化カーネルアルゴリズムは、前記難読化されたデータを難読化解除し、前記１つ又は複数のＡＩモデルを取得して予測結果を生成するために用いられ、前記ＤＰアクセラレータは、前記難読化カーネルアルゴリズムを使用して前記予測結果を難読化し、難読化した予測結果を返送するよう構成される、ステップと、
前記ＤＰアクセラレータからの難読化された予測結果を、前記リンクを介して受信するステップと、
前記難読化された予測結果を難読化解除して、前記予測結果を復元するステップと、を含み、
前記ホストと前記データプロセシングアクセラレータとの間の通信は、ペリフェラル・コンポーネント・インターコネクト（ＰＣＩ）・チャネル又はペリフェラル・コンポーネント・インターコネクト・エクスプレス（ＰＣＩＥ）・チャネルを介して行われる、
データを難読化する方法。

【請求項9】

前記難読化カーネルアルゴリズムは、前記ホストによって生成される請求項８に記載の方法。

【請求項10】

前記難読化されたデータを伝送するためのデータチャネルと異なる専用の通信チャネルにおいて前記難読化カーネルアルゴリズムを受信する請求項８に記載の方法。

【請求項11】

前記難読化されたデータは、トレーニング入力データを含み、前記トレーニング入力データを使用して前記１つ又は複数のＡＩモデルをトレーニングする請求項８に記載の方法。

【請求項12】

前記難読化カーネルアルゴリズムが対称アルゴリズムであるため、前記難読化解除と前記難読化の両方に同じアルゴリズムが使用される請求項８に記載の方法。

【請求項13】

前記難読化カーネルアルゴリズムは、名称ベースの難読化アルゴリズムである請求項８に記載の方法。

【請求項14】

前記ＤＰアクセラレータからの１つ又は複数のＡＩモデルを復元するためのリクエストを生成するステップと、
前記ＤＰアクセラレータに前記リクエストを送信するステップと、
前記１つ又は複数のＡＩモデルを示す難読化されたデータを、前記ＤＰアクセラレータから受信するステップと、
難読化されたＡＩモデルに対して難読化解除を行うことにより前記ＡＩモデルを復元するステップと、をさらに含む請求項８に記載の方法。

【請求項15】

命令が格納されている非一時的機械可読媒体であって、前記命令はプロセッサにより実行されると、
データプロセシング（ＤＰ）アクセラレータによってホストから難読化カーネルアルゴリズムを受信するステップであって、前記難読化カーネルアルゴリズムは、リンクを介した前記ホストとの通信データを難読化及び難読化解除するために使用されるステップと、
前記難読化カーネルアルゴリズムを使用して、前記ホストから受信した、予測リクエストのための難読化されたデータを難読化解除して、１つ又は複数の人工知能（ＡＩ）モデルを取得するステップであって、前記難読化されたデータは、前記ホストが１つ又は複数の人工知能（ＡＩ）モデルを難読化したデータである、ステップと、
前記１つ又は複数のＡＩモデルを予測入力に適用することにより、予測結果を生成するステップと、
前記難読化カーネルアルゴリズムを使用して、前記予測結果を難読化するステップと、
難読化された予測結果を前記ホストに送信するステップであって、前記ホストは前記難読化された予測結果を難読化解除することにより前記予測結果を復元するように構成される、ステップと、
を含み、
前記ホストと前記データプロセシングアクセラレータとの間の通信は、ペリフェラル・コンポーネント・インターコネクト（ＰＣＩ）・チャネル又はペリフェラル・コンポーネント・インターコネクト・エクスプレス（ＰＣＩＥ）・チャネルを介して行われる、
動作を前記プロセッサに実行させる、非一時的機械可読媒体。

【請求項16】

前記難読化カーネルアルゴリズムは、前記ホストによって生成される請求項１５に記載の非一時的機械可読媒体。

【請求項17】

前記難読化されたデータを伝送するためのデータチャネルと異なる専用の通信チャネルにおいて、前記難読化カーネルアルゴリズムを受信する請求項１５に記載の非一時的機械可読媒体。

【請求項18】

前記難読化されたデータは、トレーニング入力データを含み、前記トレーニング入力データを使用して前記１つ又は複数のＡＩモデルをトレーニングする請求項１５に記載の非一時的機械可読媒体。

【請求項19】

前記難読化カーネルアルゴリズムが対称アルゴリズムであるため、前記難読化解除と前記難読化の両方に同じアルゴリズムが使用される請求項１５に記載の非一時的機械可読媒体。

【請求項20】

前記難読化カーネルアルゴリズムは、名称ベースの難読化アルゴリズムである請求項１５に記載の非一時的機械可読媒体。

【請求項21】

コンピュータプログラムであって、
前記コンピュータプログラムがプロセッサにより実行されると、請求項１～７のいずれか一項に記載の方法を実現する、コンピュータプログラム。

【請求項22】

コンピュータプログラムであって、
前記コンピュータプログラムがプロセッサにより実行されると、請求項８～１４のいずれか一項に記載の方法を実現する、コンピュータプログラム。

【発明の詳細な説明】

【技術分野】

【0001】

本開示の実施形態は、主に難読化のマルチパーティ計算に関する。より詳細には、本開示の実施形態は、データプロセッシング（ＤＰ）アクセラレータのための難読化を用いたデータ伝送に関する。

【背景技術】

【0002】

人工知能（ＡＩ）アクセラレータ又はコプロセッサなどのデータプロセッシング（ＤＰ）アクセラレータは、機密取引を実行することが益々多くなってきている。これにより、ＤＰアクセラレータのための通信チャネルを保護するニーズと、不正アクセスからホストシステムを保護するようにホストシステムの環境を保護するニーズとが高まっている。

【0003】

例えば、ＡＩトレーニングデータ、モデル、及び推論出力のためのデータ伝送が保護されず、信頼できない当事者に漏洩してしまう可能性がある。さらに、暗号化キーに基づく解決策は遅くて実用的でない可能性がある。したがって、暗号化の有無にかかわらず、ＤＰアクセラレータのためのデータ伝送を難読化するシステムが必要である。

【図面の簡単な説明】

【0004】

本開示の一態様は、データを難読化解除する方法であって、該方法は、データプロセシング（ＤＰ）アクセラレータによって難読化カーネルアルゴリズムを受信するステップであって、難読化カーネルアルゴリズムは、リンクを介したホストとの通信データを難読化及び難読化解除するために使用されるステップと、難読化カーネルアルゴリズムを使用して、ホストから受信した、予測リクエストのための難読化されたデータを難読化解除して、１つ又は複数の人工知能（ＡＩ）モデルを取得するステップと、１つ又は複数のＡＩモデルを予測入力に適用することにより、予測結果を生成するステップと、難読化カーネルアルゴリズムを使用して、予測結果を難読化するステップと、リンクを介して難読化された予測結果をホストに送信するステップであって、ホストは難読化された予測結果を難読化解除することにより予測結果を復元するステップと、を含み得るデータを難読化解除する方法を提供する。

【発明を実施するための形態】

【0005】

本開示の他の一態様は、データを難読化する方法であって、該方法は、
ホストにおいてデータプロセッシング（ＤＰ）アクセラレータにより１つ又は複数の人工知能（ＡＩ）モデルを使用してＡＩ予測を実行する予測リクエストを生成するステップであって、ここで、予測リクエストは、難読化カーネルアルゴリズムに基づいて１つ又は複数のＡＩモデルを難読化する難読化されたデータを含むステップと、難読化カーネルアルゴリズムと予測リクエストを、リンクを介してＤＰアクセラレータに送信するステップであって、ここで、難読化カーネルアルゴリズムを使用して難読化されたデータを難読化解除し、１つ又は複数のＡＩモデルを取得して予測結果を生成し、ここで、ＤＰアクセラレータは、難読化カーネルアルゴリズムを使用して予測結果を難読化するステップと、ＤＰアクセラレータからの難読化された予測結果を、リンクを介して受信するステップと、難読化された予測結果を難読化解除して、予測結果を復元するステップと、を含むデータを難読化する方法を提供する。

【0006】

本開示のさらなる一態様は、命令が格納されている非一時的機械可読媒体を提供する。前記命令がプロセッサにより実行されると、前記プロセッサに動作を実行させ、前記動作は、データプロセシング（ＤＰ）アクセラレータによって難読化カーネルアルゴリズムを受信するステップであって、難読化カーネルアルゴリズムは、リンクを介したホストとの通信データを難読化及び難読化解除するために使用されるステップと、難読化カーネルアルゴリズムを使用して、ホストから受信した、予測リクエストのための難読化されたデータを難読化解除して、１つ又は複数の人工知能（ＡＩ）モデルを取得するステップと、１つ又は複数のＡＩモデルを予測入力に適用することにより、予測結果を生成するステップと、難読化カーネルアルゴリズムを使用して、予測結果を難読化するステップと、難読化された予測結果をホストに送信するステップであって、ホストは難読化された予測結果を難読化解除することにより予測結果を復元するステップと、を含み得る。

【0007】

本開示の第１態様によれば、ホストは難読化スキームによりデータプロセシング（ＤＰ）アクセラレータと通信する。ＤＰアクセラレータ（又はシステム）は、難読化カーネルアルゴリズム（又は難読化アルゴリズム）を受信し、この難読化カーネルアルゴリズムは、ホストとの通信データを難読化及び難読化解除するために使用される。システムは、難読化カーネルアルゴリズムを使用して、ホストから受信した、予測リクエストのための難読化されたデータを難読化解除して、１つ又は複数のＡＩモデルを取得する。システムは、１つ又は複数のＡＩモデルを予測入力に適用することにより、予測結果を生成する。システムは、難読化カーネルアルゴリズムを使用して、予測結果を難読化する。システムは、難読化された予測結果をホストに送信し、ここで、ホストは、難読化された予測結果を難読化解除することで、予測結果を復元する。

【0008】

本開示の第２態様によれば、システムは、ＤＰアクセラレータにより１つ又は複数の人工知能（ＡＩ）モデルを使用してＡＩ予測を実行する予測リクエストを生成し、ここで、前記予測リクエストは、難読化カーネルアルゴリズムに基づいて１つ又は複数のＡＩモデルを難読化する難読化されたデータを含む。システムは、難読化カーネルアルゴリズムと予測リクエストをＤＰアクセラレータに送信し、ここで、難読化カーネルアルゴリズムを使用して難読化されたデータを難読化解除し、１つ又は複数のＡＩモデルを取得して予測結果を生成し、ここで、ＤＰアクセラレータは、難読化カーネルアルゴリズムを使用して予測結果を難読化する。システムは、ＤＰアクセラレータから難読化された予測結果を受信する。システムは、難読化された予測結果を難読化解除して、予測結果を復元する。

【0009】

本開示の第３態様によれば、システムは、ＤＰアクセラレータによりホストからのトレーニングリクエストを受信し、前記トレーニングリクエストには、１つ又は複数のＡＩモデル及び／又はトレーニング入力データを含む難読化されたデータが含まれる。システムは、ＤＰアクセラレータの難読化ユニットによって難読化されたデータを難読化解除し、１つ又は複数のＡＩモデルを取得する。システムは、トレーニング入力データに基づいて１つ又は複数のＡＩモデルをトレーニングする。

【0010】

本開示の第４態様によれば、システム（例えば、ホスト）は、１つ又は複数のＡＩモデル及び／又はトレーニング入力データに対して難読化を行うことにより、難読化されたデータを生成する。システムは、ＤＰアクセラレータによりＡＩモデルトレーニングを実行するための、難読化されたデータが含まれるトレーニングリクエストを生成する。該システムは、ＤＰアクセラレータにトレーニングリクエストを送信し、ここで、ＤＰアクセラレータの難読化ユニットは難読化アルゴリズムを適用して１つ又は複数のＡＩモデル及び／又はトレーニング入力データを取得し、ここで、トレーニング入力データを用いて１つ又は複数のＡＩモデルをトレーニングする。

【0011】

図１は、いくつかの実施形態に係るホストとデータプロセシング（ＤＰ）アクセラレータとの間の通信を保護するためのシステムコンフィギュレーションの一例を示すブロック図である。図１を参照すると、システムコンフィギュレーション１００は、ネットワーク１０３を介してＤＰサーバ１０４に通信可能に結合された１つ又は複数のクライアントデバイス１０１～１０２を含むが、これらに限定されない。クライアントデバイス１０１～１０２は、パーソナルコンピュータ（例えば、デスクトップコンピュータ、ラップトップコンピュータ、及びタブレットコンピュータ）、シンクライアント、パーソナルデジタルアシスタント（ＰＤＡ）、ウェブ対応機器、スマートウォッチ又は携帯電話（例えば、スマートフォン）などの任意のタイプのクライアントデバイスであり得る。任意選択で、クライアントデバイス１０１、１０２は他のサーバであり得る。ネットワーク１０３は、任意のタイプのネットワーク、例えば、有線又は無線のローカルエリアネットワーク（ＬＡＮ）、インターネットのようなワイドエリアネットワーク（ＷＡＮ）又はそれらの組み合わせであってもよい。

【0012】

サーバ（例えば、ホスト）１０４は、任意のタイプのサーバ又はサーバクラスタであってもよく、例えば、Ｗｅｂ又はクラウドサーバ、アプリケーションサーバ、バックエンドサーバ、又はそれらの組み合わせが挙げられる。サーバ１０４はさらに、クライアントデバイス１０１～１０２などのクライアントがサーバ１０４によって提供されるリソース又はサービス（サーバ１０４を介してＤＰアクセラレータによって提供されるリソース及びサービスなど）にアクセスできるようにするインターフェース（図示せず）を含む。例えば、サーバ１０４は、さまざまなクラウドサービス（クラウドストレージ、クラウドコンピューティングサービス、機械学習トレーニングサービス、データマイニングサービスなど）をクライアントに提供するクラウドサーバ、又はデータセンターのサーバであり得る。サーバ１０４は、プライベートクラウド、パブリッククラウド又はハイブリッドクラウドなどのクラウド上のソフトウェアであるサービス（ＳａａＳ）又はプラットフォームであるサービス（ＰａａＳ）システムの一部として構成され得る。インターフェースには、Ｗｅｂインターフェース、アプリケーションプログラミングインターフェース（ＡＰＩ）及び／又はコマンドラインインターフェース（ＣＬＩ）が含まれ得る。

【0013】

例えば、クライアント、この例では、クライアントデバイス１０１のユーザアプリケーション（例えば、ウェブブラウザ、アプリケーション）は、実行のための命令（例えば、人工知能（ＡＩ）トレーニング、推論命令など）をサーバ１０４へ送信又は伝送することができ、サーバ１０４がネットワーク１０３のインターフェースを介して前記命令を受信する。前記命令に応答して、サーバ１０４はＤＰアクセラレータ１０５～１０７と通信して命令を実行する。いくつかの実施形態において、命令は、専用マシン又はプロセッサとしてのＤＰアクセラレータがサーバ１０４による実行よりも何倍も速く命令を実行できる機械学習タイプの命令である。したがって、サーバ１０４は、１つ又は複数のＤＰアクセラレータの実行ジョブを分散方式で制御／管理することができる。次に、サーバ１０４は、実行結果をクライアントデバイス１０１～１０２に返送する。ＤＰアクセラレータ又はＡＩアクセラレータには、バイドゥ社のＢａｉｄｕ人工知能（ＡＩ）チップセットなどの１つ又は複数の専用プロセッサが含まれ得る。又は任意選択で、ＤＰアクセラレータは、ＮＶＩＤＩＡ、Ｉｎｔｅｌ、又はその他のＡＩチップセットプロバイダーのＡＩチップセットであり得る。

【0014】

一実施形態によれば、データプロセッシングサーバ１０４（ホストとも呼ばれる）によってホストされるＤＰアクセラレータ１０５～１０７のいずれかにアクセスする各アプリケーションは、該アプリケーションが信頼できるソース又はベンダーによって提供されることを検証することができる。各アプリケーションは、ホスト１０４の中央処理装置（ＣＰＵ）によって特に構成及び実行される信頼できる実行環境（ＴＥＥ）内で起動及び実行され得る。アプリケーションがＤＰアクセラレータ１０５～１０７のいずれかにアクセスするように構成されている場合、ホスト１０４とＤＰアクセラレータ１０５～１０７の対応するアクセラレータとの間で難読化接続が確立され得、それによりホスト１０４とＤＰアクセラレータ１０５～１０７の間で交換されるデータがマルウェア／侵入からの攻撃から保護される。

【0015】

図２は、いくつかの実施形態に係るホストシステムとデータプロセシング（ＤＰ）アクセラレータとの間で難読化通信を行う多層保護スキームの一例を示すブロック図である。一実施形態において、システム２００は、ＤＰアクセラレータに対するハードウェアの変更の有無にかかわらず、ホストとＤＰアクセラレータとの間の難読化通信のための保護スキームを提供する。図２を参照すると、ホスト又はサーバ１０４は、侵入から保護されるべき１つ又は複数の層（例えば、ユーザーアプリケーション２０３、ランタイムライブラリ２０５、ドライバ２０９、オペレーティングシステム２１１、及びハードウェア２１３（例えば、セキュリティモジュール（信頼できるプラットフォームモジュール（ＴＰＭ））／中央処理装置（ＣＰＵ）））のシステムとして表すことができる。ホスト１０４は、通常、ホスト１０４又はＤＰアクセラレータ１０５～１０７上の実行ジョブを制御及び管理できるＣＰＵシステムである。ＤＰアクセラレータ１０５～１０７とホスト１０４との間の通信チャネルを保護／難読化するために、データ侵入又は攻撃を受けやすいホストシステムの異なる層を保護するために異なるコンポーネントが必要になる場合がある。例えば、信頼できる実行環境（ＴＥＥ）は、ユーザーアプリケーション層とランタイムライブラリ層をデータ侵入から保護できる。

【0016】

図２を参照すると、いくつかの実施形態によれば、システム２００は、ホストシステム１０４及びＤＰアクセラレータ１０５～１０７を含む。ＤＰアクセラレータには、ＡＩ集約型コンピューティングタスクを実行できるＢａｉｄｕＡＩチップセット、又はＮＶＩＤＩＡグラフィカルプロセッシングユニット（ＧＰＵ）などの他のＡＩチップセットが含まれ得る。一実施形態において、ホストシステム１０４は、ホスト１０４内にセキュリティモジュール（信頼できるプラットフォームモジュール（ＴＰＭ）など）を備えた、１つ又は複数のＣＰＵを有するハードウェア２１３を含む。ＴＰＭは、ハードウェア認証用のホストシステムに固有の暗号化キー（ＲＳＡ暗号化キーなど）を保存する、エンドポイント上の専用チップである。各ＴＰＭチップには、エンドースメントキー（ＥＫ）又はエンドースメントクレデンシャル（ＥＣ）（ルートキー）と呼ばれる１つ又は複数のＲＳＡキーペア（公開キーと秘密キーのペアなど）が含まれ得る。キーペアはＴＰＭチップ内に保持され、ソフトウェアからアクセスできない。不正なファームウェア及びソフトウェアによる変更からシステムを保護するために、ファームウェア及びソフトウェアの重要なセクションは、実行される前にＥＫ又はＥＣによってハッシュされることができる。したがって、ホスト上のＴＰＭチップは、セキュアブートの信頼のルートとして使用できる。

【0017】

ＴＰＭチップはまた、作業カーネル空間におけるドライバ２０９及びオペレーティングシステム（ＯＳ）２１１とＤＰアクセラレータとの通信を確保する。ここで、ドライバ２０９は、ＤＰアクセラレータベンダーによって提供され、ホストとＤＰアクセラレータ間の通信チャネル２１５を制御するためのユーザーアプリケーションのドライバとして機能することができる。ＴＰＭチップとセキュアブートがそのカーネル空間におけるＯＳとドライバを保護するため、ＴＰＭは、ドライバ２０９とオペレーティングシステム２１１をも効果的に保護する。

【0018】

ＤＰアクセラレータ１０５～１０７の通信チャネル２１５がＯＳ及びドライバによって独占され得るため、通信チャネル２１５は、ＴＰＭチップを介して保護され得る。一実施形態において、通信チャネル２１５は、ペリフェラル・コンポーネント・インターコネクト・チャネル又はペリフェラル・コンポーネント・インターコネクト・エクスプレス（ＰＣＩＥ）・チャネルを含む。一実施形態において、通信チャネル２１５は難読化通信チャネルである。

【0019】

ホスト１０４は、ＴＰＭ／ＣＰＵ２１３によって保護されるように強制される信頼できる実行環境（ＴＥＥ）２０１を含むことができる。ＴＥＥは安全な環境である。ＴＥＥは、ＴＥＥ内にロードされるコードとデータが機密性と完全性に関して保護されるように確保できる。ＴＥＥの例としては、Ｉｎｔｅｌソフトウェアガードエクステンション（ＳＧＸ）又はＡＭＤセキュア仮想マシン暗号化（ＳＥＶ）であり得る。ＩｎｔｅｌＳＧＸ及び／又はＡＭＤＳＥＶには、ユーザーレベルのコードがより高い特権レベルで実行されているプロセスから保護されているＣＰＵのメモリのプライベート領域を割り当てることができる中央処理装置（ＣＰＵ）命令コードのセットが含まれ得る。ここで、ＴＥＥ２０１は、ユーザーアプリケーション２０３及びランタイムライブラリ２０５を保護することができ、ユーザーアプリケーション２０３及びランタイムライブラリ２０５それぞれは、エンドユーザ及びＤＰアクセラレータベンダーによって提供され得る。ここで、ランタイムライブラリ２０５は、ＡＰＩコールをＤＰアクセラレータの実行、構成、及び／又は制御のためのコマンドに変換することができる。一実施形態において、ランタイムライブラリ２０５は、ユーザーアプリケーションによる実行のための所定の（例えば、事前定義された）カーネルセットを提供する。

【0020】

ホスト１０４は、Ｒｕｓｔ及びＧｏＬａｎｇなどのメモリセーフな言語を使用して実装されるメモリセーフなアプリケーション２０７を含むことができる。ＭｅｓａＬｏｃｋＬｉｎｕｘ（登録商標）などのメモリセーフなＬｉｎｕｘリリースで実行されるこれらのメモリセーフなアプリケーションはさらに、システム２００をデータの機密性と完全性の攻撃から保護することができる。ただし、オペレーティングシステムは、あらゆるＬｉｎｕｘディストリビューション、ＵＮＩＸ（登録商標）、ＷｉｎｄｏｗｓＯＳ又はＭａｃＯＳであってもよい。

【0021】

ホストは、ＴＰＭセキュアブートを備えたシステムにメモリセーフなＬｉｎｕｘディストリビューションをインストールするようにセットアップすることができる。そのインストールは、製造段階又は準備段階でオフラインで実行できる。また、そのインストールにより、ホストシステムのユーザー空間のアプリケーションが、メモリセーフなプログラミング言語を使用してプログラムされるように確保できる。ホストシステム１０４で実行されている他のアプリケーションがメモリセーフなアプリケーションであることを確保することにより、ホストシステム１０４に対する潜在的な機密性及び完全性攻撃がさらに軽減され得る。

【0022】

インストール後、システムはＴＰＭベースのセキュアブートを介して起動することができる。ＴＰＭセキュアブートは、カーネル空間においてアクセラレーターサービスを提供する、署名／認定されたオペレーティングシステムとアクセラレータードライバのみが起動されるように確保する。一実施形態において、オペレーティングシステムは、ハイパーバイザーを介してロードすることができる。なお、ハイパーバイザー又は仮想マシンマネージャーは、仮想マシンを作成及び実行するコンピューターソフトウェア、ファームウェア、又はハードウェアである。なお、カーネル空間は宣言領域又は範囲であり、ここで、カーネル（つまり、実行用の所定の（例えば、事前定義された）関数のセット）は、ユーザーアプリケーションに機能とサービスを提供するために、識別される。システムの完全性が損なわれた場合、ＴＰＭセキュアブートが起動に失敗することがあり、代わりにシステムがシャットダウンされる。

【0023】

セキュアブート後、ランタイムライブラリ２０５が実行されるとともに、ＣＰＵ２１３に関連する信頼できるメモリスペースにランタイムライブラリ２０５を配置するＴＥＥ２０１を作成する。次に、ユーザーアプリケーション２０３がＴＥＥ２０１で起動される。一実施形態において、ユーザーアプリケーション２０３及びランタイムライブラリ２０５は静的にリンクされ、一緒に起動される。別の実施形態において、まず、ランタイムライブラリ２０５がＴＥＥで起動され、次にユーザーアプリケーション２０３がＴＥＥ２０１で動的にロードされる。別の実施形態において、まず、ユーザーアプリケーション２０３がＴＥＥで起動され、次にランタイムライブラリ２０５がＴＥＥ２０１で動的にロードされる。なお、静的にリンクされたライブラリは、コンパイル時にアプリケーションにリンクされたライブラリである。動的ロードは、動的リンカーによって実行できる。動的リンカーは、実行時にユーザーアプリケーションを実行するために共有ライブラリをロード及びリンクする。ここで、ＴＥＥ２０１内のユーザーアプリケーション２０３及びランタイムライブラリ２０５は、実行時に互いに可視であり、例えば、すべてのプロセスデータは互いに可視である。ただし、ＴＥＥへの外部アクセスは拒否される。

【0024】

一実施形態において、ユーザーアプリケーションは、ランタイムライブラリ２０５によって予め定められたカーネルのセットからのみカーネルを呼び出すことができる。別の実施形態において、ユーザーアプリケーション２０３及びランタイムライブラリ２０５は、サイドチャネルフリーアルゴリズム（ｓｉｄｅｃｈａｎｎｅｌｆｒｅｅａｌｇｏｒｉｔｈｍ）で強化され、キャッシュベースのサイドチャネル攻撃などのサイドチャネル攻撃から防御する。サイドチャネル攻撃は、実装されたアルゴリズム自体の脆弱性（暗号解析やソフトウェアのバグなど）ではなく、コンピューターシステムの実装から得られた情報に基づいた攻撃である。サイドチャネル攻撃の例には、仮想化環境又はクラウド環境で共有物理システムのキャッシュを監視する攻撃者の能力に基づく攻撃であるキャッシュ攻撃が含まれる。強化には、キャッシュのマスキング、アルゴリズムによって生成されたキャッシュに配置される出力が含まれる。次に、ユーザーアプリケーションの実行が終了すると、ユーザーアプリケーションは実行を終了し、ＴＥＥを終了する。

【0025】

一実施形態において、ＴＥＥ２０１及び／又はメモリセーフなアプリケーション２０７は必ずしも必要ではない。例えば、ユーザーアプリケーション２０３及び／又はランタイムライブラリ２０５は、ホスト１０４のオペレーティングシステム環境でホストされる。

【0026】

一実施形態において、カーネルのセットは難読化カーネルアルゴリズムを含む。一実施形態において、難読化カーネルアルゴリズムは、対称アルゴリズム又は非対称アルゴリズムとすることができる。対称難読化アルゴリズムは、同じアルゴリズムを使用してデータ通信を難読化及び難読化解除できる。非対称難読化アルゴリズムには、アルゴリズムペアが必要であり、該アルゴリズムペアのうちの第１のアルゴリズムが難読化に使用され、該アルゴリズムペアのうちの第２のアルゴリズムが難読化解除に使用され、逆もまた同様である。別の実施形態において、非対称難読化アルゴリズムは、データセットを難読化するための単一の難読化アルゴリズムを含むが、該データセットは難読化解除の実行を意図していない（例えば、対応する難読化解除アルゴリズムが存在しない）。難読化とは、通常は混乱した明確ではない言葉でコミュニケーションメッセージを理解しにくくすることにより、コミュニケーションの意図された意味を不明瞭化にすることを指す。データの難読化は、リバースエンジニアリングにとっていっそう困難で複雑である。データが伝送される前に難読化アルゴリズムを適用して、データ通信を難読化（暗号化／解読）することにより、盗聴の機会を減らす。一実施形態において、難読化アルゴリズムは、層への追加保護のために難読化されたデータをさらに暗号化する暗号化スキームをさらに含むことができる。計算が集中する可能性のある暗号化とは異なり、難読化アルゴリズムは計算を簡素化することができる。一部の難読化技術には、文字の難読化、名称の難読化、データの難読化、制御フローの難読化などが含まれるが、これらに限定されない。文字の難読化は、データ内の１つ又は複数の文字を特定の代替文字に置き換えて、データを無意味にするプロセスである。文字の難読化の例には、各文字がアルファベットに従って所定の位置量シフト又は回転する文字回転機能が含まれる。別の例は、特定のパターンに基づいて文字を並べ替えたり、ごちゃ混ぜにすることである。名称の難読化は、特定の対象の文字列を無意味な文字列に置き換えるプロセスである。制御フローの難読化は、追加コード（デッドコードの挿入、制御されていないジャンプの挿入、代替構造の挿入）でプログラムにおける制御フローの順序を変更して、アルゴリズム／ＡＩモデルの真の制御フローを隠すことができる。

【0027】

要約すると、システム２００は、（機械学習モデル、トレーニングデータ、及び推論出力を含むデータ伝送のための）ＤＰアクセラレータにデータの機密性及び完全性の損失から保護する複数の保護層を提供する。システム２００は、ＴＰＭベースのセキュアブート保護層、ＴＥＥ保護層、及びカーネル確認／検証層を含むことができる。さらに、システム２００は、ホスト上の他のアプリケーションがメモリセーフなプログラミング言語で実装されることを確保することにより、メモリセーフなユーザー空間を提供でき、潜在的なメモリ破損／脆弱性を排除することで攻撃をさらに消去できる。さらに、システム２００は、キャッシュベースのサイドチャネル攻撃などのサイドチャネル攻撃から防御するために、サイドチャネルフリーアルゴリズムを使用するアプリケーションを含むことができる。

【0028】

最後に、ランタイムライブラリは、難読化カーネルアルゴリズムを提供して、ホストとＤＰアクセラレータ間のデータ通信を難読化することができる。一実施形態において、前記難読化は暗号化スキームとペアにすることができる。別の実施形態において、難読化が唯一の保護スキームであり、ＤＰアクセラレータが暗号化ベースのハードウェアに基づく必要がなくなる。

【0029】

図３は、一実施形態に係るＤＰアクセラレータと通信するホストの一例を示すブロック図である。図３を参照すると、システム３００は、ＤＰアクセラレータ１０５と通信するホスト１０４のＴＥＥ２０１を含むことができる。ＤＰアクセラレータは、永続性又は非永続性記憶装置３０５を含む。記憶装置３０５は、難読化カーネルアルゴリズム３０１用の記憶空間及び他のデータ（例えば、ＡＩモデル、入力／出力データ３０２）用の記憶空間を含むことができる。ホスト１０４のユーザーアプリケーション２０３は、ＤＰアクセラレータ１０５との不明瞭化通信（例えば、難読化及び／又は暗号化により）チャネル２１５を作成できる。ホスト１０４は、（カーネルランタイムライブラリ２０５の一部として）難読化カーネルアルゴリズムを生成することにより、難読化通信チャネルを作成できる）。次に、ホスト１０４は、ＤＰアクセラレータ（例えば、ＤＰアクセラレータ１０５）に、ＤＰアクセラレータ用の難読化カーネルアルゴリズムを送信して、通信チャネル２１５を通過するあらゆるデータパケットを難読化又は難読化解除する。別の実施形態において、チャネル２１５上のホスト１０４からの出力通信データパケットは第１の難読化アルゴリズムを使用し、チャネル上のホスト１０４からの入力データは第１の難読化アルゴリズムと異なる第２の難読化アルゴリズムを使用する。別の実施形態において、通信チャネルがドロップ又は終了すると、難読化アルゴリズムが再作成されることができ、ホスト１０４によって該通信チャネルに対して現在の難読化アルゴリズム又は新たな難読化アルゴリズムが生成される。別の実施形態において、チャネル２１５用の難読化アルゴリズム／スキームは、ホスト１０４と他のＤＰアクセラレータ（例えば、ＤＰアクセラレータ１０６～１０７）との間の他のチャネルのための難読化スキームと異なる。一実施形態において、ホスト１０４は、ＤＰアクセラレータ１０５～１０７の各通信セッションのための難読化アルゴリズムを格納する難読化インターフェースを含む。ホスト１０４とＤＰアクセラレータ１０５との間の不明瞭化通信が示されているが、不明瞭化通信（例えば、難読化）は、クライアント１０１～１０２とホスト１０４との間の通信チャネルなどの他の通信チャネルに適用され得る。

【0030】

図４は、一実施形態に係るホストとＤＰアクセラレータとの間の不明瞭化通信プロトコルの一例を示すフローチャートである。図４を参照すると、プロトコルの動作４００は、図１のシステム１００又は図３のシステム３００によって実行され得る。一実施形態において、クライアントデバイス（例えば、クライアント／ユーザなどのクライアントデバイス１０１）は、ホスト１０４へＡＩモデル推論／トレーニングリクエストを送信する。このリクエストは、リソース又はサービスに対するリクエスト（ビッグデータ分析、モデリング、機械学習／トレーニングタスクなどに対するリクエストなど）であり得、ホスト１０４の１つ又は複数のＤＰアクセラレータによって達成することができる。一実施形態において、動作４０１では、ホスト１０４は難読化アルゴリズムを準備して、不明瞭化された（例えば、難読化された）通信チャネルを作成する。難読化アルゴリズムは、任意のタイプの難読化アルゴリズムであってもよく、対称又は非対称にすることができる。動作４０２では、ホスト１０４は、難読化アルゴリズムをＤＰアクセラレータ１０５に送信して、ホスト１０４とＤＰアクセラレータ１０５との間に不明瞭化された（例えば、難読化された）通信チャネルを作成する。次に、ホスト１０４は、難読化アルゴリズムによりペイロード（例えば、ＡＩモデル及び／又は入力データ）を難読化し、難読化されたペイロード（例えば、データ）をＤＰアクセラレータ１０５に送信する。別の実施形態において、難読化アルゴリズムは、暗号化されていてもされていなくてもよい（例えば、データとは別個の）専用チャネルを介して送信されてもよい。別の実施形態において、ホスト１０４は、難読化アルゴリズムの送信と異なる時間で難読化されたデータを送信する。

【0031】

動作４０３では、ＤＰアクセラレータ１０５が難読化カーネルアルゴリズムと難読化されたデータの両方を受信すると、ＤＰアクセラレータ１０５は、難読化アルゴリズムを使用して難読化されたデータを難読化解除し、元のデータ、例えば、ＡＩモデル及び／又は入力データ（ＡＩ推論又はトレーニングのためのもの）を取得する。動作４０４では、リクエストがＡＩ推論リクエストである場合、ＤＰアクセラレータは入力データを使用してＡＩモデルを実行し、推論出力を生成する。リクエストがトレーニングリクエストである場合、ＤＰアクセラレータはトレーニング入力データに基づいてＡＩモデル用のトレーニングセッションを開始する。動作４０５では、ＤＰアクセラレータ１０５は、難読化アルゴリズムを使用して生成された出力を難読化する。動作４０６では、ＤＰは難読化された出力をホスト１０４に返送する。動作４０７では、ホスト１０４は難読化された出力を難読化解除し、元の出力を取得する。したがって、ホスト１０４とＤＰアクセラレータ１０５との間の通信は、侵入者／盗聴者にとっては隠されているものである。

【0032】

図５は、一実施形態に係る方法の一例を示すフローチャートである。プロセス５００は、処理ロジックにより実行可能であり、前記処理ロジックはソフトウェア、ハードウェア、又はそれらの組み合わせを含んでもよい。例えば、プロセス５００は、図１のＤＰアクセラレータ１０５などのＤＰアクセラレータによって実行され得る。図５を参照すると、ブロック５０１では、処理ロジックは、難読化カーネルアルゴリズムを受信し、この難読化カーネルアルゴリズムは、ホストとの通信データを難読化及び難読化解除するために使用される。ブロック５０２では、処理ロジックは、難読化カーネルアルゴリズムを使用して、ホストから受信した、予測リクエストのための難読化されたデータを難読化解除して、１つ又は複数のＡＩモデルを取得する。ブロック５０３では、処理ロジックは、１つ又は複数のＡＩモデルを予測入力に適用することにより予測結果を生成する。ブロック５０４では、処理ロジックは、難読化カーネルアルゴリズムを使用して予測結果を難読化する。ブロック５０５では、処理ロジックは、難読化された予測結果をホストに送信し、ここで、ホストは、難読化された予測結果を難読化解除することにより予測結果を復元する。

【0033】

一実施形態において、難読化カーネルアルゴリズムはホストによって生成される。一実施形態において、難読化カーネルアルゴリズムは、難読化されたデータを伝送するためのデータチャネルと異なる専用の通信チャネルで受信される。

【0034】

一実施形態において、難読化されたデータは、トレーニング入力データを含み、１つ又は複数のＡＩモデルはトレーニング入力データを使用してトレーニングされる。一実施形態において、難読化カーネルアルゴリズムは対称アルゴリズムであり、難読化解除と難読化の両方に同じアルゴリズムが使用される。一実施形態において、難読化カーネルアルゴリズムは名称ベースの難読化アルゴリズムである。

【0035】

一実施形態において、処理ロジックは、ホストから１つ又は複数のＡＩモデルに対するリクエストをさらに受信し、リクエストされた１つ又は複数のＡＩモデルを難読化し、難読化されたＡＩモデルをホストに送信し、ここで、ホストは、難読化されたＡＩモデルを難読化解除することでＡＩモデルを復元する。

【0036】

図６は、一実施形態に係る方法の一例を示すフローチャートである。プロセス６００は、処理ロジックにより実行可能であり、前記処理ロジックにはソフトウェア、ハードウェア、又はそれらの組み合わせが含まれ得る。例えば、プロセス６００は、図１のホスト１０４により実行されることが可能である。図６を参照すると、ブロック６０１では、処理ロジックは、データプロセッシング（ＤＰ）アクセラレータにより１つ又は複数の人工知能（ＡＩ）モデルを使用してＡＩ予測を実行する予測リクエストを生成し、ここで、予測リクエストは、難読化カーネルアルゴリズムに基づいて前記１つ又は複数のＡＩモデルを難読化する難読化されたデータを含む。ブロック６０２では、処理ロジックは、難読化カーネルアルゴリズムと予測リクエストをＤＰアクセラレータに送信し、ここで、難読化カーネルアルゴリズムを使用して難読化されたデータを難読化解除し、１つ又は複数のＡＩモデルを取得して予測結果を生成し、ここで、ＤＰアクセラレータは、難読化カーネルアルゴリズムを使用して予測結果を難読化する。ブロック６０３では、処理ロジックは、ＤＰアクセラレータから難読化された予測結果を受信する。ブロック６０４では、処理ロジックは、難読化された予測結果を難読化解除して、予測結果を復元する。

【0037】

一実施形態において、難読化カーネルアルゴリズムはホストによって生成される。一実施形態において、難読化カーネルアルゴリズムは、難読化されたデータを伝送するためのデータチャネルと異なる専用の通信チャネルで受信される。一実施形態において、難読化されたデータは、トレーニング入力データを含み、１つ又は複数のＡＩモデルはトレーニング入力データを使用してトレーニングされる。一実施形態において、難読化カーネルアルゴリズムは対称アルゴリズムであり、難読化解除と難読化の両方に同じアルゴリズムが使用される。他の実施形態において、難読化カーネルアルゴリズムは名称ベースの難読化アルゴリズムである。

【0038】

一実施形態において、処理ロジックは、ＤＰアクセラレータからの１つ又は複数のＡＩモデルを復元するリクエストをさらに生成し、リクエストをＤＰアクセラレーターに送信し、ＤＰアクセラレータから１つ又は複数のＡＩモデルを表す難読化されたデータを受信し、難読化されたＡＩモデルを難読化解除して、ＡＩモデルを復元する。

【0039】

図７は、一実施形態に係る難読化ユニットを有するＤＰアクセラレータと通信するホストの一例を示すブロック図である。図７を参照すると、システム７００が難読化ユニット７０１を含むことを除いて、システム７００は図３のシステム３００と同様であり得る。難読化ユニット７０１は、複数の難読化アルゴリズムを備えた永続性又は非永続性記憶装置７０２を含む専用ハードウェアモジュールであり得る。難読化アルゴリズムは、製造段階又は準備段階で事前にインストールされ得る。一実施形態において、難読化アルゴリズムは予めホスト１０４から受信される。一実施形態において、難読化ユニット７０１は、難読化／難読化解除機能を実行するための１つ又は複数のプロセッサ７０３を含む。難読化は、難読化ユニット７０１によって専用の処理として処理できるため、ＤＰアクセラレータ１０５からの追加の処理リソースは必要ない。これは、ＤＰアクセラレータ１０５がクライアントにサービスを提供している場合、又はトレーニングの実行に忙しく、リソースを追加することができない場合に役立つ。さらに、難読化ユニット７０１が難読化アルゴリズムを含むため、通信セッションのための難読化アルゴリズムは、ホスト１０４からＤＰアクセラレータに伝送されてもよく、ホスト１０４からＤＰアクセラレータに伝送されなくてもよい。

【0040】

一実施形態において、ホスト１０４は、難読化ユニット７０１によってサポートされる対応する難読化アルゴリズムを含む。一実施形態において、ホスト１０４が難読化されたデータを送信するとき、ホスト１０４は、データを難読化するために使用される対応する難読化アルゴリズムを示すインジケータを送信する。インジケータ（又はセレクタ又は難読化アルゴリズムの選択）は、予めＤＰアクセラレータ１０５からホスト１０４に伝送することができ、ＤＰアクセラレータ１０５でサポートされる利用可能な難読化アルゴリズムをリストする。一実施形態において、難読化アルゴリズムの選択のためのインジケータは暗号化されていてもよく、暗号化されていなくてもよい。別の実施形態において、セレクタは、データを難読化するデータチャネルとは別のチャネルで送信されてもよい。

【0041】

図８は、一実施形態に係るホストとＤＰアクセラレータとの間で不明瞭化通信を行う一例を示すフローチャートである。図８を参照すると、プロトコルの動作８００は、図１のシステム１００又は図７のシステム７００によって実行され得る。一実施形態において、クライアントデバイス１０１などのクライアントデバイスは、ＡＩモデル推論／トレーニングリクエストをホスト１０４に送信する。このリクエストは、リソース又はサービスに対するリクエスト（ビッグデータ分析、モデリング、機械学習／トレーニングタスクなどに対するリクエストなど）であり得、１つ又は複数のＤＰアクセラレータによって達成することができる。次に、ホスト１０４は、そのリクエストを満たすためにＤＰアクセラレータ１０５と通信する。一実施形態において、動作８０１では、ＤＰアクセラレータ１０５の難読化ユニットによってサポートされる利用可能な難読化アルゴリズムを決定するために、ホスト１０４は利用可能な難読化アルゴリズムに対するリクエストを送信する。動作８０２では、ＤＰアクセラレータ１０５は、そのリクエストに応じて難読化アルゴリズムセレクタのリストを返送する。一実施形態において、動作８０１～８０２はオプションである。セレクタのリストに基づいて、動作８０３では、ホスト１０４は難読化アルゴリズムの１つを選択し、難読化アルゴリズムセレクタを使用してサービスリクエストペイロード（例えば、ＡＩモデル及び／又は入力データ）を難読化してサービスリクエストを準備する。動作８０４では、ホスト１０４は、アルゴリズムセレクタをサービスリクエスト及び難読化されたデータとともにＤＰアクセラレータ１０５に送信する。別の実施形態において、ＤＰアクセラレータ１０５の難読化ユニット７０１がデフォルトセレクタを含むか、又は１つの難読化アルゴリズムのみをサポートする場合、アルゴリズムセレクタは、オプションのパラメータであり得、必ずしもホスト１０４とＤＰアクセラレータ１０５の間で通信されるわけではない。

【0042】

動作８０５では、ＤＰアクセラレータ１０５は、アルゴリズムセレクタに基づいて難読化されたデータを難読化解除し、ＡＩモデル及び／又は入力データを取得する。動作８０６では、リクエストがトレーニングリクエストである場合、ＤＰアクセラレータはＡＩモデルのトレーニングセッションを開始する。

【0043】

一実施形態において、動作８０７では、トレーニングが完了すると、ＤＰアクセラレータ１０５は、セレクタに基づいて出力データ（例えば、トレーニング完了データ又はトレーニングされたＡＩモデル）を難読化する。動作８０８では、ＤＰアクセラレータ１０５は難読化された出力データをホスト１０４に返送する。動作８０９では、ホスト１０４はセレクタに基づいて前記データを難読化解除し、トレーニング完了データ又はトレーニングされたＡＩモデルを取得する。

【0044】

図９は、一実施形態に係る方法の一例を示すフローチャートである。プロセス９００は、処理ロジックにより実行可能であり、前記処理ロジックにはソフトウェア、ハードウェア、又はそれらの組み合わせが含まれ得る。例えば、プロセス９００は、図７のＤＰアクセラレータ１０５などのＤＰアクセラレータによって実行され得る。図９を参照すると、ブロック９０１では、処理ロジックは、ホストからトレーニングリクエストを受信し、該トレーニングリクエストには、１つ又は複数のＡＩモデル及び／又はトレーニング入力データを含む難読化されたデータが含まれる。ブロック９０２では、処理ロジックは、ＤＰアクセラレータの難読化ユニットによって難読化されたデータを難読化解除し、１つ又は複数のＡＩモデルを取得する。ブロック９０３では、処理ロジックは、トレーニング入力データに基づいて１つ又は複数のＡＩモデルをトレーニングする。

【0045】

一実施形態において、処理ロジックは、難読化ユニットによってサポートされる複数の難読化アルゴリズムのうちの１つをさらに選択し、難読化ユニットのプロセッサによって処理し、選択された難読化アルゴリズムに基づいて難読化されたデータを難読化解除する。一実施形態において、難読化ユニットのプロセッサは、難読化アルゴリズムをＡＩモデルトレーニングの実行と同時に実行できるようにＤＰアクセラレータのプロセッサとは別体である。

【0046】

一実施形態において、難読化されたデータは、トレーニング入力データを含み、ＡＩモデルはトレーニング入力データに基づいてトレーニングされる。一実施形態において、難読化カーネルアルゴリズムは対称アルゴリズムであり、難読化解除と難読化の両方に同じアルゴリズムが使用される。一実施形態において、難読化カーネルアルゴリズムは制御フロー難読化アルゴリズムである。

【0047】

一実施形態において、処理ロジックは、ホストから１つ又は複数のＡＩモデルに対するリクエストをさらに受信し、前記難読化ユニットによってリクエストされた１つ又は複数のＡＩモデルを難読化し、難読化されたＡＩモデルをホストに送信し、ここで、ホストは、難読化されたＡＩモデルを難読化解除することでＡＩモデルを復元する。

【0048】

図１０は、一実施形態に係る方法の一例を示すフローチャートである。プロセス１０００は、処理ロジックにより実行可能であり、前記処理ロジックにはソフトウェア、ハードウェア、又はそれらの組み合わせが含まれ得る。例えば、プロセス１０００は、図７のホスト１０４により実行されることが可能である。図１０を参照すると、ブロック１００１において、処理ロジックは、１つ又は複数の人工知能（ＡＩ）モデル及び／又はトレーニング入力データに対して難読化を行うことにより、難読化されたデータを生成する。ブロック１００２において、処理ロジックは、ＤＰアクセラレータによりＡＩモデルトレーニングを実行するための、難読化されたデータが含まれるトレーニングリクエストを生成する。ブロック１００３において、処理ロジックは、トレーニングリクエストをＤＰアクセラレータに送信し、ＤＰアクセラレータの難読化ユニットが難読化アルゴリズムを適用して、１つ又は複数のＡＩモデル及び／又はトレーニング入力データを取得し、ここで、トレーニング入力データを用いて１つ又は複数のＡＩモデルをトレーニングする。

【0049】

一実施形態において、処理ロジックはさらに、ＤＰアクセラレータからトレーニング結果を受信する。一実施形態において、処理ロジックは、ＤＰアクセラレータの難読化ユニットによってサポートされる複数の難読化アルゴリズムのうちの１つとして難読化アルゴリズムをさらに選択する。ここで、難読化又は難読化解除は、選択された難読化アルゴリズムを使用して、ＤＰアクセラレータの難読化ユニットのプロセッサによって実行される。

【0050】

一実施形態において、難読化ユニットのプロセッサは、難読化アルゴリズムをＡＩモデルトレーニングの実行と同時に実行できるようにＤＰアクセラレータのプロセッサとは別体である。一実施形態において、難読化アルゴリズムは対称アルゴリズムであり、難読化解除と難読化の両方に同じアルゴリズムが使用される。一実施形態において、難読化カーネルアルゴリズムは制御フロー難読化アルゴリズムである。

【0051】

一実施形態において、処理ロジックは、ＤＰアクセラレータからの１つ又は複数のＡＩモデルを復元するリクエストをさらに生成し、難読化された１つ又は複数のＡＩモデルを表す難読化されたデータをＤＰアクセラレータから受信し、ＤＰアクセラレータの難読化ユニットでサポートされる複数の難読化アルゴリズムのうちの１種の難読化アルゴリズムの指示を受信し、該指示に基づいて難読化されたＡＩモデルを難読化解除して、ＡＩモデルを復元する。

【0052】

なお、以上に例示及び説明された構成要素の一部又は全ては、ソフトウェア、ハードウェア、又はそれらの組み合わせで実現されることができる。例えば、このような構成要素は、永続性記憶装置にインストールされるとともに格納されるソフトウェアとして実現されてもよく、前記ソフトウェアは、本開示にわたって記載されたプロセス又は動作を実施するように、プロセッサ（図示せず）によってメモリにロードして実行されてもよい。あるいは、このような構成要素は、集積回路（例えば、特定用途向け集積回路又はＡＳＩＣ）、デジタルシグナルプロセッサ（ＤＳＰ）、又はフィールドプログラマブルゲートアレイ（ＦＰＧＡ）のような専用ハードウェアにプログラミングされたか又は埋め込まれた実行可能なコードとして実現されてもよく、前記実行可能なコードはアプリケーションからの対応するドライバ及び／又はオペレーティングシステムを介してアクセスすることができる。更に、このような構成要素は、ソフトウェアコンポーネントが１つ又は複数の特定の命令によってアクセス可能な命令セットの一部として、プロセッサ又はプロセッサコアにおける特定のハードウェアロジックとして実現されることができる。

【0053】

図１１は、本開示の一実施形態と組み合わせて使用可能なデータ処理システムの一例を示すブロック図である。例えば、システム１５００は、上記のホスト１０４又はＤＰアクセラレータ１０５～１０７のような、上述した前記プロセス又は方法のいずれかを実行するあらゆるデータ処理システムを表すことができる。

【0054】

システム１５００は、いくつかの異なる構成要素を備えていてもよい。これらの構成要素は、集積回路（ＩＣ）、集積回路の一部、ディスクリート型電子デバイス、又は回路基板（例えば、コンピュータシステムのマザーボード又はアドインカード）に適するその他のモジュールとして実現されることができ、又は、他の形態でコンピュータシステムのシャーシ内に組み込まれた構成要素として実現されることができる。

【0055】

なお、システム１５００は、コンピュータシステムのいくつかの構成要素の高レベルビューを示すことを意図している。しかしながら、一部の実施形態において付加的構成要素が存在してもよく、また、その他の実施形態において示された構成要素を異なる構成にすることが可能であることを理解されたい。システム１５００は、デスクトップコンピュータ、ノードパソコン、タブレットコンピュータ、サーバ、モバイルフォン、メディアプレーヤ、パーソナルデジタルアシスタント（ＰＤＡ）、スマート腕時計、パーソナル通信機、ゲーミングデバイス、ネットワークルータ又はハブ、ワイヤレスアクセスポイント（ＡＰ）又はリピータ、セットトップボックス或いはそれらの組み合わせを示すことができる。また、単一の機械又はシステムのみが示されたが、「機械」又は「システム」という用語は、本明細書で説明されるいずれか１つ又は複数の方法を実行するための、１つ（又は複数）の命令セットを単独で又は共同で実行する機械又はシステムの任意の組み合わせも含まれることを理解されたい。

【0056】

一実施形態において、システム１５００は、バス又はインターコネクト１５１０を介して接続される、プロセッサ１５０１と、メモリ１５０３と、デバイス１５０５～１５０８とを含む。プロセッサ１５０１は、単一のプロセッサコア又は複数のプロセッサコアが含まれる単一のプロセッサ又は複数のプロセッサを表すことが可能である。プロセッサ１５０１は、マイクロプロセッサ、中央処理装置（ＣＰＵ）などのような、１つ又は複数の汎用プロセッサを表すことができる。より具体的には、プロセッサ１５０１は、複雑命令セットコンピューティング（ＣＩＳＣ）マイクロプロセッサ、縮小命令セットコンピューティング（ＲＩＳＣ）マイクロプロセッサ、超長命令語（ＶＬＩＷ）マイクロプロセッサ、又はその他の命令セットを実行するプロセッサ、又は命令セットの組み合わせを実行するプロセッサであってもよい。プロセッサ１５０１は更に１つ又は複数の専用プロセッサであってもよい。例えば、特定用途向け集積回路（ＡＳＩＣ）、セルラー若しくはベースバンドプロセッサ、フィールドプログラマブルゲートアレイ（ＦＰＧＡ）、デジタルシグナルプロセッサ（ＤＳＰ）、ネットワークプロセッサ、グラフィックプロセッサ、ネットワークプロセッサ、通信プロセッサ、暗号化プロセッサ、コプロセッサ、組込みプロセッサ、又は命令を処理可能な任意の他の種類のロジックが挙げられる。

【0057】

プロセッサ１５０１は、超低電圧プロセッサのような低電力マルチコアプロセッサソケットであってもよく、前記システムの様々な構成要素と通信するための主処理ユニット及び中央ハブとして機能することができる。このようなプロセッサは、システムオンチップ（ＳｏＣ）として実装されてもよい。プロセッサ１５０１は、本明細書で説明される動作及びステップを実行するための命令を実行するように構成される。システム１５００は、更に任意選択グラフィックサブシステム１５０４と通信するグラフィックインターフェースを含むことができ、グラフィックサブシステム１５０４は、表示コントローラ、グラフィックプロセッサ及び／又は表示装置を含んでいてもよい。

【0058】

プロセッサ１５０１は、メモリ１５０３と通信することができ、一実施形態において、メモリ１５０３は、所定量のシステムメモリを提供するための複数のメモリデバイスによって実現されることができる。メモリ１５０３は、ランダムアクセスメモリ（ＲＡＭ）、ダイナミックＲＡＭ（ＤＲＡＭ）、シンクロナスＤＲＡＭ（ＳＤＲＡＭ）、スタティックＲＡＭ（ＳＲＡＭ）、又はその他のタイプの記憶装置のような、１つ又は複数の揮発性記憶（又はメモリ）装置を含むことができる。メモリ１５０３は、プロセッサ１５０１又はその他の任意のデバイスにより実行される命令シーケンスを含む情報を格納することができる。例えば、様々なオペレーティングシステム、デバイスドライバ、ファームウェア（例えば、ベーシックインプット／アウトプットシステム又はＢＩＯＳ）、及び／又はアプリケーションの実行可能なコード及び／又はデータは、メモリ１５０３にロードされ、プロセッサ１５０１により実行されることができる。オペレーティングシステムは、例えば、Ｍｉｃｒｏｓｏｆｔ（登録商標）社のＷｉｎｄｏｗｓ（登録商標）オペレーティングシステム、アップル社のＭａｃＯＳ（登録商標）／ｉＯＳ（登録商標）、Ｇｏｏｇｌｅ（登録商標）社のＡｎｄｒｏｉｄ（登録商標）、ＬＩＮＵＸ（登録商標）、ＵＮＩＸ（登録商標）、又はその他のリアルタイム若しくは組込みオペレーティングシステム（例えば、ＶｘＷｏｒｋｓ）のような、任意の種類のオペレーティングシステムであってもよい。

【0059】

システム１５００は、更にデバイス１５０５～１５０８のようなＩ／Ｏデバイスを含むことができ、Ｉ／Ｏデバイスは、ネットワークインターフェースデバイス１５０５、任意選択入力デバイス１５０６、及びその他の任意選択Ｉ／Ｏデバイス１５０７を含む。ネットワークインターフェースデバイス１５０５は、無線送受信機及び／又はネットワークインターフェースカード（ＮＩＣ）を含むことができる。無線送受信機は、ＷｉＦｉ送受信機、赤外線送受信機、ブルートゥース（登録商標）送受信機、ＷｉＭａｘ送受信機、無線携帯電話送受信機、衛星送受信機（例えば、全地球測位システム（ＧＰＳ）送受信機）、又はその他の無線周波数（ＲＦ）送受信機、又はそれらの組み合わせであってもよい。ＮＩＣは、イーサネットカードであってもよい。

【0060】

入力デバイス１５０６は、マウス、タッチパッド、タッチスクリーン（表示装置１５０４と統合されてもよい）、ポインターデバイス（例えば、スタイラス）、及び／又はキーボード（例えば、物理キーボード又はタッチスクリーンの一部として表示された仮想キーボード）を含むことができる。例えば、入力デバイス１５０６は、タッチスクリーンと接続されるタッチスクリーンコントローラを含むことができる。タッチスクリーン及びタッチスクリーンコントローラは、例えば、様々なタッチ感応技術（コンデンサ、抵抗、赤外線、及び表面弾性波の技術を含むが、それらに限定されない）のいずれか、並びにその他の近接センサアレイ、又は、タッチスクリーンと接触する１つ又は複数の点を確定するためのその他の素子を用いて、それらの接触、移動又は中断を検出することができる。

【0061】

Ｉ／Ｏデバイス１５０７は、音声装置を含むことができる。音声装置は、音声認識、音声複製、デジタル記録、及び／又は電話機能のような音声サポート機能を促進するために、スピーカ及び／又はマイクロホンを含んでもよい。その他のＩ／Ｏデバイス１５０７は、更に、ユニバーサルシリアルバス（ＵＳＢ）ポート、パラレルポート、シリアルポート、プリンタ、ネットワークインターフェース、バスブリッジ（例えば、ＰＣＩ－ＰＣＩブリッジ）、センサ（例えば、加速度計、ジャイロスコープ、磁力計、光センサ、コンパス、近接センサなどのモーションセンサ）、又はそれらの組み合わせを含むことができる。デバイス１５０７は、結像処理サブシステム（例えば、カメラ）を更に含むことができ、前記結像処理サブシステムは、写真及びビデオ断片を記録することなどのカメラ機能を実現するための、電荷接続素子（ＣＣＤ）又は相補型金属酸化物半導体（ＣＭＯＳ）光学センサのような光学センサを含むことができる。特定のセンサは、センサハブ（図示せず）を介してインターコネクト１５１０に接続されることができ、キーボード又はサーマルセンサのようなその他のデバイスはシステム１５００の具体的な構成又は設計により、組込みコントローラ（図示せず）により制御されることができる。

【0062】

データ、アプリケーション、１つ又は複数のオペレーティングシステムなどの情報の永続性記憶を提供するために、プロセッサ１５０１には、大容量記憶デバイス（図示せず）が接続されることができる。様々な実施形態において、より薄くてより軽量なシステム設計を可能にしながら、システムの応答性を向上するために、このような大容量記憶装置は、ソリッドステート装置（ＳＳＤ）によって実現されることができる。しかしながら、その他の実施形態において、大容量記憶デバイスは、主にハードディスクドライブ（ＨＤＤ）を使用して実現することができ、より小さい容量のＳＳＤ記憶デバイスをＳＳＤキャッシュとして機能することで、停電イベントの間にコンテキスト状態及び他のそのような情報の不揮発性記憶を可能にし、それによりシステム動作が再開するときに通電を速く実現することができる。また、フラッシュデバイスは、例えば、シリアルペリフェラルインターフェース（ＳＰＩ）を介してプロセッサ１５０１に接続されることができる。このようなフラッシュデバイスは、前記システムのベーシックインプット／アウトプットソフトウェア（ＢＩＯＳ）及びその他のファームウェアを含むシステムソフトウェアの不揮発性記憶のために機能することができる。

【0063】

記憶デバイス１５０８は、本明細書に記載の方法又は機能のいずれか１つ又は複数を具現化する１つ又は複数の命令セット又はソフトウェア（例えば、モジュール、ユニット及び／又はロジック１５２８）が格納されているコンピュータアクセス可能な記憶媒体１５０９（機械可読記憶媒体又はコンピュータ可読媒体とも呼ばれる）を備えてもよい。処理モジュール／ユニット／ロジック１５２８は、例えば、上述した図１のホスト１０４又は図３もしくは図７のＤＰアクセラレータ１０５などの上記の構成要素のいずれかを表すことができる。処理モジュール／ユニット／ロジック１５２８は、更に、データ処理システム１５００、メモリ１５０３、及びプロセッサ１５０１による実行中に、メモリ１５０３内及び／又はプロセッサ１５０１内に完全的に又は少なくとも部分的に存在してもよく、データ処理システム１５００、メモリ１５０３及びプロセッサ１５０１も機械アクセス可能な記憶媒体を構成する。処理モジュール／ユニット／ロジック１５２８は、更に、ネットワークを介してネットワークインターフェースデバイス１５０５を経由して送受信されてもよい。

【0064】

コンピュータ可読記憶媒体１５０９は、以上に説明されたいくつかのソフトウェア機能を永続的に格納するために用いることができる。コンピュータ可読記憶媒体１５０９は、例示的な実施形態において単一の媒体として示されるが、「コンピュータ可読記憶媒体」という用語は、前記１つ又は複数の命令セットが格納される単一の媒体又は複数の媒体（例えば、集中型又は分散型データベース及び／又は関連するキャッシュとサーバ）を含むと解釈されるものとする。「コンピュータ可読記憶媒体」という用語は、更に、命令セットを格納又は符号化できる任意の媒体を含むと解釈されるものであり、前記命令セットは機械により実行され、本開示のいずれか１種又は複数種の方法を機械に実行させるためのものである。それゆえに、「コンピュータ可読記憶媒体」という用語は、ソリッドステートメモリ、光学媒体及び磁気媒体、又はその他の任意の非一時的機械可読媒体を含むが、それらに限定されないと解釈されるものとする。

【0065】

本明細書に記載された処理モジュール／ユニット／ロジック１５２８、構成要素及びその他の特徴は、ディスクリートハードウェア構成要素として実現されてもよく、又はＡＳＩＣＳ、ＦＰＧＡ、ＤＳＰ又は類似の装置のようなハードウェア構成要素の機能に統合されてもよい。更に、処理モジュール／ユニット／ロジック１５２８は、ハードウェア装置におけるファームウェア又は機能性回路として実現されてもよい。更に、処理モジュール／ユニット／ロジック１５２８は、ハードウェア装置とソフトウェア構成要素の任意の組み合わせで実現されてもよい。

【0066】

なお、システム１５００は、データ処理システムの様々な構成要素を有するものとして示されているが、構成要素を相互接続する任意の特定のアーキテクチャ又は方式を表すことを意図するものではなく、そのような詳細は、本開示の実施形態とは密接な関係がない。また、より少ない構成要素又はより多くの構成要素を有するネットワークコンピュータ、ハンドヘルドコンピュータ、携帯電話、サーバ及び／又はその他のデータ処理システムは、本開示の実施形態と共に使用することも可能であることを理解されたい。

【0067】

上述した具体的な説明の一部は、既に、コンピュータメモリにおけるデータビットに対する演算のアルゴリズムと記号表現により示された。これらのアルゴリズムの説明及び表現は、データ処理分野における当業者によって使用される、それらの作業実質を所属分野の他の当業者に最も効果的に伝達する方法である。本明細書では、一般的に、アルゴリズムは、所望の結果につながるセルフコンシステントシーケンスと考えられる。これらの操作は、物理量の物理的処置が必要とされるものである。

【0068】

しかしながら、念頭に置くべきなのは、これらの用語及び類似の用語の全ては、適切な物理量に関連付けられるものであり、これらの量を標識しやすくするためのものに過ぎない。以上の説明で他に明示的に記載されていない限り、本明細書の全体にわたって理解すべきなのは、用語（例えば、添付された特許請求の範囲に記載のもの）による説明とは、コンピュータシステム、又は類似の電子式計算装置の動作及び処理を指し、前記コンピュータシステム又は電子式計算装置は、コンピュータシステムのレジスタ及びメモリにおける物理（電子）量として示されたデータを制御するとともに、前記データをコンピュータシステムメモリ又はレジスタ又はこのようなその他の情報記憶装置、伝送又は表示装置において同様に物理量として示された別のデータに変換する。

【0069】

図に示される技術は、１つ又は複数の電子機器に格納され実行されるコード及びデータを使用して実施することができる。そのような電子機器は、コンピュータ可読媒体（例えば、非一時的コンピュータ可読記憶媒体（例えば、磁気ディスク、光ディスク、ランダムアクセスメモリ、読み取り専用メモリ、フラッシュメモリ装置、相変化メモリ）及び一時的コンピュータ可読伝送媒体（例えば、電子、光学、音響学、又は他の形態の伝搬信号（例えば、搬送波、赤外線信号、デジタル信号など）など）を使用して、コード及びデータを格納及び伝送する（内部に伝送され、及び／又はネットワークを介して他の電子装置に伝送される）。

【0070】

上述した図面において説明されたプロセス又は方法は、ハードウェア（例えば、回路、専用ロジックなど）、ファームウェア、ソフトウェア（例えば、非一時的コンピュータ可読媒体に具現化されるもの）、又はそれらの組み合わせを含む処理ロジックにより実行されることができる。前記プロセス又は方法は、以上で特定の順序に応じて説明されたが、前記動作の一部が異なる順序で実行されてもよいことを理解されたい。また、一部の動作は、順番ではなく並行して実行されてもよい。

【0071】

本明細書において、本開示の実施形態は、既にその具体的な例示的な実施形態を参照しながら記載された。明らかなように、添付された特許請求の範囲に記載された本発明のより広い趣旨及び範囲を逸脱しない限り、本開示に対して様々な変更を行うことができる。それゆえに、本明細書及び図面は、限定的な意味でなく、例示的な意味で理解されるべきである。

【図1】