IP Force 特許公報掲載プロジェクト 2022.1.31 β版

知財求人 - 知財ポータルサイト「IP Force」

▶ インターデジタル シーイー パテント ホールディングスの特許一覧

特表2024-509670分割可能なディープニューラルネットワークにおける動的特徴サイズ適応
(19)【発行国】日本国特許庁(JP)
(12)【公報種別】公表特許公報(A)
(11)【公表番号】
(43)【公表日】2024-03-05
(54)【発明の名称】分割可能なディープニューラルネットワークにおける動的特徴サイズ適応
(51)【国際特許分類】
   G06N 3/08 20230101AFI20240227BHJP
   H04W 28/02 20090101ALI20240227BHJP
   G06N 3/02 20060101ALI20240227BHJP
【FI】
G06N3/08
H04W28/02
G06N3/02
【審査請求】未請求
【予備審査請求】未請求
(21)【出願番号】P 2023544040
(86)(22)【出願日】2022-02-03
(85)【翻訳文提出日】2023-08-08
(86)【国際出願番号】 EP2022052633
(87)【国際公開番号】W WO2022167547
(87)【国際公開日】2022-08-11
(31)【優先権主張番号】21305156.8
(32)【優先日】2021-02-05
(33)【優先権主張国・地域又は機関】EP
(81)【指定国・地域】
【公序良俗違反の表示】
(特許庁注:以下のものは登録商標)
1.WCDMA
2.3GPP
(71)【出願人】
【識別番号】518341334
【氏名又は名称】インターディジタル・シーイー・パテント・ホールディングス・ソシエテ・パ・アクシオンス・シンプリフィエ
(74)【代理人】
【識別番号】110001243
【氏名又は名称】弁理士法人谷・阿部特許事務所
(74)【代理人】
【識別番号】110002848
【氏名又は名称】弁理士法人NIP&SBPJ国際特許事務所
(72)【発明者】
【氏名】クマラスワミ、スレシュ キルティ
(72)【発明者】
【氏名】ドゥオン、クアン カン ンゴック
(72)【発明者】
【氏名】オゼロフ、アレクセイ
(72)【発明者】
【氏名】フォンテーヌ、パトリック
(72)【発明者】
【氏名】シュニッツラー、フランソワ
(72)【発明者】
【氏名】ランベール、アンヌ
(72)【発明者】
【氏名】ペレティエ、ギスラン
【テーマコード(参考)】
5K067
【Fターム(参考)】
5K067EE02
5K067HH21
(57)【要約】
提案される手法は、複数の帯域幅の間で切り替えるための規定を有する分散型AIのための効率的な送信を扱う。エッジデバイスにおける分散推論中、各デバイスは、AIモデルの一部を一度だけロードする必要があるが、それらの間で通信される入力/出力特徴は、動的特徴サイズスイッチ(DySw)内のノード間の接続を有効化/無効化することによって、利用可能な送信帯域幅に応じて柔軟に構成され得る。所望の圧縮係数を達成するためにいくつかのノードが接続又は切断されるときに、DNNの他のパラメータは同じままである。すなわち、同じDNNモデルが異なる圧縮係数に使用され、圧縮係数又はネットワーク帯域幅に適合するために新しいDNNモデルをダウンロードする必要はない。
【選択図】図9
【特許請求の範囲】
【請求項1】
無線送信/受信ユニット(WTRU)であって、
ディープニューラルネットワーク(DNN)モデルの一部であって、前記DNNモデルの分割点の前にあり、かつ前記DNNモデルの前記分割点における特徴を圧縮するためのニューラルネットワークを含む、前記DNNモデルの前記一部を受信するように構成された受信機と、
1つ以上のプロセッサであって、
前記ニューラルネットワークの圧縮係数を取得し、
前記圧縮係数に応答して、前記ニューラルネットワーク内のどのノードが接続されるべきかを決定し、
前記決定に応答して、前記ニューラルネットワークを構成し、かつ
圧縮された特徴を生成するために、前記DNNモデルの前記一部を用いて推論を実施するように構成されている、1つ以上のプロセッサと、
前記圧縮された特徴を別のWTRUに送信するように構成された送信機と、を備える、無線送信/受信ユニット(WTRU)。
【請求項2】
前記送信機が、取得された前記圧縮係数の指示を前記別のWTRUに送るように更に構成されている、請求項1に記載のデバイス。
【請求項3】
無線送信/受信ユニット(WTRU)であって、
ディープニューラルネットワーク(DNN)モデルの一部であって、前記DNNモデルの分割点の後にあり、かつ前記DNNモデルの前記分割点における特徴を拡張するためのニューラルネットワークを含む、前記DNNモデルの前記一部を受信するように構成された受信機であって、別のWTRUから出力された1つ以上の特徴も受信するように構成されている、受信機と、
1つ以上のプロセッサであって、
前記ニューラルネットワークの圧縮係数を取得し、
前記圧縮係数に応答して、前記ニューラルネットワーク内のどのノードが接続されるべきかを決定し、
前記決定に応答して、前記ニューラルネットワークを構成し、かつ
別のWTRUから出力された前記1つ以上の特徴を前記ニューラルネットワークへの入力として使用して、前記DNNモデルの前記一部を用いて推論を実施するように構成されている、1つ以上のプロセッサと、を備える、無線送信/受信ユニット(WTRU)。
【請求項4】
前記受信機が、前記圧縮係数を示す信号を受信するように更に構成されている、請求項3に記載のデバイス。
【請求項5】
前記圧縮係数が、推論時に動的に切り替え可能である、複数の圧縮係数から選択される、請求項1~4のいずれか一項に記載のデバイス。
【請求項6】
前記1つ以上のプロセッサが、前記圧縮係数が調整されるときに前記ネットワーク内のどのノードが接続されるべきかを決定するように構成されている、請求項1~5のいずれか一項に記載のデバイス。
【請求項7】
前記1つ以上のプロセッサが、前記ネットワーク内のどのノードが推論時に接続されるべきかを決定するように構成されている、請求項6に記載のデバイス。
【請求項8】
前記DNNモデルが、複数の分割点を含む、請求項1~7のいずれか一項に記載のデバイス。
【請求項9】
前記ネットワークが、少なくとも畳み込み層及び非線形層を含む、請求項1~8のいずれか一項に記載のデバイス。
【請求項10】
前記ネットワークが、バッチ正規化層を更に含む、請求項9に記載のデバイス。
【請求項11】
異なる圧縮係数に対して1つのDNNモデルのみが前記デバイスにロードされる、請求項1~10のいずれか一項に記載のデバイス。
【請求項12】
前記分割点及び前記圧縮係数のうちの少なくとも1つが、(1)物理層動作、(2)メディアアクセス制御層動作、(3)無線リソース制御層動作、(4)利用可能な処理リソース、及び(5)制御シグナリングのうちの1つ以上に基づいて適合される、請求項1~11のいずれか一項に記載のデバイス。
【請求項13】
前記分割点及び前記圧縮係数のうちの少なくとも1つが、送信データレートに基づいて適合される、請求項1~12のいずれか一項に記載のデバイス。
【請求項14】
前記分割点及び前記圧縮係数のうちの少なくとも1つが、前記送信データレートの変化に基づいて適合される、請求項13に記載のデバイス。
【請求項15】
無線送信/受信ユニット(WTRU)によって実施される方法であって、
ディープニューラルネットワーク(DNN)モデルの一部であって、前記DNNモデルの分割点の前にあり、かつ前記DNNモデルの前記分割点における特徴を圧縮するためのニューラルネットワークを含む、前記DNNモデルの前記一部を受信することと、
前記ニューラルネットワークの圧縮係数を取得することと、
前記圧縮係数に応答して、前記ニューラルネットワーク内のどのノードが接続されるべきかを決定することと、
前記決定に応答して、前記ニューラルネットワークを構成することと、
圧縮された特徴を生成するために、前記DNNモデルの前記一部を用いて推論を実施することと、
前記圧縮された特徴を別のWTRUに送信することと、を含む、方法。
【請求項16】
取得された前記圧縮係数の指示を前記別のWTRUに送ることを更に含む、請求項15に記載の方法。
【請求項17】
方法であって、
ディープニューラルネットワーク(DNN)モデルの一部であって、前記DNNモデルの分割点の後にあり、かつ前記DNNモデルの前記分割点における特徴を拡張するためのニューラルネットワークを含む、前記DNNモデルの前記一部を受信することと、
別のWTRUから出力された1つ以上の特徴を受信することと、
前記ニューラルネットワークの圧縮係数を取得することと、
前記圧縮係数に応答して、前記ニューラルネットワーク内のどのノードが接続されるべきかを決定することと、
前記決定に応答して、前記ニューラルネットワークを構成することと、
別のWTRUから出力された前記1つ以上の特徴を前記ニューラルネットワークへの入力として使用して、前記DNNモデルの前記一部を用いて推論を実施することと、を含む、方法。
【請求項18】
前記圧縮係数を示す信号を受信することを更に含む、請求項17に記載の方法。
【請求項19】
前記圧縮係数が、推論時に動的に切り替え可能である、複数の圧縮係数から選択される、請求項15~18のいずれか一項に記載の方法。
【請求項20】
前記ネットワーク内のどのノードが接続されるべきかが、前記圧縮係数が調整されるときに決定される、請求項15~19のいずれか一項に記載の方法。
【請求項21】
前記ネットワーク内のどのノードが接続されるべきかが、推論時に決定される、請求項20に記載の方法。
【請求項22】
前記DNNモデルが、複数の分割点を含む、請求項15~21のいずれか一項に記載の方法。
【請求項23】
前記ネットワークが、少なくとも畳み込み層及び非線形層を含む、請求項15~22のいずれか一項に記載の方法。
【請求項24】
前記ネットワークが、バッチ正規化層を更に含む、請求項23に記載の方法。
【請求項25】
異なる圧縮係数に対して1つのDNNモデルのみが前記デバイスにロードされる、請求項15~24のいずれか一項に記載の方法。
【請求項26】
前記分割点及び前記圧縮係数のうちの少なくとも1つが、(1)物理層動作、(2)メディアアクセス制御層動作、(3)無線リソース制御層動作、(4)利用可能な処理リソース、及び(5)制御シグナリングのうちの1つ以上に基づいて適合される、請求項15~25のいずれか一項に記載の方法。
【請求項27】
前記分割点及び前記圧縮係数のうちの少なくとも1つが、送信データレートに基づいて適合される、請求項15~26のいずれか一項に記載の方法。
【請求項28】
前記分割点及び前記圧縮係数のうちの少なくとも1つが、前記送信データレートの変化に基づいて適合される、請求項27に記載の方法。
【請求項29】
請求項15~28のいずれか一項に記載の方法に従って、ディープニューラルネットワークを適合するための命令を記憶させた、コンピュータ可読記憶媒体。
【発明の詳細な説明】
【技術分野】
【0001】
本実施形態は、概して、分割可能なディープニューラルネットワーク(Deep Neural Network、DNN)における動的特徴サイズ適応に関する。
【背景技術】
【0002】
人工知能は、今日の多くの技術分野の重要な機能ブロックである。これは、ディープニューラルネットワーク(DNN)の形態のニューラルネットワークの復活によるものである。現代のDNNは、多くの場合、計算集約的であり、したがって、低い処理能力を有するモバイルフォン又は他のエッジデバイス上でDNN動作を実行することは困難である。これは、多くの場合、モバイルデバイスからクラウドサーバにデータを転送することによって対処され、クラウドサーバにおいて、全ての計算が行われる。
【発明の概要】
【0003】
一実施形態によれば、デバイスが提示されており、デバイスは、無線送信/受信ユニット(Wireless Transmit/Receive Unit、WTRU)を備え、無線送信/受信ユニット(WTRU)は、ディープニューラルネットワーク(DNN)モデルの一部であって、当該DNNモデルの分割点の前にあり、かつ当該DNNモデルの当該分割点における特徴を圧縮するためのニューラルネットワークを含む、当該DNNモデルの当該一部を受信するように構成された受信機と、1つ以上のプロセッサであって、当該ニューラルネットワークの圧縮係数を取得し、当該圧縮係数に応答して、当該ニューラルネットワーク内のどのノードが接続されるべきかを決定し、当該決定に応答して、当該ニューラルネットワークを構成し、かつ圧縮された特徴を生成するために、当該DNNモデルの当該一部を用いて推論を実施するように構成されている、1つ以上のプロセッサと、当該圧縮された特徴を別のWTRUに送信するように構成された送信機と、を備える。
【0004】
別の実施形態によれば、デバイスが提示されており、デバイスは、無線送信/受信ユニット(WTRU)を備え、無線送信/受信ユニット(WTRU)は、ディープニューラルネットワーク(DNN)モデルの一部であって、当該DNNモデルの分割点の後にあり、かつ当該DNNモデルの当該分割点における特徴を拡張するためのニューラルネットワークを含む、当該DNNモデルの当該一部を受信するように構成された受信機であって、別のWTRUから出力された1つ以上の特徴も受信するように構成されている、受信機と、1つ以上のプロセッサであって、当該ニューラルネットワークの圧縮係数を取得し、当該圧縮係数に応答して、当該ニューラルネットワーク内のどのノードが接続されるべきかを決定し、当該決定に応答して、当該ニューラルネットワークを構成し、かつ別のWTRUから出力された当該1つ以上の特徴を当該ニューラルネットワークへの入力として使用して、当該DNNモデルの当該一部を用いて推論を実施するように構成されている、1つ以上のプロセッサと、を備える。
【0005】
別の実施形態によれば、方法が提示されており、方法は、無線送信/受信ユニット(WTRU)によって実施される方法を含み、方法は、ディープニューラルネットワーク(DNN)モデルの一部であって、当該DNNモデルの分割点の前にあり、かつ当該DNNモデルの当該分割点における特徴を圧縮するためのニューラルネットワークを含む、当該DNNモデルの当該一部を受信することと、当該ニューラルネットワークの圧縮係数を取得することと、当該圧縮係数に応答して、当該ニューラルネットワーク内のどのノードが接続されるべきかを決定することと、当該決定に応答して、当該ニューラルネットワークを構成することと、圧縮された特徴を生成するために、当該DNNモデルの当該一部を用いて推論を実施することと、当該圧縮された特徴を別のWTRUに送信することと、を含む。
【0006】
別の実施形態によれば、方法が提示されており、方法は、ディープニューラルネットワーク(DNN)モデルの一部であって、当該DNNモデルの分割点の後にあり、かつ当該DNNモデルの当該分割点における特徴を拡張するためのニューラルネットワークを含む、当該DNNモデルの当該一部を受信することと、別のWTRUから出力された1つ以上の特徴を受信することと、当該ニューラルネットワークの圧縮係数を取得することと、当該圧縮係数に応答して、当該ニューラルネットワーク内のどのノードが接続されるべきかを決定することと、当該決定に応答して、当該ニューラルネットワークを構成することと、別のWTRUから出力された当該1つ以上の特徴を当該ニューラルネットワークへの入力として使用して、当該DNNモデルの当該一部を用いて推論を実施することと、を含む。
【0007】
更なる実施形態は、本明細書に記載の方法を実施するように構成されたシステムを含む。そのようなシステムは、プロセッサと、プロセッサ上で実行されたときに本明細書で説明される方法を実施するように動作する命令を記憶する、非一時的コンピュータ記憶媒体と、を含み得る。
【図面の簡単な説明】
【0008】
図1A】1つ以上の開示される実施形態が実装され得る例示的な通信システムを示すシステム図である。
図1B】一実施形態による、図1Aに示される通信システム内で使用され得る例示的な無線送信/受信ユニット(WTRU)を示すシステム図である。
図2】特徴サイズ圧縮を伴わない2つのデバイス間の分散AIのためのメカニズムを示す。
図3A】それぞれ、特徴圧縮のための1つ、2つ、及び3つの候補分割を有するDNNを示す。
図3B】それぞれ、特徴圧縮のための1つ、2つ、及び3つの候補分割を有するDNNを示す。
図3C】それぞれ、特徴圧縮のための1つ、2つ、及び3つの候補分割を有するDNNを示す。
図4】特徴圧縮のための単一の分割を有するDNNを示す。
図5A】単一の圧縮係数がサポートされる、帯域幅縮小器(bandwidth-reducer、BWR)及び帯域幅拡張器(bandwidth-expander、BWE)を使用する、2つのデバイス、デバイス1とデバイス2との間の分散AIのための特徴サイズ圧縮メカニズムを示す。
図5B】複数の圧縮係数がサポートされる、特徴サイズ圧縮メカニズムを示す。
図6A】BWR及びBWEを伴わない総推論レイテンシを示す。
図6B】BWR及びBWRを伴う総推論レイテンシを示し、中間データのサイズが低減され得る。
図7】一実施形態による、分割と圧縮係数(compression factor、CF)構成との間で動的に切り替えるプロセスを示す。
図8A】デバイス1及び2がそれらの計算能力及び送信チャネルを推定することを示す。
図8B】デバイスの各々からのAI/MLモデルの受信を示す。
図8C】デバイスの推論時間動作を示す。
図9】一実施形態による、適応特徴圧縮のためのDNNにおける単一分割を伴う方法を示す。
図10】サイズ4の入力を縮小及び拡張することができる例示的なDySwを示す。
図11図9に示したDySw構成の接続を示す。
【発明を実施するための形態】
【0009】
図1Aは、1つ以上の開示された実施形態が実装され得る、例示的な通信システム100を示す図である。通信システム100は、音声、データ、ビデオ、メッセージ伝達、ブロードキャストなどのコンテンツを、複数の無線ユーザに提供する、多重アクセスシステムであり得る。通信システム100は、複数の無線ユーザが、無線帯域幅を含むシステムリソースの共有を通じて、上記のようなコンテンツにアクセスすることを可能にし得る。例えば、通信システム100は、コード分割多重アクセス(code division multiple access、CDMA)、時分割多重アクセス(time division multiple access、TDMA)、周波数分割多重アクセス(frequency division multiple access、FDMA)、直交FDMA(orthogonal FDMA、OFDMA)、シングルキャリアFDMA(single-carrier FDMA、SC-FDMA)、ゼロテールユニークワードDFT-Spread OFDM(zero-tail unique-word DFT-Spread OFDM、ZT UW DTS-s OFDM)、ユニークワードOFDM(unique word OFDM、UW-OFDM)、リソースブロックフィルタ処理OFDM、フィルタバンクマルチキャリア(filter bank multicarrier、FBMC)などの、1つ以上のチャネルアクセス方法を用い得る。
【0010】
図1Aに示すように、通信システム100は、無線送/受信ユニット(WTRU)102a、102b、102c、102d、RAN104、CN106、公衆交換電話網(public switched telephone network、PSTN)108、インターネット110、及び他のネットワーク112を含み得るが、開示された実施形態は、任意の数のWTRU、基地局、ネットワーク、及び/又はネットワーク要素を想定していることが理解されるであろう。WTRU102a、102b、102c、102dの各々は、無線環境において動作し、かつ/又は通信するように構成された、任意のタイプのデバイスであり得る。例として、それらのいずれも「局」及び/又は「STA」と称され得るWTRU102a、102b、102c、102dは、無線信号を送信及び/又は受信するように構成され得、ユーザ機器(user equipment、UE)、移動局、固定又は移動加入者ユニット、加入ベースのユニット、ページャ、セルラ電話、携帯情報端末(personal digital assistant、PDA)、スマートフォン、ラップトップ、ネットブック、パーソナルコンピュータ、無線センサ、ホットスポット又はMi-Fiデバイス、モノのインターネット(Internet of Things、IoT)デバイス、ウォッチ又は他のウェアラブル、ヘッドマウントディスプレイ(head-mounted display、HMD)、車両、ドローン、医療デバイス及びアプリケーション(例えば、遠隔手術)、工業用デバイス及びアプリケーション(例えば、工業用及び/又は自動処理チェーンコンテキストで動作するロボット及び/又は他の無線デバイス)、家電デバイス、商業用及び/又は工業用無線ネットワークで動作するデバイスなどを含み得る。WTRU102a、102b、102c、及び102dのいずれも、互換的にUEと称され得る。
【0011】
通信システム100はまた、基地局114a及び/又は基地局114bを含み得る。基地局114a、114bの各々は、CN106、インターネット110、及び/又は他のネットワーク112などの1つ以上の通信ネットワークへのアクセスを容易にするために、WTRU102a、102b、102c、102dのうちの少なくとも1つと無線でインターフェース接続するように構成された任意のタイプのデバイスであり得る。例として、基地局114a、114bは、基地局トランシーバ(base transceiver station、BTS)、ノードB、eNodeB、ホームノードB、ホームeNodeB、gNB、NR NodeB、サイトコントローラ、アクセスポイント(access point、AP)、無線ルータなどであり得る。基地局114a、114bは各々単一の要素として示されているが、基地局114a、114bは、任意の数の相互接続された基地局及び/又はネットワーク要素を含み得ることが理解されるであろう。
【0012】
基地局114aは、基地局コントローラ(base station controller、BSC)、無線ネットワークコントローラ(radio network controller、RNC)、リレーノードなど、他の基地局及び/又はネットワーク要素(図示せず)も含み得る、RAN104の一部であり得る。基地局114a及び/又は基地局114bは、セル(図示せず)と称され得る、1つ以上のキャリア周波数で無線信号を送信及び/又は受信するように構成され得る。これらの周波数は、認可スペクトル、未認可スペクトル、又は認可及び未認可スペクトルの組み合わせであり得る。セルは、相対的に固定され得るか又は経時的に変化し得る特定の地理的エリアに、無線サービスのカバレッジを提供し得る。セルは、更にセルセクタに分割され得る。例えば、基地局114aと関連付けられたセルは、3つのセクタに分割され得る。したがって、一実施形態では、基地局114aは、3つのトランシーバを、すなわち、セルのセクタごとに1つのトランシーバを含み得る。一実施形態では、基地局114aは、多重入力多重出力(multiple-input multiple output、MIMO)技術を用い得、セルのセクタごとに複数のトランシーバを利用し得る。例えば、ビームフォーミングを使用して、所望の空間方向に信号を送信及び/又は受信し得る。
【0013】
基地局114a、114bは、エアインターフェース116を介して、WTRU102a、102b、102c、102dのうちの1つ以上と通信し得るが、このエアインターフェース116は、任意の好適な無線通信リンク(例えば、無線周波数(radio frequency、RF)、マイクロ波、センチメートル波、マイクロメートル波、赤外線(infrared、IR)、紫外線(ultraviolet、UV)、可視光など)であり得る。エアインターフェース116は、任意の好適な無線アクセス技術(radio access technology、RAT)を使用して確立され得る。
【0014】
より具体的には、上記のように、通信システム100は、多重アクセスシステムであり得、例えば、CDMA、TDMA、FDMA、OFDMA、SC-FDMAなどの、1つ以上のチャネルアクセススキームを用い得る。例えば、RAN104及びWTRU102a、102b、102cの基地局114aは、広帯域CDMA(wideband CDMA、WCDMA)を使用してエアインターフェース116を確立し得る、ユニバーサル移動体通信システム(Universal Mobile Telecommunications System、UMTS)地上無線アクセス(Terrestrial Radio Access、UTRA)などの無線技術を実装し得る。WCDMAは、高速パケットアクセス(High-Speed Packet Access、HSPA)及び/又は進化型HSPA(HSPA+)などの通信プロトコルを含み得る。HSPAは、高速ダウンリンク(Downlink、DL)パケットアクセス(High-Speed Downlink Packet Access、HSDPA)及び/又は高速アップリンクパケットアクセス(High-Speed UL Packet Access、HSUPA)を含み得る。
【0015】
一実施形態では、基地局114a及びWTRU102a、102b、102cは、進化型UMTS地上無線アクセス(Evolved UMTS Terrestrial Radio Access、E-UTRA)などの無線技術を実装し得、これは、ロングタームエボリューション(Long Term Evolution、LTE)及び/又はLTE-Advanced(LTE-Advanced、LTE-A)及び/又はLTE-Advanced Pro(LTE-A Pro)を使用してエアインターフェース116を確立し得る。
【0016】
一実施形態では、基地局114a及びWTRU102a、102b、102cは、NR無線アクセスなどの無線技術を実装することができ、この技術は、新しい無線(New Radio、NR)を使用してエアインターフェース116を確立することができる。
【0017】
一実施形態では、基地局114a及びWTRU102a、102b、102cは、複数の無線アクセス技術を実装し得る。例えば、基地局114a及びWTRU102a、102b、102cは、例えば、デュアルコネクティビティ(dual connectivity、DC)原理を使用して、LTE無線アクセス及びNR無線アクセスを一緒に実装し得る。したがって、WTRU102a、102b、102cによって利用されるエアインターフェースは、複数のタイプの無線アクセス技術、及び/又は複数のタイプの基地局(例えば、eNB及びgNB)に送られる/そこから送られる送信によって特徴付けられ得る。
【0018】
他の実施形態では、基地局114a及びWTRU102a、102b、102cは、IEEE802.11(すなわち、無線フィデリティ(Wireless Fidelity、WiFi)、IEEE802.16(すなわち、ワイマックス(Worldwide Interoperability for Microwave Access、WiMAX)、CDMA2000、CDMA2000 1X、CDMA2000 EV-DO、暫定規格2000(IS-2000)、暫定規格95(IS-95)、暫定規格856(IS-856)、汎欧州デジタル移動電話方式(Global System for Mobile communications、GSM)、GSM進化型高速データレート(Enhanced Data rates for GSM Evolution、EDGE)、GSM EDGE(GERAN)などの無線技術を実装し得る。
【0019】
図1Aの基地局114bは、例えば、無線ルータ、ホームノードB、ホームeノードB又はアクセスポイントであり得、事業所、家庭、車両、キャンパス、工業施設、(例えば、ドローンによる使用のための)空中回廊、道路などの場所などの局所的エリアにおける無線接続を容易にするために、任意の好適なRATを利用し得る。一実施形態では、基地局114b及びWTRU102c、102dは、IEEE802.11などの無線技術を実装して、無線ローカルエリアネットワーク(wireless local area network、WLAN)を確立し得る。一実施形態では、基地局114b及びWTRU102c、102dは、IEEE802.15などの無線技術を実装して、無線パーソナルエリアネットワーク(wireless personal area network、WPAN)を確立し得る。更に別の一実施形態では、基地局114b及びWTRU102c、102dは、セルラベースのRAT(例えば、WCDMA、CDMA2000、GSM、LTE、LTE-A、LTE-A Pro、NRなど)を利用して、ピコセル又はフェムトセルを確立し得る。図1Aに示すように、基地局114bは、インターネット110への直接接続を有し得る。したがって、基地局114bは、CN106を介してインターネット110にアクセスする必要がない場合がある。
【0020】
RAN104は、WTRU102a、102b、102c、102dのうちの1つ以上に、音声、データ、アプリケーション、及び/又はボイスオーバインターネットプロトコル(voice over internet protocol、VoIP)サービスを提供するように構成された任意のタイプのネットワークであり得る、CN106と通信し得る。データは、例えば、異なるスループット要件、待ち時間要件、エラー許容要件、信頼性要件、データスループット要件、モビリティ要件などの、様々なサービス品質(quality of service、QoS)要件を有し得る。CN106は、通話制御、ビリングサービス、モバイルロケーションベースのサービス、プリペイド通話、インターネット接続性、映像配信などを提供し、かつ/又はユーザ認証などの高レベルセキュリティ機能を行い得る。図1Aには示されていないが、RAN104及び/又はCN106は、RAN104と同じRAT又は異なるRATを用いる他のRANと直接又は間接的に通信し得ることが理解されよう。例えば、NR無線技術を利用し得るRAN104に接続されることに加えて、CN106はまた、GSM、UMTS、CDMA2000、WiMAX、E-UTRA又はWiFi無線技術を用いて別のRAN(図示せず)と通信し得る。
【0021】
CN106はまた、PSTN108、インターネット110、及び/又は他のネットワーク112にアクセスするために、WTRU102a、102b、102c、102dのゲートウェイとして機能し得る。PSTN108は、基本電話サービス(plain old telephone service、POTS)を提供する公衆交換電話網を含み得る。インターネット110は、相互接続されたコンピュータネットワーク及びデバイスのグローバルシステムを含み得るが、これらのネットワーク及びデバイスは、送信制御プロトコル(transmission control protocol、TCP)、ユーザデータグラムプロトコル(user datagram protocol、UDP)、及び/又はTCP/IPインターネットプロトコルスイートのインターネットプロトコル(internet protocol、IP)などの、共通通信プロトコルを使用する。ネットワーク112は、他のサービスプロバイダによって所有及び/又は運営される、有線及び/又は無線通信ネットワークを含み得る。例えば、ネットワーク112は、RAN104と同じRAT又は異なるRATを用い得る1つ以上のRANに接続された別のCNを含み得る。
【0022】
通信システム100におけるWTRU102a、102b、102c、102dのいくつか又は全ては、マルチモード能力を含み得る(例えば、WTRU102a、102b、102c、102dは、異なる無線リンクを介して異なる無線ネットワークと通信するための複数のトランシーバを含み得る)。例えば、図1Aに示されるWTRU102cは、セルラベースの無線技術を用い得る基地局114a、及びIEEE802無線技術を用い得る基地局114bと通信するように構成され得る。
【0023】
図1Bは、例示的なWTRU102を示すシステム図である。図1Bに示すように、WTRU102は、とりわけ、プロセッサ118、トランシーバ120、送信/受信要素122、スピーカ/マイクロフォン124、キーパッド126、ディスプレイ/タッチパッド128、非リムーバブルメモリ130、リムーバブルメモリ132、電源134、全地球測位システム(global positioning system、GPS)チップセット136、及び/又は他の周辺機器138を含み得る。WTRU102は、一実施形態との一貫性を有したまま、前述の要素の任意の部分的組み合わせを含み得ることが理解されよう。
【0024】
プロセッサ118は、汎用プロセッサ、専用プロセッサ、従来のプロセッサ、デジタル信号プロセッサ(digital signal processor、DSP)、複数のマイクロプロセッサ、DSPコアと関連付けられた1つ以上のマイクロプロセッサ、コントローラ、マイクロコントローラ、特定用途向け集積回路(Application Specific Integrated Circuit、ASIC)、フィールドプログラマブルゲートアレイ(Field Programmable Gate Array、FPGA)回路、任意の他のタイプの集積回路(integrated circuit、IC)、状態機械などであり得る。プロセッサ118は、信号コーディング、データ処理、電力制御、入力/出力処理、及び/又はWTRU102が無線環境で動作することを可能にする任意の他の機能性を実行し得る。プロセッサ118は、送信/受信要素122に結合され得るトランシーバ120に結合され得る。図1Bは、プロセッサ118及びトランシーバ120を別個の構成要素として示すが、プロセッサ118及びトランシーバ120は、電子パッケージ又はチップにおいて一緒に統合され得るということが理解されよう。
【0025】
送信/受信要素122は、エアインターフェース116を介して基地局(例えば、基地局114a)に信号を送信するか又は基地局(例えば、基地局114a)から信号を受信するように構成され得る。例えば、一実施形態では、送信/受信要素122は、RF信号を送信及び/又は受信するように構成されたアンテナであり得る。一実施形態では、送信/受信要素122は、例えば、IR、UV又は可視光信号を送信及び/又は受信するように構成されたエミッタ/検出器であり得る。更に別の実施形態では、送信/受信要素122は、RF信号及び光信号の両方を送信及び/又は受信するように構成され得る。送信/受信要素122は、無線信号の任意の組み合わせを送信及び/又は受信するように構成され得るということが理解されよう。
【0026】
送信/受信要素122は、単一の要素として図1Bに示されているが、WTRU102は、任意の数の送信/受信要素122を含み得る。より具体的には、WTRU102は、MIMO技術を用い得る。したがって、一実施形態では、WTRU102は、エアインターフェース116を介して無線信号を送信及び受信するための2つ以上の送信/受信要素122(例えば、複数のアンテナ)を含み得る。
【0027】
トランシーバ120は、送信/受信要素122によって送信される信号を変調し、送信/受信要素122によって受信される信号を復調するように構成され得る。上記のように、WTRU102は、マルチモード能力を有し得る。したがって、トランシーバ120は、例えばNR及びIEEE802.11などの複数のRATを介してWTRU102が通信することを可能にするための複数のトランシーバを含み得る。
【0028】
WTRU102のプロセッサ118は、スピーカ/マイクロフォン124、キーパッド126、及び/又はディスプレイ/タッチパッド128(例えば、液晶ディスプレイ(liquid crystal display、LCD)表示ユニット若しくは有機発光ダイオード(organic light-emitting diode、OLED)表示ユニット)に結合され得、これらからユーザが入力したデータを受信し得る。プロセッサ118はまた、ユーザデータをスピーカ/マイクロフォン124、キーパッド126、及び/又はディスプレイ/タッチパッド128に出力し得る。加えて、プロセッサ118は、非リムーバブルメモリ130及び/又はリムーバブルメモリ132などの任意のタイプの好適なメモリから情報にアクセスし、かつメモリにデータを記憶し得る。非リムーバブルメモリ130は、ランダムアクセスメモリ(random-access memory、RAM)、読み取り専用メモリ(read-only memory、ROM)、ハードディスク又は任意の他のタイプのメモリ記憶デバイスを含み得る。リムーバブルメモリ132は、加入者識別モジュール(subscriber identity module、SIM)カード、メモリスティック、セキュアデジタル(secure digital、SD)メモリカードなどを含み得る。他の実施形態では、プロセッサ118は、サーバ又はホームコンピュータ(図示せず)上など、WTRU102上に物理的に配置されていないメモリから情報にアクセスし、かつメモリにデータを記憶し得る。
【0029】
プロセッサ118は、電源134から電力を受信し得るが、WTRU102における他の構成要素に電力を分配し、かつ/又は制御するように構成され得る。電源134は、WTRU102に電力を供給するための任意の好適なデバイスであり得る。例えば、電源134は、1つ以上の乾電池(例えば、ニッケルカドミウム(nickel-cadmium、NiCd)、ニッケル亜鉛(nickel-zinc、NiZn)、ニッケル金属水素化物(nickel metal hydride、NiMH)、リチウムイオン(lithium-ion、Li-ion)など)、太陽セル、燃料セルなどを含み得る。
【0030】
プロセッサ118はまた、GPSチップセット136に結合され得、これは、WTRU102の現在の場所に関する場所情報(例えば、経度及び緯度)を提供するように構成され得る。GPSチップセット136からの情報に加えて又はその代わりに、WTRU102は、基地局(例えば、基地局114a、114b)からエアインターフェース116を介して場所情報を受信し、かつ/又は2つ以上の近くの基地局から受信されている信号のタイミングに基づいて、その場所を判定し得る。WTRU102は、一実施形態との一貫性を有したまま、任意の好適な位置判定方法によって位置情報を取得し得るということが理解されよう。
【0031】
プロセッサ118は、他の周辺機器138に更に結合され得、他の周辺機器138には、追加の特徴、機能、及び/又は有線若しくは無線接続を提供する1つ以上のソフトウェア及び/又はハードウェアモジュールが含まれ得る。例えば、周辺機器138には、加速度計、電子コンパス、衛星トランシーバ、(写真及び/又はビデオのための)デジタルカメラ、ユニバーサルシリアルバス(universal serial bus、USB)ポート、振動デバイス、テレビトランシーバ、ハンズフリーヘッドセット、Bluetooth(登録商標)モジュール、周波数変調(frequency modulated、FM)無線ユニット、デジタル音楽プレーヤ、メディアプレーヤ、ビデオゲームプレーヤモジュール、インターネットブラウザ、仮想現実及び/又は拡張現実(Virtual Reality/Augmented Reality、VR/AR)デバイス、アクティビティトラッカなどが含まれ得る。周辺機器138は、1つ以上のセンサを含み得、センサは、ジャイロスコープ、加速度計、ホール効果センサ、磁力計、方位センサ、近接センサ、温度センサ、時間センサ、ジオロケーションセンサ、高度計、光センサ、タッチセンサ、磁力計、気圧計、ジェスチャセンサ、生体認証センサ、及び/又は湿度センサのうちの1つ以上であり得る。
【0032】
WTRU102は、(例えば、UL(例えば、送信用)及びダウンリンク(例えば、受信用)の両方のための特定のサブフレームと関連付けられた)信号のいくつか又は全ての送信及び受信が並列及び/又は同時であり得る、全二重無線機を含み得る。全二重無線機は、ハードウェア(例えば、チョーク)又はプロセッサを介した信号処理(例えば、別個のプロセッサ(図示せず)又はプロセッサ118を介して)を介して自己干渉を低減し、かつ又は実質的に排除するための干渉管理ユニットを含み得る。一実施形態では、WRTU102は、(例えば、UL(例えば、送信用)又はダウンリンク(例えば、受信用)のいずれかのための特定のサブフレームと関連付けられた)信号のうちのいくつか又は全てのうちのどれかの送信及び受信のための半二重無線機を含み得る。
【0033】
WTRUは、図1A図1Bに、無線端末装置として説明されているが、特定の代表的な実施形態では、そのような端末装置は、通信ネットワークとの有線通信インターフェースを(例えば、一時的に又は恒久的に)使用し得ることが想定される。
【0034】
図1A図1B、及び図1A図1Bの対応する説明を考慮して、WTRU102a~d、基地局114a~b、eNode-B160a~c、MME162、SGW164、PGW166、gNB180a~c、AMF182a~b、UPF184a~b、SMF183a~b、DN185a~b、及び/又は本明細書に記載される任意の他のデバイスのうちの1つ以上に関して本明細書に記載される機能のうちの1つ以上又は全部は、1つ以上のエミュレーションデバイス(図示せず)によって実行され得る(図示せず)。エミュレーションデバイスは、本明細書に説明される機能の1つ以上又は全てをエミュレートするように構成された1つ以上のデバイスであり得る。例えば、エミュレーションデバイスを使用して、他のデバイスを試験し、かつ/又はネットワーク及び/若しくはWTRU機能をシミュレートし得る。
【0035】
エミュレーションデバイスは、ラボ環境及び/又はオペレータネットワーク環境における他のデバイスの1つ以上の試験を実装するように設計され得る。例えば、1つ以上のエミュレーションデバイスは、通信ネットワーク内の他のデバイスを試験するために、有線及び/又は無線通信ネットワークの一部として完全に若しくは部分的に実装され、かつ/又は展開されている間、1つ以上若しくは全ての機能を実行し得る。1つ以上のエミュレーションデバイスは、有線及び/又は無線通信ネットワークの一部として一時的に実装/展開されている間、1つ以上若しくは全ての機能を実行し得る。エミュレーションデバイスは、試験を目的として別のデバイスに直接結合され得、かつ/又は地上波無線通信を使用して試験を実行し得る。
【0036】
1つ以上のエミュレーションデバイスは、有線及び/又は無線通信ネットワークの一部として実装/展開されていない間、全てを含む1つ以上の機能を実行し得る。例えば、エミュレーションデバイスは、1つ以上の構成要素の試験を実装するために、試験実験室での試験シナリオ、並びに/又は展開されていない(例えば、試験用の)有線及び/若しくは無線通信ネットワークにおいて利用され得る。1つ以上のエミュレーションデバイスは、試験機器であり得る。RF回路(例えば、1つ以上のアンテナを含み得る)を介した直接RF結合及び/又は無線通信は、データを送信及び/又は受信するように、エミュレーションデバイスによって使用され得る。
【0037】
上述したように、DNN動作の実行は、多くの場合、モバイルデバイスからクラウドサーバにデータを転送することによって対処され、クラウドサーバにおいて、全ての計算が行われる。しかしながら、これは帯域幅を必要とし、(送信レイテンシに起因して)時間集約的であり、データプライバシーの懸念を引き起こす。これを解決することができる1つの方法は、軽量で精度の低いDNNを介してユーザデバイス(例えば、モバイルフォン)上で全ての計算を行うことによるものである。他の方法は、高精度のDNNを介するが、単一/複数のモバイルデバイス及び/又はクラウドにわたって計算を共有することによるものである。
【0038】
フレキシブルAI方法
ユーザデバイス上でのみDNNモデルを実行するために、モデル圧縮技法が広く活用されている。それらは、モデルメモリフットプリント及びランタイムを低減して、それを特定のデバイスに適合させることを可能にする。しかしながら、モデルがどのデバイス上で実行されるかを前もって知らない場合があり、デバイスが知られている場合であっても、その利用可能なリソースは、例えば他のプロセスに起因して時間とともに変化する場合がある。これらの問題を克服するために、いわゆるフレキシブルAIモデルのファミリーが最近提案された。これらのモデルは、例えば、早期分類終了を可能にすること、モデル幅を適合させること(スリム化)、又は切り替え可能なモデル重み量子化を可能にすることを通じて、利用可能なリソースに即座に適合することができる。
【0039】
分散AI方法
いわゆる分散AI方法のいくつかは、2つ以上のデバイス(すなわち、WTRU)の間で、又はデバイスとクラウド/エッジとの間でモデルを分割する。例えば、図2は、特徴サイズ圧縮を伴わない、2つのデバイス、デバイス1とデバイス2との間の分散AIのためのメカニズムを示している。分散AIでは、非常に高い次元であり得る中間データ(特徴)が送信される必要がある。これは、処理におけるレイテンシを追加し、対応する送信ネットワークの帯域幅制限のために常に可能であるとは限らない。この問題を克服するために、ボトルネックを介して特徴サイズを縮小する方法が提案された。図3Aは、特徴圧縮のための1つの候補分割を有するDNNを示しており、ここで、a1、a2、又はa3を分割点として使用することができる。図3Bは、特徴圧縮のための2つの候補分割(例えば、a1及びa2)を有するDNNを示している。図3Cは、特徴圧縮のための3つの候補分割(例えば、c1、c2及びc3)を有するDNNを示している。
【0040】
いかなる限定も導入することなく、特徴は、現象を表すために使用され得るデータの個々の測定可能な特性又は特徴として考慮され得る。1つ以上の特徴は、機械学習アルゴリズム、ニューラルネットワーク、及び/又はその層のうちの1つの入力及び/又は出力に関連し得る。例えば、特徴は、ベクトルとして編成されてもよい。例えば、無線ユースケースに関連付けられた特徴は、時間、送信機アイデンティティ、及び基準信号(Reference Signal、RS)上の測定値を含み得る。
【0041】
例えば、測位情報を処理するために使用されるアルゴリズムに関連付けられた特徴は、測位RS(positioning RS、PRS)の測定に関連付けられた値、基準信号受信電力(Reference Signal Receive Power、RSRP)などの量、基準信号受信品質(Reference Signal Receive Quality、RSRQ)などの量、受信信号強度指示(Received Signal Strength Indication、RSSI)に関連する量、別個のソースの信号に基づく時間差測定に関連する量(例えば、時間ベースの測位方法の場合)、到来角測定に関連する量、ビームの品質に関連する量、及び/又はセンサからの出力(WTRU回転、カメラからの撮像など)に関連付けられた値を含むことができる。
【0042】
例えば、チャネル状態情報(Channel State Information、CSI)を処理するために使用されるアルゴリズムに関連付けられた特徴は、チャネル状態基準信号(Channel State Reference Signal、CSI-RS)、同期信号ブロック(Synchronization Signal Block、SSB)、プリコーディング行列指示(Precoding Matrix Indication、PMI)、ランクインジケータ(Rank Indicator、RI)、チャネル品質インジケータ(Channel Quality Indicator、CQI)、RSRP、RSRQ、RSSIなどの受信に関連付けられた量の測定値を含み得る。
【0043】
例えば、ビーム管理及び選択を処理するために使用されるアルゴリズムに関連付けられた特徴は、CSI、送信/受信ポイント(Transmit/Receive Point、TRP)識別情報(identity、ID)、ビームID、及び/又はビーム障害検出(Beam Failure Detection、BFD)に関係する1つ以上のパラメータ(例えば、十分なビーム品質のしきい値決定)を処理するためのものと同様の測定値に関連付けられた量を含み得る。
【0044】
同様に、本明細書で説明される任意の方法は、AI/ML処理の特定の段階、例えば、訓練又は推論のための機械学習アルゴリズムのために使用されるハイパーパラメータに適用され得るか、又はそのための特定のパラメータ設定を更に含み得る。
【0045】
図4は、特徴圧縮のための単一の分割(それぞれa2、b2)を有するDNNを示しており、ここで、特徴サイズは、(a)4から2に、かつ(b)4から3に縮小される。具体的には、(a3)は、4から2への特徴サイズ縮小を実現するサブネットワークであり、(b3)は、4から3への縮小を実現するサブネットワークである。既存の研究では、DNNは、各圧縮係数について特徴圧縮器及び拡張器を用いて最初から訓練される。圧縮係数は、圧縮器の出力における特徴サイズと圧縮器への入力における特徴サイズとの比であることに留意されたい。これは、圧縮係数を変更する必要があるときはいつでも、デバイス及びクラウドサーバは、クラウドサーバから新しいモデルを調整し、かつ新たにダウンロードしなければならないことを意味する。図5Aは、単一の圧縮係数がサポートされる、帯域幅縮小器(BWR、510)及び帯域幅拡張器(BWE、520)を使用する、2つのデバイス、デバイス1とデバイス2との間の分散AIのための特徴サイズ圧縮メカニズムを示している。しかしながら、これらの方法では、ボトルネックを異なる送信ネットワーク帯域幅に適合させることができない。
【0046】
分散AIパラダイムにおける柔軟性を提供するために、我々は、フレキシブル分散AI(Flexible and Distributed AI、FD-AI)手法を導入する。提案された手法は、DNNが2つ以上のデバイス間で分割され得るので、分散される。また、提案された手法は、デバイス内の利用可能なリソースに応じて、いくつかの可能な分割点候補の中から分割点を選択することができるので、柔軟である。加えて、各分割点で送信される特徴サイズは、送信のために利用可能なネットワーク帯域幅に適合するように圧縮され得る。
【0047】
一実施形態では、我々は、DNNアーキテクチャの一部である切り替え可能なボトルネックサブネットワークを提案する。ボトルネックサブネットワークは、推論時に異なる送信ネットワーク帯域幅に適合することができるので、切り替え可能である。提案された設計では、我々は、特徴サイズを縮小するための層を有する1つのボトルネックサブネットワークと、特徴サイズを元のサイズに戻すための層の他のセットとを有する。これらのボトルネックサブネットワークは、任意の既存のDNNの1つ以上の分割位置に組み込むことができる。簡潔にするために、以下の説明では、我々は、特徴サイズ縮小及び拡張のためのボトルネックサブネットワークの1つのセットを有する単一の分割を有するDNNを検討する。
【0048】
一実施例では、第1のデバイスは、エッジデバイス又はクラウドサーバのいずれかであり得、第2のデバイスは、エッジデバイス又はクラウドサーバのいずれかであり得る。より一般的には、本明細書で説明する方法は、通信リンクを介してデータを交換する任意のデバイスに適用され得る。そのようなデバイスは、分割ニューラルネットワーク又はオートエンコーダ機能の処理を含み得る。本明細書で説明する方法は、例えば、エンドユーザアプリケーション(例えば、オーディオ、ビデオなど)のための、又はデータの送信及び/若しくは受信のための処理に関係する機能のための、デバイスにおける処理に適用可能であり得る。より一般的には、そのようなデバイスは、モバイル端末、gNBなどの無線アクセスネットワークノードなどであり得る。そのような通信リンクは、3GPP Uu、3GPPサイドリンク、又はWifiリンクなどの無線リンク及び/又はインターフェースであり得る。
【0049】
ボトルネックサブネットワークの特徴サイズ縮小層を有する分割点までのDNN層は、第1のデバイスにロードされる。残りの部分、すなわち、ボトルネックサブネットワーク拡張器及び分割点の後のDNNの残りは、第2のデバイスにロードされる。我々は、動的特徴サイズスイッチ(Dynamic feature size Switch、DySw)として、縮小器及び拡張器を含むボトルネックサブネットワークを参照する。第2のデバイスに送信される特徴は、DySwの中間で抽出される。我々は、これを実現するDNNを動的切り替え可能な機能サイズネットワーク(Dynamic Switchable Feature Size Network、DyFsNet)と呼ぶ。DyFsNetは、一般に、畳み込みニューラルネットワーク(convolutional neural network、CNN)などの任意のDNNアーキテクチャに適用され、設計及び訓練において新規である。DyFsNetにおける推論は単純であり、(分割位置及び利用可能なネットワーク帯域幅に関して)調整可能である。
【0050】
図5Bは、帯域幅縮小器(BWR)及び帯域幅拡張器(BWE)を使用して、2つのデバイス、デバイス-1とデバイス-2との間の分散AIのための複数の圧縮係数をサポートする特徴サイズ圧縮メカニズムの一実施例を示しており、ここで、K、K、...、Kは、推論時に排他的かつ動的に切り替え可能である訓練可能なBWR(530)及びBWE(540)内の圧縮係数を指定する。
【0051】
より具体的には、デバイス-1及びデバイス-2は、任意選択でサーバとともに、チャネル条件及びデバイス状態を監視し、分割位置における圧縮係数及び特徴サイズを選択する。デバイス-1は、分割位置までのDNNモデルの第1の部分を受信し、デバイス-2は、DNNモデルの残りの部分を受信する。デバイス-1では、入力から特徴を計算するために推論が実施され、次いでBWRによって圧縮される。図10及び図11に関連してより詳細に説明するように、BWR(530)においてどのノードが接続されるかを制御することによって、異なる圧縮係数を得ることができる。デバイス-2では、圧縮された特徴が受信され、BWE(540)によって拡張される。BWRと同様に、BWEは、BWE内のノード接続を制御することによって圧縮係数を制御することができる。次に、デバイス-2は、推論を継続し、最終出力を提供する。
【0052】
ネットワーク帯域幅制限は、推論全体に追加のレイテンシを導入する。図6Aは、BWR及びBWEなしの全推論レイテンシを示している。図6Bは、中間データのサイズが低減され得る、BWR及びBWRを伴う総推論レイテンシを示している。
【0053】
上述したように、我々は、予測の精度をほぼ維持しながら通信ネットワーク上のスループット要件を制限するために、DNNモデル内の異なる位置における中間データサイズを低減する方法を提案する。図7は、一実施形態による、分割/圧縮係数(CF)構成間で動的に切り替えるプロセスを示している。
【0054】
モデル訓練及び分割/CF推定段階(710)の間、DyFsNetモデルは、異なる分割及びCFについて訓練される。これは、現在、クラウドサーバにおいてオフラインで行うことができる。訓練されたモデルは、クラウドサーバに保存され、デバイスのダウンロードに利用可能である。(サーバ側の)オーケストレータは、要求に基づいて、訓練されたモデル選択及びエンドデバイスへの送信の調整を管理する。ここでは、帯域幅に関する情報が利用可能であると仮定する。これに基づいて、CFは、特徴サイズと利用可能な帯域幅との比として推定される。
【0055】
例えば、オーケストレータ又は外部制御システムは、エンドデバイス(例えば、デバイス-1及びデバイス-2)の計算能力に基づいて、DNNの分割位置を決定する。これは、分割情報に従って処理するためにDNNをロードするデバイスに通信される。
【0056】
モデル展開段階(720)では、訓練された分割モデルがデバイスによって受信される。受信されると、それらは推論のためにデバイスにロードされる。
【0057】
ネットワーク(例えば、帯域幅)及び/又はデバイス(例えば、利用可能な処理能力)の状態が監視される(730)。デバイスは、それらの間のネットワークチャネルを監視し、それらの間でCFを調整する。これは、サーバを伴わずに行われる。
【0058】
デバイス間でコンセンサスに達すると、CF選択(740)が行われ、したがって、分割位置における特徴サイズに影響を与える。利用可能なCFオプションは、分割が実現されるDNN層のフィルタ内のチャネルの数に依存することに留意されたい。通常、CFは、利用可能な帯域幅にほぼ一致するように選択され、厳密に一致するように選択されない。
【0059】
分割モデル推論は、第1のデバイス及び第2のデバイス上で実施される(750)。例えば、第1のデバイスは、分割までのDNNを用いて中間特徴を計算し、特徴を圧縮し、圧縮された特徴を第2のデバイスに転送する。第2のデバイスは、圧縮された特徴を受信し、それを圧縮せず、DNN推論を続ける。デバイスが無線端末デバイスであり、かつ/又はデバイスの通信リンクが無線エアインターフェース(例えば、NR Uu、サイドリンクなど)である一実施形態では、デバイスは、以下のうちの少なくとも1つを実施することができる。
-本明細書で提案される適合を開始する。例えば、デバイスは、分割処理ポイント、特徴次元、圧縮係数、推論レイテンシ、処理要件、機能の精度、又は本明細書で提案される任意の他の態様を適合し得る。
-デバイスは、L1/物理(physical、PHY)層動作に関連して以下のうちの少なくとも1つを決定すると、AI処理のためのそのような適合をトリガし得る。
○デバイスは、無線特性の変化が発生したと決定し得、ここで、そのような特性は、例えば、セルのアイデンティティの変化、キャリア周波数の変化、帯域幅部分(bandwidth part、BWP)の変化、BWP及び/又はセルの物理リソースブロック(physical resource block、PRB)の数の変化、サブキャリア間隔(sub-carrier spacing、SCS)の変化、送信に利用可能なアグリゲートキャリアの数の変化、利用可能な送信電力の変化、測定量の変化などの、インターフェースを介した送信データレートに影響を与え得る。
○デバイスは、制御チャネルリソース(CORESET)又はアイデンティティの変化など、無線インターフェースを介した動作状態の変化が発生したと決定し得、ここで、第1のアイデンティティは、第1のしきい値に関連付けられ得、第2のアイデンティティは、第2のしきい値に関連付けられ得る。
○デバイスは、変化が、チャネル品質の劣化を示す特定の可能な構成されたしきい値を上回ると決定し得、AI処理に関連付けられたデータレートを低下させる適合を実施し得る。逆に、デバイスは、無線状態の改善を決定し、かつAI処理に関連付けられたデータレートを増加させ得る適合を実施し得る。
例えば、これは、CSI自動エンコーディング(autoencoding)のようなデバイスの物理層機能に適用可能である。
-デバイスは、L2/媒体アクセス制御(Medium Access Control、MAC)層動作に関して以下のうちの少なくとも1つを決定すると、AI処理のためのそのような適合をトリガし得る。
○デバイスは、データ処理、情報ベアラ(例えば、データ無線ベアラ、シグナリング無線ベアラ)の変化が発生したことを決定し得、そのような特性は、論理チャネル優先順位付けパラメータ(例えば、パケット遅延バジェット(Packet Delay Budget、PDB)、優先ビットレート(Prioritized Bit Rate、PBR)、TTI持続時間/ヌメロロジーの変化、関連するQoSフローIDの変化、異なるデータレートを可能にするリソースのセットへのマッピング制限など)などの、AI処理に利用可能なインターフェースを介した送信データレートに影響を及ぼし得る。
○デバイスは、変化が、AI処理のために利用可能なデータレートの減少を示す特定の可能な構成されたしきい値を上回ると決定し得、AI処理に関連付けられたデータレートを低下させる適合を実施し得る。逆に、デバイスは、利用可能なデータレートの増加を決定し、AI処理に関連付けられたデータレートを増加させ得る適合を実施し得る。
例えば、これは、デバイスの測位機能のようなシステムレベル機能に適用することができる。例えば、これは、特定のデータ無線ベアラ(data radio bearer、DRB)及び/又はDRBタイプ、例えば、DRB又はその特性の変化が、関連付けられたアプリケーション層におけるAIベースの処理の適合をトリガし得るような特定のAI対応アプリケーションに関連付けられたDRBへの適用であり得る。
-デバイスは、L3/無線リソース制御(Radio Resource Control、RRC)層動作に関して、以下のうちの少なくとも1つを決定すると、AI処理のためのそのような適合をトリガし得る。
○デバイスは、例えば、利用可能なデータレートを変化し得る上記で説明した態様などの、L1/L2構成のうちの1つ以上に影響を与える、構成の変化が発生したと決定し得る。
○デバイスは、例えば、モビリティのための再構成メッセージを受信したこと、及び/又は(例えば、条件付きハンドオーバコマンドのために)適用すべきであることを決定することができ、ここで、メッセージは、AI処理及び/又はその関連する無線ベアラのための適用可能なデータレートの指示を含むことができる。
○デバイスは、無線リンク障害(radio link failure、RLF)などの無線リンク障害が発生したと決定することができる。
○デバイスは、変化が、AI処理のために利用可能なデータレートの減少を示す特定の可能な構成されたしきい値を上回ると決定し得、AI処理に関連付けられたデータレートを低下させる適合を実施し得る。逆に、デバイスは、利用可能なデータレートの増加を決定し、AI処理に関連付けられたデータレートを増加させ得る適合を実施し得る。代替的に、それは、イベント自体が、AI処理のために利用可能なデータレートの増加(例えば、デバイスの構成の接続性、例えば、デュアル接続性へのセルの追加)又は減少(例えば、RLF及び/又はデバイスの構成の接続性へのセルの除去)に関連付けられ得ると決定し得る。
-デバイスは、利用可能な処理リソースに関連して以下のうちの少なくとも1つを決定すると、AI処理のためのそのような適合をトリガし得る。
○デバイスは、例えば、インスタンス化された及び/又はアクティブなAIプロセスの数の変化に基づいて、動的デバイス能力の変化に基づいて、又はAI処理のための処理要件(例えば、推論レイテンシ、精度)の変化に基づいて、利用可能なハードウェア処理の変化が生じたと決定し得る。
○デバイスは、デバイスの電力状態の変化が発生したと決定し得る。例えば、デバイスは、それが第1の状態から第2の状態に遷移したと決定し得、ここで、そのような状態は、RRC接続性状態(IDLE、INACTIVE、又はCONNECTED)、DRX状態(アクティブ、非アクティブ)、又はそれらの異なる構成に関係し得る。
○デバイスは、変化が、利用可能な処理リソースの減少を示す、特定の可能な構成されたしきい値を上回ると決定し得る。逆に、デバイスは、利用可能な処理リソースの増加を決定し、AI処理に関連付けられたデータレートを増加させ得る適合を実施し得る。同様に、特定の状態は、関連付けられた特定のAI処理レベル、分割点構成、及び/又はデータレートに関連付けられ得る。
-デバイスは、以下のうちの少なくとも1つに従って制御シグナリングを受信すると決定すると、AI処理のためのそのような適合をトリガし得る。
○デバイスは、AI処理/AI処理のために利用可能なデータレートの増加又は減少のいずれかを示す、制御情報を受信し得る。これは、シグナリングされた値、並びに/若しくはL1、L2、L3処理及び/若しくは省電力管理について上記で説明したような値の制御チャネルプロパティの修正に暗黙的に基づいてもよく、又は制御メッセージ中の指示を明示的に使用してもよい。そのような制御情報は、L1信号、L1メッセージ、例えば、PDCCH上のDCIにおいて、L2 MAC制御要素において、又はRRCメッセージにおいて受信され得る。
○制御情報は、所与のAI処理、ハイパーパラメータ設定、ターゲット解像度、ターゲット精度、ターゲット特徴ベクトルなどに適用される特定の分割点構成を含むことができる。
【0060】
図8A図8B、及び図8Cは、プロセスの別の図を提供する。図8Aは、デバイス1及び2(840、860)が、それらの計算能力及び送信チャネル(850)を推定することを示している。それらの推定値は、オペレータ/エッジ/クラウドに伝達され(820、830)、好適なAI/MLモデル(810)が要求される。
【0061】
図8Bには、デバイスの各々からのAI/MLモデルの受信が示されている。オペレータ/クラウド/エッジは、モデルの選択を行い、ネットワークによってモデルを送信し(830)、要求されたモデルは、デバイス1及び2によって受信される。
【0062】
図8Cは、デバイスの推論時間動作を示している。デバイス-1は、特徴を計算し、次いで、チャネル条件に基づいて、適切な寸法の特徴サイズがデバイス-2に送信される。デバイス1は、入力データ(870)に対して推論を実施する。入力データは、デバイスメモリからの1つ若しくは多くの画像、若しくはデバイスのカメラからライブでキャプチャされた画像、又はデバイスメモリ上のオーディオデータ、若しくはデバイスマイクロフォンからライブでキャプチャされたオーディオデータ、又はDNNによって処理される必要がある任意の他のデータであり得る。デバイス-1は、MSDNetタイプのDNNの場合など、DNNによって処理された中間又は初期出力(880)を出力する。特徴の更なる処理に必要な情報がまた、チャネル(850)を介してデバイス-2に通信される。デバイス-2は、特徴を受信し、更に、必要に応じて推論及びCFの切り替えを継続し、最終出力(890)を提供する。追加的に、デバイス-1は、特徴を更に処理するために、制御情報とともに特徴をデバイス-2に送信する。デバイス-2は、特徴及び制御情報を受信し、推論を続ける。
【0063】
図9は、特徴圧縮のためにDNNにおいて単一の分割を用いる提案された方法を示している。図9(a)は、圧縮係数が選択されていない共同訓練されたサブネットワークDySw(a3)を示している。図9(b)は、選択された特徴圧縮係数4対2を有する共同訓練されたサブネットワーク(b3)を示している。図9(c)は、選択された特徴圧縮係数4対3を有する共同訓練されたサブネットワーク(c3)を示している。なお、図9(a)、図9(b)、及び図9(c)のDNNは、同じ(単一の)DNNである。
【0064】
DySwは、DNN全体と一緒に訓練され得る。代替的に、DySwを伴わないDNNが事前訓練され、DySwサブネットワークが追加される。この代替解決策では、事前訓練されたDNNは、DySw(a3)サブネットワークで拡張され、訓練は、事前訓練されたDNN(の重み)を不変(すなわち、固定)に保ちながら、DySwのみに対するものであることに留意されたい。
【0065】
図9に示すように、DySwは、複数の圧縮係数に適合するように再構成可能である。再構成は、DySwノードの接続詳細を通じて実現される。例えば、図10に示すようなDySwサブネットワークの場合、我々は、図11に示すようなノード接続を指定するサイズ4×3の行列を維持することができる。行列内の各要素(Eij)は、入力ノードiが出力ノードjに接続されているかどうかを表し、「0」は切断されていることを表し、「1」は接続されていることを表す。図11(a)、図11(b)、及び図11(c)に示す行列は、それぞれ図9(a)、図9(b)、及び図9(c)に対応している。具体的には、図9(a)は、いずれの入力ノードもいずれの出力ノードにも接続されないことを指定し、図9(b)は、出力ノードのうちの2つ(出力ノード-2及びノード-3)のみが入力ノードに接続されることを指定し、図9(c)は、入力の全てのノードが出力に接続されることを指定する。図11は、縮小器側の接続を示しており、拡張器は、異なる圧縮係数に対応する行列を維持することができる。一実施例では、拡張器側の行列の形状は(縮小器側のものに対して)転置されるが、全て0の行の数は同じままである。
【0066】
図8に示されるように、デバイスはCFを調整する。一実施形態では、オーケストレータ又は外部制御システムが、利用可能な帯域幅についてデバイス-1に通知する。デバイス-1は、帯域幅に関する情報に基づいて、使用されるCFを決定する。次に、デバイス-1は、決定されたCFに対応する特徴サイズ圧縮を実現するためにDySwを切り替える。デバイス-1はまた、それが使用しているCFを通信することができ、したがって、デバイス-2は、通信された情報に適合するようにDNNのその側を切り替える。
【0067】
一実施形態では、CFが選択された後、デバイス-1は、選択されたCFを提供するためにノード間でどの接続が無効にされるべきかを決定し、デバイス-2はまた、拡張を適切に実施するために対応してどの接続が無効にされるべきかを決定する。CFは、いくつの出力ノードが入力ノードに接続されるかを決定するが、その方法及びその数は学習を通して決定される。
【0068】
上述したように、図10は、サイズ4の入力を縮小及び拡張することができる例示的なDySwを示している。図10は簡略化のために単一層の「縮小器」ブロックを示しているが、縮小器は単一層に限定されないことに留意されたい。図示されたDySwは、4対3、4対2、及び4対1の圧縮、並びに対応する拡張(すなわち、1対4、2対4、及び3対4)が可能である。DySw設計は、必要に応じて追加の層、例えば、より良好な訓練のためのBatchNorm層を有し得る。ここでは、縮小器(点線の左側に示されたBWR)及び拡張器(点線の右側に示されたBWE)のみを示す。非線形性は、層に内在する。BatchNorm層は、効率的な訓練のために必要とされるオプションの層であり得、したがって、ここでは示されない。
【0069】
より一般的には、典型的なDySwは、4つのタイプの層、すなわち、特徴次元縮小器及び拡張器層、非線形層、並びにバッチ正規化(BatchNorm)層を備える。これらの層のうち、BatchNorm層はオプションである。単純なDySwを図10に示す。
【0070】
DNN分類器で使用されるDySwは、従来のタスク固有損失、例えば、分類タスクのためのクロスエントロピー損失又は回帰タスクのための平均二乗誤差損失を使用して訓練され得る。DySwは、任意のタスク、すなわち分類、検出、又はセグメント化のために、かつ任意のDNNアーキテクチャ、すなわちCNN、GAN、オートエンコーダなどにおいて使用され得る。DySwを訓練することは、縮小器-拡張器層重み及びバッチ正規化層(「BatchNorm」としても示される)のパラメータを学習することを伴う。BatchNormは、訓練のより速い収束のために使用される。
【0071】
DySw訓練は、損失目標に対する追加の制約を可能にする。例示として、我々は、DySwにわたる再構成損失の加算を示す。再構成損失は、DySwへの入力とDySwへの出力との間の視差にペナルティを課す。DySwは、訓練されたDNNに追加され得る、補助的なオプションのエンティティである。
【0072】
DySwでは、低減係数は、推論時にオンザフライで切り替え可能である。DyFsNetでは、訓練反復は、以下で更に詳述されるように、複数の低減係数を用いて共有DySw重みを共学習するように修正される。
【0073】
DySwの訓練は、クラウド/オペレータ/エッジ上で行われるオフライン若しくはオンラインであり得るか、又はデバイス上の連合訓練であり得る。ここでは、我々は、DySwを有する2つのデバイス間の単一分割の場合の分割DNNのアーキテクチャ及び訓練について説明する。本明細書で説明される訓練メカニズムは、複数の分割ケースに拡張され得る。以下では、我々は、分割DNNのアーキテクチャ、DySw層及びDyFsNet(DySw層を有するDNN)のアーキテクチャ、並びに異なる損失関数及びそれらの訓練を詳細に説明する。
【0074】
デバイス-1が層-1まで処理し、デバイス-2が層l+1以降で処理する、l番目の層の終わりでの分割を考える。デバイス-1内のDNNの一部をhdevice1とし、同様にデバイス-2内のDNNの一部をhdevice2とする。DNNへの入力は任意のタイプのデータとすることができるが、ここでは、入力Xを、X∈R{W×H×3}となるようなカラー画像し、式中、W、Hは、幅、高さであり、3は、カラーチャネル(例えば、RGB)の数を表す。分割における特徴テンソル(又は単に特徴)は、y∈R{M×N×C}であり、式中、M、N、及びCは、その幅、その高さ、及びチャネル数を表す。特徴yが無線ネットワークを介してデバイス-2に送信され、デバイス-2は、入力としてyを取り、出力Yを生成する。したがって、y=hdevice1(X)であり、Y=hdevice2(y)である。
【0075】
DySwは、hDySwによって表されるサブネットワークである。hDySwのパラメータは、θDySwである。DySwの縮小器(第1の部分)及び拡張器(第2の部分)をBWR及びBWEと呼ぶとすると、そのような縮小器及び拡張器の例示的な実装形態は、以下に要約されるように、畳み込み層、非線形層(ReLu)、及びバッチ正規化層(BatchNorm)を含むことができる。
【0076】
【数1】
【0077】
DySwを有するDNNは、DyFsNetと呼ばれる。DyFsNetをhのように表す。θはhのパラメータとする。分割点の前のDyFsNetのサブネットワークは、
【0078】
【数2】
である。分割点の後のサブネットワークは、
【0079】
【数3】
である。
【0080】
DySwは、特徴サイズの様々な圧縮係数(CF)の間で切り替える。CF切り替えは、Kによってインデックス付けされる。DyFsNetの分割における、Kによってインデックス付けされる中間出力は、以下の通りである。
【0081】
【数4】
ここで
【0082】
【数5】
は、それぞれBWR及びBWEを行うDySwサブネットワークであり、
【0083】
【数6】
及びDNN分類器について
【0084】
【数7】
であり、Nは、クラスの数であり、下付き文字Kは、圧縮係数を表す。
【0085】
【数8】
は、DNNの目的によって異なり、それが分類器であるか、回帰器であるか、又は生成器であるかに依存する。一般性を失うことなく、我々は、ここでは分類器の場合を仮定する。
【0086】
設定は、2つのタイプの監視を提供し、一方のタイプは、グラウンドトゥルースラベル
【0087】
【数9】
を介し、他方のタイプは、DySwサブネットワークへの入力とDySwサブネットワークの出力との間の再構築損失(例えば、平均二乗誤差の形式)である。追加的に、DyFsNetが事前訓練されたDNNで初期化される場合、事前訓練されたDNN、YKDの出力とDySwサブネットワークの出力との間の知識蒸留損失を使用することが可能である。利便性のために、我々は、YTrueandYKDで計算された損失を、監視をグローバル損失として、かつDySwを通じる再構築損失
【0088】
【数10】
をローカル損失として参照することができる。ネットワークの訓練中に最適化される異なるタイプの損失を以下に示す。
【0089】
最初から訓練されたDyFsNet:
【0090】
【数11】
【0091】
事前訓練された初期化を使用して訓練されたDyFsNet:
【0092】
【数12】
【0093】
最初から訓練されたマルチ分割DyFsNet:
【0094】
【数13】
【0095】
事前訓練された初期化から訓練されたマルチ分割DyFsNet:
【0096】
【数14】
【0097】
DyFsNet訓練アルゴリズム
(X,Y)∈Dをデータセットとし、ここで、X及びYは、それぞれデータ及びその監視であり、i∈{0、1、...、N}は、インデックスであり、Nは、訓練サンプルの数であり、Num-of-epochsは、訓練エポックの数である。ここで、我々は、グローバル損失、すなわち、クロスエントロピー及びKDを使用する分類器のための訓練アルゴリズムを与える。KDベースの損失は、i)圧縮なしのDySw(すなわち、K=1を有するDySw)の出力、ii)目下のより低い圧縮係数を有するDySwの出力(すなわち、K=K1を有するDySwからK=K2への蒸留、ここで、K1<K2である)、iii)非圧縮DySw出力と最も近い圧縮されたDySw出力/sとのアフィン結合、又はiv)同じタスクのために十分に訓練された完全に異なるDNNアーキテクチャの出力、からの蒸留による4つのタイプであり得る。
【0098】
全体のアルゴリズムは以下の通りである。
a.DySwの非圧縮構成についてDyFsNetの損失を計算する。我々の実施例では、それはクロスエントロピー損失であるが、それだけに限定されない。
b.逆伝播を行い、DySwの非圧縮構成について勾配を累積する。
c.1~Cの範囲のCFのN数を選択し、ここで、1は非圧縮を表し、Cは最大圧縮を表す。
d.CF=2~N:の場合
i.蒸留タイプ(i)、(ii)、(iii)、又は(iv)についてDyFsNetの損失を計算する。
ii.逆伝播を行い、DySwの勾配を累積する。
e.累積された勾配を使用して重みを更新する。
【0099】
一実施例では、以下の擬似コードが使用される。
【0100】
非圧縮(K=1)DySw出力からのKD:
【0101】
【表1】
【0102】
K=K1を有するDySwの出力からK=K2を有するDySwへのKDであり、ここで、K1<K2である:
【0103】
【表2】
【0104】
K=K1を有するDySwの出力からK=K2を有するDySwへのKDであり、ここで、K1<K2である:
【0105】
【表3】
【0106】
我々は、周知のMSDNetモデルを使用して、画像分類タスクについて提案された考え方を試験した。このモデルは、任意のブロックの出力において分類を行うことができるいくつかのCNNブロックを有する。我々は、異なるブロックの終わりでこの大きなネットワークを分割し、対応する特徴を第2のデバイス(又はクラウド)に送信することを望む。ImageNetデータセットの各ブロックの終わりのMSDNetの特徴寸法を表1に示す。
【0107】
【表4】
【0108】
ここで、我々は、典型的なDNNにおけるデータレート要件の例示を通じて、特徴サイズ縮小の有用性を示す。画像分類(MSDNet)に使用されるDNNで生成されたサイズ224×224×3の単一画像に対応する特徴を送信するために必要なデータレートは、13Mbpsから0.5Gbpsの範囲である。これは、無線ネットワーク上での送信にとって困難なデータレートである。MSDNetモデルを使用する我々のアプローチの予備的な実装において、我々は、精度の最大1%の損失で、特徴サイズを50%低減することができた。
【0109】
以下では、DNNが7つの位置で分割され、各分割位置における特徴サイズ(各単位は16ビットである)が表2に示される、CIFAR-100のためのMSDNetにおけるDySwの我々の実装について説明する。我々は、1、2、4及び10の圧縮係数を実現した。
【0110】
【表5】
【0111】
MSDNetで帯域幅縮小器-拡張器を追加することの効果を調査する。我々は、ベースライン(帯域幅縮小器-拡張器なし)の場合と、縮小係数1、2、4及び10の場合について帯域幅縮小器-拡張器ありの場合の結果を表3に示す。縮小係数1、2、4及び10は、それぞれ元の帯域幅の100%、50%、25%及び10%に対応する。帯域幅が低減されたMSDNetの精度は、いかなる低減もないベースラインMSDNetとほぼ同じであることが分かる。精度は、全ての6つのブロック(0~6)及び全てのスケールの終わりにおける圧縮実装についてのものであることに留意されたい。言い換えれば、各分割点に新しい帯域幅縮小器-拡張器を追加することによって、特徴を大幅に縮小して特徴送信をサポートすることができる一方で、分類精度はほとんど変わらない。
【0112】
【表6】
【0113】
CNN重みの精度を参照する切り替え可能な精度ネットワークの方法が存在する。また、切り替え可能な多重幅CNNに関する研究もあった。しかし、それらとは異なり、我々は、推論時に異なる特徴帯域幅間で切り替えることができる、切り替え可能な特徴帯域幅ネットワークを提案する。この切り替え可能性は、デバイス又はデバイスクラウド又はそれらの他の組み合わせの間の通信チャネルの帯域幅制約に対処するのに有用である。例えば、このメカニズムは、ResNet、AlexNet、DenseNet、SoundNet、VGGなどの異なる機械学習タスクを実施する既存のモデルとシームレスに使用され得る、CNNアーキテクチャに依存せずに使用され得る。このメカニズムはまた、重み量子化などの他のタイプの特徴圧縮技法に依存せずに使用され得る。
【0114】
提案される手法は、複数の特徴帯域幅の間で切り替えるための規定を有する分散AIのための送信のための効率的な帯域幅を扱う。エッジデバイスにおける分散推論中、各デバイスは、AIモデルの一部を一度だけロードする必要があるが、それらの間で通信される入力/出力特徴は、DySw内のノード間の接続を有効化/無効化することによって、利用可能な送信帯域幅に応じて柔軟に構成され得る。所望の圧縮係数を達成するためにいくつかのノードが接続又は切断されるときに、DNNの他のパラメータは同じままである。すなわち、同じDNNモデルが異なる圧縮係数に使用され、圧縮係数又はネットワーク帯域幅に適合するために新しいDNNモデルをダウンロードする必要はない。
【0115】
AI処理は、例えば、ベーシックな携帯電話のカメラで撮影された画像に対して、又はジェスチャ検出を介したUI対話のためにスマートTVカメラから撮影された画像に対して使用することができるが、これらに限定されない。提案される手法は、様々なシナリオにおいて使用され得る。例えば、AIモデルは、デバイスとクラウドとの間で分割され得る。以下に、我々は、いくつかの可能な使用シナリオを列挙する。
1.AIモデルは、2つのデバイス間で分割される。例えば、ユーザは、スマートウォッチにおいてキャプチャされたデータを処理することを望み、ここで、処理の一部は、ウォッチ上で行われ、残りはユーザのモバイルフォン上で行われ得る。
2.AIモデルは、複数のデバイスと場合によってはクラウドとの間で分割される。例えば、ユーザは、スマートCCTVカメラのフィードをカメラ自体で迅速に処理し、詳細な処理をクラウド又はローカルサーバで処理することを望む。
3.ユースケース3と同様であるが、CCTVカメラの代わりに計算対応マイクロフォンを用いたスピーチ/オーディオ処理を伴う。
4.医療データ診断室及びクラウドの処理を共有する。
5.無線リンクを介して通信することができる端末デバイスであって、ここで、AI処理は、無線処理チェーン(例えば、CSI圧縮、CSI自動符号化、測位決定など)の送信及び/又は受信の機能に関係する。
6.無線リンクを介して通信することができる端末デバイスであって、ここで、AI処理は、スケジューリング又はデータ処理の機能に関係し、例えば、QoS処理(例えば、ユーザプレーンデータレート適応など)に関係する。
【0116】
本出願において、様々な数値が使用されている。具体的な値は、例示目的のために提供され、記載の態様は、これらの具体的な値に限定されない。
【0117】
特徴及び要素は、特定の組み合わせにおいて上で説明されているが、当業者は、各特徴又は要素が単独で又は他の特徴及び要素との任意の組み合わせで使用され得ることを理解されよう。加えて、本明細書に説明される方法は、コンピュータ又はプロセッサによる実行のためにコンピュータ可読媒体に組み込まれたコンピュータプログラム、ソフトウェア又はファームウェアに実装され得る。非一時的なコンピュータ可読記憶媒体の例としては、読み取り専用メモリ(ROM)、ランダムアクセスメモリ(RAM)、レジスタ、キャッシュメモリ、半導体メモリデバイス、内部ハードディスク及びリムーバブルディスクなどの磁気媒体、磁気光学媒体及びCD-ROMディスク及びデジタル多用途ディスク(digital versatile disk、DVD)などの光学媒体が挙げられるが、これらに限定されない。ソフトウェアと関連付けられたプロセッサを使用して、UE、WTRU、端末、基地局、RNC又は任意のホストコンピュータにおいて使用するためのビデオエンコーダ、ビデオデコーダ、又はその両方、無線周波数トランシーバを実装し得る。
【0118】
更に、上記の実施形態では、処理プラットフォーム、コンピューティングシステム、コントローラ、及びプロセッサを含む他のデバイスが記載されている。これらのデバイスは、少なくとも1つの中央処理装置(「Central Processing Unit、CPU」)及びメモリを含み得る。コンピュータプログラミングの技術分野における当業者の慣例によれば、動作、及び演算又は命令の記号表現の言及は、様々なCPU及びメモリによって実施され得る。そのような動作及び演算又は命令は、「実行」、「コンピュータ実行」、又は「CPU実行」されることと呼ばれ得る。
【0119】
当該技術分野における通常の技術を有する者には、動作及び記号的に表現された演算又は命令が、CPUによる電気信号の操作を含むことが理解されるであろう。電気システムは、電気信号の結果的な変換又は減少を引き起こすことができるデータビットを表し、メモリシステムのメモリ位置にデータビットを維持し、それによってCPUの動作及び他の信号の処理を再構成又は別の方法で変更する。データビットが維持されるメモリ位置は、データビットに対応する、又はデータビットを表す特定の電気的特性、磁気的特性、又は光学的特性を有する物理的位置である。例示的な実施形態は、上述したプラットフォーム又はCPUに限定されず、他のプラットフォーム及びCPUが、提供される方法をサポートし得ることを理解されたい。
【0120】
データビットはまた、磁気ディスク、光学ディスク、及び任意の他の揮発性(例えば、ランダムアクセスメモリ(「RAM」))又はCPUによって読み取り可能な不揮発性(例えば、読み取り専用メモリ(「ROM」))大容量記憶システムを含む、コンピュータ可読媒体上に維持され得る。コンピュータ可読媒体は、処理システム上に排他的に存在するか、又は処理システムに対してローカル又はリモートであり得る複数の相互接続された処理システム間で分散された、協調的又は相互接続されたコンピュータ可読媒体を含んでもよい。代表的な実施形態は、上述のメモリに限定されず、他のプラットフォーム及びメモリが、記載された方法をサポートし得るということが理解される。
【0121】
例示的な実施形態において、本明細書に記載されている動作、プロセスなどのいずれも、コンピュータ可読媒体に格納されたコンピュータ可読命令として実装されてもよい。コンピュータ可読命令は、移動体、ネットワーク要素、及び/又は任意の他のコンピューティングデバイスのプロセッサによって実行され得る。
【0122】
ハードウェア又はソフトウェアの使用は、一般に(常にではないが、特定の状況では、ハードウェアとソフトウェアとの間の選択が大きな意味を持ち得る)、コスト対効率のトレードオフを意味する設計上の選択事項である。本明細書に記載されているプロセス及び/又はシステム及び/又は他の技術が効果的であり得る様々なビークル(例えばハードウェア、ソフトウェア、及び/又はファームウェア)が存在し得、好ましいビークルは、プロセス及び/又はシステム及び/又は他の技術が配備される状況によって変化し得る。例えば、実装者が、速度及び正確性が最重要であると判定した場合、実装者は、主にハードウェア及び/又はファームウェアのビークルを選択することができる。柔軟性が最重要である場合、実装者は、主にソフトウェア実装を選択することができる。代替的に、実装者は、ハードウェア、ソフトウェア、及び/又はファームウェアの何らかの組み合わせを選択してもよい。
【0123】
前述の詳細な説明では、ブロック図、フローチャート、及び/又は例の使用を通じて、デバイス及び/又はプロセスの様々な実施形態を示した。そのようなブロック図、フローチャート、及び/又は例が1つ以上の機能及び/又は動作を含む限り、そのようなブロック図、フローチャート、又は例の中の各機能及び/又は各動作は、広範なハードウェア、ソフトウェア、ファームウェア、又はそれらの実質的に任意の組み合わせによって、個別にかつ/又は集合的に実装されてよいことが当業者には理解されるであろう。好適なプロセッサとしては、例として、GPU(グラフィックスプロセッシングユニット)、汎用プロセッサ、専用プロセッサ、従来型プロセッサ、デジタル信号プロセッサ(DSP)、複数のマイクロプロセッサ、DSPコアと関連する1つ以上のマイクロプロセッサ、コントローラ、マイクロコントローラ、特定用途向け集積回路(ASIC)、アプリケーション特定用途向け標準製品(ASSP)、フィールドプログラマブルゲートアレイ(FPGA)回路、任意のその他のタイプの集積回路IC)、及び/又は状態機械が挙げられる。
【0124】
上記では特徴及び要素が特定の組み合わせにおいて提供されているが、当該技術分野の通常の技術を有する者には、各特徴若しくは各要素を単独で使用する、又は他の特徴及び要素との任意の組み合わせにおいて使用できることが理解されるであろう。本開示は、本出願に記載されている特定の実施形態の観点において限定されるものではなく、これらの実施形態は、様々な態様の例示として意図されるものである。当業者には明らかなように、本発明の趣旨及び範囲から逸脱することなく、多くの修正及び変形を行うことができる。本出願の説明において使用されているいかなる要素、動作、又は指示も、そのように明示的に提示されていない限り、本発明にとって重要又は本質的であると解釈されるべきではない。本明細書に列挙したものに加えて、本開示の範囲内の機能的に等価な方法及び装置が、上述した説明から、当業者には明らかであろう。そのような修正及び変形は、添付の特許請求の範囲に入ることが意図されている。本開示は、添付の特許請求の範囲の条項によってのみ限定されるものであり、かかる特許請求の範囲が権利を有する等価物の完全な範囲とともに、限定されるものである。本開示は、特定の方法又はシステムに限定されないことを理解されたい。
【0125】
本明細書で使用される用語は、特定の実施形態のみを説明する目的のためであり、限定することを意図するものではないということも理解されたい。
【0126】
特定の代表的な実施形態では、本明細書に記載の主題のいくつかの部分は、特定用途用集積回路(ASIC)、フィールドプログラマブルゲートアレイ(FPGA)、デジタル信号プロセッサ(DSP)、及び/又は他の統合フォーマットを介して実装され得る。しかしながら、本明細書に開示されている実施形態のいくつかの態様は、その全体又は一部が、1つ以上のコンピュータ上で動作する1つのコンピュータプログラムとして(例えば1つ以上のコンピュータシステム上で動作する1つ以上のプログラムとして)、1つ以上のプロセッサ上で動作する1つ以上のプログラムとして(例えば1つ以上のマイクロプロセッサ上で動作する1つ以上のプログラムとして)、ファームウェアとして、又はこれらの実質的に任意の組み合わせとして、集積回路において等価的に実施され得ること、並びに、回路を設計すること、及び/又は、ソフトウェア及び/若しくはファームウェアのコードを書くことが、この開示に照らして当業者の技術の範囲内であることが、当業者には認識されるであろう。加えて、本明細書に記載されている主題のメカニズムが、様々な形態のプログラム製品として配布され得ること、及び、本明細書に記載されている主題の例示的な実施形態が、配布を実際に行うために使用される特定のタイプの信号担持媒体にかかわらず適用されることが、当業者には理解されるであろう。信号担持媒体の例としては、フロッピーディスク、ハードディスクドライブ、CD、DVD、デジタルテープ、コンピュータメモリなどの記録可能型媒体、並びに、デジタル及び/又はアナログ通信媒体(例えば光ファイバケーブル、導波管、有線通信リンク、無線通信リンクなど)などの送信型媒体が挙げられ、ただしこれらに限定されない。
【0127】
本明細書に記載されている主題は、場合によっては、異なる他の構成要素内に含まれるか、又は、異なる他の構成要素に接続されている、異なる構成要素を示していることがある。そのような図示されたアーキテクチャは単なる例であり、実際には、同じ機能を達成する他の多くのアーキテクチャが実施され得ることを理解されたい。概念的には、同じ機能を達成するための構成要素の任意の配置は、所望の機能が達成され得るように、効果的に「関連付けられる」。したがって、特定の機能を達成するために本明細書において組み合わされた、任意の2つの構成要素は、アーキテクチャ又は中間構成要素に関係なく、所望の機能が達成されるように、互いに「関連付けられた」として見ることができる。同様に、そのように関連付けられた任意の2つの構成要素は、所望の機能を達成するために互いに「動作可能に接続されている」、又は「動作可能に結合されている」とみなすこともでき、そのように関連付けることができる任意の2つの構成要素は、所望の機能を達成するために互いに「動作可能に結合可能」であるとみなすこともできる。動作可能に結合可能の具体例としては、物理的に嵌合可能かつ/若しくは物理的に相互作用する構成要素、及び/又は、無線で相互作用可能かつ/若しくは無線で相互作用する構成要素、及び/又は、論理的に相互作用するかつ/若しくは論理的に相互作用可能な構成要素が挙げられ、ただしこれらに限定されない。
【0128】
本明細書における実質的に任意の複数形及び/又は単数形の用語の使用に関して、当業者は、文脈及び/又は用途に適切であるように、複数形から単数形に、かつ/又は単数形から複数形に変換することができる。本明細書では、明瞭にする目的で、様々な単数形/複数形の並べ換えが明示的に記載され得る。
【0129】
一般に、本明細書、特に添付の特許請求の範囲(例えば添付の特許請求の範囲の主文)において使用されている用語は、一般に「非限定」用語として意図されることが当業者には理解されるであろう(例えば、「含んでいる」という用語は、「含んでいるがそれらに限定されない」と解釈するべきであり、「有する」という用語は、「を少なくとも有する」と解釈するべきであり、「含む」という用語は、「含むがそれらに限定されない」と解釈するべきである)。更に、導入された請求項の特定の数の記載が意図される場合、そのような意図は請求項に明示的に記載されており、そのような記載がない場合、そのような意図は存在しないことが、当業者には理解されるであろう。例えば、1つの項目のみが意図される場合、「単一」という用語又は類似する言葉が使用され得る。理解を助けるために、以下の添付の特許請求の範囲及び/又は本明細書の説明は、請求項の記載を導入するために「少なくとも1つの」及び「1つ以上の」という導入句の使用を含み得る。しかしながら、このような句の使用は、不定冠詞「a」又は「an」による請求項の記載の導入が、そのような導入された請求項の記載を含む任意の特定の請求項を、1つのそのような記載のみを含む実施形態に制限することを意味するものと解釈すべきではなく、たとえ同じ請求項に、導入句「1つ以上の」又は「少なくとも1つの」及び「a」又は「an」などの不定冠詞が含まれていても同様である(例えば「a」及び/又は「an」は「少なくとも1つの」又は「1つ以上」を意味するものと解釈すべきである)。請求項の記載を導入するために使用される定冠詞の使用も同様である。加えて、導入された請求項の特定の数の記載が明示的に記載されている場合でも、かかる記載は少なくとも記載された数を意味するものと解釈されるべきであることが、当業者には認識されるであろう(例えば、他の修飾語なしの「2つの記載」という単純な記載は、少なくとも2つの記載、又は2つ以上の記載を意味する)。更に、「A、B、及びCのうちの少なくとも1つ」に類似する表記が使用される場合、一般に、そのような構造は、当業者がその表記を理解するであろう意味として意図される(例えば、「A、B、及びCのうちの少なくとも1つを有するシステム」は、Aのみ、Bのみ、Cのみ、A及びBを一緒に、A及びCを一緒に、B及びCを一緒に、並びに/又は、A、B、及びCを一緒に、有するシステムを含み、ただしこれらに限定されない)。「A、B、又はCのうちの少なくとも1つ」に類似する表記が使用される場合、一般に、そのような構造は、当業者がその表記を理解するであろう意味として意図される(例えば、「A、B、又はCのうちの少なくとも1つを有するシステム」は、Aのみ、Bのみ、Cのみ、A及びBを一緒に、A及びCを一緒に、B及びCを一緒に、並びに/又は、A、B、及びCを一緒に、有するシステムを含み、ただしこれらに限定されない)。明細書、特許請求の範囲、又は図面のいずれにおいても、2つ以上の代替的な用語を提示する実質的に任意の離接的な語及び/又は句は、用語の一方、用語のいずれか、又は両方の用語を含む可能性を企図するものと理解されるべきであることが、当業者には更に理解されるであろう。例えば、「A又はB」という句は、「A」若しくは「B」又は「A及びB」の可能性を含むものと理解されたい。更に、本明細書で使用される、複数の項目のリスト及び/又は複数の項目のカテゴリのリストが後ろに続く「~のいずれか」という用語は、項目及び/又は項目のカテゴリの、「のいずれか」、「の任意の組み合わせ」、「の任意の複数」、及び/又は「の任意の複数の組み合わせ」を、個別に、又は他の項目及び/又は他の項目のカテゴリとの組み合わせにおいて、含むことを意図している。更に、本明細書で使用される場合、「セット/組」又は「グループ/群」という用語は、ゼロを含む任意の数の項目を含むことが意図される。追加的に、本明細書で使用される、「数」という用語は、ゼロを含む任意の数を含むことを意図している。
【0130】
加えて、本開示の特徴又は態様がMarkush群の観点から説明されている場合、当業者には、本開示がそれによってMarkush群の任意の個々のメンバー又はメンバーのサブグループの観点からも説明されることが認識されるであろう。
【0131】
当業者には理解されるように、書面による説明を提供するという観点など、あらゆる目的のために、本明細書に開示される全ての範囲は、その任意の可能な部分範囲及び部分範囲の組み合わせも包含している。任意の列挙された範囲は、同じ範囲が、少なくとも等しい2分の1、3分の1、4分の1、5分の1、10分の1などに分解されることを十分に説明して可能にするものとして、容易に認識することができる。非限定的な例として、本明細書に記載されている各範囲は、下位3分の1、中央の3分の1、及び上位3分の1などに容易に分解され得る。また、当業者には理解されるように、「まで」、「少なくとも」、「より大きい」、「より小さい」等の全ての言葉は、言及された数を含み、かつ、上述したように更に部分範囲に分解され得る範囲を意味する。最後に、当業者には理解されるように、範囲は個々の各要素を含む。したがって、例えば、1~3個のセルを有するグループは、1個、2個、又は3個のセルを有するグループを指す。同様に、1~5個のセルを有するグループは、1個、2個、3個、4個、又は5個のセルを有するグループを指し、以下同様である。
【0132】
更に、請求項は、特にそのように記載されない限り、提供された順序又は提供された要素に限定されるものとして読まれるべきではない。加えて、いかなる請求項においても、「ための手段」という用語の使用は、米国特許法第112条、第6項、又はミーンズプラスファンクションの請求項形式に訴えることを意図しており、「ための手段」という用語を有さないいかなる請求項もそのようには意図されていない。
【0133】
システムは、マイクロプロセッサ/汎用コンピュータ(図示せず)上のソフトウェアで実装され得ることが企図される。特定の実施形態では、様々な構成要素の機能のうちの1つ以上は、汎用コンピュータを制御するソフトウェアに実装され得る。
【0134】
加えて、本発明は、特定の実施形態を参照して本明細書に例示及び説明されるが、本発明は、示された詳細に限定されることを意図していない。むしろ、特許請求の範囲及びその等価物の範囲内において、しかも本発明から逸脱することなく、詳細に様々な修正を行うことができる。
図1A
図1B
図2
図3A
図3B
図3C
図4
図5A
図5B
図6A
図6B
図7
図8A
図8B
図8C
図9
図10
図11
【手続補正書】
【提出日】2023-09-25
【手続補正1】
【補正対象書類名】特許請求の範囲
【補正対象項目名】全文
【補正方法】変更
【補正の内容】
【特許請求の範囲】
【請求項1】
無線送信/受信ユニット(WTRU)であって、
ディープニューラルネットワーク(DNN)モデルの一部であって、前記DNNモデルの分割点の前にあり、かつ前記DNNモデルの前記分割点における特徴を圧縮するためのニューラルネットワークを含む、前記DNNモデルの前記一部を受信するように構成された受信機と、
1つ以上のプロセッサであって、
前記ニューラルネットワークの圧縮係数を取得し、
前記圧縮係数に応答して、前記ニューラルネットワーク内のどのノードが接続されるべきかを決定し、
前記決定に応答して、前記ニューラルネットワークを構成し、かつ
圧縮された特徴を生成するために、前記DNNモデルの前記一部を用いて推論を実施するように構成されている、1つ以上のプロセッサと、
前記圧縮された特徴を別のWTRUに送信するように構成された送信機と、を備える、無線送信/受信ユニット(WTRU)。
【請求項2】
前記送信機が、取得された前記圧縮係数の指示を前記別のWTRUに送るように更に構成されている、請求項1に記載のデバイス。
【請求項3】
前記1つ以上のプロセッサが、前記圧縮係数が調整されるときに前記ネットワーク内のどのノードが接続されるべきかを決定するように構成されている、請求項1に記載のデバイス。
【請求項4】
前記分割点及び前記圧縮係数のうちの少なくとも1つが、(1)物理層動作、(2)メディアアクセス制御層動作、(3)無線リソース制御層動作、(4)利用可能な処理リソース、及び(5)制御シグナリングのうちの1つ以上に基づいて適合される、請求項1に記載のデバイス。
【請求項5】
前記分割点及び前記圧縮係数のうちの少なくとも1つが、送信データレートに基づいて適合される、請求項1に記載のデバイス。
【請求項6】
無線送信/受信ユニット(WTRU)によって実施される方法であって、
ディープニューラルネットワーク(DNN)モデルの一部であって、前記DNNモデルの分割点の前にあり、かつ前記DNNモデルの前記分割点における特徴を圧縮するためのニューラルネットワークを含む、前記DNNモデルの前記一部を受信することと、
前記ニューラルネットワークの圧縮係数を取得することと、
前記圧縮係数に応答して、前記ニューラルネットワーク内のどのノードが接続されるべきかを決定することと、
前記決定に応答して、前記ニューラルネットワークを構成することと、
圧縮された特徴を生成するために、前記DNNモデルの前記一部を用いて推論を実施することと、
前記圧縮された特徴を別のWTRUに送信することと、を含む、方法。
【請求項7】
取得された前記圧縮係数の指示を前記別のWTRUに送ることを更に含む、請求項6に記載の方法。
【請求項8】
前記ネットワーク内のどのノードが接続されるべきかが、前記圧縮係数が調整されるときに決定される、請求項6に記載の方法。
【請求項9】
異なる圧縮係数に対して1つのDNNモデルのみが前記デバイスにロードされる、請求項6に記載の方法。
【請求項10】
前記分割点及び前記圧縮係数のうちの少なくとも1つが、(1)物理層動作、(2)メディアアクセス制御層動作、(3)無線リソース制御層動作、(4)利用可能な処理リソース、及び(5)制御シグナリングのうちの1つ以上に基づいて適合される、請求項6に記載の方法。
【請求項11】
無線送信/受信ユニット(WTRU)であって、
ディープニューラルネットワーク(DNN)モデルの一部であって、前記DNNモデルの分割点の後にあり、かつ前記DNNモデルの前記分割点における特徴を拡張するためのニューラルネットワークを含む、前記DNNモデルの前記一部を受信するように構成された受信機であって、別のWTRUから出力された1つ以上の特徴も受信するように構成されている、受信機と、
1つ以上のプロセッサであって、
前記ニューラルネットワークの圧縮係数を取得し、
前記圧縮係数に応答して、前記ニューラルネットワーク内のどのノードが接続されるべきかを決定し、
前記決定に応答して、前記ニューラルネットワークを構成し、かつ
別のWTRUから出力された前記1つ以上の特徴を前記ニューラルネットワークへの入力として使用して、前記DNNモデルの前記一部を用いて推論を実施するように構成されている、1つ以上のプロセッサと、を備える、無線送信/受信ユニット(WTRU)。
【請求項12】
前記受信機が、前記圧縮係数を示す信号を受信するように更に構成されている、請求項11に記載のデバイス。
【請求項13】
前記1つ以上のプロセッサが、前記圧縮係数が調整されるときに前記ネットワーク内のどのノードが接続されるべきかを決定するように構成されている、請求項11に記載のデバイス。
【請求項14】
異なる圧縮係数に対して1つのDNNモデルのみが前記デバイスにロードされる、請求項11に記載のデバイス。
【請求項15】
前記分割点及び前記圧縮係数のうちの少なくとも1つが、(1)物理層動作、(2)メディアアクセス制御層動作、(3)無線リソース制御層動作、(4)利用可能な処理リソース、及び(5)制御シグナリングのうちの1つ以上に基づいて適合される、請求項11に記載のデバイス。
【請求項16】
方法であって、
ディープニューラルネットワーク(DNN)モデルの一部であって、前記DNNモデルの分割点の後にあり、かつ前記DNNモデルの前記分割点における特徴を拡張するためのニューラルネットワークを含む、前記DNNモデルの前記一部を受信することと、
別のWTRUから出力された1つ以上の特徴を受信することと、
前記ニューラルネットワークの圧縮係数を取得することと、
前記圧縮係数に応答して、前記ニューラルネットワーク内のどのノードが接続されるべきかを決定することと、
前記決定に応答して、前記ニューラルネットワークを構成することと、
別のWTRUから出力された前記1つ以上の特徴を前記ニューラルネットワークへの入力として使用して、前記DNNモデルの前記一部を用いて推論を実施することと、を含む、方法。
【請求項17】
前記圧縮係数を示す信号を受信することを更に含む、請求項16に記載の方法。
【請求項18】
前記ネットワーク内のどのノードが接続されるべきかが、前記圧縮係数が調整されるときに決定される、請求項16に記載の方法。
【請求項19】
異なる圧縮係数に対して1つのDNNモデルのみが前記デバイスにロードされる、請求項16に記載の方法。
【請求項20】
前記分割点及び前記圧縮係数のうちの少なくとも1つが、(1)物理層動作、(2)メディアアクセス制御層動作、(3)無線リソース制御層動作、(4)利用可能な処理リソース、及び(5)制御シグナリングのうちの1つ以上に基づいて適合される、請求項16に記載の方法。
【国際調査報告】