特開2024-103682 | 知財ポータル「IP Force」

知財求人 - 知財ポータルサイト「IP Force」

▶ 日本電信電話株式会社の特許一覧

特開2024-103682処理システム及び処理方法

書誌要約請求の範囲詳細な説明課題実施例実施するための形態図面の説明

目に優しい文字サイズ小中大 PDF Top

< >

1
2
3
4
5
6
7
8
9
10
11
12
13
14
15
16
17
18
19
20
21
22

(19)【発行国】日本国特許庁(JP)

(12)【公報種別】公開特許公報(A)

(11)【公開番号】P2024103682

(43)【公開日】2024-08-01

(54)【発明の名称】処理システム及び処理方法

(51)【国際特許分類】

G06F 9/50 20060101AFI20240725BHJP

G06N 3/02 20060101ALI20240725BHJP

G16Y 30/00 20200101ALI20240725BHJP

【ＦＩ】

G06F9/50 150A

G06N3/02

G16Y30/00

【審査請求】有

【請求項の数】6

【出願形態】ＯＬ

(21)【出願番号】P 2024089530

(22)【出願日】2024-05-31

(62)【分割の表示】P 2022531124の分割

【原出願日】2020-06-15

【新規性喪失の例外の表示】特許法第３０条第２項適用申請有りｈｔｔｐｓ：／／ｗｗｗ．ｉｅｉｃｅ．ｏｒｇ／ｋｅｎ／ｐａｐｅｒ／２０２００３１７ｈ１ＷＢ／ｈｔｔｐｓ：／／ｉｐｓｊ．ｉｘｓｑ．ｎｉｉ．ａｃ．ｊｐ／ｅｊ／？ａｃｔｉｏｎ＝ｐａｇｅｓ＿ｖｉｅｗ＿ｍａｉｎ＆ａｃｔｉｖｅ＿ａｃｔｉｏｎ＝ｒｅｐｏｓｉｔｏｒｙ＿ｖｉｅｗ＿ｍａｉｎ＿ｉｔｅｍ＿ｄｅｔａｉｌ＆ｉｔｅｍ＿ｉｄ＝２０４１０９＆ｉｔｅｍ＿ｎｏ＝１＆ｐａｇｅ＿ｉｄ＝１３＆ｂｌｏｃｋ＿ｉｄ＝８ウェブサイトの掲載日２０２０年３月９日

(71)【出願人】

【識別番号】000004226

【氏名又は名称】日本電信電話株式会社

(74)【代理人】

【識別番号】110002147

【氏名又は名称】弁理士法人酒井国際特許事務所

(72)【発明者】

【氏名】川島正久

(72)【発明者】

【氏名】羽室大介

(72)【発明者】

【氏名】松尾嘉典

(72)【発明者】

【氏名】江田毅晴

(72)【発明者】

【氏名】坂本啓

(72)【発明者】

【氏名】榎本昇平

(72)【発明者】

【氏名】史旭

(57)【要約】

【課題】ユーザの要望に応じた、エッジ装置とクラウドとの連携した処理の実行を制御する。
【解決手段】処理システム１００は、エッジ装置３０が、処理対象データの処理結果を出力する推論部３２と、エッジ装置３０とサーバ装置２０とのいずれにおいて処理対象データを処理すべきかを評価する評価値が条件を満たす場合、処理対象データに係る処理をサーバ装置２０に実行させることを判定し、処理対象データの処理結果が所定の評価を満たす場合、評価値をエッジ装置３０で処理すべき範囲に含まれる値と判定して推論部３２が処理した処理対象データの処理結果を出力する判定部３３と、を有し、評価値は、処理対象データの処理結果の出力期限であり、出力期限が短い場合、エッジ装置３０で処理されるよう判定される。
【選択図】図４

【特許請求の範囲】

【請求項1】

エッジ装置とサーバ装置とを用いて行われる処理システムであって、
前記エッジ装置は、
処理対象データを処理し、前記処理対象データの処理結果を出力するエッジ処理部と、
前記エッジ装置と前記サーバ装置とのいずれにおいて前記処理対象データを処理すべきかを評価する評価値が条件を満たす場合、前記処理対象データに係る処理を前記サーバ装置に実行させることを判定し、前記処理対象データの処理結果が所定の評価を満たす場合、前記評価値を前記エッジ装置で処理すべき範囲に含まれる値と判定して前記エッジ処理部が処理した前記処理対象データの処理結果を出力する判定部と、
前記判定部が前記処理対象データに係る処理を前記サーバ装置に実行させることを判定した場合、前記処理対象データに係る処理を前記サーバ装置に実行させるためのデータを送信する送信部と、
を有し、
前記評価値は、前記処理対象データの処理結果の出力期限であり、
前記出力期限が短い場合、前記エッジ装置で処理されるよう判定されることを特徴とする処理システム。

【請求項2】

前記送信部が前記サーバ装置に送信するデータを符号化する符号化部をさらに有することを特徴とする請求項１に記載の処理システム。

【請求項3】

前記エッジ装置は、複数あり、
複数の前記エッジ装置のいずれのエッジ装置から送信されたデータであっても、前記サーバ装置は前記処理対象データに係る処理を行うよう、前記エッジ装置で行われる処理と前記サーバ装置とにおいて行われる処理とが最適化されていることを特徴とする請求項１または２に記載の処理システム。

【請求項4】

前記処理対象データの処理結果を出力する処理は、学習済みニューラルネットワークによる推論であることを特徴とする請求項１～３のいずれか一つに記載の処理システム。

【請求項5】

前記サーバ装置は、複数あり、
前記エッジ装置は、
前記処理対象データを処理する目的に応じて、複数の前記サーバ装置の中から、前記処理対象データに係る処理を前記サーバ装置が実行させるためのデータを送信するサーバ装置を選択する選択部
をさらに有することを特徴とする請求項１～４のいずれか一つに記載の処理システム。

【請求項6】

エッジ装置とサーバ装置とを用いて行われる処理システムが実行する処理方法であって、
前記エッジ装置が、処理対象データを処理し、前記処理対象データの処理結果を出力する処理工程と、
前記エッジ装置が、前記エッジ装置と前記サーバ装置とのいずれにおいて前記処理対象データを処理すべきかを評価する評価値が条件を満たす場合、前記処理対象データに係る処理を前記サーバ装置に実行させることを判定し、前記処理対象データの処理結果が所定の評価を満たす場合、前記評価値を前記エッジ装置で処理すべき範囲に含まれる値と判定して前記処理工程において処理された前記処理対象データの処理結果を出力する判定工程と、
前記エッジ装置が、前記判定工程において前記処理対象データに係る処理を前記サーバ装置に実行させることが判定された場合、前記処理対象データに係る処理を前記サーバ装置に実行させるためのデータを送信する送信工程と、
を含み、
前記評価値は、前記処理対象データの処理結果の出力期限であり、
前記出力期限が短い場合、前記エッジ装置で処理されるよう判定されることを特徴とする処理方法。

【発明の詳細な説明】

【技術分野】

【0001】

本発明は、処理システム及び処理方法に関する。

【背景技術】

【0002】

センサに代表されるＩｏＴデバイスにより収集されたデータのデータ量は、膨大であるため、クラウドコンピューティングで収集されたデータを集約及び処理する際、膨大な通信量が発生する。このため、ユーザに近いエッジ装置でも、収集されたデータを処理するエッジコンピューティングに注目が集まっている。

【0003】

しかしながら、エッジ装置で用いられる装置の演算量やメモリ等のリソースは、エッジ装置よりもユーザから物理的及び論理的に遠くに配置されたエッジ装置以外の装置(以下、簡便のためクラウドと記載する)と比して、貧弱である。このため、演算負荷が大きい処理をエッジ装置で行うと、処理が完了するまでに多大な時間を要したり、演算量が大きくない他の処理が完了するまでにも時間を要したりする場合がある。

【0004】

ここで、演算量が大きい処理の一つに機械学習に係る処理が挙げられる。非特許文献１には、いわゆるアダプティブラーニングのエッジ・クラウドへの適用が提案されている。すなわち、非特許文献１に記載の方法は、クラウドで汎用的な学習データを用いて学習を行った学習済みモデルをエッジ装置に展開し、エッジ装置で取得されたデータを用いて、クラウドで学習を行ったモデルに対して再度学習を行うことでクラウドとエッジ装置との利点を活かした運用を実現している。

【先行技術文献】

【非特許文献】

【0005】

【非特許文献1】大越他, “クラウド・エッジ連携によるDNNモデル運用方式の提案と評価”, 情報処理学会第80回全国大会講演論文集 2018(1), 3-4, 2018-03-13.

【発明の概要】

【発明が解決しようとする課題】

【0006】

しかしながら、この非特許文献１に記載の方法は、推論処理について検討されていない。推論は、処理する対象、すなわち、推論対象のデータが複雑であるほど、また、解こうとする問題が難しいほど、演算量は増大する。このような演算量が大きい処理はクラウドで処理することが好ましいと想定される。しかしながら、クラウドで処理すべき演算量の大きい処理を決定するために、推論対象のデータの複雑さや、解こうとする問題の難しさをエッジ装置で判定しなければならなかった。

【0007】

また、解こうとする問題の難しさとは異なる観点として、ユーザが要求する推論精度やレスポンスがある。すなわち、ユーザからは、推論精度があまり高くなくても早急なレスポンスを要する場合や、レスポンスが遅くとも高い推論精度が求められる場合がある。しかしながら、エッジ装置が、ユーザが要求する推論精度やレスポンスを考慮しながら、クラウドで処理すべき演算量が大きい処理を決定する方法は、非特許文献１には記載されていない。

【0008】

本発明は、上記に鑑みてなされたものであって、ユーザの要望に応じた、エッジ装置とクラウドとの連携した処理の実行を制御することができる処理システム及び処理方法を提供することを目的とする。

【課題を解決するための手段】

【0009】

上述した課題を解決し、目的を達成するために、本発明に係る処理システムは、エッジ装置とサーバ装置とを用いて行われる処理システムであって、エッジ装置は、処理対象データを処理し、処理対象データの処理結果を出力するエッジ処理部と、エッジ装置とサーバ装置とのいずれにおいて処理対象データを処理すべきかを評価する評価値が条件を満たす場合、処理対象データに係る処理をサーバ装置に実行させることを判定し、処理対象データの処理結果が所定の評価を満たす場合、評価値をエッジ装置で処理すべき範囲に含まれる値と判定してエッジ処理部が処理した処理対象データの処理結果を出力する判定部と、判定部が処理対象データに係る処理をサーバ装置に実行させることを判定した場合、処理対象データに係る処理をサーバ装置に実行させるためのデータを送信する送信部と、を有し、前記評価値は、前記処理対象データの処理結果の出力期限であり、前記出力期限が短い場合、前記エッジ装置で処理されるよう判定されることを特徴とする。

【0010】

また、本発明に係る処理方法は、エッジ装置とサーバ装置とを用いて行われる処理システムが実行する処理方法であって、エッジ装置が、処理対象データを処理し、処理対象データの処理結果を出力する処理工程と、エッジ装置が、エッジ装置とサーバ装置とのいずれにおいて処理対象データを処理すべきかを評価する評価値が条件を満たす場合、処理対象データに係る処理をサーバ装置に実行させることを判定し、処理対象データの処理結果が所定の評価を満たす場合、評価値をエッジ装置で処理すべき範囲に含まれる値と判定して処理工程において処理された処理対象データの処理結果を出力する判定工程と、エッジ装置が、判定工程において処理対象データに係る処理をサーバ装置に実行させることが判定された場合、処理対象データに係る処理をサーバ装置に実行させるためのデータを送信する送信工程と、を含み、前記評価値は、前記処理対象データの処理結果の出力期限であり、前記出力期限が短い場合、前記エッジ装置で処理されるよう判定されることを特徴とする。

【発明の効果】

【0011】

本発明によれば、ユーザの要望に応じた、エッジ装置とクラウドとの連携した処理の実行を制御することができ、効率的に装置とクラウドとを合わせたシステム全体を効率的に稼働させることができる。

【図面の簡単な説明】

【0012】

【図1】図１は、実施の形態１に係る処理システムの処理方法の概要を説明する図である。

【図2】図２は、ＤＮＮ１及びＤＮＮ２の一例を説明する図である。

【図3】図３は、ＤＮＮ１及びＤＮＮ２の一例を説明する図である。

【図4】図４は、実施の形態１に係る処理システムの構成の一例を模式的に示す図である。

【図5】図５は、実施の形態１に係る処理システムの処理の流れを示すシーケンス図である。

【図6】図６は、軽量モデル及び高精度モデルを学習する学習装置の構成例を示す図である。

【図7】図７は、ケースごとの損失の一例を示す図である。

【図8】図８は、高精度モデルの学習処理の流れを示すフローチャートである。

【図9】図９は、軽量モデルの学習処理の流れを示すフローチャートである。

【図10】図１０は、実施の形態２に係る処理システムの構成の一例を模式的に示す図である。

【図11】図１１は、実施の形態２に係る処理システムの処理の流れを示すシーケンス図である。

【図12】図１２は、実施の形態２に係る処理システムの構成の他の例を模式的に示す図である。

【図13】図１３は、実施の形態３に係る処理システムの構成の一例を模式的に示す図である。

【図14】図１４は、図１３に示すエッジ装置の一例を模式的に示す図である。

【図15】図１５は、図１３に示すサーバ装置の一例を模式的に示す図である。

【図16】図１６は、実施の形態３に係る処理システムの処理の流れを示すシーケンス図である。

【図17】図１７は、実施の形態４に係る処理システムの構成の一例を模式的に示す図である。

【図18】図１８は、図１７に示すエッジ装置の一例を模式的に示す図である。

【図19】図１９は、実施の形態３に係る処理システムの処理の流れを示すシーケンス図である。

【図20】図２０は、実施の形態１～４の変形例における処理システムの概略を示す図である。

【図21】図２１は、ＤＮＮ、判定部、符号化部、復号化部の機能のバリエーションと、通信内容のバリエーションを示す図である。

【図22】図２２は、プログラムが実行されることにより、エッジ装置及びサーバ装置が実現されるコンピュータの一例を示す図である。

【発明を実施するための形態】

【0013】

以下、図面を参照して、本発明の一実施形態を詳細に説明する。なお、この実施形態により本発明が限定されるものではない。また、図面の記載において、同一部分には同一の符号を付して示している。

【0014】

［実施の形態１］
［実施の形態１の概要］
本発明の実施の形態について説明する。本発明の実施の形態１では、学習済みの高精度モデル及び軽量モデルを使って推論処理を行う処理システムについて説明する。なお、実施の形態の処理システムでは、推論処理において用いるモデルとして、ＤＮＮ（Deep Neural Network）を用いた場合を例に説明する。実施の形態の処理システムでは、ＤＮＮ以外のニューラルネットワークを用いてもよいし、学習済みモデルに代えて低演算量の信号処理と高演算量の信号処理を用いてもよい。

【0015】

図１は、実施の形態１に係る処理システムの処理方法の概要を説明する図である。実施の形態１の処理システムは、高精度モデル及び軽量モデルは、モデルカスケードを構成する。実施の形態１の処理システムでは、高速かつ低精度な軽量モデル（例えば、ＤＮＮ１）を用いるエッジ装置と、低速かつ高精度な高精度モデル（例えば、ＤＮＮ２）を用いるクラウド（サーバ装置）とのいずれにおいて処理を実行するかを、評価値を用いて制御する。例えば、サーバ装置は、ユーザから物理的及び論理的に遠い場所に配置された装置である。エッジ装置は、ユーザから物理的及び論理的に近い場所に配置されたＩｏＴ機器及び各種端末装置であり、サーバ装置と比してリソースが少ない。

【0016】

ＤＮＮ１及びＤＮＮ２は、入力されたデータを基に推論結果を出力するモデルである。図１の例では、ＤＮＮ１及びＤＮＮ２は、画像を入力とし、当該画像に写る物体のクラスごとの確率を推論する。なお、図１に示す２つの画像は、いずれも同じ画像である。例えば、ＤＮＮ１は、ＤＮＮ１及びＤＮＮ２のどちらのモデルで推論を行う方が、ユーザに要望された利益が大きいかを含めてトレーニングされたものである。ＤＮＮ１及びＤＮＮ２は、評価値について最適な値が得られるように最適化される。

【0017】

ユーザの要望は、例えば、推論結果の高精度化、データ通信量の低減、計算処理の高速化、エッジ装置のリソース最適化等がある。評価値は、ユーザの要望を満たしつつエッジ装置とサーバ装置とのいずれにおいて処理対象データを処理すべきかを評価する値である。評価値は、処理対象のデータの処理が難しいほど、サーバ装置で評価すべき範囲に入る傾向を有する。

【0018】

図１に示すように、処理システムでは、入力画像に写る物体に対するＤＮＮ１のクラス分類の推論についての評価値を取得する。そして、処理システムでは、取得した評価値が所定条件、例えば、所定値を満たす場合、ＤＮＮ１の推論結果が採用される。つまり、軽量モデルの推論結果が、モデルカスケードの最終的な推定結果として出力される。一方で、処理システムでは、評価値が所定値を満たさない場合、同一の画像をＤＮＮ２に入力して得られた推論結果が、最終的な推論結果として出力される。所定値を満たすとは、例えば、あらかじめ定められた閾値に基づく条件を満たすか否かや、所定の範囲に含まれるか否かを含む。

【0019】

このように、実施の形態１に係る処理システムは、エッジ装置とサーバ装置とのいずれにおいて処理対象データを処理すべきかをユーザの要望に応じて評価する評価値を基に、エッジ装置またはサーバ装置を選択して、処理対象データを処理する。このため、実施の形態１に係る処理システムは、ユーザの要望に応じて、エッジ装置とクラウドとのいずれにおいて処理を実行するかを制御することができる。

【0020】

［軽量モデル及び高精度モデル］
次に、ＤＮＮ１、ＤＮＮ２について説明する。図２及び図３は、ＤＮＮ１及びＤＮＮ２の一例を説明する図である。ＤＮＮは、データが入る入力層、入力層から入力されたデータを様々に変換する１層または複数の中間層、確率や尤度など、いわゆる推論した結果を出力する出力層を有する。各層から出力される出力値は、入力されるデータが匿名性を保つ必要がある場合は非可逆としてもよい。

【0021】

図２に示すように、処理システムは、それぞれ独立したＤＮＮ１ａ及びＤＮＮ２ａを用いてもよい。例えば、ＤＮＮ２ａが既知の方法でトレーニングされた後、ＤＮＮ１ａが、ＤＮＮ１ａ及びＤＮＮ２ａのどちらのモデルで推論を行う方が、ユーザに要望された利益が大きいかを含めてトレーニングされる。ＤＮＮ１ａは、評価値に関する値を出力するようトレーニングされる。ＤＮＮ１ａは、評価値に関する値として、ＤＮＮ１ａの中間層の出力値である中間出力値を出力する。評価値は、中間出力値に基づいて算出される値でもよく、中間出力値そのものでもよい。中間出力値は、所定の中間層の中間出力値をよりユーザの要望にあうような学習ができるコスト関数、例えば中間出力値と尤度の相関を取るなど、にかけた結果を用いてもよいし、解くべき問題のみをコスト関数として設計した学習済みモデルの任意の中間層の出力を用いてもよい。これは、例えば高次の中間層に、入力されたデータを決定づける特徴が反映されるような性質をもちやすいネットワーク（CNNのような）を使用する場合、高次中間層の出力値には、解くべき問題で利用できる有効な特徴が抽出されているためである。なお、ＤＮＮ１ａ及びＤＮＮ２ａには、精度とパフォーマンスが異なる同じタスクが割り当てられてもよいし、異なるタスクが割り当てられてもよい。

【0022】

また、図３に示すように、処理システムは、一体のＤＮＮとしてトレーニングを行ったＤＮＮ３を、所定基準を用いて第Ｒ層と第（Ｒ＋１）層との間でＤＮＮ１ｂ及びＤＮＮ２ｂに分割する。そして、処理システムは、前段のＤＮＮ１ｂをエッジ装置に適用し、後段のＤＮＮ１ｂをサーバ装置に適用してもよい。この場合、ＤＮＮ１ｂは、評価値として、第Ｒ中間層からの中間出力値を出力する。なお、ＤＮＮ１ｂは、評価値として、第Ｒ中間層より前段の層からの中間出力値を出力してもよい。

【0023】

また、評価値は、ＤＮＮ１ａまたはＤＮＮ１ｂから出力される中間出力値に限らない。例えば、評価値は、ＤＮＮ１ａから出力される推論誤差でもよく、該推論誤差基づく値であってもよい。例えば、評価値は、エッジ装置が処理を行った結果が正解であるかの確信度を示す値でもよい。また、評価値は、処理対象データの処理結果を得るまでに要する時間、処理対象データの処理結果の取得期限、エッジ装置またはサーバ装置のいずれにおいて処理対象データを処理すべきかを判定する際におけるエッジ装置のリソースの使用状況、処理対象データが他のデータと比してイベントが発生しているデータであるか、のいずれかに基づいて決定される値でもよい。なお、エッジ装置のリソースの使用状況は、当該エッジ装置単体のＣＰＵやメモリの使用率、消費電力量などでもいいし、当該エッジ装置と他のエッジ装置での稼働量やリソース使用率の差などでもよい。また、イベントは、例えば、前のフレームと比べて対象フレームが所望の大きさ以上の変化がある場合や、細かく推定する対象が発生している場合を意図する。また、エッジ装置で演算を行った対象と結果を示すデータをサーバ装置に伝送し、サーバ装置はエッジ装置で演算を行っていない対象のみ演算するよう設計してもよい。具体的には、バウンディングボックスの座標値やクラス分類結果とその信頼度を合わせて送り、信頼度を満たさない対象のみサーバ装置で演算してもよい。

【0024】

［処理システム］
次に、処理システムの構成について説明する。図４は、実施の形態１に係る処理システムの構成の一例を模式的に示す図である。

【0025】

実施の形態に係る処理システム１００は、サーバ装置２０及びエッジ装置３０を有する。また、サーバ装置２０及びエッジ装置３０は、ネットワークＮを介して接続される。ネットワークＮは、例えばインターネットである。その場合、サーバ装置２０は、クラウド環境に設けられたサーバであってもよい。また、エッジ装置３０は、ＩｏＴ機器及び各種端末装置であってもよい。

【0026】

サーバ装置２０及びエッジ装置３０は、それぞれＲＯＭ（Read Only Memory）、ＲＡＭ（Random Access Memory）、ＣＰＵ（Central Processing Unit）等を含むコンピュータ等に所定のプログラムが読み込まれて、ＣＰＵが所定のプログラムを実行することで実現される。また、ＧＰＵやＶＰＵ（Vision Processing Unit）、ＦＰＧＡ（Field Programmable Gate Array）、ＡＳＩＣ（Application Specific Integrated Circuit）や専用のＡＩ（Artificial Intelligence）チップに代表されるいわゆるアクセラレータも用いられる。サーバ装置２０及びエッジ装置３０は、それぞれ、ＮＩＣ（Network Interface Card）等を有し、ＬＡＮ（Local Area Network）やインターネットなどの電気通信回線を介した他の装置との間の通信を行うことも可能である。

【0027】

図４に示すように、サーバ装置２０は、学習済みの高精度モデルであるＤＮＮ２を記憶する。ＤＮＮ２は、モデルパラメータ等の情報を含む。また、サーバ装置２０は、推論部２２を有する。

【0028】

推論部２２は、ＤＮＮ２に推論用データ（処理対象データ）を入力し、推論結果（処理結果）を取得する。推論部２２は、推論用データの入力を受け付け、推論結果を出力する。推論用データは、ラベルが未知のデータであるものとする。例えば、推論用データは、画像である。また、推論結果をユーザに返す場合、推論部２２で得られた推論結果はエッジ装置に伝送され、エッジ装置からユーザに返してもよい。

【0029】

ここで、サーバ装置２０及びエッジ装置３０は、モデルカスケードを構成する。このため、推論部２２は、常に推論用データについての推論を行うわけではない。推論部２２は、推論用データに係る推論処理をサーバ装置２０に実行させると判定された場合に、ＤＮＮ２による推論を行う。

【0030】

エッジ装置３０は、学習済みの軽量モデルであるＤＮＮ１を記憶する。ＤＮＮ１は、モデルパラメータ等の情報を含む。ＤＮＮ１は、ＤＮＮ１及びＤＮＮ２のどちらのモデルで推論を行う方が、ユーザに要望された利益が大きいかを含めてトレーニングされる。ＤＮＮ１には、ＤＮＮ１とＤＮＮ２とを含むモデルカスケードが、ユーザに要望された利益が大きいかを含めて最適化されるように予め学習されたパラメータが設定される。また、エッジ装置３０は、推論部３２（エッジ処理部）、判定部３３及び通信部３４（送信部）を有する。

【0031】

推論部３２は、ＤＮＮ１に、推論用データ（処理対象データ）を入力して推論結果を取得する。推論部３２は、推論用データの入力を受け付け、推論用データを処理し、推論結果（処理対象データの処理結果）を出力する。

【0032】

判定部３３は、エッジ装置３０とサーバ装置２０とのいずれにおいて推論用データを処理すべきかをユーザの要望を反映して設計された評価する評価値が、所定値を満たすか否かを判定する。

【0033】

判定部３３は、評価値が所定値を満たす場合、推論用データの推論結果が所定の評価を満たす場合であるとし、評価値をエッジ装置３０で処理すべき範囲に含まれる値と判定して推論部３２が推論した推論結果を出力する。評価値が所定値を満たさない場合、判定部３３は、評価値がサーバ装置２０で評価すべき範囲に含まれる値である場合であるとし、推論用データに係る処理（推論処理）をサーバ装置２０に実行させることを判定する。評価値は、前述したように、中間出力値、推論誤差、確信度等である。また、判定部３３は、送信対象とする処理用データの絞り込みを行ってもよい。例えば、判定部３３は、処理用データを、ＤＮＮ２の処理において必要であるノードのデータに絞り込む。ここで、推論用データが画像である場合に絞り込む基準を例示する。画像の一部領域にイベントが発生していた場合、判定部３３は、当該一部領域若しくはイベントに係る推定を行うために必要となる領域に絞り込めばよい。また、画像の領域ごとにエッジ装置で処理を行うかサーバ装置で処理を行うかを判定する場合、判定部３３は、サーバ装置で処理を行う領域に絞り込めばよい。空間的な観点での絞り込みを例示したが、判定部３３は、時間的な観点での絞り込みを行ってもよい。

【0034】

通信部３４は、ネットワークＮを介して、他の装置（例えば、サーバ装置２０）と通信を行う。通信部３４は、判定部３３が推論用データに係る推論処理をサーバ装置２０に実行させることを判定した場合、推論処理をサーバ装置２０に実行させるための処理用データをサーバ装置２０に送信する。通信部３４は、評価値が中間出力値である場合、該中間出力値をサーバ装置２０に送信する。

【0035】

［処理システムの処理手順］
図５は、実施の形態１に係る処理システムの処理の流れを示すシーケンス図である。図５に示すように、まず、エッジ装置３０において、推論部３２は、推論用データの入力を受け付けると（ステップＳ１）、推論用データをＤＮＮ１に入力する（ステップＳ２）。

【0036】

判定部３３は、ＤＮＮ１の中間出力値を取得し（ステップＳ３，Ｓ４）、評価値を取得する（ステップＳ５）。判定部３３は、評価値が所定値を満たすか否かを判定する（ステップＳ６）。

【0037】

評価値が所定値を満たす場合（ステップＳ６：Ｙｅｓ）、判定部３３は、中間出力値を、ＤＮＮ１の中間層のうち、中間出力値を出力した層の次の中間層に入力する（ステップＳ７）。推論部３２は、ＤＮＮ１の推論結果を取得し（ステップＳ８）、取得したＤＮＮ１の推論結果を出力する（ステップＳ９）。

【0038】

これに対し、評価値が所定値を満たさない場合（ステップＳ６：Ｎｏ）、判定部３３は、推論処理をサーバ装置２０に実行させるための処理用データを、通信部３４を介してサーバ装置２０に送信する（ステップＳ１０，Ｓ１１）。例えば、処理用データは、推論用データ及びＤＮＮ１の確信度である。または、処理用データは、中間出力値である。

【0039】

サーバ装置２０では、推論部２２が、処理用データをＤＮＮ２に入力し（ステップＳ１１）、ＤＮＮ２の推論結果を取得する（ステップＳ１２，Ｓ１３）。ＤＮＮ２の推論結果は、エッジ装置３０に送信され（ステップＳ１４，Ｓ１５）、エッジ装置３０から出力される（ステップＳ１６）。なお、本実の形態では、ユーザに推論結果を返す構成を想定し、エッジ装置３０から最終的な推論結果を出力する構成としているが、サーバ装置２０側で最終的な推論結果を用いる場合は、ＤＮＮ２の推論結果をサーバ装置２０から出力する、或いは、サーバ装置２０でそのまま保持するよう構成してもよい。ＤＮＮ１の推論結果を使用する場合には、エッジ装置３０は、サーバ装置２０側で当該推論結果を用いる場合、推論結果をサーバ装置２０に送信すればよい。

【0040】

［実施の形態１の効果］
このように、実施の形態１によれば、エッジ装置とサーバ装置とのいずれにおいて処理対象データを処理すべきかをユーザの要望に応じて評価する評価値を基に、エッジ装置またはサーバ装置を選択して、処理対象データを処理する。このため、実施の形態１に係る処理システムは、ユーザの要望に応じて、エッジ装置とクラウドとのいずれにおいて処理を実行するかを制御することができる。

【0041】

なお、本実施の形態１では、エッジ装置３０の数とサーバ装置２０の数とが、いずれも単数である場合について説明したが、エッジ装置３０またはサーバ装置２０が複数であってもよく、また、エッジ装置３０とサーバ装置２０とがいずれも複数であってもよい。

【0042】

［適用例］
本実施の形態１を推論結果の高精度化の要望に対して適用し、確信度を評価値として採用する場合を例に説明する。まず、推論結果の高精度化を実現するための軽量モデル及び高精度モデルの学習について説明する。

【0043】

図６は、軽量モデル及び高精度モデルを学習する学習装置の構成例を示す図である。図６に示すように、学習装置１０は、学習用データの入力を受け付け、学習済み高精度モデル情報及び学習済み軽量モデル情報を出力する。また、学習装置１０は、高精度モデル学習部１１及び軽量モデル学習部１２を有する。

【0044】

高精度モデル学習部１１は、推定部１１１、損失計算部１１２、更新部１１３を有する。また、高精度モデル学習部１１は、高精度モデル情報１１４を記憶する。高精度モデル情報１１４は、高精度モデルを構築するためのパラメータ等の情報である。学習用データは、ラベルが既知のデータであるものとする。例えば、学習用データは、画像とラベル（正解のクラス）の組み合わせである。

【0045】

推定部１１１は、高精度モデル情報１１４を基に構築された高精度モデルに学習用データを入力し、推定結果を取得する。推定部１１１は、学習用データの入力を受け付け、推定結果を出力する。

【0046】

損失計算部１１２は、推定部１１１によって取得された推定結果を基に損失を計算する。損失計算部１１２は、推定結果及びラベルの入力を受け付け、損失を出力する。例えば、損失計算部１１２は、推定部１１１によって取得された推定結果において、ラベルに対する確信度が小さいほど大きくなるように損失を計算する。例えば、確信度は、推定結果が正解であることの確からしさの度合いである。例えば、確信度は、前述の多クラス分類モデルが出力した確率であってもよい。具体的には、損失計算部１１２は、後述するソフトマックスクロスエントロピーを損失として計算することができる。

【0047】

更新部１１３は、損失が最適化されるように、高精度モデルのパラメータを更新する。例えば、高精度モデルがニューラルネットワークであれば、更新部１１３は、誤差逆伝播法等により高精度モデルのパラメータを更新する。具体的には、更新部１１３は、高精度モデル情報１１４を更新する。更新部１１３は、損失計算部１１２によって計算された損失の入力を受け付け、更新済みのモデルの情報を出力する。

【0048】

軽量モデル学習部１２は、推定部１２１、損失計算部１２２、更新部１２３を有する。また、軽量モデル学習部１２は、軽量モデル情報１２４を記憶する。軽量モデル情報１２４は、軽量モデルを構築するためのパラメータ等の情報である。

【0049】

推定部１２１は、軽量モデル情報１２４を基に構築された軽量モデルに学習用データを入力し、推定結果を取得する。推定部１２１は、学習用データの入力を受け付け、推定結果を出力する。

【0050】

ここで、高精度モデル学習部１１は、高精度モデルの出力を基に、高精度モデルの学習を行うものであった。一方で、軽量モデル学習部１２は、高精度モデル及び軽量モデルの両方の出力を基に、軽量モデルの学習を行う。

【0051】

損失計算部１２２は、推定部によって取得された推定結果を基に損失を計算する。損失計算部１２２は、高精度モデルによる推定結果、軽量モデルによる推定結果及びラベルの入力を受け付け、損失を出力する。高精度モデルによる推定結果は、高精度モデル学習部１１による学習が行われた後の高精度モデルに、さらに学習用データを入力して得られた推定結果であってよい。さらに具体的には、軽量モデル学習部１２は、高精度モデルによる推定結果が正解であったか否かの入力を受け付ける。例えば、高精度モデルが出力した確率が最大であったクラスがラベルと一致していれば、その推定結果は正解である。

【0052】

損失計算部１２２は、軽量モデル単体での推定精度の最大化に加え、モデルカスケードを構成した場合の利益の最大化を目的として損失を計算する。ここで、利益は、推定精度が高いほど大きくなり、計算コストが小さいほど大きくなるものとする。

【0053】

例えば、高精度モデルには、推定精度は高いが計算コストが大きいという特徴がある。また、また、例えば、軽量モデルには、推定精度は低いが計算コストが小さいという特徴がある。そこで、損失計算部１２２は、（１）式のように損失Lossを計算する。ただし、wは重みであり、事前に設定されるパラメータである。

【0054】

【数1】

【0055】

ここで、L_classifierは、多クラス分類モデルにおけるソフトマックスエントロピーである。また、L_classifierは、軽量モデルによる推定結果における正解に対する確信度が小さいほど大きくなる第１の項の一例である。L_classifierは、（２）式のように表される。ただし、Nはサンプル数である。また、kはクラス数である。また、yは正解のクラスを表すラベルである。また、qは軽量モデルによって出力された確率である。iはサンプルを識別する番号である。また、jはクラスを識別する番号である。ラベルy_i,jは、i番目のサンプルにおいて、j番目のクラスが正解であれば1になり、不正解であれば0になる。

【0056】

【数2】

【0057】

また、L_cascadeは、モデルカスケードを構成した場合の利益の最大化のための項である。L_cascadeは、各サンプルについて、軽量モデルの確信度に基づいて高精度モデル及び軽量モデルの推定結果を採用した場合の損失を表している。ここで、損失は、不適切な確信度へのペナルティと高精度モデルを用いるコストを含む。また、損失は高精度モデルの推定結果が正解か否かと、軽量モデルの推定結果が正解か否かとの組み合わせで４パターンに分けられる。詳細は後述するが、高精度モデルの推定が不正解、かつ軽量モデルの確信度が低い場合は、ペナルティは大きくなる。一方、軽量モデルの推定が正解、かつ軽量モデルの確信度が高い場合は、ペナルティは小さくなる。L_cascadeは、（３）式のように表される。

【0058】

【数3】

【0059】

1_fastは、軽量モデルの推定結果が正解であれば0、軽量モデルの推定結果が不正解であれば1を返す指示関数である。また、1_accは、高精度モデルの推定結果が正解であれば0、高精度モデルの推定結果が不正解であれば1を返す指示関数である。COST_accは、高精度モデルによる推定を行うことにかかるコストであり、事前に設定されるパラメータである。

【0060】

max_jq_i,jは、軽量モデルが出力する確率の最大値であり、確信度の一例である。推定結果が正解であれば、確信度が大きいほど推定精度は高いといえる。一方、推定結果が不正解であれば、確信度が大きいほど推定精度は低いといえる。

【0061】

（３）式のmax_jq_i,j1_fastは、軽量モデルによる推定結果が不正解である場合に軽量モデルによる推定結果の確信度が大きいほど大きくなる第２の項の一例である。また、（３）式の(1-max_jq_i,j)1_accは、高精度モデルによる推定結果が不正解である場合に軽量モデルによる推定結果の確信度が小さいほど大きくなる第３の項の一例である。また、（３）式の(1-max_jq_i,j)COST_accは、軽量モデルによる推定結果の確信度が小さいほど大きくなる第４の項の一例である。この場合、更新部１２３による損失の最小化が、損失の最適化に相当する。

【0062】

更新部１２３は、損失が最適化されるように、軽量モデルのパラメータを更新する。つまり、更新部１２３は、軽量モデルによる推定結果と、入力されたデータを基に推定結果を出力するモデルであって、軽量モデルよりも処理速度が遅く推定精度が高い高精度モデルに学習用データを入力して得られた推定結果と、を基に、軽量モデルと高精度モデルを含むモデルカスケードが最適化されるように、軽量モデルのパラメータを更新する。更新部１２３は、損失計算部１２２によって計算された損失の入力を受け付け、更新済みのモデルの情報を出力する。

【0063】

図７は、ケースごとの損失の一例を示す図である。縦軸はL_cascadeの値である。また、横軸は、max_jq_i,jの値である。また、COST_acc=0.5とする。max_jq_i,jは、軽量モデルによる推定結果の確信度であり、ここでは単に確信度と呼ぶ。

【0064】

図７の「□」は、軽量モデル及び高精度モデルの両方の推定結果が正解である場合の、確信度に対するL_cascadeの値である。この場合、確信度が大きいほどL_cascadeの値は小さくなる。これは、軽量モデルによる推定結果が正解であれば、確信度が大きいほど軽量モデルが採用されやすくなるためである。

【0065】

図７の「◇」は、軽量モデルの推定結果が正解であり、高精度モデルの推定結果が不正解である場合の、確信度に対するL_cascadeの値である。この場合、確信度が大きいほどL_cascadeの値は小さくなる。また、「□」の場合と比べて、L_cascadeの最大値及び小さくなる度合いが大きい。これは、高精度モデルによる推定結果が不正解であって、軽量モデルによる推定結果が正解であれば、確信度が大きいほど軽量モデルが採用されやすくなる傾向がさらに大きくなるためである。

【0066】

図７の黒塗りの四角は、軽量モデルの推定結果が不正解であり、高精度モデルの推定結果が正解である場合の、確信度に対するL_cascadeの値である。この場合、確信度が大きいほどL_cascadeの値は大きくなる。これは、軽量モデルの推定結果が不正解である場合も、確信度が小さいほど推定結果が採用されにくくなるためである。

【0067】

図７の「◆」は、軽量モデル及び高精度モデルの両方の推定結果が不正解である場合の、確信度に対するL_cascadeの値である。この場合、確信度が大きいほどL_cascadeの値は小さくなる。ただし、「□」の場合と比べて、L_cascadeの値は大きい。これは、両方のモデルの推定結果が不正解であることから常に損失が大きく、そのような状況では軽量モデルで正確な推定ができるようにすべきであるためである。

【0068】

［学習処理］
図８は、高精度モデルの学習処理の流れを示すフローチャートである。図８に示すように、まず、推定部１１１は、高精度モデルを用いて学習用データのクラスを推定する（ステップＳ１０１）。

【0069】

次に、損失計算部１１２は、高精度モデルの推定結果を基に損失を計算する（ステップＳ１０２）。そして、更新部１１３は、損失が最適化されるように高精度モデルのパラメータを更新する（ステップＳ１０３）。なお、学習装置１０は、終了条件が満たされるまで、ステップＳ１０１からステップＳ１０３までの処理を繰り返してもよい。終了条件は、既定の回数だけ処理が繰り返されたことであってもよいし、パラメータの更新幅が収束したことであってもよい。

【0070】

図９は、軽量モデルの学習処理の流れを示すフローチャートである。図９に示すように、まず、推定部１２１は、軽量モデルを用いて学習用データのクラスを推定する（ステップＳ２０１）。

【0071】

次に、損失計算部１２２は、軽量モデルの推定結果、及び高精度モデルの推定結果及び高精度モデルによる推定のコストを基に損失を計算する（ステップＳ２０２）。そして、更新部１２３は、損失が最適化されるように軽量モデルのパラメータを更新する（ステップＳ２０３）。なお、学習装置１０は、終了条件が満たされるまで、ステップＳ２０１からステップＳ２０３までの処理を繰り返してもよい。

【0072】

このように、推定部１２１は、入力されたデータを基に推定結果を出力する軽量モデルに学習用データを入力し、第１の推定結果を取得する。また、更新部１２３は、第１の推定結果と、入力されたデータを基に推定結果を出力するモデルであって、軽量モデルよりも処理速度が遅く推定精度が高い高精度モデルに学習用データを入力して得られた第２の推定結果と、を基に、軽量モデルと高精度モデルを含むモデルカスケードが最適化されるように、軽量モデルのパラメータを更新する。このように、学習装置１０では、軽量モデルと高精度モデルによって構成されるモデルカスケードにおいて、軽量モデルがモデルカスケードに適した推定を行えるようにすることで、モデルカスケードの性能を向上させることができる。その結果、学習装置１０によれば、モデルカスケードの精度が向上するだけでなく、計算コスト及び計算リソースのオーバーヘッドを抑止することができる。さらに、第１の実施形態では、損失関数に変更を加えるものであるため、モデルアーキテクチャの変更が不要であり、適用するモデルや最適化手法に制限がない。

【0073】

更新部１２３は、第１の推定結果における正解に対する確信度が小さいほど大きくなる第１の項と、第１の推定結果が不正解である場合に第１の推定結果の確信度が大きいほど大きくなる第２の項と、第２の推定結果が不正解である場合に第１の推定結果の確信度が小さいほど大きくなる第３の項と、第１の推定結果の確信度が小さいほど大きくなる第４の項と、を含む損失関数を基に計算される損失が最小化されるように、軽量モデルのパラメータを更新する。この結果、第１の実施形態では、軽量モデルと高精度モデルによって構成されるモデルカスケードにおいて、高精度モデルの推定結果を採用する場合のコストを考慮した上で、モデルカスケードの推定精度を向上させることができる。

【0074】

処理システム１００では、学習装置１０による学習済みの高精度モデル及び軽量モデルを使って推論を行う場合、エッジ装置３０は、軽量モデル（ＤＮＮ１）に、推論用データを入力し、確信度を取得し、確信度が閾値以上である場合に、軽量モデルによる軽量モデルの推定結果を採用する。また、エッジ装置３０は、確信度が閾値未満である場合に、サーバ装置２０に処理用データを送信する。そして、処理システムは、サーバ装置２０の高精度モデル（ＤＮＮ２）に推論用データを入力することによって取得した高精度モデルの推定結果を採用する。

【0075】

なお、本実施の形態１では、ＤＮＮを学習した例について説明したが、ＤＮＮ以外の機械学習機構を用いてもよい。

【0076】

［実施の形態２］
次の実施の形態２について説明する。実施の形態２では、エッジ装置が、処理用データを符号化した後にサーバ装置に送信する。

【0077】

図１０は、実施の形態２に係る処理システムの構成の一例を模式的に示す図である。実施の形態２に係る処理システム２００は、図４に示すサーバ装置２０に代えてサーバ装置２２０を有し、エッジ装置３０に代えてエッジ装置２３０を有する。

【0078】

エッジ装置２３０は、エッジ装置３０と比して、符号化部２３５を有する。符号化部２３５は、通信部３４がサーバ装置２２０に送信するデータを符号化する。例えば、符号化部２３５は、送信するデータを圧縮して通信量を削減する。なお、サーバ装置２２０に送信するデータをＤＮＮ１の中間層の出力値とする場合、当該データを盗聴された場合であっても盗聴者が当該送信するデータが持つ意味を解釈することができないため、セキュリティの担保も可能とする。

【0079】

中間出力値は、推論用データの推論結果を出力する処理において出力されるＤＮＮ１の複数の中間出力値のうち、他の中間出力値と比して符号化が容易である値が選択される。符号化が容易であるとは、他の中間出力値と比して、エントロピーが小さい、あるいは、スパース性が高いことである。例えば、中間出力値は、所望の中間層の出力値のエントロピーが小さくなるように学習した学習済みのＤＮＮ１の中間層の中間出力値である。中間出力値は、所望の中間層の出力値スパース性が高くなるように学習した学習済みのＤＮＮ１の中間層の中間出力値である。

【0080】

サーバ装置２２０は、サーバ装置２０と比して、復号化部２２３を有する。復号化部２２３は、符号化部２３５によって符号化された処理用データを復号化し、推論部２２に出力する。

【0081】

ここで、ＤＮＮ１及びＤＮＮ２が、一体のＤＮＮとしてトレーニングを行ったＤＮＮ３（図３参照）を、所定基準を用いてＤＮＮ１ｂ及びＤＮＮ２ｂに分割したモデルである場合、推論結果への歪が少なく効率的な符号化部２３５を構築することが望ましい。

【0082】

例えば、トレーニングセットのデータを一通り学習すると、転送対象の中間層の各ノードについて最大値、ゼロの発生頻度が見えてくるため、それに対応させた符号化処理を行うように符号化部２３５を設計する。符号化処理は、ゼロ発生頻度の高いノードの影響を小さく見積ることで符号化対象の表現空間の次元を小さくするような処理でもよいし、各ノードの値がとる範囲を見極めることでその傾向を反映した方式の選択や量子化の粒度を決める処理でもよい。

【0083】

また、符号化部２３５は、ベクトル量子化的な手法を基に符号化を行ってもよい。この場合、符号化部２３５は、個別にノードの値を量子化するのではなく、ノード全体の値をベクトルととらえて、ベクトル空間でクラスタ化して、符号化する。

【0084】

また、エントロピーが小さい層を求め、その層でＤＮＮ３を分割することで、符号化部２３５が、エントロピーが小さい中間出力値を得ることができるようする。

【0085】

また、符号化部２３５及び復号化部２２３は、既知のルールに基づいた符号化・復号化方式を採用してもよいし、ＡＥ（AutoEncoder）やＶＡＥ（Variational AutoEncoder）のような学習に基づく方式を採用してもよい。

【0086】

そして、符号化部２３５は、複数の符号化方法のうち、中間出力値及び送信先のＤＮＮ２に応じて、処理用データに対する符号化方式を切り替えてもよい。復号化部２２３は、符号化部２３５が実行した符号化方式に応じた方式でデータを復号化する。

【0087】

［処理システムの処理手順］
図１１は、実施の形態２に係る処理システムの処理の流れを示すシーケンス図である。図１１に示すステップＳ２１～ステップＳ２９は、図５に示すステップＳ１～ステップＳ９と同じ処理である。

【0088】

評価値が所定値を満たさない場合（ステップＳ２６：Ｎｏ）、符号化部２３５は、推論処理をサーバ装置２２０に実行させるための処理用データを符号化し（ステップＳ３０）、符号化データを、通信部３４を介してサーバ装置２２０に送信する（ステップＳ３１，Ｓ３２）。サーバ装置２２０では、復号化部２２３が符号化データを復号化し（ステップＳ３３）、推論部２２に復号化後の処理用データを出力する（ステップＳ３４）。ステップＳ３５～ステップＳ４０は、図５に示すステップＳ１１～ステップＳ１６である。

【0089】

［実施の形態２の効果］
このように、実施の形態２では、エッジ装置２３０は、処理用データを符号化してから、サーバ装置２２０に送信することで、セキュリティを保持した処理データの送信、推論結果への歪が少ないデータ形式での処理データの送信または効率的な処理データの送信を可能とする。

【0090】

なお、実施の形態２では、エッジ装置２３０が符号化部２３６を有し、サーバ装置２２０が復号化部２２３を有する構成について説明したが、これに限らない。図１２は、実施の形態２に係る処理システムの構成の他の例を模式的に示す図である。図１２に示すように、エッジ装置２３０Ａとサーバ装置２２０Ａとの間のエッジ装置２３０Ａ側のＮＷ装置２４０Ａに符号化部２３５を設け、サーバ装置２２０Ａ側のＮＷ装置２５０Ａに復号化部２２３を設けてもよい。

【0091】

また、本実施の形態２では、エッジ装置２３０またはサーバ装置２２０が複数であってもよく、また、エッジ装置２３０とサーバ装置２２０とがいずれも複数であってもよい。

【0092】

［実施の形態３］
次に、実施の形態３について説明する。図１３は、実施の形態３に係る処理システムの構成の一例を模式的に示す図である。図１３に示すように、実施の形態３に係る処理システム３００は、複数のエッジ装置３３０－１，３３０－２がネットワークＮを介して、１台のサーバ装置３２０に接続する構成を有する。エッジ装置の台数は、一例であり、３台以上でもよい。エッジ装置３３０－１，３３０－２を総称する場合には、エッジ装置３３０と記載する。

【0093】

図１４は、図１３に示すエッジ装置３３０－１の一例を模式的に示す図である。図１４に示すように、エッジ装置３３０－１は、エッジ装置３０と比して、付加部３３６を有する。付加部３３６は、自装置を特定する符号を処理用データに付加する。通信部３４は、処理用データである中間出力値とともに、自装置を特定する符号を、サーバ装置３２０に送信する。

【0094】

なお、エッジ装置３３０－２もエッジ装置３３０－１と同様の構成を有する。この際、各エッジ装置３３０が有するＤＮＮ１は、同じモデルであってもよい。

【0095】

また、各エッジ装置３３０が有するＤＮＮ１は、モデル間で合意形成することで所定の中間層まで共通するようなマルチタスク学習で形成されたモデルであってもよい。モデル間の合意形成とは、例えば複数のモデルの同一の階層である中間層同士で合意形成を行いながら学習を行うことを意図する。つまり、モデル毎に異なる学習データを与えられた場合に自身に設定された問題に係るコスト項に加え、他のモデルの同一の階層である中間層同士で合意形成を行うコスト項の２つを同時に最適化したといいかえてもよい。この結果、各エッジ装置３３０が有するＤＮＮ１は、入力層から所定の中間層までが同じ重みとなるよう学習されたモデルであってもよい。例えば、各エッジ装置３３０が有するＤＮＮ１は、音響信号の特徴量抽出層まで共通し、それ以降の層がそれぞれ異なる処理を行う。この場合、各エッジ装置３３０が出力する中間出力値は、共通層からの出力値となるように設定される。もちろん、エッジ装置３３０は、それぞれ異なる中間層の出力値をサーバ装置３２０に送信してもよい。

【0096】

図１５は、図１３に示すサーバ装置３２０の一例を模式的に示す図である。図１５に示すように、サーバ装置３２０は、サーバ装置２０と比して、格納部３２４及び推論結果データベース（ＤＢ）３２５を有する。格納部３２４は、推論部２２が中間出力値を解析した結果（推論結果）と、処理用データを送信したエッジ装置３３０を特定する符号とを対応付けて、推論結果ＤＢ３２５に保存する。

【0097】

処理システム３００では、複数のエッジ装置３３０のいずれのエッジ装置から送信されたデータであっても、推論処理を行うよう、エッジ装置３３０で行われる処理とサーバ装置３２０とにおいて行われる処理とが最適化されている。例えば、サーバ装置３２０のＤＮＮ２は、いずれのエッジ装置３３０から送信された処理用データであっても対応できるように最適化されている。

【0098】

［処理システムの処理手順］
図１６は、実施の形態３に係る処理システムの処理の流れを示すシーケンス図である。図１６に示すステップＳ４１～ステップＳ４９は、図５に示すステップＳ１～ステップＳ９と同じ処理である。

【0099】

評価値が所定値を満たさない場合（ステップＳ４６：Ｎｏ）、付加部３３６は、自装置を特定する符号を処理用データに付加する（ステップＳ５０）。通信部３４は、処理用データである中間出力値とともに、自装置を特定する符号を、サーバ装置３２０に送信する（ステップＳ５１，Ｓ５２）。

【0100】

図１６に示すステップＳ５３～ステップＳ５８は、図５に示すステップＳ１１～ステップＳ１６である。サーバ装置３２０では、格納部３２４が、推論結果と、処理用データを送信したエッジ装置３３０を特定する符号とを対応付けて、推論結果ＤＢ３２５に格納する（ステップＳ５９～ステップＳ６１）。

【0101】

［実施の形態３の効果］
このように、実施の形態３では、複数のエッジ装置３３０と接続する場合であっても、サーバ装置３２０のＤＮＮ２は、いずれのエッジ装置３３０から送信された処理用データであっても対応できるように最適化されている。そして、エッジ装置３３０は、処理用データである中間出力値とともに自装置を特定する符号を、サーバ装置３２０に送信する。このため、サーバ装置３２０のＤＮＮ２では、いずれのエッジ装置３３０から送信された処理用データを認識することで、処理データを用いた推論処理を適切に実行することができる。

【0102】

なお、処理システム３００は、実施の形態２において説明した符号化部２３５及び復号化部２２３を設けてもよい。

【0103】

［実施の形態４］
次に、実施の形態４について説明する。図１７は、実施の形態４に係る処理システムの構成の一例を模式的に示す図である。図１７に示すように、実施の形態４に係る処理システム４００は、エッジ装置４３０がネットワークＮを介して、複数のサーバ装置４２０－１，４２０－２に接続する構成を有する。サーバ装置の台数は、一例であり、３台以上でもよい。サーバ装置４２０－１，４２０－２を総称する場合には、サーバ装置４２０と記載する。

【0104】

サーバ装置４２０が有するＤＮＮ２は、例えば、それぞれ異なるタスクを行う。例えば、サーバ装置４２０－１のＤＮＮ２は、対象データの種類（画像か音響信号か）を分類する。サーバ装置４２０－２のＤＮＮ２は、対象データの性質（被写体認識タスクの場合だと人間か乗り物かなど）を分類する。また、他のサーバ装置４２０のＤＮＮ２は、対象データを処理する処理内容（被写体認識タスクか、音源強調タスクか）を分類する。例えば、エッジ装置４３０のＤＮＮ１が、データの特徴抽出を行うものである場合、各サーバ装置４２０のＤＮＮ２は、各サーバ装置４２０にそれぞれ与えられる各タスクに特化したものとなる。なお、異なるタスクを行わせようとする場合、いわゆるマルチタスク学習を利用すればよい。具体的には、タスク１とタスク２について入力層から所定の中間層までの重みが共通するように学習させた所定の中間層までをエッジ装置４３０に配置し、所定の中間層より先をサーバ装置４２０に配置すればよい。このようにすることで、どのようなタスクであってもエッジ装置４３０に配置するモデルを共通としつつ、いずれのサーバ装置に配置されたモデルでも処理を可能とするよう構成することができる。また、異なるタスクというのは同一の目的であって異なる推定精度のものであってもよい。例えば、推定精度がエッジ装置４３０＜サーバ装置４２０－１＜サーバ装置４２０－２となるよう構成してもよい。

【0105】

図１８は、図１７に示すエッジ装置４３０の一例を模式的に示す図である。図１８に示すように、エッジ装置４３０は、エッジ装置３０と比して、選択部４３７を有する。選択部４３７は、推論用データを処理する目的に応じて、複数のサーバ装置４２０の中から、処理用データを送信するサーバ装置４２０を選択する。

【0106】

［処理システムの処理手順］
図１９は、実施の形態４に係る処理システムの処理の流れを示すシーケンス図である。図１９に示すステップＳ７１～ステップＳ７９は、図５に示すステップＳ１～ステップＳ９と同じ処理である。

【0107】

評価値が所定値を満たさない場合（ステップＳ７６：Ｎｏ）、選択部４３７は、推論用データを処理する目的や精度に応じて、送信先のサーバ装置４２０を選択する（ステップＳ８０）。通信部３４は、選択部４３７が選択したサーバ装置４２０（例えば、サーバ装置４２０－１）に処理用データを送信する（ステップＳ８１，Ｓ８２）。図１９に示すステップＳ８３～ステップＳ８８は、図５に示すステップＳ１１～ステップＳ１６と同じ処理である。なお、送信先の選択を行う（ステップＳ８０）選択部４３７は、物理的及び／または論理的にエッジ装置側に置かれてもよいし、サーバ装置側に置かれてもよい。また、選択部４３７は、ネットワーク上（サーバ側ともエッジ側とも区分できない位置）においてもよい。

【0108】

［実施の形態４の効果］
このように、実施の形態４では、エッジ装置４３０が複数のサーバ装置４２０と接続する場合であっても、推論用データを処理する目的に応じて、送信先のサーバ装置４２０を選択することによって、推論処理を適切に実行することができる。

【0109】

なお、本実施の形態４では、エッジ装置４３０が複数であってもよい。また、処理システム４００は、エッジ装置とサーバ装置との間のＮＷ装置に選択部４３７部を設けてもよい。また、処理システム４００は、実施の形態２において説明した符号化部２３５及び復号化部２２３を設けてもよい。この際、選択部２３７の配置場所は、符号部２３５の前段でもよく後段でもよい。

【0110】

［変形例］
次に、実施の形態１～４の変形例について説明する。図２０は、実施の形態１～４の変形例における処理システムの概略を示す図である。以降では、図２１を参照して、図２０に示すＤＮＮ１、ＤＮＮ２、判定部３３、符号化部２３５、復号化部２２３及びＤＮＮ２のそれぞれの機能のバリエーションや、通信内容のバリエーションを説明する。

【0111】

図２１は、ＤＮＮ１、ＤＮＮ２、判定部３３、符号化部２３５及び復号化部２２３の機能のバリエーションと、通信内容のバリエーションを示す図である。図２１に示す各欄のうち、（１－Ａ）～（１－Ｈ）は、ＤＮＮ１、ＤＮＮ２の機能のバリエーションを示す。また、（２－Ａ）～（２－Ｇ）は、判定部３３の機能のバリエーションを示す。また、（３＾Ａ）～（３－Ｆ）は、符号化部２３５、復号化部２２３及びエッジ装置とサーバ装置との間の通信内容のバリエーションを示す。各機能部及び通信内容は、これらの各欄に示すものとすることができる。

【0112】

また、各機能部や通信内容を組み合わせて運用するともできる。例えば、それぞれ独立したＤＮＮ１ａ及びＤＮＮ２ａを用いる場合（図２参照）、（１－Ｄ）、（２－Ｃ）、（３－Ａ）の機能及び通信内容を組み合わせることができる。また、一体のＤＮＮ３を分割したＤＮＮ１ｂ及びＤＮＮ２ｂを用いる場合（図３参照）、（１－Ｄ）、（１－Ｇ）のいずれかと、（２－Ｃ）、（２－Ｄ）のいずれかと、（３－Ｂ）、（３－Ｃ）、（３－Ｄ－１）、（３－Ｄ－２）、（３－Ｄ－３）のいずれかと、を組み合わせることができる。

【0113】

本発明は、ユーザの要望が多岐にわたるような様々な場合に適用することができる。いくつか具体例を挙げる。

【0114】

［自動運転］
自動車内に配置されたＤＳＰ（Digital Signal Processor）等の演算装置をエッジとし、クラウドとの連携について例を挙げる。例えば、渋滞を考慮したナビゲーションのように演算量、伝送量共に多くなりがちであるもののレスポンスが遅くてもいいような処理はサーバ装置で、自動車の直接の制御に係るイベント検知や検知したイベントに応じた自動車の制御の決定などはある程度の精度とレスポンスの速さが要求されるためエッジ装置側で処理するよう構成されてもよい。

【0115】

［変化検出］
時系列画像信号を対象とした場合に、エッジ装置で平常時若しくは前フレームと比較した変化の有無をエッジ装置で検出し、どのような変化が起こったかの推定をサーバ装置で行ってもよい。

【0116】

時系列画像信号は監視カメラでもよいし、衛星画像や航空写真でもよい。監視カメラの場合は人間が監視カメラの前を通過した場合を変化としてエッジ装置で検出し、どのような人間が通過したかをサーバ装置で推定してもよい。衛星画像の場合、建物のエッジやテクスチャの変化、船や自動車の通過を変化としてエッジ装置で検出し、どのような建物ができたかや建築状況、どのような船が通過したかなどをサーバ装置で推定してもよい。この場合、飛行機や衛星に配置された演算装置をエッジとして扱ってもよい。

【0117】

［防犯］
比較的単純・軽量な推論（人数のカウント、性別・年齢等推定、大まかな服装判定等）はエッジ装置で行い、より負荷のかかる複雑な推論（人物特定、姿勢推定、不審者検出等）をクラウド（サーバ装置）で行う。

【0118】

また、即応性の求められるＶＩＰ（Virtual IP）, リピータ, クレーマ等の既知の要注意人物検出をエッジ装置で行い、時間をかけても問題ない、より一般的な人物検出、その人物の特徴抽出、ＤＢ化等はクラウドで行う。

【0119】

［農業］
無人制御トラクタについて、前方に障害物がないことの確認はエッジ装置（トラクタ単体）で行い、何かがありそれにどう対処するかまで含めた推論・プランニングは、クラウドで行う。

【0120】

［推論基盤的なビジョン］
カメラからの映像を局舎で受けて映像処理（通常の二層推論）、処理結果をクラウドにまわしてより高度な処理や集計的な処理を行う（多段推論）。ある局舎Ａのリソースが枯渇しており、その隣の局舎Ｂでリソースが余っている場合、クラウドからの制御で局舎Ａの一部加工済みデータを局舎Ｂへまわして、残りの処理を行う。これにより効率的なリソース利用が可能となる（サービスのロバスト性、リソースの効率的利用）。これは、局舎に配置される演算装置等をいわゆるエッジクラウドとして制御してもよいことを意図する。

【0121】

［ドローンカメラ群の制御］
複数のドローンカメラ群の全体的な撮影計画に伴う個々のドローンカメラの配置や状況に応じたカメラ間のリカバー対応等はクラウド側で制御・指示し、個々のドローンカメラ固有の状況対応等に関わる推論・判断（急にカメラの前に障害物が出現した場合の回避等）はドローン（エッジ装置）側で行う。この例では、多対１の実施の形態３を適用する。

【0122】

また、１対多の実施の形態４の適用例について説明する。１つのカメラ画像をエッジ（ＤＮＮ１）で特徴量化、それを複数のクラウドに並列に渡して多様なタスク処理（人数カウント、人物特定、クラス分類、姿勢推定等）を行うために共通的に利用する。1対多の事例であり、プライバシー保護に関しては、符号化処理を適用する。

【0123】

［システム構成等］
図示した各装置の各構成要素は機能概念的なものであり、必ずしも物理的に図示の如く構成されていることを要しない。すなわち、各装置の分散・統合の具体的形態は図示のものに限られず、その全部又は一部を、各種の負荷や使用状況等に応じて、任意の単位で機能的又は物理的に分散・統合して構成することができる。さらに、各装置にて行なわれる各処理機能は、その全部又は任意の一部が、ＣＰＵ及び当該ＣＰＵにて解析実行されるプログラムにて実現され、あるいは、ワイヤードロジックによるハードウェアとして実現され得る。

【0124】

また、本実施形態において説明した各処理のうち、自動的に行われるものとして説明した処理の全部又は一部を手動的におこなうこともでき、あるいは、手動的におこなわれるものとして説明した処理の全部又は一部を公知の方法で自動的におこなうこともできる。この他、上記文書中や図面中で示した処理手順、制御手順、具体的名称、各種のデータやパラメータを含む情報については、特記する場合を除いて任意に変更することができる。

【0125】

［プログラム］
図２２は、プログラムが実行されることにより、エッジ装置３０，２３０，３３０，４３０及びサーバ装置２０，２２０，３２０，４２０が実現されるコンピュータの一例を示す図である。コンピュータ１０００は、例えば、メモリ１０１０、ＣＰＵ１０２０を有する。また、演算を補助するために前述したアクセラレータを備えてもよい。また、コンピュータ１０００は、ハードディスクドライブインタフェース１０３０、ディスクドライブインタフェース１０４０、シリアルポートインタフェース１０５０、ビデオアダプタ１０６０、ネットワークインタフェース１０７０を有する。これらの各部は、バス１０８０によって接続される。

【0126】

メモリ１０１０は、ＲＯＭ（Read Only Memory）１０１１及びＲＡＭ１０１２を含む。ＲＯＭ１０１１は、例えば、ＢＩＯＳ（Basic Input Output System）等のブートプログラムを記憶する。ハードディスクドライブインタフェース１０３０は、ハードディスクドライブ１０９０に接続される。ディスクドライブインタフェース１０４０は、ディスクドライブ１１００に接続される。例えば磁気ディスクや光ディスク等の着脱可能な記憶媒体が、ディスクドライブ１１００に挿入される。シリアルポートインタフェース１０５０は、例えばマウス１１１０、キーボード１１２０に接続される。ビデオアダプタ１０６０は、例えばディスプレイ１１３０に接続される。

【0127】

ハードディスクドライブ１０９０は、例えば、ＯＳ（Operating System）１０９１、アプリケーションプログラム１０９２、プログラムモジュール１０９３、プログラムデータ１０９４を記憶する。すなわち、エッジ装置３０，２３０，３３０，４３０及びサーバ装置２０，２２０，３２０，４２０の各処理を規定するプログラムは、コンピュータにより実行可能なコードが記述されたプログラムモジュール１０９３として実装される。プログラムモジュール１０９３は、例えばハードディスクドライブ１０９０に記憶される。例えば、エッジ装置３０，２３０，３３０，４３０及びサーバ装置２０，２２０，３２０，４２０における機能構成と同様の処理を実行するためのプログラムモジュール１０９３が、ハードディスクドライブ１０９０に記憶される。なお、ハードディスクドライブ１０９０は、ＳＳＤ（Solid State Drive）により代替されてもよい。

【0128】

また、上述した実施形態の処理で用いられる設定データは、プログラムデータ１０９４として、例えばメモリ１０１０やハードディスクドライブ１０９０に記憶される。そして、ＣＰＵ１０２０が、メモリ１０１０やハードディスクドライブ１０９０に記憶されたプログラムモジュール１０９３やプログラムデータ１０９４を必要に応じてＲＡＭ１０１２に読み出して実行する。

【0129】

なお、プログラムモジュール１０９３やプログラムデータ１０９４は、ハードディスクドライブ１０９０に記憶される場合に限らず、例えば着脱可能な記憶媒体に記憶され、ディスクドライブ１１００等を介してＣＰＵ１０２０によって読み出されてもよい。あるいは、プログラムモジュール１０９３及びプログラムデータ１０９４は、ネットワーク（ＬＡＮ（Local Area Network）、ＷＡＮ（Wide Area Network）等）を介して接続された他のコンピュータに記憶されてもよい。そして、プログラムモジュール１０９３及びプログラムデータ１０９４は、他のコンピュータから、ネットワークインタフェース１０７０を介してＣＰＵ１０２０によって読み出されてもよい。

【0130】

以上、本発明者によってなされた発明を適用した実施形態について説明したが、本実施形態による本発明の開示の一部をなす記述及び図面により本発明は限定されることはない。すなわち、本実施形態に基づいて当業者等によりなされる他の実施形態、実施例及び運用技術等は全て本発明の範疇に含まれる。

【符号の説明】

【0131】

１０学習装置
１１高精度モデル学習部
１２軽量モデル学習部
３０，２３０，２３０Ａ，３３０，４３０エッジ装置
２０，２２０，２２０Ａ，３２０，４２０サーバ装置
１００，２００，３００，４００処理システム
１１１，１２１推定部
１１２，１２２損失計算部
１１３，１２３更新部
１１４高精度モデル情報
１２４軽量モデル情報
２２，３２推論部
３３判定部
３４通信部
２２３復号化部
２３５符号化部
２４０Ａ，２５０ＡＮＷ装置
３２４格納部
３２５推論結果データベース（ＤＢ）
３３６付加部
４３７選択部

【図1】