(19)【発行国】日本国特許庁(JP)
(12)【公報種別】公表特許公報(A)
(11)【公表番号】
(43)【公表日】2023-12-19
(54)【発明の名称】設計空間削減装置、制御方法、及びプログラム
(51)【国際特許分類】
G06N 3/04 20230101AFI20231212BHJP
【FI】
G06N3/04
【審査請求】有
【予備審査請求】未請求
(21)【出願番号】P 2023535965
(86)(22)【出願日】2020-12-23
(85)【翻訳文提出日】2023-06-13
(86)【国際出願番号】 JP2020048207
(87)【国際公開番号】W WO2022137393
(87)【国際公開日】2022-06-30
(81)【指定国・地域】
(71)【出願人】
【識別番号】000004237
【氏名又は名称】日本電気株式会社
(74)【代理人】
【識別番号】100103894
【氏名又は名称】家入 健
(72)【発明者】
【氏名】ソンバトシリ サリター
(57)【要約】
設計空間削減装置(2000)は、対象ニューラルネットワークのアーキテクチャのオリジナル設計空間を表すオリジナル設計空間情報(10)を取得する。設計空間削減装置(2000)は、対象データセットの特徴を表すデータセット特徴情報(30)を取得する。対象データセットは、対象ニューラルネットワークの解析対象のデータの集合である。設計空間削減装置(2000)は、オリジナル設計空間情報(10)とデータセット特徴情報(30)を用いて、カスタマイズ設計空間情報(20)を生成する。カスタマイズ設計空間情報は、オリジナル設計空間よりも狭い、対象ニューラルネットワークのアーキテクチャのカスタマイズ設計空間を表す。
【選択図】
図1
【特許請求の範囲】
【請求項1】
少なくとも一つのプロセッサと、
命令を格納している記憶要素とを有し、
前記少なくとも一つのプロセッサは、前記命令を実行することにより、
対象ニューラルネットワークのアーキテクチャのオリジナル設計空間を表すオリジナル設計空間情報を取得し、
前記対象ニューラルネットワークの解析対象のデータの集合である対象データセットの特徴を表すデータセット特徴情報を取得し、
前記オリジナル設計空間情報と前記データセット特徴情報とを用いて、前記対象ニューラルネットワークの前記アーキテクチャのカスタマイズ設計空間を表すカスタマイズ設計空間情報を生成するように構成され、
前記カスタマイズ設計空間は、前記オリジナル設計空間よりも狭い設計空間である、設計空間削減装置。
【請求項2】
前記オリジナル設計空間情報は、前記対象ニューラルネットワークの前記アーキテクチャの1つ以上の要素それぞれについて、複数の選択肢を含み、
前記カスタマイズ設計空間情報の生成は、
前記1つ以上の要素についての前記選択肢の一部を抽出することと、
前記1つ以上の要素についての前記選択肢の前記抽出された一部が含まれる前記カスタマイズ設計空間情報を生成することとを含む、請求項1に記載の設計空間削減装置。
【請求項3】
前記カスタマイズ設計空間情報の生成は、
データセットの特徴とニューラルネットワークのアーキテクチャの設計空間との対応付けを複数表す事前知識を取得することと、
前記データセット特徴情報によって表されている前記対象データセットの前記特徴とマッチする前記データセットの特徴と対応づけられている前記設計空間を、前記事前知識から抽出することと、
前記事前知識から抽出された前記設計空間と、前記オリジナル設計空間情報によって表されている前記オリジナル設計空間とに基づいて、前記カスタマイズ設計空間情報を生成することとを含む、請求項1又は2に記載の設計空間削減装置。
【請求項4】
前記記憶要素はモデルを格納するようにさらに構成され、
前記モデルは、前記対象データセットの前記特徴を取得し、前記モデルに対して前記対象データセットの特徴が入力されたことに応じて設計空間を出力し、
前記カスタマイズ設計空間情報の生成は、
前記データセット特徴情報によって表されている前記対象データセットの前記特徴を前記モデルに入力することと、
前記モデルから出力された前記設計空間を取得することと、
前記モデルから出力された前記設計空間と、前記オリジナル設計空間情報によって表されている前記オリジナル設計空間とに基づいて、前記カスタマイズ設計空間情報を生成することとを含む、請求項1又は2に記載の設計空間削減装置。
【請求項5】
前記少なくとも一つのプロセッサは、
前記対象データセットの前記特徴と類似又は同一の特徴を持つ代表データセットを取得することと、
前記代表データセットの特徴を特定して、前記代表データセットの前記特定された特徴を前記対象データセットの前記特徴として表す前記データセット特徴情報を生成することと、を実行するようにさらに構成される、請求項1から4いずれか一項に記載の設計空間削減装置。
【請求項6】
前記対象データセットの前記特徴は、クラスの数、入力データのサイズ、入力データの種類、外接矩形のサイズ、クラスの分布、入力データの前記サイズの分布、又は外接矩形の前記サイズの分布を含む、請求項1から5いずれか一項に記載の設計空間削減装置。
【請求項7】
対象ニューラルネットワークのアーキテクチャのオリジナル設計空間を表すオリジナル設計空間情報を取得することと、
前記対象ニューラルネットワークの解析対象のデータの集合である対象データセットの特徴を表すデータセット特徴情報を取得することと、
前記オリジナル設計空間情報と前記データセット特徴情報とを用いて、前記対象ニューラルネットワークの前記アーキテクチャのカスタマイズ設計空間を表すカスタマイズ設計空間情報を生成することと、を含み、
前記カスタマイズ設計空間は、前記オリジナル設計空間よりも狭い設計空間である、コンピュータによって実行される制御方法。
【請求項8】
前記オリジナル設計空間情報は、前記対象ニューラルネットワークの前記アーキテクチャの1つ以上の要素それぞれについて、複数の選択肢を含み、
前記カスタマイズ設計空間情報の生成は、
前記1つ以上の要素についての前記選択肢の一部を抽出することと、
前記1つ以上の要素についての前記選択肢の前記抽出された一部が含まれる前記カスタマイズ設計空間情報を生成することとを含む、請求項7に記載の制御方法。
【請求項9】
前記カスタマイズ設計空間情報の生成は、
データセットの特徴とニューラルネットワークのアーキテクチャの設計空間との対応付けを複数表す事前知識を取得することと、
前記データセット特徴情報によって表されている前記対象データセットの前記特徴とマッチする前記データセットの特徴と対応づけられている前記設計空間を、前記事前知識から抽出することと、
前記事前知識から抽出された前記設計空間と、前記オリジナル設計空間情報によって表されている前記オリジナル設計空間とに基づいて、前記カスタマイズ設計空間情報を生成することとを含む、請求項7又は8に記載の制御方法。
【請求項10】
前記コンピュータは、モデルを格納するように構成され、
前記モデルは、前記対象データセットの前記特徴を取得し、前記モデルに対して前記対象データセットの特徴が入力されたことに応じて設計空間を出力し、
前記カスタマイズ設計空間情報の生成は、
前記データセット特徴情報によって表されている前記対象データセットの前記特徴を前記モデルに入力することと、
前記モデルから出力された前記設計空間を取得することと、
前記モデルから出力された前記設計空間と、前記オリジナル設計空間情報によって表されている前記オリジナル設計空間とに基づいて、前記カスタマイズ設計空間情報を生成することとを含む、請求項7又は8に記載の制御方法。
【請求項11】
前記対象データセットの前記特徴と類似又は同一の特徴を持つ代表データセットを取得することと、
前記代表データセットの特徴を特定して、前記代表データセットの前記特定された特徴を前記対象データセットの前記特徴として表す前記データセット特徴情報を生成することと、をさらに含む、請求項7から10いずれか一項に記載の制御方法。
【請求項12】
前記対象データセットの前記特徴は、クラスの数、入力データのサイズ、入力データの種類、外接矩形のサイズ、クラスの分布、入力データの前記サイズの分布、又は外接矩形の前記サイズの分布を含む、請求項7から11いずれか一項に記載の制御方法。
【請求項13】
対象ニューラルネットワークのアーキテクチャのオリジナル設計空間を表すオリジナル設計空間情報を取得することと、
前記対象ニューラルネットワークの解析対象のデータの集合である対象データセットの特徴を表すデータセット特徴情報を取得することと、
前記オリジナル設計空間情報と前記データセット特徴情報とを用いて、前記対象ニューラルネットワークの前記アーキテクチャのカスタマイズ設計空間を表すカスタマイズ設計空間情報を生成することと、をコンピュータに実行させるプログラムが格納されており、
前記カスタマイズ設計空間は、前記オリジナル設計空間よりも狭い設計空間である、コンピュータ可読記憶媒体。
【請求項14】
前記オリジナル設計空間情報は、前記対象ニューラルネットワークの前記アーキテクチャの1つ以上の要素それぞれについて、複数の選択肢を含み、
前記カスタマイズ設計空間情報の生成は、
前記1つ以上の要素についての前記選択肢の一部を抽出することと、
前記1つ以上の要素についての前記選択肢の前記抽出された一部が含まれる前記カスタマイズ設計空間情報を生成することとを含む、請求項13に記載の記憶媒体。
【請求項15】
前記カスタマイズ設計空間情報の生成は、
データセットの特徴とニューラルネットワークのアーキテクチャの設計空間との対応付けを複数表す事前知識を取得することと、
前記データセット特徴情報によって表されている前記対象データセットの前記特徴とマッチする前記データセットの特徴と対応づけられている前記設計空間を、前記事前知識から抽出することと、
前記事前知識から抽出された前記設計空間と、前記オリジナル設計空間情報によって表されている前記オリジナル設計空間とに基づいて、前記カスタマイズ設計空間情報を生成することとを含む、請求項13又は14に記載の記憶媒体。
【請求項16】
モデルをさらに格納するように構成され、
前記モデルは、前記対象データセットの前記特徴を取得し、前記モデルに対して前記対象データセットの特徴が入力されたことに応じて設計空間を出力し、
前記カスタマイズ設計空間情報の生成は、
前記データセット特徴情報によって表されている前記対象データセットの前記特徴を前記モデルに入力することと、
前記モデルから出力された前記設計空間を取得することと、
前記モデルから出力された前記設計空間と、前記オリジナル設計空間情報によって表されている前記オリジナル設計空間とに基づいて、前記カスタマイズ設計空間情報を生成することとを含む、請求項13又は14に記載の制御方法。
【請求項17】
前記プログラムは、前記コンピュータに、
前記対象データセットの前記特徴と類似又は同一の特徴を持つ代表データセットを取得することと、
前記代表データセットの特徴を特定して、前記代表データセットの前記特定された特徴を前記対象データセットの前記特徴として表す前記データセット特徴情報を生成することと、をさらに実行させる、請求項13から16いずれか一項に記載の記憶媒体。
【請求項18】
前記対象データセットの前記特徴は、クラスの数、入力データのサイズ、入力データの種類、外接矩形のサイズ、クラスの分布、入力データの前記サイズの分布、又は外接矩形の前記サイズの分布を含む、請求項13から17いずれか一項に記載の記憶媒体。
【発明の詳細な説明】
【技術分野】
【0001】
本開示は、全体として、ニューラルネットワークを生成する技術に関する。
【背景技術】
【0002】
ニューラルネットワークは、種々のタスクのために幅広く利用されている。ニューラルネットワークを生成する際、それに含まれるレイヤの種類や、種々のハイパーパラメータなどのように、そのアーキテクチャを決定する必要がある。
【0003】
生成するニューラルネットワークのアーキテクチャを自動的に決定する技術が開示されている文献がある。特許文献1は、入力データの特徴に基づいて、ニューラルネットワークの設計パラメータを決定する技術を開示する。特許文献2は、ニューラルネットワークの可能なアーキテクチャの空間を探索することにより、生成するニューラルネットワークのアーキテクチャを決定するニューラルアーキテクチャ探索(NAS: neural architecture search)システムを開示する。
【0004】
非特許文献1は、ニューラルネットワークのハイパーパラメータを生成するための強化学習を採用するシステムを開示する。非特許文献2は、非特許文献1に開示されている NAS システムを携帯端末のために拡張する技術を開示する。
【先行技術文献】
【特許文献】
【0005】
【特許文献1】米国特許出願公開第2020/0175378号明細書
【特許文献2】米国特許出願公開第2020/0257961号明細書
【非特許文献】
【0006】
【非特許文献1】Barret Zoph 及び Quoc V. Le、「Neural Architecture Search with Reinforcement Learning」、Computer Research Repository、arXiv:1611.01578v1、2016年11月5日
【非特許文献2】Mingxing Tan、Bo Chen、Ruoming Pang、Vijay Vasudevan、Mark Sandler、Andrew Howard、及び Quoc V. Le、「MnasNet: Platform-aware neural architecture search for mobile」、Computer Research Repository、arXiv:1807.11626v1、2018年7月31日
【発明の概要】
【発明が解決しようとする課題】
【0007】
たとえコンピュータによって自動的に行われるとしても、ニューラルネットワークの広い設計空間から適切なアーキテクチャを見つけることは、時間がかかる処理である。本開示の目的は、ニューラルネットワークの適切なアーキテクチャを見つけるための時間が削減される技術を提供することである。
【課題を解決するための手段】
【0008】
本開示が提供する設計空間削減装置は、少なくとも一つのプロセッサと、命令を格納している記憶要素とを有する。前記少なくとも一つのプロセッサは、前記命令を実行することにより、対象ニューラルネットワークのアーキテクチャのオリジナル設計空間を表すオリジナル設計空間情報を取得し、前記対象ニューラルネットワークの解析対象のデータの集合である対象データセットの特徴を表すデータセット特徴情報を取得し、前記オリジナル設計空間情報と前記データセット特徴情報とを用いて、前記対象ニューラルネットワークの前記アーキテクチャのカスタマイズ設計空間を表すカスタマイズ設計空間情報を生成するように構成される。前記カスタマイズ設計空間は、前記オリジナル設計空間よりも狭い設計空間である。
【0009】
本開示が提供する制御方法は、コンピュータによって実行される。当該制御方法は、対象ニューラルネットワークのアーキテクチャのオリジナル設計空間を表すオリジナル設計空間情報を取得することと、前記対象ニューラルネットワークの解析対象のデータの集合である対象データセットの特徴を表すデータセット特徴情報を取得することと、前記オリジナル設計空間情報と前記データセット特徴情報とを用いて、前記対象ニューラルネットワークの前記アーキテクチャのカスタマイズ設計空間を表すカスタマイズ設計空間情報を生成することと、を含む。前記カスタマイズ設計空間は、前記オリジナル設計空間よりも狭い設計空間である。
【0010】
本開示が提供するコンピュータ可読記憶媒体は、対象ニューラルネットワークのアーキテクチャのオリジナル設計空間を表すオリジナル設計空間情報を取得することと、前記対象ニューラルネットワークの解析対象のデータの集合である対象データセットの特徴を表すデータセット特徴情報を取得することと、前記オリジナル設計空間情報と前記データセット特徴情報とを用いて、前記対象ニューラルネットワークの前記アーキテクチャのカスタマイズ設計空間を表すカスタマイズ設計空間情報を生成することと、をコンピュータに実行させるプログラムを格納している。前記カスタマイズ設計空間は、前記オリジナル設計空間よりも狭い設計空間である。
【発明の効果】
【0011】
本開示によれば、ニューラルネットワークの適切なアーキテクチャを見つけるための時間を削減する技術が提供される。
【図面の簡単な説明】
【0012】
【
図1】
図1は、実施形態1の設計空間削減装置の概要を表す図である。
【
図2】
図2は、設計空間削減装置の機能構成の例を表すブロック図である。
【
図3】
図3は、設計空間削減装置を実現するコンピュータのハードウエア構成の例を示すブロック図である。
【
図4】
図4は、設計空間削減装置によって実行される処理の流れを表すフローチャートである。
【
図5】
図5は、オリジナル設計空間情報の例をテーブル形式で表す。
【
図6】
図6は、データセット特徴情報をテーブル形式で表す。
【発明を実施するための形態】
【0013】
以下、本開示に係る実施形態について、図面を参照しながら説明する。複数の図を通して同じ要素には同じ符号が付され、冗長な説明は必要に応じて省略される。
【0014】
実施形態1
<概要>
図1は、実施形態1の設計空間削減装置2000の概要を表す図である。ここで、
図1に示される概要は、設計空間削減装置2000の理解を容易にするための、設計空間削減装置2000の動作の例示であり、設計空間削減装置2000が行いうる動作の範囲を限定したり狭くしたりするものではない。
【0015】
ニューラルネットワークを構築する際、そのニューラルネットワークのアーキテクチャについて、考えるべき様々な可能な要素がある(バックボーンブロックの種類、マルチスケール特徴ブロックの種類、レイヤの種類、活性化関数の種類、及びハイパーパラメータなど)。ここで、本開示において、「ブロック」という用語は、複数のレイヤの集合を意味する。設計空間削減装置2000は、ニューラルネットワークで解析すべきデータセットの特徴に基づいて、構築対象のニューラルネットワークのアーキテクチャがとりうる設計空間を削減する。以下、「構築対象のニューラルネットワーク」は、「対象ニューラルネットワーク」と記載される。さらに、本開示において、「設計空間」は、対象ニューラルネットワークのアーキテクチャの要素について、とりうる選択肢の集合を意味する。
【0016】
具体的には、設計空間削減装置2000は、オリジナル設計空間情報10とカスタマイズ設計空間情報20を取得する。オリジナル設計空間情報10は、対象ニューラルネットワークのアーキテクチャのオリジナル設計空間を表す。具体的には、オリジナル設計空間情報10は、対象ニューラルネットワーク10のアーキテクチャの1つ以上の各要素について、1つ以上の選択肢を示す。
【0017】
図1において、オリジナル設計空間情報10は、対象ニューラルネットワークのアーキテクチャの3つの要素を示す。バックボーンブロックの種類(「バックボーン」と記載されている)、マルチスケール特徴ブロックの種類(「マルチスケールブロック」と記載されている)、及び活性化関数の種類(「活性化関数」と記載されている)である。バックボーンブロックについて、オリジナル設計空間情報10は3つの選択肢を示す。bb1、bb2、及び bb3 である。マルチスケール特徴ブロックについて、オリジナル設計空間情報10は4つの選択肢を示す。msb1、msb2、msb3、及び msb4 である。活性化関数について、オリジナル設計空間情報10は3つの選択肢を示す。af1、af2、及び af3 である。
【0018】
カスタマイズ設計空間情報20は、対象ニューラルネットワークについて、カスタマイズされた設計空間(オリジナル設計空間情報10によって表されているオリジナル設計空間の一部)を示す。具体的には、カスタマイズ設計空間情報20は、各要素について、オリジナル設計空間情報10に含まれている選択肢の一部を含む。そのため、各要素について、カスタマイズ設計空間情報20に含まれる選択肢の数は、オリジナル設計空間情報10に含まれる選択肢の数以下である。さらに、少なくとも1つの要素について、カスタマイズ設計空間情報20に含まれるその要素の選択肢の数は、オリジナル設計空間情報10に含まれるその要素の選択肢の数未満である。
【0019】
図1において、カスタマイズ設計空間情報20は、オリジナル設計空間情報10にも含まれている3つの要素を含む。しかしながら、各要素における選択肢の数は、オリジナル設計空間情報10に含まれているものより少ない。具体的には、カスタマイズ設計空間情報20におけるバックボーンブロックの選択肢は bb1 と bb3 であり、bb2 はバックボーンブロックの選択肢から除外されている。カスタマイズ設計空間情報20におけるマルチスケールブロックの選択肢は msb1 と msb2 であり、msb3 と msb4 はマルチスケール特徴ブロックの選択肢から除外されている。カスタマイズ設計空間情報20における活性化関数の選択肢は af2 と af3 であり、af1 は活性化関数の選択肢から除外されている。
【0020】
設計空間削減装置2000において、カスタマイズ設計空間情報20は、オリジナル設計空間情報10と、対象ニューラルネットワークが解析すべきデータの集合であるデータセット(以下、対象データセット)の特徴とに基づいて生成される。そのために、設計空間削減装置2000は、対象データセットの特徴を表すデータセット特徴情報30を取得する。ここで、データセット特徴情報30は、設計空間削減装置2000によって生成されてもよいし、他のコンピュータによって生成されてもよい。
【0021】
データセット特徴情報30によって表されている対象データセットの特徴に基づいて、設計空間削減装置2000は、対象ニューラルネットワークのアーキテクチャの各要素の1つ以上の選択肢を、オリジナル設計空間情報10に含まれているものから抽出する。そして、設計空間削減装置2000は、対象ニューラルネットワークのアーキテクチャの各要素について、抽出された選択肢を含むカスタマイズ設計空間情報20を生成する。
【0022】
<作用効果の例>
対象ニューラルネットワークのアーキテクチャの設計空間が広い場合、その設計空間から対象ニューラルネットワークの適切なアーキテクチャを見つけ出すために、多くの時間を要する。そのため、対象ニューラルネットワークの適切なアーキテクチャを探索する前に、設計空間を狭めることが好適である。しかしながら、慎重な考え無しに(例えばランダムに)設計空間を狭めると、対象ニューラルネットワークに適したアーキテクチャが設計空間から除かれてしまう可能性があり、結果として、対象ニューラルネットワークに適したアーキテクチャを見つけられないことがある。
【0023】
設計空間削減装置2000によれば、対象データセットの特徴を考慮した上で、オリジナル設計空間が狭くなる。そのため、設計空間の中に、対象ニューラルネットワークの適切なアーキテクチャを保持した上で、設計空間を狭くすることができる。その結果、設計空間削減装置2000によって提供されるカスタマイズ設計空間情報20を利用すると、オリジナル設計空間を利用する場合よりも短い時間で、対象ニューラルネットワークの適切なアーキテクチャを見つけ出すことができる。ここで、カスタマイズ設計空間は、対象ニューラルネットワークのアーキテクチャを手動で決定する場合と自動で決定する場合の双方で利用することができる。
【0024】
以下、設計空間削減装置2000についてさらに詳細に説明する。
【0025】
<機能構成の例>
図2は、設計空間削減装置2000の機能構成の例を表すブロック図である。設計空間削減装置2000は、オリジナル設計空間情報取得部2020、データセット特徴情報取得部2040、及び生成部2060を有する。オリジナル設計空間情報取得部2020は、オリジナル設計空間情報10を取得する。データセット特徴情報取得部2040は、データセット特徴情報30を取得する。生成部2060は、オリジナル設計空間情報10及びデータセット特徴情報30に基づいて、カスタマイズ設計空間情報20を生成する。
【0026】
<ハードウエア構成の例>
設計空間削減装置2000は、1つ以上のコンピュータで実現されうる。それら1つ以上のコンピュータのそれぞれは、設計空間削減装置2000を実現するために作成された専用のコンピュータであってもよいし、パーソナルコンピュータ(PC: Personal Computer)、サーバマシン又はモバイルデバイスなどの汎用のコンピュータであってもよい。
【0027】
設計空間削減装置2000は、コンピュータにアプリケーションをインストールすることで実現されうる。そのアプリケーションは、コンピュータを設計空間削減装置2000として機能させるプログラムで実現される。言い換えれば、そのプログラムは、設計空間削減装置2000の機能構成部を実装したものである。
【0028】
図3は、設計空間削減装置2000を実現するコンピュータ1000のハードウエア構成の例を示すブロック図である。
図3において、コンピュータ1000は、バス1020、プロセッサ1040、メモリ1060、ストレージデバイス1080、入出力インタフェース1100、及びネットワークインタフェース1120を有する。
【0029】
バス1020は、プロセッサ1040、メモリ1060、ストレージデバイス1080、入出力インタフェース1100、及びネットワークインタフェース1120が相互にデータの送信及び受信をするためのデータ通信路である。プロセッサ1040は、CPU(Central Processing Unit)、GPU(Graphics Processing Unit)、又は FPGA(Field-Programmable Gate Array)などといったプロセッサである。メモリ1060は、RAM(Random Access Memory)又は ROM(Read Only Memory)などの主記憶要素である。ストレージデバイス1080は、ハードディスク、SSD(Solid State Drive)、又はメモリカードなどの補助記憶要素である。入出力インタフェース1100は、コンピュータ1000と周辺デバイス(キーボード、マウス、又はディスプレイデバイスなど)との間のインタフェースである。ネットワークインタフェース1120は、コンピュータ1000とネットワークとの間のインタフェースである。ネットワークは、LAN(Local Area Network)でもよいし、WAN(Wide Area Network)でもよい。
【0030】
ストレージデバイス1080は、前述したプログラムを格納しうる。CPU1040は、設計空間削減装置2000の各機能構成部を実現するためにそのプログラムを実行する。
【0031】
コンピュータ1000のハードウエア構成は、
図3に示される構成に限定されない。
例えば、前述したように、設計空間削減装置2000は複数のコンピュータで実現されうる。この場合、それらのコンピュータは、ネットワークを介して互いに接続されうる。
【0032】
<処理の流れ>
図4は、設計空間削減装置2000によって実行される処理の流れを表すフローチャートである。オリジナル設計空間情報取得部2020はオリジナル設計空間情報10を取得する(S102)。データセット特徴情報取得部2040はデータセット特徴情報30を取得する(S104)。生成部2060は、オリジナル設計空間情報10及びデータセット特徴情報30に基づいて、カスタマイズ設計空間情報20を生成する(S106)。
【0033】
ここで、設計空間削減装置2000によって実行される処理の流れは、
図4に示されているものに限定されない。例えば、データセット特徴情報30の取得は、オリジナル設計空間情報10の取得と並行又はそれよりも前に行われてもよい。
【0034】
<オリジナル設計空間情報について>
上述したように、ニューラルネットワークを構築する際、考慮すべきニュールネットワークのアーキテクチャの様々な要素がある。例えば、バックボーンブロックの種類、マルチスケール特徴ブロックの種類、及び活性化関数の種類が、
図1に示されている、考慮すべき要素の例である。具体的には、バックボーンブロックの種類は、ResNet50、ResNet101、及び VGG16 などを含みうる。マルチスケール特徴ブロックの種類は、FPN (Feature Pyramid Network) 及び TUM (Thinned U-shape Module) などを含みうる。活性化関数の種類は、ReLU 及び Sigmoid などを含みうる。
【0035】
しかしながら、さらに多くの考慮すべき要素が存在しうる。例えば、レイヤの種類が、考慮すべきニューラルネットワークのアーキテクチャの他の要素でありうる。具体的には、畳み込み層、リカレント層、全結合層、プーリング層、及び正規化層などといった多くの種類のレイヤが、対象ニューラルネットワークの中で採用されうる。そのため、オリジナル設計空間情報10は、これらの全て又は一部を、レイヤの種類の選択肢として含みうる。
【0036】
その他にも例えば、ハイパーパラメータの値が、考慮すべきニューラルネットワークのアーキテクチャの他の要素でありうる。例えば、各種類のレイヤについて、様々なハイパーパラメータがある。畳み込み層については、グループ数、カーネル(フィルタ)数、カーネルサイズ、ストライド、及びダイレーションが、採用されるハイパーパラメータでありうる。リカレント層については、セルタイプ及び出力ノード数が、採用されるハイパーパラメータでありうる。全結合層については、出力ノード数が、採用されるハイパーパラメータでありうる。プーリング層については、カーネルサイズ、ストライド、及びダイレーションが、採用されるハイパーパラメータでありうる。オリジナル設計空間情報10は、これらのハイパーパラメータの全て又は一部について、値の選択肢(例えば、値の範囲)を含みうる。
【0037】
図5は、オリジナル設計空間情報10の例をテーブル形式で表す。オリジナル設計空間情報10は、「要素12」及び「選択肢14」という名称の2つの列を有する。要素12の各セルは、設計空間の要素を含む。選択肢14の各セルは、対応する要素について、1つ以上の選択肢を含む。
【0038】
<オリジナル設計空間情報の取得:S102>
オリジナル設計空間情報取得部2020はオリジナル設計空間情報10を取得する(S102)。オリジナル設計空間情報10を取得する方法は様々である。例えば、オリジナル設計空間情報取得部2020は、オリジナル設計空間情報10が予め格納されており、なおかつ、設計空間削減装置2000からアクセス可能な記憶装置から、オリジナル設計空間情報10を取得する。その他にも例えば、オリジナル設計空間情報取得部2020は、他のコンピュータから送信されたオリジナル設計空間情報10を受信する。
【0039】
<データセット特徴情報について>
対象ニューラルネットワークは、対象データセットに対して正確な解析を行えるように構成されるべきである。そのため、対象ニューラルネットワークにとって適切なアーキテクチャは、対象ニューラルネットワークによって解析されるべき対象データセットの特徴に依存しうる。データセット特徴情報30は、設計空間削減装置2000が対象データセットの特徴を把握できるように、対象データセットの1つ以上の特徴を示す。
【0040】
図6は、データセット特徴情報30をテーブル形式で表す。
図6のデータセット特徴情報30は、「特徴32」及び「値34」という名称の2つの列を含む。特徴32の各セルは、対象データセットの特徴の種類を含む。値34の各セルは、対応する特徴について1つ以上の値を含む。
【0041】
図6に示されるように、対象ニューラルネットワークのアーキテクチャに影響を与えうるデータセットの特徴には、様々な種類がある。例えば、クラスの数、入力データのサイズ、入力データの種類、及び外接矩形のサイズなどである。なお、「入力データ」は、対象データセットに含まれる各データであって、対象ニューラルネットワークに入力されて解析されるべきものである。「クラスの数」という特徴は、対象ニューラルネットワークによって実行されるべきタスクが物体検出や物体分類である場合に、採用されうる。T具体的には、クラスの数は、対象データセット内の入力画像に含まれる物体のクラスの総数を表しうる。例えば、データセット特徴情報30の1つ目のレコードは、対象データセット内の物体のクラスの総数が3であることを表す。
【0042】
「入力データのサイズ」という特徴は、対象データセット内の入力データのサイズを表しうる。例えば、入力データが画像データである場合において、入力データのサイズは、入力画像の列のピクセル数と行のピクセルの数の組み合わせ(例えば、512x320)によって、対象データセット内の入力画像のサイズを表しうる。ここで、対象データセットは、サイズの異なる複数の入力データを含みうる。この場合、入力データのサイズは、それらのサイズをそれぞれ表しうる。例えば、
図6に示されているデータセット特徴情報30の2つ目のレコードは、対象データセットが、512x320 というサイズの入力画像と、1920x1080 というサイズの入力画像を含むことを表す。
【0043】
「入力データの種類」という特徴は、対象データセットに含まれる入力データの種類を表しうる。例えば、画像や音声などである。さらに、入力データの種類は、RGB 画像やグレースケール画像などのように、より詳細な情報を表しうる。例えば、
図6に示されているデータセット特徴情報30の3つ目のレコードは、対象データセットが RGB 画像を含むことを表す。
【0044】
「外接矩形のサイズ」という特徴は、対象データセット内の入力画像に含まれる物体がその中に位置する、外接矩形のサイズを表しうる。この特徴は、対象ニューラルネットワークによって実行されるタスクが物体検出である場合に採用される。ここで、対象データセットは、サイズの異なる複数の物体を含みうる。この場合、外接矩形のサイズは、これらのサイズのそれぞれを表しうる。例えば、
図6に示されているデータセット特徴情報30の4つ目のレコードは、外接矩形のサイズの値として、「30x30」、「30x40」、及び「70x80」を含む。
【0045】
数値の特徴(例えば、クラスの数、入力データのサイズ、及び外接矩形のサイズ)を表す方法は、上述した方法に限定されない。例えば、数値の特徴は、相対的な態様(例えば、小さい、中程度、大きいなど)で表されうる。例えば、クラスの数 Nc が、10<=Nc である場合には大きいと考えられ、5<=Nc<10 である場合には中程度であると考えられ、Nc<5 である場合には小さいと考えられるとする。この場合、
図6に示されているクラスの数は、「3」の代わりに「小さい」と記載されうる。
【0046】
さらに、数値の特徴は、ヒストグラムや確率質量関数などといった分布で表されうる。クラスの数の分布は、複数のクラスそれぞれについて、対象データセットに含まれる物体の数を表す。例えば対象データセットが、クラス C1 に属する20個の物体、クラス C2 に属する40個の物体、クラス C3 に属する10個の物体を含むとする。この場合、クラスの数の分布は、
図6のデータセット特徴情報30の5つ目のレコードに示されているように、Hc={C1: 20, C2: 40, C3: 10} というヒストグラムを表しうる。
【0047】
入力データのサイズの分布は、複数のサイズそれぞれについて、入力データの数を表しうる。例えば対象データセットが、「512x30」というサイズの入力データを20個、及び、「1920x1080」というサイズの入力データを70個含むとする。この場合、入力データのサイズの分布は、
図6のデータセット特徴情報30の6つ目のレコードに示されているように、Hsi={512x30: 20, 1920x1080: 70} というヒストグラムを表しうる。
【0048】
外接矩形のサイズの分布は、外接矩形の各サイズについて、入力データの数を表しうる。例えば対象データセットが、その外接矩形のサイズが「30x30」である物体を40個、その外接矩形のサイズが「30x40」である物体を10個、及び、その外接矩形のサイズが「70x80」である物体を10個含むとする。この場合、外接矩形のサイズの分布は、
図6のデータセット特徴情報30の7つ目のレコードに示されているように、Hsb={30x30: 40, 30x40: 10, 70x80: 60} というヒストグラムを表しうる。
【0049】
特徴の分布も、相対的な態様で表されうる。例えば、外接矩形の数 Nb が、50<=Nb では大きいと考えられ、20<=Nb<50 では中程度と考えられ、Nb<20 では小さいと考えられるとする。この場合、前述したヒストグラム Hsb ={30x30: 40, 30x40: 10, 70x80: 60} は、ヒストグラム Hsb={30x3: 2, 30x40: 1, 70x80: 3} に変換できる。ここで、大きいは 3 で表され、中程度は 2 で表され、小さいは 1 で表される。
【0050】
なお、ヒストグラムは、0-1 スケーリング、平均値が0で分散が1であるガウス分布への正規化、パーセンテージや割合などといった他の手法によって変換されうる。
【0051】
さらに、前述したデータセットの特徴に加え、データセット特徴情報30は、対象データセットに対して実行されるべきタスクの種類を含みうる。タスクの種類は、物体検出や物体分類などを含みうる。
【0052】
<データセット特徴情報の取得:S104>
データセット特徴情報取得部2040はデータセット特徴情報30を取得する(S104)。データセット特徴情報30を取得する方法は様々である。例えば、データセット特徴情報取得部2040は、データセット特徴情報30が予め格納されており、なおかつ、設計空間削減装置2000からアクセス可能な記憶装置から、データセット特徴情報30を取得する。その他にも例えば、データセット特徴情報取得部2040は、他の装置から送信されたデータセット特徴情報30を受信する。
【0053】
その他にも例えば、データセット特徴情報30は、設計空間削減装置2000自体によって生成されてもよい。この場合、例えばデータセット特徴情報取得部2040は、設計空間削減装置2000によって管理されている記憶装置(例えばストレージデバイス1080)からデータセット特徴情報30を取得する。
【0054】
設計空間削減装置2000によってデータセット特徴情報30が生成される場合、設計空間削減装置2000は、対象データセットの特徴と同じ又は同様の特徴を持つデータセットを取得しうる。以下、データセット特徴情報30を生成するために設計空間削減装置2000によって取得されるデータセットは、「代表データセット」と記載される。設計空間削減装置2000は、代表データセットを解析し、代表データセットの特徴を特定し、代表データセットの特徴を表すデータセット特徴情報30を、対象データセットのデータセット特徴情報30として生成する。
【0055】
代表データセットの特徴の特定は、既存の手法を利用して行うことができる。例えば「クラスの数」という特徴について、設計空間削減装置2000は、代表データセット内の各入力データに対してオブジェクト分類を実行することで、代表データセットから検出される物体のクラスの数を特定しうる。「入力データのサイズ」という特徴について、設計空間削減装置2000は、各入力データにおいてそのサイズを示すメタデータを抽出することにより、代表データセット内の入力データの1つ以上のサイズを特定しうる。「入力データの種類」という特徴について、設計空間削減装置2000は、各入力データにおいてその種類を示すメタデータを抽出することにより、代表データセット内の入力データの1つ以上の種類を特定しうる。「外接矩形のサイズ」という特徴について、設計空間削減装置2000は、代表データセット内の各入力データに対して物体検出を行うことにより、対象データセットから検出される物体がそれぞれ含まれる外接矩形の1つ以上のサイズを特定しうる。
【0056】
<カスタマイズ設計空間情報の生成:S106>
生成部2060は、オリジナル設計空間情報10及びデータセット特徴情報30に基づいてカスタマイズ設計空間情報20を生成する(S106)。ここで、カスタマイズ設計空間情報20は、
図5に示されるオリジナル設計空間情報10と同様の構造を持ちうる。
【0057】
理論的には、カスタマイズ設計空間は、対象データセットの特徴に基づいてオリジナル設計空間を縮めることにより、生成することができる。以下、カスタマイズ設計空間情報20の生成方法のいくつかの例が説明される。
【0058】
<<事前知識の利用>>
例えば生成部2060は、オリジナル設計空間情報10を事前知識と比較することにより、カスタマイズ設計空間情報20を生成しうる。事前知識は、データセットの特徴と、当該対応する特徴を持つデータセットを解析するニューラルネットワークに適した、ニューラルネットワークのアーキテクチャの設計空間と、の対応関係を表しうる。
【0059】
図7は、事前知識をテーブル形式で表す。以下、
図7に示されるテーブルは、「知識テーブル40」と記載される。知識テーブル40は、「データセット特徴42」及び「設計空間44」という名称の2つの列を有する。設計空間44は、対応するデータセット特徴42に表されている特徴のデータセットを扱う対象ニューラルネットワークに適した、設計空間を表す。ここで、知識テーブル40において、[Na,Nb] という表現は、Na 以上 Nb 以下という範囲を表す。
【0060】
生成部2060は、データセット特徴情報30に示されている対象データセットの特徴とマッチするデータセット特徴42を持つ 知識テーブル40のレコードを特定する。そして、生成部2060は、特定されたレコードの設計空間44の内容を表す、カスタマイズ設計空間情報20を生成する。
【0061】
ここで、知識テーブル40は、オリジナル設計空間情報10に示されていない要素や要素の選択肢を含みうる。この場合、生成部2060は、それらの情報をカスタマイズ設計空間情報20に含めない。言い換えれば、生成部2060は、知識テーブル40とオリジナル設計空間情報10の双方に含まれる要素や要素の選択肢のみを、カスタマイズ設計空間情報20に含める。これは、カスタマイズ設計空間情報20が、オリジナル設計空間と、知識テーブルから得られる設計空間との積として生成されることを意味する。
【0062】
例えば、データセット特徴情報30にマッチすると特定されたデータ特徴102を持つ、知識テーブル40のレコードの設計空間44が、「バックボーンネットワーク」、「マルチスケールブロック」、及び「活性化関数」を含むとする。一方で、オリジナル設計空間情報10は、「バックボーンネットワーク」とマルチスケールブロック」を含むものの、「活性化関数」を含まない。この場合、生成部2060は、「活性化関数」という要素をカスタマイズ設計空間情報20に含めない。
【0063】
さらに、設計空間44におけるマルチスケールブロックの選択肢が「msb1」、「msb2」、及び「msb4」である一方で、カスタマイズ設計空間情報20における選択肢が「msb1」、「msb2」、及び「msb3」であるとする。この場合、msb4 は、設計空間44に含まれるものの、カスタマイズ設計空間情報20には含まれない。そのため、生成部2060は、msb4 をカスタマイズ設計空間情報20に含めない。
【0064】
<<機械学習ベースの方法>>
その他にも例えば、カスタマイズ設計空間情報20の生成方法として、機械学習ベースの方法が採用されうる。この場合、データセットの特徴を得てカスタマイズ設計空間を出力するように構成されたモデルが、予め用意される。このモデルは、データセットの特徴と正解のカスタマイズ設計空間とを対応づける訓練データセットを用いて、予め訓練されうる。カスタマイズ設計空間情報20を生成できるモデルには、ニューラルネットワーク、サポートベクターマシン(SVM: support vector machine)、及び k 近傍法などの様々な種類のモデルがある。
【0065】
生成部2060は、データセット特徴情報30に含まれている対象データセットの特徴を、モデルに入力する。対象データセットの特徴がモデルに入力されたことに応じて、モデルは、カスタマイズ設計空間を出力する。そして、生成部2060は、モデルから出力されたカスタマイズ設計空間を表す20を生成する。しかしながら、生成部2060は、モデルから出力されたカスタマイズ設計空間とオリジナル設計空間情報10の双方に含まれる要素又は要素の選択肢のみを、カスタマイズ設計空間情報20に含める。これは、カスタマイズ設計空間が、オリジナル設計空間とモデルから得られた設計空間との積として生成されることを意味する。
【0066】
<設計空間削減装置2000の出力>
設計空間削減装置2000は、任意の態様でカスタマイズ設計空間情報20を出力しうる。例えば設計空間削減装置2000は、カスタマイズ設計空間情報20を記憶装置に格納しうる。その他にも例えば、設計空間削減装置2000は、カスタマイズ設計空間情報20を他のコンピュータに送信しうる。
【0067】
<カスタマイズ設計空間情報の利用例>
カスタマイズ設計空間情報20は、対象ニューラルネットワークのアーキテクチャの自動生成に利用されうる。ニューラルアーキテクチャ探索(NAS: Neural Architecture Search)は、所定の設計空間に基づいてニューラルネットワークのアーキテクチャを自動的に決定する技術である。基本として、NAS は、「設計空間からニューラルネットワークのアーキテクチャをサンプルする。所定の目的関数にに基づいて、サンプル下アーキテクチャを評価する。」というタスク列を、評価結果が所定の条件を満たすまで繰り返す。サンプルしたアーキテクチャの評価は、サンプルしたアーキテクチャを持つニューラルネットワークの訓練が必要なため、時間がかかるタスクである。
【0068】
所定の設計空間が広いと、NAS システムは、上述したタスク列を多くの回数繰り返す必要がある。そのため、設計空間から対象ニューラルネットワークに適したアーキテクチャを見つけ出すために、NAS システムは多くの時間を要する。この理由から、NAS システムに対して設計空間を提供する前に、設計空間を狭めることが好ましい。しかしながら、前述したように、慎重な考え無しに設計空間を狭めると、対象ニューラルネットワークに適したアーキテクチャが設計空間から除かれてしまい、対象ニューラルネットワークに適したアーキテクチャを見つけられなくなってしまう可能性がある。
【0069】
設計空間削減装置2000によれば、対象データセットの特徴を考慮した上で、オリジナル設計空間が狭められる。そのため、対象ニューラルネットワークに適したアーキテクチャを設計空間に保持しながら、設計空間を狭めることができる。結果として、設計空間削減装置2000によって提供されるカスタマイズ設計空間を利用する場合、NAS システムは、オリジナル設計空間を利用する場合よりも短い時間で、対象ニューラルネットワークに適したアーキテクチャを見つけることができる。
【0070】
実施形態を参照して本開示について説明されているが、本開示は上述した実施形態に限定されない。発明の範囲内で、当業者が理解できる種々の変形を本開示の構成や詳細に対して行うことができる。
【0071】
上記の実施形態の一部又は全部は、以下の付記のようにも記載されうるが、以下には限られない。
<付記>
(付記1)
少なくとも一つのプロセッサと、
命令を格納している記憶要素とを有し、
前記少なくとも一つのプロセッサは、前記命令を実行することにより、
対象ニューラルネットワークのアーキテクチャのオリジナル設計空間を表すオリジナル設計空間情報を取得し、
前記対象ニューラルネットワークの解析対象のデータの集合である対象データセットの特徴を表すデータセット特徴情報を取得し、
前記オリジナル設計空間情報と前記データセット特徴情報とを用いて、前記対象ニューラルネットワークの前記アーキテクチャのカスタマイズ設計空間を表すカスタマイズ設計空間情報を生成するように構成され、
前記カスタマイズ設計空間は、前記オリジナル設計空間よりも狭い設計空間である、設計空間削減装置。
(付記2)
前記オリジナル設計空間情報は、前記対象ニューラルネットワークの前記アーキテクチャの1つ以上の要素それぞれについて、複数の選択肢を含み、
前記カスタマイズ設計空間情報の生成は、
前記1つ以上の要素についての前記選択肢の一部を抽出することと、
前記1つ以上の要素についての前記選択肢の前記抽出された一部が含まれる前記カスタマイズ設計空間情報を生成することとを含む、付記1に記載の設計空間削減装置。
(付記3)
前記カスタマイズ設計空間情報の生成は、
データセットの特徴とニューラルネットワークのアーキテクチャの設計空間との対応付けを複数表す事前知識を取得することと、
前記データセット特徴情報によって表されている前記対象データセットの前記特徴とマッチする前記データセットの特徴と対応づけられている前記設計空間を、前記事前知識から抽出することと、
前記事前知識から抽出された前記設計空間と、前記オリジナル設計空間情報によって表されている前記オリジナル設計空間とに基づいて、前記カスタマイズ設計空間情報を生成することとを含む、付記1又は2に記載の設計空間削減装置。
(付記4)
前記記憶要素はモデルを格納するようにさらに構成され、
前記モデルは、前記対象データセットの前記特徴を取得し、前記モデルに対して前記対象データセットの特徴が入力されたことに応じて設計空間を出力し、
前記カスタマイズ設計空間情報の生成は、
前記データセット特徴情報によって表されている前記対象データセットの前記特徴を前記モデルに入力することと、
前記モデルから出力された前記設計空間を取得することと、
前記モデルから出力された前記設計空間と、前記オリジナル設計空間情報によって表されている前記オリジナル設計空間とに基づいて、前記カスタマイズ設計空間情報を生成することとを含む、付記1又は2に記載の設計空間削減装置。
(付記5)
前記少なくとも一つのプロセッサは、
前記対象データセットの前記特徴と類似又は同一の特徴を持つ代表データセットを取得することと、
前記代表データセットの特徴を特定して、前記代表データセットの前記特定された特徴を前記対象データセットの前記特徴として表す前記データセット特徴情報を生成することと、を実行するようにさらに構成される、付記1から4いずれか一項に記載の設計空間削減装置。
(付記6)
前記対象データセットの前記特徴は、クラスの数、入力データのサイズ、入力データの種類、外接矩形のサイズ、クラスの分布、入力データの前記サイズの分布、又は外接矩形の前記サイズの分布を含む、付記1から5いずれか一項に記載の設計空間削減装置。
(付記7)
対象ニューラルネットワークのアーキテクチャのオリジナル設計空間を表すオリジナル設計空間情報を取得することと、
前記対象ニューラルネットワークの解析対象のデータの集合である対象データセットの特徴を表すデータセット特徴情報を取得することと、
前記オリジナル設計空間情報と前記データセット特徴情報とを用いて、前記対象ニューラルネットワークの前記アーキテクチャのカスタマイズ設計空間を表すカスタマイズ設計空間情報を生成することと、を含み、
前記カスタマイズ設計空間は、前記オリジナル設計空間よりも狭い設計空間である、コンピュータによって実行される制御方法。
(付記8)
前記オリジナル設計空間情報は、前記対象ニューラルネットワークの前記アーキテクチャの1つ以上の要素それぞれについて、複数の選択肢を含み、
前記カスタマイズ設計空間情報の生成は、
前記1つ以上の要素についての前記選択肢の一部を抽出することと、
前記1つ以上の要素についての前記選択肢の前記抽出された一部が含まれる前記カスタマイズ設計空間情報を生成することとを含む、付記7に記載の制御方法。
(付記9)
前記カスタマイズ設計空間情報の生成は、
データセットの特徴とニューラルネットワークのアーキテクチャの設計空間との対応付けを複数表す事前知識を取得することと、
前記データセット特徴情報によって表されている前記対象データセットの前記特徴とマッチする前記データセットの特徴と対応づけられている前記設計空間を、前記事前知識から抽出することと、
前記事前知識から抽出された前記設計空間と、前記オリジナル設計空間情報によって表されている前記オリジナル設計空間とに基づいて、前記カスタマイズ設計空間情報を生成することとを含む、付記7又は8に記載の制御方法。
(付記10)
前記コンピュータは、モデルを格納するように構成され、
前記モデルは、前記対象データセットの前記特徴を取得し、前記モデルに対して前記対象データセットの特徴が入力されたことに応じて設計空間を出力し、
前記カスタマイズ設計空間情報の生成は、
前記データセット特徴情報によって表されている前記対象データセットの前記特徴を前記モデルに入力することと、
前記モデルから出力された前記設計空間を取得することと、
前記モデルから出力された前記設計空間と、前記オリジナル設計空間情報によって表されている前記オリジナル設計空間とに基づいて、前記カスタマイズ設計空間情報を生成することとを含む、付記7又は8に記載の制御方法。
(付記11)
前記対象データセットの前記特徴と類似又は同一の特徴を持つ代表データセットを取得することと、
前記代表データセットの特徴を特定して、前記代表データセットの前記特定された特徴を前記対象データセットの前記特徴として表す前記データセット特徴情報を生成することと、をさらに含む、付記7から10いずれか一項に記載の制御方法。
(付記12)
前記対象データセットの前記特徴は、クラスの数、入力データのサイズ、入力データの種類、外接矩形のサイズ、クラスの分布、入力データの前記サイズの分布、又は外接矩形の前記サイズの分布を含む、付記7から11いずれか一項に記載の制御方法。
(付記13)
対象ニューラルネットワークのアーキテクチャのオリジナル設計空間を表すオリジナル設計空間情報を取得することと、
前記対象ニューラルネットワークの解析対象のデータの集合である対象データセットの特徴を表すデータセット特徴情報を取得することと、
前記オリジナル設計空間情報と前記データセット特徴情報とを用いて、前記対象ニューラルネットワークの前記アーキテクチャのカスタマイズ設計空間を表すカスタマイズ設計空間情報を生成することと、をコンピュータに実行させるプログラムが格納されており、
前記カスタマイズ設計空間は、前記オリジナル設計空間よりも狭い設計空間である、コンピュータ可読記憶媒体。
(付記14)
前記オリジナル設計空間情報は、前記対象ニューラルネットワークの前記アーキテクチャの1つ以上の要素それぞれについて、複数の選択肢を含み、
前記カスタマイズ設計空間情報の生成は、
前記1つ以上の要素についての前記選択肢の一部を抽出することと、
前記1つ以上の要素についての前記選択肢の前記抽出された一部が含まれる前記カスタマイズ設計空間情報を生成することとを含む、付記13に記載の記憶媒体。
(付記15)
前記カスタマイズ設計空間情報の生成は、
データセットの特徴とニューラルネットワークのアーキテクチャの設計空間との対応付けを複数表す事前知識を取得することと、
前記データセット特徴情報によって表されている前記対象データセットの前記特徴とマッチする前記データセットの特徴と対応づけられている前記設計空間を、前記事前知識から抽出することと、
前記事前知識から抽出された前記設計空間と、前記オリジナル設計空間情報によって表されている前記オリジナル設計空間とに基づいて、前記カスタマイズ設計空間情報を生成することとを含む、付記13又は14に記載の記憶媒体。
(付記16)
モデルをさらに格納するように構成され、
前記モデルは、前記対象データセットの前記特徴を取得し、前記モデルに対して前記対象データセットの特徴が入力されたことに応じて設計空間を出力し、
前記カスタマイズ設計空間情報の生成は、
前記データセット特徴情報によって表されている前記対象データセットの前記特徴を前記モデルに入力することと、
前記モデルから出力された前記設計空間を取得することと、
前記モデルから出力された前記設計空間と、前記オリジナル設計空間情報によって表されている前記オリジナル設計空間とに基づいて、前記カスタマイズ設計空間情報を生成することとを含む、付記13又は14に記載の制御方法。
(付記17)
前記プログラムは、前記コンピュータに、
前記対象データセットの前記特徴と類似又は同一の特徴を持つ代表データセットを取得することと、
前記代表データセットの特徴を特定して、前記代表データセットの前記特定された特徴を前記対象データセットの前記特徴として表す前記データセット特徴情報を生成することと、をさらに実行させる、付記13から16いずれか一項に記載の記憶媒体。
(付記18)
前記対象データセットの前記特徴は、クラスの数、入力データのサイズ、入力データの種類、外接矩形のサイズ、クラスの分布、入力データの前記サイズの分布、又は外接矩形の前記サイズの分布を含む、付記13から17いずれか一項に記載の記憶媒体。
【符号の説明】
【0072】
10 オリジナル設計空間情報
12 要素
14 選択肢
20 カスタマイズ設計空間情報
30 データセット特徴情報
32 特徴
34 値
40 知識テーブル
42 データセット特徴
44 設計空間
1000 コンピュータ
1020 バス
1040 プロセッサ
1060 メモリ
1080 ストレージデバイス
1100 入出力インタフェース
1120 ネットワークインタフェース
2000 設計空間削減装置
2020 オリジナル設計空間情報取得部
2040 データセット特徴情報取得部
2060 生成部
【手続補正書】
【提出日】2023-06-13
【手続補正1】
【補正対象書類名】特許請求の範囲
【補正対象項目名】全文
【補正方法】変更
【補正の内容】
【特許請求の範囲】
【請求項1】
対象ニューラルネットワークのアーキテクチャのオリジナル設計空間を表すオリジナル設計空間情報を取得し、
前記対象ニューラルネットワークの解析対象のデータの集合である対象データセットの特徴を表すデータセット特徴情報を取得し、
前記オリジナル設計空間情報と前記データセット特徴情報とを用いて、前記対象ニューラルネットワーク
のアーキテクチャのカスタマイズ設計空間を表すカスタマイズ設計空間情報を生成
し、
前記カスタマイズ設計空間は、前記オリジナル設計空間よりも狭い設計空間である、設計空間削減装置。
【請求項2】
前記オリジナル設計空間情報は、前記対象ニューラルネットワーク
のアーキテクチャの1つ以上の要素それぞれについて、複数の選択肢を含み、
前記カスタマイズ設計空間情報の生成は、
前記1つ以上の要素についての前記選択肢の一部を抽出することと、
前記1つ以上の要素についての前記選択肢の前記抽出された一部が含まれる前記カスタマイズ設計空間情報を生成することとを含む、請求項1に記載の設計空間削減装置。
【請求項3】
前記カスタマイズ設計空間情報の生成は、
データセットの特徴とニューラルネットワークのアーキテクチャの設計空間との対応付けを複数表す事前知識を取得することと、
前記データセット特徴情報によって表されている前記対象データセット
の特徴とマッチする前記データセットの特徴と対応づけられている前記設計空間を、前記事前知識から抽出することと、
前記事前知識から抽出された前記設計空間と、前記オリジナル設計空間情報によって表されている前記オリジナル設計空間とに基づいて、前記カスタマイズ設計空間情報を生成することとを含む、請求項1又は2に記載の設計空間削減装置。
【請求項4】
前記対象データセットの特徴が入力されたことに応じて設計空間を出力
するモデルを有し、
前記カスタマイズ設計空間情報の生成は、
前記データセット特徴情報によって表されている前記対象データセット
の特徴を前記モデルに入力することと、
前記モデルから出力された前記設計空間を取得することと、
前記モデルから出力された前記設計空間と、前記オリジナル設計空間情報によって表されている前記オリジナル設計空間とに基づいて、前記カスタマイズ設計空間情報を生成することとを含む、請求項1又は2に記載の設計空間削減装置。
【請求項5】
前記対象データセット
の特徴と類似又は同一の特徴を持つ代表データセットを取得
し、
前記代表データセットの特徴を特定して、前記代表データセットの前記特定された特徴を前記対象データセット
の特徴として表す前記データセット特徴情報を生成す
る、請求項1から4いずれか一項に記載の設計空間削減装置。
【請求項6】
前記対象データセット
の特徴は、クラスの数、入力データのサイズ、入力データの種類、外接矩形のサイズ、クラスの分布、入力データ
のサイズの分布、又は外接矩形
のサイズの分布を含む、請求項1から5いずれか一項に記載の設計空間削減装置。
【請求項7】
対象ニューラルネットワークのアーキテクチャのオリジナル設計空間を表すオリジナル設計空間情報を取得することと、
前記対象ニューラルネットワークの解析対象のデータの集合である対象データセットの特徴を表すデータセット特徴情報を取得することと、
前記オリジナル設計空間情報と前記データセット特徴情報とを用いて、前記対象ニューラルネットワーク
のアーキテクチャのカスタマイズ設計空間を表すカスタマイズ設計空間情報を生成することと、を含み、
前記カスタマイズ設計空間は、前記オリジナル設計空間よりも狭い設計空間である、コンピュータによって実行される制御方法。
【請求項8】
前記オリジナル設計空間情報は、前記対象ニューラルネットワーク
のアーキテクチャの1つ以上の要素それぞれについて、複数の選択肢を含み、
前記カスタマイズ設計空間情報の生成は、
前記1つ以上の要素についての前記選択肢の一部を抽出することと、
前記1つ以上の要素についての前記選択肢の前記抽出された一部が含まれる前記カスタマイズ設計空間情報を生成することとを含む、請求項7に記載の制御方法。
【請求項9】
対象ニューラルネットワークのアーキテクチャのオリジナル設計空間を表すオリジナル設計空間情報を取得することと、
前記対象ニューラルネットワークの解析対象のデータの集合である対象データセットの特徴を表すデータセット特徴情報を取得することと、
前記オリジナル設計空間情報と前記データセット特徴情報とを用いて、前記対象ニューラルネットワーク
のアーキテクチャのカスタマイズ設計空間を表すカスタマイズ設計空間情報を生成することと、をコンピュータに実行させるプログラ
ム。
【請求項10】
前記オリジナル設計空間情報は、前記対象ニューラルネットワーク
のアーキテクチャの1つ以上の要素それぞれについて、複数の選択肢を含み、
前記カスタマイズ設計空間情報の生成は、
前記1つ以上の要素についての前記選択肢の一部を抽出することと、
前記1つ以上の要素についての前記選択肢の前記抽出された一部が含まれる前記カスタマイズ設計空間情報を生成することとを含む、請求項
9に記載の
プログラム。
【手続補正3】
【補正対象書類名】明細書
【補正対象項目名】0016
【補正方法】変更
【補正の内容】
【0016】
具体的には、設計空間削減装置2000は、オリジナル設計空間情報10とカスタマイズ設計空間情報20を取得する。オリジナル設計空間情報10は、対象ニューラルネットワークのアーキテクチャのオリジナル設計空間を表す。具体的には、オリジナル設計空間情報10は、対象ニューラルネットワークのアーキテクチャの1つ以上の各要素について、1つ以上の選択肢を示す。
【手続補正4】
【補正対象書類名】明細書
【補正対象項目名】0030
【補正方法】変更
【補正の内容】
【0030】
ストレージデバイス1080は、前述したプログラムを格納しうる。プロセッサ1040は、設計空間削減装置2000の各機能構成部を実現するためにそのプログラムを実行する。
【手続補正5】
【補正対象書類名】明細書
【補正対象項目名】0055
【補正方法】変更
【補正の内容】
【0055】
代表データセットの特徴の特定は、既存の手法を利用して行うことができる。例えば「クラスの数」という特徴について、設計空間削減装置2000は、代表データセット内の各入力データに対してオブジェクト分類を実行することで、代表データセットから検出される物体のクラスの数を特定しうる。「入力データのサイズ」という特徴について、設計空間削減装置2000は、各入力データにおいてそのサイズを示すメタデータを抽出することにより、代表データセット内の入力データの1つ以上のサイズを特定しうる。「入力データの種類」という特徴について、設計空間削減装置2000は、各入力データにおいてその種類を示すメタデータを抽出することにより、代表データセット内の入力データの1つ以上の種類を特定しうる。「外接矩形のサイズ」という特徴について、設計空間削減装置2000は、代表データセット内の各入力データに対して物体検出を行うことにより、代表データセットから検出される物体がそれぞれ含まれる外接矩形の1つ以上のサイズを特定しうる。
【手続補正6】
【補正対象書類名】明細書
【補正対象項目名】0062
【補正方法】変更
【補正の内容】
【0062】
例えば、データセット特徴情報30にマッチすると特定されたデータセット特徴42を持つ、知識テーブル40のレコードの設計空間44が、「バックボーンネットワーク」、「マルチスケールブロック」、及び「活性化関数」を含むとする。一方で、オリジナル設計空間情報10は、「バックボーンネットワーク」とマルチスケールブロック」を含むものの、「活性化関数」を含まない。この場合、生成部2060は、「活性化関数」という要素をカスタマイズ設計空間情報20に含めない。
【国際調査報告】