特許7586079 | 知財ポータル「IP Force」

知財求人 - 知財ポータルサイト「IP Force」

青山学院大学 (神奈川県相模原市中央区淵野辺)

▶ ソニー株式会社の特許一覧

特許7586079情報処理方法、情報処理装置、およびプログラム

書誌要約請求の範囲詳細な説明課題実施例実施するための形態図面の説明

目に優しい文字サイズ小中大 PDF Top

< >

1
2
3
4
5
6
7
8
9
10
11
12
13
14
15
16
17
18
19
20
21
22
23
24
25
26
27

(19)【発行国】日本国特許庁(JP)

(12)【公報種別】特許公報(B2)

(11)【特許番号】

(24)【登録日】2024-11-11

(45)【発行日】2024-11-19

(54)【発明の名称】情報処理方法、情報処理装置、およびプログラム

(51)【国際特許分類】

G06N 3/10 20060101AFI20241112BHJP

G06N 3/0985 20230101ALI20241112BHJP

【ＦＩ】

G06N3/10

G06N3/0985

【請求項の数】 19

(21)【出願番号】P 2021533930

(86)(22)【出願日】2020-07-09

(86)【国際出願番号】 JP2020026866

(87)【国際公開番号】W WO2021014986

(87)【国際公開日】2021-01-28

【審査請求日】2023-05-12

(31)【優先権主張番号】P 2019134599

(32)【優先日】2019-07-22

(33)【優先権主張国・地域又は機関】JP

(73)【特許権者】

【識別番号】000002185

【氏名又は名称】ソニーグループ株式会社

(74)【代理人】

【識別番号】100121131

【弁理士】

【氏名又は名称】西川孝

(74)【代理人】

【氏名又は名称】稲本義雄

(74)【代理人】

【識別番号】100168686

【弁理士】

【氏名又は名称】三浦勇介

(72)【発明者】

【氏名】八島拓也

【審査官】多賀実

(56)【参考文献】

【文献】国際公開第２０１９／０３５３６４（ＷＯ，Ａ１）

【文献】国際公開第２０１７／１５４２８４（ＷＯ，Ａ１）

【文献】米国特許第１０２２９３５６（ＵＳ，Ｂ１）

【文献】GARG, Utsav et al.，"Fabrik: An Online Collaborative Neural Network Editor"，arXiv.org [online]，arXiv:1810.11649v1，米国，Cornell University，2018年，pp.1-12，[検索日 2020.10.05], インターネット:<https://arxiv.org/pdf/1810.11649v1>

【文献】WISTUBA, Martin et al.，"A Survey on Neural Architecture Search"，arXiv.org [online]，arXiv:1905.01392v2，米国，Cornell University，2019年06月，pp.1-53，[検索日 2020.10.05], インターネット:<https://arxiv.org/pdf/1905.01392v2>

(58)【調査した分野】(Int.Cl.，ＤＢ名)

Ｇ０６Ｎ３／００－９９／００

(57)【特許請求の範囲】

【請求項1】

情報処理装置が、
ユーザによるタスクの選択を受け付け、
前記タスクの学習に用いられる入力データを取得し、
選択された前記タスクと、取得された前記入力データに応じた構造のニューラルネットワークをデフォルトモデルとして表示し、
前記ニューラルネットワークの構造探索手法の選択肢として、前記タスクと前記入力データに応じた前記構造探索手法を優先的に表示する
情報処理方法。

【請求項2】

前記タスクと前記入力データに加えて、前記情報処理装置のハードウェア情報に応じた構造の前記ニューラルネットワークを前記デフォルトモデルとして表示する
請求項１に記載の情報処理方法。

【請求項3】

前記ハードウェア情報は、プロセッサの処理能力に関する情報である
請求項２に記載の情報処理方法。

【請求項4】

前記ハードウェア情報は、プロセッサの数に関する情報である
請求項２に記載の情報処理方法。

【請求項5】

前記デフォルトモデルとともに、前記デフォルトモデルの探索空間のサイズおよび計算量の少なくともいずれかを表示する
請求項１に記載の情報処理方法。

【請求項6】

前記ユーザによる前記デフォルトモデルの変更を受け付ける
請求項１に記載の情報処理方法。

【請求項7】

前記デフォルトモデルへの演算層の追加を受け付ける
請求項６に記載の情報処理方法。

【請求項8】

前記タスクと前記入力データに加えて、前記情報処理装置のハードウェア情報に応じた前記構造探索手法を優先的に表示する
請求項１から７のいずれかに記載の情報処理方法。

【請求項9】

前記選択肢の中から前記ユーザにより選択された前記構造探索手法の設定の入力を受け付ける
請求項１から７のいずれかに記載の情報処理方法。

【請求項10】

前記選択肢の中から前記ユーザにより選択された前記構造探索手法に応じて、構造探索に要する予測時間を表示する
請求項１から７のいずれかに記載の情報処理方法。

【請求項11】

前記選択肢の中から前記ユーザにより選択された前記構造探索手法に基づいた構造探索を実行し、
探索された構造の前記ニューラルネットワークを表示する
請求項１から７のいずれかに記載の情報処理方法。

【請求項12】

前記ニューラルネットワークにおいて前記ユーザにより選択された演算層を構造探索の対象とする
請求項１１に記載の情報処理方法。

【請求項13】

前記ニューラルネットワークに含まれるセルを構造探索の対象とする
請求項１１に記載の情報処理方法。

【請求項14】

前記ニューラルネットワークの圧縮手法の選択をさらに受け付ける
請求項１に記載の情報処理方法。

【請求項15】

前記ニューラルネットワークの演算層について、前記ユーザに選択された指標毎に圧縮条件の設定を受け付ける
請求項１４に記載の情報処理方法。

【請求項16】

選択された前記圧縮手法での前記ニューラルネットワークの圧縮を実行し、
前記演算層の圧縮結果を表示する
請求項１５に記載の情報処理方法。

【請求項17】

前記ユーザに選択された指標について、前記演算層の圧縮率を表示する
請求項１６に記載の情報処理方法。

【請求項18】

ユーザによるタスクの選択を受け付ける受付部と、
前記タスクの学習に用いられる入力データを取得する取得部と、
選択された前記タスクと、取得された前記入力データに応じた構造のニューラルネットワークをデフォルトモデルとして表示する表示制御部と
を備え、
前記表示制御部は、前記ニューラルネットワークの構造探索手法の選択肢として、前記タスクと前記入力データに応じた前記構造探索手法を優先的に表示する
情報処理装置。

【請求項19】

コンピュータに、
ユーザによるタスクの選択を受け付け、
前記タスクの学習に用いられる入力データを取得し、
選択された前記タスクと、取得された前記入力データに応じた構造のニューラルネットワークをデフォルトモデルとして表示し、
前記ニューラルネットワークの構造探索手法の選択肢として、前記タスクと前記入力データに応じた前記構造探索手法を優先的に表示する
処理を実行させるためのプログラム。

【発明の詳細な説明】

【技術分野】

【0001】

本開示は、情報処理方法、情報処理装置、およびプログラムに関し、特に、所望のタスクに対応したニューラルネットワークの設計を容易に行うことができるようにした情報処理方法、情報処理装置、およびプログラムに関する。

【背景技術】

【0002】

従来、深層学習に用いられるニューラルネットワークが知られている。その中で、複数の候補の中から最適解を探索するための種々の手法が提案されている。

【0003】

例えば、特許文献１には、評価済のニューラルネットワークから生成した、ネットワーク構造の異なる別のニューラルネットワークの評価結果に基づいて、評価済のニューラルネットワークの最適解を更新する情報処理装置が開示されている。特許文献１に記載の情報処理方法によれば、環境に応じたネットワーク構造をより効率的に探索することができる。

【0004】

また近年、深層学習に用いられるニューラルネットワーク（深層学習モデル）を設計することなく、入力データとラベルを与えるだけで、画像認識向けの深層学習モデルを自動的に設計してくれるサービスも提供されている。

【先行技術文献】

【特許文献】

【0005】

【文献】国際公開第２０１７／１５４２８４号

【発明の概要】

【発明が解決しようとする課題】

【0006】

深層学習が適用可能なタスクは、画像認識の他、生成モデル、超解像、音声／言語処理など多数存在する。

【0007】

しかしながら、現在提供されているニューラルネットワークの設計手法は、画像認識を目的としたものが主流で、他のタスクに対応したニューラルネットワークの設計を行うことは考えられていなかった。

【0008】

本開示は、このような状況に鑑みてなされたものであり、所望のタスクに対応したニューラルネットワークの設計を容易に行うことができるようにするものである。

【課題を解決するための手段】

【0009】

本開示の情報処理方法は、情報処理装置が、ユーザによるタスクの選択を受け付け、前記タスクの学習に用いられる入力データを取得し、選択された前記タスクと、取得された前記入力データに応じた構造のニューラルネットワークをデフォルトモデルとして表示し、前記ニューラルネットワークの構造探索手法の選択肢として、前記タスクと前記入力データに応じた前記構造探索手法を優先的に表示する情報処理方法である。

【0010】

本開示の情報処理装置は、ユーザによるタスクの選択を受け付ける受付部と、前記タスクの学習に用いられる入力データを取得する取得部と、選択された前記タスクと、取得された前記入力データに応じた構造のニューラルネットワークをデフォルトモデルとして表示する表示制御部とを備え、前記表示制御部が、前記ニューラルネットワークの構造探索手法の選択肢として、前記タスクと前記入力データに応じた前記構造探索手法を優先的に表示する情報処理装置である。

【0011】

本開示のプログラムは、コンピュータに、ユーザによるタスクの選択を受け付け、前記タスクの学習に用いられる入力データを取得し、選択された前記タスクと、取得された前記入力データに応じた構造のニューラルネットワークをデフォルトモデルとして表示し、前記ニューラルネットワークの構造探索手法の選択肢として、前記タスクと前記入力データに応じた前記構造探索手法を優先的に表示する処理を実行させるためのプログラムである。

【0012】

本開示においては、ユーザによるタスクの選択が受け付けられ、前記タスクの学習に用いられる入力データが取得され、選択された前記タスクと、取得された前記入力データに応じた構造のニューラルネットワークがデフォルトモデルとして表示され、前記ニューラルネットワークの構造探索手法の選択肢として、前記タスクと前記入力データに応じた前記構造探索手法が優先的に表示される。

【図面の簡単な説明】

【0013】

【図1】本開示の実施の形態に係る情報処理システムの構成例を示す図である。

【図2】情報処理装置の構成例を示すブロック図である。

【図3】制御部の機能構成例を示すブロック図である。

【図4】ＧＵＩの例を示す図である。

【図5】モデルの構造自動探索処理について説明するフローチャートである。

【図6】モデルの構造自動探索処理について説明するフローチャートである。

【図7】モデルの構造自動探索処理について説明するフローチャートである。

【図8】ＧＵＩの例を示す図である。

【図9】ＧＵＩの例を示す図である。

【図10】ＧＵＩの例を示す図である。

【図11】ＧＵＩの例を示す図である。

【図12】構造探索について設定可能なパラメータの例を示す図である。

【図13】構造探索について設定可能なパラメータの例を示す図である。

【図14】構造探索について設定可能なパラメータの例を示す図である。

【図15】ＧＵＩの例を示す図である。

【図16】ＧＵＩの例を示す図である。

【図17】構造探索について設定可能なパラメータの例を示す図である。

【図18】ＧＵＩの例を示す図である。

【図19】ＧＵＩの例を示す図である。

【図20】ＧＵＩの例を示す図である。

【図21】モデルの圧縮処理について説明するフローチャートである。

【図22】モデルの圧縮処理について説明するフローチャートである。

【図23】ＧＵＩの例を示す図である。

【図24】ＧＵＩの例を示す図である。

【図25】ＧＵＩの例を示す図である。

【図26】ＧＵＩの例を示す図である。

【図27】コンピュータのハードウェア構成例を示すブロック図である。

【発明を実施するための形態】

【0014】

以下、本開示を実施するための形態（以下、実施の形態とする）について説明する。なお、説明は以下の順序で行う。

【0015】

１．システムと装置の構成
２．モデルの構造自動探索
３．モデルの圧縮
４．コンピュータの構成例

【0016】

＜１．システムと装置の構成＞
（情報処理システムの構成例）
図１は、本開示の実施の形態に係る情報処理システムの構成例を示す図である。

【0017】

図１の情報処理システムは、情報処理端末１０と情報処理サーバ３０から構成される。情報処理端末１０と情報処理サーバ３０は、互いに通信が行えるように、ネットワーク２０を介して接続される。

【0018】

情報処理端末１０は、ニューラルネットワークの設計に関するＧＵＩ（Graphic User Interface）をユーザに提示するための情報処理装置である。情報処理端末１０は、ＰＣ（Personal Computer）、スマートフォン、タブレット端末などで構成される。

【0019】

情報処理サーバ３０は、情報処理端末１０からの要求に応じて、ニューラルネットワークの設計に関する処理を実行したり、ニューラルネットワークの設計に必要なデータを情報処理端末１０に供給したりする情報処理装置である。

【0020】

ネットワーク２０は、情報処理端末１０と情報処理サーバ３０とを接続する機能を有する。ネットワーク２０は、インターネット、電話回線網、衛星通信網などの公衆回線網や、Ethernet（登録商標）を含む各種のＬＡＮ（Local Area Network）、ＷＡＮ（Wide Area Network）などで構成される。また、ネットワーク２０は、ＩＰ－ＶＰＮ（Internet Protocol - Virtual Private Network）などの専用回線網を含んで構成されてもよい。

【0021】

（情報処理装置の構成例）
図２は、上述した情報処理端末１０を構成する情報処理装置の構成例を示す図である。

【0022】

図２の情報処理装置１００は、制御部１１０、入力部１２０、表示部１３０、通信部１４０、および記憶部１５０を備えている。

【0023】

制御部１１０は、例えば、ＧＰＵ（Graphics Processing Unit）やＣＰＵ（Central Processing Unit）などのプロセッサにより構成され、情報処理装置１００の各部を制御する。

【0024】

入力部１２０は、ユーザの操作入力に応じた入力信号を制御部１１０に供給する。入力部１２０は、例えばキーボードやマウスの他、タッチパネルとして構成される。

【0025】

表示部１３０は、制御部１１０の制御に基づいて、ニューラルネットワークの設計に関するＧＵＩや各種の情報を表示する。

【0026】

通信部１４０は、制御部１１０の制御に基づいて、ネットワーク２０を介して、情報処理サーバ３０との通信を行うことで、情報処理サーバ３０から供給される各種のデータを制御部１１０に供給する。

【0027】

記憶部１５０は、制御部１１０において実行される処理に用いられる各種のデータの他、制御部１１０が実行するプログラムなどを記憶する。

【0028】

（制御部の機能構成例）
図３は、図２の制御部１１０の機能構成例を示すブロック図である。

【0029】

図３の制御部１１０は、受付部２１１、取得部２１２、決定部２１３、実行部２１４、および表示制御部２１５から構成される。制御部１１０の各部は、制御部１１０を構成するプロセッサが、記憶部１５０に記憶されている所定のプログラムを実行することで実現される。

【0030】

受付部２１１は、入力部１２０からの入力信号に基づいて、ユーザによる操作入力を受け付ける。受け付けられたユーザの操作入力の内容を示す受付情報は、制御部１１０の各部に供給される。例えば、受付部２１１は、ユーザによるニューラルネットワークの設計に係る入力を受け付ける。

【0031】

取得部２１２は、受付部２１１からの受付情報に応じて、通信部１４０を介して情報処理サーバ３０から供給されるデータを取得したり、記憶部１５０に記憶されているデータを取得する。取得部２１２により取得されたデータは、適宜、決定部２１３や実行部２１４に供給される。

【0032】

決定部２１３は、受付部２１１からの受付情報に応じて、ユーザに提示されるニューラルネットワークの候補となるモデルを決定する。

【0033】

実行部２１４は、受付部２１１からの受付情報や、取得部２１２からのデータに基づいて、決定部２１３により決定されたモデルの構造探索や圧縮、そのモデルを用いた学習などを実行する。

【0034】

表示制御部２１５は、ニューラルネットワークの設計に関するＧＵＩや各種の情報の表示部１３０への表示を制御する。例えば、表示制御部２１５は、決定部２１３により決定されたモデルや、そのモデルの構造探索や圧縮に関する情報、そのモデルを用いた学習の結果などの表示を制御する。

【0035】

ところで、近年、深層学習に用いられるニューラルネットワークをユーザが直感的に設計できるようにしたＧＵＩが知られている。

【0036】

一方で、深層学習が適用可能なタスクは、画像認識の他、生成モデル、超解像、音声／言語処理など多数存在する。

【0037】

しかしながら、現在提供されているＧＵＩは、画像認識を目的としたものが主流で、他のタスクに対応したニューラルネットワークの設計を行うことは考えられていなかった。

【0038】

そこで、以下においては、広範にわたるタスクに対応したニューラルネットワークの設計が可能なＧＵＩを提供する例について説明する。

【0039】

＜２．モデルの構造自動探索＞
まず、モデルの構造自動探索について説明する。構造自動探索は、深層学習に用いられるニューラルネットワークの構造を自動で探索する手法であり、所定のアルゴリズムにより、多くの組み合わせから最適なネットワーク構造を見つけ出す技術である。

【0040】

モデルの構造自動探索は、情報処理装置１００によって提供されるＧＵＩにおいて、ユーザにより、例えばモデルの構造自動探索を実行するためのメニューが選択されることで開始される。

【0041】

図４は、モデルの構造自動探索を実行するためのメニューが選択された場合に、表示部１３０に表示されるＧＵＩの例を示している。以下においては、図４に示されるような画面を、構造自動探索実行画面という。

【0042】

構造自動探索実行画面には、各種のＧＵＩパーツとして、ドロップダウンリスト３１１、テキストボックス３１２、チェックボックス３１３、チェックボックス３１４、テキストボックス３１５、チェックボックス３１６、ドロップダウンリスト３１７が設けられる。また、ドロップダウンリスト３１７の下方には、モデル表示ボックス３１８が設けられる。

【0043】

ドロップダウンリスト３１１は、タスクを選択するためのＧＵＩパーツである。ここでいうタスクは、画像認識、生成モデル、超解像、音声／言語処理など、深層学習の目的となる問題を示す。

【0044】

テキストボックス３１２は、構造探索の対象となるニューラルネットワークの演算層の数を入力するためのＧＵＩパーツである。

【0045】

チェックボックス３１３は、スキップコネクションを用いるか否かを選択するためのＧＵＩパーツである。

【0046】

チェックボックス３１４は、セルベースの構造探索を行うか否かを選択するためのＧＵＩパーツである。チェックボックス３１４が操作され、セルベースの構造探索を行うことが選択された場合、テキストボックス３１２に入力された演算層の数は、セルの数を表すようになる。セル内には、複数の演算層が含まれる。

【0047】

テキストボックス３１５は、セル内のノード（演算層）の数を入力するためのＧＵＩパーツである。

【0048】

チェックボックス３１６は、セル内でスキップコネクションを用いるか否かを選択するためのＧＵＩパーツである。

【0049】

なお、テキストボックス３１５とチェックボックス３１６は、チェックボックス３１４において、セルベースの構造探索を行うことが選択された場合にのみアクティブとなる。

【0050】

ドロップダウンリスト３１７は、構造探索手法を選択するためのＧＵＩパーツである。

【0051】

モデル表示ボックス３１８は、構造探索の対象となるニューラルネットワークのモデルなどが表示される領域である。

【0052】

以下においては、図５乃至図７のフローチャートを参照しながら、構造自動探索実行画面に表示される各種のＧＵＩパーツの詳細について説明する。

【0053】

ステップＳ１１において、受付部２１１は、ドロップダウンリスト３１１に対するユーザの操作により、タスクの選択を受け付ける。

【0054】

具体的には、図８に示されるように、ドロップダウンリスト３１１には、「画像認識」、「生成モデル」、「超解像」、「音声／言語処理」の４つのタスクが表示され、ユーザは、その４つのタスクのいずれかを選択することができる。図８の例では、「画像認識」が選択されている。

【0055】

ステップＳ１２においては、デフォルトモデルを利用するか否かが判定される。デフォルトモデルは、ドロップダウンリスト３１１において選択可能なタスクに対応してあらかじめ用意されたネットワーク構造のモデルである。

【0056】

ステップＳ１２においてデフォルトモデルを利用すると判定された場合、ステップＳ１３に進む。

【0057】

ステップＳ１３において、決定部２１３は、ドロップダウンリスト３１１において選択されたタスクと、取得部２１２により所定のタイミングで取得された入力データに応じた構造のニューラルネットワークをデフォルトモデルとして決定する。そして、表示制御部２１５は、決定されたデフォルトモデルをモデル表示ボックス３１８に表示する。

【0058】

入力データは、ユーザにより用意されたものでもよいし、情報処理サーバ３０から供給されたものでもよい。

【0059】

このとき、選択されたタスクと取得された入力データに加えて、情報処理装置１００のハードウェア情報に応じた構造のニューラルネットワークがデフォルトモデルとして決定され、表示されてもよい。ここでいうハードウェア情報は、情報処理装置１００の制御部１１０を構成するプロセッサの処理能力に関する情報や、プロセッサの数に関する情報を含むものとする。

【0060】

図８の例では、ドロップダウンリスト３１１において「画像認識」が選択されていることから、モデル表示ボックス３１８には、「画像認識」に応じたデフォルトモデルとして、画像の特徴量を抽出する特徴抽出器（エンコーダ）が表示されている。

【0061】

また、図９に示されるように、ドロップダウンリスト３１１において「超解像」が選択されている場合、モデル表示ボックス３１８には、「超解像」に応じたデフォルトモデルとして、オートエンコーダを構成するエンコーダとデコーダが表示される。

【0062】

なお、モデル表示ボックス３１８に表示されるデフォルトモデルの一部の演算層のみを、後述する構造探索の対象とすることもできる。例えば、モデル表示ボックス３１８において、ユーザのドラッグ操作により所定の範囲が指定されると、図１０に示されるように、モデル表示ボックス３１８にバウンディングボックス３２１が表示されるようにする。この場合、バウンディングボックス３２１に囲まれているデフォルトモデルの演算層のみが、構造探索の対象となる。

【0063】

さらに、図示はしないが、ドロップダウンリスト３１１において「生成モデル」が選択された場合、モデル表示ボックス３１８には、「生成モデル」に応じたデフォルトモデルとして、デコーダが表示される。また、ドロップダウンリスト３１１において「音声／言語処理」が選択された場合、モデル表示ボックス３１８には、「音声／言語処理」に応じたデフォルトモデルとして、再帰型ニューラルネットワーク（ＲＮＮ）構造のモデルが表示される。

【0064】

ここで、モデル表示ボックス３１８に表示されるデフォルトモデルは１つに限らず、ユーザの操作に応じて、受付部２１１が、表示されるデフォルトモデルの、他のデフォルトモデルへの変更を受け付ける。これにより、モデル表示ボックス３１８には、構造探索の対象となるモデルの候補が切り替わって表示されるようになる。

【0065】

ステップＳ１４において、受付部２１１は、ユーザによるデフォルトモデルの選択を受け付ける。これにより、構造探索の対象となるデフォルトモデルが確定される。

【0066】

一方、ステップＳ１２においてデフォルトモデルを利用しないと判定された場合、処理はステップＳ１５に進み、受付部２１１は、ユーザによるモデルの設計を受け付ける。ユーザにより設計されたモデルは、デフォルトモデルと同様、モデル表示ボックス３１８に表示される。

【0067】

ステップＳ１４においてデフォルトモデルが確定されるか、または、ステップＳ１５においてモデルが設計された後、処理はステップＳ１６に進む。

【0068】

ステップＳ１６において、表示制御部２１５は、モデル表示ボックス３１８に表示されているモデルとともに、そのモデルのネットワーク構造の概略を表示する。具体的には、表示制御部２１５は、ネットワーク構造の概略として、モデル表示ボックス３１８に表示されているモデルの探索空間のサイズや、概算計算量を表示する。

【0069】

その後、ステップＳ１７において、ユーザの操作に応じて、モデル表示ボックス３１８に表示されているモデルに演算層を追加するか否かが判定される。すなわち、受付部２１１は、デフォルトモデルへの演算層の追加を受け付けるか否かを判定する。

【0070】

ステップＳ１７において演算層を追加すると判定された場合、処理は図６のステップＳ１８に進み、プリセットの演算層を利用するか否かが判定される。

【0071】

ステップＳ１８においてプリセットの演算層を利用すると判定された場合、ステップＳ１９において、受付部２１１は、ユーザによるプリセットの演算層の選択を受け付け、処理はステップＳ１７に戻る。

【0072】

一方、ステップＳ１８においてプリセットの演算層を利用しないと判定された場合、ステップＳ２０において、受付部２１１は、ユーザによる演算層の設計を受け付け、処理はステップＳ１７に戻る。

【0073】

さて、ステップＳ１７において演算層を追加しないと判定されると、処理は図７のステップＳ２１に進む。

【0074】

ステップＳ２１において、表示制御部２１５は、モデル表示ボックス３１８に表示されているモデルに応じて、ドロップダウンリスト３１７に構造探索手法の選択肢を表示する。具体的には、表示制御部２１５は、ドロップダウンリスト３１７に、ドロップダウンリスト３１１において選択されたタスクと、取得部２１２により所定のタイミングで取得された入力データに応じた構造探索手法を優先的に表示する。

【0075】

例えば、図１１に示されるように、ドロップダウンリスト３１７には、「強化学習」、「遺伝的アルゴリズム」、「勾配法」など、代表的な構造探索手法が表示され、ユーザは、それらの構造探索手法のいずれかを選択することができる。

【0076】

強化学習による構造探索には、例えば“B. Zoph, V. Vasudevan, J. Shlens, and Q. V. Le. Learning transferable architectures for scalable image recognition. In CVPR, 2018.”で提案されているＮＡＳＮｅｔや、“H. Pham, M. Y. Guan, B. Zoph, Q. V. Le, and J. Dean. Efficient neural architecture search via parameter sharing. In ICML, 2018.”で提案されているＥＮＡＳなどの手法が用いられる。遺伝的アルゴリズムによる構造探索には、例えば“E. Real, A. Aggarwal, Y. Huang, and Q. V. Le. Regularized evolution for image classifier architecture search. In AAAI, 2019.”で提案されているＡｍｏｅｂａＮｅｔなどの手法が用いられる。また、勾配法による構造探索には、例えば“H. Liu, K. Simonyan, and Y. Yang. DARTS: Differentiable architecture search. In ICLR, 2019.”で提案されているＤＡＲＴＳや、“S. Xie, H. Zheng, C. Liu, and L. Lin. SNAS: Stochastic neural architecture search. In ICLR, 2019.”で提案されているＳＮＡＳなどの手法が用いられる。

【0077】

このとき、ドロップダウンリスト３１７には、選択されたタスクと取得された入力データに加えて、情報処理装置１００のハードウェア情報に応じた構造探索手法が優先的に表示されてもよい。

【0078】

ステップＳ２２において、受付部２１１は、ドロップダウンリスト３１７に対するユーザの操作により、構造探索手法の選択を受け付ける。図１１の例では、「強化学習」が選択されている。

【0079】

その後、ステップＳ２３において、受付部２１１は、ドロップダウンリスト３１７において選択された構造探索手法の設定の入力を受け付ける。このとき、例えば図１１に示されるように、モデル表示ボックス３１８の右方に、構造探索手法の設定を入力するための設定入力部３３１が表示されるようにする。設定入力部３３１には、ドロップダウンリスト３１７において選択された構造探索手法について設定可能なパラメータが、ユーザにより入力される。

【0080】

ここで、図１２乃至図１４を参照して、構造探索手法について設定可能なパラメータの例について説明する。

【0081】

図１２は、強化学習による構造探索について設定可能なパラメータの例を示している。

【0082】

強化学習による構造探索について設定可能なパラメータには、ＲＮＮ／ＬＳＴＭレイヤ数、Child Network数、コントローラの学習率、アーキテクチャパラメータオプティマイザ、サーチ回数、子ネットワークの学習回数が含まれる。

【0083】

ＲＮＮ／ＬＳＴＭレイヤ数は、強化学習に用いられるＲＮＮや、その一種であるＬＳＴＭ（Long-short Term Memory）の演算層の数であり、ｉｎｔ型の数値入力により設定される。

【0084】

Child Network数は、メインとなるネットワーク構造を予測する親ネットワークとなるコントローラが一度に出力する子ネットワーク（候補ネットワーク）の数であり、ｉｎｔ型の数値入力により設定される。

【0085】

コントローラの学習率は、上述したコントローラによる学習に関するパラメータであり、ｆｌｏａｔ型の数値入力により設定される。

【0086】

アーキテクチャパラメータオプティマイザは、学習率の調整手法であり、プルダウン（ドロップダウンリスト）による選択により設定される。選択肢としては、「Ａｄａｍ」、「ＳＧＤ」、「Ｍｏｍｅｎｔｕｍ」などが用意される。

【0087】

サーチ回数は、サーチを行う回数であり、ｉｎｔ型の数値入力により設定される。

【0088】

子ネットワークの学習回数は、１回のサーチにおける子ネットワークのエポック数（一つの訓練データを繰り返し学習させる回数）であり、ｉｎｔ型の数値入力により設定される。

【0089】

図１３は、遺伝的アルゴリズムを含む進化的計算による構造探索について設定可能なパラメータの例を示している。

【0090】

候補ネットワークを複数使って学習させる進化的計算による構造探索について設定可能なパラメータには、保存するモデル数、学習回数、Population数、サンプル数、突然変異パターンが含まれる。

【0091】

保存するモデル数は、生成された候補ネットワーク（モデル）を保存する数であり、ｉｎｔ型の数値入力により設定される。保存するモデル数は、サーチ回数とほぼ同じ数となる。

【0092】

学習回数は、生成されたモデルのエポック数であり、ｉｎｔ型の数値入力により設定される。

【0093】

Population数は、Populationのサイズであり、ｉｎｔ型の数値入力により設定される。

【0094】

サンプル数は、変異するモデルを選択する際に、現在のPopulationからサンプリングするモデルの数であり、ｉｎｔ型の数値入力により設定される。

【0095】

突然変異パターンは、突然変異のパターンであり、プルダウン（ドロップダウンリスト）による選択により設定される。選択肢としては、「演算と入力ノード」、「演算のみ」、「入力ノードのみ」などが用意される。

【0096】

図１４は、勾配法による構造探索について設定可能なパラメータの例を示している。

【0097】

勾配法による構造探索について設定可能なパラメータには、サーチ回数、アーキテクチャパラメータ学習率、アーキテクチャパラメータオプティマイザが含まれる。

【0098】

サーチ回数は、学習回数と同様、生成されたモデルのエポック数であり、ｉｎｔ型の数値入力により設定される。

【0099】

アーキテクチャパラメータ学習率は、生成されたモデルによる学習に関するパラメータであり、ｆｌｏａｔ型の数値入力により設定される。

【0100】

【0101】

以上のようなパラメータが、選択された構造探索手法に応じて、設定入力部３３１において設定可能となる。

【0102】

図７のフローチャートに戻り、構造探索手法の設定が入力されると、ステップＳ２４において、表示制御部２１５は、選択された構造探索手法に応じて、設定されたパラメータでの構造探索に要する予測時間を、例えばモデル表示ボックス３１８の所定位置に表示する。

【0103】

その後、ステップＳ２５において、構造探索手法の設定を変更するか否かが判定される。

【0104】

ステップＳ２５において構造探索手法の設定を変更すると判定された場合、処理はステップＳ２３に戻り、ステップＳ２３，Ｓ２４の処理が繰り返される。

【0105】

一方、ステップＳ２５において構造探索手法の設定を変更しないと判定された場合、処理はステップＳ２６に進む。

【0106】

ステップＳ２６において、実行部２１４は、設定されたパラメータでの構造探索を開始する。

【0107】

構造探索の実行が終了すると、ステップＳ２７において、表示制御部２１５は、探索された構造のモデルをモデル表示ボックス３１８に表示する。

【0108】

その後、ステップＳ２８において、さらに構造探索を行うか否かが判定される。

【0109】

ステップＳ２８においてさらに構造探索を行うと判定された場合、処理はステップＳ２６に戻り、ステップＳ２６，Ｓ２７の処理が繰り返される。

【0110】

一方、ステップＳ２８においてさらに構造探索を行わないと判定された場合、処理は終了する。

【0111】

以上の処理によれば、画像認識の他、生成モデル、超解像、音声／言語処理などのタスクの選択が可能となり、選択されたタスクと入力データに応じた構造のニューラルネットワークがデフォルトモデルとして表示される。さらに、近年提案されている様々な構造探索手法の選択が可能となり、選択された構造探索手法での構造探索が実行される。

【0112】

これにより、所望のタスクに対応したニューラルネットワークの設計を容易に行うことが可能となり、ひいては、広範にわたるタスクに対応したニューラルネットワークの構造の最適化を図ることが可能となる。

【0113】

（セルベースの構造探索の例）
以上においては、セルベースの構造探索を行わない場合のＧＵＩの例について説明してきたが、以下においては、セルベースの構造探索を行う場合のＧＵＩの例について説明する。

【0114】

図１５は、セルベースの構造探索を行う場合のＧＵＩの例を示している。

【0115】

図１５の構造自動探索実行画面においては、チェックボックス３１４が操作されることで、セルベースの構造探索を行うことが選択されている。

【0116】

また、図１５の構造自動探索実行画面においては、上述した構造自動探索実行画面におけるモデル表示ボックス３１８に代えて、モデル表示ボックス３４１とセル表示ボックス３４２が設けられる。

【0117】

モデル表示ボックス３４１は、構造探索の対象となるニューラルネットワークのモデル全体が表示される領域である。モデル表示ボックス３４１に表示されるモデルは、複数のセル（セルブロック）を含むように構成されるセル蓄積型のモデルとなる。

【0118】

また、モデル表示ボックス３４１には、複数のセルから構成されるモデルとともに、ネットワーク構造の概略として、モデル表示ボックス３４１に表示されているモデルの探索空間のサイズや、概算計算量が表示される。

【0119】

セル表示ボックス３４２は、モデル表示ボックス３４１に表示されるモデルを構成し、構造探索の対象となるセルが表示される領域である。セル表示ボックス３４２に表示されるセルは、複数の演算層から構成される。

【0120】

図１５の構造自動探索実行画面においては、最悪計算量などの概算が表示され、ユーザに許容計算量の範囲を指定させるようにしてもよい。これにより、計算量の制約を考慮した構造探索が可能となる。

【0121】

図１６は、モデル表示ボックス３４１に表示されるモデルの構造と、セル表示ボックス３４２に表示されるセルの構造の設定に用いられる設定画面の例を示している。図１６の設定画面３５０は、例えばモデル表示ボックス３４１やセル表示ボックス３４２における所定の領域がクリック操作されるなどすることで、構造自動探索実行画面上にポップアップ表示される。

【0122】

設定画面３５０には、テキストボックス３５１，３５２，３５３，３５４と、ドロップダウンリスト３５５が設けられる。

【0123】

テキストボックス３５１は、モデル表示ボックス３４１に表示されるモデルを構成するセルの数を入力するためのＧＵＩパーツである。

【0124】

テキストボックス３５２は、モデル表示ボックス３４１に表示されるモデルを構成するセルの種類の数を入力するためのＧＵＩパーツである。

【0125】

テキストボックス３５３は、セル表示ボックス３４２に表示されるセル内のノード（演算層）の数を入力するためのＧＵＩパーツである。

【0126】

テキストボックス３５４は、セル表示ボックス３４２に表示されるセル内の１つのノードに対する入力数を入力するためのＧＵＩパーツである。

【0127】

ドロップダウンリスト３５５は、出力ノードでのリダクション演算手法を選択するためのＧＵＩパーツである。ドロップダウンリスト３５５には、例えば、「element-wise add」、「concatenate」、「average」の３つのリダクション演算手法が表示され、ユーザは、その３つのリダクション演算手法のいずれかを選択することができる。

【0128】

このようにして設定された内容は、モデル表示ボックス３４１に表示されるモデルや、セル表示ボックス３４２に表示されるセルに、リアルタイムに反映されるようになる。

【0129】

なお、設定画面３５０における設定によっては、セル蓄積型のモデルに限らず、多層積層フィードフォワード型ニューラルネットワークの構築も可能となる。図示はしないが、例えば、セル数が１、セル内のノードの数が８、セル内の１つのノードに対する入力数が１のモデルを構築することもできる。

【0130】

また、上述した説明では、選択された構造探索手法に応じて、構造探索についてのパラメータが設定されるものとしたが、構造探索手法によらないパラメータも設定可能とされる。

【0131】

図１７は、選択された構造探索手法によらない、一般的な構造探索について設定可能なパラメータの例を示している。

【0132】

一般的な構造探索について設定可能なパラメータには、モデル学習率、モデルパラメータオプティマイザ、特徴マップ数が含まれる。

【0133】

モデル学習率は、構造探索の対象となるモデルによる学習に関するパラメータであり、ｆｌｏａｔ型の数値入力により設定される。

【0134】

モデルパラメータオプティマイザは、モデル学習率の調整手法であり、プルダウン（ドロップダウンリスト）による選択により設定される。選択肢としては、「Ａｄａｍ」、「ＳＧＤ」、「Ｍｏｍｅｎｔｕｍ」などが用意される。

【0135】

特徴マップ数は、構築したモデルの最初のセルにおける隠れ層のフィルタ数であり、ｉｎｔ型の数値入力により設定される。

【0136】

このようなパラメータが、選択された構造探索手法によらずに設定可能となる。

【0137】

（探索空間の定義）
ユーザは、構造探索において用いられる演算層を、プリセットされた演算層の中から選択することができる。

【0138】

図１８は、ユーザが、プリセットの演算層から構造探索において用いられる演算層を選択する際に表示される画面の例を示している。

【0139】

図１８の画面の領域３６０の上端には、選択部３６１が設けられる。選択部３６１には、演算層の種類が選択肢として表示されている。図１８の例では、「Affine」、「Convolution」、「DepthwiseConvolution」、「Deconvolution」が選択肢として表示され、「Convolution」が選択されている。

【0140】

選択部３６１の下方には、選択部３６２が設けられる。選択部３６２には、選択部３６１において選択された種類でプリセットされている演算層が選択肢として表示されている。図１８の例では、「Convolution_3x3」、「Convolution_5x5」、「Convolution_7x7」、「MaxPooling_3x3」、「AveragePooling_3x3」が選択肢として表示されている。

【0141】

図１８の画面の領域３７０には、プリセットの演算層から選択された演算層によって構成されるモデルが表示される。図１８の例では、入力層とConvolution層から構成されるモデルが表示されている。

【0142】

さらに、ユーザは、構造探索において用いられる演算層を独自に定義することもできる。

【0143】

図１９は、ユーザが、構造探索において用いられる演算層を独自に定義する際に表示される画面の例を示している。

【0144】

図１９の画面の領域３６０の下部には、設定部３６３が設けられる。設定部３６３は、例えば、図示せぬ演算追加ボタンを押下することで表示される。設定部３６３には、ユーザにより選択された演算層の各種のパラメータが表示される。

【0145】

ユーザは、設定部３６３において演算層のパラメータに所望の値を設定することで、構造探索において用いられる演算層を、独自に定義することができる。

【0146】

なお、セル蓄積型のモデルの構造探索においては、セル内の演算によって入力サイズと出力サイズが変わらないようにする必要がある。そのため、設定部３６３においてユーザが設定できるパラメータをその一部に制限し、それらのパラメータの設定に応じて、他のパラメータが自動で設定されるようしてもよい。例えば、Convolution層のパラメータにおいては、フィルタサイズが設定されることで、他のパラメータが自動で設定されるようにする。

【0147】

（構造探索の実行結果）
上述したように、構造探索の実行が終了すると、探索された構造のネットワークが表示される。

【0148】

図２０は、上述したセル蓄積型のモデルの構造探索の実行結果が表示された画面の例を示している。

【0149】

図２０の例では、探索された構造のモデルとセルが、モデル表示ボックス３４１とセル表示ボックス３４２に表示されている。

【0150】

さらに、探索された構造のモデルとセルに加えて、精度や計算量などが表示されるようにしてもよい。図２０の例では、セル表示ボックス３４２の上方に、精度・計算量表示部３８１が設けられている。精度・計算量表示部３８１には、精度、パラメータ数（サイズ）、ＦＬＯＰＳ（Floating-point Operations per Second）、消費電力、中間バッファ（サイズ）が表示されている。

【0151】

ユーザは、精度・計算量表示部３８１に表示された精度や計算量などを確認することで、再度、構造探索を実行するか否かを判断することができる。

【0152】

特に、従来のニューラルネットワークの設計に関するＧＵＩにおいては、構造探索を実行するハードウェアの計算量の制約が考慮されていなかった。

【0153】

これに対して、上述した構成によれば、計算量の制約を考慮に入れた構造探索が簡単な操作で実現可能となる。

【0154】

＜３．モデルの圧縮＞
次に、モデルの圧縮について説明する。モデルの圧縮は、ニューラルネットワーク内の構造を簡易化し、計算コストを削減する手法であり、１つの例として、大規模で複雑なネットワークの性能を小規模なネットワークで実現する蒸留などが知られている。

【0155】

モデルの圧縮は、情報処理装置１００によって提供されるＧＵＩにおいて、ユーザにより、例えばモデルの圧縮を実行するためのメニューが選択されことで開始される。また、モデルの圧縮は、図２０に示されるような、構造探索の実行結果が表示された画面において、モデルの圧縮を実行するためのボタンなどが選択されることで開始されてもよい。

【0156】

図２１および図２２は、モデルの圧縮処理について説明するフローチャートである。

【0157】

ステップＳ５１において、取得部２１２は、圧縮対象となるモデルであるベースモデルを読み込む。ベースモデルは、あらかじめ設計されたモデルであってもよいし、上述した構造探索が実行された後のモデルであってもよい。

【0158】

ステップＳ５２においては、読み込まれたベースモデルに演算層を追加するか否かが判定される。

【0159】

ベースモデルに演算層を追加すると判定された場合、処理はステップＳ５３に進み、受付部２１１は、ベースモデルへの演算層の追加を受け付ける。

【0160】

ステップＳ５２，Ｓ５３は、ベースモデルに演算層を追加しないと判定されるまで繰り返され、ベースモデルに演算層を追加しないと判定されると、処理はステップＳ５４に進む。

【0161】

ステップＳ５４において、表示制御部２１５は、現時点での圧縮の設定を表示する。

【0162】

その後、ステップＳ５５においては、ユーザの操作に応じて、圧縮の設定を変更するか否かが判定される。

【0163】

ステップＳ５５において圧縮の設定を変更すると判定された場合、処理はステップＳ５６に進み、受付部２１１は、演算層の選択を受け付ける。このとき、受付部２１１は、ベースモデルの圧縮手法の選択も受け付ける。

【0164】

次いで、ステップＳ５７において、受付部２１１は、選択された演算層について、圧縮の設定の入力を受け付ける。このとき、選択された演算層についての圧縮の条件が、圧縮の設定として入力されるようにする。ステップＳ５７の後、処理はステップＳ５５に戻る。

【0165】

このようにして、選択された演算層についての圧縮の設定が決定される。

【0166】

一方、ステップＳ５５において、圧縮の設定を変更しないと判定された場合、処理は図２２のステップＳ５８に進む。

【0167】

ステップＳ５８において、実行部２１４は、演算層それぞれについて設定されている圧縮の設定に基づいて、モデルの圧縮を実行する。

【0168】

ステップＳ５９において、実行部２１４は、演算層それぞれの圧縮率を算出する。このとき、表示制御部２１５は、演算層それぞれの圧縮率を、圧縮結果として表示する。

【0169】

ステップＳ６０において、実行部２１４は、算出された演算層それぞれの圧縮率が、演算層それぞれについて設定された圧縮の条件を満たすか否かを判定する。

【0170】

圧縮率が条件を満たさないと判定された場合、処理はステップＳ５８に戻り、モデルの圧縮の実行と圧縮率の算出が繰り返される。

【0171】

一方、圧縮率が条件を満たすと判定された場合、処理はステップＳ６１に進む。

【0172】

ステップＳ６１においては、ユーザの操作に応じて、ベースモデルについてさらに圧縮を実行するか否かが判定される。

【0173】

さらに圧縮を実行すると判定された場合、処理は図２１のステップＳ５５に戻り、それ以降の処理が繰り返される。

【0174】

一方、ステップＳ６１においてさらに圧縮を実行しないと判定された場合、処理はステップＳ６２に進み、実行部２１４は、圧縮後のモデルを保存し、処理は終了する。

【0175】

（ＧＵＩの例）
以下、モデルの圧縮処理において、表示部１３０に表示されるＧＵＩの例について説明する。

【0176】

図２３は、モデルの圧縮に関する設定を行う画面の例を示している。

【0177】

図２３の画面の領域４１０の下部には、ドロップダウンリスト４１１とボタン４１２が設けられる。ドロップダウンリスト４１１は、圧縮手法を選択するためのＧＵＩパーツである。

【0178】

ドロップダウンリスト４１１には、「枝刈り」、「量子化」、「蒸留」の３つの圧縮手法が表示され、ユーザは、その３つの圧縮手法のいずれかを選択することができる。

【0179】

ボタン４１２は、ドロップダウンリスト４１１で選択された圧縮手法での圧縮を実行するためのＧＵＩパーツである。

【0180】

図２３の画面の領域４２０には、圧縮の対象となるベースモデル４２１が表示される。ベースモデル４２１の右側には、ベースモデル４２１を構成する演算層毎の計算量が示されている。演算層それぞれの計算量は、メモリ全体の使用量を１００％としたときの各演算層のメモリの使用量の割合として示されている。

【0181】

ユーザは、ベースモデル４２１を構成する演算層毎の計算量を確認することで、ベースモデル４２１において、どの演算層がボトルネックになり得るかを把握することができる。

【0182】

また、ドロップダウンリスト４１１で選択された圧縮手法での圧縮について、精度の劣化をどの程度許容するかの指標となる精度劣化許容値と、目標圧縮率をユーザに設定させるようにしてもよい。

【0183】

図２３の例では、ベースモデル４２１を構成する演算層全体を圧縮の対象とすることもできるし、一部の演算層のみを圧縮の対象とすることもできる。

【0184】

図２４は、ベースモデル４２１を構成する演算層毎の圧縮の設定を行う例を示している。

【0185】

図２４においては、ベースモデル４２１を構成する演算層のうち、「Affine_3」層が選択され、子画面４３１が表示されている。子画面４３１は、選択された演算層について、レイテンシ、メモリ、中間バッファ、消費電力の各指標についての許容範囲（圧縮条件）を設定するための画面である。

【0186】

子画面４３１には、各指標について、許容範囲の設定を有効にするためのラジオボタンと、許容範囲の最小値、最大値を入力するためのテキストボックスが設けられる。許容範囲の設定が有効にされ、許容範囲の最小値、最大値が入力されることで、選択されている演算層に関する圧縮条件が設定される。

【0187】

図２５および図２６は、圧縮結果が表示される画面の例を示している。

【0188】

図２５および図２６の画面の領域４１０の下部には、どの指標についての圧縮結果を表示するかを選択するための指標選択部４４１と、圧縮による精度の変化率が表示される精度変化率表示部４４２が設けられる。

【0189】

図２５および図２６の画面の領域４２０には、圧縮の対象となったベースモデル４２１と、その右側には、ベースモデル４２１を構成する演算層毎の圧縮結果が示される。演算層それぞれの圧縮結果として、指標選択部４４１において選択されている指標についての圧縮率が示される。

【0190】

具体的には、図２５の例では、指標選択部４４１においてメモリが選択されており、ベースモデル４２１を構成する演算層毎の圧縮結果として、メモリについての圧縮率が示されている。

【0191】

また、図２６の例では、指標選択部４４１において消費電力が選択されており、ベースモデル４２１を構成する演算層毎の圧縮結果として、消費電力についての圧縮率が示されている。

【0192】

これにより、ユーザは、どの演算層をさらなる圧縮対象とするかを判断することができる。

【0193】

以上の処理によれば、構造探索が実行されたモデルに加え、既存のモデルについても、その圧縮を実行することができ、計算コストを削減することが可能となる。

【0194】

以上においては、モデルの構造自動探索や圧縮に係る処理やＧＵＩの表示は、情報処理装置１００として構成される情報処理端末１０上で行われるものとした。これに限らず、情報処理サーバ３０を情報処理装置１００で構成されるようにし、モデルの構造自動探索や圧縮に係る処理は、情報処理サーバ３０上で行われ、ＧＵＩの表示のみが情報処理端末１０上で行われるようにしてもよい。さらに、上述した情報処理装置１００により実行された各処理は、図１の情報処理システムの情報処理端末１０と情報処理サーバ３０のいずれかにおいて行われればよい。

【0195】

＜４．コンピュータの構成＞
上述した一連の処理は、ハードウェアにより実行することもできるし、ソフトウェアにより実行することもできる。一連の処理をソフトウェアにより実行する場合には、そのソフトウェアを構成するプログラムが、専用のハードウェアに組み込まれているコンピュータ、または汎用のパーソナルコンピュータなどに、プログラム記録媒体からインストールされる。

【0196】

図２７は、上述した一連の処理をプログラムにより実行するコンピュータのハードウェアの構成例を示すブロック図である。

【0197】

上述した情報処理装置１００は、図２７に示す構成を有するコンピュータ１０００により実現される。

【0198】

ＣＰＵ１００１、ＲＯＭ１００２、ＲＡＭ１００３は、バス１００４により相互に接続されている。

【0199】

バス１００４には、さらに、入出力インタフェース１００５が接続されている。入出力インタフェース１００５には、キーボード、マウスなどよりなる入力部１００６、ディスプレイ、スピーカなどよりなる出力部１００７が接続される。また、入出力インタフェース１００５には、ハードディスクや不揮発性のメモリなどよりなる記憶部１００８、ネットワークインタフェースなどよりなる通信部１００９、リムーバブルメディア１０１１を駆動するドライブ１０１０が接続される。

【0200】

以上のように構成されるコンピュータ１０００では、ＣＰＵ１００１が、例えば、記憶部１００８に記憶されているプログラムを入出力インタフェース１００５およびバス１００４を介してＲＡＭ１００３にロードして実行することにより、上述した一連の処理が行われる。

【0201】

ＣＰＵ１００１が実行するプログラムは、例えばリムーバブルメディア１０１１に記録して、あるいは、ローカルエリアネットワーク、インターネット、デジタル放送といった、有線または無線の伝送媒体を介して提供され、記憶部１００８にインストールされる。

【0202】

なお、コンピュータ１０００が実行するプログラムは、本明細書で説明する順序に沿って時系列に処理が行われるプログラムであっても良いし、並列に、あるいは呼び出しが行われたときなどの必要なタイミングで処理が行われるプログラムであっても良い。

【0203】

なお、本技術の実施の形態は、上述した実施の形態に限定されるものではなく、本技術の要旨を逸脱しない範囲において種々の変更が可能である。

【0204】

また、本明細書に記載された効果はあくまで例示であって限定されるものではなく、他の効果があってもよい。

【0205】

さらに、本開示は以下のような構成をとることができる。
（１）
情報処理装置が、
ユーザによるタスクの選択を受け付け、
前記タスクの学習に用いられる入力データを取得し、
選択された前記タスクと、取得された前記入力データに応じた構造のニューラルネットワークをデフォルトモデルとして表示する
情報処理方法。
（２）
前記タスクと前記入力データに加えて、前記情報処理装置のハードウェア情報に応じた構造の前記ニューラルネットワークを前記デフォルトモデルとして表示する
（１）に記載の情報処理方法。
（３）
前記ハードウェア情報は、プロセッサの処理能力に関する情報である
（２）に記載の情報処理方法。
（４）
前記ハードウェア情報は、プロセッサの数に関する情報である
（２）に記載の情報処理方法。
（５）
前記デフォルトモデルとともに、前記デフォルトモデルの探索空間のサイズおよび計算量の少なくともいずれかを表示する
（１）乃至（４）のいずれかに記載の情報処理方法。
（６）
前記ユーザによる前記デフォルトモデルの変更を受け付ける
（１）乃至（５）のいずれかに記載の情報処理方法。
（７）
前記デフォルトモデルへの演算層の追加を受け付ける
（６）に記載の情報処理方法。
（８）
前記ニューラルネットワークの構造探索手法の選択肢として、前記タスクと前記入力データに応じた前記構造探索手法を優先的に表示する
（１）乃至（７）のいずれかに記載の情報処理方法。
（９）
前記タスクと前記入力データに加えて、前記情報処理装置のハードウェア情報に応じた前記構造探索手法を優先的に表示する
（８）に記載の情報処理方法。
（１０）
前記選択肢の中から前記ユーザにより選択された前記構造探索手法の設定の入力を受け付ける
（８）または（９）に記載の情報処理方法。
（１１）
前記選択肢の中から前記ユーザにより選択された前記構造探索手法に応じて、構造探索に要する予測時間を表示する
（８）乃至（１０）のいずれかに記載の情報処理方法。
（１２）
前記選択肢の中から前記ユーザにより選択された前記構造探索手法に基づいた構造探索を実行し、
探索された構造の前記ニューラルネットワークを表示する
（８）乃至（１１）のいずれかに記載の情報処理方法。
（１３）
前記ニューラルネットワークにおいて前記ユーザにより選択された演算層を構造探索の対象とする
（１２）に記載の情報処理方法。
（１４）
前記ニューラルネットワークに含まれるセルを構造探索の対象とする
（１２）に記載の情報処理方法。
（１５）
前記ニューラルネットワークの圧縮手法の選択をさらに受け付ける
（１）乃至（１４）のいずれかに記載の情報処理方法。
（１６）
前記ニューラルネットワークの演算層について、前記ユーザに選択された指標毎に圧縮条件の設定を受け付ける
（１５）に記載の情報処理方法。
（１７）
選択された前記圧縮手法での前記ニューラルネットワークの圧縮を実行し、
前記演算層の圧縮結果を表示する
（１６）に記載の情報処理方法。
（１８）
前記ユーザに選択された指標について、前記演算層の圧縮率を表示する
（１７）に記載の情報処理方法。
（１９）
ユーザによるタスクの選択を受け付ける受付部と、
前記タスクの学習に用いられる入力データを取得する取得部と、
選択された前記タスクと、取得された前記入力データに応じた構造のニューラルネットワークをデフォルトモデルとして表示する表示制御部と
を備える情報処理装置。
（２０）
コンピュータに、
ユーザによるタスクの選択を受け付け、
前記タスクの学習に用いられる入力データを取得し、
選択された前記タスクと、取得された前記入力データに応じた構造のニューラルネットワークをデフォルトモデルとして表示する
処理を実行させるためのプログラム。

【符号の説明】

【0206】

１０情報処理端末，３０情報処理サーバ，１００情報処理装置，１１０制御部，１２０入力部，１３０表示部，１４０通信部，１５０記憶部，２１１受付部，２１２取得部，２１３決定部，２１４実行部，２１５表示制御部，１０００コンピュータ

【図1】