特許7603478 | 知財ポータル「IP Force」

知財求人 - 知財ポータルサイト「IP Force」

▶ 三菱電機株式会社の特許一覧

特許7603478移植支援装置、移植支援方法及び移植支援プログラム

書誌要約請求の範囲詳細な説明課題実施例実施するための形態図面の説明

目に優しい文字サイズ小中大 PDF Top

< >

1
2
3
4
5
6
7
8
9
10
11
12
13
14
15
16
17

(19)【発行国】日本国特許庁(JP)

(12)【公報種別】特許公報(B2)

(11)【特許番号】

(24)【登録日】2024-12-12

(45)【発行日】2024-12-20

(54)【発明の名称】移植支援装置、移植支援方法及び移植支援プログラム

(51)【国際特許分類】

G06N 3/10 20060101AFI20241213BHJP

G06N 3/0464 20230101ALI20241213BHJP

【ＦＩ】

G06N3/10

G06N3/0464

【請求項の数】 6

(21)【出願番号】P 2021029680

(22)【出願日】2021-02-26

(65)【公開番号】P2022130980

(43)【公開日】2022-09-07

【審査請求日】2023-10-25

(73)【特許権者】

【識別番号】000006013

【氏名又は名称】三菱電機株式会社

(74)【代理人】

【識別番号】100088672

【弁理士】

【氏名又は名称】吉竹英俊

(74)【代理人】

【識別番号】100088845

【弁理士】

【氏名又は名称】有田貴弘

(72)【発明者】

【氏名】柏木僚

【審査官】多賀実

(56)【参考文献】

【文献】国際公開第２０１９／２１６４０４（ＷＯ，Ａ１）

【文献】特開２０１７－１８２３１９（ＪＰ，Ａ）

【文献】特開２０１９－０９６３１７（ＪＰ，Ａ）

【文献】Joona Jokivuori，"Cross-platform porting of Deep Neural Networks"，Bachelor of Science Thesis Faculty of Engineering and Natural Sciences [online]，Tampere University，2020年，pp.1-22，[検索日 2024.07.30], インターネット:<URL:https://trepo.tuni.fi/handle/10024/121328>

(58)【調査した分野】(Int.Cl.，ＤＢ名)

Ｇ０６Ｎ３／００－９９／００

Ｇ０６Ｆ８／００－８／７７

Ｇ０６Ｆ９／４４－９／４５５

(57)【特許請求の範囲】

【請求項1】

ＣＮＮ（Convolution Neural Network）の複数の層と、当該層に付随する重みとを含むＣＮＮモデルを取得するモデル取得部と、
前記ＣＮＮモデルの前記複数の層の末尾の層から順に層が削除された複数の欠落ＣＮＮモデルを生成する欠落モデル生成部と、
前記ＣＮＮモデルの試験入力パターンを取得する試験パターン取得部と、
少なくとも前記複数の欠落ＣＮＮモデルと、前記試験入力パターンとを用いた推論によって、複数の試験出力パターンを生成する推論部と
を備える、移植支援装置。

【請求項2】

請求項１に記載の移植支援装置であって、
前記推論部は、
前記ＣＮＮモデル及び前記複数の欠落ＣＮＮモデルと、前記試験入力パターンとを用いた推論によって、前記複数の試験出力パターンを生成する、移植支援装置。

【請求項3】

請求項２に記載の移植支援装置であって、
移植先の処理系のスケルトン用コードの断片を、スケルトンテンプレートとして取得するテンプレート取得部と、
前記複数の試験出力パターンと、前記スケルトンテンプレートとに基づいて、前記複数の層のそれぞれに対応する複数のスケルトンを生成するスケルトン生成部と
をさらに備える、移植支援装置。

【請求項4】

請求項３に記載の移植支援装置であって、
前記ＣＮＮモデルから、前記複数の層の名称を抽出する層名抽出部をさらに備え、
前記スケルトン生成部は、
前記スケルトンテンプレートと、前記複数の試験出力パターンと、前記複数の層の名称とに基づいて、前記複数の層の名称がそれぞれ付された前記複数のスケルトンを生成する、移植支援装置。

【請求項5】

モデル取得部が、ＣＮＮ（Convolution Neural Network）の複数の層と、当該層に付随する重みとを含むＣＮＮモデルを取得し、
欠落モデル生成部が、前記ＣＮＮモデルの前記複数の層の末尾の層から順に層が削除された複数の欠落ＣＮＮモデルを生成し、
試験パターン取得部が、前記ＣＮＮモデルの試験入力パターンを取得し、
推論部が、少なくとも前記複数の欠落ＣＮＮモデルと、前記試験入力パターンとを用いた推論によって、複数の試験出力パターンを生成する、移植支援方法。

【請求項6】

ＣＮＮ（Convolution Neural Network）の複数の層と、当該層に付随する重みとを含むＣＮＮモデルを取得する手段と、
前記ＣＮＮモデルの前記複数の層の末尾の層から順に層が削除された複数の欠落ＣＮＮモデルを生成する手段と、
前記ＣＮＮモデルの試験入力パターンを取得する手段と、
少なくとも前記複数の欠落ＣＮＮモデルと、前記試験入力パターンとを用いた推論によって、複数の試験出力パターンを生成する手段として
コンピュータを機能させる、移植支援プログラム。

【発明の詳細な説明】

【技術分野】

【0001】

本開示は、移植支援装置、移植支援方法及び移植支援プログラムに関する。

【背景技術】

【0002】

近年、フレームワークが存在する処理系から、フレームワークが存在しない処理系へのフレームワークの移植を支援する移植支援装置が提案されている。例えば特許文献１には、コンパイラのビルドエラーからソースコードを分析し、過去の修正履歴に基づいてソースコードを修正することで、ビルドエラーを自動で訂正する技術が提案されている。

【0003】

また例えば非特許文献１には、ＣＮＮ（Convolution Neural Network）の構成及び重みを含むＣＮＮモデルを学習したり、学習したＣＮＮモデルを用いた推論を行ったりするＣＮＮフレームワークが提案されている。

【先行技術文献】

【特許文献】

【0004】

【文献】特開２０１５－２６３６５号公報

【非特許文献】

【0005】

【文献】インターネット＜ＵＲＬ：https://www.tensorflow.org＞

【発明の概要】

【発明が解決しようとする課題】

【0006】

ＣＮＮフレームワークでは、ＣＮＮフレームワークが動作する処理系でのみ、学習したＣＮＮモデルを用いた推論を実行することが可能である。このため、ＣＮＮフレームワークが存在しない処理系に移植するためには、ＣＮＮの構成に含まれるConvolution層などの複数の層と、それらの層で用いられる重みとを特定する必要がある。

【0007】

しかしながら、ＣＮＮモデルへの入力パターンとＣＮＮモデルからの出力パターンとから、ＣＮＮモデルに含まれる複数の層のそれぞれの出力パターンを推測するのは困難である。このため、ＣＮＮモデルに含まれる複数の層及び重みを特定することが困難であり、その結果として、ＣＮＮフレームワークの移植が困難であるという問題があった。

【0008】

そこで、本開示は、上記のような問題点を鑑みてなされたものであり、ＣＮＮフレームワークの移植を容易化可能な技術を提供することを目的とする。

【課題を解決するための手段】

【0009】

本開示に係る移植支援装置は、ＣＮＮ（Convolution Neural Network）の複数の層と、当該層に付随する重みとを含むＣＮＮモデルを取得するモデル取得部と、前記ＣＮＮモデルの前記複数の層の末尾の層から順に層が削除された複数の欠落ＣＮＮモデルを生成する欠落モデル生成部と、前記ＣＮＮモデルの試験入力パターンを取得する試験パターン取得部と、少なくとも前記複数の欠落ＣＮＮモデルと、前記試験入力パターンとを用いた推論によって、複数の試験出力パターンを生成する推論部とを備える。

【発明の効果】

【0010】

本開示によれば、ＣＮＮモデルの複数の層の末尾の層から順に層が削除された複数の欠落ＣＮＮモデルを生成し、複数の欠落ＣＮＮモデルと、試験入力パターンとを用いた推論によって、複数の試験出力パターンを生成する。このような構成によれば、ＣＮＮフレームワークの移植を容易化することができる。

【図面の簡単な説明】

【0011】

【図1】実施の形態１に係る移植支援装置の構成を示すブロック図である。

【図2】実施の形態１に係るＣＮＮモデルの例を示す図である。

【図3】実施の形態１に係る欠落ＣＮＮモデルの例を示す図である。

【図4】実施の形態１に係る試験入力パターンの例を示す図である。

【図5】実施の形態１に係る試験出力パターンの例を示す図である。

【図6】実施の形態１に係るＣＮＮ層削減部の動作を示すフローチャートである。

【図7】実施の形態２に係る移植支援装置の構成を示すブロック図である。

【図8】実施の形態２に係るスケルトンテンプレートの例を示す図である。

【図9】実施の形態２に係るスケルトンコードの例を示す図である。

【図10】実施の形態２に係るスケルトン生成部の動作を示すフローチャートである。

【図11】実施の形態２に係るスケルトン生成部の動作を示すフローチャートである。

【図12】実施の形態３に係る移植支援装置の構成を示すブロック図である。

【図13】実施の形態３に係る層名付きスケルトンコードの例を示す図である。

【図14】実施の形態３に係る層名付きスケルトン生成部の動作を示すフローチャートである。

【図15】実施の形態３に係る層名付きスケルトン生成部の動作を示すフローチャートである。

【図16】その他の変形例に係る移植支援装置のハードウェア構成を示すブロック図である。

【図17】その他の変形例に係る移植支援装置のハードウェア構成を示すブロック図である。

【発明を実施するための形態】

【0012】

＜実施の形態１＞
図１は、本実施の形態１に係る移植支援装置の構成を示すブロック図である。図１に示す移植支援装置は、モデル取得部であるＣＮＮ入力部１と、欠落モデル生成部であるＣＮＮ層削減部２と、ＣＮＮ蓄積部３と、試験パターン取得部である試験パターン入力部４と、推論部であるＣＮＮ推論部５と、試験パターン蓄積部６を備える。

【0013】

ＣＮＮ層削減部２の入力は、ＣＮＮ入力部１の出力と、ＣＮＮ蓄積部３の出力とに接続される。ＣＮＮ蓄積部３の入力は、ＣＮＮ層削減部２の出力に接続される。ＣＮＮ推論部５の入力は、ＣＮＮ蓄積部３の出力と、試験パターン入力部４の出力とに接続される。試験パターン蓄積部６の入力は、ＣＮＮ推論部５の出力に接続される。

【0014】

ＣＮＮ入力部１は、移行元などのＣＮＮフレームワークで学習されたＣＮＮモデルを取得する。

【0015】

図２は、ＣＮＮモデル７の例を示す図である。ＣＮＮモデル７は、ＣＮＮの構成８とＣＮＮの重み９と含む。ＣＮＮの構成８は、どのような処理を実行するのかが記述されたＣＮＮの複数の層１０を含む。なお、以下の説明では、ＣＮＮの複数の層１０を「複数の層１０」とのみ記載したり、ＣＮＮの層１０を「層１０」とのみ記載したりすることもある。

【0016】

例えば、図２のＣＮＮの構成８は、順に並べられたＣｏｎｖｏｌｕｔｉｏｎ層→ＲｅＬＵ層→ＭａｘＰｏｏｌｉｎｇ層→…→Ｃｏｎｖｏｌｕｔｉｏｎ層を、ＣＮＮの複数の層１０として含んでいる。ＣＮＮの構成８は、例えば、ＪＳＯＮ、ＸＭＬ、及び、ＨＤＦなどの階層データ構造で記述される。

【0017】

少なくとも１つの層１０には、当該層１０などの演算で用いる係数及びパラメータがＣＮＮの重み９として付随する。例えば、図２の最初の層１０であるＣｏｎｖｏｌｕｔｉｏｎ層では、ｋｅｒｎｅｌ＿ｓｉｚｅ、ｋｅｒｎｅｌ、ｂｉａｓなどのＣｏｎｖｏｌｕｔｉｏｎを実行するのに必要なパラメータなどの数値が、ＣＮＮの重み９として付随する。ＣＮＮの重み９は、例えば、ＴＳＶ、ＣＳＶなどの行列データ構造、及び、ＪＳＯＮ、ＸＭＬ、及び、ＨＤＦなどの階層データ構造で記述される。

【0018】

図１のＣＮＮ層削減部２は、ＣＮＮ入力部１で取得されたＣＮＮモデル７の複数の層１０の末尾の層１０から順に層１０が削除された複数の欠落ＣＮＮモデルを生成する。以下、このようなＣＮＮ層削減部２の一例について説明する。

【0019】

まず、ＣＮＮ層削減部２は、ＣＮＮ入力部１で取得されたＣＮＮモデル７の複数の層１０の末尾の層１０を削除することによって欠落ＣＮＮモデルを生成する。ＣＮＮ層削減部２は、生成された欠落ＣＮＮモデルをＣＮＮ蓄積部３に蓄積する。

【0020】

それから、ＣＮＮ層削減部２は、ＣＮＮ蓄積部３に蓄積された欠落ＣＮＮモデルの複数の層１０の末尾の層１０を削除することによって新たな欠落ＣＮＮモデルを生成し、当該新たな欠落ＣＮＮモデルをＣＮＮ蓄積部３に蓄積する。ＣＮＮ層削減部２は、この動作を、欠落ＣＮＮモデルの層１０の数が１つになるまで繰り返す。この結果、ＣＮＮ層削減部２は、複数の層１０の数から１つ少ない数だけ、欠落ＣＮＮモデルを生成する。

【0021】

図２の例の場合、ＣＮＮ層削減部２は、ＣＮＮモデル７の末尾の層１０であるＣｏｎｖｏｌｕｔｉｏｎ層を削除することによって、図３の欠落ＣＮＮモデル１１ａを生成する。また、ＣＮＮ層削減部２は、欠落ＣＮＮモデル１１ａの末尾の層１０であるＭａｘＵｎｐｏｏｌｉｎｇ層を削除することによって、欠落ＣＮＮモデル１１ｂを生成する。ＣＮＮ層削減部２は、このような処理を繰り返すことによって、最終的にはＣＮＮモデル７の先頭の層であるＣｏｎｖｏｌｕｔｉｏｎ層を含む欠落ＣＮＮモデル１１ｎを生成する。以下、説明の便宜上、欠落ＣＮＮモデル１１ａ～１１ｎのそれぞれを欠落ＣＮＮモデル１１として記すこともある。

【0022】

ＣＮＮ蓄積部３は、ＣＮＮ層削減部２が生成した複数の欠落ＣＮＮモデル１１を格納する。

【0023】

試験パターン入力部４は、ＣＮＮモデル７の試験入力パターンなどの入力用のデータを取得する。ＣＮＮモデル７の試験入力パターン１５は、ＣＮＮモデル７を用いた推論に用いられ、欠落ＣＮＮモデル１１を用いた推論にも用いられる試験入力パターンである。

【0024】

図４は、試験入力パターン１５の例を示す図である。図４の例では、試験入力パターン１５は、２次元数値行列のデータであり、ＣＳＶで記述されている。試験入力パターン１５の次元数及びサイズは、ＣＮＮモデル７に含まれる先頭の層１０及びそのＣＮＮの重み９によって異なる。

【0025】

ＣＮＮ推論部５は、ＣＮＮ蓄積部３で蓄積された複数の欠落ＣＮＮモデル１１と、試験パターン入力部４で取得された試験入力パターン１５とを用いた推論によって、複数の試験出力パターンを生成する。本実施の形態１では、ＣＮＮ推論部５は、複数の欠落ＣＮＮモデル１１に、試験入力パターン１５を適用した推論によって、複数の試験出力パターンをそれぞれ生成する。なお、ＣＮＮ推論部５は、例えばＣＮＮフレームワークで構成される。

【0026】

図５は、試験出力パターン１６の例を示す図である。図５の例では、試験出力パターン１６は、２次元数値行列のデータであり、ＣＳＶで記述されている。同一の試験入力パターン１５に対する試験出力パターン１６は、欠落ＣＮＮモデル１１ごとに異なり、試験出力パターン１６の次元数やサイズは、欠落ＣＮＮモデル１１に含まれる層１０及びそのＣＮＮの重み９によって異なる。

【0027】

試験パターン蓄積部６は、ＣＮＮ推論部５で生成された複数の試験出力パターン１６を格納する。

【0028】

次に、ＣＮＮ層削減部２の動作について焼成に説明する。図６は、ＣＮＮ層削減部２による欠落ＣＮＮモデル１１の生成動作を示すフローチャートである。

【0029】

まずステップＳ１にて、ＣＮＮ層削減部２は、ＣＮＮ蓄積部３に欠落ＣＮＮモデル１１があるか否かを判定する。ＣＮＮ蓄積部３に欠落ＣＮＮモデル１１がないと判定された場合には処理がステップＳ２に進み、ＣＮＮ蓄積部３に欠落ＣＮＮモデル１１があると判定された場合には処理がステップＳ３に進む。

【0030】

ステップＳ２にて、ＣＮＮ層削減部２は、ＣＮＮ入力部１からＣＮＮモデル７を処理対象ＣＮＮモデルとして取得する。その後、処理がステップＳ４に進む。

【0031】

ステップＳ３にて、ＣＮＮ層削減部２は、ＣＮＮ蓄積部３から最後に格納した欠落ＣＮＮモデル１１を処理対象ＣＮＮモデルとして取得する。その後、処理がステップＳ４に進む。

【0032】

ステップＳ４にて、ＣＮＮ層削減部２は、処理対象ＣＮＮモデルが２つ以上の層１０を含むか否かを判定する。処理対象ＣＮＮモデルが２つ以上の層１０を含むと判定された場合には処理がステップＳ５に進み、処理対象ＣＮＮモデルが２つ以上の層１０を含むと判定されなかった場合には図６の動作が終了する。

【0033】

ステップＳ５にて、ＣＮＮ層削減部２は、処理対象ＣＮＮモデルから末尾の層１０を削除して、欠落ＣＮＮモデル１１を生成する。その後、処理がステップＳ６に進む。

【0034】

ステップＳ６にて、ＣＮＮ層削減部２は、ステップＳ５で生成した欠落ＣＮＮモデル１１をＣＮＮ蓄積部３に蓄積する。その後、処理がステップＳ１に戻る。

【0035】

＜実施の形態１のまとめ＞
以上のような本実施の形態１に係る移植支援装置によれば、ＣＮＮモデル７の複数の層１０の末尾の層１０から順に層１０が削除された複数の欠落ＣＮＮモデル１１を生成し、複数の欠落ＣＮＮモデル１１と、試験入力パターン１５とを用いた推論によって、複数の試験出力パターン１６を生成する。このような構成によれば、ＣＮＮモデル７の複数の層１０の出力パターンに概ね対応する複数の試験出力パターン１６から、ＣＮＮモデル７の複数の層１０及び重み９をある程度特定することができるので、ＣＮＮフレームワークの移植を容易化することができる。

【0036】

＜変形例１＞
実施の形態１では、ＣＮＮ層削減部２は、ＣＮＮ入力部１で取得されたＣＮＮモデル７の複数の層１０の末尾の層１０から順に層１０を削除していくことによって、複数の欠落ＣＮＮモデル１１を生成した。しかしながら、複数の欠落ＣＮＮモデル１１が、ＣＮＮモデル７の複数の層１０の末尾の層１０から順に層１０が削除されたものであれば、複数の欠落ＣＮＮモデル１１の生成方法は、これに限ったものではない。例えば、ＣＮＮ層削減部２は、ＣＮＮ入力部１で取得されたＣＮＮモデル７の複数の層１０の先頭の層１０から順に層１０を追加していくことによって、複数の欠落ＣＮＮモデル１１を生成してもよい。

【0037】

＜変形例２＞
実施の形態１では、ＣＮＮ推論部５は、複数の欠落ＣＮＮモデル１１と、試験入力パターン１５とを用いた推論によって、複数の試験出力パターンを生成したが、これに限ったものではない。例えば、ＣＮＮ推論部５は、複数の欠落ＣＮＮモデル１１と、試験入力パターン１５とを用いた推論と、ＣＮＮモデル７と、試験入力パターン１５とを用いた推論とによって、複数の試験出力パターンを生成してもよい。

【0038】

このような構成によれば、ＣＮＮモデル７の複数の層１０の出力パターンに対応する複数の試験出力パターン１６から、ＣＮＮモデル７の複数の層１０及び重み９を特定することができるので、ＣＮＮフレームワークの移植をさらに容易化することができる。なお、次に説明する実施の形態２では、ＣＮＮ推論部５は、ＣＮＮモデル７及び複数の欠落ＣＮＮモデル１１と、試験入力パターン１５とを用いた推論によって、複数の試験出力パターンを生成するものとする。

【0039】

＜実施の形態２＞
図７は、本実施の形態２に係る移植支援装置の構成を示すブロック図である。以下、本実施の形態２に係る構成要素のうち、上述の構成要素と同じまたは類似する構成要素については同じまたは類似する参照符号を付し、異なる構成要素について主に説明する。

【0040】

以下で説明するように、本実施の形態２に係る移植支援装置によれば、複数の試験出力パターン１６の次元やサイズを解析することで、複数の層１０のそれぞれに対応する複数のスケルトンとして、複数の移植先処理系のスケルトンコードを生成することが可能となっている。

【0041】

図７の移植支援装置の構成は、図１の構成に、テンプレート取得部であるスケルトンテンプレート入力部１７と、スケルトン生成部１８とが追加された構成と同様である。スケルトン生成部１８の入力は、試験パターン蓄積部６の出力と、スケルトンテンプレート入力部１７の出力とに接続される。

【0042】

スケルトンテンプレート入力部１７は、移植先の処理系のスケルトン用コードの断片を、スケルトンテンプレートとして取得する。

【0043】

図８は、スケルトンテンプレート１９の例を示す図である。図８のスケルトンテンプレート１９は、関数スケルトン２０と、次元開始文字列２１と、次元終了文字列２２とを含む。図８の例では、スケルトンテンプレート１９は、Ｃ言語のテンプレートであり、関数スケルトン２０は、ｖｏｉｄ型の戻り値と、どちらもｆｌｏａｔ型の入力を示すｉｎ及び出力を示すｏｕｔとを含む。関数名と入力と出力とを示す引数の次元やそのサイズはそれぞれ、＊ＮＡＭＥ＊、＊ＩＮ＿ＤＩＭ＊、＊ＯＵＴ＿ＤＩＭ＊という文字列で代替されている。次元開始文字列２１は、これら文字列の値の前に付加すべき文字であり、図８の例では「［」である。次元終了文字列２２は、これら文字列の値の後に付加すべき文字であり、図８の例では「］」である。

【0044】

スケルトン生成部１８は、試験パターン蓄積部６から試験出力パターン１６を取得して次元数及びサイズを解析する。そして、スケルトン生成部１８は、解析結果と、スケルトンテンプレート入力部１７で取得されたスケルトンテンプレート１９とに基づいて、ＣＮＮの複数の層１０のそれぞれに対応する複数の移植先処理系のスケルトンコードを生成する。生成されたスケルトンコードは、図示しないスケルトンファイルなどに記述される。なお、以下の説明では移植先処理系のスケルトンコードを「スケルトンコード」とのみ記載することもある。スケルトンコードは、ＣＮＮモデル７の複数の層１０における移植先処理系の関数やメソッドであり、具体的な処理は実装されていない。

【0045】

図９は、スケルトンコード２３の例を示す図である。図９は、図８のスケルトンテンプレート１９から生成されるスケルトンコード２３である。図９の例では、図８の＊ＮＡＭＥ＊がｌａｙｅｒ＿１に置換され、＊ＩＮ＿ＤＩＭ＊が［１２８］に、＊ＯＵＴ＿ＤＩＭ＊が［１２８］［６４］に置換されている。図９の例のスケルトンコード２３は、図２の最初の層１０に対応しており、入力の次元は１次元でそのサイズは１２８であり、出力の次元は２次元でそのサイズは１２８×６４である。

【0046】

図１０及び図１１は、スケルトン生成部１８によるスケルトンコード２３の生成動作を示すフローチャートである。

【0047】

まずステップＳ１１にて、スケルトン生成部１８は、スケルトンファイルを削除する。その後、処理がステップＳ１２に進む。

【0048】

ステップＳ１２にて、スケルトン生成部１８は、「層数」に０を代入する。その後、処理がステップＳ１３に進む。

【0049】

ステップＳ１３にて、スケルトン生成部１８は、試験パターン入力部４及び試験パターン蓄積部６に、「層数」に対応する試験入力パターン１５及び試験出力パターン１６があるか否かを判定する。例えば、スケルトン生成部１８は、「層数」が、試験入力パターン１５から取得される層数よりも小さいか否かに基づいてステップＳ１３の判定を行う。「層数」に対応する試験入力パターン１５及び試験出力パターン１６があると判定された場合には処理がステップＳ１４に進み、「層数」に対応する試験入力パターン１５及び試験出力パターン１６があると判定されなかった場合には図１０の動作が終了する。

【0050】

ステップＳ１４にて、スケルトン生成部１８は、試験パターン入力部４及び試験パターン蓄積部６から、「層数」に対応する試験入力パターン１５及び試験出力パターン１６を取得する。その後、処理がステップＳ１５に進む。

【0051】

ステップＳ１５にて、スケルトン生成部１８は、関数スケルトン２０を複製して、複製された関数スケルトンの＊ＮＡＭＥ＊を「ｌａｙｅｒ＿１＋層数」で置換する。例えば、「層数」が０である場合、複製された関数スケルトンの＊ＮＡＭＥ＊は、「ｌａｙｅｒ＿１」に置換される。その後、処理がステップＳ１６に進む。

【0052】

ステップＳ１６にて、スケルトン生成部１８は、試験入力パターン１５から入力の次元数を取得する。その後、処理がステップＳ１７に進む。

【0053】

ステップＳ１７にて、スケルトン生成部１８は、「入力次元」に０を代入する。その後、処理がステップＳ１８に進む。

【0054】

ステップＳ１８にて、スケルトン生成部１８は、「入力次元文字列」を初期化する。その後、処理がステップＳ１９に進む。

【0055】

ステップＳ１９にて、スケルトン生成部１８は、「入力次元」が、ステップＳ１６で取得された入力の次元数より小さいか否かを判定する。「入力次元」が、ステップＳ１６で取得された入力の次元数よりも小さい場合には処理がステップＳ２０に進み、「入力次元」が、ステップＳ１６で取得された入力の次元数以上である場合には処理が図１１のステップＳ２３に進む。

【0056】

ステップＳ２０にて、スケルトン生成部１８は、試験入力パターン１５から入力の次元のサイズを取得する。その後、処理がステップＳ２１に進む。

【0057】

ステップＳ２１にて、スケルトン生成部１８は、「入力次元文字列」に、「次元開始文字列２１＋ステップＳ２０で取得された入力の次元のサイズ＋次元終了文字列２２」を追加する。例えば、図８の例において、ステップＳ２０で取得された次元のサイズが１２８であった場合、「入力次元文字列」に［１２８］が追加される。その後、処理がステップＳ２２に進む。

【0058】

ステップＳ２２にて、スケルトン生成部１８は、「入力次元」に、「入力次元」＋１を代入する、つまり「入力次元」をインクリメントする。その後、処理がステップＳ１９に戻る。

【0059】

図１１のステップＳ２３にて、スケルトン生成部１８は、複製された関数スケルトンの＊ＩＮ＿ＤＩＭ＊を「入力次元文字列」で置換する。その後、処理がステップＳ２４に進む。

【0060】

ステップＳ２４にて、スケルトン生成部１８は、試験出力パターン１６から出力の次元数を取得する。その後、処理がステップＳ２５に進む。

【0061】

ステップＳ２５にて、スケルトン生成部１８は、「出力次元」に０を代入する。その後、処理がステップＳ２６に進む。

【0062】

ステップＳ２６にて、スケルトン生成部１８は、「出力次元文字列」を初期化する。その後、処理がステップＳ２７に進む。

【0063】

ステップＳ２７にて、スケルトン生成部１８は、「出力次元」が、ステップＳ２４で取得された出力の次元数より小さいか否かを判定する。「出力次元」が、ステップＳ２４で取得された出力の次元数よりも小さい場合には処理がステップＳ２８に進み、「出力次元」が、ステップＳ２４で取得された出力の次元数以上である場合には処理がステップＳ３１に進む。

【0064】

ステップＳ２８にて、スケルトン生成部１８は、試験出力パターン１６から出力の次元のサイズを取得する。その後、処理がステップＳ２９に進む。

【0065】

ステップＳ２９にて、スケルトン生成部１８は、「出力次元文字列」に、「次元開始文字列２１＋ステップＳ２８で取得された出力の次元のサイズ＋次元終了文字列２２」を追加する。

【0066】

ステップＳ３０にて、スケルトン生成部１８は、「出力次元」に、「出力次元」＋１を代入する、つまり「出力次元」をインクリメントする。その後、処理がステップＳ２７に戻る。

【0067】

ステップＳ３１にて、スケルトン生成部１８は、複製された関数スケルトンの＊ＯＵＴ＿ＤＩＭ＊を「出力次元文字列」で置換する。その後、処理がステップＳ３２に進む。

【0068】

ステップＳ３２にて、スケルトン生成部１８は、置換された関数スケルトンをスケルトンファイルの末尾に追加する。その後、処理がステップＳ３３に進む。

【0069】

ステップＳ３３にて、スケルトン生成部１８は、「層数」に、「層数」＋１を代入する、つまり「層数」をインクリメントする。その後、処理がステップＳ１３に戻る。

【0070】

＜実施の形態２のまとめ＞
以上のような本実施の形態２に係る移植支援装置によれば、複数の試験出力パターン１６と、スケルトンテンプレート１９とに基づいて、ＣＮＮモデル７の複数の層１０のそれぞれに対応する複数のスケルトンコード２３を生成する。このような構成によれば、ＣＮＮフレームワークの移植を容易化することができる。

【0071】

＜実施の形態３＞
図１２は、本実施の形態３に係る移植支援装置の構成を示すブロック図である。以下、本実施の形態３に係る構成要素のうち、上述の構成要素と同じまたは類似する構成要素については同じまたは類似する参照符号を付し、異なる構成要素について主に説明する。

【0072】

実施の形態２では、ＣＮＮの複数の層１０の移植先処理系のスケルトンコードには、ｌａｙｅｒ＿１、ｌａｙｅｒ＿２、…などの通し番号が付された。これに対して、以下で説明するように、本実施の形態３に係る移植支援装置によれば、複数の層１０の名称がそれぞれ付された複数のスケルトンとして、複数の移植先処理系の層名付きスケルトンコードを生成することが可能となっている。

【0073】

図１２の移植支援装置の構成は、図７の構成に、層名抽出部であるＣＮＮ層名抽出部２５が追加され、試験パターン蓄積部６及びスケルトン生成部１８を、層名付き試験パターン蓄積部２６及び層名付きスケルトン生成部２７に変更された構成と同様である。

【0074】

ＣＮＮ層名抽出部２５の入力は、ＣＮＮ入力部１の出力に接続される。層名付き試験パターン蓄積部２６の入力は、ＣＮＮ層名抽出部２５の出力と、ＣＮＮ推論部５の出力とに接続される。層名付きスケルトン生成部２７の入力は、層名付き試験パターン蓄積部２６の出力と、スケルトンテンプレート入力部１７の出力とに接続される。

【0075】

ＣＮＮ層名抽出部２５は、ＣＮＮ入力部１で取得されたＣＮＮモデル７から、複数の層１０の名称を抽出する。

【0076】

層名付き試験パターン蓄積部２６は、ＣＮＮ推論部５で生成された試験出力パターン１６と、ＣＮＮ層名抽出部２５で抽出された複数の層１０の名称とを蓄積する。

【0077】

層名付きスケルトン生成部２７は、層名付き試験パターン蓄積部２６に蓄積された試験出力パターン１６及び複数の層１０の名称と、スケルトンテンプレート入力部１７で取得されたスケルトンテンプレート１９とに基づいて、複数の層名付きスケルトンコードを生成する。つまり、層名付きスケルトン生成部２７は、層名を付す機能が付されたスケルトン生成部１８に相当し、複数の層名付きスケルトンコードは、複数の層１０の名称がそれぞれ付された複数のスケルトンコード２３に相当する。層名付きスケルトンコードは、図示しないスケルトンファイルなどに記述される。層名付きスケルトンコードは、スケルトンコード２３と同様に、ＣＮＮモデル７の複数の層１０における移植先処理系の関数やメソッドであり、具体的な処理は実装されていない。

【0078】

図１３は、層名付きスケルトンコード２８の例を示す図である。図１３は、図８のスケルトンテンプレート１９から生成される層名付きスケルトンコード２８である。図１３の例では、図８の＊ＮＡＭＥ＊が、図２の最初の層１０の名称を示すＣｏｎｖｏｌｕｔｉｏｎ＿１に置換され、＊ＩＮ＿ＤＩＭ＊が［１２８］に、＊ＯＵＴ＿ＤＩＭ＊が［１２８］［６４］に置換されている。図１３の例の層名付きスケルトンコード２８は、図２の最初の層１０に対応しており、入力の次元は１次元でそのサイズは１２８であり、出力の次元は２次元でそのサイズは１２８×６４である。

【0079】

図１４及び図１５は、層名付きスケルトン生成部２７による層名付きスケルトンコード２８の生成動作を示すフローチャートである。図１４及び図１５のフローチャートは、図１０及び図１１のフローチャートのうちステップＳ１４及びステップＳ１５をステップＳ１４ａ及びステップＳ１５ａに変更したものと同様である。このため、以下、ステップＳ１４ａ及びステップＳ１５ａの処理についてのみ説明する。

【0080】

ステップＳ１４ａにて、スケルトン生成部１８は、試験パターン入力部４及び試験パターン蓄積部６から、「層数」に対応する試験入力パターン１５、試験出力パターン１６、及び、層１０の名称を取得する。その後、処理がステップＳ１５ａに進む。

【0081】

ステップＳ１５ａにて、スケルトン生成部１８は、関数スケルトン２０を複製して、複製された関数スケルトンの＊ＮＡＭＥ＊を「ステップＳ１４で取得された層１０の名称＿１＋層数」で置換する。例えば、図２のＣＮＮモデル７に対して動作が行われ、「層数」が０である場合、複製された関数スケルトンの＊ＮＡＭＥ＊は、「Ｃｏｎｖｏｌｕｔｉｏｎ＿１」に置換される。その後、処理がステップＳ１６に進む。

【0082】

＜実施の形態３のまとめ＞
以上のような本実施の形態３に係る移植支援装置によれば、複数の層名付きスケルトンコード、つまり複数の層１０の名称がそれぞれ付された複数のスケルトンコード２３を生成することができる。これにより、移植先関数スケルトンの取り違えによる実装誤りを回避することができるので、ＣＮＮフレームワークの移植を容易化することができる。

【0083】

＜その他の変形例＞
上述した図１のＣＮＮ入力部１、ＣＮＮ層削減部２、試験パターン入力部４、及び、ＣＮＮ推論部５を、以下「ＣＮＮ入力部１等」と記す。ＣＮＮ入力部１等は、図１６に示す処理回路８１により実現される。すなわち、処理回路８１は、ＣＮＮの複数の層と、当該層に付随する重さとを含むＣＮＮモデルを取得するＣＮＮ入力部１と、ＣＮＮモデルの複数の層の末尾の層から順に層が削除された複数の欠落ＣＮＮモデルを生成するＣＮＮ層削減部２と、ＣＮＮモデルの試験入力パターンを取得する試験パターン入力部４と、少なくとも複数の欠落ＣＮＮモデルと、試験入力パターンとを用いた推論によって、複数の試験出力パターンを生成するＣＮＮ推論部５と、を備える。処理回路８１には、専用のハードウェアが適用されてもよいし、メモリに格納されるプログラムを実行するプロセッサが適用されてもよい。プロセッサには、例えば、中央処理装置、処理装置、演算装置、マイクロプロセッサ、マイクロコンピュータ、ＤＳＰ（Digital Signal Processor）などが該当する。

【0084】

処理回路８１が専用のハードウェアである場合、処理回路８１は、例えば、単一回路、複合回路、プログラム化したプロセッサ、並列プログラム化したプロセッサ、ＡＳＩＣ（Application Specific Integrated Circuit）、ＦＰＧＡ（Field Programmable Gate Array）、またはこれらを組み合わせたものが該当する。ＣＮＮ入力部１等の各部の機能それぞれは、処理回路を分散させた回路で実現されてもよいし、各部の機能をまとめて一つの処理回路で実現されてもよい。

【0085】

処理回路８１がプロセッサである場合、ＣＮＮ入力部１等の機能は、ソフトウェア等との組み合わせにより実現される。なお、ソフトウェア等には、例えば、ソフトウェア、ファームウェア、または、ソフトウェア及びファームウェアが該当する。ソフトウェア等はプログラムとして記述され、メモリに格納される。図１７に示すように、処理回路８１に適用されるプロセッサ８２は、メモリ８３に記憶されたプログラムを読み出して実行することにより、各部の機能を実現する。すなわち、移植支援装置は、処理回路８１により実行されるときに、ＣＮＮの複数の層と、当該層に付随する重さとを含むＣＮＮモデルを取得するステップと、ＣＮＮモデルの複数の層の末尾の層から順に層が削除された複数の欠落ＣＮＮモデルを生成するステップと、ＣＮＮモデルの試験入力パターンを取得するステップと、少なくとも複数の欠落ＣＮＮモデルと、試験入力パターンとを用いた推論によって、複数の試験出力パターンを生成するステップと、が結果的に実行されることになるプログラムを格納するためのメモリ８３を備える。換言すれば、このプログラムは、ＣＮＮ入力部１等の手順や方法をコンピュータに実行させるものであるともいえる。ここで、メモリ８３は、例えば、ＲＡＭ（Random Access Memory）、ＲＯＭ（Read Only Memory）、フラッシュメモリ、ＥＰＲＯＭ（Erasable Programmable Read Only Memory）、ＥＥＰＲＯＭ（Electrically Erasable Programmable Read Only Memory）などの、不揮発性または揮発性の半導体メモリ、ＨＤＤ（Hard Disk Drive）、磁気ディスク、フレキシブルディスク、光ディスク、コンパクトディスク、ミニディスク、ＤＶＤ（Digital Versatile Disc）、それらのドライブ装置等、または、今後使用されるあらゆる記憶媒体であってもよい。

【0086】

以上、ＣＮＮ入力部１等の各機能が、ハードウェア及びソフトウェア等のいずれか一方で実現される構成について説明した。しかしこれに限ったものではなく、ＣＮＮ入力部１等の一部を専用のハードウェアで実現し、別の一部をソフトウェア等で実現する構成であってもよい。例えば、ＣＮＮ入力部１については専用のハードウェアとしての処理回路８１、インターフェース及びレシーバなどでその機能を実現し、それ以外についてはプロセッサ８２としての処理回路８１がメモリ８３に格納されたプログラムを読み出して実行することによってその機能を実現することが可能である。

【0087】

以上のように、処理回路８１は、ハードウェア、ソフトウェア等、またはこれらの組み合わせによって、上述の各機能を実現することができる。

【0088】

また、以上で説明した移植支援装置は、通信端末と、サーバとを適宜に組み合わせてシステムとして構築される移植支援システムにも適用することができる。この場合、以上で説明した移植支援装置の各機能あるいは各構成要素は、前記システムを構築する各機器に分散して配置されてもよいし、いずれかの機器に集中して配置されてもよい。

【0089】

なお、各実施の形態及び各変形例を自由に組み合わせたり、各実施の形態及び各変形例を適宜、変形、省略したりすることが可能である。

【符号の説明】

【0090】

１ＣＮＮ入力部、２ＣＮＮ層削減部、４試験パターン入力部、５ＣＮＮ推論部、７ＣＮＮモデル、９重み、１０層、１１欠落ＣＮＮモデル、１５試験入力パターン、１６試験出力パターン、１７スケルトンテンプレート入力部、１８スケルトン生成部、１９スケルトンテンプレート、２３スケルトンコード、２６層名付き試験パターン蓄積部、２７層名付きスケルトン生成部、２８層名付きスケルトンコード。

【図1】