特開2023-154373 | 知財ポータル「IP Force」

知財求人 - 知財ポータルサイト「IP Force」

▶ 株式会社野村総合研究所の特許一覧

特開2023-154373情報処理装置

書誌要約請求の範囲詳細な説明課題実施例実施するための形態図面の説明

目に優しい文字サイズ小中大 PDF Top

< >

1
2
3
4
5
6
7
8
9
10
11
12
13

(19)【発行国】日本国特許庁(JP)

(12)【公報種別】公開特許公報(A)

(11)【公開番号】P2023154373

(43)【公開日】2023-10-19

(54)【発明の名称】情報処理装置

(51)【国際特許分類】

G06N 3/08 20230101AFI20231012BHJP

【ＦＩ】

G06N3/08

【審査請求】未請求

【請求項の数】5

【出願形態】ＯＬ

(21)【出願番号】P 2022111963

(22)【出願日】2022-07-12

(31)【優先権主張番号】17/714,563

(32)【優先日】2022-04-06

(33)【優先権主張国・地域又は機関】US

(71)【出願人】

【識別番号】000155469

【氏名又は名称】株式会社野村総合研究所

(74)【代理人】

【識別番号】110003281

【氏名又は名称】弁理士法人大塚国際特許事務所

(72)【発明者】

【氏名】田篭照博

(57)【要約】（修正有）

【課題】敵対的トレーニングを用いる場合に、特定のロバストネスを満たすことを予見可能なディープニューラルネットワークを生成する装置を提供する。
【解決手段】情報処理装置は、敵対的トレーニングの特性に関するユーザ設定を取得するユーザ設定取得部と、敵対的サンプルとオリジナルの分類クラスを示す正解データとを含む学習データ及びユーザ設定を用いてニューラルネットワークを学習させる敵対的トレーニングを実行する処理部と、を含む。敵対的トレーニングは、敵対的サンプルが入力された場合に誤分類クラスを出力するニューラルネットワークを、敵対的サンプルを入力した場合にオリジナルの分類クラスを出力するように学習させる。形式検証アルゴリズムを実行することにより、敵対的トレーニングによって学習された重み係数を用いるニューラルネットワークにおいて、特定のデータの所定のノイズの範囲内に敵対的サンプルが存在しないことを判定する。
【選択図】図３

【特許請求の範囲】

【請求項1】

情報処理装置であって、
１つ以上のプロセッサと、
１つ以上のプログラムを含むメモリと、を含み、前記１つ以上のプログラムは、前記１つ以上のプロセッサによって実行されると、前記情報処理装置に、
敵対的トレーニングの特性に関するユーザ設定を取得することと、
敵対的サンプルとオリジナルの分類クラスを示す正解データとを含む学習データと前記ユーザ設定とを用いてニューラルネットワークを学習させる前記敵対的トレーニングを実行することであって、前記敵対的トレーニングは、前記敵対的サンプルが入力された場合に誤分類クラスを出力するニューラルネットワークを、前記敵対的サンプルを入力した場合に前記オリジナルの分類クラスを出力するように学習させる、ことと、
形式検証アルゴリズムを実行することにより、前記敵対的トレーニングによって学習された重み係数を用いる前記ニューラルネットワークにおいて、特定のデータの所定のノイズの範囲内に敵対的サンプルが存在しないことを判定することと、を実行させる、情報処理装置。

【請求項2】

前記１つ以上のプロセッサは、
前記敵対的トレーニングの特性に関する設定のうちの少なくとも１つの設定の値を変更しながら、前記敵対的トレーニングを実行することと、前記敵対的トレーニングによって学習されたニューラルネットワークが所定の正解率を満たすかを判定することと、を繰り返し、
敵対的トレーニングによって学習されたニューラルネットワークが前記所定の正解率を満たすと判定したことに応じて、直前の前記敵対的トレーニングによって学習された重み係数を用いる前記ニューラルネットワークにおいて特定のデータの所定のノイズの範囲内に敵対的サンプルが存在しないことを、前記形式検証アルゴリズムにより判定する、請求項１に記載の情報処理装置。

【請求項3】

前記設定は、前記敵対的サンプルのノイズの大きさを含み、
前記１つ以上のプロセッサは、
前記敵対的サンプルのノイズの範囲の値を変更しながら、前記敵対的トレーニングを実行する、請求項２に記載の情報処理装置。

【請求項4】

前記敵対的トレーニングによって学習されたニューラルネットワークが前記所定の正解率を満たすかを判定することは、前記敵対的トレーニングによって学習されたニューラルネットワークとテストデータとを用いたテストの正解率が、定められた閾値を超えるかを判定することを含む、請求項３に記載の情報処理装置。

【請求項5】

前記設定は、敵対的サンプルの生成アルゴリズムを含み、
前記１つ以上のプロセッサは、
前記敵対的サンプルの生成アルゴリズムを変更しながら、前記敵対的トレーニングを実行する、請求項２に記載の情報処理装置。

【発明の詳細な説明】

【技術分野】

【0001】

本発明は、敵対的トレーニングと形式手法を用いて、ディープニューラルネットワークのロバストネスを向上させる情報処理装置に関する。

【背景技術】

【0002】

近年、ディープラーニング技術を用いて、画像に含まれる被写体を高い認識確率で認識することが可能になっている。このような、被写体認識などの分類問題を行うディープニューラルネットワークに対して、人間では気づかない程度のノイズ（摂動）を加えた敵対的サンプルと呼ばれる画像を入力し、意図的に誤分類を引き起こす技術が知られている。

【0003】

一方、敵対的サンプルを用いたディープニューラルネットワークに誤分類を引き起こさせる攻撃に対して、ロバストネス（頑健性）を向上させるようにディープニューラルネットワークを学習させる敵対的トレーニングと呼ばれる技術が開発されている（非特許文献１）。

【先行技術文献】

【非特許文献】

【0004】

【非特許文献1】Aleksander Madry、外4名、「Towards Deep Learning Models Resistant to Adversarial Attacks」 ICLR 2018、2017年6月19日、URL: https://arxiv.org/abs/1706.06083

【発明の概要】

【発明が解決しようとする課題】

【0005】

敵対的トレーニングでは、敵対的サンプルを学習データとして用いて、当該敵対的サンプルを入力しても誤分類を行わないようにディープニューラルネットワークを学習させる。このため、敵対的トレーニングによって生成されたディープニューラルネットワークは、一般的なディープニューラルネットワークの学習と同様に、学習やテストに用いるデータのサンプルにおいて高い正解率を出すことが可能になったとしても、常に正しい分類結果を出力することは保証されない。

【0006】

他方、敵対的サンプルに対する誤分類が深刻な結果をもたらす場合があるため、敵対的トレーニングを行う場合に、学習されたニューラルネットワークがどの程度のロバストネスを満たすのかを予見可能であることが望ましい。

【0007】

本発明は、上記課題に鑑みてなされ、その目的は、敵対的トレーニングを用いる場合に、特定のロバストネスを満たすことを予見可能なディープニューラルネットワークを生成する技術を実現することである。

【課題を解決するための手段】

【0008】

この課題を解決するため、例えば本発明の情報処理装置は以下の構成を備える。すなわち、
情報処理装置であって、
１つ以上のプロセッサと、
１つ以上のプログラムを含むメモリと、を含み、前記１つ以上のプログラムは、前記１つ以上のプロセッサによって実行されると、前記情報処理装置に、
敵対的トレーニングの特性に関するユーザ設定を取得することと、
前記ユーザ設定を用いて、敵対的サンプルとオリジナルの分類クラスを示す正解データを含む学習データを用いてニューラルネットワークを学習させる前記敵対的トレーニングを実行することであって、前記敵対的トレーニングは、前記敵対的サンプルが入力された場合に誤分類クラスを出力するニューラルネットワークを、前記敵対的サンプルを入力した場合に前記オリジナルの分類クラスを出力するように学習させる、ことと、
形式検証アルゴリズムを実行することにより、前記敵対的トレーニングによって学習された重み係数を用いる前記ニューラルネットワークにおいて、特定のデータの所定のノイズの範囲内に敵対的サンプルが存在しないことを判定することと、を実行させる。

【発明の効果】

【0009】

本発明によれば、敵対的トレーニングを用いる場合に、特定のロバストネスを満たすことを予見可能なディープニューラルネットワークを生成可能になる。

【図面の簡単な説明】

【0010】

【図1】本発明の実施形態に係る情報提供システムの概要を説明する図

【図2】本実施形態に係る情報処理装置のハードウェア構成例を示すブロック図

【図3】情報処理装置の機能構成例についてを示すブロック図

【図4】通常の学習によるサンプルの分類と敵対的トレーニングによるサンプルの分類の違いを説明するための図（１）

【図5】通常の学習によるサンプルの分類と敵対的トレーニングによるサンプルの分類の違いを説明するための図（２）

【図6】回帰モデルに形式検証を適用した場合を説明するための例（１）

【図7】回帰モデルに形式検証を適用した場合を説明するための例（２）

【図8】分類モデルに形式検証を適用した場合を説明するための例（１）

【図9】分類モデルに形式検証を適用した場合を説明するための例（２）

【図10】情報処理装置におけるロバストネス向上処理の動作を示すフローチャート

【図11】学習データ及びテストデータのデータ構造の一例を示す図

【図12】敵対的サンプルデータのデータ構造の一例を示す図

【図13】モデルデータ３３４のデータ構造の一例を示す図

【発明を実施するための形態】

【0011】

以下、添付図面を参照して実施形態を詳しく説明する。なお、以下の実施形態は特許請求の範囲に係る発明を限定するものではなく、また実施形態で説明されている特徴の組み合わせの全てが発明に必須のものとは限らない。実施形態で説明されている複数の特徴のうち二つ以上の特徴は任意に組み合わされてもよい。また、同一若しくは同様の構成には同一の参照番号を付し、重複した説明は省略する。

【0012】

＜情報処理システムの概要＞
図１を参照して、本実施形態に係る情報処理システムの一例について説明する。情報処理システム１０は、例えば、情報処理装置１００と電子デバイス１０１と、通信端末１０２とから構成され、これらはネットワークを通じて互いに通信可能である。情報処理装置１００は、ロバストネス（頑健性）向上処理を実行することにより、敵対的トレーニングと形式検証を終えた学習済みのモデル（検証済みディープニューラルネットワークともいう）を生成する。ロバストネス向上処理、敵対的トレーニング、及び形式検証については、後述する。情報処理装置１００は、例えばサーバ装置であるが、ネットワーク上に配置されるエッジノードであってもよいし、Ｐ２Ｐネットワークを構成するノードであってもよい。本実施形態では、説明の簡単のため、サーバ装置が１台のコンピュータで構成される場合を例に説明するが、複数のコンピュータで構成されてもよいし、ホスト上で動作する仮想マシンによって具現化されてもよい。

【0013】

通信端末１０２は、ロバストネス向上処理に必要なデータや設定値をユーザ１０３が指定したり、或いは、ユーザ１０３が必要なデータを情報処理装置１００にアップロードしたりする通信端末である。通信端末１０２は、例えばパーソナルコンピュータであるが、タブレット機器やスマートフォンであってもよい。

【0014】

電子デバイス１０１は、ロバストネス向上処理によって生成された検証済みのニューラルネットワークが配置される電子デバイスである。電子デバイス１０１は、例えば、ユーザの指示に応じて、或いは、システムアップデートなどの特定のトリガの発生に応じて、検証済みのニューラルネットワークを情報処理装置１００からダウンロードしてよい。図１に示す例では、電子デバイス１０１が例えばモバイルデバイスである場合を例に示しているが、画像認識処理を行う他の電子デバイスであってよい。電子デバイスは、例えば車両などであってもよい。ここでは、電子デバイス１０１にダウンロードする構成を示したが、電子デバイス１０１に代わり、ニューラルネットワークを取り込んだウェブアプリケーションサーバであってもよいし、または、情報処理装置１００がクラウドサービスのプラットフォーム上に構築され、情報処理装置１００自体又はクラウドサービスのプラットフォーム上の別の装置にニューラルネットワークを取り込んだ構成であってもよい。

【0015】

詳細は後述するが、本実施形態に係るロバストネス向上処理を行うことにより、ニューラルネットワークに対する敵対的トレーニングや形式検証が行われる。このため、ロバストネス向上処理を行ったニューラルネットワークは、敵対的サンプルに対するロバストネスが向上する。敵対的サンプルは、人間の目には気づかれないレベルのノイズ（摂動ともいう）を加えることにより、ニューラルネットワークが誤分類を引き起こすように生成されるサンプル（入力データ）である。敵対的サンプルに対してロバストネスを向上させたニューラルネットワークは、以下のようなユースケースの一例において、誤分類によるセキュリティリスクを軽減可能である。

【0016】

例えば、動物が撮影された画像を入力すると画像に含まれる動物が何であるかを分類するニューラルネットワークを例に説明する。このニューラルネットワークは、例えばパンダの画像が入力されると、被写体がパンダであるとの分類結果を出力する。例えば、このパンダの画像に数学的に計算されたノイズ（摂動）を加えた画像を敵対的サンプルとして生成する。この敵対的サンプル（ノイズの加わったパンダの画像）は、人間の目で見るとパンダの画像に見える。しかし、敵対的トレーニングを実行していないニューラルネットワークに当該敵対的サンプルを入力すると、ニューラルネットワークは、例えばテナガザルのような誤った分類結果を出力する。これに対し、本実施形態に係るロバストネス向上処理を行った検証済みのニューラルネットワークを用いる電子デバイスでは、ロバストネス要件を満たす範囲のノイズの敵対的サンプルについて、正しい分類結果（すなわちパンダ）を得ることができる。

【0017】

別の例として、人の顔が撮影された画像を入力すると画像に含まれる人物がだれであるかを分類するニューラルネットワークを例に説明する。このような顔認識技術は、例えば、部屋への出入りや監視画像の解析において有用である。ノイズを加えた模様を有するサングラスを着用した人の状態（すなわち敵対的サンプル）について、敵対的トレーニングを実行していないニューラルネットワークによる顔認識処理を行うと、当該ニューラルネットワークは別の人物として認識する。これに対し、本実施形態に係るロバストネス向上処理を行った検証済みのニューラルネットワークを用いる電子デバイスでは、ロバストネス要件を満たす範囲のノイズの敵対的サンプルについて、正しい人物を分類結果として得ることができる。すなわち、電子デバイスの誤動作（敵対的サンプルによるなりすまし）を防止することができる。

【0018】

他の例として、ディープフェイク技術によって生成された、世の中に存在しない人物の顔画像（或いは動画像）に対して、その画像がディープフェイク技術によって生成された画像であるか否かを分類するニューラルネットワークを例に説明する。このような分類器は、ディープフェイク技術によって生成された証明写真やアカウント用の画像を判定したり、政治的な世論操作のために生成された動画を判定するために有用である。敵対的サンプルによってこのようなニューラルネットワークの判定が回避される場合、セキュリティ上のリスクが存在する。これに対し、本実施形態に係るロバストネス向上処理を行った検証済みのニューラルネットワークを用いる電子デバイスでは、ロバストネス要件を満たす範囲のノイズの敵対的サンプルについて、ディープフェイクであるか否かの正しい判定結果を得ることができる。

【0019】

別の例として、画像内の速度標識から法定速度を認識するニューラルネットワークを例に説明する。この例では当該ニューラルネットワークが車両に搭載される場合がある。このようなニューラルネットワークは、画像内の速度標識から法定速度を認識し、走行する車両が法定速度で走行可能にする。標識に模様を付すことにより敵対的サンプル化させた場合、敵対的トレーニングを実行していないニューラルネットワークにより認識処理を行うと、異なる速度や停止の標識として誤分類する場合がある。これに対し、本実施形態に係るロバストネス向上処理を行った検証済みのニューラルネットワークを用いる電子デバイスでは、ロバストネス要件を満たす範囲のノイズの敵対的サンプルについて、正しい標識の分類結果を得ることができる。

【0020】

本実施形態に係る検証済みのニューラルネットワークを用いる電子デバイスを実際のアプリケーションに適用可能な場面は様々である。しかし、本実施形態に係る検証済みのニューラルネットワークを実際のアプリケーションに適用可能な場面や効果は上述の例に限定されない。

【0021】

＜情報処理装置のハードウェア構成例＞
図２を参照して、情報処理装置１００のハードウェア構成例について説明する。情報処理装置１００は、メモリ２０２と、プロセッサ２０４と、通信インタフェース２０６と、ストレージ２０８と、入力インタフェース２１０とを含む。これらの要素はそれぞれバス２１４に接続され、バス３７０を介して互いに通信する。

【0022】

メモリ２０２は、例えばＤＲＡＭなどの揮発性の記憶媒体であって、データやプログラムを一次的に記憶する。また、ストレージ２０８は、データやプログラムを永続的に記憶する不揮発性の記憶媒体である。ストレージ２０８は、例えば半導体メモリやハードディスクであってよい。ストレージ２０８は、後述するニューラルネットワークを学習させるための学習データ、学習済みのニューラルネットワークをテストするためのテストデータ、敵対的サンプルのデータなどの敵対的トレーニングや形式検証の実行に必要な各種データを格納することができる。

【0023】

プロセッサ２０４は、例えば、中央演算装置（ＣＰＵ）などの演算回路を含む。プロセッサ２０４は１つ以上のプロセッサで構成されてよい。プロセッサ２０４は、更に、機械学習などの統計処理をより高速に実行するための演算回路（例えばＧＰＵ）や専用ハードウェアを更に含んでよいし、内部にメモリを含んでもよい。プロセッサ２０４は、ストレージ２０８に記憶されているプログラムをメモリ２０２に展開、実行することにより、情報処理装置１００の各種機能を実現する。

【0024】

通信インタフェース２０６は、情報処理装置１００の外部との間でデータの送受信を行うためのインタフェースである。通信インタフェース２０６は、各種標準に準拠した通信方式で通信可能な通信回路を含んでよい。通信インタフェース２０６はネットワークに接続され、ネットワークを介して通信端末１０２や電子デバイス１０１とデータをやりとりする。入力インタフェース２１０は、例えば情報処理装置１００の管理者からの入力を受け付けるためのデバイスであるが、無くてもよい。

【0025】

電源２１２は、情報処理装置１００の各部が動作するための電力を提供するための回路又はモジュールである。電源２１２は、バッテリを備えるように構成されてもよい。

【0026】

＜敵対的トレーニングの説明＞
情報処理装置の機能構成例について説明する前に、本実施形態に係る敵対的トレーニングについて説明する。上述のように、敵対的サンプルは、敵対的トレーニングを行う前のニューラルネットワークに、オリジナルの分類クラスの代わりに誤分類クラスを出力させるように、ノイズを加えた画像や動画である。敵対的サンプルに対するロバストネス（頑健性）は、特定のデータによってニューラルネットワークの分類結果を変化させるために、最低でもどれだけノイズを加える必要があるかで定義されてよい。なお、加えるノイズの大きさはノルムとも言われる。オリジナルのサンプルについて、敵対的サンプルにするために要求されるノイズが大きくなるほど、人間を騙すことが難しくなる。例えば、オリジナルのサンプルＸを２次元空間に配置した場合、Ｘからの半径によりノイズの大きさ（すなわちノルム）を表すことができる。すなわち、どの程度の大きさのノルムを許容するかについてユーザ設定等により定めた場合に、（例えば学習データなどの）特定のデータ群における各サンプルに対する分類結果が、当該ノルムの範囲内で変化しないほど、モデルのロバストネスが高いということができる。

【0027】

敵対的サンプルに対してロバストネスを高める手法はいくつかあるが、本実施形態では、当該ロバストネスを高めるための一手法として敵対的トレーニングを行う場合を例に説明する。敵対的トレーニングは、敵対的サンプルを学習データとして利用する学習である。このとき、学習データにおける各正解データは、敵対的サンプルを誤分類する先のクラスではなく、敵対的サンプル化される前のオリジナルの正解クラスを示す。つまり、敵対的サンプルを入力したときに、誤分類しないように（すなわちオリジナルの正解クラスに分類するように）ニューラルネットワークを学習させる。

【0028】

図４及び図５では、通常の学習によるサンプルの分類と敵対的トレーニングによるサンプルの分類の違いを模式的に示している。図４の左側及び右側において、境界線４００は、敵対的トレーニングを行う前のニューラルネットワークによってオリジナルの学習データを正しく分類する場合の境界を模式的に示している。各サンプルが敵対的サンプル化されていないため、当該ニューラルネットワークは、各サンプルを正しく分類することができる。

【0029】

図４の右側は、各サンプルから一定のノルムの範囲内に敵対的サンプルが存在する場合に、誤分類が発生することを模式的に示している。図４の右側に示す各サンプルを囲う四角は、各オリジナルの学習データ（黒丸４１２と白丸４１４）からの一定のノルム以内の領域を模式的に表している。また、黒い三角４１６と白い三角４１８は、誤分類を発生させる敵対的サンプルを示している。図４の右側の図では、一部のサンプルにおけるノルムの範囲が別のクラスの領域に掛かっている（境界線４００を超えている）ため、「オリジナルの学習データから一定のノルム以内の領域」に敵対的サンプル（黒い三角４１６と白い三角４１８）が存在する。

【0030】

図５では、オリジナルのサンプルを学習して形成される境界線４００と、敵対的トレーニングによって形成される境界線５００との違いを模式的に示している。図５の左側は、図４の右側に示す敵対的サンプルが存在する様子を示している。敵対的トレーニングは「オリジナルの学習データから一定のノルム以内の領域」に敵対的サンプルが存在しないように、敵対的サンプルを使って学習することにより、サンプルを分類する境界が境界線５００のようになる。これにより、「オリジナルの学習データから一定のノルム以内の領域」が境界線５００を超えていないため、敵対的サンプルが存在しないことになる。

【0031】

なお、図４及び図５に示した「オリジナルの学習データから一定のノルム以内の領域」は、ロバストネス要件を満たす範囲のノイズの大きさに相当する。すなわち、敵対的トレーニングを行ったニューラルネットワークを生成するにあたり、ロバストネス要件、すなわちどの程度のノルムまでロバストネスを持たせるか、を事前に設定してから、当該ノルムの敵対的サンプルで学習させる必要がある。

【0032】

なお、学習データから一定のノルム以内の領域に敵対的サンプルが存在しないことが保証されることが望ましいが、必ずしもそのように学習が行われることは保証されない。また、敵対的トレーニングによって生成されたニューラルネットワークは、一般的なディープニューラルネットワークの学習と同様に、学習やテストに用いるデータのサンプルにおいて高い正解率を出すことが可能になったとしても、常に正しい分類結果を出力することは保証されない。一方で、敵対的サンプルに対する誤分類が深刻な結果をもたらす場合がある。このため、本実施形態では、以下に説明する形式検証を行うことにより、敵対的トレーニングで学習されたニューラルネットワークがどの程度のロバストネスを満たすのかを予見可能にする。

【0033】

＜形式検証の説明＞
次に、図６から図９を参照して、本実施形態に係る形式検証を用いたディープニューラルネットワークの検証について説明する。形式検証は、ハードウェアとソフトウェアが特定のプロパティを満たすか否かを数学的に証明することにより、例えばシステムが正しいことを保証する。本実施形態の検証では、ディープニューラルネットワークが特定のプロパティを満たすか否かを形式検証により証明する。

【0034】

図６は、回帰モデルに形式検証を適用した場合を説明するための例を示している。図６に示す例では、ノード６００と６０２は入力層のニューロンを示す。また、ノード６０４及びノード６０６は中間層のニューロンを示す。更にノード６０８は出力層のニューロンを示している。回帰モデルの例では、出力層は入力値に対応する予測値（ここでは与信スコア）を出力する。また、ノード間の矢印に対応付けられた数値は、ノードを繋ぐ重み係数の値を示す。なお、この例では簡単化のため、バイアスを０として省略している。図６に示す例では、入力ｘ_２が３以下である制約において、出力（予測結果）が５以上となる入力の組み合わせ（ｘ_１、ｘ_２）が存在するかを検証する。この例では、与信スコアが５以上になるような、勤続年数を示すパラメータと年収を示すパラメータの組が存在するかを検証する。

【0035】

図７は、上述の制約を満たす解が存在する場合の例を示している。（ｘ_１、ｘ_２）の組が（５、０）である場合に、入力値と重み係数の積の総和をノードごとに演算し、演算結果に中間層の活性化関数（例えばReLU）による演算を行うことにより、５なる与信スコアが得られる。

【0036】

図８は、分類モデルに形式検証を適用した場合を説明するための例を示している。図８に示す例では、ノード８００と８０２は入力層のニューロンを示す。また、ノード８０４及びノード８０６は中間層のニューロンを示す。更にノード８０８、８１０及び８１２は出力層のニューロンを示している。分類モデルの例では、出力層は、入力値が分類されるクラス（ここでは与信グレード）を出力する。ノード間の矢印に対応付けられた数値は、ノードを繋ぐ重み係数の値を示す。この例においても、バイアスを０として省略している。図８に示す例では、入力ｘ_１が３以下である制約において、出力層のノード８０８の値が最大となる入力の組み合わせ（ｘ_１、ｘ_２）が存在するかを検証する。この例では、与信グレードＡの確率が最も高くなるような、勤続年数を示すパラメータと年収を示すパラメータの組が存在するかを検証する。

【0037】

図９は、上述の制約を満たす解が存在する場合の例を示している。（ｘ_１、ｘ_２）の組が（１、０）である場合に、入力値と重み係数の積の総和をノードごとに演算し、演算結果に中間層の活性化関数（例えばReLU）による演算を行うことにより、与信グレードＡが最も高くなる。

【0038】

上述の例から把握できるように、特定データの一定のノルム内に敵対的サンプルが存在しないことをプロパティとし、当該プロパティを証明することにより、敵対的トレーニングによって生成されたニューラルネットワークのロバストネスを保証することができる。例えば、分類モデルとして示した重み係数は敵対的トレーニングによって得られた重み係数と対応し、入力における制約は、特定のサンプルにおけるノルムの範囲に対応する。また、出力ノードの分類は、敵対的トレーニングを適用したニューラルネットワークの出力層（分類結果）に対応し、出力の制約は、オリジナルの分類クラス以外の確率が最も高くならないことに対応する。このように、形式検証を用いることにより、敵対的トレーニングによって得られた重み係数を用いるニューラルネットワークにおいて、特定データからの一定のノルム内に敵対的サンプルが存在しないことを検証（判定）することができる。

【0039】

＜情報処理装置の機能構成例＞
次に、図３を参照して、情報処理装置１００の機能構成例について説明する。図３に示す機能構成例は、例えば、プロセッサ２０４がストレージ２０８に記憶された１つ以上のプログラムをメモリ２０２に展開、実行することにより実現され得る。なお、本実施形態で説明する機能ブロックの各々は、統合されまたは分離されてもよく、また説明する機能が別のブロックで実現されてもよい。また、ハードウェアとして説明したものがソフトウェアで実現されてもよく、その逆であってもよい。

【0040】

データ取得部３１０は、例えば、敵対的トレーニングを適用したいモデルのデータ（ニューラルネットワークの構成に関するハイパーパラメータ）と、学習データと、テストデータとを取得する。データ取得部３１０は、例えば、通信端末１０２から送信されるこれらのデータを受信してもよいし、予め、学習データ及びテストデータ３３０やモデルデータ３３４としてストレージ２０８に格納されたデータをユーザ指示に応じて取得してもよい。更に、情報処理装置１００の外部のストレージに格納されているこれらのデータを、ユーザ指示に応じて取得してもよい。

【0041】

ユーザ設定取得部３１２は、例えば通信端末１０２から、敵対的トレーニングの特性に関するユーザ設定を取得する。敵対的トレーニングの特性に関する設定は、例えば、敵対的サンプルの生成アルゴリズムの設定、敵対的トレーニングにおいて設定するノルム（ノイズの大きさ）、及び、敵対的トレーニングを実行する際の学習のエポック数などの設定を含む。

【0042】

処理部３１４は、情報処理装置１００の各部を制御して、情報処理装置１００の各種動作を制御する。また、処理部３１４は、敵対的サンプル生成部３１６、敵対的トレーニング制御部３１８、及び形式検証制御部３２０による動作を制御して、ロバストネス向上処理を実現する。

【0043】

敵対的サンプル生成部３１６は、データ取得部３１０が取得した学習データを敵対的サンプル化する。そして、敵対的サンプル生成部３１６は、生成した敵対的サンプルと、オリジナルの分類クラスを示す正解データとを関連付けた、敵対的トレーニング用の学習データを生成する。また、敵対的サンプル生成部３１６は、データ取得部３１０が取得したテストデータも敵対的サンプル化する。そして、敵対的サンプル生成部３１６は、敵対的トレーニングによって生成されたニューラルネットワークのテスト時に用いるテストデータとして、敵対的サンプル化したデータと、テストデータの正解データとを関連付ける。敵対的サンプル生成部３１６は、生成した敵対的トレーニング用の学習データやテストデータを、例えば敵対的サンプルデータ３３２としてストレージ２０８に格納する。

【0044】

敵対的トレーニング制御部３１８は、敵対的サンプル生成部３１６によって生成された敵対的トレーニング用の学習データと、ユーザ設定取得部３１２によって取得されたユーザ設定と、モデルデータとに基づいて、敵対的トレーニングを実行する。また、敵対的トレーニング制御部３１８は、設定されたエポック数や正解率に到達することによって敵対的トレーニングを終了すると、敵対的トレーニング用のテストデータを用いて、トレーニングされたニューラルネットワークがどの程度誤分類をしないかを評価する。処理部３１４は、敵対的トレーニング用のテストデータを用いた評価の結果が一定の正解率を超えない場合には、再び敵対的トレーニングを実行するようにして、敵対的トレーニング用のテストデータを用いた評価結果が一定の正解率を超えるまで繰り返してもよい。

【0045】

形式検証制御部３２０は、敵対的トレーニング制御部３１８の敵対的トレーニングによって得られた重み係数を用いるニューラルネットワークにおいて、特定データからの一定のノルム内に敵対的サンプルが存在しないことを検証（判定）する。このとき、形式検証制御部３２０は、敵対的サンプル化されていない学習データ又はテストデータを用いて検証を行う。処理部３１４は、ロバストネスの制約を満たすデータの割合が事前に設定されている値よりも大きくなった場合に形式検証の処理を終了し、そうでない場合には条件を変更した敵対的トレーニングを行うようにしてもよい。形式検証制御部３２０は、形式検証の完了したモデルのデータにラベルを付けて、モデルデータ３３４としてストレージ２０８に格納してもよい。

【0046】

モデル配置部３２２は、電子デバイス１０１からの要求に応じて又は情報処理装置１００の管理者の操作に応じて、形式検証の完了したモデルのデータを電子デバイス１０１に送信し、モデルデータを電子データにデプロイさせる。

【0047】

学習データ及びテストデータ３３０は、オリジナルの正解データを含む学習データ、及びオリジナルのテストデータを含む。図１１には、学習データ及びテストデータ３３０のデータ構造の一例を示している。学習データ及びテストデータ３３０は、データＩＤと、画像データと、正解ラベルと、データ種別とを含む。データＩＤは、データの識別子を示す。画像データは、学習データ及びテストデータの画像データである。図１１の例では、これらの画像データは、例えば、ディープフェイク技術を用いて生成された実在しない人物の顔画像と、実在する人物の顔画像のいずれかの画像データである。この正解ラベルは、オリジナルの正解データに対応する。例えば、画像データがディープフェイク技術で生成された画像であれば「１」を示し、実在する人物の顔画像である場合には「０」を示す。当業者には明らかであるが、ニューラルネットワークが人物名を識別する場合には、正解ラベルは画像データと対応する人名などとなる。正解ラベルは、このデータ構造から独立したＯｎｅ－Ｈｏｔエンコーディングの形式で記載されてもよい。データ種別は、画像データが学習データとして用いられるのか、テストデータとして用いられるのかを示す。データ種別は、学習データとテストデータの比率が一定になるように、学習のたびにランダムに種別が割り当てられてもよいし、固定であってもよい。また、データ種別の列を設けること無く、テストデータと学習データのついてデータ構造を有してもよい。

【0048】

敵対的サンプルデータ３３２は、敵対的サンプル化された敵対的トレーニング用の学習データやテストデータを含む。図１２には、敵対的サンプルデータ３３２のデータ構造の一例を示している。敵対的サンプルデータ３３２は、データＩＤと、画像データと、正解ラベルと、データ種別と、生成アルゴリズムと、ノルムとを含む。なお、図１２には示していないが、敵対的サンプルを生成した際のオリジナルの画像データのデータＩＤを更に含んでもよい。データＩＤは、敵対的サンプル化された画像の識別子であり、画像データは、敵対的サンプル化された画像データである。正解ラベルは、オリジナルの画像データの正解ラベルの値をそのまま示す。すなわち、ディープニューラルネットワークは、敵対的サンプルを入力した際であっても、誤分類すること無くオリジナルの正解ラベルを導くように学習される。データ種別は、学習データ及びテストデータ３３０と同様である。生成アルゴリズムは、敵対的サンプルを生成するアルゴリズムの別を示す。アルゴリズムの種別は、様々なものであってよいが、例えばＦＧＳＭ（Fast Gradient Sign Method）、Ｃ＆ＷＡｔｔａｃｋ、ＪＳＭＡ（Jacobian Saliency Map Attack）、ＢｏｕｎｄａｒｙＡｔｔａｃｋなどであってよい。ノルムは、敵対的サンプルを作成する際に適用されるノイズの大きさを示す。なお、ノルムは、例えば、ワッサースタイン距離などの、敵対的サンプルのノイズの大きさを示す他の指標を用いてもよい。

【0049】

モデルデータ３３４は、予め取得された或いは通信端末１０２から送信された、敵対的トレーニングを適用したいモデルのデータ（ニューラルネットワークの構成に関するハイパーパラメータ）を含む。また、敵対的トレーニング制御部３１８によって生成された敵対的トレーニングの行われたモデルのデータ（ニューラルネットワークの構成に関するハイパーパラメータ）及び重み係数のデータを含む。また、モデルデータ３３４は、形式検証制御部３２０による形式検証の完了した、ラベル付けされたモデルのデータを含んでもよい。図１３には、モデルデータ３３４のデータ構造の一例を示している。モデルデータ３３４は、モデルＩＤと、重み係数と、ハイパーパラメータと、生成日時と、生成ステージとを含む。モデルＩＤは、ニューラルネットワークを識別する識別子である。重み係数は、ニューラルネットワークが学習されたときに得られる重み係数である。ハイパーパラメータは、レイヤ数、各レイヤのノード数、ネットワークの構造（例えばＣＮＮであること、カーネルサイズなど）等のデータを含んでよい。生成日時は、モデルが生成された日時を表す。生成ステージは、例えば、形式検証を完了したモデルであるか、敵対的トレーニングが終了したモデルであるか、オリジナルのモデルであるかなどを識別するための情報である。

【0050】

＜情報処理装置におけるロバストネス向上処理の一連の動作＞
次に、情報処理装置１００において実行されるロバストネス向上処理の一連の動作について、図１０を参照して説明する。また、本処理は、プロセッサ２０４がストレージ２０８に格納されるコンピュータプログラムをメモリ２０２に展開、実行することにより実現される。以下の説明では、説明を容易にするために各ステップの処理主体をまとめてプロセッサ２０４として説明するが、処理内容に応じて処理部３１４などの各部が対応する処理を実行する。

【0051】

まずプロセッサ２０４は、学習データとニューラルネットワークの構成（ハイパーパラメータ等）を取得（Ｓ１００１）したうえで、ユーザ設定を取得する（Ｓ１００２）。Ｓ１００１の処理とＳ１００２の処理の順序は逆であってもよいし、通信端末１０２から両方のデータを一度に取得してもよい。ユーザ設定は、ノルム（ノイズの大きさ）、敵対的サンプル生成アルゴリズム、敵対的トレーニングを実行する際のエポック数、敵対的トレーニングを実行する際の学習率、敵対的トレーニングを実行する際の学習アルゴリズム、敵対的トレーニング用のテストデータを評価する際の閾値などを含む。ユーザ設定は、更に、形式検証の際にどのデータのノルム内に敵サンプルが存在しないかを指定する設定を含んでよい。敵対的トレーニングを実行する際の学習アルゴリズムは、勾配降下法、Adamなどのアルゴリズムの指定を含む。

【0052】

更に、プロセッサ２０４は、敵対的サンプルを生成する（Ｓ１００３）。敵対的サンプルの生成は、ユーザ設定に含まれる敵対的サンプル生成アルゴリズムに基づいて実行される。ユーザ設定に当該アルゴリズムの指定が無い場合には、敵対的サンプル生成アルゴリズムとして取り得るアルゴリズムを順に実行して、様々なアルゴリズムで生成された敵対的サンプルを生成してもよい。このようにすれば、特定の特性の敵対的サンプルだけでなく様々な敵対的サンプルに対してロバストネスを向上させた敵対的トレーニングを実施することができる。

【0053】

プロセッサ２０４は、Ｓ１００１で取得された学習データとＳ１００２で取得されたユーザ設定とに基づいて、敵対的トレーニングを実行する（Ｓ１００４）。プロセッサ２０４は、敵対的サンプルとオリジナルの分類クラスを示す正解データとを含む学習データを用いてニューラルネットワークを学習させる敵対的トレーニングを実行する。なお、敵対的トレーニングを行う前のオリジナルのニューラルネットワークは、敵対的サンプルを入力されると、オリジナルの分類クラスの代わりに誤分類クラスを出力する。

【0054】

次に、プロセッサ２０４は、Ｓ１００１で取得されたテストデータを用いて、敵対的トレーニングで生成されたニューラルネットワークの動作をテストし（Ｓ１００５）、テストにより求めた正解率が閾値以上であるかを判定する（Ｓ１００６）。正解率が閾値以上でない場合、プロセッサ２０４は、処理をＳ１００７に進めて、設定値のうちの１つの設定値を変更し（Ｓ１００７）、変更した設定値でＳ１００３～１００５の処理を再び実行する。

【0055】

Ｓ１００７では、プロセッサ２０４は、設定値のうち１つの設定値を変更する。例えば、Ｓ１００６においてテストデータによるテストが所定以上の正解率に届かずに失敗した場合には、ノルムの大きさ（すなわち１つの設定値）を小さくするようにしてよい。この例とは別に、例えば、ユーザ設定として、敵対的トレーニングのテストデータに対する正解率だけを設定し、Ｓ１００７が実行されるたびにノルムの大きさ（すなわち１つの設定値）を小さい値から大きな値へ変更するようにしてもよい。このようにすれば、Ｓ１００３～Ｓ１００５の処理によって敵対的トレーニングのテスト結果が所定の正解率を超えるようにしたまま、ノルムの大きさを徐々に大きくすることができる。これは、敵対的トレーニングによってロバストネスを向上させた場合に、敵対的サンプルではないオリジナルのサンプルに対する正解率が低下するトレードオフに対して、ディープニューラルネットワークの正解率を維持したまま、可能な限りノルムを大きくした（つまりロバストネスを向上させた）敵対的トレーニングを実現することができる。この場合、Ｓ１００６では、プロセッサ２０４は、所定以上の正解率を維持したまま所定の回数だけノルムの変更を繰り返したかを判定し、イエスであれば、Ｓ１００８に処理を進めるようにしてもよい。なお、上記の方法により、一の敵対的サンプル生成アルゴリズムで所定の正解率を超える最大のノルムの敵対的トレーニングを実現することができ、他の複数の敵対的サンプル生成アルゴリズムでも同様に所定の正解率を超える最大のノルムの敵対的トレーニングを実施してこれらの敵対的トレーニングにより生成されるディープニューラルネットワークのなかから、正解率又は敵対的サンプル生成アルゴリズムの特性の観点からユーザが所望のディープニューラルネットワークを選択可能な構成であってもよい。

【0056】

そのほか、プロセッサ２０４は、複数のユーザ設定のうちの他の設定を固定したまま設定の１つを変更しながら、Ｓ１００３～１００５の処理を繰り返してよい。例えば、敵対的サンプル生成アルゴリズムを変えながら処理を繰り返すことで、様々な特性の敵対的サンプルが生成され、それらの敵対的サンプルに対して敵対的トレーニングを実行することで、生成されるディープニューラルネットワークのロバストネスを向上させることができる。また、敵対的トレーニングを実行する際のエポック数、敵対的トレーニングを実行する際の学習率、敵対的トレーニングを実行する際の学習アルゴリズムなどは、どの設定値を選択すれば最善の結果を得ることができるかを把握することは難しいことが多い。このため、勘や経験で設定するよりも、プロセッサがこれらの設定値を徐々に変更して得られる結果から最善の結果を得ることができる値を特定できる方がユーザにとってメリットが大きい。

【0057】

一方、プロセッサ２０４は、正解率が閾値以上である場合、形式検証によるロバストネス評価を実行する（Ｓ１００８）。なお、形式検証によるロバストネス評価は、公知の技術を用いて実現することができる。例えば、「Reluplex: An Efficient SMT Solver for Verifying Deep Neural Networks」と題する公知文献（Guy Kats, 外３名、２０１７年５月１９日、URL: https://arxiv.org/pdf/1702.01135.pdf）に記載される、ディープニューラルネットワークに対するプロパティを証明する技術を用いることができる。プロセッサ２０４は、敵対的トレーニングで生成されたディープニューラルネットワークを対象として、オリジナルの学習データやテストデータの所定のノルム（敵対的トレーニングで指定したノルムの値）内において出力層の最大出力が正解データのクラス以外となるようなプロパティをクエリとしてあたえることで、このプロパティに該当する入力の組み合わせが存在しないことを形式検証する。存在しないという結果の場合、プロセッサ２０４は、敵対的トレーニングによって学習された重み係数を用いるニューラルネットワークにおいて、特定のデータの所定のノイズの範囲内に敵対的サンプルが存在しないことを証明したこととなる。プロパティに該当する入力の組み合わせが見つかった場合は、その特定のデータの所定のノルム内において敵対的サンプルが存在したことを証明したこととなる。なお、この場合、存在した入力の組み合わせを反例として返す。形式検証において、ロバストネスとなるデータ割合が事前に設定されている値よりも大きい場合、プロセッサ２０４は、特定のデータの所定のノイズの範囲内に敵対的サンプルが存在しないと判定して、ロバストネス向上処理を終了する。

【0058】

以上説明したように、本実施形態は、敵対的トレーニングの特性に関するユーザ設定を取得したうえで、敵対的サンプルとオリジナルの分類クラスを示す正解データとを含む学習データとユーザ設定を用いて、ニューラルネットワークを学習させる敵対的トレーニングを実行する。なお、敵対的トレーニングを行う前のニューラルネットワークは、敵対的サンプルを入力されると、オリジナルの分類クラスの代わりに誤分類クラスを出力する。そして、形式検証アルゴリズムを実行することにより、敵対的トレーニングによって学習された重み係数を用いるニューラルネットワークにおいて、特定のデータの所定のノイズの範囲内に敵対的サンプルが存在しないことを判定する。このようにすることで、敵対的トレーニングを用いる場合に、特定のロバストネスを満たすことを予見可能なディープニューラルネットワークを生成可能になる。

【0059】

発明は上記の実施形態に制限されるものではなく、発明の要旨の範囲内で、種々の変形・変更が可能である。

【符号の説明】

【0060】

１００…情報処理装置、１０１…電子デバイス、１０２…通信端末、２０４…プロセッサ、２０２…メモリ、３１０…データ取得部、３１２…ユーザ設定取得部、３１４…処理部、３２２…モデル配置部

【図1】