(19)【発行国】日本国特許庁(JP)
(12)【公報種別】公開特許公報(A)
(11)【公開番号】P2022164571
(43)【公開日】2022-10-27
(54)【発明の名称】情報処理装置、情報処理方法及び予測装置
(51)【国際特許分類】
G06N 3/02 20060101AFI20221020BHJP
G06T 7/00 20170101ALI20221020BHJP
【FI】
G06N3/02
G06T7/00 350C
【審査請求】未請求
【請求項の数】10
【出願形態】OL
(21)【出願番号】P 2022040586
(22)【出願日】2022-03-15
(31)【優先権主張番号】202110411394.X
(32)【優先日】2021-04-16
(33)【優先権主張国・地域又は機関】CN
(71)【出願人】
【識別番号】000005223
【氏名又は名称】富士通株式会社
(74)【代理人】
【識別番号】100107766
【弁理士】
【氏名又は名称】伊東 忠重
(74)【代理人】
【識別番号】100070150
【弁理士】
【氏名又は名称】伊東 忠彦
(72)【発明者】
【氏名】スヌ・リ
(72)【発明者】
【氏名】汪 留安
(72)【発明者】
【氏名】ジャン・ミンジエ
(72)【発明者】
【氏名】王 平
(72)【発明者】
【氏名】ジャン・ホォイガン
(72)【発明者】
【氏名】孫 俊
【テーマコード(参考)】
5L096
【Fターム(参考)】
5L096GA51
5L096HA11
5L096KA04
(57)【要約】
【課題】情報処理装置、情報処理方法及び予測装置を提供する。
【解決手段】該情報処理装置は、予測すべき対象を予測するために、複数のディープニューラルネットワークモデルの安定性と精度指標変化傾向一貫性とのうちの少なくとも1つ及び総合予測精度に基づいて、複数のディープニューラルネットワークモデルから少なくとも2つのディープニューラルネットワークモデルを選択するモデル選択ユニット、を含み、総合予測精度は、少なくとも2つの精度指標により表現され、安定性は、対応するディープニューラルネットワークモデルの該少なくとも2つの精度指標のそれぞれに関する安定性であり、精度指標変化傾向一貫性は、対応するディープニューラルネットワークモデルの該少なくとも2つの精度指標の変化傾向の一貫性である。
【選択図】
図1
【特許請求の範囲】
【請求項1】
予測すべき対象を予測するために、複数のディープニューラルネットワークモデルの安定性と精度指標変化傾向一貫性とのうちの少なくとも1つ及び総合予測精度に基づいて、前記複数のディープニューラルネットワークモデルから少なくとも2つのディープニューラルネットワークモデルを選択するモデル選択ユニット、を含み、
前記総合予測精度は、少なくとも2つの精度指標により表現され、
前記安定性は、対応するディープニューラルネットワークモデルの前記少なくとも2つの精度指標のそれぞれに関する安定性であり、
前記精度指標変化傾向一貫性は、対応するディープニューラルネットワークモデルの前記少なくとも2つの精度指標の変化傾向の一貫性である、情報処理装置。
【請求項2】
前記モデル選択ユニットは、前記少なくとも2つのディープニューラルネットワークモデルを選択する際に、
総合予測精度の差が第1の所定閾値よりも小さい2つ以上のディープニューラルネットワークモデルを同一のモデルグループに割り当てるように、前記複数のディープニューラルネットワークモデルの総合予測精度に基づいて前記複数のディープニューラルネットワークモデルに対して並び替え及びグループ分けを行い、
モデルグループごとに、該モデルグループにおける各ディープニューラルネットワークモデルの安定性と精度指標変化傾向一貫性のうちの少なくとも1つに基づいて、該モデルグループにおける各ディープニューラルネットワークモデルの順序を調整し、
調整された並び替え結果に基づいて前記複数のディープニューラルネットワークモデルから前記少なくとも2つのディープニューラルネットワークモデルを選択する、請求項1に記載の情報処理装置。
【請求項3】
前記モデル選択ユニットは、グループ総合予測精度が最大のモデルグループに、安定性が前記グループ総合予測精度が最大のモデルグループ以外のモデルグループにおける各ディープニューラルネットワークモデルの安定性の最大値よりも第2の所定閾値小さいディープニューラルネットワークモデル、又は精度指標変化傾向一貫性が前記グループ総合予測精度が最大のモデルグループ以外のモデルグループにおける各ディープニューラルネットワークモデルの精度指標変化傾向一貫性の最大値よりも第3の所定閾値小さいディープニューラルネットワークモデルが存在する場合、前記総合予測精度を表現するための精度指標を再選択し、
前記グループ総合予測精度は、対応するモデルグループにおける各ディープニューラルネットワークモデルの総合予測精度に基づいて計算される、請求項2に記載の情報処理装置。
【請求項4】
前記複数のディープニューラルネットワークモデルの総合予測精度に基づいて前記複数のディープニューラルネットワークモデルを降順に並び替える場合、前記モデル選択ユニットは、予測すべき対象を予測するために、調整された並び替え結果に基づいて、前記複数のディープニューラルネットワークモデルから、最上位の少なくとも2つのディープニューラルネットワークモデルを選択し、
前記複数のディープニューラルネットワークモデルの総合予測精度に基づいて前記複数のディープニューラルネットワークモデルを昇順に並び替える場合、前記モデル選択ユニットは、予測すべき対象を予測するために、調整された並び替え結果に基づいて、前記複数のディープニューラルネットワークモデルから、最下位の少なくとも2つのディープニューラルネットワークモデルを選択する、請求項2に記載の情報処理装置。
【請求項5】
前記複数のディープニューラルネットワークモデルのそれぞれは、訓練データセットを分割して得られた複数の訓練データサブセットのうちの少なくとも1つの訓練データサブセットを用いて事前に訓練を行って得られた訓練済みのディープニューラルネットワークモデルである、請求項2に記載の情報処理装置。
【請求項6】
前記モデル選択ユニットは、前記少なくとも2つのディープニューラルネットワークモデルに対応する訓練データサブセットの集合に前記訓練データセットにおける訓練データの全てを含むように、前記少なくとも2つのディープニューラルネットワークモデルを選択する、請求項5に記載の情報処理装置。
【請求項7】
前記モデル選択ユニットは、
ディープニューラルネットワークモデルごとに、該ディープニューラルネットワークモデルの重みパラメータ及び特徴抽出層の入力を変更することによって該ディープニューラルネットワークモデルの複数の性能散布点を取得する性能散布点取得サブユニットであって、各性能散布点の値はN次元ベクトルにより表され、Nは前記総合予測精度を表現する精度指標の数であり、前記N次元ベクトルの各要素の値は対応する精度指標の値により表される、性能散布点取得サブユニットと、
ディープニューラルネットワークモデルごとに、前記性能散布点取得サブユニットにより取得された該ディープニューラルネットワークモデルの複数の性能散布点に基づいて該ディープニューラルネットワークモデルの総合予測精度を決定する総合予測精度決定サブユニットと、
ディープニューラルネットワークモデルごとに、前記性能散布点取得サブユニットにより取得された該ディープニューラルネットワークモデルの複数の性能散布点の集中度に基づいて該ディープニューラルネットワークモデルの安定性を決定する安定性決定サブユニットであって、性能散布点の集中度が高くなるほど、該ディープニューラルネットワークモデルの安定性が高くなると決定される、安定性決定サブユニットと、
ディープニューラルネットワークモデルごとに、前記性能散布点取得サブユニットにより取得された該ディープニューラルネットワークモデルの複数の性能散布点に基づいて該ディープニューラルネットワークモデルの精度指標変化傾向一貫性を決定する一貫性決定サブユニットと、
前記安定性決定サブユニットにより決定された前記複数のディープニューラルネットワークモデルの安定性と前記一貫性決定サブユニットにより決定された前記複数のディープニューラルネットワークモデルの精度指標変化傾向一貫性とのうちの少なくとも1つ、及び前記総合予測精度決定サブユニットにより決定された前記複数のディープニューラルネットワークモデルの総合予測精度に基づいて、前記複数のディープニューラルネットワークモデルから前記少なくとも2つのディープニューラルネットワークモデルを選択する選択サブユニットと、を含む、請求項1に記載の情報処理装置。
【請求項8】
前記モデル選択ユニットは、
ディープニューラルネットワークモデルごとに、該ディープニューラルネットワークモデルの重みパラメータ及び特徴抽出層の入力を変更することによって該ディープニューラルネットワークモデルのN次元性能散布図を生成する性能散布図生成サブユニットであって、Nは前記総合予測精度を表現する精度指標の数であり、前記N次元性能散布図における各散布点の各次元での座標は、対応する精度指標の値により表される、性能散布図生成サブユニットと、
ディープニューラルネットワークモデルごとに、前記性能散布図生成サブユニットにより生成された該ディープニューラルネットワークモデルのN次元性能散布図における全ての散布点又は第1の所定数の散布点を含むN次元グラフを生成するN次元グラフ生成サブユニットであって、前記N次元グラフは、N次元性能散布図における全ての散布点又は前記第1の所定数の散布点のパレートフロントを反映できる、N次元グラフ生成サブユニットと、
ディープニューラルネットワークモデルごとに、N次元グラフ生成サブユニットにより生成された該ディープニューラルネットワークモデルのN次元グラフの外周、外接平面又は外接超平面に基づいて該ディープニューラルネットワークモデルの総合予測精度を決定する総合予測精度決定サブユニットと、
ディープニューラルネットワークモデルごとに、前記N次元グラフ生成サブユニットにより生成された該ディープニューラルネットワークモデルのN次元グラフのサイズに基づいて該ディープニューラルネットワークモデルの安定性を決定する安定性決定サブユニットであって、N次元グラフのサイズが大きいほど、該ディープニューラルネットワークモデルの安定性が低くなると決定される、安定性決定サブユニットと、
ディープニューラルネットワークモデルごとに、前記N次元グラフ生成サブユニットにより生成された該ディープニューラルネットワークモデルのN次元グラフにおける性能散布点の分布方向に基づいて該ディープニューラルネットワークモデルの精度指標変化傾向一貫性を決定する一貫性決定サブユニットと、
前記安定性決定サブユニットにより決定された前記複数のディープニューラルネットワークモデルの安定性と前記一貫性決定サブユニットにより決定された前記複数のディープニューラルネットワークモデルの精度指標変化傾向一貫性とのうちの少なくとも1つ、及び前記総合予測精度決定サブユニットにより決定された前記複数のディープニューラルネットワークモデルの総合予測精度に基づいて、前記複数のディープニューラルネットワークモデルから前記少なくとも2つのディープニューラルネットワークモデルを選択する選択サブユニットと、を含む、請求項1に記載の情報処理装置。
【請求項9】
予測すべき対象を予測するために、複数のディープニューラルネットワークモデルの安定性と精度指標変化傾向一貫性とのうちの少なくとも1つ及び総合予測精度に基づいて、前記複数のディープニューラルネットワークモデルから少なくとも2つのディープニューラルネットワークモデルを選択するステップ、を含み、
前記総合予測精度は、少なくとも2つの精度指標により表現され、
前記安定性は、対応するディープニューラルネットワークモデルの前記少なくとも2つの精度指標のそれぞれに関する安定性であり、
前記精度指標変化傾向一貫性は、対応するディープニューラルネットワークモデルの前記少なくとも2つの精度指標の変化傾向の一貫性である、情報処理方法。
【請求項10】
請求項1乃至8の何れかに記載の情報処理装置により前記複数のディープニューラルネットワークモデルから選択された少なくとも2つのディープニューラルネットワークモデルを用いて、予測すべき対象を予測する予測ユニット、を含む、予測装置。
【発明の詳細な説明】
【技術分野】
【0001】
本開示は、情報処理の分野に関し、具体的には、情報処理装置、情報処理方法及び予測装置に関する。
【背景技術】
【0002】
ディープニューラルネットワークモデルは、画像予測及び音声予測などの様々な分野で広く使用されている。あるアプリケーションシナリオでは、ディープニューラルネットワークモデルに使用されるデータは非常に大きい。単一のディープニューラルネットワークモデルがそのような膨大なデータを処理することは困難であることを考慮して、そのようなデータを処理するために2つ以上のディープニューラルネットワークモデルを使用する技術が提案されている。この技術では、選択されたディープニューラルネットワークモデルがデータ処理の結果に大きな影響を与えるため、適切なディープニューラルネットワークモデルを選択できる技術を提供する必要がある。
【発明の概要】
【発明が解決しようとする課題】
【0003】
以下は、本開示の態様を基本的に理解させるために、本開示の簡単な概要を説明する。なお、この簡単な概要は、本開示を網羅的な概要ではなく、本開示のポイント又は重要な部分を意図的に特定するものではなく、本開示の範囲を意図的に限定するものではなく、後述するより詳細的な説明の前文として、単なる概念を簡単な形で説明することを目的とする。
【0004】
上記の問題を鑑み、本開示は、改良された情報処理装置、情報処理方法及び予測装置を提供することを目的とする。
【課題を解決するための手段】
【0005】
本開示の1つの態様では、予測すべき対象を予測するために、複数のディープニューラルネットワーク(Deep Neural Network:DNN)モデルの安定性と精度指標変化傾向一貫性とのうちの少なくとも1つ及び総合予測精度に基づいて、前記複数のDNNモデルから少なくとも2つのDNNモデルを選択するモデル選択ユニット、を含み、前記総合予測精度は、少なくとも2つの精度指標により表現され、前記安定性は、対応するDNNモデルの前記少なくとも2つの精度指標のそれぞれに関する安定性であり、前記精度指標変化傾向一貫性は、対応するDNNモデルの前記少なくとも2つの精度指標の変化傾向の一貫性である、情報処理装置を提供する。
【0006】
本開示のもう1つの態様では、予測すべき対象を予測するために、複数のDNNモデルの安定性と精度指標変化傾向一貫性とのうちの少なくとも1つ及び総合予測精度に基づいて、前記複数のDNNモデルから少なくとも2つのDNNモデルを選択するステップ、を含み、前記総合予測精度は、少なくとも2つの精度指標により表現され、前記安定性は、対応するDNNモデルの前記少なくとも2つの精度指標のそれぞれに関する安定性であり、前記精度指標変化傾向一貫性は、対応するDNNモデルの前記少なくとも2つの精度指標の変化傾向の一貫性である、情報処理方法を提供する。
【0007】
本開示のもう1つの態様では、上記の本開示に係る情報処理装置により前記複数のDNNモデルから選択された少なくとも2つのDNNモデルを用いて、予測すべき対象を予測する予測ユニット、を含む、予測装置を提供する。
【0008】
本開示の他の態様では、上記の本開示の情報処理方法を実現するためのコンピュータプログラムコード及びコンピュータプログラムプロダクト、並びに上記の本開示の情報処理方法を実現するためのコンピュータプログラムコードが記録されているコンピュータ読み取り可能な記憶媒体をさらに提供する。
【0009】
以下は、本開示の実施例の他の態様を説明し、特に本開示の好ましい実施例を詳細に説明するが、本開示はこれらの実施例に限定されない。
【図面の簡単な説明】
【0010】
本開示の原理及び利点を理解させるために、図面を参照しながら本開示の各実施例を説明する。全ての図面において、同一又は類似の符号で同一又は類似の構成部を示している。ここで説明される図面は、好ましい実施例を例示するためのものであり、全ての可能な実施例ではなく、本開示の範囲を限定するものではない。
【
図1】本開示の実施例に係る情報処理装置の機能的構成の例を示すブロック図である。
【
図2】本開示の実施例に係るモデル選択ユニットの機能的構成の例を示すブロック図である。
【
図3】本開示の他の実施例に係るモデル選択ユニットの機能的構成の例を示すブロック図である。
【
図4】本開示の実施例に係るモデル選択ユニットによる処理を示す概略図である。
【
図5】本開示の実施例に係るモデル選択ユニットにより生成された性能散布図及びN次元グラフの例を示す図である。
【
図6】様々な数のDNNモデルを選択する場合の予測の分類正確度(classification accuracy)及びKappaスコア(Cohen’s kappa、例えばhttps://en.wikipedia.org/wiki/Cohen%27s_kappa参照)を示す図である。
【
図7】本開示の実施例に係る予測装置の機能的構成の例を示すブロック図である。
【
図8】本開示の実施例に係る情報処理方法の流れの例を示すフローチャートである。
【
図9】本開示の実施例に適用可能なパーソナルコンピュータの例示的な構成を示すブロック図である。
【発明を実施するための形態】
【0011】
以下、図面を参照しながら本開示の例示的な実施例を詳細に説明する。説明の便宜上、明細書には実際の実施形態の全ての特徴が示されていない。なお、実際に実施する際に、開発者の具体的な目標を実現するために、特定の実施形態を変更してもよい、例えばシステム及び業務に関する制限条件に応じて実施形態を変更してもよい。また、開発作業が非常に複雑であり、且つ時間がかかるが、本公開の当業者にとって、この開発作業は単なる例の作業である。
【0012】
なお、本明細書及び図面では、実質的に同一又は類似の機能的構成を有する構成要素は同一又は類似の符号で示され、重複する説明を省略する。
【0013】
また、本明細書及び図面では、同様な機能を有する複数の構成要素を区別するために、同一の符号の後に異なる文字を付加する場合もある。例えば、必要に応じて、同様な機能を有する複数の構成要素をモデル選択ユニット110aとモデル選択ユニット110bに区別する。しかし、同様な機能を有する複数の構成要素のそれぞれを明確に区別する必要がない場合、同一の符号のみを付加する。例えば、モデル選択ユニット110aとモデル選択ユニット110bとを特に区別する必要がない場合、モデル選択ユニット110aとモデル選択ユニット110bとを単にモデル選択ユニット110と称する。
【0014】
なお、本開示を明確にするために、図面には本開示に密に関連する装置の構成要件又は処理のステップのみが示され、本開示と関係のない細部が省略されている。
【0015】
以下は、図面を参照しながら、本開示の実施例を詳細に説明する。
【0016】
まず、
図1を参照しながら本開示の実施例に係る情報処理装置100の実施例を説明する。
図1は、本開示の実施例に係る情報処理装置100の機能的構成の例を示すブロック図である。
【0017】
図1に示すように、本開示の実施例に係る情報処理装置100は、モデル選択ユニット110を含んでもよい。モデル選択ユニット110は、予測すべき対象を予測するために、複数のDNNモデルの安定性と精度指標変化傾向一貫性とのうちの少なくとも1つ及び総合予測精度に基づいて、該複数のDNNモデルから少なくとも2つのDNNモデルを選択してもよい。
【0018】
総合予測精度は、少なくとも2つの精度指標により表現されてもよい。例えば、総合予測精度は、分類正確度、精度(precision、適合率とも称される)、再現率(Recall)、平均精度平均値(mean average precision:mAP)、平均交差オーバーユニオン(mean intersection over union:mIOU及びKappaスコアのうちの少なくとも2つの精度指標により表現されてもよい。例えば、総合予測精度は、上記の少なくとも2つの精度指標の値の和により表されてもよい。なお、当業者は、他の方式で上記の少なくとも2つの精度指標に基づいて総合予測精度を表してもよいが、ここでその説明を省略する。
【0019】
実際の使用では、精度の最適化目標に応じて、総合予測精度を表現するための精度指標を選択してもよい。
【0020】
安定性は、対応するDNNモデルの該少なくとも2つの精度指標のそれぞれに関する安定性を意味してもよい。例えば、特定のDNNモデルについて、該DNNモデルの重みパラメータ及び/又は特徴抽出層の入力を変更し、該少なくとも2つの精度指標のそれぞれの変化の程度に基づいて該DNNモデルの安定性を決定してもよい。
【0021】
精度指標変化傾向一貫性は、対応するDNNモデルの該少なくとも2つの精度指標の変化傾向の一貫性を意味する。例えば、特定のDNNモデルについて、該DNNモデルの重みパラメータ及び/又は特徴抽出層の入力を変更し、該少なくとも2つの精度指標の変化傾向に基づいて該DNNモデルの精度指標変化傾向一貫性を決定してもよい。
【0022】
2つ以上のDNNモデルを使用して対象を予測するシナリオでは、DNNモデルの選択が予測結果に重要な影響を及ぼす。上述したように、本開示の実施例に係る情報処理装置100は、複数のDNNモデルの安定性と精度指標変化傾向一貫性とのうちの少なくとも1つ及び総合予測精度に基づいて、DNNモデルを選択することで、複数の最適化目標を考慮して適切なDNNモデルを選択することができる。これによって、例えば、上記の少なくとも2つのDNNモデルを使用した対象レベル(例えば画像レベル)の予測精度を向上させることができる。
【0023】
また、本開示の実施例に係る情報処理装置100により使用される総合予測精度は、少なくとも2つの精度指標により表現されてもよい。これによって、DNNモデルの予測性能をよりよく表現することができるため、総合予測精度に基づいて選択された少なくとも2つのDNNモデルにより行われる対象レベル(例えば画像レベル)の予測の精度をさらに向上させることができる。
【0024】
例えば、複数のDNNモデルは、互いに異なるDNNモデルであってもよい。異なるモデルの特徴が異なってもよいため、複数のDNNモデルから選択された少なくとも2つのDNNモデルを使用して得られた予測結果の一般化性能を向上させることができる。
【0025】
なお、本明細書では、2つの異なるDNNモデルは、タイプが異なる2つのDNNモデル、又はタイプが同一であり、且つ重みパラメータが異なる2つのDNNモデルを表してもよい。例えば、タイプが同一であり、且つ重みパラメータが異なる2つのDNNモデルは、2つの異なる訓練データセットをそれぞれ使用して同一の初期DNNモデルを訓練することによって得られた2つの訓練済みのDNNモデルであってもよい。
【0026】
例えば、モデル選択ユニット110は、少なくとも2つのディープニューラルネットワークモデルを選択する際に、総合予測精度が近い(例えば、総合予測精度の差が第1の所定閾値よりも小さい)2つ以上のDNNモデルを同一のモデルグループに割り当てるように、複数のDNNモデルの総合予測精度に基づいて複数のDNNモデルに対して並び替え及びグループ分けを行い、モデルグループごとに、該モデルグループにおける各DNNモデルの安定性と精度指標変化傾向一貫性のうちの少なくとも1つに基づいて、該モデルグループにおける各DNNモデルの順序を調整し、調整された並び替え結果に基づいて該複数のDNNモデルから少なくとも2つのDNNモデルを選択してもよい。例えば、第1の所定閾値は、実際のニーズ及び/又は経験に従って設定されてもよい。
【0027】
例えば、複数のDNNモデルの総合予測精度に基づいて該複数のDNNモデルを降順に並び替える場合、モデル選択ユニット110は、予測すべき対象を予測するために、調整された並び替え結果に基づいて、該複数のDNNモデルから、最上位の少なくとも2つのDNNを選択してもよい。
【0028】
一方、例えば、複数のDNNモデルの総合予測精度に基づいて該複数のDNNモデルを昇順に並び替える場合、モデル選択ユニット110は、予測すべき対象を予測するために、調整された並び替え結果に基づいて、該複数のDNNモデルから、最下位の少なくとも2つのDNNモデルを選択してもよい。
【0029】
別の例として、モデル選択ユニット110は、総合予測精度が最高のi(iは2より大きい自然数)個のDNNモデルを第1の候補モデルとして選択し、DNNモデルの安定性又は精度指標変化傾向一貫性に基づいて第1の候補モデルから少なくとも2つのDNNモデルを選択してもよい。例えば、モデル選択ユニット110は、第1の候補モデルから安定性又は精度指標変化傾向一貫性が高いDNNモデルを該少なくとも2つのDNNモデルとして選択してもよい。
【0030】
また、例えば、モデル選択ユニット110は、総合予測精度が最高のi個のDNNモデルを第1の候補モデルとして選択し、DNNモデルの安定性に基づいて第1の候補モデルからj(jは、2より大きい自然数であり、且つi<j)個のDNNモデルを第2の候補モデルとして選択し、精度指標変化傾向一貫性に基づいて第2の候補モデルから少なくとも2つのDNNモデルを選択してもよい。例えば、モデル選択ユニット110は、第2の候補モデルから精度指標変化傾向一貫性が高いDNNモデルを該少なくとも2つのDNNモデルとして選択してもよい。
【0031】
さらに、例えば、モデル選択ユニット110は、総合予測精度が最高のi個のDNNモデルを第1の候補モデルとして選択し、DNNモデルの精度指標変化傾向一貫性に基づいて第1の候補モデルからj個のDNNモデルを第2の候補モデルとして選択し、DNNモデルの安定性に基づいて第2の候補モデルから少なくとも2つのDNNモデルを選択してもよい。例えば、モデル選択ユニット110は、第2の候補モデルからDNNモデルの安定性が高いDNNモデルを該少なくとも2つのDNNモデルとして選択してもよい。
【0032】
例えば、本開示の実施例では、モデル選択ユニット110は、グループ総合予測精度が最大のモデルグループに、(イ)安定性がグループ総合予測精度が最大のモデルグループ以外のモデルグループにおける各DNNモデルの安定性の最大値よりも第2の所定閾値小さいDNNモデル、又は(ロ)精度指標変化傾向一貫性がグループ総合予測精度が最大のモデルグループ以外のモデルグループにおける各ディープニューラルネットワークモデルの精度指標変化傾向一貫性の最大値よりも第3の所定閾値小さいDNNモデルが存在する場合、総合予測精度を表現するための精度指標を再選択してもよい。これによって、総合予測精度を表現するための適切な精度指標を選択することができるため、より適切なDNNモデルを選択することができる。例えば、第2の所定閾値及び第3の所定閾値は、実際のニーズ及び/又は経験に従って設定されてもよい。
【0033】
例えば、グループ総合予測精度は、対応するモデルグループにおける各DNNモデルの総合予測精度に基づいて計算されてもよい。例えば、特定のモデルグループについて、該モデルグループのグループ総合予測精度は、該モデルグループにおける各DNNモデルの総合予測精度の平均値により表されてもよい。
【0034】
例えば、本開示の実施例では、各DNNモデルは、訓練データセットを分割して得られた複数の訓練データサブセットのうちの少なくとも1つの訓練データサブセットを用いて事前に訓練を行って得られた訓練済みのDNNモデルであってもよい。
【0035】
例えば、モデル選択ユニット110は、少なくとも2つのDNNモデルに対応する訓練データサブセットの集合に訓練データセットにおける訓練データの全てを含むように、該少なくとも2つのDNNモデルを選択してもよい。これによって、選択された該少なくとも2つのDNNモデルが訓練データに関して補完することで、該少なくとも2つのDNNモデルを使用して行われる対象レベル(例えば画像レベル)の予測の精度をさらに向上させることができる。
【0036】
例えば、本開示の実施例では、
図2に示すように、モデル選択ユニット110aは、性能散布点取得サブユニット112、総合予測精度決定サブユニット114a、安定性決定サブユニット116a、一貫性決定サブユニット118a、及び選択サブユニット119aを含んでもよい。
【0037】
性能散布点取得サブユニット112は、DNNモデルごとに、該DNNモデルの重みパラメータ及び特徴抽出層の入力を変更することによって該DNNモデルの複数の性能散布点を取得してもよい。各性能散布点の値はN次元ベクトルにより表され、Nは総合予測精度を表現する精度指標の数であり、N次元ベクトルの各要素の値は対応する精度指標の値により表される。例えば、総合予測精度が分類正確度及びKappaスコアという2つの精度指標により表現される場合、特定の性能散布点に対応する分類正確度及びKappaスコアがそれぞれA及びBであるとき、該性能散布点の値は(A,B)であってもよい。
【0038】
総合予測精度決定サブユニット114a、DNNモデルごとに、性能散布点取得サブユニット112により取得された該DNNモデルの複数の性能散布点に基づいて該DNNモデルの総合予測精度を決定してもよい。例えば、総合予測精度決定サブユニット114aは、DNNモデルごとに、該DNNモデルの各性能散布点についてベクトルの各要素の和を計算し、要素の和が最大の性能散布点に基づいて該DNNモデルの総合予測精度を決定してもよい。例えば、総合予測精度決定サブユニット114aは、要素の和が最大の性能散布点の各要素の平均値を該DNNモデルの総合予測精度として決定してもよい。
【0039】
安定性決定サブユニット116aは、DNNモデルごとに、性能散布点取得サブユニット112により取得された該DNNモデルの複数の性能散布点の集中度に基づいて該DNNモデルの安定性を決定してもよい。ここで、性能散布点の集中度が高くなるほど、該DNNモデルの安定性が高くなると決定される。
【0040】
一貫性決定サブユニット118aは、DNNモデルごとに、性能散布点取得サブユニット112により取得された該DNNモデルの複数の性能散布点に基づいて該DNNモデルの精度指標変化傾向一貫性を決定してもよい。
【0041】
選択サブユニット119aは、安定性決定サブユニット116aにより決定された複数のDNNモデルの安定性と一貫性決定サブユニット118aにより決定された複数のDNNモデルの精度指標変化傾向一貫性とのうちの少なくとも1つ、及び総合予測精度決定サブユニット114aにより決定された複数のDNNモデルの総合予測精度に基づいて、該複数のDNNモデルから少なくとも2つのディープニューラルネットワークモデルを選択してもよい。
【0042】
例えば、選択サブユニット119aは、上記の
図1を参照しながらモデル選択ユニット110について説明したモデル選択方式と同様な方式で、予測すべき対象を予測するために、少なくとも2つのDNNモデルを選択してもよい。
【0043】
例えば、本開示の実施例では、
図3に示すように、モデル選択ユニット110bは、性能散布図生成サブユニット111、N次元グラフ生成サブユニット113、総合予測精度決定サブユニット114b、安定性決定サブユニット116b、一貫性決定サブユニット118b、及び選択サブユニット119bを含んでもよい。
【0044】
性能散布図生成サブユニット111は、DNNモデルごとに、該DNNモデルの重みパラメータ及び特徴抽出層の入力を変更することによって該DNNモデルのN次元性能散布図を生成してもよい。ここで、Nは総合予測精度を表現する精度指標の数であり、N次元性能散布図における各散布点の各次元での座標は、対応する精度指標の値により表される。例えば、総合予測精度が分類正確度及びKappaスコアという2つの精度指標により表現される場合、特定の散布点に対応する分類正確度及びKappaスコアがそれぞれA及びBであるとき、該散布点の座標は(A,B)であってもよい。
【0045】
なお、当業者が理解できるように、特定のDNNモデルについて、該DNNモデルの性能散布点及びN次元性能散布図を取得する際に、モデル選択ユニット110は、該DNNモデルの重みパラメータを変更してもよい。しかし、該DNNモデルがダウンストリームタスク(例えば予測すべき対象の予測)のために選択される場合、ダウンストリームタスクでは、該DNNモデルの重みパラメータを元のパラメータのまま維持し、即ち、モデル選択ユニット110は、該DNNモデルの重みパラメータの前の重みパラメータを変更する。例えば、該DNNモデルが訓練により取得された訓練済みのDNNモデルである場合、ダウンストリームタスクでは、該DNNモデルの重みパラメータは、訓練により取得された重みパラメータである。
【0046】
N次元グラフ生成サブユニット113は、DNNモデルごとに、該DNNモデルのN次元性能散布図における全ての散布点又は第1の所定数の散布点を含むN次元グラフを生成してもよい。該N次元グラフは、N次元性能散布図における全ての散布点又は第1の所定数の散布点のパレートフロントを反映できる。
【0047】
総合予測精度決定サブユニット114bは、DNNモデルごとに、N次元グラフ生成サブユニット113により生成された該DNNモデルのN次元グラフの外周(N=2の場合に対応する)、外接平面(N=3の場合に対応する)又は外接超平面(N>3の場合に対応する)に基づいて、該DNNモデルの総合予測精度を決定してもよい。
【0048】
安定性決定サブユニット116bは、DNNモデルごとに、N次元グラフ生成サブユニット113により生成された該DNNモデルのN次元グラフのサイズに基づいて該DNNモデルの安定性を決定してもよい。ここで、N次元グラフのサイズが大きいほど、該DNNモデルの安定性が低くなると決定される。
【0049】
一貫性決定サブユニット118bは、DNNモデルごとに、N次元グラフ生成サブユニット113により生成された該DNNモデルのN次元グラフにおける性能散布点の分布方向に基づいて、該DNNモデルの精度指標変化傾向一貫性を決定してもよい。
【0050】
選択サブユニット119bは、安定性決定サブユニット116bにより決定された複数のDNNモデルの安定性と一貫性決定サブユニット118bにより決定された複数のDNNモデルの精度指標変化傾向一貫性とのうちの少なくとも1つ、及び総合予測精度決定サブユニット114bにより決定された複数のDNNモデルの総合予測精度に基づいて、該複数のDNNモデルから少なくとも2つのDNNモデルを選択してもよい。
【0051】
例えば、選択サブユニット119bは、上記の
図1を参照しながらモデル選択ユニット110について説明したモデル選択方式と同様な方式で、予測すべき対象を予測するために、少なくとも2つのDNNモデルを選択してもよい。
【0052】
例えば、本開示の実施例では、DNNモデルは、セグメンテーションモデルであってもよい。
【0053】
一例として、性能散布図生成サブユニット111は、DNNモデルごとに、ランダムシードにより該DNNモデルの重みパラメータを変更し、該DNNモデルの特徴抽出層の入力である、該DNNモデルを用いて生成されたヒートマップについて異なる閾値を設定することによって、該DNNモデルの特徴抽出層の入力を変更してもよい。例えば、性能散布図生成サブユニット111は、DNNモデルごとに、該DNNモデルの特徴抽出層の入力を変更するために、所定のステップサイズで該DNNモデルの特徴抽出層の入力であるヒートマップについて閾値を設定してもよい。また、例えば、各DNNモデルについて、特徴抽出層の入力であるヒートマップを取得するための元の対象(例えば元の画像)は同一であってもよい。なお、当業者は、他の方式でDNNモデルの重みパラメータ及び/又は特徴抽出層の入力を変更してもよく、例えば、対応する特徴抽出層の入力を変更するためにDNNモデルの入力を変更してもよいが、ここでその説明を省略する。
【0054】
例えば、
図2に示される性能散布点取得サブユニット112は、上記の
図3に示される性能散布図生成サブユニット111について説明した方式と同様な方式で、DNNモデルの重みパラメータ及び特徴抽出層の入力を変更してもよい。
【0055】
例えば、予測すべき対象は、予測すべき画像、予測すべき音声などであってもよい。
【0056】
なお、用語「予測」は、分類、分割、オブジェクト検出などを含んでもよい。例えば、予測すべき対象が予測すべき画像である場合、予測すべき画像の予測は、予測すべき画像の分類、分割、オブジェクト検出等を含んでもよい。例えば、予測すべき画像に対してオブジェクト検出を行う際に、精度及び再現率という2つの精度指標を使用して総合予測精度を表現してもよい。また、例えば、予測すべき対象が予測すべき音声である場合、予測すべき音声の予測は、予測すべき音声の分類を分類(認識)すること等が含んでもよい。
【0057】
以下は、
図4乃至
図6を参照しながら、予測すべき対象の一例である組織切片画像(tissue slice image)を分類することを具体例として、モデル選択ユニット110による処理を説明する。
【0058】
例えば、組織切片画像を分類する際に、モデル選択ユニット110は、分類結果が既知の組織切片画像(以下は「ラベル付き組織切片画像」と称されてもよい)を使用して、各DNNモデルの安定性、精度指標変化傾向一貫性及び総合予測精度を取得してもよい。
【0059】
例えば、
図4に示すように、ラベル付き組織切片画像を取得した後、モデル選択ユニット110は、ラベル付き組織切片画像に対して前処理を行ってもよい。例えば、モデル選択ユニット110は、ラベル付き組織切片画像から関心領域(region of interest:ROI)を抽出し、パッチングストラテジー(patching strategy)を生成し、生成されたパッチングストラテジーに従ってROIから複数のパッチ(patch)を抽出してもよい。
【0060】
次に、モデル選択ユニット110は、各DNNモデルを利用して、画素レベルの処理をそれぞれ行ってもよい。即ち、パッチごとにヒートマップを生成し、特徴抽出層を使用してヒートマップから特徴(例えば形態学的特徴)を抽出してもよい。
【0061】
形態学的特徴を抽出した後、モデル選択ユニット110は、各DNNモデルを使用して、該DNNモデルにより抽出された特徴に基づいて、該DNNモデルによる組織切片画像の分類結果、例えば、組織切片画像が正常組織に関するものであるか、それとも病変組織に関するものであるかを取得してもよい。次に、モデル選択ユニット110は、各DNNモデルを用いて得られた分類結果に基づいて、各DNNモデルの少なくとも2つの精度指標、例えば分類正確度、精度、再現率、平均精度平均値及びKappaスコアのうちの少なくとも2つを取得してもよい。
【0062】
また、総合予測精度を表現するための精度指標に平均交差オーバーユニオンが含まれる場合、各DNNモデルの訓練プロセスにおいて対応する平均交差オーバーユニオンを取得してもよい。
【0063】
次に、モデル選択ユニット110は、分類すべき組織切片画像を分類するために、取得された少なくとも2つの精度指標に基づいて各DNNモデルの安定性、精度指標変化傾向一貫性及び総合予測精度を取得し、各DNNモデルの安定性、精度指標変化傾向一貫性及び総合予測精度に基づいて複数のDNNモデルから少なくとも2つのDNNモデルを選択してもよい。
【0064】
図4に示されるデータ前処理、画素レベルの処理、分類結果の取得処理は、本技術分野で周知であるため、ここでその詳細な説明を省略する。また、当業者が理解できるように、特定のDNNモデルについて、該DNNモデルの重みパラメータ及び/又は特徴抽出層の入力が変化すると、該DNNモデルにより取得された分類結果が変化する場合がある。
【0065】
なお、
図4に示されるデータ前処理、画素レベルの処理、分類結果の取得処理の一部又は全部は、必ずしもモデル選択ユニット110により実行されるものではなく、従来技術により実装されてもよい。
【0066】
以下は、
図5を参照しながら、モデル選択ユニット110bを使用してモデルを選択することを具体例として、各DNNモデルの安定性、精度指標変化傾向一貫性及び総合予測精度の取得処理及びモデル選択処理を説明する。
【0067】
図5に示す例では、モデル選択は、8つのDNNモデルの例、即ち、UperNet、DeeplapV3+、OcrNet、Ann、CCNet、Pointrend、EmaNet、PspNetについて実行される。
【0068】
各DNNモデルの精度指標(この例では、取得された精度指標は、分類正確度及びKappaスコアである)を取得した後、性能散布図生成サブユニット111は、取得された精度指標に基づいてN(この例では、N=2)次元の性能散布図を生成してもよい。
【0069】
N次元グラフ生成サブユニット113は、
図5に示すように、DNNモデルごとに、該DNNモデルの2次元性能散布図における全ての散布点を含む2次元グラフを生成してもよい。該N次元グラフは、2次元性能散布図における全ての散布点のパレートフロントを反映できる。例えば、該N次元のグラフは、2次元性能散布図における全ての散布点の外接図形と見なされてもよい。
【0070】
各DNNモデルの2次元グラフを取得した後、総合予測精度決定サブユニット114bは、DNNモデルごとに、該DNNモデルの2次元グラフの外周に基づいて、該DNNモデルの総合予測精度を決定してもよい。例えば、総合予測精度決定サブユニット114bは、2次元グラフの右上隅に近い頂点(以下は「右上隅頂点」と称されてもよい)の位置に基づいて、DNNモデルの総合予測精度を決定してもよい。例えば、総合予測精度決定サブユニット114bは、2次元グラフの右上隅頂点と座標軸により構成される矩形の右上隅の頂点(D,D)との距離が小さいDNNモデルが高い総合予測精度を有すると決定してもよい。例えば、総合予測精度決定サブユニット114bは、
図5に示される2次元グラフに基づいて、8つの例示的なDNNモデルの総合予測精度の高い順がDeeplabv3+、UperNet、OcrNet、AnnNet、CCNet、EMANet、Pointrend、PspNetであると決定してもよい。また、選択サブユニット119bは、総合予測精度決定サブユニット114bにより決定された8つの例示的なDNNモデルの総合予測精度に基づいて、8つの例示的なDNNモデルを以下のモデルグループ、即ち第1のモデルグループにDeeplabv3+及びUperNetが含まれ、第2のモデルグループにOcrNetが含まれ、第3のモデルグループにAnnNet及びCCNetが含まれ、第4のモデルグループにEMANet、Pointrend及びPspNetが含まれることにグループ分けしてもよい。ここで、第1のモデルグループ乃至第4のモデルグループのそれぞれについて、該モデルグループにおける各DNNモデルの総合予測精度の差は、第1の所定閾値よりも小さい。例えば、2つのDNNモデルの総合予測精度の差は、この2つのDNNモデルの2次元グラフの右上の頂点間の距離で表されてもよい。
【0071】
また、安定性決定サブユニット116bは、各DNNモデルの2次元グラフのサイズに基づいて、各DNNモデルの安定性を決定してもよい。例えば、安定性決定サブユニット116bは、2次元グラフの面積に基づいてDNNモデルの安定性を決定してもよい。ここで、2次元グラフの面積が大きいほど、DNNモデルの安定性が低くなると決定される。例えば、安定性決定サブユニット116bは、
図5に示される2次元グラフに基づいて、UperNetの安定性がDeeplabv3+の安定性よりも大きいと決定してもよい。
【0072】
また、一貫性決定サブユニット118bは、各DNNモデルの2次元グラフにおける性能散布点の分布方向に基づいて、各DNNモデルの精度指標変化傾向一貫性を決定してもよい。例えば、一貫性決定サブユニット118bは、2次元グラフの2つの対角線のうちの長い対角線の傾き(以下は「長軸傾き」)に基づいて、DNNモデルの精度指標変化傾向一貫性を決定してもよい。これは、長軸傾きは、該DNNモデルの2つの精度指標での変化の異なる速度と傾向を反映できるためである。ここで、長軸傾きが正の値である2次元グラフに対応するDNNモデルの精度指標変化傾向一貫性は、長軸傾きが負の値である2次元グラフに対応するDNNモデルの精度指標変化傾向一貫性よりも大きい。長軸傾きが正の値である場合、長軸傾きが値Rに近いほど、対応するDNNモデルの精度指標変化傾向一貫性が高くなる。値Rは実際の状況に応じて設定されてもよい。一方、長軸傾きが負の値である場合、精度指標変化傾向一貫性を判断するために、実際の状況に応じて同様な値Rを取得してもよい。また、長軸傾きが負の値である場合、DNNモデルの精度指標変化傾向一貫性は、固定値に設定されてもよい。
【0073】
例えば、一貫性決定サブユニット118bは、
図5に示される2次元グラフに基づいて、UperNetの精度指標変化傾向一貫性がDeeplabv3+の精度指標変化傾向一貫性よりも大きいと決定してもよい。
【0074】
次に、選択サブユニット119bは、安定性決定サブユニット116bにより決定された上記の8つの例示的なDNNモデルの安定性及び一貫性決定サブユニット118bにより決定された上記の8つの例示的なDNNモデルの精度指標変化傾向一貫性のうちの少なくとも1つに基づいて、第1のモデルグループ乃至第3のモデルグループにおける各モデルの順序を調整してもよい。例えば、選択サブユニット119bは、上記の8つの例示的なDNNモデルの安定性及び/又は精度指標変化傾向一貫性に基づいて、第1のモデルグループ乃至第3のモデルグループにおける各モデルの順序を調整してもよい。例えば、調整されたモデルの順序は、第1のモデルグループにUperNet及びDeeplabv3+が含まれ、第2のモデルグループにOcrNetが含まれ、第3のモデルグループにAnnNet及びCCNetが含まれ、第4のモデルグループにEMANet、Pointrend及びPspNetが含まれることである。
【0075】
次に、選択サブユニット119bは、予測すべき対象を予測するために、調整された順序に従って、上記の8つの例示的なモデルから少なくとも2つのDNNモデルを選択してもよい。
【0076】
例えば、
図6は、様々な数のDNNモデルを選択する場合の予測の分類正確度及びKappaスコアを示している。
図6では、Ensemble*3は、調整後の順序で上記の8つの例示的なモデルから上位の3つのDNNモデル(即ち、UperNet、Deeplabv3+及びOcrNet)を選択したケースを示している。同様に、Ensemble*5及びEnsemble*8は、それぞれ調整後の順序で上記の8つの例示的なモデルから上位の5つと上位の8つのDNNモデルを選択したケースを示している。
図6に示すように、Ensemble*3とEnsemble*5の場合、分類正確度とKappaスコアは何れも、最適な単一モデル及び8つの例示的なモデルの全てが選択された場合(即ち、Ensemble*8)に関して向上しているため、モデル選択ユニット110によるモデル選択の合理性が検証された。また、
図6に示すように、Ensemble*3の場合、分類正確度とKappaスコアは、他の場合よりも高くなるため、モデル選択ユニット110によるモデルの並び替えの合理性が検証され、モデル選択ユニット110によるモデル選択の合理性が検証された。
【0077】
なお、
図5に示す例では、2次元グラフは平行四辺形である。しかし、2次元グラフは、平行四辺形以外の四角形、円形又は楕円形などの他の形状であってもよい。例えば、2次元グラフの形状が円形又は楕円形である場合、N次元グラフ生成サブユニット113は、DNNモデルごとに、第1の所定数の散布点のみを含む2次元グラフを生成してもよい。該2次元グラフは、2次元性能散布図における全ての散布点のパレートフロントを反映できる。次に、N次元グラフ生成サブユニット113は、更新されたN次元グラフに該DNNモデルの残りの散布点が含まれるように、各散布点の2N次元グラフの中心までの距離を決定し、2次元グラフの中心までの距離が最大の第2の所定数の散布点を除去し、2次元グラフを更新してもよい。ここで、更新されたN次元グラフは、該DNNモデルの残りの散布点のパレートフロントを反映できる。次に、N次元グラフ生成サブユニット113は、更新された2次元グラフに第1の所定数の散布点のみが含まれるまで、該決定、除去及び更新の操作を繰り返してもよい。
【0078】
なお、
図5では、説明の便宜上、性能散布点の一部のみが例示的に示されている。
【0079】
例えば、本開示の実施例では、上記の本開示の実施例に係る情報処理装置100を含む予測装置を提供してもよい。
図7は、本開示の実施例に係る予測装置の機能的構成の例を示すブロック図である。
【0080】
図7に示すように、本開示の実施例に係る予測装置500は、予測ユニット510を含んでもよい。予測ユニット510は、情報処理装置100により複数のDNNモデルから選択された少なくとも2つのディープニューラルネットワークモデルを用いて、予測すべき対象を予測してもよい。これによって、例えば、対象レベル(例えば画像レベル)の予測精度を向上させることができる。
【0081】
例えば、予測ユニット510は、選択された少なくとも2つのDNNモデルによる予測すべき対象の予測結果に対する投票結果に基づいて(「多数決」に従って)、予測すべき対象の最終的な予測結果を取得してもよい。例えば、
図6に示すEnsemble*3の場合、UperNetとDeeplabv3+が対象を「正」(Positive)と予測し、OcrNetが対象を「負」(Negative)と予測するとき、予測すべき対象の最終的な予測結果が「正」であると決定してもよい。
【0082】
また、例えば、予測ユニット510は、選択された少なくとも2つのDNNモデルによる予測すべき対象の予測結果を平均化や組み合わせて、最終的な予測結果を取得してもよい。
【0083】
各DNNモデルにより予測すべき対象の予測結果を取得する処理は、本技術分野で周知されることを考慮すると、ここでその詳細な説明を省略する。
【0084】
以上は本開示の実施例に係る情報処理装置100を説明しているが、本開示は、上記の情報処理装置の実施例に対応する情報処理方法の実施例をさらに提供する。
【0085】
図8は、本開示の実施例に係る情報処理方法600の流れの例を示すフローチャートである。
図8に示すように、本開示の実施例に係る情報処理方法600は、開始ステップS602から開始し、終了ステップS606に終了してもよい。
【0086】
情報処理方法600は、モデル選択ステップS604を含んでもよい。モデル選択ステップS604において、予測すべき対象を予測するために、複数のDNNモデルの安定性と精度指標変化傾向一貫性とのうちの少なくとも1つ及び総合予測精度に基づいて、該複数のDNNモデルから少なくとも2つのDNNモデルを選択してもよい。
【0087】
総合予測精度は、少なくとも2つの精度指標により表現されてもよい。安定性は、対応するDNNモデルの該少なくとも2つの精度指標のそれぞれに関する安定性を意味してもよい。精度指標変化傾向一貫性は、対応するDNNモデルの該少なくとも2つの精度指標の変化傾向の一貫性を意味する。
【0088】
上記の本開示の実施例に係る情報処理装置100と同様に、本開示の実施例に係る情報処理方法600は、複数のDNNモデルの安定性と精度指標変化傾向一貫性とのうちの少なくとも1つ及び総合予測精度に基づいて、DNNモデルを選択することで、複数の最適化目標を考慮して適切なDNNモデルを選択することができる。これによって、例えば、上記の少なくとも2つのDNNモデルを使用した対象レベル(例えば画像レベル)の予測精度を向上させることができる。
【0089】
また、本開示の実施例に係る情報処理方法600により使用される総合予測精度は、少なくとも2つの精度指標により表現されてもよい。これによって、DNNモデルの予測性能をよりよく表現することができるため、総合予測精度に基づいて選択された少なくとも2つのDNNモデルにより行われる対象レベル(例えば画像レベル)の予測の精度をさらに向上させることができる。
【0090】
例えば、モデル選択ステップS604において、少なくとも2つのDNNモデルを選択する際に、総合予測精度の差が第1の所定閾値よりも小さい2つ以上のDNNモデルを同一のモデルグループに割り当てるように、複数のDNNモデルの総合予測精度に基づいて複数のDNNモデルに対して並び替え及びグループ分けを行い、モデルグループごとに、該モデルグループにおける各DNNモデルの安定性と精度指標変化傾向一貫性のうちの少なくとも1つに基づいて、該モデルグループにおける各DNNモデルの順序を調整し、調整された並び替え結果に基づいて該複数のDNNモデルから少なくとも2つのDNNモデルを選択してもよい。
【0091】
例えば、複数のDNNモデルの総合予測精度に基づいて該複数のDNNモデルを降順に並び替える場合、モデル選択ステップS604において、予測すべき対象を予測するために、調整された並び替え結果に基づいて、該複数のDNNモデルから、最上位の少なくとも2つのDNNを選択してもよい。
【0092】
一方、例えば、複数のDNNモデルの総合予測精度に基づいて該複数のDNNモデルを昇順に並び替える場合、モデル選択ステップS604において、予測すべき対象を予測するために、調整された並び替え結果に基づいて、該複数のDNNモデルから、最下位の少なくとも2つのDNNモデルを選択してもよい。
【0093】
例えば、本開示の実施例では、情報処理方法600は、以下の精度指標再選択ステップ(図示せず)をさらに含んでもよい。グループ総合予測精度が最大のモデルグループに、(イ)安定性がグループ総合予測精度が最大のモデルグループ以外のモデルグループにおける各DNNモデルの安定性の最大値よりも第2の所定閾値小さいDNNモデル、又は(ロ)精度指標変化傾向一貫性がグループ総合予測精度が最大のモデルグループ以外のモデルグループにおける各ディープニューラルネットワークモデルの精度指標変化傾向一貫性の最大値よりも第3の所定閾値小さいDNNモデルが存在する場合、総合予測精度を表現するための精度指標を再選択してもよい。精度指標再選択ステップにおいて総合予測精度を表現するための精度指標を再選択することで、総合予測精度を表現するための適切な精度指標を選択することができるため、より適切なDNNモデルを選択することができる。
【0094】
例えば、グループ総合予測精度は、対応するモデルグループにおける各DNNモデルの総合予測精度に基づいて計算されてもよい。
【0095】
例えば、本開示の実施例では、各DNNモデルは、訓練データセットを分割して得られた複数の訓練データサブセットのうちの少なくとも1つの訓練データサブセットを用いて事前に訓練を行って得られた訓練済みのDNNモデルであってもよい。
【0096】
例えば、モデル選択ステップS604において、少なくとも2つのDNNモデルに対応する訓練データサブセットの集合に訓練データセットにおける訓練データの全てを含むように、該少なくとも2つのDNNモデルを選択してもよい。これによって、選択された該少なくとも2つのDNNモデルが訓練データに関して補完することで、該少なくとも2つのDNNモデルを使用して行われる対象レベル(例えば画像レベル)の予測の精度をさらに向上させることができる。
【0097】
例えば、本開示の実施例では、モデル選択ステップS604は、性能散布点取得サブステップ、第1の総合予測精度決定サブステップ、第1の安定性決定サブステップ、第1の一貫性決定サブステップ、及び第1の選択サブステップ(何れも図示せず)を含んでもよい。
【0098】
性能散布点取得サブステップにおいて、DNNモデルごとに、該DNNモデルの重みパラメータ及び特徴抽出層の入力を変更することによって該DNNモデルの複数の性能散布点を取得してもよい。各性能散布点の値はN次元ベクトルにより表され、Nは総合予測精度を表現する精度指標の数であり、N次元ベクトルの各要素の値は対応する精度指標の値により表される。例えば、性能散布点取得サブステップは、上記の
図2を参照しながら説明された性能散布点取得サブユニット112により実施されてもよく、その詳細は上記の性能散布点取得サブユニット112の説明を参照してもよく、ここでその説明を省略する。
【0099】
第1の総合予測精度決定サブステップにおいて、DNNモデルごとに、該DNNモデルの複数の性能散布点に基づいて該DNNモデルの総合予測精度を決定してもよい。例えば、第1の総合予測精度決定サブステップは、上記の
図2を参照しながら説明された総合予測精度決定サブユニット114aにより実施されてもよく、その詳細は上記の総合予測精度決定サブユニット114aの説明を参照してもよく、ここでその説明を省略する。
【0100】
第1の安定性決定サブステップにおいて、DNNモデルごとに、該DNNモデルの複数の性能散布点の集中度に基づいて該DNNモデルの安定性を決定してもよい。ここで、性能散布点の集中度が高くなるほど、該DNNモデルの安定性が高くなると決定される。例えば、第1の安定性決定サブステップは、上記の
図2を参照しながら説明された安定性決定サブユニット116aにより実施されてもよく、その詳細は上記の安定性決定サブユニット116aの説明を参照してもよく、ここでその説明を省略する。
【0101】
第1の一貫性決定サブステップにおいて、DNNモデルごとに、DNNモデルの複数の性能散布点に基づいて該DNNモデルの精度指標変化傾向一貫性を決定してもよい。例えば、第1の一貫性決定サブステップは、上記の
図2を参照しながら説明された一貫性決定サブユニット118aにより実施されてもよく、その詳細は上記の一貫性決定サブユニット118aの説明を参照してもよく、ここでその説明を省略する。
【0102】
第1の選択サブステップにおいて、複数のDNNモデルの安定性と精度指標変化傾向一貫性とのうちの少なくとも1つ及び総合予測精度に基づいて、該複数のDNNモデルから少なくとも2つのディープニューラルネットワークモデルを選択してもよい。例えば、第1の選択サブステップは、上記の
図2を参照しながら説明された選択サブユニット119aにより実施されてもよく、その詳細は上記の選択サブユニット119aの説明を参照してもよく、ここでその説明を省略する。
【0103】
例えば、本開示の実施例では、モデル選択ステップS604は、性能散布図生成サブステップ、N次元グラフ生成サブステップ、第2の総合予測精度決定サブステップ、第2の安定性決定サブステップ、第2の一貫性決定サブステップ、及び第2の選択サブステップ(何れも図示せず)を含んでもよい。
【0104】
性能散布図生成サブステップにおいて、DNNモデルごとに、該DNNモデルの重みパラメータ及び特徴抽出層の入力を変更することによって該DNNモデルのN次元性能散布図を生成してもよい。ここで、Nは総合予測精度を表現する精度指標の数であり、N次元性能散布図における各散布点の各次元での座標は、対応する精度指標の値により表される。例えば、性能散布図生成サブステップは、上記の
図3を参照しながら説明された性能散布図生成サブユニット111により実施されてもよく、その詳細は上記の性能散布図生成サブユニット111の説明を参照してもよく、ここでその説明を省略する。
【0105】
N次元グラフ生成サブステップにおいて、DNNモデルごとに、該DNNモデルのN次元性能散布図における全ての散布点又は第1の所定数の散布点を含むN次元グラフを生成してもよい。該N次元グラフは、N次元性能散布図における全ての散布点又は第1の所定数の散布点のパレートフロントを反映できる。例えば、N次元グラフ生成サブステップは、上記の
図3を参照しながら説明されたN次元グラフ生成サブユニット113により実施されてもよく、その詳細は上記のN次元グラフ生成サブユニット113の説明を参照してもよく、ここでその説明を省略する。
【0106】
第2の総合予測精度決定サブステップにおいて、DNNモデルごとに、N次元グラフ生成サブステップにおいて生成された該DNNモデルのN次元グラフの外周、外接平面又は外接超平面に基づいて、該DNNモデルの総合予測精度を決定してもよい。例えば、総合予測精度決定サブステップは、上記の
図3を参照しながら説明された総合予測精度決定サブユニット114bにより実施されてもよく、その詳細は上記の総合予測精度決定サブユニット114bの説明を参照してもよく、ここでその説明を省略する。
【0107】
第2の安定性決定サブステップにおいて、DNNモデルごとに、該DNNモデルのN次元グラフのサイズに基づいて該DNNモデルの安定性を決定してもよい。ここで、N次元グラフのサイズが大きいほど、該DNNモデルの安定性が低くなると決定される。例えば、第2の安定性決定サブステップは、上記の
図3を参照しながら説明された安定性決定サブユニット116bにより実施されてもよく、その詳細は上記の安定性決定サブユニット116bの説明を参照してもよく、ここでその説明を省略する。
【0108】
第2の一貫性決定サブステップにおいて、DNNモデルごとに、該DNNモデルのN次元グラフにおける性能散布点の分布方向に基づいて、該DNNモデルの精度指標変化傾向一貫性を決定してもよい。例えば、第2の一貫性決定サブステップは、上記の
図2を参照しながら説明された一貫性決定サブユニット118bにより実施されてもよく、その詳細は上記の一貫性決定サブユニット118bの説明を参照してもよく、ここでその説明を省略する。
【0109】
第2の選択サブステップにおいて、複数のDNNモデルの安定性と精度指標変化傾向一貫性とのうちの少なくとも1つ及び総合予測精度に基づいて、該複数のDNNモデルから少なくとも2つのDNNモデルを選択してもよい。例えば、第2の選択サブステップは、上記の
図3を参照しながら説明された選択サブユニット119bにより実施されてもよく、その詳細は上記の選択サブユニット119bの説明を参照してもよく、ここでその説明を省略する。
【0110】
例えば、本開示の実施例では、DNNモデルは、セグメンテーションモデルであってもよい。
【0111】
一例として、性能散布図生成サブステップにおいて、DNNモデルごとに、ランダムシードにより該DNNモデルの重みパラメータを変更し、該DNNモデルの特徴抽出層の入力である、該DNNモデルを用いて生成されたヒートマップについて異なる閾値を設定することによって、該DNNモデルの特徴抽出層の入力を変更してもよい。
【0112】
なお、以上は本開示の実施例に係る情報処理装置及び情報処理方法の機能的構成及び動作を説明しているが、該機能的構成及び動作は単なる例示的なものであり、本開示を限定するものではない。当業者は、本開示の原理に従って上記実施例を修正してもよく、例えば各実施例における機能的モジュールを追加、削除又は組み合わせてもよく、これらの修正は本開示の範囲に含まれるものである。
【0113】
また、ここの装置の実施例は上記方法の実施例に対応するため、装置の実施例に詳細に説明されていない内容は、上記方法実施例の対応説明を参照してもよく、ここでその説明を省略する。
【0114】
また、本開示は記憶媒体及びプログラムプロダクトをさらに提供する。本開示の実施例に係る記憶媒体及びプログラムプロダクトにおける機器が実行可能な命令は上記方法を実行してもよく、ここで詳細に説明されていない内容は、上記方法の実施例の対応説明を参照してもよく、ここでその説明を省略する。
【0115】
それに応じて、本開示は、機器が実行可能な命令を含むプログラムプロダクトが記録されている記憶媒体をさらに含む。該記憶媒体は、フロッピーディスク、光ディスク、光磁気ディスク、メモリカード、メモリスティック等を含むが、これらに限定されない。
【0116】
なお、上記処理及び装置はソフトウェア及び/又はファームウェアにより実現されてもよい。ソフトウェア及び/又はファームウェアにより実施されている場合、記憶媒体又はネットワークから専用のハードウェア構成を有するコンピュータ、例えば
図9示されている汎用パーソナルコンピュータ700に上記方法を実施するためのソフトウェアを構成するプログラムをインストールしてもよく、該コンピュータは各種のプログラムがインストールされている場合は各種の機能などを実行できる。
【0117】
図9において、中央処理部(CPU)701は、読み出し専用メモリ(ROM)702に記憶されているプログラム、又は記憶部708からランダムアクセスメモリ(RAM)703にロードされたプログラムにより各種の処理を実行する。RAM703には、必要に応じて、CPU701が各種の処理を実行するに必要なデータが記憶されている。
【0118】
CPU701、ROM702、及びRAM703は、バス704を介して互いに接続されている。入力/出力インターフェース705もバス704に接続されている。
【0119】
入力部706(キーボード、マウスなどを含む)、出力部707(ディスプレイ、例えばブラウン管(CRT)、液晶ディスプレイ(LCD)など、及びスピーカなどを含む)、記憶部708(例えばハードディスクなどを含む)、通信部709(例えばネットワークのインタフェースカード、例えばLANカード、モデムなどを含む)は、入力/出力インターフェース705に接続されている。通信部709は、ネットワーク、例えばインターネットを介して通信処理を実行する。
【0120】
必要に応じて、ドライバ710は、入力/出力インターフェース705に接続されてもよい。取り外し可能な媒体711は、例えば磁気ディスク、光ディスク、光磁気ディスク、半導体メモリなどであり、必要に応じてドライバ710にセットアップされて、その中から読みだされたコンピュータプログラムは必要に応じて記憶部708にインストールされている。
【0121】
ソフトウェアにより上記処理を実施する場合、ネットワーク、例えばインターネット、又は記憶媒体、例えば取り外し可能な媒体711を介してソフトウェアを構成するプログラムをインストールする。
【0122】
なお、これらの記憶媒体は、
図9に示されている、プログラムを記憶し、機器と分離してユーザへプログラムを提供する取り外し可能な媒体711に限定されない。取り外し可能な媒体711は、例えば磁気ディスク(フロッピーディスク(登録商標)を含む)、光ディスク(光ディスク-読み出し専用メモリ(CD-ROM)、及びデジタル多目的ディスク(DVD)を含む)、光磁気ディスク(ミニディスク(MD)(登録商標))及び半導体メモリを含む。或いは、記憶媒体は、ROM702、記憶部708に含まれるハードディスクなどであってもよく、プログラムを記憶し、それらを含む機器と共にユーザへ提供される。
【0123】
以上は図面を参照しながら本開示の好ましい実施例を説明しているが、上記実施例及び例は例示的なものであり、制限的なものではない。当業者は、特許請求の範囲の主旨及び範囲内で本開示に対して各種の修正、改良、均等的なものに変更してもよい。これらの修正、改良又は均等的なものに変更することは本開示の保護範囲に含まれるものである。
【0124】
例えば、上記実施例の1つのユニットに含まれる機能は別々の装置により実現されてもよい。また、上記実施例の複数のユニットにより実現される複数の機能は別々の装置によりそれぞれ実現されてもよい。さらに、以上の機能の1つは複数のユニットにより実現されてもよい。なお、これらの構成は本開示の範囲内のものである。
【0125】
また、本開示の方法は、明細書に説明された時間的順序で実行するものに限定されず、他の時間的順序で順次、並行、又は独立して実行されてもよい。このため、本明細書に説明された方法の実行順序は、本開示の技術的な範囲を限定するものではない。
【0126】
また、上述の各実施例を含む実施形態に関し、更に以下の付記を開示するが、これらの付記に限定されない。
(付記1)
予測すべき対象を予測するために、複数のディープニューラルネットワークモデルの安定性と精度指標変化傾向一貫性とのうちの少なくとも1つ及び総合予測精度に基づいて、前記複数のディープニューラルネットワークモデルから少なくとも2つのディープニューラルネットワークモデルを選択するモデル選択ユニット、を含み、
前記総合予測精度は、少なくとも2つの精度指標により表現され、
前記安定性は、対応するディープニューラルネットワークモデルの前記少なくとも2つの精度指標のそれぞれに関する安定性であり、
前記精度指標変化傾向一貫性は、対応するディープニューラルネットワークモデルの前記少なくとも2つの精度指標の変化傾向の一貫性である、情報処理装置。
(付記2)
前記モデル選択ユニットは、前記少なくとも2つのディープニューラルネットワークモデルを選択する際に、
総合予測精度の差が第1の所定閾値よりも小さい2つ以上のディープニューラルネットワークモデルを同一のモデルグループに割り当てるように、前記複数のディープニューラルネットワークモデルの総合予測精度に基づいて前記複数のディープニューラルネットワークモデルに対して並び替え及びグループ分けを行い、
モデルグループごとに、該モデルグループにおける各ディープニューラルネットワークモデルの安定性と精度指標変化傾向一貫性のうちの少なくとも1つに基づいて、該モデルグループにおける各ディープニューラルネットワークモデルの順序を調整し、
調整された並び替え結果に基づいて前記複数のディープニューラルネットワークモデルから前記少なくとも2つのディープニューラルネットワークモデルを選択する、付記1に記載の情報処理装置。
(付記3)
前記モデル選択ユニットは、グループ総合予測精度が最大のモデルグループに、安定性が前記グループ総合予測精度が最大のモデルグループ以外のモデルグループにおける各ディープニューラルネットワークモデルの安定性の最大値よりも第2の所定閾値小さいディープニューラルネットワークモデル、又は精度指標変化傾向一貫性が前記グループ総合予測精度が最大のモデルグループ以外のモデルグループにおける各ディープニューラルネットワークモデルの精度指標変化傾向一貫性の最大値よりも第3の所定閾値小さいディープニューラルネットワークモデルが存在する場合、前記総合予測精度を表現するための精度指標を再選択し、
前記グループ総合予測精度は、対応するモデルグループにおける各ディープニューラルネットワークモデルの総合予測精度に基づいて計算される、付記2に記載の情報処理装置。
(付記4)
前記複数のディープニューラルネットワークモデルの総合予測精度に基づいて前記複数のディープニューラルネットワークモデルを降順に並び替える場合、前記モデル選択ユニットは、予測すべき対象を予測するために、調整された並び替え結果に基づいて、前記複数のディープニューラルネットワークモデルから、最上位の少なくとも2つのディープニューラルネットワークモデルを選択し、
前記複数のディープニューラルネットワークモデルの総合予測精度に基づいて前記複数のディープニューラルネットワークモデルを昇順に並び替える場合、前記モデル選択ユニットは、予測すべき対象を予測するために、調整された並び替え結果に基づいて、前記複数のディープニューラルネットワークモデルから、最下位の少なくとも2つのディープニューラルネットワークモデルを選択する、付記2に記載の情報処理装置。
(付記5)
前記複数のディープニューラルネットワークモデルのそれぞれは、訓練データセットを分割して得られた複数の訓練データサブセットのうちの少なくとも1つの訓練データサブセットを用いて事前に訓練を行って得られた訓練済みのディープニューラルネットワークモデルである、付記2に記載の情報処理装置。
(付記6)
前記モデル選択ユニットは、前記少なくとも2つのディープニューラルネットワークモデルに対応する訓練データサブセットの集合に前記訓練データセットにおける訓練データの全てを含むように、前記少なくとも2つのディープニューラルネットワークモデルを選択する、付記5に記載の情報処理装置。
(付記7)
前記モデル選択ユニットは、
ディープニューラルネットワークモデルごとに、該ディープニューラルネットワークモデルの重みパラメータ及び特徴抽出層の入力を変更することによって該ディープニューラルネットワークモデルの複数の性能散布点を取得する性能散布点取得サブユニットであって、各性能散布点の値はN次元ベクトルにより表され、Nは前記総合予測精度を表現する精度指標の数であり、前記N次元ベクトルの各要素の値は対応する精度指標の値により表される、性能散布点取得サブユニットと、
ディープニューラルネットワークモデルごとに、前記性能散布点取得サブユニットにより取得された該ディープニューラルネットワークモデルの複数の性能散布点に基づいて該ディープニューラルネットワークモデルの総合予測精度を決定する総合予測精度決定サブユニットと、
ディープニューラルネットワークモデルごとに、前記性能散布点取得サブユニットにより取得された該ディープニューラルネットワークモデルの複数の性能散布点の集中度に基づいて該ディープニューラルネットワークモデルの安定性を決定する安定性決定サブユニットであって、性能散布点の集中度が高くなるほど、該ディープニューラルネットワークモデルの安定性が高くなると決定される、安定性決定サブユニットと、
ディープニューラルネットワークモデルごとに、前記性能散布点取得サブユニットにより取得された該ディープニューラルネットワークモデルの複数の性能散布点に基づいて該ディープニューラルネットワークモデルの精度指標変化傾向一貫性を決定する一貫性決定サブユニットと、
前記安定性決定サブユニットにより決定された前記複数のディープニューラルネットワークモデルの安定性と前記一貫性決定サブユニットにより決定された前記複数のディープニューラルネットワークモデルの精度指標変化傾向一貫性とのうちの少なくとも1つ、及び前記総合予測精度決定サブユニットにより決定された前記複数のディープニューラルネットワークモデルの総合予測精度に基づいて、前記複数のディープニューラルネットワークモデルから前記少なくとも2つのディープニューラルネットワークモデルを選択する選択サブユニットと、を含む、付記1に記載の情報処理装置。
(付記8)
前記モデル選択ユニットは、
ディープニューラルネットワークモデルごとに、該ディープニューラルネットワークモデルの重みパラメータ及び特徴抽出層の入力を変更することによって該ディープニューラルネットワークモデルのN次元性能散布図を生成する性能散布図生成サブユニットであって、Nは前記総合予測精度を表現する精度指標の数であり、前記N次元性能散布図における各散布点の各次元での座標は、対応する精度指標の値により表される、性能散布図生成サブユニットと、
ディープニューラルネットワークモデルごとに、前記性能散布図生成サブユニットにより生成された該ディープニューラルネットワークモデルのN次元性能散布図における全ての散布点又は第1の所定数の散布点を含むN次元グラフを生成するN次元グラフ生成サブユニットであって、前記N次元グラフは、N次元性能散布図における全ての散布点又は前記第1の所定数の散布点のパレートフロントを反映できる、N次元グラフ生成サブユニットと、
ディープニューラルネットワークモデルごとに、N次元グラフ生成サブユニットにより生成された該ディープニューラルネットワークモデルのN次元グラフの外周、外接平面又は外接超平面に基づいて該ディープニューラルネットワークモデルの総合予測精度を決定する総合予測精度決定サブユニットと、
ディープニューラルネットワークモデルごとに、前記N次元グラフ生成サブユニットにより生成された該ディープニューラルネットワークモデルのN次元グラフのサイズに基づいて該ディープニューラルネットワークモデルの安定性を決定する安定性決定サブユニットであって、N次元グラフのサイズが大きいほど、該ディープニューラルネットワークモデルの安定性が低くなると決定される、安定性決定サブユニットと、
ディープニューラルネットワークモデルごとに、前記N次元グラフ生成サブユニットにより生成された該ディープニューラルネットワークモデルのN次元グラフにおける性能散布点の分布方向に基づいて該ディープニューラルネットワークモデルの精度指標変化傾向一貫性を決定する一貫性決定サブユニットと、
前記安定性決定サブユニットにより決定された前記複数のディープニューラルネットワークモデルの安定性と前記一貫性決定サブユニットにより決定された前記複数のディープニューラルネットワークモデルの精度指標変化傾向一貫性とのうちの少なくとも1つ、及び前記総合予測精度決定サブユニットにより決定された前記複数のディープニューラルネットワークモデルの総合予測精度に基づいて、前記複数のディープニューラルネットワークモデルから前記少なくとも2つのディープニューラルネットワークモデルを選択する選択サブユニットと、を含む、付記1に記載の情報処理装置。
(付記9)
前記ディープニューラルネットワークモデルはセグメンテーションモデルである、付記8に記載の情報処理装置。
(付記10)
前記性能散布図生成サブユニットは、ディープニューラルネットワークモデルごとに、ランダムシードにより該DNNモデルの重みパラメータを変更し、該ディープニューラルネットワークモデルの特徴抽出層の入力である、該ディープニューラルネットワークモデルを用いて生成されたヒートマップについて異なる閾値を設定することによって、該ディープニューラルネットワークモデルの特徴抽出層の入力を変更する、付記9に記載の情報処理装置。
(付記11)
Nは2に等しく、
前記N次元グラフの形状は、円形、楕円形又は四角形である、付記8に記載の情報処理装置。
(付記12)
前記N次元グラフの形状が円形又は楕円形である場合、前記N次元グラフ生成サブユニットは、ディープニューラルネットワークモデルごとに前記N次元グラフを生成する際に、
該ディープニューラルネットワークモデルのN次元性能散布図における全ての散布点を含むN次元グラフを生成するステップであって、前記N次元グラフは、N次元性能散布図における全ての散布点のパレートフロントを反映できる、ステップと、
更新されたN次元グラフに該ディープニューラルネットワークモデルの残りの散布点が含まれるように、各散布点の前記N次元グラフの中心までの距離を決定し、前記N次元グラフの中心までの距離が最大の第2の所定数の散布点を除去し、前記N次元グラフを更新するステップであって、更新されたN次元グラフは、該ディープニューラルネットワークモデルの残りの散布点のパレートフロントを反映できる、ステップと、
更新されたN次元グラフに前記第1の所定数の散布点のみが含まれるまで、前記決定、除去及び更新の操作を繰り返すステップと、を実行する、付記11に記載の情報処理装置。
(付記13)
予測すべき対象を予測するために、複数のディープニューラルネットワークモデルの安定性と精度指標変化傾向一貫性とのうちの少なくとも1つ及び総合予測精度に基づいて、前記複数のディープニューラルネットワークモデルから少なくとも2つのディープニューラルネットワークモデルを選択するステップ、を含み、
前記総合予測精度は、少なくとも2つの精度指標により表現され、
前記安定性は、対応するディープニューラルネットワークモデルの前記少なくとも2つの精度指標のそれぞれに関する安定性であり、
前記精度指標変化傾向一貫性は、対応するディープニューラルネットワークモデルの前記少なくとも2つの精度指標の変化傾向の一貫性である、情報処理方法。
(付記14)
前記少なくとも2つのディープニューラルネットワークモデルを選択するステップは、
総合予測精度の差が第1の所定閾値よりも小さい2つ以上のディープニューラルネットワークモデルを同一のモデルグループに割り当てるように、前記複数のディープニューラルネットワークモデルの総合予測精度に基づいて前記複数のディープニューラルネットワークモデルに対して並び替え及びグループ分けを行うステップと、
モデルグループごとに、該モデルグループにおける各ディープニューラルネットワークモデルの安定性と精度指標変化傾向一貫性のうちの少なくとも1つに基づいて、該モデルグループにおける各ディープニューラルネットワークモデルの順序を調整するステップと、
調整された並び替え結果に基づいて前記複数のディープニューラルネットワークモデルから前記少なくとも2つのディープニューラルネットワークモデルを選択するステップと、を含む、付記13に記載の情報処理方法。
(付記15)
グループ総合予測精度が最大のモデルグループに、安定性が前記グループ総合予測精度が最大のモデルグループ以外のモデルグループにおける各ディープニューラルネットワークモデルの安定性の最大値よりも第2の所定閾値小さいディープニューラルネットワークモデル、又は精度指標変化傾向一貫性が前記グループ総合予測精度が最大のモデルグループ以外のモデルグループにおける各ディープニューラルネットワークモデルの精度指標変化傾向一貫性の最大値よりも第3の所定閾値小さいディープニューラルネットワークモデルが存在する場合、前記総合予測精度を表現するための精度指標を再選択するステップ、をさらに含み、
前記グループ総合予測精度は、対応するモデルグループにおける各ディープニューラルネットワークモデルの総合予測精度に基づいて計算される、付記14に記載の情報処理方法。
(付記16)
前記複数のディープニューラルネットワークモデルの総合予測精度に基づいて前記複数のディープニューラルネットワークモデルを降順に並び替える場合、予測すべき対象を予測するために、調整された並び替え結果に基づいて、前記複数のディープニューラルネットワークモデルから、最上位の少なくとも2つのディープニューラルネットワークモデルを選択し、
前記複数のディープニューラルネットワークモデルの総合予測精度に基づいて前記複数のディープニューラルネットワークモデルを昇順に並び替える場合、予測すべき対象を予測するために、調整された並び替え結果に基づいて、前記複数のディープニューラルネットワークモデルから、最下位の少なくとも2つのディープニューラルネットワークモデルを選択する、付記14に記載の情報処理方法。
(付記17)
前記複数のディープニューラルネットワークモデルのそれぞれは、訓練データセットを分割して得られた複数の訓練データサブセットのうちの少なくとも1つの訓練データサブセットを用いて事前に訓練を行って得られた訓練済みのディープニューラルネットワークモデルである、付記14に記載の情報処理方法。
(付記18)
前記少なくとも2つのディープニューラルネットワークモデルに対応する訓練データサブセットの集合に前記訓練データセットにおける訓練データの全てを含むように、前記少なくとも2つのディープニューラルネットワークモデルを選択する、付記17に記載の情報処理方法。
(付記19)
前記少なくとも2つのディープニューラルネットワークモデルを選択するステップは、
ディープニューラルネットワークモデルごとに、
該ディープニューラルネットワークモデルの重みパラメータ及び特徴抽出層の入力を変更することによって該ディープニューラルネットワークモデルの複数の性能散布点を取得する処理であって、各性能散布点の値はN次元ベクトルにより表され、Nは前記総合予測精度を表現する精度指標の数であり、前記N次元ベクトルの各要素の値は対応する精度指標の値により表される、処理と、
該ディープニューラルネットワークモデルの複数の性能散布点に基づいて該ディープニューラルネットワークモデルの総合予測精度を決定する処理と、
該ディープニューラルネットワークモデルの複数の性能散布点の集中度に基づいて該ディープニューラルネットワークモデルの安定性を決定する処理であって、性能散布点の集中度が高くなるほど、該ディープニューラルネットワークモデルの安定性が高くなると決定される、処理と、
該ディープニューラルネットワークモデルの複数の性能散布点に基づいて該ディープニューラルネットワークモデルの精度指標変化傾向一貫性を決定する処理と、を実行するステップと、
前記複数のディープニューラルネットワークモデルの安定性と精度指標変化傾向一貫性とのうちの少なくとも1つ及び総合予測精度に基づいて、前記複数のディープニューラルネットワークモデルから前記少なくとも2つのディープニューラルネットワークモデルを選択するステップと、を含む、付記13に記載の情報処理方法。
(付記20)
付記1乃至12の何れかに記載の情報処理装置により前記複数のディープニューラルネットワークモデルから選択された少なくとも2つのディープニューラルネットワークモデルを用いて、予測すべき対象を予測する予測ユニット、を含む、予測装置。