特開2024-73821 | 知財ポータル「IP Force」

知財求人 - 知財ポータルサイト「IP Force」

▶ 日本電信電話株式会社の特許一覧 ▶ 国立大学法人東京工業大学の特許一覧

特開2024-73821推論方法、推論装置及びプログラム

書誌要約請求の範囲詳細な説明課題実施例実施するための形態図面の説明

目に優しい文字サイズ小中大 PDF Top

< >

1
2
3
4
5
6
7
8
9

(19)【発行国】日本国特許庁(JP)

(12)【公報種別】公開特許公報(A)

(11)【公開番号】P2024073821

(43)【公開日】2024-05-30

(54)【発明の名称】推論方法、推論装置及びプログラム

(51)【国際特許分類】

G06V 10/70 20220101AFI20240523BHJP

【ＦＩ】

G06V10/70

【審査請求】未請求

【請求項の数】8

【出願形態】ＯＬ

(21)【出願番号】P 2022184736

(22)【出願日】2022-11-18

(71)【出願人】

【識別番号】000004226

【氏名又は名称】日本電信電話株式会社

(71)【出願人】

【識別番号】304021417

【氏名又は名称】国立大学法人東京工業大学

(74)【代理人】

【識別番号】110001634

【氏名又は名称】弁理士法人志賀国際特許事務所

(72)【発明者】

【氏名】柴田剛志

(72)【発明者】

【氏名】奥富正敏

(72)【発明者】

【氏名】田中正行

(72)【発明者】

【氏名】森安宙

【テーマコード（参考）】

5L096

【Ｆターム（参考）】

5L096FA02

5L096HA11

5L096JA11

5L096KA04

(57)【要約】

【課題】画像における未知の劣化に対して頑健な画像分割を行うこと。
【解決手段】推論方法は、変換パラメータを指定するステップと、入力データに対して変換パラメータに基づく変換を行い変換データを生成するステップと、変換データの特徴を示す信頼度マップを生成するステップと、変換パラメータに基いて逆変換を行い逆変換データを生成するステップと、逆変換データから基準となる逆変換された信頼度マップを選別し各々の逆変換された信頼度マップとの差分から差分信頼度マップを生成するステップと、差分信頼度マップの各領域の値を補正して補正差分信頼度マップを生成するステップと、補正差分信頼度マップと基準となる逆変換された信頼度マップと各々の逆変換された信頼度マップとに基づいて補正信頼度マップを生成するステップと、逆変換データの各々を統合して入力データの信頼度マップと次元数が一致する統合データを生成するステップとを有する。
【選択図】図６

【特許請求の範囲】

【請求項1】

１つ以上の変換パラメータを指定する変換パラメータ指定ステップと、
入力データに対して、指定された前記変換パラメータの各々に基づく変換を行うことで変換データを生成する変換ステップと、
前記変換データごとに、前記変換データの各々の特徴を示すデータである信頼度マップを生成する信頼度マップ生成ステップと、
前記信頼度マップの各々に対して、指定された前記変換パラメータに基いて、前記変換データが生成された際に行われた前記変換に対する逆変換を行うことで逆変換データを生成する逆変換ステップと、
前記逆変換データから基準となる逆変換された前記信頼度マップを選別し、前記基準となる逆変換された前記信頼度マップと各々の逆変換された前記信頼度マップとの差分を算出することで差分信頼度マップを生成する差分算出ステップと、
前記差分信頼度マップの各領域の値を周辺の領域の値を参照して補正することで補正差分信頼度マップを生成する差分補正ステップと、
前記補正差分信頼度マップと、前記基準となる逆変換された前記信頼度マップと各々の逆変換された前記信頼度マップと、に基づいて、前記補正差分信頼度マップの領域ごとに補正信頼度マップを生成する信頼度マップ補正ステップと、
前記逆変換データの各々を統合する統合処理を行うことで、前記入力データの前記信頼度マップと次元数が一致する統合データを生成する統合ステップと、
前記統合データに対して分析処理を行う分析ステップと、
を有する推論方法。

【請求項2】

前記分析ステップでは、前記分析処理として、認識処理を行い、
前記統合ステップでは、正解データが付与された前記入力データから生成される前記統合データに対して行われる前記分析ステップの前記認識処理によって得られる認識結果と、当該統合データに対応する前記正解データとに基づいて複数の統合演算式の中から選択されるいずれか１つの最適な前記統合演算式を用いて前記統合処理を行う
請求項１に記載の推論方法。

【請求項3】

前記統合演算式は、
統合する対象の前記逆変換データの各々における対応する位置の特徴値に基づいて、前記統合データの当該位置の特徴値を算出する演算を行う式である
請求項２に記載の推論方法。

【請求項4】

前記統合演算式は、
統合する対象の前記逆変換データの各々における対応する位置、及び当該位置の近傍の位置の特徴値に基づいて、前記統合データの当該位置の特徴値を算出する演算を行う式である
請求項２に記載の推論方法。

【請求項5】

前記入力データの品質を評価する品質評価ステップ
を更に有し、
前記統合ステップでは、前記統合処理において用いる前記統合演算式が前記逆変換データの各々に適用される重みを用いる演算を含んでいる場合、前記品質評価ステップによって評価して得られる前記品質を示すデータに基づいて前記逆変換データに対応する前記入力データの前記重みの値を定める
請求項２に記載の推論方法。

【請求項6】

前記分析ステップでは、前記分析処理として認識処理を行い、
前記変換パラメータ指定ステップでは、正解データが付与された前記入力データから得られる前記逆変換データの各々に対して行われる前記分析ステップの前記認識処理によって得られる認識結果と、前記逆変換データに対応する前記正解データと、に基づいて、選択される前記変換パラメータを指定する
請求項１から請求項５のいずれか一項に記載の推論方法。

【請求項7】

１つ以上の変換パラメータを指定する変換パラメータ指定部と、
入力データに対して、指定された前記変換パラメータの各々に基づく変換を行うことで変換データを生成する変換部と、
前記変換データごとに、前記変換データの各々の特徴を示すデータである信頼度マップを生成する信頼度マップ生成部と、
前記信頼度マップの各々に対して、指定された前記変換パラメータに基いて、前記変換データが生成された際に行われた前記変換に対する逆変換を行うことで逆変換データを生成する逆変換部と、
前記逆変換データから基準となる逆変換された前記信頼度マップを選別し、前記基準となる逆変換された前記信頼度マップと各々の逆変換された前記信頼度マップとの差分を算出することで差分信頼度マップを生成する差分算出部と、
前記差分信頼度マップの各領域の値を周辺の領域の値を参照して補正することで補正差分信頼度マップを生成する差分補正部と、
前記補正差分信頼度マップと、前記基準となる逆変換された前記信頼度マップと各々の逆変換された前記信頼度マップと、に基づいて、前記補正差分信頼度マップの領域ごとに補正信頼度マップを生成する信頼度マップ補正部と、
前記逆変換データの各々を統合する統合処理を行うことで、前記入力データの前記信頼度マップと次元数が一致する統合データを生成する統合部と、
前記統合データに対して分析処理を行う分析部と、
を備える推論装置。

【請求項8】

コンピュータに、
１つ以上の変換パラメータを指定する変換パラメータ指定ステップと、
入力データに対して、指定された前記変換パラメータの各々に基づく変換を行うことで変換データを生成する変換ステップと、
前記変換データごとに、前記変換データの各々の特徴を示すデータである信頼度マップを生成する信頼度マップ生成ステップと、
前記信頼度マップの各々に対して、指定された前記変換パラメータに基いて、前記変換データが生成された際に行われた前記変換に対する逆変換を行うことで逆変換データを生成する逆変換ステップと、
前記逆変換データから基準となる逆変換された前記信頼度マップを選別し、前記基準となる逆変換された前記信頼度マップと各々の逆変換された前記信頼度マップとの差分を算出することで差分信頼度マップを生成する差分算出ステップと、
前記差分信頼度マップの各領域の値を周辺の領域の値を参照して補正することで補正差分信頼度マップを生成する差分補正ステップと、
前記補正差分信頼度マップと、前記基準となる逆変換された前記信頼度マップと各々の逆変換された前記信頼度マップと、に基づいて、前記補正差分信頼度マップの領域ごとに補正信頼度マップを生成する信頼度マップ補正ステップと、
前記逆変換データの各々を統合する統合処理を行うことで、前記入力データの前記信頼度マップと次元数が一致する統合データを生成する統合ステップと、
前記統合データに対して分析処理を行う分析ステップと、
を実行させるためのプログラム。

【発明の詳細な説明】

【技術分野】

【0001】

本発明は、推論方法、推論装置及びプログラムに関する。

【背景技術】

【0002】

コンボリューショナル・ニューラルネットワーク（以下、「ＣＮＮ」(Convolutional Neural Network)という）を積層して形成されるディープ・コンボリューショナル・ニューラルネットワーク（以下、「ＤＣＮＮ」(Deep Convolutional Neural Network)という。）は、近年、コンピュータ・ビジョンや画像処理における主流の手法になっている。ＤＣＮＮは、画像認識、物体検出、セマンティックセグメンテーションなどのコンピュータ・ビジョン・タスクの性能向上に大きく貢献している。特に、セマンティックセグメンテーションは、ビデオ監視、医用画像処理、自動運転など、多くのビジョン・アプリケーションにおいて重要な要素となっている。

【0003】

ところで、既存のセマンティックセグメンテーションのアルゴリズムは、クリーンな画像、すなわち画像劣化のない画像を認識対象とする場合、高い認識精度を発揮する。これに対して、ビデオ監視や自動運転などのアプリケーションから実際に得られる画像には、ノイズ、ぼかし、圧縮歪みなどの一般的な画像劣化が生じていることが多い。ただし、一般的な画像劣化といえども、このような画像劣化は、セマンティックセグメンテーションのアルゴリズムが予期しない画像劣化である。このような画像劣化が認識対象の画像に生じていると、例えば、非特許文献１に示されているように、訓練データの分布に対してドメインシフトが生じる。そのため、画像劣化を含む画像に対して、既存のセマンティックセグメンテーションのアルゴリズムをそのまま適用すると、認識精度は著しく低下する。

【先行技術文献】

【非特許文献】

【0004】

【非特許文献1】Christoph Kamann and Carsten Rother, “Benchmarking the Robustness of Semantic Segmentation Models”, International Journal of Computer Vision, 2021.

【非特許文献2】Kazuki Endo, Masayuki Tanaka, and Masatoshi Okutomi, “CLASSIFYING DEGRADED IMAGES OVER VARIOUS LEVELS OF DEGRADATION”, in 2020 IEEE International Conference on Image Processing (ICIP), 2020.

【非特許文献3】Kai Zhang, Wangmeng Zuo, Yunjin Chen, Deyu Meng, and Lei Zhang, “Beyond a Gaussian Denoiser: Residual Learning of Deep CNN for Image Denoising”, IEEE transactions on image processing, 2017.

【非特許文献4】Dazhou Guo, Yanting Pei, Kang Zheng, Hongkai Yu, Yuhang Lu, and SongWang, “Degraded Image Semantic Segmentation With Dense-Gram Networks”, IEEE Transactions on Image Processing, 2019.

【非特許文献5】Christoph Kamann and Carsten Rother, “Increasing the Robustness of Semantic Segmentation Models with Painting-by-Numbers”, in European Conference on Computer Vision, 2020.

【発明の概要】

【発明が解決しようとする課題】

【0005】

画像劣化に対処するための一般的なアプローチは、例えば、画像復元とセマンティックセグメンテーションとを組み合わせるアプローチである。ただし、既存の画像復元のアルゴリズムの多くは、ガウスノイズ、圧縮歪み、ブラーなどの特定の劣化モデルの各々に対応して構築されたアルゴリズムである（例えば、非特許文献２，３参照）。言い換えると、既存の画像復元のアルゴリズムは、予め劣化モデルを想定して構築されたアルゴリズムであり、想定された劣化モデルの画像劣化を含む画像に対しては有効であるが、想定された劣化モデル以外の画像劣化を含む画像を復元することができない。

【0006】

例えば、図９に示されるように、想定された画像劣化を含む画像データ３００－１と、想定外の画像劣化を含む画像データ３００－２とが存在しているとする。これらの画像データ３００－１，３００－２に対して、画像データ３００－１に生じている想定された画像劣化に対応する画像復元のアルゴリズムを適用すると、画像データ３００－１，３００－２の各々に対応する復元画像データ３１０－１，３１０－２が得られる。復元画像データ３１０－１については、適切に復元された状態になる。これに対して、復元画像データ３１０－２については、適切に復元された状態にはならない。そのため、復元画像データ３１０－１，３１０－２の各々に対してセマンティックセグメンテーションを行ったとしても、以下のような結果になる。すなわち、復元画像データ３１０－１から得られる認識結果画像データ３２０－１では、正しく画素ごとのクラスが認識されるという結果になる。これに対して、復元画像データ３１０－２から得られる認識結果画像データ３２０－２では、正しく画素ごとのクラスが認識されないという結果になる。

【0007】

上記の一般的なアプローチに対して、非特許文献４では、画像劣化を含む画像に対してセマンティックセグメンテーションを行う新たなニューラルネットワークが提案されている。ただし、非特許文献４において提案されているニューラルネットワークは、劣化モデルごとに学習させる必要がある。そのため、未知の劣化モデルの劣化が生じている画像に対しては、上記の一般的なアプローチと同様に、非特許文献４に開示されている技術も、正しくセマンティックセグメンテーションを行うことができない。

【0008】

また、実際の場面では、劣化モデルが未知であることが多い。非特許文献５では、様々な劣化に対して頑健である学習スキーマが提案されている。しかしながら、非特許文献５に開示されている技術において、ぼかし等の典型的な劣化に対して効果が得られるようにするためには、一度だけでも再学習を行う必要がある。

【0009】

このように、従来の画像をいくつのオブジェクトに分割するにセマンティックセグメンテーションにおいては、予め想定される特定の劣化に特化した画像分割を行うことは可能であるが、未知の劣化に対して正しい画像分割を行うことができない場合があるという課題があった。

【0010】

本発明は、このような状況に鑑みてなされたものであり、画像における未知の劣化に対して頑健な画像分割を行うことができる推論方法、推論装置及びプログラムを提供することにある。

【課題を解決するための手段】

【0011】

本発明の一態様は、１つ以上の変換パラメータを指定する変換パラメータ指定ステップと、入力データに対して、指定された前記変換パラメータの各々に基づく変換を行うことで変換データを生成する変換ステップと、前記変換データごとに、前記変換データの各々の特徴を示すデータである信頼度マップを生成する信頼度マップ生成ステップと、前記信頼度マップの各々に対して、指定された前記変換パラメータに基いて、前記変換データが生成された際に行われた前記変換に対する逆変換を行うことで逆変換データを生成する逆変換ステップと、前記逆変換データから基準となる逆変換された前記信頼度マップを選別し、前記基準となる逆変換された前記信頼度マップと各々の逆変換された前記信頼度マップとの差分を算出することで差分信頼度マップを生成する差分算出ステップと、前記差分信頼度マップの各領域の値を周辺の領域の値を参照して補正することで補正差分信頼度マップを生成する差分補正ステップと、前記補正差分信頼度マップと、前記基準となる逆変換された前記信頼度マップと各々の逆変換された前記信頼度マップと、に基づいて、前記補正差分信頼度マップの領域ごとに補正信頼度マップを生成する信頼度マップ補正ステップと、前記逆変換データの各々を統合する統合処理を行うことで、前記入力データの前記信頼度マップと次元数が一致する統合データを生成する統合ステップと、前記統合データに対して分析処理を行う分析ステップと、を有する推論方法である。

【0012】

また、本発明の一態様は、１つ以上の変換パラメータを指定する変換パラメータ指定部と、入力データに対して、指定された前記変換パラメータの各々に基づく変換を行うことで変換データを生成する変換部と、前記変換データごとに、前記変換データの各々の特徴を示すデータである信頼度マップを生成する信頼度マップ生成部と、前記信頼度マップの各々に対して、指定された前記変換パラメータに基いて、前記変換データが生成された際に行われた前記変換に対する逆変換を行うことで逆変換データを生成する逆変換部と、前記逆変換データから基準となる逆変換された前記信頼度マップを選別し、前記基準となる逆変換された前記信頼度マップと各々の逆変換された前記信頼度マップとの差分を算出することで差分信頼度マップを生成する差分算出部と、前記差分信頼度マップの各領域の値を周辺の領域の値を参照して補正することで補正差分信頼度マップを生成する差分補正部と、前記補正差分信頼度マップと、前記基準となる逆変換された前記信頼度マップと各々の逆変換された前記信頼度マップと、に基づいて、前記補正差分信頼度マップの領域ごとに補正信頼度マップを生成する信頼度マップ補正部と、前記逆変換データの各々を統合する統合処理を行うことで、前記入力データの前記信頼度マップと次元数が一致する統合データを生成する統合部と、前記統合データに対して分析処理を行う分析部と、を備える推論装置である。

【0013】

また、本発明の一態様は、１つ以上の変換パラメータを指定する変換パラメータ指定ステップと、入力データに対して、指定された前記変換パラメータの各々に基づく変換を行うことで変換データを生成する変換ステップと、前記変換データごとに、前記変換データの各々の特徴を示すデータである信頼度マップを生成する信頼度マップ生成ステップと、前記信頼度マップの各々に対して、指定された前記変換パラメータに基いて、前記変換データが生成された際に行われた前記変換に対する逆変換を行うことで逆変換データを生成する逆変換ステップと、前記逆変換データから基準となる逆変換された前記信頼度マップを選別し、前記基準となる逆変換された前記信頼度マップと各々の逆変換された前記信頼度マップとの差分を算出することで差分信頼度マップを生成する差分算出ステップと、
前記差分信頼度マップの各領域の値を周辺の領域の値を参照して補正することで補正差分信頼度マップを生成する差分補正ステップと、前記補正差分信頼度マップと、前記基準となる逆変換された前記信頼度マップと各々の逆変換された前記信頼度マップと、に基づいて、前記補正差分信頼度マップの領域ごとに補正信頼度マップを生成する信頼度マップ補正ステップと、前記逆変換データの各々を統合する統合処理を行うことで、前記入力データの前記信頼度マップと次元数が一致する統合データを生成する統合ステップと、前記統合データに対して分析処理を行う分析ステップと、を実行させるためのプログラムである。

【発明の効果】

【0014】

本発明によれば、画像における未知の劣化に対して頑健な画像分割を行うことを可能にする。

【図面の簡単な説明】

【0015】

【図1】本発明の一実施形態における推論装置の構成を示すブロック図である。

【図2】本発明の一実施形態における推論装置において採用されている手法の概要を示す図である。

【図3】低解像度と高解像度の分割結果における、長所と短所を示す図である。

【図4】本発明の一実施形態における差分算出部と差分補正部の概要を示した図である。

【図5】本発明の一実施形態における信頼度マップ補正部の概要を示した図である。

【図6】本発明の一実施形態における推論装置が行う処理の流れを示すフローチャートである。

【図7】本発明の一実施形態における条件選定装置の構成を示すブロック図である。

【図8】本発明の一実施形態における条件選定装置が行う処理の流れを示すフローチャートである。

【図9】画像劣化がある画像データに対するセマンティックセグメンテーションを適用するための一般的なアプローチの概要を示す図である。

【発明を実施するための形態】

【0016】

以下、本発明の一実施形態における推論方法、推論装置及びプログラムについて、図面を参照しながら説明する。

【0017】

図１は、本発明の一実施形態における推論装置１の構成を示すブロック図である。図２は、図１に示される実施形態による推論装置１において採用される手法の概要を示す図である。図２に示される画像データ１００－１は、例えば、ビデオ監視や自動運転などのアプリケーションから得られるセマンティックセグメンテーションの認識対象となる画像データである。ここで、画像データ１００－１には、未知の画像劣化が生じているとする。推論装置１において採用される手法は、以下の［１］及び［２］の２つの技術的な根拠に基づいている。

【0018】

［１］画像データ１００－１に対して、例えば、縮小の画像変換をすることにより得られる低解像度の画像データ１００－２，…，１００－Ｎは、細かいテクスチャなどのパターンが消失する代わりに、ＪＰＥＧ（Joint Photographic Experts Group）圧縮やボケなどの画像劣化も縮小される。そのため、低解像度の画像データ１００－２，…，１００－Ｎは、画像劣化が軽減された画像データになる。

【0019】

［２］セマンティックセグメンテーションのアルゴリズムは、低解像度の画像データ１００－２，…，１００－Ｎに対しても有効である。言い換えると、画像劣化のない低解像度の画像データと、画像劣化のない高解像度の画像データとにおいて、セマンティックセグメンテーションの精度は、それほど大きな違いがない。

【0020】

上記の［１］及び［２］の２つの技術的な根拠に基づいて推論装置１において採用される手法は、例えば、画像劣化を含む画像データ１００－１に対するセマンティックセグメンテーションを以下のようにして行う。画像データ１００－１に対して、任意に定める画像変換を行って、画像データ１００－２，…，１００－Ｎを得る。例えば、ＳｅｇＮｅｔやＵ－Ｎｅｔなどのエンコーダ・デコーダ型のセマンティックセグメンテーションのニューラルネットワークであって学習済みのニューラルネットワークのエンコーダの部分と、デコーダの部分とを分離する。画像データ１００－１，１００－２，…，１００－Ｎの各々を、エンコーダ部分のニューラルネットワークに与えることによりダウンサンプリングを行って、各々に対応する信頼度マップ１１０－１，１１０－２，…，１１０－Ｎを得る。

【0021】

ここで、信頼度マップとは、いわゆる特徴マップと呼ばれるデータであり、画像データ１００－１，１００－２，…，１００－Ｎに含まれている特徴を示すデータである。信頼度マップの各要素の値、すなわち、特徴量を示す値は、ロジットとよばれており、ロジットの値に基づいて、元の画像データの画素ごとに最も信頼性が高いクラスが、その画素に該当するクラスとして割り当てられることになる。ここで、画素ごとの最も信頼性が高いクラスとは、例えば、画素の各々に対応するロジットの値が最大であるクラス、または、ロジットの値を正規化した値が最大であるクラスのことである。クラスとは、例えば、画像データ１００－１，１００－２，…，１００－Ｎの各々に含まれている「人」、「車」などの物体の種類のことである。

【0022】

推論装置１は、信頼度マップ１１０－２，…，１１０－Ｎの各々に対して、各々に対応する画像データ１００－２，…，１００－Ｎが得られた際に行われた画像変換に対応する逆変換を行う。信頼度マップ１１０－１と、逆変換された信頼度マップ１１０－２，…，１１０－Ｎとを統合して統合データを生成する。このように信頼度マップ１１０－１，…，１１０－Ｎを統合する手法は、いわゆる機械学習におけるアンサンブルと呼ばれる手法に相当する。デコーダ部分のニューラルネットワークに、生成した統合データを与えることによりアップサンプリングを行って、セマンティックセグメンテーションの結果である画像データ１５０を取得する。なお、分離したエンコーダ部分のニューラルネットワーク、及びデコーダ部分のニューラルネットワークは、ニューロンに適用される係数、すなわち、重みやバイアスの値が学習済みの状態で固定された状態で用いられる。以下、係数が学習済みの状態で固定されている状態を、「係数凍結」ともいう。

【0023】

以下、推論装置１が備える各機能部について説明する前に、各機能部の説明において用いる変数や関数の意味について説明する。ビデオ監視や自動運転などのアプリケーションから得られる画像データであって推論装置１の入力となるデータ（以下「入力データ」という）を次式（１）の記号により表す。以下、本文において、次式（１）の記号を示す場合、ベクトルｘと記載する。

【0024】

【数1】

【0025】

入力データが、例えば、ＲＧＢのカラーの画像データである場合、画素ごとの赤色、緑色、青色の各々の画素値を示す３チャンネルのチャンネル方向が存在することになる。この場合、ベクトルｘは、縦方向と、横方向と、チャンネル方向とを有する３次元のデータになる。ベクトルｘから信頼度マップを算出するバックボーンのニューラルネットワークによる演算を次式（２）に示される関数Ｓ（・）で表す。

【0026】

【数2】

【0027】

関数Ｓ（・）の演算を行うニューラルネットワークは、学習済みのニューラルネットワークであり、係数凍結の状態で用いられる。関数Ｓ（・）の演算を行うニューラルネットワークの具体例としては、例えば、上記したＳｅｇＮｅｔ及びＵ－Ｎｅｔなどのエンコーダ・デコーダ型のセマンティックセグメンテーションのニューラルネットワークのエンコーダの部分のニューラルネットワークや、ＦＣＮ（Fully Convolutional Network）などがある。

【0028】

ベクトルｘに対して関数Ｓ（・）を適用することにより得られる信頼度マップを、次式（３）において示される左から１つめの記号であるベクトルｐ、または、左から２つ目の記号であるｐ_ｃｈｗとして表す。なお、ｐ_ｃｈｗの添え字のｃはチャンネル方向のインデックスであり、ｈは縦方向のインデックスであり、ｗは横方向のインデックスである。すなわち、信頼度マップを示すベクトルｐは、３次元のデータである。したがって、１組のｃ，ｈ，ｗの値を定めることにより、ベクトルｐのｃ，ｈ，ｗの位置の１つの特徴量が特定されることになる。

【0029】

【数3】

【0030】

信頼度マップであるベクトルｐからベクトルｘの画素ごとのクラスを割り当てる演算を次式（４）に示される関数ｇ（・）で表す。

【0031】

【数4】

【0032】

関数ｇ（・）の演算を行うニューラルネットワークは、関数Ｓ（・）のニューラルネットワークと同様に、学習済みのニューラルネットワークであり、係数凍結の状態で用いられる。関数ｇ（・）の演算を行うニューラルネットワークの具体例としては、例えば、上記したＳｅｇＮｅｔ及びＵ－Ｎｅｔなどのエンコーダ・デコーダ型のセマンティックセグメンテーションのニューラルネットワークのデコーダの部分のニューラルネットワークや、ベクトルｐのサイズを、元の入力データであるベクトルｘのサイズに戻すアップサンプリングを行うニューラルネットワークなどがある。

【0033】

セマンティックセグメンテーションの結果、すなわち、ベクトルｘに対して関数Ｓ（・）を適用し、更に、関数Ｓ（・）の結果に対して関数ｇ（・）を適用して得られる認識結果データを、次式（５）の左辺の記号により表す。以下、本文では、次式（５）の左辺のサーカムフレックス付きのベクトルｙを「ベクトル＾ｙ」として記載する。

【0034】

【数5】

【0035】

（実施形態の推論装置の構成）
図１に示されるように、推論装置１は、変換統合条件記憶部１０、変換パラメータ指定部１１、データ取込部１２、変換部１３、信頼度マップ生成部１４、逆変換部１５、差分算出部１６、差分補正部１７、信頼度マップ補正部１８、統合部１９、分析部２０、及び出力部２１を備える。変換統合条件記憶部１０は、予め選定されるＮ個の変換パラメータと、予め選定される１つの統合演算式とを予め記憶する。ここで、Ｎは、２以上の整数である。変換統合条件記憶部１０が記憶する変換パラメータの集合は、次式（６）によって表される。

【0036】

【数6】

【0037】

式（６）のξ_１，…，ξ_ｎ，…，ξ_Ｎの各々が、個々の変換パラメータを示す記号であり、「｛・｝」は集合を表す記号である。ここで、ｎは、１～Ｎの中の任意の整数である。以下、変換パラメータξ_ｎと記載する場合、いずれか１つの任意の変換パラメータを示すものとする。変換パラメータξ_１は、画像変換を行わない変換パラメータである。図２に示したように、元の入力データである画像データ１００－１は、画像変換が行われることなく、関数Ｓ（・）が適用され、関数Ｓ（・）を適用して得られる信頼度マップ１１０－１が統合の対象になる。そのため、変換統合条件記憶部１０に記憶される変換パラメータξ_１，…，ξ_ｎ，…，ξ_Ｎには、変換を行わない変換パラメータが１つ含まれている必要がある。そのため、ここでは、変換パラメータξ_１を、画像変換を行わない変換パラメータとしている。

【0038】

Ｎ＝２以上の変換パラメータξ_２～ξ_Ｎは、画像変換を行う変換パラメータである。変換パラメータξ_２～ξ_Ｎは、上記した縮小の画像変換以外の変換、例えば、拡大、回転、アフィン変換、射影変換などの線形変換、Ｂスプライン補間を用いた非線形変換などの幾何学的な画像変換などの変換を示す変換パラメータであってもよい。また、変換パラメータξ_２～ξ_Ｎは、色調や色温度の変換のような光学的な画像変換を示す変換パラメータであってもよい。また、変換パラメータξ_２～ξ_Ｎは、ノイズの除去や付与、ボケの除去や付与などの画像の品質（以下「画質」という）の向上や、画質の劣化に関する画像変換を示すパラメータであってもよい。

【0039】

ここで、ノイズとは、一般的な白色ノイズに限られるものではなく、圧縮ノイズ、誤った認識を引き起こすような敵対的ノイズなどであってもよい。なお、変換パラメータξ_２～ξ_Ｎの各々には、画像変換の種類を示すデータが含まれていると共に、変換の比率、例えば、縮小の画像変換であれば、縮小の比率を示す変数が含まれている。例えば、変換パラメータξ_ｎが、２次元の回転の画像変換を示す変換パラメータである場合、１変数が含まれることになる。変換パラメータξ_ｎが、アフィン変換を示す変換パラメータである場合、６変数が含まれることになる。

【0040】

なお、縮小の画像変換のように画像劣化の影響を軽減させる画像変換を示す変換パラメータ以外に、画像劣化を加えるような画像変換を示す変換パラメータが含まれてもよいとしている理由は、以下のようなことを想定しているためである。既存のセマンティックセグメンテーション、または、将来提案されるセマンティックセグメンテーションのニューラルネットワークが、画像劣化を増加させる画像変換に対して頑健であるとする。この場合、画像劣化を増加させる画像変換を付加する方が、結果的に、セマンティックセグメンテーションの認識結果として、精度の高い認識結果が得られることが想定されるためである。

【0041】

変換パラメータ指定部１１は、変換部１３と、逆変換部１５とが用いる変換パラメータを指定する。より詳細には、変換パラメータ指定部１１は、変換統合条件記憶部１０に記憶されているＮ個の変換パラメータξ_１～ξ_Ｎを読み出し、読み出した変換パラメータξ_１～ξ_Ｎを１つずつ変換部１３と、逆変換部１５とに出力することにより、変換パラメータの指定を行う。データ取込部１２は、外部から与えられる認識対象である画像データである入力データを取り込み、取り込まれた入力データを変換部１３に出力する。

【0042】

変換部１３は、データ取込部１２が出力する入力データに対して、変換パラメータ指定部１１が出力するＮ個の変換パラメータξ_１～ξ_Ｎの各々に基づいて次式（７）で表される画像変換を行う。

【0043】

【数7】

【0044】

式（７）において、右辺のＤ（・；ξ_ｎ）は、引数として与えられる画像データに対して、変換パラメータξ_ｎに基づく画像変換の演算を行う変換関数である。式（７）の左辺のチルダ付きのベクトルｘ_ｎ（以下、本文ではベクトル～ｘ_ｎと記載する。）は、変換パラメータξ_ｎに基づく画像変換が行われたベクトルｘを示している。以下、ベクトル～ｘ_ｎを変換データという。変換部１３が画像変換により生成するＮ個の変換データの集合は、次式（８）で表される。

【0045】

【数8】

【0046】

上記したように変換パラメータξ_１は、画像変換を行わない変換パラメータであるため、式（８）において、ベクトル～ｘ_１と、ベクトルｘ_１とは同一のデータである。

【0047】

信頼度マップ生成部１４は、式（８）の変換データの集合に含まれているＮ個の変換データの各々に対して、式（２）に示される関数Ｓ（・）を適用して、次式（９）に示されるようにＮ個の信頼度マップであるベクトル～ｐ_１，…，～ｐ_ｎ，…～ｐ_Ｎを生成する。

【0048】

【数9】

【0049】

逆変換部１５は、変換パラメータ指定部１１が出力するＮ個の変換パラメータξ_１～ξ_Ｎの各々に基づいて、信頼度マップ生成部１４が生成したＮ個の信頼度マップの各々に対して、各々に対応する変換データが生成された際に行われた画像変換に対応する逆変換を行う。例えば、ｎ番目の変換パラメータξ_ｎによる画像変換が、θ°回転させる回転の画像変換である場合、逆変換部１５は、ｎ番目の信頼度マップに対して、－θ°回転させる画像変換を行うことにより逆変換を行う。逆変換部１５が行う逆変換は、次式（１０）で表される。

【0050】

【数10】

【0051】

式（１０）において、右辺のＵ（・；ξ_ｎ）は、引数として与えられる信頼度マップに対して、変換パラメータξ_ｎに基づく画像変換に対応する逆変換の演算を行う変換関数である。式（１０）の左辺のベクトルｐ_ｎは、逆変換部１５が、変換パラメータξ_ｎに基づいてｎ番目の信頼度マップであるベクトル～ｐ_ｎを逆変換して得られるデータである。以下、ベクトルｐ_ｎを逆変換データという。

【0052】

なお、以下で説明する統合部１９がＮ個の逆変換データを統合する際に、統合部１９がＮ個の逆変換データの各々において空間的に同一の位置の特徴量を比較できるようにする必要がある。ここで、「空間的に同一の位置」とは、以下のような位置である。Ｎ個の逆変換データは、ベクトルｘ_１に基づいて生成されるデータである。そのため、例えば、ベクトルｘ_１において（ｃ，ｈ，ｗ）が（１，１，１）の位置に対応する位置が、Ｎ個の逆変換データの各々において存在することになる。言い換えると、Ｎ個の逆変換データの各々の位置は、ベクトルｘ_１のいずれかの１点に対応していることになり、ベクトルｘ_１において対応する位置が同一になるＮ個の逆変換データの位置が、空間的に同一の位置ということになる。

【0053】

したがって、逆変換部１５は、統合部１９がＮ個の逆変換データの各々において空間的に同一の位置の特徴量を比較できるようにするため、Ｎ個の逆変換後のデータの同一のｃ，ｈ，ｗによって示される位置が、空間的に同一の位置になるように位置合わせの処理を行ってＮ個の逆変換データを生成する。逆変換部１５が生成するＮ個の逆変換データの集合は、次式（１１）で表される。

【0054】

【数11】

【0055】

差分算出部１６は、前記逆変換データから、ある基準となる逆変換された信頼度マップを選別し、その基準となる逆変換された信頼度マップと各々の逆変換された信頼度マップとの差分を算出し、差分信頼度マップを生成する。あるいは、差分算出部１６は、ある基準となる逆変換された信頼度マップを選別し、その基準となる逆変換された信頼度マップと各々の逆変換された信頼度マップとの差分を算出し、さらにそれらの信頼度マップから画素ごと（位置座標ごと）に最大値を算出し、これを差分信頼度マップとしてもよい。

【0056】

この差分算出部１６で得られた差分信頼度マップの効果を説明する前に、図３を用いて、大きい程度で画像を縮小させて低解像画像から画像分割を行った場合と、小さい程度で画像縮小をさせた高解像画像から画像分割を行った場合における画像分割結果の違いについて説明する。

【0057】

低解像画像を用いて画像分割を行った場合、長所として、劣化の種類にかかわらず同じ分割結果になりやすく、大きな物体の分割結果は正しい結果となりやすい（図３の５０１）。しかしながら、低解像画像を用いて画像分割を行った場合、短所として、小さい物体の分割結果がつぶれやすい（図３の５０２では人（黄色）が未検出）。一方、高解像画像を用いて画像分割を行った場合、長所として、小さい物体の分割結果でも正しく推論される可能性がより高くなる（図３の５０３では人が正しく推論されている）。しかしながら、高解像画像を用いて画像分割を行った場合、短所として、大きな物体の分割結果が大きく誤る可能性がより高くなる（図３の５０４では歩道が正しく検出差されていない）。

【0058】

そこで、本発明では、図４に示されるように、高解像度画像の画像分割結果の長所と、低解像画像の画像分割結果の長所を統合することを目的としている。そのために、差分算出部１６では、例えば低解像画像における画像分割結果に対応する信頼度マップを、ある基準となる逆変換された信頼度マップとして選別し、その基準となる逆変換された信頼度マップと、各々の逆変換された信頼度マップ（例えば高解像度画像の分割結果に対応する信頼度マップ）との差分を算出し、差分信頼度マップを生成する。

【0059】

この差分信頼度マップは、図４の６００に示されるように、高解像画像の分割結果において大きく誤っている箇所（すなわち高解像画像分割結果における短所）と、図４の６０２に示されるように高解像画像分割結果において小領域であるが正しく分割されている箇所（すなわち高解像画像分割結果における長所）において差分が大きく出る。そこで、後述する差分補正部１７と信頼度マップ補正部１８により、高解像画像に対応する信頼度マップにおいて、これらの差分領域のうち、図４に示される６００の部分のみを補正することで、高解像画像に対応する信頼度マップの精度を改善する。

【0060】

差分補正部１７は、差分信頼度マップの各領域の値を、その周辺の領域の値を参照して補正し、補正差分信頼度マップを生成する。より具体的には、差分補正部１７では、周辺画素の値を参照し、領域縮小処理と領域膨張処理を行うことで、小さい差分領域（たとえば６０２）における差分信頼度マップを消しつつ、大きい差分領域（たとえば６００）における差分信頼度マップを保存する。

【0061】

例えば、ここでいう領域縮小処理として、局所領域ごとに極小値を取る操作を行うようにすればよい。また、ここでいう局所領域ごとに極小値を取る操作とは、例えば、予め決められた領域内の画素の値に対して、その領域内の画素がもつ値の最小値を求めて、当該領域内の画素に対して求めた最小値を割り当てることである。また、例えば、ここでいう領域膨張処理として、局所領域ごとに極大値を取る操作を行うようにすればよい。また、ここでいう局所領域ごとに極大値を取る操作とは、予め決められた領域内の画素の値に対して、その領域内の画素がもつ値の最大値を求めて、当該領域内の画素に対して求めた最大値を割り当てることである。

【0062】

このように領域縮小処理と領域拡大処理を行うことで、図４に示される６０１のように、大きな差分領域を保存しつつ、図４に示される６０３のように小さな差分領域を消去することができる。

【0063】

信頼度マップ補正部１８は、補正差分信頼度マップと、ある基準となる逆変換された前記信頼度マップと各々の逆変換された前記信頼度マップとから、前記補正差分信頼度マップの領域ごとに補正信頼度マップを生成する。図５に示されるように、より具体的には、補正後の差分信頼度マップの値が大きな領域は、低解像度画像（縮小率大）の信頼度マップ（すなわち基準となる信頼度マップ）の値により近い値とする。一方で、補正後の差分信頼度マップの値が小さな領域は、高解像度画像（縮小率小）の信頼度マップ（すなわち基準となる信頼度マップ）の値により近い値とする。

【0064】

これは例えば、基準となる信頼度マップをｐ_iとし、高解像度画像の信頼度マップをｐ_ｊとし、この高解像度画像に対応する差分信頼度マップをＳ_iとする。そして、補正された信頼度マップは、以下のように与えればよい。

【0065】

【数12】

【0066】

ここで、←は、新たに右辺の値を、左辺に与えることを意味する。また、＊は空間座標に関する行列の要素毎の掛け算を示している。また、σ（・）は、ゼロから１までの値をとる単調増加関数であり、例えば、シグモイド関数、ヘビサイド関数、あるいはハイパボリックタンジェント関数などの活性化関数を用いればよい。

【0067】

統合部１９は、変換統合条件記憶部１０に記憶されている予め選定された１つの統合演算式に基づいて、式（１１）の逆変換データの集合に含まれているＮ個の逆変換データを統合する。統合部１９が行う統合処理は、連結演算子（［・］）を用いて、次式（１３）で表される。

【0068】

【数13】

【0069】

式（１３）の左辺は、統合部１９がＮ個の逆変換データを統合することにより生成する統合データを示す記号であり、以下、本文では、統合データをベクトル＾ｐと記載する。統合部１９は、統合処理により生成する統合データ（すなわち、ベクトル＾ｐ）の次元数が、入力データであるベクトルｘに対して式（２）に示される関数Ｓ（・）を適用して得られる信頼度マップ（すなわち、式（３）のベクトルｐ）と同一の次元数になるように統合処理を行う。ここでいう同一の次元数とは、ｃ×ｈ×ｗで示されるデータのサイズが一致していることをいい、より具体的には、式（３）のベクトルｐが、例えば、８×２５６×２５６のサイズである場合、統合データであるベクトル＾ｐのサイズも８×２５６×２５６になっていることをいう。

【0070】

式（１３）の連結演算子は、単に、Ｎ個の逆変換データの各々におけるｃ，ｈ，ｗが同一である位置のＮ個の特徴量を連結、すなわち、Ｎ個の特徴量を合計した値を、当該位置における統合データの特徴量とする統合処理の演算を行う統合演算式であってもよい。式（１３）の連結演算子は、以下に示されるような統合演算式のいずれかであってもよい。

【0071】

例えば、式（１３）の連結演算子は、次式（１４）～（１８）で表される５個の統合演算式であってもよい。次式（１４）で表される統合演算式は、Ｎ個の逆変換データの各々において、ｃ，ｈ，ｗが同一である位置のＮ個の特徴量の中で最大値である特徴量を、当該位置における統合データの特徴量とするように統合処理を行う統合演算式である。

【0072】

【数14】

【0073】

次式（１５）で表される統合演算式は、Ｎ個の逆変換データの各々において、ｃ，ｈ，ｗが同一である位置のＮ個の特徴量の平均値を、当該位置における統合データの特徴量とするように統合処理を行う統合演算式である。

【0074】

【数15】

【0075】

次式（１６）で表される統合演算式は、Ｎ個の逆変換データの各々において、ｃ，ｈ，ｗが同一である位置のＮ個の特徴量に対して、Ｎ個の逆変換データごとに予め値が定められている重みｗ_ｎを乗算して得られた乗算値の中で最大の乗算値を、当該位置における統合データの特徴量とするように統合処理を行う統合演算式である。当該最大の乗算値は、重み付き最大値と呼ばれる値でもある。

【0076】

【数16】

【0077】

次式（１７）で表される統合演算式は、Ｎ個の逆変換データの各々において、ｃ，ｈ，ｗが同一である位置のＮ個の特徴量に対して、Ｎ個の逆変換データごとに予め定められる重みｗ_ｎの値を乗算して得られた乗算値を、Ｎ個の重みｗ_ｎの値の合計値で除算することにより得られる除算値を、当該位置における統合データの特徴量とするように統合処理を行う統合演算式である。当該除算値は、重み付き平均値、または、加重平均値と呼ばれる値でもある。

【0078】

【数17】

【0079】

次式（１８）で表される統合演算式は、Ｎ個の逆変換データの各々において、ｃ，ｈ，ｗが同一である位置のＮ個の特徴量を大きい方から順に並べた場合に、上位ｋ個の平均値を、当該位置における統合データの特徴量とするように統合処理を行う統合演算式である。

【0080】

【数18】

【0081】

式（１８）の統合演算式は、より詳細には、次式（１９）により表される。

【0082】

【数19】

【0083】

式（１９）におけるφ^（ｋ） _ｎｃｈｗは、次式（２０）によって定義される。

【0084】

【数20】

【0085】

式（２０）において、関数Ｒ（・）は、引数として与えられた値の順位を返り値として出力する関数である。例えば、逆変換データであるベクトルｐ_１～ｐ_Ｎにおいて、ｎ番目のベクトルｐ_ｎのある１点の特徴量であるｐ_ｎｃｈｗが、関数Ｒ（・）の引数として適用されたとする。この場合、関数Ｒ（・）は、引数のｐ_ｎｃｈｗとｃ，ｈ，ｗが同一であるＮ個のｐ_１ｃｈｗ～ｐ_Ｎｃｈｗの特徴量を大きい順に並べた場合に、引数のｐ_ｎｃｈｗの順位を返り値として出力する。ｋの値は、１～Ｎの間の整数値であって、予め定められる整数値である。ｋ＝１の場合、式（１８）は、式（１４）、すなわち、最大値を選択する統合処理を行う統合演算式と同一の式になり、ｋ＝Ｎの場合、式（１８）は、式（１５）、すなわち、平均値を選択する統合処理を行う統合演算式と同一の式になる。

【0086】

式（１３）の連結演算子は、以下のような統合演算式であってもよい。例えば、Ｎ個の逆変換データの各々において、ｃ，ｈ，ｗが同一である位置のＮ個の特徴量の中の中央値の特徴量を、当該位置における統合データの特徴量とするように統合処理を行う統合演算式であってもよい。Ｎ個の逆変換データの各々において、ｃ，ｈ，ｗが同一である位置のＮ個の特徴量に対して、Ｎ個の逆変換データごとに予め値が定められている重みｗｎの値を乗算して得られた乗算値の中の中央値の乗算値を、当該位置における統合データの特徴量とするように統合処理を行う統合演算式であってもよい。当該乗算値は、重み付き中央値と呼ばれる値でもある。

【0087】

式（１３）の連結演算子は、以下のような統合演算式であってもよい。統合データのある１つの位置をｃ_１，ｈ_１，ｗ_１とした場合、ｃ_１，ｈ_１，ｗ_１の位置の特徴量を統合演算式によって求める際に、Ｎ個の逆変換データの各々におけるｃ_１，ｈ_１，ｗ_１の位置の特徴量のみを対象とするのではなく、ｃ_１，ｈ_１，ｗ_１の位置の近傍の位置の特徴量を含めて、上記の式（１４）～式（１７）に示される統合演算式を適用した統合処理を行うようにしてもよい。

【0088】

この場合において、近傍を考慮する変換パラメータの種類を予め定めておき、予め定めた変換パラメータの種類に対応する逆変換データについては、近傍の特徴量を含めるようにし、予め定めた変換パラメータの種類以外の種類に対応する逆変換データについては、近傍の特徴量を含めないようにしてもよい。式（１６）、または、式（１７）に示される統合演算式を適用する場合、予め定めた変換パラメータの種類に対応する逆変換データについては、近傍の特徴量を含めた上で、重みｗｎの値を大きくするようにし、予め定めた変換パラメータの種類以外の種類に対応する逆変換データについては、近傍の特徴量を含めた上で、重みｗｎの値を小さくするようにしてもよい。

【0089】

ここで、「近傍の位置」とは、例えば、ｃ_１，ｈ_１，ｗ_１の位置を基準とした場合に、ｃ_１，ｈ_１，ｗ_１の位置に対して上下左右前後、及び斜め方向において隣接する２６個の位置であってもよいし、ｃ_１，ｈ_１，ｗ_１の位置に対して上下左右前後で隣接する６個の位置であってもよいし、ｃ_１，ｈ_１，ｗ_１の位置を含む任意の範囲であって予め定められる範囲に含まれる位置であってもよい。

【0090】

上記した統合演算式を複数組み合わせた演算式を統合演算式としてもよい。例えば、統合部１９が、式（１４）に基づいて生成した統合データと、式（１５）に基づいて生成した統合データとを、更に、式（１４）に基づいて統合した結果を、最終的な統合データとしてもよい。

【0091】

分析部２０は、統合部１９がＮ個の逆変換データを統合することにより生成する統合データであるベクトル＾ｐに対して、式（４）の関数ｇ（・）を適用する処理を行う。式（４）の関数ｇ（・）を適用する処理とは、認識処理であり、具体的には、セマンティックセグメンテーションのアルゴリズムにおいて行われる画像の領域をクラスごとに分割する画像分割処理である。分析部２０による認識処理は、次式（２１）で表される。

【0092】

【数21】

【0093】

式（２１）に示されるように、分析部２０による認識処理により、認識結果データ（すなわち、セマンティックセグメンテーションの結果を示すデータ）であるベクトル＾ｙが得られることになる。

【0094】

出力部２１は、例えば、液晶ディスプレイなどの画面を備えた表示装置であってもよいし、半導体メモリやＨＤＤ（Hard Disk Drive）などの記憶装置であってもよい。出力部２１が、表示装置である場合、分析部２０が認識処理により生成した認識結果データであるベクトル＾ｙを画面に表示する。出力部２１が、記憶装置である場合、分析部２０は、認識処理により生成した認識結果データであるベクトル＾ｙを出力部２１に書き込んで記憶させる。

【0095】

（実施形態の推論装置による処理）
図６は、本発明の一実施形態における推論装置１による処理の流れを示すフローチャートである。推論装置１が起動すると、変換パラメータ指定部１１は、変換統合条件記憶部１０に予め記憶されているＮ個の変換パラメータξ_１～ξ_Ｎを読み出し、読み出された変換パラメータξ_１～ξ_Ｎを、内部の記憶領域に書き込んで記憶させる（ステップＳａ１）。統合部１９は、変換統合条件記憶部１０に予め記憶されている１つの統合演算式を読み出し、読み出された統合演算式を、内部の記憶領域に書き込んで記憶させる（ステップＳａ２）。データ取込部１２は、外部から与えられる認識対象の画像データである入力データを取り込み、取り込まれた入力データを変換部１３に出力する（ステップＳａ３）。

【0096】

変換パラメータ指定部１１は、内部の記憶領域に記憶されている変換パラメータξ_１～ξ_Ｎの中からいずれか１つの変換パラメータξ_ｎを選択して読み出す。変換パラメータ指定部１１は、読み出した変換パラメータξ_ｎを、変換部１３と逆変換部１５とに出力する。これにより、図６に示される、最初の、Ｌａ１ｓからＬａ１ｅまでのループ処理が開始される。

【0097】

変換部１３は、データ取込部１２が出力する入力データと、変換パラメータ指定部１１が出力する変換パラメータξ_ｎとを取り込む。変換部１３は、取り込まれた入力データであるベクトルｘに対して、取り込まれた変換パラメータξ_ｎに基づいて、式（７）で表される画像変換を行って変換データを生成する。変換部１３は、生成された変換データ（すなわちベクトル～ｘ_ｎ）を、信頼度マップ生成部１４に出力する（ステップＳａ４）。

【0098】

信頼度マップ生成部１４は、変換部１３が出力する変換データであるベクトル～ｘ_ｎを取り込み、取り込まれたベクトル～ｘ_ｎに対して、式（２）に示される関数Ｓ（・）を適用して信頼度マップを生成する。信頼度マップ生成部１４は、生成された信頼度マップであるベクトル～ｐ_ｎを、逆変換部１５に出力する（ステップＳａ５）。

【0099】

逆変換部１５は、信頼度マップ生成部１４から出力された信頼度マップと、変換パラメータ指定部１１から出力された変換パラメータξ_ｎとを取り込む。逆変換部１５は、取り込まれた信頼度マップであるベクトル～ｐ_ｎに対して、取り込まれた変換パラメータξ_ｎに基づいて、式（１０）で表される逆変換（すなわち、変換部１３が変換パラメータξ_ｎに基づいて行った画像変換に対応する逆変換）を行って、逆変換データを生成する。逆変換部１５は、生成された逆変換データ（すなわち、ベクトルｐ_ｎ）を、統合部１９に出力する（ステップＳａ６）。

【0100】

差分算出部１６は、逆変換データから差分信頼度を算出する（ステップＳａ７）。より具体的には、差分算出部１６は、前記逆変換データから、ある基準となる逆変換された信頼度マップを選別し、その基準となる逆変換された信頼度マップとステップＳａ６において生成された逆変換データとの差分を算出し、差分信頼度マップを生成する。

【0101】

差分補正部１７は、差分信頼度を補正する（ステップＳａ８）。より具体的には、差分補正部１７は、差分信頼度マップの各領域の値を、その周辺の領域の値を参照して補正し、補正差分信頼度マップを生成する。

【0102】

信頼度マップ補正部１８は、逆変換データから差分信頼度を算出する（ステップＳａ９）。より具体的には、信頼度マップ補正部１８は、ステップＳａ８において生成された補正差分信頼度マップと、ある基準となる逆変換された信頼度マップと、ステップＳａ６において生成された逆変換データとから、前記補正差分信頼度マップの領域ごとに補正信頼度マップを生成する。

【0103】

変換パラメータ指定部１１は、内部の記憶領域に記憶されている変換パラメータξ_１～ξ_Ｎの中から未選択のいずれか１つの変換パラメータξ_ｎ（すなわち、変換部１３及び逆変換部１５に出力していない、いずれか１つの変換パラメータξ_ｎ）を選択することを繰り返し行う。これにより、変換パラメータξ_１～ξ_Ｎの各々に対応するステップＳａ４からＳａ６までの処理が繰り返し行われることになる（Ｌａ１ｓからＬａ１ｅまでのループ処理）。

【0104】

この場合において、変換パラメータ指定部１１が変換部１３に出力する変換パラメータξ_ｎが、画像変換を行わないことを示す変換パラメータξ_１である場合、変換部１３と逆変換部１５とは、以下の処理を行うことになる。ステップＳａ４の処理において、変換部１３は、データ取込部１２から取り込まれた入力データであるベクトルｘを、画像変換することなくベクトル～ｘ_１として、信頼度マップ生成部１４に出力する。また、ステップＳａ６の処理において、逆変換部１５は、信頼度マップ生成部１４が出力する信頼度マップであるベクトル～ｐ_１を、逆変換することなくベクトルｐ_１として、統合部１９に出力する。

【0105】

統合部１９は、変換統合条件記憶部１０を参照して、変換パラメータξ_１～ξ_Ｎの個数である「Ｎ」を検出する。統合部１９は、Ｌａ１ｓからＬａ１までのループ処理の間に、逆変換部１５が出力する逆変換データであるベクトルｐ_ｎを繰り返し取り込む。統合部１９は、取り込まれたベクトルｐ_ｎの個数がＮ個に一致しない間は、ベクトルｐ_ｎの取り込みを継続する。一方、統合部１９は、取り込まれたベクトルｐ_ｎの個数がＮ個に一致した場合、内部の記憶領域に記憶されている統合演算式に基づいて、Ｎ個のベクトルｐ_ｎを統合して統合データを生成する。統合部１９は、生成した統合データ（すなわち、ベクトル＾ｐ）を、分析部２０に出力する（ステップＳａ１０）。

【0106】

分析部２０は、統合部１９が出力する統合データであるベクトル＾ｐを取り込む。分析部２０は、取り込まれたベクトル＾ｐに対して、式（４）に示される関数ｇ（・）を適用して、式（２１）に示される認識処理を行い、認識結果データを生成する。分析部２０は、認識結果データであるベクトル＾ｙを、出力部２１に出力する（ステップＳａ１１）。

【0107】

出力部２１は、分析部２０から出力された認識結果データであるベクトル＾ｙを取り込む。上記したように、出力部２１が表示装置である場合、出力部２１は、取り込まれた認識結果データであるベクトル＾ｙを、画面に表示する。また、出力部２１が記憶装置である場合、出力部２１は、取り込んまれた認識結果データであるベクトル＾ｙを記憶する（ステップＳａ１２）。これにより、１つの入力データに対して推論装置１が行う推論処理が終了する。データ取込部１２に次の入力データが与えられた場合、再び、ステップＳａ３からＳａ９までの処理が行われることになる。

【0108】

（実施形態の条件選定装置の構成）
上記した推論装置１において、精度の高い認識結果が得られるようにするためには、変換統合条件記憶部１０に予め記憶させておく複数の変換パラメータと、１つの統合演算式との組み合わせが、入力データに生じている画像劣化に対して最適な組み合わせになるように選定されている必要がある。以下に説明する図７に示される条件選定装置２は、この最適な組み合わせを選定する装置である。

【0109】

上記した推論装置１のデータ取込部１２に与えられる入力データは、例えば、ビデオ監視や自動運転などのアプリケーションであって特定のアプリケーションから得られる時系列に並んだ複数の画像データであることを想定している。当該特定のアプリケーションは、例えば、特定のカメラによって一定の時間間隔で撮影された複数の画像データを取得する。取得された複数の画像データは、同一のカメラによって撮影され、かつ、同一のアプリケーションによって取得された画像データであることから、取得された複数の画像データの各々には、共通する画像劣化が生じることになる。ここでは、複数の画像データの各々に生じている画像劣化は、未知の画像劣化ではあるが、複数の画像データぶにおいて共通する画像劣化であり、人が目視することにより画像データの画素ごとのクラスを判別することができる程度の画像劣化であるものとする。

【0110】

図７は、本発明の一実施形態における条件選定装置２の構成を示すブロック図である。図７に示される条件選定装置２において、図１に示される推論装置１の構成と同様の構成については、同一の符号を付し、説明を省略することがある。図７に示されるように、条件選定装置２は、変換統合条件記憶部１０、変換パラメータ指定部１１ａ、変換部１３、信頼度マップ生成部１４、逆変換部１５、差分算出部１６、差分補正部１７、信頼度マップ補正部１８、統合部１９ａ、分析部２０、訓練データ記憶部２２、データ読出部２３、統合演算式選定部２４、及び処理結果記憶部２５を備える。

【0111】

訓練データ記憶部２２は、複数の訓練データを予め記憶する。上記したように特定のアプリケーションから得られる時系列に並んだ複数の画像データの各々は、未知の画像劣化を含んでいるものの、当該画像劣化は、人が目視することにより画像データの画素ごとのクラスを判別することができる程度の画像劣化である。そこで、特定のアプリケーションから得られた複数の画像データ（すなわち、複数の入力データ）が全て推論装置１に与えるデータとされるのではなく、一部の入力データが、条件選定装置２に適用するための訓練用のデータとして選択される。そして、選択された複数の訓練用の入力データの各々に対応する画素ごとのクラスを示す正解データが生成される。生成された正解データの各々は、各々に対応する訓練用の入力データに関連付けられて、複数の訓練データとされる。すなわち、１つの訓練データには、１つの訓練用の入力データと、当該訓練用の入力データに対応する１つの正解データとが含まれる。

【0112】

このようにして生成した複数の訓練データが、訓練データ記憶部２２に予め記憶されている。ここで、１つの訓練用の入力データであるベクトルｘに対応する正解データを、次式（２２）に示される記号で表し、以下、本文では、式（２２）の記号をベクトルｙと記載する。

【0113】

【数22】

【0114】

データ読出部２３は、開始指示信号、または、継続指示信号を取得するごとに、訓練データ記憶部２２から訓練データを１つ読み出す。データ読出部２３は、訓練データ記憶部２２から訓練データを読み出すことができない場合、終了指示信号を統合演算式選定部２４に出力する。データ読出部２３は、訓練データ記憶部２２から訓練データを読み出すことができた場合、変換パラメータ指定部１１ａに開始指示信号を出力する。データ読出部２３は、読み出した１つの訓練データに含まれている訓練用の入力データを変換部１３に出力し、当該訓練データに含まれている正解データを統合演算式選定部２４に出力する。

【0115】

変換パラメータ指定部１１ａは、外部から与えられる画像変換を示すＮ個の変換パラメータξ_１～ξ_Ｎを取り込む。変換パラメータ指定部１１ａは、開始指示信号を取得すると、取り込まれたＮ個の変換パラメータξ_１～ξ_Ｎの中から１つの変換パラメータξ_ｎを選択する。変換パラメータ指定部１１ａは、選択された変換パラメータξ_ｎを、変換部１３と逆変換部１５とに出力して、変換部１３と逆変換部１５とが用いる変換パラメータξ_ｎを指定する。

【0116】

【0117】

【0118】

【0119】

【0120】

【0121】

【0122】

【0123】

【0124】

【0125】

これは例えば、基準となる信頼度マップをｐ_ｉとし、高解像度画像の信頼度マップをｐ_ｊとし、この高解像度画像に対応する差分信頼度マップをＳ_ｉとする。そして、補正された信頼度マップは、以下のように与えればよい。

【0126】

【数23】

【0127】

ここで、←は、新たに右辺の値を、左辺に与えることを意味する。また、＊は空間座標に関する行列の要素毎の掛け算を示している。また、σ（・）は、ゼロから１までの値をとる単調増加関数であり、例えばシグモイド関数、ヘビサイド関数、あるいはハイパボリックタンジェント関数などの活性化関数を用いればよい。

【0128】

統合部１９ａは、外部から与えられるＭ個の統合演算式を取り込み、取り込まれたＭ個の統合演算式の各々に対応するＭ個の「統合演算式１」，…，「統合演算式Ｍ」のインデックスを生成する。ここで、Ｍは、２以上の整数である。統合部１９ａは、取り込まれたＭ個の統合演算式の各々に基づいて、式（１１）の逆変換データの集合に含まれているＮ個の逆変換データを統合して統合データを生成する統合処理を行う。

【0129】

統合部１９ａは、統合処理に用いた統合演算式に対応するインデックスを、用いた順に１つずつ統合演算式選定部２４に出力する。統合部１９ａは、生成した順に１つずつ統合データを分析部２０に出力する。言い換えると、統合部１９ａは、ある１つの統合演算式に基づいて統合処理を行って統合データを生成すると、当該ある１つの統合演算式に対応するインデックスを統合演算式選定部２４に出力するとともに、当該ある１つの統合演算式に基づいて生成した統合データを分析部２０に出力する。

【0130】

統合演算式選定部２４は、ある１つの訓練データに対して、Ｍ個の認識結果データが得られた場合、継続指示信号をデータ読出部２３に出力する。統合演算式選定部２４は、終了指示信号を取得すると、終了指示信号を取得するまでに得られた全ての認識結果データと、認識結果データの各々に対応する正解データとに基づいて、訓練データに含まれている入力データに生じている画像劣化に対する最適な１つの統合演算式を選定する。

【0131】

処理結果記憶部２５は、データ読出部２３が統合演算式選定部２４に出力する正解データごとに、変換パラメータ指定部１１ａが統合演算式選定部２４に出力するＮ個の変換パラメータと、分析部２０が統合演算式選定部２４に出力するＭ個の認識結果データとを関連付けて記憶する。条件選定装置２が備える変換統合条件記憶部１０は、初期状態ではデータを記憶しておらず、統合演算式選定部２４による選定の処理が終了した際に、複数の変換パラメータと、１つの統合演算式とを記憶する。複数の変換パラメータと、１つの統合演算式とを記憶した変換統合条件記憶部１０が、図１に示される推論装置１の変換統合条件記憶部１０として用いられることになる。

【0132】

（実施形態の条件選定装置による処理）
図８は、本発明の一実施形態における条件選定装置２による処理の流れを示すフローチャートである。図８に示されるフローチャートが開始される前提として、条件選定装置２の訓練データ記憶部２２には、複数の訓練データが予め書き込まれているものとする。また、変換統合条件記憶部１０と処理結果記憶部２５とは、初期化され、データを記憶していない状態にされているものとする。

【0133】

条件選定装置２の変換パラメータ指定部１１ａは、外部から与えられるＮ個の変換パラメータξ_１～ξ_Ｎを取り込み、取り込まれたＮ個の変換パラメータξ_１～ξ_Ｎを、内部の記憶領域に書き込んで記憶させる（ステップＳｂ１）。統合部１９ａは、外部から与えられるＭ個の統合演算式を取り込み、取り込まれたＭ個の統合演算式の各々に対応するＭ個の「統合演算式１」，…，「統合演算式Ｍ」のインデックスを生成する。統合部１９ａは、取り込まれたＭ個の統合演算式と、Ｍ個の統合演算式の各々に対応するＭ個の「統合演算式１」，…，「統合演算式Ｍ」のインデックスとを関連付けて、内部の記憶領域に書き込んで記憶させる。統合部１９ａは、生成したＭ個の「統合演算式１」，…，「統合演算式Ｍ」のインデックスを統合演算式選定部２４に出力する。

【0134】

統合演算式選定部２４は、Ｍ個の「統合演算式１」，…，「統合演算式Ｍ」のインデックスを取り込む。統合演算式選定部２４は、処理結果記憶部２５に、「正解データ」，「変換パラメータ」の項目と、取り込まれたＭ個の「統合演算式１」，…，「統合演算式Ｍ」のインデックスの各々に対応するＭ個の「統合演算式１」，…，「統合演算式Ｍ」の項目とを有するテーブルを生成する（ステップＳｂ２）。

【0135】

データ読出部２３が、外部から開始指示信号を取得すると（ステップＳｂ３）、最初の、Ｌｂ１ｓからＬｂ１ｅまでのループ処理が開始される。データ読出部２３は、訓練データ記憶部２２からいずれか１つの訓練データを読み出す。データ読出部２３は、訓練データを読み出すと、開始指示信号を変換パラメータ指定部１１ａに出力する。データ読出部２３は、読み出された訓練データに含まれている入力データを変換部１３に出力する。変換部１３は、データ読出部２３が出力する入力データを取り込む。データ読出部２３は、読み出された訓練データに含まれている正解データを統合演算式選定部２４に出力する（ステップＳｂ４）。

【0136】

統合演算式選定部２４は、データ読出部２３が出力する正解データを取り込む。以下、統合演算式選定部２４が取り込まれた正解データであるベクトルｙを、取り込まれた順番を示す番号を添え字に示してベクトルｙ_１、ベクトルｙ_２、…、として記載する。統合演算式選定部２４は、最初の正解データであるベクトルｙ_１を取り込むと、処理結果記憶部２５のテーブルにレコードを１つ生成し、生成したレコードの「正解データ」の項目に、取り込まれたベクトルｙ_１を書き込む。

【0137】

変換パラメータ指定部１１ａは、データ読出部２３から開始指示信号を取得すると、内部の記憶領域からＮ個の変換パラメータξ_１～ξ_Ｎを読み出し、読み出されたＮ個の変換パラメータξ_１～ξ_Ｎを、統合演算式選定部２４に出力する。統合演算式選定部２４は、変換パラメータ指定部１１ａが出力するＮ個の変換パラメータξ_１～ξ_Ｎを取り込む。統合演算式選定部２４は、取り込まれたＮ個の変換パラメータξ_１～ξ_Ｎを、処理結果記憶部２５のテーブルにおいて、直近で生成したレコード（すなわち、「正解ラベル」の項目にベクトルｙ_１が書き込まれているレコード）の「変換パラメータ」の項目に書き込む。変換パラメータ指定部１１ａは、内部の記憶領域に記憶されているＮ個の変換パラメータξ_１～ξ_Ｎの個数である「Ｎ」の値を、統合部１９ａに出力する。統合部１９ａは、変換パラメータ指定部１１ａが出力する「Ｎ」の値を取り込む（ステップＳｂ５）。

【0138】

変換パラメータ指定部１１ａは、データ読出部２３から開始指示信号を取得すると、内部の記憶領域に記憶されているＮ個の変換パラメータξ_１～ξ_Ｎの中から、いずれか１つの変換パラメータξ_ｎを読み出す。変換パラメータ指定部１１ａは、読み出された変換パラメータξ_ｎを、変換部１３と逆変換部１５とに出力する。これにより、最初の、Ｌｂ２ｓからＬｂ２ｅまでのループ処理が開始される。Ｌｂ２ｓからＬｂ２ｅまでのループ処理は、図６に示されるＬａ１ｓからＬａ１ｅまでのループ処理と同様の処理が行われる。なお、ステップＳｂ５の処理と、Ｌｂ２ｓからＬｂ２ｅまでのループ処理とは、ともに、ステップＳｂ４の処理においてデータ読出部２３が入力データと正解データとを出力することにより開始される処理であるため、並列に行われる。

【0139】

統合部１９ａは、ステップＳｂ５の処理で取り込まれた「Ｎ」の値を参照する。統合部１９ａは、Ｌｂ２ｓからＬｂ２ｅまでのループ処理の間に、逆変換部１５が出力する逆変換データであるベクトルｐ_１～ｐ_Ｎを取り込む。統合部１９ａは、取り込まれたベクトルｐ_ｎの個数がＮ個になると、内部の記憶領域に記憶されている「統合演算式１」，…，「統合演算式Ｍ」のインデックスが付与されたＭ個の統合演算式の中からいずれか１つの統合演算式と、当該統合演算式に関連付けられている「統合演算式ｍ」のインデックスを選択する。ここで、ｍは、１～Ｍの中の任意の整数である。

【0140】

統合部１９ａは、選択された「統合演算式ｍ」のインデックスを、統合演算式選定部２４に出力する。統合部１９ａは、選択した統合演算式に基づいて、取り込まれたベクトルｐ_１～ｐ_Ｎを統合して統合データを生成する。統合部１９ａは、生成された統合データを分析部２０に出力する（ステップＳｂ９）。

【0141】

分析部２０は、図６に示されるステップＳａ８の処理と同様の認識処理を行って、認識結果データを生成する。分析部２０は、生成された認識結果データを、統合演算式選定部２４に出力する（ステップＳｂ１０）。

【0142】

統合演算式選定部２４は、ステップＳｂ９の処理において統合部１９ａから出力された「統合演算式ｍ」のインデックスと、ステップＳｂ１０の処理において分析部２０から出力された認識結果データとを取り込む。統合演算式選定部２４は、処理結果記憶部２５のテーブルにおいて、直近で生成したレコード（すなわち「正解ラベル」の項目にベクトルｙ_１が書き込まれているレコード）を検出する。統合演算式選定部２４は、検出されたレコードにおいて、取り込まれた「統合演算式ｍ」のインデックスに対応する「統合演算式ｍ」の項目に、取り込まれた認識結果データを書き込む。ここで、ｍ＝２とした場合、正解データであるベクトルｙ_１と、ｍ＝２である「統合演算式２」のインデックスとに対応する認識結果データであるベクトル＾ｙ_１，２が、「統合演算式２」の項目に書き込まれる（ステップＳｂ１１）。

【0143】

統合部１９ａは、未選択のいずれか１つの統合演算式を選択する。これにより、再び、ステップＳｂ９からＳｂ１１までの処理（すなわち、Ｌｂ３ｓからＬｂ３ｅまでのループ処理）が行われる。Ｍ個の統合演算式の各々に対応するステップＳｂ９からＳｂ１１までの処理が終了すると、Ｌｂ３ｓからＬｂ３ｅまでのループ処理が終了する。統合演算式選定部２４は、処理結果記憶部２５のテーブルのベクトルｙ_１に対応するレコードの「統合演算式１」，…，「統合演算式Ｍ」の全ての項目に認識結果データを書き込むと、継続指示信号をデータ読出部２３に出力する。

【0144】

データ読出部２３は、統合演算式選定部２４から継続指示信号を取得すると、訓練データ記憶部２２から、それまでに処理対象として読み出していない、いずれか１つの訓練データを読み出す。データ読出部２３は、訓練データを読み出すと、開始指示信号を変換パラメータ指定部１１ａに出力する。これにより、データ読出部２３が読み出した訓練データに対して、ステップＳｂ４，Ｓｂ５、Ｌｂ２ｓからＬｂ２ｅまでのループ処理、Ｌｂ３ｓからＬｂ３ｅまでのループ処理（すなわち、Ｌｂ１ｓからＬｂ１ｅまでのループ処理）が行われる。

【0145】

データ読出部２３は、訓練データ記憶部２２に記憶されている全ての訓練データを処理対象として読み出した場合、それ以上、訓練データを読み出すことができないため、開始指示信号を変換パラメータ指定部１１ａに出力せず、終了指示信号を統合演算式選定部２４に出力する。

【0146】

統合演算式選定部２４は、データ読出部２３から終了指示信号を取得すると、処理結果記憶部２５を参照する。統合演算式選定部２４は、処理結果記憶部２５に記憶されている全ての認識結果データと、認識結果データの各々に対応する正解データとに基づいて、例えば、認識結果データと、当該認識結果データに対応する正解データとが一致する度合いを算出する。統合演算式選定部２４は、算出された一致度合いが最も大きい、正解データと認識結果データとの組み合わせを検出する。統合演算式選定部２４は、検出された認識結果データに基づいて、変換統合条件記憶部１０に書き込む変換パラメータと、統合演算式とを検出する。統合演算式選定部２４は、検出された変換パラメータと統合演算式とを変換統合条件記憶部１０に書き込んで記憶させる（ステップＳｂ１２）。

【0147】

例えば、統合演算式選定部２４は、一致する度合いが最も大きい正解データと認識結果データとの組み合わせとして、正解データであるベクトルｙ_２と認識結果データであるベクトル＾ｙ_２，２とを検出したものとする。この場合、統合演算式選定部２４は、ベクトルｙ_２を含むレコードの「変換パラメータ」の項目に書き込まれている変換パラメータξ_１～ξ_Ｎと、ベクトル＾ｙ_２，２に対応する「統合演算式２」のインデックスに対応する統合演算式とを、変換統合条件記憶部１０に書き込むことになる。統合演算式選定部２４による変換統合条件記憶部１０への書き込み処理が終了すると、図８のフローチャートが示す処理は終了する。

【0148】

変換統合条件記憶部１０に書き込まれた変換パラメータξ_１～ξ_Ｎと、「統合演算式１」のインデックスに対応する統合演算式との組み合わせが、推論装置１に対して与えられる入力データに生じている画像劣化に対して最適な組み合わせになる。そのため、変換統合条件記憶部１０を、推論装置１の変換統合条件記憶部１０として用いることにより、推論装置１において精度の高い認識結果が得られることになる。

【0149】

なお、条件選定装置２によって選定される複数の変換パラメータと１つの統合演算式との組み合わせは、共通する画像劣化を含んでいる複数の入力データに対して最適になっている。そのため、条件選定装置２の訓練データ記憶部２２に記憶されている訓練データに含まれている入力データの画像劣化とは異なる画像劣化を含んでいる入力データを推論装置１に与える場合、条件選定装置２を用いて、改めて複数の変換パラメータと１つの統合演算式との組み合わせを選定する必要がある。

【0150】

（実施形態の条件選定装置の他の構成例）
上記した実施形態の条件選定装置２においては、変換パラメータ指定部１１ａは、外部から取り込まれたＮ個の変換パラメータξ_１～ξ_Ｎの全てを用いてＬｂ２ｓからＬｂ２ｅまでのループ処理を行うようにしている。これに対し、訓練データごとに、変換パラメータ指定部１１ａが、変換部１３と逆変換部１５とに対して指定する変換パラメータの組み合わせを変えるようにしてもよい。例えば、変換パラメータ指定部１１ａは、外部から与えられるＮ個より多い数の変換パラメータを取り込む。変換パラメータ指定部１１ａは、データ読出部２３から開始指示信号を取得するごとに、画像変換を行わない変換パラメータξ_１を含むＮ個の変換パラメータを、取り込まれた変換パラメータからランダムに選択する。そして、変換パラメータ指定部１１ａによってランダムに選択されたＮ個の変換パラメータの各々に基づいて、Ｌｂ２ｓからＬｂ２ｅまでのループ処理が行われるような構成であってもよい。

【0151】

この場合において、変換パラメータ指定部１１ａに対して外部から与えられる変換パラメータの個数をＬ個とする場合、例えば、Ｎの値を、Ｌの１０％程度の値にするようにしてもよい。変換パラメータ指定部１１ａは、ランダムに選択する個数を、Ｎ個に固定するのではなく、選択するごとに、選択する変換パラメータの個数を任意に変えるようにしてもよい。

【0152】

ところで、変換パラメータ指定部１１ａは、上記したように、ステップＳｂ５の処理において、統合部１９ａに対して、内部の記憶領域に記憶されているＮ個の変換パラメータξ_１～ξ_Ｎの個数である「Ｎ」の値を出力するようにしている。これに対して、変換パラメータ指定部１１ａは、開始指示信号を取得するごとに、指定する変換パラメータの組み合わせを変更する場合、選択した変換パラメータの個数を統合部１９ａに出力することになる。

【0153】

上記のように、訓練データごとに、変換パラメータの組み合わせが変わる場合、処理結果記憶部２５のテーブルの「変換パラメータ」の項目に記憶される変換パラメータは、レコードごとに変わることになる。このようにすることで、共通の画像劣化を含んでいる複数の入力データに対する最適な変換パラメータと、統合演算式の組み合わせであって、かつ、変換パラメータの個数が外部から与えられる変換パラメータの個数よりも少なくなっている組み合わせを選定することが可能になる。そのため、推論装置１の処理の負荷を軽減することが可能になる。

【0154】

なお、条件選定装置２の統合部１９ａに対して外部から与えられる統合演算式の個数であるＭは、２以上の整数であるとしているが、訓練データごとに、変換パラメータの組み合わせが変わる場合、Ｍ＝１に（すなわち、統合部１９ａに統合演算式の数を１つに）してもよい。Ｍ＝１とする場合、統合演算式の選定を行うことにはならないが、条件選定装置２は、共通の画像劣化を含んでいる複数の入力データに対する最適な変換パラメータを選定することになる。

【0155】

上記の実施形態の推論装置１において、変換パラメータ指定部１１は、変換パラメータを指定する。変換部１３は、入力データに対して、指定された変換パラメータの各々に基づく変換を行って変換データを生成する。信頼度マップ生成部１４は、変換データごとに、変換データの各々の特徴を示すデータである信頼度マップを生成する。逆変換部１５は、信頼度マップの各々に対して、各々に対応する変換データが生成された際に行われた変換に対する逆変換を、指定された変換パラメータの各々に基づいて行って逆変換データを生成する。統合部１９は、逆変換データの各々を統合する統合処理を行い、入力データの前記信頼度マップと次元数が一致する統合データを生成する。分析部２０は、統合データに対して分析処理の一例としての認識処理を行う。

【0156】

このように、入力データから変換により生成した変換データの信頼度マップを生成し、生成した信頼度マップを逆変換して統合し、統合した統合データに認識処理を行うことにより、入力データにおいて生じている未知の劣化に対して頑健性のある推論処理を行うことが可能になる。

【0157】

すなわち、実施形態による推論装置１は、認識処理を行う前に、入力データに対して、複数の画像変換を行うことにより、画像劣化を軽減させた上で、特徴抽出を行い、抽出され特徴を含む信頼度マップを逆変換して統合する構成を備えている。言い換えると、推論装置１に採用されている手法は、変換部１３による画像変換と、逆変換部１５による画像変換の逆変換と、統合部１９によるアンサンブルと、信頼度マップ生成部１４及び分析部２０によるダウンサンプリングと、アップサンプリングとを含むセマンティックセグメンテーションのアルゴリズムという既存の手法を組み合わせた手法である。

【0158】

当該手法は、既存の手法を組み合わせた手法であるものの、未知の画像劣化による影響を軽減することができるという効果的な手法になっている。当該手法は、既存のセマンティックセグメンテーションのアルゴリズムを、再学習させることなく、そのまま利用することができる手法でもある。そのため、推論装置１は、学習済みのセマンティックセグメンテーションのニューラルネットワークに対して、微調整などの再学習を行うことなく、入力データにおいて生じている未知の劣化に対して頑健性のある推論処理を行うことを可能にしている。

【0159】

上述した実施形態によれば、推論装置は、変換パラメータ指定部と、変換部と、信頼度マップ生成部と、逆変換部と、差分算出部と、差分補正部と、信頼度マップ補正部と、統合部と、分析部とを備える。例えば、推論装置は、実施形態における推論装置１であり、変換パラメータ指定部は、実施形態における変換パラメータ指定部１１であり、変換部は、実施形態における変換部１３であり、信頼度マップ生成部は、実施形態における信頼度マップ生成部１４であり、逆変換部は、実施形態における逆変換部１５であり、差分算出部は、実施形態における差分算出部１６であり、差分補正部は、実施形態における差分補正部１７であり、信頼度マップ補正部は、実施形態における信頼度マップ補正部１８であり、統合部は、実施形態における統合部１９であり、分析部は、実施形態における分析部２０である。

【0160】

上記の変換パラメータ指定部は、１つ以上の変換パラメータを指定する。上記の変換部は、入力データに対して、指定された変換パラメータの各々に基づく変換を行うことで変換データを生成する。例えば、変換パラメータは、実施形態におけるξ_１，…，ξ_ｎ，…，ξ_Ｎの各々であり、入力データは、実施形態におけるベクトルｘであり、変換は、実施形態における関数Ｄ（・；ξ_ｎ）の演算であり、変換データは、実施形態におけるベクトル～ｘ_１，…，～ｘ_ｎ，…，～ｘ_Ｎの各々である。上記の信頼度マップ生成部は、変換データごとに、変換データの各々の特徴を示すデータである信頼度マップを生成する。例えば、信頼度マップは、実施形態におけるベクトル～ｐ_１，…，～ｐ_ｎ，…～ｐ_Ｎである。上記の逆変換部は、信頼度マップの各々に対して、指定された変換パラメータに基いて、変換データが生成された際に行われた変換に対する逆変換を行うことで逆変換データを生成する。例えば、逆変換は、実施形態における関数Ｕ（・；ξｎ）の演算であり、逆変換データは、実施形態におけるベクトルｐ_ｎである。上記の差分算出部は、逆変換データから基準となる逆変換された信頼度マップを選別し、基準となる逆変換された信頼度マップと各々の逆変換された信頼度マップとの差分を算出することで差分信頼度マップを生成する。例えば、差分信頼度マップは、実施形態におけるＳ_iである。上記の差分補正部は、差分信頼度マップの各領域の値を周辺の領域の値を参照して補正することで補正差分信頼度マップを生成する。例えば、補正差分信頼度マップは、実施形態におけるＳ_iである。上記の信頼度マップ補正部は、補正差分信頼度マップと、基準となる逆変換された信頼度マップと各々の逆変換された信頼度マップと、に基づいて、補正差分信頼度マップの領域ごとに補正信頼度マップを生成する。例えば、補正信頼度マップは、実施形態におけるｐ_ｊである。上記の統合部は、逆変換データの各々を統合する統合処理を行うことで、入力データの信頼度マップと次元数が一致する統合データを生成する。例えば、統合処理は、実施形態における＾ｐ＝［ｐ_１，…，ｐ_ｎ，…，ｐ_Ｎ］の演算であり、統合データは、実施形態におけるベクトル＾ｐである。上記の分析部は、統合データに対して分析処理を行う。例えば、認識処理は、実施形態におけるベクトル＾ｐに対して関数ｇ（・）を適用する認識処理である。

【0161】

なお、上記の分析部は、分析処理として認識処理を行い、上記の統合部は、正解データが付与された入力データから生成される統合データに対して行われる分析部の認識処理によって得られる認識結果と、当該統合データに対応する正解データとに基づいて複数の統合演算式の中から選択されるいずれか１つの最適な統合演算式を用いて統合処理を行うようにしてもよい。

【0162】

なお、上記の統合演算式は、統合する対象の逆変換データの各々における対応する位置の特徴値に基づいて、統合データの当該位置の特徴値を算出する演算を行う式であってもよい。

【0163】

なお、上記の統合演算式は、統合する対象の逆変換データの各々における対応する位置、及び当該位置の近傍の位置の特徴値に基づいて、統合データの当該位置の特徴値を算出する演算を行う式であってもよい。

【0164】

なお、上記の推論装置は、入力データの品質を評価する品質評価部をさらに備え、上記の統合部は、統合処理において用いる統合演算式が逆変換データの各々に適用される重みを用いる演算を含んでいる場合、品質評価部によって評価して得られる品質を示すデータに基づいて逆変換データに対応する入力データの重みの値を定めるようにしてもよい。

【0165】

なお、上記の分析部は、分析処理として認識処理を行い、変換パラメータ指定部は、正解データが付与された入力データから得られる逆変換データの各々に対して行われる分析部の認識処理によって得られる認識結果と、逆変換データに対応する正解データと、に基づいて、選択される変換パラメータを指定するようにしてもよい。

【0166】

なお、実施形態における推論装置１及び条件選定装置２の機能を実現するためのプログラムをコンピュータ読み取り可能な記録媒体に記録して、この記録媒体に記録されたプログラムをコンピュータシステムに読み込ませ、実行することにより、上述した処理を行ってもよい。なお、ここでいう「コンピュータシステム」とは、ＯＳや周辺機器等のハードウエアを含むものとする。また、「コンピュータシステム」は、ホームページ提供環境（あるいは表示環境）を備えたＷＷＷシステムも含むものとする。また、「コンピュータ読み取り可能な記録媒体」とは、フレキシブルディスク、光磁気ディスク、ＲＯＭ、ＣＤ－ＲＯＭ等の可搬媒体、コンピュータシステムに内蔵されるハードディスク等の記憶装置のことをいう。更に「コンピュータ読み取り可能な記録媒体」とは、インターネット等のネットワークや電話回線等の通信回線を介してプログラムが送信された場合のサーバやクライアントとなるコンピュータシステム内部の揮発性メモリ（ＲＡＭ）のように、一定時間プログラムを保持しているものも含むものとする。

【0167】

また、上記プログラムは、このプログラムを記憶装置等に格納したコンピュータシステムから、伝送媒体を介して、あるいは、伝送媒体中の伝送波により他のコンピュータシステムに伝送されてもよい。ここで、プログラムを伝送する「伝送媒体」は、インターネット等のネットワーク（通信網）や電話回線等の通信回線（通信線）のように情報を伝送する機能を有する媒体のことをいう。また、上記プログラムは、前述した機能の一部を実現するためのものであっても良い。更に、前述した機能をコンピュータシステムに既に記録されているプログラムとの組み合わせで実現できるもの、いわゆる差分ファイル（差分プログラム）であっても良い。

【0168】

以上、この発明の一実施形態について図面を参照して詳述してきたが、具体的な構成はこの実施形態に限られるものではなく、この発明の要旨を逸脱しない範囲の設計等も含まれる。

【符号の説明】

【0169】

１…推論装置、２…条件選定装置、１０…変換統合条件記憶部、１１，１１ａ…変換パラメータ指定部、１２…データ取込部、１３…変換部、１４…信頼度マップ生成部、１５…逆変換部、１６…差分算出部、１７…差分補正部、１８…信頼度マップ補正部、１９，１９ａ…統合部、２０…分析部、２１…出力部、２２…訓練データ記憶部、２３…データ読出部、２４…統合演算式選定部、２５…処理結果記憶部

【図1】