(19)【発行国】日本国特許庁(JP)
(12)【公報種別】公開特許公報(A)
(11)【公開番号】P2022150552
(43)【公開日】2022-10-07
(54)【発明の名称】データ処理装置及び方法
(51)【国際特許分類】
G06T 7/00 20170101AFI20220929BHJP
【FI】
G06T7/00 350C
【審査請求】未請求
【請求項の数】10
【出願形態】OL
(21)【出願番号】P 2021053198
(22)【出願日】2021-03-26
(71)【出願人】
【識別番号】000237592
【氏名又は名称】株式会社デンソーテン
(74)【代理人】
【識別番号】110001933
【氏名又は名称】特許業務法人 佐野特許事務所
(72)【発明者】
【氏名】関 竜介
(72)【発明者】
【氏名】岡田 康貴
(72)【発明者】
【氏名】片山 雄喜
(72)【発明者】
【氏名】広見 怜
(72)【発明者】
【氏名】荻島 葵
【テーマコード(参考)】
5L096
【Fターム(参考)】
5L096CA25
5L096DA02
5L096EA35
5L096FA16
5L096FA32
5L096FA33
5L096FA52
5L096FA60
5L096FA66
5L096FA69
5L096GA34
5L096GA51
5L096HA09
5L096HA11
5L096JA05
5L096JA11
5L096KA04
5L096KA15
5L096MA07
(57)【要約】 (修正有)
【課題】データセットにおけるクラス情報の誤りを特定するデータ処理装置及び方法を提供する。
【解決手段】画像分類データセットは、各々に物体の画像データを含む複数の物体画像と、各物体画像中の物体のクラスを特定するクラス情報を含む。複数の物体画像に含まれるm枚の物体画像の特徴量FTとm枚の物体画像に対するクラス情報とに基づき、m枚の物体画像のクラスタリングを行う。クラスタリングにより得られる1以上のクラスタ(CT
B1、CT
B2)について、クラスタ毎に、当該クラスタに属する複数の特徴点の重心(G
B1、G
B2)及び当該重心と各特徴量との距離dを導出し、複数の特徴量に対して導出した複数の距離の平均及び分散を導出する。平均及び分散の導出結果に基づいて、クラス情報に誤りのある物体画像が属するクラスタを誤りクラスタとして特定する。
【選択図】
図13
【特許請求の範囲】
【請求項1】
各々に物体の画像データを含む複数の物体画像と、各物体画像中の物体のクラスを特定するクラス情報と、を含む画像分類データセットを取得する画像分類データセット取得部と、
前記画像分類データセットにおける各物体画像の特徴量を導出する特徴量導出部と、
前記複数の物体画像に含まれるm枚の物体画像の特徴量と前記m枚の物体画像に対する前記クラス情報とに基づき、前記m枚の物体画像のクラスタリングを行うクラスタリング処理部と(mは3以上の整数)、
前記クラスタリングにより得られる1以上のクラスタについて、クラスタごとに、当該クラスタに属する複数の特徴点の重心及び当該重心と各特徴量との距離を導出し、前記複数の特徴量に対して導出した複数の距離の平均及び分散を導出する指標導出部と、
前記平均及び前記分散の導出結果に基づいて、前記クラス情報に誤りのある物体画像が属するクラスタを誤りクラスタとして特定する誤り特定部と、を備える
、データ処理装置。
【請求項2】
前記誤り特定部は、導出された平均が所定の第1閾値以上であって且つ導出された散が所定の第2閾値以上であるクラスタを、前記誤りクラスタとして特定する
、請求項1に記載のデータ処理装置。
【請求項3】
前記クラスタリング処理部は、前記クラスタリングにおいて前記m枚の物体画像をk個のクラスタに分類し、
kは、前記m枚の物体画像に対する前記クラス情報により表される、前記m枚の物体画像における物体のクラスの種類数に等しい
、請求項1又は2に記載のデータ処理装置。
【請求項4】
前記誤り特定部は、前記誤りクラスタに属するn枚の物体画像の再クラスタリングを前記n枚の物体画像に対するn個の特徴量に基づいて行い、前記再クラスタリングの結果に基づいて、前記n枚の物体画像の中から前記クラス情報に誤りのある物体画像を特定する(nは3以上の整数)
、請求項1~3の何れかに記載のデータ処理装置。
【請求項5】
前記誤り特定部は、前記再クラスタリングにより前記n枚の物体画像を第1及び第2クラスタに分類し、前記第2クラスタに属する物体画像の総数が前記第1クラスタに属する物体画像の総数よりも少ないとき、前記第2クラスタに属する物体画像を前記クラス情報に誤りのある物体画像として特定する
、請求項4に記載のデータ処理装置。
【請求項6】
前記誤り特定部は、前記再クラスタリングにより前記n枚の物体画像を第1及び第2クラスタに分類し、
前記n枚の物体画像についてのn個の特徴量の重心と前記第2クラスタとの距離が、前記n枚の物体画像についてのn個の特徴量の重心と前記第1クラスタとの距離よりも大きいとき、前記第2クラスタに属する物体画像を前記クラス情報に誤りのある物体画像として特定する
、請求項4に記載のデータ処理装置。
【請求項7】
前記複数の物体画像は複数の入力画像から切り出された画像であり、
前記複数の入力画像を複数の学習用画像として用い、前記複数の学習用画像の画像データと各学習用画像内の物体の位置及びクラスを特定するアノテーション情報とを含む学習用データセットを生成する学習用データセット生成部が当該データ処理装置に設けられ、
前記学習用データセット生成部は、前記誤り特定部の特定結果に基づき、前記クラス情報に誤りのある物体画像を含む入力画像を前記複数の入力画像からアノテーション対象として抽出し、前記アノテーション対象に対して外部から与えられた情報を用いて、前記アノテーション対象に対する前記アノテーション情報を修正する
、請求項4~6の何れかに記載のデータ処理装置。
【請求項8】
前記複数の物体画像は複数の入力画像から切り出された画像であり、
前記複数の入力画像の一部を複数の学習用画像として抽出し、前記複数の学習用画像の画像データと各学習用画像内の物体の位置及びクラスを特定するアノテーション情報とを含む学習用データセットを生成する学習用データセット生成部が当該データ処理装置に設けられ、
前記学習用データセット生成部は、前記誤り特定部の特定結果に基づき、前記クラス情報に誤りのある物体画像を含む入力画像を前記複数の学習用画像から除外する
、請求項4~6の何れかに記載のデータ処理装置。
【請求項9】
前記画像分類データセットを用いてニューラルネットワークの機械学習を実行することで物体分類用の推論モデルを作成する機械学習処理部を更に備え、
前記特徴量導出部は、前記推論モデルに対して前記画像分類データセットを入力することで各物体画像の特徴量を導出する
、請求項1~8の何れかに記載のデータ処理装置。
【請求項10】
各々に物体の画像データを含む複数の物体画像と、各物体画像中の物体のクラスを特定するクラス情報と、を含む画像分類データセットを取得する画像分類データセット取得ステップと、
前記画像分類データセットにおける各物体画像の特徴量を導出する特徴量導出ステップと、
前記複数の物体画像に含まれるm枚の物体画像の特徴量と前記m枚の物体画像に対する前記クラス情報とに基づき、前記m枚の物体画像のクラスタリングを行うクラスタリング処理ステップと(mは3以上の整数)、
前記クラスタリングにより得られる1以上のクラスタについて、クラスタごとに、当該クラスタに属する複数の特徴点の重心及び当該重心と各特徴量との距離を導出し、前記複数の特徴量に対して導出した複数の距離の平均及び分散を導出する指標導出ステップと、
前記平均及び前記分散の導出結果に基づいて、前記クラス情報に誤りのある物体画像が属するクラスタを誤りクラスタとして特定する誤り特定ステップと、を備える
、データ処理方法。
【発明の詳細な説明】
【技術分野】
【0001】
本発明は、データ処理装置及び方法に関する。
【背景技術】
【0002】
機械学習の一種である教師あり学習により画像認識(物体検出又は物体分類等)を行う推論モデルを構築するためには、一般に、アノテーション情報が付与された大量の画像(数千枚から数百万枚の画像、又は、それを超える枚数の画像)が必要である。アノテーション情報は、例えば、人間による手動アノテーション又は学習済みモデルによる自動アノテーションによって作成される。大量の画像の画像データとアノテーション情報とを含むデータセットを用いて教師あり学習を実施できる。
【先行技術文献】
【特許文献】
【0003】
【発明の概要】
【発明が解決しようとする課題】
【0004】
但し、手動アノテーション及び自動アノテーションの何れの場合でも、画像中の物体に誤ったクラス情報(ラベル)がアノテーションされることがある。人手(人間の目)によるチェックを個々の画像に対して行えば誤ったクラス情報(ラベル)を判別することができるが、当該チェックには膨大なコスト(時間及び人間の労力)が発生する。クラス情報に誤りがあるデータを装置側で自動抽出することができれば、データセット中の不備を探すコストを削減でき、有益である。
【0005】
本発明は、クラス情報の誤りの特定に寄与するデータ処理装置及び方法を提供することを目的とする。
【課題を解決するための手段】
【0006】
本発明に係るデータ処理装置は、各々に物体の画像データを含む複数の物体画像と、各物体画像中の物体のクラスを特定するクラス情報と、を含む画像分類データセットを取得する画像分類データセット取得部と、前記画像分類データセットにおける各物体画像の特徴量を導出する特徴量導出部と、前記複数の物体画像に含まれるm枚の物体画像の特徴量と前記m枚の物体画像に対する前記クラス情報とに基づき、前記m枚の物体画像のクラスタリングを行うクラスタリング処理部と(mは3以上の整数)、前記クラスタリングにより得られる1以上のクラスタについて、クラスタごとに、当該クラスタに属する複数の特徴点の重心及び当該重心と各特徴量との距離を導出し、前記複数の特徴量に対して導出した複数の距離の平均及び分散を導出する指標導出部と、前記平均及び前記分散の導出結果に基づいて、前記クラス情報に誤りのある物体画像が属するクラスタを誤りクラスタとして特定する誤り特定部と、を備える構成(第1の構成)である。
【0007】
上記第1の構成に係るデータ処理装置において、前記誤り特定部は、導出された平均が所定の第1閾値以上であって且つ導出された分散が所定の第2閾値以上であるクラスタを、前記誤りクラスタとして特定する構成(第2の構成)であっても良い。
【0008】
上記第1又は第2の構成に係るデータ処理装置において、前記クラスタリング処理部は、前記クラスタリングにおいて前記m枚の物体画像をk個のクラスタに分類し、kは、前記m枚の物体画像に対する前記クラス情報により表される、前記m枚の物体画像における物体のクラスの種類数に等しい構成(第3の構成)であっても良い。
【0009】
上記第1~第3の構成の何れかに係るデータ処理装置において、前記誤り特定部は、前記誤りクラスタに属するn枚の物体画像の再クラスタリングを前記n枚の物体画像に対するn個の特徴量に基づいて行い、前記再クラスタリングの結果に基づいて、前記n枚の物体画像の中から前記クラス情報に誤りのある物体画像を特定する(nは3以上の整数)構成(第4の構成)であっても良い。
【0010】
上記第4の構成に係るデータ処理装置において、前記誤り特定部は、前記再クラスタリングにより前記n枚の物体画像を第1及び第2クラスタに分類し、前記第2クラスタに属する物体画像の総数が前記第1クラスタに属する物体画像の総数よりも少ないとき、前記第2クラスタに属する物体画像を前記クラス情報に誤りのある物体画像として特定する構成(第5の構成)であっても良い。
【0011】
上記第4の構成に係るデータ処理装置において、前記誤り特定部は、前記再クラスタリングにより前記n枚の物体画像を第1及び第2クラスタに分類し、前記n枚の物体画像についてのn個の特徴量の重心と前記第2クラスタとの距離が、前記n枚の物体画像についてのn個の特徴量の重心と前記第1クラスタとの距離よりも大きいとき、前記第2クラスタに属する物体画像を前記クラス情報に誤りのある物体画像として特定する構成(第6の構成)であっても良い。
【0012】
上記第4~第6の構成の何れかに係るデータ処理装置において、前記複数の物体画像は複数の入力画像から切り出された画像であり、前記複数の入力画像を複数の学習用画像として用い、前記複数の学習用画像の画像データと各学習用画像内の物体の位置及びクラスを特定するアノテーション情報とを含む学習用データセットを生成する学習用データセット生成部が当該データ処理装置に設けられ、前記学習用データセット生成部は、前記誤り特定部の特定結果に基づき、前記クラス情報に誤りのある物体画像を含む入力画像を前記複数の入力画像からアノテーション対象として抽出し、前記アノテーション対象に対して外部から与えられた情報を用いて、前記アノテーション対象に対する前記アノテーション情報を修正する構成(第7の構成)であっても良い。
【0013】
上記第4~第6の構成の何れかに係るデータ処理装置において、前記複数の物体画像は複数の入力画像から切り出された画像であり、前記複数の入力画像の一部を複数の学習用画像として抽出し、前記複数の学習用画像の画像データと各学習用画像内の物体の位置及びクラスを特定するアノテーション情報とを含む学習用データセットを生成する学習用データセット生成部が当該データ処理装置に設けられ、前記学習用データセット生成部は、前記誤り特定部の特定結果に基づき、前記クラス情報に誤りのある物体画像を含む入力画像を前記複数の学習用画像から除外する構成(第8の構成)であっても良い。
【0014】
上記第1~第8の構成の何れかに係るデータ処理装置において、前記画像分類データセットを用いてニューラルネットワークの機械学習を実行することで物体分類用の推論モデルを作成する機械学習処理部を更に備え、前記特徴量導出部は、前記推論モデルに対して前記画像分類データセットを入力することで各物体画像の特徴量を導出する構成(第9の構成)であっても良い。
【0015】
本発明に係るデータ処理方法は、各々に物体の画像データを含む複数の物体画像と、各物体画像中の物体のクラスを特定するクラス情報と、を含む画像分類データセットを取得する画像分類データセット取得ステップと、前記画像分類データセットにおける各物体画像の特徴量を導出する特徴量導出ステップと、前記複数の物体画像に含まれるm枚の物体画像の特徴量と前記m枚の物体画像に対する前記クラス情報とに基づき、前記m枚の物体画像のクラスタリングを行うクラスタリング処理ステップと(mは3以上の整数)、前記クラスタリングにより得られる1以上のクラスタについて、クラスタごとに、当該クラスタに属する複数の特徴点の重心及び当該重心と各特徴量との距離を導出し、前記複数の特徴量に対して導出した複数の距離の平均及び分散を導出する指標導出ステップと、前記平均及び前記分散の導出結果に基づいて、前記クラス情報に誤りのある物体画像が属するクラスタを誤りクラスタとして特定する誤り特定ステップと、を備える構成(第10の構成)である。
【発明の効果】
【0016】
本発明によれば、クラス情報の誤りの特定に寄与するデータ処理装置及び方法を提供することが可能となる。
【図面の簡単な説明】
【0017】
【
図1】本発明の実施形態に係るデータ処理装置の構成図を示す。
【
図2】本発明の実施形態で想定される複数の入力画像を示す図である。
【
図3】本発明の実施形態に係り、1枚の入力画像から複数枚の物体画像が切り出される様子を示す図である。
【
図4】本発明の実施形態で想定される複数の物体画像を示す図である。
【
図5】本発明の実施形態に属する第1実施例に係り、複数の物体画像及び対応するクラス情報を含む評価データセット(ES1)を示す図である。
【
図6】本発明の実施形態に属する第1実施例に係り、
図5の複数の物体画像に対して導出された複数の特徴点の分布を示す図である。
【
図7】本発明の実施形態に属する第1実施例に係り、複数の物体画像及び対応するクラス情報を含む評価データセット(ES2)を示す図である。
【
図8】本発明の実施形態に属する第1実施例に係り、
図7の複数の物体画像に対して導出された複数の特徴点の分布を示す図である。
【
図9】本発明の実施形態に属する第1実施例に係り、複数の物体画像及び対応するクラス情報を含む評価データセット(ES3)を示す図である。
【
図10】本発明の実施形態に属する第1実施例に係り、
図9の複数の物体画像に対して導出された複数の特徴点の分布を示す図である。
【
図11】本発明の実施形態に属する第2実施例に係り、
図7の評価データセットに対して実施された再クラスタリングの結果を示す図である。
【
図12】本発明の実施形態に属する第2実施例に係り、
図9の評価データセットに対して実施された再クラスタリングの結果を示す図である。
【
図13】本発明の実施形態に属する第4実施例に係り、データ処理装置の動作の一部フローチャートである。
【発明を実施するための形態】
【0018】
以下、本発明の実施形態の例を、図面を参照して具体的に説明する。参照される各図において、同一の部分には同一の符号を付し、同一の部分に関する重複する説明を原則として省略する。尚、本明細書では、記述の簡略化上、情報、信号、物理量又は部材等を参照する記号又は符号を記すことによって、該記号又は符号に対応する情報、信号、物理量又は部材等の名称を省略又は略記することがある。例えば、後述の“10”によって参照される画像分類データセット取得部は(
図1参照)、画像分類データセット取得部10と表記されることもあるし、取得部10と略記されることもあり得るが、それらは全て同じものを指す。
【0019】
図1に本実施形態に係るデータ処理装置1の構成図を示す。データ処理装置1は、画像分類データセット取得部10、機械学習処理部20、推論部30、クラスタリング処理部40、指標導出部50、誤り特定部60、学習用データセット生成部70及びデータベース80を備える。尚、データ処理装置1は単一のコンピュータ装置にて構成されても良いし、物理的に分離した複数のコンピュータ装置にて構成されても良い。所謂クラウドコンピューティングを利用してデータ処理装置1が構成されても良い。
【0020】
画像分類データセット取得部10は、複数の入力画像に基づく画像分類データセットを取得する。ここでは、
図2に示す如く、画像分類データセットはL枚の入力画像に基づいて取得されるものとする。Lは2以上の任意の整数であり、例えば数千~数百万の値を持つ。各入力画像は1以上の物体を含む。例えば、自動車等の車両に搭載されたカメラの撮影画像の中から選ばれた多数の静止画像が複数の入力画像として用いられて良い。L枚の入力画像における第i番目の入力画像は記号“II[i]”にて参照されることがある。iは任意の整数を表す。
【0021】
尚、本実施形態では、或る画像内に物体の画像データが含まれることを、当該画像に当該物体が含まれる又は存在すると表現することがある。同様に、或る画像中の注目した画像領域(例えば後述の物体領域)内に物体の画像データが含まれることを、注目した画像領域に物体が含まれる又は存在すると表現することがある。本実施形態において物体とは、データ処理装置1による画像認識の対象となる認識対象物体を指す。
【0022】
図3の画像610は1枚の入力画像の例である。入力画像610には3つの物体611~613が含まれている。物体611、612、613は、夫々、車両、人間、交通標識である。本実施形態では、車両として路上を走行可能な自動車を主として想定する。
【0023】
取得部10は機械学習により生成された物体検出器を有していて良い。この場合、取得部10は、物体検出器を用いて入力画像ごとに物体検出を行うことで画像分類データセットを生成できる。物体検出では、画像認識の対象となる画像内の物体の位置を特定する位置特定と、画像認識の対象となる画像内の物体のクラス(種別)を特定するクラス識別と、が行われる。
【0024】
従って、入力画像610に対する物体検出において、物体検出器は、入力画像610に、物体611を含む物体領域611B、物体612を含む物体領域612B及び物体613を含む物体領域613Bを設定することができる。入力画像610内の物体611~613の位置が特定されることで物体領域611B~613Bが設定される。取得部10は入力画像610から物体領域611B~613Bを切り出すことで物体画像621~623を生成する。或る物体の物体領域は、当該物体の像を取り囲む矩形領域(望ましくは最小の矩形領域)であって、バウンディングボックスとも称される。また、物体検出器は、クラス識別において、物体領域ごとに当該物体領域内の物体のクラス(種類)を特定する。
【0025】
物体のクラスとして複数のクラスがある。位置特定又はクラス識別など、任意の処理の対象として注目された任意の物体を、説明の具体化及び明確化のため、注目物体と称することがある。物体検出では入力画像内の各物体が注目物体となり得る。クラス識別では、注目物体が上記複数のクラスの何れに属するのかを判別する。物体のクラスは物体の種別と同義である。ここでは、説明の具体化のため、複数のクラスが第1~第3クラスを含むものとし、第1、第2、第3クラスは、夫々、車両、人間、交通標識であるとする。この場合、クラス識別では、注目物体が車両、人間及び交通標識の何れであるか、或いは、第1~第3クラスに属さないクラス(例えば第4クラス)の物体であるかを判別することになる。
【0026】
入力画像610に対するクラス識別では、物体領域611B、612B、613B内の物体が、夫々、車両(即ち第1クラスの物体)、人間(即ち第2クラスの物体)、交通標識(即ち第3クラスの物体)であると判別されることになる(但し、クラス識別に誤りがないと仮定)。
【0027】
物体検出器により入力画像ごとに物体検出が行われることで、入力画像II[1]~II[L]から各々に1つの物体の画像データを含む多数の物体画像が生成され、各物体画像に対しクラス情報が付与される。或る物体画像に付与されるクラス情報は、当該物体画像内の物体のクラスを特定する情報である。従って、クラス識別に誤りがないと仮定すれば、物体画像621、622、623に付与されるクラス情報は、夫々、第1、第2、第3クラスを表す。尚、クラス情報はラベルとも称される。また、上記位置特定の結果を表す情報を物体位置情報と称する。或る入力画像に対する物体位置情報は当該入力画像内の各物体の物体領域の位置(詳細には物体領域における1つの対角線の両端の座標値)を特定する。クラス情報及び物体位置情報を含む情報をアノテーション情報と称する。物体検出器による物体検出では、入力画像ごとにアノテーション情報が生成されることになる。
【0028】
図4に示す如く、以下では、入力画像II[1]~II[L]から計H枚の物体画像OI[1]~OI[H]が生成されたものとし、物体画像OI[i]に付与されたクラス情報を記号“CLS[i]”にて表す。Hは2以上の任意の整数であり、ここでは各入力画像から1以上の物体領域が切り出されることを想定しているので“H≧L”である。実際には例えば、Hは数千~数百万の値を持つ。画像分類データセットは物体画像OI[1]~OI[H]の画像データとクラス情報CLS[1]~CLS[H]を含み、画像分類データセットにおいて物体画像OI[i]の画像データとクラス情報CLS[i]は互いに関連付けられている。また、各物体画像が何れの入力画像に基づく物体画像であるかを表す抽出元情報が、データ処理装置1内の各部位に共有及び認識されるものとする。従って例えば、物体画像OI[1]~OI[5]が入力画像II[1]から切り出されたものである場合、その旨が抽出元情報にて規定される。抽出元情報は画像分類データセットに含まれていても良い。
【0029】
取得部10が物体検出器を有している場合の画像分類データセットの生成方法を説明したが、取得部10が物体検出器を有していることは必須ではない。例えば、人間の手動操作に基づきアノテーション情報がデータ処理装置1に入力されることで画像分類データセットが生成されても良い。即ち例えば、データ処理装置1の管理者から所定のマンマシンインターフェース(不図示)を通じてデータ処理装置1に与えられた操作情報に基づき、各入力画像に対し物体領域が設定され且つ各物体領域(換言すれば各物体画像)のクラス情報の指定が行われ、これによって各入力画像に対するアノテーション情報の生成並びに画像分類データセットの生成及び取得が行われるようにしても良い。或いは例えば、取得部10は、データ処理装置1と異なる外部装置(不図示)から有線又は無線通信を通じ、予め作成されたデータセットの入力を受けるものであっても良い。ここにおけるデータセットは、入力画像II[1]~II[L]の画像データと各入力画像に対するアノテーション情報を含み、取得部10は、入力されたデータセットに基づいて画像分類データセットを生成及び取得しても良い。以下の説明において、画像分類データセットとは、特に記述無き限り、取得部10にて取得された画像分類データセットを指すものとする。
【0030】
機械学習処理部20は、ニューラルネットワーク21(以下、NN21と称する)を有し、機械学習処理を実行する。機械学習処理部20は、機械学習処理において、画像分類データセットを用いてNN21の機械学習を実行することにより所定の推論を行う推論モデルを作成する。ここにおける機械学習は深層学習に分類されるものであって良く、従って、NN21はディープニューラルネットワークであって良い。機械学習の中でNN21のパラメータ(重み及びバイアス)が適正に設定される。パラメータ(重み及びバイアス)が適正に設定された後のNN21が推論モデルに相当する。
【0031】
推論部30はNN21による推論モデルを用いて所定の推論を行う。NN21は画像分類用のニューラルネットワークであり、故に推論モデルにおける推論は画像分類用の推論である。即ち、推論部30は、物体を含む物体画像が与えられたとき、推論において、当該物体画像に含まれる物体のクラスを特定(判別)するクラス識別を行う。この際、推論部30は、クラス識別の実現に有益な特徴量を当該物体画像から導出する特徴量導出処理を実行し、特徴量に基づき当該物体画像に含まれる物体のクラスを特定(判別)する。特徴量は多次元のベクトル量であって、特徴量ベクトルと読み替えても良い。特徴量導出処理は推論部30に含まれる特徴量導出部31により実行される。NN21の推論モデルに対して画像分類データセットが入力されることで、画像分類データセットにおける各物体画像に対してNN21の推論モデルによる推論が行われる。この推論の中で、画像分類データセットにおける各物体画像に対して特徴量導出処理が実行され、これによって各物体画像の特徴量が導出される。
【0032】
クラスタリング処理部40は特徴量導出処理の結果に基づくクラスタリング処理を実行する。即ち、クラスタリング処理において、クラスタリング処理部40は、画像分類データセット内の各物体画像に対して導出された特徴量に基づき、当該画像分類データセットにおける複数の物体画像のクラスタリングを行う。クラスタリング処理部40は、特徴量導出処理にて導出された特徴量の次元削減を行い、次元削減後の特徴量に基づいてクラスタリングを行っても良い。例えば主成分分析を用いて次元削減を行うことができる。以下に示す特徴量は、次元削減を行わないならば特徴量導出処理にて導出された特徴量そのものを指し、次元削減を行ったならば次元削減後の特徴量を指すものとする。
【0033】
クラスタリングは、画像分類データセット内の複数の物体画像について導出された複数の特徴量間の距離に基づき実行される。特徴量間の距離は、特徴量が定義される特徴空間上の距離であって、例えば、ユークリッド距離又はコサイン類似度である。クラスタリング処理により、画像分類データセット内において、類似した特徴量を持つ物体画像同士が共通のクラスタに分類される。クラスタリングの方法として階層型クラスタリングを用いて良い。但し、非階層型クラスタリング(k平均法など)によりクラスタリングを行っても良い。
【0034】
ここで、クラスタリング処理部40におけるクラスタリングは、当該画像分類データセットに含まれる全物体画像に対して一括して行われるものではない。本実施形態では、物体画像OI[1]~OI[H]を複数の組に分割し、組ごとに当該組に属する物体画像のクラスタリングを行う。換言すれば、入力画像[1]~入力画像[L]を複数の組に分割し、組ごとに、当該組に属する入力画像内の物体画像のクラスタリングを行う。このようなクラスタリングの具体例及び技術的意義については後述される。
【0035】
画像分類データセットの作成には、入力画像内の物体の位置及び物体のクラスに対するアノテーションが必要である。画像分類データセットを物体検出器により作成する場合にも手動操作を通じて作成する場合にも、物体のクラスが誤ってアノテーションされる場合がある。つまり例えば、注目物体が本当は人間(即ち第2クラスの物体)であるのにかかわらず、当該注目物体が車両(即ち第1クラスの物体)であると誤ってクラス情報が付与され、結果、誤ったクラス情報が画像分類データセットに含まれることもある。
【0036】
指標導出部50は、このような誤りを特定するために有益な指標を導出し、誤り特定部60は、導出された指標に基づいて誤りのあるデータ等を特定する(詳細は後述)。
【0037】
学習用データセット生成部70は、複数の学習用画像の画像データと各学習用画像内の物体の位置及びクラスを特定するアノテーション情報とを含む学習用データセットを生成する。
【0038】
取得部10にて取り扱われる入力画像II[1]~II[L]の画像データ及び各入力画像のアノテーション情報を含むデータセットを、便宜上、暫定データセットと称する。暫定データセットは、生成部70にて生成されるべき学習用データセットの元となるデータセットであり、仮に、暫定データセットにおけるアノテーションに一切誤りがなければ暫定データセットそのものが学習用データセットとなる。但し、上述したように、膨大な数のアノテーションには誤りが含まれることがあり、生成部70にて当該誤りを修正又は除去し、誤りの修正又は除去後の暫定データセットを学習用データセットとして生成する。
【0039】
データベース80は、不揮発性の記録媒体から成り、生成部70の制御の下、生成部70にて生成された学習用データセットを記憶する。暫定データセットもデータベース80に記憶されていて良い。データベース80に記憶された暫定データセットが生成部70により学習用データセットに書き換え又は更新されると考えても良い。磁気ディスク、光ディスク若しくは半導体メモリ、又は、それらの組み合わせにてデータベース80を構成することができる。尚、データベース80はデータ処理装置1の外部に設けられた外部記録装置であっても良い。
【0040】
以下、複数の実施例の中で、データ処理装置1に関わる幾つかの具体的な動作例、応用技術、変形技術等を説明する。本実施形態にて上述した事項は、特に記述無き限り且つ矛盾無き限り、以下の各実施例に適用される。各実施例において、上述の事項と矛盾する事項がある場合には、各実施例での記載が優先されて良い。また矛盾無き限り、以下に示す複数の実施例の内、任意の実施例に記載した事項を、他の任意の実施例に適用することもできる(即ち複数の実施例の内の任意の2以上の実施例を組み合わせることも可能である)。
【0041】
<<第1実施例>>
第1実施例を説明する。上述したように、クラスタリング処理部40におけるクラスタリングは、当該画像分類データセットに含まれる全物体画像に対して一括して行われるものではなく、当該画像分類データセットに含まれる全物体画像の一部を含む評価データセットを単位にクラスタリングが行われる。
【0042】
まず、
図5を参照し、物体画像OI[1]~OI[H]の一部である物体画像OI[11]~OI[20]の画像データを含んだ評価データセットES1に対するクラスタリングを説明する。評価データセットES1は、画像分類データセットから抽出された、物体画像OI[11]~OI[20]のクラス情報(即ちCLS[11]~CLS[20];
図4参照)を含む。物体画像OI[11]~OI[20]は1又は複数の入力画像II[J
A1]~II[J
A2]から切り出された物体画像であるとする。“0<J
A1≦J
A2<L”であり、差(J
A2-J
A1)は0又は1以上の整数値を持つ。
【0043】
物体画像OI[11]~OI[14]の夫々に含まれる物体は車両であって、物体画像OI[15]~OI[20]の夫々に含まれる物体は人間である。画像分類データセット及び評価データセットES1において、物体画像OI[11]~OI[14]の各クラス情報は車両に対応する第1クラスを指し示し、物体画像OI[15]~OI[20]の各クラス情報は人間に対応する第2クラスを指し示す。これらのクラス情報に誤りはない。各物体画像に対して特徴量導出処理が実行されることで各物体画像の特徴量が導出される。以下、物体画像OI[i]の特徴量を記号“FT[i]”にて参照する。
【0044】
図6は、物体画像OI[11]~OI[20]に対応する特徴量FT[11]~FT[20]を特徴空間上にプロットした様子を示す図である。実際には、各特徴量は多次元ベクトル量であるが、
図6では各特徴量が二次元ベクトル量であるかのように示している。特徴量が特徴空間にプロットされる様子を示す後述の他の図においても同様である。但し、上述の次元削減により特徴量の次元数を“2”にまで削減するようにしても良い。
【0045】
尚、以下では、任意の自然数uについて、物体画像OI[u]が或る注目したクラスタに分類される又は属することを、特徴量FT[u]が当該注目したクラスタに分類される又は属すると表現することもある。即ち、物体画像OI[u]が当該注目したクラスタに分類される又は属することを、特徴量FT[u]が当該注目したクラスタに分類される又は属することは等価である。
【0046】
クラスタリング処理部40は、画像分類データセット(評価データセットES1)における物体画像OI[11]~OI[20]のクラス情報に基づき、物体画像OI[11]~OI[20]をk
A個のクラスタに分類する(即ち、クラスタ数をk
Aに設定した上でクラスリングを行う)。k
Aは、画像分類データセットの物体画像OI[11]~OI[20]へのクラス情報により表されるクラスの種類数(即ちクラス情報により表される物体画像OI[11]~OI[20]の物体の種類数)である。換言すれば、k
Aは、物体画像OI[11]~OI[20]に付与された計10個のクラス情報が指し示すクラスの種類数(総数)に等しい。
図5の例では、物体画像OI[11]~OI[20]に付与された計10個のクラス情報が指し示すクラスは第1クラス及び第2クラスの2つであるため“k
A=2”である。クラスタリングとして非階層型クラスタリングを行う場合にはクラスタの総数を“k
A=2”に設定した上でクラスタリングを行えば良く、クラスタリングとして階層型クラスタリングを行う場合にはクラスタの総数が“k
A=2”となった時点でクラスタリングを止めれば良い。
【0047】
図6に示す如く、特徴量FT[11]~FT[20]に対しては2つのクラスタCT
A1及びCT
A2が設定される。特徴量FT[11]~FT[14]はクラスタCT
A1に分類され、特徴量FT[15]~FT[20]はクラスタCT
A2に分類される。
図6において、点G
A1はクラスタCT
A1に属する特徴量FT[11]~FT[14]の重心を表し、点G
A2はクラスタCT
A2に属する特徴量FT[15]~FT[20]の重心を表す。
【0048】
指標導出部50は、クラスタリング処理部40により生成されたクラスタごとに、当該クラスタの重心を導出し且つ当該重心と当該クラスタに属する各特徴量との距離を導出する。重心及び特徴量間の距離は、2つの特徴量間の距離と同様に、特徴量が定義される特徴空間上の距離であって、例えば、ユークリッド距離又はコサイン類似度である。特徴量FT[11]~FT[20]に対して導出された距離を、夫々、記号“d[11]~d[20]”にて参照する。距離d[11]~d[14]は、夫々、重心GA1と特徴量FT[11]~FT[14]との距離を表す。距離d[15]~d[20]は、夫々、重心GA2と特徴量FT[15]~FT[20]との距離を表す。
【0049】
指標導出部50は、更に、クラスタリング処理部40により生成されたクラスタごとに、導出した複数の距離の平均及び分散を導出する。指標導出部50にて導出される平均及び分散を、以下では、距離平均、距離分散と称する。クラスタCTA1に対して導出される距離平均及び距離分散を、夫々、記号“AVEA1”及び“σ2
A1”にて参照する。そうすると、距離平均AVEA1は距離d[11]~d[14]の平均であり、距離分散σ2
A1は距離d[11]~d[14]の分散である。同様に、クラスタCTA2に対して導出される距離平均及び距離分散を、夫々、記号“AVEA2”及び“σ2
A2”にて参照する。そうすると、距離平均AVEA2は距離d[15]~d[20]の平均であり、距離分散σ2
A2は距離d[15]~d[20]の分散である。
【0050】
誤り特定部60は、指標導出部50にてクラスタごとに導出された距離平均及び距離分散に基づいて、各クラスタが誤りクラスタであるか否かを判定する。誤りクラスタとは、クラス情報に誤りのある物体画像が属するクラスタである。クラス情報に誤りのある物体画像とは、換言すれば、誤りのあるクラス情報が付与された物体画像であり、以下、誤りラベル付き物体画像とも称する。これとは逆に、正しいクラス情報が付与された物体画像を正解ラベル付き物体画像と称する。また、以下では、誤り特定部60にて誤りクラスタであると特定されなかったクラスタを正解クラスタと称することがある。誤り特定部60は、各クラスタが正解クラスタ及び誤りクラスタの何れであるかを判定する機能を有している、とも言える。
【0051】
誤り特定部60は、クラスタリング処理部40により生成されたクラスタごとに、距離平均及び距離分散を夫々所定の閾値TH1及びTH2と比較し、その比較結果に基づき所定の誤り条件を満たすクラスタを誤りクラスタとして特定する。或るクラスタについて、対応する距離平均が所定の閾値TH1以上であって且つ対応する距離分散が所定の閾値TH2以上であるとき、当該クラスタについて誤り条件が満たされる。
【0052】
閾値TH1及びTH2を以下のように設定して良い。即ち、各々に認識対象物体を含む複数の閾値設定用物体画像を予め用意しておき、複数の閾値設定用物体画像に対するクラスタリング結果に基づいて閾値TH1及びTH2を設定して良い。その際、クラスタリング処理部40は、複数の閾値設定用物体画像を複数のクラスタに分類する。次に、指標導出部50は、クラスタごとに、複数の距離の平均及び分散を導出する。次に、複数の閾値設定用物体画像について、導出された複数の距離の平均に適当なオフセット値(0でも可)を加えた値を閾値TH1に設定し、導出された複数の距離の分散に適当なオフセット値(0でも可)を加えた値を閾値TH2に設定する。そして、設定した閾値TH1及びTH2を、対応するクラスタ(同じ種別の物体に関するクラスタ)に対する上記比較に使用して良い。複数の閾値設定用物体画像の画像データは、既存且つ任意のデータセットから得られるものであって良く、例えば、例えば、Microsoft COCOデータセットに含まれる画像データであって良い。
【0053】
クラスタCT
A1については距離平均AVE
A1及び距離分散σ
2
A1が夫々閾値TH
1及びTH
2と比較され、クラスタCT
A2については距離平均AVE
A2及び距離分散σ
2
A2が夫々閾値TH
1及びTH
2と比較される。
図5及び
図6の例では、画像分類データセットにおける物体画像OI[10]~OI[20]のクラス情報に誤りはない。このため、クラスタCT
A1における距離平均AVE
A1及び距離分散σ
2
A1は閾値TH
1及びTH
2より小さく、且つ、クラスタCT
A2における距離平均AVE
A2及び距離分散σ
2
A2も閾値TH
1及びTH
2より小さい。故に、クラスタCT
A1及びCT
A2は何れも誤りクラスタとして特定されない(換言すれば正解クラスタであると判定される)。
【0054】
次に、
図7を参照し、物体画像OI[1]~OI[H]の一部である体画像OI[31]~OI[40]の画像データを含んだ評価データセットES2に対するクラスタリングを説明する。評価データセットES2は、画像分類データセットから抽出された、物体画像OI[31]~OI[40]のクラス情報(即ちCLS[31]~CLS[40];
図4参照)を含む。物体画像OI[31]~OI[40]は1又は複数の入力画像II[J
B1]~II[J
B2]から切り出された物体画像であるとする。“J
A2<J
B1≦J
B2<L”であり、差(J
B2-J
B1)は0又は1以上の整数値を持つ。
【0055】
物体画像OI[31]~OI[34]の夫々に含まれる物体は車両であり、物体画像OI[35]~OI[38]の夫々に含まれる物体は人間であり、物体画像OI[39]及びOI[40]の夫々に含まれる物体は交通標識である。画像分類データセット及び評価データセットES2において、物体画像OI[31]~OI[34]の各クラス情報は車両に対応する第1クラスを指し示し、物体画像OI[35]~OI[38]の各クラス情報は人間に対応する第2クラスを指し示す。これらのクラス情報に誤りはない。但し、画像分類データセット及び評価データセットES2において、物体画像OI[39]及びOI[40]のクラス情報は人間に対応する第2クラスを指し示しており、故に物体画像OI[39]及びOI[40]のクラス情報には誤りがある。
【0056】
図8は、物体画像OI[31]~OI[40]に対応する特徴量FT[31]~FT[40]を特徴空間上にプロットした様子を示す図である。クラスタリング処理部40は、画像分類データセット(評価データセットES2)における物体画像OI[31]~OI[40]のクラス情報に基づき、物体画像OI[31]~OI[40]をk
B個のクラスタに分類する(即ち、クラスタ数をk
Bに設定した上でクラスリングを行う)。k
Bは、画像分類データセットの物体画像OI[31]~OI[40]へのクラス情報により表されるクラスの種類数(即ちクラス情報により表される物体画像OI[31]~OI[40]の物体の種類数)である。換言すれば、k
Bは、物体画像OI[31]~OI[40]に付与された計10個のクラス情報が指し示すクラスの種類数(総数)に等しい。
図7の例では、物体画像OI[31]~OI[40]に付与された計10個のクラス情報が指し示すクラスは、本来は第1~第3クラスの3つとなるべきところ、実際には誤って第1クラス及び第2クラスの2つとなっているため“k
B=2”である。クラスタリングとして非階層型クラスタリングを行う場合にはクラスタの総数を“k
B=2”に設定した上でクラスタリングを行えば良く、クラスタリングとして階層型クラスタリングを行う場合にはクラスタの総数が“k
B=2”となった時点でクラスタリングを止めれば良い。
【0057】
図8に示す如く、特徴量FT[31]~FT[40]に対しては2つのクラスタCT
B1及びCT
B2が設定される。ここでは、特徴量FT[31]~FT[34]はクラスタCT
B1に分類され、特徴量FT[35]~FT[40]はクラスタCT
B2に分類されたとする。
図8において、点G
B1はクラスタCT
B1に属する特徴量FT[31]~FT[34]の重心を表し、点G
B2はクラスタCT
B2に属する特徴量FT[35]~FT[40]の重心を表す。
【0058】
指標導出部50は、上述したように、クラスタリング処理部40により生成されたクラスタごとに、当該クラスタの重心を導出し且つ当該重心と当該クラスタに属する各特徴量との距離を導出する。特徴量FT[31]~FT[40]に対して導出された距離を、夫々、記号“d[31]~d[40]”にて参照する。距離d[31]~d[34]は、夫々、重心GB1と特徴量FT[31]~FT[34]との距離を表す。距離d[35]~d[40]は、夫々、重心GB2と特徴量FT[35]~FT[40]との距離を表す。
【0059】
指標導出部50は、更に上述の如くクラスタごとに距離平均及び距離分散を導出する。クラスタCTB1に対して導出される距離平均及び距離分散を、夫々、記号“AVEB1”及び“σ2
B1”にて参照する。そうすると、距離平均AVEB1は距離d[31]~d[34]の平均であり、距離分散σ2
B1は距離d[31]~d[34]の分散である。同様に、クラスタCTB2に対して導出される距離平均及び距離分散を、夫々、記号“AVEB2”及び“σ2
B2”にて参照する。そうすると、距離平均AVEB2は距離d[35]~d[40]の平均であり、距離分散σ2
B2は距離d[35]~d[40]の分散である。
【0060】
誤り特定部60は、クラスタCT
B1及びCT
B2の夫々について誤り条件の成否を判定する。クラスタCT
B1については距離平均AVE
B1及び距離分散σ
2
B1が夫々閾値TH
1及びTH
2と比較され、クラスタCT
B2については距離平均AVE
B2及び距離分散σ
2
B2が夫々閾値TH
1及びTH
2と比較される。
図7及び
図8の例では、クラスタCT
B1における距離平均AVE
B1及び距離分散σ
2
B1は夫々閾値TH
1及びTH
2より小さく、結果、クラスタCT
B1は誤りクラスタとして特定されない(換言すれば正解クラスタであると判定される)。但し、クラスタCT
B2における距離平均AVE
B2及び距離分散σ
2
B2は夫々閾値TH
1及びTH
2より大きい。このため、クラスタCT
B2は誤り条件を満たし、結果、クラスタCT
B2は誤りクラスタとして特定される。
【0061】
次に、
図9を参照し、物体画像OI[1]~OI[H]の一部である体画像OI[51]~OI[60]の画像データを含んだ評価データセットES3に対するクラスタリングを説明する。評価データセットES3は、画像分類データセットから抽出された、物体画像OI[51]~OI[60]のクラス情報(即ちCLS[51]~CLS[60];
図4参照)を含む。物体画像OI[51]~OI[60]は1又は複数の入力画像II[J
C1]~II[J
C2]から切り出された物体画像であるとする。“J
B2<J
C1≦J
C2<L”であり、差(J
C2-J
C1)は0又は1以上の整数値を持つ。
【0062】
物体画像OI[51]~OI[58]の夫々に含まれる物体は車両であり、物体画像OI[59]及びOI[60]の夫々に含まれる物体は人間である。画像分類データセット及び評価データセットES3において、物体画像OI[51]~OI[58]の各クラス情報は車両に対応する第1クラスを指し示す。これらのクラス情報に誤りはない。但し、画像分類データセット及び評価データセットES3において、物体画像OI[59]及びOI[60]のクラス情報も車両に対応する第1クラスを指し示しており、故に物体画像OI[59]及びOI[60]のクラス情報には誤りがある。
【0063】
図10は、物体画像OI[51]~OI[60]に対応する特徴量FT[51]~FT[60]を特徴空間上にプロットした様子を示す図である。クラスタリング処理部40は、画像分類データセット(評価データセットES3)における物体画像OI[51]~OI[60]のクラス情報に基づき、物体画像OI[51]~OI[60]をk
C個のクラスタに分類する(即ち、クラスタ数をk
Cに設定した上でクラスリングを行う)。k
Cは、画像分類データセットの物体画像OI[51]~OI[60]へのクラス情報により表されるクラスの種類数(即ちクラス情報により表される物体画像OI[51]~OI[60]の物体の種類数)である。換言すれば、k
Cは、物体画像OI[51]~OI[60]に付与された計10個のクラス情報が指し示すクラスの種類数(総数)に等しい。
図9の例において、物体画像OI[51]~OI[60]に付与された計10個のクラス情報が指し示すクラスは、本来は第1及び第2クラスの2つとなるべきところ、誤って第1クラスのみとなっているため“k
C=1”である。クラスタリングとして非階層型クラスタリングを行う場合にはクラスタの総数を“k
C=1”に設定した上でクラスタリングを行えば良く、クラスタリングとして階層型クラスタリングを行う場合にはクラスタの総数が“k
C=1”となるまでクラスタリングを継続すれば良い。但し、“k
C=1”の場合には実体的なクラスタリング用の演算は不要とも言え、単に特徴量FT[51]~FT[60]を全て包含する単一のクラスタを設定すれば足る。
【0064】
図10に示す如く、特徴量FT[51]~FT[60]に対しては1つのクラスタCT
C1が設定される。
図10において、点G
C1はクラスタCT
C1に属する特徴量FT[51]~FT[60]の重心を表す。
【0065】
指標導出部50は、上述したように、クラスタリング処理部40により生成されたクラスタごとに、当該クラスタの重心を導出し且つ当該重心と当該クラスタに属する各特徴量との距離を導出する。評価データセットES3に対しては単一のクラスタCTC1が設定されるため、クラスタCTC1のみに注目して各距離が導出される。特徴量FT[51]~FT[60]に対して導出された距離を、夫々、記号“d[51]~d[60]”にて参照する。距離d[51]~d[60]は、夫々、重心GC1と特徴量FT[51]~FT[60]との距離を表す。
【0066】
指標導出部50は、更にクラスタCTC1に対して距離平均及び距離分散を導出する。クラスタCTC1に対して導出される距離平均及び距離分散を、夫々、記号“AVEC1”及び“σ2
C1”にて参照する。そうすると、距離平均AVEC1は距離d[51]~d[60]の平均であり、距離分散σ2
C1は距離d[51]~d[60]の分散である。
【0067】
誤り特定部60は、クラスタCT
C1について誤り条件の成否を判定する。クラスタCT
C1について距離平均AVE
C1及び距離分散σ
2
C1が夫々閾値TH
1及びTH
2と比較される。
図9及び
図10の例において、クラスタCT
C1における距離平均AVE
C1及び距離分散σ
2
C1は夫々閾値TH
1及びTH
2よりも大きい。このため、クラスタCT
C1は誤り条件を満たし、結果、クラスタCT
C1は誤りクラスタとして特定される。
【0068】
正解クラスタ内の特徴量は真に同一のクラスの物体についての特徴量であるため、正解クラスタ内の特徴量のばらつきは比較的小さい。これに対し、誤りクラスタ内の特徴量は互いに異なるクラスの物体についての特徴量を含むため、誤りクラスタ内の特徴量のばらつきは比較的大きくなる。これらを考慮し、上述の如く、クラスタごとに距離平均及び距離分散を導出し、それらの導出結果に基づいて誤りクラスタを特定する。この方法により、人の目に頼ることなくデータ処理装置1自身で誤りクラスタを良好に検出することが可能となり、人の目に頼る場合と比べてデータセット中の不備を探すコスト(時間及び人間の労力)を削減できる。誤りクラスタを特定できれば、誤りクラスタに属する物体画像のクラス情報を修正して学習用データセットを生成する又は当該物体画像を含む入力画像を学習用データセットから除外するなどといった対応が可能となり、結果、学習用データセットの質を高めることが可能となる。学習用データセットの質を高めることで、学習用データセットを用いた機械学習にて構築される画像認識用の推論モデルの性能を高めることができる。
【0069】
<<第2実施例>>
第2実施例を説明する。第2実施例は上述の第1実施例と組み合わせて実施される。第2実施例では、誤りクラスタが特定された場合に、誤り特定部60により実行可能な誤りラベル特定処理を説明する。
【0070】
誤りラベル特定処理において、誤り特定部60は、誤りクラスタ内で当該誤りクラスタに属する物体画像を第1及び第2クラスタにグループ分けするクラスタリングを行う。誤りラベル特定処理におけるクラスタリングを、クラスタリング処理40が行う上述のクラスタリングと明確に区別すべく、再クラスタリングと称する。再クラスタリングは、誤りクラスタに属する各物体画像の特徴量に基づいて行う。即ち、或る誤りクラスタにn枚の物体画像が属するのであれば、当該n枚の物体画像について特徴量導出処理にて導出されたn個の特徴量に基づき、再クラスタリングを行う。但し、この再クラスタリングは“n≧3”を満たすことを前提に実行される。故に、誤りラベル特定処理は“n≧3”を満たす誤りクラスタに対して実行可能である。再クラスタリングを、クラスタ数を2に設定した非階層型クラスタリング(k平均法など)にて実現できる。
【0071】
誤りラベル特定処理に係る誤り特定部60は、再クラスタリングの結果に基づき、上記n枚の物体画像の中から誤りラベル付き物体画像(即ちクラス情報に誤りのある物体画像)を特定する。誤り特定部60は、誤りクラスタに属する各物体画像が正解ラベル付き物体画像及び誤りラベル付き物体画像の何れであるかを判定する機能を有しているとも言える。誤りラベル特定処理として、以下の第1又は第2誤りラベル特定処理を採用できる。
【0072】
図7及び
図8に対応する上記評価データセットES2に注目して第1誤りラベル特定処理を説明する。
図11を参照する。評価セットES2に対しては第1実施例で述べたようにクラスタCT
B2が誤りクラスタとして特定される。誤りクラスタCT
B2には物体画像OI[35]~OI[40]が属する。換言すれば、誤りクラスタCT
B2には特徴量FT[35]~FT[40]が属する。故に、誤りクラスタCT
B2において“n=6”である。誤り特定部60は、特徴量FT[35]~FT[40]に基づき物体画像OI[35]~OI[40]の再クラスタリングを行うことで物体画像OI[35]~OI[40]を第1及び第2クラスタに分類する。
図11において、クラスタCT
B2_1及びCT
B2_2の内、何れか一方が第1クラスタに相当し、他方が第2クラスタに相当する。特徴量FT[35]~FT[38]はクラスタCT
B2_1に分類され、特徴量FT[39]及びFT[40]はクラスタCT
B2_2に分類される。
図11における点G
B2は
図8の重心G
B2と一致する。
【0073】
第1誤りラベル特定処理では、誤りクラスタ内の各物体画像の再クラスタリングにより形成される第1及び第2クラスタの内、属する物体画像がより少ない方のクラスタ内の物体画像を誤りラベル付き物体画像として特定する。即ち、第1誤りラベル特定処理では、誤りクラスタ内の各物体画像の再クラスタリングにより第1及び第2クラスタを形成した後、第2クラスタに属する物体画像の総数が第1クラスタに属する物体画像の総数よりも少ないならば、第2クラスタに属する物体画像を誤りラベル付き物体画像(即ちクラス情報に誤りのある物体画像)として特定し、第1クラスタに属する物体画像の総数が第2クラスタに属する物体画像の総数よりも少ないならば、第1クラスタに属する物体画像を誤りラベル付き物体画像として特定する。
【0074】
図11の例では、クラスタCT
B2_1に属する物体画像の総数は4であって且つクラスタCT
B2_2に属する物体画像の総数は2である。このため、評価データセットES2の誤りクラスタに対して第1誤りラベル特定処理を適用した場合には、クラスタCT
B2_2に属する各物体画像が誤りラベル付き物体画像として特定される。
【0075】
上記評価データセットES2に注目して第2誤りラベル特定処理を説明する。特徴量FT[35]~FT[40]をクラスタCTB2_1及びCTB2_2に分類するまでの処理は、第1及び第2誤りラベル特定処理間で共通である。第2誤りラベル特定処理では、誤りクラスタ内の各物体画像の再クラスタリングにより形成される第1及び第2クラスタの内、当該誤りクラスタの重心からより遠い方のクラスタ内の物体画像を誤りラベル付き物体画像として特定する。即ち、第2誤りラベル特定処理では、誤りクラスタ内の各物体画像の再クラスタリングにより第1及び第2クラスタを形成する。そして、当該誤りクラスタの重心と第2クラスタとの距離が当該誤りクラスタの重心と第1クラスタとの距離よりも大きいならば、第2クラスタに属する物体画像を誤りラベル付き物体画像(即ちクラス情報に誤りのある物体画像)として特定する。逆に、当該誤りクラスタの重心と第1クラスタとの距離が当該誤りクラスタの重心と第2クラスタとの距離よりも大きいならば、第1クラスタに属する物体画像を誤りラベル付き物体画像として特定する。当該誤りクラスタの重心と第1クラスタとの距離とは、当該誤りクラスタの重心と第1クラスタに属する全特徴量の重心との距離であって良く、当該誤りクラスタの重心と第2クラスタとの距離とは、当該誤りクラスタの重心と第2クラスタに属する全特徴量の重心との距離であって良い。
【0076】
図11の例において(
図8も参照)、誤りクラスタCT
B2の重心G
B2とクラスタCT
B2_2との距離(詳細には、クラスタCT
B2_2に属する特徴量FT[39]及びFT[40]の重心と重心G
B2との距離)は、誤りクラスタCT
B2の重心G
B2とクラスタCT
B2_1との距離(詳細には、クラスタCT
B2_1に属する特徴量FT[35]~FT[38]の重心と重心G
B2との距離)よりも大きい。このため、評価データセットES2の誤りクラスタに対して第2誤りラベル特定処理を適用した場合にも、第1誤りラベル特定処理を適用した場合と同様、クラスタCT
B2_2に属する各物体画像が誤りラベル付き物体画像として特定される。
【0077】
図9及び
図10に対応する上記評価データセットES3に注目して第1誤りラベル特定処理を説明する。
図12を参照する。評価データセットES3に対しては第1実施例で述べたようにクラスタCT
C1が誤りクラスタとして特定される。誤りクラスタCT
C1には物体画像OI[51]~OI[60]が属する。換言すれば、誤りクラスタCT
C1には特徴量FT[51]~FT[60]が属する。故に、誤りクラスタCT
C1において“n=10”である。誤り特定部60は、特徴量FT[51]~FT[60]に基づき物体画像OI[51]~OI[60]の再クラスタリングを行うことで物体画像OI[51]~OI[60]を第1及び第2クラスタに分類する。
図12において、クラスタCT
C1_1及びCT
C1_2の内、何れか一方が第1クラスタに相当し、他方が第2クラスタに相当する。特徴量FT[51]~FT[58]はクラスタCT
C1_1に分類され、特徴量FT[59]及びFT[60]はクラスタCT
C1_2に分類される。
図12における点G
C1は
図10の重心G
C1と一致する。
【0078】
図12の例では、クラスタCT
C1_1に属する物体画像の総数は8であって且つクラスタCT
C1_2に属する物体画像の総数は2である。このため、評価データセットES3の誤りクラスタに対して第1誤りラベル特定処理を適用した場合には、クラスタCT
C1_2に属する各物体画像が誤りラベル付き物体画像として特定される。
【0079】
図12の例において(
図10も参照)、誤りクラスタCT
C1の重心G
C1とクラスタCT
C1_2との距離(詳細には、クラスタCT
C1_2に属する特徴量FT[59]及びFT[60]の重心と重心G
C1との距離)は、誤りクラスタCT
C1の重心G
C1とクラスタCT
C1_1との距離(詳細には、クラスタCT
C1_1に属する特徴量FT[51]~FT[58]の重心と重心G
C1との距離)よりも大きい。このため、評価データセットES3の誤りクラスタに対して第2誤りラベル特定処理を適用した場合にも、第1誤りラベル特定処理を適用した場合と同様、クラスタCT
C1_2に属する各物体画像が誤りラベル付き物体画像として特定される。
【0080】
本実施例に示す如く、誤りクラスタに対して再クラスタリングを実行すれば、誤りクラスタが、正解ラベル付き物体画像が属するクラスタと、誤りラベル付き物体画像が属するクラスタと、に分解されると見込まれる。このため、再クラスタリングの結果を参照することで、誤りラベル付き物体画像を容易に特定することが可能となる。
【0081】
より具体的には、誤りクラスタに対して再クラスタリングを実行して第1及び第2クラスタを形成したとき、第1及び第2クラスタの内、一方のクラスタに属する物体画像は正解ラベル付き物体画像であって且つ他方のクラスタに属する物体画像は誤りラベル付き物体画像であると見込まれる。一方で、基本的に画像分類データセットのアノテーション情報の大部分は正しいと期待される。従って、第1及び第2クラスタの内、属する物体画像がより少ない方のクラスタ内の物体画像が誤りラベル付き物体画像である可能性が高い。この知見に基づく第1誤りラベル特定処理を用いれば、誤りラベル付き物体画像を精度良く特定することができる。
【0082】
また、画像分類データセットのアノテーション情報の大部分は正しいと期待されるのであるから、誤りクラスタ内の各物体画像の再クラスタリングにより形成される第1及び第2クラスタの内、当該誤りクラスタの重心からより遠い方のクラスタ内の物体画像が誤りラベル付き物体画像である可能性が高い。この知見に基づく第2誤りラベル特定処理を用いることでも、誤りラベル付き物体画像を精度良く特定することができる。
【0083】
<<第3実施例>>
第3実施例を説明する。第3実施例は上述の第1及び第2実施例と組み合わせて実施される。上述したように、学習用データセット生成部70は、複数の学習用画像の画像データと各学習用画像内の物体の位置及びクラスを特定するアノテーション情報とを含む学習用データセットを生成する。入力画像II[1]~II[L]の夫々は学習用画像の候補であり、仮に、取得部10にて取り扱われる入力画像II[1]~II[L]の画像データ及び各入力画像のアノテーション情報を含むデータセット(暫定データセット)において、誤りラベル付き物体画像が一切存在しないのであれば、暫定データセットが、そのまま学習用データセットとなる。但し、実際には、或る程度、誤りラベル付き物体画像が存在することが多い。第3実施例では、誤りラベル付き物体画像が特定された場合に、学習用データセット生成部70により実行可能な誤りラベル対応処理を説明する。
【0084】
まず、
図5及び
図6に対応する上記評価データセットES1に注目する。評価データセットES1に関して、クラスタリング処理部40により生成されたクラスタCT
A1及びCT
A2は何れも誤りクラスタは特定されず、故に、物体画像OI[11]~OI[20]は何れも誤りラベル付き物体画像として特定されない。生成部70は、誤りラベル付き物体画像が特定されない評価データセット(ここではES1)に対しては誤りラベル対応処理を実行しない。生成部70は、誤りクラスタが一切特定されない評価データセット中の各物体画像を正解ラベル付き物体画像とみなし、正解ラベル付き物体画像を含む各入力画像を学習用画像に設定する。学習用画像に設定された各入力画像の画像データは学習用データセットに含められる。
【0085】
例えば、物体画像OI[11]~OI[14]が入力画像II[JA1]に含まれ、物体画像OI[15]~OI[17]が入力画像II[JA1+1]に含まれ、且つ、物体画像OI[18]~OI[20]が入力画像II[JA1+2]に含まれるのであれば(ここでは“JA1+2=JA2”であると仮定)、3枚の入力画像II[JA1]~II[JA1+2]を3枚の学習用画像に設定し、入力画像II[JA1]~II[JA1+2]の画像データと、暫定データセットにおける入力画像II[JA1]~II[JA1+2]のアノテーション情報とを、そのまま学習用データセットに含める。
【0086】
次に、
図7、
図8及び
図11に対応する上記評価データセットES2に注目する。評価データセットES2に関しては、クラスタリング処理部40により生成されたクラスタCT
B1及びCT
B2の内、クラスタCT
B2のみが誤りクラスタとして特定され、且つ、物体画像OI[31]~[40]の内、物体画像OI[39]及び[40]のみが誤りラベル付き物体画像として特定される。生成部70は、誤りラベル付き物体画像が特定された評価データセット(ここではES2)に対して誤りラベル対応処理を実行する。誤りラベル対応処理として、以下の第1誤りラベル対応処理を採用できる。
【0087】
今、物体画像OI[31]~OI[34]が入力画像II[JB1]に含まれ、物体画像OI[35]~OI[37]が入力画像II[JB1+2]に含まれ、且つ、物体画像OI[38]~OI[40]が入力画像II[JB1+2]に含まれるケースCASE1を想定する(当該ケースでは“JB1+2=JB2”)。
【0088】
ケースCASE1に係る第1誤りラベル対応処理において、生成部70は、誤りラベル付き物体画像である物体画像OI[39]及び[40]を含む入力画像II[JB1+2]をアノテーション対象として抽出し、暫定データセットにおける入力画像II[JB1+2]のアノテーション情報に誤りが含まれる可能性があることを、データ処理装置1の管理者に対して通知する(この通知を通知NT1と称する)。通知NT1は、データ処理装置1に設けられた又は接続された表示画面(不図示)での表示を通じて行われて良い。通知NT1は、入力画像II[JB1+2]のアノテーション情報の正解を求める正解要求通知を含んでいて良い。通知NT1を受けた管理者は、入力画像II[JB1+2]のアノテーション情報の正解を示す正解情報を、ポインティングデバイス等の所定のマンマシンインターフェース(不図示)を通じてデータ処理装置1に入力する。ここにおける正解情報は、物体画像OI[39]及び[40]中の物体が交通標識であること(即ち第3クラスの物体であること)を指し示す。生成部70は、正解情報に基づき入力画像II[JB1+2]に対するアノテーション情報(暫定データセット中のアノテーション情報)を修正し、入力画像II[JB1+2]の画像データと当該修正したアノテーション情報とを、1枚の教師用画像の画像データ及び当該教師用画像のアノテーション情報の組として、学習用データセットに含める。
【0089】
ケースCASE1において、入力画像II[JB1]及びII[JB1+1]は2枚の学習用画像に設定され、入力画像II[JB1]及びII[JB1+1]の画像データと、暫定データセットにおける入力画像II[JB1]及びII[JB1+1]のアノテーション情報とが、そのまま学習用データセットに含められる。
【0090】
物体画像OI[31]~OI[40]が全て1枚の入力画像II[JB1]に含まれるケースCASE2もあり得る(当該ケースでは“JB1=JB2”)。
【0091】
ケースCASE2に係る第1誤りラベル対応処理において、生成部70は、誤りラベル付き物体画像である物体画像OI[39]及び[40]を含む入力画像II[JB1]をアノテーション対象として抽出し、暫定データセットにおける入力画像II[JB1]のアノテーション情報に誤りが含まれる可能性があることを、データ処理装置1の管理者に対して通知する(この通知を通知NT2と称する)。通知NT2は、データ処理装置1に設けられた又は接続された表示画面(不図示)での表示を通じて行われて良い。通知NT2は、入力画像II[JB1]のアノテーション情報の正解を求める正解要求通知を含んでいて良い。通知NT2を受けた管理者は、入力画像II[JB1]のアノテーション情報の正解を示す正解情報を、ポインティングデバイス等の所定のマンマシンインターフェース(不図示)を通じてデータ処理装置1に入力する。ここにおける正解情報は、物体画像OI[39]及び[40]中の物体が交通標識であること(即ち第3クラスの物体であること)を指し示す。生成部70は、正解情報に基づき入力画像II[JB1]に対するアノテーション情報(暫定データセット中のアノテーション情報)を修正し、入力画像II[JB1]の画像データと当該修正したアノテーション情報とを、1枚の教師用画像の画像データ及び当該教師用画像のアノテーション情報の組として、学習用データセットに含める。
【0092】
誤りラベル対応処理として、以下の第2誤りラベル対応処理を採用することもできる。上記ケースCASE1に係る第2誤りラベル対応処理において、生成部70は、誤りラベル付き物体画像である物体画像OI[39]及び[40]を含む入力画像II[JB1+2]を学習用画像に設定しない。即ち、入力画像II[JB1+2]の画像データを学習用データセットから除外する(学習用データセットに含めない)。第2誤りラベル対応処理が採用される場合、ケースCASE1においては、第1誤りラベル対応処理が採用される場合と同様に、入力画像II[JB1]及びII[JB2]は2枚の学習用画像に設定され、入力画像II[JB1]及びII[JB1+1]の画像データと、暫定データセットにおける入力画像II[JB1]及びII[JB1+1]のアノテーション情報とが、そのまま学習用データセットに含められる。上記ケースCASE2に係る第2誤りラベル対応処理において、生成部70は、誤りラベル付き物体画像である物体画像OI[39]及び[40]を含む入力画像II[JB1]を学習用画像に設定しない。即ち、入力画像II[JB1]の画像データを学習用データセットから除外する(学習用データセットに含めない)。尚、第2誤りラベル対応処理が採用される場合であっても、ケースCASE1、CASE2において、上記通知NT1、NT2が行われるようにしても良い(但し正解要求通知は非実行)。
【0093】
評価データセットES2に注目して第1及び第2誤りラベル対応処理を説明したが、評価データセットES3を含む他の評価データセットに対しても同様の処理が実行される。
【0094】
このように、第1誤りラベル対応処理を採用する生成部70は、複数の入力画像(II[1]~II[L])を複数の学習用画像に設定し、複数の入力画像(II[1]~II[L])としての複数の学習用画像の画像データと各学習用画像内の物体の位置及びクラスを特定するアノテーション情報とを含む学習用データセットを生成する。この際、第1誤りラベル対応処理を採用する生成部70は、誤り特定部60の特定結果(誤りクラスタ及び誤りラベル付き物体画像の特定結果)に基づき、誤りラベル付き物体画像を含む入力画像をアノテーション対象として抽出し、アノテーション対象に対して外部から与えられた情報(正解情報)を用いて、アノテーション対象に対するアノテーション情報を修正する。修正後のアノテーション情報が学習用データセットに含められることになる。
【0095】
これに対し、第2誤りラベル対応処理を採用する生成部70は、複数の入力画像(II[1]~II[L])の一部を複数の学習用画像として抽出し、抽出によって得られた複数の学習用画像の画像データと各学習用画像内の物体の位置及びクラスを特定するアノテーション情報とを含む学習用データセットを生成する。この際、第2誤りラベル対応処理を採用する生成部70は、誤り特定部60の特定結果(誤りクラスタ及び誤りラベル付き物体画像の特定結果)に基づき、誤りラベル付き物体画像を含む入力画像を上記複数の学習用画像から除外する。例えば、入力画像II[1]~II[10000]が存在する場合において、入力画像II[1]~II[9800]の夫々が誤りラベル付き物体画像を含まず、且つ、入力画像II[9801]~II[10000]の夫々が誤りラベル付き物体画像を含むのであれば、入力画像II[1]~II[9800]のみが計9800枚の学習用画像として抽出されて、9800枚の学習用画像の画像データを含む学習用データセットが生成される。
【0096】
第1及び第2ラベル対応処理の何れを採用した場合でも、質の高い学習用データセット、即ちアノテーション情報に誤りの少ない(理想的には誤りの無い)学習用データセットを生成することが可能である。学習用データセットの質を高めることで、学習用データセットを用いた機械学習にて構築される画像認識用の推論モデルの性能を高めることができる。第2ラベル対応処理の採用時には手動による正解情報の入力作業が不要となるというメリットがある。一方で、第1ラベル対応処理の採用時には、第2ラベル対応処理の採用時と比べて、学習用画像の枚数を増やすことができるというメリットがある。
【0097】
<<第4実施例>>
第4実施例を説明する。
図13にデータ処理装置1の動作の一部フローチャートを示す。画像分類データセットの取得処理、機械学習処理、及び、特徴量導出処理は、ステップS11に至る前に実行済みであるとする。但し、特徴量導出処理の実行タイミングは後述のステップS12に至る前であれば任意である。
【0098】
図13の動作では、評価データセットを単位にクラスタリング処理を行うために、まずステップS11において、クラスタリング処理部40がm枚の物体画像の画像データと当該m枚の物体画像のクラス情報とを含む評価データセットを設定する。m枚の物体画像は画像分類データセット中のM枚の入力画像から切り出された物体画像である。Mは1以上の整数である。
【0099】
mは3以上の整数である。但し、mは4以上の整数であっても良いし、5以上の整数であっても良いし、更にそれ以上の整数であっても良い。mは固定値mCNST(例えば“m=mCNST=10)であっても良い。“m=mCNST”である場合、Mの値は不定であり、固定値mCNSTの枚数分の物体画像を含むM枚の入力画像を画像分類データセット中から抽出することによって評価データセットが設定される。“m=mCNST”とするのではなく、“M=MCNST”としても良い。MCNSTは固定値であり、基本的には2以上の整数であるが、1であり得ても良い。“M=MCNST”である場合、MCNST枚の入力画像に設定された物体領域(バウンディングボックス)の総数がmの値になるので、評価データセットが設定されるたびにmの値は変動しうる。“M=MCNST”とすることを原則としつつも、M枚の入力画像に設定される物体領域(バウンディングボックス)の総数が必要数(少なくとも3)に満たない場合には、当該総数が必要数以上となるまでMの値を増大させて良い。
【0100】
ステップS11にて評価データセットが設定されると、その設定された評価データセットに対しステップS12~S15の処理又はステップS12~S16の処理が順次実行される。即ちステップS12において、クラスタリング処理部40は、評価データセットにおけるm枚の物体画像の特徴量及びクラス情報に基づきm枚の物体画像のクラスタリングを行い、これによってm枚の物体画像を1以上のクラスタに分類する。続くステップS13において、指標導出部50は、クラスタごとに特徴量の重心、距離平均及び距離分散を導出する。そしてステップS14において、誤り特定部60は、距離平均及び距離分散に基づき誤りクラスタを特定するための処理を実行する。この処理にて誤りクラスタが特定されたか否かがステップS15にてチェックされる。誤りクラスタが特定された場合(ステップS15のY)にはステップS16の処理を行ってからステップS17に進むが、誤りクラスタが特定されなかった場合(ステップS15のN)にはステップS16の処理を経ずにステップS17に直接進む。ステップS16において、誤り特定部60は、誤りクラスタの再クラスタリングを経て誤りラベル付き物体画像を特定する。
【0101】
ステップS17において、データ処理装置1(例えばクラスタリング処理部40)は、画像分類データセットに含まれる全ての物体画像に対する評価が完了したか否かを判定する。画像分類データセットに含まれる全ての物体画像が何れかの評価データセットに含められた上でステップS12~S15の処理又はステップS12~S16の処理が行われたならば、上記評価が完了したと判定して(ステップS17のY)ステップS18に進む。
画像分類データセットに含まれる1以上の物体画像が未だ評価データセットに含められていないのであれば、ステップS11に戻ってステップS11以降の処理を繰り返す。
【0102】
ステップS18において、学習用データセット生成部70は、必要に応じて第3実施例で述べた誤りラベル対応処理を行いつつ、暫定データセットを元に学習用データセットを生成する。生成された学習用データセットはデータベース80に記憶される。
【0103】
<<第5実施例>>
第5実施例を説明する。第5実施例では、上述した事項に対する応用技術、変形技術又は補足事項等を説明する。
【0104】
上述の実施例において、誤りクラスタに属する誤りラベル付き物体画像の数が2つとなる具体例に挙げたが(
図7~
図12参照)、1つの誤りクラスタに属する誤りラベル付き物体画像の数は1であり得るし、3以上であり得る。
【0105】
データ処理装置1は、ハードウェアとして、演算処理装置であるCPU(Central Processing Unit)、GPU(Graphics Processing Unit)、ROM(Read only memory)及びRAM(Random access memory)等を備える。データ処理装置1は、ROMに格納されたプログラム又は他の装置から通信を通じて取得されたプログラムをCPUにて実行することにより、
図1に示す各部位の機能を実現して良く、故に
図13のステップS11~S18の各処理を実現して良い。
【0106】
データ処理装置1にて生成された学習用データセットを用いて、任意のニューラルネットワークを機械学習させることにより画像認識用の推論モデルを構築できる。例えば、車載装置においてDNN(Deep Neural Network)を含む学習器を形成しておき、学習用データセットを教師データとして用いて、車載装置の学習器に機械学習を行わせるようにしても良い。機械学習を経て車載装置の学習器により物体検出が可能な推論モデルが形成される。そして、車載装置にて推論モデルによる物体検出を行わせ、物体検出の結果を、車両で実施され得る自動運転又は運転支援等に利用して良い。ここにおける車載装置は、自動車等の車両に設置される装置を指す。
【0107】
尚、データ処理装置1自体が車載装置であっても構わない。車両(例えば放送中継車)によっては、豊富な計算資源を有する車載装置が設置されることもあり、この場合においては特にデータ処理装置1自体を車載装置とすることも可能である。
【0108】
データ処理装置1により実行される処理の一部又は全部は、ソフトウェアおよびハードウェアの混在処理により実現しても良い。前述した方法をコンピュータに実行させるコンピュータプログラム及びそのプログラムを記録したコンピュータ読み取り可能な記録媒体は、本実施形態の範囲に含まれる。ここで、コンピュータ読み取り可能な記録媒体は、例えば、フレキシブルディスク、ハードディスク、CD-ROM、MO、DVD、DVD-ROM、DVD-RAM、大容量DVD、次世代DVD、半導体メモリである。
【0109】
本発明の実施形態は、特許請求の範囲に示された技術的思想の範囲内において、適宜、種々の変更が可能である。以上の実施形態は、あくまでも、本発明の実施形態の例であって、本発明ないし各構成要件の用語の意義は、以上の実施形態に記載されたものに制限されるものではない。上述の説明文中に示した具体的な数値は、単なる例示であって、当然の如く、それらを様々な数値に変更することができる。
【符号の説明】
【0110】
1 データ処理装置
10 画像分類データセット取得部
20 機械学習処理部
21 ニューラルネットワーク
30 推論部
31 特徴量導出部
40 クラスタリング処理部
50 指標導出部
60 誤り特定部
70 学習用データセット生成部
80 データベース