IP Force 特許公報掲載プロジェクト 2022.1.31 β版

知財求人 - 知財ポータルサイト「IP Force」

▶ 株式会社ブリヂストンの特許一覧

特許7132701タイヤ画像の認識方法及びタイヤ画像の認識装置
<>
  • 特許-タイヤ画像の認識方法及びタイヤ画像の認識装置 図1
  • 特許-タイヤ画像の認識方法及びタイヤ画像の認識装置 図2
  • 特許-タイヤ画像の認識方法及びタイヤ画像の認識装置 図3
  • 特許-タイヤ画像の認識方法及びタイヤ画像の認識装置 図4
  • 特許-タイヤ画像の認識方法及びタイヤ画像の認識装置 図5
  • 特許-タイヤ画像の認識方法及びタイヤ画像の認識装置 図6
  • 特許-タイヤ画像の認識方法及びタイヤ画像の認識装置 図7
  • 特許-タイヤ画像の認識方法及びタイヤ画像の認識装置 図8
  • 特許-タイヤ画像の認識方法及びタイヤ画像の認識装置 図9
  • 特許-タイヤ画像の認識方法及びタイヤ画像の認識装置 図10
< >
(19)【発行国】日本国特許庁(JP)
(12)【公報種別】特許公報(B2)
(11)【特許番号】
(24)【登録日】2022-08-30
(45)【発行日】2022-09-07
(54)【発明の名称】タイヤ画像の認識方法及びタイヤ画像の認識装置
(51)【国際特許分類】
   G01M 17/02 20060101AFI20220831BHJP
   B60C 11/03 20060101ALI20220831BHJP
   B60C 11/24 20060101ALI20220831BHJP
   B60C 13/00 20060101ALI20220831BHJP
   G06T 7/00 20170101ALI20220831BHJP
【FI】
G01M17/02
B60C11/03 Z
B60C11/24 Z
B60C13/00 Z
G06T7/00 350C
【請求項の数】 4
(21)【出願番号】P 2017156115
(22)【出願日】2017-08-10
(65)【公開番号】P2019035626
(43)【公開日】2019-03-07
【審査請求日】2020-07-01
【審判番号】
【審判請求日】2021-10-05
(73)【特許権者】
【識別番号】000005278
【氏名又は名称】株式会社ブリヂストン
(74)【代理人】
【識別番号】100141243
【弁理士】
【氏名又は名称】宮園 靖夫
(72)【発明者】
【氏名】西井 雅之
(72)【発明者】
【氏名】大澤 靖雄
(72)【発明者】
【氏名】若尾 泰通
【合議体】
【審判長】三崎 仁
【審判官】樋口 宗彦
【審判官】▲高▼見 重雄
(56)【参考文献】
【文献】特開平10-255048(JP,A)
【文献】特開2015-148979(JP,A)
【文献】Lei Zhang, Fan Yang, Yimin Daniel Zhang, and Ying Julie Zhu,ROAD CRACKDETECTION USING DEEP CONVOLUTIONAL NEURAL NETWORK,2016 IEEE InternationalConference on Image Processing (ICIP),IEEE,2016年 9月25日,pp.3708-3712,DOI:10.1109/ICIP.2016.533052
(58)【調査した分野】(Int.Cl.,DB名)
G01M17/007-17/02
B60C11/03
B60C11/24
B60C13/00
B60C19/00
G01B11/24
G01N21/88-21/91
G06T7/00
(57)【特許請求の範囲】
【請求項1】
タイヤ画像を認識する方法であって、
品種もしくはタイヤ状態のいずれか一方もしくは両方の異なる複数のタイヤ画像を取得して、これを教師用画像とするステップと、
前記教師用画像から、前記教師用画像よりもサイズが小さく、かつ、一定の画素数のサイズの画像を複数切り出し、これらの画像を学習用データの変換画像とするステップと、
前記複数の学習用データの変換画像を学習用画像として、畳み込みニューラルネットワークで学習し、前記ニューラルネットワークのパラメータを設定するステップと、
認識対象のタイヤのタイヤ画像を取得し、前記取得されたタイヤの画像から、前記学習用データの変換画像と同じサイズの画像を複数切り出し、これらの画像を認識用データの変換画像とするステップと、
前記複数の認識用データの変換画像を前記畳み込みニューラルネットワークに入力し、前記入力された複数の認識用データの変換画像のそれぞれについて、前記対象となるタイヤの品種もしくはタイヤ状態のいずれか一方もしくは両方を判別するステップとを備え、
前記複数の学習用データの変換画像及び前記複数の認識用データの変換画像には、それぞれ、当該タイヤのトレッドパターンのパターン周期構造が少なくとも1つ写っていることを特徴とするタイヤ画像の認識方法。
【請求項2】
前記品種もしくはタイヤ状態が、トレッドパターン、トレッド摩耗量のいずれかであることを特徴とする請求項1に記載のタイヤ画像の認識方法。
【請求項3】
前記学習用データの変換画像及び前記認識用データの変換画像をグレースケールに変換し、前記グレースケールの階調を0~1の範囲に規格化したことを特徴とする請求項1または請求項2に記載のタイヤ画像の認識方法。
【請求項4】
タイヤ画像を認識する装置であって、
品種もしくはタイヤ状態のいずれか一方もしくは両方の異なる複数の教師用画像と認識対
象となる認識用画像とを撮影するタイヤ画像撮影手段と、
前記教師用画像から、前記教師用画像よりもサイズが小さく、かつ、一定の画素数のサイズの画像を複数切り出し、これらの画像を学習用データの変換画像とするとともに、
前記認識用画像から、前記学習用データの変換画像と同じサイズの画像を複数切り出し、これらの画像を認識用データの変換画像とする画像データ変換手段と、
前記学習用データの変換画像と前記認識用データの変換画像の特徴量を抽出する特徴量抽出手段と、
前記学習用データの変換画像の特徴量と前記認識用データの変換画像の特徴量とを比較して、前記対象となるタイヤの品種もしくはタイヤ状態のいずれか一方もしくは両方を判別する判別手段とを備え、
前記複数の学習用データの変換画像及び前記複数の認識用データの変換画像には、それぞれ、当該タイヤのトレッドパターンのパターン周期構造が少なくとも1つ写っており、
前記特徴量抽出手段が、
前記学習用用データの変換画像を学習用画像として構築した畳み込みニューラルネットワークの畳み込み層とプーリング層であり、
前記判別手段が、
前記畳み込みニューラルネットワークの全結合層であることを特徴とするタイヤ画像の認識装置。
【発明の詳細な説明】
【技術分野】
【0001】
本発明は、タイヤ画像の認識方法とその装置に関する。
【背景技術】
【0002】
タイヤは、摩耗によるトレッドゴムの減少や外傷や劣化による損傷が発生した場合に、タイヤ性能と安全性を担保するために、新品タイヤへ交換することが推奨されている。その判断のための情報取得は、主に、目視による外観観察によりなされている。
摩耗量の判別においては、それがタイヤの走行性能や安全性能に対して重要であるにも関わらず、運転者による点検が日常的に必要な頻度で実施されているとは言い難い。
そこで、人による目視ではなく、カメラのような機械による画像から摩耗量などのタイヤ情報を認識できれば、点検の省力化が実現できるだけでなく、管理コストの低減も期待できる。
近年、画像処理、画像認識の技術が大きく進歩しており、例えば、タイヤのトレッドパターンを撮影し、そのアスペクト比やトレッド溝深さを解析してタイヤ摩耗量を特定するなど、タイヤの点検への活用が検討され始めている(例えば、特許文献1参照)。
【先行技術文献】
【特許文献】
【0003】
【文献】US 2016/0343126
【発明の概要】
【発明が解決しようとする課題】
【0004】
しかしながら、上記特許文献1では、トレッドパターンのエッジやラインといった特徴的な幾何学情報である特徴量を、事前に開発者などの人間が介在して設定しているため、解析パラメータが個別のケースに限定されるだけでなく、大量のタイヤを解析するには多大な時間がかかってしまうといった問題点があった。
更に、用いる画像の明るさや角度、大きさといった個別の画像状態に解析精度が左右されてしまっていた。
【0005】
本発明は、従来の問題点に鑑みてなされたもので、タイヤの画像からタイヤ種や摩耗状態などを容易にかつ確実に認識できる方法とその装置を提供することを目的とする。
【課題を解決するための手段】
【0006】
本発明は、タイヤ画像の認識方法であって、品種もしくはタイヤ状態のいずれか一方も
しくは両方の異なる複数のタイヤ画像を取得して、これを教師用画像とするステップと、
前記教師用画像から、前記教師用画像よりもサイズが小さく、かつ、一定の画素数のサイズの画像を複数切り出し、これらの画像を学習用データの変換画像とするステップと、前記複数の学習用データの変換画像を学習用画像として、畳み込み層とプーリング層とを備えた畳み込みニューラルネットワーク(CNN;Convolutional Neural Network)で学習し、前記ニューラルネットワークのパラメータを設定するステップと、認識対象のタイヤのタイヤ画像を取得し、前記取得されたタイヤの画像から、前記学習用データの変換画像と同じサイズの画像を複数切り出し、これらの画像を認識用データの変換画像とするステップと、前記複数の認識用データの変換画像を前記畳み込みニューラルネットワークに入力し、前記入力された複数の認識用データの変換画像のそれぞれについて、前記対象となるタイヤの品種もしくはタイヤ状態のいずれか一方もしくは両方を判別するステップとを備え、前記複数の学習用データの変換画像及び前記複数の認識用データの変換画像には、それぞれ、当該タイヤのトレッドパターンのパターン周期構造が少なくとも1つ写っていることを特徴とする。
このように、タイヤ画像を認識する際に、畳み込み層とプーリング層により入力したタ
イヤ画像データから特徴量を抽出した後、全結合層(従来のニューラルネットワーク)に
て判別する畳み込みニューラルネットワークを用いたので、ニューラルネットワーク内の
パラメータが大幅に削減されて計算速度を速めることができるだけでなく、トレッドパタ
ーンのエッジやラインといった特徴的な幾何学情報を設定することなく、品種や摩耗量な
どのタイヤ情報を精度よく認識・判別することができる。
また、畳み込みニューラルネットワークでは、学習時は、教師用画像データのセットに
対する誤差を、勾配急降下法(GD)や確率的勾配急降下法(SGD)などを用いて誤差逆伝
搬法により最小化するように、ニューラルネットワークのパラメータを更新して最適化し
ているので、認識対象のタイヤの判別精度を大幅に向上させることができる。
【0007】
また、前記タイヤ品種もしくはタイヤ状態、トレッドパターン、トレッド摩耗量のいずれかとしたので、タイヤ交換に必要なタイヤ情報を精度よく認識・判別できる。
また、前記学習用データの変換画像及び前記認識用データの変換画像をグレースケールに変換し、前記グレースケールの階調を0~1の範囲に規格化したので、画像情報量を少なくして計算時間を短縮できる。
【0008】
また、本発明は、タイヤ画像を認識する装置であって、品種もしくはタイヤ状態のいずれか一方もしくは両方の異なる複数の教師用画像と認識対象となる認識用画像とを撮影するタイヤ画像撮影手段と、前記教師用画像から、前記教師用画像よりもサイズが小さく、かつ、一定の画素数のサイズの画像を複数切り出し、これらの画像を学習用データの変換画像とするとともに、前記認識用画像から、前記学習用データの変換画像と同じサイズの画像を複数切り出し、これらの画像を認識用データの変換画像とする画像データ変換手段と、前記学習用データの変換画像と前記認識用データの変換画像の特徴量を抽出する特徴量抽出手段と、前記学習用データの変換画像の特徴量と前記認識用データの変換画像の特徴量とを比較して、前記対象となるタイヤの品種もしくはタイヤ状態のいずれか一方もしくは両方を判別する判別手段とを備え、前記複数の学習用データの変換画像及び前記複数の認識用データの変換画像には、それぞれ、当該タイヤのトレッドパターンのパターン周期構造が少なくとも1つ写っており、前記特徴量抽出手段が、前記学習用用データの変換画像を学習用画像として構築した畳み込みニューラルネットワークの畳み込み層とプーリング層であり、前記判別手段が、前記畳み込みニューラルネットワークの全結合層であることを特徴とする。
このような構成を採ることにより、品種や摩耗量などのタイヤ情報を精度よく認識・判
別することのできるタイヤ画像の認識装置を実現できる。
【0009】
なお、前記発明の概要は、本発明の必要な全ての特徴を列挙したものではなく、これらの特徴群のサブコンビネーションもまた、発明となり得る。
【図面の簡単な説明】
【0010】
図1】本発明の実施の形態に係わるタイヤ画像の認識装置を示す図である。
図2】変換画像の切り出し方法を示す図である。
図3】畳み込み層の動作を説明するための図である。
図4】プーリング層の動作を説明するための図である。
図5】全結合層の動作を説明するための図である。
図6】深層学習によるタイヤ画像の認識方法を示すフローチャートである。
図7】実施例1(摩耗識別1)のタイヤ画像と学習用画像を示す図である。
図8】実施例2(摩耗識別2)のタイヤ画像と学習用画像を示す図である。
図9】実施例4(タイヤ種識別)のタイヤ画像と学習用画像を示す図である。
図10】実施例5(トレッドパターン識別)のタイヤ画像と学習用画像の一例を示す図である。
【発明を実施するための形態】
【0011】
図1は、タイヤ画像の認識装置10の構成を示す機能ブロック図である。
本例のタイヤ画像の認識装置10は、タイヤ画像撮影手段11と、画像データ変換手段12と、画像格納手段13と、タイヤ認識・判別手段14と、表示手段15とを備え、撮影されたタイヤの画像から、当該タイヤの摩耗状態を判別する。
タイヤ画像撮影手段11としては、例えば、デジタルカメラやスマートフォンなどの撮影装置が用いられ、表示手段15は、ディスプレイ等から構成される。なお、ビデオなどの動画を撮影して、その静止画を用いてもよい。
また、画像データ変換手段12~タイヤ認識・判別手段14までの各手段は、ROMやRAMなどの記憶装置とマイクロコンピュータのプログラムとから構成される。
タイヤ画像撮影手段11は、タイヤ20の表面の画像を撮影してタイヤ画像を取得する。具体的には、タイヤ20の周の複数の位置(例えば、6か所)を撮影して複数の画像を取得する。
色調は、グレースケール、RGBのいずれでもよいが、タイヤは黒色なので、本例では、グレースケール画像を用いた。これにより、チャンネル数が1つで済むので、画像情報量を少なくすることができる。なお、画像階調としては、グレースケール225階調を0~1の範囲に規格化した画像を使用した。
タイヤ画像撮影手段11は、畳み込みニューラルネットワークの学習用データを取得するための、摩耗量が異なる複数の基準タイヤと、摩耗量を認識・判別するため認識用タイヤとを撮影する。
本例では、基準タイヤの画像数を6枚、認識用タイヤの画像数を2枚とした。
また、画像のサイズや画素数も特に限定しないが、本例では、撮影画像のサイズを、480×640ピクセルとした。また、画像範囲も特に限定しないが、画像全体にトレッドのいずれかの部分が収まっていることが望ましい。もし、画像に、風景や車両などのタイヤ20以外の物体が写っている場合には、タイヤ部分を抽出して、これを新たにタイヤ画像とすることが望ましい。
【0012】
画像データ変換手段12は、撮影した画像一定サイズの画像に変換する。
具体的には、図2に示すように、撮影したタイヤ画像G0から、矩形もしくは正方形の範囲で、タイヤ画像G0よりもサイズが小さい複数の画像G1~Gnを切り出し、これらを変換画像とする。このとき、変換画像G1~Gnの各画像内には、トレッドパターンを構成する最小周期のパターンが最低でも1個収まっていることが望ましい。
本例では、タイヤ画像G0のサイズを480×640ピクセルとし、変換画像G1~Gnのサイズを256×256ピクセルとし、1枚のタイヤ画像G0から6枚の変換画像G1~G6を切り出した。変換画像の個数は36枚となる。
画像格納手段13は、画像データ変換手段12で変換された、学習用データの変換画像GL1~GLnと、認識用データの変換画像GS1~GSnとを収納する。なお、学習用データの変換画像GL1~GLnは、後述する畳み込み層やプーリング層のフィルタや全結合層のパラメータなどを決定するための教師データGL1~GLmと、畳み込みニューラルネットワークの判別精度を確認するためのテストデータGLm+1~GLnとに分けて収納される。教師データの個数mとしては、学習用データの総数nの2/3以上とすることが好ましい。
本例では、水準数を2とし、mを27とした。すなわち、36×2枚の学習用画像のうちの27×2枚を教師画像とし、残りの9×2枚をテスト画像とした。
【0013】
タイヤ認識・判別手段14は、特徴量抽出部14Aと認識・判別部14Bとを備える。
特徴量抽出部14Aは、畳み込み用フィルタF1(ここでは、F11,F12)を備えた畳み込み層と、矩形フィルタF2(ここでは、F21,F22)を備えたプーリング層とを備え、画像データ変換手段12で変換された認識用データの変換画像GS(GS1~GSn)から認識する対象となるタイヤの画像である認識用画像の特徴量を抽出した後、各ピクセルの値を一次元に展開して認識・判別部14Bに送る。
認識・判別部14Bは、入力層、隠れ層、出力層の3つの全結合層を備え、認識用画像の特徴量と教師用画像の特徴量とを比較して、対象となるタイヤの摩耗状態を認識・判別し、判別結果を「確率」の形で出力層から表示手段15に出力する。
全結合層は、それぞれが、図1の丸印で示す、1つ1つがある関数を有する複数個のユニット(ニューロンともいう)から構成され、かつ、前の全結合層の全てのユニットと結合されている。出力層のユニット数は、摩耗状態の水準数に等しい。
ここでは、摩耗状態の水準数を、新品(摩耗量0mm)と摩耗量大(摩耗量11mm)の2水準とした。
なお、全結合層の数は2層であってもよいし、4層以上であってもよい。
また、上記の畳み込み用フィルタF11,F12と矩形フィルタF21,F22、及び、全結合層のユニット同士を結合するパラメータ(重み、もしくは、weight)は、教師データGL1~GLkを用いた深層学習(Deep Learning)により求められる。
畳み込みニューラルネットワークの詳細と深層学習については後述する。
表示手段15は、タイヤ認識・判別手段14の判定結果を表示画面15Gに表示する。
【0014】
次に、畳み込みニューラルネットワークについて説明する。
畳み込みニューラルネットワークは、入力画像に対してフィルタを用いた畳み込み処理を行って特徴画像を出力する畳み込み層(Convolution layer)と、抽出された特徴の位置感度を低下させることで位置変化に対する認識能力を向上させるプーリング層(Pooling layer)とを組み合わせたフィードフォワード型のニューラルネットワークで、畳み込み層とプーリング層とを何回か繰り返した後に、全結合層(fully connected layer)が配置される構成となっている。なお、畳み込み層とプーリング層とは必ずしもペアで有る必要なく、例えば、畳み込み層-畳み込み層-プーリング層としてもよい。
畳み込み層は、入力画像に対してフィルタをかける(畳み込む)層で、入力画像の特徴を的確に捉えるためには、フィルタを複数個使うことが好ましい。
なお、畳み込み用のフィルタは、適当な大きさの領域に含まれる各画素値を重みづけして足し合わせるもので、4次元テンソルで表せる。
一方、プーリング層は、矩形のフィルタを入力画像内でずらして行き矩形内の最大値を取出して新しい画像を出力する(MAXプーリング)ことで抽出された特徴の位置感度を低下させる。なお、矩形内の値の平均値を採る平均値プーリングを行ってもよい。
【0015】
次に、畳み込み層の動作について、認識用画像Gkを、第1の畳み込み層にて畳み込み処理して、第1の畳み込み画像Gk(F11)を得るまでを例にとって説明する。
畳み込み用フィルタF11としては、一般には、サイズがp×pの正方形のフィルタが用いられる。畳み込み用フィルタF11の升目の大きさは認識用画像Gkのピクセルに相当し、升目内の数字(フィルタ値)a1,1~ap,pが学習により更新可能なパラメータとなっている。すなわち、学習の過程で、画像の特徴量が抽出できるように、パラメータa1,1~ap,pが更新される。
図3に示すように、入力画像である認識用画像Gkに、畳み込み用フィルタF11を所定のスライド幅で掛けて、第1の畳み込み画像Gk(F11)を得る。この第1の畳み込み画像Gk(F11)の画素値は、畳み込み用フィルタF11が掛けられたp×pの正方形内の認識用画像Gkの画素値とフィルタ値との内積で与えられる。なお上記の畳み込み処理より、第1の畳み込み画像Gk(F11)のサイズは、認識用画像Gkのサイズよりも小さくなる。
なお、畳み込み用フィルタF12を用いて、後述する第2のプーリング画像Gk(F21)から第2の畳み込み画像Gk(F12)を得る動作も同様である。
畳み込み用フィルタF11,F12としては、横方向のエッジを検出する横方向微分フィルタや縦方向のエッジを検出する縦方向微分フィルタなどが用いられる。
【0016】
次に、プーリング層の動作について、第1の畳み込み画像Gk(F11)を、第1のプーリング層にてプーリング処理して、出力画像である第1プーリング画像を得るまでを例にとって説明する。
本例では、図4に示すように、入力画像である第1の畳み込み画像Gk(F11)内で、q×qの矩形フィルタF21を、所定のスライド幅でずらして行き、畳み込み用フィルタF21が掛けられたq×qの正方形内の第1の畳み込み画像Gk(F11)の画素値のうちの最大の値を取出して新しい画像である第1のプーリング画像Gk(F21)を出力するMAXプーリングを行った。プーリング処理でも、第1のプーリング画像Gk(F21)のサイズは、第1の畳み込み画像Gk(F11)のサイズよりも小さくなる。
矩形フィルタF22を用いて、第2の畳み込み画像Gk(F11)から第2のプーリング画像Gk(F22)を得る動作も同様である。
なお、プーリング処理では、学習の過程で更新されるパラメータは存在しない。
【0017】
全結合層は、それぞれが複数のユニットから成る入力層と隠れ層と出力層とを有するニューラルネットワークで、2次元画像である第2のプーリング画像Gk(F22)を1次元のベクトルに変換したものを入力データに対してパターン分類を行う。
図5に示すように、同図の白丸で示す全結合層の各ユニットは、前の層及び次の層の全てのユニットと、学習により更新可能なパラメータにより結合されている。
入力層及び隠れ層のユニット数をそれぞれN1、N2、入力層の上からm番目(m=1~N2)のユニットと隠れ層の上からn番目のユニットとの結合パラメータである重みをWm,n、入力層の各ユニットの値をu1,k(k=1~N1)とすると、隠れ層の上からn番目のユニットへの入力値u2,mは、u2,m=W1,m×u1,1+W2,m×u1,2+……+WN1,m×u1,N1となる。実際には、この入力値u2,nにバイアスb2,nが加わる。バイアスb2,nも、学習により更新可能なパラメータである。
ニューラルネットワークでは、このようにして得られた入力値u2,nに、更に重み活性化関数(activation function)を通して出力することで、非線形性を高めて分類の判別精度を向上させる。
隠れ層が複数ある場合、及び、隠れ層と出力層との関係も、同様である。
重み活性化関数としては、tanhやジグモイド(Sigmoid)関数などが用いられるが、本例では、tanhよりも高速でかつ高性能なReLU(Rectified Linear Unit)関数を用いた。
なお、出力層では、重み活性化関数としてSoftmax関数を用いる。
Softmax関数は、出力層のみに用いられる特別な活性化関数で、出力層の出力値の組み合わせを確率に変換する。すなわち、出力値が0~1、出力値の総和が1(100%)になるように出力層の出力値を変換する。
【0018】
次に、教師用画像を用いてフィルタ値a1,1~ap,pや重みWm,nなどのパラメータを自己更新する方法について説明する。
まず、各水準の出力値についての「正答」の出力値と、教師用画像を入力して得られた出力値との差を、誤差関数(loss function)により数値化する。本例では、教師用画像が27×2枚であるので、54枚のデータを畳み込みネットワークに通した時の誤差の合計が最小になるように上記のパラメータを更新する。本例では、誤差関数として交差エントロピー関数(cross-entropy loss function)を用いた。
また、本例では、誤差を小さくする方法として、確率的勾配下降法(SGD; Stochastic Gradient Descent method)を用いるとともに、誤差関数の勾配の修正に、誤差逆伝搬法(back propagation)のアルゴリズムを用いた。
確率的勾配下降法は、全データの中から、ミニバッチ単位で少数のサンプルだけを抜き出し、このサンプルでの全体と見做してパラメータを更新する。
また、誤差逆伝搬法は、勾配を直接計算するのではなく、出力から入力にかけて勾配を順次求めることで、勾配を高速に求めることができる。
なお、データ数が多い場合には、全結合層の計算を行う際に、一部のユニットをないものとして計算するDropoutの手法を用いれば、過学習を防ぐことができる。
また、学習回数については特に限定しないが、最低10回以上行うことが好ましい。学習が正しく行われていれば、誤差関数の値が学習を経る後に減少する。
【0019】
次に、タイヤ画像の認識方法について図6のフローチャートを参照して説明する。
まず、CNN(畳み込みニューラルネットワーク)の学習が終了しているか否かを確認する(ステップS10)。
学習が終了していない場合にはステップS11に進み、学習が終了している場合にはステップS21に進む。
ステップS11では、摩耗量が異なる複数の基準タイヤの表面を撮影して、基準タイヤの画像を取得する。
次に、取得した基準タイヤの画像を一定サイズの大きさの複数の画像に変換(ステップS12)した後、この変換された画像を複数の教師用画像とテスト用画像とに分ける(ステップS13)。
そして、これら複数の教師用画像を用いて、深層学習し、畳み込み層やプーリング層のフィルタ値、及び、全結合層の重みなどのCNNのパラメータを自己更新して、学習パラメータを求め(ステップS14)、これら求められた学習済みのパラメータを用いて、図1のタイヤ認識・判別手段に相当する摩耗量判別装置を構築する(ステップS15)。
そして、学習が完了した時点で、テスト用画像を用いて、摩耗量判別装置の判別精度を確認する(ステップS16)。
判別精度の確認後には、ステップS21に進んで、摩耗量を認識・判別する対象となるタイヤの表面を撮影して、認識用タイヤの画像を取得する。
次に、取得した認識用タイヤの画像を一定サイズの大きさの複数の画像に変換する(ステップS22)。
そして、これら変換された画像のデータを、前記ステップS15で構築した摩耗量判別装置に入力して、認識用タイヤを認識・判別(ステップS23)した後、その判別結果をディスプレイ等の表示画面に表示(ステップS24)して、本処理を終了する。
なお、次のタイヤの認識・判別を行う場合には、ステップS21~ステップS24の処理を行えばよい。
【0020】
以上、本発明を実施の形態を用いて説明したが、本発明の技術的範囲は前記実施の形態に記載の範囲には限定されない。前記実施の形態に、多様な変更または改良を加えることが可能であることが当業者にも明らかである。そのような変更または改良を加えた形態も本発明の技術的範囲に含まれ得ることが、特許請求の範囲から明らかである。
【0021】
例えば、前記実施形態では、ここでは、摩耗状態の水準数を、新品(摩耗量0mm)と摩耗量大(摩耗量11mm)の2水準としたが、3水準以上としてもよい。
例えば、摩耗状態に代えて、摩耗量を判別したい場合には、教師データとして、1~2mm刻みで摩耗した複数水準のタイヤ画像を摩耗量の水準数だけラベリングして学習させておき、そのパラメータを用いて実際の判別したいタイヤの摩耗量を判別するようにすればよい。
また、前記実施形態では、タイヤ状態をトレッド摩耗量としたが、サイドトレッドにひび割れがあるか否かなどについても、正常品と不良品とを認識して判別することも可能である。
また、トレッドパターンから品種を特定したい場合には、品種の数をラベルとして学習させ、判別に用いればよい。
なお、出力された判別結果は、サーバーやクラウドなどに格納しておけば、結果の情報を現場ユーザーへ告知したり、結果によってはタイヤの交換を推奨するといったサービスに用いることができる。
【0022】
[実施例1]
同一品種のタイヤにおいて、タイヤ摩耗量を、新品及び摩耗量大の2水準とした場合の識別結果について説明する。
なお、識別方法については、図6に示したフローチャートによる。
タイヤの仕様を下記に示す。
・タイヤ1
サイズ;245/70R19.5
パターン;A
摩耗量;0mm(新品のタイヤ)
・タイヤ2
サイズ;245/70R19.5
パターン;A
摩耗量;11mm
・撮影画像
写真はスマートフォンのカメラで、各タイヤの周長を無作為に6枚ずつ撮影した。
図7(a)がタイヤ1の画像で、図7(b)がタイヤ2の画像である。
画像のサイズは、いずれも、480×640ピクセルである。
・画像階調
グレースケール255階調を0~1の範囲に規格化した。
データ変換後の画像を図7(c),(d)に示す。
データ変換後の画像のサイズは、256×256ピクセルである。
2種類のタイヤに対して、それぞれ、以下のようにデータを振り分けた。
Pic0,1.jpeg~Pic4,3.jpeg;教師画像27枚
Pic44,.jpeg~Pic5,6.jpeg;テスト画像9枚
・深層学習条件
畳み込みの数;2
フィルターサイズ;それぞれ、16,6
プーリングの数;2
プーリング領域;それぞれ、7,3
全結合層のサイズ
第1層(入力層);400×1×27
第2層(隠れ層);50×1×27
第3層(出力層);2×1×27
第1層から第2層への計算では、ドロップアウト手法を適用。
出力値は、ソフトマックス関数で確率要素に変換。
誤差関数としてクロスエントロピー関数を用い、教師データとの誤差を見積もった。
勾配逆伝搬法で、フィルタと重み関数とを更新。
以上の学習サイクルを10回繰り返し、学習パラメータを得た。
・結果
得られた学習パラメータをテスト画像の識別テストに用いた結果を以下の表1に示す。
【表1】
表1に示すように、学習回数を重ねるにつれて誤差がゼロに近付き、学習が進んでいることが確認された。
また、判別正答率は100%であった。
すなわち、テスト用タイヤ1の9画像とテスト用タイヤ2の9画像の合計18枚を、全て正しく認識・分類した。
【0023】
[実施例2]
タイヤ摩耗量が大のタイヤ2と摩耗量が中のタイヤ3とを識別した
・タイヤ2
サイズ;245/70R19.5
パターン;A
摩耗量;11mm
・タイヤ3
サイズ;245/70R19.5
パターン;A
摩耗量;8mm
図8(a),(b)は、タイヤ2とタイヤ3の撮影画像で、図8(c),(d)は、データ変換後の画像である。
・実施条件は、実施例1に順ずる。
・結果
判別正答率は96%であった。
すなわち、テスト用タイヤ2の9画像とテスト用タイヤ3の9画像の合計18枚のうち、17枚を正しく認識・分類した。
【0024】
[実施例3]
新品タイヤ1とタイヤ摩耗量が大のタイヤ2と摩耗量が中のタイヤ3とを識別した
・タイヤ1
サイズ;245/70R19.5
パターン;A
摩耗量;0mm(新品のタイヤ)
・タイヤ2
サイズ;245/70R19.5
パターン;A
摩耗量;11mm
・タイヤ3
サイズ;245/70R19.5
パターン;A
摩耗量;8mm
なお、タイヤ1~タイヤ3の撮影画像とデータ変換後の画像は、図7及び図8に示したものと同じである。
・実施条件は、実施例1に順ずる。
・結果
判別正答率は96%であった。
すなわち、テスト用タイヤ1の9画像とテスト用タイヤ2の9画像とテスト用タイヤ3の9画像の合計27枚のうち、26枚を正しく認識・分類した。
【0025】
[実施例4]
品種の異なるタイヤ1とタイヤ4とを識別した。
・タイヤ1
サイズ;245/70R19.5
パターン;A
摩耗量;0mm(新品のタイヤ)
・タイヤ4
サイズ;205/65R15
パターン;B
摩耗量;0mm(新品のタイヤ)
図9(a),(b)は、タイヤ1とタイヤ4の撮影画像で、図9(c),(d)は、データ変換後の画像である。
・実施条件は、実施例1に順ずる。
・結果
判別正答率は100%であった。
すなわち、テスト用タイヤ1の9画像とテスト用タイヤ4の9画像の合計18枚を、全て正しく認識・分類した。
【0026】
[実施例5]
トレッドパターンの異なるタイヤ4とタイヤ5とを識別した。
・タイヤ4
サイズ;205/65R15
パターン;B
摩耗量;0mm(新品のタイヤ)
・タイヤ5
サイズ;205/65R15
パターン;C
摩耗量;0mm(新品のタイヤ)
図10(a),(b)は、タイヤ4とタイヤ5の撮影画像で、図10(c),(d)は、データ変換後の画像である。
・画像に関する実施条件は、実施例1と同様である。
・深層学習条件
畳み込みの数;4
フィルターサイズ;それぞれ、8,5,4,4
プーリングの数;4
プーリング領域;それぞれ、5,4,4,4
全結合層のサイズ
第1層(入力層);2304×1×27
第2層(隠れ層);なし
第3層(出力層);2×1×27
他の学習条件は実施例1に順ずる。
・結果
判別正答率は100%であった。
すなわち、テスト用タイヤ4の9画像とテスト用タイヤ5の9画像の合計18枚を、全て正しく認識・分類した。
【0027】
[比較例]
畳み込み構造を持たないタイヤ識別装置にて、新品タイヤ1とタイヤ摩耗量が大のタイヤ2と摩耗量が中のタイヤ3とを識別した
・タイヤ1
サイズ;245/70R19.5
パターン;A
摩耗量;0mm(新品のタイヤ)
・タイヤ2
サイズ;245/70R19.5
パターン;A
摩耗量;11mm
・タイヤ3
サイズ;245/70R19.5
パターン;A
摩耗量;8mm
・画像に関する実施条件は、実施例1と同様である。
・深層学習条件
畳み込み;なし
全結合層のサイズ
第1層(入力層);65536×1×27
第2層(隠れ層);50×1×27
第3層(出力層);2×1×27
他の学習条件は実施例1に順ずる。
・結果
判別正答率は59%であった。
すなわち、テスト用タイヤ1の9画像とテスト用タイヤ2の9画像とテスト用タイヤ3の9画像の合計27枚のうち、16枚しか正しく認識・分類できなかった。
【符号の説明】
【0028】
10 タイヤ画像の認識装置、11 タイヤ画像撮影手段、
12 画像データ変換手段、13 画像格納手段、14 タイヤ認識・判別手段、
14A 特徴量抽出部、14B 認識・判別部、15 表示手段、20 タイヤ。
図1
図2
図3
図4
図5
図6
図7
図8
図9
図10