(19)【発行国】日本国特許庁(JP)
(12)【公報種別】公開特許公報(A)
(11)【公開番号】P2023065028
(43)【公開日】2023-05-12
(54)【発明の名称】教師データ生成方法、画像解析モデル生成方法、画像解析方法、教師データ生成プログラム、画像解析プログラムおよび教師データ生成装置
(51)【国際特許分類】
G06T 7/00 20170101AFI20230502BHJP
【FI】
G06T7/00 350B
【審査請求】有
【請求項の数】12
【出願形態】OL
(21)【出願番号】P 2021175579
(22)【出願日】2021-10-27
【新規性喪失の例外の表示】特許法第30条第2項適用申請有り (その1) ウェブサイトの掲載日 2020年3月10日 ウェブサイトのアドレス http://www.sakai-chem.co.jp/jp/ http://www.sakai-chem.co.jp/jp/kaiseki/index.html
【新規性喪失の例外の表示】特許法第30条第2項適用申請有り (その2) ウェブサイトの掲載日 2020年3月12日 ウェブサイトのアドレス http://www.sakai-chem.co.jp/jp/ http://www.sakai-chem.co.jp/jp/kaiseki/index.html
【新規性喪失の例外の表示】特許法第30条第2項適用申請有り (その3) ウェブサイトの掲載日 2020年3月10日 ウェブサイトのアドレス http://www.sakai-chem.co.jp/jp/ http://www.sakai-chem.co.jp/jp/kaiseki/index.html http://www.sakai-chem.co.jp/jp/kaiseki/pdf/kaiseki_pdf01.pdf
【新規性喪失の例外の表示】特許法第30条第2項適用申請有り (その4) ウェブサイトの掲載日 2021年6月14日 ウェブサイトのアドレス https://www.youtube.com/watch?v=GPYbAVEQrUI
【新規性喪失の例外の表示】特許法第30条第2項適用申請有り (その5) 展示日 2021年5月19日~2021年5月21日 展示会名 CITE JAPAN第10回化粧品産業技術展 開催場所 パシフィコ横浜(神奈川県横浜市西区みなとみらい1-1-1)
【新規性喪失の例外の表示】特許法第30条第2項適用申請有り (その6) ウェブサイトの掲載日 2021年6月16日~2021年6月18日 ウェブサイトのアドレス https://www.japan-it-online.jp/ja-jp.html https://www.japan-it-online.jp/ja-jp/about/ai.html
【新規性喪失の例外の表示】特許法第30条第2項適用申請有り (その7) ウェブサイトの掲載日 2021年8月4日~2021年9月3日 (再公開)2021年10月22日~2021年11月26日 ウェブサイトのアドレス https://www.matsumoto-trd.co.jp/ https://www.matsumoto-trd.co.jp/2021exhibition/entry/ https://www.matsumoto-trd.co.jp/2021exhibition/greeting/ https://www.matsumoto-trd.co.jp/2021-exhibition/sak.html
【新規性喪失の例外の表示】特許法第30条第2項適用申請有り (その8) ウェブサイトの掲載日 2021年8月4日~2021年9月3日 (再公開)2021年10月22日~2021年11月26日 ウェブサイトのアドレス https://www.matsumoto-trd.co.jp/ https://www.matsumoto-trd.co.jp/2021exhibition/entry/ https://www.matsumoto-trd.co.jp/2021exhibition/greeting/ https://www.matsumoto-trd.co.jp/2021exhibition/freepresentation/
【新規性喪失の例外の表示】特許法第30条第2項適用申請有り (その9) 展示日 2021年10月6日~2021年10月8日 展示会名 食品開発展2021 開催場所 東京ビッグサイト(東京都江東区有明3-10-1)
【新規性喪失の例外の表示】特許法第30条第2項適用申請有り (その10) ウェブサイトの掲載日 2021年9月29日~2021年11月12日 ウェブサイトのアドレス https://www.powtex.com/online/ https://powtex.com/online/expo/exhibitor/5-b13/
【新規性喪失の例外の表示】特許法第30条第2項適用申請有り (その11) 展示日 2021年10月13日~2021年10月15日 展示会名 国際粉体工業展大阪2021 開催場所 インテックス大阪(大阪府大阪市住之江区南港北1-5-102)
【新規性喪失の例外の表示】特許法第30条第2項適用申請有り (その12) ウェブサイトの掲載日 2021年10月18日~2021年10月29日 ウェブサイトのアドレス https://www.chemmate.jp/online https://www.chemmate.jp/online/exhibitor https://www.chemmate.jp/online/exhibitor/list/5 https://www.chemmate.jp/online/exhibitor/booth/472
【新規性喪失の例外の表示】特許法第30条第2項適用申請有り (その13) ウェブサイトの掲載日 2021年10月18日~2021年10月29日 ウェブサイトのアドレス https://www.chemmate.jp/online https://www.chemmate.jp/ebook/guidebook2021/book/#target/page_no=1 https://www.chemmate.jp/ebook/guidebook2021/book/#target/page_no=25 https://www.chemmate.jp/online/exhibitor/booth/472
(71)【出願人】
【識別番号】000174541
【氏名又は名称】堺化学工業株式会社
(74)【代理人】
【識別番号】110000796
【氏名又は名称】弁理士法人三枝国際特許事務所
(72)【発明者】
【氏名】窪内 将隆
(72)【発明者】
【氏名】西本 拓磨
(72)【発明者】
【氏名】齋藤 晴信
【テーマコード(参考)】
5L096
【Fターム(参考)】
5L096DA01
5L096EA02
5L096EA12
5L096EA13
5L096KA04
(57)【要約】
【課題】画像解析モデルの解析精度を向上させる。
【解決手段】画像内の領域の境界を判別するための画像解析モデルMの機械学習に用いる教師データD2を生成する教師データ生成方法であって、学習用画像D1を取得する取得ステップS1と、学習用画像D1にノイズを付与する処理を行うことによりノイズ画像を生成するノイズ付与ステップS3と、前記ノイズ画像と学習用画像D1内の領域の境界を示す境界データとを対応付けて教師データD2を生成する教師データ生成ステップS4と、を備える。
【選択図】
図1
【特許請求の範囲】
【請求項1】
画像内の領域の境界を判別するための画像解析モデルの機械学習に用いる教師データを生成する教師データ生成方法であって、
学習用画像を取得する取得ステップと、
前記学習用画像にノイズを付与する処理を行うことによりノイズ画像を生成するノイズ付与ステップと、
前記ノイズ画像と前記学習用画像内の領域の境界を示す境界データとを対応付けて教師データを生成する教師データ生成ステップと、
を備える、教師データ生成方法。
【請求項2】
前記処理は、ぼかし処理、リサイズ処理、クロップ処理、ブライトネス処理、コントラスト処理および左右反転処理の少なくともいずれかである、請求項1に記載の教師データ生成方法。
【請求項3】
前記処理は、ぼかし処理である、請求項2に記載の教師データ生成方法。
【請求項4】
前記処理は、ブライトネス処理である、請求項2に記載の教師データ生成方法。
【請求項5】
前記処理は、ぼかし処理およびブライトネス処理である、請求項2に記載の教師データ生成方法。
【請求項6】
前記処理は、ぼかし処理、ブライトネス処理、リサイズ処理、およびコントラスト処理である、請求項2に記載の教師データ生成方法。
【請求項7】
前記ノイズ付与ステップでは、各学習用画像に付与する前記ノイズの強さがランダムである、請求項1~6のいずれかに記載の教師データ生成方法。
【請求項8】
請求項1~7のいずれかに記載の教師データ生成方法によって生成された教師データを用いて機械学習を行うことにより、解析対象画像を入力した場合に、前記解析対象画像内の領域の境界を示すデータを出力する画像解析モデルを生成する学習ステップを備える、画像解析モデル生成方法。
【請求項9】
解析対象画像を取得する取得ステップと、
請求項8に記載の画像解析モデル生成方法によって生成された画像解析モデルを用いて、前記解析対象画像内の領域の境界を判別する判別ステップと、
を備える、画像解析方法。
【請求項10】
コンピュータに請求項1~7のいずれかに記載の教師データ生成方法の各ステップを実行させる、教師データ生成プログラム。
【請求項11】
コンピュータに請求項10に記載の画像解析方法の各ステップを実行させる、画像解析プログラム。
【請求項12】
画像内の領域の境界を判別するための画像解析モデルの学習に用いる教師データを生成する教師データ生成装置であって、
学習用画像を取得する取得部と、
前記学習用画像にノイズを付与する処理を行うことによりノイズ画像を生成するノイズ付与部と、
前記ノイズ画像と前記学習用画像内の領域の境界を示す境界データとを対応付けて教師データを生成する教師データ生成部と、
を備える、教師データ生成装置。
【発明の詳細な説明】
【技術分野】
【0001】
本発明は、画像を解析する技術に関し、特に、画像内の領域の境界を判別する技術に関する。
【背景技術】
【0002】
商品や製品の品質や等級を判断するのに、しばしば画像解析の手法が用いられるが、対象物を認識するために、画像内の領域の境界を判別して、色などで対象領域を区別する二値化(セグメンテーション)という処理が行われている。従来の二値化は、主にグレースケールとエッジ検出に基づくルールベースで行われていたが、ピクセル単位で生じるノイズや領域の破れなどに弱く、自動的に二値化できる画像は限られていた。そのため、自動的に二値化できない画像に関しては、人の手で二値化を行っており、膨大な労力と時間がかかっていた。このことが原因で、統計的に信頼性を担保できるデータ量の確保が難しく、また画像データを数値化して信頼性あるデータとして活用することはできなかった。
【0003】
これに対し、ルールベースのアルゴリズムの代わりに、人工知能によって二値化を行う方法が提案されている。
【0004】
例えば、特許文献1には、機械学習を用いて、細胞の数と位置を検出する方法が記載されている。特許文献2には、ニューラルネットワークを用いて、処理対象の画像から複数の融合特徴マップを予測することで、物体検出を行う方法が記載されている。特許文献3には、道路と非道路の画像を第一ネットワークで学習し、道路部分を予想させて弱セグメンテーションを出力し、その後第二ネットワークで弱セグメンテーションを学習することで道路の予想を行うという方法が記載されている。
【先行技術文献】
【特許文献】
【0005】
【特許文献1】特開2019-91307号公報
【特許文献2】特表2020-509488号公報
【特許文献3】特開2019-61658号公報
【発明の概要】
【発明が解決しようとする課題】
【0006】
しかしながら、特許文献1~3に記載の方法では、いずれも機械学習のための教師データをカスタマイズしていないため、十分な量の教師データを用意していたとしても、学習した教師データに対して解析対象となる画像の画質にバラツキがある場合は、二値化の精度向上が困難であるという問題がある。
【0007】
本発明は、上記問題を解決するためになされたものであって、画像解析モデルの解析精度を向上させることを課題とする。
【課題を解決するための手段】
【0008】
本発明に係る教師データ生成方法は、画像内の領域の境界を判別するための画像解析モデルの機械学習に用いる教師データを生成する教師データ生成方法であって、学習用画像を取得する取得ステップと、前記学習用画像にノイズを付与する処理を行うことによりノイズ画像を生成するノイズ付与ステップと、前記ノイズ画像と前記学習用画像内の領域の境界を示す境界データとを対応付けて教師データを生成する教師データ生成ステップと、を備える。
【0009】
好ましい実施形態によれば、前記処理は、ぼかし処理、リサイズ処理、クロップ処理、ブライトネス処理、コントラスト処理および左右反転処理の少なくともいずれかである。
【0010】
好ましい実施形態によれば、前記処理は、ぼかし処理である。
【0011】
好ましい実施形態によれば、前記処理は、ブライトネス処理である。
【0012】
好ましい実施形態によれば、前記処理は、ぼかし処理およびブライトネス処理である。
【0013】
好ましい実施形態によれば、前記処理は、ぼかし処理、ブライトネス処理、リサイズ処理、およびコントラスト処理である。
【0014】
好ましい実施形態によれば、前記ノイズ付与ステップでは、各学習用画像に付与する前記ノイズの強さがランダムである。
【0015】
本発明に係る画像解析モデル生成方法は、上記の教師データ生成方法によって生成された教師データを用いて機械学習を行うことにより、解析対象画像を入力した場合に、前記解析対象画像内の領域の境界を示すデータを出力する画像解析モデルを生成する学習ステップを備える。
【0016】
本発明に係る画像解析方法は、解析対象画像を取得する取得ステップと、上記の画像解析モデル生成方法によって生成された画像解析モデルを用いて、前記解析対象画像内の領域の境界を判別する判別ステップと、を備える。
【0017】
本発明に係る教師データ生成プログラムは、コンピュータに上記の教師データ生成方法の各ステップを実行させる。
【0018】
本発明に係る画像解析プログラムは、コンピュータに上記の画像解析方法の各ステップを実行させる。
【0019】
本発明に係る教師データ生成装置は、画像内の領域の境界を判別するための画像解析モデルの学習に用いる教師データを生成する教師データ生成装置であって、学習用画像を取得する取得部と、前記学習用画像にノイズを付与する処理を行うことによりノイズ画像を生成するノイズ付与部と、前記ノイズ画像と前記学習用画像内の領域の境界を示す境界データとを対応付けて教師データを生成する教師データ生成部と、を備える。
【発明の効果】
【0020】
本発明によれば、画像解析モデルの解析精度を向上させることができる。
【図面の簡単な説明】
【0021】
【
図1】本発明の一実施形態に係る画像解析モデル生成システムの概略構成を示すブロック図である。
【
図2】(a)~(c)は、学習用画像の一例である。
【
図3】(a)~(c)はそれぞれ、
図2(a)~(c)に示す学習用画像から生成された境界データの一例である。
【
図4】本発明の一実施形態に係る画像解析装置のブロック図である。
【
図8】本発明の一実施形態に係る画像解析モデル生成方法の処理手順を示すフローチャートである。
【
図9】(a)~(j)は、本発明の実施例において用いた解析対象画像である。
【
図10】本発明の実施例において生成された二値化画像である。
【
図11】本発明の実施例において生成された二値化画像である。
【
図12】本発明の実施例において生成された二値化画像である。
【
図13】本発明の実施例において生成された二値化画像である。
【発明を実施するための形態】
【0022】
以下、本発明の実施形態について添付図面を参照して説明する。なお、本発明は、下記の実施形態に限定されるものではない。
【0023】
(全体構成)
図1は、本発明の一実施形態に係る画像解析モデル生成システム1の概略構成を示すブロック図である。画像解析モデル生成システム1は、本実施形態に係る画像解析モデル生成方法によって、画像内の領域の境界を判別するための画像解析モデルを生成するシステムであり、教師データ生成装置2と、機械学習装置3とを備える。
【0024】
(教師データ生成)
教師データ生成装置2は、本実施形態に係る教師データ生成方法によって、画像内の領域の境界を判別するための画像解析モデルの機械学習に用いる教師データを生成する装置である。教師データ生成装置2は、汎用のコンピュータで構成することができ、ハードウェア構成として、CPUやGPUなどのプロセッサ、DRAMやSRAMなどの主記憶装置(図示省略)、および、HDDやSSDなどの補助記憶装置20を備えている。補助記憶装置20には、複数の学習用画像D1や、教師データ生成プログラムなどの教師データ生成装置2を動作させるための各種プログラムが格納されている。
【0025】
学習用画像D1は、教師データを生成するためのサンプルとなる画像であり、画像内に複数の領域を含む画像であればよい。
図2(a)~(c)は、学習用画像D1の一例である。各画像内には多数の微粒子が含まれている。学習用画像D1の個数は特に限定されないが、機械学習が十分に実行可能な数であることが好ましい。
【0026】
また、教師データ生成装置2は、機能ブロックとして、取得部21と、境界データ生成部22と、ノイズ付与部23と、ラベリング部24とを備えている。本実施形態において、これらの各部は、教師データ生成装置2のプロセッサが教師データ生成プログラムを主記憶装置に読み出して実行することによってソフトウェア的に実現される。
【0027】
取得部21は、学習用画像D1を取得する機能ブロックである。本実施形態では、取得部21は、補助記憶装置20から学習用画像D1を読み出すことにより取得するが、外部との通信回線や記録媒体を介して学習用画像D1を取得してもよい。
【0028】
境界データ生成部22は、学習用画像D1内の領域の境界を示す境界データを生成する機能ブロックである。本実施形態では、境界データ生成部22は、図示しない入力装置を介したユーザの操作により、学習用画像D1内の各領域を白で表示し、それ以外の部分を黒で表示することにより、境界データを作成する。境界データは、学習用画像D1における領域の境界を示す正解データとなる。
【0029】
図3(a)~(c)はそれぞれ、
図2(a)~(c)に示す学習用画像D1から生成された境界データの一例である。
図3(a)に示す境界データでは、比較的輝度の高い表層部の微粒子によって画定される部分が白で表示され、それ以外の部分(領域の境界、表層部以外の微粒子)は黒で表示される。
図3(b)に示す境界データでは、矩形の粒子に該当する部分が白で表示され、それ以外の部分は黒で表示される。
図3(c)に示す境界データでは、一定以上の大きさの粒子に該当する部分が白で表示され、それ以外の部分は黒で表示される。なお、境界データの態様はこれに限定されず、例えば、領域の境界のみを線で表示し、その他の部分を白等で塗りつぶしたようなデータであってもよい。
【0030】
図1に示すノイズ付与部23は、学習用画像D1にノイズを付与する処理を行うことによりノイズ画像を生成する機能ブロックである。ノイズを付与する処理の詳細については、後述する。
【0031】
ラベリング部24は、ノイズ付与部23によってノイズを付与されたノイズ画像と、境界データ生成部22によって生成された境界データとを対応付けて教師データD2を生成する機能ブロックである。教師データD2は、補助記憶装置20に蓄積され、その後、学習データセットとして機械学習装置3に転送される。
【0032】
(機械学習)
機械学習装置3は、機械学習によって画像解析モデルMを生成する装置である。機械学習装置3は、汎用のコンピュータで構成することができ、教師データ生成装置2と同様に、CPUやGPUなどのプロセッサ、DRAMやSRAMなどの主記憶装置(図示省略)、および、HDDやSSDなどの補助記憶装置30を備えている。補助記憶装置30には、教師データ生成装置2から転送された教師データD2や、機械学習装置3を動作させるための各種プログラム等が格納されている。
【0033】
なお、本実施形態では、機械学習装置3はクラウド上に設けられているが、教師データ生成装置2と同じ場所に設置してもよいし、あるいは、教師データ生成装置2と機械学習装置3とを一体的に構成してもよい。
【0034】
機械学習装置3は、機能ブロックとして学習部31を備えている。学習部31は、教師データD2に基づいて機械学習を行うことにより、解析対象画像を入力した場合に、前記解析対象画像内の領域の境界を示すデータを出力する画像解析モデルMを生成する。学習法は特に限定されないが、例えば、ディープラーニング、サポートベクターマシン、ランダムフォレストなどを用いることができる。生成された画像解析モデルMは、補助記憶装置30に格納され、その後、画像解析のために用いられる。
【0035】
(画像解析)
図4は、本実施形態に係る画像解析装置4のブロック図である。画像解析装置4は、解析対象画像を解析する画像解析方法を実行するために用いられる装置であり、汎用のコンピュータで構成することができる。画像解析装置4は、ハードウェア構成として、CPUやGPUなどのプロセッサ、DRAMやSRAMなどの主記憶装置(図示省略)、および、HDDやSSDなどの補助記憶装置40を備えている。
【0036】
補助記憶装置40には、
図1に示す画像解析モデル生成システム1(本実施形態に係る画像解析モデル生成方法)によって生成された画像解析モデルMおよび解析対象画像D3の他、画像解析プログラムなどの画像解析装置4を動作させるための各種プログラムが格納されている。解析対象画像D3は、例えば画像解析の依頼者から画像解析装置4に送信されたものである。
【0037】
画像解析装置4は、機能ブロックとして、画像解析部41と、二値化処理部42とを備えている。本実施形態において、これらの各部は、画像解析装置4のプロセッサが画像解析プログラムを主記憶装置に読み出して実行することによってソフトウェア的に実現される。
【0038】
画像解析部41は、画像解析モデルMを用いて、解析対象画像D3内の領域の境界を判別する機能ブロックである。本実施形態では、画像解析部41は、補助記憶装置40から解析対象画像D3および画像解析モデルMを主記憶装置に読み出す。
図5は、解析対象画像D3の一例である。
【0039】
続いて、画像解析部41は、解析対象画像D3を画像解析モデルMに入力し、これに対して、画像解析モデルMは、解析対象画像D3内の領域の境界を示すデータを出力する。当該データは、
図3に示すような、領域に該当する部分が白で表示され、それ以外の部分が黒で表示された画像である。なお、当該データは白黒という色に限定されず、また画像ではなくバイナリデータであってもよい。画像解析部41は、画像解析モデルMの出力データを二値化処理部42に入力する。
【0040】
二値化処理部42は、画像解析部41が出力したデータに基づき、解析対象画像D3において、判別された境界によって区分される領域を認識し、認識した領域を着色やラベル付け、またはこれらを同時に表示することにより、二値化画像D4を生成する。二値化画像D4は、補助記憶装置40に格納され、その後、解析結果として画像解析の依頼者に送信される。
【0041】
また、画像解析部41の境界データは二値化のみならず、三値化やそれ以上の境界データであってもよく、二値化処理部42では、境界数に応じた着色やラベル付けが可能である。
【0042】
図6は、二値化画像D4の一例である。二値化画像D4では、認識された領域が着色されている。なお、画像解析装置4において、二値化処理部42は必須構成ではなく、画像解析モデルMの出力データ、すなわち、
図3に示す境界データと同様のデータを解析結果としてもよい。
【0043】
(ノイズ付与処理)
従来の方法では、教師データを生成する際に、学習用画像にノイズを付与することなく、境界データとラベリングしていた。そのため、例えば、学習した教師データに対して解析対象となる画像の画質にバラツキがある場合は、画像解析モデルによって解析対象画像内の領域を認識する精度が低いという問題があった。そこで、本実施形態では、二値化画像D4における領域の認識率を向上させるために、教師データ生成装置2において、ノイズ付与部23が学習用画像D1にノイズを付与している。
【0044】
以下、教師データ生成装置2のノイズ付与部23によるノイズ付与処理について説明する。本実施形態におけるノイズ付与処理は、ぼかし処理(Blur)、リサイズ処理(Risize)、クロップ処理(Crop)、ブライトネス処理(Brightness)、コントラスト処理(Contrast)、左右反転処理(Hflip)の6種類であるが、本発明ではこれらに限定されない。
【0045】
ぼかし処理は、学習用画像D1にぼかしフィルターをかけることにより、画像の解像度を低下させる処理である。リサイズ処理は、画像のサイズを縮小する処理である。クロップ処理は、画像の一部を切り取る処理である。ブライトネス処理は、画像の輝度を変更(低下または上昇)する処理である。コントラスト処理は、画像のコントラストを変更(低下または上昇)する処理である。左右反転処理は、画像の向きを左右反転させる処理である。ノイズ付与部23は、1つの学習用画像D1に対し、これらの処理の少なくともいずれかを行うことにより、ノイズ画像を生成する。
【0046】
図7は、ノイズ画像の一例である。このノイズ画像は、
図2(a)に示す学習用画像D1に対し、左右反転処理、ぼかし処理、コントラスト処理(コントラスト低下)、ブライトネス処理(ブライトネス上昇)、クロップ処理およびリサイズ処理をこの順で行うことにより生成されたものである。
【0047】
ノイズ画像はラベリング部24によって境界データと対応付けられることにより、教師データD2が生成され、機械学習装置3における学習により、画像解析モデルMが生成される。このようにして生成された画像解析モデルMは、ノイズが付与されたノイズ画像を用いて学習されたものであるため、学習した教師データに対して解析対象となる画像の画質にバラツキがある場合であっても、高精度で解析対象画像を解析することができる。
【0048】
なお、1つの学習用画像D1に対し、上記6種類のノイズ処理を全て行ってもよいが、単独のノイズまたは複数のノイズの組み合わせに係るノイズ処理を行ってもよい。例えば、後述する実施例に示すように、
・ぼかし処理のみ
・ブライトネス処理のみ
・ぼかし処理およびブライトネス処理のみ
・ぼかし処理、ブライトネス処理、リサイズ処理、およびコントラスト処理のみ
であっても、十分に高精度な画像解析モデルを生成することができる。
【0049】
また、各学習用画像D1に付与するノイズの強さをランダムに変化させるのが好ましい。すなわち、ノイズ付与部23は、付与するノイズの強さを学習用画像D1ごとにランダムに変化させてもよい。このようにして生成されたノイズ画像を用いて画像解析モデルMを学習されることにより、画質にバラツキのある解析対象画像に対しても、高精度に解析できる画像解析モデルを生成することができる。
【0050】
(処理手順)
以下、本実施形態に係る画像解析モデル生成方法の処理手順について、
図8に示すフローチャートを用いて説明する。画像解析モデル生成方法は、
図1に示す画像解析モデル生成システム1によって実行される。
【0051】
ステップS1(取得ステップ)では、教師データ生成装置2の取得部21が補助記憶装置20から学習用画像D1を取得する。続いて、ステップS2において、境界データ生成部22が学習用画像D1内の領域の境界を示す境界データを生成し、ステップS3(ノイズ付与ステップ)において、ノイズ付与部23が学習用画像D1にノイズを付与する処理を行うことによりノイズ画像を生成する。なお、ステップS2とステップS3の順序は特に限定されない。
【0052】
続いて、ステップS4(教師データ生成ステップ)において、ラベリング部24がノイズ画像と境界データとを対応付けて教師データD2を生成する。
【0053】
ステップS1~S4によって、1つの学習用画像D1から1つの教師データD2が生成される。全ての学習用画像D1が処理されるまでステップS1~S4を繰り返し(ステップS5においてYES)、その後、ステップS6(学習ステップ)に移行する。
【0054】
ステップS6では、機械学習装置3の学習部31が教師データD2に基づいて機械学習を行うことにより、画像解析モデルMを生成する。
【0055】
(付記事項)
以上、本発明の実施形態について説明したが、本発明は上記実施形態に限定されるものではなく、その趣旨を逸脱しない限りにおいて、種々の変更が可能である。例えば、上記実施形態では、ノイズ付与部23によるノイズ付与処理は、ぼかし処理などの6種類であったが、これらに限らず、直線ノイズ処理(画像内に任意の長さ、幅の直線を任意数与える処理)、ドロップ処理(画像の任意のサイズと数の部分を欠落させる処理)、回転処理(画像を任意角度回転させる処理)、色処理(画像の色を任意の範囲で変更する処理)などを含んでもよい。
【実施例0056】
本発明を詳細に説明するために以下に具体例を挙げるが、本発明はこれに限定されるものではない。
【0057】
(画像解析モデルの生成)
本実施例では、各モデルで共通する97枚の学習用画像に異なるノイズ処理(ぼかし処理、リサイズ処理、クロップ処理、ブライトネス処理、コントラスト処理および左右反転処理の少なくともいずれか)を施すことによりノイズ画像を生成し、あらかじめ用意した境界データと対応付けることにより教師データを生成し、さらに、当該教師データを用いて機械学習(ディープラーニング)を行い、15の画像解析モデルM1~M15を生成した。また、比較例として、ノイズ処理を施していない上記の学習用画像に境界データを対応付けることにより教師データを生成し、当該教師データを用いて機械学習(ディープラーニング)を行い、画像解析モデルM0を生成した。
【0058】
画像解析モデルM1~M15、M0の学習に用いた学習用画像D1に付与されたノイズの有無または強弱を、表1および表2に示す。
【0059】
【0060】
【0061】
上記各表において、リサイズ、クロップおよび左右反転の各ノイズについては、付与の有無(Yes/No)のみ示しており、リサイズ、クロップの各ノイズの強さは一定とした。リサイズ処理では、画像の縦横をいずれも0.5倍に縮小した。クロップ処理では、縦横0.5×0.5のサイズで切り取った。
【0062】
ぼかし、ブライトネスおよびコントラストの各ノイズは、モデル毎に強弱を変えて付与した。
【0063】
ぼかしの強さは、学習用画像に、ぼかしフィルターをかける回数によって制御した。「Low」は1回、「Middle」は2回を意味する。ぼかしフィルターには平均化フィルターを使用し、カーネル(平均化する際の値を取る範囲)は5×5であった。また、「Arbitrarily」は、学習用画像によってぼかしフィルターをかける回数を1~2回の範囲で任意に異ならせたことを意味する。
【0064】
ブライトネスについて、元の学習用画像を1とすると、「Low」は、0.8~1.2の範囲で、「Middle」は、0.5~1.5の範囲で、「High」は、0.3~1.7の範囲で、「Higher」は、0.1~2.0の範囲で、各画像ごとにブライトネスをランダムに変えることを意味する。
【0065】
コントラストについて、元の学習用画像を1とすると、「Middle」は、0.5~1.5の範囲で、「High」は、0.3~1.7の範囲で、「Higher」は、0.1~2.0の範囲で、画像ごとにコントラストをランダムに変えることを意味する。
【0066】
(画像解析)
続いて、
図9(a)~(j)に示す10の解析対象画像A~Jを画像解析モデルM1~M15、M0に入力し、各画像解析モデルからの出力データに対し二値化処理を行うことにより、二値化画像を生成した。
【0067】
図10~
図13に、画像解析モデルM1~M15およびM0が解析対象画像A~Jを解析したデータを二値化した二値化画像を示す。各二値化画像では、領域として認識された部分が着色されている。
【0068】
画像解析モデルM1~M15およびM0に対応する二値化画像における、領域の認識数を表3および表4に示す。
【0069】
【0070】
【0071】
さらに、画像解析モデルM1~M15の認識数の、画像解析モデルM0の認識数に対する比率を、表5および表6に示す。
【0072】
【0073】
【0074】
本実施例に係る画像解析モデルM1~M15はいずれも、比較例に係る画像解析モデルM0に比べ、認識数が向上する傾向にあった。よって、学習用画像へのノイズ処理によって、画像解析モデルの解析精度を向上させることができることが分かる。特に、画像解析モデルM11~14の結果から、ノイズ処理が、
・ぼかし処理のみ
・ブライトネス処理のみ
・ぼかし処理およびブライトネス処理のみ
・ぼかし処理、ブライトネス処理、リサイズ処理、およびコントラスト処理のみ
であっても、十分に高精度な画像解析モデルを生成することができることが分かる。
【0075】
また、画像解析モデルM1~M3を比較すると、ぼかしの強さは、LowまたはArbitrarilyが有効であり、画像解析モデルM4~M6を比較すると、ブライトネスはLowまたはHigherが有効であり、画像解析モデルM7~M9を比較すると、コントラストはNoまたはHigherが有効であることがわかる。
【0076】
また、汎化性能(画像の種類による解析の得手/不得手)については、画像解析モデルM1~M4、M6、M7、M9、M12~M15が高いと認められる。