IP Force 特許公報掲載プロジェクト 2022.1.31 β版

知財求人 - 知財ポータルサイト「IP Force」

▶ 株式会社島津製作所の特許一覧

特許6996633教師ラベル画像修正方法、学習済みモデルの作成方法および画像解析装置
(19)【発行国】日本国特許庁(JP)
(12)【公報種別】特許公報(B2)
(11)【特許番号】
(24)【登録日】2021-12-20
(45)【発行日】2022-01-17
(54)【発明の名称】教師ラベル画像修正方法、学習済みモデルの作成方法および画像解析装置
(51)【国際特許分類】
   G06T 7/00 20170101AFI20220107BHJP
【FI】
G06T7/00 350B
【請求項の数】 15
(21)【出願番号】P 2020535357
(86)(22)【出願日】2018-08-06
(86)【国際出願番号】 JP2018029473
(87)【国際公開番号】W WO2020031243
(87)【国際公開日】2020-02-13
【審査請求日】2021-01-18
(73)【特許権者】
【識別番号】000001993
【氏名又は名称】株式会社島津製作所
(74)【代理人】
【識別番号】100104433
【弁理士】
【氏名又は名称】宮園 博一
(74)【代理人】
【識別番号】100155608
【弁理士】
【氏名又は名称】大日方 崇
(72)【発明者】
【氏名】▲高▼橋 渉
(72)【発明者】
【氏名】赤澤 礼子
(72)【発明者】
【氏名】押川 翔太
【審査官】川▲崎▼ 博章
(56)【参考文献】
【文献】特開2015-129988(JP,A)
【文献】特開2014-215852(JP,A)
【文献】特開2018-81569(JP,A)
(58)【調査した分野】(Int.Cl.,DB名)
G06T 7/00
(57)【特許請求の範囲】
【請求項1】
画像のセグメンテーション処理を行う機械学習における教師ラベル画像の修正方法であって、
入力画像と教師ラベル画像とを含む学習データの前記入力画像に対して、前記学習データを用いた学習済みモデルによりセグメンテーション処理を行って、複数のラベル領域に分割された判定用ラベル画像を作成するステップと、
作成された前記判定用ラベル画像と前記教師ラベル画像とについて、画像中の対応する部分同士のラベルを比較するステップと、
ラベルの比較結果に基づいて、前記教師ラベル画像に含まれる前記ラベル領域を修正するステップとを含む、
教師ラベル画像修正方法。
【請求項2】
前記ラベル領域を修正するステップにおいて、ラベルの比較結果に基づいて、前記教師ラベル画像中の前記ラベル領域の範囲を、前記判定用ラベル画像の前記ラベル領域に近づけるように修正する、請求項1に記載の教師ラベル画像修正方法。
【請求項3】
前記ラベル領域を修正するステップにおいて、前記ラベル領域の修正は、前記教師ラベル画像中の前記ラベル領域の膨張および収縮の少なくとも一方により行う、請求項2に記載の教師ラベル画像修正方法。
【請求項4】
前記ラベルを比較するステップにおいて、前記判定用ラベル画像と前記教師ラベル画像との比較により、着目するラベルについて、前記判定用ラベル画像における前記教師ラベル画像との一致部分および不一致部分を取得し、
前記ラベル領域を修正するステップにおいて、前記一致部分および前記不一致部分に基づいて、着目するラベルが付された前記ラベル領域の範囲を修正する、請求項1~3のいずれか1項に記載の教師ラベル画像修正方法。
【請求項5】
前記ラベルを比較するステップにおいて、前記一致部分および前記不一致部分に基づいて、前記判定用ラベル画像においてラベルの未検出を評価する未検出評価値およびラベルの誤検出を評価する誤検出評価値をそれぞれ取得し、
前記ラベル領域を修正するステップにおいて、前記未検出評価値および前記誤検出評価値の比較に基づいて前記教師ラベル画像の前記ラベル領域を修正する、請求項4に記載の教師ラベル画像修正方法。
【請求項6】
前記未検出評価値および前記誤検出評価値の比較により、前記判定用ラベル画像におけるラベルの未検出に比べて誤検出が多いと判断された場合、前記ラベル領域を修正するステップにおいて、前記教師ラベル画像の前記ラベル領域を膨張する、請求項5に記載の教師ラベル画像修正方法。
【請求項7】
前記未検出評価値および前記誤検出評価値の比較により、前記判定用ラベル画像におけるラベルの誤検出に比べて未検出が多いと判断された場合、前記ラベル領域を修正するステップにおいて、前記教師ラベル画像の前記ラベル領域を収縮する、請求項5または6に記載の教師ラベル画像修正方法。
【請求項8】
未検出および誤検出の少なくとも一方が所定の閾値よりも多いと判断された前記教師ラベル画像を含む前記学習データを、学習用データセットから除外するステップをさらに含む、請求項5~7のいずれか1項に記載の教師ラベル画像修正方法。
【請求項9】
前記教師ラベル画像のラベル間に優先度を設定するステップをさらに含み、
前記ラベル領域を修正するステップにおいて、前記優先度に応じて、前記ラベル領域の修正量を調整する、請求項1~8のいずれか1項に記載の教師ラベル画像修正方法。
【請求項10】
前記ラベル領域を修正するステップにおいて、前記教師ラベル画像の前記ラベル領域を修正する際に、前記優先度の高い前記ラベル領域への、前記優先度の低い前記ラベル領域の膨張を禁止する、請求項9に記載の教師ラベル画像修正方法。
【請求項11】
前記ラベル領域を修正するステップにおいて、前記教師ラベル画像を複数の部分画像に分割し、分割された前記教師ラベル画像の少なくとも1つの前記部分画像について前記ラベル領域を修正する、請求項1~10のいずれか1項に記載の教師ラベル画像修正方法。
【請求項12】
前記ラベルを比較するステップにおいて、前記判定用ラベル画像と前記教師ラベル画像との対応する部分同士のラベルの比較を、画像中の1画素毎または近傍の複数画素毎に行う、請求項1~11のいずれか1項に記載の教師ラベル画像修正方法。
【請求項13】
修正された前記教師ラベル画像を含む前記学習データを用いた学習済みモデルにより、前記判定用ラベル画像を作成するステップをさらに含み、
前記ラベル領域を修正するステップにおいて、作成された前記判定用ラベル画像と前記修正された教師ラベル画像との比較結果に基づいて、前記修正された教師ラベル画像に含まれる前記ラベル領域を再修正する、請求項1~11のいずれか1項に記載の教師ラベル画像修正方法。
【請求項14】
画像のセグメンテーション処理を行う機械学習による学習済みモデルの作成方法であって、
入力画像と教師ラベル画像とを含む学習データを用いた機械学習による事前学習済みモデルを取得するステップと、
取得した前記事前学習済みモデルにより、前記学習データの前記入力画像に対してセグメンテーション処理を行って、複数のラベル領域に分割された判定用ラベル画像を作成するステップと、
作成された前記判定用ラベル画像と前記教師ラベル画像とについて、画像中の対応する部分同士のラベルを比較するステップと、
ラベルの比較結果に基づいて、前記教師ラベル画像に含まれる前記ラベル領域を修正するステップと、
修正された前記教師ラベル画像を含む前記学習データを用いて機械学習を行うことにより、学習済みモデルを作成するステップと、を含む、学習済みモデルの作成方法。
【請求項15】
解析用画像の入力を受け付ける画像入力部と、
機械学習による学習済みモデルを用いて、前記解析用画像のセグメンテーション処理を行って、複数のラベル領域に分割されたラベル画像を作成する解析処理部と、
前記学習済みモデルを記憶する記憶部と、
前記記憶部に記憶された前記学習済みモデルを事前学習済みモデルとして、入力画像と教師ラベル画像とを含む学習データの前記入力画像に対してセグメンテーション処理を行うことにより、判定用ラベル画像を作成する判定用画像作成部と、
前記判定用画像作成部により作成された前記判定用ラベル画像と前記教師ラベル画像とについて、画像中の対応する部分同士のラベルを比較する比較部と、
前記比較部によるラベルの比較結果に基づいて、前記教師ラベル画像に含まれる前記ラベル領域を修正するラベル修正部と、を備える、画像解析装置。
【発明の詳細な説明】
【技術分野】
【0001】
本発明は、教師ラベル画像修正方法、学習済みモデルの作成方法および画像解析装置に関する。
【背景技術】
【0002】
従来、機械学習において教師ラベル画像を修正することが知られている。このような教師ラベル画像の修正は、たとえば、特開2014-22837号公報に開示されている。
【0003】
上記特開2014-22837号公報には、テレビ番組などの映像データ中のある映像区間に、検出対象が出現している(正例である)か出現していない(負例である)かを示すラベルを付与する画像分類を行うための識別器(学習済みモデル)を、機械学習によって構築することが開示されている。識別器の構築には、映像と、正例であるか負例であるかのラベルとを含む学習データが用いられる。学習データのラベルには、誤りや漏れが含まれる可能性がある。そこで、上記特開2014-22837号公報には、初期の学習データ、あるいは、ラベルが設定された学習データに対して、ユーザ入力または他の識別器による学習データの検出結果に基づいて、学習データのラベルを修正することが開示されている。
【先行技術文献】
【特許文献】
【0004】
【文献】特開2014-22837号公報
【発明の概要】
【発明が解決しようとする課題】
【0005】
上記特開2014-22837号公報に開示された識別器は、入力された映像を単純に分類して映像単位でラベルを付するものであるが、そのような画像分類とは別の技術として、画像セグメンテーションがある。画像セグメンテーションは、画像全体ではなく、画像を複数の領域に分割する技術であって、検出対象が写る領域にその検出対象を示すラベルを付与することにより、入力画像を複数のラベル領域に分割するものである。なお、本明細書で言う「画像セグメンテーション」は、エッジ検出などのラベルを付さない単なる領域分割(境界検出)と異なり、ラベルによって領域に意味づけをすることから、セマンティックセグメンテーションと呼ばれる。
【0006】
画像セグメンテーションに用いる学習済みモデルを構築するための機械学習(教師あり学習)には、入力画像と、入力画像をラベル毎に領域分割した教師ラベル画像とが用いられる。この場合の教師ラベル画像は、元の画像に対して閾値処理などによってラベル領域を抽出することにより作成される。個々の入力画像には検出対象の写り具合(信号強度など)のばらつきがあるため、教師ラベル画像の作成は、多数のラベル作成者によって分担され、各ラベル作成者が手動で閾値調整をすることによって行われる。
【0007】
その結果、教師ラベル画像の作成には、閾値設定などに個人差が含まれることになり、あるラベル領域が大きめに抽出される、または小さめに抽出されることが起こる。また、画像によってはラベル領域の境界となる部分がそもそも曖昧なケースもあり、その場合にはラベル領域の境界がばらつきやすい。このため、教師ラベル画像の境界を修正する作業が行われる。
【0008】
しかしながら、上記特開2014-22837号公報のような画像単位の単純なラベル修正とは異なり、教師ラベル画像中のラベル領域の境界のばらつきを修正するには、全ての教師ラベル画像に対して一貫した基準でラベル領域の修正を行うことが望まれるため、たとえば特定の作業者のみにより修正作業を行うなど多大な労力がかかる。また、教師ラベル画像の修正のための専用の学習済みモデルを作成することも考えられるが、そのためには一貫した基準で作成された高精度な教師ラベル画像を学習させる必要があるため、多大な労力が必要となる点で同様である。そこで、画像セグメンテーション処理の機械学習に用いる教師ラベル画像の修正作業を、精度を確保しつつ簡易に行えるようにすることが望まれている。
【0009】
この発明は、上記のような課題を解決するためになされたものであり、この発明の1つの目的は、画像セグメンテーション処理の機械学習に用いる教師ラベル画像の修正作業を、精度を確保しつつ簡易化することが可能な教師ラベル画像修正方法、学習済みモデルの作成方法および画像解析装置を提供することである。
【課題を解決するための手段】
【0010】
上記目的を達成するために、本願発明者らが鋭意検討した結果、ラベル領域の境界にばらつきを含んだ教師ラベル画像であっても、それらの教師ラベル画像を用いて十分な機械学習を行った学習済みモデルでは、多数の教師ラベル画像の境界のばらつきを統計的に平均したような中間的なセグメンテーション結果が得られるため、学習済みモデルによるセグメンテーション結果が教師ラベル画像の境界のばらつきの一貫した基準となりうることを見出した。この知見に基づき、この発明の第1の局面における教師ラベル画像修正方法は、画像のセグメンテーション処理を行うための機械学習における教師ラベル画像の修正方法であって、入力画像と教師ラベル画像とを含む学習データの入力画像に対して、学習データを用いた学習済みモデルによりセグメンテーション処理を行って、複数のラベル領域に分割された判定用ラベル画像を作成するステップと、作成された判定用ラベル画像と教師ラベル画像とについて、画像中の対応する部分同士のラベルを比較するステップと、ラベルの比較結果に基づいて、教師ラベル画像に含まれるラベル領域を修正するステップとを含む。
【0011】
この発明の第1の局面における教師ラベル画像修正方法では、上記のように構成することによって、ラベル領域の境界にばらつきを含んだ教師ラベル画像を含む学習データを用いて学習した学習済みモデルにより作成した判定用ラベル画像と教師ラベル画像との比較に基づいて、教師ラベル画像を修正することができる。すなわち、本来は教師ラベル画像のラベル領域が正しいという前提で機械学習を行い学習済みモデルが作成されるが、十分な学習を経た学習済みモデルを用いたセグメンテーション結果(判定用ラベル画像)では、ラベル領域の境界部分に関して、多数の教師ラベル画像の境界のばらつきの中間的な結果となることから、ばらつきを含んだ個々の教師ラベル画像に対しては判定用ラベル画像の方が境界の妥当性が高いと見なしうる。そのため、判定用ラベル画像を基準に、判定用ラベル画像と教師ラベル画像との比較結果に基づいて教師ラベル画像のラベル領域の修正を行うことによって、ラベル修正作業者ではなく、コンピュータを用いた自動的な修正作業でも一貫した基準(判定用ラベル画像のラベル領域の境界)に基づいて境界のばらつきを低減することができる。これにより、画像セグメンテーション処理の機械学習に用いる教師ラベル画像の修正作業を、精度を確保しつつ簡易化することができる。
【0012】
上記第1の局面における教師ラベル画像修正方法では、ラベル領域を修正するステップにおいて、ラベルの比較結果に基づいて、教師ラベル画像中のラベル領域の範囲を、判定用ラベル画像のラベル領域に近づけるように修正してもよい。このように構成すれば、教師ラベル画像中のラベル領域の範囲を、たとえば判定用ラベル画像のラベル領域に一致させ、または判定用ラベル画像のラベル領域との間の中間的な範囲とするだけで、容易かつ効果的に、個々の教師ラベル画像のラベル領域のばらつきを小さくする修正ができる。
【0013】
この場合、ラベル領域を修正するステップにおいて、ラベル領域の修正は、教師ラベル画像中のラベル領域の膨張および収縮の少なくとも一方により行ってもよい。このように構成すれば、ラベルの比較結果に基づいて、教師ラベル画像中のラベル領域の範囲を膨張させたり収縮させたりするだけの簡易な処理で、教師ラベル画像のラベル領域の修正が行える。なお、ラベル領域の膨張とは、ラベル領域の面積を大きくすることであり、ラベル領域の収縮とは、ラベル領域の面積を小さくすることである。
【0014】
上記第1の局面における教師ラベル画像修正方法では、ラベルを比較するステップにおいて、判定用ラベル画像と教師ラベル画像との比較により、着目するラベルについて、判定用ラベル画像における教師ラベル画像との一致部分および不一致部分を取得し、ラベル領域を修正するステップにおいて、一致部分および不一致部分に基づいて、着目するラベルが付されたラベル領域の範囲を修正してもよい。このように構成すれば、判定用ラベル画像と教師ラベル画像との一致部分および不一致部分から、教師ラベル画像のラベル領域が、多数の教師ラベル画像の境界のばらつきの基準となる判定用ラベル画像からどのように乖離しているかが把握できる。そのため、一致部分および不一致部分に基づくことにより、容易に、境界のばらつきが小さくなるようにラベル領域を修正することができる。
【0015】
この場合、ラベルを比較するステップにおいて、一致部分および不一致部分に基づいて、判定用ラベル画像においてラベルの未検出を評価する未検出評価値およびラベルの誤検出を評価する誤検出評価値をそれぞれ取得し、ラベル領域を修正するステップにおいて、未検出評価値および誤検出評価値の比較に基づいて教師ラベル画像のラベル領域を修正してもよい。ここで、未検出は、着目するラベルについて、教師ラベル画像では当該ラベルが付与された部分を、判定用ラベル画像では当該ラベル領域として検出しなかったことを意味し、未検出となる領域が多い場合、教師ラベル画像のラベル領域が判定用ラベル画像のラベル領域よりも大きいと推定される。また、誤検出は、判定用ラベル画像において着目するラベル領域であると検出されたが、教師ラベル画像では異なったラベルが付与されていることを意味し、誤検出となる領域が多い場合、教師ラベル画像のラベル領域が判定用ラベル画像のラベル領域よりも小さいと推定される。そのため、未検出評価値および誤検出評価値の比較に基づくことによって、教師ラベル画像のラベル領域をどのように修正すればよいか(大きくすればよいか小さくすればよいか)を把握できるので、より適切に、個々の教師ラベル画像のラベル領域を修正することができる。
【0016】
上記未検出評価値および誤検出評価値を取得する構成において、未検出評価値および誤検出評価値の比較により、判定用ラベル画像におけるラベルの未検出に比べて誤検出が多いと判断された場合、ラベル領域を修正するステップにおいて、教師ラベル画像のラベル領域を膨張してもよい。このように構成すれば、誤検出となる領域が多く、教師ラベル画像のラベル領域が基準となる判定用ラベル画像のラベル領域よりも小さいと推定される場合に、教師ラベル画像のラベル領域を膨張することにより、容易に、ラベル領域の境界のばらつきを小さくする修正が行える。
【0017】
上記未検出評価値および誤検出評価値を取得する構成において、未検出評価値および誤検出評価値の比較により、判定用ラベル画像におけるラベルの誤検出に比べて未検出が多いと判断された場合、ラベル領域を修正するステップにおいて、教師ラベル画像のラベル領域を収縮してもよい。このように構成すれば、未検出となる領域が多く、教師ラベル画像のラベル領域が基準となる判定用ラベル画像のラベル領域よりも大きいと推定される場合に、教師ラベル画像のラベル領域を収縮することにより、容易に、ラベル領域の境界のばらつきを小さくする修正が行える。
【0018】
上記未検出評価値および誤検出評価値を取得する構成において、未検出および誤検出の少なくとも一方が所定の閾値よりも多いと判断された教師ラベル画像を含む学習データを、学習用データセットから除外するステップをさらに含んでもよい。このように構成すれば、基準となる判定用ラベル画像との比較において未検出および誤検出の少なくとも一方が過度に多い場合、その教師ラベル画像は学習データとして不適切であると考えられる。そこで、未検出および誤検出の少なくとも一方が多くなる教師ラベル画像を学習用データセットから除外することにより、機械学習の精度を低下させる要因となる、統計上のいわゆる外れ値に相当するような学習データを除外できるので、学習用データセットの品質を向上させて高精度な機械学習を行うことができる。
【0019】
上記第1の局面における教師ラベル画像修正方法において、教師ラベル画像のラベル間に優先度を設定するステップをさらに含み、ラベル領域を修正するステップにおいて、優先度に応じて、ラベル領域の修正量を調整してもよい。ここで、セグメンテーション処理は、画像中で検出対象が写る領域を区別してラベリングするものであるから、ラベルには、検出対象(優先度:高)と検出対象以外(優先度:低)を区別するなど、処理の目的に応じて異なる優先度が設定されうる。そこで、上記のように構成すれば、たとえば優先度の高いラベルは極力検出漏れを抑制できるように修正量を意図的に偏らせることができる。その結果、セグメンテーション処理の目的に応じて教師ラベル画像の修正を適切に行うことができる。
【0020】
この場合、ラベル領域を修正するステップにおいて、教師ラベル画像のラベル領域を修正する際に、優先度の高いラベル領域への、優先度の低いラベル領域の膨張を禁止してもよい。このように構成すれば、優先度の低いラベル領域を膨張させる修正をしても優先度の高いラベル領域を保存できるので、境界のばらつきを抑制しつつ、優先度の高いラベル領域の検出漏れを抑制した学習が可能な教師ラベル画像(学習データ)を得ることができる。
【0021】
上記第1の局面における教師ラベル画像修正方法では、ラベル領域を修正するステップにおいて、教師ラベル画像を複数の部分画像に分割し、分割された教師ラベル画像の少なくとも1つの部分画像についてラベル領域を修正してもよい。このように構成すれば、教師ラベル画像の特定の一部分のみを修正したり、小部分ごとに個別に修正することができる。
【0022】
上記第1の局面における教師ラベル画像修正方法では、ラベルを比較するステップにおいて、判定用ラベル画像と教師ラベル画像との対応する部分同士のラベルの比較を、画像中の1画素毎または近傍の複数画素毎に行ってもよい。このように構成すれば、判定用ラベル画像と教師ラベル画像とを、1画素単位または複数画素単位の小領域毎に比較することができるので、より精密に、教師ラベル画像のラベル領域のばらつきを評価することができる。
【0023】
上記第1の局面における教師ラベル画像修正方法では、修正された教師ラベル画像を含む学習データを用いた学習済みモデルにより、判定用ラベル画像を作成するステップをさらに含み、ラベル領域を修正するステップにおいて、作成された判定用ラベル画像と修正された教師ラベル画像との比較結果に基づいて、修正された教師ラベル画像に含まれるラベル領域を再修正してもよい。このように構成すれば、修正された教師ラベル画像を用いて機械学習を行った上で、再度判定用ラベル画像を作成することにより、教師ラベル画像のラベル領域の修正を繰り返し行うことができる。ラベル領域の修正を繰り返し行うことによって、教師ラベル画像のラベル領域のばらつきを、さらに小さく収束させることができる。
【0024】
この発明の第2の局面における学習済みモデルの作成方法は、画像のセグメンテーション処理を行うための機械学習による学習済みモデルの作成方法であって、入力画像と教師ラベル画像とを含む学習データを用いた機械学習による事前学習済みモデルを取得するステップと、取得した事前学習済みモデルにより、学習データの入力画像に対してセグメンテーション処理を行って、複数のラベル領域に分割された判定用ラベル画像を作成するステップと、作成された判定用ラベル画像と教師ラベル画像とについて、画像中の対応する部分同士のラベルを比較するステップと、ラベルの比較結果に基づいて、教師ラベル画像に含まれるラベル領域を修正するステップと、修正された教師ラベル画像を含む学習データを用いて機械学習を行うことにより、学習済みモデルを作成するステップと、を含む。なお、学習済みモデルを作成するステップは、(1)事前学習済みモデルに対して、修正された教師ラベル画像を含む学習データを用いて機械学習(追加学習)を行うことにより、学習済みモデルを作成すること、および、(2)未学習の学習モデルに対して、修正された教師ラベル画像を含む学習データを用いて機械学習を行うことにより、学習済みモデルを作成すること、の両方を含みうる。
【0025】
この発明の第2の局面による学習済みモデルの作成方法では、上記第1の局面と同様に、判定用ラベル画像を基準に、判定用ラベル画像と教師ラベル画像との比較結果に基づいて教師ラベル画像のラベル領域の修正を行うことによって、コンピュータを用いた自動的な修正作業でも一貫した基準(判定用ラベル画像のラベル領域の境界)に基づいて境界のばらつきを低減することができるので、画像セグメンテーション処理の機械学習に用いる教師ラベル画像の修正作業を、精度を確保しつつ簡易化することができる。そして、修正された教師ラベル画像を含む学習データを用いて事前学習済みモデルに対する機械学習を行うことにより、ラベル領域の境界部分の判定ばらつきが抑制された高品質なセグメンテーション処理が可能な学習済みモデルを得ることができる。
【0026】
この発明の第3の局面における画像解析装置は、解析用画像の入力を受け付ける画像入力部と、機械学習による学習済みモデルを用いて、解析用画像のセグメンテーション処理を行って、複数のラベル領域に分割されたラベル画像を作成する解析処理部と、学習済みモデルを記憶する記憶部と、記憶部に記憶された学習済みモデルを事前学習済みモデルとして、入力画像と教師ラベル画像とを含む学習データの入力画像に対してセグメンテーション処理を行うことにより、判定用ラベル画像を作成する判定用画像作成部と、判定用画像作成部により作成された判定用ラベル画像と教師ラベル画像とについて、画像中の対応する部分同士のラベルを比較する比較部と、比較部によるラベルの比較結果に基づいて、教師ラベル画像に含まれるラベル領域を修正するラベル修正部と、を備える。
【0027】
この発明の第3の局面による画像解析装置では、上記第1の局面と同様に、事前学習済みモデルにより作成した判定用ラベル画像を基準に、判定用ラベル画像と教師ラベル画像との比較結果に基づいて教師ラベル画像のラベル領域の修正を行うことによって、コンピュータを用いた自動的な修正作業でも一貫した基準(判定用ラベル画像のラベル領域の境界)に基づいて境界のばらつきを低減することができる。これにより、画像セグメンテーション処理の機械学習に用いる教師ラベル画像の修正作業を、精度を確保しつつ簡易化することができる。
【発明の効果】
【0028】
本発明によれば、上記のように、画像セグメンテーション処理の機械学習に用いる教師ラベル画像の修正作業を、精度を確保しつつ簡易化することができる。
【図面の簡単な説明】
【0029】
図1】第1実施形態による教師ラベル画像修正方法を説明するための図である。
図2】機械学習およびセグメンテーション処理の概要を示した図である。
図3】骨部のX線画像および2クラスのラベル画像の一例を示した図である。
図4】細胞画像および3クラスのラベル画像の一例を示した図である。
図5】教師ラベル画像を説明するための図である。
図6】学習回数の増大に伴う損失関数の変化を説明するためのグラフである。
図7】入力画像、判定用画像および教師ラベル画像の一例を示した図である。
図8】教師ラベル画像のラベル領域の境界のばらつきを説明するための図である。
図9】教師ラベル画像のラベル領域の修正を説明するための図である。
図10】教師ラベル画像のラベル領域の修正方法を説明するためのフロー図である。
図11】判定用画像および教師ラベル画像の比較方法を説明するための図である。
図12】教師ラベル画像のラベル領域を収縮させる例を示した模式図である。
図13】教師ラベル画像のラベル領域を膨張させる例を示した模式図である。
図14】学習済みモデルの作成方法を説明するためのフロー図である。
図15】学習データ処理部を説明するためのブロック図である。
図16】画像解析装置の第1の例を示したブロック図である。
図17】画像解析装置の画像解析処理を説明するためのフロー図である。
図18】画像解析装置の第2の例を示したブロック図である。
図19】第2実施形態におけるラベルの優先度を説明するための図である。
図20】ラベルの優先度に応じたラベル領域の修正量の調整を説明する図である。
図21】ラベル領域の修正を部分画像ごとに行う変形例を示した図である。
図22】教師ラベル画像の修正および学習済みデータの作成をサーバ側で実施する変形例を示した模式図である。
図23】教師ラベル画像の修正を画像解析装置側で行い、学習済みデータの作成をサーバ側で実施する変形例を示した模式図である。
【発明を実施するための形態】
【0030】
以下、本発明を具体化した実施形態を図面に基づいて説明する。
【0031】
図1図13を参照して、第1実施形態による教師ラベル画像修正方法、学習済みモデルの作成方法、画像解析装置について説明する。
【0032】
図1に示す第1実施形態による教師ラベル画像修正方法は、画像のセグメンテーション処理を行うための機械学習における教師ラベル画像の修正方法である。以下、セグメンテーション処理を行うことを、「領域分割する」と言い換える場合がある。
【0033】
図2に示すように、画像のセグメンテーション処理は、機械学習によって作成された学習済みモデル2によって実施される。
【0034】
学習済みモデル2は、入力された画像(解析用画像15、入力画像11)に対して、セグメンテーション処理を行い、複数のラベル領域13(図3図4参照)に分割したラベル画像(ラベル画像16、判定用ラベル画像14)を出力する。機械学習法として、全層畳み込みニューラルネットワーク(FullyConvolutionalNetworks;FCN)、ニューラルネットワーク、サポートベクターマシン(SVM)、ブースティング等の任意の手法を用いることができる。第1実施形態の学習済みモデル2には、ラベル領域の識別性能の点から、好ましくは、セマンティックセグメンテーションに頻用される畳み込みニューラルネットワーク、より好ましくは、全層畳み込みニューラルネットワークを用いるとよい。そのような学習済みモデル2は、画像が入力される入力層、畳み込み層、出力層を含んで構成される。
【0035】
画像のセグメンテーション処理を行う学習済みモデルを作成するためには、多数の学習データ10を含んだ学習用データセット1(図1参照)を用いた機械学習が行われる。
【0036】
機械学習に用いる学習データ10は、少なくとも、入力画像11と教師ラベル画像12とを含む。入力画像11は、セグメンテーション処理が行われる前の元画像である。教師ラベル画像12は、入力画像11に対するセグメンテーション処理の結果として生成されるべき正解の画像として作成される。つまり、教師ラベル画像12は、入力画像11を複数のラベル領域13に分割したラベル画像である。ラベル領域13とは、画像中で共通のラベルが付与された画素群によって構成される領域(画像の一部分)である。
【0037】
ラベルは、ラベル領域13を構成する画像部分が示す意味を表す情報である。セグメンテーションは、画像中の1画素毎にラベルを付与することにより行われる。ラベルは、複数画素のまとまり(画素群)を単位として付与されてもよい。ラベルの種類のことを、クラスという。
【0038】
クラスの数(ラベルの種類)は、複数(2以上)であれば特に限定されない。最も簡単な例では、クラスは、「検出対象」のラベルと「検出対象以外」のラベルとの2クラスで構成される。たとえば図3では、ヒトの骨盤部(大腿骨の付け根)のX線画像を入力画像11として、検出対象としての「骨部」のラベル領域13aと「骨部以外」のラベル領域13bとに領域分割した例を示す。
【0039】
図4では、iPS細胞やES細胞などの多能性幹細胞の画像(細胞画像)を入力画像11として、3クラスに領域分割する例を示す。図4では、多能性を維持した細胞である「未分化細胞」のラベル領域13c、未分化状態を逸脱した細胞(分化が開始した細胞または分化しそうな細胞)である「未分化逸脱細胞」のラベル領域13dと、それら以外の「背景」のラベル領域13eとの3クラスに領域分割がされている。
【0040】
学習済みモデルを作成する際、学習モデルに入力画像11を入力とし、教師ラベル画像12を出力として、入力画像11から正解である教師ラベル画像12への変換処理(セグメンテーション処理)を学習させる。機械学習を行うことにより、セグメンテーション処理が可能な学習済みモデル2が生成される。その結果、解析の対象となる解析用画像15を学習済みモデル2に入力することにより、機械学習による学習済みモデル2を用いて、解析用画像15のセグメンテーション処理を行って、複数のラベル領域13に分割されたラベル画像を出力することができる。
【0041】
〈教師ラベル画像〉
図5では、図4に示した多能性幹細胞の入力画像11に対する、3クラスに領域分割した教師ラベル画像12を作成する例を示す。図5の例では、多能性幹細胞について、染色剤により細胞領域を染色した細胞膜染色画像91と、未分化細胞の核染色領域を未分化マーカーにより染色した核染色画像92とを取得し、細胞膜染色画像91と核染色画像92とをそれぞれ閾値処理により2値化した上で両画像の差分を取得することにより、教師ラベル画像12を作成している。
【0042】
このような教師ラベル画像12では、細胞の染色画像を元に教師ラベル画像12が作成されるため、染色具合のばらつきが不可避的に存在する。そのため、染色具合に応じた閾値の手動調整が必要となり、閾値の設定によっては、細胞の境界部分が、他の教師ラベル画像12に対して相対的に大きめあるいは小さめになってばらつく。また、細胞膜染色画像91では核以外の細胞骨格も含んで染色されるのに対して、核染色画像92では核の部分のみが染色されるため、未分化逸脱細胞と未分化細胞とで、そもそも染色される領域が僅かに異なることがあり、このような差異が教師ラベル画像12におけるラベル領域13の境界(大きさ)のばらつきの原因にもなりうる。図3に示した骨部のX線画像では、染色法の相違に起因する染色領域の差異は生じないが、閾値処理に伴う境界部分のばらつきは、細胞画像の例と同様に発生する。
【0043】
個々の教師ラベル画像12におけるラベル領域13の境界がばらつく場合、画像中のどの部分を境界として定めるかという基準がばらつくことになる。そのため、ラベル領域13の境界がばらついた教師ラベル画像12を含んだ学習用データセット1を用いて学習を行った学習済みモデル2では、生成されるラベル画像16(図2参照)において、ラベル領域13の境界がぼけたり、不自然な形状になるおそれがある。
【0044】
そこで、第1実施形態では、図1に示したように、ラベル領域13の境界がばらついた教師ラベル画像12を含む学習データ10を用いて学習された学習済みモデル2(以下、事前学習済みモデル2aという)を用いて、教師ラベル画像12のラベル領域13の修正を行う。
【0045】
(教師ラベル画像の修正方法)
具体的には、第1実施形態の教師ラベル画像の修正方法は、図1に示すように、下記のステップを含む。
(1)入力画像11と教師ラベル画像12とを含む学習データ10の入力画像11に対して、学習データ10を用いた学習済みモデル2によりセグメンテーション処理を行って、複数のラベル領域13に分割された判定用ラベル画像14を作成するステップ
(2)作成された判定用ラベル画像14と教師ラベル画像12とについて、画像中の対応する部分同士のラベルを比較するステップ
(3)ラベルの比較結果に基づいて、教師ラベル画像12に含まれるラベル領域13を修正するステップ
【0046】
なお、第1実施形態において、判定用ラベル画像14を生成する事前学習済みモデル2aは、ラベル領域13の境界がばらついた教師ラベル画像12を含む学習データ10を用いて学習された学習済みモデルである。
【0047】
〈学習済みモデル、事前学習済みモデル〉
判定用ラベル画像14を生成する学習済みモデル2(事前学習済みモデル2a)としては、十分な点数の学習データ10を含む学習用データセット1を用いて学習され、かつ、学習が適切に収束している学習済みモデルが用いられる。すなわち、事前学習済みモデル2aは、機械学習自体は適切に行われ、ラベル領域13の境界を除いて十分な精度でセグメンテーション処理が行えるように構成されている。機械学習の分野において、事前学習済みモデル2aの精度は、個々の入力画像11に対するセグメンテーションの結果(ここでは、判定用ラベル画像14)と、その入力画像11の教師ラベル画像12との誤差(損失関数)を求めることにより評価することができる。図6に示すように、十分な点数の学習用データセット1で、学習が適切に行われる場合、学習済みモデルでは、学習回数とともに損失関数の値が低下し、ラベル領域13の境界のばらつきも含む不可避的に存在する各種の要因に起因した限界に相当する値で収束する。図6のグラフは、縦軸が損失関数を対数表示し、横軸が学習の反復回数を示したものである。
【0048】
また、教師ラベル画像12は、事前学習済みモデル2aの学習を適切に収束させることが可能な程度に一貫した基準に従って作成された教師ラベル画像である。つまり、学習用データセット1が含む多数の教師ラベル画像12は、ラベル領域13の境界においては上記の閾値処理等の要因によってばらつきが存在するものの、学習を適切に収束させることが可能な程度に統計的な偏りが小さいものである。なお、図3に示した骨盤部の画像や図4に示した細胞画像から分かるように、ラベル領域13の全体に占める境界の部分の割合はごく僅かであり、境界のばらつきは学習を収束させる障害にはならない。
【0049】
〈教師ラベル画像の修正方法の詳細〉
判定用ラベル画像14を作成するステップでは、事前学習済みモデル2aに入力画像11を入力し、セグメンテーション処理を行うことにより、出力として判定用ラベル画像14が作成される。図7に示すように、判定用ラベル画像14は、教師ラベル画像12と同様に、入力画像11を複数のラベル領域13によって領域分割した画像となる。
【0050】
判定用ラベル画像14と教師ラベル画像12とのラベルを比較するステップでは、判定用ラベル画像14と教師ラベル画像12とについて、画像中の対応する部分同士のラベルが比較される。対応する部分は、判定用ラベル画像14と教師ラベル画像12とで同一箇所の像と見なせる部分であり、各画像の撮像視野が同一である限りにおいて、同一の座標を意味する。
【0051】
判定用ラベル画像14と教師ラベル画像12との対応する部分同士のラベルの比較は、画像中の1画素毎または近傍の複数画素毎に行いうる。近傍の複数画素は、ある画素とその周囲の画素とを含み、たとえば2×2の4画素、3×3の9画素の正方形領域などでありうる。第1実施形態では、より好ましくは、判定用ラベル画像14と教師ラベル画像12との対応する部分同士のラベルが1画素毎に比較する。
【0052】
第1実施形態では、ラベルを比較するステップにおいて、判定用ラベル画像14と教師ラベル画像12との比較により、着目するラベルについて、判定用ラベル画像14における教師ラベル画像12との一致部分および不一致部分を取得する。
【0053】
教師ラベル画像12に含まれるラベル領域13を修正するステップでは、比較結果としての一致部分および不一致部分に基づいて、着目するラベルが付されたラベル領域13の範囲を修正する。教師ラベル画像12に含まれるラベル領域13の修正は、たとえば修正対象となるラベル領域13に付与したラベルを、別のラベルに置き換えることにより行う。図1に示したように、ラベル領域13の修正により、修正済み教師ラベル画像12aが作成される。作成された修正済み教師ラベル画像12aは、学習データ10において元の(修正前の)教師ラベル画像12と置き換えられる(すなわち、教師ラベル画像12が更新される)。
【0054】
ここで、事前学習済みモデル2aの学習を適切に収束させることが可能な学習用データセット1であれば、ラベル領域13の境界に関して、図8に示したようにラベル領域13が相対的に大きくなる方向にばらついた教師ラベル画像12と、ラベル領域13が相対的に小さくなる方向にばらついた教師ラベル画像12とが、概ね均等に分布する(概ね正規分布となる)ことが期待される。なお、図8の横軸はばらつきの大きさを示し、縦軸は、該当するばらつきを有する教師ラベル画像の数(頻度)を示す。図8のようにばらつきが分布した教師ラベル画像12を学習した結果、事前学習済みモデル2aが出力する判定用ラベル画像14のラベル領域13の境界は、一貫して、図8の分布における中間的な結果となることが期待される。そのため、事前学習済みモデル2aにより生成された判定用ラベル画像14のラベル領域13を基準として、判定用ラベル画像14との差異の分だけ、個々の教師ラベル画像12のラベル領域13の境界部分がばらついていると見なすことができる。
【0055】
そこで、第1実施形態では、ラベル領域13を修正するステップにおいて、ラベルの比較結果に基づいて、教師ラベル画像12中のラベル領域13の範囲を、図9に示すように判定用ラベル画像14のラベル領域13に近づけるように修正する。具体的には、ラベル領域13の修正は、教師ラベル画像12中のラベル領域13の膨張および収縮の少なくとも一方により行う。つまり、判定用ラベル画像14のラベル領域13の境界18aに対して、ラベル領域13が相対的に大きく(境界18b参照)設定された教師ラベル画像12については、ラベル領域13を収縮させる修正が行われ、ラベル領域13が相対的に小さく(境界18c参照)設定された教師ラベル画像12については、ラベル領域13を収縮させる修正が行われる。これにより、学習用データセット1の全体として偏ることなく、個々の教師ラベル画像12のラベル領域13の境界部のばらつきを減少させることが可能となる。
【0056】
ラベル領域13の修正は、たとえばモルフォロジー処理により行うことができる。モルフォロジー処理は、入力イメージ(ここでは、教師ラベル画像12)の画素と、その近傍の画素との比較に基づいて、出力イメージ(ここでは、修正済み教師ラベル画像12a)における対応画素の画素値を決定するものである。膨張処理を行う場合、近傍の画素との比較により検出されたラベル領域13の境界の画素に、ラベル領域13と同一のラベルを付与する。収縮処理を行う場合、近傍の画素との比較により検出されたラベル領域13の境界の画素からラベルを除去して、境界の外側のラベルと同じラベルを付与する。モルフォロジー処理による修正量(何画素分、膨張または収縮するか)は、特に限定されず、1画素分、または複数画素分修正することができる。
【0057】
〈教師ラベル画像の修正の具体例〉
次に、教師ラベル画像の修正の具体例を示す。図10に示すように、ステップS1において、学習用データセット1のうちから、修正の対象となる教師ラベル画像12を含む学習データ10を選択する。
【0058】
ステップS2は、上記の判定用ラベル画像14を作成するステップである。ステップS2において、事前学習済みモデル2aにより、入力画像11から判定用ラベル画像14が作成される。
【0059】
ステップS3は、上記の判定用ラベル画像14と教師ラベル画像12とのラベルを比較するステップである。判定用ラベル画像14と教師ラベル画像12との比較方法として、図11に示す2クラス(正、負)分類の混同行列21を例示する。行列の縦が教師ラベル画像12におけるセグメンテーションの結果、行列の横が判定用ラベル画像14におけるセグメンテーションの結果を示す。TPは、判定用ラベル画像14と教師ラベル画像12とで一致して「正」のラベルを付与した画素の総数である。TNは、判定用ラベル画像14と教師ラベル画像12とで一致して「負」のラベルを付与した画素の総数である。したがって、TP、TNは、一致部分の画素数を表す。一方、FPは、判定用ラベル画像14では「正」のラベルを付与して教師ラベル画像12では「負」のラベルを付与した画素の総数である。FNは、判定用ラベル画像14では「負」のラベルを付与して教師ラベル画像12では「正」のラベルを付与した画素の総数である。したがって、FP、FNは、不一致部分の画素数を表す。
【0060】
そして、第1実施形態では、判定用ラベル画像14と教師ラベル画像12との乖離度合いを評価する評価値を算出する。具体的には、ラベルを比較するステップにおいて、一致部分および不一致部分に基づいて、判定用ラベル画像14においてラベルの未検出を評価する未検出評価値22およびラベルの誤検出を評価する誤検出評価値23をそれぞれ取得する。なお、第1実施形態では、教師ラベル画像12のラベル領域13を(誤っているものとして)修正するが、未検出評価値22および誤検出評価値23は、あくまでも教師ラベル画像12の各ラベル領域13が正しいと仮定して、判定用ラベル画像14におけるラベルの未検出および誤検出を評価する評価値である。教師ラベル画像12の各ラベル領域13が正しいと仮定した場合、判定用ラベル画像14における教師ラベル画像12との不一致部分は、未検出または誤検出となる部分であるので、未検出評価値22および誤検出評価値23は、判定用ラベル画像14における教師ラベル画像12との一致不一致を、数値によって評価するものである。
【0061】
未検出評価値22および誤検出評価値23は、それぞれ、ラベルの未検出の多さ(または少なさ)、および誤検出の多さ(または少なさ)を示す数値であれば、特に限定されない。
【0062】
一例として、未検出評価値22は、下式(1)で示される検出率(RecallまたはTrue Positive Rate;TPR)である。検出率は感度とも呼ばれる。
K=TP/(TP+FN) ・・・(1)
検出率は、「本来ポジティブ(正)に分類するべきアイテム(画素)を、正しくポジティブに分類できたアイテムの割合」を示し、未検出の少なさを表す。つまり未検出評価値22として検出率を採用する場合、値が大きいほど未検出が少ないことを表す。
【0063】
誤検出評価値23は、下式(2)で示される精度(Precision)である。
G=TP/(TP+FP) ・・・(2)
精度は、「ポジティブ(正)に分類されたアイテムのうち、実際にポジティブであったアイテムの割合」を示し、誤検出の少なさを表す。つまり誤検出評価値23として精度を採用する場合、値が大きいほど誤検出が少ないことを表す。
【0064】
未検出評価値22および誤検出評価値23の比較により、教師ラベル画像12のラベル領域13が相対的に大きく設定されているか、ラベル領域13が相対的に小さく設定されているかを判定することが可能である。そこで、ラベル領域13を修正するステップにおいて、未検出評価値22および誤検出評価値23の比較に基づいて教師ラベル画像12のラベル領域13を修正する。
【0065】
未検出評価値22および誤検出評価値23の比較結果と、判定用ラベル画像14と教師ラベル画像12との各ラベル領域の大きさとの関係を、図12および図13に示す単純化した仮想例を用いて説明する。図12および図13において、着色部が各画像のラベル領域13を示し、ハッチング部は、判定用ラベル画像14のラベル領域13fを、教師ラベル画像12に重畳して示したものである。
【0066】
図12に示すように、判定用ラベル画像14と教師ラベル画像12とを比較して、未検出が多い(検出率Kが小さい)ケースでは、判定用ラベル画像14で正のラベルが付されたラベル領域13fよりも、教師ラベル画像12で正のラベルが付されたラベル領域13gが大きく、ラベル領域13fの外側にラベル領域13gの境界がある(ラベル領域13fの外側が未検出となる)。
【0067】
そこで、未検出評価値22および誤検出評価値23の比較により、判定用ラベル画像14におけるラベルの誤検出に比べて未検出が多いと判断された場合、ラベル領域13を修正するステップS4において、教師ラベル画像12のラベル領域13を収縮する。
【0068】
すなわち、(検出率K<精度G≒1)となる場合、誤検出が少なく、未検出が多いと判断できるので、教師ラベル画像12のラベル領域13の範囲を収縮させることにより、判定用ラベル画像14のラベル領域13に近づけることができる。図12の仮想例では、K=0.56、G=1となるので、条件(検出率K<精度G≒1)を満たす。
【0069】
一方、図13に示すように、判定用ラベル画像14と教師ラベル画像12とを比較して、誤検出が多い(精度Gが小さい)ケースでは、判定用ラベル画像14で正のラベルが付されたラベル領域13fよりも、教師ラベル画像12で正のラベルが付されたラベル領域13gが小さく、ラベル領域13fの内側にラベル領域13gの境界がある(ラベル領域13gの外側が誤検出となる)。
【0070】
そこで、未検出評価値22および誤検出評価値23の比較により、判定用ラベル画像14におけるラベルの未検出に比べて誤検出が多いと判断された場合、ラベル領域13を修正するステップS4において、教師ラベル画像12のラベル領域13を膨張する。
【0071】
すなわち、(1≒検出率K>精度G)となる場合、未検出が少なく、誤検出が多いと判断できるので、教師ラベル画像12のラベル領域13の範囲を膨張させることにより、判定用ラベル画像14のラベル領域13に近づけることができる。図13の仮想例では、K=1、G=0.56となるので、条件(1≒検出率K>精度G)を満たす。なお、精度G≒1および検出率K≒1の判断基準としては、たとえば0.8以上、または0.9以上などとしてよい。
【0072】
また、第1実施形態では、未検出および誤検出の少なくとも一方が所定の閾値よりも多いと判断された教師ラベル画像12を含む学習データ10を、学習用データセット1から除外するステップをさらに含む。未検出および誤検出の少なくとも一方が所定の閾値よりも多いとは、検出率Kおよび精度Gの少なくとも一方が所定の閾値Thを下回る(K<Th、および/またはG<Th)ことである。
【0073】
このように未検出評価値22および誤検出評価値23の一方が許容範囲外(所定の閾値を超える)となる場合、ラベル領域13の境界のばらつきが実際のサイズに対して極端に大きい不適切な教師ラベル画像12であると考えられ、学習の妨げとなるため、修正を図るよりも学習用データセット1から除外する方が好ましい。所定の閾値は、クラス数や、事前学習済みモデル2aの精度(損失関数)に応じて設定しうるが、たとえば2クラス分類の場合、閾値=0.5とすることができる。
【0074】
以上のようにして、ステップS4において、教師ラベル画像12のラベル領域13の修正が行われる。教師ラベル画像12の修正は、学習用データセット1に含まれる全ての学習データ10の教師ラベル画像12に対して、行うことができる。すなわち、ステップS5において、全ての学習データ10の教師ラベル画像12に対して、修正処理が完了したかが判断され、未修正の学習データ10(教師ラベル画像12)がある場合、ステップS1に処理が戻り、次に選択された学習データ10に対して、ステップS2~S4が実行される。全ての学習データ10の教師ラベル画像12に対して修正処理が完了した場合、学習済みモデル2の修正処理が完了する。この他、教師ラベル画像12の修正は、特定の教師ラベル画像12についてのみ行うことができる。たとえば損失関数や未検出評価値22および誤検出評価値23などに修正可否を判定するための閾値を設け、閾値を超えた特定の教師ラベル画像12についてのみ、教師ラベル画像12の修正を行うことができる。
【0075】
また、第1実施形態では、教師ラベル画像12のラベル領域13の修正は、1回または複数回行われうる。
【0076】
すなわち、第1実施形態の1つの態様では、修正された教師ラベル画像12(修正済み教師ラベル画像12a)を含む学習データ10を用いた学習済みモデル2により、判定用ラベル画像14を作成するステップをさらに含み、ラベル領域を修正するステップにおいて、作成された判定用ラベル画像14と修正済み教師ラベル画像12aとの比較結果に基づいて、修正済み教師ラベル画像12aに含まれるラベル領域13を再修正する。詳細は後述する。
【0077】
(学習済みモデルの作成方法)
次に、教師ラベル画像修正方法によって修正された教師ラベル画像(修正済み教師ラベル画像12a)を用いて画像セグメンテーションを行うための学習済みモデル2を作成する方法について説明する。
【0078】
学習済みモデルの作成方法は、下記のステップを含む。
(1)入力画像11と教師ラベル画像12とを含む学習データ10を用いた機械学習による事前学習済みモデル2aを取得するステップ
(2)取得した事前学習済みモデル2aにより、学習データ10の入力画像11に対してセグメンテーション処理を行って、複数のラベル領域13に分割された判定用ラベル画像14を作成するステップ
(3)作成された判定用ラベル画像14と教師ラベル画像12とについて、画像中の対応する部分同士のラベルを比較するステップ
(4)ラベルの比較結果に基づいて、教師ラベル画像12に含まれるラベル領域13を修正するステップ
(5)修正済み教師ラベル画像12aを含む学習データ10を用いて機械学習を行うことにより、学習済みモデル2を作成するステップ
【0079】
図14に、学習済みモデルの作成方法を実施する処理の流れを示す。ステップS11において、事前学習済みモデル2aを取得する。ステップS12において、学習用データセット1に含まれる教師ラベル画像12の修正を行う。すなわち、図10に示したステップS1~S5の処理を実行することにより、各学習データ10の教師ラベル画像12を修正する。これにより、ステップS13において、修正済み教師ラベル画像12aを含む修正済みの学習用データセット1を取得する。
【0080】
ステップS14において、修正済み教師ラベル画像12aを含む学習用データセット1を用いて、機械学習を行う。その結果、ラベル領域13の境界のばらつきが抑制された修正済み教師ラベル画像12aを含んだ学習データ10を利用して、事前学習済みモデル2aが追加学習されることにより、学習済みモデル2が生成される。ステップS16において、作成された学習済みモデル2がコンピュータの記憶部に記憶される。なお、ここでは、修正済み教師ラベル画像12aを含む学習用データセット1を用いて、事前学習済みモデル2aに対する機械学習(追加学習)を行う例を示しているが、修正済み教師ラベル画像12aを含む学習用データセット1を用いて、事前学習済みモデル2aとは異なる他の学習済みモデルや、未学習の学習モデルに対して機械学習を行ってもよい。
【0081】
学習済みモデル2の作成は、所定の繰り返し回数だけ反復して行うことができる。この際、教師ラベル画像12の修正処理も、反復して実施される。すなわち、ステップS16において、学習が所定回数だけ繰り返し実施されたか否かが判断される。所定回数に達していない場合、処理がステップS11に戻され、学習済みモデル2の作成が再度行われる。
【0082】
このとき、ステップS11では、直前のステップS15で記憶された学習済みモデル2が、今回の事前学習済みモデル2aとして取得される。そして、ステップS12において、取得された事前学習済みモデル2aと、修正済み教師ラベル画像12aを含む学習用データセット1とを用いて、修正済み教師ラベル画像12aの再修正が行われる。
【0083】
そして、ステップS14では、再修正された修正済み教師ラベル画像12aを含む学習用データセット1を用いて、事前学習済みモデル2aに対する機械学習が行われる。このようにステップS11~S15を反復することにより、学習用データセット1に含まれる教師ラベル画像12の修正を繰り返し行い更新しつつ、更新された修正済み教師ラベル画像12aを含む学習用データセット1を用いた機械学習によって、学習済みモデル2が作成される。ステップS16において、学習が所定回数だけ繰り返し実施されると、処理が終了する。
【0084】
以上の教師ラベル画像修正方法、および学習済みモデルの作成方法は、所定のソフトウェア(プログラム)が記憶部にインストールされたコンピュータ(パーソナルコンピュータやワークステーション、スーパーコンピュータなど)または複数台のコンピュータからなるコンピュータシステムによって実施される。コンピュータは、CPU、GPU、専用設計されたFPGAなどのプロセッサと、ROM、RAM、揮発性または不揮発性記憶装置(HDD、SDDなど)の記憶部とを備える。
【0085】
図15に示すように、コンピュータが備えるプロセッサ50aが、記憶部54に記憶されたプログラムを実行することにより、教師ラベル画像修正方法や学習済みモデルの作成方法を実行するための学習データ処理部50として機能する。
【0086】
〈学習データ処理部〉
第1実施形態の教師ラベル画像修正方法を行う学習データ処理部50は、教師ラベル画像修正方法の各ステップ(図10のステップS1~S5)を実行するための機能ブロックを含み、記憶部54に記憶された各種データ(事前学習済みモデル2a、学習用データセット1)を用いた処理によって教師ラベル画像修正方法を実行することができる。第1実施形態の学習済みモデルの作成方法を実施する学習データ処理部50は、学習済みモデルの作成方法の各ステップ(図14のステップS11~S16)を実行するための機能ブロックを含み、記憶部54に記憶された各種データを用いた処理によって学習済みモデルの作成方法を実行することができる。
【0087】
具体的には、学習データ処理部50は、判定用画像作成部51と、比較部52と、ラベル修正部53と、を機能ブロックとして含む。第1実施形態の学習済みモデルの作成方法を実施する学習データ処理部50は、さらに、学習部55を機能ブロックとして含む。教師ラベル画像12の修正のみを行う場合、学習データ処理部50は、学習部55を含む必要はない。記憶部54には、学習用データセット1、および学習済みモデル2(事前学習済みモデル2a)などの各種データおよびプログラムが記憶される。
【0088】
学習データ処理部50は、図10のステップS1において、学習データ10を選択する。判定用画像作成部51は、記憶部54に記憶された学習済みモデル2を事前学習済みモデル2aとして、入力画像11と教師ラベル画像12とを含む学習データ10の入力画像11に対してセグメンテーション処理を行うことにより、判定用ラベル画像14を作成するように構成されている。判定用画像作成部51は、図14のステップS11と、図10のステップS1、S2の処理を行う。
【0089】
比較部52は、判定用画像作成部51により作成された判定用ラベル画像14と教師ラベル画像12とについて、画像中の対応する部分同士のラベルを比較するように構成されている。すなわち、比較部52は、図10のステップS3の処理を行う。
【0090】
ラベル修正部53は、比較部52によるラベルの比較結果に基づいて、教師ラベル画像12に含まれるラベル領域13を修正するように構成されている。すなわち、ラベル修正部53は、図10のステップS4の処理を行う。
【0091】
学習データ処理部50は、図10のステップS5において、全ての学習データ10が選択されるまで、学習データ10の選択と教師ラベル画像12の修正とを繰り返す。
【0092】
学習部55は、修正済み教師ラベル画像12aを含む学習データ10を用いて機械学習を行うことにより、学習済みモデル2を作成(更新)するように構成されている。すなわち、学習部55は、図14のステップS13~S15の処理を行う。学習データ処理部50は、図14のステップS16において、教師ラベル画像12の修正と学習済みモデル2の再学習とを、所定回数だけ繰り返す。
【0093】
(画像解析装置)
次に、上記の学習済みモデルの作成方法によって作成された学習済みモデル2を用いて、画像解析(画像セグメンテーション)を行う画像解析装置の例について説明する。
【0094】
(画像解析装置の構成例:細胞解析装置)
画像解析装置の第1の例として、図16に示す画像解析装置100は、細胞を撮像した細胞画像の解析を行う細胞解析装置である。
【0095】
画像解析装置100は、細胞を撮像した解析用画像15であるIHM(In-line Holographic Microscopy)位相像に対して、細胞に関するセグメンテーションを実施するように構成されている。画像解析装置100は、セグメンテーション処理により、細胞画像から検出対象となる細胞の領域毎に分割したラベル画像16を作成する。
【0096】
画像解析装置100は、撮像部110と、制御部120と、ユーザーインターフェイスである操作部130と、表示部140と、学習データ処理部50とを備える。
【0097】
撮像部110は、インライン型ホログラフィック顕微鏡であり、レーザダイオードなどを含む光源部111とイメージセンサ112とを備える。撮像時には、光源部111とイメージセンサ112との間に、細胞コロニー(又は細胞単体)114を含む培養プレート113が配置される。
【0098】
制御部120は、撮像部110の動作を制御するとともに撮像部110で取得されたデータを処理するように構成されている。制御部120は、プロセッサと記憶部126とを備えたコンピュータであり、プロセッサは、撮像制御部121と、細胞画像作成部122と、画像解析部123とを機能ブロックとして含む。
【0099】
画像解析部123は、解析用画像15の入力を受け付ける画像入力部124と、機械学習による学習済みモデル2を用いて、解析用画像15のセグメンテーション処理を行って、複数のラベル領域13に分割されたラベル画像を作成する解析処理部125と、を下位の機能ブロックとして含む。
【0100】
学習データ処理部50は、図15に示した構成と同様であるので説明を省略する。学習データ処理部50において作成される学習済みモデル2が、制御部120における記憶部126に格納されて、画像解析部123による細胞のセグメンテーション処理に利用される。
【0101】
制御部120は、作業者により細胞コロニー114を含む培養プレート113が撮像部110の所定位置にセットされ、操作部130を介して所定の操作を受け付けると、撮像制御部121により撮像部110を制御してホログラムデータを取得する。
【0102】
具体的には、撮像部110は、光源部111からコヒーレント光を照射させ、培養プレート113および細胞コロニー114を透過した光と、培養プレート113上で細胞コロニー114の近傍領域を透過した光との干渉縞による像を、イメージセンサ112により取得する。イメージセンサ112は、ホログラムデータ(検出面上に形成されたホログラムの2次元的な光強度分布データ)を取得する。
【0103】
細胞画像作成部122は、撮像部110により取得されたホログラムデータに対して、位相回復のための演算処理を実行することにより、位相情報を算出する。そして、細胞画像作成部122は、算出された位相情報に基づいてIHM位相像(解析用画像15)を作成する。位相情報の算出やIHM位相像の作成手法は、公知の技術を利用することができるので、詳細な説明を省略する。
【0104】
〈細胞画像解析部〉
図4に示した細胞画像は、iPS細胞における未分化逸脱細胞コロニーを対象とするIHM位相像の一例である。画像解析装置100では、画像解析部123によりIHM位相像に対するセグメンテーション処理を行うことにより、IHM位相像(解析用画像15)を、未分化細胞のラベル領域13cと、未分化逸脱細胞のラベル領域13dと、背景のラベル領域13eと、に分類して領域分割する処理を自動的に行う。
【0105】
図17に示すように、ステップS21において、画像入力部124が、解析用画像15であるIHM位相像を取得する。ステップS22において、解析処理部125が、記憶部126に記憶された学習済みモデル2により、解析用画像15に対するセグメンテーション処理を行う。これにより、今回入力された解析用画像15を複数のラベル領域13に領域分割したラベル画像16が作成される。ステップS23において、画像解析部123は、作成されたラベル画像16を記憶部126に記憶させるとともに、作成されたラベル画像16を表示部140や外部のサーバなどに出力する。
【0106】
画像解析部123では、セグメンテーション処理の他、セグメンテーション処理を行った結果に基づく各種の解析処理を行いうる。たとえば、画像解析部123は、セグメンテーション処理によって得られたラベル画像16に基づき、細胞領域の面積、細胞の数、又は細胞の密度の少なくともいずれかを推定する。
【0107】
(画像解析装置の構成例:骨部画像解析装置)
画像解析装置の第2の例として、図18に示す画像解析装置200は、被検者の骨部を含む領域のX線画像の解析を行う骨部画像解析装置である。
【0108】
画像解析装置200は、骨部を撮像した解析用画像15であるX線画像に対して、骨部に関するセグメンテーションを実施するように構成されている。画像解析装置200は、セグメンテーション処理により、X線画像から骨部の領域を分割した骨部のラベル画像16を作成する。
【0109】
画像解析装置200は、撮像部210と、制御部220と、操作部230と、表示部240と、学習データ処理部50とを備える。
【0110】
撮像部210は、天板211と、X線照射部212と、X線検出部213とを含んでいる。天板211は、被検体O(人)を支持するように構成されている。X線照射部212は、被検体Oに向けてX線を照射するように構成されている。X線検出部213は、たとえばFPD(Flat Panel Detector)により構成され、X線照射部212から照射され、被検体Oを透過したX線を検出するように構成されている。撮像部210により、たとえば図2に示したように、被検者の骨部を含む領域のX線画像が、解析用画像15として取得される。
【0111】
制御部220は、プロセッサと記憶部226とを備えたコンピュータであり、プロセッサは、撮像制御部221と、X線画像作成部222と、画像解析部223とを機能ブロックとして含む。
【0112】
画像解析部223は、図16に示した例と同様に、画像入力部224と、解析処理部225とを下位の機能ブロックとして含む。
【0113】
学習データ処理部50は、図15に示した構成と同様であるので説明を省略する。学習データ処理部50において作成される学習済みモデル2が、制御部220における記憶部226に格納されて、画像解析部223による骨部のセグメンテーション処理に利用される。
【0114】
骨部に関するセグメンテーション処理を行うための教師ラベル画像12は、X線画像のほか、被検者のCT画像(コンピュータ断層撮影画像)データを用いて作成することができる。具体的には、教師ラベル画像12は、被検者のCT画像データに対して、X線照射部212とX線検出部213との幾何学的条件を模擬した仮想的投影を行うことにより、骨部を含む領域を示す複数のDRR画像(デジタル再構成シミュレーション画像)を生成し、CT値が一定以上の値となる領域を骨部の領域としてラベリングすることにより、作成されうる。学習データ処理部50は、図示しないCT撮影装置からCT画像を取得し、取得したCT画像に基づいて、教師ラベル画像12を生成することができる。
【0115】
図17に示したように、ステップS21において、画像入力部224が、解析用画像15であるX線画像を取得する。ステップS22において、解析処理部225が、記憶部226に記憶された学習済みモデル2により、解析用画像15に対するセグメンテーション処理を行う。これにより、今回入力された解析用画像15が複数のラベル領域13に領域分割されたラベル画像16が作成される。ステップS23において、画像解析部223は、作成されたラベル画像16を記憶部226に記憶させるとともに、作成されたラベル画像16を表示部240や外部のサーバなどに出力する。
【0116】
画像解析部223では、セグメンテーション処理の他、セグメンテーション処理を行った結果に基づく各種の解析処理を行いうる。たとえば、画像解析部223は、セグメンテーション処理によって得られたラベル画像16(図3参照)に基づき、検出された骨部の骨密度を推定する。
【0117】
なお、図15図16および図18において、学習データ処理部50および制御部120、220の各部を、プロセッサがソフトウェアを実行することにより実現される機能ブロックとして構築する代わりに、それぞれの処理を行う専用のハードウェアにより構築してもよい。
【0118】
(第1実施形態の効果)
第1実施形態では、以下のような効果を得ることができる。
【0119】
第1実施形態では、上記のように、判定用ラベル画像14を作成し、作成された判定用ラベル画像14と教師ラベル画像12とについて、画像中の対応する部分同士のラベルを比較し、ラベルの比較結果に基づいて、教師ラベル画像12に含まれるラベル領域13を修正する。このように判定用ラベル画像14を基準に、判定用ラベル画像14と教師ラベル画像12との比較結果に基づいて教師ラベル画像12のラベル領域13の修正を行うことによって、ラベル修正作業者ではなく、コンピュータを用いた自動的な修正作業でも一貫した基準に基づいて境界のばらつきを低減することができる。これにより、画像セグメンテーション処理の機械学習に用いる教師ラベル画像12の修正作業を、精度を確保しつつ簡易化することができる。
【0120】
また、第1実施形態では、上記のように、ラベル領域13を修正するステップにおいて、ラベルの比較結果に基づいて、教師ラベル画像12中のラベル領域13の範囲を、判定用ラベル画像14のラベル領域13に近づけるように修正する。このように構成すれば、教師ラベル画像12中のラベル領域13の範囲を、たとえば判定用ラベル画像14のラベル領域13に一致させ、または判定用ラベル画像14のラベル領域13との間の中間的な範囲とするだけで、容易かつ効果的に、個々の教師ラベル画像12のラベル領域13のばらつきを小さくする修正ができる。
【0121】
また、第1実施形態では、上記のように、ラベル領域13を修正するステップにおいて、ラベル領域13の修正は、教師ラベル画像12中のラベル領域13の膨張および収縮の少なくとも一方により行う。このように構成すれば、ラベルの比較結果に基づいて、教師ラベル画像12中のラベル領域13の範囲を膨張させたり収縮させたりするだけの簡易な処理で、教師ラベル画像12のラベル領域13の修正が行える。
【0122】
また、第1実施形態では、上記のように、ラベル領域13を修正するステップにおいて、判定用ラベル画像14における教師ラベル画像12との一致部分および不一致部分に基づいて、着目するラベルが付されたラベル領域13の範囲を修正する。このように構成すれば、判定用ラベル画像14と教師ラベル画像12との一致部分および不一致部分から、教師ラベル画像12のラベル領域13が、基準となる判定用ラベル画像14からどのように乖離しているかが把握できる。そのため、一致部分および不一致部分に基づくことにより、容易に、境界のばらつきが小さくなるようにラベル領域13を修正することができる。
【0123】
また、第1実施形態では、上記のように、ラベルを比較するステップにおいて、一致部分および不一致部分に基づいて、判定用ラベル画像14においてラベルの未検出を評価する未検出評価値22およびラベルの誤検出を評価する誤検出評価値23をそれぞれ取得し、ラベル領域13を修正するステップにおいて、未検出評価値22および誤検出評価値23の比較に基づいて教師ラベル画像12のラベル領域13を修正する。このように、未検出評価値22および誤検出評価値23の比較に基づくことによって、教師ラベル画像12のラベル領域13をどのように修正すればよいか(大きくすればよいか小さくすればよいか)を把握できるので、より適切に、個々の教師ラベル画像12のラベル領域13を修正できる。
【0124】
また、第1実施形態では、上記のように、未検出評価値22および誤検出評価値23の比較により、判定用ラベル画像14におけるラベルの未検出に比べて誤検出が多いと判断された場合、ラベル領域13を修正するステップにおいて、教師ラベル画像12のラベル領域13を膨張する。このように構成すれば、誤検出となる領域が多く、教師ラベル画像12のラベル領域13が基準となる判定用ラベル画像14のラベル領域13よりも小さいと推定される場合に、教師ラベル画像12のラベル領域13を膨張することにより、容易に、ラベル領域13の境界のばらつきを小さくする修正が行える。
【0125】
また、第1実施形態では、上記のように、未検出評価値22および誤検出評価値23の比較により、判定用ラベル画像14におけるラベルの誤検出に比べて未検出が多いと判断された場合、ラベル領域13を修正するステップにおいて、教師ラベル画像12のラベル領域13を収縮する。このように構成すれば、未検出となる領域が多く、教師ラベル画像12のラベル領域13が基準となる判定用ラベル画像14のラベル領域13よりも大きいと推定される場合に、教師ラベル画像12のラベル領域13を収縮することにより、容易に、ラベル領域13の境界のばらつきを小さくする修正が行える。
【0126】
また、第1実施形態では、上記のように、未検出および誤検出の少なくとも一方が所定の閾値よりも多いと判断された教師ラベル画像12を含む学習データ10を、学習用データセットから除外するステップをさらに含む。このように構成すれば、基準となる判定用ラベル画像14との比較において未検出および誤検出の少なくとも一方が過度に多い場合、その教師ラベル画像12は学習データ10として不適切であると考えられる。そこで、未検出および誤検出の少なくとも一方が多くなる教師ラベル画像12を学習用データセットから除外することにより、機械学習の精度を低下させる要因となる学習データ10を除外できるので、学習用データセットの品質を向上させて高精度な機械学習を行うことができる。
【0127】
また、第1実施形態では、上記のように、ラベルを比較するステップにおいて、判定用ラベル画像14と教師ラベル画像12との対応する部分同士のラベルの比較を、画像中の1画素毎に行う。このように構成すれば、判定用ラベル画像14と教師ラベル画像12とを、1画素単位で比較することができるので、より精密に、教師ラベル画像12のラベル領域13のばらつきを評価することができる。
【0128】
また、第1実施形態では、上記のように、修正された教師ラベル画像(修正済み教師ラベル画像12a)を含む学習データ10を用いた学習済みモデル2により、判定用ラベル画像14を作成するステップをさらに含み、ラベル領域13を修正するステップにおいて、作成された判定用ラベル画像14と修正済み教師ラベル画像12aとの比較結果に基づいて、修正済み教師ラベル画像12aに含まれるラベル領域13を再修正する。このように構成すれば、修正済み教師ラベル画像12aを用いて機械学習を行った上で、再度判定用ラベル画像14を作成することにより、教師ラベル画像12のラベル領域13の修正を繰り返し行うことができる。ラベル領域13の修正を繰り返し行うことによって、教師ラベル画像12のラベル領域13のばらつきを、さらに小さく収束させることができる。
【0129】
また、第1実施形態の学習済みモデルの作成方法では、上記のように、判定用ラベル画像14と教師ラベル画像12とについてのラベルの比較結果に基づいて、教師ラベル画像12に含まれるラベル領域13を修正する。これにより、画像セグメンテーション処理の機械学習に用いる教師ラベル画像12の修正作業を、精度を確保しつつ簡易化することができる。そして、修正済み教師ラベル画像12aを含む学習データ10を用いて事前学習済みモデル2aに対する機械学習を行うことにより、学習済みモデル2を作成するので、ラベル領域13の境界部分の判定ばらつきが抑制された高品質なセグメンテーション処理が可能な学習済みモデル2を得ることができる。
【0130】
また、第1実施形態の画像解析装置100、200では、上記のように、判定用ラベル画像14を作成する判定用画像作成部51と、判定用画像作成部51により作成された判定用ラベル画像14と教師ラベル画像12とについて、画像中の対応する部分同士のラベルを比較する比較部52と、比較部52によるラベルの比較結果に基づいて、教師ラベル画像12に含まれるラベル領域13を修正するラベル修正部53と、を設ける。これにより、画像セグメンテーション処理の機械学習に用いる教師ラベル画像12の修正作業を、精度を確保しつつ簡易化することができる。
【0131】
(第2実施形態)
次に、図19および図20を参照して、第2実施形態による教師ラベル画像修正方法ついて説明する。第2実施形態では、上記第1実施形態による教師ラベル画像修正方法に加えて、ラベル領域の膨張または収縮による修正を行う際に、ラベルの優先度に応じて修正量を調整する例について説明する。
【0132】
図19に示すように、第2実施形態による教師ラベル画像修正方法では、教師ラベル画像12のラベル間に優先度60を設定するステップをさらに含む。そして、ラベル領域13を修正するステップにおいて、優先度60に応じて、ラベル領域13の修正量を調整する。
【0133】
たとえば図19では、多能性幹細胞の細胞画像に対して、未分化細胞、未分化逸脱細胞、背景の3つのラベルを設定し、セグメンテーション処理によりそれぞれのラベル領域13に分割する例を示している。
【0134】
この細胞画像は、多能性幹細胞を培養する際に、細胞コロニー中から未分化逸脱細胞を発見してこれを除去することにより、多能性を維持した未分化細胞が分化することを抑止するとともに未分化細胞のみを培養するために用いられる。すなわち、未分化逸脱細胞を確実に発見することが望まれるため、未分化細胞、未分化逸脱細胞、背景の各ラベルのうちでは、優先度が高い方から未分化逸脱細胞、未分化細胞、背景の順で優先度60が設定される。
【0135】
そして、第2実施形態では、ラベル領域13を修正するステップにおいて、教師ラベル画像12のラベル領域13を修正する際に、優先度の高いラベル領域13への、優先度の低いラベル領域13の膨張を禁止する。すなわち、優先度の低いラベル領域13の膨張によって優先度の高いラベル領域13が小さくされないように、優先度60に応じてラベル領域13の修正量が調整される。図20の例では、ラベル領域13の膨張修正を行う場合に、背景のラベル領域13eの未分化細胞のラベル領域13cおよび未分化逸脱細胞のラベル領域13dへの膨張が禁止される。そして、未分化細胞のラベル領域13cの未分化逸脱細胞のラベル領域13dへの膨張が禁止される。
【0136】
一方、ラベル領域13の膨張修正を行う場合に、未分化逸脱細胞のラベル領域13dは、未分化細胞のラベル領域13cおよび背景のラベル領域13eへの膨張が許容される。そして、未分化細胞のラベル領域13cは、背景のラベル領域13eへの膨張が許容される。この結果、第2実施形態では、教師ラベル画像12において、優先度の高いラベルのラベル領域13が小さくなる方向への修正が制限される。
【0137】
第2実施形態のその他の構成は、上記第1実施形態と同様である。なお、第2実施形態の他の構成例では、優先度の高いラベル領域13への、優先度の低いラベル領域13の膨張を禁止しなくてもよい。たとえば、優先度の低いラベル領域13cから優先度の高いラベル領域13dへの膨張量を、優先度の高いラベル領域13dから優先度の低いラベル領域13cへの膨張量よりも小さくする。このようにしても、優先度の高いラベルのラベル領域13が小さくなる方向への修正を抑制できる。
【0138】
(第2実施形態の効果)
第2実施形態では、以下のような効果を得ることができる。
【0139】
第2実施形態では、上記第1実施形態と同様に、画像セグメンテーション処理の機械学習に用いる教師ラベル画像12の修正作業を、精度を確保しつつ簡易化することができる。
【0140】
また、第2実施形態では、上記のように、教師ラベル画像12のラベル間に優先度60を設定するステップをさらに含み、ラベル領域13を修正するステップにおいて、優先度60に応じて、ラベル領域13の修正量を調整する。これにより、優先度の高いラベルは極力検出漏れを抑制できるように修正量を意図的に偏らせることができる。その結果、セグメンテーション処理の目的に応じて教師ラベル画像12の修正を適切に行うことができる。
【0141】
また、第2実施形態では、上記のように、ラベル領域13を修正するステップにおいて、教師ラベル画像12のラベル領域13を修正する際に、優先度の高いラベル領域13への、優先度の低いラベル領域13の膨張を禁止する。これにより、優先度の低いラベル領域13(たとえばラベル領域13c)を膨張させる修正をしても優先度の高いラベル領域13(たとえばラベル領域13d)を保存できる。そのため、セグメンテーション処理の目的に応じて、境界のばらつきを抑制しつつ、優先度の高いラベル領域13の検出漏れを抑制した学習が可能な教師ラベル画像12(学習データ10)を得ることができる。
【0142】
(変形例)
なお、今回開示された実施形態は、すべての点で例示であって制限的なものではないと考えられるべきである。本発明の範囲は、上記した実施形態の説明ではなく、特許請求の範囲によって示され、さらに特許請求の範囲と均等の意味および範囲内でのすべての変更(変形例)が含まれる。
【0143】
たとえば、上記一実施形態では、画像の例として、細胞画像、X線画像の例を示したが、本発明はこれに限られない。本発明による教師ラベル画像の修正は、セグメンテーション処理の機械学習に用いる教師ラベル画像であれば、どのような画像に対しても適用しうる。本発明による教師ラベル画像の修正は、ラベル領域の境界のばらつきを修正するものであるから、ラベル領域の境界部分に高い精度が要求される分野において特に好適である。そのような画像として、特に医用分野(医療分野、医科学分野)に用いられる、いわゆる医用画像がある。医用画像は、たとえば医師による疾患の診断などに用いられるため、ラベル領域の微細な境界部分であっても、境界がぼけたり、不自然な形状になるのを極力抑制することが望まれる。そのため、教師ラベル画像の修正によってラベル領域の境界のばらつきを低減することが可能な本発明は、医用画像のセグメンテーションに用いる場合に特に好適である。医用画像としては、細胞画像、骨部その他のX線画像のほか、たとえば治療対象部位としての腫瘍領域を検出対象としてセグメンテーション処理をする場合の、腫瘍が写る画像(内視鏡画像など)などでもよい。
【0144】
また、上記第1および第2実施形態では、教師ラベル画像12の全体を、判定用ラベル画像14と1画素毎に比較して、比較結果に基づいて修正する例を示したが、本発明はこれに限られない。本発明では、教師ラベル画像12の一部に対して判定用ラベル画像14との比較および修正を行ってもよい。たとえば図21に示す教師ラベル画像修正方法の変形例では、ラベル領域13を修正するステップにおいて、教師ラベル画像12を複数の部分画像17に分割し、分割された教師ラベル画像12の少なくとも1つの部分画像17についてラベル領域13を修正する。図21では、教師ラベル画像12を6×6の矩形の部分画像17aとなるようにマトリクス状に分割している。そして、変形例では、判定用ラベル画像14についても部分画像17bに分割し、部分画像17(17a、17b)ごとに、教師ラベル画像12と判定用ラベル画像14とを比較するとともに、比較結果に基づいて教師ラベル画像12の部分画像17を修正する。それぞれの部分画像17の形状や、分割数は、特に限定されず、任意である。修正は、特定の1つまたは複数の部分画像17のみについて行ってもよいし、全ての部分画像17に対してそれぞれ行ってもよい。この変形例のように構成すれば、教師ラベル画像12の特定の一部分のみを修正したり、小部分ごとに個別に修正することができる。
【0145】
また、上記第1実施形態では、画像解析装置100、200が、教師ラベル画像12の修正処理を行う例を示したが、本発明はこれに限られない。教師ラベル画像12の修正処理を、画像解析装置以外の他の装置によって行ってもよい。同様に、上記第1および第2実施形態では、画像解析装置100、200が、機械学習による学習済みモデル2の作成を行う例を示したが、学習済みモデル2の作成を、画像解析装置以外の他の装置によって行ってもよい。
【0146】
たとえば図22に示す変形例では、学習データ処理部50が、画像解析装置300とは別個のサーバ装置として設けられ、画像解析装置300とネットワークを介して接続されている。学習データ処理部50は、画像解析装置300から、新たに撮像された解析用画像15を、機械学習のための学習データ10の入力画像11として取得する。学習データ処理部50によって、または他の画像処理装置を用いて、入力画像11から教師ラベル画像12が作成され、入力画像11と教師ラベル画像12とを含む学習データ10が、学習用データセット1に追加される。学習データ処理部50は、入力画像11から事前学習済みモデル2aにより判定用ラベル画像14を作成し、教師ラベル画像12との比較を行い、比較結果に基づいて教師ラベル画像12の修正を行う。学習データ処理部50は、修正済み教師ラベル画像12を用いて事前学習済みモデル2aの再学習を行い、学習済みモデル2を作成(アップデート)する。学習データ処理部50は、新たに作成された学習済みモデル2を、ネットワークを介して画像解析装置300に送信する。これにより、画像解析装置300は、新たに作成された学習済みモデル2を用いてセグメンテーション処理を行うことができる。
【0147】
また、たとえば図23に示す変形例では、画像解析装置300において、教師ラベル画像12の修正が行われる。そして、学習データ処理部50側で、学習済みモデル2が作成される。画像解析装置300側で、新たに撮像された解析用画像15を、学習データ10の入力画像11として、教師ラベル画像12が作成される。入力画像11と教師ラベル画像12とを含む学習データ10が、学習用データセット1に追加される。画像解析装置300は、入力画像11から事前学習済みモデル2aにより判定用ラベル画像14を作成し、教師ラベル画像12との比較を行い、比較結果に基づいて教師ラベル画像12の修正を行う。画像解析装置300は、入力画像11と修正済み教師ラベル画像12aとを含む学習データ10を、ネットワークを介して学習データ処理部50へ送信する。学習データ処理部50は、送信された学習データ10を学習用データセット1に追加して、事前学習済みモデル2aの再学習を行い、学習済みモデル2を作成(アップデート)する。学習データ処理部50は、新たに作成された学習済みモデル2を、ネットワークを介して画像解析装置300に送信する。これにより、画像解析装置300は、新たに作成された学習済みモデル2を用いてセグメンテーション処理を行うことができる。
【0148】
このように、本発明の教師ラベル画像修正方法および学習済みモデルの作成方法は、それぞれ、いわゆるクラウドサービスなどの形態で、ネットワーク接続された複数のコンピュータの協働により、実施してもよい。
【0149】
また、上記第1実施形態では、教師ラベル画像12のラベル領域13の修正を、モルフォロジー処理により行う例を示したが、本発明はこれに限られない。本発明では、モルフォロジー処理以外の方法でラベル領域を修正してもよい。たとえば、未検出または誤検出が所定の閾値よりも多い場合に、教師ラベル画像12のラベル領域13を、判定用ラベル画像14のラベル領域13によって置き換えてもよい。また、たとえば、修正済み教師ラベル画像12aのラベル領域13の境界が、教師ラベル画像12のラベル領域13の境界と、判定用ラベル画像14のラベル領域13の境界との中間に位置するように修正してもよい。これらの場合、上記第1実施形態のように、必ずしも未検出評価値22および誤検出評価値23を用いる必要はない。
【0150】
また、上記第1実施形態では、未検出評価値22として上式(1)で示す検出率Kを用い、誤検出評価値23として上式(2)で示す精度Gを用いる例を示したが、本発明はこれに限られない。たとえば、検出率Kおよび精度Gのいずれか一方に代えて、下式(3)に示すIoU(Intersectional over Union)や、下式(4)に示すF値を用いてもよい。
IoU=TP/(TP+FN+FP) ・・・(3)
F値 =2K×G/(K+G) ・・・(4)
なお、上式(4)におけるKは、上式(1)に示した検出率であり、Gは、上式(2)に示した精度である。
【0151】
これらのIoUおよびF値は、未検出と誤検出との両方を評価する複合的な指標であり、未検出評価値22および誤検出評価値23の両方に該当する。IoUまたはF値と、検出率Kまたは精度Gと組み合わせて用いることにより、未検出と誤検出とを別個に評価することができる。たとえばIoUと検出率Kとを用いる場合、K≒IoU<<1のときは誤検出が少なく未検出が多いと判断され、1≒K>IoUのときは未検出が少なく誤検出が多いと判断される。
【0152】
なお、上記第1実施形態では、図11に示した2クラスの混同行列21を前提として、未検出評価値22および誤検出評価値23について説明したが、3クラス以上の多クラスのセグメンテーション処理にも適用可能である。説明は省略するが、3クラス以上の場合も、クラス数に応じた混同行列から、検出率や精度などの未検出評価値および誤検出評価値を求めればよい。
【符号の説明】
【0153】
1 学習用データセット
2 学習済みモデルモデル
2a 事前学習済みモデルモデル
10 学習データ
11 入力画像
12 教師ラベル画像
12a 修正済み教師ラベル画像(修正された教師ラベル画像)
13、13a、13b、13c、13d、13e、13f、13g ラベル領域
14 判定用ラベル画像
15 解析用画像
16 ラベル画像
17、17a、17b 部分画像
22 未検出評価値
23 誤検出評価値
51 判定用画像作成部
52 比較部
53 ラベル修正部
54 記憶部
60 優先度
100、200 画像解析装置
124、224 画像入力部
125、225 解析処理部
126、226 記憶部
図1
図2
図3
図4
図5
図6
図7
図8
図9
図10
図11
図12
図13
図14
図15
図16
図17
図18
図19
図20
図21
図22
図23