(19)【発行国】日本国特許庁(JP)
(12)【公報種別】特許公報(B2)
(11)【特許番号】
(24)【登録日】2024-12-16
(45)【発行日】2024-12-24
(54)【発明の名称】画像識別システム及び画像識別方法
(51)【国際特許分類】
G06T 7/00 20170101AFI20241217BHJP
【FI】
G06T7/00 350B
(21)【出願番号】P 2021123914
(22)【出願日】2021-07-29
【審査請求日】2024-02-01
(73)【特許権者】
【識別番号】000005108
【氏名又は名称】株式会社日立製作所
(74)【代理人】
【識別番号】110000350
【氏名又は名称】ポレール弁理士法人
(72)【発明者】
【氏名】倉田 明佳
(72)【発明者】
【氏名】汪 海林
【審査官】吉田 千裕
(56)【参考文献】
【文献】特開2020-160543(JP,A)
【文献】特開2014-215852(JP,A)
【文献】特開2013-125322(JP,A)
【文献】国際公開第2020/182710(WO,A1)
【文献】特開2020-160997(JP,A)
(58)【調査した分野】(Int.Cl.,DB名)
G06T 7/00
(57)【特許請求の範囲】
【請求項1】
識別対象画像の識別を行う画像識別モデルを構築するモデル構築部と、
教師画像と前記教師画像に付与されたラベルとの組み合わせの集合である第1の教師データセットに対して、前記第1の教師データセットの教師画像を分割した分割教師画像にラベルを付与し、前記分割教師画像と前記分割教師画像に付与されたラベルとの組み合わせの集合である第2の教師データセットを作成する教師データ作成部と、を有し、
前記モデル構築部は、前記第1の教師データセットまたは前記第2の教師データセットを用いて前記画像識別モデルを構築する学習部を備え、
前記教師データ作成部は、
前記第1の教師データセットの教師画像を分割し、前記分割教師画像の暫定ラベルとして分割前の教師画像に付与されたラベルを付与する画像分割部と、
前記分割教師画像のそれぞれに対してテクスチャ指標を算出するテクスチャ指標計算部と、
前記テクスチャ指標に基づき前記分割教師画像に付与された暫定ラベルを予測する暫定ラベル予測モデルを構築する暫定ラベル予測モデル構築部と、
前記分割教師画像に付与された第1の暫定ラベルと前記暫定ラベル予測モデルにより前記分割教師画像について予測された第2の暫定ラベルとを比較し、前記第1の暫定ラベルと前記第2の暫定ラベルとが異なる分割教師画像を暫定ラベルの修正の必要性が高い分割教師画像として抽出するラベル比較部と、
前記暫定ラベルの修正の必要性が高い分割教師画像として抽出された分割教師画像に付与するラベルを修正するラベル修正部とを備える、
ことを特徴とする画像識別システム。
【請求項2】
請求項1において、
前記画像識別モデルを用いて前記識別対象画像の識別を行う画像識別部をさらに有し、
前記モデル構築部は、前記第1の教師データセットを用いて構築した第1の画像識別モデル及び前記第2の教師データセットを用いて構築した第2の画像識別モデルのそれぞれについて識別精度を計算する識別精度計算部を備え、
前記画像識別部は、
前記第1の画像識別モデルの識別精度と前記第2の画像識別モデルの識別精度とを比較し、識別精度の高い画像識別モデルを前記識別対象画像の識別に用いる画像識別モデルとして選択するモデル選択部と、
前記モデル選択部で選択された画像識別モデルの教師画像の分割数にあわせて前記識別対象画像を分割して分割識別対象画像を作成する画像分割部と、
前記モデル選択部で選択された画像識別モデルを用いて前記分割識別対象画像の識別を行う識別部とを備える、
ことを特徴とする画像識別システム。
【請求項3】
請求項1において、
教師データセットの管理データを記憶する教師データ管理データベースを有し、
前記第2の教師データセットの前記管理データとして、前記教師データ作成部が前記第2の教師データセットを作成した過程を示すログデータを含む、
ことを特徴とする画像識別システム。
【請求項4】
請求項1において、
前記テクスチャ指標計算部は、前記分割教師画像のそれぞれに対してあらかじめ定められた複数のテクスチャ指標を算出し、
前記暫定ラベル予測モデル構築部は、前記複数のテクスチャ指標のうち、前記暫定ラベルと相関の高いテクスチャ指標を選択し、選択したテクスチャ指標に基づく前記暫定ラベル予測モデルを構築する、
ことを特徴とする画像識別システム。
【請求項5】
請求項4において、
前記テクスチャ指標として、輝度、周波数、均一性、局所一様性、コントラスト、エントロピー、不均一性、エッジの強さ、明暗の変化の強さ、コリレーション、またはこれらの線形結合のいずれかを含むことを特徴とする画像識別システム。
【請求項6】
請求項1において、
前記ラベル修正部は、
前記第1の暫定ラベルと前記第2の暫定ラベルとが等しい分割教師画像と前記第1の暫定ラベルとの組み合わせの集合である暫定的な第2の教師データセットを用いて前記モデル構築部が構築した暫定的な第2の画像識別モデルを用いて、前記第1の暫定ラベルと前記第2の暫定ラベルとが異なる分割教師画像を識別させることにより、前記暫定ラベルの修正の必要性が高い分割教師画像として抽出された分割教師画像のラベルを修正する、
ことを特徴とする画像識別システム。
【請求項7】
請求項1において、
前記ラベル修正部は、
前記第1の暫定ラベルと前記第2の暫定ラベルとが異なる分割教師画像を画像表示装置に表示し、当該分割教師画像に付与するラベルを選択させる、
ことを特徴とする画像識別システム。
【請求項8】
請求項2において、
前記教師データ作成部は、分割数の異なる複数の前記第2の教師データセットを作成し、
前記画像識別部の前記モデル選択部は、前記第1の画像識別モデルの識別精度と前記複数の第2の画像識別モデルの識別精度とを比較し、識別精度の最も高い画像識別モデルを前記識別対象画像の識別に用いる画像識別モデルとして選択する、
ことを特徴とする画像識別システム。
【請求項9】
請求項1において、
前記識別対象画像は顕微鏡画像であることを特徴とする画像識別システム。
【請求項10】
識別対象画像の識別を行う画像識別モデルを構築するモデル構築部と、教師画像と前記教師画像に付与されたラベルとの組み合わせの集合である第1の教師データセットに対して、前記第1の教師データセットの教師画像を分割した分割教師画像にラベルを付与し、前記分割教師画像と前記分割教師画像に付与されたラベルとの組み合わせの集合である第2の教師データセットを作成する教師データ作成部と、を備える画像識別システムを用いた画像識別方法であって、
前記教師データ作成部は、
前記第1の教師データセットの教師画像を分割し、前記分割教師画像の暫定ラベルとして分割前の教師画像に付与されたラベルを付与し、
前記分割教師画像のそれぞれに対してテクスチャ指標を算出し、
前記テクスチャ指標に基づき前記分割教師画像に付与された暫定ラベルを予測する暫定ラベル予測モデルを構築し、
前記分割教師画像に付与された第1の暫定ラベルと前記暫定ラベル予測モデルにより前記分割教師画像について予測された第2の暫定ラベルとを比較し、前記第1の暫定ラベルと前記第2の暫定ラベルとが異なる分割教師画像を暫定ラベルの修正の必要性が高い分割教師画像として抽出し、
前記暫定ラベルの修正の必要性が高い分割教師画像として抽出された分割教師画像に付与するラベルを修正し、
前記モデル構築部は、前記第1の教師データセット及び前記第2の教師データセットのそれぞれを用いて第1の画像識別モデル及び第2の画像識別モデルを構築する、
ことを特徴とする画像識別方法。
【請求項11】
請求項10において、
前記画像識別システムは、前記画像識別モデルを用いて前記識別対象画像の識別を行う画像識別部をさらに備え、
前記画像識別部は、
前記第1の画像識別モデルの識別精度と前記第2の画像識別モデルの識別精度とを比較し、識別精度の高い画像識別モデルを前記識別対象画像の識別に用いる画像識別モデルとして選択し、
選択された画像識別モデルの教師画像の分割数にあわせて前記識別対象画像を分割して分割識別対象画像を作成し、
選択された画像識別モデルを用いて前記分割識別対象画像の識別を行う、
ことを特徴とする画像識別方法。
【請求項12】
請求項10において、
前記教師データ作成部は、前記分割教師画像のそれぞれに対してあらかじめ定められた複数のテクスチャ指標を算出し、前記複数のテクスチャ指標のうち、前記暫定ラベルと相関の高いテクスチャ指標を選択し、選択したテクスチャ指標に基づく前記暫定ラベル予測モデルを構築する、
ことを特徴とする画像識別方法。
【請求項13】
請求項10において、
前記教師データ作成部は、前記第1の暫定ラベルと前記第2の暫定ラベルとが等しい分割教師画像と前記第1の暫定ラベルとの組み合わせの集合である暫定的な第2の教師データセットを用いて構築した暫定的な第2の画像識別モデルを用いて、前記第1の暫定ラベルと前記第2の暫定ラベルとが異なる分割教師画像を識別させることにより、前記暫定ラベルの修正の必要性が高い分割教師画像として抽出された分割教師画像のラベルを修正する、
ことを特徴とする画像識別方法。
【請求項14】
請求項10において、
前記教師データ作成部は、前記第1の暫定ラベルと前記第2の暫定ラベルとが異なる分割教師画像を画像表示装置に表示し、当該分割教師画像に付与するラベルを選択させる、
ことを特徴とする画像識別方法。
【請求項15】
請求項11において、
前記教師データ作成部は、分割数の異なる複数の前記第2の教師データセットを作成し、
前記画像識別部は、前記第1の画像識別モデルの識別精度と前記複数の第2の画像識別モデルの識別精度とを比較し、識別精度の最も高い画像識別モデルを前記識別対象画像の識別に用いる画像識別モデルとして選択する、
ことを特徴とする画像識別方法。
【発明の詳細な説明】
【技術分野】
【0001】
本発明は、画像識別システム及び画像識別方法に関する。
【背景技術】
【0002】
高機能材料の開発や品質管理において、材料のミクロな組成や、物質構造を顕微鏡により撮像された画像から識別することが行われる。従来は目視によって人が識別することが一般的であるが、近年の人工知能(AI)技術を用いた画像認識技術の急激な進展に伴い、機械学習の手法によりあらかじめ構築されたモデルを用いて、顕微鏡画像から自動的に識別することが期待される。これにより、人による認識のばらつきを排して均質な識別が低コストに行える。
【0003】
しかしながら、このような機械学習による画像識別モデルにより、撮像された材料の物質構造の分類を効率的、かつ正確に行うためには、画像識別モデルが適切、かつ多数の教師データによって学習を行う必要がある。このような品質と量の双方が要求される教師データの準備のためには、高いスキルを有する熟練者が必要となるため、工数をできるだけ抑えることが望ましい。
【0004】
特許文献1は、少ない顕微鏡画像から多量の教師データを構築するため、顕微鏡画像を分割処理して、教師データベースを拡充する技術を開示する。顕微鏡画像を分割処理することにより、分割された画像が元の顕微鏡画像の構造とは異なる、他の構造と混同されやすい画像となるおそれがあることから、分割画像の特徴量を算出し、特徴量と閾値とを比較し、特徴量が閾値を満たさない分割画像については、教師データから削除する。
【0005】
本実施例として、顕微鏡画像に表れるテクスチャから物質のミクロな組成や物質構造を推定するシステムについて開示するが、リモートセンシングの分野でも衛星画像に表れるテクスチャから地表面の利用状況や環境について推定することが行われている。非特許文献1には、衛星画像のテクスチャ解析に用いられるテクスチャ指標が開示されている。
【先行技術文献】
【特許文献】
【0006】
【非特許文献】
【0007】
【文献】Jingjing Zhou et. al., “The Effects of GLCM parameters on LAI estimation using texture values from Quickbird Satellite Imagery” Scientific Reports volume 7, Article number: 7366 (2017)
【発明の概要】
【発明が解決しようとする課題】
【0008】
特許文献1では、分割画像の教師データとしての適不適を判定するための画像の特徴量としては、色度、輝度、コントラスト、構造パターン、周波数や情報量(エントロピー)などが例示されており、モデルの目的に応じた特徴量が選択され、適否を判定するための特徴量の閾値があらかじめ定められている。観察対象の顕微鏡画像の特徴について、あらかじめ十分な予備知識を備えていれば、適切な特徴量とその閾値の選択は可能であると考えられるが、そのような予備知識がない場合においても分割画像の適否を適切に判断することが望ましい。
【課題を解決するための手段】
【0009】
本発明の一実施態様である画像識別システムは、識別対象画像の識別を行う画像識別モデルを構築するモデル構築部と、教師画像と教師画像に付与されたラベルとの組み合わせの集合である第1の教師データセットに対して、第1の教師データセットの教師画像を分割した分割教師画像にラベルを付与し、分割教師画像と分割教師画像に付与されたラベルとの組み合わせの集合である第2の教師データセットを作成する教師データ作成部と、を有し、
モデル構築部は、第1の教師データセットまたは第2の教師データセットを用いて画像識別モデルを構築する学習部を備え、
教師データ作成部は、第1の教師データセットの教師画像を分割し、分割教師画像の暫定ラベルとして分割前の教師画像に付与されたラベルを付与する画像分割部と、分割教師画像のそれぞれに対してテクスチャ指標を算出するテクスチャ指標計算部と、テクスチャ指標に基づき分割教師画像に付与された暫定ラベルを予測する暫定ラベル予測モデルを構築する暫定ラベル予測モデル構築部と、分割教師画像に付与された第1の暫定ラベルと暫定ラベル予測モデルにより分割教師画像について予測された第2の暫定ラベルとを比較し、第1の暫定ラベルと第2の暫定ラベルとが異なる分割教師画像を暫定ラベルの修正の必要性が高い分割教師画像として抽出するラベル比較部と、暫定ラベルの修正の必要性が高い分割教師画像として抽出された分割教師画像に付与するラベルを修正するラベル修正部とを備える。
【発明の効果】
【0010】
教師画像を分割した分割教師画像を用いて、高い識別精度をもつ画像識別モデルを構築可能とする。その他の課題と新規な特徴は、本明細書の記述および添付図面から明らかになるであろう。
【図面の簡単な説明】
【0011】
【
図1】画像識別モデルを構築するフローチャートである。
【
図2】未知画像(識別対象画像)を識別するフローチャートである。
【
図3B】第2の教師データセット(暫定ラベル付与)の例である。
【
図3C】暫定的な第2の教師データセットの例である。
【
図3D】第2の教師データセット(修正ラベル付与)の例である。
【
図4】暫定ラベルの修正の必要性が高い分割教師画像を抽出するフローチャートである。
【
図5A】重要テクスチャ指標空間におけるノードの分布例である。
【
図5B】モデル(決定木)を用いて予測された予測ラベルの分布である。
【
図6】画像識別モデルを用いて暫定ラベルを修正するフローチャートである。
【
図7】ユーザがラベルを個別に修正するフローチャートである。
【
図8】顕微鏡画像テクスチャ解析システムの機能ブロック図である。
【
図9A】第1の教師データセットの管理データ例である。
【
図9B】第2の教師データセットの管理データ例である。
【
図11】教師画像の最適な分割数を選択するフローチャートである。
【
図12】識別モデル管理データベースのデータ構造の例である。
【発明を実施するための形態】
【0012】
図8に本実施例の顕微鏡画像テクスチャ解析システムの機能ブロック図を示す。顕微鏡画像テクスチャ解析システムは、主要な構成として、PC、サーバ等の情報処理装置10、画像表示装置20及び入力装置30を有する。情報処理装置10は、処理装置(プロセッサ)及び記憶装置を備えている。
【0013】
顕微鏡画像テクスチャ解析システムの機能は、情報処理装置10の記憶装置に格納されたプログラムが処理装置(プロセッサ)によって実行されることによって実現される。情報処理装置10の物理的な構成としては、単体のサーバ、PCで構成されてもよいし、処理装置、記憶装置の任意の部分がネットワークで接続された複数のサーバで構成されてもよい。また、ソフトウェアで構成する機能の全部または一部と同等の機能を、FPGA(Field Programmable Gate Array)やASIC(Application Specific Integrated Circuit)などのハードウェアで実現してもよい。
【0014】
図8では、顕微鏡画像テクスチャ解析システムが実現する機能的な特徴に着目して、機能ブロック図として示している。各機能の詳細については後述する。
【0015】
記憶装置400は、HDD(Hard Disk Drive)、SSD(Solid State Drive)のような不揮発メモリであり、システムの処理に必要なデータ、処理の結果得られるデータが格納される。これらのデータの詳細については後述する。
【0016】
情報処理装置10は、画像表示装置20、キーボードやポインティングデバイスのような入力装置30と接続されている。ユーザは、画像表示装置20に表示されたGUI(Graphical User Interface)に対して、入力装置30を用いてユーザからの指示を入力する。
【0017】
図1に顕微鏡画像テクスチャ解析システムにおいて画像識別モデルを構築するフローチャートを示す。このフローチャートにおいて、教師画像を分割した分割画像を新たな教師画像として学習を行った画像識別モデル(第2の画像識別モデル)を構築する。画像識別モデルはCNN(畳み込みニューラルネットワーク)のような既知の手法を用いる。ここで、分割する教師画像が全体的に一様なテクスチャを示す画像であれば、分割画像に付与されるラベルは元の教師画像のラベルと同一と考えてよい。しかし、教師画像が複数のテクスチャが入り混じった不均一な画像である場合もある。この場合、教師画像のクラス分類は、その大部分を占めるテクスチャ、特徴的なテクスチャ、あるいはテクスチャの特徴的な組み合わせにしたがってなされる。このような教師画像を分割した分割画像は、元の教師画像が全体として有していた特徴を必ずしも備えておらず、このため、仮に分割画像に機械的に元の教師画像と同じラベルを付与した教師データを用いて画像識別モデルを構築したとすれば、かえって画像識別モデルの識別精度を低下させるおそれがある。本実施例では、ユーザによる分割教師画像のクラス再分類の負担を抑えて高品質な分割画像に基づく教師画像セットを作成可能とする。
【0018】
最初に、モデル構築部200は、元の教師画像である第1の教師データセットを用いて画像識別モデルを構築する。学習部210は、教師データ管理データベース410を参照し、教師画像記憶部430から第1の教師データセットの教師画像を読み込み、第1の画像識別モデルを構築する(S01)。
【0019】
教師画像と教師画像に付与されたラベルとの組み合わせの集合を教師データセットと呼び、
図9Aに、教師データ管理データベース410に登録されている第1の教師データセットの管理データ例を示す。データベース410には、第1の教師データセットを構成する教師画像について、画像ID601、ファイル名602、ラベル603が登録されている。画像ID601は教師画像を一意に特定するIDである。ファイル名602は教師画像記憶部430に記憶された教師画像のファイル名である。ラベル603は教師画像に付与されたラベルである。
図3Aに、
図9Aに示す第1の教師データセットの例を示す。
【0020】
次に、識別精度計算部220は、交差検証により、第1の画像識別モデルの識別精度を求め、識別モデル管理データベース420に記憶する(S02)。
図12に識別モデル管理データベース420のデータ構造の例を示す。データベース420は、モデルID801、作成日802、ファイル名803、教師データセット804、分割数805、識別精度806といったカラムを含んでいる。モデルID801は、データベース420のレコードを一意に特定するIDである。作成日802はレコードの作成日である。ファイル名803は識別モデル記憶部440に記憶された画像識別モデルのファイル名である。教師データセット804は、当該画像識別モデルの構築に使用した教師データセットである。分割数805は、元の教師画像を分割した数である。識別精度806は当該画像識別モデルに交差検証を行って得られる識別精度である。
【0021】
図12におけるモデルID「#1」が第1の画像識別モデルのレコードであり、第1の画像識別モデルは、元の教師画像そのままである第1の教師データセットにより構築したモデルであるから、分割数805は「1×1」とされている。ステップS02で得られた第1の画像識別モデルの識別精度はカラム806に記憶される。
【0022】
続いて、元の教師画像を分割して新たな教師データセットを作成する工程について説明する。以下では、第1の教師データセット(
図3A)を構成する教師画像を縦横方向にそれぞれ2等分割(「2×2」)して、第2の教師データセットを作成する例を参照しながら説明する。
図9Bに、本工程で教師データ管理データベース410に登録される第2の教師データセットの管理データ例を示す。本工程において、第2の教師データセットを構成する教師画像について、画像ID611、ファイル名612、分割前画像ID613、分割数614、暫定ラベル615、予測ラベル616、X/Y画像群617、修正ラベル618が登録される。
【0023】
まず、画像分割部110は、教師画像を分割して教師画像記憶部430に保存し、画像分割数を教師データ管理データベース410に書き込み(S03)、分割された教師画像に対して、暫定ラベルとして、第1の教師データセットと同一のラベルを付与する(S04)。この段階で、
図9Bに示す管理データのカラム611~615が登録される。
図3Bに、ステップS04段階での第2の教師データセットを示す。
図3Aと
図3Bとを比較すれば明らかなように、分割教師画像の暫定ラベルにはそれぞれ、分割前教師画像のラベルが付与されている。
【0024】
図9Bにおいて、画像ID611は分割教師画像を一意に特定するIDであり、ここでは、分割前の画像ID613に枝番号を付することによって特定している。ファイル名612は教師画像記憶部430に記憶された分割教師画像のファイル名である。分割数614は分割前画像からの分割数を示す。暫定ラベル615には、分割前画像に付与されていたラベルが機械的に分割教師画像に付与されている。
【0025】
続いて、分割教師画像のうち、暫定ラベルを修正する必要性の高いものを抽出する(S05)。このため、画像のテクスチャ指標を抽出し、画像のテクスチャ指標に基づく解析モデルを構築し、解析モデルによる予測されるラベルと暫定ラベルとを比較することにより、修正が必要である可能性の高い暫定ラベルを抽出する。ステップS05の詳細を
図4に示す。
【0026】
テクスチャ指標計算部120は、分割教師画像に対して、それぞれあらかじめ定められたN個のテクスチャ指標を算出する(S21)。テクスチャ指標は、画像のテクスチャを指標化したものであり、例えば、輝度、周波数、均一性、局所一様性、コントラスト、エントロピー、不均一性、エッジの強さ、明暗の変化の強さ、コリレーション、またはこれらの線形結合といったテクスチャ指標が考えられる。これらはいずれも例示であって、これら以外のテクスチャ指標を用いてもよい。
【0027】
暫定ラベル予測モデル構築部130は、N個のテクスチャ指標から、暫定ラベルとの相関が高いテクスチャ指標を選択して暫定ラベルを予測するモデル(決定木)を構築し(S22)、モデル(決定木)に使用するテクスチャ指標(重要テクスチャ指標と呼ぶ)及び閾値を記憶する(S23)。
図5Aに重要テクスチャ指標空間におけるノードの分布例を示す。各ノードは分割教師画像に対応しており、付与された暫定ラベルごとに色分けして示している。テクスチャ指標空間において、破線によって示される閾値に区分された領域内に分布するノードの暫定ラベルができるだけ同じになるよう、モデル(決定木)の構築においては、暫定ラベルとの相関が高いテクスチャ指標をモデル構築に使用するテクスチャ指標として選択し、異なる暫定ラベルのノードができるだけ混在しないよう、空間を区分する閾値を適切に選択する。ここでは図示しやすい2つのテクスチャ指標によって定義される重要テクスチャ指標空間の例を示しているが、2以上の指標によって定義される重要テクスチャ指標空間に基づくモデルであってもよい。
【0028】
ステップS22で作成したモデル(決定木)を用いて、分割教師画像のラベルを予測する(S24)。モデルを用いて予測した暫定ラベルを予測ラベルと呼ぶ。
図5Aのモデル(決定木)を用いて予測された予測ラベルの分布を
図5Bに示す。
図5Aと
図5Bではノードの分布は同じであり、
図5Bに示す予測ラベルは、破線によって示される閾値に区分された領域内に分布するノードについては同一となっている点で
図5Aの暫定ラベルと異なる。
【0029】
ラベル比較部140は、テクスチャ指標により予測された予測ラベルと暫定ラベルとを比較し、両者が一致する画像を画像群Xとし、両者が一致しない画像を画像群Yとし(S25)、画像群Yを、暫定ラベルを修正する必要性の高い教師画像として教師データ管理データベース410に登録する(S26)。
図5Bの例では、矢印を付して示したノードに対応する分割教師画像が画像群Yに分類され、それ以外のノードに対応する分割教師画像が画像群Xに分類される。
【0030】
ステップS05が終了した段階で、
図9Bに示す管理データのカラム616~617が登録される。予測ラベル616にはステップS24で予測した予測ラベルが、X/Y画像群617にはステップS25で分類された画像群の区分が登録される。このように、テクスチャ指標を決め打ちするのではなく、暫定ラベルをよく再現するテクスチャ指標を選択する工程を実施することにより、どのような顕微鏡画像であっても暫定ラベルを修正する必要性の高い分割教師画像を適切に抽出することが可能になる。
【0031】
以上説明したステップS05(
図1参照)において、暫定ラベルを修正する必要が高いとして抽出された分割教師画像に対して、ラベル修正部150は、ラベルの確認・修正を行い、第2の教師データセットとする(S06)。ラベルの修正は、画像識別モデルを用いて自動的に行うようにしてもよいし、GUIを用いてユーザが個別に修正するようにしてもよい。それぞれの修正方法について説明する。
【0032】
図6はモデルを用いて暫定ラベルを修正するフローチャートである。ステップS25の分類結果に基づき、画像群Xと暫定ラベルとの組み合わせを暫定的な第2の教師データセットとする(S31)。
図3Cに、暫定的な第2の教師データセットを示す。モデル構築部200の学習部210は、暫定的な第2の教師データセットを用いて暫定的な第2の画像識別モデルを構築し(S32)、画像識別部300の識別部330は、画像群Yの分割教師画像に付与するラベルを暫定的な第2の画像識別モデルを用いて推定する(S33)。暫定的な第2の画像識別モデルで推定されたラベルを画像群Yの分割教師画像のラベルに修正する(S34)。
【0033】
図7はGUIを用いてユーザがラベルを個別に修正するフローチャートである。ステップS25で画像群Yに分類された分割教師画像とその暫定ラベルを、GUIを通じてユーザに提示し、ラベルを修正するかどうかを問い合わせる(S41)。
図10にGUI画面の例を示す。ユーザはGUI画面700に表示された分割教師画像に対して目視により該当するラベルを選択することにより、ラベルを修正する(S42)。
【0034】
図3Dに画像群Yの分割教師画像のラベルが修正された第2の教師データセットを示す。いずれの修正方法によっても画像群Yの分割教師画像に付与されるラベルが修正されると、
図9Bに示す管理データのカラム618(修正ラベル618)に、各分割教師画像に付与されたラベルが登録される(S07)。このように、第2の教師データセットの分割教師画像に付与されるラベルが最終的に確定するまでのログデータが教師データ管理データベース410に残ることで、例えば、第2の教師データセットを用いて構築される第2の画像識別モデルの識別精度が向上しないといった不具合がある場合に、その原因の検討に用いることができる。
【0035】
このようにして作成された第2の教師データセットを用いて、モデル構築部200の学習部210は、第2の画像識別モデルを構築し(S08)、識別精度計算部220は交差検証により第2の画像識別モデルの識別精度を求め、識別モデル管理データベース420に記憶する(S09)。ここでの処理は、ステップS01,S02と同様であるので、重複する説明は省略する。
【0036】
続いて、画像識別部300のモデル選択部310は、第1の画像識別モデルと第2の画像識別モデルの識別精度を比較し、より識別精度の高い画像識別モデルを未知画像(識別対象画像)の識別を行う画像識別モデルとして選択する(S10)。
【0037】
図2に、ステップS10で選択された画像識別モデルを用いて、識別対象画像を識別するフローチャートを示す。本フローチャートは、画像識別部300によって実行される。
【0038】
まず、識別部330は、モデル選択部310が選択した画像識別モデルを識別モデル記憶部440から読み出す(S11)。
【0039】
一方、画像分割部320は、識別モデル管理データベース420を参照し、モデル選択部310が選択した画像識別モデルが使用した教師データセットの分割数805を読み込む(S12)。続いて、識別対象画像を読み込み(S13)、読み込んだ識別対象画像をステップS12で読み込んだ分割数で分割する(S14)。例えば、ステップS10で第2の識別モデルが選択されたとすれば、識別部330は、第2の画像識別モデルを用いて、2×2に分割された識別対象画像を識別し(S15)、識別結果を識別結果記憶部450に記憶する(S16)。
【0040】
以上の説明では、教師画像の分割数を2×2とする例を説明したが、分割数はこれに限られない。複数の分割方法を試行して最適な画像識別モデルを選択するようにしてもよい。
図11にそのフローチャートを示す。
図11では教師画像を縦横それぞれ2
n等分に分割した分割教師画像を用いて第n+1の教師データセットを作成する。nがmとなるまで1から順次1を加算して(S58,S59)、ステップS54~S57を繰り返すことで第1から第m+1の教師データセットを作成し、さらにこれらの教師データセットを用いた第1から第m+1の画像識別モデルの構築及び識別精度の算出を行う。n=1である場合のステップS51~S57は、
図1のフローチャートにおけるS01~S09と同じ処理であり、
図11のフローは、同じ処理を教師画像の分割数を変えて繰り返しているため、重複する説明は省略する。この過程で構築される識別モデルの情報は
図12に示すように、識別モデル管理データベース420に格納される。
【0041】
画像識別部300のモデル選択部310は、第1から第m+1の識別モデルの識別精度を比較し、識別精度の最も高い画像識別モデルを識別対象画像の識別を行う画像識別モデルとして選択する(S60)。
【0042】
以上、本発明を実施例、変形例に基づき説明した。本発明は、上記した実施例、変形例に限定されるものではなく、発明の要旨を変更しない範囲でさまざまな変形が可能である。
【符号の説明】
【0043】
10:情報処理装置、20:画像表示装置、30:入力装置、100:教師データ作成部、110:画像分割部、120:テクスチャ指標計算部、130:暫定ラベル予測モデル構築部、140:ラベル比較部、150:ラベル修正部、200:モデル構築部、210:学習部、220:識別精度計算部、300:画像識別部、310:モデル選択部、320:画像分割部、330:識別部、400:記憶装置、410:教師データ管理データベース、420:識別モデル管理データベース、430:教師画像記憶部、440:識別モデル記憶部、450:識別結果記憶部、601:画像ID、602:ファイル名、603:ラベル、611:画像ID、612:ファイル名、613:分割前画像ID、614:分割数、615:暫定ラベル、616:予測ラベル、617:X/Y画像群、618:修正ラベル、700:GUI画面、801:モデルID、802:作成日、803:ファイル名、804:教師データセット、805:分割数、806:識別精度。