(19)【発行国】日本国特許庁(JP)
(12)【公報種別】公開特許公報(A)
(11)【公開番号】P2022119640
(43)【公開日】2022-08-17
(54)【発明の名称】データ生成装置及びデータ生成方法
(51)【国際特許分類】
G06N 20/00 20190101AFI20220809BHJP
G16H 30/00 20180101ALI20220809BHJP
G16H 50/00 20180101ALI20220809BHJP
G16H 80/00 20180101ALI20220809BHJP
【FI】
G06N20/00
G16H30/00
G16H50/00
G16H80/00
【審査請求】未請求
【請求項の数】8
【出願形態】OL
(21)【出願番号】P 2021016901
(22)【出願日】2021-02-04
(71)【出願人】
【識別番号】596100812
【氏名又は名称】京セラコミュニケーションシステム株式会社
(71)【出願人】
【識別番号】509349141
【氏名又は名称】京都府公立大学法人
(74)【代理人】
【識別番号】100147485
【弁理士】
【氏名又は名称】杉村 憲司
(74)【代理人】
【識別番号】230118913
【弁護士】
【氏名又は名称】杉村 光嗣
(74)【代理人】
【識別番号】100132045
【弁理士】
【氏名又は名称】坪内 伸
(74)【代理人】
【識別番号】100203264
【弁理士】
【氏名又は名称】塩川 未久
(72)【発明者】
【氏名】上野 賢吾
(72)【発明者】
【氏名】上田 啓喜
(72)【発明者】
【氏名】辺見 航平
(72)【発明者】
【氏名】東 正雪
(72)【発明者】
【氏名】浮村 理
(72)【発明者】
【氏名】金子 正大
(72)【発明者】
【氏名】辻 恵介
【テーマコード(参考)】
5L099
【Fターム(参考)】
5L099AA03
5L099AA04
(57)【要約】
【課題】学習データセットを効率良く生成可能な、データ生成装置及びデータ生成方法を提供する。
【解決手段】データ生成装置は、医用画像と、学習済みモデルによって判定された医用画像の病変の種類と、病変の種類に付与された自信度とを取得する。データ生成装置は、自信度が閾値を超えると判定するとき、医用画像を、病変の種類に対応付けて、学習データセットに保存する。データ生成装置は、自信度が閾値以下であると判定するとき、医用画像のデータを、第1端末装置に送信する。
【選択図】
図1
【特許請求の範囲】
【請求項1】
医用画像と、学習済みモデルによって判定された前記医用画像の病変の種類と、前記病変の種類に付与された自信度とを取得し、
前記自信度が閾値を超えると判定するとき、前記医用画像を、前記病変の種類に対応付けて、学習データセットに保存し、
前記自信度が前記閾値以下であると判定するとき、前記医用画像のデータを、第1端末装置に送信する、データ生成装置。
【請求項2】
請求項1に記載のデータ生成装置であって、
前記データ生成装置は、前記医用画像を、前記第1端末装置から受信した病変の種類に対応付けて、学習データセットに保存する、データ生成装置。
【請求項3】
請求項1に記載のデータ生成装置であって、
前記データ生成装置は、前記第1端末装置から受信した病変の種類と、前記学習済みモデルによって判定された前記医用画像の病変の種類とが一致すると判定するとき、前記医用画像を、前記第1端末装置から受信した病変の種類に対応付けて、学習データセットに保存する、データ生成装置。
【請求項4】
請求項3に記載のデータ生成装置であって、
前記データ生成装置は、
前記第1端末装置から受信した病変の種類と、前記学習済みモデルによって判定された前記医用画像の病変の種類とが一致しないと判定するとき、前記第1端末装置とは異なる第2端末装置に、前記医用画像のデータを送信し、
前記医用画像を、学習済みモデルによって判定された前記医用画像の病変の種類と、前記第1端末装置から受信した病変の種類と、前記第2端末装置から受信した病変の種類とに対応付けて、学習データセットに保存する、データ生成装置。
【請求項5】
請求項4に記載のデータ生成装置であって、
前記データ生成装置は、前記第1端末装置から受信した病変の種類及び前記第2端末装置から受信した病変の種類の少なくとも何れかに基づいて、前記学習済みモデルを更新させるための更新データセットを生成する、データ生成装置。
【請求項6】
請求項5に記載のデータ生成装置であって、
前記データ生成装置は、前記医用画像に対して、前記第1端末装置からのみ病変の種類を受信した場合、当該医用画像を、当該病変の種類及び第1重み係数に対応付けて、前記更新データセットに保存する、データ生成装置。
【請求項7】
請求項6に記載のデータ生成装置であって、
前記データ生成装置は、同じ前記医用画像に対して、前記第1端末装置及び前記第2端末装置の両方から病変の種類を受信した場合に、前記第1端末装置から受信した病変の種類と、前記第2端末装置から受信した病変の種類とが一致しないと判定するとき、当該医用画像を、前記第1端末装置及び前記第2端末装置の各々から受信した病変の種類と、前記第1重み係数よりも小さい第2重み係数とに対応付けて、前記更新データセットに保存する、データ生成装置。
【請求項8】
医用画像と、学習済みモデルによって判定された前記医用画像の病変の種類と、前記病変の種類に付与された自信度とを取得するステップと、
前記自信度が閾値を超えると判定するとき、前記医用画像を、前記病変の種類に対応付けて、学習データセットに保存するステップと、
前記自信度が前記閾値以下であると判定するとき、前記医用画像のデータを、第1端末装置に送信するステップと
を含む、データ生成方法。
【発明の詳細な説明】
【技術分野】
【0001】
本開示は、データ生成装置及びデータ生成方法に関する。
【背景技術】
【0002】
従来、機械学習を利用して、画像から病変を診断する方法が知られている(例えば、特許文献1)。
【0003】
特許文献1には、ディジタル乳房X線像から微小石灰化物を含んでいる疑いのある関心領域を抽出することと、関心領域を数値データに変換することとが記載されている。さらに、特許文献1には、その数値データを、微小石灰化物を検出するように学習が行われたニューラルネットワークに入力することが記載されている。
【先行技術文献】
【特許文献】
【0004】
【発明の概要】
【発明が解決しようとする課題】
【0005】
ところで、機械学習には、学習データが必要である。従来の技術では、学習データを効率良く生成することが求められている。
【0006】
かかる点に鑑みてなされた本開示の目的は、学習データを効率良く生成可能な、データ生成装置及びデータ生成方法を提供することにある。
【課題を解決するための手段】
【0007】
本開示の一実施形態に係るデータ生成装置は、医用画像と、学習済みモデルによって判定された前記医用画像の病変の種類と、前記病変の種類に付与された自信度とを取得する。前記データ生成装置は、前記自信度が閾値を超えると判定するとき、前記医用画像を、前記病変の種類に対応付けて、学習データセットに保存する。前記データ生成装置は、前記自信度が前記閾値以下であると判定するとき、前記医用画像のデータを、第1端末装置に送信する。
【0008】
本開示の一実施形態に係るデータ生成方法は、医用画像と、学習済みモデルによって判定された前記医用画像の病変の種類と、前記病変の種類に付与された自信度とを取得するステップを含む。前記データ生成方法は、前記自信度が閾値を超えると判定するとき、前記医用画像を、前記病変の種類に対応付けて、学習データセットに保存するステップを含む。前記データ生成方法は、前記自信度が前記閾値以下であると判定するとき、前記医用画像のデータを、第1端末装置に送信するステップを含む。
【発明の効果】
【0009】
本開示の一実施形態によれば、学習データセットを効率良く生成可能な、データ生成装置及びデータ生成方法が提供され得る。
【図面の簡単な説明】
【0010】
【
図1】本開示の第1実施形態に係るデータ生成システムの概略構成を示す図である。
【
図2】本開示の第1実施形態に係るデータ生成装置の動作を示すフローチャートである。
【
図3】本開示の第2実施形態に係る学習データセットを示す図である。
【
図4】本開示の第2実施形態に係るデータ生成装置の動作を示すフローチャートである。
【
図5】本開示の第2実施形態に係るデータ生成装置の動作を示すフローチャートである。
【
図6】本開示の第3実施形態に係る更新データセットを示す図である。
【
図7】本開示の第3実施形態に係る学習データセットの経時変化を示す図である。
【
図8】本開示の第3実施形態に係るデータ生成装置の動作を示すフローチャートである。
【
図9】本開示の第3実施形態に係るデータ生成装置の動作を示すフローチャートである。
【発明を実施するための形態】
【0011】
以下、本開示に係る実施形態について、図面を参照して説明する。
【0012】
(第1実施形態)
図1は、本開示の第1実施形態に係るデータ生成システム1の概略構成を示す図である。データ生成システム1は、学習データセット33を生成する。学習データセット33は、医療用の診断装置の機械学習に用いられ得る。当該診断装置は、例えば、医用画像から、医用画像の病変の種類を診断するものであってよい。
【0013】
本開示において「医用画像の病変」は、医用画像に像として含まれる検体の病変を意味する。また、医用画像は、組織片又は細胞等の検体を撮像した任意の種類の画像であってよい。例えば、医用画像は、X線CT(Computed Tomography)画像、X線画像、MRI(Magnetic Resonance Imaging)画像、核医学画像、又は超音波画像等であってよい。
【0014】
データ生成システム1は、端末装置10A,10B,10Cと、情報処理装置20と、データ生成装置30とを備える。端末装置10A~10Cと、情報処理装置20と、データ生成装置30とは、ネットワーク2を介して通信可能である。ネットワーク2は、移動体通信ネットワーク及びインターネット等を含む任意のネットワークであってよい。情報処理装置20とデータ生成装置30とは、ネットワーク2を介さずに、直接通信可能であってよい。以下、情報処理装置20とデータ生成装置30とは、ネットワーク2を介さずに、直接通信するものとする。ただし、情報処理装置20とデータ生成装置30とは、ネットワーク2を介して通信してもよい。
【0015】
以下、端末装置10Aと、端末装置10Bと、端末装置10Cとを特に区別しない場合、これらは、まとめて「端末装置10」と記載される。
図1に示す構成では、データ生成システム1が備える端末装置10の数は、3個である。ただし、データ生成システム1が備える端末装置10の数は、任意であってよい。例えば、データ生成システム1が備える端末装置10の数は、2個以下であってよいし、4個以上であってよい。
【0016】
異なる端末装置10は、異なる作業者によって使用され得る。例えば、端末装置10Aは、作業者Aによって使用され得る。端末装置10Bは、作業者Bによって使用され得る。端末装置10Cは、作業者Cによって使用され得る。
【0017】
端末装置10を使用する作業者は、医師等の医療従事者であってよい。作業者は、端末装置10を使用して、アノテーション作業を実施する。アノテーション作業とは、医用画像に、その医用画像の病変の種類をラベル付けする作業である。作業者は、アノテーション作業とは別に、通常業務を有し得る。例えば作業者が医師である場合、通常業務は、患者の診察等である。作業者には、通常業務を行っていない時間帯に、アノテーション作業を実施することが求められる。
【0018】
端末装置10は、パーソナルコンピュータ又はタブレット端末装置等であってよい。端末装置10は、通信部11と、表示部12と、入力部13と、記憶部14と、制御部15とを有する。
【0019】
通信部11は、ネットワーク2に接続可能な少なくとも1つの通信モジュールを含んで構成されていてよい。例えば、通信モジュールは、LTE(Long Term Evolution)、4G(4th Generation)、又は5G(5th Generation)等の移動体通信規格に対応した通信モジュールであってよい。例えば、通信モジュールは、有線LAN(Local Area Network)又は無線LAN等の規格に対応した通信モジュールであってよい。通信部11は、有線LAN又は無線LAN等の規格に対応した通信モジュールによって、有線LAN又は無線LANを介してネットワーク2に接続されてもよい。
【0020】
表示部12は、LCD(Liquid Crystal Display)又は有機EL(Electro Luminescence)ディスプレイ等の任意のディスプレイを含んで構成されていてよい。表示部12は、制御部15の制御に基づいて、医用画像を表示する。作業者は、表示部12から、医用画像を視認し得る。作業者は、表示部12から医用画像を視認することにより、その医用画像の病変の種類を診断し得る。
【0021】
入力部13は、ユーザ入力を検出可能な1つ以上のインタフェースを含む。例えば、入力部13は、物理キー、静電容量キー、及びタッチスクリーンの少なくとも何れかを含んで構成されていてよい。作業者は、医用画像の病変の種類を、入力部13から入力し得る。
【0022】
記憶部14は、少なくとも1つの半導体メモリ、少なくとも1つの磁気メモリ、少なくとも1つの光メモリ、又はこれらのうちの少なくとも2種類の組み合わせを含んで構成されていてよい。半導体メモリは、例えば、RAM(Random Access Memory)又はROM(Read Only Memory)である。RAMは、例えば、SRAM(Static Random Access Memory)又はDRAM(Dynamic Random Access Memory)である。ROMは、例えば、EEPROM(Electrically Erasable Programmable Read Only Memory)である。記憶部14は、主記憶装置、補助記憶装置、又はキャッシュメモリとして機能してよい。記憶部14は、制御部15を機能させる多様なプログラム及び制御部15が用いる多様な情報を記憶する。例えば、記憶部14は、作業者の識別子の情報を記憶する。
【0023】
制御部15は、1つ以上のプロセッサ及びメモリを含む。プロセッサは、特定のプログラムを読み込ませて特定の機能を実行する汎用のプロセッサ、及び、特定の処理に特化した専用のプロセッサを含んでよい。専用のプロセッサは、特定用途向けIC(ASIC:Application Specific Integrated Circuit)を含んでよい。プロセッサは、プログラマブルロジックデバイス(PLD:Programmable Logic Device)を含んでよい。PLDは、FPGA(Field-Programmable Gate Array)を含んでよい。制御部15は、1つ又は複数のプロセッサが協働するSoC(System-on-a-Chip)、及び、SiP(System-in-a-Package)の何れかであってよい。
【0024】
制御部15は、ネットワーク2を介してデータ生成装置30から、医用画像のデータ及び医用画像の識別子を示す情報を、通信部11によって取得し得る。制御部15は、データ生成装置30から医用画像のデータを取得すると、その医用画像を表示部12に表示させる。表示部12に医用画像が表示されると、作業者によって入力部13から、その医用画像の病変の種類が入力され得る。制御部15は、作業者からの病変の種類の入力を、入力部13によって検出し得る。制御部15は、病変の種類の入力を検出すると、作業者の識別子を示す情報と、医用画像の識別子を示す情報と、病変の種類を示す情報とを、ネットワーク2を介してデータ生成装置30に、通信部11によって送信し得る。
【0025】
情報処理装置20は、アノテーション作業を実行し得る。情報処理装置20は、汎用のコンピュータであってよいし、アノテーション作業を実行するための専用のコンピュータであってもよい。情報処理装置20は、通信部21と、記憶部22と、制御部24とを有する。
【0026】
通信部21は、ネットワーク2に接続可能な少なくとも1つの通信モジュールを含んで構成されていてよい。例えば、ネットワーク2に接続可能な通信モジュールは、LTE、4G、又は5G等の移動体通信規格に対応した通信モジュールであってよい。通信部21は、データ生成装置30と通信可能な通信モジュールを含んで構成されていてよい。データ生成装置30と通信可能な通信モジュールは、有線LAN又は無線LAN等の規格に対応した通信モジュールであってよい。通信部21は、有線LAN又は無線LAN等の規格に対応した通信モジュールによって、有線LAN又は無線LANを介してデータ生成装置30と直接通信し得る。また、通信部21は、有線LAN又は無線LAN等の規格に対応した通信モジュールによって、有線LAN又は無線LANを介してネットワーク2に接続されてもよい。
【0027】
記憶部22は、少なくとも1つの半導体メモリ、少なくとも1つの磁気メモリ、少なくとも1つの光メモリ、又はこれらのうちの少なくとも2種類の組み合わせを含んで構成されていてよい。半導体メモリは、例えば、RAM又はROMである。RAMは、例えば、SRAM又はDRAMである。ROMは、例えば、EEPROMである。記憶部22は、主記憶装置、補助記憶装置、又はキャッシュメモリとして機能してよい。記憶部22は、制御部24を機能させる多様なプログラム及び制御部24が用いる多様な情報を記憶する。記憶部22は、学習済みモデル23を含む。
【0028】
学習済みモデル23は、既存の学習データセットを用いた機械学習により生成されたものであってよい。既存の学習データセットは、作業者が既にアノテーション作業を実施したデータによって生成されてよい。学習済みモデル23を生成する機械学習のアルゴリズムは、学習データセット33によって機械学習される医療用の診断装置の機械学習のアルゴリズムに応じたものであってよい。例えば、学習済みモデル23を生成する機械学習のアルゴリズムは、サポートベクターマシン(SVM:Support Vector Machine)、ベイズ推定及び深層学習(DNN:Deep Neural Network)等の少なくとも何れかであってよい。
【0029】
制御部24は、1つ以上のプロセッサ及びメモリを含む。プロセッサは、特定のプログラムを読み込ませて特定の機能を実行する汎用のプロセッサ、及び、特定の処理に特化した専用のプロセッサを含んでよい。専用のプロセッサは、特定用途向けICを含んでよい。プロセッサは、プログラマブルロジックデバイスを含んでよい。PLDは、FPGAを含んでよい。制御部24は、1つ又は複数のプロセッサが協働するSoC、及び、SiPの何れかであってよい。
【0030】
制御部24は、データ生成装置30から、医用画像のデータ及び医用画像の識別子を示す情報を、通信部21によって取得し得る。制御部24は、医用画像のデータを取得すると、学習済みモデル23によって、その医用画像の病変の種類を判定する。
【0031】
制御部24は、判定した病変の種類に、自信度を付与する。自信度は、学習済みモデル23によって判定された病変の種類の確からしさを示す指標であってよい。制御部24は、学習済みモデル23の生成に用いられた機械学習のアルゴリズムが深層学習である場合、学習済みモデル23によって医用画像から抽出された特徴量と、判定した病変の種類の特徴量とのマッチング率に基づいて、自信度を算出してよい。特徴量は、医用画像に像として含まれる検体の画素の輝度及び色、当該検体の形状、当該検体を構成する画素の数、並びに深層学習で抽出される特徴量の少なくとも何れかを含んでよい。制御部24は、学習済みモデル23の生成に用いられた機械学習に用いられるパラメータのうち、学習済みモデル23によって判定された病変の種類の確からしさを示すパラメータを、自信度として取得してもよい。例えば、制御部24は、機械学習のアルゴリズムがサポートベクターマシンである場合、判定時に出力される“Probability”を自信度として取得してもよい。制御部24が自信度を算出又は取得する代わりに、学習済みモデル23が、医用画像の病変の種類を判定するとともに、その病変の種類に付与する自信度を出力するように、機械学習されていてもよい。
【0032】
制御部24は、医用画像の識別子を示す情報と、判定した病変の種類を示す情報と、病変の種類に付与した自信度を示す情報とを、データ生成装置30に、通信部21によって送信する。
【0033】
データ生成装置30は、学習データセット33を生成する。データ生成装置30は、汎用のコンピュータであってよいし、学習データセット33を生成するための専用のコンピュータであってもよい。データ生成装置30は、通信部31と、記憶部32と、制御部34とを有する。
【0034】
通信部31は、ネットワーク2に接続可能な少なくとも1つの通信モジュールを含んで構成されていてよい。例えば、ネットワーク2に接続可能な通信モジュールは、LTE、4G、又は5G等の移動体通信規格に対応した通信モジュールであってよい。通信部31は、情報処理装置20と通信可能な通信モジュールを含んで構成されていてよい。情報処理装置20と通信可能な通信モジュールは、有線LAN又は無線LAN等の規格に対応した通信モジュールであってよい。通信部31は、有線LAN又は無線LAN等の規格に対応した通信モジュールによって、有線LAN又は無線LANを介して情報処理装置20と直接通信し得る。また、通信部31は、有線LAN又は無線LAN等の規格に対応した通信モジュールによって、有線LAN又は無線LANを介してネットワーク2に接続されてもよい。
【0035】
記憶部32は、少なくとも1つの半導体メモリ、少なくとも1つの磁気メモリ、少なくとも1つの光メモリ、又はこれらのうちの少なくとも2種類の組み合わせを含んで構成されていてよい。半導体メモリは、例えば、RAM又はROMである。RAMは、例えば、SRAM又はDRAMである。ROMは、例えば、EEPROMである。記憶部32は、主記憶装置、補助記憶装置、又はキャッシュメモリとして機能してよい。記憶部32は、制御部34を機能させる多様なプログラム及び制御部34が用いる多様な情報を記憶する。記憶部32は、後述の処理により生成される学習データセット33を記憶する。学習データセット33は、データベースとして生成されてよい。
【0036】
制御部34は、1つ以上のプロセッサ及びメモリを含む。プロセッサは、特定のプログラムを読み込ませて特定の機能を実行する汎用のプロセッサ、及び、特定の処理に特化した専用のプロセッサを含んでよい。専用のプロセッサは、特定用途向けICを含んでよい。プロセッサは、プログラマブルロジックデバイスを含んでよい。PLDは、FPGAを含んでよい。制御部34は、1つ又は複数のプロセッサが協働するSoC、及び、SiPの何れかであってよい。
【0037】
制御部34は、アノテーション作業が未実施の医用画像のデータ及び医用画像の識別子を示す情報を、通信部31によって外部から取得し得る。制御部34は、アノテーション作業が未実施の医用画像のデータ等を取得すると、学習データセット33を生成又は更新する。本実施形態では、制御部34は、以下に説明するように、学習データセット33にデータを適宜保存していくことにより、学習データセット33を生成又は更新する。
【0038】
具体的には、制御部34は、アノテーション作業が未実施の医用画像のデータ及び識別子を示す情報を取得すると、取得した医用画像のデータ及び医用画像の識別子を示す情報を、情報処理装置20に、通信部31によって送信する。情報処理装置20は、データ生成装置30から医用画像のデータ等を受信すると、上述のように、学習済みモデル23によって、その医用画像の病変の種類を判定等する。情報処理装置20が医用画像の病変の種類を判定等することにより、情報処理装置20からデータ生成装置30へ、医用画像の識別子を示す情報と、情報処理装置20が判定した病変の種類を示す情報と、病変の種類に付与された自信度を示す情報とが送信される。
【0039】
制御部34は、情報処理装置20から、医用画像の識別子を示す情報と、病変の種類を示す情報と、自信度を示す情報とを、通信部31によって受信し得る。つまり、制御部34は、情報処理装置20の学習済みモデル23によって判定された医用画像の病変の種類と、病変の種類に付与された自信度とを受信し得る。制御部34は、受信した自信度が閾値以下であるか否かを判定する。
【0040】
閾値は、学習済みモデル23による病変の判定精度に応じて、適宜設定されてよい。閾値は、学習済みモデル23による病変の判定精度が高いほど、小さくてよい。閾値は、一定値であってよい。閾値は、学習済みモデル23による病変の判定精度に応じて変動する変動値であってもよい。例えば、学習済みモデル23が既存の学習データセットを用いた機械学習により生成されたものであるとする。この場合、当該既存の学習データセットのデータ量が増えると、学習済みモデル23による判定精度は、当該既存の学習データセットのデータ量が増える前と比較して、高くなる場合がある。この場合、当該既存の学習データセットのデータ量が増え、学習済みモデル23による判定精度が高くなった後の閾値は、当該既存の学習データセットのデータ量が増える前の閾値よりも、小さくてよい。
【0041】
自信度が閾値を超える場合、その自信度が付与された病変の種類が正解である可能性は高い。つまり、情報処理装置20の学習済みモデル23によって判定された病変の種類が正解である可能性は高い。そこで、本実施形態では、閾値を超える自信度が付与された病変の種類の判定に用いられた医用画像については、作業者にアノテーション作業を実施させない。制御部34は、閾値を超える自信度が付与された病変の種類の判定に用いられた医用画像を、学習済みモデル23によって判定された病変の種類に対応付けて、学習データセット33に保存する。具体的には、制御部34は、情報処理装置20から受信した自信度が閾値を超えると判定するとき、情報処理装置20から受信した識別子に対応する医用画像を、情報処理装置20から受信した病変の種類に対応付けて、学習データセット33に保存する。制御部34は、当該医用画像を、自信度にも対応付けて、学習データセット33に保存してよい。
【0042】
自信度が閾値以下である場合、その自信度が付与された病変の種類が正解である可能性は低い。つまり、情報処理装置20の学習済みモデル23によって判定された病変の種類が正解である可能性は低い。そこで、制御部34は、閾値以下の自信度が付与された病変の種類の判定に用いられた医用画像については、作業者にアノテーション作業を実施させる。具体的には、制御部34は、情報処理装置20から受信した自信度が閾値以下であると判定するとき、その自信度が付与された病変の種類の判定に用いられた医用画像のデータを、ネットワーク2を介して第1端末装置に、通信部31によって送信する。制御部34は、その自信度が付与された病変の種類の判定に用いられた医用画像のデータとともに、その医用画像の識別子を示す情報を、ネットワーク2を介して第1端末装置に、通信部31によって送信する。ここで、第1端末装置は、データ生成システム1が備える端末装置10のうちから、適宜選択された端末装置10である。制御部34は、作業者A~Cのアノテーション作業の負担が公平になるように、端末装置10A~10Cのうちから、第1端末装置を適宜選択してよい。例えば、制御部34は、データ生成装置30から端末装置10A~10Cの各々に送信される医用画像のフレーム数が均等化されるように、端末装置10A~10Cのうちから、第1端末装置を選択してよい。このような構成により、作業者A~Cがアノテーション作業を実施する医用画像の枚数が均等化され得る。
【0043】
第1端末装置としての端末装置10は、データ生成装置30から、医用画像のデータ及び医用画像の識別子を示す情報を、受信し得る。端末装置10が医用画像のデータ等を受信すると、作業者は、通常業務を行っていない時間帯等に、端末装置10を使用して、アノテーション作業を実施する。作業者が端末装置10を使用してアノテーション作業を実施することで、第1端末装置としての端末装置10からデータ生成装置30へ、作業者の識別子を示す情報と、医用画像の識別子を示す情報と、作業者が診断した病変の種類を示す情報とが、送信される。
【0044】
制御部34は、ネットワーク2を介して第1端末装置としての端末装置10から、作業者の識別子を示す情報と、医用画像の識別子を示す情報と、病変の種類を示す情報とを、通信部31によって受信し得る。制御部34は、端末装置10から受信した識別子に対応する医用画像を、端末装置10から受信した病変の種類に対応付けて、学習データセット33に保存する。制御部34は、当該医用画像を、病変の種類及び作業者の識別子に対応付けて、学習データセット33に保存してもよい。
【0045】
(データ生成装置の動作)
図2は、本開示の第1実施形態に係るデータ生成装置30の動作を示すフローチャートである。制御部34は、アノテーション作業が未実施の医用画像のデータ及び医用画像の識別子を示す情報を、外部から通信部31によって取得すると、
図2に示すような処理を開始してよい。
【0046】
制御部34は、アノテーション作業が未実施の医用画像のデータ及び医用画像の識別子を示す情報を、情報処理装置20に、通信部31によって送信する(ステップS10)。
【0047】
ステップS10の処理が実行されることにより、情報処理装置20は、データ生成装置30から医用画像のデータ等を受信する。情報処理装置20は、医用画像のデータ等を受信すると、学習済みモデル23によって、その医用画像の病変の種類を判定等する。情報処理装置20が医用画像の病変の種類を判定等することにより、情報処理装置20からデータ生成装置30へ、医用画像の識別子を示す情報と、情報処理装置20が判定した病変の種類を示す情報と、病変の種類に付与された自信度を示す情報とが送信される。
【0048】
制御部34は、情報処理装置20から、医用画像の識別子を示す情報と、病変の種類を示す情報と、自信度を示す情報とを、通信部31によって受信する(ステップS11)。
【0049】
制御部34は、ステップS11の処理にて受信した自信度が閾値以下であるか否かを判定する(ステップS12)。制御部34は、受信した自信度が閾値を超えると判定するとき(ステップS12:Nо)、ステップS13の処理に進む。一方、制御部34は、受信した自信度が閾値以下であると判定するとき(ステップS12:Yes)、ステップS14の処理に進む。
【0050】
ステップS13の処理では、制御部34は、ステップS11の処理で受信した識別子に対応する医用画像を、ステップS11の処理で受信した病変の種類に対応付けて、学習データセット33に保存する。
【0051】
ステップS14の処理では、制御部34は、医用画像のデータ及び医用画像の識別子を示す情報を、ネットワーク2を介して第1端末装置に、通信部31によって送信する。
【0052】
ステップS14の処理が実行されることにより、第1端末装置としての端末装置10は、データ生成装置30から医用画像のデータ等を受信し得る。作業者は、通常業務を行っていない時間帯等に、端末装置10を使用して、アノテーション作業を実施する。作業者が端末装置10を使用してアノテーション作業を実施することで、第1端末装置としての端末装置10からデータ生成装置30へ、作業者の識別子を示す情報と、医用画像の識別子を示す情報と、作業者が診断した病変の種類を示す情報とが、送信される。
【0053】
ステップS15の処理では、制御部34は、ネットワーク2を介して第1端末装置から、作業者の識別子を示す情報と、医用画像の識別子を示す情報と、病変の種類を示す情報とを、通信部31によって受信する。
【0054】
ステップS16の処理では、制御部34は、ステップS15の処理で受信した識別子に対応する医用画像を、ステップS15の処理で受信した病変の種類に対応付けて、学習データセット33に保存する。
【0055】
このように第1実施形態に係るデータ生成装置30は、自信度が閾値を超えると判定するとき、医用画像を、情報処理装置20の学習済みモデル23によって判定された病変の種類に対応付けて、学習データセット33に保存する。つまり、制御部34は、自信度が閾値を超えると判定するとき、作業者にアノテーション作業を実施させず、学習済みモデル23によって判定された病変の種類によって、学習データセット33の少なくとも一部を生成する。このような構成により、学習データセット33を生成する際、作業者が全ての医用画像についてアノテーション作業を実施しなくてもよくなる。その結果として、作業者のアノテーション作業の負担が軽減され得る。よって、本実施形態によれば、学習データセット33を効率良く生成可能な、データ生成装置30及びデータ生成方法が提供され得る。
【0056】
(第2実施形態)
次に、第2実施形態に係るデータ生成システムについて説明する。第2実施形態に係るデータ生成システムには、第1実施形態に係るデータ生成システム1と同様の構成を採用可能である。従って、以下では、
図1を参照しつつ、第1実施形態との相違点を中心に説明する。
【0057】
第1実施形態と同様に、制御部34は、アノテーション作業が未実施の医用画像のデータ及び医用画像の識別子を示す情報を、外部から通信部31によって取得し得る。制御部34は、アノテーション作業が未実施の医用画像のデータ等を取得すると、取得した医用画像のデータ及び医用画像の識別子を示す情報を、情報処理装置20に、通信部31によって送信する。
【0058】
第1実施形態と同様に、制御部34は、情報処理装置20から、医用画像の識別子を示す情報と、病変の種類を示す情報と、病変の種類に付与された自信度を示す情報とを、通信部31によって受信し得る。
【0059】
例えば、制御部34は、
図3に示すような識別子ID1,ID2,ID3,ID4の医用画像のデータ等を、情報処理装置20に送信する。
図3において、種類X,Y,Zの各々は、異なる病変の種類を示す。情報処理装置20は、識別子ID1の医用画像のデータ等を受信すると、識別子ID1の医用画像の病変の種類を、種類Xと判定し、100%の自信度を付与する。情報処理装置20は、識別子ID2の医用画像のデータ等を受信すると、識別子ID2の医用画像の病変の種類を、種類Xと判定し、50%の自信度を付与する。情報処理装置20は、識別子ID3の医用画像のデータ等を受信すると、識別子ID3の医用画像の病変の種類を、種類Yと判定し、50%の自信度を付与する。情報処理装置20は、識別子ID4の医用画像のデータ等を受信すると、識別子ID4の医用画像の病変の種類を、種類Zと判定し、40%の自信度を付与する。制御部34は、情報処理装置20が判定したこれらの病変の種類及び自信度を、情報処理装置20から、受信し得る。
【0060】
制御部34は、第1実施形態と同様に、受信した自信度が閾値以下であるか否かを判定する。制御部34は、第1実施形態と同様に、情報処理装置20から受信した自信度が閾値を超えると判定するとき、情報処理装置20から受信した識別子に対応する医用画像を、情報処理装置20から受信した病変の種類に対応付けて、学習データセット33に保存する。制御部34は、当該医用画像を、自信度にも対応付けて、学習データセット33に保存してよい。
【0061】
例えば、
図3において、閾値は、80%であるとする。この場合、
図3に示すような識別子ID1の医用画像について、制御部34は、100%の自信度が80%の閾値を超えると判定する。制御部34は、識別子ID1の医用画像を、情報処理装置20から受信した種類Xと100%の自信度とに対応付けて、学習データセット33に保存する。
【0062】
制御部34は、情報処理装置20から受信した自信度が閾値以下であると判定するとき、その自信度が付与された病変の種類の判定に用いられた医用画像のデータを、ネットワーク2を介して第1端末装置に、通信部31によって送信する。制御部34は、その自信度が付与された病変の種類の判定に用いられた医用画像のデータとともに、その医用画像の識別子を示す情報を、ネットワーク2を介して第1端末装置に、通信部31によって送信する。以下、第1端末装置を使用する作業者は、「第1作業者」とも記載される。制御部34は、第1端末装置への医用画像のデータの送信後、ネットワーク2を介して第1端末装置から、第1作業者の識別子を示す情報と、医用画像の識別子を示す情報と、病変の種類を示す情報とを通信部31によって受信し得る。
【0063】
例えば、
図3に示すような識別子ID2の医用画像について、制御部34は、50%の自信度が80%の閾値以下であると判定する。制御部34は、識別子ID2の医用画像のデータ等を、第1端末装置としての端末装置10Aに、送信する。作業者Aは、識別子ID2の医用画像の病変の種類を、種類Xと診断する。制御部34は、第1端末装置としての端末装置10Aから、識別子idAを示す情報と、識別子ID2を示す情報と、種類Xを示す情報とを受信する。識別子idAは、作業者Aの識別子である。
【0064】
例えば、
図3に示すような識別子ID3の医用画像について、制御部34は、50%の自信度が80%の閾値以下であると判定する。制御部34は、識別子ID3の医用画像のデータ等を、第1端末装置としての端末装置10Cに、送信する。作業者Cは、識別子ID3の医用画像の病変の種類を、種類Xと診断する。制御部34は、第1端末装置としての端末装置10Cから、識別子idCを示す情報と、識別子ID3を示す情報と、種類Xを示す情報とを受信する。識別子idCは、作業者Cの識別子である。
【0065】
例えば、
図3に示すような識別子ID4の医用画像について、制御部34は、40%の自信度が80%の閾値以下であると判定する。制御部34は、識別子ID4の医用画像のデータ等を、第1端末装置としての端末装置10Bに、送信する。作業者Bは、識別子ID4の医用画像の病変の種類を、種類Xと診断する。制御部34は、第1端末装置としての端末装置10Bから、識別子idBを示す情報と、識別子ID4を示す情報と、種類Xを示す情報とを受信する。識別子idBは、作業者Bの識別子である。
【0066】
制御部34は、第1端末装置から受信した病変の種類と、情報処理装置20から受信した病変の種類すなわち学習済みモデル23によって判定された病変の種類とが一致するか否か判定する。制御部34は、第1端末装置から受信した病変の種類と、情報処理装置20から受信した病変の種類とが一致すると判定するとき、医用画像を、第1端末装置から受信した病変の種類及び第1作業者の識別子に対応付けて、学習データセット33に保存する。さらに、制御部34は、医用画像を、情報処理装置20から受信した病変の種類及び自信度にも対応付けて、学習データセット33に保存してもよい。
【0067】
例えば、
図3に示すような識別子ID2の医用画像について、制御部34は、情報処理装置20から受信した種類Xと、第1端末装置としての端末装置10Aから受信した種類Xとが一致すると判定する。制御部34は、識別子ID2の医用画像を、情報処理装置20から受信した種類X及び50%の自信度と、第1端末装置としての端末装置10Aから受信した種類X及び第1作業者の識別子idAとに対応付けて、学習データセット33に保存する。
【0068】
制御部34は、第1端末装置から受信した病変の種類と、情報処理装置20から受信した病変の種類とが一致しないと判定するとき、医用画像のデータを、ネットワーク2を介して第2端末装置に、通信部31によって送信する。第2端末装置は、第1端末装置とは異なる端末装置10である。以下、第2端末装置を使用する作業者は、「第2作業者」とも記載される。第1端末装置とは異なる端末装置10である第2端末装置に、医用画像のデータが送信されることにより、第1作業者とは異なる第2作業者によって、医用画像に対するアノテーション作業が実施され得る。
【0069】
例えば、
図3に示すような識別子ID3の医用画像について、制御部34は、第1端末装置としての端末装置10Cから受信した種類Xと、情報処理装置20から受信した種類Yとが一致しないと判定する。制御部34は、識別子ID3の医用画像のデータを、端末装置10Cとは異なる第2端末装置としての端末装置10Bに、送信する。作業者Bは、ID3の医用画像の病変の種類を、種類Yと診断する。
【0070】
例えば、
図3に示すような識別子ID4の医用画像について、制御部34は、第1端末装置としての端末装置10Bから受信した種類Xと、情報処理装置20から受信した種類Zとが一致しないと判定する。制御部34は、識別子ID4の医用画像のデータを、端末装置10Bとは異なる第2端末装置としての端末装置10Cに、送信する。作業者Cは、識別子ID4の医用画像の病変の種類を、種類Xと診断する。
【0071】
制御部34は、ネットワーク2を介して第2端末装置から、第2作業者の識別子を示す情報と、医用画像の識別子を示す情報と、病変の種類を示す情報とを、通信部31によって受信し得る。制御部34は、受信した識別子に対応する医用画像を、情報処理装置20から受信した病変の種類と、第1端末装置から受信した病変の種類と、第2端末装置から受信した病変の種類とに対応付けて、学習データセット33に保存する。さらに、制御部34は、当該医用画像を、情報処理装置20から受信した自信度と、第1端末装置から受信した第1作業者の識別子と、第2端末装置から受信した第2作業者の識別子とにも対応付けて、学習データセット33に保存してもよい。
【0072】
例えば、制御部34は、
図3に示すような識別子ID3の医用画像について、第2端末装置としての端末装置10Bから、識別子idBを示す情報と、識別子ID3を示す情報と、種類Yを示す情報とを受信する。制御部34は、識別子ID3の医用画像を、情報処理装置20から受信した種類Yと、第1端末装置としての端末装置10Cから受信した種類Xと、第2端末装置としての端末装置10Bから受信した種類Yとに対応付けて、学習データセット33に保存する。さらに、制御部34は、識別子ID3の医用画像を、50%の自信度と、第1作業者の識別子idCと、第2作業者の識別子idBとにも対応付けて、学習データセット33に保存する。
【0073】
例えば、
図3に示すような識別子ID4の医用画像について、制御部34は、第2端末装置としての端末装置10Cから、識別子idCを示す情報と、識別子ID4を示す情報と、種類Xを示す情報とを受信する。制御部34は、識別子ID4の医用画像を、情報処理装置20から受信した種類Zと、第1端末装置としての端末装置10Bから受信した種類Xと、第2端末装置としての端末装置10Cから受信した種類Xとに対応付けて、学習データセット33に保存する。さらに、制御部34は、識別子ID4の医用画像を、40%の自信度と、第1作業者の識別子idBと、第2作業者の識別子idCとにも対応付けて、学習データセット33に保存する。
【0074】
(データ生成装置の動作)
図4及び
図5は、本開示の第2実施形態に係るデータ生成装置30の動作を示すフローチャートである。制御部34は、アノテーション作業が未実施の医用画像のデータ及び医用画像の識別子を示す情報を、外部から通信部31によって取得すると、
図4に示すような処理を開始してよい。
【0075】
制御部34は、
図2に示すようなステップS10,S11,S12,S13,S14,S15の処理と同様にして、ステップS20,S21,S22,S23,S24,S25の処理を実行する。
【0076】
ステップS26の処理では、制御部34は、ステップS25の処理にて第1端末装置から受信した病変の種類と、ステップS21の処理にて情報処理装置20から受信した病変の種類とが一致するか否か判定する。
【0077】
制御部34は、第1端末装置から受信した病変の種類と、情報処理装置20から受信した病変の種類とが一致すると判定するとき(ステップS26:Yes)、ステップS27の処理に進む。一方、制御部34は、第1端末装置から受信した病変の種類と、情報処理装置20から受信した病変の種類とが一致しないと判定するとき(ステップS26:Nо)、
図5に示すようなステップS28の処理に進む。
【0078】
ステップS27の処理では、制御部34は、医用画像を、第1端末装置から受信した病変の種類に対応付けて、学習データセット33に保存する。さらに、制御部34は、医用画像を、情報処理装置20から受信した病変の種類及び自信度と、第1作業者の識別子とにも対応付けて、学習データセット33に保存してもよい。
【0079】
図5に示すようなステップS28の処理では、制御部34は、医用画像のデータ及び医用画像の識別子を示す情報を、ネットワーク2を介して第2端末装置に、通信部31によって送信する。
【0080】
ステップS28の処理が実行されることにより、第2端末装置としての端末装置10は、データ生成装置30から医用画像のデータ等を受信し得る。第2作業者は、通常業務を行っていない時間帯等に、端末装置10を使用して、アノテーション作業を実施する。第2作業者が端末装置10を使用してアノテーション作業を実施することで、第2端末装置としての端末装置10からデータ生成装置30へ、第2作業者の識別子を示す情報と、医用画像の識別子を示す情報と、病変の種類を示す情報とが送信される。
【0081】
ステップS29の処理では、制御部34は、ネットワーク2を介して第2端末装置から、第2作業者の識別子を示す情報と、医用画像の識別子を示す情報と、病変の種類を示す情報とを、通信部31によって受信する。
【0082】
ステップS30の処理では、制御部34は、医用画像を、情報処理装置20から受信した病変の種類と、第1端末装置から受信した種類と、第2端末装置から受信した病変の種類とに対応付けて、学習データセット33に保存する。さらに、制御部34は、医用画像を、情報処理装置20から受信した自信度と、第1端末装置から受信した第1作業者の識別子と、第2作業者の識別子とにも対応付けて、学習データセット33に保存してもよい。
【0083】
ここで、一般的な学習データセットの生成では、1つの医用画像に対して、二人以上の作業者がアノテーション作業を実施することが求められる。さらに、一般的な学習データセットの生成では、1つの医用画像に対する各作業者の診断結果が一致する場合、その医用画像に、その診断結果を対応付けることにより、学習データセットが生成される。一般的な学習データセットの生成では、1つの医用画像に対して、二人以上の作業者がアノテーション作業を実施することが求められるため、作業者の負担が増加し得る。また、一人目の作業者が、準備された医用画像へのアノテーション作業を終了してから、二人目の作業者は、準備された医用画像へのアノテーション作業を開始する。換言すると、二人目の作業者は、一人目の作業者がアノテーション作業を終了するまで、アノテーション作業の開始を待たなければならない。例えば、
図3に示すような識別子ID1~ID4の医用画像が準備されており、一人目の作業者が作業者Aであり、二人目の作業者が作業者Bであるとする。この場合、作業者Bは、作業者Aが識別子ID1~ID4の医用画像へのアノテーション作業を終了するまで、識別子ID1~ID4の医用画像へのアノテーション作業の開始を待たなければならない。
【0084】
第2実施形態に係るデータ生成装置30は、第1端末装置から受信した病変の種類と、情報処理装置20から受信した病変の種類とが一致すると判定するとき、医用画像を、第1端末装置から受信した病変の種類に対応付けて、学習データセット33に保存する。換言すると、第1端末装置から受信した病変の種類と、情報処理装置20から受信した病変の種類とが一致する場合、その病変の種類の判定に用いられた医用画像に対しては、二人以上の作業者がアノテーション作業を実施する必要がなくなる。このような構成により、作業者の負担が低減され得る。
【0085】
さらに、第2実施形態に係るデータ生成装置30は、自信度が閾値以下であると判定するとき、第1端末装置に、医用画像のデータを送信する。このような構成により、複数の医用画像のデータを、複数の第1端末装置に、同時期に送信することができる。例えば、制御部34は、
図3に示すような識別子ID2,ID3,ID4の医用画像のデータを、第1端末装置としての端末装置10A,10C,10Bに、同時期に送信することができる。複数の医用画像のデータが複数の第1端末装置に同時期に送信されることにより、アノテーション作業を実施する一人目の作業者として、複数の第1作業者が、複数の医用画像に対してアノテーション作業を各々実施することができる。このような構成により、一般的な学習データセットの生成のように、二人目の作業者が、一人目の作業者がアノテーション作業を終了するまで、アノテーション作業の開始を待たなければならないといった事態が解消され得る。
【0086】
また、第2実施形態に係るデータ生成装置30は、第2端末装置に医用画像のデータを送信する際、情報処理装置20が判定した病変の種類及び第1作業者が診断した病変の種類等を、第2端末装置に送信しない。このような構成により、第2作業者は、第1作業者の診断結果等に依拠せずに、医用画像の病変を診断することができる。
【0087】
第2実施形態に係るデータ生成装置30のその他の構成及び効果は、第1実施形態に係るデータ生成装置30の構成及び効果と同様である。
【0088】
(第3実施形態)
次に、第3実施形態に係るデータ生成システムについて説明する。第3実施形態に係るデータ生成システムには、第1実施形態に係るデータ生成システム1と同様の構成を採用可能である。従って、以下では、
図1を参照しつつ、第1実施形態との相違点を中心に説明する。
【0089】
制御部34は、第1実施形態及び第2実施形態にて上述したように学習データセット33を生成又は更新していく際、ネットワーク2を介して端末装置10から、通信部31によって病変の種類を示す情報を受信し得る。第3実施形態では、制御部34は、学習データセット33を生成又は更新していく際に、端末装置10から受信した病変の種類を示す情報に基づいて、情報処理装置20の学習済みモデル23を更新させるための更新データセットを生成する。換言すると、制御部34は、作業者がアノテーション作業を実施した医用画像に基づいて、更新データセットを生成する。学習済みモデル23は、後述のように、更新データセットを用いた機械学習によって更新され得る。学習済みモデル23が更新されることにより、学習済みモデル23による病変の種類の判定精度が向上し得る。
【0090】
制御部34は、学習データセット33に保存済みのデータを用いて、更新データセットを生成してよい。又は、制御部34は、第1実施形態及び第2実施形態にて上述したように学習データセット33を生成又は更新していく際に、データを記憶部32に一時的に記憶させておいてもよい。例えば、制御部34は、端末装置10から受信した、作業者の識別子を示す情報と、医用画像の識別子を示す情報と、病変の種類を示す情報とを、記憶部32に一時的に記憶させておいてもよい。この場合、制御部34は、記憶部32に一時的に記憶させた病変の種類を示す情報等を用いて、更新データセットを生成してよい。制御部34は、定期的に、更新データセットを生成してよい。本実施形態では、以下に説明するように、制御部34は、更新データセットにデータを適宜保存していくことにより、更新データセットを生成する。
【0091】
制御部34は、第1端末装置から受信した病変の種類及び第2端末装置から受信した病変の種類の少なくとも何れかに基づいて、更新データセットを生成してよい。
【0092】
制御部34は、医用画像に対して、第1端末装置からのみ病変の種類を受信した場合、当該医用画像を、当該病変の種類及び第1重み係数に対応付けて、更新データセットに保存してよい。第1重み係数は、1であってよい。
【0093】
第1重み係数に対応付けられた医用画像には、第1重み係数とともに、第1端末装置から受信した1つの病変の種類のみが対応付けられ得る。学習済みモデル23は、後述の更新データセットを用いた機械学習による更新の際、第1重み係数が対応付けられた医用画像の病変の種類が、当該医用画像に対応付けられた病変の種類のみであると判定するように学習されてよい。この際、学習済みモデル23は、判定した病変の種類の確からしさが、第1重み係数に応じた値に近付くように学習されてよい。例えば、当該第1重み係数に応じた値は、判定された病変の種類の確からしさを示す指標としての自信度が採用される場合、100%であってよい。この場合に、学習済みモデル23は、自信度を出力するように構成される場合、第1重み係数に対応付けられた病変の種類については、自信度が100%に近付くように学習されてよい。
【0094】
制御部34は、学習データセット33に保存済みのデータを用いる場合、学習データセット33に保存済みのデータから、第1作業者の識別子にのみ対応付けられた医用画像を、第1端末装置からのみ病変の種類を受信した医用画像として抽出してよい。制御部34は、抽出した医用画像を、第1端末装置から受信した病変の種類及び第1重み係数に対応付けて、更新データセットに保存してよい。
【0095】
例えば、学習データセット33に保存済みのデータとして、
図3に示すようなデータが用いられるとする。識別子ID2の医用画像には、第1作業者の識別子idAのみが対応付けられている。この場合、制御部34は、
図6に示すように、識別子ID2の医用画像を、種類X及び第1重み係数に対応付けて、更新データセットに保存してよい。
図6に示す例では、制御部34は、第1重み係数として、1を付与している。
【0096】
制御部34は、同じ医用画像に対して、第1端末装置及び第2端末装置の両方から病変の種類を受信した場合、当該医用画像によって、更新データセットを生成してよい。この場合、制御部34は、学習データセット33に保存済みのデータから、第1作業者の識別子及び第2作業者の識別子の両方に対応付けられた医用画像を、第1端末装置及び第2端末装置の両方から病変の種類を受信した医用画像として抽出してよい。
【0097】
例えば、学習データセット33に保存済みのデータとして、
図3に示すようなデータが用いられるとする。識別子ID3の医用画像には、第1作業者の識別子idCと、第2作業者の識別子idBとが対応付けられている。識別子ID4の医用画像には、第1作業者の識別子idBと、第2作業者の識別子idCとが対応付けられている。制御部34は、学習データセット33から、識別子ID3,ID4の医用画像を、第1端末装置及び第2端末装置の両方から病変の種類を受信した医用画像として抽出する。
【0098】
制御部34は、同じ医用画像に対して、第1端末装置及び第2端末装置の両方から病変の種類を受信した場合、第1端末装置から受信した病変の種類と、第2端末装置から受信した病変の種類とが一致するか否か判定してよい。
【0099】
制御部34は、同じ医用画像に対して、第1端末装置から受信した病変の種類と、第2端末装置から受信した病変の種類とが一致しないと判定し得る。この場合、制御部34は、当該医用画像を、第1端末装置及び第2端末装置の各々から受信した病変の種類と第2重み係数とに対応付けて、更新データセットに保存してよい。第2重み係数は、第1重み係数よりも小さい。制御部34は、第1重み係数を、同じ医用画像に対して病変の種類を送信した端末装置10の数で割ることにより、第2重み係数を算出してよい。例えば、第1重み係数が1であり、同じ医用画像に対して病変の種類を送信した端末装置10の数が第1端末装置及び第2端末装置の2つである場合、第2重み係数は、0.5であってよい。
【0100】
第2重み係数に対応付けられた医用場像には、第2重み係数とともに、第1端末装置及び第2端末装置から受信した、2つの病変の種類が対応付けられ得る。学習済みモデル23は、後述の更新データセットを用いた機械学習による更新の際、第2重み係数が対応付けられた医用画像の病変の種類が、当該医用画像に対応付けられた2つの病変の種類の各々に該当すると学習されてよい。この際、学習済みモデル23は、当該医用画像の病変の種類に該当する2つの病変の種類の各々の確からしさが、第1重み係数よりも小さい第2重み係数に応じた値に近付くように学習されてよい。例えば、当該第2重み係数に応じた値は、判定された病変の種類の確からしさを示す指標としての自信度が採用され、且つ、第2係数が0.5である場合、50%であってよい。この場合に、学習済みモデル23は、自信度を出力するように構成される場合、第2重み係数に対応付けられた病変の種類については、自信度が50%に近付くように学習されてよい。
【0101】
例えば、制御部34は、
図3に示すような識別子ID3の医用画像に対して、第1端末装置としての端末装置10Cから受信した種類Xと、第2端末装置としての端末装置10Bから受信した種類Yとが一致しないと判定する。この場合、制御部34は、
図6に示すように、識別子ID3の医用画像を、種類X及び種類Yと、第2重み係数の0.5とに対応付けて、更新データセットに保存する。
【0102】
制御部34は、同じ医用画像に対して、第1端末装置から受信した病変の種類と、第2端末装置から受信した病変の種類とが一致すると判定し得る。この場合、制御部34は、当該医用画像を、第1端末装置及び第2医用画像の各々から受信した病変の種類と第1重み係数とに対応付けて、更新データセットに保存してよい。
【0103】
例えば、制御部34は、
図3に示すような識別子ID4の医用画像に対して、第1端末装置としての端末装置10Bから受信した種類Xと、第2端末装置としての端末装置10Cから受信した種類Xとが一致すると判定する。この場合、制御部34は、
図6に示すように、識別子ID4の医用画像を、種類Xと第1重み係数の1とに対応付けて、更新データセットに保存する。
【0104】
制御部34は、生成した更新データセットを、情報処理装置20に、通信部31によって送信する。情報処理装置20では、制御部24は、データ生成装置30から、通信部21によって更新データセットを受信し得る。制御部24は、更新データセットを受信すると、更新データセットを用いた機械学習によって学習済みモデル23を更新させる。制御部24は、学習済みモデル23の更新が終了すると、更新終了を示す通知を、データ生成装置30に、通信部21によって送信してよい。
【0105】
制御部34は、更新終了を示す通知を、情報処理装置20から、通信部31によって受信し得る。制御部34は、更新終了を示す通知を受信すると、学習データセット33の保存されている医用画像のうち、情報処理装置20から受信した病変の種類すなわち学習済みモデル23によって判定された病変の種類のみが対応付けられた医用画像を抽出する。例えば、学習データセット33が
図3に示すような構成である場合、制御部34は、識別子ID1の医用画像を、抽出する。制御部34は、抽出した医用画像のデータ及び医用画像の識別子を示す情報を、情報処理装置20に、通信部21によって送信する。情報処理装置20では、制御部24は、当該医用画像のデータ及び当該医用画像の識別子を通信部21によって受信し得る。制御部24は、当該医用画像のデータ等を受信すると、更新された学習済みモデル23によって当該医用画像の病変の種類を判定し、判定した病変の種類に、自信度を付与する。制御部24は、当該医用画像の識別子を示す情報と、判定した病変の種類を示す情報と、病変の種類に付与した自信度を示す情報とを、データ生成装置30に、通信部21によって送信する。
【0106】
制御部34は、情報処理装置20から、医用画像の識別子を示す情報と、病変の種類を示す情報と、自信度を示す情報とを、通信部31によって受信し得る。制御部34は、受信した病変の種類を示す情報等に基づいて、学習データセット33に保存済みのデータを更新してよい。
【0107】
図7には、本開示の第3実施形態に係る学習データセット33の経時変化を示す。
図7には、学習済みモデル23の1回目の更新、2回目の更新、及び3回目の更新において、識別子ID1の医用画像に対して、学習済みモデル23によって判定された病変の種類及び自信度が示されている。
【0108】
学習済みモデル23の更新回数が多くなるほど、学習済みモデル23による病変の種類の判定精度が向上し得る。このような構成により、同じ医用画像に対して、更新の前後で学習済みモデル23によって判定された病変の種類が同じになる場合でも、更新後に付与された自信度の方が、更新前に付与された自信度よりも、低くなる場合がある。例えば、
図7に示すように、1回目及び2回目の更新では、学習済みモデル23は、識別子ID1の医用画像の病変の種類を、同じ種類Xと判定している。2回目の更新に付与された自信度は、50%であり、1回目に付与された80%の自信度よりも、低くなっている。
【0109】
学習済みモデル23の病変の種類の判定精度が向上することにより、同じ医用画像に対して、更新前の学習済みモデル23によって判定された病変の種類と、更新後の学習済みモデル23によって判定された病変の種類とが異なる場合がある。例えば、
図7に示すように、2回目の更新では、学習済みモデル23は、識別子ID1の医用画像に対して種類Xと判定している。これに対し、3回目の更新では、学習済みモデル23は、識別子ID1の医用画像に対して種類Yと判定している。
【0110】
(データ生成装置の動作)
図8及び
図9は、本開示の第3実施形態に係るデータ生成装置30の動作を示すフローチャートである。以下では、制御部34は、学習データセット33に保存済みのデータを用いて、更新データセットを生成するものとする。制御部34は、
図8に示すような処理を、定期的に実行してよい。例えば、学習データセット33に保存済みの医用画像の数が所定値増加する毎に、
図8に示すような処理を実行してよい。所定値は、学習済みモデル23に求められる病変の種類の判定精度を考慮して、適宜決定されてよい。
【0111】
制御部34は、学習データセット33に保存済みのデータから、第1作業者の識別子にのみ対応付けられた医用画像を、第1端末装置からのみ病変の種類を受信した医用画像として抽出する(ステップS40)。
【0112】
制御部34は、ステップS40の処理で抽出した医用画像を、第1端末装置から受信した病変の種類及び第1重み係数に対応付けて、更新データセットに保存する(ステップS41)。制御部34は、ステップS40の処理で抽出した医用画像の数だけ、ステップS41の処理を繰り返し実行してよい。
【0113】
制御部34は、学習データセット33に保存済みのデータから、第1作業者の識別子及び第2作業者の識別子の両方に対応付けられた医用画像を、第1端末装置及び第2端末装置の両方から病変の種類を受信した医用画像として抽出する(ステップS42)。
【0114】
制御部34は、ステップS42の処理で抽出した医用画像において、同じ医用画像に対し、第1端末装置から受信した病変の種類と、第2端末装置から受信した病変の種類とが一致するか否か判定する(ステップS43)。制御部34は、同じ医用画像に対し、第1端末装置から受信した病変の種類と、第2端末装置から受信した病変の種類とが一致しないと判定するとき(ステップS43:Nо)、ステップS44の処理に進む。制御部34は、同じ医用画像に対し、第1端末装置から受信した病変の種類と、第2端末装置から受信した病変の種類とが一致すると判定するとき(ステップS43:Yes)、ステップS45の処理に進む。
【0115】
ステップS44の処理では、制御部34は、ステップS43の判定処理に用いた医用画像を、第1端末装置及び第2端末装置の各々から受信した病変の種類と第2重み係数とに対応付けて、更新データセットに保存する。
【0116】
ステップS45の処理では、制御部34は、ステップS43の判定処理に用いた医用画像を、第1端末装置及び第2医用画像の各々から受信した病変の種類と第1重み係数とに対応付けて、更新データセットに保存する。
【0117】
制御部34は、ステップS42の処理で抽出した医用画像の数だけ、ステップS43~S45の処理を繰り返し実行してよい。
【0118】
ステップS46の処理では、制御部34は、生成した更新データセットを、情報処理装置20に、通信部31によって送信する。
【0119】
ステップS46の処理を実行した後、制御部34は、
図9に示すような処理に進む。
【0120】
ステップS46の処理が実行されることにより、情報処理装置20では、制御部24は、データ生成装置30から、通信部21によって更新データセットを受信し得る。制御部24は、更新データセットを受信すると、更新データセットを用いた機械学習によって学習済みモデル23を更新させる。制御部24は、学習済みモデル23の更新が終了すると、更新終了を示す通知を、データ生成装置30に、通信部21によって送信する。
【0121】
ステップS47の処理では、制御部34は、更新終了を示す通知を、情報処理装置20から、通信部31によって受信する。
【0122】
ステップS48の処理では、制御部34は、学習データセット33に保存されている医用画像のうち、情報処理装置20から受信した病変の種類すなわち学習済みモデル23によって判定された病変の種類のみが対応付けられた医用画像を抽出する。
【0123】
ステップS49の処理では、制御部34は、ステップS48の処理で抽出した医用画像のデータ及び医用画像の識別子を示す情報を、情報処理装置20に、通信部21によって送信する。
【0124】
ステップS49の処理が実行されることにより、情報処理装置20では、制御部24は、当該医用画像のデータ及び当該医用画像の識別子を通信部21によって受信し得る。制御部24は、当該医用画像のデータ等を受信すると、更新された学習済みモデル23によって当該医用画像の病変の種類を判定し、判定した病変の種類に、自信度を付与する。制御部24は、当該医用画像の識別子を示す情報と、判定した病変の種類を示す情報と、病変の種類に付与した自信度を示す情報とを、データ生成装置30に、通信部21によって送信する。
【0125】
ステップS50の処理では、制御部34は、情報処理装置20から、医用画像の識別子を示す情報と、病変の種類を示す情報と、自信度を示す情報とを、通信部31によって受信する。
【0126】
ステップ51の処理では、制御部34は、ステップ50の処理で受信した病変の種類を示す情報等に基づいて、学習データセット33に保存済みのデータを更新する。
【0127】
なお、制御部34は、ステップS50の処理を実行した後、ステップ51の処理に進む代わりに、
図4に示すようなステップS22の処理に進んでもよい。
【0128】
また、制御部34は、学習データセット33内に、第1作業者の識別子にのみ対応付けられた医用画像が存在しない場合、ステップS40,S41の処理を実行しなくてよい。
【0129】
また、制御部34は、学習データセット33内に、第1作業者の識別子及び第2作業者の識別子の両方に対応付けられた医用画像が存在しない場合、ステップS42~S45の処理を実行しなくてよい。
【0130】
このように第3実施形態に係るデータ生成装置30は、第1端末装置から受信した病変の種類及び第2端末装置から受信した病変の種類の少なくとも何れかに基づいて、学習済みモデル23を更新させるための更新データセットを生成する。学習済みモデル23の更新が更新されることにより、学習済みモデル23の病変の種類の判定精度が向上し得る。学習済みモデル23の病変の種類の判定精度が向上することにより、学習データセット33の精度が向上され得る。
【0131】
本開示は上述の実施形態に限定されるものではない。例えば、ブロック図に記載の複数のブロックを統合してもよいし、又は1つのブロックを分割してもよい。フローチャートに記載の複数のステップを記述に従って時系列に実行する代わりに、各ステップを実行する装置の処理能力に応じて、又は必要に応じて、並列的に又は異なる順序で実行してもよい。その他、本開示の趣旨を逸脱しない範囲での変更が可能である。
【0132】
例えば、上述した第1から第3実施形態では、
図1示すように、情報処理装置20と、データ生成装置30とが別個の装置であるものとして説明した。ただし、情報処理装置20と、データ生成装置30とは、1つの装置として構成されてもよいし、1つのクラウドサーバとして構成されてもよい。情報処理装置20とデータ生成装置30とが1つの装置又はクラウドサーバとして構成される場合、データ生成装置30の記憶部32に、学習済みモデル23が格納されていてよい。また、制御部34は、学習済みモデル23によって、医用画像の病変の種類を判定し、判定した病変の種類に自信度を付与してよい。
【0133】
例えば、上述した第1実施形態において、閾値は、学習済みモデル23の学習量に応じて、適宜決定され得るものとして説明した。ただし、第3実施形態にて上述したように学習済みモデル23が更新データセットを用いた機械学習により更新される場合、閾値は、更新データセットのデータ量に基づいて、適宜設定されてもよい。例えば、閾値は、更新データセットのデータ量が多いほど、小さくてよい。
【符号の説明】
【0134】
1 データ生成システム
2 ネットワーク
10,10A,10B,10C 端末装置
11 通信部
12 表示部
13 入力部
14 記憶部
15 制御部
20 情報処理装置
21 通信部
22 記憶部
23 学習済みモデル
24 制御部
30 データ生成装置
31 通信部
32 記憶部
33 学習データセット
34 制御部