IP Force 特許公報掲載プロジェクト 2022.1.31 β版

知財求人 - 知財ポータルサイト「IP Force」

▶ 東芝メディカルシステムズ株式会社の特許一覧

特許7510760医用情報処理装置及び医用情報処理システム
<>
  • 特許-医用情報処理装置及び医用情報処理システム 図1
  • 特許-医用情報処理装置及び医用情報処理システム 図2
  • 特許-医用情報処理装置及び医用情報処理システム 図3
  • 特許-医用情報処理装置及び医用情報処理システム 図4
< >
(19)【発行国】日本国特許庁(JP)
(12)【公報種別】特許公報(B2)
(11)【特許番号】
(24)【登録日】2024-06-26
(45)【発行日】2024-07-04
(54)【発明の名称】医用情報処理装置及び医用情報処理システム
(51)【国際特許分類】
   G16H 50/70 20180101AFI20240627BHJP
【FI】
G16H50/70
【請求項の数】 12
(21)【出願番号】P 2020004726
(22)【出願日】2020-01-15
(65)【公開番号】P2021111288
(43)【公開日】2021-08-02
【審査請求日】2022-12-08
(73)【特許権者】
【識別番号】594164542
【氏名又は名称】キヤノンメディカルシステムズ株式会社
(74)【代理人】
【識別番号】110002147
【氏名又は名称】弁理士法人酒井国際特許事務所
(72)【発明者】
【氏名】佐々木 翔
(72)【発明者】
【氏名】長江 亮一
(72)【発明者】
【氏名】藤戸 智生
(72)【発明者】
【氏名】寺井 公一
(72)【発明者】
【氏名】狩野 佑介
(72)【発明者】
【氏名】山崎 優大
(72)【発明者】
【氏名】山形 佳史
(72)【発明者】
【氏名】吉田 昌史
(72)【発明者】
【氏名】春 雄之介
(72)【発明者】
【氏名】篠原 滉平
【審査官】齊藤 貴孝
(56)【参考文献】
【文献】国際公開第2019/150813(WO,A1)
【文献】国際公開第2019/144066(WO,A1)
【文献】国際公開第2019/211308(WO,A1)
【文献】特開2010-172559(JP,A)
【文献】特開2006-126886(JP,A)
【文献】特開2010-072779(JP,A)
【文献】特開平11-175552(JP,A)
【文献】特開2020-004009(JP,A)
【文献】欧州特許出願公開第3349218(EP,A1)
(58)【調査した分野】(Int.Cl.,DB名)
G16H 10/00-80/00
(57)【特許請求の範囲】
【請求項1】
学習モデルのトレーニングデータとして用いられる、患者毎に管理された複数のトレーニング用データを含む第1のデータセットと、前記トレーニング用データと同じデータ構造を有する複数の予備用データを含む第2のデータセットと、を格納するデータベースと、
前記第1のデータセットに含まれる前記複数のトレーニング用データのうち、前記患者毎に関連付けられたプライバシー情報の少なくとも一部の使用制限に応じて、使用不可となった前記プライバシー情報を特定する特定情報を生成する情報管理部と、
前記第1のデータセットに含まれる前記複数のトレーニング用データのうち、前記情報管理部が生成した前記特定情報によって特定される使用不可となった前記トレーニング用データを、前記第2のデータセットに含まれる複数の前記予備用データのうちの使用可能である前記予備用データと置換し、前記第1のデータセットを加工する加工部と、
を備えた医用情報処理装置。
【請求項2】
前記トレーニング用データは、患者に関する患者情報、遺伝子情報、画像情報のうちの少なくともいずれかと、前記トレーニング用データに含まれるプライバシー情報の使用可否を患者毎に一括して管理するためのタグと、を有し、
前記加工部は、前記タグに基づいて前記第1のデータセットを加工する、
請求項1に記載の医用情報処理装置。
【請求項3】
前記トレーニング用データは、患者に関する患者情報、遺伝子情報、画像情報のうちの少なくともいずれかと、前記トレーニング用データに含まれるプライバシー情報の使用可否を患者毎に個別に管理するためタグと、を有し、
前記加工部は、前記タグに基づいて前記第1のデータセットを加工する、
請求項に記載の医用情報処理装置。
【請求項4】
前記加工部は、前記第1のデータセットに含まれる使用不可となった前記トレーニング用データと、前記第2のデータセットに含まれる複数の前記予備用データのそれぞれとの類似度に基づいて前記置換を実行する請求項1乃至3のうちいずれか一項に記載の医用情報処理装置。
【請求項5】
前記加工部は、撮像プロトコル、撮像プログラム、患者情報、撮像時の撮像装置の設定情報、画像情報のうち、少なくとも一つを用いて前記類似度を計算する請求項4に記載の医用情報処理装置。
【請求項6】
加工された前記第1のデータセットを用いて前記学習モデルを事後学習させる事後学習部をさらに備える請求項4又は5に記載の医用情報処理装置。
【請求項7】
前記加工部は、前記事後学習された前記学習モデルが所定の精度を満たさない場合には、前記類似度に基づいて前記第1のデータセットをさらに加工し、
前記事後学習部は、さらに加工された前記第1のデータセットを用いて前記学習モデルを事後学習させる請求項6に記載の医用情報処理装置。
【請求項8】
前記加工部は、前記第1のデータセットに含まれる前記複数のトレーニング用データのうち使用不可となった前記トレーニング用データが複数ある場合には、使用不可となった複数の前記トレーニング用データのそれぞれについて、前記第2のデータセットに含まれる複数の前記予備用データのうちの使用可能である前記予備用データと置換し、前記第1のデータセットを加工する請求項1乃至7のうちいずれか一項に記載の医用情報処理装置。
【請求項9】
前記加工部は、患者提供情報データベースに新規登録された患者提供情報の数が一定値以上になったことをトリガとして、前記第1のデータセットを再構築する請求項1乃至8のうちいずれか一項に記載の医用情報処理装置。
【請求項10】
前記加工部は、前記第2のデータセットの使用可能データの割合が閾値を下回った場合、前記第1のデータセットを再構築する請求項1乃至9のうちいずれか一項に記載の医用情報処理装置。
【請求項11】
前記加工部は、前記第1のデータセット及び前記第2のデータセットの少なくとも一方がトレーニングへの使用に関し不適切なデータである適格性喪失データを含む場合、前記第1のデータセット及び前記第2のデータセットの少なくとも一方を再構築する請求項1乃至10のうちいずれか一項に記載の医用情報処理装置。
【請求項12】
学習モデルのトレーニングデータとして用いられる、患者毎に管理された複数のトレーニング用データを含む第1のデータセットと、前記トレーニング用データと同じデータ構造を有する複数の予備用データを含む第2のデータセットと、を格納するデータベースと、
前記第1のデータセットに含まれる前記複数のトレーニング用データのうち、前記患者毎に関連付けられたプライバシー情報の少なくとも一部の使用制限に応じて、使用不可となった前記プライバシー情報を特定する特定情報を生成する情報管理部と、
前記第1のデータセットに含まれる前記複数のトレーニング用データのうち、前記情報管理部が生成した前記特定情報によって特定される使用不可となった前記トレーニング用データを、前記第2のデータセットに含まれる複数の前記予備用データのうちの使用可能である前記予備用データと置換し、前記第1のデータセットを加工する加工部と、
を備えた医用情報処理システム。
【発明の詳細な説明】
【技術分野】
【0001】
本明細書に開示の実施形態は、医用情報処理装置及び医用情報処理システムに関する。
【背景技術】
【0002】
近年、医療分野においても多くのAI技術が適用され応用されている。このような医療分野でのAI技術では、実際の診療において利用された医用データが、その患者の許可を受け、トレーニングデータとして利用される。従って、医用システムに組み込まれた学習モデルは、被検者の許可を得たトレーニングデータを用いてトレーニングされたものとなる。
【0003】
しかしながら、患者からデータの使用を制限又は禁止する申し出が事後的に発生した場合、これまでの学習モデルを使用できなくなる可能性がある。同時に、この様な問題にあたり、トレーニングデータセットに含まれる膨大なデータの中から使用制限のかかったデータを手動で差し替え学習済モデルを再学習させることは、大きな負担となる。
【先行技術文献】
【特許文献】
【0004】
【文献】特表2013-537326号公報
【発明の概要】
【発明が解決しようとする課題】
【0005】
本明細書等に開示の実施形態が解決しようとする課題の一つは、学習モデルに用いたトレーニング用データに事後的に使用制限がかかった場合であっても、トレーニング用データセットを容易に再構築できるようにすることである。
【課題を解決するための手段】
【0006】
本実施形態に係る医用情報処理装置は、データベースと、情報管理部と、加工部とを備える。前記データベースは、学習モデルのトレーニングデータとして用いられる、患者毎に管理された複数のトレーニング用データを含む第のデータセットと、前記トレーニング用データと同じデータ構造を有する複数の予備用データを含む第2のデータセットと、を格納する。前記情報管理部は、前記第1のデータセットに含まれる前記複数のトレーニング用データのうち、前記患者毎に関連付けられたプライバシー情報の少なくとも一部の使用制限に応じて、使用不可となった前記プライバシー情報を特定する特定情報を生成する。前記加工部は、前記第1のデータセットに含まれる前記複数のトレーニング用データのうち、前記情報管理部が生成した前記特定情報によって特定される使用不可となった前記トレーニング用データを、前記第2のデータセットに含まれる複数の前記予備用データのうちの使用可能である前記予備用データと置換し、前記第1のデータセットを加工する。
【図面の簡単な説明】
【0007】
図1図1は、実施形態に係る医用情報処理装置が使用される状況について説明するための図である。
図2図2は、本実施形態に係る医用情報処理装置の構成を示したブロック図である。
図3図3は、トレーニング用データ、予備用データのデータ構造を説明するための図である。
図4図4は、学習モデル用データセットの再構築処理及び事後学習処理の流れについて説明するためのフローチャートである。
【発明を実施するための形態】
【0008】
以下、添付図面を参照して、実施形態に係る医用情報処理装置について説明する。
【0009】
まず、実施形態に係る医用情報処理装置が使用される状況について説明する。図1は、実施形態に係る医用情報処理装置が使用される状況について説明するための図である。図1において、企業Aは、医療において利用される学習モデル(例えば、低解像度の画像を入力とし高解像度の画像を出力する超解像モデル、診断に用いる画像を入力とし腫瘍等の有無を判定するCAD用モデル、領域抽出用モデル等)を開発・製造する。このような学習モデルは、医用画像診断装置や医用画像処理装置に実装される。また、このような学習モデルは、企業Aが有するサーバ装置に実装し、病院Bが有するクライアント装置からの要求によりネットワークNを介して利用されることもある。
【0010】
病院Bは、企業Aが製造した学習モデルが内蔵された医用画像診断装置や医用画像処理装置、或いはネットワークNを介して企業Aが有するサーバ装置に実装された学習モデルを使用する。
【0011】
また、企業Aが製造した学習モデルは、複数の医用情報者から提供された医用情報をトレーニングデータとして利用することで製造されたものである。医用情報提供者Cは、このトレーニングデータとして利用された医用情報の提供者(典型的には患者)の一人であり、自身の判断と任意のタイミングで、自身が提供した医用情報の使用可否(提供した医用情報の一部の使用可否も含む)を企業Aに意思表示することができる。
【0012】
なお、図1においては、医用情報提供者Cを一人だけ記載したのはあくまでも説明上の便宜に過ぎない。当然ながら、医用情報提供者は、医用情報の提供を受けた人数だけ存在することになる。また、医用情報提供者が提供した医用上情報の使用可否を企業Aに伝えるのは、医用情報提供者本人である必要はなく、その代理人(例えば、親族、法的代理人、エージエント等)であってもよい。以下の説明においては、説明を具体的にするため、情報提供者が患者本人である場合を例とする。
【0013】
図2は、本実施形態に係る医用情報処理装置1の構成を示したブロック図である。医用情報処理装置1は、典型的には企業Aによって所有され管理されるものであり、専用又は汎用コンピュータである。
【0014】
医用情報処理装置1は、記憶回路10、処理回路11、入力回路12、通信I/F部13、表示回路14を備える。
【0015】
記憶回路10は、RAM(Random Access Memory)、フラッシュメモリ(flash memory)等の半導体メモリ素子、ハードディスク、光ディスク等によって構成される。記憶回路10は、USB(Universal Serial Bus)メモリ及びDVD(Digital Video Disk)などの可搬型メディアによって構成されてもよい。
【0016】
記憶回路10は、処理回路11において用いられる各種処理プログラム(アプリケーションプログラムの他、OS(Operating System)等も含まれるや、プログラムの実行に必要なデータや、ボリュームデータ及び医用画像を記憶する。また、OSに、操作者に対する表示回路14への情報の表示にグラフィックを多用し、基礎的な操作を入力回路12によって行なうことができるGUI(Graphical User Interface)を含めることもできる。
【0017】
また、記憶回路10は、学習モデル毎に生成された複数の学習モデル用データセット10-1~10-nを記憶する。
【0018】
学習モデル用データセット10-1~10-nは、それぞれ予め決められたデータ構造に従って医用データを患者毎に登録するデータベースであり、例えば超解像モデル、CAD用モデルといった学習モデル毎に管理される。学習モデル用データセット10-1~10-nは、複数のトレーニング用データによって構成されるトレーニング用データセット10-1a~10-naと、複数の予備用データによって構成される予備用データセット10-1b~10-nbとからそれぞれ構成される。
【0019】
ここで、トレーニング用データとは、例えば深層学習モデル等のAIモデルのトレーニング(又は学習)に使用するトレーニングデータ(訓練データ)であり、患者毎に管理される。また、対応する学習モデルのトレーニングに必要とされる量の複数のトレーニング用データをトレーニング用データセットと呼ぶ。従って、トレーニング用データセットは、複数の患者から提供されたトレーニング用データによって構成される。
【0020】
予備用データとは、トレーニング用データと同様のデータ構造を有し、直接的にAIモデルのトレーニングには用いられないが、学習モデル構築後にトレーニング用データセットが使用不可データを含むことになった場合に、使用不可データと入れ替え(置換)するためのデータである。この目的から、予備用データは、トレーニング用データを参考に(例えば、含まれるコンテンツ等がトレーニング用データと似る様に)生成される。また、複数の予備用データを予備用データセットと呼ぶ。同じく、予備用データセットは、複数の患者から提供された予備用データによって構成される。なお、予備用データセットは、例えば、使用不可データの入れ替えの対象となるトレーニング用データセットと関連付して管理するようにしてもよい。
【0021】
図3は、トレーニング用データ、予備用データのデータ構造を説明するための図であり、トレーニング用データ、予備用データに付されるメタ情報の一例である。図3に示すように、トレーニング用データ及び予備用データは、患者毎すなわち患者ID毎に管理され、各患者について性別、生年月日、身長、体重、遺伝子情報、病歴、検査情報(CT画像検査、MR画像検査等)等の各種情報について体系的に分類されている。
【0022】
患者ID及び当該患者IDに関連づけされた各情報には、プライバシータグPが付されている。ここで、プライバシータグとは、対応する情報の使用可否を示すタグである。例えば、患者IDそのもののプライバシータグ(第1のタグ)は、当該患者に関連付けされた全ての情報の使用可否を一括して管理するタグである。図3に示した例では、患者IDのプライバシータグPについて「使用可」を示すものとしてチェックが付されている。このため、当該患者に関する情報は、その下に関連付けされた情報毎に使用可否が管理されることになる。一方、仮に図3に示した例において、患者IDのプライバシータグPについて「使用不可」を示すものとしてチェックが外されている場合には、当該患者に関連する全ての情報は、一括して使用不可として管理されることになる。
【0023】
また、図3に示した例では、性別、生年月日、身長、体重、病歴、検査情報といった患者IDに関連する情報に付されたプライバシータグP(第2のタグ)には「使用可」を示すものとしてチェックが付されている。一方、遺伝子情報のプライバシータグPには「使用不可」を示すものとしてチェックが外されている。
【0024】
従って、図3に示した当該患者のトレーニング用データ又は予備用データについては、遺伝子情報のみ「使用不可」として取り扱われることになる。
【0025】
処理回路11は、プログラムを記憶回路10から読み出し、実行することで各プログラムに対応する機能を実現するプロセッサである。処理回路11は、例えば、プライバシー管理機能111、データセット加工機能112、事後学習機能113を有する。処理回路11は、記憶回路10に格納されている各種制御プログラムを読み出してプライバシー管理機能111、データセット加工機能112、事後学習機能113を実現すると共に、記憶回路10、入力回路12、通信I/F部13、表示回路14における処理動作を統括的に制御する。換言すると、各プログラムを読み出した状態の処理回路11は、プライバシー管理機能111、データセット加工機能112、事後学習機能113を有することとなる。
【0026】
プライバシー管理機能111は、各患者に関する医用情報につき、プライバシーを保護するための処理(プライバシー保護処理)を行う。このプライバシー保護処理を受けたデータは、原則的に個人を特定できない情報となる。また、プライバシー管理機能111は、学習モデルが生成された後に(事後的に)特定のトレーニング用データの少なくとも一部が使用不可となった場合(トレーニング用データの少なくとも一部に使用制限がかかった場合)、当該使用不可となったデータを特定するための情報(特定情報)を生成する。また、プライバシー管理機能111は、特定情報と共に、当該使用不可となったデータを含むトレーニング用データセットの再構築をデータセット加工機能112に対して指示する。なお、プライバシー管理機能111は情報管理部の一例である。
【0027】
データセット加工機能112は、学習モデルのトレーニングを目的として患者から提供された情報を格納するデータベース(図示せず。また、このデータベースを「患者提供情報データベース」と呼ぶ。)から、学習モデルの種別に応じて事前に設定された条件に基づいて、トレーニング用データセットと予備用データセットに必要なデータを自動で収集し、学習モデル用データセットを自動的に構築する。なお、データセット加工機能112は加工部の一例である。
【0028】
すなわち、データセット加工機能112は、患者提供情報データベースに格納された情報から図3に示したデータ構造を有するトレーニング用データ又は予備用データを患者毎に生成し、トレーニング用データセットと予備用データセットとを学習モデル毎に自動的に構築する。データセット加工機能112は、トレーニング用データセット及び予備用データセットの構築に用いるデータのうち、トレーニング用データとして用いる割合と、予備用データとして用いる割合とを任意に設定することができる。
【0029】
なお、学習モデル用データセットは、自動構築ではなく、人的に構成することもできる。また、トレーニング用データとして積極的に用いたいデータに関して、その情報を事前に設定しておくことも可能である。さらに、トレーニング用データセットと予備用データセットとの間で、一部のデータが共有されていてもよい。
【0030】
また、データセット加工機能112は、プライバシー管理機能111からの命令をトリガとして、学習モデル用データセットを自動的に再構築する。すなわち、データセット加工機能112は、プライバシー管理機能111から受け取った特定情報に基づいて、トレーニング用データセット内の使用不可データを特定する。また、データセット加工機能112は、トレーニング用データセット内の特定した使用不可データを、予備用データセット内の当該使用不可データと類似度が高く置換の候補となるデータ(候補データ)を入れ替えることで、学習モデル用データセットを自動的に再構築する。
【0031】
さらに、データセット加工機能112は、予備用データセットの各使用可能データにつき、入れ替える使用不可データとの類似度を計算する。データセット加工機能112は、予備用データセットの各使用可能データにつき、類似度の最も高い使用可能データをトレーニング用データセット内の使用不可データと置換する。
【0032】
データセット加工機能112は、使用不可データに関する種々の指標を基準として類似度を計算することができる。
【0033】
類似度計算に用いる指標としては、例えば、「撮像プロトコル(Cardiac、Neuro等)」、「撮像プログラム(造影剤使用の有無、DA、DSA、回転撮像等)」、「患者情報(性別、年齢層、体格、症例等)」、「撮像時の装置の設定情報(管電圧値、管電流値、寝台の高さ、アームの角度等)」、「画像情報(検査目的、診断部位、モダリティ、画像種、解像度等)を挙げることができる。
【0034】
複数の指標を用いた類似度計算は、例えば次のような類似度評価式を利用することができる。
【0035】
(類似度)=1/{(重み係数α)・(第1指標の差)+(重み係数β)・(第2指標の差)+・・・・}
【0036】
ここで、「指標の差」とは、使用不可データと類似度計算の対象となる予備用データとの間の当該指標の差を意味する。また、各重み係数は、それぞれの指標をどれくらい類似度に反映させるかを調整するための係数である。
【0037】
例えば、特定の臓器の領域を自動抽出する学習モデルにおいて、入力データに対象臓器の領域をマーキングし画像データが使用されているとする。この学習モデルに使用されたトレーニングデータの差し替えにおいては、例えば対象領域の大きさや断面の位置を指標として含む類似度掲載を実行する。このとき、対象領域の大きさや断面の位置については、学習モデルの種別に鑑み、重み係数を大きくした上で類似度の計算をすることができる。
【0038】
データセット加工機能112は、学習用モデルデータセットの構築又は再構築が完了した旨を、必要に応じて、事後学習機能113、企業Bの管理サーバに通知する。
【0039】
事後学習機能113は、データセット加工機能112によって再構築されたトレーニング用データセットを用いて、対応する学習モデルについての事後学習を実行する。
【0040】
また、事後学習機能113は、再構築されたトレーニング用データセットを用いた事後学習の結果を、必要に応じて、データセット加工機能112、企業Bの管理サーバに通知する。
【0041】
なお、上記説明において用いた「プロセッサ」という文言は、例えば、CPU(Central Processing Unit)、GPU(Graphical processing unit)或いは、特定用途向け集積回路(Application Specific Integrated Circuit:ASIC)、プログラマブル論理デバイス(例えば、単純プログラマブル論理デバイス(Simple Programmable Logic Device:SPLD)、複合プログラマブル論理デバイス(Complex Programmable Logic Device:CPLD),及びフィールドプログラマブルゲートアレイ(Field Programmable Gate Array:FPGA))等の回路を意味する。プロセッサは記憶回路10に保存されたプログラムを読み出し実行することで機能を実現する。なお、記憶回路10にプログラムを保存する代わりに、プロセッサの回路内にプログラムを直接組み込むよう構成しても構わない。この場合、プロセッサは回路内に組み込まれたプログラムを読み出し実行することで機能を実現する。
【0042】
入力回路12は、操作者によって操作が可能なポインティングデバイス(マウス等)やキーボード等の入力デバイスからの信号を入力する回路であり、ここでは、入力デバイス自体も入力回路12に含まれるものとする。操作者により入力デバイスが操作されると、入力回路12はその操作に応じた入力信号を生成して処理回路11に出力する。なお、医用情報処理装置1は、入力デバイスが表示回路14と一体に構成されたタッチパネルを備えてもよい。
【0043】
入力回路12は、は、関心領域(ROI)の設定などを行うためのトラックボール、スイッチボタン、マウス、キーボード、操作面へ触れることで入力操作を行うタッチパッド、操作面へ触れることで入力操作を行うタッチパッド、表示画面とタッチパッドとが一体化されたタッチスクリーン、光学センサを用いた非接触入力回路、及び音声入力回路及び表示画面とタッチパッドとが一体化されたタッチパネルディスプレイ等によって実現される。
【0044】
なお、入力回路12は、はマウス、キーボードなどの物理的な操作部品を備えるものだけに限られない。例えば、装置とは別体に設けられた外部の入力機器から入力操作に対応する電気信号を受け取り、この電気信号を制御回路へ出力する電気信号の処理回路も入力回路12の例に含まれる。
【0045】
表示回路14は、画像を表示するディスプレイであり、LCD(Liquid Crystal Display等によって構成される。表示回路14は、処理回路11からの指示に応じてLCD上に、各種操作画面や、画像データ等の各種表示情報を表示させる。
【0046】
通信I/F(interface)回路13は、所定の通信規格にしたがって、外部装置との通信動作を行う。医用情報処理装置1がネットワーク上に設けられる場合、通信I/F回路13は、ネットワーク上の外部装置と情報の送受信を行なう。例えば、通信I/F回路13は、撮像で得られたデータをMRI装置等の医用画像診断装置や医用画像管理装置から受信する。
【0047】
(学習モデル用データセットの再構築処理)
次に、学習モデル用データセットの再構築処理について説明する。
【0048】
まず、学習モデル用データセットの再構築処理が実行される典型的な場面について説明する。
【0049】
データセット加工機能112によって最初のトレーニング用データセットが構築された時点では、トレーニング用データセット、予備用データセットのそれぞれに含まれている各データは、使用可能データとなっている。しかしながら、これらの各データが、例えば提供者である患者本人やその親族から使用を希望しない申し出があるなど、事後的に使用不可データとなる場合がある。係る場合には、使用不可データを含むトレーニング用データセットを用いてトレーニングされた学習モデルについても使用不可となる可能性がある。
【0050】
このため、トレーニング用データセット内の使用不可データを予備用データセット内の使用可能データと置換してトレーニング用データセットを再構築し、当該再構築されたトレーニング用データセットを用いて学習モデルを事後学習する必要がある。また、係る事後学習の結果、事後学習前の学習モデルと同程度の精度を担保する必要がある。
【0051】
以下、そのための学習モデル用データセットの再構築処理及び事後学習処理について説明する。
【0052】
図4は、学習モデル用データセットの再構築処理及び事後学習処理の流れについて説明するためのフローチャートである。
【0053】
図4に示すように、まず、データセット加工機能112は、プライバシー管理機能111から使用不可データのデータ加工指示を受け付ける(ステップS1)。また、データセット加工機能112は、使用不可データに関する情報(すなわち、どの患者のどのデータが使用不可データであるのかを特定するための情報)を取得する(ステップS2)。
【0054】
データセット加工機能112は、取得した使用不可データに関する情報を用いて、トレーニング用データセット内の使用不可データを特定する(ステップS3)。
【0055】
データセット加工機能112は、予備用データセット内の各データと、特定された使用不可データとの類似度を計算し、計算された類似度に従って、特定された使用不可データとの置換対象となる候補データを決定する(ステップS4)。なお、このとき、予備用データセット内に特定された使用不可データと同一の提供者によるデータが含まれている場合がある。この様な特定された使用不可データと同一の提供者によるデータについては、類似度計算の対象から除外され、置換の対象とされない。
【0056】
データセット加工機能112は、予備用データセット内の類似度が最も高い第1の候補データと、トレーニング用データセット内の使用不可データとを置換する(ステップS5)。このとき、置換された使用不可データは、「使用不可」を示すものとして患者IDのプライバシータグが外され、予備データとして予備用データセット内に格納され管理される。
【0057】
なお、置換された使用不可データは、「使用不可」を示すものとして患者IDのプライバシータグが外された後、必要に応じて予備用データセットから削除するようにしてもよい。
【0058】
データセット加工機能112は、他の使用不可データが存在する場合には(ステップS6のYes)、他の使用不可データについてもステップS4、5の処理を実行する。
【0059】
他の使用不可データが存在しない場合には(ステップS6のNo)、事後学習機能113は、再構築されたトレーニング用データセットを用いて、対応する学習モデルについての事後学習を実行する(ステップS7)。
【0060】
事後学習機能113は、事後学習の結果得られた新たな学習モデルの精度は一定値以上であるか否かを判定する(ステップS8)。
【0061】
一方、データセット加工機能112は、新たな学習モデルの精度は一定以下であると判定した場合には(ステップS8のNo)、類似度が最も高い第1の候補データを類似度が二番目に高い第2の候補データに入れ替えて、トレーニング用データセットを再構築する(ステップS9)。事後学習機能113は、第1の候補データが第2の候補データと置換されたトレーニング用データセットを用いて、対応する学習モデルについての事後学習を実行する(ステップS7)。
【0062】
なお、事後学習機能113は、事後学習によって新たに生成される学習モデルの精度が一定値になるまで、ステップS3において計算された類似度に基づいて候補データを置換して、ステップS7~S9までの処理を繰り返し実行する。
【0063】
一方、事後学習機能113は、新たな学習モデルの精度は一定値以上であると判定した場合には(ステップS8のYes)、事後学習を終了し、再構築されたトレーニング用データセットを用いた学習モデルの生成を完了する。また、事後学習機能113は、必要に応じて、再構築されたトレーニング用データセットを用いた事後学習が完了した旨を、企業Bの管理サーバに通知する。
【0064】
本実施形態に係る医用情報処理装置は、データベースとしての学習モデル用データセットと、加工部としてのデータセット加工機能112と、事後学習部としての事後学習機能113とを備える。学習モデル用データセットは、学習モデルのトレーニングデータとして用いられる複数のトレーニング用データを含む第1のデータセットとしてのトレーニング用データセットと、トレーニング用データと同じデータ構造を有する複数の予備用データを含む第2のデータセットとしての予備用データセットと、を格納する。データセット加工機能112は、トレーニング用データセットに含まれる複数のトレーニング用データのうち使用不可となったトレーニング用データを、予備用データセットに含まれる複数の予備用データのうちの使用可能である予備用データと置換し、トレーニング用データセットを加工(再構築)する。
【0065】
従って、トレーニング用データセットに含まれるデータに事後的に使用制限がかかった場合であっても、容易にトレーニング用データセットを再構築し、トレーニング(学習)に使ったデータ総数とバリエーションを一定に保つことができる。その結果、事後学習に必要なデータセットを、容易且つ迅速に更新することができ、トレーニング用データに使用制限がかかった場合であっても、新たに再学習したモデルが、これまで使用していた学習モデルと同様の性能を持つことを担保することができ、常に一定レベルの精度を有する学習モデルを提供することができる。
【0066】
また、医用システムで用いられている学習モデルで使用しているデータの差し替えと、学習モデルの際学習の手間をなくすことができる。その結果、トレーニング用データセットに含まれるデータに事後的に使用制限がかかった場合であっても、ユーザは特定の作業を行うことなく学習モデルの精度を担保することができる。
【0067】
(変形例1)
上記実施形態においては、医用情報処理装置1がデータベースとしての学習モデル用データセット10-1~10-n、プライバシー管理機能111、事後学習機能113を有する構成を例示した。これに対し、学習モデル用データセット10-1~10-n、プライバシー管理機能111、事後学習機能113は、例えばクラウド上のサーバ等、ネットワークを介して医用情報処理装置1を通信可能な少なくとも一つ装置に、分散して又はまとめて設けるようにしてもよい。
【0068】
係る構成の場合、医用情報処理装置1は、医用画像情報処理システムとして構成されることになる。
【0069】
(変形例2)
上記実施形態においては、データセット加工機能112は、プライバシー管理機能からの命令をトリガとしてトレーニング用データセットの再構築を実行した。これに対し、データセット加工機能112は、例えば、企業Bが管理する別のサーバ装置からの命令をトリガとして、トレーニング用データセットの再構築を実行するようにしてもよい。
【0070】
また、上記実施形態においては、事後学習機能113は、データセット加工機能112bによってトレーニング用データセットが再構築されたことをトリガとして、事後学習を自動的に実行した。これに対し、事後学習機能113は、学習モデル用データベースの再構築の後、任意のタイミングで学習モデルの事後学習を開始することもできる。例えば、事後学習機能113は、企業Bが管理する別のサーバ装置からの命令や別途人為的な入力指示をトリガとして事後学習を実行するようにしてもよい。
【0071】
(変形例3)
上記実施形態においては、プライバシー管理機能111から使用不可データのデータ加工指示を受け付けたことをトリガとして、トレーニング用データセットを再構築する場合を例とした。これに対し、患者提供情報データベースに新規登録された患者提供情報の数が一定値以上になったことをトリガとして、トレーニング用データセットを再構築するようにしてもよい。このとき、トレーニング用データセットのみならず、予備用データセットについても患者提供情報データベース内の新たなデータと入れ替えるようにしてもよい。また、予備用データセットから入れ替え対象とされた古い予備用データについては、学習モデル用データセットとしての管理を解除されることが好ましい。
【0072】
なお、本変形例においても、当然ながら、事後学習機能113は、新たなトレーニングデータの精度が担保されるまで、トレーニング用データセットの再構築は繰り返し実行されるのが好ましい。
【0073】
(変形例4)
学習モデル用データセット内の予備用データセットの使用可能データの割合が閾値を下回った場合には、データセット加工機能112は、当該予備用データセットを再構築することが好ましい。このとき、データセット加工機能112は、患者提供情報データベースから新たな使用可能データを取得し、予備用データセット内の使用不可データと入れ替えることにより、予備用データセットを再構築する。また、係る再構築においては、予備用データセットから入れ替え対象とされた古い予備用データについては、学習モデル用データセットとしての管理を解除されることが好ましい。
【0074】
(変形例5)
学習モデル用データセット10-1~10-n内のトレーニングデータは、事後的に、例えば使用されなくなった装置によって取得された情報、医療ガイドラインの変更により不適切な条件で収集してしまった情報等を含むことになる場合がある。この様なトレーニングデータ(「適格性喪失データ」と呼ぶ)は、たとえ患者からの使用許可を得ている場合であっても、学習モデルのトレーニングに用いることはできない。
【0075】
そこで、このような適格性喪失データが学習モデル用データセットに含まれていることが判明した場合、データセット加工機能112は、予備用データセット内の使用不可データと入れ替えることにより、自動的にトレーニング用モデルデータベースを再構築することが好ましい。また、係る再構築においては、予備用データセットから入れ替え対象とされた古い予備用データについては、学習モデル用データセットとしての管理を解除されることが好ましい。
【0076】
なお、本変形例においても、当然ながら、事後学習機能113は、新たなトレーニングデータの精度が担保されるまで、トレーニング用データセットの再構築は繰り返し実行されるのが好ましい。
【0077】
以上説明した少なくとも一つの実施形態によれば、学習モデルに用いたトレーニング用データに事後的に使用制限がかかった場合であっても、トレーニング用データセットを容易に再構築できるようにすることができる。
【0078】
また、本発明のいくつかの実施形態を説明したが、これらの実施形態は、例として提示したものであり、発明の範囲を限定することは意図していない。これら実施形態は、その他の様々な形態で実施されることが可能であり、発明の要旨を逸脱しない範囲で、種々の省略、置き換え、変更、実施形態同士の組み合わせを行うことができる。これら実施形態やその変形は、発明の範囲や要旨に含まれると同様に、特許請求の範囲に記載された発明とその均等の範囲に含まれる。
【符号の説明】
【0079】
1 医用情報処理装置
10 記憶回路
10-1~10-n 学習モデル用データセット
10-1a~10-na トレーニング用データセット
10-1b~10-nb予備用データセット
11 処理回路
12 入力回路
13 通信I/F部
14 表示回路
111 プライバシー管理機能
112 データセット加工機能
113 事後学習機能
図1
図2
図3
図4