IP Force 特許公報掲載プロジェクト 2022.1.31 β版

知財求人 - 知財ポータルサイト「IP Force」

▶ エフ ホフマン−ラ ロッシュ アクチェン ゲゼルシャフトの特許一覧

<>
  • 特表-医療検証モデルの連合学習 図1
  • 特表-医療検証モデルの連合学習 図2
  • 特表-医療検証モデルの連合学習 図3
  • 特表-医療検証モデルの連合学習 図4
  • 特表-医療検証モデルの連合学習 図5
  • 特表-医療検証モデルの連合学習 図6
< >
(19)【発行国】日本国特許庁(JP)
(12)【公報種別】公表特許公報(A)
(11)【公表番号】
(43)【公表日】2024-11-13
(54)【発明の名称】医療検証モデルの連合学習
(51)【国際特許分類】
   G16H 50/00 20180101AFI20241106BHJP
【FI】
G16H50/00
【審査請求】有
【予備審査請求】未請求
(21)【出願番号】P 2024525719
(86)(22)【出願日】2021-11-01
(85)【翻訳文提出日】2024-04-30
(86)【国際出願番号】 CN2021127937
(87)【国際公開番号】W WO2022247143
(87)【国際公開日】2022-12-01
(81)【指定国・地域】
【公序良俗違反の表示】
(特許庁注:以下のものは登録商標)
1.TENSORFLOW
(71)【出願人】
【識別番号】501205108
【氏名又は名称】エフ ホフマン-ラ ロッシュ アクチェン ゲゼルシャフト
(74)【代理人】
【識別番号】110001896
【氏名又は名称】弁理士法人朝日奈特許事務所
(72)【発明者】
【氏名】ヤオ、イー
(72)【発明者】
【氏名】シン、ウェイビン
(72)【発明者】
【氏名】タオ、シャオジュン
(72)【発明者】
【氏名】チェン、ジン
(72)【発明者】
【氏名】ジョウ、チー
(72)【発明者】
【氏名】チャン、チェンシー
(72)【発明者】
【氏名】チェン、イン
【テーマコード(参考)】
5L099
【Fターム(参考)】
5L099AA03
(57)【要約】
マスタノードによって、複数のコンピューティングノードに、初期医療検証モデルに関する定義情報を送信すること(410)と、マスタノードによって、複数のコンピューティングノード(420)と共に連合学習プロセスを実行し、複数のコンピューティングノードで利用可能なそれぞれの処理されたローカル訓練データセットを使用して初期医療検証モデルを共同で訓練することであって、それぞれのローカル訓練データセットが、定義情報に基づいて複数のコンピューティングノードによって処理される、訓練することと、マスタノードによって、連合学習プロセスの結果に基づいて最終医療検証モデルを決定すること(430)と、を含むコンピュータにより実行される方法が提供される。このソリューションを通じて、連合学習によって、ローカルサイトが所有することによるデータセキュリティおよびプライバシーの懸念に対処する。
【特許請求の範囲】
【請求項1】
マスタノードによって、初期医療検証モデルに関する定義情報を複数のコンピューティングノードに送信することと、
前記マスタノードによって、前記複数のコンピューティングノードと共に連合学習プロセスを実行し、前記複数のコンピューティングノードで利用可能なそれぞれの処理されたローカル訓練データセットを使用して前記初期医療検証モデルを共同で訓練することであって、前記それぞれのローカル訓練データセットが、前記定義情報に基づいて前記複数のコンピューティングノードによって処理される、訓練することと、
前記マスタノードによって、前記連合学習プロセスの結果に基づいて最終医療検証モデルを決定することと
を含む、コンピュータにより実行される方法。
【請求項2】
前記マスタノードによって、前記最終医療検証モデルを、医療検証で使用するために前記複数のコンピューティングノードのうちの少なくとも1つ、または少なくとも1つのさらなるコンピューティングノードに配信すること、
をさらに含む、請求項1に記載の方法。
【請求項3】
前記それぞれのローカル訓練データセットが、医療検査で生成された過去の医療データと、前記過去の医療データのローカル検証カテゴリを示すラベリング情報とを含む、請求項1に記載の方法。
【請求項4】
前記定義情報が、前記初期医療検証モデルに入力される医療データにおける統一された項目名と、前記初期医療検証モデルから出力される統一された検証カテゴリとを示し、前記統一された検証カテゴリが、前記医療データに対して実行される複数の所定の検証アクションを示し、
前記それぞれのローカル訓練データセットが、前記過去の医療データで使用されたローカル項目名を前記統一された項目名にマッピングし、前記ローカル検証カテゴリを前記統一された検証カテゴリにマッピングすることによって処理される、
請求項3に記載の方法。
【請求項5】
前記定義情報が、前記初期医療検証モデルに入力される医療データ内の項目についてのスケーリングされた値の範囲をさらに示し、
前記それぞれのローカル訓練データセットが、前記過去の医療データ内の前記項目の値を前記スケーリングされた値の範囲内の値にマッピングすることによって処理される、
請求項3または4に記載の方法。
【請求項6】
前記定義情報が、医療データが前記初期医療検証モデルに入力されるのを防止するための統一されたレッドフラグルールをさらに示し、
前記それぞれのローカル訓練データセットが、前記統一されたレッドフラグルールを満たす過去の医療データをフィルタリングすることによって処理される、請求項2~5のいずれかに記載の方法。
【請求項7】
前記定義情報が、前記初期医療検証モデルに入力される医療データ内の項目を示し、示された前記項目の値が、ローカル訓練データセット内の過去の医療データからは入手不可能であり、
前記ローカル訓練データセットが、前記示された項目について所定の値を入力することによって処理される、請求項2~6のいずれかに記載の方法。
【請求項8】
前記所定の値が、他の医療検査で生成された過去の医療データにおける前記示された項目の基準値範囲の平均値および前記示された項目の利用可能な値の中央値のいずれか1つを含む、請求項7に記載の方法。
【請求項9】
前記最終医療検証モデルを決定することが、
前記マスタノードによって、前記連合学習プロセスの前記結果から、訓練された医療検証モデルを取得することと、
前記訓練された医療検証モデルを前記複数のコンピューティングノードに配信することと、
前記複数のコンピューティングノードからフィードバックを受信することであって、前記フィードバックが、それぞれのローカル検証データセットを使用して前記コンピューティングノードによって決定された前記訓練された医療検証モデルのそれぞれの性能メトリックを示す、受信することと、
受信した前記フィードバックに基づいて前記最終医療検証モデルを決定することと
を含む、請求項1~8のいずれかに記載の方法。
【請求項10】
前記受信したフィードバックに基づいて前記最終医療検証モデルを決定することが、
前記それぞれの性能メトリックがモデル公開基準を満たすことに応答して、前記訓練された医療検証モデルを前記最終医療検証モデルとして決定することと、
前記それぞれの性能メトリックが前記モデル公開基準を満たしていないことに応答して、前記訓練された医療検証モデルを調整して前記最終医療検証モデルを生成することと
を含む、請求項9に記載の方法。
【請求項11】
前記マスタノードが、スター型トポロジネットワーク内の前記複数のコンピューティングノードと通信可能に接続されている、請求項1~10のいずれかに記載の方法。
【請求項12】
コンピューティングノードによって、マスタノードから、初期医療検証モデルに関する定義情報を受信することと、
少なくとも前記定義情報に基づいてローカル訓練データセットを処理することと、
前記マスタノードおよび少なくとも1つのさらなるコンピューティングノードと共に連合学習処理を実行して、処理された前記ローカル訓練データセットを使用して前記初期医療検証モデルを共同で訓練することと
を含む、コンピュータにより実行される方法。
【請求項13】
前記コンピューティングノードによって、前記マスタノードから、前記連合学習プロセスから決定された最終医療検証モデルを受信すること、
をさらに含む、請求項12に記載の方法。
【請求項14】
前記ローカル訓練データセットが、医療検査において生成された過去の医療データと、前記過去の医療データのローカル検証カテゴリを示すラベリング情報とを含む、請求項12または13に記載の方法。
【請求項15】
前記定義情報が、前記初期医療検証モデルに入力される医療データにおける統一された項目名と、前記初期医療検証モデルから出力される統一された検証カテゴリとを示し、前記統一された検証カテゴリが、前記医療データに対して実行される複数の所定の検証アクションを示し、
前記ローカル訓練データセットを処理することが、
前記過去の医療データで使用されたローカル項目名を前記統一された項目名にマッピングし、前記ローカル検証カテゴリを前記統一された検証カテゴリにマッピングすること、
を含む、請求項14に記載の方法。
【請求項16】
前記定義情報が、前記初期医療検証モデルに入力される医療データ内の項目についてのスケーリングされた値の範囲をさらに示し、
前記ローカル訓練データセットを処理することが、
前記過去の医療データ内の前記項目の値を、前記スケーリングされた値の範囲内の値にマッピングすること、
を含む、請求項14または15に記載の方法。
【請求項17】
前記定義情報が、医療データが前記初期医療検証モデルに入力されるのを防止するための統一されたレッドフラグルールをさらに示し、
前記ローカル訓練データセットを処理することが、
前記統一されたレッドフラグルールを満たす過去の医療データを前記ローカル訓練データセットからフィルタリングすること、
を含む、請求項14~16のいずれかに記載の方法。
【請求項18】
前記定義情報が、前記初期医療検証モデルに入力される医療データ内の項目を示し、示された前記項目の値が、医療検査で生成された過去の医療データからは入手不可能であり、
前記ローカル訓練データセットを処理することが、
前記示された項目に所定の値を入力することによって前記過去の医療データを処理すること、
を含む、請求項14~17のいずれかに記載の方法。
【請求項19】
前記所定の値が、他の医療検査で生成された過去の医療データにおける前記示された項目の基準値範囲の平均値および前記示された項目の利用可能な値の中央値のいずれか1つを含む、請求項18に記載の方法。
【請求項20】
前記マスタノードから、前記連合学習プロセスの結果から決定された訓練された医療検証モデルを受信することと、
ローカル検証データセットを使用して、前記訓練された医療検証モデルの性能メトリックを決定することと、
決定された前記性能メトリックを示すフィードバックを前記マスタノードに送信することと
を含む、請求項12~19のいずれかに記載の方法。
【請求項21】
前記性能メトリックを決定することが、
前記定義情報に基づいてローカル検証データセットを処理することと、
処理された前記ローカル検証データセットを使用して前記性能メトリックを決定することと
を含む、請求項20に記載の方法。
【請求項22】
電子デバイスであって、
少なくとも1つのプロセッサと、
前記電子デバイスの前記少なくとも1つのプロセッサによって実行されると、前記電子デバイスに、請求項1~11のいずれか一項に記載の方法のステップを実行させるコンピュータ可読命令を含む少なくとも1つのメモリと
を備える、電子デバイス。
【請求項23】
電子デバイスであって、
少なくとも1つのプロセッサと、
前記電子デバイスの前記少なくとも1つのプロセッサによって実行されると、前記電子デバイスに、請求項12~21のいずれか一項に記載の方法のステップを実行させるコンピュータ可読命令を含む少なくとも1つのメモリと
を備える、電子デバイス。
【請求項24】
装置のプロセッサによって実行されると、前記装置に請求項1~11のいずれか一項に記載の方法のステップを実行させる命令を含むコンピュータプログラム製品。
【請求項25】
装置のプロセッサによって実行されると、前記装置に、請求項12~21のいずれか一項に記載の方法のステップを実行させる命令を含むコンピュータプログラム製品。
【発明の詳細な説明】
【技術分野】
【0001】
本開示の実施形態は、一般に、コンピュータ科学の分野に関し、詳細には、医療検証モデルの連合学習のための方法、デバイス、およびコンピュータプログラム製品に関する。
【背景技術】
【0002】
医療検査は、ほぼ毎日、医療検査室で行われ、そこから多数の医療検査報告書が生成され、医療データが提示される。医療検査報告書を診療科または患者に公開する前に、患者の誤診を回避するために、報告書に提示された医療データが有効であることを確実にするための検証手順が開始される。しかしながら、いくつかの自動化された機能が導入されているにもかかわらず、現在の検証手順では多くの労力が必要とされる。
【0003】
機械学習の発展に伴い、現在、医療データの自動検証のための機械学習モデルを訓練することが提案されている。機械学習モデルの訓練は、過去の医療データを含む訓練データを必要とする場合がある。従来、各検査室または病院は、ローカルに生成された過去の医療データを収集して、使用する機械学習モデルを訓練することがある。しかしながら、モデルのこのような個別のローカル訓練は、リソースを消費し、あまり効率的ではない場合がある。一方で、利用可能な過去の医療データは、それぞれのローカルサイトで制限される可能性がある。例えば、健診センターで収集された医療データの大部分は、健常者の病状を反映する可能性があり、一方、腫瘍科クリニックで収集された医療データの大部分は、腫瘍患者の病状を反映する可能性がある。したがって、1つのローカルサイトで訓練された医療検証モデルは、他のローカルサイトの正確な検証結果を提供するために一般化されない可能性がある。
【0004】
したがって、医療検証モデルを効率的かつ効果的に訓練するためのソリューションを提供することが望ましい。
【発明の概要】
【0005】
一般に、本開示の例示的な実施形態は、医療検証モデルの連合学習のためのソリューションを提供する。
【0006】
第1の態様では、コンピュータにより実行される方法が提供される。本方法は、マスタノードによって、複数のコンピューティングノードに、初期医療検証モデルに関する定義情報を送信することと、マスタノードによって、複数のコンピューティングノードと共に連合学習プロセスを実行し、複数のコンピューティングノードで利用可能なそれぞれの処理されたローカル訓練データセットを使用して初期医療検証モデルを共同で訓練することであって、それぞれのローカル訓練データセットが、定義情報に基づいて複数のコンピューティングノードによって処理される、訓練することと、マスタノードによって、連合学習プロセスの結果に基づいて最終医療検証モデルを決定することと、を含む。
【0007】
第2の態様では、コンピュータにより実行される方法が提供される。本方法は、コンピューティングノードによって、マスタノードから、初期医療検証モデルに関する定義情報を受信することと、少なくとも定義情報に基づいてローカル訓練データセットを処理することと、マスタノードおよび少なくとも1つのさらなるコンピューティングノードと共に連合学習処理を実行して、処理されたローカル訓練データセットを使用して初期医療検証モデルを共同で訓練することと、を含む。
【0008】
第3の態様では、電子デバイスが提供される。電子デバイスは、少なくとも1つのプロセッサと、電子デバイスの少なくとも1つのプロセッサによって実行されると、電子デバイスに上述の第1の態様における方法のステップを実行させるコンピュータ可読命令を含む少なくとも1つのメモリと、を備える。
【0009】
第4の態様では、電子デバイスが提供される。電子デバイスは、少なくとも1つのプロセッサと、電子デバイスの少なくとも1つのプロセッサによって実行されると、電子デバイスに、上述の第2の態様における方法のステップを実行させるコンピュータ可読命令を含む少なくとも1つのメモリと、を備える。
【0010】
第5の態様では、コンピュータプログラム製品が提供される。コンピュータプログラム製品は、装置のプロセッサによって実行されると、装置に、上述の第1の態様の方法のいずれか1つのステップを実行させる命令を含む。
【0011】
第6の態様では、コンピュータプログラム製品が提供される。コンピュータプログラム製品は、装置のプロセッサによって実行されると、装置に、上述の第2の態様の方法のいずれか1つのステップを実行させる命令を含む。
【0012】
概要の項は、本開示の実施形態の重要なまたは本質的な特徴を特定することを意図するものではなく、本開示の範囲を限定するために使用されることを意図するものでもないことを理解されたい。本開示の他の特徴は、以下の説明によって容易に理解されるであろう。
【図面の簡単な説明】
【0013】
本開示の実施形態の以下の詳細な説明は、以下の図面と併せて読むと最もよく理解することができる。
【0014】
図1】本開示の実施形態が実施され得る例示的な環境を示す図である。
図2】本開示のいくつかの実施形態による、連合学習および医療検証モデルの適用のためのシステムのブロック図である。
図3】本開示のいくつかの実施形態による、医療検証モデルの連合学習のための図2のシステムにおけるコンピューティングノードおよびマスタノードのブロック図である。
図4】本開示のいくつかの実施形態による、マスタノードで実施される医療検証モデルを訓練するための例示的なプロセスのフローチャートである。
図5】本開示のいくつかの実施形態による、コンピューティングノードで実施される医療検証モデルを訓練するための例示的なプロセスのフローチャートである。
図6】本開示の例示的な実施形態を実施するのに適した例示的なコンピューティングシステム/デバイスのブロック図である。
【0015】
図面を通して、同じまたは類似の参照番号は、同じまたは類似の要素を表す。
【発明を実施するための形態】
【0016】
次に、いくつかの実施形態を参照して、本開示の原理を説明する。これらの実施形態は、例示のみを目的として記載されており、本開示の範囲に関するいかなる限定も示唆することなく、当業者が本開示を理解して実施するのに役立つことを理解されたい。本明細書に記載された開示は、以下に説明する以外にも、様々な態様で実施されることが可能である。
【0017】
以下の説明および特許請求の範囲では、別段の定義がない限り、本明細書において使用されるすべての技術用語および科学用語は、本開示が属する技術分野の当業者によって一般に理解されている意味と同じ意味を有する。
【0018】
本開示における「一実施形態」、「実施形態」、「例示的な実施形態」などへの言及は、記載された実施形態が特定の特徴、構造、または特性を含み得ることを示すが、すべての実施形態が特定の特徴、構造、または特性を含む必要はない。さらに、このような語句は、必ずしも同じ実施形態を指すとは限らない。さらに、特定の特徴、構造、または特性が例示的な実施形態に関連して記載されている場合、明示的に記載されているか否かにかかわらず、他の実施形態に関連してこのような特徴、構造、または特性に影響を及ぼすことは当業者の知識の範囲内であると考えられる。
【0019】
本明細書では、「第1」および「第2」などの用語を使用して様々な要素を説明し得るが、これらの要素はこれらの用語によって限定されるべきではないことを理解されたい。これらの用語は、ある要素を別の要素と区別するためにのみ使用される。例えば、例示的な実施形態の範囲から逸脱することなく、第1の要素が第2の要素と呼ばれてもよく、同様に、第2の要素が第1の要素と呼ばれてもよい。本明細書で使用される場合、「および/または」という用語は、列挙された用語のうちの1つまたは複数のありとあらゆる組合せを含む。
【0020】
本明細書で使用される用語は、特定の実施形態のみを説明するためのものであり、例示的な実施形態を限定することを意図するものではない。本明細書で使用される場合、単数形「a」、「an」および「the」は、文脈が明らかにそうでないことを示さない限り、複数形も含むことが意図される。「備える(comprises)」、「備える(comprising)」、「有する(has)」、「有する(having)」、「含む(includes)」および/または「含む(including)」という用語は、本明細書で使用される場合、記載された特徴、要素、および/または構成要素などの存在を指定するが、1つまたは複数の他の特徴、要素、構成要素、および/またはそれらの組合せの存在または追加を排除するものではないことがさらに理解されよう。
【0021】
本明細書で使用される場合、「モデル」という用語は、入力と訓練データから学習された出力との間の関連付けと呼ばれ、したがって、訓練後に所与の入力に対して対応する出力を生成し得る。モデルの生成は、機械学習技術に基づいてもよい。機械学習技術は、人工知能(AI)技術と呼ばれることもある。一般に、入力情報を受け取り、入力情報に基づいて予測を行う機械学習モデルを構築することができる。例えば、分類モデルは、所定のクラスのセットの中から入力情報のクラスを予測し得る。本明細書で使用される場合、「モデル」は、「機械学習モデル」、「学習モデル」、「機械学習ネットワーク」、または「学習ネットワーク」とも呼ばれることがあり、本明細書では互換的に使用される。
【0022】
一般に、機械学習は、通常、3つの段階、すなわち、訓練段階、検証段階、および適用段階(推論段階とも呼ばれる)を含み得る。訓練段階では、所与の機械学習モデルは、モデルが訓練データから、人間の知能が行うことができるものと同様の一貫した推論を得ることができるまで、大量の訓練データを使用して反復的に訓練され得る。訓練を通じて、機械学習モデルは、訓練データから入力と出力との間の関連付け(入出力マッピングとも呼ばれる)を学習することができると見なされてもよい。訓練されたモデルのパラメータ値のセットが決定される。検証段階では、モデルの性能を判定するために、モデルが正しい出力を提供できるかどうかをテストするために、訓練された機械学習モデルに検証入力が適用される。適用段階では、得られた機械学習モデルを使用して、訓練から得られたパラメータ値のセットに基づいて実際のモデル入力を処理し、対応するモデル出力を決定し得る。
【0023】
例示的な環境
上述したように、検証手順は、様々な医療検査において生成される医療データの正当性を保証するために重要である。図1は、本開示の例示的な実施形態を実施することができる環境100を示す。環境100は、異なるローカルサイト105-1、105-2、...105-Nで実施される医療診断検査のための典型的なワークフローを含み、Nは1以上である。以下、説明のために、ローカルサイト105-1、105-2、...105-Nをまとめてまたは個別にローカルサイト105と呼ぶ。以下、105-Nをまとめてまたは個別にローカルサイト105と呼ぶ。ローカルサイト105は、医療検査室、病院、診療科、理学検査センター、医療機関、または医療検査が実行され、医療検査から得られた医療データを検証する必要がある任意のサイトを含み得る。
【0024】
図1では、簡潔にするために、医療診断検査のワークフローはローカルサイト105-1において詳述されているが、他のローカルサイトでも同様のワークフローが実施されることが理解されよう。ワークフローは、一般に、医療診断のための検査試料に対して医療検査を実行することと、医療検査において医療データを生成することと、生成された医療データを検証することとを含む。
【0025】
図1に示すように、ローカルサイト105において、医療検査システム110は、検査試料102に対して医療検査を実行し、検査試料102に関連付けられた医療データ112を生成するように構成される。医療検査は、生化学的検出検査または免疫検出検査などのインビトロ診断検査を含み得る。医療検査システム110は、様々な化学的、生物学的、物理的、または他の医療検査手順による検査試料の分析のために設計された、1つまたは複数の自動化された検査機器または分析装置を含み得る。いくつかの例では、機器または分析装置は、測定値を得るために試料と試薬との反応を誘導するように構成され得る。このような機器または分析装置の例としては、臨床化学分析装置、凝固分析装置、免疫化学分析装置、血液分析装置、尿分析装置および核酸分析装置があり、これらは試料中に存在する分析物の定性的検出および/または定量的検出に使用され、化学的反応または生物的反応の結果を検出し、および/または化学的反応または生物的反応の進行を監視する。
【0026】
医療検査システム110は、試料またはその少なくとも1つの分析物のパラメータを測定するために医療検査を実行するように動作可能であってもよい。医療検査は、試料102に対して行われる1つまたは複数の検査項目を含んでもよい。医療検査システム110は、各検査項目に対応する検査結果を医療データ112として返してもよい。医療検査システム110によって返される可能性のある検査結果は、試料中の分析物の濃度、試料中の分析物の存在を示すデジタル(はいまたはいいえ)結果(検出レベルを超える濃度に対応する)、タンパク質または代謝産物の質量分析から得られたデータ、ならびに/あるいは様々なタイプの物理的、機械的、光学的、電気的または化学的パラメータなどを決定することによって得られてもよい。
【0027】
検査項目のタイプのいくつかの具体例は、アラニンアミノトランスフェラーゼ(ALT)、アスパラギン酸アミノトランスフェラーゼ(AST)、グルタミン酸デヒドロゲナーゼ(GLDH)、ナトリウム(NA)濃度、年齢、ヘモグロビン、血漿タンパク質、アルブミン(ALB)、グロブリン(GLB)、総ビリルビン(TBIL)、直接ビリルビン(DBIL)、総胆汁酸(TBA)、血中尿素窒素(BUN)などのレベルを含み得る。ここに列挙された例は網羅的ではない。特定の医療検査において実施される検査項目は、診療科、健診センター、医師、患者などの医療検査を依頼するエンティティによって指定されてもよい。
【0028】
検査試料102は、生物学的試料とも呼ばれることがあり、これは、1つまたは複数の関心対象の分析物を含む疑いのある生物学的材料であり、その定性的検出および/または定量的検出は臨床状態に関連付けられ得る。生物学的試料は、血液、唾液、眼レンズ液、脳脊髄液、汗、尿、便、精液、乳、腹水液、粘液、滑液、腹水、羊水、組織、細胞などを含む生理液などの生物源に由来する。このような生物学的供給源は、生物学的対象、例えば患者、人、動物などから収集され得る。
【0029】
生物学的試料は、血液から血漿または血清を調製するなど、使用前に前処理され得る。処理方法は、関心対象の分析物を含む試料成分の遠心分離、濾過、蒸留、希釈、濃縮および/または分離、干渉成分の不活性化、ならびに試薬の添加を含むことができる。生物学的試料は、供給源に由来するものとして直接使用されてもよく、または試料の特徴を改変するための前処理後に使用されてもよい。いくつかの実施形態では、最初に固体または半固体の生物学的材料を、適切な液体媒体で溶解または懸濁することによって液体にすることができる。
【0030】
「試薬」という用語は、生物学的試料に対して特定の医療検査を実施するときに生物学的試料に添加されて、試料中の特定の反応を誘発する物質を指す。試薬は、特定の検査またはアッセイに特異的であり得る。例えば、血液試料の部分的な血栓形成時間を測定する状況では、分析装置は、血液試料に試薬として活性化剤を添加して内因性凝固経路を活性化するように構成され得る。特定の物質は、異なる状況では「修飾剤」または「試薬」であり得る。いくつかの例では、試薬は、検査される生物学的試料に添加されなくてもよい。
【0031】
検査試料102に関連付けられた医療データ112は、医療検査システム110での医療検査において行われた検査項目の1つまたは複数の検査結果を含み得る。検査結果のタイプは、医療検査システム110のオペレータ(例えば、検査技師)によって指定されてもよく、または医療検査システム110に接続された情報システムを介して電子注文から自動的に識別されてもよい。いくつかの例では、医療データ112は、特定の検査項目および対応する検査結果が列挙された医療検査報告書に編成されてもよい。いくつかの例では、医療検査で生成された検査結果に加えて、医療データ112はまた、検査試料102および/または検査試料102が収集される生物学的対象(患者など)に関連する情報などの補助情報を含んでもよい。
【0032】
医療データ112は、医療データ112の正当性を評価し、医療データ112を公開することができるかどうかを判定するために検証システム120に提供される。検証が必要なのは、試料採取および検査プロセス中に多くの潜在的な問題が起こり得るからである。例えば、患者試料が誤って標識され、その結果、検査結果が間違った患者に関連して報告される可能性がある。別の例として、患者試料が不適切に抜き取られたり不適切に取り扱われたりして、試料の汚染や誤った検査結果をもたらす可能性がある。さらに、検査室分析器は、誤動作しているか、または較正から外れてドリフトしている可能性があり、この場合も分析器に誤った結果を報告させる。
【0033】
医療検証プロセスの効率を改善するために、訓練された医療検証モデル130を検証システム120で利用して、医療データ112の正当性を自動的に評価し得る。医療検証モデル130は、入力された医療データを自動的に処理し、検証カテゴリのうちの1つを示す検証結果を出力するように訓練される。訓練された医療検証モデル130はそれぞれ、医療データと検証カテゴリとの間の関連付けを表す。
【0034】
医療検証モデル130への入力は医療データであり、医療検証モデル130からの出力検証結果122は検証カテゴリのうちの1つを含む。いくつかの実施形態では、医療検証モデル130は、入力医療データを検証カテゴリのうちの1つに分類/割り当てるための分類モデルとして設計され得る。いくつかの実施形態では、医療検証モデル130からの検証結果122は、現在の医療データについての検証カテゴリおよび/または検証カテゴリの信頼性レベルの明示的な指示を含み得る。出力された検証カテゴリを決定する際、医療検証モデル130は、所定の検証カテゴリのそれぞれの確率を測定し、最も高い確率を有するものを選択する。
【0035】
医療データは、検査項目に関する測定値および/または検査試料中の特定の分析物の存在を示すデジタル(はいまたはいいえ)結果を含み得る、検査項目の1つまたは複数の検査結果を含んでもよい。医療データ112は、患者情報、診療科情報などの他の情報をさらに含み得る。
【0036】
医療検証モデルによって出力された検証カテゴリのそれぞれは、医療データに対して実行される所定のアクションのうちの1つを示してもよく、これは、医療診断検査ワークフロー全体の次のステップで医療データをどのように処理することができるかをシステムまたはユーザが自動的にまたは手動で決定するための提案と考えることができる。
【0037】
医療検証は、医療データが医療検査を要求するエンティティ(診療科または患者など)に公開される前に、医療データ内の潜在的なエラーを見つけることである。医療データが正しいと検証され、エラーがない場合、次のステップは、医療データをそのエンティティに公開する(または迅速な手動レビューを要求し、次いでエンティティに公開する)ことである。この場合、医療データに対して実行される1つの可能なアクションは、医療データに関連する医療検査を要求するエンティティに、医療データを直接または迅速な手動レビューの後に公開することである。検証結果122は、医療データ112が医療検査を注文する要求者に直接公開される(または簡単な手動レビューの後に公開される)ことが正しいことを示す検証カテゴリを含み得る。
【0038】
他の場合には、医療データは、検査試料、実施された医療診断検査手順、医療検査で使用された試薬、検査試料の生物学的対象の物理的状態との不一致、意思決定のための不十分な情報などに起因するエラーがあるものとして検証される。このような場合、エラーを修正するために対応するアクションを実行する必要がある。医療データの検証結果122に示されるアクションは、医療データのさらなる検証を提案することである。このアクションは一般的な提案であり、これは、現在の医療データを公開するべきではなく、医療データがさらにどのように検証され得るかを決定するために手動によるレビューが必要であることを意味する。
【0039】
いくつかの例では、さらなる検証のための1つまたは複数の特定のアクションは、医療データに関連する医療検査を再実行するアクション、患者の病歴を確認するアクション、試薬反応曲線を確認するなどの、医療検査における試薬の反応を確認するアクション、医療検査に用いるために採取された検査試料を確認するアクション、臨床診断と併せて医療データを確認するアクション、患者の薬剤使用を確認するアクションなどを含む、医療検証モデル130から出力された検証カテゴリによって示され得る。上記の次のステップのアクションは単にいくつかの特定の例であり、実際の使用事例、したがって医療検証モデル130の検証カテゴリで必要に応じて、より多くの、より少ない、または異なるアクションを指定することもできることが理解されよう。
【0040】
動作原理および例示的なシステム
医療検証モデルの導入は、医療データのレビューに費やされる手動の労力を大幅に削減することができ、医療データ検証の精度および品質を改善することもできる。しかしながら、様々な理由により、現在、各ローカルサイト(例えば、検査室または病院)は、ローカルに収集された医療データを使用して独自の医療検証モデルを訓練しており、これはリソースを消費し、あまり効率的ではない可能性がある。一方、ローカルサイトで訓練された医療検証モデルは、他のローカルサイトの正確な検証結果を提供するために一般化されない場合がある。
【0041】
簡単なソリューションは、異なるローカルサイトから過去の医療データを収集して、中央ノードでモデルを訓練することである。しかしながら、医療データの機密性および異なるローカルサイト間の不十分なネットワーキング接続を考慮すると、実用的かつ理想的ではない。一部のローカルサイトは、いくつかの合意または規制のために医療データのエクスポートを拒否する場合がある。
【0042】
本開示の例示的な実施形態によれば、医療検証の連合学習のためのソリューションが提案される。このソリューションでは、マスタノードおよび複数のコンピューティングノードが協働して連合学習プロセスを実行し、医療検証モデルを共同で訓練する。マスタノードは、コンピューティングノードに医療検証モデルに関する定義情報を提供する。コンピューティングノードは、定義情報に基づいてローカル訓練データセットをそれぞれ処理し、連合学習プロセスにおいて処理されたローカル訓練データセットを利用する。したがって、コンピューティングノードにおけるローカル訓練データセット自体は、マスタノードまたは他のコンピューティングノードに公開されなくてもよい。マスタノードは、連合学習プロセスの結果に基づいて最終医療検証モデルを決定する。
【0043】
このソリューションを通じて、連合学習によって、ローカルサイトがモデル訓練用の訓練データセットを所有することによるデータセキュリティおよびプライバシーの懸念に対処する。さらに、最終医療検証モデルは、異なるローカル訓練データセットで訓練されており、これにより、モデルを使用した医療検証の精度および品質を改善することが可能になる。
【0044】
以下、本開示の例示的な実施形態について図面を参照して説明する。まず、連合学習および医療検証モデルの適用のためのシステム200を示す図2を参照する。図2のシステム200は、図1の環境100に部分的に実装されてもよい。説明のために、システム200を説明するために図1を参照する。
【0045】
図示のように、システム200は、マスタノード202と、複数のコンピューティングノード210-1、210-2、...、210-N(以下、集合的または個別にコンピューティングノード210と呼ばれる)とを含む。マスタノード202およびコンピューティングノード210は、サーバ、コンピュータ、メインフレームなどのコンピューティング能力を有する任意の数のデバイス/システムを備え、またはそれらとして実装し得る。
【0046】
コンピューティングノード210-1、210-2、...、210-Nはそれぞれ、ローカルサイト105-1、105-2、・・・、105-Nに配置されてもよく、さもなければ、ローカルサイトで利用可能なデータにアクセスすることができる。したがって、コンピューティングノード210-1、210-2、...、210-Nは、それらのサイトに対するローカルノードと見なされてもよい。図2に示すように、コンピューティングノード210-1は、ローカルサイト105-1で利用可能なデータベース220-1に格納されたデータにアクセスすることができ、コンピューティングノード210-2は、ローカルサイト105-2で利用可能なデータベース220-2に格納されたデータにアクセスすることができ、コンピューティングノード210-Nは、ローカルサイト105-Nで利用可能なデータベース220-Nに格納されたデータにアクセスすることができ、以下同様である。説明の目的のために、データベース220-1、220-2、...、220-Nは、総称して、または個別に、データベース220と呼ばれる。
【0047】
以下で詳細に説明するように、本開示の実施形態によれば、マスタノード202および複数のコンピューティングノード210は、連合学習によって初期医療検証モデル230を共同で訓練するために協働する。コンピューティングノード210は、それらのアクセス可能なデータベース220から連合学習のためのそれぞれのローカル訓練データセットを取得する。このような場合、ローカルサイト105は、グローバルモデルの訓練にデータを提供するため、貢献サイトと呼ばれることがある。コンピューティングノード210は、マスタノード202から受信した初期医療検証モデル230の定義に基づいてローカル訓練データセットを処理する。定義情報は、訓練される初期医療検証モデル230の入力および出力の1つまたは複数の態様を定義し得る。定義情報を用いて、ローカル訓練データセットは、コンピューティングノードにおいて、グローバルモデルの訓練に適するように適合されてもよい。マスタノード202は、連合学習の結果に基づいて最終医療検証モデル240を決定することができる。
【0048】
連合学習は、訓練データセットを保持する複数の分散ノードにわたってモデルを訓練する機械学習技術である。連合学習は、コンピューティングノード210が、すべての訓練データセットをノード上に保持しながらモデルを協調的に学習することを可能にする。すなわち、ローカル訓練データセットは、訓練中に他のコンピューティングノード210またはマスタノード202に公開されない。結果として、ローカルサイト105は、生の医療データがローカルコンピューティングノード210を離れることがないため、プライバシーに関する懸念およびデータ所有権に関する懸念がない。さらに、セキュリティ侵害によって大量の生データが危険にさらされる可能性があるノードが1つもないため、セキュリティ上の懸念が大幅に低減される。
【0049】
マスタノード202およびコンピューティングノード210は、初期医療検証モデル230のための連合学習プロセスを実施するために、それぞれの連合学習エンジンと共に配備されてもよい。本開示の実施形態に適用することができる様々な連合学習フレームワークがある。いくつかの例として、適用可能な連合学習フレームワークは、Tensorflow Federated(TFF)、Pysyft、またはFederated AI Technology Enabler(FATE)、および現在利用可能な、または将来開発される任意の他の連合学習フレームワークを含み得る。
【0050】
ノード間の連合学習をサポートするために、システム200において、マスタノード202は、複数のコンピューティングノード210と通信可能に接続される。いくつかの実施形態では、マスタノード202とコンピューティングノード210との間にスター型トポロジネットワークを確立し得る。いくつかの実施形態では、スター型トポロジネットワークでは、それぞれのコンピューティングノード210からマスタノード202への発信接続は許可されるが、それぞれのコンピューティングノード210への着信要求は許可されない。発信接続は、コンピューティングノード210におけるデータセキュリティをさらに保証することができる。
【0051】
いくつかの実施形態では、得られた最終医療検証モデル240は、医療検証で使用するためにローカルサイトに配信されてもよい。使用のために最終医療検証モデル240を受け取るローカルサイトは、消費者サイトと呼ばれる場合がある。いくつかの実施形態では、最終医療検証モデル240は、図2に示すようなローカルサイト105などの、貢献サイトとして機能するローカルサイト255以外の1つまたは複数のサイトに配信されてもよい。例えば、マスタノード202は、最終医療検証モデル240をローカルサイト255のコンピューティングノード250に配信し得る。いくつかの実施形態では、マスタノード202は、代替的にまたは追加的に、モデル訓練のための訓練データに寄与するローカルサイト105のうちの1つまたは複数に最終医療検証モデル240を配信してもよい。
【0052】
医療検証モデルの連合学習
図3は、本開示のいくつかの実施形態による、医療検証モデルの連合学習のための図2のシステム200におけるコンピューティングノード210およびマスタノード202のブロック図を示す。図3では、簡潔にするために、1つのコンピューティングノード210の例示的な詳細構造と、マスタノード202とこのコンピューティングノード210との間の相互作用が示されている。連合学習に関与するコンピューティングノード210のそれぞれは、図3のコンピューティングノード210に示すのと同じまたは同様の構成要素を含み得ることに留意されたい。
【0053】
図示するように、マスタノード202は、複数のコンピューティングノードに対して訓練される初期医療検証モデル230を構成するためのモデル構成モジュール310と、複数のコンピューティングノード210を用いて連合学習プロセスを実行し、連合学習プロセス中に中間訓練結果を集約するための訓練集約モジュール330とを備える。コンピューティングノード210は、モデル訓練のための訓練データセットを少なくとも部分的に形成するデータベース220からのデータを前処理するためのデータ準備モジュール320と、データ準備モジュール320によって準備された訓練データセットに基づいて連合学習プロセスを実行するためのローカルモデル訓練モジュール340とを備える。
【0054】
いくつかの実施形態では、マスタノード202および複数のコンピューティングノード210は、機械学習のための検証段階を実施して、連合学習プロセスから決定された訓練された医療検証モデル305の性能を評価して、配信用の最終医療検証モデル240を決定し得る。マスタノード220は、モデル検証モジュール350を含んでもよく、コンピューティングノード210は、訓練された医療検証モデル305の検証段階を実施するためのローカルモデル検証モジュール360を含んでもよい。
【0055】
マスタノード202およびコンピューティングノード210のモジュールは、特定のモジュールに帰属する機能を実装するためのロジックで構成される、1つまたは複数のソフトウェアエンジン、ハードウェア構成要素、ミドルウェア構成要素などとして実装されることがある。
【0056】
マスタノード202およびコンピューティングノード210のそれぞれのモジュールの詳細な説明は、以下に提供される。
【0057】
マスタノード202のモデル構成モジュール310は、初期医療検証モデル230に関する定義情報312をコンピューティングノード210、例えばコンピューティングノード210のデータ準備モジュール320に送信するように構成される。定義情報は、コンピューティングノード210間でグローバルに初期医療検証モデル230を定義するために使用される。初期医療検証モデル230は、図1を参照して説明した医療検証モデル130と同様に定義されてもよい。本明細書で使用される場合、「初期」医療検証モデルは、医療検証モデルが訓練プロセス中に反復的に更新され得る初期パラメータ値を有することを示す。
【0058】
いくつかの実施形態では、定義情報312は、訓練される初期医療検証モデル230の入力および出力の1つまたは複数の態様を定義し得る。いくつかの実施形態では、定義情報312は、モデルタイプ、層、層内の処理ユニット、初期医療検証モデル230内の処理ユニット間の接続を含む、初期医療検証モデル230のモデル構成をさらに定義し得る。
【0059】
各コンピューティングノード210のデータ準備モジュール320は、データベース220からローカル訓練データセット302を取得し、定義情報312に基づいてローカル訓練データセット302を処理して、処理されたローカル訓練データセット322を取得し、ローカルモデル訓練モジュール340に提供するように構成される。
【0060】
初期医療検証モデル230は、異なるローカルサイト105間でグローバルにマスタノード202によって定義されるため、ローカルサイト105で利用可能なローカル訓練データセットは、初期医療検証モデル230を訓練するのに適していない可能性がある。モデル構成を定義することに加えて、マスタノード202からの定義情報312は、少なくとも、コンピューティングノード210が初期医療検証モデル230を訓練する準備ができるようにローカル訓練データセットを準備することを可能にし得る。
【0061】
上述したように、初期医療検証モデル230への入力は医療データを含んでもよく、初期医療検証モデル230からの出力(すなわち、検証結果)は、入力された医療データに対して実行される所定のアクションに対応する複数の検証カテゴリのうちの1つを示すことがある。
【0062】
いくつかの実施形態では、医療検証モデル130は、教師ありの様式でローカルに訓練されてもよい。したがって、ローカルサイト105のローカル訓練データセット302は、医療検査で生成された過去の医療データおよびそれに関連付けられたラベリング情報を含み得る。過去の医療データは、1人または複数の患者の異なる医療検査で生成されたいくつかの医療検査報告書を含んでもよい。
【0063】
医療検査報告書は、検査項目名および対応する検査値を含む、項目名および対応する項目値、検査試料102および/または検査試料102が収集された生物学的物体(患者など)に関する情報などの補助情報を示す項目名を示し得る。ラベリング情報は、過去の医療データに対応するそれぞれのローカル検証カテゴリを示す。ラベリング情報は、訓練におけるグランドトゥルース検証カテゴリとして使用されてもよい。一般に、各ローカルサイト105のラベル付けされたローカル検証カテゴリは、過去の医療データに対して適切なアクションであると考えられたアクションおよび/または検査室専門家によって手動でマークされたアクションを示し得る。
【0064】
場合によっては、ローカル訓練データセット302において、異なるローカルサイト105は、異なる項目名を利用して、過去の医療データに含まれる同じ項目を識別し得る。例えば、ローカルサイト105は、「血清総前立腺特異抗原」という項目名の検査項目を記録してもよく、他のローカルサイト105は、「tPSA」または「PSA」という項目コードで同じ検査項目を記録してもよい。医療検証モデルが、異なる項目名を有する同じ項目を異なる項目として扱うことを回避するために、いくつかの実施形態では、マスタノード202のモデル構成モジュール310は、初期医療検証モデル230に入力された医療データにおいて統一された項目名を示すように定義情報312を決定してもよい。定義情報312に従って、コミューティングノード210のデータ準備モジュール320は、ローカル訓練データセット302の過去の医療データで使用されたローカル項目名を統一された項目名にマッピングし得る。すなわち、データ準備モジュール320は、定義情報312によって示される統一された項目名と同じ項目を識別するローカル項目名を識別し、ローカル項目名が統一された項目名と異なる場合、過去の医療データ内のローカル項目名を対応する統一された項目名で置き換えてもよい。
【0065】
表1は、統一された項目名とローカル項目名との間のマッピングの例を示す。
【0066】
【表1】
【0067】
表1の例では、ローカルサイト105-1および105-2で利用可能な過去の医療データ内のローカル項目名は、統一された検査項目名と同じローカル項目名を有する。ローカルサイト105-Nについて、ローカル項目名「TestCode1」、「TestCode2」、「TestCode3」、および「TestCode4」は、それぞれ、定義情報に示された統一の項目名「TestItem4」、「TestItem5」、「TestItem...」、および「TestItemn」と同じ項目を指す。ローカルサイト105-Nのコンピューティングノード210は、ローカル項目名を統一された項目名に置き換えることによってローカル訓練データセット302を更新し得る。
【0068】
いくつかの実施形態では、定義情報312は、初期医療検証モデル230への入力に含まれるすべての可能な項目の統一された項目名を示し得る。ローカルサイト105で利用可能なローカル訓練データセット302内の過去の医療データが、このようなローカル項目またはローカル項目名を含まない場合、データ準備モジュール320はまた、初期医療検証モデル230への入力に統一された項目名を有する欠落項目を含めることが可能であり得る。
【0069】
いくつかの実施形態では、ローカルサイト105において、項目が初期医療検証モデル230への入力を形成するものとして定義情報312によって示されているが、示された項目の値がローカル訓練データセット302内の過去の医療データから利用できない場合、対応するコンピューティングノード210は、初期医療検証モデル230に適するように過去の医療データを処理する必要があり得る。初期医療検証モデル230はグローバルに訓練されるため、入力は一般に、検証カテゴリに関連すると考えられる多数の項目を含み得る。
【0070】
ローカルサイト105で取得された医療データには、すべての項目が含まれていない可能性があり、その結果、行列が疎になるという問題が生じ、結果として得られるモデルの精度が低くなる可能性がある。例えば、同じ医療検査について、一部のローカルサイト105は、5つの検査項目の値を記録することがあり、他のローカルサイト105は、10個の検査項目の値を記録することがある。初期医療検証モデル230への入力は、ローカルサイトの一部よりも多くの検査項目を示すことがある。また、表1から、ローカルサイト105-1では、検査項目「TestItem4」、「TestItem5」、「TestItem...」が欠落しているのに対して、ローカルサイト105-2では、検査項目「TestItem4」、「TestItemn」が欠落していることがわかる。
【0071】
いくつかの実施形態では、疎行列の問題に対処するために、コンピューティングノード210(すなわち、その中のデータ準備モジュール320)は、ローカルの過去の医療データでは利用できないが、初期医療検証モデル230への入力に含まれることが要求される項目に対して所定の値を記入することによって、そのローカルの訓練データセット302を処理し得る。
【0072】
ある項目に対する所定の値は、様々な方法で決定され得る。いくつかの実施形態では、所定の値は、指示された項目の基準値範囲の平均値として決定されてもよい。基準値範囲は、指示された項目の正常な状況を識別するために使用され、基準値範囲の下限よりも低い、または上限よりも高い任意の値は、外れ値と見なされ得る。基準値範囲の平均値の使用は、指示項目が含まれる医療データの検証結果に影響を与えない可能性がある。いくつかの実施形態では、所定の値は、他の医療検査で生成された過去の医療データ内の指示された項目の利用可能な値の中央値として決定されてもよい。例えば、複数の医療検査から生成されたすべての過去の医療データの中で、指示された項目の値が医療検査のうちの1つまたはいくつかから欠落していることがある。このような場合、同じ項目の他の利用可能な値を使用して、記入される所定の値を決定してもよい。
【0073】
いくつかの実施形態では、ある項目に対する所定の値は、マスタノード202によって構成された固定値など、他の多くの方法で決定されてもよい。いくつかの実施形態では、欠落している項目に対する所定の値を記入する代わりに、コンピューティングノード210は、欠落している項目を未検査でマークすることによって過去の医療データを処理し得る。いくつかの実施形態では、コンピューティングノード210(すなわち、データ準備モジュール320)は、欠落している項目に対する値を極値(例えば、-9999)としてマークし、入力された過去の医療データから構築された疎行列を密行列に変換することによって、疎行列の問題に対処し得る。コンピューティングノード210は、疎行列から密行列への変換に任意の適切な手法を適用し得て、その手法の一例には主成分分析が含まれてもよい。
【0074】
いくつかの実施形態では、初期医療検証モデル230に入力された医療データ内のいくつかの項目は、数値を有してもよい。異なるローカルサイト105は、異なる単位で同じ項目の値を記録することがあり、データスケーリングの問題につながる。異なるローカルサイト105間の潜在的なデータスケーリング問題に対処するために、マスタノード202内のモデル構成モジュール310は、初期医療検証モデル230に入力された医療データ内の項目に対するスケーリングされた値の範囲を示す定義情報312を決定し得る。スケーリングされた値の範囲は、例えば、0から1までの範囲、または任意の他の範囲であってもよい。特定の項目のスケーリングされた値の範囲を用いて、コンピューティングノード210(すなわち、データ準備モジュール320)は、スケーリングされた値の範囲内の過去の医療データ値内のこの項目の値によって、ローカル訓練データセット302内の過去の医療データを処理し得る。このように、同じ範囲(すなわち、スケーリングされた値の範囲)からの値は、異なるローカルサイト105にわたって同じ項目について決定され得て、これにより、初期医療検証モデル230における特徴エンジニアリングが容易になる。連合学習は、入力の同じ特徴が様々なローカルサイトにわたって同じ分布に従う可能性があることを想定しているため、これは実用的であり得る。
【0075】
いくつかの実施形態では、医療データ内の項目に対して、その値は、検査中の他の項目の2つ以上の値から計算されてもよい。例えば、遊離前立腺特異抗原(FPSA)と総前立腺特異抗原(TPSA)との比であるFPSA/TPSAを、FPSAおよびTPSAの値から計算し、血清中の一次測定カチオン(ナトリウムNa+およびカリウムK+)と一次測定アニオン(塩化物Cl-および重炭酸塩HCO3-)との差に基づいてアニオンギャップを計算する。コンピューティングノード210(すなわち、データ準備モジュール320)は、他の項目をスケーリングされた値の範囲にスケーリングする前に、他の項目の元の値に基づいて項目の値をローカルに計算してもよい。
【0076】
場合によっては、入力項目名以外に、異なるローカルサイト105は、異なる基準を適用して、過去の医療データを異なる検証カテゴリのセットに分割することがある。例えば、ローカルサイト105は、2つの検証カテゴリでローカル訓練データセット302内の過去の医療データをラベル付けしてもよく、一方は過去の医療データが直接公開されるのが正しいことを示し、他方はさらなる検証が必要であることを示す。別のローカルサイト105は、さらなる検証を受ける特定のアクションを示す3つ以上の検証カテゴリで過去の医療データをラベル付けしてもよい。ローカルモデル訓練モジュール340が教師ありの様式で訓練を実行することを可能にするために、いくつかの実施形態では、マスタノード202内のモデル構成モジュール310は、初期医療検証モデル230から出力された統一された検証カテゴリを示すように定義情報312を決定し得る。
【0077】
定義情報312に従って、コミューティングノード210のデータ準備モジュール320は、ローカル検証カテゴリを統一された検証カテゴリにマッピングし得る。すなわち、データ準備モジュール320は、ローカル訓練データセット302内のラベリング情報を更新または作成する際に同じラベリング手法を適用し得る。いくつかの例では、データ準備モジュール320は、統一された検証カテゴリと同じであるローカル検証カテゴリ(例えば、ローカル訓練データセット302内の過去の医療データにラベル付けされた同じカテゴリ名を有するもの)を保存し得る。いくつかの例では、ローカル訓練データセット302内の過去の医療データがローカル検証カテゴリでラベル付けされているが、定義情報312が、このローカル検証カテゴリがきめ細かく分割され、2つ以上の統一された検証カテゴリにマッピングされることを示す場合、データ準備モジュール320は、過去の医療データを分割し、それらを2つ以上の対応する統一された検証カテゴリでラベル付けし得る。いくつかの他の例では、ローカル訓練データセット302内の2つ以上のローカル検証カテゴリでラベル付けされた過去の医療データは、集約され、2つ以上のローカル検証カテゴリがマッピングされる1つの統一された検証カテゴリでラベル付けされてもよい。
【0078】
いくつかの実施形態では、定義情報は、医療データが初期医療検証モデルに入力されるのを防止する1つまたは複数の統一されたレッドフラグルールをさらに示し得る。医療検証手順は、潜在的なエラーを有する医療検査報告書が公開されないことを確実にすることであるため、モデルによって実行される間違った診断の可能性を考慮して、重大なまたは明らかなエラーを有する医療検査報告書が、医療検証モデルによって誤って正しいと判断されないことを確実にするために、レッドフラグルールが設定され得る。より具体的には、レッドフラグルールを満たす医療データは、自動検証のために医療検証モデルに入力される代わりに、手動検証に直接渡されてもよい。異なる要件および従うべき異なる規制に応じて、異なるローカルサイト105は、ローカルレッドフラグルールを満たす医療検査報告書がモデルベースの自動検証に渡されるのを阻止するために、異なるローカルレッドフラグルールを適用し得る。
【0079】
初期医療検証モデル230を訓練する際に、マスタノード202は、定義情報312に1つまたは複数の統一されたレッドフラグルールを構成して、コンピューティングノード210が初期医療検証モデル230に入力され得る医療データに対して統一されたデータフィルタリングを適用できるようにしてもよい。コンピューティングノード210(例えば、コンピューティングノード210内のデータ準備モジュール320)は、1つまたは複数の統一されたレッドフラグルールを満たす過去の医療データを除外することによってローカル訓練データセット302を処理し得る。統一されたレッドフラグルールは、医療検査報告書内の項目のしきい値ベースの基準を定義し得る。例えば、統一されたレッドフラグは、血清カリウムがしきい値よりも高い任意の医療検査報告書が公開され得ないことを定義し得る。過去の医療検査報告書内のこの項目の値がしきい値ベースの基準を満たす場合、例えば、(基準がどのように設定されるかに応じて)値がしきい値を超えるか、またはしきい値を下回る場合、過去の医療検査報告書は、ローカル訓練データセット302から除外され得る。
【0080】
統一されたレッドフラグルールを適用してローカル訓練データセットをフィルタリングすることにより、統一されたレッドフラグルールを満たす医療データは、初期医療検証モデル230を訓練するために使用されなくてもよく、これは、モデルが、統一されたレッドフラグルールを満たす医療データから知識を学習しなくてもよいことを意味する。最終医療検証モデル240が適用される次の適用段階では、検証精度を保証するために、消費者サイトの医療データも同じ統一されたレッドフラグルールでフィルタリングされてもよい。
【0081】
いくつかの実施形態では、代替として、マスタノード202は、ローカルサイト105のローカル訓練データセットに対して統一されたレッドフラグルールを構成しなくてもよい。したがって、初期医療検証モデル230は、訓練データ選択にいかなる制限もなく訓練され得る。その結果、最終的な医療検証モデル240は、ルールフリーのモデルとなる。最終医療検証モデル240の次の適用段階において、消費者サイトは、それぞれのローカルレッドフラグルールを適用して、自動検証のためにどの医療データを最終医療検証モデル240に渡すことができるかを判定し得る。
【0082】
以上、モデル構成およびデータ準備のいくつかの例示的な実施形態について説明した。データ準備の後、各コンピューティングノード210は、訓練のための処理されたローカル訓練データセット322を生成し得る。示されるように、マスタノード202は、ローカルサイト105のコンピューティングノード210と協働して連合学習プロセスを実行し、初期医療検証モデル230を共同で訓練する。連合学習中、コンピューティングノード210内のローカルモデル訓練モジュール340は、処理されたローカル訓練データセット322を使用して、ローカル医療検証モデル230をローカルに訓練し得る。コンピューティングノード210は、訓練を実行するために対応する訓練アルゴリズムを適用してもよい。
【0083】
いくつかの実施形態では、コンピューティングノード210は、処理されたローカル訓練データセット322に基づいてパラメータ勾配342を生成し、パラメータ勾配342をマスタノード202内の訓練集約モジュール330に送信し得る。訓練集約モジュール330は、複数のコンピューティングノード210から受信したパラメータ勾配を集約して、初期検証モデル230のパラメータに対するパラメータ更新332を決定し得る。パラメータ更新332は、複数のコンピューティングノード210に送信されてもよい。いくつかの実施形態では、パラメータ勾配342および/またはパラメータ更新332は、情報漏洩を防ぐために、コンピューティングノード210とマスタノード202との間の安全なチャネルで通信され得る。
【0084】
パラメータ更新332を用いて、コンピューティングノード210内のローカルモデル訓練モジュール340は、初期検証モデル230の更新されたパラメータ値を決定して、中間初期検証モデルを形成し、処理されたローカル訓練データセット322を使用して中間初期検証モデルに基づいてさらなる訓練ステップを実行し得る。マスタノード202とコンピューティングノード210との間のパラメータ勾配とパラメータ更新の交換は、連合学習プロセスの収束条件に達するまで繰り返し実行され得る。このとき、マスタノード202内の訓練集約モジュール330は、連合学習プロセスから決定された訓練されたパラメータ値を有する訓練された医療検証モデル305を取得し得る。
【0085】
いくつかの実施形態では、マスタノード202は、訓練された医療検証モデル305を、消費者サイトに配信する準備ができている最終医療検証モデル240として決定し得る。いくつかの実施形態では、マスタノード202は、モデル検証手順を実行して、訓練された医療検証モデル305の性能が配信されるのに適しているかどうかを検証し得る。マスタノード202は、モデルを検証するためのデータを有していない場合があり、異なるローカルサイト105が異なる検証基準を有し得ることを考慮するため、マスタノード202は、ローカルサイト105のコンピューティングノード210と協働してモデル検証手順を実行し得る。
【0086】
具体的には、マスタノード202内のモデル検証モジュール350は、例えば、訓練された医療検証モデル305の訓練されたパラメータ値352をコンピューティングノード210に送信することによって、訓練された医療検証モデル305を複数のコンピューティングノード210に配信し得る。コンピューティングノード210内のローカルモデル検証モジュール360は、処理されたローカル検証データセット324を使用して、訓練された医療検証モデル305の性能メトリックを決定し得る。処理されたローカル検証データセット324は、対応するローカルサイト105内のデータベース220から得られた元のローカル検証データセット304から決定し得る。ローカル検証データセット304の処理は、ローカル訓練データセット302の処理と同様であってもよく、定義情報312も処理に利用されてもよい。ローカルモデル検証プロセス中、コンピューティングノード210内のローカルモデル検証モジュール360は、処理されたローカル検証データセット324内の過去の医療データを訓練された医療検証モデル305に入力し、訓練された医療検証モデル305から出力された予測された検証結果(検証カテゴリを示す)が、処理されたローカル検証データセット324内のグランドトゥルース検証結果と一致するかどうかを判定し得る。
【0087】
ローカルモデル検証プロセスの結果に応じて、コンピューティングノード210内のローカルモデル検証モジュール360は、訓練された医療検証モデル305の性能を示す性能メトリックを決定し得る。性能メトリックは、例えば、訓練された医療検証モデル305から出力された予測された検証結果の精度率または損失率を示すことがある。代替として、または加えて、性能メトリックは、受信者動作特性(ROC)曲線および/または曲線下面積(AUC)に基づいて決定されてもよい。他の性能メトリックも決定されてもよく、本開示の範囲はこれに関して限定されない。各コンピューティングノード210のローカルモデル検証モジュール360は、性能メトリックをフィードバック362としてマスタノード202のモデル検証モジュール350に送信し得る。
【0088】
複数のコンピューティングノード210から訓練された医療検証モデル305の性能メトリックのフィードバックを収集した後、マスタノード202内のモデル検証モジュール350は、受信したフィードバックに基づいて最終的な医療検証モデル240を決定し得る。いくつかの実施形態では、受信した性能メトリックがモデル公開基準を満たす場合、例えば、ほとんどまたは特定の数のコンピューティングノード210からの性能メトリックが、訓練された医療検証モデル305がローカル医療検証でうまく機能することを示す場合、モデル検証モジュール350は、訓練された医療検証モデル305が最終医療検証モデル240として配信され得ることを決定し得る。いくつかの実施形態では、受信した性能メトリックがモデル公開基準を満たさない場合、例えば、ほとんどまたは特定の数のコンピューティングノード210からの性能メトリックが、訓練された医療検証モデル305がローカルで動作するときに性能を満たしていないことを示す場合、モデル検証モジュール350は、訓練された医療検証モデル305がさらに調整され得て、したがって、訓練された医療検証モデル305のパラメータ値をさらに更新するために、モデル微調整プロセスが開始され得ることを決定し得る。
【0089】
いくつかの実施形態では、モデル検証モジュール350は、訓練された医療検証モデル305を最終医療検証モデルとしてコンピューティングノード210に配信し得て、このコンピューティングノード210から、満たされた性能メトリック(性能しきい値以上のものなど)が受信される。モデル検証モジュール350は、訓練された医療検証モデル305を他のローカルサイトに配信して、それらのローカル訓練データセットを使用して訓練された医療検証モデル305を微調整するように要求し得る。
【0090】
上記の実施形態では、1つのグローバル医療検証モデルの訓練および検証について説明した。他の実施形態では、マスタノード202およびコンピューティングノード210は、連合学習プロセスに基づいて複数の異なる医療検証モデルを共同で訓練し得る。異なる医療検証モデルは、異なる処理アルゴリズム(例えば、ロジスティック回帰に基づくモデルおよびニューラルネットワークに基づくモデル)で構築され、異なる訓練アルゴリズムなどで訓練され得る。したがって、連合学習プロセスからの訓練された医療検証モデルは、コンピューティングノード210において同じローカル訓練データセットで訓練されているにもかかわらず、様々な性能を有し得る。
【0091】
異なる訓練された医療検証モデルを取得し、コンピューティングノード210からそれらの性能メトリックを示すフィードバックを取得することによって、マスタノード202内のモデル検証モジュール350は、特定の消費者サイト(ローカルサイト105およびローカルサイト255などの他のローカルサイトを含む)の性能メトリックを満たした1つまたは複数の候補医療検証モデルを選択し得る。消費者サイトのコンピューティングノードは、ローカルデータセットを適用して、候補医療検証モデルの性能をさらに検証し、候補医療検証モデルの性能メトリックに基づいて、ローカル医療検証で使用するための適切なモデルを選択し得る。消費者サイトのコンピューティングノードは、必要に応じてローカルデータセットを使用して候補医療検証モデルを微調整し得る。
【0092】
例示的なプロセス
図4は、本開示のいくつかの実施形態による、マスタノードで実施される医療検証モデルを訓練するための例示的なプロセスのフローチャートである。プロセス400は、図2のマスタノード202において実施され得る。説明のために、図2を参照してプロセス400を説明する。
【0093】
ブロック410において、マスタノード202は、初期医療検証モデルに関する定義情報を複数のコンピューティングノード210に送信する。ブロック420において、マスタノード202は、複数のコンピューティングノード210と共に連合学習プロセスを実行して、複数のコンピューティングノード210で利用可能なそれぞれの処理されたローカル訓練データセットを使用して初期医療検証モデルを共同で訓練する。それぞれのローカル訓練データセットは、定義情報に基づいて複数のコンピューティングノード210によって処理される。ブロック430において、マスタノード202は、連合学習プロセスの結果に基づいて最終医療検証モデルを決定する。
【0094】
いくつかの実施形態では、マスタノード202は、医療検証で使用するために複数のコンピューティングノード210のうちの少なくとも1つ、または少なくとも1つのさらなるコンピューティングノードに最終医療検証モデルを配信し得る。
【0095】
いくつかの実施形態では、それぞれのローカル訓練データセットは、医療検査で生成された過去の医療データと、過去の医療データのローカル検証カテゴリを示すラベリング情報とを含み得る。
【0096】
いくつかの実施形態では、定義情報は、初期医療検証モデルに入力された医療データ内の統一された項目名、および初期医療検証モデルから出力された統一された検証カテゴリを示し、統一された検証カテゴリは、医療データに対して実行される複数の所定の検証アクションを示す。いくつかの実施形態では、それぞれのローカル訓練データセットは、過去の医療データで使用されたローカル項目名を統一された項目名にマッピングし、ローカル検証カテゴリを統一された検証カテゴリにマッピングすることによって処理され得る。
【0097】
いくつかの実施形態では、定義情報は、初期医療検証モデルに入力された医療データ内の項目のスケーリングされた値の範囲をさらに示し得る。いくつかの実施形態では、それぞれのローカル訓練データセットは、過去の医療データ内の項目の値をスケーリングされた値の範囲内の値にマッピングすることによって処理され得る。
【0098】
いくつかの実施形態では、定義情報は、医療データが初期医療検証モデルに入力されるのを防止するための統一されたレッドフラグルールをさらに示し得る。このような場合、それぞれのローカル訓練データセットは、統一されたレッドフラグルールを満たす過去の医療データを除外することによって処理されてもよい。
【0099】
いくつかの実施形態では、定義情報は、初期医療検証モデルに入力された医療データ内の項目を示す場合があり、示された項目の値は、ローカル訓練データセット内の過去の医療データから利用できない場合がある。このような場合、ローカル訓練データセットは、示された項目に対して所定の値を記入することによって処理される。いくつかの実施形態では、所定の値は、他の医療検査で生成された過去の医療データにおける、示された項目の基準値範囲の平均値および示された項目の利用可能な値の中央値のいずれか1つを含む。
【0100】
いくつかの実施形態では、最終医療検証モデルを決定するために、マスタノード202は、連合学習プロセスの結果から、訓練された医療検証モデルを取得し、訓練された医療検証モデルを複数のコンピューティングノード210に配信してもよい。マスタノード202は、それぞれのローカル検証データセットを使用してコンピューティングノード210によって決定された訓練された医療検証モデルのそれぞれの性能メトリックを示すフィードバックを、複数のコンピューティングノード210から受信し得る。次いで、マスタノード202は、受信したフィードバックに基づいて最終的な医療検証モデルを決定し得る。いくつかの実施形態では、それぞれの性能メトリックがモデル公開基準を満たすことに応答して、マスタノード202は、訓練された医療検証モデルを最終医療検証モデルとして決定し得る。いくつかの実施形態では、それぞれの性能メトリックがモデル公開基準を満たさないことに応答して、マスタノード202は、訓練された医療検証モデルを調整して、最終的な医療検証モデルを生成し得る。
【0101】
いくつかの実施形態では、マスタノード202は、スター型トポロジネットワーク内の複数のコンピューティングノード210と通信可能に接続される。
【0102】
図5は、本開示のいくつかの実施形態による、コンピューティングノードで実施される医療検証モデルを訓練するための例示的なプロセス500のフローチャートを示す。プロセス500は、図2のコンピューティングノード210で実施され得る。説明のために、プロセス500を図2を参照して説明する。
【0103】
ブロック510において、コンピューティングノード210は、マスタノード202から、初期医療検証モデルに関する定義情報を受信する。ブロック520において、コンピューティングノード210は、少なくとも定義情報に基づいてローカル訓練データセットを処理する。ブロック530において、コンピューティングノード210は、マスタノード202および少なくとも1つのさらなるコンピューティングノードと共に連合学習処理を実行して、処理されたローカル訓練データセットを使用して初期医療検証モデルを共同で訓練する。
【0104】
いくつかの実施形態では、コンピューティングノード210は、連合学習プロセスから決定された最終医療検証モデルをマスタノード202からさらに受信し得る。
【0105】
いくつかの実施形態では、ローカル訓練データセットは、医療検査で生成された過去の医療データと、過去の医療データのローカル検証カテゴリを示すラベリング情報とを含む。
【0106】
いくつかの実施形態では、定義情報は、初期医療検証モデルに入力された医療データ内の統一された項目名、および初期医療検証モデルから出力された統一された検証カテゴリを示してもよく、統一された検証カテゴリは、医療データに対して実行される複数の所定の検証アクションを示す。いくつかの実施形態では、コンピューティングノード210は、過去の医療データで使用されたローカル項目名を統一された項目名にマッピングし、ローカル検証カテゴリを統一された検証カテゴリにマッピングし得る。
【0107】
いくつかの実施形態では、定義情報は、初期医療検証モデルに入力された医療データ内の項目のスケーリングされた値の範囲をさらに示し得る。いくつかの実施形態では、コンピューティングノード210は、過去の医療データ内の項目の値をスケーリングされた値の範囲内の値にマッピングし得る。
【0108】
いくつかの実施形態では、定義情報は、医療データが初期医療検証モデルに入力されるのを防止するための統一されたレッドフラグルールをさらに示し得る。いくつかの実施形態では、コンピューティングノード210は、統一されたレッドフラグルールを満たす過去の医療データをローカル訓練データセットから除外するようにフィルタリングし得る。
【0109】
いくつかの実施形態では、定義情報は、初期医療検証モデルに入力された医療データ内の項目を示す場合があり、示された項目の値は、医療検査で生成された過去の医療データから利用できない。いくつかの実施形態では、コンピューティングノード210は、示された項目に所定の値を記入することによって過去の医療データを処理し得る。
【0110】
いくつかの実施形態では、所定の値は、他の医療検査で生成された過去の医療データにおける、示された項目の基準値範囲の平均値および示された項目の利用可能な値の中央値のいずれか1つを含み得る。
【0111】
いくつかの実施形態では、コンピューティングノード210は、連合学習プロセスの結果から決定された訓練された医療検証モデルをマスタノード202からさらに受信し得る。コンピューティングノード210は、ローカル検証データセットを使用して訓練された医療検証モデルの性能メトリックを決定し、決定された性能メトリックを示すフィードバックをマスタノード202に送信し得る。
【0112】
いくつかの実施形態では、コンピューティングノード210は、定義情報に基づいてローカル検証データセットを処理し、処理されたローカル検証データセットを使用して性能メトリックを決定し得る。
【0113】
例示的なシステム/デバイス
図6は、本開示の例示的な実施形態を実施するのに適した例示的なコンピューティングシステム/デバイス600のブロック図を示す。システム/デバイス600は、図2のマスタノード202またはコンピューティングノード210として実装され得るか、または実装される。システム/デバイス600は、汎用コンピュータ、物理コンピューティングデバイス、またはポータブル電子デバイスであってもよく、または通信ネットワークを介してリンクされたリモート処理デバイスによってタスクが実行される分散クラウドコンピューティング環境で実施されてもよい。システム/デバイス600を使用して、図4のプロセス400および/または図5のプロセス500を実施することができる。
【0114】
図示のように、システム/デバイス600は、読み出し専用メモリ(ROM)602に記憶されたプログラム、または記憶ユニット608からランダムアクセスメモリ(RAM)603にロードされたプログラムに従って様々なプロセスを実行することができるプロセッサ601を含む。RAM603にはまた、プロセッサ601が様々なプロセスを実行する際に必要なデータなども必要に応じて記憶される。プロセッサ601、ROM602およびRAM603は、バス604を介して相互に接続されている。バス604にはまた、入出力(I/O)インターフェース605も接続されている。
【0115】
プロセッサ601は、ローカル技術ネットワークに適した任意のタイプのものであってもよく、非限定的な例として、汎用コンピュータ、専用コンピュータ、マイクロプロセッサ、デジタル信号プロセッサ(DSP)、グラフィック処理ユニット(GPU)、コプロセッサ、およびマルチコアプロセッサアーキテクチャに基づくプロセッサのうちの1つまたは複数を含み得る。システム/デバイス600は、メインプロセッサを同期させるクロックに合わせて時間的にスレーブされる特定用途向け集積回路チップなどの複数のプロセッサを有してもよい。
【0116】
システム/デバイス600内の複数の構成要素は、キーボードまたはマウスなどの入力ユニット606と、陰極線管(CRT)、液晶ディスプレイ(LCD)などのディスプレイ、およびスピーカなどを含む出力ユニット607と、ディスク、光ディスクなどの記憶ユニット608と、ネットワークカード、モデム、無線トランシーバなどの通信ユニット609とを含むI/Oインターフェース605に接続される。通信ユニット609は、システム/デバイス600が、インターネット、様々な電気通信ネットワークなどの通信ネットワークを介して他のデバイスと情報/データを交換できるようにする。
【0117】
プロセス400および/またはプロセス500などの上述の方法およびプロセスも、プロセッサ601によって実行され得る。いくつかの実施形態では、プロセス400および/またはプロセス500は、例えば記憶ユニット608などのコンピュータ可読媒体に有形に含まれるコンピュータソフトウェアプログラムまたはコンピュータプログラムプロダクトとして実装され得る。いくつかの実施形態では、コンピュータプログラムは、ROM602および/または通信ユニット609を介してシステム/デバイス600に部分的もしくは完全にロードおよび/または具現化され得る。コンピュータプログラムは、関連付けられたプロセッサ601によって実行されるコンピュータ実行可能命令を含む。コンピュータプログラムがRAM603にロードされ、プロセッサ601によって実行されると、上述したプロセス400および/またはプロセス500の1つまたは複数の動作を実施することができる。あるいは、プロセッサ601は、他の実施形態では、プロセス400および/またはプロセス500を実行するために、任意の他の適切な方法を介して(例えば、ファームウェアを用いて)構成され得る。
【0118】
列挙された例示的な実施形態
本開示の実施形態は、本明細書に記載された形態のいずれかで具現化されてもよい。例えば、以下に列挙される例示的な実施形態は、本明細書に開示される本開示のいくつかの態様のいくつかの構造、特徴、および機能を説明する。
【0119】
第1の態様では、本開示の例示的な実施形態は、コンピュータにより実行される方法を提供する。本方法は、マスタノードによって、複数のコンピューティングノードに、初期医療検証モデルに関する定義情報を送信することと、マスタノードによって、複数のコンピューティングノードと共に連合学習プロセスを実行し、複数のコンピューティングノードで利用可能なそれぞれの処理されたローカル訓練データセットを使用して初期医療検証モデルを共同で訓練することであって、それぞれのローカル訓練データセットが、定義情報に基づいて複数のコンピューティングノードによって処理される、訓練することと、マスタノードによって、連合学習プロセスの結果に基づいて最終医療検証モデルを決定することと、を含む。
【0120】
いくつかの実施形態では、本方法は、マスタノードによって、最終医療検証モデルを、医療検証で使用するために複数のコンピューティングノードのうちの少なくとも1つまたは少なくとも1つのさらなるコンピューティングノードに配信することをさらに含む。
【0121】
いくつかの実施形態では、それぞれのローカル訓練データセットは、医療検査で生成された過去の医療データと、過去の医療データのローカル検証カテゴリを示すラベリング情報とを含む。
【0122】
いくつかの実施形態では、定義情報は、初期医療検証モデルに入力された医療データ内の統一された項目名、および初期医療検証モデルから出力された統一された検証カテゴリを示し、統一された検証カテゴリは、医療データに対して実行される複数の所定の検証アクションを示す。いくつかの実施形態では、それぞれのローカル訓練データセットは、過去の医療データで使用されたローカル項目名を統一された項目名にマッピングし、ローカル検証カテゴリを統一された検証カテゴリにマッピングすることによって処理される。
【0123】
いくつかの実施形態では、定義情報は、初期医療検証モデルに入力された医療データ内の項目のスケーリングされた値の範囲をさらに示す。いくつかの実施形態では、それぞれのローカル訓練データセットは、過去の医療データ内の項目の値をスケーリングされた値の範囲内の値にマッピングすることによって処理される。
【0124】
いくつかの実施形態では、定義情報は、医療データが初期医療検証モデルに入力されるのを防止するための統一されたレッドフラグルールをさらに示す。いくつかの実施形態では、それぞれのローカル訓練データセットは、統一されたレッドフラグルールを満たす過去の医療データを除外することによって処理される。
【0125】
いくつかの実施形態では、定義情報は、初期医療検証モデルに入力された医療データ内の項目を示し、示された項目の値は、ローカル訓練データセット内の過去の医療データからは入手不可能である。いくつかの実施形態では、ローカル訓練データセットは、指示された項目の所定の値を入力することによって処理される。
【0126】
いくつかの実施形態では、所定の値は、他の医療検査で生成された過去の医療データにおける指示された項目の基準値範囲の平均値および指示された項目の利用可能な値の中央値のいずれか1つを含む。
【0127】
いくつかの実施形態では、複数のコンピューティングノードのうちの少なくとも1つに対して最終医療検証モデルを決定することは、マスタノードによって、連合学習プロセスの結果から、訓練された医療検証モデルを取得することと;訓練された医療検証モデルを複数のコンピューティングノードに配信することと;前記複数のコンピューティングノードからフィードバックを受信することであって、前記フィードバックが、それぞれのローカル検証データセットを使用して前記コンピューティングノードによって決定された前記訓練された医療検証モデルのそれぞれの性能メトリックを示す、受信することと;受信したフィードバックに基づいて最終的な医療検証モデルを決定することと、を含む。
【0128】
いくつかの実施形態では、受信したフィードバックに基づいて最終医療検証モデルを決定することは、モデル公開基準を満たすそれぞれの性能メトリックに応答して、訓練された医療検証モデルを最終医療検証モデルとして決定することと;前記それぞれの性能メトリックが前記モデル公開基準を満たしていないことに応答して、前記訓練された医療検証モデルを調整して、前記最終医療検証モデルを生成することと、を含む方法。
【0129】
いくつかの実施形態では、マスタノードは、スター型トポロジネットワーク内の複数のコンピューティングノードと通信可能に接続される。
【0130】
第2の態様では、本開示の例示的な実施形態は、コンピュータにより実行される方法を提供する。本方法は、コンピューティングノードによって、マスタノードから、初期医療検証モデルに関する定義情報を受信することと、少なくとも定義情報に基づいてローカル訓練データセットを処理することと、マスタノードおよび少なくとも1つのさらなるコンピューティングノードと共に連合学習処理を実行して、処理されたローカル訓練データセットを使用して初期医療検証モデルを共同で訓練することと、を含む。
【0131】
いくつかの実施形態では、本方法は、コンピューティングノードによって、およびマスタノードから、連合学習プロセスから決定された最終医療検証モデルを受信することをさらに含む。
【0132】
いくつかの実施形態では、ローカル訓練データセットは、医療検査で生成された過去の医療データと、過去の医療データのローカル検証カテゴリを示すラベリング情報とを含む。
【0133】
いくつかの実施形態では、定義情報は、初期医療検証モデルに入力された医療データ内の統一された項目名、および初期医療検証モデルから出力された統一された検証カテゴリを示し、統一された検証カテゴリは、医療データに対して実行される複数の所定の検証アクションを示す。いくつかの実施形態では、ローカル訓練データセットを処理することは、過去の医療データで使用されたローカル項目名を統一された項目名にマッピングすることと、ローカル検証カテゴリを統一検証カテゴリにマッピングすることとを含む。
【0134】
いくつかの実施形態では、定義情報は、初期医療検証モデルに入力された医療データ内の項目のスケーリングされた値の範囲をさらに示す。いくつかの実施形態では、ローカル訓練データセットを処理することは、過去の医療データ内の項目の値をスケーリングされた値の範囲内の値にマッピングすることを含む。
【0135】
いくつかの実施形態では、定義情報は、医療データが初期医療検証モデルに入力されるのを防止するための統一されたレッドフラグルールをさらに示す。いくつかの実施形態では、ローカル訓練データセットを処理することは、ローカル訓練データセットから統一されたレッドフラグルールを満たす過去の医療データをフィルタリングすることを含む。
【0136】
いくつかの実施形態では、定義情報は、初期医療検証モデルに入力された医療データ内の項目を示し、示された項目の値は、医療検査で生成された過去の医療データからは入手不可能である。いくつかの実施形態では、ローカル訓練データセットを処理することは、示された項目の所定の値を記入することによって過去の医療データを処理することを含む。
【0137】
いくつかの実施形態では、所定の値は、他の医療検査で生成された過去の医療データにおける示された項目の基準値範囲の平均値および示された項目の利用可能な値の中央値のいずれか1つを含む。
【0138】
いくつかの実施形態では、本方法は、マスタノードから、連合学習プロセスの結果から決定された訓練された医療検証モデルを受信することと、ローカル検証データセットを使用して訓練された医療検証モデルの性能メトリックを決定することと、決定された性能メトリックを示すフィードバックをマスタノードに送信することと、をさらに含む。
【0139】
第3の態様では、本開示の例示的な実施形態は、電子デバイスを提供する。電子デバイスは、少なくとも1つのプロセッサと、電子デバイスの少なくとも1つのプロセッサによって実行されると、電子デバイスに上述の第1の態様における方法のステップを実行させるコンピュータ可読命令を含む少なくとも1つのメモリと、を備える。
【0140】
第4の態様では、本開示の例示的な実施形態は、電子デバイスを提供する。電子デバイスは、少なくとも1つのプロセッサと、電子デバイスの少なくとも1つのプロセッサによって実行されると、電子デバイスに、上述の第2の態様における方法のステップを実行させるコンピュータ可読命令を含む少なくとも1つのメモリと、を備える。
【0141】
第5の態様では、本開示の例示的な実施形態は、装置のプロセッサによって実行されると、装置に、上述の第1の態様における方法のいずれか1つのステップを実行させる命令を含むコンピュータプログラム製品を提供する。
【0142】
第6の態様では、本開示の例示的な実施形態は、装置のプロセッサによって実行されると、装置に、上述の第2の態様における方法のいずれか1つのステップを実行させる命令を含むコンピュータプログラム製品を提供する。
【0143】
第7の態様では、本開示の例示的な実施形態は、装置に少なくとも上述の第1の態様における方法を実行させるためのプログラム命令を含むコンピュータ可読媒体を提供する。コンピュータ可読媒体は、いくつかの実施形態では、非一時的コンピュータ可読媒体であってもよい。
【0144】
第8の態様では、本開示の例示的な実施形態は、装置に少なくとも上述の第2の態様における方法を実行させるためのプログラム命令を含むコンピュータ可読媒体を提供する。コンピュータ可読媒体は、いくつかの実施形態では、非一時的コンピュータ可読媒体であってもよい。
【0145】
一般に、本開示の様々な例示的な実施形態は、ハードウェアまたは専用回路、ソフトウェア、ロジック、またはそれらの任意の組合せで実施されてもよい。いくつかの態様は、ハードウェアで実施されてもよく、他の態様は、コントローラ、マイクロプロセッサ、または他のコンピューティングデバイスによって実行されてもよいファームウェアまたはソフトウェアで実施されてもよい。本開示の例示的な実施形態の様々な態様は、ブロック図、フローチャート、またはいくつかの他の図式表現を使用して図示および説明されているが、本明細書に記載のブロック、装置、システム、技法、または方法は、非限定的な例として、ハードウェア、ソフトウェア、ファームウェア、専用回路もしくはロジック、汎用ハードウェアもしくはコントローラもしくは他のコンピューティングデバイス、またはそれらの何らかの組合せで実装されてもよいことが理解されよう。
【0146】
本開示はまた、非一時的コンピュータ可読記憶媒体に有形に記憶された少なくとも1つのコンピュータプログラム製品を提供する。コンピュータプログラム製品は、上述の方法/プロセスを実行するために、ターゲットの実プロセッサまたは仮想プロセッサ上のデバイスで実行される、プログラムモジュールに含まれるものなどのコンピュータ実行可能命令を含む。一般に、プログラムモジュールは、特定のタスクを実行する、または特定の抽象データ型を実装するルーチン、プログラム、ライブラリ、オブジェクト、クラス、コンポーネント、データ構造などを含む。プログラムモジュールの機能は、様々な実施形態において、所望に応じてプログラムモジュール間で組み合わされても分割されてもよい。プログラムモジュールのためのコンピュータ実行可能命令は、ローカルまたは分散デバイス内で実行されてもよい。分散型デバイスでは、プログラムモジュールは、ローカル記憶媒体およびリモート記憶媒体の両方に配置されてもよい。
【0147】
コンピュータ可読媒体は、コンピュータ可読信号媒体またはコンピュータ可読記憶媒体であってもよい。コンピュータ可読媒体は、電子、磁気、光学、電磁気、赤外線、または半導体のシステム、装置、もしくはデバイス、またはこれらの任意の適切な組合せを含み得るが、これらに限定されない。コンピュータ可読記憶媒体のより具体的な例は、1つまたは複数の配線を有する電気的接続、ポータブルコンピュータディスケット、ハードディスク、ランダムアクセスメモリ(RAM)、読み出し専用メモリ(ROM)、消去可能プログラマブル読み出し専用メモリ(EPROMまたはフラッシュメモリ)、光ファイバ、ポータブルコンパクトディスク読み出し専用メモリ(CD-ROM)、光記憶装置、磁気記憶装置、またはこれらの任意の適切な組合せを含む。
【0148】
本明細書で開示される方法を実行するためのコンピュータプログラムコードは、1つまたは複数のプログラミング言語の任意の組合せで書かれてもよい。プログラムコードは、汎用コンピュータ、専用コンピュータ、または他のプログラマブルデータ処理装置のプロセッサもしくはコントローラに提供されてもよく、その結果、プログラムコードは、プロセッサまたはコントローラによって実行されると、フローチャートおよび/またはブロック図で指定された機能/動作を実施させる。プログラムコードは、完全にコンピュータ上で、部分的にコンピュータ上で、スタンドアロンソフトウェアパッケージとして、部分的にコンピュータ上で、部分的にリモートコンピュータ上で、または完全にリモートコンピュータもしくはサーバ上で実行してもよい。プログラムコードは、本明細書では一般に「モジュール」と呼ばれる場合がある特別にプログラムされたデバイス上に配信されてもよい。モジュールのソフトウェアコンポーネント部分は、任意のコンピュータ言語で書かれてもよく、モノリシックコードベースの一部であってもよく、またはオブジェクト指向コンピュータ言語で典型的であるように、より離散的なコード部分で開発されてもよい。加えて、モジュールは、複数のコンピュータプラットフォーム、サーバ、端末、モバイルデバイスなどにわたって分散されてもよい。所与のモジュールは、記載された機能が別個のプロセッサおよび/またはコンピューティングハードウェアプラットフォームによって実行されるように実装されることさえあってもよい。
【0149】
動作は特定の順序で示されているが、これは、望ましい結果を達成するために、そのような動作が示された特定の順序で、または連続した順序で実行されること、または示されたすべての動作が実行されることを必要とすると理解されるべきではない。特定の状況では、マルチタスク処理および並列処理が有利であり得る。同様に、いくつかの具体的な実施の詳細が上記の議論に含まれているが、これらは本開示の範囲に対する限定として解釈されるべきではなく、むしろ特定の実施形態に特有であり得る特徴の説明として解釈されるべきである。別個の実施形態の文脈で説明される特定の特徴はまた、単一の実施形態において組み合わせて実施されてもよい。逆に、単一の実施形態の文脈で説明される様々な特徴はまた、複数の実施形態において別々に、または任意の適切な部分的組合せで実装されてもよい。
【0150】
本開示は、構造的特徴および/または方法論的行為に特有の言語で説明されているが、添付の特許請求の範囲で定義される本開示は、必ずしも上記の特定の特徴または行為に限定されないことを理解されたい。むしろ、上記の特定の特徴および動作は、特許請求の範囲を実施する例示的な形態として開示されている。
図1
図2
図3
図4
図5
図6
【手続補正書】
【提出日】2024-05-27
【手続補正1】
【補正対象書類名】特許請求の範囲
【補正対象項目名】全文
【補正方法】変更
【補正の内容】
【特許請求の範囲】
【請求項1】
マスタノードによって、初期医療検証モデルに関する定義情報を複数のコンピューティングノードに送信することと、
前記マスタノードによって、前記複数のコンピューティングノードと共に連合学習プロセスを実行し、前記複数のコンピューティングノードで利用可能なそれぞれの処理されたローカル訓練データセットを使用して前記初期医療検証モデルを共同で訓練することであって、それぞれのローカル訓練データセットが、前記定義情報に基づいて前記複数のコンピューティングノードによって処理される、訓練することと、
前記マスタノードによって、前記連合学習プロセスの結果に基づいて最終医療検証モデルを決定することと
を含む、コンピュータにより実行される方法。
【請求項2】
前記マスタノードによって、前記最終医療検証モデルを、医療検証で使用するために前記複数のコンピューティングノードのうちの少なくとも1つ、または少なくとも1つのさらなるコンピューティングノードに配信すること、
をさらに含む、請求項1に記載の方法。
【請求項3】
前記それぞれのローカル訓練データセットが、医療検査で生成された過去の医療データと、前記過去の医療データのローカル検証カテゴリを示すラベリング情報とを含む、請求項1または2に記載の方法。
【請求項4】
前記定義情報が、前記初期医療検証モデルに入力される医療データにおける統一された項目名と、前記初期医療検証モデルから出力される統一された検証カテゴリとを示し、前記統一された検証カテゴリが、前記医療データに対して実行される複数の所定の検証アクションを示し、
前記それぞれのローカル訓練データセットが、前記過去の医療データで使用されたローカル項目名を前記統一された項目名にマッピングし、前記ローカル検証カテゴリを前記統一された検証カテゴリにマッピングすることによって処理される、
請求項3に記載の方法。
【請求項5】
前記定義情報が、前記初期医療検証モデルに入力される医療データ内の項目についてのスケーリングされた値の範囲をさらに示し、
前記それぞれのローカル訓練データセットが、前記過去の医療データ内の前記項目の値を前記スケーリングされた値の範囲内の値にマッピングすることによって処理される、
請求項3または4に記載の方法。
【請求項6】
前記定義情報が、医療データが前記初期医療検証モデルに入力されるのを防止するための統一されたレッドフラグルールをさらに示し、
前記それぞれのローカル訓練データセットが、前記統一されたレッドフラグルールを満たす過去の医療データをフィルタリングすることによって処理される、請求項2~5のいずれか一項に記載の方法。
【請求項7】
前記定義情報が、前記初期医療検証モデルに入力される医療データ内の項目を示し、示された前記項目の値が、ローカル訓練データセット内の過去の医療データからは入手不可能であり、
前記ローカル訓練データセットが、前記示された項目について所定の値を入力することによって処理される、請求項2~6のいずれか一項に記載の方法。
【請求項8】
前記所定の値が、他の医療検査で生成された過去の医療データにおける前記示された項目の基準値範囲の平均値および前記示された項目の利用可能な値の中央値のいずれか1つを含む、請求項7に記載の方法。
【請求項9】
前記最終医療検証モデルを決定することが、
前記マスタノードによって、前記連合学習プロセスの前記結果から、訓練された医療検証モデルを取得することと、
前記訓練された医療検証モデルを前記複数のコンピューティングノードに配信することと、
前記複数のコンピューティングノードからフィードバックを受信することであって、前記フィードバックが、それぞれのローカル検証データセットを使用して前記コンピューティングノードによって決定された前記訓練された医療検証モデルのそれぞれの性能メトリックを示す、受信することと、
受信した前記フィードバックに基づいて前記最終医療検証モデルを決定することと
を含む、請求項1~8のいずれか一項に記載の方法。
【請求項10】
前記受信したフィードバックに基づいて前記最終医療検証モデルを決定することが、
前記それぞれの性能メトリックがモデル公開基準を満たすことに応答して、前記訓練された医療検証モデルを前記最終医療検証モデルとして決定することと、
前記それぞれの性能メトリックが前記モデル公開基準を満たしていないことに応答して、前記訓練された医療検証モデルを調整して前記最終医療検証モデルを生成することと
を含む、請求項9に記載の方法。
【請求項11】
前記マスタノードが、スター型トポロジネットワーク内の前記複数のコンピューティングノードと通信可能に接続されている、請求項1~10のいずれか一項に記載の方法。
【請求項12】
電子デバイスであって、
少なくとも1つのプロセッサと、
前記電子デバイスの前記少なくとも1つのプロセッサによって実行されると、前記電子デバイスに、請求項1~11のいずれか一項に記載の方法のステップを実行させるコンピュータ可読命令を含む少なくとも1つのメモリと
を備える、電子デバイス。
【請求項13】
装置のプロセッサによって実行されると、前記装置に請求項1~11のいずれか一項に記載の方法のステップを実行させる命令を含むコンピュータプログラム。
【国際調査報告】