IP Force 特許公報掲載プロジェクト 2022.1.31 β版

知財求人 - 知財ポータルサイト「IP Force」

▶ コーニンクレッカ フィリップス エヌ ヴェの特許一覧

特表2024-508025証拠タイムラインを使用した患者の疾患コンテキストの自動特定
<>
  • 特表-証拠タイムラインを使用した患者の疾患コンテキストの自動特定 図1
  • 特表-証拠タイムラインを使用した患者の疾患コンテキストの自動特定 図2
  • 特表-証拠タイムラインを使用した患者の疾患コンテキストの自動特定 図3
  • 特表-証拠タイムラインを使用した患者の疾患コンテキストの自動特定 図4
< >
(19)【発行国】日本国特許庁(JP)
(12)【公報種別】公表特許公報(A)
(11)【公表番号】
(43)【公表日】2024-02-21
(54)【発明の名称】証拠タイムラインを使用した患者の疾患コンテキストの自動特定
(51)【国際特許分類】
   G16H 15/00 20180101AFI20240214BHJP
   G16H 10/60 20180101ALI20240214BHJP
   G06F 16/35 20190101ALI20240214BHJP
【FI】
G16H15/00
G16H10/60
G06F16/35
【審査請求】未請求
【予備審査請求】未請求
(21)【出願番号】P 2023553078
(86)(22)【出願日】2022-03-05
(85)【翻訳文提出日】2023-08-31
(86)【国際出願番号】 EP2022055655
(87)【国際公開番号】W WO2022184933
(87)【国際公開日】2022-09-09
(31)【優先権主張番号】63/157,080
(32)【優先日】2021-03-05
(33)【優先権主張国・地域又は機関】US
(81)【指定国・地域】
(71)【出願人】
【識別番号】590000248
【氏名又は名称】コーニンクレッカ フィリップス エヌ ヴェ
【氏名又は名称原語表記】Koninklijke Philips N.V.
【住所又は居所原語表記】High Tech Campus 52, 5656 AG Eindhoven,Netherlands
(74)【代理人】
【識別番号】110001690
【氏名又は名称】弁理士法人M&Sパートナーズ
(72)【発明者】
【氏名】ホンバル ヴァディラジ
(72)【発明者】
【氏名】マボツワナ ツシッタ ダナンジャヤ デ シルヴァ
【テーマコード(参考)】
5B175
5L099
【Fターム(参考)】
5B175FA03
5L099AA01
5L099AA23
(57)【要約】
患者の医用レポートを分類する方法である。この方法は、複数の患者医用レポートを受信するステップと、患者医療情報を抽出する処理されたレポートを生成するように、複数の患者医用レポートを処理するステップと、抽出した患者医療情報に基づいて、複数の医用レポート間の類似性を推定するステップと、類似する医用レポートをクラスタリングするステップと、クラスタリングされた医用レポートのグループタイプを推論し、クラスタリングされた医用レポートに、推論したグループタイプをラベリングするステップと、ラベリングしたクラスタリングされた医用レポートをディスプレイに視覚化するステップとを含む。

【特許請求の範囲】
【請求項1】
患者の医用レポートを分類する方法であって、
複数の患者医用レポートを受信するステップと、
患者医療情報を抽出する処理されたレポートを生成するように、前記複数の患者医用レポートを処理するステップと、
処理された医用レポートにおける文書ベクトルと抽出した前記患者医療情報とに基づいて、前記複数の患者医用レポート間の関連度スコアを推定するステップと、
トレーニングされた分類器を使用して類似する患者医用レポートをクラスタリングするステップであって、前記トレーニングされた分類器は、抽出した前記患者医療情報に対応するベクトル化フレーズに基づいて、患者医用レポートを分類する、クラスタリングするステップと、
クラスタリングされた前記患者医用レポートのグループタイプを推論し、標準的な辞書、又は標準的な医学的状態、医学用語、及び医学的解剖学的構造のうちの1つを含むデータベースに基づいて、解剖学的構造ラベリングマッチングを使用して、クラスタリングされた前記患者医用レポートに、推論した前記グループタイプでラベリングするステップと、
を含む、方法。
【請求項2】
患者病歴から関連情報を発見する際の実践臨床医の効率を最大化する、クラスタリングされた時間リストを視覚化するステップを更に含む、請求項1に記載の方法。
【請求項3】
前記複数の患者医用レポートを処理するステップは、文書構造処理を含む、請求項1に記載の方法。
【請求項4】
前記複数の患者医用レポートを処理するステップは、前記文書構造処理の出力の構文解析を含む、請求項3に記載の方法。
【請求項5】
前記複数の患者医用レポートを処理するステップは、抽出した前記患者医療情報のベクトル化表現を使用して、前記構文解析の出力からエンティティを抽出するステップを含む、請求項4に記載の方法。
【請求項6】
前記複数の患者医用レポートを処理するステップは、抽出した前記エンティティに関する解剖学的構造推論を決定するステップを含む、請求項5に記載の方法。
【請求項7】
前記患者の現在の医用レポートを受信するステップと、
現在の患者医療情報を抽出する現在の処理されたレポートを生成するように、前記現在の医用レポートを処理するステップと、
処理された前記現在の医用レポートの文書ベクトルと抽出した前記現在の患者医療情報とに基づいて、前記現在の医用レポートと前記複数の患者医用レポートとの前記関連度スコアを推定するステップと、
前記現在の医用レポートが類似している医用レポートの前記クラスタを決定するステップと、
医用レポートの決定された前記クラスタに関連付けられている推論した前記グループタイプで前記現在の医用レポートにラベリングするステップと、
を更に含む、請求項1に記載の方法。
【請求項8】
前記複数の患者医用レポートは、放射線学レポート及び病理学レポートを含む、請求項1に記載の方法。
【請求項9】
類似する医用レポートをクラスタリングするステップは、機械学習モデルを使用するステップを含む、請求項1に記載の方法。
【請求項10】
類似する医用レポートをクラスタリングするステップは、閾値を上回る関連度スコアを有する医用レポートを特定するステップを含む、請求項1に記載の方法。
【請求項11】
前記現在の医用レポートの前記処理に基づいて、前記現在の医用レポートの現在の解剖学的構造ラベルを決定するステップを更に含み、類似する医用レポートをクラスタリングするステップは、前記レポート処理によって生成された前記複数の医用レポートの解剖学的構造ラベルと一致するように現在の解剖学的構造ラベルを使用するステップを含む、請求項1に記載の方法。
【請求項12】
前記複数の患者医用レポート間の前記類似性を推定するステップは、前記レポートにおいて特定された解剖学的構造、前記レポートにおいて特定された疾患の場所、及び前記レポートにおいて特定された疾患のタイプのうちの1つに基づいている、請求項1に記載の方法。
【請求項13】
患者の医用レポートを分類するデバイスであって、
メモリと、
前記メモリに結合されたプロセッサであって、
複数の患者医用レポートを受信し、
患者医療情報を抽出する処理されたレポートを生成するように、前記複数の患者医用レポートを処理し、
抽出した前記患者医療情報に基づいて、前記複数の患者医用レポート間の類似性を推定し、
類似する医用レポートをクラスタリングし、
クラスタリングされた前記医用レポートのグループタイプを推論し、クラスタリングされた前記医用レポートに、推論した前記グループタイプをラベリングし、
ラベリングされたクラスタリングされた前記医用レポートをディスプレイに視覚化する、プロセッサと、
を含む、デバイス。
【請求項14】
前記複数の患者医用レポートを処理することは、文書構造処理を含む、請求項13に記載のデバイス。
【請求項15】
前記複数の患者医用レポートを処理することは、前記文書構造処理の出力の構文解析を含む、請求項14に記載のデバイス。
【請求項16】
前記複数の患者医用レポートを処理することは、前記構文解析の出力からエンティティを抽出することを含む、請求項15に記載のデバイス。
【請求項17】
前記複数の患者医用レポートを処理することは、抽出した前記エンティティに関する解剖学的構造推論を決定することを含む、請求項16に記載のデバイス。
【請求項18】
前記プロセッサは更に、
前記患者の現在の医用レポートを受信し、
患者医療情報を抽出する現在の処理されたレポートを生成するように、前記現在の医用レポートを処理し、
前記現在の医用レポートと前記複数の患者医用レポートとの類似性を推定し、
前記現在の医用レポートが類似している医用レポートの前記クラスタのうちのクラスタを決定し、
医用レポートの決定された前記クラスタに関連付けられている推論した前記グループタイプで前記現在の医用レポートにラベリングし、
前記現在の医用レポートをディスプレイに視覚化する、請求項13に記載のデバイス。
【請求項19】
前記複数の患者医用レポートは、放射線学レポート及び病理学レポートを含む、請求項13に記載のデバイス。
【請求項20】
類似する医用レポートをクラスタリングすることは、機械学習モデルを使用することを含む、請求項13に記載のデバイス。
【請求項21】
類似する医用レポートをクラスタリングすることは、閾値を上回る類似性スコアを有する医用レポートを特定することを含む、請求項13に記載のデバイス。
【請求項22】
前記プロセッサは更に、前記現在の医用レポートの前記処理に基づいて、前記現在の医用レポートの現在の解剖学的構造ラベルを決定し、類似する医用レポートをクラスタリングすることは、前記レポート処理によって生成された前記複数の患者医用レポートの解剖学的構造ラベルと一致するように現在の解剖学的構造ラベルを使用することを含む、請求項13に記載のデバイス。
【請求項23】
前記複数の患者医用レポート間の前記類似性を推定することは、前記レポートにおいて特定された解剖学的構造、前記レポートにおいて特定された疾患の場所、及び前記レポートにおいて特定された疾患のタイプのうちの1つに基づいている、請求項13に記載のデバイス。
【発明の詳細な説明】
【技術分野】
【0001】
[0001] 本明細書に開示される様々な模範的な実施形態は、概して、証拠タイムラインの自動特定のためのシステム及び方法に関する。
【背景技術】
【0002】
[0002] いくつかの臨床ワークフローでは、関連する患者記録を臨床医が収集して分析する。関連する過去の放射線検査及び検査結果(病理検査を含む)の情報により、臨床医は、正しい診断に到達する前、適切な治療計画を決定する際、又は診断の質を評価する際に、患者の疾患コンテキストを考慮できる。
【発明の概要】
【0003】
[0003] 様々な模範的な実施形態の概要を以下に提示する。いくつかの簡略化及び省略は、以下の概要で行う場合がある。概要は、様々な模範的な実施形態のいくつかの態様を強調して紹介することを意図しているが、本発明の範囲を限定することは意図していない。当業者が発明概念を作成し、使用することを可能にするのに十分な模範的な実施形態の詳細な説明は、後のセクションに記載する。
【0004】
[0004] 様々な実施形態は、患者の医用レポートを分類する方法に関する。この方法は、複数の患者医用レポートを受信するステップと、患者医療情報を抽出する処理されたレポートを生成するように、複数の患者医用レポートを処理するステップと、抽出した患者医療情報に基づいて、複数の医用レポート間の類似性を推定するステップと、類似する医用レポートをクラスタリングするステップと、クラスタリングされた医用レポートのグループタイプを推論し、クラスタリングされた医用レポートに、推論したグループタイプをラベリングするステップと、ラベリングしたクラスタリングされた医用レポートをディスプレイに視覚化するステップとを含む。
【0005】
[0005] 複数の患者医用レポートを処理するステップが文書構造処理を含む、様々な実施形態が説明されている。
【0006】
[0006] 複数の患者医用レポートを処理するステップが文書構造処理の出力の構文解析を含む、様々な実施形態が説明されている。
【0007】
[0007] 複数の患者医用レポートを処理するステップが構文解析の出力からエンティティを抽出するステップを含む、様々な実施形態が説明されている。
【0008】
[0008] 複数の患者医用レポートを処理するステップが、抽出したエンティティに関する解剖学的構造推論を決定するステップを含む、様々な実施形態が説明されている。
【0009】
[0009] 患者の現在の医用レポートを受信するステップと、患者医療情報を抽出する現在の処理されたレポートを生成するように、現在の医用レポートを処理するステップと、現在の医用レポートと複数の医用レポートとの類似性を推定するステップと、現在の医用レポートが類似している医用レポートのクラスタのうちのクラスタを決定するステップと、医用レポートの決定されたクラスタに関連付けられている推論したグループタイプで現在の医用レポートにラベリングするステップと、現在の医用レポートをディスプレイに視覚化するステップとを更に含む、様々な実施形態が説明されている。
【0010】
[0010] 複数の医用レポートが放射線学レポート及び病理学レポートを含む、様々な実施形態が説明されている。
【0011】
[0011] 類似する医用レポートをクラスタリングするステップが機械学習モデルを使用するステップを含む、様々な実施形態が説明されている。
【0012】
[0012] 類似する医用レポートをクラスタリングするステップが閾値を上回る類似度スコアを有する医用レポートを特定するステップを含む、様々な実施形態が説明されている。
【0013】
[0013] 現在の医用レポートの処理に基づいて、現在のレポートの現在の解剖学的構造ラベルを決定するステップを更に含み、類似する医用レポートをクラスタリングするステップは、レポート処理によって生成された複数の医用レポートの解剖学的構造ラベルと一致するように現在の解剖学的構造ラベルを使用するステップを含む、様々な実施形態が説明されている。
【0014】
[0014] 複数の医用レポート間の類似性を推定するステップが、レポートにおいて特定された解剖学的構造、レポートにおいて特定された疾患の場所、及びレポートにおいて特定された疾患のタイプのうちの1つに基づいている、様々な実施形態が説明されている。
【0015】
[0015] 更なる様々な実施形態は、患者の医用レポートを分類するデバイスに関する。このデバイスは、メモリと、メモリに結合されたプロセッサとを含み、プロセッサは、複数の患者医用レポートを受信し、患者医療情報を抽出する処理されたレポートを生成するように、複数の患者医用レポートを処理し、抽出した患者医療情報に基づいて、複数の患者医用レポート間の類似性を推定し、類似する医用レポートをクラスタリングし、クラスタリングされた医用レポートのグループタイプを推論し、クラスタリングされた医用レポートに、推論したグループタイプをラベリングし、ラベリングされたクラスタリングされた医用レポートをディスプレイに視覚化する。
【0016】
[0016] 複数の患者医用レポートを処理することが文書構造処理を含む、様々な実施形態が説明されている。
【0017】
[0017] 複数の患者医用レポートを処理することが文書構造処理の出力の構文解析を含む、様々な実施形態が説明されている。
【0018】
[0018] 複数の患者医用レポートを処理することが構文解析の出力からエンティティを抽出することを含む、様々な実施形態が説明されている。
【0019】
[0019] 複数の患者医用レポートを処理することが、抽出したエンティティに関する解剖学的構造推論を決定することを含む、様々な実施形態が説明されている。
【0020】
[0020] プロセッサが更に、患者の現在の医用レポートを受信し、患者医療情報を抽出する現在の処理されたレポートを生成するように、現在の医用レポートを処理し、現在の医用レポートと複数の医用レポートとの類似性を推定し、現在の医用レポートが類似している医用レポートのクラスタのうちのクラスタを決定し、医用レポートの決定されたクラスタに関連付けられている推論したグループタイプで現在の医用レポートにラベリングし、現在の医用レポートをディスプレイに視覚化する、様々な実施形態が説明されている。
【0021】
[0021] 複数の医用レポートが放射線学レポート及び病理学レポートを含む、様々な実施形態が説明されている。
【0022】
[0022] 類似する医用レポートをクラスタリングすることが機械学習モデルを使用することを含む、様々な実施形態が説明されている。
【0023】
[0023] 類似する医用レポートをクラスタリングすることが閾値を上回る類似度スコアを有する医用レポートを特定することを含む、様々な実施形態が説明されている。
【0024】
[0024] プロセッサが更に、現在の医用レポートの処理に基づいて、現在のレポートの現在の解剖学的構造ラベルを決定し、類似する医用レポートをクラスタリングすることがレポート処理によって生成された複数の医用レポートの解剖学的構造ラベルと一致するように現在の解剖学的構造ラベルを使用することを含む、様々な実施形態が説明されている。
【0025】
[0025] 複数の医用レポート間の類似性を推定することが、レポートにおいて特定された解剖学的構造、レポートにおいて特定された疾患の場所、及びレポートにおいて特定された疾患のタイプのうちの1つに基づいている、様々な実施形態が説明されている。
【図面の簡単な説明】
【0026】
[0026] 様々な模範的な実施形態をより深く理解するために、添付の図面を参照する。
【0027】
図1】[0027]図1は、患者の放射線検査及び病理学検査をグループ化するクラスタリングシステムの一実施形態を示す。
図2】[0028]図2は、レポートプロセッサ及び推論プロセッサによって実行される患者レポートのレポート処理パイプラインを示す。
図3】[0029]図3は、医用検査をグループ化するクラスタリングシステムによって実施される方法のフローチャートを示す。
図4】[0030]図4は、クラスタリングシステムを実装するための模範的なハードウェアデバイスを示す。
【0028】
[0031] 理解を容易にするために、同一の参照番号を使用して、実質的に同じ若しくは類似の構造及び/又は実質的に同じ若しくは類似の機能を有する要素を指定している。
【発明を実施するための形態】
【0029】
[0032] 説明及び図面は、本発明の原理を説明する。したがって、当業者であれば、本明細書に明示的に説明又は示されていないが、本発明の原理を具体化し、その範囲内に含まれる様々な配置を考案できることが理解されるであろう。更に、本明細書に記載する全ての実施例は、主に、本発明の原理と、発明者が技術を深めるために貢献した概念とを読者が理解するのを助ける教育的目的を明示的に意図しており、また、そのような具体的に記載された実施例及び条件に限定されないと解釈されるべきである。更に、本明細書で使用する「又は」という用語は、特に示されていない限り(例えば「排他的論理和」又は「又は、別の方法では」など)、非排他的な「又は」(即ち「及び/又は」)を指す。また、本明細書で説明する様々な実施形態は、必ずしも相互に排他的ではない。これは、いくつかの実施形態を1つ以上の他の実施形態と組み合わせて新しい実施形態を形成できるからである。
【0030】
[0033] 患者は、医用画像、医学的検査、医用検査などの様々な情報を含む証拠タイムライン(evidentiary timeline)を有している。更に、患者(特に高齢の患者)は、複数の病的状態を有している場合がある。例えば、患者は股関節や他の骨を骨折した経験がある場合がある。更に、患者は乳房、肝臓、又は他の解剖学的構造に他の問題を抱えていた場合がある。このような問題は、例えば、多数のX線、MRI、CTスキャン、又は他の医用画像をもたらした場合がある。例えば、患者の医用レコードに50枚以上の画像が含まれている場合がある。
【0031】
[0034] その後、患者ががん(乳がん、肺がんなど)のスクリーニングを受けると、追加の画像が撮影される。過去の画像がグループ化されている場合、検査医師は、現在の画像と過去の画像とを比較することで、評価用の関連する医用画像をより効果的に分離できる。例えば、過去の画像は、筋骨格の症状の発現、乳がん、肝臓の研究、肺の研究などに基づいてグループ化される。
【0032】
[0035] 多くの場合、患者は複数の放射線検査や臨床検査を伴う複雑な臨床履歴を有し、また複数の慢性病状を抱えている。例えば、女性患者は股関節骨折、乳がん、及び付随して起こる肺結節を有している場合がある。適切な関連するコンテキストに到達するために臨床医が多数の検査を検討することは珍しくない。いくつかの臨床環境では、関連する患者コンテキストの収集は、手動で行われ、複数の病状に起因する組み合わせの複雑さが伴う。これにより、視野内の全ての検査が引き出される患者コンテキストの過剰指定や、視野内にはないが依然として患者の状態に関連する検査が無視される過少指定が生じる場合がある。
【0033】
[0036] 多くの放射線学の読影ワークフローでは、関連する過去の検査を収集するために、医用における検査デジタル画像と通信(DICOM)データに関する簡単なヒューリスティクスに基づいて、過去の医用画像が時系列に提示される。これらのアルゴリズムは、レポートの意味的内容や検査間の関係の複雑さを考慮していない。放射線技師は、通常、過去の検査を手動でスクロールし、視野(CT/MRI/X線胸部対CT/MRI/X線骨盤)に基づいて、レビューのための過去の検査を選択する。この手動選択プロセスでは、重要な関連する過去の検査を見落とす可能性があり、したがって、不完全なコンテキストに起因した誤診のリスクが高まる。例えば、転移性疾患では、関連する過去の検査が、現在診断で使用される検査と同じモダリティではない場合がある(例えば、X線下顎はMRI前立腺の前の関連するモダリティ検査である可能性がある)。
【0034】
[0037] 検査の構文解析と検査間の複雑な関係の特定とに基づいて、関連する放射線学レポート及び病理学レポートを特定する方法並びにシステムの実施形態について説明する。これらの実施形態は、検査間の複雑な関係を特定するための体系的な解決策を提供する。
【0035】
[0038] 本明細書に説明する実施形態は、患者の放射線検査及び病理学検査を疾患/病理学の分析に従って分類して、関連する患者データの収集及び異なる疾患コンテキストでの提示を可能にする解決策を提供する。例えば、次の臨床ワークフローに関連するコンテキストの特定に重点を置いている(ただし、実施形態は他のワークフローにも適用できる)。「放射線学・病理学の相関(Radiology Pathology Correlation)」ワークフローでは、外科的処置(生検、切除など)のための病理学レポートが与えられると、実施形態は、放射線学及び病理学の転帰コンコーダンスのための関連する過去の放射線検査及び病理学検査を特定する。この適用は、放射線学の臨床品質及びトレーニングにおいて基本的なことである。
【0036】
[0039] 「放射線学読影ワークフロー(Radiology Reading Workflow)」では、現在読影されている放射線画像内の関心領域が与えられると、実施形態は、関連する過去の放射線検査及び病理学検査を特定して、患者の検査コンテキストを取得して、疾患の発症、進行又は広がり、及び治療の有効性を理解する。この適用は、放射線技師の重要な機能をサポートする。
【0037】
[0040] 「矛盾読影を特定するための縦断的解析(Longitudinal Analyses to Identify Discrepant Reads)」ワークフローでは、実施形態は、後続の検査及び過去の検査の解析に基づいて、2回目の読影又はピアレビューのための矛盾読影を特定する。この適用は、誤読影及び臨床品質の特定に重要である。
【0038】
[0041] 図1は、患者の放射線検査及び病理学検査をグループ化するクラスタリングシステムの一実施形態を示す。クラスタリングシステム100は、患者の放射線検査及び病理学検査を疾患/病理学の分析に従って分類して、関連する患者データの収集及び提示、並びに異なる疾患コンテキストでの提示を可能にする。本明細書では、放射線学レポート及び病理学レポートを例として使用しているが、他のタイプの医用レポートを分類及びグループ化することもできる。クラスタリングシステムは、レポートプロセッサ105、推論プロセッサ110、類似性推定器115、検査クラスタリングシステム120、グループ推論システム124、及び検査ビジュアライザ130を含む。
【0039】
[0042] クラスタリングシステムは、乳房生検に関する病理学レポートを対応する乳房のX線写真にリンクさせるなど、放射線学レポートと病理学レポートとをリンクする。更に、これは、過去のレポート(例えば過去の乳房生検及び過去の乳房X線写真)に対しても行われる。これらは特定されて、現在のレポートにリンクされる。病理学レポートを過去の関連する放射線学レポート及びX線写真レポートにリンクする機能、及びX線写真を過去のX線写真レポート及び病理学レポートにリンクする機能は、クラスタリングシステムの利点の1つであり、利用法である。
【0040】
[0043] クラスタリングシステムは、患者レポート及びデータを解析して、所与の患者のレポート間の類似性(例えば、限定ではないが、所与の病理学レポートと過去の放射線学レポートとの類似性)を推定及び決定する。これは、病理学レポートの診断セクションと放射線学レポートの診断セクションとの類似性を確立することによって達成される。放射線学レポートと病理学レポートとは2つの異なるタイプのレポートであるため、これは重要である。放射線学レポートは全体の解剖学的構造を扱い、イメージングに基づいているが、病理学レポートは細胞レベルでの診断に基づいている。その結果、放射線学レポートと病理学レポートとでは、語彙に関して共通性はほとんどないか、又は、病理学レポートの診断セクションと放射線学レポートの所見セクションとの間にのみ唯一の共通性が存在している。ここでは、解剖学的構造、疾患の場所、及び疾患の種類が記載されている。
【0041】
[0044] 図1では、レポートプロセッサ105及び推論プロセッサ110は、類似性推定器115に入力されるデータを提供するために、患者レポートを解析する。図2は、レポートプロセッサ105及び推論プロセッサ110によって実行される患者レポートのレポート処理パイプライン200を示す。全ての病理学レポート及び放射線学レポートは、放射線学ストレージ及び病理学ストレージを含むデータストレージ205に保存される。ただし、他のタイプの医用レポート用のストレージを含めてもよい。全ての病理学リポート及び放射線学レポート210は、最初に処理パイプライン200を個別に通される。レポート処理パイプライン200の最初のステップは、セクション、ヘッダー、パラグラフ、センテンスなどの文書構造を特定する文書構造処理215である。文書構造処理215は、患者レポート210を受信し、レポートの構造を解析する。レポートの特定の部分には、類似性を特定するために使用される関連度が最も高い情報が含まれている場合があるため、レポートのこれらの部分が特定される。例えば、上記のように、病理学レポートの診断セクション及びX線レポートの所見セクションは、類似性を特定するための良い情報源である。文書構造処理215には、レコードの異なるセクションを決定し、特定された各セクションのタイプを決定するセクション分類モデルが含まれる。これは、セクションヘッダーとセクションコンテンツ境界とを特定するために、条件付き確率場やルールベースモデルなどのトレーニングされたシーケンスラベリングモデルを使用して行うことができる。一例では、これらのモデルでは、縦方向間隔及び文字属性を使用して、文書をセクション、パラグラフ、及びセンテンスに分離する。レポート内の縦方向間隔及び文字属性を使用するルールベースモデルとCRFモデルの両方が開発され、堅牢で構成可能であることが示されている。例えば、特定の医療施設又はシステムでは、特定のレポート構造が使用される。このレポート構造の知識を使用して、セクション分類モデルが開発される。モデルは、文書のセクションと、セクションの関連付けられたタイプとを出力する。更に、セクション内のテキストを処理して、パラグラフ及びセンテンスが特定される。パラグラフ及びセンテンスを特定するために、縦方向空間及び文字属性に基づくシーケンスモデルが採用される。
【0042】
[0045] 文書構造処理の出力は、次に、構文解析220に供給される。構文解析220には、文書セクション内の特定のテキストを処理する言語モデルが含まれる。例えば、センテンスを構文解析して、名詞句が特定される。特定された名詞句は、エンティティ抽出モジュール225によって処理され、例えば、解剖学的領域(左下肺葉、胆嚢など)、所見/診断(肺結節、肝硬変、肝細胞がんなど)、及び処置(卵管開口術、結腸内視鏡検査など)を特定する。
【0043】
[0046] 次に、解剖学的構造推論モジュール230が、検査メタデータ、文書構造、並びにパラグラフ及びセンテンスレベルの情報に基づいて、抽出されたエンティティ(解剖学的構造、所見/診断、及び処置)に臨床的オントロジーベースの解剖学的構造ラベルを提供する。解剖学的構造推論モジュールは、統合医学用語システムメタシソーラス2016AAバージョンのファウンデーション・モデル・オブ・アナトミー(FMA)オントロジーを使用して作成された解剖学的構造の辞書に基づいている。実際の臨床現場で一般的に使用される「主要身体部位の下位区分(Subdivision of cardinal body part)」と「臓器(Organ)」のFMA階層下の全ての解剖学的用語が辞書に含まれている。このモジュールは、暗示する解剖学的ラベルへのフレーズのマッピングを提供する。例えば、気胸は肺にマッピングされ、卵管切除は卵管がんにマッピングされ、CT胸部LLUは肺にマッピングされる。
【0044】
[0047] ベクトル化表現モジュール235は、エンティティのベクトル表現を提供する。このような表現は、放射線学レポート及び病理学レポートでトレーニングされた言語モデル(Word2Vec又はGloVe)によって提供される個々の単語ベクトル表現を平均化することによって生成される。このトレーニングは、他のタイプの医用レポートを使用する場合は、当該他のタイプの医用レポートに適応される。単純平均化と重み付け平均化の両方の方法を使用できる。重み付け平均化スキームでは、重みは、フレーズ内の各単語の単語頻度・逆文書頻度(TF-IDF)値から推定される。或いは、BERTやユニバーサルセンテンスエンコーダなどの動的エンコーダから生成された埋め込みを使用して、エンティティのベクトル表現を生成してもよい。一般に、複数の表現がモジュールによって提示される。
【0045】
[0048] 検査メタデータ、文書構造、センテンスの構文解析、抽出されたエンティティ、それらのラベルは、処理されたレポート240としてエンティティ間の関係を保持する階層的なデータ構造に保存される。次のデータ構造例は、そのようなデータがどのように保存されるかを示している。
【0046】
[0049] 文書構造処理215から、次のデータ構造が出力される:

ID:文書ID(例:UG0000047)
テキスト:レポートテキスト
メタ:{
処置タイプ:検査の処置タイプ(例:XR胸部2ビュー)
DTTMF:検査レポートの最終決定日
セクション:検査の視野(例:胸部)

構造:[{},・・・{}]
エンティティ:[{},・・・{}]
【0047】
[0050] 構文解析では、上記の形式の処理された文書を取得し、次のような構造表現に処理できる:


ID:構造エンティティID(例:S0001)
スパン:レポート内のセクションテキストの文字スパン(例:(0,97))
タイプ:セクション
カテゴリ:所見
},

ID:構成エンティティID(例:P0001)
スパン:レポート内のパラグラフテキストの文字スパン(例:(12,32))
タイプ:パラグラフ
},

ID:構造エンティティID(例:s0001)
スパン:レポート内のセンテンステキストの文字スパン(例:(12,48))
タイプ:センテンス

・・・
【0048】
[0051] エンティティ抽出255、解剖学的構造推論230、及びベクトル化表現235は、構造表現を処理し、処理されたレポート240の一部となるエンティティ表現を生成する。エンティティ表現の例を次に示す。

ID:エンティティID(例:E0047)
テキスト:実際のエンティティテキスト(例:(気胸))
スパン:レポート内のテキストの文字スパン(例:(10,23))
タイプ:エンティティのタイプ。例:解剖学的構造、所見、症状、測定値、スコア、診断、又は処置
推論される解剖学的構造:肺
SENT_ID:このエンティティが属するセンテンス(例:SENT0017)
ベクトル:[

値:[0.12,0.23,0.56,・・・]
ソース:「平均化」
},

値:[0.19,0.19,0.92,・・・]
ソース:「重み付け平均化」
},

値:[0.05,0.11,0.61,・・・]
ソース:「USE」
},
・・・
【0049】
[0052] 全てのレポートが処理された後、類似性推定器115が、各レポート間の類似性を推定する。例えば、n回の検査を受けた患者病歴を所与とすると、類似性推定器115は、n(n-1)/2個の固有値を含む検査間のn関連度マトリックスを計算する。このマトリックスの各要素には、2つの検査の関連性を示す範囲[0,1](0と1とを含めて)内の値が含まれる。教師ありの設定では、これらの値はバイナリ関連性分類器(例えば、ロジスティック回帰、ニューラルネットワークなど)の関連度スコアとして推定される。教師なしの設定では、これらの値は前のステップで抽出されたエンティティに対応する名詞句を使用して計算されたフレーズベクトルの関連度スコアとして推定される。レポート間の類似性を決定するためのこれらの既知の技術のいずれかを使用できる。
【0050】
[0053] 例えば、レポート内で見つかったフレーズは、ベクトルのセットに変換される。レポート内のベクトルは、2つのベクトルセット間の類似性を探すことによって比較される。これらのベクトル比較に基づいて、上記の様々なアプローチを使用して類似性スコアを決定できる。なお、患者は併存疾患を有している場合があるため、レポートは多数の異なるレポートに似ている可能性がある。
【0051】
[0054] 次に、検査クラスタリングシステム120が類似性の結果を取得し、レポートをクラスタリングする。このクラスタリングは、様々な機械学習技術を使用して行われる。例えば、教師なしの設定では、親和性伝播(affinity propagation)を使用してクラスタを特定する。別の実施形態では、2つのレポートの類似性スコアが指定の閾値を上回るときは、レポートは相互にリンクされる。教師ありの設定では、クラスタリングは、2つのレポート間の関連度スコアを直接生成するバイナリ分類器を使用して達成される。別の実施形態では、レポートのクラスタは、レポートにおいて検査されている解剖学的構造が同一又は類似していることに基づいて、解剖学的構造推論プロセスから生じる解剖学的構造ラベリングによって直接決定される。患者は複数の併存疾患を有している場合があるため、任意のレポートは多数の異なるレポートにクラスタリング/リンクされる可能性がある。検査クラスタリングシステム120は、互いに類似した関連レポートのセットを生成する。
【0052】
[0055] 次に、グループ推論システム125が、解剖学的構造のラベリングとマッチングとからグループタイプを推論する。このようなラベリングは、標準的な辞書や、医学的状態、用語、解剖学的構造などを記述したデータベースから得られる。例えば、国際医療用語集(SNOMED)は、医師や他のヘルスケア提供者が臨床健康情報の電子交換のために使用する標準的な臨床的用語の語彙集である。
【0053】
[0056] 次に、ラベル付けされたクラスタは、検査ビジュアライザ130によって医療専門家のために視覚化される。検査ビジュアライザ130には、プロセッサとディスプレイが含まれている。プロセッサは、ラベル付けされたクラスタに関連するデータを処理し、そのデータをディスプレイに提供する。解剖学的構造ラベルが提示され、それらに関連する対応するクラスタが時間順に並べたリストとして提示される。この時間順のリストは、ある解剖学的構造における特定の疾患又は病状を介して患者の進化を示す。そして、医療専門家は、関心の解剖学的構造に関連するレポートを選択できる。例えば、呼吸器科医は乳がん患者に検出された付随的な肺結節の進化に関心を持つかもしれないし、整形外科医は骨盤骨折の進行状況の追跡に関心を持つかもしれない。したがって、関心の解剖学的構造に関連する全てのレポートを提示することで、医療専門家の時間を節約できる。別の使用事例では、医療専門家が新しいレポートを作成した場合、分類器システム100を使用して、新しく受信したレポートと同じクラスタ内の他の全ての関連レポートを決定する。
【0054】
[0057] クラスタリングシステム100は、例えば次のシナリオで使用される。ある高齢患者が乳がんの再発に関してモニタリングされている。したがって、先の乳がんの発作に関連する過去の病理学レポート及び放射線学レポートは、患者の現在進行中のモニタリング及び診断に関連している。この患者は他にも多くの健康問題を抱えていたことがあるため、他の医療記録を多く持っている。例えば、この患者は、関節リウマチを患っており、様々な関節のX線撮影が行われているだけでなく、転倒による股関節置換や、関節リウマチによる膝置換も受けている。更に、この患者は様々な肺感染症を患ったことがあるため、胸部X線撮影を多く受けている。他にもこの患者に関連する他の様々なタイプのX線撮影及び医用レポートがある。
【0055】
[0058] 患者の医師が新しいX線写真を受信して乳房を評価するときに、クラスタリングシステム100を使用して、過去のがんの発作や肺感染症に関連した過去の胸部X線写真など、他の関連するレポートを迅速且つ正確に医師に対して特定できる。胸部領域の関連部分が含まれている場合があるため、乳房又は上腹部のX線写真が含められてもよい。また、過去のがんの発作に関連する過去の病理学レポートも特定される。更に、股関節及び膝の置換に関するX線写真は、乳がんに関連しないとして無視される。他のレポートも、現在の診断には関連しないため無視される場合がある。この結果、医師は多数の無関係なレポートを検討して時間を無駄にする必要がなくなる。また、多数のレポートが存在する場合、医師はそれらの全てに目を通す際に、関連するレポートを見落とす可能性がある。クラスタリングシステム100は、医師が求めている診断に関係している現在の医用レポートに関連するレポートを決定することで、これを防止する。
【0056】
[0059] クラスタリングシステムは、医療専門家が過去の関連する医用検査を迅速且つ正確に見つける能力を高めるのに役立つ。クラスタリングシステムによって自動処理が行われるため、医療専門家は、関心の過去の検査を見つけるために過去の検査を手動で検索する必要がない。過去の検査数が多い場合、この検索には非常に時間がかかる場合がある。又は、医療専門家は、過去の検査の結果の大まかな検査のみを行う場合がある。更に、クラスタリングシステムの様々な機械学習技術及びデータ処理技術を使用して、関連するレポートをより正確に見つけることができる。特に時間効率の良い方法で、また、レポートを手動で比較する場合には実用的ではない類似性のベースに沿って見つけることができる。例えば、クラスタリングシステムは、入力データのベクトル化表現を使用する。クラスタリングシステムは、このベクトル化表現によって、医療専門家が手動では特定できない検査結果の類似性を特定可能になる。これらの技術進歩により、現在の患者の検査に関連し得る検査を決定するために、過去の検査を評価するのにかかる時間及び労力の問題が解決される。これにより、医療専門家は患者の状態をより正確に診断し、より効率的に診断できるようになる。
【0057】
[0060] 図3は、医用検査をグループ化するクラスタリングシステムによって実施される方法のフローチャートを示す。方法300は305で開始し、最初に医用レポートを受信し、処理する(310)。上記の実施例では、医用レポートは放射線学レポート及び病理学レポートであるが、他のタイプの医用レポートが含まれていてもよい。医用レポートは、図2に詳述したように処理される。処理された医用レポートは、更なる処理のためにコンピュータ化された形式になっている。次に、方法300は、処理された医用レポート間の類似性を推定する(315)。これは上記のように類似性推定器によって行われる。次に、方法300は、類似性推定に基づいてレポートをクラスタリングする(320)。これは上記のように検査クラスタリングシステム120によって行われる。次に、方法300は、クラスタリングされたレポートからグループタイプを推論する(325)。上記のグループ推論システム125によって、方法300のこのステップが実行される。次に、方法300はラベル付けされたクラスタを可視化する(330)。上記の検査ビジュアライザ130によって、このステップが実行される。検査ビジュアライザ130には、視覚化されたデータを医療専門家に表示するディスプレイとプロセッサが含まれている。方法300は335で終了する。
【0058】
[0061] 図4は、クラスタリングシステム100を実装するための模範的なハードウェアデバイス400を示す。このデバイスは、クラスタリングシステム100全体を実装することもでき、また、レポートプロセッサ105、推論プロセッサ110、類似性推定器115、検査クラスタリングシステム120、グループ推論システム125、及び検査ビジュアライザ130など、クラスタリングシステムの様々な要素を実装することもできる。図示するように、デバイス400は、1つ以上のシステムバス410を介して相互接続されたプロセッサ420、メモリ430、ユーザインターフェース440、ネットワークインターフェース450、及びストレージ460を含む。図4は、いくつかの点で、抽象化を構成しており、デバイス400の構成要素の実際の組織化は、図示されるものよりも複雑であり得ることが理解されよう。
【0059】
[0062] プロセッサ420は、メモリ430又はストレージ460に保存された命令を実行したり、データを処理したりできる任意のハードウェアデバイスである。したがって、プロセッサには、マイクロプロセッサ、グラフィックスプロセッシングユニット(GPU)、フィールドプログラマブルゲートアレイ(FPGA)、特定用途向け集積回路(ASIC)、並列コンピューティングが可能な任意のプロセッサ、又は他の類似のデバイスが含まれ得る。プロセッサはまた、機械学習モデルを実装する特別なプロセッサであってもよい。
【0060】
[0063] メモリ430には、L1、L2、若しくはL3キャッシュ、又はシステムメモリなどの様々なメモリが含まれ得る。そのため、メモリ430には、静的ランダムアクセスメモリ(SRAM)、動的RAM(DRAM)、フラッシュメモリ、読み取り専用メモリ(ROM)、又は他の類似のメモリデバイスが含まれ得る。メモリ430は、クラスタリングシステム100の1つの要素から別の要素に渡されるときに、クラスタリングシステムの様々な要素の中間結果を保存してもよい。例として、上記のように処理された様々なデータ構造とデータが含まれる。
【0061】
[0064] ユーザインターフェース440には、ユーザとのやり取りを可能にする1つ以上のデバイスが含まれ得、また、ユーザに情報を提示し得る。例えば、ユーザインターフェース440には、ユーザコマンドを受信するためのディスプレイ、タッチインターフェース、マウス、及び/又はキーボードが含まれる。いくつかの実施形態では、ユーザインターフェース440には、ネットワークインターフェース450を介してリモート端末に提示されるコマンドラインインターフェース又はグラフィカルユーザインターフェースが含まれる。ユーザインターフェース440を使用して、レポートのグループ化及びラベリングの結果を医療専門家に提示する検査ビジュアライザ130を実現できる。
【0062】
[0065] ネットワークインターフェース450には、他のハードウェアデバイスとの通信を可能にするための1つ以上のデバイスが含まれ得る。例えば、ネットワークインターフェース450には、イーサネット(登録商標)プロトコル又は他の通信プロトコル(ワイヤレスプロトコルなど)に従って通信するネットワークインターフェースカード(NIC)が含まれ得る。更に、ネットワークインターフェース450は、TCP/IPプロトコルに従って通信するためのTCP/IPスタックを実装していてもよい。ネットワークインターフェース450の様々な代替又は追加のハードウェア若しくは構成は明らかであろう。
【0063】
[0066] ストレージ460には、読み取り専用メモリ(ROM)、ランダムアクセスメモリ(RAM)、磁気ディスクストレージ媒体、光学ストレージ媒体、フラッシュメモリデバイス、又は同様のストレージ媒体など、1つ以上の機械可読ストレージ媒体が含まれ得る。様々な実施形態では、ストレージ460は、プロセッサ420による実行のための命令又はプロセッサ420が作用するデータを保存している。例えば、ストレージ460は、ハードウェア400の様々な基本動作を制御するためのベースのオペレーティングシステム461を保存している。ストレージ462には、クラスタリングシステムや、レポートプロセッサ105、推論プロセッサ110、類似性推定器115、検査クラスタリングシステム120、グループ推論システム125、及び検査ビジュアライザ130などのクラスタリングシステム100の様々な要素を実現するための命令が保存され得る。更に、ストレージには、レポートプロセッサ105、推論プロセッサ110、類似性推定器115、検査クラスタリングシステム120、グループ推論システム125、及び検査ビジュアライザ130など、クラスタリングシステム100で生成された各種データ(上記のデータ構造など)が保存され得る。
【0064】
[0067] ストレージ460に保存されているものとして説明された様々な情報は、追加的に又は代替的に、メモリ430に保存されてもよいことが明らかであろう。この点において、メモリ430も「ストレージデバイス」を構成していると見なされ、ストレージ460は「メモリ」と見なされることがある。他の様々な配置が明らかであろう。更に、メモリ430及びストレージ460は共に、「非一時的機械可読媒体」と見なされてもよい。本明細書で使用される場合、「非一時的」という用語は、一時的な信号は除外するが、揮発性メモリと不揮発性メモリの両方を含むあらゆる形態のストレージを含むと理解されるものとする。
【0065】
[0068] システム400は、説明した各構成要素の1つを含むものとして示されているが、様々な構成要素が様々な実施形態で重複していてもよい。例えば、プロセッサ420は、本明細書で説明する機能を達成するために複数のプロセッサが協働するように、本明細書で説明する方法を独立して実行する、又は、本明細書で説明する方法のステップ若しくはサブルーチンを行う複数のマイクロプロセッサを含んでいてもよい。このような複数のプロセッサは、同じタイプでも異なるタイプでも構わない。更に、デバイス400がクラウドコンピューティングシステムで実現されている場合、様々なハードウェア構成要素が別々の物理システムに属していてもよい。例えばプロセッサ420は、第1のサーバにある第1のプロセッサと、第2のサーバにある第2のプロセッサとを含む。
【0066】
[0069] 本発明の実施形態を実現するために、プロセッサ上で実行される特定のソフトウェアの任意の組み合わせは、特定の専用機械を構成する。
【0067】
[0070] 本明細書で使用される場合、「非一時機械可読媒体」という用語は、一時的な伝播信号は除外するが、揮発性メモリと不揮発性メモリのあらゆる形態を含むと理解されるものとする。
【0068】
[0071] 様々な模範的な実施形態を、その特定の模範的な態様を特に参照して詳細に説明したが、本発明は他の実施形態が可能であり、その詳細は様々な明白な点で修正可能であることが理解されるべきである。当業者には容易に明らかであるように、変更及び修正は、本発明の精神及び範囲内にある限り、作用可能である。したがって、上記の開示、説明、及び図は説明のみを目的としたものであり、特許請求の範囲によってのみ定義される本発明を限定するものではない。
図1
図2
図3
図4
【国際調査報告】