IP Force 特許公報掲載プロジェクト 2022.1.31 β版

知財求人 - 知財ポータルサイト「IP Force」

▶ カカオ・ヘルスケア・コーポレイションの特許一覧

特表2024-521461コホート抽出方法、これを実現したコホート抽出装置およびコホート抽出プログラム
<>
  • 特表-コホート抽出方法、これを実現したコホート抽出装置およびコホート抽出プログラム 図1
  • 特表-コホート抽出方法、これを実現したコホート抽出装置およびコホート抽出プログラム 図2
  • 特表-コホート抽出方法、これを実現したコホート抽出装置およびコホート抽出プログラム 図3
  • 特表-コホート抽出方法、これを実現したコホート抽出装置およびコホート抽出プログラム 図4
  • 特表-コホート抽出方法、これを実現したコホート抽出装置およびコホート抽出プログラム 図5
  • 特表-コホート抽出方法、これを実現したコホート抽出装置およびコホート抽出プログラム 図6
  • 特表-コホート抽出方法、これを実現したコホート抽出装置およびコホート抽出プログラム 図7
  • 特表-コホート抽出方法、これを実現したコホート抽出装置およびコホート抽出プログラム 図8
  • 特表-コホート抽出方法、これを実現したコホート抽出装置およびコホート抽出プログラム 図9
< >
(19)【発行国】日本国特許庁(JP)
(12)【公報種別】公表特許公報(A)
(11)【公表番号】
(43)【公表日】2024-05-31
(54)【発明の名称】コホート抽出方法、これを実現したコホート抽出装置およびコホート抽出プログラム
(51)【国際特許分類】
   G16H 10/00 20180101AFI20240524BHJP
【FI】
G16H10/00
【審査請求】有
【予備審査請求】未請求
(21)【出願番号】P 2023576223
(86)(22)【出願日】2022-05-11
(85)【翻訳文提出日】2023-12-07
(86)【国際出願番号】 KR2022006743
(87)【国際公開番号】W WO2022260291
(87)【国際公開日】2022-12-15
(31)【優先権主張番号】10-2021-0073385
(32)【優先日】2021-06-07
(33)【優先権主張国・地域又は機関】KR
(81)【指定国・地域】
(71)【出願人】
【識別番号】523462620
【氏名又は名称】カカオ・ヘルスケア・コーポレイション
【氏名又は名称原語表記】KAKAO HEALTHCARE CORP.
【住所又は居所原語表記】5F, BLDG. B, KAKAO PANGYO AGIT, 166 PANGYOYEOK‐RO, BUNDANG‐GU, SEONGNAM‐SI, GYEONGGI‐DO 13529, REPUBLIC OF KOREA
(74)【代理人】
【識別番号】110001818
【氏名又は名称】弁理士法人R&C
(72)【発明者】
【氏名】リュ,デヒョプ
(72)【発明者】
【氏名】イ,ユナ
【テーマコード(参考)】
5L099
【Fターム(参考)】
5L099AA21
(57)【要約】
コホート抽出装置の動作方法であって、コホート生成条件を受信し、臨床データウェアハウスから前記コホート生成条件に該当するイベントを抽出する段階と、抽出した各イベントのイベント識別子、患者識別子、そして最初段階の条件満足を示すビット列を含む最初のヒストリテーブルを生成する段階と、現在段階の条件を受信し、直前段階のヒストリテーブルに含まれている患者のうち、前記現在段階の条件に該当するイベントを有する現在段階の患者を識別し、前記直前段階のヒストリテーブルに含まれている前記現在段階の患者の各イベントに対してビット列を更新し、前記現在段階で抽出された新規イベントを追加して現在段階のヒストリテーブルを生成する段階と、段階別ヒストリテーブルを順次に生成した後、最終段階のヒストリテーブルを用いてコホートテーブルを生成する段階とを含む。
【特許請求の範囲】
【請求項1】
コホート抽出装置の動作方法であって、
コホート生成条件を受信し、臨床データウェアハウスから前記コホート生成条件に該当するイベントを抽出する段階と、
抽出した各イベントのイベント識別子、患者識別子、そして最初段階の条件満足を示すビット列を含む最初のヒストリテーブルを生成する段階と、
現在段階の条件を受信し、直前段階のヒストリテーブルに含まれている患者のうち、前記現在段階の条件に該当するイベントを有する現在段階の患者を識別し、前記直前段階のヒストリテーブルに含まれている前記現在段階の患者の各イベントに対してビット列を更新し、前記現在段階で抽出された新規イベントを追加して現在段階のヒストリテーブルを生成する段階と、
段階別ヒストリテーブルを順次に生成した後、最終段階のヒストリテーブルを用いてコホートテーブルを生成する段階と
を含む動作方法。
【請求項2】
段階別に生成される各ヒストリテーブルは、
当該段階の条件を満足するイベントを含み、各イベントのイベント識別子、患者識別子、そして当該段階までの条件満足の有無を示すビット列が記載され、
前記ビット列は、各段階の条件満足の有無を1または0で示す桁が指定される、請求項1に記載の動作方法。
【請求項3】
前記現在段階のヒストリテーブルを生成する段階は、
前記直前段階のヒストリテーブルから前記現在段階の患者のイベントを確認し、確認したイベントのビット列を前記現在段階の条件満足を示す値に更新して、前記現在段階のヒストリテーブルに記録する、請求項1に記載の動作方法。
【請求項4】
前記現在段階のヒストリテーブルを生成する段階は、
前記現在段階で新規イベントが抽出されれば、前記新規イベントの識別子、患者識別子、そして前記現在段階の条件満足を示すビット列を前記現在段階のヒストリテーブルに記録し、
前記新規イベントのビット列は、前記現在段階に指定された桁の値が1であり、他の段階に指定された桁の値が0と記載される、請求項1に記載の動作方法。
【請求項5】
前記現在段階のヒストリテーブルを生成する段階は、
前記直前段階のヒストリテーブルに含まれている患者のうち、前記現在段階の条件に該当するイベントを有さない前段階の患者を識別し、前記前段階の患者のイベントを前記現在段階のヒストリテーブルに記録しない、請求項1に記載の動作方法。
【請求項6】
特定段階で抽出されたイベント数または患者数が要請されれば、前記特定段階のヒストリテーブルを用いて前記イベント数または前記患者数を計算する段階
をさらに含む、請求項1に記載の動作方法。
【請求項7】
特定段階の変更条件を受信する段階と、
前記特定段階の直前段階で生成された直前段階のヒストリテーブルを持って来る段階と、
前記直前段階のヒストリテーブルに含まれている患者のうち、前記特定段階の変更条件に該当するイベントを有する特定段階の患者を識別し、前記直前段階のヒストリテーブルに含まれている前記特定段階の患者の各イベントに対してビット列を更新し、前記特定段階で抽出された新規イベントを追加して前記特定段階のヒストリテーブルを再生成する段階と
をさらに含む、請求項1に記載の動作方法。
【請求項8】
再生成された前記特定段階のヒストリテーブルを用いて、前記特定段階後の段階のヒストリテーブルを順次に再生成する段階
をさらに含む、請求項7に記載の動作方法。
【請求項9】
コホート抽出装置の動作方法であって、
条件を受信する段階と、
直前段階で生成された第1ヒストリテーブルに含まれている患者の臨床データに基づいて、前記第1ヒストリテーブルに含まれている患者のうち前記条件を満足する現在段階の患者を識別する段階と、
前記第1ヒストリテーブルに含まれている前記現在段階の患者のすべてのイベントのイベント識別子、患者識別子、そして更新されたビット列を第2ヒストリテーブルに記録する段階と、
前記条件に該当する新規イベントが抽出される場合、前記新規イベントのイベント識別子、患者識別子、そして現在段階で抽出されたイベントを示すビット列を第2ヒストリテーブルに記録する段階と、
前記第2ヒストリテーブルを現在段階のヒストリテーブルに格納する段階とを含む、動作方法。
【請求項10】
前記第1ヒストリテーブルに含まれている前記現在段階の患者のすべてのイベントの場合、前記第1ヒストリテーブルに記録されたビット列において現在段階に指定された桁の値が1に更新されたビット列が、前記第2ヒストリテーブルに記録される、請求項9に記載の動作方法。
【請求項11】
前記新規イベントの場合、前記現在段階に指定された桁の値が1であり、他の段階に指定された桁の値が0であるビット列が、前記第2ヒストリテーブルに記録される、請求項9に記載の動作方法。
【請求項12】
前記第1ヒストリテーブルに含まれているイベントのうち、前記条件に該当するイベントを有さない前段階の患者のイベントは、前記第2ヒストリテーブルに記録されない、請求項9に記載の動作方法。
【請求項13】
コンピュータ読取可能な記憶媒体に格納され、少なくとも1つのプロセッサによって実行される命令語を含むコンピュータプログラムであって、
コホート生成条件を受信し、臨床データウェアハウスから前記コホート生成条件に該当するイベントを抽出する段階と、
抽出した各イベントのイベント識別子、患者識別子、そして最初段階の条件満足を示すビット列を含む最初のヒストリテーブルを生成する段階と、
現在段階の条件を受信し、直前段階のヒストリテーブルに含まれている患者のうち、前記現在段階の条件に該当するイベントを有する現在段階の患者を識別し、前記直前段階のヒストリテーブルに含まれている前記現在段階の患者の各イベントに対してビット列を更新し、前記現在段階で抽出された新規イベントを追加して現在段階のヒストリテーブルを生成する段階と、
段階別ヒストリテーブルを順次に生成した後、最終段階のヒストリテーブルを用いてコホートテーブルを生成する段階と
を実行するように記述された命令語を含む、コンピュータプログラム。
【請求項14】
段階別に生成される各ヒストリテーブルは、
当該段階の条件を満足するイベントを含み、各イベントのイベント識別子、患者識別子、そして当該段階までの条件満足の有無を示すビット列が記載され、
前記ビット列は、各段階の条件満足の有無を1または0で示す桁が指定される、請求項13に記載のコンピュータプログラム。
【請求項15】
前記現在段階のヒストリテーブルを生成する段階は、
前記直前段階のヒストリテーブルから前記現在段階の患者のイベントを確認し、確認したイベントのビット列を前記現在段階の条件満足を示す値に更新して、前記現在段階のヒストリテーブルに記録し、
前記現在段階で新規イベントが抽出されれば、前記新規イベントの識別子、患者識別子、そして前記現在段階の条件満足を示すビット列を前記現在段階のヒストリテーブルに記録する、請求項13に記載のコンピュータプログラム。
【発明の詳細な説明】
【技術分野】
【0001】
本開示は、患者コホート抽出に関する。
【背景技術】
【0002】
研究者は臨床データウェアハウス(Clinical Data Warehouse、CDW)から抽出したコホート(Cohort)を用いて医療研究を進行させるため、コホート抽出が非常に重要である。したがって、研究者は各種条件を満足するコホートが適正なのかを判断し、条件を変更しながら適正患者数のコホートを抽出しようとする。
【0003】
しかし、従来のコホート抽出装置は、条件を受信し、CDWからすべての条件を満足する患者群を出力するが、条件に応じて抽出された患者数が可変する。したがって、研究者は条件を変更しながら膨大なCDWからコホート抽出作業を繰り返さなければならないので、研究者が満足できるコホートを得るまで相当の時間がかかる。また、条件数が増えればクエリ量が増えるが、変更されていない条件の患者まで再び抽出しなければならないので、不要な作業が繰り返される。
【発明の概要】
【発明が解決しようとする課題】
【0004】
本開示は、コホートを段階的に抽出する方法、これを実現したコホート抽出装置およびコホート抽出プログラムを提供する。
【0005】
具体的には、本開示は、段階ごとに各患者のイベントを含むヒストリテーブルを生成し、ヒストリテーブルにイベント別に条件満足の有無を示すビット列(bit string)をアップデートしながらコホートを抽出する方法を提供する。
【課題を解決するための手段】
【0006】
一実施例によるコホート抽出装置の動作方法であって、コホート生成条件を受信し、臨床データウェアハウスから前記コホート生成条件に該当するイベントを抽出する段階と、抽出した各イベントのイベント識別子、患者識別子、そして最初段階の条件満足を示すビット列を含む最初のヒストリテーブルを生成する段階と、現在段階の条件を受信し、直前段階のヒストリテーブルに含まれている患者のうち、前記現在段階の条件に該当するイベントを有する現在段階の患者を識別し、前記直前段階のヒストリテーブルに含まれている前記現在段階の患者の各イベントに対してビット列を更新し、前記現在段階で抽出された新規イベントを追加して現在段階のヒストリテーブルを生成する段階と、段階別ヒストリテーブルを順次に生成した後、最終段階のヒストリテーブルを用いてコホートテーブルを生成する段階とを含む。
【0007】
段階別に生成される各ヒストリテーブルは、当該段階の条件を満足するイベントを含み、各イベントのイベント識別子、患者識別子、そして当該段階までの条件満足の有無を示すビット列が記載される。前記ビット列は、各段階の条件満足の有無を1または0で示す桁が指定される。
【0008】
前記現在段階のヒストリテーブルを生成する段階は、前記直前段階のヒストリテーブルから前記現在段階の患者のイベントを確認し、確認したイベントのビット列を前記現在段階の条件満足を示す値に更新して、前記現在段階のヒストリテーブルに記録することができる。
【0009】
前記現在段階のヒストリテーブルを生成する段階は、前記現在段階で新規イベントが抽出されれば、前記新規イベントの識別子、患者識別子、そして前記現在段階の条件満足を示すビット列を前記現在段階のヒストリテーブルに記録することができる。前記新規イベントのビット列は、前記現在段階に指定された桁の値が1であり、他の段階に指定された桁の値が0と記載される。
【0010】
前記現在段階のヒストリテーブルを生成する段階は、前記直前段階のヒストリテーブルに含まれている患者のうち、前記現在段階の条件に該当するイベントを有さない前段階の患者を識別し、前記前段階の患者のイベントを前記現在段階のヒストリテーブルに記録しない。
【0011】
前記動作方法は、特定段階で抽出されたイベント数または患者数が要請されれば、前記特定段階のヒストリテーブルを用いて前記イベント数または前記患者数を計算する段階をさらに含むことができる。
【0012】
前記動作方法は、特定段階の変更条件を受信する段階と、前記特定段階の直前段階で生成された直前段階のヒストリテーブルを持って来る段階と、前記直前段階のヒストリテーブルに含まれている患者のうち、前記特定段階の変更条件に該当するイベントを有する特定段階の患者を識別し、前記直前段階のヒストリテーブルに含まれている前記特定段階の患者の各イベントに対してビット列を更新し、前記特定段階で抽出された新規イベントを追加して前記特定段階のヒストリテーブルを再生成する段階とをさらに含むことができる。
【0013】
前記動作方法は、再生成された前記特定段階のヒストリテーブルを用いて、前記特定段階後の段階のヒストリテーブルを順次に再生成する段階をさらに含むことができる。
【0014】
他の実施例によるコホート抽出装置の動作方法であって、条件を受信する段階と、直前段階で生成された第1ヒストリテーブルに含まれている患者の臨床データに基づいて、前記第1ヒストリテーブルに含まれている患者のうち前記条件を満足する現在段階の患者を識別する段階と、前記第1ヒストリテーブルに含まれている前記現在段階の患者のすべてのイベントのイベント識別子、患者識別子、そして更新されたビット列を第2ヒストリテーブルに記録する段階と、前記条件に該当する新規イベントが抽出される場合、前記新規イベントのイベント識別子、患者識別子、そして現在段階で抽出されたイベントを示すビット列を第2ヒストリテーブルに記録する段階と、前記第2ヒストリテーブルを現在段階のヒストリテーブルに格納する段階とを含む。
【0015】
前記動作方法は、前記第1ヒストリテーブルに含まれている前記現在段階の患者のすべてのイベントの場合、前記第1ヒストリテーブルに記録されたビット列において現在段階に指定された桁の値が1に更新されたビット列が、前記第2ヒストリテーブルに記録される。
【0016】
前記新規イベントの場合、前記現在段階に指定された桁の値が1であり、他の段階に指定された桁の値が0であるビット列が、前記第2ヒストリテーブルに記録される。
【0017】
前記第1ヒストリテーブルに含まれているイベントのうち、前記条件に該当するイベントを有さない前段階の患者のイベントは、前記第2ヒストリテーブルに記録されない。
【0018】
さらに他の実施例によりコンピュータ読取可能な記憶媒体に格納され、少なくとも1つのプロセッサによって実行される命令語を含むコンピュータプログラムであって、コホート生成条件を受信し、臨床データウェアハウスから前記コホート生成条件に該当するイベントを抽出する段階と、抽出した各イベントのイベント識別子、患者識別子、そして最初段階の条件満足を示すビット列を含む最初のヒストリテーブルを生成する段階と、現在段階の条件を受信し、直前段階のヒストリテーブルに含まれている患者のうち、前記現在段階の条件に該当するイベントを有する現在段階の患者を識別し、前記直前段階のヒストリテーブルに含まれている前記現在段階の患者の各イベントに対してビット列を更新し、前記現在段階で抽出された新規イベントを追加して現在段階のヒストリテーブルを生成する段階と、段階別ヒストリテーブルを順次に生成した後、最終段階のヒストリテーブルを用いてコホートテーブルを生成する段階とを実行するように記述された命令語を含むことができる。
【0019】
段階別に生成される各ヒストリテーブルは、当該段階の条件を満足するイベントを含み、各イベントのイベント識別子、患者識別子、そして当該段階までの条件満足の有無を示すビット列が記載される。前記ビット列は、各段階の条件満足の有無を1または0で示す桁が指定される。
【0020】
前記現在段階のヒストリテーブルを生成する段階は、前記直前段階のヒストリテーブルから前記現在段階の患者のイベントを確認し、確認したイベントのビット列を前記現在段階の条件満足を示す値に更新して、前記現在段階のヒストリテーブルに記録し、前記現在段階で新規イベントが抽出されれば、前記新規イベントの識別子、患者識別子、そして前記現在段階の条件満足を示すビット列を前記現在段階のヒストリテーブルに記録することができる。
【発明の効果】
【0021】
実施例によれば、段階ごとに抽出された各患者のイベントおよび各イベントの段階別条件満足の有無を示すビット列をヒストリテーブルで管理するため、複数のヒストリテーブルを用いて、各段階での患者数およびイベント数を迅速に計算することができ、これによって研究者はコホートの適正性を迅速に判断することができる。
【0022】
実施例によれば、各イベントの段階別条件満足の有無を示すビット列により、イベントが抽出された段階およびイベントが条件を満足する段階を迅速に確認することができる。
【0023】
実施例によれば、最終段階までのイベント抽出を完了した後に、特定段階の条件を変更しなければならない場合、直前段階で生成されたヒストリテーブルを用いて、変更条件を満足するイベントを含む新しいヒストリテーブルを生成することができる。
【図面の簡単な説明】
【0024】
図1】従来のコホート抽出方法を説明する図である。
図2】従来のコホート抽出方法を説明する図である。
図3】コホート抽出装置を説明する図である。
図4】コホート抽出方法を例として説明する図である。
図5】コホート抽出方法を例として説明する図である。
図6】コホート抽出方法を例として説明する図である。
図7】ヒストリテーブルを用いたコホート再抽出方法を説明する図である。
図8】コホート抽出方法のフローチャートである。
図9】一実施例によるコンピューティング装置のハードウェア構成図である。
【発明を実施するための形態】
【0025】
以下、添付した図面を参照して、本開示の実施例について、本発明の属する技術分野における通常の知識を有する者が容易に実施できるように詳細に説明する。しかし、本開示は種々の異なる形態で実現可能であり、ここで説明する実施例に限定されない。そして、図面において本発明を明確に説明するために説明上不必要な部分は省略し、明細書全体にわたって類似の部分については類似の図面符号を付した。
【0026】
明細書全体において、ある部分がある構成要素を「含む」とする時、これは特に反対の記載がない限り、他の構成要素を除くのではなく、他の構成要素をさらに包含できることを意味する。また、明細書に記載された「...部」、「...器」、「モジュール」などの用語は、少なくとも1つの機能や動作を処理する単位を意味し、これはハードウェアやソフトウェア、またはハードウェアおよびソフトウェアの結合で実現される。
【0027】
図1図2は、従来のコホート抽出方法を説明する図である。
【0028】
図1を参照すれば、従来のコホート抽出装置10は、研究者からコホート条件(criteria)(条件1、条件2、...、条件n)を受信し、各種患者データを格納する臨床データウェアハウス(Clinical Data Warehouse、CDW)20からすべての条件を満足するK名の患者を抽出する。従来のコホート抽出装置10は、K名の患者のデータを含むコホートテーブルを出力する。
【0029】
もし、研究者が条件1を変更したり、条件1を削除したい場合、従来のコホート抽出装置10に変更された条件を入力し、すべての条件を満足するM名の患者で構成されたコホートを得ることができる。しかし、従来のコホート抽出装置10は、入力条件の1つでも変更されれば、コホート抽出作業を再び進行させなければならないので、コホート抽出作業を繰り返し、変更されていない条件の患者まで再び抽出しなければならないので、不要な作業が繰り返される。また、条件数が増えればクエリ量が増えて、抽出時間が相当かかることがある。
【0030】
図2を参照すれば、従来のコホート抽出装置10は、研究者からコホート条件(条件1、条件2、...、条件n)を段階的に受信し、次第に患者数を減らしながらK名の患者を抽出することができる。つまり、従来のコホート抽出装置10は、条件1を満足する第1患者群を抽出し、第1患者群から条件2を満足する第2患者群を抽出し、第2患者群から条件3を満足する第3患者群を抽出しながら、K名の患者群を抽出することができる。
【0031】
各段階で抽出された患者群は、当該段階までのすべての条件を満足する患者であるので、研究者は最初段階から現在段階まで設定されたすべての条件を満足する患者を得ることができる。このように、従来のコホート抽出装置10は、患者を抽出するのに集中していて、現在段階までのすべての条件(例えば、高血圧診断、50代、男性、A薬物処方、B薬物処方)を満足する患者だけを識別する。したがって、研究者は抽出された患者が現在段階までのすべての条件(例えば、高血圧診断、50代、男性、A薬物処方、B薬物処方)に該当することを知ることができるだけで、患者にA薬物とB薬物が共に処方されたのか、別々に処方されたのか、A薬物が高血圧の診断時に処方されたのか、他の診断時に処方されたのかを知ることは難しい。もし、研究者がA薬物とB薬物が共に処方されたコホートを得ようとする場合、患者データを分析して患者を再選別しなければならない。
【0032】
一方、キーワード検索のように検索を希望する属性が1つであれば、検索装置は、1次元データから希望する対象を抽出すれば良い。しかし、コホート抽出作業は、ある患者の臨床データから抽出するとしても、年齢、性別、主診断名、副診断名、診断日付、投薬した薬物名、処方日付などの属性ごとのテーブルから条件に適したデータを持って来なければならない。したがって、コホート抽出作業は、テーブルの量、属性の特性および検索条件に応じて検索速度が幾何級数的に遅くなるが、このような作業を条件を変更するたびに繰り返すとすれば、時間および資源が無駄遣いになる。
【0033】
以下、このような従来の方法を改善したコホート抽出方法について詳しく説明する。
【0034】
図3は、コホート抽出装置を説明する図である。
【0035】
図3を参照すれば、コホート抽出装置100は、少なくとも1つのプロセッサによって動作するコンピューティング装置である。コホート抽出装置100のプロセッサがコンピュータプログラムに含まれている命令語を実行することによって、本開示の動作を行う。コンピュータプログラムは、プロセッサが本開示の動作を実行するように記述された命令語(instructions)を含み、非一時的-コンピュータ読取可能な記憶媒体(non-transitory computer readable storage medium)に格納される。コンピュータプログラムは、ネットワークを介してダウンロードされたり、製品形態で販売され、研究所、病院などの多様なサイトのコンピューティング装置に設けられる。
【0036】
コホート抽出装置100は、各種患者データを格納する臨床データウェアハウス(CDW)20からコホートを抽出する。臨床データウェアハウス(CDW)20から抽出される患者データの種類は多様であるが、便宜上、臨床データと通称する。また、コホート抽出装置100は、多様なストレージから患者データを抽出することができるが、便宜上、臨床データウェアハウスから抽出すると説明する。
【0037】
コホート抽出装置100は、段階別に条件を受信するが、段階ごとに条件に該当するイベントを抽出し、イベントを患者ごとに整列して各患者のイベントを含むヒストリテーブルを生成する。ここで、イベントは、臨床データウェアハウス(CDW)20から確認可能な情報であって、一定の時点で患者に発生した事件、行為などを区分する情報を意味する。例えば、イベントは、診断イベント(例えば、E10-E14の疾病コードを受けた糖尿病診断の内訳)、薬物処方イベント(例えば、Aspirinが処方された内訳)、検査イベント(例えば、低密度リポタンパク質(LDL)コレステロール検査を受けた内訳)、入院イベント(例えば、救急室訪問の内訳)などで定義される。ここで、条件は、コホート生成(entry)条件(例えば、高血圧疾病と一度でも診断された人)、そして抽出しようとする細部条件(例えば、薬物、年齢など)を含むことができる。細部条件は、当該項目を含むかまたは除外されたもので定義され、範囲で定義されてもよい。
【0038】
コホート抽出装置100は、コホート生成(entry)条件に対するヒストリテーブル1を最初に生成した後、段階別に入力された条件(criteria)を用いてヒストリテーブル2、...、ヒストリテーブルnを別途に生成する。
【0039】
ヒストリテーブルは、イベント別に各現在段階までの条件満足の有無を0、1で示すビット列(bit string)を含む。ビット列の桁ごとに段階が割当てられ、当該ビットの値が1であれば、当該段階の条件を満足することを示し、当該ビットの値が0であれば、当該段階の条件を満足しないことを示すことができる。例えば、ビット列が10ビットの場合、「0000000001」は、段階1の条件を満足するイベントを示し、「0000000011」は、段階1および段階2の条件を満足するイベントを示し、「0000000010」は、段階2の条件を満足するイベントを示す。
【0040】
コホート抽出装置100は、前段階のヒストリテーブルに含まれている患者のうち、現在段階の条件に該当するイベントを有する現在段階の患者を識別する。そして、コホート抽出装置100は、現在段階の条件を満足するイベントで構成された現在段階のヒストリテーブルを生成する。
【0041】
この時、コホート抽出装置100は、前段階のヒストリテーブルに存在する現在段階の患者のイベントがあれば、当該イベントのビット列を更新(例えば、「0000000001」から「0000000011」に更新)し、現在段階で抽出されたイベントを新規イベントに追加して、現在段階のヒストリテーブルを生成する。新規イベントは、現在段階に割当てられたビットが「1」であるビット列(例えば、「0000000010」)が記載される。
【0042】
コホート抽出装置100は、前段階のヒストリテーブルに含まれている患者のうち、現在段階の条件に該当するイベントがない前段階の患者を識別する。そして、コホート抽出装置100は、前段階のヒストリテーブルから前段階の患者のイベントを現在段階のヒストリテーブルへ持って来ない。
【0043】
ヒストリテーブルは、段階別に生成され、イベント単位で記載され、患者によっては複数のイベントが記載されるが、当該段階の条件に該当するイベントを1つでも有する患者のイベントが記載される。このようなヒストリテーブルのスキマは多様に定義されるが、例えば、表1のように、行ごとにイベントが記載され、列はイベント情報が記載され、患者ごとに整列される。イベント情報は、患者識別子(person_ID)、訪問識別子(visit_ID)、イベント開始日(start_date)、イベント終了日(end_date)、イベント種類(event_type)、細部条件種類(criteria_type)を含むことができる。ここで、訪問識別子(visit_ID)、イベント開始日(start_date)、イベント終了日(end_date)は、イベントを区分するのに用いられるイベント識別子として使用できる。
【0044】
【表1】
【0045】
表1中、患者識別子(person_ID)は、条件を満足する患者を区分する識別子である。訪問識別子(visit_ID)は、イベントが発生した訪問を区分する識別子である。イベント開始日(start_date)およびイベント終了日(end_date)は、イベントの開始日および終了日を示す。イベント種類(event_type)は、イベントの段階情報であって、各現在段階までの条件満足の有無を0、1で示すビット列で表現され、段階によって更新される。細部条件種類(criteria_type)は、イベントが抽出された細部条件を示す情報であって、イベントが最初に抽出された細部条件が記載される。
【0046】
コホート抽出装置100は、各段階のヒストリテーブルから、患者数およびイベント数を計算して出力することができる。したがって、研究者は患者数およびイベント数をみて、抽出されたコホートの適正性を容易に判断することができる。
【0047】
コホート抽出装置100は、ヒストリテーブルから特定イベント種類を有するイベントだけを迅速に抽出することができる。例えば、コホート抽出装置100は、ヒストリテーブルから、イベント種類が「********11」と記載されたイベントを抽出すれば、条件1を満足するイベントのうち、条件2を満足する患者によって発生したイベント数を計算することができ、「********11」と記載されたイベントの患者識別子に基づいて条件1および条件2を満足するイベントを有する患者数を計算することができる。したがって、コホート抽出装置100は、イベント数や患者数の計算のためにSQLクエリを新たに生成してCDWから抽出する必要がなく、ヒストリテーブルのイベント種類の列においてビット演算をすれば良いので、イベント数および患者数を迅速に計算することができる。
【0048】
コホート抽出装置100は、最終段階または特定段階のヒストリテーブルからコホートテーブルを生成し、これを出力することができる。コホートテーブルは、ヒストリテーブルに含まれている患者の各種臨床データを含む。
【0049】
一方、研究者は最終段階までのイベント抽出を完了した後に、特定段階の条件を変更したいことがある。この場合、研究者はコホート抽出装置100に変更しようとする特定段階、そして変更条件を入力する。すると、コホート抽出装置100は、格納されたヒストリテーブルのうち、特定段階の直前段階で生成されたヒストリテーブルを持って来て、このヒストリテーブルを用いて、変更条件を満足するイベントを含む特定段階の新しいヒストリテーブルを生成することができる。
【0050】
以下、コホート抽出装置100が段階別にヒストリテーブルを生成する方法について詳しく説明する。
【0051】
図4から図6は、コホート抽出方法を例として説明する図である。
【0052】
図4から図6を参照して、コホート抽出装置100が段階別にヒストリテーブルを生成する方法について例として説明する。
【0053】
最初段階である段階1の条件は、コホート生成(entry)条件であって、例えば、高血圧疾病と一度でも診断された人であってもよい。段階2の条件は、薬物(drug)と仮定する。段階2で薬物または特定薬物が処方されたイベントが抽出される。段階3の条件は、年齢(age)と仮定する。段階3で特定年齢帯に該当する患者が抽出される。
【0054】
まず、図4を参照すれば、コホート抽出装置100は、段階1の条件を受信し、臨床データウェアハウス(CDW)から段階1の条件に該当する高血圧診断イベントを抽出する。例えば、9個のイベントであるevent1、event2、...、event9が抽出されるが、event1およびevent2は、患者Aの高血圧診断イベントであり、event3は、患者Bの高血圧診断イベントであり、event4およびevent5は、患者Cの高血圧診断イベントであり、event6は、患者Dの高血圧診断イベントであり、event7およびevent8は、患者Eの高血圧診断イベントであり、event9は、患者Fの高血圧診断イベントであると仮定する。
【0055】
コホート抽出装置100は、段階1の条件に応じて抽出したイベントをヒストリテーブル1に格納しかつ、患者識別子およびイベント識別子(訪問識別子、イベント開始日、イベント終了日)と共に、現在段階までの条件満足の有無を示すビット列をイベント種類に記録することができる。コホート抽出装置100は、表2のように、段階1のヒストリテーブルを生成することができる。便宜上、ヒストリテーブルにおいてイベント開始日(start_date)、イベント終了日(end_date)の値を省略する。
【0056】
【表2】
【0057】
表2を参照すれば、段階1で抽出されたイベントであるので、段階1に割当てられた最端桁が1である「0000000001」がイベント種類に記載される。段階1は、コホート生成条件であるので、イベントが抽出された細部条件を示す細部条件種類は値が空いている(NULL)。
【0058】
コホート抽出装置100は、段階1で抽出されたイベント数が要請された場合、段階1のヒストリテーブルからイベント種類(event_type)が「0000000001」の行数を計算し、イベント数9を出力することができる。
【0059】
コホート抽出装置100は、段階1で抽出された患者数が要請された場合、段階1のヒストリテーブルから患者識別子(person_ID)と区分される数を計算し、患者数6を出力することができる。
【0060】
図5を参照すれば、コホート抽出装置100は、段階2の条件(薬物)を受信し、ヒストリテーブル1から段階2の条件を満足するイベントを含むヒストリテーブル2を生成する。
【0061】
コホート抽出装置100は、臨床データウェアハウス(CDW)を参照して、段階1のヒストリテーブル1に含まれている患者のうち、段階2の条件(薬物)に該当するイベントを有する現在段階の患者を識別する。そして、コホート抽出装置100は、段階1のヒストリテーブル1に記録された現在段階の患者のすべてのイベントのビット列を更新(例えば、「0000000001」から「0000000011」に更新)し、段階2で抽出されたイベントを新規イベントに追加して、段階2のヒストリテーブル2を生成する。この時、コホート抽出装置100は、ヒストリテーブル1に含まれている患者のうち、段階2の条件(薬物)に該当するイベントを1つも有さない患者(前段階の患者)を識別し、前段階の患者のイベントを段階2のヒストリテーブルへ持って来ずに除外する。
【0062】
例えば、ヒストリテーブル1に含まれている患者のうち、患者Bは、段階2の条件(薬物)に該当するイベントを有さないと仮定する。段階2でevent10-event14が新たに抽出されると仮定する。すると、コホート抽出装置100は、表3のように、ヒストリテーブル2を生成することができる。ヒストリテーブル2に記録された患者数は5であり、イベント数は13である。
【0063】
【表3】
【0064】
表3を参照すれば、患者Bは、段階2の条件(薬物)に該当するイベントを有さないので、患者Bの高血圧診断イベントであるevent3は、ヒストリテーブル2に記録されない。
【0065】
ヒストリテーブル1に含まれているevent1、event2、event4-event9のイベント種類「0000000001」は、段階2の条件(薬物)に該当するイベントを有する現在段階の患者のイベントであるので、段階2に割当てられた2番目の桁が1である「0000000011」に更新される。
【0066】
段階2で新たに抽出されたevent10-event14がヒストリテーブル2に追加され、これらのイベント種類は、段階2に割当てられた端から2番目の桁が1である「0000000010」が記載される。また、event10-event14は、段階2の条件で最初に抽出されたので、細部条件種類(criteria_type)に薬物(drug)が記載される。
【0067】
コホート抽出装置100は、段階2で抽出されたイベント数が要請された場合、ヒストリテーブル2からイベント種類(event_type)が「0000000010」の行数を計算し、イベント数5を出力することができる。
【0068】
図6を参照すれば、コホート抽出装置100は、段階3の条件を受信し、ヒストリテーブル2から段階3の条件を満足するイベントを含むヒストリテーブル3を生成する。
【0069】
コホート抽出装置100は、臨床データウェアハウス(CDW)を参照して、段階2のヒストリテーブル2に含まれている患者のうち、段階3の条件に該当するイベントを有する現在段階の患者を識別する。そして、コホート抽出装置100は、段階2のヒストリテーブル2に記録された現在段階の患者のイベントのビット列を更新(例えば、「0000000011」から「0000000111」に更新)する。そして、コホート抽出装置100は、段階3で抽出された新規イベントを段階3のヒストリテーブル3に追加することができる。
【0070】
コホート抽出装置100は、ヒストリテーブル2に含まれている患者のうち、段階3の条件に該当しない前段階の患者がいれば、この患者のイベントを削除する。
【0071】
一方、条件が年齢/性別の場合、年齢/性別の計算条件は、患者の最も早いイベント(Earliest event)、最も遅いイベント(Latest event)、各イベント(Each event)が可能である。
【0072】
例えば、ヒストリテーブル2に含まれている患者のうち、患者Dは段階3の条件(年齢)に該当せず、残りの患者は段階3の条件を満足する現在段階の患者と仮定する。すると、コホート抽出装置100は、表4のように、前段階の患者である患者Dのevent6およびevent12を含まないヒストリテーブル3を生成することができる。コホート抽出装置100は、段階2のヒストリテーブル2に記録された現在段階の患者のイベントのビット列を更新する。ビット列は、段階3に割当てられた3番目の桁が1に更新される。
【0073】
また、コホート抽出装置100は、段階3で抽出された新規イベントを段階3のヒストリテーブル3に追加するが、年齢計算条件が患者の最も早いイベントの場合、表4のように、患者A、患者C、患者E、患者Fそれぞれの最も早いイベントであるevent1、event4、event7、event9と同一のイベント識別子を有するnew event15、new event16、new event17、new event18をヒストリテーブル3に追加することができる。そして、コホート抽出装置100は、new event15、new event16、new event17、new event18の細部条件種類(criteria_type)に年齢(age)を記載する。
【0074】
【表4】
【0075】
一方、年齢/性別条件で抽出されたevent15、event16、event17、event18は、event1、event4、event7、event9と同一のイベント識別子(訪問識別子、イベント開始日、イベント終了日)を有するので、イベント数を計算する時、年齢/性別条件で抽出されたイベントはイベント数から除外される。したがって、ヒストリテーブル3に記録された患者数は4であり、イベント数は11と計算される。コホート抽出装置100は、各ヒストリテーブルから細部条件種類が年齢/性別(criteria_type=「age」、criteria_type=「gender」)であるイベントを識別し、これを全体イベント数から除外することができる。
【0076】
この方式により、コホート抽出装置100は、段階ごとに各患者のイベントを含むヒストリテーブルを生成するが、ヒストリテーブルにイベント別に条件満足の有無を示すビット列を更新しておく。したがって、コホート抽出装置100は、条件を満足する患者数を検索するたびにSQLクエリを作成する必要がなく、複数のヒストリテーブルを用いて、各段階での患者数およびイベント数を迅速に計算することができる。特に、イベント種類に表示されたビット列により、イベントが抽出された段階およびイベントが条件を満足する段階を迅速に確認することができる。
【0077】
図7は、ヒストリテーブルを用いたコホート再抽出方法を説明する図である。
【0078】
図7を参照すれば、コホート抽出装置100は、コホート生成(entry)条件に対するヒストリテーブル1を最初に生成した後、段階別に入力された条件を用いてヒストリテーブル2、...、ヒストリテーブルnを別途に生成する。
【0079】
以後、研究者が段階k(例えば、段階3)の条件を変更する場合、コホート抽出装置100は、直前段階である段階2のヒストリテーブル2を用いて、段階3の変更された条件に該当する新規ヒストリテーブル3を生成することができる。コホート抽出装置100は、このように再生成された新規ヒストリテーブル3を用いて、段階3後の段階のヒストリテーブルを順次に再生成することができる。
【0080】
このように、研究者が条件を変更しても、変更前のヒストリテーブルをそのまま用い、変更された条件についてのみイベントを抽出すれば良いので、コホート抽出速度が向上できる。
【0081】
図8は、コホート抽出方法のフローチャートである。
【0082】
図8を参照すれば、コホート抽出装置100は、最初段階でコホート生成条件を受信し、臨床データウェアハウス(CDW)からコホート生成条件に該当するイベントを抽出する(S110)。
【0083】
コホート抽出装置100は、抽出したイベントのイベント識別子(訪問識別子、イベント開始日、イベント終了日)、患者識別子、そして最初段階の条件満足を示すビット列を含む最初のヒストリテーブルを生成する(S120)。
【0084】
以後、コホート抽出装置100は、現在段階の条件を受信し、直前段階のヒストリテーブルに含まれている患者の臨床データから、現在段階の条件に該当するイベントを抽出する(S130)。
【0085】
コホート抽出装置100は、直前段階のヒストリテーブルに含まれている患者のうち現在段階の条件に該当するイベントが抽出された現在段階の患者を識別し、直前段階のヒストリテーブルに含まれている現在段階の患者のイベントのビット列を更新し、現在段階で最初に抽出された新規イベントを追加して、現在段階のヒストリテーブルを生成する(S140)。コホート抽出装置100は、直前段階のヒストリテーブルに含まれている患者のうち現在段階の条件に該当するイベントを有さない前段階の患者を識別し、直前段階のヒストリテーブルに格納された前段階の患者のイベントは、現在段階のヒストリテーブルに格納しない。
【0086】
コホート抽出装置100は、現在段階が最終段階なのかを判断する(S150)。コホート抽出装置100は、現在段階が最終段階でなければ、次の抽出段階の条件を受信できる状態で待機する。コホート抽出装置100は、終了またはコホートテーブルの生成が要請されれば、現在段階が最終段階と判断することができる。
【0087】
現在段階が最終段階であれば、コホート抽出装置100は、最終段階のヒストリテーブルを用いてコホートテーブルを生成する(S160)。
【0088】
このように、コホート抽出装置100は、段階別ヒストリテーブルを順次に生成した後、最終段階のヒストリテーブルを用いてコホートテーブルを生成する。
【0089】
図9は、一実施例によるコンピューティング装置のハードウェア構成図である。
【0090】
図9を参照すれば、コホート抽出装置100は、少なくとも1つのプロセッサによって動作するコンピューティング装置で実現できる。
【0091】
コホート抽出装置100は、1つ以上のプロセッサ110と、プロセッサ110によって行われるコンピュータプログラムをロードするメモリ130と、コンピュータプログラムおよび各種データを格納する格納装置150と、通信インターフェース170とを含むことができる。その他にも、コホート抽出装置100は、多様な構成要素をさらに含むことができる。
【0092】
プロセッサ110は、コホート抽出装置100の動作を制御する装置であって、コンピュータプログラムに含まれている命令語を処理する多様な形態のプロセッサであってもよく、例えば、CPU(Central Processing Unit)、MPU(Micro Processor Unit)、MCU(Micro Controller Unit)、GPU(Graphic Processing Unit)、または本開示の技術分野でよく知られた任意の形態のプロセッサの少なくとも1つを含んで構成される。
【0093】
メモリ130は、各種データ、命令および/または情報を格納する。メモリ130は、本開示の動作を実行するように記述された命令語がプロセッサ110によって処理されるように当該コンピュータプログラムを格納装置150からロードすることができる。メモリ130は、例えば、ROM(read only memory)、RAM(random access memory)などであってもよい。
【0094】
格納装置150は、コンピュータプログラム、各種データを非臨時的に格納することができる。格納装置150は、ROM(Read Only Memory)、EPROM(Erasable Programmable ROM)、EEPROM(Electrically Erasable Programmable ROM)、フラッシュメモリなどのような不揮発性メモリ、ハードディスク、着脱型ディスク、または本開示の属する技術分野でよく知られた任意の形態のコンピュータ読取可能な記録媒体を含んで構成される。
【0095】
通信インターフェース170は、有/無線通信を支援する有/無線通信モジュールであってもよい。通信インターフェース170は、臨床データウェアハウス(CDW)20に接続することができる。
【0096】
コンピュータプログラムは、プロセッサ110によって実行される命令語(instructions)を含み、非一時的-コンピュータ読取可能な記憶媒体(non-transitory computer readable storage medium)に格納され、命令語はプロセッサ110が本開示の動作を実行するようにする。コンピュータプログラムは、ネットワークを介してダウンロードされたり、製品形態で販売される。
【0097】
コンピュータプログラムは、コホート生成条件を受信し、臨床データウェアハウス(CDW)からコホート生成条件に該当するイベントを抽出し、抽出したイベントのイベント情報、患者識別子、そして現在段階までの条件満足の有無を示すビット列を含む最初のヒストリテーブルを生成する命令語を含むことができる。そして、コンピュータプログラムは、現在段階の条件を受信し、直前段階のヒストリテーブルに含まれている患者のうち、現在段階の条件に該当するイベントを有する現在段階の患者を識別した後、直前段階のヒストリテーブルに含まれている現在段階の患者のイベントのビット列を更新し、現在段階で抽出されたイベントを新規イベントに追加して、現在段階のヒストリテーブルを生成する命令語を含むことができる。プログラムは、現在段階が最終段階なのかを判断し、現在段階が最終段階であれば、最終段階のヒストリテーブルを用いてコホートテーブルを生成する命令語を含むことができる。コンピュータプログラムは、現在段階が最終段階でなければ、次の抽出段階の条件を受信できる状態で待機する命令語を含むことができる。
【0098】
以上に説明した本開示の実施例は装置および方法によってのみ実現されるものではなく、本開示の実施例の構成に対応する機能を実現するプログラムまたはそのプログラムが記録された記録媒体によって実現されてもよい。
【0099】
以上、本開示の実施例について詳細に説明したが、本開示の権利範囲はこれに限定されるものではなく、以下の特許請求の範囲で定義している本開示の基本概念を利用した当業者の様々な変形および改良形態も本開示の権利範囲に属する。
図1
図2
図3
図4
図5
図6
図7
図8
図9
【国際調査報告】