(19)【発行国】日本国特許庁(JP)
(12)【公報種別】特許公報(B2)
(11)【特許番号】
(24)【登録日】2024-07-26
(45)【発行日】2024-08-05
(54)【発明の名称】機械学習を用いた患者のための薬剤有効性のランク付けの判定
(51)【国際特許分類】
G16H 20/10 20180101AFI20240729BHJP
G16H 70/40 20180101ALI20240729BHJP
【FI】
G16H20/10
G16H70/40
(21)【出願番号】P 2021534373
(86)(22)【出願日】2019-12-06
(86)【国際出願番号】 IB2019060507
(87)【国際公開番号】W WO2020148585
(87)【国際公開日】2020-07-23
【審査請求日】2022-05-26
(32)【優先日】2019-01-15
(33)【優先権主張国・地域又は機関】US
(73)【特許権者】
【識別番号】523223135
【氏名又は名称】メラティヴ ユーエス エル.ピー.
(74)【代理人】
【識別番号】100107766
【氏名又は名称】伊東 忠重
(74)【代理人】
【識別番号】100070150
【氏名又は名称】伊東 忠彦
(74)【代理人】
【識別番号】100135079
【氏名又は名称】宮崎 修
(72)【発明者】
【氏名】エイファート、チェリル、リン
(72)【発明者】
【氏名】シュイ、ジア
(72)【発明者】
【氏名】ヒュットナー、クラウディア
(72)【発明者】
【氏名】ワーン、ファーン
(72)【発明者】
【氏名】ミシェリニ、バネッサ
(72)【発明者】
【氏名】デハン、エリノル
【審査官】鹿谷 真紀
(56)【参考文献】
【文献】特開2013-059665(JP,A)
【文献】米国特許出願公開第2018/0060483(US,A1)
【文献】米国特許出願公開第2011/0230360(US,A1)
(58)【調査した分野】(Int.Cl.,DB名)
G16H 10/00-80/00
(57)【特許請求の範囲】
【請求項1】
薬剤特性を判定するために、少なくとも1つのプロセッサを含むシステムが情報処理によって実行する方法であって、
複数の薬剤についての薬剤投与に関する抽出された情報を分析するステップであって、前記抽出された情報は、自然言語処理モジュールを使用することによって抽出される、ステップと、
各薬剤について、前記抽出された情報から、前記薬剤に対応する複数の属性についての1つ又は複数の薬剤特性を判定するステップであって、前記属性は、前記薬剤がターゲットとする変異又は遺伝子、及び前記変異又は前記遺伝子を含む生物学的経路を含む、ステップと、
複数の薬剤について、共通の構造特徴及び対応する薬剤特性を特定するステップと、
前記複数の薬剤のうちのいずれが毒性と関連付けられるかを特定するステップと、
前記共通の構造特徴及び前記薬剤特性を特定する情報によって訓練されている機械学習モジュールを使用することによって、毒性と関連する前記複数の薬剤の他の薬剤
の薬剤特性を予測するステップと、
前記薬剤がターゲットとする前記変異又は前記遺伝子、及び前記変異又は前記遺伝子を含む前記生物学的経路を含む前記複数の属性について、
毒性、ポテンシー、及びエフィカシーを含む前記予測された薬剤特性に基づいた薬剤有効性スコアにしたがって
前記他の薬剤を含む複数の薬剤をランク付けするステップと、
を含む、
方法。
【請求項2】
前記薬剤特性は、エフィカシー、前記毒性及びポテンシーから成る群から選択される1つ又は複数の薬剤特性である、請求項1に記載の方法。
【請求項3】
前記抽出された情報は、前臨床、臨床及び後臨床情報を含む、請求項1に記載の方法。
【請求項4】
前記抽出された情報で機械学習モジュールを訓練するステップと、
訓練されている前記機械学習モジュールに基づいて、前記複数の薬剤のうちの各薬剤についての1つ又は複数の薬剤特性を予測するステップと、
患者に特有のがんの治療のために前記薬剤をランク付けするステップであって、各薬剤は、前記患者のがんと関連する特定の遺伝子、遺伝子変異、又は生物学的経路をターゲットとし、前記薬剤は、前記予測される薬剤特性に基づいてランク付けされる、ステップと、
を含む、請求項3に記載の方法。
【請求項5】
前記複数の薬剤は、共通のターゲットに基づいてグループに分類され、各グループ内の前記薬剤をランク付けする、請求項1に記載の方法。
【請求項6】
前記属性は、患者についての前記遺伝子、前記変異、又は前記生物学的経路を含む、患者特有の情報を含み、
前記患者の前記遺伝子、前記変異、又は前記生物学的経路をターゲットとする前記複数の薬剤を特定するステップと、
前記薬剤有効性スコアに基づいて、前記患者のための特定された前記薬剤をランク付けするステップと、
をさらに含む、請求項1に記載の方法。
【請求項7】
薬剤特性を判定するためのコンピュータ・システムであって、前記システムは、少なくとも1つのプロセッサを含み、前記少なくとも1つのプロセッサは、
複数の薬剤についての薬剤投与に関する抽出された情報を分析し、前記抽出された情報は、自然言語処理モジュールを使用することによって抽出され、
各薬剤について、前記抽出された情報から、前記薬剤に対応する複数の属性についての1つ又は複数の薬剤特性を判定し、前記属性は、前記薬剤がターゲットにする変異又は遺伝子、及び前記変異又は前記遺伝子を含む生物学的経路を含み、
複数の薬剤について、共通の構造特徴及び対応する薬剤特性を特定し、
前記複数の薬剤のうちのいずれが毒性と関連付けられるかを特定し、
前記共通の構造特徴及び前記薬剤特性を特定する情報によって訓練されている機械学習モジュールを使用することによって、毒性と関連する前記複数の薬剤の他の薬剤
の薬剤特性を予測し、
前記薬剤がターゲットとする前記変異又は前記遺伝子、及び前記変異又は前記遺伝子を含む前記生物学的経路を含む前記複数の属性について、
毒性、ポテンシー、及びエフィカシーを含む前記予測された薬剤特性に基づいた薬剤有効性スコアにしたがって
前記他の薬剤を含む複数の薬剤をランク付けする、
ように構成される、
システム。
【請求項8】
前記薬剤特性は、エフィカシー、前記毒性、及びポテンシーから成る群から選択される1つ又は複数の薬剤特性である、請求項7に記載のシステム。
【請求項9】
前記抽出された情報は、前臨床、臨床及び後臨床情報を含む、請求項7に記載のシステム。
【請求項10】
前記プロセッサは、さらに、
前記抽出された情報で機械学習モジュールを訓練し、
訓練された前記機械学習モジュールに基づいて前記複数の薬剤の各薬剤についての1つ又は複数の薬剤特性を予測し、
患者に特有のがんの治療のために前記薬剤をランク付けする、ように構成され、各薬剤は、前記患者のがんと関連する特定の遺伝子、遺伝子変異、又は生物学的経路をターゲットとし、前記薬剤は、前記予測される薬剤特性に基づいてランク付けされる、
請求項9に記載のシステム。
【請求項11】
前記複数の薬剤は、共通のターゲットに基づいてグループに分類され、前記プロセッサは、さらに、各グループ内に前記薬剤をランク付けするように構成される、請求項7に記載のシステム。
【請求項12】
前記属性は、患者についての前記遺伝子、前記変異、又は前記生物学的経路を含む、患者特有の情報を含み、前記プロセッサは、さらに、
前記患者の前記遺伝子、遺伝子変異、又は生物学的経路をターゲットとする前記複数の薬剤を特定し、
前記薬剤有効性スコアに基づいて前記患者のための特定された前記薬剤をランク付けする、
ように構成される、請求項7に記載のシステム。
【請求項13】
少なくとも1つのプロセッサを含むシステムに請求項1乃至6のうちのいずれか1項に記載の方法を実行させる、コンピュータプログラム。
【請求項14】
請求項13に記載のコンピュータプログラムを格納する、コンピュータ読み取り可能な記憶媒体。
【発明の詳細な説明】
【技術分野】
【0001】
本発明の実施形態は、薬剤の有効性(drug effectiveness)に関し、より具体的には、機械学習を用いて薬剤情報を分析し、患者のための薬剤有効性のランク付けを生成し、薬剤投与に関連したコンテンツをインテリジェントに検索して抽出することに関する。
【背景技術】
【0002】
データベース及び論文リポジトリは、多くの場合、様々なタイプの情報の文書の大規模コーパスを含む。例えば、ユーザは、異なるタイプの査読付き科学及び臨床文書についてのNCBIのPubMed(登録商標)データベースを検索することがある。HER-2陽性乳がんなどの一般的なゲノム変化が引き金になる病気をもつ患者を治療するために、多数の薬剤が潜在的に利用可能であり得る。しかしながら、これらの個々の薬剤の各々のエフィカシー(efficacy)及びポテンシー(potency)が、患者によって著しく異なることが多い。
【0003】
臨床及び実験情報を網羅する利用可能な種々のデータベースがあるが、これらのデータベースは、医薬品及び生物製剤に関する専門的情報を適切に網羅するものではない。幾つかのシステムは、抗がん治療に合わせて調整され、承認薬及び治験薬を網羅するが、これらのシステムは、薬剤のエフィカシー、ポテンシー、及び薬剤投与に関連する他の側面に関する特定の専門的情報を提供しない。
【0004】
さらに、PubMed(登録商標)内の完全版の(full-length)研究文書へのアクセスは、多くの場合、組織のライセンス契約が実施され、雑誌の出版社、又は別の形態の支払いがサブミットされて完全版の文書への権利を獲得した場合にのみ与えられる。データの正確さを保証するために、ユーザは、文書の結果セクション内の数字、グラフ、表及びテキストを評価できなくてはならない。場合によっては、コンテンツ・リポジトリは、完全なコンテンツにアクセスするためのインテリジェントな方法がなく何百万もの文書を保持することがある。
【0005】
コンテンツ・リポジトリは、医薬品及び生物製剤のエフィカシー及び他の特徴に関する特定のコンテンツ検索のためのユーザ・インターフェースを提供しない。従って、関連情報が見落とされることが多く、患者を、最適な薬剤又はその組み合わせとマッチングすることができない。
【発明の概要】
【0006】
本発明の実施形態によると、コンテンツ・リポジトリ内の種々のタイプの医薬情報にインテリジェントにアクセスし、遺伝子変異レベル、遺伝子レベル及び生物学的経路レベルで薬剤をランク付けするための方法、システム及びコンピュータ可読媒体が提供される。場合によっては、薬剤特性を含む前臨床、臨床又は後臨床エビデンスに基づいて、同じ遺伝子/生物学的経路をターゲットとする薬剤をランク付けすることができる。
【0007】
複数の薬剤について、薬剤特性に関する抽出された情報を分析する。各薬剤について、毒性、ポテンシーもしくはエフィカシー又はそれらの組み合わせを含む1つ又は複数の薬剤特性を判断する。薬剤は、薬剤がターゲットとする変異又は遺伝子、及びターゲットとされた変異又は遺伝子を含む生物学的経路を含む複数の属性と関連付けられる。薬剤特性に基づいた薬剤有効性スコアに従って、複数の薬剤をランク付けする。この手法は、臨床エビデンスに依存し、薬剤特性を突き止め、指定されたターゲットのための薬剤の最適な又は有効なランク付けを与える。
【0008】
幾つかの態様において、薬剤特性は、エフィカシー、毒性及びポテンシーを含む薬剤の性能又は有効性を評価するために用いられる任意のパラメータを含むことができる。本技術は、ポテンシー及びエフィカシーが高く、毒性が低い薬剤を特定し、患者への投与のために優先順位を付けることを可能にする。任意の適切な薬剤特性を用いて薬剤を特定し、ランク付けすることができるので、薬剤特性は、ポテンシー、エフィカシー、及び毒性に限定されない。
【0009】
別の実施形態において、抽出された情報は、前臨床、臨床及び後臨床情報を含み、そこから薬剤特性が抽出される。従って、本技術は、臨床文献からのエビデンスを利用する。この情報を用いて、機械学習モジュールのための訓練データセットを作成し、文献においてそうした特性が利用可能でない他の薬剤の薬剤特性を予測することができる。
【0010】
他の態様において、機械学習モジュールを、抽出された情報から生成された訓練データセットで訓練することができる。訓練データセット内にはない薬剤の場合、訓練された機械学習モジュールによって、複数の薬剤の各々の薬剤についての1つ又は複数の薬剤特性を予測することができる。患者特有のがんの治療のために、薬剤をランク付けすることができ、そこで、各薬剤は、患者のがんと関連した特定の遺伝子、遺伝子変異、又は生物学的経路をターゲットとし、ランク付けは、薬剤有効性スコアに従って予測された薬剤特性に基づく。従って、本技術は、特定の患者のための薬剤のランク付け情報を提供する。
【0011】
他の態様において、複数の薬剤について共通の構造特徴及び毒性を含む対応する薬剤特性を特定することができる。共通の構造特徴及び対応する薬剤を特定する情報で訓練された機械学習モジュールを用いて、他の薬剤を毒性と関連すると又は関連しないと予測することができる。同様に、機械学習モジュールによって毒性のリスクが高い薬剤を分析し、毒性と関連した化学構造を予測することができる。本技術は毒性を予測し、その結果を用いて、毒性のリスクが低い最適な薬剤、及び他の望ましくない副作用を予測することができる。
【0012】
他の態様において、共通のターゲットに基づいて複数の薬剤をグループに分類することができ、各グループ内の薬剤をランク付けすることができる。従って、特定のターゲット(及び特定の患者)のための最適な薬剤を有効な方法で特定することができる。
【0013】
他の態様において、薬剤属性は、患者の遺伝子、遺伝子変異、又は生物学的経路を示す患者特有の情報を含み、患者の遺伝子、遺伝子変異、又は生物学的経路を特定することをさらに含む。特定された薬剤は、薬剤特性に基づいた薬剤有効性スコアに従ってランク付けすることができる。従って、薬剤は、患者特有の方法で、薬剤有効性スコアに従った属性及び薬剤特性に基づいてランク付けすることができる。
【0014】
この概要は、本開示の実施形態の重要な又は本質的な特徴を特定することを意図するものではなく、本開示の範囲を限定するために使用されることを意図するものでもないことを理解されたい。本開示の他の特徴は、以下の説明を通じて容易に理解可能になるであろう。
【図面の簡単な説明】
【0015】
一般に、種々の図面における同様の参照番号は、同様のコンポーネントを示すために利用される。
【0016】
【
図1】本開示の実施形態による、薬剤ランク付けシステムについての例示的なコンピューティング環境のブロック図である。
【
図2】本開示の実施形態による、薬剤有効性スコアに基づいて薬剤をランク付けする方法の例示的なフローチャートである。
【
図3】本開示の実施形態による、異なるタイプのオミックス・データの例を示す図である。
【
図4】本開示の実施形態による、がんに特有の異なる生物学的経路の例を示す図である。
【
図5】本開示の実施形態による、異なる薬剤プロファイルの例を示す図である。
【
図6】本開示の実施形態による、薬剤特性に基づいて薬剤をランク付けする例示的なフローチャートを示す図である。
【
図7】本開示の実施形態による、薬剤をランク付けする方法を示す高レベルフロー図である。
【発明を実施するための形態】
【0017】
個人化されたがん医学では、患者からの発がん突然変異を、ターゲットとされた適切な薬剤療法とマッチングすることを要する。薬剤(例えば、医薬品、生物調剤など)は、前臨床、臨床、又は後臨床研究における任意の適切な療法を含み得る。本明細書では、特定の患者のために、薬剤特性に基づいた薬剤有効性スコアに従って薬剤をランク付けするための方法、システム及びコンピュータ可読媒体が提供される。
【0018】
前臨床、臨床、又は承認された薬剤に関する文書にアクセス及び分析し、ある種のがんなど、特定の病気についての薬剤、遺伝子、遺伝子変異、及び生物学的経路の間の関係を判定することができる。ユーザ・インターフェースは、文書管理ポータル内に設けることができ、ユーザが、特定のタイプのがんに対する薬剤のエフィカシー又は他の薬剤特性(例えば、薬剤のポテンシー、薬剤の毒性など)に関するデータベースに問い合わせすることを可能にする。
【0019】
これを達成するために、臨床情報から、薬剤投与に関連するエビデンス(例えば、エフィカシー、ポテンシー、毒性、二次的効果(オフターゲット効果(off target effect)など)、IC50、ED50など)を抽出することができる。ひとたび関連情報が抽出されると、遺伝子レベル、遺伝子変異レベル、又は生物学的経路レベルにおいてエフィカシー及び他の特性(例えば、毒性、ポテンシーなど)に関して、機械学習システムにより薬剤及びその対応する特性を分析し、特定の発がん突然変異のための最適な薬剤を判定することができる。がんなどの特定のタイプの病気の特定の患者のために、薬剤をランク付けすることができる。
【0020】
本発明の実施形態と共に使用される例示的な環境100が、
図1に示される。具体的には、この環境は、1つ又は複数のサーバ・システム10と、1又は複数のクライアント又はエンドユーザ・システム20とを含む。サーバ・システム10及びクライアント・システム20は、互いに遠隔にあり、ネットワーク35上で通信することができる。ネットワークは、任意の数のいずれかの適切な通信媒体(例えば、広域ネットワーク(WAN)、ローカル・エリア・ネットワーク(LAN)、インターネット、イントラネットなど)によって実装することができる。或いは、サーバ・システム10及びクライアント・システム20は、互いにローカルにあり、いずれかの適切なローカル通信媒体(例えば、ローカル・エリア・ネットワーク(LAN)、配線、無線リンク、イントラネットなど)を介して通信することもできる。
【0021】
クライアント・システム20は、ユーザが、分析及び検討のために、サーバ・システム10からの文書及び情報(例えば、臨床文書、抽出された文献データ、抽出されたオミックス・データ、薬剤ランク付け情報、患者特有の情報、生物学的経路など)にアクセスするのを可能にする。サーバ・システムは、特定の患者のための薬剤を選択し優先順位付けするために薬剤をランク付けするための薬剤ランク付けシステムを含むことができる。
【0022】
データベース・システム40は、分析のための種々の情報(例えば、抽出されたオミックス・データ41、抽出された文献データ42、患者特有のデータ43、薬剤ランク付けデータ44など)を格納することができる。データベース・システムは、いずれかの従来の又は他のデータベースもしくはストレージ・ユニットによって実装することができ、サーバ・システム10及びクライアント・システム20に対してローカルであっても又はこれらから遠隔であってもよく、いずれか適切な通信媒体(例えば、ローカル・エリア・ネットワーク(LAN)、広域ネットワーク(WAN)、インターネット、配線、無線リンク、イントラネットなど)を介して通信することができる。クライアント・システムは、所望の文書及び薬剤分析に関するユーザからの情報を求めるために、グラフィカル・ユーザ(例えば、GUIなど)又は他のインターフェース(例えば、コマンド・ライン・プロンプト、メニュー画面など)を提示することができ、分析結果(例えば、薬剤のエフィカシー、薬剤のランク付け、薬剤の毒性、薬剤のポテンシー、ED50、IC50、薬剤の生物学的ターゲット(例えば、遺伝子、遺伝子変異、タンパク質、他の細胞内ターゲット)、生物学的経路、オフターゲット効果などの二次的効果)を含むレポートを提供することができる。
【0023】
サーバ・システム10及びクライアント・システム20は、好ましくはディスプレイ又はモニタ26、基部(例えば、少なくとも1つのプロセッサ16、22、1つ又は複数のメモリ17、23、及び/又は内部もしくは外部ネットワーク・インターフェースもしくは通信デバイス18、24(例えば、モデム、ネットワーク・カードなど)を含む)、随意的な入力デバイス(例えば、キーボード、マウス、又は他の入力デバイス)、及び/又はユーザ・インターフェース19、25、並びにいずれかの市販及びカスタム・ソフトウェア(例えば、サーバ/通信ソフトウェア、薬剤ランク付けシステム15、ブラウザ/インターフェース・ソフトウェアなど)を備えた、任意の従来の又は他のコンピュータ・システムによって実装することができる。
【0024】
代替的に、1つ又は複数のクライアント・システム20は、独立型ユニットとして動作するとき、文書を分析し、薬剤のランク付けを判定することができる。独立動作モードにおいて、クライアント・システムは、抽出されたオミックス・データ41、抽出された文献データ42、患者特有のデータ43、及び薬剤ランク付けデータ44、並びに薬剤ランク付けシステム15を格納するか、又はこれらへのアクセスを有する。グラフィカル・ユーザ(例えば、GUIなど)又は他のユーザ・インターフェース(例えば、コマンド・ライン・プロンプト、メニュー画面など)は、薬剤ランク付けに関する対応するユーザからの情報を求め、分析結果及び薬剤ランク付け(例えば、薬剤のランク付け、薬剤のエフィカシー、薬剤の毒性、薬剤のポテンシー、IC50、ED50、薬剤の生物学的ターゲット(遺伝子、遺伝子変異、他の細胞内ターゲット)、生物学的経路、オフターゲット効果などの二次的効果など)を含むレポートを提供することができる。
【0025】
抽出されたオミックス・データ41及び抽出された文献データ42は、患者の病気の存在を示し得るデータベースもしくは文献又はその両方からの抽出された情報を含むことができる。例えば、抽出された文献データは、対応する発現タンパク質、転写産物又は他の関連分子、生物学的経路、薬剤ターゲット、毒性、ポテンシー、エフィカシー、二次的効果、IC50、ED50などと共に、病気と関連した遺伝子及び遺伝子変異を含むことができる。文献文書は、機械読取装置によって読み取り可能であると仮定される。幾つかの態様において、光学式文字認識を用いて文書内のテキストを認識し、テキストを読み取り可能及び検索可能にすることができる。さらに、表内のテキスト、画像、画像の説明又はリストを機械可読にすることもできる。この処理は、例えば、走査したPDFなどの文書の画像が分析に含まれることを保証する。
【0026】
文献データは、データベース、科学文献、及び臨床及び前臨床文献、並びに臨床試験中又は規制機関により承認されている特定の薬剤の生物学的ターゲットに関連する関連情報の任意の他のソースからのデータを含むことができる。場合によっては、この情報は、経路の特定の生体分子との薬剤相互作用(例えば、薬剤が生体分子に結合し、生物学的経路を抑制し、生態学的経路を活性化するエビデンス、二次ターゲットとの相互作用を含むオフターゲット効果、有害な作用、他の薬との禁忌など)を含む。これにより、生物学的ターゲットを生物学的経路と関連付けること、並びに薬剤のエフィカシー及び特異性を研究するためのフレームワークを設定することが可能になる。
【0027】
幾つかの態様において、病気は、乳、肺、膵臓、卵巣、前立腺などのがんのタイプを含み得る。幾つかの態様において、薬剤用語抽出器により抽出される関連用語を提供することができ(例えば、主題専門家によって)、検索用語は、遺伝子、遺伝子の同義語、遺伝子変異、遺伝子変異の同義語、薬剤、薬剤の同義語、病気、病気の同義語又はがんのタイプ、及びがんタイプ名の同義語を含む。
【0028】
抽出されたオミックス・データ41は、患者の集団についての、病気、病気と関連したRNA翻訳レベル、病気と関連するタンパク質発現レベルなどに関する情報を含むことができる。場合によっては、データをグループ化して、患者の集団の共通の特徴に基づいてコホートを形成することができる。
【0029】
患者特有のデータ43は、特定の患者についての他の病歴データ(例えば、薬剤アレルギー、年齢、病状、禁忌に対する評価のための他の薬物)と共に、患者に特有のオミックス・データ(患者の集団からのデータではなく)を含むことができる。
【0030】
薬剤ランク付けデータ44は、がんのタイプなどの特定の病気に対する薬剤のリストのランク付けを含むことができる。場合によっては、ランク付けは、特定の患者についての特定の情報ではなく、患者の集団を反映することがある。他の場合には、ランク付けは、患者特有の発がん突然変異、薬剤アレルギー、その患者に適用できる他の薬物からの禁忌などを考慮して、特定の患者に特有であるように改良することができる。
【0031】
薬剤ランク付けシステム15は、本明細書に説明される本発明の実施形態の種々の機能を実行するための1つ又は複数のモジュール又はユニットを含むことができる。種々のモジュール(例えば、薬剤用語抽出器71、オミックス抽出器72、機械学習モジュール73、生物学的経路モジュール74、薬剤ランク付けモジュール75など)は、任意の量のソフトウェア及び/又はハードウェア・モジュール又はユニットのいずれかの組み合わせによって実装することができ、プロセッサ16、22による実行のために、サーバ・システムもしくはクライアント・システム又はその両方のメモリ17、23内に常駐することができる。
【0032】
薬剤用語抽出器71は、(例えば、臨床情報などを包含する情報を含む科学又は臨床出版物、及び/又は生物学的経路の特定の治療ターゲットのための特定の薬剤に関する情報を特定するためのデータベースなど)機械可読形式の文献を解析する。場合によっては、薬剤用語抽出器71は、遺伝子/遺伝子変異名、タンパク質名、薬剤名、生物学的ターゲット、薬剤の特性(例えば、エフィカシー、ポテンシー、毒性、二次的効果、IC50、ED50など)、並びにこれらの同義語を特定するように構成できる自然言語処理(NLP)モジュール76を含むことができる。NLPベースのツールは、遺伝子変化、遺伝子変異変化、遺伝子経路変化に基づいて、薬剤特性に関連するエビデンスを半自動的に抽出することができる。これらの薬剤は、遺伝子レベル、遺伝子変異レベルもしくは生物学的経路レベル又はそれらの組み合わせで、その特性に関してランク付けすることができる。
【0033】
幾つかの態様において、薬剤用語抽出器71は、(生体外(in vitro)研究だけでなく)前臨床、臨床、及び後臨床研究からのデータに依存し、薬剤を、規制機関によって承認されたもの又は臨床試験から入手可能な他のものに限定する。多くの場合、薬剤の機序は既知である。
【0034】
さらに、薬剤用語抽出器71により遺伝子名同義語、遺伝子変異名同義語、薬剤名同義語、及びがんタイプ名同義語を特定し、共通の名前にリンクし、この分析に含ませることができる。
【0035】
場合によっては、システムは、FDAにより承認されている又は臨床試験中の薬剤名(及び同義語)のリストを備えることができる。例えば、システムは、文献から関連情報を特定し抽出するために、薬剤などに関する商品名、一般名、構造名、もしくは(例えば、薬剤のデータベースからの)参照ID又はそれらの組み合わせなどを備えることができる。幾つかの態様において、薬剤用語抽出器71は、任意の適切な情報を抽出し、これらに限定されるものではないが、エフィカシー、毒性、ポテンシーなど、臨床試験の成功に関する用語、臨床試験の失敗に関する用語、臨床試験の回数、臨床試験の段階、薬剤の副作用、薬剤の相互作用、薬剤の構造などを含む抗がん剤の特性を判定することができる。場合によっては、薬剤用語抽出器71によって、生物学的ターゲット(例えば、タンパク質、細胞表面ターゲット、細胞ターゲット、細胞内ターゲット、細胞外ターゲットなど)に関する用語を抽出することもでき、他の場合には、主題専門家によって、生物学的ターゲットに関する情報を提供することができる。
【0036】
臨床文書(例えば、前臨床、臨床及び後臨床文書、並びにデータベース)を特定し、関連情報の抽出を自動化することができる。場合によっては、抽出された情報は、主題専門家(例えば、特定のタイプのがんに関する)によってキュレートすることができる。実験/研究論文、創薬論文、前臨床論文、臨床論文、後臨床論文などを含む、いずれかの適切なソースを用いることができる。
【0037】
各薬剤について、薬剤名(一般名及び同義語を含む)、遺伝子/タンパク質、又は薬剤の他の生物学的ターゲット(一次ターゲット)、薬剤の毒性、オフターゲット効果(薬剤が結合する二次ターゲット)、薬剤の構造、ポテンシー、ED50、IC50、有害な事象、患者特有の情報、薬剤のエフィカシーなどを含むがこれらに限定されない、種々の異なるタイプの薬剤関連情報を抽出することができる。オフターゲット効果は、一次ターゲットと比べて親和性が低い二次ターゲットに結合する薬剤を指すことができ、薬剤の毒性プロファイルに悪影響を与え得る生物学的効果をもたらし得る。
【0038】
場合によっては、抽出される情報は、分析のためにがんタイプに従って、年齢幅に従って、性別に従って、生物学的経路に従って、遺伝子/遺伝子変異、又は特定の患者と比べてデータのコホートを生成するのに適した他のいずれかのカテゴリに従って編成することができる。抽出される情報は、構造化テキスト又は非構造化テキスト、又はその組み合わせとして格納することができる。
【0039】
オミックス抽出器72は、ゲノミクス、エピゲノミクス、トランスクリプトミクス、プロテオミクス、メタボロミクスなどの研究を含む、種々のデータベース(例えば、公開、私的など)からのデータ含むオミックス・データにアクセスすることができる。オミックス抽出器72は、各タイプの生物学データを抽出するように調整された1つ又は複数の抽出器を含むことができる。例えば、ゲノム/エピゲノム抽出器は、遺伝子、遺伝子変異、並びにがんに関連するゲノム変化及び変異を含むゲノム/エピゲノム・データを抽出し分析することができる。トランスクリプトミクス抽出器は、がんの生体サンプル中のRNA発現プロファイル(例えば、発現上昇(overexpressed)、発現低下(under expressed)、又は非がん性制御に類似した発現を示すRNAプロファイルを分析するために)抽出し分析することができる。プロテオミクス抽出器は、がん性生体サンプル中のタンパク質発現プロファイル(例えば、過剰発現、発現未満、又は非がん性制御と比べてほぼ同じタンパク質)を抽出し分析することができる。同様に、メタボロミクス抽出器は、がん性生体サンプル中の代謝データを抽出し分析することができる。生物学データは、シークエンシング・データ、ハイブリダイゼーション・マイクロアレイ、転写マイクロアレイ、発現マイクロアレイ、代謝マイクロアレイなどを含むいずれかの適切なフォーマットを含むことができる。
【0040】
機械学習モジュール73は、抽出されたデータを訓練し、薬剤と生物学的ターゲットとの間の新しい関係を特定し、毒性効果などにリンクされた遺伝子/遺伝子変異、タンパク質/タンパク質変異との相互作用を含む、オフターゲット効果などの毒性の原因を特定することができる。機械学習モジュール73は、構造、毒性、生物学的ターゲット、ポテンシー、エフィカシー及びオフターゲット効果などを含む既知の薬剤についての情報を含む訓練データを備えることができる。機械学習モジュールは、分析される薬剤について、これらの特徴(例えば、毒性、生物学的ターゲット、ポテンシー、エフィカシー及びオフターゲット効果など)のいずれかを予測することができる。
【0041】
機械学習モジュール73は、これらに限定されるものではないが、統計的分類、教師あり学習、教師なし学習、人工ニューラル・ネットワーク、深層学習ニューラル・ネットワーク、クラスタ分析、ランダム・フォレスト、次元削減、二項分類、決定木などを含むいずれかの適切な機械学習技術を用いて、これらに限定されるものではないが、薬剤についての毒性、生物学的ターゲット、ポテンシー、エフィカシー、及びオフターゲットを含む種々の特徴を予測することができる。
【0042】
生物学的経路モジュール74は、薬剤用語抽出器71もしくはオミックス抽出器72又はその両方からの情報を生物学的経路にマッピングする。例えば、ある薬剤は第1のターゲット(一次ターゲット)と相互作用することが既知であり、ターゲットは、オミックス・データセットと関連した遺伝子、遺伝子変異、転写産物、タンパク質、代謝産物などであり得る。生物学的経路モジュール74は、第1のターゲットを第1の生物学的経路にマッピングすることができる。
【0043】
場合によっては、生物学的経路モジュール74は、二次的効果(オフターゲット)を生物学的経路にマッピングすることができる。これを、複数の薬剤について繰り返すことができ、複数の薬剤からの二次的効果を1つ又は複数の生物学的経路にマッピングすることを可能にする。生物学的経路は、予め定められた遺伝子群に基づいて判定することができる。場合によっては、生物学的経路は、毒性と関連付けられ得る。これらの経路と相互作用する薬剤は、主効果又は二次的効果を通じて、これらの経路と相互作用しない薬剤よりも低くランク付けされ得る。従って、生物学的経路は、患者の特定の変異に適した薬剤を決定することができるだけでなく、毒性に関連した経路と相互作用しない薬剤に優先順位付けするために使用することもできる。
【0044】
薬剤ランク付けモジュール75は、生物学的経路モジュール74、薬剤用語抽出器71、機械学習モジュール73もしくはオミックス抽出器72又はそれらの組み合わせからの入力、並びに患者特有のデータ43を受け入れることができる。特定の患者に適した薬剤のセットを薬剤ランク付けモジュール75に提供することができ、モジュールは、より高いランク付けをもたらす有効性の肯定的要因(例えば、良好なエフィカシー、高いポテンシー(例えば、nM又はpMの範囲)、既知の二次的ターゲットの不存在、低い毒性など)、又は低いランク付けをもたらす有効性の否定的要因(例えば、限定的なエフィカシー、低いポテンシー、複数の二次的ターゲット、高い毒性など)に基づいて、薬剤をランク付けすることができる。患者特有のデータに基づいて、関連する生物学的経路をターゲットにする薬剤を特定することができ、薬剤の特性に関する抽出された情報を用いて、オミックス及び他のデータ(例えば、腫瘍タイプ、腫瘍変異、診療データ、病歴など)に基づいて、特定の患者のための薬剤をランク付けすることができる。受け取った情報に基づいて、薬剤ランク付けモジュールは、特定の患者のための薬剤のセットをランク付けし、それを薬剤ランク付けデータ44に格納することができる。
【0045】
本技術は、薬剤の相互作用、エフィカシー及び他の特性に関する高い粒度を提供し、特定の患者のために最適な治療を特定するように調整することができる。
【0046】
図2は、薬剤ランク付けを判定するための例示的動作のフローチャートである。動作210において、臨床文献から、薬剤情報が抽出される。薬剤情報は、これらに限定されるものではないが、一次ターゲット、エフィカシー、毒性、副作用、ポテンシー、ED50、IC50などを含むことができる。動作220において、薬剤は、がんのタイプ、遺伝子変異、もしくは潜在的に他の患者特有の要因又はそれらの組み合わせによって随意的にグループ化される。動作230において、機械学習モジュールは、抽出された薬剤情報を訓練し、文献から抽出された特性を欠いている他の薬剤について、ポテンシー、エフィカシー、主効果、生物学的ターゲット、毒性、二次的効果(オフターゲット効果)などを予測する。場合によっては、機械学習モジュールは、抗がん剤が、時間の経過とともに、患者が二次疾患又はがんを発症するリスクと関連付けられるかどうかを予測することができる。動作240において、薬剤ベースの生物学的ターゲット情報(抽出された薬剤情報から取得された)が、生物学的経路にマッピングされる。
【0047】
動作250において、例えば、患者のがんのタイプ、及び1つ又は複数のタイプのオミックス情報を示す患者特有のオミック・データを取得し、このオミック・データは、ゲノム配列(例えば、がんと関連した突然変異、がんと関連した特定のドライバ遺伝子の存在、遺伝子、遺伝子変異など)、RNA発現レベル(例えば、がんに関連した特定の転写産物を含む)、タンパク質発現レベル(例えば、がんに関連した1又は複数のバイオマーカ、過剰発現もしくは発現未満又はそれらの組み合わせなど)を含むことができる。幾つかの態様において、オミックス・データは、オミックス・サービス・プロバイダ(例えば、遺伝子翻訳、タンパク質発現などを評価するために、ゲノム・シークエンシングを実行する、及び/又はマイクロアレイ分析もしくは他のサービスを提供する企業)によって分析し提供することができる。レポートを、そのレポートの結果に関する患者又は医療提供者に提供し、ゲノム変異、遺伝子変異、又はがんと関連した特定のタンパク質/転写産物を特定することができる。
【0048】
動作260において、患者特有のオミックス・データが生物学的経路にマッピングされる。例えば、患者特有のデータが生物学的経路の特定のタンパク質又は遺伝子の変異を示す場合、システムは、生物学的経路におけるタンパク質又は遺伝子の存在を特定する。ひとたびターゲットが既知になると、薬剤ランク付けシステムは、どの薬剤が最も投与に適しているかを判定することができる。場合によっては、薬剤を生物学的経路にマッピングすることができる(例えば、どの薬剤が患者特有の変異を含む生物学的経路に作用するかを判定するために)。二次的効果を生物学的経路にマッピングすることもできる。場合によっては、二次的効果(オフターゲット結合)を、毒性又は他の望ましくない薬剤特性と関連付けることができる。毒性と関連付けられる生物学的経路を特定し、これを用いて、これらの特定された経路との相互作用に基づいて、毒性問題を有し得る他の薬剤を特定することができる。動作270において、機械学習モジュールは、抽出された薬剤情報を訓練し、薬剤特性を予測するために使用される。動作280において、複数の薬剤(又はその組み合わせ)が、患者のオミックス情報及びがんのタイプに関連する特定のがん経路をターゲットとするために、薬剤有効性スコアに基づいてランク付けされる。薬剤有効性スコアは、種々の薬剤特性(例えば、エフィカシー、毒性、ポテンシーなど)の重み付けされた組み合わせを示すことができる。
【0049】
図3は、これらに限定されるものではないが、ゲノミクス、エピゲノミクス、トランスクリプトミクス、プロテオミクス、メタボロミクスなどの研究からのデータを含み得るオミックス・データを示す。幾つかの態様において、オミックス・データは、出版物、配列、マイクロアレイ分析からの発現又は転写レベル、オミックス研究の他の結果などを含み得る公的に入手可能なデータベースから取得することができる。オミックス・データは、患者の集団からのデータを含むことができ、抽出して、抽出されたオミックス・データ41内に格納することができる。
【0050】
これらのカテゴリの各々について、データを分析して、種々のがんに関連したターゲットを特定することができる。例えば、ゲノム/エピゲノム・データを分析して、がんと関連した遺伝子及び変異、並びに、がんの発症及び病因に関与する分子の転写及び発現レベルを特定することができる。特定のタイプのがんは、生物学的経路と関連した特定の転写又は発現プロファイルを有し得る。この情報を生物学的経路にマッピングし、発がん突然変異及び他の発がん因子を示すことができる。
【0051】
このように、オミックス抽出器72は、個々の集団についての特定のタイプのがんと関連した特定の情報(例えば、突然変異、転写プロファイル、発現プロファイルなど)を特定することができる。この情報は、抽出されたオミックス・データ41として格納することができる。
【0052】
患者特有の情報(例えば、患者特有のデータ43)がシステムに提供されると、マッピングされた集団ベースのオミックス情報からのがん関連情報を有する生物学的経路を用いて、特定の患者と関連した特定の生物学的ターゲットもしくは経路又はその両方に対する潜在的な薬剤ターゲットを特定することができる。患者特有のデータ43は、ゲノム情報、トランスクリプトミクス情報、プロテオミクス情報、代謝情報など、又は特定の患者に関するいずれかの他の適切な薬理又は実験情報を含むことができる。この手法に基づいて、特定の生物学的ターゲットもしくは経路又はその両方を、患者のための潜在的な薬剤ターゲットとして特定することができる。
【0053】
図4は、種々の生物学的経路を示す。この例では、経路は、細胞運動性、細胞成長、細胞生存性、並びに細胞分化及び細胞増殖抑制を含むカテゴリに従って配列されるように示される。ノードは、特定の生物学的/化学構造を有する経路内の種々のエンティティ(例えば、タンパク質、化学分子など)を表す。黒い矢印は、生物学的経路のノード間の相互接続性を示す。この例では、外円は細胞の輪郭を表し、内円は核の輪郭を表す。
【0054】
細胞外に、細胞膜に、細胞質レベルの細胞内に、並びに遺伝子発現を制御する核内になど種々の方法で、種々の生物学的経路をターゲットにすることができる。
【0055】
例示的な生物学的ターゲットが、薬剤の種々の潜在的な生物学的ターゲットに対応する、白丸として示される。ターゲット1(数字1を含む丸)は、既知の二次的相互作用のない薬剤ターゲット(例えば、特定の薬剤に対する)に対応する。ターゲット2(数字2を含む丸)は、別の薬剤ターゲットに対応する。ターゲット3及び4は、毒性と関連したさらに他の薬剤の二次ターゲットを表す。
【0056】
細胞成長カテゴリにおいて、ターゲット3、4は、同じ生物学的経路に沿って存在し、そのどちらも二次ターゲットを示し、薬剤の毒性と関連付けられる。この場合、薬剤ランク付けモジュールは、この同じ生物学的経路に沿った何れのターゲット2も毒性と関連付けられるとみなし、従って、この経路に沿った薬剤を、他の無毒の経路内の薬剤よりも優先させることなない。
【0057】
さらに、同じ遺伝子、同じ遺伝子変異、又は同じ生物学的経路をターゲットにする薬剤をグループ化し、カテゴリに対する各薬剤についての対応するエフィカシー、毒性、副作用、ポテンシー、ED50、及びIC50を判定することができる。場合によっては、異なる特性を有する異なる薬剤によって、単一のがん遺伝子をターゲットにすることもできる。薬剤ランク付けシステムは、特定の薬剤もしくは患者特有のオミックス・プロファイル又はその両方に基づいて、患者特有の方法で薬剤をランク付けすることができる。
【0058】
図5は、複数の薬剤を分析し、薬剤とそのターゲットとの間の新しいパターン及び関係を発見する例を示す。例えば、第1の薬剤(薬剤1のプロファイル)及び第2の薬剤(薬剤2のプロファイル)を、同じ生物学的ターゲット(遺伝子X又はタンパク質Z)に結合することができる。第1の薬剤の毒性は不明であるが、機械学習モジュールを用いて、抽出された情報に基づいて導き出すことができる。
【0059】
薬剤の特性を判定するために、機械学習モジュールを用いることができる。訓練データを、薬剤プロファイルとして機械学習モジュールに提供することができる。ひとたび訓練されると、機械学習システムは、毒性不明の薬剤1が中毒性副作用を有し得るかどうかを判定することができる。この場合、機械学習システムは、毒性を二次生物学的ターゲットにリンクする複数の薬剤プロファイルを訓練することができる。この情報から、機械学習モジュールは、二次生物学的ターゲットに結合する薬剤1も中毒性副作用を有する可能性が高いと判定し得る。従って、この例では、第1の薬剤が、望ましくない副作用である毒性にリンクされた二次生物学的ターゲットと関連付けられるので、特定のタイプのがんを治療するための患者への投与のために薬剤2を選択することができる。
【0060】
別の例として、毒性について、複数の薬剤のプロファイルを評価することができる。閾値を上回る毒性を有する薬剤を一緒にグループ化することができ、毒性にリンクされる共通の特徴について、薬剤を評価することができる。例えば、薬剤群が毒性と関連した遺伝子又はタンパク質と相互作用する(二次的効果)場合、全ての薬剤に共通し得る共通の構造上の特徴(例えば、特定の側鎖、複素環基などの存在)について、薬剤群を評価することができる。
図5において、薬剤3は、毒性をもつとして知られる複数の他の薬剤に共通する特徴である側鎖A1が存在するため、毒性を有する可能性が高いとしてフラグ付けすることができる。さらに、これらの同じ特徴を有する新しい薬剤を、毒性についてフラグ付けすることができる。患者への投与のために、毒素と関連していない薬剤を選択することができる。
【0061】
更に別の例として、相乗効果又は相乗効果の欠如について、遺伝子群を評価することができる。オフターゲット効果を介して第1の遺伝子群と相互作用する薬剤(例えば、A、R、Y遺伝子と相互作用→相乗効果を示し、毒性をもたない)を、第2の遺伝子群(例えば、A、D、Y遺伝子と相互作用→相乗効果の欠如を示し、毒性をもつ)と相互作用する別の薬剤に対して選択することができる。
【0062】
更に別の例として、特定の副作用を有する薬剤に応答する患者を評価し、副作用の原因を特定することができる。例えば、特定の薬剤を服用したときに、患者の集団の約3パーセントが毒性効果を示した場合、有害集団からの患者特有のデータを、対照集団(薬剤を服用し副作用を示さない患者)と比較して、オフターゲット効果(例えば、有害集団における一般的共通性、病歴における共通性など)を潜在的に担う特徴を判定することができる。例えば、患者の3パーセントは、遺伝子の変異を有することがあり、それは、例えば、対応する変異タンパク質に結合する(親和性が増大した)薬剤から悪影響をもたらし得る。
【0063】
従って、これらの技術は、抽出された情報及び機械学習に基づいて、個々の薬剤についてプロファイルを生成することを可能にし、ランク付けモジュール75を用いて薬剤をスコア付け及びランク付けし、特定のタイプのがんを有する所与の患者のための有効な薬剤を判定することができる。
【0064】
図6は、薬剤をランク付けするためのフローチャートを示す。ランク付けは、強いカテゴリ、中間のカテゴリ、低いカテゴリに限定することができる。ひとたび機械学習モジュールが訓練されると、薬剤を数値でランク付けすることができ、ランクは、所与の生物学的ターゲットについての毒性、ポテンシー、ED50、IC50、臨床的エフィカシーなどいずれか1つ又は複数に基づく。ランク付けのために、抽出されたデータ(例えば、遺伝子、遺伝子変異、生物学的ターゲットなど)を、文献から抽出することもできる生物学的経路にマッピングすることができる。
【0065】
動作710において、患者特有のデータが取得され、これを用いて、患者のがんを治療するための生物学的ターゲットを判定することができる。動作720において、システム15は、どの薬剤が、患者特有のデータから特定された遺伝子/遺伝子変異/生物学的経路をターゲットにするかを判定する。動作730において、薬剤の有効性に関する異なる重み付けの概念を各薬剤に適用して、薬剤有効性スコアを計算することができる。薬剤有効性スコアは、これらに限定されるものではないが、エフィカシー、毒性、ポテンシー、患者特有の要因(例えば、オミックス情報、病歴)などを含む、どのような概念/重みが適用されるかに応じて、薬剤の異なる特性を表すことができる。エフィカシーは、(投薬量に関係なく)薬剤の最大限の効果である。ポテンシーは、指定の効果をもたらすために必要な薬剤の量である。毒性は、有害な作用(例えば、呼吸困難、器官の損傷など)をもたらす薬剤の量に対応する。
【0066】
場合によっては、同じ遺伝子、遺伝子変異、もしくはシグナル伝達経路又はそれらの組み合わせをターゲットにする薬剤を一緒にグループ化することができ、各薬剤に適用される薬剤有効性に関連する異なる重み付け概念を用いて、それぞれランク付けすることができる。薬剤有効性スコアを計算し、薬剤有効性スコアは、どの概念/重みが適用されるかに応じて、薬剤の異なる特性を表すことができる。
【0067】
他の場合には、各薬剤は、遺伝子、遺伝子変異もしくはシグナル伝達経路レベルにおける(同じターゲットによって限定されない)有効性に関する薬剤有効性スコアに基づいて(例えば、毒性、エフィカシー、二次的効果、ポテンシーなどを含む薬剤特性に関連する異なる重み付け概念を用いて)ランク付けすることができる。
【0068】
幾つかの態様において、薬剤ランク付けは、薬剤を層(tier)に割り当てることができ、層1は、腫瘍反応又はIC50値に基づいて最高/最良のエフィカシーを有し、層2は、腫瘍反応又はIC50値に基づいて適度な/中間のエフィカシーを有し、層3は、腫瘍反応又はIC50値に基づいて低いエフィカシーを有する/エフィカシーを有さない。場合によっては、同じ遺伝子、同じ遺伝子変異、同じ生物学的経路をターゲットにする薬剤を、層レベルによってグループ化することができる。
【0069】
従って、(同じ遺伝子、変異、又は経路に限定されることなく)層に従って、薬剤をランク付けすることができる。ひとたび層のランク付けが完了すると、各層は、同じ遺伝子/遺伝子変異、又は生物学的経路をターゲットにする薬剤をグループ化することによって、さらなるランク付けが行われる。
【0070】
規制当局による承認状況(FDA及び米国以外の国における)、薬剤耐性との既知の関連、薬剤が血液脳関門を通過するかどうか、及び薬剤の化学構造などの、特定の薬剤についての付加的なタイプの情報を提供することができ、それらを分析及びランク付けにおいて考慮することもできる。
【0071】
この情報は、症例管理のためのデータ管理ポータルに統合することができる。特定の遺伝子、遺伝子変異、又は生物学的経路をターゲットとする薬剤を、薬剤のランク付けと共に医師又は他の医療提供者に提示し、特定の遺伝子変化、遺伝子変異又は生物学的経路の変化を有する患者のための治療の選択肢を選択させることができる。
【0072】
図7は、例示的な動作のフローチャートを示す。動作810において、複数の薬剤についての薬剤特性に関する抽出された情報を分析する。動作815において、各薬剤について、1つ又は複数の薬剤特性を判定する。薬剤特性は、毒性、ポテンシー、及びエフィカシーを含むことができる。動作820において、各薬剤は、薬剤がターゲットとする変異又は遺伝子と、変異又は遺伝子から成る生物学的経路を含む複数の属性と関連付けられる。場合によっては、遺伝子名は、遺伝子名同義語及び遺伝子変異名同義語を含み、薬剤名は、薬剤名同義語を含むことができる。動作825において、複数の薬剤は、エフィカシー、ポテンシーもしくは毒性又はそれらの組み合わせから成る群から選択される1つ又は複数の薬剤特性に基づいた薬剤有効性スコアを用いてランク付けされる。
【0073】
薬剤は、特定の病気、遺伝子、遺伝子同義語、遺伝子変異、遺伝子変異同義語薬剤、薬剤名同義語、がんタイプ及びがんタイプ名同義語を含む以下の基準の1つ又は複数に基づいて組み合わせることができる。
【0074】
本技術は、同じターゲットに影響を与える薬剤をランク付けするための多層システムを生成することを含む、既存の手法に優る種々の利点を提供する。第1の層は、文献もしくはデータベース又はその両方から遺伝子、遺伝子変異もしくはシグナル伝達経路又はそれらの組み合わせを抽出することを含むことができる。第2の層は、遺伝子、遺伝子変異及び/又はシグナル伝達経路レベルにおける、エフィカシー又は他の薬剤特性(例えば、毒性、二次的効果、ポテンシーなど)に関して各薬剤をランク付けする。第3の層のグループは、同じ遺伝子、遺伝子変異もしくはシグナル伝達経路又はそれらの組み合わせをターゲットにする薬剤を一緒にランク付けする。本技術は、文献からの前臨床データ(抽出されたIC50値)もしくは臨床試験(ポテンシー)又はその両方を用いて、薬剤をランク付けすることもできる。がん特有の情報を抽出し、個人化されたゲノム・ベースの薬のために機械学習と共に用いることができる。
【0075】
上述され、図に示される実施形態は、投与に応じて(例えば、エフィカシー、毒性、患者特異性、ポテンシー、オフターゲット効果など)薬剤をランク付けするための実施形態を実施する多くの方法のほんの僅かを表すに過ぎないことが理解されるだろう。
【0076】
本発明の実施形態の環境は、任意の数のコンピュータ又は他の処理システム(例えば、クライアント又はエンドユーザ・システム、サーバ・システムなど)、及びいずれかの所望の方法で配置されたデータベース又は他のリポジトリを含むことができ、ここで、本発明の実施形態は、いずれかの所望のタイプのコンピューティング環境(例えば、クラウド・コンピューティング、クライアント・サーバ、ネットワーク・コンピューティング、メインフレーム、独立型システムなど)に適用することができる。本発明の実施形態によって使用されるコンピュータ又は他の処理システムは、任意の数のいずれかの個人的な又は他のタイプのコンピュータ又は処理システム(例えば、デスクトップ、ラップトップ、PDA、モバイル・デバイスなど)によって実装することができ、任意の市販のオペレーティング・システム、並びに市販及びカスタム・ソフトウェア(例えば、ブラウザ・ソフトウェア、通信ソフトウェア、サーバ・ソフトウェア、薬剤ランク付けシステムなど)のいずれかの組み合わせを含むことができる。これらのシステムは、情報を入力もしくは表示する又はその両方を行うためのいずれかのタイプのモニタ及び入力デバイス(例えば、キーボード、マウス、音声認識など)を含むことができる。
【0077】
本発明の実施形態のソフトウェア(例えば、薬剤抽出器71、オミックス抽出器72、機械学習モジュール73,生物学的経路モジュール74、薬剤ランク付けモジュール75など)は、いずれかの所望のコンピュータ言語で実装することができ、本明細書に含まれる機能説明及び図面に示されるフローチャートに基づいて、コンピュータ技術の当業者によって開発され得ることを理解されたい。さらに、本明細書における種々の機能を実行するソフトウェアへの何れの言及も、一般に、ソフトウェアの制御下でそれらの機能を実行するコンピュータ・システム又はプロセッサを指す。本発明の実施形態のコンピュータ・システムは、代替的に任意のタイプのハードウェアもしくは他の処理回路又はその両方によって実装することができる。
【0078】
コンピュータ又は他の処理システムの種々の機能は、任意の数のソフトウェア及び/又はハードウェア・モジュール又はユニット、処理又はコンピュータ・システム及び/又は回路の間で任意の方法で分散させることができ、ここで、コンピュータ又は処理システムは、互いにローカル又は遠隔に配置されてもよく、いずれかの適切な通信媒体(例えば、LAN、WAN、イントラネット、インターネット、配線、モデム接続、無線など)を介して通信することができる。例えば、本発明の実施形態の機能は、種々のエンド・ユーザ/クライアント及びサーバ・システム、及び/又は任意の他の中間処理デバイスの間で任意の方法で分散させることができる。上述され、フローチャートに示されたソフトウェアもしくはアルゴリズム又はその両方は、本明細書に記載される機能を達成する任意の方法で修正することができる。さらに、フローチャート又は説明における機能は、所望の動作を達成する何れの順序でも実行することができる。
【0079】
本発明の実施形態のソフトウェア(例えば、薬剤抽出器71、オミックス抽出器72、機械学習モジュール73,生物学的経路モジュール74、薬剤ランク付けモジュール75など)は、独立型システム又はネットワークもしくは他の通信媒体により接続されたシステムと共に使用するための、固定型又は携帯型プログラム製品装置又はデバイスの非一時的コンピュータ使用可能媒体(例えば、磁気又は光媒体、光磁気媒体、フロッピー・ディスケット、CD-ROM、DVD、メモリ・デバイスなど)上で利用可能であり得る。
【0080】
通信ネットワークは、いずれかの数の任意のタイプの通信ネットワーク(例えば、LAN、WAN、インターネット、イントラネット、VPNなど)によって実装することができる。本発明の実施形態のコンピュータ又は他の処理システムは、いずれかの従来の又は他のプロトコルを介してネットワーク上で通信するための、いずれかの従来の又は他の通信デバイスを含むことができる。コンピュータ又は他の処理システムは、ネットワークにアクセスするために、任意のタイプの接続(例えば、有線、無線など)を利用することができる。いずれかの適切な通信媒体(例えば、ローカル・エリア・ネットワーク(LAN)、配線、無線リンク、イントラネットなど)によって、ローカル通信媒体を実装することができる。
【0081】
システムは、情報(例えば、抽出されたオミックス・データ41、抽出された文献データ42、患者特有のデータ43、薬剤ランク付けデータ44など)を格納するために、任意の数のいずれかの従来の又は他のデータベース、データストア又はストレージ構造(例えば、ファイル、データベース、データ構造、データ又は他のリポジトリなど)を用いることができる。データベース・システムは、情報(例えば、抽出されたオミックス・データ41、抽出された文献データ42、患者特有のデータ43、薬剤ランク付けデータ44など)を格納するために、任意の数のいずれかの従来の又は他のデータベース、データストア又はストレージ構造(例えば、ファイル、データベース、データ構造、データ又は他のリポジトリなど)によって実装することができる。データベース・システムは、サーバもしくはクライアント・システム又はその両方内に含まれてもよく、又はそれらに結合されてもよい。データベース・システムもしくはストレージ構造又はその両方は、コンピュータ又は他の処理システムから遠隔であってもよく、又はローカルであってもよく、いずれかの所望のデータ(例えば、抽出されたオミックス・データ41、抽出された文献データ42、患者特有のデータ43、薬剤ランク付けデータ44など)を格納することができる。
【0082】
本発明の実施形態は、情報(例えば、抽出されたオミックス・データ41、抽出された文献データ42、患者特有のデータ43、薬剤ランク付けデータ44など)を取得又は提供するために、いずれか数の任意のタイプのユーザ・インターフェース(例えば、グラフィカル・ユーザ・インターフェース(GUI)、コマンドライン、プロンプトなど)を用いることができ、ここで、インターフェースは、任意の方法で配置された任意の情報を含むことができる。インターフェースは、いずれかの適切な入力デバイス(例えば、マウス、キーボードなど)を介して情報を入力/表示し、所望の作用を開始するために、任意の位置に配置されたいずれかの数の任意のタイプの入力又は作動機構(例えば、ボタン、アイコン、フィールド、ボックス、リンクなど)を含むことができる。インターフェース画面は、いずれかの方法で画面の間をナビゲートするためのいずれかの適切なアクチュエータ(例えば、リンク、タブなど)を含むことができる。
【0083】
レポートは、任意の方法で配置された任意の他の情報と共にランク付けされた薬剤のリストを含むことができ、規則又は他の基準に基づいて、所望の情報(例えば、エフィカシー、毒性、患者特有など)をユーザに提供するように構成することができる。
【0084】
本発明の実施形態は、上述した特定のタスク又はアルゴリズムに限定されるものではないが、非構造化文書もしくは構造化文書又はその両方の文書を含むコーパスにわたって分散された特性に基づいて薬剤のランク付けが必要とされる何れの用途にも用いることができる。
【0085】
本明細書で用いられる用語は、特定の実施形態を説明することのみを目的とし、本開示を限定することを意図したものではない。本明細書で用いられる場合、単数形「1つの(a)」、「1つの(an)」及び「その(the)」は、文脈がそうでないことを明確に示していない限り、複数形も含むことを意図している。さらに、用語「含む(comprise)」、「含んでいる(comprising)」、「含む(include)」、「含んでいる(including)」、「有する(has)」、「有する(have)」、「有している(having)」、「with(備える)」などは、本明細書で用いられる場合、記載される特徴、整数、ステップ、動作、要素もしくはコンポーネント又はその組み合わせの存在を明示するが、1つ又は複数の他の特徴、整数、ステップ、動作、要素、コンポーネントもしくはグループ又はその組み合わせの存在も又は追加も排除しないことが理解されるであろう。
【0086】
以下の特許請求の範囲における「手段又はステップと機能との組合せ(ミーンズ又はステップ・プラス・ファンクション)」要素の対応する構造、材料、動作及び均等物は、明確に特許請求された他の特許請求される要素と共に機能を実行するための任意の構造、材料、又は動作を含むことを意図したものである。本発明の説明は、例証及び説明のためだけに提示されたものであるが、網羅的であること又は本発明を開示した形態に限定することを意図したものではない。当業者には、本発明の範囲及び趣旨から逸脱することなく、多くの修正及び変形が明らかになるであろう。実施形態は、本発明の原理及び実際の用途を最も良く説明するため、並びに考えられる特定の使用に適するものとして種々の修正を備える種々の実施形態において、当業者が、本発明を理解するのを可能にするために、選択され説明されたものである。
【0087】
本発明の種々の実施形態の説明は、説明のために提示されたものであるが、網羅的であること又は本発明を開示した形態に限定することを意図したものではない。当業者には、本発明の範囲及び趣旨から逸脱することなく、多くの修正及び変形が明らかになるであろう。本明細書で使用される用語は、実施形態の原理、実際の適用、又は市場で見られる技術に比べた技術的改善を最もよく説明するため、又は当業者が本明細書で開示される実施形態を理解できるように選択されたものである。
【0088】
本発明は、統合のいずれかの可能な技術的詳細レベルにおける、システム、方法もしくはコンピュータ・プログラム製品又はその組み合わせとすることができる。コンピュータ・プログラム製品は、プロセッサに本発明の態様を実行させるためのコンピュータ可読プログラム命令をその上に有するコンピュータ可読ストレージ媒体(単数又は複数)を含むことができる。
【0089】
コンピュータ可読ストレージ媒体は、命令実行デバイスにより使用される命令を保持及び格納できる有形デバイスとすることができる。コンピュータ可読ストレージ媒体は、例えば、これらに限定されるものではないが、電子記憶装置、磁気記憶装置、光学記憶装置、電磁気記憶装置、半導体記憶装置、又は上記のいずれかの適切な組み合わせとすることができる。コンピュータ可読ストレージ媒体のより具体的な例の非網羅的なリストとして、以下のもの、すなわち、ポータブル・コンピュータ・ディスケット、ハードディスク、ランダム・アクセス・メモリ(RAM)、読み出し専用メモリ(ROM)、消去可能プログラム可能読み出し専用メモリ(EPROM又はフラッシュ・メモリ)、スタティック・ランダム・アクセス・メモリ(SRAM)、ポータブル・コンパクト・ディスク読み出し専用メモリ(CD-ROM)、デジタル多用途ディスク(DVD)、メモリ・スティック、フロッピー・ディスク、パンチカードもしくは命令がそこに記録された溝内の隆起構造のような機械的にエンコードされたデバイス、及び上記のいずれかの適切な組み合わせが挙げられる。本明細書で使用されるとき、コンピュータ可読ストレージ媒体は、電波、又は他の自由に伝搬する電磁波、導波管もしくは他の伝送媒体を通じて伝搬する電磁波(例えば、光ファイバ・ケーブルを通る光パルス)、又はワイヤを通って送られる電気信号などの、一時的信号自体として解釈されない。
【0090】
本明細書で説明されるコンピュータ可読プログラム命令は、コンピュータ可読ストレージ媒体からそれぞれのコンピューティング/処理デバイスに、又は、例えばインターネット、ローカル・エリア・ネットワーク、広域ネットワークもしくは無線ネットワーク又はその組み合わせなどのネットワークを介して外部コンピュータ又は外部ストレージ・デバイスにダウンロードすることができる。ネットワークは、銅伝送ケーブル、光伝送ファイバ、無線伝送、ルータ、ファイアウォール、スイッチ、ゲートウェイ・コンピュータもしくはエッジ・サーバ又はその組み合わせを含むことができる。各コンピューティング/処理デバイスにおけるネットワーク・アダプタ・カード又はネットワーク・インターフェースは、ネットワークからコンピュータ可読プログラム命令を受け取り、コンピュータ可読プログラム命令を転送して、それぞれのコンピューティング/処理デバイス内のコンピュータ可読ストレージ媒体に格納する。
【0091】
本発明の動作を実行するためのコンピュータ可読プログラム命令は、アセンブラ命令、命令セットアーキテクチャ(ISA)命令、機械命令、機械依存命令、マイクロコード、ファームウェア命令、状態設定データ、集積回路のための構成データ、又は、Smalltalk、C++などのオブジェクト指向プログラミング言語、及び、「C」プログラミング言語もしくは類似のプログラミング言語などの従来の手続き型プログラミング言語を含む1つ又は複数のプログラミング言語の任意の組み合わせで記述されるソース・コード又はオブジェクト・コードとすることができる。コンピュータ可読プログラム命令は、完全にユーザのコンピュータ上で実行される場合もあり、一部がユーザのコンピュータ上で、独立型ソフトウェア・パッケージとして実行される場合もあり、一部がユーザのコンピュータ上で実行され、一部が遠隔コンピュータ上で実行される場合もあり、又は完全に遠隔コンピュータもしくはサーバ上で実行される場合もある。最後のシナリオにおいて、遠隔コンピュータは、ローカル・エリア・ネットワーク(LAN)もしくは広域ネットワーク(WAN)を含むいずれかのタイプのネットワークを通じてユーザのコンピュータに接続される場合もあり、又は外部コンピュータへの接続がなされる場合もある(例えば、インターネットサービスプロバイダを用いたインターネットを通じて)。幾つかの実施形態において、例えば、プログラム可能論理回路、フィールド・プログラマブル・ゲート・アレイ(FPGA)、又はプログラム可能論理アレイ(PLA)を含む電子回路は、本発明の態様を実施するために、コンピュータ可読プログラム命令の状態情報を利用することによって、コンピュータ可読プログラム命令を実行して、電子回路を個別化することができる。
【0092】
本発明の態様は、本発明の実施形態による方法、装置(システム)及びコンピュータ・プログラム製品のフローチャート図もしくはブロック図又はその両方を参照して説明される。フローチャート図もしくはブロック図又はその両方の各ブロック、並びにフローチャート図もしくはブロック図又はその両方におけるブロックの組み合わせは、コンピュータ可読プログラム命令によって実装できることが理解されるであろう。
【0093】
これらのコンピュータ可読プログラム命令を、汎用コンピュータ、専用コンピュータ、又は他のプログラム可能データ処理装置のプロセッサに与えて機械を製造し、それにより、コンピュータ又は他のプログラム可能データ処理装置のプロセッサによって実行される命令が、フローチャートもしくはブロック図又はその両方の1つ又は複数のブロック内で指定された機能/動作を実施するための手段を作り出すようにすることができる。これらのコンピュータ・プログラム命令を、コンピュータ、他のプログラム可能データ処理装置、もしくは他のデバイス又はその組み合わせを特定の方式で機能させるように指示することができるコンピュータ可読媒体内に格納し、それにより、そのコンピュータ可読媒体内に格納された命令が、フローチャートもしくはブロック図又はその両方の1つ又は複数のブロックにおいて指定された機能/動作の態様を実施する命令を含む製品を含むようにすることもできる。
【0094】
コンピュータ・プログラム命令を、コンピュータ、他のプログラム可能データ処理装置、又は他のデバイス上にロードして、一連の動作ステップをコンピュータ、他のプログラム可能データ処理装置、又は他のデバイス上で行わせてコンピュータ実施のプロセスを生産し、それにより、コンピュータ又は他のプログラム可能装置上で実行される命令が、フローチャートもしくはブロック図又はその両方の1つ又は複数のブロックにおいて指定された機能/動作を実行するためのプロセスを提供するようにすることもできる。
【0095】
図面内のフローチャート及びブロック図は、本発明の種々の実施形態による、システム、方法、及びコンピュータ・プログラム製品の可能な実装の、アーキテクチャ、機能及び動作を示す。この点に関して、フローチャート内の各ブロックは、指定された論理機能を実装するための1つ又は複数の実行可能命令を含む、モジュール、セグメント、又はコードの一部を表すことができる。幾つかの代替的な実装において、ブロック内に示される機能は、図に示される順序とは異なる順序で生じることがある。例えば、連続して示される2つのブロックは、関与する機能に応じて、実際には実質的に同時に実行されることもあり、又はこれらのブロックはときとして逆順で実行されることもある。ブロック図もしくはフローチャート図又はその両方の各ブロック、及びブロック図もしくはフローチャート図又はその両方におけるブロックの組み合わせは、指定された機能又は動作を実行する、又は専用のハードウェアとコンピュータ命令との組み合わせを実行する、専用ハードウェア・ベースのシステムによって実装できることにも留意されたい。