IP Force 特許公報掲載プロジェクト 2022.1.31 β版

知財求人 - 知財ポータルサイト「IP Force」

▶ ジェネンテック, インコーポレイテッドの特許一覧

(19)【発行国】日本国特許庁(JP)
(12)【公報種別】公表特許公報(A)
(11)【公表番号】
(43)【公表日】2024-03-19
(54)【発明の名称】HLA発現喪失の推定
(51)【国際特許分類】
   G16B 20/20 20190101AFI20240312BHJP
   G16B 25/10 20190101ALI20240312BHJP
【FI】
G16B20/20
G16B25/10
【審査請求】未請求
【予備審査請求】未請求
(21)【出願番号】P 2023554793
(86)(22)【出願日】2022-03-08
(85)【翻訳文提出日】2023-11-02
(86)【国際出願番号】 US2022019409
(87)【国際公開番号】W WO2022192304
(87)【国際公開日】2022-09-15
(31)【優先権主張番号】63/158,306
(32)【優先日】2021-03-08
(33)【優先権主張国・地域又は機関】US
(81)【指定国・地域】
【公序良俗違反の表示】
(特許庁注:以下のものは登録商標)
1.PYTHON
(71)【出願人】
【識別番号】509012625
【氏名又は名称】ジェネンテック, インコーポレイテッド
(74)【代理人】
【識別番号】110002077
【氏名又は名称】園田・小林弁理士法人
(72)【発明者】
【氏名】ウー, トーマス ディー
(72)【発明者】
【氏名】ジル, オリバー アンソニー
(72)【発明者】
【氏名】チェン, チエミン
(72)【発明者】
【氏名】フォーレスト, ウィリアム フレドリック, ザ サード
(72)【発明者】
【氏名】ハマー, クリスチャン
(57)【要約】
主要組織適合性遺伝子複合体(MHC)対立遺伝子を型決定する方法およびシステム。方法は、MHC遺伝子に関連する対立遺伝子ペアのエクソン分解能識別子のセットを受け取ることを含む。対立遺伝子ペアの対応する対立遺伝子のエクソン分解能識別子のセットのエクソン分解能識別子は、対立遺伝子群、特異的対立遺伝子タンパク質、および対応する対立遺伝子のエクソン領域情報を記載する。試料の複数のリードを受け取る。エクソン分解能識別子のセットのそれぞれのエクソン分解能識別子のために、イントロン分解能識別子のセットが特定されて、複数のイントロン分解能候補識別子を形成する。対応する対立遺伝子のイントロン分解能識別子のセットのイントロン分解能識別子は、対立遺伝子群、特異的対立遺伝子タンパク質、エクソン領域情報、および対応する対立遺伝子のイントロン領域情報を記載する。イントロン分解能識別子の最終セットが、対立遺伝子ペアのために複数のイントロン分解能候補識別子から生成される。
【選択図】図1
【特許請求の範囲】
【請求項1】
主要組織適合性遺伝子複合体(MHC)対立遺伝子を型決定する方法であって、
MHC遺伝子に関連する対立遺伝子ペアのエクソン分解能識別子のセットを受け取ることであって、
前記対立遺伝子ペアの対応する対立遺伝子の前記エクソン分解能識別子のセットのエクソン分解能識別子が、対立遺伝子群、特異的対立遺伝子タンパク質、および前記対応する対立遺伝子のエクソン領域情報を記載する、エクソン分解能識別子のセットを受け取ること;
試料の複数のリードを受け取ること;
前記エクソン分解能識別子のセットのそれぞれのエクソン分解能識別子のために、イントロン分解能識別子のセットを特定して、複数のイントロン分解能候補識別子を形成することであって、
前記対応する対立遺伝子の前記イントロン分解能識別子のセットのイントロン分解能識別子が、前記対立遺伝子群、前記特異的対立遺伝子タンパク質、前記エクソン領域情報、および前記対応する対立遺伝子のイントロン領域情報を記載する、複数のイントロン分解能候補識別子を形成すること;ならびに
前記複数のイントロン分解能候補識別子から前記対立遺伝子ペアのイントロン分解能識別子の最終セットを生成すること
を含む、方法。
【請求項2】
単一エクソン分解能識別子を含む前記エクソン分解能識別子のセットが、前記対立遺伝子ペアがエクソンレベルの分解能でホモ接合性であることを示す、請求項1に記載の方法。
【請求項3】
少なくとも2つのエクソン分解能識別子を含む前記エクソン分解能識別子のセットが、前記対立遺伝子ペアがエクソンレベルの分解能でヘテロ接合性であることを示す、請求項1に記載の方法。
【請求項4】
前記イントロン分解能識別子の最終セットを生成することが、
複数のリードおよびセットカバーリングアルゴリズムを使用して、前記複数のイントロン分解能候補識別子から前記対立遺伝子ペアの前記イントロン分解能識別子の最終セットを生成すること
を含む、請求項1から3のいずれか一項に記載の方法。
【請求項5】
前記イントロン分解能識別子の最終セットを生成することが、
セットカバーリングアルゴリズムを前記複数のリードに適用して、前記複数のイントロン分解能候補識別子からソリューションペアのセットを特定することを含み、前記ソリューションペアのセットのそれぞれのソリューションペアが、前記複数のイントロン分解能候補識別子からの2つの異なるイントロン分解能候補識別子を含む、請求項1から4のいずれか一項に記載の方法。
【請求項6】
前記イントロン分解能識別子の最終セットを生成することが、
多数のソリューションペアを含む前記ソリューションペアのセットに応答して、前記多数のソリューションペアの分解を実施して、前記対立遺伝子ペアの前記イントロン分解能識別子の最終セットを形成することをさらに含む、請求項5に記載の方法。
【請求項7】
前記実施することが、
階層クラスタリングを使用して前記多数のソリューションペアを分解して、前記対立遺伝子ペアの前記イントロン分解能識別子の最終セットを形成することを含む、請求項6に記載の方法。
【請求項8】
前記生成することが、
前記ソリューションペアのセットがイントロン分解能識別子の単一ペアを含むことを決定すること、および
選択されたイントロン分解能識別子が前記イントロン分解能識別子の単一ペアと同じ量の複数のリードのカバレージを提供する場合、前記イントロン分解能識別子の単一ペアの前記選択されたイントロン分解能識別子を前記イントロン分解能識別子の最終セットとして出力することを含む、請求項5に記載の方法。
【請求項9】
セットカバーリングアルゴリズムを使用して、複数のエクソン分解能候補識別子から前記エクソン分解能識別子のセットを生成することをさらに含む、請求項1から8のいずれか一項に記載の方法。
【請求項10】
前記複数のリードの少なくとも一部分とMHC遺伝子のそれぞれの位置のエクソン識別子の最終セットにより形成される複数のシリーズとのアラインメントを評価すること、および
エクソンカバレージに基づいて、前記シリーズから前記複数のエクソン分解能候補識別子を形成すること
をさらに含む、請求項9に記載の方法。
【請求項11】
前記複数のリードをフィルタ処理して、フィルタ処理された複数のリードを形成することをさらに含み、前記アラインメントが、前記フィルタ処理された複数のリードと前記MHC遺伝子のそれぞれのエクソン位置の前記エクソン識別子の最終セットにより形成される前記シリーズとの間で評価される、請求項10に記載の方法。
【請求項12】
前記複数のエクソン分解能候補識別子を形成することが、
潜在的エクソン分解能識別子に関連する複数のエクソンが、前記複数のリードによりカバレージ閾値までカバーされている場合、複数の潜在的エクソン分解能識別子のうちの1つの潜在的エクソン識別子を前記複数のエクソン分解能候補識別子に付加することを含む、
請求項10または11に記載の方法。
【請求項13】
セットカバーリングアルゴリズムを前記複数のリードに適用して、複数のエクソン分解能候補識別子からソリューションペアのセットを特定することをさらに含み、前記ソリューションペアのセットのそれぞれのソリューションペアが、前記複数のエクソン分解能候補識別子からの2つの異なるエクソン分解能候補識別子を含む、請求項1から12のいずれか一項に記載の方法。
【請求項14】
多数のソリューションペアを含む前記ソリューションペアのセットに応答して、前記多数のソリューションペアの分解を実施して、前記対立遺伝子ペアの前記エクソン分解能識別子のセットを形成することをさらに含む、請求項13に記載の方法。
【請求項15】
前記実施することが、
階層クラスタリングを使用して前記多数のソリューションペアを分解して、前記対立遺伝子ペアの前記エクソン分解能識別子のセットを形成することを含む、請求項14に記載の方法。
【請求項16】
前記ソリューションペアのセットがエクソン分解能識別子の単一ペアを含むことを決定すること、および
選択されたエクソン分解能識別子が前記エクソン分解能識別子の単一ペアと同じ量の前記複数のリードのカバレージを提供する場合、前記エクソン分解能識別子の単一ペアの前記選択されたエクソン分解能識別子を前記エクソン分解能識別子のセットとして出力すること
をさらに含む、請求項13に記載の方法。
【請求項17】
シリーズを複数の最終候補エクソンに制約することによって、前記MHC遺伝子のシリーズを特定すること
をさらに含む、請求項10から16のいずれか一項に記載の方法。
【請求項18】
セットカバーリングアルゴリズムを使用して、前記複数の最終候補エクソンを特定すること
をさらに含む、請求項10から17のいずれか一項に記載の方法。
【請求項19】
複数の候補MHCエクソンを特定し、前記複数の候補MHCエクソンのそれぞれが、前記複数のリードの前記少なくとも一部分の少なくとも1つのリードで完全カバーされていること、および
前記複数の候補MHCエクソンから前記複数の最終候補エクソンを特定すること
をさらに含む、請求項10から18のいずれか一項に記載の方法。
【請求項20】
前記試料が、健康組織の試料および不健康組織の試料からなる群のうちの1つから選択され、
前記複数のリードが、全エクソームシーケンシング(WES)または全ゲノムシーケンシング(WGS)の少なくとも一方を介して生成される、
請求項1から19のいずれか一項に記載の方法。
【請求項21】
前記イントロン分解能識別子の最終セットを使用して、前記MHC遺伝子の対立遺伝子ペアの第1の対立遺伝子のイントロン分解能識別子の第1のセット、および前記対立遺伝子ペアの第2の対立遺伝子のイントロン分解能識別子の第2のセットを生成することをさらに含み、
前記イントロン分解能識別子の第1のセットおよび前記イントロン分解能識別子の第2のセットのそれぞれが、前記対立遺伝子ペアがホモ接合性である場合、同じ単一イントロン分解能識別子を含む、
請求項1から20のいずれか一項に記載の方法。
【請求項22】
前記イントロン分解能識別子の最終セットを使用して、前記試料と別の試料とのMHC喪失を評価することをさらに含む、請求項1から21のいずれか一項に記載の方法。
【請求項23】
前記複数のリードが複数のペアエンドリードを含む、請求項1から22のいずれか一項に記載の方法。
【請求項24】
前記MHC遺伝子がヒト白血球抗原(HLA)遺伝子であり、前記MHC対立遺伝子がHLA対立遺伝子である、請求項1から23のいずれか一項に記載の方法。
【請求項25】
前記イントロン分解能識別子の最終セットが、前記MHC遺伝子のそれぞれのエクソン位置のエクソン識別子の最終セットにより形成されるシリーズに基づいて生成される、請求項1から24のいずれか一項に記載の方法。
【請求項26】
前記エクソン分解能識別子のセットが、前記MHC遺伝子のそれぞれのエクソン位置のエクソン識別子の最終セットにより形成されるシリーズに基づいて生成される、請求項1から25のいずれか一項に記載の方法。
【請求項27】
前記イントロン分解能識別子の最終セットが、エクソン識別子レベル、エクソン分解能識別子レベルおよびイントロン分解能識別子レベルで使用される3つのセットカバーリングアルゴリズムに基づいて生成される、請求項1から24のいずれか一項に記載の方法。
【請求項28】
前記イントロン分解能識別子の最終セットが、エクソン識別子レベル、エクソン分解能識別子レベルおよびイントロン分解能識別子レベルでの三層精緻化に基づいて生成される、請求項1から24のいずれか一項に記載の方法。
【請求項29】
リードと、主要組織適合性遺伝子複合体(MHC)遺伝子の対立遺伝子配列とを、MHC対立遺伝子発現の評価に使用するために比較する方法であって、
MHC遺伝子の第1の対立遺伝子のイントロン分解能識別子の第1のセット、および前記MHC遺伝子の第2の対立遺伝子のイントロン分解能識別子の第2のセットを受け取ること;
第1の試料の第1の複数のリード、および第2の試料の第2の複数のリードを受け取ること;
前記イントロン分解能識別子の第1のセットのうちから選択された1つを使用して、前記MHC遺伝子の第1の対立遺伝子の第1の対立遺伝子配列を特定し、前記イントロン分解能識別子の第2のセットのうちから選択された1つを使用して、前記MHC遺伝子の第2の対立遺伝子の第2の対立遺伝子配列を特定すること;ならびに
対立遺伝子リードアラインメントを、前記第1の対立遺伝子配列と前記第1の複数のリードおよび前記第2の複数のリードのそれぞれとの間、ならびに前記第2の対立遺伝子配列と前記第1の複数のリードおよび前記第2の複数のリードのそれぞれとの間で定量化して、アラインメント出力を形成すること
を含む、方法。
【請求項30】
前記対立遺伝子リードアラインメントを定量化することが、
前記イントロン分解能識別子の第1のセットのうちから選択された1つおよび前記イントロン分解能識別子の第2のセットのうちから選択された1つに対応する、前記第1の対立遺伝子配列および前記第2の対立遺伝子配列の使用に基づいて、前記対立遺伝子リードアラインメントを増加された精度で定量化することを含む、請求項29に記載の方法。
【請求項31】
前記対立遺伝子リードアラインメントを定量化することが、
前記第1の対立遺伝子配列と前記第1の複数のリードとの間の第1の対立遺伝子と第1の試料とのアラインメントの数をカウントすること、および
前記第1の対立遺伝子配列と前記第2の複数のリードとの間の第1の対立遺伝子と第2の試料とのアラインメントの数をカウントすること
を含む、請求項29に記載の方法。
【請求項32】
前記第1のアラインメント数および前記第2のアラインメント数を使用して、前記第1の対立遺伝子に関連するMHC喪失を評価することをさらに含む、請求項31に記載の方法。
【請求項33】
前記対立遺伝子リードアラインメントを定量化することが、
前記第2の対立遺伝子配列と第1の複数のリードとの間の第2の対立遺伝子と第1の試料とのアラインメントの数をカウントすること、および
前記第2の対立遺伝子配列と前記第2の複数のリードとの間の第2の対立遺伝子と第2の試料とのアラインメントの数をカウントすること
を含む、請求項29に記載の方法。
【請求項34】
前記第1のアラインメント数および前記第2のアラインメント数を使用して、前記第2の対立遺伝子に関連するMHC喪失を評価することをさらに含む、請求項33に記載の方法。
【請求項35】
前記アラインメント出力を使用して統計分析を実施して、MHC喪失の評価に使用するための統計出力を生成することをさらに含む、請求項29から34のいずれか一項に記載の方法。
【請求項36】
前記第1の対立遺伝子と前記第2の対立遺伝子がホモ接合性である場合、前記イントロン分解能識別子の第1のセットが、前記イントロン分解能識別子の第2のセットと同一である、請求項29から35のいずれか一項に記載の方法。
【請求項37】
前記複数のリードが、全エクソームシーケンシング(WES)または全ゲノムシーケンシング(WGS)の少なくとも一方を介して生成される、請求項29から36のいずれか一項に記載の方法。
【請求項38】
前記第1の試料が健康組織の試料であり、前記第2の試料が不健康組織の試料である、請求項29から37のいずれか一項に記載の方法。
【請求項39】
前記イントロン分解能識別子の第1のセットおよび前記イントロン分解能識別子の第2のセットのそれぞれのイントロン分解能識別子が、8桁MHC対立遺伝子識別子である、請求項29から38のいずれか一項に記載の方法。
【請求項40】
前記アラインメント出力を使用してMHC喪失を評価することをさらに含む、請求項29から39のいずれか一項に記載の方法。
【請求項41】
前記MHC遺伝子がヒト白血球抗原(HLA)遺伝子である、請求項29から40のいずれか一項に記載の方法。
【請求項42】
試料間の主要組織適合性遺伝子複合体(MHC)対立遺伝子喪失を分析する方法であって、
第1の試料および第2の試料に関連するMHC遺伝子の対立遺伝子のペアのMHCアラインメント入力を受け取ること;
前記第1の試料および前記第2の試料に関連する複数の非MHC遺伝子の非MHCアラインメント入力を受け取ること;
前記非MHCアラインメント入力の使用により対立遺伝子喪失閾値を計算すること;ならびに
前記対立遺伝子喪失閾値を使用して、前記MHCアラインメント入力の統計分析を実施して、MHC喪失の評価に使用する統計出力を形成すること
を含む、方法。
【請求項43】
前記統計出力を使用して、前記対立遺伝子ペアの少なくとも1つの対立遺伝子の喪失を評価することをさらに含む、請求項42に記載の方法。
【請求項44】
前記MHCアラインメント入力を受け取ることが、
前記対立遺伝子ペアの第1の対立遺伝子および前記第1の試料に対応する第1のアラインメント数を受け取ること、ならびに
前記対立遺伝子ペアの第1の対立遺伝子および前記第2の試料に対応する第2のアラインメント数を受け取ること
を含む、請求項42および43のいずれか一項に記載の方法。
【請求項45】
前記MHCアラインメント入力を受け取ることが、
前記対立遺伝子ペアの第2の対立遺伝子および前記第1の試料に対応する第3のアラインメント数を受け取ること、ならびに
前記対立遺伝子ペアの第2の対立遺伝子および前記第2の試料に対応する第4のアラインメント数を受け取ること
をさらに含む、請求項44に記載の方法。
【請求項46】
前記統計分析を実施することが、
前記対立遺伝子ペアの第1の対立遺伝子の第1の統計量tを計算すること、および
前記対立遺伝子ペアの第2の対立遺伝子の第2の統計量tを計算すること
を含む、請求項42から45のいずれか一項に記載の方法。
【請求項47】
前記第1の統計量tおよび前記第2の統計量tを分析して、前記対立遺伝子ペアの発現をカテゴリ化することをさらに含む、請求項46に記載の方法。
【請求項48】
前記第1の統計量tおよび前記第2の統計量tを分析することが、
ボロノイ図を使用して前記第1の統計量tおよび前記第2の統計量tを分析することを含む、請求項47に記載の方法。
【請求項49】
前記統計出力を使用して、前記対立遺伝子ペアの発現を複数のカテゴリの1つとしてカテゴリ化することをさらに含み、
前記複数のカテゴリが、正常な発現、単一欠失、二重欠失、ヘテロ接合性喪失、単一増幅、および二重増幅を含む、
請求項42から48のいずれか一項に記載の方法。
【請求項50】
前記統計分析を実施することが、
前記対立遺伝子ペアのZスコアを計算することを含む、請求項42から49のいずれか一項に記載の方法。
【請求項51】
前記統計分析を実施することが、
変動の分析(ANOVA)を使用して前記統計分析を実施することを含む、請求項42から50のいずれか一項に記載の方法。
【請求項52】
前記統計出力の少なくとも一部分を含有する報告を生成することをさらに含み、
前記報告が、前記MHC遺伝子の対立遺伝子のために、前記対立遺伝子の腫瘍対正常コピー数のlog比の信頼区間、前記対立遺伝子の統計量t、前記対立遺伝子のZスコアまたは前記対立遺伝子のp値のうちの少なくとも1つを含む、請求項42から51のいずれか一項に記載の方法。
【請求項53】
前記統計出力を使用して少なくとも1つのMHC対立遺伝子の喪失を検出すること、および
前記少なくとも1つのMHC対立遺伝子の喪失に基づいて免疫療法を個人化すること
をさらに含む、請求項42から52のいずれか一項に記載の方法。
【請求項54】
前記統計出力を使用して少なくとも1つのMHC対立遺伝子の喪失を検出すること、および
前記少なくとも1つのMHC対立遺伝子により提示される抗原のセットを、免疫療法の標的抗原のセットから除くことを決定すること
をさらに含む、請求項42から52のいずれか一項に記載の方法。
【請求項55】
前記統計出力に基づいて、腫瘍細胞の表面上の前記対立遺伝子ペアのMHC対立遺伝子により提示される抗原を免疫療法の標的として含めることを決定することをさらに含む、請求項42から52および54のいずれか一項に記載の方法。
【請求項56】
前記統計出力に基づいて、腫瘍細胞の表面上の前記対立遺伝子ペアのMHC対立遺伝子により提示される抗原を免疫療法の標的から除くことを決定することをさらに含む、請求項42から52のいずれか一項に記載の方法。
【請求項57】
前記免疫療法が、T細胞療法、個人化がん療法、抗原特異的免疫療法、抗原依存性免疫療法、ワクチン、およびナチュラルキラー(NK)細胞療法からなる群から選択される、請求項53から56のいずれか一項に記載の方法。
【請求項58】
前記MHC遺伝子がヒト白血球抗原(HLA)遺伝子である、請求項42から57のいずれか一項に記載の方法。
【請求項59】
試料間の主要組織適合性遺伝子複合体(MHC)対立遺伝子喪失を分析する方法であって、
第1の試料の第1の複数のリード、および第2の試料の第2の複数のリードを受け取ること;
MHC遺伝子の第1の対立遺伝子のイントロン分解能識別子の第1のセット、およびMHC遺伝子の第2の対立遺伝子のイントロン分解能識別子の第2のセットを受け取ること;
前記イントロン分解能識別子の第1のセットおよび前記イントロン分解能識別子の第2のセットを使用して、対立遺伝子配列ペアのセットを特定し、
前記対立遺伝子配列ペアのセットにおけるそれぞれの対立遺伝子配列ペアが、前記第1の対立遺伝子の第1の対立遺伝子配列および前記第2の対立遺伝子の第2の対立遺伝子配列を含むこと;
前記第1の対立遺伝子配列、前記第2の対立遺伝子配列、前記第1の複数のリード、および前記第2の複数のリードを使用して、複数のアラインメントカウントを前記対立遺伝子配列ペアのセットにおけるそれぞれの対立遺伝子配列ペアのために生成すること;
非MHC遺伝子のアラインメントカウントのコレクションを使用して、対立遺伝子喪失閾値を計算すること、ならびに
前記対立遺伝子喪失閾値を使用して前記複数のアラインメントカウントの統計分析を実施し、前記第1の試料と比較した前記第2の試料におけるMHC喪失の評価に使用する統計出力を形成すること
を含む、方法。
【請求項60】
前記対立遺伝子配列ペアのセットの対立遺伝子配列のそれぞれの対立遺伝子配列ペアのために、前記複数のアラインメントカウントを生成することが、
前記対立遺伝子配列ペアのセットの対応する対立遺伝子配列ペアの第1の対立遺伝子配列と、前記第1の複数のリードとの間の第1の対立遺伝子および第1の試料のアラインメント数をカウントすること、ならびに
前記対応する対立遺伝子配列ペアの第1の対立遺伝子配列と、前記第2の複数のリードとの間の第1の対立遺伝子および第2の試料のアラインメント数をカウントすることを含む、
請求項59に記載の方法。
【請求項61】
前記対立遺伝子配列ペアのセットの対立遺伝子配列のそれぞれの対立遺伝子配列ペアのために、前記複数の整数カウントを生成することが、
前記対立遺伝子配列ペアのセットの対応する対立遺伝子配列ペアの第2の対立遺伝子配列と、前記第1の複数のリードとの間の第2の対立遺伝子および第1の試料のアラインメント数をカウントすること、ならびに
前記対応する対立遺伝子配列ペアの第2の対立遺伝子配列と、前記第2の複数のリードとの間の第2の対立遺伝子および第2の試料のアラインメント数をカウントすることを含む、
請求項59および60のいずれか一項に記載の方法。
【請求項62】
前記統計分析を実施することが、
前記第1の対立遺伝子配列を有する前記第1の対立遺伝子の第1の統計量tを計算すること、および
前記第2の対立遺伝子配列を有する前記第2の対立遺伝子の第2の統計量tを計算することを含む、
請求項59から61のいずれか一項に記載の方法。
【請求項63】
前記統計出力を使用して、前記第1の対立遺伝子および前記第2の対立遺伝子の発現を複数のカテゴリの1つとしてカテゴリ化することをさらに含み、
前記複数のカテゴリが、正常な発現、単一欠失、二重欠失、ヘテロ接合性喪失、単一増幅、および二重増幅を含む、
請求項59から62のいずれか一項に記載の方法。
【請求項64】
前記MHC遺伝子がヒト白血球抗原(HLA)遺伝子であり、前記非MHC遺伝子が非HLA遺伝子である、請求項59から63のいずれか一項に記載の方法。
【請求項65】
主要組織適合性遺伝子複合体(MHC)コピー数変更を評価する方法であって、
第1の試料の第1の複数のリード、および第2の試料の第2の複数のリードを受け取ること;
前記第1の複数のリードおよびセットカバーリングアルゴリズムを使用して、MHC遺伝子の対立遺伝子ペアのイントロン分解能識別子の最終セットを特定すること;
前記イントロン分解能識別子の最終セットを使用して、対立遺伝子配列ペアのセットを特定し、
前記対立遺伝子配列ペアのセットにおけるそれぞれの対立遺伝子配列ペアが、前記対立遺伝子ペアの第1の対立遺伝子配列および第2の対立遺伝子配列を含むこと;
前記第1の対立遺伝子配列、前記第2の対立遺伝子配列、前記第1の複数のリード、および前記第2の複数のリードを使用して、複数のアラインメントカウントを前記対立遺伝子配列ペアのセットにおけるそれぞれの対立遺伝子配列ペアのために生成すること;
前記複数のアラインメントカウントの統計分析を実施して、統計出力を形成すること;
前記統計出力を使用して、前記第1の試料と比較した前記第2の試料におけるMHCコピー数変更を推定すること
を含む、方法。
【請求項66】
前記統計出力を使用して、第1の対立遺伝子および第2の対立遺伝子の発現を複数のカテゴリの1つとしてカテゴリ化することをさらに含み、
前記複数のカテゴリが、正常な発現、単一欠失、二重欠失、ヘテロ接合性喪失、単一増幅、および二重増幅を含む、
請求項65に記載の方法。
【請求項67】
前記統計出力を使用して、前記対立遺伝子ペアの少なくとも1つの対立遺伝子の喪失を検出すること、および
前記対立遺伝子ペアの少なくとも1つの対立遺伝子により提示される抗原のセットを、免疫療法の標的抗原のセットから除くことを決定すること
をさらに含む、請求項65および66のいずれか一項に記載の方法。
【請求項68】
前記統計出力に基づいて、腫瘍細胞の表面上の前記対立遺伝子ペアの少なくとも1つの対立遺伝子により提示される抗原を免疫療法の標的として含めることを決定することをさらに含む、請求項65から67のいずれか一項に記載の方法。
【請求項69】
前記統計出力に基づいて、腫瘍細胞の表面上の前記対立遺伝子ペアのMHC対立遺伝子により提示される抗原を免疫療法の標的から除くことを決定することをさらに含む、請求項65から68のいずれか一項に記載の方法。
【請求項70】
前記統計出力を使用して前記対立遺伝子ペアの少なくとも1つの対立遺伝子の喪失を検出すること、および
前記少なくとも1つの対立遺伝子の喪失に基づいて免疫療法を個人化すること
をさらに含む、請求項65および66のいずれか一項に記載の方法。
【請求項71】
前記免疫療法が、T細胞療法、個人化がん療法、抗原特異的免疫療法、抗原依存性免疫療法、ワクチン、およびナチュラルキラー(NK)細胞療法からなる群から選択される、請求項65から70のいずれか一項に記載の方法。
【請求項72】
前記統計出力の少なくとも一部分を含有する報告を生成することをさらに含み、
前記報告が、前記MHC遺伝子の対立遺伝子のために、前記対立遺伝子の腫瘍対正常コピー数のlog比の信頼区間、前記対立遺伝子の統計量t、前記対立遺伝子のZスコアまたは前記対立遺伝子のp値のうちの少なくとも1つを含む、請求項65から71のいずれか一項に記載の方法。
【請求項73】
前記MHC遺伝子がヒト白血球抗原(HLA)遺伝子である、請求項65から72のいずれか一項に記載の方法。
【請求項74】
1つまたは複数のデータプロセッサと、
命令を含有する非一時的コンピュータ可読記憶媒体であって、前記命令が、前記1つまたは複数のデータプロセッサ上で実行される場合、前記1つまたは複数のデータプロセッサに、請求項1から73に開示される1つまたは複数の方法の一部またはすべてを実施させる、非一時的コンピュータ可読記憶媒体と
を含む、システム。
【請求項75】
1つまたは複数のデータプロセッサに、請求項1から73に開示される1つまたは複数の方法の一部またはすべてを実施させるように構成された命令を含む、非一時的機械可読記憶媒体において有形に具現化されたコンピュータプログラム製品。
【発明の詳細な説明】
【背景技術】
【0001】
本記載は、一般に、ヒト白血球抗原(HLA)喪失を評価することに向けられている。より詳細に、本記載は、イントロン分解能識別子を使用して特定した対立遺伝子配列のリードのアラインメントに基づいて、対象におけるHLA喪失を推定する方法およびシステムを提供する。
【0002】
HLA喪失は、遺伝子修飾、エピジェネティック修飾または間接制御が原因のHLA対立遺伝子発現の非存在または低下である。例えば、特定のHLA対立遺伝子に関するHLA喪失は、その特定のHLA対立遺伝子の発現の非存在または低下である。遺伝子修飾は、ハード修飾(hard modification)とも称され、エピジェネティック修飾は、ソフト修飾(soft modification)とも称される。遺伝子修飾は不可逆的であり、一方でエピジェネティック修飾は、可逆的である。多くの場合、HLA喪失は、抗腫瘍免疫応答を回避するように進化する不健康または疾患組織(例えば、腫瘍)の結果として見られる。HLA喪失は、治療抗原(例えば、新生抗原)を提示するビヒクルの喪失または低い利用能のため、腫瘍の治療を提供することを困難にし得る。このように、HLA喪失は、例えば、がんによる免疫系回避、および治療抵抗性に寄与し得る。
【発明の概要】
【0003】
本明細書に記載されている実施形態は、シーケンシングデータ(例えば、次世代シーケンシングデータ)に基づいて対象におけるHLA喪失および/またはHLA獲得を検出する方法およびシステムを提供する。本明細書に記載されている方法およびシステムは、イントロン領域レベル(例えば、イントロン領域の多型を考慮に入れる)で特定されたHLA遺伝子への特異的対立遺伝子に関して、HLA喪失および/または獲得を評価することができる。
【0004】
1つまたは複数の実施形態では、主要組織適合性遺伝子複合体(MHC)対立遺伝子を型決定する方法が提供される。方法は、MHC遺伝子に関連する対立遺伝子ペアのエクソン分解能識別子のセットを受け取ることを含む。対立遺伝子ペアの対応する対立遺伝子のエクソン分解能識別子のセットのエクソン分解能識別子は、対立遺伝子群、特異的対立遺伝子タンパク質、および対応する対立遺伝子のエクソン領域情報を記載する。試料の複数のリードを受け取る。エクソン分解能識別子のセットのそれぞれのエクソン分解能識別子のために、イントロン分解能識別子のセットが特定されて、複数のイントロン分解能候補識別子を形成する。対応する対立遺伝子のイントロン分解能識別子のセットのイントロン分解能識別子は、対立遺伝子群、特異的対立遺伝子タンパク質、エクソン領域情報、および対応する対立遺伝子のイントロン領域情報を記載する。イントロン分解能識別子の最終セットが、対立遺伝子ペアのために複数のイントロン分解能候補識別子から生成される。
【0005】
1つまたは複数の実施形態では、リードと、主要組織適合性遺伝子複合体(MHC)遺伝子の対立遺伝子配列とを、MHC対立遺伝子発現の評価に使用するために比較する方法が提供される方法は、MHC遺伝子の第1の対立遺伝子のイントロン分解能識別子の第1のセット、およびMHC遺伝子の第2の対立遺伝子のイントロン分解能識別子の第2のセットを受け取ることを含む。第1の試料の第1の複数のリード、および第2の試料の第2の複数のリードを受け取る。MHC遺伝子の第1の対立遺伝子の第1の対立遺伝子配列は、イントロン分解能識別子の第1のセットのうちから選択された1つを使用して特定され、MHC遺伝子の第2の対立遺伝子の第2の対立遺伝子配列は、イントロン分解能識別子の第2のセットのうちから選択された1つを使用して特定される。対立遺伝子リードアラインメントを、第1の対立遺伝子配列と第1の複数のリードおよび第2の複数のリードのそれぞれとの間、ならびに第2の対立遺伝子配列と第1の複数のリードおよび第2の複数のリードのそれぞれとの間で定量化して、アラインメント出力を形成する。
【0006】
1つまたは複数の実施形態では、試料間の主要組織適合性遺伝子複合体(MHC)対立遺伝子喪失を分析する方法が提供される。方法は、第1の試料および第2の試料に関連するMHC遺伝子の対立遺伝子のペアのMHCアラインメント入力を受け取ることを含む。第1の試料および第2の試料に関連する複数の非MHC遺伝子の非MHCアラインメント入力を受け取る。対立遺伝子喪失閾値を、非MHCアラインメント入力の使用により計算する。MHCアラインメント入力の統計分析を、対立遺伝子喪失閾値の使用により実施して、MHC喪失の評価に使用する統計出力を形成する。
【0007】
1つまたは複数の実施形態では、試料間の主要組織適合性遺伝子複合体(MHC)対立遺伝子喪失を分析する方法が提供される。方法は、第1の試料の第1の複数のリード、および第2の試料の第2の複数のリードを受け取ることを含む。MHC遺伝子の第1の対立遺伝子のイントロン分解能識別子の第1のセット、およびMHC遺伝子の第2の対立遺伝子のイントロン分解能識別子の第2のセットを受け取る。対立遺伝子配列ペアのセットを、イントロン分解能識別子の第1のセットおよびイントロン分解能識別子の第2のセットを使用して特定する。対立遺伝子配列ペアのセットにおけるそれぞれの対立遺伝子配列ペアは、第1の対立遺伝子の第1の対立遺伝子配列および第2の対立遺伝子の第2の対立遺伝子配列を含む。対立遺伝子配列ペアのセットにおけるそれぞれの対立遺伝子配列ペアでは、複数のアラインメントカウントが第1の対立遺伝子配列、第2の対立遺伝子配列、第1の複数のリード、および第2の複数のリードを使用して生成される。対立遺伝子喪失閾値を、非MHC遺伝子のアラインメントカウントのコレクションを使用して計算する。複数のアラインメントカウントの統計分析を、対立遺伝子喪失閾値の使用により実施して、第1の試料と比較した第2の試料におけるMHC喪失の評価に使用する統計出力を形成する。
【0008】
1つまたは複数の実施形態では、主要組織適合性遺伝子複合体(MHC)コピー数変更を評価する方法が提供される。方法は、第1の試料の第1の複数の読み取り、および第2の試料の第2の複数の読み取りを受け取ることを含む。イントロン分解能識別子の最終セットを、第1の複数のリード、およびセットカバーリングアルゴリズムを使用して、MHC遺伝子の対立遺伝子ペアのために特定する。対立遺伝子配列ペアのセットを、イントロン分解能識別子の最終セットを使用して特定する。対立遺伝子配列ペアのセットにおけるそれぞれの対立遺伝子配列ペアは、対立遺伝子ペアの第1の対立遺伝子配列および第2の対立遺伝子配列を含む。対立遺伝子配列ペアのセットにおけるそれぞれの対立遺伝子配列ペアでは、複数のアラインメントカウントが第1の対立遺伝子配列、第2の対立遺伝子配列、第1の複数のリード、および第2の複数のリードを使用して生成される。複数のアラインメントカウントの統計分析を実施して、統計出力を形成する。第2の試料におけるMHCコピー数変更を、統計出力の使用により第1の試料と比較して評価する。
【0009】
一部の実施形態において、1つまたは複数のデータプロセッサと、命令を含有する非一時的コンピュータ可読記憶媒体であって、該命令が、1つまたは複数のデータプロセッサ上で実行される場合、1つまたは複数のデータプロセッサに、本明細書に開示される1つまたは複数の方法の一部またはすべてを実施させる、非一時的コンピュータ可読記憶媒体とを含む、システムが提供される。
【0010】
一部の実施形態において、非一時的機械可読記憶媒体に有形に具現化され、1つまたは複数のデータプロセッサに、本明細書に開示されている1つまたは複数の方法の一部またはすべてを実施させるように構成された命令を含む、コンピュータプログラム製品が提供される。
【0011】
本開示の一部の実施形態は、1つまたは複数のデータプロセッサを含むシステムを含む。一部の実施形態において、システムは、命令を含有する非一時的コンピュータ可読記憶媒体であって、該命令が、1つまたは複数のデータプロセッサ上で実行される場合、1つまたは複数のデータプロセッサに、本明細書に開示される1つもしくは複数の方法の一部もしくはすべて、および/または1つもしくは複数のプロセスの一部もしくはすべてを実施させる、非一時的コンピュータ可読記憶媒体を含む。本開示の一部の実施形態は、本明細書に開示される1つもしくは複数の方法の一部もしくはすべて、および/または1つもしくは複数のプロセスの一部もしくはすべてを、1つまたは複数のデータプロセッサに実施させるように構成された命令を含む非一時的機械可読記憶媒体において有形に具現化されたコンピュータプログラム製品を含む。
【0012】
用いられている用語および表現は、記載のための用語として使用され、限定するためではなく、そのような用語および表現の使用は、示されている、および記載されている特徴またはその一部分の任意の同等物を除くことを意図しないが、様々な修正が特許請求される本発明の範囲内で可能であることが認識される。よって、特許請求される本発明は実施形態および任意選択の特徴によって特定的に開示されているが、本明細書に開示されている概念の修正および変更は、当業者により求められてもよく、そのような修正および変更は、添付の特許請求の範囲により定義されている本発明の範囲内であると考慮されることが理解されるべきである。
【0013】
本開示は、添付図面と共に記載される。
【図面の簡単な説明】
【0014】
図1】1つまたは複数の実施形態によるHLA喪失を評価する評価システムの例を図解する概略図である。
図2】1つまたは複数の実施形態によるHLA喪失を評価するプロセスの例を図解する流れ図である。
図3】1つまたは複数の実施形態によるHLA対立遺伝子を型決定するプロセスの例を図解する流れ図である。
図4】1つまたは複数の実施形態によるイントロン分解能識別子の最終セットを生成するプロセスの例を図解する流れ図である。
図5】1つまたは複数の実施形態によるイントロン分解能識別子ペアの論理和の行列表現の例の図解である。
図6】1つまたは複数の実施形態によるHLA対立遺伝子を型決定するプロセスの例を図解する流れ図である。
図7A】1つまたは複数の実施形態によるエクソン分解能識別子のセットを生成するプロセスの例を図解する流れ図である。
図7B】1つまたは複数の実施形態によるHLA遺伝子のそれぞれのエクソン位置のエクソン分解能識別子の一連の最終セットを特定するプロセスの例を図解する流れ図である。
図8】1つまたは複数の例示的実施形態による対立遺伝子リードアラインメントの二部グラフである。
図9】1つまたは複数の実施形態によるHLA遺伝子の対立遺伝子リードアラインメントを定量化するプロセスの例を図解する流れ図である。
図10】1つまたは複数の実施形態による対立遺伝子リードアラインメントおよびアラインメントカウントを図解する。
図11】1つまたは複数の実施形態によるHLA対立遺伝子発現を分析するプロセスの例を図解する流れ図である。
図12】1つまたは複数の実施形態による2つ試料間の遺伝子変動のプロットの例を図解する。
図13】1つまたは複数の実施形態によるベータ二項モデルを使用して生成されたプロットの例を図解する。
図14】1つまたは複数の実施形態によるHLA喪失を評価するプロセスの例を図解する流れ図である。
図15】1つまたは複数の実施形態によるボロノイ図の例を図解する。
図16】1つまたは複数の実施形態によるHLA喪失を評価する例を図解する流れ図である。
図17A】1つまたは複数の実施形態による様々な腫瘍試料におけるHLA喪失の検出を示すプロットシリーズを図解する。
図17B】1つまたは複数の実施形態による様々な腫瘍試料におけるHLA喪失の検出を示すプロットシリーズを図解する。
図17C】1つまたは複数の実施形態による様々な腫瘍試料におけるHLA喪失の検出を示すプロットシリーズを図解する。
図17D】1つまたは複数の実施形態による様々な腫瘍試料におけるHLA喪失の検出を示すプロットシリーズを図解する。
図17E】1つまたは複数の実施形態による様々な腫瘍試料におけるHLA喪失の検出を示すプロットシリーズを図解する。
図17F】1つまたは複数の実施形態による様々な腫瘍試料におけるHLA喪失の検出を示すプロットシリーズを図解する。
図18】様々な実施形態によるコンピュータシステムの例を図解するブロック図である。
【発明を実施するための形態】
【0015】
添付図面において、類似した構成要素および/または特徴は同じ参照ラベルを有することができる。さらに、同じタイプの様々な構成要素は、参照ラベルの後に類似した構成要素を区別する破線および第2のラベルを続けることによって区別され得る。本明細書において第1の参照ラベルのみが使用される場合、記載は、第2の参照ラベルに関係なく、同じ第1の参照ラベルを有する類似した構成要素のいずれか1つに適用可能である。
【0016】
I.概要
本明細書に記載されている実施形態は、HLA喪失および/または獲得の(例えば、HLAコピー数変更を介した)検出が、例えばがん免疫療法などであるが、これに限定されないある特定のタイプの免疫療法を開発および/または管理するために重要であることを認識する。例えば、腫瘍は様々な機構(例えば、遺伝子修飾、エピジェネティック修飾または間接制御)を使用して、腫瘍が療法を逃れ、または回避して、選択優位性を有することを可能にするHLA喪失を引き起こし得る。例えば、特定の免疫療法(例えば、T細胞療法)は効果がなく、腫瘍特異的抗原(例えば、新生抗原)を認識することができず、そのためにHLA喪失の場合に活性化することができないことがある。例えば、特定のHLA対立遺伝子を有さない、またはその低減された発現を有する腫瘍細胞は、その腫瘍細胞上の所定の抗原に反応性であるT細胞により認識されない、または死滅しないことがある。よって、例えば対象の腫瘍においてHLA喪失を検出することは、例えばT細胞療法および/またはナチュラルキラー(NK)細胞療法などであるが、これらに限定されない免疫療法を開発および/または個人化する(personalize)助けとなり得る。
【0017】
本明細書に記載されている実施形態は、対象から得た試料におけるHLA喪失を別の試料と比較して評価するために、様々な方法、システム、および非一時的コンピュータ可読媒体を提供する。例えば、本明細書に記載されている実施形態は、2つの試料でHLA対立遺伝子発現を分析して、2つの試料間で任意のHLA発現喪失がある(例えば、一方の試料におけるHLA対立遺伝子の発現が、もう一方の試料におけるHLA対立遺伝子の発現と比較して低減されている、または非存在である)かを推定することができる。本明細書に記載されている実施形態は、2つの試料のHLA発現の特徴づけに使用することができる。様々な例において、2つの試料は、正常な、そうでなければ健康な試料、および腫瘍、そうでなければ不健康または疾患試料を含む。
【0018】
1つまたは複数の例示的実施形態において、HLA対立遺伝子は、イントロンレベルの分解能で型決定される。例えば、HLA対立遺伝子は、これらのHLA対立遺伝子のエクソン領域内の変動(例えば、多型)に基づいて、およびこれらのHLA対立遺伝子のイントロン領域内の変動(例えば、多型)に基づいて型決定され得る。そのようなHLA対立遺伝子のイントロン分解能識別子を使用すると、そのHLAの対立遺伝子配列をより正確に特定することが可能になり、そのことはHLA対立遺伝子と、シーケンシングにより得たリードとの改善されたアラインメントを可能にし得る。
【0019】
HLA対立遺伝子を型決定する一部の現在利用可能な方法は主にエクソンレベルの分解能(イントロン領域情報を有さない、または一部だけ有する)を提供することを認識すると、本明細書に記載されている実施形態は、HLA対立遺伝子をイントロンレベルの分解能で型決定して、HLA喪失の検出の全体精度を改善することができる。例えば、HLA対立遺伝子を最初にエクソン分解能識別子で型決定して、シーケンシングデータと比較する必要がある可能な対立遺伝子のフィールドをナローイングする。すべての可能なイントロン分解能識別子をシーケンシングデータと比較しなければならないことに比べて、このナローイングしたフィールドを用いて、これらのエクソン分解能識別子に対応するイントロン分解能識別子をシーケンシングデータ(例えば、リード)と比較することができる。エクソン分解能識別子を使用するHLA対立遺伝子の型決定は、可能なエクソン分解能識別子のフィールドを、最初に、リードとマッチするエクソンを有するものにナローイングすることによって、より正確に実施することができる。さらに、エクソン分解能識別子を使用するHLA対立遺伝子の型決定は、可能なエクソン分解能識別子のフィールドを、最初に、リードとマッチするエクソンを有するものにナローイングすることによって、より効率的に、素早く、および/または少ない計算資源の使用で実施することができる。最初に個別のエクソンレベルでナローイングすることによって、計算時間および資源節約を実現することができる。
【0020】
本明細書に記載されている実施形態を様々な方法に使用して、免疫療法、例えばT細胞療法またはがんワクチンを開発および個人化することができる、例えば、HLA喪失が、腫瘍試料(例えば、腫瘍組織の試料)に存在するとき、1つのHLA対立遺伝子において推定される場合、T細胞療法またはがんワクチンは、HLA喪失が推定または検出されない患者における別のHLA対立遺伝子により提示される抗原に反応性であるように設計され得る。このタイプのHLA喪失検出は、有効で時宜を得た療法を個体対象に提供するために重要であり得る。
【0021】
II.定義
別途定義のない限り、本明細書に記載されている本発明の教示に関連して使用される科学および技術用語は、当業者に一般的に理解される意味を有する。さらに、文脈から別途要求のない限り、単数用語は複数形を含み、複数用語は単数形を含む。一般に、本明細書に記載されている化学、生化学、分子生物学、薬理学および毒物学に関連して利用される命名法およびそれらの技法は、当技術分野において周知であり、一般的に使用されるものである。
【0022】
本明細書で使用される場合、「実質的に」とは、意図された目的のために機能するのに十分であることを意味する。よって、「実質的に」という用語は、例えば、当業者によって予想されるが、全体的な性能にそれほど影響しない、絶対的または完全な状態、寸法、測定値、結果等からの微細で極僅かな変動を可能にする。数値、または数値として表され得るパラメータもしくは特性に関して使用される場合、「実質的に」とは、10パーセント以内を意味する。
【0023】
「複数のもの(ones)」という用語は、2つ以上のものを意味する。
【0024】
本明細書で使用される場合、「複数」という用語は、2、3、4、5、6、7、8、9、10、またはそれ以上であり得る。
【0025】
本明細書で使用される場合、「のセット」という用語は、1つまたは複数を意味する。例えば、項目のセットは、1つまたは複数の項目を含む。
【0026】
本明細書で使用される場合、「のうちの少なくとも1つ」という語句は、項目のリストとともに使用される場合、リストされた項目のうちの1つまたは複数の異なる組み合わせが使用されてもよく、リストの項目のうちの1つのみが必要とされてもよいことを意味する。項目は、特定のオブジェクト、物、ステップ、作動、プロセス、またはカテゴリであり得る。換言すると、「のうちの少なくとも1つ」とは、リストから項目の任意の組み合わせまたは任意の数の項目が使用され得るが、リストの項目のすべてが必要とされるわけではない場合があることを意味する。例えば、限定されることなく、「項目A、項目B、または項目Cのうちの少なくとも1つ」とは、項目A;項目Aおよび項目B;項目B;項目A、項目Bおよび項目C;項目Bおよび項目C;または項目AおよびCを意味する。一部の場合では、「項目A、項目B、または項目Cのうちの少なくとも1つ」とは、2個の項目A、1個の項目B、および10個の項目C;4個の項目Bおよび7個の項目C;または他のいくつかの適切な組み合わせを意味するがこれらに限定されない。
【0027】
要素のリスト(例えば、要素a、b、c)が参照される場合、そのような参照は、それ自体でリストされた要素のいずれか1つ、リストされた要素のすべてよりも少ない要素の任意の組み合わせ、および/またはリストされた要素のすべての組み合わせを含むことを意図する。
【0028】
本明細書で使用される場合、「モデル」は、アルゴリズム、式、数学的技法、機械アルゴリズム、確率分布もしくはモデル、または他のタイプの数学的もしくは統計的表現のうちの少なくとも1つを含む。
【0029】
本明細書で使用される場合、「対象」は、治療のために査定される、および/または治療されている哺乳動物、臨床治験に参加している哺乳動物、抗がん療法を受けている哺乳動物、または目的の任意の他の哺乳動物を指すことができる。様々な実施形態において、「対象」、「個体」および「患者」という用語は、本明細書において互換的に使用される。対象は、健康な、もしくは無症状の個体、疾患(例えば、がん)もしくは疾患の素因を有する、もしくは有すると疑われる個体、療法を必要とする、もしくは療法を必要とすると疑われる個体、またはこれらの組み合わせであり得る。対象は、例えば、限定されることなく、がんを有する個体または自己免疫疾患を有する個体であり得る。対象はヒトであり得る。他の場合において、対象は、いくつかの他のタイプの哺乳動物であり得る。例えば、対象はヒト疾患の実験モデルの形成に使用される哺乳動物であり得る。そのような哺乳動物は、マウス、ラット、霊長類(例えば、カニクイザル)等を含むがこれらに限定されない。
【0030】
本明細書で使用される場合、「試料」は、対象の「生物学的試料」を指すことができる。試料は、組織(例えば、生検)、単一細胞、多数の細胞、細胞の断片、または体液のアリコートを含むことができる。試料は、静脈穿刺、排出、射精、マッサージ、生検、針吸引液、洗浄試料、擦過、外科的切開もしくは処置、または当技術分野において公知の他の手段を含む手段によって対象から採取され得る。
【0031】
本明細書で使用される場合、「ヌクレオチド」は、ヌクレオシドおよびホスフェート基を含む。「ヌクレオシド」は、本明細書で使用される場合、核酸塩基および五炭糖(例えば、リボース、デオキシリボースまたはこれらの類似体)を含む。核酸塩基がリボースに結合している場合、ヌクレオシドはリボヌクレオシドと称され得る。核酸塩基がデオキシリボースに結合している場合、ヌクレオシドはデオキシリボヌクレオシドと称され得る。「窒素性塩基」とも称され得る「核酸塩基」は、5つのタイプ:アデニン(A)、グアニン(G)、チミン(T)、ウラシル(U)およびシトシン(C)のうちの1つの形態を取ることができる。
【0032】
本明細書で使用される場合、「ポリヌクレオチド」、「核酸」または「オリゴヌクレオチド」は、ヌクレオチド(または、インターヌクレオシド連結により接合されているヌクレオシド)の線状ポリマーを指す。一般に、ポリヌクレオチドは、少なくとも3つのヌクレオチドを含む。一般に、オリゴヌクレオチドは、数個のヌクレオチド(または、モノマー単位)から数百個のヌクレオチド(モノマー単位)の数の範囲のヌクレオチドから構成される。ポリヌクレオチド、例えばオリゴヌクレオチドが文字の配列、例えば「ATGCCTG」によって表される場合はいつも、別段の注記がない限り、ヌクレオチドは、5’→3’の順番または左から右の方向であり、「A」はアデニンを意味し、「C」はシトシンを意味し、「G」はグアニンを意味し、「T」はチミンを意味することが理解されるであろう。A、C、G、およびTという文字は、上記に記載された核酸塩基自体、これらの核酸塩基を含むヌクレオシド、またはこれらの塩基を含むヌクレオチドを指すために使用されてもよく、当技術分野において標準的である。
【0033】
デオキシリボ核酸(DNA)は、4つのタイプのヌクレオチド:アデニン(A)、チミン(T)、シトシン(C)およびグアニン(G)からなるヌクレオチドの鎖である。リボ核酸(RNA)は、4つのタイプのヌクレオチド:A、C、Gおよびウラシル(U)から構成される。ヌクレオチドのある特定のペアは、相補的な様式で互いに特異的に結合し、このことは相補的塩基ペアリングと称され得る。例えば、CはGとペア形成し、AはTとペア形成する。しかしRNAの場合、AはUとペア形成する。第1の核酸鎖が、第1の鎖中のヌクレオチドと相補的であるヌクレオチドから構成される第2の核酸鎖と結合する場合、2つの鎖は結合して、二本鎖を形成する。本明細書で使用される場合、「核酸シーケンシングデータ」、「核酸シーケンシング情報」、「核酸配列」、「ゲノム配列」、「遺伝子配列」、「断片配列」、または「核酸シーケンシングリード」とは、DNAまたはRNAの分子(例えば、全ゲノム、全トランスクリプトーム、エクソーム、オリゴヌクレオチド、ポリヌクレオチド、断片等)中のヌクレオチド塩基(例えば、A、C、G、T/U)の順番を示す任意の情報またはデータを意味する。本開示は、この配列情報が、キャピラリー電気泳動、マイクロアレイ、ライゲーションに基づくシステム、ポリメラーゼに基づくシステム、ハイブリダイゼーションに基づくシステム、直接的もしくは間接的なヌクレオチド特定システム、パイロシーケンシング、イオンもしくはpHに基づく検出システム、電子に基づくシステム等、またはこれらの組み合わせを含むがこれらに限定されない任意の利用可能な様々な技法、プラットフォームまたは技術を使用して得ることができることを企図することが理解されるべきである。
【0034】
「ゲノム」という用語は、本明細書で使用される場合、細胞、または哺乳動物(例えば、ヒト)などの動物を含む生物体の遺伝子材料を指し、DNAなどの核酸を含む。ゲノムは、DNA配列から構成される1つまたは複数の染色体に貯蔵される。ヒトにおいて、DNAは、例えば、遺伝子、非コードDNAおよびミトコンドリアDNAを含む。ヒトゲノムは、典型的に23ペアの染色体:22ペアの常染色体(オートソーム)+性決定XおよびY染色体を含有する。23ペアの染色体は、各親からの1つのコピーを含む。染色体を構成するDNAは、染色体DNAと称され、ヒト細胞の核内に存在する(核DNA)。
【0035】
本明細書で使用される場合、「遺伝子」は、遺伝性のゲノム配列の別個の部分であり、機能性産物として発現することにより、または遺伝子発現の制御により対象の形質に影響する。対象または細胞における遺伝子のすべての相補体は、対象または細胞のゲノムとして公知である。特定の遺伝子が位置する染色体の領域は、座と呼ばれる。それぞれの座は遺伝子の1つの対立遺伝子を含有する。よって、染色体のペアは一緒に、それぞれ遺伝子の対立遺伝子を含有して対立遺伝子ペアを形成する2つの座を有することになる。2つの対立遺伝子は、同じであってもよく、異なっていてもよい(例えば、僅かに異なる遺伝子配列を有してもよい)。
【0036】
本明細書で使用される場合、「対立遺伝子」は、遺伝子のバリアントである。遺伝子の一方の対立遺伝子は、同じ遺伝子のもう一方の対立遺伝子と様々な方法で異なり得る。例えば、同じ遺伝子の2つの対立遺伝子は、例えば、タンパク質(例えば、コードされたタンパク質のアミノ酸配列内での差)、アミノ酸配列に影響しないエクソン領域における他の(サイレントな、もしくは同義の)変動、イントロン領域の変動、またはこれらの変動のいくつかの組み合わせによって異なり得る。
【0037】
本明細書で使用される場合、「配列」とは、DNAまたはRNAの分子(例えば、全ゲノム、全トランスクリプトーム、エクソーム、オリゴヌクレオチド、ポリヌクレオチド、断片等)中のヌクレオチド塩基(例えば、A、C、G、T/U)の順番を示す任意の情報またはデータを意味する。配列情報は、キャピラリー電気泳動、マイクロアレイ、ライゲーションに基づくシステム、ポリメラーゼに基づくシステム、ハイブリダイゼーションに基づくシステム、直接的もしくは間接的なヌクレオチド特定システム、パイロシーケンシング、イオンもしくはpHに基づく検出システム、電子に基づくシステム等、またはこれらの組み合わせを含むがこれらに限定されない任意の利用可能な様々な技法、プラットフォームまたは技術を使用して得ることができる。一例として、配列情報は、次世代シーケンシングを使用して得ることができる。
【0038】
本明細書で使用される場合、「次世代シーケンシング」(NGS)は、伝統的なサンガーおよびキャピラリー電気泳動に基づく手法と比較して、増加したスループットを有するシーケンシング技術を指す。これらのシーケンシング技術は、例えば、数十万の相対的に小さい配列リードまたは「リード」を一度に生成する能力を有する。次世代シーケンシング技法のいくつかの例は、合成によるシーケンシング、ライゲーションによるシーケンシング、およびハイブリダイゼーションによるシーケンシングを含むがこれらに限定されない。
【0039】
本明細書で使用される場合、「リード」または「配列リード」は、シーケンシングされた核酸分子に対応する一連の核酸塩基を含む。例えば、リードは、例えば次世代シーケンシング(「NGS」)などのシーケンシングに付された核酸断片において決定された、ヌクレオチドの配列を指すことができる。リードは、任意の数のヌクレオチドの任意の配列であり、ヌクレオチドの数がリード長さを定義し得る。
【0040】
本明細書で使用される場合、「主要組織適合性遺伝子複合体遺伝子」または「MHC遺伝子」は、免疫系の制御に関与する系、複合体、または細胞表面タンパク質群をコードする遺伝子である。
【0041】
本明細書で使用される場合、「ヒト白血球抗原遺伝子」または「HLA遺伝子」は、免疫系の制御に関与する系、複合体、または細胞表面タンパク質群をコードする遺伝子である。HLA系または複合体は、ヒトのMHC遺伝子複合体によりコードされる。細胞上に抗原を提示するMHC分子は、MHC分子のMHCクラスI、MHCクラスIIおよびMHCクラスIIIの3つのクラスのうちの1つに属するとカテゴリ化される。例えば、HLA-A、HLA-B、HLA-Cを含むある特定のHLA遺伝子は、MHCクラスIに対応する。例えば、HLA-DP、HLA-DM、HLA-DO、HLA-DQおよびHLADRを含むある特定のHLA遺伝子は、MHCクラスIIに対応する。公知であるHLA遺伝子は、例えば、HLA-A、HLA-B、HLA-C、HLA-E、HLA-F、HLA-G、HLA-H、HLA-J、HLA-K、HLA-L、HLA-N、HLA-P、HLA-S、HLA-T、HLA-U、HLA-V、HLA-W、HLA-X、HLA-Y、HLA-Z、HLA-DRA、HLA-DRB、HLA-DQ、HLA-DOA、HLA-DOB、HLA-DMA、HLA-DMB、HLA-DPA、HLA-DPB、およびHFEを含む。HLA領域に見出される他の遺伝子は、例えば、TAP1、TAP2、PSMB9、PSMB8、MICA、MICB、MICC、MICD、およびMICEを含む。
【0042】
本明細書で使用される場合、「T細胞」は、Tリンパ球としても公知であり、適応免疫細胞のタイプを指す。T細胞は胸腺で発展し、身体の免疫応答において中心的役割を果たす。T細胞は、細胞表面のT細胞受容体(TCR)の存在によって、他のリンパ球と区別され得る。これらの免疫細胞は、骨髄に由来する前駆細胞として始まり、胸腺に遊走するといくつかの異なるタイプのT細胞に発展する。T細胞分化は、胸腺を離れた後であっても持続している。T細胞は、ヘルパーT細胞、細胞傷害性T細胞、メモリT細胞、制御T細胞およびキラーT細胞を含むがこれらに限定されない。ヘルパーT細胞はB細胞を刺激して、抗体を作成し、キラー細胞の発展を助ける。T細胞受容体鎖に基づいて、T細胞は、αβTCR鎖を発現するT細胞、γδTCR鎖を発現するT細胞、ならびにαβおよびγδTCR鎖を共発現する特有のTCR共発現因子(co-expressor)(すなわち、ハイブリッドαβ-γδT細胞)も含む。
【0043】
T細胞は、特異的ながん細胞を攻撃することができる改変T細胞を含むこともできる。改変T細胞は、MHC提示ペプチドを認識するように設計され得る。例えば、改変T細胞は、HLA喪失に付されていない抗原を用いて設計され得る。改変T細胞は、研究所において数百万または数十億個が形成され、患者の身体に注入され得る。改変T細胞は、増加するように、および特異的なタンパク質または新生抗原を発現するがん細胞を認識するように設計され得る。このタイプの技術を、潜在的な次世代免疫療法治療に使用することができる。
【0044】
本明細書で使用される場合、「免疫療法」は、対象の免疫系の1つまたは複数の部分を使用して、例えば限定されることなく、がんなどの疾患と戦う治療または治療のクラスを指す。免疫療法は、身体から作成された、または身体以外から合成された物質を使用して、免疫系が、がん細胞を見出して破壊するように機能する方法を改善することができる。
【0045】
本明細書で使用される場合、「新生抗原」は、腫瘍における体細胞突然変異に由来する腫瘍特異的抗原であり、対象のがん細胞および抗原提示細胞により提示される。例えば、新生抗原ワクチンであるがこれに限定されない新生抗原療法は、個別化がん治療を提供する比較的新しい手法である。新生抗原ワクチンは、対象のT細胞を初回刺激して、1つまたは複数の特定の腫瘍新生抗原を発現するがん細胞を認識および攻撃させることができる。この手法は、健康な細胞を見逃し、一方で腫瘍細胞を標的化する、腫瘍特異的免疫応答を生成する。個別化ワクチンは、対象特異的腫瘍プロファイルに基づいて改変または選択され得る。腫瘍プロファイルは、対象の腫瘍細胞のDNAおよび/またはRNA配列を決定すること、ならびに配列を使用して、腫瘍細胞に存在するが正常な細胞では非存在である新生抗原を特定することによって定義され得る。
【0046】
III.HLA喪失の評価
本明細書に記載されている実施形態は、一般に、所定のHLA遺伝子のHLA喪失(例えば、HLA対立遺伝子発現喪失)に関して提示されている。しかし、本明細書に記載されている実施形態は、多数のHLA遺伝子におけるHLA喪失の評価にも同様に使用されることが理解されるべきである。例えば、所定のHLA遺伝子においてHLA対立遺伝子の喪失を評価する下記に記載されている様々なプロセスは、多数のHLA遺伝子にわたるHLA対立遺伝子の喪失を評価できるように、必要であれば反復または修正され得る。
【0047】
さらに、本明細書に記載されている実施形態は、一般に、所定のHLA遺伝子のHLA喪失(例えば、HLA対立遺伝子発現喪失)に関して提示されている。しかし、本明細書に記載されている実施形態は、1つまたは複数のMHC遺伝子におけるMHC喪失の評価にも同様に使用されることが理解されるべきである。したがって、修飾語「HLA」を含む本明細書で使用される用語(例えば、HLA喪失、HLAアラインメント入力、HLA対立遺伝子、HLA遺伝子等)は、修飾語MHC(例えば、MHC喪失、MHCアラインメント入力、MHC対立遺伝子、MHC遺伝子等)と交換可能であり得る。
【0048】
なおさらに、本明細書に記載されている実施形態は、一般に、HLA喪失(例えば、HLA対立遺伝子発現喪失)に関して提示されている。しかし、本明細書に記載されている実施形態は、1つまたは複数のHLA遺伝子におけるHLA獲得の評価にも同様に使用されることが理解されるべきである。よって、所定のHLA遺伝子においてHLA対立遺伝子の喪失を評価する下記に記載されている様々な方法およびシステムは、1つまたは複数のHLA遺伝子にわたるHLA対立遺伝子の獲得を評価できるように、必要であれば反復または修正され得る。さらに、様々な実施形態において、HLA喪失への参照は、HLA遺伝子における少なくとも1つのHLA対立遺伝子のコピー数の変更であるHLAコピー数変更の、1つまたは複数の他の形態と交換可能であり得ることが理解されるべきである。本明細書に記載されている実施形態において、HLAコピー数変更は、遺伝子の第1の対立遺伝子が失われ(第1の対立遺伝子の0コピーをもたらす)およびその遺伝子の第2の対立遺伝子が獲得される(第2の対立遺伝子の2つのコピーをもたらす)、コピーニュートラルヘテロ接合性喪失(copy-neutral loss of heterozygosity)(LOH)を含む。
【0049】
III.A HLA喪失を評価するシステム
図1は、1つまたは複数の実施形態によるHLA喪失を評価する評価システム100の例を図解する概略図である。評価システム100は、ハードウェア、ソフトウェア、ファームウェア、またはこれらの組み合わせを使用して実装される。評価システム100は、例えばコンピュータシステム102を使用して実装され得る。コンピュータシステム102は、単一コンピュータまたは互いに通信する多数のコンピュータを含む。コンピュータシステム102が多数のコンピュータを含む場合、一部の実施形態では、一方のコンピュータが少なくとももう一方のコンピュータから離れた位置にあってもよい。
【0050】
評価システム100は、対立遺伝子型ジェネレータ104、アラインメントアナライザ106、統計量ジェネレータ108、またはこれらの組み合わせを含む。対立遺伝子型ジェネレータ104、アラインメントアナライザ106および統計量ジェネレータ108のそれぞれは、ハードウェア、ソフトウェア、ファームウェア、またはこれらの組み合わせを使用して実装される。例えば、対立遺伝子型ジェネレータ104、アラインメントアナライザ106および統計量ジェネレータ108のそれぞれは、異なるコンパイルされたコンピュータプログラム、翻訳された言語スクリプト、別のタイプのソフトウェア、またはこれらの組み合わせとして実装され得る。アラインメントアナライザ106および統計量ジェネレータ108は、HLA喪失エバリュエータ110を形成する。HLA喪失エバリュエータ110は、様々な方法で実装され得る。
【0051】
1つまたは複数の実施形態において、アラインメントアナライザ106および統計量ジェネレータ108は別個のプログラムであり、それによってアラインメントアナライザ106は出力を生成し、該出力は統計量ジェネレータ108への入力として送り出される。他の実施形態において、アラインメントアナライザ106および統計量ジェネレータ108は統合される、またはアラインメントアナライザ106および統計量ジェネレータ108により実施される作動は、統合されて、HLA喪失エバリュエータ110を形成する。したがって、HLA喪失エバリュエータ110は、ハードウェア、ソフトウェア、またはこれらの組み合わせを使用して実装される。一部の実施形態において、HLA喪失エバリュエータ110には、コンパイルされたコンピュータプログラム、翻訳された言語スクリプト、別のタイプのソフトウェア、またはこれらの組み合わせが実装される。他の実施形態において、HLA喪失エバリュエータ110は、一緒に機能する複数のプログラムとして実装される。HLA喪失エバリュエータ110への本明細書における参照は、配列アナライザ106、統計量ジェネレータ108、配列アナライザ106および統計量ジェネレータ108の組み合わせ、アラインメントアナライザ106により実施される作動、統計量ジェネレータ108により実施される作動、配列アナライザ106および統計量ジェネレータ108の組み合わせにより実施される作動、またはこれらの組み合わせを指す。
【0052】
評価システム100は、リードデータ112を入力として受け取る。1つまたは複数の対立遺伝子型ジェネレータ104およびHLA喪失エバリュエータ110(例えば、アラインメントアナライザ106、統計量ジェネレータ108、または両方)は、リードデータ112を入力として受け取る。リードデータ112は、1つまたは複数のデータセットを含む。リードデータ112は、例えば、1つまたは複数のシーケンシングデータセットを含む。シーケンシングデータセットは、例えば、複数のリードを含む。一部の実施形態において、評価システム100は、データ格納114からリードデータ112を検索する。データ格納114は、例えば、データベース、データ記憶ユニット、スプレッドシート、ファイル、サーバ、クラウド記憶ユニット、クラウドデータベース、または他のいくつかのタイプのデータ格納のうちの少なくとも1つを含むがこれらに限定されない。一部の例において、データ格納114は、別個であるがコンピュータシステム102と通信する1つまたは複数のデータ記憶デバイスを含む。他の例において、データ格納114は、コンピュータシステム102の一部として少なくとも部分的に統合される。
【0053】
リードデータ112は、例えば、1つまたは複数の次世代シーケンシング(NGS)システムを使用して生成されるリード(例えば、配列リード)を含む。リードは、例えば、全エクソームシーケンシング(WES)、全ゲノムシーケンシング(WGS)、または両方を使用して生成される。リードは、例えば、ペアエンドシーケンシング(paired-end sequencing)を使用して生成され得る。
【0054】
例えば、リードデータ112は、少なくとも複数のリード116を含む。リード116は、対応する第1の試料のために生成され、第1の試料は、例えば生物学的試料であり得る。第1の試料は、例えば、対象(例えば、生存対象)から得ることができる。一部の実施形態において、リードデータ112は、第1の試料と異なる対応する第2の試料のために生成される複数のリード118をさらに含む。この第2の試料は、例えば、リード116が生成される対象と同じ、または異なる対象から得た生物学的試料であり得る。リード118は、一部の例では、シミュレーションを介して、多数の対象のために生成したリードのコレクションからの試料採取を介して、またはいくつかの他の方法を介して生成される。
【0055】
1つまたは複数の実施形態において、リード116およびリード118は、ペアエンドリードである。例えば、断片のペアエンドシーケンシングは、断片の5’末端から始まって生成された配列および断片の3’末端から始まって生成された配列の2つの配列をもたらす。これらの2つの配列は、ペアエンドリードを形成する。
【0056】
リードデータ112の少なくとも一部分(例えば、リード116、リード118)が生成される生物学的試料は、例えば、不健康もしくは疾患組織の試料、腫瘍組織の試料、腫瘍細胞を含む組織の試料、健康もしくは正常組織の試料、正常細胞を含む組織の試料、がん進行の第一期もしくは時点に採取された組織の試料、がん進行の第二期もしくは時点に採取された組織の試料、または別のタイプの試料であり得る。1つまたは複数の実施形態において、リード116は、健康または正常組織の試料のために生成され、リード118は、不健康または疾患組織(例えば、腫瘍)の試料のために生成される。一部の例において、リード116は、正常リードまたは健康リードと称され、リード118は、不健康リード、疾患リードまたは腫瘍リードと称される。
【0057】
対立遺伝子型ジェネレータ104は、リードデータ112(例えば、リード116またはリード118に基づく)を使用して、試料内の1つまたは複数の目的の遺伝子のために少なくとも1つの適用可能な、またはほぼ確実な対立遺伝子型を生成する。対立遺伝子型ジェネレータ104は、1つまたは複数の実施形態において、リード116を使用する対象に関連する対立遺伝子のセット120が対象のために生成されることを特定する。対立遺伝子のセット120は、リード116が所定のHLA遺伝子のために生成される試料内に存在する可能性が最も高いと決定される、HLA対立遺伝子のセットである。対立遺伝子型ジェネレータ104は、対立遺伝子のセット120の対立遺伝子識別子の最終セット122を特定することによって、対立遺伝子のセット120を特定する。対立遺伝子の対立遺伝子識別子は、様々な形態を取ることができる。例えば、対立遺伝子識別子は、対立遺伝子について異なるいくつかの情報を表す1つまたは複数のフィールドを形成する、様々な文字および/または桁から構成され得る。対立遺伝子識別子は、様々なレベルの分解能を有することができ、高いレベルの分解能は、低いレベルの分解能より多くの情報を提供する。一部の場合では、追加の文字および/または桁が追加の情報を提供する。一例として、6桁対立遺伝子識別子(または、6桁識別子)は、8桁対立遺伝子識別子(または、8桁識別子)より低い分解能を有する。一部の実施形態において、対立遺伝子識別子は、これらの対立遺伝子識別子により提示される情報フィールドの数によって参照される。例えば、6桁識別子は、3フィールド識別子と同じレベルの情報として参照され得る、または同じレベルの情報を一般に提供し得る。8桁識別子は、4フィールド識別子と同じレベルの情報として参照され得る、または同じレベルの情報を一般に提供し得る。
【0058】
HLA遺伝子のHLA対立遺伝子は、エクソン分解能識別子およびイントロン分解能識別子を含むがこれらに限定されない様々な分解能の識別子を使用して特定され得る。HLA対立遺伝子のエクソン分解能識別子は、対立遺伝子群、特異的対立遺伝子タンパク質、および対応するHLA対立遺伝子のエクソン領域情報を記載する。1つまたは複数の実施形態において、エクソン分解能識別子は、6桁識別子であり、第1桁および第2桁は対立遺伝子群を特定し、第3桁および第4桁は特異的対立遺伝子タンパク質を特定し、第5桁および第6桁はエクソン領域情報を特定する。特異的対立遺伝子タンパク質は、DNA配列、およびコードタンパク質のアミノ酸配列内の差に基づいて決定される。エクソン領域情報は、例えば同義ヌクレオチド置換など、HLA対立遺伝子の1つまたは複数のエクソン領域における変化を捕らえる。6桁識別子は、対応するHLA遺伝子、発現レベル、または両方を示す1つまたは複数の文字を含む。他の実施形態において、エクソン分解能識別子は3フィールド識別子であり、各フィールドは任意の数の文字、桁、記号、またはこれらの組み合わせから構成される。
【0059】
イントロン分解能識別子は、エクソン分解能識別子より多くの情報を提供し、したがって、エクソン分解能識別子より高いレベルの分解能を有する。HLA対立遺伝子イントロン分解能識別子は、対立遺伝子群、特異的対立遺伝子タンパク質、エクソン領域情報、および対応するHLA対立遺伝子のイントロン領域情報を記載する。1つまたは複数の実施形態において、イントロン分解能識別子は8桁識別子であり、上記に記載された6桁識別子に、イントロン領域情報を特定する第7桁および第8桁を加えたものである。イントロン領域情報は、例えばイントロン領域における多型など、HLA対立遺伝子の1つまたは複数のイントロン領域における変化を捕らえる。対立遺伝子識別子の最終セット122は、1つまたは複数の実施形態において、イントロン分解能識別子の最終セットである。8桁識別子は、対応するHLA遺伝子、発現レベル、または両方を示す1つまたは複数の文字を含む。他の実施形態において、イントロン分解能識別子は4フィールド識別子であり、1つのフィールド(例えば、任意の数の文字、桁、記号、またはこれらの組み合わせから構成される)を3フィールド識別子に加えたものである。
【0060】
対立遺伝子型ジェネレータ104は、リード116を使用して決定される、所定のHLA遺伝子に対応する対立遺伝子識別子の最終セット122を出力する。HLA喪失エバリュエータ110は、対立遺伝子識別子の最終セット122を入力として受け取る。HLA喪失エバリュエータ110は、対立遺伝子識別子の最終セット122およびリードデータ112を使用して、HLA喪失情報124を生成する。HLA喪失情報124は、リード116およびリード118から、2つの試料間のHLA喪失を記載する様々な情報を含み得る。例えば、HLA喪失情報124は、リード116に関連する試料と比較した、リード118に関連する試料におけるHLA喪失を定量化および/または定性化するために使用できる1つまたは複数の情報を含む。
【0061】
上記のセクションIIに既に記載されているように、HLA遺伝子におけるHLA対立遺伝子のHLA喪失は、そのHLA対立遺伝子の発現の非存在または減少を指す。HLA喪失情報124は、この発現の非存在または減少を定量化および/または定性化するために使用できる情報を提供する。HLA喪失情報124に含まれる情報の例は、HLA遺伝子の対立遺伝子識別子と様々なリードとのアラインメントに基づいて生成された統計量である。HLA喪失情報124に含まれる情報の別の例は、統計量を使用して作成された1つまたは複数の結論または推論である。HLA喪失情報124に含まれる情報のなお別の例は、HLA喪失量の推定(例えば、百分率等)である。
【0062】
1つまたは複数の実施形態において、HLA喪失情報124は、アラインメントアナライザ106および統計量ジェネレータ108が関与する作動により生成される。アラインメントアナライザ106は、例えば、対立遺伝子識別子の最終セット122を入力として受け取り、この入力に基づいてアラインメント出力126を生成する。アラインメントアナライザ106は、対立遺伝子識別子の最終セット122の対応する1つにより特定されたそれぞれの対立遺伝子と、リード116およびリード118とのアラインメントの分析を実施する。アラインメント出力126は、これらのアラインメントの定量化を提供する。1つまたは複数の実施形態において、アラインメント出力126はまた、非HLA遺伝子とリード116およびリード118とのアラインメントの定量化も含む。
【0063】
アラインメントアナライザ106は、アラインメント出力126を出力し、統計量ジェネレータ108は、アラインメント出力126を入力として受け取る。統計量ジェネレータ108は、アラインメント出力126および一部の場合では他の情報を使用して、統計分析128を実施する。統計ジェネレータ108は、統計量を生成する1つもしくは複数のアルゴリズム、1つもしくは複数の数式もしくは数学的方程式、1つもしくは複数の他のタイプの分析技術、またはこれらの組み合わせを使用して統計分析128を実施する。HLA喪失エバリュエータ110は、統計分析128の結果、統計分析128の結果に基づいて作成された1つもしくは複数の推論もしくは結論、またはこれらの組み合わせを使用して、HLA喪失情報124を生成する。
【0064】
HLA喪失エバリュエータ110は、一部の実施形態において、HLA喪失情報124を使用して報告130を生成する。報告130は、例えば、限定されることなく、表、スプレッドシート、データベース、ファイル、プレゼンテーション、警告、グラフ、チャート、1つもしくは複数のグラフィック、またはこれらの組み合わせのうちの少なくとも1つを含むことができる。HLA喪失エバリュエータ110は、任意選択で、ディスプレイシステム132に報告を表示する。ディスプレイシステム132は、コンピュータシステム102と通信する1つまたは複数のディスプレイデバイスを含む。ディスプレイシステム132は、別個であっても、コンピュータシステム102の一部として少なくとも部分的に統合されていてもよい。
【0065】
評価システム100の作動が所定のHLA遺伝子に関して一般的に記載されているが、評価システム100は、試料中の複数のHLA遺伝子のそれぞれの対立遺伝子のセットを特定すること、および特定された対立遺伝子のセットを使用してHLA喪失を評価することができる。さらに、対立遺伝子型ジェネレータ104は、評価システム100の一部として示されているが、他の実施形態では、対立遺伝子型ジェネレータ104は、評価システム100と別個であり得る。
【0066】
図2は、1つまたは複数の実施形態によるHLA喪失を評価するプロセス200の例を図解する流れ図である。プロセス200は、図1の評価システム100または評価システム100の少なくとも一部分により実装されるプロセスの一例である。
【0067】
ステップ202は、第1の試料の第1の複数のリード、および第2の試料の第2の複数のリードを受け取ることを含む。第1の試料および第2試料は生物学的試料である。第1の試料は、例えば、健康または正常組織の試料であり得るが、これらに限定されない。第2の試料は、例えば、不健康または疾患組織(例えば、腫瘍)の試料であり得るが、これらに限定されない。1つまたは複数の実施形態において、第1の複数のリードは、図1のリード116を含み、第2の複数のリードは、図1のリード118を含む。
【0068】
ステップ204は、第1の複数のリード、およびセットカバーリングアルゴリズムを使用して、HLA遺伝子の対立遺伝子ペアのそれぞれの対立遺伝子のイントロン分解能識別子の最終セットを特定することを含む。対立遺伝子ペアの2つの対立遺伝子が同じ場合、イントロン分解能識別子の最終セットは、対立遺伝子ペアのそれぞれの対立遺伝子で同じである。あるいは、対立遺伝子ペアは、イントロン分解能識別子の最終セットが対立遺伝子ペアのそれぞれの対立遺伝子で異なるように、ヘテロ接合性対立遺伝子ペアであり得る。ステップ204の実装に使用され得るプロセスの例が、下記のセクションIII.Bの図3~7にさらに詳細に記載されている。
【0069】
ステップ206は、イントロン分解能識別子の最終セットを使用して、対立遺伝子配列ペアのセットを特定することを含む。対立遺伝子配列ペアのセットにおけるそれぞれの対立遺伝子配列ペアは、対立遺伝子ペアの第1の対立遺伝子配列および第2の対立遺伝子配列を含む。一部の例では、単一の対立遺伝子配列ペアが形成される。他の例では、多数の特有の対立遺伝子配列ペアが、イントロン分解能識別子の最終セットから形成される。イントロン分解能識別子の最終セットが単一のイントロン分解能識別子を含む場合は、イントロン分解能識別子に対応する対立遺伝子配列を2回(例えば、ホモ接合性のために)使用して、対立遺伝子配列ペアを形成する。
【0070】
ステップ208は、第1の対立遺伝子配列、第2の対立遺伝子配列、第1の複数のリード、および第2の複数のリードを使用して、複数のアラインメントカウントを対立遺伝子配列ペアのセットにおけるそれぞれの対立遺伝子配列ペアのために生成することを含む。ステップ208の実装に使用されるプロセスの例が、下記のセクションIII.C.1の図8にさらに詳細に記載されている。ステップ208に生成される複数のアラインメントカウントは、アラインメント出力(例えば、図1のアラインメント出力126)に含まれる情報の一例であり得る。よって、ステップ208は、第1の複数のリード、第2の複数のリードおよび対立遺伝子配列ペアのセットを使用してアラインメント出力を生成する方法の一例であり得る。
【0071】
ステップ210は、アラインメント出力に基づいて対立遺伝子配列ペアのセットの統計分析を実施することを含む。統計分析を実施して、HLA喪失の評価に使用される統計出力を生成する。ステップ210の実装に使用されるプロセスの例が、下記のセクションIII.C.2の図9にさらに詳細に記載されている。ステップ210は、例えば、対立遺伝子の遺伝子の対立遺伝子ペアにおける対立遺伝子の発現についての情報を提供することを含む。1つまたは複数の実施形態において、ステップ210は、非HLA対立遺伝子と第1の複数のリードおよび第2の複数のリードのそれぞれとのアラインメントによって記載された、そうでなければアラインメントから推論された全体的な遺伝子変動に関するこの情報の少なくとも一部分を提供することを含む。
【0072】
ステップ212は、実施された統計分析に基づいてHLA喪失を評価することを含む。ステップ212は、例えば、ステップ212において実施された統計分析に基づいて推論または結論を生成することを含む。1つまたは複数の実施形態において、ステップ212は、対立遺伝子ペアの対立遺伝子の発現が正常であるか、または単一欠失、二重欠失、ヘテロ接合性喪失(LOH)、例えばコピーニュートラルLOHなど、単一増幅、二重増幅、もしくは別の遺伝子/染色体事象/突然変異を示すかを決定することを含む。よって、ステップ212は、HLA喪失が存在するかを推定することができる。ステップ212の実装に使用されるプロセスの例が、下記のセクションIII.C.3の図10にさらに詳細に記載されている。
【0073】
ステップ212により実施される評価を使用して、対象に関する様々な決定を行うことができる。これらの決定は、例えば、診断、治療、疾患進行/転帰の予測、またはこれらの組み合わせに関して行うことができる。行うことができるいくつかのタイプの決定の例が、下記のセクションIII.Dに記載されている。
【0074】
III.B HLA対立遺伝子の型決定
対象の試料におけるHLA喪失が評価される前に、対象に存在するHLA対立遺伝子が特定される。対象はHLA型決定される。このHLA型決定は、それぞれの公知のHLA遺伝子(例えば、HLA-A、HLA-B、HLA-C等)に関して実施することができる。一部の場合では、対象におけるそれぞれのHLA遺伝子について、対象に存在する正確に2つのHLA対立遺伝子が特定される。これらの2つのHLA対立遺伝子は、同じ(即ち、ホモ接合性)であっても、異なって(即ち、ヘテロ接合性)いてもよい。他の場合では、それぞれのHLA遺伝子について、対象に存在する2つのHLA対立遺伝子の最も可能性のある選択肢が特定される。
【0075】
III.B.1 イントロン分解能識別子を特定するためのHLA型決定
図3は、1つまたは複数の実施形態によるHLA対立遺伝子を型決定するプロセス300の例を図解する流れ図である。プロセス300は、図1の評価システム100または評価システム100の少なくとも一部分により実装されるプロセスの一例である。プロセス300は、例えば、図1の対立遺伝子型ジェネレータ104により実装され得る。プロセス300は、上記に記載された図2のステップ204に含まれ得るプロセスの一例である。
【0076】
ステップ302は、対象におけるHLA遺伝子に関連する対立遺伝子のセットのそれぞれの対立遺伝子のエクソン分解能識別子のセットを受け取ることを含む。既に記載されているように、エクソン分解能識別子、例えば、対立遺伝子のセットの対応する対立遺伝子のエクソン分解能識別子のセットの1つは、対立遺伝子群、特異的対立遺伝子タンパク質、および対応する対立遺伝子のエクソン領域情報を記載する。1つまたは複数の実施形態において、エクソン分解能識別子のセットは、異なるシステムからの入力(例えば、高品質辞書システムからHLA型決定(HLA-HD)により受け取った入力)として受け取られる。他の実施形態において、エクソン分解能識別子のセットは、例えば、図1の対立遺伝子型ジェネレータ104の出力の例である。エクソン分解能識別子のセットを特定することができる方法の一例が、下記の図6に記載されている。
【0077】
ステップ302では、エクソンレベルのホモ接合性の場合のHLA遺伝子に関連する単一対立遺伝子のため、エクソン分解能識別子のセットを受け取ることができる。例えば、エクソン分解能識別子のセットは、HLA遺伝子に関連する対立遺伝子ペアと同一であるので、単一対立遺伝子(したがって、エクソン分解能識別子の単一セット)がステップ302に使用される。このタイプのナローイングまたはフィルタ処理は、プロセス300の実施に関連する全体的な時間および/または処理資源を低減する。
【0078】
ステップ304は、試料の複数のリードを受け取ることを含む。試料は、例えば、対象から得た生物学的試料であり得る。試料は、例えば、健康または正常組織の試料であり得る。試料は、例えば、目的の時点で採取された不健康または疾患組織の試料であり得る。複数のリードは、一部の実施形態において、WESまたはWGSを介して生成されたリードを含む。他の実施形態において、複数のリードは、シミュレーションを介して、多数の対象にために生成したリードのコレクションからの試料採取を介して、またはいくつかの他の方法を介して生成されたリードを含む。
【0079】
ステップ306は、対立遺伝子のセットのそれぞれの対立遺伝子のエクソン分解能識別子のセットのそれぞれのエクソン分解能識別子のために、イントロン分解能識別子のセットを特定して、複数のイントロン分解能候補識別子を形成することを含む。既に記載されているように、イントロン分解能識別子、例えば、対応する対立遺伝子のイントロン分解能識別子のセットの1つは、対立遺伝子群、特異的対立遺伝子タンパク質、エクソン領域情報、および対応する対立遺伝子のイントロン領域情報を記載する。よって、所定のHLA遺伝子のイントロン分解能識別子は、同じHLA対立遺伝子のエクソン分解能識別子より高いレベルの分解能を提供する。
【0080】
様々な実施形態において、ステップ306は、データ格納、例えば図1のデータ格納114から、または所定のエクソン分解能識別子(例えば、6桁識別子)の公知のイントロン分解能識別子(例えば、8桁識別子)である別のデータ源(例えば、international ImMunoGeneTics information system(登録商標)(IMGT(登録商標)データベース)から検索することを含む。例えば、特定のHLA遺伝子(例えば、HLA-A、HLA-B、HLA-C等)は、イントロン領域に公知のΡ個の多型組み合わせを有してもよい。よって、イントロン領域情報は、そのHLA遺伝子の所定のエクソン分解能識別子のΡ個の異なる可能なイントロン分解能候補識別子を特定することができる。
【0081】
ステップ308は、対立遺伝子のセットのそれぞれの対立遺伝子のために、複数のイントロン分解能候補識別子からイントロン分解能識別子の最終セットを生成することを含む。単一イントロン分解能識別子を含むイントロン分解能識別子の最終セットは、イントロン分解能レベルでホモ接合性を示す。HLA遺伝子に予測される2つのHLA対立遺伝子に一つずつの2つのイントロン分解能識別子を含むイントロン分解能識別子の最終セットは、イントロン分解能レベルでヘテロ接合性を示す。一部の実施形態において、イントロン分解能識別子の最終セットは、2つの対立遺伝子のうちの少なくとも一方に多数のイントロン分解能識別子を含む。よって、イントロン分解能識別子の最終セットは、論理和イントロン分解能識別子のペアであり得る。
【0082】
図4は、1つまたは複数の実施形態によるイントロン分解能識別子の最終セットを生成するプロセス400の例を図解する流れ図である。プロセス400は、図1の評価システム100または評価システム100の少なくとも一部分により実装されるプロセスの一例である。プロセス400は、例えば、図1の対立遺伝子型ジェネレータ104により実装され得る。プロセス400は、上記に記載された図3のステップ308に含まれ得るプロセスの一例である。
【0083】
ステップ402は、セットカバーリングアルゴリズムを複数のリードに適用して、複数のイントロン分解能候補識別子からイントロン分解能識別子ペアのセットを特定することを含む。複数のイントロン分解能候補識別子は、例えば、上記に記載された図3のステップ306で特定された複数のイントロン分解能候補識別子であり得る。
【0084】
一般に、項目のユニバースUおよびUのサブセットのファミリーSを考慮すると、セットカバーはサブファミリーC⊆Sであり、このユニオンはUである。セットカバーリングアルゴリズムの一例は、最も少ない数のセットを含有するセットカバーCを見出す。ステップ402において、項目のユニバースUは、例えばリード116を含み、Sは、例えば図1のデータ格納114で特定され得るすべての公知のHLA対立遺伝子のファミリーである。単一HLA対立遺伝子に対応するそれぞれのサブセットのSは、その対立遺伝子と適合性であるリードと定義され、ここで適合性は、対立遺伝子の一部に対するリードの配列類似性によって決定される。一部の実施形態において、ステップ402に使用されるセットカバーリングアルゴリズムは、HLA対立遺伝子が遺伝子によりグループ化(例えば、HLA-A、HLA-B、HLA-C等)される、修正セットカバーリングアルゴリズムである。制約付きセットカバーC⊆Sは、各遺伝子から少数(例えば、1つ、2つ等)の対立遺伝子までのみを含有するものである。修正セットカバーリングアルゴリズムは、ユニオンU⊆Uが、すべての可能な制約付きセットカバーと比べて、合計濃度M=|U|に対して最大濃度Nを有する、制約付きセットカバーを見出す。
【0085】
ステップ402は、イントロン分解能識別子の単一ペアまたはイントロン分解能識別子の多数のペアをセットカバーリングソリューションとして特定することを含む。一部の例において、ステップ402で特定されたイントロン分解能識別子のペアは、カバーされたリードの最大数Nが複数のリードにおけるリードの総数Mに等しくなるように、複数のリードの100%のカバレージを提供する。他の例において、ステップ402で特定されたイントロン分解能識別子のペアは、100%未満のカバレージを提供する。この方法では、ステップ402で特定されたイントロン分解能識別子のそれぞれのペアが、例えば、複数のリードのすべて、またはほぼすべてのリードを説明することができるステップ402で特定されたイントロン分解能識別子のそれぞれのペアは、ソリューションペアである。
【0086】
一部の実施形態において、ステップ402またはステップ402の後のプロセス400は、Nが、いくつかの閾値数または百分率だけMより少ない場合(例えば、Nが、1%、2%、3%、5%、10%等を超えてMより少ない)場合に警告を生成することを含む。
【0087】
一部の実施形態において、ステップ402は、セットカバーリングアルゴリズムを介して見出された1つまたは複数のソリューションの「適合度」を計算することを含む。この「適合度」測定値は、例えば、様々な対立遺伝子により説明されるリードの割合であり得る。
【0088】
ステップ402のセットカバーリングアルゴリズムの使用は、遺伝子クロストークに関連する問題の低減または排除の助けとなる。クロストークは、2つの異なる遺伝子でリードが対立遺伝子とアラインする場合に起こる。例えば、HLA-A遺伝子およびHLA-B遺伝子の両方の対立遺伝子とアラインするリードは、クロストークの一例である。クロストークは、カバレージを人工的に膨張させ得る。例えば、クロストークは、対立遺伝子により提供されるリードのカバレージの量を人工的に膨張させ得る。セットカバーリングアルゴリズムは、ペア毎にクロストークするすべてのHLA遺伝子を集合的に解決する。
【0089】
ステップ404は、イントロン分解能識別子の単一ペアまたは多数のペアが特定されたかを決定することを含む。単一ペアが特定された場合は、ステップ406が実施される。
【0090】
ステップ406は、イントロン分解能識別子の単一ペアのイントロン分解能識別子のいずれかが所望のカバレージを独立して提供するかを決定することを含む。例えば、イントロン分解能識別子の単一ペアは、第1の対立遺伝子のために第1のイントロン分解能識別子および第2の対立遺伝子のために第2のイントロン分解能識別子を含む。ステップ406は、例えば、第1のイントロン分解能識別子によりカバーされたリードの最大数N1が、イントロン分解能識別子ペアによりカバーされたリードの最大数Nに等しいかを決定することを含む。一部の実施形態において、ステップ406は、第1のイントロン分解能識別子によりカバーされたリードの最大数N1が、イントロン分解能識別子ペアによりカバーされたリードの最大数Nの選択範囲内であるかを決定することを含む。ステップ406は、例えば、第2のイントロン分解能識別子によりカバーされたリードの最大数N2がNに等しいかを決定することを含む。一部の実施形態において、ステップ406は、第2のイントロン分解能識別子によりカバーされたリードの最大数N2がNの選択範囲内であるかを決定することを含む。N1およびN2に関して上記に考察された選択範囲とは、例えば、1つのリード、2つのリード、3つのリード等であり得る。ステップ406において、N1またはN2のいずれかがNに等しい(または、一部の実施形態では、Nの選択範囲内である)場合、対応するイントロン分解能識別子は、所望のカバレージを提供していると考慮される。
【0091】
イントロン分解能識別子の単一ペアの単一イントロン分解能識別子が所望のカバレージを提供する場合には、ステップ408が実施される。そうでなければ、ステップ410が実施される。ステップ408は、単一イントロン分解能識別子をイントロン分解能識別子の最終セットとして出力することを含む。ステップ410は、イントロン分解能識別子のペアをイントロン分解能識別子の最終セットとして出力することを含む。
【0092】
再びステップ404を参照すると、イントロン分解能識別子の多数のペアが特定される場合には、ステップ412が実施される。ステップ412は、分解を実施して、イントロン分解能識別子の最終セットを形成することを含む。ステップ412の分解は、様々な方法により実施され得る。1つまたは複数の実施形態において、分解は、ペア(X,X)の論理和Dを処理することを含み、ここで、i≠jであり、XおよびXは、可能なイントロン分解能識別子Xのセットのメンバーである。分解アルゴリズムは、ペア(Y,Z)の論理和を生成し、ここで、Y⊆XおよびZ⊆Xは、論理和であり、YおよびZのクロス乗積はDのスーパーセットである。この論理和のペアは、例えば、第1の対立遺伝子および第2の対立遺伝子のうちの少なくとも1つの対立遺伝子の多数のイントロン分解能識別子を含む。ステップ412は、例えば、階層クラスタリングを実施することを含んでもよい。本明細書で使用される場合、「階層クラスタリング」は、階層的クラスター分析としても公知であり、類似オブジェクトをクラスターと呼ばれる群にグループ化する1つまたは複数のアルゴリズムを含む。エンドポイントは、クラスターのセットであり、それぞれのクラスターは、他のクラスターと互いに異なっており、それぞれのクラスター内のオブジェクトは、互いに広く類似している。
【0093】
図5は、1つまたは複数の実施形態によるイントロン分解能識別子ペアの論理和の行列表現の例の図解である。マトリックス500は、例えば、イントロン分解能識別子の多数のペアにより提供されるカバレージを表す。これらのイントロン分解能識別子の多数のペアは、セットカバーリングアルゴリズム、例えば、上記に記載された図4のステップ402に適用されたセットカバーリングアルゴリズムにより生じるソリューションペアの論理和である。それぞれのソリューションペアは、リード(例えば、図1のリード116)の最適カバレージを提供する対立遺伝子のペアである。
【0094】
1つまたは複数の例において、マトリックス500は、図4のステップ412の分解プロセスが実施されるイントロン分解能識別子のソリューションペアの2つの対立遺伝子のための、様々なイントロン分解能識別子を表す。例えば、イントロン分解能識別子のソリューションペアの総数Sは、集合的に見ると、第1の対立遺伝子のx個の異なるイントロン分解能識別子および第2の対立遺伝子のy個の異なるイントロン分解能識別子を含む。マトリックス500は、これらのx個の異なるイントロン分解能識別子およびy個の異なるイントロン分解能識別子をアンペアード(unpaired)分解方式で表す。
【0095】
例えば、イントロン分解能識別子のそれぞれのペアは、第1の対立遺伝子のためのイントロン分解能識別子および第2の対立遺伝子のためのイントロン分解能識別子を含む。マトリックス500は、第1の対立遺伝子のペアにおけるすべてのイントロン分解能識別子を表す横列502を含む。1つまたは複数の例において、イントロン分解能識別子が8桁識別子である場合、横列502は、それぞれ、対応する8桁識別子の第7桁および第8桁により表される。マトリックス500は、第2の対立遺伝子のペアにおけるすべてのイントロン分解能識別子を表す縦列504をさらに含む。1つまたは複数の例において、イントロン分解能識別子が8桁識別子である場合、縦列504は、それぞれ、対応する8桁識別子の第7桁および第8桁により表される。
【0096】
マトリックス500の要素506は、対応する横列および対応する縦列により形成されるペアがソリューションペアのうちの1つであるかを示す。例えば、要素506は、網掛け要素508および非網掛け要素510を含む。網掛け要素508の網掛け要素は、例えば、対応する横列および対応する縦列により形成されるイントロン分解能識別子のペアがソリューションペアであることを表す。非網掛け要素510の非網掛け要素は、例えば、対応する横列および対応する縦列により形成されるイントロン分解能識別子のペアがソリューションペアではないことを表す。
【0097】
分解を、例えば、階層クラスタリングを介して実施して、マトリックス500に表されているイントロン分解能識別子のペアの論理和を論理和のペアに転換することができる。よって、分解は、イントロン分解能識別子のペアをアンペア(unpair)する。階層クラスタリングは、イントロン分解能識別子間の類似性または近似性を決定することを含む。この類似性または近似性は、例えば限定されることなく、Dice距離(または、Dice係数)を含む様々な方法により測定され得る。階層クラスタリングを使用して、第1の対立遺伝子のために1つまたは複数のイントロン分解能識別子、および第2の対立遺伝子のために1つまたは複数のイントロン分解能識別子を特定する。
【0098】
III.B.2 エクソン分解能識別子を特定するためのHLA型決定
図6は、1つまたは複数の実施形態によるHLA対立遺伝子を型決定するプロセス600の例を図解する流れ図である。プロセス600は、図1の評価システム100または評価システム100の少なくとも一部分により実装されるプロセスの一例である。プロセス600は、例えば、図1の対立遺伝子型ジェネレータ104により実装され得る。プロセス600は、上記に記載された図2のステップ204に含まれ得るプロセスの一例である。プロセス600は、上記に記載されたステップ302で受け取られる入力を生成するために使用することができるプロセスの一例である。
【0099】
ステップ602は、試料の複数のリードを受け取ることを含む。試料は、生物学的試料である。試料は、例えば、健康または正常組織の試料であり得る。試料は、例えば、目的の時点で採取された不健康または疾患組織の試料であり得る。
【0100】
プロセス600は、任意選択でステップ603を含んでもよい。例えば、1つまたは複数の実施形態において、プロセス600は、下記に記載されているように、ステップ603、続いてステップ604を実施することを含む。他の実施形態において、プロセス600は、ステップ602の後に、下記に記載されているステップ604を実施することを含む。
【0101】
ステップ603は、複数のリードをフィルタ処理して、フィルタ処理された複数のリードを形成することを含む。このフィルタ処理は、異なる方法で実施することができる。
【0102】
1つまたは複数の実施形態では、複数のリードを、非HLAゲノム、HLA対立遺伝子の参照ドメイン、個別のHLAエクソン、またはこれらの組み合わせとアラインさせて、HLA関連リードを特定することができる。非HLAゲノムは、HLA遺伝子を除くゲノムの部分であり得る。HLA対立遺伝子の参照ドメインは、例えば、すべての公知のHLA対立遺伝子を含んでもよい。HLAエクソンは、HLA遺伝子の少なくとも1つのHLA対立遺伝子に現れるエクソンである。非HLAゲノム、HLA対立遺伝子の参照ドメイン、HLAエクソン、またはこれらの組み合わせは、データ格納、例えば、図1のデータ格納114、別のデータ源(例えば、international IMGT(登録商標)データベース)またはこれらの組み合わせから検索され得る。HLAが関連する(例えば、非HLAゲノムとアラインせず、HLA対立遺伝子とアラインする、または少なくとも1つのHLAエクソンとアラインする)リードは、HLA関連またはHLAリードと考慮される(リードの「フィルタ処理された」セットとも称され得る)。
【0103】
同じまたは異なる実施形態において、HLAリードは、フォワードまたはリバース相補体方向のいずれかの複製である任意のペアエンドリードを、そのようなリードが望ましくないアーチファクト(例えば、PCR複製アーチファクト)を表し、それによってフィルタ処理された複数のリードを形成し得るので、除去することにより、ステップ603でフィルタ処理される。よって、ステップ603で形成されるフィルタ処理された複数のリードは、1つまたは2つのレベルのフィルタ処理を介してフィルタ処理され得る。
【0104】
ステップ604は、複数のリードの少なくとも一部分と、HLA遺伝子のそれぞれのエクソン位置のエクソン識別子の最終セットにより形成されるシリーズとのアラインメントを評価することを含む。それぞれのHLA遺伝子は、イントロンにより散在されたエクソンのある特定の数を有し得る。各エクソンは、HLA遺伝子にエクソン位置を有すると考慮され得る。604がステップ603の後に実施される場合、アラインメントの評価に使用される複数のリードの部分は、フィルタ処理された複数のリードである。604がステップ602の後に実施される場合、アラインメントの評価に使用される複数のリードの部分は、複数のリードをすべて含む。ステップ604は、アラインメントが既に実施された後のアラインメントを評価することを含んでもよく、またはアラインメントを実施し、アラインメントを評価することを含んでもよい。
【0105】
ステップ604において、HLA遺伝子の一連のエクソン分解能識別子は、HLA遺伝子に対応するHLA対立遺伝子の参照ドメインのサブドメインの潜在的エクソン分解能識別子に基づいて生成され得る。このサブドメインは、所定のHLA遺伝子に可能なHLA対立遺伝子(例えば、所定のHLA遺伝子のすべての可能な(非制約)HLA対立遺伝子)の参照ドメイン内のHLA対立遺伝子の部分を含む。ステップ604に記載されているアラインメントは、例えばペアエンドアラインメントを使用して実施することができる。ペアエンドアラインメントは、対立遺伝子と、ペアエンドリードとのアラインメントである。換言すると、アラインメントは、対立遺伝子がペアエンドリードの両方の配列とアラインする場合に起こる。一部の実施形態において、シリーズは、図7Bのプロセス720を使用して決定される。
【0106】
ステップ606は、エクソンカバレージに基づいてHLA遺伝子の各エクソン位置のエクソン識別子の最終セットにより形成されたシリーズから、複数のエクソン分解能候補識別子を形成することを含む。1つまたは複数の実施形態において、ステップ606は、HLA遺伝子の一連のエクソン分解能識別子を使用して、各エクソン位置の潜在的エクソン分解能識別子のリストを、その位置のエクソン識別子の最終セットに基づいて制約して、複数のエクソン分解能候補識別子を形成することにより実施する。これは、エクソン位置の順番(例えば、最大の多様度(例えば、配列バリアント)を有するエクソン位置の順番)で制約することにより進行的に実施され得る。この潜在的エクソン分解能識別子(例えば、エクソン分解能識別子の初期群)の制約は、エクソン位置が完了するまで、または潜在的エクソン分解能識別子のないことが特定されたエクソン位置に達するまで、各エクソン位置について進行的に実施することができる。
【0107】
一部の実施形態において、ステップ606は、例えば、潜在的エクソン分解能識別子に関連する複数のエクソンが、複数のリードにより、少なくともカバレージ閾値までカバーされているかを決定することにより実施することができる。ステップ606は、例えば、潜在的エクソン分解能識別子に関連する複数のエクソンが、複数のリードにより、カバレージ閾値までカバーされている場合、潜在的エクソン分解能識別子を複数のエクソン分解能候補識別子に付加することを含むことができる。一部の例において、カバレージ閾値は100%のカバレージである。他の例において、カバレージ閾値は100%未満のカバレージである。例えば、カバレージ閾値は、複数のエクソンの1つまたは2つを除いてすべてのカバレージであり得る。別の例では、カバレージ閾値は、複数のエクソンのそれぞれのエクソンの少なくとも90%のカバレージ(例えば、少なくとも90%のエクソン領域が複数のリードにより説明される)であり得る。よって、カバレージ閾値は様々な方法で設定され得る。
【0108】
ステップ608は、HLA遺伝子の対立遺伝子のセットのそれぞれの対立遺伝子のために、複数のエクソン分解能候補識別子からエクソン分解能識別子のセットを生成することを含む。エクソン分解能識別子のセットが単一エクソン分解能識別子を含む場合、このことは、エクソン分解能レベルでのホモ接合性を示す。エクソン分解能識別子のセットが、HLA遺伝子に予測される2つのHLA対立遺伝子に一つずつの2つのエクソン分解能識別子を含む場合、このことは、エクソン分解能レベルでのヘテロ接合性を示す。
【0109】
図7Aは、1つまたは複数の実施形態によるエクソン分解能識別子のセットを生成するプロセス700の例を図解する流れ図である。プロセス700は、図1の評価システム100または評価システム100の少なくとも一部分により実装されるプロセスの一例である。プロセス700は、例えば、図1の対立遺伝子型ジェネレータ104により実装され得る。プロセス700は、上記に記載された図6のステップ608に含まれ得るプロセスの一例である。
【0110】
ステップ702は、セットカバーリングアルゴリズムを複数のリードに適用して、複数のエクソン分解能候補識別子からエクソン分解能識別子ペアのセットを特定することを含む。複数のエクソン分解能候補識別子は、例えば、上記に記載された図6のステップ606で特定された複数のエクソン分解能候補識別子であり得る。ステップ702は、エクソン分解能識別子の単一ペアまたはエクソン分解能識別子の多数のペアをセットカバーリングソリューションとして特定することを含む。一部の例において、ステップ702で特定されたエクソン分解能識別子のペアは、カバーされたリードの最大数Nが複数のリードにおけるリードの総数Mに等しくなるように、複数のリードの100%のカバレージを提供する。他の例において、ステップ702で特定されたエクソン分解能識別子のペアは、100%未満のカバレージを提供する。この方法では、ステップ702で特定されたエクソン分解能識別子のそれぞれのペアが、例えば、複数のリードのすべて、またはほぼすべてのリードを説明することができる
【0111】
エクソン分解能識別子のペアのセットを特定するためのセットカバーリングアルゴリズムの使用は、遺伝子クロストークに関連する問題の低減または排除の助けとなる。既に考察されているように、クロストークは、2つの異なる遺伝子でリードが対立遺伝子とアラインする場合に起こる。例えば、HLA-A遺伝子およびHLA-B遺伝子の両方の対立遺伝子とアラインするリードは、クロストークの一例である。クロストークは、エクソンカバレージを人工的に膨張させ得る。例えば、クロストークは、リードにより提供される対立遺伝子配列のエクソン領域のカバレージの量を人工的に膨張させ得る。
【0112】
一部の実施形態において、ステップ702は、セットカバーリングアルゴリズムを介して見出された1つまたは複数のソリューションの「適合度」を計算することを含む。この「適合度」測定値は、例えば、様々な対立遺伝子により説明されるリードの割合であり得る。セットカバーリングアルゴリズムは、大部分のリードを特定するエクソン分解能識別子のペアのセットを探索する。
【0113】
ステップ704は、エクソン分解能識別子の単一ペアまたは多数のペアが特定されたかを決定することを含む。単一ペアが特定された場合は、ステップ706が実施される。
【0114】
ステップ706は、エクソン分解能識別子の単一ペアのエクソン分解能識別子のいずれかが所望のカバレージを独立して提供するかを決定することを含む。例えば、エクソン分解能識別子の単一ペアは、第1の対立遺伝子のために第1のエクソン分解能識別子および第2の対立遺伝子のために第2のエクソン分解能識別子を含む。ステップ706は、例えば、第1のエクソン分解能識別子によりカバーされたリードの最大数N1が、エクソン分解能識別子ペアによりカバーされたリードの最大数Nに等しいか、または最大数Nの選択範囲内であるかを決定することを含む。ステップ706は、例えば、第2のエクソン分解能識別子によりカバーされたリードの最大数N2がNに等しいか、またはNの選択範囲内であるかを決定することを含む。選択範囲とは、例えば、1つのリード、2つのリード、3つのリード等であり得る。ステップ706において、N1またはN2のいずれかが、Nに等しいか、またはNの選択範囲内である場合、対応するエクソン分解能識別子は、所望のカバレージを提供していると考慮される。
【0115】
エクソン分解能識別子の単一ペアの単一エクソン分解能識別子が所望のカバレージを提供する場合には、ステップ708が実施される。そうでなければ、ステップ710が実施される。ステップ708は、単一エクソン分解能識別子をHLA遺伝子のエクソン分解能識別子の最終セットとして出力することを含む。ステップ710は、エクソン分解能識別子のペアをHLA遺伝子のエクソン分解能識別子のセットとして出力することを含む。
【0116】
再びステップ704を参照すると、エクソン分解能識別子の多数のペアが特定される場合には、ステップ712が実施される。ステップ712は、分解を実施して、エクソン分解能識別子のセットを形成することを含む。ステップ712の分解は、様々な方法により実施され得る。1つまたは複数の実施形態において、分解は、エクソン分解能識別子ペアの論理和から論理和のペアを特定することを含む。この論理和のペアは、例えば、第1の対立遺伝子および第2の対立遺伝子のうちの少なくとも1つの対立遺伝子の多数のエクソン分解能識別子を含む。ステップ712は、例えば、階層クラスタリングを実施することを含んでもよい。
【0117】
図7Bは、1つまたは複数の実施形態によるHLA遺伝子のそれぞれのエクソン位置のエクソン識別子の最終セットを特定するプロセス720の例を図解する流れ図である。プロセス720は、図1の評価システム100または評価システム100の少なくとも一部分により実装されるプロセスの一例である。プロセス720は、例えば、図1の対立遺伝子型ジェネレータ104により実装され得る。プロセス720は、上記に記載された図6のステップ604に記載された複数の潜在的エクソン分解能識別子を形成することに使用され得るプロセスの一例である。
【0118】
ステップ722は、複数のHLAリードを、HLA遺伝子のHLA対立遺伝子のサブドメインおよびHLAエクソンとアラインすることを含む。図6のステップ604に関して既に記載されているように、このHLA対立遺伝子のサブドメインは、所定のHLA遺伝子に可能なHLA対立遺伝子(例えば、所定のHLA遺伝子のすべての可能な(非制約)HLA対立遺伝子)の参照ドメイン内のHLA対立遺伝子の部分を含む。HLA対立遺伝子のサブドメインおよびHLAエクソン、または両方は、データ格納、例えば、図1のデータ格納114、別のデータ源(例えば、international IMGT(登録商標)データベース)またはこれらの組み合わせから検索され得る。ステップ722の複数のHLAリードは、例えば、ステップ603で形成されたフィルタ処理された複数のリードであり得る。HLA対立遺伝子のサブドメインに関してのアラインメントは、HLA対立遺伝子のサブドメインのエクソン分解能識別子を使用して実施される。
【0119】
ステップ724は、アラインメントに基づいて、HLA遺伝子のそれぞれのエクソン位置の潜在的エクソン識別子のセットを特定することを含む。潜在的エクソン識別子は、複数のHLAリードの少なくとも1つのHLAリードで完全にカバーされているHLAエクソンのエクソン識別子(例えば、エクソンのヌクレオチド配列を表す識別子)である。カバレージは、それぞれのリード配列の5’半分および3’半分で別個に決定される。例えば、潜在的エクソン識別子に対応するヌクレオチド配列のヌクレオチド位置の「総カバレージレベル」とは、リードが、潜在的エクソン識別子に対応するヌクレオチド配列とアラインする場合、このヌクレオチド位置のヌクレオチドにマッチするリードの数の総カウント(5’半分と3’半分の両方)である。「カバレージホール」は、HLAリードいずれかの5’半分または3’半分によりカバーされない潜在的エクソン識別子に対応するヌクレオチド配列のヌクレオチド位置である。換言すると、「カバレージホール」とは、総カバレージレベルがゼロであるヌクレオチド位置である。「カバレージアノマリ(coverage anomaly)」は、(a)統計的に有意に(例えば、二項検定等を実施して決定すると、選択閾値を超えて)異なる総カバレージレベルを有する2つの隣接ヌクレオチド位置がある場合、または(b)所定のヌクレオチド位置の個別の5’半分および3’半分のカバレージレベルが、統計的に有意に(例えば、二項検定等を実施して決定すると、選択閾値を超えて)異なる場合に起こり得る。
【0120】
カバレージホールが存在するヌクレオチド配列を有するエクソン識別子は、潜在的なエクソン識別子から除外される。カバレージアノマリが存在するヌクレオチド配列を有するエクソン識別子は、潜在的なエクソン識別子から除外される。
【0121】
ステップ726は、各エクソン位置で特定された潜在的エクソン識別子のセットを使用して、エクソン分解能識別子の初期群を特定することを含む。エクソン分解能識別子のこの初期群におけるエクソン分解能識別子は、対応するHLA対立遺伝子のすべてのエクソンが潜在的エクソン識別子の1つであると特定されているものである。例えば、エクソン分解能識別子のこの初期群におけるエクソン分解能識別子は、対応するHLA対立遺伝子のそれぞれのエクソン位置のエクソンが、そのエクソン位置で決定された潜在的エクソン識別子のセットに含まれるものである。
【0122】
ステップ728は、複数のHLAリードをエクソン分解能識別子の初期群と、および潜在的なエクソン識別子のセットと再アラインさせることを含む。ステップ728において、HLA遺伝子のそれぞれのエクソン位置では、それぞれのリードが、ステップ724で特定された潜在的エクソン識別子の対応するセット中のあらゆる潜在的エクソン識別子とアラインすることを可能にする。これは、HLAリードのヌクレオチドと、潜在的エクソン識別子に対応するヌクレオチド配列のヌクレオチドとのミスマッチ(例えば、X個までのミスマッチであり、ここでXは調整可能であり得る)の評価を可能にするという意味において、寛大な(lenient)アラインメントである。
【0123】
ホモ接合性HLA対立遺伝子を有する対象では、予測は、対応するヌクレオチド配列の長さの全体にわたって完全にマッチする(ステップ728のミスマッチが反映されている時折の配列誤差を除いて)、1つの潜在的エクソン識別子を見ることである。しかし、2つの異なる対立遺伝子を有するヘテロ接合性対象では、完全にマッチする潜在的エクソン識別子はなく、それは、第1の潜在的エクソン識別子と寛大にアラインする第1の対立遺伝子のリードがミスマッチを有し、第2の潜在的エクソン識別子と寛大にアラインする第2の対立遺伝子のリードが、類似してミスマッチを有するからである。これらのミスマッチのパターンは、相補的である。例えば、第1の潜在的エクソン識別子で観察されたミスマッチのヌクレオチド位置は、第2の潜在的エクソン識別子で観察されたミスマッチと同じヌクレオチド位置である。この方法によって、ヘテロ接合性エクソンペアが推論されうる。
【0124】
ステップ730は、潜在的エクソン識別子のセットをさらに精緻化して、アラインメントに基づいて、HLA遺伝子のそれぞれのエクソン位置の候補エクソン識別子のセットを形成することを含む。ステップ730において、それぞれのエクソン位置の潜在的エクソン識別子のセットは、カバレージホールが存在するヌクレオチド配列を有する任意の潜在的エクソン識別子を除くことによって精緻化され得る。所定のエクソン位置の候補エクソン識別子のセットは、1つもしくは複数の単一候補エクソン識別子(例えば、ホモ接合性対立遺伝子のため)、1つもしくは複数の候補エクソン識別子ペア(例えば、ヘテロ接合性対立遺伝子のため)、または両方を含むことができる。
【0125】
ステップ732は、セットカバーリングアルゴリズムおよび候補エクソン識別子のセットを使用して、HLA遺伝子のそれぞれのエクソン位置のエクソン識別子の最終セットにより形成されたシリーズを特定することを含む。ステップ732に使用されるセットカバーリングアルゴリズムは、図7Aに関してステップ702において(図6のステップ608に関連して)上記に記載されたセットカバーリングアルゴリズム、および/または図4のステップ402において(図3のステップ308に関連して)上記に記載されたセットカバーリングアルゴリズムと類似していてよい。例えば、セットカバーリングアルゴリズムは、HLA遺伝子のそれぞれのエクソン位置の大部分のリードを説明する1つもしくは複数のエクソン識別子および/またはエクソン識別子ペアを特定するために使用される。ステップ732は、HLA遺伝子のそれぞれのエクソン位置の候補エクソン識別子のセットを、それぞれのエクソン位置のエクソン識別子の最終セットに制約する。1つまたは複数の実施形態において、分析は、クロージャに関して実施することができ、ここでクロージャは、リードを共有する(例えば、クロストークを介して説明する)、多数のHLA遺伝子におけるエクソン位置のセット(HLA-B遺伝子における第2のエクソン位置およびHLA-C遺伝子における第2の位置)である。
【0126】
図8は、1つまたは複数の例示的実施形態による対立遺伝子リードアラインメントの二部グラフである。グラフ800は、グラフ800の上側にリード801を示し、グラフ800の下側に対立遺伝子802を示す。1つまたは複数の実施形態において、対立遺伝子802は、エクソン分解能識別子による二部グラフで表されている。リード801は、異なる遺伝子を表すセクション804(例えば、着色セクション)に示されている。アラインメント806は、様々な遺伝子のリードと対立遺伝子とのアラインメントを図解する。例えば、対立遺伝子ペア808は、HLA-B遺伝子に対応するセクション810をカバーするソリューションペアとして特定される。対立遺伝子ペア812は、HLA-C遺伝子に対応するセクション814をカバーするソリューションペアとして特定される。対立遺伝子816は、HLA-A遺伝子に対応するセクション818のすべてのリードをカバーする単一対立遺伝子の例である。クロストークアラインメント820は、特定の対立遺伝子が、2つの異なる遺伝子(例えば、HLA-HおよびHLA-A)のリードとアラインしていることが特定される、クロストークの一例である。
【0127】
III.C イントロン分解能識別子を使用するHLA喪失の評価
本明細書に記載されている様々な実施形態は、HLA遺伝子の対立遺伝子が特定されているイントロン分解能識別子に基づいてHLA喪失を評価する方法およびシステムを提供する。例えば、方法およびシステムは、試料リードとイントロン分解能識別子とのアラインメントを定量化することを含む。これらの方法およびシステムは、この定量化の統計分析を実施して、HLA喪失情報、例えば、図1に関して上記に記載されたHLA喪失情報を生成することをさらに含む。
【0128】
III.C.1 対立遺伝子のセットとリードとのアラインメント
図9は、1つまたは複数の実施形態によるHLA遺伝子の対立遺伝子リードアラインメントを定量化するプロセス900の例を図解する流れ図である。プロセス900は、図1の評価システム100または評価システム100の少なくとも一部分により実装されるプロセスの一例である。プロセス900は、例えば、図1のHLA喪失エバリュエータ110により実装され得る。プロセス900は、例えば、図1のアラインメントアナライザ106により実装され得る。プロセス900は、上記に記載された図2のステップ208に含まれ得るプロセスの一例である。
【0129】
ステップ902は、HLA遺伝子の第1の対立遺伝子のイントロン分解能識別子の第1のセット、およびHLA遺伝子の第2の対立遺伝子のイントロン分解能識別子の第2のセットを受け取ることを含む。1つまたは複数の実施形態において、第1の対立遺伝子および第2の対立遺伝子は同じであり、イントロン分解能識別子の第1のセットおよびイントロン分解能識別子の第2のセットも同じである。
【0130】
ステップ904は、第1の試料の第1の複数のリード、および第2の試料の第2の複数のリードを受け取ることを含む。第1の複数のリード、第2の複数のリード、または両方とも、例えば、WESまたはWGSを介して生成されたリードであり得る。第1の試料は、例えば、健康または正常組織の試料であり得る。第2の試料は、例えば、不健康または疾患組織(例えば、腫瘍)の試料であり得る。他の実施形態において、第1の試料および第2の試料は、疾患(例えば、腫瘍、がん等)の進行の第1の時点および第2の時点のそれぞれで採取された組織の試料である。
【0131】
ステップ906は、イントロン分解能識別子の第1のセットのうちから選択された1つを使用して、HLA遺伝子の第1の対立遺伝子の第1の対立遺伝子配列を特定すること、およびイントロン分解能識別子の第2のセットのうちから選択された1つを使用して、HLA遺伝子の第2の対立遺伝子の第2の対立遺伝子配列を特定することを含む。ステップ906において、一部の実施形態では、イントロン分解能識別子の第1のセット、イントロン分解能識別子の第2のセット、または両方が多数のイントロン分解能識別子を含む場合、対立遺伝子の多数の組み合わせが作製され得る。イントロン分解能識別子の第1のセットのうちから選択された1つおよび/またはイントロン分解能識別子の第2のセットのうちから選択された1つを含む、ステップ906に使用される組み合わせは、異なる方法で実践することができる。例えば、限定されることなく、選択は無作為選択を介して実施される。他の実施形態において、選択は、順序づけられた方法(例えば、英数字順にイントロン分解能識別子の第1のセットうちの最初の1つを選択し、イントロン分解能識別子の第2のセットのうちの最初の1つを選択する等)によって実施される。
【0132】
ステップ908は、第1の対立遺伝子配列と第1の複数のリードおよび第2の複数のリードのそれぞれとの間、ならびに第2の対立遺伝子配列と第1の複数のリードおよび第2の複数のリードのそれぞれとの間で対立遺伝子リードアラインメントを定量化して、アラインメント出力を形成することを含む。ステップ908は、例えば、第1の対立遺伝子配列、第2の対立遺伝子配列、第1の複数のリード、および第2の複数のリードを使用して、アラインメントに基づいてアラインメント出力を生成することを含んでもよい。ステップ908は、例えば、第1の対立遺伝子および第2の対立遺伝子と第1の試料および第2の試料との異なる組み合わせの間のアラインメント(例えば、正確なアラインメント、1または2つの塩基ペアの範囲内のアラインメント、3または4つの塩基ペアの範囲内のアラインメント等)の数をカウントすることを含むが、これに限定されない。例えば、ステップ908は、第1の対立遺伝子と第1の試料とのアラインメントの数の第1のカウント、第1の対立遺伝子と第2の試料とのアラインメントの数の第2のカウント、第2の対立遺伝子と第1の試料とのアラインメントの数の第3のカウント、および第2の対立遺伝子と第2の試料とのアラインメントの数の第4のカウントを生成することを含むことができる。第1の対立遺伝子と第1の試料とのアラインメントは、第1の対立遺伝子配列と、第1の試料に関連する第1の複数のリードとのアラインメントである。第1の対立遺伝子と第2の試料とのアラインメントは、第1の対立遺伝子配列と、第2の試料に関連する第2の複数のリードとのアラインメントである。第2の対立遺伝子と第1の試料とのアラインメントは、第2の対立遺伝子配列と第1の複数のリードとのアラインメントである。第2の対立遺伝子と第2の試料とのアラインメントは、第2の対立遺伝子配列と第2の複数のリードとのアラインメントである。
【0133】
他の実施形態において、ステップ908のアラインメント出力は、異なる形態を取る。アラインメント出力は、例えば、比、百分率、または第1の対立遺伝子配列、第2の対立遺伝子配列、第1の複数のリードおよび第2の複数のリードの間の対立遺伝子リードアラインメントを特徴づける他のタイプの定量化フォーマットを含み得るが、これらに限定されない。一例として、アラインメント出力は、第1の比および第2の比を含み得る。第1の比は、第1の対立遺伝子配列および第1の複数のリードのアラインメントの数と、第1の対立遺伝子配列および第2の複数のリードのアラインメントの数との比である。第2の比は、第2の対立遺伝子配列および第1の複数のリードのアラインメントの数と、第2の対立遺伝子配列および第2の複数のリードのアラインメントの数との比である。
【0134】
様々な実施形態において、ステップ906および908は、イントロン分解能識別子の第1のセットのうちから選択された1つおよびイントロン分解能識別子の第2のセットのうちから選択された1つの様々な組み合わせで繰り返される。例えば、第1の対立遺伝子にそれぞれ可能なイントロン分解能識別子および第2の対立遺伝子にそれぞれ可能なイントロン分解能識別子を使用するすべての可能な組み合わせを評価して、アラインメント出力を生成することができる。
【0135】
図10は、1つまたは複数の実施形態による対立遺伝子リードアラインメントおよびアラインメントカウントを図解する。アラインメント情報は、対立遺伝子リードアラインメント1000および四分円1002を含む。対立遺伝子リードアラインメント1000は、第1のイントロン分解能識別子(例えば、第1の対立遺伝子)により特定された第1の対立遺伝子配列と、第1の(例えば、正常)試料のリードとのアラインメント、第1の対立遺伝子配列と第2の(例えば、腫瘍)試料のリードとのアラインメント、第2のイントロン分解能識別子(例えば、第2の対立遺伝子)により特定された第2の対立遺伝子配列と第1の試料のリードとのアラインメント、および第2の対立遺伝子配列と第2の試料のリードとのアラインメントを含む。
【0136】
よって四分円1002は、これらの異なる4つのタイプのアラインメントの対応するカウントを特定する。特定的には、四分円1002は、第1の対立遺伝子と第1の試料とのアラインメントの数の第1のカウント1004、第1の対立遺伝子と第2の試料とのアラインメントの数の第2のカウント1006、第2の対立遺伝子と第1の試料とのアラインメントの数の第3のカウント1008、および第2の対立遺伝子と第2の試料とのアラインメントの数の第4のカウント1010を特定する。
【0137】
III.C.2 対立遺伝子リードアラインメントに基づいたHLA喪失の評価
図11は、1つまたは複数の実施形態によるHLA対立遺伝子発現を分析するプロセス1100の例を図解する流れ図である。プロセス1100は、図1の評価システム100または評価システム100の少なくとも一部分により実装されるプロセスの一例である。プロセス1100は、例えば、図1のHLA喪失エバリュエータ110により実装され得る。プロセス1100は、例えば、図1の統計量ジェネレータ108により実装され得る。プロセス1100は、上記に記載された図2のステップ210に含まれ得るプロセスの一例である。
【0138】
ステップ1102は、第1の試料および第2の試料に関連するHLA遺伝子の対立遺伝子のペアの、HLAアラインメント入力を受け取ることを含む。HLAアラインメント入力は、第1の試料および第2の試料のリードとHLA対立遺伝子とのアラインメントについての情報を含む。HLAアラインメント入力は、例えば、図9のステップ908で生成されたアラインメント出力を含む。一部の例において、HLAアラインメント入力は、ステップ908の多数の反復(例えば、イントロン分解能識別子の第1のセットのうちから選択された1つおよびイントロン分解能識別子の第2のセットのうちから選択された1つの様々な組合せにおいて上記に記載された反復)を介して生成されたアラインメント出力を含む。
【0139】
ステップ1104は、第1の試料および第2の試料に関連する複数の非HLA遺伝子の、非HLAアラインメント入力を受け取ることを含む。この非HLAアラインメント入力を使用して、統計モデルのトレーニングデータを提供する。この統計モデルは、1つまたは複数の例において、ベータ二項モデルである。非HLAアラインメント入力は、第1の試料と第の2試料の遺伝子(例えば、対立遺伝子)リードカウントの変動に関する情報を提供する。
【0140】
ステップ1106は、非HLAアラインメント入力を使用して、対立遺伝子喪失閾値を計算することを含む。ステップ1106は、例えば、非HLAアラインメント入力により記載された、そうでなければ非HLAアラインメント入力から推論された遺伝子変動に基づいて、対立遺伝子喪失閾値を計算することを含む。
【0141】
ステップ1108は、HLA喪失の評価に使用するため、対立遺伝子喪失閾値を使用してHLAアラインメント入力の統計分析を実施することを含む。ステップ1108で実施される統計分析は、様々な方法により実施され得る。1つまたは複数の実施形態において、統計分析は、上記に記載されたベータ二項モデルを使用して統計量tを計算することを含む。他の実施形態において、統計分析は、Zスコア、変動の分析(ANOVA)、1つもしくは複数の他の統計アルゴリズムもしくは技術、またはこれらの組み合わせを使用して実施される。ステップ1108の統計分析により生成される結果または情報は、統計出力と称され得る。
【0142】
図9のプロセス900および図11のプロセス1100が別個に記載されているが、一部の実施形態において、プロセス900およびプロセス1100は、単一プロセスとして組み合わされる、そうでなければ統合される。さらに、プロセス1100を異なる対立遺伝子ペアで繰り返すことができる。
【0143】
図12は、1つまたは複数の実施形態による2つの試料間の遺伝子変動のプロットの例を図解する。プロット1200は、正常試料および腫瘍試料の2つの試料間の遺伝子変動を、2つの試料のアラインメントカウントのlog比を使用して特定する。プロット1200は、非HLA遺伝子およびHLA遺伝子(例えば、2つのHLA対立遺伝子)の遺伝子変動を特定する。プロット1200は、例えば、図11のステップ1108を介して生成され得るタイプの統計出力の一例である。一部の例において、プロット1200は、図11のステップ1108を介して生成される統計出力を使用して生成されるタイプの出力の一例である。
【0144】
図13は、1つまたは複数の実施形態によるベータ二項モデルを使用して生成されたプロットの例を図解する。プロット1300は、対象のHLA遺伝子の様々なHLA対立遺伝子の統計量tに双対の95%信頼区間を特定する。プロット1300は、例えば、図12のプロット1200に提供される情報を使用して生成され得る。プロット1300は、例えば、図11のステップ1108を介して生成され得るタイプの統計出力の一例である。一部の例において、プロット1300は、図11のステップ1108を介して生成される統計出力を使用して生成されるタイプの出力の一例である。
【0145】
図14は、1つまたは複数の実施形態によるHLA喪失を評価するプロセス1400の例を図解する流れ図である。プロセス1400は、図1の評価システム100または評価システム100の少なくとも一部分により実装されるプロセスの一例である。プロセス1400は、例えば、図1のHLA喪失エバリュエータ100により実装され得る。一部の例において、プロセス1400は、例えば、図1の統計量ジェネレータ148により実装される。プロセス1400は、上記に記載された図2のステップ212に含まれ得るプロセスの一例である。
【0146】
ステップ1402は、2つの試料に関して対立遺伝子ペアのHLA発現を特徴づける統計出力を受け取ることを含む。ステップ1402は、例えば、上記に記載された図10のステップ1108を介して生成される統計出力を受け取ることを含むことができる。
【0147】
ステップ1404は、対立遺伝子ペアの第1の対立遺伝子の第1の統計量、および対立遺伝子ペアの第2の対立遺伝子の第2の統計量を選択することを含む。ステップ1404は、例えば、第1の対立遺伝子の統計量tおよび第2の対立遺伝子の統計量tを特定することを含む。
【0148】
ステップ1406は、第1の統計量および第2の統計量を使用して、対立遺伝子ペアのHLA発現の複数のカテゴリから1つのカテゴリを特定することを含む。複数の発現カテゴリは、例えば、正常な発現、単一欠失、二重欠失、LOH(例えば、コピーニュートラルLOH)、単一増幅、および二重増幅を含み得るが、これらに限定されない。ステップ1406は、例えば、第1の対立遺伝子の統計量tと第2の対立遺伝子の統計量tとの交差をプロットすること、およびボロノイ図において、この交差を複数のカテゴリに対応する領域または理想的な交差と比較することを含む。ボロノイ図における様々な領域のカットオフまたは境界は、必要に応じて、より高い、またはより低い信頼レベルを提供するようにカスタマイズされる。さらに、ボロノイ図における様々な領域のカットオフまたは境界は、試料(例えば、腫瘍組織の試料)の間質(例えば、非腫瘍)含有物の量を反映するようにカスタマイズされ得る。
【0149】
図15は、1つまたは複数の実施形態によるボロノイ図の例を図解する。ボロノイ図1500は、HLA遺伝子の対立遺伝子ペアの2つの対立遺伝子の統計量tの交差がマッピングされ得る領域1502を含む。それぞれの領域1502は、対立遺伝子ペアの発現を特徴づける対応するカテゴリを特定する。ボロノイ図の領域1502は、HLA発現の複数のカテゴリ、例えば、図14のステップ1406に記載されている複数のカテゴリの一例を表す。
【0150】
図16は、1つまたは複数の実施形態によるHLA喪失を評価する例を図解する流れ図である。プロセス1600は、図1の評価システム100または評価システム100の少なくとも一部分により実装されるプロセスの一例である。プロセス1600は、例えば、図1のHLA喪失エバリュエータ110により実装され得る。プロセス1600は、上記に記載された図2のステップ210およびステップ212の実施に使用され得るプロセスの一例である。
【0151】
ステップ1602は、第1の試料の第1の複数のリード、および第2の試料の第2の複数のリードを受け取ることを含む。第1の試料および第2の試料は、それぞれ正常試料および腫瘍試料であり得る。他の例において、第1の試料および第2の試料は、2つの異なる時点で採取された腫瘍の試料であり得る。
【0152】
ステップ1604は、HLA遺伝子の第1の対立遺伝子のイントロン分解能識別子の第1のセット、およびHLA遺伝子の第2の対立遺伝子のイントロン分解能識別子の第2のセットを受け取ることを含む。一部の実施形態において、イントロン分解能識別子の第1のセットは、イントロン分解能識別子の第2のセットの単一イントロン分解能識別子と同一の単一イントロン分解能識別子を含み、ホモ接合性を示している。
【0153】
ステップ1606は、イントロン分解能識別子の第1のセットおよびイントロン分解能識別子の第2のセットを使用して、対立遺伝子配列ペアのセットを特定することを含む。対立遺伝子配列ペアのセットにおけるそれぞれの対立遺伝子配列ペアは、第1の対立遺伝子の第1の対立遺伝子配列および第2の対立遺伝子の第2の対立遺伝子配列を含む。
【0154】
ステップ1608は、第1の対立遺伝子配列、第2の対立遺伝子配列、第1の複数のリード、および第2の複数のリードを使用して、複数のアラインメントカウントを対立遺伝子配列ペアのセットにおけるそれぞれの対立遺伝子配列ペアのために生成することを含む。
【0155】
ステップ1610は、非HLA遺伝子のアラインメントカウントのコレクションを使用して、対立遺伝子喪失閾値を計算することを含む。例えば、非HLA遺伝子と、第1の複数のリードおよび第2の複数のリードの両方とのアラインメントを使用して、ベースライン遺伝子発現変動を決定することができる。これらの非HLA遺伝子のアラインメントカウントを使用して、例えばベータ二項モデルなどのモデルをトレーニングすることができる。このベータ二項モデルを使用して、ステップ1610で対立遺伝子喪失閾値を計算することができる。
【0156】
ステップ1612は、対立遺伝子喪失閾値を使用して複数のアラインメントカウントの統計分析を実施し、第1の試料と比較した第2の試料におけるHLA喪失の評価に使用する統計出力を形成することを含む。ステップ1612は、例えば、第1の対立遺伝子および第2の対立遺伝子の統計量tを計算することを含んでもよい。これらの統計量tを使用して、HLA喪失の発生を推定することができる。
【0157】
図17A~17Fは、1つまたは複数の実施形態による様々な腫瘍試料におけるHLA喪失の検出を示すプロットシリーズを図解する。図17A~17Fのプロットシリーズ1700は、一群のプロット1702を含み、それぞれ、対応する腫瘍試料におけるHLA喪失の検出を図解している。このHLA喪失の検出は、本明細書における様々な実施形態により記載される方法に基づいて実施される。一部の実施形態において、このHLA喪失の検出は、図16のプロセス1600を使用して実施される。プロットシリーズ1700は、図16のステップ1612を介して生成されるタイプの統計出力の一例であり得る。プロット群1702は、プロット1704を含み、該プロット1704は、HLA喪失の検出が、腫瘍試料中の腫瘍細胞の百分率が10%の低さである腫瘍試料であっても可能であることを示す。
【0158】
III.D HLA喪失の評価に基づく意思決定
上記に記載されたプロセス(例えば、図11のプロセス1100、図14のプロセス1400、図16のプロセス1600)により提供される情報を使用して、腫瘍またはがんなどの疾患の進行または帰結の治療または予測の少なくとも1つに関する様々なタイプの決定を行うことができる。1つまたは複数の実施形態において、これらのプロセスは、別の試料と比較して、1つの試料におけるHLA喪失を検出する(例えば、推定する)方法を提供する。
【0159】
HLA喪失(例えば、1つまたは複数のHLA対立遺伝子の喪失)が検出されると、この情報を使用して、T細胞療法を含む免疫療法を開発および/または個人化することができる。例えば、HLA対立遺伝子に関連する新生抗原にT細胞が到達することを防ぐある特定のHLA対立遺伝子の喪失に対処するように、T細胞がん療法を個人化することができる。よって、発現の喪失(例えば、発現の非存在または発現の低減を介した)が検出されていないHLA対立遺伝子に基づいて、対象において活性化され得るT細胞療法を開発することが重要である。
【0160】
例えば、対象の1つまたは複数のHLA対立遺伝子(例えば、HLA-A、HLA-B、HLA-C)を有する細胞の細胞表面に、免疫監視のためにペプチドが提示され得る。抗原(例えば、ペプチド)が免疫系に外来として現れる場合、この細胞は免疫系により死滅される。HLA対立遺伝子喪失が検出される場合、どの外来抗原が、失われたHLA対立遺伝子により提示されていたかに関して予測を行うことができる。このタイプの予測は、腫瘍療法(例えば、腫瘍ワクチン)の標的として使用される外来抗原の選択を精緻化する助けとなる。一部の場合では、対象が多くのまたはすべてのHLA対立遺伝子を失っている場合、対象が腫瘍ワクチンの良好な候補ではなく、他のタイプの療法(例えば、NK細胞が関与する療法)が考慮されるべきであるという決定を行うことができる。
【0161】
新生抗原ワクチンは、対象のT細胞を初回刺激して、1つまたは複数の特定の腫瘍新生抗原を発現するがん細胞を認識および攻撃させることができる。この手法は、健康な細胞を見逃し、一方で腫瘍細胞を標的化する、腫瘍特異的免疫応答を生成することができる。上記に記載された様々な実施形態により生成された情報に基づいて、個別化ワクチンを改変または選択することができる。
【0162】
例えば、限定されることなく、がん治療などの免疫療法は、対象から試料(例えば、血液試料)を収集することを含んでもよい。T細胞が単離され、刺激され得る。単離は、例えば、密度勾配沈降法(例えば、密度勾配遠心分離法)、免疫磁気選択法、および/または抗体複合体選別法を使用して実施することができる。刺激は、例えば、抗原非依存性刺激を含むことができ、該抗原非依存性刺激は、マイトジェン(例えば、PHAもしくはConA)または抗CD3抗体(例えば、CD3に結合し、T細胞受容体複合体を活性化する)および抗CD28抗体(例えば、CD28に結合し、T細胞を刺激する)使用することができる。ペプチド(例えば、変異ペプチド)のセットは、ペプチドのセットのそれぞれが対象のMHC分子(または、HLA分子)に結合するかどうか、および/もしくは結合する程度、対象のMHC分子により提示されるかどうか、および/もしくは提示される程度、ならびに/または対象の免疫応答をトリガするかどうか、および/もしくはトリガする程度についての予測に対応して、上記に記載された様々な実施形態により提供される情報に基づいて対象の治療に使用するために選択され得る。例えば、ペプチドのセットは、1つまたは複数の腫瘍試料内のHLA喪失の検出に基づいて選択され得る。このHLA喪失は、1つまたは複数のHLA対立遺伝子の喪失を含むことができる。
【0163】
一部の実施形態において、ペプチド(または、その前駆体)のセットは、変異ペプチド(例えば、新生抗原)特異的T細胞を生成するために使用され得る。例えば、末梢血T細胞を対象から単離し、1つまたは複数の変異ペプチドに接触させて、対象に投与することができる変異ペプチド特異的T細胞集団を誘導することができる。一部の例において、変異ペプチド反応性T細胞のT細胞受容体配列をシーケンシングすることができる。T細胞受容体配列(例えば、アミノ酸T細胞受容体配列)を得ると、T細胞は、変異ペプチドを特異的に認識するT細胞受容体を含むように改変され得る。次いで、これらの改変T細胞を対象に投与することができる。例えば、Matsudaら、「Induction of Neoantigen-Specific Cytotoxic T Cells and Construction of T-cell Receptor Engineered T Cells for Ovarian Cancer」、Clin.Cancer Res.1~11(2018)(すべての目的において、その全体が参照により本明細書に組み込まれる)を参照すること。T細胞を、対象に投与する前に、in vitroおよび/またはエクスビボで拡大することができる。次いで対象には、T細胞の拡大集団を含む組成物を投与する(例えば、注入する)ことができる。1つまたは複数の実施形態において、治療は、例えば、T細胞をin vivoで初回刺激、活性化および拡大するのに有効な量で個体に投与される。
【0164】
よって、上記の例は、HLA喪失検出に基づいて開発され得る異なるタイプの免疫療法のいくつかの例を提供する。HLA喪失の検出を使用して、免疫療法を個人化すること(例えば、がん免疫療法を個人化すること)、免疫療法の潜在的標的としてHLA対立遺伝子により提示される抗原をいつ含めるか、いつ除くかを決定すること、および/または免疫療法に関する他の決定を通知することができる。
【0165】
IV.コンピュータ実装システム
図18は、様々な実施形態によるコンピュータシステムの例を図解するブロック図である。コンピュータシステム1800は、上記の図1に記載されたコンピュータシステム102についての一実装形態の一例であり得る。1つまたは複数の例では、コンピュータシステム1800は、情報を通信するためのバス1802または他の通信機構、および情報を処理するためのバス1802と連関されたプロセッサ1804を含むことができる。様々な実施形態において、コンピュータシステム1800はまた、プロセッサ1804によって実行される命令を決定するためにバス1802に連関された、ランダムアクセスメモリ(RAM)1806または他の動的記憶デバイスであり得るメモリを含むこともできる。メモリはまた、プロセッサ1804によって実行される命令の実行中に一時変数または他の中間情報を記憶するために使用され得る。様々な実施形態において、コンピュータシステム1800は、プロセッサ1804のための静的情報および命令を記憶するためにバス1802に連関された読み出し専用メモリ(ROM)1808または他の静的記憶デバイスをさらに含むことができる。磁気ディスクまたは光ディスクなどの記憶デバイス1810が設けられ、情報および命令を記憶するためにバス1802に連関され得る。
【0166】
様々な実施形態において、コンピュータシステム1800は、バス1802を介して、コンピュータユーザに情報を表示するために、陰極線管(CRT)または液晶ディスプレイ(LCD)などのディスプレイ1812に連関され得る。英数字および他のキーを含む入力デバイス1814は、情報およびコマンド選択をプロセッサ1804に通信するためにバス1802に連関され得る。別のタイプのユーザ入力デバイスは、プロセッサ1804に方向情報およびコマンド選択を通信し、ディスプレイ1812上のカーソル移動を制御するための、マウス、ジョイスティック、トラックボール、ジェスチャ入力デバイス、視線に基づく入力デバイス、またはカーソル方向キーなどのカーソルコントロール1816である。この入力デバイス1814は、典型的には、デバイスが平面内の位置を指定することを可能にする第1の軸(例えば、x)および第2の軸(例えば、y)の2軸の2自由度を有する。しかし、三次元(例えば、x、yおよびz)カーソル移動を可能にする入力デバイス1814も本明細書で企図されることが理解されるべきである。
【0167】
本教示のある特定の実装形態と一致して、結果は、RAM1806に含有された1つまたは複数の命令の1つまたは複数のシーケンスを実行するプロセッサ1804に応答して、コンピュータシステム1800によって提供され得る。そのような命令を、記憶デバイス1810などの別のコンピュータ可読媒体またはコンピュータ可読記憶媒体からRAM1806に読み込ませることができる。RAM1806に含有された命令のシーケンスの実行は、本明細書に記載されているプロセスをプロセッサ1804に実施させることができる。あるいは、本教示を実装するために、ソフトウェア命令の代わりに、またはソフトウェア命令と組み合わせて、ハードワイヤード回路構成を使用することができる。よって、本教示の実装形態は、ハードウェア回路構成とソフトウェアとのいずれかの具体的な組み合わせに限定されない。
【0168】
「コンピュータ可読媒体」(例えば、データ格納、データ記憶、記憶デバイス、データ記憶デバイス等)、または「コンピュータ可読記憶媒体」という用語は、本明細書で使用される場合、実行のためにプロセッサ1804に命令を提供することに関与する任意の媒体を指す。そのような媒体は、不揮発性媒体、揮発性媒体、および伝送媒体を含むがこれらに限定されない多くの形態をとることができる。不揮発性媒体の例は、記憶デバイス1810などの光学、ソリッドステート、磁気ディスクを含むことができるがこれらに限定されない。揮発性媒体の例は、RAM1806などの動的メモリを含むことができるがこれらに限定されない。伝送媒体の例は、バス1802を含むワイヤを含む、同軸ケーブル、銅線、および光ファイバを含むことができるがこれらに限定されない。
【0169】
コンピュータ可読媒体の一般的な形態は、例えば、フロッピーディスク、フレキシブルディスク、ハードディスク、磁気テープ、または他の任意の磁気媒体、CD-ROM、他の任意の光学媒体、パンチカード、紙テープ、孔のパターンを有する他の任意の物理媒体、RAM、PROM、およびEPROM、フラッシュEPROM、他の任意のメモリチップもしくはカートリッジ、またはコンピュータが読み取ることができる他の任意の有形媒体を含む。
【0170】
コンピュータ可読媒体に加えて、命令またはデータは、実行のためにコンピュータシステム1800のプロセッサ1804に1つまたは複数の命令のシーケンスを提供するのに、通信装置またはシステムに含まれる伝送媒体上の信号として提供され得る。例えば、通信装置は、命令およびデータを示す信号を有するトランシーバを含むことができる。命令およびデータは、1つまたは複数のプロセッサに、本明細書の開示に概説されている機能を実装させるように構成される。データ通信伝送接続の代表的な例は、電話モデム接続、ワイドエリアネットワーク(WAN)、ローカルエリアネットワーク(LAN)、赤外線データ接続、NFC接続、光通信接続等を含むことができるがこれらに限定されない。
【0171】
本明細書に記載されている方法論、フローチャート、図表、および付随する開示は、コンピュータシステム1800をスタンドアロンデバイスとして使用して、またはクラウドコンピューティングネットワークなどの共有コンピュータ処理資源の分散ネットワーク上で実装され得ることが理解されるべきである。
【0172】
本明細書に記載されている方法論は、用途に応じて様々な手段によって実装され得る。例えば、これらの方法論は、ハードウェア、ファームウェア、ソフトウェア、またはそれらの任意の組み合わせで実装され得る。ハードウェア実装形態では、処理ユニットは、1つまたは複数の特定用途向け集積回路(ASIC)、デジタル信号プロセッサ(DSP)、デジタル信号処理デバイス(DSPD)、プログラマブルロジックデバイス(PLD)、フィールドプログラマブルゲートアレイ(FPGA)、プロセッサ、コントローラ、マイクロコントローラ、マイクロプロセッサ、電子デバイス、本明細書に記載されている機能を実施するように設計された他の電子ユニット、またはこれらの組み合わせ内に実装され得る。
【0173】
様々な実施形態において、本教示の方法は、ファームウェア、および/またはソフトウェアプログラム、および従来のプログラミング言語、例えば、C、C++、Python等により書かれたアプリケーションとして実装され得る。ファームウェアおよび/またはソフトウェアとして実装される場合、本明細書に記載されている実施形態は、上記に記載された方法をコンピュータに実施させるプログラムが格納されている非一時的コンピュータ可読媒体に実装され得る。本明細書に記載されている様々なエンジンは、コンピュータシステム1800などのコンピュータシステム上に設けることができ、それによってプロセッサ1804は、メモリ構成要素RAM1806、ROM1808、または記憶デバイス1810、および入力デバイス1814を介して提供されるユーザ入力のいずれか1つまたはこれらの組み合わせによって提供される命令に従って、これらのエンジンによって提供される分析および決定を実行することが理解されるべきである。
【0174】
V.実施形態の列挙
実施形態1.主要組織適合性遺伝子複合体(MHC)対立遺伝子を型決定する方法であって、MHC遺伝子に関連する対立遺伝子ペアのエクソン分解能識別子のセットを受け取ることであって、対立遺伝子ペアの対応する対立遺伝子のエクソン分解能識別子のセットのエクソン分解能識別子が、対立遺伝子群、特異的対立遺伝子タンパク質、および対応する対立遺伝子のエクソン領域情報を記載する、エクソン分解能識別子のセットを受け取ること;試料の複数のリードを受け取ること;エクソン分解能識別子のセットのそれぞれのエクソン分解能識別子のために、イントロン分解能識別子のセットを特定して、複数のイントロン分解能候補識別子を形成することであって、対応する対立遺伝子のイントロン分解能識別子のセットのイントロン分解能識別子が、対立遺伝子群、特異的対立遺伝子タンパク質、エクソン領域情報、および対応する対立遺伝子のイントロン領域情報を記載する、複数のイントロン分解能候補識別子を形成すること;ならびに複数のイントロン分解能候補識別子から対立遺伝子ペアのイントロン分解能識別子の最終セットを生成することを含む、方法。
【0175】
実施形態2.単一エクソン分解能識別子を含むエクソン分解能識別子のセットが、対立遺伝子ペアがエクソンレベルの分解能でホモ接合性であることを示す、実施形態1に記載の方法。
【0176】
実施形態3.少なくとも2つのエクソン分解能識別子を含むエクソン分解能識別子のセットが、対立遺伝子ペアがエクソンレベルの分解能でヘテロ接合性であることを示す、実施形態1に記載の方法。
【0177】
実施形態4.イントロン分解能識別子の最終セットを生成することが、複数のリードおよびセットカバーリングアルゴリズムを使用して、複数のイントロン分解能候補識別子から対立遺伝子ペアのイントロン分解能識別子の最終セットを生成することを含む、実施形態1から3のいずれか一項に記載の方法。
【0178】
実施形態5.イントロン分解能識別子の最終セットを生成することが、セットカバーリングアルゴリズムを複数のリードに適用して、複数のイントロン分解能候補識別子からソリューションペアのセットを特定することを含み、ソリューションペアのセットのそれぞれのソリューションペアが、複数のイントロン分解能候補識別子からの2つの異なるイントロン分解能候補識別子を含む、実施形態1から4のいずれか一項に記載の方法。
【0179】
実施形態6.イントロン分解能識別子の最終セットを生成することが、多数のソリューションペアを含むソリューションペアのセットに応答して、多数のソリューションペアの分解を実施して、対立遺伝子ペアのイントロン分解能識別子の最終セットを形成することをさらに含む、実施形態5に記載の方法。
【0180】
実施形態7.実施することが、階層クラスタリングを使用して多数のソリューションペアを分解して、対立遺伝子ペアのイントロン分解能識別子の最終セットを形成することを含む、実施形態6に記載の方法。
【0181】
実施形態8.生成することが、ソリューションペアのセットがイントロン分解能識別子の単一ペアを含むことを決定すること、および選択されたイントロン分解能識別子がイントロン分解能識別子の単一ペアと同じ量の複数のリードのカバレージを提供する場合、イントロン分解能識別子の単一ペアの選択されたイントロン分解能識別子をイントロン分解能識別子の最終セットとして出力することを含む、実施形態5に記載の方法。
【0182】
実施形態9.セットカバーリングアルゴリズムを使用して、複数のエクソン分解能候補識別子からエクソン分解能識別子のセットを生成することをさらに含む、実施形態1から8のいずれか一項に記載の方法。
【0183】
実施形態10.複数のリードの少なくとも一部とMHC遺伝子の複数の潜在的エクソン分解能識別子とのアラインメントを評価すること、およびエクソンカバレージに基づいて複数の潜在的エクソン分解能識別子から複数のエクソン分解能候補識別子を形成することをさらに含む、実施形態9に記載の方法。
【0184】
実施形態11.複数のリードをフィルタ処理して、フィルタ処理された複数のリードを形成することをさらに含み、アラインメントが、フィルタ処理された複数のリードと複数の潜在的エクソン分解能識別子との間で評価される、実施形態10に記載の方法。
【0185】
実施形態12.複数のエクソン分解能候補識別子を形成することが、複数の潜在的エクソン分解能識別子のうちの1つの潜在的エクソン分解能識別子を、潜在的エクソン分解能識別子に関連する複数のエクソンがカバレージ閾値で複数のリードによりカバーされている場合、複数のエクソン分解能候補識別子に付加することを含む、実施形態10または実施形態11に記載の方法。
【0186】
実施形態13.セットカバーリングアルゴリズムを複数のリードに適用して、複数のエクソン分解能候補識別子からソリューションペアのセットを特定することをさらに含み、ソリューションペアのセットのそれぞれのソリューションペアが、複数のエクソン分解能候補識別子からの2つの異なるエクソン分解能候補識別子を含む、実施形態1から12のいずれか一項に記載の方法。
【0187】
実施形態14.多数のソリューションペアを含むソリューションペアのセットに応答して、多数のソリューションペアの分解を実施して、対立遺伝子ペアのエクソン分解能識別子のセットを形成することをさらに含む、実施形態13に記載の方法。
【0188】
実施形態15.実施することが、階層クラスタリングを使用して多数のソリューションペアを分解して、対立遺伝子ペアのエクソン分解能識別子のセットを形成することを含む、実施形態14に記載の方法。
【0189】
実施形態16.ソリューションペアのセットがエクソン分解能識別子の単一ペアを含むことを決定すること、および選択されたエクソン分解能識別子がエクソン分解能識別子の単一ペアと同じ量の複数のリードのカバレージを提供する場合、エクソン分解能識別子の単一ペアの選択されたエクソン分解能識別子をエクソン分解能識別子のセットとして出力することをさらに含む、実施形態13に記載の方法。
【0190】
実施形態17.複数の潜在的エクソン分解能識別子を複数の最終候補エクソンに制約することによって、MHC遺伝子の複数の潜在的エクソン分解能識別子を特定することをさらに含む、実施形態10から16のいずれか一項に記載の方法。
【0191】
実施形態18.セットカバーリングアルゴリズムを使用して、複数の最終候補エクソンを特定することをさらに含む、実施形態10から17のいずれか一項に記載の方法。
【0192】
実施形態19.複数の候補MHCエクソンを特定し、複数の候補MHCエクソンのそれぞれが、複数のリードの少なくとも一部の少なくとも1つのリードで完全カバーされていること、および複数の候補MHCエクソンから複数の最終候補エクソンを特定することをさらに含む、実施形態10から18のいずれか一項に記載の方法。
【0193】
実施形態20.試料が、健康組織の試料および不健康組織の試料からなる群のうちの1つから選択され、複数のリードが、全エクソームシーケンシング(WES)または全ゲノムシーケンシング(WGS)の少なくとも一方を介して生成される、実施形態1から19のいずれか一項に記載の方法。
【0194】
実施形態21.イントロン分解能識別子の最終セットを使用して、MHC遺伝子の対立遺伝子ペアの第1の対立遺伝子のイントロン分解能識別子の第1のセット、および対立遺伝子ペアの第2の対立遺伝子のイントロン分解能識別子の第2のセットを生成することをさらに含み、イントロン分解能識別子の第1のセットおよびイントロン分解能識別子の第2のセットのそれぞれが、対立遺伝子ペアがホモ接合性である場合、同じ単一イントロン分解能識別子を含む、実施形態1から20のいずれか一項に記載の方法。
【0195】
実施形態22.イントロン分解能識別子の最終セットを使用して、試料と別の試料とのMHC喪失を評価することをさらに含む、実施形態1から21のいずれか一項に記載の方法。
【0196】
実施形態23.複数のリードが複数のペアエンドリードを含む、実施形態1から22のいずれか一項に記載の方法。
【0197】
実施形態24.MHC遺伝子がヒト白血球抗原(HLA)遺伝子であり、MHC対立遺伝子がHLA対立遺伝子である、実施形態1から23のいずれか一項に記載の方法。
【0198】
実施形態25.イントロン分解能識別子の最終セットが、MHC遺伝子のそれぞれのエクソン位置のエクソン識別子の最終セットにより形成されるシリーズに基づいて生成される、実施形態1から24のいずれか一項に記載の方法。
【0199】
実施形態エクソン分解能識別子のセットが、MHC遺伝子のそれぞれのエクソン位置のエクソン識別子の最終セットにより形成されるシリーズに基づいて生成される、実施形態1から25のいずれか一項に記載の方法。
【0200】
実施形態イントロン分解能識別子の最終セットが、エクソン識別子レベル、エクソン分解能識別子レベルおよびイントロン分解能識別子レベルで使用される3つのセットカバーリングアルゴリズムに基づいて生成される、実施形態1から24のいずれか一項に記載の方法。
【0201】
実施形態イントロン分解能識別子の最終セットが、エクソン識別子レベル、エクソン分解能識別子レベルおよびイントロン分解能識別子レベルでの三層精緻化に基づいて生成される、実施形態1から24のいずれか一項に記載の方法。
【0202】
実施形態29.リードと、主要組織適合性遺伝子複合体(MHC)遺伝子の対立遺伝子配列とを、MHC対立遺伝子発現の評価に使用するために比較する方法であって、MHC遺伝子の第1の対立遺伝子のイントロン分解能識別子の第1のセット、およびMHC遺伝子の第2の対立遺伝子のイントロン分解能識別子の第2のセットを受け取ること;第1の試料の第1の複数のリード、および第2の試料の第2の複数のリードを受け取ること;ならびにイントロン分解能識別子の第1のセットのうちから選択された1つを使用して、MHC遺伝子の第1の対立遺伝子の第1の対立遺伝子配列、およびイントロン分解能識別子の第2のセットのうちから選択された1つを使用して、MHC遺伝子の第2の対立遺伝子の第2の対立遺伝子配列を特定すること;ならびに対立遺伝子リードアラインメントを、第1の対立遺伝子配列と第1の複数のリードおよび第2の複数のリードのそれぞれとの間、ならびに第2の対立遺伝子配列と第1の複数のリードおよび第2の複数のリードのそれぞれとの間で定量化して、アラインメント出力を形成することを含む、方法。
【0203】
実施形態30.対立遺伝子リードアラインメントを定量化することが、イントロン分解能識別子の第1のセットのうちから選択された1つおよびイントロン分解能識別子の第2のセットのうちから選択された1つに対応する、第1の対立遺伝子配列および第2の対立遺伝子配列の使用に基づいて、対立遺伝子リードアラインメントを増加された精度で定量化することを含む、実施形態29に記載の方法。
【0204】
実施形態31.対立遺伝子リードアラインメントを定量化することが、第1の対立遺伝子配列と第1の複数のリードとの間の第1の対立遺伝子と第1の試料とのアラインメントの数をカウントすること、および、第1の対立遺伝子配列と第2の複数のリードとの間の第1の対立遺伝子と第2の試料とのアラインメントの数をカウントすることを含む、実施形態29に記載の方法。
【0205】
実施形態32.第1のアラインメント数および第2のアラインメント数を使用して、第1の対立遺伝子に関連するMHC喪失を評価することをさらに含む、実施形態31に記載の方法。
【0206】
実施形態33.対立遺伝子リードアラインメントを定量化することが、第2の対立遺伝子配列と第1の複数のリードとの間の第2の対立遺伝子と第1の試料とのアラインメントの数をカウントすること、および、第2の対立遺伝子配列と第2の複数のリードとの間の第2の対立遺伝子と第2の試料とのアラインメントの数をカウントすることを含む、実施形態29に記載の方法。
【0207】
実施形態34.第1のアラインメント数および第2のアラインメント数を使用して、第2の対立遺伝子に関連するMHC喪失を評価することをさらに含む、実施形態33に記載の方法。
【0208】
実施形態35.アラインメント出力を使用して統計分析を実施して、MHC喪失の評価に使用するための統計出力を生成することをさらに含む、実施形態29から34のいずれか一項に記載の方法。
【0209】
実施形態36.第1の対立遺伝子と第2の対立遺伝子がホモ接合性である場合、イントロン分解能識別子の第1のセットが、イントロン分解能識別子の第2のセットと同一である、実施形態29から35のいずれか一項に記載の方法。
【0210】
実施形態37.複数のリードが、全エクソームシーケンシング(WES)または全ゲノムシーケンシング(WGS)の少なくとも一方を介して生成される、実施形態29から36のいずれか一項に記載の方法。
【0211】
実施形態38.第1の試料が健康組織の試料であり、第2の試料が不健康組織の試料である、実施形態29から37のいずれか一項に記載の方法。
【0212】
実施形態39.イントロン分解能識別子の第1のセットおよびイントロン分解能識別子の第2のセットのそれぞれのイントロン分解能識別子が、8桁MHC対立遺伝子識別子である、実施形態29から38のいずれか一項に記載の方法。
【0213】
実施形態40.アラインメント出力を使用してMHC喪失を評価することをさらに含む、実施形態29から39のいずれか一項に記載の方法。
【0214】
実施形態41.MHC遺伝子がヒト白血球抗原(HLA)遺伝子である、実施形態29から40のいずれか一項に記載の方法。
【0215】
実施形態42.試料間の主要組織適合性遺伝子複合体(MHC)対立遺伝子喪失を分析する方法であって、第1の試料および第2の試料に関連するMHC遺伝子の対立遺伝子のペアのMHCアラインメント入力を受け取ること;第1の試料および第2の試料に関連する複数の非MHC遺伝子の非MHCアラインメント入力を受け取ること;非MHCアラインメント入力を使用して、対立遺伝子喪失閾値を計算すること;対立遺伝子喪失閾値を使用してMHCアラインメント入力の統計分析を実施して、MHC喪失の評価に使用する統計出力を形成することを含む、方法。
【0216】
実施形態43.統計出力を使用して、対立遺伝子ペアの少なくとも1つの対立遺伝子の喪失を評価することをさらに含む、実施形態42に記載の方法。
【0217】
実施形態44.MHCアラインメント入力を受け取ることが、対立遺伝子ペアの第1の対立遺伝子および第1の試料に対応する第1のアラインメント数を受け取ること、ならびに対立遺伝子ペアの第1の対立遺伝子および第2の試料に対応する第2のアラインメント数を受け取ることを含む、実施形態42および43のいずれか一項に記載の方法。
【0218】
実施形態45.MHCアラインメント入力を受け取ることが、対立遺伝子ペアの第2の対立遺伝子および第1の試料に関連する第3のアラインメント数を受け取ること、ならびに対立遺伝子ペアの第2の対立遺伝子および第2の試料に関連する第4のアラインメント数を受け取ることをさらに含む、実施形態44に記載の方法。
【0219】
実施形態46.統計分析を実施することが、対立遺伝子ペアの第1の対立遺伝子の第1の統計量tを計算すること、および対立遺伝子ペアの第2の対立遺伝子の第2の統計量tを計算することを含む、実施形態42から45のいずれか一項に記載の方法。
【0220】
実施形態47.第1の統計量tおよび第2の統計量tを分析して、対立遺伝子ペアの発現をカテゴリ化することをさらに含む、実施形態46に記載の方法。
【0221】
実施形態48.第1の統計量tおよび第2の統計量tを分析することが、ボロノイ図を使用して第1の統計量tおよび第2の統計量tを分析することを含む、実施形態47に記載の方法。
【0222】
実施形態49.統計出力を使用して、対立遺伝子ペアの発現を複数のカテゴリの1つとしてカテゴリ化することをさらに含み、複数のカテゴリが、正常な発現、単一欠失、二重欠失、ヘテロ接合性喪失、単一増幅、および二重増幅を含む、実施形態42から48のいずれか一項に記載の方法。
【0223】
実施形態50.統計分析を実施することが、対立遺伝子ペアのZスコアを計算することを含む、実施形態42から49のいずれか一項に記載の方法。
【0224】
実施形態51.統計分析を実施することが、変動の分析(ANOVA)を使用して統計分析を実施することを含む、実施形態42から50のいずれか一項に記載の方法。
【0225】
実施形態52.統計出力の少なくとも一部分を含有する報告を生成することをさらに含み、報告が、MHC遺伝子の対立遺伝子のために、対立遺伝子の腫瘍対正常コピー数のlog比の信頼区間、対立遺伝子の統計量t、対立遺伝子のZスコアまたはその対立遺伝子のp値のうちの少なくとも1つを含む、実施形態42から51のいずれか一項に記載の方法。
【0226】
実施形態53.統計出力を使用して少なくとも1つのMHC対立遺伝子の喪失を検出すること、および少なくとも1つのMHC対立遺伝子の喪失に基づいて免疫療法を個人化することをさらに含む、実施形態42から52のいずれか一項に記載の方法。
【0227】
実施形態54.統計出力を使用して少なくとも1つのMHC対立遺伝子の喪失を検出すること、および少なくとも1つのMHC対立遺伝子により提示される抗原のセットを、免疫療法の標的抗原のセットから除くことを決定することをさらに含む、実施形態42から52のいずれか一項に記載の方法。
【0228】
実施形態55.統計出力に基づいて、腫瘍細胞の表面上の対立遺伝子ペアのMHC対立遺伝子により提示される抗原を免疫療法の標的として含めることを決定することをさらに含む、実施形態42から52および54のいずれか一項に記載の方法。
【0229】
実施形態56.統計出力に基づいて、腫瘍細胞の表面上の対立遺伝子ペアのMHC対立遺伝子により提示される抗原を免疫療法の標的から除くことを決定することをさらに含む、実施形態42から52のいずれか一項に記載の方法。
【0230】
実施形態57.免疫療法が、T細胞療法、個人化がん療法、抗原特異的免疫療法、抗原依存性免疫療法、ワクチン、およびナチュラルキラー(NK)細胞療法からなる群から選択される、実施形態53から56のいずれか一項に記載の方法。
【0231】
実施形態58.MHC遺伝子がヒト白血球抗原(HLA)遺伝子である、実施形態42から57のいずれか一項に記載の方法。
【0232】
実施形態59.試料間の主要組織適合性遺伝子複合体(MHC)対立遺伝子喪失を分析する方法であって、第1の試料の第1の複数のリード、および第2の試料の第2の複数のリードを受け取ること;MHC遺伝子の第1の対立遺伝子のイントロン分解能識別子の第1のセット、およびMHC遺伝子の第2の対立遺伝子のイントロン分解能識別子の第2のセットを受け取ること;イントロン分解能識別子の第1のセットおよびイントロン分解能識別子の第2のセットを使用して、対立遺伝子配列ペアのセットを特定し、対立遺伝子配列ペアのセットにおけるそれぞれの対立遺伝子配列ペアが、第1の対立遺伝子の第1の対立遺伝子配列および第2の対立遺伝子の第2の対立遺伝子配列を含むこと;第1の対立遺伝子配列、第2の対立遺伝子配列、第1の複数のリード、および第2の複数のリードを使用して、複数のアラインメントカウントを対立遺伝子配列ペアのセットにおけるそれぞれの対立遺伝子配列ペアのために生成すること;非MHC遺伝子のアラインメントカウントのコレクションを使用して、対立遺伝子喪失閾値を計算すること;ならびに対立遺伝子喪失閾値を使用して複数のアラインメントカウントの統計分析を実施して、第1の試料と比較した第2の試料におけるMHC喪失の評価に使用する統計出力を形成することを含む、方法。
【0233】
実施形態60.対立遺伝子配列ペアのセットの対立遺伝子配列のそれぞれの対立遺伝子配列ペアのために、複数の整数カウントを生成することが、対立遺伝子配列ペアのセットの対応する対立遺伝子配列ペアの第1の対立遺伝子配列と、第1の複数のリードとの間の第1の対立遺伝子および第1の試料のアラインメント数をカウントすること、ならびに対応する対立遺伝子配列ペアの第1の対立遺伝子配列と、第2の複数のリードとの間の第1の対立遺伝子および第2の試料のアラインメント数をカウントすることを含む、実施形態59に記載の方法。
【0234】
実施形態61.対立遺伝子配列ペアのセットの対立遺伝子配列のそれぞれの対立遺伝子配列ペアのために、複数の整数カウントを生成することが、対立遺伝子配列ペアのセットの対応する対立遺伝子配列ペアの第2の対立遺伝子配列と、第1の複数のリードとの間の第2の対立遺伝子および第1の試料のアラインメント数をカウントすること、ならびに対応する対立遺伝子配列ペアの第2の対立遺伝子配列と、第2の複数のリードとの間の第2の対立遺伝子および第2の試料のアラインメント数をカウントすることを含む、実施形態59および60いずれか一項に記載の方法。
【0235】
実施形態62.統計分析を実施することが、第1の対立遺伝子配列を有する第1の対立遺伝子の第1の統計量tを計算すること、および第2の対立遺伝子配列を有する第2の対立遺伝子の第2の統計量tを計算することを含む、実施形態59から61のいずれか一項に記載の方法。
【0236】
実施形態63.統計出力を使用して、第1の対立遺伝子および第2の対立遺伝子の発現を複数のカテゴリの1つとしてカテゴリ化することをさらに含み、複数のカテゴリが、正常な発現、単一欠失、二重欠失、ヘテロ接合性喪失、単一増幅、および二重増幅を含む、実施形態59から62のいずれか一項に記載の方法。
【0237】
実施形態64.MHC遺伝子がヒト白血球抗原(HLA)遺伝子であり、非MHC遺伝子が非HLA遺伝子である、実施形態59から63のいずれか一項に記載の方法。
【0238】
実施形態65.主要組織適合性遺伝子複合体(MHC)コピー数変更を評価する方法であって、第1の試料の第1の複数のリード、および第2の試料の第2の複数のリードを受け取ること;第1の複数のリードおよびセットカバーリングアルゴリズムを使用して、MHC遺伝子の対立遺伝子ペアのイントロン分解能識別子の最終セットを特定すること;イントロン分解能識別子の最終セットを使用して、対立遺伝子配列ペアのセットを特定し、対立遺伝子配列ペアのセットにおけるそれぞれの対立遺伝子配列ペアが、対立遺伝子ペアの第1の対立遺伝子配列および第2の対立遺伝子配列を含むこと;第1の対立遺伝子配列、第2の対立遺伝子配列、第1の複数のリード、および第2の複数のリードを使用して、複数のアラインメントカウントを対立遺伝子配列ペアのセットにおけるそれぞれの対立遺伝子配列ペアのために生成すること;複数のアラインメントカウントの統計分析を実施して、統計出力を形成すること;統計出力を使用して、第1の試料と比較して第2の試料におけるMHCコピー数変更を推定することを含む、方法。
【0239】
実施形態66.統計出力を使用して、第1の対立遺伝子および第2の対立遺伝子の発現を複数のカテゴリの1つとしてカテゴリ化することをさらに含み、複数のカテゴリが、正常な発現、単一欠失、二重欠失、ヘテロ接合性喪失、単一増幅、および二重増幅を含む、実施形態65に記載の方法。
【0240】
実施形態67.統計出力を使用して、対立遺伝子ペアの少なくとも1つの対立遺伝子の喪失を検出すること、および対立遺伝子ペアの少なくとも1つの対立遺伝子により提示される抗原のセットを、免疫療法の標的抗原のセットから除くことを決定することをさらに含む、実施形態65および66のいずれか一項に記載の方法。
【0241】
実施形態68.統計出力に基づいて、腫瘍細胞の表面上の対立遺伝子ペアの少なくとも1つの対立遺伝子により提示される抗原を免疫療法の標的として含めることを決定することをさらに含む、実施形態65から67のいずれか一項に記載の方法。
【0242】
実施形態69.統計出力に基づいて、腫瘍細胞の表面上の対立遺伝子ペアのMHC対立遺伝子により提示される抗原を免疫療法の標的から除くことを決定することをさらに含む、実施形態65から68のいずれか一項に記載の方法。
【0243】
実施形態70.統計出力を使用して対立遺伝子ペアの少なくとも1つの対立遺伝子の喪失を検出すること、および少なくとも1つの対立遺伝子の喪失に基づいて免疫療法を個人化することをさらに含む、実施形態65および66のいずれか一項に記載の方法。
【0244】
実施形態71.免疫療法が、T細胞療法、個人化がん療法、抗原特異的免疫療法、抗原依存性免疫療法、ワクチン、およびナチュラルキラー(NK)細胞療法からなる群から選択される、実施形態65から70いずれか一項に記載の方法。
【0245】
実施形態72.統計出力の少なくとも一部分を含有する報告を生成することをさらに含み、報告が、MHC遺伝子の対立遺伝子のために、対立遺伝子の腫瘍対正常コピー数のlog比の信頼区間、対立遺伝子の統計量t、対立遺伝子のZスコアまたはその対立遺伝子のp値のうちの少なくとも1つを含む、実施形態65から71のいずれか一項に記載の方法。
【0246】
実施形態73.MHC遺伝子がヒト白血球抗原(HLA)遺伝子である、実施形態65から72のいずれか一項に記載の方法。
【0247】
実施形態74.1つまたは複数のデータプロセッサと、命令を含有する非一時的コンピュータ可読記憶媒体であって、該命令が、1つまたは複数のデータプロセッサ上で実行される場合、1つまたは複数のデータプロセッサに、実施形態1から73に開示される1つまたは複数の方法の一部またはすべてを実施させる、非一時的コンピュータ可読記憶媒体とを含む、システム。
【0248】
実施形態75.1つまたは複数のデータプロセッサに、実施形態1から73に開示される1つまたは複数の方法の一部またはすべてを実施させるように構成された命令を含む、非一時的機械可読記憶媒体において有形に具現化されたコンピュータプログラム製品。
実施形態76.実施形態1から73に開示される1つまたは複数の方法を含む、方法。
【0249】
VI.追加の検討
本文書のセクションおよびサブセクション間の見出しおよび小見出しは、読みやすさを改善するために含まれるに過ぎず、特徴がセクションおよびサブセクションをまたいで組み合わされ得ないことを示唆するものではない。よって、セクションおよびサブセクションは、別個の実施形態を説明するものではない。
【0250】
本開示の一部の実施形態は、1つまたは複数のデータプロセッサを含むシステムを含む。一部の実施形態において、システムは、命令を含有する非一時的コンピュータ可読記憶媒体であって、該命令が、1つまたは複数のデータプロセッサ上で実行される場合、1つまたは複数のデータプロセッサに、本明細書に開示される1つもしくは複数の方法の一部もしくはすべて、および/または1つもしくは複数のプロセスの一部もしくはすべてを実施させる、非一時的コンピュータ可読記憶媒体を含む。本開示の一部の実施形態は、本明細書に開示される1つもしくは複数の方法の一部もしくはすべて、および/または1つもしくは複数のプロセスの一部もしくはすべてを、1つまたは複数のデータプロセッサに実施させるように構成された命令を含む非一時的機械可読記憶媒体において有形に具現化されたコンピュータプログラム製品を含む。
【0251】
用いられている用語および表現は、記載のための用語として使用され、限定するためではなく、そのような用語および表現の使用は、示されている、および記載されている特徴またはその一部分の任意の同等物を除くことを意図しないが、様々な修正が特許請求される本発明の範囲内で可能であることが認識される。よって、特許請求される本発明は実施形態および任意選択の特徴によって特定的に開示されているが、本明細書に開示されている概念の修正および変更は、当業者により求められてもよく、そのような修正および変更は、添付の特許請求の範囲により定義されている本発明の範囲内であると考慮されることが理解されるべきである。
【0252】
続く記載は、好ましい例示的な実施形態のみを提供し、本開示の範囲、適用可能性または構成を限定することを意図しない。むしろ、好ましい例示的な実施形態の続く記載は、様々な実施形態を実装することを可能にする記載を当業者に提供する。様々な変更を、添付の特許請求の範囲に記載された精神および範囲を逸脱することなく、要素の機能および配置(例えば、ブロックまたは概略図における要素、流れ図における要素)に行ってもよいことが理解される。
【0253】
特定の詳細が、実施形態の十分な理解を提供するために続く記載に提示されている。しかし実施形態は、これらの特定の詳細がなくても実践できることが理解されるであろう。例えば、回路、システム、ネットワーク、プロセス、および他の構成要素は、実施形態を不必要に詳細に不明瞭にしないために、ブロック図形式の構成要素として示されてもよい。他の場合では、実施形態を不明瞭にすることを避けるために、周知の回路、プロセス、アルゴリズム、構造、および技術が不必要な詳細なしに示されてもよい。
図1
図2
図3
図4
図5
図6
図7A
図7B
図8
図9
図10
図11
図12
図13
図14
図15
図16
図17A
図17B
図17C
図17D
図17E
図17F
図18
【国際調査報告】