IP Force 特許公報掲載プロジェクト 2022.1.31 β版

知財求人 - 知財ポータルサイト「IP Force」

▶ エスシーエル ヘルスケア カンパニー リミテッドの特許一覧

特表2025-505828核酸配列分析に基づく遺伝子変異解析方法
<>
  • 特表-核酸配列分析に基づく遺伝子変異解析方法 図1
< >
(19)【発行国】日本国特許庁(JP)
(12)【公報種別】公表特許公報(A)
(11)【公表番号】
(43)【公表日】2025-02-28
(54)【発明の名称】核酸配列分析に基づく遺伝子変異解析方法
(51)【国際特許分類】
   C12Q 1/6827 20180101AFI20250220BHJP
【FI】
C12Q1/6827 Z
【審査請求】未請求
【予備審査請求】未請求
(21)【出願番号】P 2024549237
(86)(22)【出願日】2023-02-17
(85)【翻訳文提出日】2024-08-16
(86)【国際出願番号】 KR2023002310
(87)【国際公開番号】W WO2023158253
(87)【国際公開日】2023-08-24
(31)【優先権主張番号】10-2022-0020483
(32)【優先日】2022-02-17
(33)【優先権主張国・地域又は機関】KR
(81)【指定国・地域】
(71)【出願人】
【識別番号】524308756
【氏名又は名称】エスシーエル ヘルスケア カンパニー リミテッド
(74)【代理人】
【識別番号】110002860
【氏名又は名称】弁理士法人秀和特許事務所
(72)【発明者】
【氏名】イ,サンフ
(72)【発明者】
【氏名】ホン,ジョン フン
(72)【発明者】
【氏名】イ,ミ-ギョン
(72)【発明者】
【氏名】ペク,セユン
(72)【発明者】
【氏名】イ,ギョン-リュル
【テーマコード(参考)】
4B063
【Fターム(参考)】
4B063QA13
4B063QQ02
(57)【要約】
NGSによって検出される遺伝子変異の種類が非常に広範囲であり、すべての遺伝子変異が常に疾病につながるのではないため、探知された遺伝子変異について疾病の関連性に対する意味を迅速かつ正確に解析することに困難がある。本発明は、核酸配列分析に基づく遺伝子変異解析方法に関し、本発明の遺伝子変異解析方法は、ACMGガイドラインに基づいて病原性情報を分類し、病原性レベルを判定できるNGS変異データ解析ロジックツリーを提供するので、生命科学および医療保健分野において大きく利用されることが期待される。
【特許請求の範囲】
【請求項1】
(a)塩基配列分析の結果から遺伝子変異情報を得るステップと、
(b)前記遺伝子変異情報について臨床的特徴情報、単一塩基変異の発生頻度情報、反復配列情報、タンパク質ドメイン(domain)情報、およびインシリコ(in-silico)予測情報を対照して病原性情報を分類するステップと、
(c)病原性レベルを決定するステップと、を含む、遺伝子変異の病原性の決定方法。
【請求項2】
前記臨床的特徴情報、単一塩基変異の発生頻度情報、反復配列情報、タンパク質ドメイン(domain)情報、およびインシリコ(in-silico)予測情報は、公共のデータベースから抽出されるものである、請求項1に記載の方法。
【請求項3】
前記(b)ステップにおける病原性情報の分類は、
病因性基準(pathogenic criteria)について非常に強い(very strong)、強い(strong)、普通(moderate)、および裏付け(supporting)に区分し、
良性基準(benign criteria)について独立(stand-alone)、強い(strong)、および裏付け(supporting)に区分するものである、請求項1に記載の方法。
【請求項4】
前記(b)ステップにおける病原性情報の分類は、
病因性基準(pathogenic criteria)について非常に強い1段階、強い(strong)1~4段階、普通(moderate)1~6段階、および裏付け(supporting)1~5段階に区分し、
良性基準(benign criteria)について独立(stand-alone)1段階、強い(strong)1~4段階、および裏付け(supporting)1~7段階に区分するものである、請求項3に記載の方法。
【請求項5】
前記臨床的特徴情報は、病因性基準の非常に強い1段階、病因性基準の強い1段階、病因性基準の普通1段階、病因性基準の普通5段階、病因性基準の裏付け2段階、良性基準の強い1段階、および良性基準の裏付け6段階から構成されるグループより選択されるいずれか1つ以上の分類に適用されるものである、請求項4に記載の方法。
【請求項6】
前記単一塩基変異の発生頻度情報は、病因性基準の普通2段階、良性基準の独立1段階、良性基準の裏付け1段階、および良性基準の裏付け2段階から構成されるグループより選択されるいずれか1つ以上の分類に適用されるものである、請求項4に記載の方法。
【請求項7】
前記反復配列情報は、病因性基準の普通4段階、および良性基準の裏付け3段階から構成されるグループより選択されるいずれか1つ以上の分類に適用されるものである、請求項4に記載の方法。
【請求項8】
前記タンパク質ドメイン情報は、病因性基準の普通1段階の分類に適用されるものである、請求項4に記載の方法。
【請求項9】
前記インシリコ(in-silico)予測情報は、病因性基準の裏付け3段階、良性基準の裏付け4段階、および良性基準の裏付け7段階から構成されるグループより選択されるいずれか1つ以上の分類に適用されるものである、請求項4に記載の方法。
【請求項10】
前記(c)ステップにおける病原性レベルの決定は、病因性(pathogenic)、準病因性(likely pathogenic)、良性(benign)、準良性(
likely benign)、および不確実な重要性(uncertain significance)に区分するものである、請求項1に記載の方法。
【請求項11】
前記準良性(likely benign)病原性の決定は、不確実な重要性(uncertain significance)、不確実な重要性-病因性(uncertain significance-pathogenic)、および不確実な重要性-良性(uncertain significance-benign)に区分するものである、請求項10に記載の方法。
【請求項12】
(a)塩基配列分析の結果から得られた遺伝子変異情報を入力する入力部と、
(b)前記遺伝子変異情報について臨床的特徴情報、単一塩基変異の発生頻度情報、反復配列情報、タンパク質ドメイン(domain)情報、およびインシリコ(in-silico)予測情報を対照して病原性情報を分類する演算部と、
(c)病原性レベルを決定する判定部と、を含む、遺伝子変異の病原性の決定装置。
【請求項13】
前記臨床的特徴情報、単一塩基変異の発生頻度情報、反復配列情報、タンパク質ドメイン(domain)情報、およびインシリコ(in-silico)予測情報は、公共のデータベースから抽出されるものである、請求項12に記載の装置。
【請求項14】
(a)目的の個体から分離された試料に対して塩基配列分析を行うステップと、
(b)請求項1に記載の方法で遺伝子変異の病原性を決定するステップと、
(c)病原性の決定結果に応じて、前記個体の疾病発生を予測するステップと、を含む、個体の疾病発生の予測方法。
【請求項15】
(a)目的の個体から分離された試料に対して塩基配列分析を行うステップと、
(b)請求項1に記載の方法で遺伝子変異の病原性を決定するステップと、
(c)病原性の決定結果に応じて、前記個体の疾病発生の原因を把握するステップと、を含む、個体の病因の診断に関する情報を提供する方法。
【発明の詳細な説明】
【技術分野】
【0001】
本発明は、核酸配列分析に基づく遺伝子変異解析方法に関する。
【背景技術】
【0002】
大容量塩基配列解読技術である次世代塩基配列分析(Next Generation
Sequencing、NGS)の急速な発展により変異追跡を含む遺伝体データ研究が活発に進められており、これを疾病の診断に利用しようとする努力が続いている。しかし、NGSによって検出される遺伝子変異の種類が非常に広範囲であり、単純表現型の差を誘発するだけの遺伝子変異も存在してすべての遺伝子変異が常に疾病につながるのではないため、探知された遺伝子変異について疾病の関連性に対する意味を迅速かつ正確に解析することに困難がある。また、全世界の科学者と医療関係者との間の円滑な意思疎通によって、NGS情報から解析された遺伝子変異の意味を共通した用語で伝達できる技術の必要性も台頭した。このような脈絡から、米国医学遺伝学会(American Medical College of Medical Genetics and Genomics、ACMG)、分子病理学会(Association for Molecular Pathology、AMP)、および米国病理学会(College of
American Pathologists、CAP)は、共同協議の勧告により病原性情報を計28種の根拠に分類し、これに基づいて病原性レベルを5種に判定するACMGガイドラインを提示した。しかし、依然として、NGSによって検出される多様な遺伝子変異情報を統合してACMGガイドラインに合わせて変異の病原性を決定することは非常に複雑多難なことで、研究および臨床適用への困難があるのが現状である。
【0003】
したがって、本発明は、上記の問題を解決するためになされたものであって、核酸配列分析に基づく遺伝子変異解析方法に関する。本発明の遺伝子変異解析方法は、ACMGガイドラインに基づいて病原性情報を分類し、病原性レベルを判定できるNGS変異データ解析ロジックツリーを提供するので、生命科学および医療保健分野において大きく利用されることが期待される。
【発明の概要】
【発明が解決しようとする課題】
【0004】
本発明は、上記の従来の技術上の問題点を解決するためになされたものであって、核酸配列分析に基づく遺伝子変異解析方法に関する。
【0005】
本発明は、一態様として、遺伝子変異の病原性の決定方法を提供する。
本発明の他の態様として、遺伝子変異の病原性の決定装置を提供する。
本発明のさらに他の態様として、個体の疾病発生の予測方法を提供する。
本発明のさらに他の態様として、個体の病因の診断に関する情報を提供する方法を提供する。
【0006】
しかし、本発明が解決しようとする技術的課題は以上に言及した課題に制限されず、言及されていない他の課題は以下の記載から当業界における通常の知識を有する者に明確に理解されるであろう。
【課題を解決するための手段】
【0007】
以下、本願に記載された多様な具体例が図面を参照して記載される。下記の説明において、本発明の完全な理解のために、多様な特異的詳細事項、例えば、特異的形態、組成物および工程などが記載されている。しかし、特定の具体例はこれらの特異的詳細事項の1
つ以上なしに、または他の公知の方法および形態とともに実行可能である。他の例において、公知の工程および製造技術は本発明を不必要にあいまいにしないようにするために、特定の詳細事項として記載されない。「一つの具体例」または「具体例」に対する本明細書全体による参照は、具体例と結びついて記載された特別な特徴、形態、組成または特性が本発明の一つ以上の具体例に含まれることを意味する。したがって、本明細書全体にわたる多様な位置で表現された「一つの具体例において」または「具体例」の状況は必ずしも本発明の同一の具体例を示さない。追加的に、特別な特徴、形態、組成、または特性は一つ以上の具体例において何らかの適した方法で組み合わされる。
【0008】
明細書において特別な定義がなければ、本明細書に使用されたすべての科学的および技術的用語は本発明の属する技術分野における当業者によって通常理解されるのと同じ意味を有する。
【0009】
明細書全体において、ある部分がある構成要素を「含む」とする時、これは特に反対の記載がない限り、他の構成要素を除くのではなく、他の構成要素をさらに包含できることを意味する。
【0010】
本発明は、米国医学遺伝学会(American Medical College of Medical Genetics and Genomics、ACMG)と分子病理学会(Association for Molecular Pathology)の共同協議の勧告案であるACMGガイドラインに基づいて病原性情報を分類し、病原性レベルを判定できるNGS変異データ解析ロジックツリーを提供する。
【0011】
本発明において、前記の「ACMGガイドライン」とは、米国医学遺伝学会(American Medical College of Medical Genetics
and Genomics、ACMG)、分子病理学会(Association for Molecular Pathology、AMP)、および米国病理学会(College of American Pathologists、CAP)の共同協議によって勧告される塩基配列変異(sequence variants)の解析のための指針である。ACMGガイドラインは、病原性情報を計28種の根拠に分類し、これに基づいて病原性レベルを5種に判定する分類方法を提供する。
【0012】
以下、ACMGガイドラインによる病原性情報の分類方法を下記表1に、病原性判定方法を表2に示した。
【0013】
【表1】
【0014】
【表2】
【0015】
前記表1と表2を含むACMGガイドラインについて、具体的には、追加的な情報は当業界で公知の先行文献(S Richards et al.,Genet Med.2015May;17(5):405-424.)などにより確認することができ、これを本発明に適用可能である。
【0016】
本発明の「ロジックツリー」、「ロジックツリーシステム」、または「システム」とは、与えられた問題を解決するためにコンピュータプログラミングなどが行うべき過程を示したものである。一定の順序によって機械的に処理すれば必ず目的の結果が得られる時、その一定の順序を目的に対するロジックツリーという。アルゴリズムの用語も代替可能である。
【0017】
本発明において、前記ロジックツリーシステムは、NGSによって検出される遺伝子変異情報からACMGガイドラインに基づいて病原性情報を分類し、病原性レベルを判定する方法を含むアルゴリズム、またはこれを実現する装置のシステムである。
【0018】
本発明のアルゴリズムは、当業界で公知の多様なデータベースから遺伝子変異の解析に役立つ多様なデータを収集し必要な情報を抽出して、前記ACMGガイドラインに合わせて根拠を分類し、これに基づいて病原性レベルを決定する。
【0019】
本発明のアルゴリズムは、前記当業界で公知の多様なデータベースから収集された情報を加工せず、必要な一部の情報のみを抽出して用いることを特徴とする。
【0020】
また、本発明のアルゴリズムは、目的の収集情報に応じてそれぞれ異なるデータベース(DB)を用いることを特徴とする。前記目的の収集情報は、臨床的特徴情報、公共(population)の単一塩基変異(single nucleotide polymorphism、SNP)の発生頻度情報、反復配列情報、タンパク質ドメイン(domain)情報、および/またはインシリコ(in-silico)予測情報であってもよく、前記in-silico予測情報は、missense予測情報、Splice予測情報、および/またはConservation予測情報であってもよい。この場合に、好ましくは、各情報を収集するデータベースは、臨床的特徴情報の場合、米国国立生物工学情報センター(National Center for Biotechnology Information、NCBI)で提供する臨床的特徴情報に基づくデータベースであってもよく、公共のSNPの発生頻度情報の場合、不特定多数の10,000人以上のSNPの発生頻度情報を提供するデータベースであってもよいし、反復配列情報の場合、散在した反復(interspersed repeats)および複雑性の低いDNA配列(low complexity DNA sequences)を含むデータベースであってもよいし、タンパク質ドメイン情報の場合、隠れマルコフモデル(Hidden Markov model)を用いてタンパク質のfamilyの多重配列整列を集めておいたデータベースであってもよいし、in-silico予測情報の場合、missense予測情報、Splice予測情報、およびConservation予測情報に区分するデータベースであってもよい。一例として、前記臨床的特徴情報の場合にClinVarデータベース、公共(population)のSNPの発生頻度情報の場合にGnomADデータベース、反復配列情報の場合にRepeatMaskerデータベース、タンパク質ドメイン情報の場合にPfamデータベース、missense予測情報の場合にMetaSVM、REVEL、Eigen、Polyphen2、Provean、またはVEST3のアルゴリズムを用いるデータベース、Splice予測情報の場合にAda_score&Rf_scoreのアルゴリズムを用いるデータベース、およびConservation予測情報の場合にGERP++のアルゴリズムを用いるデータベースを用いることができるが、これに限定されるものではない。前記各データベースのアイデンティティ(出所)を、下記表3と表4に示した。
【0021】
【表3】
【0022】
【表4】
【0023】
本発明の一具体例において、(a)塩基配列分析の結果から遺伝子変異情報を得るステップと、(b)前記遺伝子変異情報について臨床的特徴情報、単一塩基変異の発生頻度情報、反復配列情報、タンパク質ドメイン(domain)情報、およびin-silico予測情報を対照して病原性情報を分類するステップと、(c)病原性レベルを決定するステップと、を含む遺伝子変異の病原性の決定方法を提供する。前記塩基配列分析は、従来のサンガー(Sanger)-ベースのジデオキシヌクレオチド塩基配列分析、または次世代塩基配列分析のような新たな大規模並列型塩基配列分析であってもよいが、これに限定されるものではない。前記臨床的特徴情報、単一塩基変異の発生頻度情報、反復配列情報、タンパク質ドメイン(domain)情報、およびin-silico予測情報は、公共のデータベースから抽出されるものである、遺伝子変異の病原性の決定方法を提供し、前記臨床的特徴情報は、米国国立生物工学情報センター(National Center for Biotechnology Information、NCBI)で提供する臨床的特徴情報に基づくデータベースから抽出されるものであり、単一塩基変異の発生頻度情報は、不特定多数の単一塩基変異(single nucleotide polymorphism、SNP)の発生頻度情報を提供するデータベースから抽出されるものであり、反復配列情報は、散在した反復(interspersed repeats)および複雑性の低いDNA配列(low complexity DNA sequences)を含むデータベースから抽出されるものであり、タンパク質ドメイン(domain)情報は、隠れマルコフモデル(Hidden Markov model)を用いてタンパク質のfamilyの多重配列整列を集めておいたデータベースから抽
出されるものであり、in-silico予測情報は、missense予測情報、Splice予測情報、およびConservation予測情報を区分して収集したin-silicoデータベースから抽出されるものである、遺伝子変異の病原性の決定方法を提供する。また、前記(b)ステップにおける病原性情報の分類は、病因性基準(pathogenic criteria)について非常に強い(very strong)、強い(strong)、普通(moderate)、または裏付け(supporting)に区分し、良性基準(benign criteria)について独立(stand-alone)、強い(strong)、または裏付け(supporting)に区分するものである、遺伝子変異の病原性の決定方法を提供し、または前記(b)ステップにおける病原性情報の分類は、病因性基準(pathogenic criteria)について非常に強い1段階、強い(strong)1~4段階、普通(moderate)1~6段階、または裏付け(supporting)1~5段階に区分し、良性基準(benign criteria)について独立(stand-alone)1段階、強い(strong)1~4段階、および裏付け(supporting)1~7段階に区分するものである、遺伝子変異の病原性の決定方法を提供する。
【0024】
前記本発明の遺伝子変異の病原性の決定方法において、前記臨床的特徴情報は、病因性基準の非常に強い1段階、病因性基準の強い1段階、病因性基準の普通1段階、病因性基準の普通5段階、病因性基準の裏付け2段階、良性基準の強い1段階、および良性基準の裏付け6段階から構成されるグループより選択されるいずれか1つ以上の分類に適用されるものである、遺伝子変異の病原性の決定方法を提供し、前記単一塩基変異の発生頻度情報は、病因性基準の普通2段階、良性基準の独立1段階、良性基準の裏付け1段階、および良性基準の裏付け2段階から構成されるグループより選択されるいずれか1つ以上の分類に適用されるものである、遺伝子変異の病原性の決定方法を提供し、前記反復配列情報は、病因性基準の普通4段階、および良性基準の裏付け3段階から構成されるグループより選択されるいずれか1つ以上の分類に適用されるものである、遺伝子変異の病原性の決定方法を提供し、前記タンパク質ドメイン情報は、病因性基準の普通1段階の分類に適用されるものである、遺伝子変異の病原性の決定方法を提供し、前記in-silico予測情報は、病因性基準の裏付け3段階、良性基準の裏付け4段階、および良性基準の裏付け7段階から構成されるグループより選択されるいずれか1つ以上の分類に適用されるものである、遺伝子変異の病原性の決定方法を提供する。これはつまり、前記臨床的特徴情報は、PVS1、PS1、PM1、PM5、PP2、BS1、BP1、またはBP6分類に適用されるものである、遺伝子変異の病原性の決定方法を提供し、前記単一塩基変異の発生頻度情報は、PM2、BA1、BS1、またはBS2分類に適用されるものである、遺伝子変異の病原性の決定方法を提供し、前記反復配列情報は、PM4、またはBP3分類に適用されるものである、遺伝子変異の病原性の決定方法を提供し、前記タンパク質ドメイン情報は、PM1分類に適用されるものである、遺伝子変異の病原性の決定方法を提供し、前記in-silico予測情報は、PP3、BP4、またはBP7分類に適用されるものである、遺伝子変異の病原性の決定方法を提供することが理解できるが、これに限定されるものではない。
【0025】
また、前記本発明の遺伝子変異の病原性の決定方法において、前記(c)ステップにおける病原性レベルの決定は、病因性(pathogenic)、準病因性(likely
pathogenic)、良性(benign)、準良性(likely benign)、または不確実な重要性(uncertain significance)に区分するものである、遺伝子変異の病原性の決定方法を提供し、前記準良性(likely benign)病原性の決定は、不確実な重要性(uncertain significance)、不確実な重要性-病因性(uncertain significance-pathogenic)、および不確実な重要性-良性(uncertain significance-benign)に区分するものである、遺伝子変異の病原性の決
定方法を提供し、前記病原性レベルの決定は、本発明の表7のように分類するものである、遺伝子変異の病原性の決定方法を提供する。
【0026】
本発明の他の具体例において、(a)塩基配列分析の結果から得られた遺伝子変異情報を入力する入力部と、(b)前記遺伝子変異情報について臨床的特徴情報、単一塩基変異の発生頻度情報、反復配列情報、タンパク質ドメイン(domain)情報、およびin-silico予測情報を対照して病原性情報を分類する演算部と、(c)病原性レベルを決定する判定部と、を含む遺伝子変異の病原性の決定装置を提供する。前記装置を構成する各部分の制限事項は、前記遺伝子変異の病原性の決定方法で記載したものと重複し、以下、本明細書の過度の複雑性を回避するために省略する。
【0027】
本発明のさらに他の具体例において、(a)目的の個体から分離された試料に対して塩基配列分析を行うステップと、(b)請求項1に記載の方法で遺伝子変異の病原性を決定するステップと、(c)病原性の決定結果に応じて、前記個体の疾病発生を予測するステップと、を含む個体の疾病発生の予測方法を提供する。前記個体の疾病発生の予測方法を構成する各部分の制限事項は、前記遺伝子変異の病原性の決定方法で記載したものと重複し、以下、本明細書の過度の複雑性を回避するために省略する。
【0028】
本発明のさらに他の具体例において、(a)目的の個体から分離された試料に対して塩基配列分析を行うステップと、(b)請求項1に記載の方法で遺伝子変異の病原性を決定するステップと、(c)病原性の決定結果に応じて、前記個体の疾病発生の原因を把握するステップと、を含む個体の病因の診断に関する情報を提供する方法を提供する。前記個体の病因の診断に関する情報を提供する方法を構成する各部分の制限事項は、前記遺伝子変異の病原性の決定方法で記載したものと重複し、以下、本明細書の過度の複雑性を回避するために省略する。
【0029】
以下、前記本発明を実施例により詳細に説明する。
【発明の効果】
【0030】
本発明の遺伝子変異解析方法は、ACMGガイドラインに基づいて病原性情報を分類し、病原性レベルを判定できるNGS変異データ解析ロジックツリーを提供するので、生命科学および医療保健分野において大きく利用されることが期待される。
【図面の簡単な説明】
【0031】
図1】本発明の一実施例による、本発明のロジックツリーと対照群ロジックツリーとでの病原性レベルの決定精度を比較した結果である。
【発明を実施するための形態】
【0032】
本発明は、実施のための最良の形態として、(a)塩基配列分析の結果から遺伝子変異情報を得るステップと、(b)前記遺伝子変異情報について臨床的特徴情報、単一塩基変異の発生頻度情報、反復配列情報、タンパク質ドメイン(domain)情報、およびインシリコ(in-silico)予測情報を対照して病原性情報を分類するステップと、(c)病原性レベルを決定するステップと、を含む、遺伝子変異の病原性の決定方法であって、前記(b)ステップにおける病原性情報の分類は、病因性基準(pathogenic criteria)について非常に強い(very strong)1段階、強い(strong)1~4段階、普通(moderate)1~6段階、および裏付け(supporting)1~5段階に区分し、良性基準(benign criteria)について独立(stand-alone)1段階、強い(strong)1~4段階、および裏付け(supporting)1~7段階に区分するものであり、前記臨床的特徴情報は、病因性基準の非常に強い1段階、病因性基準の強い1段階、病因性基準の普通
1段階、病因性基準の普通5段階、病因性基準の裏付け2段階、良性基準の強い1段階、および良性基準の裏付け6段階から構成されるグループより選択されるいずれか1つ以上の分類に適用されるものであり、前記(c)ステップにおける病原性レベルの決定は、病因性(pathogenic)、準病因性(likely pathogenic)、良性(benign)、準良性(likely benign)、不確実な重要性(uncertain significance)、不確実な重要性-病因性(uncertain significance-pathogenic)、または不確実な重要性-良性(uncertain significance-benign)に区分するものである、遺伝子変異の病原性の決定方法を提供する。
【実施例
【0033】
以下、実施例を通じて本発明をより詳細に説明する。これらの実施例は単に本発明をより具体的に説明するためのものであって、本発明の要旨によって本発明の範囲がこれらの実施例によって制限されないことは当業界における通常の知識を有する者にとって自明であろう。
【0034】
明細書全体において、ある部分がある構成要素を「含む」とする時、これは、特に反対の記載がない限り、他の構成要素を除くのではなく、他の構成要素をさらに包含できることを意味する。
【0035】
実施例1.NGS変異データ解析ロジックツリーの開発
ACMGガイドラインに基づいて病原性情報を分類し、病原性レベルを判定できるNGS変異データ解析ロジックツリーを開発した。
【0036】
以下、本発明のアルゴリズムを「SAToK」と名付ける。
【0037】
通常、アルゴリズムとは、入力値に応じて出力結果が無限大に変化するので、本発明の目的上、迅速かつ正確なNGS変異データ解析のために入力情報の選択が非常に重要である。本発明のロジックツリーは、入力情報として臨床的特徴情報、公共(population)の単一塩基変異(single nucleotide polymorphism、SNP)の発生頻度情報、反復配列情報、タンパク質ドメイン(domain)情報、およびin-silico予測情報を選択し、前記in-silico予測情報は、missense予測情報、Splice予測情報、およびConservation予測情報を選択した。具体的には、前記臨床的特徴情報は、米国国立生物工学情報センター(National Center for Biotechnology Information、NCBI)で提供する臨床的特徴情報に基づくデータベースから収集した情報であり、前記公共のSNPの発生頻度情報は、不特定多数の10,000人以上のSNPの発生頻度情報を提供するデータベースから収集した情報であり、前記反復配列情報は、散在した反復(interspersed repeats)および複雑性の低いDNA配列(low complexity DNA sequences)を含むデータベースから収集した情報であり、前記タンパク質ドメイン情報は、隠れマルコフモデル(Hidden Markov model)を用いてタンパク質のfamilyの多重配列整列を集めておいたデータベースから収集した情報である。また、前記in-silico予測情報は、missense予測情報、Splice予測情報、およびConservation予測情報に区分して収集した。
【0038】
前記収集した情報をACMGガイドライン病原性情報の分類方法に代入しかつ、それぞれのACMGガイドライン病原性情報の分類について代入する収集情報を異にした。これを下記表5と表6に示した。表5と表6中、「情報1」は、米国国立生物工学情報センター(National Center for Biotechnology Info
rmation、NCBI)で提供する臨床的特徴情報に基づくデータベースから収集した臨床的特徴情報を示し、「情報2」は、不特定多数の100人以上のSNPの発生頻度情報を提供するデータベースから収集した公共のSNPの発生頻度情報を示し、「情報3」は、散在した反復(interspersed repeats)および複雑性の低いDNA配列(low complexity DNA sequences)を含むデータベースから収集した反復配列情報を示し、「情報4」は、隠れマルコフモデル(Hidden Markov model)を用いてタンパク質のfamilyの多重配列整列を集めておいたデータベースから収集したタンパク質ドメイン情報を示し、「情報5」は、missense予測情報、Splice予測情報、およびConservation予測情報を区分して収集したin-silico予測情報を示す。また、「O」印は、情報が代入される場合を示し、「X」印は、情報が代入されない場合を示し、「-」は、本発明のロジックツリーによって自動的に分類しない場合を示す。
【0039】
【表5】
【0040】
【表6】
【0041】
前記収集した情報をACMG領ガイドライン病原性情報の分類方法に代入して導出された本発明の病原性判定ロジックツリーを、下記表7に示した。
【0042】
【表7】
【0043】
前記表7中、VUSpは「PM2 and PP3 and PM1」の場合であって、ACMGガイドラインでVUSに分類されるが、本発明のロジックツリー(SAToKアルゴリズム)ではVUSであるが、pathogenicに近い変異に分類される。VUSbは「BP6を有する場合」または「ClinVar review status≧2stars P、LPがないand当該遺伝子のClinVar review status≧2stars P、LP variant Max.MAF<対象変異MAF and PP3ではないand MAF>0.01%AND domainではない場合」であって、ACMGガイドラインでVUSに分類されるが、本発明のロジックツリー(SAToKアルゴリズム)ではVUSであるが、benignに近い変異に分類される。
【0044】
実施例2.NGS変異データ解析ロジックツリーの検証
前記実施例1のNGS変異データ解析ロジックツリーが実質的にNGS変異データを解析して病原性を決定するのに信頼度あるように適用できるかを検証した。
【0045】
具体的には、先天性代謝異常疾患遺伝子パネルで検査した計52個の患者サンプル(遺伝子260余個)を用いて、重複しない計3,373個の分析対象変異を選定し、本発明のロジックツリー(SAToKアルゴリズム)と対照群ロジックツリー(InterVarアルゴリズム)とで比較分析した。対照群として使用されたInterVarアルゴリズムは、本発明と同一に核酸配列分析に基づく遺伝子変異の解析を容易にする目的で発明されたものであり、本発明の属する分野で公知である(Am J Hum Genet.2017Feb2;100(2):267-280.)。本発明のロジックツリーが遺伝子変異情報について臨床的特徴情報、単一塩基変異の発生頻度情報、反復配列情報、タンパク質ドメイン(domain)情報、およびin-silico予測情報を対照するのに対し、対照群ロジックツリーは、臨床的特徴情報、単一塩基変異の発生頻度情報、およびin-silico prediction情報を対照するという点で差異があり、また、本発明のロジックツリーが米国国立生物工学情報センター(National Center for Biotechnology Information、NCBI)で提供する臨床的特徴情報に基づくデータベースから信頼性の高い情報(Review status=2)のみ抽出して適用するのに対し、対照群ロジックツリーは信頼性の検証なしにすべての情報を適用するという点で差異がある。
【0046】
分析の結果、下記表8のように、それぞれのロジックツリーにおいて病原性レベルが決定され、本発明のロジックツリーと対照群ロジックツリーにおいてそれぞれ、「病因性(pathogenic、P)」、または「準病因性(likely pathogenic、LP)」と判定された変異についてのみClinVarアルゴリズム(Nucleic Acids Res.2016Jan 4;44(D1):D862-8.)と対照して、本発明のロジックツリーと対照群ロジックツリーとの精度を比較した。その結果を下記図1に示した。
【0047】
【表8】
【0048】
図1のように、本発明のロジックツリーにおいて、「病因性(pathogenic、P)」、または「準病因性(likely pathogenic、LP)」と判定された変異は、ClinVarアルゴリズムでの結果と第1一致率(判定が完全に同一の場合)と第2一致率(PまたはLPを同一の判定と認める場合)がそれぞれ50%、80%であったが、対照群ロジックツリーの場合にはそれぞれ20%、20%となり、本発明のロジックツリーがACMGガイドラインに基づいて病原性情報を分類するのに迅速かつ正確に利用できることが分かった。
【0049】
以上、本発明の特定の部分を詳細に記述したが、当業界における通常の知識を有する者にとってこのような具体的な記述は単に好ましい実施形態に過ぎず、このため、本発明の
範囲が制限されない点は明らかである。したがって、本発明の実質的な範囲は添付した請求項とその等価物によって定義される。
【産業上の利用可能性】
【0050】
本発明の遺伝子変異解析方法は、ACMGガイドラインに基づいて病原性情報を分類し、病原性レベルを判定できるNGS変異データ解析ロジックツリーを提供するので、生命科学および医療保健分野において大きく利用されることが期待される。
図1
【国際調査報告】