IP Force 特許公報掲載プロジェクト 2022.1.31 β版

知財求人 - 知財ポータルサイト「IP Force」

▶ 江蘇科技大学の特許一覧

特開2024-133008遺伝性心疾患の遺伝子支援診断システムの動作方法
<>
  • 特開-遺伝性心疾患の遺伝子支援診断システムの動作方法 図1
< >
(19)【発行国】日本国特許庁(JP)
(12)【公報種別】公開特許公報(A)
(11)【公開番号】P2024133008
(43)【公開日】2024-10-01
(54)【発明の名称】遺伝性心疾患の遺伝子支援診断システムの動作方法
(51)【国際特許分類】
   C12Q 1/6869 20180101AFI20240920BHJP
【FI】
C12Q1/6869 Z
【審査請求】有
【請求項の数】9
【出願形態】OL
(21)【出願番号】P 2024039628
(22)【出願日】2024-03-14
(11)【特許番号】
(45)【特許公報発行日】2024-08-21
(31)【優先権主張番号】202310252078.1
(32)【優先日】2023-03-16
(33)【優先権主張国・地域又は機関】CN
(71)【出願人】
【識別番号】520154254
【氏名又は名称】江蘇科技大学
【氏名又は名称原語表記】JIANGSU UNIVERSITY OF SCIENCE AND TECHNOLOGY
【住所又は居所原語表記】No.2 Mengxi Road,Zhenjiang,Jiangsu 212003,China
(74)【代理人】
【識別番号】110000291
【氏名又は名称】弁理士法人コスモス国際特許商標事務所
(72)【発明者】
【氏名】諸 峰
(72)【発明者】
【氏名】呉 開林
(72)【発明者】
【氏名】楊 習貝
【テーマコード(参考)】
4B063
【Fターム(参考)】
4B063QA13
4B063QA19
4B063QQ08
4B063QQ42
4B063QS39
4B063QX10
(57)【要約】      (修正有)
【課題】遺伝性心疾患の遺伝子支援診断システムの動作方法を提供する。
【解決手段】本発明は、遺伝性心疾患の遺伝子支援診断システムの動作方法を開示するものであり、検査対象遺伝子選択モジュール、変異部位同定モジュール、変異部位アノテーションモジュール、変異部位病原性分析モジュール、及びレポート生成モジュールの5つのモジュールからなる診断システムを構築することによって、遺伝子配列決定データを利用して遺伝性心疾患の診断手段を体系的に改善し、臨床医が遺伝性心疾患であるか否かについてリスク評価及びターゲティングを正確かつ効率的に行うことを可能にし、患者に対する正確な治療を行うのに有利である。
【選択図】図1
【特許請求の範囲】
【請求項1】
遺伝性心疾患の遺伝子支援診断システムの動作方法であって、
前記遺伝子支援診断システムは、順次接続された、検査対象遺伝子選択モジュール、変異部位同定モジュール、変異部位アノテーションモジュール、変異部位病原性分析モジュール、及びレポート生成モジュールを有し、
前記検査対象遺伝子選択モジュールは、文献分析及び遺伝専門家の知識と経験に基づいて、遺伝性心疾患を5個の主要カテゴリーと15個のサブカテゴリーに分類し、主要カテゴリーによって各遺伝性心疾患に対応する検出対象遺伝子リストを決定し、
前記変異部位同定モジュールは、検査対象候補遺伝子の配列決定データを分析し、シーケンサーに使用されるキットによって、指定された染色体ROI間隔から潜在的な病原性変異部位を同定し、分析過程には、配列アラインメント及びマッピングユニット、配列データ前処理ユニット、及び変異部位同定ユニットが含まれ、
前記変異部位アノテーションモジュールは、同定された変異部位にアノテーションを付け、分析過程には、vcfファイル分析ユニット、遺伝子情報アノテーションユニット、塩基及びアミノ酸変化情報アノテーションユニット、スプライシング変異部位情報アノテーションユニット、及びDBNSFPデータベースに基づく変異部位情報アノテーションユニットが含まれ、
前記変異部位病原性分析モジュールは、家族又は個体を単位にして、被検者の全遺伝的変異部位の病原性を分類して分析し、分析過程には、リソースファイル前処理ユニット、変異部位病原性判別ユニット、及び変異部位病原性分類ユニットが含まれ、
前記レポート生成モジュールは、患者情報、医師情報、検出サンプル情報、配列決定データ情報、病原性部位情報、及び文献情報を読み取って分析することによってさまざまな詳細レベルの中英バイリンガル検出分析レポートを自動的に生成し、その過程には、データ抽出ユニット、レポート生成ユニット、レポート解釈ユニット、及びレポートエクスポートユニットが含まれる、ことを特徴とする遺伝性心疾患の遺伝子支援診断システムの動作方法。
【請求項2】
前記検査対象遺伝子選択モジュールは、遺伝性心疾患分類ユニットと検査対象遺伝子リストユニットを含み、前記遺伝性心疾患分類ユニットは、遺伝性心疾患を遺伝性心筋症Cardiomyopathies、遺伝性大動脈疾患Aortopathies、遺伝性不整脈Inheritedarrthymias、家族性高コレステロール血症Familialhypercholesterolaemia、及び肺高血圧症Pulmonaryarterialhypertensionの5個の主要タイプに分け、
前記遺伝性心筋症は、拡張型心筋症DCM、肥大型心筋症HCM、不整脈源性右室心筋症ARVC、及び左室緻密化障害LVNC心筋症に細分化され、
前記遺伝性大動脈疾患は、マルファン症候群Marfans、ロイス・ディーツ症候群LoeysDietz、及び結合組織病CCTDに細分化され、
前記遺伝性不整脈は、QT延長症候群LQTS、QT短縮症候群SQTS、ブルガダ症候群Brugada、心臓伝導疾患CCD、及びカテコラミン誘発多形性心室頻拍CVPTに細分化され、
前記検査対象遺伝子リストユニットは、遺伝性心疾患の分類に基づいており、関連する心疾患に対応する検査対象遺伝子リストは遺伝学専門家により提供され、前記拡張型心筋症DCMに対応する遺伝子リストは、LMNA、SCN5A、ACTC1、DES、SGCD、MYH7、TNNT2、TPM1、TTN、VCL、MYBPC3、PLN、LDB3、ACTN2、CSRP3、MYH6、ABCC9、TNNC1、TCAP、EYA4、TMPO、FCMD、DMD、Tafazzin、TNNI3、DNAJC19、BAG3、DSP、RYR2、LMNA、NEXN、RBM20、DSG2であり、
前記肥大型心筋症HCMに対応する遺伝子リストは、ACTC1、CSRP3、MYBPC3、MYH6、MYH7、MYL2、MYL3、TCAP、TNNC1、TNNI3、TNNT2、TPM1、TTN、MYLK2、PRKAG2、MYOZ2であり、
前記不整脈源性右室心筋症ARVCに対応する遺伝子リストは、DSC2、DSG2、DSP、PKP2、TGFB3、RYR2、TMEM43、JUPであり、
前記左室緻密化障害LVNC心筋症に対応する遺伝子リストは、ACTC1、CASQ2、LDB3、LMNA、MYBPC3、MYH7、PLN、TAZ、TNNT2、TPM1、DTNAであり、
前記QT延長症候群LQTSに対応する遺伝子リストは、KCNQ1、SCN4B、KCNH2、SCN5A、ANK2、KCNE1、KCNE2、KCNJ2、CACNA1C、CAV3、AKAP9、SNTA1であり、
前記QT短縮症候群SQTSに対応する遺伝子リストは、KCNH2、KCNQ1、TMEM43であり、
前記ブルガダ症候群に対応する遺伝子リストは、SCN5A、GPD1L、CACNA1C、CACNB2、SCN1B、KCNE3、SCN3B、HCN4、KCNJ8、MOG1、KCND3、KCNE5であり、
前記心臓伝導疾患CCDに対応する遺伝子リストは、RYR2、SCN5A、TRPM4であり、
前記カテコラミン誘発多形性心室頻拍CVPTに対応する遺伝子リストは、RYR2、CASQ2であり、
前記マルファン症候群Marfans、ロイス・ディーツ症候群LoeysDietz、結合組織病CCTDに対応する遺伝子リストは、FBN1、TGFBR1、TGFBR2、COL3A1、MYH11、ACTA2、SMAD3、MYLK、GLUT10、EFEMP2であり、
前記家族性高コレステロール血症FHに対応する遺伝子リストは、APOB、LDLR、LDLRAP1、PCSK9であり、
前記肺高血圧症PAHに対応する遺伝子リストは、ACVRL1、BMPR2、CAV1、ENG、SMAD9である、ことを特徴とする請求項1に記載の遺伝性心疾患の遺伝子支援診断システムの動作方法。
【請求項3】
前記変異部位同定モジュールの配列アラインメント及びマッピングユニットは、fastq形式の配列決定生データを受信し、BWA-MEMアルゴリズムを利用して、70bp-1Mbpクエリ配列をBWA-MEMアルゴリズムに合わせて、マルチスレッド方法により配列アラインメント及びマッピング過程を促進し、bam形式のファイルを出力し、
前記変異部位同定モジュールの配列データ前処理ユニットは、bam形式のファイルを入力、処理済みのbam形式のファイルを出力とし、PicardのAddOrReplaceReadGroups方法によりreadsグループ情報をマッピング後のbamファイルに付加するステップ(1)と、PicardのMarkDuplicate方法により反復readsをマークすることで、PCR増幅などのデータ生成ステップによる偏差を低減させるステップ(2)と、後の変異同定を容易にするために、配列をPicardでソートするステップ(3)と、Indelsの塩基品質スコア再校正BQSRを行うことで、シーケンサーの系統誤差を調整するステップ(4)と、を含み、
前記変異部位同定モジュールの変異部位同定ユニットは、参照ゲノムに対する変異部位を識別して、各変異部位の遺伝子型を算出し、配列データ前処理ユニットにより出力されたbamファイルを入力、変異部位を含むvcf形式のファイルを出力とし、GATKを使用して、GVCFモードで各サンプルに対してHaplotypeCaller方法を個別に実行し、GVCF中間ファイル形式を生成するステップ(1)と、GATKのGenotypeGVCFs方法を使用して単一サンプルGVCFファイルと組み合わせて、マルチサンプルのvcfファイルを生成するステップ(2)と、GATKのSelectVariants方法を使用してSNPsとINDELsを区別するステップ(3)と、GATKのVariantRecalibrator及びApplyRecalibration方法を使用して遺伝的変異に対して品質スコア再校正VQSRを行うことで、変異部位をフィルタリングするステップ(4)と、GATKのCombineVariants方法を使用してSNPsとINDELsをまとめてvcfファイルに出力するステップ(5)と、を含む、ことを特徴とする請求項2に記載の遺伝性心疾患の遺伝子支援診断システムの動作方法。
【請求項4】
前記変異部位アノテーションモジュールは、変異部位情報にアノテーションを付けることに用いられ、変異部位同定ユニットにより生成されたファイルを入力、アノテーションを付けたtxt形式の変異部位情報ファイルを出力とし、変異部位同定ユニットにより生成されたvcfファイルを分析し、変異部位が存在する染色体CHROM、部位座標POS、参照配列塩基REF、変異配列塩基ALT、部位カバレッジDP、参照配列カバレッジRO、変異配列カバレッジAO、及び遺伝子型情報GTを取得し、一時ファイルinput.txt及びcoverage.txtを生成するステップ(1)と、
遺伝子情報にアノテーションを付けるステップであって、まず、前処理された遺伝子エクソンファイルsorted_compiled_exon.bed、イントロンファイルintron.bed、utr3ファイルutr3.bed、utr5ファイルutr5.bed、上流ファイルupstream1000.bed、下流ファイルdownstream1000.bed、「スクリプトン-遺伝子」ファイルtranscript_to_gene.txt、及び「タンパク質アノテーション」ファイルprotein_annotation.txtを含む、遺伝子アノテーションリソースライブラリファイルを読み取り、次に、ステップ(1)で生成されたinput.txtファイル及び読み取られた遺伝子アノテーションリソースライブラリファイル中のデータに基づいて、変異が発生したエリアとして、イントロンintronエリア、エクソンexonエリア、utr5又はutr3を算出し、一時ファイルannotation.txtを生成するステップ(2)と、
塩基及びアミノ酸変化情報にアノテーションを付けるステップであって、まず、コードエリアファイルallcds.bed、HGNCに対応する塩基配列ファイルsequence.txt、アミノ酸に対応する略語ファイルaminoacid.txtを読み取り、次に、コードエリアファイルallcds.bed中のスクリプトン番号、部位開始座標及び部位終了座標に基づいて、エクソンエリアに変異が発生した場合、エクソン番号を算出し、それ以外の場合、NAを出力し、さらに変異が発生したエリアに応じて、SynonymousSNP、NonsynonymousSNP、IntronSNP、Utr5SNP、Utr3SNP、IntronDeletion、IntronInsertion、FrameshiftDeletion、In-FrameDeletion、StopGain、及びUnknownを含む当該変異のタイプを算出し、さらにエクソンエリアの変異の場合、ある位置における塩基変化情報及びアミノ酸変化情報を算出し、塩基及びアミノ酸変化情報アノテーション一時ファイルhgvs_annotation.txtを生成するステップ(3)と、
スプライシング変異部位情報にアノテーションを付けるステップであって、まず、(3)で生成されたファイルhgvs_annotation.txt及び前処理された遺伝子エクソンファイルsorted_compiled_exon.bed及びコードエリアファイルallcds.bedを読み取り、変異部位の開始位置と終了位置を境界として、さらに境界から5bp以内に潜在的なスプライシング変異部位があるか否かを確認し、開始位置と終了位置にそれぞれ5を加算及び減算して、境界エリアをs1、e1、s2、e2と命名した4つのセグメントに分割し、その後、s1、e1エリアがスプライシング部位であるか否か、s2、e2エリアがスプライシング部位であるか否かをそれぞれ判断し、スプライシング部位であれば、さらに該スプライシング部位変異の塩基変化情報を出力し、一時ファイルspliced_hgvs_annotation.txtを生成するステップ(4)と、
dbnsfpデータベースの変異部位情報アノテーションに基づいて、まず、(4)で生成されたファイルspliced_hgvs_annotation.txt及びフィルタリングされたdbnsfpデータファイルfilterbased_dbnsfp.txtを読み取り、次に、spliced_hgvs_annotation.txtとfilterbased_dbnsfp.txtとのアラインメントを行い、SIFT、Polyphen、LRT、MutationTaster、FATHMM、CAD、MetaSVM、及びClinvar計算ツールによって予測可能な変異部位の病原性結果とスコアを取得し、さらに、1000Gp3_AFR_AF、1000Gp3_EUR_AF、1000Gp3_AMR_AF、1000Gp3_EAS_AF、1000Gp3_SAS_AF、ESP6500_EA_AF、ExAC_Adj_AF、ExAC_AFR_AF、ExAC_AMR_AF、ExAC_EAS_AF、ExAC_FIN_AF、ExAC_NFE_A、及びExAC_SASを含む、集団内の変異部位のアノテーション情報を取得するとともに、該変異部位の希少性をマークし、一時ファイルを生成して、popgen_filtering_spliced_hgvs_annotation.txtと命名するステップ(5)と、
カバレッジ情報にアノテーションを付けるステップであって、(1)で生成されたcoverage.txtファイルを読み取り、Total_Coverage、Ref_Coverage、Alt_Coverage、及びGenotypeの情報を含む変異部位のカバレッジ情報を付加し、最終的なアノテーションファイルannotation.txtを生成するステップ(6)と、
を含む、ことを特徴とする請求項1に記載の遺伝性心疾患の遺伝子支援診断システムの動作方法。
【請求項5】
前記変異部位病原性分析モジュールのリソース読み取り及び前処理ユニットは、様々なデータリソースを前処理し、すべての分析対象の外部リソースファイルを読み取り、処理する必要のないデータをフィルタリングして、病原性判別及びモジュールの処理性能をさらに向上させることに用いられ、Lost of Function遺伝子リストを読み取り、ミスセンス遺伝子リストを読み取るステップ(1)と、遺伝的変異の病原性染色体、開始座標、塩基変化、アミノ酸変化、及び対応する遺伝子名を含む、Clinvarデータベース内のすべての病原性の変異情報を読み取るステップ(2)と、OMIM番号に対応する遺伝子名、劣性遺伝病のOMIM番号リスト、優性遺伝病のOMIM番号リスト、及びOMIM番号に対応するOrpha番号リストを含む、OMIMデータベース関連情報を読み取るステップ(3)と、染色体番号、hg19での位置、SNP番号、参照対立遺伝子、及び置換対立遺伝子を含む、PS4に関連する変異情報をgwasdbから取得するステップ(4)と、PM1判断のための良性タンパク質ドメインを読み取り、BP1遺伝子リストを読み取り、遺伝子名を取得し、具体的には、染色体番号、開始位置、及び終了位置を含む、PM4及びBP3の判断のためのrmsk範囲を読み取り、BS2の判断のためのヘテロ接合体及びホモ接合体の情報を読み取るステップ(5)と、染色体番号、位置、参照対立遺伝子、置換対立遺伝子、adaスコア、rfスコアを含む、dbscSNVデータ情報をロードするステップ(6)と、を含み、
前記変異部位病原性分析モジュールの変異部位病原性判別ユニットは、ACMGの28項の基準に従ってSNPを判定し、データファイル中の各前記変異部位における全判別項目の値を算出し、各判別項目について採点を行い、スコアに従って全判別項目を集計し、その集計に応じてすべての遺伝的変異の病原性を分類することに用いられ、算出可能な判別項目は、PVS1、PS1、PS4、PM1、PM2、PM4、PM5、PP2、PP3、PP5、BS1、BS2、BP1、BP3、BP4、BP6、BP7、及びBA1を含み、具体的には、(1)判別項目PVS1に対して、まず、変異部位が存在する遺伝子がLost of Functionリストに含まれているか否かを確認し、次に、変異部位のアノテーション情報を確認し、ナンセンス変異、フレームシフト変異、+/-1又は+/-2スプライシング部位、開始コドン、1つ又は複数のエクソン欠失の場合、PVS1が成り立ち、その値は1とされ、(2)判別項目PS1に対して、以前に病原性があると判定された変異と同じアミノ酸変化があるか否かを判断し、点突然変異SNPがスプライシングに影響を与えるか否かをさらに判定し、(3)判別項目PM2に対して、公開されているSAP、1000Genome、及びExACデータベース内の対照集団の割合を参照し、東南アジアの対照集団に関するデータを追加し、(4)判別項目PM4に対して、UCSCゲノムブラウザにおいてRMSKデータベースを検索し、変異が非反復エリアの非フレームシフトINDELである場合、又は変異タイプがStopLossである場合、PM4が成り立ち、その値は1とされ、それ以外の場合、その値は0とされ、(5)判別項目BP3に対して、UCSCゲノムブラウザにおいてRMSKデータベースを検索し、変異が反復エリアの非フレームシフトINDELである場合、BP3が成り立ち、その値は1とされ、それ以外の場合、その値は0とされ、(6)判別項目PM5に対して、まず、変異のタイプを確認し、ミスセンス変異の場合、ロードされたClinvar病原性変異データにその変異が存在するか否かをさらに確認し、次に、当該変異が異なる核酸変化を引き起こすか否かを確認し、異なるアミノ酸変化を引き起こす場合、PM5が成り立ち、その値は1とされ、それ以外の場合、その値は0とされ、(7)判別項目BP7に対して、保存性を確認し、同義変異がスプライシングに影響を与えず、かつヌクレオチドの位置が高度に保存されていない場合、その変異を良性のものと分類し、BP7が成り立ち、その値は1とされ、変異がスプライシングに影響を与えないと予測した場合、dbscSNV_RF_SCORE及びdbscSNV_ADA_SCOREの両方が0.6未満である必要があり、ヌクレオチド保存性の予測はdbnsfp30aデータベースから検出したものであり、ヌクレオチドが高度に保存されていることを示すために、2を超えるGERP++スコアが必要であり、
前記変異部位病原性分析モジュールの病原性分類ユニットは、上記各判別ユニットによる算出結果に基づいて、以下のルールに従って分類を行い、PVS1が1であり、かつPSの数が1以上である、又はPMの数が2以上である、又はPMの数が1であり、かつPPの数が1である、又はPPの数が2以上である場合、分類の結果、病原性のものであり、PSの数が2以上である場合にも、分類の結果、病原性のものであり、PSの数が1であり、PMの数が3以上である場合、分類の結果、病原性のものであり、PSの数が1であり、PMの数が2であり、かつPPの数が2以上である場合、分類の結果、病原性のものであり、PVS1の数が1であり、かつPMの数が1である、又はPSの数が1であり、かつPMの数が1又は2である、又はPSの数が1であり、かつPPの数が2以上である、又はPMの数が3以上であるか、PMの数が2であり、かつPPの数が2以上である場合、分類の結果、病原性である可能性があり、BAの数が1であり、又はBSの数が2以上である場合、分類の結果、良性のものであり、BSの数が1であり、かつBPの数が1である、又はBPの数が2以上である場合、分類の結果、良性である可能性があり、それ以外の場合、分類の結果、有意性が不明であり、さらに病原性の分類結果をannotation.txtファイルに付加し、最終的な分類結果ファイルinterpretation.txtを生成する、ことを特徴とする請求項1に記載の遺伝性心疾患の遺伝子支援診断システムの動作方法。
【請求項6】
前記レポート生成モジュールのデータ抽出ユニットは、検出分析結果から、すべての変異部位の染色体番号、変異部位が存在する塩基位置、参照塩基、変異塩基、遺伝子名、遺伝子型、病原性分類結果、検出遺伝子リスト、及びカバレッジという品質制御データ項目を抽出し、上記で抽出されたデータをレポートのコンテンツとして記入し、
前記レポート生成モジュールのレポート生成ユニットは、データ抽出ユニットによって抽出された情報に基づいて、中国語と英語の両方をサポートする包括レベルの検出・分析レポート及び中国語と英語の両方をサポートする詳細なレベルの検出・分析レポートを生成し、レポート生成ユニットは、単一変異部位のレポート生成とバッチ変異部位のレポート生成をサポートし、単一変異部位のレポート生成とは、ユーザが入力した単一変異部位情報に基づいて、病原性分類ユニット及び情報抽出ユニットから提供される関連データによりレポートを生成することを指し、バッチ変異部位レポートは、病原性分類ユニットによって生成されたファイルinterpretation.txtを読み取ることによって生成され、
前記レポート生成モジュールのレポート解釈ユニットは、レポートのコンテンツと家系メンバーの分析結果を組み合わせて、レポート結論についてのさらなる解釈を提供し、具体的には、
レポート結論には、陽性結果Positive、陰性結果Negative、及び臨床的意義が不明なバリアントVUS:Variant of Unknown Significanceの3つの結果があり、
前記陽性結果は、対象者に病原性突然変異が見つかったことを示し、前記陰性結果は、対象者に病原性突然変異が見つからなかったが、遺伝的原因は除外されないことを示し、前記臨床的意義が不明なバリアントは、不確実な同定を示し、
前記レポート生成モジュールのレポートエクスポートユニットは、Webページ形式のレポートをWord又はPDFなどの標準ファイル形式として出力する、ことを特徴とする請求項1に記載の遺伝性心疾患の遺伝子支援診断システムの動作方法。
【請求項7】
前記中国語と英語の両方をサポートする包括レベルの検出・分析レポートの具体的な生成ステップは、(1)レポートの構造とスタイルを設定し、HTMLタグを使用してレポート構造を定義し、CSSを使用してレポートのスタイルを設定し、レポート構造には、検出レポート基本情報エリア、検出結果エリア、レポート結論エリア、及びサンプル品質制御エリアの4つのサブ構造が含まれ、(2)レポートコンテンツを記入し、検出結果エリアに被検者の変異部位情報を記入して、その変異部位が遺伝性心疾患の疑いと関連しているか否かの分析結果を表示し、レポート結論エリアでは、検出結果データの分析を通じてレポート結論を示し、家系メンバーの検出結果がある場合、結論の生成には家系メンバーの検出結果も考慮し、具体的な判断ルールはレポート解釈ユニットで説明し、さらにデータベースから医師の電子署名を抽出し、レポート結論の関連エリアに署名し、サンプル品質制御エリアに疾患に対応する候補検出遺伝子及びカバレッジ情報を記入する、ことを特徴とする請求項6に記載の遺伝性心疾患の遺伝子支援診断システムの動作方法。
【請求項8】
前記中国語と英語の両方をサポートする詳細なレベルの検出・分析レポートの具体的な生成ステップは、(1)レポートの構造とスタイルを設定し、HTMLタグを使用してレポート構造を定義し、CSSを使用してレポートのスタイルを設定し、レポート構造には、分析結果表示エリア、病原性分類結果の可視化表示エリア、及び分析結果の裏付け証拠エリアという3つのサブ構造が含まれ、(2)レポートコンテンツを記入し、分析結果表示エリアには、遺伝的変異部位の病原性分類結果、対応する遺伝子名、変異タイプ、HGVSコードDNA変化、HGVSアミノ酸変化、変異部位染色体、及び塩基位置を記入し、病原性分類結果の可視化表示エリアには、病原性分類の関連指標項目を表及び異なる色で表示し、分析結果の裏付け証拠エリアには、関連裏付け証拠データを表示し、この関連裏付け証拠データには、病原性分類指標のうちのBS1、PM2、PS4を裏付けるための集団証拠データと、SIFT、MutationTaster、MutationAccessor、Polyphen、LRT、FATHMM、及びCADDツールを含み、分類指標のうちのBP1、BP3、BP4、PP3、PM4、PM5、PS1、PVS1を裏付けるための病原性算出及び予測ツール裏付け証拠データと、分類指標のうちのBS3、PP1、PP2、PM1、PS3を裏付けるための機能的証拠データと、追加の証拠データと、参照文献と、が含まれる、ことを特徴とする請求項6に記載の遺伝性心疾患の遺伝子支援診断システムの動作方法。
【請求項9】
前記レポートエクスポートユニットの具体的な動作ステップは、(1)エクスポートファイルのパスと名前の設定、用紙サイズの設定、フォントの設定、ヘッダーとフッターの設定等を含むエクスポート設定を行い、(2)word形式をエクスポートし、1つの手段としては、Documentクラスを使用してHTMLファイルをロードするステップaと、Document.save方法を使用してHTMLファイルをWordドキュメントとして保存するステップbとにより実現される、HTMLをdoc、docx、docm形式に直接変換することであり、もう1つの手段としては、Documentクラスのインスタンスを作成するステップaと、DocumentBuilderクラスのインスタンスを作成して、Documentオブジェクトで初期化するステップbと、DocumentBuilder.InsertHtml方法を使用してドキュメントにHTMLを挿入するステップcと、Document.save方法を使用してWordドキュメントを保存するステップdとにより実現される、HTML文字列に基づいてWordを動的に生成することであり、更なる手段としては、URLクラスのインスタンスを作成して、必要なURLで初期化するステップaと、InputStreamオブジェクトにおいてURLを開くステップbと、HtmlLoadOptionsクラスのインスタンスを作成するステップcと、Documentクラスのインスタンスを作成して、InputStreamオブジェクトとHtmlLoadOptionsオブジェクトを使用して初期化するステップdと、Document.save方法を使用してWebページをWordドキュメントとして保存するステップeとにより実現される、レポートのurlに基づいてWebページをWordに変換することであり、(3)オープンソースプロジェクトiTextを使用してpdf形式をエクスポートし、重要なステップには、com.lowagie.text.Documenオブジェクトのインスタンスを作成するステップaと、ライターWriterを作成してdocumentオブジェクトに関連付け、ライターWriterによってドキュメントをディスクに書き込むステップbと、ドキュメント属性を設定し、ドキュメントを開く前に、関連する方法を呼び出して、ドキュメントのタイトル、テーマ、著者、キーワード、バインド方式、作成者、作成日などを設定するステップcと、ドキュメントを開くステップdと、Phrase、Paragraph、Table、Graphicsオブジェクトを含むコンテンツオブジェクトをドキュメントに追加するステップeと、ドキュメントを閉じるステップfと、が含まれる、ことを特徴とする請求項6に記載の遺伝性心疾患の遺伝子支援診断システムの動作方法。
【発明の詳細な説明】
【技術分野】
【0001】
本発明は、バイオインフォマティクスの技術分野に関し、特に遺伝性心疾患の遺伝子支援診断システムの動作方法に関する。
【背景技術】
【0002】
遺伝性心疾患(ICC:Inherited Cardiac Conditions)とは、次世代に受け継がれる可能性のある遺伝子変異によって引き起こされる一群の心疾患を指し、心臓突然死(SCD:Sudden Cardiac Death)の主な原因であり、心筋構造異常、遺伝的不整脈や大動脈症などを含む。2017年の心臓血管ガイドラインによると、心停止の25%は遺伝性心疾患に関連しており、35歳未満の人の中には心停止の50%は遺伝性心疾患に関連しており、中国の心臓突然死数は世界第1位で、毎年54万4,000人に達している。臨床的には、遺伝性心疾患には多様な症状、異なる疾患の進行、家族性の特徴があり、医師が問診や日常的な検査のみで疾患のリスク評価と診断を正確かつ効果的に行うことは多くの場合困難であり、これは、的確な治療を患者に提供するのに不利である。
【0003】
遺伝子技術や配列決定データ処理技術の開発と普及により、標的遺伝子セット、全エクソーム、全ゲノムに基づく配列決定や、膨大な遺伝子データの処理と解釈が可能になる。現在、遺伝子配列決定データの分析は、遺伝性疾患、希少疾患、腫瘍のリスク評価、妊娠前早期スクリーニング、疾患原因遺伝子の同定などに一般的に使用されており、関連する技術的手段には、配列アライメント、遺伝的変異部位の同定、アノテーションなどを従来の分析ソフトウェアで行い、また、具体的な用途に応じて結果の解釈を与えることが含まれる。既存の文献や特許から、中国国内外の心臓血管ガイドラインの多くは、疾患のリスク予測、診断や予後評価を支援するために遺伝子技術の利用を推奨しているが、現在、遺伝子分子レベルでの遺伝性心疾患の体系的なスクリーニングと診断に関する研究は現在ほとんどなく、臨床診断を支援するために遺伝子配列決定データを使用するための技術的手段がない。「遺伝性心疾患」をキーワードに検索すると、該当する特許出願は1件のみ(「遺伝性心疾患のスクリーニングのための遺伝子の組み合わせ及びその使用」、出願番号:CN201911408249.5)出願されたものであり、当該特許出願は、遺伝性心疾患をスクリーニングするための遺伝子の組み合わせを提案し、遺伝性心疾患を検出するための試薬におけるその使用を記載しているが、この特許出願は、関連する遺伝子の組み合わせを提供するだけであり、具体的な配列決定データ分析方法、支援診断方法、及び関連システムを提供するものではない。この空白に対処するために、本願は解決策を提案している。
【発明の概要】
【発明が解決しようとする課題】
【0004】
本発明の目的は、遺伝子分子レベルで遺伝性心疾患のスクリーニングと診断を体系的に行い、遺伝子配列決定データを利用して臨床診断を支援し、この技術分野の空白を埋める、遺伝性心疾患の遺伝子支援診断システムの動作方法を提供することである。
【課題を解決するための手段】
【0005】
本発明の遺伝性心疾患の遺伝子支援診断システムの動作方法であって、前記遺伝子支援診断システムは、順次接続された、検査対象遺伝子選択モジュール、変異部位同定モジュール、変異部位アノテーションモジュール、変異部位病原性分析モジュール、及びレポート生成モジュールを含み、
前記検査対象遺伝子選択モジュールは、文献分析及び遺伝専門家の知識と経験に基づいて、遺伝性心疾患を5個の主要カテゴリーと15個のサブカテゴリーに分類し、主要カテゴリーによって各遺伝性心疾患に対応する検出対象遺伝子リストを決定し、
前記変異部位同定モジュールは、検査対象候補遺伝子の配列決定データを分析し、シーケンサーに使用されるキットによって、指定された染色体ROI間隔から潜在的な病原性変異部位を同定し、分析過程には、配列アラインメント及びマッピングユニット、配列データ前処理ユニット、及び変異部位同定ユニットが含まれ、
前記変異部位アノテーションモジュールは、同定された変異部位にアノテーションを付け、分析過程には、vcfファイル分析ユニット、遺伝子情報アノテーションユニット、塩基及びアミノ酸変化情報アノテーションユニット、スプライシング変異部位情報アノテーションユニット、及びDBNSFPデータベースに基づく変異部位情報アノテーションユニットが含まれ、
前記変異部位病原性分析モジュールは、家族又は個体を単位にして、被検者の全遺伝的変異部位の病原性を分類して分析し、分析過程には、リソースファイル前処理ユニット、変異部位病原性判別ユニット、及び変異部位病原性分類ユニットが含まれ、
前記レポート生成モジュールは、患者情報、医師情報、検出サンプル情報、配列決定データ情報、病原性部位情報、及び文献情報を読み取って分析することによってさまざまな詳細レベルの中英バイリンガル検出分析レポートを自動的に生成し、その過程には、データ抽出ユニット、レポート生成ユニット、レポート解釈ユニット、及びレポートエクスポートユニットが含まれる。
【0006】
好ましくは、前記検査対象遺伝子選択モジュールは、遺伝性心疾患分類ユニットと検査対象遺伝子リストユニットを含み、前記遺伝性心疾患分類ユニットは、遺伝性心疾患を遺伝性心筋症Cardiomyopathies、遺伝性大動脈疾患Aortopathies、遺伝性不整脈Inheritedarrthymias、家族性高コレステロール血症Familialhypercholesterolaemia、及び肺高血圧症Pulmonaryarterialhypertensionの5個の主要タイプに分け、
前記遺伝性心筋症は、拡張型心筋症DCM、肥大型心筋症HCM、不整脈源性右室心筋症ARVC、及び左室緻密化障害LVNC心筋症に細分化され、
前記遺伝性大動脈疾患は、マルファン症候群Marfans、ロイス・ディーツ症候群LoeysDietz、及び結合組織病CCTDに細分化され、
前記遺伝性不整脈は、QT延長症候群LQTS、QT短縮症候群SQTS、ブルガダ症候群Brugada、心臓伝導疾患CCD、及びカテコラミン誘発多形性心室頻拍CVPTに細分化され、
前記検査対象遺伝子リストユニットは、遺伝性心疾患の分類に基づいており、関連する心疾患に対応する検査対象遺伝子リストは遺伝学専門家により提供され、前記拡張型心筋症DCMに対応する遺伝子リストは、LMNA、SCN5A、ACTC1、DES、SGCD、MYH7、TNNT2、TPM1、TTN、VCL、MYBPC3、PLN、LDB3、ACTN2、CSRP3、MYH6、ABCC9、TNNC1、TCAP、EYA4、TMPO、FCMD、DMD、Tafazzin、TNNI3、DNAJC19、BAG3、DSP、RYR2、LMNA、NEXN、RBM20、DSG2であり、
前記肥大型心筋症HCMに対応する遺伝子リストは、ACTC1、CSRP3、MYBPC3、MYH6、MYH7、MYL2、MYL3、TCAP、TNNC1、TNNI3、TNNT2、TPM1、TTN、MYLK2、PRKAG2、MYOZ2であり、
前記不整脈源性右室心筋症ARVCに対応する遺伝子リストは、DSC2、DSG2、DSP、PKP2、TGFB3、RYR2、TMEM43、JUPであり、
前記左室緻密化障害LVNC心筋症に対応する遺伝子リストは、ACTC1、CASQ2、LDB3、LMNA、MYBPC3、MYH7、PLN、TAZ、TNNT2、TPM1、DTNAであり、
前記QT延長症候群LQTSに対応する遺伝子リストは、KCNQ1、SCN4B、KCNH2、SCN5A、ANK2、KCNE1、KCNE2、KCNJ2、CACNA1C、CAV3、AKAP9、SNTA1であり、
前記QT短縮症候群SQTSに対応する遺伝子リストは、KCNH2、KCNQ1、TMEM43であり、
前記ブルガダ症候群に対応する遺伝子リストは、SCN5A、GPD1L、CACNA1C、CACNB2、SCN1B、KCNE3、SCN3B、HCN4、KCNJ8、MOG1、KCND3、KCNE5であり、
前記心臓伝導疾患CCDに対応する遺伝子リストは、RYR2、SCN5A、TRPM4であり、
前記カテコラミン誘発多形性心室頻拍CVPTに対応する遺伝子リストは、RYR2、CASQ2であり、
前記マルファン症候群Marfans、ロイス・ディーツ症候群LoeysDietz、結合組織病CCTDに対応する遺伝子リストは、FBN1、TGFBR1、TGFBR2、COL3A1、MYH11、ACTA2、SMAD3、MYLK、GLUT10、EFEMP2であり、
前記家族性高コレステロール血症FHに対応する遺伝子リストは、APOB、LDLR、LDLRAP1、PCSK9であり、
前記肺高血圧症PAHに対応する遺伝子リストは、ACVRL1、BMPR2、CAV1、ENG、SMAD9である。
【0007】
好ましくは、前記変異部位同定モジュールの配列アラインメント及びマッピングユニットは、fastq形式の配列決定生データを受信し、BWA-MEMアルゴリズムを利用して、70bp-1Mbpクエリ配列をBWA-MEMアルゴリズムに合わせて、マルチスレッド方法により配列アラインメント及びマッピング過程を促進し、bam形式のファイルを出力し、
前記変異部位同定モジュールの配列データ前処理ユニットは、bam形式のファイルを入力、処理済みのbam形式のファイルを出力とし、PicardのAddOrReplaceReadGroups方法によりreadsグループ情報をマッピング後のbamファイルに付加するステップ(1)と、PicardのMarkDuplicate方法により反復readsをマークすることで、PCR増幅などのデータ生成ステップによる偏差を低減させるステップ(2)と、後の変異同定を容易にするために、配列をPicardでソートするステップ(3)と、Indelsの塩基品質スコア再校正BQSRを行うことで、シーケンサーの系統誤差を調整するステップ(4)と、を含み、
前記変異部位同定モジュールの変異部位同定ユニットは、参照ゲノムに対する変異部位を識別して、各変異部位の遺伝子型を算出し、配列データ前処理ユニットにより出力されたbamファイルを入力、変異部位を含むvcf形式のファイルを出力とし、GATKを使用して、GVCFモードで各サンプルに対してHaplotypeCaller方法を個別に実行し、GVCF中間ファイル形式を生成するステップ(1)と、GATKのGenotypeGVCFs方法を使用して単一サンプルGVCFファイルと組み合わせて、マルチサンプルのvcfファイルを生成するステップ(2)と、GATKのSelectVariants方法を使用してSNPsとINDELsを区別するステップ(3)と、GATKのVariantRecalibrator及びApplyRecalibration方法を使用して遺伝的変異に対して品質スコア再校正VQSRを行うことで、変異部位をフィルタリングするステップ(4)と、GATKのCombineVariants方法を使用してSNPsとINDELsをまとめてvcfファイルに出力するステップ(5)と、を含む。
【0008】
好ましくは、前記変異部位アノテーションユニットは、変異部位情報にアノテーションを付けることに用いられ、変異部位同定ユニットにより生成されたファイルを入力、アノテーションを付けたtxt形式の変異部位情報ファイルを出力とし、変異部位同定ユニットにより生成されたvcfファイルを分析し、変異部位が存在する染色体CHROM、部位座標POS、参照配列塩基REF、変異配列塩基ALT、部位カバレッジDP、参照配列カバレッジRO、変異配列カバレッジAO、及び遺伝子型情報GTを取得し、一時ファイルinput.txt及びcoverage.txtを生成するステップ(1)と、遺伝子情報にアノテーションを付けるステップであって、まず、前処理された遺伝子エクソンファイルsorted_compiled_exon.bed、イントロンファイルintron.bed、utr3ファイルutr3.bed、utr5ファイルutr5.bed、上流ファイルupstream1000.bed、下流ファイルdownstream1000.bed、「スクリプトン-遺伝子」ファイルtranscript_to_gene.txt、及び「タンパク質アノテーション」ファイルprotein_annotation.txtを含む、遺伝子アノテーションリソースライブラリファイルを読み取り、次に、ステップ(1)で生成されたinput.txtファイル及び読み取られた遺伝子アノテーションリソースライブラリファイル中のデータに基づいて、変異が発生したエリアとして、イントロンintronエリア、エクソンexonエリア、utr5又はutr3を算出し、一時ファイルannotation.txtを生成するステップ(2)と、塩基及びアミノ酸変化情報にアノテーションを付けるステップであって、まず、コードエリアファイルallcds.bed、HGNCに対応する塩基配列ファイルsequence.txt、アミノ酸に対応する略語ファイルaminoacid.txtを読み取り、次に、コードエリアファイルallcds.bed中のスクリプトン番号、部位開始座標及び部位終了座標に基づいて、エクソンエリアに変異が発生した場合、エクソン番号を算出し、それ以外の場合、NAを出力し、さらに変異が発生したエリアに応じて、SynonymousSNP、NonsynonymousSNP、IntronSNP、Utr5SNP、Utr3SNP、IntronDeletion、IntronInsertion、FrameshiftDeletion、In-FrameDeletion、StopGain、及びUnknownを含む当該変異のタイプを算出し、さらにエクソンエリアの変異の場合、ある位置における塩基変化情報及びアミノ酸変化情報を算出し、塩基及びアミノ酸変化情報アノテーション一時ファイルhgvs_annotation.txtを生成するステップ(3)と、スプライシング変異部位情報にアノテーションを付けるステップであって、まず、(3)で生成されたファイルhgvs_annotation.txt及び前処理された遺伝子エクソンファイルsorted_compiled_exon.bed及びコードエリアファイルallcds.bedを読み取り、次に、境界から5bp以内に潜在的なスプライシング変異部位があるか否かを確認し、変異部位の開始位置と終了位置を境界として、開始位置と終了位置にそれぞれ5を加算及び減算して、境界エリアをs1、e1、s2、e2と命名した4つのセグメントに分割し、その後、s1、e1エリアがスプライシング部位であるか否か、s2、e2エリアがスプライシング部位であるか否かをそれぞれ判断し、スプライシング部位であれば、さらに該スプライシング部位変異の塩基変化情報を出力し、一時ファイルspliced_hgvs_annotation.txtを生成するステップ(4)と、dbnsfpデータベースの変異部位情報アノテーションに基づいて、まず、(4)で生成されたファイルspliced_hgvs_annotation.txt及びフィルタリングされたdbnsfpデータファイルfilterbased_dbnsfp.txtを読み取り、次に、spliced_hgvs_annotation.txtとfilterbased_dbnsfp.txtとのアラインメントを行い、SIFT、Polyphen、LRT、MutationTaster、FATHMM、CAD、MetaSVM、及びClinvar計算ツールによって予測可能な変異部位の病原性結果とスコアを取得し、さらに、1000Gp3_AFR_AF、1000Gp3_EUR_AF、1000Gp3_AMR_AF、1000Gp3_EAS_AF、1000Gp3_SAS_AF、ESP6500_EA_AF、ExAC_Adj_AF、ExAC_AFR_AF、ExAC_AMR_AF、ExAC_EAS_AF、ExAC_FIN_AF、ExAC_NFE_A、及びExAC_SASを含む、集団内の変異部位のアノテーション情報を取得するとともに、該変異部位の希少性をマークし、一時ファイルを生成して、popgen_filtering_spliced_hgvs_annotation.txtと命名するステップ(5)と、カバレッジ情報にアノテーションを付けるステップであって、(1)で生成されたcoverage.txtファイルを読み取り、Total_Coverage、Ref_Coverage、Alt_Coverage、及びGenotypeの情報を含む変異部位のカバレッジ情報を付加し、最終的なアノテーションファイルannotation.txtを生成するステップ(6)と、を含む。
【0009】
好ましくは、前記変異部位病原性分析モジュールのリソース読み取り及び前処理ユニットは、様々なデータリソースを前処理し、すべての分析対象の外部リソースファイルを読み取り、処理する必要のないデータをフィルタリングして、病原性判別及びモジュールの処理性能をさらに向上させることに用いられ、Lost of Function遺伝子リストを読み取り、ミスセンス遺伝子リストを読み取るステップ(1)と、遺伝的変異の病原性染色体、開始座標、塩基変化、アミノ酸変化、及び対応する遺伝子名を含む、Clinvarデータベース内のすべての病原性の変異情報を読み取るステップ(2)と、OMIM番号に対応する遺伝子名、劣性遺伝病のOMIM番号リスト、優性遺伝病のOMIM番号リスト、及びOMIM番号に対応するOrpha番号リストを含む、OMIMデータベース関連情報を読み取るステップ(3)と、染色体番号、hg19での位置、SNP番号、参照対立遺伝子、及び置換対立遺伝子を含むPS4に関連する変異情報をgwasdbから取得するステップ(4)と、PM1判断のための良性タンパク質ドメインを読み取り、BP1遺伝子リストを読み取り、遺伝子名を取得し、具体的には、染色体番号、開始位置、及び終了位置を含む、PM4及びBP3の判断のためのrmsk範囲を読み取り、BS2の判断のためのヘテロ接合体及びホモ接合体の情報を読み取るステップ(5)と、染色体番号、位置、参照対立遺伝子、置換対立遺伝子、adaスコア、rfスコアを含む、dbscSNVデータ情報をロードするステップ(6)と、を含む。
【0010】
前記変異部位病原性分析モジュールの変異部位病原性判別ユニットは、ACMGの28項の基準に従ってSNPを判定し、前記データファイル中の各前記変異部位における全判別項目の値を算出し、各判別項目について採点を行い、スコアに従って全判別項目を集計し、その集計に応じてすべての遺伝的変異の病原性を分類することに用いられ、算出可能な判別項目は、PVS1、PS1、PS4、PM1、PM2、PM4、PM5、PP2、PP3、PP5、BS1、BS2、BP1、BP3、BP4、BP6、BP7、及びBA1を含み、具体的には、(1)判別項目PVS1に対して、まず、変異部位が存在する遺伝子がLost of Functionリストに含まれているか否かを確認し、次に、変異部位のアノテーション情報を確認し、ナンセンス変異、フレームシフト変異、+/-1又は+/-2スプライシング部位、開始コドン、1つ又は複数のエクソン欠失の場合、PVS1が成り立ち、その値は1とされ、(2)判別項目PS1に対して、以前に病原性があると判定された変異と同じアミノ酸変化があるか否かを判断し、点突然変異SNPがスプライシングに影響を与えるか否かをさらに判定し、(3)判別項目PM2に対して、公開されているSAP、1000Genome、及びExACデータベース内の対照集団の割合を参照し、東南アジアの対照集団に関するデータを追加し、(4)判別項目PM4に対して、UCSCゲノムブラウザにおいてRMSKデータベースを検索し、変異が非反復エリアの非フレームシフトINDELである場合、又は変異タイプがStopLossである場合、PM4が成り立ち、その値は1とされ、それ以外の場合、その値は0とされ、(5)判別項目BP3に対して、UCSCゲノムブラウザにおいてRMSKデータベースを検索し、変異が反復エリアの非フレームシフトINDELである場合、BP3が成り立ち、その値は1とされ、それ以外の場合、その値は0とされ、(6)判別項目PM5に対して、まず、変異のタイプを確認し、ミスセンス変異の場合、ロードされたClinvar病原性変異データにその変異が存在するか否かをさらに確認し、次に、当該変異が異なる核酸変化を引き起こすか否かを確認し、異なるアミノ酸変化を引き起こす場合、PM5が成り立ち、その値は1とされ、それ以外の場合、その値は0とされ、(7)判別項目BP7に対して、保存性を確認し、同義変異がスプライシングに影響を与えず、かつヌクレオチドの位置が高度に保存されていない場合、その変異を良性のものと分類し、BP7が成り立ち、その値は1とされ、変異がスプライシングに影響を与えないと予測した場合、dbscSNV_RF_SCORE及びdbscSNV_ADA_SCOREの両方が0.6未満である必要があり、ヌクレオチド保存性の予測はdbnsfp30aデータベースから検出したものであり、ヌクレオチドが高度に保存されていることを示すために、2を超えるGERP++スコアが必要であり、
前記変異部位病原性分析モジュールの病原性分類ユニットは、上記各判別ユニットによる算出結果に基づいて、以下のルールに従って分類を行い、PVS1が1であり、かつPSの数が1以上である、又はPMの数が2以上である、又はPMの数が1であり、かつPPの数が1である、又はPPの数が2以上である場合、分類の結果、病原性のものであり、PSの数が2以上である場合にも、分類の結果、病原性のものであり、PSの数が1であり、PMの数が3以上である場合、分類の結果、病原性のものであり、PSの数が1であり、PMの数が2であり、かつPPの数が2以上である場合、分類の結果、病原性のものであり、PVS1の数が1であり、かつPMの数が1である、又はPSの数が1であり、かつPMの数が1又は2である、又はPSの数が1であり、かつPPの数が2以上である、又はPMの数が3以上であるか、PMの数が2であり、かつPPの数が2以上である場合、分類の結果、病原性である可能性があり、BAの数が1であり、又はBSの数が2以上である場合、分類の結果、良性のものであり、BSの数が1であり、かつBPの数が1である、又はBPの数が2以上である場合、分類の結果、良性である可能性があり、それ以外の場合、分類の結果、有意性が不明であり、さらに病原性の分類結果をannotation.txtファイルに付加し、最終的な分類結果ファイルinterpretation.txtを生成する。
【0011】
好ましくは、前記レポート生成モジュールのデータ抽出ユニットは、検出分析結果から、すべての変異部位の染色体番号、変異部位が存在する塩基位置、参照塩基、変異塩基、遺伝子名、遺伝子型、病原性分類結果、検出遺伝子リスト、及びカバレッジという品質制御データ項目を抽出し、上記で抽出されたデータをレポートのコンテンツとして記入し、
前記レポート生成モジュールのレポート生成ユニットは、データ抽出ユニットによって抽出された情報に基づいて、中国語と英語の両方をサポートする包括レベルの検出・分析レポート及び中国語と英語の両方をサポートする詳細なレベルの検出・分析レポートを生成し、レポート生成ユニットは、単一変異部位のレポート生成とバッチ変異部位のレポート生成をサポートし、単一変異部位のレポート生成とは、ユーザが入力した単一変異部位情報に基づいて、前記病原性分類ユニット及び情報抽出ユニットから提供される関連データによりレポートを生成することを指し、バッチ変異部位レポートは、病原性分類ユニットによって生成されたファイルinterpretation.txtを読み取ることによって生成され、
前記レポート生成モジュールのレポート解釈ユニットは、レポートのコンテンツと家系メンバーの分析結果を組み合わせて、レポート結論についてのさらなる解釈を提供し、具体的には、
レポート結論には、陽性結果Positive、陰性結果Negative、及び臨床的意義が不明なバリアントVUS:Variant of Unknown Significanceの3つの結果があり、
前記陽性結果は、対象者に病原性突然変異が見つかったことを示し、前記陰性結果は、対象者に病原性突然変異が見つからなかったが、遺伝的原因は除外されないことを示し、前記臨床的意義が不明なバリアントは、不確実な同定を示し、
前記レポート生成モジュールのレポートエクスポートユニットは、Webページ形式のレポートをWord又はPDFなどの標準ファイル形式として出力する。
【0012】
好ましくは、前記中国語と英語の両方をサポートする包括レベルの検出・分析レポートの具体的な生成ステップは、(1)レポートの構造とスタイルを設定し、HTMLタグを使用してレポート構造を定義し、CSSを使用してレポートのスタイルを設定し、レポート構造には、検出レポート基本情報エリア、検出結果エリア、レポート結論エリア、及びサンプル品質制御エリアの4つのサブ構造が含まれ、(2)レポートコンテンツを記入し、検出結果エリアに被検者の変異部位情報を記入して、その変異部位が遺伝性心疾患の疑いと関連しているか否かの分析結果を表示し、レポート結論エリアでは、検出結果データの分析を通じてレポート結論を示し、家系メンバーの検出結果がある場合、結論の生成には家系メンバーの検出結果も考慮し、具体的な判断ルールはレポート解釈ユニットで説明し、さらにデータベースから医師の電子署名を抽出し、レポート結論の関連エリアに署名し、サンプル品質制御エリアに疾患に対応する候補検出遺伝子及びカバレッジ情報を記入する。
【0013】
好ましくは、前記中国語と英語の両方をサポートする詳細なレベルの検出・分析レポートの具体的な生成ステップは、(1)レポートの構造とスタイルを設定し、HTMLタグを使用してレポート構造を定義し、CSSを使用してレポートのスタイルを設定し、レポート構造には、分析結果表示エリア、病原性分類結果の可視化表示エリア、及び分析結果の裏付け証拠エリアの3つのサブ構造が含まれ、(2)レポートコンテンツを記入し、分析結果表示エリアには、遺伝的変異部位の病原性分類結果、対応する遺伝子名、変異タイプ、HGVSコードDNA変化、HGVSアミノ酸変化、変異部位染色体、及び塩基位置を記入し、病原性分類結果の可視化表示エリアには、病原性分類の関連指標項目を表及び異なる色で表示し、分析結果の裏付け証拠エリアには、関連裏付け証拠データを表示し、この関連裏付け証拠データには、病原性分類指標のうちのBS1、PM2、PS4を裏付けるための集団証拠データと、SIFT、MutationTaster、MutationAccessor、Polyphen、LRT、FATHMM、及びCADDツールを含み、分類指標のうちのBP1、BP3、BP4、PP3、PM4、PM5、PS1、PVS1を裏付けるための病原性算出及び予測ツール裏付け証拠データと、分類指標のうちのBS3、PP1、PP2、PM1、PS3を裏付けるための機能的証拠データと、追加の証拠データと、参照文献と、が含まれる。
【0014】
好ましくは、前記レポートエクスポートユニットの具体的な動作ステップは、(1)エクスポートファイルのパスと名前の設定、用紙サイズの設定、フォントの設定、ヘッダーとフッターの設定などを含むエクスポート設定を行い、(2)word形式をエクスポートし、1つの手段としては、Documentクラスを使用してHTMLファイルをロードするステップaと、Document.save方法を使用してHTMLファイルをWordドキュメントとして保存するステップbとにより実現される、HTMLをdoc、docx、docm形式に直接変換することであり、もう1つの手段としては、Documentクラスのインスタンスを作成するステップaと、DocumentBuilderクラスのインスタンスを作成して、Documentオブジェクトで初期化するステップbと、DocumentBuilder.InsertHtml方法を使用してドキュメントにHTMLを挿入するステップcと、Document.save方法を使用してWordドキュメントを保存するステップdとにより実現される、HTML文字列に基づいてWordを動的に生成することであり、更なる手段としては、URLクラスのインスタンスを作成して、必要なURLで初期化するステップaと、InputStreamオブジェクトにおいてURLを開くステップbと、HtmlLoadOptionsクラスのインスタンスを作成するステップcと、Documentクラスのインスタンスを作成して、InputStreamオブジェクトとHtmlLoadOptionsオブジェクトを使用して初期化するステップdと、Document.save方法を使用してWebページをWordドキュメントとして保存するステップeとにより実現される、レポートのurlに基づいてWebページをWordに変換することであり、(3)オープンソースプロジェクトiTextを使用してpdf形式をエクスポートし、重要なステップには、com.lowagie.text.Documenオブジェクトのインスタンスを作成するステップaと、ライターWriterを作成してdocumentオブジェクトに関連付け、ライターWriterによってドキュメントをディスクに書き込むステップbと、ドキュメント属性を設定し、ドキュメントを開く前に、関連する方法を呼び出して、ドキュメントのタイトル、テーマ、著者、キーワード、バインド方式、作成者、作成日などを設定するステップcと、ドキュメントを開くステップdと、Phrase、Paragraph、Table、Graphicsオブジェクトを含むドキュメントにコンテンツオブジェクトを追加するステップeと、ドキュメントを閉じるステップfと、が含まれる。
【発明の効果】
【0015】
有益な効果は、以下の通りである。
【0016】
(1)本願は、遺伝子配列決定データを利用して遺伝性心疾患の臨床診断を支援することによって、遺伝性心疾患の臨床診断の効果を効果的に高め、遺伝性心疾患の患者に対する診療効果を向上させることができる。
【0017】
(2)本願は、遺伝子配列決定データを利用して遺伝性心疾患の診断手段を体系的に改善し、臨床医が遺伝性心疾患であるか否かについてリスク評価及びターゲティングを正確かつ効率的に行うことを可能にし、患者に対する正確な治療を行うのに有利である。
【0018】
(3)本願は、遺伝性心疾患の支援診断に対して、遺伝子配列決定データからレポート生成までの自動分析を実現し、人の介入を低減し、診断効率を大幅に向上させる。
【図面の簡単な説明】
【0019】
図1】本願の動作流れの模式図である。
【発明を実施するための形態】
【0020】
以下、特定の実施例を参照して本願についてさらに説明する。
【0021】
図1に示すように、本実施例では、遺伝性心疾患の遺伝子支援診断システムの動作方法であって、前記遺伝子支援診断システムは、順次接続された、検査対象遺伝子選択モジュール、変異部位同定モジュール、変異部位アノテーションモジュール、変異部位病原性分析モジュール、及びレポート生成モジュールを含む。
【0022】
本実施例では、検査対象遺伝子選択モジュールは、文献分析及び遺伝専門家の知識と経験に基づいて、遺伝性心疾患を5個の主要カテゴリーと15個のサブカテゴリーに分類し、主要カテゴリーによって各遺伝性心疾患に対応する検出対象遺伝子リストを決定する。医師、診断を通じて、患者が罹患している可能性のある遺伝性心疾患を予備的に判断し、心疾患のタイプに応じてリストから対応する検査対象候補遺伝子を選択する。
【0023】
具体的には、検査対象遺伝子選択モジュールは、遺伝性心疾患分類ユニットと検査対象遺伝子リストユニットを含み、遺伝性心疾患分類ユニットは、遺伝性心疾患を遺伝性心筋症Cardiomyopathies、遺伝性大動脈疾患Aortopathies、遺伝性不整脈Inheritedarrthymias、家族性高コレステロール血症Familialhypercholesterolaemia、及び肺高血圧症Pulmonaryarterialhypertensionの5個の主要タイプに分け、
遺伝性心筋症は、拡張型心筋症DCM、肥大型心筋症HCM、不整脈源性右室心筋症ARVC、及び左室緻密化障害LVNC心筋症に細分化され、
遺伝性大動脈疾患は、マルファン症候群Marfans、ロイス・ディーツ症候群LoeysDietz、及び結合組織病CCTDに細分化され、
遺伝性不整脈は、QT延長症候群LQTS、QT短縮症候群SQTS、ブルガダ症候群Brugada、心臓伝導疾患CCD、及びカテコラミン誘発多形性心室頻拍CVPTに細分化され、
本実施例では、検査対象遺伝子リストユニットは、遺伝性心疾患の分類に基づいており、関連する心疾患に対応する検査対象遺伝子リストは遺伝学専門家により提供され、拡張型心筋症DCMに対応する遺伝子リストは、LMNA、SCN5A、ACTC1、DES、SGCD、MYH7、TNNT2、TPM1、TTN、VCL、MYBPC3、PLN、LDB3、ACTN2、CSRP3、MYH6、ABCC9、TNNC1、TCAP、EYA4、TMPO、FCMD、DMD、Tafazzin、TNNI3、DNAJC19、BAG3、DSP、RYR2、LMNA、NEXN、RBM20、DSG2であり、
肥大型心筋症HCMに対応する遺伝子リストは、ACTC1、CSRP3、MYBPC3、MYH6、MYH7、MYL2、MYL3、TCAP、TNNC1、TNNI3、TNNT2、TPM1、TTN、MYLK2、PRKAG2、MYOZ2であり、
不整脈源性右室心筋症ARVCに対応する遺伝子リストは、DSC2、DSG2、DSP、PKP2、TGFB3、RYR2、TMEM43、JUPであり、
左室緻密化障害LVNC心筋症に対応する遺伝子リストは、ACTC1、CASQ2、LDB3、LMNA、MYBPC3、MYH7、PLN、TAZ、TNNT2、TPM1、DTNAであり、
QT延長症候群LQTSに対応する遺伝子リストは、KCNQ1、SCN4B、KCNH2、SCN5A、ANK2、KCNE1、KCNE2、KCNJ2、CACNA1C、CAV3、AKAP9、SNTA1であり、
QT短縮症候群SQTSに対応する遺伝子リストは、KCNH2、KCNQ1、TMEM43であり、
ブルガダ症候群に対応する遺伝子リストは、SCN5A、GPD1L、CACNA1C、CACNB2、SCN1B、KCNE3、SCN3B、HCN4、KCNJ8、MOG1、KCND3、KCNE5であり、
心臓伝導疾患CCDに対応する遺伝子リストは、RYR2、SCN5A、TRPM4であり、
カテコラミン誘発多形性心室頻拍CVPTに対応する遺伝子リストは、RYR2、CASQ2であり、
マルファン症候群Marfans、ロイス・ディーツ症候群LoeysDietz、結合組織病CCTDに対応する遺伝子リストは、FBN1、TGFBR1、TGFBR2、COL3A1、MYH11、ACTA2、SMAD3、MYLK、GLUT10、EFEMP2であり、
家族性高コレステロール血症FHに対応する遺伝子リストは、APOB、LDLR、LDLRAP1、PCSK9であり、
肺高血圧症PAHに対応する遺伝子リストは、ACVRL1、BMPR2、CAV1、ENG、SMAD9である。
【0024】
本実施例では、変異部位同定モジュールは、検査対象候補遺伝子の配列決定データを分析し、シーケンサーに使用されるキットによって、指定された染色体ROI間隔から潜在的な病原性変異部位を同定し、分析過程には、配列アラインメント及びマッピングユニット、配列データ前処理ユニット、及び変異部位同定ユニットが含まれる。
【0025】
具体的には、配列アラインメント及びマッピングユニットは、fastq形式の配列決定生データを受信し、BWA-MEMアルゴリズムを利用して、70bp-1Mbpクエリ配列をBWA-MEMアルゴリズムに合わせて、マルチスレッド方法により配列アラインメント及びマッピング過程を促進し、bam形式のファイルを出力する。
【0026】
配列データ前処理ユニットは、bam形式のファイルを入力、処理済みのbam形式のファイルを出力とし、PicardのAddOrReplaceReadGroups方法によりreadsグループ情報をマッピング後のbamファイルに付加するステップ(1)と、PicardのMarkDuplicate方法により反復readsをマークすることで、PCR増幅などのデータ生成ステップによる偏差を低減させるステップ(2)と、後の変異同定を容易にするために、配列をPicardでソートするステップ(3)と、Indelsの塩基品質スコア再校正BQSRを行うことで、シーケンサーの系統誤差を調整するステップ(4)と、を含む。
【0027】
変異部位同定ユニットは、参照ゲノムに対する変異部位を識別して、各変異部位の遺伝子型を算出し、配列データ前処理ユニットにより出力されたbamファイルを入力、変異部位を含むvcf形式のファイルを出力とし、GATKを使用して、GVCFモードで各サンプルに対してHaplotypeCaller方法を個別に実行し、GVCF中間ファイル形式を生成するステップ(1)と、GATKのGenotypeGVCFs方法を使用して単一サンプルGVCFファイルと組み合わせて、マルチサンプルのvcfファイルを生成するステップ(2)と、GATKのSelectVariants方法を使用してSNPsとINDELsを区別するステップ(3)と、GATKのVariantRecalibrator及びApplyRecalibration方法を使用して遺伝的変異に対して品質スコア再校正VQSRを行うことで、変異部位をフィルタリングするステップ(4)と、GATKのCombineVariants方法を使用してSNPsとINDELsをまとめてvcfファイルに出力するステップ(5)と、を含む。
【0028】
本実施例では、変異部位アノテーションモジュールは、変異部位情報にアノテーションを付けることに用いられ、変異部位同定ユニットにより生成されたファイルを入力、アノテーションを付けたtxt形式の変異部位情報ファイルを出力とし、変異部位同定ユニットにより生成されたvcfファイルを分析し、変異部位が存在する染色体CHROM、部位座標POS、参照配列塩基REF、変異配列塩基ALT、部位カバレッジDP、参照配列カバレッジRO、変異配列カバレッジAO、及び遺伝子型情報GTを取得し、一時ファイルinput.txt及びcoverage.txtを生成するステップ(1)と、遺伝子情報にアノテーションを付けるステップであって、まず、前処理された遺伝子エクソンファイルsorted_compiled_exon.bed、イントロンファイルintron.bed、utr3ファイルutr3.bed、utr5ファイルutr5.bed、上流ファイルupstream1000.bed、下流ファイルdownstream1000.bed、「スクリプトン-遺伝子」ファイルtranscript_to_gene.txt、及び「タンパク質アノテーション」ファイルprotein_annotation.txtを含む遺伝子アノテーションリソースライブラリファイルを読み取り、次に、ステップ(1)で生成されたinput.txtファイル及び読み取られた遺伝子アノテーションリソースライブラリファイル中のデータに基づいて、変異が発生したエリアとして、イントロンintronエリア、エクソンexonエリア、utr5又はutr3を算出し、一時ファイルannotation.txtを生成するステップ(2)と、塩基及びアミノ酸変化情報にアノテーションを付けるステップであって、まず、コードエリアファイルallcds.bed、HGNCに対応する塩基配列ファイルsequence.txt、アミノ酸に対応する略語ファイルaminoacid.txtを読み取り、次に、コードエリアファイルallcds.bed中のスクリプトン番号、部位開始座標及び部位終了座標に基づいて、エクソンエリアに変異が発生した場合、エクソン番号を算出し、それ以外の場合、NAを出力し、さらに変異が発生したエリアに応じて、SynonymousSNP、NonsynonymousSNP、IntronSNP、Utr5SNP、Utr3SNP、IntronDeletion、IntronInsertion、FrameshiftDeletion、In-FrameDeletion、StopGain、及びUnknownを含む当該変異のタイプを算出し、さらにエクソンエリアの変異の場合、ある位置における塩基変化情報及びアミノ酸変化情報を算出し、塩基及びアミノ酸変化情報アノテーション一時ファイルhgvs_annotation.txtを生成するステップ(3)と、スプライシング変異部位情報にアノテーションを付けるステップであって、まず、(3)で生成されたファイルhgvs_annotation.txt及び前処理された遺伝子エクソンファイルsorted_compiled_exon.bed及びコードエリアファイルallcds.bedを読み取り、次に、境界から5bp以内に潜在的なスプライシング変異部位があるか否かを確認し、変異部位の開始位置と終了位置を境界として、開始位置と終了位置にそれぞれ5を加算及び減算して、境界エリアをs1、e1、s2、e2と命名した4つのセグメントに分割し、その後、s1、e1エリアがスプライシング部位であるか否か、s2、e2エリアがスプライシング部位であるか否かをそれぞれ判断し、スプライシング部位であれば、さらに該スプライシング部位変異の塩基変化情報を出力し、一時ファイルspliced_hgvs_annotation.txtを生成するステップ(4)と、dbnsfpデータベースの変異部位情報アノテーションに基づいて、まず、(4)で生成されたファイルspliced_hgvs_annotation.txt及びフィルタリングされたdbnsfpデータファイルfilterbased_dbnsfp.txtを読み取り、次に、spliced_hgvs_annotation.txtとfilterbased_dbnsfp.txtとのアラインメントを行い、SIFT、Polyphen、LRT、MutationTaster、FATHMM、CAD、MetaSVM、及びClinvar計算ツールによって予測可能な変異部位の病原性結果とスコアを取得し、さらに、1000Gp3_AFR_AF、1000Gp3_EUR_AF、1000Gp3_AMR_AF、1000Gp3_EAS_AF、1000Gp3_SAS_AF、ESP6500_EA_AF、ExAC_Adj_AF、ExAC_AFR_AF、ExAC_AMR_AF、ExAC_EAS_AF、ExAC_FIN_AF、ExAC_NFE_A、及びExAC_SASを含む、集団内の変異部位のアノテーション情報を取得するとともに、該変異部位の希少性をマークし、一時ファイルを生成して、popgen_filtering_spliced_hgvs_annotation.txtと命名するステップ(5)と、カバレッジ情報にアノテーションを付けるステップであって、(1)で生成されたcoverage.txtファイルを読み取り、Total_Coverage、Ref_Coverage、Alt_Coverage、及びGenotypeの情報を含む変異部位のカバレッジ情報を付加し、最終的なアノテーションファイルannotation.txtを生成するステップ(6)と、を含む。
【0029】
本実施例では、変異部位病原性分析モジュールは、家族又は個体を単位にして、被検者の全遺伝的変異部位の病原性を分類して分析し、分析過程には、リソースファイル前処理ユニット、変異部位病原性判別ユニット、及び変異部位病原性分類ユニットが含まれ、
具体的には、リソース読み取り及び前処理ユニットは、様々なデータリソースを前処理し、すべての分析対象の外部リソースファイルを読み取り、処理する必要のないデータをフィルタリングして、病原性判別及びモジュールの処理性能をさらに向上させることに用いられ、Lost of Function遺伝子リストを読み取り、ミスセンス遺伝子リストを読み取るステップ(1)と、遺伝的変異の病原性染色体、開始座標、塩基変化、アミノ酸変化、及び対応する遺伝子名を含む、Clinvarデータベース内のすべての病原性の変異情報を読み取るステップ(2)と、OMIM番号に対応する遺伝子名、劣性遺伝病のOMIM番号リスト、優性遺伝病のOMIM番号リスト、及びOMIM番号に対応するOrpha番号リストを含む、OMIMデータベース関連情報を読み取るステップ(3)と、染色体番号、hg19での位置、SNP番号、参照対立遺伝子、及び置換対立遺伝子を含むPS4に関連する変異情報をgwasdbから取得するステップ(4)と、PM1判断のための良性タンパク質ドメインを読み取り、BP1遺伝子リストを読み取り、遺伝子名を取得し、具体的には、染色体番号、開始位置、及び終了位置を含む、PM4及びBP3の判断のためのrmsk範囲を読み取り、BS2の判断のためのヘテロ接合体及びホモ接合体の情報を読み取るステップ(5)と、染色体番号、位置、参照対立遺伝子、置換対立遺伝子、adaスコア、rfスコアを含むdbscSNVデータ情報をロードするステップ(6)と、を含む。
【0030】
変異部位病原性判別ユニットは、ACMGの28項の基準に従ってSNPを判定し、前記データファイル中の各前記変異部位における全判別項目の値を算出し、各判別項目について採点を行い、スコアに従って全判別項目を集計し、その集計に応じてすべての遺伝的変異の病原性を分類することに用いられ、算出可能な判別項目は、PVS1、PS1、PS4、PM1、PM2、PM4、PM5、PP2、PP3、PP5、BS1、BS2、BP1、BP3、BP4、BP6、BP7、及びBA1を含み、具体的には、(1)判別項目PVS1に対して、まず、変異部位が存在する遺伝子がLost of Functionリストに含まれているか否かを確認し、次に、変異部位のアノテーション情報を確認し、ナンセンス変異、フレームシフト変異、+/-1又は+/-2スプライシング部位、開始コドン、1つ又は複数のエクソン欠失の場合、PVS1が成り立ち、その値は1とされ、(2)判別項目PS1に対して、以前に病原性があると判定された変異と同じアミノ酸変化があるか否かを判断し、点突然変異SNPがスプライシングに影響を与えるか否かをさらに判定し、(3)判別項目PM2に対して、公開されているSAP、1000Genome、及びExACデータベース内の対照集団の割合を参照し、東南アジアの対照集団に関するデータを追加し、(4)判別項目PM4に対して、他の公開されたスキームでは、非反復エリアでのフレーム内又は終止コドンの欠損のみが考慮されているが、ACMGガイドラインによれば、PM4は変異部位が非反復エリア内で非frameshift indelに属している場合にのみ判定可能であるが、本技術的解決手段の実装時にこの条件の判断を追加し、UCSCゲノムブラウザにおいてRMSKデータベースを検索し、変異が非反復エリアの非フレームシフトINDELである場合、又は変異タイプがStopLossである場合、PM4が成り立ち、その値は1とされ、それ以外の場合、その値は0とされ、(5)判別項目BP3に対して、他の公開されたスキームでは、機能が不明な反復エリア内のみが考慮されているが、同様に、ACMGガイドラインによれば、BP3は変異部位が反復エリア内で非frameshift indelである場合にのみ判定可能であるが、本技術的解決手段の実装時にこの条件の判断を追加し、UCSCゲノムブラウザにおいてRMSKデータベースを検索し、変異が反復エリアの非フレームシフトINDELである場合、BP3が成り立ち、その値は1とされ、それ以外の場合、その値は0とされ、(6)判別項目PM5に対して、他の公開されたスキームでは、新しいミスセンス突然変異がアミノ酸変化を引き起こすことのみが考慮されているが、ACMGガイドラインによれば、PM5はミスセンス変異が病原性であることが知られており、アミノ酸変化を引き起こす場合にのみ判定可能であるが、本技術的解決手段では突然変異病原性の判断を追加し、まず、変異のタイプを確認し、ミスセンス変異の場合、ロードされたClinvar病原性変異データにその変異が存在するか否かをさらに確認し、次に、当該変異が異なる核酸変化を引き起こすか否かを確認し、異なるアミノ酸変化を引き起こす場合、PM5が成り立ち、その値は1とされ、それ以外の場合、その値は0とされ、(7)判別項目BP7に対して、他の公開されたスキームでは、スプライシングに影響しない同義変異のみが考慮されているが、ACMGガイドラインによれば、ヌクレオチドの位置が高度に保存されているか否かも確認する必要があり、本技術的解決手段では保存性の確認を追加し、即ち、保存性を確認し、同義変異がスプライシングに影響を与えず、かつヌクレオチドの位置が高度に保存されていない場合、その変異を良性のものと分類し、BP7が成り立ち、その値は1とされ、変異がスプライシングに影響を与えないと予測した場合、dbscSNV_RF_SCORE及びdbscSNV_ADA_SCOREの両方が0.6未満である必要があり、ヌクレオチド保存性の予測はdbnsfp30aデータベースから検出したものであり、ヌクレオチドが高度に保存されていることを示すために、2を超えるGERP++スコアが必要である。
【0031】
病原性分類ユニットは、上記各判別ユニットによる算出結果に基づいて、以下のルールに従って分類を行い、PVS1が1であり、かつPSの数が1以上である、又はPMの数が2以上である、又はPMの数が1であり、かつPPの数が1である、又はPPの数が2以上である場合、分類の結果、病原性のものであり、PSの数が2以上である場合にも、分類の結果、病原性のものであり、PSの数が1であり、PMの数が3以上である場合、分類の結果、病原性のものであり、PSの数が1であり、PMの数が2であり、かつPPの数が2以上である場合、分類の結果、病原性のものであり、PVS1の数が1であり、かつPMの数が1である、又はPSの数が1であり、かつPMの数が1又は2である、又はPSの数が1であり、かつPPの数が2以上である、又はPMの数が3以上であるか、PMの数が2であり、かつPPの数が2以上である場合、分類の結果、病原性である可能性があり、BAの数が1であり、又はBSの数が2以上である場合、分類の結果、良性のものであり、BSの数が1であり、かつBPの数が1である、又はBPの数が2以上である場合、分類の結果、良性である可能性があり、それ以外の場合、分類の結果、有意性が不明であり、さらに病原性の分類結果をannotation.txtファイルに付加し、最終的な分類結果ファイルinterpretation.txtを生成する。
【0032】
本実施例では、レポート生成モジュールは、患者情報、医師情報、検出サンプル情報、配列決定データ情報、病原性部位情報、及び文献情報を読み取って分析することによってさまざまな詳細レベルの中英バイリンガル検出分析レポートを自動的に生成し、その過程には、データ抽出ユニット、レポート生成ユニット、レポート解釈ユニット、及びレポートエクスポートユニットが含まれる。
【0033】
具体的には、レポート生成モジュールのデータ抽出ユニットは、検出分析結果から、すべての変異部位の染色体番号、変異部位が存在する塩基位置、参照塩基、変異塩基、遺伝子名、遺伝子型、病原性分類結果、検出遺伝子リスト、及びカバレッジという品質制御データ項目を抽出し、上記で抽出されたデータをレポートのコンテンツとして記入し、
レポート生成ユニットは、データ抽出ユニットによって抽出された情報に基づいて、中国語と英語の両方をサポートする包括レベルの検出・分析レポート及び中国語と英語の両方をサポートする詳細なレベルの検出・分析レポートを生成し、レポート生成ユニットは、単一変異部位のレポート生成とバッチ変異部位のレポート生成をサポートし、単一変異部位のレポート生成とは、ユーザが入力した単一変異部位情報に基づいて、前記病原性分類ユニット及び情報抽出ユニットから提供される関連データによりレポートを生成することを指し、バッチ変異部位レポートは、病原性分類ユニットによって生成されたファイルinterpretation.txtを読み取ることによって生成され、
具体的には、中国語と英語の両方をサポートする包括レベルの検出・分析レポートの具体的な生成ステップは、(1)レポートの構造とスタイルを設定し、HTMLタグを使用してレポート構造を定義し、CSSを使用してレポートのスタイルを設定し、レポート構造には、検出レポート基本情報エリア、検出結果エリア、レポート結論エリア、及びサンプル品質制御エリアの4つのサブ構造が含まれ、(2)レポートコンテンツを記入し、検出結果エリアに被検者の変異部位情報を記入して、その変異部位が遺伝性心疾患の疑いと関連しているか否かの分析結果を表示し、レポート結論エリアでは、検出結果データの分析を通じてレポート結論を示し、家系メンバーの検出結果がある場合、結論の生成には家系メンバーの検出結果も考慮し、具体的な判断ルールはレポート解釈ユニットで説明し、さらにデータベースから医師の電子署名を抽出し、レポート結論の関連エリアに署名し、サンプル品質制御エリアに疾患に対応する候補検出遺伝子及びカバレッジ情報を記入する。
【0034】
中国語と英語の両方をサポートする詳細なレベルの検出・分析レポートの具体的な生成ステップは、(1)レポートの構造とスタイルを設定し、HTMLタグを使用してレポート構造を定義し、CSSを使用してレポートのスタイルを設定し、レポート構造には、分析結果表示エリア、病原性分類結果の可視化表示エリア、及び分析結果の裏付け証拠エリアの3つのサブ構造が含まれ、(2)レポートコンテンツを記入し、分析結果表示エリアには、遺伝的変異部位の病原性分類結果、対応する遺伝子名、変異タイプ、HGVSコードDNA変化、HGVSアミノ酸変化、変異部位染色体、及び塩基位置を記入し、病原性分類結果の可視化表示エリアには、病原性分類の関連指標項目を表及び異なる色で表示し、分析結果の裏付け証拠エリアには、関連裏付け証拠データを表示し、この関連裏付け証拠データには、病原性分類指標のうちのBS1、PM2、PS4を裏付けるための集団証拠データと、SIFT、MutationTaster、MutationAccessor、Polyphen、LRT、FATHMM、及びCADDツールを含み、分類指標のうちのBP1、BP3、BP4、PP3、PM4、PM5、PS1、PVS1を裏付けるための病原性算出及び予測ツール裏付け証拠データと、分類指標のうちのBS3、PP1、PP2、PM1、PS3を裏付けるための機能的証拠データと、追加の証拠データと、参照文献と、が含まれる。
【0035】
レポート解釈ユニットは、レポートのコンテンツと家系メンバーの分析結果を組み合わせて、レポート結論についてのさらなる解釈を提供し、具体的には、レポート結論には、陽性結果Positive、陰性結果Negative、及び臨床的意義が不明なバリアントVUS:Variant of Unknown Significanceの3つの結果がある。
【0036】
そのうち、陽性結果は、対象者に病原性突然変異が見つかったことを示す。この発現は、遺伝的原因の診断、及び遺伝性疾患の可能性の高い又は非常に可能性の高い診断を裏付ける。この情報は、医師と家族に、治療、予後、再発のリスクに関する貴重な情報を提供する。遺伝子検出で陽性結果が出た患者のすべての一親等血縁者(子供、兄弟、両親)は、予測遺伝子検出を受けることができる。家族の一員も陽性であることが判明した場合、その人も遺伝性疾患のリスクにさらされているため、さらなる評価の必要がある。なお、同じ病原性突然変異を有する同じ家族のメンバーの間でも、浸透率が低下し、症状や発症年齢のばらつきが減少する場合がある。
【0037】
陰性結果は、対象者に病原性突然変異が見つからなかったが、遺伝的原因は除外されないことを示し、検査結果が陰性の場合、考えられる理由は次のとおりである。
【0038】
(1)患者の遺伝子突然変異は検査パネルに含まれていなかった。
【0039】
(2)当該患者は遺伝子の一部に検査の対象外となる突然変異を持っていた。
【0040】
(3)患者には遺伝性疾患はなかった。
【0041】
無症状の家族のメンバーの予測検査では陰性結果は同じ検査に関するガイダンス情報がないが、遺伝子検出結果が陰性だった、影響を受けた家族のメンバーは依然として遺伝性疾患のリスクにさらされている可能性があるため、必要に応じて心臓専門医の診断を受ける必要がある。無症状の個体が、遺伝的疾患を持つ家族のメンバーの突然変異について検査で陰性だった場合、その結果は「真陰性」とみなされる。これは、個体が遺伝病のリスクの増加に直面しているのではなく、むしろ一般集団の人々と同じ遺伝性疾患のリスクを抱えていることを意味する。「真陰性」の結果が出た個体では、遺伝性疾患の発症に関する特定の臨床監視が削減される可能性がある。
【0042】
臨床的意義が不明なバリアントVUS結果は、不確実な同定を示す。この場合、このバリアントの病原性の役割を明確に判定できないことを示唆している。場合によっては、他の家族のメンバーの検査がVUSの臨床的有意性を明らかにするのに役立つ場合がある。同じ遺伝病を持つ他の親族に同じバリアントが見つかった場合、そのバリアントが疾患を引き起こす可能性が高くなる。VUSを保有する、影響を受けた家族のメンバーの数が多ければ多いほど、VUSが病気を引き起こす可能性が高くなる。同様に、ある人が明らかな非家族性疾患を患っている場合、VUSが新たに同定されたもの(個体の中に新たに存在し、親から受け継がれたものではない)であることは、その変異が疾患を引き起こす可能性があることを示している。
【0043】
レポートエクスポートユニットは、Web形式のレポートをword及びpdfなどの標準ファイル形式として出力し、具体的には、エクスポートファイルのパスと名前の設定、用紙サイズの設定、フォントの設定、ヘッダーとフッターの設定などを含むエクスポート設定を行うステップ(1)と、word形式をエクスポートし、1つの手段としては、Documentクラスを使用してHTMLファイルをロードするステップaと、Document.save方法を使用してHTMLファイルをWordドキュメントとして保存するステップbとにより実現される、HTMLをdoc、docx、docm形式に直接変換することであり、もう1つの手段としては、Documentクラスのインスタンスを作成するステップaと、DocumentBuilderクラスのインスタンスを作成して、Documentオブジェクトで初期化するステップbと、DocumentBuilder.InsertHtml方法を使用してドキュメントにHTMLを挿入するステップcと、Document.save方法を使用してWordドキュメントを保存するステップdとにより実現される、HTML文字列に基づいてWordを動的に生成することであり、さらなる手段としては、URLクラスのインスタンスを作成して、必要なURLで初期化するステップaと、InputStreamオブジェクトにおいてURLを開くステップbと、HtmlLoadOptionsクラスのインスタンスを作成するステップcと、Documentクラスのインスタンスを作成して、InputStreamオブジェクトとHtmlLoadOptionsオブジェクトを使用して初期化するステップdと、Document.save方法を使用してWebページをWordドキュメントとして保存するステップeとにより実現される、レポートのurlに基づいてWebページをWordに変換することである、ステップ(2)と、オープンソースプロジェクトiTextを使用してpdf形式をエクスポートし、重要なステップには、com.lowagie.text.Documenオブジェクトのインスタンスを作成するステップaと、ライターWriterを作成してdocumentオブジェクトに関連付け、ライターWriterによってドキュメントをディスクに書き込むステップbと、ドキュメント属性を設定し、ドキュメントを開く前に、関連する方法を呼び出して、ドキュメントのタイトル、テーマ、著者、キーワード、バインド方式、作成者、作成日などを設定するステップcと、ドキュメントを開くステップdと、Phrase、Paragraph、Table、Graphicsオブジェクトを含むコンテンツオブジェクトをドキュメントに追加するステップeと、ドキュメントを閉じるステップfと、が含まれる、ステップ(3)と、を含む。
図1
【手続補正書】
【提出日】2024-07-16
【手続補正1】
【補正対象書類名】特許請求の範囲
【補正対象項目名】全文
【補正方法】変更
【補正の内容】
【特許請求の範囲】
【請求項1】
遺伝性心疾患の遺伝子支援診断システムの動作方法であって、
前記遺伝子支援診断システムは、順次接続された、検査対象遺伝子選択モジュール、変異部位同定モジュール、変異部位アノテーションモジュール、変異部位病原性分析モジュール、及びレポート生成モジュールを有し、
前記検査対象遺伝子選択モジュールは、文献分析及び遺伝専門家の知識と経験に基づいて、遺伝性心疾患を5個の主要カテゴリーと15個のサブカテゴリーに分類し、主要カテゴリーによって各遺伝性心疾患に対応する検出対象遺伝子リストを決定し、
前記変異部位同定モジュールは、検査対象候補遺伝子の配列決定データを分析し、シーケンサーに使用されるキットによって、指定された染色体ROI間隔から潜在的な病原性変異部位を同定し、分析過程には、配列アラインメント及びマッピングユニット、配列データ前処理ユニット、及び変異部位同定ユニットが含まれ、
前記変異部位アノテーションモジュールは、同定された変異部位にアノテーションを付け、分析過程には、vcfファイル分析ユニット、遺伝子情報アノテーションユニット、塩基及びアミノ酸変化情報アノテーションユニット、スプライシング変異部位情報アノテーションユニット、及びDBNSFPデータベースに基づく変異部位情報アノテーションユニットが含まれ、
前記変異部位病原性分析モジュールは、家族又は個体を単位にして、被検者の全遺伝的変異部位の病原性を分類して分析し、分析過程には、リソースファイル前処理ユニット、変異部位病原性判別ユニット、及び変異部位病原性分類ユニットが含まれ、
前記レポート生成モジュールは、患者情報、医師情報、検出サンプル情報、配列決定データ情報、病原性部位情報、及び文献情報を読み取って分析することによってさまざまな詳細レベルの中英バイリンガル検出分析レポートを自動的に生成し、その過程には、データ抽出ユニット、レポート生成ユニット、レポート解釈ユニット、及びレポートエクスポートユニットが含まれる、ことを特徴とする遺伝性心疾患の遺伝子支援診断システムの動作方法。
【請求項2】
前記検査対象遺伝子選択モジュールは、遺伝性心疾患分類ユニットと検査対象遺伝子リストユニットを含み、前記遺伝性心疾患分類ユニットは、遺伝性心疾患を遺伝性心筋症Cardiomyopathies、遺伝性大動脈疾患Aortopathies、遺伝性不整脈Inheritedarrthymias、家族性高コレステロール血症Familialhypercholesterolaemia、及び肺高血圧症Pulmonaryarterialhypertensionの5個の主要タイプに分け、
前記遺伝性心筋症は、拡張型心筋症DCM、肥大型心筋症HCM、不整脈源性右室心筋症ARVC、及び左室緻密化障害LVNC心筋症に細分化され、
前記遺伝性大動脈疾患は、マルファン症候群Marfans、ロイス・ディーツ症候群LoeysDietz、及び結合組織病CCTDに細分化され、
前記遺伝性不整脈は、QT延長症候群LQTS、QT短縮症候群SQTS、ブルガダ症候群Brugada、心臓伝導疾患CCD、及びカテコラミン誘発多形性心室頻拍CVPTに細分化され、
前記検査対象遺伝子リストユニットは、遺伝性心疾患の分類に基づいており、関連する心疾患に対応する検査対象遺伝子リストは遺伝学専門家により提供され、前記拡張型心筋症DCMに対応する遺伝子リストは、LMNA、SCN5A、ACTC1、DES、SGCD、MYH7、TNNT2、TPM1、TTN、VCL、MYBPC3、PLN、LDB3、ACTN2、CSRP3、MYH6、ABCC9、TNNC1、TCAP、EYA4、TMPO、FCMD、DMD、Tafazzin、TNNI3、DNAJC19、BAG3、DSP、RYR2、LMNA、NEXN、RBM20、DSG2であり、
前記肥大型心筋症HCMに対応する遺伝子リストは、ACTC1、CSRP3、MYBPC3、MYH6、MYH7、MYL2、MYL3、TCAP、TNNC1、TNNI3、TNNT2、TPM1、TTN、MYLK2、PRKAG2、MYOZ2であり、
前記不整脈源性右室心筋症ARVCに対応する遺伝子リストは、DSC2、DSG2、DSP、PKP2、TGFB3、RYR2、TMEM43、JUPであり、
前記左室緻密化障害LVNC心筋症に対応する遺伝子リストは、ACTC1、CASQ2、LDB3、LMNA、MYBPC3、MYH7、PLN、TAZ、TNNT2、TPM1、DTNAであり、
前記QT延長症候群LQTSに対応する遺伝子リストは、KCNQ1、SCN4B、KCNH2、SCN5A、ANK2、KCNE1、KCNE2、KCNJ2、CACNA1C、CAV3、AKAP9、SNTA1であり、
前記QT短縮症候群SQTSに対応する遺伝子リストは、KCNH2、KCNQ1、TMEM43であり、
前記ブルガダ症候群に対応する遺伝子リストは、SCN5A、GPD1L、CACNA1C、CACNB2、SCN1B、KCNE3、SCN3B、HCN4、KCNJ8、MOG1、KCND3、KCNE5であり、
前記心臓伝導疾患CCDに対応する遺伝子リストは、RYR2、SCN5A、TRPM4であり、
前記カテコラミン誘発多形性心室頻拍CVPTに対応する遺伝子リストは、RYR2、CASQ2であり、
前記マルファン症候群Marfans、ロイス・ディーツ症候群LoeysDietz、結合組織病CCTDに対応する遺伝子リストは、FBN1、TGFBR1、TGFBR2、COL3A1、MYH11、ACTA2、SMAD3、MYLK、GLUT10、EFEMP2であり、
前記家族性高コレステロール血症FHに対応する遺伝子リストは、APOB、LDLR、LDLRAP1、PCSK9であり、
前記肺高血圧症PAHに対応する遺伝子リストは、ACVRL1、BMPR2、CAV1、ENG、SMAD9である、ことを特徴とする請求項1に記載の遺伝性心疾患の遺伝子支援診断システムの動作方法。
【請求項3】
前記変異部位同定モジュールの配列アラインメント及びマッピングユニットは、fastq形式の配列決定生データを受信し、BWA-MEMアルゴリズムを利用して、70bp-1Mbpクエリ配列をBWA-MEMアルゴリズムに合わせて、マルチスレッド方法により配列アラインメント及びマッピング過程を促進し、bam形式のファイルを出力し、
前記変異部位同定モジュールの配列データ前処理ユニットは、bam形式のファイルを入力、処理済みのbam形式のファイルを出力とし、PicardのAddOrReplaceReadGroups方法によりreadsグループ情報をマッピング後のbamファイルに付加するステップ(1)と、PicardのMarkDuplicate方法により反復readsをマークすることで、PCR増幅のデータ生成ステップによる偏差を低減させるステップ(2)と、後の変異同定を容易にするために、配列をPicardでソートするステップ(3)と、Indelsの塩基品質スコア再校正BQSRを行うことで、シーケンサーの系統誤差を調整するステップ(4)と、を含み、
前記変異部位同定モジュールの変異部位同定ユニットは、参照ゲノムに対する変異部位を識別して、各変異部位の遺伝子型を算出し、配列データ前処理ユニットにより出力されたbamファイルを入力、変異部位を含むvcf形式のファイルを出力とし、GATKを使用して、GVCFモードで各サンプルに対してHaplotypeCaller方法を個別に実行し、GVCF中間ファイル形式を生成するステップ(1)と、GATKのGenotypeGVCFs方法を使用して単一サンプルGVCFファイルと組み合わせて、マルチサンプルのvcfファイルを生成するステップ(2)と、GATKのSelectVariants方法を使用してSNPsとINDELsを区別するステップ(3)と、GATKのVariantRecalibrator及びApplyRecalibration方法を使用して遺伝的変異に対して品質スコア再校正VQSRを行うことで、変異部位をフィルタリングするステップ(4)と、GATKのCombineVariants方法を使用してSNPsとINDELsをまとめてvcfファイルに出力するステップ(5)と、を含む、ことを特徴とする請求項2に記載の遺伝性心疾患の遺伝子支援診断システムの動作方法。
【請求項4】
前記変異部位アノテーションモジュールは、変異部位情報にアノテーションを付けることに用いられ、変異部位同定ユニットにより生成されたファイルを入力、アノテーションを付けたtxt形式の変異部位情報ファイルを出力と、変異部位同定ユニットにより生成されたvcfファイルを分析し、変異部位が存在する染色体CHROM、部位座標POS、参照配列塩基REF、変異配列塩基ALT、部位カバレッジDP、参照配列カバレッジRO、変異配列カバレッジAO、及び遺伝子型情報GTを取得し、一時ファイルinput.txt及びcoverage.txtを生成するステップ(1)と、
遺伝子情報にアノテーションを付けるステップであって、まず、前処理された遺伝子エクソンファイルsorted_compiled_exon.bed、イントロンファイルintron.bed、utr3ファイルutr3.bed、utr5ファイルutr5.bed、上流ファイルupstream1000.bed、下流ファイルdownstream1000.bed、「スクリプトン-遺伝子」ファイルtranscript_to_gene.txt、及び「タンパク質アノテーション」ファイルprotein_annotation.txtを含む、遺伝子アノテーションリソースライブラリファイルを読み取り、次に、ステップ(1)で生成されたinput.txtファイル及び読み取られた遺伝子アノテーションリソースライブラリファイル中のデータに基づいて、変異が発生したエリアとして、イントロンintronエリア、エクソンexonエリア、utr5又はutr3を算出し、一時ファイルannotation.txtを生成するステップ(2)と、
塩基及びアミノ酸変化情報にアノテーションを付けるステップであって、まず、コードエリアファイルallcds.bed、HGNCに対応する塩基配列ファイルsequence.txt、アミノ酸に対応する略語ファイルaminoacid.txtを読み取り、次に、コードエリアファイルallcds.bed中のスクリプトン番号、部位開始座標及び部位終了座標に基づいて、エクソンエリアに変異が発生した場合、エクソン番号を算出し、それ以外の場合、NAを出力し、さらに変異が発生したエリアに応じて、SynonymousSNP、NonsynonymousSNP、IntronSNP、Utr5SNP、Utr3SNP、IntronDeletion、IntronInsertion、FrameshiftDeletion、In-FrameDeletion、StopGain、及びUnknownを含む当該変異のタイプを算出し、さらにエクソンエリアの変異の場合、塩基変化情報及びアミノ酸変化情報を算出し、塩基及びアミノ酸変化情報アノテーション一時ファイルhgvs_annotation.txtを生成するステップ(3)と、
スプライシング変異部位情報にアノテーションを付けるステップであって、まず、(3)で生成されたファイルhgvs_annotation.txt及び前処理された遺伝子エクソンファイルsorted_compiled_exon.bed及びコードエリアファイルallcds.bedを読み取り、変異部位の開始位置と終了位置を境界として、さらに境界から5bp以内に潜在的なスプライシング変異部位があるか否かを確認し、開始位置と終了位置にそれぞれ5を加算及び減算して、境界エリアをs1、e1、s2、e2と命名した4つのセグメントに分割し、その後、s1、e1エリアがスプライシング部位であるか否か、s2、e2エリアがスプライシング部位であるか否かをそれぞれ判断し、スプライシング部位であれば、さらに該スプライシング部位の塩基変化情報を出力し、一時ファイルspliced_hgvs_annotation.txtを生成するステップ(4)と、
dbnsfpデータベースの変異部位情報アノテーションに基づいて、まず、(4)で生成されたファイルspliced_hgvs_annotation.txt及びフィルタリングされたdbnsfpデータファイルfilterbased_dbnsfp.txtを読み取り、次に、spliced_hgvs_annotation.txtとfilterbased_dbnsfp.txtとのアラインメントを行い、SIFT、Polyphen、LRT、MutationTaster、FATHMM、CAD、MetaSVM、及びClinvar計算ツールによって予測可能な変異部位の病原性結果とスコアを取得し、さらに、1000Gp3_AFR_AF、1000Gp3_EUR_AF、1000Gp3_AMR_AF、1000Gp3_EAS_AF、1000Gp3_SAS_AF、ESP6500_EA_AF、ExAC_Adj_AF、ExAC_AFR_AF、ExAC_AMR_AF、ExAC_EAS_AF、ExAC_FIN_AF、ExAC_NFE_A、及びExAC_SASを含む、集団内の変異部位のアノテーション情報を取得するとともに、該変異部位の希少性をマークし、一時ファイルを生成して、popgen_filtering_spliced_hgvs_annotation.txtと命名するステップ(5)と、
カバレッジ情報にアノテーションを付けるステップであって、(1)で生成されたcoverage.txtファイルを読み取り、Total_Coverage、Ref_Coverage、Alt_Coverage、及びGenotypeの情報を含む変異部位のカバレッジ情報を付加し、最終的なアノテーションファイルannotation.txtを生成するステップ(6)と、を含む、ことを特徴とする請求項1に記載の遺伝性心疾患の遺伝子支援診断システムの動作方法。
【請求項5】
前記変異部位病原性分析モジュールのリソースファイル前処理ユニットは、様々なデータリソースを前処理し、すべての分析対象の外部リソースファイルを読み取り、処理する必要のないデータをフィルタリングして、病原性判別及びモジュールの処理性能をさらに向上させることに用いられ、Lost of Function遺伝子リストを読み取り、ミスセンス遺伝子リストを読み取るステップ(1)と、遺伝的変異の病原性染色体、開始座標、塩基変化、アミノ酸変化、及び対応する遺伝子名を含む、Clinvarデータベース内のすべての病原性の変異情報を読み取るステップ(2)と、OMIM番号に対応する遺伝子名、劣性遺伝病のOMIM番号リスト、優性遺伝病のOMIM番号リスト、及びOMIM番号に対応するOrpha番号リストを含む、OMIMデータベース関連情報を読み取るステップ(3)と、染色体番号、hg19での位置、SNP番号、参照対立遺伝子、及び置換対立遺伝子を含む、PS4に関連する変異情報をgwasdbから取得するステップ(4)と、PM1判断のための良性タンパク質ドメインを読み取り、BP1遺伝子リストを読み取り、遺伝子名を取得し、具体的には、染色体番号、開始位置、及び終了位置を含む、PM4及びBP3の判断のためのrmsk範囲を読み取り、BS2の判断のためのヘテロ接合体及びホモ接合体の情報を読み取るステップ(5)と、染色体番号、位置、参照対立遺伝子、置換対立遺伝子、adaスコア、rfスコアを含む、dbscSNVデータ情報をロードするステップ(6)と、を含み、
前記変異部位病原性分析モジュールの変異部位病原性判別ユニットは、ACMGの28項の基準に従ってSNPを判定し、データファイル中の各前記変異部位における全判別項目の値を算出し、各判別項目について採点を行い、スコアに従って全判別項目を集計し、その集計に応じてすべての遺伝的変異の病原性を分類することに用いられ、算出可能な判別項目は、PVS1、PS1、PS4、PM1、PM2、PM4、PM5、PP2、PP3、PP5、BS1、BS2、BP1、BP3、BP4、BP6、BP7、及びBA1を含み、具体的には、(1)判別項目PVS1に対して、まず、変異部位が存在する遺伝子がLost of Functionリストに含まれているか否かを確認し、次に、変異部位のアノテーション情報を確認し、ナンセンス変異、フレームシフト変異、+/-1又は+/-2スプライシング部位、開始コドン、1つ又は複数のエクソン欠失の場合、PVS1が成り立ち、その値は1とされ、(2)判別項目PS1に対して、以前に病原性があると判定された変異と同じアミノ酸変化があるか否かを判断し、点突然変異SNPがスプライシングに影響を与えるか否かをさらに判定し、(3)判別項目PM2に対して、公開されているSAP、1000Genome、及びExACデータベース内の対照集団の割合を参照し、東南アジアの対照集団に関するデータを追加し、(4)判別項目PM4に対して、UCSCゲノムブラウザにおいてRMSKデータベースを検索し、変異が非反復エリアの非フレームシフトINDELである場合、又は変異タイプがStopLossである場合、PM4が成り立ち、その値は1とされ、それ以外の場合、その値は0とされ、(5)判別項目BP3に対して、UCSCゲノムブラウザにおいてRMSKデータベースを検索し、変異が反復エリアの非フレームシフトINDELである場合、BP3が成り立ち、その値は1とされ、それ以外の場合、その値は0とされ、(6)判別項目PM5に対して、まず、変異のタイプを確認し、ミスセンス変異の場合、ロードされたClinvar病原性変異データにその変異が存在するか否かをさらに確認し、次に、当該変異が異なるアミノ酸変化を引き起こすか否かを確認し、異なるアミノ酸変化を引き起こす場合、PM5が成り立ち、その値は1とされ、それ以外の場合、その値は0とされ、(7)判別項目BP7に対して、保存性を確認し、同義変異がスプライシングに影響を与えず、かつヌクレオチドの位置が高度に保存されていない場合、その変異を良性のものと分類し、BP7が成り立ち、その値は1とされ、変異がスプライシングに影響を与えないと予測した場合、dbscSNV_RF_SCORE及びdbscSNV_ADA_SCOREの両方が0.6未満である必要があり、ヌクレオチド保存性の予測はdbnsfp30aデータベースから検出したものであり、ヌクレオチドが高度に保存されていることを示すために、2を超えるGERP++スコアが必要であり、
前記変異部位病原性分析モジュールの病原性分類ユニットは、変異部位病原性判別ユニットにより算出された各判別項目の算出結果に基づいて、以下のルールに従って分類を行い、PVS1が1であり、かつPSの数が1以上である、又はPMの数が2以上である、又はPMの数が1であり、かつPPの数が1である、又はPPの数が2以上である場合、分類の結果、病原性のものであり、PSの数が2以上である場合にも、分類の結果、病原性のものであり、PSの数が1であり、PMの数が3以上である場合、分類の結果、病原性のものであり、PSの数が1であり、PMの数が2であり、かつPPの数が2以上である場合、分類の結果、病原性のものであり、PVS1の数が1であり、かつPMの数が1である、又はPSの数が1であり、かつPMの数が1又は2である、又はPSの数が1であり、かつPPの数が2以上である、又はPMの数が3以上であるか、PMの数が2であり、かつPPの数が2以上である場合、分類の結果、病原性である可能性があり、BAの数が1であり、又はBSの数が2以上である場合、分類の結果、良性のものであり、BSの数が1であり、かつBPの数が1である、又はBPの数が2以上である場合、分類の結果、良性である可能性があり、それ以外の場合、分類の結果、有意性が不明であり、さらに病原性の分類結果をannotation.txtファイルに付加し、最終的な分類結果ファイルinterpretation.txtを生成する、ことを特徴とする請求項1に記載の遺伝性心疾患の遺伝子支援診断システムの動作方法。
【請求項6】
前記レポート生成モジュールのデータ抽出ユニットは、検出分析結果から、すべての変異部位の染色体番号、変異部位が存在する塩基位置、参照塩基、変異塩基、遺伝子名、遺伝子型、病原性分類結果、検出遺伝子リスト、及びカバレッジという品質制御データ項目を抽出し、上記で抽出されたデータをレポートのコンテンツとして記入し、
前記レポート生成モジュールのレポート生成ユニットは、データ抽出ユニットによって抽出された情報に基づいて、中国語と英語の両方をサポートする包括レベルの検出・分析レポート及び中国語と英語の両方をサポートする詳細なレベルの検出・分析レポートを生成し、レポート生成ユニットは、単一変異部位のレポート生成とバッチ変異部位のレポート生成をサポートし、単一変異部位のレポート生成とは、ユーザが入力した単一変異部位情報に基づいて、病原性分類ユニット及び情報抽出ユニットから提供される関連データによりレポートを生成することを指し、バッチ変異部位レポートは、病原性分類ユニットによって生成されたファイルinterpretation.txtを読み取ることによって生成され、
前記レポート生成モジュールのレポート解釈ユニットは、レポートのコンテンツと家系メンバーの分析結果を組み合わせて、レポート結論についてのさらなる解釈を提供し、具体的には、
レポート結論には、陽性結果Positive、陰性結果Negative、及び臨床的意義が不明なバリアントVUS:Variant of Unknown Significanceの3つの結果があり、
前記陽性結果は、対象者に病原性突然変異が見つかったことを示し、前記陰性結果は、対象者に病原性突然変異が見つからなかったが、遺伝的原因は除外されないことを示し、前記臨床的意義が不明なバリアントは、不確実な同定を示し、
前記レポート生成モジュールのレポートエクスポートユニットは、Webページ形式のレポートをWord又はPDFの標準ファイル形式として出力する、ことを特徴とする請求項1に記載の遺伝性心疾患の遺伝子支援診断システムの動作方法。
【請求項7】
前記中国語と英語の両方をサポートする包括レベルの検出・分析レポートの具体的な生成ステップは、(1)レポートの構造とスタイルを設定し、HTMLタグを使用してレポート構造を定義し、CSSを使用してレポートのスタイルを設定し、レポート構造には、検出レポート基本情報エリア、検出結果エリア、レポート結論エリア、及びサンプル品質制御エリアの4つのサブ構造が含まれ、(2)レポートコンテンツを記入し、検出結果エリアに被検者の変異部位情報を記入して、その変異部位が遺伝性心疾患の疑いと関連しているか否かの分析結果を表示し、レポート結論エリアでは、検出結果データの分析を通じてレポート結論を示し、家系メンバーの検出結果がある場合、結論の生成には家系メンバーの検出結果も考慮し、具体的な判断ルールはレポート解釈ユニットで説明し、さらにデータベースから医師の電子署名を抽出し、レポート結論の関連エリアに署名し、サンプル品質制御エリアに疾患に対応する候補検出遺伝子及びカバレッジ情報を記入する、ことを特徴とする請求項6に記載の遺伝性心疾患の遺伝子支援診断システムの動作方法。
【請求項8】
前記中国語と英語の両方をサポートする詳細なレベルの検出・分析レポートの具体的な生成ステップは、(1)レポートの構造とスタイルを設定し、HTMLタグを使用してレポート構造を定義し、CSSを使用してレポートのスタイルを設定し、レポート構造には、分析結果表示エリア、病原性分類結果の可視化表示エリア、及び分析結果の裏付け証拠エリアという3つのサブ構造が含まれ、(2)レポートコンテンツを記入し、分析結果表示エリアには、遺伝的変異部位の病原性分類結果、対応する遺伝子名、変異タイプ、HGVSコードDNA変化、HGVSアミノ酸変化、変異部位染色体、及び塩基位置を記入し、病原性分類結果の可視化表示エリアには、病原性分類の関連指標項目を表及び異なる色で表示し、分析結果の裏付け証拠エリアには、関連裏付け証拠データを表示し、この関連裏付け証拠データには、病原性分類指標のうちのBS1、PM2、PS4を裏付けるための集団証拠データと、SIFT、MutationTaster、MutationAccessor、Polyphen、LRT、FATHMM、及びCADDツールを含み、分類指標のうちのBP1、BP3、BP4、PP3、PM4、PM5、PS1、PVS1を裏付けるための病原性算出及び予測ツール裏付け証拠データと、分類指標のうちのBS3、PP1、PP2、PM1、PS3を裏付けるための機能的証拠データと、追加の証拠データと、参照文献と、が含まれる、ことを特徴とする請求項6に記載の遺伝性心疾患の遺伝子支援診断システムの動作方法。
【請求項9】
前記レポートエクスポートユニットの具体的な動作ステップは、(1)エクスポートファイルのパスと名前の設定、用紙サイズの設定、フォントの設定、ヘッダーとフッターの設定を含むエクスポート設定を行い、(2)word形式をエクスポートし、1つの手段としては、Documentクラスを使用してHTMLファイルをロードするステップaと、Document.save方法を使用してHTMLファイルをWordドキュメントとして保存するステップbとにより実現される、HTMLをdoc、docx、docm形式に直接変換することであり、もう1つの手段としては、Documentクラスのインスタンスを作成するステップaと、DocumentBuilderクラスのインスタンスを作成して、Documentオブジェクトで初期化するステップbと、DocumentBuilder.InsertHtml方法を使用してドキュメントにHTMLを挿入するステップcと、Document.save方法を使用してWordドキュメントを保存するステップdとにより実現される、HTML文字列に基づいてWordを動的に生成することであり、更なる手段としては、URLクラスのインスタンスを作成して、必要なURLで初期化するステップaと、InputStreamオブジェクトにおいてURLを開くステップbと、HtmlLoadOptionsクラスのインスタンスを作成するステップcと、Documentクラスのインスタンスを作成して、InputStreamオブジェクトとHtmlLoadOptionsオブジェクトを使用して初期化するステップdと、Document.save方法を使用してWebページをWordドキュメントとして保存するステップeとにより実現される、レポートのurlに基づいてWebページをWordに変換することであり、(3)オープンソースプロジェクトiTextを使用してpdf形式をエクスポートし、重要なステップには、com.lowagie.text.Documenオブジェクトのインスタンスを作成するステップaと、ライターWriterを作成してdocumentオブジェクトに関連付け、ライターWriterによってドキュメントをディスクに書き込むステップbと、ドキュメント属性を設定し、ドキュメントを開く前に、関連する方法を呼び出して、ドキュメントのタイトル、テーマ、著者、キーワード、バインド方式、作成者、作成日を設定するステップcと、ドキュメントを開くステップdと、Phrase、Paragraph、Table、Graphicsオブジェクトを含むコンテンツオブジェクトをドキュメントに追加するステップeと、ドキュメントを閉じるステップfと、が含まれる、ことを特徴とする請求項6に記載の遺伝性心疾患の遺伝子支援診断システムの動作方法。