(19)【発行国】日本国特許庁(JP)
(12)【公報種別】公開特許公報(A)
(11)【公開番号】P2024152565
(43)【公開日】2024-10-25
(54)【発明の名称】遺伝性疾患の予測及び疾病誘発に関わる遺伝的バリアントの発掘システム及び方法
(51)【国際特許分類】
G16H 50/50 20180101AFI20241018BHJP
【FI】
G16H50/50
【審査請求】有
【請求項の数】8
【出願形態】OL
(21)【出願番号】P 2023180434
(22)【出願日】2023-10-19
(31)【優先権主張番号】10-2023-0049291
(32)【優先日】2023-04-14
(33)【優先権主張国・地域又は機関】KR
(71)【出願人】
【識別番号】521229072
【氏名又は名称】スリービリエン
【氏名又は名称原語表記】3BILLION
【住所又は居所原語表記】14th floor, yeonbong building, 416, Teheran-ro, Gangnam-gu Seoul 06193, Republic of Korea
(74)【代理人】
【識別番号】110002262
【氏名又は名称】TRY国際弁理士法人
(72)【発明者】
【氏名】イ キョンヨル
(72)【発明者】
【氏名】キム ホホン
(72)【発明者】
【氏名】ベク ジュヨプ
【テーマコード(参考)】
5L099
【Fターム(参考)】
5L099AA01
(57)【要約】 (修正有)
【課題】遺伝性疾患の予測及び疾病誘発に関わる遺伝的バリアントの発掘システムを提供する。
【解決手段】遺伝性疾患の予測及び疾病誘発に関わる遺伝的バリアントの発掘システム1000は、患者の遺伝的バリアントの情報であるインスタンス(instance)と、前記インスタンスのバッグ(bag)とを入力データで学習し、患者の疾病が遺伝的バリアントによる遺伝性疾患であるか否かをバッグラベル(bag label)で処理する多重インスタンス学習モデル(Multiple instance learning Model)を用いて、患者の遺伝性疾患の予測と、疾病誘発に関わる遺伝的バリアントの発掘と、を共に導出する多重インスタンス学習モデル部を含む。
【選択図】
図3
【特許請求の範囲】
【請求項1】
患者の遺伝的バリアントの情報であるインスタンス(instance)と、前記インスタンスのバッグ(bag)とを入力データで学習し、患者の疾病が遺伝的バリアントによる遺伝性疾患であるか否かをバッグラベル(bag label)で処理する多重インスタンス学習モデル(Multiple instance learning Model)を用いて、患者の遺伝性疾患の予測と、疾病誘発に関わる遺伝的バリアントの発掘と、を共に導出する多重インスタンス学習モデル部
を含む、遺伝性疾患の予測及び疾病誘発に関わる遺伝的バリアントの発掘システム。
【請求項2】
アテンションメカニズム(Attention mechanism)を用いて、前記インスタンスが患者の遺伝性疾患の予測に寄与した程度であるアテンション加重値(Attention weight)を生成し、前記インスタンスに対する前記アテンション加重値を反映して、前記入力データを加工処理する入力データ加工部
を含む、請求項1に記載の遺伝性疾患の予測及び疾病誘発に関わる遺伝的バリアントの発掘システム。
【請求項3】
前記入力データ加工部は、
前記インスタンスの各々を、各々の神経網を用いて同じ次元の低次元ベクトルで埋め込みした後、加重値の行列と活性化関数とを用いて一つの多様体(manifold)上に射影(projection)させて、同じ埋め込みベクトルを求める遺伝的バリアント情報埋め込み部と、
前記埋め込みベクトルに対するアテンション加重値をアテンションメカニズムを用いて生成し、前記埋め込みベクトルを一つとして取り扱うプーリング(pooling)過程を行う遺伝的バリアント情報プーリング部と、
を含む、請求項2に記載の遺伝性疾患の予測及び疾病誘発に関わる遺伝的バリアントの発掘システム。
【請求項4】
既に設定された基準以上であれば、患者の疾病が遺伝的バリアントによる遺伝性疾患と判別し、この際、前記インスタンスのアテンション加重値を用いて、患者の疾病を誘発する疾病誘発に関わる遺伝的バリアントを発掘する、疾病及び誘発に関わる遺伝的バリアント判別部
を含む、請求項3に記載の遺伝性疾患の予測及び疾病誘発に関わる遺伝的バリアントの発掘システム。
【請求項5】
前記多重インスタンス学習モデルは、ベクトルのサイズが多様な入力データを用いる多重入力モデル(Multi-input model)である
ことを特徴とする、請求項1に記載の遺伝性疾患の予測及び疾病誘発に関わる遺伝的バリアントの発掘システム。
【請求項6】
前記インスタンスのアテンション加重値を用いて、前記インスタンスに対するインスタンスラベルを生成し、生成された前記インスタンスラベルを用いて前記多重インスタンス学習モデルを再学習させる
ことを特徴とする、請求項4に記載の遺伝性疾患の予測及び疾病誘発に関わる遺伝的バリアントの発掘システム。
【請求項7】
入力データ加工処理部が、患者の遺伝的バリアントの情報であるインスタンス(instance)と、前記インスタンスのバッグ(bag)とを入力データにし、アテンションメカニズムを用いて、前記インスタンスに対するアテンション加重値を生成し、前記入力データを加工処理する入力データ加工処理ステップと、
多重インスタンス学習モデル部が、多重インスタンス学習モデルを用いて、患者の疾病が遺伝性疾患であるか否かを予測する遺伝性疾患の有無の予測ステップと、
疾病及び誘発に関わる遺伝的バリアント判別部が、患者の疾病が遺伝性疾患と判断されれば、前記インスタンスに対するアテンション加重値を用いて、患者の疾病を誘発する疾病誘発に関わる遺伝的バリアントを発掘する、疾病誘発に関わる遺伝的バリアントの発掘ステップと、
を含む、遺伝性疾患の予測及び疾病誘発に関わる遺伝的バリアントの発掘方法。
【請求項8】
患者の疾病が遺伝性疾患と判断されれば、前記インスタンスのアテンション加重値を用いて、インスタンスラベルを生成し、生成された前記インスタンスラベルを用いて、多重インスタンス学習モデルを再学習させる再学習ステップ
を更に含む、請求項7に記載の遺伝性疾患の予測及び疾病誘発に関わる遺伝的バリアントの発掘方法。
【発明の詳細な説明】
【技術分野】
【0001】
本発明は、遺伝性疾患の予測及び疾病誘発に関わる遺伝的バリアントの発掘システム及び方法に関し、特に、多重インスタンス学習を用いて、患者の疾病が遺伝性疾患であるか否かを判別し、且つ、患者の多くの遺伝的バリアントのうち、疾病を誘発する疾病誘発に関わる遺伝的バリアントを発掘する、遺伝性疾患の予測及び疾病誘発に関わる遺伝的バリアントの発掘システム及び方法に関する。
【背景技術】
【0002】
遺伝性疾患とは、遺伝子または染色体の変異により発生する疾病を意味する。疾病誘発に関わる遺伝的バリアントは、遺伝性疾患の原因となる遺伝子変異を意味する。
【0003】
人間の遺伝的バリアントの解釈は、多くの遺伝的バリアントのうち、何れか一つ以上の疾病誘発に関わる遺伝的バリアントを探る過程である。
【0004】
一般的に、疾病誘発に関わる遺伝的バリアントを確認するために、特定の疾病を有している患者(Case)のゲノム情報と、元気な一般人(Control)のゲノム情報と、を比較し、Controlに比べてCaseから有意に多く見当たる遺伝的バリアントを確認する方式が利用されている。
【0005】
近来、人工知能を用いて、患者の疾病が遺伝性疾患であるか否かを判断するか、又は患者の疾患の原因となる疾病誘発に関わる遺伝的バリアントを探索する研究が施されている。
【0006】
単一インスタンス学習(single instance learning)を用いて、患者の遺伝的バリアントの各々に対して、患者の疾病に対する疾病誘発に関わる遺伝的バリアントを予測するための研究が施されているが、このような単一インスタンス学習は、各々の遺伝的バリアントに対するラベル(インスタンスラベル)が必要であり、現実的には使用が制限されている。
【0007】
本発明は、多重インスタンス学習(Multiple instance learning、MIL)モデルを用いて、患者の疾病が遺伝性疾病であるか否か、且つ多くの遺伝的バリアントのうち、疾病誘発に関わる遺伝的バリアントの判別とを同時に行う方法を提示する。
【発明の概要】
【発明が解決しようとする課題】
【0008】
本明細書は、多重インスタンス学習を用いて、患者の疾病が遺伝性疾患であるか否か、且つ患者の多くの遺伝子変異のうち、疾病を誘発する疾病誘発に関わる遺伝的バリアントの判別を同時に行う、遺伝性疾患の予測及び疾病誘発に関わる遺伝的バリアントの発掘システム及びその方法を提供する。
【課題を解決するための手段】
【0009】
このような課題を解決するために、本発明の実施例による遺伝性疾患の予測及び疾病誘発に関わる遺伝的バリアントの発掘システムは、患者の遺伝的バリアントの情報であるインスタンス(instance)と、前記インスタンスのバッグ(bag)とを入力データで学習し、患者の疾病が遺伝的バリアントによる遺伝性疾患であるか否かをバッグラベル(bag label)で処理する多重インスタンス学習モデル(Multiple instance learning Model)を用いて、患者の遺伝性疾患の予測と、疾病誘発に関わる遺伝的バリアントの発掘と、を共に導出する多重インスタンス学習モデル部を含む。
【0010】
アテンションメカニズム(Attention mechanism)を用いて、前記インスタンスが患者の遺伝性疾患の予測に寄与した程度であるアテンション加重値(Attention weight)を生成し、前記インスタンスに対する前記アテンション加重値を反映して、前記入力データを加工処理する入力データ加工部を含むことができる。
【0011】
前記入力データ加工部は、前記インスタンスの各々を、各々の神経網を用いて同じ次元の低次元ベクトルで埋め込みした後、同じ加重値の行列を用いて一つの多様体(manifold)上に射影(projection)させて、同じ埋め込みベクトルを求める遺伝的バリアント情報埋め込み部と、前記埋め込みベクトルに対するアテンション加重値をアテンションメカニズムを用いて生成し、前記埋め込みベクトルを一つとして取り扱うプーリング(pooling)過程を行う遺伝的バリアント情報プーリング部と、を含むことができる。
【0012】
既に設定された基準以上であれば、患者の疾病が遺伝的バリアントによる遺伝性疾患と判別し、この際、前記インスタンスのアテンション加重値を用いて、患者の疾病を誘発する疾病誘発に関わる遺伝的バリアントを発掘する、疾病及び誘発に関わる遺伝的バリアント判別部を含むことができる。
【0013】
前記多重インスタンス学習モデルは、ベクトルのサイズが多様な入力データを用いる多重入力モデル(Multi-input model)であり得る。
【0014】
前記インスタンスのアテンション加重値を用いて、前記インスタンスに対するインスタンスラベルを生成し、生成された前記インスタンスラベルを用いて前記多重インスタンス学習モデルを再学習させることができる。
【0015】
本発明の実施例による遺伝性疾患の予測及び疾病誘発に関わる遺伝的バリアントの発掘方法は、入力データ加工処理部が、患者の遺伝的バリアントの情報であるインスタンス(instance)と、前記インスタンスのバッグ(bag)とを入力データにし、アテンションメカニズムを用いて、前記インスタンスに対するアテンション加重値を生成し、前記入力データを加工処理する入力データ加工処理ステップと、多重インスタンス学習モデル部が、多重インスタンス学習モデルを用いて、患者の疾病が遺伝性疾患であるか否かを予測する遺伝性疾患の有無の予測ステップと、疾病及び誘発に関わる遺伝的バリアント判別部が、患者の疾病が遺伝性疾患と判断されれば、前記インスタンスに対するアテンション加重値を用いて、患者の疾病を誘発する疾病誘発に関わる遺伝的バリアントを発掘する、疾病誘発に関わる遺伝的バリアントの発掘ステップと、を含む。
【0016】
患者の疾病が遺伝性疾患と判断されれば、前記インスタンスのアテンション加重値を用いて、インスタンスラベルを生成し、生成された前記インスタンスラベルを用いて、多重インスタンス学習モデルを再学習させる再学習ステップを更に含むことができる。
【発明の効果】
【0017】
本発明は、多重インスタンス学習モデルを用いて、患者の遺伝的バリアントラベル(インスタンスラベル)がなくても、遺伝性疾患であるか否かを判別可能である。
【0018】
さらに、本発明は、アテンションメカニズムを用いて生成された患者の遺伝的バリアントに対するアテンション加重値を用いて、患者の疾病誘発に関わる遺伝的バリアントを発掘することができる。
【0019】
さらに、本発明は、患者の遺伝的バリアントラベル(インスタンスラベル)がなくても、アテンションメカニズムと多重インスタンス学習モデルを用いることで、患者の遺伝性疾患の有無及び疾病誘発に関わる遺伝的バリアントの判別を同時に行うことができる。
【0020】
さらに、本発明は、アテンション加重値を用いて、患者の遺伝的バリアントラベル(インスタンスラベル)を生成し、生成されたインスタンスラベルを用いて多重インスタンス学習モデルを再学習させることで、多重インスタンス学習モデルの性能を向上させることができる。
【図面の簡単な説明】
【0021】
【
図1】本発明の一実施例に係る遺伝性疾患の予測及び疾病誘発に関わる遺伝的バリアントの発掘システム、入力データ、及び出力データの構成図である。
【
図2】本発明の一実施例に係る遺伝性疾患の予測及び疾病誘発に関わる遺伝的バリアントの発掘システム、入力データ、及び出力データの構成図である。
【
図3】本発明の一実施例に係る遺伝性疾患の予測及び疾病誘発に関わる遺伝的バリアントの発掘システムの構成図である。
【
図4】本発明の一実施例に係る遺伝性疾患の予測及び疾病誘発に関わる遺伝的バリアントの発掘システムの遂行過程を説明するための図である。
【
図5】本発明の一実施例に係る遺伝性疾患の予測及び疾病誘発に関わる遺伝的バリアントの発掘システムを用いた疾病誘発に関わる遺伝的バリアントの発掘テスト結果に関する図である。
【
図6】本発明の一実施例に係る遺伝性疾患の予測及び疾病誘発に関わる遺伝的バリアントの発掘方法についてのフローチャートである。
【発明を実施するための形態】
【0022】
本明細書において記述されている「含む」または「有する」などの用語は、一つ又はそれ以上の他の特徴や数字、ステップ、動作、構成要素、部分品、またはこれらを組み合わせたものの存在または付加可能性を予め排除しないものと理解すべきである。
【0023】
本明細書において、単数型は本文において特別に言及されていない限り、複数形も含む。例えば、インスタンス(instance)は単数に記載しているが、複数形も含まれる。
【0024】
以下の添付図面を参考しながら、前述した問題点を解決するために考案された本発明の好適な実施例について詳細に説明する。
【0025】
図1及び
図2は、本発明の一実施例に係る遺伝性疾患の予測及び疾病誘発に関わる遺伝的バリアントの発掘システム、入力データ、及び出力データの構成図である。
【0026】
図1及び
図2を参照すると、本発明の一実施例に係る遺伝性疾患の予測及び疾病誘発に関わる遺伝的バリアントの発掘システム1000は、入力データ100を学習して出力データ200を生成可能である。
【0027】
本発明の一実施例に係る遺伝性疾患の予測及び疾病誘発に関わる遺伝的バリアントの発掘システム1000は、多重インスタンス学習モデル(Multiple instance learning Model)とアテンションメカニズム(Attention mechanism)を用いることができる。
【0028】
多重インスタンス学習モデル(Multiple instance learning Model)は、指導学習の一分類であって、多くのデータポイント(=instance、インスタンス)が一つのバッグ(Bag)に構成されている場合、このようなバッグ(Bag)の分類を扱う学習方法である。
【0029】
本発明による遺伝性疾患の予測及び疾病誘発に関わる遺伝的バリアントの発掘システム1000は、患者が有している各々の遺伝的バリアントの情報をインスタンスとし、インスタンスのバッグ(bag)を入力データ100で学習し、患者の疾病が遺伝的バリアントによる遺伝性疾患であるか否かをバッグラベル(bag label)にし、バッグラベルを出力データ200にする。この際、多重インスタンス学習モデルは、多様なベクトルサイズの入力データを用いる多重入力モデル(Multi-input model)であり得る。
【0030】
一例として、入力データ100は、患者が有している遺伝的バリアントをインスタンスにし、多様な種類の変異(例えば、SNV、SV、CNVなど)をバッグ(bag)にすることができる。
【0031】
SNV(Single Nucleotide Variant)は、単一塩基変異であって、DNA塩基序列において、一つの塩基が他の塩基に取り替えられることを言う。例えば、CがTに変わる場合、これはC-to-T変異、またはSNP(Single Nucleotide Polymorphism)と知られている。
【0032】
SV(Structural Variant)は、遺伝子内における大きな構造的変化を意味する。このような構造的変化は、大体、二つの部位のDNA塩基序列が移動するか、削除、複製、逆転などが起こる場合に発生する。このような変化は、DNA塩基序列に対して大きな影響を及ぼすことができる。
【0033】
CNV(Copy Number Variant)は、特定のDNA塩基序列が二つ以上の写本として存在する場合を意味する。CNVは、人間の疾病と係わる遺伝的原因とも知られている。
【0034】
この際、本発明による遺伝性疾患の予測及び疾病誘発に関わる遺伝的バリアントの発掘システム1000は、多重インスタンス学習モデル(Multiple instance learning Model)を用いて、患者の疾病が遺伝的バリアントによる遺伝性疾患であるか否かを判別することができ、アテンションメカニズム(Attention mechanism)を用いて疾病誘発に関わる遺伝的バリアントを発掘することができる。すなわち、出力データ200は、患者の疾病が遺伝的バリアントによる遺伝性疾患であるか否か、且つ患者が有する様々な遺伝的バリアントのうち、疾病誘発に関わる遺伝的バリアントの予測結果になり得る。
【0035】
から1までの値に表現されることができ、既に設定された基準値以上であれば、患者の疾病が遺伝的バリアントによる遺伝性疾患として予測可能である。
【0036】
なお、後述するが、アテンションメカニズム(Attention mechanism)を用いて生成された各々の遺伝的バリアントに対するアテンション加重値(Attention weight)で、患者が有している多くの遺伝的バリアントの中から疾病誘発に関わる遺伝的バリアントを予測することができる。
【0037】
図3は、本発明の一実施例に係る遺伝性疾患の予測及び疾病誘発に関わる遺伝的バリアントの発掘システムの構成図であり、
図4は、本発明の一実施例に係る遺伝性疾患の予測及び疾病誘発に関わる遺伝的バリアントの発掘システムの遂行過程を説明するための図である。
【0038】
図3及び
図4を参照すると、本発明の一実施例に係る遺伝性疾患の予測及び疾病誘発に関わる遺伝的バリアントの発掘システム1000は、入力データ加工部1100、多重インスタンス学習モデル部1200、及び疾病及び誘発に関わる遺伝的バリアント判別部1300を含む。
【0039】
入力データ加工部1100は、アテンションメカニズム(Attention mechanism)を用いて、前記インスタンスが患者の遺伝性疾患の予測に寄与した程度であるアテンション加重値(Attention weight)を生成し、各々のインスタンスに対するアテンション加重値を反映して入力データを加工処理することができる。
【0040】
アテンションメカニズム(Attention mechanism)は、ディープラーニングモデルの入力データのうち、重要な部分に集中して学習及び予測可能な処理方式である。既存のディープラーニングでは、入力データのすべての部分が同等な加重値に処理されていたため、入力データのうちの一部が重要な情報を含めていても、これを認識することは難しかった。アテンションメカニズムを用いることにより、入力データの重要な部分を探るように学習し、この重要度と入力とを乗算することで計算し、モデルが重要な情報を更に良く認識できるようにする。
【0041】
入力データ加工部1100は、遺伝的バリアント情報埋め込み部1110と、遺伝的バリアント情報プーリング部1130と、を含む。
【0042】
遺伝的バリアント情報埋め込み部1110は、インスタンスの各々を、各々の神経網を用いて同じ次元の低次元ベクトルで埋め込みした後、加重値の行列と活性化関数を用いて一つの多様体(manifold)上に射影(projection)させて、同じ埋め込みベクトルを求めることができる。
【0043】
遺伝的バリアント情報プーリング部1130は、埋め込みベクトルに対するアテンション加重値をアテンションメカニズムを用いて生成し、埋め込みベクトルを一つに扱うプーリング(pooling)過程を行うことができる。
【0044】
例えば、SNV、SVの全2つの種類の変異が入力値で伝達された場合、式1のような表現により変異の集合(Bag)を定義することができ、式2のような表現により、イン
個の特徴値を有する。
【0045】
【0046】
【0047】
遺伝的バリアント情報埋め込み部1110は、以下の式3及び式4のように、SNV、SV変異を、各々の神経網を用いて各々同じ次元の低次元ベクトルで埋め込みした後、同じ加重値の行列を用いて一つの多様体(manifold)上に射影(projection)させることができる。
【0048】
【0049】
【0050】
【0051】
【0052】
遺伝的バリアント情報プーリング部1130は、各々の変異に対して求められた埋め込みベクトルに対するアテンション加重値(attention weight)を求めて、各ベクトルを仮重合することができる。この際に求められるアテンション加重値を各変異の重要度と見なし、大きい値の重要度を有する変異を疾病誘発に関わる遺伝的バリアントとして解釈することができる。
【0053】
遺伝的バリアント情報プーリング部1130は、個別変異に対して求められた埋め込みベクトルの重要度を求めるために、アテンションメカニズム(attention mechanism)を用いて各々の変異に対するアテンション加重値を求めることができる。式5のように、埋め込みベクトルを二つの層からなる神経網を通過させた後、式6のように、ソフトマックス関数(softmax function)を通過させてアテンション加重値(attention weight)を求めることができる。
【0054】
【0055】
【0056】
where e is a natural constant.
【0057】
以下の式7のように、式4から求められた埋め込みベクトルを行ベクトルにする行列で、各列ベクトルと求められたアテンション加重値(attention weight)とを内積して、変異軸に対して集計された埋め込みベクトルを求めることができる。
【0058】
【0059】
【0060】
多重インスタンス学習モデル部1200は、以下の式8のように、集計された埋め込みベクトルを単層の神経網を通過させて、患者が遺伝性疾患を実際に有する可能度を予測可能である。
【0061】
【0062】
疾病及び誘発に関わる遺伝的バリアント判別部1300は、既に設定された基準以上であれば、患者の疾病が遺伝的バリアントによる遺伝性疾患であると判別し、この際、前記インスタンスのアテンション加重値を用いて、患者の疾病を誘発する疾病誘発に関わる遺伝的バリアントを発掘することができる。
【0063】
疾病及び誘発に関わる遺伝的バリアント判別部1300は、式6から求められたアテンション加重値と、インコイングされた遺伝的バリアントの情報と、を内積して求められる寄与度(contribution)値を基準にして遺伝的バリアントを手順化することができる。この後、既に設定された上位ランクされた遺伝的バリアントを疾病誘発に関わる遺伝的バリアントとして見なすことができる。
【0064】
図5は、本発明の一実施例に係る遺伝性疾患の予測及び疾病誘発に関わる遺伝的バリアントの発掘システムを用いた疾病誘発に関わる遺伝的バリアントの発掘テスト結果に関する図である。
【0065】
図5は、100個の単一塩基変異(SNV)と57個の構造変異(SV)、計157個の変異を有する患者を、本発明による遺伝性疾患の予測及び疾病誘発に関わる遺伝的バリアントの発掘システムを用いて予測し、各変異別の寄与度を視覚化した図である。
【0066】
図5のx軸は、0から99番目まではSNV、100から157番目まではSVの変異のインデックスを意味する。遺伝性疾患に対する可否を0.6のモデルConfidenceと予測し、そのうち、128番目の変異が最も高い寄与をしたと解釈可能であり、本発明による遺伝性疾患の予測及び疾病誘発に関わる遺伝的バリアントの発掘システムが、疾病誘発に関わる遺伝的バリアントを、128番目を集中して、0.6の値を出したことから、これを疾病誘発に関わる遺伝的バリアントと解釈可能である。
【0067】
このように、本発明による遺伝性疾患の予測及び疾病誘発に関わる遺伝的バリアントの発掘システム1000は、患者の遺伝的バリアントラベル(インスタンスラベル)がなくても、多重インスタンス学習モデルを用いることで、遺伝性疾患であるか否かを判別可能である。
【0068】
なお、アテンションメカニズムを用いて生成された患者の遺伝的バリアントに対するアテンション加重値を用いて、患者の疾病誘発に関わる遺伝的バリアントを発掘することができる。
【0069】
すなわち、本発明による遺伝性疾患の予測及び疾病誘発に関わる遺伝的バリアントの発掘システム1000は、患者の遺伝的バリアントラベル(インスタンスラベル)がなくても、アテンションメカニズムと多重インスタンス学習モデルとを用いることで、患者の遺伝性疾患の有無及び疾病誘発に関わる遺伝的バリアントの判別を同時に行うことができる。
【0070】
なお、本発明による遺伝性疾患の予測及び疾病誘発に関わる遺伝的バリアントの発掘システム1000は、求められたアテンション加重値を用いて、患者の遺伝的バリアントラベル(インスタンスラベル)を生成し、生成されたインスタンスラベルを用いて多重インスタンス学習モデルを再学習させることで、多重インスタンス学習モデルの性能を向上させることができる。
【0071】
図6は、本発明の一実施例に係る遺伝性疾患の予測及び疾病誘発に関わる遺伝的バリアントの発掘方法についてのフローチャートである。
【0072】
本発明の一実施例に係る遺伝性疾患の予測及び疾病誘発に関わる遺伝的バリアントの発掘方法は、入力データ加工処理ステップ(S10)、遺伝性疾患の有無の予測ステップ(S20)、疾病誘発に関わる遺伝的バリアントの発掘ステップ(S30)、及び再学習ステップ(S40)を含む。
【0073】
入力データ加工処理ステップ(S10)は、入力データ加工処理部が、患者の遺伝的バリアントの情報であるインスタンス(instance)と、前記インスタンスのバッグ(bag)と、を入力データにし、アテンションメカニズムを用いて、前記インスタンスに対するアテンション加重値を生成して、前記入力データを加工処理することができる。
【0074】
遺伝性疾患の有無の予測ステップ(S20)は、多重インスタンス学習モデル部が、多重インスタンス学習モデルを用いて、患者の疾病が遺伝性疾患であるか否かを予測可能である。
【0075】
疾病誘発に関わる遺伝的バリアントの発掘ステップ(S30)は、疾病及び誘発に関わる遺伝的バリアント判別部か、患者の疾病が遺伝性疾患と判断されれば、前記インスタンスに対するアテンション加重値を用いて、患者の疾病を誘発する疾病誘発に関わる遺伝的バリアントを発掘することができる。
【0076】
この際、患者の疾病が遺伝性疾患と判断されないと、疾病誘発に関わる遺伝的バリアントの発掘は遂行しない可能性もある。
【0077】
再学習ステップ(S40)は、患者の疾病が遺伝性疾患と判断されれば、前記インスタンスのアテンション加重値を用いて、前記インスタンスラベルを生成し、生成された前記インスタンスラベルを用いて多重インスタンス学習モデルを再学習させることができる。本発明の一実施例に係る遺伝性疾患の予測及び疾病誘発に関わる遺伝的バリアントの発掘方法に従い、多重インスタンス学習モデルを再学習させることで、多重インスタンス学習モデルの性能を向上させることができる。
【0078】
本明細書及び図面において、例示的な装置構成は記述しているものの、本明細書において説明している機能的な動作と主題の具現物は、他の類型のデジタル電子回路に具現されるか、本明細書で開示する構造及びその構造的な等価物を含むコンピューターソフトウェア、ファームウエア、あるいはハードウェアに具現されるか、これらのうち、何れか一つ以上の結合により具現可能である。本明細書において説明している主題の具現物は、一つ以上のコンピュータープログラム製品、言い換えれば、前述した方法による装置の動作を制御するために、あるいは、これによる実行のため、類型のプログラム格納媒体上にインコーディングされたコンピュータープログラム命令に関する一つ以上のモジュールとして具現されることができる。コンピューターで読み取り可能な媒体は、機械で読み取り可能な格納装置、機械で読み取り可能な格納基板、メモリー装置、これらのうち、何れか一つ以上の組み合わせであり得る。
【0079】
以上で説明したように、本発明は、前述した実施例及び添付図面に限定されず、本発明の技術的思想を脱しない範囲内で、多様な置き換え、変形、及び変更が可能であるということは、本発明が属する技術分野で通常の知識を有する者にとって明白である。
【符号の説明】
【0080】
100 入力データ
200 出力データ
1000 遺伝性疾患の予測及び疾病誘発に関わる遺伝的バリアントの発掘システム
1100 入力データ加工部
1110 遺伝的バリアント情報埋め込み部
1120 遺伝的バリアント情報プーリング部
1200 多重インスタンス学習モデル部
1300 疾病及び誘発に関わる遺伝的バリアント判別部