IP Force 特許公報掲載プロジェクト 2022.1.31 β版

知財求人 - 知財ポータルサイト「IP Force」

▶ 孫孝芳の特許一覧

特表2024-532959人工知能を用いて人工生殖による胚移植の結果を予測する方法及びシステム
<>
  • 特表-人工知能を用いて人工生殖による胚移植の結果を予測する方法及びシステム 図1
  • 特表-人工知能を用いて人工生殖による胚移植の結果を予測する方法及びシステム 図2
  • 特表-人工知能を用いて人工生殖による胚移植の結果を予測する方法及びシステム 図3
< >
(19)【発行国】日本国特許庁(JP)
(12)【公報種別】公表特許公報(A)
(11)【公表番号】
(43)【公表日】2024-09-10
(54)【発明の名称】人工知能を用いて人工生殖による胚移植の結果を予測する方法及びシステム
(51)【国際特許分類】
   G16B 40/00 20190101AFI20240903BHJP
   C12Q 1/6881 20180101ALI20240903BHJP
【FI】
G16B40/00
C12Q1/6881 Z
【審査請求】有
【予備審査請求】未請求
(21)【出願番号】P 2024536351
(86)(22)【出願日】2022-11-11
(85)【翻訳文提出日】2024-02-27
(86)【国際出願番号】 CN2022131317
(87)【国際公開番号】W WO2023093545
(87)【国際公開日】2023-06-01
(31)【優先権主張番号】63/282,545
(32)【優先日】2021-11-23
(33)【優先権主張国・地域又は機関】US
(81)【指定国・地域】
(71)【出願人】
【識別番号】524075478
【氏名又は名称】孫孝芳
【氏名又は名称原語表記】Sunny Sun
【住所又は居所原語表記】Rm.4307,4F.,No.367,Shengli Rd.,North Dist.,Tainan City 704,Taiwan,
(74)【代理人】
【識別番号】110000523
【氏名又は名称】アクシス国際弁理士法人
(72)【発明者】
【氏名】孫孝芳
【テーマコード(参考)】
4B063
【Fターム(参考)】
4B063QA01
4B063QA13
4B063QQ08
4B063QQ42
4B063QQ52
4B063QR32
4B063QR35
4B063QR77
4B063QS39
(57)【要約】
入力インターフェース及び人工知能予測モデルを含む、人工知能を用いて人工生殖による胚移植の結果を予測するシステム。前記入力インターフェースに、胚のゲノムデータ(ミトコンドリアDNAコピー数とテロメア長を含む)及び前記胚を移植される母体の基本データ(年齢、染色体正倍数体データ、習慣性流産データを含む)を含む複数の入力パラメータを入力することと、前記人工知能予測モデルが前記複数の入力パラメータを受信し、前記複数の入力パラメータに基づいて前記胚移植の結果に関連する予測結果を生成することと、を含む人工知能を用いて人工生殖による胚移植の結果を予測する方法。
【特許請求の範囲】
【請求項1】
胚のゲノムデータ(ミトコンドリアDNAコピー数(mitochondrial DNA copy number)とテロメア長(telomere length)を含む)と、前記胚を移植される母体の基本データ(年齢、染色体正倍数体(chromosome abnormality、CA)データ、習慣性流産(recurrent miscarriage、RM)データを含む)と、を含む複数の入力パラメータを入力するための入力インターフェースを提供するステップと、
前記複数の入力パラメータを受信し、前記複数の入力パラメータに基づいて前記胚移植の結果に関連する予測結果を生成する人工知能予測モデルを提供するステップと、
を含む人工知能を用いて人工生殖による胚移植の結果を予測する方法。
【請求項2】
前記複数の入力パラメータは、前記胚の父親の染色体正倍数体データを含む請求項1に記載の方法。
【請求項3】
次世代シーケンジング(Next Generation Sequencing、NGS)によって前記胚にシーケンジングを行い、前記胚のゲノムデータを得ることを含む請求項1記載の方法。
【請求項4】
前記胚のゲノムデータのテロメア長は、次世代シーケンジングの結果に基づいて計算して得られたものである請求項3に記載の方法。
【請求項5】
前記胚のゲノムデータは染色体安定性(chromosome stability)を含む請求項1に記載の方法。
【請求項6】
前記母体の基本データは、家族歴、不妊因子及び婦人科関連疾患を含む請求項1に記載の方法。
【請求項7】
前記母体の基本データは、検査及び手術歴を含む請求項6に記載の方法。
【請求項8】
前記複数の入力パラメータは、子宮内膜厚(Endometrial thickness)を含む前記母体の生理学的数値データをさらに含む請求項1に記載の方法。
【請求項9】
前記生理的数値は、ホルモン値(Hormone levels)を含む請求項8に記載の方法。
【請求項10】
前記生理学的数値は月経周期を含む請求項8に記載の方法。
【請求項11】
前記入力パラメータは、前記胚の卵子源、前記胚の等級、前記母体に移植される前記胚と他の胚との総数を含む人工施術データをさらに含む請求項1に記載の方法。
【請求項12】
前記人工施術データは、前記母体の卵巣刺激方法、前記母体の総採卵数、前記母体の受精卵数、前記胚の形態及び動態を含む請求項11に記載の方法。
【請求項13】
前記人工知能予測モデルを訓練データセットを用いて訓練することを含み、
前記訓練データセットは、複数の訓練データを含み、前記訓練データの各々は、所定の胚のゲノムデータ及び女性の基本データを含み、前記所定の胚のゲノムデータは、前記所定の胚のミトコンドリアDNAコピー数及びテロメア長を含み、前記女性の基本データは、年齢、染色体正倍数体データ、習慣性流産データを含む請求項1記載の方法。
【請求項14】
前記人工知能予測モデルは、訓練されたロジスティック回帰、決定木、ランダムフォレスト、サポートベクターマシン、LightGBM、XGBoost及びTabnetアルゴリズムにアンサンブル(ensemble)分析を行って得られたものである請求項1に記載の方法。
【請求項15】
胚のゲノムデータ(ミトコンドリアDNAコピー数(mitochondrial DNA copy number)とテロメア長(telomere length)を含む)と、前記胚を移植される母体の基本データ(年齢、染色体正倍数体(chromosome abnormality、CA)データ、習慣性流産(recurrent miscarriage、RM)データを含む)と、を含む複数の入力パラメータを入力するための入力インターフェースと、
複数の入力パラメータを受信し、複数の入力パラメータに基づいて前記胚移植の結果に関連する予測結果を生成する人工知能予測モデルと、
を含む人工知能を用いて人工生殖による胚移植の結果を予測するシステム。
【請求項16】
前記複数の入力パラメータは、前記胚の父親の染色体正倍数体データを含む請求項15に記載のシステム。
【請求項17】
前記母体の基本データは、家族歴、不妊因子、及び婦人科関連疾患を含む請求項16に記載のシステム。
【請求項18】
前記複数の入力パラメータは、子宮内膜厚(Endometrial thickness)を含む前記母体の生理的数値データをさらに含む請求項15に記載のシステム。
【請求項19】
前記入力パラメータは、前記胚の卵子源、前記胚の等級、前記母体に移植される前記胚と他の胚との総数を含む人工施術データをさらに含む請求項15に記載のシステム。
【請求項20】
前記胚のゲノムデータは、染色体安定性(chromosome stability)を含む請求項15に記載のシステム。
【発明の詳細な説明】
【技術分野】
【0001】
本発明は、人工生殖による胚移植の結果の予測に関し、特に、人工知能を用いて人工生殖による胚移植の結果を予測する方法及びシステムに関する。
【背景技術】
【0002】
出生率低下は世界が直面している重大な公衆衛生上の問題となっており、台湾を例にとると、女性の合計特殊出生率(1人の女性が一生のあいだに産む子どもの数)は1951年の7.04から2016年の1.125に低下した。2006年から2016年までの10年間に、主な出生者年齢層は25~29歳(2006年)から30~34歳(2016年)に上昇し、高齢産婦の割合は2006年の11.84%から2017年の27.17%に上昇した。晩婚や出生年齢の上昇は、出生率の低下を招く要因である。34歳以上の高齢は女性の不妊の原因と考えられている。
【0003】
現在、不妊症は世界中の10%の夫婦に影響を与える一般的な疾患である。体外受精(In vitro fertilization、IVF)は、不妊症の問題を解決するための方法の1つとなっている。現在の体外受精の技術はかなり進んでいるが、不妊患者が体外受精治療を受ける成功率は約30%であり、成功率は依然として低い。不妊症患者の体外受精治療の成功率を高めることは人工生殖関連分野の急務である。
【発明の開示】
【発明が解決しようとする課題】
【0004】
本発明は、上記事情に鑑みてなされたもので、人工知能を用いて人工生殖による胚移植の結果を予測する方法及びシステムを提供することを目的とし、胚移植の結果を予測することができる。
上記目的を達成するために、本発明が提供する人工知能を用いて人工生殖による胚移植の結果を予測する方法は、以下のステップを含む。
【0005】
胚のゲノムデータと前記胚を移植される母体の基本データとを含む複数の入力パラメータを入力するための入力インターフェースを提供する。ただし、前記胚のゲノムデータは、ミトコンドリアDNAコピー数(mitochondrial DNA copy number)とテロメア長(telomere length)を含み、前記母体の基本データは、年齢、染色体正倍数体(chromosome abnormality、CA)データ、習慣性流産(recurrent miscarriage、RM)データを含む。
前記複数の入力パラメータを受信し、前記複数の入力パラメータに基づいて前記胚移植の結果に関連する予測結果を生成する人工知能予測モデルを提供する。
【0006】
本発明が提供する人工知能を用いて人工生殖による胚移植の結果を予測するシステムは、入力インターフェースと人工知能予測モデルを含む。前記入力インターフェースは、胚のゲノムデータと前記胚を移植される母体の基本データを含む複数の入力パラメータを入力するためのものである。前記胚のゲノムデータは、ミトコンドリアDNAコピー数(mitochondrial DNA copy number)とテロメア長(telomere length)を含む。母体の基本データは、年齢、染色体正倍数体(chromosome abnormality、CA)データ、習慣性流産(recurrent miscarriage、RM)データを含む。人工知能予測モデルは、前記複数の入力パラメータを受信し、前記複数の入力パラメータに基づいて前記胚移植の結果に関連する予測結果を生成する。
【0007】
本発明の効果は、上記の方法及びシステムにより、前記胚が母体への人工移植に適しているか否かの補助判断因子として、後に胚を母体に移植するか否かを決定することである。これにより、体外受精治療の成功率を効果的に高めることができる。
【図面の簡単な説明】
【0008】
図1図1は、本発明の第1の好ましい実施例に係る人工知能を用いて人工生殖による胚移植の結果を予測する方法のフローチャートである。
図2図2は、本発明の第1の好ましい実施例に係る人工知能を用いて人工生殖による胚移植の結果を予測するシステム及びそれに接続されるデータベースである。
図3図3は、本発明の第1の好ましい実施例に係るロジスティック回帰及び決定木のROC曲線である。
【発明を実施するための形態】
【0009】
以下、本発明をより明確に説明するために、好ましい実施例を挙げ、添付の図面を参照して詳しく説明する。図1に示されるように、本発明の第1の好ましい実施例に係る人工知能を用いて人工生殖による胚移植の結果を予測する方法のフローチャートであり、この方法は、入力インタフェース10と人工知能予測モデル20とを含む図2に示すシステム1に適用される。前記入力インタフェース10は、データベース2に接続するために用いられる。本実施例の方法について、前記システム1と併せて後述する。
【0010】
ステップS1:胚のゲノムデータと前記胚を移植される母体の基本データとを含む複数の入力パラメータを入力するための前記入力インターフェース10を提供する。本実施例において、胚の母体(卵子提供者)は、胚に移植される前記母体と同じ人であるが、これに限定されず、実施例によっては、異なる人であってもよい。
【0011】
この実施例では、予測される前記胚のゲノムデータ及び前記母体の基本データは、前記データベースに記憶されてもよく、前記入力インターフェースを介して、前記データベースから前記複数の入力パラメータを受信する。ある実施例において、予測される前記胚のゲノムデータ及び前記母体の基本データを前記入力インターフェースに直接入力してもよい。
【0012】
ステップS2:前記入力インターフェース10から前記複数の入力パラメータを受信し、前記複数の入力パラメータに基づいて前記胚移植の結果に関連する予測結果を生成する前記人工知能予測モデル20を提供する。
【0013】
前記人工知能予測モデル20は、事前学習済みの複数の人工知能予測モデルから選ばれた予測能力が最適なものである。前記予測結果は、例えば、母体への胚移植後の着床率(すなわち、母体の妊娠率)であり得るが、これに限定されず、予測結果は、移植成功、移植失敗、移植成功確信度、移植失敗確信度などの少なくとも1つの胚移植の結果に関する内容を表すものであってもよい。
【0014】
本実施例において、前記胚のゲノムデータは、ミトコンドリアDNAコピー数(mitochondrial DNA copy number)及びテロメア長(telomere length)を含み、ゲノムデータは、次世代シーケンシング(Next Generation Sequencing、NGS)を用いて胚に対してシーケンシングを行い、シーケンシングの結果から得られた胚のゲノムデータである。次世代シーケンシングの装置は、Thermo Fisherのシーケンシングソリューション及び/またはIlluminaのシーケンシングソリューションを使用することができる。
【0015】
ミトコンドリアDNAコピー数とテロメア長は、次世代シーケンシングの結果に基づいて計算され、これにより、定量的PCR(qPCR)を用いてテロメア長を得るための複雑な手順を減らすことができる。例えば、既知のテロメア反復配列TTAGGGまたはCCCTAAを用いて、次世代シーケンシングの結果と比較してテロメア長を演算するが、この方法に限定されず、ゲノミクスに詳しい者であれば、計算で知ることができる。
【0016】
前記母体の基本データは、年齢、染色体正倍数体(chromosome abnormality、CA)データ、習慣性流(recurrent miscarriage、RM)データを含む。母体の染色体正倍数体データは、次世代シーケンシングにより得られる。染色体正倍数体データは、母体本人及び/又はそのファミリーの染色体正倍数体データを含み、習慣性流産データは、母体本人及び/又はそのファミリーの習慣性流産データを含む。
【0017】
本実施例では、前記データベース2は、複数の所定のデータをさらに含み、各所定のデータは、所定の胚のゲノムデータと、前記所定の胚の卵子が由来する女性の基本データとを含む。各前記所定のデータの所定の胚のゲノムデータは、ミトコンドリアDNAコピー数及びテロメア長を含み、かつミトコンドリアDNAコピー数及びテロメア長も、次世代シーケンジングにより得られたものである。各前記所定のデータの所定の胚の女性の基本データは、年齢、女性及び/又はそのファミリーの染色体正倍数体データ、女性及び/又はそのファミリーの習慣流産データを含む。染色体正倍数体データは、次世代シーケンジングにより得られる。各所定のデータのは、移植成否のデータ、すなわち、所定の胚の着床成否のデータを含む。
【0018】
所定の胚のゲノムデータについてミトコンドリアDNAコピー数及びテロメア長を選んだ理由は、実験によると、女性の染色体正倍数体データが異数倍数体(aneuploid)である場合、その所定の胚のミトコンドリアDNAコピー数は、正倍数体(euploid)の所定の胚のミトコンドリアDNAコピー数より多く、移植後に着床成功した所定の胚は、移植後に着床失敗した所定の胚より、テロメア長が長いことが見出されている。従って、ミトコンドリアDNAコピー数及びテロメア長の2つのパラメータが女性の胚移植後の成功率と有意な関係を有することが確認され、所定の人工知能予測モデルを訓練するための主要なゲノムデータとして選択された。女性の年齢、習慣性流産データも、所定の胚着床成功に影響を与える因子であるため、女性の年齢、習慣性流産データ、及び染色体正倍数体データも、所定の人工知能予測モデルを訓練するための基本データとして選択され得る。本実施例では、女性の年齢は24~50歳である。所定の胚は216個あり、かつ対応する女性に移植された。
【0019】
本実施例では、前記複数の所定の人工知能予測モデルは、ロジスティック回帰、決定木、及びランダムフォレストなどの3つのアルゴリズムを例として説明するが、これらに限定されず、サポートベクターマシン(SVM)、XGBoots、人工ニューラルネットワーク、ベイジアン分類ネットワーク(Bayesian classification and network)、ツリーベースの特徴選択(Tree-based feature selection)、及びディープラーニングモデルなどのアルゴリズムのうちの少なくとも1つをさらに含んでもよい。
本実施例の方法は、ステップS1の前にモデル訓練ステップとモデル選択ステップをさらに含む。
【0020】
前記予測モデル訓練ステップは、前記データベース2における一部の前記複数の所定のデータを訓練データセットとして前記複数の所定の人工知能予測モデルのそれぞれを訓練し、他方の一部の所定のデータを検証データセットとし、換言すれば、前記訓練データセットの各訓練データは、所定の胚のゲノムデータ及び対応する女性の基本データを含む。各所定の人工知能予測モデルを訓練する際、例えばK fold cross validationを採用してもよく、本実施例ではK=5を例にするが、これに限定されない。
【0021】
図3はロジスティック回帰と決定木のROC曲線であり、訓練データセットに対して、ロジスティック回帰の正解率(accuracy)は0.65(65%)、曲線下面積(AUC)は0.72(72%)であり、決定木の正解率は0.81(81%)、曲線下面積(AUC)は0.86(86%)である。
【0022】
ランダムフォレストは、500個の木に基づくものを例とし、訓練データセットに対する正解率は0.91(91%)であり、ランダムフォレストの正解率は、単一の判定木の0.81(81%)とロジスティック回帰の0.65(65%)より高く、換言すれば、ランダムフォレストの予測能力は最も高い。検証データセットに対するランダムフォレストと決定木の正解率は、それぞれ0.61(61%)と0.54(54%)である。
【0023】
前記予測モデルの選択ステップは、前記人工知能予測モデル20として、前記複数の所定の人工知能予測モデルから予測能力が最適なものを選択することを含む。前述したように、訓練されたランダムフォレストは予測能力が最も高いので、前記人工知能予測モデル20として訓練されたランダムフォレストが選択される。換言すれば、前記人工知能予測モデル20は、訓練データセットを用いて訓練されて得られる。
【0024】
これにより、前記人工知能予測モデル20は、前記入力インタフェース10から前記複数の入力パラメータを受信すると、前記予測結果を生成することができる。医療従事者は、前記人工知能予測モデル20による予測結果に基づいて、前記胚が母体への人工移植に用いるのに適しているか否かの補助判断因子として、後に胚を母体へ移植するか否かを決定することができる。
【0025】
次に、本発明の第2の好ましい実施例に係る人工知能を用いた人工生殖による胚移植の結果予測方法及びシステムについて説明する。本実施例の方法及びシステムは、第1の実施例に基づくものであるが、相違点は、入力パラメータが、前記胚のゲノムデータ(ミトコンドリアDNAコピー数、テロメア長)、母体の基本データ(年齢、染色体正倍数体データ、習慣性流産データ)に加えて、以下の入力パラメータをさらに含むことである。
【0026】
胚のゲノムデータは、染色体安定性(chromosome stability)データも含み、染色体安定性データは、次世代シーケンジングの結果と標準配列とのアライメントから、染色体発散度の標準偏差を算出したものである。
【0027】
母体の基本データは、家族歴、不妊因子、及び婦人科関連疾患をさらに含む。家族歴は、人工流産、免疫異常、子宮外妊娠、及び早期分娩などの病歴のうちの少なくとも1つ又は複数を含む。不妊症因子は、卵管因子、卵巣因子、子宮因子、男性因子などのうちの少なくとも1つまたは複数を含むが、他の不妊症因子を排除するものではない。婦人科関連疾患は、子宮内膜症(Endometriosis)、多嚢胞性卵巣症候群(PCO)、子宮頸部筋腫(Cervical myoma)、子宮内膜ポリープ(Endometrial polyps)、子宮筋腺症(Adenomyosis)、卵巣嚢胞(Ovarian cyst)、卵管閉塞(Oviduct obstruction)、及び他の子宮頸部または卵管疾患のうちの少なくとも1つまたは複数を含む。前記母体の基本データは、母体に対して施された婦人科の検査と手術歴、硬式子宮鏡検査、腹腔鏡手術、子宮内膜スクレイピングのうちの少なくとも一つ又は複数をさらに含んでもよいが、他の検査と手術を排除するものではない。
【0028】
前記複数の入力パラメータは、前記母体の生理学的数値データ及び人工施術データをさらに含む。生理学的数値は、子宮内膜厚(Endometrial thickness)、及び月経周期を含む。前記人工施術データは、前記胚の卵子源(移植しようとする前記母体から、または他の母体から提供される)、前記胚の等級及び/またはサイズ、並びに前記母体に移植される前記胚及び他の胚の総数を含み、前記胚のみを移植しようとする場合、総数は1である。
【0029】
胎児の父親(精子提供者)の基本データについて、父親の基本データは染色体正数体データを含み、染色体正数体データは父親本人及び/またはそのファミリーの染色体正数体データを含む。
【0030】
一実施例において、生理的数値は、ホルモン値(Hormone levels)、例えばAMH、FSH、LH、E2、TSH、P4、PRLのうち少なくとも1つ又は複数をさらに含んでもよい。前記人工施術データは、前記母体の卵巣刺激方法、前記母体の総採卵数、前記母体の受精卵数、前記胚の形態(morphology)及び動態(morphokinetics)をさらに含んでもよい。任意選択で、父親の基本データは、父親の家族の習慣的な流産データをさらに含んでもよい。
【0031】
前記データベース2における前記複数の所定データの各々は、所定の胚のゲノムデータ(ミトコンドリアDNAコピー数、テロメア長)、女性の基本データ(年齢、染色体正倍体データ、習慣性流産データ)、移植の成否のデータに加えて、前記入力パラメータと同じデータ、すなわち、所定の胚のゲノムデータ、女性の基本データ、女性の生理数値データ、人工施術データ、所定の胚の父親の基本データをさらに含むが、ここでは説明を省略する。本実施例では、前記複数の所定のデータは456であり、すなわち、所定の胚は239人の女性から456個である。
【0032】
本実施例では、所定の胚のゲノムデータに使用される次世代シーケンジングの装置は、Thermo Fisherのシーケンジングソリューション及びIlluminaのシーケンジングソリューションであり、両装置のシーケンジングの結果を取得して、所定の胚の2種類のゲノムデータを得る。
【0033】
本実施例の前記複数の所定の人工知能予測モデルは、ロジスティック回帰、決定木、ランダムフォレスト、サポートベクターマシン、LightGBM、XGBoost、Tabnet、及び前述した7種類のアルゴリズムにアンサンブル分析(ensemble)を行ったアルゴリズムを含み、合計8個のアルゴリズムを例とするが、前記8個に限定されるものではなく、そのうちの幾つかのアルゴリズムを選択したり、その他のアルゴリズムを追加してもよい。
【0034】
前記データベース2における各所定のデータのうち、移植の成否のデータ、すなわち女性の妊娠成功の結果は、血液ホルモン検出、超音波での胚盤胞検査、及び最終生産の有無の3種類の判定方式が用いられる。
【0035】
本実施例のモデル訓練ステップにおいて、前記データベースにおける一部の前記複数の所定のデータを訓練データセットとして、前記複数の所定の人工知能予測モデルのそれぞれを訓練し、他の一部の所定のデータを検証データセットとする。各予定人工知能予測モデルを訓練する際、例えば、K fold cross validationを採用してもよく、本実施例ではK=3を例にするが、これに限定されない。
【0036】
特に、全部で9種類の訓練データセット及び検証データセットを用いて、各所定の人工知能予測モデルに訓練及び検証を行い、すなわち、第1種から第3種の訓練データセット及び検証データセットは、Thermo Fisherのシーケンジングソリューションによってシーケンジングを行った所定の胚のゲノムデータであり、それぞれ女性の妊娠成功の結果の3つの判定方式に合わせて、第1種から第3種の訓練データセット及び検証データセットが得られる。第4種から第6種の訓練データセット及び検証データセットは、Illuminaのシーケンジングソリューションによってシーケンジングを行った所定の胚のゲノムデータであり、それぞれ女性の妊娠成功の結果の3つの判定方式に合わせて、第4種から第6種の訓練データセット及び検証データセットが得られる。第7種から第9種の訓練データセット及び検証データセットは、Thermo FisherのシーケンジングソリューションとIlluminaのシーケンジングソリューションによって、シーケンジングを行った所定の胚の2種類のゲノムデータを同時に用いて、それぞれ女性の妊娠成功の結果の3つの判定方式に合わせて、第7種から第9種の訓練データセット及び検証データセットが得られる。
【0037】
本実施例では、72つの訓練された人工知能予測モデルから予測能力が最適なものを前記人工知能予測モデル20として選択した。8つの所定の人工知能予測モデルは、9種類の訓練データをそれぞれ使用して、合計72つの訓練された所定の人工知能予測モデルが得られる。
【0038】
例えば、各訓練データセットによって訓練された8つの所定の人工知能予測モデルから予測能力が最適なものを1つ選択すると、計9種類の訓練データセットがあるため、9つの訓練された所定の人工知能予測モデルが得られる。そして、これら9つの訓練された所定の人工知能予測モデルから、予測能力が最適なものを前記人工知能予測モデル20として選択する。
【0039】
72つの訓練された所定の人工知能予測モデルから最終的に選ばれた最適なものは、アンサンブル分析アルゴリズムを使用したものであり、かつそれに用いられた訓練データセットは、Thermo Fisherのシーケンジングソリューションによってシーケンジングを行った所定の胚のゲノムデータであり、最終的に生産するか否かに合わせて女性の妊娠成功の結果の判定方式とする。
【0040】
最終的に選ばれた前記人工知能予測モデル20は、訓練データセット予測の結果に対して、正確率(Accuracy)は97.6%、感度(Sensitivity)は95.0%、陽性予測率(Positive Predictive Value、PPV)は97.4%、F1数値は96.2%、曲線下面積(AUC)は99.6%である。前記人工知能予測モデルは、検証データセット予測の結果に対して、正解率は87.5%、感度は78.3%、陽性予測率は82.5%、F1値は80.3%、曲線下面積は87.5%である。
【0041】
訓練された様々なアルゴリズムをアンサンブル分析して得られる人工知能予測モデル20は、人工生殖による胚移植の結果を予測するのに最適な予測能力を有し、後に前記胚を母体に移植するかどうかの補助参照とすることができる。これにより、体外受精治療の成功率を効果的に高めることができる。
【0042】
以上の説明は、本発明の好ましい実施例に過ぎず、本発明の明細書及び特許請求の範囲に基づいて行われたすべての均等な変更は、本発明の特許範囲に含まれるべきである。
【符号の説明】
【0043】
1:システム
10:入力インターフェース
20:人工知能予測モデル
2:データベース
S1、S2:ステップ
図1
図2
図3
【国際調査報告】