(19)【発行国】日本国特許庁(JP)
(12)【公報種別】公表特許公報(A)
(11)【公表番号】
(43)【公表日】2024-12-20
(54)【発明の名称】ペットの親類検索システムおよび方法
(51)【国際特許分類】
G06Q 50/10 20120101AFI20241213BHJP
G06N 5/04 20230101ALI20241213BHJP
【FI】
G06Q50/10
G06N5/04
【審査請求】有
【予備審査請求】未請求
(21)【出願番号】P 2024524644
(86)(22)【出願日】2022-10-26
(85)【翻訳文提出日】2024-06-20
(86)【国際出願番号】 US2022078695
(87)【国際公開番号】W WO2023076932
(87)【国際公開日】2023-05-04
(32)【優先日】2021-10-27
(33)【優先権主張国・地域又は機関】US
(81)【指定国・地域】
(71)【出願人】
【識別番号】390037914
【氏名又は名称】マース インコーポレーテッド
【氏名又は名称原語表記】MARS INCORPORATED
(74)【代理人】
【識別番号】100073184
【氏名又は名称】柳田 征史
(74)【代理人】
【識別番号】100175042
【氏名又は名称】高橋 秀明
(74)【代理人】
【識別番号】100224775
【氏名又は名称】南 毅
(72)【発明者】
【氏名】ギャリガン,ダニエル
(72)【発明者】
【氏名】ハフ,ジェイソン トロイ
(72)【発明者】
【氏名】フォラン,レベッカ チョドロフ
【テーマコード(参考)】
5L050
【Fターム(参考)】
5L050CC11
(57)【要約】
コンパニオンペットのDNA情報を使用してコンパニオンペットの親族関係を推測するためのコンピュータで実装される方法であって、少なくとも1つのDNA配列を含む、コンパニオンペットのDNA情報を受信するステップと、少なくとも1つのDNA配列をデータベースに送信するステップであって、少なくとも1つのDNA配列を受信したデータベースが、マッチした少なくとも1頭のコンパニオンペットに対応する一致した染色体セグメントを少なくとも1つ含む、局所的なDNA断片パターンを少なくとも1つ検索して出力するステップと、少なくとも1つの局所的なDNA断片パターンを解析することにより、コンパニオンペットとマッチした少なくとも1頭のコンパニオンペットとの間において推測される親族関係を少なくとも1つ特定するステップと、解析するステップに基づいて、少なくとも1つの推測される親族関係を少なく出力するステップと、を含む方法。
【特許請求の範囲】
【請求項1】
コンパニオンペットのDNA情報を使用してコンパニオンペットの親族関係を推測するためのコンピュータで実装される方法であって、
少なくとも1つのDNA配列を含む、コンパニオンペットのDNA情報を受信するステップと、
前記少なくとも1つのDNA配列をデータベースに送信するステップであって、該少なくとも1つのDNA配列を受信した前記データベースが、マッチした少なくとも1頭のコンパニオンペットに対応する一致した染色体セグメントを少なくとも1つ含む、局所的なDNA断片パターンを少なくとも1つ検索して出力するステップと、
前記少なくとも1つの局所的なDNA断片パターンを解析することにより、前記コンパニオンペットと前記マッチした少なくとも1頭のコンパニオンペットとの間において推測される親族関係を少なくとも1つ特定するステップと、
前記解析するステップに基づいて、前記少なくとも1つの推測される親族関係を少なく出力するステップと、
を含む方法。
【請求項2】
前記少なくとも1つの局所的なDNA断片パターンが、複数の同祖(IBD)断片を含む、請求項1に記載のコンピュータで実装される方法。
【請求項3】
前記少なくとも1つのDNA配列のうち、2組中1組の染色体にのみ前記複数の同祖断片を含むDNA配列の割合を特定するステップをさらに含む、請求項2に記載のコンピュータで実装される方法。
【請求項4】
前記少なくとも1つのDNA配列のうち、2組の染色体の双方に前記複数の同祖断片を含むDNA配列の割合を特定するステップをさらに含む、請求項2に記載のコンピュータで実装される方法。
【請求項5】
前記少なくとも1つのDNA配列のうち、前記複数の同祖断片のいずれも含まないDNA配列の割合を特定するステップをさらに含む、請求項2に記載のコンピュータで実装される方法。
【請求項6】
前記複数の同祖断片を解析して、前記少なくとも1つの局所的なDNA断片パターンに含まれる同祖断片の総数を特定するステップをさらに含む、請求項2に記載のコンピュータで実装される方法。
【請求項7】
前記複数の同祖断片を解析して、前記少なくとも1つの局所的なDNA断片パターンに含まれる前記複数の同祖断片の合計長さを特定するステップをさらに含む、請求項2に記載のコンピュータで実装される方法。
【請求項8】
前記複数の同祖断片の前記合計長さがセンチモルガン単位で測定される、請求項7に記載のコンピュータで実装される方法。
【請求項9】
前記少なくとも1つの局所的なDNA断片パターンに、重なり合う形質が少なくとも1つあることを特定するステップと、
前記マッチした少なくとも1頭のコンパニオンペットとの間で該少なくとも1つの形質を共有していることを示す通知を出力するステップと、
をさらに含む、請求項1に記載のコンピュータで実装される方法。
【請求項10】
前記少なくとも1つの形質が品種に特異的な形質である、請求項9に記載のコンピュータで実装される方法。
【請求項11】
前記少なくとも1つの推測される親族関係が、母、父、姉妹、兄弟、おじ、おば、姪、甥、いとこ、祖父、祖母、孫息子、孫娘、曾祖父、曾祖母、曾孫息子、曾孫娘、半血の母、半血の父、半血の姉妹、半血の兄弟、半血のおじ、半血のおば、半血の姪、半血の甥、半血のいとこ、半血の祖父、半血の祖母、半血の孫息子、半血の孫娘、半血の曾祖父、半血の曾祖母、半血の曾孫息子、半血の曾孫娘のうちの少なくとも1つを含む、請求項1に記載のコンピュータで実装される方法。
【請求項12】
前記方法が、DNAがマッチしたコンパニオンペットサンプルの一覧を出力するステップをさらに含み、
前記DNAがマッチしたコンパニオンペットサンプルは、マッチ閾値を満たすか上回るかしたコンパニオンペットサンプルである、請求項1に記載のコンピュータで実装される方法。
【請求項13】
前記コンパニオンペットと前記マッチした少なくとも1頭のコンパニオンペットについて、それぞれの近親交配度を示すホモ接合度を特定するステップをさらに含む、請求項1に記載のコンピュータで実装される方法。
【請求項14】
前記少なくとも1つの局所的なDNA断片パターンを解析して、前記少なくとも1つの局所的なDNA断片パターンが、前記コンパニオンペットが有する2組の染色体のうちの1組の染色体に生じているか、2組の染色体の双方に生じているかを特定するステップをさらに含む、請求項1に記載のコンピュータで実装される方法。
【請求項15】
命令を格納する少なくとも1つのメモリと、
前記命令を実行することにより動作を実行するように構成された少なくとも1つのプロセッサと、
を備える、コンパニオンペットのDNA情報を使用してコンパニオンペットの親族関係を推測するためのコンピュータシステムであって、
前記動作が、
少なくとも1つのDNA配列を含む、コンパニオンペットのDNA情報を受信する工程と、
前記少なくとも1つのDNA配列をデータベースに送信する工程であって、該少なくとも1つのDNA配列を受信した前記データベースが、マッチした少なくとも1頭のコンパニオンペットに対応する一致した染色体セグメントを少なくとも1つ含む、局所的なDNA断片パターンを少なくとも1つ検索して出力する工程と、
前記少なくとも1つの局所的なDNA断片パターンを解析することにより、前記コンパニオンペットと前記マッチした少なくとも1頭のコンパニオンペットとの間において推測される親族関係を少なくとも1つ特定する工程と、
前記解析する工程に基づいて、前記少なくとも1つの推測される親族関係を少なく出力する工程と、
を含む、コンピュータシステム。
【請求項16】
前記動作が、前記少なくとも1つの局所的なDNA断片パターンを解析して、前記少なくとも1つの局所的なDNA断片パターンが、前記コンパニオンペットが有する2組の染色体のうちの1組の染色体に生じているか、2組の染色体の双方に生じているかを特定する工程をさらに含む、請求項15に記載のコンピュータシステム。
【請求項17】
前記少なくとも1つの推測される親族関係が、母、父、姉妹、兄弟、おじ、おば、姪、甥、いとこ、祖父、祖母、孫息子、孫娘、曾祖父、曾祖母、曾孫息子、曾孫娘、半血の母、半血の父、半血の姉妹、半血の兄弟、半血のおじ、半血のおば、半血の姪、半血の甥、半血のいとこ、半血の祖父、半血の祖母、半血の孫息子、半血の孫娘、半血の曾祖父、半血の曾祖母、半血の曾孫息子、半血の曾孫娘のうちの少なくとも1つを含む、請求項15に記載のコンピュータシステム。
【請求項18】
命令を収容した非一時的なコンピュータ可読媒体であって、
前記命令は、該命令をプロセッサによって実行した場合に、前記プロセッサに、コンパニオンペットのDNA情報を使用してコンパニオンペットの親族関係を推測するための動作を実行させるものであり、
該動作が、
少なくとも1つのDNA配列を含む、コンパニオンペットのDNA情報を受信する工程と、
前記少なくとも1つのDNA配列をデータベースに送信する工程であって、該少なくとも1つのDNA配列を受信した前記データベースが、マッチした少なくとも1頭のコンパニオンペットに対応する一致した染色体セグメントを少なくとも1つ含む、局所的なDNA断片パターンを少なくとも1つ検索して出力する工程と、
前記少なくとも1つの局所的なDNA断片パターンを解析することにより、前記コンパニオンペットと前記マッチした少なくとも1頭のコンパニオンペットとの間において推測される親族関係を少なくとも1つ特定する工程と、
前記解析する工程に基づいて、前記少なくとも1つの推測される親族関係を少なく出力する工程と、
を含む、非一時的なコンピュータ可読媒体。
【請求項19】
前記少なくとも1つの推測される親族関係が、母、父、姉妹、兄弟、おじ、おば、姪、甥、いとこ、祖父、祖母、孫息子、孫娘、曾祖父、曾祖母、曾孫息子、曾孫娘、半血の母、半血の父、半血の姉妹、半血の兄弟、半血のおじ、半血のおば、半血の姪、半血の甥、半血のいとこ、半血の祖父、半血の祖母、半血の孫息子、半血の孫娘、半血の曾祖父、半血の曾祖母、半血の曾孫息子、半血の曾孫娘のうちの少なくとも1つを含む、請求項18に記載の非一時的なコンピュータ可読媒体。
【請求項20】
前記動作が、前記少なくとも1つの局所的なDNA断片パターンを解析して、前記少なくとも1つの局所的なDNA断片パターンが、前記コンパニオンペットが有する2組の染色体のうちの1組の染色体に生じているか、2組の染色体の双方に生じているかを特定する工程をさらに含む、請求項18に記載の非一時的なコンピュータ可読媒体。
【発明の詳細な説明】
【技術分野】
【0001】
本開示の種々の実施形態は、概して、コンパニオンペットの親族関係を推測するための、機械学習に基づいた技術に関する。また、いくつかの実施形態では、本開示は、コンパニオンペットの親族関係を推測できるように、機械学習に基づくモデルを訓練するためのシステムおよび方法に関する。
【背景技術】
【0002】
コンパニオンペットの親族関係(familial relationship)の特定は、非常に困難かつ誤判定を生じやすいプロセスである。例えば、従来の技術として、2頭のコンパニオンペット間で類似しているDNA断片を比較することより、そのコンパニオンペットが血縁関係にあるかどうかを判定する工程を含む技術がある。従来の技術の場合、2頭のコンパニオンペットが同じようなDNAを共有していれば、これら2頭のコンパニオンペットが血縁関係にあるという結論を出す場合があった。しかし、従来の技術では、近親交配を示すDNA断片と親族関係を示すDNA断片を区別することはできなかった。そのため、従来の技術では、実際には近親交配されているだけの2頭のコンパニオンペットを血縁関係にあると判定してしまっていた。さらに、従来の技術では、2頭以上のコンパニオンペットの親族関係(続柄)ラベル(例えば、母、姉妹、半血の姉妹、甥などのラベル)をユーザに提供する機能を持っていなかった。
【0003】
本開示は、上記の課題に対処するためのものである。なお、本項に示した背景技術の説明は、本開示の背景を概略的に示すためのものである。本明細書において特に断りのない限り、本項に記載した内容は、本出願の特許請求の範囲に対する先行技術ではない。よって、本項に記載することによって先行技術であると認めるものでも、または先行技術を示唆するものと認めるものでもない。
【発明の概要】
【0004】
本開示の特定の態様によれば、コンパニオンペットの親族関係を推測するための方法およびシステムが開示される。
【0005】
一態様では、コンパニオンペットのDNA情報を使用してコンパニオンペットの親族関係を推測するためのコンピュータで実装される方法の例示的な実施形態は、少なくとも1つのDNA配列を含む、コンパニオンペットのDNA情報を受信するステップと、少なくとも1つのDNA配列をデータベースに送信するステップであって、少なくとも1つのDNA配列を受信したデータベースが、マッチした少なくとも1頭のコンパニオンペットに対応する一致した染色体セグメントを少なくとも1つ含む、局所的なDNA断片パターンを少なくとも1つ検索して出力するステップと、少なくとも1つの局所的なDNA断片パターンを解析することにより、コンパニオンペットとマッチした少なくとも1頭のコンパニオンペットとの間において推測される親族関係を少なくとも1つ特定するステップと、解析するステップに基づいて、少なくとも1つの推測される親族関係を少なく出力するステップと、を含む。
【0006】
一態様では、コンパニオンペットのDNA情報を使用してコンパニオンペットの親族関係を推測するためのコンピュータシステムの例示的な実施形態は、命令を格納する少なくとも1つのメモリと、命令を実行することにより動作を実行するように構成された少なくとも1つのプロセッサと、を備える。この動作は、少なくとも1つのDNA配列を含む、コンパニオンペットのDNA情報を受信する工程と、少なくとも1つのDNA配列をデータベースに送信する工程であって、少なくとも1つのDNA配列を受信したデータベースが、マッチした少なくとも1頭のコンパニオンペットに対応する一致した染色体セグメントを少なくとも1つ含む、局所的なDNA断片パターンを少なくとも1つ検索して出力する工程と、少なくとも1つの局所的なDNA断片パターンを解析することにより、コンパニオンペットとマッチした少なくとも1頭のコンパニオンペットとの間において推測される親族関係を少なくとも1つ特定する工程と、解析する工程に基づいて、少なくとも1つの推測される親族関係を少なく出力する工程と、を含むことができる。
【0007】
一態様では、非一時的なコンピュータ可読媒体の例示的な実施形態は、命令をプロセッサによって実行した場合に、プロセッサに、コンパニオンペットのDNA情報を使用してコンパニオンペットの親族関係を推測するための動作を実行させる命令を収容する。この動作は、少なくとも1つのDNA配列を含む、コンパニオンペットのDNA情報を受信する工程と、少なくとも1つのDNA配列をデータベースに送信する工程であって、少なくとも1つのDNA配列を受信したデータベースが、マッチした少なくとも1頭のコンパニオンペットに対応する一致した染色体セグメントを少なくとも1つ含む、局所的なDNA断片パターンを少なくとも1つ検索して出力する工程と、少なくとも1つの局所的なDNA断片パターンを解析することにより、コンパニオンペットとマッチした少なくとも1頭のコンパニオンペットとの間において推測される親族関係を少なくとも1つ特定する工程と、解析する工程に基づいて、少なくとも1つの推測される親族関係を少なく出力する工程と、を含むことができる。
【0008】
一態様では、コンパニオンペットのDNA情報を使用してコンパニオンペットの親族関係を推測できるように機械学習システムを訓練するための方法の例示的な実施形態は、コンパニオンペットのDNA情報(少なくとも1つのDNA配列と、マッチした少なくとも1頭のコンパニオンペットと、コンパニオンペットとこれにマッチした少なくとも1頭のコンパニオンペットとの間の親族関係に対応する少なくとも1つの続柄ラベルを含む)を受信するステップと、この受信するステップを受けて、少なくとも1つのDNA配列から少なくとも1つの親族関係を推測できるように機械学習モデルを訓練するステップと、を含むことができる。また、訓練するステップは、少なくとも1つのDNA配列のそれぞれについて、マッチした少なくとも1頭のコンパニオンペットに対応する少なくとも1つの局所的なDNA断片パターンをデータベースから抽出するステップと、少なくとも1つの局所的なDNA断片パターンを解析することにより、コンパニオンペットとこれにマッチした少なくとも1頭のコンパニオンペットとの間において推測される親族関係を少なくとも1つ特定するステップと、解析に基づいて、少なくとも1つの推測される親族関係とこれに対応する少なくとも1つの信頼度を特定するステップと、をさらに含むことができる。
【0009】
さらなる態様では、コンパニオンペットのDNA情報を使用してコンパニオンペットの親族関係を推測できるように機械学習システムを訓練するためのコンピュータシステムの例示的な実施形態は、命令を格納する少なくとも1つのメモリと、命令を実行することにより動作を実行するように構成された少なくとも1つのプロセッサと、を備えることができる。この動作は、コンパニオンペットのDNA情報(少なくとも1つのDNA配列と、マッチした少なくとも1頭のコンパニオンペットと、コンパニオンペットとこれにマッチした少なくとも1頭のコンパニオンペットとの間の血縁関係に対応する少なくとも1つの続柄ラベルを含む)を受信する工程と、この受信する工程を受けて、少なくとも1つのDNA配列から少なくとも1つの親族関係を推測できるように機械学習モデルを訓練する工程と、を含むことができる。また、訓練する工程は、少なくとも1つのDNA配列のそれぞれについて、マッチした少なくとも1頭のコンパニオンペットに対応する少なくとも1つの局所的なDNA断片パターンをデータベースから抽出する工程と、少なくとも1つの局所的なDNA断片パターンを解析することにより、コンパニオンペットとこれにマッチした少なくとも1頭のコンパニオンペットとの間において推測される親族関係を少なくとも1つ特定する工程と、解析に基づいて、少なくとも1つの推測される親族関係とこれに対応する少なくとも1つの信頼度を特定する工程と、をさらに含むことができる。
【0010】
さらなる態様では、非一時的なコンピュータ可読媒体は、命令をプロセッサによって実行した場合に、プロセッサに、コンパニオンペットのDNA情報を使用してコンパニオンペットの親族関係を推測できるように機械学習システムを訓練するための動作を実行させる命令を収容することができる。この動作は、コンパニオンペットのDNA情報(少なくとも1つのDNA配列と、マッチした少なくとも1頭のコンパニオンペットと、コンパニオンペットとこれにマッチした少なくとも1頭のコンパニオンペットとの間の血縁関係に対応する少なくとも1つの続柄ラベルを含む)を受信する工程と、この受信する工程を受けて、少なくとも1つのDNA配列から少なくとも1つの親族関係を推測できるように機械学習モデルを訓練する工程と、を含むことができる。また、訓練する工程は、少なくとも1つのDNA配列のそれぞれについて、マッチした少なくとも1頭のコンパニオンペットに対応する少なくとも1つの局所的なDNA断片パターンをデータベースから抽出する工程と、少なくとも1つの局所的なDNA断片パターンを解析することにより、コンパニオンペットとこれにマッチした少なくとも1頭のコンパニオンペットとの間において推測される親族関係を少なくとも1つ特定する工程と、解析に基づいて、少なくとも1つの推測される親族関係とこれに対応する少なくとも1つの信頼度を特定する工程と、をさらに含むことができる。
【0011】
上述の概略的説明および以下の詳細な説明は、特許請求の範囲に記載した本開示の実施形態を例示的に説明するものに過ぎず、特許請求の範囲に記載した本開示の実施形態の開示内容を限定するものではないことを理解されたい。
【図面の簡単な説明】
【0012】
添付の図面は、本明細書に組み込まれるとともにその一部を構成するものであり、種々の例示的な実施形態を例示して、以下の説明と併せて本開示の実施形態の原理を説明するためのものである。
【
図1A】1つ以上の実施形態に係る、コンパニオンペットの親族関係を推測するためのプラットフォームの例示的な環境を示す図
【
図1B】1つ以上の実施形態に係る、コンパニオンペットの親族関係を推測するためのプラットフォームの例示的な環境を示す図
【
図1C】1つ以上の実施形態に係る、コンパニオンペットの親族関係を推測するためのプラットフォームの例示的な環境を示す図
【
図1D】1つ以上の実施形態に係る、コンパニオンペットの親族関係を推測するためのプラットフォームの例示的な環境を示す図
【
図1E】1つ以上の実施形態に係る、コンパニオンペットの親族関係を推測するためのプラットフォームの例示的な環境を示す図
【
図1F】1つ以上の実施形態に係る、コンパニオンペットの親族関係を推測するためのプラットフォームの例示的な環境を示す図
【
図1G】1つ以上の実施形態に係る、コンパニオンペットの親族関係を推測するためのプラットフォームの例示的な環境を示す図
【
図1H】1つ以上の実施形態に係る、コンパニオンペットの親族関係を推測するためのプラットフォームの例示的な環境を示す図
【
図1I】1つ以上の実施形態に係る、コンパニオンペットの親族関係を推測するためのプラットフォームの例示的な環境を示す図
【
図1J】1つ以上の実施形態に係る、コンパニオンペットの親族関係を推測するためのプラットフォームの例示的な環境を示す図
【
図2】1つ以上の実施形態に係る、コンパニオンペットの親族関係を推測できるように機械学習モデルを訓練するための例示的な方法を示すフローチャート
【
図3】1つ以上の実施形態に係る、少なくとも1つの局所的なDNA断片パターンを解析することにより、推測される親族関係を少なくとも1つ特定することができるように機械学習モデルを訓練するための例示的な方法を示すフローチャート
【
図4】1つ以上の実施形態に係る、コンパニオンペットとこれにマッチしたコンパニオンペットとの間の少なくとも1つの共有形質を推測することができるように機械学習モデルを訓練するための例示的な方法をさらに示すフローチャート
【
図5】1つ以上の実施形態に係る、DNAがマッチしたコンパニオンペットサンプルの一覧を出力することができるように機械学習モデルを訓練するための例示的な方法をさらに示すフローチャート
【
図6】1つ以上の実施形態に係る、コンパニオンペットのDNA情報を使用してコンパニオンペットの親族関係を推測するための例示的なプロセスを示す図
【
図7】1つ以上の実施形態に係る、本明細書で提示する技術を利用することができる例示的な環境を示す図
【
図8】1つ以上の実施形態に係る、本明細書で提示する技術を実行することができるコンピューティングデバイスの一例を示す図
【発明を実施するための形態】
【0013】
本開示の特定の態様によれば、コンパニオンペットの親族関係を推測するための方法およびシステムが開示される。従来の技術ではコンパニオンペットの近親交配が考慮されていなかったため、この目的には適していないと考えられる。したがって、コンパニオンペットの親族関係を推測する技術の改良が求められている。
【0014】
DNA断片などの遺伝子データを用いて、血縁関係が互いに近いコンパニオンペットを見つけることが行われている。例えば、そのようなプロセスには、少なくとも2頭のコンパニオンペットのゲノムの長鎖DNA断片を解析して、どのDNA断片が同一であるかを特定する工程が含まれる。このような同一の長鎖DNA断片を、「同祖(identical-by-descent:IBD)」断片と呼ぶことができる。ただし、同一のDNA断片のすべてが同祖断片と言えるわけではない。例えば、近親交配の産物である純血種の犬の多くは、その血統の犬の間で同一のDNAが長く続いている。品種とは、特定の特徴を発現させるように少数の個体を近親交配することにより作られたものだからである。また、DNA断片が、同祖断片なのか、近親交配の結果なのかを特定することができないプロセスでは、これら2頭のコンパニオンペットの親族関係を続柄として特定することもできない。さらに、遺伝的な観点から見ると、曾祖父母と曾孫の間や、おじ、おば、姪、甥の間のように、続柄が異なっていても同祖DNAの量が同量である場合もある。したがって、DNA断片が、同祖断片なのか、近親交配の結果なのかを特定し、同祖DNAに基づいて親族関係を続柄として特定したいというニーズが存在している。
【0015】
以下に詳述するように、種々の実施形態において、機械学習モデルを使用してコンパニオンペットの親族関係を推測するためのシステムおよび方法を説明する。機械学習モデルを訓練(例えば、教師あり学習または半教師あり学習によって訓練)することにより、コンパニオンペットのDNA情報の間の関連性(例えば、品種、マッチした少なくとも1頭のコンパニオンペット、少なくとも1つの続柄ラベル)を学習させることによって、訓練済み機械学習モデルを利用してコンパニオンペットの親族関係を推測できるようにすることができる。
【0016】
本明細書では、コンパニオンペットの親族関係を推測するように適合することができる機械学習技術の様々な態様を提示する。以下に詳述するように、コンパニオンペットの親族関係を推測するように適合された機械学習技術は、本開示に係る1つ以上の態様として、例えば、訓練データの特定の選択手法、機械学習モデルの特定の訓練プロセス、訓練済み機械学習モデルと組み合わせて使用するのに適した特定のデバイスの動作、特定のデータに連携させた機械学習モデルの動作、機械学習モデルによるかかる特定のデータの修正手法、当業者であれば本開示に基づいて明らかな他の態様、またはそのいずれかの組み合わせを含むことができる。
【0017】
親類検索プラットフォーム
図1A~
図1Jは、1つ以上の実施形態に係る、コンパニオンペットの親族関係を推測するためのプラットフォームの例示的な環境を示す図である。
【0018】
図1Aは、1つ以上の実施形態に係る、コンパニオンペットの親族関係を推測するためのプラットフォームの例示的な環境における「概要(Highlights)」ページを示している。本プラットフォームは、コンパニオンペットの名前(例えば、ココ(Coco))、画像、またはその両方を表示するとともに、コンパニオンペットのいる場所(例えば、オレゴン州ポートランド)、ソーシャルメディアのアカウント(例えば、@cocothegreat)、またはその両方を表示することができる。さらに、本プラットフォームは、「いいね!」ボタン(例えば、ハートボタン)、コンパニオンペットの視点からの1つ以上のコメント(例えば、「泥遊びができるから雨が大好き。お父さん、お母さんはうんざりしてるけどね。お気に入りの遊びはね、...」)、またはその両方をさらに表示することができる。また、これに加えて、コンパニオンペットの画像を囲むようにカラフルな丸い輪を表示することもできる。このカラフルな丸い輪(詳細は後述)は、当該コンパニオンペットの品種構成に対応したものとすることができる。
【0019】
図1Bは、1つ以上の実施形態に係る、コンパニオンペットの親族関係を推測するためのプラットフォームの例示的な環境における「概要」ページのトップにある品種欄をさらに示している。
【0020】
「概要」ページのトップにある品種欄には、
図1Aに示す欄から下にスクロールする(例えば、上にスワイプする)ことによりアクセスすることができる。プラットフォームは、ページトップにある品種欄で、コンパニオンペットの品種構成の内訳をさらに表示することができる。例えば、
図1Bに示すコンパニオンペットは、グレートピレニーズ(26%)、ジャーマンシェパード(15%)、ボースロン(13%)、ホワイトスイスシェパード(13%)、チャウチャウ(13%)という品種構成を有している。さらに、プラットフォームは、割合閾値以上の割合の品種のみを表示することもできる。割合閾値は、例えば、6.25%とすることができる。例えば、機械学習モデルにより、コンパニオンペットが有する品種として、8つの異なる品種が特定される場合が考えられる。ただし、これら8つの異なる品種のうち3つの品種のコンパニオンペットに占める割合が、それぞれ6.25%未満であることも、機械学習モデルが特定する場合があると考えられる。その場合、プラットフォームは、6.25%の閾値を上回る5つの品種のみを表示することができる。さらに、プラットフォームは、コンパニオンペットの画像を囲むように、コンパニオンペットの品種構成を視覚的に表す丸い輪を表示することもできる。例えば、
図1Bでは、グレートピレニーズの品種に特定の色が割り当てられている。コンパニオンペットの26%がグレートピレニーズであるため、丸い輪の26%の部分が、グレートピレニーズを示す特定の色を有している。また、コンパニオンペットを構成するすべての品種を示す完全な内訳を、丸い輪で視覚的に表すこともできる。
【0021】
プラットフォームは、コンパニオンペットの親類(relatives)の総数を表示することもできる。親類の総数は、親族関係を推測するための機械学習モデルを用いて決定することができる。かかる機械学習モデルの詳細については後述する。また、プラットフォームは、親類の総数の表示に加えて、親類の総数の内訳を表示することもできる。より具体的には、プラットフォームは、近縁の親類(close relatives)の数、やや遠縁の親類(extended relatives)の数、遠縁の親類(distant relatives)の数、またはそのいずれかの組み合わせを表示することができる。例えば、
図1Bでは、プラットフォームは、コンパニオンペットに、近縁の親類が8頭、やや遠縁の親類が12頭、遠縁の親類が43頭いることを示している。
【0022】
図1Cは、1つ以上の実施形態に係る、コンパニオンペットの親族関係を推測するためのプラットフォームの例示的な環境における「概要」ページの近縁親族欄をさらに示している。
【0023】
「概要」ページの近縁親族欄には、
図1Bに示す欄からさらに下にスクロールする(例えば、上にスワイプする)ことによりアクセスすることができる。プラットフォームは、近縁親族欄で、コンパニオンペットの親類としてマッチしたコンパニオンペットのプロフィールのサムネイルのうちの一部のサムネイルを表示することができる。例えば、プラットフォームは、コンパニオンペットの近縁親類としてマッチしたコンパニオンペットのプロフィールのサムネイルのみを表示することができる。各プロフィールのサムネイルには、画像、名前、画像を囲む丸い輪、場所、血縁関係の種類、共通性比率、またはそのいずれかの組み合わせを含めることができる。例えば、画像は、マッチしたコンパニオンペットの写真とすることができ、画像の外周を丸い輪で囲むことができる。この丸い輪で、マッチしたコンパニオンペットの品種構成を視覚的に表すことができる。また、プロフィールのサムネイルには、名前(例えば、エマ(Emma))と場所(例えば、コロラド州デンバー)を含めることもできる。プラットフォームは、マッチしたコンパニオンペットとコンパニオンペットとの血縁関係の種類(例えば、近親の親族)を表示することもできる。例えば、プラットフォームは、マッチしたコンパニオンペットが、コンパニオンペットの近縁の親類、やや遠縁の親類、遠縁の親類のいずれであるかを表示することができる。また、さらに、プラットフォームは、コンパニオンペットとこれにマッチしたコンパニオンペットとの間で共有しているDNA断片の割合を示す共通性比率を表示することもできる。例えば、共通性比率は、パーセント(例えば、50%)で表すことができる。近縁親族欄における、マッチしたコンパニオンペットの表示順は、共通点比率に基づいた順番とすることができる。さらに、プラットフォームは、マッチしたコンパニオンペットのうちの一部のみではなく、マッチしたコンパニオンペットをすべて表示するオプション(例えば、「63頭の親類をすべて見る」)をユーザに提示することができる。
【0024】
図1Dは、1つ以上の実施形態に係る、コンパニオンペットの親族関係を推測するためのプラットフォームの例示的な環境における「親類(Relatives)」ページを示している。例えば、ユーザが「概要」ページで「63頭の親類をすべて見る」ボタンを選択すると、プラットフォームは、マッチしたコンパニオンペットに対応するすべてのプロフィールサムネイルを表示することができる。プラットフォームは、一部および/またはすべてのプロフィールサムネイルに続柄ラベル(例えば、母)を表示することができる。
【0025】
図1Eは、1つ以上の実施形態に係る、コンパニオンペットの親族関係を推測するためのプラットフォームの例示的な環境における、マッチしたコンパニオンペットの詳細プロフィールページを示している。
【0026】
例えば、ユーザがプロフィールサムネイルを選択すると、プラットフォームは、そのプロフィールサムネイルが示すマッチしたコンパニオンペットに対応する詳細プロフィールページを表示することができる。詳細プロフィールページには、マッチしたコンパニオンペットの名前(例えば、エマ)、マッチしたコンパニオンペットの画像、マッチしたコンパニオンペットの年齢(例えば、3歳1カ月)、マッチしたコンパニオンペットの性別(例えば、メス)、マッチしたコンパニオンペットの視点からの1つ以上のコメント(例えば、「泥遊びができるから雨が大好き。お父さん、お母さんはうんざりしてるけどね。お気に入りの遊びはね、...」)、またはそのいずれかの組み合わせを含めることができる。
【0027】
図1Fは、1つ以上の実施形態に係る、コンパニオンペットの親族関係を推測するためのプラットフォームの例示的な環境における、マッチしたコンパニオンペットの詳細プロフィールページの「血縁関係」欄をさらに示している。
【0028】
マッチしたコンパニオンペットの詳細プロフィールページの「血縁関係」欄には、
図1Eに示す欄から下にスクロールする(例えば、上にスワイプする)ことによりアクセスすることができる。また、プラットフォームは、親族関係、インフォグラフィック、共通性比率、またはそのいずれかの組み合わせをさらに表示することもできる。プラットフォームは、コンパニオンペットとこれに対応するマッチしたコンパニオンペットとの間の親族関係を表示することができる。インフォグラフィックで、親族関係を視覚的に表すことができる。さらに、共通性比率で、コンパニオンペットとこれにマッチしたコンパニオンペットとの間で共有しているDNA断片の割合を示すこともできる。また、ベン図などのインフォグラフィックを用いて、共通性比率をさらに示すことできる。親族関係は、機械学習モデルによって推測することができるが、このプロセスについては後述する。
【0029】
図1Gは、1つ以上の実施形態に係る、コンパニオンペットの親族関係を推測するためのプラットフォームの例示的な環境における、マッチしたコンパニオンペットの詳細プロフィールページの「場所」欄をさらに示している。マッチしたコンパニオンペットの詳細プロフィールページの「場所」欄には、
図1Fに示す欄から下にスクロールする(例えば、上にスワイプする)ことによりアクセスすることができる。また、プラットフォームは、マッチしたコンパニオンペットの住所を表示する(例えば、「エマはコロラド州デンバーに住んでいます。」)とともに、コンパニオンペットの住所とマッチしたコンパニオンペットの住所をともに表示する詳細な地図ビューを表示することができる。
【0030】
図1Hは、1つ以上の実施形態に係る、コンパニオンペットの親族関係を推測するためのプラットフォームの例示的な環境における、マッチしたコンパニオンペットの詳細プロフィールページの「品種比較」欄を示している。
【0031】
マッチしたコンパニオンペットの詳細プロフィールページの「品種比較」欄には、
図1Gに示す欄から下にスクロールする(例えば、上にスワイプする)ことによりアクセスすることができる。プラットフォームは、コンパニオンペットとこれにマッチしたコンパニオンペットとの間で重なり合うDNA断片の類似点についての詳細な比較を表示することができる。この詳細な比較には、コンパニオンペットとマッチしたコンパニオンペットとを左右に並べて比較する、コンパニオンペットとマッチしたコンパニオンペットのうちの少なくとも一方が持つすべて品種の一覧などの表示を含めることができる。かかる左右に並べて比較する表示には、左右に並べて表示したコンパニオンペットの画像とマッチしたコンパニオンペットの画像や、各画像を囲む丸い輪の表示も含めることができる。また、左右に並べて比較する表示に、一覧表示した品種のそれぞれが、コンパニオンペットとマッチしたコンパニオンペットにどれだけ含まれているかを示す比率(例えば、パーセント比率)をさらに含めることもできる。また、さらに、プラットフォームは、コンパニオンペットとこれにマッチしたコンパニオンペットが共通に持っている品種の数を表示する(例えば、「ココとエマに共通の品種は3つです。」)こともできる。
【0032】
図1Iは、1つ以上の実施形態に係る、コンパニオンペットの親族関係を推測するためのプラットフォームの例示的な環境における、マッチしたコンパニオンペットの詳細プロフィールページの「共通品種」欄を示している。
【0033】
マッチしたコンパニオンペットの詳細プロフィールページの「共通品種」欄には、
図1Hに示す欄から下にスクロールする(例えば、上にスワイプする)ことによりアクセスすることができる。プラットフォームは、コンパニオンペットとこれにマッチしたコンパニオンペットが共通に持っているコンパニオンペット品種の一覧を表示することができる。この一覧表示は、各コンパニオンペット品種に対応するグラフィック画像を表示することにより行うことができる。さらに、プラットフォームは、各共通品種(例えば「グレートピレニーズ」)に関する追加情報をユーザが得ることができる欄またはリンクを表示することもできる。
【0034】
図1Jは、1つ以上の実施形態に係る、コンパニオンペットの親族関係を推測するためのプラットフォームの例示的な環境における、マッチしたコンパニオンペットの詳細プロフィールページの「健康状態」欄を示している。
【0035】
マッチしたコンパニオンペットの詳細プロフィールページの「健康状態」欄には、
図1Iに示す欄から下にスクロールする(例えば、上にスワイプする)ことによりアクセスすることができる。「健康状態」欄には、コンパニオンペットとこれにマッチしたコンパニオンペットが共通に持っている健康関連遺伝子に関する情報を含めることができる。プラットフォームは、健康関連遺伝子の名前、健康関連遺伝子の状態、健康関連遺伝子のコピー数、健康関連遺伝子についてユーザがさらに詳しく知ることができる機会となるもの、またはそのいずれかの組み合わせを示すことができる。例えば、健康関連遺伝子の名前は、「変性性脊髄症(Degenerative Myelopathy:DM)」とすることができ、プラットフォームは、コンパニオンペットやこれにマッチしたコンパニオンペットが持っている「変性性脊髄症」のコピー数を表示することができる。さらに、プラットフォームは、コンパニオンペットやこれにマッチしたコンパニオンペットが当該健康関連遺伝子に関する「リスクあり(At Risk)」の状態にあるのか、または健康関連遺伝子について「特記事項あり(Notable)」であるかを示す健康関連遺伝子の状態も示すこともできる。また、プラットフォームは、さらに詳しく知るための機会として、「変性性脊髄症」に関する詳細情報へのリンク(例えば、「DMについて知る」)などを提供することもできる。
【0036】
親族関係を推測するために行う機械学習モデルの訓練
図2は、1つ以上の実施形態に係る、コンパニオンペットの親族関係を推測できるように機械学習モデルを訓練するための例示的なプロセスを示す。最初に、本方法は、コンパニオンペットのDNA情報を受信するステップ(ステップ202)を含むことができる。コンパニオンペットのDNA情報には、少なくとも1つのDNA配列と、マッチした少なくとも1頭のコンパニオンペットと、コンパニオンペットとこれにマッチした少なくとも1頭のコンパニオンペットとの間の親族関係に対応する少なくとも1つの続柄ラベルと、を含めることができる。いくつかの実施形態では、コンパニオンペットDNA情報に、少なくとも1つのコンパニオンペット品種ラベル(例えば、シュナウザー、ドーベルマンなど)をさらに含めることができる。これに加えて、例えば、コンパニオンペットのDNA情報の2組の染色体のうちの1組の染色体または2組の染色体に、マッチした少なくとも1頭のコンパニオンペットと一致するものがあるかどうかや、マッチした少なくとも1頭のコンパニオンペットと一致するDNA断片の数をさらに含むことができる。さらに、少なくとも1つの続柄ラベルには、母、父、姉妹、兄弟、おじ、おば、姪、甥、いとこ、祖父、祖母、孫息子、孫娘、曾祖父、曾祖母、曾孫息子、曾孫娘、半血の母、半血の父、半血の姉妹、半血の兄弟、半血のおじ、半血のおば、半血の姪、半血の甥、半血のいとこ、半血の祖父、半血の祖母、半血の孫息子、半血の孫娘、半血の曾祖父、半血の曾祖母、半血の曾孫息子、半血の曾孫娘のうちの少なくとも1つを含めることができる。
【0037】
本方法は、コンパニオンペットのDNA情報を受信すると、少なくとも1つのDNA配列から少なくとも1つの親族関係を推測できるように機械学習モデルを訓練するステップ(ステップ204)を含むことができる。なお、この訓練するステップについては、下記のステップ206、208、210に関する説明で詳しく説明する。一実施形態では、機械学習モデルとして、マルチラベル分類用の決定木モデル(例えば、マルチラベル分類用の決定木の勾配ブースティング)用いることができる。ただし、本開示において企図されている機械学習モデルは、決定木モデルに限定されるものではなく、本開示において提示している分類問題を解決するように構成された任意のモデルとすることができる。
【0038】
上記の訓練するステップは、少なくとも1つのDNA配列のそれぞれについて、マッチしたコンパニオンペットに対応する少なくとも1つの局所的なDNA断片パターンをデータベースから抽出するステップ(ステップ206)を含むことができる。DNA配列は、コンパニオンペットDNA配列のデータベースに入力することができる。データベースには、数百、数千、または数百万のコンパニオンペットDNA配列エントリを収めることができる。DNA配列を受信したデータベースは、局所的なDNA断片パターンを少なくとも1つ検索して出力することができ、この少なくとも1つの局所的なDNA断片パターンに、局所的に一致する染色体セグメントを少なくとも1つ含めることができる。なお、かかる局所的に一致する染色体セグメントは、入力されたDNA配列の1つ以上の染色体セグメントと完全に一致するものであってもよい。DNA配列の受信時に、データベースから絞り込みオプションを提供することもでき、例えば、局所的に一致している部分の長さによる絞り込みオプションを提供することができる。例えば、近親交配の結果、複数のコンパニオンペット品種の大半で一致している可能性がある長さの短い同一セグメントを除外するため、局所的に一致している部分の長さを18センチモルガンで絞り込むことが有益な場合がある。また、DNAの遺伝型解析やフェージング解析に誤差が生じている可能性を考慮に入れるため、得られた局所的な染色体セグメントをつなぎ合わせることもできる。そして、このようにつなぎ合わせた局所的な染色体セグメントを、すべての染色体について集めることができる。
【0039】
上記の訓練するステップは、少なくとも1つの局所的なDNA断片パターンを解析することにより、コンパニオンペットとこれにマッチしたコンパニオンペットとの間において推測される親族関係を少なくとも1つ特定するステップ(ステップ208)をさらに含むことができる。例えば、少なくとも1つの推測される親族関係は、母、父、姉妹、兄弟、おじ、おば、姪、甥、いとこ、祖父、祖母、孫息子、孫娘、曾祖父、曾祖母、曾孫息子、曾孫娘、半血の母、半血の父、半血の姉妹、半血の兄弟、半血のおじ、半血のおば、半血の姪、半血の甥、半血のいとこ、半血の祖父、半血の祖母、半血の孫息子、半血の孫娘、半血の曾祖父、半血の曾祖母、半血の曾孫息子、半血の曾孫娘のうちの少なくとも1つを含むことができる。この解析するステップについては、
図3(後記)にて詳述する。
【0040】
また、上記の訓練するステップは、上記の解析するステップに基づいて、少なくとも1つの推測される親族関係とこれに対応する少なくとも1つの信頼度を特定するステップ(ステップ210)を含むこともできる。また、これに加えて、本方法は、一致している部分の長さを求めるステップを含むこともできる。ここで、一致している部分の長さは、少なくとも1つの局所的なDNA断片パターンにおける断片の数に対応する。また、本方法は、少なくとも1つの推測される親族関係、これに対応する少なくとも1つの信頼度、またはその両方を、結果データベースに格納するステップをさらに含むことができる。また、本方法は、少なくとも1つの推測される親族関係、これに対応する少なくとも1つの信頼度、一致している部分の長さ、またはそのいずれかの組み合わせを、ユーザインタフェースを介してユーザに表示するステップを含むこともできる。
図1Cと
図1Dには、推測される2つの親族関係(例えば、「母」と「父」)を表示するユーザインタフェースの例が示されている。
【0041】
なお、
図2には、例示的な方法200の例示的なブロックを示しているが、いくつかの実施態様では、
図2に示すブロックに、ブロックの追加、ブロックの削減、ブロックの変更、またはブロックの順序変更を施した例示的な方法200も可能である。また、これに加えてまたは代えて、例示的な方法200の2つ以上のブロックを同時に実行することもできる。
【0042】
図3は、少なくとも1つの局所的なDNA断片パターンを解析することにより、コンパニオンペットとこれにマッチした少なくとも1頭のコンパニオンペットとの間において推測される親族関係を少なくとも1つ特定することができるように機械学習モデルを訓練するための例示的な方法300を含むことができる。なお、
図3に示す方法300は、
図2のステップ208に対応する。
【0043】
上述したように、本方法は、少なくとも1つの局所的なDNA断片パターンを解析することにより、コンパニオンペットとこれにマッチした少なくとも1頭のコンパニオンペットとの間において推測される親族関係を少なくとも1つ特定するステップ(ステップ302)を含むことができる。この解析するステップの詳細またはサブステップについては、以下のステップ304~314を参照してさらに詳しく説明する。なお、ステップ304~314で特定した1つ以上の指標を用いて、機械学習モデルを訓練することができる。
【0044】
少なくとも1つの局所的なDNA断片パターンは、複数の同祖(IBD)断片を含むことができる。同祖断片は、コンパニオンペットとこれにマッチしたコンパニオンペットの間で配列が全く同じである長鎖DNA断片であり得る。ただし、2頭のコンパニオンペットの間で同じDNA断片があれば、それらのすべてが同祖断片とみなされるわけではない。例えば、純血種の犬は近親交配されているため、その血統の犬の間で同一のDNAが長く続いている可能性がある。
【0045】
上記の解析するステップは、複数の同祖断片を解析して、少なくとも1つの局所的なDNA断片パターンに含まれる同祖断片の総数を特定するステップ(ステップ304)をさらに含むことができる。
【0046】
また、上記の解析するステップは、複数の同祖断片を解析して、少なくとも1つの局所的なDNA断片パターンに含まれる複数の同祖断片の合計長さを特定するステップ(ステップ306)をさらに含むこともできる。なお、複数の同祖断片の合計長さはセンチモルガン単位で測定することができる。
【0047】
また、上記の解析するステップは、少なくとも1つの局所的なDNA断片パターンを解析して、少なくとも1つの局所的なDNA断片パターンが、コンパニオンペットが有する2組の染色体のうちの1組の染色体に生じているか、2組の染色体の双方に生じているかを特定するステップ(ステップ308)をさらに含むことができる。
【0048】
また、上記の解析するステップは、少なくとも1つのDNA配列のうち、複数の同祖断片のいずれも含まないDNA配列の割合を特定するステップ(ステップ310)をさらに含むことができる。また、上記の解析するステップは、少なくとも1つのDNA配列のうち、2組中1組の染色体にのみ複数の同祖断片を含むDNA配列の割合を特定するステップ(ステップ312)をさらに含むことができる。また、上記の解析するステップは、少なくとも1つのDNA配列のうち、2組の染色体の双方に複数の同祖断片を含むDNA配列の割合を特定するステップ(ステップ314)をさらに含むことができる。
【0049】
上述の解析(例えば、解析時に特定した様々な指標)は、コンパニオンペットとこれにマッチしたコンパニオンペットとの間の親族関係を評価する(これらの指標を、特徴として機械学習モデルに提供することにより評価する)際に役立てることができる。例えば、少なくとも1つのDNA配列のうち、複数の同祖断片のいずれも含まないDNA配列(IBD0と呼ぶ)の割合を特定することが、親族関係がある可能性の有無を判定するのに有用である場合がある。IBD0の割合が非常に高い場合、親族関係がある可能性は低いと考えられる。さらに、2頭の半血の(例えば、片親が同じ)兄弟姉妹の例を挙げれば、このような2頭は、同じ親から1組の染色体を受け継いでいる。よって、半血の兄弟姉妹である2頭の間では、同じ親から受け継いだ染色体の組でのみ同祖性を有することになる。かかる状況(IBD1と呼ぶ)は、コンパニオンペットとこれにマッチしたコンパニオンペットの双方において、2組中1組の染色体にのみ同祖断片を持つDNA配列の割合を特定することにより証明することができる。また、他の例として、全血の(例えば、両親が同じ)兄弟姉妹の例を挙げると、この場合、2組の染色体のうち2組とも祖先が同じであるため、全血の兄弟姉妹の間では、2組の染色体の双方で同祖性を有することになる。かかる状況(IBD2と呼ぶ)は、コンパニオンペットとこれにマッチしたコンパニオンペットの双方において、2組の染色体の双方に同祖性を有するDNA配列の割合を特定することにより証明することができる。上記のような状況の例を、表1(下記)にさらに示す。
【0050】
【0051】
また、本方法は、コンパニオンペットとこれにマッチした少なくとも1頭のコンパニオンペットについて、それぞれの近親交配度を示すホモ接合性(homozygosity-by-descent:HBD)のレベル(ホモ接合度)を特定するステップ(ステップ316)を含むこともできる。ホモ接合性から、コンパニオンペットの系譜における近親交配度に関する情報が得られる。純血種の動物と非近交系の動物では、純血種の動物の方がホモ接合度は高くなると予想される。例えば、コンパニオンペットとこれにマッチしたコンパニオンペットの対それぞれについて、コンパニオンペットのホモ接合性およびマッチしたコンパニオンペットのホモ接合性という2つの指標を、機械学習モデルが行う全体解析の際の追加指標として用いる。換言すれば、ステップ304~314で特定した指標に加えて、コンパニオンペットのホモ接合性およびマッチしたコンパニオンペットのホモ接合性も、機械学習モデルの訓練に使用することができる。
【0052】
一実施形態では、モデルの精度を決定するために、交差検証法を利用することもできる。例えば、訓練データセット(すなわち、訓練パネル)に含まれる正解の続柄ラベルのうちの一部にマスクをかけ、訓練データセットの残りの部分から構築した機械学習モデルに基づいて、マスクをかけたラベルを推定することにより行うことができる。
【0053】
なお、
図3には、例示的な方法300の例示的なブロックを示しているが、いくつかの実施態様では、
図3に示すブロックに、ブロックの追加、ブロックの削減、ブロックの変更、またはブロックの順序変更を施した例示的な方法300も可能である。また、これに加えてまたは代えて、例示的な方法300の2つ以上のブロックを同時に実行することもできる。
【0054】
図4は、1つ以上の実施形態に係る、コンパニオンペットとこれにマッチしたコンパニオンペットとの間の少なくとも1つの共有形質を推測することができるように機械学習モデルを訓練するための方法400をさらに示している。
【0055】
本方法は、少なくとも1つの局所的なDNA断片パターンに、重なり合う形質が少なくとも1つあることを特定するステップ(ステップ402)を含むことができる。例えば、この少なくとも1つの形質は、品種に特異的な形質とすることができる。形質の例としては、眼の色や、毛色、健康関連遺伝子を挙げることができる。また、本方法は、重なり合う形質が少なくとも1つあることを特定すると、マッチした少なくとも1頭のコンパニオンペットとの間で当該少なくとも1つの形質を共有していることを示す通知を出力するステップ(ステップ404)をさらに含むことができる。
【0056】
なお、
図4には、例示的な方法400の例示的なブロックを示しているが、いくつかの実施態様では、
図4に示すブロックに、ブロックの追加、ブロックの削減、ブロックの変更、またはブロックの順序変更を施した例示的な方法400も可能である。また、これに加えてまたは代えて、例示的な方法400の2つ以上のブロックを同時に実行することもできる。
【0057】
図5は、1つ以上の実施形態に係る、DNAがマッチしたコンパニオンペットサンプルの一覧を出力することができるように機械学習モデルを訓練するための方法500をさらに示している。なお、方法500は、
図2に示す方法200を補完する方法とすることができ、その場合、ステップ502が
図2のステップ210に対応する。
【0058】
上述の
図2に関する説明で述べたように、本方法は、上記の解析するステップに基づいて、少なくとも1つの推測される親族関係とこれに対応する少なくとも1つの信頼度を特定するステップ(ステップ502)を含むことができる。また、本方法は、当該特定するステップを機械学習モデルが行った結果に基づいて、DNAがマッチしたコンパニオンペットサンプルの一覧を出力するステップ(ステップ504)をさらに含むことができる。ここで、DNAがマッチしたコンパニオンペットサンプルとは、マッチ閾値を満たすか上回るかしたコンパニオンペットサンプルである。例えば、データベースから、2つ以上の局所的なDNA断片パターンが返された場合に、返された局所的なDNA断片パターンのすべてを一覧に表示することができる。また、返された局所的なDNA断片パターンのうち、閾値を満たすか上回るかした局所的なDNA断片パターンのみを一覧に表示することもできる。この閾値には、最大表示件数(例えば、50件)を加味することもでき、カットオフDNAマッチ割合値を含めることもできる。カットオフDNAマッチ割合値は、データベースの局所的なDNA断片のうち、コンパニオンペットのすべてのDNA断片と一致する局所的なDNA断片のパーセント比率を特定することにより計算することができる。例えば、閾値に、6.25%のカットオフDNA割合値を含めることができる。
【0059】
なお、
図5には、例示的な方法500の例示的なブロックを示しているが、いくつかの実施態様では、
図5に示すブロックに、ブロックの追加、ブロックの削減、ブロックの変更、またはブロックの順序変更を施した例示的な方法500も可能である。また、これに加えてまたは代えて、例示的な方法500の2つ以上のブロックを同時に実行することもできる。
【0060】
訓練済み機械学習モデルを用いた親族関係の推測
以下では、1つ以上の実施形態に係る、コンパニオンペットの親族関係を(例えば、上述の1つ以上の実施形態に従い訓練した機械学習モデルなどの、訓練された機械学習モデルを利用することにより)推測するための例示的なプロセスを説明する。
【0061】
本方法は、コンパニオンペットのDNA情報を受信するステップを含むことができる。コンパニオンペットのDNA情報には、少なくとも1つのDNA配列を含めることができる。コンパニオンペットのDNA情報の受信は、機械学習モデルが行うことができる。機械学習モデルは、事前に訓練しておくことができる。
【0062】
本方法は、コンパニオンペットのDNA情報を受信すると、訓練済み機械学習モデルを使用して、少なくとも1つのDNA配列から少なくとも1つの親族関係を推測するステップを含むことができる。なお、この推測するステップの詳細については後述する。
【0063】
本方法は、少なくとも1つのDNA配列のそれぞれについて、マッチした少なくとも1頭のコンパニオンペットに対応する少なくとも1つの局所的なDNA断片パターンをデータベースから抽出するステップを含むことができる。DNA配列は、コンパニオンペットDNA配列データベースに入力することができる。DNA配列データベースには、数百、数千、または数百万のコンパニオンペットDNA配列エントリを収めることができる。DNA配列を受信したDNA配列データベースは、局所的なDNA断片パターンを少なくとも1つ検索してこれを出力することができ、この少なくとも1つの局所的なDNA断片パターンに、局所的に一致する染色体セグメントを少なくとも1つ含めることができる。なお、かかる局所的な染色体セグメントは、入力されたDNA配列の1つ以上の染色体セグメントと完全に一致するものであってもよい。DNA配列の受信時に、データベースから絞り込みオプションを提供することもでき、例えば、局所的に一致している部分の長さによる絞り込みオプションを提供することができる。例えば、近親交配の結果として一致している可能性がある長さの短い同一セグメントを除外するため、局所的に一致している部分の長さを18センチモルガンで絞り込むことが有益な場合がある。また、DNAの遺伝型解析やフェージング解析に誤差が生じている可能性を考慮に入れるため、得られた局所的な染色体セグメントをつなぎ合わせることもできる。そして、このようにつなぎ合わせた局所的な染色体セグメントを、すべての染色体について集めることができる。
【0064】
本方法は、少なくとも1つの局所的なDNA断片パターンを解析することにより、コンパニオンペットとこれにマッチした少なくとも1頭のコンパニオンペットとの間において推測される親族関係を少なくとも1つ特定するステップを含むことができる。例えば、少なくとも1つの推測される親族関係は、母、父、姉妹、兄弟、おじ、おば、姪、甥、いとこ、祖父、祖母、孫息子、孫娘、曾祖父、曾祖母、曾孫息子、曾孫娘、半血の母、半血の父、半血の姉妹、半血の兄弟、半血のおじ、半血のおば、半血の姪、半血の甥、半血のいとこ、半血の祖父、半血の祖母、半血の孫息子、半血の孫娘、半血の曾祖父、半血の曾祖母、半血の曾孫息子、半血の曾孫娘のうちの少なくとも1つを含むことができる。なお、この解析するステップの詳細については後述する。
【0065】
少なくとも1つの局所的なDNA断片パターンは、複数の同祖断片を含むことができる。ただし、2頭のコンパニオンペットの間で同じDNA断片があれば、それらのすべてが同祖断片とみなされるわけではない。例えば、純血種のペットは近親交配されているため、その血統のペットの間で同一のDNAが長く続いている可能性がある。
【0066】
上記の解析するステップは、複数の同祖断片を解析して、少なくとも1つの局所的なDNA断片パターンに含まれる同祖断片の総数を特定するステップをさらに含むことができる。
【0067】
また、上記の解析するステップは、複数の同祖断片を解析して、少なくとも1つの局所的なDNA断片パターンに含まれる複数の同祖断片の合計長さを特定するステップをさらに含むこともできる。なお、複数の同祖断片の合計長さはセンチモルガン単位で測定することができる。
【0068】
また、上記の解析するステップは、少なくとも1つの局所的なDNA断片パターンを解析して、少なくとも1つの局所的なDNA断片パターンが、コンパニオンペットが有する2組の染色体のうちの1組の染色体に生じているか、2組の染色体の双方に生じているかを特定するステップをさらに含むことができる。
【0069】
また、上記の解析するステップは、少なくとも1つのDNA配列のうち、複数の同祖断片のいずれも含まないDNA配列の割合を特定するステップをさらに含むことができる。また、上記の解析するステップは、少なくとも1つのDNA配列のうち、2組中1組の染色体にのみ複数の同祖断片を含むDNA配列の割合を特定するステップをさらに含むことができる。また、上記の解析するステップは、少なくとも1つのDNA配列のうち、2組の染色体の双方に複数の同祖断片を含むDNA配列の割合を特定するステップをさらに含むことができる。
【0070】
上述の解析(例えば、解析時に特定した様々な指標)は、コンパニオンペットとこれにマッチしたコンパニオンペットとの間の親族関係を評価する(特定した指標を、特徴として訓練済み機械学習モデルに提供することにより評価する)際に役立てることができる。例えば、少なくとも1つのDNA配列のうち、複数の同祖断片のいずれも含まないDNA配列(IBD0と呼ぶ)の割合を特定することが、親族関係がある可能性の有無を判定するのに有用である場合がある。IBD0の割合が非常に高い場合、親族関係がある可能性は低いと考えられる。さらに、2頭の半血の(例えば、片親が同じ)兄弟姉妹の例を挙げれば、このような2頭は、同じ親から1組の染色体を受け継いでいる。よって、半血の兄弟姉妹である2頭の間では、同じ親から受け継いだ染色体の組でのみ同祖性を有することになる。かかる状況(IBD1と呼ぶ)は、コンパニオンペットとこれにマッチしたコンパニオンペットの双方において、2組中1組の染色体にのみ同祖性を有するDNA配列の割合を特定することにより証明することができる。また、他の例として、全血の(例えば、両親が同じ)兄弟姉妹の例を挙げると、この場合、2組の染色体のうち2組とも祖先が同じであるため、全血の兄弟姉妹の間では、2組の染色体の双方で同祖性を有することになる。かかる状況(IBD2と呼ぶ)は、コンパニオンペットとこれにマッチしたコンパニオンペットの双方において、2組の染色体の双方に同祖性を有するDNA配列の割合を特定することにより証明することができる。
【0071】
また、本方法は、コンパニオンペットとこれにマッチした少なくとも1頭のコンパニオンペットについて、それぞれの近親交配度を示すホモ接合度を特定するステップをさらに含むこともできる。ホモ接合性から、コンパニオンペットの系譜における近親交配度に関する情報が得られる。純血種の動物と非近交系の動物では、純血種の動物の方がホモ接合度は高くなると予想される。例えば、コンパニオンペットとこれにマッチしたコンパニオンペットの対それぞれについて、コンパニオンペットのホモ接合性およびマッチしたコンパニオンペットのホモ接合性という2つの指標を、機械学習モデルが行う全体解析の際の追加指標として用いる。換言すれば、(例えば、少なくとも1つの局所的なDNA断片パターンを解析するステップなどにより)先に特定した上述の指標に加えて、コンパニオンペットのホモ接合性およびマッチしたコンパニオンペットのホモ接合性も、親族関係を推測するための訓練済み機械学習モデルに提供することができる。
【0072】
また、本方法は、少なくとも1つの局所的なDNA断片パターンに、重なり合う形質が少なくとも1つあることを特定するステップを含むこともできる。例えば、この少なくとも1つの形質は、品種に特異的な形質とすることができる。形質の例としては、眼の色や、毛色、健康関連遺伝子を挙げることができる。また、本方法は、重なり合う形質が少なくとも1つあることを特定すると、マッチした少なくとも1頭のコンパニオンペットとの間で当該少なくとも1つの形質を共有していることを示す通知を出力するステップを含むことができる。
【0073】
そして、機械学習モデルにより実行した解析に基づいて、コンパニオンペットとこれにマッチしたコンパニオンペットとの間において推測される少なくとも1つの親族関係と、これに対応する少なくとも1つの信頼度とを特定することができる。また、これに加えて、本方法は、一致している部分の長さを求めるステップをさらに含むこともできる。ここで、一致している部分の長さは、少なくとも1つの局所的なDNA断片パターンにおける断片の数に対応する。また、本方法は、少なくとも1つの推測される親族関係、これに対応する少なくとも1つの信頼度、またはその両方を、結果データベースに格納するステップをさらに含むことができる。また、本方法は、少なくとも1つの推測される親族関係、これに対応する少なくとも1つの信頼度、一致している部分の長さ、またはそのいずれかの組み合わせを、ユーザインタフェースを介してユーザに表示するステップを含むこともできる。
図1Cと
図1Dには、推測される2つの親族関係(例えば、「母」と「父」)を表示するユーザインタフェースの例が示されている。
【0074】
また、本方法は、当該特定するステップを機械学習モデルが行った結果に基づいて、DNAがマッチしたコンパニオンペットサンプルの一覧を出力するステップをさらに含むことができる。ここで、DNAがマッチしたコンパニオンペットサンプルとは、マッチ閾値を満たすか上回るかしたコンパニオンペットサンプルである。例えば、データベースから、2つ以上の局所的なDNA断片パターンが返された場合に、返された局所的なDNA断片パターンのすべてを一覧に表示することができる。また、返された局所的なDNA断片パターンのうち、閾値を満たすか上回るかした局所的なDNA断片パターンのみを一覧に表示することもできる。この閾値には、最大表示件数(例えば、50件)を加味することもでき、カットオフDNAマッチ割合値を含めることもできる。この割合値は、データベースのコンパニオンペットの局所的なDNA断片のうち、コンパニオンペットのすべてのDNA断片と一致する局所的なDNA断片のパーセント比率を特定することにより計算することができる。例えば、閾値に、6.25%のカットオフDNA割合値を含めることができる。
【0075】
コンパニオンペットの親族関係を推測するための例示的プロセス
図6は、1つ以上の実施形態に係る、コンパニオンペットのDNA情報を使用してコンパニオンペットの親族関係を推測するための例示的なプロセスを示す。
【0076】
本方法は、コンパニオンペットのDNA情報を受信するステップ(ステップ602)を含むことができる。コンパニオンペットのDNA情報には、少なくとも1つのDNA配列を含めることができる。
【0077】
本方法は、少なくとも1つのDNA配列をデータベースに送信するステップ(ステップ604)を含むことができる。少なくとも1つのDNA配列を受信したデータベースは、局所的なDNA断片パターンを少なくとも1つ検索して出力することができ、この少なくとも1つの局所的なDNA断片パターンに、マッチした少なくとも1頭のコンパニオンペットに対応する一致した染色体セグメントを少なくとも1つ含めることができる。DNA配列は、コンパニオンペットDNA配列のデータベースに入力することができる。データベースには、数百、数千、または数百万のコンパニオンペットDNA配列エントリを収めることができる。DNA配列を受信したデータベースは、局所的なDNA断片パターンを少なくとも1つ検索して出力することができ、この少なくとも1つの局所的なDNA断片パターンに、局所的に一致する染色体セグメントを少なくとも1つ含めることができる。なお、かかる局所的に一致する染色体セグメントは、入力されたDNA配列の1つ以上の染色体セグメントと完全に一致するものであってもよい。DNA配列の受信時に、データベースから絞り込みオプションを提供することもでき、例えば、局所的に一致している部分の長さによる絞り込みオプションを提供することができる。例えば、近親交配の結果、複数のコンパニオンペット品種の大半で一致している可能性がある長さの短い同一セグメントを除外するため、局所的に一致している部分の長さを18センチモルガンで絞り込むことが有益な場合がある。また、DNAの遺伝型解析やフェージング解析に誤差が生じている可能性を考慮に入れるため、得られた局所的な染色体セグメントをつなぎ合わせることもできる。そして、このようにつなぎ合わせた局所的な染色体セグメントを、すべての染色体について集めることができる。
【0078】
本方法は、少なくとも1つの局所的なDNA断片パターンを解析することにより、コンパニオンペットとこれにマッチした少なくとも1頭のコンパニオンペットとの間において推測される親族関係を少なくとも1つ特定するステップ(ステップ606)を含むことができる。少なくとも1つの局所的なDNA断片パターンは、複数の同祖(IBD)断片を含むことができる。
【0079】
また、本方法は、上記の解析するステップに基づいて、推測される親族関係を少なくとも1つ出力するステップ(ステップ608)を含むこともできる。この少なくとも1つの推測される親族関係は、母、父、姉妹、兄弟、おじ、おば、姪、甥、いとこ、祖父、祖母、孫息子、孫娘、曾祖父、曾祖母、曾孫息子、曾孫娘、半血の母、半血の父、半血の姉妹、半血の兄弟、半血のおじ、半血のおば、半血の姪、半血の甥、半血のいとこ、半血の祖父、半血の祖母、半血の孫息子、半血の孫娘、半血の曾祖父、半血の曾祖母、半血の曾孫息子、半血の曾孫娘のうちの少なくとも1つを含むことができる。また、本方法は、対応する少なくとも1つの信頼度を特定するステップを含むこともできる。また、これに加えて、本方法は、一致している部分の長さを求めるステップを含むこともできる。ここで、一致している部分の長さは、少なくとも1つの局所的なDNA断片パターンにおける断片の数に対応する。また、本方法は、少なくとも1つの推測される親族関係、これに対応する少なくとも1つの信頼度、またはその両方を、結果データベースに格納するステップをさらに含むことができる。また、本方法は、少なくとも1つの推測される親族関係、これに対応する少なくとも1つの信頼度、一致している部分の長さ、またはそのいずれかの組み合わせを、ユーザインタフェースを介してユーザに表示するステップを含むこともできる。
図1Cと
図1Dには、推測される2つの親族関係(例えば、「母」と「父」)を表示するユーザインタフェースの例が示されている。
【0080】
いくつかの実施形態では、本方法は、DNAがマッチしたコンパニオンペットサンプルの一覧を出力するステップを含むことができる。ここで、DNAがマッチしたコンパニオンペットサンプルとは、マッチ閾値を満たすか上回るかしたコンパニオンペットサンプルである。例えば、データベースから、2つ以上の局所的なDNA断片パターンが返された場合に、返された局所的なDNA断片パターンのすべてを一覧に表示することができる。また、返された局所的なDNA断片パターンのうち、閾値を満たすか上回るかした局所的なDNA断片パターンのみを一覧に表示することもできる。この閾値には、最大表示件数(例えば、50件)を加味することもでき、カットオフDNAマッチ割合値を含めることもできる。カットオフDNAマッチ割合値は、データベースの局所的なDNA断片のうち、コンパニオンペットのすべてのDNA断片と一致する局所的なDNA断片のパーセント比率を特定することにより計算することができる。例えば、閾値に、6.25%のカットオフDNA割合値を含めることができる。
【0081】
いくつかの実施形態では、本方法は、少なくとも1つの局所的なDNA断片パターンに、重なり合う形質が少なくとも1つあることを特定するステップを含むことができる。形質の例としては、眼の色や、毛色、健康関連遺伝子を挙げることができる。また、本方法は、マッチした少なくとも1頭のコンパニオンペットとの間で当該少なくとも1つの形質を共有していることを示す通知を出力するステップを含むこともできる。なお、この少なくとも1つの形質は、品種に特異的な形質とすることができる。
【0082】
また、いくつかの実施形態では、本方法は、コンパニオンペットとこれにマッチした少なくとも1頭のコンパニオンペットについて、それぞれの近親交配度を示すホモ接合度を特定するステップを含むことができる。ホモ接合性から、コンパニオンペットの系譜における近親交配度に関する情報を得ることができる。純血種の動物と非近交系の動物では、純血種の動物の方がホモ接合度は高くなると予想することができる。
【0083】
いくつかの実施形態では、本方法は、複数の同祖断片を解析して、少なくとも1つの局所的なDNA断片パターンに含まれる同祖断片の総数を特定するステップを含むことができる。
【0084】
いくつかの実施形態では、本方法は、複数の同祖断片を解析して、少なくとも1つの局所的なDNA断片パターンに含まれる複数の同祖断片の合計長さを特定するステップをさらに含むことができる。なお、複数の同祖断片の合計長さはセンチモルガン単位で測定することができる。
【0085】
いくつかの実施形態では、本方法は、少なくとも1つの局所的なDNA断片パターンを解析して、少なくとも1つの局所的なDNA断片パターンが、コンパニオンペットが有する2組の染色体のうちの1組の染色体に生じているか、2組の染色体の双方に生じているかを特定するステップをさらに含むことができる。また、いくつかの実施形態では、本方法は、少なくとも1つのDNA配列のうち、複数の同祖断片のいずれも含まないDNA配列の割合を特定するステップをさらに含むことができる。また、上記の解析するステップは、少なくとも1つのDNA配列のうち、2組中1組の染色体にのみ複数の同祖断片を含むDNA配列の割合を特定するステップをさらに含むことができる。また、上記の解析するステップは、少なくとも1つのDNA配列のうち、2組の染色体の双方に複数の同祖断片を含むDNA配列の割合を特定するステップをさらに含むことができる。
【0086】
なお、
図6には、例示的な方法600の例示的なブロックを示しているが、いくつかの実施態様では、
図6に示すブロックに、ブロックの追加、ブロックの削減、ブロックの変更、またはブロックの順序変更を施した例示的な方法600も可能である。また、これに加えてまたは代えて、例示的な方法600の2つ以上のブロックを同時に実行することもできる。
【0087】
例示的な環境と例示的なデバイス
図7は、本明細書で提示する技術を利用することができる例示的な環境700を示している。1つ以上のユーザデバイス705と、1つ以上の外部システム710と、1つ以上のサーバシステム715とは、ネットワーク701を介して通信することができる。詳細は後述するが、1つ以上のサーバシステム715は、ネットワーク701を介して環境700の他の1つ以上のコンポーネントと通信することができる。1つ以上のユーザデバイス705は、ユーザと関連付けることができ、例えば、コンパニオンペットの親族関係を推測するための機械学習モデルの生成、訓練、調整のうちの1つ以上に関連付けられているユーザと関連付けることができる。
【0088】
いくつかの実施形態では、環境700のコンポーネントは、例えば獣医師、診療所、動物の専門家、研究センターなどの公の主体に関連付けられている。いくつかの実施形態では、環境700のコンポーネントの1つ以上が、他のコンポーネントとは異なる主体に関連付けられる。環境700のシステムおよびデバイスは、任意の構成で通信することができる。なお、以下に説明するように、環境700のシステムやデバイスは、特に、コンパニオンペットの親族関係を推測するための機械学習モデルの生成、訓練、使用のうちの1つ以上を行うために通信を行うことができる。
【0089】
ユーザデバイス705は、ユーザが、ユーザデバイス705により環境700内の他のシステムへのアクセスや相互作用が行えるように構成することができる。例えば、ユーザデバイス705は、デスクトップコンピュータ、モバイルデバイス、タブレット端末などのコンピュータシステムとすることができる。いくつかの実施形態では、ユーザデバイス705は、ユーザデバイス705のメモリ上にインストールされた1つ以上の電子アプリケーション(例えば、プログラム、プラグイン、ブラウザ拡張機能など)を含むことができる。
【0090】
ユーザデバイス705は、ディスプレイ/ユーザインタフェース(UI)705A、プロセッサ705B、メモリ705C、ネットワークインタフェース705D、またはそのいずれかの組み合わせを備えることができる。ユーザデバイス705は、プロセッサ705Bにより、オペレーティングシステム(O/S)および少なくとも1つの電子アプリケーション(これらはいずれもメモリ705Cに格納される)を実行することができる。電子アプリケーションは、デスクトッププログラム、ブラウザプログラム、ウェブクライアント、またはモバイルアプリケーションプログラム(モバイルO/Sにおけるブラウザプログラムでもよい)、アプリカント専用プログラム、システム制御ソフトウェア、システム監視ソフトウェア、ソフトウェア開発ツールなどとすることができる。例えば、環境700により、ウェブブラウザを通じてアクセスできるウェブクライアントの情報を拡張することができる。いくつかの実施形態では、電子アプリケーションを、環境700内の他のコンポーネントのうちの1つ以上に関連付けることができる。アプリケーションは、データベースなどのメモリ705Cを管理して、ストリーミングデータをネットワーク701に送信することができる。ディスプレイ/UI 705Aは、タッチパネル、または他の入力システム(例えば、マウス、キーボードなど)を備えたディスプレイとすることができ、これにより、ユーザはアプリケーションやO/Sと相互作用することができる。ネットワークインタフェース705Dは、(例えば、ネットワーク701とのイーサネットまたは無線通信を行うための)TCP/IPネットワークインタフェースとすることができる。プロセッサ705Bは、アプリケーションの実行と並行して、データの生成、ディスプレイ/UI 705Aからのユーザ入力の受信、サーバシステム715とのメッセージの送受信、またはそのいずれかの組み合わせを行うことができ、また1つ以上の工程をさらに実行してから、ネットワーク701に出力を行うことができる。
【0091】
外部システム710は、例えば、サーバシステム715への組込みやサーバシステム715との通信により様々な文書情報抽出タスクを実行することができる1つ以上のサードパーティおよび/または補助システムとすることができる。外部システム710は、1つ以上のネットワーク701を介して、環境700内の他のデバイスまたはシステムと通信することができる。例えば、外部システム710は、API(アプリケーションプログラミングインタフェース)アクセスを介して1つ以上のネットワーク701上のサーバシステム715と通信することができ、かつ、ウェブブラウザアクセスを介して1つ以上のネットワーク701上のユーザデバイス705と通信することができる。
【0092】
種々の実施形態において、ネットワーク701は、広域ネットワーク(「WAN」)、ローカルエリアネットワーク(「LAN」)、パーソナルエリアネットワーク(「PAN」)などとすることができる。いくつかの実施形態では、ネットワーク701はインターネットを含み、様々なシステム間での情報およびデータの提供はオンラインで行われる。「オンライン(online)」という用語は、インターネットに接続された他のデバイスまたはネットワークからは離れた場所から、ソースデータまたはソース情報への接続またはアクセスを行うことを意味することができる。また、これに代えて、「オンライン」という用語が、移動体通信ネットワークやデバイスを介してネットワークに(有線または無線で)接続またはアクセスを行うことを指している場合もある。インターネットは、全世界的なコンピュータネットワークシステムであり、ネットワークに接続されたコンピュータなどのデバイスの前にいる関係者が、他のコンピュータから情報を入手したり、他のコンピュータまたはデバイスを持つ関係者と通信したりすることが可能になるようなネットワークが複数繋がったネットワーク網である。インターネットの中で最も広く使われているのが、ワールドワイドウェブ(「WWW」と略されたり、単に「ウェブ」と呼ばれたりすることも多い)である。「ウェブサイトページ(website page)」という用語は、例えば、コンピュータシステムがホストや動作を担うことにより、オンラインでアクセスできるようになっている場所やデータストアなど、およびデータの送受信や、処理、視覚的表示、対話型インタフェースの生成などの工程をウェブブラウザなどのプログラムに実行させるように構成されたデータを含み得る場所やデータストアなど、を広く包含する用語である。
【0093】
サーバシステム715は、電子データシステムを備えることができ、例えば、ハードドライブ、フラッシュドライブ、ディスクなどのコンピュータ可読メモリを備えることができる。いくつかの実施形態では、サーバシステム715は、他のシステム(例えば、環境内の他のコンポーネントのうちの1つ以上)とデータ交換を行うためのアプリケーションプログラミングインタフェースの具備、かかるアプリケーションプログラミングインタフェースとの相互作用、またはその両方を行う。
【0094】
サーバシステム715は、データベース715Aと、少なくとも1つのサーバ715Bとを備えることができる。サーバシステム715は、コンピュータ、コンピュータのシステム(例えば、ラックサーバ)、クラウドサービスのコンピュータシステム、またはそのいずれかの組み合わせとすることができる。サーバシステムは、データベース715A(例えば、サードパーティのサーバまたはメモリ715Eにホストされている)を格納するか、またはデータベース715Aにアクセスすることができる。サーバは、ディスプレイ/UI 715C、プロセッサ715D、メモリ715E、ネットワークインタフェース715F、またはそのいずれかの組み合わせを備えることができる。ディスプレイ/UI 715Cは、タッチパネル、または他の入力システム(例えば、マウス、キーボードなど)を備えたディスプレイとすることができ、これにより、サーバ715Bを操作する人はサーバ715Bの機能を制御することができる。サーバシステム715は、プロセッサ715Dにより、オペレーティングシステム(O/S)およびサーブレットプログラムの少なくとも1つのインスタンス(これらはいずれもメモリ715Eに格納される)を実行することができる。
【0095】
サーバシステム715は、コンパニオンペットの親族関係を推測するように構成された機械学習モデルの生成、格納、訓練、または使用を担うことができる。サーバシステム715は、機械学習モデル、機械学習モデルに関連付けられた命令、またはその両方を含むことができ、例えば、機械学習モデルを生成する命令、機械学習モデルを訓練する命令、機械学習モデルを使用する命令などの命令を含むことができる。また、サーバシステム715は、(例えば、機械学習モデルの出力に基づいて)DNA情報データを取得する命令、(例えば、機械学習モデルに基づいて調整された)親族関係情報データを出力するようにディスプレイ715Cを動作させる命令、またはその両方を含むことができる。また、サーバシステム715は、訓練データを含むことができ、例えば、訓練データとして、少なくとも1つのDNA配列、マッチした少なくとも1頭のコンパニオンペット、コンパニオンペットとこれにマッチした少なくとも1頭のコンパニオンペットとの間の親族関係に対応する少なくとも1つの続柄ラベルを含むことができる。
【0096】
いくつかの実施形態では、サーバシステム715以外のシステムまたはデバイスを利用して、機械学習モデルの生成、訓練、またはその両方を行う。例えば、かかるシステムは、機械学習モデル、訓練データ、およびグランドトゥルースを生成する命令、機械学習モデルを訓練する命令、またはその両方を含むことができる。そして、これにより得られた訓練済み機械学習モデルを、サーバシステム715に提供することができる。
【0097】
一般に、機械学習モデルは、1組の変数(例えば、ノード、ニューロン、フィルタなどの変数)を含んでおり、訓練データを適用することにより、(例えば、これらの変数に重みやバイアスをかけて)これらの変数が様々に異なる値に調整される。教師あり学習では、例えば、提供された訓練データのグランドトゥルースが既知である場合、機械学習モデルの変数を初期設定値(例えば、ガウスノイズや事前訓練済のモデルなどに基づいてランダムに設定された初期設定値)に設定した状態で、機械学習モデルに訓練データのサンプルを投入することにより、訓練を始めることができる。そして、この出力をグランドトゥルースと比較することにより、誤差を特定することができ、さらに、この誤差を機械学習モデルに逆伝播することにより、変数の値を調整することができる。
【0098】
訓練は、任意の適切なやり方(例えば、バッチ)で行うことができ、任意の適切な訓練法(例えば、確率的勾配降下法、非確率的勾配降下法、勾配ブースティング法、ランダムフォレスト法など)を含むことができる。いくつかの実施形態では、訓練データの一部分を訓練中に取り分けるなどし、このデータ部分を利用して訓練済み機械学習モデルを検証することもでき、例えば、当該訓練データ部分に対する訓練済みモデルの出力をそのグランドトゥルースと比較することにより、訓練済みモデルの精度を評価することができる。機械学習モデルの訓練は、機械学習モデルにDNA情報データと親族関係データとの間の関連性を学習させるように構成することができる。したがって、訓練された機械学習モデルは、DNA情報データが入力されると、これに応えて、訓練により学習した関連性に基づいて親族関係を特定するように構成されることになる。
【0099】
種々の実施形態において、機械学習モデルの変数は、機械学習モデルの出力が生成されるように、任意の適切な関係で互いに相関させることができる。例えば、いくつかの実施形態では、機械学習モデルは、テキストが有する特徴、パターン、構造、またはそのいずれかの組み合わせの識別、分離、抽出を行うように構成された信号処理アーキテクチャを備えることができる。例えば、機械学習モデルは、文書情報データ内の特徴を識別するように構成された1つ以上の畳み込みニューラルネットワーク(convolutional neural network:「CNN」)を備えることができ、さらに、文書情報データ内の位置を特定するために、識別した特徴間の関係を特定するように構成された追加のアーキテクチャ(例えば、結合層、ニューラルネットワークなど)を備えることもできる。
【0100】
なお、
図7では、環境700のコンポーネントを別体のコンポーネントとして図示しているが、いくつかの実施形態では、環境700のコンポーネントまたはコンポーネントの一部を他の1つ以上のコンポーネントと一体化したり、他の1つ以上のコンポーネントに組み込んだりすることができることを理解されたい。例えば、ディスプレイ715Cの一部を、ユーザデバイス705などに一体化することができる。いくつかの実施形態では、上記にて説明した1つ以上のコンポーネントの動作または側面を、他の1つ以上のコンポーネントに分散させることもできる。環境700の種々のシステムおよびデバイスについて、任意の適切な配置や一体化を行うことができる。
【0101】
機械学習モデルのさらなる側面や、機械学習モデルを利用してコンパニオンペットの親族関係を推測する方法については、本方法に関する上記の説明において詳細に述べている。なお、上述の方法に関する説明では、
図7に示すコンポーネント(サーバシステム715、ユーザデバイス705、またはそれらの中のコンポーネントなど)が様々な動作を実行するものして説明している場合がある。しかしながら、種々の実施形態において、上述した環境700の各種コンポーネントが、命令を実行したり、上述の動作を含む動作を実行したりする場合があることを理解されたい。デバイスが或る動作を実行する場合、そのデバイスに関連付けられたプロセッサ、アクチュエータなどが当該動作を実行するものとみなすことができる。さらに、種々の実施形態において、任意の適切なやり方で各種ステップの追加、省略、並べ替えを行うことができることも理解されたい。
【0102】
一般に、
図1A~
図6に示すプロセスなどの、コンピュータで実装可能であると理解される本開示に記載の任意のプロセスまたは工程(operation)を、上述したように、コンピュータシステムの1つ以上のプロセッサ(例えば、
図7に示す環境700のシステムまたはデバイスのいずれか)によって実行することができる。1つ以上のプロセッサにより実行される処理(プロセス)または処理ステップを、工程(operation)と呼ぶこともできる。1つ以上のプロセッサによって実行した場合に、当該1つ以上のプロセッサに処理を実行させる命令(例えば、ソフトウェアまたはコンピュータ可読コード)にアクセスすることによって、1つ以上のプロセッサがかかる処理を実行するように構成することができる。これらの命令は、コンピュータシステムのメモリに格納することができる。プロセッサは、中央処理装置(CPU)、画像処理装置(GPU)、または任意の適切な種類の処理装置とすることができる。
【0103】
コンピュータシステム(例えば、上記の例に示したプロセスまたは工程を実施するシステムまたはデバイス)は、1つ以上のコンピューティングデバイス(例えば、
図7に示すシステムまたはデバイスのうちの1つ以上)を備えることができる。コンピュータシステムの1つ以上のプロセッサは、1つのコンピューティングデバイスで備えることができるほか、複数のコンピューティングデバイスに分散させることもできる。また、コンピュータシステムのメモリは、複数のコンピューティングデバイスそれぞれのメモリを含むことができる。
【0104】
図8は、本開示の例示的な実施形態に係る、
図1A~
図6に示す方法を実行するためのデバイスとして構成することが可能なコンピュータ800の簡略機能ブロック図である。例えば、デバイス800は中央処理装置(CPU)820を備えることができる。CPU820は、任意の種類のプロセッサ装置とすることができ、例えば、任意の種類の専用または汎用のマイクロプロセッサ装置とすることができる。当業者であれば理解するであろうが、CPU820はまた、単独で動作するか、またはクラスタもしくはサーバファームとして動作する複数のコンピューティングデバイスのクラスタとして動作するマルチコア/マルチプロセッサシステムにおける1つのプロセッサとすることもできる。また、CPU820は、データ通信インフラ810(例えば、バス(BUS)、メッセージキュー、ネットワーク、またはマルチコアメッセージパッシングスキーム)に接続することができる。
【0105】
デバイス800はまた、メインメモリ840(例えば、ランダムアクセスメモリ(RAM))を備えることができ、また補助メモリ830をさらに備えることもできる。補助メモリ830(例えば、読み取り専用メモリ(ROM))は、例えば、ハードディスクドライブまたはリムーバブルストレージドライブとすることができる。かかるリムーバブルストレージドライブは、例えば、フロッピーディスクドライブ、磁気テープドライブ、光ディスクドライブ、またはフラッシュメモリなどで構成することができる。本例のリムーバブルストレージドライブは、周知のやり方でリムーバブルストレージユニットへの読み書きを行うものである。リムーバブルストレージユニットは、フロッピーディスク、磁気テープ、光ディスクなどで構成することができ、その読み書きをリムーバブルストレージドライブで行うことができる。当業者であれば理解するであろうが、一般に、かかるリムーバブルストレージユニットが、コンピュータソフトウェア、データ、またはその両方を格納したコンピュータ使用可能な記憶媒体を備えている。
【0106】
代替的な実施態様では、補助メモリ830は、コンピュータプログラムまたは他の命令をデバイス800にロード可能とする他の同様の手段を備えることもできる。このような手段の例としては、プログラムカートリッジとカートリッジインタフェース(例えば、ビデオゲームデバイスに見られるようもの)や、リムーバブルメモリチップとその対応ソケット(例えば、EPROMまたはPROM)などの、リムーバブルストレージユニットからデバイス800へのソフトウェアおよびデータの転送を可能とするリムーバブルストレージユニットとインタフェースの組み合わせが挙げられる。
【0107】
デバイス800は、通信インタフェース(communications interface:「COM」)860を備えることもできる。通信インタフェース860は、デバイス800と外部デバイスの間でのソフトウェアおよびデータの転送を可能にするものである。通信インタフェース860は、モデム、ネットワークインタフェース(例えば、イーサネットカード)、通信ポート、PCMCIAスロットとPCMCIAカードなどを含むことができる。通信インタフェース860を介して転送するソフトウェアおよびデータの形態は、電子信号、電磁信号、光信号などの、通信インタフェース860により受信可能な信号の形態とすることができる。これらの信号は、デバイス800の通信路を介して通信インタフェース860に供給することができる。かかる通信路は、例えば、ワイヤまたはケーブル、光ファイバ、電話回線、携帯電話リンク、RFリンクなどの通信チャネルを用いて実装することができる。
【0108】
かかる機器のハードウェア要素、オペレーティングシステム、およびプログラミング言語は、本質的に従来からあるものであるため、当業者であればこれらに十分に精通しているものと推定される。また、デバイス800は、キーボード、マウス、タッチパネル、モニター、ディスプレイなどの入出力デバイスと接続するための入出力ポート850を備えることができる。なお、当然ながら、処理負荷を分散させるため、各種サーバ機能を複数の同様のプラットフォームに分散して実装することもできる。また、これに代えて、1つのコンピュータハードウェアプラットフォームの適切なプログラミングにより、サーバを実装することもできる。
【0109】
本技術のプログラムとしての側面は、何らかの種類の機械可読媒体により担持または具現化される、実行可能なコードおよび/または関連データの形態を代表的な形態とする「製品(products)」または「製造物品(articles of manufacture)」であると考えることができる。「記憶(storage)」媒体の種類の媒体には、ソフトウェアプログラミング用の非一時的な記憶場所をいつでも提供することが可能な、コンピュータ、プロセッサなどの有形メモリまたはその関連モジュール(例えば、各種半導体メモリ、テープドライブ、ディスクドライブなど)のいずれかまたはすべてが含まれる。本ソフトウェアのすべてまたは一部は、インターネットなどの各種通信ネットワークを介して伝送することもできる。かかる通信により、例えば、或るコンピュータまたはプロセッサから他のコンピュータまたはプロセッサにソフトウェアをロードすることが可能となり、例えば、移動体通信ネットワークの管理サーバまたはホストコンピュータからサーバのコンピュータプラットフォームにソフトウェアをロードしたり、サーバからモバイルデバイスにソフトウェアをロードしたりすることが可能となる。したがって、ソフトウェア要素を搭載することができる他の種類の媒体として、光波、電波、電磁波(例えば、ローカルデバイス間の物理的インタフェース、有線および光固定回線ネットワーク、各種エアリンクで用いられる光波、電波、電磁波)を挙げることができる。また、かかる波を運ぶ物理的要素(例えば、有線または無線リンク、光リンクなど)も、ソフトウェアを搭載した媒体とみなすことができる。本明細書において、非一時的な有形の「記憶」媒体に限定している場合を除き、コンピュータ「可読媒体」やマシン「可読媒体」などの用語は、命令を実行させるためにプロセッサに対して命令を与えることに関与する任意の媒体を指す。
【0110】
本開示において特定の活動(activity)に言及している場合、かかる説明はあくまでも便宜上のものであり、本開示を限定することを意図するものではない。当業者であれば、開示しているデバイスおよび方法の根底にある概念を、これに適した任意の活動に利用できることを認識するであろう。また、本開示は、上記の説明および添付の図面を参照することにより理解することができるであろう。なお、添付の図面において、同様の要素には同一の参照数字を付して示す。
【0111】
上述の説明で使用している用語は、妥当な範囲内で最も広い意味で解釈することができ、たとえその用語を、本開示の特定の具体例を詳細に説明する際に用いていたとしてもそのように解釈することができる。実際には、一部の用語について、上述の説明の中でもこの点を強調している場合があるが、或る用語を限定的に解釈することが意図されている場合には、上述の『発明の詳細な説明』の項において、その用語をそのように定義することを明白かつ具体的に示している。概略的説明も詳細な説明も、本開示を例示的に説明するものに過ぎず、特許請求の範囲に記載された特徴を限定するものではない。
【0112】
本開示において、「~に基づいて(based on)」いるという表現は、「~に少なくとも一部基づいて(based at least in part on)」いることを意味している。「a」、「an」、および「the(その/前記)」で示す単数形は、文脈上複数形を含まないことが明らかである場合を除き、対応する複数形に対する言及も包含するものとする。また、「例示的(exemplary)」という言葉は、「理想的(ideal)」という意味ではなく「例としての(example)」という意味で用いている。「備える」「含む」「有する」(comprise、comprising、include、including)という用語またはこれらの他の変化形は、非限定的(non-exclusive)に含むという意味を意味範囲に含むことが意図されている。よって、プロセス、方法、または製品が、列挙された要素を「備える」(「含む」「有する」)場合、必ずしも列挙された要素のみを含むわけではなく、明示的には列挙されていない他の要素や、かかるプロセス、方法、物品、または装置に固有の要素も含むことができる。また、「または(or)」という用語は、選言的に用いられる用語であり、「AまたはBの少なくとも一方(at least one of A or B)」という表現は、(A)、(B)、(AおよびA)、(AおよびB)などを包含する。「実質的に(substantially)」や「一般的に(generally)」などの相対的な用語は、記載されている値または暗黙的に示されている値に±10%の変動があり得ることを示すために使用されている。
【0113】
本明細書において、「ユーザ(user)」などの用語は、1人以上のペットの飼い主(pet parent)を広く包含する用語である。また、「ペット(pet)」などの用語は、ユーザのペットを広く包含する用語であり、「ペット」という用語で複数のペットを包含することもできる。「供給業者(provider)」などの用語は、ペットケア事業を広く包含する用語である。
【0114】
本明細書において、「機械学習モデル(machine-learning model)」という用語は、受け取った入力に対して、重み付け、バイアスの付加、分類、解析のうちの1つ以上を行って出力を生成するように構成された命令、データ、モデル、またはそのいずれかの組み合わせを広く包含する用語である。かかる出力には、例えば、入力の分類結果、入力に基づいた解析結果、または入力に関連した設計、プロセス、推測、または助言などの、任意の適切な種類の出力が含まれ得る。通常、機械学習モデル/システムは、訓練データ(例えば、経験的データ、入力データのサンプル、又はその両方)を使って訓練が行われ、訓練データをモデルに入力することにより、当該モデルの1つ以上の側面(例えば、重み、バイアス、分類やクラスタ形成を行うための基準など)の設定、調整、または修正が行われる。入力に対して機械学習モデルの諸側面がどのように動作するかについては、線形的動作、並列的動作、ネットワーク(例えば、ニューラルネットワーク)を介した動作など、任意の適切な構成を介した動作とすることができる。
【0115】
機械学習モデルの実行は、1つ以上の機械学習技術のデプロイを含むことができる。機械学習技術としては、例えば、線形回帰、ロジスティック回帰、ランダムフォレスト、勾配ブーストマシン(gradient boosted machine:GBM)、決定木、決定木の勾配ブースティング、深層学習、深層ニューラルネットワーク、またはそのいずれかの組み合わせが挙げられる。教師あり訓練、教師なし訓練、またはその両方を行なうことができる。例えば、教師あり学習は、訓練データと、訓練データに対応する複数のラベルとを(例えば、グランドトゥルースとして)提供する工程を含み得る。一方、教師なしアプローチは、クラスタリング、分類などの工程を含み得る。また、K平均クラスタリング法(教師なし)またはK近傍法(教師あり)を用いることもできる。K近傍法と教師なしクラスタ技術を組み合わせて用いることもできる。さらには、例えば、確率的手法、勾配ブースト、ランダムシード、再帰的手法、エポックベースまたはバッチベースの手法などの任意の適切な種類の訓練を採用することができる。
【0116】
本発明の例示的な実施形態に関する上述の説明において、本発明の種々の特徴を、1つの実施形態、1つの図、またはそれに対する説明にまとめて示している場合があるが、これは、本開示を効率的に行い、本発明の種々の態様の1つ以上の理解を助ける目的で行ったものであることを理解されたい。ただし、このような開示方法が、本願発明が、各請求項に明示的に記載している範囲を上回る特徴を必須としているという意図を反映したものであると解釈すべきではない。むしろ、以下の特許請求の範囲に示しているように、本発明に進歩性を与える特徴の数は、上記にて開示した1つの実施形態に示すすべての特徴に比べて少ない。したがって、この『発明の詳細な説明』の後に記載する特許請求の範囲は、『発明の詳細な説明』に明示的に組み込まれるものであり、特許請求の範囲に記載の各請求項は、それぞれ単独で本発明の一実施形態として成立するものである。
【0117】
さらに、本明細書に記載の実施形態の中には、他の実施形態に含まれる特徴のうち一部を含み、他の一部を含まないものもあるが、当業者であれば理解するように、互いに異なる実施形態に含まれる特徴の組み合わせも、本発明の範囲内にあり、かかる組み合わせにより様々に異なる実施形態が形成されることが意図されている。例えば、以下の特許請求の範囲において、請求項により規定される複数の実施形態のうち任意の実施形態を任意の組み合わせで使用することができる。
【0118】
したがって、特定の実施形態について説明してきたが、当業者であれば、特許請求の趣旨から逸脱しない範囲で、他にもさらに変更を加えることができること、さらにこのような変更および変形もすべて、本発明の範囲に含まれると主張する意図があることを認識するであろう。例えば、ブロック図に記載の機能の追加または削除、機能ブロック間での工程の入れ替えなどを行うことができる。また、本発明の範囲内で記載された方法に、ステップの追加または削除を行うこともできる。
【0119】
以上、本開示の主題について記載してきたが、これは例示的なものであり、限定を意図したものではないと考えるべきであり、添付の特許請求の範囲は、本開示の真の趣旨および範囲に含まれる変形例、拡張例などの実施態様をすべてその範囲に含むことが意図されている。従って、本開示の範囲は、法律で許容される最大限の範囲において、以下の特許請求の範囲およびその均等物を許容される最も広い意味で解釈することにより特定されるべきものであり、上述の発明の詳細な説明によって制限または限定されるべきものではない。以上、本開示の種々の実施態様について説明してきたが、当業者であれば、本開示の範囲内でさらに多くの実施態様が可能であることは明らかであろう。したがって、本開示は、特許請求の範囲及びその均等物に基づく制限以外には制限を受けるものではない。
【符号の説明】
【0120】
700 環境
701 ネットワーク
705 ユーザデバイス
705A ユーザデバイスのディスプレイ/ユーザインタフェース
705B ユーザデバイスのプロセッサ
705C ユーザデバイスのメモリ
705D ユーザデバイスのネットワークインタフェース
710 外部システム
715 サーバシステム
715A データベース
715B サーバ
715C サーバシステムのディスプレイ/ユーザインタフェース
715D サーバシステムのプロセッサ
715E サーバシステムのメモリ
715F サーバシステムのネットワークインタフェース
800 デバイス
810 データ通信インフラ
820 中央処理装置
830 補助メモリ
840 メインメモリ
850 入出力ポート
860 通信インタフェース
【手続補正書】
【提出日】2024-06-24
【手続補正1】
【補正対象書類名】明細書
【補正対象項目名】0119
【補正方法】変更
【補正の内容】
【0119】
以上、本開示の主題について記載してきたが、これは例示的なものであり、限定を意図したものではないと考えるべきであり、添付の特許請求の範囲は、本開示の真の趣旨および範囲に含まれる変形例、拡張例などの実施態様をすべてその範囲に含むことが意図されている。従って、本開示の範囲は、法律で許容される最大限の範囲において、以下の特許請求の範囲およびその均等物を許容される最も広い意味で解釈することにより特定されるべきものであり、上述の発明の詳細な説明によって制限または限定されるべきものではない。以上、本開示の種々の実施態様について説明してきたが、当業者であれば、本開示の範囲内でさらに多くの実施態様が可能であることは明らかであろう。したがって、本開示は、特許請求の範囲及びその均等物に基づく制限以外には制限を受けるものではない。
以下、本発明の好ましい実施形態を項分け記載する。
実施形態1
コンパニオンペットのDNA情報を使用してコンパニオンペットの親族関係を推測するためのコンピュータで実装される方法であって、
少なくとも1つのDNA配列を含む、コンパニオンペットのDNA情報を受信するステップと、
前記少なくとも1つのDNA配列をデータベースに送信するステップであって、該少なくとも1つのDNA配列を受信した前記データベースが、マッチした少なくとも1頭のコンパニオンペットに対応する一致した染色体セグメントを少なくとも1つ含む、局所的なDNA断片パターンを少なくとも1つ検索して出力するステップと、
前記少なくとも1つの局所的なDNA断片パターンを解析することにより、前記コンパニオンペットと前記マッチした少なくとも1頭のコンパニオンペットとの間において推測される親族関係を少なくとも1つ特定するステップと、
前記解析するステップに基づいて、前記少なくとも1つの推測される親族関係を少なく出力するステップと、
を含む方法。
実施形態2
前記少なくとも1つの局所的なDNA断片パターンが、複数の同祖(IBD)断片を含む、実施形態1に記載のコンピュータで実装される方法。
実施形態3
前記少なくとも1つのDNA配列のうち、2組中1組の染色体にのみ前記複数の同祖断片を含むDNA配列の割合を特定するステップをさらに含む、実施形態2に記載のコンピュータで実装される方法。
実施形態4
前記少なくとも1つのDNA配列のうち、2組の染色体の双方に前記複数の同祖断片を含むDNA配列の割合を特定するステップをさらに含む、実施形態2に記載のコンピュータで実装される方法。
実施形態5
前記少なくとも1つのDNA配列のうち、前記複数の同祖断片のいずれも含まないDNA配列の割合を特定するステップをさらに含む、実施形態2に記載のコンピュータで実装される方法。
実施形態6
前記複数の同祖断片を解析して、前記少なくとも1つの局所的なDNA断片パターンに含まれる同祖断片の総数を特定するステップをさらに含む、実施形態2に記載のコンピュータで実装される方法。
実施形態7
前記複数の同祖断片を解析して、前記少なくとも1つの局所的なDNA断片パターンに含まれる前記複数の同祖断片の合計長さを特定するステップをさらに含む、実施形態2に記載のコンピュータで実装される方法。
実施形態8
前記複数の同祖断片の前記合計長さがセンチモルガン単位で測定される、実施形態7に記載のコンピュータで実装される方法。
実施形態9
前記少なくとも1つの局所的なDNA断片パターンに、重なり合う形質が少なくとも1つあることを特定するステップと、
前記マッチした少なくとも1頭のコンパニオンペットとの間で該少なくとも1つの形質を共有していることを示す通知を出力するステップと、
をさらに含む、実施形態1に記載のコンピュータで実装される方法。
実施形態10
前記少なくとも1つの形質が品種に特異的な形質である、実施形態9に記載のコンピュータで実装される方法。
実施形態11
前記少なくとも1つの推測される親族関係が、母、父、姉妹、兄弟、おじ、おば、姪、甥、いとこ、祖父、祖母、孫息子、孫娘、曾祖父、曾祖母、曾孫息子、曾孫娘、半血の母、半血の父、半血の姉妹、半血の兄弟、半血のおじ、半血のおば、半血の姪、半血の甥、半血のいとこ、半血の祖父、半血の祖母、半血の孫息子、半血の孫娘、半血の曾祖父、半血の曾祖母、半血の曾孫息子、半血の曾孫娘のうちの少なくとも1つを含む、実施形態1に記載のコンピュータで実装される方法。
実施形態12
前記方法が、DNAがマッチしたコンパニオンペットサンプルの一覧を出力するステップをさらに含み、
前記DNAがマッチしたコンパニオンペットサンプルは、マッチ閾値を満たすか上回るかしたコンパニオンペットサンプルである、実施形態1に記載のコンピュータで実装される方法。
実施形態13
前記コンパニオンペットと前記マッチした少なくとも1頭のコンパニオンペットについて、それぞれの近親交配度を示すホモ接合度を特定するステップをさらに含む、実施形態1に記載のコンピュータで実装される方法。
実施形態14
前記少なくとも1つの局所的なDNA断片パターンを解析して、前記少なくとも1つの局所的なDNA断片パターンが、前記コンパニオンペットが有する2組の染色体のうちの1組の染色体に生じているか、2組の染色体の双方に生じているかを特定するステップをさらに含む、実施形態1に記載のコンピュータで実装される方法。
実施形態15
命令を格納する少なくとも1つのメモリと、
前記命令を実行することにより動作を実行するように構成された少なくとも1つのプロセッサと、
を備える、コンパニオンペットのDNA情報を使用してコンパニオンペットの親族関係を推測するためのコンピュータシステムであって、
前記動作が、
少なくとも1つのDNA配列を含む、コンパニオンペットのDNA情報を受信する工程と、
前記少なくとも1つのDNA配列をデータベースに送信する工程であって、該少なくとも1つのDNA配列を受信した前記データベースが、マッチした少なくとも1頭のコンパニオンペットに対応する一致した染色体セグメントを少なくとも1つ含む、局所的なDNA断片パターンを少なくとも1つ検索して出力する工程と、
前記少なくとも1つの局所的なDNA断片パターンを解析することにより、前記コンパニオンペットと前記マッチした少なくとも1頭のコンパニオンペットとの間において推測される親族関係を少なくとも1つ特定する工程と、
前記解析する工程に基づいて、前記少なくとも1つの推測される親族関係を少なく出力する工程と、
を含む、コンピュータシステム。
実施形態16
前記動作が、前記少なくとも1つの局所的なDNA断片パターンを解析して、前記少なくとも1つの局所的なDNA断片パターンが、前記コンパニオンペットが有する2組の染色体のうちの1組の染色体に生じているか、2組の染色体の双方に生じているかを特定する工程をさらに含む、実施形態15に記載のコンピュータシステム。
実施形態17
前記少なくとも1つの推測される親族関係が、母、父、姉妹、兄弟、おじ、おば、姪、甥、いとこ、祖父、祖母、孫息子、孫娘、曾祖父、曾祖母、曾孫息子、曾孫娘、半血の母、半血の父、半血の姉妹、半血の兄弟、半血のおじ、半血のおば、半血の姪、半血の甥、半血のいとこ、半血の祖父、半血の祖母、半血の孫息子、半血の孫娘、半血の曾祖父、半血の曾祖母、半血の曾孫息子、半血の曾孫娘のうちの少なくとも1つを含む、実施形態15に記載のコンピュータシステム。
実施形態18
命令を収容した非一時的なコンピュータ可読媒体であって、
前記命令は、該命令をプロセッサによって実行した場合に、前記プロセッサに、コンパニオンペットのDNA情報を使用してコンパニオンペットの親族関係を推測するための動作を実行させるものであり、
該動作が、
少なくとも1つのDNA配列を含む、コンパニオンペットのDNA情報を受信する工程と、
前記少なくとも1つのDNA配列をデータベースに送信する工程であって、該少なくとも1つのDNA配列を受信した前記データベースが、マッチした少なくとも1頭のコンパニオンペットに対応する一致した染色体セグメントを少なくとも1つ含む、局所的なDNA断片パターンを少なくとも1つ検索して出力する工程と、
前記少なくとも1つの局所的なDNA断片パターンを解析することにより、前記コンパニオンペットと前記マッチした少なくとも1頭のコンパニオンペットとの間において推測される親族関係を少なくとも1つ特定する工程と、
前記解析する工程に基づいて、前記少なくとも1つの推測される親族関係を少なく出力する工程と、
を含む、非一時的なコンピュータ可読媒体。
実施形態19
前記少なくとも1つの推測される親族関係が、母、父、姉妹、兄弟、おじ、おば、姪、甥、いとこ、祖父、祖母、孫息子、孫娘、曾祖父、曾祖母、曾孫息子、曾孫娘、半血の母、半血の父、半血の姉妹、半血の兄弟、半血のおじ、半血のおば、半血の姪、半血の甥、半血のいとこ、半血の祖父、半血の祖母、半血の孫息子、半血の孫娘、半血の曾祖父、半血の曾祖母、半血の曾孫息子、半血の曾孫娘のうちの少なくとも1つを含む、実施形態18に記載の非一時的なコンピュータ可読媒体。
実施形態20
前記動作が、前記少なくとも1つの局所的なDNA断片パターンを解析して、前記少なくとも1つの局所的なDNA断片パターンが、前記コンパニオンペットが有する2組の染色体のうちの1組の染色体に生じているか、2組の染色体の双方に生じているかを特定する工程をさらに含む、実施形態18に記載の非一時的なコンピュータ可読媒体。
【国際調査報告】