(19)【発行国】日本国特許庁(JP)
(12)【公報種別】公開特許公報(A)
(11)【公開番号】P2024156326
(43)【公開日】2024-11-06
(54)【発明の名称】情報処理装置、プログラム、及び情報処理方法
(51)【国際特許分類】
G06Q 50/10 20120101AFI20241029BHJP
【FI】
G06Q50/10
【審査請求】未請求
【請求項の数】6
【出願形態】OL
(21)【出願番号】P 2023070697
(22)【出願日】2023-04-24
(71)【出願人】
【識別番号】504217812
【氏名又は名称】ジェネシスヘルスケア株式会社
(74)【代理人】
【識別番号】100079108
【弁理士】
【氏名又は名称】稲葉 良幸
(74)【代理人】
【識別番号】100109346
【弁理士】
【氏名又は名称】大貫 敏史
(74)【代理人】
【識別番号】100117189
【弁理士】
【氏名又は名称】江口 昭彦
(74)【代理人】
【識別番号】100134120
【弁理士】
【氏名又は名称】内藤 和彦
(72)【発明者】
【氏名】佐藤 バラン 伊里
(72)【発明者】
【氏名】斉藤 成也
(72)【発明者】
【氏名】鈴木 留美子
【テーマコード(参考)】
5L049
5L050
【Fターム(参考)】
5L049CC12
5L050CC12
(57)【要約】 (修正有)
【課題】ハプロタイプから名字を推定する新たなサービスを提供することのできる情報処理装置、情報処理方法及びプログラムを提供する。
【解決手段】サーバ及び複数のユーザ端末が、ネットワークNを介して接続されるシステムにおいて、サーバ100は、ユーザ端末200からの要求に応じて、ユーザの遺伝情報に基づいて、そのユーザの父及び母の少なくとも一方のハプログループを特定する処理と、特定したハプログループから父及び母の少なくとも一方の関連性の高い名字を推定する処理と、を実行し、その結果を、ユーザ端末200に送信する。ユーザが使用するユーザ端末200は、サーバ100に対して、ユーザの父及び母の少なくとも一方について、関連性の高い名字を推定する処理を要求する。
【選択図】
図1
【特許請求の範囲】
【請求項1】
ユーザの遺伝情報に基づいて、前記ユーザの父又は母の少なくとも一方のハプログループを特定する特定部と、
特定した前記ハプログループに基づいて、前記父又は前記母の少なくとも一方と関連する名字を推定する推定部と、を有する、
情報処理装置。
【請求項2】
前記遺伝情報が、mtDNA又はY-DNAの少なくとも一方を含む、
請求項1に記載の情報処理装置。
【請求項3】
前記推定部は、前記父又は前記母の少なくとも一方の前記ハプログループに基づいて、前記父又は前記母の少なくとも一方の関連する名字を関連度に応じて複数推定する、
請求項1に記載の情報処理装置。
【請求項4】
前記推定部は、前記名字に加えて、前記名字の由来に関する情報を抽出する、
請求項1に記載の情報処理装置。
【請求項5】
情報処理装置が、
ユーザの遺伝情報に基づいて、前記ユーザの父又は母の少なくとも一方のハプログループを特定するステップと、
特定した前記ハプログループに基づいて、前記父又は前記母の少なくとも一方と関連する名字を推定するステップと、を実行する、
情報処理方法。
【請求項6】
情報処理装置に、
ユーザの遺伝情報に基づいて、前記ユーザの父又は母の少なくとも一方のハプログループを特定するステップと、
特定した前記ハプログループに基づいて、前記父又は前記母の少なくとも一方と関連する名字を推定するステップと、を実行させる、
プログラム。
【発明の詳細な説明】
【技術分野】
【0001】
本発明は、情報処理装置、プログラム、及び情報処理方法に関する。
【背景技術】
【0002】
ヒトは、両親から配偶子を通してそれぞれ1セットのゲノムを受け取り、計2セットのゲノムを有する。2セットのゲノムにおいて、同じ遺伝子座を占める個々の遺伝子を対立遺伝子と呼ぶ。ハプロタイプは、片方の親由来の遺伝子の組み合わせを意味する。ヒトゲノムにおいて共通するハプロタイプを調べることで、そのヒトのルーツを探ることができる。例えば、特許文献1には、ハプロタイプデータを使用して個体間の祖先の血縁度を推定する方法が開示されている。
【先行技術文献】
【特許文献】
【0003】
【発明の概要】
【発明が解決しようとする課題】
【0004】
ハプロタイプに基づいて母型や父型の祖先のルーツについての調査は科学研究として非常に有意義であるが、一般ユーザからすれば個別に母型や父型の祖先のルーツを知ることで、家族の起源、歴史、文化、伝統を知ることができるサービスも非常に魅力的である。しかしながら、これまではハプロタイプの研究は遺伝学的な観点が強く、例えば、遺伝学的ルーツを示すハプロタイプと、結婚等により承継される名字などのヒトの生活習慣的ルーツとを、関連付けて、ユーザに提供するということはされていなかった。
【0005】
本発明は、上記点に鑑みてなされたものであり、ハプロタイプから名字を推定する新たなサービスを提供することのできる情報処理装置、情報処理方法、及びプログラムを提供することを目的とする。
【課題を解決するための手段】
【0006】
すなわち、本発明は以下のとおりである。
〔1〕
ユーザの遺伝情報に基づいて、前記ユーザの父又は母の少なくとも一方のハプログループを特定する特定部と、
特定した前記ハプログループに基づいて、前記父又は前記母の少なくとも一方と関連する名字を推定する推定部と、を有する、
情報処理装置。
〔2〕
前記遺伝情報が、mtDNA又はY-DNAの少なくとも一方を含む、
請求項1に記載の情報処理装置。
〔3〕
前記推定部は、前記父又は前記母の少なくとも一方の前記ハプログループに基づいて、前記父又は前記母の少なくとも一方の関連する名字を関連度に応じて複数推定する、
〔1〕又は〔2〕に記載の情報処理装置。
〔4〕
前記推定部は、前記名字に加えて、前記名字の由来に関する情報を抽出する、
〔1〕~〔3〕のいずれか一項に記載の情報処理装置。
〔5〕
情報処理装置が、
ユーザの遺伝情報に基づいて、前記ユーザの父又は母の少なくとも一方のハプログループを特定するステップと、
特定した前記ハプログループに基づいて、前記父又は前記母の少なくとも一方と関連する名字を推定するステップと、を実行する、
情報処理方法。
〔6〕
情報処理装置に、
ユーザの遺伝情報に基づいて、前記ユーザの父又は母の少なくとも一方のハプログループを特定するステップと、
特定した前記ハプログループに基づいて、前記父又は前記母の少なくとも一方と関連する名字を推定するステップと、を実行させる、
プログラム。
【発明の効果】
【0007】
本発明によれば、ハプロタイプから名字を推定する新たなサービスを提供することのできる情報処理装置、情報処理方法、及びプログラムを提供できる。
【図面の簡単な説明】
【0008】
【
図2A】本実施形態におけるサーバの構成を示す図である。
【
図2B】本実施形態におけるサーバのユーザデータの構成を示す図である。
【
図2C】本実施形態におけるサーバの匿名データの構成を示す図である。
【
図2D】本実施形態におけるサーバの名字データの構成を示す図である。
【
図3A】本実施形態におけるユーザ端末の構成を示す図である。
【
図3B】本実施形態におけるユーザ端末の画面の一例を示す図である。
【
図3C】本実施形態におけるユーザ端末の画面の一例を示す図である。
【
図4】本実施形態におけるシステムが行う処理を示すシーケンス図の一例である。
【発明を実施するための形態】
【0009】
以下、本発明の実施の形態(以下、「本実施形態」という。)について詳細に説明するが、本発明はこれに限定されるものではなく、その要旨を逸脱しない範囲で様々な変形が可能である。なお、同一の要素には同一の符号を付し、重複する説明を省略する。
【0010】
1.システム
図1は、本実施形態のシステムを示す概略図である。
図1に示すように、本実施形態のシステム1は、サーバ100及びユーザ端末200を備えてもよい。サーバ100及びユーザ端末200は、ネットワークNを介して接続されていてもよい。
【0011】
サーバ100は、ユーザ端末200からの要求に応じて、ユーザの遺伝情報に基づいて、そのユーザの父及び母の少なくとも一方のハプログループを特定する処理と、特定したハプログループから父及び母の少なくとも一方の関連性の高い名字を推定する処理と、を実行し、その結果を、ユーザ端末200に送信する。
【0012】
ユーザ端末200は、ユーザが使用する端末であり、サーバ100に対して、ユーザの父及び母の少なくとも一方について、関連性の高い名字を推定する処理を要求してもよい。また、ユーザ端末200は、上記処理の結果をサーバ100から受信して、処理結果を表示装置に表示制御してもよい。
【0013】
ネットワークNとしては、特に制限されないがアドホック・ネットワーク、イントラネット、エクストラネット、仮想プライベート・ネットワーク(VPN)、ローカル・エリア・ネットワーク(LAN)、ワイヤレスLAN(WLAN)、広域ネットワーク(WAN)、ワイヤレスWAN(WWAN)、大都市圏ネットワーク(MAN)、インターネットの一部、公衆交換電話網(PSTN)の一部、携帯電話網、ISDNs、無線LANs、LTE、CDMA、ブルートゥース(登録商標)、衛星通信等であってよく、これらが組み合わせられてもよい。ネットワークは、1つまたは複数のネットワークを含むことができる。
【0014】
以下、本実施形態の情報処理装置がユーザ端末である場合を例に説明するが、本実施形態はこれに限定されるものではない。
【0015】
1.1.サーバ
図2Aに、本実施形態のサーバの構成を示す図を示す。
図2Aに示すように、サーバ100は、例えば、プロセッサ110、通信インターフェース120、入出力インターフェース130、メモリ140、ストレージ150、及びこれらの構成要素を相互接続するための1つ又は複数のバス160を含む。サーバ100は、例えば、デスクトップ、ラップトップ、その他コンピュータであってもよい。また、サーバ100は、汎用的なコンピュータであり、一台のコンピュータで構成されてもよいし、ネットワークN上に雲散する複数台のコンピュータで構成されてもよい。
【0016】
プロセッサ110は、ストレージ150に記憶されるプログラムに含まれるコード、又は、命令によって実現する処理、機能、又は、方法を実行する。
図3Aに示すように、本実施形態のプロセッサ110は、送受信部111、管理部112、特定部113、推定部114、及び学習部115として機能してもよい。
【0017】
送受信部111は、例えば、通信インターフェース120とネットワークNを介して、ユーザ端末200などの他の装置に各種情報を送信する送信部、又は他の装置から各種情報を受信する受信部として機能してもよい。
【0018】
例えば、送受信部111は、ユーザ端末200から、父及び母の少なくとも一方の関連性の高い名字の推定処理の要求を受信してもよい。また、送受信部111は、ユーザ端末200に対して、当該推定処理の結果を送信してもよい。
【0019】
なお、ユーザの遺伝情報に関しては、一般にはユーザが自ら直接調べる情報ではないため、ユーザ端末200からサーバ100に推定処理の要求を送信する際に、ユーザの遺伝情報を一緒に送信しなくてもよい。ユーザの遺伝情報は、遺伝情報解析サービスを提供する企業がユーザに対して遺伝情報解析キットを送付し、ユーザから返送された遺伝情報解析キットを解析して、調べることができる。そして、遺伝情報解析サービスを提供する企業が、直接的又は間接的に、サーバ100にユーザの遺伝情報を入力することで、サーバ100はユーザの遺伝情報を取得することができる。
【0020】
この際、サーバ100に対するユーザの遺伝情報の入力は、送受信部111が他の情報処理装置からユーザの遺伝情報を受信して行ってもよいし、またこれに代えて、サーバ100は、入出力インターフェース130を介してユーザの遺伝情報を受け付けて行ってもよい。
【0021】
管理部112は、ユーザの遺伝情報や氏名等の個人情報をユーザデータ151に記録する処理と、他の機能部からの要求に応じて、ユーザデータ151に記録された情報を提供する処理を実行してもよい。例えば、管理部112は、上記のようにして取得したユーザの遺伝情報をユーザIDと対応付けて、ユーザデータ151に記録してもよい。また、ユーザ端末200からの要求に応じて、管理部112はユーザデータ151に記録した遺伝情報を特定部113に提供し、推定部114が推定した名字に関する情報を記録してもよい。
【0022】
図2Bに、ユーザデータ151のデータ構造の一例を示す。
図2Bに示すように、ユーザデータ151には、ユーザを一意に識別するためのユーザID、ユーザの氏名、性別、及び遺伝情報などが対応付けて記録されてもよい。また、ユーザデータ151には、特定部113が特定したユーザの父又は母の少なくとも一方のハプログループが記録されてもよい。さらに、ユーザデータ151には、推定部114がハプログループに基づいて推定した、父又は母の少なくとも一方と関連する名字がさらに記録されてもよい。
【0023】
なお、厳密には、「名字」は、同じ氏の公家が違いの区別のために使った称号が元になったものであり、「苗字」は、江戸時代以降に広まったものとされる。しかしながら、本実施形態においては両者を区別せず、本来的には「苗字」であったとしても「名字」を使用する。
【0024】
また、本実施形態において、「母」、「父」、或いは「両親」とは、生物学的、遺伝学的な意味における親を意味する。
【0025】
特定部113は、ユーザの遺伝情報に基づいて、ユーザの父又は母の少なくとも一方のハプログループを特定する。当該特定処理において、特定部113は、ユーザデータ151に記録されたユーザの遺伝情報を参照してもよい。なお、遺伝情報には、ミトコンドリアDNA(mtDNA)又はY染色体(Y-DNA)の少なくとも一方又は両方が含まれてもよい。
【0026】
受精の際には、卵子内のmtDNAが母から子へと受け継がれ、父のmtDNAは失われる。このように、ハプロタイプとして知られているmtDNA突然変異または遺伝的変異のグループは、母から子へと遺伝するため、mtDNAを使用することで、母系を追跡することができる。
【0027】
また、Y染色体は男性だけがもつ染色体であり、Y染色体は別の染色体と再結合またはDNAを交換せず、Y染色体に含まれるすべての遺伝情報は父から息子に渡される。そのため、Y染色体を使用することで、男性の父系を追跡することができる。
【0028】
つまり、ユーザが男性である場合には、母から遺伝したmtDNAと父から遺伝したY-DNAを有するため、特定部113は、ユーザの遺伝情報に基づいて、ユーザの父及び母の両方のハプログループを特定することができる。
【0029】
一方で、ユーザが女性である場合には、母から遺伝したmtDNAのみを有するため、特定部113は、ユーザの遺伝情報に基づいて、ユーザの母のハプログループを特定することができる。
【0030】
特定部113によるハプログループの特定は、ハプログループ名とその遺伝学的な分類方法が定められた、公知のデータベースなどを参照することにより実行できる。例えば、ミトコンドリアDNA(mtDNA)のハプログループの樹状分類については、https://www.phylotree.org/tree/index.htmにおいてまとめられている。また、Y染色体(Y-DNA)のハプログループの樹状分類については、https://isogg.org/tree/2017/index17.htmlにおいてまとめられている。その他、 https://www.yfull.com/tree/やその他の情報を参照してもよい。
【0031】
推定部114は、特定したハプログループに基づいて、父又は母の少なくとも一方と関連する名字を推定する。具体的には、ユーザが男性である場合には、特定部113がユーザの父及び母の両方のハプログループを特定できるため、推定部114は、父及び母の両方について関連する名字を推定することができる。また、ユーザが女性である場合には、特定部113がユーザの母のハプログループを特定できるため、推定部114は、母について関連する名字を推定することができる。
【0032】
この際、推定部114は、父又は母の少なくとも一方のハプログループに基づいて、父又は母の少なくとも一方の関連する名字を関連度に応じて複数推定してもよい。推定部114は、上記推定処理において、ハプログループと名字の関連性を記録したテーブルを参照してもよい。なお、上記推定処理はテーブル以外に、モデル棟を用いて実行してもよい。
【0033】
このようなテーブルは、学習部115が予め作成してもよい。具体的には、学習部115は、名字とハプログループとが対応付けて記録された匿名化された情報を記録した匿名データ152に基づいて、所定のハプログループと相関の高い名字を特定し、それをテーブル等として作成してもよい。
【0034】
図2Cに、匿名データ152のデータ構造の一例を示す。
図2Cに示すように、匿名データ152には、匿名化された情報として、名字とハプログループとが対応付けて記録されていてもよい。また、上記に加え、性別が対応付けられていてもよい。相関関係の作成方法は、特に限定されないが、例えば、フィッシャの正確確立検定などのノンパラメトリックな従来公知の単変量解析手法を使用してもよい。また、相関度はp値などにより表わしてもよい。
【0035】
また、推定部114は、名字の推定に加えて、名字の由来に関する情報の抽出をし、名字に関する情報を付して、ユーザ端末200に送信してもよい。この際、推定部114は、推定した名字に基づいて、名字データ153を参照して、名字の由来に関する情報の抽出をしてもよい。
【0036】
図2Dに、名字データ153のデータ構造の一例を示す。
図2Dに示すように、名字データ153には、名字と名字に関する情報とが対応付けて記録されていてもよい。ここで、名字に関する情報としては、特に限定されないが、例えば、その名字の系譜、その名字の地理的分布、その他、名字に関する情報が挙げられる。
【0037】
プロセッサ110は、限定でなく例として、1又は複数の中央処理装置(CPU)、マイクロプロセッサ(MPU、画像処理装置(GPU)、プロセッサコア、マルチプロセッサ、特定用途向け集積回路(ASIC)、特定用途向け集積回路(FPGA)等を含み、集積回路(IC)チップ、LS)や専用回路によって各実施形態に開示されるそれぞれの、処理、機能、又は、方法を実現してもよい。
【0038】
通信インターフェース120は、ネットワークを介して他の装置と各種データの送受信を行う。当該通信は、有線、無線のいずれで実行されてもよく、互いの通信が実行できるのであれば、どのような通信プロトコルを用いてもよい。例えば、通信インターフェース120は、ネットワークアダプタ等のハードウェア、各種の通信用ソフトウェア、又はこれらの組み合わせとして実装される。
【0039】
入出力インターフェース130は、サーバ100に対する各種操作を入力する入力装置、及び、サーバ100で処理された処理結果を出力する出力装置を含む。例えば、入出力インターフェース130は、キーボード、マウス、及びタッチパネル等の情報入力装置、及び表示装置131などの情報出力装置を含んでもよい。なお、サーバ100は、外付けの入出力インターフェース130を接続することで、所定の入力を受け付けてもよいし、所定の出力を実行してもよい。
【0040】
メモリ140は、ストレージ150からロードしたプログラムを一時的に記憶し、プロセッサ110に対して作業領域を提供する。メモリ140には、プロセッサ110がプログラムを実行している間に生成される各種データも一時的に格納される。メモリ140は、例えば、DRAM、SRAM、DDR RAM又は他のランダムアクセス固体記憶装置などの高速ランダムアクセスメモリであってよく、これらが組み合わせられてもよい。
【0041】
ストレージ150は、プログラム、各機能部、及び各種データを記憶する。ストレージ150は、例えば、上述したユーザデータ151、匿名データ152、及び名字データ153などを格納してもよい。
【0042】
また、ストレージ150は、例えば、1つ又は複数の磁気ディスク記憶装置、光ディスク記憶装置、フラッシュメモリデバイス、又は他の不揮発性固体記憶装置などの不揮発性メモリ等であってよく、これらが組み合わせられてもよい。ストレージ150の他の例としては、プロセッサ110から遠隔に設置される1つ又は複数の記憶装置を挙げることができる。
【0043】
1.2.ユーザ端末
図2Aに、本実施形態のユーザ端末200の構成を示す図を示す。
図2Aに示すように、ユーザ端末200は、例えば、プロセッサ210、通信インターフェース220、入出力インターフェース230、メモリ240、ストレージ250、及びこれらの構成要素を相互接続するための1つ又は複数のバス260を含む。ユーザ端末200は、例えば、スマートフォン、携帯電話、デスクトップ、ラップトップ、タブレット、ハンドヘルドコンピュータデバイス、ウェアラブル端末等であってもよい。
【0044】
プロセッサ210は、ストレージ250に記憶されるプログラムに含まれるコード、又は、命令によって実現する処理、機能、又は、方法を実行する。
図2Aに示すように、本実施形態のプロセッサ210は、送受信部211及び表示制御部212として機能してもよい。
【0045】
送受信部211は、例えば、通信インターフェース220とネットワークNを介して、サーバ100に対して、父及び母の少なくとも一方の関連性の高い名字の推定処理の要求を送信する送信部、又はサーバ100から推定処理の結果を受信する受信部として機能してもよい。
【0046】
表示制御部212は、表示装置231に対して、推定処理の結果を表示制御してもよい。
図3Bに、ユーザ端末200の表示装置231に表示制御される推定処理の結果画面D1の一例を示す。
図3Bに示すように、父または母の名字は、タブO1で切り替えられるようにしてもよい。また、ユーザが所属するハプログループが複数ありえる場合には、そのハプログループごとに表示領域O2を分けて、名字の推定がされてもよい。
【0047】
さらに、
図3Bに示すように、表示制御部212は、推定処理の結果として、関連度に応じて複数の名字を表示制御してもよい。また、画面D1において名字O3をタップすると、
図3Cに示すように、画面D2において名字の由来に関する情報を表示制御するようにしてもよい。名字の由来に関する情報は、例えば、名字の系譜に関する情報を表示する領域O4と、地理的分布に関する情報を表示する領域O5に分けて表示されてもよい。
【0048】
その他、プロセッサ210、通信インターフェース220、入出力インターフェース230、メモリ240、ストレージ250、及びバス260の構成は、プロセッサ110、通信インターフェース120、入出力インターフェース130、メモリ140、ストレージ150、及びバス160と、同様としてもよい。
【0049】
1.3.動作処理
図4を参照し、本実施形態に係る情報処理装置の処理と各機能部の詳細について説明する。
図4は、本実施形態におけるシステム1が行う処理を示すシーケンス図の一例を示す。なお、以下で説明する処理手順は一例に過ぎず、各処理は、本開示の技術思想の範囲内において可能な限り変更されてよく、また、適宜、ステップの省略、置換、および追加が可能である。
【0050】
ステップS401において、ユーザ端末200は、ユーザの操作に応じて、遺伝情報に基づく名字の推定処理の要求をサーバ100に対して送信し、サーバ100の送受信部111は、当該要求を受信する。
【0051】
ステップS402において、サーバ100の特定部113は、ユーザデータ151を参照して、遺伝情報に基づいて、ユーザのハプログループを特定する。
【0052】
ステップS403において、サーバ100の推定部114は、上述したハプログループと名字の関係を表現したテーブルなどを用いて、特定部113が特定したハプログループに基づいて、関連度のある名字を推定してもよい。
【0053】
ステップS404において、サーバ100の推定部114は、推定した名字に基づいて名字データ153等を参照して、名字に由来に関する情報を抽出してもよい。
【0054】
ステップS405において、サーバ100の推定部114は、推定結果に関する情報をユーザ端末200に送信する。
【0055】
ステップS406において、ユーザ端末200は、推定された名字やその由来に関する情報を表示制御する。
【0056】
2.情報処理方法
本実施形態のサーバ100の情報処理方法においては、情報処理装置が、ユーザの遺伝情報に基づいて、前記ユーザの父又は母の少なくとも一方のハプログループを特定するステップと、特定した前記ハプログループに基づいて、前記父又は前記母の少なくとも一方と関連する名字を推定するステップと、を実行する。
【0057】
なお、本実施形態の方法の具体的態様については、上記動作処理で述べているため、ここでは詳細な説明は省略する。
【0058】
3.プログラム
本実施形態のサーバ100のプログラムにおいては、情報処理装置に、ユーザの遺伝情報に基づいて、前記ユーザの父又は母の少なくとも一方のハプログループを特定するステップと、特定した前記ハプログループに基づいて、前記父又は前記母の少なくとも一方と関連する名字を推定するステップと、を実行させる。
【0059】
プログラムは、読み取り可能な記録媒体に記録された物であってもよい。なお、本実施形態のプログラムが実行する処理の具体的態様については、上記動作処理で述べているため、ここでは詳細な説明は省略する。
【符号の説明】
【0060】
1…システム、100…サーバ、110…プロセッサ、111…送受信部、112…管理部、113…特定部、114…推定部、115…学習部、120…通信インターフェース、130…入出力インターフェース、131…表示装置、140…メモリ、150…ストレージ、151…ユーザデータ、152…匿名データ、153…名字データ、160…バス、200…ユーザ端末、210…プロセッサ、211…送受信部、212…表示制御部、220…通信インターフェース、230…入出力インターフェース、231…表示装置、240…メモリ、250…ストレージ、260…バス。