(58)【調査した分野】(Int.Cl.,DB名)
前記データ処理装置は、前記生体データのうち遺伝体識別子、遺伝体位置および遺伝形質情報を含む遺伝体変異情報のうち少なくとも一つを暗号化する、請求項1に記載の生体データ提供方法。
【発明を実施するための形態】
【0010】
以下、説明において使用される用語について説明する。
試料(sample)は、分析対象になる個体から採取した単一細胞または多重細胞、細胞断片、体液などを意味する。
【0011】
個体(subject)は、細胞、組織または有機体を含む。個体は、基本的にヒトを対象とするが、これに限定されない。個体は、動物、植物、微生物などを含むことができる。
【0012】
遺伝体データないし遺伝体情報は、特定個体の試料から得られた遺伝情報を意味する。例えば、遺伝体データは、細胞、組織などからデオキシリボ核酸(DNA)、リボ核酸(RNA)、またはタンパク質(Protein)などから得られた塩基配列、遺伝子発現データ、標準遺伝体データとの遺伝変異、DNAメチル化(methylation)などを含むことができる。一般的に、遺伝体データは、特定の試料を分析して得られた配列情報を含む。遺伝体データは、一般的にデジタルデータで表現される。NGS分析装置を用いて得られた配列データなどがこれに該当する。
【0013】
表現型(phenotype)データないし表現型情報は、本来生命体の表面に現れる発現形質を意味する。表現型データは、細胞/組織/個体の外部発現形質を意味する。例えば、個人(ヒト)の場合、表現型データは、身長、体重のような測定値、性別、人種、疾患の有無、健康状態(疾患)に対するアンケート調査値などを含むことができる。
【0014】
ひいては、表現型データは、個人の健康状態を判断できるデータを含むことができる。例えば、表現型データは、電子医療記録(EMR,Electronic Medical Record)のような医療データを含むことができる。医療データは、医療装備を利用した検査結果(臨床情報)または医療スタッフによる診断結果などを含むことができる。例えば、医療データは、医療装備により獲得された映像データなどを含むことができる。また、医療データは、ヘルスケアデバイスが測定した生体信号データを含むことができる。また、医療データは、IoTデバイスが測定した生活習慣データ(活動パターン、運動量など)を含むこともできる。
【0015】
生体データ(bio data)は、前述した遺伝体データ、表現型データ、バイオメトリックデータおよび医療データを包括する意味として使用する。生体データは、遺伝体データ、表現型データおよび医療データのうち少なくとも一つのデータ類型を含むことができる。
【0016】
試料(sample)提供者は、遺伝体データ分析のための試料を提供する主体である。例えば、試料提供者は、個人または医療機関でありうる。または、試料提供者は、試料を分析するための研究機関や分析企業でありうる。
【0017】
生体データ提供者は、試料を分析して遺伝体データのような生体データを生産する主体である。例えば、生体データ提供者は、NGS(Next Generation Sequencing)に基づく遺伝体データを生産することができる。生体データ提供者は、遺伝体データと表現型データを結合して生体データを生産することもできる。
【0018】
生体データユーザは、生体データを使用する主体である。生体データユーザは、生体データを使用して分析を行う主体である。例えば、生体データユーザは、医療機関、分析企業などでありうる。生体データユーザは、GWASに基づく分析を行うこともできる。
【0019】
サービス提供者は、生体データを一定に処理する主体である。サービス提供者は、生体データを分析する主体ではなく、生体データを一定に処理して生体データユーザに提供する主体である。生体データ処理は、生体データ暗号化、生体データ前処理、生体データ後処理などを含むことができる。例えば、サービス提供者は、生体データの全体または一部を暗号化して生体データユーザに提供することができる。また、サービス提供者は、暗号化された生体データを一定のフォーマットに変換して生体データユーザに提供することができる。サービス提供者は、生体データを一定に処理/加工/暗号化するサービスを提供する主体である。
【0020】
場合によって、サービス提供者が生体データ生産をすることもできる。この場合、サービス提供者は、自分が生産した生体データを一定に処理するサービスまで行う。以下、サービス提供者が提供する生体データサービスを中心に説明する。
【0021】
図1は、生体データを処理する過程に対する例である。時間の流れによって説明する。
図1は、試料提供者5、サービス提供者10および生体データユーザ20を示す。サービス提供者10は、試料を利用して生体データを生成し、生体データを提供するサービスをする。
【0022】
サービス提供者10は、試料提供者5から試料を伝達され得る。または、サービス提供者10は、生体データユーザ20から試料を伝達されることもできる。このように生体データユーザ20が試料を収集してサービス提供者10に伝達することもできる。
【0023】
サービス提供者10は、まず、生体データを生成する。サービス提供者10は、NGS分析を通じて遺伝体データを生成することができる。遺伝体データは、NGS分析の他にも多様な方法で生産され得る。サービス提供者10は、試料提供者5の表現型データを獲得することができる。例えば、サービス提供者10は、EMRのような医療データベース30から特定試料の提供者に対する表現型データを獲得することができる。この場合、サービス提供者10は、試料または試料提供者の識別子を基準として医療データベース30からマッチングされる特定の表現型データを獲得することができる。表現型データは、身体情報、生体信号情報、医療情報および診療情報のうち少なくとも一つを含むことができる。サービス提供者10は、遺伝体データおよび表現型データのうち少なくとも一つを使用して生体データを生成することができる。サービス提供者10は、遺伝体データだけから構成される生体データを生成することもできる。生体データは、デジタルデータである。
【0024】
サービス提供者10は、生体データを一定に処理することができる。代表的に、サービス提供者10は、生体データを暗号化することができる。サービス提供者10は、生体データの全体または一部を暗号化することができる。暗号化過程については、後述する。
【0025】
サービス提供者10は、暗号化された生体データを生体データユーザ20に伝達する。生体データユーザ20は、暗号化された生体データを利用して生体データを分析することができる。生体データは、前述したように、一定のデジタルデータ形態である。遺伝体データを基準として説明すると、遺伝体データは、遺伝子または一定の配列断片(fragment)の位置および当該遺伝子の種類ないし配列構成で特定され得る。サービス提供者10は、同じ原本値(例えば、“AGC”)を同じ暗号化データ(例えば、“011110”)で暗号化する。したがって、生体データユーザ20は、暗号化されたデータを基準として一定のパターンまたは一定の位置に現れる情報を抽出することができる。生体データユーザ20は、このように暗号化されたデータを基準として分析結果を導き出すことができる。例えば、生体データユーザ20は、繰り返される特定の配列、特定の位置に存在する配列、有意なSNPパターンなどを分析結果として導き出すことができる。
【0026】
生体データユーザ20は、分析結果をサービス提供者10に伝達することができる。サービス提供者10は、分析結果に存在する暗号化された生体データを一定に復号することができる。復号過程については、後述する。サービス提供者10は、分析結果の全体または分析結果に含まれた特定の生体データを復号して、原本生体データを生体データユーザ20に伝達することができる。例えば、サービス提供者10は、特定のSNPパターンを生体データユーザ20に伝達することができる。生体データユーザ20は、復号された生体データを受信して、最終的な分析結果を導き出すことができる。例えば、生体データユーザ20は、受信した配列またはSNPパターンを基準として特定試料(個人)に対する疾患診断をすることもできる。または、生体データユーザ20は、生体データプール(pool)を利用してゲノムワイド相関分析(GWAS)をすることもできる。
【0027】
図2は、生体データを処理する過程に対する他の例である。
図2は、試料提供者5、生体データ提供者40、サービス提供者50および生体データユーザ60を示す。
図2は、生体データ提供者40とサービス提供者50が互いに異なる主体である場合を示す。時間の流れによって説明する。
【0028】
生体データ提供者40は、試料提供者5から試料を伝達され得る。または、生体データ提供者40は、
図1のように、生体データユーザ60から試料を伝達されることもできる(不図示)。
【0029】
生体データ提供者40は、生体データを生成する。生体データ提供者40は、NGS分析を通じて遺伝体データを生成することができる。遺伝体データは、NGS分析の他にも多様な方法で生産され得る。生体データ提供者40は、試料提供者5の表現型データを獲得することができる。例えば、生体データ提供者40は、EMRのような医療データベース30から特定試料の提供者に対する表現型データを獲得することができる。この場合、生体データ提供者40は、試料または試料提供者の識別子を基準として医療データベース30からマッチングされる特定の表現型データを獲得することができる。表現型データは、身体情報、生体信号情報、医療情報および診療情報のうち少なくとも一つを含むことができる。生体データ提供者40は、遺伝体データおよび表現型データのうち少なくとも一つを使用して生体データを生成することができる。生体データ提供者40は、遺伝体データだけから構成される生体データを生成することもできる。生体データは、デジタルデータである。
【0030】
サービス提供者50は、生体データを一定に処理することができる。代表的にサービス提供者50は、生体データを暗号化することができる。サービス提供者50は、生体データの全体または一部を暗号化することができる。暗号化過程については、後述する。
【0031】
サービス提供者50は、暗号化された生体データを生体データユーザ60に伝達する。生体データユーザ60は、暗号化された生体データを利用して生体データを分析することができる。生体データユーザ60は、暗号化されたデータを基準として分析結果を導き出すことができる。例えば、生体データユーザ60は、繰り返される特定の配列、特定の位置に存在する配列、有意なSNPパターンなどを分析結果として導き出すことができる。
【0032】
生体データユーザ60は、分析結果をサービス提供者50に伝達することができる。サービス提供者50は、分析結果に存在する暗号化された生体データを一定に復号することができる。復号過程については、後述する。サービス提供者50は、分析結果の全体または分析結果に含まれた特定生体データを復号して、原本生体データを生体データユーザ60に伝達することができる。例えば、サービス提供者50は、特定のSNPパターンを生体データユーザ60に伝達することができる。生体データユーザ60は、復号された生体データを受信して、最終的な分析結果を導き出すことができる。例えば、生体データユーザ60は、受信した配列またはSNPパターンを基準として特定試料(個人)に対する疾患診断をすることもできる。または、生体データユーザ20は、生体データプール(pool)を利用してゲノムワイド相関分析(GWAS)をすることもできる。
【0033】
図3は、生体データを処理するシステム100に対する例である。
図3は、生体データユーザA、生体データ提供者Bおよびサービス提供者Cを示す。生体データユーザA、生体データ提供者Bおよびサービス提供者Cは、それぞれシステム100において分析装置、端末装置ないしサーバーなどのようなオブジェクトで特定され得る。
【0034】
生体データ処理システム100は、データ生成装置110、データ処理装置130およびデータ分析装置140を含むことができる。データ生成装置110は、試料を分析する分析装置でありうる。例えば、データ生成装置110は、NGS分析装置を含むことができる。データ生成装置110は、遺伝体データを生成する。また、データ生成装置110は、医療データベース120から分析対象である特定人に対する表現型データを受信することができる。データ生成装置110は、遺伝体データおよび表現型データから構成された生体データを生成することができる。データ生成装置110は、遺伝体データを含む生体データを生成することもできる。
【0035】
データ処理装置130は、データ生成装置110が生成した生体データを処理する。データ処理装置130は、生体データの全体または一部を暗号化する。データ処理装置130は、一定のハッシュキーを利用して生体データをハッシュすることができる。
【0036】
データ分析装置140は、暗号化された生体データを利用してデータを分析することができる。データ分析装置140は、分析結果をデータ処理装置130に伝送することができる。データ処理装置130は、分析結果のうち暗号化された生体データを一定に復号して、データ分析装置140に伝達することができる。データ分析装置140は、最終分析結果をユーザ端末150に伝達することができる。ユーザ端末150は、分析を依頼した個人または機関を代表する。
【0037】
図4は、生体データ処理システム100の動作(200)に対する例である。データ生成装置110は、生体データを生成する(201)。データ生成装置110は、生体データをデータ処理装置130に伝達する。データ生成装置110は、多数の試料に対する生体データをデータ処理装置130に伝達することができる。データ処理装置130は、生体データプール(pool)を保存し、管理する(211)。データ処理装置130は、外部ネットワークから隔離された保存空間に生体データを保存することができる。データ処理装置130は、遺伝体データと表現型データを区分して保存することもできる。
【0038】
データ生成装置110は、生体データを一定に暗号化して、データ処理装置130に伝達することができる。データ処理装置130は、暗号化された生体データを復号して保存することができる。この際、公開キー基盤の暗号化方式を利用することもできる。公開キーは、データを暗号化するキーであり、暗号キーは、暗号化されたデータを復号するキーである。公開キーと暗号キーは、互いに対をなし、多様な公開キー暗号化方法(例えば、RSA、楕円曲線暗号など)を利用して無作為で生産され得る。
【0039】
データ処理装置130は、データ分析装置140から分類情報を受信することができる(221)。または、データ処理装置130は、データ生成装置110から分類情報を獲得することもできる。
【0040】
データ処理装置130は、分類情報によって生体データプールで生体データセットを生成する(231)。生体データセットは、多数の生体データから構成される。生体データセットは、互いに異なるオブジェクト(個人)に対する生体データから構成される。データ処理装置130は、分類情報に含まれた特定基準によって生体データプールから生体データを選択する。
【0041】
データ処理装置130は、生体データセットに含まれた生体データを暗号化する(232)。データ処理装置130は、生体データの全体または一部を暗号化することができる。データ処理装置130は、ハッシュキーを利用して生体データを暗号化することができる。データ処理装置130は、生体データセットを構成する生体データの組合せによってハッシュキーを決定することができる。または、データ処理装置130は、分類情報によってハッシュキーを決定することができる。すなわち、ハッシュキーを固定された値を有するものでなく、生体データセットの構成によって互いに異なる値が使用され得る。
データ処理装置130は、暗号化された生体データをデータ分析装置140に伝達する。この際、必要な場合(optional)、データ処理装置130は、暗号化された生体データをデータ分析装置140が要求するデータフォーマットに変換することができる(241)。
【0042】
データ分析装置140は、暗号化された生体データを利用して生体データを分析する(261)。データ分析装置140は、暗号化された生体データを暗号化状態で分析する。データ分析装置140は、分析結果をデータ処理装置130に伝達することができる(262)。
【0043】
データ処理装置130は、分析結果のうち暗号化された生体データを復号することができる(271)。データ処理装置130は、生体データ原本値とハッシュ結果をマッチングしたマッピングテーブルを保有することができる。生体データは、一定の範囲の値を有するので、一定の容量のマッピングテーブル構成が可能である。データ処理装置130は、マッピングテーブルを利用してハッシュドェン生体データを原本生体データに変換することができる。データ処理装置130は、復号したデータをデータ分析装置140に伝達することができる(272)。
【0044】
データ処理装置130が暗号化された生体データをデータ分析装置140に提供する。データ分析装置140も、暗号化された生体データを分析する。暗号化された生体データが第三者に露出しても、第三者は、生体データを提供した個人の情報を追跡できない。
【0045】
生体データを暗号化する例について説明する。
図5は、生体データおよび暗号化されたデータに対する例である。
【0046】
図5(A)は、遺伝体データに対する暗号化の例である。原本遺伝体データは、遺伝体識別子(番号)、遺伝体位置および変異情報を含むことができる。遺伝体識別子は、遺伝体の種類ないし遺伝体が抽出された細胞内位置情報を示すことができる。例えば、ヒトの場合、遺伝体識別子は、相同染色体の番号(1〜22)、X染色体(X)、Y染色体(Y)、ミトコンドリア(MT)などのような値を有する。遺伝体位置情報は、当該個体の全体遺伝子における位置を示すことができる。例えば、ヒトの場合、遺伝体位置情報は、1〜3,000,000,000(30億個)の範囲を有することができる。変異情報は、遺伝体の配列情報を示す。SNPの場合、変異情報は、一つの塩基配列以上が異なる場合、当該情報を示す。変異情報は、ユニバーサルな配列と異なる配列に関する情報を含む。
【0047】
データ処理装置は、遺伝体データのうち一部の項目のみに対して暗号化をすることができる。例えば、データ処理装置は、遺伝体識別子および遺伝体位置だけを暗号化することができる。データ処理装置は、ハッシュキーを利用して遺伝体データの全体または一部を変換することができる。ハッシュキーは、多様な方法を通じて生成され得る。代表的なハッシュキー生成アルゴリズムは、MD5、SHA−256などがある。ハッシュキーは、多様な長さの文字列から構成されるキーである。前述したように、ハッシュキーは、生体データセットの構成によって動的に変更され得る。
【0048】
ひいては、データ処理装置は、遺伝体識別子と遺伝体位置を一定に加工した後、ハッシュすることもできる。例えば、データ処理装置は、遺伝体識別子と遺伝体位置を一定のルールによって結合(concatenation)した後、ハッシュすることもできる。例えば、データ処理装置は、遺伝体番号「1」と遺伝体位置「23」をハッシュして、本来データを類推できない符号のない整数型(0〜4,294,967,295)に変換することができる。
【0049】
遺伝体変異情報は、塩基配列であるA、G、T、Cの組合せから構成される。例えば、遺伝体変異形態がA/T型であれば有しうる変異情報は、AA、AT、TTである。データ処理装置は、各塩基を二進数に変換することができる。この際、暗号化は、ハッシュキーと暗号化された位置情報をベースに変わる。例えば、聞いて遺伝体1番1000位置の変異型がA/T型であれば、AA型は、00、AT型は、01、TT型は、11になり得、遺伝体2番4000位置の変異型がA/G型であれば、AA型は、11、AG型は、01、GG型は、00になり得る。
【0050】
このように文字列形態の情報を二進数に変換すると、データ処理装置は、原本生体データをよりサイズが小さい2進データに減らすことができる。
【0051】
図5(B)は、表現型データに対する暗号化の例である。原本表現型データは、性別、人種、キー(身長)、服用薬などのような情報から構成され得る。各項目の値は、テキストまたは数字である。データ処理装置は、表現型データの全体または一部をハッシュすることができる。例えば、データ処理装置は、表現型データを区間別に分けて代表値に変換したり、または変異情報のように二進数に変換することができる。
【0052】
遺伝体データおよび/または表現型データは、多様な方法でハッシュされ得る。前述したように、ハッシュキーは、生体データセットを構成によって動的に変更され得る。
図6は、ハッシュキーを決定する過程に対する例である。
図6は、データ分析装置311、312および313およびデータ処理装置350を示す。生体データプールは、100個の個別生体データから構成された例を示す。
【0053】
データ処理装置350は、データ分析装置311、312または313から分類情報を受信する。データ処理装置350は、受信した分類情報によって生体データプールから一定の生体データを選択して生体データセットを構成する。
【0054】
分類情報は、人種、年齢、体重、身長、性別、疾患の有無、疾患の種類、生体データセットを構成するグループの個数および全体または個別グループに属する生体データの個数のうち少なくとも一つの情報から構成され得る。基本的に、分類情報は、生体データプールから特定のグループを選別する基準に該当する。いくつかの例を挙げて説明する。
【0055】
(1)データ分析装置311は、分類情報1をデータ処理装置350に伝送する。生体データユーザは、自身の研究目的に合う試料に対する生体データを要請する。分類情報1は、「アジア人」+「男性」+「60才以上」という情報を含むことができる。この場合、データ処理装置350は、生体データプールからアジア系60才以上の男性に対する生体データを選択して、生体データセットを生成することができる。以後、データ処理装置350は、選択した生体データセットに属する生体データを暗号化(暗号化された生体データ1)して、データ分析装置311に伝達することができる。データ処理装置350は、生体データセットを構成する生体データの組合せを基準として暗号化のためのハッシュキー(ハッシュキー1という)を生成することができる。例えば、ハッシュキーは、特定の入力値によって異なる値を算出する関数で決定され得る。データ処理装置350は、分類情報1を基準としてハッシュキー1を生成することもできる。
【0056】
(2)データ分析装置312は、分類情報2をデータ処理装置350に伝送する。分類情報2は、高血圧患者と正常ヒトという情報を含むことができる。この場合、データ処理装置350は、生体データプールから高血圧患者に対する生体データと正常ヒトの生体データを区分して生体データセットを生成することができる。この際、生体データプールによって高血圧患者の数が変わることができる。データ処理装置350は、生体データセットを構成する生体データの組合せを基準として暗号化のためのハッシュキー(ハッシュキー2という)を生成することができる。データ処理装置350は、分類情報2を基準としてハッシュキー2を生成することもできる。ひいては、データ処理装置350は、高血圧患者と正常ヒトというグループの個数(2個)をさらに利用してハッシュキー2を生成することもできる。また、データ処理装置350は、高血圧患者グループに属する生体データの個数ないし正常ヒトグループに属する生体データの個数をさらに利用してハッシュキー2を生成することもできる。以後、データ処理装置350は、選択した生体データセットに属する生体データを暗号化(暗号化された生体データ2)して、データ分析装置312に伝達することができる。
【0057】
(3)データ分析装置313は、分類情報3をデータ処理装置350に伝送する。分類情報3は、「男性30人」と「女性25人」という情報を含むことができる。この場合、データ処理装置350は、生体データプールから男性に対する生体データ30個と女性の生体データ25個を選択して生体データセットを生成することができる。データ処理装置350は、生体データセットを構成する生体データの組合せを基準として暗号化のためのハッシュキー(ハッシュキー3という)を生成することができる。データ処理装置350は、分類情報3を基準としてハッシュキー3を生成することもできる。ひいては、データ処理装置350は、男性と女性というグループの個数(2個)をさらに利用してハッシュキー3を生成することもできる。また、データ処理装置350は、男性グループに属する生体データの個数ないし女性グループに属する生体データの個数をさらに利用してハッシュキー3を生成することもできる。
【0058】
ひいては、データ処理装置350は、分類情報を受信した時点ないし暗号化時点のような時間を追加的な変数として使用してハッシュキーを決定することもできる。
【0059】
データ分析装置311、312および313が前述した分類情報によって要請した生体データセットに共通した生体データが含まれ得る。例えば、生体データ10番が全て含まれたと仮定する。生体データ10番は、同じ情報を含むが、データ分析装置311、312または313がそれぞれ要請した分類情報が異なるので、生体データセットの構成が異なる。データ分析装置311、312または313が要請した生体データを暗号化するハッシュキーも変わる。結果的に、原本生体データ10番は、同一であるが、暗号化された生体データ10番は、互いに異なる値としてデータ分析装置311、312および313に伝達される。
【0060】
図7は、生体データ処理装置400の構成を示す例である。生体データ処理装置400は、前述したサービス提供者10または50が使用する装置に該当する。また、生体データ処理装置400は、前述した生体データ処理装置130または350に該当する。
【0061】
生体データ処理装置400は、生体データを処理するモデルないしプログラムを利用して生体データを処理する。生体データ処理装置400は、物理的に多様な形態で具現され得る。例えば、生体データ処理装置400は、PC、スマート機器、コンピュータ装置、ネットワークのサーバー、データ処理専用チップセットなどの形態を有することができる。
【0062】
生体データ処理装置400は、保存装置410、メモリ420、演算装置430、インターフェース装置440および通信装置450を含む。
【0063】
保存装置410は、生体データプールを保存することができる。保存装置410は、生体データセットに含まれた生体データを暗号化するプログラムを保存することができる。ひいては、保存装置410は、その他データ前処理(正規化)ないし後処理(フォーマット変換)に必要なプログラムを保存することができる。保存装置410は、選択したデータセットおよび暗号化した生体データを保存することができる。また、保存装置410は、生体データ原本値と生体データに対するハッシュ値を含むマッピングテーブルを保存することができる。
【0064】
メモリ420は、生体データ処理装置400がデータ処理過程に必要なデータおよび生成される臨時データを保存することができる。
【0065】
インターフェース装置440は、外部から一定の命令およびデータを入力される装置である。インターフェース装置440は、物理的に連結された入力装置または外部保存装置から生体データプールを入力され得る。インターフェース装置440は、データ処理のためのプログラムを入力され得る。
【0066】
通信装置450は、有線または無線ネットワークを介して一定の情報を受信し伝送する構成を意味する。通信装置450は、外部オブジェクトから生体データプールを受信することができる。通信装置450は、データ処理のためのプログラムおよびデータを受信することができる。通信装置450は、生体データセット選択のための分類情報を受信することができる。通信装置450は、暗号化したデータを外部オブジェクトに送信することができる。通信装置450は、データ分析装置から分析結果を受信することができる。通信装置450は、分析結果で復号した生体データをデータ分析装置に送信することができる。
【0067】
通信装置450ないしインターフェース装置440は、外部から一定のデータないし命令を伝達される装置である。通信装置450ないしインターフェース装置440を入力装置と命名することができる。
【0068】
演算装置430は、プログラムを利用して分類情報によって前記生体データプールから前記生体データセットを選択することができる。演算装置430は、プログラムを利用して分類情報または生体データセットの組合せによってハッシュキーを生成することができる。場合によって、演算装置430は、時間情報をさらに利用してハッシュキーを生成することもできる。演算装置430は、プログラムを利用して選択した前記生体データセットに含まれた個別生体データを暗号化することができる。演算装置430は、生体データ全体または一部を暗号化することができる。例えば、演算装置430は、遺伝体識別子、遺伝体位置および遺伝体変異情報のうち少なくとも一つを暗号化することができる。演算装置430は、データを処理し、一定の演算を処理するプロセッサ、AP、プログラムがエンベッドされたチップのような装置でありうる。
【0069】
図8は、生体データを処理するシステム500に対する他の例である。
図8は、生体データをブロックチェーンを利用して保存し管理するシステムに対する例である。
図8は、生体データユーザA、生体データ提供者Bおよびサービス提供者Cを示す。生体データ処理システム500は、データ生成装置510、データ処理装置530およびデータ分析装置540を含むことができる。
【0070】
データ生成装置510は、試料を分析する分析装置でありうる。例えば、データ生成装置510は、NGS分析装置を含むことができる。データ生成装置510は、遺伝体データを生成する。また、データ生成装置510は、医療データベース520から分析対象である特定人に対する表現型データを受信することができる。データ生成装置510は、遺伝体データおよび表現型データから構成された生体データを生成することができる。データ生成装置510は、遺伝体データを含む生体データを生成することもできる。
【0071】
データ処理装置530は、データ生成装置510が生成した生体データを処理する。データ処理装置530は、生体データ全体または一部を暗号化する。データ処理装置530は、一定のハッシュキーを利用して生体データをハッシュすることができる。データ処理装置530は、処理した生体データをブロックチェーン550に保存することができる。すなわちブロックチェーン550が生体データプールを保存することができる。データ処理装置530は、ブロックチェーン550から特定の生体データまたは生体データセットを検索して抽出することができる。データ処理装置530は、ブロックチェーン550に保存された特定の生体データを他の値にアップデートすることもできる。
【0072】
データ分析装置540は、暗号化された生体データを利用してデータを分析することができる。データ分析装置540は、分析結果をデータ処理装置530に伝送することができる。データ処理装置530は、分析結果のうち暗号化された生体データを一定に復号してデータ分析装置540に伝達することができる。
【0073】
図8に示していないが、データ生成装置510は、試料に対する遺伝体データと表現型データを利用して生成した生体データをブロックチェーン550に保存することもできる。データ生成装置510が生体データプールに属する生体データをブロックチェーン550に伝達する。ブロックチェーン550は、生体データプールを保有することになる。以後、データ分析装置540は、ブロックチェーン550に接近および検索して必要な生体データセットを抽出し、暗号化することができる。データ分析装置540は、暗号化した生体データを含む生体データセットをさらにブロックチェーン550に保存することができる。この場合、一つの生体データセットを一つのブロックまたは連続したブロックに保存することもできる。
【0074】
ひいては、データ分析装置540は、ブロックチェーン550に接近および検索して暗号化された生体データを抽出することができる。データ分析装置540は、分析した結果をさらにブロックチェーン550に保存することができる。データ処理装置530は、ブロックチェーン550に接近して分析結果のうち暗号化されたデータを復号してデータ分析装置540に伝達することができる。または、データ処理装置530は、暗号化されたデータをブロックチェーン550に保存することもできる。
【0075】
また、上述したような生体データを暗号化方法、生体データ処理方法およびハッシュキー決定方法は、コンピュータで実行され得る実行可能なアルゴリズムを含むプログラム(またはアプリケーション)で具現され得る。前記プログラムは、非一時的読み取り可能な媒体(non−transitory computer readable medium)に保存されて提供され得る。
【0076】
非一時的読み取り可能な媒体とは、レジスター、キャッシュ、メモリなどのように短い瞬間の間データを保存する媒体でなく、半永久的にデータを保存し、機器によって読み取り(reading)が可能な媒体を意味する。具体的には、上述した多様なアプリケーションまたはプログラムは、CD、DVD、ハードディスク、ブルーレイディスク、USB、メモリカード、ROMなどのような非一時的読み取り可能な媒体に保存されて提供され得る。
【0077】
本実施例および本明細書に添付された図面は、前述した技術に含まれる技術的思想の一部を明確に示しているものに過ぎず、前述した技術の明細書および図面に含まれた技術的思想の範囲内で当業者が容易に類推できる変形例と具体的な実施例は、いずれも、前述した技術の権利範囲に含まれることが自明であると言える。